專利名稱:一種電子閱讀器的取詞方法、取詞裝置及電子閱讀器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息索引領(lǐng)域,尤其涉及一種電子閱讀器的取詞方法、取詞裝置及電子閱讀器。
背景技術(shù):
目前,電子閱讀器作為一種以EPD(Electrophoretic Paper Display,電泳顯示屏)為顯示屏幕的新式數(shù)字閱讀器,具有取詞查詢和摘錄的功能。根據(jù)現(xiàn)有技術(shù),電子閱讀器一般基于目標(biāo)位置的匹配選擇進(jìn)行取詞,只能選中點(diǎn)擊區(qū)域的ー個(gè)或多個(gè)字符。
但是對于定位不準(zhǔn)的觸摸屏電子閱讀器,用戶需要多次重復(fù)操作才能選中目標(biāo)字符,取詞出錯(cuò)概率高。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種電子閱讀器的取詞方法、取詞裝置及電子閱讀器,提高取詞的準(zhǔn)確性。本發(fā)明實(shí)施例采用如下技術(shù)方案一種電子閱讀器的取詞方法,包括確定待匹配字符;以所述待匹配字符為索引,利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符,其中所述匹配字符庫是根據(jù)字符間的語意關(guān)系建立的;對所述目標(biāo)字符進(jìn)行突出顯示處理。一種取詞裝置,包括確定單元,用于確定待匹配字符;獲取單元,用于以所述待匹配字符為索引,利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符,其中所述匹配字符庫是根據(jù)字符間的語意關(guān)系建立的;顯示處理單元,用于對所述目標(biāo)字符進(jìn)行突出顯示處理。ー種電子閱讀器,包括取詞裝置。本發(fā)明實(shí)施例提供的電子閱讀器的取詞方法、取詞裝置及電子閱讀器,確定待匹配字符,以所述待匹配字符為索引,利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符,其中所述匹配字符庫是根據(jù)字符間的語意關(guān)系建立的,并對所述目標(biāo)字符進(jìn)行突出顯示處理。當(dāng)用戶在電子閱讀器當(dāng)前界面顯示的文檔中進(jìn)行取詞時(shí),取詞裝置以選中的待匹配字符為索引自動搜索,并利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符。由于所述匹配字符庫是根據(jù)字符間的語意關(guān)系建立的,使得用戶在選中待匹配字符的同時(shí)為用戶選中與待匹配字符具有一定的語義關(guān)系的目標(biāo)字符,因此,利用本發(fā)明實(shí)施例的技術(shù)方案,提高了取詞的準(zhǔn)確率。
為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作ー簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖I為本發(fā)明實(shí)施例ニ電子閱讀器的取詞方法的流程·
圖2為本發(fā)明實(shí)施例ニ取詞裝置取詞界面的示意圖;圖3為本發(fā)明實(shí)施例ニ中TRIE字符樹的示意圖;圖4為本發(fā)明實(shí)施例ニ取詞裝置取詞界面的又一示意圖;圖5為本發(fā)明實(shí)施例三取詞裝置的示意圖;圖6為本發(fā)明實(shí)施例三取詞裝置的又一示意圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。為豐富用戶閱讀的體驗(yàn),本發(fā)明實(shí)施例一提供了一種電子閱讀器的取詞方法,首先,確定待匹配字符,以所述待匹配字符為索引,利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符,其中所述匹配字符庫是根據(jù)字符間的語意關(guān)系建立的,并對所述目標(biāo)字符進(jìn)行突出顯示處理。因而,通過上述描述可以看出,當(dāng)用戶在電子閱讀器當(dāng)前界面顯示的文檔中進(jìn)行取詞時(shí),取詞裝置以選中的待匹配字符為索引自動搜索,并利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符。由于所述匹配字符庫是根據(jù)字符間的語意關(guān)系建立的,使得用戶在選中待匹配字符的同時(shí)為用戶選中與待匹配字符具有一定的語義關(guān)系的目標(biāo)字符,因此,利用本發(fā)明實(shí)施例的技術(shù)方案,提高了取詞的準(zhǔn)確率。如圖I所示,本發(fā)明實(shí)施例ニ提供了一種電子閱讀器的取詞方法,包括如下步驟步驟11、取詞裝置接收用戶的字符選擇指令。在本實(shí)施例中,所述取詞裝置可以設(shè)置于電子閱讀器中。當(dāng)用戶使用電子閱讀器進(jìn)行閱讀時(shí),對當(dāng)前界面顯示的文檔中的字符感興趣,需要對其進(jìn)行翻譯或摘錄等操作,首先要選擇這些字符。通過所述用戶對所述字符的選擇,所述取詞裝置接收了所述用戶的字符選擇指令。通常情況下,當(dāng)用戶選定了某些字符時(shí),這些選定的字符都會被突出顯示,例如聞売顯不等。步驟12、取詞裝置根據(jù)所述字符選擇指令以及當(dāng)前文檔的結(jié)構(gòu)信息確定所述待匹配字符。當(dāng)利用電子閱讀器為所述用戶顯示文檔時(shí),所述取詞裝置會自動讀取該文檔的結(jié)構(gòu)信息。所述文檔的結(jié)構(gòu)信息也稱為字符信息鏈表,該字符信息鏈表由單個(gè)字符信息節(jié)點(diǎn)構(gòu)成,每個(gè)節(jié)點(diǎn)包含字符位置,字符數(shù)據(jù),矩形區(qū)域位置等信息。其中,所述字符位置由段落編號、行編號、字符編號構(gòu)成,所述字符數(shù)據(jù)為該字符的內(nèi)容,所述矩形區(qū)域位置由矩形的左上角和右下角的坐標(biāo)構(gòu)成。
所述取詞裝置接收所述用戶的字符選擇指令之后,根據(jù)當(dāng)前文檔的結(jié)構(gòu)信息就可以確定所述待匹配字符。如圖2所示,當(dāng)用戶選擇文檔時(shí),起始的點(diǎn)擊坐標(biāo)為(113,122),所述取詞裝置根據(jù)當(dāng)前界面的文檔的結(jié)構(gòu)信息,獲取“克”這個(gè)字符的左上角坐標(biāo)為(100,110),并且該字符的寬度為28,高度為30,那么所述取詞裝置可以獲知“克”這個(gè)字符的右上角坐標(biāo)為(128,110),左下角坐標(biāo)為(100,130),右下角坐標(biāo)為(128,130),進(jìn)而確定起始的點(diǎn)擊坐標(biāo)(113,122)包含干“克”這個(gè)字符區(qū)域內(nèi),所以所述取詞裝置確定所述用戶點(diǎn)擊的起始字符為“克”這個(gè)字符。步驟13、取詞裝置讀取樣本詞庫,并根據(jù)所述樣本詞庫建立所述匹配字符庫。在取詞裝置中還存儲有一祥本詞庫。在本實(shí)施例中,為了節(jié)省內(nèi)存,只有當(dāng)用戶選擇當(dāng)前界面顯示的文檔中的字符時(shí),所述取詞裝置才將所述樣本詞庫讀入內(nèi)存中。進(jìn)ー步的,為便于所述用戶利用該樣本詞庫進(jìn)行匹配取詞,所述取詞裝置根據(jù)所述樣本詞庫建立匹配字符庫,其中所述匹配字符庫是根據(jù)字符間的語意關(guān)系建立的。如圖3所示,所述匹配字符庫可以為TRIE字符樹。以“中”這個(gè)字符為例,根據(jù)字符間的語意匹配關(guān)系,定義“華”和“國”都與“中”這個(gè)字符在語意上相匹配,故“華”和“國”都能分別和“中”組成語意組。 為此,以“中”為根節(jié)點(diǎn),建立如圖3所示的樹形結(jié)構(gòu)。同理,再根據(jù)字符間的語意匹配關(guān)系,將與“華”和“國”相匹配的字符分別設(shè)置在“華”和“國”的下面。步驟14、取詞裝置以所述待匹配字符為索引,利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符。在本實(shí)施例中,若所述待匹配字符為ー個(gè)字符,那么所述取詞裝置首先以所述待匹配字符為索引,向前進(jìn)行匹配捜索,或向后進(jìn)行匹配捜索,或向前進(jìn)行匹配搜索并向后進(jìn)行匹配捜索;如果所述取詞裝置捜索到的字符與所述待匹配字符組成的語意組位于所述匹配字符庫中,將所述捜索到的字符作為目標(biāo)字符。還以圖2為例,來說明當(dāng)所述待匹配字符為ー個(gè)字符時(shí),利用所述匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符的過程。當(dāng)所述用戶點(diǎn)擊的字符為“克”這個(gè)字符時(shí),首先,所述取詞裝置以“克”為索引,向前搜索獲取“馬”這個(gè)字符,然后確定由“馬” “克”組成的語意組“馬克”是否位于所述匹配字符庫中。經(jīng)搜索匹配字符庫,確定“馬克”這個(gè)語意組存在干“馬克思”這個(gè)語意組中,因此,將“馬”作為目標(biāo)字符。接著,以“馬”為索引繼續(xù)向前捜索,當(dāng)捜索到“,”時(shí),由于由“,”和“馬”組成的語意組不存在于所述匹配字符庫中,所以所述取詞裝置停止捜索。同理,以“克”為索引,向后捜索,所述取詞裝置將“思”也確定為目標(biāo)字符。若所述待匹配字符為兩個(gè)以上的字符,那么所述取詞裝置首先確定所述字符中的起始字符和結(jié)束字符,然后以所述起始字符為索引向前進(jìn)行匹配捜索,或以所述結(jié)束字符為索引向后進(jìn)行匹配捜索,或以所述起始字符為索引向前進(jìn)行匹配捜索,并以所述結(jié)束字符為索引向后進(jìn)行匹配捜索。當(dāng)所述取詞裝置以所述起始字符為索引向前進(jìn)行匹配搜索時(shí),如果搜索到的字符與所述起始字符組成的語意組位于所述匹配字符庫中,將所述捜索到的字符作為目標(biāo)字符;當(dāng)所述取詞裝置以所述結(jié)束字符為索引向后進(jìn)行匹配搜索時(shí),如果搜索到的字符與所述結(jié)束字符組成的語意組位于所述匹配字符庫中,將所述捜索到的字符作為目標(biāo)字符。如圖4所示,當(dāng)所述用戶選擇的文檔為“思分析并批”這五個(gè)字符時(shí),那么所述取詞裝置首先將所述“思分析并批”中的“思”確定為起始字符,將“批”確定為結(jié)束字符。然后所述取詞裝置以“思”和“批”為索引分別向前和向后進(jìn)行搜索。當(dāng)所述取詞裝置向前搜索到“克”這個(gè)字符時(shí),確定由“克” “思”組成的語意組“克思”是否位于所述匹配字符庫中。經(jīng)搜索匹配字符庫,確定“克思”這個(gè)語意組存在于所述匹配字符庫中的“馬克思”這個(gè)語意組中,那么所述取詞裝置將“克”確定為目標(biāo)字符。接著,以“克”為索引繼續(xù)向前搜索,當(dāng)捜索到“馬”這個(gè)字符時(shí),確定由“馬” “克” “思”組成的語意組“馬克思”是否位于所述匹配字符庫中。經(jīng)搜索匹配字符庫,確定“馬克思”恰好存在于所述匹配字符庫中,那么所述取詞裝置再將“馬”確定為目標(biāo)字符。再接著,所述取詞裝置以“馬”為索引繼續(xù)向前捜索,當(dāng)捜索到“,”吋,由于由“,”和“馬”組成的語意組不存在于所述匹配字符庫中,所以所述取詞裝置停止捜索。同理,以“批”為索引,向后捜索,所述取詞裝置將“判”也確定為目標(biāo)字符。步驟15、取詞裝置對所述目標(biāo)字符進(jìn)行突出顯示處理。 當(dāng)所述取詞裝置確定目標(biāo)字符之后,會自動提取所述目標(biāo)字符,并對所述目標(biāo)字 符進(jìn)行突出顯示處理。所述突出顯示處理,是指將提取的目標(biāo)字符顯示為高亮、反色、下劃線或畫框等形式,能夠提示用戶所述目標(biāo)字符的存在,也便于用戶對所述目標(biāo)字符進(jìn)行其他操作,如翻譯或摘錄等。通過上述描述可以看出,當(dāng)用戶在電子閱讀器當(dāng)前界面顯示的文檔中進(jìn)行取詞時(shí),取詞裝置以選中的待匹配字符為索引自動搜索,并利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符。由于所述匹配字符庫是根據(jù)字符間的語意關(guān)系建立的,使得用戶在選中待匹配字符的同時(shí)為用戶選中與待匹配字符具有一定的語義關(guān)系的目標(biāo)字符,因此,利用本發(fā)明實(shí)施例的技術(shù)方案,提高了取詞的準(zhǔn)確率,節(jié)省了用戶的時(shí)間,并豐富了用戶的閱讀體驗(yàn)。如圖5所示,本發(fā)明實(shí)施例三提供了一種取詞裝置,包括確定單元51,用于確定待匹配字符;獲取單元52,用于以所述待匹配字符為索引,利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符,其中所述匹配字符庫是根據(jù)字符間的語意關(guān)系建立的;顯示處理單元53,用于對所述目標(biāo)字符進(jìn)行突出顯示處理。其中,所述確定単元51包括指令接收模塊,用于接收用戶的字符選擇指令;獲取模塊,用于根據(jù)所述字符選擇指令以及當(dāng)前文檔的結(jié)構(gòu)信息獲取所述待匹配字符。當(dāng)所述待匹配字符為ー個(gè)字符時(shí),所述獲取単元52包括捜索模塊,用于以所述待匹配字符為索引,向前和/或向后進(jìn)行匹配捜索;獲取模塊,用于在搜索到的字符與所述待匹配字符組成的語意組位于所述匹配字符庫中時(shí),將所述搜索到的字符作為目標(biāo)字符。若所述待匹配字符為兩個(gè)以上的字符,所述獲取単元52包括確定模塊,用于確定所述字符中的起始字符和結(jié)束字符;搜索模塊,用于以所述起始字符為索引,向前進(jìn)行匹配捜索;以所述結(jié)束字符為索引,向后進(jìn)行匹配捜索;獲取模塊,用于在以所述起始字符為索引向前進(jìn)行匹配搜索時(shí),如果搜索到的字符與所述起始字符組成的語意組位于所述匹配字符庫中,將所述捜索到的字符作為目標(biāo)字符;在以所述結(jié)束字符為索引向后進(jìn)行匹配搜索時(shí),如果搜索到的字符與所述結(jié)束字符組成的語意組位于所述匹配字符庫中,將所述搜索到的字符作為目標(biāo)字符。另外,如圖6所示,在圖5的基礎(chǔ)上,所述取詞裝置還包括字符庫建立単元54,用于讀取樣本詞庫,井根據(jù)所述樣本詞庫建立所述匹配字符庫。具體的,只有當(dāng)用戶選擇當(dāng)前界面的文檔時(shí),所述字符庫建立単元54才將所述樣本詞庫讀入內(nèi)存中,并且,為便于所述用戶利用該樣本詞庫進(jìn)行匹配取詞,所述字符庫建立単元54根據(jù)所述樣本詞庫建立匹配字符庫。其中,所述取詞裝置的工作原理可參照前述方法實(shí)施例中的描述。通過上述描述可以看出,當(dāng)用戶在電子閱讀器當(dāng)前界面顯示的文檔中進(jìn)行取詞時(shí),取詞裝置以選中的待匹配字符為索引自動搜索,并利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符。由于所述匹配字符庫是根據(jù)字符間的語意關(guān)系建立的,使得用戶在選中待匹配字符的同時(shí)為用戶選中與待匹配字符具有一定的語義關(guān)系的目標(biāo)字符,因此,利用本發(fā)明實(shí)施例的取詞裝置,提高了取詞的準(zhǔn)確率 。此外,本發(fā)明實(shí)施例還提供了ー種電子閱讀器,包括圖5或圖6所示的取詞裝置。綜上所述,本發(fā)明實(shí)施例提供的電子閱讀器的取詞方法、取詞裝置及電子閱讀器,確定待匹配字符,以所述待匹配字符為索引,利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符,其中所述匹配字符庫是根據(jù)字符間的語意關(guān)系建立的,并對所述目標(biāo)字符進(jìn)行突出顯示處理。因而,利用本發(fā)明實(shí)施例的技術(shù)方案,提高了取詞的準(zhǔn)確率。以上所述,僅為本發(fā)明的具體實(shí)施方式
,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
1.一種電子閱讀器的取詞方法,其特征在于,包括 確定待匹配字符; 以所述待匹配字符為索引,利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符,其中所述匹配字符庫是根據(jù)字符間的語意關(guān)系建立的; 對所述目標(biāo)字符進(jìn)行突出顯示處理。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述確定待匹配字符包括 接收用戶的字符選擇指令; 根據(jù)所述字符選擇指令以及當(dāng)前文檔的結(jié)構(gòu)信息確定所述待匹配字符。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述以所述待匹配字符為索引,利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符包括 若所述待匹配字符為ー個(gè)字符,以所述待匹配字符為索引,向前和/或向后進(jìn)行匹配捜索;如果搜索到的字符與所述待匹配字符組成的語意組位于所述匹配字符庫中,將所述捜索到的字符作為目標(biāo)字符; 若所述待匹配字符為兩個(gè)以上的字符,確定所述字符中的起始字符和結(jié)束字符;以所述起始字符為索引,向前進(jìn)行匹配捜索,如果搜索到的字符與所述起始字符組成的語意組位于所述匹配字符庫中,將所述捜索到的字符作為目標(biāo)字符;以所述結(jié)束字符為索引,向后進(jìn)行匹配捜索,如果搜索到的字符與所述結(jié)束字符組成的語意組位于所述匹配字符庫中,將所述捜索到的字符作為目標(biāo)字符。
4.根據(jù)權(quán)利要求1-3任一所述的方法,其特征在于,所述確定待匹配字符之后,所述方法還包括 讀取樣本詞庫,并根據(jù)所述樣本詞庫建立所述匹配字符庫。
5.一種取詞裝置,其特征在于,包括 確定單元,用于確定待匹配字符; 獲取單元,用于以所述待匹配字符為索引,利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符,其中所述匹配字符庫是根據(jù)字符間的語意關(guān)系建立的; 顯示處理單元,用于對所述目標(biāo)字符進(jìn)行突出顯示處理。
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述確定単元包括 指令接收模塊,用于接收用戶的字符選擇指令; 獲取模塊,用于根據(jù)所述字符選擇指令以及當(dāng)前文檔的結(jié)構(gòu)信息獲取所述待匹配字符。
7.根據(jù)權(quán)利要求5所述的裝置,其特征在干,當(dāng)所述待匹配字符為ー個(gè)字符時(shí),所述獲取單元包括 捜索模塊,用于以所述待匹配字符為索引,向前和/或向后進(jìn)行匹配捜索; 獲取模塊,用于在搜索到的字符與所述待匹配字符組成的語意組位于所述匹配字符庫中時(shí),將所述捜索到的字符作為目標(biāo)字符。
8.根據(jù)權(quán)利要求5所述的裝置,其特征在于,若所述待匹配字符為兩個(gè)以上的字符,所述獲取單元包括 確定模塊,用于確定所述字符中的起始字符和結(jié)束字符; 捜索模塊,用于以所述起始字符為索引,向前進(jìn)行匹配捜索;以所述結(jié)束字符為索引,向后進(jìn)行匹配捜索; 獲取模塊,用于在以所述起始字符為索引向前進(jìn)行匹配搜索時(shí),如果搜索到的字符與所述起始字符組成的語意組位于所述匹配字符庫中,將所述捜索到的字符作為目標(biāo)字符;在以所述結(jié)束字符為索引向后進(jìn)行匹配搜索時(shí),如果搜索到的字符與所述結(jié)束字符組成的語意組位于所述匹配字符庫中,將所述捜索到的字符作為目標(biāo)字符。
9.根據(jù)權(quán)利要求5-8任一項(xiàng)所述的裝置,其特征在于,所述裝置還包括 字符庫建立単元,用于讀取樣本詞庫,井根據(jù)所述樣本詞庫建立所述匹配字符庫。
10.ー種電子閱讀器,其特征在于,包括權(quán)利要求5-9任一項(xiàng)所述的取詞裝置。
全文摘要
本發(fā)明實(shí)施例公開了一種電子閱讀器的取詞方法、取詞裝置及電子閱讀器,涉及信息索引領(lǐng)域,為提高取詞的準(zhǔn)確性而發(fā)明。所述方法包括確定待匹配字符,以所述待匹配字符為索引,利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符,其中所述匹配字符庫是根據(jù)字符間的語意關(guān)系建立的,并對所述目標(biāo)字符進(jìn)行突出顯示處理。裝置包括確定單元,用于確定待匹配字符;獲取單元,用于以所述待匹配字符為索引,利用匹配字符庫獲取與所述待匹配字符相匹配的目標(biāo)字符;顯示處理單元,用于對所述目標(biāo)字符進(jìn)行突出顯示處理。本發(fā)明實(shí)施例主要用于電子閱讀器中,并且利用本發(fā)明實(shí)施例的技術(shù)方案可以提高取詞的準(zhǔn)確性。
文檔編號G06F17/30GK102722490SQ201110078539
公開日2012年10月10日 申請日期2011年3月30日 優(yōu)先權(quán)日2011年3月30日
發(fā)明者侯中華 申請人:漢王科技股份有限公司