本發(fā)明涉及電子雙語(yǔ)雙解詞典的查詢方法,尤其涉及一種雙語(yǔ)雙解詞典的中文查詢方法。
背景技術(shù):
英漢雙解詞典是以英語(yǔ)作為詞頭,用英語(yǔ)和漢語(yǔ)對(duì)詞頭進(jìn)行同時(shí)釋義的詞典,即先進(jìn)行英語(yǔ)解釋,隨之是漢語(yǔ)解釋,英漢雙解詞典是學(xué)習(xí)英語(yǔ)的好工具書(shū),比較適合英語(yǔ)初學(xué)者和中級(jí)學(xué)習(xí)者,英語(yǔ)釋義可以使你對(duì)詞匯有一種原滋原味的理解,由于解釋中有一些英文內(nèi)容使用者可能不能理解,因此需要借助漢語(yǔ)釋義幫助使用者更快理解詞匯,當(dāng)你的英語(yǔ)水平達(dá)到能夠完全用英語(yǔ)理解詞匯釋義的時(shí)候,就可以只使用英語(yǔ)解釋了。
目前對(duì)英漢雙解詞典的檢索都是使用英語(yǔ)詞頭進(jìn)行查詢,如果想用中文漢字或詞語(yǔ)查詢對(duì)應(yīng)英語(yǔ)詞條,則需要先將中文翻譯成英語(yǔ),再利用英語(yǔ)進(jìn)行查詢,這樣查詢起來(lái)不僅非常麻煩,而且如果翻譯有誤,會(huì)造成歧義使查詢效果大大降低。
對(duì)于在以漢語(yǔ)為母語(yǔ)的詞典用戶市場(chǎng),母語(yǔ)是漢語(yǔ)的用戶更喜歡使用中文來(lái)檢索英漢雙解詞典;英漢雙向詞典雖然可以中文檢索,但是其檢索內(nèi)容又過(guò)于單一,只有漢英釋義和英漢釋義,沒(méi)有針對(duì)英語(yǔ)詞頭的雙解釋義效果,不利于學(xué)習(xí),因而一些英語(yǔ)學(xué)習(xí)者更愿意用英漢雙解詞典進(jìn)行學(xué)習(xí)。
目前市場(chǎng)上沒(méi)有可采用中文進(jìn)行英漢雙解詞典檢索的電子詞典。由于一般英漢雙解詞典中的中文釋義都是描述性語(yǔ)言或是對(duì)英文描述性釋義的對(duì)照翻譯,所以其包含的中文直接映射英文詞頭信息有限,如果僅使用英漢雙解詞典中文釋義的反向索引進(jìn)行查詢,就會(huì)造成僅以中文釋義的反向索引方式進(jìn)行查詢的英漢雙解查詞用戶體驗(yàn)較差,如查詢不到詞條、查詢到的詞條量少、查詢到的不是目標(biāo)詞條。
目前市場(chǎng)上的其他雙解詞典也存在著諸如英漢雙解詞典一樣的不能漢語(yǔ)查詢、查詢到的信息單一、查詢準(zhǔn)確度及覆蓋面需提升等問(wèn)題。對(duì)于慣用母語(yǔ)作為第一查詢語(yǔ)言的查詢?nèi)?,在查詢默認(rèn)的查詢語(yǔ)言為第二語(yǔ)言但包括第一語(yǔ)言(母語(yǔ))的雙語(yǔ)雙解詞典時(shí),需要采取一種比較有效地快速檢索方法才能快速檢索,既能滿足第一語(yǔ)言查詢,又能提高查詢的準(zhǔn)確度和覆蓋度。
技術(shù)實(shí)現(xiàn)要素:
鑒于目前存在的上述不足,本發(fā)明提供一種雙語(yǔ)雙解詞典的查詢方法,讓?xiě)T用語(yǔ)言為第一語(yǔ)言的用戶能快速查詢默認(rèn)查詢語(yǔ)言為第二語(yǔ)言的第一語(yǔ)言與第二語(yǔ)言的雙語(yǔ)雙解詞典,具體通過(guò)引入雙語(yǔ)映射關(guān)系的輔助數(shù)據(jù)庫(kù),并結(jié)合雙解詞典內(nèi)部第一語(yǔ)言釋義數(shù)據(jù)組成的綜合索引數(shù)據(jù)庫(kù),利用第一語(yǔ)言查詢雙解詞典并返回多個(gè)相關(guān)第二語(yǔ)言詞條,提高了雙解詞典第一語(yǔ)言檢索的用戶體驗(yàn),大幅提高用戶使用第一語(yǔ)言查詢的候選詞準(zhǔn)確度和覆蓋度。
為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案:
一種雙解詞典綜合索引數(shù)據(jù)庫(kù)的構(gòu)建方法,所述雙解詞典綜合索引數(shù)據(jù)庫(kù)的構(gòu)建方法包括以下步驟:
構(gòu)建包含第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的輔助數(shù)據(jù)庫(kù);
根據(jù)雙解詞典第一語(yǔ)言釋義的分詞結(jié)果建立包含第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的反向全文檢索數(shù)據(jù)庫(kù);
根據(jù)所述輔助數(shù)據(jù)庫(kù)和反向全文檢索數(shù)據(jù)庫(kù)生成一個(gè)以第一語(yǔ)言為檢索詞,目標(biāo)雙解詞典的第二語(yǔ)言詞條為結(jié)果的綜合索引數(shù)據(jù)庫(kù)。
依照本發(fā)明的一個(gè)方面,所述輔助數(shù)據(jù)庫(kù),是包含有第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的數(shù)據(jù)庫(kù),包括語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中的一種或多種。
依照本發(fā)明的一個(gè)方面,所述根據(jù)雙解詞典第一語(yǔ)言釋義的分詞結(jié)果建立反向全文檢索數(shù)據(jù)庫(kù)包括:根據(jù)第一語(yǔ)言釋義分詞處理得到的第一語(yǔ)言與第二語(yǔ)言詞條的映射建立反向全文檢索數(shù)據(jù)庫(kù),所述第一語(yǔ)言釋義分詞處理的方式,包括自然語(yǔ)言切分、一元切分和二元切分三種切分方式中的一種或多種。
依照本發(fā)明的一個(gè)方面,所述雙解詞典綜合索引數(shù)據(jù)庫(kù)的構(gòu)建方法包括:將輔助數(shù)據(jù)庫(kù)中的第一語(yǔ)言到第二語(yǔ)言詞條的映射關(guān)系記為權(quán)重w1;將反向全文檢索數(shù)據(jù)庫(kù)的第一語(yǔ)言到第二語(yǔ)言詞條的映射關(guān)系記為權(quán)重w2;所述輔助數(shù)據(jù)庫(kù)的權(quán)重w1和反向全文檢索數(shù)據(jù)庫(kù)的權(quán)重w2預(yù)先給定且權(quán)重值不同。
一種雙解詞典的查詢方法,所述雙解詞典的查詢方法包括以下步驟:
構(gòu)建包含第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的輔助數(shù)據(jù)庫(kù);
根據(jù)雙解詞典第一語(yǔ)言釋義的分詞結(jié)果建立包含第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的反向全文檢索數(shù)據(jù)庫(kù);
根據(jù)所述輔助數(shù)據(jù)庫(kù)和反向全文檢索數(shù)據(jù)庫(kù)生成一個(gè)以第一語(yǔ)言為檢索詞,目標(biāo)雙解詞典的第二語(yǔ)言詞條為結(jié)果的綜合索引數(shù)據(jù)庫(kù);
以第一語(yǔ)言為檢索詞,查詢綜合索引數(shù)據(jù)庫(kù)中對(duì)應(yīng)的第二語(yǔ)言詞條映射,返回檢索詞對(duì)應(yīng)的第二語(yǔ)言詞條項(xiàng)。
依照本發(fā)明的一個(gè)方面,所述輔助數(shù)據(jù)庫(kù),是包含有第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的數(shù)據(jù)庫(kù),包括語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中的一種或多種。
依照本發(fā)明的一個(gè)方面,所述根據(jù)雙解詞典第一語(yǔ)言釋義的分詞結(jié)果建立反向全文檢索數(shù)據(jù)庫(kù)包括:根據(jù)第一語(yǔ)言釋義分詞處理得到的第一語(yǔ)言與第二語(yǔ)言詞條的映射建立反向全文檢索數(shù)據(jù)庫(kù),所述第一語(yǔ)言釋義分詞處理的方式,包括自然語(yǔ)言切分、一元切分和二元切分三種切分方式中的一種或多種。
一種雙解詞典的查詢方法,所述雙解詞典的查詢方法包括以下步驟:
構(gòu)建包含第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的輔助數(shù)據(jù)庫(kù),并將第一語(yǔ)言與第二語(yǔ)言詞條的映射關(guān)系記為權(quán)重w1;
根據(jù)雙解詞典第一語(yǔ)言釋義的分詞結(jié)果建立包含第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的反向全文檢索數(shù)據(jù)庫(kù),并將第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系記為權(quán)重w2;
根據(jù)所述輔助數(shù)據(jù)庫(kù)和反向全文檢索數(shù)據(jù)庫(kù)生成一個(gè)以第一語(yǔ)言為檢索詞,目標(biāo)雙解詞典的第二語(yǔ)言詞條為結(jié)果的綜合索引數(shù)據(jù)庫(kù);
以第一語(yǔ)言為檢索詞,查詢綜合索引數(shù)據(jù)庫(kù)中對(duì)應(yīng)的第二語(yǔ)言詞條映射,返回檢索詞對(duì)應(yīng)的第二語(yǔ)言詞條項(xiàng)。
依照本發(fā)明的一個(gè)方面,所述輔助數(shù)據(jù)庫(kù),是包含有第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的數(shù)據(jù)庫(kù),包括語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中的一種或多種。
依照本發(fā)明的一個(gè)方面,所述根據(jù)雙解詞典第一語(yǔ)言釋義的分詞結(jié)果建立反向全文檢索數(shù)據(jù)庫(kù)包括:根據(jù)第一語(yǔ)言釋義分詞處理得到的第一語(yǔ)言與第二語(yǔ)言詞條的映射建立反向全文檢索數(shù)據(jù)庫(kù),所述第一語(yǔ)言釋義分詞處理的方式,包括自然語(yǔ)言切分、一元切分和二元切分三種切分方式中的一種或多種。所述自然語(yǔ)言切分具體為根據(jù)不同的語(yǔ)言的默認(rèn)或自帶的分詞方式進(jìn)行分詞。
依照本發(fā)明的一個(gè)方面,所述雙解詞典的查詢方法包括:先檢索反向全文檢索數(shù)據(jù)庫(kù)和輔助數(shù)據(jù)庫(kù)中該第一語(yǔ)言對(duì)應(yīng)的第二語(yǔ)言詞條映射,再將檢索的映射結(jié)果分別計(jì)算權(quán)重返回或按詞條排序方式返回對(duì)應(yīng)的第二語(yǔ)言詞條。
依照本發(fā)明的一個(gè)方面,所述輔助數(shù)據(jù)庫(kù)的權(quán)重w1高于反向全文檢索數(shù)據(jù)庫(kù)的權(quán)重w2。
依照本發(fā)明的一個(gè)方面,所述輔助數(shù)據(jù)庫(kù)的權(quán)重w1低于反向全文檢索數(shù)據(jù)庫(kù)的權(quán)重w2。
依照本發(fā)明的一個(gè)方面,所述雙解詞典的查詢方法包括:當(dāng)輔助數(shù)據(jù)庫(kù)來(lái)源于語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中的一個(gè)時(shí),按權(quán)重高低返回對(duì)應(yīng)的第二語(yǔ)言詞條項(xiàng);當(dāng)有多個(gè)數(shù)據(jù)庫(kù)來(lái)源時(shí),則將有交集的第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系權(quán)重相加計(jì)算,再按權(quán)重高低返回對(duì)應(yīng)的第二語(yǔ)言詞條。
一種雙解詞典的查詢方法,所述雙解詞典的查詢方法包括以下步驟:
構(gòu)建包含第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的輔助數(shù)據(jù)庫(kù);
以第一語(yǔ)言為檢索詞,查詢輔助數(shù)據(jù)庫(kù)中對(duì)應(yīng)的第二語(yǔ)言詞條映射,返回檢索詞對(duì)應(yīng)的雙解詞典的第二語(yǔ)言詞條項(xiàng);
其中,所述輔助數(shù)據(jù)庫(kù)是包含有第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的數(shù)據(jù)庫(kù),包括語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中的一種或多種。
本發(fā)明實(shí)施的優(yōu)點(diǎn):
本發(fā)明的技術(shù)方案,利用雙解詞典的第一語(yǔ)言釋義進(jìn)行分詞處理、建庫(kù),引入語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中的一種或多種作為輔助數(shù)據(jù)庫(kù)進(jìn)行第一語(yǔ)言到第二語(yǔ)言詞條的映射,根據(jù)權(quán)重的高低或詞條排序方式輸出候選第二語(yǔ)言詞條項(xiàng),大幅提高用戶使用第一語(yǔ)言查詢雙解詞典時(shí)選詞的準(zhǔn)確度和覆蓋度。當(dāng)不構(gòu)建綜合索引數(shù)據(jù)庫(kù)時(shí),只需調(diào)取輔助數(shù)據(jù)庫(kù)內(nèi)的第一語(yǔ)言與第二語(yǔ)言詞條的映射關(guān)系,并返回在雙解詞典內(nèi)對(duì)應(yīng)的第二語(yǔ)言詞條項(xiàng),實(shí)現(xiàn)雙解詞典的第一語(yǔ)言檢索。通過(guò)引入一個(gè)或多個(gè)從第一語(yǔ)言檢索詞到第二語(yǔ)言詞條的映射關(guān)系數(shù)據(jù)庫(kù)作為輔助數(shù)據(jù)庫(kù),進(jìn)行雙解詞典的第一語(yǔ)言檢索,輸出雙解詞典中第一語(yǔ)言作為檢索關(guān)鍵詞時(shí)匹配的第二語(yǔ)言最佳詞條,并且根據(jù)映射關(guān)系將其余映射的第二語(yǔ)言詞條作為用戶進(jìn)行雙解詞典查詢的候選詞條,提高了雙解詞典的第一語(yǔ)言查詞用戶體驗(yàn)。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例一所述的一種雙解詞典綜合索引數(shù)據(jù)庫(kù)的構(gòu)建方法示意圖;
圖2為本發(fā)明實(shí)施例二所述的一種雙解詞典綜合索引數(shù)據(jù)庫(kù)的構(gòu)建方法示意圖;
圖3為本發(fā)明實(shí)施例三所述的一種雙解詞典的查詢方法示意圖;
圖4為本發(fā)明實(shí)施例四所述的一種雙解詞典的查詢方法示意圖;
圖5為本發(fā)明實(shí)施例五所述的一種雙解詞典的查詢方法示意圖;
圖6為本發(fā)明實(shí)施例六所述的綜合索引數(shù)據(jù)庫(kù)結(jié)構(gòu)框圖;
圖7為本發(fā)明實(shí)施例七所述的一種英漢雙解詞典的中文查詢方法示意圖;
圖8為本發(fā)明實(shí)施例八查詢實(shí)例示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
實(shí)施例一
如圖1所示,在慣用語(yǔ)言為第一語(yǔ)言的用戶查詢默認(rèn)查詢語(yǔ)言為第二語(yǔ)言的第一語(yǔ)言與第二語(yǔ)言的雙語(yǔ)雙解詞典時(shí),需要一種雙解詞典綜合索引數(shù)據(jù)庫(kù)的構(gòu)建方法,所述雙解詞典綜合索引數(shù)據(jù)庫(kù)的構(gòu)建方法包括以下步驟:
步驟s11:構(gòu)建包含第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的輔助數(shù)據(jù)庫(kù);
所述輔助數(shù)據(jù)庫(kù),是包含有第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的數(shù)據(jù)庫(kù),包括語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中的一種或多種。
步驟s12:根據(jù)雙解詞典第一語(yǔ)言釋義的分詞結(jié)果建立包含第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的反向全文檢索數(shù)據(jù)庫(kù);
根據(jù)雙解詞典第一語(yǔ)言釋義分詞處理得到的第一語(yǔ)言與第二語(yǔ)言詞條的映射建立反向全文檢索數(shù)據(jù)庫(kù)。
所述雙解詞典第一語(yǔ)言釋義的分詞處理方式包括:自然語(yǔ)言切分、一元切分和二元切分三種切分方式中的一種或多種。
所述自然語(yǔ)言切分具體為根據(jù)不同的語(yǔ)言的默認(rèn)或自帶的分詞方式進(jìn)行分詞。例如,英語(yǔ)自帶分詞功能,能準(zhǔn)確快速地分詞,直接采用其自動(dòng)的分詞結(jié)果就行。
步驟s13:根據(jù)所述輔助數(shù)據(jù)庫(kù)和反向全文檢索數(shù)據(jù)庫(kù)生成一個(gè)以第一語(yǔ)言為檢索詞,目標(biāo)雙解詞典的第二語(yǔ)言詞條為結(jié)果的綜合索引數(shù)據(jù)庫(kù)。
實(shí)施例二
如圖2所示,在慣用語(yǔ)言為漢語(yǔ)的用戶查詢默認(rèn)查詢語(yǔ)言為英語(yǔ)的英漢雙語(yǔ)雙解詞典時(shí),需要一種雙解詞典綜合索引數(shù)據(jù)庫(kù)的構(gòu)建方法,所述雙解詞典綜合索引數(shù)據(jù)庫(kù)的構(gòu)建方法包括以下步驟:
步驟s21:引入一輔助數(shù)據(jù)庫(kù),將該輔助數(shù)據(jù)庫(kù)中的漢語(yǔ)到外語(yǔ)詞條的映射關(guān)系記為權(quán)重w1。
所述輔助數(shù)據(jù)庫(kù),是包含有漢語(yǔ)與外語(yǔ)詞條映射關(guān)系的數(shù)據(jù)庫(kù),包括語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中的一種或多種。
所述輔助數(shù)據(jù)庫(kù)中的漢語(yǔ)包含所述雙解詞典中文釋義的分詞結(jié)果。
所述語(yǔ)料庫(kù),系采用平行語(yǔ)料庫(kù)、翻譯語(yǔ)料庫(kù)等存在漢語(yǔ)與外語(yǔ)語(yǔ)義映射關(guān)系的語(yǔ)料庫(kù)。
所述詞典數(shù)據(jù)庫(kù),其漢語(yǔ)與外語(yǔ)的語(yǔ)義映射來(lái)自一本或多本漢外詞典,或者采用多本漢外詞典和外漢詞典,如漢英詞典、英漢詞典或漢德詞典、德漢詞典等等。
語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中包含有漢語(yǔ)與外語(yǔ)詞條的語(yǔ)義映射關(guān)系。
步驟s22:根據(jù)雙解詞典中文釋義分詞結(jié)果建立反向全文檢索數(shù)據(jù)庫(kù),將漢語(yǔ)到外語(yǔ)詞條的映射關(guān)系記為權(quán)重w2;
所述雙解詞典中文釋義的分詞處理方式包括:自然語(yǔ)言切分、一元切分和二元切分三種切分方式中的一種或多種。
所述自然語(yǔ)言切分具體為根據(jù)不同的語(yǔ)言的默認(rèn)或自帶的分詞方式進(jìn)行分詞。例如,英語(yǔ)自帶分詞功能,能準(zhǔn)確快速地分詞,直接采用其自動(dòng)的分詞結(jié)果就行。
所述權(quán)重w1和權(quán)重w2預(yù)先給定,每個(gè)漢語(yǔ)與外語(yǔ)詞條的映射權(quán)重均預(yù)選給定一權(quán)重值。
步驟s23:根據(jù)所述輔助數(shù)據(jù)庫(kù)和反向全文檢索數(shù)據(jù)庫(kù)生成一個(gè)以漢語(yǔ)為檢索詞,目標(biāo)雙解詞典的外語(yǔ)詞條為結(jié)果的綜合索引數(shù)據(jù)庫(kù)。
所述反向全文檢索數(shù)據(jù)庫(kù)和輔助數(shù)據(jù)庫(kù)中關(guān)于漢語(yǔ)與外語(yǔ)詞條的映射關(guān)系權(quán)重預(yù)先給定。
在實(shí)際應(yīng)用中,所述輔助數(shù)據(jù)庫(kù)的權(quán)重w1高于反向全文檢索數(shù)據(jù)庫(kù)的權(quán)重w2。
在實(shí)際應(yīng)用中,所述輔助數(shù)據(jù)庫(kù)的權(quán)重w1低于反向全文檢索數(shù)據(jù)庫(kù)的權(quán)重w2。
實(shí)施例三
如圖3所示,在慣用語(yǔ)言為第一語(yǔ)言的用戶查詢默認(rèn)查詢語(yǔ)言為第二語(yǔ)言的第一語(yǔ)言與第二語(yǔ)言的雙語(yǔ)雙解詞典時(shí),需要一種雙解詞典的查詢方法,所述雙解詞典的查詢方法包括以下步驟:
步驟s31:構(gòu)建包含第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的輔助數(shù)據(jù)庫(kù);
所述輔助數(shù)據(jù)庫(kù),是包含有第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的數(shù)據(jù)庫(kù),包括語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中的一種或多種。
步驟s32:根據(jù)雙解詞典第一語(yǔ)言釋義的分詞結(jié)果建立包含第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的反向全文檢索數(shù)據(jù)庫(kù);
根據(jù)雙解詞典第一語(yǔ)言釋義分詞處理得到的第一語(yǔ)言與第二語(yǔ)言詞條的映射建立反向全文檢索數(shù)據(jù)庫(kù)。
所述雙解詞典第一語(yǔ)言釋義的分詞處理方式包括:自然語(yǔ)言切分、一元切分和二元切分三種切分方式中的一種或多種。
所述自然語(yǔ)言切分具體為根據(jù)不同的語(yǔ)言的默認(rèn)或自帶的分詞方式進(jìn)行分詞。例如,英語(yǔ)自帶分詞功能,能準(zhǔn)確快速地分詞,直接采用其自動(dòng)的分詞結(jié)果就行。
步驟s33:根據(jù)所述輔助數(shù)據(jù)庫(kù)和反向全文檢索數(shù)據(jù)庫(kù)生成一個(gè)以第一語(yǔ)言為檢索詞,目標(biāo)雙解詞典的第二語(yǔ)言詞條為結(jié)果的綜合索引數(shù)據(jù)庫(kù);
步驟s34:以第一語(yǔ)言為檢索詞,查詢綜合索引數(shù)據(jù)庫(kù)中對(duì)應(yīng)的第二語(yǔ)言詞條映射,返回檢索詞對(duì)應(yīng)的第二語(yǔ)言詞條項(xiàng)。
實(shí)施例四
如圖4所示,一種雙解詞典的查詢方法,所述雙解詞典的查詢方法包括以下步驟:
步驟s41:構(gòu)建包含第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的輔助數(shù)據(jù)庫(kù),并將第一語(yǔ)言與第二語(yǔ)言詞條的映射關(guān)系記為權(quán)重w1;
所述輔助數(shù)據(jù)庫(kù),是包含有第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的數(shù)據(jù)庫(kù),包括語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中的一種或多種。
步驟s42:根據(jù)雙解詞典第一語(yǔ)言釋義的分詞結(jié)果建立包含第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的反向全文檢索數(shù)據(jù)庫(kù),并將第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系記為權(quán)重w2;
根據(jù)雙解詞典第一語(yǔ)言釋義分詞處理得到的第一語(yǔ)言與第二語(yǔ)言詞條的映射建立反向全文檢索數(shù)據(jù)庫(kù)。
所述雙解詞典第一語(yǔ)言釋義的分詞處理方式包括:自然語(yǔ)言切分、一元切分和二元切分三種切分方式中的一種或多種。
所述自然語(yǔ)言切分具體為根據(jù)不同的語(yǔ)言的默認(rèn)或自帶的分詞方式進(jìn)行分詞。例如,英語(yǔ)自帶分詞功能,能準(zhǔn)確快速地分詞,直接采用其自動(dòng)的分詞結(jié)果就行。
步驟s43:根據(jù)所述輔助數(shù)據(jù)庫(kù)和反向全文檢索數(shù)據(jù)庫(kù)生成一個(gè)以第一語(yǔ)言為檢索詞,目標(biāo)雙解詞典的第二語(yǔ)言詞條為結(jié)果的綜合索引數(shù)據(jù)庫(kù);
步驟s44:以第一語(yǔ)言為檢索詞,查詢綜合索引數(shù)據(jù)庫(kù)中對(duì)應(yīng)的第二語(yǔ)言詞條映射,返回檢索詞對(duì)應(yīng)的第二語(yǔ)言詞條項(xiàng)。
在實(shí)際應(yīng)用中,先檢索反向全文檢索數(shù)據(jù)庫(kù)和輔助數(shù)據(jù)庫(kù)中該第一語(yǔ)言對(duì)應(yīng)的第二語(yǔ)言詞條映射,再將檢索的映射結(jié)果分別計(jì)算權(quán)重返回。
在實(shí)際應(yīng)用中,先檢索反向全文檢索數(shù)據(jù)庫(kù)和輔助數(shù)據(jù)庫(kù)中該第一語(yǔ)言對(duì)應(yīng)的第二語(yǔ)言詞條映射,再將檢索的映射結(jié)果分別按詞條排序方式返回對(duì)應(yīng)的第二語(yǔ)言詞條。
在將檢索的映射結(jié)果分別計(jì)算權(quán)重返回時(shí),所述輔助數(shù)據(jù)庫(kù)的權(quán)重w1高于反向全文檢索數(shù)據(jù)庫(kù)的權(quán)重w2。
在實(shí)際應(yīng)用中,在將檢索的映射結(jié)果分別計(jì)算權(quán)重返回時(shí),所述輔助數(shù)據(jù)庫(kù)的權(quán)重w1低于反向全文檢索數(shù)據(jù)庫(kù)的權(quán)重w2。
在將檢索的映射結(jié)果分別計(jì)算權(quán)重返回時(shí),當(dāng)輔助數(shù)據(jù)庫(kù)來(lái)源于語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中的一個(gè)時(shí),按權(quán)重高低返回對(duì)應(yīng)的第二語(yǔ)言詞條項(xiàng);當(dāng)有多個(gè)數(shù)據(jù)庫(kù)來(lái)源時(shí),則將有交集的第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系權(quán)重相加計(jì)算,再按權(quán)重高低返回對(duì)應(yīng)的第二語(yǔ)言詞條。
實(shí)施例五
如圖5所示,在慣用語(yǔ)言為第一語(yǔ)言的用戶查詢默認(rèn)查詢語(yǔ)言為第二語(yǔ)言的第一語(yǔ)言與第二語(yǔ)言的雙語(yǔ)雙解詞典時(shí),需要一種雙解詞典的查詢方法,所述雙解詞典的查詢方法包括以下步驟:
步驟s51:構(gòu)建包含第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的輔助數(shù)據(jù)庫(kù);
所述輔助數(shù)據(jù)庫(kù),是包含有第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的數(shù)據(jù)庫(kù),包括語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中的一種或多種。
步驟s52:以第一語(yǔ)言為檢索詞,查詢輔助數(shù)據(jù)庫(kù)中對(duì)應(yīng)的第二語(yǔ)言詞條映射,返回檢索詞對(duì)應(yīng)的雙解詞典的第二語(yǔ)言詞條項(xiàng);
其中,所述輔助數(shù)據(jù)庫(kù)是包含有第一語(yǔ)言與第二語(yǔ)言詞條映射關(guān)系的數(shù)據(jù)庫(kù),包括語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中的一種或多種。
實(shí)施例六
如圖6所示,在慣用語(yǔ)言為漢語(yǔ)的用戶查詢默認(rèn)查詢語(yǔ)言為英語(yǔ)的英漢雙語(yǔ)雙解詞典時(shí),需要根據(jù)英漢雙解詞典的反向全文檢索數(shù)據(jù)庫(kù)和一輔助數(shù)據(jù)庫(kù)構(gòu)建一個(gè)綜合索引數(shù)據(jù)庫(kù),具體構(gòu)建方法包括:
步驟s61:引入一輔助數(shù)據(jù)庫(kù),將該輔助數(shù)據(jù)庫(kù)中的漢語(yǔ)到英語(yǔ)詞條的映射記為權(quán)重w1;
步驟s62:根據(jù)英漢雙解詞典中文釋義分詞結(jié)果建立反向全文檢索數(shù)據(jù)庫(kù),將漢語(yǔ)到英語(yǔ)詞條的映射記為權(quán)重w2;
步驟s63:根據(jù)所述輔助數(shù)據(jù)庫(kù)和反向全文檢索數(shù)據(jù)庫(kù)生成一個(gè)以漢語(yǔ)為檢索詞,目標(biāo)英漢雙解詞典的英語(yǔ)詞條為結(jié)果的綜合索引數(shù)據(jù)庫(kù)。
見(jiàn)圖6,所述的綜合索引數(shù)據(jù)庫(kù),包括反向全文檢索數(shù)據(jù)庫(kù)和輔助數(shù)據(jù)庫(kù),反向全文檢索數(shù)據(jù)庫(kù)包含漢語(yǔ)與英語(yǔ)詞條的映射關(guān)系,輔助數(shù)據(jù)庫(kù)中包含有漢語(yǔ)與英語(yǔ)詞條映射關(guān)系,通過(guò)b樹(shù)查找等檢索方式即可檢索到漢語(yǔ)與英語(yǔ)詞條的映射。
所述輔助數(shù)據(jù)庫(kù)中漢語(yǔ)映射的英語(yǔ)詞條在英漢雙解詞典內(nèi)有對(duì)應(yīng)的英語(yǔ)詞條。
本發(fā)明中所有實(shí)施例所采用的數(shù)據(jù)庫(kù),優(yōu)選采用簡(jiǎn)易的數(shù)據(jù)庫(kù),如key-value數(shù)據(jù)庫(kù),包括主數(shù)據(jù)庫(kù)和索引數(shù)據(jù)庫(kù),主數(shù)據(jù)庫(kù)內(nèi)存儲(chǔ)有數(shù)據(jù)內(nèi)容,漢語(yǔ)檢索字/詞在索引數(shù)據(jù)庫(kù)中建立數(shù)據(jù)索引項(xiàng),并將對(duì)應(yīng)漢語(yǔ)的數(shù)據(jù)索引指向主數(shù)據(jù)庫(kù)中對(duì)應(yīng)的數(shù)據(jù)內(nèi)容,對(duì)于b樹(shù)結(jié)構(gòu)的數(shù)據(jù)庫(kù),檢索時(shí)優(yōu)先搜索索引數(shù)據(jù)庫(kù),可以降低檢索深度,提高檢索效率。
實(shí)施例七
如圖7所示,在慣用語(yǔ)言為漢語(yǔ)的用戶查詢默認(rèn)查詢語(yǔ)言為英語(yǔ)的英漢雙語(yǔ)雙解詞典時(shí),需要一種英漢雙解詞典的中文查詢方法,其包括如下內(nèi)容:
步驟s71:引入一輔助數(shù)據(jù)庫(kù),將該輔助數(shù)據(jù)庫(kù)中的漢語(yǔ)到英語(yǔ)詞條的映射記為權(quán)重w1;
步驟s72:根據(jù)英漢雙解詞典中文釋義分詞結(jié)果建立反向全文檢索數(shù)據(jù)庫(kù),將漢語(yǔ)到英語(yǔ)詞條的映射記為權(quán)重w2;
所述中文釋義分詞處理的方式,包括自然語(yǔ)言切分、一元切分和二元切分三種切分方式中的一種或多種,依據(jù)分詞處理得到的漢語(yǔ)建立反向全文檢索數(shù)據(jù)庫(kù),反向全文檢索數(shù)據(jù)庫(kù)包含漢語(yǔ)與英語(yǔ)詞條的映射關(guān)系。
所述自然語(yǔ)言切分具體為根據(jù)不同的語(yǔ)言的默認(rèn)或自帶的分詞方式進(jìn)行分詞。例如,英語(yǔ)自帶分詞功能,能準(zhǔn)確快速地分詞,直接采用其自動(dòng)的分詞結(jié)果就行。
如:一英漢雙解詞典中[change]詞條對(duì)應(yīng)例句的中文釋義中有一條“更改法律的提議”的中文解釋,采用自然語(yǔ)言切分就是“更改|法律|的|提議”,利用一元切分就是“更|改|法|律|的|提|議”,利用二元切分就是“更改|改法|法律|律的|的提|提議”,分詞處理得到一個(gè)不重復(fù)的漢語(yǔ)列表,將該漢語(yǔ)列表中的漢語(yǔ)與英語(yǔ)詞條建立映射關(guān)系,預(yù)先給定每個(gè)映射英語(yǔ)詞條的權(quán)重,如可以根據(jù)詞頻給定權(quán)重。
可選地,將中文釋義分詞處理得到的漢語(yǔ)進(jìn)行過(guò)濾,剔除其中查詢概率較低的漢語(yǔ),如“律的”、“的提”等等。
分詞結(jié)果是龐大的,如何在大量的數(shù)據(jù)面前實(shí)現(xiàn)快速查找相關(guān)映射呢,優(yōu)選地?cái)?shù)據(jù)結(jié)構(gòu)采用b樹(shù)結(jié)構(gòu),并建立索引項(xiàng)。
步驟s73:根據(jù)所述輔助數(shù)據(jù)庫(kù)和反向全文檢索數(shù)據(jù)庫(kù)生成一個(gè)以漢語(yǔ)為檢索詞,目標(biāo)英漢雙解詞典的英語(yǔ)詞條為結(jié)果的綜合索引數(shù)據(jù)庫(kù);
步驟s74:以漢語(yǔ)為檢索詞,查詢綜合索引數(shù)據(jù)庫(kù)中對(duì)應(yīng)的英語(yǔ)詞條映射,返回檢索詞對(duì)應(yīng)的英漢雙解詞典的英語(yǔ)詞條項(xiàng)。
所述步驟s74中,優(yōu)選地按權(quán)重高低返回映射的英語(yǔ)詞條項(xiàng)。
所述輔助數(shù)據(jù)庫(kù),是包含有漢語(yǔ)與英語(yǔ)詞條映射關(guān)系的數(shù)據(jù)庫(kù),采用語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)等中的一種或多種,上述各數(shù)據(jù)庫(kù)中關(guān)于漢語(yǔ)與英語(yǔ)的映射關(guān)系權(quán)重預(yù)先給定。
優(yōu)選地,所述輔助數(shù)據(jù)庫(kù)中漢語(yǔ)包含英漢雙解詞典中文釋義分詞處理得到的漢語(yǔ)。
所述語(yǔ)料庫(kù),系采用平行語(yǔ)料庫(kù)、翻譯語(yǔ)料庫(kù)等存在漢語(yǔ)與英語(yǔ)詞條映射關(guān)系的語(yǔ)料庫(kù),語(yǔ)料庫(kù)數(shù)據(jù)來(lái)源于一種或多種語(yǔ)料庫(kù)。
所述詞典數(shù)據(jù)庫(kù),其漢語(yǔ)與英語(yǔ)的語(yǔ)義映射來(lái)自一本或多本漢英詞典或英漢雙向詞典,或者采用多本漢英詞典和英漢詞典。
輔助數(shù)據(jù)庫(kù)來(lái)源于一個(gè)語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)或語(yǔ)料庫(kù)時(shí),優(yōu)選按權(quán)重高低返回對(duì)應(yīng)的英語(yǔ)詞條項(xiàng);有語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)或語(yǔ)料庫(kù)中的一種或多種構(gòu)成的多個(gè)來(lái)源時(shí),優(yōu)選將有交集的漢語(yǔ)與英語(yǔ)詞條映射關(guān)系權(quán)重相加計(jì)算,再按權(quán)重高低返回對(duì)應(yīng)的英語(yǔ)詞條項(xiàng)。
當(dāng)輔助數(shù)據(jù)庫(kù)來(lái)源于漢英詞典和英漢詞典時(shí),優(yōu)選將漢英詞典中漢語(yǔ)到英語(yǔ)詞條的映射與英漢詞典中漢語(yǔ)到英語(yǔ)詞條的反向映射有交集的映射權(quán)重相加。
輔助數(shù)據(jù)庫(kù)來(lái)源于漢英詞典和英漢詞典時(shí)的漢語(yǔ)映射查詢:
1)漢英詞典中映射關(guān)系的查找:
在b樹(shù)中查找檢索詞得到漢語(yǔ)到英語(yǔ)詞條的映射,查得[改變]對(duì)應(yīng)映射的英文詞條包括:
meta、vary、remodel、transmute、transform、unwill、shunt、alter、change、alteration。
2)英漢詞典中:查找[改變]反向映射的英文詞條包括:
change、alter、transform、unwill、alteration、vary。
3)將[改變]與change、alter、transform、alteration、unwill、vary等映射的權(quán)重分別相加,完成輔助數(shù)據(jù)庫(kù)對(duì)應(yīng)映射關(guān)系的權(quán)重計(jì)算。
4)將輔助數(shù)據(jù)庫(kù)得到的[改變]與英語(yǔ)詞條的映射與反向全文檢索數(shù)據(jù)庫(kù)中[改變]映射的英語(yǔ)詞條權(quán)重相加并按權(quán)重排序,按權(quán)重將change、alter、transform、alteration、unwill、vary等等對(duì)應(yīng)的英語(yǔ)詞條返回。
如果檢索詞在全文檢索數(shù)據(jù)庫(kù)中沒(méi)有對(duì)應(yīng)映射外語(yǔ)詞條,則以輔助數(shù)據(jù)庫(kù)的映射外語(yǔ)詞條進(jìn)行返回。
實(shí)施例八
用漢語(yǔ)[立志]查詢英漢雙解詞典:
1)語(yǔ)料庫(kù)、知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)等輔助數(shù)據(jù)庫(kù)中映射關(guān)系的查找:
在b樹(shù)中查找檢索詞得到漢語(yǔ)到英語(yǔ)詞條的映射,查得[立志]對(duì)應(yīng)映射的英文詞條包括:aspire,purpose,will。
2)反向全文檢索數(shù)據(jù)庫(kù)中映射關(guān)系的查找:
在b樹(shù)中查找檢索詞[立志]對(duì)應(yīng)映射的英文詞條,未發(fā)現(xiàn)有對(duì)應(yīng)的詞條映射。
3)將英漢雙解詞典中輔助數(shù)據(jù)庫(kù)映射的英語(yǔ)詞條aspire、purpose、will按權(quán)重或按詞條排序方式返回。
如圖8所示,用英漢雙解詞典進(jìn)行漢語(yǔ)檢索時(shí),輸入一個(gè)漢語(yǔ)【中國(guó)】,檢索【中國(guó)】在反向全文檢索數(shù)據(jù)庫(kù)內(nèi)映射的英語(yǔ)詞條,檢索輔助數(shù)據(jù)庫(kù)內(nèi)【中國(guó)】映射的英語(yǔ)詞條,計(jì)算檢索到的【中國(guó)】與英語(yǔ)詞條各個(gè)映射的權(quán)重并疊加對(duì)應(yīng)的反向全文檢索數(shù)據(jù)庫(kù)內(nèi)【中國(guó)】與英語(yǔ)詞條的權(quán)重,優(yōu)選按權(quán)重高低返回對(duì)應(yīng)的英語(yǔ)詞條。
漢語(yǔ)【中國(guó)】映射英語(yǔ)詞條【china】的權(quán)重最高,其余英語(yǔ)詞條按權(quán)重的高低依次返回,包括chinese、cathay、kungfu、chink、cn、chinatown等,點(diǎn)擊對(duì)應(yīng)的英語(yǔ)詞條項(xiàng)即進(jìn)入英語(yǔ)詞條的詳情,通過(guò)本發(fā)明方法也有利于用戶橫向?qū)W習(xí)英語(yǔ)。
特別地,所述漢語(yǔ)與英語(yǔ)的映射結(jié)果可以按權(quán)重返回,也可以按詞條編排順序等多種排序方式排序返回,優(yōu)選地本發(fā)明采用預(yù)先設(shè)定的權(quán)重排序返回。
本發(fā)明不僅適用于英漢雙解詞典,也同時(shí)適用于德漢、日漢、俄漢、韓中、法漢、西漢、意漢等雙解詞典,以及其他語(yǔ)種和漢語(yǔ)的雙解詞典,在此不再一一舉例說(shuō)明。
本發(fā)明實(shí)施的優(yōu)點(diǎn):
本發(fā)明的技術(shù)方案,利用雙解詞典的第一語(yǔ)言釋義進(jìn)行分詞處理、建庫(kù),引入語(yǔ)義知識(shí)庫(kù)、詞典數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)中的一種或多種作為輔助數(shù)據(jù)庫(kù)進(jìn)行第一語(yǔ)言到第二語(yǔ)言詞條的映射,根據(jù)權(quán)重的高低或詞條排序方式輸出候選第二語(yǔ)言詞條項(xiàng),大幅提高用戶使用第一語(yǔ)言查詢雙解詞典時(shí)選詞的準(zhǔn)確度和覆蓋度。當(dāng)不構(gòu)建綜合索引數(shù)據(jù)庫(kù)時(shí),只需調(diào)取輔助數(shù)據(jù)庫(kù)內(nèi)的第一語(yǔ)言與第二語(yǔ)言詞條的映射關(guān)系,并返回在雙解詞典內(nèi)對(duì)應(yīng)的第二語(yǔ)言詞條項(xiàng),實(shí)現(xiàn)雙解詞典的第一語(yǔ)言檢索。通過(guò)引入一個(gè)或多個(gè)從第一語(yǔ)言檢索詞到第二語(yǔ)言詞條的映射關(guān)系數(shù)據(jù)庫(kù)作為輔助數(shù)據(jù)庫(kù),進(jìn)行雙解詞典的第一語(yǔ)言檢索,輸出雙解詞典中第一語(yǔ)言作為檢索關(guān)鍵詞時(shí)匹配的最佳詞條,并且根據(jù)映射關(guān)系將其余映射的詞條作為用戶進(jìn)行雙解詞典查詢的候選詞條,提高了雙解詞典的第一語(yǔ)言查詞用戶體驗(yàn)。
以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本領(lǐng)域技術(shù)的技術(shù)人員在本發(fā)明公開(kāi)的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。