專利名稱:利用網(wǎng)絡(luò)維護(hù)語言模型庫的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及文字輸入領(lǐng)域,尤其涉及一種利用網(wǎng)絡(luò)輔助實現(xiàn)的,改進(jìn)語言模型庫的維護(hù)方面的輸入方法和系統(tǒng)。
背景技術(shù):
目前流行的輸入法,如搜狗、谷歌輸入法等都內(nèi)置了統(tǒng)計語言模型算法,來分析文字輸入數(shù)據(jù)以生成符合用戶期望的結(jié)果。統(tǒng)計語言模型是用概率統(tǒng)計的方法來揭示語言單位內(nèi)在的統(tǒng)計規(guī)律,其中N-Gram簡單有效,被廣泛使用。N-Gram模型基于這樣一種假設(shè),第 N個詞的出現(xiàn)只與前面N-I個詞相關(guān),而與其它任何詞都不相關(guān),整句的概率就是各個詞出現(xiàn)概率的乘積。這些概率可以通過直接從語料中統(tǒng)計N個詞同時出現(xiàn)的次數(shù)得到。常用的是二元的Bi-Gram和三元的Tri_Gram。具體而言,在輸入法中語言模型的研究任務(wù)是已知文本序列中前面(i_l)個詞匯,第i個詞匯為單詞w的可能性有多大?假設(shè)S代表了某個長度為k的特定單詞序列,S
=wl,w2,......wk。N-gram語言模型將詞匯序列S看作是具有以下概率值的馬爾科夫過
程p(S) = nP(wi |wi-l, wi-2, wi-3, . . . , wi-n+1) (i = 1,· · ·,k)其中η代表了馬爾科夫過程的階數(shù)。例如當(dāng)η = 2時,即上述的二元語言模型 Bi-gram。它利用詞匯對的同現(xiàn)信息來進(jìn)行相關(guān)參數(shù)的概率估計。在輸入法中引入統(tǒng)計語言模型,可以有效地提高在用戶在進(jìn)行文字輸入尤其是進(jìn)行如長句輸入情況下輸入法選擇結(jié)果的準(zhǔn)確率。然而,存在應(yīng)用語言模型的很多進(jìn)一步的問題沒有解決,例如,關(guān)于語言模型庫的更新和優(yōu)化等。實際上,在語言模型應(yīng)用方面,各種現(xiàn)有輸入法都存在某些不完善之處。例如,谷歌輸入法所提供的個性化語言模型庫,注重于本地語言模型庫的維護(hù),網(wǎng)絡(luò)側(cè)對語言模型庫的維護(hù)的輔助作用僅限于原始意義上的同步和更新,即當(dāng)用戶登錄網(wǎng)絡(luò)服務(wù)器時,可以將自己本地的語言模型庫上傳到網(wǎng)絡(luò)保存,并且當(dāng)用戶重裝輸入法或進(jìn)行輸入法升級等情況下,可以要求將網(wǎng)絡(luò)服務(wù)器上保留的用戶語言模型庫與本地用戶設(shè)備的語言模型庫同步。谷歌輸入法中不涉及在網(wǎng)絡(luò)側(cè)對用戶的語言模型庫進(jìn)行優(yōu)化,其僅僅針對用戶個人的輸入習(xí)慣來維護(hù)其個性化語言模型庫,而不會將其他網(wǎng)絡(luò)用戶的輸入習(xí)慣有機(jī)地吸收到用戶的個性化語言模型庫中,即使這種其他網(wǎng)絡(luò)用戶與該用戶具有某種同質(zhì)性或關(guān)于其輸入習(xí)慣的統(tǒng)計對于該用戶的語言模型庫優(yōu)化具有積極意義。囿于本地設(shè)備有限的處理能力, 類似于谷歌輸入法這種語言模型庫必然具有容量有限、更新不及時的內(nèi)在缺陷。搜狗輸入法提供了免本地安裝的云輸入功能,聲稱可以利用服務(wù)器的無限處理容量在云端提供輸入。這實質(zhì)上相當(dāng)于在網(wǎng)絡(luò)側(cè)維護(hù)整個語料庫,并直接與客戶端進(jìn)行交互。 可以想像,這種云輸入所基于的將是沒有經(jīng)過分類或優(yōu)化的巨型語料庫。據(jù)統(tǒng)計,如果把網(wǎng)絡(luò)上出現(xiàn)的詞匯或慣用短語等都收集起來形成的語料庫可能至少超過幾十G容量,而把幾十G的語料庫都同步到本地設(shè)備上幾乎是不可能實現(xiàn)的,特別是對于手持設(shè)備這樣的瘦客戶端來說尤其如此。即便如搜狗輸入法所尋求的那樣,僅在網(wǎng)絡(luò)側(cè)存儲如此大的語料庫,那么直接從網(wǎng)絡(luò)側(cè)基于這樣海量的語料庫搜索出匹配的詞條也是困難的或具有延時的。更重要的,這種對于超大語料庫的使用遵循的是所有人的輸入習(xí)慣,其與用戶個人語言模型沒有關(guān)聯(lián),因此無法提供針對特定用戶調(diào)用特定語言模型所帶來的高效性。為了解決上述問題,需要提供一種新的文字輸入方法。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種解決上述問題的文字輸入方法和系統(tǒng)。根據(jù)本發(fā)明的第一個方面,提供一種利用網(wǎng)絡(luò)輔助實現(xiàn)的輸入系統(tǒng),其利用網(wǎng)絡(luò)服務(wù)器來維護(hù)語言模型庫,并通過針對用戶調(diào)用相應(yīng)語言模型庫來完成輸入,所述系統(tǒng)包括至少一個用戶設(shè)備,配置為由用戶使用進(jìn)行文字輸入,并配置為根據(jù)用戶輸入建立本地語言模型庫;網(wǎng)絡(luò)服務(wù)器,配置為基于接收到的至少一個本地語言模型以及對其他語料的統(tǒng)計分析,建立網(wǎng)絡(luò)語言模型庫;以及語言模型同步裝置,配置為將本地語言模型庫與網(wǎng)絡(luò)語言模型庫進(jìn)行同步。根據(jù)本發(fā)明的第二個方面,提供一種利用網(wǎng)絡(luò)輔助實現(xiàn)的輸入方法,其中在網(wǎng)絡(luò)側(cè)維護(hù)語言模型庫,并通過針對用戶調(diào)用相應(yīng)語言模型庫來完成輸入,所述方法包括步驟根據(jù)用戶輸入建立本地語言模型;將所述本地語言模型上傳到網(wǎng)絡(luò)服務(wù)器;基于接收到的至少一個本地語言模型以及對其他語料的統(tǒng)計分析,建立網(wǎng)絡(luò)語言模型庫。根據(jù)本發(fā)明的方案,可以將在本地建立的適應(yīng)于用戶的個性化語言模型上傳到網(wǎng)絡(luò)側(cè),并在網(wǎng)絡(luò)側(cè)在本地語言模型庫的基礎(chǔ)上,通過對多個用戶的輸入進(jìn)行統(tǒng)計分析,形成網(wǎng)絡(luò)語言模型庫。與現(xiàn)有技術(shù)的語言模型應(yīng)用相比,本發(fā)明利用了服務(wù)器相對于本地設(shè)備而言幾乎無限量的處理能力來進(jìn)行有關(guān)用戶輸入的統(tǒng)計分析,以幫助建立在本地語言模型庫基礎(chǔ)上擴(kuò)充的語言模型庫。同時針對特定用戶而言,擴(kuò)充的網(wǎng)絡(luò)語言模型庫保持了其個性化特征,將在保證語言模型庫良好地適配于特定用戶的前提下縮短用戶對輸入法的訓(xùn)練過程,帶來意想不到的速度提升效果。此外,本發(fā)明可以使用戶能夠根據(jù)需要將本地語言模型庫與網(wǎng)絡(luò)語言模型庫雙向同步,并且無論是本地設(shè)備上保留的語言模型庫還是服務(wù)器為其選擇或調(diào)用的網(wǎng)絡(luò)語言模型庫都是與用戶特征相匹配的,即能夠最大限度地滿足用戶的輸入習(xí)慣要求。
本發(fā)明的上述的以及其他的特征、性質(zhì)和優(yōu)勢將通過下面結(jié)合附圖和實施例的描述而變得更加的明顯,在附圖中相同的附圖標(biāo)記始終表示相同的特征,其中圖1是根據(jù)本發(fā)明的一個實施例的輸入系統(tǒng)的結(jié)構(gòu)框圖;圖2是根據(jù)本發(fā)明的另一個實施例的輸入系統(tǒng)的結(jié)構(gòu)框圖3是根據(jù)本發(fā)明的一個實施例的輸入方法的流程圖;圖4是根據(jù)本發(fā)明的另一個實施例的輸入方法的部分流程圖;圖5是根據(jù)本發(fā)明的網(wǎng)絡(luò)語言模型庫和本地語言模型庫的示意圖;圖6是說明可實現(xiàn)本發(fā)明的適當(dāng)?shù)挠嬎阆到y(tǒng)環(huán)境的示意圖。
具體實施例方式下面結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)描述。下面參照圖1詳細(xì)描述根據(jù)本發(fā)明的一個實施例的文字輸入系統(tǒng)。圖1所示的輸入系統(tǒng)包括網(wǎng)絡(luò)服務(wù)器10、用戶設(shè)備20以及語言模型同步裝置30,其中網(wǎng)絡(luò)服務(wù)器10可
以是分布在互聯(lián)網(wǎng)上的多個網(wǎng)絡(luò)服務(wù)器IO1......10nO這些網(wǎng)絡(luò)服務(wù)器IO1......IOn協(xié)同
工作,構(gòu)成一個服務(wù)器云,為大量用戶提供服務(wù)。網(wǎng)絡(luò)服務(wù)器10也可以是位于企業(yè)局域網(wǎng)上的一個或多個服務(wù)器。為實現(xiàn)本發(fā)明的目的,網(wǎng)絡(luò)服務(wù)器10包括網(wǎng)絡(luò)語料庫101,網(wǎng)絡(luò)語料庫101可以包括分別對應(yīng)于每個用戶的用戶網(wǎng)絡(luò)語料庫IOla以及公共網(wǎng)絡(luò)語料庫101b。用戶網(wǎng)絡(luò)語料庫IOla是每個注冊的用戶的本地語料庫在網(wǎng)絡(luò)服務(wù)器上的備份。 如圖所示,用戶設(shè)備20包括語料庫同步裝置(未示出),用于當(dāng)注冊用戶登錄網(wǎng)絡(luò)服務(wù)器 10后,根據(jù)用戶的選擇將用戶設(shè)備上的本地語料庫201上傳到網(wǎng)絡(luò)服務(wù)器10或者將該用戶保留在網(wǎng)絡(luò)服務(wù)器10上的用戶網(wǎng)絡(luò)語料庫IOla與本地語料庫201進(jìn)行同步。與本地語料庫201相同,用戶網(wǎng)絡(luò)語料庫IOla也存儲有基礎(chǔ)詞匯集、基礎(chǔ)語言模型、用戶使用輸入法過程中生成的詞匯集。還可以存儲一些輔助信息例如,用戶對輸入法的各種設(shè)置屬性,包括但不限于模糊音、繁簡體、雙拼、全拼、簡拼等等;以及用戶的屬性信息,包括但不限于職業(yè)、愛好、專業(yè)領(lǐng)域、簡歷、年齡等等。由于網(wǎng)絡(luò)服務(wù)器10上保存有用戶網(wǎng)絡(luò)語料庫,因此無論用戶用哪個終端設(shè)備,只要能夠連接到網(wǎng)絡(luò)服務(wù)器10都可以通過登錄后同步本地語料庫201或在線使用用戶網(wǎng)絡(luò)語料庫IOla來快速地進(jìn)行錄入。公共網(wǎng)絡(luò)語料庫IOlb基于對公開文獻(xiàn)、出版物、大量用戶的輸入、大量用戶在網(wǎng)絡(luò)搜索引擎上的檢索詞匯、大量網(wǎng)頁的索引關(guān)鍵詞和/或關(guān)鍵詞廣告信息進(jìn)行分析統(tǒng)計而形成,其反映用戶群體的共性或熱點(diǎn)。用戶網(wǎng)絡(luò)語料庫IOla和公共網(wǎng)絡(luò)語料庫IOlb共同構(gòu)成的網(wǎng)絡(luò)語料庫101用作網(wǎng)絡(luò)服務(wù)器10建立網(wǎng)絡(luò)語言模型庫的訓(xùn)練語料庫。網(wǎng)絡(luò)服務(wù)器10包括網(wǎng)絡(luò)語言模型建立裝置102,其用于從網(wǎng)絡(luò)語料庫101獲得訓(xùn)練語料,并由訓(xùn)練語料建立語言模型,其中建立模型包括對訓(xùn)練語料進(jìn)行預(yù)處理、分析語料以抽取語言模型以及對語言模型庫進(jìn)行優(yōu)化處理等。根據(jù)預(yù)定的訓(xùn)練語料建立統(tǒng)計語言模型是本領(lǐng)域技術(shù)人員公知的內(nèi)容,在此不對其詳細(xì)展開。根據(jù)訓(xùn)練語料的豐富程度以及所需模型準(zhǔn)確率、構(gòu)成模型庫的期望大小等,可以選擇建立如二元或三元語言模型之類的具體語言模型種類以及用于建立語言模型的具體算法,如Apriori算法等。網(wǎng)絡(luò)語言模型建立裝置102將生成的語言模型放入網(wǎng)絡(luò)語言模型庫103中。用戶設(shè)備20也通過語言模型同步裝置30將其本地語言模型庫203同步到網(wǎng)絡(luò)語言模型庫103 中。這樣,網(wǎng)絡(luò)語言模型庫103中既包含語言模型建立裝置102由網(wǎng)絡(luò)語料庫101中抽取的語言模型,也包含用戶本地的語言模型。相對于用戶的本地語言模型庫203而言,網(wǎng)絡(luò)語言模型庫更加豐富,融合了大量用戶的輸入習(xí)慣,其中無需用戶的初始訓(xùn)練即可直接調(diào)用符合其習(xí)慣的語言模型。毋庸置疑,人與人之間總是會存在某種聯(lián)系和共性,通過對大量用戶輸入的統(tǒng)計分析,能夠快速建立起適合于多個用戶的語言模型,這比用戶設(shè)備通過分析用戶自身輸入歷史來建立語言模型明顯效率更高。即使是首次輸入一個按鍵序列,用戶也無需再通過逐個糾正長句等語言單位中的干擾詞項即可直接得到符合自己期望的輸出結(jié)果, 這無疑是用戶所期望的。例如,用戶之前從未輸入過按鍵序列“zhuanlfshshxzdiershitia odiyikuan”。利用之前的語言模型庫,用戶需要人為將該句子分為多個詞輸入,或者需要逐個選擇正確詞項來獲得“專利法實施細(xì)則第二十條第一款”,否則有可能得到“專利法實施西藏爹人事調(diào)第一款”這樣錯誤的結(jié)果。然而,如果網(wǎng)絡(luò)語料庫已經(jīng)包含從專利實質(zhì)審查相關(guān)的文本中抽取的相關(guān)語言模型,或者在大量網(wǎng)絡(luò)用戶中存在專利相關(guān)人員包括專利代理人、專利審查員、公司知識產(chǎn)權(quán)顧問,只要曾經(jīng)有一個用戶選擇過同樣的語料輸出,則后續(xù)的用戶就可以省卻了如上所述的麻煩步驟。優(yōu)選地,網(wǎng)絡(luò)語言模型庫103包括分類模塊103a,用于根據(jù)用戶屬性將網(wǎng)絡(luò)語言
模型庫103細(xì)分為多個網(wǎng)絡(luò)語言模型子庫,子庫1、子庫2......子庫η。通過這樣的分類,
將提供更精確的語言模型庫給用戶調(diào)用。在用戶期望將適合自己的網(wǎng)絡(luò)語料庫下載到其本地用戶設(shè)備或者服務(wù)器處理能力有限的情況下,該優(yōu)選方案是有利的。本發(fā)明可以為用戶在節(jié)約語言模型庫占用空間和更便捷地獲得間接語言模型之間取得最佳折中,使用戶既能從網(wǎng)絡(luò)服務(wù)器所擴(kuò)充的語言模型中獲益,又能避免不適合自己的語言模型對自身輸入造成的混淆。圖中為了清楚,將網(wǎng)絡(luò)語言模型建立裝置102和網(wǎng)絡(luò)語言模型庫103示出為獨(dú)立的裝置,實際上,其往往集成于網(wǎng)絡(luò)語料庫101中作為語料庫的有機(jī)組成部分,直接用于與匹配裝置等進(jìn)行交互以完成用戶的輸入。語言模型庫同步裝置30不但用于用戶本地語言模型庫到網(wǎng)絡(luò)服務(wù)器側(cè)的同步 (上傳),也用于為用戶選擇的網(wǎng)絡(luò)語言模型子庫到用戶設(shè)備側(cè)的同步(下載)。用戶設(shè)備20包括本地語料庫201,其中存儲有基礎(chǔ)詞匯集、用戶使用輸入法過程中生成的詞匯集。除此之外,該本地語料庫201還可以存儲一些輔助信息例如,用戶對輸入法的各種設(shè)置屬性,包括但不限于模糊音、繁簡體、雙拼、全拼、簡拼等等;以及用戶的屬性信息,包括但不限于職業(yè)、愛好、專業(yè)領(lǐng)域、簡歷、年齡等等。這些輔助的信息有助于對候選詞條進(jìn)行優(yōu)化排序。如上所述,用戶可以根據(jù)需要將本地語料庫201與網(wǎng)絡(luò)語料庫101 進(jìn)行同步,這可以利用豐富的網(wǎng)絡(luò)資源和服務(wù)器處理能力以及提高本地輸入法設(shè)置的靈活性。用戶設(shè)備20包括本地語言模型建立裝置202,其與網(wǎng)絡(luò)語言模型建立裝置102類似,應(yīng)用已知的語言模型建立算法,根據(jù)本地語料庫201中的語料建立本地語言模型,并將建立的本地語言模型放入本地語言模型庫203中。本地語言模型庫203中包含經(jīng)過對用戶輸入的文本進(jìn)行學(xué)習(xí)訓(xùn)練得到的適合用戶的語言模型。對于不同的用戶,其輸入內(nèi)容在語言模型上可能有較大的差異。比如,有的用戶常輸入正式公文,要求行文規(guī)范、用詞準(zhǔn)確、較少口語化表達(dá)方式;有的用戶常輸入博客文章,要求流暢自然、流行語匯和個性化文風(fēng)層出不窮;而有的用戶常將輸入法應(yīng)用于網(wǎng)絡(luò)聊天,其內(nèi)容則盡是輕松、休閑的風(fēng)格,口語化傾向十分明顯。這種行文風(fēng)格的不同都將體現(xiàn)在語言模型上。如果同一用戶在不同應(yīng)用場合要求不同的語言模型,例如同一用戶有時輸入正式文本,有時輸入聊天內(nèi)容,則需要對本地語言模型庫進(jìn)行細(xì)分,這可以通過類似于網(wǎng)絡(luò)語言模型庫103的分類模塊來實現(xiàn)。同樣地,圖中為了清楚,將本地語言模型建立裝置202和本地語言模型庫203示出為獨(dú)立的裝置,實際上,其往往集成于本地語料庫201中作為語料庫的有機(jī)組成部分,直接用于與匹配裝置等進(jìn)行交互以完成用戶的輸入。在本實施例中,用戶設(shè)備20還包括本地匹配裝置204,其用于與由用戶使用來進(jìn)行輸入文字的輸入組件(鍵盤205和顯示裝置206)配合來實現(xiàn)本地輸入。其中,本地匹配裝置204用于接收用戶經(jīng)鍵盤205輸入的按鍵序列,并調(diào)用本地語言模型在本地語料庫中進(jìn)行查詢,隨后將候選詞項輸出到顯示裝置206,供用戶進(jìn)行選擇。在后面將要詳細(xì)介紹的云輸入的實施例中,用戶設(shè)備所包括的配置為由用戶使用來輸入文字的輸入組件(鍵盤 205和顯示裝置206)還可以與網(wǎng)絡(luò)側(cè)的網(wǎng)絡(luò)匹配裝置直接交互,以實現(xiàn)云輸入模式。圖2示出了根據(jù)本發(fā)明的另一個實施例的文字輸入系統(tǒng)。圖2的輸入系統(tǒng)與圖1 中的系統(tǒng)類似,只是圖2中的系統(tǒng)可以由服務(wù)器直接在云端為用戶提供輸入服務(wù)。如圖所示,在網(wǎng)絡(luò)服務(wù)器10中增加了網(wǎng)絡(luò)匹配裝置104,其在接收到用戶經(jīng)鍵盤205輸入的按鍵序列后,與網(wǎng)絡(luò)語料庫101以及網(wǎng)絡(luò)語言模型庫103(其中的相應(yīng)網(wǎng)絡(luò)語言模型子庫)交互, 獲得一個或多個網(wǎng)絡(luò)候選詞項,并將候選詞項發(fā)送到用戶設(shè)備20上的顯示裝置206,供用戶選擇。為了清楚,圖2中的用戶設(shè)備20沒有包括本地匹配裝置。實際上,用戶設(shè)備20可以仍然包括本地匹配裝置,并包括用于將網(wǎng)絡(luò)候選詞項以及本地候選詞項匯總在一起的匯總裝置(未示出)。這種結(jié)合本地輸入與服務(wù)器協(xié)助的方法,既可以利用網(wǎng)絡(luò)側(cè)龐大的網(wǎng)絡(luò)語料庫和強(qiáng)大的服務(wù)器處理能力來查找適合的詞條選項,也可以利用本地設(shè)備反應(yīng)速度快帶來的優(yōu)勢。圖3為根據(jù)本發(fā)明的一個實施例的在網(wǎng)絡(luò)服務(wù)器上維護(hù)語言模型庫的方法的流程圖。如圖所示,在步驟S301中,用戶設(shè)備根據(jù)本地語料庫建立本地語言模型。該本地語料庫所包含的訓(xùn)練語料可以是基礎(chǔ)詞匯集、用戶使用輸入法過程中生成的詞匯集。該本地語言模型可以是二元或者三元語言模型。建立語言模型的算法是本領(lǐng)域技術(shù)人員所熟知的, 在此不再贅述。在步驟S302中,用戶設(shè)備將本地語言模型上傳到網(wǎng)絡(luò)服務(wù)器。例如,通過圖1和圖 2中的語言模型庫同步裝置來實現(xiàn)該上傳步驟。當(dāng)用戶通過用戶設(shè)備登錄到網(wǎng)絡(luò)服務(wù)器時, 在接收到來自用戶設(shè)備的語言模型庫同步指令之后,將該用戶的本地語言模型庫同步到網(wǎng)絡(luò)語言模型庫。在步驟S303中,網(wǎng)絡(luò)服務(wù)器接收到用戶設(shè)備的本地語言模型,將該本地語言模型庫合并到網(wǎng)絡(luò)語言模型庫中。網(wǎng)絡(luò)語言模型庫可以看做多個用戶的本地語言模型庫的有機(jī)集合,其在各個本地語言模型庫的基礎(chǔ)上,結(jié)合從網(wǎng)絡(luò)語料中抽取到的新增語言模型,形成更大的語言模型庫。在步驟S304中,根據(jù)用戶屬性,將網(wǎng)絡(luò)語言模型庫細(xì)分為多個網(wǎng)絡(luò)語言模型子庫。用戶屬性可以是用戶的工作性質(zhì)、興趣愛好、年齡階段、地理區(qū)域等。由于這種屬性,用戶在進(jìn)行輸入時反映出不同的輸入風(fēng)格和輸入習(xí)慣。例如,同樣表達(dá)堵車的意思,年齡較大的用戶可能會輸入“今天早晨路上真堵”,而年齡較小的用戶可能會輸入“今兒早上超級堵”。又例如,喜歡足球的用戶會常常用到“荷蘭和斯洛伐克比分多少”,“今晚的杯賽到底幾點(diǎn)開始”等表達(dá),而對該類運(yùn)動無興趣的用戶可能根本不會涉及到這種句式。因此,根據(jù)用戶所具有的不同屬性,形成更具有顆粒度的網(wǎng)絡(luò)語言模型子庫,將能夠結(jié)合網(wǎng)絡(luò)語言模型庫的實時和豐富優(yōu)勢和本地語言模型庫的準(zhǔn)確和個性化優(yōu)勢,為用戶輸入提供最優(yōu)選擇。在步驟S305中,針對用戶調(diào)用相應(yīng)的網(wǎng)絡(luò)語言模型子庫。當(dāng)用戶期望將網(wǎng)絡(luò)語言模型庫中的語言模型同步到本地語言模型庫,或者用戶期望由服務(wù)器直接提供云輸入服務(wù)時,可為其調(diào)用適合的網(wǎng)絡(luò)語言模型子庫。例如,根據(jù)用戶屬性(李威-男-23歲-熱愛足
球-......),將為其選擇的網(wǎng)絡(luò)語言模型子庫發(fā)送語言模型庫同步裝置,由后者同步到本
地語言模型庫;或者由網(wǎng)絡(luò)匹配裝置調(diào)用為其選擇的網(wǎng)絡(luò)語言模型子庫,在網(wǎng)絡(luò)語料庫中查詢相應(yīng)的網(wǎng)絡(luò)候選結(jié)果,傳送給用戶的顯示裝置供其選擇。圖4示出了根據(jù)本發(fā)明的由網(wǎng)絡(luò)服務(wù)器在其維護(hù)的網(wǎng)絡(luò)語言模型庫的基礎(chǔ)上提供云輸入的方法的流程圖。在步驟S401中,經(jīng)由網(wǎng)絡(luò)接收用戶在用戶設(shè)備的鍵盤上的按鍵輸入序列。該按鍵序列可以是一個或多個詞組甚至一句話的簡拼或全拼,例如用戶要輸入“我喜歡用百度搜索引擎”,可以輸入每個字聲母的簡拼“wxhybdssyq”,可以輸入每個字的全拼“woxihuanyongbaidusousuoyinqing”,還可以輸入簡拼和全拼的混合輸入 “woxhuanybaidssyinq”。一般來說,全部輸入全拼的話,候選詞更加精確,減少翻頁查找的次數(shù),但是需要輸入較多字符。如果全部輸入簡拼,則重碼較多,導(dǎo)致翻頁查找時間較長,效率不高。因此通常全拼和簡拼混合輸入比較有效。接著,在步驟S402中,獲得用戶的按鍵輸入序列后,調(diào)用與用戶相應(yīng)的網(wǎng)絡(luò)語言模型子庫,將所述輸入序列在網(wǎng)絡(luò)服務(wù)器的網(wǎng)絡(luò)語料庫中進(jìn)行匹配查詢。由于網(wǎng)絡(luò)語料庫非常龐大,同時依據(jù)的是符合用戶輸入習(xí)慣的語言模型,因此匹配的結(jié)果會更加準(zhǔn)確,例如可能直接返回“我喜歡用百度搜索引擎”這個詞條,而不需逐個詞組進(jìn)行翻頁選詞,因此即便網(wǎng)絡(luò)反饋稍有滯后仍然會大大加快輸入速度。舉例來說,假設(shè)用戶輸入的按鍵序列是簡拼“wxhtzhmsh”。在網(wǎng)絡(luò)語料庫中針對
WXh存在詞項“我喜歡、無信號、無限好、汪小荷......”,針對tzh存在“特征、通知、同志、
童裝、桶裝......”,針對msh存在“描述、模式、沒說、秒殺、美食......”,根據(jù)不同的語言
模型,上述詞項可以構(gòu)成諸如“我喜歡圖中美食”、“無信號調(diào)整模式”和“汪小荷童裝秒殺” 等等。根據(jù)用戶屬性可知該用戶的工作性質(zhì)為淘寶店專業(yè)賣家,則調(diào)用其相應(yīng)的語言模型后,發(fā)現(xiàn)最有可能的輸出結(jié)果應(yīng)當(dāng)是第三種選擇。而對于不具有這種屬性的用戶而言,則很難得到這樣的詞項組合。在步驟S403中,將所獲得的網(wǎng)絡(luò)詞條選項反饋會給用戶設(shè)備,供其選擇。網(wǎng)絡(luò)匹配裝置可以根據(jù)詞條先前是否被選擇過、詞條先前被選擇的時間先后、詞條先前被選擇的次數(shù)、用戶預(yù)置的輸入偏好選項和/或詞條在網(wǎng)絡(luò)上的被搜索的次數(shù)來確定詞條選項的優(yōu)先級。在此雖然用了詞條選項一詞,但是應(yīng)當(dāng)理解,其代指用戶期望得到的任何語言單位, 甚至包括一段話。在目前輸入法越來越智能的情況下,用戶直接輸入較長的按鍵序列而得到比單詞、詞組甚至句子更長和完整的候選語言單位是非??赡艿摹D5示出了根據(jù)本發(fā)明的網(wǎng)絡(luò)語言模型庫和本地語言模型庫的示意圖。如圖所示,網(wǎng)絡(luò)服務(wù)器10上的網(wǎng)絡(luò)語言模型庫103包括若干個子庫公務(wù)員子庫、淘寶子庫、25歲以下子庫、足球子庫等。用戶設(shè)備20上的本地語言模型庫203包括兩個子庫工作子庫和聊天子庫。該用戶設(shè)備20的用戶是一個23歲的年輕人,在政府機(jī)構(gòu)任職,業(yè)余愛好是足球。當(dāng)其使用輸入法時,可以利用語言模型庫同步裝置30將其本地語言模型庫同步到網(wǎng)絡(luò)語言模型庫103,該網(wǎng)絡(luò)語言模型庫103內(nèi)的分類模塊(未示出)將根據(jù)該用戶的屬性將這些語言模型合并到相應(yīng)的網(wǎng)絡(luò)語言模型子庫中。當(dāng)然,也有可能網(wǎng)絡(luò)語言模型庫為每個用戶維護(hù)其自己的子庫,如甲、乙、丙、丁、戊子庫。當(dāng)用戶更換其用戶設(shè)備,或者更新其輸入法時,可以通過語言模型庫同步裝置30將適合自己的網(wǎng)絡(luò)語言模型子庫同步到本地。如圖中的虛線所示,將公務(wù)員子庫中的語言模型同步到該用戶的工作子庫中,以便于其在進(jìn)行工作相關(guān)輸入時容易地獲得符合正式公文的行文風(fēng)格、語言規(guī)范的輸出結(jié)果。另外,將25歲以下以及足球子庫中的語言模型同步到該用戶的聊天子庫,以便于其在如網(wǎng)絡(luò)聊天等非正式交互場景進(jìn)行輸入時容易地獲得網(wǎng)絡(luò)中的新詞、熱詞、口頭語的表達(dá)等相對隨意的輸入結(jié)果。圖5中的子庫分類僅僅是一個示例,在實踐中也可能存在根據(jù)用戶其他屬性獲得的分類結(jié)果以及與本地語言模型之間的其他形式的映射。圖6說明了適當(dāng)?shù)挠嬎阆到y(tǒng)環(huán)境600的一例,其中可以實現(xiàn)本發(fā)明。計算系統(tǒng)環(huán)境600僅是適當(dāng)?shù)挠嬎悱h(huán)境的一例并且并非意圖限制本發(fā)明的使用范圍或功能。計算環(huán)境 600不應(yīng)被解釋為具有與示例性操作環(huán)境600中所述的組件的任一或組合有關(guān)的從屬性或要求。本領(lǐng)域的技術(shù)人員可以理解,計算機(jī)或其它客戶機(jī)或服務(wù)器設(shè)備可以作為部分計算機(jī)網(wǎng)絡(luò)而采用,或者用于分布式計算環(huán)境中。在這點(diǎn)上,本發(fā)明屬于具有任意數(shù)量內(nèi)存或存儲單元的任意計算機(jī)系統(tǒng),以及發(fā)生在任意數(shù)量存儲單元或容量上的任意數(shù)量的應(yīng)用程序和過程,它們可以與本發(fā)明一起使用。本發(fā)明可以應(yīng)用于在網(wǎng)絡(luò)環(huán)境或分布式計算環(huán)境中采用服務(wù)器計算機(jī)和客戶機(jī)計算機(jī)的環(huán)境。本發(fā)明還可以用于獨(dú)立計算設(shè)備,具有編程語言功能、以及與遠(yuǎn)程或本地服務(wù)一起產(chǎn)生、接收和發(fā)射信息的解譯和執(zhí)行能力。本發(fā)明可以用多種其它通用或?qū)S糜嬎阆到y(tǒng)環(huán)境或配置來操作.可以適合與本發(fā)明一起使用的公知計算系統(tǒng)、環(huán)境和/或配置的示例包括、但不限于個人計算機(jī)、服務(wù)器計算機(jī)、手提或便攜式設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、機(jī)頂盒、可編程用戶電子設(shè)備、網(wǎng)絡(luò)PC、小型計算機(jī)、大型計算機(jī)、包括任一上述系統(tǒng)的分布式計算環(huán)境等等。本發(fā)明可以用計算機(jī)可執(zhí)行指令的一般上下文來描述,譬如由計算機(jī)執(zhí)行的程序模塊。一般而言,程序模塊包括例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等,它們執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型。本發(fā)明還可以實際用于分布式計算環(huán)境中,其中由通過通信網(wǎng)絡(luò)或其它數(shù)據(jù)傳輸媒質(zhì)連接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計算環(huán)境中,程序模塊及其它數(shù)據(jù)可以位于本地和遠(yuǎn)程存儲媒質(zhì)中,包括內(nèi)存存儲設(shè)備。分布式計算通過計算設(shè)備和系統(tǒng)間的直接交換便于共享計算機(jī)資源和服務(wù)。這些資源和服務(wù)包括信息、高速緩存、及文件磁盤存儲的交換。分布式計算利用網(wǎng)絡(luò)連接性,允許用戶機(jī)發(fā)揮它們的集體功效來有利于整個公司。在這點(diǎn)上,多種設(shè)備可以具有應(yīng)用程序、對象或資源,它們可以利用本發(fā)明的技術(shù)。參考圖6,用于實現(xiàn)本發(fā)明的示例性系統(tǒng)包括形式為計算機(jī)610的通用計算設(shè)備。 計算機(jī)610的組件可以包括、但不限于處理單元620、系統(tǒng)內(nèi)存630、及把包括系統(tǒng)內(nèi)存在內(nèi)的各種系統(tǒng)組件藕合至處理單元620的系統(tǒng).總線621。系統(tǒng)總線621可以是多種類型.總線結(jié)構(gòu)的任一種,包括內(nèi)存總線或內(nèi)存控制器、外圍設(shè)備總線、及使用任一多種總線結(jié)構(gòu)的本地總線。通過示例但非限制,這種結(jié)構(gòu)包括工業(yè)標(biāo)準(zhǔn)結(jié)構(gòu)(ISA)總線、微通道結(jié)構(gòu) (MCA)總線、增強(qiáng)型ISA(EISA)總線、視頻電子標(biāo)準(zhǔn)聯(lián)盟(VESA)本地總線、及外圍組件互連 (PCI)總線(也稱為Mezzanine總線)。計算機(jī)610 —般包括各種計算機(jī)可讀媒質(zhì)。計算機(jī)可讀媒質(zhì)可以是能由計算機(jī) 610訪問的任何可用媒質(zhì)并包括易失性和非易失性的媒質(zhì)、可移動和不可移動媒質(zhì)。通過示例但非限制,計算機(jī)可讀媒質(zhì)可以包括計算機(jī)存儲媒質(zhì)和通信媒質(zhì)。計算機(jī)存儲媒質(zhì)包括易失性和非易失性、可移動和不可移動媒質(zhì),它們以用于存儲諸如計算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)這樣的信息的任意方法或技術(shù)來實現(xiàn)。計算機(jī)存儲媒質(zhì)包括、但不限于RAM、R0M、EEPR0M、閃存或其它存儲技術(shù)、CDR0M、數(shù)字化通用光盤(DVD)或其它光盤存儲器、磁帶盒、磁帶、磁盤存儲器或其它磁性存儲設(shè)備、或用于存儲期望信息并能由計算機(jī) 610訪問的任意其它媒質(zhì)。通信媒質(zhì)一般在諸如載波或其它傳輸機(jī)制這樣的已調(diào)數(shù)據(jù)信號中包含計算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù),并且包括任意信息傳遞媒質(zhì)。術(shù)語“已調(diào)數(shù)據(jù)信號”意指其一個或多個特性以對信號內(nèi)信息進(jìn)行編碼的方式被設(shè)置或改變的信號。通過示例但非限制,通信媒質(zhì)包括諸如有線網(wǎng)絡(luò)或直接線連接這樣的有線媒質(zhì)、以及諸如聲音、RF、紅外這樣的無線媒質(zhì)及其它無線媒質(zhì)。上述的任意組合應(yīng)該包含在計算機(jī)可讀媒質(zhì)的范圍內(nèi)。系統(tǒng)內(nèi)存630包括計算機(jī)存儲媒質(zhì),其形式為易失性和/或非易失性內(nèi)存,譬如只讀內(nèi)存(ROM)631和隨機(jī)存取內(nèi)存(RAM)632?;据斎?輸出系統(tǒng)633 ¢10 —般存儲在 ROM 131內(nèi),它包含例如啟動期間幫助在計算機(jī)610內(nèi)的組件間傳輸信息的基本例程。RAM 632 一般包含數(shù)據(jù)和/或程序模塊,它們可以立即訪問并且/或者當(dāng)前由處理單元620在其上操作。通過示例但非限制,圖6說明了操作系統(tǒng)634、應(yīng)用程序635、其它程序模塊636和程序數(shù)據(jù)637。計算機(jī)610還可以包括其它可移動/不可移動、易失性/非易失性計算機(jī)存儲媒質(zhì)。僅僅通過示例,圖6說明了對不可移動、非易失性磁性媒質(zhì)進(jìn)行讀寫的硬盤驅(qū)動器641、 對可移動、非易失性磁盤652進(jìn)行讀寫的磁盤驅(qū)動器651、以及對可移動、非易失性光盤656 進(jìn)行讀寫的光盤驅(qū)動器655,譬如CD ROM或其它光學(xué)媒質(zhì)。示例性操作環(huán)境中可用的其它可移動/不可移動、易失性/非易失性計算存儲媒質(zhì)包括、但不限于磁帶盒、閃存卡、數(shù)字通用盤、數(shù)字視頻磁帶、固態(tài)RAM、固態(tài)ROM等等。硬盤驅(qū)動器641 —般通過如接口 640這樣的不可移動存儲器接口與系統(tǒng)總線621相連,且磁盤驅(qū)動器651和光盤驅(qū)動器655 —般用如接口 650這樣的可移動存儲器接口與系統(tǒng)總線621相連。上面討論并在圖6中說明的驅(qū)動器和它們的相關(guān)計算機(jī)存儲媒質(zhì)為計算機(jī)610提供了計算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊和其它數(shù)據(jù)的存儲。在圖6中,例如,所述硬盤驅(qū)動器641存儲操作系統(tǒng)644、應(yīng)用程序645、其它程序模塊646和程序數(shù)據(jù)647。注意到這些組件或者可與操作系統(tǒng)634、應(yīng)用程序635、其它程序模塊636和程序數(shù)據(jù)637相同,或者與它們不同。這里為操作系統(tǒng)644、應(yīng)用程序645、其它程序模塊646和程序數(shù)據(jù)647給出不同數(shù)字以說明它們至少是不同的副本。用戶可以通過諸如鍵盤662和指示設(shè)備661這樣的輸入設(shè)備把命令和信息輸入到計算機(jī)610中,輸入設(shè)備通常稱為鼠標(biāo)、軌跡球或觸板。其它輸入設(shè)備(未示出)可以包括麥克風(fēng)、游戲桿、游戲板、衛(wèi)星式轉(zhuǎn)盤、掃描儀等等。這些和其它輸入設(shè)備經(jīng)常通過與系統(tǒng)總線621藕合的用戶輸入接口 660與處理單元620相連,但也可以用其它接口和總線結(jié)構(gòu)連接,譬如并行端口、游戲端口或通用串行總線(USB)。監(jiān)視器 691或其它類型的顯示設(shè)備也通過諸如視頻接口 690這樣的接口與系統(tǒng)總線621相連。除了監(jiān)視器691之外,計算機(jī)還可以包括其它外部設(shè)備,如揚(yáng)聲器697和打印機(jī)1 %,它們可以通過輸出外設(shè)接口 690連接。計算機(jī)610可以工作在聯(lián)網(wǎng)環(huán)境中,該環(huán)境使用與諸如遠(yuǎn)程計算機(jī)680這樣的一個或多個遠(yuǎn)程計算機(jī)之間的邏輯連接。遠(yuǎn)程計算機(jī)680可以是個人計算機(jī)、服務(wù)器、路由器、網(wǎng)絡(luò)PC、對等設(shè)備或其它公共網(wǎng)絡(luò)節(jié)點(diǎn),并且一般包括上述與計算機(jī)610有關(guān)的許多或全部元件,盡管圖6中僅說明了內(nèi)存存儲設(shè)備681。圖6所述的邏輯連接包括局域網(wǎng) (LAN)671和廣域網(wǎng)(WAN)673,但可以還包括其它網(wǎng)絡(luò)。這種聯(lián)網(wǎng)環(huán)境在辦公室、企業(yè)范圍計算機(jī)網(wǎng)絡(luò)、企業(yè)內(nèi)聯(lián)網(wǎng)和互聯(lián)網(wǎng)中是常見的。當(dāng)用于LAN聯(lián)網(wǎng)環(huán)境中時,計算機(jī)610通過網(wǎng)絡(luò)接口或適配器670與LAN 671相連。當(dāng)用于WAN聯(lián)網(wǎng)環(huán)境中時,計算機(jī)610—般包括用于在諸如互聯(lián)網(wǎng)這樣的WAN 673上建立通信的調(diào)制解調(diào)器672或其它裝置。調(diào)制解調(diào)器672可以是內(nèi)部或外部的,它可以通過用戶輸入接口 660或其它適當(dāng)機(jī)制與系統(tǒng)總線621相連。在網(wǎng)絡(luò)化環(huán)境中,關(guān)于計算機(jī) 610所述的程序模塊或其部分可以存儲在遠(yuǎn)程內(nèi)存存儲設(shè)備中。通過示例但非限制,圖6說明了駐留在內(nèi)存設(shè)備681上的遠(yuǎn)程應(yīng)用程序685??梢岳斫?,所示網(wǎng)絡(luò)連接是示例性的,也可以使用在計算機(jī)間建立通信連接的其它裝置。以上對本發(fā)明的具體實施例進(jìn)行了描述。需要理解的是,本發(fā)明并不局限于上述特定實施方式,本領(lǐng)域技術(shù)人員可以在所附權(quán)利要求的范圍內(nèi)做出各種變形或修改。
權(quán)利要求
1.一種利用網(wǎng)絡(luò)輔助實現(xiàn)的輸入系統(tǒng),其利用網(wǎng)絡(luò)服務(wù)器來維護(hù)語言模型庫,并通過針對用戶調(diào)用相應(yīng)語言模型庫來完成輸入,所述系統(tǒng)包括至少一個用戶設(shè)備,配置為由用戶使用進(jìn)行文字輸入,并配置為根據(jù)用戶輸入建立本地語言模型庫;網(wǎng)絡(luò)服務(wù)器,配置為基于接收到的至少一個本地語言模型以及對其他語料的統(tǒng)計分析,建立網(wǎng)絡(luò)語言模型庫;以及語言模型同步裝置,配置為將本地語言模型庫與網(wǎng)絡(luò)語言模型庫進(jìn)行同步。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述網(wǎng)絡(luò)服務(wù)器進(jìn)一步包括網(wǎng)絡(luò)語料庫,所述網(wǎng)絡(luò)語料庫包含用于建立網(wǎng)絡(luò)語言模型庫的訓(xùn)練語料。
3.根據(jù)權(quán)利要求2所述的系統(tǒng),其中所述網(wǎng)絡(luò)語料庫包括用戶網(wǎng)絡(luò)語料庫和公共網(wǎng)絡(luò)語料庫,其中用戶網(wǎng)絡(luò)語料庫可與用戶的本地語料庫進(jìn)行同步。
4.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述網(wǎng)絡(luò)服務(wù)器進(jìn)一步包括網(wǎng)絡(luò)語言模型建立裝置,用于根據(jù)網(wǎng)絡(luò)語料庫中的語料建立網(wǎng)絡(luò)語言模型。
5.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述網(wǎng)絡(luò)語言模型庫包括分類模塊,用于根據(jù)用戶屬性,將網(wǎng)絡(luò)語言模型庫分類為一個或多個網(wǎng)絡(luò)語言模型子庫。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其中所述用戶屬性選自包括以下項的組用戶的工作性質(zhì)、興趣愛好、年齡階段、居住區(qū)域。
7.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述網(wǎng)絡(luò)服務(wù)器進(jìn)一步包括網(wǎng)絡(luò)匹配裝置,其與網(wǎng)絡(luò)語料庫和網(wǎng)絡(luò)語言模型庫交互,用于針對用戶調(diào)用相應(yīng)類型的網(wǎng)絡(luò)語言模型子庫對網(wǎng)絡(luò)語料庫進(jìn)行查詢,以提供云輸入服務(wù)。
8.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述用戶設(shè)備進(jìn)一步包括本地語料庫和本地語言模型建立裝置,其中所述本地語言模型建立裝置根據(jù)所述本地語料庫中的語料建立本地語言模型庫。
9.一種利用網(wǎng)絡(luò)輔助實現(xiàn)的輸入方法,其中在網(wǎng)絡(luò)側(cè)維護(hù)語言模型庫,并通過針對用戶調(diào)用相應(yīng)語言模型庫來完成輸入,所述方法包括步驟根據(jù)用戶輸入建立本地語言模型;將所述本地語言模型上傳到網(wǎng)絡(luò)服務(wù)器;基于接收到的至少一個本地語言模型以及對其他語料的統(tǒng)計分析,建立網(wǎng)絡(luò)語言模型庫。
10.根據(jù)權(quán)利要求9所述的方法,還包括從網(wǎng)絡(luò)語料庫獲得訓(xùn)練語料,通過對訓(xùn)練語料進(jìn)行統(tǒng)計分析建立網(wǎng)絡(luò)語言模型庫。
11.根據(jù)權(quán)利要求10所述的方法,還包括將用戶本地語料庫與網(wǎng)絡(luò)語料庫進(jìn)行同步。
12.根據(jù)權(quán)利要求9所述的方法,其中所述建立網(wǎng)絡(luò)語言模型庫包括對訓(xùn)練語料進(jìn)行預(yù)處理、語言模型抽取以及對得到的語言模型庫進(jìn)行優(yōu)化。
13.根據(jù)權(quán)利要求9所述的方法,還包括根據(jù)用戶屬性,將網(wǎng)絡(luò)語言模型庫分類為一個或多個網(wǎng)絡(luò)語言模型子庫。
14.根據(jù)權(quán)利要求9所述的方法,其中所述用戶屬性選自包括以下項的組用戶工作性質(zhì)、興趣愛好、年齡階段、居住區(qū)域等。
15.根據(jù)權(quán)利要求9所述的方法,還包括針對用戶調(diào)用相應(yīng)類型的網(wǎng)絡(luò)語言模型庫對網(wǎng)絡(luò)語料庫進(jìn)行查詢,以提供云輸入服務(wù)。
16.根據(jù)權(quán)利要求13所述的方法,還包括將適合于該用戶的網(wǎng)絡(luò)語言模型子庫同步到用戶正在使用的用戶設(shè)備。
全文摘要
本發(fā)明涉及一種利用網(wǎng)絡(luò)輔助實現(xiàn)的輸入方法和系統(tǒng),其利用網(wǎng)絡(luò)服務(wù)器來維護(hù)語言模型庫,并通過針對用戶調(diào)用相應(yīng)語言模型庫來完成輸入,該系統(tǒng)包括至少一個用戶設(shè)備,配置為由用戶使用進(jìn)行文字輸入,并配置為根據(jù)用戶輸入建立本地語言模型庫;網(wǎng)絡(luò)服務(wù)器,配置為基于接收到的至少一個本地語言模型以及對其他語料的統(tǒng)計分析,建立網(wǎng)絡(luò)語言模型庫;以及語言模型同步裝置,配置為將本地語言模型庫與網(wǎng)絡(luò)語言模型庫進(jìn)行同步。本發(fā)明還涉及用于利用上述系統(tǒng)實現(xiàn)的輸入方法。
文檔編號G06F17/30GK102314440SQ20101021663
公開日2012年1月11日 申請日期2010年6月30日 優(yōu)先權(quán)日2010年6月30日
發(fā)明者周志華, 弓辰, 蔣斌 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司