專利名稱:一種數(shù)字鍵盤文本輸入的實時翻譯方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種在文本輸入過程中的翻譯方法和系統(tǒng),特別是一種數(shù)字鍵盤文字輸入過程中進行實時翻譯的方法和系統(tǒng)。本發(fā)明適用于手機、小靈通、PDA、掌上電腦、IPTV、機頂盒、游戲機等各種數(shù)字產(chǎn)品。
背景技術(shù):
長期以來,語言差異是不同民族、不同文化之間交流的主要障礙。隨著全球經(jīng)濟一體化的發(fā)展,跨文化、跨民族之間的交流日益頻繁,交流的方式也趨于多樣化、多語言化、國際化,語言差異產(chǎn)生的影響也顯得越來越突出。特別是隨著手機、PDA、小靈通等通信終端的普及,通過這些數(shù)字產(chǎn)品進行瀏覽、編輯、查詢、收發(fā)短信已成為時代的潮流。國際之間的含多語種、不同符號的短信和電子郵件已成為一種趨勢。不同語言之間的翻譯就顯得非常必要和常見。尤其是混合短信的編輯和閱讀對數(shù)字鍵盤輸入技術(shù)提出了更高的要求,支持實時翻譯功能已經(jīng)成為手機等產(chǎn)品中的必然的需求。
然而,現(xiàn)行的數(shù)字產(chǎn)品中或是不支持翻譯功能,或是在手機等數(shù)字產(chǎn)品中添加一個雙語詞典(如英漢詞典),進行單字(詞)查詢和翻譯。但是,這些幫助翻譯的詞典與輸入技術(shù)是相互脫離的,并不在一個系統(tǒng)之內(nèi)。在實際應(yīng)用中,當(dāng)編輯信息需要翻譯時,就必須先退出信息編輯狀態(tài),借助功能鍵進入翻譯菜單,啟動翻譯程序,記下翻譯出來的結(jié)果,再進入信息編輯狀態(tài),輸入先前記下的翻譯結(jié)果。整個過程操作十分繁瑣,翻譯的范圍只能是詞典式詞匯翻譯,無法選定句子、段落或篇章的翻譯范圍,實現(xiàn)部分內(nèi)容翻譯或全文翻譯等。這種翻譯與輸入技術(shù)相脫離的方法沒有從根本上解決人機交互過程中對不同語言文字和信息的處理,難以滿足短信編輯、輸入、閱讀過程中翻譯的實際需要。
發(fā)明內(nèi)容
本發(fā)明的主要目的是為了打破輸入與翻譯相互脫離的狀況,創(chuàng)新一種輸入系統(tǒng)中的翻譯功能技術(shù)。本發(fā)明的創(chuàng)新要點在于輸入技術(shù)和翻譯功能使用同一引擎、同一界面,實現(xiàn)在文本輸入的過程中進行實時翻譯,并可以根據(jù)輸入、閱讀過程中的需要,進行實時、部分、全文等不同翻譯模式的翻譯。通過輸入、選擇、翻譯等環(huán)節(jié)和步驟完成翻譯操作。本發(fā)明實現(xiàn)了人機交互系統(tǒng)中輸入和翻譯功能的完美結(jié)合,滿足日益增多的不同語言、不同文字、不同民族之間的交流的需要,克服跨文化、跨民族交流中因為語言障礙帶來的困難。
在計算機內(nèi)部編碼技術(shù)中,Unicode的產(chǎn)生使文字在計算機內(nèi)最基本的處理單元(編碼字符)在全球范圍內(nèi)和多種語言中得到統(tǒng)一,使全球語言編碼能夠建立在統(tǒng)一的平面上。Unicode提供了一個統(tǒng)一的編碼空間,不同語言文字占用編碼空間的不同部分,并且互不重疊。這種平面分層設(shè)計,使得不同語言可以統(tǒng)一編碼,并且沒有沖突,本發(fā)明就是在這種內(nèi)部碼的統(tǒng)一性的基礎(chǔ)上,提出了一種利用單一核心引擎、同一界面,在文字輸入過程中進行實時翻譯的方法和系統(tǒng)。本發(fā)明利用上述各種語言之間的統(tǒng)一平面和編碼關(guān)系,使信息技術(shù)處理在計算機內(nèi)部碼之間進行不同語言的轉(zhuǎn)換成為可能。在本發(fā)明的方法和系統(tǒng)中不論何種語言或者何種編碼方案均以統(tǒng)一的編碼(Unicode)儲存;無論何種語言,均使用一組統(tǒng)一的標(biāo)準(zhǔn)API(應(yīng)用程序接口)和單一處理邏輯。通過轉(zhuǎn)換模塊,使“單一核心引擎”在同一界面上進行輸入過程中的實時翻譯,并真正做到程序和數(shù)據(jù)兩者的分離。
本發(fā)明單一核心引擎的設(shè)計原理和主要技術(shù)特征是1)使用一組標(biāo)準(zhǔn)API(應(yīng)用程序接口)和單一處理邏輯無論什么語言,均使用一組統(tǒng)一的標(biāo)準(zhǔn)API和單一處理邏輯,例如輸入均為數(shù)字編碼,輸出均為Unicode編碼,因此應(yīng)用程序編程接口兼容不同語言,引擎的實現(xiàn)也只需要遵循統(tǒng)一的規(guī)則處理數(shù)字編碼串,在Unicode數(shù)據(jù)庫中進行搜索,輸出匹配的Unicode編碼串。統(tǒng)一的處理邏輯和同一套標(biāo)準(zhǔn)API更加易于調(diào)用,更加具有一致性。
2)程序和數(shù)據(jù)分離無論何種語言,輸入均為數(shù)字編碼,輸出均為Unicode編碼,因此程序的實現(xiàn)僅與數(shù)字編碼串和Unicode相關(guān),與具體的語言無關(guān)。這樣,如果需要加入和支持一種新的語言,僅僅需要加入該語言相關(guān)的數(shù)據(jù)庫即可,不需要改動程序。同樣,如果需要進行程序升級,僅僅需要更新程序文件,不需要改變已有的數(shù)據(jù)結(jié)構(gòu)。真正實現(xiàn)了程序和數(shù)據(jù)分離,數(shù)據(jù)大小可裁剪。
3)模塊化設(shè)計本發(fā)明中的API解決方案面向各種不同的軟硬件平臺,系統(tǒng)采用模塊化設(shè)計,各項功能都是單獨的模塊,模塊之間通過接口相連。這種獨特的功能模塊機制,使得系統(tǒng)可以根據(jù)要求將某些模塊插入系統(tǒng)或從系統(tǒng)中移走,也根據(jù)嵌入式設(shè)備的特性和個性需求量體裁衣。
附圖1為本發(fā)明系統(tǒng)的輸入模塊、翻譯模塊和其它模塊的關(guān)系示意圖;附圖2為本發(fā)明“實時翻譯”模式的流程示意圖;附圖3為本發(fā)明“部分翻譯”模式的流程示意圖;附圖4為本發(fā)明“全文翻譯”模式的流程示意圖;附圖5為本發(fā)明“實時翻譯”模式的示意圖例;附圖6為本發(fā)明“部分翻譯”模式的示意圖例;附圖7為本發(fā)明“全文翻譯”模式的示意圖例;下面將通過具體實施例,結(jié)合附圖詳細(xì)說明本發(fā)明的技術(shù)特征及其優(yōu)點。
具體實施實例參見附圖1,依據(jù)本發(fā)明單一引擎和模塊化的設(shè)計原理,在本發(fā)明的系統(tǒng)中設(shè)置有輸入裝置、輸入模塊、翻譯模塊、顯示模塊等。該翻譯模塊與輸入模塊及其他轉(zhuǎn)換、計算等功能模塊并存,并共享系統(tǒng)的語言數(shù)據(jù)庫和其它諸如查詢、語法、語義、語用、語境、統(tǒng)計、等相關(guān)單元模塊。在輸入文本的過程中,借助本發(fā)明中定義的功能鍵啟動翻譯模塊、鎖定翻譯的范圍等,可實現(xiàn)在輸入的同時可以進行多種語言之間的實時相互翻譯。
所述輸入裝置用于將自然語言輸入到手機、PDA、機頂盒、IPTV、遙控器等數(shù)字鍵盤終端設(shè)備。所述翻譯模塊主要包括語言數(shù)據(jù)庫、查詢模塊、分析模塊。所述語言數(shù)據(jù)庫指為翻譯功能提供的收錄了多種語言詞匯的數(shù)據(jù)庫。所述查詢模塊指實現(xiàn)翻譯功能,根據(jù)輸入的文字或選定的內(nèi)容在語言數(shù)據(jù)庫中搜索目的語言所對應(yīng)詞匯的程序模塊。所述分析模塊指基于目的語言的語法、語義、語用、語境等規(guī)則,根據(jù)輸入的多個詞匯進行諸多方面分析,來調(diào)整翻譯結(jié)果的程序模塊。顯示模塊則用于顯示翻譯后的信息。
上述分析模塊包含詞匯分析模塊、概率統(tǒng)計分析模塊、語法分析模塊、語義分析模塊、語用分析模塊、語境分析模塊。所述概率統(tǒng)計模塊是指對翻譯文字進行概率統(tǒng)計分析,拆分出詞匯;所述詞匯分析模塊是指對拆分出來的詞匯進行分析翻譯;所述語法分析模塊是指按照目的語言的語法規(guī)則對詞匯進行組合或添加;所述語義分析模塊是指按照目的語言的語義對詞匯進行搭配分析;所述語用分析模塊是指按照目的語言的特征對翻譯結(jié)果進行詞匯搭配的邏輯判斷;所述語境分析是指根據(jù)使用者輸入的上下文內(nèi)容,分析語法的正確性、時態(tài)的合理性的過程。
本發(fā)明提供的語言數(shù)據(jù)庫至少包含兩種以上語言,且可以實現(xiàn)多語種之間的互譯,在擴充語言數(shù)據(jù)庫的情況下還可以完成某一語言的多種方言之間的互譯。在進入本系統(tǒng)時,首先設(shè)置翻譯的源語種和目的語種。無論上述語言數(shù)據(jù)庫中包含哪些語言,這些數(shù)據(jù)均采用優(yōu)化的壓縮技術(shù),以便節(jié)約存儲空間。
為了便于清楚的描述本發(fā)明的翻譯方法,這里以數(shù)字產(chǎn)品手機為例,使用0~9十個數(shù)字鍵進行文字語言的輸入,并設(shè)定如下功能鍵1.OK(確認(rèn))鍵信息處于可文本編輯狀態(tài)下(即文字內(nèi)容可以通過光標(biāo)的移動確定輸入文字的插入、刪除位置),使用該鍵確定開始選擇翻譯范圍;2.“*”鍵使用該鍵啟動翻譯模塊,進行翻譯;3.左選鍵在啟動翻譯模塊的狀態(tài)下,可以使用該鍵左向移動光標(biāo),以選擇翻譯內(nèi)容;4.右選鍵在啟動翻譯模塊的狀態(tài)下,可以使用該鍵右向移動光標(biāo),選擇和確定翻譯內(nèi)容的范圍;5.上選鍵在啟動翻譯模塊的狀態(tài)下,可以使用該鍵向上移動光標(biāo),以選擇翻譯內(nèi)容;6.下選鍵在啟動翻譯模塊的狀態(tài)下,可以使用該鍵向下移動光標(biāo),以選擇翻譯內(nèi)容;以上功能鍵的設(shè)定僅僅為舉例說明,在實際應(yīng)用中可以根據(jù)需要重新定義。
本發(fā)明提出的在數(shù)字鍵盤文本輸入過程中進行實時翻譯的方法主要有以下三種模式一、實時翻譯(參見附圖1和2)a.通過數(shù)字鍵盤或觸摸屏等輸入裝置輸入編碼,得到候選字詞;b.通過功能鍵移動光標(biāo)選擇所需翻譯的候選內(nèi)容;c.按下翻譯功能鍵“*”鍵,啟動翻譯模塊,查詢模塊以便對語言數(shù)據(jù)庫進行查詢,找到與被翻譯內(nèi)容相匹配的目的詞匯。此過程采用了優(yōu)化的查找算法,以便提高查詢和選定的速度;d.在查詢過程中,得到一個或多個匹配結(jié)果,經(jīng)過詞匯分析模塊,得到最合理的詞匯,顯示在候選區(qū)內(nèi),選擇后使之上屏。在完成翻譯后系統(tǒng)會自動恢復(fù)到原來的輸入模式下。
二、部分翻譯(參見附圖1和3)a.此模式可以在兩種狀態(tài)下實現(xiàn)①在得到文本信息后,打開文本信息,并使其位于文本編輯狀態(tài)下(即可以通過光標(biāo)的移動確定輸入文字的插入、刪除位置)(轉(zhuǎn)換到文本編輯狀態(tài)下可以通過一定的方式,如轉(zhuǎn)發(fā)信息);②通過數(shù)字鍵盤或觸摸屏等輸入裝置輸入編碼,得到候選字詞,按上屏鍵使其上屏,重復(fù)上述過程,得到一段文本信息,此時位于文本編輯狀態(tài)下;b.將光標(biāo)移至到所需翻譯的起始位置(或終止位置),按下內(nèi)容選擇鍵OK鍵,確定開始選擇翻譯范圍,利用方向鍵將光標(biāo)移動到需要翻譯文字的終止位置(或起始位置),并將其與不翻譯的文字部分區(qū)別開來,完成文字翻譯范圍的選?。籧.按下翻譯功能鍵“*”鍵,啟動翻譯模塊,查詢模塊便對語言數(shù)據(jù)庫進行查詢,找到與之相匹配的目的詞匯。此過程采用了優(yōu)化的查找算法,以提高了查詢和選定的速度;d.依次經(jīng)過詞匯分析模塊、概率統(tǒng)計分析模塊、語法分析模塊、語義分析模塊、語用分析模塊、語境分析模塊,最終得到最為合理的翻譯語句,并顯示在候選行中。
三、全文翻譯(參見附圖1和4)a.此模式可以在兩種狀態(tài)下實現(xiàn)①收到文本信息的狀態(tài)在得到文本信息后,打開文本信息,并使其位于文本編輯狀態(tài)下;②直接輸入文本信息的狀態(tài)通過鍵盤或觸摸屏等設(shè)備輸入編碼,得到候選字詞,按上屏鍵使其上屏,重復(fù)上述過程,得到一段文本信息,此時位于文本編輯狀態(tài)下;b.按OK鍵確定開始選擇翻譯范圍,在不移動光標(biāo)的情況下,按翻譯功能鍵“*”鍵,啟動翻譯模塊,確定翻譯全部文本信息,將全部文本信息傳送給翻譯模塊;c.翻譯模塊接收到信息文字后,查詢模塊便對語言數(shù)據(jù)庫進行查詢,找到與之相匹配的目的詞匯。此過程采用了優(yōu)化的查找算法,以提高了查詢速度;d.依次經(jīng)過詞匯分析模塊、概率統(tǒng)計分析模塊、語法分析模塊、語義分析模塊、語用分析模塊、語境分析模塊,最終得到最為合理的翻譯語句,并顯示在候選行中。
下面結(jié)合手機的實例(本文以中英文互譯為例),具體說明本發(fā)明的翻譯方法實施例一實時翻譯(參見圖5)以翻譯“工作”為例,描述實時翻譯的過程a.使用拼音輸入模式(也可以使用其它模式)先輸入“工作”;b.通過方向鍵移動光標(biāo),使“工作”被選中(如圖5a所示);c.按“*”鍵,候選區(qū)出現(xiàn)work、job、task、labor、employment等內(nèi)容(如圖5b所示);d.通過方向鍵移動光標(biāo)選擇需要的翻譯,通過OK鍵選擇上屏。
e.在完成翻譯后系統(tǒng)自動恢復(fù)到原來的拼音輸入模式下。
實施例二部分翻譯(參見圖6)以翻譯“周日有空嗎?來我家吧,一起吃午飯!”中的“來我家吧”為例,描述部分翻譯的過程a.使用拼音輸入模式(也可以使用其它模式)先輸入“周日有空嗎?來我家吧,一起吃午飯!”或在得到信息“周日有空嗎?來我家吧,一起吃午飯!”后將其改到可文本編輯狀態(tài)下(即文字內(nèi)容可以通過光標(biāo)的移動確定輸入文字的插入、刪除位置),如通過轉(zhuǎn)發(fā)信息;b.在文本編輯狀態(tài)下,把光標(biāo)置于“來”前面,按OK鍵,確定選擇翻譯范圍的開始,移動方向鍵使光標(biāo)到“吧,”后面,此時選擇了待翻譯的字詞“來我家吧,”(以反顯其顏色為例),并區(qū)別不需翻譯文字;c.按翻譯功能鍵“*”鍵啟動翻譯模塊功能,候選窗口中就顯示與該詞句對應(yīng)的翻譯“Come to my home”。
實施例三全文翻譯(參見圖7)以將“我現(xiàn)在忙,稍候聯(lián)系你”譯成英文為例,描述全文翻譯的過程a.使用拼音輸入模式(也可以使用其它模式)先輸入“我現(xiàn)在忙,稍后聯(lián)系你”或在得到信息“我現(xiàn)在忙,稍后聯(lián)系你”后將其改到可文本編輯狀態(tài)下(如通過轉(zhuǎn)發(fā)信息);
b.按OK鍵確定開始選擇翻譯范圍,不移動光標(biāo),直接按翻譯功能鍵“*”鍵,啟動翻譯模塊;c.全文被翻譯為“I’m busy now,call you later.”,并顯示在候選中。
從以上實例可以看出,本發(fā)明的實時翻譯系統(tǒng)和方法實現(xiàn)了將文字輸入與翻譯功能融合在同一引擎、同一系統(tǒng)、同一界面中,使輸入和翻譯得到了有效結(jié)合。可以在輸入短信或收到短信時,將該短信中的部分內(nèi)容翻譯成需要的其它語言,克服了語言障礙對不同短信的交流所造成的不便,使不同語言文字的輸入、瀏覽、查詢、翻譯等能夠在同一界面上完成。同時,本發(fā)明中翻譯功能的操作方法簡單,更加人性化、系統(tǒng)化。不僅可以支持實時的翻譯,同時支持自選的范圍翻譯,使短信能夠順利完成交互過程中的部分或通篇翻譯,克服了字典式翻譯功能的局限性,滿足國際短信、不同語言混合短信翻譯的需要,使人們相互之間的短信交流更加暢通、自然、和諧。
權(quán)利要求
1.一種數(shù)字鍵盤文本輸入過程中進行實時翻譯的方法,其特征在于該方法包括利用數(shù)字鍵盤輸入各種文字信息,該輸入均為統(tǒng)一的數(shù)字編碼;利用一組統(tǒng)一的應(yīng)用程序接口和單一處理邏輯,按照統(tǒng)一的規(guī)則處理數(shù)字編碼串,在統(tǒng)一編碼字符的數(shù)據(jù)庫中進行搜索,輸出與輸入數(shù)字編碼串相匹配的編碼字符串;在進行各種文字輸入的同時,利用輔助功能鍵的操作,啟動同一引擎、同一界面下的翻譯功能,將不同語言進行實時的相互翻譯。
2.根據(jù)權(quán)利要求1所述的實時翻譯的方法,其特征在于在不同的輸入狀態(tài)下,可選擇實時、部分和全文的翻譯模式。
3.一種數(shù)字鍵盤文本輸入過程中進行實時翻譯的系統(tǒng),其特征在于該系統(tǒng)包括有用于輸入多種文字和編輯文本的輸入裝置,該輸入裝置包括有數(shù)字鍵及輸入模塊;與所述輸入模塊處于同一引擎、同一界面的翻譯模塊,該翻譯模塊中包括有用于為翻譯功能提供多種語言詞匯的語言數(shù)據(jù)庫,用于在數(shù)據(jù)庫中搜索目的語言所對應(yīng)的詞匯和內(nèi)容的查詢模塊,用于對翻譯內(nèi)容進行詞匯、概率統(tǒng)計、語法、語義、語用、語境等分析,得到最合理的匹配候選的分析模塊;用于顯示輸入及翻譯后的信息的顯示模塊;和用于啟動所述翻譯模塊,選擇翻譯范圍的功能鍵。
4.根據(jù)權(quán)利要求3所述的系統(tǒng),其特征在于所述輸入模塊中包括有語言模塊、詞根詞綴模塊、聯(lián)想模塊和智能模塊。
5.根據(jù)權(quán)利要求3所述的系統(tǒng),其特征在于所述分析模塊中包括有詞匯分析模塊、概率統(tǒng)計分析模塊、語法分析模塊、語義分析模塊、語用分析模塊和語境分析模塊。
6.根據(jù)權(quán)利要求3-5中任一權(quán)利要求所述的系統(tǒng),其特征在于所述各功能模塊都是單獨的模塊,模塊之間通過接口相連,可根據(jù)需要將某個模塊插入系統(tǒng)或從系統(tǒng)中拔出。
全文摘要
一種數(shù)字鍵盤文本輸入過程中實現(xiàn)實時翻譯的技術(shù)方法和系統(tǒng),其創(chuàng)新要點在于輸入技術(shù)和翻譯功能使用同一引擎、同一界面,實現(xiàn)在文本輸入的過程中進行實時翻譯,并可以根據(jù)輸入、閱讀過程中的需要,進行實時、部分、全文等不同翻譯模式的翻譯。通過輸入、選擇、翻譯等環(huán)節(jié)和步驟完成翻譯操作。本發(fā)明適用于手機、小靈通、PDA、掌上電腦、IPTV、機頂盒、游戲機等數(shù)字產(chǎn)品中。
文檔編號G06F17/30GK1987744SQ20051013475
公開日2007年6月27日 申請日期2005年12月21日 優(yōu)先權(quán)日2005年12月21日
發(fā)明者王孝軍 申請人:北京優(yōu)耐數(shù)碼科技有限公司