專利名稱:語言翻譯系統(tǒng)的制作方法
本發(fā)明涉及一種將詞組從第一種語言翻譯成第二種語言的系統(tǒng),特別是(但不是單獨(dú)地)涉及一種根據(jù)第一種語言的講話產(chǎn)生第二種語言的話音的系統(tǒng)。
對(duì)快速自動(dòng)語言翻譯機(jī)特別是口譯機(jī)的研究已有多年的歷史了。但盡管近年來電子計(jì)算、言語識(shí)別和言語合成等技術(shù)取得了巨大進(jìn)展,這類機(jī)器仍然只是夢(mèng)幻和小說的資料。
迄今,對(duì)自動(dòng)翻譯正文(text)的計(jì)算機(jī)系統(tǒng)是進(jìn)行過大量的研究工作的。但除了在為數(shù)不多極其有限的應(yīng)用領(lǐng)域(例如天氣預(yù)報(bào)的翻譯)外,都未能取得能自動(dòng)精確地翻譯因而可以取代翻譯員的這樣的成果。言語識(shí)別的誤差、再加上語調(diào)、重音等方面的信息和言語本身的不準(zhǔn)確,使言語的翻譯問題變得復(fù)雜化了。
現(xiàn)有正文語言翻譯程序包又偏偏都是不完全的,不是在這方面欠缺,就是在那方面不足,不能滿足言語至言語的翻譯系統(tǒng)的要求。迄今,這類程序包多數(shù)是作為職業(yè)翻譯員的輔助工具而設(shè)計(jì)的,所產(chǎn)生的輸出必須經(jīng)過其后編輯處理才能以它們的目標(biāo)語言表示出來。多數(shù)程序包不是按項(xiàng)目單加以驅(qū)動(dòng)和進(jìn)行人-機(jī)對(duì)話,就是以緩慢的成批處理方式工作,兩者都不適于“實(shí)時(shí)”言語操作。此外,翻譯程序包也往往不可靠,原因在于,習(xí)慣語和其它例外情況最容易得出錯(cuò)誤的輸出使用者得不到輸出能正確予以翻譯的保證。再者,現(xiàn)有系統(tǒng)中用的中央處理機(jī)非常密集,這使它們的運(yùn)行費(fèi)用非常貴,因而不適用于許多對(duì)費(fèi)用極其敏感的用途。
本發(fā)明試圖提供一種上述不足和缺點(diǎn)有所減少的翻譯系統(tǒng)。
根據(jù)本發(fā)明提供了一種將詞組從第一種語言翻譯成第二種語言的系統(tǒng),該系統(tǒng)包括一存儲(chǔ)一批第二種語言詞組的存儲(chǔ)器;一接收第一種語言詞組的輸入裝置;一以第二種語言輸出包括所述一批詞組中的一詞組的詞組的輸出裝置;一確定所述一批詞組中哪一個(gè)詞組對(duì)應(yīng)于所述輸入詞組的鑒定裝置;一響應(yīng)所述鑒定裝置來控制輸出裝置并確保從所述一批詞組中輸出對(duì)應(yīng)于所述輸入詞組的裝置。
這種系統(tǒng)翻譯速度非常快,所需要的時(shí)間主要花在識(shí)別/鑒定輸入詞組和查找第二種語言中的“答案”。
該系統(tǒng)還可設(shè)計(jì)得可以給使用者提供輸入確認(rèn)信號(hào),表明系統(tǒng)已正確識(shí)別/理解使用者的意思,這在言語翻譯系統(tǒng)中當(dāng)然是特別重要的。
由于所存儲(chǔ)的一批詞組是僅僅由預(yù)先做好的準(zhǔn)確翻譯組成的,因此一旦使用者獲得他的信息已被正確鑒定的確認(rèn)信號(hào)時(shí),翻譯的準(zhǔn)確性即得到了保證。
這種翻譯系統(tǒng)還可能同時(shí)將一種語言迅速地翻譯成若干種第二種語言,所需要增加的部件基本上只是另外一些存儲(chǔ)另外每種第二種語言的各批詞組的存儲(chǔ)器。
現(xiàn)在參照附圖介紹本發(fā)明的一些實(shí)施例。附圖中,圖1是顯示根據(jù)本發(fā)明的系統(tǒng)各主要組件的方框圖。
本發(fā)明是以我們的下列見解為基礎(chǔ)的,即用數(shù)目小得多的關(guān)鍵詞有可能鑒定和抓住大量截然不同的詞組的語義內(nèi)容。通過適當(dāng)?shù)剡x擇關(guān)鍵詞,就有可能使用現(xiàn)行市面上出售的只能識(shí)別數(shù)目遠(yuǎn)比大量有用的詞組組中所包含的詞少得多的詞的言語識(shí)別器,來鑒定和區(qū)別大量的詞組組。
因此翻譯系統(tǒng)的性能總的說來有賴于那些關(guān)鍵詞正確辨別詞組的能力。識(shí)別詞組的能力越大,系統(tǒng)在識(shí)別上的容許誤差就越大,同時(shí)說話者本人所造成的容許誤差也大。
關(guān)鍵詞的選擇合適的檢索程序如下1.根據(jù)各詞在詞組中出現(xiàn)的頻率整理N個(gè)有關(guān)詞組中K個(gè)詞中的每一個(gè)詞。
2.選擇M個(gè)最頻繁出現(xiàn)的詞列入基本關(guān)鍵詞表中,其中M為言語識(shí)別器詞匯中的詞數(shù)。
3.然后確定各詞是否存在于各詞組中。清點(diǎn)計(jì)數(shù)不為關(guān)鍵詞所鑒別的詞組的數(shù)目(E)。
4.令i=1。
5.臨時(shí)從列表中刪除一關(guān)鍵詞,計(jì)算E的新值(E′)。
6.把記分E′-E指定給被暫時(shí)刪除的關(guān)鍵詞。這是在關(guān)鍵詞更新之后對(duì)系統(tǒng)性能變壞的程度的一個(gè)衡量,也就是它對(duì)系統(tǒng)總性能的影響程度的一個(gè)衡量?!矊?shí)際上,這種衡量是用以確保各關(guān)鍵詞盡可能多地識(shí)別詞組對(duì)而不致僅僅重復(fù)其它詞組對(duì)的功能〕。
7.將暫時(shí)刪除了的關(guān)鍵詞復(fù)位,對(duì)M個(gè)關(guān)鍵詞的每一個(gè)關(guān)鍵詞重復(fù)上述過程。
8.從現(xiàn)有關(guān)鍵詞表中除去記分最低的詞。
9.用第M+i個(gè)最頻繁出現(xiàn)的關(guān)鍵詞代替該除去的詞,然后計(jì)算新的E值。
10.若新E值所表示的性能比原E值的好,就增加i值,同時(shí)除非M+i>K,過程停止,否則從第5步起重復(fù)過程。要不然,將第M+i個(gè)詞放棄不用,增加i值,同時(shí)除非M+i>K,在此情況下,在第8步最后一個(gè)被除去的詞復(fù)位,過程停止,否則過程就從第9步起重復(fù)進(jìn)行。
最后得出的關(guān)鍵詞表包含識(shí)別詞組用的由M個(gè)關(guān)鍵單詞組成的最佳關(guān)鍵詞組。
從上一次重復(fù)的最佳M個(gè)詞開始的進(jìn)一步重復(fù)可以進(jìn)一步改進(jìn)詞組的識(shí)別效果。第1步中整理待選用詞的系列可采用試探法而不用頻率法,特別是有既定的語言信息可資利用時(shí)更是如此。此外,可能在出現(xiàn)頻率表中趨近底部的詞對(duì)詞組識(shí)別的幫助不大,因此是不值得超出出現(xiàn)頻率表中前三分之一或前一半的范圍進(jìn)行檢索的。
往往有這樣的情況在檢索過程中,大部分詞組都辨別出來了,而E過早趨近于零。在這些情況下,通過根據(jù)只有當(dāng)不同的關(guān)鍵詞多于一個(gè)時(shí)才可認(rèn)為該諸詞組已鑒別出來了來計(jì)算E的情況,可以獲得進(jìn)一步的改善。這樣可以確保用多于最起碼數(shù)目的關(guān)鍵詞來識(shí)別大多數(shù)詞組,同時(shí)在某種程度上起防止言語識(shí)別誤差的作用。
在檢索過程中會(huì)愈來愈明顯有些類型的詞組如果不擴(kuò)大關(guān)鍵詞匯是永遠(yuǎn)也識(shí)別不出的。這些詞組“簇”或詞組群的區(qū)別往往只在于其中一個(gè)字或一連串輔助字(例如商業(yè)信件中的日期)的不同而已,而且都是自動(dòng)得出的選擇對(duì)象,用以編制關(guān)鍵詞輔助詞匯(下面將詳細(xì)介紹)。
顯然識(shí)別單個(gè)關(guān)鍵詞時(shí)并沒有考慮詞序和可能包含的附加意義。因此,各詞之間具有各種識(shí)別可能性的關(guān)鍵詞對(duì)(或其它復(fù)合詞)的有無也可用以改進(jìn)單個(gè)關(guān)鍵詞組的有效性。這給言語識(shí)別帶來了這樣的好處,即可以提高識(shí)別性能而無需增加識(shí)別詞匯。應(yīng)用在正文上時(shí),還可以通過對(duì)關(guān)鍵詞的歸納推廣使其包括標(biāo)點(diǎn)符號(hào)、詞的各部分和詞與詞各部分的組合等而獲得進(jìn)一步的改進(jìn)。例如,“-ing*bed”(其中*可以是任何詞)可出現(xiàn)在“making the bed”和“selling a bed”中。
若能進(jìn)一步解決詞組的混淆問題,則采用關(guān)鍵詞對(duì)(例如We**to)可以提高作為組成部分的單詞的價(jià)值。檢索一些不一定鄰接而為不同數(shù)量的其它詞所隔開的詞對(duì)也得從按出現(xiàn)頻率進(jìn)行整理的準(zhǔn)備工作開始。其組成詞都是在M個(gè)關(guān)鍵詞中的詞對(duì),若它們能解決任何遺留的詞組的混淆現(xiàn)象,則可以整頓好的列表中制取。和先前一樣,對(duì)最后得出的單個(gè)關(guān)鍵詞和關(guān)鍵詞對(duì)列表進(jìn)行記分,并計(jì)算總的詞組混淆記分值E。
現(xiàn)在開始對(duì)其中一個(gè)或兩個(gè)組成關(guān)鍵詞都不在現(xiàn)有關(guān)鍵詞表中、使用情況更好的詞對(duì)進(jìn)行檢索。從按出現(xiàn)頻率整頓的序列頂部選取下一個(gè)詞對(duì)候選對(duì)象,然后添加到關(guān)鍵詞表中。同時(shí)也加入所添加詞對(duì)中還未出現(xiàn)的單個(gè)關(guān)鍵詞,并刪除等量使用情況最差的單個(gè)關(guān)鍵詞。這一下,其它詞對(duì),若它們的組成詞不再存在的話也可能被刪除。計(jì)算E的新值(E′)。若情況有所改進(jìn)且E′<E,就保留對(duì)關(guān)鍵詞表所作的最新修改,否則將列表回復(fù)到其以前的狀態(tài)。其它詞對(duì)就根據(jù)出現(xiàn)頻率的次序進(jìn)行處理,盡管和檢索單個(gè)關(guān)鍵詞時(shí)一樣,但可以采用其它試探法提供詞對(duì)候選對(duì)象。
值得注意的是,有些關(guān)鍵詞通過加入到若干詞組而比它們單獨(dú)使用時(shí)對(duì)總性能的影響要大。
該方法可推廣應(yīng)用到更大的關(guān)鍵詞的分組(>2個(gè)詞)上,但由于出現(xiàn)頻率的減少,所以只有在詞組是極其大量時(shí),解決詞組混淆問題的作用才突出。
檢索關(guān)鍵詞的計(jì)算量隨著關(guān)鍵詞和詞組數(shù)量而增加。這可通過先對(duì)混淆的或極其接近混淆的詞組子集合進(jìn)行運(yùn)算來減少。如此得出的關(guān)鍵詞及其記分,對(duì)將以更完整的詞組組進(jìn)行工作的主要算法,提供了更有效的候選關(guān)鍵詞的次序安排。
在言語識(shí)別應(yīng)用中,一些不在關(guān)鍵詞組中的詞會(huì)產(chǎn)生許多虛假的關(guān)鍵詞識(shí)別,例如出現(xiàn)“I”一詞時(shí)可能總是會(huì)被識(shí)別為“by”。但若在開始檢索關(guān)鍵詞之前和在接著的詞組識(shí)別時(shí)把混淆詞群視為同義詞性質(zhì)的,則真正識(shí)別詞組時(shí)就不應(yīng)受此問題的影響。此外,由于這類同義詞總的出現(xiàn)的頻繁性必然高于個(gè)別詞的出現(xiàn)頻率,因此通常有較大的詞組信息量與它們的檢測(cè)過程有關(guān)的。
關(guān)鍵詞的應(yīng)用可以推廣到重復(fù)出現(xiàn)頻率更高,且所帶的詞組辨別信息比整個(gè)字更多的關(guān)鍵詞各部分(例如音素)上。此外,在連續(xù)言語中識(shí)別某些詞的部分是要比識(shí)別完整的詞更容易,因而在接收連續(xù)言語話音輸入的翻譯系統(tǒng)中更受歡迎。在本說明書中,“關(guān)鍵詞”一詞是整個(gè)關(guān)鍵詞和關(guān)鍵詞的部分的簡(jiǎn)稱。
有許多種詞組彼此間的區(qū)別僅在于其可能包含日期、時(shí)間、價(jià)格、項(xiàng)目、名稱或其它詞群等細(xì)節(jié)的附屬詞組和附屬子句的不同。有可能一個(gè)言語識(shí)別器的詞匯足以確定一個(gè)詞組為一特定的詞組類別或詞組群,但其容量還不足以容納足量的關(guān)鍵詞以識(shí)別各附屬結(jié)構(gòu)。此外,很有可能識(shí)別詞組類別和附屬結(jié)構(gòu)所需的全部詞匯包含更多易于混淆的詞。這就是說,即使識(shí)別器的容量足以容納整個(gè)詞匯,但由于性能低,因而不能可靠地識(shí)別詞組和附屬詞組。本發(fā)明的方法具有這樣的優(yōu)點(diǎn),即可以將原始的發(fā)音或原始發(fā)音的某些變音存儲(chǔ)在緩沖存儲(chǔ)器中,而且一旦詞組類別被確定下來后,可以用預(yù)期在對(duì)該詞組類別來說系特殊的附屬詞串中有的關(guān)鍵詞組來重復(fù)識(shí)別過程。這樣,識(shí)別器就完全無需馬上應(yīng)付具有許多潛在的詞混淆情況的整個(gè)詞匯,但在使用者看來似乎如此。應(yīng)該指出,輔助識(shí)別過程的速度并不受原始發(fā)音速率的限制,且一般可進(jìn)行得比實(shí)時(shí)快很多,因而不需要引入顯著的延遲。識(shí)別過程可按需要重復(fù)多次,以識(shí)別所要求的詞組及其基本結(jié)構(gòu)。這樣,由于詞組是在多個(gè)識(shí)別階段中鑒別的,且識(shí)別器在各階段對(duì)關(guān)鍵詞的不同詞匯進(jìn)行提取,因而有可能“套用”識(shí)別過程。
附屬詞串有很多(雖然不是全部)在源語言中與上下文無關(guān)。這是因?yàn)橹挥挟?dāng)若干替換詞可能建立密切的上下文依賴關(guān)系,且任何附屬詞串這樣做的可能性更小時(shí),才能確定附屬詞串的位置。此外,上下文關(guān)系的重要性意味著在可能成為附屬詞串內(nèi)外的詞之間存在著依賴關(guān)系,因而無需采用詞串內(nèi)的詞辨別整個(gè)詞組的關(guān)鍵詞是有一定的范圍的。例如在包含變更日期的詞組中(在這種情況下,除日期本身之外,詞組中是很少需要修改任何詞的)就是如此。(未來的研究課題應(yīng)該論證“這種與上下文無關(guān)的性質(zhì)在各語言之間是不變的”這個(gè)假設(shè),并用它來無限制地?cái)U(kuò)大短語集的翻譯。)本發(fā)明的這種特點(diǎn)當(dāng)應(yīng)用到正文翻譯時(shí)有顯著的好外可以采用較小詞典或短語集的類似體系來大大削減查大詞典所需的計(jì)算費(fèi)用。某些附屬詞組是無需翻譯的,而且往往在這些情況下通常不可能自動(dòng)識(shí)別這些詞組中的詞。這種最普遍的情況發(fā)生在參照象專有名詞之類的稱號(hào)發(fā)音時(shí)發(fā)生的,例如“我可與史密斯先生說話嗎?”。和前面所述的一樣,本發(fā)明的系統(tǒng)能識(shí)別詞組類連同各詞在緩沖存儲(chǔ)器中對(duì)應(yīng)于稱號(hào)標(biāo)記的位置。于是在翻譯過程中對(duì)這類稱號(hào)標(biāo)記字的處理僅僅需要在適當(dāng)位置將原始話音信號(hào)以目標(biāo)語言發(fā)音發(fā)送即可。顯然最好是合成出來的目標(biāo)語言的聲與原說話人的話音一致,而且正文轉(zhuǎn)換成言語的合成器的要求是,某些言語話音參量可以調(diào)節(jié),使得盡量滿足話音的一致性(例如老年人/年輕人,男人/女人)。
為使使用者有把握肯定譯出來的目標(biāo)語言詞組的正確性,翻譯系統(tǒng)指示出它將翻譯的輸入語言的詞組。為做到這一點(diǎn),翻譯系統(tǒng)配備有存儲(chǔ)輸入語言詞組的所有組成部分的存儲(chǔ)器。
各詞組在系統(tǒng)中最好作為正文以例如美國信息交換標(biāo)準(zhǔn)碼(ASCII)編碼的形式進(jìn)行存儲(chǔ),因?yàn)檫@樣可以比普通壓縮擴(kuò)展式或非壓縮擴(kuò)展式言語大大減少所需用的存儲(chǔ)器數(shù)。需要輸出講話時(shí),可以從存儲(chǔ)器中取出正文,把它傳送到正文/言語轉(zhuǎn)換器和言語合成器中。采用ASCII編碼正文存儲(chǔ)器時(shí),1字符需要1字節(jié),這就是說,用半兆字節(jié)的存儲(chǔ)量即可存儲(chǔ)10,000個(gè)詞組左右。因此能翻譯10,000個(gè)詞組左右的系統(tǒng)約需要1兆字節(jié)的存儲(chǔ)量,這些是不難存儲(chǔ)在硬磁盤上的。雙向通信有可能采用兩個(gè)結(jié)構(gòu)對(duì)稱的翻譯系統(tǒng)。這樣做的好處是,各系統(tǒng)只需要識(shí)別和合成以操作該單元的人員的語言表示的詞。用第二單元的通信要借助一個(gè)規(guī)定詞組和任何附屬詞組內(nèi)容的協(xié)議。該協(xié)議與語言無關(guān),因而可以無需識(shí)別目標(biāo)語言來傳輸信息。此外,這樣做還可采用多種不同語言同時(shí)接收從單個(gè)單元輸出的譯文。
實(shí)例操作一種接到電話網(wǎng)絡(luò)的示范系統(tǒng),用以示范查找短語集方法的可行性。該示范裝置采用一Votan言語識(shí)別器、一Infovox言語合成器和一IBM公司的XT型個(gè)人電子計(jì)算機(jī)。
Votan言語識(shí)別器能識(shí)別多達(dá)64個(gè)在電話網(wǎng)絡(luò)上連續(xù)說出的詞??紤]到象“yes”,“no”,“quit”和“enter”之類的系統(tǒng)控制詞,可選多達(dá)60個(gè)詞作為關(guān)鍵詞。輸入詞組中不容許有任何一個(gè)系統(tǒng)控制詞出現(xiàn),所以可能的話最好采用控制按鈕或控制鍵而不用口頭指令。
存儲(chǔ)的詞組包括400個(gè)英語詞組及其法語的等效詞組。
英語詞組約含1100個(gè)不同的詞。這些數(shù)目相當(dāng)于普通商業(yè)用語短語集一般所包含的詞組數(shù)目的范圍。
按上述原理操作關(guān)鍵詞抽出軟件之后,選用了60個(gè)關(guān)鍵詞,該60個(gè)關(guān)鍵詞成功地識(shí)別了所有詞組。在400個(gè)詞組中,只有32個(gè)詞組只用單個(gè)詞辨別(該32個(gè)詞組為16對(duì)詞組)。
示范系統(tǒng)一經(jīng)識(shí)別關(guān)鍵詞就訪問有關(guān)詞組,(口頭)向使用者確認(rèn),然后通過正文/言語合成器輸出等效的法語詞組。
應(yīng)該指出的是,正文/言語合成器并非本發(fā)明的主題。目標(biāo)語言可以從預(yù)錄制或編碼的詞和詞組合成,這樣做是完全行得通的,也是確實(shí)有益的。這樣做的好處是,這類言語可由使用者錄制,因而在話音方面會(huì)與任何記入的話音一致,而且可以無需將正文合成為言語語音。這種方法還可以在一些重要國家的語言中無需將正文合成為言語話音,在這些重要國家中這種技術(shù)是不可能在最近的將來制造出可使用的硬件的一例如印地語和阿拉伯語。
除將言語翻譯成另一種語言的言語外,本發(fā)明當(dāng)然也適用于將正文翻譯成另一種語言的、正文、將正文翻譯轉(zhuǎn)換成另一種語言的講活或?qū)⒅v話翻譯轉(zhuǎn)換成另一種語言的正文等的翻譯。特別有用的用途是在辦公室自動(dòng)化的領(lǐng)域中,在該領(lǐng)域中是不難實(shí)現(xiàn)將講話直接翻譯成外語正文的翻譯機(jī)的。實(shí)質(zhì)上,這種翻譯機(jī)可以采用言語識(shí)別器、上述軟件和控制系統(tǒng),但將第二種語言正文輸出到一打印機(jī)上或電傳機(jī)或其它電信線路上。當(dāng)然用幾種語言編制日用商業(yè)通信的普通詞組并不是什么難事。
權(quán)利要求
1.一種將詞組從第一種語言翻譯成第二種語言的系統(tǒng),其特征在于,該翻譯系統(tǒng)包括一存儲(chǔ)一批第二種語言詞組的存儲(chǔ)器、一接收第一種語言詞組的輸入裝置、一以第二種語言輸出包括所述一批詞組中一詞組的詞組的輸出裝置、一確定所述一批詞組中哪一個(gè)詞組對(duì)應(yīng)于所述輸入詞組的鑒定裝置和一響應(yīng)所述鑒定裝置來控制輸出裝置并確保從所述一批詞組中輸出對(duì)應(yīng)于所述輸入詞組的裝置。
2.如權(quán)利要求
1所述的系統(tǒng),其特征在于,該系統(tǒng)包括一通過一數(shù)據(jù)線路可操作連接的第一和第二終端,第一終端包括所述輸入裝置和所述鑒定裝置,第二終端包括所述存儲(chǔ)器和所述輸出裝置,其中所述第一終端還包括一產(chǎn)生信息并通過所述數(shù)據(jù)線路傳輸?shù)剿龅诙K端的信息發(fā)生裝置,該信息則指示所述一批詞組中哪一個(gè)詞組對(duì)應(yīng)于所述輸入詞組。
3.如權(quán)利要求
1或2所述的系統(tǒng),其特征在于,所述鑒定裝置根據(jù)輸入詞組中存在的一個(gè)或多個(gè)關(guān)鍵詞或關(guān)鍵詞部分確定各詞組的對(duì)應(yīng)關(guān)系,所述鑒定裝置應(yīng)用第一個(gè)詞匯表確定輸入詞組對(duì)應(yīng)于所述一批詞組中的哪一個(gè)詞組或詞組群(如有的話),當(dāng)發(fā)現(xiàn)輸入詞組對(duì)應(yīng)于未確定的其中一個(gè)詞組群時(shí),所述鑒定裝置就應(yīng)用第二個(gè)詞匯表來確定輸入詞組對(duì)應(yīng)于哪一個(gè)詞組群。
4.如以上任一權(quán)利要求
所述的系統(tǒng),其特征在于,所述鑒定裝置包括一言語識(shí)別器。
5.如以上任一權(quán)利要求
所述的系統(tǒng),其特征在于,所述輸入裝置能接收口頭講話輸入,且所述輸出裝置提供話音輸出。
6.如以上任一權(quán)利要求
所述的系統(tǒng),其特征在于,設(shè)置有一能將所述輸入詞組的某些部分不經(jīng)翻譯傳送到所述輸出裝置,作為第二種語言詞組的一部分輸出。
7.一種實(shí)現(xiàn)以上任一權(quán)利要求
所述的系統(tǒng)的設(shè)備。
8.如權(quán)利要求
7所述的設(shè)備,其特征在于,該設(shè)備還包括一將輸入信息提供給所述輸入裝置的鍵盤和一以第二種語言提供正文輸出的裝置。
9.如權(quán)利要求
7或8所述將第一種語言翻譯成多種第二種語言中的任一種語言的設(shè)備,其特征在于,在一存儲(chǔ)器中配備有所述多種第二種語言中每一種語言的另外一批詞組。
專利摘要
一種將詞組從第一種語言翻譯成第二種語言的翻譯系統(tǒng)包括一存儲(chǔ)一批第二種語言詞組的存儲(chǔ)器。以第一種語言輸入的詞組個(gè)個(gè)都根據(jù)一個(gè)或多個(gè)關(guān)鍵詞加以鑒定,然后以第二種語言輸出相應(yīng)的詞組。這種短語集法使翻譯能有效地快速而準(zhǔn)確地進(jìn)行,口譯也不例外。因第二種語言的詞組是事先編制好且存儲(chǔ)在存儲(chǔ)器中,故不會(huì)出現(xiàn)翻譯質(zhì)量差或不合語法結(jié)構(gòu)等問題。輸出可以是正文形式或采用言語合成以話音形式輸出。
文檔編號(hào)G06F3/16GK87106964SQ87106964
公開日1988年6月1日 申請(qǐng)日期1987年10月3日
發(fā)明者弗雷德里克·沃里克·邁克爾·斯坦蒂福德, 馬丁·喬治·斯蒂爾 申請(qǐng)人:英國電信公司導(dǎo)出引文BiBTeX, EndNote, RefMan