專利名稱:用于通過在語言之間執(zhí)行翻譯來支持交流的交流支持設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于通過在多種語言之間執(zhí)行翻譯來支持交流的交流支持設(shè)備、交流支持方法和計算機(jī)程序產(chǎn)品。
背景技術(shù):
近些年來,隨著自然語言處理技術(shù)的發(fā)展,用于將例如用日語書寫的文本翻譯為另一種語言(例如英語)的文本的機(jī)器翻譯系統(tǒng)已經(jīng)投入實(shí)用并廣泛流行。
隨著語音處理技術(shù)的發(fā)展,同樣已經(jīng)使用了語音聽寫系統(tǒng)以及語音合成系統(tǒng),在語音聽寫系統(tǒng)中,通過將用戶所說的句子轉(zhuǎn)換為文字從而使得能夠通過語音來輸入自然語言字符串,所述語音合成系統(tǒng)用于將作為電子數(shù)據(jù)獲取的句子和從系統(tǒng)輸出的自然語言字符串轉(zhuǎn)換為語音輸出。
隨著圖像處理技術(shù)的發(fā)展,已經(jīng)實(shí)現(xiàn)了字符識別系統(tǒng),在該系統(tǒng)中,通過分析用照相機(jī)等拍攝的字符圖像將圖像中的句子轉(zhuǎn)換為機(jī)器可讀的字符數(shù)據(jù)。此外,隨著手寫字符技術(shù)的發(fā)展,已經(jīng)實(shí)現(xiàn)了將用戶用筆式(pen-based)輸入設(shè)備手寫輸入的句子轉(zhuǎn)換為機(jī)器可讀字符數(shù)據(jù)的技術(shù)。
隨著文化和經(jīng)濟(jì)的全球化,以不同語言為母語的人之間的交流機(jī)會在增加。因此,對應(yīng)用于交流支持設(shè)備的技術(shù)的期望提高增長了,所述交流支持設(shè)備通過集成自然語言處理技術(shù)、語音處理技術(shù)、圖像處理技術(shù)、手寫字符識別技術(shù)來支持以不同語言為母語的人之間的交流。
作為這樣的設(shè)備,可以考慮如下的交流支持設(shè)備。首先,利用語音識別技術(shù)或者手寫字符識別技術(shù)將講日語的人所說的或者通過筆所輸入的日語句子轉(zhuǎn)換為機(jī)器可讀的日語字符數(shù)據(jù)。接著,使用機(jī)器翻譯技術(shù)將所述數(shù)據(jù)翻譯為語義等價的英語句子,并且將結(jié)果呈現(xiàn)為英語字符串?;蛘?,利用語音合成技術(shù)將結(jié)果以英語語音的形式呈現(xiàn)給講英語的人。另一方面,對講英語的人所說的或者通過筆輸入的英語句子進(jìn)行相反的處理,從而向講日語的人呈現(xiàn)翻譯完的日語句子。通過這種方法,試圖實(shí)現(xiàn)能夠使得在母語為不同語言的人之間進(jìn)行雙向交流的交流支持設(shè)備。
此外,作為另一個例子,可以考慮如下的交流支持設(shè)備。首先,用照相機(jī)拍攝用英語表達(dá)的本地標(biāo)記的字符串、警示陳述等。接著,利用圖像處理技術(shù)和字符識別技術(shù)將所拍攝的字符串轉(zhuǎn)換為機(jī)器可讀的英語字符串?dāng)?shù)據(jù)。進(jìn)一步使用機(jī)器翻譯技術(shù)將所述數(shù)據(jù)翻譯為語義等價的日語句子,并將日語字符串結(jié)果呈現(xiàn)給用戶?;蛘?,利用語音合成技術(shù)將結(jié)果以日語語音的形式呈現(xiàn)給用戶。通過這種方法,已經(jīng)嘗試了實(shí)現(xiàn)一種交流支持設(shè)備,通過使用該設(shè)備,在講英語的地區(qū)旅游的、不懂英語的講日語的旅游者可以理解英語表達(dá)的標(biāo)記和警示陳述。
在這種交流支持設(shè)備中,當(dāng)通過語音識別處理、手寫字符識別處理、或者圖像字符識別處理識別由用戶輸入的、將被轉(zhuǎn)換為機(jī)器可讀的字符數(shù)據(jù)的源語言的輸入句子時,難于獲取沒有錯誤的正確的候選,并且通常出現(xiàn)由獲取了多個候選解釋而導(dǎo)致的歧義。
在機(jī)器翻譯處理中,因?yàn)楫?dāng)將源語言句子轉(zhuǎn)換為語義等價的目標(biāo)語言句子時也會出現(xiàn)歧義,所以存在多個目標(biāo)語言句子的候選。因此,在很多情況下,不能唯一地選擇語義等價的目標(biāo)句子并且不能消除歧義。
可以考慮以下原因,例如一種情況是,其中,源語言句子自身是存在多個解釋的歧義表達(dá);一種情況是,因?yàn)樵凑Z言句子自身是高度依賴于上下文的表達(dá),所以會出現(xiàn)多個解釋;還有一種情況是,因?yàn)樵凑Z言和目標(biāo)語言的語言和文化背景、概念系統(tǒng)等不同,所以出現(xiàn)多個候選翻譯。
為了消除這些歧義,當(dāng)獲取多個候選時,提出了選擇所獲取的第一個候選的方法,以及將多個候選呈現(xiàn)給用戶以便用戶在他們之中作出選擇的方法。還提出了一種方法,其中,當(dāng)獲取了多個候選時,根據(jù)一些標(biāo)準(zhǔn)為各個候選打分以選擇具有最高分的候選。例如,在日本專利申請?zhí)亻_平(JP-A)No.H07-334506中,提出了一種技術(shù),其中,從多個由翻譯產(chǎn)生的譯出的單詞中選擇一個譯出的單詞,使得從該單詞能想起的概念的相似度最高,從而提高譯句的質(zhì)量。
但是,選擇所獲取的第一個候選的方法雖然能縮短處理時間,卻不能保證選擇最優(yōu)的候選,并且很可能輸出與源語言句子的內(nèi)涵不匹配的目標(biāo)語言句子。
用戶在多個候選中做出選擇的方法增加了用戶的負(fù)擔(dān),并且在獲取多個候選解釋時不能有效地呈現(xiàn)給用戶。此外,還存在一個問題,即,即使用戶可以正確地選擇源語言的候選解釋,也不能消除在進(jìn)行后續(xù)翻譯處理時引起的歧義,并且還有一個問題在于,即使為了消除這些歧義,指定由用戶選擇翻譯處理結(jié)果,但是因?yàn)橛脩敉ǔ2焕斫饽繕?biāo)語言,所以這也不是一個有效的方法。
在JP-A No.H07-334506的方法中,因?yàn)橛脩舨贿x擇所翻譯的候選句子,而是基于根據(jù)概念相似性的標(biāo)準(zhǔn)計算的值來選擇候選譯句,所以降低了用戶的負(fù)擔(dān)。但是,有一個問題,即,因?yàn)殡y以設(shè)置作為打分依據(jù)的標(biāo)準(zhǔn),所以不能保證選擇最優(yōu)的候選,并且可能會選擇與源語言句子的含義不匹配的目標(biāo)語言句子。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個方面,一種交流支持設(shè)備包括分析單元,用于分析將被翻譯為目標(biāo)語言的源語言句子,并輸出至少一個作為源語言句子的解釋的候選的候選源語言解釋;檢測單元,用于當(dāng)存在多個候選源語言解釋時,檢測歧義部分,該歧義部分是多個候選源語言解釋中的各個候選之間的不同部分;翻譯單元,用于將除歧義部分之外的候選源語言解釋翻譯為目標(biāo)語言。
根據(jù)本發(fā)明的另一個方面,一種交流支持設(shè)備包括分析單元,用于分析將被翻譯為目標(biāo)語言的源語言句子,并輸出至少一個作為源語言句子的解釋的候選的候選源語言解釋;翻譯單元,用于將候選源語言解釋翻譯為目標(biāo)語言,并輸出至少一個作為以目標(biāo)語言描述的解釋的候選的候選目標(biāo)語言解釋;檢測單元,用于當(dāng)存在多個候選目標(biāo)語言解釋時,檢測歧義部分,該歧義部分是多個候選目標(biāo)語言解釋中的各個候選之間的不同部分;以及生成單元,用于基于除歧義部分之外的候選目標(biāo)語言解釋生成作為用目標(biāo)語言描述的句子的目標(biāo)語言句子,并輸出至少一個作為目標(biāo)語言句子的候選的候選目標(biāo)語言句子。
根據(jù)本發(fā)明的另一個方面,一種交流支持設(shè)備包括分析單元,用于分析將被翻譯為目標(biāo)語言的源語言句子,并輸出至少一個作為源語言句子的解釋的候選的候選源語言解釋;翻譯單元,用于將候選源語言解釋翻譯為目標(biāo)語言,并輸出至少一個作為以目標(biāo)語言描述的解釋的候選的候選目標(biāo)語言解釋;生成單元,用于基于候選目標(biāo)語言解釋生成作為用目標(biāo)語言描述的句子的目標(biāo)語言句子,并輸出至少一個作為目標(biāo)語言句子的候選的候選目標(biāo)語言句子;檢測單元,用于當(dāng)存在多個候選目標(biāo)語言句子時,檢測歧義部分,該歧義部分是多個候選目標(biāo)語言句子中的各個候選之間的不同部分;以及刪除單元,用于刪除歧義部分。
根據(jù)本發(fā)明的另一個方面,一種交流支持設(shè)備包括分析單元,用于分析將被翻譯為目標(biāo)語言的源語言句子,并輸出至少一個作為源語言句子的解釋的候選的候選源語言解釋;檢測單元,用于當(dāng)存在多個候選源語言解釋時,檢測歧義部分,該歧義部分是多個候選源語言解釋中的各個候選之間的不同部分;平行翻譯對存儲單元,用于存儲由語義上相互等價的候選源語言解釋和候選目標(biāo)語言句子組成的平行翻譯對;以及選擇單元,用于根據(jù)除歧義部分之外的候選源語言解釋和存儲在平行翻譯對存儲單元中的平行翻譯對來選擇候選目標(biāo)語言句子。
根據(jù)本發(fā)明的另一個方面,一種交流支持方法包括分析將被翻譯為目標(biāo)語言的源語言句子;輸出至少一個作為源語言句子的解釋的候選的候選源語言解釋;當(dāng)存在多個候選源語言解釋時,檢測歧義部分,該歧義部分是多個候選源語言解釋中的各個候選之間的不同部分;將除歧義部分之外的候選源語言解釋翻譯為目標(biāo)語言。
根據(jù)本發(fā)明的另一個方面,一種交流支持方法包括分析將被翻譯為目標(biāo)語言的源語言句子;輸出至少一個作為源語言句子的解釋的候選的候選源語言解釋;將候選源語言解釋翻譯為目標(biāo)語言;輸出至少一個作為以目標(biāo)語言描述的解釋的候選的候選目標(biāo)語言解釋;當(dāng)存在多個候選目標(biāo)語言解釋時,檢測歧義部分,該歧義部分是多個候選目標(biāo)語言解釋中的各個候選之間的不同部分;基于除歧義部分以外的候選目標(biāo)語言解釋,生成作為用目標(biāo)語言描述的句子的目標(biāo)語言句子;輸出至少一個作為目標(biāo)語言句子的候選的候選目標(biāo)語言句子。
根據(jù)本發(fā)明的另一個方面,一種交流支持方法包括分析將被翻譯為目標(biāo)語言的源語言句子;輸出至少一個作為源語言句子的解釋的候選的候選源語言解釋;將候選源語言解釋翻譯為目標(biāo)語言;輸出至少一個作為以目標(biāo)語言描述的解釋的候選的候選目標(biāo)語言解釋;基于候選目標(biāo)語言解釋生成作為用目標(biāo)語言描述的句子的目標(biāo)語言句子;輸出至少一個作為目標(biāo)語言句子的候選的候選目標(biāo)語言句子;當(dāng)存在多個候選目標(biāo)語言句子時,檢測歧義部分,該歧義部分是多個候選目標(biāo)語言句子中的各個候選之間的不同部分;以及刪除歧義部分。
圖1是顯示根據(jù)第一實(shí)施例的交流支持設(shè)備的配置的框圖;圖2是顯示第一實(shí)施例中的交流支持處理的總體過程的流程圖;圖3是顯示歧義部分排除處理的總體過程的流程圖;圖4顯示了在根據(jù)第一實(shí)施例的交流支持設(shè)備中處理的數(shù)據(jù)的實(shí)例;圖5顯示了由源語言語音識別單元輸出的源語言句子的實(shí)例;圖6A到6F顯示了由源語言分析單元輸出的候選源語言解釋的實(shí)例;圖7A到7F顯示了由翻譯單元輸出的候選目標(biāo)語言解釋的實(shí)例;圖8顯示了由目標(biāo)語言生成單元輸出的候選目標(biāo)語言句子的實(shí)例;
圖9A到9C顯示了由歧義部分檢測單元檢測的歧義部分的實(shí)例;圖10A到10C顯示了通過在歧義部分檢測單元中刪除歧義部分所得到的結(jié)果的實(shí)例;圖11顯示了由第一實(shí)施例中的交流支持處理所處理的數(shù)據(jù)的流程的實(shí)例;圖12是顯示由譯出部分呈現(xiàn)單元顯示的譯出部分顯示屏幕的實(shí)例的說明視圖;圖13是顯示根據(jù)第二實(shí)施例的交流支持設(shè)備的配置的框圖;圖14是顯示概念層次存儲單元的數(shù)據(jù)結(jié)構(gòu)的實(shí)例的說明視圖;圖15是顯示根據(jù)第二實(shí)施例的歧義部分排除處理的總體過程的流程圖;圖16是顯示由源語言語音識別單元所輸出的源語言句子的實(shí)例的說明視圖;圖17是顯示由源語言分析單元輸出的候選源語言解釋的實(shí)例的說明視圖;圖18A到18B顯示了由翻譯單元輸出的候選目標(biāo)語言解釋的實(shí)例;圖19顯示了由目標(biāo)語言生成單元輸出的候選目標(biāo)語言句子的實(shí)例;圖20顯示了由歧義部分檢測單元檢測到的歧義部分的實(shí)例;圖21顯示了在概念替換單元中通過將歧義部分替換為上位概念所得到的結(jié)果的實(shí)例;圖22顯示了第二實(shí)施例中的交流支持處理所處理的數(shù)據(jù)的流程的實(shí)例;以及圖23是顯示由譯出部分呈現(xiàn)單元顯示的譯出部分顯示屏幕的實(shí)例的說明視圖。
具體實(shí)施例方式
下面參照附圖詳細(xì)描述根據(jù)本發(fā)明的交流支持設(shè)備、交流支持方法、以及計算機(jī)程序產(chǎn)品的典型實(shí)施例。
根據(jù)第一實(shí)施例的交流支持設(shè)備解釋從語音中識別出的源語言句子的語義內(nèi)容,將所解釋的以源語言描述的語義內(nèi)容翻譯為以目標(biāo)語言描述的語義內(nèi)容,根據(jù)翻譯出的以目標(biāo)語言表示的語義內(nèi)容生成目標(biāo)語言句子,以及根據(jù)生成的目標(biāo)語言句子合成并輸出目標(biāo)語言語音。這時,如果在語音識別處理、源語言分析處理、翻譯處理、以及目標(biāo)語言生成處理的處理結(jié)果中得到了多個候選,則檢測各個候選之間的差別并作為歧義部分刪除,從而消除最終輸出的目標(biāo)語言句子的歧義。
這里,源語言句子是指用源語言(待翻譯的源語言)表達(dá)的字符串,目標(biāo)語言句子是指用目標(biāo)語言(將被翻譯成的語言)表達(dá)的字符串。源語言句子和目標(biāo)語言句子都不局限于帶有句號的句子,可以是句子、段落、短語、單詞等。
此外,雖然在第一實(shí)施例中,說明了將通過用戶的語音輸入的日語翻譯為英語并輸出為語音的交流支持設(shè)備作為實(shí)例,但是源語言和目標(biāo)語言的組合不局限于此,本發(fā)明可以應(yīng)用于任意組合,只要是將源語言翻譯成一個不同的語言。
圖1是顯示根據(jù)第一實(shí)施例的交流支持設(shè)備100的配置的框圖。如圖1所示,交流支持設(shè)備100包括源語言語音識別單元101、源語言分析單元102、翻譯單元103、目標(biāo)語言生成單元104、目標(biāo)語言語音合成單元105、歧義部分檢測單元106、歧義部分刪除單元107、譯出部分呈現(xiàn)單元108、以及對應(yīng)信息存儲單元110。
源語言語音識別單元101接收用戶發(fā)出的源語言語音,并執(zhí)行語音識別處理從而輸出轉(zhuǎn)錄了語音內(nèi)容的候選源語言句子。任何常用的使用線性預(yù)測系數(shù)(Linear Predictive Coefficient)分析、隱馬爾可夫模型(Hidden Markov Model,HMM)、動態(tài)規(guī)劃(dynamicprogramming)、神經(jīng)網(wǎng)絡(luò)(neural network)、N-元語法語言模型(N-Gram language model)等的語音識別方法都可以應(yīng)用于由源語言語音識別單元101執(zhí)行的語音識別處理。
源語言分析單元102接收由源語言語音識別單元101識別出的源語言句子,并參考源語言的詞匯信息和語法規(guī)則來執(zhí)行自然語言分析處理,例如形態(tài)分析、句法分析、依賴分析、語義分析、上下文分析,從而輸出作為源語言句子所表示的語義內(nèi)容的解釋的候選的候選源語言解釋。此外,源語言分析單元102輸出源語言句子和候選源語言解釋之間的對應(yīng)關(guān)系作為解釋對應(yīng)信息。
通過自然語言分析處理所獲取的單個候選源語言解釋是一種表示源語言句子的語法結(jié)構(gòu)和概念之間的依賴關(guān)系的樹結(jié)構(gòu)圖,其中,使對應(yīng)于源語言詞匯的概念表示為節(jié)點(diǎn)。因此,解釋對應(yīng)信息存儲如下信息,其中,源語言句子中包含的部分字符串與標(biāo)識樹結(jié)構(gòu)圖中的每個節(jié)點(diǎn)的數(shù)字(節(jié)點(diǎn)標(biāo)識號)相關(guān)聯(lián)。
任何常用的方法都可以應(yīng)用于源語言分析單元102所執(zhí)行的自然語言分析處理,例如使用CYK算法的形態(tài)分析和使用Earley算法、Chart算法、或廣義LR(generalized left to right)分析的句法分析。此外,將包含了形態(tài)信息、語法信息、語義信息等信息的用于自然語言處理的詞典存儲在常用的存儲器中,例如硬盤驅(qū)動器(HDD)、光盤、存儲卡等等,并且在自然語言分析處理中參考。
翻譯單元103接收源語言分析單元102輸出的候選源語言解釋,并根據(jù)源語言和目標(biāo)語言的詞匯信息、用于消減兩種語言之間結(jié)構(gòu)差別的結(jié)構(gòu)轉(zhuǎn)換規(guī)則以及表示兩種語言的詞匯之間的對應(yīng)關(guān)系的平行翻譯詞典,輸出候選目標(biāo)語言解釋。此外,翻譯單元103輸出候選源語言解釋和候選目標(biāo)語言解釋之間的對應(yīng)關(guān)系作為翻譯對應(yīng)信息。
通過翻譯處理所獲取的候選目標(biāo)語言解釋是用英語(目標(biāo)語言)表示的內(nèi)在表達(dá)的候選。與候選源語言解釋相似,候選目標(biāo)語言解釋是一種表示將要翻譯成的目標(biāo)語言句子的句法結(jié)構(gòu)和概念之間的依賴關(guān)系的樹結(jié)構(gòu)圖,其中,使對應(yīng)于源語言詞匯的概念表示為節(jié)點(diǎn)。因此,翻譯對應(yīng)信息存儲如下信息,其中,代表候選源語言解釋的樹結(jié)構(gòu)圖的節(jié)點(diǎn)標(biāo)識號與代表候選目標(biāo)語言解釋的樹結(jié)構(gòu)圖中的節(jié)點(diǎn)標(biāo)識號一一對應(yīng)。任何常規(guī)的轉(zhuǎn)換方法中利用的方法都可以應(yīng)用于翻譯單元103所執(zhí)行的翻譯處理。
目標(biāo)語言生成單元104接收由翻譯單元103輸出的候選目標(biāo)語言解釋,并根據(jù)詞匯信息和定義目標(biāo)語言英語的語法結(jié)構(gòu)的語法規(guī)則等輸出候選目標(biāo)語言句子。此外,目標(biāo)語言生成單元104輸出候選目標(biāo)語言解釋和候選目標(biāo)語言句子之間的對應(yīng)關(guān)系作為生成對應(yīng)信息。生成對應(yīng)信息存儲如下信息,其中,代表候選目標(biāo)語言解釋的樹結(jié)構(gòu)圖的節(jié)點(diǎn)標(biāo)識號與候選目標(biāo)語言句子中包含的部分字符串一一對應(yīng)。任何常用的語言生成方法都可以應(yīng)用于這里執(zhí)行的目標(biāo)語言生成處理。
目標(biāo)語言語音合成單元105接收由目標(biāo)語言生成單元104輸出的目標(biāo)語言句子,并輸出作為目標(biāo)語言英語的合成語音的內(nèi)容。任何常用的方法都可以應(yīng)用于這里執(zhí)行的語音合成處理,例如使用語音片編輯和語音合成、共振峰語音合成等的文本到語音的系統(tǒng)。
如果存在多個由源語言語音識別單元101輸出的候選源語言句子、多個由源語言分析單元102輸出的候選源語言解釋、多個由翻譯單元103輸出的候選目標(biāo)語言解釋、或者多個由目標(biāo)語言生成單元104輸出的候選目標(biāo)語言句子,則歧義部分檢測單元106檢測并輸出多個候選之間的差異部分作為歧義部分。
歧義部分刪除單元107從候選源語言句子、或候選源語言解釋、或候選目標(biāo)語言解釋、或候選目標(biāo)語言句子中刪除由歧義部分檢測單元106輸出的歧義部分。從而多個候選可以被合成為一個不包含歧義部分的候選。
譯出部分呈現(xiàn)單元108通過順序地參考由源語言分析單元102輸出的解釋對應(yīng)信息、由翻譯單元103輸出的翻譯對應(yīng)信息以及由目標(biāo)語言生成單元104輸出的生成對應(yīng)信息,來識別源語言句子中對應(yīng)于最終譯出的目標(biāo)語言句子的部分的字符串(以下稱為譯出部分),并且執(zhí)行屏幕顯示等從而反饋給用戶。
對應(yīng)信息存儲單元110是存儲解釋對應(yīng)信息、翻譯對應(yīng)信息以及生成對應(yīng)信息的存儲器,可以由任何常用的存儲器組成,例如HDD、光盤和存儲卡。當(dāng)譯出部分呈現(xiàn)單元108識別譯出部分時參考存儲在對應(yīng)信息存儲單元110中的解釋對應(yīng)信息、翻譯對應(yīng)信息以及生成對應(yīng)信息。
接下來,說明根據(jù)如上配置的第一實(shí)施例的交流支持設(shè)備100所執(zhí)行的交流支持處理。圖2是顯示第一實(shí)施例中的交流支持處理的總體過程的流程圖。
源語言語音識別單元101首先接收用戶發(fā)出的源語言語音的輸入(步驟S201),對所接收的源語言語音執(zhí)行語音識別處理,并輸出源語言句子(步驟S202)。
接著,源語言分析單元102分析由源語言語音識別單元101輸出的源語言句子,并輸出候選源語言解釋,同時,將解釋對應(yīng)信息輸出到對應(yīng)信息存儲單元110(步驟S203)。更具體地,執(zhí)行一般的自然語言分析處理,例如形態(tài)分析、句法分析、語義分析以及上下文分析等,并輸出帶有由樹結(jié)構(gòu)圖表示的各個語素之間的關(guān)系的候選源語言解釋。
例如,假設(shè)識別出發(fā)音為“ASUKURUMADEMATSU”的日語語,并且當(dāng)其被翻譯為英語時,可以解釋為“I will wait until you comtomorrow”和“I will wait in the car tomorrow”,因此,輸入了圖4所示的日語句子401作為源語言句子。在這種情況下,輸出兩個候選源語言解釋一個是具有三個作為樹結(jié)構(gòu)圖的節(jié)點(diǎn)的節(jié)點(diǎn)402、403和404的候選,另一個是具有三個作為樹結(jié)構(gòu)圖的節(jié)點(diǎn)的節(jié)點(diǎn)405、406和407的候選。也就是說,在這種情況下,顯示了一個例子,其中,通過形態(tài)分析,由于為句子加的逗號的位置的差別,作為源語言句子的一部分的日語408被以兩種方式解釋為日語409和日語410,并且因此輸出了兩個候選源語言解釋。
這里,每個節(jié)點(diǎn)以“<概念標(biāo)簽>@<節(jié)點(diǎn)標(biāo)識號>”的格式來表示。概念標(biāo)簽包括指示主要對應(yīng)于名詞的“對象”或“事件”(例如“明天”或“車”)的標(biāo)簽、指示主要對應(yīng)于動詞的“動作”或“現(xiàn)象”(例如“等待”和“購買”)的標(biāo)簽、以及指示主要對應(yīng)于輔助動詞的“意圖”或“狀態(tài)”(例如“問”、“希望”和“不可行”)的標(biāo)簽。此外,節(jié)點(diǎn)標(biāo)識號是唯一標(biāo)識每個節(jié)點(diǎn)的號碼。
在步驟S203輸出候選源語言解釋之后,執(zhí)行歧義部分排除處理,其該處理中,從多個候選源語言解釋中刪除歧義部分,以輸出一個候選源語言解釋(步驟S204)。下文中描述歧義部分排除處理的細(xì)節(jié)。
圖3是顯示歧義部分排除處理的總體過程的流程圖。在歧義部分排除處理中,歧義部分檢測單元106首先確定是否有多個候選輸出(步驟S301)。如果不存在多個候選(步驟S301否),則不存在歧義部分,所以結(jié)束歧義部分排除處理。
如果存在多個候選(步驟S301是),則歧義部分檢測單元106檢測多個候選之間的差別作為歧義部分(步驟S302)。例如,在所述例子中(日語句子401),日語408被檢測為歧義部分。
接著,歧義部分刪除單元107刪除由歧義部分檢測單元106檢測到的歧義部分,從而將多個候選集成為一個候選并輸出(步驟S303),從而結(jié)束歧義部分排除處理。例如,在所述例子中(日語句子401),輸出具有作為樹結(jié)構(gòu)圖的兩個節(jié)點(diǎn)的日語411和日語412的候選,作為候選源語言解釋,其中刪除了日語408。
在步驟204的關(guān)于候選源語言解釋的歧義部分排除處理結(jié)束之后,翻譯單元103翻譯排除了歧義部分的候選源語言解釋,并輸出候選目標(biāo)語言解釋,與此同時,輸出翻譯對應(yīng)信息到對應(yīng)信息存儲單元110(步驟S205)。例如,對于具有日語411和日語412作為樹結(jié)構(gòu)圖的兩個節(jié)點(diǎn)的候選源語言解釋,輸出具有“TOMORROW”和“WAIT”作為樹結(jié)構(gòu)圖的兩個節(jié)點(diǎn)的候選目標(biāo)語言解釋。
接著,執(zhí)行關(guān)于候選目標(biāo)語言解釋的歧義部分排除處理(步驟S206)。這里,因?yàn)樘幚磉^程中的不同點(diǎn)僅僅是對候選目標(biāo)語言解釋執(zhí)行歧義部分排除處理,而不是對候選源語言解釋執(zhí)行,并且處理內(nèi)容相同,因此不再重復(fù)其描述。在所述例子中,在候選目標(biāo)語言解釋中不存在歧義,所以不執(zhí)行歧義部分的刪除處理并且結(jié)束歧義部分排除處理結(jié)束(步驟S301否)。
在對候選目標(biāo)語言解釋執(zhí)行歧義部分排除處理之后(步驟S206),目標(biāo)語言生成單元104根據(jù)候選目標(biāo)語言解釋生成目標(biāo)語言句子,與此同時,將生成對應(yīng)信息輸出到對應(yīng)信息存儲單元110(步驟S207)。例如,根據(jù)具有“TOMORROW”和“WAIT”作為樹結(jié)構(gòu)圖的兩個節(jié)點(diǎn)的候選目標(biāo)語言解釋生成目標(biāo)語言句子“I will wait,tomorrow”。
在這種方式下,根據(jù)目標(biāo)語言英語的語法和詞匯知識,目標(biāo)語言生成單元104按照英語安排格式,并根據(jù)需要補(bǔ)充在原始的作為源語言的日語文本中省略的主語等,從而輸出呈現(xiàn)了候選目標(biāo)語言解釋的內(nèi)容的英語表層文本(surface text)作為目標(biāo)語言句子。
接著,譯出部分呈現(xiàn)單元108通過順序地參考存儲在對應(yīng)信息存儲單元110中的解釋對應(yīng)信息、翻譯對應(yīng)信息以及生成對應(yīng)信息,獲取對應(yīng)于由目標(biāo)語言生成單元104生成的目標(biāo)語言句子的譯出部分,并通過屏幕顯示呈現(xiàn)給用戶(步驟S208)。這是為了使用戶容易地知道哪部分包含在源語言句子中的部分字符串已被翻譯并作為目標(biāo)語言句子輸出。這種方式的配置使用戶能知道通過翻譯刪除了哪部分,并在之后的對話中對其進(jìn)行補(bǔ)充等等,因此能夠有效地執(zhí)行對交流的支持。稍后描述用于呈現(xiàn)譯出部分的屏幕顯示(譯出部分顯示屏幕)的例子。
接著,目標(biāo)語言語音合成單元105根據(jù)目標(biāo)語言句子合成目標(biāo)語言的語音以輸出(步驟S209),并且結(jié)束交流支持處理。由于有屏幕顯示,所以如果用戶決定不執(zhí)行語音輸出,則可以不由目標(biāo)語言語音合成單元105執(zhí)行語音合成處理,但處理可以返回到語音識別處理以便再次輸入。
此外,雖然只對候選源語言解釋和候選目標(biāo)語言解釋執(zhí)行了歧義部分排除處理,但是當(dāng)存在多個由源語言語音識別單元101輸出的源語言句子時,或者當(dāng)存在多個由目標(biāo)語言生成單元104輸出的候選目標(biāo)語言句子時,可以使用一種配置,其中,以與前述方式相似的方式來執(zhí)行歧義部分排除處理。在這種情況下,可以利用一種配置,其中,利用以格子(lattice)等表達(dá)的源語言語音識別單元101的輸出結(jié)果來執(zhí)行歧義部分排除處理。也就是說,歧義部分排除處理可以應(yīng)用于任何處理,只要在處理過程中輸出了多個處理結(jié)果并且它們之間的差別部分可以被檢測為歧義部分。
接下來,描述根據(jù)第一實(shí)施例的交流支持設(shè)備100中的交流支持處理的具體例子。
圖5顯示了由源語言語音識別單元101輸出的源語言句子的例子。如圖5所示,考慮三個例子,其中,源語言句子S1、源語言句子S2以及源語言句子S3分別作為源語言句子被輸入。
圖6A到6F顯示了由源語言分析單元102輸出的候選源語言解釋的例子。如圖6A到6F所示,源語言分析單元102輸出候選源語言解釋T1a和T1b、T2a和T2b、T3a和T3b,分別對應(yīng)于源語言句子S1、S2和S3。
候選源語言解釋由如上所述的樹結(jié)構(gòu)圖表示,樹結(jié)構(gòu)圖的每個節(jié)點(diǎn)以<概念標(biāo)簽>@<標(biāo)識號>的格式來表示。此外,連接候選解釋的樹結(jié)構(gòu)圖的各個節(jié)點(diǎn)的弧指示了各個節(jié)點(diǎn)之間的語義關(guān)系,以“$<關(guān)系標(biāo)簽>$”的格式來表示弧。關(guān)系標(biāo)簽包括的語義關(guān)系例如$TIME$(時間)、$LOCATION$(地點(diǎn))、$UNTIL$(時間的前后關(guān)系)、$BACKGROUND$(背景)、$OBJECT$(對象)、$ACTION$(行為)、$REASON$(原因)、$TYPE$(種類)等。關(guān)系標(biāo)簽不局限于此,可以包括任何指示節(jié)點(diǎn)之間的語義關(guān)系的關(guān)系。
在圖6A到6F中,顯示了多個例子,在每個例子中,由源語言分析單元102輸出兩個候選源語言。在形態(tài)分析中,以兩種方式解釋T1a和T1b的例子。
T2a和T2b的例子是在語義分析或上下文分析中產(chǎn)生的多個解釋的例子,語義分析或上下文分析用于分析節(jié)點(diǎn)之間的語義關(guān)系和語音意圖。
T3a和T3b的例子是在語義分析中產(chǎn)生多個解釋的例子。
圖7A到7F顯示由翻譯單元103輸出的候選目標(biāo)語言解釋的例子。如圖7A到7F所示,翻譯單元103輸出候選目標(biāo)語言解釋U1a和U1b、U2a和U2b、U3a和U3b,分別對應(yīng)于候選源語言解釋T1a和T1b、T2a和T2b、T3a和T3b。
每個候選目標(biāo)語言解釋都是一個與候選源語言解釋類似的樹結(jié)構(gòu)圖,每個節(jié)點(diǎn)指示一個目標(biāo)語言的概念,以“<概念標(biāo)簽>@<節(jié)點(diǎn)標(biāo)識號>”的格式來表示。候選目標(biāo)語言解釋的每個弧的標(biāo)記和含義與候選源語言解釋的每個弧的標(biāo)記和含義類似。
例如,在圖7A到7F所示的例子中,U1a表示在時間“TOMORROW”($TIME$)、地點(diǎn)“CAR”($LOCATION$)執(zhí)行動作“WAIT”。另一方面,U1b表示在時間“TOMORROW”($TIME$)執(zhí)行動作“WAIT”,直到現(xiàn)象“COME”($UNTIL$)出現(xiàn)。
此外,U2a表示關(guān)于對于對象“COFFEE”($OBJECT$)的動作“BUY”($ACTION$)存在背景“WANT”($BACKGROUND$),并且動作“EXCHANGE”($ACTION$)是在不可行的狀態(tài)(CANNOT)。另一方面,U2b表示由于對于對象“COFFEE”($OBJECT$)的動作“BUY”($ACTION$)的“WANT”的原因($REASON$),對動作“EXCHANGE”($ACTION$)有“REQUEST”的意圖。
此外,U3a表示對作為目標(biāo)的對象“ROOM”具有“REQUEST”的意圖,其價格是“EXPENSIVE”($PRICE$),并且其種類為“OCEANVIEW”($TYPE$)。另一方面,U3b表示對作為目標(biāo)的對象“ROOM”具有“REQUEST”的意圖,其位置為“UPPERFLOOR”($LOCATION$),并且其類型為“OCEANVIEW”($TYPE$)。
每個候選目標(biāo)語言解釋的各個節(jié)點(diǎn)是對相應(yīng)的候選源語言解釋的相關(guān)節(jié)點(diǎn)的源語言概念到目標(biāo)語言概念的翻譯。在圖7A到7F所示的例子中,候選源語言解釋的樹結(jié)構(gòu)圖的結(jié)構(gòu)保持不變。然而通常,作為節(jié)點(diǎn)之間的連接關(guān)系的弧標(biāo)簽或圖的結(jié)構(gòu)可以通過翻譯處理等被改變,本發(fā)明可以應(yīng)用于這種情況。
圖8顯示了由目標(biāo)語言生成單元104輸出的候選目標(biāo)語言的例子。如圖8所示,目標(biāo)語言生成單元104輸出候選目標(biāo)語言句子V1a和V1b、V2a和V2b、V3a和V3b,分別對應(yīng)于候選目標(biāo)語言解釋U1a和U1b、U2a和U2b、U3a和U3b。此外,最終輸出的排除了歧義部分的目標(biāo)語言句子如Z1、Z2和Z3所示。
圖9A到9C顯示由歧義部分檢測單元106檢測到的歧義部分的例子。在圖9A到9C所示的例子中,顯示了通過在歧義部分檢測單元106中檢測兩個相應(yīng)候選之間的差別部分作為歧義部分所獲得的結(jié)果W1、W2和W3,分別對應(yīng)于圖6A到6F中的候選源語言解釋T1a和T1b、T2a和T2b、T3a和T3b。圖中,歧義部分由粗線和黑體表示,兩個候選之間的歧義部分的對應(yīng)關(guān)系由箭頭表示。
圖10A到10C顯示了通過在歧義部分刪除單元107中刪除歧義部分所獲得的結(jié)果的例子。在圖10A到10C所示的例子中,顯示了通過在歧義部分刪除單元107中刪除相應(yīng)的歧義部分所獲得的結(jié)果X1、X2和X3,分別對應(yīng)于圖9A到9C的歧義部分檢測結(jié)果W1、W2和W3。被刪除的歧義部分由虛線表示。
圖11顯示了第一實(shí)施例中的由交流支持處理所處理的數(shù)據(jù)的流程的例子。在圖11中,顯示了交流支持處理中的每個源語言句子輸入如何獲得候選源語言解釋和候選目標(biāo)語言解釋,以及最終被輸出為目標(biāo)語言句子。此外,各條數(shù)據(jù)之間的對應(yīng)關(guān)系由箭頭顯示。
例如,當(dāng)輸入源語言句子S1時,由源語言分析單元102輸出候選源語言解釋T1a和T1b,并通過歧義部分檢測單元106檢測到歧義部分并由歧義部分刪除單元107刪除歧義部分,從而輸出排除了歧義部分的候選源語言解釋X1。
此外,翻譯單元103對排除了歧義部分的候選源語言解釋X1執(zhí)行翻譯處理,并輸出排除了歧義部分的候選目標(biāo)語言解釋U1。最后,目標(biāo)語言生成單元104對排除了歧義部分的候選目標(biāo)語言解釋U1執(zhí)行目標(biāo)語言生成處理,輸出排除了歧義部分的目標(biāo)語言句子Z1。
因?yàn)閷?yīng)信息存儲單元110存儲如圖11中箭頭所示的各條數(shù)據(jù)之間的對應(yīng)信息,所以通過沿著對應(yīng)關(guān)系從最終輸出的排除了歧義部分的目標(biāo)語言句子Z1向源語言句子側(cè)追溯,譯出部分呈現(xiàn)單元108可以獲得對應(yīng)于最終譯出的目標(biāo)語言句子Z1的譯出部分以在屏幕上顯示。
圖12A到12C顯示了由譯出部分呈現(xiàn)單元108顯示的譯出部分顯示屏幕的例子。如圖12A到12C所示,譯出部分顯示屏幕顯示了相互關(guān)聯(lián)的作為語音識別的結(jié)果的源語言句子、譯出部分以及作為翻譯結(jié)果的目標(biāo)語言句子。圖12A到12C所示的屏幕例子是分別處理圖5中的源語言句子的例子S1到S3時的屏幕例子。
例如,圖12A中的屏幕例子顯示輸出日語句子1101作為語音識別的結(jié)果,并且執(zhí)行了歧義排除處理和翻譯處理,從而輸出了目標(biāo)語言句子“I will wait,tomorrow”。在這個例子中,在日語句子1101中,因?yàn)閳D4的日語408被作為歧義部分刪除,所以僅僅在屏幕上顯示日語句子1102作為譯出部分。
類似地,在圖12B的屏幕例子中,僅僅在屏幕上顯示日語句子1112作為譯出部分。此外,在圖12C的屏幕例子中,僅僅在屏幕上顯示日語句子1122作為譯出部分。
在這種方式中,譯出部分呈現(xiàn)單元108在屏幕上顯示譯出部分,其使得用戶能夠以源語言日語確認(rèn)什么翻譯結(jié)果被最終傳達(dá)給對話的另一方。
例如,在有關(guān)技術(shù)中,如圖12C的屏幕例子所示,當(dāng)不確定是價格高還是樓層高時,任意選擇一個,因此有可能錯誤地傳達(dá)了希望高價格房間的翻譯結(jié)果,而事實(shí)是希望低價格的房間。但是,根據(jù)本發(fā)明,通過刪除歧義部分并且只保留不包含歧義部分的部分,從而消除了錯誤地選擇與用戶意圖不匹配的候選的可能性,并且能夠向交流的另一方至少傳達(dá)一個與用戶意圖匹配的不包含錯誤的翻譯結(jié)果。
盡管在第一實(shí)施例中,普通的包含三個過程(源語言句子的分析、轉(zhuǎn)換(翻譯)為目標(biāo)語言、以及目標(biāo)語言句子的生成)的轉(zhuǎn)換方法被描述為用于機(jī)器翻譯的方法,但是本發(fā)明可以應(yīng)用于任何機(jī)器翻譯方法,例如基于例子的機(jī)器翻譯、基于統(tǒng)計的機(jī)器翻譯、以及中間語言系統(tǒng)機(jī)器翻譯,只要在相應(yīng)處理過程的輸出結(jié)果中產(chǎn)生了歧義。
此外,在第一實(shí)施例中,盡管顯示了一個例子,其中,執(zhí)行通過語音識別的源語言句子的輸入以及通過語音合成處理的目標(biāo)語言的輸出,但是也可以使用一種配置,其中,通過筆式輸入來輸入源語言句子并通過屏幕顯示來輸出目標(biāo)語言。源語言句子的輸入和目標(biāo)語言的輸出不局限于此,可以應(yīng)用任何普通的方法。
如上所述,在根據(jù)第一實(shí)施例的交流支持設(shè)備中,當(dāng)在語音識別處理、源語言分析處理、翻譯處理、或者目標(biāo)語言生成處理中獲得多個候選處理結(jié)果時,通過檢測并刪除作為歧義部分的各個候選之間的差別部分,能夠在沒有用戶的專門操作的情況下而消除最終輸出的目標(biāo)語言句子的歧義,從而可以獲得不包含錯誤的正確的目標(biāo)語言句子。
在根據(jù)第二實(shí)施例的交流支持設(shè)備中,當(dāng)在語音識別處理、源語言分析處理、翻譯處理、或者目標(biāo)語言生成處理中獲得多個候選處理結(jié)果時,將各個候選之間的差別部分檢測為歧義部分,并且當(dāng)存在所述歧義部分的語義內(nèi)容的上位概念時,將所述歧義部分替換為所述上位概念從而排除了最終輸出的目標(biāo)語言句子的歧義。
圖13是顯示根據(jù)第二實(shí)施例的交流支持設(shè)備1200的配置的框圖。如圖13所示,交流支持設(shè)備1200包括源語言語音識別單元101、源語言分析單元102、翻譯單元103、目標(biāo)語言生成單元104、目標(biāo)語言語音分析單元105、歧義部分檢測單元106、歧義部分刪除單元107、譯出部分呈現(xiàn)單元108、對應(yīng)信息存儲單元110、概念替換單元1209、以及概念層次存儲單元1220。
在第二實(shí)施例中,新增的概念替換單元1209和概念層次存儲單元1220與第一實(shí)施例不同。因?yàn)槠渌渲煤凸δ芘c圖1中的對應(yīng)部分類似,所以給予相同的參考數(shù)字和標(biāo)記并省略對其的說明,其中圖1是顯示根據(jù)第一實(shí)施例的交流支持設(shè)備100的配置的框圖。
概念替換單元1209檢索由歧義部分檢測單元106檢測到的歧義部分的語義內(nèi)容的上位概念,當(dāng)能夠檢索到上位概念時,將歧義部分替換為檢索到的上位概念。
概念層次存儲單元1220是一個其中預(yù)先存儲了概念之間的層次關(guān)系的存儲單元,其可以由任何常用的存儲器組成,例如HDD、光盤和存儲卡。概念層次存儲單元1220用于搜索由歧義部分表示的語義內(nèi)容的上位概念。
圖14是顯示概念層次存儲單元1220的數(shù)據(jù)結(jié)構(gòu)的一個例子的說明視圖。圖14中,每個橢圓中描述的單詞表示一個概念。此外,箭頭表示位于其起點(diǎn)的概念是位于其終點(diǎn)的概念的上位概念。標(biāo)記“…”代表省略部分。
例如,圖14中描述的內(nèi)容是,概念“EVENT”、概念“OBJECT”、以及概念“ACTION”是位于最頂層次的概念“CONCEPT”的下位概念,概念“ACCESS”是概念“OBJECT”的下位概念,概念“GATE”和概念“BARRIER”是概念“ACCESS”的下位概念。
接下來,說明根據(jù)第二實(shí)施例的、如上配置的交流支持設(shè)備1200的交流支持處理。在第二實(shí)施例中,雖然歧義部分排除處理的細(xì)節(jié)與其在第一實(shí)施例不同,但其它處理與圖2中顯示的交流支持處理類似,因此不再重復(fù)其描述。
圖15是顯示第二實(shí)施例中的歧義部分排除處理的總體過程的流程圖。因?yàn)閺牟襟ES1401到S1402的歧義部分檢測處理與在根據(jù)第一實(shí)施例的交流支持設(shè)備100中的從步驟S301到S302的處理類似,所以不再重復(fù)其描述。
在歧義部分檢測單元106檢測到歧義部分之后(步驟S1402),概念替換單元1209從概念層次存儲單元1220中檢索歧義部分的上位概念(步驟S1403)。更具體地,概念替換單元1209參照概念層次存儲單元1220檢測包含了歧義部分中所包括的多個概念的最低層次的上位概念。
例如,假定圖14所示的概念層次存儲單元1220的數(shù)據(jù)實(shí)例,當(dāng)概念替換單元1209檢索到包含概念“TRUCK”、概念“CAR”和概念“BIKE”的歧義部分的上位概念時,通過檢索包含這些概念的最低層次中的概念以輸出概念“VIHECLE”。此外,例如當(dāng)對包含概念“BARRIER”和概念“GATE”的歧義部分檢索到上位概念時,概念替換單元1209輸出概念“ACCESS”,當(dāng)對包含概念“BARRIER”和概念“VEHICLE”的歧義部分檢索到上位概念時,概念替換單元1209輸出概念“OBJECT”。
為了避免過度抽象,可以使用對待檢索的上位概念增加限制的配置。例如,該配置可以是,當(dāng)代表各個概念的節(jié)點(diǎn)之間的弧的數(shù)目大于預(yù)設(shè)的數(shù)量時,不檢索該上位概念。此外,該配置可以是,根據(jù)從上位概念開始所到達(dá)的層次的不同增加點(diǎn)數(shù),當(dāng)點(diǎn)數(shù)大于預(yù)設(shè)值時,不檢索該上位概念。
接下來,概念替換單元1209確定是否檢索到上位概念(步驟S1404)。如果檢索到(步驟S1404是),則概念替換單元1209將歧義部分替換為檢索到的上位概念,從而將多個候選集成為一個候選(步驟S1405),從而結(jié)束所述歧義部分排除處理。
如果沒有檢索到上位概念(步驟S1404否),則歧義部分刪除單元107刪除歧義部分,從而將多個候選集成為一個候選(步驟S1406),從而結(jié)束歧義部分排除處理。
這種方式下,在根據(jù)第二實(shí)施例的交流支持設(shè)備1200中,當(dāng)存在歧義部分并存在歧義部分的上位概念時,可以將歧義部分替換為上位概念,而不是簡單地刪除歧義部分。因此,刪除歧義部分可以減少未充分傳達(dá)用戶意圖的可能性。
接下來,描述根據(jù)第二實(shí)施例的交流支持設(shè)備1200中的交流支持處理的具體例子。
圖16是顯示源語言語音識別單元101輸出的源語言句子的例子的說明視圖。如圖16所示,考慮輸入源語言句子S4作為源語言句子的例子。
圖17是顯示由源語言分析單元102輸出的候選源語言解釋的例子的說明視圖。如圖17所示,源語言分析單元102輸出候選源語言解釋T4,其對應(yīng)于圖16中的源語言句子S4。
在圖17所示的例子中,僅僅存在一個候選源語言解釋,也就是說,不存在歧義部分。
圖18A到18B顯示了由翻譯單元103輸出的候選目標(biāo)語言解釋的例子。如圖18A和18B所示,翻譯單元103輸出候選目標(biāo)語言解釋U4a和U4b,它們對應(yīng)于圖17的候選源語言解釋T4。
在該例子中,根據(jù)一個候選源語言解釋T4輸出了多個候選目標(biāo)語言解釋U4a和U4b。這是因?yàn)閷τ赥4中由節(jié)點(diǎn)標(biāo)識號627標(biāo)識的節(jié)點(diǎn),得到了多個節(jié)點(diǎn)“BARRIER@727”和“GATE@730”作為候選翻譯。
圖19顯示了由目標(biāo)語言生成單元104輸出的候選目標(biāo)語言句子的例子。如圖19所示,目標(biāo)語言生成單元104輸出候選目標(biāo)語言句子V4a和V4b,分別對應(yīng)于候選目標(biāo)語言解釋U4a和U4b。此外,最終輸出的排除了歧義部分的目標(biāo)語言句子是Z4。
圖20顯示了由歧義部分檢測單元106檢測到的歧義部分。在圖20所示的例子中,顯示了在歧義部分檢測單元106中通過檢測圖18的兩個候選目標(biāo)語言解釋U4a和U4b之間的差別部分所獲得的結(jié)果W4,作為對應(yīng)于所述候選的歧義部分。
圖21顯示了通過在概念替換單元1209中將歧義部分替換為上位概念所獲得的結(jié)果的例子。在圖21所示的例子中,顯示了在概念替換單元1209中將歧義部分替換為對應(yīng)于圖20中的歧義部分檢測結(jié)果W4的上位概念“ACCESS@1203”所獲得的結(jié)果Y4。
圖22顯示了第二實(shí)施例中的交流支持處理所處理的數(shù)據(jù)的流程的例子。在圖22中,顯示了交流支持處理中的源句子輸入如何獲得候選源語言解釋和候選目標(biāo)語言解釋,以及最終被輸出為目標(biāo)語言句子。此外,各條數(shù)據(jù)之間的對應(yīng)關(guān)系由箭頭顯示。
例如,當(dāng)輸入源語言句子S4時,源語言分析單元102輸出候選源語言解釋T4。在這個例子中,因?yàn)楹蜻x源語言解釋中不存在歧義,所以T4對應(yīng)于排除了歧義部分的候選源語言解釋。
此外,翻譯單元103對排除了歧義部分的候選源語言解釋T4執(zhí)行翻譯處理,并輸出候選目標(biāo)語言解釋U4a和U4b。對于這些候選,由歧義部分檢測單元106執(zhí)行歧義部分的檢測,由概念替換單元1209執(zhí)行上位概念的替換,并輸出排除了歧義部分的候選目標(biāo)語言解釋Y4。最后,目標(biāo)語言生成單元104對排除了歧義部分的候選目標(biāo)語言解釋Y4執(zhí)行目標(biāo)語言生成處理,并輸出排除了歧義部分的目標(biāo)語言句子Z4。
圖23顯示了由譯出部分呈現(xiàn)單元108所顯示的譯出部分顯示屏幕的例子。如圖23所示,該例子顯示了通過語音識別,日語句子2201作為源語言句子輸出,并且執(zhí)行歧義部分排除處理和翻譯處理,從而輸出目標(biāo)語言句子“Let’s meet at the access”。在這個例子中,盡管日語單詞2203被檢測為歧義部分,但是因?yàn)榇嬖谏衔桓拍?,所以不刪除歧義部分,而是在屏幕上顯示與源語言句子相同的日語句子2202作為譯出部分。
這種方式下,在第二實(shí)施例中,因?yàn)榭梢詫⑵缌x部分替換為上位概念而不刪除歧義部分,所以能夠向?qū)υ挼牧硪环絺鬟_(dá)不包含歧義部分并與用戶意圖匹配的翻譯結(jié)果。
如上所述,對于根據(jù)第二實(shí)施例的交流支持設(shè)備,當(dāng)在語音識別處理、源語言分析處理、翻譯處理或者目標(biāo)語言生成處理中獲得多個候選處理結(jié)果時,將各個候選之間的差別部分檢測為歧義部分,并且如果存在檢測到的歧義部分的上位概念,則將歧義部分替換為所述上位概念。此外,如果不存在上位概念,則與第一實(shí)施例一樣刪除歧義部分。這使得能夠排除最終輸出的目標(biāo)語言句子的歧義部分,從而能夠獲得不包含錯誤的正確的目標(biāo)語言句子。
盡管在第一和第二實(shí)施例中,使用利用了源語言分析、語言翻譯和目標(biāo)語言生成的交流設(shè)備描述了本發(fā)明,但是,也可以應(yīng)用如下方案的技術(shù),即,將語義上相互等價的多對源語言和目標(biāo)語言存儲在存儲器(平行翻譯對存儲器)中,作為平行翻譯對,當(dāng)通過從平行翻譯對中選擇候選目標(biāo)語言句子時,實(shí)現(xiàn)交流支持。
在根據(jù)第一或第二實(shí)施例的交流支持設(shè)備中執(zhí)行的交流支持程序可以通過存入ROM(只讀存儲器)等來預(yù)先提供。
可以使用一種配置,其中,通過將在根據(jù)第一或第二實(shí)施例的交流支持設(shè)備中執(zhí)行的交流支持程序作為可安裝格式或執(zhí)行格式的文件記錄在計算機(jī)可讀的記錄介質(zhì)上來提供所述程序,所述記錄介質(zhì)可以是例如CD-ROM(光盤只讀存儲器)、軟盤(FD)、CD-R(可寫光盤)以及DVD(數(shù)字多用途盤)。
此外,可以使用一種配置,其中,通過將在根據(jù)第一或第二實(shí)施例的交流支持設(shè)備中執(zhí)行的交流支持程序存儲在連接到網(wǎng)絡(luò)(例如因特網(wǎng))上的計算機(jī)中,并通過網(wǎng)絡(luò)下載來提供這些程序。此外,可以使用一種配置,其中,通過網(wǎng)絡(luò)(例如因特網(wǎng))來提供或分發(fā)在根據(jù)第一或第二實(shí)施例的交流支持設(shè)備中執(zhí)行的交流支持程序。
在根據(jù)第一或第二實(shí)施例的交流支持設(shè)備中執(zhí)行的交流支持程序具有包括多個單元(源語言語音識別單元、源語言分析單元、翻譯單元、目標(biāo)語言生成單元、目標(biāo)語言語音合成單元、歧義部分檢測單元、歧義部分刪除單元、譯出部分呈現(xiàn)單元以及概念替換單元)的模塊配置,并且CPU(中央處理單元)從ROM讀取交流支持程序以便執(zhí)行,從而將所述單元加載到主存儲器中并在主存儲器上生成,作為實(shí)際的硬件。
本領(lǐng)域的技術(shù)人員將容易地知道其它的優(yōu)點(diǎn)和變形。所以,本發(fā)明并不局限于這里顯示并描述的具體細(xì)節(jié)和代表性的實(shí)施例。因此,在不脫離由附加的權(quán)利要求及其等價內(nèi)容所定義的一般發(fā)明概念的精神和范圍的情況下,可以進(jìn)行各種修改。
權(quán)利要求
1.一種交流支持設(shè)備,包括分析單元,用于分析將被翻譯成目標(biāo)語言的源語言句子,并輸出至少一個候選源語言解釋,所述候選源語言解釋是所述源語言句子的解釋的候選;檢測單元,用于當(dāng)存在多個所述候選源語言解釋時,檢測歧義部分,該歧義部分是所述多個候選源語言解釋中的各個候選之間的差別部分;翻譯單元,用于將除了所述歧義部分之外的所述候選源語言解釋翻譯成所述目標(biāo)語言。
2.如權(quán)利要求1所述的交流支持設(shè)備,還包括概念層次存儲單元,用于存儲單詞的語義內(nèi)容的層次關(guān)系;替換單元,用于從所述概念層次存儲單元中檢索上位概念,所述上位概念是由所述各個候選的所述歧義部分表示的語義內(nèi)容所共有的上級層次的語義內(nèi)容,并且當(dāng)檢索到所述上位概念時,將所述歧義部分替換為所述檢索到的上位概念;以及刪除單元,用于當(dāng)所述替換單元未用上位概念替換所述歧義部分時,刪除所述歧義部分。
3.如權(quán)利要求1所述的交流支持設(shè)備,還包括生成單元,用于基于候選目標(biāo)語言解釋生成目標(biāo)語言句子,并輸出至少一個候選目標(biāo)語言句子,其中,所述候選目標(biāo)語言解釋是用所述目標(biāo)語言描述的語義內(nèi)容的解釋的候選,所述目標(biāo)語言句子是用所述目標(biāo)語言描述的句子,所述候選目標(biāo)語言句子是所述目標(biāo)語言句子的候選,其中,所述分析單元輸出解釋對應(yīng)信息,所述解釋對應(yīng)信息是所述源語言句子和所述候選源語言解釋之間的對應(yīng)信息,所述翻譯單元輸出翻譯對應(yīng)信息,所述翻譯對應(yīng)信息是所述候選源語言解釋和所述候選目標(biāo)語言解釋之間的對應(yīng)信息,所述生成單元輸出生成對應(yīng)信息,所述生成對應(yīng)信息是所述候選目標(biāo)語言解釋和所述候選目標(biāo)語言句子之間的對應(yīng)信息,以及呈現(xiàn)單元,用于基于另外提供的所述解釋對應(yīng)信息、所述翻譯對應(yīng)信息和所述生成對應(yīng)信息,用所述源語言呈現(xiàn)所述源語言句子中的對應(yīng)于所述目標(biāo)語言句子的部分的字符串。
4.如權(quán)利要求3所述的交流支持設(shè)備,還包括語音識別單元,向該語音識別單元輸入所述源語言的語音,所述語音識別單元識別所述輸入的語音并輸出至少一個候選源語言句子,所述候選源語言句子是用所述源語言描述的句子,其中,當(dāng)存在多個所述候選源語言句子、多個所述候選源語言解釋、多個所述候選目標(biāo)語言解釋、或多個所述候選目標(biāo)語言句子時,所述檢測單元檢測歧義部分,所述歧義部分是所述多個候選源語言句子中的各個候選之間、所述多個候選源語言解釋中的各個候選之間、或所述多個候選目標(biāo)語言解釋中的各個候選之間、或所述多個候選目標(biāo)語言句子中的各個候選之間的差別部分。
5.一種交流支持設(shè)備,包括分析單元,用于分析將被翻譯成目標(biāo)語言的源語言句子,并輸出至少一個候選源語言解釋,所述候選源語言解釋是所述源語言句子的解釋的候選;翻譯單元,用于將所述候選源語言解釋翻譯成目標(biāo)語言,并輸出至少一個候選目標(biāo)語言解釋,所述候選目標(biāo)語言解釋是用所述目標(biāo)語言描述的所述解釋的候選;檢測單元,用于當(dāng)存在多個所述候選目標(biāo)語言解釋時,檢測歧義部分,該歧義部分是所述多個候選目標(biāo)語言解釋中的各個候選之間的差別部分;以及生成單元,基于除所述歧義部分之外的所述候選目標(biāo)語言解釋,生成目標(biāo)語言句子,并輸出至少一個候選目標(biāo)語言句子,其中,所述目標(biāo)語言句子是用所述目標(biāo)語言描述的句子,所述候選目標(biāo)語言句子是所述目標(biāo)語言句子的候選。
6.如權(quán)利要求5所述的交流支持設(shè)備,還包括概念層次存儲單元,用于存儲單詞的語義內(nèi)容的層次關(guān)系;替換單元,用于從所述概念層次存儲單元中檢索上位概念,所述上位概念是由所述各個候選的所述歧義部分表示的語義內(nèi)容所共有的上級層次的語義內(nèi)容,并且當(dāng)檢索到所述上位概念時,將所述歧義部分替換為所述檢索到的上位概念;以及刪除單元,用于當(dāng)所述替換單元未用上位概念替換所述歧義部分時,刪除所述歧義部分。
7.如權(quán)利要求5所述的交流支持設(shè)備,其中其中,所述分析單元輸出解釋對應(yīng)信息,所述解釋對應(yīng)信息是所述源語言句子和所述候選源語言解釋之間的對應(yīng)信息,所述翻譯單元輸出翻譯對應(yīng)信息,所述翻譯對應(yīng)信息是所述候選源語言解釋和所述候選目標(biāo)語言解釋之間的對應(yīng)信息,所述生成單元輸出生成對應(yīng)信息,所述生成對應(yīng)信息是所述候選目標(biāo)語言解釋和所述候選目標(biāo)語言句子之間的對應(yīng)信息,以及呈現(xiàn)單元,用于基于另外提供的所述解釋對應(yīng)信息、所述翻譯對應(yīng)信息和所述生成對應(yīng)信息,用所述源語言呈現(xiàn)所述源語言句子中的對應(yīng)于所述目標(biāo)語言句子的部分的字符串。
8.如權(quán)利要求5所述的交流支持設(shè)備,還包括語音識別單元,向該語音識別單元輸入所述源語言的語音,所述語音識別單元識別所述輸入的語音并輸出至少一個候選源語言句子,所述候選源語言句子是用所述源語言描述的句子,其中,當(dāng)存在多個所述候選源語言句子、多個所述候選源語言解釋、多個所述候選目標(biāo)語言解釋、或多個所述候選目標(biāo)語言句子時,所述檢測單元檢測歧義部分,所述歧義部分是所述多個候選源語言句子中的各個候選之間、所述多個候選源語言解釋中的各個候選之間、或所述多個候選目標(biāo)語言解釋中的各個候選之間、或所述多個候選目標(biāo)語言句子中的各個候選之間的差別部分。
9.一種交流支持設(shè)備,包括分析單元,用于分析將被翻譯成目標(biāo)語言的源語言句子,并輸出至少一個候選源語言解釋,所述候選源語言解釋是所述源語言句子的解釋的候選;翻譯單元,用于將所述候選源語言解釋翻譯成目標(biāo)語言,并輸出至少一個候選目標(biāo)語言解釋,所述候選目標(biāo)語言解釋是用所述目標(biāo)語言描述的所述解釋的候選;生成單元,用于基于所述候選目標(biāo)語言解釋,生成目標(biāo)語言句子,并輸出至少一個候選目標(biāo)語言句子,其中,所述目標(biāo)語言句子是用所述目標(biāo)語言描述的句子,所述候選目標(biāo)語言句子是所述目標(biāo)語言句子的候選;檢測單元,用于當(dāng)存在多個所述候選目標(biāo)語言句子時,檢測歧義部分,該歧義部分是所述多個候選目標(biāo)語言句子中的各個候選之間的差別部分;以及刪除單元,用于刪除所述歧義部分。
10.如權(quán)利要求9所述的交流支持設(shè)備,還包括概念層次存儲單元,用于存儲單詞的語義內(nèi)容的層次關(guān)系;以及替換單元,用于從所述概念層次存儲單元中檢索上位概念,所述上位概念是由所述各個候選的所述歧義部分表示的語義內(nèi)容所共有的上級層次的語義內(nèi)容,并且當(dāng)檢索到所述上位概念時,將所述歧義部分替換為所述檢索到的上位概念,其中,當(dāng)所述替換單元未用上位概念替換所述歧義部分時,所述刪除單元刪除所述歧義部分。
11.如權(quán)利要求9所述的交流支持設(shè)備,其中所述分析單元輸出解釋對應(yīng)信息,所述解釋對應(yīng)信息是所述源語言句子和所述候選源語言解釋之間的對應(yīng)信息,所述翻譯單元輸出翻譯對應(yīng)信息,所述翻譯對應(yīng)信息是所述候選源語言解釋和所述候選目標(biāo)語言解釋之間的對應(yīng)信息,所述生成單元輸出生成對應(yīng)信息,所述生成對應(yīng)信息是所述候選目標(biāo)語言解釋和所述候選目標(biāo)語言句子之間的對應(yīng)信息,以及呈現(xiàn)單元,用于基于另外提供的所述解釋對應(yīng)信息、所述翻譯對應(yīng)信息和所述生成對應(yīng)信息,用所述源語言呈現(xiàn)所述源語言句子中的對應(yīng)于所述目標(biāo)語言句子的部分的字符串。
12.如權(quán)利要求9所述的交流支持設(shè)備,還包括語音識別單元,向該語音識別單元輸入所述源語言的語音,所述語音識別單元識別所述輸入的語音并輸出至少一個候選源語言句子,所述候選源語言句子是用所述源語言描述的句子,其中,當(dāng)存在多個所述候選源語言句子、多個所述候選源語言解釋、多個所述候選目標(biāo)語言解釋、或多個所述候選目標(biāo)語言句子時,所述檢測單元檢測歧義部分,所述歧義部分是所述多個候選源語言句子中的各個候選之間、所述多個候選源語言解釋中的各個候選之間、或所述多個候選目標(biāo)語言解釋中的各個候選之間、或所述多個候選目標(biāo)語言句子中的各個候選之間的差別部分。
13.一種交流支持設(shè)備,包括分析單元,用于分析將被翻譯成目標(biāo)語言的源語言句子,并輸出至少一個候選源語言解釋,所述候選源語言解釋是所述源語言句子的解釋的候選;檢測單元,用于當(dāng)存在多個所述候選源語言解釋時,檢測歧義部分,該歧義部分是所述多個候選源語言解釋中的各個候選之間的差別部分;平行翻譯對存儲單元,用于存儲由語義上相互等價的候選源語言解釋和候選目標(biāo)語言句子組成的平行翻譯對;以及選擇單元,用于基于除所述歧義部分外的所述候選源語言解釋和存儲在所述平行翻譯對存儲單元中的所述平行翻譯對,選擇所述候選目標(biāo)語言句子。
14.如權(quán)利要求13所述的交流支持設(shè)備,還包括概念層次存儲單元,用于存儲單詞的語義內(nèi)容的層次關(guān)系;替換單元,用于從所述概念層次存儲單元中檢索上位概念,所述上位概念是由所述各個候選的所述歧義部分表示的語義內(nèi)容所共有的上級層次的語義內(nèi)容,并且當(dāng)檢索到所述上位概念時,將所述歧義部分替換為所述檢索到的上位概念;以及刪除單元,用于當(dāng)所述替換單元未用上位概念替換所述歧義部分時,刪除所述歧義部分。
15.如權(quán)利要求13所述的交流支持設(shè)備,其中所述分析單元輸出解釋對應(yīng)信息,所述解釋對應(yīng)信息是所述源語言句子和所述候選源語言解釋之間的對應(yīng)信息,所述翻譯單元輸出翻譯對應(yīng)信息,所述翻譯對應(yīng)信息是所述候選源語言解釋和所述候選目標(biāo)語言解釋之間的對應(yīng)信息,所述生成單元輸出生成對應(yīng)信息,所述生成對應(yīng)信息是所述候選目標(biāo)語言解釋和所述候選目標(biāo)語言句子之間的對應(yīng)信息,以及呈現(xiàn)單元,用于基于另外提供的所述解釋對應(yīng)信息、所述翻譯對應(yīng)信息和所述生成對應(yīng)信息,用所述源語言呈現(xiàn)所述源語言句子中的對應(yīng)于所述目標(biāo)語言句子的部分的字符串。
16.如權(quán)利要求13所述的交流支持設(shè)備,還包括語音識別單元,向該語音識別單元輸入所述源語言的語音,所述語音識別單元識別所述輸入的語音并輸出至少一個候選源語言句子,所述候選源語言句子是用所述源語言描述的句子,其中,當(dāng)存在多個所述候選源語言句子、多個所述候選源語言解釋、多個所述候選目標(biāo)語言解釋、或多個所述候選目標(biāo)語言句子時,所述檢測單元檢測歧義部分,所述歧義部分是所述多個候選源語言句子中的各個候選之間、所述多個候選源語言解釋中的各個候選之間、或所述多個候選目標(biāo)語言解釋中的各個候選之間、或所述多個候選目標(biāo)語言句子中的各個候選之間的差別部分。
17.一種交流支持方法,包括分析將被翻譯成目標(biāo)語言的源語言句子;輸出至少一個候選源語言解釋,所述候選源語言解釋是所述源語言句子的解釋的候選;當(dāng)存在多個所述候選源語言解釋時,檢測歧義部分,該歧義部分是所述多個候選源語言解釋中的各個候選之間的差別部分;將除了所述歧義部分之外的所述候選源語言解釋翻譯成所述目標(biāo)語言。
18.一種交流支持方法,包括分析將被翻譯成目標(biāo)語言的源語言句子;輸出至少一個候選源語言解釋,所述候選源語言解釋是所述源語言句子的解釋的候選;將所述候選源語言解釋翻譯成目標(biāo)語言;輸出至少一個候選目標(biāo)語言解釋,所述候選目標(biāo)語言解釋是用所述目標(biāo)語言描述的所述解釋的候選;當(dāng)存在多個所述候選目標(biāo)語言解釋時,檢測歧義部分,該歧義部分是所述多個候選目標(biāo)語言解釋中的各個候選之間的差別部分;基于除所述歧義部分之外的所述候選目標(biāo)語言解釋,生成目標(biāo)語言句子,所述目標(biāo)語言句子是用所述目標(biāo)語言描述的句子;以及輸出至少一個候選目標(biāo)語言句子,所述候選目標(biāo)語言句子是所述目標(biāo)語言句子的候選。
19.一種交流支持方法,包括分析將被翻譯成目標(biāo)語言的源語言句子;輸出至少一個候選源語言解釋,所述候選源語言解釋是所述源語言句子的解釋的候選;將所述候選源語言解釋翻譯成目標(biāo)語言;輸出至少一個候選目標(biāo)語言解釋,所述候選目標(biāo)語言解釋是用所述目標(biāo)語言描述的所述解釋的候選;基于所述候選目標(biāo)語言解釋,生成目標(biāo)語言句子,所述目標(biāo)語言句子是用所述目標(biāo)語言描述的句子;輸出至少一個候選目標(biāo)語言句子,所述候選目標(biāo)語言句子是所述目標(biāo)語言句子的候選;當(dāng)存在多個所述候選目標(biāo)語言句子時,檢測歧義部分,該歧義部分是所述多個候選目標(biāo)語言句子中的各個候選之間的差別部分;以及刪除所述歧義部分。
全文摘要
一種交流支持設(shè)備,包括分析單元,用于分析將被翻譯成目標(biāo)語言的源語言句子,并輸出至少一個候選源語言解釋,所述候選源語言解釋是所述源語言句子的解釋的候選;檢測單元,用于當(dāng)存在多個所述候選源語言解釋時,檢測歧義部分,該歧義部分是所述多個候選源語言解釋中的各個候選之間的差別部分;翻譯單元,用于將除了所述歧義部分之外的所述候選源語言解釋翻譯成所述目標(biāo)語言。
文檔編號G06F17/28GK1841367SQ200610071660
公開日2006年10月4日 申請日期2006年3月30日 優(yōu)先權(quán)日2005年3月30日
發(fā)明者知野哲朗, 黑田由加, 釜谷聰史 申請人:株式會社東芝