亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

語音翻譯設(shè)備、語音翻譯方法以及輸出經(jīng)翻譯的語音的終端的制作方法

文檔序號:7660759閱讀:197來源:國知局
專利名稱:語音翻譯設(shè)備、語音翻譯方法以及輸出經(jīng)翻譯的語音的終端的制作方法
技術(shù)領(lǐng)域
本發(fā)明總體涉及提供語音翻譯設(shè)備和語音翻譯方法的技術(shù)以及輸出經(jīng)翻譯的語音的 終端設(shè)備。
背景技術(shù)
通過先進(jìn)的信息技術(shù),電子會議系統(tǒng)己經(jīng)被廣泛用于討論會、集會等會議中與諸多參 與者的通話。電子會議系統(tǒng)包括提供參與者的語音和圖像的視頻會議系統(tǒng)和傳送參與者的 語音的電話會議系統(tǒng)。如果參與者使用不同的語言,識別和翻譯語音的語音翻譯技術(shù)被用于將每個參與者的 發(fā)言與其他人共同交流。然而,當(dāng)將語音翻譯技術(shù)應(yīng)用到視頻會議系統(tǒng)時,講話者的圖像和經(jīng)翻譯的語音并不 是同步輸出的,因為需要一定的時間處理語音。JP-A 2001-224002 (KOKAI)披露了一種技術(shù),該技術(shù)翻譯語音信號,對與語音信號 一起接收的圖像信號進(jìn)行時間比例壓縮/解壓縮從而使圖像信號的持續(xù)時間與翻譯后的合 成語音的持續(xù)時間相等,并且同時輸出經(jīng)處理的圖像信號和合成語音。JP-A 2001-224002 (KOKAI)中披露的技術(shù)消除了經(jīng)翻譯的語音和運(yùn)動圖像之間的時 滯;然而,它并不消除所輸出的電話會議中的參與者的經(jīng)翻譯的語音與運(yùn)動圖像之間的時 滯。換句話說,如果語音被翻譯成多種目標(biāo)語言,則取決于目標(biāo)語言經(jīng)翻譯的語音可能在 不同的時刻輸出,因為翻譯的處理以及經(jīng)翻譯的文字的輸出順序不同。此外,使用與說話者相同的語言的參與者實時聽到語音而其他人必須等到語音被翻譯 后。因此,有時聆聽經(jīng)翻譯的語音的參與者難以跟上會議的節(jié)奏。發(fā)明內(nèi)容根據(jù)本發(fā)明的一個方面,語音翻譯設(shè)備包括存儲彼此相關(guān)聯(lián)的唯一標(biāo)識可通過網(wǎng)絡(luò)連 接的多個終端中的每一個終端的標(biāo)識符和在這些終端中使用的使用語言的對應(yīng)存儲單元; 從一個終端接收源語音的接收單元;從對應(yīng)存儲單元中獲取與源語音中使用的源語言不同 的使用語言,并且通過將每個所獲取的使用語言作為目標(biāo)語言來生成從源語音翻譯的經(jīng)翻 譯的語音的生成單元;當(dāng)用任何一種目標(biāo)語言生成經(jīng)翻譯的語音時確定是否已經(jīng)用所有的 目標(biāo)語言生成經(jīng)翻譯的語音的確定單元;當(dāng)已經(jīng)用所有的目標(biāo)語言生成經(jīng)翻譯的語音時輸 出經(jīng)翻譯的語音的輸出處理單元;和將所輸出的經(jīng)翻譯的語音發(fā)送到每個由對應(yīng)于目標(biāo)語 言的標(biāo)識符標(biāo)識的終端的發(fā)送單元。根據(jù)本發(fā)明的另一方面,所述終端包括接收源語音的語音接收單元;將源語音發(fā)送到 可通過網(wǎng)絡(luò)連接的用于翻譯源語音并且生成經(jīng)翻譯的語音的語音翻譯設(shè)備的發(fā)送單元;從 語音翻譯設(shè)備接收經(jīng)翻譯的語音的第一接收單元;輸出經(jīng)翻譯的語音的語音輸出單元;從 語音翻譯設(shè)備接收完成源語音的翻譯的估計時間的第二接收單元;和顯示該估計時間的顯不單兀。根據(jù)本發(fā)明的再一個方面,語音翻譯設(shè)備包括存儲彼此相關(guān)聯(lián)的唯一標(biāo)識通過網(wǎng)絡(luò)連 接的多個終端中的每一個終端的標(biāo)識符和這些終端中使用的使用語言的對應(yīng)存儲單元;從 一個終端接收源語音的接收單元;從對應(yīng)存儲單元中獲取與源語音中使用的源語言不同的 使用語言并且通過將每個所獲取的使用語言作為目標(biāo)語言來生成從源語音翻譯的經(jīng)翻譯 的語音的生成單元;將經(jīng)翻譯的語音發(fā)送到由對應(yīng)于目標(biāo)語言的標(biāo)識符標(biāo)識的每個終端并 且將源語音發(fā)送到由對應(yīng)于源語言的標(biāo)識符標(biāo)識的每個終端的發(fā)送單元;當(dāng)用任何一種目 標(biāo)語言生成經(jīng)翻譯的語音時確定是否已經(jīng)用所有的目標(biāo)語言生成經(jīng)翻譯的語音的確定單 元;和當(dāng)已經(jīng)用所有的目標(biāo)語言生成經(jīng)翻譯的語音時輸出由確定單元確定的源語音的語音 持續(xù)時間的持續(xù)時間信息的輸出處理單元,其中發(fā)送單元進(jìn)一步將持續(xù)時間信息發(fā)送到各 個終端。根據(jù)本發(fā)明的再一個方面,所述終端包括能夠存儲包括經(jīng)翻譯的語音或源語音的混合 語音的語音存儲單元;接收源語音的語音接收單元;將輸入源語音發(fā)送到可通過網(wǎng)絡(luò)連接 的翻譯源語音并且生成經(jīng)翻譯的語音的語音翻譯設(shè)備的發(fā)送單元;從語音翻譯設(shè)備接收經(jīng) 翻譯的語音的第一接收單元;將經(jīng)翻譯的語音與語音存儲單元中的混合語音混合從而生成 結(jié)果的混合語音并且將結(jié)果的混合語音存儲在語音存儲單元中的保存單元;從語音翻譯設(shè) 備接收有關(guān)源語音的語音持續(xù)時間的持續(xù)時間信息的第二接收單元;和輸出由從語音存儲 單元獲取的持續(xù)時間信息表示的語音持續(xù)時間所對應(yīng)的結(jié)果的混合語音的輸出處理單元。根據(jù)本發(fā)明的再一個方面,語音翻譯設(shè)備包括存儲使用語言的語言存儲單元;從多個
可通過網(wǎng)絡(luò)連接的其他語音翻譯設(shè)備中接收源語音的第一接收單元;通過將每個存儲在語 言存儲單元中的使用語言作為目標(biāo)語言生成從源語音翻譯來的經(jīng)翻譯的語音的生成單元;接收指示源語音已經(jīng)被翻譯成另一個語音翻譯設(shè)備中使用的語言的信息的第二接收單元; 當(dāng)從任何一個其他語音翻譯設(shè)備中接收到信息時確定是否已經(jīng)在所有其他語音翻譯設(shè)備 中生成經(jīng)翻譯的語音的確定單元;和當(dāng)已經(jīng)在所有其他語音翻譯設(shè)備中生成經(jīng)翻譯的語音 時輸出經(jīng)翻譯的語音的輸出處理單元。根據(jù)本發(fā)明的再一個方面,語音翻譯方法包括從多個可通過網(wǎng)絡(luò)連接的終端中接收源 語音;從存儲彼此相關(guān)的唯一標(biāo)識多個終端中的每一個終端的標(biāo)識符和這些終端中使用的 使用語言的對應(yīng)存儲單元中獲取與源語音中使用的源語言不同的使用語言;通過將所獲取 的每種使用語言作為目標(biāo)語言生成從源語音翻譯的經(jīng)翻譯的語音;當(dāng)用任何一個目標(biāo)語言 生成經(jīng)翻譯的語音時確定是否已經(jīng)用所有的目標(biāo)語言生成經(jīng)翻譯的語音;當(dāng)確定已經(jīng)用所 有的目標(biāo)語言生成經(jīng)翻譯的語音時輸出經(jīng)翻譯的語音;和將所輸出的經(jīng)翻譯的語音發(fā)送到 由對應(yīng)于目標(biāo)語言的標(biāo)識符標(biāo)識的每個終端。


圖1是根據(jù)本發(fā)明的第一實施例的會議系統(tǒng)的示意圖;圖2是根據(jù)第一實施例的終端的框圖;圖3是根據(jù)第一實施例的語音翻譯設(shè)備的框圖;圖4是顯示從圖3中所示的生成單元輸出的信息的實例的說明圖; 圖5是顯示圖3中所示的語音存儲單元中的語音的實例的說明圖; 圖6是根據(jù)第一實施例的語音翻譯處理的程序圖; 圖7是語音輸出處理的流程圖;圖8是顯示將要輸出到每個終端的語音持續(xù)時間的實例的說明圖;圖9是由圖3中所示的確定單元進(jìn)行的確定處理的流程圖;圖IO是顯示表示確定處理的偽代碼的實例的說明圖;圖11到14是語音存儲單元的內(nèi)容的實例;圖15是根據(jù)本發(fā)明的第二實施例的語音翻譯設(shè)備的框圖;圖16是根據(jù)第二實施例的語音翻譯處理的程序圖;圖17是根據(jù)第二實施例的語音輸出處理的流程圖; 圖18是根據(jù)本發(fā)明的第三實施例的終端的框圖;圖19是顯示由圖18中所示的第一接收單元接收的信息的實例的說明圖;圖20是根據(jù)第三實施例的語音翻譯設(shè)備的框圖;圖21到23是從圖20中所示的生成單元輸出的信息的實例。圖24是根據(jù)第三實施例的語音翻譯處理的程序圖;圖25是由圖20中所示的確定單元進(jìn)行的確定處理的程序圖;圖26是根據(jù)本發(fā)明的第四實施例的會議系統(tǒng)的示意圖; 圖27是根據(jù)第四實施例的語音翻譯設(shè)備的框圖;圖28是顯示從圖27中所示的生成單元輸出的信息的實例的說明圖;圖29是根據(jù)第四實施例的語音翻譯處理的程序圖;圖30是根據(jù)本發(fā)明的第五實施例的語音翻譯設(shè)備的框圖;圖31是根據(jù)第五實施例的語音輸出處理的流程圖;圖32是顯示語音持續(xù)時間的實例的說明圖;圖33是延遲消除處理的流程圖;圖34是根據(jù)本發(fā)明的第六實施例的語音翻譯設(shè)備的框圖;圖35和36是根據(jù)第六實施例的語音輸出處理的流程圖;圖37是顯示由圖34中所示的縮短單元縮短的語音持續(xù)時間的實例的說明圖;圖38是根據(jù)本發(fā)明的第七實施例的終端的框圖;圖39是根據(jù)第七實施例的語音翻譯設(shè)備的框圖;圖40是根據(jù)第七實施例的語音翻譯處理的程序圖;圖41是顯示在終端上顯示的屏幕的實例的說明圖;以及圖42是根據(jù)任何一個第一到第七實施例的語音翻譯設(shè)備中的硬件的框圖。
具體實施方式
下文將參考附圖詳盡解釋本發(fā)明的示例性實施例。根據(jù)第一實施例的語音翻譯設(shè)備ioo在其中存儲預(yù)定的語音持續(xù)時間中的語音被完全翻譯完之前的經(jīng)翻譯的語音的持續(xù)時間,并且當(dāng)該語音被翻譯成所有語言時輸出經(jīng)翻譯的 語音。經(jīng)翻譯的語音是通過翻譯接收到的語音并且對結(jié)果語音進(jìn)行語音合成生成的語音。語
音持續(xù)時間是接收到的語音或者從語音翻譯設(shè)備輸出的經(jīng)翻譯的語音的持續(xù)時間。為了定 義語音持續(xù)時間的開始點(diǎn)和結(jié)束點(diǎn),例如,使用從語音翻譯設(shè)備開始工作后經(jīng)過的時間。 另外,語音翻譯設(shè)備可以被配置成使用格林尼治標(biāo)準(zhǔn)時間(Greenwich Mean Time)。語音持續(xù)時間由[x,y)表示,它意味著x是開始點(diǎn)且y是結(jié)束點(diǎn)。符號"["意味著x 處于即刻被包括在語音持續(xù)時間之后,而符號")"意味著y處于即刻不被包括在語音持 續(xù)時間之前。與語音持續(xù)時間相對存在非語音持續(xù)時間,該非語音持續(xù)時間是由語音翻譯設(shè)備接收 的在聲音上不翻譯的語音的持續(xù)時間。非語音持續(xù)時間通常包括靜音或噪音。在由語音翻譯設(shè)備接收到的聲音中,用于語音翻譯的語音持續(xù)時間可以被稱為輸入語 音持續(xù)時間,而經(jīng)翻譯的語音的語音持續(xù)時間被稱為輸出語音持續(xù)時間。所接收的語音可以被稱為源語音和輸出語音的源語音。使用這些術(shù)語是因為輸出語音 可以包括所接收的沒有為使用與發(fā)言者發(fā)言時使用的語言相同的語言的參與者翻譯的語 音。因此,輸出語音包括經(jīng)翻譯的語音和源語音。如圖1中所示,會議系統(tǒng)包括語音翻譯設(shè)備100和多個通過網(wǎng)絡(luò)300連接的終端200a、 200b和200z (每一個也被稱為終端200)。終端200被提供給每個參與者。該終端接收源語音并且輸出經(jīng)翻譯的語音。網(wǎng)絡(luò)300 可以是能夠傳輸語音數(shù)據(jù)的電話線、互聯(lián)網(wǎng)、無線網(wǎng)絡(luò)等中的任何一種設(shè)施。根據(jù)第一實施例的語音翻譯處理略述如下。為電話會議中的參與者消除時滯以及消除 經(jīng)翻譯的語音與運(yùn)動圖像之間的時滯是第一實施例的一個目標(biāo)。這樣的現(xiàn)象發(fā)生在以下情形(1)有三個或更多個參與者,(2)其中至少一個參與者 講不同的語言,(3)由于語言上的限制和輸出使翻譯引起延遲,和(4)只能通過語音翻 譯設(shè)備100聽到參與者的語音。例如,有三個參與者,并且其中一個講不同的語言。講語言A的參與者被稱為Al和 A2,而講不同語言B的參與者被稱為Bl。當(dāng)Al通過終端200a講話時,他/她的語音被通 過網(wǎng)絡(luò)300發(fā)送到語音翻譯設(shè)備100。雖然不需要翻譯,該語音也不是立即傳輸給A2而是存儲一段時間。將要傳輸給B1的 語音被翻譯并且轉(zhuǎn)換到語言B的語音。完成轉(zhuǎn)換后,源語音被傳輸給A2而經(jīng)翻譯的語音 被傳輸給B1。同樣的方法被應(yīng)用于所有參與者都講不同的語言的場合。例如,三個參與者Al、 Bl 和Cl講三種不同的語言A、 B和C。當(dāng)參與者Al通過終端200a講話時,語音翻譯設(shè)備100 接收該語音并且將其翻譯成語言B和C。然而,該轉(zhuǎn)換并不是同時完成的。所以,語音翻 譯設(shè)備100在其中存儲經(jīng)翻譯的語音,直到另一個轉(zhuǎn)換也完成,并且當(dāng)來自同一個源語音 的所有經(jīng)翻譯的語音都準(zhǔn)備好時輸出經(jīng)翻譯的語音。如上文所述,即使一種語音可以輸出給一個參與者,該語音在為所有的參與者輸出的 語音都準(zhǔn)備好之前并不被輸出。以這種方式,向每個參與者輸出語音的時滯被最小化,從 而使參與者可以跟上會議的節(jié)奏。如圖2中所示,終端200包括語音接收單元201,發(fā)送單元202,第一接收單元203 和語音輸出單元204。語音接收單元201將所接收的語音轉(zhuǎn)換到電信號,該電信號也被稱為語音數(shù)據(jù),并且 將該語音數(shù)據(jù)傳遞到發(fā)送單元202。下文中,語音數(shù)據(jù)被簡稱為語音。語音接收單元201 可以是公用的話筒等。發(fā)送單元202將由語音接收單元201接收到的語音發(fā)送到語音翻譯設(shè)備100。第一接 收單元203從語音翻譯設(shè)備100接收由語音翻譯設(shè)備100生成的經(jīng)翻譯的語音或源語音。語音輸出單元204輸出第一接收單元203接收的語音,并且該語音輸出單元204可以 是公用的擴(kuò)音器等。語音接收單元201和語音輸出單元204可以被集成,如電話機(jī)或頭戴 式耳機(jī)等。如圖3中所示,語音翻譯設(shè)備100包括語音存儲單元110,對應(yīng)存儲單元120,接收 單元130,生成單元140,輸出控制單元150和發(fā)送單元160。語音存儲單元110在其中相關(guān)于每種語言存儲從終端200接收到的語音。語音存儲單 元110包括相關(guān)于每種語言存儲語音的子存儲單元,諸如語言l存儲單元lll,語言2存 儲單元112,……,和語言n存儲單元lln。對應(yīng)存儲單元120在其中存儲與終端200使用的語言相關(guān)聯(lián)的每個終端200的信息。 對應(yīng)存儲單元120在其中存儲將唯一標(biāo)識終端的標(biāo)識符與該終端200中使用的語言相關(guān)聯(lián) 的映射表121。映射表121包括標(biāo)識符和當(dāng)終端200通過網(wǎng)絡(luò)300連接到語音翻譯設(shè)備100時從該終 端200發(fā)送的語言。語音存儲單元110和對應(yīng)存儲單元120可以是任何公用的記錄介質(zhì),諸如硬盤驅(qū)動器 (HDD)、光盤、存儲卡或隨機(jī)存取存儲器(RAM)等。 接收單元130通過網(wǎng)絡(luò)300接收來自終端200的語音。接收單元130接收伴隨語音的 終端200的標(biāo)識符。接收單元130將語音和標(biāo)識符傳遞到生成單元140和輸出控制單元150。 語音被傳遞到輸出控制單元150是因為如果終端200使用與源語音相同的語言則實際上被 發(fā)送到原來的終端200。生成單元140進(jìn)行語音翻譯設(shè)備100使用的所有語言之間的語音翻譯。例如,如果語 音翻譯設(shè)備100使用日語、英語和中文,則在日語和英語之間、英語和中文之間以及中文 和日語之間進(jìn)行翻譯。生成單元140通過進(jìn)行語音識別處理、機(jī)器翻譯處理和語音合成處理生成經(jīng)翻譯的語 音。語音識別處理包括識別所接收的語音并且將其轉(zhuǎn)換成字符串。機(jī)器翻譯處理包括將所 述字符串翻譯成目標(biāo)語言。語音合成處理包括通過合成已翻譯成目標(biāo)語言的字符串生成經(jīng) 翻譯的語音。語音識別處理可以采用任何利用縱向均等檢驗、隱馬爾科夫模型(H羅)、動態(tài)規(guī)劃、 神經(jīng)網(wǎng)絡(luò)、N-gram語言模型等的語音識別技術(shù)。機(jī)器翻譯處理可以采用任何翻譯技術(shù),諸如轉(zhuǎn)移法,基于實例的翻譯、基于統(tǒng)計的翻 譯或跨語言法等。語音合成處理可以采用任何語音合成技術(shù),諸如語音分段編輯合成、構(gòu)形成分合成、 基于語音主體的合成或者文字轉(zhuǎn)語音合成等。生成單元140將經(jīng)翻譯的語音與關(guān)于輸入語音持續(xù)時間的信息相關(guān)聯(lián)并且輸出該語 音。生成單元140使用任何常規(guī)技術(shù)探測語音持續(xù)時間,諸如一種以比預(yù)定的閾值相對更 長的時間探測聲音的持續(xù)時間確定為語音持續(xù)時間的技術(shù)。如圖4中所示,從生成單元140輸出的信息包括指示接收源語音的終端的標(biāo)識符的接 收終端號,輸入語音持續(xù)時間,輸出語音持續(xù)時間號,輸出語音和語言信息。接收終端號與語音一起從接收單元130接收,并且被設(shè)定為如被接收的信息。輸出語 音持續(xù)時間號是識別將要輸出的經(jīng)翻譯的語音的語音持續(xù)時間的號碼,并且相關(guān)于每種語 言和每個接收終端號使用連續(xù)的號碼。圖4中所示的輸出語音顯示了輸出語音的數(shù)據(jù),被示意性地表示為波形。語言信息用 于識別翻譯的目標(biāo)語言。圖4中語言信息由數(shù)字表示;然而,也可以由諸如英語的語言名 稱表示。下面解釋輸入語音持續(xù)時間和輸出語音持續(xù)時間之間的關(guān)系。作為一般規(guī)則,生成單
元140生成與源語音相同長度的經(jīng)翻譯的語音。這并不意味著每個輸入語音持續(xù)時間必須 與對應(yīng)的輸出語音持續(xù)時間匹配。換句話說,多個輸入語音持續(xù)時間只需要與對應(yīng)于輸入 語音持續(xù)時間的經(jīng)翻譯的語音的持續(xù)時間匹配。因此,作為翻譯成某種語言的源的輸入語音持續(xù)時間的長度可以與作為翻譯成另一種 語言的源的輸入語音持續(xù)時間的長度不同。然而,輸入語音持續(xù)時間需要在對所有語言共 同的一些點(diǎn)處被劃界。圖5是顯示被劃界成每個語音持續(xù)時間的每種語言的語音的實例的說明圖。n是正整 數(shù)的橫軸上的符號tn表示語音持續(xù)時間開始的時間點(diǎn),圓括號中的數(shù)字表示用每種語言輸 出該輸出語音持續(xù)時間的順序,N表示所使用的語言總數(shù)。在圖5中,雖然語言1的第二輸出語音持續(xù)時間和語言2的第四輸出語音持續(xù)時間在 同一個開始點(diǎn)t2開始,但它們結(jié)束于不同的結(jié)束點(diǎn)(t3, t4)。另一方面,也總是存在同一 結(jié)束點(diǎn)結(jié)束的語音持續(xù)時間,如語言1的第三語音持續(xù)時間和語言2的第三語音持續(xù)時間。例如,因為使用同一個源語音,說話者說話的源語音的語音持續(xù)時間對于所有目標(biāo)語 言是共同的。因此,至少語音的開始點(diǎn)和語音的結(jié)束點(diǎn)對于所有的目標(biāo)語言是共同的。此 外,結(jié)束點(diǎn)可以例如在可以插入標(biāo)點(diǎn)符號的點(diǎn)上是共同的。生成單元140實際上未經(jīng)處理將非語音持續(xù)時間發(fā)送到輸出控制單元150。生成單元 140向非語音持續(xù)時間賦上一個持續(xù)時間號,在下面的處理中除非另有其他規(guī)定,非語音 持續(xù)時間并不與通過語音翻譯生成的語音相區(qū)別。如果非語音持續(xù)時間相對較長,則生成 單元140將其分割成足夠小的持續(xù)時間,并且向每個持續(xù)時間賦上號碼,從而使該非語音 持續(xù)時間可以被盡早輸出。如上文所述,生成單元140生成在一定的持續(xù)時間與所接收的語音相同長度的經(jīng)翻譯 的語音。沒有這個條件, 一個終端200完成經(jīng)翻譯的語音的輸出而另一個終端200還在輸 出經(jīng)翻譯的語音。一定的持續(xù)時間并不必是固定的持續(xù)時間;可以是單個語音持續(xù)時間,或者是語音多 個語音持續(xù)時間的集合。為了滿足該條件,生成單元140在合成經(jīng)翻譯的語音時調(diào)整語音的長度。更加具體地, 生成單元140控制經(jīng)合成的語音的速度從而使不同語言的經(jīng)翻譯的語音的持續(xù)時間相等。生成單元140可以被配置成通過在語音的前后插入靜音來調(diào)整語音的長度。例如,如 果經(jīng)合成的語音較短,則生成單元140在語音前后至少一處插入靜音。如果經(jīng)合成的語音
較長,則生成單元140在輸入語音持續(xù)時間中包括一些非語音持續(xù)時間來延長源語音的持續(xù)時間,從而使不同語言的經(jīng)翻譯的語音可以具有相同的長度。輸出控制單元150控制輸出語音的時間,并且包括確定單元151和輸出處理單元152。 當(dāng)生成單元140生成有關(guān)經(jīng)翻譯的語音的信息時,確定單元151確定是否已經(jīng)用所有的語言生成每個語音持續(xù)時間中的經(jīng)翻譯的語音,由此確定是否可以輸出經(jīng)翻譯的語音。由確定單元151進(jìn)行的確定處理將在后文解釋。輸出處理單元152輸出經(jīng)翻譯的語音和對應(yīng)于用所有的語言生成經(jīng)翻譯的語音的語音持續(xù)時間的源語音。發(fā)送單元160將從輸出處理單元152輸出的語音發(fā)送到終端200,并且包括終端確定 單元161。終端確定單元161通過參考映射表121確定將每種語言的語音發(fā)往哪個終端200。更 加具體地,終端確定單元161從映射表121中獲取對應(yīng)于每種語言的終端200的標(biāo)識符, 并且將對應(yīng)于所獲取的標(biāo)識符的終端200確定為目的地。下文將參考圖6解釋由根據(jù)第一實施例的語音翻譯設(shè)備100進(jìn)行的語音翻譯處理。雖然圖6顯示單個終端200和語音翻譯設(shè)備100之間的語音傳輸,但該處理實際上在 多個終端200和語音翻譯設(shè)備100之間進(jìn)行。終端200中的語音接收單元201接收源語音(步驟S601)。發(fā)送單元202將源語音發(fā) 送到語音翻譯設(shè)備IOO (步驟S602)。語音翻譯設(shè)備100中的接收單元130接收源語音(步驟S603)。生成單元140翻譯所 接收的源語音并且生成經(jīng)翻譯的語音(步驟S604)。輸出控制單元150確定從源語音翻譯的語音的輸出時間,并且進(jìn)行語音輸出處理輸出 可以被輸出的語音(步驟S605)。語音輸出處理將在下文中詳細(xì)解釋。終端確定單元161通過參考映射表121確定每種語言的經(jīng)翻譯的語音發(fā)往的終端200 (步驟S606)。在圖6中,假設(shè)將要輸出的語音持續(xù)時間在語音輸出處理期間被探測。然而,如果可以輸出的語音持續(xù)時間不存在,則不進(jìn)行步驟606及其后的步驟。發(fā)送單元160將可以輸出的語音發(fā)送到每個終端200 (步驟S607)。 終端200中的第一接收單元203接收來自語音翻譯設(shè)備100的語音(步驟S608),并且語音輸出單元204輸出所接收的語音(步驟S609)。 如上文所述,終端200將所有的源語音發(fā)送到語音翻譯設(shè)備100,接收將要以由語音 翻譯設(shè)備100調(diào)整的輸出時間輸出的語音,并且輸出被調(diào)整的語音。因此,能夠以較小的 時滯從每個終端200輸出同一個源語音的經(jīng)翻譯的語音。下文參考圖7細(xì)化步驟S605的語音輸出處理。輸出處理單元152將從生成單元140輸出的語音存儲在語音存儲單元110中。如果語 音存儲單元110已經(jīng)在其中存儲了另一個語音,則在其中存儲包括現(xiàn)存的語音和從生成單 元140輸出的語音的混合的混合語音(步驟S701),因為語音翻譯設(shè)備IOO可以同時接收 來自多個終端200的語音。換句話說,如果在對應(yīng)于輸出語音的語音持續(xù)時間期間語音存儲單元110中沒有任何 語音,則輸出處理單元152輸出實際語音。如果在該語音持續(xù)時間期間語音存儲單元110 中包括任何語音,則輸出處理單元152獲取該語音,生成混合的語音,并且將該混合的語 音作為對應(yīng)于該語音持續(xù)時間的語音存儲。當(dāng)輸出語音既包括沒有任何語音的語音持續(xù)時間又包括有任何語音的語音持續(xù)時間 時,輸出處理單元152確定沒有語音的語音持續(xù)時間為靜音。輸出處理單元152參考從生成單元140輸出的信息中的語言信息并且將該語音存儲在 對應(yīng)的存儲單元lln中。輸出處理單元152進(jìn)行確定處理來確定可以輸出的語音持續(xù)時間(步驟S702)。確定 處理將在后文詳細(xì)描述。輸出處理單元152確定是否存在另一個可以輸出的語音持續(xù)時間(步驟S703)。如果 這樣的語音持續(xù)時間不存在(步驟S703為"否"),則輸出處理單元152終止語音輸出處 理。如果這樣的語音持續(xù)時間存在(步驟S703為"是"),則輸出處理單元152計算可以 輸出的最短持續(xù)時間(步驟S704)。換句話說,如果語音翻譯設(shè)備100同時接收來自多個 終端200的語音并且存在多個對應(yīng)的輸出語音,則輸出處理單元152計算輸出語音持續(xù)時 間,從而用所有語言的輸出語音已經(jīng)準(zhǔn)備好的持續(xù)時間被首先輸出。下文將參考圖8解釋計算最短持續(xù)時間的處理。陰影區(qū)域表示輸出語音持續(xù)時間,輸 出語音持續(xù)時間中的數(shù)字表示輸出語音持續(xù)時間號。圖5與圖8不同,因為圖5中的陰影 區(qū)域表示輸入語音持續(xù)時間。由于終端200的用戶在不同時刻說話,因此輸出語音持續(xù)時間很少匹配。因此,可以 在語音持續(xù)時間中間插入延遲。然而,除了在劃界點(diǎn)之外不在任何非語音持續(xù)時間中插入 延遲,除非兩個或多個人同時說話,因為在非語音持續(xù)時間上不進(jìn)行翻譯處理并且由于翻 譯處理引起的延遲不會發(fā)生。因此,在這種情形下,輸出語音不暫停。這里假設(shè)為所有終端200輸出輸出語音持續(xù)時間號1的輸出語音。輸出處理單元152 計算首先結(jié)束的輸出語音的語音持續(xù)時間來確定最短持續(xù)時間。在圖8中,輸出處理單元 152計算t。和L之間的持續(xù)時間作為最短持續(xù)時間。如果然后輸出終端200c的輸出語音持續(xù)時間號2的輸出語音,則最舊的結(jié)束點(diǎn)還是 t,,并且最短持續(xù)時間不變。如下文所述,在這種情形下確定可以輸出的最短持續(xù)時間不 存在,并且在這一個點(diǎn)上沒有最新輸出語音。如果然后輸出終端200b的輸出語音持續(xù)時間號2的輸出語音,則在這一個點(diǎn)上的最 舊的結(jié)束點(diǎn)是t2, t2之前的持續(xù)時間被計算為最短持續(xù)時間。在步驟S704中計算最短持續(xù)時間之后,輸出處理單元152確定是否存在可以輸出的 最短持續(xù)時間(步驟S705)。如果這樣的最短持續(xù)時間不存在(步驟S705為"否"),則輸 出處理單元終止語音輸出處理。如果這樣的最短持續(xù)時間存在(步驟S705為"是"),則輸出處理單元152從語音存 儲單元110中獲取對應(yīng)于該最短持續(xù)時間的語音并且將其輸出(步驟S706)。以這種方式,輸出語音能夠以從為所有終端200生成輸出語音的持續(xù)時間開始的順序 輸出。如果在等待所有終端200的語音時語音的輸出延遲,則在延遲期間沒有任何語音輸 出。代替沒有語音輸出,靜音數(shù)據(jù)可以被添加到將要輸出的語音數(shù)據(jù)中。與之相反,如果 在當(dāng)前語音輸出期間生成下一個將要輸出的另一個語音,則在當(dāng)前語音輸出完成后輸出該 另一個語音。下文將參考圖9細(xì)化步驟S703的確定處理。確定單元151選擇一個目標(biāo)語言(下文中稱為"語音i")(步驟S901)。確定單元151 獲取將要以語言i輸出的語音持續(xù)時間(下文中稱為"持續(xù)時間Sni")(步驟S902)。例如,如果圖5中所示的語音被存儲在語音存儲單元110中并且語言2中輸出順序1 和2的語音持續(xù)時間己經(jīng)被輸出,則下一步將輸出t3和t5之間的語音持續(xù)時間。確定單元151選擇另一種語言j (步驟S903),并且對所有目標(biāo)語言重復(fù)到步驟S908 的處理。確定單元151確定對應(yīng)于Sni的語音是否己經(jīng)被翻譯成語言j (步驟S904)。如果還
沒被翻譯(步驟S904為"否"),則確定單元151終止確定處理。如果已經(jīng)被翻譯(步驟S904為"是"),則確定單元151從下一個將要輸出的持續(xù)時 間到與Sni重疊的持續(xù)時間獲取語言j的語音持續(xù)時間的輸出語音持續(xù)時間號。所獲取的 輸出語音持續(xù)時間號被稱為組X (步驟S905)。如果在語言j中重疊在Sni上的語音持續(xù)時間之前有任何將要輸出的語音持續(xù)時間, 則進(jìn)行步驟S905確定對于每個將要輸出的語音持續(xù)時間是否已經(jīng)生成其他語言的經(jīng)翻譯 的語音。以這種方式,即使重疊在Sni上的語音持續(xù)時間已經(jīng)被翻譯,該語音持續(xù)時間也 不能被輸出,除非將要在此之前輸出的語音持續(xù)時間已被翻譯。確定單元151從組X中獲取一個持續(xù)時間號,并且獲取對應(yīng)于所獲取的持續(xù)時間號的 語音持續(xù)時間Sj (步驟S906)。確定單元151確定對應(yīng)于Sj的持續(xù)時間是否已經(jīng)被翻譯 成所有其他語言(步驟S907)。如果該持續(xù)時間還未被翻譯成任何語言(步驟S907為"否"),則確定單元151終止 確定處理,因為翻譯還未用所有語言完成。如果持續(xù)時間已經(jīng)被翻譯成所有語言(步驟S907 為"是"),則確定單元151確定是否所有的持續(xù)時間號已經(jīng)被處理(步驟S908)。如果不是所有的持續(xù)時間號已經(jīng)被處理(步驟S908為"否"),則確定單元151獲取 另一個持續(xù)時間號并且重復(fù)該處理(步驟S906)。如果所有持續(xù)時間號己經(jīng)被處理(步驟 S908為"是"),則確定處理部151確定除了語言i之外是否所有的語言已經(jīng)被處理(步驟 S909)。如果除了語言i之外不是所有的語言已經(jīng)被處理(步驟S909為"否"),則確定單元 151獲取作為語言j的另一種語言并且重復(fù)該處理(步驟S903)。如果除了語言i之外所有的語言已經(jīng)被處理(步驟S909為"是"),則確定單元151 確定是否所有的目標(biāo)語言已經(jīng)被處理(步驟S910)。如果不是所有的目標(biāo)語言已經(jīng)被處理 (步驟S910為"否"),則確定單元151獲取作為語言i的另一種目標(biāo)語言并且重復(fù)該處 理(步驟S901)。如果所有的目標(biāo)語言已經(jīng)被處理(步驟S910為"是"),則確定單元151對于所有目 標(biāo)語言輸出可以輸出的語音持續(xù)時間的持續(xù)時間號(步驟S911),并且終止確定處理。 下文將參考圖10 — 14解釋確定處理的一個實例。所述實例中,由終端200接收到的語音是日語,輸出經(jīng)翻譯的語音的終端200分別使 用日語和英語。日語是語言l,英語是語言2。終端200接收到意思是"東京車站在哪里"
的日語語音。輸入日語語音被輸入到輸出控制單元150和生成單元140。當(dāng)輸出控制單元150接收 到輸入語音時,語音存儲單元110如圖11中所示在其中存儲輸出語音,其中Ud是輸入語 音的持續(xù)時間的結(jié)束點(diǎn)時間。雖然只在圖11中顯示單個持續(xù)時間,但假設(shè)該語音被劃分成足夠小的多個持續(xù)時間 來進(jìn)行確定處理。所述足夠小的持續(xù)時間是例如一個被采樣語音的單個樣本的持續(xù)時間。 如果語音是以llkhz采樣的,則該持續(xù)時間是每秒11000周的持續(xù)時間。相關(guān)聯(lián)的多個持 續(xù)時間可以在生成單元140輸出語音持續(xù)時間信息的時間點(diǎn)進(jìn)行組合。每次翻譯語音和生成經(jīng)合成的語音時生成單元140都將經(jīng)翻譯的語音輸出到輸出控制 單元150。這里假設(shè)經(jīng)翻譯的英語語音"where is (在哪里)"首先從生成單元140輸出。因為用于生成"where is (在哪里)"的輸入語音持續(xù)時間也被輸出,輸出處理單元 152將"where is (在哪里)"存儲在對應(yīng)于該輸入語音持續(xù)時間的持續(xù)時間中。該狀態(tài)下 語音存儲單元110的內(nèi)容如圖12中所示。雖然日語持續(xù)時間可以在被劃分成更小的持續(xù)時間時進(jìn)行處理,但它們被組合以與賦 有序號的英語持續(xù)時間相匹配。日語持續(xù)時間足夠小以被組合成與英語持續(xù)時間相同的持 續(xù)時間而沒有持續(xù)時間的開始點(diǎn)和結(jié)束點(diǎn)的不匹配。在這種狀態(tài)下,如圖9中所示,基于i二l,也就是在日語中(語言l)進(jìn)行確定處理。 下面利用圖10中顯示的偽代碼來解釋確定處理。偽代碼對應(yīng)于圖9中所示的步驟S903到 S909。因為使用日語和英語,等式LH1,2)成立。L是翻譯處理中用到的所有語言的序號的 集合。第一行表示對所有除了 i之外的L重復(fù)從第二行到第十二行的處理。在這個實例中,只對j是2進(jìn)行處理。第二行中,用重疊在語言1的持續(xù)時間上的語 言2 (英語)的持續(xù)時間的持續(xù)時間號替代X。在該情況中,X={},也即,X是空。第三行中,用X中包括的號碼的持續(xù)時間替代T, T是空。在第四行中,持續(xù)時間X廣 和T的交集(intersection)也是空,它不等于持續(xù)時間X,xt,條件陳述滿足。作為結(jié)果, 執(zhí)行第五行,確定單元151確定不可以輸出語音,確定處理終止。另一個經(jīng)翻譯的英語語音"Tokyo station (東京車站)"從生成單元140輸出。該狀 態(tài)下語音存儲單元110的內(nèi)容如圖13中所示。再次對語言1進(jìn)行確定處理。偽代碼的第一行與前文描述的相同。在第二行中,因為有重疊在語言1的持續(xù)時間上的語言2的持續(xù)時間的持續(xù)時間號2, 等式X^2)成立。在第三行中,用持續(xù)時間[t。,t,)代替T。因為i是1,語言1中下一步將要被輸出的 持續(xù)時間X""表示為X,、1。其意思是第一語音持續(xù)時間(i-l)將在下一步輸出,因為 語言1中還沒有輸出任何語音。因為語言1中第一持續(xù)時間S/包括持續(xù)時間[t。,tJ,第四行被確定為假,并且處理 移至第六行。在第六行中獲取X中的數(shù)的最大值,這里X,等于2。當(dāng)在第七行中X被更新時,根據(jù)x/"、 x廣"=1,滿足Kx《2的唯一整數(shù)是2。因此,等式x二m成立。第八行表示對于X中的所有數(shù)重復(fù)第九行到第十二行的處理。在這個實例中,只對x=2 進(jìn)行該處理。第九行表示對于除了語言j之外的所有語言重復(fù)第十行到第十二行的處理。在本例中, 只對1<=1進(jìn)行處理。第十行中,用語言k的所有持續(xù)時間代替T, T包括持續(xù)時間[t。, Ua)。第十一行中,確定語言j的第x持續(xù)時間是否己經(jīng)被T的持續(xù)時間填滿。因為j等于 2并且x等于2,等式S,、S2^ [t。, tO成立。另一方面,因為T的持續(xù)時間是[t。, tend), 該持續(xù)時間包括持續(xù)時間[t。, t,)。因此,第十一行的條件不滿足。為了完成所有循環(huán),處理移至第十三行并且返回真值。由于已經(jīng)對i=l,也即對語言 l進(jìn)行確定處理,將對語言2進(jìn)行同樣的處理。雖然這里省略解釋,但仍確定翻譯成語言2的語音能夠輸出,也即返回真值,并且確 定單元151在圖9中所示的步驟S911中輸出可以用所有目標(biāo)語言輸出的語音持續(xù)時間的 持續(xù)時間號。此外,輸出處理單元152在步驟S705中確定存在可以輸出的持續(xù)時間,并 且在圖7中所示的步驟S706中輸出對應(yīng)的語音。在這個實例中,日語的第一持續(xù)時間被輸出到使用日語的終端200,英語的第一持續(xù) 時間被輸出到使用英語的終端200。下一個將要輸出的持續(xù)時間是日語和英語的第二持續(xù)時間,它們由x,"=2和xr"=2 表示。在該狀態(tài)中,進(jìn)一步重復(fù)確定處理。為了開始該狀態(tài)中的確定處理,i等于l,偽代碼的第一行是f2。第二行是X二U), 第三行中T是[t,.tw)。因為第四行中的條件不滿足,處理移至第六行,其中等式xmax= 1 成立。當(dāng)X在第七行中被更新時,因為沒有滿足條件2〈x《2的整數(shù),等式X二G成立。因此,不進(jìn)行從第八行到第十二行的處理。處理移至第十三行,并且返回真值。下面, i增加l,對1=2,也即對語言2進(jìn)行相同的處理。雖然這里省略了解釋,但仍確定翻譯成語言2的語音能夠輸出,并且確定單元151在 圖9中所示的步驟S911中輸出可以用所有目標(biāo)語言輸出的語音持續(xù)時間的持續(xù)時間號, 也即,日語和英語的第二持續(xù)時間的持續(xù)時間號。如果是在圖14中所示的情形,則要求第七到第十二行的偽代碼。第一持續(xù)時間將在 下一步在語言1和2中輸出,并且在i=l的情形下進(jìn)行偽代碼。第一行是」'=2,并且第二行是X二(3h在第三行中,T是[t2,tJ。因為第四行中的條 件不滿足,處理移至第六行,其中等式x自4成立。在第七行中,X被更新為(2,3h在第八行中,X等于2,并且在第九行中k等于l。 在第十行中,T的持續(xù)時間是[t。,t,]和[t2,Ud)。根據(jù)S22 = [ ti, t2),第十一行中的條件 滿足。進(jìn)行第十二行并且返回假值。換句話說,確定沒有語音持續(xù)時間可以輸出,并且處 理終止。如果不進(jìn)行第七到第十二行中的處理,則在圖14中所示的狀態(tài)中確定將要在語言1 和2中輸出持續(xù)時間號1。然而,如果輸出語言1的持續(xù)時間[tLt2)之前的等待時間比輸 出每種語言的第一持續(xù)時間之前的等待時間更長,則語言1的用戶不得不在聽[t2,Ud)的內(nèi) 容的同時等待,而語言2的用戶不得不在聽[t。,t》的內(nèi)容的同時等待。以這樣的方式,不能延遲語音的輸出,盡量在同一時刻向用戶提供相同的內(nèi)容。第七 到十二行中的處理被要求進(jìn)行適當(dāng)?shù)难舆t。下文將參考圖5解釋不同狀態(tài)中的確定處理。這里假設(shè)經(jīng)翻譯的語音以語言1和2輸 出,并且每種語言只生成第一語音持續(xù)時間。換句話說,翻譯成語言l的持續(xù)時間[t。,t2] 的輸出語音已經(jīng)生成,翻譯成語言2的持續(xù)時間[t。,t,)的輸出語音也己經(jīng)生成。在這個實例中,偽代碼中i是1且j是2。第二行是X二 {1},因為S,仏S,1 = SJ是滿 足的并且X是非空。在第三行中,T是S,2 = [ t。, t》。因此,第四行中的條件陳述是真, 并且因為第五行中的條件不滿足返回假。以這樣的方式,因為語言2的第二語音持續(xù)時間還未生成,語言l的第二語音持續(xù)時 間不被輸出。如果沒有開始點(diǎn)和結(jié)束點(diǎn)在不同語言中都匹配的持續(xù)時間,則沒有任何語音持續(xù)時間
可以被輸出。然而,因為對于所有語言至少有一個語音在同一點(diǎn)開始和結(jié)束,這樣的情形 不會發(fā)生。如上文所述,根據(jù)第一實施例的語音翻譯設(shè)備100在其中存儲經(jīng)翻譯的語音,直到源 語音被翻譯成所有的語言,并且當(dāng)用所有的語言生成經(jīng)翻譯的語音時輸出該經(jīng)翻譯的語 音。以這種方式,向參與者輸出的語音的時滯可以被最小化。根據(jù)第一實施例,所有從生成單元140輸出的語音與語音存儲單元110中的語音混合。 在這種情形下,經(jīng)混合的語音被輸出到說話的參與者的終端200,因此可能存在回聲^L象, 他/她自己的語音在輸出時帶有延遲。因為在演講期間聽到他/她自己的聲音,講話者會感 到說話很笨拙。根據(jù)第二實施例的語音翻譯設(shè)備1500不向接收源語音的終端發(fā)送語音,由此防止了 源語音被發(fā)送給該語音的說話者。如圖15中所示,語音翻譯設(shè)備1500包括語音存儲單元1510,對應(yīng)存儲單元120,接 收單元130,生成單元140,輸出控制單元1550和發(fā)送單元1560。語音存儲單元1510中的數(shù)據(jù)結(jié)構(gòu),輸出控制單元1550的功能和發(fā)送單元1560的功 能與第一實施例不同。因為其他單元的結(jié)構(gòu)和功能與根據(jù)第一實施例的語音翻譯設(shè)備100 相同,因此使用與圖3中相同的參考數(shù)字,并且省略對它們的解釋。語音存儲單元1510包括在其中存儲對應(yīng)終端200的語音的終端N存儲單元151n,其 中N和n是自然數(shù)。終端N存儲單元151n在其中存儲所有語言的輸出語音。輸出控制單元1550包括確定單元151和輸出處理單元1552。輸出處理單元1552的功 能與根據(jù)第一實施例的輸出處理單元152不同。輸出處理單元1552從所接收的來自生成單元140的信息中提取發(fā)送源語音的終端200 的接收終端號,并且獲取目標(biāo)語言。然后輸出處理單元1552將輸出語音存儲在對應(yīng)于接 收終端號的終端N存儲單元151n中的對應(yīng)于所獲取的語言的語言n存儲單元lln中。與第一實施例不同,當(dāng)輸出處理單元1552在語音存儲單元1510中存儲語音時不混合 語音。當(dāng)被確定可以輸出時,語音存儲單元1510中的語音被輸出到發(fā)送單元1560,并且 在發(fā)送單元1560中混合后被發(fā)送到每個終端200。發(fā)送單元1560在將語音發(fā)送到終端200之前先混合語音,并且包括終端確定單元161 和混合單元1562。終端確定單元161的功能如第一實施例中所述,這里省略對它的解釋。混合單元1562在將從語音被發(fā)往的終端200 (下文中稱"目的終端200")接收到的 語音刪除后混合從終端確定單元161接收到的語音,并且輸出經(jīng)混合的語音?;旌蠁卧?562通過將來自終端確定單元161的接收終端號與目的終端200的標(biāo)識符進(jìn)行比較確定將要輸出的語音是否是原先從目的終端200發(fā)出的語音。下文參考圖16解釋由根據(jù)第二實施例的語音翻譯設(shè)備1500進(jìn)行的語音翻譯處理。 步驟S1601到S1604與圖6中所示的步驟S601到S604相同,因此省略對它們的解釋。 在步驟S1605,輸出控制單元1550進(jìn)行語音輸出處理,該處理將在后文詳細(xì)描述。 在語音輸出處理后,終端確定單元161通過參考映射表121確定每種語言的經(jīng)翻譯的語音被發(fā)往的終端200 (步驟S1606)。這是與圖6中所示的步驟S606相同的處理?;旌蠁卧?562混合將要發(fā)送的語音(步驟S1607)。換句話說,混合單元1562從對應(yīng)于目的終端200中使用的語言的語言n存儲單元lln中獲取目標(biāo)語言的輸出語音,并且如果獲取多個語音,則混合單元1562混合這些語音。在混合語音前,混合單元1562刪除原先從目的終端200發(fā)送的語音,并且發(fā)送經(jīng)混合的語音。步驟S1608到S1610與圖6中所示的步驟S607到S609相同,因此省略對它們的解釋。 下文參考圖17細(xì)化步驟S1605的語音輸出處理。輸出處理單元1552選擇對應(yīng)于接收源語音的終端200的終端N存儲單元151n,并且 選擇對應(yīng)于從接收單元130或生成單元140接收到的語音的語言的語言n存儲單元lln(步 驟S1701)。輸出處理單元1552將輸出語音存儲在所選擇的終端N存儲單元151n中(步驟 S1702)。根據(jù)第二實施例,此時語音不被混合。步驟S1703到S1707與圖7中所示的步驟S702到S706相同,因此省略對它們的解釋。如上文所述,根據(jù)第二實施例的語音翻譯設(shè)備1500不將語音發(fā)送到接收源語音的終 端200,由此防止回聲現(xiàn)象。根據(jù)第三實施例的語音翻譯設(shè)備2000通過在翻譯處理和將語音信息存儲在終端200 中之后立即將經(jīng)翻譯的語音發(fā)送到終端200來規(guī)避由于網(wǎng)絡(luò)故障引起的延遲。如圖18中所示,終端1800包括語音接收單元201,發(fā)送單元202,第一接收單元203, 語音輸出單元204,保存單元1805,第二接收單元1806,輸出處理單元1807和語音存儲 單元1810。終端1800與根據(jù)第一實施例的終端200的不同之處在于增加了保存單元1805、第二 接收單元1806、輸出處理單元1807和語音存儲單元1810。因為其他單元的結(jié)構(gòu)和功能與 根據(jù)第一實施例的終端200相同,因此使用與圖2中所示相同的參考數(shù)字,并且省略對它
們的解釋。語音存儲單元1810包括對應(yīng)于語音存儲單元1810中使用的語言的語言n存儲單元1 In 中的一個單元。換句話說,在其中存儲語音的存儲單元被包括在終端1800中。保存單元1805將從語音翻譯設(shè)備2000發(fā)送到第一接收單元203的語音存儲在語音存 儲單元1810中。如圖19中所示,語音翻譯設(shè)備2000發(fā)送彼此相關(guān)聯(lián)的接收終端號、輸 出語音持續(xù)時間號和輸出語音,并且第一接收單元203接收這些信息。如果第一接收單元203接收一個包括重疊的語音持續(xù)時間的語音,則保存單元1805 生成經(jīng)混合的語音并且將其存儲在語音存儲單元1810中,因為所接收的語音的源語音可 能已經(jīng)由多個終端1800同時接收。保存單元1805也在接收語音時生成圖8中所示的用于 計算最短持續(xù)時間的信息并且將其存儲在語音存儲單元1810中。第二接收單元1806接收作為將要輸出的持續(xù)時間的信息的從語音翻譯設(shè)備2000發(fā)送 的輸出語音持續(xù)時間號和接收終端號。輸出處理單元1807參考由第二接收單元1806接收的信息,獲取準(zhǔn)備好將從終端1800 輸出的語音持續(xù)時間的最短持續(xù)時間并將其輸出。輸出處理單元1807將已經(jīng)從語音存儲 單元1810中輸出的語音消除。如圖20中所示,語音翻譯設(shè)備2000包括對應(yīng)存儲單元120,接收單元2030,生成單 元2040,輸出控制單元2050和發(fā)送單元2060。語音翻譯設(shè)備2000與根據(jù)第一實施例的語音翻譯設(shè)備100的不同之處在于不包括語 音存儲單元110,并且接收單元2030、生成單元2040、輸出控制單元2050和發(fā)送單元2060 的功能不同。因為其他單元的結(jié)構(gòu)和功能與根據(jù)第一實施例的語音翻譯設(shè)備100相同,所 以使用與圖3中所示相同的參考數(shù)字,并且省略對它們的解釋。接收單元2030也將所接收的語音原樣輸出到發(fā)送單元2060,并且將所接收語音的語 音持續(xù)時間信息輸出到輸出控制單元2050。生成單元2040也將經(jīng)翻譯的語音輸出到發(fā)送單元2060,但是不輸出到輸出控制單元 2050。生成單元2040只將輸出語音的語音持續(xù)時間信息輸出到輸出控制單元2050。如圖21中所示,輸入到發(fā)送單元2060的信息包括接收終端號、輸出語音持續(xù)時間號、 輸出語音和語言信息。如圖22中所示,輸入到輸出控制單元2050的信息包括接收終端號、輸入語音持續(xù)時 間、輸出語音持續(xù)時間號和語言信息。
從接收單元2030傳遞到輸出控制單元2050的持續(xù)時間信息并不是由語音持續(xù)時間的單位或者按詞來劃界的。持續(xù)時間信息以可以被定義為持續(xù)時間的最小單位傳輸。例如,如果采樣頻率是8Khz,則每一秒中生成8000個持續(xù)時間。然而,為了以與其接收時相同 的語言輸出語音,所接收的語音和輸出語音的順序相同,并且接收單元2030只必須將至 此接收到的語音的最后點(diǎn)傳輸?shù)捷敵隹刂茊卧?050。輸出控制單元2050控制輸出語音的時間,并且包括確定單元151和輸出處理單元 2052。確定單元151的功能如第一實施例中所述,并且省略對它的解釋。輸出處理單元2052輸出包括其間確定單元151已經(jīng)用所有語言生成的經(jīng)翻譯的i吾音 的語音持續(xù)時間的輸出語音持續(xù)時間號的信息。如圖23中所示,從輸出處理單元2052輸出的信息包括接收終端號、輸出語音持續(xù)時 間號和語言信息。下文將參考圖24解釋由根據(jù)第三實施例的語音翻譯設(shè)備2000進(jìn)行的語音翻譯處理。 步驟S2401到S2404與圖6中所示的步驟S601到S604相同,因此省略對它們的解釋。 在翻譯處理后,發(fā)送單元2060將如圖19中所示的包括由生成單元2040生成的經(jīng)翻 譯的語音的信息發(fā)送到終端1800 (步驟S2405),并且第一接收單元203接收該信息(步 驟S2406)。保存單元1805將經(jīng)翻譯的語音保存在語音存儲單元1810中(步驟S2407)。在語音翻譯設(shè)備2000中,確定單元151進(jìn)行確定處理(步驟S2408),該確定處理>(每 在后文詳細(xì)描述。在輸出持續(xù)時間的確定處理之后,發(fā)送單元2060將被確定可以輸出的語音持續(xù)時間 的輸出語音持續(xù)時間號以及接收終端號發(fā)送到終端1800 (步驟S2409)。第二接收單元1806接收輸出語音持續(xù)時間號和接收終端號(步驟S2410)。輸出處理 單元1807通過參考輸出語音持續(xù)時間號和接收終端號生成如圖8中所示的信息,并且計 算將要輸出的最短持續(xù)時間(步驟S2411)。計算最短持續(xù)時間的處理與第一實施例中的解 釋相同,因此省略對它的解釋。輸出處理單元1807從語音存儲單元1810中獲取對應(yīng)于最短持續(xù)時間的語音并且將其 輸出到語音輸出單元204 (步驟S2412)。語音輸出單元204輸出該語音(步驟S2413)。下文將參考圖25細(xì)化步驟S2408的語音輸出處理。步驟S2501和S2502與圖7中所示的步驟S702和S703相同,因此省略對它們的解釋。 如果沒有能夠輸出的持續(xù)時間(步驟S2502位"否"),則輸出處理單元2052終止確定處理。如果有能夠輸出的持續(xù)時間(步驟S2502為"是"),則輸出處理單元2052輸出如圖 23中的信息(步驟S2503),并且終止確定處理。如上文所述,根據(jù)第三實施例,如果確定單元151確定存在能夠輸出的語音持續(xù)時間 則輸出如圖23中所示的將要輸出的語音持續(xù)時間的信息。因為根據(jù)第三實施例的語音翻譯設(shè)備2000向終端1800串行輸出大容量的語音數(shù)據(jù), 由于網(wǎng)絡(luò)故障引起的輸出語音的延遲被減小。在第一實施例、第二實施例和第三實施例中使用了客戶一服務(wù)器系統(tǒng)結(jié)構(gòu)。對應(yīng)于服 務(wù)器的語音翻譯進(jìn)行翻譯處理,對應(yīng)于客戶的終端只輸出經(jīng)翻譯的語音。根據(jù)第四實施例,沒有這樣一個集中進(jìn)行處理的服務(wù)器。作為代替,為每個參與者提 供的設(shè)備相互交換信息并且進(jìn)行翻譯處理。換句話說,根據(jù)第四實施例的語音翻譯設(shè)備 2600根據(jù)從另一個參與者的語音翻譯設(shè)備2600接收到的信息控制輸出在其自己內(nèi)部翻譯 的語音的時間。如圖26中所示,根據(jù)第四實施例的會議系統(tǒng)包括多個通過網(wǎng)絡(luò)300彼此連接的語音 翻譯設(shè)備2600a、 2600b和2600z (每一個也被稱為語音翻譯設(shè)備2600)。如圖27中所示,語音翻譯設(shè)備2600包括語音接收單元201,發(fā)送單元202,第一接 收單元203,語音輸出單元204,語音存儲單元2610,語言存儲單元2620,生成單元2650, 輸出控制單元2660和第二接收單元2670。語音接收單元201、發(fā)送單元202、第一接收單元203和語音輸出單元204的功能如 第一實施例中的解釋,并且省略對它們的解釋。語音存儲單元2610在其中相關(guān)于每個設(shè)備存儲從其他語音翻譯設(shè)備2600接收到的語 音。語音存儲單元2610包括相關(guān)于每個設(shè)備存儲語音的存儲子單元,諸如設(shè)備1存儲單 元2611、設(shè)備2存儲單元2612,……,和設(shè)備n存儲單元261n。語言存儲單元2620在其中存儲彼此關(guān)聯(lián)的語言和在會議系統(tǒng)中使用該語言的語音翻 譯設(shè)備2600的標(biāo)識符。根據(jù)第一實施例,當(dāng)終端200被連接到語音翻譯設(shè)備100時或者 當(dāng)通信開始時,終端200把將要使用的語言發(fā)送到語音翻譯設(shè)備100。根據(jù)第四實施例, 當(dāng)每個語音翻譯設(shè)備2600被連接時,語音翻譯設(shè)備2600互相交換將要使用的語言的信息。生成單元2650將所接收的語音翻譯成語音翻譯設(shè)備2600中使用的語言,并且生成經(jīng) 翻譯的語音。例如,如果使用的是日語,則生成單元2650需要將所接收的語音翻譯成英 語;然而,它并不需要把日語語音翻譯成任何其他語言。經(jīng)翻譯的語音被輸出到輸出控制 單元2660。與根據(jù)第一實施例的生成單元140不同,生成單元2650將包括輸出終端號的信息輸 出到輸出控制單元2660。同樣的信息在語音翻譯設(shè)備2600之間進(jìn)行交換。第二接收單元2670接收從其他語音翻譯設(shè)備2600輸出的信息。如圖28中所示,從生成單元2650輸出的信息包括接收設(shè)備號、輸入語音持續(xù)時間、 輸出語音持續(xù)時間號和輸出設(shè)備號。該信息與從根據(jù)第一實施例的生成單元140輸出的{言 息的不同之處在于不包括輸出語音和語言信息并且添加了指示發(fā)送語音的語音翻譯設(shè)備 2600的標(biāo)識符的輸出設(shè)備號。輸出控制單元2660控制輸出語音的時間,并且包括確定單元2651和輸出處理單元 2652。確定單元2651通過確定語音持續(xù)時間是否已經(jīng)由所有的語音翻譯設(shè)備2600翻譯來確 定是否可以輸出經(jīng)翻譯的語音。輸出處理單元2652輸出己經(jīng)由所有的語音翻譯設(shè)備2600翻譯的語音持續(xù)時間中的經(jīng) 翻譯的語音和源語音。如上文所述,雖然根據(jù)第一實施例經(jīng)翻譯的語音是相關(guān)于每種語言生成的,但根據(jù)第 四實施例確定處理和語音輸出處理相關(guān)于每個語音翻譯設(shè)備2600進(jìn)行。這是因為與第一實施例不同的是可以在不同的語音翻譯設(shè)備2600中進(jìn)行相同方向的 翻譯處理。例如,如果語音翻譯設(shè)備A和B使用日語而語音翻譯設(shè)備C使用英語,則從i吾 音翻譯設(shè)備C接收的語音在語音翻譯設(shè)備A和B中分別翻譯成日語。語音翻譯設(shè)備A和B很少完全同時開始和完成翻譯處理,并且時間差別可以很大。因 此,為了最小化該差異,確定處理和語音輸出處理是相關(guān)于每個語音翻譯設(shè)備2600進(jìn)《亍 的。語音翻譯設(shè)備2600需要在測量語音持續(xù)時間的時間上達(dá)到同步。下文參考圖29解釋由根據(jù)第四實施例的語音翻譯設(shè)備2600進(jìn)行的語音翻譯處理。語音翻譯設(shè)備2600a中的語音接收單元201接收語音(步驟S2901)。發(fā)送單元202將 所接收的語音發(fā)送到其他語音接收設(shè)備2600b (步驟S2902)。第一接收單元203接收從語音翻譯設(shè)備2600b發(fā)送的語音(步驟S2903)。第一接收單 元203參考語言存儲單元2620以獲取由每個設(shè)備使用的語言。如果語音翻譯設(shè)備2600b 使用與語音翻譯設(shè)備2600a相同的語言,則第一接收單元203將語音傳遞到輸出控制單元 2660,并且將如圖28中所示的信息發(fā)送到語音翻譯設(shè)備2600b。如果語音翻譯設(shè)備2600b 使用不同的語言,則第一接收單元203將語音傳遞到生成單元2650。生成單元2650將所接收的語音翻譯成語音翻譯設(shè)備2600a中使用的語言并生成經(jīng)翻 譯的語音(步驟S2904),以及將如圖28中所示的信息輸出到輸出控制單元2660 (步驟 S2905)。發(fā)送單元202將信息發(fā)送到語音翻譯設(shè)備2600b (步驟S2906)。如果語音翻譯設(shè)備2600b發(fā)送信息,則語音翻譯設(shè)備2600a中的第二接收單元2670 接收該信息(步驟S2907)。輸出控制單元2660以與第一實施例中的解釋相同的方法利用 所接收的信息進(jìn)行語音輸出處理(步驟S2908)。在語音輸出處理中,相關(guān)于每個語音番召譯 設(shè)備2600而不是語言進(jìn)行確定處理。輸出控制單元2660混合從其他語音翻譯設(shè)備2600接收到的語音并且將經(jīng)混合的i吾音 存儲在語音存儲單元2610中。當(dāng)將要輸出的語音持續(xù)時間在語音輸出處理中被確定時,從語音存儲單元2610中提 取對應(yīng)的語音持續(xù)時間中的語音,并且語音輸出單元204輸出該語音(步驟S2909)。步驟S2910到S2918除了它們由語音翻譯設(shè)備2600b進(jìn)行之外與步驟S2901到S2909 相同,因此省略對它們的解釋。如上文所示,根據(jù)第四實施例的語音翻譯設(shè)備2600與另一個語音翻譯設(shè)備2600交換 語音翻譯的信息,并且當(dāng)某個參與者的語音由所有的語音翻譯設(shè)備2600翻譯時輸出該語 音。這樣就使將經(jīng)翻譯的語音輸出到每個參與者的時滯最小化。根據(jù)第五實施例的語音翻譯設(shè)備3000通過在一個預(yù)定的延遲之后輸出經(jīng)翻譯的i吾音 來使語音的暫停最小化。如圖30所示,語音翻譯設(shè)備3000包括語音存儲單元110,對應(yīng)存儲單元120,接收 單元130,生成單元140,輸出控制單元3050和發(fā)送單元160。輸出控制單元3050的功能與第一實施例不同。因為其他單元的結(jié)構(gòu)和功能與根據(jù)第 一實施例的語音翻譯設(shè)備100相同,因此使用與圖3中所示相同的參考數(shù)字,并且省略對 它們的解釋。輸出控制單元3050控制輸出語音的時間,并且包括確定單元151、輸出處理單元152 和延遲單元3053。確定單元151和輸出處理單元152的功能如第一實施例中的解釋,因此省略對它們的解釋。延遲單元3053將語音的輸出延遲預(yù)定的時間。延遲處理將在后文詳細(xì)描述。
下文將參考圖31解釋由根據(jù)第五實施例的語音翻譯設(shè)備3000進(jìn)行的語音翻譯處理。 語音翻譯的流程除了在步驟S605的語音輸出處理的細(xì)節(jié)之外與第一實施例的解釋相同。步驟S3101到S3105與圖7中所示的步驟S701到S705相同,因此省略對它們的解釋。如果將要輸出的最短持續(xù)時間存在(步驟S3105為"是"),則延遲單元3053進(jìn)行延 遲語音輸出的延遲處理(步驟S3106)。在延遲處理后,輸出處理單元152從語音存儲單元110中獲取對應(yīng)于最短持續(xù)時間的 語音并且講其輸出(步驟S3107)。下文參考圖32解釋步驟S3106的延遲處理的概念。這里假設(shè)接收單元130在tub, ti2b, tub等時刻接收語音。時間可以基于任何一個格林 尼治標(biāo)準(zhǔn)時間,時間從系統(tǒng)啟動開始計算,時間從用戶開始使用系統(tǒng)開始計算等。每個輸入語音持續(xù)時間以長方形形狀顯示在"接收"行中,并且長方形以賦于持續(xù)時 間的時間順序排列。長方形中的號以接收的順序賦值。由語音翻譯設(shè)備3000接收的實際語音是連續(xù)的,并且當(dāng)語音翻譯設(shè)備3000接收語音 時語音不被劃界。如第一實施例中所描述的,由生成單元140劃界的每個持續(xù)時間與圖32 中的一個長方形相關(guān)。持續(xù)時間可以是任何一個語音持續(xù)時間和非語音持續(xù)時間。"輸出"行顯示確定單元151確定輸出語音的時刻。長方形中的數(shù)字對應(yīng)于輸入語音 持續(xù)時間的號碼。例如,輸出語音1從所接收的語音1生成。所生成的語音通常是從源語 音翻譯來的語音;然而,如果所接收的語音和輸出語音使用相同的語言,則源語音實際上 可以就是輸出語音。"延遲輸出"行顯示延遲單元3053確定輸出語音的時刻。確定單元151在"延遲輸 出"行中所顯示的時刻輸出語音。預(yù)定延遲Uw表示最小延遲。換句話說,不能以小于td6lay 的延遲輸出語音。下文參考圖33解釋延遲處理。延遲單元3053把將要輸出的語音持續(xù)時間的持續(xù)時間號確定為x (步驟S3301),并 且用當(dāng)前時間twt代替輸出開始時刻t。rt (步驟S3302)。延遲單元3053確定輸出開始時刻Ub與接收對應(yīng)持續(xù)時間中的語音的時刻tw之差是 否小于預(yù)定延遲tdelay (步驟S3303)。如果差值小于預(yù)定延遲(步驟S3303為"是"),則延遲單元3053等待,直到等式tMb —U》td一滿足(步驟S3304)。
如果差值不小于預(yù)定延遲(步驟S3303為"否"),這意味著實際延遲已經(jīng)超過預(yù)定延 遲,則延遲單元3053終止延遲處理。下文參考圖32解釋延遲處理的實例。延遲單元3053在接收到來自輸出處理單元152 的持續(xù)時間號時開始延遲處理。這里的解釋假設(shè)延遲單元3053接收"接收"行中的持續(xù) 時間號1。在步驟S3301中用1代替x,并且在步驟S3302中用當(dāng)前時間U,t代替輸出開始時刻圖32中,t。fti,b比t一小(步驟S3303為"是"),延遲單元3053等待,直到t。xb —ti^W滿足(步驟S3304)。當(dāng)延遲單元3053接收持續(xù)時間號2時,t。2b—ti2b比t^,小(步驟S3303為"是"),延 遲單元3053延遲輸出(步驟S3304)。在這種情形下,因為t。2b—ti2b等于tdelay,因此不插 入靜音,并且語音持續(xù)時間2在語音持續(xù)時間1之后立刻被輸出。當(dāng)延遲單元3053接收持續(xù)時間號3時,t。3b—ti3b比t^y大(步驟S3303為"否"),也 即,由于翻譯處理引起的延遲比Uw長,因此沒有必要插入任何延遲。作為翻譯處理的結(jié)果,輸出語音并不總是以與源語音被接收時相同的順序輸出。持續(xù) 時間4和5表示了這樣的情形。在該實例中,基于輸入語音持續(xù)時間5的輸出語音在基于 輸入語音持續(xù)時間4的輸出語音之前輸出。首先,只延遲U^的目的是為了防止輸出語音暫停。因此,除非"輸出"行中持續(xù)時 間號5的開始點(diǎn)Ub超過"接收"行中持續(xù)時間號4的開始端t"b和td一之和,否則沒有必 要插入延遲。在輸出持續(xù)時間號5中的語音被輸出之后輸出持續(xù)時間號4中的語音。將兩 個值結(jié)合,就有一個至少td一的延遲。如圖32中所示,"輸出"行中語音持續(xù)時間5的開始時刻是t。4b,并且以x值的升序 排列Ub。以這種方式,延遲單元3053確定是否插入延遲而不確定是否改變順序。雖然第五實施例是通過向第一實施例的實例中插入延遲來解釋的,但也可以被應(yīng)用于 其他實施例。如上文所述,根據(jù)第五實施例的語音翻譯設(shè)備3000通過在預(yù)定的延遲之后輸出經(jīng)翻 譯的語音來使語音的暫停最小化。根據(jù)第五實施例,如果延遲單元3053確定能夠輸出語音并且之前的語音正在被輸出, 則該語音不被輸出,直到完成先前語音的輸出。因此, 一旦翻譯處理的延遲長于預(yù)定延遲Ulay,由于翻譯引起的延遲就是實際的延遲。換句話說,如果翻譯處理的延遲長于td6lay, 延遲就不能被降到tMay。如果翻譯處理的延遲長于預(yù)定延遲,則根據(jù)第六實施例的語音翻譯設(shè)備3400通過減 小將要輸出的經(jīng)翻譯的語音的再現(xiàn)時間來使延遲最小化。如圖34中所示,語音翻譯設(shè)備3400包括語音存儲單元110,對應(yīng)存儲單元120,接 收單元130,生成單元140,輸出控制單元3450和發(fā)送單元160。輸出控制單元3450的功能與第五實施例不同。因為其他單元的結(jié)構(gòu)和功能與根據(jù)第 五實施例的語音翻譯設(shè)備3000相同,因此使用與圖30中所示相同的參考數(shù)字,并且省略 對它們的解釋。輸出控制單元3450控制輸出語音的時刻,并且包括確定單元151,輸出處理單元152, 延遲單元3053和縮短單元3454。確定單元151,輸出處理單元152和延遲單元3053的功 能如同第五實施例中的解釋,并且省略對它們的解釋。縮短單元3454縮短再現(xiàn)時間,也即輸出語音的長度,并且將其傳輸?shù)桨l(fā)送單元160。 更加具體地,縮短單元3454通過加快輸出語音的再現(xiàn)速度來縮短再現(xiàn)時間??s短單元3454 可以被配置成利用靜音探測算法和噪音探測算法探測靜音和噪音的持續(xù)時間并且消除所 探測的持續(xù)時間,由此縮短再現(xiàn)時間。此外,縮短單元3454可以被配置成從生成單元140接收信息,根據(jù)該信息區(qū)分語音 持續(xù)時間和非語音持續(xù)時間并且消除非語音持續(xù)時間,由此縮短再現(xiàn)時間。下文參考圖35解釋由根據(jù)第六實施例的語音翻譯設(shè)備3400進(jìn)行的語音翻譯處理。i吾 音翻譯處理的流程與第五實施例中的解釋也就是第一實施例中的圖6相同,除了步驟S605 的語音輸出處理的細(xì)節(jié)之外。步驟S3501到S3507與圖31中所示的步驟S3101到S3107相同,因此省略對它們的 解釋。輸出處理單元152在步驟S3107中輸出對應(yīng)于最短持續(xù)時間的語音后,縮短單元3454 進(jìn)行縮短輸出語音再現(xiàn)時間并且將其輸出的輸出時間縮短處理(步驟S3508),并且終止語 音輸出處理。下文參考圖36細(xì)化步驟S3508的輸出時間縮短處理。縮短單元3454確定由于翻譯處理引起的延遲是否長于預(yù)定的延遲時間td一,也就是, 等式t她—U,Uay是否滿足(步驟S3601)。如果Ub—Ub〉td^y滿足(步驟S3601為"是"),則縮短單元3454縮短該語音(步驟 3602),并且輸出經(jīng)縮短的語音(步驟S3603)。如果Ub—Ub〉t^y不滿足(步驟S3601為"否"),則縮短單元3454不縮短該語音就 將其輸出(步驟S3603)。下文參考圖37解釋縮短處理的實例。"接收"行表示在接收單元130接收語音時劃界的輸入語音持續(xù)時間和以接收順序賦 值給輸入語音持續(xù)時間的號碼。"輸出"行表示與輸出語音的時刻相關(guān)聯(lián)的輸出語音持續(xù)時間。"經(jīng)縮短的持續(xù)時間 輸出"行表示與縮短單元3454輸出語音的時刻相關(guān)聯(lián)的持續(xù)時間。"經(jīng)縮短的持續(xù)時間輸出"行中的持續(xù)時間1比"輸出"行中對應(yīng)的持續(xù)時間短,因 為縮短單元3454在輸入語音被輸出之前先將其縮短。 第六實施例可以在各種如下文所示的修改中實現(xiàn)。根據(jù)第六實施例,預(yù)定延遲"13,是預(yù)先確定的,并且語音被延遲至少Uw后再將其輸 出。第六實施例可以被修改成利用根據(jù)過去的翻譯處理中的延遲動態(tài)改變的延遲而不是利 用固定的延遲來進(jìn)行延遲處理。在延遲單元3053進(jìn)行延遲處理之前,先從翻譯處理的延遲中獲取最近延遲的預(yù)定數(shù) 值(下文中為"n")。最近輸出的延遲被稱為第一延遲,第i個延遲被稱為Li。延遲發(fā)生 得越早,i數(shù)越大。在圖32所示的實例中,在輸出語音持續(xù)時間3之后,最近延遲"是t。3b—ti3b,"是t。2b — ti2b。利用下式計算延遲tdelay = a (Ji=1Li ) /n (1) 如果沒有持續(xù)時間并且不能計算Li,則Li是0。換句話說,td一等于最近n個延遲的平均值的a倍。使用預(yù)定系數(shù)a的乘積是因為 如果使用延遲的簡單平均數(shù)則td一可能被低估。通過加大a,語音暫停較不頻繁。通過動態(tài)改變用于確定處理的延遲,由于翻譯處理引起的實際延遲不那么容易比"lay 短。換句話說,事先與確定U^的情況進(jìn)行比較,輸出語音的延遲被減小。如果從諸如回答問題的"是"或"否"的短語音中利用式(1)計算延遲,則Uay太小以致于語音可能經(jīng)常暫停并且再現(xiàn)速度可能經(jīng)常提高。防止暫停和再現(xiàn)速度提高的方法 是把短語音從td一計算中排除。換句話說,如果源語音等于或短于預(yù)定長度,則不被用于
計算tdeayo相似地,如果從包括靜音或噪音的語音持續(xù)時間中計算延遲,則結(jié)果的td一可能太大 或太小。為了防止這種現(xiàn)象,生成單元140輸出表示持續(xù)時間是否是非語音持續(xù)時間的信 息,從而使非語音持續(xù)時間不被用于計算Ulay。如上文所述,如果翻譯處理的延遲長于預(yù)定延遲,則根據(jù)第六實施例的語音翻譯設(shè)備 3400縮短經(jīng)翻譯的語音的語音時間,由此大的延遲不再保留。根據(jù)第七實施例的語音翻譯設(shè)備3900從接收語音和運(yùn)動圖像的終端3800接收語音和 運(yùn)動圖像,并且將運(yùn)動圖像與經(jīng)翻譯的語音同步地輸出到終端3800。如圖38中所示,終端3800包括語音接收單元201,發(fā)送單元202,第一接收單元203, 語音輸出單元204,圖像形成單元3801,第二接收單元3802和圖像顯示單元3803。圖像形成單元3801,第二接收單元3802和圖像顯示單元3803被添加到根據(jù)第一實施 例的終端200中。因為其他單元的結(jié)構(gòu)和功能與根據(jù)第一實施例的終端200相同,因此使 用與圖2中所示相同的參考數(shù)字,并且省略對它們的解釋。圖像形成單元3801形成參與者的圖像并且輸出參與者的運(yùn)動圖像。圖像形成單元3801 可以是諸如通用照相機(jī)的任何圖像形成裝置。第二接收單元3802接收發(fā)自語音翻譯設(shè)備 3900的翻譯處理中的延遲。圖像顯示單元3803向參與者顯示運(yùn)動圖像和文本。圖像顯示 單元3803可以是任何現(xiàn)存的顯示裝置。如上文所述,終端3800包括輸入和輸出運(yùn)動圖像以及語音的用戶接口。如圖39中所示,語音翻譯設(shè)備3900包括語音存儲單元110,對應(yīng)存儲單元120,接 收單元3930,生成單元140,輸出控制單元3950,發(fā)送單元3960和運(yùn)動圖像存儲單元3970。與根據(jù)第一實施例的語音翻譯設(shè)備100比較,增加了運(yùn)動圖像存儲單元3970,并且接 收單元3930、輸出控制單元3950和發(fā)送單元3960的功能也與語音翻譯設(shè)備100不同。因 為其他單元的結(jié)構(gòu)和功能與根據(jù)第一實施例的語音翻譯設(shè)備100相同,因此使用與圖3中 所示相同的參考數(shù)字,并且省略對它們的解釋。運(yùn)動圖像存儲單元3970在其中存儲從終端3800接收的運(yùn)動圖像。運(yùn)動圖像存儲單元 3970包括相關(guān)于每個終端3800存儲運(yùn)動圖像的存儲子單元,諸如終端1存儲單元3971, 終端2存儲單元3972,……,終端n存儲單元397n,因為運(yùn)動圖像不取決于語言。接收單元3930從每個終端3800接收運(yùn)動圖像以及語音。接收單元3930只將語音傳 遞到生成單元140,并且將語音和運(yùn)動圖像都傳遞到輸出控制單元3950。 輸出控制單元3950從生成單元140接收經(jīng)翻譯的語音,并且從接收單元3930接收所 接收的語音和運(yùn)動圖像。輸出控制單元3950將運(yùn)動圖像存儲在運(yùn)動圖像存儲單元3970中。 當(dāng)能夠輸出經(jīng)翻譯的語音時,輸出控制單元3950從語音存儲單元110和運(yùn)動圖像存儲單 元3970中獲取語音和運(yùn)動圖像,并且將它們傳遞到發(fā)送單元3960。輸出控制單元3950從運(yùn)動圖像存儲單元3970中獲取與將要輸出的語音持續(xù)時間相同 長度的運(yùn)動圖像。如果有使用與源語音相同語言的任何終端3800,則語音持續(xù)時間將以與 源語音相同的順序輸出。然而,如果用與源語音不同的語言輸出語音,則能夠以與源語音 不同的順序輸出語音。然而,具有與將要輸出的語音相同的長度的運(yùn)動圖像以與源語音相 同的順序輸出。如果輸出語音長于所接收的語音,則減小運(yùn)動圖像的再現(xiàn)速度。如果輸出語音短于所接收的語音,則加大運(yùn)動圖像的再現(xiàn)速度。發(fā)送單元3960使語音與運(yùn)動圖像相關(guān)聯(lián),并且將它們發(fā)送到終端3800。 下文將參考圖40解釋由根據(jù)第七實施例的語音翻譯設(shè)備3900進(jìn)行的語音翻譯處理。 終端3800中的圖像形成單元3801攝取運(yùn)動圖像(步驟S4001)。發(fā)送單元202將運(yùn)動圖像與從語音接收單元201輸入(步驟S4002)的語音一起發(fā)送到語音翻譯設(shè)備3900 (步驟S4003)。語音翻譯設(shè)備3900中的接收單元3930接收語音和運(yùn)動圖像(步驟S4004)。輸出控制 單元3950估計由于翻譯引起的延遲并且將該延遲發(fā)送到終端3800 (步驟S4005)。終端3800中的第二接收單元3802接收該延遲(步驟S4006),并且圖像顯示單元3803 在屏幕上顯示該延遲(步驟S4007)。顯示延遲的方法將在后面描述。語音翻譯設(shè)備3900以與第一實施例中的步驟S604、 S605和S606相同的方式進(jìn)行翻 譯處理、語音輸出處理和確定處理(步驟S4008、 S4009、 S4010)。發(fā)送單元3960把將要輸出的語音和對應(yīng)的運(yùn)動圖像發(fā)送到終端3800 (步驟S4011)。終端3800中的第一接收單元203接收語音和運(yùn)動圖像(步驟S4012)。語音輸出單元 204輸出語音(步驟S4013),并且圖像顯示單元3803顯示運(yùn)動圖像(步驟S4014)。下文參考圖41解釋顯示延遲的方法。顯示屏4100包括進(jìn)程條4101,顯示區(qū)域4102和顯示多個參與者的四個顯示區(qū)域之外 的進(jìn)程條4103。進(jìn)程條4101顯示翻譯由使用終端3800的參與者所說的語音的進(jìn)程。顯示 區(qū)域4102顯示另一個參與者正在說話。進(jìn)程條4103顯示處理由另一個參與者所說的語音
的進(jìn)程。由于語音翻譯引起的延遲可以持續(xù)幾秒到幾十秒,有時會議不能平穩(wěn)地進(jìn)行,除非參 與者理解延遲的程度。例如,當(dāng)參與者期待一個回答時,他/她不能確定需要等待回答多 久。為了防止這種情形而設(shè)置進(jìn)程條4101,該進(jìn)程條4101指示所述語音輸出到其他參與 者之前的時間。處理的進(jìn)程可以以進(jìn)程條以外的任何其他方式來表示。例如,完成處理之 前的時間可以用數(shù)字并且倒計數(shù)來表示。在圖41所示的實例中使用5個終端3800。圖41中所示的終端3800的用戶因為不是 實質(zhì)內(nèi)容而沒有顯示;然而,終端3800可以被配置成顯示它們的用戶。當(dāng)另一個終端3800的用戶開始講話時,顯示區(qū)域4102顯示他/她正在說話來提醒其 他用戶。通過獲悉語音被輸出之前的時間,用戶知道他們應(yīng)該等待多久。由語音翻譯設(shè)備3900中的輸出控制單元3950平均過去的延遲來計算對延遲的估計。 當(dāng)生成單元140中非語音持續(xù)時間改變到語音持續(xù)時間時或者反之亦然,可以確定用戶是 否正在說話。語音翻譯設(shè)備3900可以被配置成如第五和第六實施例中的解釋以預(yù)定的延遲輸出語 音和運(yùn)動圖像。為了縮短延遲,必須縮短運(yùn)動圖像以及語音的再現(xiàn)時間。為了縮短運(yùn)動圖像的再現(xiàn)時 間,可以使用任何已有的方法,諸如消除由運(yùn)動探測技術(shù)探測到的不活動的部分和通過以 固定比率壓縮圖像來縮短運(yùn)動圖像。如上文所述,根據(jù)第七實施例的語音翻譯設(shè)備3900連同語音一起交換運(yùn)動圖像,并 且使對于使用運(yùn)動圖像的視頻會議系統(tǒng)中的所有參與者的時滯最小化。此外,通過在屏幕 上顯示延遲和參與者正在講話的事實,用戶知道處理的進(jìn)程,因此會議可以平穩(wěn)地進(jìn)行。如圖42中所示,根據(jù)第一到第七實施例的每一種語音翻譯設(shè)備都包括諸如中央處理 單元(CPU) 51的控制裝置,諸如只讀存儲器(ROM) 52鄰RAM 53的內(nèi)部存儲裝置,連接 到網(wǎng)絡(luò)的用以通信的通信I/F54,諸如HDD和小型光盤(CD)驅(qū)動器的外部存儲單元,顯 示裝置,諸如鍵盤和鼠標(biāo)的輸入裝置,和將各種裝置彼此連接的總線61,并且這些語音翻 譯設(shè)備使用通用的計算機(jī)。在根據(jù)第一到第七實施例的語音翻譯設(shè)備中執(zhí)行的語音翻譯程序以可安裝或可執(zhí)行 的格式設(shè)置在諸如小型光盤只讀存儲器(CD-ROM)、軟盤(FD)、可記錄小型光盤(CD-R) 和數(shù)字通用光盤(DVD)的計算機(jī)可讀記錄介質(zhì)中。 另外,語音翻譯程序可以被存儲在連接到諸如互聯(lián)網(wǎng)的網(wǎng)絡(luò)的計算機(jī)中以通過網(wǎng)絡(luò)下 載。語音翻譯程序可以通過諸如互聯(lián)網(wǎng)的網(wǎng)絡(luò)提供或分配。 語音翻譯程序可以預(yù)先安裝在ROM 52等存儲裝置中。語音翻譯程序包括接收單元、生成單元、輸出控制單元、發(fā)送單元等模塊。CPU 51從 記錄介質(zhì)中讀取語音翻譯程序并且執(zhí)行該程序,由此各個單元被加載到主存儲裝置中并且 在其中被生成。對于本技術(shù)領(lǐng)域中的熟練專業(yè)人員很容易實現(xiàn)其他的優(yōu)點(diǎn)和修改。因而本發(fā)明在其廣 闊的各個方面不局限于本文展示和描述的具體細(xì)節(jié)和代表性實施例。所以,可以進(jìn)行各種 修改而不背離由附后的權(quán)利要求及其等效內(nèi)容定義的本發(fā)明的總體概念的精神或范圍。
權(quán)利要求
1.一種語音翻譯設(shè)備,其特征在于,該設(shè)備包括對應(yīng)存儲單元,存儲彼此相關(guān)聯(lián)的唯一標(biāo)識可通過網(wǎng)絡(luò)連接的多個終端中的每一個終端的標(biāo)識符和在所述終端中使用的使用語言;接收單元,從一個終端接收源語音;翻譯單元,從對應(yīng)存儲單元中獲取與源語音中使用的源語言不同的使用語言,并且通過將每個所獲取的使用語言作為目標(biāo)語言來生成從源語音翻譯的經(jīng)翻譯的語音;確定單元,當(dāng)用任何一個目標(biāo)語言生成經(jīng)翻譯的語音時確定是否已經(jīng)用所有的目標(biāo)語言生成經(jīng)翻譯的語音;輸出單元,當(dāng)已經(jīng)用所有目標(biāo)語言生成經(jīng)翻譯的語音時輸出經(jīng)翻譯的語音;和發(fā)送單元,將經(jīng)翻譯的語音發(fā)送到由對應(yīng)于目標(biāo)語言的標(biāo)識符標(biāo)識的每個終端。
2. 如權(quán)利要求l所述的設(shè)備,其特征在于,當(dāng)已經(jīng)用所有的目標(biāo)語言生成經(jīng)翻譯的語音時,輸出單元進(jìn)一步輸出源語音,以及 發(fā)送單元將源語音發(fā)送到由對應(yīng)于源語言的標(biāo)識符標(biāo)識的終端。
3. 如權(quán)利要求l所述的設(shè)備,其特征在于,-當(dāng)用任何一個目標(biāo)語言生成經(jīng)翻譯的語音時,確定單元確定是否已經(jīng)用所有的目標(biāo)語 言生成經(jīng)翻譯的語言的第一語音持續(xù)時間和第二語音持續(xù)時間,第一語音持續(xù)時間是用一 個目標(biāo)語言將要在下一個被輸出的持續(xù)時間,第二語音持續(xù)時間是用任何其他目標(biāo)語言將 要在第一語音持續(xù)時間結(jié)束之前輸出的持續(xù)時間,以及當(dāng)已經(jīng)用所有的目標(biāo)語言生成經(jīng)翻譯的語音的第一語音持續(xù)時間和第二語音持續(xù)時 間時,輸出單元輸出對應(yīng)于第一語音持續(xù)時間和第二語音持續(xù)時間的經(jīng)翻譯的語音和源語音
4. 如權(quán)利要求1所述的設(shè)備,其特征在于,翻譯單元生成經(jīng)翻譯的語音,該經(jīng)翻譯的語 音的再現(xiàn)時間持續(xù)與目標(biāo)語言基本相同的時間長度。
5. 如權(quán)利要求4所述的設(shè)備,其特征在于,當(dāng)經(jīng)翻譯的語音的再現(xiàn)時間不與目標(biāo)語言的 再現(xiàn)時間基本相同時,翻譯單元改變經(jīng)翻譯的語音的再現(xiàn)速度,以使多個目標(biāo)語言的經(jīng)翻 譯的語音的長度基本相同。
6. 如權(quán)利要求4所述的設(shè)備,其特征在于,當(dāng)經(jīng)翻譯的語音的再現(xiàn)時間不與目標(biāo)語言的 再現(xiàn)時間基本相同時,翻譯單元在經(jīng)翻譯的語音前后的至少一處位置添加靜音語音,以使 多個目標(biāo)語言中經(jīng)翻譯的語音的再現(xiàn)時間基本相同。
7. 如權(quán)利要求1所述的設(shè)備,其特征在于,該設(shè)備進(jìn)一步包括語音存儲單元,該語音存 儲單元能夠存儲通過對每個目標(biāo)語言混合經(jīng)翻譯的語音或源語音得到的經(jīng)混合的語音,其中輸出單元進(jìn)一步對于每個目標(biāo)語言將所述存儲在語音存儲單元中的經(jīng)混合的語音與 另外的經(jīng)翻譯的語音或者另一個源語音混合,將由輸出單元混合的經(jīng)混合的語音存儲在語 音存儲單元中,并且當(dāng)已經(jīng)用所有的目標(biāo)語言生成經(jīng)翻譯的語音時輸出所述經(jīng)混合的語音
8. 如權(quán)利要求1所述的設(shè)備,其特征在于,該設(shè)備進(jìn)一步包括語音存儲單元,該語音存 儲單元能夠?qū)τ诿總€終端存儲每個目標(biāo)語言的經(jīng)翻譯的語音或者源語音,其中輸出單元將經(jīng)翻譯的語音和源語音存儲在語音存儲單元中,并且當(dāng)已經(jīng)用所有的目標(biāo) 語言生成經(jīng)翻譯的語音時輸出從語音存儲單元獲取的目標(biāo)語言的經(jīng)翻譯的語音和源語音, 以及發(fā)送單元將只包括經(jīng)翻譯的語音的經(jīng)混合的語音發(fā)送到先前發(fā)送源語音的終端,并且 將包括經(jīng)翻譯的語音和源語音的經(jīng)混合的語音發(fā)送到其他終端。
9. 如權(quán)利要求1所述的設(shè)備,其特征在于,該設(shè)備進(jìn)一步包括延遲單元,該延遲單元通 過從確定已經(jīng)用所有的目標(biāo)語言生成經(jīng)翻譯的語音的第一時間點(diǎn)減去接收源語音的第二 時間點(diǎn)計算第一差值,并且當(dāng)所計算的第一差值小于預(yù)先確定的第一閾值時間時延遲經(jīng)翻 譯的語音和源語音的輸出,直到從第二時間點(diǎn)開始已經(jīng)經(jīng)過第一閾值時間為止,其中在延遲單元延遲再現(xiàn)之后,輸出單元輸出經(jīng)翻譯的語音和源語音。
10. 如權(quán)利要求9所述的設(shè)備,其特征在于,該設(shè)備進(jìn)一步包括縮短單元,當(dāng)所述第一差 值大于第一閾值時間時,該縮短單元將經(jīng)翻譯的語音和源語音的再現(xiàn)時間縮短通過從第一 差值中減去第一閾值時間計算得到的第二差值的長度。
11. 如權(quán)利要求10所述的設(shè)備,其特征在于,縮短單元通過提高再現(xiàn)速度縮短經(jīng)翻譯的 語音和源語音的再現(xiàn)時間。
12. 如權(quán)利要求10所述的設(shè)備,其特征在于,縮短單元從每個經(jīng)翻譯的語音和源語音中 探測靜音和噪音中的至少兩者之一并且通過消除所述靜音和噪音縮短經(jīng)翻譯的語音和源 語音的再現(xiàn)時間。
13. 如權(quán)利要求9所述的設(shè)備,其特征在于,延遲單元計算預(yù)定個數(shù)的各第二語音持續(xù)時 間的第一差值,該第二語音持續(xù)時間是在用所有的目標(biāo)語言生成的經(jīng)翻譯的語音的第一語 音持續(xù)時間之前被輸出的經(jīng)翻譯的語音和源語音的持續(xù)時間,該延遲單元計算第一差值的 平均值與預(yù)定系數(shù)的乘積,并且當(dāng)所述乘積小于所述第一差值時延遲經(jīng)翻譯的語音和源語 音的第一語音持續(xù)時間的再現(xiàn),直到從第二時間點(diǎn)開始已經(jīng)經(jīng)過第一閾值時間時為止。
14. 如權(quán)利要求13所述的設(shè)備,其特征在于,延遲單元利用已經(jīng)在第一語音持續(xù)時間之前輸出的經(jīng)翻譯的語音和源語音的預(yù)定個數(shù)的第二語音持續(xù)時間計算所述乘積,每個第二 持續(xù)時間大于預(yù)先確定的第二閾值時間。
15. 如權(quán)利要求l所述的設(shè)備,其特征在于,接收單元從終端進(jìn)一步接收與源語音相關(guān)聯(lián)的圖像,以及 發(fā)送單元發(fā)送進(jìn)一步與經(jīng)翻譯的語音或者源語音相關(guān)聯(lián)的圖像。
16. 如權(quán)利要求15所述的設(shè)備,其特征在于,生成單元生成其再現(xiàn)時間與源語音基本相 同的經(jīng)翻譯的語音。
17. 如權(quán)利要求16所述的設(shè)備,其特征在于,當(dāng)經(jīng)翻譯的語音的再現(xiàn)時間比源語音的再 現(xiàn)時間短時,翻譯單元通過在經(jīng)翻譯的語音前后的至少一處位置添加靜音生成其再現(xiàn)時間 與源語音基本相同的經(jīng)翻譯的語音。
18. —種終端,其特征在于,該終端包括 接收源語音的語音接收單元;發(fā)送單元,將源語音發(fā)送到可通過網(wǎng)絡(luò)連接的用于翻譯源語音并且生成經(jīng)翻譯的語音的語音翻譯設(shè)備;從語音翻譯設(shè)備接收經(jīng)翻譯的語音的第一接收單元;輸出經(jīng)翻譯的語音的語音輸出單元;從語音翻譯設(shè)備接收完成源語音翻譯的估計時間的第二接收單元;和 顯示該估計時間的顯示單元。
19. 一種語音翻譯設(shè)備,其特征在于,該設(shè)備包括對應(yīng)存儲單元,存儲彼此相關(guān)聯(lián)的唯一標(biāo)識通過網(wǎng)絡(luò)連接的多個終端中的每一個終端 的標(biāo)識符和在所述終端中使用的使用語言; 接收單元,從一個終端接收源語音;翻譯單元,從對應(yīng)存儲單元中獲取與源語音中使用的源語言不同的使用語言,并且通過將每個所獲取的使用語言作為目標(biāo)語言來生成從源語音翻譯的經(jīng)翻譯的語音;發(fā)送單元,將經(jīng)翻譯的語音發(fā)送到由對應(yīng)于目標(biāo)語言的標(biāo)識符標(biāo)識的每個終端并且將源語音發(fā)送到由對應(yīng)于源語言的標(biāo)識符標(biāo)識的每個終端;確定單元,當(dāng)用任何一個目標(biāo)語言生成經(jīng)翻譯的語音時確定是否已經(jīng)用所有的目標(biāo)語 言生成經(jīng)翻譯的語音;禾口輸出單元,當(dāng)已經(jīng)用所有的目標(biāo)語言生成經(jīng)翻譯的語音時輸出由確定單元確定的源語 音的語音持續(xù)時間的持續(xù)時間信息,其中發(fā)送單元進(jìn)一步將所述持續(xù)時間信息發(fā)送到各個終端。
20. —種終端,其特征在于,該終端包括 能夠存儲包括經(jīng)翻譯的語音或源語音的經(jīng)混合的語音的語音存儲單元; 接收源語音的語音接收單元;將輸入源語音發(fā)送到可通過網(wǎng)絡(luò)連接的語音翻譯設(shè)備的發(fā)送單元,語音翻譯設(shè)備翻譯 源語音并且生成經(jīng)翻譯的語音;從語音翻譯設(shè)備接收經(jīng)翻譯的語音的第一接收單元;將經(jīng)翻譯的語音與語音存儲單元中的經(jīng)混合的語音混合以生成結(jié)果的經(jīng)混合的語音并且將結(jié)果的經(jīng)混合的語音存儲在語音存儲單元中的保存單元;從語音翻譯設(shè)備接收有關(guān)源語音的語音持續(xù)時間的持續(xù)時間信息的第二接收單元;和 輸出由從語音存儲單元獲取的持續(xù)時間信息表示的語音持續(xù)時間所對應(yīng)的結(jié)果的經(jīng)混合的語音的輸出單元。
21. —種語音翻譯設(shè)備,其特征在于,該設(shè)備包括 存儲使用語言的語言存儲單元;從多個可通過網(wǎng)絡(luò)連接的其他語音翻譯設(shè)備中接收源語音的第一接收單元;通過將每個存儲在語言存儲單元中的使用語言作為目標(biāo)語言生成從源語音翻譯的經(jīng) 翻譯的語音的翻譯單元;從另一個語音翻譯設(shè)備接收指示源語音已經(jīng)被翻譯成另一個語音翻譯設(shè)備中使用的 語言的信息的第二接收單元;當(dāng)從任何一個其他語音翻譯設(shè)備中接收到所述信息時確定是否已經(jīng)在所有其他語音 翻譯設(shè)備中生成經(jīng)翻譯的語音的確定單元;和當(dāng)已經(jīng)在所有其他語音翻譯設(shè)備中生成經(jīng)翻譯的語音時輸出經(jīng)翻譯的語音的輸出單
22. —種語音翻譯方法,其特征在于,該方法包括 從多個可通過網(wǎng)絡(luò)連接的終端中接收源語音;從存儲彼此相關(guān)聯(lián)的唯一標(biāo)識多個終端中的每個終端的標(biāo)識符和終端中使用的使用 語言的對應(yīng)存儲單元中獲取與源語音中使用的源語言不同的使用語言;通過將所獲取的每種使用語言作為目標(biāo)語言生成從源語音翻譯的經(jīng)翻譯的語音; 當(dāng)用任何一個目標(biāo)語言生成經(jīng)翻譯的語音時確定是否已經(jīng)用所有的目標(biāo)語言生成經(jīng) 翻譯的語音;當(dāng)確定已經(jīng)用所有的目標(biāo)語言生成經(jīng)翻譯的語音時輸出經(jīng)翻譯的語音;和 將輸出的經(jīng)翻譯的語音發(fā)送到由對應(yīng)于目標(biāo)語言的標(biāo)識符標(biāo)識的每個終端。
全文摘要
在語音翻譯設(shè)備中,對應(yīng)存儲單元在其中存儲彼此關(guān)聯(lián)的終端的標(biāo)識符和終端中使用的使用語言。接收單元從一個終端接收源語音。生成單元從對應(yīng)存儲單元中獲取使用語言,并且通過將每個所獲取的使用語言作為目標(biāo)語言生成經(jīng)翻譯的語音。當(dāng)用任何一個目標(biāo)語言生成經(jīng)翻譯的語音時,確定單元確定是否已經(jīng)用所有的目標(biāo)語言生成經(jīng)翻譯的語音。如果已經(jīng)用所有的目標(biāo)語言生成經(jīng)翻譯的語音,則輸出處理單元輸出經(jīng)翻譯的語音。發(fā)送單元將經(jīng)翻譯的語音發(fā)送到每個終端。
文檔編號H04N7/15GK101155291SQ20071014723
公開日2008年4月2日 申請日期2007年8月30日 優(yōu)先權(quán)日2006年9月27日
發(fā)明者永尾學(xué) 申請人:株式會社東芝
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1