機(jī)動車中的語音識別的制作方法
【專利說明】機(jī)動車中的語音識別
[0001]本發(fā)明涉及一種用于在機(jī)動車中進(jìn)行語音識別的方法。借助于車輛內(nèi)部的語音識別器一一該語音識別器在此被稱為車載-語音識別器,基于用戶的語音輸入由語音輸入來獲得語言文本。本發(fā)明還涉及一種用于實施本發(fā)明方法的機(jī)動車信息娛樂系統(tǒng),以及具有用于實施本發(fā)明方法的處理裝置的機(jī)動車。
[0002]當(dāng)今車輛中的信息-娛樂系統(tǒng)使用自動語音識別系統(tǒng)或ASR(Automatic SpeechRecognit1n),以便接收來自駕駛員的語音輸入。這些ASR可以要么在車輛本身(車載-onboard)中,要么在遠(yuǎn)程服務(wù)器(online)上。為此,識別裝置可以被配備用于執(zhí)行不同數(shù)量的任務(wù)。
[0003]在EP I 408 304 Al中介紹了一種用于機(jī)動車的控制系統(tǒng),該控制系統(tǒng)可以實現(xiàn)機(jī)動車的設(shè)備的語音控制。車輛外部的語音識別器(結(jié)合本發(fā)明這被稱為非車載-語音識別器)被用于識別單個語音輸入,也就是說將其轉(zhuǎn)換成機(jī)器可處理的語言文本。為此在現(xiàn)有技術(shù)中已經(jīng)公知,檢測語音聲音作為語音信號,然后將所述語音聲音數(shù)字化,并且借助于特征提取為語音識別做準(zhǔn)備。接下來將所提取到的特征通過移動通信傳遞給非車載-語音識別器,然后該非車載-語音識別器將其識別結(jié)果再次通過移動通信提供給機(jī)動車。這種解決方案的缺點是,必須有移動通信連接可供使用,語音識別才能正常工作。
[0004]在EP I 341 363 BI中介紹了一種駕駛員信息系統(tǒng),該駕駛員信息系統(tǒng)同樣使用了非車載-語音識別器。附加地,非車載-語音識別器可以被用于簡單的識別任務(wù),例如識別個別控制命令。在這種情況下,決策單元根據(jù)需要在車載-語音識別器和非車載-語音識別器之間進(jìn)行轉(zhuǎn)換,以便將用戶的單個語音輸入轉(zhuǎn)化成語言文本。非車載-語音識別器在此僅被設(shè)計用于在語音對話范圍內(nèi)進(jìn)行識別。反之,車載-語音識別器僅理解單個的指令詞。語音對話系統(tǒng)的優(yōu)點是,如果他還未明白特定的語言輸入,語音識別器可以提出疑問。然而,這種情況下的缺點是,在駕駛期間使用語音識別系統(tǒng)時會導(dǎo)致駕駛員分心。
[0005]本發(fā)明的目的是:在機(jī)動車中提供可靠的語音識別,其使得機(jī)動車中的用戶盡可能少地從交通現(xiàn)狀中分心。
[0006]該目的通過根據(jù)權(quán)利要求1所述的方法、根據(jù)權(quán)利要求12所述的信息娛樂系統(tǒng)和根據(jù)權(quán)利要求13所述的機(jī)動車來實現(xiàn)。本發(fā)明的有利的改進(jìn)方案由從屬權(quán)利要求給出。
[0007]根據(jù)本發(fā)明的方法確保:在不向用戶提出詢問的情況下將語音輸入傳輸給一自動的語音識別系統(tǒng)以生成語言文本。在對特定的語音輸入進(jìn)行語音識別有困難時,它以有利的方式防止了用戶從交通現(xiàn)狀中分心。根據(jù)本發(fā)明的方法在此通過車載的處理裝置來實施,該處理裝置從車輛內(nèi)部的檢測裝置一一例如帶有聯(lián)接在下游的信號處理裝置的麥克風(fēng)一一處接收用戶的語音輸入。至少一個所接收的語音輸入在此被處理裝置傳輸給車輛內(nèi)部的車載-語音識別器。然后,處理裝置從該車載-語音識別器接收第一識別結(jié)果、即例如可能的語言文本候選對象亦或多個可能的語言文本候選對象的列表。“語言文本候選對象”是將語音輸入轉(zhuǎn)換為了字符串的文本。如果發(fā)出的語音輸入為“Hallo”,那么正確的語言文本候選對象是字符串“Hallo”。代替于純文本“Hallo”,也可以以符號的形式表示為語言文本候選對象的語音識別結(jié)果或者表示為對可能的語言文本候選對象的列表的列表項的參考或者表示為列表項的標(biāo)識符(例如ID_0815)。
[0008]這時希望降低基于第一識別結(jié)果進(jìn)行錯誤識別的可能性,即降低輸出不正確的語言文本的可能性,這將使用戶不必分心。為此,通過處理裝置將語音輸入全部或部分地傳輸給車輛外部的非車載-語音識別器。然后由處理裝置從該非車載-語音識別器接收第二識別結(jié)果、即語言文本候選對象或者由多個語言文本候選對象組成的列表。然后,不僅根據(jù)第一識別結(jié)果而且根據(jù)第二識別結(jié)果通過處理裝置來確定最終作為識別結(jié)果而被輸出的語言文本。
[0009]根據(jù)本發(fā)明的方法具有以下優(yōu)點:語音輸入被全部或部分地傳輸給一種雙重的語音識別系統(tǒng),即,一重為傳輸給車輛內(nèi)的語音識別裝置,另一重為傳輸給車輛外的語音識別裝置。于是,最終作為識別結(jié)果而被輸出的語言文本更可能符合用戶實際說的話。結(jié)合本發(fā)明,語音輸入要么可以理解為經(jīng)變換的聲信號、即模擬信號,要么可以理解為數(shù)字信號,或者也可以理解為通過對語音信號進(jìn)行已知的特征提取而形成的、各信號段的特征的序列、即例如美爾倒譜系數(shù)的序列。
[0010]在一個實施方式中,根據(jù)本發(fā)明的方法規(guī)定進(jìn)行串行的語音識別模式,在該串行的語音識別模式中,語音輸入首先被傳輸給車載-語音識別器以進(jìn)行關(guān)鍵詞識別,并且第一識別結(jié)果被接收。然后,借助于第一識別結(jié)果從語音輸入提取至少一個由車載-語音識別器不能識別的部分,然后將該部分傳輸給非車載-語音識別器。由此得到以下優(yōu)點:首先使用通常具有較短反應(yīng)時間的車載-語音識別器進(jìn)行語音識別,僅僅對于在識別時有問題的情況才啟用通常更高效能的非車載-語音識別器。另一優(yōu)點在于:借助于關(guān)鍵詞識別通過處理裝置可以決定,要將語音輸入傳輸給多個可能的非車載-語音識別器中的哪一個。如果例如借助于關(guān)鍵詞識別已知用戶想要確定導(dǎo)航目的地,那么就可以相應(yīng)地控制用于導(dǎo)航系統(tǒng)的非車載-語音識別器。
[0011]根據(jù)本發(fā)明的方法的另一個實施方式規(guī)定,在并行的語音識別模式中,將至少一個語音輸入傳輸給車載-語音識別器并獨立地將該至少一個語音輸入傳輸給非車載-語音識別器。于是就有兩個識別結(jié)果可供使用,它們均與整個語音輸入有關(guān)。然后,例如可以將被作為語言文本候選對象而包含在兩個識別結(jié)果中的那個語言文本作為最終的識別結(jié)果進(jìn)行輸出。并行地使用車載-識別器和非車載-識別器的另一原因在于,兩種識別器可以覆蓋不同的職能范圍。于是,得到的不是兩個相同的或相似的結(jié)果,而是不同的結(jié)果。然而,兩個中的一個通常具有明顯更高的可信度、即用于識別的準(zhǔn)確度的指示值,從而也可以合理地選擇語言文本候選對象。
[0012]根據(jù)本方法的另一實施方式,由處理裝置根據(jù)針對預(yù)定語言文本內(nèi)容而預(yù)定的優(yōu)先級基于第一識別結(jié)果和第二識別結(jié)果確定語言文本。“語言文本內(nèi)容”這里系指一種主題語境,在該主題語境情況下用戶表達(dá)了語音輸入。因此,如果例如通過在串行的語音識別中進(jìn)行關(guān)鍵詞識別斷定了涉及導(dǎo)航目的地的輸入,那么就可以由非車載-語音識別器的第二識別結(jié)果從第二識別結(jié)果中有針對性地找到涉及導(dǎo)航目的地的語言文本候選對象。然后,通過關(guān)鍵詞識別來確定用于語言文本內(nèi)容“導(dǎo)航”的優(yōu)先級。
[0013]根據(jù)本發(fā)明的一個實施方式,由處理裝置根據(jù)至少一個環(huán)境參數(shù)基于第一識別結(jié)果和第二識別結(jié)果確定語言文本。所述環(huán)境參數(shù)描述機(jī)動車中當(dāng)前的識別情況。例如可以通過環(huán)境參數(shù)來指示:機(jī)動車是否處于堵車狀態(tài)、機(jī)動車位于哪里(例如GPS-接收器的地理坐標(biāo))、車輛位于所計劃的行駛路線的起始位置還是終點位置、機(jī)動車當(dāng)前是否在去駕駛員的工作場所的途中或者機(jī)動車是否在回家的返程路上。行駛類型(例如前往辦公室或回家)例如可以從駕駛員激活的個人資料中讀取。
[0014]附加于此地或替代于此地,也可以根據(jù)當(dāng)前的車輛狀態(tài)來確定語言文本。例如可以以“是否剛剛有電話呼叫并且例如通過鈴聲告知給駕駛員”為根據(jù)。同樣可以檢查,在機(jī)動車中是否剛剛向駕駛員發(fā)出了一定的指示、例如警告信號。環(huán)境參數(shù)和當(dāng)前的車輛狀態(tài)是一種可靠的指示:用戶剛剛想用其語音輸入表達(dá)什么。如果駕駛員例如正好在從工作回家的路上,那么他更有可能想要把涉及到其自由時間的東西作為語音輸入。就其它情況而言,駕駛員在去工作的路上更可能處理或準(zhǔn)備工作上的事情,于是,這就同樣為語音識別提供了重要的語境。如果向駕駛員發(fā)出了警告指示,那么他的語音輸入可能會涉及到該警告指示。在確定語言文本時,可以采用以下方式使用環(huán)境參數(shù)和車輛狀態(tài),即就識別結(jié)果而言,該識別結(jié)果具有多個語音識別候選對象、即多個可能的合理的識別結(jié)果,那些與相應(yīng)的環(huán)境參數(shù)和/或車輛狀態(tài)相適配的識別結(jié)果被優(yōu)選或設(shè)為優(yōu)先。
[0015]尤其有利的是,在所述方法中由處理裝置