專利名稱:通信終端處理聲音信號(hào)的方法和使用該方法的通信終端的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信終端處理聲音信號(hào)的方法以及使用該方法的通信終 端,具體地涉及與不同聲音獲取系統(tǒng)一起使用該通信終端。 本發(fā)明可以特別地使用在移動(dòng)電話中。
背景技術(shù):
有一些已知的、使用必需的語(yǔ)音識(shí)別功能的通信終端,例如通過說(shuō)出 被叫方的姓名,或?yàn)榱藛?dòng)諸如日歷的顯示的某種功能,而發(fā)起呼叫。在通信終端中,特別是在移動(dòng)通信終端的情況下,語(yǔ)音識(shí)別裝置,特 別是處理和存儲(chǔ)信息的裝置都是受限的,因?yàn)橹亓?、成本和整體尺寸的約 束是這些通信終端設(shè)計(jì)者必須遵從的。此外,如下文將詳細(xì)描述的相同的通信終端,以及由此相同的語(yǔ)音識(shí) 別裝置可以與不同的聲音獲取系統(tǒng)一起使用,該系統(tǒng)尤其包括不同的話筒 和/或不同的到通信終端的連接裝置。圖1概略地表示了現(xiàn)有技術(shù)的一個(gè)例子中的語(yǔ)音識(shí)別的操作。通信終端100,包括內(nèi)部語(yǔ)音識(shí)別裝置108,交替使用不同的聲音獲取 系統(tǒng)特別包括內(nèi)部話筒102的系統(tǒng)101、特別包括位于通信終端100外 部的話筒104的行人免提工具包(pedestrian hand-free kit)系統(tǒng)103,或 者特別包括位于通信終端100外部的話筒106的車栽免提工具包(car hand-free kit)系統(tǒng)105。這些識(shí)別裝置將從信號(hào)114、 116或118中提取的參數(shù)與包含在通信終 端內(nèi)部的數(shù)據(jù)庫(kù)IIO中的參數(shù)進(jìn)行比較,其中信號(hào)114、 116或118信號(hào)由 系統(tǒng)101、 103或105之一發(fā)送,數(shù)據(jù)庫(kù)110中的參數(shù)代表如名字或功能的
數(shù)據(jù)項(xiàng)。為此,該操作對(duì)每次比較一般采用識(shí)別得分,并選擇具有超過特定識(shí) 別閾值的最高識(shí)別得分的存儲(chǔ)參數(shù)集。如果存儲(chǔ)參數(shù)集足夠接近從接收信號(hào)中提取的參數(shù),那么將該參數(shù)集發(fā)送到通信終端的管理裝置112以執(zhí)行操作,例如進(jìn)行呼叫。此接近程度也稱為通信終端的語(yǔ)音識(shí)別率。對(duì)于有效的語(yǔ)音識(shí)別方法,該成功率必須超過95%。數(shù)據(jù)庫(kù)110尤其通過在工廠內(nèi)存儲(chǔ)所謂的多揚(yáng)聲器序列(multispeakersequence)而建立,因?yàn)閷?duì)于相同的序列,它們結(jié)合了潛在的、不同人之間的聲音差異。它也可以通過所謂的學(xué)習(xí)過程來(lái)建立,該過程涉及特定用戶,所述特 定用戶借助于專用于通信終端的功能將聲音關(guān)聯(lián)到通信終端100的數(shù)據(jù)或 功能項(xiàng)。根據(jù)針對(duì)本發(fā)明的觀察,顯而易見,用戶能夠?qū)⑼ㄐ沤K端100與不同 的聲音獲取系統(tǒng)101、 103或105—起使用,這樣,所述系統(tǒng)的每一個(gè)都會(huì) 引入其自身的失真到用戶102發(fā)出的信號(hào)中(特別地,由此而來(lái)的諧波失 真和音量的特定失真,或靈敏度對(duì)背景噪聲和回波的特定失真)。因此,對(duì)于用戶使用其通信終端的通信終端的語(yǔ)音識(shí)別設(shè)施來(lái)說(shuō),如 果通信終端使用的是聲音信號(hào)獲取系統(tǒng),而不是學(xué)習(xí)過程所引導(dǎo)的系統(tǒng), 或多揚(yáng)聲器預(yù)記錄的實(shí)現(xiàn)所基于的系統(tǒng),則語(yǔ)音識(shí)別率經(jīng)常被判斷為不足。發(fā)明內(nèi)容這就是為本發(fā)明涉及通信終端處理語(yǔ)音信號(hào)的方法的原因所在,該通 信終端使用語(yǔ)音識(shí)別裝置,該裝置將這些語(yǔ)音信號(hào)和存儲(chǔ)在數(shù)據(jù)庫(kù)中的數(shù) 據(jù)進(jìn)行比較,以便識(shí)別對(duì)應(yīng)于這些信號(hào)的數(shù)據(jù),被識(shí)別的數(shù)據(jù)纟H送到管 理裝置以觸發(fā)動(dòng)作,該方法特征在于,語(yǔ)音信號(hào)有可能由不同的聲音獲取 系統(tǒng)提供,單獨(dú)的語(yǔ)音識(shí)別裝置用于每個(gè)獲取系統(tǒng)。由于本發(fā)明,對(duì)于通信終端的不同聲音獲取系統(tǒng),可以獲得滿意的語(yǔ)
音識(shí)別率,因?yàn)樾盘?hào)的處理適合每個(gè)獲取系統(tǒng)。因此用戶能夠滿意地將語(yǔ)音識(shí)別功能與所有聲音獲取系統(tǒng)一起使用, 聲音獲取系統(tǒng)的使用與其通信終端相關(guān)。在一個(gè)實(shí)施例中,數(shù)據(jù)庫(kù)包括獨(dú)立的子數(shù)據(jù)庫(kù),每個(gè)子數(shù)據(jù)庫(kù)關(guān)聯(lián)到 一個(gè)聲音獲取系統(tǒng),以便語(yǔ)音識(shí)別裝置優(yōu)先使用關(guān)聯(lián)到用來(lái)實(shí)現(xiàn)比較的聲 音獲取系統(tǒng)的子數(shù)據(jù)庫(kù)。在一個(gè)實(shí)施例中,對(duì)于每個(gè)子數(shù)據(jù)庫(kù),信號(hào)和存儲(chǔ)數(shù)據(jù)之間的比較連 續(xù)地進(jìn)行,直到通過所述比較達(dá)到必需的識(shí)別率。在一個(gè)實(shí)施例中,用不同語(yǔ)音識(shí)別系統(tǒng)完成語(yǔ)音識(shí)別學(xué)習(xí)過程,以產(chǎn) 生專用于每個(gè)語(yǔ)音識(shí)別系統(tǒng)的子數(shù)據(jù)庫(kù)。在一個(gè)實(shí)施例中,通信終端的語(yǔ)音識(shí)別裝置結(jié)合至少兩個(gè)聲音信號(hào)濾 波器,每個(gè)濾波器專用于通信終端的 一個(gè)聲音獲取系統(tǒng)。在一個(gè)實(shí)施例中,濾波器具有預(yù)定的濾波器特征。在一個(gè)實(shí)施例中,由濾波器傳遞的信號(hào)由語(yǔ)音識(shí)別裝置相對(duì)于數(shù)據(jù)庫(kù) 進(jìn)行相同處理。在一個(gè)實(shí)施例中,語(yǔ)音識(shí)別裝置包含關(guān)聯(lián)到第 一語(yǔ)音識(shí)別系統(tǒng)的固定 濾波器裝置,和關(guān)聯(lián)到第二濾波器系統(tǒng)的動(dòng)態(tài)濾波器裝置,這些動(dòng)態(tài)濾波 器檢測(cè)固定濾波特征以傳遞信號(hào),該信號(hào)類似于固定濾波傳遞的信號(hào)。本發(fā)明還涉及通信終端,其^f吏用語(yǔ)音識(shí)別裝置處理語(yǔ)音信號(hào),該裝置 將這些語(yǔ)音信號(hào)和數(shù)據(jù)庫(kù)內(nèi)的存儲(chǔ)數(shù)據(jù)進(jìn)行比較,以^更識(shí)別對(duì)應(yīng)于這些信 號(hào)的數(shù)據(jù),被識(shí)別的數(shù)據(jù)被發(fā)送到管理裝置以觸發(fā)動(dòng)作,該通信終端特征 在于,語(yǔ)音信號(hào)有可能由不同的聲音獲取系統(tǒng)提供,它包括用于每個(gè)獲取 系統(tǒng)的單獨(dú)的語(yǔ)音識(shí)別裝置。在一個(gè)實(shí)施例中,通信終端的特征在于數(shù)據(jù)庫(kù)位于通信終端外部的服 務(wù)器中。在一個(gè)實(shí)施例中,通信終端包括數(shù)據(jù)庫(kù)中的獨(dú)立子數(shù)據(jù)庫(kù),每個(gè)子數(shù) 據(jù)庫(kù)關(guān)聯(lián)到一個(gè)聲音獲取系統(tǒng),以便語(yǔ)音識(shí)別裝置優(yōu)先使用關(guān)聯(lián)到用戶用 來(lái)實(shí)現(xiàn)比較的聲音獲取系統(tǒng)的子數(shù)據(jù)庫(kù)。
在一個(gè)實(shí)施例中,通信終端包括在信號(hào)與所述存儲(chǔ)數(shù)據(jù)之間對(duì)于每個(gè) 子數(shù)據(jù)庫(kù)連續(xù)地進(jìn)行比較直到通過所述比較達(dá)到要求的識(shí)別率為止的裝 置。在一個(gè)實(shí)施例中,通信終端包括用不同的語(yǔ)音識(shí)別系統(tǒng)進(jìn)行語(yǔ)音識(shí)別 學(xué)習(xí)過程以產(chǎn)生專用于每個(gè)語(yǔ)音識(shí)別系統(tǒng)的子數(shù)據(jù)庫(kù)的裝置。在一個(gè)實(shí)施例中,通信終端在所述通信終端的所述語(yǔ)音識(shí)別裝置內(nèi), 包括至少兩個(gè)聲音信號(hào)濾波器,每個(gè)所述濾波器專用于所述通信終端的一 個(gè)聲音獲取系統(tǒng)。在一個(gè)實(shí)施例中,通信終端包括具有預(yù)定的固定濾波器特征的濾波器。在一個(gè)實(shí)施例中,通信終端包括由所述語(yǔ)音識(shí)別裝置相對(duì)于所述數(shù)據(jù) 庫(kù)對(duì)濾過的信號(hào)進(jìn)行相同處理所憑借的裝置。在一個(gè)實(shí)施例中,通信終端包括語(yǔ)音識(shí)別裝置,該裝置包含與第一語(yǔ) 音識(shí)別系統(tǒng)相關(guān)聯(lián)的固定濾波器裝置,和與第二濾波系統(tǒng)相關(guān)聯(lián)的動(dòng)態(tài)濾 波器裝置,這些動(dòng)態(tài)濾波器裝置檢測(cè)固定濾波特征以傳遞信號(hào),該信號(hào)類 似于固定濾波傳遞的信號(hào)。在一個(gè)實(shí)施例中,通信終端包括話筒。在一個(gè)實(shí)施例中,所述聲音獲取系統(tǒng)之一是行人免提工具包、車載免 提工具包或集成到所述通信終端的識(shí)別系統(tǒng)。
才艮據(jù)下文通過非限制性例子給出的描述,并參考附圖,本發(fā)明的其他特征和優(yōu)點(diǎn)將變得顯而易見,其中圖1,已經(jīng)描述過,表示通信終端的現(xiàn)有技術(shù)的一個(gè)語(yǔ)音識(shí)別例子。圖2是使用本發(fā)明的應(yīng)用的概略表示。圖3是本發(fā)明的第一實(shí)施例的示意圖。圖4是本發(fā)明的第二實(shí)施例的示意圖。圖5是引入到本發(fā)明的不同實(shí)施例中的頻傳校正示圖,并且圖6是本發(fā)明的第三實(shí)施例的概略表示。
具體實(shí)施方式
圖2概略地表示根據(jù)本發(fā)明的語(yǔ)音識(shí)別方法針對(duì)用戶202使用的同樣 的移動(dòng)通信終端204的三種聲音獲取系統(tǒng)的使用。在此情況下,認(rèn)為所謂的語(yǔ)音識(shí)別學(xué)習(xí)步驟已經(jīng)被執(zhí)行,用戶借助于 其語(yǔ)音或任何其他可識(shí)別的聲音信號(hào)能夠觸發(fā)通信終端的功能。例如,用戶202借助于他的語(yǔ)音203通過說(shuō)出聯(lián)絡(luò)人的名字,簡(jiǎn)單地 命令他的通信終端204向該聯(lián)絡(luò)人發(fā)起呼叫。移動(dòng)通信終端的語(yǔ)音識(shí)別功能的使用200例如與聲音獲取系統(tǒng)206 — 起使用,該聲音獲取系統(tǒng)206集成到通信終端204并包括話筒。正如已經(jīng)描述過的,通信終端的語(yǔ)音識(shí)別裝置將用戶信號(hào)的^t與存 儲(chǔ)在數(shù)據(jù)庫(kù)中的參數(shù)集比較,所述信號(hào)接著將由系統(tǒng)206發(fā)送。如果比較是成功的,則通信終端204向請(qǐng)求的聯(lián)絡(luò)人發(fā)起呼叫。-在移動(dòng)通信終端204與聲音獲取系統(tǒng)212 —起^f吏用210的情況下, 用戶則可以決定將他的通信終端204夾在他的腰帶上或放進(jìn)他的口袋內(nèi), 該聲音獲取系統(tǒng)212通常稱為行人免提工具包,特別地,行人免提工具包 集成了靠近用戶嘴部202和耳朵214的話筒216、電纜,以及將其連接到 通信終端204的連接裝置。由于本發(fā)明,用戶能夠?qū)υ捦?16說(shuō)出聯(lián)絡(luò)人的名字,并對(duì)聯(lián)絡(luò)人成 功命令呼叫。-在移動(dòng)通信終端204與車栽免提工具包一起使用218的情況下,用 戶202可以決定在車220內(nèi)的另一個(gè)聲音獲取系統(tǒng)228的幫助下使用移動(dòng) 通信終端204,該車栽免提工具包特別地集成了話筒230、電纜以及將它們 連接到通信終端204的連接裝置222。用戶對(duì)話筒230說(shuō)出他的聯(lián)絡(luò)人的名字,并因此命令對(duì)聯(lián)絡(luò)人的呼叫。 因此,顯而易見,如果使用根據(jù)本發(fā)明的方法,用戶202能夠?qū)⑵渫?信終端的語(yǔ)音識(shí)別功能與不同的聲音獲取系統(tǒng)206、 212或218 —起4吏用, 這些系統(tǒng)不會(huì)引起任何語(yǔ)音識(shí)別問題,下文中將描述本發(fā)明的三個(gè)優(yōu)選實(shí) 施例。第一個(gè)實(shí)施例在圖3中概略地表示,包括通信終端300,該終端特別 地配備有語(yǔ)音識(shí)別裝置302;參數(shù)集數(shù)據(jù)庫(kù)304,所述參數(shù)集的每一個(gè)對(duì)應(yīng) 于要識(shí)別的功能;內(nèi)部聲音獲取系統(tǒng),特別地包括集成的話筒306;以及 通信終端300的管理裝置312。通信終端也可以使用聲音獲取系統(tǒng)307和聲音獲取系統(tǒng)309,該聲音 獲取系統(tǒng)307對(duì)應(yīng)于行人免提工具包例如包括話筒308,該聲音獲取系統(tǒng) 309對(duì)應(yīng)于車栽免提工具包,例如特別地包括話筒310。然后,用戶用集成了不同話筒306、 308和310的不同系統(tǒng)305、 307 和309,執(zhí)行語(yǔ)音識(shí)別學(xué)習(xí)過程。此外,通信終端包括用于檢測(cè)所使用的聲音獲取系統(tǒng)和抑制其他系統(tǒng) 的裝置。因此,在第一操作中,用戶使用其通信終端300的集成的話筒306, 例如通過在他的通信終端上選擇他希望與聲音序列相關(guān)聯(lián)的功能,然后對(duì) 該聲音序列進(jìn)行一次或幾次來(lái)執(zhí)行學(xué)習(xí)過程。這產(chǎn)生了取決于系統(tǒng)305的特征的信號(hào)320。語(yǔ)音識(shí)別裝置302從這 個(gè)信號(hào)320中提取參數(shù)集,該參數(shù)集然后被存儲(chǔ)在數(shù)據(jù)庫(kù)304的子數(shù)據(jù)庫(kù) 或分區(qū)314中。-然后,在第二操作中,用戶安裝包括另一個(gè)話筒308的免提工具包 系統(tǒng)307,并且對(duì)先前處理的功能,用話筒308執(zhí)行學(xué)習(xí)過程。語(yǔ)音識(shí)別 裝置302從信號(hào)322中提取參數(shù)集,該信號(hào)取決于系統(tǒng)307,參數(shù)集存儲(chǔ) 在數(shù)據(jù)庫(kù)304的分區(qū)316中。-最后,在第三操作中,用戶安裝包括另一個(gè)話筒310的車載免提工 具包系統(tǒng)309,并對(duì)與前面一樣的數(shù)據(jù)項(xiàng)或功能,執(zhí)行一次或多次學(xué)習(xí)過 程。語(yǔ)音識(shí)別裝置302從信號(hào)324中提取參數(shù)集,接著信號(hào)324由系統(tǒng)309 發(fā)送,參數(shù)集則存儲(chǔ)在數(shù)據(jù)庫(kù)304的分區(qū)318中。如果用戶打算將它們啟動(dòng),其他的聲音獲取系統(tǒng)也可以按照類似方式 被關(guān)聯(lián)。在這種情況下,通過學(xué)習(xí)過程獲得的參數(shù)集存儲(chǔ)在與每個(gè)其它話 筒相關(guān)聯(lián)的新分區(qū)中??傊?,不同的*集(一個(gè)用于所使用的每個(gè)聲音獲取系統(tǒng))與相同的功能相關(guān)它們被存儲(chǔ)在數(shù)據(jù)庫(kù)304的分區(qū)中,每個(gè)分區(qū)與給定系統(tǒng)關(guān) 聯(lián),并且因此集成了來(lái)自上述系統(tǒng)的信號(hào)的傳輸特征。此后,當(dāng)用戶希望使用語(yǔ)音識(shí)別時(shí),通信終端識(shí)別所使用的系統(tǒng),這 樣已經(jīng)使用的識(shí)別降低了回聲和背景噪聲。最后,它將裝置302從信號(hào)320、 322或324中提取的參數(shù),與存儲(chǔ)在 對(duì)應(yīng)于使用的系統(tǒng)的分區(qū)中的參數(shù)集進(jìn)行比較。這就將需要比較的數(shù)目的 減少到三分之一。這個(gè)實(shí)施例有著許多變體。 一個(gè)變體將用戶所說(shuō)出的序列與在那個(gè)特 定時(shí)刻所使用的分區(qū)進(jìn)行比較。如果比較不能滿足所需的識(shí)別率,則繼續(xù)在其他分區(qū)進(jìn)行比較,直到 成功為止,或直到在存儲(chǔ)器中沒有找到滿意的匹配為止。本發(fā)明的第二實(shí)施例在圖4中概略表示,該圖示出通信終端400,其 特別地包括語(yǔ)音識(shí)別裝置402、數(shù)據(jù)庫(kù)404、通信終端的管理裝置412,和 特別地包括話筒406的聲音獲取系統(tǒng)405。通信終端也可以與包括兩個(gè)其他的話筒的兩個(gè)其他聲音獲取系統(tǒng)一起 操作系統(tǒng)407,特別地包括話筒408,例如所述系統(tǒng)407是免提工具包, 以及系統(tǒng)409,特別地包括話筒409,例如所述系統(tǒng)409是車載免提工具包。在該實(shí)施例中,在所述系統(tǒng)使用之前,與通信終端400相關(guān)聯(lián)的不同 聲音獲取系統(tǒng)405、 407和409的信號(hào)傳輸特征是已知的。實(shí)際上,與通信終端400相關(guān)聯(lián)的不同聲音信號(hào)獲取系統(tǒng)405、 407 和409的表現(xiàn)與濾波器類似。以下被集成到語(yǔ)音識(shí)別裝置402:濾波器裝置414,與位于通信終端400內(nèi)部的聲音信號(hào)獲取系統(tǒng)405 相關(guān)聯(lián)。濾波器裝置416,與位于通信終端400外部的聲音信號(hào)獲取系統(tǒng)407 相關(guān)聯(lián)。
濾波器裝置418,與位于通信終端400外部的聲音信號(hào)獲取系統(tǒng)409 相關(guān)聯(lián)。更詳細(xì)地,圖5是通過逆濾波的頻諳特征適配的例子,其是可以用于 該實(shí)施例的濾波的特殊形式。例如,圖5表示了三個(gè)衰減曲線,繪制在縱坐標(biāo)軸502上衰減量dB 值是繪制在橫坐標(biāo)軸504上的頻率的函數(shù)。曲線506表示聲音信號(hào)獲取系統(tǒng)405、 407或409的頻率響應(yīng)。曲線 508表示分別與系統(tǒng)405, 407或409相關(guān)聯(lián)的濾波器裝置414、 416、 418 之一的頻率響應(yīng)。這樣,在逆濾波裝置的輸出端得到平坦響應(yīng)510,其在所需通帶內(nèi)與 頻率無(wú)關(guān),也與所使用的聲音獲取系統(tǒng)無(wú)關(guān)。如果這些逆濾波器應(yīng)用到每個(gè)獲取系統(tǒng),在不同逆濾波裝置的輸出端 得到可比較的信號(hào)。在該實(shí)施例中,僅使用一個(gè)獲取系統(tǒng)就足以執(zhí)行學(xué)習(xí)過程,或僅考慮 一個(gè)獲取系統(tǒng),尤其是內(nèi)部系統(tǒng)405的特征,就足夠產(chǎn)生多揚(yáng)聲器記錄。實(shí)際上,通過語(yǔ)音識(shí)別裝置420可以對(duì)存儲(chǔ)在數(shù)據(jù)庫(kù)404中的對(duì)應(yīng)參 數(shù)集與所述語(yǔ)音識(shí)別裝置420的輸入信號(hào)422、 424或426之一進(jìn)行同類比 較,該比較與下述事實(shí)無(wú)關(guān)所述信號(hào)422、 424或426基于信號(hào)428、 430 或432,在濾波器裝置414、 416或418中被處理。這個(gè)實(shí)施例導(dǎo)致了各種各樣的變體,例如,使用位于內(nèi)部系統(tǒng)405的 外部的濾波器裝置414。本發(fā)明的第三個(gè)實(shí)施例在圖6中表示。在這個(gè)實(shí)施例中,通信終端600 特別地包括語(yǔ)音識(shí)別裝置602、數(shù)據(jù)庫(kù)614、通信終端的管理裝置616和聲 音信號(hào)獲取裝置607,特別地,所述裝置607包括話筒608。另一個(gè)聲音信號(hào)獲取系統(tǒng)609可以連接到通信終端600,如果用戶希 望的話。特別地,系統(tǒng)609可以是免提工具包或車栽免提工具包。語(yǔ)音識(shí)別裝置602包括-用于聲音信號(hào)獲取系統(tǒng)607的信號(hào)處理裝置604,-自適應(yīng)濾波器裝置612,—算法裝置606,使用數(shù)據(jù)庫(kù)614以執(zhí)行語(yǔ)音識(shí)別算法。 自適應(yīng)濾波器裝置612通過將用戶未i兌話時(shí)來(lái)自系統(tǒng)609的信號(hào)618與信號(hào)622進(jìn)行比較,來(lái)檢測(cè)來(lái)自系統(tǒng)609的信號(hào)的處理特征,以便識(shí)別濾波器裝置612傳遞類似于信號(hào)622的信號(hào)620。換言之,取決于實(shí)施方式,交替或同時(shí)地貫穿于系統(tǒng)607和系統(tǒng)609,周圍環(huán)境補(bǔ)t聽兩次。該實(shí)施例的變體不是在學(xué)習(xí)步驟內(nèi),而是在操作期間系統(tǒng)地實(shí)現(xiàn)這個(gè)二次監(jiān)聽,其中所述操作期間特別地是在給定時(shí)間間隔內(nèi)或者是在發(fā)起與接收的每一個(gè)呼叫上。一旦參數(shù)612計(jì)算出來(lái),它們必須被保留以在識(shí)別階段處理信號(hào)618。 適合的信號(hào)618變成信號(hào)620,信號(hào)620接著能由算法裝置606處理,以從中提取所述算法所需的參數(shù),然后將這些參數(shù)與存儲(chǔ)在數(shù)據(jù)庫(kù)614的參數(shù)集進(jìn)行比較。圖6還示出裝置604,其處理來(lái)自聲音信號(hào)獲取系統(tǒng)607的信號(hào)624 以使它附加地適應(yīng)預(yù)定等級(jí),并將其轉(zhuǎn)換為信號(hào)622。在圖7中,移動(dòng)通信終端300、 400、 600在無(wú)線通信網(wǎng)內(nèi)發(fā)送和接收 呼叫。數(shù)據(jù)庫(kù)304、 404、 614位于移動(dòng)通信終端外部的服務(wù)器700中,該 服務(wù)器也位于無(wú)線通信網(wǎng)中。
權(quán)利要求
1.一種用于通信終端(300、400、600)處理語(yǔ)音信號(hào)(320、322、324、428、430、432、618、624)的方法,該通信終端使用語(yǔ)音識(shí)別裝置(302、402、602),該裝置將所述語(yǔ)音信號(hào)與存儲(chǔ)在數(shù)據(jù)庫(kù)(304、404、604)中的數(shù)據(jù)進(jìn)行比較,以便識(shí)別對(duì)應(yīng)于所述信號(hào)的數(shù)據(jù),被識(shí)別的數(shù)據(jù)被發(fā)送到管理裝置(312、412、616)用于觸發(fā)動(dòng)作,該方法特征在于,所述語(yǔ)音信號(hào)有可能由不同的聲音獲取系統(tǒng)(305、307、309、405、407、409、607、609)提供,單獨(dú)的語(yǔ)音識(shí)別裝置用于每個(gè)獲取系統(tǒng)。
2. 根據(jù)權(quán)利要求l的方法,其特征在于,所述數(shù)據(jù)庫(kù)(304)包括獨(dú) 立的子數(shù)據(jù)庫(kù)(314、 316、 318),每個(gè)子數(shù)據(jù)庫(kù)(314、 316、 318)關(guān)聯(lián) 到一個(gè)聲音獲取系統(tǒng)(305、 307、 309),以便所述語(yǔ)音識(shí)別裝置優(yōu)先使用 關(guān)聯(lián)到用于實(shí)現(xiàn)所述比較的所述聲音獲取系統(tǒng)(305、 307、 309)的子數(shù)據(jù) 庫(kù)(314、 316、 318)。
3. 根據(jù)權(quán)利要求2的方法,其特征在于,對(duì)于每一個(gè)子數(shù)據(jù)庫(kù)(314、 316、 318),信號(hào)(320、 322、 324)與所述存儲(chǔ)數(shù)據(jù)之間的比較連續(xù)地進(jìn) 行,直到通過所述比較達(dá)到要求的識(shí)別率。
4. 根據(jù)權(quán)利要求2或3的方法,其特征在于,用不同的語(yǔ)音識(shí)別系統(tǒng) (305、 307、 309)完成語(yǔ)音識(shí)別學(xué)習(xí)過程,以產(chǎn)生專用于每個(gè)語(yǔ)音識(shí)別系統(tǒng)的子數(shù)據(jù)庫(kù)(314、 316、 318)。
5. 根據(jù)權(quán)利要求l的方法,其特征在于,所述通信終端的所述語(yǔ)音識(shí) 別裝置結(jié)合了至少兩個(gè)聲音信號(hào)濾波器(414、 416、 418),每個(gè)所述濾波 器專用于所述通信終端的一個(gè)聲音獲取系統(tǒng)(405、 407、 409)。
6. 根據(jù)權(quán)利要求5的方法,其特征在于,所述濾波器(414、 416、 418) 具有預(yù)定濾波器特征。
7. 根據(jù)權(quán)利要求5或6的方法,其特征在于,通過所述濾波器(414、 416、 418)傳遞的信號(hào)(422、 424、 426)由語(yǔ)音識(shí)別裝置相對(duì)于所述數(shù)據(jù) 庫(kù)(404)進(jìn)行相同處理。
8. 根據(jù)權(quán)利要求l的方法,其特征在于,所述語(yǔ)音識(shí)別裝置包含與第 一語(yǔ)音識(shí)別系統(tǒng)(607)相關(guān)聯(lián)的固定濾波器裝置(604),和與第二濾波 系統(tǒng)(609 )相關(guān)聯(lián)的動(dòng)態(tài)濾波器裝置(612 ),所述動(dòng)態(tài)濾波器裝置(612 ) 檢測(cè)固定濾波的特征以傳遞信號(hào),該信號(hào)類似于所述固定濾波傳遞的信號(hào)。
9. 一種使用語(yǔ)音識(shí)別裝置處理語(yǔ)音信號(hào)(320、 322、 324、 428、 430、 432、 618、 624)的通信終端(300、 400、 600),所述語(yǔ)音識(shí)別裝置比較 這些語(yǔ)音信號(hào)和存儲(chǔ)在數(shù)據(jù)庫(kù)(304、 404、 614)中的數(shù)據(jù),以便識(shí)別對(duì)應(yīng) 于這些信號(hào)的數(shù)據(jù),被識(shí)別的數(shù)據(jù)被發(fā)送給管理裝置(312、 412、 616)用 于觸發(fā)動(dòng)作,其特征在于,所述語(yǔ)音信號(hào)有可能由不同的聲音獲取系統(tǒng)(305、 307、 309、 405、 407、 409、 607、 609)提供,該終端包括用于每 個(gè)獲取系統(tǒng)的單獨(dú)的語(yǔ)音識(shí)別裝置。
10. 根據(jù)權(quán)利要求9的通信終端,其特征在于,所述數(shù)據(jù)庫(kù)(304、 404、 614)位于通信終端外部的服務(wù)器(700)中。
11. 根據(jù)權(quán)利要求9的通信終端,其特征在于,其包括數(shù)據(jù)庫(kù)(304、 404、 614)中的獨(dú)立子數(shù)據(jù)庫(kù)(314、 316、 318),每個(gè)子數(shù)據(jù)庫(kù)(314、 316、 318)關(guān)聯(lián)到一個(gè)聲音獲取系統(tǒng)(305、 307、 309),以便所述語(yǔ)音識(shí) 別裝置優(yōu)先使用關(guān)聯(lián)到所述用戶用來(lái)進(jìn)行所述比較的所述聲音獲取系統(tǒng)的 子數(shù)據(jù)庫(kù)。
12. 根據(jù)權(quán)利要求11的通信終端,其特征在于,包括在信號(hào)(320、 322、 324)與所述存儲(chǔ)數(shù)據(jù)之間對(duì)于每個(gè)所述子數(shù)據(jù)庫(kù)連續(xù)地進(jìn)行比較直 到通過所述比較達(dá)到要求的識(shí)別率為止的裝置。
13. 根據(jù)權(quán)利要求11或12的通信終端,其特征在于,包括用不同的 語(yǔ)音識(shí)別系統(tǒng)(305、 307、 309)進(jìn)行語(yǔ)音識(shí)別學(xué)習(xí)過程以產(chǎn)生專用于每個(gè) 語(yǔ)音識(shí)別系統(tǒng)的子數(shù)據(jù)庫(kù)(314、 316、 318)的裝置。
14. 根據(jù)權(quán)利要求9的通信終端,其特征在于,在所述通信終端的所 述語(yǔ)音識(shí)別裝置內(nèi),包括至少兩個(gè)聲音信號(hào)濾波器(414、 416、 418),每 個(gè)所述濾波器專用于所述通信終端的一個(gè)聲音獲取系統(tǒng)(405、 407、 409)。
15. 根據(jù)權(quán)利要求14的通信終端,其特征在于,所述濾波器(414、416、 418)具有預(yù)定的固定濾波器特征。
16. 根據(jù)權(quán)利要求14或15的通信終端,其特征在于,包括由所述語(yǔ) 音識(shí)別裝置相對(duì)于所述數(shù)據(jù)庫(kù)(404)對(duì)濾過的信號(hào)(422、 424、 426)進(jìn) 行相同處理所憑借的裝置。
17. 根據(jù)權(quán)利要求9的通信終端,其特征在于,所述語(yǔ)音識(shí)別裝置包 含與第一語(yǔ)音識(shí)別系統(tǒng)(607)相關(guān)聯(lián)的固定濾波器裝置(604),和與第 二濾波系統(tǒng)(609)相關(guān)聯(lián)的動(dòng)態(tài)濾波器裝置(612),這些動(dòng)態(tài)濾波器裝 置(612)檢測(cè)固定濾波特征以傳遞信號(hào),該信號(hào)類似于固定濾波傳遞的信 號(hào)。
18. 根據(jù)權(quán)利要求9到17任一項(xiàng)的通信終端,其特征在于,所述聲音 獲取系統(tǒng)之一包括話筒。
19. 根據(jù)權(quán)利要求9到18任一項(xiàng)的通信終端,其特征在于,所述聲音 獲取系統(tǒng)之一是行人免提工具包、車栽免提工具包或集成到所述通信終端 的識(shí)別系統(tǒng)。
全文摘要
本發(fā)明涉及通信終端(300)處理語(yǔ)音信號(hào)(320、322、324)的方法,該方法使用語(yǔ)音識(shí)別裝置,該裝置將這些語(yǔ)音信號(hào)和存儲(chǔ)在數(shù)據(jù)庫(kù)(304)的數(shù)據(jù)進(jìn)行比較,以便識(shí)別對(duì)應(yīng)于這些信號(hào)的數(shù)據(jù),被識(shí)別的數(shù)據(jù)被發(fā)送到管理裝置(312)用于觸發(fā)動(dòng)作。根據(jù)本發(fā)明,該方法的特征在于,語(yǔ)音信號(hào)有可能由不同的聲音獲取系統(tǒng)(305、307、309)提供,對(duì)于每個(gè)獲取系統(tǒng)使用單獨(dú)的語(yǔ)音識(shí)別裝置。
文檔編號(hào)G10L15/28GK101128865SQ200580027671
公開日2008年2月20日 申請(qǐng)日期2005年6月16日 優(yōu)先權(quán)日2004年6月16日
發(fā)明者A·帕里塞爾, F·勒熱 申請(qǐng)人:阿爾卡特朗訊公司