亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

語音識別系統(tǒng)和方法

文檔序號:2829582閱讀:184來源:國知局
專利名稱:語音識別系統(tǒng)和方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種語音識別系統(tǒng)和方法,更具體地,涉及一種服務(wù)器-客戶端語音識別系統(tǒng)和方法。本發(fā)明還涉及一種記錄有用于語音識別的程序的計算機可讀存儲介質(zhì)。本發(fā)明可應(yīng)用于語音輸入接口,例如蜂窩電話或個人數(shù)字助理。
本申請要求日本專利申請JP 2005-217534的優(yōu)先權(quán),其公開一并在此作為參考。
背景技術(shù)
圖1是示出了傳統(tǒng)服務(wù)器-客戶端語音識別系統(tǒng)示例的示意圖,該系統(tǒng)具有客戶端設(shè)備和服務(wù)器設(shè)備。在傳統(tǒng)服務(wù)器-客戶端語音識別系統(tǒng)中,客戶端設(shè)備處理相對輕負荷的語音識別,而服務(wù)器設(shè)備處理相比較而言重負荷的語音識別。具體地,如圖1所示,傳統(tǒng)服務(wù)器-客戶端語音識別系統(tǒng)具有客戶端設(shè)備310和服務(wù)器設(shè)備320,它們通過通信網(wǎng)絡(luò)330彼此連接。
客戶端設(shè)備310包括用于輸入用戶語音的語音輸入單元311、用于執(zhí)行預(yù)處理(例如,輸入語音數(shù)據(jù)的波形分析)的語音預(yù)處理單元312、以及用于選擇隨后對預(yù)處理后語音數(shù)據(jù)的內(nèi)容識別由內(nèi)部處理(在客戶端設(shè)備310中)執(zhí)行還是由外部處理(在服務(wù)器設(shè)備320)執(zhí)行的選擇器單元313??蛻舳嗽O(shè)備310還包括用于內(nèi)部內(nèi)容識別處理的初次語音識別單元314和初次識別詞典315、用于與服務(wù)器設(shè)備320通信的通信單元316、以及用于向系統(tǒng)外部發(fā)送語音識別結(jié)果的識別結(jié)果輸出單元317。
服務(wù)器設(shè)備320包括用于與客戶端設(shè)備310通信的通信單元321、二次語音識別單元322、和二次識別詞典323。二次語音識別單元322和二次識別詞典323用于外部語音識別處理。例如,在日本待審專利公開No.2003-241796和2004-133699中已經(jīng)公開了這種類型的語音識別系統(tǒng)。
在這種傳統(tǒng)語音識別系統(tǒng)中,客戶端設(shè)備310和服務(wù)器設(shè)備320如下操作。
具體地,當(dāng)語音數(shù)據(jù)輸入到客戶端設(shè)備310的語音輸入單元311中時,語音預(yù)處理單元312對語音數(shù)據(jù)執(zhí)行預(yù)處理,例如對輸入語音數(shù)據(jù)的讀音波形分析等。選擇器單元313響應(yīng)讀音波形分析結(jié)果操作,并且選擇對輸入語音數(shù)據(jù)中內(nèi)容的識別應(yīng)該由客戶端設(shè)備310中的初次語音識別單元314執(zhí)行還是由服務(wù)器設(shè)備320中的二次語音識別單元322執(zhí)行。
如果選擇器單元313選擇初次語音識別單元314,初次語音識別單元314利用初次識別詞典315,對語音數(shù)據(jù)執(zhí)行語音識別,并且將識別結(jié)果發(fā)送到識別結(jié)果輸出單元317。如果選擇器單元313選擇二次語音識別單元322,則通過通信網(wǎng)絡(luò)330將預(yù)處理后的語音數(shù)據(jù)從客戶端設(shè)備310中的通信單元316發(fā)送到服務(wù)器設(shè)備320。當(dāng)服務(wù)器設(shè)備320中的通信單元321從客戶端設(shè)備310接收到預(yù)處理后的語音數(shù)據(jù)時,二次語音識別單元322立即操作,利用二次識別詞典323對接收到的語音數(shù)據(jù)執(zhí)行語音識別。通信單元321將語音識別結(jié)果通過通信網(wǎng)絡(luò)330返回給客戶端設(shè)備310。當(dāng)客戶端設(shè)備310中的通信單元316接收到語音識別結(jié)果時,識別結(jié)果輸出單元317將結(jié)果提供給用戶。
然而,在傳統(tǒng)語音識別系統(tǒng)中,客戶端設(shè)備310中的初次識別詞典315容量較小,以便減少語音識別所需的處理量。因此,客戶端設(shè)備310用于識別的詞匯量非常有限。這常常使得在傳統(tǒng)語音識別系統(tǒng)中難以依賴單詞來識別用戶語音。
在這種情況下,可以考慮由每個用戶向客戶端終端設(shè)備310中的初次識別詞典315中連續(xù)添加未識別單詞的方式。然而,這種向初次識別詞典315添加未識別單詞的方式對用戶造成了嚴重負擔(dān),并且導(dǎo)致客戶端一側(cè)的計算量增加。這在語音識別處理期間帶來各種問題,例如延遲。
另外,在傳統(tǒng)示例中,當(dāng)客戶端設(shè)備310從服務(wù)器設(shè)備320接收到語音識別結(jié)果時,只是將這種結(jié)果傳送給用戶,而不積累在客戶端設(shè)備310中。因此,傳統(tǒng)語音識別系統(tǒng)的不便之處在于不能滿足用戶獲得頻繁使用單詞(詞匯)或最近使用單詞的需要。

發(fā)明內(nèi)容
鑒于上述缺點,做出了本發(fā)明。因此,本發(fā)明的目的是提供一種語音識別系統(tǒng)、一種語音識別方法、以及一種記錄有用于語音識別的程序的計算機可讀介質(zhì),可以有效地向用戶提供滿足用戶需要的單詞,例如,即便客戶端設(shè)備處理能力較小。
根據(jù)本發(fā)明的第一方面,提供了一種可以有效地向用戶提供滿足用戶需要的單詞的語音識別系統(tǒng)。該語音識別系統(tǒng)具有識別詞典,存儲語音信息;初次語音識別裝置,用于根據(jù)識別詞典,對用戶的輸入語音信息執(zhí)行初次語音識別,以產(chǎn)生輸入語音信息的初次語音識別結(jié)果;和識別結(jié)果判斷裝置,用于判斷初次語音識別裝置所產(chǎn)生的初次語音識別結(jié)果的可靠性,并決定接受還是拒絕初次語音識別結(jié)果。該語音識別系統(tǒng)包括收發(fā)機裝置,用于當(dāng)識別結(jié)果判斷裝置拒絕初次語音識別結(jié)果時,向額外語音識別裝置發(fā)送用戶的輸入語音信息,并且接收額外語音識別裝置的語音識別功能所產(chǎn)生的二次語音識別結(jié)果;和識別結(jié)果輸出裝置,用于將從識別結(jié)果判斷裝置輸出的初次語音識別結(jié)果或者由收發(fā)機裝置接收到的二次語音識別結(jié)果輸出到語音識別系統(tǒng)外部。
該語音識別系統(tǒng)還包括確定(settlement)結(jié)果輸入裝置,用于接收關(guān)于向語音識別系統(tǒng)外部輸出的初次語音識別結(jié)果或者二次語音識別結(jié)果的確定信息;和詞典內(nèi)容控制裝置,用于根據(jù)確定結(jié)果輸入裝置輸入的確定信息,更新識別詞典。
根據(jù)本發(fā)明,即使初次語音識別裝置處理能力較小,詞典內(nèi)容控制裝置也能利用確定的識別結(jié)果,不斷更新識別詞典。因此,該語音識別系統(tǒng)可以提供滿足用戶請求的識別單詞。另外,即使用戶說出或讀出識別詞典中沒有記錄的單詞,除了初次語音識別裝置的初次識別結(jié)果之外,通過額外語音識別裝置的語音識別功能,可以容易地獲得識別結(jié)果(二次語音識別結(jié)果)。于是,即使初次語音識別裝置處理能力較小,該語音識別系統(tǒng)也可以識別沒有記錄在識別詞典中的單詞。另外,服務(wù)器設(shè)備中已經(jīng)識別的單詞或詞組可以由詞典內(nèi)容控制裝置自動添加到識別詞典。因此,當(dāng)為用戶定制識別詞典時,可以減輕對用戶施加的負擔(dān)。
根據(jù)本發(fā)明的第二方面,上述對初次識別結(jié)果的接受或拒絕決定取決于外部判定系統(tǒng)。具體地,識別結(jié)果判斷裝置包括識別結(jié)果呈現(xiàn)裝置,用于向外部判定系統(tǒng)呈現(xiàn)初次語音識別裝置所產(chǎn)生的初次語音識別結(jié)果;以及判定結(jié)果輸入裝置,用于從外部判定系統(tǒng)接收判定結(jié)果接收或拒絕初次語音識別結(jié)果。
這種布置也具有與本發(fā)明第一方面中所述功能相同的功能。另外,當(dāng)外部判定系統(tǒng)(例如,用戶)發(fā)出判定結(jié)果(命令)時,采用該判定結(jié)果作為關(guān)于初次識別結(jié)果的判定信息。因此,用戶可以確定是否更新識別詞典。于是,可以生成對語音識別具有高處理效率的識別詞典,以確保增強處理語音信息的可靠性。
初次語音識別裝置可以包括語音預(yù)處理單元,可操作來分析輸入語音信息,以提取其特征,以及初次語音識別單元,可操作來根據(jù)語音預(yù)處理單元所提取的特征,輸出初次語音識別結(jié)果。在這種情況下,初次語音識別裝置可以迅速完成對輸入語音信息的初次語音識別。另外,也可以高度準確地執(zhí)行二次語音識別。
另外,詞典內(nèi)容控制裝置可以被配置為在識別詞典中的單詞數(shù)量超過語音識別系統(tǒng)的處理能力時,根據(jù)過去確定信息的順序和過去確定信息的頻率中至少之一,刪除單詞。在這種情況下,即使識別詞典容量較小并且初次語音識別裝置處理能力較小,也可以針對用戶喜好迅速輸出初次識別結(jié)果。另外,因為使用用戶的過去使用歷史作為針對用來獲得初次識別結(jié)果的識別詞典的信息,所以可以獲得適于用戶喜好的信息。
另外,詞典內(nèi)容控制裝置可以被配置為在識別詞典要更新時,向額外語音識別裝置發(fā)送更新信息。在這種情況下,額外語音識別裝置可以具有這樣的識別詞典,其包括由初次語音識別裝置所使用的識別詞典的內(nèi)容。因此,可以迅速執(zhí)行語音識別。
額外語音識別裝置由具有語音識別功能的服務(wù)器設(shè)備配置。該服務(wù)器設(shè)備可以通過通信網(wǎng)絡(luò)與收發(fā)機裝置通信。
根據(jù)本發(fā)明的第三方面,提供了一種可以有效地向用戶提供滿足用戶需要的單詞的語音識別方法。在該方法中,輸入用戶的語音信息;根據(jù)存儲語音信息的識別詞典,對語音信息執(zhí)行初次語音識別,以產(chǎn)生輸入語音信息的初次語音識別結(jié)果。判斷初次語音識別結(jié)果的可靠性,并決定接受還是拒絕初次語音識別結(jié)果。當(dāng)拒絕初次語音識別結(jié)果時,向額外語音識別裝置發(fā)送用戶的輸入語音信息。額外語音識別裝置的語音識別功能或二次語音識別產(chǎn)生二次語音識別結(jié)果,并接收該結(jié)果。向語音識別系統(tǒng)外部輸出初次語音識別結(jié)果或二次語音識別結(jié)果。輸入關(guān)于向語音識別系統(tǒng)外部輸出的初次語音識別結(jié)果或二次語音識別結(jié)果的確定信息,并且根據(jù)輸入的確定信息,更新識別詞典。
根據(jù)本發(fā)明,即使初次語音識別裝置處理能力較小,該語音識別系統(tǒng)也可以有效且迅速地提供適合用戶喜好的識別單詞。另外,服務(wù)器設(shè)備中已經(jīng)識別的單詞或詞組可以由詞典內(nèi)容控制裝置自動添加到識別詞典。因此,當(dāng)為用戶定制識別詞典時,可以減輕給用戶帶來的負擔(dān)。
根據(jù)本發(fā)明的第四方面,上述對初次識別結(jié)果的接受或拒絕決定取決于外部判定系統(tǒng)。具體地,不是進行上述判定過程,而是向外部判定系統(tǒng)呈現(xiàn)初次語音識別結(jié)果,并從外部判定系統(tǒng)接收判定結(jié)果接收或拒絕初次語音識別結(jié)果。此配置具有與本發(fā)明第三方面中所述功能相同的功能。另外,當(dāng)外部判定系統(tǒng)(例如,用戶)發(fā)出判定結(jié)果(命令)時,采用該判定結(jié)果作為關(guān)于初次識別結(jié)果的判定信息。因此,用戶可以確定是否更新識別詞典。于是,可以生成對語音識別具有高處理效率的識別詞典,以確保增強處理語音信息的可靠性。
另外,當(dāng)識別詞典中的單詞數(shù)量超過語音識別系統(tǒng)的處理能力時,可以根據(jù)過去確定信息的順序和過去確定信息的頻率中至少之一,刪除單詞。另外,當(dāng)要更新識別詞典時,可以向額外語音識別裝置發(fā)送更新信息。
根據(jù)本發(fā)明的第五方面,提供了一種記錄有用于語音識別的程序的計算機可讀存儲介質(zhì),可以有效地向用戶提供滿足用戶需要的單詞。該計算機可讀存儲介質(zhì)上記錄的程序被配置為執(zhí)行如下過程。輸入用戶的語音信息,并根據(jù)存儲單詞語音信息的識別詞典,對語音信息執(zhí)行初次語音識別,以產(chǎn)生輸入語音信息的初次語音識別結(jié)果。判斷初次語音識別結(jié)果的可靠性,并決定接受還是拒絕初次語音識別結(jié)果。當(dāng)拒絕初次語音識別結(jié)果時,向額外語音識別裝置發(fā)送用戶的輸入語音信息。額外語音識別裝置的語音識別功能產(chǎn)生二次語音識別結(jié)果,并接收該結(jié)果。向語音識別系統(tǒng)外部輸出初次語音識別結(jié)果或二次語音識別結(jié)果。輸入關(guān)于向語音識別系統(tǒng)外部輸出的初次語音識別結(jié)果或二次語音識別結(jié)果的確定信息,并根據(jù)輸入的確定信息,更新識別詞典。
根據(jù)本發(fā)明,即使初次語音識別裝置處理能力較小,也可利用確定的識別結(jié)果,不斷更新識別詞典。因此,可以提供適合用戶喜好的識別單詞。另外,即使用戶說出識別詞典中沒有記錄的單詞,除了初次語音識別裝置的初次識別結(jié)果之外,通過額外語音識別裝置的語音識別功能,可以容易地獲得識別結(jié)果(二次語音識別結(jié)果)。于是,即使初次語音識別功能處理能力較小,也可以容易地識別沒有記錄在識別詞典中的單詞。另外,服務(wù)器設(shè)備中已經(jīng)識別的單詞或詞組可以由詞典內(nèi)容控制功能自動添加到識別詞典。因此,當(dāng)為用戶定制識別詞典時,可以減輕給用戶帶來的負擔(dān)。
根據(jù)本發(fā)明的第六方面,上述對初次識別結(jié)果的接受或拒絕決定取決于外部判定系統(tǒng)。具體地,不是進行上述判定功能,而是向外部判定系統(tǒng)呈現(xiàn)初次語音識別結(jié)果,并從外部判定系統(tǒng)接收判定結(jié)果接收或拒絕初次語音識別結(jié)果。此配置具有與本發(fā)明第五方面中所述功能相同的功能。另外,當(dāng)外部判定系統(tǒng)(例如,用戶)發(fā)出判定結(jié)果(命令)時,采用該判定結(jié)果作為關(guān)于初次識別結(jié)果的判定信息。因此,用戶可以確定是否更新識別詞典。于是,可以生成對語音識別具有高處理效率的識別詞典,以確保增強處理語音信息的可靠性。
另外,當(dāng)識別詞典中的單詞數(shù)量超過語音識別系統(tǒng)的處理能力時,可以根據(jù)過去確定信息的順序和過去確定信息的頻率中至少之一,刪除單詞。另外,當(dāng)要更新識別詞典時,可以向額外語音識別裝置發(fā)送更新信息。
因此,即使客戶端設(shè)備處理能力較小,也可以提供滿足用戶需要的單詞。
如上所述,根據(jù)本發(fā)明,即使客戶端設(shè)備或語音識別裝置對初次語音識別的處理能力較小,也可以提供適合用戶喜好的單詞,因為不斷利用確定的識別結(jié)果更新識別詞典。
根據(jù)如下結(jié)合附圖的描述,本發(fā)明的上述及其他目的、特征和優(yōu)點將顯而易見,附圖中圖示了本發(fā)明的優(yōu)選實施例作為示例。


圖1是示出了傳統(tǒng)服務(wù)器-客戶端語音識別系統(tǒng)示例的示意圖;圖2是示出了根據(jù)本發(fā)明第一實施例的語音識別系統(tǒng)的布置的示意圖;圖3是示出了圖2所示的語音識別系統(tǒng)中初次識別詞典示例的說明圖;圖4是示出了圖2所示的語音識別系統(tǒng)的操作的流程圖;圖5是示出了根據(jù)本發(fā)明第二實施例的語音識別系統(tǒng)的布置的示意圖;圖6是示出了圖5所示的語音識別系統(tǒng)中單詞歷史列表和初次識別詞典示例的說明圖;圖7是示出了圖5所示的語音識別系統(tǒng)的操作的流程圖;圖8是示出了根據(jù)本發(fā)明第三實施例的語音識別系統(tǒng)的詞典內(nèi)容控制單元中單詞歷史列表示例的說明圖。
具體實施例方式
下面將參考圖2至8描述根據(jù)本發(fā)明實施例的語音識別系統(tǒng)。所有附圖中相似或相應(yīng)的部分由相似或相應(yīng)的標號來表示,并且下面不重復(fù)描述。
圖2示出了根據(jù)本發(fā)明第一實施例的語音識別系統(tǒng)的整體。如圖2所示,該語音識別系統(tǒng)包括用于接收用戶語音的客戶端設(shè)備110、和通過通信網(wǎng)絡(luò)130與客戶端設(shè)備110可通信的服務(wù)器設(shè)備(額外語音識別裝置)120。圖示的客戶端設(shè)備110對用戶語音執(zhí)行初次識別,產(chǎn)生用戶語音的初次識別結(jié)果。服務(wù)器設(shè)備120對用戶語音執(zhí)行二次識別,產(chǎn)生用戶語音的二次識別結(jié)果,并且向客戶端設(shè)備110輸出二次識別結(jié)果。
客戶端設(shè)備110包括用于接收輸入用戶語音或讀音的語音輸入單元111、初次識別詞典113、以及用于利用初次識別詞典113對輸入語音執(zhí)行初次識別的初次語音識別裝置112。另外,客戶端設(shè)備110還包括結(jié)果判定單元(識別結(jié)果判定裝置)115,用于確定接受還是拒絕初次識別的結(jié)果。另外,客戶端設(shè)備110還包括通信單元(收發(fā)機裝置)116,用于在拒絕語音數(shù)據(jù)的初次識別結(jié)果時向服務(wù)器設(shè)備(額外語音識別裝置)120發(fā)送語音數(shù)據(jù)。在這種情況下,通信單元116請求服務(wù)器設(shè)備120對語音數(shù)據(jù)執(zhí)行二次識別,并且接收二次識別的結(jié)果。在客戶端設(shè)備110中,結(jié)果輸出單元(識別結(jié)果輸出裝置)117用于向系統(tǒng)外部輸出識別結(jié)果。
用戶確定或決定輸出識別結(jié)果為識別的確定結(jié)果??蛻舳嗽O(shè)備110包括確定結(jié)果輸入單元(確定結(jié)果輸入裝置)118,用于接收識別的確定結(jié)果??蛻舳嗽O(shè)備110還包括詞典內(nèi)容控制單元(詞典內(nèi)容控制裝置)119,用于參考確定結(jié)果輸入單元118接收到的識別確定結(jié)果,更新初次識別詞典113。
圖示的初次語音識別裝置112對語音數(shù)據(jù)執(zhí)行初次識別。具體地,初次語音識別裝置112包括可操作來分析輸入語音以從輸入語音中提取特征的語音預(yù)處理單元112A,以及可操作來根據(jù)所提取的語音特征輸出語音數(shù)據(jù)的初次識別結(jié)果的初次語音識別單元112B。
客戶端設(shè)備110可以具有存儲用于語音識別的程序的存儲器(未示出),以及可操作來執(zhí)行存儲器中所存儲的程序的中央處理單元(CPU)。在這種情況下,CPU執(zhí)行程序,以根據(jù)程序操作語音預(yù)處理單元112A、初次語音識別單元112B、結(jié)果判定單元115、通信單元116、結(jié)果輸出單元117、確定結(jié)果輸入單元118以及詞典內(nèi)容控制單元119。
接著,將描述該語音識別系統(tǒng)中各個部件的操作。
例如,語音輸入單元111可以包括麥克風(fēng),并接收用戶的語音。語音預(yù)處理單元(特征輸出裝置)112A被配置為對輸入語音執(zhí)行讀音分析,并從輸入語音中提取語音特征。初次識別詞典113具有詞典數(shù)據(jù),其中記錄了詞匯(單詞)和單詞的讀音,如圖3所示。
初次語音識別單元(語音識別裝置)112B被配置為根據(jù)語音預(yù)處理單元112A所提取的語音特征,從初次識別詞典113中檢索與用戶語音相對應(yīng)的單詞。例如,當(dāng)用戶說“e-mail address”時,初次語音識別單元112B從初次識別詞典113中檢索與用戶語音相對應(yīng)的單詞。具體地,初次語音識別單元112B根據(jù)從語音預(yù)處理單元112A輸入的特征,從初次識別詞典113中讀出單詞“e-mail”和“address”。然后,初次語音識別單元112B將單詞“e-mail”連到“address”,并產(chǎn)生或生成詞組“e-mail address”。此后,初次語音識別單元112B將詞組“e-mail address”提供給結(jié)果判定單元115。如果初次語音識別單元112B未能讀出相應(yīng)單詞,則初次語音識別單元112B向結(jié)果判定單元115通知失敗。
例如,當(dāng)從初次語音識別單元112B向結(jié)果判定單元(識別結(jié)果判定裝置)115輸入單詞時,結(jié)果判定單元115計算輸入單詞的似然或相似性。如果輸入單詞的似然較高,則結(jié)果判定單元115判斷輸入單詞是用戶所需單詞,并且接受輸入單詞。如果輸入單詞的似然較低,則結(jié)果判定單元115判斷輸入單詞不同于用戶所需單詞,并且拒絕輸入單詞。
例如,當(dāng)輸入單詞是初次識別詞典113中已經(jīng)記錄的“e-mailaddress”時,結(jié)果判定單元115判斷輸入單詞的似然為高,并且接受輸入單詞。假設(shè)另一單詞“registration”沒有記錄在初次識別詞典113中。例如,如果初次語音識別單元112B將單詞“registration”錯誤地識別為“change”并輸入到結(jié)果判定單元115,則結(jié)果判定單元115判斷輸入單詞的似然為低,并且拒絕輸入單詞。
如果從初次語音識別單元112B輸出的單詞被結(jié)果判定單元115拒絕,通信單元(收發(fā)機裝置)116通過通信網(wǎng)絡(luò)130向服務(wù)器設(shè)備120發(fā)送語音預(yù)處理單元112A所提取的語音特征。然后,通信單元116通過通信網(wǎng)絡(luò)130從服務(wù)器設(shè)備120接收語音識別結(jié)果。結(jié)果輸出單元(識別結(jié)果輸出裝置)117被配置為向系統(tǒng)外部輸出在客戶端設(shè)備110或服務(wù)器設(shè)備120中產(chǎn)生的用戶語音的語音識別結(jié)果(初次或二次識別結(jié)果)。
當(dāng)用戶輸入確定或決定輸出識別結(jié)果的請求時,確定或決定結(jié)果輸入單元(確定結(jié)果輸入裝置)118向詞典內(nèi)容控制單元(詞典內(nèi)容控制裝置)119輸出該請求。詞典內(nèi)容控制單元(詞典內(nèi)容控制裝置)119根據(jù)接收到的請求,將新的詞典數(shù)據(jù)記錄在初次識別詞典113中。另外,如果已記錄單詞數(shù)超過客戶端設(shè)備110的處理能力,詞典內(nèi)容控制單元119從初次識別詞典113中刪除最老的單詞(執(zhí)行單詞刪除功能)。
如圖2所示,充當(dāng)額外語音識別裝置的服務(wù)器設(shè)備120包括通信單元121、二次識別詞典122、和二次語音識別單元123。通信單元121被配置為通過通信網(wǎng)絡(luò)130從客戶端設(shè)備110接收特征,并且通過通信網(wǎng)絡(luò)130向客戶端設(shè)備110發(fā)送二次語音識別結(jié)果。
二次識別詞典122記錄詞典數(shù)據(jù),包括與客戶端設(shè)備110不能識別的語音相對應(yīng)的單詞,以及其中所記錄的單詞的讀音。另外,二次語音識別單元123具有如下功能根據(jù)從客戶端設(shè)備110接收到的語音特征,從二次識別詞典122中檢索與用戶語音相對應(yīng)的單詞。另外,二次語音識別單元123對用戶語音執(zhí)行二次語音識別,并且向客戶端設(shè)備110返回二次識別結(jié)果。
接著,將參考圖4所示流程圖描述第一實施例中語音識別系統(tǒng)的操作。
如圖4所示,用戶語音輸入到客戶端設(shè)備110中的語音輸入單元111中(步驟151)。輸入語音在語音預(yù)處理單元112A中進行讀音分析,以提取語音的特征(步驟152)。然后,初次語音識別單元112B根據(jù)語音預(yù)處理單元112A提取的特征,檢索初次識別詞典113,并執(zhí)行初次語音識別(步驟153語音識別處理)。
例如,當(dāng)用戶說出或發(fā)出“e-mail address”的讀音時,初次語音識別單元112B從初次識別詞典113中檢索單詞,根據(jù)兩個單詞的特征從初次識別詞典113中讀出單詞“e-mail”和“address”,并將單詞“e-mail address”輸出到結(jié)果判定單元115。如果初次語音識別單元112B未能從初次識別詞典113中讀出任何相應(yīng)單詞,則初次語音識別單元112B可能向結(jié)果判定單元115輸出錯誤單詞。圖3示出了初次識別詞典113中存儲的單詞示例。
接著,結(jié)果判定單元115計算輸入單詞的似然,并且判定接受或拒絕每個單詞(步驟154識別結(jié)果判定處理)。如果結(jié)果判定單元115計算輸入單詞的似然為高,并決定接受輸入單詞(步驟154接受),則結(jié)果判定單元115向結(jié)果輸出單元117輸出從初次語音識別單元112B給出的識別結(jié)果的單詞(步驟155)。然后,處理返回上述步驟152。另一方面,如果結(jié)果判定單元115計算輸入單詞的似然為低,并決定拒絕輸入單詞(步驟154拒絕),則結(jié)果判定單元115從語音預(yù)處理單元112A獲得語音特征,并且將語音特征輸出到通信單元116。通信單元116通過通信網(wǎng)絡(luò)130向充當(dāng)額外語音識別裝置的服務(wù)器設(shè)備120中的通信單元121發(fā)送輸入語音特征(步驟156)。
在服務(wù)器設(shè)備(額外語音識別裝置)120中,當(dāng)通信單元121接收到來自客戶端設(shè)備110的語音特征時(步驟157),通信單元121將接收到的語音特征輸出到二次語音識別單元123。然后,二次語音識別單元123根據(jù)接收到的語音特征,從二次識別詞典122中檢索與用戶語音相對應(yīng)的單詞,以執(zhí)行二次語音識別(步驟158)。此后,二次語音識別單元123向通信單元121輸出二次語音識別所獲得的二次識別結(jié)果。通信單元121通過通信網(wǎng)絡(luò)130向客戶端設(shè)備110中的通信單元116發(fā)送二次識別結(jié)果(步驟159)。
當(dāng)客戶端設(shè)備110的通信單元116從充當(dāng)額外語音識別裝置的服務(wù)器設(shè)備120接收到二次識別結(jié)果時(步驟160二次識別結(jié)果獲取處理),然后通信單元116將二次識別結(jié)果輸出到結(jié)果輸出單元117。結(jié)果輸出單元117以用戶可以識別結(jié)果的方式輸出語音識別結(jié)果(步驟161識別結(jié)果輸出處理)。然后,當(dāng)向確定結(jié)果輸入單元118輸入確定所輸出識別結(jié)果的請求時,然后確定結(jié)果輸入單元118將所輸入的請求輸出到詞典內(nèi)容控制單元119(步驟162確定結(jié)果輸入處理)。詞典內(nèi)容控制單元119根據(jù)接收到的請求,將新的詞典數(shù)據(jù)記錄在初次識別詞典113中。另外,如果已記錄單詞數(shù)超過客戶端設(shè)備110的處理能力,則詞典內(nèi)容控制單元119從初次識別詞典113中刪除最老的單詞,以更新初次識別詞典113中(步驟163詞典更新控制處理)。然后,處理終止。
根據(jù)第一實施例中的語音識別系統(tǒng),即使用戶說出客戶端設(shè)備110的初次識別詞典113中沒有記錄的單詞,也可以在服務(wù)器設(shè)備120中對該單詞進行語音處理,并提供給用戶。因此,即使客戶端設(shè)備110的處理能力較小,該語音識別系統(tǒng)也可以提供與用戶的請求匹配的單詞。
另外,根據(jù)第一實施例中的語音識別系統(tǒng),即使客戶端設(shè)備110不能識別單詞,該單詞也極有可能被帶有記錄了大量單詞的二次識別詞典122的服務(wù)器設(shè)備120(額外語音識別裝置)識別。因此,即使用戶說出客戶端設(shè)備110的初次識別詞典113中沒有記錄的單詞,該語音識別系統(tǒng)也能識別這種單詞。
此外,根據(jù)第一實施例中的語音識別系統(tǒng),服務(wù)器設(shè)備120中已經(jīng)識別的單詞或詞組可以自動添加到客戶端設(shè)備110的初次識別詞典113中。因此,當(dāng)對用戶定制初次識別詞典113時,可以減輕向用戶施加的負擔(dān)。
圖5示出了根據(jù)本發(fā)明第二實施例的語音識別系統(tǒng)的整體布置。如圖5所示,該語音識別系統(tǒng)包括客戶端設(shè)備200和通過通信網(wǎng)絡(luò)130與客戶端設(shè)備200可通信、作為額外語音識別裝置的服務(wù)器設(shè)備120。此配置類似于第一實施例中的語音識別系統(tǒng)。
第二實施例中的客戶端設(shè)備200包括用于向外部判定系統(tǒng)呈現(xiàn)初次識別結(jié)果的結(jié)果呈現(xiàn)單元(識別結(jié)果呈現(xiàn)裝置)205,以及用于從外部判定系統(tǒng)獲取判定結(jié)果作為判定信息的判定輸入單元(判定輸入裝置)206。結(jié)果呈現(xiàn)單元205和判定輸入單元206布置在初次語音識別裝置112和結(jié)果判定單元(識別結(jié)果判斷裝置)115之間,初次語音識別裝置112和結(jié)果判定單元115在第一實施例中已經(jīng)描述過。
利用這種結(jié)構(gòu),外部判斷系統(tǒng)判斷接受還是拒絕由結(jié)果呈現(xiàn)單元205所呈現(xiàn)的初次識別結(jié)果,并且向判定輸入單元206輸入判定結(jié)果。換句話說,客戶端設(shè)備200的判斷取決于外部判定系統(tǒng)(可以是用戶)的判定。在這種情況下,用戶可以充當(dāng)外部判定系統(tǒng)。如圖5所示,該語音識別系統(tǒng)的其他布置與第一實施例中的語音識別系統(tǒng)(見圖2)相同。
第二實施例中的語音識別系統(tǒng)具有與第一實施例相同的功能。另外,第二實施例中的語音識別系統(tǒng)具有如下功能。具體地,當(dāng)外部判定系統(tǒng)(例如,用戶)所發(fā)出的判定結(jié)果(命令)輸入到該語音識別系統(tǒng)中時,采用判定結(jié)果作為關(guān)于初次識別結(jié)果的判定信息。因此,用戶可以確定是否更新初次識別詞典。因此,可以生成對語音識別具有高處理效率的識別詞典,以確保增強處理語音信息的可靠性。
客戶端設(shè)備200可以具有存儲用于語音識別的程序的存儲器(未示出),以及可操作來執(zhí)行存儲器中所存儲的程序的中央處理單元(CPU),以便操作語音識別裝置112(語音預(yù)處理單元112A和初次語音識別單元112B)、結(jié)果呈現(xiàn)單元205、判定輸入單元206、結(jié)果判定單元115、通信單元116、結(jié)果輸出單元117、確定結(jié)果輸入單元118以及詞典內(nèi)容控制單元119。
結(jié)果呈現(xiàn)單元(識別結(jié)果呈現(xiàn)裝置)205被配置為向用戶(外部判定系統(tǒng))呈現(xiàn)從初次語音識別單元112B輸出的初次識別結(jié)果,呈現(xiàn)方式是使用戶能夠識別初次識別結(jié)果。然后,用戶(外部判定系統(tǒng))將接受或拒絕所呈現(xiàn)的單詞初次識別結(jié)果的判定結(jié)果輸入到判定輸入單元(判斷輸入裝置)206中。判定輸入單元206用于從用戶(外部判定系統(tǒng))獲取判定結(jié)果。無論如何,結(jié)果呈現(xiàn)單元205和判定輸入單元206與結(jié)果判定單元或裝置115一起可以統(tǒng)稱為結(jié)果判斷單元或裝置,因為它們用來判定接受還是拒絕初次語音識別結(jié)果。
這里,詞典內(nèi)容控制單元119用來控制及更新初次識別詞典113。詞典內(nèi)容控制單元119具有如圖6所示的單詞歷史列表113a。單詞歷史列表113a包括由單詞、音標或單詞發(fā)音、使用順序及使用頻率構(gòu)成的單詞歷史數(shù)據(jù)。使用順序的最大值表示該單詞最近使用過。當(dāng)初次識別詞典113記錄滿了單詞時,詞典內(nèi)容控制單元119可以從初次識別詞典113中刪除單詞歷史列表113a中列出的使用順序的值最小的單詞(例如,圖6中的單詞“number”)??蛇x地,詞典內(nèi)容控制單元119可以刪除使用頻率最低的單詞(例如,圖6中的單詞“change”)。
當(dāng)詞典內(nèi)容控制單元119在初次識別詞典113中記錄新單詞時,在單詞歷史列表113a中將單詞歷史數(shù)據(jù)中已記錄單詞中最大的使用順序值或者使用頻率“00001”存儲給新的單詞。這里,從初次識別詞典113中已經(jīng)刪除的單詞可能沒有由詞典內(nèi)容控制單元119從單詞歷史列表113a中刪除。因此,單詞歷史列表113a中記錄的單詞數(shù)等于或大于初次識別詞典113中記錄的單詞數(shù)。
接著,將參考圖7所示的流程圖描述第二實施例中語音識別系統(tǒng)的操作。
在該實施例中,當(dāng)用戶語音輸入到客戶端設(shè)備200中的語音輸入單元111中時,語音輸入單元111將語音輸出到語音預(yù)處理單元112A(步驟251)。語音預(yù)處理單元112A通過讀音分析,提取輸入語音的語音特征(步驟252)。然后,初次語音識別單元112B根據(jù)語音預(yù)處理單元112A提取的特征,通過檢索初次識別詞典113,執(zhí)行初次語音識別(步驟253)。
例如,當(dāng)用戶說出“e-mail address”時,初次語音識別單元112B從初次識別詞典113中檢索單詞,根據(jù)語音特征從初次識別詞典113中讀出單詞“e-mail”和“address”,并將單詞“e-mail address”輸出到結(jié)果呈現(xiàn)單元205。如果初次語音識別單元112B未能從初次識別詞典113中讀出任何相應(yīng)單詞,則初次語音識別單元112B向結(jié)果呈現(xiàn)單元205輸出錯誤單詞。
接著,結(jié)果呈現(xiàn)單元205將輸入的單詞呈現(xiàn)給外部判定系統(tǒng),例如用戶(步驟254識別結(jié)果呈現(xiàn)處理)。然后,判定輸入單元206從外部判定系統(tǒng)接收所呈現(xiàn)單詞的判定結(jié)果(判定結(jié)果輸入處理),并向結(jié)果判定單元115輸出判定結(jié)果。結(jié)果判定單元115根據(jù)輸入的判定結(jié)果,決定接受還是拒絕所呈現(xiàn)的識別結(jié)果(步驟255)。如果結(jié)果判定單元115決定接受識別結(jié)果(步驟256接受),則結(jié)果判定單元115向結(jié)果輸出單元117輸出從初次語音識別單元112B輸入的識別結(jié)果的單詞。然后,處理返回上述步驟253。
另一方面,如果結(jié)果判定單元115決定拒絕識別結(jié)果(步驟255拒絕),則結(jié)果判定單元115通過通信單元116向服務(wù)器設(shè)備(額外語音識別裝置)120輸出從語音預(yù)處理單元112A獲得的語音特征。通信單元116通過通信網(wǎng)絡(luò)130向服務(wù)器設(shè)備120中的通信單元121發(fā)送從語音預(yù)處理單元112A輸入的語音特征(步驟257)。
當(dāng)服務(wù)器設(shè)備120中的通信單元121接收到來自客戶端設(shè)備200的語音特征時(步驟258),通信單元121將語音特征輸出到二次語音識別單元123。然后,二次語音識別單元123根據(jù)輸入語音特征,從二次識別詞典122中檢索與用戶語音相對應(yīng)的單詞,以執(zhí)行二次語音識別(步驟259)。此后,二次語音識別單元123向通信單元121輸出二次語音識別所獲得的二次識別結(jié)果。通信單元121通過通信網(wǎng)絡(luò)130向客戶端設(shè)備200中的通信單元116發(fā)送二次識別結(jié)果(步驟260)。
當(dāng)客戶端設(shè)備200的通信單元116從服務(wù)器設(shè)備120接收到二次識別結(jié)果時(步驟261),然后通信單元116將二次識別結(jié)果輸出到結(jié)果輸出單元117。結(jié)果輸出單元117以用戶可以識別結(jié)果的方式輸出二次識別結(jié)果(步驟262)。然后,當(dāng)向確定結(jié)果輸入單元118輸入確定或決定所輸出識別結(jié)果的請求時,然后確定結(jié)果輸入單元118將所輸入的請求輸出到詞典內(nèi)容控制單元119(步驟263)。詞典內(nèi)容控制單元119參考單詞歷史列表113a,并且如果接收到的請求需要,則將新的詞典數(shù)據(jù)記錄在初次識別詞典113中。如果初次識別詞典113中已記錄單詞數(shù)超過客戶端設(shè)備200的處理能力,則詞典內(nèi)容控制單元119從初次識別詞典113中刪除最老的單詞,以更新初次識別詞典113中(步驟264)。然后,處理終止。
第二實施例中的語音識別系統(tǒng)具有與第一實施例中的語音識別系統(tǒng)類似的效果。另外,因為在詞典內(nèi)容控制單元119的單詞歷史列表113a中使用用戶的過去使用歷史作為針對客戶端設(shè)備200的初次識別詞典113的信息,可以獲得適于用戶喜好的信息。
根據(jù)第一和第二實施例中的語音識別系統(tǒng),從語音預(yù)處理單元112A輸出的語音特征輸出作為要從客戶端設(shè)備發(fā)送到服務(wù)器設(shè)備的語音數(shù)據(jù)。然而,讀音波形數(shù)據(jù)可以直接發(fā)送到服務(wù)器設(shè)備。
另外,第一實施例中的語音識別系統(tǒng)可以采用第二實施例中公開的詞典內(nèi)容控制單元119和初次識別詞典113。
另外,第二實施例中的語音識別系統(tǒng)采用使用順序和使用頻率作為歷史操作數(shù)據(jù)。然而,歷史操作數(shù)據(jù)不限于這些示例。另外,使用順序和適應(yīng)頻率可以單獨或組合使用。初次識別詞典113中單詞數(shù)的上限可以根據(jù)系統(tǒng)的處理能力來設(shè)置。如果負荷根據(jù)環(huán)境變化,則可以動態(tài)改變上限。
圖8是示出了根據(jù)本發(fā)明第三實施例的語音識別系統(tǒng)的詞典內(nèi)容控制單元中單詞歷史列表213a示例的說明圖。在第三實施例中,除了第一或第二實施例中語音識別系統(tǒng)的詞典內(nèi)容控制單元119之外,另外設(shè)置圖8所示的單詞歷史列表213a。詞典內(nèi)容控制單元119被配置為根據(jù)單詞歷史列表213a來控制初次識別詞典113中的單詞。在這種情況下,從客戶端設(shè)備的通信單元116向服務(wù)器設(shè)備120發(fā)送關(guān)于單詞歷史列表213a的信息。服務(wù)器設(shè)備120于是接收關(guān)于單詞歷史列表213a的信息。因此,服務(wù)器設(shè)備120可以獲得用戶的輸入歷史,而不用請求用戶呈現(xiàn)或者單獨監(jiān)視用戶的使用條件。
圖8所示的示例是針對蜂窩電話的市場搜索引擎設(shè)計的。根據(jù)圖8所示的單詞歷史列表213a,可以猜測用戶對購買電視感興趣。因此,管理服務(wù)器設(shè)備的公司可以向用戶發(fā)送新產(chǎn)品信息。于是,可以利用語音識別系統(tǒng)來進行公司的促銷。另外,在傳統(tǒng)方法中,應(yīng)該分析語音識別結(jié)果,以獲得顧客信息。然而,根據(jù)第三實施例中的語音識別系統(tǒng),單詞歷史列表213a的使用使得不需要分析語音識別結(jié)果。
在第三實施例中,語音識別系統(tǒng)從客戶端設(shè)備200的通信單元116向服務(wù)器設(shè)備發(fā)送單詞歷史列表213a。然而,用戶可以設(shè)置不向服務(wù)器設(shè)備發(fā)送單詞歷史列表213a。另外,用戶可以設(shè)置每次客戶端設(shè)備與服務(wù)器設(shè)備120通信以進行語音識別時向服務(wù)器設(shè)備發(fā)送單詞歷史列表213a。
雖然已經(jīng)詳細示出并描述了本發(fā)明的某些優(yōu)選實施例,但是應(yīng)該理解,不脫離所附權(quán)利要求的范圍,可以做出各種改變和修改。
權(quán)利要求
1.一種用于識別用戶所發(fā)出的輸入語音信息的語音識別系統(tǒng),包括識別詞典,用于存儲語音信息;初次語音識別裝置,用于利用所述識別詞典,對輸入語音信息執(zhí)行初次語音識別,以產(chǎn)生輸入語音信息的初次語音識別結(jié)果;識別結(jié)果判斷裝置,用于判斷接受還是拒絕初次語音識別結(jié)果;收發(fā)機裝置,用于當(dāng)所述識別結(jié)果判斷裝置拒絕初次語音識別結(jié)果時,向用于執(zhí)行二次語音識別的額外語音識別裝置發(fā)送用戶的輸入語音信息,并且接收額外語音識別裝置所產(chǎn)生的二次語音識別結(jié)果;識別結(jié)果輸出裝置,用于將從所述識別結(jié)果判斷裝置輸出的初次語音識別結(jié)果或者由所述收發(fā)機裝置接收到的二次語音識別結(jié)果輸出到所述語音識別系統(tǒng)外部;確定結(jié)果輸入裝置,用于接收關(guān)于向所述語音識別系統(tǒng)外部輸出的初次語音識別結(jié)果或者二次語音識別結(jié)果的確定信息;以及詞典內(nèi)容控制裝置,用于根據(jù)所述確定結(jié)果輸入裝置輸入的確定信息,更新所述識別詞典。
2.根據(jù)權(quán)利要求1所述的語音識別系統(tǒng),其中識別結(jié)果判斷裝置包括識別結(jié)果呈現(xiàn)裝置,用于向外部判定系統(tǒng)呈現(xiàn)所述初次語音識別裝置所產(chǎn)生的初次語音識別結(jié)果;以及判定結(jié)果輸入裝置,用于從外部判定系統(tǒng)接收判定結(jié)果接收或拒絕初次語音識別結(jié)果。
3.根據(jù)權(quán)利要求1所述的語音識別系統(tǒng),其中所述初次語音識別裝置包括(i)語音預(yù)處理單元,可操作來分析輸入語音信息,以提取其特征,以及(ii)初次語音識別單元,可操作來根據(jù)所述語音預(yù)處理單元所提取的特征,輸出初次語音識別結(jié)果。
4.根據(jù)權(quán)利要求1所述的語音識別系統(tǒng),其中所述詞典內(nèi)容控制裝置可操作來在所述識別詞典中的單詞數(shù)量超過所述語音識別系統(tǒng)的處理能力時,根據(jù)過去確定信息的順序和過去確定信息的頻率中至少之一,刪除單詞。
5.根據(jù)權(quán)利要求1所述的語音識別系統(tǒng),其中所述詞典內(nèi)容控制裝置可操作來在所述識別詞典要更新時,向額外語音識別裝置發(fā)送更新信息。
6.根據(jù)權(quán)利要求1所述的語音識別系統(tǒng),其中由具有語音識別功能的服務(wù)器設(shè)備配置所述額外語音識別裝置,服務(wù)器設(shè)備通過通信網(wǎng)絡(luò)與所述收發(fā)機裝置可通信。
7.一種語音識別方法,包括輸入由用戶所發(fā)出的輸入語音信息;根據(jù)存儲語音信息的識別詞典,對語音信息執(zhí)行初次語音識別,以產(chǎn)生輸入語音信息的初次語音識別結(jié)果;決定接受還是拒絕初次語音識別結(jié)果;當(dāng)拒絕初次語音識別結(jié)果時,向用于執(zhí)行二次語音識別的額外語音識別裝置發(fā)送用戶的輸入語音信息;接收額外語音識別裝置所產(chǎn)生的二次語音識別結(jié)果;向語音識別系統(tǒng)外部輸出初次語音識別結(jié)果或二次語音識別結(jié)果;響應(yīng)于向語音識別系統(tǒng)外部輸出的初次語音識別結(jié)果或二次語音識別結(jié)果,輸入確定信息;以及根據(jù)輸入的確定信息,更新識別詞典。
8.根據(jù)權(quán)利要求7所述的語音識別方法,其中決定步驟包括如下步驟向外部判定系統(tǒng)呈現(xiàn)初次語音識別結(jié)果;以及從外部判定系統(tǒng)接收判定結(jié)果接收或拒絕初次語音識別結(jié)果。
9.根據(jù)權(quán)利要求7所述的語音識別方法,其中更新識別詞典的所述更新步驟包括如下步驟當(dāng)識別詞典中的單詞數(shù)量超過語音識別系統(tǒng)的處理能力時,根據(jù)過去確定信息的順序和過去確定信息的頻率中至少之一,刪除單詞。
10.根據(jù)權(quán)利要求7所述的語音識別方法,其中更新識別詞典的所述更新步驟包括如下步驟當(dāng)更新所述識別詞典時,向額外語音識別裝置發(fā)送更新信息。
11.一種計算機可讀存儲介質(zhì),記錄有程序,用于與計算機一起執(zhí)行過程,所述過程包括輸入用戶的語音信息;根據(jù)存儲語音信息的識別詞典,對語音信息執(zhí)行初次語音識別,以產(chǎn)生輸入語音信息的初次語音識別結(jié)果;判斷接受還是拒絕初次語音識別結(jié)果;當(dāng)拒絕初次語音識別結(jié)果時,向用于執(zhí)行二次語音識別的額外語音識別裝置發(fā)送用戶的輸入語音信息;接收額外語音識別裝置所產(chǎn)生的二次語音識別結(jié)果;向語音識別系統(tǒng)外部輸出初次語音識別結(jié)果或二次語音識別結(jié)果;響應(yīng)于向語音識別系統(tǒng)外部輸出的初次語音識別結(jié)果或二次語音識別結(jié)果,輸入確定信息;以及根據(jù)輸入的確定信息,更新識別詞典。
12.根據(jù)權(quán)利要求11所述的計算機可讀存儲介質(zhì),其中判斷步驟包括如下步驟向外部判定系統(tǒng)呈現(xiàn)初次語音識別結(jié)果;以及從外部判定系統(tǒng)接收判定結(jié)果接收或拒絕初次語音識別結(jié)果。
13.根據(jù)權(quán)利要求11所述的計算機可讀存儲介質(zhì),其中更新識別詞典的所述更新步驟包括如下步驟當(dāng)識別詞典中的單詞數(shù)量超過語音識別系統(tǒng)的處理能力時,根據(jù)過去確定信息的順序和過去確定信息的頻率中至少之一,刪除單詞。
14.根據(jù)權(quán)利要求11所述的計算機可讀存儲介質(zhì),其中更新識別詞典的所述更新步驟包括如下步驟當(dāng)更新所述識別詞典時,向額外語音識別裝置發(fā)送更新信息。
全文摘要
一種語音識別系統(tǒng)具有識別詞典,存儲語音信息;初次語音識別裝置,用于利用識別詞典,響應(yīng)用戶所發(fā)出的輸入語音信息,執(zhí)行初次語音識別;和識別結(jié)果判斷裝置,用于判斷接受還是拒絕初次語音識別結(jié)果。該語音識別系統(tǒng)包括收發(fā)機裝置,用于當(dāng)識別結(jié)果判斷裝置拒絕初次語音識別結(jié)果時,向額外語音識別裝置發(fā)送用戶的輸入語音信息,并且接收額外語音識別裝置的二次語音識別所產(chǎn)生的二次語音識別結(jié)果;和識別結(jié)果輸出裝置,用于向語音識別系統(tǒng)外部輸出初次或二次語音識別結(jié)果。該語音識別系統(tǒng)還包括確定結(jié)果輸入裝置,用于接收關(guān)于初次或二次語音識別結(jié)果的確定信息;和詞典內(nèi)容控制裝置,用于根據(jù)確定信息更新識別詞典。
文檔編號G10L15/00GK1905007SQ20061010745
公開日2007年1月31日 申請日期2006年7月25日 優(yōu)先權(quán)日2005年7月27日
發(fā)明者花澤健 申請人:日本電氣株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1