專(zhuān)利名稱(chēng):交互語(yǔ)音識(shí)別系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用來(lái)識(shí)別輸入的口述短語(yǔ)的交互語(yǔ)音識(shí)別方法,交互 語(yǔ)音識(shí)別系統(tǒng),以及計(jì)算機(jī)可讀介質(zhì)。
背景技術(shù):
隨著由語(yǔ)音操作的應(yīng)用系統(tǒng)的迅速普及,對(duì)可靠的語(yǔ)音識(shí)別系統(tǒng) 的需求變得越來(lái)越重要。
語(yǔ)音識(shí)別系統(tǒng)的難題在于不同的說(shuō)話(huà)者性別、年齡、口音、說(shuō)話(huà) 者詞匯、噪聲水平和不同的環(huán)境。
通常,語(yǔ)音識(shí)別系統(tǒng)首先將數(shù)字化的語(yǔ)音信號(hào)轉(zhuǎn)換為一組有用的
特征,如頻率或固定速率(典型為每10-20毫秒一次)的能量水平。進(jìn) 一步,人類(lèi)語(yǔ)音通常包括單音素(single phone)的序列。語(yǔ)音上相似 的音素被分組成音位(phoneme),音位可區(qū)分不同的發(fā)聲(utterance)。 在語(yǔ)音識(shí)別中,語(yǔ)言的音位是通過(guò)隱藏馬爾可夫模型(HMM)建模的, 借此隱藏馬爾可夫模型的每個(gè)狀態(tài)是通過(guò)概率密度函數(shù)描述的。隱藏 馬爾可夫模型適合于語(yǔ)音識(shí)別,因?yàn)檎Z(yǔ)音信號(hào)可被看作是10-20毫秒范 圍內(nèi)的短時(shí)間靜止信號(hào)。通過(guò)組合多個(gè)隱藏馬爾可夫模型,可識(shí)別最 可能的詞。
語(yǔ)音識(shí)別中遇到的主要問(wèn)題之一是輸入詞隨時(shí)間的變化。例如, 在各種語(yǔ)言中,元音是以不同速度發(fā)出的。另一個(gè)問(wèn)題是詞的拼寫(xiě)相 似或語(yǔ)音相似,這可以?xún)H通過(guò)考慮先前輸入的詞的上下文或者通過(guò)請(qǐng) 求用戶(hù)進(jìn)行補(bǔ)充輸入來(lái)解決。
許多論文和許多專(zhuān)利中都討論并提出了語(yǔ)音識(shí)別系統(tǒng)。在 US2006/0074661中,提供了一種導(dǎo)航設(shè)備,其對(duì)用戶(hù)的自由發(fā)言進(jìn)行 語(yǔ)音識(shí)別,其中從字典數(shù)據(jù)庫(kù)中搜索包括在被識(shí)別語(yǔ)音的內(nèi)容中的關(guān) 鍵詞,然后將這些詞顯示為"興趣點(diǎn)(Point of Interest)"搜索的關(guān)鍵 詞。大多數(shù)錯(cuò)誤出現(xiàn)在誤識(shí)別的詞的第一個(gè)音符中。該提出的設(shè)備使
得可以通過(guò)用戶(hù)操作來(lái)校正關(guān)鍵詞的誤識(shí)別。如果需要校正關(guān)鍵詞, 則顯示這些詞并且請(qǐng)求用戶(hù)從顯示的詞中選擇正確的關(guān)鍵詞。
在例如基于車(chē)輛的導(dǎo)航設(shè)備中,由于在語(yǔ)音輸入的情況中有誤識(shí) 別的可能性,所以識(shí)別結(jié)果需要通過(guò)語(yǔ)音輸出或觸摸面板上顯示的鍵 盤(pán)或?qū)Ш皆O(shè)備中設(shè)置的遙控裝置來(lái)確認(rèn)。在傳統(tǒng)語(yǔ)音識(shí)別系統(tǒng)中,整 個(gè)口述短語(yǔ)被聲學(xué)地輸出,或者被可視地輸出在用戶(hù)必須從中選擇的 顯示器上。因此,整個(gè)口述的地址必須通過(guò)語(yǔ)音再次輸入,并且系統(tǒng) 試圖再一次識(shí)別該地址或者用戶(hù)必須讀取顯示器上的整個(gè)地址并確認(rèn) 正確的地址。
如果有一個(gè)詞沒(méi)有被識(shí)別,則整個(gè)口述輸入的重復(fù),通常會(huì)需要 進(jìn)一步的用戶(hù)交互以便正確地檢測(cè)整個(gè)口述短語(yǔ)。然而,甚至是在操 作觸摸面板上的軟鍵盤(pán)或操作遙控裝置的方法中,許多動(dòng)作仍必須重 復(fù)地執(zhí)行以校正誤識(shí)別,并且這在諸如汽車(chē)的環(huán)境中可能是麻煩和危 險(xiǎn)的。進(jìn)一步,該方法喪失了免手操作的簡(jiǎn)單操作和便利性,而這些 是語(yǔ)音識(shí)別的優(yōu)點(diǎn)。
而且,由于需要更多存儲(chǔ)容量來(lái)存儲(chǔ)大量地址、媒體庫(kù)等而導(dǎo)致 的成本增加的問(wèn)題,在當(dāng)前的語(yǔ)音識(shí)別系統(tǒng)中還沒(méi)有得到滿(mǎn)意的解決。
解決這些缺點(diǎn)將極大地有益于提高用戶(hù)友好性和減小由于智能存 儲(chǔ)管理而導(dǎo)致的語(yǔ)音識(shí)別系統(tǒng)的成本。
發(fā)明內(nèi)容
因此,需要改進(jìn)系統(tǒng)的存儲(chǔ)管理。聯(lián)系到該需要,將系統(tǒng)存儲(chǔ)器 的成本保持在最低也會(huì)是合乎需要的。為了增強(qiáng)例如道路交通方面的 安全性,進(jìn)一步的需要是將用戶(hù)交互減小至最低水平。
這些需要中的至少一個(gè)是通過(guò)獨(dú)立權(quán)利要求的主題解決的。有利 實(shí)施例由從屬權(quán)利要求界定。
本發(fā)明的一個(gè)方面是將參考項(xiàng)目(term)與輸入的口述短語(yǔ)的項(xiàng)目 進(jìn)行匹配。取決于存儲(chǔ)容量,形成匹配的參考項(xiàng)目的各種可選的串接 (concatenation)。例如,只要有足夠的存儲(chǔ)容量可用于為每個(gè)先前匹 配的參考項(xiàng)目加載各個(gè)參考項(xiàng)目列表,就可以保持這些串接。如果然 后將會(huì)超出存儲(chǔ)容量,則可以請(qǐng)求用戶(hù)進(jìn)行補(bǔ)充輸入以減小所存儲(chǔ)的
匹配參考項(xiàng)目的串接的數(shù)目,并隨之減小存儲(chǔ)器中為了加載與剩余的 匹配參考項(xiàng)目/串接相對(duì)應(yīng)的列表而所需的空間。
本發(fā)明的一個(gè)優(yōu)點(diǎn)是可提供節(jié)省資源的語(yǔ)音識(shí)別系統(tǒng)。進(jìn)一步, 在超出存儲(chǔ)容量的情況下,語(yǔ)音識(shí)別系統(tǒng)可僅需要用戶(hù)對(duì)初始輸入的 口述短語(yǔ)的單個(gè)項(xiàng)目進(jìn)行補(bǔ)充輸入,而無(wú)需請(qǐng)求完全重復(fù)口述短語(yǔ)。 系統(tǒng)對(duì)補(bǔ)充用戶(hù)輸入的請(qǐng)求可以例如考慮語(yǔ)音和拼寫(xiě)相似性這二者。
語(yǔ)音識(shí)別系統(tǒng)的下面的實(shí)施例可以例如在基于車(chē)輛的環(huán)境中的導(dǎo) 航系統(tǒng)中或在移動(dòng)裝置(如個(gè)人數(shù)字助理、手持裝置、移動(dòng)電話(huà)等) 中實(shí)現(xiàn)。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,提供了通過(guò)語(yǔ)音識(shí)別系統(tǒng)交互地識(shí)別
口述短語(yǔ)的語(yǔ)音識(shí)別方法。根據(jù)該方法,類(lèi)別n的至少一個(gè)參考項(xiàng)目 列表從數(shù)據(jù)庫(kù)加載到列表存儲(chǔ)器中。隨即,可以確定類(lèi)別n的至少一 個(gè)參考項(xiàng)目是否可與包括多個(gè)項(xiàng)目的輸入的口述短語(yǔ)的其中一個(gè)項(xiàng)目 匹配。如果至少一個(gè)參考項(xiàng)目可與口述短語(yǔ)的項(xiàng)目匹配,則類(lèi)別n-l 的至少一個(gè)路徑可通過(guò)類(lèi)別n的該至少一個(gè)匹配參考項(xiàng)目而得到擴(kuò)展 以形成類(lèi)別n的至少一個(gè)路徑。對(duì)于最高類(lèi)別,路徑在最初被建立并 在隨后的類(lèi)別得到擴(kuò)展。
因此,可以確定列表存儲(chǔ)器的存儲(chǔ)容量是否足以為類(lèi)別n的每個(gè) 路徑加載類(lèi)別n+l的各個(gè)參考項(xiàng)目列表。如果確定存儲(chǔ)容量不夠,則 可以基于補(bǔ)充用戶(hù)輸入來(lái)消除類(lèi)別n的至少一個(gè)路徑。然后,可以卸 載類(lèi)別n的該至少一個(gè)參考項(xiàng)目列表,并且可以為類(lèi)別n的每個(gè)路徑 加載類(lèi)別n+l的各個(gè)參考項(xiàng)目列表。
在本發(fā)明的另一實(shí)施例中,可以有N個(gè)不同的類(lèi)別,并且級(jí)別n 的路徑含有間隔N到n中的不同類(lèi)別的匹配參考項(xiàng)目的串接。應(yīng)該注 意N和n都是整數(shù)。
根據(jù)另一實(shí)施例,基于補(bǔ)充用戶(hù)輸入來(lái)消除類(lèi)別n的至少一個(gè)路 徑可包括,基于補(bǔ)充用戶(hù)輸入來(lái)消除類(lèi)別m的匹配參考項(xiàng)目和消除含 有類(lèi)別m的被消除的匹配參考項(xiàng)目的類(lèi)別n的所有路徑。這可能是有 利的,如果先前級(jí)別的匹配參考項(xiàng)目具有語(yǔ)音相似性并且在聲學(xué)地澄 清方面難以區(qū)分的話(huà)。
進(jìn)一步,根據(jù)本發(fā)明的另一實(shí)施例,在確定列表存儲(chǔ)器的存儲(chǔ)容
量不足以為類(lèi)別n的每個(gè)路徑加載類(lèi)別n+l的各個(gè)參考項(xiàng)目列表后, 可以基于補(bǔ)充用戶(hù)輸入來(lái)消除類(lèi)別m以外的類(lèi)別的匹配參考項(xiàng)目,并 且可以消除含有m以外的級(jí)別的被消除的匹配參考項(xiàng)目的類(lèi)別n的所 有路徑。
根據(jù)本發(fā)明的另一實(shí)施例,在確定列表存儲(chǔ)器的存儲(chǔ)容量不足以 為類(lèi)別n的每個(gè)路徑加載類(lèi)別n+l的各個(gè)參考項(xiàng)目列表后,可選擇具 有最高可能性成為唯一地指定數(shù)據(jù)庫(kù)的條目(entry)的路徑的類(lèi)別n 的相應(yīng)路徑,并且可為類(lèi)別n的被選路徑的匹配參考項(xiàng)目加載相應(yīng)的 參考項(xiàng)目列表。
進(jìn)一步,根據(jù)本發(fā)明的另一實(shí)施例,具有最高可能性成為唯一地 指定數(shù)據(jù)庫(kù)的條目的路徑的類(lèi)別n的相應(yīng)路徑,可基于當(dāng)前車(chē)輛位置、 當(dāng)前或先前目的地或媒體文件當(dāng)中的至少一個(gè)參數(shù)來(lái)確定。
在本發(fā)明的另一實(shí)施例中,如果對(duì)于類(lèi)別n-l的一路徑,級(jí)別n 的參考項(xiàng)目列表中沒(méi)有相應(yīng)項(xiàng)目匹配口述短語(yǔ)的項(xiàng)目,則可消除類(lèi)別 n-l的該路徑。
進(jìn)一步,根據(jù)本發(fā)明的另一實(shí)施例,可以確定對(duì)于級(jí)別n的一個(gè) 剩余路徑,是否僅有一個(gè)可能的項(xiàng)目存在于級(jí)別n-l的路徑的參考項(xiàng)目 列表中,并使用由該路徑指定的數(shù)據(jù)庫(kù)條目來(lái)啟動(dòng)應(yīng)用程序。
根據(jù)另一實(shí)施例,如果所有類(lèi)別N都被處理完(passed)并且余 下最低類(lèi)別的多于一個(gè)的路徑,則可以請(qǐng)求補(bǔ)充輸入。
根據(jù)本發(fā)明的另一實(shí)施例,如果余下最低類(lèi)別的一個(gè)路徑,則可 使用由該路徑指定的數(shù)據(jù)庫(kù)條目來(lái)啟動(dòng)應(yīng)用程序。
在本發(fā)明的另一實(shí)施例中,路徑可指向表示媒體庫(kù)條目的數(shù)據(jù) 庫(kù)條目,或?qū)Ш铰肪€(xiàn)引導(dǎo)服務(wù)的目的地,或用于操作插件式計(jì)算機(jī) (board computer)的命令,或用于對(duì)裝置進(jìn)行控制的命令,或外部在 線(xiàn)數(shù)據(jù)庫(kù)的條目。
為了例如向語(yǔ)音識(shí)別系統(tǒng)的用戶(hù)提供更多靈活性,另一實(shí)施例提 出口述短語(yǔ)的項(xiàng)目可由語(yǔ)音識(shí)別系統(tǒng)以任意順序接收??商鎿Q地,口 述短語(yǔ)的項(xiàng)目必須由語(yǔ)音識(shí)別系統(tǒng)以預(yù)定順序接收。
進(jìn)一步,根據(jù)本發(fā)明的另一實(shí)施例,如果口述短語(yǔ)的項(xiàng)目和加載 的列表的相應(yīng)參考項(xiàng)目具有等于或高于閾值標(biāo)準(zhǔn)的語(yǔ)音和/或拼寫(xiě)相似
性,則可確定參考項(xiàng)目與該項(xiàng)目匹配。
根據(jù)另一實(shí)施例,甚至是在列表存儲(chǔ)器的容量足夠時(shí), 一旦出現(xiàn) 匹配參考項(xiàng)目的語(yǔ)音或拼寫(xiě)相似性,語(yǔ)音識(shí)別系統(tǒng)就可中斷口述短語(yǔ) 的輸入。
在本發(fā)明的另一實(shí)施例中,潛在地匹配口述短語(yǔ)的項(xiàng)目的參考項(xiàng) 目列表可以可視地或聲學(xué)地輸出以允許用戶(hù)通過(guò)從列表中選擇哪個(gè)匹 配的參考項(xiàng)目將被考慮以保持特定類(lèi)別的路徑,來(lái)提供補(bǔ)充輸入。
參考項(xiàng)目在輸出列表上的順序可有利地基于它們與口述短語(yǔ)的項(xiàng) 目匹配的可能性。
為了將必要的用戶(hù)輸入保持在最低水平,可以在聲學(xué)地提供補(bǔ)充 輸入以將一個(gè)參考項(xiàng)目與口述短語(yǔ)的項(xiàng)目匹配的請(qǐng)求的數(shù)目超過(guò)預(yù)設(shè) 數(shù)目時(shí)輸出列表。
進(jìn)一歩,輸出列表的條目可口頭地選擇,并且如果不成功,則可 通過(guò)操縱控制元件來(lái)選擇。
進(jìn)一步,根據(jù)另一實(shí)施例,在唯一地識(shí)別數(shù)據(jù)庫(kù)條目后,路徑的 匹配參考項(xiàng)目可由系統(tǒng)可視地或聲學(xué)地確認(rèn)。
本發(fā)明還涉及語(yǔ)音識(shí)別系統(tǒng)。根據(jù)一個(gè)實(shí)施例,語(yǔ)音識(shí)別系統(tǒng)包
括處理單元,用來(lái)將類(lèi)別n的至少一個(gè)參考項(xiàng)目列表從數(shù)據(jù)庫(kù)加載到 列表存儲(chǔ)器中,其中處理單元可操作地確定類(lèi)別n的至少一個(gè)參考項(xiàng) 目是否可與包括多個(gè)項(xiàng)目的輸入的口述短語(yǔ)的其中一個(gè)項(xiàng)目匹配。該 處理單元還可操作地通過(guò)類(lèi)別n的該至少一個(gè)匹配參考項(xiàng)目來(lái)擴(kuò)展類(lèi) 別n-l的至少一個(gè)路徑,以形成類(lèi)別n的至少一個(gè)路徑。進(jìn)一步,處理 單元可確定列表存儲(chǔ)器的存儲(chǔ)容量是否足以為類(lèi)別n的每個(gè)路徑加載 類(lèi)別n+l的各個(gè)參考項(xiàng)目列表。在處理單元確定列表存儲(chǔ)器的存儲(chǔ)容 量不足以為類(lèi)別n的每個(gè)路徑加載類(lèi)別n+l的各個(gè)參考項(xiàng)目列表時(shí), 可基于補(bǔ)充用戶(hù)輸入來(lái)消除類(lèi)別n的至少一個(gè)路徑。處理單元還可卸 載類(lèi)別n的該至少一個(gè)參考項(xiàng)目列表,并且可以為類(lèi)別n的每個(gè)路徑 加載類(lèi)別n+l的各個(gè)參考項(xiàng)目列表。
本發(fā)明還提供了存儲(chǔ)指令的計(jì)算機(jī)可讀介質(zhì),當(dāng)所述指令被交互 語(yǔ)音識(shí)別系統(tǒng)的處理單元執(zhí)行時(shí),可使交互語(yǔ)音識(shí)別系統(tǒng)識(shí)別口述短 語(yǔ)。這可通過(guò)將類(lèi)別n的至少一個(gè)參考項(xiàng)目列表從數(shù)據(jù)庫(kù)加載到列表
存儲(chǔ)器中,隨后確定類(lèi)別n的至少一個(gè)參考項(xiàng)目是否可與包括多個(gè)項(xiàng) 目的輸入的口述短語(yǔ)的其中一個(gè)項(xiàng)目匹配,來(lái)執(zhí)行。類(lèi)別n-l的至少一 個(gè)路徑可通過(guò)類(lèi)別n的該至少一個(gè)匹配參考項(xiàng)目而得到擴(kuò)展,以形成 類(lèi)別n的至少一個(gè)路徑。進(jìn)一步,可確定列表存儲(chǔ)器的存儲(chǔ)容量是否 足以為類(lèi)別n的每個(gè)路徑加載類(lèi)別n+l的各個(gè)參考項(xiàng)目列表。在確定 存儲(chǔ)容量不夠時(shí)可以基于補(bǔ)充用戶(hù)輸入來(lái)消除類(lèi)別n的至少一個(gè)路徑。 然后,可以卸載類(lèi)別n的該至少一個(gè)參考項(xiàng)目列表,并且可以為類(lèi)別n 的每個(gè)路徑加載類(lèi)別n+l的各個(gè)參考項(xiàng)目列表。
本發(fā)明的另一實(shí)施例涉及通過(guò)語(yǔ)音識(shí)別系統(tǒng)交互地識(shí)別口述短語(yǔ) 的方法。根據(jù)該方法,可取決于可用的列表存儲(chǔ)器容量,為至少一個(gè) 類(lèi)別的每個(gè)將各個(gè)參考項(xiàng)目列表從數(shù)據(jù)庫(kù)加載到列表存儲(chǔ)器中。然后, 可以確定至少一個(gè)參考項(xiàng)目是否可與包括多個(gè)項(xiàng)目的輸入的口述短語(yǔ) 的至少一個(gè)項(xiàng)目匹配。語(yǔ)音識(shí)別系統(tǒng)還可存儲(chǔ)匹配的參考項(xiàng)目,并卸 載當(dāng)前的參考項(xiàng)目列表。如果先前不能夠加載所有類(lèi)別的所有參考項(xiàng) 目列表,則可卸載當(dāng)前的參考項(xiàng)目列表,并且可加載至少另一個(gè)類(lèi)別 的每個(gè)的參考項(xiàng)目列表。隨即,可重復(fù)匹配處理并且可存儲(chǔ)匹配的參 考項(xiàng)目。迸一步,可加載與存儲(chǔ)的匹配參考項(xiàng)目相對(duì)應(yīng)的參考項(xiàng)目列 表??蓪ふ易钣锌赡茏R(shí)別數(shù)據(jù)庫(kù)條目的匹配參考項(xiàng)目的串接。
本發(fā)明的另一實(shí)施例涉及通過(guò)語(yǔ)音識(shí)別系統(tǒng)交互地識(shí)別口述短語(yǔ) 的方法。根據(jù)該方法,接收到的輸入的口述短語(yǔ)可包括類(lèi)別n或更低 類(lèi)別的項(xiàng)目。進(jìn)一步,可以基于當(dāng)前車(chē)輛位置、當(dāng)前或先前駕駛目的 地或在播放列表中選擇的將被重放或當(dāng)前正在重放的媒體庫(kù)的媒體文 件當(dāng)中的至少一個(gè)參數(shù),來(lái)加載類(lèi)別n的參考項(xiàng)目列表。然后,可以 確定加載的列表中的類(lèi)別n的參考項(xiàng)目是否可與口述短語(yǔ)的項(xiàng)目匹配。
根據(jù)另一實(shí)施例,可以確定輸入的口述短語(yǔ)中具有最高類(lèi)別的參 考項(xiàng)目,其中輸入的口述短語(yǔ)中的項(xiàng)目的最高類(lèi)別可以定義為類(lèi)別n。
進(jìn)一步,根據(jù)另一實(shí)施例,可以將至少一個(gè)參數(shù)與數(shù)據(jù)庫(kù)中的類(lèi) 別n+l的參考項(xiàng)目匹配,并且可以為類(lèi)別n+l的匹配參考項(xiàng)目加載類(lèi) 別n的參考項(xiàng)目列表。
在本發(fā)明的另一實(shí)施例中,類(lèi)別n-l的至少一個(gè)路徑可通過(guò)類(lèi)別n 的該至少一個(gè)匹配參考項(xiàng)目而得到擴(kuò)展,以形成類(lèi)別n的至少一個(gè)路
徑。對(duì)于最高類(lèi)別,路徑在最初被建立并在隨后的類(lèi)別得到擴(kuò)展。因
此,可以確定列表存儲(chǔ)器的存儲(chǔ)容量是否足以為類(lèi)別n的每個(gè)路徑加 載類(lèi)別n+l的各個(gè)參考項(xiàng)目列表。如果確定存儲(chǔ)容量不夠,則可基于 補(bǔ)充用戶(hù)輸入來(lái)消除類(lèi)別n的至少一個(gè)路徑。然后,可以卸載類(lèi)別n 的該至少一個(gè)參考項(xiàng)目列表,并且可以為類(lèi)別n的每個(gè)路徑加載類(lèi)別 n+l的各個(gè)參考項(xiàng)目列表。
在下文中,將參考附圖更詳細(xì)地描述本發(fā)明。 圖1示出根據(jù)本發(fā)明的示例性實(shí)施例的示例性的輸入口述短語(yǔ)的 項(xiàng)目和類(lèi)別,
圖2示出根據(jù)本發(fā)明的示例性實(shí)施例的基于車(chē)輛的環(huán)境中的導(dǎo)航 系統(tǒng)或插件式計(jì)算機(jī)的總體實(shí)現(xiàn)方案,
圖3示出根據(jù)本發(fā)明的示例性實(shí)施例的語(yǔ)音識(shí)別系統(tǒng)的硬件模塊,
圖4示出根據(jù)本發(fā)明的示例性實(shí)施例,當(dāng)在導(dǎo)航系統(tǒng)中實(shí)現(xiàn)時(shí), 具有形成路徑的串接的匹配參考項(xiàng)目的搜索路徑樹(shù),
圖5示出根據(jù)本發(fā)明的示例性實(shí)施例,當(dāng)在媒體庫(kù)中實(shí)現(xiàn)時(shí),具 有形成路徑的串接的匹配參考項(xiàng)目的搜索路徑樹(shù),其中路徑可唯一地 識(shí)別數(shù)據(jù)庫(kù)的多個(gè)條目,
圖6示出根據(jù)本發(fā)明的示例性實(shí)施例,具有執(zhí)行語(yǔ)音識(shí)別所必須 的步驟的流程圖,并且
圖7示出根據(jù)本發(fā)明的示例性實(shí)施例,具有執(zhí)行語(yǔ)音識(shí)別所必須 的步驟的流程圖。
具體實(shí)施例方式
在進(jìn)一步詳細(xì)討論本發(fā)明的不同示例性實(shí)施例之前,先在下面定 義本文中頻繁使用的幾個(gè)術(shù)語(yǔ)。
數(shù)據(jù)庫(kù)典型地由幾個(gè)數(shù)據(jù)庫(kù)條目的集合組成。每個(gè)數(shù)據(jù)庫(kù)條目自 身可包括許多不同的字段,其中所有數(shù)據(jù)庫(kù)條目可典型地包括同樣數(shù) 目的不同字段。每個(gè)字段可與將在下面更詳細(xì)概述的類(lèi)別相關(guān)聯(lián)。
數(shù)據(jù)庫(kù)可以例如是包括數(shù)字音樂(lè)文件、視頻、游戲等的媒體庫(kù)。
例如,在本發(fā)明的一個(gè)實(shí)施例中,數(shù)據(jù)庫(kù)被實(shí)現(xiàn)為SQL內(nèi)部/外部(在
線(xiàn))數(shù)據(jù)庫(kù)(SQI^結(jié)構(gòu)化查詢(xún)語(yǔ)言)??紤]例如數(shù)字音樂(lè)文件的媒體
庫(kù),其可以包括可例如由曲風(fēng)、演奏者和標(biāo)題表征的歌曲的集合。這 些特征可被認(rèn)為每個(gè)均與一個(gè)類(lèi)別相關(guān)聯(lián)。
在本發(fā)明的另一實(shí)施例中,數(shù)據(jù)庫(kù)也可包含全世界的、全洲的或
全國(guó)的目的地和/或興趣點(diǎn)(POI)的條目。目的地和/或興趣點(diǎn)可被認(rèn)
為包括若干字段,諸如國(guó)家、(任選地)州、城市、街道名稱(chēng)、房屋號(hào)、
房屋號(hào)的尾標(biāo)(suffix)、補(bǔ)充信息等。
在本發(fā)明的另一實(shí)施例中,用于操作插件式計(jì)算機(jī)和/或控制基于 車(chē)輛的裝置的命令被存儲(chǔ)在數(shù)據(jù)庫(kù)中。當(dāng)操作車(chē)輛裝置時(shí),例如,每
個(gè)命令可以包括指示要控制的單元(例如,"空調(diào)")的字段(其例 如對(duì)應(yīng)于最高類(lèi)別),隨后是指示要執(zhí)行的操作(例如,"溫度")的字 段(其可對(duì)應(yīng)于下一類(lèi)別)。根據(jù)示例性的輸入口述短語(yǔ)"請(qǐng)把空調(diào)的
溫度設(shè)置為20度",項(xiàng)目"空調(diào)"表示最高類(lèi)別。項(xiàng)目"溫度"可對(duì) 應(yīng)于下一類(lèi)別,隨后是項(xiàng)目"20度",其可對(duì)應(yīng)于該實(shí)例的最低類(lèi)別。
另一選項(xiàng)可以是,數(shù)據(jù)庫(kù)包括不同類(lèi)型的條目,諸如媒體、目的 地、興趣點(diǎn)、插件式計(jì)算機(jī)命令等。
如上所述,數(shù)據(jù)庫(kù)條目的每個(gè)字段可與類(lèi)別相關(guān)聯(lián)。例如,導(dǎo)航 系統(tǒng)的數(shù)據(jù)庫(kù)的國(guó)家可定義為對(duì)應(yīng)于最高類(lèi)別。下一類(lèi)別可表示目的 地的城市,隨后的類(lèi)別可以是街道名稱(chēng),等等。數(shù)據(jù)庫(kù)的各個(gè)字段的 條目被表示為參考項(xiàng)目。
類(lèi)似地,對(duì)于媒體庫(kù),歌曲標(biāo)題"Madman across the water"可以 例如是類(lèi)別"標(biāo)題"的參考項(xiàng)目。 一旦數(shù)據(jù)庫(kù)從語(yǔ)音識(shí)別系統(tǒng)接收到 查詢(xún),就可以根據(jù)該査詢(xún)中指示的類(lèi)別生成適當(dāng)?shù)膮⒖柬?xiàng)目的列表。 例如,如果第一査詢(xún)指示最高類(lèi)別,則將國(guó)家的列表返回給語(yǔ)音識(shí)別 系統(tǒng)。如下面詳細(xì)說(shuō)明的那樣,下一類(lèi)別的下一查詢(xún)可從數(shù)據(jù)庫(kù)返回 語(yǔ)音識(shí)別系統(tǒng)在先前類(lèi)別中先前確定的該國(guó)家內(nèi)的城市的列表。
語(yǔ)音識(shí)別系統(tǒng)處理不同類(lèi)別的順序可取決于不同因素,諸如要啟 動(dòng)的應(yīng)用程序或要控制的功能,要指定的數(shù)據(jù)庫(kù)條目的類(lèi)型,等等。 例如,如果語(yǔ)音識(shí)別系統(tǒng)與車(chē)輛的導(dǎo)航系統(tǒng)結(jié)合使用,并且例如如果 車(chē)輛位于歐洲,則語(yǔ)音識(shí)別系統(tǒng)可以使用下面的數(shù)據(jù)庫(kù)條目類(lèi)別的順序來(lái)處理輸入的口述短語(yǔ)(例如,導(dǎo)航系統(tǒng)的駕駛目的地)國(guó)家,城 市,街道名,等等。如果例如車(chē)輛位于美國(guó),則類(lèi)別可以以不同的順 序來(lái)處理,該順序從州開(kāi)始,隨后是城市,街道名稱(chēng),等等。
例如,興趣點(diǎn)可以?xún)H由兩個(gè)類(lèi)別(其可以是例如"紐約市政廳(City
hall in New York)")定義。用戶(hù)可在其口述短語(yǔ)中使用關(guān)鍵詞"興趣點(diǎn)"。 然后,語(yǔ)音識(shí)別系統(tǒng)可加載"紐約"的"興趣點(diǎn)"類(lèi)別的參考項(xiàng)目列 表,其中參考項(xiàng)目可與數(shù)據(jù)庫(kù)中的唯一地址相關(guān)聯(lián)。
當(dāng)使用語(yǔ)音識(shí)別系統(tǒng)來(lái)識(shí)別數(shù)字音樂(lè)文件庫(kù)的條目時(shí),例如可使 用自由搜索而不采用分級(jí)排序的類(lèi)別。
通常,類(lèi)別n可指示總共N個(gè)類(lèi)別中的特定類(lèi)別。因此,類(lèi)別n-l 可表示類(lèi)別n前面的類(lèi)別。類(lèi)別n+l可在類(lèi)別n之后得到處理。
口述短語(yǔ)是由用戶(hù)輸入的完整發(fā)聲?;诳谑龆陶Z(yǔ),語(yǔ)音識(shí)別系 統(tǒng)試圖唯一地識(shí)別數(shù)據(jù)庫(kù)的一個(gè)條目。例如,輸入的導(dǎo)航目的地通常 識(shí)別數(shù)據(jù)庫(kù)的一個(gè)唯一地址。在本發(fā)明的另一實(shí)施例中,口述短語(yǔ)也 可唯一地識(shí)別數(shù)據(jù)庫(kù)的多個(gè)條目。假定用戶(hù)打算聽(tīng)某個(gè)演奏者的曲集 的所有歌曲,則語(yǔ)音識(shí)別系統(tǒng)必須尋定并選擇若干個(gè)標(biāo)題。
根據(jù)本發(fā)明的另一實(shí)施例,口述短語(yǔ)由多個(gè)項(xiàng)目組成,這些項(xiàng)目 可由語(yǔ)音識(shí)別系統(tǒng)識(shí)別為輸入的發(fā)聲的一些部分。項(xiàng)目可定義為類(lèi)似 "Melbourne"的單個(gè)詞或形成例如類(lèi)似"Please, drive me to"的命令 的詞的串接。這些項(xiàng)目必須在語(yǔ)音識(shí)別處理開(kāi)始之前從口述的發(fā)聲中 確定。
然后,語(yǔ)音識(shí)別系統(tǒng)試圖將各個(gè)類(lèi)別的參考項(xiàng)目與輸入的口述短 語(yǔ)的項(xiàng)目進(jìn)行匹配,以獲得不同類(lèi)別的匹配參考項(xiàng)目的一個(gè)或多個(gè)串 接(也表示為"路徑"),每個(gè)串接識(shí)別一個(gè)數(shù)據(jù)庫(kù)條目。
圖1示出根據(jù)本發(fā)明的示例性實(shí)施例的口述短語(yǔ)與其項(xiàng)目和該實(shí) 例的相關(guān)類(lèi)別。口述短語(yǔ)可以是"Please drive me to Harbor Street fifteen AinMelboume"。首先,項(xiàng)目"Please drive me to"可確定為對(duì)應(yīng)于最 高類(lèi)別1,其可以是指示哪個(gè)應(yīng)用程序?qū)⒈粏?dòng)或哪個(gè)單元將被控制的 命令。在該實(shí)例中,導(dǎo)航系統(tǒng)被請(qǐng)求計(jì)算到達(dá)給定目的地的路線(xiàn)。然 后,項(xiàng)目"Melbourne"可被定義為對(duì)應(yīng)于下一類(lèi)別2。輸入的目的地 地址的項(xiàng)目"Harbor Street"可定義為對(duì)應(yīng)于下一類(lèi)別3。然后,項(xiàng)目
"fifteen"可對(duì)應(yīng)于類(lèi)別4,并且項(xiàng)目"A"可對(duì)應(yīng)于最低類(lèi)別。通常, 應(yīng)用程序或要控制的單元可由最高類(lèi)別的匹配參考項(xiàng)目規(guī)定。隨后的 類(lèi)別的分級(jí)結(jié)構(gòu)可取決于最高類(lèi)別的匹配參考項(xiàng)目。
類(lèi)別n的匹配參考項(xiàng)目表示可與口述短語(yǔ)的項(xiàng)目匹配的參考項(xiàng)目。 例如,在操作導(dǎo)航系統(tǒng)(包括或共同操作語(yǔ)音識(shí)別)時(shí),輸入的短語(yǔ) 可以是"Please, drive me to Melbourne,,。對(duì)于該實(shí)例,命令"please, drive me to"被認(rèn)為是一個(gè)項(xiàng)目。進(jìn)一步,"Melbourne"被認(rèn)為是該實(shí)例的 另一項(xiàng)目。語(yǔ)音識(shí)別系統(tǒng)可將參考項(xiàng)目澳大利亞的"Melbourne"與口 述短語(yǔ)的輸入項(xiàng)目匹配,但也可以將參考項(xiàng)目美國(guó)Florida的
"Melbourne"與口述短語(yǔ)的輸入項(xiàng)目匹配。
參考項(xiàng)目的列表被定義為與所請(qǐng)求的類(lèi)別相對(duì)應(yīng)的數(shù)據(jù)庫(kù)字段內(nèi) 容的列表。例如,該列表可通過(guò)請(qǐng)求從數(shù)據(jù)庫(kù)取回。作為請(qǐng)求的參數(shù), 可以使用一個(gè)或多個(gè)先前處理的類(lèi)別的一個(gè)或多個(gè)匹配參考項(xiàng)目。例 如,數(shù)據(jù)庫(kù)響應(yīng)于具有參數(shù)"USA, Melbourne"的對(duì)街道名稱(chēng)的查詢(xún) 而返回的參考項(xiàng)目列表,將返回美國(guó)Melbourne中的所有街道的所有 名稱(chēng)。通過(guò)使用SQL,請(qǐng)求可具有下面的格式SELECT streets FROM database WHERE country=,USA, AND city= ,Melbourne,。因此,不使用 參數(shù)的對(duì)街道名稱(chēng)的查詢(xún)將返回包含在數(shù)據(jù)庫(kù)中的所有街道名稱(chēng)的列 表,而不管特定城市(和國(guó)家)(例如使用SQL: SELECT streets FROM database )。
路徑是各種類(lèi)別的匹配參考項(xiàng)目的串接。 一個(gè)或多個(gè)路徑可在匹 配參考項(xiàng)目的處理中動(dòng)態(tài)地建立和/或消除。例如,如果在類(lèi)別n沒(méi)有 其它的參考項(xiàng)目可與口述短語(yǔ)的項(xiàng)目匹配,則可消除各個(gè)路徑。例如, 如果對(duì)于具有城市"Melbourne"(澳大利亞)的路徑,沒(méi)有參考項(xiàng)目 可與口述短語(yǔ)的項(xiàng)目"Townhallstreet "匹配,則可以刪除含有 "Melbourne"(澳大利亞)的路徑。與之相對(duì)比,關(guān)于城市"Melbourne" (Florida),例如,類(lèi)別"街道"的各個(gè)參考項(xiàng)目可與口述短語(yǔ)的項(xiàng)目 "Townhallstreet"匹配。
進(jìn)一步,措辭語(yǔ)音相似性表示至少兩個(gè)參考項(xiàng)目可與口述短語(yǔ)的 一個(gè)項(xiàng)目匹配的情況,其中匹配的參考項(xiàng)目表示具有不同拼寫(xiě)但具有 相同發(fā)音的項(xiàng)目。例如,參考項(xiàng)目"Harbor Street"禾卩"Harberstreet" 可與輸入的口述短語(yǔ)的項(xiàng)目"Harbor Street"匹配。
下面的段落將描述本發(fā)明的多個(gè)實(shí)施例。應(yīng)該注意,本發(fā)明可有 利地例如與基于車(chē)輛的娛樂(lè)、導(dǎo)航和信息處理裝置結(jié)合使用,但本發(fā) 明不限于用在該特定的示例性的基于車(chē)輛的環(huán)境中。
本發(fā)明的一個(gè)方面是改善語(yǔ)音識(shí)別系統(tǒng)的存儲(chǔ)管理。這可通過(guò)僅 加載各個(gè)類(lèi)別的參考項(xiàng)目至存儲(chǔ)器來(lái)實(shí)現(xiàn)。語(yǔ)音識(shí)別系統(tǒng)識(shí)別輸入的 口述短語(yǔ)中的一個(gè)或多個(gè)項(xiàng)目,其中每個(gè)項(xiàng)目可對(duì)應(yīng)于具有重要性的 各個(gè)類(lèi)別。例如,如果語(yǔ)音識(shí)別系統(tǒng)的用戶(hù)想聽(tīng)媒體庫(kù)的歌曲,則他/ 她可輸入所期望的歌曲的演奏者和標(biāo)題。在口述短語(yǔ)己經(jīng)由用戶(hù)輸入 后,語(yǔ)音識(shí)別系統(tǒng)可發(fā)送查詢(xún)至數(shù)據(jù)庫(kù)并取回包括存儲(chǔ)在數(shù)據(jù)庫(kù)中的 所有演奏者的參考項(xiàng)目的列表。
最高類(lèi)別的參考項(xiàng)目的列表被存儲(chǔ)在列表存儲(chǔ)器中。隨后,將每 個(gè)參考項(xiàng)目與口述短語(yǔ)的每個(gè)項(xiàng)目進(jìn)行比較。 一旦所有加載的參考項(xiàng) 目已經(jīng)與口述短語(yǔ)的項(xiàng)目進(jìn)行了比較,并且至少一個(gè)參考項(xiàng)目已經(jīng)與 口述短語(yǔ)的項(xiàng)目匹配,就已經(jīng)為該相應(yīng)的類(lèi)別完成了搜索和匹配處理。 每個(gè)匹配的參考項(xiàng)目可添加到各個(gè)路徑(即,表示各個(gè)路徑的第一元 素)。各個(gè)類(lèi)別的至少一個(gè)路徑的匹配處理可被認(rèn)為是語(yǔ)音識(shí)別處理的 迭代步驟。
根據(jù)下一較低的類(lèi)別(其可例如對(duì)應(yīng)于歌曲的標(biāo)題),該至少一個(gè) 匹配的參考項(xiàng)目(標(biāo)題)可與先前類(lèi)別的各個(gè)匹配參考項(xiàng)目串接。為 了將列表存儲(chǔ)器的占用率保持在最低水平,在當(dāng)前處理的類(lèi)別中沒(méi)有 為其發(fā)現(xiàn)參考項(xiàng)目的路徑被刪除。
因此,通過(guò)僅加載根據(jù)各個(gè)類(lèi)別的參考項(xiàng)目的列表,語(yǔ)音識(shí)別系 統(tǒng)有效地使用可用的存儲(chǔ)器。也就是,對(duì)于數(shù)字音樂(lè)文件的實(shí)例,首 先可加載演奏者的列表并將其與口述短語(yǔ)的項(xiàng)目進(jìn)行比較。然后如果 類(lèi)似作為實(shí)例的"Madonna"的演奏者已經(jīng)與口述短語(yǔ)的項(xiàng)目匹配,則 卸載演奏者列表并加載"Madonna"的所有可得到的歌曲標(biāo)題。該方法 在存儲(chǔ)器占用率方面比例如同時(shí)加載具有所有演奏者和標(biāo)題的列表的 方法要高效得多。
本發(fā)明的另一方面是減小語(yǔ)音識(shí)別系統(tǒng)和用戶(hù)之間必需的交互。 根據(jù)本發(fā)明的一個(gè)實(shí)施例,考慮口述短語(yǔ)的項(xiàng)目而不是對(duì)完整的發(fā)聲
執(zhí)行語(yǔ)音識(shí)別,這在必需的用戶(hù)交互方面要有效得多。
例如,口述短語(yǔ)可以是"I want to listen to the song Fever from Madonna"。當(dāng)對(duì)整個(gè)發(fā)聲執(zhí)行語(yǔ)音識(shí)別時(shí),系統(tǒng)在為"I want to listen to"
尋找參考項(xiàng)目時(shí)可能會(huì)有問(wèn)題,并且可能會(huì)請(qǐng)求重復(fù)口述短語(yǔ)。根據(jù) 本發(fā)明,語(yǔ)音識(shí)別系統(tǒng)可僅考慮口述短語(yǔ)的項(xiàng)目"Madonna"和"Fever"。 由于系統(tǒng)可允許輸入項(xiàng)目的任意順序,所以可以實(shí)現(xiàn)對(duì)補(bǔ)充用戶(hù)輸入 的必要請(qǐng)求的減少。甚至在補(bǔ)充用戶(hù)輸入是必需的情況中,語(yǔ)音識(shí)別 系統(tǒng)也可僅需要校正各個(gè)單獨(dú)的項(xiàng)目,而無(wú)需重復(fù)整個(gè)口述短語(yǔ)。這 可顯著地增強(qiáng)道路交通中的安全性。
減小用戶(hù)交互的第二個(gè)措施是有效地加載參考項(xiàng)目列表至列表存 儲(chǔ)器。由于列表存儲(chǔ)器可以以滿(mǎn)容量操作,所以可以追蹤許多可能的 路徑以便無(wú)需請(qǐng)求用戶(hù)進(jìn)行補(bǔ)充輸入。系統(tǒng)還可消除在各個(gè)類(lèi)別處不 具有合適的相應(yīng)參考項(xiàng)目的路徑。
因此,本發(fā)明的語(yǔ)音識(shí)別系統(tǒng)提供了有效的操作系統(tǒng),其解決了 增強(qiáng)存儲(chǔ)管理和減少用戶(hù)交互的需要。
圖2顯示出了根據(jù)本發(fā)明的示例性實(shí)施例,導(dǎo)航系統(tǒng)或插件式計(jì) 算機(jī)如何在汽車(chē)環(huán)境中實(shí)現(xiàn)的實(shí)例。該系統(tǒng)可以例如包括導(dǎo)航系統(tǒng)1, 導(dǎo)航系統(tǒng)1包括用于執(zhí)行語(yǔ)音識(shí)別的所有處理裝置和數(shù)據(jù)庫(kù)。麥克風(fēng)2 可設(shè)置在車(chē)輛的內(nèi)部以用于輸入口述短語(yǔ)。進(jìn)一歩,導(dǎo)航系統(tǒng)可以例 如包括用于與用戶(hù)可視地交互的觸摸板顯示器(touchpad display),并 且如果有必要,可在顯示器3上顯示軟鍵盤(pán)以使得用戶(hù)能夠輸入。可 替換地或另外,導(dǎo)航系統(tǒng)還可包括使用戶(hù)能夠輸入的按鍵或按鈕4。這 些按鍵或按鈕可以例如在方向盤(pán)上,并且可有利于與用戶(hù)相應(yīng)的用戶(hù) 友好性以便不使用戶(hù)從道路交通分心。例如,也設(shè)置了揚(yáng)聲器5來(lái)聲 學(xué)地輸出信息和請(qǐng)求給用戶(hù)。顯示器也可例如設(shè)置為將信息投影在用 戶(hù)視場(chǎng)內(nèi)的擋風(fēng)玻璃上的平視顯示器。對(duì)于語(yǔ)音識(shí)別所必需的硬件模 塊以及它們?cè)诶鐚?dǎo)航系統(tǒng)1中的實(shí)現(xiàn),在圖3中顯示出。
圖3顯示出根據(jù)本發(fā)明的示例性實(shí)施例,可包括在語(yǔ)音識(shí)別系統(tǒng) 中的多個(gè)硬件模塊??蓪?shí)現(xiàn)用戶(hù)接口 10以用于由用戶(hù)輸入口述短語(yǔ)和 用于輸出對(duì)補(bǔ)充用戶(hù)輸入的請(qǐng)求。這可通過(guò)采用供輸入用的麥克風(fēng)2 或顯示器3的軟鍵盤(pán)或按鍵4和供輸出用的顯示器3和/或揚(yáng)聲器5來(lái)執(zhí)行。
進(jìn)一步,輸入存儲(chǔ)器12存儲(chǔ)輸入的口述短語(yǔ)。如下面參考圖5所 述,語(yǔ)音識(shí)別系統(tǒng)的處理單元14能夠經(jīng)由接口 17發(fā)送查詢(xún)至數(shù)據(jù)庫(kù) 16以獲得參考項(xiàng)目的列表。進(jìn)一歩,處理單元14可加載從數(shù)據(jù)庫(kù)16 接收的參考項(xiàng)目列表至列表存儲(chǔ)器13。數(shù)據(jù)庫(kù)可包括至少一個(gè)永久存 儲(chǔ)介質(zhì),諸如硬盤(pán)驅(qū)動(dòng)器、DVD、 CD或其它光學(xué)存儲(chǔ)介質(zhì)以存儲(chǔ)數(shù)字 音樂(lè)文件、電影、導(dǎo)航目的地、興趣點(diǎn)、命令等。連接至列表存儲(chǔ)器 13和處理單元14的識(shí)別部11能夠比較存儲(chǔ)在列表存儲(chǔ)器13中的每個(gè) 參考項(xiàng)目與存儲(chǔ)在輸入存儲(chǔ)器12中的口述短語(yǔ)的項(xiàng)目。包括匹配參考 項(xiàng)目的串接的路徑可被存儲(chǔ)在輸出存儲(chǔ)器15中。
圖4示例性地顯示出根據(jù)本發(fā)明的示例性實(shí)施例,當(dāng)在車(chē)輛的導(dǎo) 航系統(tǒng)中實(shí)現(xiàn)時(shí),語(yǔ)音識(shí)別系統(tǒng)如何操作。對(duì)于該實(shí)例,為了示例性 的目的,假定與輸入目的地地址相應(yīng)的輸入口述短語(yǔ)是"Please drive me toHarbor Street fifteen A in Melbourne"。此處,為了簡(jiǎn)單起見(jiàn),假定語(yǔ) 音識(shí)別系統(tǒng)僅用于控制導(dǎo)航系統(tǒng),因此不需要從口述短語(yǔ)中確定哪個(gè) 應(yīng)用程序?qū)⒈粏?dòng)或哪個(gè)單元將被控制。首先,語(yǔ)音識(shí)別系統(tǒng)可任選 地確定目的地的國(guó)家??梢约俣康牡匚挥陉P(guān)于口述短語(yǔ)被輸入的時(shí) 間點(diǎn)的同一國(guó)家內(nèi)。在本發(fā)明的一個(gè)實(shí)施例中,國(guó)家可基于當(dāng)前車(chē)輛 位置(其可以例如通過(guò)GPS接收機(jī)來(lái)確定)而被(自動(dòng)地)預(yù)選擇。 可替換地,可以請(qǐng)求用戶(hù)手動(dòng)地預(yù)選擇國(guó)家。該預(yù)選擇的國(guó)家然后可 用作步驟S20的基礎(chǔ)。
根據(jù)上面的說(shuō)明,語(yǔ)音識(shí)別系統(tǒng)從最高類(lèi)別(該實(shí)例中的類(lèi)別l) 開(kāi)始,并加載相應(yīng)國(guó)家(在該實(shí)例中為美國(guó))的城市。語(yǔ)音識(shí)別系統(tǒng) 比較加載列表的每個(gè)參考項(xiàng)目(每個(gè)城市)與輸入的口述短語(yǔ)的每個(gè) 項(xiàng)目。在已經(jīng)終止最高類(lèi)別的搜索運(yùn)行后,可以假設(shè)通過(guò)考慮匹配參 考項(xiàng)目拼寫(xiě)和/或語(yǔ)音相似性而發(fā)現(xiàn)了兩個(gè)參考項(xiàng)目。在該實(shí)例中,美 國(guó)城市"Melbourne"和"Elburn"與口述短語(yǔ)的一個(gè)項(xiàng)目匹配。
類(lèi)別1的搜索運(yùn)行的結(jié)果 路徑a
[Elburn (USA)] 路徑山
在還沒(méi)有預(yù)選擇國(guó)家的情況中,城市的搜索運(yùn)行可以以多于兩個(gè)
城市結(jié)束。例如,這些匹配的城市可以是"Melbourne"(澳大利亞)、 "Melbourne"(美國(guó))、"Elbum"(美國(guó))禾n "Malborn"(德國(guó))。
該實(shí)例將以表示美國(guó)的匹配城市的路徑ai和山繼續(xù)進(jìn)行。系統(tǒng)保 持兩個(gè)路徑(&和d。,因?yàn)椴荒艽_定是否已經(jīng)有一個(gè)路徑對(duì)于口述輸 入的目的地地址無(wú)效,由于在該階段街道名稱(chēng)還沒(méi)有被匹配。
進(jìn)一步,在一個(gè)實(shí)施例中,處理單元可在搜索運(yùn)行之間(即,在 每次搜索特定類(lèi)別之后)確定是否已經(jīng)有一個(gè)路徑唯一地識(shí)別數(shù)據(jù)庫(kù) 條目,即該實(shí)例中的目的地。如果是,則可開(kāi)始計(jì)算到目的地的路線(xiàn)。
處理單元可確定是否有足夠的存儲(chǔ)容量來(lái)加載在當(dāng)前類(lèi)別匹配的 兩個(gè)城市中的每個(gè)城市的街道名稱(chēng)列表。如果在加載這兩個(gè)城市的街 道名稱(chēng)列表時(shí)超出存儲(chǔ)器容量,則系統(tǒng)可請(qǐng)求用戶(hù)進(jìn)行補(bǔ)充輸入。特 別地,可以例如請(qǐng)求用戶(hù)選擇兩個(gè)城市中的一個(gè)。相反,如果有足夠 的存儲(chǔ)器容量可利用,則可保持存儲(chǔ)兩個(gè)路徑并卸載城市列表。然后, 對(duì)城市"Melbourne"(美國(guó))禾n "Elbum"(美國(guó))的所有街道名稱(chēng)的 查詢(xún),被發(fā)送到數(shù)據(jù)庫(kù)。應(yīng)答可以是根據(jù)例如街道名稱(chēng)的下一類(lèi)別(該 實(shí)例中為類(lèi)別2)的參考項(xiàng)目的兩個(gè)列表,然后這兩個(gè)列表被加載到列 表存儲(chǔ)器13中。
系統(tǒng)以表示路徑al的當(dāng)前末端的節(jié)點(diǎn)S21繼續(xù)進(jìn)行處理,并且可 在為"Melbourne"(美國(guó))加載的相應(yīng)參考列表中搜索包含在輸入的 口述短語(yǔ)中的街道名稱(chēng)的項(xiàng)目。在該實(shí)例中,兩個(gè)街道名稱(chēng)可匹配口 述短語(yǔ)的項(xiàng)目"Harbor Street"。特別地,它們是"Harbor Street"(路徑 a1+2)和"Harberstreet"(路徑c1+2)。因此,路徑被分割并分別擴(kuò)展到 節(jié)點(diǎn)S23和S24。同樣的處理被應(yīng)用于城市"Elburn"(美國(guó)),在這種 情況下沒(méi)有與街道名稱(chēng)相應(yīng)的參考項(xiàng)目可以匹配輸入的口述短語(yǔ)的項(xiàng) 目,因?yàn)閷?duì)于與口述短語(yǔ)的項(xiàng)目("Harbor Street")在拼寫(xiě)和語(yǔ)音上相 似的該城市,可能沒(méi)有有效的街道名稱(chēng)(S25,路徑d,+2)。
使用獨(dú)立的列表可能是有利的,因?yàn)槠ヅ涞膮⒖柬?xiàng)目(此處是街 道名稱(chēng))可容易地與各個(gè)路徑(此處是城市名稱(chēng))相關(guān)聯(lián)。如果所有 加載的參考項(xiàng)目(例如,匹配城市的所有街道名稱(chēng))都包括在一個(gè)參 考項(xiàng)目列表中,則可能無(wú)法分配給與匹配城市相應(yīng)的路徑。
在這一點(diǎn)上,應(yīng)該注意,路徑a,+2表示從節(jié)點(diǎn)S20到節(jié)點(diǎn)S21和 到節(jié)點(diǎn)S23的路徑。因此,路徑c,+2表示從節(jié)點(diǎn)S20到節(jié)點(diǎn)S21和到 節(jié)點(diǎn)S24的路徑。
類(lèi)別2的搜索運(yùn)行的結(jié)果 足各今5 a1+25各《5 c+2
因?yàn)樵诓襟ES25,對(duì)于"Elbum (USA)",沒(méi)有參考項(xiàng)目可匹配口 述短語(yǔ)的項(xiàng)目,所以包括從節(jié)點(diǎn)S20到S22和從節(jié)點(diǎn)S22到S25的路 徑的路徑d,+2可由系統(tǒng)消除。因此,消除的路徑在下一類(lèi)別的隨后搜 索運(yùn)行中將不再被考慮。
進(jìn)一步,處理單元可任選地再次確定是否已經(jīng)有一個(gè)剩余路徑唯 一地識(shí)別目的地。如果是,則可開(kāi)始路線(xiàn)的計(jì)算。
處理單元可任選地確定是否有足夠的存儲(chǔ)容量來(lái)加載每個(gè)匹配的 街道名稱(chēng)的房屋號(hào)列表。如果存儲(chǔ)器容量在加載所有三個(gè)街道名稱(chēng)的 房屋號(hào)列表時(shí)被超出,則系統(tǒng)可請(qǐng)求用戶(hù)補(bǔ)充輸入。特別地,可以例 如請(qǐng)求用戶(hù)選擇兩個(gè)街道名稱(chēng)中的一個(gè)。如果有足夠的存儲(chǔ)器容量可 用,則可保持存儲(chǔ)兩個(gè)路徑a1+2 (S20到S23)和c1+2 (S20到S24)并 可卸載街道名稱(chēng)列表。然后,對(duì)"Melbourne"(美國(guó))中的街道"Harbor Street"和"Melbourne"(美國(guó))中的街道"Harberstreet"的所有房屋 號(hào)的查詢(xún),可被發(fā)送到數(shù)據(jù)庫(kù)。應(yīng)答可以是根據(jù)例如各個(gè)街道的房屋 號(hào)的下一類(lèi)別(該實(shí)例中為類(lèi)別3)的參考項(xiàng)目列表,這些參考項(xiàng)目列 表然后被加載到列表存儲(chǔ)器13中。
系統(tǒng)以表示路徑a^的當(dāng)前末端的節(jié)點(diǎn)S23繼續(xù)進(jìn)行處理,并可 在與"Harbor Street" (Melbourne,美國(guó))相對(duì)應(yīng)的加載參考列表中搜 索包含在輸入的口述短語(yǔ)中的房屋號(hào)的項(xiàng)目。在該實(shí)例中,兩個(gè)房屋 號(hào)可匹配口述短語(yǔ)的項(xiàng)目"fifteen"。特別地,這兩個(gè)房屋號(hào)是"fifteen" (路徑31+2+3)和"fifty"(路徑b,+2+3)。因此,路徑被分割并分別擴(kuò)展 到節(jié)點(diǎn)S26和S27。同樣的處理可在節(jié)點(diǎn)S24應(yīng)用于街if"Harberstreet" (Melbourne,美國(guó)),在這種情況下僅一個(gè)與房屋號(hào)相應(yīng)的參考項(xiàng)目 ("fifteen",路徑31+2+3,節(jié)點(diǎn)S28)可匹配輸入的口述短語(yǔ)的項(xiàng)目,因
為對(duì)于與口述短語(yǔ)的項(xiàng)目("fifteen")在拼寫(xiě)和語(yǔ)音上相似的該街道, 可能沒(méi)有其它有效的房屋號(hào)。
類(lèi)別3的搜索運(yùn)行的結(jié)果 路徑a1+2+3 路徑b1+2+3 £各《5 c1+2+3
進(jìn)一步,處理單元可任選地再次確定是否已經(jīng)有一個(gè)路徑唯一地 識(shí)別目的地。如果是,則可開(kāi)始計(jì)算路線(xiàn)。
處理單元可確定是否有足夠的存儲(chǔ)容量來(lái)加載每個(gè)匹配房屋號(hào)的 房屋號(hào)的后綴列表。如果存儲(chǔ)器容量在加載所有四個(gè)匹配的房屋號(hào)的 房屋號(hào)后綴列表時(shí)被超出,則系統(tǒng)可請(qǐng)求用戶(hù)補(bǔ)充輸入。特別地,可 以例如請(qǐng)求用戶(hù)選擇兩個(gè)街道名稱(chēng)中的一個(gè)和/或再次輸入房屋號(hào)。如 果有足夠的存儲(chǔ)器容量可利用,則可保持存儲(chǔ)三個(gè)路徑(a1+2+3, b1+2+3, c1+2+3)并可卸載房屋號(hào)的列表。然后,根據(jù)每個(gè)路徑的各個(gè)匹配街道 名稱(chēng)和它們相應(yīng)的匹配城市而對(duì)匹配房屋號(hào)"fifteen"和"fifty"的所 有后綴的查詢(xún),可被發(fā)送到數(shù)據(jù)庫(kù)。應(yīng)答可以是根據(jù)例如房屋號(hào)的后 綴的下一類(lèi)別(該實(shí)例中為類(lèi)別4)的參考項(xiàng)目列表,然后這些參考項(xiàng) 目列表被加載到列表存儲(chǔ)器13中。
關(guān)于類(lèi)別4,可用于房屋號(hào)"fifteen"或"fifty"的唯一后綴"A", 可以例如是"Melboume, USA"的"Harbor Street"中的房屋號(hào)"fifteen"。 包括從S20到S29的路徑的路徑31+2+3+4可被確定為在所有其它路徑被 消除后的唯一剩余路徑。特別地,可消除路徑b1+2+3+4,其包括從S20 到S30的路徑。進(jìn)一步,可消除路徑31+2+3+4,其包括從S20到S31的 路徑。
類(lèi)別4的搜索運(yùn)行的結(jié)果 路徑a1+2+3+4
處理單元確定剩余路徑a1+2+3+4唯一地識(shí)別導(dǎo)航系統(tǒng)的地址數(shù)據(jù)庫(kù)
條目。然后,啟動(dòng)應(yīng)用程序,在該實(shí)例中,其可以是對(duì)具有被識(shí)別的
地址的路線(xiàn)的計(jì)算。
總之,即使在沒(méi)有足夠清楚地口頭輸入口述短語(yǔ)的情況下,語(yǔ)音 識(shí)別系統(tǒng)仍能夠通過(guò)考慮關(guān)于輸入的口述項(xiàng)目的語(yǔ)音相似性的各種可 能性,來(lái)識(shí)別正確的數(shù)據(jù)庫(kù)條目,而無(wú)需倉(cāng)促地請(qǐng)求用戶(hù)補(bǔ)充輸入。
在圖4的實(shí)例中,語(yǔ)音識(shí)別系統(tǒng)是指識(shí)別唯一地識(shí)別數(shù)據(jù)庫(kù)的一 個(gè)條目的輸入口述短語(yǔ)。圖5示例性地示出根據(jù)本發(fā)明的示例性實(shí)施 例,語(yǔ)音識(shí)別系統(tǒng)也能夠識(shí)別唯一地識(shí)別多個(gè)數(shù)據(jù)庫(kù)條目的輸入口述 短語(yǔ)。
在圖5中,例如,假定的輸入口述短語(yǔ)是"Iwantto listen to Madman across the water from Elton John"。該實(shí)例應(yīng)示出數(shù)字音樂(lè)文件媒體庫(kù)的 實(shí)例。在該實(shí)例中,數(shù)據(jù)庫(kù)的類(lèi)別可能沒(méi)有分級(jí)順序。因此,在査詢(xún) 最高類(lèi)別時(shí),返回的參考項(xiàng)目列表可對(duì)應(yīng)于例如數(shù)字音樂(lè)文件的類(lèi)別 "title (標(biāo)題)"或"album (曲集)"。但其也可以?xún)H是類(lèi)別"artist (演 奏者)"。要加載的類(lèi)別的順序可以由語(yǔ)音識(shí)別系統(tǒng)定義或者可以由口 述短語(yǔ)的輸入項(xiàng)目的順序定義。在該實(shí)例中,類(lèi)別"artist"的參考項(xiàng) 目被確定為要首先加載。系統(tǒng)也可以根據(jù)例如最高類(lèi)別"artist"、第二 類(lèi)別"album"和作為第三類(lèi)別的"title",來(lái)隨后處理參考項(xiàng)目列表的 加載。
如已經(jīng)在圖4的先前實(shí)例中顯示出的那樣,語(yǔ)音識(shí)別追蹤多個(gè)可 能的路徑,在該實(shí)例中將是路徑ai和bp在該實(shí)例中,類(lèi)別"artist" 的匹配參考項(xiàng)目可以是"Elton John"和"Alton Elis"。進(jìn)一步,i亥系 統(tǒng)確定對(duì)于作為演奏者的參考項(xiàng)目"AltonEllis",不能獲得可匹配曲集 或歌曲"Madman across the water"的數(shù)據(jù)庫(kù)參考項(xiàng)目。因此,在匹配 處理的進(jìn)一步進(jìn)行中,可消除該特殊路徑(b,)。在已經(jīng)將參考項(xiàng)目 "Elton John"與口述短語(yǔ)的項(xiàng)目匹配后,在步驟S53 (路徑31+2)和步 驟S54 (路徑b!+2),系統(tǒng)必須確定匹配的參考項(xiàng)目"Madman across the water"是否已經(jīng)識(shí)別了數(shù)據(jù)庫(kù)的條目。由于"Madman across the water" 可能是具有多個(gè)標(biāo)題的曲集,也可能是單個(gè)歌曲標(biāo)題,所以在步驟S55 需要補(bǔ)充用戶(hù)輸入。在該步驟,用戶(hù)可澄清語(yǔ)音識(shí)別系統(tǒng)接下來(lái)必須 考慮哪個(gè)路徑。在該實(shí)例中,在步驟S55中請(qǐng)求補(bǔ)充輸入時(shí),用戶(hù)可 通過(guò)口頭輸入口述項(xiàng)目"album"而選擇曲集"Madman across the water"。 在步驟S57 (路徑aw),對(duì)應(yīng)于曲集"Madman across the water"的所
有歌曲標(biāo)題被確定為匹配的參考項(xiàng)目,并且可啟動(dòng)用于重放的應(yīng)用程 序并把匹配的參考項(xiàng)目(此處為曲集的所有歌曲)作為指定要重放的 歌曲的輸入?yún)?shù)(例如播放列表)。如果用戶(hù)在步驟S56僅決定歌曲,
則標(biāo)題"Madman across the water"被確定為唯一的匹配參考項(xiàng)目,并 且以這一首歌曲來(lái)啟動(dòng)應(yīng)用程序。
根據(jù)本發(fā)明的另一實(shí)施例,語(yǔ)音識(shí)別系統(tǒng)可取決于列表存儲(chǔ)器的 可利用容量,來(lái)首先加載至少一個(gè)類(lèi)別的每個(gè)的參考項(xiàng)目列表。例如, 可首先加載類(lèi)別"album"和"title"的參考項(xiàng)目??蛇M(jìn)一步假定加載 類(lèi)別"artist"的參考項(xiàng)目列表將超出類(lèi)別存儲(chǔ)器的容量。然后,系統(tǒng) 試圖將至少一個(gè)參考項(xiàng)目與口述短語(yǔ)的至少一個(gè)項(xiàng)目匹配。匹配的參 考項(xiàng)目可以例如是"Madman across the water"(歌曲)禾卩"Madman across the water"(曲集)。
在該第一次匹配處理之后,存儲(chǔ)匹配的參考項(xiàng)目并卸載列表,并 且如果先前不能加載所有類(lèi)別的所有列表,則加載剩余類(lèi)別的參考項(xiàng) 目列表,其在該實(shí)例中是類(lèi)別"artist"的參考項(xiàng)目列表。系統(tǒng)可再次 試圖將至少一個(gè)參考項(xiàng)目與口述短語(yǔ)的至少一個(gè)項(xiàng)目匹配。例如,根 據(jù)該實(shí)例,參考項(xiàng)目"Elton John"和"Alton Ellis"可被匹配。在已經(jīng) 匹配了參考項(xiàng)目后,系統(tǒng)可確定識(shí)別數(shù)據(jù)庫(kù)條目的最適當(dāng)和最可能的 串接。通過(guò)使用SQL,系統(tǒng)的請(qǐng)求可例如具有下面的格式SELECT* FROM database WHERE ((song='Madman across the water') OR (album=,Madman across the water')) AND ((artist=,Elton John') OR (artist=,Alton Ellis'))。
在該實(shí)例中,數(shù)字音樂(lè)文件數(shù)據(jù)庫(kù)的條目將被識(shí)別。由于通過(guò)邏 輯"AND"函數(shù)而產(chǎn)生的類(lèi)別"album"和"title"的組合將導(dǎo)致來(lái)自 演奏者"Elton John"的曲集"Madman across the water"的歌曲"Madman across the water",所以在實(shí)例中使用邏輯"OR"函數(shù)以獲得兩個(gè)選中 項(xiàng)(hit),即歌曲"Madman across the water"和具有其相應(yīng)歌曲的曲集 "Madman across the water"。
換句話(huà)說(shuō),在該實(shí)例中,同一類(lèi)別的匹配參考項(xiàng)目可以采用邏輯 "OR"函數(shù)組合,而且,不同類(lèi)別的匹配參考項(xiàng)目可也以采用邏輯"OR" 函數(shù)組合。
然而,在其它情形中,不同類(lèi)別的所有匹配參考項(xiàng)目可以通過(guò)邏 輯"AND"函數(shù)組合。這可以應(yīng)用于例如導(dǎo)航系統(tǒng)的地址的匹配參考 項(xiàng)目上。
該示例性査詢(xún)的返回結(jié)果可以是兩個(gè)選中項(xiàng),即來(lái)自"Elton John" 的"Madman across the water"(曲集)和來(lái)自"Elton John"的"Madman across the water"(歌曲)。由于可能沒(méi)有進(jìn)一步的用戶(hù)輸入,所以系統(tǒng) 可在步驟S55停止,并請(qǐng)求用戶(hù)補(bǔ)充輸入以決定是否所有歌曲都要選 擇或僅從具有相同名稱(chēng)的曲集中選出一首歌曲。
進(jìn)一步,在另一實(shí)施例中,為了示例性目的,假定用戶(hù)想聽(tīng)具有 先前確定的標(biāo)題的播放列表。語(yǔ)音識(shí)別系統(tǒng)可識(shí)別具有相應(yīng)的唯一數(shù) 據(jù)庫(kù)條目的播放列表的名稱(chēng),并以包括在播放列表中的各個(gè)歌曲來(lái)啟 動(dòng)應(yīng)用程序。
類(lèi)似的解決方案可例如適用于具有將在特定路線(xiàn)上選中的預(yù)定的 中途停留點(diǎn)的導(dǎo)航系統(tǒng)。這些中途停留點(diǎn)可例如對(duì)應(yīng)于具有特定路線(xiàn) 的名稱(chēng)的參考項(xiàng)目。這對(duì)例如具有幾個(gè)中途停留點(diǎn)目的地的觀光旅行 會(huì)是有幫助的。
圖6示出根據(jù)本發(fā)明的示例性實(shí)施例的語(yǔ)音識(shí)別處理的示例性流 程圖。首先,口述短語(yǔ)由用戶(hù)在歩驟S1輸入。然后,在步驟S2,具有 最高類(lèi)別的參考項(xiàng)目列表被加載到語(yǔ)音識(shí)別系統(tǒng)的列表存儲(chǔ)器13中。 數(shù)據(jù)庫(kù)可例如包括各個(gè)應(yīng)用程序的所有參考項(xiàng)目,諸如媒體庫(kù),或?qū)?航路線(xiàn)引導(dǎo)服務(wù)的目的地,或用于操作插件式計(jì)算機(jī)的命令,或用于 控制基于車(chē)輛的裝置的命令,或外部在線(xiàn)數(shù)據(jù)庫(kù)的條目。
作為下一步驟,在步驟S3,隨后將參考項(xiàng)目的加載列表的每個(gè)參 考項(xiàng)目與輸入口述短語(yǔ)的每個(gè)項(xiàng)目比較。如果加載的參考項(xiàng)目列表中 沒(méi)有參考項(xiàng)目可匹配輸入的口述短語(yǔ)的項(xiàng)目,則請(qǐng)求用戶(hù)再次輸入整 個(gè)口述短語(yǔ)(步驟S1)。然后,處理系統(tǒng)再次執(zhí)行步驟S3并決定是否 至少一個(gè)參考項(xiàng)目可匹配輸入口述短語(yǔ)的一個(gè)項(xiàng)目。只要沒(méi)有參考項(xiàng) 目可匹配口述短語(yǔ)的項(xiàng)目,則重復(fù)執(zhí)行步驟S1至S3,例如直到用戶(hù)中 斷該處理為止。
如果在步驟S3,至少一個(gè)參考項(xiàng)目可匹配輸入的口述短語(yǔ)的一個(gè) 項(xiàng)目,則系統(tǒng)繼續(xù)進(jìn)行步驟S4。如上所述,路徑是在當(dāng)前類(lèi)別之前已
經(jīng)被處理的各個(gè)類(lèi)別的匹配參考項(xiàng)目的串接。在步驟S4,可以決定路 徑是否由于沒(méi)有當(dāng)前類(lèi)別的合適參考項(xiàng)目而被排除。
這可適用于例如圖4中的路徑(11+2,在這種情況下不能找到口述短
語(yǔ)的項(xiàng)目"Harbor Street"的參考項(xiàng)目。因此,該路徑或其它路徑可能 是無(wú)用的,并可在循環(huán)中的步驟S5被消除,直到?jīng)]有另外的路徑可被 刪除。
系統(tǒng)繼續(xù)進(jìn)行步驟S6,在該步驟中可以決定是否存儲(chǔ)的路徑中的 一個(gè)己經(jīng)唯一地識(shí)別數(shù)據(jù)庫(kù)的條目。如果是這樣,則可以通過(guò)使用數(shù) 據(jù)庫(kù)的條目來(lái)啟動(dòng)應(yīng)用程序或?qū)卧M(jìn)行控制(步驟S14)。如果沒(méi)有 數(shù)據(jù)庫(kù)條目可由存儲(chǔ)的路徑中的一個(gè)唯一地識(shí)別,則系統(tǒng)繼續(xù)進(jìn)行步 驟S7以在歩驟S7為類(lèi)別n的每個(gè)路徑?jīng)Q定存儲(chǔ)容量是否足以加載下 一類(lèi)別n+l的各個(gè)參考項(xiàng)目列表。如果足夠,則系統(tǒng)繼續(xù)進(jìn)行步驟S9 并存儲(chǔ)串接的匹配參考項(xiàng)目的路徑。如果在步驟S7,存儲(chǔ)容量不足以 為類(lèi)別的每個(gè)路徑加載下一類(lèi)別n+l的各個(gè)參考項(xiàng)目列表,則請(qǐng)求用 戶(hù)補(bǔ)充輸入以在步驟S8鑒于語(yǔ)音和/或拼寫(xiě)相似性而澄清匹配的參考 項(xiàng)目,以減小存儲(chǔ)路徑的數(shù)目,從而相應(yīng)地減小在下一類(lèi)別n+l為相 應(yīng)的匹配參考項(xiàng)目加載參考項(xiàng)目列表所需的存儲(chǔ)器。
然后,系統(tǒng)可繼續(xù)進(jìn)行步驟S9以存儲(chǔ)串接的匹配參考項(xiàng)目的澄清 的和剩余的路徑。然后,可以在步驟S12決定是否參考項(xiàng)目的列表已 經(jīng)對(duì)應(yīng)于最低類(lèi)別。在已經(jīng)決定參考項(xiàng)目列表不對(duì)應(yīng)于最低類(lèi)別后, 在步驟S13卸載當(dāng)前參考項(xiàng)目列表并加載下一類(lèi)別的參考項(xiàng)目列表。 在該步驟,要加載的參考項(xiàng)目列表是與類(lèi)別n的路徑的匹配參考項(xiàng)目 相匹配的參考項(xiàng)目列表。
如果在步驟S12參考項(xiàng)目列表對(duì)應(yīng)于最低類(lèi)別,則系統(tǒng)在步驟Sll 決定是否剩余路徑中的一個(gè)已經(jīng)唯一地指定了數(shù)據(jù)庫(kù)條目。如果不是, 則請(qǐng)求用戶(hù)通過(guò)補(bǔ)充輸入從剩余路徑中識(shí)別正確的路徑。這可通過(guò)請(qǐng) 求澄清先前類(lèi)別的一個(gè)匹配參考項(xiàng)目或先前類(lèi)別之一的一個(gè)匹配參考 項(xiàng)目來(lái)實(shí)現(xiàn)。如果步驟S10的用戶(hù)交互是成功的,并且數(shù)據(jù)庫(kù)的條目 由存儲(chǔ)的匹配參考項(xiàng)目的串接唯一地識(shí)別,則可以使用數(shù)據(jù)庫(kù)的條目 來(lái)啟動(dòng)應(yīng)用程序或?qū)卧M(jìn)行控制(步驟S14)。
總結(jié)針對(duì)圖6概述的概念,語(yǔ)音識(shí)別系統(tǒng)在其存儲(chǔ)器中保持至少 一個(gè)路徑,并決定對(duì)于當(dāng)前類(lèi)別的每個(gè)匹配參考項(xiàng)目,下一類(lèi)別n+l 的各個(gè)參考項(xiàng)目列表是否可加載到列表存儲(chǔ)器中。如果列表存儲(chǔ)器的 容量會(huì)被超出,則可以請(qǐng)求用戶(hù)識(shí)別與先前類(lèi)別之一的匹配參考項(xiàng)目 相對(duì)應(yīng)的路徑,以便減小剩余路徑。這使得系統(tǒng)能夠應(yīng)付受限制的列 表存儲(chǔ)器容量,以適當(dāng)?shù)丶虞d剩余路徑的參考項(xiàng)目列表。
通過(guò)該實(shí)例,顯然的是,由于語(yǔ)音識(shí)別系統(tǒng)僅在必要時(shí)請(qǐng)求補(bǔ)充 用戶(hù)輸入,所以道路交通的安全性得到了增強(qiáng)。并且如果需要補(bǔ)充輸 入,則系統(tǒng)僅要求澄清口述短語(yǔ)的特定項(xiàng)目,而不是要求重復(fù)整個(gè)口 述短語(yǔ)。
語(yǔ)音識(shí)別系統(tǒng)的可替換實(shí)施例可以是根據(jù)圖7的實(shí)現(xiàn)方案。基本 上,其步驟類(lèi)似于圖6所示的步驟,但在執(zhí)行步驟S7之前,可以在步 驟S6a確定是否存儲(chǔ)的路徑中的一個(gè)已經(jīng)唯一地識(shí)別多個(gè)數(shù)據(jù)庫(kù)條目。 如果是這樣,則系統(tǒng)可推斷多個(gè)條目被用戶(hù)所期望以由應(yīng)用程序啟動(dòng), 如果例如僅曲集的演奏者和標(biāo)題被口頭輸入的話(huà)??商鎿Q地,在未定 義的情形中,可以在使用數(shù)據(jù)庫(kù)條目啟動(dòng)應(yīng)用程序或?qū)卧M(jìn)行控制 之前,請(qǐng)求用戶(hù)為其決定進(jìn)行補(bǔ)充輸入。根據(jù)圖5的實(shí)例,用戶(hù)可在 步驟S55在僅播放一首歌曲或播放與歌曲同名的整個(gè)曲集之間做出決定。
而且,語(yǔ)音識(shí)別系統(tǒng)也可通過(guò)關(guān)鍵詞來(lái)操作。用戶(hù)可在輸入具有 關(guān)于目的地或想要聽(tīng)的歌曲的信息的口述短語(yǔ)之前,輸入用于控制車(chē) 輛中的裝置或開(kāi)始導(dǎo)航系統(tǒng)的路線(xiàn)引導(dǎo)或選擇媒體庫(kù)的命令?;谒?br>
識(shí)別的關(guān)鍵詞,語(yǔ)音識(shí)別系統(tǒng)可在執(zhí)行圖6的實(shí)例的步驟之前加載類(lèi) 別的各個(gè)分級(jí)結(jié)構(gòu)。
關(guān)鍵詞也可用于識(shí)別用戶(hù)創(chuàng)建的歌曲的播放列表的名稱(chēng)。用戶(hù)可 以知道存儲(chǔ)在語(yǔ)音識(shí)別系統(tǒng)的數(shù)據(jù)庫(kù)中的關(guān)鍵詞,或者系統(tǒng)具有存儲(chǔ) 在數(shù)據(jù)庫(kù)中的各種關(guān)鍵詞以便不需要基于所存儲(chǔ)的關(guān)鍵詞對(duì)用戶(hù)進(jìn)行 訓(xùn)練。
另一示例性實(shí)施例涉及語(yǔ)音識(shí)別系統(tǒng)不能夠匹配最高類(lèi)別的參考 項(xiàng)目的情形。不是請(qǐng)求用戶(hù)重復(fù)輸入口述短語(yǔ)(Sl),而是可替換地, 系統(tǒng)取決于可利用的存儲(chǔ)器容量而試圖加載下一類(lèi)別的參考項(xiàng)目列 表,并可試圖將至少一個(gè)參考項(xiàng)目與口述短語(yǔ)的項(xiàng)目匹配。在其中一 個(gè)下一類(lèi)別中,系統(tǒng)可確定可被消除的不合適的路徑,以便將存儲(chǔ)器 占用率保持在最低水平。進(jìn)一步,在特定類(lèi)別,最高類(lèi)別的參考項(xiàng)目 可基于除第一類(lèi)別以外的類(lèi)別的匹配參考項(xiàng)目而獲得。例如,如果沒(méi) 有城市名稱(chēng)能夠匹配口述短語(yǔ)的項(xiàng)目,則系統(tǒng)可加載所有城市的所有 街道名稱(chēng)并可繼續(xù)進(jìn)行處理直到串接揭示出一定數(shù)目的路徑是無(wú)效的 為止,這些路徑因此可被消除?;诼窂降南?,可確定類(lèi)別(例如, 城市)的先前未被識(shí)別的項(xiàng)目。這可進(jìn)一步確保將補(bǔ)充輸入所需的用 戶(hù)交互保持在最低水平。
為了甚至向語(yǔ)音識(shí)別系統(tǒng)的用戶(hù)提供更高的靈活性,根據(jù)本發(fā)明 的另一實(shí)施例,輸入的口述短語(yǔ)的項(xiàng)目也可以以任意順序輸入。而且, 語(yǔ)音識(shí)別系統(tǒng)也能夠提供必須澄清的路徑的參考項(xiàng)目列表的可視輸 出,其中可視地輸出參考項(xiàng)目列表的順序可以基于它們匹配口述短語(yǔ) 的項(xiàng)目的可能性。系統(tǒng)也可適于聲學(xué)地請(qǐng)求用戶(hù)補(bǔ)充輸入預(yù)設(shè)的次數(shù), 直到可視地輸出列表,用戶(hù)通過(guò)操縱控制元件從其中進(jìn)行選擇。
本發(fā)明額外的實(shí)施例涉及進(jìn)一歩減少必要的用戶(hù)交互,這可例如 應(yīng)用于列表存儲(chǔ)器被超出的情況。該實(shí)施例更可以是存儲(chǔ)器管理的進(jìn) 一步增強(qiáng)。不是在確定列表存儲(chǔ)器的存儲(chǔ)容量不足以為類(lèi)別n的每個(gè)
路徑加載類(lèi)別n+l的各個(gè)參考項(xiàng)目列表之后請(qǐng)求用戶(hù)補(bǔ)充輸入,而是
語(yǔ)音識(shí)別系統(tǒng)可繼續(xù)處理具有最高可能性成為唯一地指定數(shù)據(jù)庫(kù)條目
的路徑的類(lèi)別n的路徑的匹配參考項(xiàng)目。參考項(xiàng)目列表可根據(jù)特定路 徑的匹配參考項(xiàng)目加載。在匹配處理之后,在同一類(lèi)別內(nèi),要選擇的 下一路徑是成為唯一地指定數(shù)據(jù)庫(kù)條目的路徑的可能性為下一較低的 可能性的路徑。再次加載根據(jù)當(dāng)前選擇的路徑的參考項(xiàng)目列表并重復(fù) 執(zhí)行匹配處理,直到所有路徑都已經(jīng)被處理為止。
示例性的口述短i吾可以是"Drive me to Elizabeth Street Berkeley "。 首先,語(yǔ)音識(shí)別系統(tǒng)可匹配參考項(xiàng)目(城市)"Berkeley"與口述短語(yǔ) 的項(xiàng)目,并使該匹配的參考項(xiàng)目與具有最高可能性成為唯一地識(shí)別數(shù) 據(jù)庫(kù)條目的路徑的路徑相關(guān)聯(lián)。該最高類(lèi)別的第二匹配參考項(xiàng)目可以 是New Jersey的城市"Elizabeth"。假定類(lèi)別存儲(chǔ)器將在加載兩個(gè)匹配 的城市名稱(chēng)的所有街道名稱(chēng)時(shí)被超出,則系統(tǒng)可首先基于最高可能性 來(lái)選擇參考項(xiàng)目"Berkeley"并加載"Berkeley"的所有街道名稱(chēng)。如
果例如加載的列表中沒(méi)有參考項(xiàng)目可匹配口述短語(yǔ)的項(xiàng)目"Elizabeth Street",則可卸載對(duì)應(yīng)于匹配參考項(xiàng)目(城市)"Berkeley"的街道名 稱(chēng)列表并消除該路徑。然后,可加載對(duì)應(yīng)于城市"Elizabeth"的街道名 稱(chēng)列表,并且例如參考項(xiàng)目"Berkeley Street"可匹配口述短語(yǔ)的項(xiàng)目。 然后,具有匹配參考項(xiàng)目"Elizabeth"禾口 "Berkeley Street"的路徑已 經(jīng)成為具有最高可能性成為唯一地識(shí)別數(shù)據(jù)庫(kù)條目的路徑的路徑,該 路徑可在下一類(lèi)別內(nèi)首先被考慮。對(duì)于每個(gè)隨后的類(lèi)別,所考慮的路 徑可以基于它們成為唯一地識(shí)別數(shù)據(jù)庫(kù)條目的路徑的可能性而被排 序。
其它示例性實(shí)施例涉及考慮用于識(shí)別輸入口述短語(yǔ)的操作參數(shù)的 語(yǔ)音識(shí)別系統(tǒng)。操作參數(shù)可以例如是語(yǔ)音識(shí)別系統(tǒng)的目前位置、當(dāng)前 或先前的目的地、或者當(dāng)前正在重放的或在播放列表中選擇的媒體庫(kù) 的媒體文件等當(dāng)中的至少一個(gè)。
在一個(gè)實(shí)施例中,操作參數(shù)可以用于確定唯一地指定數(shù)據(jù)庫(kù)條目 的最可能路徑,然而,在另一實(shí)施例中,操作參數(shù)可以用于確定比輸 入的口述短語(yǔ)的項(xiàng)目具有更高類(lèi)別的參考項(xiàng)目。后一個(gè)實(shí)施例在下面
的情況中會(huì)是有利的語(yǔ)音識(shí)別系統(tǒng)允許用戶(hù)僅輸入例如街道名稱(chēng)和 房屋號(hào),而不是說(shuō)出完整的目的地。
在示例性實(shí)施例中,用戶(hù)可輸入口述短語(yǔ)(例如駕駛目的地),但 語(yǔ)音識(shí)別系統(tǒng)匹配多個(gè)參考項(xiàng)目與例如口述短語(yǔ)的城市名稱(chēng)。通過(guò)使
用操作參數(shù),可以例如防止請(qǐng)求用戶(hù)進(jìn)行補(bǔ)充輸入。該系統(tǒng)可通過(guò)GPS 接收機(jī)來(lái)使用當(dāng)前車(chē)輛位置的操作參數(shù)以獲得當(dāng)前城市名稱(chēng)。隨后, 可以檢査基于GPS信息確定的當(dāng)前城市名稱(chēng)是否匹配口述短語(yǔ)中的潛 在城市名稱(chēng)之一。
因此,通過(guò)借助例如GPS信號(hào)澄清各個(gè)參考項(xiàng)目,可以找到最可 能的路徑。
在另一示例性實(shí)施例中,當(dāng)前操作參數(shù)可用于初始地確定對(duì)于正 確識(shí)別收入口述短語(yǔ)所必需的參考項(xiàng)目。
例如,出于示例性的目的,可以假定導(dǎo)航系統(tǒng)的用戶(hù)位于New York (城市),并且僅向語(yǔ)音識(shí)別系統(tǒng)輸入街道名稱(chēng)和房屋號(hào)作為輸入的口 述短語(yǔ)。在系統(tǒng)已經(jīng)檢測(cè)到輸入口述短語(yǔ)不是完整目的地輸入之后,
系統(tǒng)可首先確定對(duì)應(yīng)于最高類(lèi)別的口述短語(yǔ)的項(xiàng)目。然后,系統(tǒng)可借 助例如GPS信號(hào)解析出語(yǔ)音識(shí)別系統(tǒng)所處的城市名稱(chēng),在本實(shí)例中將
是"NewYork"。然后將該城市名稱(chēng)用作次高類(lèi)別的參考項(xiàng)目。語(yǔ)音識(shí) 別系統(tǒng)然后可試圖將對(duì)應(yīng)于操作參數(shù)"New York"的參考項(xiàng)目與輸入 口述短語(yǔ)的項(xiàng)目匹配。即,在該實(shí)例中,可以為基于GPS信息或者先 前或當(dāng)前導(dǎo)航目的地確定的類(lèi)別n+l的項(xiàng)目("NewYork"),加載類(lèi)別 n (街道名稱(chēng))的參考項(xiàng)目列表。
另一實(shí)例可對(duì)應(yīng)于音樂(lè)文件和例如僅包括歌曲標(biāo)題的口述短語(yǔ)。 然后系統(tǒng)可首先加載對(duì)應(yīng)于例如當(dāng)前被播放的歌曲的演奏者的參考項(xiàng) 目。
導(dǎo)航系統(tǒng)中的實(shí)現(xiàn)方案可以是有利的,因?yàn)槠湓试S僅輸入不完整 的目的地,然而,仍能保證目的地的口述短語(yǔ)的正確識(shí)別。為了向語(yǔ) 音識(shí)別系統(tǒng)的用戶(hù)提供更高的靈活性,這會(huì)是極大的益處。
本發(fā)明的另一實(shí)施例涉及使用硬件和軟件的本發(fā)明的上述各個(gè)實(shí) 施例的實(shí)現(xiàn)方案??梢哉J(rèn)識(shí)到,各個(gè)實(shí)施例和實(shí)例可以使用計(jì)算裝置 (處理器)來(lái)實(shí)現(xiàn)或執(zhí)行。計(jì)算裝置或處理器可以例如是通用處理器, 數(shù)字信號(hào)處理器(DSP),專(zhuān)用集成電路(ASIC),現(xiàn)場(chǎng)可編程門(mén)陣列 (FPGA)或其它可編程邏輯器件等。本發(fā)明的各個(gè)實(shí)施例也可以通過(guò) 這些裝置的組合來(lái)執(zhí)行或?qū)崿F(xiàn)。
進(jìn)一步,本發(fā)明的各個(gè)實(shí)施例也可通過(guò)軟件模塊來(lái)實(shí)現(xiàn),這些軟 件模塊由處理器執(zhí)行或直接在硬件中執(zhí)行。而且,軟件模塊和硬件實(shí) 現(xiàn)方案的組合也是可能的。軟件模塊可存儲(chǔ)在任何種類(lèi)的計(jì)算機(jī)可讀 存儲(chǔ)介質(zhì)上,例如存儲(chǔ)在RAM、 EPR0M、 EEPROM、閃存、寄存器、 硬盤(pán)、CD-ROM、 DVD等上。
進(jìn)一步,應(yīng)該注意,本發(fā)明的不同實(shí)施例的各個(gè)單獨(dú)的特征可獨(dú) 立地或以任意組合方式作為另一發(fā)明的主題。
本領(lǐng)域的技術(shù)人員可以理解的是,可在不偏離本發(fā)明寬泛描述的 精神或范圍的情況下對(duì)具體實(shí)施例中所示的本發(fā)明做出許多變化和/或 改進(jìn)。因此,這些實(shí)施例在所有方面都應(yīng)被認(rèn)為是說(shuō)明性的而非限制 性的。
權(quán)利要求
1.一種通過(guò)語(yǔ)音識(shí)別系統(tǒng)交互地識(shí)別口述短語(yǔ)的方法,包括以下步驟a)將類(lèi)別n的至少一個(gè)參考項(xiàng)目列表從數(shù)據(jù)庫(kù)加載到列表存儲(chǔ)器中,b)確定類(lèi)別n的至少一個(gè)參考項(xiàng)目是否可與包括多個(gè)項(xiàng)目的輸入的口述短語(yǔ)的其中一個(gè)項(xiàng)目匹配,c)通過(guò)類(lèi)別n的至少一個(gè)匹配參考項(xiàng)目來(lái)擴(kuò)展類(lèi)別n-1的至少一個(gè)路徑,以形成類(lèi)別n的至少一個(gè)路徑,d)確定所述列表存儲(chǔ)器的存儲(chǔ)容量是否足以為類(lèi)別n的每個(gè)路徑加載類(lèi)別n+1的各個(gè)參考項(xiàng)目列表,e)如果不足,則基于補(bǔ)充用戶(hù)輸入來(lái)消除類(lèi)別n的至少一個(gè)路徑,f)卸載類(lèi)別n的所述至少一個(gè)參考項(xiàng)目列表,以及g)為類(lèi)別n的每個(gè)路徑加載類(lèi)別n+1的參考項(xiàng)目列表。
2. 如權(quán)利要求l所述的方法,其中有N個(gè)不同的類(lèi)別,并且類(lèi)別 n的路徑含有間隔N到n中的不同類(lèi)別的匹配參考項(xiàng)目的串接。
3. 如權(quán)利要求1和2所述的方法,其中步驟e)包括基于補(bǔ)充用 戶(hù)輸入來(lái)消除類(lèi)別m的匹配參考項(xiàng)目和消除含有類(lèi)別m的被消除的匹 配參考項(xiàng)目的類(lèi)別n的所有路徑。
4. 如權(quán)利要求1至3中的任一項(xiàng)所述的方法,其中當(dāng)在步驟d) 中確定所述列表存儲(chǔ)器的存儲(chǔ)容量不足以為類(lèi)別n的每個(gè)路徑加載類(lèi) 別n+l的各個(gè)參考項(xiàng)目列表時(shí),基于補(bǔ)充用戶(hù)輸入來(lái)消除類(lèi)別m以外 的類(lèi)別的匹配參考項(xiàng)目,并且消除含有m以外的級(jí)別的被消除的匹配 參考項(xiàng)目的類(lèi)別n的所有路徑。
5. 如權(quán)利要求1至4中的任一項(xiàng)所述的方法,其中如果在步驟d) 中確定所述列表存儲(chǔ)器的存儲(chǔ)容量不足以為類(lèi)別n的每個(gè)路徑加載類(lèi) 別n+l的各個(gè)參考項(xiàng)目列表,則選擇具有最高可能性成為唯一地指定數(shù)據(jù)庫(kù)的條目的路徑的類(lèi)別n的相應(yīng)路徑,并且為類(lèi)別n的被選路徑 的匹配參考項(xiàng)目加載相應(yīng)的參考項(xiàng)目列表。
6. 如權(quán)利要求1至5中的任一項(xiàng)所述的方法,其中具有最高可能 性成為唯一地指定數(shù)據(jù)庫(kù)的條目的路徑的類(lèi)別n的相應(yīng)路徑,是基于 當(dāng)前車(chē)輛位置、當(dāng)前或先前目的地或媒體文件當(dāng)中的至少一個(gè)參數(shù)來(lái) 確定的。
7. 如權(quán)利要求1至6中的任一項(xiàng)所述的方法,包括如果對(duì)于類(lèi)別 n-l的一路徑,類(lèi)別n的參考項(xiàng)目列表中沒(méi)有相應(yīng)項(xiàng)目匹配所述口述短 語(yǔ)中的項(xiàng)目,則消除類(lèi)別n-l的所述路徑的步驟。
8. 如權(quán)利要求1至7中的任一項(xiàng)所述的方法,包括確定對(duì)于類(lèi)別 n的一個(gè)剩余路徑,是否僅有一個(gè)可能的項(xiàng)目存在于類(lèi)別n-l的路徑的 參考項(xiàng)目列表中,并使用由所述路徑指定的數(shù)據(jù)庫(kù)條目來(lái)啟動(dòng)應(yīng)用程 序的步驟。
9. 如權(quán)利要求1至8中的任一項(xiàng)所述的方法,包括如果已經(jīng)處理 完所有類(lèi)別N并且余下最低類(lèi)別的多于一個(gè)的路徑,則請(qǐng)求補(bǔ)充輸入 的步驟。
10. 如權(quán)利要求1至9中的任一項(xiàng)所述的方法,其中如果余下最低 類(lèi)別的一個(gè)路徑,則使用由所述路徑指定的數(shù)據(jù)庫(kù)條目來(lái)啟動(dòng)應(yīng)用程 序。
11. 如權(quán)利要求1至10中的任一項(xiàng)所述的方法,其中路徑指向 表示媒體庫(kù)條目的數(shù)據(jù)庫(kù)條目,或?qū)Ш铰肪€(xiàn)引導(dǎo)服務(wù)的目的地,或用 于操作插件式計(jì)算機(jī)的命令,或用于對(duì)裝置進(jìn)行控制的命令,或外部 在線(xiàn)數(shù)據(jù)庫(kù)的條目。
12. 如權(quán)利要求1至11中的任一項(xiàng)所述的方法,其中所述口述短語(yǔ)的項(xiàng)目可由所述語(yǔ)音識(shí)別系統(tǒng)以任意順序接收。
13. 如權(quán)利要求1至12中的任一項(xiàng)所述的方法,其中所述口述短語(yǔ)的項(xiàng)目必須由所述語(yǔ)音識(shí)別系統(tǒng)以預(yù)定順序接收。
14. 如權(quán)利要求1至13中的任一項(xiàng)所述的方法,其中如果所述口 述短語(yǔ)的項(xiàng)目和加載的列表的相應(yīng)參考項(xiàng)目具有等于或高于閾值標(biāo)準(zhǔn) 的語(yǔ)音相似性,則確定所述參考項(xiàng)目與所述項(xiàng)目匹配。
15. 如權(quán)利要求1至14中的任一項(xiàng)所述的方法,其中甚至是在所 述列表存儲(chǔ)器的容量足夠時(shí), 一旦出現(xiàn)匹配參考項(xiàng)目的語(yǔ)音相似性, 所述語(yǔ)音識(shí)別系統(tǒng)就中斷口述短語(yǔ)的輸入。
16. 如權(quán)利要求1至15中的任一項(xiàng)所述的方法,包括可視地或聲 學(xué)地輸出潛在地匹配所述口述短語(yǔ)的項(xiàng)目的參考項(xiàng)目列表以允許用戶(hù) 通過(guò)從所述列表中選擇哪個(gè)匹配的參考項(xiàng)目將被考慮以保持給定類(lèi)別 的路徑,來(lái)提供補(bǔ)充輸入的步驟。
17. 如權(quán)利要求16所述的方法,其中參考項(xiàng)目在輸出列表上的順 序基于它們與所述口述短語(yǔ)的項(xiàng)目匹配的可能性。
18. 如權(quán)利要求16所述的方法,其中在聲學(xué)地提供補(bǔ)充輸入以將 一個(gè)參考項(xiàng)目與所述口述短語(yǔ)的項(xiàng)目匹配的請(qǐng)求的數(shù)目超過(guò)預(yù)設(shè)數(shù)目 時(shí)輸出列表。
19. 如權(quán)利要求16所述的方法,其中輸出列表的條目可口頭地選 擇,并且如果不成功,則通過(guò)操縱控制元件來(lái)選擇。
20. 如權(quán)利要求1至19中的任一項(xiàng)所述的方法,其中在唯一地識(shí) 別數(shù)據(jù)庫(kù)條目后,路徑的匹配參考項(xiàng)目由所述系統(tǒng)可視地或聲學(xué)地確 認(rèn)。
21. —種交互語(yǔ)音識(shí)別系統(tǒng),包括 處理單元,用來(lái)將類(lèi)別n的至少一個(gè)參考項(xiàng)目列表從數(shù)據(jù)庫(kù)加載到列表存儲(chǔ)器中,其中所述處理單元可操作地確定類(lèi)別n的至少一個(gè)參考項(xiàng)目是否 可與包括多個(gè)項(xiàng)目的輸入的口述短語(yǔ)的其中一個(gè)項(xiàng)目匹配,并且a) 通過(guò)類(lèi)別n的至少一個(gè)匹配參考項(xiàng)目來(lái)擴(kuò)展類(lèi)別n-l的至少一 個(gè)路徑,以形成類(lèi)別n的至少一個(gè)路徑,b) 確定所述列表存儲(chǔ)器的存儲(chǔ)容量是否足以為類(lèi)別n的每個(gè)路徑 加載類(lèi)別n+l的各個(gè)參考項(xiàng)目列表,c) 如果所述處理單元已經(jīng)確定所述列表存儲(chǔ)器的存儲(chǔ)容量不足以 為類(lèi)別n的至少一個(gè)路徑加載類(lèi)別n+l的至少一個(gè)參考項(xiàng)目列表,則 基于補(bǔ)充用戶(hù)輸入來(lái)消除類(lèi)別n的至少一個(gè)路徑,d) 卸載類(lèi)別n的所述至少一個(gè)參考項(xiàng)目列表,并且e) 為類(lèi)別n的每個(gè)路徑加載類(lèi)別n+l的參考項(xiàng)目列表。
22. 如權(quán)利要求21所述的系統(tǒng),還包括適于執(zhí)行根據(jù)權(quán)利要求1 至20中的任一項(xiàng)的方法的步驟的裝置。
23. —種存儲(chǔ)指令的計(jì)算機(jī)可讀介質(zhì),當(dāng)所述指令被交互語(yǔ)音識(shí)別 系統(tǒng)的處理單元執(zhí)行時(shí),使所述交互語(yǔ)音識(shí)別系統(tǒng)通過(guò)以下操作來(lái)識(shí) 別口述短語(yǔ)a) 將類(lèi)別n的至少一個(gè)參考項(xiàng)目列表從數(shù)據(jù)庫(kù)加載到列表存儲(chǔ)器中,b) 確定類(lèi)別n的至少一個(gè)參考項(xiàng)目是否可與包括多個(gè)項(xiàng)目的輸入 的口述短語(yǔ)的其中一個(gè)項(xiàng)目匹配,c) 通過(guò)類(lèi)別n的至少一個(gè)匹配參考項(xiàng)目來(lái)擴(kuò)展類(lèi)別n-l的至少一 個(gè)路徑,以形成類(lèi)別n的至少一個(gè)路徑,d) 確定所述列表存儲(chǔ)器的存儲(chǔ)容量是否足以為類(lèi)別n的每個(gè)路徑 加載類(lèi)別n+l的各個(gè)參考項(xiàng)目列表,e) 如果不足,則基于補(bǔ)充用戶(hù)輸入來(lái)消除類(lèi)別n的至少一個(gè)路徑,f) 卸載類(lèi)別n的所述至少一個(gè)參考項(xiàng)目列表,以及g) 為類(lèi)別n的每個(gè)路徑加載類(lèi)別n+l的各個(gè)參考項(xiàng)目列表。
24. —種通過(guò)語(yǔ)音識(shí)別系統(tǒng)交互地識(shí)別口述短語(yǔ)的方法,包括以下步驟a) 取決于可用的列表存儲(chǔ)器容量,為至少一個(gè)類(lèi)別的每個(gè)將各個(gè)參考項(xiàng)目列表從數(shù)據(jù)庫(kù)加載到所述列表存儲(chǔ)器中,b) 確定至少一個(gè)參考項(xiàng)目是否可與包括多個(gè)項(xiàng)目的輸入的口述短 語(yǔ)的至少一個(gè)項(xiàng)目匹配,c) 存儲(chǔ)匹配的參考項(xiàng)目并卸載當(dāng)前的參考項(xiàng)目列表,d) 如果先前不能夠加載所有類(lèi)別的所有參考項(xiàng)目列表,則卸載當(dāng) 前的參考項(xiàng)目列表,并加載至少另一個(gè)類(lèi)別的每個(gè)的參考項(xiàng)目列表,并重復(fù)步驟b)和c),e) 加載與存儲(chǔ)的匹配參考項(xiàng)目相對(duì)應(yīng)的參考項(xiàng)目列表,并確定最 有可能識(shí)別數(shù)據(jù)庫(kù)條目的匹配參考項(xiàng)目的串接。
25. —種通過(guò)語(yǔ)音識(shí)別系統(tǒng)交互地識(shí)別口述短語(yǔ)的方法,包括以下 歩驟h) 接收包括類(lèi)別n或更低類(lèi)別的項(xiàng)目的輸入的口述短語(yǔ),i) 基于當(dāng)前車(chē)輛位置、當(dāng)前或先前目的地、或者被選擇重放或當(dāng) 前正被重放的媒體庫(kù)的媒體文件當(dāng)中的至少一個(gè)參數(shù),來(lái)加載類(lèi)別n 的參考項(xiàng)目列表,j)確定加載的列表中的類(lèi)別n的參考項(xiàng)目是否可與所述口述短語(yǔ) 的項(xiàng)目匹配。
26. 如權(quán)利要求25所述的方法,還包括確定輸入的口述短語(yǔ)中具 有最高類(lèi)別的參考項(xiàng)目的步驟,其中輸入的口述短語(yǔ)中的項(xiàng)目的最高 類(lèi)別被定義為類(lèi)別n。
27. 如權(quán)利要求25和26所述的方法,其中將所述至少一個(gè)參數(shù)與 數(shù)據(jù)庫(kù)中的類(lèi)別n+l的參考項(xiàng)目匹配,并且為類(lèi)別n+l的匹配參考項(xiàng) 目加載類(lèi)別n的參考項(xiàng)目列表。
28. 如權(quán)利要求25至27中的任一項(xiàng)所述的方法,還包括以下步驟:c) 通過(guò)類(lèi)別n的至少一個(gè)匹配參考項(xiàng)目擴(kuò)展類(lèi)別n-l的至少一個(gè) 路徑,以形成類(lèi)別n的至少一個(gè)路徑,d) 確定所述列表存儲(chǔ)器的存儲(chǔ)容量是否足以為類(lèi)別n的每個(gè)路徑 加載類(lèi)別n+l的各個(gè)參考項(xiàng)目列表,e) 如果不足,則基于補(bǔ)充用戶(hù)輸入來(lái)消除類(lèi)別n的至少一個(gè)路徑,f) 卸載類(lèi)別n的所述至少一個(gè)參考項(xiàng)目列表,以及g) 為類(lèi)別n的每個(gè)路徑加載類(lèi)別n+l的參考項(xiàng)目列表。
29. 如權(quán)利要求25至28中的任一項(xiàng)所述的方法,還包括根據(jù)權(quán)利 要求2至24中的任一項(xiàng)的方法的步驟。
全文摘要
本發(fā)明涉及用于識(shí)別輸入的口述短語(yǔ)的交互語(yǔ)音識(shí)別方法,交互語(yǔ)音識(shí)別系統(tǒng),以及計(jì)算機(jī)可讀介質(zhì)。為了改善系統(tǒng)的存儲(chǔ)器管理并增強(qiáng)例如道路交通的安全性,以及將用戶(hù)交互減少至最低水平,本發(fā)明提出通過(guò)在每次迭代中考慮加載參考項(xiàng)目列表的可用存儲(chǔ)器,來(lái)逐類(lèi)別地迭代地分析輸入的口述短語(yǔ)。更具體地,將特定類(lèi)別的參考項(xiàng)目迭代地與口述短語(yǔ)的項(xiàng)目進(jìn)行匹配,并且如果發(fā)現(xiàn)一個(gè)或多個(gè)匹配項(xiàng)目,則系統(tǒng)確定在下一迭代中為每個(gè)匹配參考項(xiàng)目加載參考項(xiàng)目列表的存儲(chǔ)器是否足夠。如果不夠,則向用戶(hù)請(qǐng)求補(bǔ)充輸入。
文檔編號(hào)G10L15/00GK101192406SQ20071019635
公開(kāi)日2008年6月4日 申請(qǐng)日期2007年11月30日 優(yōu)先權(quán)日2006年11月30日
發(fā)明者A·戈森貝格爾, L·柯尼希, R·扎姆 申請(qǐng)人:哈曼貝克自動(dòng)系統(tǒng)股份有限公司