基于語音配置文件的車載信息娛樂身份識別的制作方法
【專利摘要】本公開涉及一種基于語音配置文件的車載信息娛樂身份識別。一種車輛的計算平臺可與多個移動裝置進(jìn)行通信。所述計算平臺可執(zhí)行以下處理:識別與從用戶接收到的語音輸入匹配的語音配置文件,所述語音配置文件與車輛內(nèi)的多個移動裝置中的一個關(guān)聯(lián);使用所述語音配置文件對所述語音輸入執(zhí)行語音識別,以確定語音命令;在與所述語音配置文件關(guān)聯(lián)的移動裝置的環(huán)境中處理所述語音命令??苫趶倪B接到所述計算平臺的移動裝置中或者從連接到所述計算平臺的移動裝置的存儲器中檢索到的唯一裝置標(biāo)識符,從遠(yuǎn)程信息處理服務(wù)器中檢索所述語音配置文件。
【專利說明】
基于語音配置文件的車載信息娛樂身份識別
技術(shù)領(lǐng)域
[0001]本公開的多個方面涉及用于在車輛內(nèi)針對信息娛樂命令處理和其他功能識別語音命令的發(fā)言者的用戶語音配置文件的使用?!颈尘凹夹g(shù)】
[0002]車輛計算平臺通常配備有語音識別接口。這種接口允許駕駛員執(zhí)行與車輛的免提交互,這使得駕駛員不受束縛以集中最大的注意力在道路上。如果系統(tǒng)不能夠識別駕駛員的命令,則駕駛員可手動地通過按鈕或觸摸屏界面來更正對系統(tǒng)的輸入,這可能使得駕駛員分心且不能集中注意力在道路上。
[0003]語音識別通常是概率性成果,通過該概率性成果,將輸入的語音與用于匹配的語法進(jìn)行比較。高質(zhì)量的匹配可導(dǎo)致系統(tǒng)識別出所請求的服務(wù),而低質(zhì)量的匹配可能導(dǎo)致語音命令被拒絕或誤解。一般而言,車輛可使用至少最初被調(diào)整(tune)為提供總體上良好的結(jié)果的識別系統(tǒng),從而產(chǎn)生針對最大數(shù)量的新用戶的積極體驗。然而,如果用戶有口音或不尋常的特殊習(xí)慣,則匹配質(zhì)量可能會被降低。此外,由于輸入到車輛的語音命令可能相對不頻繁,因此對于車輛而言學(xué)習(xí)用戶的語音模式可能需要大量的時間。
[0004]第2010/0185445號美國專利申請總體上涉及一種用于語音命令的用戶引導(dǎo)式教學(xué)和修改以及將由會話式學(xué)習(xí)系統(tǒng)執(zhí)行的動作的機(jī)器、系統(tǒng)和方法。所述機(jī)器包括:用于向計算系統(tǒng)傳送從會話式學(xué)習(xí)系統(tǒng)接收到的數(shù)據(jù)和控制信號的系統(tǒng)總線、用于連接所述機(jī)器中的裝置和傳感器的車輛數(shù)據(jù)和控制總線、用于將車輛數(shù)據(jù)和控制總線連接到系統(tǒng)總線的橋接模塊、具有用于從用戶接收語音命令或輸入信號的單獨的用戶界面的連接到車輛數(shù)據(jù)和控制總線的機(jī)器子系統(tǒng)、用于存儲針對新的語音命令而學(xué)習(xí)的動作命令序列的連接到系統(tǒng)總線的存儲器,以及用于自動執(zhí)行在新語音命令被說出時學(xué)習(xí)的動作命令序列的連接到系統(tǒng)總線的處理單元。
【發(fā)明內(nèi)容】
[0005]在第一說明性實施例中,一種車輛包括:計算平臺,被配置為:識別與從用戶接收到的語音輸入匹配的語音配置文件,所述語音配置文件與車輛內(nèi)的多個移動裝置中的一個關(guān)聯(lián);使用所述語音配置文件對所述語音輸入執(zhí)行語音識別,以確定語音命令;在與所述語音配置文件關(guān)聯(lián)的移動裝置的環(huán)境中處理所述語音命令。
[0006]在第二說明性實施例中,一種計算機(jī)實現(xiàn)的方法包括:使用由車輛的計算平臺識別為與車輛內(nèi)的多個移動裝置中的一個關(guān)聯(lián)的語音配置文件來對從用戶接收到的語音輸入執(zhí)行語音識別,以確定語音命令;在與所述語音配置文件關(guān)聯(lián)的移動裝置的環(huán)境中處理所述語音命令。
[0007]在第三說明性實施例中,一種包含指令的非暫時性計算機(jī)可讀介質(zhì),其中,所述指令在被處理器執(zhí)行時被配置為使得所述處理器:將語音輸入的聲音生物特征與多個語音配置文件中的每一個配置文件的語音特征進(jìn)行匹配,其中,所述多個語音配置文件與連接到車輛的移動裝置關(guān)聯(lián);識別哪個語音配置文件與所述語音輸入的聲音生物特征最匹配;使用識別的語音配置文件對所述語音輸入執(zhí)行語音識別,以確定語音命令;在與識別的語音配置文件關(guān)聯(lián)的移動裝置的環(huán)境中處理所述語音命令。
[0008]根據(jù)本發(fā)明,提供一種包含指令的非暫時性計算機(jī)可讀介質(zhì),其中,所述指令在被車輛的處理器執(zhí)行時被配置為使得所述處理器:將語音輸入的聲音生物特征與多個語音配置文件中的每一個配置文件的語音特征進(jìn)行匹配,其中,所述多個語音配置文件與連接到車輛的移動裝置關(guān)聯(lián);識別哪個語音配置文件與所述語音輸入的聲音生物特征最匹配;使用識別的語音配置文件對所述語音輸入執(zhí)行語音識別,以確定語音命令;在與識別的語音配置文件關(guān)聯(lián)的移動裝置的環(huán)境中處理所述語音命令。
[0009]根據(jù)本發(fā)明的一個實施例,所述非暫時性計算機(jī)可讀介質(zhì)還包含以下指令,所述指令被配置為:使得處理器基于從連接到車輛的移動裝置中檢索到的唯一裝置標(biāo)識符,從遠(yuǎn)程信息處理服務(wù)器中檢索多個語音配置文件中的至少一個子集。
[0010]根據(jù)本發(fā)明的一個實施例,所述非暫時性計算機(jī)可讀介質(zhì)還包含以下指令,所述指令被配置為:使得處理器從連接到車輛的移動裝置的存儲器中檢索多個語音配置文件中的至少一個子集。
[0011]根據(jù)本發(fā)明的一個實施例,所述語音配置文件包括:(i)關(guān)于用戶的語音識別的音調(diào)信息;(i i)指示用戶的語音特征的聲音生物特征。
[0012]根據(jù)本發(fā)明的一個實施例,所述語音配置文件包括與所述語音配置文件關(guān)聯(lián)的移動裝置的唯一標(biāo)識符。
[0013]根據(jù)本發(fā)明的一個實施例,所述移動裝置的環(huán)境包括移動裝置的通訊簿,所述語音命令包括對移動裝置的通訊簿的條目的指引。
[0014]根據(jù)本發(fā)明的一個實施例,所述非暫時性計算機(jī)可讀介質(zhì)還包含以下指令,所述指令被配置為:使得處理器自動地連接到在由車輛的處理器保存的配對的裝置數(shù)據(jù)中所涉及到的移動裝置?!靖綀D說明】
[0015]圖1示出了被配置為向車輛提供遠(yuǎn)程信息處理服務(wù)的系統(tǒng)的示例性示意圖;
[0016]圖2A示出了具有多個配對的移動裝置的車輛的示例性部分;[〇〇17]圖2B示出了被存儲到遠(yuǎn)程信息處理服務(wù)器的語音配置文件的示例;
[0018]圖2C示出了利用語音配置文件來識別在語音輸入中的語音命令的語音接口的示例;
[0019]圖3示出了用于連接和同步車輛與移動裝置的示例性處理;
[0020]圖4示出了用于連接和同步移動裝置與遠(yuǎn)程信息處理服務(wù)器的示例性處理;
[0021]圖5示出了用于使用用戶的移動裝置來執(zhí)行語音訓(xùn)練的示例性處理;[〇〇22]圖6示出了用于在識別的移動裝置的環(huán)境中使用語音配置文件來執(zhí)行語音命令的示例性處理?!揪唧w實施方式】
[0023]根據(jù)需要,在此公開本發(fā)明的詳細(xì)實施例;然而,將要理解的是,所公開的實施例僅為本發(fā)明的示例,其中,本發(fā)明可以以各種替代形式來實現(xiàn)。附圖無需按比例繪制;一些特征可被夸大或最小化以示出特定組件的細(xì)節(jié)。因此,在此公開的具體結(jié)構(gòu)和功能細(xì)節(jié)不應(yīng)被解釋為具有限制性,而僅作為用于教導(dǎo)本領(lǐng)域技術(shù)人員以多種方式利用本發(fā)明的代表性基礎(chǔ)。
[0024]—些車輛允許多個電話到車輛的配對和連接。當(dāng)多個電話被連接且與電話功能相關(guān)的命令被說出時,車輛可嘗試在多個電話之一的情境下處理該命令。例如,車輛可利用最近配對的電話或者根據(jù)預(yù)先建立的電話的優(yōu)先級順序識別的最高優(yōu)先級電話。然而,由于命令可根據(jù)哪個電話情境被使用而被不同地解釋,所以如果不正確的電話被使用,則這樣的方法可能會有不期望的結(jié)果。例如,車輛內(nèi)的發(fā)言者可能說出“給媽媽打電話”,但是如果該命令在另一用戶裝置的環(huán)境中被處理,則車輛可能會給錯誤的“媽媽”打電話。這一問題的不完善的解決方案可能是在多個裝置被配對時針對車輛請求車輛乘員提供澄清。
[0025]在改進(jìn)的語音命令系統(tǒng)中,車輛可被連接到多個連接的電話,其中,每個電話與語音配置文件關(guān)聯(lián)。當(dāng)口述命令被車輛接收到時,車輛可使用語音配置文件來識別哪個連接的電話與發(fā)言者關(guān)聯(lián)。當(dāng)發(fā)言者的電話被識別時,車輛可使用發(fā)言者的電話以在適當(dāng)?shù)碾娫挼沫h(huán)境中處理該命令。繼續(xù)進(jìn)行給被命名為“媽媽”的聯(lián)系人打電話的示例,已經(jīng)識別發(fā)言者和相應(yīng)的移動裝置之后,車輛可在正確的電話的環(huán)境中處理該命令“給媽媽打電話”,并給正確的“媽媽”打電話。在此討論了語音命令系統(tǒng)的進(jìn)一步的多個方面。
[0026]圖1示出了被配置為向車輛102提供遠(yuǎn)程信息處理服務(wù)的系統(tǒng)100的示例性示意圖。車輛102可包括各種類型的乘員車輛,諸如,混合型多用途車輛(CUV)、運動型多用途車輛(SUV)、卡車、休旅車(RV)、船、飛機(jī)或用于運輸人或貨物的其他移動機(jī)器。作為一些非限制性可行方式,遠(yuǎn)程信息處理服務(wù)可包括導(dǎo)航、逐向?qū)Ш?turn-by-turn direct1n)、車輛健康報告、本地商業(yè)搜索、事故報告以及免提呼叫。在示例中,系統(tǒng)100可包括由密歇根州的迪爾伯恩市的福特汽車公司制造的SYNC系統(tǒng)。應(yīng)當(dāng)注意的是,示出的系統(tǒng)100僅為示例,并且可使用更多、更少和/或不同位置的元件。
[0027]計算平臺104可包括一個或更多個處理器106,所述一個或更多個處理器106連接到存儲器108和計算機(jī)可讀存儲介質(zhì)112兩者并被配置為執(zhí)行指令、命令或其他例程,以支持在此描述的處理。例如,計算平臺104可被配置為執(zhí)行車輛應(yīng)用110的指令,以提供諸如導(dǎo)航、事故報告、衛(wèi)星無線電解碼和免提呼叫的功能。可使用各種類型的計算機(jī)可讀存儲介質(zhì)112以非易失性的方式來保存這種指令和其他數(shù)據(jù)。計算機(jī)可讀介質(zhì)112(也被稱作處理器可讀介質(zhì)或存儲器)包括參與提供可由計算平臺104的處理器106讀取的指令或其他數(shù)據(jù)的任何非暫時性介質(zhì)(例如,有形介質(zhì))??蓮氖褂酶鞣N編程語言和/或技術(shù)創(chuàng)建的計算機(jī)程序編譯或解釋計算機(jī)可執(zhí)行指令,所述各種編程語言和/或技術(shù)包括但不限于以下項中單獨一個或它們的組合:Java、C、C++、C#、Objective C、Fortran、Pascal、Java Script、Python、Perl和PL/SQL。
[0028]計算平臺104可被設(shè)置有允許車輛乘員與計算平臺104進(jìn)行交互的各種功能。例如,計算平臺104可包括音頻輸入114和輔助音頻輸入118,音頻輸入114被配置為通過連接的麥克風(fēng)116從車輛乘員接收說出的命令,輔助音頻輸入118被配置為從連接的裝置接收音頻信號。輔助音頻輸入118可以是物理連接(諸如,電線或光纖線纜的物理連接)或者無線輸入(諸如,藍(lán)牙音頻連接的無線輸入)。在一些示例中,音頻輸入114可被配置為提供音頻處理能力(諸如,低電平信號的前置放大的處理能力)并將模擬輸入轉(zhuǎn)換成數(shù)字?jǐn)?shù)據(jù)以由處理器106進(jìn)行處理。
[0029]計算平臺104還可向具有音頻播放功能的音頻模塊122的輸入提供一個或更多個音頻輸出120。在其它示例中,計算平臺104可通過使用一個或更多個專用揚聲器(未示出)向乘員提供音頻輸出。音頻模塊122可包括輸入選擇器124,輸入選擇器124被配置為將音頻內(nèi)容從所選擇的音頻源126提供至音頻放大器128,以通過車輛揚聲器130或耳機(jī)(未示出)進(jìn)行播放。作為一些示例,音頻源126可包括解碼的調(diào)幅(AM)無線電信號或調(diào)頻(FM)無線電信號、以及來自致密盤(CD)或數(shù)字多功能盤(DVD)音頻播放的音頻信號。音頻源126還可包括從計算平臺104接收的音頻(諸如,由計算平臺104產(chǎn)生的音頻內(nèi)容、從連接到計算平臺104的通用串行總線(USB)子系統(tǒng)132的閃存驅(qū)動器解碼的音頻內(nèi)容以及通過計算平臺104從輔助音頻輸入118傳送的音頻內(nèi)容)。
[0030]計算平臺104可利用語音接口134來向計算平臺104提供免提接口。語音接口 134可支持根據(jù)與可用命令關(guān)聯(lián)的語法對經(jīng)由麥克風(fēng)116接收的音頻進(jìn)行語音識別以及用于經(jīng)由音頻模塊122輸出的語音提示生成。語音接口 134可利用使用語法的概率語音識別技術(shù),以與輸入的語音進(jìn)行比對。在很多情況下,語音接口 134可包括用于供語音識別功能使用的標(biāo)準(zhǔn)用戶配置文件音調(diào)(tuning),以允許語音識別可被調(diào)整為提供總體上良好的結(jié)果,從而針對最大數(shù)量的初始用戶產(chǎn)生積極的體驗。在一些情況下,當(dāng)音頻提示已經(jīng)準(zhǔn)備好由計算平臺104進(jìn)行呈現(xiàn)并且另一音頻源126被選擇用于播放時,系統(tǒng)可被配置為暫時靜音或以其他方式超馳由輸入選擇器124指定的音頻源。
[0031]計算平臺104還可從被配置為提供乘員與車輛102的交互的人機(jī)界面(HMI)控制件136接收輸入。例如,計算平臺104可與被配置為調(diào)用計算平臺104上的功能的一個或更多個按鈕或者其他HMI控制件(例如,方向盤的音頻按鈕、一鍵通按鈕、儀表板控制等)進(jìn)行接口連接。計算平臺104還可驅(qū)動或以其他方式與一個或更多個顯示器138進(jìn)行通信,一個或更多個顯示器138被配置為通過視頻控制器140向車輛乘員提供視覺輸出。在一些情況下,顯示器138可以是觸摸屏,觸摸屏被進(jìn)一步配置為經(jīng)由視頻控制器140接收用戶觸摸輸入,而在其他情況下,顯示器138可僅為不具備觸摸輸入能力的顯示器。
[0032]計算平臺104還可被配置為經(jīng)由一個或更多個車載網(wǎng)絡(luò)142與車輛102的其他組件進(jìn)行通信。作為一些示例,車載網(wǎng)絡(luò)142可包括車輛控制器局域網(wǎng)(CAN)、以太網(wǎng)以及面向媒體的系統(tǒng)傳輸(MOST)中的一個或更多個。車載網(wǎng)絡(luò)142可允許計算平臺104與其他車輛102系統(tǒng)(諸如,車載調(diào)制解調(diào)器144(其在一些配置中可能不存在)、被配置為提供當(dāng)前車輛102位置和航向信息的全球定位系統(tǒng)(GPS)模塊146以及被配置為與計算平臺104協(xié)作的各種車輛電子控制單元(E⑶)148)進(jìn)行通信。作為一些非限制性的可行方式,車輛ECU 148可包括:動力傳動系統(tǒng)控制模塊,被配置為提供發(fā)動機(jī)運行組件(例如,怠速控制組件、燃料傳送組件、排放控制組件等)的控制以及發(fā)動機(jī)運行組件的監(jiān)測(例如,發(fā)動機(jī)診斷代碼的狀態(tài));車身控制模塊,被配置為管理各種電力控制功能,諸如,外部照明、內(nèi)部照明、無鑰匙進(jìn)入、遠(yuǎn)程啟動以及接入點狀態(tài)驗證(例如,車輛102的引擎蓋、車門和/或行李廂的關(guān)閉狀態(tài));無線電收發(fā)器模塊,被配置為與遙控鑰匙或其他本地車輛102裝置進(jìn)行通信;氣候控制管理模塊,被配置為提供制熱和制冷系統(tǒng)組件(例如,壓縮機(jī)離合器和鼓風(fēng)機(jī)風(fēng)扇控制、溫度傳感器信息等)的控制和監(jiān)測。
[0033]如示出的,音頻模塊122和HMI控制件136可通過第一車載網(wǎng)絡(luò)142A與計算平臺104 進(jìn)行通信,并且車載調(diào)制解調(diào)器144、GPS模塊146和車輛ECU 148可通過第二車載網(wǎng)絡(luò)142B 與計算平臺104進(jìn)行通信。在其他示例中,計算平臺104可被連接到更多或更少的車載網(wǎng)絡(luò) 142。另外或可選地,一個或更多個HMI控制件136或其他組件可經(jīng)由與示出的不同的車載網(wǎng)絡(luò)142連接到計算平臺104,或者直接地連接到計算平臺104而不連接到車載網(wǎng)絡(luò)142。
[0034]計算平臺104還可被配置為與車輛乘員的移動裝置152進(jìn)行通信。移動裝置152可為任何不同類型的便攜式計算裝置,諸如,蜂窩電話、平板計算機(jī)、智能手表、膝上型計算機(jī)、便攜式音樂播放器或能夠與計算平臺104進(jìn)行通信的其他裝置。在很多示例中,計算平臺104可包括無線收發(fā)器150(例如,藍(lán)牙模塊、ZIGBEE收發(fā)器、W1-Fi收發(fā)器、IrDA收發(fā)器、 RFID收發(fā)器等),無線收發(fā)器150被配置為與移動裝置152的兼容的無線收發(fā)器154進(jìn)行通信。另外或可選地,計算平臺104可通過有線連接與移動裝置152進(jìn)行通信,諸如,經(jīng)由移動裝置152與USB子系統(tǒng)132之間的USB連接與移動裝置152進(jìn)行通信。在一些示例中,移動裝置 152可以是電池供電的,而在其他情況下,移動裝置152可經(jīng)由有線連接從車輛102接收其電力的至少一部分。
[0035]通信網(wǎng)絡(luò)156可向連接到通信網(wǎng)絡(luò)156的裝置提供諸如分組交換的網(wǎng)絡(luò)服務(wù)(例如,互聯(lián)網(wǎng)接入、VoIP通信服務(wù))的通信服務(wù)。通信網(wǎng)絡(luò)156的示例可包括蜂窩式電話網(wǎng)絡(luò)。 移動裝置152可經(jīng)由移動裝置152的裝置調(diào)制解調(diào)器158提供到通信網(wǎng)絡(luò)156的網(wǎng)絡(luò)連接能力。為了便于通過通信網(wǎng)絡(luò)156進(jìn)行通信,移動裝置152可與唯一裝置標(biāo)識符(例如,移動裝置號碼(MDN)、互聯(lián)網(wǎng)協(xié)議(IP)地址等)進(jìn)行關(guān)聯(lián),以識別移動裝置152通過通信網(wǎng)絡(luò)156進(jìn)行的通信。在一些情況下,計算平臺104可根據(jù)保存在存儲器介質(zhì)112中的配對的裝置數(shù)據(jù) 160來識別車輛102的乘員或具有連接到計算平臺104的許可的裝置。例如,配對的裝置數(shù)據(jù) 160可指示先前與車輛102的計算平臺104配對的移動裝置152的唯一裝置標(biāo)識符,使得計算平臺104可在沒有用戶干預(yù)的情況下自動地重新連接到在配對的裝置數(shù)據(jù)160中所涉及到的移動裝置152。
[0036]當(dāng)支持網(wǎng)絡(luò)連接能力的移動裝置152與計算平臺104配對時,移動裝置152可允許計算平臺104使用裝置調(diào)制解調(diào)器158的網(wǎng)絡(luò)連接能力,以通過通信網(wǎng)絡(luò)156與遠(yuǎn)程信息處理服務(wù)器162或其他遠(yuǎn)程計算裝置進(jìn)行通信。在一個示例中,計算平臺104可利用移動裝置 152的話上數(shù)據(jù)計劃或數(shù)據(jù)計劃在計算平臺104與通信網(wǎng)絡(luò)156之間傳送信息。另外或可選地,計算平臺104可利用車載調(diào)制解調(diào)器144在計算平臺104與通信網(wǎng)絡(luò)156之間傳送信息, 而不使用移動裝置152的通信設(shè)施。[〇〇37]與計算平臺104類似,移動裝置152可包括一個或更多個處理器164,一個或更多個處理器164被配置為執(zhí)行從移動裝置152的存儲器介質(zhì)168加載到移動裝置152的存儲器166 的移動應(yīng)用的指令。在一些示例中,移動應(yīng)用可被配置為經(jīng)由無線收發(fā)器154與計算平臺 104進(jìn)行通信,并且經(jīng)由裝置調(diào)制解調(diào)器158與遠(yuǎn)程信息處理服務(wù)器162或其他網(wǎng)絡(luò)服務(wù)進(jìn)行通信。計算平臺104還可包括裝置鏈路接口 172,以便于將移動應(yīng)用的功能通過語音接口 134集成到可用命令的語法中。裝置鏈路接口 172還可向移動應(yīng)用提供對車輛信息的訪問, 計算平臺104經(jīng)由車載網(wǎng)絡(luò)142可獲得所述車輛信息。裝置鏈路接口 172的示例可以是由密歇根州的迪爾伯恩市的福特汽車公司提供的SYNC系統(tǒng)的SYNC APPLINK組件。語音學(xué)習(xí)應(yīng)用 170可以是安裝到移動裝置152的移動應(yīng)用的示例,并且被配置為利用裝置鏈路接口 172與計算平臺104進(jìn)行接口連接。
[0038]針對特定用戶改進(jìn)語音識別率可能需要使用指示用戶的特定口音和其他聲音特性的語音配置文件174。語音學(xué)習(xí)應(yīng)用170可被配置為提示用戶說話的詞匯表176(例如,詞或短語),并使用接收到的語音輸入來對該用戶的數(shù)據(jù)進(jìn)行調(diào)整,以創(chuàng)建解釋用戶的口音和語音模式的語音配置文件174。語音配置文件174還可捕獲包括有關(guān)發(fā)言者的額外信息,其中,所述有關(guān)發(fā)言者的額外信息可被用于識別發(fā)言者,諸如,關(guān)于用戶的語音的音高、諧音、第一共振峰的平均頻率或其他可測量的聲音生物特征。語音配置文件174還可包括一個或更多個用戶標(biāo)識符(例如,移動裝置152的唯一裝置標(biāo)識符等)或以其他方式與一個或更多個用戶標(biāo)識符進(jìn)行關(guān)聯(lián)。在很多情況下,語音學(xué)習(xí)應(yīng)用170可被配置為可離開車輛102離線執(zhí)行(即,當(dāng)用戶當(dāng)前不在車輛內(nèi)或當(dāng)前沒有在駕駛車輛102時執(zhí)行),并且收集并保存語音配置文件174,以便當(dāng)用戶在車輛102中時進(jìn)行使用。作為一些其他可行方式,一些實施方式可允許用戶使用車輛102本身、使用車輛102內(nèi)的移動裝置152或者使用能夠?qū)⒄Z音配置文件174傳輸?shù)揭苿友b置152或其他車輛可訪問存儲器的另一計算裝置(例如,臺式計算機(jī))來訓(xùn)練語音配置文件174。
[0039]當(dāng)移動裝置152連接到車輛102時,語音配置文件174的信息可經(jīng)由裝置鏈路接口172與計算平臺104的語音接口 134進(jìn)行共享。作為一個可行方式,語音配置文件174可從移動裝置152被傳輸?shù)接嬎闫脚_104。作為另一可行方式,用戶的標(biāo)識符可從移動裝置152被傳輸?shù)接嬎闫脚_104,并且語音配置文件174可通過車輛102從遠(yuǎn)程信息處理服務(wù)器162中被檢索到。語音配置文件174的共享可允許車輛102的語音接口 134通過解釋用戶說話時的特殊性(其中,所述用戶的裝置與計算平臺104配對),來改進(jìn)車輛102的語音接口 134的語音識別結(jié)果。如果語音配置文件174對于用戶是不可用的,則語音接口 134可默認(rèn)使用標(biāo)準(zhǔn)的、通用的用戶配置文件。
[0040]圖2A示出了具有多個配對的移動裝置152的車輛102的示例性部分200A。如示出的,車輛102包括:移動裝置152-A,經(jīng)由語音學(xué)習(xí)應(yīng)用170-A與語音接口 134共享語音配置文件174-A;移動裝置152-B,經(jīng)由語音學(xué)習(xí)應(yīng)用170-B與語音接口 134共享語音配置文件174-B;移動裝置152-C,經(jīng)由語音學(xué)習(xí)應(yīng)用170-C與語音接口 134共享語音配置文件174-C;移動裝置152-D,經(jīng)由語音學(xué)習(xí)應(yīng)用170-D與語音接口 134共享語音配置文件174-D。在示出的示例中,多個移動裝置152-A至152-D(統(tǒng)稱為152)同時與計算平臺104配對。作為一個示例,這可能在共享車輛102的多個家庭成員進(jìn)入行程時(同時攜帶著他們各自的移動裝置152)發(fā)生。
[0041]每個移動裝置152-A至152-D還被示出為保存各自的詞匯表176-A至176-D,詞匯表176-A至176-D可被各自的語音學(xué)習(xí)應(yīng)用170-A至170-D用于訓(xùn)練各自的語音配置文件174-A至I74-D0
[0042]作為語音配置文件174的存儲的另一示例,圖2B示出了被存儲到遠(yuǎn)程信息處理服務(wù)器162的語音配置文件174的示例200B。在這樣的示例中,用戶的標(biāo)識符(例如,MDN、IP地址、MAC地址、用戶賬戶名等)可從移動裝置152被傳輸?shù)接嬎闫脚_104,并且語音配置文件174可通過車輛102使用該標(biāo)識符從遠(yuǎn)程信息處理服務(wù)器162中被檢索到。然而,應(yīng)當(dāng)注意的是,在很多示例中,語音配置文件174的存儲可通過移動裝置152來被執(zhí)行,而無需存儲到遠(yuǎn)程信息處理服務(wù)器162。
[0043]在不考慮從何處檢索語音配置文件174的情況下,車輛102可利用與連接的移動裝置152關(guān)聯(lián)的語音配置文件174來識別語音輸入202的發(fā)言者。例如,語音接口 134可識別語音輸入202的語音特征,諸如,音高、諧音、第一共振峰的平均頻率或其他可測量的聲音生物特征。使用語音配置文件174的信息,語音接口 134可將這些特征與語音配置文件174中的每一個的語音特征進(jìn)行匹配,其中,語音配置文件174與連接到計算平臺104的移動裝置相關(guān)聯(lián)?;谠撈ヅ洌Z音接口 134可識別哪個語音配置文件174與語音輸入202的語音特征最匹配。如在圖2C中示出的,已識別語音配置文件174之后,語音接口 134可相應(yīng)地識別移動裝置 152以用作用于執(zhí)行在語音輸入202中識別的語音命令204的環(huán)境。此外,已識別語音命令 204之后,語音接口 134可在與所識別的語音配置文件174關(guān)聯(lián)的移動裝置152的環(huán)境中處理語音命令204。
[0044]作為更為具體的示例,移動裝置152-D的用戶可說出包括語音命令204“給媽媽打電話”的語音輸入202。語音接口 134可相應(yīng)地接收該語音輸入202,并試圖使用語音配置文件174-A至174-D來識別該發(fā)言者。這些語音配置文件174-A至174-D可能先前已被指示為表示當(dāng)前在車輛102內(nèi)的用戶(例如,當(dāng)移動裝置152連接到計算平臺104時當(dāng)前在車輛102內(nèi)的用戶)。語音接口 134可將該語音特征與由語音配置文件174指定的語音特征進(jìn)行比較,并可確定發(fā)言者的語音與語音配置文件174-D最匹配。相應(yīng)地,車輛102可利用由語音配置文件174-D指定的音調(diào)對語音輸入202執(zhí)行語音識別,識別語音命令204“給媽媽打電話”,并在與語音配置文件174-D關(guān)聯(lián)的裝置(S卩,移動裝置152-D)的通訊簿的環(huán)境中處理語音命令 204“給媽媽打電話”。相應(yīng)地,系統(tǒng)100可給正確的“媽媽”的聯(lián)系人打電話。因此,語音配置文件174可被用于改進(jìn)語音識別質(zhì)量,并且還用于消除多個候選發(fā)言者兩者,以識別語音輸入202的發(fā)言者。[〇〇45]圖3示出了用于連接和同步車輛102與移動裝置152的示例性處理300。在示例中, 處理300可由與一個或更多個移動裝置152進(jìn)行通信的車輛102來執(zhí)行。例如,該通信可經(jīng)由無線收發(fā)器150和154或者經(jīng)由計算平臺104與移動裝置152之間的有線連接來執(zhí)行。
[0046]在操作302,車輛102連接到移動裝置152。例如,這可響應(yīng)于用戶攜帶移動裝置152 進(jìn)入車輛102而發(fā)生。計算平臺104可利用配對的裝置數(shù)據(jù)160來識別移動裝置152是否與先前與車輛102的計算平臺104配對的唯一裝置標(biāo)識符相關(guān)聯(lián),使得計算平臺104應(yīng)在無需用戶干預(yù)的情況下自動地重新連接到在配對的裝置數(shù)據(jù)160中所涉及到的移動裝置152。 [〇〇47]在操作304,車輛102確定語音學(xué)習(xí)應(yīng)用170是否被安裝到移動裝置152。在示例中, 當(dāng)配對時,移動裝置152可向車輛102提供指示移動裝置152當(dāng)前安裝的可供車輛102使用的移動應(yīng)用的信息。在另一示例中,車輛102可查詢移動裝置152,以確定語音學(xué)習(xí)應(yīng)用170是否被安裝。如果語音學(xué)習(xí)應(yīng)用170被安裝,則控制轉(zhuǎn)到操作308。否則,控制轉(zhuǎn)到操作306。 [〇〇48]在操作306,車輛102向移動裝置152推薦語音學(xué)習(xí)應(yīng)用170以進(jìn)行安裝。該推薦還可包括向移動裝置152的用戶指示語音學(xué)習(xí)應(yīng)用170可幫助允許車輛102更好地理解來自用戶的語音輸入的信息。在一些示例中,車輛可在推薦語音學(xué)習(xí)應(yīng)用170之前等待直到用戶遇到由語音接口 134使用標(biāo)準(zhǔn)用戶配置文件而引起的至少閾值數(shù)量的識別錯誤為止,以防用戶的語音模式可接受地與標(biāo)準(zhǔn)配置文件匹配。在操作306之后,處理300結(jié)束。[〇〇49]在操作308,車輛102確定語音學(xué)習(xí)應(yīng)用170是否具有針對所連接的移動裝置152的用戶的更新的語音配置文件174。在示例中,計算平臺104可向移動裝置152查詢由移動裝置152保存的語音配置文件174的唯一標(biāo)識符和最新修改日期。當(dāng)移動裝置152包括未被緩存到車輛102(例如,未被緩存到存儲器112)的新的或更新的語音配置文件174時,控制轉(zhuǎn)到操作310。否則,控制轉(zhuǎn)到操作312。
[0050]在操作310,車輛102從移動裝置152中檢索到指示的語音配置文件174。在示例中,計算平臺104可請求語音配置文件174被傳輸?shù)接嬎闫脚_104(例如,被保存在存儲器112中)。應(yīng)注意的是,在其他示例中,計算平臺104可檢索任何可用的語音配置文件174,而不考慮日期或用戶。在另一示例中,車輛102可從遠(yuǎn)程信息處理服務(wù)器162中檢索語音配置文件174(例如,基于從連接的移動裝置152檢索到的唯一的裝置標(biāo)識符,從遠(yuǎn)程信息處理服務(wù)器162中檢索語音配置文件174)。
[0051]在操作312,車輛102確定更新的車輛配置文件的詞匯表176信息在車輛102上是否可用于上傳到移動裝置152。例如,可能存在駐留在計算平臺104上(例如,在存儲器112中)的新的詞匯表176,其中,所述新的詞匯表176還不在移動裝置152上(例如,在存儲器168中)。在示例中,該新的詞匯表176可包括:與安裝到計算平臺104的新的或更新的軟件模塊或應(yīng)用相關(guān)的詞匯表176的詞條,其中,所述新的或更新的軟件模塊或應(yīng)用識別了推薦的詞匯表176。當(dāng)詞匯表176特定訓(xùn)練通過用戶與語音學(xué)習(xí)應(yīng)用170進(jìn)行交互來被執(zhí)行時,該詞匯表176對于更新用戶的語音配置文件174可能是有用的。如果新的詞匯表176可用于上傳,則控制轉(zhuǎn)到操作314,在操作314,車輛102將新的詞匯表176信息上傳到移動裝置152。在操作314之后,或者,在操作312之后,如果沒有詞匯表176將要被更新,則處理300結(jié)束。
[0052]圖4示出了用于連接和同步移動裝置152與遠(yuǎn)程信息處理服務(wù)器162的示例性處理400。在示例中,處理400可由執(zhí)行語音學(xué)習(xí)應(yīng)用170的移動裝置152來執(zhí)行。
[0053]在操作402,移動裝置152連接到語音詞匯表176數(shù)據(jù)的源。在示例中,移動裝置152可通過通信網(wǎng)絡(luò)156連接到遠(yuǎn)程信息處理服務(wù)器162。例如,對車輛102的軟件配置的更新可導(dǎo)致在追蹤車輛的軟件狀態(tài)的遠(yuǎn)程信息處理服務(wù)器162上的車輛配置文件的更新。因此,移動裝置152即使不在車輛102的連接范圍內(nèi)時也可利用遠(yuǎn)程信息處理服務(wù)器162進(jìn)行連接。
[0054]在操作404,移動裝置152確定新的應(yīng)用詞匯表176是否可用。例如,移動裝置152可識別(或者可從連接的遠(yuǎn)程信息處理服務(wù)器162或車輛102接收識別)對車輛102的配置文件的任何更新是否可包括可能需要訓(xùn)練的指示的其它的詞匯表176。如果新的詞匯表176是可用的,則控制轉(zhuǎn)到操作406以檢索新的詞匯表176。在操作406之后,或者,在操作404之后,如果沒有新的詞匯表176將要被更新,則控制轉(zhuǎn)到操作408。
[0055]在操作408,移動裝置152確定語音配置文件174是否應(yīng)該被提供以更新遠(yuǎn)程信息處理服務(wù)器162。例如,移動裝置152可向遠(yuǎn)程信息處理服務(wù)器162請求最新修改的語音配置文件174的時間戳,并且如果移動裝置152正在存儲多個更新的語音配置文件174,則移動裝置152可確定更新遠(yuǎn)程信息處理服務(wù)器162。在其他情況下,移動裝置152可一直更新遠(yuǎn)程信息處理服務(wù)器162,或者可周期性地(例如,每天、每周等)更新遠(yuǎn)程信息處理服務(wù)器162。如果移動裝置152確定更新語音配置文件174,則控制轉(zhuǎn)到操作410以向遠(yuǎn)程信息處理服務(wù)器162發(fā)送語音配置文件174。在操作410之后,或者,在操作408之后,如果沒有語音配置文件174將要被更新,則處理400結(jié)束。
[0056]圖5示出了用于使用用戶的移動裝置152來執(zhí)行語音訓(xùn)練的示例性處理500。在示例中,處理500可由執(zhí)行語音學(xué)習(xí)應(yīng)用170的移動裝置152來執(zhí)行。
[0057] 在操作502,移動裝置152啟動語音學(xué)習(xí)應(yīng)用170。例如,用戶可從移動裝置152的顯示器或其他HMI來選擇語音學(xué)習(xí)應(yīng)用170。[〇〇58]在操作504,移動裝置152確定語音訓(xùn)練是否應(yīng)該被執(zhí)行。在示例中,用戶可選擇執(zhí)行詞匯表176的訓(xùn)練,或者該訓(xùn)練可基于在移動裝置152上的尚未被用戶用來進(jìn)行訓(xùn)練的詞匯表176來針對用戶指定訓(xùn)練。在另一示例中,可使用針對最近使用的車輛功能(例如,電話服務(wù)、導(dǎo)航服務(wù)等)的詞匯表176來針對用戶指定訓(xùn)練,或者,可使用針對具有由語音接口 134而引起的至少閾值數(shù)量的識別錯誤的車輛102的功能(例如,這種錯誤由車輛102來識另IJ,并且這種錯誤的指示被傳送到移動裝置152)的詞匯表176來針對用戶指定訓(xùn)練。在又一示例中,移動裝置152可選擇訓(xùn)練所需要的、基礎(chǔ)的或者通用的詞匯表176,并且一旦基礎(chǔ)訓(xùn)練被執(zhí)行,則隨后可允許其他的訓(xùn)練。
[0059]在操作506,移動裝置152使用詞匯表176來訓(xùn)練用戶的語音配置文件174。例如,移動裝置152可針對用戶指定說出由詞匯表176所指示的特定的詞或短語,并且移動裝置152 可接收用戶響應(yīng)并相應(yīng)地更新語音配置文件174。
[0060]在操作508,移動裝置152存儲語音配置文件174。在示例中,移動裝置152可將語音配置文件174存儲到移動裝置152的存儲器168。另外或可選地,移動裝置152可將語音配置文件174發(fā)送到遠(yuǎn)程信息處理服務(wù)器162進(jìn)行存儲。在操作508之后,處理500結(jié)束。[〇〇61]圖6示出了用于在識別的移動裝置152的環(huán)境中使用語音配置文件174來執(zhí)行被包括在語音輸入202中的語音命令204的示例性處理。在示例中,處理600可由與被檢測為存在于車輛102內(nèi)的移動裝置152進(jìn)行通信的車輛102來執(zhí)行。
[0062]在操作602,車輛102連接到車輛102內(nèi)的移動裝置152。在示例中,計算平臺104可在無需用戶干預(yù)的情況下自動地連接到在配對的裝置數(shù)據(jù)106中所涉及到的移動裝置152。
[0063]在操作604,車輛102識別連接的移動裝置152的語音配置文件174。當(dāng)移動裝置152 被連接到車輛102時,語音配置文件174的信息可經(jīng)由裝置鏈路接口 172與計算平臺104的語音接口 134進(jìn)行共享。作為一個可行方式,語音配置文件174可從移動裝置152被傳輸?shù)接嬎闫脚_104。作為另一可行方式,用戶的標(biāo)識符可從移動裝置152被傳輸?shù)接嬎闫脚_104,并且語音配置文件174可通過車輛102從遠(yuǎn)程信息處理服務(wù)器162中被檢索到。作為另一可行方式,連接的移動裝置152的一個或更多個語音配置文件174可能先前已經(jīng)通過計算平臺104 被緩存,并且可通過依據(jù)移動裝置152的標(biāo)識符在計算平臺104的存儲器112中查詢語音配置文件174而被識別為可用于基于移動裝置152的出現(xiàn)的使用。[〇〇64]在操作606,車輛102接收語音輸入202。在示例中,移動裝置152的用戶可說出語音輸入202,并且計算平臺104的語音接口 134可接收經(jīng)由麥克風(fēng)116接收的口語音頻的電信號。[〇〇65]在操作608,車輛102識別語音輸入202的發(fā)言者。在示例中,語音接口 134可識別語音輸入202的語音特征,諸如,音高、諧音、第一共振峰的平均頻率或其他可測量的聲音生物特征。使用語音配置文件174的信息,語音接口 134可將這些特性與語音配置文件174中的每一個的語音特征進(jìn)行匹配,其中,所述語音配置文件174與連接到計算平臺104的移動裝置 152關(guān)聯(lián)。基于該匹配,語音接口 134可識別哪個語音配置文件174與語音輸入202的語音特征最匹配。
[0066]在操作610,車輛102識別所識別的發(fā)言者的移動裝置152。例如,移動裝置152可被識別為與匹配的語音配置文件174具有的相同的唯一標(biāo)識符關(guān)聯(lián)的裝置。已經(jīng)識別語音配置文件174之后,語音接口 134可相應(yīng)地識別移動裝置152以用作用于執(zhí)行語音輸入202中的語音命令204的環(huán)境。
[0067]在操作612,車輛102使用識別的語音配置文件174對語音輸入202執(zhí)行語音識別。在示例中,語音接口 134可使用根據(jù)識別的語音配置文件174的語音特征和其他信息而改變的語音識別技術(shù)來識別包括在語音輸入202中的語音命令204。
[0068]在操作614,車輛102在識別的移動裝置152的環(huán)境中處理語音命令204。例如,語音接口 134可在識別的移動裝置152的通訊簿或其他數(shù)據(jù)或設(shè)置的環(huán)境中處理語音命令204。在操作614之后,處理600結(jié)束。
[0069]雖然以上描述了示例性實施例,但這些實施例并不意在描述本發(fā)明的所有可能形式。更確切地說,說明書中所使用的詞語是描述性詞語而非限制性詞語,并且應(yīng)理解的是,可在不脫離本發(fā)明的精神和范圍的情況下做出各種改變。此外,可將各種實現(xiàn)的實施例的特征進(jìn)行組合以形成本發(fā)明的進(jìn)一步的實施例。
【主權(quán)項】
1.一種車輛,包括: 計算平臺,被配置為: 識別與從用戶接收到的語音輸入匹配的語音配置文件,所述語音配置文件與車輛內(nèi)的多個移動裝置中的一個關(guān)聯(lián); 使用所述語音配置文件對所述語音輸入執(zhí)行語音識別,以確定語音命令; 在與所述語音配置文件關(guān)聯(lián)的移動裝置的環(huán)境中處理所述語音命令。2.如權(quán)利要求1所述的車輛,其中,所述語音配置文件包括:(i)關(guān)于用戶的語音識別的音調(diào)信息;(ii)指示用戶的語音特征的聲音生物特征。3.如權(quán)利要求1所述的車輛,其中,所述語音配置文件包括與所述語音配置文件關(guān)聯(lián)的移動裝置的唯一標(biāo)識符。4.如權(quán)利要求1所述的車輛,其中,所述移動裝置的環(huán)境包括移動裝置的通訊簿,所述語音命令包括對移動裝置的通訊簿的條目的指引。5.如權(quán)利要求1所述的車輛,其中,所述計算平臺還被配置為: 將所述語音輸入的聲音生物特征與語音配置文件中的每一個的語音特征進(jìn)行匹配,其中,所述多個語音配置文件與連接到所述計算平臺的移動裝置關(guān)聯(lián); 識別哪個語音配置文件與所述語音輸入的聲音生物特征最匹配。6.如權(quán)利要求5所述的車輛,其中,所述計算平臺還被配置為以下操作中的至少一個: 基于從連接到所述計算平臺的移動裝置中檢索到的唯一裝置標(biāo)識符,從遠(yuǎn)程信息處理服務(wù)器中檢索所述語音配置文件中的至少一個子集; 從連接到所述計算平臺的移動裝置的存儲器中檢索所述語音配置文件的至少一個子集。7.如權(quán)利要求1所述的車輛,其中,所述計算平臺還被配置為:自動地連接到在由所述計算平臺保存的配對的裝置數(shù)據(jù)中所涉及到的移動裝置。8.一種計算機(jī)實現(xiàn)的方法,包括: 使用由車輛的計算平臺識別為與車輛內(nèi)的多個移動裝置中的一個關(guān)聯(lián)的語音配置文件來對從用戶接收到的語音輸入執(zhí)行語音識別,以確定語音命令; 在與所述語音配置文件關(guān)聯(lián)的移動裝置的環(huán)境中處理所述語音命令。9.如權(quán)利要求8所述的方法,其中,所述語音配置文件包括:(i)關(guān)于用戶的語音識別的音調(diào)信息;(ii)指示用戶的語音特征的聲音生物特征。10.如權(quán)利要求8所述的方法,其中,所述語音配置文件包括與所述語音配置文件關(guān)聯(lián)的移動裝置的唯一標(biāo)識符。11.如權(quán)利要求8所述的方法,其中,所述移動裝置的環(huán)境包括移動裝置的通訊簿,所述語音命令包括對移動裝置的通訊簿的條目的指引。12.如權(quán)利要求8所述的方法,還包括: 將語音輸入的聲音生物特征與語音配置文件中的每一個的語音特征進(jìn)行匹配,其中,所述語音配置文件與連接到所述計算平臺的移動裝置關(guān)聯(lián); 識別哪個語音配置文件與所述語音輸入的聲音生物特征最匹配。13.如權(quán)利要求8所述的方法,還包括:自動地連接到在由所述計算平臺保存的配對的裝置數(shù)據(jù)中所涉及到的移動裝置。
【文檔編號】G10L15/06GK105957522SQ201610133140
【公開日】2016年9月21日
【申請日】2016年3月9日
【發(fā)明人】布雷特·斯托特勒邁爾
【申請人】福特全球技術(shù)公司