戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備; 網(wǎng)絡(luò)接入設(shè)備將用戶語音指令信息和用戶標(biāo)識發(fā)送給語音識別服務(wù)器; 語音識別服務(wù)器查詢與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫; 語音識別服務(wù)器在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中,提取與用戶語音指令信息相對應(yīng)的控制指令,將控制指令發(fā)送給網(wǎng)絡(luò)接入設(shè)備,以便網(wǎng)絡(luò)接入設(shè)備根據(jù)控制指令進(jìn)行相應(yīng)操作。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于, 語音識別服務(wù)器在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中,提取與用戶語音指令信息相對應(yīng)的控制指令的步驟包括: 語音識別服務(wù)器判斷在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中,是否存在與用戶語音指令信息相對應(yīng)的控制指令; 若在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中存在與用戶語音指令信息相對應(yīng)的控制指令,則執(zhí)行提取與用戶語音指令信息相對應(yīng)的控制指令的步驟。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于, 若在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中不存在與用戶語音指令信息相對應(yīng)的控制指令,則通過通用語料庫對用戶語音指令信息進(jìn)行語音識別以得到控制指令,并將控制指令與相對應(yīng)的用戶語音指令信息存入到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中。
4.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的方法,其特征在于, 語音識別服務(wù)器查詢與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫的步驟包括: 語音識別服務(wù)器判斷是否查詢到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫; 若查詢到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫,則執(zhí)行語音識別服務(wù)器在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中,提取與用戶語音指令信息相對應(yīng)的控制指令的步驟。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于, 若沒有查詢到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫,則語音識別服務(wù)器建立與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫,對用戶語音指令信息進(jìn)行語音識別以得到控制指令,并將控制指令與相對應(yīng)的用戶語音指令信息存入到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中,然后執(zhí)行將控制指令發(fā)送給網(wǎng)絡(luò)接入設(shè)備的步驟。
6.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的方法,其特征在于, 聲紋識別服務(wù)器對用戶語音指令信息進(jìn)行聲紋識別,并將與識別出的聲紋相對應(yīng)的用戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備的步驟包括: 聲紋識別服務(wù)器對用戶語音指令信息進(jìn)行聲紋識別,以得到聲紋信息; 判斷在聲紋庫中是否存在所述聲紋信息; 若在聲紋庫中存在所述聲紋信息,則執(zhí)行將與識別出的聲紋相對應(yīng)的用戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備的步驟。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于, 若在聲紋庫中不存在所述聲紋信息,則將所述聲紋信息存儲到聲紋庫中,并為所述聲紋信息分配相應(yīng)的用戶標(biāo)識,然后將分配的用戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備。
8.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的方法,其特征在于, 移動終端為遙控器; 網(wǎng)絡(luò)接入終端為機(jī)頂盒。
9.一種語音控制系統(tǒng),其特征在于,包括移動終端、網(wǎng)絡(luò)接入終端、聲紋識別服務(wù)器和語音識別服務(wù)器,其中: 移動終端,用于采集用戶語音指令信息,將采集到的用戶語音指令信息發(fā)送給網(wǎng)絡(luò)接入終; 網(wǎng)絡(luò)接入終端,用于在接收到移動終端發(fā)送的用戶語音指令信息時,將用戶語音指令信息發(fā)送給聲紋識別服務(wù)器;在接收到聲紋識別服務(wù)器發(fā)送的用戶標(biāo)識時,將用戶語音指令信息和用戶標(biāo)識發(fā)送給語音識別服務(wù)器; 聲紋識別服務(wù)器,用于在接收到網(wǎng)絡(luò)接入終端發(fā)送的用戶語音指令信息時,對用戶語音指令信息進(jìn)行聲紋識別,并將與識別出的聲紋相對應(yīng)的用戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備; 語音識別服務(wù)器,用于在接收到網(wǎng)絡(luò)接入終端發(fā)送的用戶語音指令信息和用戶標(biāo)識時,查詢與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫,在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中,提取與用戶語音指令信息相對應(yīng)的控制指令,將控制指令發(fā)送給網(wǎng)絡(luò)接入設(shè)備,以便網(wǎng)絡(luò)接入設(shè)備根據(jù)控制指令進(jìn)行相應(yīng)操作。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于, 語音識別服務(wù)器具體在接收到網(wǎng)絡(luò)接入終端發(fā)送的用戶語音指令信息和用戶標(biāo)識時,判斷在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中,是否存在與用戶語音指令信息相對應(yīng)的控制指令;若在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中存在與用戶語音指令信息相對應(yīng)的控制指令,則執(zhí)行提取與用戶語音指令信息相對應(yīng)的控制指令的操作。
11.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于, 語音識別服務(wù)器還用于在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中不存在與用戶語音指令信息相對應(yīng)的控制指令時,通過通用語料庫對用戶語音指令信息進(jìn)行語音識別以得到控制指令,并將控制指令與相對應(yīng)的用戶語音指令信息存入到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中。
12.根據(jù)權(quán)利要求9-11中任一項(xiàng)所述的系統(tǒng),其特征在于, 語音識別服務(wù)器具體在接收到網(wǎng)絡(luò)接入終端發(fā)送的用戶語音指令信息和用戶標(biāo)識時,判斷是否查詢到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫;若查詢到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫,則執(zhí)行在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中,提取與用戶語音指令信息相對應(yīng)的控制指令的操作。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于, 語音識別服務(wù)器還用于在沒有查詢到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫時,建立與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫,對用戶語音指令信息進(jìn)行語音識別以得到控制指令,并將控制指令與相對應(yīng)的用戶語音指令信息存入到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中,然后執(zhí)行將控制指令發(fā)送給網(wǎng)絡(luò)接入設(shè)備的操作。
14.根據(jù)權(quán)利要求9-11中任一項(xiàng)所述的系統(tǒng),其特征在于, 聲紋識別服務(wù)器具體在接收到網(wǎng)絡(luò)接入終端發(fā)送的用戶語音指令信息時,對用戶語音指令信息進(jìn)行聲紋識別,以得到聲紋信息;判斷在聲紋庫中是否存在所述聲紋信息;若在聲紋庫中存在所述聲紋信息,則執(zhí)行將與識別出的聲紋相對應(yīng)的用戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備的操作。
15.根據(jù)權(quán)利要求14所述的系統(tǒng),其特征在于, 聲紋識別服務(wù)器還用于在聲紋庫中不存在所述聲紋信息時,將所述聲紋信息存儲到聲紋庫中,并為所述聲紋信息分配相應(yīng)的用戶標(biāo)識,然后將分配的用戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備。
16.根據(jù)權(quán)利要求9-11中任一項(xiàng)所述的系統(tǒng),其特征在于, 移動終端為遙控器; 網(wǎng)絡(luò)接入終端為機(jī)頂盒。
【專利摘要】本發(fā)明公開一種語音控制方法和系統(tǒng)。其中在語言控制方法中,移動終端將采集到的用戶語音指令信息通過網(wǎng)絡(luò)接入終端發(fā)送給聲紋識別服務(wù)器,聲紋識別服務(wù)器對用戶語音指令信息進(jìn)行聲紋識別,并將與識別出的聲紋相對應(yīng)的用戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備。網(wǎng)絡(luò)接入設(shè)備將用戶語音指令信息和用戶標(biāo)識發(fā)送給語音識別服務(wù)器,語音識別服務(wù)器在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中,提取與用戶語音指令信息相對應(yīng)的控制指令,將控制指令發(fā)送給網(wǎng)絡(luò)接入設(shè)備,以便網(wǎng)絡(luò)接入設(shè)備根據(jù)控制指令進(jìn)行相應(yīng)操作。通過利用聲紋識別技術(shù)來區(qū)分用戶,在用戶個性化語料庫的基礎(chǔ)上進(jìn)行語音識別,從而提高語音識別的準(zhǔn)確率,縮短語音識別的消耗時間,使用戶獲得更好的使用體驗(yàn)。
【IPC分類】G10L17-00, G10L15-26
【公開號】CN104778946
【申請?zhí)枴緾N201410011484
【發(fā)明人】馬宇飛, 鄧佳佳, 林毅
【申請人】中國電信股份有限公司
【公開日】2015年7月15日
【申請日】2014年1月10日