語音控制方法和系統(tǒng)的制作方法_4

文檔序號：8458036閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>語音控制方法和系統(tǒng)的制作方法

戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備；網(wǎng)絡(luò)接入設(shè)備將用戶語音指令信息和用戶標(biāo)識發(fā)送給語音識別服務(wù)器；語音識別服務(wù)器查詢與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫；語音識別服務(wù)器在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中，提取與用戶語音指令信息相對應(yīng)的控制指令，將控制指令發(fā)送給網(wǎng)絡(luò)接入設(shè)備，以便網(wǎng)絡(luò)接入設(shè)備根據(jù)控制指令進(jìn)行相應(yīng)操作。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，語音識別服務(wù)器在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中，提取與用戶語音指令信息相對應(yīng)的控制指令的步驟包括: 語音識別服務(wù)器判斷在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中，是否存在與用戶語音指令信息相對應(yīng)的控制指令；若在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中存在與用戶語音指令信息相對應(yīng)的控制指令，則執(zhí)行提取與用戶語音指令信息相對應(yīng)的控制指令的步驟。
3.根據(jù)權(quán)利要求2所述的方法，其特征在于，若在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中不存在與用戶語音指令信息相對應(yīng)的控制指令，則通過通用語料庫對用戶語音指令信息進(jìn)行語音識別以得到控制指令，并將控制指令與相對應(yīng)的用戶語音指令信息存入到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中。
4.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的方法，其特征在于，語音識別服務(wù)器查詢與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫的步驟包括: 語音識別服務(wù)器判斷是否查詢到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫；若查詢到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫，則執(zhí)行語音識別服務(wù)器在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中，提取與用戶語音指令信息相對應(yīng)的控制指令的步驟。
5.根據(jù)權(quán)利要求4所述的方法，其特征在于，若沒有查詢到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫，則語音識別服務(wù)器建立與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫，對用戶語音指令信息進(jìn)行語音識別以得到控制指令，并將控制指令與相對應(yīng)的用戶語音指令信息存入到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中，然后執(zhí)行將控制指令發(fā)送給網(wǎng)絡(luò)接入設(shè)備的步驟。
6.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的方法，其特征在于，聲紋識別服務(wù)器對用戶語音指令信息進(jìn)行聲紋識別，并將與識別出的聲紋相對應(yīng)的用戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備的步驟包括: 聲紋識別服務(wù)器對用戶語音指令信息進(jìn)行聲紋識別，以得到聲紋信息；判斷在聲紋庫中是否存在所述聲紋信息；若在聲紋庫中存在所述聲紋信息，則執(zhí)行將與識別出的聲紋相對應(yīng)的用戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備的步驟。
7.根據(jù)權(quán)利要求6所述的方法，其特征在于，若在聲紋庫中不存在所述聲紋信息，則將所述聲紋信息存儲到聲紋庫中，并為所述聲紋信息分配相應(yīng)的用戶標(biāo)識，然后將分配的用戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備。
8.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的方法，其特征在于，移動終端為遙控器；網(wǎng)絡(luò)接入終端為機(jī)頂盒。
9.一種語音控制系統(tǒng)，其特征在于，包括移動終端、網(wǎng)絡(luò)接入終端、聲紋識別服務(wù)器和語音識別服務(wù)器，其中: 移動終端，用于采集用戶語音指令信息，將采集到的用戶語音指令信息發(fā)送給網(wǎng)絡(luò)接入終; 網(wǎng)絡(luò)接入終端，用于在接收到移動終端發(fā)送的用戶語音指令信息時，將用戶語音指令信息發(fā)送給聲紋識別服務(wù)器；在接收到聲紋識別服務(wù)器發(fā)送的用戶標(biāo)識時，將用戶語音指令信息和用戶標(biāo)識發(fā)送給語音識別服務(wù)器；聲紋識別服務(wù)器，用于在接收到網(wǎng)絡(luò)接入終端發(fā)送的用戶語音指令信息時，對用戶語音指令信息進(jìn)行聲紋識別，并將與識別出的聲紋相對應(yīng)的用戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備；語音識別服務(wù)器，用于在接收到網(wǎng)絡(luò)接入終端發(fā)送的用戶語音指令信息和用戶標(biāo)識時，查詢與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫，在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中，提取與用戶語音指令信息相對應(yīng)的控制指令，將控制指令發(fā)送給網(wǎng)絡(luò)接入設(shè)備，以便網(wǎng)絡(luò)接入設(shè)備根據(jù)控制指令進(jìn)行相應(yīng)操作。
10.根據(jù)權(quán)利要求9所述的系統(tǒng)，其特征在于，語音識別服務(wù)器具體在接收到網(wǎng)絡(luò)接入終端發(fā)送的用戶語音指令信息和用戶標(biāo)識時，判斷在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中，是否存在與用戶語音指令信息相對應(yīng)的控制指令；若在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中存在與用戶語音指令信息相對應(yīng)的控制指令，則執(zhí)行提取與用戶語音指令信息相對應(yīng)的控制指令的操作。
11.根據(jù)權(quán)利要求10所述的系統(tǒng)，其特征在于，語音識別服務(wù)器還用于在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中不存在與用戶語音指令信息相對應(yīng)的控制指令時，通過通用語料庫對用戶語音指令信息進(jìn)行語音識別以得到控制指令，并將控制指令與相對應(yīng)的用戶語音指令信息存入到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中。
12.根據(jù)權(quán)利要求9-11中任一項(xiàng)所述的系統(tǒng)，其特征在于，語音識別服務(wù)器具體在接收到網(wǎng)絡(luò)接入終端發(fā)送的用戶語音指令信息和用戶標(biāo)識時，判斷是否查詢到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫；若查詢到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫，則執(zhí)行在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中，提取與用戶語音指令信息相對應(yīng)的控制指令的操作。
13.根據(jù)權(quán)利要求12所述的系統(tǒng)，其特征在于，語音識別服務(wù)器還用于在沒有查詢到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫時，建立與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫，對用戶語音指令信息進(jìn)行語音識別以得到控制指令，并將控制指令與相對應(yīng)的用戶語音指令信息存入到與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中，然后執(zhí)行將控制指令發(fā)送給網(wǎng)絡(luò)接入設(shè)備的操作。
14.根據(jù)權(quán)利要求9-11中任一項(xiàng)所述的系統(tǒng)，其特征在于，聲紋識別服務(wù)器具體在接收到網(wǎng)絡(luò)接入終端發(fā)送的用戶語音指令信息時，對用戶語音指令信息進(jìn)行聲紋識別，以得到聲紋信息；判斷在聲紋庫中是否存在所述聲紋信息；若在聲紋庫中存在所述聲紋信息，則執(zhí)行將與識別出的聲紋相對應(yīng)的用戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備的操作。
15.根據(jù)權(quán)利要求14所述的系統(tǒng)，其特征在于，聲紋識別服務(wù)器還用于在聲紋庫中不存在所述聲紋信息時，將所述聲紋信息存儲到聲紋庫中，并為所述聲紋信息分配相應(yīng)的用戶標(biāo)識，然后將分配的用戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備。
16.根據(jù)權(quán)利要求9-11中任一項(xiàng)所述的系統(tǒng)，其特征在于，移動終端為遙控器；網(wǎng)絡(luò)接入終端為機(jī)頂盒。
【專利摘要】本發(fā)明公開一種語音控制方法和系統(tǒng)。其中在語言控制方法中，移動終端將采集到的用戶語音指令信息通過網(wǎng)絡(luò)接入終端發(fā)送給聲紋識別服務(wù)器，聲紋識別服務(wù)器對用戶語音指令信息進(jìn)行聲紋識別，并將與識別出的聲紋相對應(yīng)的用戶標(biāo)識發(fā)送給網(wǎng)絡(luò)接入設(shè)備。網(wǎng)絡(luò)接入設(shè)備將用戶語音指令信息和用戶標(biāo)識發(fā)送給語音識別服務(wù)器，語音識別服務(wù)器在與用戶標(biāo)識相關(guān)聯(lián)的用戶語料庫中，提取與用戶語音指令信息相對應(yīng)的控制指令，將控制指令發(fā)送給網(wǎng)絡(luò)接入設(shè)備，以便網(wǎng)絡(luò)接入設(shè)備根據(jù)控制指令進(jìn)行相應(yīng)操作。通過利用聲紋識別技術(shù)來區(qū)分用戶，在用戶個性化語料庫的基礎(chǔ)上進(jìn)行語音識別，從而提高語音識別的準(zhǔn)確率，縮短語音識別的消耗時間，使用戶獲得更好的使用體驗(yàn)。
【IPC分類】G10L17-00, G10L15-26
【公開號】CN104778946
【申請?zhí)枴緾N201410011484
【發(fā)明人】馬宇飛, 鄧佳佳, 林毅
【申請人】中國電信股份有限公司
【公開日】2015年7月15日
【申請日】2014年1月10日

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第4頁1 2 3 4

相關(guān)技術(shù)