語(yǔ)音操控系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語(yǔ)音識(shí)別技術(shù)、圖像識(shí)別技術(shù)、文本識(shí)別技術(shù)、動(dòng)作模擬技術(shù)和藍(lán)牙技術(shù)。
【背景技術(shù)】
[0002]開(kāi)車時(shí)用手操控車載娛樂(lè)系統(tǒng)危險(xiǎn)性非常大。
[0003]當(dāng)前智能家居、智能穿戴、智能玩具對(duì)于語(yǔ)音操控的需求越來(lái)越強(qiáng)烈。
[0004]在醫(yī)療等領(lǐng)域很多人士手不方便操作終端,需要操控一些智能設(shè)備極其不便利。
[0005]如何通過(guò)語(yǔ)音有效的操控各種智能設(shè)備是目前急需解決的問(wèn)題。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的在于解決上述問(wèn)題,提供了一種語(yǔ)音操控系統(tǒng),提升了車載終端、手機(jī)、智能家居、移動(dòng)互聯(lián)等各類應(yīng)用操作的便利性,讓操控交互更簡(jiǎn)單,更人性化。
[0007]語(yǔ)音操控系統(tǒng)技術(shù)方案如下描述。
[0008]系統(tǒng)自定義命令和系統(tǒng)截取屏幕并識(shí)別圖片中可操作區(qū)域,可操作區(qū)域包括圖標(biāo)、按鈕、文本標(biāo)簽等界面控件,然后生成對(duì)應(yīng)的命令集庫(kù)。
[0009]系統(tǒng)采集語(yǔ)音,通過(guò)在線或離線的方式對(duì)語(yǔ)音進(jìn)行識(shí)別為文字。
[0010]系統(tǒng)匹配文字與命令集庫(kù),識(shí)別語(yǔ)音控制命令。
[0011 ]系統(tǒng)模擬控制命令對(duì)應(yīng)的操控動(dòng)作或通知應(yīng)用進(jìn)行操作,實(shí)現(xiàn)語(yǔ)音操控目標(biāo)。
[0012]根據(jù)本發(fā)明的語(yǔ)音操控系統(tǒng)的一實(shí)施例,語(yǔ)音識(shí)別和命令識(shí)別由系統(tǒng)的語(yǔ)音命令識(shí)別層實(shí)現(xiàn)。
[0013]根據(jù)本發(fā)明的語(yǔ)音操控系統(tǒng)的一實(shí)施例,應(yīng)用的操作由系統(tǒng)的操作執(zhí)行層完成。
[0014]根據(jù)本發(fā)明的語(yǔ)音操控系統(tǒng)的一實(shí)施例,語(yǔ)音操控系統(tǒng)狀態(tài)包括初期空閑、開(kāi)始提示、采集語(yǔ)音、語(yǔ)音識(shí)別、命令匹配結(jié)果提示、操作執(zhí)行。
[0015]用戶端遙控器包括藍(lán)牙遙控器,用于接收用戶按鍵事件傳輸至智能終端。
[0016]智能終端包括圖形和文本識(shí)別模塊、語(yǔ)音識(shí)別命令模塊和操作執(zhí)行模塊,各模塊功能如下。
[0017]圖形和文本識(shí)別模塊,把自定義的命令和截圖識(shí)別的可操作區(qū)域命令匯合生成命令集庫(kù)。
[0018]語(yǔ)音識(shí)別命令模塊,就采樣的語(yǔ)音識(shí)別為文字,然后和命令集庫(kù)匹配識(shí)別語(yǔ)音控制命令。
[0019]操作執(zhí)行模塊,模擬控制命令對(duì)應(yīng)的操控動(dòng)作或通知應(yīng)用進(jìn)行操作,實(shí)現(xiàn)語(yǔ)音操控目標(biāo)。
[0020]本發(fā)明對(duì)比現(xiàn)有技術(shù)有如下的有益效果:本發(fā)明的方案是對(duì)現(xiàn)有應(yīng)有界面識(shí)別其可操作區(qū)域動(dòng)態(tài)生成命令集庫(kù),在語(yǔ)音識(shí)別之后進(jìn)行語(yǔ)音命令的識(shí)別,然后模擬相應(yīng)的操作動(dòng)作或通知應(yīng)用執(zhí)行。相較于傳統(tǒng)技術(shù),本發(fā)明可以執(zhí)行應(yīng)用的任何命令,而傳統(tǒng)的技術(shù)只能支持幾個(gè)常用的命令,每次添加命令都需要底層深度定制;本發(fā)明可以推廣到接受語(yǔ)音操控的各種智能終端,包括但不限于智能手機(jī)、智能車載、智能穿戴、智能家居、智能醫(yī)療、智能玩具等可以接受語(yǔ)音輸入的用戶終端。
【附圖說(shuō)明】
[0021 ]圖1示出了本發(fā)明的語(yǔ)音操控系統(tǒng)的較佳實(shí)施例的流程圖。
[0022]圖2示出了本發(fā)明的語(yǔ)音操控系統(tǒng)的較佳實(shí)施例的業(yè)務(wù)邏輯圖。
【具體實(shí)施方式】
[0023]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的描述。
[0024]圖1示出了本發(fā)明的語(yǔ)音操控系統(tǒng)的較佳實(shí)施例的流程。請(qǐng)參見(jiàn)圖1,本實(shí)施例的語(yǔ)音操控系統(tǒng)的實(shí)施步驟詳述如下。
[0025]步驟100系統(tǒng)自定義命令和系統(tǒng)截取屏幕并識(shí)別圖片中可操作區(qū)域,可操作區(qū)域包括圖標(biāo)、按鈕、文本標(biāo)簽等界面控件,然后生成對(duì)應(yīng)的命令集庫(kù)。
[0026]步驟102系統(tǒng)采集語(yǔ)音,通過(guò)在線或離線的方式對(duì)語(yǔ)音進(jìn)行識(shí)別為文字。
[0027]步驟104系統(tǒng)匹配文字與命令集庫(kù),識(shí)別語(yǔ)音控制命令。
[0028]圖2示出了本發(fā)明的語(yǔ)音操控系統(tǒng)的較佳實(shí)施例的業(yè)務(wù)邏輯圖,請(qǐng)參見(jiàn)圖2,本實(shí)施例的語(yǔ)音操控系統(tǒng)包括用戶端遙控器20和智能終端60。
[0029]用戶端遙控器20包括藍(lán)牙遙控器,用于接收用戶按鍵事件傳輸至智能終端。智能終端60包括圖形和文本識(shí)別模塊602、語(yǔ)音命令識(shí)別模塊604和操作執(zhí)行模塊606。語(yǔ)音命令識(shí)別模塊604對(duì)采樣的語(yǔ)音進(jìn)行識(shí)別后轉(zhuǎn)化成文字并對(duì)轉(zhuǎn)化后的文字進(jìn)行命令識(shí)別。操作執(zhí)行模塊606模擬控制命令對(duì)應(yīng)的操控動(dòng)作或通知應(yīng)用進(jìn)行操作,實(shí)現(xiàn)語(yǔ)音操控目標(biāo)。
[0030]例如,用戶打開(kāi)車載導(dǎo)航,用戶點(diǎn)擊藍(lán)牙遙控器語(yǔ)音開(kāi)始鍵,說(shuō)出“搜地點(diǎn)”命令。
[0031]從用戶的角度看,用戶的控制命令與可操作區(qū)域是對(duì)應(yīng)匹配的“搜地點(diǎn)”對(duì)應(yīng)界面中的搜地點(diǎn)文本框可操作取悅,“景點(diǎn)”命令對(duì)應(yīng)界面中的標(biāo)簽可操作區(qū)域,“播放”命令對(duì)應(yīng)播放器界面中的播放圖標(biāo),界面中的可操作區(qū)域,可操作區(qū)域包括圖標(biāo)、按鈕、文本標(biāo)簽等界面控件都是語(yǔ)音命令,另外還有系統(tǒng)自定義的語(yǔ)音命令,譬如“Home”返回主菜單界面等。
[0032]系統(tǒng)截取當(dāng)前和屏幕識(shí)別可操作區(qū)域結(jié)合系統(tǒng)自定義的命令生成命令集庫(kù)。
[0033]系統(tǒng)識(shí)別出“搜地點(diǎn)”語(yǔ)音文本,然后和命令集庫(kù)匹配識(shí)別出“搜地點(diǎn)”命令。
[0034]步驟106模擬控制命令“搜地點(diǎn)”對(duì)應(yīng)的操控動(dòng)作或通知應(yīng)用進(jìn)行操作,跳轉(zhuǎn)到下一個(gè)操作界面,實(shí)現(xiàn)語(yǔ)音操控目標(biāo)。
[0035]上述實(shí)施例是提供給本領(lǐng)域一般技術(shù)人員來(lái)實(shí)現(xiàn)和使用本發(fā)明的,本領(lǐng)域一般技術(shù)人員可在不脫離本發(fā)明的思想的情況下,對(duì)上述實(shí)施例做出種種修改或變化,因而本發(fā)明的保護(hù)范圍并不被上述實(shí)施例所限,而應(yīng)該是符合權(quán)利要求書所提到的創(chuàng)新性特征的最大范圍。
【主權(quán)項(xiàng)】
1.一種語(yǔ)音操控系統(tǒng),包括:系統(tǒng)自定義命令和系統(tǒng)截取屏幕并識(shí)別圖片中可操作區(qū)域,可操作區(qū)域包括圖標(biāo)、按鈕、文本標(biāo)簽等界面控件,然后生成對(duì)應(yīng)的命令集庫(kù);系統(tǒng)采集語(yǔ)音,通過(guò)在線或離線的方式對(duì)語(yǔ)音進(jìn)行識(shí)別為文字;系統(tǒng)匹配文字與命令集庫(kù),識(shí)別語(yǔ)音控制命令;系統(tǒng)模擬控制命令對(duì)應(yīng)的操控動(dòng)作或通知應(yīng)用進(jìn)行操作,實(shí)現(xiàn)語(yǔ)音操控目標(biāo);用戶端遙控器包括藍(lán)牙遙控器,用于接收用戶按鍵事件傳輸至智能終端;智能終端包括圖形和文本識(shí)別模塊、語(yǔ)音識(shí)別命令模塊和操作執(zhí)行模塊,各模塊功能如下:圖形和文本識(shí)別模塊,把自定義的命令和截圖識(shí)別的可操作區(qū)域命令匯合生成命令集庫(kù);語(yǔ)音識(shí)別命令模塊,就采樣的語(yǔ)音識(shí)別為文字,然后和命令集庫(kù)匹配識(shí)別語(yǔ)音控制命令;操作執(zhí)行模塊,模擬控制命令對(duì)應(yīng)的操控動(dòng)作或通知應(yīng)用進(jìn)行操作,實(shí)現(xiàn)語(yǔ)音操控目標(biāo)。2.根據(jù)權(quán)利要求1所述的語(yǔ)音操控系統(tǒng),其特征在于,命令集庫(kù)是圖形和文本識(shí)別層來(lái)實(shí)現(xiàn)的。3.根據(jù)權(quán)利要求1所述的語(yǔ)音操控系統(tǒng),其特征在于,語(yǔ)音識(shí)別和語(yǔ)音控制命令識(shí)別由系統(tǒng)的語(yǔ)音命令識(shí)別層實(shí)現(xiàn)。4.根據(jù)權(quán)利要求1所述的語(yǔ)音操控系統(tǒng),其特征在于,應(yīng)用的操作由系統(tǒng)的操作執(zhí)行層模擬用戶操作動(dòng)作或通知應(yīng)用執(zhí)行來(lái)實(shí)現(xiàn)。5.根據(jù)權(quán)利要求1所述的語(yǔ)音操控系統(tǒng),其特征在于,語(yǔ)音操控系統(tǒng)狀態(tài)包括初期空閑、開(kāi)始提示、采集語(yǔ)音、語(yǔ)音識(shí)別、命令匹配結(jié)果提示、操作執(zhí)行。6.根據(jù)權(quán)利要求2所述的語(yǔ)音操控系統(tǒng),其特征在于,識(shí)別的屏幕界面可操作區(qū)域包括圖標(biāo)、按鈕、文本標(biāo)簽、文本輸入框、文字導(dǎo)航等一切用戶可進(jìn)行動(dòng)作操作的區(qū)域。7.根據(jù)權(quán)利要求3所述的語(yǔ)音操控系統(tǒng),其特征在于,語(yǔ)音識(shí)別包括在線云平臺(tái)和離線的語(yǔ)音識(shí)別庫(kù)兩種方式實(shí)現(xiàn)。8.根據(jù)權(quán)利要求4所述的語(yǔ)音操控系統(tǒng),其特征在于,模擬的用戶操作動(dòng)作包括單擊、雙擊、拖拽、多點(diǎn)觸摸、橫劃等交互動(dòng)作。
【專利摘要】本發(fā)明提供了一種語(yǔ)音操控系統(tǒng),提升了車載終端、手機(jī)、智能家居、移動(dòng)互聯(lián)等各類應(yīng)用操作的便利性,讓操控交互更簡(jiǎn)單,更人性化。語(yǔ)音操控系統(tǒng)技術(shù)方案如下描述:系統(tǒng)自定義命令和系統(tǒng)截取屏幕并識(shí)別圖片中可操作區(qū)域,可操作區(qū)域包括圖標(biāo)、按鈕、文本標(biāo)簽等界面控件,然后生成對(duì)應(yīng)的命令集庫(kù);系統(tǒng)采集語(yǔ)音,通過(guò)在線或離線的方式對(duì)語(yǔ)音進(jìn)行識(shí)別為文字;系統(tǒng)匹配文字與命令集庫(kù),識(shí)別語(yǔ)音控制命令;系統(tǒng)模擬控制命令對(duì)應(yīng)的操控動(dòng)作或通知應(yīng)用進(jìn)行操作,實(shí)現(xiàn)語(yǔ)音操控目標(biāo)。
【IPC分類】G06F3/0487, G10L15/22
【公開(kāi)號(hào)】CN105513594
【申請(qǐng)?zhí)枴緾N201510835844
【發(fā)明人】不公告發(fā)明人
【申請(qǐng)人】許傳平
【公開(kāi)日】2016年4月20日
【申請(qǐng)日】2015年11月26日