一種erp語音控制方法
【專利摘要】為了便于ERP用戶能夠方便、安全地從遠程訪問ERP服務(wù),本發(fā)明提供了一種ERP語音控制方法,包括以下步驟:(1)預(yù)存儲語音命令、語音命令集以及操作指令三者之間的映射關(guān)系;(2)音頻通信設(shè)備接收語音命令,并傳輸給音頻收發(fā)設(shè)備;(3)音頻收發(fā)設(shè)備接收所述語音命令;(4)對所接收的語音命令生成語音命令模板;(5)將語音命令的模板與預(yù)存儲的語音命令集進行匹配;如果相匹配,則根據(jù)所述映射關(guān)系獲取相匹配的語音命令對應(yīng)的操作指令后執(zhí)行該操作指令;否則,向音頻通信設(shè)備提示語音命令無效。本發(fā)明通過語音可以判斷出當前操作人員是否是合法的操作人員,避免了非法操作人員的非法操作,提高了安全性。
【專利說明】一種ERP語音控制方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種語音識別【技術(shù)領(lǐng)域】,尤其是涉及一種應(yīng)用于ERP的語音控制方法。
【背景技術(shù)】
[0002]隨著科技的日新月異,IT廠商所生產(chǎn)的外圍裝置,例如掃描器,均以能夠讓使用者方便使用為目標。一般控制外圍裝置的方式一般是利用鍵盤、滑鼠或觸控屏輸入控制命令。
[0003]在利用操作指令控制設(shè)備運行的應(yīng)用場合,常常是通過輸入操作指令的方式來啟動設(shè)備的運行。一旦非法人員獲取了操作指令,便可以冒充合法身份來操作設(shè)備,安全性較差。
[0004]如果采用語音來控制設(shè)備的運行,不但無需輸入操作指令,而且兼具身份識別的能力,無疑能夠提高系統(tǒng)的安全性和便利性?,F(xiàn)有的語音識別系統(tǒng)能夠識別出語音的語義內(nèi)容,但識別過程較為復(fù)雜,識別效率也相對較低,僅適合在ERP系統(tǒng)的終端現(xiàn)場使用。例如,對于ERP系統(tǒng)的采購子系統(tǒng),當操作人員輸入正確的密碼后,采購子系統(tǒng)便會進行查詢、輸入、輸出等操作,無法遠程地進行操作,尤其是無法僅僅使用普通的手機、座機來實現(xiàn)遠程操作指令的下達。
【發(fā)明內(nèi)容】
[0005]針對現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明所要解決的技術(shù)問題是提供一種操作方便、安全性好的應(yīng)用于ERP系統(tǒng)的語音控制方法。
[0006]為解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案如下:
[0007]一種ERP語音控制方法,包括以下步驟:
[0008](I)預(yù)存儲語音命令、語音命令集以及操作指令三者之間的映射關(guān)系;
[0009](2)音頻通信設(shè)備接收語音命令,并傳輸給音頻收發(fā)設(shè)備;
[0010](3)音頻收發(fā)設(shè)備接收所述語音命令;
[0011](4)對所接收的語音命令生成語音命令模板;
[0012](5)將語音命令的模板與預(yù)存儲的語音命令集進行匹配;如果相匹配,則根據(jù)所述映射關(guān)系獲取相匹配的語音命令對應(yīng)的操作指令后執(zhí)行該操作指令;否則,向音頻通信設(shè)備提示語音命令無效。
[0013]進一步地,其中,所述語音命令集包括多個參考語音模板,所述參考語音模板是根據(jù)對同一命令在聲調(diào)、發(fā)音長短和口音這三方面的多種變化的各種語音產(chǎn)生的。
[0014]進一步地,步驟(5)中所述將語音命令的模板與預(yù)存儲的語音命令集進行匹配的方法如下:
[0015](a)獲得語音命令模板中的第一聲紋;
[0016](b)獲取所述語音命令集中各個參考語音模板的第二聲紋;
[0017](c)比較所述第一聲紋和所述第二聲紋,如果相匹配,則匹配成功;否則,匹配失敗。
[0018]進一步地,在步驟(3)和步驟(4)之間,還包括對接收到的語音命令進行降噪處理。
[0019]進一步地,在步驟(I)中,將所述語音命令分成若干節(jié),存儲每一節(jié)語音命令的模板。
[0020]進一步地,步驟(3)中,如果每一節(jié)語音命令的模板均與預(yù)存儲的相對應(yīng)節(jié)的語音命令的模板相匹配,則獲取該語音命令對應(yīng)的操作指令。
[0021]進一步地,獲得所述第一聲紋包括:獲得基于語音命令模板中的聲調(diào)和口音的聲紋,或者獲得基于語音命令模板中的發(fā)音長短與口音的聲紋,或者獲得基于聲調(diào)、發(fā)音長短和口音的聲紋。
[0022]進一步地,獲得所述第二聲紋包括:獲得基于語音命令模板中的聲調(diào)和口音的聲紋,或者獲得基于語音命令模板中的發(fā)音長短與口音的聲紋,或者獲得基于聲調(diào)、發(fā)音長短和口音的聲紋。
[0023]進一步地,比較所述第一聲紋和所述第二聲紋包括:比較基于語音命令模板和語音命令集中的基于聲調(diào)和口音的聲紋,如果匹配,則繼續(xù)比較基于語音命令模板中的發(fā)音長短與口音的聲紋,如果匹配,再比較基于聲調(diào)、發(fā)音長短和口音的聲紋;其中任何匹配不成功都不再繼續(xù)進行后續(xù)比較。
[0024]本發(fā)明所述方法,無需手動輸入操作指令,通過語音便可控制設(shè)備的啟動或運行,操作方便。而且,通過語音可以判斷出當前操作人員是否是合法的操作人員,避免了非法操作人員的非法操作,提高了安全性。
【專利附圖】
【附圖說明】
[0025]圖1是【具體實施方式】中ERP語音控制方法的流程圖。
【具體實施方式】
[0026]下面結(jié)合【具體實施方式】和附圖對本發(fā)明進行詳細描述。
[0027]如圖1所示,本實施方式中ERP系統(tǒng)的語音控制方法包括以下步驟:
[0028](I)預(yù)存儲語音命令、語音命令集以及操作指令三者之間的映射關(guān)系。預(yù)存的語音命令包括表示ERP系統(tǒng)的各種操作動作(例如:打開、打印、發(fā)送郵件給、添加附件、查詢)的動詞、表示ERP系統(tǒng)的操作動作的各種參數(shù)(例如:起始日期、終止日期、文件位置、數(shù)據(jù)類型)的名詞等。操作指令為預(yù)先編制好的ERP系統(tǒng)內(nèi)部執(zhí)行的指令,這些指令可以采用機器語言編制,通常采用軟件編程的方式產(chǎn)生和維護。所述語音命令集包括多個參考語音模板,所述參考語音模板是根據(jù)對同一命令在聲調(diào)、發(fā)音長短和口音這三方面的多種變化的各種語音產(chǎn)生的。在一個優(yōu)選的實施例中,上述參考語音模板將所述聲調(diào)、發(fā)音長短(單位采用微秒)和口音設(shè)置成三維數(shù)組。
[0029]對于口音的處理,本發(fā)明采用的是通過預(yù)先記錄各地口音對于漢語字母的聲母、韻母的發(fā)音規(guī)則實現(xiàn)的:這種處理已經(jīng)是本領(lǐng)域公知技術(shù),在此不再詳述。例如,預(yù)先分析使用者發(fā)出聲音的各個字符的發(fā)音長短、是否卷舌、是否帶有聲調(diào)、若帶有聲調(diào)時的具體聲調(diào)。
[0030](2)音頻通信設(shè)備接收語音命令,并傳輸給音頻收發(fā)設(shè)備。
[0031]在優(yōu)選的實施例中,所述的音頻通信設(shè)備包括手機,尤其是非智能手機,還可以包括固定電話。更廣泛地,可以使用包括智能手機在內(nèi)的任何既具有語音接收功能又具有將所接收到的語音通過通信網(wǎng)絡(luò)發(fā)送出去,并接收外部語音、文字和/或圖像等信息反饋功能的設(shè)備。
[0032](3)音頻收發(fā)設(shè)備接收所述語音命令。這里的音頻收發(fā)設(shè)備優(yōu)選地為ERP系統(tǒng)終端附近的音頻收發(fā)設(shè)備。該設(shè)備接收來自上述音頻通信設(shè)備發(fā)送來的語音信息。
[0033](4)對所接收的語音命令生成語音命令模板。具體地,在所接收到的語音信息中,根據(jù)本發(fā)明的優(yōu)選實施例,首先進行降噪的操作,盡可能地去除語音信號中的噪聲。然后,利用STT(SpeeCh To Text)技術(shù)得到語音信息中包括的語音命令,并在同時分析得到各個文字的聲調(diào)、各個字符的發(fā)音長短時間和各個字符對應(yīng)的聲母、韻母的發(fā)音規(guī)則(例如,發(fā)音長短、是否卷舌、是否帶有聲調(diào)、若帶有聲調(diào)時的具體聲調(diào)),進而形成由聲調(diào)、發(fā)音長短和口音組成的三維數(shù)組。
[0034](5)將語音命令的模板與預(yù)存儲的語音命令集進行匹配;如果相匹配,則根據(jù)所述映射關(guān)系獲取相匹配的語音命令對應(yīng)的操作指令后執(zhí)行該操作指令;否則,向音頻通信設(shè)備提示語音命令無效。
[0035]這一步驟中,具體包括:
[0036](a)獲得語音命令模板中的第一聲紋;
[0037](b)獲取所述語音命令集中各個參考語音模板的第二聲紋;
[0038](C)比較所述第一聲紋和所述第二聲紋,如果相匹配,則匹配成功;否則,匹配失敗。
[0039]在其他的實施例中,可以在步驟(I)中將所述語音命令分成若干節(jié),存儲每一節(jié)語音命令的模板,而不是像上述實施例中那樣采用字符為單位進行分析和語音處理。此時,在步驟(3)中,如果每一節(jié)語音命令的模板均與預(yù)存儲的相對應(yīng)節(jié)的語音命令的模板相匹配,則獲取該語音命令對應(yīng)的操作指令。
[0040]根據(jù)本發(fā)明的優(yōu)選實施例,獲得所述第一聲紋包括:獲得基于語音命令模板中的聲調(diào)和口音的聲紋,或者獲得基于語音命令模板中的發(fā)音長短與口音的聲紋,或者獲得基于聲調(diào)、發(fā)音長短和口音的聲紋。獲得所述第二聲紋包括:獲得基于語音命令模板中的聲調(diào)和口音的聲紋,或者獲得基于語音命令模板中的發(fā)音長短與口音的聲紋,或者獲得基于聲調(diào)、發(fā)音長短和口音的聲紋。
[0041]在確定了聲紋的數(shù)據(jù)處理對象(或稱數(shù)據(jù)來源)后,上述聲紋的獲取步驟為:將語音信號波形的k個樣點的每一幀,或有k個參數(shù)的每一參數(shù)幀,構(gòu)成k維空間中的一個矢量,然后對矢量進行量化。量化時,將k維無限空間劃分為M個區(qū)域邊界,然后將輸入矢量與這些邊界進行比較,并被量化為“距離”最小的區(qū)域邊界的中心矢量值。當然,也可以采用HMM(隱馬爾可夫法)實現(xiàn)對于聲紋的特征提取。
[0042]根據(jù)本發(fā)明的優(yōu)選實施例,比較所述第一聲紋和所述第二聲紋包括:比較基于語音命令模板和語音命令集中的基于聲調(diào)和口音的聲紋,如果匹配,則繼續(xù)比較基于語音命令模板中的發(fā)音長短與口音的聲紋,如果匹配,再比較基于聲調(diào)、發(fā)音長短和口音的聲紋;其中任何匹配不成功都不再繼續(xù)進行后續(xù)比較。
[0043]上述比較過程中,如果基于語音命令模板的聲紋和語音命令集中的聲紋的方差在預(yù)定的閾值之內(nèi),則認為上述語音命令模板中包括的語音命令是可以被執(zhí)行的,此時,ERP系統(tǒng)將根據(jù)該語音命令集中對應(yīng)的操作指令進行處理,執(zhí)行相應(yīng)的操作。否則,上述音頻通信設(shè)備將收到由ERP系統(tǒng)終端附近的音頻收發(fā)設(shè)備發(fā)出的語音命令無法被執(zhí)行的信息。
[0044]顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其同等技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
【權(quán)利要求】
1.一種ERP語音控制方法,其特征在于,包括以下步驟: (1)預(yù)存儲語音命令、語音命令集以及操作指令三者之間的映射關(guān)系; (2)音頻通信設(shè)備接收語音命令,并傳輸給音頻收發(fā)設(shè)備; (3)音頻收發(fā)設(shè)備接收所述語音命令; (4)對所接收的語音命令生成語音命令模板; (5)將語音命令的模板與預(yù)存儲的語音命令集進行匹配;如果相匹配,則根據(jù)所述映射關(guān)系獲取相匹配的語音命令對應(yīng)的操作指令后執(zhí)行該操作指令;否則,向音頻通信設(shè)備提示語音命令無效。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述語音命令集包括多個參考語音模板,所述參考語音模板是根據(jù)對同一命令在聲調(diào)、發(fā)音長短和口音這三方面的多種變化的各種語音產(chǎn)生的。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟(5)中所述將語音命令的模板與預(yù)存儲的語音命令集進行匹配的方法如下: (a)獲得語音命令模板中的第一聲紋; (b)獲取所述語音命令集中各個參考語音模板的第二聲紋; (c)比較所述第一聲紋和所述第二聲紋,如果相匹配,則匹配成功;否則,匹配失敗。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,在步驟(3)和步驟(4)之間,還包括對接收到的語音命令進行降噪處理。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在步驟(I)中,將所述語音命令分成若干節(jié),存儲每一節(jié)語音命令的模板。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,步驟(3)中,如果每一節(jié)語音命令的模板均與預(yù)存儲的相對應(yīng)節(jié)的語音命令的模板相匹配,則獲取該語音命令對應(yīng)的操作指令。
7.根據(jù)權(quán)利要求3所述的方法,其特征在于,獲得所述第一聲紋包括:獲得基于語音命令模板中的聲調(diào)和口音的聲紋,或者獲得基于語音命令模板中的發(fā)音長短與口音的聲紋,或者獲得基于聲調(diào)、發(fā)音長短和口音的聲紋。
8.根據(jù)權(quán)利要求3所述的方法,其特征在于,獲得所述第二聲紋包括:獲得基于語音命令模板中的聲調(diào)和口音的聲紋,或者獲得基于語音命令模板中的發(fā)音長短與口音的聲紋,或者獲得基于聲調(diào)、發(fā)音長短和口音的聲紋。
9.根據(jù)權(quán)利要求3所述的方法,其特征在于,比較所述第一聲紋和所述第二聲紋包括:比較基于語音命令模板和語音命令集中的基于聲調(diào)和口音的聲紋,如果匹配,則繼續(xù)比較基于語音命令模板中的發(fā)音長短與口音的聲紋,如果匹配,再比較基于聲調(diào)、發(fā)音長短和口音的聲紋;其中任何匹配不成功都不再繼續(xù)進行后續(xù)比較。
【文檔編號】G10L17/22GK104200807SQ201410478889
【公開日】2014年12月10日 申請日期:2014年9月18日 優(yōu)先權(quán)日:2014年9月18日
【發(fā)明者】曹毅 申請人:成都博智維訊信息技術(shù)有限公司