一種erp語音控制方法

文檔序號：2827809閱讀：448來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種erp語音控制方法
【專利摘要】為了便于ERP用戶能夠方便、安全地從遠程訪問ERP服務(wù)，本發(fā)明提供了一種ERP語音控制方法，包括以下步驟：(1)預(yù)存儲語音命令、語音命令集以及操作指令三者之間的映射關(guān)系；(2)音頻通信設(shè)備接收語音命令，并傳輸給音頻收發(fā)設(shè)備；(3)音頻收發(fā)設(shè)備接收所述語音命令；(4)對所接收的語音命令生成語音命令模板；(5)將語音命令的模板與預(yù)存儲的語音命令集進行匹配；如果相匹配，則根據(jù)所述映射關(guān)系獲取相匹配的語音命令對應(yīng)的操作指令后執(zhí)行該操作指令；否則，向音頻通信設(shè)備提示語音命令無效。本發(fā)明通過語音可以判斷出當前操作人員是否是合法的操作人員，避免了非法操作人員的非法操作，提高了安全性。
【專利說明】一種ERP語音控制方法

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種語音識別【技術(shù)領(lǐng)域】，尤其是涉及一種應(yīng)用于ERP的語音控制方法。

【背景技術(shù)】
[0002]隨著科技的日新月異，IT廠商所生產(chǎn)的外圍裝置，例如掃描器，均以能夠讓使用者方便使用為目標。一般控制外圍裝置的方式一般是利用鍵盤、滑鼠或觸控屏輸入控制命令。
[0003]在利用操作指令控制設(shè)備運行的應(yīng)用場合，常常是通過輸入操作指令的方式來啟動設(shè)備的運行。一旦非法人員獲取了操作指令，便可以冒充合法身份來操作設(shè)備，安全性較差。
[0004]如果采用語音來控制設(shè)備的運行，不但無需輸入操作指令，而且兼具身份識別的能力，無疑能夠提高系統(tǒng)的安全性和便利性?，F(xiàn)有的語音識別系統(tǒng)能夠識別出語音的語義內(nèi)容，但識別過程較為復(fù)雜，識別效率也相對較低，僅適合在ERP系統(tǒng)的終端現(xiàn)場使用。例如，對于ERP系統(tǒng)的采購子系統(tǒng)，當操作人員輸入正確的密碼后，采購子系統(tǒng)便會進行查詢、輸入、輸出等操作，無法遠程地進行操作，尤其是無法僅僅使用普通的手機、座機來實現(xiàn)遠程操作指令的下達。

【發(fā)明內(nèi)容】

[0005]針對現(xiàn)有技術(shù)中存在的缺陷，本發(fā)明所要解決的技術(shù)問題是提供一種操作方便、安全性好的應(yīng)用于ERP系統(tǒng)的語音控制方法。
[0006]為解決上述技術(shù)問題，本發(fā)明采用的技術(shù)方案如下:
[0007]一種ERP語音控制方法，包括以下步驟:
[0008](I)預(yù)存儲語音命令、語音命令集以及操作指令三者之間的映射關(guān)系；
[0009](2)音頻通信設(shè)備接收語音命令，并傳輸給音頻收發(fā)設(shè)備；
[0010](3)音頻收發(fā)設(shè)備接收所述語音命令；
[0011](4)對所接收的語音命令生成語音命令模板；
[0012](5)將語音命令的模板與預(yù)存儲的語音命令集進行匹配；如果相匹配，則根據(jù)所述映射關(guān)系獲取相匹配的語音命令對應(yīng)的操作指令后執(zhí)行該操作指令；否則，向音頻通信設(shè)備提示語音命令無效。
[0013]進一步地，其中，所述語音命令集包括多個參考語音模板，所述參考語音模板是根據(jù)對同一命令在聲調(diào)、發(fā)音長短和口音這三方面的多種變化的各種語音產(chǎn)生的。
[0014]進一步地，步驟(5)中所述將語音命令的模板與預(yù)存儲的語音命令集進行匹配的方法如下:
[0015](a)獲得語音命令模板中的第一聲紋；
[0016](b)獲取所述語音命令集中各個參考語音模板的第二聲紋；
[0017](c)比較所述第一聲紋和所述第二聲紋，如果相匹配，則匹配成功；否則，匹配失敗。
[0018]進一步地，在步驟(3)和步驟(4)之間，還包括對接收到的語音命令進行降噪處理。
[0019]進一步地，在步驟(I)中，將所述語音命令分成若干節(jié)，存儲每一節(jié)語音命令的模板。
[0020]進一步地，步驟(3)中，如果每一節(jié)語音命令的模板均與預(yù)存儲的相對應(yīng)節(jié)的語音命令的模板相匹配，則獲取該語音命令對應(yīng)的操作指令。
[0021]進一步地，獲得所述第一聲紋包括:獲得基于語音命令模板中的聲調(diào)和口音的聲紋，或者獲得基于語音命令模板中的發(fā)音長短與口音的聲紋，或者獲得基于聲調(diào)、發(fā)音長短和口音的聲紋。
[0022]進一步地，獲得所述第二聲紋包括:獲得基于語音命令模板中的聲調(diào)和口音的聲紋，或者獲得基于語音命令模板中的發(fā)音長短與口音的聲紋，或者獲得基于聲調(diào)、發(fā)音長短和口音的聲紋。
[0023]進一步地，比較所述第一聲紋和所述第二聲紋包括:比較基于語音命令模板和語音命令集中的基于聲調(diào)和口音的聲紋，如果匹配，則繼續(xù)比較基于語音命令模板中的發(fā)音長短與口音的聲紋，如果匹配，再比較基于聲調(diào)、發(fā)音長短和口音的聲紋；其中任何匹配不成功都不再繼續(xù)進行后續(xù)比較。
[0024]本發(fā)明所述方法，無需手動輸入操作指令，通過語音便可控制設(shè)備的啟動或運行，操作方便。而且，通過語音可以判斷出當前操作人員是否是合法的操作人員，避免了非法操作人員的非法操作，提高了安全性。

【專利附圖】

【附圖說明】
[0025]圖1是【具體實施方式】中ERP語音控制方法的流程圖。

【具體實施方式】
[0026]下面結(jié)合【具體實施方式】和附圖對本發(fā)明進行詳細描述。
[0027]如圖1所示，本實施方式中ERP系統(tǒng)的語音控制方法包括以下步驟:
[0028](I)預(yù)存儲語音命令、語音命令集以及操作指令三者之間的映射關(guān)系。預(yù)存的語音命令包括表示ERP系統(tǒng)的各種操作動作(例如:打開、打印、發(fā)送郵件給、添加附件、查詢)的動詞、表示ERP系統(tǒng)的操作動作的各種參數(shù)(例如:起始日期、終止日期、文件位置、數(shù)據(jù)類型)的名詞等。操作指令為預(yù)先編制好的ERP系統(tǒng)內(nèi)部執(zhí)行的指令，這些指令可以采用機器語言編制，通常采用軟件編程的方式產(chǎn)生和維護。所述語音命令集包括多個參考語音模板，所述參考語音模板是根據(jù)對同一命令在聲調(diào)、發(fā)音長短和口音這三方面的多種變化的各種語音產(chǎn)生的。在一個優(yōu)選的實施例中，上述參考語音模板將所述聲調(diào)、發(fā)音長短(單位采用微秒)和口音設(shè)置成三維數(shù)組。
[0029]對于口音的處理，本發(fā)明采用的是通過預(yù)先記錄各地口音對于漢語字母的聲母、韻母的發(fā)音規(guī)則實現(xiàn)的:這種處理已經(jīng)是本領(lǐng)域公知技術(shù)，在此不再詳述。例如，預(yù)先分析使用者發(fā)出聲音的各個字符的發(fā)音長短、是否卷舌、是否帶有聲調(diào)、若帶有聲調(diào)時的具體聲調(diào)。
[0030](2)音頻通信設(shè)備接收語音命令，并傳輸給音頻收發(fā)設(shè)備。
[0031]在優(yōu)選的實施例中，所述的音頻通信設(shè)備包括手機，尤其是非智能手機，還可以包括固定電話。更廣泛地，可以使用包括智能手機在內(nèi)的任何既具有語音接收功能又具有將所接收到的語音通過通信網(wǎng)絡(luò)發(fā)送出去，并接收外部語音、文字和/或圖像等信息反饋功能的設(shè)備。
[0032](3)音頻收發(fā)設(shè)備接收所述語音命令。這里的音頻收發(fā)設(shè)備優(yōu)選地為ERP系統(tǒng)終端附近的音頻收發(fā)設(shè)備。該設(shè)備接收來自上述音頻通信設(shè)備發(fā)送來的語音信息。
[0033](4)對所接收的語音命令生成語音命令模板。具體地，在所接收到的語音信息中，根據(jù)本發(fā)明的優(yōu)選實施例，首先進行降噪的操作，盡可能地去除語音信號中的噪聲。然后，利用STT(SpeeCh To Text)技術(shù)得到語音信息中包括的語音命令，并在同時分析得到各個文字的聲調(diào)、各個字符的發(fā)音長短時間和各個字符對應(yīng)的聲母、韻母的發(fā)音規(guī)則(例如，發(fā)音長短、是否卷舌、是否帶有聲調(diào)、若帶有聲調(diào)時的具體聲調(diào))，進而形成由聲調(diào)、發(fā)音長短和口音組成的三維數(shù)組。
[0034](5)將語音命令的模板與預(yù)存儲的語音命令集進行匹配；如果相匹配，則根據(jù)所述映射關(guān)系獲取相匹配的語音命令對應(yīng)的操作指令后執(zhí)行該操作指令；否則，向音頻通信設(shè)備提示語音命令無效。
[0035]這一步驟中，具體包括:
[0036](a)獲得語音命令模板中的第一聲紋；
[0037](b)獲取所述語音命令集中各個參考語音模板的第二聲紋；
[0038](C)比較所述第一聲紋和所述第二聲紋，如果相匹配，則匹配成功；否則，匹配失敗。
[0039]在其他的實施例中，可以在步驟(I)中將所述語音命令分成若干節(jié)，存儲每一節(jié)語音命令的模板，而不是像上述實施例中那樣采用字符為單位進行分析和語音處理。此時，在步驟(3)中，如果每一節(jié)語音命令的模板均與預(yù)存儲的相對應(yīng)節(jié)的語音命令的模板相匹配，則獲取該語音命令對應(yīng)的操作指令。
[0040]根據(jù)本發(fā)明的優(yōu)選實施例，獲得所述第一聲紋包括:獲得基于語音命令模板中的聲調(diào)和口音的聲紋,或者獲得基于語音命令模板中的發(fā)音長短與口音的聲紋，或者獲得基于聲調(diào)、發(fā)音長短和口音的聲紋。獲得所述第二聲紋包括:獲得基于語音命令模板中的聲調(diào)和口音的聲紋，或者獲得基于語音命令模板中的發(fā)音長短與口音的聲紋，或者獲得基于聲調(diào)、發(fā)音長短和口音的聲紋。
[0041]在確定了聲紋的數(shù)據(jù)處理對象(或稱數(shù)據(jù)來源)后，上述聲紋的獲取步驟為:將語音信號波形的k個樣點的每一幀，或有k個參數(shù)的每一參數(shù)幀，構(gòu)成k維空間中的一個矢量，然后對矢量進行量化。量化時，將k維無限空間劃分為M個區(qū)域邊界，然后將輸入矢量與這些邊界進行比較，并被量化為“距離”最小的區(qū)域邊界的中心矢量值。當然，也可以采用HMM(隱馬爾可夫法)實現(xiàn)對于聲紋的特征提取。
[0042]根據(jù)本發(fā)明的優(yōu)選實施例，比較所述第一聲紋和所述第二聲紋包括:比較基于語音命令模板和語音命令集中的基于聲調(diào)和口音的聲紋，如果匹配，則繼續(xù)比較基于語音命令模板中的發(fā)音長短與口音的聲紋，如果匹配，再比較基于聲調(diào)、發(fā)音長短和口音的聲紋；其中任何匹配不成功都不再繼續(xù)進行后續(xù)比較。
[0043]上述比較過程中，如果基于語音命令模板的聲紋和語音命令集中的聲紋的方差在預(yù)定的閾值之內(nèi)，則認為上述語音命令模板中包括的語音命令是可以被執(zhí)行的，此時，ERP系統(tǒng)將根據(jù)該語音命令集中對應(yīng)的操作指令進行處理，執(zhí)行相應(yīng)的操作。否則，上述音頻通信設(shè)備將收到由ERP系統(tǒng)終端附近的音頻收發(fā)設(shè)備發(fā)出的語音命令無法被執(zhí)行的信息。
[0044]顯然，本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣，倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其同等技術(shù)的范圍之內(nèi)，則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
【權(quán)利要求】
1.一種ERP語音控制方法，其特征在于，包括以下步驟: (1)預(yù)存儲語音命令、語音命令集以及操作指令三者之間的映射關(guān)系； (2)音頻通信設(shè)備接收語音命令，并傳輸給音頻收發(fā)設(shè)備； (3)音頻收發(fā)設(shè)備接收所述語音命令； (4)對所接收的語音命令生成語音命令模板； (5)將語音命令的模板與預(yù)存儲的語音命令集進行匹配；如果相匹配，則根據(jù)所述映射關(guān)系獲取相匹配的語音命令對應(yīng)的操作指令后執(zhí)行該操作指令；否則，向音頻通信設(shè)備提示語音命令無效。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述語音命令集包括多個參考語音模板，所述參考語音模板是根據(jù)對同一命令在聲調(diào)、發(fā)音長短和口音這三方面的多種變化的各種語音產(chǎn)生的。
3.根據(jù)權(quán)利要求1所述的方法，其特征在于，步驟(5)中所述將語音命令的模板與預(yù)存儲的語音命令集進行匹配的方法如下: (a)獲得語音命令模板中的第一聲紋； (b)獲取所述語音命令集中各個參考語音模板的第二聲紋； (c)比較所述第一聲紋和所述第二聲紋，如果相匹配，則匹配成功；否則，匹配失敗。
4.根據(jù)權(quán)利要求1所述的方法，其特征在于，在步驟(3)和步驟(4)之間，還包括對接收到的語音命令進行降噪處理。
5.根據(jù)權(quán)利要求1所述的方法，其特征在于，在步驟(I)中，將所述語音命令分成若干節(jié)，存儲每一節(jié)語音命令的模板。
6.根據(jù)權(quán)利要求5所述的方法，其特征在于，步驟(3)中，如果每一節(jié)語音命令的模板均與預(yù)存儲的相對應(yīng)節(jié)的語音命令的模板相匹配，則獲取該語音命令對應(yīng)的操作指令。
7.根據(jù)權(quán)利要求3所述的方法，其特征在于，獲得所述第一聲紋包括:獲得基于語音命令模板中的聲調(diào)和口音的聲紋，或者獲得基于語音命令模板中的發(fā)音長短與口音的聲紋，或者獲得基于聲調(diào)、發(fā)音長短和口音的聲紋。
8.根據(jù)權(quán)利要求3所述的方法，其特征在于，獲得所述第二聲紋包括:獲得基于語音命令模板中的聲調(diào)和口音的聲紋，或者獲得基于語音命令模板中的發(fā)音長短與口音的聲紋，或者獲得基于聲調(diào)、發(fā)音長短和口音的聲紋。
9.根據(jù)權(quán)利要求3所述的方法，其特征在于，比較所述第一聲紋和所述第二聲紋包括:比較基于語音命令模板和語音命令集中的基于聲調(diào)和口音的聲紋，如果匹配，則繼續(xù)比較基于語音命令模板中的發(fā)音長短與口音的聲紋，如果匹配，再比較基于聲調(diào)、發(fā)音長短和口音的聲紋；其中任何匹配不成功都不再繼續(xù)進行后續(xù)比較。
【文檔編號】G10L17/22GK104200807SQ201410478889
【公開日】2014年12月10日申請日期:2014年9月18日優(yōu)先權(quán)日:2014年9月18日
【發(fā)明者】曹毅申請人:成都博智維訊信息技術(shù)有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：曹毅
技術(shù)所有人：成都博智維訊信息技術(shù)有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

語音合成控制器相關(guān)技術(shù)

蘋果關(guān)閉語音控制相關(guān)技術(shù)

語音控制智能家居相關(guān)技術(shù)

語音控制相關(guān)技術(shù)

汽車語音控制系統(tǒng)相關(guān)技術(shù)

語音控制模塊相關(guān)技術(shù)

蘋果語音控制煩死了相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種erp語音控制方法