一種利用漢語數(shù)碼語音輸入計算機指令的方法及裝置的制造方法
【專利說明】一種利用漢語數(shù)碼語音輸入計算機指令的方法及裝置 1技術(shù)領(lǐng)域
[0001] 本發(fā)明公開一種利用漢語數(shù)碼語音輸入計算機指令的方法及裝置,主要用于工業(yè) 設(shè)備、交通設(shè)備、軍事設(shè)備(以下統(tǒng)稱重要設(shè)備)的精準語音操控,也用于各種智能手機、平 板電腦、家用電器和可穿戴設(shè)備的語音操控,屬于信息通信技術(shù)領(lǐng)域。 2【背景技術(shù)】
[0002] 對重要設(shè)備進行精準語音控制,需要滿足下列要求:
[0003] 第一,準確性。重要設(shè)備的語音控制指令識別精準度必須達到100%,不允許出現(xiàn) 任何誤操作。
[0004] 第二,實時性。重要設(shè)備的語音控制指令必須實時發(fā)出,不允許出現(xiàn)任何延遲操 作。
[0005] 第三,簡短性。重要設(shè)備的語音控制指令必須簡短明確,不允許出現(xiàn)任何含糊冗長 指令。
[0006] 第四,抗噪性。重要設(shè)備的語音控制指令必須發(fā)音洪亮清晰,與環(huán)境噪音有著顯著 區(qū)別。
[0007] 第五,極端性。重要設(shè)備的語音控制指令必須適應(yīng)各種極端環(huán)境條件(如網(wǎng)絡(luò)中 斷、人員負傷等)。
[0008] 基于下列原因,漢語語音(指包括漢語拼音全部音節(jié))控制技術(shù)無法滿足上述要 求,因而難以應(yīng)用在重要設(shè)備上。
[0009] 第一,漢語語音識別無論如何努力都做不到100%的識別率,這無疑是漢語語音技 術(shù)應(yīng)用于工業(yè)、交通、軍事領(lǐng)域的一個最大痛點。
[0010] 第二,漢語語音控制需要選擇、確定、重復(fù)等復(fù)雜的步驟與操作,還要用手動方式 發(fā)出語音指令起始信號和結(jié)束信號,這些都難以符合實時性要求。
[0011] 第三,漢語同音字詞多,識別率低,雖然通過一段話語來與重要設(shè)備進行交流能夠 大幅度提高識別率,卻不符合簡短性要求。
[0012] 第四,漢語各個音節(jié)的識別率并不完全相同,一些單音節(jié)(如"a""yi" "mi")在 噪聲環(huán)境中識別率很低,不符合抗噪性要求。
[0013] 第五,目前,在線漢語語音識別率已經(jīng)達到很高的精準度,但在單機交互情景中, 還達不到類似精準度,不符合極端性要求。
[0014] 滿足上述精準語音控制要求的充分必要條件是:
[0015] 第一,必須最大限度地減少語音數(shù)量。語音數(shù)量愈多,識別難度就愈大,識別精準 度就愈低,反之亦然。
[0016] 第二,必須增加各個語音之間的區(qū)分度。各個語音之間的區(qū)分度愈高,識別精準度 就愈高,反之亦然。
[0017] 第三,必須采用統(tǒng)一、規(guī)范的語音控制指令格式,這樣才能被計算機準確地識別, 并且無需用手動方式發(fā)出語音指令起始信號和結(jié)束信號,讓聲控系統(tǒng)隨時處于"待命"狀 O
[0018] 第四,必須徹底消除同音語音指令,即兩個語音指令的發(fā)音不能相同或相近,否則 容易引起誤操作。
[0019] 第五,必須能夠校驗語音指令的正確性,即通過增加一位用于校驗的語音,讓聲控 系統(tǒng)能夠自動驗證語音指令的正確性。
[0020] 本發(fā)明人所研發(fā)的漢語數(shù)碼語音指令系統(tǒng),通過將漢語語音指令轉(zhuǎn)換為數(shù)碼語音 指令,并對部分漢語數(shù)碼讀音所進行的修訂,制定包括拼形規(guī)則、數(shù)碼規(guī)則、語音規(guī)則、替代 規(guī)則、校驗規(guī)則、組合規(guī)則、導(dǎo)引規(guī)則在內(nèi)的一整套漢語數(shù)碼語音指令輸入規(guī)則,使之滿足 了上述重要設(shè)備對語音控制的要求及其充分必要條件。 3
【發(fā)明內(nèi)容】
[0021] 3. 1將漢語語音指令轉(zhuǎn)換為數(shù)碼語音指令
[0022] 將漢語語音指令轉(zhuǎn)換為數(shù)碼語音指令,依據(jù)的是基于《漢字拼形方案所形成的漢 字拼形技術(shù),這一技術(shù)的核心內(nèi)容是將漢字看做是由八個漢字字母構(gòu)成的。
[0023] 將漢語語音指令轉(zhuǎn)換為數(shù)碼語音指令是分四步完成的:
[0024] 第一步:從構(gòu)成計算機指令的漢字中提取特征漢字字母,組成漢字字母指令,將漢 字字符指令轉(zhuǎn)換為漢字字母指令;
[0025] 第二步:將漢字字母表示為數(shù)碼,將漢字字母指令轉(zhuǎn)換為漢字數(shù)碼指令;
[0026] 第三步:對漢字數(shù)碼指令進行替換、校驗、組合、導(dǎo)引,生成具有不同功能、應(yīng)用于 不同場合的漢字數(shù)碼指令。
[0027] 第四步:讀出漢字數(shù)碼指令,生成漢語數(shù)碼語音指令。
[0028] 漢語數(shù)碼語音只有10個,而漢語語音則有1100多個(含四聲),前者不足后者的 百分之一。
[0029] 漢字拼形技術(shù)提供了這樣一種簡單實用的轉(zhuǎn)換方法,將由3000多個常用字組合 而成的漢字字符指令轉(zhuǎn)換為由8個數(shù)碼組合而成的漢字數(shù)碼指令,將由1100多個漢語語音 組合而成的漢語語音指令轉(zhuǎn)換為僅由10個漢語數(shù)碼語音組合而成的漢語數(shù)碼語音指令, 而且這些漢字字符指令、漢字數(shù)碼指令和漢語數(shù)碼語音指令之間存在著一一對應(yīng)關(guān)系。
[0030] 附圖4~附圖6為《智能手機常用漢字數(shù)碼指令表》,其中每個漢字字符指令與漢 字數(shù)碼指令之間都是一一對應(yīng)的。
[0031] 通過這一轉(zhuǎn)換,即使采用通用算法,即利用漢語語音識別軟件去識別漢語數(shù)碼語 音,其識別精準度也會大幅提升;若是采用專用算法,漢語數(shù)碼語音的識別精準度要遠遠超 過漢語語音的識別精準度。
[0032] 本發(fā)明與發(fā)明人已申請國家發(fā)明專利的《一種利用漢字拼形手勢輸入計算機指令 的方法》(申請?zhí)枮?01410214836. 1)和已獲得國家發(fā)明專利的《漢字數(shù)字化輸入法》(專 利號為ZL03155247. 1),都是基于同一《漢字拼形方案》。所不同的是,前兩者定義了八個漢 字字母,用于輸入計算機指令,本發(fā)明是利用漢語數(shù)碼語音來輸入計算機指令,另一個發(fā)明 則是利用漢字拼形手勢來輸入計算機指令,后者定義了九個漢字字母,用于在數(shù)字鍵盤上 輸入常用漢字及其詞語。
[0033] 3. 2本發(fā)明定義的漢字字母
[0034] 本發(fā)明總共定義了八種漢字字母,其中一畫字母有"一畫橫""一畫豎" "一畫 撇""一畫捺",兩畫字母有"兩畫橫""兩畫豎""兩畫撇" "兩畫捺"。
[0035] 八種漢字字母的定義如下:
[0036] 將以橫結(jié)尾的單個筆畫定義為"一畫橫";
[0037] 將以豎結(jié)尾