一種指令式語音控制發(fā)音詞典輔助生成方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬語音處理技術(shù),模式識(shí)別技術(shù)。
【背景技術(shù)】
[0002]隨著語音識(shí)別技術(shù)的發(fā)展和不斷成熟,語音識(shí)別技術(shù)產(chǎn)品的應(yīng)用領(lǐng)域和范圍在不斷擴(kuò)展,逐漸深入到人們生活、生產(chǎn)的各個(gè)環(huán)節(jié),成為改善生活和工作質(zhì)量、提高效率的重要支撐工具。
[0003]語音識(shí)別技術(shù)的應(yīng)用領(lǐng)域不同,其實(shí)現(xiàn)的方式有所區(qū)別。以互聯(lián)網(wǎng)平臺(tái)為基礎(chǔ)的語音識(shí)別服務(wù)依托于強(qiáng)大的數(shù)據(jù)服務(wù)器和背后龐大的系統(tǒng)維護(hù)專業(yè)團(tuán)隊(duì),能夠?yàn)槿藗兲峁┤粘I罱涣鞯恼Z音服務(wù)。然而對(duì)于各專業(yè)領(lǐng)域的工作系統(tǒng),一般不具備上述條件,適合采用專用的指令式的語音控制操作方式,這種語音控制功能一般不需要日常更新和維護(hù),也不需要大型的服務(wù)器平臺(tái),能夠?qū)崟r(shí)識(shí)別響應(yīng),適合于在各專業(yè)生產(chǎn)領(lǐng)域內(nèi)廣泛應(yīng)用。
[0004]目前的語音識(shí)別技術(shù),在實(shí)現(xiàn)過程中包含兩部分的處理,即語音模型處理和語法模型處理。語音模型處理主要基于連續(xù)HMM模型,識(shí)別出語音的發(fā)音序列,語法模型處理中包含了由各字詞組成語句的語言組織語法規(guī)則。大規(guī)模互聯(lián)網(wǎng)語音識(shí)別應(yīng)用采用無限詞匯,其詞匯和語法規(guī)則需要不斷地維護(hù)和刷新,以適應(yīng)于不斷涌現(xiàn)的新的詞匯和用法;專用系統(tǒng)的語音控制僅僅針對(duì)系統(tǒng)人機(jī)操作本身有限的詞匯,其詞法和語法相對(duì)固定,不需要頻繁刷新維護(hù),因此在語音識(shí)別的實(shí)現(xiàn)技術(shù)上可以采用預(yù)先設(shè)計(jì)定義的詞法和語法結(jié)構(gòu)。其中,發(fā)音字典文件就是定義指令式語音控制目標(biāo)系統(tǒng)指令詞匯及其發(fā)音的專用詞法文件。
[0005]發(fā)音字典文件的基本實(shí)現(xiàn)形式如下:
[0006]a)每個(gè)詞(或短語)為一條記錄,每條記錄包括詞(短語)的漢字碼和發(fā)音兩部分?jǐn)?shù)據(jù);
[0007]b)發(fā)音為該詞(短語)的發(fā)音序列在識(shí)別模型庫(kù)中對(duì)應(yīng)的單音素發(fā)音注記字符組入口 ο
[0008]其中,每個(gè)單音素發(fā)音注記字符是模型庫(kù)對(duì)每個(gè)基本發(fā)音單位的符號(hào)表示,這些注記字符實(shí)際上是與拼音(或國(guó)際音標(biāo))功能相似的另一套音標(biāo)表示方式,語音識(shí)別器使用這些注記字符的組合用于定義所有的語言發(fā)音,同時(shí)也存在著注記字符組合與漢語拼音的一一對(duì)應(yīng)關(guān)系。
[0009]發(fā)音字典在語音識(shí)別中主要應(yīng)用在兩個(gè)方面:其一是在識(shí)別過程中建立識(shí)別出的聲音音素模型與字(詞)和語句之間的映射關(guān)系;其二是用于個(gè)性化自適應(yīng)處理過程中的自適應(yīng)樣本采集和訓(xùn)練腳本。
[0010]發(fā)音字典中包含了語音控制系統(tǒng)所有語音指令中所包含的字詞,其數(shù)量規(guī)模隨實(shí)際應(yīng)用系統(tǒng)而定,復(fù)雜的系統(tǒng)(飛機(jī)駕駛艙控制)可以有近1000條的詞條規(guī)模。
[0011]在指令式語音識(shí)別控制系統(tǒng)開發(fā)過程中,一直采用人工編輯的方式產(chǎn)生發(fā)音字典文件,這需要編輯人員非常熟悉單音素發(fā)音注記字符,一套漢字注記符包含143個(gè)基本音素發(fā)音符號(hào)。對(duì)于一套指令數(shù)量較多的語音控制系統(tǒng),人工編輯發(fā)音字典文件過程中難免會(huì)產(chǎn)生一些錯(cuò)誤,需要反復(fù)的測(cè)試來查找修正這些錯(cuò)誤,耗費(fèi)較多的人力和時(shí)間。
[0012]本發(fā)明面向中大詞匯量的語音控制產(chǎn)品,利用該發(fā)明可以有效降低語音控制產(chǎn)品開發(fā)過程的工作量,降低實(shí)現(xiàn)難度,并能夠保證語音控制產(chǎn)品的開發(fā)質(zhì)量,降低對(duì)相關(guān)開發(fā)人員的專業(yè)性要求,實(shí)現(xiàn)語音控制產(chǎn)品開發(fā)人力資源的合理利用,也有助于提高產(chǎn)品開發(fā)效率、縮短產(chǎn)品開發(fā)周期,進(jìn)而產(chǎn)生良好的經(jīng)濟(jì)效益。
【發(fā)明內(nèi)容】
[0013]此項(xiàng)發(fā)明的目的在于提供一種指令式語音控制發(fā)音詞典輔助生成方法,將人工全手動(dòng)輸入編輯發(fā)音字典文件的方式轉(zhuǎn)變成計(jì)算機(jī)輔助生成方式,有效降低語音控制產(chǎn)品開發(fā)、測(cè)試、修改過程的工作量,消除產(chǎn)生人為差錯(cuò)的可能性,提高語音控制產(chǎn)品的開發(fā)質(zhì)量和效率,節(jié)省人力資源、縮短產(chǎn)品開發(fā)周期。
[0014]本發(fā)明的發(fā)明目的通過以下技術(shù)方案實(shí)現(xiàn):
[0015]—種指令式語音控制發(fā)音詞典輔助生成方法,包含以下步驟:
[0016]a)向計(jì)算機(jī)程序輸入語音指令漢字字符串及該語音指令漢字字符串對(duì)應(yīng)的音調(diào)信息;
[0017]b)計(jì)算機(jī)程序按語音指令漢字字符串中字符出現(xiàn)的依次將語音指令漢字字符轉(zhuǎn)換為對(duì)應(yīng)的語首指令拼首字符;
[0018]c)計(jì)算機(jī)程序?qū)⒄Z音指令拼音字符轉(zhuǎn)換為語音指令音素發(fā)音注記字符;
[0019]d)由計(jì)算機(jī)程序在語音控制發(fā)音字典文件中添加語音指令漢字字符及該語音指令漢字字符對(duì)應(yīng)的音素發(fā)音注記字符。
[0020]本發(fā)明的有益效果在于:
[0021]通過使用該發(fā)明,語音控制發(fā)音字典文件的計(jì)算機(jī)處理生成效率比全人工編輯提高3倍以上,不會(huì)產(chǎn)生差錯(cuò),免除了針對(duì)語音控制發(fā)音字典文件的錯(cuò)誤查找和修正,降低了語音控制產(chǎn)品的整體缺陷故障因素。
【附圖說明】
[0022]圖1為本發(fā)明的實(shí)例界面;
[0023]圖2為本發(fā)明的實(shí)施流程圖。
[0024]具體實(shí)現(xiàn)方式
[0025]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述。
[0026]1、操作界面與基本處理流程
[0027]操作界面的形式如附圖1所示。
[0028]其中,文件管理菜單中實(shí)現(xiàn)文件創(chuàng)建、文件打開、文件保存的功能;在查找修改菜單中實(shí)現(xiàn)添加、查找及修改字典內(nèi)容的功能選擇;查找結(jié)果框中顯示查找指定指令詞或短語有無的結(jié)果;添加詞條按鈕用于選擇添加新的指令詞或短語;確認(rèn)按鈕用于確認(rèn)當(dāng)前指令詞發(fā)音標(biāo)注碼的生成結(jié)束;添加停頓按鈕用于選擇是否在指令詞發(fā)音標(biāo)注碼尾部添加停頓標(biāo)注。詞條輸入框用于輸入指令詞條漢字字符串;字音選擇按鈕框?qū)@示出當(dāng)前處理字符的所有拼音發(fā)音,提供操作者加以選擇,三角箭頭按鈕用于在輸入的指令字符串中選擇當(dāng)前處理的字符;發(fā)音注記框顯示出當(dāng)前已處理字符的發(fā)音注記轉(zhuǎn)換結(jié)果。
[0029]整體的基本處理流程如附圖2所示。對(duì)于每一個(gè)輸入的指令詞或短語字符串,按照每個(gè)漢字在該字符串中出現(xiàn)的順序逐一人工確定其在指令中的發(fā)音,計(jì)算機(jī)程序?qū)⒃摪l(fā)音的拼音轉(zhuǎn)換成相應(yīng)的音素發(fā)音注記符,順序拼接各音素發(fā)音注記符形成與指令字符串相對(duì)應(yīng)的因素發(fā)音注記符串,再根據(jù)實(shí)際需要選擇在其末尾處添加停頓注記符,完成一條指令詞或短語的音素發(fā)音注記符轉(zhuǎn)換處理。
[0030]2、漢字字符與拼音字符串的轉(zhuǎn)換
[0031]本發(fā)明實(shí)例中,漢字字符串與拼音字符串的轉(zhuǎn)換,主要用于選擇漢字在語音指令中的實(shí)際發(fā)音,并獲得相應(yīng)的拼音表示字符串。
[0032]本發(fā)明在實(shí)現(xiàn)過程中使用帶有音調(diào)標(biāo)注的漢字-拼音對(duì)照表,可用漢字字符查找出其對(duì)應(yīng)的所有發(fā)音的拼音字符串及其音調(diào)標(biāo)注。其中,漢字-拼音對(duì)照表可以在互聯(lián)網(wǎng)的相關(guān)網(wǎng)站獲得。其查找方法可根據(jù)該表的編排規(guī)律自行確定。
[0033]3、拼音字符串與音素發(fā)音注記字符串的轉(zhuǎn)換
[0034]本發(fā)明實(shí)例中,拼音字符串與音素發(fā)音注記字符串的轉(zhuǎn)換是利用拼音-注記符對(duì)照表,可用拼音查找出其相應(yīng)的音素發(fā)音注記符字符串。該表是和語音模型庫(kù)配套的數(shù)據(jù)文件,共有1000多條記錄,包含了所有漢語中出現(xiàn)的發(fā)音拼音,每條記錄中包含了帶聲調(diào)的拼音字符串和相對(duì)應(yīng)的音素發(fā)音注記符字符串,其查找方法可根據(jù)該表的編排規(guī)律自行確定。
[0035]可以理解的是,對(duì)本領(lǐng)域普通技術(shù)人員來說,可以根據(jù)本發(fā)明的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,而所有這些改變或替換都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。
【主權(quán)項(xiàng)】
1.一種指令式語音控制發(fā)音詞典輔助生成方法,包含以下步驟: a)向計(jì)算機(jī)程序輸入語音指令漢字字符串及該語音指令漢字字符串對(duì)應(yīng)的音調(diào)信息; b)計(jì)算機(jī)程序按語音指令漢字字符串中字符出現(xiàn)的依次將語音指令漢字字符轉(zhuǎn)換為對(duì)應(yīng)的語首指令拼首字符; c)計(jì)算機(jī)程序?qū)⒄Z音指令拼音字符轉(zhuǎn)換為語音指令音素發(fā)音注記字符; d)由計(jì)算機(jī)程序在語音控制發(fā)音字典文件中添加語音指令漢字字符及該語音指令漢字字符對(duì)應(yīng)的音素發(fā)音注記字符。
【專利摘要】本發(fā)明公開了一種指令式語音控制發(fā)音詞典輔助生成方法,包含以下步驟:a)向計(jì)算機(jī)程序輸入語音指令漢字字符串及該語音指令漢字字符串對(duì)應(yīng)的音調(diào)信息;b)計(jì)算機(jī)程序?qū)⒄Z音指令漢字字符串轉(zhuǎn)換為對(duì)應(yīng)的語音指令拼音字符串;c)計(jì)算機(jī)程序?qū)⒄Z音指令拼音字符串轉(zhuǎn)換為語音指令音素發(fā)音注記字符串;d)由計(jì)算機(jī)程序在語音控制發(fā)音字典文件中添加語音指令漢字字符及該語音指令漢字字符對(duì)應(yīng)的音素發(fā)音注記字符串。本發(fā)明將人工全手動(dòng)輸入編輯發(fā)音字典文件的方式轉(zhuǎn)變成計(jì)算機(jī)輔助生成方式,有效降低語音控制產(chǎn)品開發(fā)、測(cè)試、修改過程的工作量。
【IPC分類】G10L15/22, G10L15/26, G10L15/00
【公開號(hào)】CN105225659
【申請(qǐng)?zhí)枴緾N201510574070
【發(fā)明人】原帥, 須明
【申請(qǐng)人】中國(guó)航空無線電電子研究所
【公開日】2016年1月6日
【申請(qǐng)日】2015年9月10日