一種用于錄音筆的語音特征提取控制方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種用于錄音筆的語音特征提取控制方法,屬于錄音筆控制的技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002]數(shù)碼錄音筆,也稱為數(shù)碼錄音棒或數(shù)碼錄音機(jī),數(shù)字錄音器的一種,為了便于操作和提升錄音質(zhì)量造型并非以單純的筆型為主,攜帶方便,同時(shí)擁有多種功能,如激光筆功能、FM調(diào)頻、MP3播放等。與傳統(tǒng)錄音機(jī)相比,數(shù)碼錄音筆是通過數(shù)字存儲(chǔ)的方式來記錄音頻的。
[0003]其過程原理是,數(shù)碼錄音筆通過對(duì)模擬信號(hào)的采樣、編碼將模擬信號(hào)通過數(shù)模轉(zhuǎn)換器轉(zhuǎn)換為數(shù)字信號(hào),并進(jìn)行一定的壓縮后進(jìn)行存儲(chǔ)。而數(shù)字信號(hào)即使經(jīng)過多次復(fù)制,聲音信息也不會(huì)受到損失,保持原樣不變。
[0004]因?yàn)槭卿浺粼O(shè)備,錄音時(shí)間的長短自然是數(shù)碼錄音筆最重要的技術(shù)指標(biāo)。根據(jù)不同產(chǎn)品之間閃存容量、壓縮算法的不同,錄音時(shí)間的長短也有很大的差異。內(nèi)存為IG的數(shù)碼錄音筆的錄音存儲(chǔ)時(shí)間在都在20-272小時(shí),電池連續(xù)工作時(shí)間一般在2-26小時(shí)左右,可以滿足大多數(shù)人的需要。不過需注意的是,如果很長的錄音時(shí)間是由于其通過使用了高壓縮率獲得的話,往往會(huì)影響錄音的質(zhì)量。
[0005]因此,使得錄音筆錄音方式壓縮率十分低,音質(zhì)非常好,但容量比較大,一般適合要求較高的場(chǎng)合使用,例如為重要講話作存檔式的記錄等。
[0006]雖然現(xiàn)有的錄音筆在錄音過程中,實(shí)現(xiàn)其功能,但是其仍然存在問題。如申請(qǐng)?zhí)?201310710630.3申請(qǐng)日:2013-12-20的文件中,公開了“一種具有溫濕度計(jì)的錄音筆,它包括錄音筆本體,其特征在于:錄音筆本體的前表面有顯示屏及功能按鍵,錄音筆本體的后表面有溫濕度計(jì),溫濕度計(jì)與錄音筆本體內(nèi)部電源的輸出電路相連”。該錄音筆由于將溫濕度計(jì)集成到了錄音筆本體上,增加了錄音筆的戶外實(shí)用性,戶外旅行時(shí)不僅能夠通過錄音筆錄制語音游記,還能隨時(shí)了解空氣中的溫濕度信息,更具溫濕度信息能夠正確攜帶相應(yīng)的裝備。
[0007]而在另外一篇申請(qǐng)?zhí)?201520029314.4申請(qǐng)日:2015-01-15的文件中,公開了“一種雙存儲(chǔ)的錄音筆,所述錄音筆包括麥克風(fēng)、音頻編解碼模塊、存儲(chǔ)控制電路和第一存儲(chǔ)介質(zhì),其中:所述麥克風(fēng)用于將接收的語音信號(hào)轉(zhuǎn)化為模擬音頻信號(hào);所述音頻編解碼模塊與所述麥克風(fēng)連接,對(duì)接收到的模擬音頻信號(hào)進(jìn)行采樣并且編碼為數(shù)字音頻信號(hào);所述存儲(chǔ)控制電路與所述音頻編解碼模塊相連接,基于編碼的數(shù)字音頻信號(hào)生成錄音文件,并且將所述錄音文件寫入到所述第一存儲(chǔ)介質(zhì)和第二存儲(chǔ)介質(zhì);所述第一存儲(chǔ)介質(zhì),與所述存儲(chǔ)控制電路相連接,用于存儲(chǔ)所述錄音文件”,該實(shí)用新型的實(shí)施例雙存儲(chǔ)的錄音筆能夠在兩個(gè)存儲(chǔ)介質(zhì)中同時(shí)保存錄音文件,提高了錄音文件的安全性。
[0008]雖然上述文獻(xiàn)對(duì)錄音筆做出改進(jìn),使得功能更加完善。但是其在實(shí)際運(yùn)用過程中,仍然存在缺陷?,F(xiàn)有的錄音筆在使用中,只能執(zhí)行語音錄入功能,而無法對(duì)語音進(jìn)行關(guān)鍵字提取,用戶需要聽取錄音才能獲知其內(nèi)容,而錄音筆無法自動(dòng)提取頻率出現(xiàn)多次的語音特征,由此不具備自動(dòng)檢測(cè)識(shí)別功能,降低使用效率。
【發(fā)明內(nèi)容】
[0009]本發(fā)明所要解決的技術(shù)問題在于克服現(xiàn)有技術(shù)的不足,提供一種用于錄音筆的語音特征提取控制方法,解決現(xiàn)有的錄音筆不具備自動(dòng)檢測(cè)識(shí)別功能、無法自動(dòng)提取頻率出現(xiàn)多次的語音特征的問題。
[0010]本發(fā)明具體采用以下技術(shù)方案解決上述技術(shù)問題:
一種用于錄音筆的語音特征提取控制方法,包括以下步驟:
步驟1、輸入語音信號(hào);
步驟2、對(duì)所輸入的語音信號(hào)進(jìn)行檢測(cè)和識(shí)別,獲得語音特征并進(jìn)行寄存;
步驟3、連續(xù)對(duì)輸入的語音信號(hào)進(jìn)行識(shí)別,當(dāng)語音信號(hào)中再次出現(xiàn)已寄存的語音特征時(shí),對(duì)該語音特征進(jìn)行頻率累計(jì);
步驟4、判斷檢測(cè)的語音信號(hào)是否結(jié)束,當(dāng)語音信號(hào)檢測(cè)未結(jié)束時(shí)返回步驟2 ;當(dāng)語音信號(hào)檢測(cè)結(jié)束時(shí),執(zhí)行步驟5;
步驟5、在語音信號(hào)檢測(cè)結(jié)束后,提取出頻率累計(jì)最高的語音特征;
步驟6、將步驟5所提取的語音特征作為語音信號(hào)的關(guān)鍵字輸出。
[0011]進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟2中獲得至少兩個(gè)語音特征。
[0012]進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟3還包括將語音特征的頻率累計(jì)進(jìn)行對(duì)比,獲得頻率累計(jì)最高的語音特征。
[0013]進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟5將所提取的語音特征生成文本后作為語音信號(hào)的關(guān)鍵字輸出。
[0014]進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟5還包括將所提取的語音特征生成語音信號(hào)的文件名,及將語音信號(hào)以該文件名進(jìn)行輸出。
[0015]本發(fā)明采用上述技術(shù)方案,能產(chǎn)生如下技術(shù)效果:
(I)本發(fā)明所提供的用于錄音筆的語音特征提取控制方法,通過對(duì)輸入的語音信號(hào)進(jìn)行檢測(cè)和識(shí)別,獲得語音特征并進(jìn)行累計(jì),在檢測(cè)的語音信號(hào)結(jié)束時(shí),提取出頻率累計(jì)最高的語音特征,并將其作為語音信號(hào)的關(guān)鍵字輸出,由此使得語音信號(hào)不僅可以錄入,還能自動(dòng)檢測(cè)和識(shí)別,自動(dòng)提取關(guān)鍵字,使得用戶在查看音頻文件時(shí),無需逐個(gè)打開文件,即可獲知語音信號(hào)的關(guān)鍵字,使得語音信號(hào)處理過程更加智能化,方便用戶對(duì)音頻文件的分辨;有效解決現(xiàn)有的錄音筆不具備自動(dòng)檢測(cè)識(shí)別功能、無法自動(dòng)提取頻率出現(xiàn)多次的語音特征的問題。
【附圖說明】
[0016]圖1為本發(fā)明用于錄音筆的語音特征提取控制方法的流程示意圖。
【具體實(shí)施方式】
[0017]下面結(jié)合說明書附圖,對(duì)本發(fā)明的實(shí)施方式進(jìn)行描述。
[0018]如圖1所示,本發(fā)明提供了一種用于錄音筆的語音特征提取控制方法,該方法具體包括以下步驟:
步驟1、輸入語音信號(hào);
步驟2、對(duì)所輸入的語音信號(hào)進(jìn)行檢測(cè)和識(shí)別,獲得語音特征并進(jìn)行寄存;
步驟3、連續(xù)對(duì)輸入的語音信號(hào)進(jìn)行識(shí)別,當(dāng)語音信號(hào)中再次出現(xiàn)已寄存的語音特征時(shí),對(duì)該語音特征進(jìn)行頻率累計(jì);
步驟4、判斷檢測(cè)的語音信號(hào)是否結(jié)束,當(dāng)語音信號(hào)檢測(cè)未結(jié)束時(shí)返回步驟2 ;當(dāng)語音信號(hào)檢測(cè)結(jié)束時(shí),執(zhí)行步驟5;
步驟5、在語音信號(hào)檢測(cè)結(jié)束后,提取出頻率累計(jì)最高的語音特征;
步驟6、將步驟5所提取的語音特征作為語音信號(hào)的關(guān)鍵字輸出。
[0019]由此,在檢測(cè)的語音信號(hào)結(jié)束時(shí),提取出頻率累計(jì)最高的語音特征,并將其作為語音信號(hào)的關(guān)鍵字輸出,由此使得語音信號(hào)不僅可以錄入,還能自動(dòng)檢測(cè)和識(shí)別,自動(dòng)提取關(guān)鍵字。
[0020]進(jìn)一步地,本發(fā)明的方法在實(shí)施時(shí),步驟2中獲得的語音特征至少兩個(gè),即當(dāng)識(shí)別出一個(gè)語音特征時(shí)進(jìn)行寄存,在獲得另外一個(gè)或多個(gè)語音特征時(shí)分別寄存;而至少為兩個(gè)可以使得識(shí)別過程更加靈敏。多個(gè)語音特征方式下,分別逐個(gè)識(shí)別后對(duì)應(yīng)其頻率值,出現(xiàn)I次則記錄為1,出現(xiàn)4次則為4,出現(xiàn)N次則為N。
[0021]并且,所述步驟3在進(jìn)行頻率累計(jì)的過程還可以包括將語音特征的頻率累計(jì)進(jìn)行對(duì)比,如將語音特征A獲得的頻率累計(jì)數(shù)3和語音特征B獲得的頻率累計(jì)數(shù)7進(jìn)行對(duì)比,獲得語音特征B獲得的頻率累計(jì)數(shù)7為最高;實(shí)現(xiàn)對(duì)比過程,使得提取過程更加精準(zhǔn),
在此基礎(chǔ)上,本發(fā)明的控制方法中還可以在所述步驟5中進(jìn)一步改進(jìn),將所提取的語音特征生成文本后作為語音信號(hào)的關(guān)鍵字輸出。即系統(tǒng)每生成一個(gè)音頻文件,則自動(dòng)生成對(duì)應(yīng)文本,文本內(nèi)容即關(guān)鍵字內(nèi)容,關(guān)鍵字即所提取的語音特征,文本可以與音頻文件設(shè)定成綁定模式,使得用戶在選擇音頻文件時(shí),自動(dòng)將文本彈出,便于用戶查看該段音頻的主要內(nèi)容。
[0022]更進(jìn)一步地,在上述過程中,所述步驟5還可以包括將所提取的語音特征生成語音信號(hào)的文件名,及將語音信號(hào)以該文件名進(jìn)行輸出;即直接將語音特征作為該音頻文件的文件名,使得用戶可以快速解讀獲知該音頻的主要內(nèi)容。
[0023]綜上,本發(fā)明所提供的用于錄音筆的語音特征提取控制方法,使得語音信號(hào)不僅可以錄入,還能自動(dòng)檢測(cè)和識(shí)別,自動(dòng)提取關(guān)鍵字,使得用戶在查看音頻文件時(shí),無需逐個(gè)打開文件,即可獲知語音信號(hào)的關(guān)鍵字,使得語音信號(hào)處理過程更加智能化,方便用戶對(duì)音頻文件的分辨;有效解決現(xiàn)有的錄音筆不具備自動(dòng)檢測(cè)識(shí)別功能、無法自動(dòng)提取頻率出現(xiàn)多次的語音特征的問題。
[0024]上面結(jié)合附圖對(duì)本發(fā)明的實(shí)施方式作了詳細(xì)說明,但是本發(fā)明并不限于上述實(shí)施方式,在本領(lǐng)域普通技術(shù)人員所具備的知識(shí)范圍內(nèi),還可以在不脫離本發(fā)明宗旨的前提下做出各種變化。
【主權(quán)項(xiàng)】
1.一種用于錄音筆的語音特征提取控制方法,其特征在于,包括以下步驟: 步驟1、輸入語音信號(hào); 步驟2、對(duì)所輸入的語音信號(hào)進(jìn)行檢測(cè)和識(shí)別,獲得語音特征并進(jìn)行寄存; 步驟3、連續(xù)對(duì)輸入的語音信號(hào)進(jìn)行識(shí)別,當(dāng)語音信號(hào)中再次出現(xiàn)已寄存的語音特征時(shí),對(duì)該語音特征進(jìn)行頻率累計(jì); 步驟4、判斷檢測(cè)的語音信號(hào)是否結(jié)束,當(dāng)語音信號(hào)檢測(cè)未結(jié)束時(shí)返回步驟2 ;當(dāng)語音信號(hào)檢測(cè)結(jié)束時(shí),執(zhí)行步驟5; 步驟5、在語音信號(hào)檢測(cè)結(jié)束后,提取出頻率累計(jì)最高的語音特征; 步驟6、將步驟5所提取的語音特征作為語音信號(hào)的關(guān)鍵字輸出。2.根據(jù)權(quán)利要求1所述用于錄音筆的語音特征提取控制方法,其特征在于:所述步驟2中獲得至少兩個(gè)語音特征。3.根據(jù)權(quán)利要求1所述用于錄音筆的語音特征提取控制方法,其特征在于:所述步驟3還包括將語音特征的頻率累計(jì)進(jìn)行對(duì)比,獲得頻率累計(jì)最高的語音特征。4.根據(jù)權(quán)利要求1所述用于錄音筆的語音特征提取控制方法,其特征在于:所述步驟5將所提取的語音特征生成文本后作為語音信號(hào)的關(guān)鍵字輸出。5.根據(jù)權(quán)利要求1所述用于錄音筆的語音特征提取控制方法,其特征在于:所述步驟5還包括將所提取的語音特征生成語音信號(hào)的文件名,及將語音信號(hào)以該文件名進(jìn)行輸出。
【專利摘要】本發(fā)明公開了一種用于錄音筆的語音特征提取控制方法,包括:輸入語言信號(hào);對(duì)所輸入的語音信號(hào)進(jìn)行檢測(cè)和識(shí)別,獲得語音特征并進(jìn)行寄存;連續(xù)對(duì)輸入的語音信號(hào)進(jìn)行識(shí)別,當(dāng)再次出現(xiàn)已寄存的語音特征時(shí),對(duì)該語音特征進(jìn)行頻率累計(jì);判斷檢測(cè)的語音信號(hào)是否結(jié)束,當(dāng)語音信號(hào)檢測(cè)未結(jié)束時(shí)返回識(shí)別步驟;當(dāng)語音信號(hào)檢測(cè)結(jié)束時(shí),執(zhí)行提取步驟;在語音信號(hào)檢測(cè)結(jié)束后,提取出頻率累計(jì)最高的語音特征;將所提取的語音特征作為語言信號(hào)的關(guān)鍵字輸出。本發(fā)明不僅可以錄入,還能自動(dòng)檢測(cè)和識(shí)別,自動(dòng)提取關(guān)鍵字,使得用戶在查看音頻文件時(shí),無需逐個(gè)打開文件,即可獲知語音信號(hào)的關(guān)鍵字,使得語音信號(hào)處理過程更加智能化,方便用戶對(duì)音頻文件的分辨。
【IPC分類】G10L15/02
【公開號(hào)】CN105023571
【申請(qǐng)?zhí)枴緾N201510447252
【發(fā)明人】馮方敏
【申請(qǐng)人】蘇州宏展信息科技有限公司
【公開日】2015年11月4日
【申請(qǐng)日】2015年7月28日