亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種快速檢測(cè)單頻提示音的方法及系統(tǒng)的制作方法

文檔序號(hào):8413623閱讀:3507來(lái)源:國(guó)知局
一種快速檢測(cè)單頻提示音的方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種快速檢測(cè)單頻提示音的方法及系 統(tǒng)。
【背景技術(shù)】
[0002] 當(dāng)前,帶有語(yǔ)音轉(zhuǎn)寫(xiě)功能的app在智能手機(jī)上如雨后春筍般出現(xiàn),人們?cè)絹?lái)習(xí)慣 使用語(yǔ)音輸入獲取自己想要的信息。一個(gè)典型的語(yǔ)音信息獲取一般包含這些步驟:
[0003] 1.用戶點(diǎn)擊觸屏按鈕O伴隨著單頻提示音,系統(tǒng)開(kāi)始錄音;
[0004] 2.當(dāng)用戶語(yǔ)音輸入完畢,或者再次點(diǎn)擊按鈕,或者系統(tǒng)檢測(cè)到靜音自動(dòng)停止,同時(shí) 將語(yǔ)音送往云端(或者本地)進(jìn)行語(yǔ)音識(shí)別;
[0005] 3.拿到識(shí)別結(jié)果并進(jìn)行后續(xù)處理(智能對(duì)話部分,在此不詳細(xì)贅述);
[0006] 4.最終用戶獲得期望的信息結(jié)果。
[0007] 很多語(yǔ)音助手類app應(yīng)用,或者具有自動(dòng)轉(zhuǎn)寫(xiě)功能的app應(yīng)用里,當(dāng)按下開(kāi)始說(shuō)話 按鍵后,通常會(huì)有個(gè)提示說(shuō)話音,此聲音一般為幾個(gè)(通常不多于3)單頻聲音的結(jié)合。這 些聲音很容易在錄入的聲音開(kāi)頭(由于智能手機(jī)錄音的機(jī)制,這種提示音被錄入的幾率很 大),被識(shí)別為語(yǔ)音(如一些app應(yīng)用語(yǔ)音輸入時(shí),其經(jīng)常會(huì)在第一個(gè)字前面插入一些"啊 俄"等插入詞),從而影響語(yǔ)音轉(zhuǎn)寫(xiě)的正確率。在1中,一般播放提示音和錄音是同時(shí)進(jìn)行, 這樣,在語(yǔ)音開(kāi)頭很容易出現(xiàn)完整的或者部分提示音。這部分開(kāi)頭的提示音對(duì)識(shí)別過(guò)程有 兩個(gè)不利的因素:
[0008] a.語(yǔ)音識(shí)別作為模式識(shí)別的一種,是對(duì)某種模式進(jìn)行建模,初始的提示音會(huì)與聲 學(xué)模型中各種模型進(jìn)行匹配,找到其中最像的模型,因此,在提示音階段,很容易被誤識(shí)別 為一些哼哼哈哈這樣的文字,從而影響識(shí)別率;
[0009] b.提示音的特征與聲學(xué)模型的靜音模型相差比較大,在識(shí)別解碼過(guò)程中很容易識(shí) 別成為語(yǔ)音,從而增加插入錯(cuò)誤。
[0010] 現(xiàn)有應(yīng)用針對(duì)這種提示音的去除并沒(méi)有很好的辦法,一般是直接去掉語(yǔ)音前面的 N幀語(yǔ)音(一般提示音的長(zhǎng)度是已知的),但是這樣做會(huì)存在一個(gè)風(fēng)險(xiǎn):由于一般錄音線程 是單獨(dú)啟動(dòng),很多時(shí)候不是100%的概率可以錄入全部提示音,或者只有一部分提示音,這 樣就有可能將正常的語(yǔ)音或者語(yǔ)音前面的靜音切掉,這對(duì)語(yǔ)音識(shí)別系統(tǒng)是災(zāi)難性的。
[0011] 對(duì)此單頻類提示音必須檢測(cè)出并去除掉。本發(fā)明針對(duì)此種應(yīng)用場(chǎng)景,提出一種快 速檢測(cè)單頻提示音的方法及系統(tǒng)。

【發(fā)明內(nèi)容】

[0012] 本發(fā)明所要解決的技術(shù)問(wèn)題是針對(duì)現(xiàn)有技術(shù)的不足,提供一種快速檢測(cè)單頻提示 音的方法及系統(tǒng)。
[0013] 本發(fā)明解決上述技術(shù)問(wèn)題的技術(shù)方案如下:一種快速檢測(cè)單頻提示音的方法,包 括如下步驟:
[0014] 步驟1,確定參考單頻信號(hào),根據(jù)參考單頻信號(hào)確定搜索頻率范圍為Pmin至P max,所 述參考單頻頻率在該范圍內(nèi);
[0015] 步驟2,根據(jù)參考單頻信號(hào)的長(zhǎng)度截取相應(yīng)長(zhǎng)度的待檢測(cè)信號(hào);
[0016] 步驟3,根據(jù)搜索頻率范圍計(jì)算待檢測(cè)信號(hào)的自相關(guān)函數(shù)Ck;
[0017] 步驟4,在待檢測(cè)信號(hào)的每幀信號(hào)的自相關(guān)函數(shù)Ck上,搜索預(yù)定數(shù)量的最大候選 值;
[0018] 步驟5,設(shè)定一個(gè)代價(jià)損失函數(shù),根據(jù)步驟4中搜索的最大候選值利用動(dòng)態(tài)規(guī)劃獲 得一條平滑的基頻曲線;
[0019] 步驟6,將所述基頻曲線與目標(biāo)單頻信號(hào)的基頻曲線進(jìn)行比對(duì),如果一致,則初步 判定所述待檢測(cè)信號(hào)為提示音,否則判斷不是提示音,結(jié)束處理流程。
[0020] 本發(fā)明的有益效果是:本發(fā)明根據(jù)單頻信號(hào)本質(zhì)上是一種周期性信號(hào)的特性,通 過(guò)計(jì)算每幀信號(hào)的自相關(guān)函數(shù),由于自相關(guān)函數(shù)的局部極值點(diǎn)可能是周期函數(shù)的頻率點(diǎn), 因此在每幀信號(hào)的自相關(guān)函數(shù)C k上,搜索預(yù)定數(shù)量的最大候選值,進(jìn)而通過(guò)代價(jià)損失函數(shù) 找到一條平滑的基頻曲線,通過(guò)獲得的基頻曲線與參考單頻信號(hào)的基頻曲線進(jìn)行對(duì)比,實(shí) 現(xiàn)對(duì)待測(cè)信號(hào)中是否存在提示音的精準(zhǔn)檢測(cè)。
[0021] 在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可以做如下改進(jìn)。
[0022] 進(jìn)一步,還包括步驟6中當(dāng)獲得的基頻曲線與目標(biāo)單頻信號(hào)的基頻曲線一致時(shí), 進(jìn)行如下進(jìn)一步操作:
[0023] 計(jì)算每楨待檢測(cè)信號(hào)對(duì)應(yīng)到單頻信號(hào)附近的子帶能量以及每楨信號(hào)的全帶能量, 并在時(shí)間軸分別將其累加得到待檢測(cè)信號(hào)的子帶能量E sub和全帶能量E all;
[0024] 計(jì)算待檢測(cè)信號(hào)子帶能量Esub和全帶能量E all的比值;
[0025] 如果子帶能量Esub和全帶能量E all的比值大于設(shè)定的閾值,則判定所述待檢測(cè)信 號(hào)為提示音,去掉該段待檢測(cè)信號(hào),否則判定所述待檢測(cè)信號(hào)不是提示音,結(jié)束處理流程。
[0026] 采用上述進(jìn)一步方案的有益效果:由于待檢測(cè)的語(yǔ)音信號(hào)前面可能只包含部分 單頻信號(hào),或者根本沒(méi)有錄入單頻信號(hào),假如某個(gè)人聲音的基頻頻率與待檢測(cè)的單頻信號(hào) 的頻率很接近,存在被誤檢測(cè)為提示音的風(fēng)險(xiǎn),從而將正常語(yǔ)音刪除,引起不必要的識(shí)別錯(cuò) 誤。為了避免這種錯(cuò)誤的發(fā)生,求取每楨待檢測(cè)語(yǔ)音信號(hào)的全帶能量,以及對(duì)應(yīng)單頻點(diǎn)周圍 的子帶能量,并將其分別累加,得到總的語(yǔ)音能量和單頻點(diǎn)子帶能量。當(dāng)單頻點(diǎn)子帶能量與 每幀信號(hào)全帶能量的比值大于一個(gè)閾值時(shí)(例如〇. 7),則可以確定所檢測(cè)的語(yǔ)音信號(hào)的該 頻點(diǎn)為提示音信號(hào)。
[0027] 進(jìn)一步,步驟3中計(jì)算自相關(guān)函數(shù)Ck的計(jì)算公式為:
[0028]
【主權(quán)項(xiàng)】
1. 一種快速檢測(cè)單頻提示音的方法,其特征在于,包括如下步驟: 步驟1,確定參考單頻信號(hào),根據(jù)參考單頻信號(hào)確定搜索頻率范圍為Pmin至P _,所述參 考單頻頻率在該范圍內(nèi); 步驟2,根據(jù)參考單頻信號(hào)的長(zhǎng)度截取相應(yīng)長(zhǎng)度的待檢測(cè)信號(hào); 步驟3,根據(jù)搜索頻率范圍計(jì)算待檢測(cè)信號(hào)的自相關(guān)函數(shù)Ck; 步驟4,在待檢測(cè)信號(hào)的每幀信號(hào)的自相關(guān)函數(shù)Ck上,搜索預(yù)定數(shù)量的最大候選值; 步驟5,設(shè)定一個(gè)代價(jià)損失函數(shù),根據(jù)步驟4中搜索的最大候選值利用動(dòng)態(tài)規(guī)劃獲得一 條平滑的基頻曲線; 步驟6,將所述基頻曲線與目標(biāo)單頻信號(hào)的基頻曲線進(jìn)行比對(duì),如果一致,則初步判定 所述待檢測(cè)信號(hào)為提示音,否則判斷不是提示音,結(jié)束處理流程。
2. 根據(jù)權(quán)利要求1所述一種快速檢測(cè)單頻提示音的方法,其特征在于,還包括步驟6中 當(dāng)獲得的基頻曲線
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1