亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

有效語音識別方法及系統(tǒng)的制作方法

文檔序號:8261276閱讀:239來源:國知局
有效語音識別方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種有效語音識別方法及系統(tǒng)。
【背景技術(shù)】
[0002] 傳統(tǒng)識別有效語音的方法一般基于能量大小、過零率、自相關(guān)等原理,其需連續(xù)對 若干語音數(shù)據(jù)幀綜合作出判決,這些方法在固定的場景下有較好識別效果,但對于非固定 場景及場景頻繁切換時(shí),如安靜環(huán)境到辦公室吵雜環(huán)境、公交內(nèi)、工地等等,實(shí)時(shí)識別效果 差,且有效語音的識別率會大幅降低。

【發(fā)明內(nèi)容】

[0003] 針對現(xiàn)有技術(shù)的不足,本發(fā)明旨在于提供一種可解決上述技術(shù)問題的有效語音識 別方法及系統(tǒng)。
[0004] 為實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
[0005] 一種有效語音識別方法,其包括以下步驟:
[0006] 步驟A:實(shí)時(shí)獲取當(dāng)前語音幀的語音頻譜分布;
[0007] 步驟B:實(shí)時(shí)獲取當(dāng)前語音幀的短時(shí)能量和長時(shí)能量;
[0008] 步驟C:根據(jù)語音頻譜分布、長時(shí)能量和短時(shí)能量獲取語音類似度;以及
[0009] 步驟D:判斷語音類似度是否大于預(yù)設(shè)的語音類似度閾值,若是,執(zhí)行步驟E;若 否,執(zhí)行步驟F;
[0010] 步驟E:判定當(dāng)前語音幀為有效語音;以及
[0011] 步驟F:判定當(dāng)前語音幀為非語音。
[0012] 優(yōu)選地,步驟A包括以下子步驟:
[0013] 步驟A1 :實(shí)時(shí)根據(jù)傅里葉變換將當(dāng)前的語音幀變換為語音頻域;
[0014] 步驟A2 :獲取該語音頻域的各頻譜處的能量;以及
[0015] 步驟A3 :根據(jù)各頻譜處的能量統(tǒng)計(jì)語音頻譜分布。
[0016] 優(yōu)選地,步驟A1根據(jù)公式I將當(dāng)前的語音換到語音頻域X(k),公式I為X(k)= FFT(x(j)),jG(〇,N)為時(shí)域樣點(diǎn)序號,kG(〇,N)為頻域樣點(diǎn)序號;
[0017] 步驟A2根據(jù)公式II計(jì)算該語音頻域的各頻譜處的能量E(k),公式II為E(k)= X(k) |~2,kG(〇,N);
[0018] 步驟A3根據(jù)公式III和各頻譜處的能量統(tǒng)計(jì)語音頻譜分布p,公
[0019]
【主權(quán)項(xiàng)】
1. 一種有效語音識別方法,其特征在于:其包括以下步驟: 步驟A:實(shí)時(shí)獲取當(dāng)前語音幀的語音頻譜分布; 步驟B:實(shí)時(shí)獲取當(dāng)前語音幀的短時(shí)能量和長時(shí)能量; 步驟C:根據(jù)語音頻譜分布、長時(shí)能量和短時(shí)能量獲取語音類似度;以及 步驟D:判斷語音類似度是否大于預(yù)設(shè)的語音類似度閾值,若是,執(zhí)行步驟E;若否,執(zhí) 行步驟F; 步驟E:判定當(dāng)前語音幀為有效語音;以及 步驟F:判定當(dāng)前語音幀為非語音。
2. 如權(quán)利要求1所述的有效語音識別方法,其特征在于:步驟A包括以下子步驟: 步驟A1 :實(shí)時(shí)根據(jù)傅里葉變換將當(dāng)前的語音幀變換為語音頻域; 步驟A2 :獲取該語音頻域的各頻譜處的能量;以及 步驟A3 :根據(jù)各頻譜處的能量統(tǒng)計(jì)語音頻譜分布。
3. 如權(quán)利要求2所述的有效語音識別方法,其特征在于:步驟A1根據(jù)公式I將當(dāng) 前的語音換到語音頻域X(k),公式I為X(k) =FFT(x(j)),jG(〇,N)為時(shí)域樣點(diǎn)序號, kG(〇,N)為頻域樣點(diǎn)序號; 步驟A2根據(jù)公式II計(jì)算該語音頻域的各頻譜處的能量E(k),公式II為E(k)=X(k) |~2,kG(〇,N); 步驟A3根據(jù)公式III和各頻譜處的能量統(tǒng)計(jì)語音頻譜分布p,公式III為
其中,〇^為固定值,對應(yīng)各子頻帶權(quán)重系 數(shù)。
4. 如權(quán)利要求1至3中任一項(xiàng)所述的有效語音識別方法,其特征在于:步驟B包括以 下子步驟: 步驟B1 :根據(jù)公式IV計(jì)算該語音頻域的短時(shí)能量Es,公式IV為
,+ ,ie(〇,N),b為濾波器更新系數(shù),取值范圍為[0,1];以及 步驟B2 :根據(jù)公式V計(jì)算該語音頻域的長時(shí)能量民,公式V為
iG(〇,N),a為濾波器更新系數(shù),取值范圍[0,1]。
5. 如權(quán)利要求1至3中任一項(xiàng)所述的有效語音識別方法,其特征在于:步驟C根 據(jù)公式VI、語音頻譜分布P、長時(shí)能量£1和短時(shí)能量E3計(jì)算語音類似度Y,公式VI為
,c為常數(shù),取值范圍為[0,1] ;e為自然指數(shù)。
6. -種有效語音識別系統(tǒng),其特征在于:其包括以下模塊: 模塊A:實(shí)時(shí)獲取當(dāng)前語音幀的語音頻譜分布; 模塊B:實(shí)時(shí)獲取當(dāng)前語音幀的短時(shí)能量和長時(shí)能量; 模塊C:根據(jù)語音頻譜分布、長時(shí)能量和短時(shí)能量獲取語音類似度;以及 模塊D:判斷語音類似度是否大于預(yù)設(shè)的語音類似度閾值,若是,執(zhí)行模塊E;若否,執(zhí) 行模塊F; 模塊E:判定當(dāng)前語音幀為有效語音;以及 模塊F:判定當(dāng)前語音幀為非語音。
7. 如權(quán)利要求6所述的有效語音識別系統(tǒng),其特征在于:模塊A包括以下子模塊: 模塊A1 :實(shí)時(shí)根據(jù)傅里葉變換將當(dāng)前的語音幀變換為語音頻域; 模塊A2 :獲取該語音頻域的各頻譜處的能量;以及 模塊A3 :根據(jù)各頻譜處的能量統(tǒng)計(jì)語音頻譜分布。
8. 如權(quán)利要求7所述的有效語音識別系統(tǒng),其特征在于:模塊A1根據(jù)公式I將當(dāng) 前的語音換到語音頻域X(k),公式I為X(k) =FFT(x(j)),jG(〇,N)為時(shí)域樣點(diǎn)序號, kG(〇,N)為頻域樣點(diǎn)序號; 模塊A2根據(jù)公式II計(jì)算該語音頻域的各頻譜處的能量E(k),公式II為E(k)=X(k) |~2,kG(〇,N); 模塊A3根據(jù)公式III和各頻譜處的能量統(tǒng)計(jì)語音頻譜分布p,公式III為
其中,〇^為固定值,對應(yīng)各子頻帶權(quán)重系 5 數(shù)。
9. 如權(quán)利要求6至8中任一項(xiàng)所述的有效語音識別系統(tǒng),其特征在于:模塊B包括以 下子模塊: 模塊B1 :根據(jù)公式IV計(jì)算該語音頻域的短時(shí)能量Es,公式IV為
ie(〇,N),b為濾波器更新系數(shù),取值范圍為[0,1],Ei指第i個(gè) 頻譜能量;以及 模塊B2 :根據(jù)公式V計(jì)算該語音頻域的長時(shí)能量民,公式V為
ie(0,N),a為濾波器更新系數(shù),取值范圍[0,1],Ei指第i個(gè)頻譜能量。
10. 如權(quán)利要求6至8中任一項(xiàng)所述的有效語音識別系統(tǒng),其特征在于:模塊C根 據(jù)公式VI、語音頻譜分布P、長時(shí)能量£1和短時(shí)能量E3計(jì)算語音類似度y,公式VI為
,c為常數(shù),取值范圍為[0,l],e為自然指數(shù)。
【專利摘要】有效語音識別方法及系統(tǒng),方法包括以下步驟:步驟A:實(shí)時(shí)獲取當(dāng)前語音幀的語音頻譜分布;步驟B:實(shí)時(shí)獲取當(dāng)前語音幀的短時(shí)能量和長時(shí)能量;步驟C:根據(jù)語音頻譜分布、長時(shí)能量和短時(shí)能量獲取語音類似度;以及步驟D:判斷語音類似度是否大于預(yù)設(shè)的語音類似度閾值,若是,執(zhí)行步驟E;若否,執(zhí)行步驟F;步驟E:判定當(dāng)前語音幀為效語音;以及步驟F:判定當(dāng)前語音幀為非語音。上述發(fā)明實(shí)時(shí)獲取每一語音幀的語音頻譜分布和能量變化,并根據(jù)語音頻譜分布和能量變化快速識別出效語音,無需像傳統(tǒng)方法那樣結(jié)合多幀才能綜合判斷,故,即使所應(yīng)用的場景頻繁切換也能可靠快速地識別。
【IPC分類】G10L15-20
【公開號】CN104575498
【申請?zhí)枴緾N201510055655
【發(fā)明人】付姝華
【申請人】深圳市云之訊網(wǎng)絡(luò)技術(shù)有限公司
【公開日】2015年4月29日
【申請日】2015年1月30日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1