專利名稱:語音音頻統(tǒng)一編碼窗型選擇方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及語音音頻統(tǒng)一編碼技術(shù)中一種語音音頻統(tǒng)一編碼窗型選擇方法及裝置。
背景技術(shù):
語音音頻統(tǒng)一編碼模塊的核心算法是修正離散余弦變換。而在進(jìn)行修正離散余弦變換的過程中,需要對(duì)輸入的編碼信號(hào)分塊加窗。大多數(shù)的語音音頻編碼標(biāo)準(zhǔn)中提供了兩種類型窗型,分別是長窗和短窗。在現(xiàn)有技術(shù)中,可以通過判斷信號(hào)高頻能量是否發(fā)生突變來判斷輸入的編碼信號(hào)需要使用哪種類型的窗型,并在確定所述編碼信號(hào)需要使用短窗時(shí),對(duì)所述編碼信號(hào)分組。但是,現(xiàn)有技術(shù)中判斷編碼信號(hào)的窗型的方法,其判斷結(jié)果不準(zhǔn)確。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種語音音頻統(tǒng)一編碼窗型選擇方法及裝置,以提高為編碼信號(hào)選擇窗型的準(zhǔn)確性。本發(fā)明實(shí)施例采用如下技術(shù)方案—種語音音頻統(tǒng)一編碼窗型選擇方法,包括將當(dāng)前幀編碼信號(hào)劃分成至少兩個(gè)子幀;利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性;根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型。一種語音音頻統(tǒng)一編碼窗型選擇裝置,包括劃分單元,用于將當(dāng)前幀編碼信號(hào)劃分成至少兩個(gè)子幀;檢測單元,用于利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性;選擇單元,用于根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型。本發(fā)明實(shí)施例提供的語音音頻統(tǒng)一編碼窗型選擇方法及裝置,將編碼比特率作為檢測當(dāng)前幀編碼信號(hào)的子幀的高頻能量特性時(shí)的參數(shù),也即本發(fā)明實(shí)施例中考慮到了編碼比特率對(duì)編碼信號(hào)窗型選擇的影響。因此,利用本發(fā)明實(shí)施例的方法及裝置,能夠提高選擇編碼信號(hào)的窗型的準(zhǔn)確性。
為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實(shí)施例語音音頻統(tǒng)一編碼窗型選擇方法的流程圖;圖2為本發(fā)明又一實(shí)施例語音音頻統(tǒng)一編碼窗型選擇方法的流程圖3為本發(fā)明又一實(shí)施例語音音頻統(tǒng)一編碼窗型選擇方法的流程圖;圖4為本發(fā)明實(shí)施例中子幀分組的算法示意圖;圖5為本發(fā)明實(shí)施例語音音頻統(tǒng)一編碼窗型選擇裝置的示意圖;圖6為本發(fā)明實(shí)施例語音音頻統(tǒng)一編碼窗型選擇裝置的結(jié)構(gòu)圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。如圖1所示,本發(fā)明實(shí)施例提供了一種語音音頻統(tǒng)一編碼窗型選擇方法,包括如下步驟步驟11、將當(dāng)前幀編碼信號(hào)劃分成至少兩個(gè)子幀。以一幀編碼信號(hào)為IOM個(gè)樣點(diǎn)為例,可將該幀編碼信號(hào)劃分為8個(gè)子幀。步驟12、利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性。其中所述編碼比特率由用戶在編碼之前根據(jù)需求任意設(shè)定,例如該需求可以是編碼后語音文件的大小,聲音信號(hào)的質(zhì)量等等。所述高頻能量特性可包括子幀的高頻能量是否發(fā)生第一級(jí)突變;或者所述子幀的實(shí)際高頻能量總和與所述可編碼高頻能量之間的關(guān)系。第一級(jí)突變可以理解為較大的突變,也可以理解為相對(duì)較小的突變,具體突變的程度根據(jù)用戶最終期望得到的聲音信號(hào)的質(zhì)量的好壞決定。例如若用戶期望獲得高質(zhì)量的聲音信號(hào),那么他可以將該突變程度較小的突變?cè)O(shè)置為第一級(jí)突變。一般來說,在利用下面步驟22 計(jì)算得到的子幀的實(shí)際高頻能量與預(yù)測高頻能量之間相差4倍以上都可以認(rèn)為存在第一級(jí)突變。步驟13、根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型。由上可以看出,本發(fā)明實(shí)施例提供的語音音頻統(tǒng)一編碼窗型選擇方法,將編碼比特率作為檢測當(dāng)前幀編碼信號(hào)的子幀的高頻能量特性時(shí)的參數(shù),也即本發(fā)明實(shí)施例中考慮到了編碼比特率對(duì)編碼信號(hào)窗型選擇的影響。因此,利用本發(fā)明實(shí)施例的方法,能夠提高選擇編碼信號(hào)的窗型的準(zhǔn)確性。以下結(jié)合圖2-圖4所示的實(shí)施例,詳細(xì)描述一下本發(fā)明實(shí)施例語音音頻統(tǒng)一編碼窗型選擇方法的具體過程。如圖2所示,本發(fā)明又一實(shí)施例語音音頻統(tǒng)一編碼窗型選擇方法包括如下步驟步驟21、將當(dāng)前幀編碼信號(hào)劃分成至少兩個(gè)子幀。在此實(shí)施例以及圖4所示的實(shí)施例中,均已當(dāng)前幀編碼信號(hào)為IOM個(gè)樣點(diǎn),將該幀編碼信號(hào)劃分為8個(gè)子幀為例。那么,相應(yīng)的每個(gè)子幀中包含1 個(gè)樣點(diǎn)。步驟22、計(jì)算每個(gè)子幀的實(shí)際高頻能量和預(yù)測高頻能量。在此步驟中,首先用一個(gè)I頂濾波器對(duì)該當(dāng)前幀編碼信號(hào)Signali進(jìn)行高通濾波, 濾波后獲得信號(hào)hpsignali,濾波方法如公式(1)所示。在高通濾波中,選取的高通頻率截止頻率為π/2,階數(shù)為2階。hpsignalj = 0. 7548signali-0. 7548signali_1+0. SOgShpsignal^1, ^ ψ,0 彡 i 彡 1023 (1)然后,按照公式(2)所示的方式計(jì)算濾波后每個(gè)子幀的實(shí)際高頻能量SUbEnergywt5
I 28+12權(quán)利要求
1.一種語音音頻統(tǒng)一編碼窗型選擇方法,其特征在于,包括將當(dāng)前幀編碼信號(hào)劃分成至少兩個(gè)子幀;利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性;根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述高頻能量特性包括子幀的高頻能量是否發(fā)生第一級(jí)突變;所述利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性包括計(jì)算所述子幀的實(shí)際高頻能量和預(yù)測高頻能量;利用所述編碼比特率計(jì)算第一高頻能量突變閾值,其中所述第一高頻能量突變閾值小于1;利用所述實(shí)際高頻能量、所述預(yù)測高頻能量以及所述第一高頻能量突變閾值,檢測所述子幀的高頻能量是否發(fā)生第一級(jí)突變。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述利用所述實(shí)際高頻能量、所述預(yù)測高頻能量以及所述第一高頻能量突變閾值,檢測所述子幀的高頻能量是否發(fā)生第一級(jí)突變包括當(dāng)所述實(shí)際高頻能量與所述預(yù)測高頻能量之比小于所述第一高頻能量突變閾值或者所述預(yù)測高頻能量與所述實(shí)際高頻能量之比小于所述第一高頻能量突變閾值時(shí),確定所述子幀的高頻能量發(fā)生第一級(jí)突變,否則確定所述子幀的高頻能量沒有發(fā)生第一級(jí)突變。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型包括為高頻能量發(fā)生第一級(jí)突變的子幀選擇短窗,為高頻能量沒有發(fā)生第一級(jí)突變的子幀選擇長窗。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述高頻能量特性包括所述子幀的實(shí)際高頻能量總和與所述可編碼高頻能量之間的關(guān)系;所述利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性包括計(jì)算所述子幀的實(shí)際高頻能量;根據(jù)所述子幀的實(shí)際高頻能量計(jì)算所述子幀的實(shí)際高頻能量總和;利用所述編碼比特率計(jì)算所述可編碼高頻能量;將所述子幀的實(shí)際高頻能量總和與所述可編碼高頻能量進(jìn)行比較,獲得所述子幀的實(shí)際高頻能量總和與所述可編碼高頻能量之間的關(guān)系。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型包括若所述實(shí)際高頻能量總和小于所述可編碼高頻能量,為所述子幀選擇長窗;若所述實(shí)際高頻能量總和大于所述可編碼高頻能量,為所述子幀選擇短窗。
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,在根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型為所述子幀選擇短窗后,所述方法還包括將所述子幀分組;在根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型為所述子幀選擇長窗后,所述方法還包括調(diào)整所述當(dāng)前幀編碼信號(hào)的長窗類型。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述將所述子幀分組包括利用所述第一高頻能量突變閾值計(jì)算第二高頻能量突變閾值,其中所述第二高頻能量突變閾值小于1 ;利用所述子幀的實(shí)際高頻能量、所述預(yù)測高頻能量以及所述第二高頻能量突變閾值, 檢測所述子幀的高頻能量是否發(fā)生第二級(jí)突變,并根據(jù)檢測結(jié)果,為所述子幀設(shè)置能量突變標(biāo)識(shí);根據(jù)所述能量突變標(biāo)識(shí)將所述子幀分組。
9.根據(jù)權(quán)利要求6所述的方法,其特征在于,在根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型為所述子幀選擇短窗后,所述方法還包括將所述子幀分組;在根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型為所述子幀選擇長窗后,所述方法還包括調(diào)整所述當(dāng)前幀編碼信號(hào)的長窗類型。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述將所述子幀分組包括計(jì)算所述子幀的實(shí)際高頻能量和預(yù)測高頻能量;利用所述編碼比特率計(jì)算第一高頻能量突變閾值,其中所述第一高頻能量突變閾值小于1;利用所述第一高頻能量突變閾值計(jì)算第二高頻能量突變閾值,其中所述第二高頻能量突變閾值小于1 ;利用所述子幀的實(shí)際高頻能量、所述預(yù)測高頻能量以及所述第二高頻能量突變閾值, 檢測所述子幀的高頻能量是否發(fā)生第二級(jí)突變,并根據(jù)檢測結(jié)果,為子幀設(shè)置能量突變標(biāo)識(shí);根據(jù)所述能量突變標(biāo)識(shí)將所述子幀分組。
11.根據(jù)權(quán)利要求8或10所述的方法,其特征在于,所述檢測所述子幀的高頻能量是否發(fā)生第二級(jí)突變包括當(dāng)所述實(shí)際高頻能量與所述預(yù)測高頻能量之比小于所述第二高頻能量突變閾值或者所述預(yù)測高頻能量與所述實(shí)際高頻能量之比小于所述第二高頻能量突變閾值時(shí),確定所述子幀的高頻能量發(fā)生第二級(jí)突變,否則確定所述子幀的高頻能量沒有發(fā)生第二級(jí)突變。
12.—種語音音頻統(tǒng)一編碼窗型選擇裝置,其特征在于,包括劃分單元,用于將當(dāng)前幀編碼信號(hào)劃分成至少兩個(gè)子幀;檢測單元,用于利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性;選擇單元,用于根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述高頻能量特性包括子幀的高頻能量是否發(fā)生第一級(jí)突變;所述檢測單元包括第一計(jì)算模塊,用于計(jì)算所述子幀的實(shí)際高頻能量和預(yù)測高頻能量;第二計(jì)算模塊,用于利用所述編碼比特率計(jì)算第一高頻能量突變閾值,其中所述第一高頻能量突變閾值小于1 ;第一檢測模塊,用于利用所述實(shí)際高頻能量、所述預(yù)測高頻能量以及所述第一高頻能量突變閾值,檢測所述子幀的高頻能量是否發(fā)生第一級(jí)突變。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述第一檢測模塊具體用于 當(dāng)所述實(shí)際高頻能量與所述預(yù)測高頻能量之比小于所述第一高頻能量突變閾值或者所述預(yù)測高頻能量與所述實(shí)際高頻能量之比小于所述第一高頻能量突變閾值時(shí),確定所述子幀的高頻能量發(fā)生第一級(jí)突變,否則確定所述子幀的高頻能量沒有發(fā)生第一級(jí)突變。
15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述選擇單元具體用于為高頻能量發(fā)生第一級(jí)突變的子幀選擇短窗,為高頻能量沒有發(fā)生第一級(jí)突變的子幀選擇長窗。
16.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述高頻能量特性包括所述子幀的實(shí)際高頻能量總和與所述可編碼高頻能量之間的關(guān)系;所述檢測單元包括第三計(jì)算模塊,用于計(jì)算所述子幀的實(shí)際高頻能量;第四計(jì)算模塊,用于根據(jù)所述子幀的實(shí)際高頻能量計(jì)算所述子幀的實(shí)際高頻能量總和;第五計(jì)算模塊,用于利用所述編碼比特率計(jì)算所述可編碼高頻能量; 第二檢測模塊,用于將所述子幀的實(shí)際高頻能量總和與所述可編碼高頻能量進(jìn)行比較,獲得所述子幀的實(shí)際高頻能量總和與所述可編碼高頻能量之間的關(guān)系。
17.根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述選擇單元具體用于若所述實(shí)際高頻能量總和小于所述可編碼高頻能量,為所述子幀選擇長窗;若所述實(shí)際高頻能量總和大于所述可編碼高頻能量,為所述子幀選擇短窗。
18.根據(jù)權(quán)利要求13或16所述的裝置,其特征在于,所述裝置還包括 分組單元,用于將所述子幀分組;窗型調(diào)整單元,用于調(diào)整所述當(dāng)前幀編碼信號(hào)的長窗類型。
19.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述分組單元包括第一計(jì)算模塊,用于利用所述第一高頻能量突變閾值計(jì)算第二高頻能量突變閾值,其中所述第二高頻能量突變閾值小于1 ;第一處理模塊,用于利用所述子幀的實(shí)際高頻能量、所述預(yù)測高頻能量以及所述第二高頻能量突變閾值,檢測所述子幀的高頻能量是否發(fā)生第二級(jí)突變,并根據(jù)檢測結(jié)果,為所述子幀設(shè)置能量突變標(biāo)識(shí);第一分組模塊,用于根據(jù)所述能量突變標(biāo)識(shí)將所述子幀分組。
20.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述分組單元包括 第二計(jì)算模塊,用于計(jì)算所述子幀的實(shí)際高頻能量和預(yù)測高頻能量;第三計(jì)算模塊,用于利用所述編碼比特率計(jì)算第一高頻能量突變閾值,其中所述第一高頻能量突變閾值小于1 ;第四計(jì)算模塊,用于利用所述第一高頻能量突變閾值計(jì)算第二高頻能量突變閾值,其中所述第二高頻能量突變閾值小于1 ;第二處理模塊,用于利用所述子幀的實(shí)際高頻能量、所述預(yù)測高頻能量以及所述第二高頻能量突變閾值,檢測所述子幀的高頻能量是否發(fā)生第二級(jí)突變,并根據(jù)檢測結(jié)果,為子幀設(shè)置能量突變標(biāo)識(shí);第二分組模塊,用于根據(jù)所述能量突變標(biāo)識(shí)將所述子幀分組。
全文摘要
本發(fā)明實(shí)施例公開了一種語音音頻統(tǒng)一編碼窗型選擇方法及裝置,涉及通信技術(shù)領(lǐng)域,為提高為編碼信號(hào)選擇窗型的準(zhǔn)確性而發(fā)明。所述方法包括將當(dāng)前幀編碼信號(hào)劃分成至少兩個(gè)子幀;利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性;根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型。本發(fā)明實(shí)施例主要用于語音音頻統(tǒng)一編碼技術(shù)中。
文檔編號(hào)G10L19/02GK102446508SQ201010502679
公開日2012年5月9日 申請(qǐng)日期2010年10月11日 優(yōu)先權(quán)日2010年10月11日
發(fā)明者劉貴忠, 杜正中, 金劍, 頓玉潔 申請(qǐng)人:華為技術(shù)有限公司