語音音頻統(tǒng)一編碼窗型選擇方法及裝置的制作方法

文檔序號(hào)：2823877閱讀：217來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：語音音頻統(tǒng)一編碼窗型選擇方法及裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及通信技術(shù)領(lǐng)域，尤其涉及語音音頻統(tǒng)一編碼技術(shù)中一種語音音頻統(tǒng)一編碼窗型選擇方法及裝置。
背景技術(shù)：
語音音頻統(tǒng)一編碼模塊的核心算法是修正離散余弦變換。而在進(jìn)行修正離散余弦變換的過程中，需要對(duì)輸入的編碼信號(hào)分塊加窗。大多數(shù)的語音音頻編碼標(biāo)準(zhǔn)中提供了兩種類型窗型，分別是長窗和短窗。在現(xiàn)有技術(shù)中，可以通過判斷信號(hào)高頻能量是否發(fā)生突變來判斷輸入的編碼信號(hào)需要使用哪種類型的窗型，并在確定所述編碼信號(hào)需要使用短窗時(shí)，對(duì)所述編碼信號(hào)分組。但是，現(xiàn)有技術(shù)中判斷編碼信號(hào)的窗型的方法，其判斷結(jié)果不準(zhǔn)確。

發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種語音音頻統(tǒng)一編碼窗型選擇方法及裝置，以提高為編碼信號(hào)選擇窗型的準(zhǔn)確性。本發(fā)明實(shí)施例采用如下技術(shù)方案—種語音音頻統(tǒng)一編碼窗型選擇方法，包括將當(dāng)前幀編碼信號(hào)劃分成至少兩個(gè)子幀；利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性；根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型。一種語音音頻統(tǒng)一編碼窗型選擇裝置，包括劃分單元，用于將當(dāng)前幀編碼信號(hào)劃分成至少兩個(gè)子幀；檢測單元，用于利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性；選擇單元，用于根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型。本發(fā)明實(shí)施例提供的語音音頻統(tǒng)一編碼窗型選擇方法及裝置，將編碼比特率作為檢測當(dāng)前幀編碼信號(hào)的子幀的高頻能量特性時(shí)的參數(shù)，也即本發(fā)明實(shí)施例中考慮到了編碼比特率對(duì)編碼信號(hào)窗型選擇的影響。因此，利用本發(fā)明實(shí)施例的方法及裝置，能夠提高選擇編碼信號(hào)的窗型的準(zhǔn)確性。

為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案，下面將對(duì)實(shí)施例描述中所需要使用的附圖作一簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例，對(duì)于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動(dòng)的前提下，還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實(shí)施例語音音頻統(tǒng)一編碼窗型選擇方法的流程圖；圖2為本發(fā)明又一實(shí)施例語音音頻統(tǒng)一編碼窗型選擇方法的流程圖3為本發(fā)明又一實(shí)施例語音音頻統(tǒng)一編碼窗型選擇方法的流程圖；圖4為本發(fā)明實(shí)施例中子幀分組的算法示意圖；圖5為本發(fā)明實(shí)施例語音音頻統(tǒng)一編碼窗型選擇裝置的示意圖；圖6為本發(fā)明實(shí)施例語音音頻統(tǒng)一編碼窗型選擇裝置的結(jié)構(gòu)圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。如圖1所示，本發(fā)明實(shí)施例提供了一種語音音頻統(tǒng)一編碼窗型選擇方法，包括如下步驟步驟11、將當(dāng)前幀編碼信號(hào)劃分成至少兩個(gè)子幀。以一幀編碼信號(hào)為IOM個(gè)樣點(diǎn)為例，可將該幀編碼信號(hào)劃分為8個(gè)子幀。步驟12、利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性。其中所述編碼比特率由用戶在編碼之前根據(jù)需求任意設(shè)定，例如該需求可以是編碼后語音文件的大小，聲音信號(hào)的質(zhì)量等等。所述高頻能量特性可包括子幀的高頻能量是否發(fā)生第一級(jí)突變；或者所述子幀的實(shí)際高頻能量總和與所述可編碼高頻能量之間的關(guān)系。第一級(jí)突變可以理解為較大的突變，也可以理解為相對(duì)較小的突變，具體突變的程度根據(jù)用戶最終期望得到的聲音信號(hào)的質(zhì)量的好壞決定。例如若用戶期望獲得高質(zhì)量的聲音信號(hào)，那么他可以將該突變程度較小的突變?cè)O(shè)置為第一級(jí)突變。一般來說，在利用下面步驟22 計(jì)算得到的子幀的實(shí)際高頻能量與預(yù)測高頻能量之間相差4倍以上都可以認(rèn)為存在第一級(jí)突變。步驟13、根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型。由上可以看出，本發(fā)明實(shí)施例提供的語音音頻統(tǒng)一編碼窗型選擇方法，將編碼比特率作為檢測當(dāng)前幀編碼信號(hào)的子幀的高頻能量特性時(shí)的參數(shù)，也即本發(fā)明實(shí)施例中考慮到了編碼比特率對(duì)編碼信號(hào)窗型選擇的影響。因此，利用本發(fā)明實(shí)施例的方法，能夠提高選擇編碼信號(hào)的窗型的準(zhǔn)確性。以下結(jié)合圖2-圖4所示的實(shí)施例，詳細(xì)描述一下本發(fā)明實(shí)施例語音音頻統(tǒng)一編碼窗型選擇方法的具體過程。如圖2所示，本發(fā)明又一實(shí)施例語音音頻統(tǒng)一編碼窗型選擇方法包括如下步驟步驟21、將當(dāng)前幀編碼信號(hào)劃分成至少兩個(gè)子幀。在此實(shí)施例以及圖4所示的實(shí)施例中，均已當(dāng)前幀編碼信號(hào)為IOM個(gè)樣點(diǎn)，將該幀編碼信號(hào)劃分為8個(gè)子幀為例。那么，相應(yīng)的每個(gè)子幀中包含1 個(gè)樣點(diǎn)。步驟22、計(jì)算每個(gè)子幀的實(shí)際高頻能量和預(yù)測高頻能量。在此步驟中，首先用一個(gè)I頂濾波器對(duì)該當(dāng)前幀編碼信號(hào)Signali進(jìn)行高通濾波，濾波后獲得信號(hào)hpsignali，濾波方法如公式(1)所示。在高通濾波中，選取的高通頻率截止頻率為π/2，階數(shù)為2階。hpsignalj = 0. 7548signali-0. 7548signali_1+0. SOgShpsignal^1, ^ ψ,0 彡 i 彡 1023 (1)然后，按照公式(2)所示的方式計(jì)算濾波后每個(gè)子幀的實(shí)際高頻能量SUbEnergywt5
I 28+12權(quán)利要求
1.一種語音音頻統(tǒng)一編碼窗型選擇方法，其特征在于，包括將當(dāng)前幀編碼信號(hào)劃分成至少兩個(gè)子幀；利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性；根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述高頻能量特性包括子幀的高頻能量是否發(fā)生第一級(jí)突變；所述利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性包括計(jì)算所述子幀的實(shí)際高頻能量和預(yù)測高頻能量；利用所述編碼比特率計(jì)算第一高頻能量突變閾值，其中所述第一高頻能量突變閾值小于1;利用所述實(shí)際高頻能量、所述預(yù)測高頻能量以及所述第一高頻能量突變閾值，檢測所述子幀的高頻能量是否發(fā)生第一級(jí)突變。
3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述利用所述實(shí)際高頻能量、所述預(yù)測高頻能量以及所述第一高頻能量突變閾值，檢測所述子幀的高頻能量是否發(fā)生第一級(jí)突變包括當(dāng)所述實(shí)際高頻能量與所述預(yù)測高頻能量之比小于所述第一高頻能量突變閾值或者所述預(yù)測高頻能量與所述實(shí)際高頻能量之比小于所述第一高頻能量突變閾值時(shí)，確定所述子幀的高頻能量發(fā)生第一級(jí)突變，否則確定所述子幀的高頻能量沒有發(fā)生第一級(jí)突變。
4.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型包括為高頻能量發(fā)生第一級(jí)突變的子幀選擇短窗，為高頻能量沒有發(fā)生第一級(jí)突變的子幀選擇長窗。
5.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述高頻能量特性包括所述子幀的實(shí)際高頻能量總和與所述可編碼高頻能量之間的關(guān)系；所述利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性包括計(jì)算所述子幀的實(shí)際高頻能量；根據(jù)所述子幀的實(shí)際高頻能量計(jì)算所述子幀的實(shí)際高頻能量總和；利用所述編碼比特率計(jì)算所述可編碼高頻能量；將所述子幀的實(shí)際高頻能量總和與所述可編碼高頻能量進(jìn)行比較，獲得所述子幀的實(shí)際高頻能量總和與所述可編碼高頻能量之間的關(guān)系。
6.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型包括若所述實(shí)際高頻能量總和小于所述可編碼高頻能量，為所述子幀選擇長窗；若所述實(shí)際高頻能量總和大于所述可編碼高頻能量，為所述子幀選擇短窗。
7.根據(jù)權(quán)利要求4所述的方法，其特征在于，在根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型為所述子幀選擇短窗后，所述方法還包括將所述子幀分組；在根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型為所述子幀選擇長窗后，所述方法還包括調(diào)整所述當(dāng)前幀編碼信號(hào)的長窗類型。
8.根據(jù)權(quán)利要求7所述的方法，其特征在于，所述將所述子幀分組包括利用所述第一高頻能量突變閾值計(jì)算第二高頻能量突變閾值，其中所述第二高頻能量突變閾值小于1 ；利用所述子幀的實(shí)際高頻能量、所述預(yù)測高頻能量以及所述第二高頻能量突變閾值，檢測所述子幀的高頻能量是否發(fā)生第二級(jí)突變，并根據(jù)檢測結(jié)果，為所述子幀設(shè)置能量突變標(biāo)識(shí)；根據(jù)所述能量突變標(biāo)識(shí)將所述子幀分組。
9.根據(jù)權(quán)利要求6所述的方法，其特征在于，在根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型為所述子幀選擇短窗后，所述方法還包括將所述子幀分組；在根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型為所述子幀選擇長窗后，所述方法還包括調(diào)整所述當(dāng)前幀編碼信號(hào)的長窗類型。
10.根據(jù)權(quán)利要求9所述的方法，其特征在于，所述將所述子幀分組包括計(jì)算所述子幀的實(shí)際高頻能量和預(yù)測高頻能量；利用所述編碼比特率計(jì)算第一高頻能量突變閾值，其中所述第一高頻能量突變閾值小于1;利用所述第一高頻能量突變閾值計(jì)算第二高頻能量突變閾值，其中所述第二高頻能量突變閾值小于1 ；利用所述子幀的實(shí)際高頻能量、所述預(yù)測高頻能量以及所述第二高頻能量突變閾值，檢測所述子幀的高頻能量是否發(fā)生第二級(jí)突變，并根據(jù)檢測結(jié)果，為子幀設(shè)置能量突變標(biāo)識(shí)；根據(jù)所述能量突變標(biāo)識(shí)將所述子幀分組。
11.根據(jù)權(quán)利要求8或10所述的方法，其特征在于，所述檢測所述子幀的高頻能量是否發(fā)生第二級(jí)突變包括當(dāng)所述實(shí)際高頻能量與所述預(yù)測高頻能量之比小于所述第二高頻能量突變閾值或者所述預(yù)測高頻能量與所述實(shí)際高頻能量之比小于所述第二高頻能量突變閾值時(shí)，確定所述子幀的高頻能量發(fā)生第二級(jí)突變，否則確定所述子幀的高頻能量沒有發(fā)生第二級(jí)突變。
12.—種語音音頻統(tǒng)一編碼窗型選擇裝置，其特征在于，包括劃分單元，用于將當(dāng)前幀編碼信號(hào)劃分成至少兩個(gè)子幀；檢測單元，用于利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性；選擇單元，用于根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型。
13.根據(jù)權(quán)利要求12所述的裝置，其特征在于，所述高頻能量特性包括子幀的高頻能量是否發(fā)生第一級(jí)突變；所述檢測單元包括第一計(jì)算模塊，用于計(jì)算所述子幀的實(shí)際高頻能量和預(yù)測高頻能量；第二計(jì)算模塊，用于利用所述編碼比特率計(jì)算第一高頻能量突變閾值，其中所述第一高頻能量突變閾值小于1 ；第一檢測模塊，用于利用所述實(shí)際高頻能量、所述預(yù)測高頻能量以及所述第一高頻能量突變閾值，檢測所述子幀的高頻能量是否發(fā)生第一級(jí)突變。
14.根據(jù)權(quán)利要求13所述的裝置，其特征在于，所述第一檢測模塊具體用于當(dāng)所述實(shí)際高頻能量與所述預(yù)測高頻能量之比小于所述第一高頻能量突變閾值或者所述預(yù)測高頻能量與所述實(shí)際高頻能量之比小于所述第一高頻能量突變閾值時(shí)，確定所述子幀的高頻能量發(fā)生第一級(jí)突變，否則確定所述子幀的高頻能量沒有發(fā)生第一級(jí)突變。
15.根據(jù)權(quán)利要求14所述的裝置，其特征在于，所述選擇單元具體用于為高頻能量發(fā)生第一級(jí)突變的子幀選擇短窗，為高頻能量沒有發(fā)生第一級(jí)突變的子幀選擇長窗。
16.根據(jù)權(quán)利要求12所述的裝置，其特征在于，所述高頻能量特性包括所述子幀的實(shí)際高頻能量總和與所述可編碼高頻能量之間的關(guān)系；所述檢測單元包括第三計(jì)算模塊，用于計(jì)算所述子幀的實(shí)際高頻能量；第四計(jì)算模塊，用于根據(jù)所述子幀的實(shí)際高頻能量計(jì)算所述子幀的實(shí)際高頻能量總和；第五計(jì)算模塊，用于利用所述編碼比特率計(jì)算所述可編碼高頻能量；第二檢測模塊，用于將所述子幀的實(shí)際高頻能量總和與所述可編碼高頻能量進(jìn)行比較，獲得所述子幀的實(shí)際高頻能量總和與所述可編碼高頻能量之間的關(guān)系。
17.根據(jù)權(quán)利要求16所述的裝置，其特征在于，所述選擇單元具體用于若所述實(shí)際高頻能量總和小于所述可編碼高頻能量，為所述子幀選擇長窗；若所述實(shí)際高頻能量總和大于所述可編碼高頻能量，為所述子幀選擇短窗。
18.根據(jù)權(quán)利要求13或16所述的裝置，其特征在于，所述裝置還包括分組單元，用于將所述子幀分組；窗型調(diào)整單元，用于調(diào)整所述當(dāng)前幀編碼信號(hào)的長窗類型。
19.根據(jù)權(quán)利要求18所述的裝置，其特征在于，所述分組單元包括第一計(jì)算模塊，用于利用所述第一高頻能量突變閾值計(jì)算第二高頻能量突變閾值，其中所述第二高頻能量突變閾值小于1 ；第一處理模塊，用于利用所述子幀的實(shí)際高頻能量、所述預(yù)測高頻能量以及所述第二高頻能量突變閾值，檢測所述子幀的高頻能量是否發(fā)生第二級(jí)突變，并根據(jù)檢測結(jié)果，為所述子幀設(shè)置能量突變標(biāo)識(shí)；第一分組模塊，用于根據(jù)所述能量突變標(biāo)識(shí)將所述子幀分組。
20.根據(jù)權(quán)利要求18所述的裝置，其特征在于，所述分組單元包括第二計(jì)算模塊，用于計(jì)算所述子幀的實(shí)際高頻能量和預(yù)測高頻能量；第三計(jì)算模塊，用于利用所述編碼比特率計(jì)算第一高頻能量突變閾值，其中所述第一高頻能量突變閾值小于1 ；第四計(jì)算模塊，用于利用所述第一高頻能量突變閾值計(jì)算第二高頻能量突變閾值，其中所述第二高頻能量突變閾值小于1 ；第二處理模塊，用于利用所述子幀的實(shí)際高頻能量、所述預(yù)測高頻能量以及所述第二高頻能量突變閾值，檢測所述子幀的高頻能量是否發(fā)生第二級(jí)突變，并根據(jù)檢測結(jié)果，為子幀設(shè)置能量突變標(biāo)識(shí)；第二分組模塊，用于根據(jù)所述能量突變標(biāo)識(shí)將所述子幀分組。
全文摘要
本發(fā)明實(shí)施例公開了一種語音音頻統(tǒng)一編碼窗型選擇方法及裝置，涉及通信技術(shù)領(lǐng)域，為提高為編碼信號(hào)選擇窗型的準(zhǔn)確性而發(fā)明。所述方法包括將當(dāng)前幀編碼信號(hào)劃分成至少兩個(gè)子幀；利用預(yù)設(shè)的編碼比特率檢測所述子幀的高頻能量特性；根據(jù)所述高頻能量特性為所述子幀選擇編碼窗型。本發(fā)明實(shí)施例主要用于語音音頻統(tǒng)一編碼技術(shù)中。
文檔編號(hào)G10L19/02GK102446508SQ201010502679
公開日2012年5月9日申請(qǐng)日期2010年10月11日優(yōu)先權(quán)日2010年10月11日
發(fā)明者劉貴忠, 杜正中, 金劍, 頓玉潔申請(qǐng)人:華為技術(shù)有限公司

完整全部詳細(xì)技術(shù)資料下載