專利名稱:一種寬帶語音編碼器及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及寬帶語音編碼技術(shù),尤其涉及語音編碼的寬帶擴展技術(shù)。
背景技術(shù):
現(xiàn)在的電信網(wǎng)絡(luò)已經(jīng)普遍使用了光纖傳輸,原有的PSTN網(wǎng)絡(luò)也逐漸被 基于IP的網(wǎng)絡(luò)代替,寬帶語音的應(yīng)用條件逐漸成熟。然而現(xiàn)有的寬帶語音 編碼方法存在高延遲、高復(fù)雜度等缺點,而窄帶聲碼器由于帶寬較窄而具有 較低的音頻質(zhì)量。因此,需要對窄帶聲碼器進行寬帶擴展,同時,能使得語 音編碼方法保持較低的延遲和計算復(fù)雜度。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種寬帶語音編碼器及方法,能夠使 得語音編碼器在保證編碼效率的情況下,具有低延遲、低復(fù)雜度的特點。
為了解決上述技術(shù)問題,本發(fā)明提供了一種寬帶語音編碼器,包括分 頻模塊、低帶編碼器、低帶解碼器、差分運算模塊、低帶增強編碼器、高帶 增強編碼器以及碼流復(fù)用模塊,其中
分頻模塊,用于從寬帶數(shù)字語音信號中提取高頻分量和低頻分量,得到 高子帶信號和低子帶信號,分別輸出給高帶增強編碼器和低帶編碼器;
低帶編碼器,用于對低子帶信號進行編碼得到低帶碼流數(shù)據(jù),分別輸出 給低帶解碼器和碼流復(fù)用模塊;
低帶解碼器,用于對低帶碼流數(shù)據(jù)進行解碼得到低子帶語音信號輸出給 差分運算模塊;
差分運算模塊,用于將原始的低子帶信號與低子帶語音信號相減得到一 個低子帶差分信號輸出給低帶增強編碼器;低帶增強編碼器,用于將低子帶差分信號進行編碼得到低帶增強碼流數(shù)
據(jù)輸出給碼流復(fù)用模塊;
高帶增強編碼器,用于將高子帶信號進行編碼得到高帶增強碼流ib悟輸 出給碼流復(fù)用模塊;
碼流復(fù)用模塊,用于將低帶碼流數(shù)據(jù)、低帶增強碼流數(shù)據(jù)以及高帶增強 碼流教:據(jù)進行復(fù)用打包處理,得到寬帶語音碼流數(shù)據(jù)輸出。
進一步地,在分頻模塊前還連接有預(yù)處理模塊,用于將寬帶數(shù)字語音信 號中的信號偏移和0 ~ 50Hz的低頻信號分量濾除。
進一步地,該預(yù)處理模塊由一個高通濾波器構(gòu)成。
進一步地,分頻模塊包括一正交鏡像濾波器,或者包括高、低通濾波器。
進一步地,低帶編碼器包括噪聲整形模塊和窄帶編碼器,其中,噪聲整 形模塊用于將低子帶信號進行噪聲整形處理;窄帶編碼器用于將經(jīng)過噪聲整 形處理的低子帶信號進行編碼,得到低帶碼流數(shù)據(jù)。
進一步地,低帶編碼器包括感知加權(quán)處理模塊和窄帶編碼器,其中,感 知加權(quán)處理模塊用于將低子帶信號進行感知加權(quán)處理;窄帶編碼器用于將經(jīng) 過感知加權(quán)處理的低子帶信號進行編碼,得到低帶碼流數(shù)據(jù)。
進一步地,窄帶編碼器由一個A律脈沖編碼調(diào)制編碼器取代。
進一步地,低帶增強編碼器進一步含有相互連接的低帶增強編碼模塊和 加權(quán)矢量量化器,其中低帶增強編碼模塊用于將低子帶差分信號進行編碼 得到低帶增強數(shù)據(jù)輸出,加權(quán)矢量量化器用于將低帶增強數(shù)據(jù)進行加權(quán)矢量 量化處理,得到低帶增強碼流數(shù)據(jù)。
進一步地,加權(quán)矢量量化器中進一步含有一有限沖擊響應(yīng)FIR濾波器, 該FIR濾波器用于將低帶增強數(shù)據(jù)進行加權(quán)處理。
進一步地,所述高帶增強編碼器進一步含有相互連接的基于修正的離散 余弦變換MDCT編碼器和交織矢量量化器IVQ;其中,該MDCT編碼器用 于將高子帶信號進行編碼得到高帶增強數(shù)據(jù),該IVQ用于將高帶增強數(shù)據(jù) 進行交織矢量量化處理得到高帶增強碼流數(shù)據(jù)。
6為了解決上述技術(shù)問題,本發(fā)明提供了一種寬帶語音編碼方法,其特征
在于,所述方法包括步驟
(a) 提取寬帶數(shù)字語音信號的高頻分量和低頻分量,即得到高子帶信 號和低子帶信號;
(b) 將低子帶信號進行低帶編碼得到低帶碼流數(shù)據(jù);將低帶碼流數(shù)據(jù) 進行低帶增強編碼處理,得到低帶增強碼流數(shù)據(jù);將高子帶信號進行高帶增 強編碼處理高帶增強碼流數(shù)據(jù);
(c) 將高帶增強碼流數(shù)據(jù)、低帶增強碼流數(shù)據(jù)以及低帶碼流數(shù)據(jù)進行 復(fù)用打包處理后得到寬帶語音碼流數(shù)據(jù)輸出。
進一步地,在步驟(a)前要通過預(yù)處理,將寬帶數(shù)字語音信號中的直 流偏移和0 ~ 50Hz的^[氐頻分量濾除。
進一步地,該預(yù)處理通過高通濾波實現(xiàn)。
進一步地,其特征在于,步驟(b)所述低帶增強編碼處理進一步包括 步驟
(bl)將低帶碼流數(shù)據(jù)進行解碼,得到低子帶語音信號;
(b2 )將原始的低子帶信號和低子帶語音信號進行差分運算得到低子帶 差值信號;
(b3)將低子帶差值信號進行低帶增強編碼,得到低帶增強碼流數(shù)據(jù)。
進一步地,步驟(b3 )低帶增強編碼通過將低子帶差分信號進行編碼得 到低帶增強數(shù)據(jù),然后將低帶增強數(shù)據(jù)進行加權(quán)矢量量化處理,得到低帶增 強碼流數(shù)據(jù)。
進一步地,步驟(b3)加權(quán)矢量量化處理,通過有限沖激響應(yīng)FIR濾波 實現(xiàn)加4又處理。
進一步地,步驟(b)高帶增強編碼處理進一步包括步驟
將高子帶信號進行修正的離散余弦變換編碼得到高帶增強數(shù)據(jù),然后將 高帶增強數(shù)據(jù)進行交織矢量量化處理得到高帶增強碼流數(shù)據(jù)。采用本發(fā)明提供的寬帶語音編碼器及其方法,能夠^f吏得聲碼器的帶寬擴
展,從而能夠適用寬帶語音的應(yīng)用;同時,能夠保證較高的編碼效率,且具 有低延遲、低復(fù)雜度的特點。
圖1為本發(fā)明的寬帶語音編碼器的結(jié)構(gòu)框圖2為本發(fā)明寬帶語音編碼器一實施例的結(jié)構(gòu)框圖。
具體實施例方式
如圖l所示,本發(fā)明提供的一種寬帶語音編碼器100,包括預(yù)處理模 塊101、分頻模塊102、低帶編碼器103、低帶解碼器104、差分運算模塊 105、低帶增強編碼器106、高帶增強編碼器107以及碼流復(fù)用模塊108,其 中
預(yù)處理模塊IOI,與分頻模塊102連接,用于對經(jīng)采樣輸入的寬帶數(shù)字 語音信號進行預(yù)處理,濾除其中的信號偏移和0 ~ 50Hz的低頻信號分量;
分頻模塊102,分別與低帶編碼器103及高帶增強編碼器107連接,用 于將經(jīng)過預(yù)處理的寬帶數(shù)字語音信號提取其中的高頻分量和低頻分量,即獲 得高、低子帶信號分別輸出給高帶增強編碼器107和低帶編碼器103;
該分頻模塊102基于一正交鏡像濾波器或者基于高、低通濾波器構(gòu)成。
低帶編碼器103,分別與低帶解碼器104和碼流復(fù)用模塊108連接,用 于對低子帶信號進行編碼得到低帶碼流數(shù)據(jù),分別輸出給低帶解碼器104和 碼流復(fù)用模塊107;
低帶解碼器104,與差分運算模塊105連接,用于對輸入的低帶碼流數(shù) 據(jù)進行解碼得到低子帶語音信號輸出給差分運算模塊105;
差分運算模塊105,分別與分頻模塊102的輸出端和低帶增強編碼器206 的輸入端連接,用于將原始的低子帶信號與經(jīng)低帶解碼器104解碼后的低子 帶語音信號相減得到一個低子帶差分信號輸出給低帶增強編碼器106;
低帶增強編碼器106,與碼流復(fù)用模塊108連接,用于將低子帶差分信 號進行編碼得到低帶增強碼流數(shù)據(jù);
用此低帶增強編碼器106可以減小低帶編解碼器引入的量化噪聲。
高帶增強編碼器107,與碼流復(fù)用模塊108連接,用于將高子帶信號進 行編碼得到高帶增強碼流數(shù)據(jù)輸出給碼流復(fù)用模塊108;
碼流復(fù)用模塊108,用于將低帶碼流數(shù)據(jù)、低帶增強碼流數(shù)據(jù)和高帶增 加碼流數(shù)據(jù)進行復(fù)用打包處理后得到寬帶語音碼流數(shù)據(jù)輸出。
以下結(jié)合具體實施例和附圖對本發(fā)明上述:R術(shù)方案進行詳細(xì)闡述。
如圖2所示,為本發(fā)明上述寬帶語音編碼器的一個實施例的結(jié)構(gòu)框圖。 該寬帶語音編碼器200包括高通濾波器201、 32抽頭的正交鏡像濾波器 (QMF, Quadrature Mirror Filter) 202、低帶編碼器203、低帶解碼器204、 加法器205、低帶增強編碼器206、高帶增強編碼器207以及碼流復(fù)用模塊 208,其中
高通濾波器201,與32抽頭的QMF202連接,將輸入的寬帶數(shù)字語音 信號中的直流偏移和0 ~ 50Hz的低頻分量濾除;
該高通濾波器的傳遞函數(shù)為
其中"取0.97 ~ 0.99之間的一個常數(shù)。
32抽頭的QMF 202,分別與低帶編碼器203和高帶增強編碼器207連 接,將經(jīng)高通濾波的寬帶語音信號分離為高、低子帶信號,分別輸出給高帶 增強編碼器207和低帶編碼器203;
低帶編碼器203,分別與低帶解碼器204和碼流復(fù)用模塊208連接,將 低子帶信號進行編碼得到低帶碼流數(shù)據(jù)輸出給低帶解碼器204和碼流復(fù)用 才莫塊208連接;
低帶編碼器203進一步含有噪聲整形模塊(或感知加權(quán)處理模塊)和A 律脈沖編碼調(diào)制(PCM, Pulse Code Modulation)編碼器(或者其它簡單的 窄帶濾波器),其中
噪聲整形模塊,用于對低子帶信號進行噪聲整形處理(或感知加權(quán)處理),該噪聲整形模塊的噪聲整形函數(shù)為xw(w) = ;c(")+aO<"-l)-x("-1》+6; 式中
;^(")為第n個低子帶樣本信號的噪聲整形輸出;
x("-l)是第n-l個低子帶樣本信號的噪聲整形輸出;
少(w-l)是第n-l個樣本經(jīng)A律PCM編碼器編碼后的輸出;
參數(shù)",6為常數(shù),在本實施例里a取0.8,力取8;
A律PCM編碼器,用于對經(jīng)過噪聲整形后的低子帶信號進行編碼,經(jīng) 過噪聲整形后能夠得到更好的低帶語音解碼質(zhì)量。
低帶解碼器204,與一個加法器的負(fù)輸入端連接,用于對低帶碼流數(shù)據(jù) 進行解碼得到低子帶語音信號^輸出給加法器205負(fù)輸入端;
加法器205,其正輸入端與32抽頭的QMF202的輸出端連接,用于將 原始的低子帶信號&與低子帶語音信號&進行差分運算得到差值
^ = ^ 一 & ,輸出給低帶增強編碼器206;
低帶增強編碼器206,與碼流復(fù)用模塊208連接,用于將^信號進行編 碼后得到低帶增強碼流數(shù)據(jù)輸出給碼流復(fù)用模塊208;
低帶增強編碼器206進一步含有相互連接的低帶增強編碼模塊和加權(quán) 矢量量化器,其中
低帶增強編碼模塊將^信號進行編碼,通過加權(quán)矢量量化器的碼本搜 索處理的到低帶增強碼流數(shù)據(jù)。加權(quán)矢量量化器包括形狀碼本c和增益碼本 g,該加權(quán)矢量量化器的目標(biāo)為使以下距離d最小化,即
其中『,g,.和。.分別是加權(quán)系數(shù)矩陣;其中,加權(quán)部分通過一個有限沖擊 響應(yīng)(FIR, Finite Impulse Response)濾波器實現(xiàn),該FIR濾波器的傳遞函 數(shù)i^以及加權(quán)系數(shù)矩陣『如下『=
9
o
、o -"乂
其中々=0.550107。該FIR濾波器是一個二階的濾波器并且其復(fù)雜度很低。 每8個樣本點進行一次上述的碼本搜索。
高帶增強編碼器207,與碼流復(fù)用模塊208連接,用于將高子帶信號進 行編碼得到高帶增強碼流數(shù)據(jù)輸出給碼流復(fù)用模塊208。
高帶增強編碼器207進一步由相互連接的基于修正的離散余弦變換 (MDCT。 Modified Discrete Cosine Transform)編碼器和交織矢量量化器 (IVQ, Interleave Vector Quantization)組成,其中MDCT編碼器對高子 帶信號進行MDCT編碼處理,再經(jīng)過IVQ量化器進行交織處理生成高帶增 強碼流數(shù)據(jù)。
碼流復(fù)用模塊208,用于將低帶碼流數(shù)據(jù)、低帶增強碼流數(shù)據(jù)和高帶增 加碼流數(shù)據(jù)進行復(fù)用處理得到寬帶語音碼流數(shù)據(jù)輸出。
本發(fā)明的一種寬帶語音編碼方法,包括如下步驟
(a) 提取寬帶數(shù)字語音信號中的高頻分量和低頻分量,即分別得到高、 低子帶信號;
在步驟(a)前需要通過預(yù)處理,將寬帶數(shù)字語音信號中的直流偏移和 0 ~ 50Hz的低頻分量濾除;該預(yù)處理通過高通濾波實現(xiàn)。
(b) 將低子帶信號進行低帶編碼得到低帶碼流數(shù)據(jù);將低帶碼流數(shù)據(jù) 進行低帶增強編碼處理,得到低帶增強碼流數(shù)據(jù);將高子帶信號進行高帶增 強編碼處理高帶增強碼流數(shù)據(jù);
上述步驟中的低帶增強編碼處理是指
將低帶碼流數(shù)據(jù)進行解碼,得到低子帶語音信號;
將原始的低子帶信號和低子帶語音信號進行差分運算得到差值信號;
將差值信號進行低帶增強編碼,得到低帶增強碼流數(shù)據(jù)。(C)將低帶碼流數(shù)據(jù)和高、低帶增強碼流數(shù)據(jù)進行復(fù)用打包處理后得 到寬帶語音碼流數(shù)據(jù)輸出。
由上述實施例可以看出,本發(fā)明提供的寬帶語音編碼器及其方法,通過
使得聲碼器的帶寬擴展,從而使其能夠適用寬帶語音的應(yīng)用;同時,本發(fā)明 具有低延遲、低復(fù)雜度的特點。
當(dāng)然,本發(fā)明還可有其他多種實施例,在不背離本發(fā)明精神及其實質(zhì)的 情況下,熟悉本領(lǐng)域的技術(shù)人員當(dāng)可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變 形,但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護范圍。
1權(quán)利要求
1、一種寬帶語音編碼器,其特征在于,所述編碼器包括分頻模塊、低帶編碼器、低帶解碼器、差分運算模塊、低帶增強編碼器、高帶增強編碼器以及碼流復(fù)用模塊,其中所述分頻模塊,用于從寬帶數(shù)字語音信號中提取高頻分量和低頻分量,得到高子帶信號和低子帶信號,分別輸出給所述高帶增強編碼器和所述低帶編碼器;所述低帶編碼器,用于對所述低子帶信號進行編碼得到低帶碼流數(shù)據(jù),分別輸出給所述低帶解碼器和所述碼流復(fù)用模塊;所述低帶解碼器,用于對所述低帶碼流數(shù)據(jù)進行解碼得到低子帶語音信號輸出給所述差分運算模塊;所述差分運算模塊,用于將原始的低子帶信號與所述低子帶語音信號相減得到一個低子帶差分信號輸出給所述低帶增強編碼器;所述低帶增強編碼器,用于將所述低子帶差分信號進行編碼得到低帶增強碼流數(shù)據(jù)輸出給所述碼流復(fù)用模塊;所述高帶增強編碼器,用于將所述高子帶信號進行編碼得到高帶增強碼流數(shù)據(jù)輸出給所述碼流復(fù)用模塊;所述碼流復(fù)用模塊,用于將所述低帶碼流數(shù)據(jù)、所述低帶增強碼流數(shù)據(jù)以及所述高帶增強碼流數(shù)據(jù)進行復(fù)用打包處理,得到寬帶語音碼流數(shù)據(jù)輸出。
2、 按照權(quán)利要求1所述的編碼器,其特征在于,在所述分頻模塊前還 連接有預(yù)處理模塊,用于將所述寬帶數(shù)字語音信號中的信號偏移和0 ~ 50Hz 的低頻信號分量濾除。
3、 按照權(quán)利要求2所述的編碼器,其特征在于,所述預(yù)處理模塊由一 個高通濾波器構(gòu)成。
4、 按照權(quán)利要求1或2所述的編碼器,其特征在于,所述分頻模塊包括一正交鏡像濾波器,或者包括高、低通濾波器。
5、 按照權(quán)利要求1所述的編碼器,其特征在于,所述低帶編碼器包括噪聲整形模塊和窄帶編碼器,其中,所述噪聲整形模塊用于將所述低子帶信號進行噪聲整形處理;所述窄帶編碼器用于將經(jīng)過噪聲整形處理的低子帶信號進行編碼,得到所述低帶碼流數(shù)據(jù)。
6、 按照權(quán)利要求1所述的編碼器,其特征在于,所述低帶編碼器包括感知加權(quán)處理模塊和窄帶編碼器,其中,所述感知加權(quán)處理模塊用于將所述低子帶信號進行感知加權(quán)處理;所述窄帶編碼器用于將經(jīng)過感知加權(quán)處理的低子帶信號進行編碼,得到所述低帶碼流數(shù)據(jù)。
7、 按照權(quán)利要求5或6所述的編碼器,其特征在于,所述窄帶編碼器由一個A律脈沖編碼調(diào)制編碼器取代。
8、 按照權(quán)利要求1或2所述的編碼器,其特征在于,所述低帶增強編碼器進一步含有相互連接的低帶增強編碼模塊和加權(quán)矢量量化器,其中所述低帶增強編碼模塊用于將所述低子帶差分信號進行編碼得到低帶增強數(shù)據(jù)輸出,所述加權(quán)矢量量化器用于將所述低帶增強數(shù)據(jù)進行加權(quán)矢量量化處理,得到所述低帶增強碼流數(shù)據(jù)。
9、 按照權(quán)利要求8所述的編碼器,其特征在于,所述加權(quán)矢量量化器中進一步含有一有限沖擊響應(yīng)FIR濾波器,所述FIR濾波器用于將所述低帶增強數(shù)據(jù)進行加權(quán)處理。
10、 按照權(quán)利要求1或2所述的編碼器,其特征在于,所述高帶增強編碼器進一步含有相互連接的基于修正的離散余弦變換MDCT編碼器和交織矢量量化器IVQ;其中,所述MDCT編碼器用于將所述高子帶信號進行編碼得到高帶增強數(shù)據(jù),所述IVQ用于將所述高帶增強數(shù)據(jù)進行交織矢量量化處理得到所述高帶增強碼流數(shù)據(jù)。
11、 一種寬帶語音編碼方法,其特征在于,所述方法包括如下步驟(a)提取寬帶數(shù)字語音信號的高頻分量和低頻分量,即得到高子帶信號和低子帶信號;(b) 將所述低子帶信號進行低帶編碼得到所述低帶碼流數(shù)據(jù);將所述低帶碼流數(shù)據(jù)進行低帶增強編碼處理,得到低帶增強碼流數(shù)據(jù);將所述高子帶信號進行高帶增強編碼處理高帶增強碼流數(shù)據(jù);(c) 將所述高帶增強碼流數(shù)據(jù)、低帶增強碼流數(shù)據(jù)以及低帶碼流數(shù)據(jù)進行復(fù)用打包處理后得到寬帶語音碼流數(shù)據(jù)輸出。
12、 按照權(quán)利要求11所述的方法,其特征在于,在步驟(a)前要通過預(yù)處理,將所述寬帶數(shù)字語音信號中的直流偏移和0~50Hz的低頻分量濾除。
13、 按照權(quán)利要求12所述的方法,其特征在于,所述預(yù)處理通過高通濾波實現(xiàn)。
14、 按照權(quán)利要求11至13任一項所述的方法,其特征在于,步驟(b)所述低帶增強編碼處理進一步包括步驟(bl)將所述低帶碼流數(shù)據(jù)進行解碼,得到低子帶語音信號;(b2)將原始的所述低子帶信號和所述低子帶語音信號進行差分運算得到低子帶差值信號;(b3 )將所述低子帶差值信號進行所述低帶增強編碼,得到所述低帶增強碼流數(shù)據(jù)。
15、 按照權(quán)利要求14所述的方法,其特征在于,步驟(b3)所述低帶增強編碼通過將所述低子帶差分信號進行編碼得到低帶增強數(shù)據(jù),然后將所述低帶增強數(shù)據(jù)進行加權(quán)矢量量化處理,得到所述低帶增強碼流數(shù)據(jù)。
16、 按照權(quán)利要求15所述的方法,其特征在于,步驟(b3)所述加權(quán)矢量量化處理,通過有限沖激響應(yīng)FIR濾波實現(xiàn)所述加權(quán)處理。
17、 按照權(quán)利要求14所述的方法,其特征在于,步驟(b)所述高帶增強編碼處理進一步包括步驟將所述高子帶信號進行修正的離散余弦變換編碼得到高帶增強數(shù)據(jù),然后將所述高帶增強數(shù)據(jù)進行交織矢量量化處理得到所述高帶增強碼流數(shù)據(jù)。
全文摘要
一種寬帶語音編碼器,其中分頻模塊從寬帶數(shù)字語音信號中提取高、低頻分量得到高、低子帶信號輸出;低帶編碼器將低子帶信號編碼成低帶碼流數(shù)據(jù)輸出;低帶解碼器將低帶碼流數(shù)據(jù)解碼成低子帶語音信號輸出;差分運算模塊將原始的低子帶信號與低子帶語音信號相減得到一個低子帶差分信號輸出;低帶增強編碼器將低子帶差分信號編碼成低帶增強碼流數(shù)據(jù)輸出;高帶增強編碼器將高子帶信號編碼成高帶增強碼流數(shù)據(jù)輸出;碼流復(fù)用模塊將低帶碼流數(shù)據(jù)、低帶增強碼流數(shù)據(jù)以及高帶增強碼流數(shù)據(jù)進行復(fù)用打包處理成寬帶語音碼流數(shù)據(jù)輸出。本發(fā)明通過擴展聲碼器的帶寬而適用寬帶語音應(yīng)用,且具有低延遲、低復(fù)雜度的特點。
文檔編號G10L19/00GK101488343SQ20081000069
公開日2009年7月22日 申請日期2008年1月14日 優(yōu)先權(quán)日2008年1月14日
發(fā)明者鐘毅睿, 毅 高 申請人:中興通訊股份有限公司