本發(fā)明涉及音頻編碼領域,具體是一種音頻帶寬擴展的方法及擴展裝置。
背景技術:
心理聲學研究表明人們對于音頻不同頻率下的敏感性具有差異,對低頻更敏感而對高頻不敏感,因此在音頻編碼中常常不對高頻進行編碼以節(jié)省碼率。而高頻部分的完全缺失又會帶來聽感上的不適,因此往往采用帶寬擴展的方式恢復高頻。基于lpc的帶寬擴展技術是目前低碼率、低復雜度的代表技術。它通過提取表征高頻包絡的lpc參數(shù),子帶能量,然后對得到高頻的低頻信號進行調整,從而完成高頻重建。我國自主研發(fā)的移動音頻編解碼器avs-p10也采用了這種帶寬擴展方法。
在對現(xiàn)有方法的研究和實踐中,存在以下弊端:算法中對于信號的高頻部分統(tǒng)一通過基于語音產(chǎn)生原理的lpc的帶寬擴展算法進行編碼,通過將低頻信號的殘差信號作為高頻激勵并結合線性預測編碼技術實現(xiàn)高頻的重建。從原理上來看,avs-p10帶寬擴展技術采用的一種典型的參數(shù)編碼技術。其對語音信號的高頻重建具有良好的效果,而對音樂信號的高頻重建效果不佳,不能根據(jù)信號的類型與特征做自適應的調整。
技術實現(xiàn)要素:
本發(fā)明的目的在于提供一種音頻帶寬擴展的方法及擴展裝置,以解決上述背景技術中提出的問題。
為實現(xiàn)上述目的,本發(fā)明提供如下技術方案:
一種音頻帶寬擴展的方法,包括如下步驟:
步驟1,通過檢測當前幀信號在混合acelp/tvc核心編碼器中的編碼模式來區(qū)分信號類型;
若當前幀信號在核心編碼器的編碼模式為acelp256,則當前幀為語音信號;
若當前幀信號在核心編碼器的編碼模式為tvc256、tvc512、tvc1024,則當前幀為音樂信號;
步驟2,同時基于信號類型分別對語音和音樂信號選擇自適應的高頻重建策略;
若為語音信號,則采用基于lpc的帶寬擴展方法;
若為音樂信號,則采用基于高低頻信號相關性的頻帶復制帶寬擴展方法。
作為本發(fā)明進一步方案:所述對于語音信號,采用基于lpc的帶寬擴展方法具體為:
(1)提取低頻殘差信號作為激勵信號;
低帶原始信號經(jīng)過低帶線性預測逆濾波器濾波后得到低帶殘差信號作為激勵信號,低帶的線性預測系數(shù)每幀更新一次;每一個1024樣點超幀的低帶激勵信號通過長度為288樣點,重疊區(qū)域為32樣點的余弦窗分割為四個長度288樣點的幀
(2)提取高頻lpc系數(shù),表征高頻包絡信息;
對每一幀高頻原始信號進行一次八階線性預測分析,得到一組八階的線性預測編碼系數(shù),并轉換為導抗頻譜對系數(shù),導抗頻譜對系數(shù)進一步變換為導抗譜頻率系數(shù);量化后的導抗譜頻率系數(shù)變換為量化后線性預測系數(shù),并以此產(chǎn)生高頻合成濾波器;假設高頻合成濾波器288點的沖擊響應為,用288點的快速傅里葉變換將變換到頻域,以此表示原始高頻信號的頻譜包絡;
(3)利用高頻包絡信息和低頻殘差信號得到準高頻信號;
每一幀的低帶激勵信號和高帶合成濾波器的沖擊響應用288點的fft變換到頻域;高帶合成濾波器沖擊響應的288點fft系數(shù)用其中的最大值歸一化;將低帶激勵信號的fft系數(shù)乘以歸一化的高帶合成濾波器的沖擊響應fft系數(shù)就可以得到頻域的基礎信號;
(4)提取高低頻對應頻帶之間的增益信息;
計算288樣點幀準高頻信號和原始高頻信號對應子帶間的能量增益,
(5)利用高頻信號的譜包絡信息及增益信息調整原始低頻信號生成的高頻激勵信號來重建高頻信號。
作為本發(fā)明進一步方案:所述對于音樂信號,采用基于高低頻信號相關性的頻帶復制帶寬擴展方法具體為:
(1)對原始高低頻信號進行加窗并變換到頻域;
利用重疊區(qū)域為32樣點的余弦窗對每一個256樣點幀的原始高低頻信號進行加窗,得到288樣點幀;對加窗后的原始信號和高頻信號通過fft變換到頻域;
(2)計算高低頻信號對應頻帶之間的相關性,若相關性較高,則將低頻信號復制到高頻頻段用于高頻重建;若高低頻信號之間的相關性較低,則將白噪聲信號填充到高頻頻段用于高頻重建;
針對每一個288樣點幀,計算對應高低頻信號之間的相關性,從而確定用低頻信號還是白噪聲信號來重建;
(3)提取能量參數(shù);
若采用低頻信號來復制高頻信號,需提取對應低頻子帶的能量增益;若采用白噪聲重建高頻,則需提取高頻子帶平均能量;
(4)利用能量參數(shù)調整復制的低頻信號或白噪聲信號完成高頻重建。
一種所述音頻帶寬擴展的擴展裝置,包括信號類型檢測模塊、語音信號帶寬擴展模塊和音樂信號帶寬擴展模塊,
所述信號類型檢測模塊,用于檢測當前幀信號在混合acelp/tvc核心編碼器中的編碼模式來區(qū)分信號類型;
所述語音信號帶寬擴展模塊,用于完成語音幀信號的高頻重建,
所述音樂信號帶寬擴展模塊,用于完成音樂幀信號的高頻重建。
作為本發(fā)明進一步方案:所述語音信號帶寬擴展模塊包括:
低頻殘差提取模塊,提取低頻殘差信號作為激勵信號,低帶原始信號經(jīng)過低帶線性預測逆濾波器濾波后得到低帶殘差信號作為激勵信號,低帶的線性預測系數(shù)每幀更新一次;每一個1024樣點超幀的低帶激勵信號通過長度為288樣點,重疊區(qū)域為32樣點的余弦窗分割為四個長度288樣點的幀;
包絡信息提取模塊,提取高頻lpc系數(shù),表征高頻包絡信息,提取高頻lpc系數(shù),表征高頻包絡信息,具體為,對每一幀高頻原始信號進行一次八階線性預測分析,得到一組八階的線性預測編碼系數(shù),并轉換為導抗頻譜對系數(shù),導抗頻譜對系數(shù)進一步變換為導抗譜頻率系數(shù);量化后的isf系數(shù)變換為量化后線性預測系數(shù),并以此產(chǎn)生高頻合成濾波器;假設高頻合成濾波器288點的沖擊響應為,用288點的快速傅里葉變換將變換到頻域,以此表示原始高頻信號的頻譜包絡;
增益提取模塊,提取高頻與準高頻信號之間的對應頻帶之間的增益信息,計算288樣點幀準高頻信號和原對應子帶間的能量增益,并進行編碼傳遞到解碼端;
重建模塊,用于利用增益信息調整調整準高頻信號完成高頻重建。
作為本發(fā)明再進一步方案:所述音樂信號帶寬擴展模塊包括:
加窗轉換模塊,對原始高低頻信號進行加窗并變換到頻域,利用重疊區(qū)域為32樣點的余弦窗對每一個256樣點幀的原始高低頻信號進行加窗,得到288樣點幀;對加窗后的原始信號和高頻信號通過fft變換到頻域;
相關性計算模塊,計算高低頻信號對應頻帶之間的相關性,針對每一個288樣點幀,計算對應高低頻信號之間的相關性,從而確定用低頻信號還是白噪聲信號來重建;
能量參數(shù)提取模塊,提取指導高頻重建所需的能量參數(shù),采用低頻信號來復制高頻信號,需提取對應低頻子帶的能量增益;若采用白噪聲重建高頻,則需提取高頻子帶平均能量;
重建模塊,用于利用能量參數(shù)調整低頻或白噪聲信號完成高頻重建。
與現(xiàn)有技術相比,本發(fā)明的有益效果是:
本發(fā)明充分考慮到了不同信號類型的特性,從信號類型的角度著手,通過檢測當前幀信號的acelp/tvc編碼模式判斷當前幀的信號類型(語音/音樂),再基于信號類型分別對語音和音樂信號進行自適應的高頻重建策略,以提高音頻恢復質量。因此本發(fā)明實施例技術方案能夠更準確的進行高頻重建。
附圖說明
圖1是本發(fā)明實施例帶寬擴展的方法流程圖。
圖2是本發(fā)明實施例語音幀信號高頻重建策略流程圖。
圖3是本發(fā)明實施例音樂幀信號高頻重建策略流程圖。
圖4是本發(fā)明實施例帶寬擴展的模塊裝置圖。
具體實施方式
下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
如圖1所示,是本發(fā)明實施例的方法流程圖,音頻帶寬擴展的方法,包括以下步驟:
步驟101:檢測當前幀信號在混合acelp/tvc核心編碼器中的編碼模式來區(qū)分信號類型,若當前幀信號在核心編碼器的編碼模式為acelp256,則當前幀為語音信號;若當前幀信號在核心編碼器的編碼模式為tvc256、tvc512、tvc1024,則當前幀為音樂信號;
步驟102:基于信號類型分別對語音和音樂信號選擇自適應的高頻重建策略,若為語音信號,則采用基于lpc的帶寬擴展策略;若為音樂信號,則采用基于高低頻信號相關性的頻帶復制帶寬擴展策略。
本發(fā)明針對語音幀信號和音樂幀信號分別采用不同的帶寬擴展策略,下面將分別介紹。
如圖2所示,是本發(fā)明實施例語音幀信號高頻重建策略流程圖,包括以下步驟:
步驟201,提取低頻殘差信號作為激勵信號,低帶原始信號經(jīng)過低帶線性預測逆濾波器濾波后得到低帶殘差信號作為激勵信號,低帶的線性預測系數(shù)每幀更新一次。每一個1024樣點超幀的低帶激勵信號通過長度為288樣點,重疊區(qū)域為32樣點的余弦窗分割為四個長度288樣點的幀。
步驟202,提取高頻lpc系數(shù)表征高頻包絡信息,對每一幀高頻原始信號進行一次八階線性預測分析,得到一組八階的線性預測編碼(lpc)系數(shù),并轉換為導抗頻譜對(isp)系數(shù),導抗頻譜對系數(shù)進一步變換為導抗譜頻率(isf)系數(shù)。量化后的isf系數(shù)變換為量化后線性預測系數(shù),并以此產(chǎn)生高頻合成濾波器。假設高頻合成濾波器288點的沖擊響應為,用288點的快速傅里葉變換(fft)將變換到頻域,以此表示原始高頻信號的頻譜包絡。
步驟203,利用步驟202得到的高頻包絡信息和步驟201得到的低頻殘差信號得到準高頻信號,每一幀的低帶激勵信號和高帶合成濾波器的沖擊響應用288點的fft變換到頻域。高帶合成濾波器沖擊響應的288點fft系數(shù)用其中的最大值歸一化。將低帶激勵信號的fft系數(shù)乘以歸一化的高帶合成濾波器的沖擊響應fft系數(shù)就可以得到頻域的準高頻信號。
步驟204,提取增益信息,計算288樣點幀準高頻信號和原始高頻信號對應子帶間的能量增益。
步驟205,高頻重建,利用步驟204得到的能量增益調整步驟203得到的準高頻信號完成高頻重建。
如圖3所示,是本發(fā)明實施例音樂幀信號高頻重建策略流程圖,包括以下步驟:
步驟301,對原始高低頻信號進行加窗并變換到頻域,利用重疊區(qū)域為32樣點的余弦窗對每一個256樣點幀的原始高低頻信號進行加窗,得到288樣點幀。對加窗后的原始信號和高頻信號通過fft變換到頻域。
步驟302,計算高低頻信號對應頻帶之間的相關性,針對每一個288樣點幀,通過計算對應高低頻信號之間的相關性,從而確定用低頻信號還是白噪聲信號來重建。
步驟303,提取能量參數(shù),根據(jù)步驟302相關性計算判斷的結果,若采用低頻信號來復制高頻信號,需提取對應低頻子帶的能量增益。若采用白噪聲重建高頻,則需提取高頻子帶平均能量。
步驟304,高頻重建,利用步驟303得到的能量參數(shù)調整步驟304得到的激勵信號完成高頻重建。
如圖4所示,一種音頻帶寬擴展的裝置,包括:信號類型檢測模塊401、語音信號帶寬擴展模塊402、音樂信號帶寬擴展模塊403。
信號類型檢測模塊401,用于檢測當前幀信號在混合acelp/tvc核心編碼器中的編碼模式來區(qū)分信號類型。
語音信號帶寬擴展模塊402,用于完成語音幀信號的高頻重建;
音樂信號帶寬擴展模塊403,用于完成音樂幀信號的高頻重建。
所述語音信號帶寬擴展模塊402,進一步包括:低頻殘差提取模塊4021,包絡信息提取模塊4022,增益提取模塊4023,重建模塊4024。
低頻殘差提取模塊4021,用于提取低頻殘差信號作為激勵信號;
包絡信息提取模塊4022,用于提取高頻lpc系數(shù),表征高頻包絡信息;
增益提取模塊4023,用于提取高頻與準高頻信號之間的對應頻帶之間的增益信息;
重建模塊4024,用于利用增益信息調整調整準高頻信號完成高頻重建。
所述音樂信號帶寬擴展模塊,進一步包括:加窗轉換模塊4031,相關性計算模塊4032,能量參數(shù)提取模塊4033,重建模塊4034。
加窗轉換模塊4031,用于對原始高低頻信號進行加窗并變換到頻域。
相關性計算模塊4032,用于計算高低頻信號對應頻帶之間的相關性。
能量參數(shù)提取模塊4033,用于提取指導高頻重建所需的能量參數(shù)。
重建模塊4034,用于利用能量參數(shù)調整低頻或白噪聲信號完成高頻重建。
對于本領域技術人員而言,顯然本發(fā)明不限于上述示范性實施例的細節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,無論從哪一點來看,均應將實施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權利要求而不是上述說明限定,因此旨在將落在權利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。不應將權利要求中的任何附圖標記視為限制所涉及的權利要求。