在音頻信號的不連續(xù)傳輸中具有高頻譜時間分辨率的舒緩噪聲的生成的制作方法
【技術領域】
[0001] 本發(fā)明設及音頻信號處理,并且更具體地,設及添加舒緩噪聲至音頻信號。
【背景技術】
[0002] 舒緩噪聲生成器通常用于音頻信號的不連續(xù)傳輸值T幻中,特別含語音的音頻信 號。于此種模式中,該音頻信號首先由語音活動檢測器(VAD)分類為活動帖及不活動帖。根 據該VAD結果,只有該活動語音帖被編碼及W標稱比特率傳輸。于長期暫停期間,于該處只 存在有背景噪聲,比特率降低或歸零,及該背景噪聲使用靜默插入描述符帖(SID帖)偶發(fā) 地且參數地編碼。然后,平均比特率顯著降低。
[0003] 該噪聲在該不活動帖期間于該解碼器端由舒緩噪聲生成器(CNG)生成。實際上 SID帖的大小極有限。因此,描述該背景噪聲之參數數目須保持盡可能地小。為了達成此項 目的,噪聲估計不直接地施加于該頻譜變換的輸出。反而是通過求頻帶群組中的該輸入功 率頻譜的平均,例如遵照己克炬ark)尺標而W較低頻譜分辨率施用。求平均可通過算術或 幾何手段達成。不幸地,于該等SID帖中傳輸的有限參數數目不允許捕捉該背景噪聲的精 密頻譜結構。因此只有噪聲的平滑頻譜包絡可通過CNG再生。當該VAD觸發(fā)CNG帖時,該 重建舒緩噪聲之平滑頻譜與該實際背景噪聲之頻譜間的不一致變成在活動帖(設及該信 號的吵雜語音部分的常規(guī)編碼及解碼)與CNG帖間過渡時極為可聽聞。
【發(fā)明內容】
[0004] 本發(fā)明的目的是提出一種音頻信號處理的改良構思。更明確言之,本發(fā)明的目的 是提出一種舒緩噪聲添加至音頻信號的改良構思。本發(fā)明的該目的通過根據權利要求1的 音頻解碼器,通過權利要求17的系統(tǒng),通過權利要求18的方法及通過權利要求19的計算 機程序達成。
[0005] 在一個方面中,本發(fā)明提出一種被配置用于解碼位串流W從其中產生音頻輸出信 號的音頻解碼器,該位串流包含接著至少一個不活動階段的至少一個活動階段,其中該位 串流已經于其中編碼描述一背景噪聲的一頻譜的至少一個靜默插入描述符帖,該音頻解碼 器包含:
[0006] -靜默插入描述符解碼器,被配置為解碼該靜默插入描述符帖W重建該背景噪聲 的該頻譜;
[0007] -解碼裝置,被配置為在該活動階段期間從該位串流重建該音頻輸出信號;
[0008] -頻譜轉換器,被配置為確定該音頻輸出信號之一頻譜;
[0009] -噪聲估計器裝置,被配置為根據由該頻譜轉換器所提供的該音頻輸出信號之該 頻譜而確定該音頻輸出信號之該噪聲的一第一頻譜,其中該音頻輸出信號之該噪聲的該第 一頻譜具有比如由該靜默插入描述符解碼器所提供的該背景噪聲的該頻譜更高的頻譜分 辨率;
[0010] 一分辨率轉換器,被配置為根據該音頻輸出信號之該噪聲的該第一頻譜而建立該 音頻輸出信號之該噪聲的一第二頻譜,其中該音頻輸出信號之該噪聲的該第二頻譜具有與 如由該靜默插入描述符解碼器所提供的該背景噪聲的該頻譜相同的頻譜分辨率;
[0011] 一舒緩噪聲頻譜估計裝置,具有一定標因子計算裝置,該定標因子計算裝置被配 置為根據如由該靜默插入描述符解碼器所提供的該背景噪聲的該頻譜,及根據如由該分辨 率轉換器所提供的該音頻輸出信號之該噪聲的該第二頻譜,針對一舒緩噪聲的一頻譜計算 定標因子,及具有舒緩噪聲頻譜生成器,該舒緩噪聲頻譜生成器被配置為根據該等定標因 子計算針對一舒緩噪聲的該頻譜;及
[0012] 一舒緩噪聲生成器,被配置為根據針對該舒緩噪聲的該頻譜在該不活動階段期間 產生該舒緩噪聲。
[0013] 該位串流含有活動階段及不活動階段,其中活動階段為含有該音頻信息的期望成 分諸如語音或樂音的一階段,而一不活動階段為不含有該音頻信息的任何期望成分的一階 段。不活動階段通常出現在暫停期間,于該處不存在有期望成分,諸如樂音或語音。因此, 不活動階段通常只含有背景噪聲。于含有編碼音頻信號的該位串流中的信息被嵌置于所謂 的帖內,其中此等帖各自含有指稱某個時間的音頻信息。于活動階段期間,包含音頻信息包 括有關該期望信號的音頻信息的活動帖可在該位串流內部傳輸。相反地,于不活動階段期 間,包含噪聲信息的靜默插入描述符帖可W比該等活動階段的平均比特率更低的一平均比 特率而在該位串流內部傳輸。
[0014] 靜默插入描述符解碼器被配置為解碼該靜默插入描述符帖,因而重建該背景噪聲 的頻譜。但此背景噪聲的頻譜,因在該靜默插入描述符帖中傳輸的參數數目有限之故,不允 許捕捉該背景噪聲的精密頻譜結構。
[0015] 解碼裝置可為于活動階段期間,能夠解碼位串流(其為含音頻信息的一數字數據 串流)的裝置或計算機程序。該解碼過程可獲得一數字解碼音頻輸出信號,其可饋送至一 D/A轉換器W產生一模擬音頻信號,其然后可饋送至一揚聲器W產生一可聽聞信號。
[0016] 頻譜轉換器可獲得音頻輸出信號的一頻譜,其具有比如由該靜默插入描述符解碼 器所提供的該背景噪聲的頻譜顯著地更高的頻譜分辨率。
[0017] 因此,該噪聲估計器可根據由該頻譜轉換器所提供的該音頻輸出信號之頻譜而確 定該音頻輸出信號的噪聲之一第一頻譜,其中該音頻輸出信號的噪聲之該第一頻譜具有比 如由該靜默插入描述符解碼器所提供的該背景噪聲的頻譜更高的頻譜分辨率。
[0018] 進一步地,該分辨率轉換器可根據該音頻輸出信號的噪聲之該第一頻譜而建立該 音頻輸出信號的噪聲之一第二頻譜,其中該音頻輸出信號的噪聲之該第二頻譜具有與如由 該靜默插入描述符解碼器所提供的該背景噪聲的頻譜相同的頻譜分辨率。
[0019] 定標因子計算裝置可根據如由該靜默插入描述符解碼器所提供的該背景噪聲的 頻譜,及根據如由該分辨率轉換器所提供的該音頻輸出信號之噪聲的該第二頻譜,針對舒 緩噪聲的一頻譜而容易地計算定標因子,原因在于由該靜默插入描述符解碼器所提供的該 背景噪聲的頻譜與該音頻輸出信號之噪聲的該第二頻譜具有相同頻譜分辨率之故。
[0020] 舒緩噪聲頻譜生成器可根據該定標因子及根據如由噪聲估計裝置所提供的該音 頻輸出信號之噪聲的該第一頻譜而針對該舒緩噪聲建立頻譜。
[0021] 此外,該舒緩噪聲生成器可根據該舒緩噪聲的頻譜而于該不活動階段期間產生該 舒緩噪聲。
[0022] 于解碼器獲得的噪聲估值含有有關該背景噪聲之頻譜結構之信息,該信息比含在 該等SID帖的有關該背景噪聲的平滑頻譜包絡之信息更準確。但此等估值無法于不活動階 段期間更新,原因在于噪聲估計是活動階段期間在已解碼音頻輸出信號上進行之故。相反 地,SID帖于不活動階段期間傳遞有關頻譜包絡的新穎信息。依據本發(fā)明之解碼器組合此 二信息源。定標因子可于活動階段期間取決于在解碼器端的噪聲估值更新,及于不活動階 段期間,取決于含在SID帖的噪聲估值更新。定標因子的連續(xù)更新確保所產生的舒緩噪聲 特性不會有急劇改變。
[0023] 因含在SID帖的該背景噪聲的頻譜與該音頻輸出信號之噪聲的該第二頻譜具有 相同頻譜分辨率,故定標因子的更新及因而舒緩噪聲的更新可W容易的方式完成,原因在 于針對含在SID帖的該背景噪聲的頻譜之各個頻帶群組,在該音頻輸出信號之噪聲的該第 二頻譜中恰存在有一個頻帶群組。須注意于一優(yōu)選實施例中,含在SID帖的該背景噪聲的 頻譜之該等頻帶群組與該音頻輸出信號之噪聲的該第二頻譜之該等頻帶群組彼此相對應。
[0024] 此外,因含在SID帖的該背景噪聲的頻譜與該音頻輸出信號之該噪聲的該第二頻 譜具有相同頻譜分辨率,故定標因子的更新不會產生或幾乎不會產生可聽聞鬼影(audible artifact)。
[00巧]依據本發(fā)明之一優(yōu)選實施例,該頻譜分析器包含一快速傅里葉變換裝置。一快速 傅里葉變換(FFT)為只需要低運算努力的計算離散傅里葉變換值FT)及其反變換的一算 法。因此,該快速傅里葉變換裝置可容易地計算該音頻輸出信號之該頻譜。
[0026] 依據本發(fā)明之一優(yōu)選實施例,在該解碼器的該噪聲估計器裝置包含一轉換器裝 置,該轉換器裝置被配置為將該音頻輸出信號之該頻譜轉換成通常具有遠更低的一頻譜分 辨率之該音頻輸出信號之一轉換頻譜。通過提供該音頻輸出信號之該轉換頻譜,可減低隨 后運算步驟之復雜度。
[0027] 依據本發(fā)明之一優(yōu)選實施例,該噪聲估計器裝置包含一噪聲估計器,被配置為根 據由該轉換器裝置所提供的該音頻輸出信號之該轉換頻譜W確定該音頻輸出信號之該噪 聲的該第一頻譜。當該音頻輸出信號之該轉換頻譜用作為于該解碼器的噪聲估計的基礎 時,可減少運算努力而不降低噪聲估計的質量。
[0028] 依據本發(fā)明之一優(yōu)選實施例,該定標因子計算裝置被配置為根據公式 乏w(l) = 計算該定標因子,其中