具有噪聲檢測和響度下降檢測的響度控制的制作方法
【專利摘要】響度控制系統(tǒng)或方法可以將音頻信號標準化成預定的響度水平。如果音頻信號包括平穩(wěn)的背景噪聲,那么該背景噪聲也會被標準化成目標響度水平。可以使用內(nèi)容對噪聲分類來檢測噪聲信號,并且可以基于噪聲檢測來調(diào)整響度控制系統(tǒng)或方法。噪聲信號可以通過在頻域或時域中的信號分析來檢測。響度控制系統(tǒng)還會在內(nèi)容從高的整體響度水平轉(zhuǎn)移到較低的整體響度水平時產(chǎn)生不期望的音頻效果。這種響度下降可以被檢測到,并且響度控制系統(tǒng)可以被調(diào)整以在響度水平之間的轉(zhuǎn)變期間將不期望的效果最小化。
【專利說明】具有噪聲檢測和響度下降檢測的響度控制
[0001] 相關(guān)申請的交叉引用
[0002] 本申請要求享有于2012年7月12日提交的美國臨時申請No. 61/670, 991、以及 于2012年7月12日提交的美國臨時申請No. 61/671,005的權(quán)益,這些申請通過引用合并 于此,如同充分闡述一樣。
【技術(shù)領域】
[0003] 本申請涉及響度控制系統(tǒng)。
【背景技術(shù)】
[0004] 響度控制系統(tǒng)可以被設計成根據(jù)具有不同響度水平的輸入音頻信號生成具有均 勻響度水平的輸出音頻信號。這些系統(tǒng)可以在例如音頻廣播鏈的應用中使用,以及在音頻 回放設備中使用,在所述音頻回放設備中,可以使用不同響度水平的多內(nèi)容源。響度控制系 統(tǒng)的一個示例目標可以是自動提供具有均勻的平均響度水平的輸出信號,消除了聽者要持 續(xù)調(diào)整對他們的回放設備的音量控制的需要。
[0005] 與響度控制系統(tǒng)有關(guān)的是自動增益控制(AGC)系統(tǒng)和動態(tài)范圍控制(DRC)系統(tǒng)。 AGC系統(tǒng)是現(xiàn)代響度控制系統(tǒng)的先驅(qū),并且在通信和廣播應用方面具有較長的歷史,其中, 許多早期設計被實施為模擬電路。AGC系統(tǒng)可以通過將輸入信號與時變增益信號相乘來運 行,其中,所述增益信號被控制以使輸出信號的客觀測量被標準化(normalize)成預定的 目標水平??梢允褂美缇礁≧MS)測量、峰值測量、幅度測量、或能量測量之類的客觀 測量?,F(xiàn)有的AGC設計的一個缺陷在于感知的輸出信號的響度仍然會不可預測。這是因為 心理聲學現(xiàn)象--感知的響度是主觀測量,其僅大致與客觀測量(例如,RMS水平、峰值水 平、幅度水平或能量水平)相關(guān)。因此,盡管AGC可能足以控制輸出信號的RMS值,但是其 不能必然導致感知的響度是均勻的。
[0006] DRC系統(tǒng)也與響度控制系統(tǒng)有關(guān),但是具有稍微不同的目標。DRC系統(tǒng)假設信號的 長期平均水平已經(jīng)被標準化成期望的水平,并且試圖僅修改短期動態(tài)。DRC系統(tǒng)可以將所述 動態(tài)壓縮,以使響亮的事件衰減,并且安靜的事件放大。這不同于響度控制系統(tǒng)要對信號的 平均響度水平進行標準化、同時保持短期信號動態(tài)的目標。
[0007] 現(xiàn)代響度控制系統(tǒng)試圖通過從心里聲學和響度感知的領域引入知識來改善AGC 設計和DRC設計。響度控制系統(tǒng)可以通過估計輸入信號的感知響度和控制時變增益、使得 輸出信號的平均響度水平可以被標準化成預定的目標響度水平的方式來運行。
[0008] 現(xiàn)有的響度控制系統(tǒng)的問題在于沒有在期望的內(nèi)容與不期望的噪聲之間做出區(qū) 另IJ,使得大于預定閾值的所有低水平音頻內(nèi)容都被放大。針對現(xiàn)有的響度控制系統(tǒng)的常見 的問題信號是具有平穩(wěn)的背景噪聲的演講。如果在演講中存在長間歇,那么響度控制系統(tǒng) 會開始放大背景噪聲。所導致的信噪比(SNR)的降低對于一些聽者而言會是反感的。期望 的是,響度控制系統(tǒng)避免噪聲水平的相對放大,因此保持輸入信號的SNR。
[0009] 對于響度控制系統(tǒng)的另一挑戰(zhàn)的場景是在不負面地限制內(nèi)容內(nèi)短期信號動態(tài)的 情況下,維持均勻的平均響度水平。對響度變化快速反應的系統(tǒng)可以始終實現(xiàn)期望的目標 水平,但是以降低的短期信號動態(tài)為代價。另一方面,對響度變化反應較慢的系統(tǒng)可能不能 有效地控制響度水平,或者可能呈現(xiàn)出明顯的偽像(artifact),例如,在輸入信號響度水平 的較大變化期間的斜坡。較大的長期響度變化在內(nèi)容間轉(zhuǎn)變期間最常見,例如,程序轉(zhuǎn)變或 內(nèi)容源變化。期望的是,通過不同方式解決響度控制系統(tǒng)內(nèi)的內(nèi)容內(nèi)和內(nèi)容間波動,使得保 持內(nèi)容內(nèi)短期信號動態(tài)、同時快速控制較大的內(nèi)容間響度轉(zhuǎn)變。
【發(fā)明內(nèi)容】
[0010] 響度控制系統(tǒng)和方法可以將音頻內(nèi)容標準化成預定的響度水平。如果音頻內(nèi)容包 括平穩(wěn)的背景噪聲,那么該背景噪聲也會被標準化成目標響度水平??梢允褂脙?nèi)容對噪聲 分類來檢測噪聲信號,并且可以基于噪聲檢測來調(diào)整響度控制系統(tǒng)或方法,以保持輸入信 號的SNR。噪聲信號可以通過在頻域或時域中的信號分析來檢測。響度控制系統(tǒng)還會在內(nèi) 容從高的長期響度水平轉(zhuǎn)變到較低的長期響度水平時產(chǎn)生不期望的音頻偽像。這種響度下 降可以被檢測到,并且響度控制系統(tǒng)可以被調(diào)整以在響度水平之間的轉(zhuǎn)變期間將不期望的 偽像最小化。
[0011] 根據(jù)一個實施方式,響度控制系統(tǒng)可以被配置成處理音頻信號。該響度控制系統(tǒng) 可以包括響度測量模塊,被配置成生成對所述音頻信號的短期響度估計。該響度控制系統(tǒng) 還可以包括噪聲檢測模塊,被配置成產(chǎn)生所述音頻信號的內(nèi)容對噪聲分類。該響度控制系 統(tǒng)還可以包括時間平滑模塊,被配置成基于內(nèi)容對噪聲分類結(jié)果調(diào)整至少一個平滑因子, 并使用所述至少一個平滑因子、基于所述短期響度估計生成對所述音頻信號的長期響度估 計。該響度控制系統(tǒng)還可以包括增益校正模塊,被配置成基于所述長期響度估計向所述音 頻信號應用時變增益。所述噪聲檢測模塊可以被配置成使用頻域噪聲檢測或時域噪聲檢測 來產(chǎn)生所述內(nèi)容對噪聲分類結(jié)果。所述至少一個平滑因子可以包括消逝平滑因子,該消逝 平滑因子控制所述增益校正模塊能夠增加增益水平的速度。所述內(nèi)容對噪聲分類可以標準 化在范圍[0,1]上。該響度控制系統(tǒng)還可以包括響度下降檢測模塊,被配置成生成響度下 降檢測值,其中,所述時間平滑模塊還可以被配置成基于所述響度下降檢測值調(diào)整所述至 少一個平滑因子。
[0012] 根據(jù)另一實施方式,響度控制系統(tǒng)可以被配置成處理音頻信號。該響度控制系統(tǒng) 可以包括響度測量模塊,被配置成生成對所述音頻信號的短期響度估計。該響度控制系統(tǒng) 還可以包括響度下降檢測模塊,被配置成生成響度下降檢測值。該響度控制系統(tǒng)還可以包 括時間平滑模塊,被配置成基于所述響度下降檢測值調(diào)整至少一個平滑因子,并使用所述 至少一個平滑因子、基于所述短期響度估計生成對所述音頻信號的長期響度估計。該響度 控制系統(tǒng)還可以包括增益校正模塊,被配置成基于所述長期響度估計向所述音頻信號應用 時變增益。所述至少一個平滑因子可以包括消逝平滑因子,該消逝平滑因子控制所述增益 校正模塊能夠增加增益水平的速度。所述響度下降檢測值可以標準化在范圍[0, 1]上。該 響度控制系統(tǒng)還可以包括噪聲檢測模塊,被配置成產(chǎn)生所述音頻信號的內(nèi)容對噪聲分類, 其中,所述時間平滑模塊還可以被配置成基于所述內(nèi)容對噪聲分類調(diào)整所述至少一個平滑 因子。
[0013] 根據(jù)另一實施方式,系統(tǒng)可以被配置成執(zhí)行頻域噪聲檢測。該系統(tǒng)可以包括求和 組件,被配置成接收包括多個信道的輸入信號,并通過對所述多個信道進行求和來生成單 聲道(mono)信號。該系統(tǒng)還可以包括短期傅里葉變換(STFT)組件,被配置成通過向所述單 聲道信號應用STFT來生成頻域信號。該系統(tǒng)還可以包括分貝轉(zhuǎn)換器,被配置成基于所述頻 域信號生成功率頻譜,并將所述功率頻譜轉(zhuǎn)換到分貝(dB)域。該系統(tǒng)還可以包括時間平滑 組件,被配置成通過估計所述功率頻譜的每個頻帶的能量的時間平均來生成時間平滑的功 率頻譜。該系統(tǒng)還可以包括頻譜通量測量組件,被配置成通過計算所述功率頻譜與所述時 間平滑的功率頻譜的平均差來計算所述功率頻譜的頻譜通量值。該系統(tǒng)還可以包括成峰度 (peakiness)測量組件,被配置成通過估計所述功率頻譜的每個子帶的音調(diào)(tonal)特性 來生成成峰度值,所述估計所述功率頻譜的每個子帶的音調(diào)特性是通過測量子帶相比于其 鄰居的相對能量實現(xiàn)的。該系統(tǒng)還可以包括信噪比(SNR)估計器組件,被配置成基于所述 功率頻譜的頻譜通量值、所述成峰度值和所述功率頻譜估計噪聲功率頻譜,并生成信噪比 (SNR)。該系統(tǒng)還可以包括時間平滑組件,被配置成基于所述SNR生成平滑的SNR。該系統(tǒng) 還可以包括滯后組件,被配置成基于所述SNR生成所述輸入信號的內(nèi)容對噪聲分類值。所 述SNR估計器組件可以被配置成通過從所述信號的原始頻譜中移除任何時間動態(tài)或音調(diào) 分量來估計所述信號的所述噪聲功率頻譜,所述時間動態(tài)或音調(diào)分量被假設為是期望的內(nèi) 容的分量。所述內(nèi)容對噪聲分類可以標準化在范圍[0, 1]上。所述信噪比估計器組件可以 被配置成計算寬帶噪聲水平和信號水平。該系統(tǒng)可以被包括在響度控制系統(tǒng)中,其中,所述 響度控制系統(tǒng)可以包括時間平滑組件,該時間平滑組件被配置成基于內(nèi)容對噪聲分類值調(diào) 整增益校正速度。
[0014] 根據(jù)另一實施方式,系統(tǒng)可以被配置成執(zhí)行時域噪聲檢測。該系統(tǒng)可以包括求和 組件,被配置成接收包括多個信道的輸入信號,并通過對所述多個信道進行求和來生成單 聲道信號。該系統(tǒng)還可以包括均方根(RMS)組件,被配置成將所述單聲道信號轉(zhuǎn)換成短期 包絡估計。該系統(tǒng)還可以包括分貝轉(zhuǎn)換器,被配置成對所述短期包絡估計執(zhí)行分貝(dB)轉(zhuǎn) 換。該系統(tǒng)還可以包括平滑濾波器,被配置成對所述短期包絡估計取平均,以生成長期均值 包絡估計。該系統(tǒng)還可以包括減法組件,被配置成從所述短期包絡估計中減去所述長期均 值包絡估計,以生成包絡值。該系統(tǒng)還可以包括半波整流組件,被配置成對所述包絡值進行 半波整流。該系統(tǒng)還可以包括至少兩個平滑濾波器,被配置成基于所述包絡值估計啟動能 量的均值和偏移能量的均值。該系統(tǒng)還可以包括標準化誤差計算器,被配置成計算所述啟 動能量的均值與所述偏移能量的均值之間的標準化的平方誤差。該系統(tǒng)還可以包括時間平 滑組件,被配置成對所述標準化的平方誤差進行時間平滑。該系統(tǒng)還可以包括滯后組件,被 配置成向所述平滑的標準化的平方誤差應用滯后,以生成內(nèi)容對噪聲分類。所述平滑濾波 器可以被配置成對所述短期包絡估計取指數(shù)移動平均(EM)。所述時間平滑組件使用與信 號有關(guān)的平滑因子。所述平滑因子區(qū)分起音(attack)特性和消逝(release)特性。所述 內(nèi)容對噪聲分類被標準化在范圍[0, 1]上。所要求保護的系統(tǒng)可以被包括在響度控制系統(tǒng) 中,其中,所述響度控制系統(tǒng)可以包括時間平滑組件,該時間平滑組件被配置成基于所述內(nèi) 容對噪聲分類值調(diào)整增益校正速度。
[0015] 根據(jù)另一實施方式,系統(tǒng)可以被配置成執(zhí)行響度下降檢測。該系統(tǒng)可以包括短期 響度測量模塊,被配置成接收輸入信號,并基于所述輸入信號計算短期響度估計。該系統(tǒng) 還可以包括至少兩個時間平滑濾波器,被配置成計算慢速平滑響度估計和快速平滑響度估 計。該系統(tǒng)還可以包括減法模塊,被配置成從所述慢速平滑響度估計中減去所述快速平滑 響度估計,以生成差值。該系統(tǒng)還可以包括半波整流器模塊,被配置成對所述差值進行半波 整流,以生成整流后的差值。該系統(tǒng)還可以包括標準化模塊,被配置成對所述整流后的差值 進行標準化,以生成下降檢測值。所述短期響度測量模塊可以被配置成使用ITU-R BS. 1770 響度測量來計算所述短期響度估計。所述至少兩個時間平滑濾波器可以被配置成分別使用 慢速平滑因子和快速平滑因子,其中,所述慢速平滑因子和所述快速平滑因子基于所述輸 入信號的動態(tài)來被動態(tài)修改。針對具有高信號動態(tài)測量的輸入信號,所述慢速平滑因子和 所述快速平滑因子可以相互減慢。針對具有低信號動態(tài)測量的輸入信號,所述慢速平滑因 子和所述快速平滑因子可以相互加快。所述標準化模塊可以使用轉(zhuǎn)化(translation)、縮 放(scale)和飽和(saturation)來計算所述下降檢測值。所述標準化模塊可以被配置成 在[0, 1]的范圍中生成所述下降檢測值,其中,為1的下降檢測值指示檢測到響度下降,并 且為〇的下降檢測值指示沒有檢測到下降。該系統(tǒng)可以被包括在響度控制系統(tǒng)中,其中,所 述響度控制系統(tǒng)可以包括時間平滑組件,該時間平滑組件被配置成基于所述下降檢測值調(diào) 整增益校正速度。
【專利附圖】
【附圖說明】
[0016] 圖1不出了輸入聲波經(jīng)過音頻處理系統(tǒng)以產(chǎn)生輸出聲波的框圖;
[0017] 圖2示出了響度控制系統(tǒng)的框圖;
[0018] 圖3示出了根據(jù)一種實施方式的頻域噪聲檢測系統(tǒng)的框圖;
[0019] 圖4A和圖4B分別示出了短音樂音段和短噪聲音段的功率頻譜;
[0020] 圖4C和圖4D分別示出了音樂音段和噪聲音段的噪聲功率頻譜的估計,其中,已經(jīng) 消除了信號的音調(diào)和暫態(tài)結(jié)構(gòu);
[0021] 圖4E示出了來自頻域噪聲檢測系統(tǒng)的針對由音樂音段及其后伴隨的噪聲音段組 成的信號的內(nèi)容對噪聲分類輸出;
[0022] 圖5示出了根據(jù)一種實施方式的時域噪聲檢測系統(tǒng)的框圖;
[0023] 圖6A示出了在內(nèi)容到噪聲轉(zhuǎn)變期間的信號包絡和平滑的信號包絡;
[0024] 圖6B示出了來自時域噪聲檢測系統(tǒng)的對應于在圖6A中的信號的示例分類輸出;
[0025] 圖7示出了根據(jù)一種實施方式的具有噪聲檢測的響度控制系統(tǒng)的框圖;
[0026] 圖8示出了根據(jù)一種實施方式的響度下降檢測系統(tǒng)的框圖;
[0027] 圖9示出了短期響度估計、兩個平滑的濾波器輸出、以及在響度下降檢測系統(tǒng)內(nèi) 得出的響度下降檢測信號的示例信號,所述示例信號以dB為單位;
[0028] 圖IOA-圖IOD分別示出了短期響度估計、平滑的濾波器輸出、以及在響度下降檢 測系統(tǒng)中針對不同的平滑因子選擇的響度下降檢測信號的示例;
[0029] 圖11示出了根據(jù)一種實施方式的具有動態(tài)平滑因子的響度下降檢測系統(tǒng)的框 圖;
[0030] 圖12A和圖12B分別示出了短期響度估計、平滑的濾波器輸出、以及在響度下降檢 測系統(tǒng)中具有動態(tài)平滑因子的響度下降檢測信號的示例;
[0031] 圖13示出了根據(jù)一種實施方式的具有響度下降檢測的響度控制系統(tǒng)的框圖;以 及
[0032] 圖14示出了根據(jù)一種實施方式的具有噪聲檢測和響度下降檢測的響度控制系統(tǒng) 的框圖。
【具體實施方式】
[0033] 聲波是由物體振動引起的一種形式的壓力波,其傳播穿過例如空氣的可壓縮介 質(zhì)。聲波周期性地取代該介質(zhì)(例如,空氣)中的物質(zhì),導致物質(zhì)振蕩。聲波的頻率描述了 在時間周期內(nèi)的整周的數(shù)量,并且以赫茲(Hz)來表示。在12Hz到20, OOOHz頻率范圍中的 聲波對于人類是能夠聽見的。
[0034] 圖1示出了輸入聲波105經(jīng)過音頻處理系統(tǒng)以產(chǎn)生輸出聲波135的框圖100。音 頻信號是聽得見的聲波作為電壓的表示。設備11〇(例如,麥克風)接收聲壓波(其是機械 能量),并將該聲壓波轉(zhuǎn)換成電能量或音頻信號115。類似地,設備130 (例如,揚聲器或耳 機)將電音頻信號125轉(zhuǎn)換成聽得見的聲波135。音頻信號處理塊120是對音頻信號115 的有意操作,以改變音頻信號的音響效果。可以在模擬域或數(shù)字域中執(zhí)行音頻信號處理。
[0035] 模擬音頻信號由例如沿電路的連續(xù)的數(shù)據(jù)流表示,其以電壓、電流或電荷變化為 形式。模擬信號處理(ASP)通過經(jīng)由各種電子裝置改變電壓或電流或電荷,來物理地改變 連續(xù)的信號。數(shù)字音頻信號是通過模擬音頻信號的采樣創(chuàng)建的,其中,該信號表示為符號 (symbol)序列,典型地為二進制數(shù)字,其允許使用數(shù)字電路(例如,微處理器和計算機)來 進行信號處理。在這種情況下,對數(shù)字表示的信號執(zhí)行處理。響度控制是音頻信號處理的 示例。
[0036] 這里描述的實施方式是參考應用于音頻信號的響度控制系統(tǒng)和方法描述的,然 而,假設概念和改進可以類似地應用于其他音頻信號處理系統(tǒng)(例如,AGC系統(tǒng)和DRC系 統(tǒng))和方法。響度控制系統(tǒng)可以用于操縱具有不同響度水平的輸入音頻信號,以產(chǎn)生具有 均勻響度水平的輸出音頻信號,該具有均勻響度水平的輸出音頻信號是令聽者更滿意的。
[0037] 遍及這里描述的實施方式,使用了一些標記法則。假設信號x[n]是具有采樣索引 η和采樣速率Fsn的時間序列。信號x[n]可以由多個音頻信道C組成,并且可以被表示為 χ>]以規(guī)定具體的信道,其中,c是信道索引,0彡c彡C-1。信號x[m]可以是已經(jīng)根據(jù)因 子M進行下采樣以使X [m]的采樣速率為Fsni= Fs n/M的時間序列。
[0038] 圖2中示出了響度控制系統(tǒng)200的高級框圖。響度控制系統(tǒng)200可以至少包括以 下三個核心模塊:響度測量模塊205、時間平滑模塊210以及增益校正模塊215。響度控制系 統(tǒng)200可以修改傳入的音頻信號x[n],以產(chǎn)生具有改善的響度特性的輸出音頻信號y [η]。 例如,響度控制系統(tǒng)200可以是圖1中的音頻處理系統(tǒng)100中的音頻處理塊120的部分。
[0039] 參考圖2,響度測量模塊205可以分析輸入信號χ[η]的短音段,并且可以生成短期 響度估計L stort [m]。時間平滑模塊210可以通過隨時間對所述短期響度估計進行平滑,提供 對長期平均響度水平的估計L_[m]。增益校正模塊215可以向輸入信號x[n]應用時變內(nèi) 插增益,其中,所述增益可以被控制以使輸出信號y[n]的長期平均響度水平可以等于預定 的目標響度水平。
[0040] 響度測量模塊205可以使用任意過程來估計音頻信號的感知響度。這種過程的示 例包括:
[0041] ?響度等效測量(Leq[m]),其可以與A、B或C頻率加權(quán)耦合,如由國際電工委員會 (IEC)定義的;
[0042] ?茨維克(Zwicker)和法斯特(Fasti)響度模型,其是由國際標準化組織(ISO)定 義的標準的基礎;以及
[0043] · L^1測量與修正的低頻B加權(quán)(RLB)頻率加權(quán)和預濾波器耦合,如由國際電信聯(lián) 盟(ITU)定義的。
[0044] 例如,ITU部門(ITU-R)BS. 1770響度測量系統(tǒng)可以在響度控制系統(tǒng)200的響度測 量模塊205中使用。ITU-R BS. 1770方法是已經(jīng)被廣播行業(yè)廣泛采用的國際標準,該廣播行 業(yè)包括高級電視系統(tǒng)委員會和歐洲廣播聯(lián)盟。ITU-R BS. 1770實施通常具有低計算和存儲 要求,并且已經(jīng)顯示出很好地與聽者的響度感知相關(guān)。
[0045] 響度測量模塊205可以估計輸入信號x[n]的短音段的感知響度,例如,5-10毫秒 的音段。所得出的短期響度估計L shOTt[m]可以例如以振幅域、能量域或分貝(dB)域表示, 取決于響度控制設計和實施。
[0046] 響度控制系統(tǒng)200的目標可以是生成具有均勻的平均響度水平的輸出信號y [η], 而不過度地壓縮短期信號動態(tài)。因此,時間平滑模塊210可以隨時間對短期響度估計進行 平均或平滑,以獲取對信號的長期平均響度水平的估計。用于對短期響度估計執(zhí)行時間平 滑的方法可以是例如根據(jù)以下等式,應用單極指數(shù)移動平均(EM)濾波:
[0047] Lave [m] = Lave[m-1] · (I-α )+Lshort [m] · α 等式 I
[0048] 其中,LshOTt[m]是短期響度估計,Lave[m]是長期平均響度估計,以及α是控制時間 平滑的行為的平滑因子。
[0049] 時間平滑模塊210可以被設計有獨立的"起音"行為和"消逝"行為,這兩個行為 使用不同的平滑因子α值。起音相位可以指新獲取的短期響度估計L shOTt[m],其比之前的 平均響度估計LavJm]更響。消逝相位可以指新獲取的短期響度估計L shOTt[m],其比之前的 平均響度估計LavJm]更安靜。因此:
【權(quán)利要求】
1. 一種響度控制系統(tǒng),該響度控制系統(tǒng)被配置成處理音頻信號,該響度控制系統(tǒng)包 括: 響度測量模塊,被配置成生成對所述音頻信號的短期響度估計; 噪聲檢測模塊,被配置成產(chǎn)生所述音頻信號的內(nèi)容對噪聲分類; 時間平滑模塊,被配置成基于所述內(nèi)容對噪聲分類結(jié)果調(diào)整至少一個平滑因子,并使 用所述至少一個平滑因子、基于所述短期響度估計生成對所述音頻信號的長期響度估計; W及 增益校正模塊,被配置成基于所述長期響度估計向所述音頻信號應用時變增益。
2. 根據(jù)權(quán)利要求1所述的響度控制系統(tǒng),其中: 所述噪聲檢測模塊被配置成使用頻域噪聲檢測來產(chǎn)生所述內(nèi)容對噪聲分類結(jié)果。
3. 根據(jù)權(quán)利要求1所述的響度控制系統(tǒng),其中: 所述噪聲檢測模塊被配置成使用時域噪聲檢測來產(chǎn)生所述內(nèi)容對噪聲分類結(jié)果。
4. 根據(jù)權(quán)利要求1所述的響度控制系統(tǒng),其中: 所述至少一個平滑因子包括消逝平滑因子,該消逝平滑因子控制所述增益校正模塊能 夠增加增益水平的速度。
5. 根據(jù)權(quán)利要求1所述的響度控制系統(tǒng),該響度控制系統(tǒng)還包括: 響度下降檢測模塊,被配置成生成響度下降檢測值; 其中,所述時間平滑模塊還被配置成基于所述響度下降檢測值調(diào)整所述至少一個平滑 因子。
6. -種響度控制系統(tǒng),該響度控制系統(tǒng)被配置成處理音頻信號,該響度控制系統(tǒng)包 括: 響度測量模塊,被配置成生成對所述音頻信號的短期響度估計; 響度下降檢測模塊,被配置成生成響度下降檢測值; 時間平滑模塊,被配置成基于所述響度下降檢測值調(diào)整至少一個平滑因子,并使用所 述至少一個平滑因子、基于所述短期響度估計生成對所述音頻信號的長期響度估計;W及 增益校正模塊,被配置成基于所述長期響度估計向所述音頻信號應用時變增益。
7. 根據(jù)權(quán)利要求6所述的響度控制系統(tǒng),其中: 所述至少一個平滑因子包括消逝平滑因子,該消逝平滑因子控制所述增益校正模塊能 夠增加增益水平的速度。
8. 根據(jù)權(quán)利要求6所述的響度控制系統(tǒng),該響度控制系統(tǒng)還包括: 噪聲檢測模塊,被配置成產(chǎn)生所述音頻信號的內(nèi)容對噪聲分類;其中,所述時間平滑模 塊還被配置成基于所述內(nèi)容對噪聲分類調(diào)整所述至少一個平滑因子。
9. 一種被配置成檢測輸入信號中的噪聲的系統(tǒng),該系統(tǒng)包括: 濾波器組組件,被配置成基于所述輸入信號生成頻域信號; 頻譜通量測量組件,被配置成計算所述頻域信號的頻譜通量值; 成峰度測量組件,被配置成通過估計所述頻域信號的音調(diào)特性來生成成峰度值;W及 信噪比(SNR)估計器組件,被配置成基于所述頻譜通量值和所述成峰度值估計噪聲功 率頻譜,并生成信噪比(SNR)。
10. 根據(jù)權(quán)利要求9所述的系統(tǒng),該系統(tǒng)還包括: 分貝轉(zhuǎn)換器,被配置成基于所述頻域信號生成功率頻譜,并將所述功率頻譜轉(zhuǎn)換到分 貝(地)域;W及 時間平滑組件,被配置成通過估計所述功率頻譜的每個頻帶的能量的時間平均來生成 時間平滑的功率頻譜; 其中,所述頻譜通量測量組件被配置成通過計算所述功率頻譜與所述時間平滑的功率 頻譜的平均差來計算所述頻譜通量值; 其中,所述成峰度測量組件被配置成通過估計所述功率頻譜的每個子帶的音調(diào)特性來 生成成峰度值,所述估計所述功率頻譜的每個子帶的音調(diào)特性是通過測量子帶相比于其鄰 居的相對能量實現(xiàn)的。
11. 根據(jù)權(quán)利要求9所述的系統(tǒng),其中,所述信噪比估計器組件被配置成計算寬帶噪聲 水平和信號水平。
12. 根據(jù)權(quán)利要求9所述的系統(tǒng),該系統(tǒng)還包括: 時間平滑組件,被配置成基于所述SNR生成平滑的SNR ; W及 滯后組件,被配置成基于所述SNR生成所述輸入信號的內(nèi)容對噪聲分類值。
13. 根據(jù)權(quán)利要求12所述的系統(tǒng),其中,所述SNR估計器組件被配置成通過從所述信號 的原始頻譜中移除任何時間動態(tài)或音調(diào)分量來估計所述信號的所述噪聲功率頻譜,所述時 間動態(tài)或音調(diào)分量被假設為是期望的內(nèi)容的分量。
14. 根據(jù)權(quán)利要求12所述的系統(tǒng),該系統(tǒng)被包括在響度控制系統(tǒng)中,其中,所述響度控 制系統(tǒng)包括時間平滑組件,該時間平滑組件被配置成基于所述內(nèi)容對噪聲分類值調(diào)整增益 校正速度。
15. -種被配置成檢測輸入信號中的噪聲的系統(tǒng),該系統(tǒng)包括: 包絡估計器,被配置成生成所述輸入信號的短期包絡估計; 平滑濾波器,被配置成對所述短期包絡估計取平均,W生成長期均值包絡估計; 減法組件,被配置成從所述短期包絡估計中減去所述長期均值包絡估計,W生成包絡 值; 半波整流組件,被配置成對所述包絡值進行半波整流; 至少兩個平滑濾波器,被配置成基于所述包絡值估計啟動能量的均值和偏移能量的均 值;W及 標準化誤差計算器,被配置成計算所述啟動能量的均值與所述偏移能量的均值之間的 標準化的平方誤差,其中,所述標準化的平方誤差指示所述輸入信號是內(nèi)容還是噪聲。
16. 根據(jù)權(quán)利要求15所述的系統(tǒng),其中,所述包絡估計器包括: 求和組件,被配置成接收包括多個信道的所述輸入信號,并通過對所述多個信道進行 求和來生成單聲道信號; 均方根(M巧組件,被配置成將所述單聲道信號轉(zhuǎn)換成所述短期包絡估計;W及 分貝轉(zhuǎn)換器,被配置成對所述短期包絡估計執(zhí)行分貝(地)轉(zhuǎn)換。
17. 根據(jù)權(quán)利要求15所述的系統(tǒng),該系統(tǒng)還包括: 時間平滑組件,被配置成對所述標準化的平方誤差進行時間平滑;W及 滯后組件,被配置成向所述平滑的標準化的平方誤差應用滯后,W生成內(nèi)容對噪聲分 類。
18. 根據(jù)權(quán)利要求17所述的系統(tǒng),其中,所述時間平滑組件使用與信號有關(guān)的平滑因 子。
19. 根據(jù)權(quán)利要求18所述的系統(tǒng),其中,所述平滑因子區(qū)分起音特性和消逝特性。
20. 根據(jù)權(quán)利要求15所述的系統(tǒng),其中,所述平滑濾波器被配置成對所述短期包絡估 計取指數(shù)移動平均(EM)。
21. 根據(jù)權(quán)利要求17所述的系統(tǒng),該系統(tǒng)被包括在響度控制系統(tǒng)中,其中,所述響度控 制系統(tǒng)包括時間平滑組件,該時間平滑組件被配置成基于內(nèi)容對噪聲分類值調(diào)整增益校正 速度。
22. -種被配置成檢測輸入信號中的響度下降的系統(tǒng),該系統(tǒng)包括: 短期響度測量模塊,被配置成接收所述輸入信號,并基于所述輸入信號計算短期響度 估計; 至少兩個時間平滑濾波器,被配置成計算慢速平滑響度估計和快速平滑響度估計; 減法模塊,被配置成從所述慢速平滑響度估計中減去所述快速平滑響度估計,W生成 差值; 半波整流模塊,被配置成對所述差值進行半波整流,W生成整流后的差值;W及 標準化模塊,被配置成對所述整流后的差值進行標準化,W生成下降檢測值,該下降檢 測值指示在所述輸入信號中是否存在響度下降。
23. 根據(jù)權(quán)利要求22所述的系統(tǒng),其中: 所述短期響度測量模塊被配置成使用口U-R BS. 1770響度測量來計算所述短期響度估 計。
24. 根據(jù)權(quán)利要求22所述的系統(tǒng),其中: 所述至少兩個時間平滑濾波器被配置成分別使用慢速平滑因子和快速平滑因子,其 中,所述慢速平滑因子和所述快速平滑因子基于所述輸入信號的動態(tài)來被動態(tài)修改。
25. 根據(jù)權(quán)利要求24所述的系統(tǒng),其中,針對具有高信號動態(tài)測量的輸入信號,所述慢 速平滑因子和所述快速平滑因子相互減慢,而針對具有低信號動態(tài)測量的輸入信號,所述 慢速平滑因子和所述快速平滑因子相互加快。
26. 根據(jù)權(quán)利要求22所述的系統(tǒng),其中,所述標準化模塊使用轉(zhuǎn)化、縮放和飽和來計算 所述下降檢測值。
27. 根據(jù)權(quán)利要求22所述的系統(tǒng),其中,所述標準化模塊被配置成在[0, 1]的范圍中生 成所述下降檢測值,其中,為1的下降檢測值指示檢測到響度下降,并且為0的下降檢測值 指示沒有檢測到下降。
28. 根據(jù)權(quán)利要求22所述的系統(tǒng),該系統(tǒng)被包括在響度控制系統(tǒng)中,其中,所述響度控 制系統(tǒng)包括時間平滑組件,該時間平滑組件被配置成基于所述下降檢測值調(diào)整增益校正速 度。
【文檔編號】H03G3/20GK104471855SQ201380037168
【公開日】2015年3月25日 申請日期:2013年7月12日 優(yōu)先權(quán)日:2012年7月12日
【發(fā)明者】B·史密斯, A·沃納, J·湯普森 申請人:Dts公司