專利名稱:音頻信號的感知響度和/或感知頻譜平衡的計(jì)算和調(diào)整的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號處理。更具體而言,本發(fā)明涉及音頻信號的感知 聲音響度和/或感知頻譜平衡的計(jì)量和控制。本發(fā)明可例如用于以下中的
一個或多個響度補(bǔ)償式音量控制、自動增益控制、動態(tài)范圍控制(包括 例如限制器、壓縮器、擴(kuò)展器等)、動態(tài)均衡以及補(bǔ)償音頻回放環(huán)境中的 背景噪聲干擾。本發(fā)明不僅包括方法,而且包括對應(yīng)的計(jì)算積4呈序和裝置。
背景技術(shù):
已進(jìn)行了許多開發(fā)令人滿意的客觀的響度計(jì)量方法的嘗試。Fletcher 和Munson在1933年確定人類聽覺在低頻和高頻要比在中頻(或話頻) 遲鈍。他們還發(fā)現(xiàn)敏感度的相對變化隨著聲級的升高而減小。早期的響度 計(jì)包括麥克風(fēng)、放大器、表頭以及設(shè)計(jì)成粗略模仿聽覺在低、中和高聲 級的頻率響應(yīng)的濾波器的組合。
盡管這樣的設(shè)備提供了對單個恒定級的孤立音調(diào)的響度的計(jì)量,但更 復(fù)雜聲音的計(jì)量不與響度的主觀印^Jf艮好地匹配。這種類型的聲級計(jì)已標(biāo) 準(zhǔn)化但僅用于特定任務(wù),比如工業(yè)噪聲的監(jiān)視和控制。
在上世紀(jì)五十年代早期,包括Zwicker和Stevens在內(nèi)的一些人在開 發(fā)響度感知過程的更逼真模型方面擴(kuò)展了 Fletcher和Munson的工作。 Stevens于1956年在Journal of the Acoustical Society of America公布了 一種用于"計(jì)算復(fù)雜噪聲的響度(Calculation of仇e Loudness of Complex Noise)"的方法,Zwicker于1958年在Acoustica 乂>布了他的論文 "Psychological and Methodical Basis of Loudness" 。 Zwicker于1959年 公布了響度計(jì)算的圖解法,之后不久又公布了幾篇類似論文。Stevens和 Zwicker的方法被分別標(biāo)準(zhǔn)化為ISO 532的A和B部分。兩種方法包括 類似的步驟。
首先,通過使音頻通過具有在臨界頻帶率尺度上均勻間隔開的中心頻 率的帶通聽覺濾波器的組,iM"能量沿著內(nèi)耳基膜的時變分布(稱為激勵) 進(jìn)行仿真。每個聽覺濾波器被設(shè)計(jì)成對沿著內(nèi)耳_^膜的特定位置的頻率響應(yīng)進(jìn)行仿真,其中濾波器的中心頻率對應(yīng)于此位置。臨界頻帶寬度被定義 為一個這種濾波器的帶寬。以赫茲為單位來度量,這些聽覺濾波器的臨界 頻帶寬度隨著中心頻率的增大而增大。因此,有用的是,定義彎曲頻率尺 度,使得以此彎曲尺先變量的所有聽覺濾波器的臨界頻帶寬度是恒定的。
這樣的彎曲XJL被稱為臨界頻帶率尺度,在理解和仿真許多種心理聲學(xué)現(xiàn) 象時非常有用。參見例如E. Zwicker和H. Fastl的"Psychoacoustics — Facts and Models", Springer國Verlag, Berlin, 1990。 Stevens和Zwicker 的方法利用了稱為Bark尺度的臨界頻帶率,其中,在500 Hz以下,臨 界頻帶寬度是恒定的,而在500 Hz以上,臨界頻帶寬度增大。最近,Moore 和Glasberg定義了一種臨界頻帶率尺變,他們將其命名為等價矩形帶寬 (ERB )尺度(B. C. J. Moore, B. Glasberg, T. Baer, "A Model for the Prediction of Thresholds, Loudness, and Partial Loudness", Journal of the Audio Engineering Society,第450巻,第4號,1997年4月,224-240 頁)。通過利用殘余噪聲(notched noise)掩蔽器進(jìn)行的心理聲學(xué)實(shí)驗(yàn), Moore和Glasberg證明了在500 Hz以下臨界頻帶寬度持續(xù)減小,這與臨 界頻帶寬度保持恒定的Bark尺度形成對比。
在激勵的計(jì)算之后是非線性壓縮函數(shù),該非線性壓縮函數(shù)生成稱為 "特定響度"的量。特定響JLA將感知響度作為頻率和時間的函數(shù)的度量, 并且可以以沿著臨界頻帶率尺度(比如上述Bark或ERB尺度)的每單 位頻率的感知響度為單位來度量。理想地,特定響度表示將響度作為頻率 和時間的函數(shù)的連續(xù)分布,而時變"總響度"通過將此分布對頻率積分來 算出。在實(shí)踐中,獲得特定響度的精確表示的方法是通過使用例如上述 聽覺濾波器沿著臨界頻帶率尺度對此分布均勻采樣.在此情形下,總響度 可通過將來自每個濾波器的特定響度簡單相加來算出。為了降低復(fù)雜度, 某些應(yīng)用可以以感知響度的估計(jì)和修正稍微不精確為代價計(jì)算特定響度 的較為粗略的近似。這樣的近似將在后面更詳細(xì)地討論,
響度可以以方(phon)為單位來度量。給定聲音的用方度量的響度 是具有與該聲音的主觀響度相等的主觀響度的1 kHz音調(diào)的聲壓級 (SPL)。按照慣例,SPL的參考值0dB是2xl0-5帕斯卡的均方根壓力, 因此這也是參考值0方。使用此定義將不同于1 kHz的頻率處的音調(diào)的響 度與1 kHz處的響度相比較,可針對給定的方級確定等響度線.圖ll示 出了頻率在20 Hz到12.5 kHz之間且方級在4.2方(被認(rèn)為是聽覺閾值) 到120方之間的等響度線(ISO 226:1087 (E), "Acoustics - Normal equal loudness level contours")。該方值度量考慮了人類聽覺的敏感度隨頻4"變化,但所得結(jié)果不允許評估變化級聲音的相對主觀響度,因?yàn)槲磭L試校正
響度隨SPL增長的非線性,即,未嘗試校正各等響度線的間距變化這一 事實(shí)。
響度亦可以以"宋(sone)"為單位來度量。如圖11所示,方單位與
宋單位之間存在--映射。 一個宋被定義為40 dB (SPL ) 1 kHz純正弦
波的響度并等價于40方。宋單位使得以宋為單位的兩倍增大對應(yīng)于感知 響度的加倍。例如,4宋被感知為比2宋響一倍。因此,用宋表示響度級 能提供更多信息。如果特定響度被定義為將感知響度作為頻率和時間的函 數(shù)的度量,則特定響度可以以"宋每單位頻率"為單位來度量。因此,當(dāng) 使用Bark尺度時,特定響度的單位是"宋每Bark",類似地,當(dāng)使用ERB 尺度時,單位是"宋每ERB"。
如上所述,人耳的敏感度隨頻率和級二者變化,這是心理聲學(xué)文獻(xiàn)中 清楚記栽的事實(shí)。結(jié)果之一是給定聲音的感知頻鐠或音色隨收聽聲音的 聲級變化。例如,對于包含低、中和高頻的聲音,這些頻率分量的感知相 對比例隨聲音總響度變化;低頻和高頻分量在安靜時要比在喧鬧時聽起來 更安靜(相對于中頻而言)。此現(xiàn)象是眾所周知的,在聲音再現(xiàn)i殳備中通 過所謂響度控制得以減輕此現(xiàn)象。響度控制是在音量被調(diào)低時施加低頻增 強(qiáng)(有時亦施加高頻增強(qiáng))的音量控制。因此,耳朵在極限頻率的較低敏 感度被那些頻率的人工增強(qiáng)所補(bǔ)償.這樣的控制是完全被動的;所施加補(bǔ) 償?shù)某蘜A音量控制或某種其它用戶操作式控制的設(shè)置的函數(shù),而不是音 頻信號內(nèi)容的函數(shù)。
在實(shí)踐中,低、中和高頻之中感知相對頻譜平衡的變化依賴于信號, 尤其依賴于其實(shí)際頻鐠,而且依賴于想務(wù)使其響亮還是柔和??紤]交響樂 團(tuán)的錄音。以與聽眾中的一員將在音樂廳中收聽的^目同的級再現(xiàn),整個 頻譜的平衡可能無論樂團(tuán)響亮地還是安靜地演奏都是正確的,如果例如安 靜了 10dB地再現(xiàn)音樂,則整個頻鐠的感知平衡對于響亮段以一種方式變 化而對于安靜段以另一種方式變化。常規(guī)的被動響度控制不根據(jù)音樂施加 不同的補(bǔ)償。
在2004年5月27日提交、2004年12月23日公布為WO 2004/111994 A2的國際專利申請?zhí)朠CT/US2004/016964中,Seefeldt等人尤其公開了 一種用于計(jì)量和調(diào)整音頻信號的感知響度的系統(tǒng)。通過引用將指定美國的 所述PCT申請整體合并于此。在所述申請中,心理聲學(xué)模型以感知單位 計(jì)算音頻信號的響度。此外,所述申請引入用于計(jì)算寬帶倍增增益的技術(shù),這些技術(shù)當(dāng)應(yīng)用于音頻時,導(dǎo)致增益修正了的音頻的響度與參考響M本 上相同。然而,這種寬帶增益的應(yīng)用改變了音頻的感知頻鐠平衡。
發(fā)明內(nèi)容
在一方面,本發(fā)明允許通過修正音頻信號以便減小其特定響度與目標(biāo) 特定響度之間的差異來推導(dǎo)可用于控制音頻信號的特定響度的信息。特定 響^A將感知響度作為頻率和時間的函數(shù)的度量。在實(shí)際實(shí)施中,可使得 經(jīng)修正的音頻信號的特定響度近似于目標(biāo)特定響度。如后面所描述的那 樣,該近似可能不僅受到普通信號處理考慮的影響,而且受到可在該<務(wù)正 中采用的時間和/或頻率平滑的影響。
由于特定響度是將音頻信號的感知響度作為頻率和時間的函數(shù)的度 量,為了減小音頻信號的特定響度與目標(biāo)特定響度之間的差異,該1務(wù)正可 將音頻信號修正為頻率的函數(shù)。雖然在某些情形下,目標(biāo)特定響度可能是 非時變的,且音頻信號本身可能是穩(wěn)態(tài)非時變信號(典型地說),該修正 也可將音頻信號修正為時間的函數(shù)。
本發(fā)明諸方面亦可用來補(bǔ)償音頻回放環(huán)境中的背景噪聲干擾。當(dāng)在有 背景噪聲的情況下收聽音頻時,噪聲可能以依賴于音頻的級和頻譜以及噪 聲的級和頻鐠的方式部分地或完全地遮蔽音頻。結(jié)果是音頻的感知頻鐠的
變更。根據(jù)心理聲學(xué)研究(參見例如Moore、 Glasberg和Baer的"A Model for the Prediction of Thresholds, Loudness, and Partial Loudness", J. Audio Eng. Soc.,第45巻,第4號,1997年4月),可將音頻的"部分特 定響度"定義為在有次要干擾聲音信號比如噪聲的情況下的音頻的感知響 度。
因此,在另一方面,本發(fā)明允許通過修正音頻信號以便減小其部分特 定響度與目標(biāo)特定響度之間的差異來推導(dǎo)可用于控制音頻信號的部分特 定響度的信息。這樣做以感知上精確的方式減輕了噪聲的影響。在考慮了 干擾噪聲信號的本發(fā)明的此方面和其它方面,假定音頻信號可訪問本身且 次要干擾信號可訪問本身。
在另一方面,本發(fā)明允許通過修正音頻信號以便減小其特定響度與目 標(biāo)特定響度之間的差異來控制音頻信號的特定響度。
在另一方面,本發(fā)明允許通過修正音頻信號以便減小其部分特定響度 與目標(biāo)特定響度之間的差異來控制音頻信號的部分特定響度。當(dāng)目標(biāo)特定響度不是音頻信號的函數(shù)時,其可能是存儲的或接收到的 目標(biāo)特定響度。當(dāng)目標(biāo)特定響度不是音頻信號的函數(shù)時,該修正或該推導(dǎo) 可顯式或隱式地計(jì)算特定響度或部分特定響度。隱式計(jì)算的例子包括查找
表或"閉式(closed-form)"數(shù)學(xué)表達(dá)式,其中特定響度和/或部分特定響 度被固有地決定(術(shù)語"閉式"意在描述可使用有限數(shù)量的標(biāo)準(zhǔn)數(shù)學(xué)運(yùn)算 和函數(shù)(比如取冪和余弦)準(zhǔn)確表示的數(shù)學(xué)表達(dá)式)。而且,當(dāng)目標(biāo)特定 響度不是音頻信號的函數(shù)時,目標(biāo)特定響度可能是非時變且非頻變的,或 者可能是僅非時變的。
在又另 一方面,本發(fā)明允許通過才艮據(jù)一個或多個過程和一個或多個過 程控制參數(shù)處理音頻信號或音頻信號的度量以產(chǎn)生目標(biāo)特定響度來處理 音頻信號。雖然目標(biāo)特定響度可能是非時變的("固定的"),但目標(biāo)特定 響度可有利地是音頻信號的特定響度的函數(shù)。雖然典型地說,其可能是靜 態(tài)的非頻變且非時變的信號,但音頻信號本身是頻變且時變的,從而造成 目標(biāo)特定響度當(dāng)為音頻信號的函數(shù)時是頻變且時變的。
音頻和目標(biāo)特定響度或目標(biāo)特定響度的表示可從發(fā)送中接收或者從 存儲介質(zhì)再現(xiàn)。
目標(biāo)特定響度的表示可以是對音頻信號或音頻信號的度量進(jìn)行縮放 的一個或多個尺度因子。
本發(fā)明的任何以上方面的目標(biāo)特定響度可以是音頻信號或音頻信號 的度量的函數(shù)。音頻信號的一個適當(dāng)度量是音頻信號的特定響度。音頻信 號或音頻信號的度量的函數(shù)可以是對音頻信號或音頻信號的度量的縮放。 例如,該縮放可以是以下縮放中的一種或組合
(a) 如以下關(guān)系式中的對特定響度的時變且頻變尺度因子S [W]縮
放
(b) 如以下關(guān)系式中的對特定響度的時變而非頻變尺度因子(D[,]縮
放
(C)如以下關(guān)系式中的對特定響度的非時變而頻變尺度因子0間縮放(d )如以下關(guān)系式中的對特定響度的非時變且非頻變尺度因子a縮
放
其中》[6,,]是目標(biāo)特定響度,AT[ZM]是音頻信號的特定響度,6是頻率的度 量,f是時間的度量。
在時變且頻變尺度因子的情形(a)下,縮放可至少部分地由期望多
帶響度與音頻信號的多帶響度的比值來確定。這樣的縮放可用作動態(tài)范圍 控制。采用本發(fā)明諸方面作為動態(tài)范圍控制的進(jìn)一步細(xì)節(jié)在后面闡述。
而且,在時變且頻變AJL因子的情形(a)下,特定響度可被縮放等 于期望頻鐠形狀的度量與音頻信號的頻譜形狀的度量的比值的倍數(shù)。這樣
時變的感知頻鐠。當(dāng)特定響度被縮放等于期望頻鐠形狀的度量與音頻信號 的頻鐠形狀的度量的比值的倍數(shù)時,這樣的縮放可用作動態(tài)均衡器。采用 本發(fā)明諸方面作為動態(tài)均衡器的進(jìn)一步細(xì)節(jié)在后面闡述。
在時變而非頻變尺度因子的情形(b)下,縮放可至少部分地由期望 寬帶響度與音頻信號的寬帶響度的比值來確定。這樣的縮放可用作自動增 益控制或動態(tài)范圍控制。采用本發(fā)明諸方面作為自動增益控制或動態(tài)范圍 控制的進(jìn)一步細(xì)節(jié)在后面闡述。
在情形(a)(時變且頻變凡復(fù)因子)或情形(b)(時變而非頻變尺度 因子)下,尺度因子可以是音頻信號或音頻信號的度量的函數(shù)。
在非時變而頻變尺度因子的情形(c)和非時變且非頻變尺度因子的 情形(d)二者下,該修正或該推導(dǎo)可包括存儲尺度因子或者尺度因子可 從外部源接收。
在情形(c)和(d)中的任一情形下,尺度因子可以不是音頻信號或 音頻信號的度量的函數(shù)。
在本發(fā)明的任何各方面及其變體中,該修正、推導(dǎo)或產(chǎn)生可以以不同 方式顯示或隱式地計(jì)算(1)特定響度、和/或(2)部分特定響度、和/或 (3)目標(biāo)特定響度。隱式計(jì)算可包括例如查找表或閉式數(shù)學(xué)表達(dá)式。
修正M可在時間上被平滑。修正M可例如是(1)與音頻信號的 頻帶相關(guān)的多個幅度縮放因子,或(2)用于控制一個或多個濾波器(比 如多抽頭FIR濾波器或多極IIR濾波器)的多個濾波器系數(shù)??s放因子或?yàn)V波器系數(shù)(和它們被施加于的濾波器)可以是時變的。
在計(jì)算定義目標(biāo)特定響度的音頻信號的特定響度的函數(shù)或該函數(shù)的 反函數(shù)時,執(zhí)行這些計(jì)算的一個或多個過程在可特征化為感知(心理聲學(xué)) 響度域的域內(nèi)工作-計(jì)算的輸入和輸出是特定響度。與^目比,在向音頻
系數(shù)時,修正^在感知(心理聲學(xué))響度域之外、可特征化為電信號域 的域內(nèi)工作以修正音頻信號。雖然對音頻信號的4務(wù)正可在電信號域內(nèi)對音 頻信號進(jìn)行,但電信號域內(nèi)的這些改變從感知(心理聲學(xué))響度域內(nèi)的計(jì) 算導(dǎo)出,使得經(jīng)修正的音頻信號具有近似于期望目標(biāo)特定響度的特定響 度。
通it^響度域內(nèi)的計(jì)算推導(dǎo)修正M,與在電信號域內(nèi)導(dǎo)出這些修正 參數(shù)的情況相比,可實(shí)現(xiàn)對感知響度和感知頻鐠平衡的更大控制。此外, 與以在電信號域內(nèi)推導(dǎo)修正參數(shù)的布置提供對感知頻鐠的控制相比,在執(zhí) 行響度域計(jì)算時使用基膜仿真的心理聲學(xué)濾波器組或其等價物可提供對 感知頻鐠的更詳細(xì)控制。
該修正、推導(dǎo)和產(chǎn)生中的每一個可能依賴于以下中的一個或多個干 擾音頻信號的度量、目標(biāo)特定響度、從經(jīng)修正的音頻信號的特定響度或部 分特定響度導(dǎo)出的未修正的音頻信號的特定響度的估計(jì)、未修正的音頻信 號的特定響度、以及從經(jīng)修正的音頻信號的特定響度或部分特定響度導(dǎo)出 的目標(biāo)特定響度的近似。
該<務(wù)正或推導(dǎo)可至少部分地從以下中的一個或多個推導(dǎo){務(wù)正^::干 擾音頻信號的度量、目標(biāo)特定響度、從經(jīng)修正的音頻信號的特定響度或部 分特定響度導(dǎo)出的未修正的音頻信號的特定響度的估計(jì)、未修正的音頻信 號的特定響度、以及從經(jīng)修正的音頻信號的特定響度或部分特定響度導(dǎo)出 的目標(biāo)特定響度的近似。
更具體而言,該修正或推導(dǎo)可至少部分M下面推導(dǎo)修正參數(shù)
(1) 以下兩者之一
目標(biāo)特定響度,和
從經(jīng)修正的音頻信號的特定響度得到的未修正的音頻信號的 特定響度的估計(jì),以及
(2) 以下兩者之一未修正的音頻信號的特定響度,和
從經(jīng)修正的音頻信號的特定響度導(dǎo)出的目標(biāo)特定響度的近似 或者,當(dāng)要考慮干擾音頻信號時,該修正或推導(dǎo)可至少部分地從下面推導(dǎo)
(1) 干擾音頻信號的度量
(2) 以下兩者之一
目標(biāo)特定響度,和
從經(jīng)修正的音頻信號的部分特定響度導(dǎo)出的未修正的音頻信 號的特定響度的估計(jì),以及
(3) 以下兩者之一
未修正的音頻信號的特定響度,和
從經(jīng)修正的音頻信號的部分特定響度導(dǎo)出的目標(biāo)特定響度的 近似
可采用一種前饋布置,其中特定響度從音頻信號導(dǎo)出,并且其中目標(biāo) 特定響度從該方法外部的源接收,或者當(dāng)該修正或推導(dǎo)包括存儲目標(biāo)特定 響度時從存儲接收。可替選地,可采用一種混合前饋/反饋布置,其中目 標(biāo)特定響度的近似從經(jīng)修正的音頻信號導(dǎo)出,并且其中目標(biāo)特定響度從該 方法外部的源接收,或者當(dāng)該修正或推導(dǎo)包括存儲目標(biāo)特定響度時從存儲 接收。
該修正或推導(dǎo)可包括用于顯式或隱式地獲得目標(biāo)特定響度的一個或 多個過程,所述過程中的一個或多個顯式或隱式地計(jì)算音頻信號或音頻信 號的度量的函數(shù)。在一個可替選方案中,可采用一種前饋布置,其中特定 響度和目標(biāo)特定響度從音頻信號導(dǎo)出,目標(biāo)特定響度的推導(dǎo)采用了音頻信 號或音頻信號的度量的函數(shù)。在另一個可替選方案中,可采用一種混合前 饋/反饋布置,其中目標(biāo)特定響度的近似從經(jīng)修正的音頻信號導(dǎo)出,且目 標(biāo)特定響;^從音頻信號導(dǎo)出,目標(biāo)特定響度的推導(dǎo)采用了音頻信號或音頻 信號的度量的函數(shù)。
該修正或推導(dǎo)可包括用于顯式或隱式地獲得響應(yīng)于經(jīng)修正的音頻信 號對未修正的音頻信號的特定響度進(jìn)行的估計(jì)的一個或多個過程,所述過 程中的一個或多個顯式或隱式地計(jì)算音頻信號或音頻信號的度量的函數(shù) 的反函數(shù)。在一個可替選方案中,采用一種反饋布置,其中未修正的音頻信號的特定響度的估計(jì)以及目標(biāo)特定響度的近似從經(jīng)修正的音頻信號導(dǎo) 出,特定響度的估計(jì)使用音頻信號或音頻信號的度量的函數(shù)的反函數(shù)來計(jì) 算。在另一個可替選方案中,采用一種混合前饋/反饋布置,其中特定響 度從音頻信號導(dǎo)出,且未修正的音頻信號的特定響度的估計(jì)從經(jīng)修正的音 頻信號導(dǎo)出,該估計(jì)的推導(dǎo)使用音頻信號或音頻信號的度量的所述函數(shù)的 反函數(shù)來計(jì)算。
修正^lt可被施加于音頻信號以產(chǎn)生經(jīng)修正的音頻信號。
本發(fā)明的另一方面是可存在過程和設(shè)備的時間和/或空間分離,使 得在效果上既存在編碼器或編碼也存在解碼器或解碼。例如,可存在一種 編碼/解碼系統(tǒng),其中修正或推導(dǎo)可發(fā)送和接收或者存儲和再現(xiàn)音頻信號
以及(1)修正參數(shù)或(2 )目標(biāo)特定響度或目標(biāo)特定響度的表示??商孢x 地,在效果上可僅存在編碼器或編碼,其中存在音頻信號以及(1) <務(wù)正 參數(shù)或(2)目標(biāo)特定響度或目標(biāo)特定響度的表示的發(fā)送或存儲。可替選 地,如上所述,在效果上可僅存在解碼器或解碼,其中存在音頻信號以及
圖l是示出了根據(jù)本發(fā)明諸方面的前饋實(shí)施的例子的功能框圖。
圖2是示出了根據(jù)本發(fā)明諸方面的反饋實(shí)施的例子的功能框圖。
圖3是示出了根據(jù)本發(fā)明諸方面的一個混合前饋/反饋實(shí)施的例子的 功能才匡圖。
圖4是示出了根據(jù)本發(fā)明諸方面的另一個混合前饋/反饋實(shí)施的例子 的功能4匡圖。
圖5是示出了由前饋、反饋和混合前饋/反饋布置中的任何一種布置
或空間分離的設(shè)備或過程使用的功能框圖。
圖6是示出了由前饋、反饋和混合前饋/反饋布置中的任何一種布置 確定的目標(biāo)特定響度或其表示和未修正的音頻信號可怎樣被存儲或發(fā)送 以例如供時間或空間分離的設(shè)備或過程使用的功能框圖。
圖7是示出了本發(fā)明的一方面的;||^見的示意性功能框圖或示意性流 程圖。圖8是適合作為本發(fā)明實(shí)施例中的透射濾波器的線性濾波器尸向的理 想化特征響應(yīng),其中豎直軸是用分貝UB)表示的衰減,水平軸是用赫 茲(Hz)表示的logK)頻率。
圖9示出了 ERB頻率尺度(豎直軸)與用赫茲表示的頻率(水平軸) 之間的關(guān)系。
圖IO示出了近似于ERB尺度上的臨界頻帶的一組理想化聽覺濾波器 特征響應(yīng)。水平尺度是用赫茲表示的頻率,豎直尺Jbl用分貝表示的級。
圖11示出了 ISO 226的等響度線。水平尺度是用赫茲表示的頻率
(iogw尺度),豎直;d是用分貝表示的聲壓級。
圖12示出了由透射濾波器尸(z)^M^化的ISO 226的等響度線,水平 尺M(jìn)用赫茲表示的頻率(log1()尺度),豎直M是用分貝表示的聲壓級。
圖13a是示出了對于對女性i絲片段的0.25倍響度縮放而言的寬帶 和多帶增益的理想化圖。水平尺度是ERB頻帶,豎直AJL是用分貝(dB) 表示的相對增益。
圖13b是分別示出了原始信號、經(jīng)寬帶增益修正的信號、以及經(jīng)多帶 增益修正的信號的特定響度的理想化圖。水平尺度是ERB頻帶,豎直尺 度是特定響度(宋/ERB )。
圖14a是示出了對于典型AGC而言的丄。[。與z^]之間函數(shù)關(guān)系的理 想化圖。水平尺度是log(AW),豎直尺度是log(丄。W)。
圖14b是示出了對于典型DRC而言的丄。[。與/^]之間函數(shù)關(guān)系的理 想化圖。水平尺AAlog(AW),豎直尺度是log(丄。W).
圖15是示出了對于多帶DRC而言的典型頻帶平滑函數(shù)的理想化圖。 水平尺M(jìn)頻帶號,豎直M是對于頻帶6而言的增益輸出。
圖16是示出了本發(fā)明的一方面的概觀的示意性功能框圖或示意性流 程圖。
圖17是與圖1類似的還包括對回放環(huán)境中噪聲的補(bǔ)償?shù)氖疽庑怨δ?框圖或示意性流程圖。
具體實(shí)施例方式
圖1到4是示出了根據(jù)本發(fā)明諸方面的可能的前饋、反饋和兩個版本的混合前饋/反饋實(shí)施的例子的功能框圖。
參考圖1中前饋拓樸的例子,音頻信號被施加于兩條路徑(l)具有 能夠響應(yīng)于修正M而修正音頻信號的過程或設(shè)備2 ("修正音頻信號") 的信號路徑,以及(2)具有能夠生成修正^的過程或設(shè)備4 ("生成修 正M")的控制路徑。圖1前饋拓樸例子中的和圖2-4例子中的每一個 中的修正音頻信號2可以是這樣的設(shè)備或過程其^Mt從生成^務(wù)正^t 4 (或分別從圖2-4例子中的每一個中的對應(yīng)物過程或設(shè)備4,、 4"和4",) 接收到的修正參數(shù)M以頻變和/或時變的方式修正音頻信號(例如其幅 度)。生成修正參數(shù)4及其在圖2-4中的對應(yīng)物每個都至少部分地在感知 響度域內(nèi)工作。在圖l-4例子中的每一個中,修正音頻信號2在電信號域 內(nèi)工作并生成經(jīng)修正的音頻信號。而且,在圖l-4例子中的每一個中,修 正音頻信號2和生成1務(wù)正^ 4 (或其對應(yīng)物)修正音頻信號以減小其特 定響度與目標(biāo)特定響度之間的差異。
在圖l前饋例子中,過程或設(shè)備4可包括幾個過程和/或設(shè)備"計(jì)算 目標(biāo)特定響度"過程或設(shè)備6,其響應(yīng)于音頻信號或音頻信號的度量(比 如音頻信號的特定響度)而計(jì)算目標(biāo)特定響度;"計(jì)算特定響度"過程或 設(shè)備8,其響應(yīng)于音頻信號或音頻信號的度量(比如其激勵)而計(jì)算音頻 信號的特定響度;以及"計(jì)算修正M"過程或設(shè)備10,其響應(yīng)于特定 響度和目標(biāo)特定響度而計(jì)算4務(wù)正M。計(jì)算目標(biāo)特定響度6可執(zhí)行一個或 多個函數(shù)"F",其每個可具有函數(shù)^lfc。例如,計(jì)算目標(biāo)特定響度6可計(jì) 算音頻信號的特定響度然后向其施加一個或多個函數(shù)F以提供目標(biāo)特定 響度。這在圖1中示意性地顯示為到過程或設(shè)備6的"選擇函數(shù)F和函數(shù) 參數(shù)"輸入。代替由設(shè)備或過程6計(jì)算,目標(biāo)特定響度可由包含在生成修 正M 4中或與生成修正^lt 4相關(guān)聯(lián)的存儲過程或設(shè)備(示意性地顯示 為到過程或設(shè)備10的"存儲"輸入)來提供,或者由整個過程或設(shè)備外 部的源(示意性地顯示為到過程或設(shè)備IO的"外部"輸入)來提供。因 此,修正^至少部分地基于感知(心理聲學(xué))響度域內(nèi)的計(jì)算(即,至 少特定響度和在某些情形下目標(biāo)特定響度計(jì)算)。
由過程或設(shè)備6、 8和10(以及圖2例子中的過程或設(shè)備12、 14、 10,, 圖3例子中的過程或i殳備6、 14、 10",和圖4例子中的過程或i殳備8、 12、 10",)執(zhí)行的計(jì)算可被顯式和/或隱式地執(zhí)行。隱式執(zhí)行的例子包括(1) 查找表,其條目全部或部分地基于特定響度和/或目標(biāo)特定響度和/或修正 參數(shù)計(jì)算,以及(2)閉式數(shù)學(xué)表達(dá)式,其固有地全部或部分地基于特定響度和/或目標(biāo)特定響度和/或修正參數(shù)。
雖然圖1例子中的計(jì)算過程或設(shè)備6、 8和10 (以及圖2例子中的過 程或設(shè)備12、 14、 10,,圖3例子中的過程或i更備6、 14、 10",和圖4例 子中的過程或i殳備8、 12、 10,")被分別示意性地示出和描述,但這僅是 出于解釋的目的。應(yīng)理解,這些過程或設(shè)備中的部分或全部可組合成單個 過程或設(shè)備或者以不同方式組合成多個過程或設(shè)備。例如,在下面圖9 的布置(如圖1的例子中的前饋拓樸)中,計(jì)算修正M的過程或i殳備響 應(yīng)于從音頻信號和目標(biāo)特定響度導(dǎo)出的經(jīng)平滑的激勵而計(jì)算修正M。在 圖9例子中,計(jì)算修正#的設(shè)備或過程隱式地計(jì)算音頻信號的特定響 度.
作為本發(fā)明的一方面,在圖1的例子中和在此處本發(fā)明各實(shí)施例的其 它例子中,目標(biāo)特定響度(》[ZM])可通過以一個或多個縮放因子來縮放 特定響度(可^])來計(jì)算。該縮放可以是如以下關(guān)系式中的對特定響度 的時變且頻變尺度因子S [W]縮放
》[M] = s〖M〗,,《] 如以下關(guān)系式中的對特定響度的時變而非頻變尺度因子①M(fèi)縮放
=①[f〗,,f〗
如以下關(guān)系式中的對特定響度的非時變而頻變尺度因子0間縮放 或者如以下關(guān)系式中的對音頻信號的特定響度的尺度因子"縮放
其中6是頻率的度量(例如頻帶號),f是時間的度量(例如塊號)。亦可 利用特定縮放的多重實(shí)例和/或各特定縮放的組合來采用多重縮放。后面 給出這樣的多重縮放的例子。在某些情形下,如后面進(jìn)一步解釋的那樣, 縮放可以是音頻信號或音頻信號的度量的函數(shù)。在其它情形下,也如后面 進(jìn)一步解釋的那樣,當(dāng)縮放不是音頻信號的度量的函數(shù)時,縮放可以以其
它方式確定或提供。例如,用戶可選擇或施加非時變且非頻變尺度因子a 或非時變而頻變的尺度因子0問縮放。因此,目標(biāo)特定響度可表示為音頻信號或音頻信號的度量的一個或多
個函數(shù)F (特定響度是音頻信號的一個可能的度量)
<formula>formula see original document page 25</formula>
如果該一個或多個函數(shù)F是可逆的,則未修正的音頻信號的特定響度 (iV[W])可計(jì)算為目標(biāo)特定響度()的一個或多個反函數(shù)F、
<formula>formula see original document page 25</formula>。
如后面將看到的那樣,該一個或多個反函數(shù)F"在圖2和圖4的反饋和混 合前饋/反饋例子中計(jì)算。
示出了計(jì)算目標(biāo)特定響度6的"選擇函數(shù)和函數(shù)^"輸入,以表明 設(shè)備或過程6可通過根據(jù)一個或多個函數(shù)^lt施加一個或多個函數(shù)來計(jì) 算目標(biāo)特定響度。例如,計(jì)算目標(biāo)特定響度8可計(jì)算音頻信號的特定響度 的該一個或多個函數(shù)"F"以便限定目標(biāo)特定響度。例如,"選擇函數(shù)和函 數(shù)M"輸入可選擇屬于以上類型縮放中的一種或多種的一個或多個特 定函數(shù);以及一個或多個函數(shù)參數(shù),比如屬于所述函數(shù)的常數(shù)(例如尺度 因子)。
如上所述,由于目標(biāo)特定響度可計(jì)算為特定響度的縮放,所以與縮放 相關(guān)聯(lián)的尺度因子可充當(dāng)目標(biāo)特定響度的表示。因此,在后面描述且前面 提到的圖9例子中,查找表可由尺度因子和激勵來索引,4吏得特定響度和 目標(biāo)特定響度的計(jì)算為查找表所固有。
無論采用查找表、閉式數(shù)學(xué)表達(dá)式還是某種其它技術(shù),生成修正M 4(及其在圖2-4例子中的每一個中的對應(yīng)物過程或設(shè)備4,、 4"和4",)的 工作使得所述計(jì)算基于感知(心理聲學(xué))響度域,盡管特定響度和目標(biāo)特 定響度可能不被顯式地算出。要么存在顯式特定響度,要么存在概念上的 隱式特定響度。類似地,要么存在顯式目標(biāo)特定響度,要么存在概念上的 隱式目標(biāo)特定響度。在任何情形下,修正^的計(jì)算設(shè)法生成這樣的修正 參數(shù)其修正音頻信號以減小特定響度與目標(biāo)特定響度之間的差異。
在具有次要干擾音頻信號(比如噪聲)的回放環(huán)境中,計(jì)算修正M IO(及其在圖2-4例子中的每一個中的對應(yīng)物過程或設(shè)備10,、10"和10,") 亦可以以任選輸入來接收這樣的次要干擾音頻信號的度量或該次要干擾 信號本身作為其輸入之一。這樣的任選輸入在圖1中(和在圖2-4中)以 虛線示出。次要干擾信號的度量可以是比如后面描述的圖17的例子中的 該次要干擾信號的激勵。向圖1中的計(jì)算修正;Nt過程或該:備lO (及其在圖2-4例子中的每一個中的對應(yīng)物過程或設(shè)備10,、 IO"和IO",)施加千 擾信號的度量或干擾信號本身(假定干擾信號可單獨(dú)供處理所用)允許適 當(dāng)配置的這種過程或設(shè)備計(jì)算考慮了干擾信號的修正^lt, i^后面在標(biāo) 題"噪聲補(bǔ)償"下進(jìn)一步解釋。在圖2-4的例子中,部分特定響度的計(jì)算 假定千擾信號的適當(dāng)度量不僅施加于相應(yīng)的計(jì)算修正參數(shù)10,、 IO,,或 10",,而JL拖加于"計(jì)算未修正的音頻的特定響度的近似"過程或i殳備12 和/或"計(jì)算目標(biāo)特定響度的近似"過程或設(shè)備14以便利于該功能或設(shè)備 執(zhí)行部分特定響度的計(jì)算。在圖1前饋例子中,部分特定響度不被顯式地 算出-圖1中的計(jì)算修正^ 10計(jì)算適當(dāng)?shù)男拚齘以使得經(jīng)修正的音 頻的部分特定響度近似于目標(biāo)特定響度。這在后面在上述標(biāo)題"噪聲補(bǔ)償" 下進(jìn)一步解釋。
如上所述,在圖l-4例子中的每一個中,修正參數(shù)M當(dāng)被音頻信號 修正器2施加于音頻信號時減小作為結(jié)果的經(jīng)修正的音頻的特定響度或 部分特定響度與目標(biāo)特定響度之間的差異。理想地,經(jīng)修正的音頻信號的 特定響度非常近似于目標(biāo)特定響度或與目標(biāo)特定響度相同。修正參數(shù)M 可例如采取施加于從濾波器組得到的頻帶或施加于時變?yōu)V波器的系數(shù)的 時變增益因子的形式。因此,在所有的圖l-4例子中,修正音頻信號2可 例如實(shí)施為每個都在一頻帶內(nèi)工作的多個幅度縮放器、或時變?yōu)V波器(例 如多抽頭FIR濾波器或多極IIR濾波器)。
在本文獻(xiàn)中的此處和別處,相同標(biāo)號的使用表明該設(shè)備或過程可與帶 有相同標(biāo)號的另 一個或另 一些i殳備或過程基本上相同。帶有上標(biāo)的標(biāo)號 (例如"10,")表明該設(shè)備或過程與帶有相同基標(biāo)號或其帶上標(biāo)版本的另 一個或另 一些設(shè)備或過程在結(jié)構(gòu)或功能上類似但可能是所述另 一個或另 一些設(shè)備或過程的修改形式。
在特定約束下,可實(shí)現(xiàn)圖1的前饋例子的近似等價的反饋布置。圖2 描繪了這樣的例子,其中音頻信號同樣施加于信號路徑中的修正音頻信號 過程或設(shè)備2。過程或設(shè)備2同樣從控制路徑接收修正^ltM,在控制路 徑中,反饋布置中的生成修正M過程或設(shè)備4,從修正音頻信號2的輸出 端接收經(jīng)修正的音頻信號作為其輸入。因此,在圖2例子中,是經(jīng)修正的 音頻而不是未修正的音頻被施加于控制#。修正音頻信號過程或設(shè)備2 和生成修正參數(shù)過程或設(shè)備4,修正音頻信號以減小其特定響度與目標(biāo)特 定響度之間的差異。過程或設(shè)備4,可包括幾個功能和/或設(shè)備"計(jì)算未修 正的音頻的特定響度的近似"過程或設(shè)備12、"計(jì)算目標(biāo)特定響度的近似"過程或i更備14、以及計(jì)算修正^的"計(jì)算修正M"過程或設(shè)備10,。
在該一個或多個函數(shù)F可逆這一約束下,過程或設(shè)備12通過向經(jīng)修 正的音頻信號的特定響度或部分特定響度施加反函數(shù)F1來估計(jì)未l務(wù)正的 音頻信號的特定響度。如上所述,設(shè)備或過程12可計(jì)算反函數(shù)F1。 i1^ 圖2中示意性地顯示為到過程或設(shè)備12的"選擇反函數(shù)F"和函數(shù)^" 輸入。"計(jì)算目標(biāo)特定響度的近似"14通過計(jì)算經(jīng)修正的音頻信號的特定 響度或部分特定響度來工作。該特定響度或部分特定響^i目標(biāo)特定響度 的近似。計(jì)算修正參數(shù)IO,使用未修正的音頻信號的特定響度的近似以及 目標(biāo)特定響度的近似來導(dǎo)出修正^tM,修正^M當(dāng)被修正音頻信號 2施加于音頻信號時減小經(jīng)修正的音頻信號的特定響度或部分特定響度 與目標(biāo)特定響度之間的差異。如上所述,這些修正^M可例如采^fe 加于濾波器組的頻帶或時變?yōu)V波器的系數(shù)的時變增益的形式。在計(jì)算修正 IO"實(shí)際實(shí)施例中,及Jt環(huán)可在修正^ M的計(jì)算和施加之間引入延遲。
如上所述,在具有次要干擾音頻信號(比如噪聲)的回放環(huán)境中,計(jì) 算修正^lt 10,、計(jì)算未修正的音頻的特定響度的近似12、以及計(jì)算目標(biāo) 特定響度的近似14每個都同樣可以以任選輸入來接收這樣的次要干擾音 頻信號的度量或該次要干擾信號本身作為其輸入之一,且過程或設(shè)備12 和過程或設(shè)備14每個都可計(jì)算經(jīng)修正的音頻信號的部分特定響度。這樣 的任選輸入在圖2中用虛線示出。
如上所述,本發(fā)明諸方面的混合前饋/反饋實(shí)施的例子是可能的。圖3 和4示出了這樣的實(shí)施的兩個例子。在圖3和4例子中,如圖l和2例子 中那樣,音頻信號同樣施加于信號路徑中的修正音頻信號過程或設(shè)備2, ^t目應(yīng)控制路徑中的生成修正^ (圖3中的4",圖4中的4",)每個都 接收未修正的音頻信號和經(jīng)修正的音頻信號二者。在圖3和4例子中,修 正音頻信號2和生成修正參數(shù)(分別是4"和4",)修正音頻信號以減小其 特定響度(它可能是隱式的)與目標(biāo)特定響度(它也可能是隱式的)之間 的差異。
在圖3例子中,生成修正^過程或設(shè)備4,可包括幾個功能和/或設(shè) 備如圖l例子中的計(jì)算目標(biāo)特定響度6、如圖2反饋例子中的計(jì)算目標(biāo) 特定響度的近似14、以及"計(jì)算修正^lt"過程或設(shè)備10"。如圖l例子 中那樣,在此混合前饋/反饋例子的前饋部分中,計(jì)算目標(biāo)特定響度6可 執(zhí)行一個或多個函數(shù)"F",其每個可具有函數(shù)參數(shù)。這在圖3中示意性地顯示為到過程或設(shè)備6的"選擇函數(shù)F和函數(shù)^lt"輸入。在此混合前饋 /反饋例子的反饋部分中,如圖2反饋例子中那樣,經(jīng)修正的音頻信號被 施加于計(jì)算目標(biāo)特定響度的近似14。過程或設(shè)備14通過計(jì)算經(jīng)修正的音 頻信號的特定響度或部分特定響度來如它在圖2例子中工作那樣在圖3 例子中工作。這樣的特定響度或部分特定響Jbl目標(biāo)特定響度的近似。目 標(biāo)特定響度(來自過程或設(shè)備6)和目標(biāo)特定響度的近似(來自過程或設(shè) 備14)被施加于計(jì)算修正^ltlO,,以導(dǎo)出修正^ltM,修正^M當(dāng)被 修正音頻信號2施加于音頻信號時減小未修正的音頻信號的特定響度與 目標(biāo)特定響度之間的差異。如上所述,這些修正^ M可例如采取施加 于濾波器組的頻帶或時變?yōu)V波器的系數(shù)的時變增益的形式。在實(shí)際實(shí)施例 中,反饋環(huán)可在修正參數(shù)M的計(jì)算和施加之間引入延遲。如上所述,在 具有次要干擾音頻^f號(比如噪聲)的回放環(huán)境中,計(jì)算修正參數(shù)10" 和計(jì)算目標(biāo)特定響度的近似14每個都同樣可以以任選輸入來接收這樣的 次要干擾音頻信號的度量或該次要干擾信號本身作為其輸入之一,且過程 或設(shè)備14可計(jì)算經(jīng)修正的音頻信號的部分特定響度。任選輸入在圖3中 用虛線示出。
計(jì)算修正^lt IO"可采用誤差檢測設(shè)備或功能,使得其目標(biāo)特定響度 與目標(biāo)特定響度近似輸入之間的差異調(diào)整修正參數(shù)以便減小目標(biāo)特定響 度的近似與"實(shí)際"目標(biāo)特定響度之間的差異.這樣的調(diào)整減小了未修正 的音頻信號的特定響度與目標(biāo)特定響度(其可能是隱式的)之間的差異。 因此,修正參數(shù)M可基于目標(biāo)特定響度與目標(biāo)特定響度近似之間的誤差 被更新,其中目標(biāo)特定響度在前饋路徑中根據(jù)原始音頻的特定響度使用函 數(shù)F算出,而目標(biāo)特定響度近似在反饋路徑中根據(jù)經(jīng)修正的音頻的特定響 度或部分特定響度算出。
在圖4例子中,示出了一個可替選的前饋/^Jt例子。此可替選例子 與圖3的例子的不同之處在于該一個或多個反函數(shù)F"在反饋路徑中計(jì) 算,而不是該一個或多個函數(shù)F在前饋路徑中計(jì)算。在圖4例子中,生成 修正M過程或設(shè)備4,可包括幾個功能和/或設(shè)備如圖l前饋例子中的 計(jì)算特定響度8、如圖2反饋例子中的計(jì)算未修正的音頻的特定響度的近 似12、以及計(jì)算修正參數(shù)10,"。如圖l前饋例子中那樣,計(jì)算特定響度8 提供未修正的音頻信號的特定響度作為到計(jì)算修正;^lt 10",的輸入。如圖 2>^饋例子中那樣,在該一個或多個函數(shù)F可逆這一約束下,過程或設(shè)備 12通過向經(jīng)修正的音頻信號的特定響度或部分特定響度施加反函數(shù)F1來 估計(jì)未修正的音頻信號的特定響度。示出了計(jì)算未修正的音頻的特定響度的近似12的"選擇反函數(shù)和反函數(shù)參數(shù)"輸入,以表明如上所述那樣設(shè) 備或過程12可計(jì)算反函數(shù)F1。這在圖4中示意性地顯示為到過程或設(shè)備 12的"選擇反函數(shù)F"和函數(shù)^"輸入。因此,過程或設(shè)備12提供未 修正的音頻信號的特定響度的近似作為到計(jì)算修正M IO,"的另一個輸 入。
如圖1-3的例子中那樣,計(jì)算修正M 10",導(dǎo)出修正^ltM,修正 參數(shù)M當(dāng)被修正音頻信號2施加于音頻信號時減小未修正的音頻信號的 特定響度與目標(biāo)特定響度(其在此例子中是隱式的)之間的差異。如上所 述,修正^ M可例如采取施加于濾波器組的頻帶或時變?yōu)V波器的系數(shù) 的時變增益的形式。在實(shí)際實(shí)施例中,^J績環(huán)可在〗務(wù)正M M的計(jì)算和 施加之間引M遲。如上所述,在具有次要干擾音頻信號(比如噪聲)的 回放環(huán)境中,計(jì)算修正M IO,,,和計(jì)算未修正的音頻的特定響度的近似 12每個都同樣可以以任選輸入來接收這樣的次要干擾音頻信號的度量或 該次要干擾信號本身作為其輸入之一,且過程或設(shè)備12可計(jì)算經(jīng)《務(wù)正的 音頻信號的部分特定響度。任選輸入在圖4中用虛線示出。
計(jì)算修正^lt IO",可采用誤差檢測設(shè)備或功能,使得其特定響度與 特定響度近似輸入之間的差異產(chǎn)生這樣的輸出其調(diào)^^正M以便減小 特定響度的近似與"實(shí)際"特定響度之間的差異。因?yàn)樘囟懚鹊慕茝?經(jīng)修正的音頻的特定響度或部分特定響度(其可視為目標(biāo)特定響度的近 似)導(dǎo)出,所以這樣的調(diào)整減小了經(jīng)修正的音頻信號的特定響度與目標(biāo)特 定響度(其為該一個或多個函數(shù)F"所固有)之間的差異。因此,修正參 數(shù)M可基于特定響度與特定響度近似之間的誤差被更新,其中特定響度 在前饋路徑中根據(jù)原始音頻算出,而特定響度近似在反饋路徑中根據(jù)經(jīng)修 正的音頻的特定響度或部分特定響度、使用該一個或多個反函數(shù)F1算出。 歸因于J^饋3M^,實(shí)際實(shí)施可在修正^t的更新和施加之間引AJl遲。
雖然圖1-4的例子中的修正^M當(dāng)被施加于〗務(wù)正音頻信號過程或 設(shè)備2時減小音頻信號的特定響度與目標(biāo)特定響度之間的差異,但在實(shí)際 實(shí)施例中,響應(yīng)于同一音頻信號而產(chǎn)生的對應(yīng)^"正^可能彼此不相同。
雖然對本發(fā)明諸方面來說不是關(guān)鍵或必需的,音頻信號或經(jīng)修正的音 頻信號的特定響度的計(jì)算可有利地采用7>布為WO 2004/111964 A2的所 述國際專利申請?zhí)朠CT/US2004/016964中闡述的技術(shù),其中該計(jì)算>^構(gòu) 成一組的兩個或更多特定響度模型函數(shù)中選擇兩個或更多所述特定響度 模型函數(shù)中的一個或組合,其選擇由輸入音頻信號的特征的度量來控制。后面對圖7的特定響度104的描述描述了這樣的布置。
根據(jù)本發(fā)明的又一些方面,未修正的音頻信號以及(1)修正M或 者(2)目標(biāo)特定響度或目標(biāo)特定響度的表示(例如,可用于顯式或隱式 地計(jì)算目標(biāo)特定響度的縮放因子)可被存儲或發(fā)送以例如供時間和/或空
間分離的設(shè)備或過程使用。如上所述,修正參數(shù)、目標(biāo)特定響度或目標(biāo)特 定響度的表示可以如例如圖1-4的前饋、反饋和混合前饋/反饋布置例子之 一中那樣以任何適當(dāng)方式確定。在實(shí)踐中,比如圖1的例子中的前饋布置 是最不復(fù)雜和最快的,因?yàn)樗苊饬嘶诮?jīng)修正的音頻信號的計(jì)算。在圖 5中示出了發(fā)送或存儲未修正的音頻和修正^的例子,而在圖6中示出 了發(fā)送或存儲未修正的音頻和目標(biāo)特定響度或目標(biāo)特定響度的表示的例 子。
比如圖5的例子中的布置可用來將修正參數(shù)向音頻信號的施加與這 樣的修正^lt的生成在時間和/或空間上分離。比如圖6的例子中的布置 可用來將修正參數(shù)的生成和施加與目標(biāo)特定響度或其表示的生成在時間 和/或空間上分離。這兩種類型的布置都使得避免了生成修正參數(shù)的或生 成目標(biāo)特定響度的復(fù)雜度的簡單低成本回放或接收布置成為可能。雖然圖 5類型的布置比圖6類型的布置簡單,但圖6布置具有如下優(yōu)點(diǎn)尤其是 當(dāng)目標(biāo)特定響度的表示(比如一個或多個尺度因子)被存儲或發(fā)送時,需 要被存儲或發(fā)送的信息可少得多。信息存儲或發(fā)送的這種減小在低比特率 音頻環(huán)境中可能尤其有用。
相應(yīng)地,本發(fā)明的又一些方面是提供這樣的設(shè)備或過程(l)其從存 儲或發(fā)送設(shè)備或過程接收或回放修正參數(shù)M并將它們施加于同樣被接收 到的音頻信號;或者(2)其從存儲或發(fā)送設(shè)備或過程接收或回放目標(biāo)特 定響度或目標(biāo)特定響度的表示,通過將目標(biāo)特定響度或其表示施加于同樣 被接收到的音頻信號(或施加于音頻信號的度量比如其特定響度,其中特 定響度可從音頻信號導(dǎo)出)來生成修正參數(shù)M,并將修正^M施加于 接收到的音頻信號。這樣的設(shè)備或過程可特征化為解碼過程或解碼器;而 產(chǎn)生存儲或發(fā)送的信息所需的設(shè)備或過程可特征化為編碼過程或編碼器。 這樣的編碼過程或編碼器是圖l-4布置例子中的那些可用來產(chǎn)生相應(yīng)解碼 過程或解碼器需要的信息的部分。這樣的解碼過程或解碼器可與處理和/ 或再現(xiàn)聲音的幾乎任何類型的過程或設(shè)備相關(guān)聯(lián)或一起工作。
在本發(fā)明的一方面,如圖5的例子中那樣,例如由修正M生成過程 或生成器(比如圖1的生成^務(wù)正^lt4、圖2的生成修正^IU,、圖3的生成修正^lt 4"、或圖4的生成修正M 4",)產(chǎn)生的修正M M和未 修正的音頻信號可被施加于任何適當(dāng)?shù)拇鎯虬l(fā)送設(shè)備或功能("存儲或 發(fā)送")16。在使用圖1的前饋例子作為編碼過程或編碼器的情形下,如 果無需在編碼器或編碼過程的時間或空間位置提供經(jīng)修正的音頻,則修正 音頻信號2將不需要生成經(jīng)修正的音頻并可被省略。存儲或發(fā)送16可包 括例如任何適當(dāng)?shù)拇?、光或固態(tài)存儲器和回放設(shè)備或任何適當(dāng)?shù)挠芯€或無 線發(fā)送和接收設(shè)備,其選擇對本發(fā)明來說不是關(guān)鍵的?;胤呕蚪邮盏男拚?^!t然后可被施加于圖l-4的例子中采用的類型的修正音頻^t2,以便 修正回放或接收的音頻信號使得其特定響度近似于從中導(dǎo)出修正參數(shù)的 布置的或?yàn)樵摬贾盟逃械哪繕?biāo)特定響度.修正^可以以各種方式中的 任一種存儲或發(fā)送。例如,它們可作為伴隨音頻信號的元數(shù)據(jù)^L存儲或發(fā) 送,它們可在不同的路徑或通道中被發(fā)送,它們可在音頻中被加密編碼, 它們可被復(fù)用,等等。使用修正M來修正音頻信號可以是任選的,且如 果是任選的,則它們的使用可例如由用戶選擇。例如,修正M當(dāng)被施加 于音頻信號時可減小音頻信號的動態(tài)范圍。是否要采用這樣的動態(tài)范圍減 小可由用戶選擇。
在本發(fā)明的另一方面,如圖6的例子中那樣,未修正的音頻信號和目 標(biāo)特定響度或目標(biāo)特定響度的表示可被施加于任何適當(dāng)?shù)拇鎯ζ骰虬l(fā)送 設(shè)備或功能("存儲或發(fā)送")16。在使用比如圖1的例子中的前饋配置作 為編碼過程或編碼器的情形下,如果無需在編碼器或編碼過程的時間或空 間位置提^H務(wù)正^或經(jīng)修正的音頻,則計(jì)算修正M 10類型的過程或 設(shè)備和修正音頻信號2類型的過程或設(shè)備都將不需要并可被省略。如圖5
例子的情形下那樣,存儲或發(fā)送16可包括例如任何適當(dāng)?shù)拇?、光或固態(tài) 存儲器和回放設(shè)備或任何適當(dāng)?shù)挠芯€或無線發(fā)送和接收設(shè)備,其選擇對本
發(fā)明來說不是關(guān)鍵的。回放或接收的目標(biāo)特定響度或目標(biāo)特定響度的表示 然后可與未修正的音頻一起被施加于圖1例子中采用的類型的計(jì)算修正 參數(shù)10或施加于圖3例子中采用的類型的計(jì)算修正M 10",以便提供 修正M M,然后#"正>|* M可被施加于圖1-4例子中采用的類型的修 正音頻信號2,以便修正回放或接收的音頻信號使得其特定響度近似于從 中導(dǎo)出4務(wù)正^lt的布置的或?yàn)樵摬贾盟逃械哪繕?biāo)特定響度。雖然目標(biāo)特 定響度或其表示最容易可以在圖1例子類型的編碼過程或編碼器中獲得, 但目標(biāo)特定響度或其表示或者目標(biāo)特定響度的近似或其表示可以在圖2-4 例子類型的編碼過程或編碼器中獲得(近似在圖2和3中的過程或設(shè)備 14中以及在圖4中的過程或設(shè)備12中計(jì)算)。目標(biāo)特定響度或其表示可以以各種方式中的任一種存儲或發(fā)送.例如,其可作為伴隨音頻信號的元 數(shù)據(jù)被存儲或發(fā)送,其可在不同的路徑或通道中被發(fā)送,其可在音頻中被 加密編碼,其可被復(fù)用,等等。使用從存儲或發(fā)送的目標(biāo)特定響度或其表 示導(dǎo)出的修正參數(shù)來修正音頻信號可以是任選的,且如果是任選的,則它 們的使用可例如由用戶選擇。例如,修正^t當(dāng)被施加于音頻信號時可減 小音頻信號的動態(tài)范圍。是否要采用這樣的動態(tài)范圍減小可由用戶選擇。
當(dāng)將本發(fā)明實(shí)施為數(shù)字系統(tǒng)時,前饋配置是最實(shí)用的,因此下面詳細(xì) 描述這樣的配置的例子,但應(yīng)理解本發(fā)明的范圍不局限于此。
在整篇文獻(xiàn)中,比如"濾波器"或"濾波器組"的術(shù)語在此用來包括
基本上任何形式的遞歸和非遞歸濾波,比如IIR濾波器或變換,而"經(jīng)濾 波的"信息是施加這樣的濾波器的結(jié)果。下面描述的實(shí)施例采用由變換實(shí) 現(xiàn)的濾波器組。
圖7描繪了體現(xiàn)在前饋布置中的本發(fā)明的一方面的示例實(shí)施例的更 多細(xì)節(jié)。音頻首先通過分析濾波器組功能或設(shè)備("分析濾波器組")100, 分析濾波器組100將音頻信號分成多個頻帶(因此,圖5示出了分沖斤濾波 器組100的多個輸出,每個輸出表示一個頻帶,該輸出經(jīng)過各功能或設(shè)備 一直到合成濾波器組,合成濾波器組將各頻帶相加為組合寬帶信號,這在 后面進(jìn)一步描述)。分析濾波器組IOO中的每個頻帶所關(guān)聯(lián)的濾波器的響 應(yīng)被設(shè)計(jì)成對內(nèi)耳基膜的特定位置的響應(yīng)進(jìn)行仿真。接著,分析濾波器組 100中的每個濾波器的輸出傳入透射濾波器或透射濾波器功能("透射濾 波器")101,透射濾波器101對音頻透過外耳和中耳的透射這一濾波效應(yīng) 進(jìn)行仿真。如果^f5l要計(jì)量音頻的響度,透射濾波器可先于分析濾波器組被 施加,但因?yàn)榉治鰹V波器組輸出被用來合成經(jīng)修正的音頻,所以在該濾波 器組之后施加透射濾波器是有利的。接著,透射濾波器101的輸出傳入激 勵功能或設(shè)備("激勵")102,激勵102的輸出對能量沿基膜的分布進(jìn)行 仿真。激勵能量值可由平滑功能或i殳備("平滑")103在時間上平滑。平 滑功能的時間常數(shù)根據(jù)期望應(yīng)用的要求來i殳置。隨后,經(jīng)平滑的激勵信號 在特定響度功能或設(shè)備("特定響度(SL)") 104中被轉(zhuǎn)換成特定響度。 特定響度以"宋每單位頻率"為單位來表示。每個頻帶所關(guān)聯(lián)的特定響度 分量被傳入特定響度修正功能或設(shè)備("SL修正")105。 SL修正105將 原始特定響度取作其輸入然后輸出期望或"目標(biāo)"特定響度,根據(jù)本發(fā)明 的一方面,該期望或"目標(biāo)"特定響度優(yōu)選為原始特定響度的函數(shù)(參見 后面的標(biāo)題,名稱為"目標(biāo)特定響度")。依賴于所期望的效果,各頻帶之間可存在相互依賴性(圖7中的交叉連接線所示的頻率平滑),或者SL 修正105可在每個頻帶上獨(dú)立工作。將來自激勵102的經(jīng)平滑的激勵頻帶 分量和來自SL修正105的目標(biāo)特定響JL取作輸入,增益求解器功能或i殳 備("增益求解器")106確定需要被施加于分析濾波器組100的輸出的每 個頻帶以便將計(jì)量到的特定響度變換成目標(biāo)特定響度的增益。增益求解器 可以以各種方式實(shí)現(xiàn)。例如,增益求解器可包括比如公布為WO 2004/111964 A2的所述國際專利申請?zhí)朠CT/US2004/016964中公開的迭 代過程那樣的迭代過程,或(可替選地)表查找。雖然增益求解器106 所生成的每頻帶增益可由任選的平滑功能或設(shè)備("平滑")107在時間上 進(jìn)一步平滑以使感知假象最小化,但優(yōu)選地在整個過程或設(shè)備中的其它地 方施加時間平滑,如別處描述的那樣。最后,增益通it^目應(yīng)的乘法組合功 能或組合器108 ^L施加于分析濾波器組100的相應(yīng)頻帶,由經(jīng)增益修正的 頻帶在合成濾波器組功能或設(shè)備("合成濾波器組")110中合成經(jīng)處理的 或"經(jīng)修正的"音頻。此外,分析濾波器組的輸出可在施加增益之前fc^ 遲功能或設(shè)備("延遲")109延遲以便補(bǔ)償與增益計(jì)算相關(guān)聯(lián)的任何等待 時間??商孢x地,代替計(jì)算在頻帶中施加增益修正所使用的增益,增益求 解器106可計(jì)算控制時變?yōu)V波器(比如多抽頭FIR濾波器或多極IIR濾 波器)的濾波器系數(shù)。為便于說明,本發(fā)明諸方面主要描述為采用施加于 頻帶的增益因子,但應(yīng)理解亦可在實(shí)際實(shí)施例中釆用濾波器系數(shù)和時變?yōu)V
在實(shí)際實(shí)施例中,音頻處理可在數(shù)字域內(nèi)執(zhí)行。因此,音頻輸入信號 由以某個采樣頻率/,從音頻源采樣得到的離散時間序列x["]來表示。假定
序列4"]已被適當(dāng)縮放以使得由下式給出的4"]的均方根功率(分貝)
fi £ 、 爾必=101唯。75>2["]
71=0
與收聽者收聽音頻的聲壓級(分貝)相等。此外,為便于說明,假定音頻 信號是單聲道的。
分析濾波器組IOO、透射濾波器101、激勵102、特定響度104、特定 響度修正105、增益求解器106和合成濾波器組110可更詳細(xì)地描述如下。
分析濾波器組100
音頻輸^^信號被施加于分析濾波器組或?yàn)V波器組功能("分析濾波器組")100。分析濾波器組100中的每個濾波器被設(shè)計(jì)成對沿著內(nèi)耳基膜的 特定位置的頻率響應(yīng)進(jìn)行仿真。濾波器組100可包括一組線性濾波器,該 組線性濾波器的帶寬和間距在由Moore、 Glasberg和Baer定義的等價矩 形帶寬(ERB)頻率尺度(B. C. J. Moore, B. Glasberg, T. Baer, "A Model for the Prediction of Thresholds, Loudness, and Partial Loudness,"見前 面)上是恒定的。
雖然ERB頻率尺度與人類感知更緊密地匹配并且在產(chǎn)生與主觀響度 結(jié)果匹配的客觀響度計(jì)量結(jié)果方面展示出改善的性能,但也可以以性能降 低的方式采用Bark頻率尺度。
對于中心頻率/(赫茲), 一個ERB頻帶的寬度(赫茲)可近似為
£朋(/) = 24.7(4.37//1000 + 1) (1) 根據(jù)此關(guān)系式,彎曲頻率尺度被定義為使得在沿著彎曲尺度的任何點(diǎn)
處,以彎曲尺度為單位的對應(yīng)ERB等于1。用于從線性頻率(赫茲)向 此ERB頻率尺度轉(zhuǎn)換的函數(shù)通過將等式1的倒數(shù)積分來獲得
歷7b五朋0 f-^-c//=21.41og10(4.37//1000 + l) (2a)
J 24.7(4.37//1000 + 1) &io、 J
通過在等式2a中求解/來表ii^ERB尺度回到線性頻率尺度的變換 也是有用的
層綠(e) = / = =10(6/21") (2b)
其中e以ERB尺度為單位。圖9示出了 ERB尺度與頻率(赫茲)之間的 關(guān)系。
分析濾波器組100可包括處于沿著ERB尺度均勻間隔開的中心頻率
.y;["的、稱為頻帶的s個聽覺濾波器。更具體而言,
= (3a)
/C[W = /C[6 —1] +五朋raHzCHzIb五朋C/;[6 —1]) + A) 6 = 2—5 (3b)
訓(xùn)</隨, (3c) 其中A是分析濾波器組100的期望ERB間距,/_和/_分別是期望最小和最大中心頻率??蛇x擇A-1,考慮到人耳敏感的頻率范圍,可設(shè)置L
=50 Hz且= 20,000 Hz。利用例如這樣的^lt,應(yīng)用等式3a-3c得到5 -40個聽覺濾波器。
Moore和Glasberg提出,每個聽覺濾波器的幅頻響應(yīng)可由舍入 (rounded)指數(shù)函數(shù)特征化。具體而言,具有中心頻率/;問的濾波器的 幅度響應(yīng)可計(jì)算為
<formula>formula see original document page 35</formula> (4a)
其中,
<formula>formula see original document page 35</formula>(4b)
<formula>formula see original document page 35</formula>(4c)
圖10中示出了近似于ERB尺度上的臨界頻帶的這樣的萬個聽覺濾波器的 幅度響應(yīng)。
分析濾波器組100的濾波操作可使用常稱為短時離散傅立葉變換 (STDFT )的有限長度離散傅立葉變換足夠地取近似,因?yàn)橐砸纛l信號 的采樣速率運(yùn)轉(zhuǎn)濾波器的實(shí)施(稱為全速率實(shí)施)被認(rèn)為提供了超出精確 響度計(jì)量所必需的時間分辨率。通過使用STDFT而不是全速率實(shí)施,可 實(shí)現(xiàn)效率的提高和計(jì)算復(fù)雜度的降低。
輸入音頻信號x["]的STDFT被定義為
<formula>formula see original document page 35</formula>(5a)
其中&是頻率指標(biāo),f是時間塊指標(biāo),W是DFT大小,r是0巨大小, 是被歸一化使得
<formula>formula see original document page 35</formula> (5b)
的長度w窗口。
注意,與用秒度量時間形成對比,等式5a中的變量f是表示STDFT 的時間塊的離散指標(biāo)。f的每個增量表示沿著信號r個樣本的0巨。 后面對指標(biāo)f的引用采取了此定義。盡管依賴于實(shí)施細(xì)節(jié)可使用不同的參
35數(shù)設(shè)置和窗口形狀,樹于厶=44層他,選捧JV-2048 、 r = 1024并且使wn
為Hanning窗提供了時間和頻率分辨率的足夠平衡。使用快速傅立葉變 換(FFT),上述STDFT可能效率更高.
代替STDFT,可利用修正離^t余弦變換(MDCT)來實(shí)現(xiàn)分析濾波 器組。MDCT是常用在感知音頻編碼器比如Dolby AC-3中的變換。如果 本發(fā)明的系統(tǒng)利用這種感知編碼音頻來實(shí)現(xiàn),則通過處理該編碼音頻的現(xiàn) 有MDCT系數(shù)從而消除執(zhí)行分析濾波器組變換的需要,本發(fā)明的響度計(jì) 量和修正可更有效地實(shí)現(xiàn)。輸入音頻信號x["]的MDCT由下式給出
鄧,,]=Z剩x[" + J] cos((2;r / A0(A: +1 / 2)(" + w0))
其中 。=^f±l (6)
通常,0巨大小r被選擇為變換長度iv的',一半,使得有可能完美地重
構(gòu)信號JC["]。
透射濾波器101
分析濾波器組100的輸出被施加于透射濾波器或透射濾波器功能 ("透射濾波器")101,透射濾波器101根據(jù)音頻透it^卜耳和中耳的透射 對濾波器組的每個頻帶進(jìn)行濾波。圖8描繪了在可聽頻率范圍內(nèi)的、透射 濾波器的一個適當(dāng)?shù)姆l響應(yīng)尸(/)。在1姐z以下,該響應(yīng)是1,而在1 kHz 以上,該響應(yīng)與IS0 226標(biāo)準(zhǔn)中規(guī)定的聽覺閾值成反比,其中該閾值在l kHz歸一4匕為1。
激勵102
為了計(jì)算輸入音頻信號的響度,需要在施加透射濾波器101之后度量 分析濾波器組100的每個濾波器中的音頻信號的短時能量.此時變且頻變 的度量被稱為激勵。分析濾波器組100中的每個濾波器的短時能量輸出可 在激勵功能102中通過將頻域內(nèi)的濾波器響應(yīng)與輸入信號的功率譜相乘 來取近似
其中Z)是頻帶號,/是塊號,仏W和iW分別是以對應(yīng)于STDFT或MDCT雙態(tài)(bin)指標(biāo)A的頻率采樣得到的聽覺濾波器和透射濾波器的頻率響 應(yīng)。應(yīng)注意,可在等式7中使用與等式4a-4c中規(guī)定的聽覺濾波器幅度響 應(yīng)不同的聽覺濾波器幅度響應(yīng)的各形式來實(shí)現(xiàn)類似的結(jié)果。例如,公布為 WO 2004/111964 A2的所述國際申請?zhí)朠CT/US2004/016964描述了兩種 可替選方案由第12階IIR傳遞函數(shù)特征化的聽覺濾波器、以及低成本 "磚墻(brick-wall)"帶通近似。
總而言之,激勵功能102的輸出是能量五在相應(yīng)ERB頻帶6中在每 個時間段,的頻域表示。
時間平均("平滑")103
如后面描述的那樣,對于本發(fā)明的某些應(yīng)用,可能期望在激勵 ]變 換成特定響度之前將其平滑。例如,可才艮據(jù)以下等式在平滑功能103中遞 歸地執(zhí)行平滑處理
<formula>formula see original document page 37</formula> (8)
其中每個頻帶6處的時間常數(shù)A根據(jù)期望應(yīng)用來選擇。在大多數(shù)情形下, 時間常數(shù)可有利地選擇為與頻帶6內(nèi)人類響度感知的積分時間成比例。 Watson和Gengel進(jìn)行實(shí)驗(yàn)證明了此積分時間在低頻(125-200 Hz)下處 于150-175 ms范圍內(nèi)而在高頻下處于40-60 ms范圍內(nèi)(Charles S. Watson 和Roy W. Gengel, "Signal Duration and Signal Frequency in Relation to Auditory Sensitivity" Journal of the Acoustical Society of America, 第46 巻,第4號(第2部分),1969年,989-997頁)。
特定響度104
在特定響度轉(zhuǎn)換器或轉(zhuǎn)換功能("特定響度")104中,激勵的每個頻 帶被轉(zhuǎn)換成以"宋每ERB"度量的特定響度的分量值。
初始時,在計(jì)算特定響度時,E[M的每個頻帶中的激勵級可被變換 成圖12中的由透射濾波器尸②M^化的圖11中的ISO 226的等響度線所 規(guī)定的1 kHz處的等價激勵級
<formula>formula see original document page 37</formula> (9) 其中《股(五,/)是生成與頻率/處的級五等響度的、1 kHz處的級的函數(shù)。在實(shí)踐中,T^(A/)被實(shí)施為由透射濾波器M^f匕的等響度線的查找表的
插值。向1 kHz處的等價級的變換簡化了下面的特定響度計(jì)算。 接著,每個頻帶中的特定響度可計(jì)算為
<formula>formula see original document page 38</formula> (10)
其中^[W]和l[M分別U于窄帶和寬帶信號模型的特定響度值。值 [^]是根據(jù)音頻信號計(jì)算的處在0和1之間的插值因子。公布為wo 2004/111964 A2的所述國際申請?zhí)朠CT/US2004/016964描述了 一種用于 根據(jù)激勵的頻諳平坦度計(jì)算"[M]的技術(shù)。其還更詳細(xì)地描述了 "窄帶" 和"寬帶"信號模型。
窄帶和寬帶特定響度值A(chǔ)U[V]和A^[M可使用指數(shù)函數(shù)根據(jù)經(jīng)變換 的激勵來估計(jì)
E腿[6,,]〉rQ鵬 (lla) 否則
^姐z[6,?!祌a他 (lib) 否則
其中W股是對于lkHz音調(diào)而言的靜音閾值處的激勵級。從等響度線(圖 11和圖12)中看出,re,等于4.2dB。注意,當(dāng)激勵等于靜音閾值時,這 兩個特定響度函數(shù)都等于零,對于大于靜音閾值的激勵,這兩個函數(shù)都根 據(jù)強(qiáng)度感覺的Stevens定律以冪律單調(diào)增長,用于窄帶函數(shù)的指數(shù)被選擇為 比用于寬帶函數(shù)的指數(shù)大,這使得窄帶函數(shù)比寬帶函數(shù)更i5tit地增大。用 于窄帶和寬帶情形的指數(shù)/ 和增益G的特定選^選擇為與關(guān)于音調(diào)和噪 聲的響度的增長的實(shí)驗(yàn)數(shù)據(jù)匹配。
Moore和Glasberg提出當(dāng)激勵處于聽覺閾值時,特定響度應(yīng)等于 某個小值而不是零。特定響度于是應(yīng)隨著激勵減小到零而單調(diào)減小到零。 理由是聽覺閾值是概率性閾值(在50%時間檢測到音調(diào)的點(diǎn)),而且一起 呈現(xiàn)的每個都處于閾值的許多音調(diào)可相加為比任何單獨(dú)音調(diào)更可聽見的 一個聲音。在本申請中,將特定響度函數(shù)擴(kuò)充有此特性具有如下額外優(yōu)點(diǎn) 使得后面討論的增益求解器在激勵接近閾值時更適當(dāng)?shù)剡\(yùn)轉(zhuǎn)。如果在激勵 處于或低于閾值時特定響度被限定為零,則對于處于或低于閾值的激勵而言增益求解器的唯一解不存在。另一方面,如果如Moore和Glasberg所 提出的那樣對于所有大于或等于零的激勵值而言特定響度被限定為單調(diào) 增大,則唯一解存在。大于1的響度縮放將總是導(dǎo)致大于1的增益,反之 亦然。等式lla和lib中的特定響度函數(shù)可根據(jù)下式更改為具有期望特性
<formula>formula see original document page 39</formula>
(llc)
<formula>formula see original document page 39</formula>(lld)
其中常數(shù);i大于l,指數(shù)w小于l,常數(shù)咒和C被選擇為使得特定響度函 數(shù)及其一階導(dǎo)數(shù)在點(diǎn)罵股[&,,] = Ara她處連續(xù)。
根據(jù)特定響度,總體或"總"響度則由所有頻帶6的特定響度的總 和給出
<formula>formula see original document page 39</formula>(12)
特定響度修正105
在特定響度修正函數(shù)("特定響度修正")105中,被稱為々[W]的目 標(biāo)特定響度可依賴于總體i更備或過程的期望應(yīng)用以各種方式^4t SL 104 (圖7)的特定響度計(jì)算。將在后面更詳細(xì)地描述,在音量控制的情形下, 目標(biāo)特定響度可例如使用尺度因子《來計(jì)算。參見后面的等式16及其相 關(guān)聯(lián)的描述。在自動增益控制(AGC)和動態(tài)范圍控制(DRC)的情形 下,目標(biāo)特定響度可使用期望輸出響度與輸入響度的比值來計(jì)算。參見后 面的等式17和18及其相關(guān)聯(lián)的描述。在動態(tài)均衡的情形下,目標(biāo)特定響 度可使用等式23中闡明的關(guān)系及其相關(guān)聯(lián)的描述來計(jì)算.
增益求解器106
在這個例子中,對于每個頻帶6和每個時間間隔,,增益求解器106將經(jīng)平滑的激勵E[M和目標(biāo)特定響度々[W]取作輸入,并生成隨后用于修
正音頻的增益g[6,,]。令函數(shù)甲H表示從激勵到特定響度的非線性變換,使 得
順]=平{取,]} (13)
增益求解器求得g[zm], ^f吏得
麵,,]=甲{(72[6,頓6,。} (14a)
增益求解器106確定頻變且時變的增益,頻變且時變的增益當(dāng)?shù)v:施加于原始 激勵時產(chǎn)生理想地等于期望目標(biāo)特定響度的特定響度。在實(shí)踐中,增益求
解器106確定頻變且時變的增益,頻變且時變的增益當(dāng)被施加于音頻信號的
頻域版本時導(dǎo)致修正音頻信號以便減小其特定響度與目標(biāo)特定響度之間 的差異。理想地,該<務(wù)正4吏得經(jīng)#"正的音頻信號具有為目標(biāo)特定響度的精
確近似的特定響度。等式14a的求解可以以許多種方式實(shí)現(xiàn)。例如,如果由 Y-力表示的特定響度的反函數(shù)的閉式數(shù)學(xué)表達(dá)式存在,則增益可直接用重 新整理的等式14a計(jì)算
可替選地,如果Y力的閉式解不存在,則可采用迭代法,其中,對于每次 迭代,^^用增益的當(dāng)前估計(jì)來評估等式14a。作為結(jié)果的特定響度與期望目 標(biāo)相比較,且增益基于誤差被更新。如果增益被適當(dāng)?shù)馗?,則增益將收 斂至期望解。另 一方法包括針對每個頻帶中一定范圍的激勵值預(yù)計(jì)算函數(shù) 平fl以創(chuàng)建查找表。^L據(jù)此查找表,獲得反函數(shù)甲"tt的近似,于是增益可 根據(jù)等式14b計(jì)算。如上所述,目標(biāo)特定響度可由特定響度的縮放來表示
= S[Zm],," (14c) 將等式13代入14c然后將14c代入14b,得到增益的可替選表達(dá)式
翻 ,
~ 五[M
我們看到,增益可完全表達(dá)為激勵E[M和特定響度縮放s[^]的函數(shù)。因此, 可通過14d的評估或等價的查找表、而不曾顯式地計(jì)算特定響度或目標(biāo)特
40定響度作為中間值來計(jì)算增益。然而,這些值通過使用等式14d被隱式地 計(jì)算。亦可設(shè)計(jì)通過特定響度和目標(biāo)特定響度的顯示或隱式計(jì)算來計(jì)算修 正M的其它等價方法,本發(fā)明意在涵蓋所有這樣的方法。
合成濾波器組110
如上所述,分析濾波器組100可通過使用短時離散傅立葉變換 (STDFT)或修正離散余弦變換(MDCT)來有效地實(shí)現(xiàn),并可類似地 使用STDFT或MDCT來實(shí)現(xiàn)合成濾波器組110。具體而言,如前面所定 義的那樣,令z[^]表示輸入音頻的STDFT或MDCT,合成濾波器組110 中經(jīng)處理(經(jīng)修正)的音頻的STDFT或MDCT可計(jì)算為
力f ] = ZG[V]W&OTM-d] (15)
其中WW是與頻帶6相關(guān)聯(lián)的合成濾波器的響應(yīng),J是與圖7中的延遲塊 109相關(guān)聯(lián)的延遲。合成濾波器的形狀^W可被選擇為與分析濾波器組中 使用的濾波器的形狀仏W相同,或者它們可被修正為在無任何增益修正 的情況下(即,當(dāng)( [^] = 1時)拔:供完美的重構(gòu)。然后可通過f[^]的逆傅 立葉或修正余弦變換和疊加合成來生成最終經(jīng)處理的音頻,這是本領(lǐng)域技
術(shù)人員所熟悉的。
目標(biāo)特定響度
比如圖l-7例子的、體現(xiàn)本發(fā)明諸方面的布置的行為主要由計(jì)算目標(biāo) 特定響度所^]所采用的方式?jīng)Q定。雖然4^發(fā)明不受用于計(jì)算目標(biāo)特定響 度的任何具體函數(shù)或反函數(shù)的限制,但現(xiàn)在將描述幾個這樣的函數(shù)和它們 的適當(dāng)應(yīng)用。
適用于音量控制的非時變且非頻變的函數(shù)
標(biāo)準(zhǔn)音量控制通過向音頻施加寬帶增益來調(diào)整音頻信號的響度。 一般 而言,增益^L耦合至凝:鈕或滑動器,旋鈕或滑動器由用戶調(diào)整,直到音頻 的響度處于期望級為止。本發(fā)明的一方面允許實(shí)現(xiàn)這種控制的更符合心理 聲學(xué)的方法。根據(jù)本發(fā)明的此方面,并非使寬帶增益耦合至音量控制(其 導(dǎo)致所有頻帶的增益改變相同的量,這可能造成感知頻鐠的改變),而是使特定響度縮放因子與音量控制調(diào)整相關(guān)聯(lián),使得多個頻帶中每個頻帶的 增益改變了考慮了人類聽覺模型的量,使得理想而言感知頻譜沒有改變。 在本發(fā)明的此方面及其示例應(yīng)用的背景下,"恒定的"或"非時變的"意
在允許由用戶例如時而改變音量控制尺度因子的^:置。該"非時變的"有 時被稱為"準(zhǔn)非時變的"、"準(zhǔn)靜態(tài)的"、"分段式非時變的"、"分段 式靜態(tài)的"、"階躍式非時變的"和"階躍式靜態(tài)的"。給定這樣的;CJL
因子《,目標(biāo)特定響度可計(jì)算為計(jì)量到的特定響度乘以"
麵"]-a/V[6,。 (16)
由于總響度印]是所有頻帶6的特定響度A^,,]的總和,所以上面的4務(wù) 正同樣將總響度縮放了 "倍,但其以在特定時間對于音量控制調(diào)整的改變 保持相同的感知頻鐠的方式來進(jìn)行.換句話說,在任何特定時間,音量控 制調(diào)整的改變導(dǎo)致感知響度的改變,但不導(dǎo)致經(jīng)《務(wù)正的音頻的感知頻鐠相
對于未1務(wù)正的音頻的感知頻鐠的改變。圖13a描繪了對于由女性講話構(gòu)成 的音頻信號而言的、當(dāng)《=0.25時、在特定時間",、在頻帶"6"內(nèi)的作 為結(jié)果的多帶增益G[W]。為了比較,還描繪了如標(biāo)準(zhǔn)音量控制中的將原 始總響度縮放0.25倍所需的寬帶增益(水平線)。與中頻帶相比,在低 和高頻帶,多帶增益G[V]增大。這與表明人耳在低頻和高頻較遲鈍的等 響度線相符合。
圖13b描繪了原始音頻信號、根據(jù)現(xiàn)有技術(shù)的音量控制修正了的經(jīng)寬 帶增益修正的信號、以及根據(jù)本發(fā)明的此方面修正了的經(jīng)多帶增益修正的 信號的特定響度。經(jīng)多帶增益修正的信號的特定響度是原始信號被縮放 0.25倍后的特定響度。相對于原始未修正的信號的特定響度,經(jīng)寬帶增益 修正的信號的特定響度的頻鐠形狀發(fā)生了改變。在此情形下,在相對意義 上,特定響度在低頻和高頻處響度受損失。這被感知為音頻隨著其音量被 調(diào)低而鈍化,這個問題不在其響度由在感知響度域內(nèi)導(dǎo)出的增益來控制的 經(jīng)多帶修正的信號的情形下發(fā)生。
與傳統(tǒng)音量控制相關(guān)聯(lián)的感知頻譜平衡的失真一起,還存在第二個問 題。反映在等式lla-lld中所反映的響度模型中的響度感知特性是任何 頻率下信號的響度隨著信號級逼近聽覺閾值而更iStil地減小。因此,向較 柔和信號和較響亮信號施加相同的響度衰減,較柔和信號所需的電衰減小 于較響亮信號所需的電衰減。傳統(tǒng)音量控制無論信號級如何都施加恒定的 衰減,因此,隨著音量被調(diào)低,柔和信號相對于較響亮信號變得"過于柔 和"。在^f艮多情形下,這導(dǎo)致音頻中的細(xì)節(jié)丟失??紤]混響室中響板的錄音。在這樣的錄音中,響板的主"擊打"與混響回音相比是頗為響亮的, 但正是混響回音傳達(dá)該室的大小。隨著利用傳統(tǒng)音量控制來調(diào)低音量,混 響回音與主擊打相比變得更柔和,并最終消失在聽覺閾值以下,留下發(fā)"干 的"聲音的響板。基于響度的音量控制防止錄音的較柔和部分消失的方法
是相對于較響亮的主擊打而增強(qiáng)錄音的較柔和的混響部分,以使得這些
部分之間的相對響度維持恒定。為了實(shí)現(xiàn)此效果,多帶增益G[6,,]必須以
與響度感知的人類時間分辨率相稱的速率隨時間變化。由于多帶增益
邵,,]作為經(jīng)平滑的激勵f[M的函數(shù)被計(jì)算,所以等式8中的時間常數(shù)^ 的選擇決定了增益可在每個頻帶6中隨時間變化的速度。如上所述,這些 時間常數(shù)可選擇為與頻帶6內(nèi)人類響度感知的積分時間成比例,并因此得 到G[zu]隨時間的適當(dāng)變化.應(yīng)注意,如果時間常數(shù)被不適當(dāng)?shù)剡x擇(過 快或過慢),則感知上有害的假象可能被引入經(jīng)處理的音頻中。
適用于固定的均衡的非時變而頻變的函數(shù)
在某些應(yīng)用中,可能希望向音頻施加固定的感知均衡,在此情形下, 目標(biāo)特定響度可通過施加如以下關(guān)系式中的非時變但頻變尺度因子 來計(jì)算
》[ZM] = [6],,f]
其中》[6,,]為目標(biāo)特定響度,7V[^]為音頻信號的特定響度,6為頻率的度 量,,為時間的度量.在此情形下,縮放可隨頻帶不同而變化。這樣的應(yīng)用
可用于例如突出ig頻率占主導(dǎo)的頻,分以便提高可懂度。
適用于自動增益控制和動態(tài)范圍控制的非頻變而時變的函數(shù)
自動增益控制和動態(tài)范圍控制(AGC和DRC )的技術(shù)在音頻處理領(lǐng) 域是眾所周知的。在抽象意義上,這兩種技術(shù)以某種方式計(jì)量音頻信號的 級,然后用為計(jì)量級的函數(shù)的量對該信號執(zhí)行增益修正。對于AGC的情 形,信號被執(zhí)行增益修正,使得其計(jì)量級更接近用戶選擇的參考級。對于 DRC,信號被執(zhí)行增益修正,使得信號的計(jì)量級的范圍被變換成某個期 望范圍。例如,可能希望使音頻的安靜部分較響亮而響亮部分較安靜。 Robinson和Gundry描述了這樣的系統(tǒng)(Charles Robinson和Kenneth Gundry, "Dynamic Range Control via Metadata" , AES第107屆^i義, 預(yù)印本5028, 1999年9月24-27日,紐約)。AGC和DRC的傳統(tǒng)實(shí)施一般利用音頻信號級的簡單計(jì)量(比如經(jīng)平滑的呻,值或均方根(rins)幅 度)來驅(qū)動增益修正。這樣的簡單計(jì)量在一定程度上與音頻的感知響度相 關(guān)聯(lián),但本發(fā)明諸方面通過利用基于心理聲學(xué)模型的響度計(jì)量驅(qū)動增益修 正來允許與感知更貼切的AGC和DRC。同樣,4艮多傳統(tǒng)AGC和DRC 系統(tǒng)利用寬帶增益施加增益修正,從而招致經(jīng)處理音頻的上述音色(頻鐠) 失真。而本發(fā)明諸方面則利用多帶增益以降低或最小化這樣的失真的方式 調(diào)整特定響度。
采用本發(fā)明諸方面的AGC和DRC應(yīng)用均由將輸入寬帶響度AW變換 或映射成期望輸出寬帶響度ZJ。的函數(shù)來特征化,其中響度以感知響度單 位(比如宋)來度量。輸入寬帶響度AW是輸入音頻信號的特定響度A^M] 的函數(shù)。雖然它可能與輸入音頻信號的總響度相同,但它可為音頻信號的 總響度的經(jīng)時間平滑的版本。
圖14a和14b分別描繪了對于AGC和DRC而言典型的映射函數(shù)的 例子。給定其中丄。W是AW的函數(shù)的映射,目標(biāo)特定響度可計(jì)算為
音頻信號的原始特定響度ATM被簡單地縮放等于期望輸出寬帶響度與輸
入寬帶響度的比值的倍數(shù),以得到輸出特定響度々[W]。對于AGC系統(tǒng), 輸入寬帶響度AW —般應(yīng)為音頻的長期總響度的度量。這可通過在時間上 平滑總響度ZW以生成丄,W來實(shí)現(xiàn)。
與AGC相比,DRC系統(tǒng)對信號響度的較短期改變起反應(yīng),因此可 簡單地使A[。等于丄W。因此,由丄。W/AW給出的特定響度的縮放可能i^il 地波動從而導(dǎo)致經(jīng)處理的音頻中存在不希望的假象。 一個典型的假象是 頻鐠的一部分受到頻鐠的某些其它相對不相關(guān)部分的可聽到的調(diào)制。例 如,古典音樂段可能包含持續(xù)弦音符占主導(dǎo)的高頻,而低頻包含響亮的發(fā) 轟隆聲的定音鼓。每當(dāng)定音鼓擊打時,總體響度AW增大,且DRC系統(tǒng) 向整個特定響度施加衰減。于是聽到弦與定音鼓一起在響度上上下"泵動 (pump)"。頻謙中的這種"交叉泵動(crosspumping)"也是傳統(tǒng)寬 帶DRC系統(tǒng)的一個問題,典型的解決方案包括向不同頻帶獨(dú)立地施加 DRC。歸因于采用感知響度模型的特定響度的計(jì)算以及濾波器組,本發(fā) 明的系統(tǒng)是固有多帶的,因此根據(jù)本發(fā)明諸方面將DRC系統(tǒng)修正為以多 帶方式工作是相對直接的,接下來將描述這種修正。適用于動態(tài)范圍控制的頻變且時變的函數(shù)
通過允許輸入和輸出響度隨頻帶Z)獨(dú)立地變化,DRC系統(tǒng)可被擴(kuò)展 為以多帶或頻變方式工作。這些多帶響度值記為A[V]和Z。[Z),/],于是目標(biāo) 特定響度可由下式給出
其中已如圖14b所示、^于每個頻帶6獨(dú)立地從A仇,]算出或映射出丄 ]。
輸入多帶響度A[M是輸入音頻信號的特定響度7V[M的函數(shù)。雖然它可能 與輸入音頻信號的特定響度相同,但它可為音頻信號的特定響度的經(jīng)時間
平滑和/或頻率平滑的版本。
計(jì)算A[M的最直接方法是將其設(shè)置成等于特定響度A^M]。在此情形
下,DRC在感知響度模型的聽覺濾波器組中的每個頻帶上獨(dú)立地執(zhí)行, 而并非如上面在標(biāo)題"適用于自動增益控制和動態(tài)范圍控制的非頻變而時 變的函數(shù)"下描述的那樣對于所有頻帶根據(jù)同一輸入與輸出響度比來執(zhí) 行。在采用40個頻帶的實(shí)際實(shí)施例中,沿著頻率軸的這些頻帶的間距是 相對細(xì)微的以便提供響度的精確度量。然而,向每個頻帶獨(dú)立地施加DRC 尺度因子可能造成經(jīng)處理的音頻聽起來像是"撕裂"的。為了避免此問題, 可選擇通過如下方法來計(jì)算A[Z^]:在頻帶上平滑特定響度7^,小使得從 一個頻帶到下一個頻帶被施加的DRC的量不劇烈地變化。這可通過定義 頻帶平滑濾波器2(6)然后4^據(jù)以下標(biāo)準(zhǔn)巻積和在所有頻帶c上平滑特定響 度來實(shí)現(xiàn)
A[6,,] = S,-Cf] (19)
其中iV[cj]是音頻信號的特定響度,Q(6-c)是平滑濾波器的頻帶平移后的 響應(yīng)。圖15描繪了這種頻帶平滑濾波器的一個例子。
如果將丄,仇,]計(jì)算為丄。[&,,]的函數(shù)的DRC畢數(shù)對于每個頻帶6而言是 固定的,則特定響度7V[W]的每個頻帶遭受的改變的類型將依賴于被處理 的音頻的頻譜而變化,盡管信號的總體響度保持相同.例如,具有響亮低 音和安靜高音的音頻信號可以使低音減弱而高音增強(qiáng)。具有安靜低音和響 亮高音的信號可相反地出現(xiàn)。凈效果為音頻的音色或感知頻鐠的改變,而 這在某些應(yīng)用中可能是所期望的。然而,可能希望不修正音頻的平均感知頻鐠而執(zhí)行多帶DRC??赡?希望每個頻帶的平均修正粗略相同同時仍允許修正的短期變化在頻帶之 間獨(dú)立地產(chǎn)生。期望效果可通過迫使每個頻帶中的DRC的平均行為與某 個參考行為的平均行為相同來實(shí)現(xiàn)??蛇x擇此參考行為作為寬帶輸入響度 AW的期望DRC。令函數(shù)Z。[r^z^C仏W)表示寬帶響度的期望DRC映射。
然后令z;[,]表示寬帶輸入響度的經(jīng)時間平均的版本,并令z;[^]表示多帶輸
入響度丄A,]的經(jīng)時間平均的版本。于是多帶輸出響度可計(jì)算為
注意,多帶輸入響度首先被縮放成落入與寬帶輸入響度的平均范圍相 同的平均范圍內(nèi)。然后施加針對寬帶響v^設(shè)計(jì)的DRC函數(shù)。最后,所得 結(jié)果被回縮減至多帶響度的平均范圍。利用多帶DRC的此^^式表示,頻 鐠泵動降低的優(yōu)點(diǎn)得以保留,同時保持了音頻的平均感知頻鐠。
適用于動態(tài)均衡的頻變且時變的函數(shù)
本發(fā)明諸方面的另 一個應(yīng)用是將音頻的時變感知頻鐠有意地變換成 目標(biāo)非時變感知頻謙同時仍保持音頻的原始動態(tài)范圍??蓪⒋颂幚矸Q為動 態(tài)均衡(DEQ)。對于傳統(tǒng)的靜態(tài)均衡,簡單的固定濾波被施加于音頻以 1更改變其頻譜。例如,可施加固定的低音或高音增強(qiáng)。這種處理未考慮音 頻的當(dāng)前頻譜并因此可能對于某些信號(即,已經(jīng)包含了相對大量的低音 或高音的信號)是不適當(dāng)?shù)?,對于DEQ,信號的頻鐠被計(jì)量,然后信號 被動態(tài)修正以便將計(jì)量到的頻鐠變換成基本上靜態(tài)的期望形狀。對于本發(fā) 明諸方面,在濾波器組中各頻帶上規(guī)定這樣的期望形狀并將其稱為吸問。 在一個實(shí)際實(shí)施例中,計(jì)量到的頻"*應(yīng)表示可通過在時間上平滑特定響度 Ap,,]來生成的音頻的平均頻鐠形狀??蓪⒔?jīng)平滑的特定響度稱為^[6,,]。 如同多帶DRC —樣,可能不希望DEQ修正從一個頻帶到下一個頻帶劇 烈地變化,并因此可施加頻帶平滑函數(shù)來生成經(jīng)頻帶平滑的頻謙Z[6,,]:
(21)
為了保持音頻的原始動態(tài)范圍,期望頻鐠£2間應(yīng)被歸一化以與由 f[6, ]給出的計(jì)量到的頻鐠形狀具有相同的總體響度??蓪⒋藲w 一化頻鐠
形狀稱為1£。[6,。<formula>formula see original document page 47</formula>
(22)
最后,目標(biāo)特定響度被計(jì)算為
<formula>formula see original document page 47</formula>(23)
其中"是范圍在0到1之間的用戶規(guī)定M,指示要施加的DEQ的程度。 參見等式23,注意當(dāng)/ -0時,原始特定響度是未4務(wù)正的,而當(dāng)〃=1時, 特定響度被縮放等于期望頻譜形狀與計(jì)量到的頻鐠形狀的比值的倍數(shù)。
生成期望頻鐠形狀五e問的一種方便的方法是使用戶設(shè)置印問等于 為自己覺得其頻鐠平衡合意的某段音頻計(jì)量到的r[ZM]。在一個實(shí)際實(shí)施 例中,例如如圖16所示,用戶可^L提供掩組或其它適當(dāng)?shù)闹聞悠?07, 致動器507當(dāng)被致動時導(dǎo)致音頻的頻誥形狀r[M的當(dāng)前度量的捕捉,然 后將此度量作為預(yù)設(shè)存儲(在目標(biāo)特定響度預(yù)設(shè)捕捉和存儲506中),該 預(yù)設(shè)可以以后當(dāng)DEQ被啟用(如由預(yù)設(shè)選擇508啟用)時被載入五2M中。 圖16是圖7的簡化版本,其中僅示出了單個線來表示從分析濾波器組100 到合成濾波器組110的多個頻帶。圖17例子還提供動態(tài)EQ特定響度(SL) 修正505,動態(tài)EQ特定響度修正505如上所述那樣才艮據(jù)動態(tài)均^^對由功 能或設(shè)備104計(jì)量到的特定響度進(jìn)行修正。
組合式處理
可能希望將包括音量控制(VC) 、 AGC、 DRC和DEQ的所有前述 處理組合成單個系統(tǒng)。由于這些過程中的每個過程可表示為對特定響度的 縮放,所以所有這些過程可容易地組合如下
<formula>formula see original document page 47</formula> (24)
其中S,[M表示與過程"*"相關(guān)聯(lián)的尺度因子。然后可以為表示組合式處 理的目標(biāo)特定響度計(jì)算單個集合的增益G[M。
在某些情形下,響度修正過程中的一個或組合的凡變因子可能隨時間 過于迅速地波動并在作為結(jié)果的經(jīng)處理的音頻中產(chǎn)生假象。因此可能期望
平滑這些縮放因子的某個子集。 一般而言,來自VC和DEQ的尺度因子 隨時間平滑地變化,但可能需要平滑AGC和DRC尺度因子的組合。令這些尺度因子的組合由下式表示
sc[6,。 = s^gc[6"]smc[Zm] (25)
該平滑所依據(jù)的^MMft念是當(dāng)特定響度增大時,組合尺度因子應(yīng)快速地 反應(yīng),而當(dāng)特定響度減小時,所述尺度因子應(yīng)被更大程度地平滑。此概念 符合在音頻壓縮器設(shè)計(jì)中利用快速擊打和緩慢^^放這一眾所周知的實(shí)踐。 用于平滑尺度因子的適當(dāng)時間常數(shù)可通過在時間上平滑特定響度的經(jīng)頻 帶平滑的版本來計(jì)算。首先計(jì)算特定響度的經(jīng)頻帶平滑的版本
,李i;,-c)餘,。
(26)
其中7V[C]是音頻信號的特定響度,Q(6-c)是如上面等式19中的平滑濾波 器的頻帶平移后的響應(yīng)。
這個經(jīng)頻帶平滑的特定響度的經(jīng)時間平滑的版本于是被計(jì)算為
, 。 = A[&, z ]z[6, + (l -義[6, 。 , ^ -1] 其中頻帶相關(guān)的平滑系數(shù);i[^]由下式給出
(27)
義[M
(28)
經(jīng)平滑的組合尺度因子于是被計(jì)算為
豆c [6, 。 = AM [&, ,]sc [6, f ] + (1 - & [6, f ])互c [6,, -1]
其中4[M是舉,。的經(jīng)頻帶平滑的版本
(29)
Z胸
(30)
平滑系數(shù)的頻帶平滑防止經(jīng)時間平滑的凡變因子隨頻帶劇烈地變化。 所述尺度因子時間及頻帶平滑導(dǎo)致經(jīng)處理的音頻包含更少的有害的感知 假象。
噪聲補(bǔ)償
在很多音頻回放環(huán)境中,存在干擾收聽者希望聽到的音頻的背景噪 聲。例如,行進(jìn)的汽車中的收聽者可能正通過安裝的立體聲系統(tǒng)播放音樂,而來自發(fā)動機(jī)和道路的噪聲可能相當(dāng)大地更改對音樂的感知。具體而言, 對于其中噪聲能量相對于音樂能量而言相當(dāng)大的頻脊郎分,音樂的感知響
度降低.如果噪聲的^UL夠大,則音樂被完全掩蔽。就本發(fā)明的一方面而 言,人們愿意選擇增益G[/M]使得在有干擾噪聲的情況下的經(jīng)處理的音頻 的特定響度等于目標(biāo)特定響度々[W]。為實(shí)現(xiàn)此效果,可利用見前面由 Moore和Glasberg定義的部分響度的概念。假定能夠獲得噪聲對本身的 計(jì)量和音頻對本身的計(jì)量。令^[^]表示來自噪聲的激勵,并令&[6,,]表 示來自音頻的激勵。于是音頻和噪聲的組合特定響度由下式給出<formula>formula see original document page 49</formula> (31)
其中甲{}仍表示從激勵至特定響度的非線性變換??杉俣ㄊ章犝叩穆犛X以 保持以下組合特定響度的方式在音頻的部分特定響度與噪聲的部分特定
響度之間劃分組合特定響度
<formula>formula see original document page 49</formula> (32)
音頻的部分特定響度^[^]是希望控制的值,因此必須求解此值。噪 聲的部分特定響度可近似為
<formula>formula see original document page 49</formula>
其中^[W]是在有噪聲的情況下的掩蔽后的閾值,^[h]是頻帶6處的M 聽覺閾值,K是0到1之間的指數(shù)。將等式31-33相結(jié)合,得到音頻的部 分特定響度的表達(dá)式
<formula>formula see original document page 49</formula>
注意,當(dāng)音頻的激勵等于噪聲的掩蔽后的閾值(£ ]=£W[V])時, 音頻的部分特定響度等于靜音閾值處信號的響度,這是所期望的結(jié)果。當(dāng) 音頻的激勵比噪聲的激勵大4艮多時,等式34中的第二項(xiàng)變?yōu)榱?,音頻的 特定響度近似等于它在無噪聲的情況下的值。換句話說,隨著音頻變得比 噪聲響亮很多,噪聲被音頻所遮蔽。根據(jù)經(jīng)j^擇指數(shù)K以給出與作為信 噪比的函數(shù)的噪聲中音調(diào)的響度的數(shù)據(jù)的良好擬合,Moore和Glasberg 已發(fā)現(xiàn)^=0.3是適當(dāng)?shù)?。噪聲的遮^的閾值可近似為噪聲激勵本身的 函數(shù)
<formula>formula see original document page 49</formula> (35)其中x問是在較低頻帶處增大的常數(shù).因此,由等式34給出的音頻的部 分特定響度可抽象M示為音頻激勵和噪聲激勵的函數(shù)
,』=0{,,,],五洲} (36) 于是可利用經(jīng)修正的增益求解器來計(jì)算增益g[zm],使得在有噪聲的情況
下的經(jīng)處理的音頻的部分特定響度等于目標(biāo)特定響度
= o{g2[mA[W],£v[m} (37)
圖17描繪了圖7的系統(tǒng),但其中原始增益求解器106被所述噪聲補(bǔ) 償增益求解器206 4&替(注意,表示濾波器組的多個頻帶的塊之間的多條 豎直線已被單條線代替以簡化圖示)。圖17還描繪了噪聲激勵的計(jì)量(由 分析濾波器組200、透射濾波器201、激勵202和平滑203以對應(yīng)于塊100、 101、 102和103的工作的方式進(jìn)行計(jì)量),噪聲激勵的計(jì)量結(jié)果與音頻 的激勵(來自平滑103 )及目標(biāo)特定響度(來自sl修正105 ) —起饋送 入新的增益求解器206。
在其最基本的工作模式下,圖17中的sl <務(wù)正105可將目標(biāo)特定響 度^[Zv]簡單地設(shè)置成等于音頻的原始特定響度AT[v]。換句話說,sl修 正提供對音頻信號的特定響度的非頻變尺度因子a縮放,其中《=1。對于 比如圖17中的布置,增益被計(jì)算為使得在有噪聲的情況下的經(jīng)處理的音 頻的感知響度頻誨等于在無噪聲的情況下的音頻的響度頻鐠。另外,用于 計(jì)算作為原始特定響度的函數(shù)的目標(biāo)特定響度的前述技術(shù)(包括vc、 agc、 drc和deq)中的一些技術(shù)中任一種或組合可與噪聲^H嘗響度修 正系統(tǒng)相結(jié)^使用。
在一個實(shí)際實(shí)施例中,噪聲的計(jì)量可M置在將播放音頻的環(huán)境中或 附近的麥克風(fēng)獲得。可替選地,可使用預(yù)定組的模板噪聲激勵iMt各種情 況下的預(yù)期噪聲頻譜取近似。例如,汽車車廂內(nèi)的噪聲可在各種駕駛速度 下被預(yù)分析,然后被存儲為噪聲激勵與速度的關(guān)系的查找表。當(dāng)汽車速度 變化時于是可根據(jù)此查找^j"被饋送入圖17中的增益求解器206的噪聲 激勵取近似,
特定響度的近似
雖然本發(fā)明最適用于使用特定響度的精確度量的情形,但某些應(yīng)用可 能需務(wù)使用較粗略的近似以便降低計(jì)算復(fù)雜度。利用適當(dāng)?shù)慕疲钥蓪?shí) 現(xiàn)感知響度的可接受的估計(jì)和修正。這樣的近似應(yīng)試圖至少部分地保留響度感知的幾個關(guān)鍵方面。首先,該近似應(yīng)至少粗略地捕捉響度感知隨頻率 變化的敏感度。 一般而言,該近似在較低頻和較高頻要比在中頻顯示出更 低的敏感度。其次,該近似應(yīng)展現(xiàn)響度隨信號級的非線性增長。具體而言,
特定響度的增長應(yīng)對于接近聽覺閾值的低級信號是最iS^的,然后隨著信 號級增大而減小至恒定的增長速率.最后,該近似應(yīng)展現(xiàn)響度求和的特性, 這意味著對于恒定的信號級,總響度(特定響度對頻率的積分)隨著信號 帶寬增大而增大。
降低特定響度計(jì)算的復(fù)雜度同時仍保留響度感知的期望特性的一種 方法是使用具有較少頻帶并且其中頻帶可能不在臨界頻帶率尺度上均勻 間隔開的濾波器組,例如,可使用其中頻帶在線性頻率尺度上均勻分布的 5頻帶濾波器組,這與前面描述的40個頻帶形成對比。存在4艮多用于有 效地實(shí)現(xiàn)這樣的濾波器組的技術(shù),例如余弦調(diào)制濾波器組(P.P Vaidyanthan的MultiRate Systems and Filter Banks, 1993年,Prentice Hall)。作為一般性例子,考慮具有S個頻帶的濾波器組,其中每個頻帶 由時域沖擊響應(yīng)/a"]描述。亦假定濾波器組是接近完美的重構(gòu),這意味著
Z&[打px["] (38)
、1
每個頻帶6的頻率響應(yīng)可由中心頻率A和帶寬A厶(赫茲)特征化。于是
以ERB為單位的等價中心頻率和帶寬由下式給出
e廣婦環(huán)") (39a)
A -, (39b)
如果頻帶數(shù)目萬較小,則每個頻帶的帶寬&將很可能大于1ERB。
令">]=^["]*咖]表示每個頻帶所關(guān)聯(lián)的音頻信號,可與等式7和8 類似地、通過計(jì)算用以頻率y;采樣的透射濾波器的頻率響應(yīng)以及以ERB 為單位的帶寬的倒數(shù)加權(quán)的^["]的經(jīng)平滑的均方才艮功率來計(jì)算經(jīng)平滑的 激勵信號取"]:
£[6,"]=人£[6,w] + (1 —義jH力x62["] (40)
用1、對頻帶6的激勵加權(quán)有效地將該頻帶內(nèi)的能量均勻分布在包含 在該頻帶內(nèi)的所有臨界頻帶上??梢钥商孢x地將所有能量分配給其中心頻
51率最接近該頻帶的中心頻率A的臨界頻帶,但均勻分布能量是大多數(shù)真實(shí) 世界音頻信號的更好近似,
利用激發(fā)E[6^],可如上所述那樣計(jì)算特定響度々[6,"]、目標(biāo)特定響度 々[6,n]和增益G[M],只是此處頻帶總數(shù)可少很多,從而降低了復(fù)雜性。在
計(jì)算總體響度4"]時同樣需要進(jìn)行如下修正當(dāng)特定響度對頻帶求和時, 其需要用頻帶b內(nèi)的ERBs數(shù)目加權(quán)
(41)
最后,可通過對用相應(yīng)頻帶的增益加權(quán)的每個頻帶信號進(jìn)行求和來得到經(jīng) 修正的信號 乂"]:
_v["] = S,," ] (42)
為了便于說明,上面的計(jì)算被示出為針對信號咖]的每個采樣周期"執(zhí)行。 然而,在實(shí)踐中,激勵可被子采樣至在時間上低4艮多的速率,然后所有后 續(xù)響度處理可以以此降低的速率執(zhí)行。當(dāng)最終施加增益時,便可在增益被 施加于頻帶信號之前通過插值對增益進(jìn)行上采樣。
上面僅是適用于本發(fā)明的特定響度的較粗略近似的一個例子。其它近 似也是可能的,且本發(fā)明意在涵蓋所有這樣的近似的使用。
實(shí)現(xiàn)
本發(fā)明可用硬件或軟件或二者的組合(例如可程序邏輯陣列)來實(shí)現(xiàn)。 除非另有規(guī)定,作為本發(fā)明的一部分被包括在內(nèi)的算法并非與任何具體計(jì)
算機(jī)或其它裝置固有^M目關(guān)。具體而言,各種通用機(jī)器可與根據(jù)此處教導(dǎo) 編寫的程序一起使用,或者,構(gòu)造更專門的裝置(例如集成電路)來執(zhí)行 所需的方法步驟可能是更方便的。因此,本發(fā)明可用在一個或多個可編程 計(jì)算機(jī)系統(tǒng)上執(zhí)行的一個或多個計(jì)算M序來實(shí)現(xiàn),其中每個可編程計(jì)算 機(jī)系統(tǒng)包括至少一個處理器、至少一個數(shù)據(jù)存儲系統(tǒng)(包括易失性和非易 失性存儲器和/或存儲單元)、至少一個輸入設(shè)備或端口以及至少一個輸 出設(shè)備或端口 。程序代碼被施加于輸入數(shù)據(jù)以執(zhí)行此處描述的功能并生成 輸出信息。該輸出信息以已知的方式被施加于一個或多個輸出設(shè)備。
每個這樣的程序可用任何期望計(jì)算機(jī)語言(包括機(jī)器、匯編、或高級程序的、邏輯的或面向?qū)ο蟮木幊陶Z言)來實(shí)現(xiàn),以與計(jì)算機(jī)系統(tǒng)通信。 在任何情形下,該語言可以是編譯或解釋語言。
每個這樣的計(jì)算機(jī)程序優(yōu)選地被存儲在或被下載到可由通用或?qū)S?可編程計(jì)算機(jī)讀取的存儲介質(zhì)或設(shè)備(例如固態(tài)存儲器或介質(zhì)、或者磁或
光介質(zhì)),用于當(dāng)存儲介質(zhì)或設(shè)備被計(jì)算機(jī)系統(tǒng)讀取時配置和操作計(jì)算機(jī) 以執(zhí)行此處描述的過程。本發(fā)明的系統(tǒng)亦可被看作實(shí)施為配置有計(jì)算M 序的計(jì)算機(jī)可讀M儲介質(zhì),其中如此配置的存儲介質(zhì)使得計(jì)算機(jī)系統(tǒng)以 特定且預(yù)定的方式工作以執(zhí)行此處描述的功能。
已描述了本發(fā)明的若干實(shí)施例。然而,應(yīng)理解,可在不背離本發(fā)明的 精神和范圍的情況下作出各種修改。例如,此處描述的步驟中的一些步驟 可無順序之分,并因此可按不同于所述順序的順序來執(zhí)行。
權(quán)利要求
1. 一種用于推導(dǎo)可用于控制音頻信號的特定響度的信息的方法,其中特定響度是將感知響度作為頻率和時間的函數(shù)的度量,所述方法包括推導(dǎo)可用于修正所述音頻信號以便減小其特定響度與目標(biāo)特定響度之間的差異的修正參數(shù)。
2. —種用于推導(dǎo)可用于控制音頻信號的部分特定響度的信息的方法, 其中特定響度是將感知響度作為頻率和時間的函數(shù)的度量,且信號的部分率和時間的函數(shù)的度量,所述方法包括推導(dǎo)可用于修正所述音頻信號以便減小其部分特定響度與目標(biāo)特定 響度之間的差異的l務(wù)正^lt。
3. —種用于控制音頻信號的特定響度的方法,其中特定響度是將感知 響度作為頻率和時間的函數(shù)的度量,所述方法包括修正所述音頻信號以〗更減小其特定響度與目標(biāo)特定響度之間的差異。
4. 一種用于控制音頻信號的部分特定響度的方法,其中特定響度是 將感知響度作為頻率和時間的函數(shù)的度量,且信號的部分特定響度是將在 有次要干擾信號的情況下的所述信號的感知響度作為頻率和時間的函數(shù) 的度量,所述方法包括修正所述音頻信號以便減小其部分特定響度與目標(biāo)特定響度之間的 差異。
5.根據(jù)權(quán)利要求1^4中任一項(xiàng)所述的方法,,中所,修正或,導(dǎo)從響度的表示o
6. 根據(jù)權(quán)利要求3或4所述的方法,其中所述修正根據(jù)修正^修 正所述音頻信號以提供經(jīng)修正的音頻信號,且所述修正從發(fā)送中接收或者 從存儲介質(zhì)再現(xiàn)所述音頻和所述修正^lt。
7. 根據(jù)權(quán)利要求3或4所述的方法,其中所述修正包括修正^的 生成。
8. 根據(jù)權(quán)利要求l-7中任一項(xiàng)所述的方法,其中所述目標(biāo)特定響度 不是所述音頻信號的函數(shù)。
9. 根據(jù)權(quán)利要求8所述的方法,其中所述修正或所述推導(dǎo)包括存儲 目標(biāo)特定響度。
10. 根據(jù)權(quán)利要求8所述的方法,其中所述修正或所述推導(dǎo)包括從所 述方法外部的源接收目標(biāo)特定響度。
11. 根據(jù)權(quán)利要求8-10中任一項(xiàng)所述的方法,其中所述《務(wù)正或所述 推導(dǎo)包括顯式地計(jì)算特定響度和/或部分特定響度的處理。
12. 根據(jù)權(quán)利要求8-10中任一項(xiàng)所述的方法,其中所述4務(wù)正或所述 推導(dǎo)包括隱式地計(jì)算特定響度和/或部分特定響度的處理。
13. 根據(jù)權(quán)利要求12所述的方法,其中所述處理采用查找表使得所 述處理固有地確定特定響度和/或部分特定響度。
14. 根據(jù)權(quán)利要求12所述的方法,其中特定響度和/或部分特定響度 在由所述處理采用的閉式數(shù)學(xué)表達(dá)式中被固有地確定。
15. 根據(jù)權(quán)利要求8-14中任一項(xiàng)所述的方法,其中所述目標(biāo)特定響 度是非時變且非頻變的。
16. 根據(jù)權(quán)利要求8-14中任一項(xiàng)所述的方法,其中所述目標(biāo)特定響 度是非時變的。
17. —種用于處理音頻信號的方法,所述方法包括根據(jù)一個或多個過程和一個或多個過程控制參數(shù)處理所述音頻信號 或所述音頻信號的度量以產(chǎn)生目標(biāo)特定響度,其中特定響Jbl將音頻信號 的感知響度作為頻率和時間的函數(shù)的度量。
18. 根據(jù)權(quán)利要求1 - 7和17中任一項(xiàng)所述的方法,其中所述目標(biāo)特 定響度是所述音頻信號或所述音頻信號的度量的函數(shù)。
19. 根據(jù)權(quán)利要求18所述的方法,其中所述音頻信號的所述度量是 所述音頻信號的特定響度。
20. 根據(jù)權(quán)利要求18或19所述的方法,其中所述音頻信號或所述音 頻信號的度量的所述函數(shù)是對所述音頻信號或所述音頻信號的度量的一 種或多種縮放。
21. 根據(jù)權(quán)利要求20所述的方法,其中所述一種或多種縮放包括如 以下關(guān)系式中的對所述特定響度的時變且頻變尺度因子S [W]縮放其中》[6,,]是所述目標(biāo)特定響度,可6,。是所述音頻信號的所述特定響度, 6是頻率的度量,f是時間的度量。
22. 根據(jù)權(quán)利要求21所述的方法,其中所述縮放至少部分地由期望 多帶響度與所述音頻信號的多帶響度的比值來確定。
23. 根據(jù)權(quán)利要求22所述的方法,其中所述縮放可表達(dá)為如以下關(guān)系式中的4[W]/A[6,f]:<formula>formula see original document page 4</formula>.其中W[ZM]是所述音頻信號的所述特定響度,1。[M]是所述期望多帶響度, A[Z^]是所述音頻信號的所述多帶響度,力[ZM]是所述目標(biāo)特定響度。
24. 根據(jù)權(quán)利要求23所述的方法,其中4[M是A[&]的函數(shù)。
25. 根據(jù)權(quán)利要求24所述的方法,其中作為z,[ZM]的函數(shù)的丄。[M可 表達(dá)為<formula>formula see original document page 4</formula>其中加CU表示將丄,仇,]映射到丄。[M的動態(tài)范圍函數(shù)。
26. 根據(jù)權(quán)利要求23所述的方法,其中丄,[^]是所述音頻信號的所述 特定響度的經(jīng)時間平滑和/或頻率平滑的版本。
27. 根據(jù)權(quán)利要求22-26中任一項(xiàng)所述的方法,其中所述方法可用 作動態(tài)范圍控制,在所述動態(tài)范圍控制中,所述修正或所述修正^lt的施 加產(chǎn)生這樣的音頻信號或者所述目標(biāo)特定響度對應(yīng)于這樣的音頻信號其 中感知音頻頻鐠或在有干擾信號的情況下的感知音頻頻鐠對于不同的特 定響度縮ii值而言可能不同。
28. 根據(jù)權(quán)利要求27所述的方法,其中所述動態(tài)范圍函數(shù)控制每個 頻帶中的響度,以使得施加于每個頻帶的短期改變在頻帶之間獨(dú)立地變 化,而施加于每個頻帶的平均改變對于所有頻帶而言基本上相同。
29. 根據(jù)權(quán)利要求28所述的方法,其中作為z^,。的函數(shù)的z。[ZM]可 表達(dá)為<formula>formula see original document page 4</formula>其中4[V]-^ c"[6,W表示所述音頻信號的總響度到期望總響度的映射,其中z;w表示所述音頻信號的寬帶響度丄,w的經(jīng)時間平均的版本,z;[^]表 示所述音頻信號的多帶響度A[^]的經(jīng)時間平均的版本。
30.根據(jù)權(quán)利要求28或29所述的方法,其中所述方法可用作動態(tài)范圍控制,在所述動態(tài)范圍控制中,所述修正或所述修正參數(shù)的施加產(chǎn)生這樣的音頻信號或者所述目標(biāo)特定響度對應(yīng)于這樣的音頻信號其中感知音放值而言保持與所述音頻信號的感知音頻頻譜基本上相同。
31. 根據(jù)權(quán)利要求21所述的方法,其中所述特定響度被縮放等于期 望頻諳形狀的度量與所述音頻信號的頻鐠形狀的度量的比值的倍數(shù)。
32. 根據(jù)權(quán)利要求31所述的方法,其中所述方法將所述音頻信號的 感知頻謙從時變的感知頻語變換成14Ui非時變的感知頻鐠。
33. 根據(jù)權(quán)利要求31或32所述的方法,其中所述縮放可表達(dá)為如以下關(guān)系式中的<formula>formula see original document page 5</formula>并且其中z[w是所述音頻信號的經(jīng)時間平滑的多帶響度,^[^]是被歸一 化以與所述多帶響度r[v]具有相同的寬帶響度的期望頻諉印[w,使得^g[W]可表達(dá)為<formula>formula see original document page 5</formula>其中7V[W]是所述音頻信號的所述特定響度,々[M是所述目標(biāo)特定響度, P是具有由零和一界定并且包括零和一的范圍的^lt,所述^控制縮放 的水平。
34. 根據(jù)權(quán)利要求33所述的方法,其中所述參數(shù)〃由所述方法外部 的源選擇或控制。
35. 根據(jù)權(quán)利要求34所述的方法,其中所述源是所述方法的用戶。
36. 根據(jù)權(quán)利要求31-35中任一項(xiàng)所述的方法,其中所述方法可用 作動態(tài)均衡器,在所述動態(tài)均衡器中,所述修正或所述修正^的施加產(chǎn) 生這樣的音頻信號或者所述目標(biāo)特定響度對應(yīng)于這樣的音頻信號其中感 知音頻頻譜或在有干擾信號的情況下的感知音頻頻譜對于不同的特定響度縮放值而言可能不同。
37. 根據(jù)權(quán)利要求21-36中任一項(xiàng)所述的方法,其中所述音頻信號的一些臨界頻帶上進(jìn)行頻率平滑來取近似。
38. 根據(jù)權(quán)利要求37所述的方法,其中特定頻帶6處的所迷多帶響 度的經(jīng)頻帶平滑的版本 ]可表達(dá)為對所有頻帶c的巻積和其中iV[c,,]是所述音頻信號的所述特定響度,0(6 - c)是所述平滑濾波器的 頻帶平移后的響應(yīng)。
39. 根據(jù)權(quán)利要求20所述的方法,其中所述一種或多種縮放包括如 以下關(guān)系式中的對所述特定響度的時變而非頻變X^變因子(DW縮放其中所6,。是所述目標(biāo)特定響度,W[6, f ]是所述音頻信號的所述特定響度, &是頻率的度量,f是時間的度量。
40. 根據(jù)權(quán)利要求39所述的方法,其中所述縮放至少部分地由期望 寬帶響度與所述音頻信號的寬帶響度的比值來確定。
41. 祁^據(jù)權(quán)利要求39或40所述的方法,其中所述音頻信號的所述特 定響度的所述函數(shù)中的所述縮放可表達(dá)為如以下關(guān)系式中的丄。[,]/丄,W:丄,W其中MW]是所述音頻信號的所述特定響度,丄。w是期望多帶響度,丄,w是 所述音頻信號的所述寬帶響度,》[M是所述目標(biāo)特定響度。
42. 根據(jù)權(quán)利要求41所述的方法,其中丄。W是丄,W的函數(shù)。
43. 根據(jù)權(quán)利要求42所述的方法,其中作為丄,.[,]的函數(shù)的丄。[,]可表達(dá)為其中wcO表示將i^]映射到丄。w的動態(tài)范圍函數(shù)。
44. 根據(jù)權(quán)利要求41所述的方法,其中丄,[,]是所述音頻信號的總響 度的經(jīng)時間平滑的版本。
45. 根據(jù)權(quán)利要求41所述的方法,其中A[f]是所述音頻信號的長期 響度的度量。
46. 根據(jù)權(quán)利要求41所述的方法,其中AW是所述音頻信號的短期 響度的度量。
47. 根據(jù)權(quán)利要求39-46中任一項(xiàng)所述的方法,其中所述方法可用 作自動增益控制或動態(tài)范圍控制,在所述自動增益控制或動態(tài)范圍控制 中,所述修正或所述修正^的施加產(chǎn)生這樣的音頻信號或者所述目標(biāo)特 定響度對應(yīng)于這樣的音頻信號其中感知音頻頻鐠或在有干擾信號的情況言保持與所述音頻信號的感知音頻頻譜基本上相同。
48. 根據(jù)權(quán)利要求21-47中任一項(xiàng)所述的方法,其中所述縮放因子 是所述音頻信號或所述音頻信號的度量的函數(shù)。
49. 根據(jù)權(quán)利要求20所述的方法,其中所述一種或多種縮放包括如 以下關(guān)系式中的對所述特定響度的非時變而頻變尺度因子 問縮放<formula>formula see original document page 7</formula>其中々[W]是所述目標(biāo)特定響度,是所述音頻信號的所述特定響度, 6是頻率的度量,f是時間的度量。
50. 根據(jù)權(quán)利要求49所述的方法,其中所述修正或所述推導(dǎo)包括存 儲所述縮放因子0問。
51. 根據(jù)權(quán)利要求49所述的方法,其中所述縮放因子 問從所述方 法外部的源接收。
52. 根據(jù)權(quán)利要求20所述的方法,其中所述一種或多種縮放包括如 以下關(guān)系式中的對所述特定響度的非時變且非頻變尺度因子《縮放其中々[6,。是所述目標(biāo)特定響度,W[M]是所述音頻信號的所述特定響度, 6是頻率的度量,f是時間的度量。
53. 根據(jù)權(quán)利要求52所述的方法,其中所述修正或所述推導(dǎo)包括存 儲所述縮放因子《。
54. 根據(jù)權(quán)利要求52所述的方法,其中所述縮放因子《從所述方法 外部的源接收。
55.根據(jù)權(quán)利要求49-54中任一項(xiàng)所述的方法,其中所述方法可用 作音量控制,在所述音量控制中,所述修正或所述修正^的施加產(chǎn)生這 樣的音頻信號或者所述目標(biāo)特定響度對應(yīng)于這樣的音頻信號其中感知音 頻頻諉或在有干擾信號的情況下的感知音頻頻譜對于不同的特定響度或同。
56. 根據(jù)權(quán)利要求49-55中任一項(xiàng)所述的方法,其中所述縮放因子 不是所述音頻信號或所述音頻信號的度量的函數(shù)。
57. 根據(jù)權(quán)利要求l-56中任一項(xiàng)所述的方法,其中所述修正、所述 推導(dǎo)或所述產(chǎn)生顯式地計(jì)算(1)特定響度、和/或(2)部分特定響度、 和/或(3 )所述目標(biāo)特定響度。
58. 根據(jù)權(quán)利要求1-56中任一項(xiàng)所述的方法,其中所述修正、所述 推導(dǎo)或所述產(chǎn)生隱式地計(jì)算(1)特定響度、和/或(2)部分特定響度、 和/或(3 )所述目標(biāo)特定響度。
59. 根據(jù)權(quán)利要求58所述的方法,其中所述修正、所述推導(dǎo)或所述 產(chǎn)生采用固有地確定(1)特定響度、和/或(2 )部分特定響度、和/或(3 ) 所述目標(biāo)特定響度的查找表。
60. 根據(jù)權(quán)利要求58所述的方法,其中所述修正、所述推導(dǎo)或所述 產(chǎn)生采用固有地確定(1)特定響度、和/或(2 )部分特定響度、和/或(3 ) 所述目標(biāo)特定響度的閉式數(shù)學(xué)表達(dá)式。
61. 根據(jù)權(quán)利要求l、 2、 7中任一項(xiàng)以及引用權(quán)利要求l、 2或7的 權(quán)利要求8 - 16和18 - 60中任一項(xiàng)所述的方法,其中所述修正或推導(dǎo)(1) 發(fā)送和接收或(2 )存儲和再現(xiàn)所述音頻信號和修正M.
62. 根據(jù)權(quán)利要求l、 2、 6、 7中任一項(xiàng)以及引用權(quán)利要求1、 2、 6 或7的權(quán)利要求8 - 16和18 - 60中任一項(xiàng)所述的方法,其中所述修正參 數(shù)被執(zhí)行時間平滑。
63. 根據(jù)權(quán)利要求62所述的方法,其中所述修正^4ft包括與所述音 頻信號的頻帶相關(guān)的多個幅度縮放因子。
64. 根據(jù)權(quán)利要求63所述的方法,其中所述多個幅度縮放因子中的 至少一些幅度縮放因子是時變的。
65. 根據(jù)權(quán)利要求62所述的方法,其中所述修正^lt包括用于控制一個或多個濾波器的多個濾波器系數(shù)。
66. 才艮據(jù)權(quán)利要求65所述的方法,其中所述一個或多個濾波器中的 至少一些濾波器是時變的,且所述濾波器系數(shù)中的至少一些濾波器系ltA 時變的。
67. 根據(jù)權(quán)利要求1-66中任一項(xiàng)所述的方法,其中所述<多正、所述 推導(dǎo)或所述產(chǎn)生依賴于以下中的一個或多個干擾音頻信號的度量,目標(biāo)特定響度,從經(jīng)修正的音頻信號的特定響度或部分特定響度導(dǎo)出的未修正的音 頻信號的特定響度的估計(jì),所述未修正的音頻信號的所述特定響度,以及從所述經(jīng)修正的音頻信號的所述特定響度或部分特定響度導(dǎo)出的所 述目標(biāo)特定響度的近似。
68. 根據(jù)權(quán)利要求1 - 4和7中任一項(xiàng)以及引用權(quán)利要求1 - 4或7的 權(quán)利要求8 - 16和18 - 66中任一項(xiàng)所述的方法,其中所述修正或所述推 導(dǎo)至少部分M以下中的一個或多個推導(dǎo)l務(wù)正^lt:干擾音頻信號的度量,目標(biāo)特定響度,從經(jīng)修正的音頻信號的特定響度或部分特定響度導(dǎo)出的未修正的音 頻信號的特定響度的估計(jì),所述未修正的音頻信號的所述特定響度,以及從所述經(jīng)修正的音頻信號的所述特定響度或部分特定響度導(dǎo)出的所 述目標(biāo)特定響度的近似。
69. 根據(jù)權(quán)利要求68所述的方法,其中所述修正或所述推導(dǎo)至少部 分M下面推導(dǎo)修正^:(1)以下兩者之一目標(biāo)特定響度,和從所述經(jīng)修正的音頻信號的所述特定響度得到的所述未修正 的音頻信號的所述特定響度的估計(jì),以及(2)以下兩者之一所述未修正的音頻信號的所述特定響度,和從所述經(jīng)修正的音頻信號的所述特定響度導(dǎo)出的所述目標(biāo)特 定響度的近似
70. 根據(jù)權(quán)利要求68所述的方法,其中所述修正或所述推導(dǎo)至少部 分iWv下面推導(dǎo)修正^t:(1) 千擾音頻信號的度量(2) 以下兩者之一目標(biāo)特定響度,和從所述經(jīng)修正的音頻信號的所述部分特定響度導(dǎo)出的所述未 修正的音頻信號的所述特定響度的估計(jì),以及(3) 以下兩者之一所述未修正的音頻信號的所述特定響度,和從所述經(jīng)修正的音頻信號的所述部分特定響度導(dǎo)出的所述目 標(biāo)特定響度的近似
71. 根據(jù)權(quán)利要求69或70所述的方法,其中所述方法采用其中所述 特定響度從所述音頻信號導(dǎo)出的前饋布置,并且其中所述目標(biāo)特定響;l從 所述方法外部的源接收,或者在所述修正或推導(dǎo)包括存儲目標(biāo)特定響度時 從存儲接收。
72. 根據(jù)權(quán)利要求69或70所述的方法,其中所述方法采用其中所述置,并且其中所述目標(biāo)特定響度從所述方法外部的源接收,或者在所述修 正或推導(dǎo)包括存儲目標(biāo)特定響度時M儲接收。
73. 根據(jù)權(quán)利要求69或70所述的方法,其中所述修正或推導(dǎo)包括用 于顯式或隱式地獲得所述目標(biāo)特定響度的一個或多個過程,所述過程中的 一個或多個顯式或隱式地計(jì)算所述音頻信號或所述音頻信號的度量的所 述函數(shù)。
74. 根據(jù)權(quán)利要求73所述的方法,其中所述方法采用其中所述特定 響度和所述目標(biāo)特定響度從所述音頻信號導(dǎo)出的前饋布置,所述目標(biāo)特定 響度的推導(dǎo)采用所述音頻信號或所迷音頻信號的度量的所迷函數(shù)。
75.根據(jù)權(quán)利要求73所述的方法,其中所述方法釆用其中所述目標(biāo)述音頻信號導(dǎo)出的混合前饋/反饋布置,所述目標(biāo)特定響度的推導(dǎo)采用所 述音頻信號或所述音頻信號的度量的所述函數(shù).
76. 根據(jù)權(quán)利要求69或70所述的方法,其中所述修正或推導(dǎo)包括用信號的所述特定響度進(jìn)行的估計(jì)的 一個或多個過程,所述過程中的 一個或 多個顯式或隱式地計(jì)算所述音頻信號或所述音頻信號的度量的所述函數(shù) 的反函數(shù)。
77. 根據(jù)權(quán)利要求76所述的方法,其中所述方法采用其中所述未《務(wù)述經(jīng)修正的音頻信號導(dǎo)出的反饋布置,所述特定響度的估計(jì)使用所述音頻 信號或所述音頻信號的度量的所述函數(shù)的反函數(shù)來計(jì)算。
78. 根據(jù)權(quán)利要求76所述的方法,其中所述方法采用其中所述特定述估計(jì)從所述經(jīng)修正的音頻信號導(dǎo)出的混合前饋/反饋布置,所述估計(jì)的 推導(dǎo)使用所述音頻信號或所述音頻信號的度量的所述函數(shù)的反函數(shù)來計(jì) 算。
79. 根據(jù)權(quán)利要求1 - 4和17以及引用權(quán)利要求1 - 4或17的權(quán)利要 求18 - 78中任一項(xiàng)所述的方法,其中所述修正或推導(dǎo)(1)發(fā)送和接收或(2 )存儲和再現(xiàn)所述音頻信號以及目標(biāo)特定響度或目標(biāo)特定響度的表示。
80. 根據(jù)引用權(quán)利要求20、 21、 39、 49或52中任一項(xiàng)的權(quán)利要求 79所述的方法,其中所述目標(biāo)特定響度的表示是對所述音頻信號或所述 音頻信號的度量進(jìn)行縮放的 一個或多個尺度因子。
81. 根據(jù)權(quán)利要求l、 2、 6和7以及引用權(quán)利要求1、 2、 6或7的權(quán) 利要求8 - 16和18 - 80中任一項(xiàng)所述的方法,還包括向所述音頻信號施 加所述修正>|*以產(chǎn)生經(jīng)修正的音頻信號。
82. 根據(jù)權(quán)利要求l-4、 17以及引用權(quán)利要求1-4或17的權(quán)利要 求18-78中任一項(xiàng)所述的方法,還包括發(fā)送或存儲所述音頻信號以及所 述目標(biāo)特定響度或所述目標(biāo)特定響度的表示。
83. 根據(jù)權(quán)利要求82所述的方法,還包括接收或再現(xiàn)所述被發(fā)送或存儲的音頻信號以及所述目標(biāo)特定響度或所述目標(biāo)特定響度的表示。
84. 根據(jù)權(quán)利要求83所述的方法,還包括響應(yīng)于所述音頻信號以及 所述目標(biāo)特定響度或所述目標(biāo)特定響度的表示而修正所述音頻信號以便 減小所述音頻信號的特定響度與所述目標(biāo)特定響;l之間的差異。
85. 根據(jù)引用權(quán)利要求20 - 60中任一項(xiàng)的權(quán)利要求82 - 84中任一項(xiàng) 所述的方法,其中所述目標(biāo)特定響度的表示是對所述音頻信號或所述音頻 信號的度量進(jìn)行縮放的 一個或多個M因子。
86. 根據(jù)權(quán)利要求l、 2、 7以及引用權(quán)利要求1、 2和7的權(quán)利要求 18-60中任一項(xiàng)所述的方法,還包括發(fā)送或存儲所述音頻信號和所述《多 正錄。
87. 根據(jù)權(quán)利要求86所述的方法,還包括接收或再現(xiàn)所述被發(fā)送或 存儲的音頻信號和所述l務(wù)正參數(shù)。
88. 根據(jù)權(quán)利要求87所述的方法,還包括響應(yīng)于所述修正^lt而修 正所述音頻信號。
89. —種裝置,其適于執(zhí)行權(quán)利要求l-88中任一項(xiàng)所述的方法。
90. 一種計(jì)算機(jī)程序,其存儲在計(jì)算機(jī)可讀介質(zhì)上,所述計(jì)算機(jī)可讀 介質(zhì)用于使得計(jì)算機(jī)執(zhí)行權(quán)利要求1 - 88中任一項(xiàng)所述的方法。
全文摘要
涉及音頻信號的感知聲音響度和/或感知頻譜平衡的計(jì)量和控制的音頻信號處理可例如用于以下中的一個或多個響度補(bǔ)償式音量控制、自動增益控制、動態(tài)范圍控制(包括例如限制器、壓縮器、擴(kuò)展器等)、動態(tài)均衡以及補(bǔ)償音頻回放環(huán)境中的背景噪聲干擾。在各實(shí)施例中,推導(dǎo)修正參數(shù),用于修正音頻信號以便減小其特定響度與目標(biāo)特定響度之間的差異。
文檔編號G10L21/00GK101421781SQ200780011710
公開日2009年4月29日 申請日期2007年3月30日 優(yōu)先權(quán)日2006年4月4日
發(fā)明者阿蘭·杰弗里·西費(fèi)爾特 申請人:杜比實(shí)驗(yàn)室特許公司