本發(fā)明涉及用于音頻信號處理的系統(tǒng)、方法和技術(shù),具體地,適用于適應不同水平的音頻音量(或響度)的處理和/或補償。
背景技術(shù):
通常,音頻信號以特定音量水平產(chǎn)生(例如,記錄),但是然后以不同的音量水平被回放。不幸的是,由于人類響度感知的不一致性,該情形通常提出了對于感知音頻質(zhì)量的問題。具體地,人類聽覺系統(tǒng)的靈敏度隨頻率和音量而變化。例如,當在深夜以低音量觀看電影時,可能注意到電影聲音主要或僅僅被減小為對話,而諸如腳步聲的其它(例如,背景)聲音變得聽不見。這是由于人類聽覺系統(tǒng)對特別低或特別高的頻率不是非常靈敏而發(fā)生的,并且靈敏度的這種降低的嚴重性在低回放音量變得更糟糕。
因此,期望自適應地補償在任何回放水平聲音分量的所感知的音量的不同,以使得即使回放音量改變,這些分量的所感知的相對響度也不改變。在以上示例中,這表示在任何回放水平與對話相比諸如腳步聲的背景聲音將聽起來同樣大。
響度補償?shù)臉?gòu)思可追溯至1930年代。1935格魯諾“Tombstone”臺式收音機使用模擬電路來產(chǎn)生如下響度補償頻率響應曲線,該曲線:1)較強地提升了低音并且較弱地提升了高音,以及2)隨著用戶設(shè)置的回放音量而變化。該電路基本上固化了響度補償?shù)幕驹恚弘S著用戶設(shè)置的回放音量(即,回放裝置的音量旋鈕的位置)變化的低音和高音提升。
當代的響度補償技術(shù)不是非常不同的,除了采用數(shù)字動態(tài)均衡器(具體地,架濾波器(shelf filter))以使得音頻工程師能夠針對耳朵的喜好而對頻率范圍和提升水平進行微調(diào)之外。該微調(diào)通常是針對一對回放水平而進行的,然后使用內(nèi)插來適應其它回放水平。
技術(shù)實現(xiàn)要素:
以上方案和現(xiàn)有技術(shù)中的類似方案采用對人類響度感知機制的粗略和經(jīng)驗性近似。另一方面,本發(fā)明的優(yōu)選實施例通常提供更精密近似理想響度補償輪廓而無需費力微調(diào)的補償濾波器。
因此,本發(fā)明的一個實施例涉及一種用于基于響度的音頻信號補償?shù)南到y(tǒng)。輸入線路接受輸入音頻信號;耦合到輸入線路的響度估計器對輸入音頻信號進行處理以獲得音頻回放響度水平并且還提供輸入音頻信號的產(chǎn)生響度水平;以及耦合到響度估計器的輸出的濾波器生成器/選擇器基于產(chǎn)生響度水平和音頻回放響度水平而提供音頻補償濾波器。音頻補償濾波器對輸入信號進行處理以提供輸出信號。
以上發(fā)明內(nèi)容僅是旨在提供本發(fā)明的某些方面的簡要描述。可以通過參考權(quán)利要求和結(jié)合附圖的優(yōu)選實施例的以下詳細描述來獲得本發(fā)明的更完整理解。
附圖說明
在以下公開中,參考附圖描述本發(fā)明。然而,應理解,附圖僅描繪了本發(fā)明的某些代表性和/或示例性實施例以及特征,并且不旨在以任何方式限制本發(fā)明的范圍。以下僅是附圖中的每個的簡要描述。
圖1是根據(jù)本發(fā)明的代表性實施例的音頻補償系統(tǒng)的簡化框圖。
圖2示出了根據(jù)ISO 226:2003的各種音量水平的等響度輪廓。
圖3示出了某些示例性響度補償輪廓。
圖4示出了某些變型示例性響度補償輪廓以便限制過度低音增益。
圖5是根據(jù)本發(fā)明的代表性實施例的時域中的回放參考響度估計器的框圖。
圖6是根據(jù)本發(fā)明的代表性實施例的頻域中的回放參考響度估計器的框圖。
圖7是用于估計回放參考響度水平并且然后使用基于差值的方案來估計產(chǎn)生(例如,記錄)參考響度水平的框圖。
圖8是用于根據(jù)期望響度補償輪廓來生成濾波器系數(shù)的流程圖。
圖9是示出利用預先存儲的補償濾波器的響度補償回放系統(tǒng)的框圖。
圖10是利用短時傅立葉變換(STFT)響度補償?shù)幕胤畔到y(tǒng)的框圖。
圖11是示出防混疊(anti-aliasing)處理的流程圖。
圖12是用于使用預先存儲的頻率響應來執(zhí)行STFT響度補償?shù)幕胤畔到y(tǒng)的框圖。
具體實施方式
為了易于引用,本發(fā)明的某些部分被劃分成章節(jié)。每個章節(jié)的總體主題由章節(jié)的標題來指示。
在圖1中示出了根據(jù)本發(fā)明的優(yōu)選實施例的用于音頻補償?shù)南到y(tǒng)5的總體配置。如以下更詳細地討論的,系統(tǒng)5的目標之一是使用頻率相關(guān)增益曲線而為音頻信號的不同頻率分量提供不同的增益,該頻率相關(guān)增益曲線根據(jù)音頻信號正以多大的響聲被回放而變化,并且特別與生成原始音頻信號(例如,記錄在物理介質(zhì)上)的音量有關(guān)。
在這點上,通常將從存儲介質(zhì)(例如,光盤、固態(tài)裝置或磁介質(zhì))檢索輸入音頻信號7以用于回放,并且這里討論的特定實施例通常將是這樣的情形。然而,替代地,可經(jīng)由任何類型的連接而從本地源接收輸入音頻信號7和/或通過任何類型的通信信道而從遠程源接收輸入音頻信號7(在任一情況下,例如,使用包括一個或多個轉(zhuǎn)發(fā)節(jié)點的、一個或多個直接無線和/或硬接線連接和/或網(wǎng)絡,諸如因特網(wǎng))以用于立即回放。在任意情況下,輸入信號7在輸入到系統(tǒng)5中之前通常將進行某些預處理(用于多種不同目的中的任意目的)。另外,根據(jù)特定實施例,系統(tǒng)5可以獨立地起作用或者可以是較大系統(tǒng)(通常為音頻回放系統(tǒng))的一部分。
信號7所對應的原始音頻信號通常將以一個音量水平生成,但是端用戶希望以不同的音量水平進行回放。然而,如本文其它地方更詳細地討論的,音頻譜的人類感知基于響度(或音量)而變化,以使得例如被產(chǎn)生(例如,記錄)以在第一音量水平對收聽者來說在一定意義上“最優(yōu)”的音頻信號(通常包括一個或多個聲音)通常在第二音量將沒有相同的質(zhì)量。例如,某些離散聲音在第二音量水平可能被感知為過于安靜(或者甚至完全不可感知)或者過響,和/或甚至包括多個頻率分量的各個聲音可能以在第二音量水平相對于“最優(yōu)”失真的方式被感知。因此,本發(fā)明的目標之一是提供用于通過對要回放的音頻信號的頻譜應用基于響度的差分增益曲線來補償這些感知差別的系統(tǒng)、方法和技術(shù)。
為此,通常期望識別或估計例如產(chǎn)生(例如,記錄)原始音頻信號的產(chǎn)生響度水平以及端用戶實際正播放或期望播放音頻信號的回放響度水平。然而,如以下更詳細地討論的,應注意,這樣的估計(具體地,針對再現(xiàn)響度水平)不需要是實際值的估計,而是替代地可以是期望產(chǎn)生收聽者主觀期望的效果的值的估計。
在當前實施例中,這樣的估計在處理塊10中執(zhí)行。以下更詳細地討論響度估計器10的具體實施例,并且如所指示的,每個實施例具有其自己的特有益處組合。然而,一般來說,在各個實施例中,響度估計器10可以使用多種不同輸入中的任何輸入,諸如輸入信號7本身、用戶輸入12和/或各種其它輸入14。在各個實施例中,可以在響度估計器10內(nèi)處理輸入信號7以估計瞬時回放響度水平和/或使用指定假設(shè)(例如,關(guān)于原始音頻信號生成系統(tǒng)和/或隨后的傳送、存儲和/或回放系統(tǒng)中的增益)和/或校準信息來估計產(chǎn)生響度水平。
根據(jù)特定實施例,用戶輸入12可以包括用戶提供(例如,手動)或者響應于用戶采取的動作(例如,語音命令或姿勢)而生成的多種不同信號中的任意信號。這樣的用戶輸入12可以包括例如下述中的任意或全部:端用戶經(jīng)由回放裝置的用戶接口選擇的音量水平、與產(chǎn)生響度水平對應的值的選擇、表示產(chǎn)生響度水平與回放響度水平之間的差的值的選擇和/或表示影響回放響度的任意其它因素或與表示影響回放響度的任意其它因素對應的一個或多個值的選擇(諸如室內(nèi)聲學、揚聲器或耳機靈敏度、揚聲器的數(shù)量或布局和/或相對于揚聲器的收聽者距離)。如果提供,這些用戶輸入信號12通常反映用戶做出的至少一個手動設(shè)置。
相反,如果提供,其它輸入14通常將自動生成和/或從一些其它源接收(例如,作為伴隨輸入信號7的元數(shù)據(jù),諸如指示特定相對大音頻內(nèi)容(諸如整首歌曲或音頻曲目)的瞬時或總體產(chǎn)生響度水平的元數(shù)據(jù)),并且可反映例如以下的某個方面:原始音頻信號生成,原始音頻信號存儲或傳送處理和/或介質(zhì),和/或總體音頻回放系統(tǒng)(例如,室內(nèi)聲學和/或耳機特性)。例如,其它輸入14可以包括回放裝置中的放大器的檢測特性和/或音頻信號的發(fā)起者提供的元數(shù)據(jù)。另外,在一些實施例中,回放裝置自動檢測正使用的耳機的類型(例如,USB耳機或藍牙耳機),并且檢索指示耳機的靈敏度和/或當前音量設(shè)置的預先存儲值,該值然后用作一個或多個其它輸入14。此外,在一些實施例中,可以由回放裝置來執(zhí)行校準過程,其中,通過回放系統(tǒng)的揚聲器播放參考音頻信號,并且放置具有已知特性的麥克風(例如,收聽者期望的位置),以便檢測從揚聲器的輸入到收聽者可能遇到的聲音壓力水平的總體增益的一個或多個測量值(由此反映揚聲器靈敏度與室內(nèi)聲學的組合),這一個或多個測量值然后可以被存儲并且稍后被提供作為其它輸入14。
在任意情況下,基于(例如,所接收的和/或內(nèi)部生成的)信息,估計模塊10優(yōu)選地生成至少產(chǎn)生響度和回放響度的估計。根據(jù)特定實施例,這些值之一或兩者可以對于特定音頻(例如,歌曲、歌曲專輯、視頻配樂或者音樂或其它音頻文件)的整個持續(xù)時間是不變的,或者可以以固定的時間間隔(例如,從10毫秒(ms)到10秒的任意地方)或者可變時間間隔(例如,具有一致音頻特性的間隔)而動態(tài)地估計,和/或可以在收聽者期望時變更。
在以下討論的實施例中,有時僅各種輸入7、10和12的子集被討論和/或示出為被提供到響度估計器10。然而,這樣的簡化僅是為了易于討論和/或圖示。應理解,在本發(fā)明的任意實施例中,這樣的輸入7、10和12的任意組合或全部可被提供到響度估計器10并且由響度估計器10使用。
以下討論一般指的是如下實施例:其中,預先記錄原始信號,并且通過讀取預先記錄的信號來生成輸入信號7。然而,應理解,這些實施例僅是示例性的,期望不失一般性,并且同樣的概念和術(shù)語旨在包括原始信號被產(chǎn)生并且然后例如被傳送或者提供而沒有任何中間記錄步驟的情形。即,這里對“記錄”、“所記錄的”或基礎(chǔ)詞“記錄”的其它變型的各個引用旨在包括生成、產(chǎn)生和/或提供原始信號的任何方式而與信號實際上是否被記錄無關(guān),并且這里對詞“記錄”的任何形式的引用可以以詞“生成”、“產(chǎn)生”或“提供”的相應形式來替換。另外,根據(jù)本發(fā)明的補償系統(tǒng)5可被插入到期望響度補償?shù)娜魏我纛l信號處理鏈中,包括但不限于音頻混合和/或產(chǎn)生信號鏈以及回放系統(tǒng)。
再次參照圖1,來自模塊10的響度估計被提供到濾波器生成器/選擇器模塊18以基于這樣的估計來使用,該濾波器生成器/選擇器模塊18生成補償濾波器20或檢索預先存儲的濾波器20。在優(yōu)選實施例中,基于ISO226:2003的等響度輪廓而生成或選擇補償濾波器20。然而,在替選實施例中,可替代地使用其它(例如,類似)等響度輪廓和/或可使用其它技術(shù)。如本領(lǐng)域公知的,等響度輪廓是在頻譜內(nèi)純穩(wěn)定音調(diào)被人感知為同樣響的聲音壓力水平(SPL)的輪廓。在ISO 226:2003中,對具有頻率f的純音的SPL(以dB表示為L(f))進行調(diào)整,直到其被感知為與1000赫茲(Hz)的參考音調(diào)一樣響為止,該參考音調(diào)的SPL以dB表示為R。因此,輪廓通常以參考音調(diào)的響度R來標記,因此,等響度輪廓可以以L(f;R)來表示。R的值也用作響度水平的測量值,其單位(dB)也稱為方。在圖2中示出了根據(jù)ISO 226:2003的對于各種響度水平的等響度輪廓。
如果從等響度輪廓減去參考音調(diào)的響度水平,則獲得相對響度衰減輪廓:
A(f;R)=L(f;R)-R dB,
其表示人類聽覺系統(tǒng)的響度感知機制在頻率f施加于輸入音調(diào)的衰減。在給定輸入音頻譜X(f)的情況下,在響度方面人感知的信號因此是:
Y(f)=X(f)-A(f;R)dB.
當產(chǎn)生(例如,由藝術(shù)家)音頻內(nèi)容時,通常設(shè)置特定響度水平,這確立了相應的記錄響度水平Rr、記錄等響度輪廓Lr(f;Rr)以及記錄相對響度衰減輪廓Ar(f;Rr)。如果Xr(f)表示原始音頻信號的頻率響應,則在響度方面人耳感知的原始信號是:
Yr(f)=Xr(f)-Ar(f;Rr)dB.
這是通常將在產(chǎn)生(例如,記錄)期間在譜平衡方面被優(yōu)化的信號。出于多種原因,回放響度Rp通常不同于記錄響度,這多種原因包括記錄響度水平的不可用性、不同再現(xiàn)裝備、不同聲學環(huán)境和/或不同優(yōu)選回放響度水平。令Xp(f)表示該理想回放音頻信號的頻率響應,其可由與原始音頻信號的響度差來定義,如下:
Vd=Xr(f)-Xp(f)dB.
該不同回放響度確立了相應回放響度水平Rp、回放等響度輪廓Lp(f;Rp)和回放相對響度衰減輪廓Ap(f;Rp)。因此,在響度方面人所感知的回放信號是:
Yp(f)=Xp(f)-Ap(f;Rp)dB.
由于相對響度衰減輪廓Ar(f;Rr)和Ap(f;Rp)是不同的,因此所感知的回放譜平衡或聲音質(zhì)量與原始(例如,藝術(shù)家或聲音工程師所期望的)的不同。為了減輕該問題,濾波器生成器/選擇器模塊18優(yōu)選地生成或選擇提供例如由G(f;Rr;Rp)表示的響度補償輪廓的濾波器20,以使得除了響度差之外所感知的回放譜平衡與原始相同,即:
Yr(f)-[Yp(f)+G(f;Rr,Rp)]=Vd
代入,理想響度補償輪廓是:
G(f;Rr,Rp)=Ap(f;Rp)-Ar(f;Rr).
公式1
圖3示出了分別對于Rr=96dB和Rp=0、10、…、90dB的這樣響度補償輪廓。
然而,關(guān)于上述理想響度補償輪廓的潛在問題在于,對于低音的增益可能變得非常高,尤其是對于低回放響度水平。例如,圖3中的零方輪廓呈現(xiàn)了幾乎40dB的低音增強。這樣的低音增強可使得揚聲器線圈撞擊后板,從而導致失真以及可能的揚聲器損壞。因此,在某些實施例中,這樣的低音增強被限制。在一個實施例中,例如,選擇低音頻率fB,并且前述響度補償輪廓被修改為使得:
圖4示出了具有上述修改和具有fB=100Hz的圖3的響度補償輪廓。然而,應理解,可替代地使用用于限制過度增益(尤其是低頻增益)的其它方案。
在優(yōu)選實施例中,模塊18首先基于預先存儲的等響度輪廓的集合和從模塊10接收的響度估計而合成期望補償輪廓(例如,如上所述),然后基于該期望的補償輪廓而生成補償濾波器20(例如,如在以下標題為“基于音量補償輪廓的濾波器生成”的章節(jié)中討論的)。更優(yōu)選地,每次從模塊10接收的響度估計之一改變時,模塊18重復上述步驟。
如圖1所示,然后由該當前選擇的/生成的補償濾波器20對輸入信號7進行處理以提供輸出信號22,該輸出信號22通常然后被放大并且用于驅(qū)動一個或多個音頻輸出裝置24,諸如揚聲器或耳機。然而,輸出信號22替代地可以用于任何其它目的。
響度估計
以下是響度估計器10或者至少其部分的特定具體實現(xiàn)的更詳細描述,每個具體實現(xiàn)均采用不同的方案,如相應子章節(jié)標題所指示的。
用戶設(shè)置記錄和回放響度水平
在該實現(xiàn)中,正回放音頻信號的用戶選擇記錄參考響度水平Rr和回放參考響度水平Rp。記錄參考響度水平Rr的選擇可以是當產(chǎn)生音頻內(nèi)容時的平均信號水平的估計。大約-18dBFS的值被廣泛地用在記錄工業(yè)中,因此,可默認來設(shè)置,例如,其中,如果期望,用戶/收聽者具有在任一方向上修改該值的能力。在這點上,例如,用戶可希望將值設(shè)置非常高,諸如0dBFS,以給出響度增強的強烈感覺,或者在替選實施例中,這樣的值替代地可用作默認值。在任意情況下,在當前實施例中,用戶可以在回放之前或期間調(diào)整該參數(shù)以適合他的/她的偏好。另一方面,回放參考響度水平Rp完全是用戶參數(shù),并且通常將被選擇以適合關(guān)于以多大響聲播放音頻的用戶偏好意向(例如,通過調(diào)整回放裝置上的音頻控制)。
注意,對于每個這樣的參數(shù),用戶不需要知道基于用戶進行的特定設(shè)置的、在補償系統(tǒng)5內(nèi)將使用的具體值。替代地,例如,用戶可僅選擇與記錄參考響度水平Rr相關(guān)的從-10至+10的值(例如,0與上述默認值之一對應,并且每個方向上的最大值與相對于默認值的最大期望偏離對應),并且還選擇對于回放響度的從0至10的值,例如,其中,系統(tǒng)5然后將這些所選擇的設(shè)置轉(zhuǎn)換為相應記錄參考響度水平Rr和相應回放參考響度水平Rp。實際上,如上所述,根據(jù)各個實施例,要基于特定用戶設(shè)置使用的特定值還可與關(guān)于原始音頻信號產(chǎn)生環(huán)境和/或回放環(huán)境的其它信息14有關(guān)(例如,對于回放環(huán)境,耳機/揚聲器靈敏度、室內(nèi)聲學、放大器增益等)。
用戶設(shè)置記錄響度水平和可變回放響度水平
在該實施例中,如在先前實施例中,記錄參考響度水平Rr被設(shè)置為固定值(例如,默認地或者基于用戶進行的設(shè)置),但是根據(jù)輸入信號7而實時地估計回放參考響度水平Rp。在圖5中示出了時域中的回放參考響度估計器10A的一個示例。如所示出的,回放參考響度估計器10A包括帶通濾波器42和功率估計器43。帶通濾波器42的中心頻率優(yōu)選地被設(shè)置為1000Hz(以便與在補償所基于的等響度輪廓的測量中使用的參考音調(diào)對應)。帶通濾波器42的帶寬可被選擇為非常窄(例如,不大于500Hz或1000Hz,諸如具有覆蓋1000Hz附近的兩個臨界頻帶的通帶,通常從800Hz至1250Hz)以得到參考音調(diào)附近的功率水平的良好估計。然而,使用窄帶寬在參考音調(diào)附近的瞬時功率非常低的情形期間(諸如當僅低音吉他存在于輸入音頻信號中時)可能產(chǎn)生非常低的響度。較寬的帶寬(例如,4000Hz至6000Hz,諸如從200Hz至5000Hz的通帶)將減輕該問題,但是具有所估計的響度不能準確地反映參考音調(diào)(例如,1000Hz)的響度水平的潛在缺點。極端帶寬選擇可包括全音頻帶寬,在該情況下,帶通濾波器42可完全省略以便節(jié)省不必要的計算。更一般地,回放裝置中的用于回放參考響度水平Rp的估計的方案優(yōu)選地與所使用的或者假設(shè)已使用的用于估計記錄(或其它產(chǎn)生)參考響度水平Rr的方案相同或者至少匹配。
平滑機制優(yōu)選地包括在功率估計器43中以保證隨時間平滑地變化的響度估計。一種這樣的實施例使用所計算的功率值的以下滑動(或移動)平均值:
其中,x(n)是輸入樣本值,并且N是塊大小。更簡單的實施例是使用
低階無限脈沖響應(IIR)濾波器,諸如以下的一階IIR低通濾波器:
P(n)=αP(n-1)+(1-α)x2(n)
公式3
其中,α是濾波器系數(shù)并且與采樣頻率fs和時間常數(shù)τ相關(guān),如:
在任意情況下,功率估計器43輸出(優(yōu)選地,平滑后的)響度估計45。
回放參考響度估計器替代地可在頻域中實現(xiàn),諸如圖6所示的估計器10B。令X(k)表示輸入信號的DFT系數(shù),功率估計器52優(yōu)選地計算參考音調(diào)(例如,1000Hz)的頻率附近的功率,作為:
其中,KL和KH是與參考音調(diào)附近的頻率對應的DFT頻點(bin)。
以上獲得的功率值可由于DFT的塊處理性質(zhì)而在連續(xù)DFT塊之間顯著地變化,這進而可能導致響度補償?shù)耐蝗桓淖儭T搯栴}可以由低通濾波器54來減輕,諸如以上公式3中給出的一階IIR濾波器,以便提供響度估計55。
另外,在上述實施例的某個替選變型中,記錄參考響度水平Rr基于其它信息14(諸如與輸入信號7所基于的原始信號一起包括的元數(shù)據(jù))而被設(shè)置為固定值,其中,用戶具有或者沒有用于調(diào)整該默認值的能力,并且根據(jù)輸入信號7而估計回放參考響度水平Rp(例如,如上所述)。
可變記錄和回放參考響度水平
如果假設(shè)記錄和回放響度水平為相同的,則使用在先前兩個子章節(jié)中描述的結(jié)構(gòu)、方案和技術(shù)而根據(jù)輸入音頻信號7估計的回放參考響度水平也可以用作記錄參考響度水平。然而,回放和記錄響度水平幾乎總是不同的,并且該差別可由響度差參數(shù)來提供:
Δp=Rr-Rp,
該響度差參數(shù)優(yōu)選地由用戶來設(shè)置。然后,一旦根據(jù)輸入音頻信號估計出回放參考響度水平,就可以容易地獲得記錄參考響度水平作為:
Rr=Rp+Δp.
在圖7中示出了用于實現(xiàn)這樣的基于差值的方案的結(jié)構(gòu)60,其中,估計器10C可以是例如估計器10A或10B中的任一個。圖7中的加法器63的輸出處的飽和器62用于保證所計算的記錄參考響度水平不超過諸如0dBFS的指定最大值。
基于響度補償輪廓的濾波器生成
在本發(fā)明的優(yōu)選實施例中,一旦檢索到或生成了響度補償輪廓(例如,如上所述),模塊18就生成相應濾波器。以下討論涉及用于進行可由模塊18實現(xiàn)的操作的技術(shù)。
以上給出的響度補償輪廓(即,公式1和公式2)是響度數(shù)據(jù)可用的頻率網(wǎng)格處的幅頻響應。期望輪廓優(yōu)選地被轉(zhuǎn)換為可以用于響度估計的實際濾波器。在圖8中示出了并且在以下描述了用于處理期望的響度補償輪廓101的一種這樣的方法100。
初始,在步驟102中,當對于這樣的點不存在等響度數(shù)據(jù)(這是通常情況)時,對輸入響度補償輪廓進行外插以覆蓋零和奈奎斯特頻率。簡單的方案是僅將最近的可用輪廓值復制到這些頻率。某個更相關(guān)的方案是線性外插,例如,使用與最低頻率對應的兩個輪廓數(shù)據(jù)點來構(gòu)造線性方程以外插零頻率以及使用與最高頻率對應的兩個輪廓數(shù)據(jù)點來外插奈奎斯特頻率。替選地,可結(jié)合另外的數(shù)據(jù)點來使用較高階的外插。
接下來,在步驟103中,將所得到的響度補償輪廓再采樣為適合于濾波器設(shè)計的頻率網(wǎng)格。該步驟優(yōu)選地提供可以在快速傅立葉變換(FFT)中使用的均勻頻率網(wǎng)格。線性內(nèi)插通常對于該目的是足夠的,但是可替代地使用諸如樣條內(nèi)插的更復雜方法。
在步驟105中,將所得到的響度補償輪廓反映在奈奎斯特頻率附近的零與奈奎斯特頻率之間的頻率范圍至奈奎斯特頻率與采樣率之間的頻率范圍中,以便構(gòu)造對稱幅值響應。這樣的步驟保證了隨后的響度補償濾波器僅具有實系數(shù)。
在步驟106中,對相位進行合成以便將幅值響應轉(zhuǎn)換為適當?shù)念l率響應。簡單的方案是將零相位附屬于所有頻點以及然后延遲隨后濾波器的脈沖響應以使得其為原因。另一方案是使用多種方法(諸如基于復雜對數(shù)倒頻譜的非參數(shù)方案的多種方法)根據(jù)幅值響應獲得最小相位頻率響應(例如,如在A.V.Oppenheim和R.W.Schafer,Digital Signal Processing,Englewood Cliffs,NJ:Prentice-Hall,1975中討論的)。如果要使用IIR濾波器,則由于最小相位通常是用于將幅值響應轉(zhuǎn)換為IIR濾波器系數(shù)的大部分算法所假設(shè)的或者對于這些大部分算法起最佳作用的,因此最小相位是優(yōu)選的。
在步驟107中,通常通過生成濾波器系數(shù)109而將所得到的頻率響應轉(zhuǎn)換為適合于實時實現(xiàn)的濾波器。可使用IIR或有限脈沖響應(FIR)濾波器,并且以下描述用于生成這兩個濾波器的技術(shù)。
IIR濾波器
如果期望IIR濾波器,則可使用任何適當?shù)臑V波器轉(zhuǎn)換方法,諸如在J.O.Smith III,“Introduction to Digital Filters:with Audio Applications”,W3K Publishing,2007中描述的方程誤差方法(equation error method)。當IIR濾波器的延遲線被硬接線至其濾波器系數(shù)(通常是這樣的情況)時,濾波器系數(shù)的改變通常使得不同的延遲線成為必要。因此,當響度補償輪廓隨著時間(或者期望潛在地隨著時間)變化時,這樣的IIR濾波器不是優(yōu)選的。
FIR濾波器
對于給定階,所有FIR濾波器可以共享相同的延遲線,因此FIR濾波器更好地允許響度補償輪廓的動態(tài)更新。由于響度補償輪廓的每次更新需要FIR濾波器系數(shù)的新集合的計算,因此簡單的和穩(wěn)定的轉(zhuǎn)換方法是優(yōu)選的。以下給出了一個這樣的示例:
1.將逆FFT應用于在步驟106(圖8)中獲得的響度補償頻率響應以得到其脈沖響應。
2.如果期望較短的濾波器,則將窗函數(shù)應用于脈沖響應。窗的中心與脈沖響應的能量中心對準。
3.如果在步驟106中使用了零相位,則延遲脈沖響應以使得其成為原因。如果在緊接先前的步驟2中使用了加窗,則適當?shù)难舆t也是期望的。
如果針對每個輸入樣本而更新濾波器,則以上過程可能計算強度過大。為了減輕該潛在問題,可如下預先計算FIR濾波器的集合:
1.對記錄和回放響度水平的期望動態(tài)范圍進行量化。為了適應人類響度感知以及使用較小的量化水平集合,優(yōu)選地使用諸如對數(shù)的非均勻量化方案。
2.對于每對量化后的記錄和回放響度水平,產(chǎn)生響度補償濾波器。
3.將補償濾波器存儲在濾波器表中以用于稍后查找。
在圖9中示出了然后利用這些存儲的補償濾波器的系統(tǒng)5A。盡管未明確示出,如上所述,其它輸入14也可被提供到響度估計器10。
如所示出的以及如以上所討論的,估計器10生成記錄(或其它產(chǎn)生)參考響度水平Rr和回放參考響度水平Rp的估計。然后,分別在量化器121和122中,對這兩個估計進行量化(例如,結(jié)合預先存儲的補償濾波器的生成而使用上述同一方案)。量化后的值被提供到濾波器查找模塊18A(例如,作為查找表的索引),并且選擇匹配濾波器20用于對輸入音頻信號7進行處理。在該特定實施例中,首先在放大器124中對濾波器20的輸出進行放大,然后使用該輸出來驅(qū)動一個或多個揚聲器125。
STFT實現(xiàn)
由于補償濾波器20的每次更新需要不同F(xiàn)IR濾波器的應用,因此可能產(chǎn)生濾波后的音頻樣本中的一定程度的不連續(xù)性,并且該不連續(xù)性可能變得可聽見。在本發(fā)明的某些實施例中,通過引入相鄰濾波器產(chǎn)生的音頻樣本之間的重疊來減輕該不連續(xù)性問題。短時傅立葉變換(STFT)中固有的疊加操作也適合該目標。與FFT相關(guān)聯(lián)的計算效率是STFT的其它益處。然而,隱含重疊的其它技術(shù)替代地可用于提供相同的或類似的益處。
在圖10中示出了用于實現(xiàn)STFT響度補償?shù)囊粋€系統(tǒng)5B。如上所述,生成器/選擇器模塊18包括補償輪廓合成器18C和輪廓至頻率響應轉(zhuǎn)換器18D。正向STFT模塊141將輸入音頻信號7(初始在時域中)轉(zhuǎn)換到頻域中,以使得在乘法器142中所得到的頻率系數(shù)可以與模塊18提供的頻率響應系數(shù)相乘。
當前基于STFT的方案的一個特性是時域中的用于響度補償濾波的卷積被頻域中的乘法取代。盡管該方案通常提高了計算效率,但是如果不滿足以下大小限制則可引起時域混疊:
ML+F<N
公式4
其中,M是STFT的塊大小,L是STFT塊的數(shù)量,N是DFT大小,并且F是FIR濾波器系數(shù)的數(shù)量。對于給定M、L和N,防混疊模塊143通過將模塊18提供的響度補償濾波器的頻率響應轉(zhuǎn)換成具有長度為F的相應脈沖響應的頻率響應來增強該限制,其中長度F實際上滿足公式4。
根據(jù)一個實施例,防混疊模塊143對模塊18提供的頻率響應171實現(xiàn)圖11所示的方法170的處理步驟。初始地,在步驟172中,對頻率響應171應用反向DFT以便獲得其脈沖響應。該DFT的大小可短于用于STFT的DFT大小,以便減輕對于該DFT的計算負荷以及對于輪廓至頻率響應轉(zhuǎn)換器18的計算負荷。
在步驟173中,優(yōu)選地將從步驟172獲得的脈沖響應與長度F的窗函數(shù)(諸如漢寧窗或布萊克曼窗),以保證所得到的脈沖響應的時間限制滿足公式4。
在步驟175中,在根據(jù)步驟173的任何變型之后,對脈沖響應進行偏移以實現(xiàn)期望的延遲/相位特性。由于在頻域中執(zhí)行濾波,因此零相位濾波器是可能的。
在步驟176中,對步驟175提供的脈沖響應應用正向DFT,以便獲得其頻率響應。該DFT優(yōu)選地具有與STFT相同的大小。
與先前章節(jié)中的FIR濾波器的討論類似,如果以上過程計算強度過大,則可預先計算補償濾波器頻率響應的集合,例如,如下:
1.針對可能的記錄和回放響度水平的集合中的每個而對動態(tài)范圍進行量化。為了適應人類響度感知以及使用較小的量化水平集合,優(yōu)選地使用諸如對數(shù)的非均勻量化方案。
2.對于每對量化后的記錄和回放響度水平,生成響度補償濾波器頻率響應。
3.將補償濾波器頻率響應存儲在表中以用于稍后查找。
在圖12中示出了使用這樣的預先存儲的濾波器的回放系統(tǒng)5C。參照圖12,在每次來自估計器10B的記錄和/或回放響度估計更新時,
1.使用在生成預先存儲的濾波器響應時(以上討論)所使用的相同量化方案,分別在量化器202和203內(nèi)對回放響度水平Rp和記錄參考響度水平Rr的估計進行量化。
2.在頻率響應查找模塊205中,使用所得到的量化索引來查找相應的響度補償濾波器頻率響應。
3.將正向STFT模塊141產(chǎn)生的輸入信號7的頻率系數(shù)與在查找模塊205中檢索到的濾波器頻率響應相乘(在乘法器142中),然后在模塊144中執(zhí)行反向STFT,從而提供輸入樣本7的期望處理。
應注意,盡管在上述實施例中使用了STFT的具體示例,但是可替代地使用其它變換方案。因此,這里對STFT的任何和所有引用可利用對任何頻率變換或其它正交變換(就此而言)的引用替換。
另外的實施例
在某些上述實施例中,實時地根據(jù)輸入信號7動態(tài)地估計回放響度水平Rp。該類型的某些更具體實施例還將超過輸入信號7本身的其它信息納入考慮。在這點上,僅關(guān)注于輸入信號7可能例如由于原始記錄(或者產(chǎn)生)信號的實際響度的變化(與其參考響度相比)而導致不適當?shù)难a償。一般而言,原始記錄信號在總體參考響度設(shè)置的上下文內(nèi)將呈現(xiàn)瞬時響度的顯著變化量(例如,以提供不同的聽覺效果)。結(jié)果,在回放期間,雖然在不同的總體回放參考響度設(shè)置,但是將發(fā)生瞬時響度的相同變化。在某些優(yōu)選實施例中,特別是在不能訪問瞬時記錄響度水平的實施例中,(例如,在整條音頻內(nèi)容內(nèi))估計總體參考響度水平(記錄和回放)。然后,在某些具體變型中,補償輪廓僅基于這些水平。在其它具體變型中,根據(jù)回放環(huán)境的改變(諸如用戶選擇的回放響度改變、輸出裝置24中的任何改變(特別是這種不同輸出裝置24的靈敏度的改變)和/或室內(nèi)聲學的任何改變,例如,在輸出裝置24包括一個或多個揚聲器的情況下)來修改上述總體回放響度水平。在另外的具體變型中,總體估計響度水平(記錄和回放兩者)用于確立差別響度(例如,Δp),然后該差別用在諸如系統(tǒng)60(以上結(jié)合圖7討論的)的系統(tǒng)中。
系統(tǒng)環(huán)境
一般而言,除了明確相反指出之外,這里描述的所有系統(tǒng)、方法、功能和技術(shù)可以利用一個或多個可編程通用計算裝置來實踐。這樣的裝置(例如,包括這里所述的任何電子裝置)通常將包括例如經(jīng)由例如公共總線彼此耦合的以下部件中的至少一部分:(1)一個或多個中央處理單元(CPU);(2)只讀存儲器(ROM);(3)隨機存取存儲器(RAM);(4)其它集成或附接存儲裝置;(5)用于與其它裝置接口的輸入/輸出軟件和電路(例如,使用硬接線連接,諸如串行端口、并行端口、USB連接或火線連接,或者使用無線協(xié)議,諸如射頻標識(RFID)、任何其它近場通信(NFC)協(xié)議、藍牙或802.11協(xié)議);(6)用于例如使用硬接線連接(諸如以太網(wǎng)卡)或無線協(xié)議(諸如碼分多址(CDMA)、全球移動通信系統(tǒng)(GSM)、藍牙、802.11協(xié)議或者任何其它基于蜂窩或非基于蜂窩的系統(tǒng))連接到一個或多個網(wǎng)絡的軟件和電路,這些網(wǎng)絡在本發(fā)明的許多實施例中進而連接到因特網(wǎng)或任何其它網(wǎng)絡;(7)顯示器(諸如陰極射線管顯示器、液晶顯示器、有機發(fā)光顯示器、聚合物發(fā)光顯示器或任何其它薄膜顯示器);(8)其它輸出裝置(諸如一個或多個揚聲器、耳機、激光或其它光投影儀和/或打印機);(9)一個或多個輸入裝置(諸如鼠標、一個或多個物理開關(guān)或可變控制、觸摸板、平板、觸敏顯示器或其它指向裝置、鍵盤、小鍵盤、麥克風和/或攝像裝置或掃描儀);(10)大容量存儲單元(諸如硬盤驅(qū)動器或固態(tài)驅(qū)動器);(11)實時時鐘;(12)可拆卸存儲讀/寫裝置(諸如閃存驅(qū)動器、利用半導體存儲器的任何其它便攜式驅(qū)動器、磁盤、磁帶、光磁盤、光盤等);和/或(13)調(diào)制解調(diào)器(例如,用于發(fā)送傳真或用于連接到因特網(wǎng)或任何其它計算機網(wǎng)絡)。在操作中,在一定程度上由這樣的通用計算機執(zhí)行的用于實現(xiàn)以上方法和功能的處理步驟通常初始存儲在大容量存儲裝置(例如,硬盤或固態(tài)驅(qū)動器)中,被下載到RAM中,然后由CPU在RAM之外執(zhí)行。然而,在一些情況下,處理步驟初始存儲在RAM或ROM中和/或直接在大容量存儲裝置之外執(zhí)行。
可從各種賣方獲得用于實現(xiàn)本發(fā)明的適當通用可編程裝置。在各個實施例中,根據(jù)任務的大小和復雜性而使用不同類型的裝置。這樣的裝置可以包括例如大型計算機、多處理器計算機、一個或多個服務器盒、工作站、個人(例如,臺式、筆記本、平板或板式)計算機和/或甚至更小的計算機(諸如個人數(shù)字助理(PDA)、無線電話(例如,智能電話)或任何其它可編程設(shè)施或裝置),無論是單獨的、硬接線到網(wǎng)絡的還是無線連接到網(wǎng)絡的都可以。
另外,盡管以上描述了通用可編程裝置,但是在替選實施例中,替代地(或者另外地)使用一個或多個專用處理器或計算機。一般地,應注意,除了明確相反指出之外,上述任何功能都可以由執(zhí)行軟件和/固件的通用處理器、專用(例如,基于邏輯的)硬件或這些方案的任何組合來實現(xiàn),其中,基于已知的工程折中來選擇特定實現(xiàn)。更具體地,如本領(lǐng)域技術(shù)人員容易想到的,在上述任何處理和/或功能以固定的、預定的和/或邏輯方式來實現(xiàn)的情況下,可以由執(zhí)行編程(例如,軟件或固件)的處理器、邏輯部件(硬件)的適當布置或者這兩者的任意組合來完成。換言之,如何將邏輯和/或算術(shù)操作轉(zhuǎn)換成用于在處理器內(nèi)執(zhí)行這樣的操作的指令和/或轉(zhuǎn)換成用于執(zhí)行這樣的操作的邏輯門配置是容易理解的;實際上,編譯器通??捎糜谶@兩種轉(zhuǎn)換。
應理解,本發(fā)明還涉及其上存儲有用于執(zhí)行本發(fā)明的方法和功能的軟件或固件程序指令(即,計算機可執(zhí)行處理指令)的機器可讀有形(或者非暫態(tài))介質(zhì)。作為示例,這樣的介質(zhì)包括磁盤、磁帶、光學可讀取介質(zhì)(諸如CD和DVD)或者半導體存儲器(諸如各種類型的存儲卡、USB閃存裝置、固態(tài)驅(qū)動器等)。在每種情況下,介質(zhì)可采取便攜式物品的形式(諸如微型盤驅(qū)動器或小盤、磁碟、卡帶、盤式磁帶、卡、棒等),或者可采取相對較大或不便移動的物品的形式(諸如設(shè)置在計算機或其它裝置中的硬盤驅(qū)動器、ROM或RAM)。如這里所使用的,除非清楚相反指出,對存儲在計算機可讀或機器可讀介質(zhì)上的計算機可執(zhí)行處理步驟的引用旨在包括這樣的處理步驟存儲在單個介質(zhì)上的情形以及這樣的處理步驟跨越多個介質(zhì)存儲的情形。
先前描述主要強調(diào)了電子計算機和裝置。然而,應理解,可替代地使用任何其它計算裝置或其它類型的裝置,諸如利用能夠執(zhí)行基本邏輯和/或算術(shù)操作的電子、光學、生物和化學處理的任何組合的裝置。
另外,在本公開引用處理器、計算機、服務器、服務器裝置、計算機可讀介質(zhì)或其它存儲裝置、客戶端裝置或任何其它種類的設(shè)備或裝置的情況下,除了清楚相反指出之外,這樣的引用應被理解為包括使用多個這樣的處理器、計算機、服務器、服務器裝置、計算機可讀介質(zhì)或其它存儲裝置、客戶端裝置或任何其它這樣的設(shè)備或裝置。例如,服務器一般可以(以及通常將)使用單個裝置或例如具有適當?shù)呢撦d平衡的服務器裝置的簇(本地或地理上分散)來實現(xiàn)。類似地,服務器裝置和客戶端裝置通常將配合執(zhí)行完整方法的處理步驟,例如,其中,每個這樣的裝置具有其自己的存儲這樣的處理步驟的一部分的存儲裝置和其自己的執(zhí)行這些處理步驟的處理器。
如這里所使用的,術(shù)語“耦合”或者該詞的任何其它形式旨在表示直接連接或者通過一個或多個其它元件或處理塊連接。在附圖和/或其討論中,在各個步驟、模塊或處理塊被示出和/或討論為直接連接到彼此的情況下,這樣的連接應被理解為可包括另外的元件和/或處理塊的耦合。
另外的考慮
在先前討論中,術(shù)語“操作者”、“操作”、“功能”和類似術(shù)語可以指的是根據(jù)特定實現(xiàn)/實施例的方法步驟或硬件部件。
除非清楚相反指出,在以上討論中諸如“最優(yōu)”、“優(yōu)化”、“最小化”、“最佳”和類似詞的詞以及表示比較的其它詞和前綴不以其絕對意義來使用。替代地,這樣的術(shù)語通常旨在根據(jù)任何其它潛在限制來理解,諸如用戶指定限制和目標以及成本和處理限制。
在以上討論中,通過將某些方法分解為以特定順序列出的步驟來說明某些方法。然而,應注意,在每個這種情況下,除了明確相反指出或者根據(jù)實際考慮要求(諸如來自一個步驟的結(jié)果需要執(zhí)行其它步驟的情況)之外,所指示的順序不是關(guān)鍵的,而是替代地,所描述的步驟可以重新排序和/或兩個或更多個這樣的步驟可以并行地執(zhí)行。
這里對旨在觸發(fā)、限制、過濾或者影響處理步驟、其它動作、處理步驟或動作的主體或者任何其它活動或數(shù)據(jù)的“標準”、“多個標準”、“條件”、“多個條件”或類似詞的引用旨在表示“一個或多個”,而與使用單數(shù)還是復數(shù)形式無關(guān)。例如,任何標準或條件可以包括動作、事件和/或發(fā)生(即,多部分標準或條件)的任何組合(例如,布爾組合)。
類似地,在以上討論中,功能有時被歸于特定模塊或部件。然而,功能一般可在任何不同的模塊或部件當中根據(jù)期望重新分配,從而在一些情況下,完全避免對于特定部件或模塊的需要和/或需要添加新的部件或模塊。如本領(lǐng)域技術(shù)人員所理解的,參考本發(fā)明的具體實施例,根據(jù)已知工程折中而優(yōu)選地進行功能的精確分配。
在以上討論中,詞“包括(include)”、“包含(includes)”、“具有(including)”和該詞的所有其它形式不應被理解為限制性的,而是這樣的詞之后的任何具體項應被理解為僅是示例性的。
以上描述了本發(fā)明的多個不同實施例,其中每個這樣的實施例被描述為包括某些特征。然而,如本領(lǐng)域技術(shù)人員所理解的,旨在為結(jié)合任何單個實施例的討論描述的特征不限于該實施例,而是也可包括和/或布置在任何其它實施例的各種組合中。
因此,盡管關(guān)于本發(fā)明的示例性實施例和附圖詳細描述了本發(fā)明,但是對本領(lǐng)域技術(shù)人員來說明顯的是,可在不背離本發(fā)明的精神和范圍的情況下實現(xiàn)本發(fā)明的各種調(diào)整和修改。因此,本發(fā)明不限于圖中示出的和以上描述的具體實施例。相反,旨在為不背離本發(fā)明的精神的所有這樣的變型應被視為在僅由所附權(quán)利要求限定的范圍中。