專利名稱:濾波器自適應(yīng)頻率分辨率的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及輸入數(shù)字信號的數(shù)字濾波,并且尤其涉及處理數(shù)字濾波 器表示中的濾波器系數(shù)。
背景技術(shù):
在數(shù)字信號處理中,濾波器通常表示并存儲為 一系列或濾波器系數(shù) 集合。這些系數(shù)可以依次表示例如濾波器在時間或頻率域中的采樣脈沖 響應(yīng)或差分方程的系數(shù),所述差分方程例如
其中t是時間采樣的索引,/是濾波器的輸出,義是其輸入,且a和6 是表示濾波器的系數(shù)集合。在濾波器用其脈沖響應(yīng)表示的情況下,存儲 的系數(shù)數(shù)目依賴于哪個塊長度是描述濾波器脈沖響應(yīng)必需的。在差分方 程(方程(1))中的系數(shù)被使用的其它情況下,系數(shù)的數(shù)目由濾波器 的階確定。應(yīng)當(dāng)注意到,對FIR濾波器(所有&=0)來說,時域脈沖響 應(yīng)與系數(shù)^相符合。由頻率域脈沖響應(yīng)表示的濾波器被存儲和使用且本 發(fā)明有用的一個應(yīng)用是環(huán)繞聲音的立體聲(binaural)解碼。
在全世界的電影院中,很久以來,多信道環(huán)繞音頻系統(tǒng)就將電影觀 眾的位置安排在電影場景音頻空間的中心,電影場景在觀眾前面播放并給予觀眾真實可信的"身臨其境"之感。這種音頻技術(shù)作為家庭環(huán)繞聲 影院系統(tǒng)已經(jīng)進入普通人的家庭,現(xiàn)在正為人們在他們自己的起居室中 提供"身臨其境"的感覺。
該音頻技術(shù)將會被用到的下一個領(lǐng)域包括移動無線單元或終端,特
別是諸如蜂窩電話和PDA (個人數(shù)字助理)的小型單元。這里,由于屏 幕尺寸小,環(huán)繞聲音的沉浸感特性就更加重要。然而,將這項技術(shù)移用 到移動單元中不是個小問題。主要的障礙包括
1. 在無線移動信道中,可用比特率在很多情況下較低。
2. 移動終端的處理能力通常是有限的。
3. 小型移動終端通常只有兩個微型揚聲器和耳塞或耳機。 這意味著,特別是對諸如蜂窩電話的移動終端來說,移動終端的環(huán)繞聲音解決方案必須使用比在杜比(Dolby )數(shù)字5. 1系統(tǒng)中使用的384
千比特/秒低得多的比特率。由于有限的處理能力,移動終端的解碼器 必須在計算上被優(yōu)化,并且由于移動終端的揚聲器配置,環(huán)繞聲音必須 通過耳塞或耳機來傳遞。
通過耳機或耳塞來傳遞多信道環(huán)繞聲音的標(biāo)準(zhǔn)方式是實施每個揚 聲器信號的3D音頻或立體聲再現(xiàn)。
通常,在3D音頻再現(xiàn)中,使用音頻場景模型,并且每個進入的單 信道信號被通過一組濾波器濾波,該組濾波器對人頭部、軀干和耳朵所 產(chǎn)生的變換建模。這些濾波器被稱為具有頭部相關(guān)轉(zhuǎn)移函數(shù)(HRTF)的 頭部相關(guān)濾波器(HRF),如果被恰當(dāng)?shù)卦O(shè)計,它們會給出良好的3D音 頻場景感知。
圖1中的圖示出了根據(jù)5.1環(huán)繞系統(tǒng)的音頻信號的完整3D音頻再 現(xiàn)方法。根據(jù)5. 1環(huán)繞系統(tǒng)的六個多信道信號是 -環(huán)繞右(SR), -右(R), -中心(C ), -低頻(LFE ), -左(L), -環(huán)繞左(SL)。
在圖l所示的例子中,中心和低頻信號被組合為一個信號。由于用 于左側(cè)和右側(cè)的聲學(xué)假設(shè)是對稱的,因此,頭部相關(guān)濾波可利用五個不同的濾波器〃f、 #纟、//c、 //f和/^來實現(xiàn)。從頭部的一側(cè)看過去,這 些濾波器為從位于頭部同側(cè)(身體同側(cè))和相對側(cè)(對側(cè))的揚聲器到 達的聲音建模聲學(xué),所述同側(cè)和對側(cè)這里用下標(biāo)/和C表示。這些維度 與中軸(前或后)的原點相結(jié)合,給出上標(biāo),和厭位于音頻場景中心 的聲音用濾波器"纟建^^。
這種再現(xiàn)的3D感知方面的質(zhì)量依賴于當(dāng)聽者正在收聽時,HRF多么 接近地建?;虮硎舅?她本身的頭部相關(guān)濾波。因此,如果想要良好或 非常好的質(zhì)量,如果HRF可以為每個聽者自適應(yīng)調(diào)整和個人化,則將是 有益的。該自適應(yīng)調(diào)整和個人化步驟可包括建模、測量和一般情況下依 賴于用戶的調(diào)諧,以便改進所感知的3D音頻場景的質(zhì)量。
當(dāng)前技術(shù)水平的標(biāo)準(zhǔn)化多信道音頻編解碼器需要大量帶寬或高比 特率,以便達到可接受的質(zhì)量,因而它們妨礙了將這種編解碼器用于諸 如無線移動流的服務(wù)。
例如,即使杜比數(shù)字5. 1編解碼器(AC - 3編解碼器)與AAC多信 道編解碼器相比具有非常低的復(fù)雜度,為達到相似的質(zhì)量它也需要多得 多的比特率。AAC多信道編解碼器和AC - 3編解碼器這兩種編解碼器直 到今天都不能被用在無線移動領(lǐng)域,因為它們對計算復(fù)雜度和比特率有 ;f艮高要求。
基于立體聲線索(cue)編碼的新的參量(parametric)多信道編 解碼器已經(jīng)被開發(fā)。最近標(biāo)準(zhǔn)化的參量立體聲工具是用于編碼立體聲聲 音的低復(fù)雜度/高質(zhì)量參量技術(shù)的好例子。將參量立體聲擴展到多信道 編碼當(dāng)前在MPEG中正在標(biāo)準(zhǔn)化,名為空間音頻編碼,并且還稱為MPEG 環(huán)繞。
通過示出通常情況的圖2的框圖,可以解釋和理解參量多信道編碼 的原理。還被稱作多信道參量環(huán)繞編碼器的參量環(huán)繞編碼器3接收多信 道復(fù)合音頻信號,所述音頻信號包括單獨的信號、(")到^("),其中#是 輸入信道的數(shù)目。對于5.1環(huán)繞系統(tǒng),#=6,如上所述。編碼器3然后 在下混合單元5中形成復(fù)合下混合信號,所述下混合信號包括單獨的下 混合信號a(w)到~(")。下混合信道數(shù)依賴于#信道音頻編碼器 7所需或可允許的最高比特率、所需的質(zhì)量和可用性。編碼過程的一個 關(guān)鍵方面是,通常是立體聲信號但也可能是單信道信號的下混合復(fù)合信 號被從多信道輸入信號導(dǎo)出,并且就是該下混合復(fù)合信號而不是原始多
7信道信號被在音頻編碼器7中壓縮以便通過信道11傳輸。參量編碼器3
和特別是其下混合單元5能夠執(zhí)行下混合過程,使得其在單信道或立體
聲域產(chǎn)生多信道信號的或多或少真正的等價物。參量環(huán)繞編碼器還包括
空間參量估計單元9,該單元9根據(jù)輸入信號;c,(")到&(w)計算線索或空 間參數(shù),所述線索或空間參數(shù)以某種方式可被稱作描述了下混合過程或 其中所做的假設(shè)。從M信道音頻編碼器輸出并且也是主信號的壓縮音頻 信號與構(gòu)成輔助信息(side information)的空間參數(shù)一起通過諸如無 線接口的接口 11而被發(fā)送到接收端,所述接收端在這里考慮的情況下 通常是移動終端。
可替換地,下混合可以由某些外部單元提供,例如從采用藝術(shù)下混 合的單元提供。
在接收端,互補的參量環(huán)繞解碼器13包括音頻解碼器15,并應(yīng)當(dāng) 被構(gòu)建為能夠基于在發(fā)射端使用的下混合算法和與壓縮的多信道信號 并行接收的編碼空間參數(shù)或線索的知識,產(chǎn)生可能的最佳多信道解碼。 音頻解碼器15產(chǎn)生應(yīng)當(dāng)與發(fā)射端的信號^(w)到^(w)盡可能相似的信號 A(w)到^(")。這些與空間參數(shù)一起被輸入到空間合成單元17,該單元 17產(chǎn)生應(yīng)當(dāng)與發(fā)射端上的原始輸入信號&(w)到xw(w)盡可能相似的輸出 信號g(")到O)。輸出信號A(")到^(")可^支輸入到諸如圖1所示的立體 聲再現(xiàn)系統(tǒng)。
很明顯,依賴于通過接口 11的傳輸信道的通常相對低的帶寬,將 會丟失信息并因此在接收端上的信號^ (")到SM (n)和A (")到4 (w)不可能 與它們在發(fā)射端上的相對應(yīng)部分相同。即使它們不是它們相對應(yīng)部分的 非常真實的等價物,它們也可以是在感知上足夠好的等價物。
通常,這種環(huán)繞編碼過程獨立于圖2中的單元音頻編碼器7和音頻 解碼器15中使用的用于傳輸信道的壓縮算法。編碼過程可利用若干高 性能壓縮算法(例如AMR-WB+、 MPEG-1層III、 MPEG-4 AAC或MPEG-4 高效AAC)中的任何一種,或者它甚至還可利用PCM。
通常,上面的操作是在變換信號域中完成,所用的變換例如傅立葉 變換或MDCT。如果單元9和17中的空間參數(shù)估計和合成使用與音頻編 碼器7中使用的變換類型相同的變換,這是特別有益的,所述音頻編碼 器7也稱為核心編解碼器。
圖3'是高效參量音頻編碼器的詳細框圖。用向量形式表示為^(")的^信道離散時間輸入信號首先在變換單元21中被變換到頻域,并且一般 而言變換到給出信號^(A,附)的變換域。索引A是變換系數(shù)的索引,或者 如果選擇頻域變換則是子帶。索引歷表示抽取的時域索引,其還與可能 通過重疊幀的輸入信號相關(guān)。
信號此后在下混合單元5中被下混合,以生成W信道的下混合信號 ^(;t,附),其中#<#。空間模型參數(shù)向量/v化w)的序列在估計單元9中被 估計。這可以在開環(huán)方式下完成,或者可在閉環(huán)方式下完成。
空間參數(shù)包括代表環(huán)繞聲音感覺的心理聲學(xué)線索。例如,在MPEG 環(huán)繞編碼器中,這些參數(shù)包括信道間水平差、相位差和相千性,其等價 于ILD、 ITD和IC線索,以捕獲多信道音頻信號相對于發(fā)射的下混合信 號^(/fc,w)的空間圖像,或者如果在閉環(huán)中,捕獲解碼的信號^(、m)。線 索/^(/t,m)可以在例如空間參數(shù)量化單元23中以非常緊湊的形式編碼, 所述空間參數(shù)量化單元2 3產(chǎn)生信號& (A:,m),之后為空間參數(shù)編碼器25 。 M信道音頻編碼器7產(chǎn)生主比特流,其在多路復(fù)用器27中與參數(shù)編碼器 產(chǎn)生的空間輔助信息進行多路復(fù)用。多路復(fù)用的信號被從多路復(fù)用器發(fā) 送到接收端上的多路分解器29,輔助信息和主比特流在其中被恢復(fù),如 圖4中的框圖所示。
在接收端,主比特流被解碼,以利用接收的空間參數(shù)合成高質(zhì)量的 多信道表示。主比特流首先在M信道音頻解碼器31中被解碼,解碼信 號SM(yt,w)從這里被輸入到空間合成單元17 。持有空間參數(shù)的空間輔助信 息被多路分解器29提取,并被提供給空間參數(shù)解碼器33,其產(chǎn)生解碼 參數(shù)^(、m),并將它們發(fā)送到合成單元17??臻g合成單元產(chǎn)生信號 t(、w),其被提供給信號F/T變換單元35,信號F/T變換單元35將其 變換成時域以產(chǎn)生信號^的,即多信道解碼信號。
多信道環(huán)繞聲音的3D音頻再現(xiàn)可通過使用高效的參量環(huán)繞解碼器 以首先獲得多個環(huán)繞信道,使用例如上面參照圖4描述的多信道解碼器 而被傳遞到移動終端用戶。因此,圖1中所示的系統(tǒng)被用于合成立體聲 3D音頻再現(xiàn)的多信道信號。該操作被示于圖5的示意圖中。
可替換地,可以使用2007年1月5日提交的國際專利申請 No.PCT/SE2007/000006, "Personalized Decoding of Multi—channel Surround Sound"中描述的更高效的立體聲解碼器。這種立體聲解碼器 的操作在下面被概述。MPEG環(huán)繞解碼器中的處理可以由圖15的圖示中所示的兩個矩陣乘
法來定義,所述乘法顯示為包括也分別被稱作預(yù)解相關(guān)器矩陣單元和混
合矩陣單元的矩陣單元Ml和M2,各個信號被輸入到所述矩陣單元。第 一矩陣乘法形成到解相關(guān)單元或解相關(guān)器Di、 D2、……的輸入信號,而 第二矩陣乘法基于下混合輸入和來自解相關(guān)器的輸出而形成輸出信號。 上面的操作對每個用混合子帶索引A索引的混合子帶進行。
在下面,索引/7用于多個時隙,i用于索引混合子帶,且/用于索 引參數(shù)集。為了形成輸出信道對輸入信道的處理可描述為
y""Myw .i (3)
其中M"是二維矩陣,其將一定數(shù)量的輸入信道映射到一定數(shù)量的進入 解相關(guān)器的信道,并針對每個時隙"和每個混合子帶A定義,而M〖》是 將一定數(shù)量的預(yù)處理信道映射到一定數(shù)量的輸出信道的二維矩陣,并且 針對每個時隙n和每個混合子帶k定義。矩陣Mf依賴于是使用解相關(guān) 信號的時域時間整形(TP)還是時間包絡(luò)整形(TES)存在兩個版本, 這兩個版本用M;';和M&表示。矩陣A/"和M,利用被發(fā)送給解碼器的 立體聲參數(shù)來導(dǎo)出。A/"和M,的推導(dǎo)在IS0/EC 14496-3: 200X/PDAM 4,MPEG Surround N7530, 2005年1 0月,Nice, France中有更詳細描述。
到第一矩陣單元M1的輸入向量;c"對應(yīng)于圖4中從M信道音頻解碼 器31獲得的解碼信號^(、w)。被輸入給混合矩陣單元M2的向量釅"是
來自解相關(guān)器D,、 D2.......的輸出山、d2........來自第一矩陣乘法,
即來自預(yù)解相關(guān)器矩陣單元Mi的輸出和殘余信號res。 res2.......的組
合,并且針對每個時隙/7和每個混合子帶i定義。輸出向量少"具有基 本上對應(yīng)于如上所述的信號L、 SL、 R、 SR、 C和LFE的分量lf、 ls、 rf、 rs、 cf和lfe。這些分量必須;故轉(zhuǎn)換到時域,并以某種方式#皮再現(xiàn),以 提供到使用的耳機,即它們不能被直接使用。
用于3D音頻再現(xiàn)的方法使用包括"由模型重構(gòu)"塊的解碼器,其 采用附加輸入,例如個人HRF的表示和混合濾波器組域中的其它再現(xiàn)參 數(shù),比較圖14的項43、 37和17,,并使用其將^t型參數(shù)的導(dǎo)數(shù)變換為 其它允許直接在變換域中生成兩個立體聲信號的模型參數(shù),使得只有立體聲2信道信號必須例如在圖14的變換單元35中-皮變換到離散時域, 圖14示出基于MPEG環(huán)繞的個人化立體聲解碼。
在圖16中用符號顯示為參數(shù)修改矩陣M3的第三矩陣Mf在這個例 子中是從6個信道到兩個信道的線性映射,所述兩個信道^L用作通過變 換單元35到用戶耳機39的輸入。矩陣乘法可寫作
<formula>formula see original document page 11</formula>
通過線性(結(jié)合律),很清楚矩陣A/,和M,可被結(jié)合在一起,形 成一組新的參數(shù),這些新參數(shù)存儲在新的混合矩陣A^"'^^M,Mf中。該 組合運算被示于圖17中,其中對應(yīng)于新矩陣的乘法單元^皮顯示為混合 矩陣單元M4,兩個矩陣的乘法在乘法單元45中進行。
新混合矩陣具有依賴于比特流參數(shù)和用戶預(yù)先定義的頭部相關(guān) 濾波器HRF以及如果希望的話還依賴于其它動態(tài)再現(xiàn)參數(shù)的參數(shù)。
對于只有頭部相關(guān)濾波器的情況,矩陣A/3"可被寫作<formula>formula see original document page 11</formula>
這些矩陣元素是五個不同的濾波器,它們被用于實現(xiàn)頭部相關(guān)濾波并如 上表示為/7f、 //c\ //c'、 //f和/^。在圖15的系統(tǒng)中,濾波器在混合域 中表示。這樣的將濾波器表示從時域變換到頻域或變換域的運算在信號 處理文獻中是公知的。這里,形成矩陣A/^的濾波器是混合子帶索引1 的函數(shù),并與圖1中所示的相似。這在圖17中有進一步的詳細描述。 首先,表示在20個空間參數(shù)帶中的空間參數(shù)被用于生成矩陣Mg,參數(shù) 帶域中的混合矩陣。然后,上面引用的IS0/EC文獻的表A. 30中給出的 映射函數(shù)被用于將參數(shù)子帶索引/映射到混合子帶索引A以生成M,'、 得到的混合矩陣與Mf相乘,由結(jié)果生成最后的混合矩陣Mf 。
應(yīng)當(dāng)注意到,對于該簡單情況來說,矩陣Mf獨立于時隙索引"。 如果用戶想通過耳機39體驗另一種虛擬揚聲器配置的話,頭部相關(guān)濾 波器還可以動態(tài)改變。
從上述討論很明顯看出,數(shù)字濾波器和它們系數(shù)的高效處理在某些 情況下,例如對于具有用于諸如在移動電話中進行處理和/或存儲的有 限資源的應(yīng)用將是有益的。<formula>formula see original document page 11</formula>
發(fā)明內(nèi)容
本發(fā)明的目標(biāo)是提供用于數(shù)字濾波,尤其是用于高效處理數(shù)字濾波
器中濾波系數(shù)的方法和裝置。
一般地,濾波器的表示可以依賴于濾波器特性而被高效地適應(yīng)。 并且,濾波器的表示可被自適應(yīng)調(diào)節(jié),以滿足保真度準(zhǔn)則。 濾波器的表示還可被自適應(yīng)調(diào)節(jié),以滿足復(fù)雜度準(zhǔn)則。 并且,當(dāng)濾波器用其頻域脈沖響應(yīng)表示時,濾波器的頻率分辨率可
以依賴于其頻率響應(yīng)而#皮高效地適應(yīng)。
對立體聲環(huán)繞解碼來說,可以應(yīng)用用作中間頻率分辨率的立體聲處
理帶的概念,以便實現(xiàn)高效和高質(zhì)量的立體聲再現(xiàn)。
立體聲參數(shù)帶分辨率被自適應(yīng)調(diào)節(jié),以滿足質(zhì)量或復(fù)雜度的要求。 特別地,濾波器表示的頻率分辨率可一皮適應(yīng)該濾波器的頻率響應(yīng)。 潛在原理是,濾波器的頻率響應(yīng)對于一定頻率范圍而言可接近于常數(shù)。 該頻率范圍于是由一個單一系數(shù)表示。因此,濾波器所需的存儲空間量 減少。另外,當(dāng)將濾波器響應(yīng)與相似特性組合時,同樣的乘法被避免。
具有;方差^帶分為兩個;:當(dāng)例如使用并存儲頭部相關(guān)濾波〔轉(zhuǎn)移函 數(shù)時,該方法是有用的。
在一個一般方面中,輸入信號可使用將輸入信號提供給用濾波器系 數(shù)集合表示的數(shù)字濾波器并用該數(shù)字濾波器濾波輸入信號的常規(guī)步驟 來處理。在實際的濾波步驟之前,濾波器系數(shù)被從簡化的數(shù)字濾波器擴 展并對應(yīng)于某個原始數(shù)字濾波器,所述簡化的數(shù)字濾波器用減少的濾波 器系數(shù)表示并存儲為減少的濾波器系數(shù)。然后,至少其中一個減少的濾 波器系數(shù)對應(yīng)于或基本符合于原始數(shù)字濾波器中的兩個濾波器系數(shù)。簡 化的數(shù)字濾波器可通過將原始數(shù)字濾波器的濾波器系數(shù)互相比較并且 根據(jù)比較結(jié)果將彼此相等或彼此足夠接近的濾波器系數(shù)組合為濾波器 系數(shù)的子集來獲得。每個這種子集通??梢允穷l帶,并通過從子集中濾 波器系數(shù)獲得的減少的濾波器系數(shù)表示,例如通過某種平均運算。
原始的數(shù)字濾波器可以是多個元素原始數(shù)字濾波器的乘積
(product)。然后,在比較運算中,每個元素數(shù)字濾波器的濾波器系 數(shù)相互比較,并且在組合步驟中,彼此相等或彼此足夠接近的每個元素數(shù)字濾波器的濾波器系數(shù)被組合為子集。對于簡單的情況,每個這種子 集通過從子集中濾波器系數(shù)獲得的減少的濾波器系數(shù)表示。用于所有元 素數(shù)字濾波器的濾波器系數(shù)集合的子集也被選擇,使得它們彼此相等, 即元素數(shù)字濾波器的所有濾波器系數(shù)集合被以相同方式分為子集。
用于處理輸入信號的裝置則通常可包括用于存儲簡化的數(shù)字濾波 器的減少的濾波器系數(shù)的存儲空間、用于存儲將減少的濾波器系數(shù)映射 到原始數(shù)字濾波器的濾波器系數(shù)的表的存儲空間和用于擴展減少的濾 波器系數(shù)以形成與原始數(shù)字濾波器的濾波器系數(shù)相等或基本符合的實 際濾波器系數(shù)的邏輯單元,和用于使用實際濾波器系數(shù)濾波輸入信號的 濾波單元。
在另一方面,濾波器系數(shù)被存儲,其表示原始數(shù)字濾波器,原始數(shù) 字濾波器依次用原始濾波器系數(shù)表示。在存儲操作中,原始濾波器系數(shù) 被互相比較,并根據(jù)比較結(jié)果將彼此相等或彼此足夠接近的濾波器系數(shù) 組合為濾波器系數(shù)的子集,如上所述。最后,減少的濾波器系數(shù)被存儲, 并且將子集映射到原始濾波器系數(shù)的表也被確定和存儲。
本發(fā)明的附加目標(biāo)和優(yōu)點將在下面的描述中敘述,將會根據(jù)該描述 而部分地明顯,或者可以通過本發(fā)明的實踐而得知。本發(fā)明的目標(biāo)和優(yōu) 點可通過隨附權(quán)利要求中特別指出的方法、過程、工具和組合而被實現(xiàn) 和獲得。
附圖.說明
盡管本發(fā)明的新穎特征在隨附權(quán)利要求中被特別給出,不過對本發(fā) 明有關(guān)組織和內(nèi)容及其上述和其它特征的完整理解可以通過對下面非 限制性實施例的詳細描述的考慮而獲得,本發(fā)明根據(jù)所述考慮也將被更
好地理解,在下面參考附圖給出所述實施例,其中
-圖1是示出了 5. 1音頻信號的可能的3D音頻或立體聲再現(xiàn)的框
圖,
-圖2是示出了參量多信道編碼和解碼系統(tǒng)的原理的高級示意圖,
-圖3是參量多信道音頻編碼器的更詳細示意圖,
-圖4是參量多信道音頻解碼器的更詳細示意圖,
-圖5是示出解碼多信道信號的3D音頻再現(xiàn)的示意圖,
-圖6是示出頻域信號與濾波器脈沖響應(yīng)的向量乘法的示意圖,_圖7與圖6類似,但示出了當(dāng)使用被簡化到濾波器帶的濾波器脈 沖響應(yīng)時的乘法,
-圖8與圖6類似,示出了濾波器脈沖響應(yīng)被從級聯(lián)濾波器導(dǎo)出的 情況,
-圖9與圖8類似,但示出了當(dāng)被簡化到濾波器帶的濾波器脈沖響
應(yīng)被用于級聯(lián)濾波器時所需的乘法,
-圖IO是用于尋找濾波器帶的過程的流程圖,
-圖ll是從J個變換帶映射到/個濾波器帶的例子的示意圖,
-圖12是示出參數(shù)修改矩陣如何在混合域中與混合矩陣組合,但不
使用立體聲帶的示意圖,-
-圖13與圖12類似,示出了使用立體聲帶的情況,
-圖14是用于多信道環(huán)繞聲音的個人化立體聲解碼的安裝示意圖,
-圖15是示出在MPEG環(huán)繞解碼器中進行空間音頻處理的總體示意
圖,
-圖16是用于個人化立體聲解碼的裝置的示意圖,和 -圖17與圖14類似,也示出了如何組合參數(shù)。
具體實施例方式
現(xiàn)在將描述方法和系統(tǒng),其中濾波器表示的分辨率可適應(yīng)臨近(at hand)的濾波器響應(yīng)。這在應(yīng)用在開始和在其操作過程中面對不同濾波 器響應(yīng)的情況中是特別有益的??梢栽谶B續(xù)應(yīng)用設(shè)置之間變化的濾波器 響應(yīng)的例子是具有每個算法用戶特有的頭部相關(guān)轉(zhuǎn)移函數(shù)(HRTF)的頭 部相關(guān)濾波器。如果HRTF要被存儲并與其它濾波器響應(yīng)組合,則存儲 格式和HRTF中的系數(shù)數(shù)目可適應(yīng)它們中的方差。
通常,考慮信號處理系統(tǒng),其中時域輸入信號i"](信號幅度作為 時間t的函數(shù))被變換到頻域中。因此,時域輸入信號的T個采
樣(在時間^、 6.......G上獲得)被變換為/個頻域采樣i^]。然后,
具有時域脈沖響應(yīng)力U]的濾波器通過用變換后的信號I[到乘以頻域脈 沖響應(yīng)#[1]而被應(yīng)用到變換后的信號,以獲得濾波后的頻域信號
朋=邵剛 (6)該運算被示于圖6中。在該情況下,被用于變換到頻域的變換的分辨率 /確定即等于濾波器系數(shù)的數(shù)目。如果頻域脈沖響應(yīng)中的某些濾波 器系數(shù)彼此等價或接近等價,則只存儲這些等價系數(shù)的 一個表示就足夠 了,參見圖7。由該表示跨越的頻帶可表示濾波器帶。在一個濾波器帶 中的濾波器系數(shù)不完全等價的情況下,可通過例如最小化誤差準(zhǔn)則或通 過某種適當(dāng)?shù)钠骄\算導(dǎo)出適當(dāng)?shù)谋硎荆缦滤觥?br>
在考慮Z7個串聯(lián)連接的獨立濾波器,即具有各個頻域脈沖響應(yīng)
"U]、.......^U]的的F個濾波器的級聯(lián)的情況下,得到的總體
頻域脈沖響應(yīng)^U]通過如下給出的向量乘法運算獲得(同時參見圖8):
(7)
如果所有這些級聯(lián)濾波器在某些頻率區(qū)域是常數(shù)或接近于常數(shù),則導(dǎo)出 總體濾波器頻域脈沖響應(yīng)機i]所需的乘法數(shù)目可以從,'/減少到
其中/是表示濾波器響應(yīng)#;到^所需的頻帶數(shù)目,且這對應(yīng)于復(fù)
雜度和存儲量減少因子i7/。從f個變換帶映射到7個濾波器帶的例子
被示于圖11,其中每個濾波器帶跨越至少兩個變換帶。垂直箭頭示出了 從濾波器帶到變換帶的映射。
簡化后,新的濾波器響應(yīng)#^[/]、.......爲(wèi)^[/]被獲得,
其中/從1到/變化,參見圖9,其中示出了方程(7)中的乘法。到濾 波器帶的簡化需要用圖7和9中的方框"擴展邏輯"表示的附加邏輯, 其可給出增加的復(fù)雜度,還需要從濾波器帶到變換帶的映射表,其在某 些簡單情況下可給出增加的存儲空間需求。然而,如果提供多個級聯(lián)濾 波器,則復(fù)雜度和存儲空間需求的整體減小將會實現(xiàn)。
這里所述的方法包括兩個主要特征
-用于濾波器存儲和計算的濾波器的自適應(yīng)頻率分辨率。
-用于尋找表示濾波器響應(yīng)的帶的方法。
給定濾波器響應(yīng)機到,h1,2,…,/,自適應(yīng)地尋找希望數(shù)目/個濾 波器帶的迭代算法例子在下面的步驟中給出(同時參見圖IO的流程圖)
1. 將濾波器帶的數(shù)目/初始化為等于1,初始的濾波器帶跨越整個 頻率范圍,參見流程圖的步驟101。
2. 在流程圖的步驟103中,尋找所有濾波器帶中的濾波器響應(yīng)機1]的方差(72[/]:
2W=》2W-+ S剛
其中《.是映射到濾波器帶/的所有變換帶A的集合,(.是及.的大小。
3. 在流程圖的下一步驟105中,分割濾波器帶/,其中方差cj2[/]是 兩個部分中最大的,并且在流程圖的步驟107中將/增加1。
4. 重復(fù)步驟2.和3.,直到數(shù)目/達到帶的希望的或預(yù)先確定的數(shù) 目,或者可替換地滿足某些準(zhǔn)則,參見流程圖的步驟109。
步驟3.,分割操作和步驟4中的停止準(zhǔn)則可以以不同的方式實現(xiàn)。 對于步驟3中的分割,可選的例子是
a) 二等分類型的方法被發(fā)現(xiàn)具有最大方差—的帶被分割為兩個 相同大小的部分,或者在(是奇數(shù)的情況下接近于相同大小的部分。
b) 方差最小化方法被發(fā)現(xiàn)具有最大方差一的帶被分割,使得得 到的兩個帶的方差和^ + ct22被最小化,其中CTl2和 2分別表示通過分割得 到的第一和第二帶的方差。
c) 頻語平直度最大化方法被發(fā)現(xiàn)具有最大方差o"2的帶被分割, 使得總體頻譜平直度/7"+/7"被最大化。頻譜平直度被定義為
d)等價矩形帶寬(ERB)方法分割具有最大方差的帶,使得得到 的帶是圍繞它們中心頻率的一個ERB的相等部分。該方法的動機是,兩 個帶在這種情況下在感知上具有相等的帶寬。ERB例如被定義在 B.C.J.Moore, "An Introduction to the Psychology of Hearing", Academic Press, London, 1989, 1 05-1 09頁中
£7L5(/) = 0.10S/ + 24.7 (9)
其中/是帶的中心頻率,單位Hz。步驟4中的不同停止準(zhǔn)則與希望數(shù)目的帶#有關(guān),或者與某些保真 度準(zhǔn)則有關(guān)。不同保真度準(zhǔn)則的例子是a) 最大方差分割帶,直到在任意給定的帶中觀察的最大方差小 于或等于閾值b) 最小頻譜平直度分割帶,直到任意給定的帶中的最小頻譜平直度小于或等于閾值c) ERB的最大片段分割帶,直到觀察的ERB的最大片段小于或等于閾值。在步驟3中的分割準(zhǔn)則和步驟4中的停止準(zhǔn)則不匹配的情況下,必 須注意算法不進入無限循環(huán)。例如,相對寬的帶已經(jīng)到達零方差并且將 從不被分割是可能的。然而,最大片段ERB準(zhǔn)則在該情況下將不會終止算法。在同樣的濾波器帶應(yīng)當(dāng)被用于濾波器組的情況下,例如對于上述, 級聯(lián)濾波器或下面描述的HRF集合的情況,圖10中所示的算法必須被 修改以便同時地處理所有濾波器。這種修改的例子是改變上面的迭代算 法的步驟2。修改然后要找到方差cr2[。作為在該帶中觀察的最大方差<formula>formula see original document page 17</formula>(10)其中/ e {1 ..."是所涉及濾波器的索引。在分割過程終止之后,新的濾波器系數(shù)被計算,并且濾波器和濾波 器帶之間的映射被存儲在表格中。新的濾波器系數(shù)通過例如最小化誤差 準(zhǔn)則計算。如果例如帶A到A被組合為一個濾波器帶中,那么可能的誤 差準(zhǔn)則是<formula>formula see original document page 17</formula>該誤差準(zhǔn)則通過如下設(shè)置而被最小化(12)方程(方程(i))的系數(shù)上。并且,該自適應(yīng)濾波器表示可被應(yīng)用于時變?yōu)V波器,以便尋找整個時變?yōu)V波器組的表示的分辨率或者尋找每個單獨的濾波器在特定時間上的表示的分辨率。另外,該方法可被應(yīng)用于在例如圖像處理中使用的多維濾波器。在 該情況下,濾波器的脈沖響應(yīng)被定義在幾個維度上,即濾波器具有響應(yīng)#[n...,u,其中"是維度數(shù)。在該情況下,系數(shù)的分組可跨越不同幾何形狀,即系數(shù)對y^(^[,l.入e(、[,]」由一個單個系數(shù)U/]代替,其 中&,…,(、是被映射到新系數(shù)/上的系數(shù)A,…,^的集合。上面用于簡化到濾波器帶的方法的應(yīng)用例子是MPEG環(huán)繞解碼器的 擴展,參見例如上面引用的文本IS0/EC 14496-3: 200X/PDAM 4,MPEG Surround N7530, October 2005, Nice, France。如在引用的ISO/EC文獻中規(guī)定的MPEG環(huán)繞解碼器的信號處理部分 在71個混合帶上操作,而表示空間化的參數(shù)被發(fā)送到具有20個參數(shù)帶 的分辨率的解碼器,比較例如用于參數(shù)環(huán)繞解碼器的圖4中的功能框 17,同時參見圖12。從參數(shù)帶到混合帶的映射在上面引用的文本的表 A. 30中給出,并且不是自適應(yīng)的。具有其71個混合帶的混合域的頻率分辨率對于HRF的表示來說是 不必高。多數(shù)收聽者的HRF可用較低的分辨率來精確表示,即跨越方程 (4 )中矩陣yv/ f的濾波器可以表示在具有較低頻率分辨率的域中。然而, 參數(shù)帶的分辨率太粗糙。如上所述的簡化到濾波器帶的方法可提供尋找 可適應(yīng)HRF特性的非均勻分辨率的方式。得到的頻帶可被稱作立體聲帶,因為它們提供的頻率分辨率足夠高 質(zhì)量地實施立體聲再現(xiàn)。為了說明參數(shù)帶的存在,上述算法的初始化被 改變,以便將濾波器帶(在本申請中是立體聲帶)設(shè)置為等于參數(shù)帶。 參數(shù)帶因此可被看作濾波器帶的初始集合。另外,當(dāng)分割參數(shù)帶時,算 法必須跟蹤參數(shù)帶與立體聲帶之間以及立體聲帶與混合帶之間的映射 函數(shù)。發(fā)現(xiàn)/= 30個立體聲帶足夠用于表示HRF的多數(shù)所研究的集合。所修改的系統(tǒng)提供了三個不同的頻率分辨率1. 用于表示編碼的空間參數(shù)的參數(shù)帶,其允許按照在上面引用的IS 0 / EC文獻中所描述的進行矩陣M"和A/,的推導(dǎo)。2. 用于將混合矩陣似2";'與參數(shù)修改矩陣似3";'中的HRTF組合的立體聲 帶。HRTF^f皮存儲在該分辨率中。3. 用于利用矩陣A^"對與信號矩陣,"組合的參數(shù)實施處理的混合帶。得到的系統(tǒng)被示于圖13中。應(yīng)當(dāng)注意到,這些映射函數(shù)在計算上 是簡單的,因為只有進入映射的參數(shù)被復(fù)制到由映射得到的不同帶。 本發(fā)明的優(yōu)點可例如包括1. 存儲濾波器響應(yīng)或濾波器級聯(lián)響應(yīng)所需的存儲器被減少,并可適 應(yīng)所觀察的濾波器或濾波器級聯(lián)。2. 計算P個濾波器級聯(lián)的計算復(fù)雜度被從尸./次乘法減少到,./ 次乘法,其中r是原始變換的分辨率,且/〈/是這里所述方法中使用的分辨率。根據(jù)在上述算法中的選擇,對于給定復(fù)雜度和存儲量減少的濾波器 表示的質(zhì)量被最大化。可替換地,所需的復(fù)雜度和存儲對于濾波器表示 的給定保真度被最小化。在MPEG環(huán)繞解碼器中的立體聲解碼例子中,已經(jīng)發(fā)現(xiàn)復(fù)雜度和存 儲量減少因子2.37倍,帶的數(shù)目從1W1減少到/=30。另外,在這個例 子中,頭部相關(guān)轉(zhuǎn)移函數(shù)與被發(fā)送到解碼器的參數(shù)組合為被信號相乘的 混合矩陣。將HRTF的表示引入到立體聲帶中簡化了這些混合矩陣的計 算。代替計算f個不同矩陣的是,只需計算/個不同矩陣。雖然這里解釋和描述了本發(fā)明的特定實施例,但是應(yīng)當(dāng)認識到,可 以設(shè)想多個其它實施例,并且大量附加優(yōu)點、修改和改變對本領(lǐng)域技術(shù) 人員來說很容易想到,而不脫離本發(fā)明的精神和范圍。因此,本發(fā)明在 其更寬方面上不限于這里所示和描述的特定細節(jié)、代表性裝置和所示例 子。因此,可以在不脫離如隨附權(quán)利要求和它們的等價物所限定的總體 發(fā)明概念的精神或范圍的情況下做出各種修改。因此應(yīng)當(dāng)明白,隨附權(quán) 利要求旨在覆蓋全部落入本發(fā)明真正精神和范圍內(nèi)的這樣的修改和變 化??梢栽诓幻撾x本發(fā)明精神和范圍的情況下設(shè)想出大量其它實施例??s寫列表AAC:高級音頻編碼C:中心,5. 1環(huán)繞系統(tǒng)中六個多信道信號的其中之一ERB:等價矩形帶寬FIR filter:有限脈沖響應(yīng)濾波器HRF:頭部相關(guān)濾波器HRTF:頭部相關(guān)轉(zhuǎn)移函數(shù)MPEG:移動圖片專家組L:左,5. 1環(huán)繞系統(tǒng)中六個多信道信號的其中之一 LFE:低頻,5. 1環(huán)繞系統(tǒng)中六個多信道信號的其中之一 PDA:個人數(shù)字助理R:右,5. 1環(huán)繞系統(tǒng)中六個多信道信號的其中之一SL:環(huán)繞左,5. 1環(huán)繞系統(tǒng)中六個多信道信號的其中之一SR:環(huán)繞右,5. 1環(huán)繞系統(tǒng)中六個多信道信號的其中之一
權(quán)利要求
1.一種處理輸入信號的方法,包括如下連續(xù)的步驟-將輸入信號提供給由濾波器系數(shù)集合表示的數(shù)字濾波器,和-通過該數(shù)字濾波器對輸入信號進行濾波,其中,在濾波步驟之前,所述濾波器系數(shù)被從簡化的數(shù)字濾波器擴展并對應(yīng)于原始數(shù)字濾波器,所述簡化的數(shù)字濾波器由減少的濾波器系數(shù)表示并存儲為減少的濾波器系數(shù),所述減少的濾波器系數(shù)中的至少一個對應(yīng)于或基本符合于原始數(shù)字濾波器中的兩個濾波器系數(shù),簡化的數(shù)字濾波器通過如下步驟獲得-將原始數(shù)字濾波器的濾波器系數(shù)互相比較,-根據(jù)比較結(jié)果,將彼此相等或彼此足夠接近的濾波器系數(shù)組合為濾波器系數(shù)的子集,每個這種子集通過從子集中濾波器系數(shù)獲得的減少的濾波器系數(shù)表示。
2. 根據(jù)權(quán)利要求1所述的方法,用于原始數(shù)字濾波器是多個元素 原始數(shù)字濾波器的乘積的情況,其中在比較步驟中,每個元素數(shù)字濾波 器的濾波器系數(shù)互相比較,且在組合步驟中,彼此相等或彼此足夠接近 的每個元素數(shù)字濾波器的濾波器系數(shù)被組合為子集,每個這種子集通過 從子集中濾波器系數(shù)獲得的減少的濾波器系數(shù)表示,且用于所有元素數(shù) 字濾波器的濾波器系數(shù)集合的子集彼此相等。
3. 根據(jù)權(quán)利要求1所述的方法,其中輸入信號是依賴于時間的信 號,且濾波系數(shù)與不同的頻率相關(guān)聯(lián)。
4. 根據(jù)權(quán)利要求3所述的方法,其中在比較步驟中,用于相鄰頻 率的原始數(shù)字濾波器的濾波器系數(shù)被比較,使得在組合步驟中,只有用 于相鄰頻率的濾波器系數(shù)被組合,且所形成的一個子集或多個子集的每個都跨越不同的頻帶。
5. 根據(jù)權(quán)利要求1所述的方法,其中表示原始數(shù)字濾波器的濾波 器系數(shù)集合是原始數(shù)字濾波器的頻率脈沖響應(yīng)。
6. 根據(jù)權(quán)利要求1所述的方法,其中表示原始數(shù)字濾波器的濾波 器系數(shù)集合是數(shù)字濾波器的時間脈沖響應(yīng)。
7. 根據(jù)權(quán)利要求1所述的方法,其中表示原始數(shù)字濾波器的濾波 器系數(shù)集合是表征該數(shù)字濾波器的差分方程的系數(shù)集合。
8. 根據(jù)權(quán)利要求1所述的方法,其中在比較濾波器系數(shù)的步驟中,表示原始數(shù)字濾波器的系數(shù)子集的方差被比較。
9. 根據(jù)權(quán)利要求1所述的方法,其中比較和組合步驟包括-將子集數(shù)目初始化為等于1,初始子集包括表示原始數(shù)字濾波器 的所有系數(shù),-確定原始數(shù)字濾波器所有子集中的系數(shù)的方差,-將方差最大的子集分割為兩部分,并將子集數(shù)目增加l,和-重復(fù)確定和分割步驟,直到滿足停止準(zhǔn)則。
10. 根據(jù)權(quán)利要求9所述的方法,其中在分割步驟中, 一皮發(fā)現(xiàn)具有 最大方差的子集被分割為兩個大小相等的部分或盡可能接近大小相等 的部分。
11. 根據(jù)權(quán)利要求9所述的方法,其中在分割步驟中, 一皮發(fā)現(xiàn)具有 最大方差的子集被分割,使得分割得到的兩個子集的方差和被最小化。
12. 根據(jù)權(quán)利要求9所述的方法,其中在分割步驟中,被發(fā)現(xiàn)具有 最大方差的子集被分割,使得分割得到的兩個子集的頻譜平直度之和被 最大化。
13. 根據(jù)權(quán)利要求9所述的方法,其中在分割步驟中,被發(fā)現(xiàn)具有 最大方差的子集被分割,使得得到的子集是圍繞它們的中心頻率的 一 個 等價矩形帶寬(ERB)的相等片段。
14. 根據(jù)權(quán)利要求9所述的方法,其中重復(fù)確定和分割步驟,直到 子集數(shù)目達到預(yù)先確定的數(shù)目。
15. 根據(jù)權(quán)利要求9所述的方法,其中重復(fù)確定和分割步驟,直到 在得到的任意子集中觀察的最大方差小于或等于闊值。
16. 根據(jù)權(quán)利要求9所述的方法,其中重復(fù)確定和分割步驟,直到 在得到的任意子集帶中的最小頻譜平直度小于或等于閾值。
17. 根據(jù)權(quán)利要求9所述的方法,其中重復(fù)確定和分割步驟,直到 得到的子集中的等價矩形帶寬(ERB)的最大片段小于或等于閾值。
18. —種用于處理輸入信號的裝置,包括-存儲空間,用于存儲簡化的數(shù)字濾波器的減少的濾波器系數(shù), -存儲空間,用于存儲將減少的濾波器系數(shù)映射到原始數(shù)字濾波器的濾波器系數(shù)的表,-邏輯單元,用于擴展減少的濾波器系數(shù),以形成等于或基本上符合原始數(shù)字濾波器的濾波器系數(shù)的實際濾波器系數(shù),和-濾波單元,使用所述實際的濾波器系數(shù)對輸入信號進行濾波。
19. 根據(jù)權(quán)利要求18所迷的裝置,其中所述減少的濾波器系數(shù)中 的至少 一個對應(yīng)于原始數(shù)字濾波器的至少兩個濾波器系數(shù),用于存儲減 少的濾波器系數(shù)所需的存儲空間因此小于用于存儲原始數(shù)字濾波器的 濾波器系數(shù)所需的存儲空間。
20. —種處理輸入時域信號的方法,包括如下連續(xù)步驟-將輸入信號變換為頻率時間,以給出經(jīng)變換的輸入信號,和 -通過用濾波器頻域脈沖響應(yīng)的系數(shù)乘以經(jīng)變換信號中頻率分量的幅度,在濾波器中對經(jīng)變換的輸入信號進行濾波,其中,系數(shù)由減小的系數(shù)集合導(dǎo)出,表示頻帶中濾波器響應(yīng)的減小的集合中的至少一個系數(shù)覆蓋至少兩個在變換中所使用的相鄰頻率。
21. —種存儲表示原始數(shù)字濾波器的濾波器系數(shù)的方法,所述原始 數(shù)字濾波器由原始濾波器系數(shù)表示,該方法包括如下連續(xù)步驟-互相比較原始濾波器系數(shù),-根據(jù)比較結(jié)果,將彼此相等或彼此足夠接近的濾波器系數(shù)組合為 濾波器系數(shù)的子集,每個這種子集通過從子集中濾波器系數(shù)獲得的減少 的濾波器系數(shù)表示,和-存儲減少的濾波器系數(shù)和將子集映射到原始濾波器系數(shù)的表。
22. 根據(jù)權(quán)利要求21所述的方法,在濾波器系數(shù)與不同頻率相關(guān) 聯(lián)的情況下,其中在比較步驟中,用于相鄰頻率的原始數(shù)字濾波器的濾 波器系數(shù)被比較,使得在組合步驟中,只有用于相鄰頻率的濾波器系數(shù) 被組合,且所形成的一個子集或多個子集的每個跨越不同的頻帶。
全文摘要
在使用數(shù)字濾波的信號處理中,濾波器的表示依賴于濾波器特性可自適應(yīng)改變。如果例如數(shù)字濾波器由用于頻域中的變換帶編號0,1,…,K,的濾波器系數(shù)表示,則具有用于組合變換帶,即變換帶子集編號0,1,…,L的系數(shù)的簡化的數(shù)字濾波器被形成且只有這些系數(shù)被存儲。當(dāng)數(shù)字濾波器中的實際濾波要被實施時,實際的數(shù)字濾波器通過根據(jù)映射表擴展簡化的數(shù)字濾波器的系數(shù)而獲得,然后使用實際的數(shù)字濾波器代替原始的數(shù)字濾波器。
文檔編號H03H21/00GK101411063SQ200780010963
公開日2009年4月15日 申請日期2007年3月28日 優(yōu)先權(quán)日2006年3月28日
發(fā)明者A·塔萊布, E·卡爾森, E·諾維爾, H·波布洛思 申請人:艾利森電話股份有限公司