專利名稱:聲場(chǎng)中空間感知信息量的度量方法及應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種聲場(chǎng)中空間感知信息量的度量方法及應(yīng)用,具體地說(shuō)是一種 空間音頻系統(tǒng)中基于雙耳聽音的空間感知信息量的度量方法及應(yīng)用。
背景技術(shù):
自1948年香農(nóng)提出熵的概念,創(chuàng)立信息論以來(lái),熵被用來(lái)作為信息的量度。 1988年,在香農(nóng)熵的基礎(chǔ)上Johnston提出感知熵(Perc印tual Entropy,以下 簡(jiǎn)稱PE)的概念,并作為可感知音頻信號(hào)信息的量度,回答感知音頻編碼的最 基本問(wèn)題~"在無(wú)可感知失真的前提下最少需要多少比特才能表示一個(gè)音頻序 列。感知熵的理論基礎(chǔ)是心理聲學(xué),現(xiàn)有主流的感知音頻編碼器都將PE作為一 項(xiàng)重要的心理聲學(xué)指標(biāo),如MP3和AAC編碼器。
傳統(tǒng)感知音頻編碼中,以感知熵來(lái)估計(jì)音頻序列中可感知信息量的大小,也 就是說(shuō),感知熵給出了信源無(wú)感知損失壓縮的下限。與傳統(tǒng)感知音頻編碼類似, 空間音頻編碼的最基本問(wèn)題就是在無(wú)感知失真前提下最少需要多少比特才能表 示一個(gè)多聲道音頻序列的空間信息。
2002年Faller和Baumgarte將多聲道信號(hào)包含的音頻信息和空間信息分離 并分別編碼,提出了基于雙耳線索的空間音頻編碼技術(shù)(Binaural Cues Coding, 以下簡(jiǎn)稱BCC),與傳統(tǒng)感知音頻編碼技術(shù)相比,其低碼率高音質(zhì)的優(yōu)異表現(xiàn)受 到國(guó)內(nèi)外研究機(jī)構(gòu)的關(guān)注,成為近年來(lái)音頻編碼領(lǐng)域的研究熱點(diǎn)。
聽覺系統(tǒng)通常有兩個(gè)輸入通道,即左耳和右耳,而以單耳聽音模型為基礎(chǔ)的 感知熵理論,只考慮了單耳聽音的情況。心理聲學(xué)的研究表明,雙耳聽音既不是 左耳和右耳聽音的簡(jiǎn)單疊加,也不是左耳和右耳單獨(dú)聽音的平均,而是引入了新
的信息,即空間定位信息。
傳統(tǒng)感知音頻編碼采取離散聲道編碼的系統(tǒng)框架,忽略了聲道間蘊(yùn)含的空間 信息。而在以BCC為基礎(chǔ)發(fā)展起來(lái)的空間音頻編碼系統(tǒng)框架中,將多聲道輸入信 號(hào)的音頻信息和空間信息分離并分別編碼。在計(jì)算輸入的多聲道音頻可感知信息 量時(shí),對(duì)于采用下混技術(shù)獲得的單聲道信號(hào)依舊能夠應(yīng)用感知熵理論進(jìn)行度量。
3而對(duì)于采用空間參數(shù)提取技術(shù)獲得的空間信息,當(dāng)前的度量方法受自身度量模型 的限制,已經(jīng)無(wú)法適用于空間感知信息量的度量,也就是說(shuō),以單耳聽音模型為 基礎(chǔ)計(jì)算的感知熵?zé)o法度量聲場(chǎng)中的空間感知信息量,無(wú)法解決空間音頻編碼的
最基本問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明目的就在于克服上述現(xiàn)有技術(shù)的不足,提出一種聲場(chǎng)中空間感知信息 量的度量方法及應(yīng)用,本發(fā)明以空間感知熵SPE (Spatial Perc印tual Entropy, 簡(jiǎn)稱SPE)代表一個(gè)多聲道音頻信號(hào)中可以被感知到的空間信息量的大小,即表 達(dá)雙耳聽音中人耳接收到的空間感知信息量的大小。
一種聲場(chǎng)中空間感知信息量的度量方法,包括以下步驟
(1) 對(duì)輸入音頻信號(hào)進(jìn)行分幀、時(shí)頻變換處理,由臨界頻帶濾波單元模擬 聽覺系統(tǒng)臨界頻帶濾波過(guò)程,確定臨界頻帶的劃分規(guī)則,確定空間參數(shù)集的選取。
(2) 對(duì)空間參數(shù)進(jìn)行計(jì)算,得到各空間參數(shù)在臨界頻帶上的數(shù)值。
(3) 由噪音疊加單元處理由空間參數(shù)有限分辨率導(dǎo)致的信息量損失,計(jì)算 各空間參數(shù)所包含的有效感知量。
(4) 由SPE度量單元計(jì)算輸入信號(hào)所具有的空間感知熵SPE。
在上述的空間感知信息量的度量方法中,在步驟l中,空間參數(shù)包含了聲場(chǎng) 中的各種空間參數(shù),如雙耳線索參數(shù)、高度角線索參數(shù)、距離線索參數(shù)和水平偏 向角線索參數(shù)等。
在上述空間感知信息量的度量方法的步驟(1)中,用臨界頻帶濾波單元模 擬聽覺系統(tǒng)臨界頻帶濾波過(guò)程,臨界頻帶濾波單元是耳蝸的頻率位置映射的一個(gè) 信號(hào)處理模型,由若干個(gè)子帶的濾波器組成,每個(gè)頻帶的寬度為一個(gè)臨界帶寬。 根據(jù)心理聲學(xué),每個(gè)臨界頻帶可以近似作為一個(gè)獨(dú)立聽覺單元,不同臨界頻帶間 的影響忽略不計(jì),只有來(lái)自左右耳同一個(gè)臨界頻帶的信號(hào)才作為一次空間參數(shù)計(jì) 算的輸入。
在上述空間感知信息量的度量方法的步驟(2)中,從步驟(1)的輸出信號(hào) 中提取待度量的空間參數(shù),用a,/ ,&S…表示。由空間參數(shù)計(jì)算單元對(duì)提取的 空間參數(shù)進(jìn)行計(jì)算,得到各空間參數(shù)在臨界頻帶上的數(shù)值。在上述的空間感知信息量的度量方法的步驟(3)中,各空間參數(shù)所疊加的 噪音需要體現(xiàn)聽覺系統(tǒng)有限精度與神經(jīng)系統(tǒng)的內(nèi)在的噪音以及多聲源干擾、反 射、混響等非理想因素。這些因素聯(lián)合使得空間參數(shù)具有一定的有限分辨率,在 心理聲學(xué)上被稱為恰可感知差異,它反映了聽覺系統(tǒng)總體的靈敏度,記為
Aa,A",A5,As...。對(duì)于不同的參數(shù)其有限分辨率不同。在不考慮這些參數(shù)之 間影響的條件下,空間參數(shù)的有效感知量估計(jì)式如下-
其中,a為選取的空間參數(shù),6為頻帶標(biāo)志,a(6)為空間參數(shù)a在頻帶Z)上 的數(shù)值,Aa(6)為空間參數(shù)a在該頻帶的分辨率,^^(6)為空間參數(shù)a在頻帶6
上所具有的有效感知量。
在上述的空間感知信息量的度量方法的步驟(4)中,將信息度量單元輸出 的信號(hào)輸入SPE度量單元??臻g感知熵SPE包含了所有空間參數(shù)的有效感知量, 但考慮各空間參數(shù)之間的相互影響,SPE并不是各空間參數(shù)有效感知量的簡(jiǎn)單疊 加,而是小于各空間參數(shù)在全頻帶上有效感知量之和。采用下面的空間感知熵估 計(jì)式計(jì)算SPE:
其中,O"反映了聽覺感知的幅度壓縮,iV是變換幀長(zhǎng),w為劃分的頻帶數(shù)。 ^(6)表示該空間參數(shù)a在6頻帶上所具有的有效感知量。
聲場(chǎng)中空間感知信息量的度量方法的應(yīng)用,首先按上述方法計(jì)算多路信號(hào)的 空間感知熵SPE,然后在編碼中,將SPE作為音頻編碼的下限碼率,并指導(dǎo)空間 參數(shù)的選取以及空間參數(shù)的量化編碼。
本發(fā)明以空間感知熵SPE代表一個(gè)多聲道音頻信號(hào)中可以被感知到的空間 信息量的大小,即表達(dá)雙耳聽音中人耳接收到的空間感知信息量的大小。以雙耳 聽音模型為基礎(chǔ)的SPE代表了一個(gè)多聲道音頻信號(hào)中可以被感知到的空間信息 量的大小,是空間音頻編碼碼率的下限。解決了以單耳聽音模型為基礎(chǔ)計(jì)算的感知熵?zé)o法度量聲場(chǎng)中的空間感知信息量,無(wú)法解決空間音頻編碼的最基本問(wèn)題。
圖l為本發(fā)明方法的流程圖。
圖2為巴克頻帶劃分規(guī)則示意圖。
圖3為神經(jīng)興奮度曲面圖。
圖4為IC對(duì)ILD/ITD影響示意圖。
圖5為空間感知信息量度量方法在音頻編碼中的應(yīng)用框圖。
具體實(shí)施例方式
聲場(chǎng)中空間感知信息量的度量方法其流程如圖l所示,包括以下歩驟-
(1)由預(yù)處理單元對(duì)輸入音頻信號(hào)進(jìn)行分幀、時(shí)頻變換處理。以1024采樣 點(diǎn)為分幀單位,采用FFT變換實(shí)現(xiàn)時(shí)域信號(hào)到頻域信號(hào)的轉(zhuǎn)換。
由臨界頻帶濾波單元模擬聽覺系統(tǒng)臨界頻帶濾波過(guò)程,確定臨界頻帶的劃分 規(guī)則。臨界頻帶濾波單元采用巴克帶劃分規(guī)則,由25個(gè)子帶的濾波器組成,每 個(gè)頻帶的寬度為一個(gè)臨界帶寬,巴克頻帶劃分規(guī)則示意圖如圖2所示。
由空間參數(shù)選取單元確定空間參數(shù)集的選取,空間參數(shù)選取單元包含了聲場(chǎng) 中的各種空間參數(shù),如雙耳線索參數(shù),高度角線索參數(shù),距離線索參數(shù)和水平偏 向角線索參數(shù)等等。
(2)由空間參數(shù)計(jì)算單元將空間參數(shù)選取單元輸出的空間參數(shù)進(jìn)行計(jì)算, 得到各空間參數(shù)在臨界頻帶上的數(shù)值。從步驟(1)的輸出信號(hào)中提取待度量的 空間參數(shù),用",>5,(5^...表示,計(jì)算各空間參數(shù)在各頻帶上的具體數(shù)值。
(3)由噪音疊加單元處理由空間參數(shù)有限分辨率導(dǎo)致的信息量損失,各空間 參數(shù)所疊加的噪音需要體現(xiàn)聽覺系統(tǒng)有限精度與神經(jīng)系統(tǒng)的內(nèi)在的噪音,以及多 聲源干擾、反射、混響等非理想因素。這些因素使得空間參數(shù)具有一定的有限分 辨率;
由信息度量單元計(jì)算各空間參數(shù)所包含的有效感知量。空間參數(shù)的有效感知 量估計(jì)式如下
6a(。
其中,a表示選取的空間參數(shù),6為頻帶標(biāo)志,a(6)為空間參數(shù)a在頻帶6 上的數(shù)值,Aa(的為空間參數(shù)a在該頻帶的分辨率,《a(6)表示空間參數(shù)a在 頻帶6上所具有的有效感知量。
(4)由SPE度量單元估計(jì)輸入信號(hào)所具有的空間感知熵SPE,用下面的空 間感知熵估計(jì)式計(jì)算SPE:
a A辦=1
其中,O"反映了聽覺感知的幅度壓縮,7V是變換幀長(zhǎng),W為劃分的頻帶數(shù)。 ^0)表示該空間參數(shù)a在6頻帶上所具有的有效感知量。
下面以三個(gè)雙耳線索耳間相關(guān)度(以下稱IC)、雙耳強(qiáng)度差(以下稱ILD)、
雙耳時(shí)間差(以下稱ITD)為例對(duì)本發(fā)明實(shí)施例做進(jìn)一步的說(shuō)明,以便具體實(shí)施參考。
步驟(1)中,在預(yù)處理單元,將輸入信號(hào)以1024個(gè)采樣點(diǎn)為分幀單位進(jìn)行 分幀處理,采用FFT變換實(shí)現(xiàn)時(shí)域信號(hào)到頻域信號(hào)的轉(zhuǎn)換。
如附圖2所示,臨界頻帶濾波單元采用巴克帶的劃分規(guī)則,由25個(gè)子帶濾 波器組構(gòu)成,每個(gè)頻帶的寬度為一個(gè)臨界帶寬,呈現(xiàn)低頻窄高頻寬的趨勢(shì)。每個(gè) 臨界頻帶近似作為一個(gè)獨(dú)立聽覺單元,不同臨界頻帶間的影響忽略不計(jì),將來(lái)自 左右耳同一個(gè)臨界頻帶的信號(hào)作為一次ILD、 ITD和IC計(jì)算的輸入。
本實(shí)施例中空間參數(shù)選取單元選取雙耳強(qiáng)度差I(lǐng)LD、雙耳時(shí)間差I(lǐng)TD和耳間 相關(guān)度IC作為待度量的空間參數(shù)。
步驟(2)中,計(jì)算步驟(1)中輸出的空間參數(shù)的數(shù)值。 耳間相關(guān)度IC計(jì)算式如下<formula>formula see original document page 8</formula>
其中6是臨界頻帶標(biāo)號(hào),/C(6)是IC參數(shù)在臨界頻帶6的數(shù)值,&和&+1 分別是臨界頻帶6和6 + l的起始FFT譜線標(biāo)號(hào),Z,("和X,("分別表示左右
聲道第A條FFT譜線,A^(A)表示^;(^)的共軛復(fù)數(shù),Re表示取復(fù)數(shù)實(shí)部的操
作??紤]到音頻信號(hào)在時(shí)域都是實(shí)數(shù)表示,公式5計(jì)算子帶歸一化相關(guān)度的實(shí)部, 與時(shí)域信號(hào)的歸 一化相關(guān)度等價(jià)。 雙耳強(qiáng)度差I(lǐng)LD計(jì)算式如下
<formula>formula see original document page 8</formula>
即左右聲道對(duì)應(yīng)臨界帶頻譜能量比,以dB為單位。其中6是臨界頻帶標(biāo)號(hào),
/ZX>(W是ILD參數(shù)在臨界頻帶6的數(shù)值,&和分別是臨界頻帶6和6 +1的
起始FFT譜線標(biāo)號(hào),義"A:)和;^(A:)分別表示左右聲道第A:條FFT譜線。根據(jù)
FFT變換的能量守恒性質(zhì),上式與時(shí)域信號(hào)的能量比等價(jià)。 雙耳時(shí)間差I(lǐng)TD計(jì)算式如下
<formula>formula see original document page 8</formula>
即左右聲道臨界頻帶群延時(shí)差。其中6是臨界頻帶標(biāo)號(hào),/7D(Z))是ITD參數(shù)在臨界頻帶6的數(shù)值,^和、+1分別是臨界頻帶^和6 + 1的起始FFT譜線標(biāo)
號(hào),J^("和Xr(A)分別表示左右聲道第A條FFT譜線。arg表示求取相角操作。
由于時(shí)域延時(shí)對(duì)應(yīng)FFT域的線性相移,上式與時(shí)域信號(hào)的延時(shí)差是對(duì)應(yīng)的。
步驟3中,IC、 ILD、 ITD所疊加的噪音需要體現(xiàn)聽覺系統(tǒng)有限精度與內(nèi)在的 噪音以及多聲源干擾、反射、和混響等非理想因素。聽覺系統(tǒng)的有限精度是信號(hào) 傳輸過(guò)程中的延時(shí)、衰減,以及神經(jīng)系統(tǒng)的內(nèi)在噪音所造成的。這些因素聯(lián)合造 成的有限分辨率,即恰可感知差異,反映了聽覺系統(tǒng)總體的靈敏度, 一般是頻率 的函數(shù)。記Ar、 AA、和A77分別為ITD、 ILD、和IC的有限分辨率,不考慮雙 耳線索相互影響,空間參數(shù)ITD、 ILD、和IC采用如下有效感知量估計(jì)式
其中L」表示下取整。《,TO(6),《助(6),^:(6)分別表示ITD、 ILD和IC在頻帶b
的有效感知量,/7D(Z ), 7LD(Z)), /C(的分別為頻帶b內(nèi)的ITD、 ILD和IC
數(shù)值。Ar(", A;iO), A7(W為ITD、 ILD和IC參數(shù)在頻帶b內(nèi)的有限分辨 率。
其中,有限分辨率測(cè)量方法將全頻帶按巴克帶劃分方法劃分為25個(gè)子帶, 每個(gè)子帶上分別測(cè)量ILD、 ITD和IC的有限分辨率。下面以ILD為例,說(shuō)明測(cè)量 ILD有限分辨率的步驟制作音頻序列,設(shè)置其ILD值分別從-9到9,以l為步 長(zhǎng)變化,共生成19個(gè)測(cè)試音。其中,ILD=0的測(cè)試音作為參考音,其聲源方向 來(lái)自頭頂?shù)恼行?。主觀測(cè)試時(shí),使ILD值從O開始分別向正數(shù)和負(fù)數(shù)兩邊逐漸 變化,并對(duì)相應(yīng)的測(cè)試音進(jìn)行測(cè)聽。人耳感覺測(cè)試音與參考音聲源方向是相同的, 比對(duì)結(jié)果記錄為0;人耳感知到了測(cè)試音與參考音聲源方向不同,則比對(duì)結(jié)果記錄為1。測(cè)試者對(duì)所有原始音測(cè)聽結(jié)束后,記錄下結(jié)果為0和1的交界處且記錄 為1的兩個(gè)測(cè)試序列的ILD值,取這兩個(gè)值的絕對(duì)值平均,作為ILD臨界值。該 值即為ILD的有限分辨率。
步驟(4)中,修正空間參數(shù)的有限分辨率并計(jì)算SPE。如附圖3所示,ITD、 ILD是神經(jīng)興奮度曲面極小值點(diǎn)的位置,當(dāng)IC變小時(shí),曲面的谷值點(diǎn)附近將趨 于平緩,從而降低ITD和ILD的分辨率。反之,當(dāng)IC變大時(shí),曲面的谷值點(diǎn)附 近將趨于陡峭,從而提高ITD和ILD的分辨率。
IC對(duì)于ILD和ITD的影響是不同的。如附圖4所示,當(dāng)IC減小時(shí),神經(jīng)興 奮度曲面的延時(shí)方向的曲率變化要顯著大于衰減方向的曲率變化,在等高線上表 現(xiàn)為延時(shí)方向變換明顯,而衰減方向變換不明顯。
信號(hào)的能量與信號(hào)的相位無(wú)關(guān),IC的降低可以看成相位噪音的增加,因此 ILD受IC的影響較小,而信號(hào)的互相關(guān)曲線的曲率受到相關(guān)度的影響很大。以 相關(guān)噪音為例,其互相關(guān)函數(shù)是沖擊函數(shù),此時(shí)曲率趨于無(wú)限大,等高線在延時(shí) 方向退化成一個(gè)點(diǎn),此時(shí)可以精確的確定ITD;隨著相關(guān)度的降低,噪音信號(hào)的 互相關(guān)函數(shù)峰值處的曲率逐漸下降,表現(xiàn)為等高線在延時(shí)方向擴(kuò)展,ITD的精度 下降;在極端的非相關(guān)噪音,即獨(dú)立噪音的情況下,互相關(guān)函數(shù)恒為0,此時(shí)等 高線由封閉曲線變成延時(shí)方向的水平線,完全無(wú)法確定ITD。
由上述分析知,IC對(duì)ILD的影響可以忽略不計(jì),只考慮IC對(duì)ITD的影響。 由于ITD的分辨率隨著IC的下降而下降,相當(dāng)于ITD的恰可感知差異增大。采 用ITD有限分辨率修正式,通過(guò)IC對(duì)ITD的有限分辨率進(jìn)行修正
其中Ar'(。為修正的lTD在頻帶b的有限分辨率,Ar(6)為步驟(3)中 計(jì)算的ITD在頻帶b的有限分辨率,IC(Z))為IC在頻帶b的數(shù)值。當(dāng)IC0)-1 時(shí),Ar'(6)有最小值A(chǔ)r(6),此時(shí)ITD有限分辨率最高;當(dāng)(KIC(6)〈1時(shí), △ r(6) < Ar'O) < oo ,此時(shí)ITD有限分辨率下降,但能提供ITD信息;當(dāng)IC(6) = 1 時(shí),Ar'(6)-Q0, ITD有限分辨率為O,無(wú)法提供任何ITD信息。
10ITD的有效感知量修正式如下
/r卿
其中《'/ro(。為修正的ITD在頻帶b的有效感知量,Ar'(。為修正的ITD 在頻帶b的有限分辨率,/7D(6)為ITD在頻帶b的數(shù)值。
綜合以上步驟,采用空間感知熵SPE估計(jì)式如下:
25 廣
1 25
+ — y crlog
1 25
2
、L
2
乂 廣
+ 1
△AO)
+ 1
+ 1
A柳
其中/丄D(Z)), /77X的,/C(Z>)分別由步驟(3)給出,△ AA(6), △ /7(6)分 別是ITD、 ILD、 IC在臨界帶6的有限分辨率,通過(guò)聽音測(cè)試確定。O"反映聽覺 感知的幅度壓縮,一般取0.6。 7V是FFT變換的幀長(zhǎng)。log可以任何正實(shí)數(shù)為底。 通常計(jì)算機(jī)默認(rèn)以2為底。
附圖5為空間感知信息量度量方法在音頻編碼中的應(yīng)用框圖。
多路信號(hào)分別經(jīng)預(yù)處理單元進(jìn)行分幀、時(shí)頻變換等處理。處理后的信號(hào)進(jìn)入 下混單元和空間參數(shù)選取單元。下混后的信號(hào)進(jìn)入量化熵編碼單元處理后進(jìn)入碼 流復(fù)用單元。空間參數(shù)選取單元將選取后的空間參數(shù)輸入空間感知信息度量單 元。空間感知信息量度量單元計(jì)算信號(hào)的空間感知熵SPE。在編碼中,SPE作為 音頻編碼的下限碼率,指導(dǎo)空間參數(shù)選取單元以及空間參數(shù)的量化編碼單元。空 間參數(shù)經(jīng)量化編碼單元后進(jìn)入碼流復(fù)用單元。
權(quán)利要求
1. 一種聲場(chǎng)中空間感知信息量的度量方法,其特征在于包括以下步驟(1)對(duì)輸入的音頻信號(hào)進(jìn)行分幀、時(shí)頻變換處理,模擬聽覺系統(tǒng)臨界頻帶濾波過(guò)程,確定臨界頻帶的劃分規(guī)則,選取聲場(chǎng)中的各種空間參數(shù)集;(2)對(duì)空間參數(shù)進(jìn)行計(jì)算,得到各空間參數(shù)在臨界頻帶上的數(shù)值;(3)測(cè)量空間參數(shù)的有限分辨率,由下式計(jì)算各空間參數(shù)所包含的有效感知量其中,α表示選取的空間參數(shù),b為頻帶標(biāo)志,α(b)為空間參數(shù)α在頻帶b上的數(shù)值,Δα(b)為空間參數(shù)α在該頻帶的分辨率,qα(b)表示空間參數(shù)α在頻帶b上所具有的有效感知量;(4)由下式計(jì)算輸入信號(hào)所具有的空間感知熵SPE其中,qα(b)表示空間參數(shù)α在頻帶b上所具有的有效感知量,σ為聽覺感知的幅度壓縮,N是FFT變換的幀長(zhǎng),n為劃分的頻帶數(shù);SPE即為一個(gè)多聲道音頻信號(hào)中可以被感知到的空間信息量的大小。
2. 根據(jù)權(quán)利要求1所述的空間感知信息量,其特征在于在步驟(1)中,用臨 界頻帶濾波單元模擬聽覺系統(tǒng)臨界頻帶濾波過(guò)程,所用臨界頻帶濾波單元由若干 個(gè)子帶的濾波器組成,每個(gè)頻帶的寬度為一個(gè)臨界帶寬。
3. 根據(jù)權(quán)利要求1所述的空間感知信息量,其特征在于將空間參數(shù)集中來(lái)自 同一個(gè)臨界頻帶的信號(hào)進(jìn)行計(jì)算,得出各空間參數(shù)在臨界頻帶上的數(shù)值。
4. 一種權(quán)利要求1所述聲場(chǎng)中空間感知信息量的度量方法的應(yīng)用,其特征在于包 括以下步驟首先按權(quán)利要求1所訴方法計(jì)算多路信號(hào)的空間感知熵SPE,然后在編碼中,將SPE作為音頻編碼的下限碼率,并指導(dǎo)空間參數(shù)的選取以及空間參 數(shù)的量化編碼。
全文摘要
本發(fā)明公開了一種聲場(chǎng)中空間感知信息量的度量方法及應(yīng)用,該方法以空間感知熵SPE代表一個(gè)多聲道音頻信號(hào)中可以被感知到的空間信息量的大小,即表達(dá)雙耳聽音中人耳接收到的空間感知信息量的大小。以雙耳聽音模型為基礎(chǔ)的SPE代表了一個(gè)多聲道音頻信號(hào)中可以被感知到的空間信息量的大小,是空間音頻編碼碼率的下限,解決了以單耳聽音模型為基礎(chǔ)計(jì)算的感知熵?zé)o法度量聲場(chǎng)中空間感知信息量的問(wèn)題。
文檔編號(hào)G10L19/02GK101504835SQ20091006101
公開日2009年8月12日 申請(qǐng)日期2009年3月9日 優(yōu)先權(quán)日2009年3月9日
發(fā)明者磊 張, 晟 曹, 恒 王, 胡瑞敏, 冰 陳, 琪 陳, 陳文琴, 陳水仙 申請(qǐng)人:武漢大學(xué)