專利名稱:基于麥克風(fēng)信號(hào)來提供空間提示集合的設(shè)備、方法和計(jì)算機(jī)程序以及用于提供雙聲道音 ...的制作方法
基于麥克風(fēng)信號(hào)來提供空間提示集合的設(shè)備、方法和計(jì)算機(jī)程序以及用于提供雙聲道音頻信號(hào)和空間提示集合的設(shè)
備
背景技術(shù):
根據(jù)本發(fā)明的實(shí)施例涉及一種用于基于雙聲道麥克風(fēng)信號(hào)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的設(shè)備。根據(jù)本發(fā)明的其他實(shí)施例涉及一種對(duì)應(yīng)的方法和一種對(duì)應(yīng)的計(jì)算機(jī)程序。根據(jù)本發(fā)明的其他實(shí)施例涉及一種用于提供處理過的和未處理的雙聲道音頻信號(hào)以及空間提示集合的設(shè)備。根據(jù)本發(fā)明的另一實(shí)施例涉及一種用于空間音頻編碼器的麥克風(fēng)前端。在下文中,將介紹音頻信號(hào)的參數(shù)表示的領(lǐng)域。立體聲和環(huán)繞音頻信號(hào)的參數(shù)表示已經(jīng)發(fā)展了幾十年并且達(dá)到了成熟狀態(tài)。強(qiáng)度立體聲(R. Waal 禾口 R. Veldhuis, "Subband coding of stereophonic digital audio signals, "Proc. IEEE ICASSP 1991,pp. 3601-3604,1991.)、(J. Herre,K. Brandenburg和 D.Lederer,"Intensity stereo coding,"96th AES Conv. ,Feb. 1994,Amsterdam(preprint 3799),1994.)用在MP3 (IS0/IEC,Coding of moving pictures and associated audio for digital storage media at up to about 1. 5Mbit/s-Part 3 :Audio. IS0/IEC 11172-3
International Standard,1993,jTCl/SC29/WGll.)、MPEG_2 AAC(-,Generic coding of
moving pictures and associated audio information-Part 7 :Advanced Audio Coding. IS0/IEC 13818-7International Standard, 1997, jTCl/SC29/WGll.)以及其他音頻編碼器中。強(qiáng)度立體聲是原始參數(shù)立體聲編碼技術(shù),通過下混頻和聲級(jí)差信息來表示立體聲信號(hào)。雙耳提示編碼(BCC) (C. Faller 禾口 F. Baumgarte, "Efficient representation of spatial audio using perceptual parametrization,"in Proc. IEEE Workshop on App1.
Of Sig. Proc. to Audio and Acoust.,Oct. 2001,pp. 199—202.),(-, "Binaural Cue
Coding-Part II Schemes and applications,"IEEE Trans, on Speech and Audio Proc., vol. 11,no. 6,pp. 520-531,Nov. 2003.)通過針對(duì)參數(shù)立體聲/環(huán)繞編碼而不是針對(duì)音頻編碼使用不同的濾波器組使得可以實(shí)現(xiàn)音頻質(zhì)量的顯著提高(F. Baumgarte和C. Faller, "Why Binaural Cue Coding is better than Intensity Stereo Coding,” in Preprint 112th Conv. Aud. Eng. Soc.,May 2002.),即,雙耳提示編碼(BCC)可以被看作是針對(duì)傳統(tǒng)音頻編碼器的預(yù)處理器或后處理器。此外,雙耳提示編碼(BCC)還針對(duì)參數(shù)化而不是僅針對(duì)聲級(jí)差(即,還針對(duì)時(shí)間差和聲道間相干性)來使用附加的空間提示。以IEC/IS0 MPEG 來標(biāo)準(zhǔn)化的參數(shù)立體聲(PS) (E. Schuijers, J. Breebaart, H. Purnhagen 和 J. Engdegard, "Low complexity parametric stereo coding,,,in Preprint 117th Conv. Aud. Eng. Soc. ,May 2004.)使用相位差而不是時(shí)間差,這具有的優(yōu)點(diǎn)是與對(duì)于時(shí)間延遲合成相比,更容易實(shí)現(xiàn)無偽跡合成。BCC還將上述參數(shù)立體聲構(gòu)思應(yīng)用于環(huán)繞聲。MP3環(huán)繞(J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer 禾口 C. Spenger, "MP3 Surround :Efficient and compatible coding of multi-channel audio,,,in Preprint 116th Conv. Aud. Eng. Soc. , May2004. ) > (C. Faller, "Coding of spatial audio compatible with different
6playback formats,"in Preprint 117th Conv. Aud. Eng. Soc. ,October 2004.)禾口 MPEG if 繞(J. Herre, K. Kjdrling, J. Breebaart, C. Faller, S. Disch, H. Purnhagen, J. Koppens, J. Hilpert, J. R_6den,W. Oomen, K. Linzmeier 禾口 K. S. Chong, “Mpeg surround—the iso/ mpeg standard for efficient and compatible multi-channel audio coding," in Preprint 122th Conv. Aud. Eng. Soc. ,May 2007.)音頻編碼器基于立體聲下混頻來引入空間合成,使得可以實(shí)現(xiàn)立體聲向后兼容性和更高的音頻質(zhì)量。參數(shù)多聲道音頻編碼器(如, BCC、MP3環(huán)繞和MPEG環(huán)繞)常常被稱作空間音頻編碼器(SAC)。最近,提出了表示空間脈沖響應(yīng)呈現(xiàn)(SIRR)的技術(shù)(J. Merimaa和V. Pulkki, “Spatial impulse response rendering i :Analysis and synthesis, "J. Aud. Eng. Soc., vol. 53, no. 12,2005.)、(V. Pulkki 禾口 J. Merimaa, "Spatial impulse response rendering ii !Reproduction of diffuse sound and listening tests, " J. Aud. Eng. Soc. , vol. 54, no. 1,2006.),該技術(shù)基于單個(gè)音頻聲道(B格式的W信號(hào)(M. A. Gerzon,"Periphony Width-Height Sound Reproduction, "J. Aud. Eng. Soc. , vol. 21, no. 1, pp. 2-10,1973.), (K. Farrar,‘‘Soundfield microphone, "Wireless World, pp. 48-50, Oct. 1979.)力口上從 B格式信號(hào)得到的空間信息,來合成(相對(duì)于麥克風(fēng)位置的)任何方向的脈沖響應(yīng)。這種技術(shù)后來還應(yīng)用于音頻信號(hào),與脈沖響應(yīng)和所謂的方向音頻編碼(DirAC) (V. Pulkki and C. Faller, "Directional audio coding :Filterbank and STFTbased design,,,in Preprintl20th Conv. Aud. Eng. Soc. , May 2006, p. preprint 6658.)才目 β., DirAC nj 以被看作是SAC,SAC可以直接應(yīng)用于麥克風(fēng)信號(hào)。已提出多種技術(shù)以用于DirAC(J. Ahonen, G. D. Galdo, M. Kallinger, F. Kiich, V. Pulkki 禾口 R. Schultz-Amling, "Analysis and adjustment of planar microphone arrays for application in directional audio coding,,,in Preprint 124th Conv. Aud. Eng. Soc. , May. 2008. ) > (J. Ahonen, M. Kallinger, F. Kiich, V. Pulkki 禾口 R. Schultz-Amling, "Directional analysis of sound field with linear microphone array and applications in sound reproduction," in Preprintl24th Conv. Aud. Eng. Soc.,May. 2008.)。DirAC 始終是基于 B 格式信號(hào)的,對(duì)多種麥克風(fēng)配置的信號(hào)進(jìn)行處理,以得到B格式,然后用于DirAC的方向分析中。從上述觀點(diǎn)來看,本發(fā)明的目的是建立一種在計(jì)算量上高效的構(gòu)思,以得到空間提示信息,而同時(shí)保持對(duì)于聲音換能而作出的努力非常小。
發(fā)明內(nèi)容
以下設(shè)備和方法解決了該問題根據(jù)權(quán)利要求1所述的用于基于雙聲道麥克風(fēng)信號(hào)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的設(shè)備,根據(jù)權(quán)利要求10所述的用于提供雙聲道音頻信號(hào)以及與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的設(shè)備,根據(jù)權(quán)利要求11所述的用于基于雙聲道麥克風(fēng)信號(hào)來提供處理后的雙聲道音頻信號(hào)以及與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的設(shè)備,根據(jù)權(quán)利要求12所述的基于雙聲道麥克風(fēng)信號(hào)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的方法,以及根據(jù)權(quán)利要求13所述的計(jì)算機(jī)程序。根據(jù)本發(fā)明的實(shí)施例提供了一種用于基于雙聲道麥克風(fēng)信號(hào)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的設(shè)備。所述設(shè)備包括信號(hào)分析器,被配置為基于雙聲道麥克風(fēng)信號(hào)來獲得分量能量信息和方向信息,使得分量能量信息描述對(duì)雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量和雙聲道麥克風(fēng)信號(hào)的散射聲分量的能量的估計(jì),以及使得方向信息描述對(duì)雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量所源自的方向的估計(jì)。所述設(shè)備還包括空間輔助信息發(fā)生器,被配置為將雙聲道麥克風(fēng)信號(hào)的分量能量信息和雙聲道麥克風(fēng)信號(hào)的方向信息映射到空間提示信息上,所述空間提示信息描述與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合。該實(shí)施例基于以下發(fā)現(xiàn)如果從雙聲道信號(hào)提取直達(dá)聲分量和散射聲分量的能量的估計(jì)以及方向信息并將所述能量的估計(jì)和方向信息映射到空間提示上,則可以以具體有效的方式來計(jì)算上混頻音頻信號(hào)的空間提示,這是因?yàn)榈湫偷乜梢砸詼p小的計(jì)算量從具有僅兩個(gè)聲道的音頻信號(hào)提取分量能量信息和方向信息,但仍然對(duì)于計(jì)算與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示而言構(gòu)成良好的基礎(chǔ)。換言之,即使分量能量信息和方向信息基于雙聲道信號(hào),所述信息也非常適于直接計(jì)算空間提示而實(shí)際上不使用上混頻音頻聲道作為中間量。在優(yōu)選實(shí)施例中,空間輔助信息發(fā)生器被配置為將方向信息映射到對(duì)與方向有關(guān)的直達(dá)聲至環(huán)繞音頻聲道的映射加以描述的增益因子集合上。此外,空間輔助信息發(fā)生器被配置為基于分量能量信息和增益因子來得到聲道強(qiáng)度估計(jì),所述聲道強(qiáng)度估計(jì)描述多于兩個(gè)環(huán)繞聲道的估計(jì)強(qiáng)度。在這種情況下,空間輔助信息發(fā)生器優(yōu)選地被配置為基于聲道強(qiáng)度估計(jì)來確定與上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示。該實(shí)施例基于以下發(fā)現(xiàn)雙聲道麥克風(fēng)信號(hào)允許提取方向信息,所述方向信息可以被良好地映射到對(duì)與方向有關(guān)的直達(dá)聲到環(huán)繞音頻聲道的映射加以描述的增益因子集合上,使得能夠得到有意義的聲道強(qiáng)度估計(jì), 所述聲道強(qiáng)度估計(jì)描述上混頻信號(hào)并且構(gòu)成計(jì)算空間提示信息的基礎(chǔ)。在優(yōu)選實(shí)施例中,空間輔助信息發(fā)生器還被配置為基于分量能量信息和增益因子來得到聲道相關(guān)性信息,聲道相關(guān)性信息描述上混頻信號(hào)的不同聲道之間的相關(guān)性。在該實(shí)施例中,空間輔助信息發(fā)生器優(yōu)選地被配置為基于一個(gè)或多個(gè)聲道強(qiáng)度估計(jì)以及聲道相關(guān)性信息來確定與上混頻信號(hào)相關(guān)聯(lián)的空間提示。已經(jīng)發(fā)現(xiàn),分量能量信息和增益因子構(gòu)成了足以用于計(jì)算聲道相關(guān)性信息的信息,使得優(yōu)選地可以在不使用任何其他變量(一些常數(shù)除外,這些常數(shù)反映了散射聲至上混頻信號(hào)的聲道的分布)的情況下計(jì)算聲道相關(guān)性信息。此外,已經(jīng)認(rèn)識(shí)到,一旦已知聲道強(qiáng)度估計(jì)和聲道相關(guān)性信息,就能夠容易地確定對(duì)上混頻信號(hào)的聲道間相關(guān)性加以描述的空間提示。在另一優(yōu)選實(shí)施例中,空間輔助信息發(fā)生器被配置為對(duì)雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量的強(qiáng)度的估計(jì)與雙聲道麥克風(fēng)信號(hào)的散射聲分量的強(qiáng)度的估計(jì)進(jìn)行線性組合,以得到聲道強(qiáng)度估計(jì)。在該實(shí)施例中,空間輔助信息發(fā)生器優(yōu)選地被配置為根據(jù)增益因子以及根據(jù)方向信息來對(duì)直達(dá)聲分量的強(qiáng)度的估計(jì)進(jìn)行加權(quán)??蛇x地,空間輔助信息發(fā)生器還可以被配置為根據(jù)恒定值來對(duì)散射聲分量的強(qiáng)度的估計(jì)進(jìn)行加權(quán),其中所述恒定值反映了散射聲分量至上混頻音頻信號(hào)的不同聲道的分布。已認(rèn)識(shí)到,可以通過非常簡單的數(shù)學(xué)運(yùn)算(即,線性組合)從分量能量信息得到聲道強(qiáng)度估計(jì),其中可以高效地從雙聲道麥克風(fēng)信號(hào)得到的增益因子構(gòu)成了合適的加權(quán)因子。本發(fā)明的另一實(shí)施例提供了一種用于提供雙聲道音頻信號(hào)以及與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的設(shè)備。所述設(shè)備包括麥克風(fēng)布置,麥克風(fēng)布置包括第一方向性麥克風(fēng)和第二方向性麥克風(fēng),其中,第一方向性麥克風(fēng)和第二方向性麥克風(fēng)相隔不大于30cm(或甚至不超過5cm),第一方向性麥克風(fēng)和第二方向性麥克風(fēng)被定向?yàn)槭沟玫诙较蛐喳溈孙L(fēng)的方向特性是第一方向性麥克風(fēng)的方向特性的旋轉(zhuǎn)版本。用于提供雙聲道音頻信號(hào)的所述設(shè)備還包括上述用于基于雙聲道麥克風(fēng)信號(hào)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的設(shè)備。用于提供與上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的所述設(shè)備優(yōu)選地被配置為接收第一方向性麥克風(fēng)和第二方向性麥克風(fēng)的麥克風(fēng)信號(hào)作為雙聲道麥克風(fēng)信號(hào),以及基于所述雙聲道麥克風(fēng)信號(hào)來提供所述空間提示集合。用于提供雙聲道音頻信號(hào)的所述設(shè)備還包括雙聲道音頻信號(hào)提供器,雙聲道音頻信號(hào)提供器被配置為提供第一方向性麥克風(fēng)和第二方向性麥克風(fēng)的麥克風(fēng)信號(hào)或其處理后的版本,作為雙聲道音頻信號(hào)。根據(jù)本發(fā)明,該實(shí)施例基于以下發(fā)現(xiàn)如果相距較近的麥克風(fēng)的方向特性相對(duì)于彼此而旋轉(zhuǎn),則所述相距較近的麥克風(fēng)可以用于提供適當(dāng)?shù)目臻g提示信息。因此,已認(rèn)識(shí)到,能夠基于物理布置來計(jì)算與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合,這種方式的計(jì)算量較小。顯然,已發(fā)現(xiàn)如果提供雙聲道麥克風(fēng)信號(hào)的兩個(gè)麥克風(fēng)被布置為彼此相距較近(例如,彼此間相隔不超過30cm)并因而包括非常相似的散射聲信息,則通過較小的努力就可以提取分量能量信息和方向信息,所述分量能量信息和方向信息允許高效地計(jì)算空間提示信息。此外,已發(fā)現(xiàn),使用具有相對(duì)于彼此而旋轉(zhuǎn)的方向特性的方向性麥克風(fēng)使得可以計(jì)算分量能量信息和方向信息,這是因?yàn)椴煌姆较蛱匦允沟每梢詫⒅边_(dá)聲和散射聲分開。根據(jù)本發(fā)明的另一實(shí)施例提供了一種用于基于雙聲道麥克風(fēng)信號(hào)來提供處理后的雙聲道音頻信號(hào)以及與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的設(shè)備。用于提供處理后的雙聲道音頻信號(hào)的所述設(shè)備包括上述用于基于雙聲道麥克風(fēng)信號(hào)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的設(shè)備。用于提供處理后的雙聲道音頻信號(hào)和空間提示集合的所述設(shè)備還包括雙聲道音頻信號(hào)提供器,雙聲道音頻信號(hào)提供器被配置為基于雙聲道麥克風(fēng)信號(hào)來提供處理后的雙聲道音頻信號(hào)。雙聲道音頻信號(hào)提供器優(yōu)選地被配置為使用一個(gè)或多個(gè)第一麥克風(fēng)信號(hào)縮放因子來縮放雙聲道麥克風(fēng)信號(hào)的第一音頻信號(hào),以得到處理后的雙聲道音頻信號(hào)的第一處理后的音頻信號(hào)。雙聲道音頻信號(hào)提供器還優(yōu)選地被配置為使用一個(gè)或多個(gè)第二麥克風(fēng)信號(hào)縮放因子來縮放雙聲道麥克風(fēng)信號(hào)的第二音頻信號(hào),以得到處理后的雙聲道音頻信號(hào)的第二處理后的音頻信號(hào)。雙聲道音頻信號(hào)提供器優(yōu)選地被配置為基于用于提供空間提示集合的設(shè)備的信號(hào)分析器所提供的分量能量信息,來計(jì)算所述一個(gè)或多個(gè)第一麥克風(fēng)信號(hào)縮放因子和所述一個(gè)或多個(gè)第二麥克風(fēng)信號(hào)縮放因子,使得所述空間提示和所述麥克風(fēng)信號(hào)縮放因子都由分量能量信息來確定。該實(shí)施例基于以下思想對(duì)于空間提示集合的計(jì)算以及對(duì)于麥克風(fēng)信號(hào)的適當(dāng)縮放來說,使用由信號(hào)分析器提供的分量能量信息都是高效的,其中,麥克風(fēng)信號(hào)的適當(dāng)縮放可以引起麥克風(fēng)信號(hào)和空間提示的適配,使得既包括處理后的麥克風(fēng)信號(hào)又包括空間提示信息的組合信息符合期望的空間音頻編碼工業(yè)標(biāo)準(zhǔn)(例如,MPEG環(huán)繞),從而使得可以在傳統(tǒng)的空間音頻編碼解碼器(例如,傳統(tǒng)的MPEG環(huán)繞解碼器)上回放音頻內(nèi)容。本發(fā)明的另一實(shí)施例提供了一種基于雙聲道麥克風(fēng)信號(hào)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的方法。
根據(jù)本發(fā)明的另一實(shí)施例提供了一種用于執(zhí)行所述方法的計(jì)算機(jī)程序。
隨后參考附圖來描述根據(jù)本發(fā)明的實(shí)施例,附圖中圖1示出了根據(jù)本發(fā)明實(shí)施例的設(shè)備的示意框圖,該設(shè)備用于基于雙聲道麥克風(fēng)信號(hào)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合;圖2示出了根據(jù)本發(fā)明另一實(shí)施例的設(shè)備的示意框圖,該設(shè)備用于提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合;圖3示出了根據(jù)本發(fā)明另一實(shí)施例的設(shè)備的示意框圖,該設(shè)備用于提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合;圖4示出了可以在本發(fā)明的實(shí)施例中使用的兩個(gè)雙極麥克風(fēng)的方向響應(yīng)的圖形表不;圖如示出了根據(jù)雙極立體聲麥克風(fēng)的聲音到達(dá)方向的左右之間幅度比的圖形表示;圖恥示出了根據(jù)雙極立體聲麥克風(fēng)的聲音到達(dá)方向的總功率的圖形表示;圖6示出了可以在本發(fā)明的一些實(shí)施例中使用的兩個(gè)心形麥克風(fēng)(cardioid microphone)的方向響應(yīng)的圖形表示;圖7a示出了根據(jù)心形立體聲麥克風(fēng)的聲音到達(dá)方向的左右之間幅度比的圖形表示;圖7b示出了根據(jù)心形立體聲麥克風(fēng)的聲音到達(dá)方向的總功率的圖形表示;圖8示出了可以在本發(fā)明的一些實(shí)施例中使用的兩個(gè)超心形麥克風(fēng)的方向響應(yīng)的圖形表示;圖9a示出了根據(jù)超心形立體聲麥克風(fēng)的聲音到達(dá)方向的左右之間幅度比的圖形表不;圖9b示出了根據(jù)超心形立體聲麥克風(fēng)的聲音到達(dá)方向的總功率的圖形表示;圖IOa示出了根據(jù)心形立體聲麥克風(fēng)的聲音到達(dá)方向的增益修改的圖形表示;圖IOb示出了根據(jù)心形立體聲麥克風(fēng)的聲音到達(dá)方向的總功率的圖形表示(實(shí)線沒有增益修改;虛線有增益修改);圖Ila示出了根據(jù)超心形立體聲麥克風(fēng)的聲音到達(dá)方向的增益修改的圖形表示;圖lib示出了根據(jù)超心形立體聲麥克風(fēng)的聲音到達(dá)方向的總功率的圖形表示(實(shí)線沒有增益修改;虛線有增益修改);圖12示出了根據(jù)本發(fā)明另一實(shí)施例的設(shè)備的示意框圖,該設(shè)備用于提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合;圖13示出了將立體聲麥克風(fēng)信號(hào)轉(zhuǎn)換成SAC兼容下混頻和輔助信息的編碼器的示意框圖,并且還示出了相應(yīng)的(傳統(tǒng)的)SAC解碼器;圖14示出了將立體聲麥克風(fēng)信號(hào)轉(zhuǎn)換成SAC兼容空間輔助信息的編碼器的示意框圖,并且還示出了采用下混頻處理的相應(yīng)SAC解碼器的示意框圖;圖15示出了盲SAC解碼器的示意框圖,可以直接向該盲SAC解碼器饋送立體聲麥克風(fēng)信號(hào),其中,通過對(duì)立體麥克風(fēng)信號(hào)的分析處理,得到SAC下混頻和SAC空間輔助信息;以及圖16示出了根據(jù)本發(fā)明實(shí)施例的提供空間提示集合的方法的流程圖。
具體實(shí)施例方式圖1示出了設(shè)備100的示意框圖,設(shè)備100用于基于雙聲道麥克風(fēng)信號(hào)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合。設(shè)備100被配置為接收雙聲道麥克風(fēng)信號(hào),所述雙聲道麥克風(fēng)信號(hào)可以例如包括第一聲道信號(hào)110(還表示為X1)和第二聲道信號(hào)112(還表示為X2)。設(shè)備100還被配置為提供空間提示信息120。設(shè)備100包括信號(hào)分析器130,信號(hào)分析器130被配置為接收第一聲道信號(hào)110和第二聲道信號(hào)112。信號(hào)分析器130被配置為基于雙聲道麥克風(fēng)信號(hào),S卩,基于第一聲道信號(hào)110和第二聲道信號(hào)112,來獲得分量能量信息132和方向信息134。優(yōu)選地,信號(hào)分析器130被配置為獲得分量能量信息132和方向信息134,使得分量能量信息132描述對(duì)雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量的以及雙聲道麥克風(fēng)信號(hào)的散射聲分量的能量的估計(jì),并且使得方向信息134描述對(duì)雙聲道麥克風(fēng)信號(hào)110、112的直達(dá)聲分量所源自的方向的估計(jì)。設(shè)備100還包括空間輔助信息發(fā)生器140,所述空間輔助信息發(fā)生器140被配置為接收分量能量信息132和方向信息134,并且基于所述分量能量信息132和方向信息134 來提供空間提示信息120。優(yōu)選地,空間輔助信息發(fā)生器140被配置為將雙聲道麥克風(fēng)信號(hào) 110,112的分量能量信息132和雙聲道麥克風(fēng)信號(hào)110、112的方向信息134映射到空間提示信息120上。相應(yīng)地,獲得空間提示信息120,使得空間提示信息120描述與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合。因此,空間輔助信息120使得可以基于雙聲道麥克風(fēng)信號(hào),在計(jì)算量上非常高效地計(jì)算與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示信息。信號(hào)分析器130可以從雙聲道麥克風(fēng)信號(hào)中提取大量的信息,即,分量能量信息和方向信息,其中,分量能量信息描述了對(duì)直達(dá)聲分量的能量的估計(jì)和對(duì)散射聲分量的能量的估計(jì),以及方向信息描述了對(duì)雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量所源自的方向的估計(jì)。已發(fā)現(xiàn),信號(hào)分析器基于雙聲道信號(hào)110、112得到的該信息足以甚至針對(duì)具有多于兩個(gè)聲道的上混頻音頻信號(hào)來得到空間提示信息。重要的是,已發(fā)現(xiàn)分量能量信息132和方向信息134足以在實(shí)際上不使用上混頻音頻聲道作為中間量的情況下直接確定空間提示信息120。在下文中,參考圖2和3來描述設(shè)備100的一些擴(kuò)展。圖2示出了設(shè)備200的示意框圖,設(shè)備200用于提供雙聲道音頻信號(hào)以及與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合。設(shè)備200包括麥克風(fēng)布置210, 麥克風(fēng)布置210被配置為提供雙聲道麥克風(fēng)信號(hào),所述雙聲道麥克風(fēng)信號(hào)包括第一聲道信號(hào)212和第二聲道信號(hào)214。設(shè)備200還包括設(shè)備100,如參考圖1所描述的,設(shè)備100用于基于雙聲道麥克風(fēng)信號(hào)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合。設(shè)備100被配置為接收由麥克風(fēng)布置210提供的第一聲道信號(hào)212和第二聲道信號(hào)214作為其輸入信號(hào)。設(shè)備100還被配置為提供空間提示信息220,空間提示信息220可以與空間提示信息120相同。設(shè)備200還包括雙聲道音頻信號(hào)提供器230,所述雙聲道音頻信號(hào)提供器230被配置為接收由麥克風(fēng)布置210提供的第一聲道信號(hào)212和第二聲道信號(hào) 214,以及提供第一聲道信號(hào)212和第二聲道信號(hào)214或其處理后的版本,作為雙聲道音頻信號(hào)232。麥克風(fēng)布置210包括第一方向性麥克風(fēng)216和第二方向性麥克風(fēng)218。優(yōu)選地,第一方向性麥克風(fēng)216和第二方向性麥克風(fēng)218相隔不多于30厘米。相應(yīng)地,第一方向性麥克風(fēng)216和第二方向性麥克風(fēng)218接收到的信號(hào)有很強(qiáng)的相關(guān)性,已發(fā)現(xiàn)這對(duì)于信號(hào)分析器130對(duì)分量能量信息和方向信息的計(jì)算而言是有益的。然而,第一方向性麥克風(fēng)216和第二方向性麥克風(fēng)218被定向?yàn)槭沟玫诙较蛐喳溈孙L(fēng)218的方向特性219是第一方向性麥克風(fēng)216的方向特性217的旋轉(zhuǎn)版本。相應(yīng)地,第一聲道麥克風(fēng)信號(hào)212與第二聲道麥克風(fēng)信號(hào)214之間也有很強(qiáng)的相關(guān)性(由于麥克風(fēng)216、218在空間上接近),但是第一聲道麥克風(fēng)信號(hào)212和第二聲道麥克風(fēng)信號(hào)214不同(由于方向性麥克風(fēng)216、218的方向特性 217、219不同)。具體地,從近似恒定的方向入射到麥克風(fēng)布置210上的方向信號(hào)引起了第一聲道麥克風(fēng)信號(hào)212和第二聲道麥克風(fēng)信號(hào)214的強(qiáng)相關(guān)信號(hào)分量,所述強(qiáng)相關(guān)信號(hào)分量具有在時(shí)間上恒定的、與方向有關(guān)的幅度比(或強(qiáng)度比)。從時(shí)間上變化的方向入射到麥克風(fēng)陣列210上的環(huán)境音頻信號(hào)引起了第一聲道麥克風(fēng)信號(hào)212和第二聲道麥克風(fēng)信號(hào) 214的信號(hào)分量具有顯著的相關(guān)性,但是所述信號(hào)分量具有在時(shí)間上波動(dòng)的幅度比(或強(qiáng)度比)。相應(yīng)地,麥克風(fēng)布置210提供雙聲道麥克風(fēng)信號(hào)212、214,雙聲道麥克風(fēng)信號(hào)212、 214使得即使麥克風(fēng)216、218間距較小,設(shè)備100的信號(hào)分析器130也能夠區(qū)分直達(dá)聲和散射聲。因此,設(shè)備200構(gòu)成了音頻信號(hào)提供器,所述音頻信號(hào)提供器可以以空間上緊湊的形式來實(shí)現(xiàn),盡管如此,所述音頻信號(hào)提供器也能夠提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示??臻g音頻解碼器可以使用空間提示信息220以及所提供的雙聲道音頻信號(hào)232,來提供環(huán)繞聲輸出信號(hào)。圖3示出了設(shè)備300的示意框圖,設(shè)備300用于基于雙聲道麥克風(fēng)信號(hào)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合。設(shè)備300被配置為接收雙聲道麥克風(fēng)信號(hào),所述雙聲道麥克風(fēng)信號(hào)包括第一聲道信號(hào)312和第二聲道信號(hào)314。設(shè)備 300被配置為基于雙聲道麥克風(fēng)信號(hào)312、314來提供空間提示信息316。此外,設(shè)備300被配置為提供雙聲道麥克風(fēng)信號(hào)的處理后的版本,其中雙聲道麥克風(fēng)信號(hào)的處理后的版本包括第一聲道信號(hào)322和第二聲道信號(hào)324。設(shè)備300包括設(shè)備100,設(shè)備100用于基于雙聲道信號(hào)312、314來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合。在設(shè)備300中,設(shè)備100被配置為接收第一聲道信號(hào)312和第二聲道信號(hào)314作為其輸入信號(hào)110、112。此外,設(shè)備100所提供的空間提示信息120構(gòu)成了設(shè)備300的輸出信息316。此外,設(shè)備300包括雙聲道信號(hào)提供器340,雙聲道信號(hào)提供器340被配置為接收第一聲道信號(hào)312和第二聲道信號(hào)314。雙聲道信號(hào)提供器340還被配置為接收由設(shè)備100 的信號(hào)分析器130提供的分量能量信息342。雙聲道音頻信號(hào)提供器340還被配置為提供處理后的雙聲道音頻信號(hào)的第一聲道信號(hào)322和第二聲道信號(hào)324。優(yōu)選地,雙聲道音頻信號(hào)提供器包括縮放器350,縮放器350被配置為接收雙聲道麥克風(fēng)信號(hào)的第一聲道信號(hào)312,并縮放第一聲道信號(hào)312或第一聲道信號(hào)312的各個(gè)單獨(dú)的時(shí)間/頻率段,以得到處理后的雙聲道音頻信號(hào)的第一聲道信號(hào)322。縮放器350還被配置為接收雙聲道麥克風(fēng)信號(hào)的第二聲道信號(hào)314,并縮放第二聲道信號(hào)314或第二聲道信號(hào)314的各個(gè)單獨(dú)的時(shí)間/頻率段,以得到處理后的雙聲道音頻信號(hào)的第二聲道信號(hào)324。
12
雙聲道信號(hào)提供器340還包括縮放因子計(jì)算器360,縮放因子計(jì)算器360被配置為基于分量能量信息342來計(jì)算縮放器350所使用的縮放因子。相應(yīng)地,對(duì)雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量以及雙聲道麥克風(fēng)信號(hào)的散射聲分量的能量估計(jì)加以描述的分量能量信息342確定了對(duì)雙聲道麥克風(fēng)信號(hào)的第一聲道信號(hào)312和第二聲道信號(hào)314的縮放,所述縮放用于從雙聲道麥克風(fēng)信號(hào)得到處理后的雙聲道音頻信號(hào)的第一聲道信號(hào)322和第二聲道信號(hào)324。相應(yīng)地,使用相同的分量能量信息來確定對(duì)雙聲道麥克風(fēng)信號(hào)的第一聲道信號(hào)312和第二聲道信號(hào)314的縮放,空間提示信息120也是如此。還發(fā)現(xiàn),對(duì)分量能量信息342的雙重使用是一種在計(jì)算量上非常高效的解決方案,并且確保了處理后的雙聲道音頻信號(hào)與空間提示信息之間的良好一致性。相應(yīng)地,能夠產(chǎn)生處理后的雙聲道音頻信號(hào)以及空間提示信息,使得所述處理后的雙聲道音頻信號(hào)以及空間提示信息允許使用標(biāo)準(zhǔn)化的環(huán)繞解碼器來對(duì)雙聲道麥克風(fēng)信號(hào)312、314所表示的音頻內(nèi)容進(jìn)行環(huán)繞回放。魏OT—立僻立僻耗RX仔搬綠麵合性在本部分中,在對(duì)于通過后處理來產(chǎn)生環(huán)繞聲信號(hào)的適合性方面,討論了多種雙聲道麥克風(fēng)配置。下一部分將這些認(rèn)識(shí)應(yīng)用于空間音頻編碼(SAC)與立體聲麥克風(fēng)的一起使用。本文所描述的麥克風(fēng)配置可以例如用于得到雙聲道麥克風(fēng)信號(hào)110、112或雙聲道麥克風(fēng)信號(hào)212、214或雙聲道麥克風(fēng)信號(hào)312、314。本文描述的麥克風(fēng)配置可以用在麥克風(fēng)布置210中。由于“第一波前定律”,人類的聲源定位很大程度上取決于直達(dá)聲,(J.Blauert, Spatial Hearing :The Psychophysics of Human Sound Localization, revised ed. Cambridge, Massachusetts, USA :The MIT Press, 1997),因此本部分中的分析是針對(duì)在自由場(沒有反射)中在麥克風(fēng)處從特定角度α到達(dá)的單個(gè)直接遠(yuǎn)場聲來執(zhí)行的。在不丟失一般性的前提下,為了簡單起見,假定麥克風(fēng)是一致的,即,兩個(gè)麥克風(fēng)碳精盒(例如, 方向性麥克風(fēng)216、218)位于同一點(diǎn)處。在這些假定下,左側(cè)麥克風(fēng)信號(hào)和右側(cè)麥克風(fēng)信號(hào)可以被寫作X1 (n) = T1 ( α ) s (η)χ2 (η) = r2 ( α ) s (η), (1)其中,η是離散時(shí)間索引,s(n)對(duì)應(yīng)于麥克風(fēng)位置處的聲壓,^ ( α )是左側(cè)麥克風(fēng)對(duì)于從角度α到達(dá)的聲音的方向響應(yīng),r2(a)是右側(cè)麥克風(fēng)的對(duì)應(yīng)響應(yīng)。左側(cè)麥克風(fēng)與右側(cè)麥克風(fēng)之間的信號(hào)幅度比是
權(quán)利要求
1.一種用于基于雙聲道麥克風(fēng)信號(hào)Oc1U), )(2(t))來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合(ICLD^,ICCllsICLDees, ICCees, ICLD1, ICLD2)的設(shè)備 (100 ;200 ;300 ; 1200 ; 1300 ; 1400 ; 1500),所述設(shè)備包括信號(hào)分析器(130;1212;1312;1410;1510),被配置為基于雙聲道麥克風(fēng)信號(hào)(X1U), X2 (t))來獲得分量能量信息(E{SS*}, E{NN*})和方向信息(a, α ),使得分量能量信息 (E{SS*}, Ε{ΝΝ*})描述對(duì)雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量( 和雙聲道麥克風(fēng)信號(hào)的散射聲分量(N)的能量的估計(jì),以及使得方向信息(a,α )描述對(duì)雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量⑶所源自的方向的估計(jì);以及空間輔助信息發(fā)生器(140 ;1216 ;1312 ;1410 ;1510),被配置為將雙聲道麥克風(fēng)信號(hào)的分量能量信息(E{SS*},Ε{ΝΝ*})和雙聲道麥克風(fēng)信號(hào)的方向信息(a,α)映射到空間提示信息上,所述空間提示信息描述與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示皇A朱口 ο
2.根據(jù)權(quán)利要求1所述的設(shè)備(100;200 ;300 ;1200 ; 1300 ; 1400 ; 1500),其中,空間輔助信息發(fā)生器(140 ;1216 ;1312 ;1410 ;1510)被配置為將雙聲道麥克風(fēng)信號(hào)(X1 (t),X2(t)) 的分量能量信息(E{SS*},E{NN*})和雙聲道麥克風(fēng)信號(hào)(Χ^υ,^α))的方向信息(a, α) 直接映射到空間提示信息上,所述空間提示信息描述與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合。
3.根據(jù)權(quán)利要求1或2所述的設(shè)備(100;200 ;300 ; 1200 ; 1300 ; 1400 ; 1500),其中,空間輔助信息發(fā)生器(140 ;1216 ;1312 ;1410 ;1510)被配置為將雙聲道麥克風(fēng)信號(hào)(X1U), X2(t))的分量能量信息(E{SS*}, E{NN*})和雙聲道麥克風(fēng)信號(hào)(X1U), X2(t))的方向信息 (a, α)映射到空間提示信息(ICLDll, I CClls I CLDkks,ICLD1, ICLD2)上,而實(shí)際上不使用上混頻音頻聲道作為中間量,所述空間提示信息(ICLDll,ICClls ICLDees, ICLD1, ICLD2)描述與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合。
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的設(shè)備(100;200 ;300 ;1200 ; 1300 ; 1400 ; 1500), 其中,空間輔助信息發(fā)生器(140 ;1216 ;1312 ;1410 ;1510)被配置為將方向信息(a, α )映射到增益因子集合(gl, g2,g3,g4,g5)上,所述增益因子集合(gl, g2,g3,g4,g5)描述與方向有關(guān)的直達(dá)聲到環(huán)繞音頻聲道的映射;空間輔助信息發(fā)生器還被配置為基于分量能量信息(E{SS*},E{Nr})和增益因子(gl, g2,g3,g4,g5)來得到對(duì)多于兩個(gè)的環(huán)繞聲道(L,R,C,Ls, Rs)的估計(jì)強(qiáng)度加以描述的聲道強(qiáng)度估計(jì)(Pl,PK,Pc,PLs,PJ ;以及空間輔助信息發(fā)生器被配置為基于聲道強(qiáng)度估計(jì)(K,Pe, Pe,PLs, PJ來確定與上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示(ICU\ls,ICCllsICLDees, ICLD1, ICLD2)。
5.根據(jù)權(quán)利要求4所述的設(shè)備(100;200 ;300 ;1200 ; 1300 ; 1400 ; 1500),其中,空間輔助信息發(fā)生器(140;1216;1312;1410;1510)還被配置為基于分量能量信息(E{SS*}, E{NN*})和增益因子(gl,g2,g4,g5)來得到聲道相關(guān)性信息(P&,PkiJ,所述聲道相關(guān)性信息 (PLLs, Pees)描述上混頻信號(hào)的不同聲道(L,Ls, R,Rs)之間的相關(guān)性;以及空間輔助信息發(fā)生器還被配置為基于一個(gè)或多個(gè)聲道強(qiáng)度估計(jì)(&,Py PK,PJ以及聲道相關(guān)性信息(Plls,PkJ來確定與上混頻信號(hào)相關(guān)聯(lián)的空間提示(ICC^s,ICCmJ。
6.根據(jù)權(quán)利要求4或5所述的設(shè)備(100;200 ;300 ;1200 ; 1300 ; 1400 ; 1500),其中,空間輔助信息發(fā)生器(140 ;1216 ;1312 ;1410 ;1510)被配置為對(duì)雙聲道麥克風(fēng)信號(hào)(X1U), X2 (t))的直達(dá)聲分量(S)的強(qiáng)度的估計(jì)(E{SSl)與雙聲道麥克風(fēng)信號(hào)的散射聲分量(N)的強(qiáng)度的估計(jì)(Ε{ΝΝ*})進(jìn)行線性組合,以得到聲道強(qiáng)度估計(jì)(P。PE, Pc, PLs, Pj,以及空間輔助信息發(fā)生器被配置為根據(jù)增益因子(gl,...,g5)以及根據(jù)方向信息(a,α) 來對(duì)直達(dá)聲分量的強(qiáng)度的估計(jì)(E{SS*})進(jìn)行加權(quán)。
7.根據(jù)權(quán)利要求4至6中任一項(xiàng)所述的設(shè)備(100;200 ;300 ;1200 ; 1300 ; 1400 ; 1500), 其中,空間輔助信息發(fā)生器(140 ;1216 ;1312 ;1410 ;1510)被配置為根據(jù)Pi丨+時(shí)五丨胃*丨來得到上混頻音頻信號(hào)的左前環(huán)繞聲道的估計(jì)功率譜值1\,根據(jù)尺=g22/(a)4s^i+A224vATj來得到上混頻音頻信號(hào)的右前環(huán)繞聲道的估計(jì)功率譜值IV根據(jù)Pe =來得到上混頻音頻信號(hào)的中心環(huán)繞聲道的估計(jì)功率譜值&,根據(jù)4=仏2/( )4^1+^2五i^VATj來得到上混頻音頻信號(hào)的左后環(huán)繞聲道的估計(jì)功率譜值Py率譜值Plis,并且其中,空間輔助信息發(fā)生器還被配置為使用估計(jì)功率譜值來計(jì)算多個(gè)不同的聲道間聲級(jí)差 (ICLDlls, ICLDees, ICLD1, ICLD2),其中,gl、g2, g3、g4、g5是對(duì)與方向有關(guān)的直達(dá)聲到環(huán)繞音頻聲道的映射加以描述的增益因子,f(a)是與方向有關(guān)的幅度校正因子,E{SS*}是對(duì)雙聲道麥克風(fēng)信號(hào)( , )的直達(dá)聲分量(S)的能量的估計(jì)加以描述的分量言旨量信息,E{NN*}是對(duì)雙聲道麥克風(fēng)信號(hào)( , )的散射聲分量(N)的能量的估計(jì)加以描述的分量能量信息,以及Iiptvhyhph5是對(duì)散射聲到環(huán)繞音頻聲道的映射加以描述的散射聲分布因子。
8.根據(jù)權(quán)利要求4至7中任一項(xiàng)所述的設(shè)備(100;200 ;300 ;1200 ; 1300 ; 1400 ; 1500), 其中,空間輔助信息發(fā)生器(140 ;1216 ;1312 ;1410 ;1510)被配置為根據(jù)P^ = glg4f(a)E{SS*}來得到在上混頻音頻信號(hào)的左前環(huán)繞聲道與左后環(huán)繞聲道之間的估計(jì)互相關(guān)譜值P&,根據(jù)Pkks =來得到在右前環(huán)繞聲道與右后環(huán)繞聲道之間的估計(jì)互相關(guān)譜值Pkks,以及將所述估計(jì)互相關(guān)譜值與上混頻音頻信號(hào)的環(huán)繞聲道的估計(jì)功率譜值(P。PLs, Pe, Pes) 相組合,以得到聲道間相干性提示(ICC^sICCkks),其中,gl、&、&、g5是對(duì)與方向有關(guān)的直達(dá)聲到環(huán)繞音頻聲道的映射加以描述的增益因子,f(a)是與方向有關(guān)的幅度校正因子,E{SS*}是對(duì)雙聲道麥克風(fēng)信號(hào)( , )的直達(dá)聲分量(S)的能量的估計(jì)加以描述的分量言旨量信息,E{NN*}是對(duì)雙聲道麥克風(fēng)信號(hào)(( , )的散射聲分量(N)的能量的估計(jì)加以描述的分量言旨量信息。
9.根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的設(shè)備(100;200 ;300 ; 1200 ; 1300 ; 1400 ; 1500), 其中,信號(hào)分析器(130 ;1212 ;1312 ;1410 ;1510)被配置為對(duì)描述以下關(guān)系的方程組求解(1)雙聲道麥克風(fēng)信號(hào)的第一聲道麥克風(fēng)信號(hào)(X1)的估計(jì)能量(E(X1)C1I)、雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量( 的估計(jì)能量(E{SS*})、以及雙聲道麥克風(fēng)信號(hào)的散射聲分量(N) 的估計(jì)能量(Ε{ΝΝ*})之間的關(guān)系,(2)雙聲道麥克風(fēng)信號(hào)的第二聲道麥克風(fēng)信號(hào)(X2)的估計(jì)能量(Ε{Χ2Χ/})、雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量( 的估計(jì)能量(E{SS*})、以及雙聲道麥克風(fēng)信號(hào)的散射聲分量(N) 的估計(jì)能量(Ε{ΝΝ*})之間的關(guān)系,(3)第一聲道麥克風(fēng)信號(hào)(X1)和第二聲道麥克風(fēng)信號(hào)(X2)的估計(jì)互相關(guān)值(EiX1X2I)、 雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量(S)的估計(jì)能量(E{SS*})、以及雙聲道麥克風(fēng)信號(hào)的散射聲分量(N)的估計(jì)能量(Ε{ΝΝ*})之間的關(guān)系,考慮以下假設(shè)散射聲分量(N)的能量(E{NNl)在第一聲道麥克風(fēng)信號(hào)(X1)和第二聲道麥克風(fēng)信號(hào) (X2)中相同,在第一麥克風(fēng)信號(hào)(X1)和第二麥克風(fēng)信號(hào)OQ中的直達(dá)聲分量(S)的能量(E{SS*}, a2E{SS*})的比值與方向有關(guān),以及第一麥克風(fēng)信號(hào)(X1)和第二麥克風(fēng)信號(hào)OQ中的散射聲分量(N1, N2)之間的歸一化互相關(guān)系數(shù)(Φ)采用小于1的恒定值,所述恒定值取決于提供第一麥克風(fēng)信號(hào)(X1)和第二麥克風(fēng)信號(hào)OQ的麥克風(fēng)的方向特性。
10.一種用于提供雙聲道音頻信號(hào)(Y, J2)以及與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合(ICLDlls, ICCllsICLDees, ICCees, ICLD1, ICLD2)的設(shè)備(200),所述設(shè)備包括麥克風(fēng)布置(210)包括第一方向性麥克風(fēng)(216)和第二方向性麥克風(fēng)018),其中,第一方向性麥克風(fēng)和第二方向性麥克風(fēng)相隔不大于30cm,第一方向性麥克風(fēng)和第二方向性麥克風(fēng)被定向?yàn)槭沟玫诙较蛐喳溈孙L(fēng)的方向特性是第一方向性麥克風(fēng)的方向特性的旋轉(zhuǎn)版本;以及根據(jù)權(quán)利要求1至9中任一項(xiàng)所述的用于基于雙聲道麥克風(fēng)信號(hào)(X1, X2)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合(ICU\ls,ICCllsICLDees, ICCees, ICLD1, ICLD2)的設(shè)備(100),其中用于提供與上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的所述設(shè)備(100)被配置為 接收第一方向性麥克風(fēng)和第二方向性麥克風(fēng)的麥克風(fēng)信號(hào)(X1, X2)作為雙聲道麥克風(fēng)信號(hào),以及基于接收到的麥克風(fēng)信號(hào)(X1, X2)來提供所述空間提示集合;以及雙聲道音頻信號(hào)提供器O30 ;340 ;1214 ;1314)被配置為提供第一方向性麥克風(fēng)和第二方向性麥克風(fēng)的麥克風(fēng)信號(hào)(χι,χ2)或其處理后的版本,作為雙聲道音頻信號(hào)。
11.一種用于基于雙聲道麥克風(fēng)信號(hào)(X1, X2)來提供處理后的雙聲道音頻信號(hào)以及與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合(ICU\ls,ICCllsICLDees, ICCees, ICLD1, ICLD2)的設(shè)備(300),所述設(shè)備包括根據(jù)權(quán)利要求1至9中任一項(xiàng)所述的用于基于雙聲道麥克風(fēng)信號(hào)(X1, X2)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合(ICU\ls,ICCllsICLDees, ICCees, ICLD1, ICLD2)的設(shè)備(100);以及雙聲道音頻信號(hào)提供器O30 ;340 ;1214 ;1314)被配置為基于雙聲道麥克風(fēng)信號(hào)(X1, X2)來提供處理后的雙聲道音頻信號(hào),其中,雙聲道音頻信號(hào)提供器被配置為使用一個(gè)或多個(gè)第一麥克風(fēng)信號(hào)縮放因子(H1) 來縮放雙聲道麥克風(fēng)信號(hào)的第一音頻信號(hào)(X1),以得到處理后的雙聲道音頻信號(hào)的第一處理后的音頻信號(hào)(只),雙聲道音頻信號(hào)提供器還被配置為使用一個(gè)或多個(gè)第二麥克風(fēng)信號(hào)縮放因子(H2)來縮放雙聲道麥克風(fēng)信號(hào)的第二音頻信號(hào)(X2),以得到處理后的雙聲道音頻信號(hào)的第二處理后的音頻信號(hào)(只),雙聲道音頻信號(hào)提供器被配置為基于用于提供空間提示集合的設(shè)備的信號(hào)分析器所提供的分量能量信息(E{SS*},E {NN*}),來計(jì)算所述一個(gè)或多個(gè)第一麥克風(fēng)信號(hào)縮放因子 (H1)和所述一個(gè)或多個(gè)第二麥克風(fēng)信號(hào)縮放因子(H2),使得所述空間提示和所述麥克風(fēng)信號(hào)縮放因子(H1,H2)都由分量能量信息來確定。
12.一種基于雙聲道麥克風(fēng)信號(hào)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的方法(1600),所述方法包括基于雙聲道麥克風(fēng)信號(hào)來獲得(1610)分量能量信息和方向信息,使得分量能量信息描述對(duì)雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量和雙聲道麥克風(fēng)信號(hào)的散射聲分量的能量的估計(jì), 以及使得方向信息描述對(duì)雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量所源自的方向的估計(jì);以及將雙聲道麥克風(fēng)信號(hào)的分量能量信息和雙聲道麥克風(fēng)信號(hào)的方向信息映射(1620)到空間提示信息上,所述空間提示信息描述與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示。
13.一種計(jì)算機(jī)程序,用于當(dāng)所述計(jì)算機(jī)程序運(yùn)行在計(jì)算機(jī)上時(shí),執(zhí)行根據(jù)權(quán)利要求 12所述的方法。
全文摘要
一種用于基于雙聲道麥克風(fēng)信號(hào)來提供與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合的設(shè)備包括信號(hào)分析器和空間輔助信息發(fā)生器。信號(hào)分析器被配置為基于雙聲道麥克風(fēng)信號(hào)來獲得分量能量信息和方向信息,使得分量能量信息描述對(duì)雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量和雙聲道麥克風(fēng)信號(hào)的散射聲分量的能量的估計(jì),以及使得方向信息描述對(duì)雙聲道麥克風(fēng)信號(hào)的直達(dá)聲分量所源自的方向的估計(jì)??臻g輔助信息發(fā)生器被配置為將分量能量信息和方向信息映射到空間提示信息上,所述空間提示信息描述與具有多于兩個(gè)聲道的上混頻音頻信號(hào)相關(guān)聯(lián)的空間提示集合。
文檔編號(hào)H04S3/00GK102209988SQ200980145087
公開日2011年10月5日 申請(qǐng)日期2009年9月4日 優(yōu)先權(quán)日2008年9月11日
發(fā)明者克里斯托弗·弗勒 申請(qǐng)人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)