音頻源位置估計(jì)的制作方法
【專利摘要】一種用于確定針對音頻源的位置估計(jì)的裝置包括兩個話筒(M1,M2)和聲學(xué)元件(203),所述聲學(xué)元件(203)將聲學(xué)效應(yīng)提供給從聲源位置到第一話筒(M1)的聲音。聲學(xué)效應(yīng)相對于話筒(M1,M2)之間的軸(201)是不對稱的。位置電路(305)響應(yīng)于在話筒(M1,M2)處的到達(dá)時間來估計(jì)針對聲源的在軸的不同側(cè)的兩個可能的位置。估計(jì)器(307)確定指示第一話筒信號的聲學(xué)效應(yīng)和對于在軸(201)一側(cè)的聲源的聲學(xué)效應(yīng)的預(yù)期特性相匹配的程度的聲學(xué)效應(yīng)量度。另一電路(309)響應(yīng)于聲學(xué)效應(yīng)量度通過在兩個可能的位置之間進(jìn)行選擇來確定位置估計(jì)。方法可以基于在兩個話筒處的到達(dá)時間來解析與位置確定相關(guān)聯(lián)的位置確定中的不定性。
【專利說明】音頻源位置估計(jì)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及針對音頻源的位置確定,并且特別地但不排他地,涉及基于針對信號的在兩個話筒處的到達(dá)時間差的位置估計(jì)。
【背景技術(shù)】
[0002]在許多應(yīng)用中,音頻源的位置的知識是有益的并且可以例如被用來優(yōu)化從音頻源捕獲的音頻的信號處理。例如,針對免提通信和電話會議應(yīng)用的信號處理可以取決于聲源的特定位置以及典型地僅僅角方向而被優(yōu)化。因此,許多音頻處理系統(tǒng)包括允許聲源的(例如角)位置被檢測和跟蹤的音頻跟蹤系統(tǒng)。
[0003]用于確定音頻源的位置的一個方法使用話筒陣列,其中話筒信號之間的相對差異被分析以便估計(jì)源的位置。使用話筒陣列的常見定位方法是主要基于計(jì)算在話筒中的每一個上的聲波的到達(dá)時間差的。
[0004]使用緊密相間的話筒的其它定位方法是基于構(gòu)建一階差分響應(yīng)的,其通過組合兩個話筒信號并且使用優(yōu)化準(zhǔn)則在聲源的方向上指向空來實(shí)現(xiàn)。
[0005]使用三個話筒,聲源相對于陣列的位置能夠基于到達(dá)時間以及實(shí)際上基于到達(dá)時間中的差在360度(水平)方位角平面中被確定。然而,為了降低所關(guān)聯(lián)的處理的成本和復(fù)雜性,期望盡可能地降低話筒的數(shù)目,并且因此期望使用僅兩個話筒來執(zhí)行位置確定。
[0006]采用兩個話筒,適 當(dāng)?shù)牡竭_(dá)時間計(jì)算可以允許特定位置的確定,即典型地在水平平面中的位置確定。然而,這樣的計(jì)算要求來自音頻源的傳輸?shù)臅r間為已知的,并且因此典型地要求音頻源與位置確定電路同步。這典型地是高度不切實(shí)際的,并且因此位置確定是典型地基于在話筒之間的到達(dá)時間測量結(jié)果的差的。對于兩話筒實(shí)施方案,這意味著僅角方向能夠典型地在到聲源的距離不是已知的情況下被確定。然而,對于許多應(yīng)用來說,這樣的角位置確定是高度有利的并且實(shí)際上對于許多應(yīng)用來說是足夠的。
[0007]然而,兩話筒設(shè)置的另一問題是它像圖1中所圖示的那樣圍繞互連兩個話筒的軸是完全對稱的。在該例子中,兩個話筒Ml和M2被用來基于兩個話筒Ml和M2之間的時間差來確定對于聲源S的角方向A。
[0008]因此,系統(tǒng)確定針對話筒Ml和M2的波前(wavefronts)之間的到達(dá)時間差。如果源位于遠(yuǎn)場中,則聲波能夠被假定成是平面的并且與彼此平行。使用三角學(xué),角度按下式與到達(dá)時間差(TDOA) t (以秒為單位)相關(guān):
【權(quán)利要求】
1.一種用于確定針對音頻源的位置估計(jì)的裝置,所述裝置包括: 用于生成第一話筒信號的第一話筒(Ml); 用于生成第二話筒信號的第二話筒(M2); 聲學(xué)兀件(203),其將聲學(xué)效應(yīng)提供給從聲源位置到第一話筒的聲音,聲學(xué)效應(yīng)相對于第一話筒與第二話筒之間的軸(201)是不對稱的; 位置處理器,其包 括: -第一位置電路(305),其用于響應(yīng)于針對來自聲源的音頻的在第一話筒和第二話筒處的到達(dá)時間來估計(jì)針對聲源的第一可能的位置和第二可能的位置,第一可能的位置是在軸(201)的一側(cè)的第一區(qū)域中的位置并且第二可能的位置是在軸(201)的相對側(cè)的第二區(qū)域中的位置; -估計(jì)器(307),其用于確定針對第一話筒信號的第一聲學(xué)效應(yīng)量度,第一聲學(xué)效應(yīng)量度指示第一話筒信號的聲學(xué)效應(yīng)和對于第一區(qū)域中的聲源的聲學(xué)效應(yīng)的預(yù)期特性相匹配的程度; -第二位置電路(309),其用于響應(yīng)于第一聲學(xué)效應(yīng)量度通過在第一可能的位置與第二可能的位置之間進(jìn)行選擇來確定針對聲源的位置估計(jì)。
2.根據(jù)權(quán)利要求1所述的裝置,其中第一聲學(xué)效應(yīng)量度相對于第一話筒信號的聲學(xué)效應(yīng)和對于第二區(qū)域中的聲源的聲學(xué)效應(yīng)的預(yù)期特性相匹配的程度來指示第一話筒信號的聲學(xué)效應(yīng)和聲學(xué)兀件(203)對于第一區(qū)域中的聲源的預(yù)期聲學(xué)效應(yīng)相匹配的程度。
3.根據(jù)權(quán)利要求1所述的裝置,其中聲學(xué)效應(yīng)相對于軸(201)是不對稱地頻率相關(guān)的,并且估計(jì)器(307)被布置成響應(yīng)于第一信號的頻率響應(yīng)與對于第一區(qū)域中的聲源的預(yù)期頻率響應(yīng)之間的相關(guān)程度的確定來生成第一聲學(xué)效應(yīng)量度。
4.根據(jù)權(quán)利要求1所述的裝置,其中聲學(xué)效應(yīng)是不對稱地頻率相關(guān)的;并且其中估計(jì)器(307)包括濾波器以用于對第一話筒信號進(jìn)行濾波以便生成第一濾波的話筒信號,并且被布置成響應(yīng)于第一濾波的話筒信號來確定第一聲學(xué)效應(yīng)量度。
5.根據(jù)權(quán)利要求1所述的裝置,其中聲學(xué)元件(203)被布置成使第一話筒從第一區(qū)域中的聲源接收反射,但不從第二區(qū)域中的聲源接收反射。
6.根據(jù)權(quán)利要求5所述的裝置,其中預(yù)期特性是由來自第一區(qū)域中的聲源的直接聲分量與反射聲分量之間的干涉產(chǎn)生的干涉效應(yīng)。
7.根據(jù)權(quán)利要求6所述的裝置,其中預(yù)期特性是干涉頻率響應(yīng)。
8.根據(jù)權(quán)利要求1所述的裝置,其中聲學(xué)元件(203)僅存在于軸(201)的一側(cè)。
9.根據(jù)權(quán)利要求1所述的裝置,其中估計(jì)器(307)被布置成響應(yīng)于第一話筒信號與第二話筒信號的比較來確定第一聲學(xué)效應(yīng)量度。
10.根據(jù)權(quán)利要求1所述的裝置,進(jìn)一步包括: 第二聲學(xué)元件(1003),其為從聲源位置到第二話筒的聲音提供第二聲學(xué)效應(yīng),第二聲學(xué)效應(yīng)相對于軸(201)是不對稱的;并且其中位置處理器包括: -第二估計(jì)器,其用于確定針對第二話筒信號的第二聲學(xué)效應(yīng)量度,第二聲學(xué)效應(yīng)量度指示第二話筒信號的聲學(xué)效應(yīng)和對于第二區(qū)域中的聲源的聲學(xué)效應(yīng)的預(yù)期特性相匹配的程度;并且其中 -第二位置電路(309)被布置成響應(yīng)于第二聲學(xué)效應(yīng)量度通過進(jìn)一步在第一可能的位置與第二可能的位置之間進(jìn)行選擇來確定針對聲源的位置估計(jì)。
11.根據(jù)權(quán)利要求10所述的裝置,其中第二位置電路(309)被布置成如果第一聲學(xué)效應(yīng)量度超過第二聲學(xué)效應(yīng)量度則選擇第一可能的位置,并且被布置成如果第二聲學(xué)效應(yīng)量度超過第一聲學(xué)效應(yīng)量度則選擇第二可能的位置。
12.根據(jù)權(quán)利要求1所述的裝置,其中聲學(xué)元件(203)的最近點(diǎn)被定位離第一話筒(Ml)不超過10 cm。
13.根據(jù)權(quán)利要求1所述的裝置,其中第一話筒(Ml)與第二話筒(M2)之間的距離不少于I cm并且不超過50 cm。
14.一種用于根據(jù)來自第一話筒(Ml)的第一話筒信號和來自第二話筒(M2)的第二話筒信號確定針對音頻環(huán)境中的音頻源的位置估計(jì)的裝置,所述音頻環(huán)境包括將聲學(xué)效應(yīng)提供給從聲源位置到第一話筒(Ml)的聲音的聲學(xué)元件(203),聲學(xué)效應(yīng)相對于第一話筒(Ml)與第二話筒(M2)之間的軸(201)是不對稱的;所述裝置包括: 用于接收第一話筒信號的第一接收機(jī); 用于接收第二話筒信號的第二接收機(jī); 第一位置電路(305),其用于響應(yīng)于針對來自聲源的音頻的在第一話筒(Ml)和第二話筒(M2)處的到達(dá)時間來估計(jì)針對聲源的第一可能的位置和第二可能的位置,第一可能的位置是在軸(201)的一側(cè)的第一區(qū)域中的位置并且第二可能的位置是在軸(201)的相對側(cè)的第二區(qū)域中的位置; 估計(jì)器(307),其用于確定針對第一話筒信號的聲學(xué)效應(yīng)量度,聲學(xué)效應(yīng)量度指示第一話筒信號的聲學(xué)效應(yīng)和對于第一區(qū)域中的聲源的聲學(xué)效應(yīng)的預(yù)期特性相匹配的程度; 第二位置電路(309),其用于響應(yīng)于聲學(xué)效應(yīng)量度通過在第一可能的位置與第二可能的位置之間進(jìn)行選擇來確定針對聲源的位置估計(jì)。
15.—種用于根據(jù)來自第一話筒(Ml)的第一話筒信號和來自第二話筒(M2)的第二話筒信號確定針對音頻環(huán)境中的音頻源的位置估計(jì)的方法,所述音頻環(huán)境包括將聲學(xué)效應(yīng)提供給從聲源位置到第一話筒(Ml)的聲音的聲學(xué)元件(203),聲學(xué)效應(yīng)相對于第一話筒(Ml)與第二話筒(M2)之間的軸(201)是不對稱的;所述方法包括: 接收第一話筒信號; 接收第二話筒信號; 響應(yīng)于針對來自聲源的音頻的在第一話筒(Ml)和第二話筒(M2)處的到達(dá)時間來估計(jì)針對聲源的第一可能的位置和第二可能的位置,第一可能的位置是在軸(201)的一側(cè)的第一區(qū)域中的位置并且第二可能的位置是在軸(201)的相對側(cè)的第二區(qū)域中的位置; 確定針對第一話筒信號的聲學(xué)效應(yīng)量度,聲學(xué)效應(yīng)量度指示第一話筒信號的聲學(xué)效應(yīng)和對于第一區(qū)域中的聲源的聲學(xué)效應(yīng)的預(yù)期特性相匹配的程度;以及 響應(yīng)于第一聲學(xué)效應(yīng)量度通過在第一可能的位置與第二可能的位置之間進(jìn)行選擇來確定針對聲源的位置估計(jì)。
【文檔編號】G10K11/20GK104041075SQ201380005646
【公開日】2014年9月10日 申請日期:2013年1月8日 優(yōu)先權(quán)日:2012年1月17日
【發(fā)明者】P.科奇奇安, O.奧維特杰斯 申請人:皇家飛利浦有限公司