一種srp-phat多源空間定位方法

文檔序號：6235796閱讀：1864來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>測量裝置的制造及其應(yīng)用技術(shù)

一種srp-phat多源空間定位方法
【專利摘要】本發(fā)明所述一種SRP-PHAT多源空間定位方法，首先假設(shè)在數(shù)據(jù)獲得過程中均勻圓形麥克風(fēng)陣列的全部麥克風(fēng)的數(shù)目和空間位置不變，各向同性的麥克風(fēng)均勻分布在一個半徑為r的位于x-y平面的圓周上，采用極坐標(biāo)來表示平面波s的到達(dá)方向，坐標(biāo)系的原點位于圓形陣列的圓心位置上，多聲源信號劃分為互不重疊的時頻點集合，使每個時頻窗內(nèi)只包含一個活動的源信號，滿足弱的W分離正交條件；并選取漢明窗，通過SRP-PHAT算法計算可控響應(yīng)功率函數(shù)和得到目標(biāo)函數(shù)，控制波束在所有可能的接收方向進(jìn)行掃描，則波束輸出功率最大的方向值即得到聲源的方向，其使得多聲源的DOA估計在強(qiáng)噪聲和適度混響的聲學(xué)環(huán)境下具有較好的分離性能，明顯突出了真正峰值，具有較高的定位精度。
【專利說明】-種SRP-PHAT多源空間定位方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種空間定位方法，具體地說，涉及一種SRP-PHAT多源空間定位方法，應(yīng)用于視頻會議、語音增強(qiáng)、助聽器、免提電話和智能機(jī)器人等系統(tǒng)中。

【背景技術(shù)】
[0002] 聲源定位技術(shù)在視頻會議、語音增強(qiáng)、助聽器、免提電話和智能機(jī)器人等系統(tǒng)中具有廣泛的應(yīng)用前景，近年來受到了越來越多的關(guān)注。
[0003] 目前相位變換加權(quán)的可控響應(yīng)功率（SRP-PHAT :Steered Response Power-Phase Transform)聲源定位算法已成為主流算法，該算法結(jié)合了可控波束形成和GCC-PHAT的優(yōu) 點，在低信噪比條件下具有較強(qiáng)的魯棒性。對于單聲源定位有較好的性能，但最大的缺點是運(yùn)算量大，龐大的運(yùn)算量限制了在實時系統(tǒng)中的應(yīng)用。
[0004] 許多研究者都嘗試著減少其核心的可控響應(yīng)功率搜索過程的計算量。如二次加速 SRP-PHAT聲源定位算法通過垂直布置的陣列將二維空間的搜索轉(zhuǎn)化為一維空間的搜索，采用層次搜索策略，由粗至精對一維空間進(jìn)行搜索。又如改進(jìn)的聯(lián)合SRP-PHAT語音定位算法利用正交直線麥克風(fēng)陣列將二維搜索空間削減為一對一維空間，然后分別在一維空間中執(zhí) 行分級搜索策略，尋找SRP最大值以確定聲源位置。
[0005] 在實際運(yùn)用中常常需要估計多個聲源的位置?，F(xiàn)有的基于語音信號稀疏性的 W-分離正交性假設(shè)并不滿足多聲源，導(dǎo)致該方法空間分辨率低，容易受混響的影響，特別是在混響和噪聲環(huán)境下無法分辨兩個在方向上靠的較近的信號源。因此，多聲源定位問題具有非常重要的理論意義和實用價值。

【發(fā)明內(nèi)容】

[0006] 本發(fā)明克服了現(xiàn)有技術(shù)中的缺點，提供了一種SRP-PHAT多源空間定位方法，可在混響和噪聲環(huán)境下分辨多個在方向上靠的較近的信號源，定位效果好。
[0007] 為了解決上述技術(shù)問題，本發(fā)明是通過以下技術(shù)方案實現(xiàn)的：
[0008] -種SRP-PHAT多源空間定位方法，其特征在于，包括以下步驟：
[0009] 1)在假設(shè)條件下計算空間坐標(biāo)，首先假設(shè)在數(shù)據(jù)獲得過程中均勻圓形麥克風(fēng)陣列的全部麥克風(fēng)的數(shù)目和空間位置不變，聲源與麥克風(fēng)距離符合聲場模型的要求，各個麥克風(fēng)的物理性質(zhì)相同，各向同性的麥克風(fēng)均勻分布在一個半徑為r的位于x-y平面的圓周上，采用極坐標(biāo)來表示平面波s的到達(dá)方向，坐標(biāo)系的原點位于圓形陣列的圓心位置上，信號的俯仰角Θ e [0, ji/2]，而方位角Φ e [0,2ji];
[0010] 2)多聲源信號劃分為互不重疊的時頻點集合，使每個時頻窗內(nèi)只包含一個活動的源信號，滿足弱的W分離正交條件；并選取漢明窗，當(dāng)WD0M = 1時滿足W-分離正交；
[0011] 3)通過SRP-PHAT算法計算所有麥克風(fēng)對的相位變換的可控響應(yīng)功率函數(shù)和得到一個目標(biāo)函數(shù)，波束形成器的控制波束在所有可能的接收方向進(jìn)行掃描，則波束輸出功率最大的方向值即得到聲源的方向。
[0012] 進(jìn)一步，所述步驟2)包括：
[0013] 首先引入兩個重要的特性準(zhǔn)則：（1)掩蔽在多大程度上保留了感興趣的聲源； (2)掩蔽在多大程度上抑制了干擾聲源；
[0014] 考慮將多聲源信號劃分為互不重疊的時頻點集合，每個時頻窗內(nèi)只包含一個活動的源信號，而且近似滿足
[0015]

【權(quán)利要求】
1. 一種SRP-PHAT多源空間定位方法，其特征在于，包括以下步驟： 1) 在假設(shè)條件下計算空間坐標(biāo)，首先假設(shè)在數(shù)據(jù)獲得過程中均勻圓形麥克風(fēng)陣列的全部麥克風(fēng)的數(shù)目和空間位置不變，聲源與麥克風(fēng)距離符合聲場模型的要求，各個麥克風(fēng)的物理性質(zhì)相同，各向同性的麥克風(fēng)均勻分布在一個半徑為r的位于x-y平面的圓周上，采用極坐標(biāo)來表示平面波s的到達(dá)方向，坐標(biāo)系的原點位于圓形陣列的圓心位置上，信號的俯仰角 Θ e [〇，ji/2],而方位角 Φ e [〇,2π]; 2) 多聲源信號劃分為互不重疊的時頻點集合，使每個時頻窗內(nèi)只包含一個活動的源信號，滿足弱的W分離正交條件；并選取漢明窗，當(dāng)WDO M = 1時滿足W-分離正交； 3) 通過SRP-PHAT算法計算所有麥克風(fēng)對的相位變換的可控響應(yīng)功率函數(shù)和得到一個目標(biāo)函數(shù)，波束形成器的控制波束在所有可能的接收方向進(jìn)行掃描，則波束輸出功率最大的方向值即得到聲源的方向。
2. 根據(jù)權(quán)利要求1所述一種SRP-PHAT多源空間定位方法，其特征在于，所述步驟2)包括：首先引入兩個重要的特性準(zhǔn)則：（1)掩蔽在多大程度上保留了感興趣的聲源；（2)掩蔽在多大程度上抑制了干擾聲源；考慮將多聲源信號劃分為互不重疊的時頻點集合，每個時頻窗內(nèi)只包含一個活動的源信號，而且近似滿足
定義時頻掩蔽碼為
通過估計對應(yīng)每個源的時頻掩蔽，由此可以從混合源中得到某個源j
其中Mj為源j支集的指示函數(shù)，Sj (t，ω)，X(t，ω)分別為sj，x(t)的時頻表示，對于給定的時頻掩碼M，定義保留的信號比率PSRM :
PSRM為估量在使用掩蔽后所保留的源Sj能量所占的百分比；同時定義
其中zj (t)為在源Sj的干擾下所有源之和；定義應(yīng)用時頻掩蔽Μ后信號干擾比為：
其中SIRM主要估量在應(yīng)用時頻掩蔽Μ分離信號后的信號干擾比；通過PSRM和SIRM可估量近似W-分離正交性WDOM :
由于語音信號具有稀疏的時頻表示，其時頻表示的功率占總功率的絕大比例，其時頻表示的乘積幅度通常總是小的，因此滿足弱的W分離正交條件；特別地，當(dāng)WDOM = 1時滿足 W-分離正交。
3. 根據(jù)權(quán)利要求1所述一種SRP-PHAT多源空間定位方法，其特征在于，所述步驟3)對于雙麥克風(fēng)的SRP-PHAT算法，對于僅有兩個麥克風(fēng)，麥克風(fēng)mi和麥克風(fēng)mj陣列，來自方位角和俯仰角的信號到達(dá)兩麥克風(fēng)時延為Λ τ ij( θ，φ)，TDOA可以通過廣義互相關(guān)（GCC)估計，表示為：
其中P(r)是三維空間矢量r空間似然函數(shù)，可通過計算所有可能的Θ和φ得到，廣義互相關(guān)函數(shù)Rsisj(A Ti，j(0，φ))在頻域中可表示為：
其中Vij(co)為加權(quán)函數(shù)，Si(c〇)S*j(c〇)為互功率譜密度函數(shù)；相位變換（PHAT)法就是一種典型的變換方法，定義相位加權(quán)函數(shù)為：
通過選擇合適的加權(quán)函數(shù)，使延時累加可控響應(yīng)功率滿足最優(yōu)化信噪比準(zhǔn)則，廣義互相關(guān)Rsisj(A Ti，j(0，φ))在所限制的范圍τ內(nèi)表現(xiàn)為一個峰值，對應(yīng)傳播到麥克風(fēng) mi和麥克風(fēng)mj的延遲TD0A。
4. 根據(jù)權(quán)利要求1所述一種SRP-PHAT多源空間定位方法，其特征在于，所述步驟3)對于圓陣列麥克風(fēng)聲源的SRP-PHAT算法：對所有麥克風(fēng)對的廣義互相關(guān)

其中Δ τ ρ Δ τ f Δ τ N為N個麥克風(fēng)的可控延時，其中Δ τ i = τ廠τ Qi = l…N，τ。為參考時延估計，取所有麥克風(fēng)延時中最小的為參考。
5.根據(jù)權(quán)利要求1所述一種SRP-PHAT多源空間定位方法，其特征在于，所述步驟3)對于多聲源圓陣列麥克風(fēng)SRP-PHAT算法：當(dāng)同時存在兩個及以上聲源時，當(dāng)同時存在兩個以上聲源時，一個聲源的SRP-PHAT峰值混入了另一個聲源的SRP-PHAT峰值，一些點上會產(chǎn)生虛假的峰值，很難找到局部最大峰值；利用語音信號近似W-分離正交性，在時頻域估計各聲源信號到達(dá)麥克風(fēng)、陣列的相對時延，利用短時傅里葉變換作為近似W-分離正交變換，假設(shè)第i個麥克風(fēng)的信號模型的頻域表示為：
若給定窗函數(shù)W，sj的短時傅里葉變換為Sj，有
通過選擇恰當(dāng)?shù)拇昂瘮?shù)及大小，在信號為近似W-分離正交性假設(shè)下，僅有一個聲源在任何時間-頻率點有效，則其互譜為：
則麥克風(fēng)i和麥克風(fēng)j之間的延時Λ τ n，i-Λ τ n，j可以通過互功率譜得到。
【文檔編號】G01S5/18GK104142492SQ201410366922
【公開日】2014年11月12日申請日期:2014年7月29日優(yōu)先權(quán)日:2014年7月29日
【發(fā)明者】孫明申請人:佛山科學(xué)技術(shù)學(xué)院

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：孫明
技術(shù)所有人：佛山科學(xué)技術(shù)學(xué)院
我是此專利的發(fā)明人

上一篇：一種生物電極及其制備方法
上一篇：一種連續(xù)式皮帶稱的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、邢老師：1.機(jī)械設(shè)計及理論 2.生物醫(yī)學(xué)材料及器械 3.聲發(fā)射檢測技術(shù)。
2、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
3、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
4、張老師：1.機(jī)械設(shè)計的應(yīng)力分析、強(qiáng)度校核的計算機(jī)仿真 2.生物反應(yīng)器研制 3.生物力學(xué)
5、趙老師：檢測與控制技術(shù)、機(jī)器人技術(shù)、機(jī)電一體化技術(shù)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

多源目標(biāo)協(xié)同搜尋定位相關(guān)技術(shù)

多源數(shù)據(jù)融合方法相關(guān)技術(shù)

空間定位方法相關(guān)技術(shù)

多源異構(gòu)數(shù)據(jù)相關(guān)技術(shù)

多源信息融合相關(guān)技術(shù)

樂融多源相關(guān)技術(shù)

多源數(shù)據(jù)融合相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種srp-phat多源空間定位方法