亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種srp-phat多源空間定位方法

文檔序號:6235796閱讀:1864來源:國知局
一種srp-phat多源空間定位方法
【專利摘要】本發(fā)明所述一種SRP-PHAT多源空間定位方法,首先假設(shè)在數(shù)據(jù)獲得過程中均勻圓形麥克風(fēng)陣列的全部麥克風(fēng)的數(shù)目和空間位置不變,各向同性的麥克風(fēng)均勻分布在一個半徑為r的位于x-y平面的圓周上,采用極坐標(biāo)來表示平面波s的到達(dá)方向,坐標(biāo)系的原點位于圓形陣列的圓心位置上,多聲源信號劃分為互不重疊的時頻點集合,使每個時頻窗內(nèi)只包含一個活動的源信號,滿足弱的W分離正交條件;并選取漢明窗,通過SRP-PHAT算法計算可控響應(yīng)功率函數(shù)和得到目標(biāo)函數(shù),控制波束在所有可能的接收方向進(jìn)行掃描,則波束輸出功率最大的方向值即得到聲源的方向,其使得多聲源的DOA估計在強(qiáng)噪聲和適度混響的聲學(xué)環(huán)境下具有較好的分離性能,明顯突出了真正峰值,具有較高的定位精度。
【專利說明】-種SRP-PHAT多源空間定位方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種空間定位方法,具體地說,涉及一種SRP-PHAT多源空間定位方 法,應(yīng)用于視頻會議、語音增強(qiáng)、助聽器、免提電話和智能機(jī)器人等系統(tǒng)中。

【背景技術(shù)】
[0002] 聲源定位技術(shù)在視頻會議、語音增強(qiáng)、助聽器、免提電話和智能機(jī)器人等系統(tǒng)中具 有廣泛的應(yīng)用前景,近年來受到了越來越多的關(guān)注。
[0003] 目前相位變換加權(quán)的可控響應(yīng)功率(SRP-PHAT :Steered Response Power-Phase Transform)聲源定位算法已成為主流算法,該算法結(jié)合了可控波束形成和GCC-PHAT的優(yōu) 點,在低信噪比條件下具有較強(qiáng)的魯棒性。對于單聲源定位有較好的性能,但最大的缺點是 運(yùn)算量大,龐大的運(yùn)算量限制了在實時系統(tǒng)中的應(yīng)用。
[0004] 許多研究者都嘗試著減少其核心的可控響應(yīng)功率搜索過程的計算量。如二次加速 SRP-PHAT聲源定位算法通過垂直布置的陣列將二維空間的搜索轉(zhuǎn)化為一維空間的搜索,采 用層次搜索策略,由粗至精對一維空間進(jìn)行搜索。又如改進(jìn)的聯(lián)合SRP-PHAT語音定位算法 利用正交直線麥克風(fēng)陣列將二維搜索空間削減為一對一維空間,然后分別在一維空間中執(zhí) 行分級搜索策略,尋找SRP最大值以確定聲源位置。
[0005] 在實際運(yùn)用中常常需要估計多個聲源的位置?,F(xiàn)有的基于語音信號稀疏性的 W-分離正交性假設(shè)并不滿足多聲源,導(dǎo)致該方法空間分辨率低,容易受混響的影響,特別是 在混響和噪聲環(huán)境下無法分辨兩個在方向上靠的較近的信號源。因此,多聲源定位問題具 有非常重要的理論意義和實用價值。


【發(fā)明內(nèi)容】

[0006] 本發(fā)明克服了現(xiàn)有技術(shù)中的缺點,提供了一種SRP-PHAT多源空間定位方法,可在 混響和噪聲環(huán)境下分辨多個在方向上靠的較近的信號源,定位效果好。
[0007] 為了解決上述技術(shù)問題,本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:
[0008] -種SRP-PHAT多源空間定位方法,其特征在于,包括以下步驟:
[0009] 1)在假設(shè)條件下計算空間坐標(biāo),首先假設(shè)在數(shù)據(jù)獲得過程中均勻圓形麥克風(fēng)陣列 的全部麥克風(fēng)的數(shù)目和空間位置不變,聲源與麥克風(fēng)距離符合聲場模型的要求,各個麥克 風(fēng)的物理性質(zhì)相同,各向同性的麥克風(fēng)均勻分布在一個半徑為r的位于x-y平面的圓周上, 采用極坐標(biāo)來表示平面波s的到達(dá)方向,坐標(biāo)系的原點位于圓形陣列的圓心位置上,信號 的俯仰角Θ e [0, ji/2],而方位角Φ e [0,2ji];
[0010] 2)多聲源信號劃分為互不重疊的時頻點集合,使每個時頻窗內(nèi)只包含一個活動的 源信號,滿足弱的W分離正交條件;并選取漢明窗,當(dāng)WD0M = 1時滿足W-分離正交;
[0011] 3)通過SRP-PHAT算法計算所有麥克風(fēng)對的相位變換的可控響應(yīng)功率函數(shù)和得到 一個目標(biāo)函數(shù),波束形成器的控制波束在所有可能的接收方向進(jìn)行掃描,則波束輸出功率 最大的方向值即得到聲源的方向。
[0012] 進(jìn)一步,所述步驟2)包括:
[0013] 首先引入兩個重要的特性準(zhǔn)則:(1)掩蔽在多大程度上保留了感興趣的聲源; (2)掩蔽在多大程度上抑制了干擾聲源;
[0014] 考慮將多聲源信號劃分為互不重疊的時頻點集合,每個時頻窗內(nèi)只包含一個活動 的源信號,而且近似滿足
[0015]

【權(quán)利要求】
1. 一種SRP-PHAT多源空間定位方法,其特征在于,包括以下步驟: 1) 在假設(shè)條件下計算空間坐標(biāo),首先假設(shè)在數(shù)據(jù)獲得過程中均勻圓形麥克風(fēng)陣列的全 部麥克風(fēng)的數(shù)目和空間位置不變,聲源與麥克風(fēng)距離符合聲場模型的要求,各個麥克風(fēng)的 物理性質(zhì)相同,各向同性的麥克風(fēng)均勻分布在一個半徑為r的位于x-y平面的圓周上,采用 極坐標(biāo)來表示平面波s的到達(dá)方向,坐標(biāo)系的原點位于圓形陣列的圓心位置上,信號的俯 仰角 Θ e [〇,ji/2],而方位角 Φ e [〇,2π]; 2) 多聲源信號劃分為互不重疊的時頻點集合,使每個時頻窗內(nèi)只包含一個活動的源信 號,滿足弱的W分離正交條件;并選取漢明窗,當(dāng)WDO M = 1時滿足W-分離正交; 3) 通過SRP-PHAT算法計算所有麥克風(fēng)對的相位變換的可控響應(yīng)功率函數(shù)和得到一個 目標(biāo)函數(shù),波束形成器的控制波束在所有可能的接收方向進(jìn)行掃描,則波束輸出功率最大 的方向值即得到聲源的方向。
2. 根據(jù)權(quán)利要求1所述一種SRP-PHAT多源空間定位方法,其特征在于,所述步驟2)包 括: 首先引入兩個重要的特性準(zhǔn)則:(1)掩蔽在多大程度上保留了感興趣的聲源;(2)掩蔽 在多大程度上抑制了干擾聲源; 考慮將多聲源信號劃分為互不重疊的時頻點集合,每個時頻窗內(nèi)只包含一個活動的源 信號,而且近似滿足
定義時頻掩蔽碼為
通過估計對應(yīng)每個源的時頻掩蔽,由此可以從混合源中得到某個源j
其中Mj為源j支集的指示函數(shù),Sj (t,ω),X(t,ω)分別為sj,x(t)的時頻表示, 對于給定的時頻掩碼M,定義保留的信號比率PSRM :
PSRM為估量在使用掩蔽后所保留的源Sj能量所占的百分比; 同時定義
其中zj (t)為在源Sj的干擾下所有源之和; 定義應(yīng)用時頻掩蔽Μ后信號干擾比為:
其中SIRM主要估量在應(yīng)用時頻掩蔽Μ分離信號后的信號干擾比; 通過PSRM和SIRM可估量近似W-分離正交性WDOM :
由于語音信號具有稀疏的時頻表示,其時頻表示的功率占總功率的絕大比例,其時頻 表示的乘積幅度通常總是小的,因此滿足弱的W分離正交條件;特別地,當(dāng)WDOM = 1時滿足 W-分離正交。
3. 根據(jù)權(quán)利要求1所述一種SRP-PHAT多源空間定位方法,其特征在于,所述步驟3)對 于雙麥克風(fēng)的SRP-PHAT算法, 對于僅有兩個麥克風(fēng),麥克風(fēng)mi和麥克風(fēng)mj陣列,來自方位角和俯仰角的信號到達(dá)兩 麥克風(fēng)時延為Λ τ ij( θ,φ),TDOA可以通過廣義互相關(guān)(GCC)估計,表示為:
其中P(r)是三維空間矢量r空間似然函數(shù),可通過計算所有可能的Θ和φ得到,廣 義互相關(guān)函數(shù)Rsisj(A Ti,j(0,φ))在頻域中可表示為:
其中Vij(co)為加權(quán)函數(shù),Si(c〇)S*j(c〇)為互功率譜密度函數(shù); 相位變換(PHAT)法就是一種典型的變換方法, 定義相位加權(quán)函數(shù)為:
通過選擇合適的加權(quán)函數(shù),使延時累加可控響應(yīng)功率滿足最優(yōu)化信噪比準(zhǔn)則,廣義互 相關(guān)Rsisj(A Ti,j(0,φ))在所限制的范圍τ內(nèi)表現(xiàn)為一個峰值,對應(yīng)傳播到麥克風(fēng) mi和麥克風(fēng)mj的延遲TD0A。
4. 根據(jù)權(quán)利要求1所述一種SRP-PHAT多源空間定位方法,其特征在于,所述步驟3)對 于圓陣列麥克風(fēng)聲源的SRP-PHAT算法: 對所有麥克風(fēng)對的廣義互相關(guān)

其中Δ τ ρ Δ τ f Δ τ N為N個麥克風(fēng)的可控延時,其中Δ τ i = τ廠τ Qi = l…N,τ。 為參考時延估計,取所有麥克風(fēng)延時中最小的為參考。
5.根據(jù)權(quán)利要求1所述一種SRP-PHAT多源空間定位方法,其特征在于,所述步驟3)對 于多聲源圓陣列麥克風(fēng)SRP-PHAT算法: 當(dāng)同時存在兩個及以上聲源時,當(dāng)同時存在兩個以上聲源時,一個聲源的SRP-PHAT峰 值混入了另一個聲源的SRP-PHAT峰值,一些點上會產(chǎn)生虛假的峰值,很難找到局部最大峰 值; 利用語音信號近似W-分離正交性,在時頻域估計各聲源信號到達(dá)麥克風(fēng)、陣列的相對 時延,利用短時傅里葉變換作為近似W-分離正交變換, 假設(shè)第i個麥克風(fēng)的信號模型的頻域表示為:
若給定窗函數(shù)W,sj的短時傅里葉變換為Sj,有
通過選擇恰當(dāng)?shù)拇昂瘮?shù)及大小,在信號為近似W-分離正交性假設(shè)下,僅有一個聲源在 任何時間-頻率點有效,則其互譜為:
則麥克風(fēng)i和麥克風(fēng)j之間的延時Λ τ n,i-Λ τ n,j可以通過互功率譜得到。
【文檔編號】G01S5/18GK104142492SQ201410366922
【公開日】2014年11月12日 申請日期:2014年7月29日 優(yōu)先權(quán)日:2014年7月29日
【發(fā)明者】孫明 申請人:佛山科學(xué)技術(shù)學(xué)院
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1