基于多個手機麥克風(fēng)陣列的定位方法
【專利摘要】本發(fā)明提供一種基于多個手機麥克風(fēng)陣列的定位方法,包括下述步驟:(a)獲取不同位置的多個手機麥克風(fēng)的位置,m≥1,為正整數(shù);(b)通過歸一化互相關(guān)方法,對于所有的麥克風(fēng)對,計算同一聲源發(fā)出的聲音到麥克風(fēng)和麥克風(fēng)的帶誤差容忍的時間差范圍;;根據(jù)帶誤差容忍的時間差范圍和每對麥克風(fēng)的位置,得到相應(yīng)的雙曲線帶;(c)將所有的雙曲線帶疊加在平面上,平面中被雙曲線帶覆蓋次數(shù)最多的區(qū)域即是最大可能的音源區(qū)域。本發(fā)明能夠通過計算音源發(fā)出的聲音到達不同位置的麥克風(fēng)的時間差來確定音源的位置。
【專利說明】基于多個手機麥克風(fēng)陣列的定位方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及手機與移動網(wǎng)絡(luò)領(lǐng)域,具體涉及一種通過手機麥克風(fēng)進行聲音定位的方法。
【背景技術(shù)】
[0002]人耳為什么能分辨聲音的位置,是因為聲音源和雙耳之間的存在角度差。這個角度差使得聲音到達左右兩個耳朵有時間差,人的耳朵能夠捕捉到這個時間差,從而大概定位到音源的位置。同時聲音到達兩個耳朵的強度也是有區(qū)別的,這個也是確定音源位置的一個重要來源。通過時間差和強度差別,人們可以準確的知道音源的位置。同樣的原理也可以用到手機上。
[0003]手機逐漸成為具有強大計算能力的移動工具,越來越多的傳感器被安放在手機上,提供各種感知的功能。尤其是手機上,麥克風(fēng)的數(shù)量在逐漸增多,但現(xiàn)在的手機,一般都只有兩個或者一個麥克風(fēng),只有極少數(shù)的手機有三個麥克風(fēng),例如現(xiàn)在的iPhone5手機,就具有三個麥克風(fēng),一個在前面,一個在背面,另一個在底部。這樣可以更好的獲取多個方向的聲音,并且在通話過程中消除背景噪音。
[0004]隨著多個麥克風(fēng)的出現(xiàn),提供了精確定位聲音源的可能性,如果在單個手機上有大于等于3個麥克風(fēng),即可通過手機聲音到達不同位置的麥克風(fēng)的時間差進行定位,從而得到較精確的音源位置 。但是如果手機只有兩個麥克風(fēng),則需要多個手機進行協(xié)同合作定位。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于提供一種基于多個手機麥克風(fēng)陣列的定位方法,通過計算音源發(fā)出的聲音到達不同位置的麥克風(fēng)的時間差來確定音源的位置。本發(fā)明采用的技術(shù)方案是:
[0006]一種基于多個手機麥克風(fēng)陣列的定位方法,包括下述步驟:
[0007](a).獲取不同位置的多個手機麥克風(fēng)M1M2M3...M2m的位置,m≥1,為正整數(shù);
[0008](b).通過歸一化互相關(guān)方法,對于所有的麥克風(fēng)對,計算同一聲源發(fā)出的聲音到麥克風(fēng)Mi和麥克風(fēng)的帶誤差容忍的時間差范圍Δtij ;i ≠ j ;
[0009]根據(jù)帶誤差容忍的時間差范圍和每對麥克風(fēng)的位置,得到相應(yīng)的雙曲線帶;
[0010](c).將所有的雙曲線帶疊加在平面上,平面中被雙曲線帶覆蓋次數(shù)最多的區(qū)域即是最大可能的音源區(qū)域。
[0011]進一步地,所述步驟(b)具體包括:
[0012]通過兩個不同位置的麥克風(fēng)對同一音源發(fā)出的聲音進行采集,分別獲取第一聲音序列和第二聲音序列;其中第一麥克風(fēng)米集的第一聲音序列中的聲音強度的最高時刻是h,第二麥克風(fēng)采集的第二聲音序列中聲音強度的最高時刻是t2 ;采集的采樣率為k ;
[0013]分別選取第一聲音序列和第二聲音序列的兩個聲音序列的聲音強度最高的時間段,得到第一麥克風(fēng)的第一聲音子序列X (t)和第二麥克風(fēng)的第二聲音子序列Y (t);第一聲音子序列X (t)和第二聲音子序列Y (t)的序列長度均為L ;
[0014]將得到的兩個子序列進行歸一化互相關(guān)計算,以得到最佳匹配位置tM,即兩個子序列相對位置為tM時,歸一化互相關(guān)計算的結(jié)果CCatl)數(shù)值最大;
[0015]歸一化的互相關(guān)方法的計算公式如下所示:
[0016]
【權(quán)利要求】
1.一種基于多個手機麥克風(fēng)陣列的定位方法,其特征在于,包括下述步驟: (a).獲取不同位置的多個手機麥克風(fēng)M1M2M3...M2m的位置,m≥1,為正整數(shù); (b).通過歸一化互相關(guān)方法,對于所有的麥克風(fēng)對,計算同一聲源發(fā)出的聲音到麥克風(fēng)Mi和麥克風(fēng)的帶誤差容忍的時間差范圍Λ ;i ^ j ; 根據(jù)帶誤差容忍的時間差范圍和每對麥克風(fēng)的位置,得到相應(yīng)的雙曲線帶; (c).將所有的雙曲線帶疊加在平面上,平面中被雙曲線帶覆蓋次數(shù)最多的區(qū)域即是最大可能的音源區(qū)域。
2.如權(quán)利要求1所述的基于多個手機麥克風(fēng)陣列的定位方法,其特征在于,所述步驟(b)具體包括: 通過兩個不同位置的麥克風(fēng)對同一音源發(fā)出的聲音進行米集,分別獲取第一聲音序列和第二聲音序列;其中第一麥克風(fēng)米集的第一聲音序列中的聲音強度的最高時刻是t1;第二麥克風(fēng)采集的第二聲音序列中聲音強度的最高時刻是t2 ;采集的采樣率為k ; 分別選取第一聲音序列和第二聲音序列的兩個聲音序列的聲音強度最高的時間段,得到第一麥克風(fēng)的第一聲音子序列X(t)和第二麥克風(fēng)的第二聲音子序列Y(t);第一聲音子序列X(t)和第二聲音子序列Y(t)的序列長度均為L ; 將得到的兩個子序列進行歸一化互相關(guān)計算,以得到最佳匹配位置tM,即兩個子序列相對位置為tM時,歸一化互相關(guān)計算的結(jié)果CCatl)數(shù)值最大; 歸一化的互相關(guān)方法的計算公式如下所示:
3.如權(quán)利要求2所述的基于多個手機麥克風(fēng)陣列的定位方法,其特征在于:聲首序列的聲首強度最聞的時間段為該聲首序列中聲首強度的最聞時刻的如后2秒的時間段,第一聲音 子序列X(t)和第二聲音子序列Y(t)的長度均為L=4*k ;k為采樣率。
【文檔編號】G01S5/28GK103675757SQ201310695643
【公開日】2014年3月26日 申請日期:2013年12月17日 優(yōu)先權(quán)日:2013年12月17日
【發(fā)明者】朱彤, 馬強, 張善豐, 劉云浩 申請人:無錫清華信息科學(xué)與技術(shù)國家實驗室物聯(lián)網(wǎng)技術(shù)中心