一種基于麥克風(fēng)陣列的攝像頭引導(dǎo)裝置及引導(dǎo)方法
【專利摘要】本發(fā)明涉及基于麥克風(fēng)陣列的攝像頭引導(dǎo)裝置及引導(dǎo)方法,該引導(dǎo)裝置包括帶有控制云臺的攝像頭、麥克風(fēng)陣列和多通道聲音信號同步采集處理系統(tǒng),多通道聲音信號同步處理系統(tǒng)包括調(diào)理電路、Codec芯片、DSP芯片和485接口,調(diào)理電路用于對麥克風(fēng)采集的模擬信號進(jìn)行調(diào)理,Codec芯片用于將模擬信號轉(zhuǎn)換為數(shù)字信號并將數(shù)字信號送入DSP芯片中,DSP芯片用于根據(jù)所接收到的數(shù)字信號進(jìn)行突發(fā)聲信號檢測以及突發(fā)聲信號測向,并將測向結(jié)果通過485接口傳送給攝像頭的控制云臺,從而調(diào)整攝像頭的視角以對準(zhǔn)目標(biāo)進(jìn)行拍攝。該引導(dǎo)裝置具有自適應(yīng)性,應(yīng)用范圍廣,能避免攝像頭沒有目的的轉(zhuǎn)動;同時,方向的估計精度和系統(tǒng)的魯棒性高。
【專利說明】一種基于麥克風(fēng)陣列的攝像頭引導(dǎo)裝置及引導(dǎo)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于監(jiān)控【技術(shù)領(lǐng)域】,涉及一種利用麥克風(fēng)陣列對突發(fā)聲源進(jìn)行檢測及測 向,并引導(dǎo)攝像頭捕捉該突發(fā)聲源的裝置及方法。
【背景技術(shù)】
[0002] 目前,視頻監(jiān)控是監(jiān)控領(lǐng)域中的一個重要手段,已經(jīng)得到廣泛應(yīng)用。然而,攝像頭 有盲區(qū),一般攝像頭的視角為52°,監(jiān)控范圍有限,可轉(zhuǎn)動的攝像頭通常是有規(guī)律的旋轉(zhuǎn)或 由人工控制,很難及時捕捉到突發(fā)事件,如公共場所的騷亂、居民小區(qū)車輛偷竊報警、交通 事故等。如果這些事件沒有在攝像頭的監(jiān)控區(qū)域,傳統(tǒng)的視頻監(jiān)控系統(tǒng)就無能為力了。
[0003] 眾所周知,人可以通過耳朵對突發(fā)事件的聲音進(jìn)行定位,進(jìn)而及時調(diào)整視角。借鑒 人的感知機(jī)理,可以為攝像頭裝上"耳朵",這個"耳朵"就是麥克風(fēng)陣列。利用麥克風(fēng)陣列 對突發(fā)事件的聲音進(jìn)行檢測及測向,并引導(dǎo)攝像頭,實現(xiàn)對突發(fā)事件的音視頻實時監(jiān)控。
[0004] 目前利用麥克風(fēng)陣列對聲源進(jìn)行定位,進(jìn)而引導(dǎo)攝像頭對準(zhǔn)聲源已有多個專 利。美國專利US 6, 826, 284 B1中利用6個麥克風(fēng)組成立體陣列,通過時間延遲測向算法 (TDOA)對聲源進(jìn)行定位,從而引導(dǎo)攝像頭指向聲源。中國專利CN10156798B披露了基于麥 克風(fēng)陣列聲音智導(dǎo)的智能視頻導(dǎo)播方法,其首先對關(guān)鍵區(qū)域進(jìn)行拍攝參數(shù)設(shè)置,將示例保 存在訓(xùn)練集中,然后利用麥克風(fēng)陣列對聲源進(jìn)行定位,并將定位結(jié)果與訓(xùn)練集中的示例進(jìn) 行比對計算,最后引導(dǎo)攝像頭按給定參數(shù)進(jìn)行拍攝。中國實用新型專利CN203151672U披露 了一種聲源定位功能的視頻系統(tǒng),其在自己搭建的硬件系統(tǒng)上實現(xiàn)了聲源定位并控制云臺 上的攝像頭對準(zhǔn)聲源。
[0005] 但是,以上這些專利中共同的缺點(diǎn)是:1.沒有聲音檢測模塊,如果不加入聲音檢 測模塊則攝像頭并不能有的放矢的對準(zhǔn)突發(fā)事件,且整個系統(tǒng)容易受外界噪聲干擾;2.以 上專利中利用的都是TDOA類聲源定位方法,該類方法要求傳聲器間隔較大,因此導(dǎo)致整個 裝置體積龐大,在實際中難以實用;并且該類測向算法屬于時域處理方法,而不同場景下的 聲音信號的頻率范圍是不同的,該類方法沒有對聲音頻率進(jìn)行選擇。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明針對上述現(xiàn)有技術(shù)的不足,提出了一種利用麥克風(fēng)陣列引導(dǎo)攝像頭捕捉突 發(fā)聲源的裝置及方法,其中使用了噪聲譜估計技術(shù)和寬帶信號波達(dá)方向估計技術(shù),因此具 有自適應(yīng)性,應(yīng)用范圍廣,能避免攝像頭沒有目的的轉(zhuǎn)動;同時,方向的估計精度和系統(tǒng)的 魯棒性高。
[0007] 為了實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于麥克風(fēng)陣列的攝像頭引 導(dǎo)裝置,其包括帶有控制云臺的攝像頭、由多個麥克風(fēng)組成的圍繞所述攝像頭設(shè)置的麥克 風(fēng)陣列和多通道聲音信號同步采集處理系統(tǒng),其中,所述多個麥克風(fēng)通過音頻線連接到所 述多通道聲音信號同步采集處理系統(tǒng)從而將多通道麥克風(fēng)信號輸送到所述多通道聲音信 號同步采集處理系統(tǒng)中,所述多通道聲音信號同步處理系統(tǒng)包括調(diào)理電路、Codec芯片、DSP 芯片和485接口,其中,所述調(diào)理電路用于對所述多個麥克風(fēng)采集的模擬信號進(jìn)行調(diào)理,所 述Codec芯片用于將經(jīng)所述調(diào)理電路調(diào)理過的模擬信號轉(zhuǎn)換為數(shù)字信號并將所述數(shù)字信 號送入所述DSP芯片中,所述DSP芯片用于根據(jù)所接收到的數(shù)字信號進(jìn)行突發(fā)聲信號檢測 以及突發(fā)聲信號測向,并將測向結(jié)果通過所述485接口傳送給所述攝像頭的控制云臺,從 而調(diào)整所述攝像頭的視角以對準(zhǔn)目標(biāo)進(jìn)行拍攝。
[0008] 此外,本發(fā)明還提供一種采用上述基于麥克風(fēng)陣列的攝像頭引導(dǎo)裝置的攝像頭引 導(dǎo)方法,其包括以下步驟:第一步:啟動所述攝像頭引導(dǎo)裝置,通過所述Codec芯片將所述 多個麥克風(fēng)采集到的模擬信號轉(zhuǎn)換為數(shù)字信號,并將所述數(shù)字信號送入所述DSP芯片;第 二步:由所述DSP芯片根據(jù)其中一個麥克風(fēng)接收到的信號自適應(yīng)地估計環(huán)境噪聲能量;第 三步:由所述DSP芯片計算該麥克風(fēng)接收到的信號的能量和所述環(huán)境噪聲能量的比值,根 據(jù)該比值判斷是否有突發(fā)聲信號出現(xiàn),如果有轉(zhuǎn)入第四步;如果沒有則轉(zhuǎn)入第二步,繼續(xù)根 據(jù)麥克風(fēng)接收到的信號自適應(yīng)地估計環(huán)境噪聲能量;第四步:由所述DSP芯片根據(jù)第三步 的突發(fā)聲檢測結(jié)果,截取出所述多個麥克風(fēng)中有突發(fā)聲的信號段;第五步:由所述DSP芯片 將所述第四步中截取的麥克風(fēng)的信號分別進(jìn)行快速傅里葉變換,變成多個窄帶信號,根據(jù) 不同的應(yīng)用場景和突發(fā)聲信號的特點(diǎn),選取合適的頻帶利用寬帶波達(dá)方向估計算法估計目 標(biāo)的方位角和俯仰角;第六步:由所述DSP芯片將所述方位角和俯仰角通過所述485接口 發(fā)送給所述攝像頭的控制云臺,所述控制云臺根據(jù)該方位角和俯仰角調(diào)整所述攝像頭的視 角進(jìn)行拍攝。
[0009] 進(jìn)一步地,其中,所述第二步中,假設(shè)某個麥克風(fēng)接收到的信號為x(t),則根據(jù)該 麥克風(fēng)接收到的信號自適應(yīng)地估計環(huán)境噪聲能量p n(t)用公式可以表示為
【權(quán)利要求】
1. 一種基于麥克風(fēng)陣列的攝像頭引導(dǎo)裝置,其包括帶有控制云臺的攝像頭(I)、由多 個麥克風(fēng)組成的圍繞所述攝像頭(1)設(shè)置的麥克風(fēng)陣列(2)和多通道聲音信號同步采集處 理系統(tǒng)(3),其中,所述多個麥克風(fēng)通過音頻線連接到所述多通道聲音信號同步采集處理系 統(tǒng)(3)從而將多通道麥克風(fēng)信號輸送到所述多通道聲音信號同步采集處理系統(tǒng)(3)中,所 述多通道聲音信號同步處理系統(tǒng)包括調(diào)理電路、Codec芯片、DSP芯片和485接口,其中,所 述調(diào)理電路用于對所述多個麥克風(fēng)采集的模擬信號進(jìn)行調(diào)理,所述Codec芯片用于將經(jīng)所 述調(diào)理電路調(diào)理過的模擬信號轉(zhuǎn)換為數(shù)字信號并將所述數(shù)字信號送入所述DSP芯片中,所 述DSP芯片用于根據(jù)所接收到的數(shù)字信號進(jìn)行突發(fā)聲信號檢測以及突發(fā)聲信號測向,并將 測向結(jié)果通過所述485接口傳送給所述攝像頭(1)的控制云臺,從而調(diào)整所述攝像頭(1) 的視角以對準(zhǔn)目標(biāo)進(jìn)行拍攝。
2. -種采用權(quán)利要求1所述的基于麥克風(fēng)陣列的攝像頭引導(dǎo)裝置的攝像頭引導(dǎo)方法, 其包括以下步驟: 第一步:啟動所述攝像頭引導(dǎo)裝置,通過所述Codec芯片將所述多個麥克風(fēng)采集到的 模擬信號轉(zhuǎn)換為數(shù)字信號,并將所述數(shù)字信號送入所述DSP芯片; 第二步:由所述DSP芯片根據(jù)其中一個麥克風(fēng)接收到的信號自適應(yīng)地估計環(huán)境噪聲能 量; 第三步:由所述DSP芯片計算該麥克風(fēng)接收到的信號的能量和所述環(huán)境噪聲能量的比 值,根據(jù)該比值判斷是否有突發(fā)聲信號出現(xiàn),如果有轉(zhuǎn)入第四步;如果沒有則轉(zhuǎn)入第二步, 繼續(xù)根據(jù)麥克風(fēng)接收到的信號自適應(yīng)地估計環(huán)境噪聲能量; 第四步:由所述DSP芯片根據(jù)第三步的突發(fā)聲檢測結(jié)果,截取出所述多個麥克風(fēng)中有 突發(fā)聲的信號段; 第五步:由所述DSP芯片將所述第四步中截取的麥克風(fēng)的信號分別進(jìn)行快速傅里葉變 換,變成多個窄帶信號,根據(jù)不同的應(yīng)用場景和突發(fā)聲信號的特點(diǎn),選取合適的頻帶利用寬 帶波達(dá)方向估計算法估計目標(biāo)的方位角和俯仰角; 第六步:由所述DSP芯片將所述方位角和俯仰角通過所述485接口發(fā)送給所述攝像頭 的控制云臺,所述控制云臺根據(jù)該方位角和俯仰角調(diào)整所述攝像頭的視角進(jìn)行拍攝。
3. 如權(quán)利要求2所述的攝像頭引導(dǎo)方法,其中,所述第二步中,假設(shè)某個麥克風(fēng)接收到 的信號為X(t),則根據(jù)該麥克風(fēng)接收到的信號自適應(yīng)地估計環(huán)境噪聲能量Pn (t)用公式可 以表示為
其中,4和fH為麥克風(fēng)接收到的信號的最低頻率和最高頻率,Pn(t,f)是麥克風(fēng)接收到 的信號在頻率f處的能量,Pn(t-1,f)是麥克風(fēng)接收到的信號在前一時刻頻率f處的能量, X(t,f)是麥克風(fēng)接收到的信號的傅里葉變換,α⑴是平滑系數(shù)。
4. 如權(quán)利要求3所述的攝像頭引導(dǎo)方法,其中,所述第三步中,該麥克風(fēng)接收到的信 號的能量為乃(0= 則該麥克風(fēng)接收到的信號的能量和環(huán)境噪聲能量的比值 f~fhy SNR=Ps (t)/Pn(t),當(dāng)SNR>Th時,檢測到突發(fā)聲信號;當(dāng)SNR<Th時,沒有檢測到突發(fā)聲 信號,其中Th為檢測閾值。
5. 如權(quán)利要求4所述的攝像頭引導(dǎo)方法,其中,所述第五步中,所述寬帶波達(dá)方向估計 算法選用頻域波束形成算法,頻域波束形成算法通過對接收信號做傅里葉變換,將不同麥 克風(fēng)之間的時間延遲轉(zhuǎn)換為各個頻帶上的相位差,然后在每個頻帶上應(yīng)用波束形成算法獲 得該頻帶上的角度估計,最后將這些頻帶上的角度估計結(jié)果取平均獲得目標(biāo)信號的角度估 計。
6. 如權(quán)利要求5所述的攝像頭引導(dǎo)方法,其中,具體地,假定所述麥克風(fēng)陣列接收到的 信號為xn(t),n= 1,2,...,N,其中N為麥克風(fēng)陣列中麥克風(fēng)的個數(shù), 首先對接收到的信號做快速傅里葉變換,得到信號在各個頻帶上的表示Xn(f),將N個 麥克風(fēng)的信號表不成列向量的形式 x(f) = [XJfhx2(f),···,XN(f)]T 其中[·]τ表示向量轉(zhuǎn)置變換, 根據(jù)向量X(f)獲得陣列信號在頻帶f處的協(xié)方差矩陣R(f),用公式可以表示為 R(f) =E[X(f)X(f)H] 其中Ε[·]為取均值運(yùn)算, 利用協(xié)方差矩陣R(f)就可以獲得寬帶波束形成算法的代價函數(shù)艮供)
其中Θ和卩分別為目標(biāo)信號的俯仰角和方
位角,a(/,<9,供)為麥克風(fēng)陣列的導(dǎo)向矢量 其中為目標(biāo)信號到第η個麥克風(fēng)和第1個麥克風(fēng)之間的時間延遲,該延遲可以 根據(jù)麥克風(fēng)陳列的形狀和位置確定, 最后通過對代價函數(shù)的搜索就可以獲得目標(biāo)信號的俯仰角和方位角,用公式可以表示 為
【文檔編號】H04N5/232GK104469154SQ201410726856
【公開日】2015年3月25日 申請日期:2014年12月5日 優(yōu)先權(quán)日:2014年12月5日
【發(fā)明者】蔡盛盛 申請人:合肥國科聲拓信息技術(shù)有限公司