基于嵌套子陣列的后置濾波與譜減法聯(lián)合語(yǔ)音增強(qiáng)方法

文檔序號(hào)：2830792閱讀：856來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專(zhuān)利名稱(chēng)：基于嵌套子陣列的后置濾波與譜減法聯(lián)合語(yǔ)音增強(qiáng)方法
技術(shù)領(lǐng)域：
本發(fā)明涉及到計(jì)算機(jī)語(yǔ)音信號(hào)處理領(lǐng)域，更具體地說(shuō)，本發(fā)明涉及一種基于嵌套子陣列的后置濾波與譜減法聯(lián)合語(yǔ)音增強(qiáng)方法，尤其適用于室內(nèi)嘈雜環(huán) 境中話音信號(hào)的增強(qiáng)。
背景技術(shù)：
語(yǔ)音增強(qiáng)(SpeechEnhancement)技術(shù)就是對(duì)帶噪的語(yǔ)音進(jìn)行相關(guān)處理，從中提取盡可能純凈的原始語(yǔ)音，以改善接收端語(yǔ)音質(zhì)量，提高語(yǔ)音的清晰度、可懂度和舒適度，使人易于接受或提高語(yǔ)音處理系統(tǒng)的性能。常用在自動(dòng)語(yǔ)音識(shí)別系統(tǒng)、車(chē)載非手持式電話、多媒體會(huì)議、無(wú)線通信、場(chǎng)景錄音、軍事竊聽(tīng)、助聽(tīng)設(shè)備和智能機(jī)器人等領(lǐng)域。語(yǔ)音增強(qiáng)技術(shù)的研究發(fā)展已有四十多年的歷史，傳統(tǒng)的方法皆是基于單一麥克風(fēng)的系統(tǒng)，其拾音范圍、指向性變化、噪聲抑制能力等問(wèn)題都受到一定的限制?；邴溈孙L(fēng)陣列的自適應(yīng)語(yǔ)音增強(qiáng)技術(shù)融合了陣列信號(hào)處理技術(shù)、語(yǔ)音信號(hào)處理技術(shù)以及多通道信號(hào)采集技術(shù)等多項(xiàng)關(guān)鍵技術(shù)。其技術(shù)優(yōu)勢(shì)在于它不僅可以利用語(yǔ)音信號(hào)的時(shí)域和頻域特性，而且可以利用其空間信息來(lái)實(shí)現(xiàn)對(duì)噪聲的消除，達(dá)到增強(qiáng)和純化語(yǔ)音的目的?；邴溈孙L(fēng) 陣列的語(yǔ)音增強(qiáng)方法典型的工作流程如圖l所示，具體描述如下-
1) 根據(jù)應(yīng)用要求設(shè)計(jì)麥克風(fēng)陣列結(jié)構(gòu)；
2) 利用麥克風(fēng)陣列接收到的多通道語(yǔ)音信號(hào)的時(shí)間、頻率、空間信息，對(duì)語(yǔ)音信號(hào)的起始、結(jié)束端點(diǎn)進(jìn)行檢測(cè)，同時(shí)估計(jì)通道之間的時(shí)間延遲，估計(jì)信號(hào)空間方位信息；
3) 采用語(yǔ)音增強(qiáng)算法對(duì)多通道信號(hào)進(jìn)行處理，實(shí)現(xiàn)語(yǔ)音信號(hào)的增強(qiáng)。前述步驟l)中的麥克風(fēng)陣列結(jié)構(gòu)設(shè)計(jì)是一項(xiàng)關(guān)鍵的步驟。傳統(tǒng)的陣列結(jié)構(gòu)
有均勻線陣、非均勻線陣、均勻圓陣和球面陣列等。陣列結(jié)構(gòu)的設(shè)計(jì)與多通道信號(hào)模型的選擇有密切關(guān)系。
陣列信號(hào)模型分為近場(chǎng)模型和遠(yuǎn)場(chǎng)模型，其最大區(qū)別在于在遠(yuǎn)場(chǎng)模型中，各陣元接收到的信號(hào)幅度被認(rèn)為是相同的，有相位差；而近場(chǎng)模型則需要考慮傳播路徑的不同帶來(lái)的信號(hào)幅度衰減，即近場(chǎng)模型除了要考慮信源的到達(dá)方向之外，還必須考慮信源到各個(gè)麥克風(fēng)的距離。在近場(chǎng)情況下，通常采用球面波前模型，來(lái)代替遠(yuǎn)場(chǎng)的平面波前模型。
與時(shí)域采樣定理類(lèi)似，為了防止出現(xiàn)空間混迭現(xiàn)象，基于麥克風(fēng)陣列傳感器空間釆樣也需要滿(mǎn)足一定的條件，稱(chēng)為空間采樣定理，描述為式(l)-
<formula>formula see original document page 5</formula> (1)
其中，"是相鄰麥克風(fēng)陣元間的直線距離，A為聲波的波長(zhǎng)。只有空間采樣率足夠高，才能避免空間混迭。然而，如果陣元距離過(guò)小，則是才采樣，采用較多的麥克風(fēng)傳感器并不能提供更多的信號(hào)空間信息。
此外，信號(hào)源與麥克風(fēng)陣列之間距離也將影響信號(hào)模型的建立。定義r為聲源到麥克風(fēng)陣列中心的直線距離，丄為線性麥克風(fēng)陣列的總長(zhǎng)度。如果滿(mǎn)足式
(2)，則符合遠(yuǎn)場(chǎng)條件；反之，則需采用近場(chǎng)模型。
<formula>formula see original document page 5</formula> (2)
對(duì)于一個(gè)均勻線性麥克風(fēng)陣列，采用遠(yuǎn)場(chǎng)平面波模型，則第m個(gè)麥克風(fēng)的輸出離散信號(hào)可表示為
<formula>formula see original document page 5</formula> (3)
其中，^h]為聲源信號(hào)，A 為第m個(gè)麥克風(fēng)接收到的信號(hào)與聲源信號(hào)之間的樣本點(diǎn)延遲，77j"]為第m個(gè)麥克風(fēng)接收到的噪聲信號(hào)。
A^為第m個(gè)麥克風(fēng)接收到的信號(hào)與聲源信號(hào)之間的時(shí)間延遲，則有如下關(guān)
系式-
<formula>formula see original document page 5</formula> (4)
式(4)中，乂為采樣頻率，c為聲波在空間傳播的速度。
前述步驟2)中的語(yǔ)音端點(diǎn)檢測(cè)(Voice Activity Detection, VAD)步驟可視不同語(yǔ)音增強(qiáng)算法或增或減。魯棒的VAD方法對(duì)實(shí)現(xiàn)噪聲信號(hào)的統(tǒng)計(jì)特征估計(jì)，以及后續(xù)的語(yǔ)音增強(qiáng)算法的性能都具有重要的作用。通常辦法是采用單一通道的基于短時(shí)能量的VAD方法、基于過(guò)零率的VAD方法、基于線性預(yù)測(cè)系統(tǒng)的VAD方法等等。此外，基于陣列結(jié)構(gòu)的端點(diǎn)檢測(cè)方法常用的有基于波束形成
器的VAD方法、基于相位向量的VAD方法以及基于GSC的空間VAD方法。
前述步驟3)中，語(yǔ)音增強(qiáng)技術(shù)主要可分為基于單一麥克風(fēng)的方法和基于麥克風(fēng)陣列的方法，其中基于單一麥克風(fēng)的方法最成熟也最簡(jiǎn)單有效的是譜減法語(yǔ)音增強(qiáng)算法；而基于麥克風(fēng)陣列的方法目前廣泛采用的有a)固定波束形成器(Fixed B醒fo謹(jǐn)g, FBF); b)自適應(yīng)波束形成器(Adaptive Beamforming, ABF); c)具有自適應(yīng)后置濾波器的波束形成法(Microphone Arrays with Adaptive Postfiltering); d)廣義旁瓣消除法(Generalized Sidelobe Canceller, GSC)等等。除此之外，一些改進(jìn)的算法、聯(lián)合的算法也層出不窮。常用的有將譜減法與固定波束形成器相結(jié)合的語(yǔ)音增強(qiáng)方法；固定波束形成器與自適應(yīng)后置濾波聯(lián)合語(yǔ)音增強(qiáng)方法；基于空間傳輸函數(shù)的廣義旁瓣消除語(yǔ)音增強(qiáng)方法等。常用的基于時(shí)延-累加波束形成
前述的譜減法(Spectral Subtraction, SS)語(yǔ)音增強(qiáng)算法是經(jīng)典的單一通道語(yǔ) 音增強(qiáng)方法之一，是1979年由美國(guó)猶他大學(xué)(University of Utah) Steven F. Boll 教授提出的一種普遍應(yīng)用于單通道含加性噪聲的語(yǔ)音增強(qiáng)算法。如圖2所示，該方法通過(guò)對(duì)受污染的語(yǔ)音信號(hào)和估計(jì)的噪聲信號(hào)的短時(shí)幅度譜進(jìn)行相減處理，獲得純凈的語(yǔ)音信號(hào)，其效果相當(dāng)于在變換域?qū)胝Z(yǔ)音信號(hào)進(jìn)行了某種均衡化處理。然而，實(shí)際中噪聲的頻譜服從高斯分布，噪聲的幀功率譜變化范圍很寬，在頻域中的最大、最小值之比往往達(dá)到幾個(gè)數(shù)量級(jí)，而最大值與均值之比也達(dá)6-8倍。因此，在減去噪聲譜之后，會(huì)有較大的功率譜分量的剩余部分，在頻譜上呈現(xiàn)隨機(jī)出現(xiàn)的尖峰，在聽(tīng)覺(jué)上形成殘留噪聲。這種噪聲具有一定節(jié) 奏起伏感，稱(chēng)為"音樂(lè)噪聲"。此外，在譜減算法中語(yǔ)音的各個(gè)部分受到的影響是不同的。摩擦音由于其特征與噪聲相似，在處理過(guò)程中會(huì)和噪聲一起被抑制。鼻音能量較低，其功率譜的幅度與噪聲接近，增強(qiáng)效果遠(yuǎn)不如濁音。譜減法的衰減作用使語(yǔ)音的非濁音部分和高頻部分減弱，這就是增強(qiáng)后語(yǔ)音的可懂度下降的原因。
時(shí)延-累加波束形成器(Delay-and-Sum Beamformer， DSBF)是一種典型的固定波束形成器，分為時(shí)延補(bǔ)償和加權(quán)求和兩部分。如圖3所示，采用遠(yuǎn)場(chǎng)模型，假設(shè)噪聲為加性噪聲，以第m通道接收到的信號(hào)為例，其表達(dá)式為^["]"["-A";J + "J"] (5)
利用時(shí)延估計(jì)算法得到語(yǔ)音信號(hào)在各通道的時(shí)間延遲，再采用時(shí)延補(bǔ)償將
各通道信號(hào)在時(shí)域?qū)R，得到
= + (6)
對(duì)各通道信號(hào)進(jìn)行加權(quán)求和，即得到波束形成輸出信號(hào)-
y["] = 2X["],w["] (7)
在波束形成算法中，準(zhǔn)確的時(shí)延估計(jì)是多通道語(yǔ)音增強(qiáng)的基礎(chǔ)。延遲-累加波束形成器具有系統(tǒng)簡(jiǎn)單、算法魯棒、計(jì)算量小的優(yōu)點(diǎn)，可應(yīng)用于實(shí)際系統(tǒng)。
該算法在理論上可獲得101ogH)M的信噪比提高。所以要獲得好的語(yǔ)音增強(qiáng)，則要采用較多的麥克風(fēng)陣元。另外，此算法有隱藏的前提條件，即需要獲得精確的時(shí)間延遲估計(jì)A^、入射信號(hào)為窄帶信號(hào)、不存在空間傳輸損耗和反射信號(hào)和混響信號(hào)，算法主要的不足在于算法對(duì)于空間多于一個(gè)語(yǔ)音聲源或者方向性噪聲、混響干擾嚴(yán)重的情況，其性能下降很快，此外，對(duì)信號(hào)的不同頻率成分，其響應(yīng)不同，通常低頻部分空間分辨率比較差，高頻部分相對(duì)較好。
1988年，R. Zelinski提出了在延遲-累加波束形成器的輸出后端增加一個(gè)后置自適應(yīng)維納濾波器(Wiener Filter)的方法，形成了經(jīng)典的后置濾波器語(yǔ)音增強(qiáng)算法(Delay-and-Sum Beamforming with an Additional Postfiltering)。后置自適應(yīng)濾波方法結(jié)合線性自適應(yīng)波束形成器(ABF)和后置濾波器(Postfilter),利用線性ABF的空間濾波特性和后置濾波器的非相干噪聲抑制特性，可以同時(shí)達(dá) 到空間濾波和頻率濾波語(yǔ)音增強(qiáng)的效果，進(jìn)一步提高輸出信噪比。
后置自適應(yīng)濾波的作用是對(duì)延遲-累加方法獲取的信號(hào)采用自適應(yīng)維納濾波法進(jìn)一步估計(jì)出目標(biāo)語(yǔ)音。其主要思想是假設(shè)
1) 每個(gè)通道接收到的語(yǔ)音信號(hào)與噪聲信號(hào)是不相關(guān)的；
2) 陣列中不同麥克風(fēng)接收到的噪聲信號(hào)是不相關(guān)的；
3) 每個(gè)麥克風(fēng)接收到的噪聲信號(hào)的功率譜密度相同。如圖4所示，經(jīng)時(shí)延補(bǔ)償后，做傅里葉變換轉(zhuǎn)換到頻域，各個(gè)麥克風(fēng)通道的信號(hào)包括目標(biāo)語(yǔ)音信號(hào)和噪聲信號(hào)，加權(quán)后
W)=『m(/)[S(/) + ^(/)] (8)
y(/)=2X(/)
(9)
基于前述三個(gè)假設(shè)，分別計(jì)算各通道的譜密度和通道間互譜密度可以得到 O朋(/)=五ft^(/)(S(/) + 7,(/))][^(/)(S(/) +;;,(/))]}
+ W(/勿,(/)] W(/)W/) + W(/k(/)]] =K(/)|20,,(/) + K(/)「Ow,(/)
=K(/)f[^(/) + <EV,(/)]
(10)
氣"(/)=^[w(/)(s(/)+",(/))][R'(/)諷/)+",(/)):
,W(/艮(/)
根據(jù)維納濾波器的最佳傳遞函數(shù)表達(dá)式
(12)
通過(guò)求輸入各通道的目標(biāo)信號(hào)和噪聲信號(hào)的自相關(guān)譜密度和互相關(guān)譜密度可以分別得到傳遞函數(shù)的分子和分母。
由式(io)和式(11)可以分別得到^,(/)和Om(/) +①J/)，艮P-
<formula>formula see original document page 8</formula>從而，可得到后置自適應(yīng)維納濾波器的傳遞函數(shù)估計(jì)值
<formula>formula see original document page 9</formula>
其中，M表示通道數(shù)目，51(0為取實(shí)部運(yùn)算，*為共軛算子，^(/)為各麥克風(fēng) 通道的信號(hào)延遲-累加的權(quán)重，艮P:
<formula>formula see original document page 9</formula>(16) 則自適應(yīng)維納濾波器輸出的目標(biāo)語(yǔ)音信號(hào)的估計(jì)值為
<formula>formula see original document page 9</formula>(17)
由上述公式可見(jiàn)，后置自適應(yīng)維納濾波方法不受噪聲源的個(gè)數(shù)限制。但該
方法由于是基于假設(shè)條件2)，即陣列中不同麥克風(fēng)接收到的噪聲信號(hào)是不相關(guān) 的，而實(shí)際上，各麥克風(fēng)陣列各通道接收到的噪聲信號(hào)的互相關(guān)函數(shù)只有在高頻情況下才能被基本忽略，在低頻情況下，各通道接收到的噪聲信號(hào)的互相關(guān) 較為明顯，并不能被忽略，因而該方法與固定波束形成算法一樣，對(duì)于信號(hào)的高頻部分增強(qiáng)效果較好，低頻部分增強(qiáng)效果較差。
可見(jiàn)，譜減法和后置濾波法各有優(yōu)劣，單獨(dú)采用一種方法無(wú)法達(dá)到理想的語(yǔ)音增強(qiáng)效果，需要一種對(duì)于低頻和高頻語(yǔ)音信號(hào)都適用的算法進(jìn)行處理。

發(fā)明內(nèi)容
本發(fā)明的目的是為了解決目前在多通道語(yǔ)音增強(qiáng)技術(shù)中均勻陣列對(duì)寬頻帶的語(yǔ)音信號(hào)的頻率響應(yīng)性能不一致的問(wèn)題，且傳統(tǒng)的語(yǔ)音增強(qiáng)方法也存在高頻段和低頻段難以兼顧的問(wèn)題。
為了解決上述技術(shù)問(wèn)題，本發(fā)明提出了一種基于嵌套式子陣列的后置濾波與譜減法相結(jié)合的語(yǔ)音增強(qiáng)方法。本發(fā)明所采取的技術(shù)方案是
第一步設(shè)計(jì)兩個(gè)均勻子陣列嵌套的麥克風(fēng)陣列用于多通道信號(hào)的采集；
所述基于嵌套子陣列的多通道語(yǔ)音信號(hào)至少包括五個(gè)通道語(yǔ)音信號(hào)；第二步檢測(cè)語(yǔ)音信號(hào)的起始、結(jié)束端點(diǎn)，估計(jì)純?cè)肼曅盘?hào)的功率譜；第三步估計(jì)語(yǔ)音信號(hào)在各通道的時(shí)間延遲；
第四步對(duì)各通道語(yǔ)音信號(hào)進(jìn)行時(shí)延補(bǔ)償，將各通道語(yǔ)音信號(hào)在時(shí)域?qū)R; 第五步用傅里葉變換將各通道信號(hào)從時(shí)域轉(zhuǎn)換到頻域；
第六步估計(jì)純凈語(yǔ)音信號(hào)的自功率譜和帶噪語(yǔ)音信號(hào)的自功率譜，得到維納濾波器的頻響函數(shù)；
第七步對(duì)于兩子陣列的信號(hào)，分別用固定波束形成器將各子陣列的每個(gè) 通道的信號(hào)進(jìn)行波束形成；
第八步分別將兩個(gè)子陣列的輸出波束進(jìn)行低通濾波和高通濾波；
第九步對(duì)濾波后的兩子陣列的輸出波束進(jìn)行譜減法或后置維納濾波法處理，實(shí)現(xiàn)語(yǔ)音增強(qiáng)；
第十步將兩路增強(qiáng)后的波束交疊相加，進(jìn)行反傅里葉變換，得到時(shí)域里增強(qiáng)后的語(yǔ)音信號(hào)。
本發(fā)明具有如下優(yōu)點(diǎn)
1) 嵌套子陣列對(duì)寬頻帶的空間語(yǔ)音信號(hào)具有較好的頻率響應(yīng)；
2) 陣列結(jié)構(gòu)簡(jiǎn)單，利用公共的陣元減少了陣列的尺寸，算法的運(yùn)算復(fù)雜度較??；
3) 采用多通道后置濾波語(yǔ)音增強(qiáng)算法僅對(duì)目標(biāo)語(yǔ)音信號(hào)的高頻部分進(jìn)行增強(qiáng)處理，避免了后置濾波語(yǔ)音增強(qiáng)算法對(duì)低頻段的語(yǔ)音信號(hào)增強(qiáng)性能下降的問(wèn)題；
4) 算法易于實(shí)現(xiàn)，計(jì)算量小，適用于PC機(jī)平臺(tái)和嵌入式平臺(tái)。

圖1.典型的語(yǔ)音增強(qiáng)方法步驟圖
圖2.幅度譜減法語(yǔ)音增強(qiáng)方法流程圖
圖3.延遲-累加波束形成器流程圖
圖4.后置自適應(yīng)維納濾波語(yǔ)音增強(qiáng)方法流程圖
圖5.基于嵌套子陣列的后置濾波與譜減法聯(lián)合語(yǔ)音增強(qiáng)方法流程圖
圖6.嵌套子陣列設(shè)計(jì)圖
具體實(shí)施例方式
基于嵌套子陣列的后置濾波與譜減法聯(lián)合語(yǔ)音增強(qiáng)方法的流程框圖如圖5 所示，其中由多通道信號(hào)采集、時(shí)延補(bǔ)償、波束形成、后置自適應(yīng)濾波四部分組成。下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。本實(shí)施案例并不限制本發(fā)明，對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員，在不脫離本發(fā)明原理的前提下，還可以做出若干改進(jìn)和變化，這些改進(jìn)和變化也應(yīng)視為本發(fā)明的保護(hù)范圍之內(nèi)。
本實(shí)施安全運(yùn)行在普通PC機(jī)上，具體配置如下
CPU: Celeron 2.80GHz 內(nèi)存1GHz
操作系統(tǒng)Windows XP Professional Edition 運(yùn)行環(huán)境MathWorks MATLAB R2006b
采用本發(fā)明的實(shí)施案例，針對(duì)室內(nèi)環(huán)境中的聲源特性及噪聲場(chǎng)特性，采用散射噪聲場(chǎng)(Diffiise Noise Field)模型和嵌套子陣列(Harmonically Nested Subarrays, HNSA)模型，對(duì)實(shí)際環(huán)境中的多通道含噪語(yǔ)音信號(hào)進(jìn)行建模。通過(guò) 由7個(gè)全指向性麥克風(fēng)組成的兩個(gè)子陣列嵌套結(jié)構(gòu)的陣列采集空間中的語(yǔ)音信號(hào)，每個(gè)子陣列包含5個(gè)陣元，則M-5，用x;,["]和x二[n]分別表示小子陣列 (Small)和大子陣列(Large)的某一通道的信號(hào)，且/ = 1，...，5， 7 = 1,…，5。由于嵌套性，其中部分麥克風(fēng)通道共用
對(duì)于式(5)和式(6)所給出的信號(hào)模型，延時(shí)補(bǔ)償后，再經(jīng)過(guò)傅里葉變換，兩個(gè)子陣列某一通道的頻域信號(hào)表達(dá)式-
<formula>formula see original document page 11</formula>(19)
<formula>formula see original document page 11</formula>(20) 其中，S(/)是純凈語(yǔ)音信號(hào)的傅里葉變換，^(/)和^(/)分別兩子陣列第Z通道和第y通道的噪聲的傅里葉變換，^是幀長(zhǎng)<
對(duì)大小兩子陣列分別做累加波束形成
rs(/)=4i>s,(/) (21)
&(/)=會(huì)1>&(/) (22)
將波束形成輸出i;(/)和K(/)分別通過(guò)高通(HP) FIR濾波器和低通(LP) FIR濾波器，得到K(/)和將寬頻帶的語(yǔ)音信號(hào)分成兩個(gè)頻段分別用不同的語(yǔ)音增強(qiáng)算法進(jìn)行處理。
對(duì)于低頻信號(hào)，采用如圖4所示的譜減法進(jìn)行去噪增強(qiáng)
A(/)H之'(/)卜"/) 。"
其中，&(/)是經(jīng)過(guò)譜減法去噪后的目標(biāo)語(yǔ)音信號(hào)的估計(jì)值，"/)是采用語(yǔ)音活動(dòng)檢測(cè)方法在非語(yǔ)音段估計(jì)的噪聲信號(hào)的幅度平均值。
而對(duì)于高頻信號(hào)，采用如圖6和圖1所示的后置自適應(yīng)維納濾波法進(jìn)行語(yǔ) 音增強(qiáng)。對(duì)于子陣列中任意兩通道/和,z、y，帶噪語(yǔ)音信號(hào)的自功率譜密度和互功率譜密度分別為
①早,C/V^(/) + (D卿(/) (24)
c^," (/) = ￡{X(/)Z;(/)} = ^(/) + O邵(/) + Os". (/) + (/) ( 25)
基于前述后置自適應(yīng)維納濾波法的三個(gè)假設(shè)條件，各通道的噪聲信號(hào)互不相關(guān)，且與聲源信號(hào)也不相關(guān)，貝U:
0怖(/)=氣,(/) = 0柳,(/) = 0
(26)
且每個(gè)麥克風(fēng)接收到的噪聲信號(hào)的功率譜密度相同，定義為:
0卿(/) = <1>，(/) = (1)"/)
則式(24)和式(")可改寫(xiě)為
。早,(/) = ^(/) + ^(/)
12
(27)
(28)其中
6早,(/) = :|^,(/)|
2 M-l A/
(29)
(30)
(31)
考慮實(shí)際情況中的信號(hào)短時(shí)平穩(wěn)性，F(xiàn)FT的長(zhǎng)度L是有限的，因而式(25) 中的后三項(xiàng)不可能為0，而是趨近于0的一個(gè)復(fù)數(shù)。由于信號(hào)功率譜OJ/)只可能是正實(shí)數(shù)，所以得到
",) ,te^S曹,(32)
此外，各通道的信號(hào)是通過(guò)一種迭代平滑的方式處理得到的。對(duì)于某一頻率點(diǎn)t,定義一個(gè)長(zhǎng)度為2戶(hù)+ l的平滑區(qū)間[A:-/7，A: + / ]，貝U
2/7 + l,=_p
(33)
(34)
(35)
綜合考慮精度和計(jì)算量之間的關(guān)系，通常取p-l或2。
則通過(guò)高通濾波器后的輸出信號(hào)《(/)再通過(guò)自適應(yīng)維納濾波器，得到增強(qiáng)
后的高頻段的語(yǔ)音信號(hào)
式-(/) = &'(/) (36)
將高、低兩頻率段的語(yǔ)音信號(hào)進(jìn)行交疊相加傅里葉綜合(Fourier Synthesis Overlap-Add),轉(zhuǎn)換成時(shí)域內(nèi)增強(qiáng)后的語(yǔ)音信號(hào)5["]。
權(quán)利要求
1、一種采用嵌套子陣列的后置濾波譜減法聯(lián)合的語(yǔ)音增強(qiáng)方法，用于室內(nèi)環(huán)境的多通道語(yǔ)音信號(hào)增強(qiáng)，其特征在于，所述方法包括1)設(shè)計(jì)兩個(gè)均勻子陣列嵌套的麥克風(fēng)陣列用于多通道信號(hào)的采集；2)檢測(cè)語(yǔ)音信號(hào)的起始、結(jié)束端點(diǎn)，估計(jì)純?cè)肼曅盘?hào)的功率譜；3)估計(jì)語(yǔ)音信號(hào)在各通道的時(shí)間延遲；4)對(duì)各通道語(yǔ)音信號(hào)進(jìn)行時(shí)延補(bǔ)償，將各通道語(yǔ)音信號(hào)在時(shí)域?qū)R；5)用傅里葉變換將各通道信號(hào)從時(shí)域轉(zhuǎn)換到頻域；6)估計(jì)純凈語(yǔ)音信號(hào)的自功率譜和帶噪語(yǔ)音信號(hào)的自功率譜，得到維納濾波器的頻響函數(shù)；7)對(duì)于兩子陣列的信號(hào)，分別用固定波束形成器將各子陣列的每個(gè)通道的信號(hào)進(jìn)行波束形成；8)分別將兩個(gè)子陣列的輸出波束進(jìn)行低通濾波和高通濾波；9)對(duì)濾波后的兩子陣列的輸出波束進(jìn)行譜減法或后置維納濾波法處理，實(shí)現(xiàn)語(yǔ)音增強(qiáng)；10)將兩路增強(qiáng)后的波束交疊相加，進(jìn)行反傅里葉變換，得到時(shí)域里增強(qiáng)后的語(yǔ)音信號(hào)。
2、根據(jù)權(quán)利要求1所述的嵌套子陣列的麥克風(fēng)陣列結(jié)構(gòu)，其特征在于，步驟 (l)所述的，每個(gè)子陣列是都是間距固定的均勻線性陣列，且大子陣列的間距是小子陣列間距的2倍，部分陣元可共用。
3、根據(jù)權(quán)利要求1或2所述的將兩子陣列波束形成后的語(yǔ)音信號(hào)進(jìn)行低通濾波或高通濾波，其特征在于，步驟(8)所述的，對(duì)大子陣列各通道波束形成后的語(yǔ)音信號(hào)進(jìn)行低通濾波，對(duì)小子陣列各通道波束形成后的語(yǔ)音信號(hào)進(jìn) 行高通濾波，使得語(yǔ)音信號(hào)在整個(gè)頻率帶上都有較好的頻率響應(yīng)。
4、根據(jù)權(quán)利要求1或3所述的分別用譜減法和后置維納濾波器對(duì)兩子陣列的輸出波束進(jìn)行增強(qiáng)處理，其特征在于，步驟(9)所述的，用功率譜減法對(duì)低通濾波后的輸出波束進(jìn)行譜相減處理，實(shí)現(xiàn)語(yǔ)音信號(hào)低頻部分的增強(qiáng)；用所述的后置維納濾波器對(duì)高通濾波后的輸出波束進(jìn)行濾波，實(shí)現(xiàn)語(yǔ)音信號(hào) 高頻部分的增強(qiáng)。
5、根據(jù)權(quán)利要求1或2所述的采用嵌套子陣列的后置濾波譜減法聯(lián)合語(yǔ)音增強(qiáng)方法，其特征在于，所述多通道語(yǔ)音信號(hào)至少包括五個(gè)通道語(yǔ)音信號(hào)。
全文摘要
本發(fā)明公開(kāi)了一種基于嵌套子陣列的自適應(yīng)后置濾波與譜減法聯(lián)合的語(yǔ)音增強(qiáng)方法，適用于室內(nèi)環(huán)境，包括車(chē)載環(huán)境的多通道語(yǔ)音信號(hào)的增強(qiáng)。由于本發(fā)明考慮到了語(yǔ)音信號(hào)的寬帶非平穩(wěn)特性，基于麥克風(fēng)陣列多通道語(yǔ)音增強(qiáng)方法對(duì)于語(yǔ)音信號(hào)的頻率響應(yīng)不一致，且在實(shí)際噪聲場(chǎng)環(huán)境中，各通道噪聲之間的相關(guān)性等問(wèn)題，通過(guò)由間距不等的子陣列嵌套構(gòu)成的麥克風(fēng)陣列采集語(yǔ)音信號(hào)，并將各子陣列波束形成后的語(yǔ)音信號(hào)分成高頻段和低頻段，采用不同的語(yǔ)音增強(qiáng)算法進(jìn)行處理，優(yōu)勢(shì)互補(bǔ)，提高了語(yǔ)音增強(qiáng)的效果。
文檔編號(hào)G10L21/02GK101447190SQ200810068000
公開(kāi)日2009年6月3日申請(qǐng)日期2008年6月25日優(yōu)先權(quán)日2008年6月25日
發(fā)明者波萬(wàn), 璟趙, 鄒月嫻申請(qǐng)人:北京大學(xué)深圳研究生院

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：鄒月嫻;趙璟;萬(wàn)波
技術(shù)所有人：北京大學(xué)深圳研究生院
我是此專(zhuān)利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

顏色濾波陣列相關(guān)技術(shù)

彩色濾波陣列相關(guān)技術(shù)

基于陣列的空間濾波相關(guān)技術(shù)

濾波陣列板相關(guān)技術(shù)

后置濾波器相關(guān)技術(shù)

if函數(shù)嵌套相關(guān)技術(shù)

嵌套相關(guān)技術(shù)

if嵌套相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于嵌套子陣列的后置濾波與譜減法聯(lián)合語(yǔ)音增強(qiáng)方法