亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于嵌套子陣列的后置濾波與譜減法聯(lián)合語(yǔ)音增強(qiáng)方法

文檔序號(hào):2830792閱讀:856來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):基于嵌套子陣列的后置濾波與譜減法聯(lián)合語(yǔ)音增強(qiáng)方法
技術(shù)領(lǐng)域
本發(fā)明涉及到計(jì)算機(jī)語(yǔ)音信號(hào)處理領(lǐng)域,更具體地說(shuō),本發(fā)明涉及一種基 于嵌套子陣列的后置濾波與譜減法聯(lián)合語(yǔ)音增強(qiáng)方法,尤其適用于室內(nèi)嘈雜環(huán) 境中話音信號(hào)的增強(qiáng)。
背景技術(shù)
語(yǔ)音增強(qiáng)(SpeechEnhancement)技術(shù)就是對(duì)帶噪的語(yǔ)音進(jìn)行相關(guān)處理,從 中提取盡可能純凈的原始語(yǔ)音,以改善接收端語(yǔ)音質(zhì)量,提高語(yǔ)音的清晰度、 可懂度和舒適度,使人易于接受或提高語(yǔ)音處理系統(tǒng)的性能。常用在自動(dòng)語(yǔ)音 識(shí)別系統(tǒng)、車(chē)載非手持式電話、多媒體會(huì)議、無(wú)線通信、場(chǎng)景錄音、軍事竊聽(tīng)、 助聽(tīng)設(shè)備和智能機(jī)器人等領(lǐng)域。語(yǔ)音增強(qiáng)技術(shù)的研究發(fā)展已有四十多年的歷史, 傳統(tǒng)的方法皆是基于單一麥克風(fēng)的系統(tǒng),其拾音范圍、指向性變化、噪聲抑制 能力等問(wèn)題都受到一定的限制?;邴溈孙L(fēng)陣列的自適應(yīng)語(yǔ)音增強(qiáng)技術(shù)融合了 陣列信號(hào)處理技術(shù)、語(yǔ)音信號(hào)處理技術(shù)以及多通道信號(hào)采集技術(shù)等多項(xiàng)關(guān)鍵技 術(shù)。其技術(shù)優(yōu)勢(shì)在于它不僅可以利用語(yǔ)音信號(hào)的時(shí)域和頻域特性,而且可以利 用其空間信息來(lái)實(shí)現(xiàn)對(duì)噪聲的消除,達(dá)到增強(qiáng)和純化語(yǔ)音的目的?;邴溈孙L(fēng) 陣列的語(yǔ)音增強(qiáng)方法典型的工作流程如圖l所示,具體描述如下-
1) 根據(jù)應(yīng)用要求設(shè)計(jì)麥克風(fēng)陣列結(jié)構(gòu);
2) 利用麥克風(fēng)陣列接收到的多通道語(yǔ)音信號(hào)的時(shí)間、頻率、空間信息, 對(duì)語(yǔ)音信號(hào)的起始、結(jié)束端點(diǎn)進(jìn)行檢測(cè),同時(shí)估計(jì)通道之間的時(shí)間延 遲,估計(jì)信號(hào)空間方位信息;
3) 采用語(yǔ)音增強(qiáng)算法對(duì)多通道信號(hào)進(jìn)行處理,實(shí)現(xiàn)語(yǔ)音信號(hào)的增強(qiáng)。 前述步驟l)中的麥克風(fēng)陣列結(jié)構(gòu)設(shè)計(jì)是一項(xiàng)關(guān)鍵的步驟。傳統(tǒng)的陣列結(jié)構(gòu)
有均勻線陣、非均勻線陣、均勻圓陣和球面陣列等。陣列結(jié)構(gòu)的設(shè)計(jì)與多通道 信號(hào)模型的選擇有密切關(guān)系。
陣列信號(hào)模型分為近場(chǎng)模型和遠(yuǎn)場(chǎng)模型,其最大區(qū)別在于在遠(yuǎn)場(chǎng)模型中, 各陣元接收到的信號(hào)幅度被認(rèn)為是相同的,有相位差;而近場(chǎng)模型則需要考慮傳播路徑的不同帶來(lái)的信號(hào)幅度衰減,即近場(chǎng)模型除了要考慮信源的到達(dá)方向 之外,還必須考慮信源到各個(gè)麥克風(fēng)的距離。在近場(chǎng)情況下,通常采用球面波 前模型,來(lái)代替遠(yuǎn)場(chǎng)的平面波前模型。
與時(shí)域采樣定理類(lèi)似,為了防止出現(xiàn)空間混迭現(xiàn)象,基于麥克風(fēng)陣列傳感 器空間釆樣也需要滿(mǎn)足一定的條件,稱(chēng)為空間采樣定理,描述為式(l)-
<formula>formula see original document page 5</formula> (1)
其中,"是相鄰麥克風(fēng)陣元間的直線距離,A為聲波的波長(zhǎng)。只有空間采樣率足 夠高,才能避免空間混迭。然而,如果陣元距離過(guò)小,則是才采樣,采用較多 的麥克風(fēng)傳感器并不能提供更多的信號(hào)空間信息。
此外,信號(hào)源與麥克風(fēng)陣列之間距離也將影響信號(hào)模型的建立。定義r為聲 源到麥克風(fēng)陣列中心的直線距離,丄為線性麥克風(fēng)陣列的總長(zhǎng)度。如果滿(mǎn)足式
(2),則符合遠(yuǎn)場(chǎng)條件;反之,則需采用近場(chǎng)模型。
<formula>formula see original document page 5</formula> (2)
對(duì)于一個(gè)均勻線性麥克風(fēng)陣列,采用遠(yuǎn)場(chǎng)平面波模型,則第m個(gè)麥克風(fēng)的 輸出離散信號(hào)可表示為
<formula>formula see original document page 5</formula> (3)
其中,^h]為聲源信號(hào),A 為第m個(gè)麥克風(fēng)接收到的信號(hào)與聲源信號(hào)之間的樣 本點(diǎn)延遲,77j"]為第m個(gè)麥克風(fēng)接收到的噪聲信號(hào)。
A^為第m個(gè)麥克風(fēng)接收到的信號(hào)與聲源信號(hào)之間的時(shí)間延遲,則有如下關(guān)
系式-
<formula>formula see original document page 5</formula> (4)
式(4)中,乂為采樣頻率,c為聲波在空間傳播的速度。
前述步驟2)中的語(yǔ)音端點(diǎn)檢測(cè)(Voice Activity Detection, VAD)步驟可視不 同語(yǔ)音增強(qiáng)算法或增或減。魯棒的VAD方法對(duì)實(shí)現(xiàn)噪聲信號(hào)的統(tǒng)計(jì)特征估計(jì), 以及后續(xù)的語(yǔ)音增強(qiáng)算法的性能都具有重要的作用。通常辦法是采用單一通道 的基于短時(shí)能量的VAD方法、基于過(guò)零率的VAD方法、基于線性預(yù)測(cè)系統(tǒng)的VAD方法等等。此外,基于陣列結(jié)構(gòu)的端點(diǎn)檢測(cè)方法常用的有基于波束形成
器的VAD方法、基于相位向量的VAD方法以及基于GSC的空間VAD方法。
前述步驟3)中,語(yǔ)音增強(qiáng)技術(shù)主要可分為基于單一麥克風(fēng)的方法和基于麥 克風(fēng)陣列的方法,其中基于單一麥克風(fēng)的方法最成熟也最簡(jiǎn)單有效的是譜減法 語(yǔ)音增強(qiáng)算法;而基于麥克風(fēng)陣列的方法目前廣泛采用的有a)固定波束形成 器(Fixed B醒fo謹(jǐn)g, FBF); b)自適應(yīng)波束形成器(Adaptive Beamforming, ABF); c)具有自適應(yīng)后置濾波器的波束形成法(Microphone Arrays with Adaptive Postfiltering); d)廣義旁瓣消除法(Generalized Sidelobe Canceller, GSC)等等。 除此之外, 一些改進(jìn)的算法、聯(lián)合的算法也層出不窮。常用的有將譜減法與固 定波束形成器相結(jié)合的語(yǔ)音增強(qiáng)方法;固定波束形成器與自適應(yīng)后置濾波聯(lián)合 語(yǔ)音增強(qiáng)方法;基于空間傳輸函數(shù)的廣義旁瓣消除語(yǔ)音增強(qiáng)方法等。常用的基 于時(shí)延-累加波束形成
前述的譜減法(Spectral Subtraction, SS)語(yǔ)音增強(qiáng)算法是經(jīng)典的單一通道語(yǔ) 音增強(qiáng)方法之一,是1979年由美國(guó)猶他大學(xué)(University of Utah) Steven F. Boll 教授提出的一種普遍應(yīng)用于單通道含加性噪聲的語(yǔ)音增強(qiáng)算法。如圖2所示, 該方法通過(guò)對(duì)受污染的語(yǔ)音信號(hào)和估計(jì)的噪聲信號(hào)的短時(shí)幅度譜進(jìn)行相減處 理,獲得純凈的語(yǔ)音信號(hào),其效果相當(dāng)于在變換域?qū)胝Z(yǔ)音信號(hào)進(jìn)行了某種 均衡化處理。然而,實(shí)際中噪聲的頻譜服從高斯分布,噪聲的幀功率譜變化范 圍很寬,在頻域中的最大、最小值之比往往達(dá)到幾個(gè)數(shù)量級(jí),而最大值與均值 之比也達(dá)6-8倍。因此,在減去噪聲譜之后,會(huì)有較大的功率譜分量的剩余部分, 在頻譜上呈現(xiàn)隨機(jī)出現(xiàn)的尖峰,在聽(tīng)覺(jué)上形成殘留噪聲。這種噪聲具有一定節(jié) 奏起伏感,稱(chēng)為"音樂(lè)噪聲"。此外,在譜減算法中語(yǔ)音的各個(gè)部分受到的影響 是不同的。摩擦音由于其特征與噪聲相似,在處理過(guò)程中會(huì)和噪聲一起被抑制。 鼻音能量較低,其功率譜的幅度與噪聲接近,增強(qiáng)效果遠(yuǎn)不如濁音。譜減法的 衰減作用使語(yǔ)音的非濁音部分和高頻部分減弱,這就是增強(qiáng)后語(yǔ)音的可懂度下 降的原因。
時(shí)延-累加波束形成器(Delay-and-Sum Beamformer, DSBF)是一種典型的 固定波束形成器,分為時(shí)延補(bǔ)償和加權(quán)求和兩部分。如圖3所示,采用遠(yuǎn)場(chǎng)模 型,假設(shè)噪聲為加性噪聲,以第m通道接收到的信號(hào)為例,其表達(dá)式為^["]"["-A";J + "J"] (5)
利用時(shí)延估計(jì)算法得到語(yǔ)音信號(hào)在各通道的時(shí)間延遲,再采用時(shí)延補(bǔ)償將
各通道信號(hào)在時(shí)域?qū)R,得到
= + (6)
對(duì)各通道信號(hào)進(jìn)行加權(quán)求和,即得到波束形成輸出信號(hào)-
y["] = 2X["],w["] (7)
在波束形成算法中,準(zhǔn)確的時(shí)延估計(jì)是多通道語(yǔ)音增強(qiáng)的基礎(chǔ)。延遲-累加 波束形成器具有系統(tǒng)簡(jiǎn)單、算法魯棒、計(jì)算量小的優(yōu)點(diǎn),可應(yīng)用于實(shí)際系統(tǒng)。
該算法在理論上可獲得101ogH)M的信噪比提高。所以要獲得好的語(yǔ)音增強(qiáng),則 要采用較多的麥克風(fēng)陣元。另外,此算法有隱藏的前提條件,即需要獲得精確 的時(shí)間延遲估計(jì)A^、入射信號(hào)為窄帶信號(hào)、不存在空間傳輸損耗和反射信號(hào)和 混響信號(hào),算法主要的不足在于算法對(duì)于空間多于一個(gè)語(yǔ)音聲源或者方向性 噪聲、混響干擾嚴(yán)重的情況,其性能下降很快,此外,對(duì)信號(hào)的不同頻率成分, 其響應(yīng)不同,通常低頻部分空間分辨率比較差,高頻部分相對(duì)較好。
1988年,R. Zelinski提出了在延遲-累加波束形成器的輸出后端增加一個(gè)后 置自適應(yīng)維納濾波器(Wiener Filter)的方法,形成了經(jīng)典的后置濾波器語(yǔ)音增 強(qiáng)算法(Delay-and-Sum Beamforming with an Additional Postfiltering)。后置自適 應(yīng)濾波方法結(jié)合線性自適應(yīng)波束形成器(ABF)和后置濾波器(Postfilter),利 用線性ABF的空間濾波特性和后置濾波器的非相干噪聲抑制特性,可以同時(shí)達(dá) 到空間濾波和頻率濾波語(yǔ)音增強(qiáng)的效果,進(jìn)一步提高輸出信噪比。
后置自適應(yīng)濾波的作用是對(duì)延遲-累加方法獲取的信號(hào)采用自適應(yīng)維納濾波 法進(jìn)一步估計(jì)出目標(biāo)語(yǔ)音。其主要思想是假設(shè)
1) 每個(gè)通道接收到的語(yǔ)音信號(hào)與噪聲信號(hào)是不相關(guān)的;
2) 陣列中不同麥克風(fēng)接收到的噪聲信號(hào)是不相關(guān)的;
3) 每個(gè)麥克風(fēng)接收到的噪聲信號(hào)的功率譜密度相同。如圖4所示,經(jīng)時(shí)延補(bǔ)償后,做傅里葉變換轉(zhuǎn)換到頻域,各個(gè)麥克風(fēng)通道 的信號(hào)包括目標(biāo)語(yǔ)音信號(hào)和噪聲信號(hào),加權(quán)后
W)=『m(/)[S(/) + ^(/)] (8)
y(/)=2X(/)
(9)
基于前述三個(gè)假設(shè),分別計(jì)算各通道的譜密度和通道間互譜密度可以得到 O朋(/)=五ft^(/)(S(/) + 7,(/))][^(/)(S(/) +;;,(/))]}
+ W(/勿,(/)] W(/)W/) + W(/k(/)]] =K(/)|20,,(/) + K(/)「Ow,(/)
=K(/)f[^(/) + <EV,(/)]
(10)
氣"(/)=^[w(/)(s(/)+",(/))][R'(/)諷/)+",(/)):
,W(/艮(/)
根據(jù)維納濾波器的最佳傳遞函數(shù)表達(dá)式
(12)
通過(guò)求輸入各通道的目標(biāo)信號(hào)和噪聲信號(hào)的自相關(guān)譜密度和互相關(guān)譜密度可以 分別得到傳遞函數(shù)的分子和分母。
由式(io)和式(11)可以分別得到^,(/)和Om(/) +①J/),艮P-
<formula>formula see original document page 8</formula>從而,可得到后置自適應(yīng)維納濾波器的傳遞函數(shù)估計(jì)值
<formula>formula see original document page 9</formula>
其中,M表示通道數(shù)目,51(0為取實(shí)部運(yùn)算,*為共軛算子,^(/)為各麥克風(fēng) 通道的信號(hào)延遲-累加的權(quán)重,艮P:
<formula>formula see original document page 9</formula>(16) 則自適應(yīng)維納濾波器輸出的目標(biāo)語(yǔ)音信號(hào)的估計(jì)值為
<formula>formula see original document page 9</formula>(17)
由上述公式可見(jiàn),后置自適應(yīng)維納濾波方法不受噪聲源的個(gè)數(shù)限制。但該
方法由于是基于假設(shè)條件2),即陣列中不同麥克風(fēng)接收到的噪聲信號(hào)是不相關(guān) 的,而實(shí)際上,各麥克風(fēng)陣列各通道接收到的噪聲信號(hào)的互相關(guān)函數(shù)只有在高 頻情況下才能被基本忽略,在低頻情況下,各通道接收到的噪聲信號(hào)的互相關(guān) 較為明顯,并不能被忽略,因而該方法與固定波束形成算法一樣,對(duì)于信號(hào)的 高頻部分增強(qiáng)效果較好,低頻部分增強(qiáng)效果較差。
可見(jiàn),譜減法和后置濾波法各有優(yōu)劣,單獨(dú)采用一種方法無(wú)法達(dá)到理想的 語(yǔ)音增強(qiáng)效果,需要一種對(duì)于低頻和高頻語(yǔ)音信號(hào)都適用的算法進(jìn)行處理。

發(fā)明內(nèi)容
本發(fā)明的目的是為了解決目前在多通道語(yǔ)音增強(qiáng)技術(shù)中均勻陣列對(duì)寬頻帶 的語(yǔ)音信號(hào)的頻率響應(yīng)性能不一致的問(wèn)題,且傳統(tǒng)的語(yǔ)音增強(qiáng)方法也存在高頻 段和低頻段難以兼顧的問(wèn)題。
為了解決上述技術(shù)問(wèn)題,本發(fā)明提出了一種基于嵌套式子陣列的后置濾波 與譜減法相結(jié)合的語(yǔ)音增強(qiáng)方法。本發(fā)明所采取的技術(shù)方案是
第一步設(shè)計(jì)兩個(gè)均勻子陣列嵌套的麥克風(fēng)陣列用于多通道信號(hào)的采集;
所述基于嵌套子陣列的多通道語(yǔ)音信號(hào)至少包括五個(gè)通道語(yǔ)音信號(hào);第二步檢測(cè)語(yǔ)音信號(hào)的起始、結(jié)束端點(diǎn),估計(jì)純?cè)肼曅盘?hào)的功率譜; 第三步估計(jì)語(yǔ)音信號(hào)在各通道的時(shí)間延遲;
第四步對(duì)各通道語(yǔ)音信號(hào)進(jìn)行時(shí)延補(bǔ)償,將各通道語(yǔ)音信號(hào)在時(shí)域?qū)R; 第五步用傅里葉變換將各通道信號(hào)從時(shí)域轉(zhuǎn)換到頻域;
第六步估計(jì)純凈語(yǔ)音信號(hào)的自功率譜和帶噪語(yǔ)音信號(hào)的自功率譜,得到 維納濾波器的頻響函數(shù);
第七步對(duì)于兩子陣列的信號(hào),分別用固定波束形成器將各子陣列的每個(gè) 通道的信號(hào)進(jìn)行波束形成;
第八步分別將兩個(gè)子陣列的輸出波束進(jìn)行低通濾波和高通濾波;
第九步對(duì)濾波后的兩子陣列的輸出波束進(jìn)行譜減法或后置維納濾波法處 理,實(shí)現(xiàn)語(yǔ)音增強(qiáng);
第十步將兩路增強(qiáng)后的波束交疊相加,進(jìn)行反傅里葉變換,得到時(shí)域里 增強(qiáng)后的語(yǔ)音信號(hào)。
本發(fā)明具有如下優(yōu)點(diǎn)
1) 嵌套子陣列對(duì)寬頻帶的空間語(yǔ)音信號(hào)具有較好的頻率響應(yīng);
2) 陣列結(jié)構(gòu)簡(jiǎn)單,利用公共的陣元減少了陣列的尺寸,算法的運(yùn)算復(fù)雜度 較??;
3) 采用多通道后置濾波語(yǔ)音增強(qiáng)算法僅對(duì)目標(biāo)語(yǔ)音信號(hào)的高頻部分進(jìn)行 增強(qiáng)處理,避免了后置濾波語(yǔ)音增強(qiáng)算法對(duì)低頻段的語(yǔ)音信號(hào)增強(qiáng)性能 下降的問(wèn)題;
4) 算法易于實(shí)現(xiàn),計(jì)算量小,適用于PC機(jī)平臺(tái)和嵌入式平臺(tái)。


圖1.典型的語(yǔ)音增強(qiáng)方法步驟圖
圖2.幅度譜減法語(yǔ)音增強(qiáng)方法流程圖
圖3.延遲-累加波束形成器流程圖
圖4.后置自適應(yīng)維納濾波語(yǔ)音增強(qiáng)方法流程圖
圖5.基于嵌套子陣列的后置濾波與譜減法聯(lián)合語(yǔ)音增強(qiáng)方法流程圖
圖6.嵌套子陣列設(shè)計(jì)圖
具體實(shí)施例方式
基于嵌套子陣列的后置濾波與譜減法聯(lián)合語(yǔ)音增強(qiáng)方法的流程框圖如圖5 所示,其中由多通道信號(hào)采集、時(shí)延補(bǔ)償、波束形成、后置自適應(yīng)濾波四部分 組成。下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。本實(shí)施案例 并不限制本發(fā)明,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明原理的前 提下,還可以做出若干改進(jìn)和變化,這些改進(jìn)和變化也應(yīng)視為本發(fā)明的保護(hù)范 圍之內(nèi)。
本實(shí)施安全運(yùn)行在普通PC機(jī)上,具體配置如下
CPU: Celeron 2.80GHz 內(nèi)存1GHz
操作系統(tǒng)Windows XP Professional Edition 運(yùn)行環(huán)境MathWorks MATLAB R2006b
采用本發(fā)明的實(shí)施案例,針對(duì)室內(nèi)環(huán)境中的聲源特性及噪聲場(chǎng)特性,采用 散射噪聲場(chǎng)(Diffiise Noise Field)模型和嵌套子陣列(Harmonically Nested Subarrays, HNSA)模型,對(duì)實(shí)際環(huán)境中的多通道含噪語(yǔ)音信號(hào)進(jìn)行建模。通過(guò) 由7個(gè)全指向性麥克風(fēng)組成的兩個(gè)子陣列嵌套結(jié)構(gòu)的陣列采集空間中的語(yǔ)音信 號(hào),每個(gè)子陣列包含5個(gè)陣元,則M-5,用x;,["]和x二[n]分別表示小子陣列 (Small)和大子陣列(Large)的某一通道的信號(hào),且/ = 1,...,5, 7 = 1,…,5。由 于嵌套性,其中部分麥克風(fēng)通道共用
對(duì)于式(5)和式(6)所給出的信號(hào)模型,延時(shí)補(bǔ)償后,再經(jīng)過(guò)傅里葉變換,兩 個(gè)子陣列某一通道的頻域信號(hào)表達(dá)式-
<formula>formula see original document page 11</formula>(19)
<formula>formula see original document page 11</formula>(20) 其中,S(/)是純凈語(yǔ)音信號(hào)的傅里葉變換,^(/)和^(/)分別兩子陣列第Z通道和第y通道的噪聲的傅里葉變換,^是幀長(zhǎng)<
對(duì)大小兩子陣列分別做累加波束形成
rs(/)=4i>s,(/) (21)
&(/)=會(huì)1>&(/) (22)
將波束形成輸出i;(/)和K(/)分別通過(guò)高通(HP) FIR濾波器和低通(LP) FIR濾波器,得到K(/)和將寬頻帶的語(yǔ)音信號(hào)分成兩個(gè)頻段分別用不同 的語(yǔ)音增強(qiáng)算法進(jìn)行處理。
對(duì)于低頻信號(hào),采用如圖4所示的譜減法進(jìn)行去噪增強(qiáng)
A(/)H之'(/)卜"/) 。"
其中,&(/)是經(jīng)過(guò)譜減法去噪后的目標(biāo)語(yǔ)音信號(hào)的估計(jì)值,"/)是采用語(yǔ)音 活動(dòng)檢測(cè)方法在非語(yǔ)音段估計(jì)的噪聲信號(hào)的幅度平均值。
而對(duì)于高頻信號(hào),采用如圖6和圖1所示的后置自適應(yīng)維納濾波法進(jìn)行語(yǔ) 音增強(qiáng)。對(duì)于子陣列中任意兩通道/和,z、y,帶噪語(yǔ)音信號(hào)的自功率譜密度 和互功率譜密度分別為
①早,C/V^(/) + (D卿(/) (24)
c^," (/) = £{X(/)Z;(/)} = ^(/) + O邵(/) + Os". (/) + (/) ( 25)
基于前述后置自適應(yīng)維納濾波法的三個(gè)假設(shè)條件,各通道的噪聲信號(hào)互不 相關(guān),且與聲源信號(hào)也不相關(guān),貝U:
0怖(/)=氣,(/) = 0柳,(/) = 0
(26)
且每個(gè)麥克風(fēng)接收到的噪聲信號(hào)的功率譜密度相同,定義為:
0卿(/) = <1>,(/) = (1)"/)
則式(24)和式(")可改寫(xiě)為
。早,(/) = ^(/) + ^(/)
12
(27)
(28)其中
6早,(/) = :|^,(/)|
2 M-l A/
(29)
(30)
(31)
考慮實(shí)際情況中的信號(hào)短時(shí)平穩(wěn)性,F(xiàn)FT的長(zhǎng)度L是有限的,因而式(25) 中的后三項(xiàng)不可能為0,而是趨近于0的一個(gè)復(fù)數(shù)。由于信號(hào)功率譜OJ/)只可 能是正實(shí)數(shù),所以得到
",) ,te^S曹,(32)
此外,各通道的信號(hào)是通過(guò)一種迭代平滑的方式處理得到的。對(duì)于某一頻 率點(diǎn)t,定義一個(gè)長(zhǎng)度為2戶(hù)+ l的平滑區(qū)間[A:-/7,A: + / ],貝U
2/7 + l,=_p
(33)
(34)
(35)
綜合考慮精度和計(jì)算量之間的關(guān)系,通常取p-l或2。
則通過(guò)高通濾波器后的輸出信號(hào)《(/)再通過(guò)自適應(yīng)維納濾波器,得到增強(qiáng)
后的高頻段的語(yǔ)音信號(hào)
式-(/) = &'(/) (36)
將高、低兩頻率段的語(yǔ)音信號(hào)進(jìn)行交疊相加傅里葉綜合(Fourier Synthesis Overlap-Add),轉(zhuǎn)換成時(shí)域內(nèi)增強(qiáng)后的語(yǔ)音信號(hào)5["]。
權(quán)利要求
1、一種采用嵌套子陣列的后置濾波譜減法聯(lián)合的語(yǔ)音增強(qiáng)方法,用于室內(nèi)環(huán)境的多通道語(yǔ)音信號(hào)增強(qiáng),其特征在于,所述方法包括1)設(shè)計(jì)兩個(gè)均勻子陣列嵌套的麥克風(fēng)陣列用于多通道信號(hào)的采集;2)檢測(cè)語(yǔ)音信號(hào)的起始、結(jié)束端點(diǎn),估計(jì)純?cè)肼曅盘?hào)的功率譜;3)估計(jì)語(yǔ)音信號(hào)在各通道的時(shí)間延遲;4)對(duì)各通道語(yǔ)音信號(hào)進(jìn)行時(shí)延補(bǔ)償,將各通道語(yǔ)音信號(hào)在時(shí)域?qū)R;5)用傅里葉變換將各通道信號(hào)從時(shí)域轉(zhuǎn)換到頻域;6)估計(jì)純凈語(yǔ)音信號(hào)的自功率譜和帶噪語(yǔ)音信號(hào)的自功率譜,得到維納濾波器的頻響函數(shù);7)對(duì)于兩子陣列的信號(hào),分別用固定波束形成器將各子陣列的每個(gè)通道的信號(hào)進(jìn)行波束形成;8)分別將兩個(gè)子陣列的輸出波束進(jìn)行低通濾波和高通濾波;9)對(duì)濾波后的兩子陣列的輸出波束進(jìn)行譜減法或后置維納濾波法處理,實(shí)現(xiàn)語(yǔ)音增強(qiáng);10)將兩路增強(qiáng)后的波束交疊相加,進(jìn)行反傅里葉變換,得到時(shí)域里增強(qiáng)后的語(yǔ)音信號(hào)。
2、 根據(jù)權(quán)利要求1所述的嵌套子陣列的麥克風(fēng)陣列結(jié)構(gòu),其特征在于,步驟 (l)所述的,每個(gè)子陣列是都是間距固定的均勻線性陣列,且大子陣列的間 距是小子陣列間距的2倍,部分陣元可共用。
3、 根據(jù)權(quán)利要求1或2所述的將兩子陣列波束形成后的語(yǔ)音信號(hào)進(jìn)行低通濾 波或高通濾波,其特征在于,步驟(8)所述的,對(duì)大子陣列各通道波束形成 后的語(yǔ)音信號(hào)進(jìn)行低通濾波,對(duì)小子陣列各通道波束形成后的語(yǔ)音信號(hào)進(jìn) 行高通濾波,使得語(yǔ)音信號(hào)在整個(gè)頻率帶上都有較好的頻率響應(yīng)。
4、 根據(jù)權(quán)利要求1或3所述的分別用譜減法和后置維納濾波器對(duì)兩子陣列的 輸出波束進(jìn)行增強(qiáng)處理,其特征在于,步驟(9)所述的,用功率譜減法對(duì)低 通濾波后的輸出波束進(jìn)行譜相減處理,實(shí)現(xiàn)語(yǔ)音信號(hào)低頻部分的增強(qiáng);用 所述的后置維納濾波器對(duì)高通濾波后的輸出波束進(jìn)行濾波,實(shí)現(xiàn)語(yǔ)音信號(hào) 高頻部分的增強(qiáng)。
5、 根據(jù)權(quán)利要求1或2所述的采用嵌套子陣列的后置濾波譜減法聯(lián)合語(yǔ)音增強(qiáng)方法,其特征在于,所述多通道語(yǔ)音信號(hào)至少包括五個(gè)通道語(yǔ)音信號(hào)。
全文摘要
本發(fā)明公開(kāi)了一種基于嵌套子陣列的自適應(yīng)后置濾波與譜減法聯(lián)合的語(yǔ)音增強(qiáng)方法,適用于室內(nèi)環(huán)境,包括車(chē)載環(huán)境的多通道語(yǔ)音信號(hào)的增強(qiáng)。由于本發(fā)明考慮到了語(yǔ)音信號(hào)的寬帶非平穩(wěn)特性,基于麥克風(fēng)陣列多通道語(yǔ)音增強(qiáng)方法對(duì)于語(yǔ)音信號(hào)的頻率響應(yīng)不一致,且在實(shí)際噪聲場(chǎng)環(huán)境中,各通道噪聲之間的相關(guān)性等問(wèn)題,通過(guò)由間距不等的子陣列嵌套構(gòu)成的麥克風(fēng)陣列采集語(yǔ)音信號(hào),并將各子陣列波束形成后的語(yǔ)音信號(hào)分成高頻段和低頻段,采用不同的語(yǔ)音增強(qiáng)算法進(jìn)行處理,優(yōu)勢(shì)互補(bǔ),提高了語(yǔ)音增強(qiáng)的效果。
文檔編號(hào)G10L21/02GK101447190SQ200810068000
公開(kāi)日2009年6月3日 申請(qǐng)日期2008年6月25日 優(yōu)先權(quán)日2008年6月25日
發(fā)明者波 萬(wàn), 璟 趙, 鄒月嫻 申請(qǐng)人:北京大學(xué)深圳研究生院
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1