專(zhuān)利名稱(chēng):一種消除模數(shù)轉(zhuǎn)換器噪聲對(duì)數(shù)字錄音干擾的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種消除噪音干擾的方法,尤其是涉及一種消除模數(shù)轉(zhuǎn)換器噪 聲對(duì)數(shù)字錄音干擾的方法,適用于所有嵌入式數(shù)字錄音系統(tǒng)。
背景技術(shù):
在嵌入式數(shù)字錄音系統(tǒng)中,噪音干擾會(huì)嚴(yán)重影響錄音效果。不同于錄音中 的外部背景噪聲,作為錄音系統(tǒng)中關(guān)鍵器件的模數(shù)轉(zhuǎn)換器(ADC),其電路本身 產(chǎn)生的噪聲對(duì)錄音引起的干擾則很難有效地消除。因此,如何有效、便捷地消 除ADC的毛刺干擾成為數(shù)字錄音中噪聲消除技術(shù)的一個(gè)難點(diǎn)。
實(shí)際的ADC由于電路本身的局限在許多方面與理想的ADC有偏差,因此,在 采集聲音數(shù)據(jù)過(guò)程中,這些偏差不可避免地會(huì)產(chǎn)生噪聲干擾。 一般將這些噪聲 分為擇算到輸入端的噪聲和量化噪聲,前者是一種有效輸入噪聲,后者是在采 集數(shù)據(jù)中數(shù)據(jù)精度的一種必然損失。如圖1所示,描述了對(duì)于"理想的"ADC和 實(shí)際的ADC,上述噪聲及對(duì)ADC總傳遞函數(shù)的影響。
理想的ADC具有零編碼躍遷噪聲,并且躍遷區(qū)域的寬度為零。實(shí)際的ADC有 一定數(shù)量的編碼躍遷噪聲,因而具有有限的躍遷區(qū)域?qū)挾?。圖l (b)示出編碼 躍遷噪聲寬度約為一個(gè)最低有效位(LSB)峰峰值(P-P)噪聲的情況。
這些噪音在整個(gè)錄音過(guò)程中一直存在,為抑制這些噪聲干擾,傳統(tǒng)的方法 有對(duì)輸出采樣進(jìn)行多次測(cè)量平均以減少噪聲影響,這種方法缺點(diǎn)是需要增加 數(shù)字硬件和降低總輸出采樣率;另外一種方法是適當(dāng)?shù)厥褂枚秳?dòng)(有意施加到 模擬輸入信號(hào)的外部噪聲)來(lái)抑制噪聲,圖2給出了產(chǎn)生小幅度和大幅度抖動(dòng)的 示意圖。
這種方法的缺點(diǎn)是它高度依賴于ADC本身的特性,局限性較強(qiáng)。還有其他一 些方法如修改PCB布線,修改輸入驅(qū)動(dòng)或輸出電容等等,總之現(xiàn)有的抑制ADC噪 聲的方法都是從硬件電路本身出發(fā),使得這些方法成本高,靈活性差,且增加 了系統(tǒng)成本。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種消除模數(shù)轉(zhuǎn)換器噪聲對(duì)數(shù)字錄音干擾的方法, 既能有效消除ADC的噪聲對(duì)數(shù)字錄音的干擾,又能避免修改或增加原系統(tǒng)硬件電 路,節(jié)約成本。
本發(fā)明的目的可通過(guò)以下的技術(shù)措施來(lái)實(shí)現(xiàn), 一種消除模數(shù)轉(zhuǎn)換器噪聲對(duì) 數(shù)字錄音干擾的方法,將模數(shù)轉(zhuǎn)換器輸出的數(shù)字錄音數(shù)據(jù)依次經(jīng)噪聲定位,數(shù) 字錄音數(shù)據(jù)加窗處理,特征域定位,特征功率密度計(jì)算,特征域逆變換和時(shí)域 混迭處理后輸出。
本發(fā)明的具體處理過(guò)程,包括以下步驟
(1) 采集模數(shù)轉(zhuǎn)換器輸出的數(shù)字錄音數(shù)據(jù),對(duì)模數(shù)轉(zhuǎn)換器引起的非語(yǔ)音信
號(hào)進(jìn)行時(shí)間定位,判斷出非語(yǔ)音信號(hào)及其持續(xù)時(shí)間;
(2) 對(duì)步驟(1)中的數(shù)字錄音數(shù)據(jù)進(jìn)行時(shí)域加窗處理;
(3) 利用離散余弦變換對(duì)步驟(2)中得出的數(shù)據(jù)進(jìn)行特征域變換,從時(shí) 間域轉(zhuǎn)換到特征域,獲得特征頻譜系數(shù);
(4) 通過(guò)獲得的特征頻譜系數(shù),得出錄音信號(hào)總的特征功率密度和其中非 語(yǔ)音的特征功率密度,用總的錄音信號(hào)的特征功率密度減去非語(yǔ)音的特征功率 密度;
(5) 再將所得差值數(shù)據(jù)做逆離散余弦變換,從特征域轉(zhuǎn)換到時(shí)間域;
(6) 對(duì)步驟(5)中的輸出數(shù)據(jù)進(jìn)行時(shí)域混迭處理。
本發(fā)明步驟(2)中時(shí)間定位具體過(guò)程為從步驟(1)得到數(shù)字信號(hào)數(shù) 據(jù),取幀長(zhǎng)10 30ms的一幀信號(hào)計(jì)算數(shù)據(jù)的包絡(luò),并計(jì)算這些包絡(luò)峰值的變化 的統(tǒng)計(jì)量En,結(jié)合典型語(yǔ)音信號(hào)的統(tǒng)計(jì)值,設(shè)統(tǒng)計(jì)量的最大值為門(mén)限值Et,如 果En大于Et判斷該幀為含噪聲的信號(hào),再對(duì)連續(xù)10幀的信號(hào)進(jìn)行語(yǔ)音判斷,從 而對(duì)整個(gè)語(yǔ)音信號(hào)進(jìn)行噪聲時(shí)間定位。
本發(fā)明步驟(6)中混迭過(guò)程具體如下第一次從步驟(5)輸出256個(gè)實(shí) 數(shù)點(diǎn),然后將前64個(gè)點(diǎn)作為語(yǔ)音信號(hào)輸出,下次再?gòu)牟襟E(5)輸出得到256 個(gè)實(shí)數(shù)點(diǎn),這256個(gè)同上次輸出的后(256-64)個(gè)混疊,依次進(jìn)行。
本發(fā)明采用數(shù)字處理的過(guò)程,能有效的去除ADC產(chǎn)生的噪聲對(duì)數(shù)字錄音的干 擾,同時(shí)避免在原有數(shù)字錄音系統(tǒng)硬件電路上的修改,節(jié)約成本。易于維護(hù)和移植,靈活性高,適用所有嵌入式數(shù)字錄音系統(tǒng)。
圖1ADC噪聲及對(duì)ADC傳遞函數(shù)的影響
圖2使用抖動(dòng)抑制ADC噪聲
圖3本發(fā)明的流程框圖4為本發(fā)明具體實(shí)施方式
的流程框圖5為本發(fā)明中時(shí)間定位具體過(guò)程的流程框圖6為本發(fā)明中時(shí)域混迭示意圖。
具體實(shí)施例方式
如圖3、圖4所示,本發(fā)明方法具體處理步驟如下
步驟l,數(shù)字錄音系統(tǒng)通過(guò)麥克風(fēng)進(jìn)行一段時(shí)間的錄音,原始模擬語(yǔ)音信號(hào)
經(jīng)模數(shù)轉(zhuǎn)換器ADC轉(zhuǎn)換后則變成數(shù)字信號(hào)。
.
歩驟2,經(jīng)步驟(1)得到數(shù)字信號(hào)數(shù)據(jù),取幀長(zhǎng)10 30ms的一幀信號(hào),計(jì) 算在短時(shí)條件下(10 30ms)數(shù)據(jù)的包絡(luò),并計(jì)算這些包絡(luò)峰值的變化的統(tǒng)計(jì) 量En,計(jì)算定義如下
= ZI x( + m) * (w) _ x(w + w + r) * w2 (附+ r)(
其中x(")為錄音數(shù)據(jù),w2(m)為窗函數(shù),r為時(shí)長(zhǎng)。取En的上限為
門(mén)限值Et,當(dāng)該統(tǒng)計(jì)量En大于Et時(shí)判斷該段為含噪聲的信號(hào),考慮到說(shuō)話時(shí)語(yǔ) 音的持續(xù)性,同時(shí)也為了求得含噪聲信號(hào)的持續(xù)時(shí)間(作為去除噪聲的一個(gè)判 斷條件),必須對(duì)持續(xù)幀進(jìn)行判斷,通常經(jīng)驗(yàn)為當(dāng)連續(xù)10幀信號(hào)為噪聲時(shí)判斷 該時(shí)間段語(yǔ)音含有噪聲,該步驟流程圖如圖5所示。
步驟3,對(duì)歩驟(2)中的數(shù)據(jù)進(jìn)行時(shí)域加窗處理,加窗處理降低由于采樣 時(shí)矩形窗截?cái)嘣斐傻念l譜擴(kuò)散和干擾。
時(shí)域加窗處理采用256個(gè)數(shù)據(jù)點(diǎn)進(jìn)行運(yùn)算,加窗函數(shù)定義如下 win二O.5*hamming (256+1) /1. 08
其中,hamming ()表示翰明函數(shù)。hamming (256+1)函數(shù)返回的是含有
5257個(gè)點(diǎn)的hamming窗,hamming窗函數(shù)定義如下
hamming (k) =0. 54-0. 46cos (2*pi*k/256. 0) , k=0, 1, 2"., 256.
步驟4,利用離散余弦變換(DCT)對(duì)時(shí)域步驟(3)得出的數(shù)據(jù)進(jìn)行特征 域變換,將數(shù)據(jù)從時(shí)間域轉(zhuǎn)換到特征域,獲得特征頻譜系數(shù);對(duì)時(shí)域信號(hào)特征 的提取關(guān)鍵是需要將時(shí)域信號(hào)中相關(guān)特征實(shí)現(xiàn)在特征域能量集中,而離散余弦 變換不僅能有效提起信號(hào)的特征,且實(shí)現(xiàn)算法快速。
步驟5,經(jīng)步驟4處理錄音數(shù)據(jù)中噪聲特征能較好的集中,通過(guò)獲得的特 征頻譜系數(shù),可以計(jì)算噪聲特征功率密度。定義特征功率密度W如下
其中C, =|c/|/;f;|c, |, c/,^l,2,…,iV是N個(gè)數(shù)據(jù)的DCT變換系數(shù)。當(dāng)c,大
于3/4W時(shí)給點(diǎn)為噪聲,統(tǒng)計(jì)這些噪聲點(diǎn)可以得出噪聲特征功率。
步驟6根據(jù)步驟(5)中計(jì)算得出的W,將錄音數(shù)據(jù)減去那些超過(guò)3/4W的
噪聲點(diǎn),可以得到語(yǔ)音信號(hào)的特征功率密度。
步驟7,對(duì)步驟6的輸出的特征域數(shù)據(jù)進(jìn)行特征域的反變換,使變?yōu)闀r(shí)間
域數(shù)據(jù)。由于語(yǔ)音信號(hào)的非平穩(wěn),時(shí)變的特征步驟(7)對(duì)部分的低頻噪聲容易 "錯(cuò)檢",此時(shí)結(jié)合步驟(2)的噪聲持續(xù)時(shí)間可彌補(bǔ)此問(wèn)題。
步驟8,對(duì)步驟7中的時(shí)間域數(shù)據(jù)進(jìn)行混迭以得出語(yǔ)音信號(hào),如圖6所
示,混迭具體如下第一次從步驟(7)輸出256個(gè)實(shí)數(shù)點(diǎn),然后將前64個(gè)點(diǎn)
作為語(yǔ)音信號(hào)輸出,下次再?gòu)牟襟E(7)輸出得到256個(gè)實(shí)數(shù)點(diǎn),這256個(gè)同上
次輸出的后(256-64)個(gè)混疊,依次進(jìn)行。時(shí)域內(nèi)的混迭處理后得出消除了模
數(shù)轉(zhuǎn)換器引起噪聲的語(yǔ)音信號(hào)。
權(quán)利要求
1、一種消除模數(shù)轉(zhuǎn)換器噪聲對(duì)數(shù)字錄音干擾的方法,其特征在于將模數(shù)轉(zhuǎn)換器輸出的數(shù)字錄音數(shù)據(jù)依次經(jīng)噪聲時(shí)間定位,數(shù)字錄音數(shù)據(jù)加窗處理,特征域定位,特征功率密度計(jì)算,特征域逆變換和時(shí)域混迭處理后輸出。
2、 根據(jù)權(quán)利要求1所述的消除模數(shù)轉(zhuǎn)換器噪聲對(duì)數(shù)字錄音干擾的方法,其特征在于包括以下步驟(1) 采集模數(shù)轉(zhuǎn)換器輸出的數(shù)字錄音數(shù)據(jù),對(duì)模數(shù)轉(zhuǎn)換器引起的非語(yǔ)音信 號(hào)進(jìn)行時(shí)間定位,判斷出非語(yǔ)音信號(hào)及其持續(xù)時(shí)間;(2) 對(duì)步驟(1)的數(shù)字錄音數(shù)據(jù)進(jìn)行時(shí)域加窗處理;(3) 利用離散余弦變換對(duì)歩驟(2)中得出的數(shù)據(jù)進(jìn)行特征域變換,從時(shí)間 域轉(zhuǎn)換到特征域,獲得特征頻譜系數(shù);(4) 通過(guò)獲得的特征頻譜系數(shù),得出錄音信號(hào)總的特征功率密度和其中非 語(yǔ)音的特征功率密度,用總的錄音信號(hào)的特征功率密度減去非語(yǔ)音的特征功率密 度;(5) 再將所得差值數(shù)據(jù)做逆離散余弦變換,從特征域轉(zhuǎn)換到時(shí)間域;(6) 對(duì)步驟(5)中的輸出數(shù)據(jù)進(jìn)行時(shí)域混迭處理。
3、 根據(jù)權(quán)利要求1或2所述的消除模數(shù)轉(zhuǎn)換器噪聲對(duì)數(shù)字錄音千擾的方法, 其特征在于步驟(2)中時(shí)間定位具體過(guò)程為從步驟(1)得到數(shù)字信號(hào)數(shù)據(jù), 取幀長(zhǎng)10 30ffls的一幀信號(hào)計(jì)算數(shù)據(jù)的包絡(luò),并計(jì)算這些包絡(luò)峰值的變化的統(tǒng)計(jì) 量En,結(jié)合典型語(yǔ)音信號(hào)的統(tǒng)計(jì)值,設(shè)統(tǒng)計(jì)量的最大值為門(mén)限值Et,如果En大于 Et判斷該幀為含噪聲的信號(hào),再對(duì)連續(xù)10幀的信號(hào)進(jìn)行語(yǔ)音判斷,從而對(duì)整個(gè)語(yǔ) 音信號(hào)進(jìn)行噪聲時(shí)間定位。
4、 根據(jù)權(quán)利要求1或2所述的消除模數(shù)轉(zhuǎn)換器噪聲對(duì)數(shù)字錄音干擾的方法, 其特征在于混迭過(guò)程具體如下第一次從步驟(5)輸出256個(gè)實(shí)數(shù)點(diǎn),然后將 前64個(gè)點(diǎn)作為語(yǔ)音信號(hào)輸出,下次再?gòu)牟襟E(5)輸出得到256個(gè)實(shí)數(shù)點(diǎn),這 256個(gè)同上次輸出的后(256-64)個(gè)混疊,依次進(jìn)行。
全文摘要
本發(fā)明公開(kāi)了一種消除模數(shù)轉(zhuǎn)換器噪聲對(duì)數(shù)字錄音干擾的方法,將模數(shù)轉(zhuǎn)換器輸出的數(shù)字錄音數(shù)據(jù)依次經(jīng)噪聲定位,數(shù)字錄音數(shù)據(jù)加窗處理,特征域定位,特征功率密度計(jì)算,特征域逆變換和時(shí)域混迭處理后輸出。本發(fā)明采用數(shù)字處理的過(guò)程,能有效的去除ADC產(chǎn)生的噪聲對(duì)數(shù)字錄音的干擾,同時(shí)避免在原有數(shù)字錄音系統(tǒng)硬件電路上的修改,節(jié)約成本。易于維護(hù)和移植,靈活性高,適用所有嵌入式數(shù)字錄音系統(tǒng)。
文檔編號(hào)G11B20/24GK101458950SQ200710032440
公開(kāi)日2009年6月17日 申請(qǐng)日期2007年12月14日 優(yōu)先權(quán)日2007年12月14日
發(fā)明者敏 李, 李小明, 羅發(fā)龍, 胡勝發(fā) 申請(qǐng)人:安凱(廣州)軟件技術(shù)有限公司