噪聲水平估計的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明的實施例一般性地涉及音頻處理,并且更具體地,涉及用于噪聲水平估計 的方法和系統(tǒng)。
【背景技術(shù)】
[0002] 現(xiàn)實生活的噪聲可W包括不同類型的噪聲:平穩(wěn)噪聲和非平穩(wěn)噪聲。非平穩(wěn)噪聲 可W包括兩個分類:本底噪聲的突增W及脈沖噪聲,它們對于考慮噪聲信號的音頻處理非 常具有挑戰(zhàn)。如本文中所使用的,本底噪聲的突增指的是本底噪聲從一個水平突然增長到 另一個水平并且在相對長的一段時間內(nèi)基本維持平穩(wěn),并且脈沖噪聲指的是其水平突然增 長并且然后在短時間段內(nèi)下降的非平穩(wěn)噪聲。通常,在音頻處理中,諸如在語音增強(qiáng)、音頻 播放或者噪聲補(bǔ)償中,需要追蹤噪聲水平。例如,在耳機(jī)噪聲補(bǔ)償中,噪聲信號的估計水平 可W直接影響要被應(yīng)用至音頻信號的增益。噪聲信號的實際信號水平通常不能夠被應(yīng)用, 因為它隨著時間快速變化,特別是當(dāng)出現(xiàn)本底噪聲的突增或者脈沖噪聲時。因此,應(yīng)當(dāng)處理 噪聲信號輸入W獲得在音頻處理中能夠被使用的估計噪聲水平,如圖1所示。
[0003] 主要在語音處理的架構(gòu)中,特別是在語音增強(qiáng)中,已經(jīng)開發(fā)了噪聲估計技術(shù)。送些 技術(shù)例如可W被劃分為:最小值追蹤、時間遞歸平均、基于直方圖的噪聲估計、W及基于分 位數(shù)的噪聲估計等等??紤]到兩類非平穩(wěn)噪聲,所期望的是,估計的噪聲信號跟隨本底噪聲 的突增并且在短期脈沖噪聲期間抵抗噪聲估計的移動。然而,現(xiàn)有的噪聲估計方法不是對 本底噪聲的突增過于敏感或者就是對脈沖噪聲過于敏感,不能夠在送兩種噪聲場景中估計 魯棒的噪聲水平。
[0004] 鑒于W上,在本領(lǐng)域中需要一種解決方案用于針對脈沖噪聲和本底噪聲的突增兩 者適當(dāng)?shù)毓烙嬙肼曀健?br>
【發(fā)明內(nèi)容】
[0005] 為了解決前述W及其他潛在問題中的至少一個問題,本發(fā)明的實施例提出了用于 噪聲水平估計的方法和系統(tǒng)。
[0006] 在一個方面,本發(fā)明的實施例提供了一種用于噪聲水平估計的方法。該方法包括: 響應(yīng)于噪聲信號的信號水平的增長,計算所述噪聲信號的脈沖噪聲概率,其中所述脈沖噪 聲概率指示所述噪聲信號是脈沖噪聲的可能性;基于所述脈沖噪聲概率,確定用于噪聲水 平估計的可變平滑因數(shù),該可變平滑因數(shù)與所述噪聲信號的先前估計水平相關(guān)聯(lián);W及利 用所述可變平滑因數(shù)平滑所述噪聲信號,W確定所述噪聲信號的當(dāng)前估計水平。在送個方 面的實施例進(jìn)一步包括對應(yīng)的計算機(jī)程序產(chǎn)品。
[0007] 在另一個方面,本發(fā)明的實施例提供了一種用于噪聲水平估計的系統(tǒng)。該系統(tǒng)包 括:脈沖噪聲概率計算單元,被配置為響應(yīng)于噪聲信號的信號水平的增長,計算所述噪聲信 號的脈沖噪聲概率,其中所述脈沖噪聲概率指示所述噪聲信號是脈沖噪聲的可能性;平滑 因數(shù)確定單元,被配置為基于所述脈沖噪聲概率,確定用于噪聲水平估計的可變平滑因數(shù), 該可變平滑因數(shù)與所述噪聲信號的先前估計水平相關(guān)聯(lián);w及噪聲水平估計單元,被配置 為利用所述可變平滑因數(shù),平滑所述噪聲信號W確定所述噪聲信號的當(dāng)前估計水平。
[0008] 通過W下描述,將認(rèn)識到,根據(jù)本發(fā)明的實施例,所估計的噪聲水平能夠在脈沖噪 聲的場景中基于從脈沖噪聲概率確定的可變平滑因數(shù)來抵抗移動。本發(fā)明的實施例所帶來 的其他益處將通過下文描述而清楚。
【附圖說明】
[0009] 通過參考附圖閱讀下文的詳細(xì)描述,本發(fā)明實施例的上述W及其他目的、特征和 優(yōu)點將變得易于理解。在附圖中,W示例而非限制性的方式示出了本發(fā)明的若干實施例,其 中:
[0010] 圖1圖示了噪聲水平估計的一般性的圖;
[0011] 圖2圖示了根據(jù)本發(fā)明的實施例的用于噪聲水平估計的方法的流程圖;
[0012] 圖3圖示了根據(jù)本發(fā)明的一個示例實施例的噪聲水平估計的示意圖;
[0013] 圖4圖示了根據(jù)本發(fā)明的另一個示例實施例的噪聲水平估計的示意圖;
[0014] 圖5(a)圖示了根據(jù)現(xiàn)有的方法和根據(jù)本發(fā)明的示例實施例的估計噪聲水平的比 較;
[0015] 圖5(b)-(d)圖示了在圖5(a)的示例實施例中使用的參數(shù)的圖;
[0016] 圖6圖示了根據(jù)本發(fā)明的示例實施例的用于噪聲水平估計的系統(tǒng)的框圖;W及
[0017] 圖7圖示了適合用于實施本發(fā)明的實施例的示例計算機(jī)系統(tǒng)的框圖。
[001引在各個附圖中,相同或?qū)?yīng)的標(biāo)號表示相同或?qū)?yīng)的部分。
【具體實施方式】
[0019] 下面將參考附圖中示出的若干示例實施例來描述本發(fā)明的原理。應(yīng)當(dāng)理解,描述 送些實施例僅僅是為了使本領(lǐng)域技術(shù)人員能夠更好地理解進(jìn)而實現(xiàn)本發(fā)明,而并非W任何 方式限制本發(fā)明的范圍。
[0020] 如W上所提及的,本底噪聲的突增和脈沖噪聲對于考慮噪聲信號的音頻處理特別 具有挑戰(zhàn),并且在噪聲估計中,期望所估計的噪聲信號跟隨本底噪聲的突增并且抵抗在短 期脈沖噪聲期間噪聲估計的移動。就此而言,應(yīng)當(dāng)從噪聲信號輸入中區(qū)分出本底噪聲的增 長和脈沖噪聲,并且然后不同的平滑因數(shù)能夠被應(yīng)用于平滑噪聲信號輸入。然而,在增長開 始時,本底噪聲的突增和脈沖噪聲沒有區(qū)分。一種簡單的解決方法是向前看并且緩沖足夠 長的信號,W構(gòu)建對于信號類型的足夠置信度,并且稍后據(jù)此處理信號,然后,送可能造成 大的延遲。
[0021] 本發(fā)明的實施例提出了用于魯棒的噪聲水平估計的方法和系統(tǒng),其能夠緊密并且 平滑地追蹤噪聲水平,快速地跟隨本底噪聲的增長并且抵抗短期脈沖噪聲。本發(fā)明的方法 和系統(tǒng)引入了脈沖噪聲概率和自適應(yīng)平滑因數(shù),W便于實現(xiàn)低延遲且正確的信號類型分類 W及魯棒的噪聲水平估計。
[0022] 首先參照圖2,其示出了根據(jù)本發(fā)明的示例實施例的用于噪聲水平估計的方法 200的流程圖。
[002引在步驟S201,響應(yīng)于噪聲信號的信號水平的增長,計算噪聲信號的脈沖噪聲概率。 脈沖噪聲概率指示該噪聲信號是脈沖噪聲的可能性
[0024]在本發(fā)明的一些實施例中,噪聲信號可W例如從麥克風(fēng)輸入或者經(jīng)處理的麥克風(fēng) 信號來獲得。因為噪聲的水平是頻率和時間的函數(shù),噪聲水平估計可W-個頻帶接一個頻 帶地執(zhí)行,或者在全頻帶上執(zhí)行。在不同頻帶處的噪聲水平估計可W同時執(zhí)行或者按順序 執(zhí)行。因此,要被估計的噪聲信號可W是噪聲輸入信號的多個頻帶中的一個頻帶中的信號, 或者是噪聲輸入信號的寬帶信號。
[00巧]本發(fā)明的一個目的是快速并且準(zhǔn)確地區(qū)分本底噪聲的增長和脈沖噪聲,兩者在早 期階段均具有增長的信號水平。增長的信號水平可W用于觸發(fā)脈沖噪聲概率的計算。在本 發(fā)明的示例實施例中,起始檢測器可W用于追蹤噪聲信號的起始(onset),并且噪聲信號增 長的概率可W被表示為起始概率。因此,在計算脈沖噪聲概率之前,可W確定噪聲信號的起 始概率,并且該起始概率指示信號水平的增長的可能性。起始概率的確定將在W下參照圖 3更詳細(xì)地討論。
[0026] 響應(yīng)于檢測到信號水平正在增長,執(zhí)行操作W計算指示該噪聲信號是脈沖噪聲的 可能性的脈沖噪聲概率。脈沖噪聲概率在0和1之間。當(dāng)計算脈沖噪聲概率時,本底噪聲 增長的概率還可W通過1減去脈沖噪聲概率來確定。
[0027] 如本文中所指代的,本底噪聲的突增指的是本底噪聲從一個水平突然增長到另一 個水平并且在相對長的一段時間內(nèi)基本維持平穩(wěn),并且脈沖噪聲指的是其水平突然增長并 且在短時間段內(nèi)下降的非平穩(wěn)噪聲。例如,在現(xiàn)實生活的場景中,在街角小店的人處于相對 安靜的室內(nèi)環(huán)境。當(dāng)他打開口的時候,他突然進(jìn)入到高水平的外界交通噪聲的環(huán)境,并且可 能隨后聽到在交通噪聲之上的很大的關(guān)口聲。在送種場景中,交通噪聲可W導(dǎo)致本底噪聲 的增長,并且關(guān)口聲的噪聲(其水平非??斓叵陆担┛蒞被分類成脈沖噪聲。
[0028] 脈沖噪聲概率的計算將在W下參照圖3更詳細(xì)地討論。
[0029] 方法200然后行進(jìn)至步驟S202,其中基于步驟S201的脈沖噪聲概率,確定用于噪 聲水平估計的可變平滑因數(shù)。
[0030] 如本文中所使用的,可變平滑因數(shù)與所述噪聲信號的先前估計水平相關(guān)聯(lián)??勺?平滑因數(shù)用于平滑噪聲信號,W便于使得噪聲信號的估計水平快速跟隨本底噪聲的增長并 且抵抗短時期的脈沖噪聲。由于較小的平滑因數(shù)可W導(dǎo)致所估計的噪聲水平更快速地跟隨 噪聲信號的實際水平并且反之亦然,如果所計算的脈沖噪聲概率較小,其意味著該噪聲信 號可能是本底噪聲的增長,則可變平滑因數(shù)被確定為較小,并且反之亦然。
[0031] 通常,即使沒有本底噪聲的增長和脈沖噪聲,噪聲信號輸入也可W利用恒定平滑 因數(shù)來平滑W產(chǎn)生具有更平滑的水平的平滑噪聲信號W用于后續(xù)處理,該恒定平滑因數(shù)在 本文中被稱為基準(zhǔn)平滑因數(shù)。因此,在步驟S202所確定的可變平滑因數(shù)可W在該恒定平滑 因數(shù)和1之間??勺兤交驍?shù)的確定將在W下參照圖3更詳細(xì)地討論。
[0032] 方法200然后行進(jìn)至步驟S203,其中利用可變平滑因數(shù)來平滑噪聲信號,W確定 該噪聲信號的當(dāng)前估計水平。該估計水平可W在后續(xù)音頻處理中被使用,諸如在噪聲補(bǔ)償、 語音增強(qiáng)等處理中。該步驟也將在W下參照圖3更纖細(xì)地討論。
[0033] 圖3圖示了根據(jù)本發(fā)明的一個示例實施例的噪聲水平估計的示意圖300。參照圖 3,將更詳細(xì)描述噪聲水平估計的過程。應(yīng)當(dāng)注意,在實踐中,圖3中示出的一個或多個框可 W是可選的并且因此能夠在一些實施例中被省略,并且一些框可W被組合為一個框或者一 個框可w被劃分為多個框。本發(fā)明的實施例在送方面不受限制。
[0034] 在W下描述所圖示的框的操作。
[00巧]頗時分析柜301
[0036] 因為噪聲信號輸入隨時間和頻率而變化,噪聲水平估計的處理可W針對多個頻 帶的每個頻帶來執(zhí)行,并且參數(shù)在頻帶與頻帶之間是被調(diào)整的。郝么,要被估計的噪聲 信號可W是噪聲輸入信號的多個頻帶中的一個頻帶中的信號,或者是噪聲輸入信號的寬 帶信號。例如,噪聲信號輸入的頻率可W被劃分成五個頻帶,Bl(f《700Hz)、B2 (700化 <f《lOOOHz)、B3(lOOOHz<f《2000Hz)、B4 (2000Hz<f《6000Hz)和B5(f> 6000Hz), 并且要被估計的噪聲信號可W在五個頻帶之一。
[0037] 在送種情況下,在一個示例實施例中,框301的輸出可W是X(f,t),其中Xa,t) 可W表示噪聲信號在一個頻帶和時間點的實際信號水平。
[0038] 應(yīng)當(dāng)注意到,如果在處理中使用寬帶噪聲信號,在其他實施例中,框301可W是可 選的。在送種情況下,噪聲信號例如可W被表示為X(t)。
[0039] 在一些實施例中,送個框還可W確定噪聲信號估計的處理間隔At,也就是說,它 可W每隔一個處理間隔At就輸出噪聲信號X(f,t)。處理間隔At可W由采樣率來確定。 例如,送個框可W每個一個樣本或者每個十個樣本等輸出噪聲信號X(f,t)。
[0040]快諫平滑柜302巧緩憬平滑柜303
[0041] 兩個平滑器可W用于在噪聲信號被輸出到起始概率、最大值追蹤或者脈沖噪