一種音頻降噪方法及裝置制造方法

文檔序號：2826148閱讀：519來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種音頻降噪方法及裝置制造方法
【專利摘要】本申請?zhí)峁┝艘环N音頻降噪方法及裝置，其中的方法具體包括：在待降噪音頻信號中搜索能量最小的音頻信號段，將其作為噪聲段；對所述噪聲段進行頻譜分析得到其頻域特征，作為噪聲特征；依據(jù)所述噪聲特征對所述待降噪音頻信號進行降噪處理。本申請能夠提高音頻降噪的便捷性。
【專利說明】一種音頻降噪方法及裝置
【技術(shù)領(lǐng)域】
[0001]本申請涉及音頻信號處理【技術(shù)領(lǐng)域】，特別是涉及一種音頻降噪方法及裝置。
【背景技術(shù)】
[0002]音頻降噪技術(shù)，是指利用信號處理和模式識別的方法，從含有噪聲的音頻中將噪聲去除，使去除噪聲后的音頻有較高的信噪比和較好的質(zhì)量。音頻降噪是音頻信號處理領(lǐng)域需要解決的關(guān)鍵技術(shù)之一。
[0003]現(xiàn)有一種典型的音頻降噪方法，在人為選取噪聲段數(shù)據(jù)后，依據(jù)所選取的噪聲段數(shù)據(jù)學(xué)習(xí)相應(yīng)的噪聲特征，并依據(jù)所述噪聲特征對相應(yīng)的音頻信號進行降噪處理。由于目前通常利用人為預(yù)聽的方式來選取音頻信號中的噪聲段，往往需要人為的多次操作才能實現(xiàn)噪聲段的選取，因此，現(xiàn)有的音頻降噪方法的便捷性較差，且不符合移動設(shè)備的簡潔交互特性。

【發(fā)明內(nèi)容】

[0004]本申請所要解決的技術(shù)問題是提供一種音頻降噪方法及裝置，能夠提高音頻降噪的便捷性。
[0005]為了解決上述問題，本申請公開了一種音頻降噪方法，包括:
[0006]在待降噪音頻信號中搜索能量最小的音頻信號段，將其作為噪聲段；
[0007]對所述噪聲段進行頻譜分析得到其頻域特征，作為噪聲特征；
[0008]依據(jù)所述噪聲特征對所述待降噪音頻信號進行降噪處理。
[0009]優(yōu)選的，所述在待降噪音頻信號中搜索能量最小的音頻信號段，將其作為噪聲段的步驟，包括:
[0010]在全部或部分待降噪音頻信號中搜索能量最小的音頻信號段，作為噪聲段。
[0011]優(yōu)選的，所述在部分待降噪音頻信號中搜索能量最小的音頻信號段，作為噪聲段的步驟，包括:
[0012]遍歷所述待降噪音頻信號的初始部分，并比較所述初始部分中每個音頻信號段的能量；其中，所述每個音頻信號段的時域長度相等；
[0013]從所有音頻信號段中選取能量最小的一個音頻信號段，作為噪聲段。
[0014]優(yōu)選的，對所述噪聲段進行頻譜分析得到其頻域特征，作為噪聲特征的步驟，包括:
[0015]將所述噪聲段在時域上劃分為多個大小相等的第一窗口；
[0016]對所述每個第一窗口進行時頻轉(zhuǎn)換處理；
[0017]依據(jù)所述每個第一窗口的頻域數(shù)據(jù)，確定所述噪聲段的所有第一窗口在每個頻率上的頻譜最大值；
[0018]將所述每個頻率上的頻譜最大值記錄為所述噪聲段對應(yīng)的噪聲特征。
[0019]優(yōu)選的，所述依據(jù)所述噪聲特征對所述待降噪音頻信號進行降噪處理的步驟，包括:
[0020]將所述待降噪音頻信號與所述噪聲特征進行頻譜比較；
[0021]根據(jù)頻譜比較結(jié)果對所述待降噪音頻信號進行頻譜增益處理。
[0022]優(yōu)選的，所述根據(jù)頻譜比較結(jié)果對所述待降噪音頻信號進行頻譜增益處理的步驟包括:
[0023]依據(jù)所述頻譜比較結(jié)果確定下調(diào)參數(shù)，使得所述下調(diào)參數(shù)隨著所述頻譜比較結(jié)果的增大而減??；
[0024]依據(jù)所述下調(diào)參數(shù)對所述待降噪音頻信號進行頻譜下調(diào)處理。
[0025]優(yōu)選的，所述依據(jù)所述頻譜比較結(jié)果確定下調(diào)參數(shù)，使得所述下調(diào)參數(shù)隨著所述頻譜比較結(jié)果的增大而減小的步驟，包括:
[0026]按照大小順序?qū)㈩l譜比較結(jié)果劃分為若干個階段，其中階段對應(yīng)下調(diào)參數(shù)的大小順序與階段間頻譜比較結(jié)果的大小順序相反。
[0027]另一方面，本申請還公開了一種音頻降噪裝置，包括:
[0028]噪聲搜索模塊，用于在待降噪音頻信號中搜索能量最小的音頻信號段，將其作為噪聲段；
[0029]噪聲特征學(xué)習(xí)模塊，用于對所述噪聲段進行頻譜分析得到其頻域特征，作為噪聲特征；及
[0030]降噪處理模塊，用于依據(jù)所述噪聲特征對所述待降噪音頻信號進行降噪處理。
[0031]優(yōu)選的，所述噪聲搜索模塊，具體用于在全部或部分待降噪音頻信號中搜索能量最小的音頻信號段，作為噪聲段。
[0032]優(yōu)選的，所述噪聲搜索模塊包括:
[0033]遍歷比較子模塊，用于遍歷所述待降噪音頻信號的初始部分，并比較所述初始部分中每個音頻信號段的能量；其中，所述每個音頻信號段的時域長度相等；及
[0034]選取子模塊，用于從所有音頻信號段中選取能量最小的一個音頻信號段，作為噪聲段。
[0035]優(yōu)選的，所述噪聲特征學(xué)習(xí)模塊包括:
[0036]窗口劃分子模塊，用于將所述噪聲段在時域上劃分為多個大小相等的第一窗口；
[0037]時頻轉(zhuǎn)換處理子模塊，用于對所述每個第一窗口進行時頻轉(zhuǎn)換處理；
[0038]最大值確定子模塊，用于依據(jù)所述每個第一窗口的頻域數(shù)據(jù)，確定所述噪聲段的所有第一窗口在每個頻率上的頻譜最大值；及
[0039]記錄子模塊，用于將所述每個頻率上的頻譜最大值記錄為所述噪聲段對應(yīng)的噪聲特征。
[0040]優(yōu)選的，所述降噪處理模塊包括:
[0041]頻譜比較子模塊，用于將所述待降噪音頻信號與所述噪聲特征進行頻譜比較；及
[0042]頻譜增益處理子模塊，用于根據(jù)頻譜比較結(jié)果對所述待降噪音頻信號進行頻譜增益處理。
[0043]優(yōu)選的，所述頻譜增益處理子模塊包括:
[0044]參數(shù)確定單元，用于依據(jù)所述頻譜比較結(jié)果確定下調(diào)參數(shù)，使得所述下調(diào)參數(shù)隨著所述頻譜比較結(jié)果的增大而減??；及[0045]頻譜下調(diào)處理單元，用于依據(jù)所述下調(diào)參數(shù)對所述待降噪音頻信號進行頻譜下調(diào)處理。
[0046]優(yōu)選的,所述參數(shù)確定單元包括:
[0047]階段劃分子單元，用于按照大小順序?qū)㈩l譜比較結(jié)果劃分為若干個階段，其中階段對應(yīng)下調(diào)參數(shù)的大小順序與階段間頻譜比較結(jié)果的大小順序相反。
[0048]與現(xiàn)有技術(shù)相比，本申請具有以下優(yōu)點:
[0049]首先，相對于現(xiàn)有技術(shù)利用人為預(yù)聽的方式來選取音頻信號中的噪聲段，本申請在待降噪音頻信號中自動搜索能量最小的音頻信號段，將其作為噪聲段，所述自動搜索無需人為參與，故能夠節(jié)省現(xiàn)有技術(shù)所花費的人為的多次操作，從而能夠提高音頻降噪的便捷性。
[0050]其次，本申請在應(yīng)用于移動設(shè)備時，只需用戶通過一次按鍵操作觸發(fā)相應(yīng)的音頻降噪流程，因此，本申請能夠在移動設(shè)備上一鍵式濾除音頻信號中的環(huán)境噪聲，能夠符合移動設(shè)備的簡潔交互特性。
【專利附圖】

【附圖說明】
[0051]圖1是本申請一種音頻降噪方法實施例的流程圖；
[0052]圖2是本申請一種基于移動設(shè)備的音頻降噪方法實施例的流程圖；
[0053]圖3是本申請一種第二窗口的示例；
[0054]圖4是本申請一種音頻降噪裝置實施例的結(jié)構(gòu)圖。
【具體實施方式】
[0055]為使本申請的上述目的、特征和優(yōu)點能夠更加明顯易懂，下面結(jié)合附圖和【具體實施方式】對本申請作進一步詳細(xì)的說明。
[0056]參照圖1，示出了本申請一種音頻降噪方法實施例的流程圖，具體可以包括:
[0057]步驟101、在待降噪音頻信號中搜索能量最小的音頻信號段，將其作為噪聲段；
[0058]本申請實施例可以應(yīng)用于個人計算機(PC, Personal Computer)、移動設(shè)備等設(shè)備之上，用于在各種設(shè)備之上進行音頻降噪處理。
[0059]本申請實施例可以對各種格式的音頻信號進行降噪處理，如高級音頻編碼(AAC，Advanced Audio Coding)、動態(tài)影像專家壓縮標(biāo)準(zhǔn)音頻層面3 (MP3, Moving PictureExperts Group Audio Layer III)和WAVE格式等等；其中，降噪處理的音頻信號可以為單純的音頻文件中的音頻信號，也可以為視頻文件中的音頻信號?？傊旧暾垖嵤├龑唧w的音頻信號的格式和文件形式不加以限制。
[0060]另外，無論應(yīng)用于何種設(shè)備之上，用戶均可以通過一次按鍵操作觸發(fā)本申請的音頻降噪流程。
[0061]現(xiàn)有的音頻降噪方法是利用人為預(yù)聽的方式來選取音頻信號中的噪聲段的，需要人為的多次操作，便捷性較差，且不符合移動設(shè)備的簡潔交互特性。
[0062]而本申請實施例經(jīng)研究發(fā)現(xiàn):由于不包含主流聲信號(如人說話的聲音等)，純環(huán)境噪聲的能量通常比較小，也即，能量越小，相應(yīng)的信號音頻信號段與純環(huán)境噪聲的近似度越高；因此可以認(rèn)為，音頻信號中能量最小的音頻信號段就是純環(huán)境噪聲音頻信號段(以下統(tǒng)稱噪聲段)，這也是純環(huán)境噪聲能量最小的特性。
[0063]相應(yīng)地，所述依據(jù)純環(huán)境噪聲能量最小的特性，在待降噪音頻信號中搜索噪聲段的步驟101具體可以包括:在待降噪音頻信號中搜索能量最小的音頻信號段，將其作為噪聲段。
[0064]在具體實現(xiàn)中，可以在全部或部分待降噪音頻信號中搜索能量最小的音頻信號段，作為噪聲段。其中，在全部待降噪音頻信號中搜索噪聲段能夠有效保證噪聲段的搜索精度，但是具有運算量大的缺點；在部分待降噪音頻信號中搜索噪聲段具有運算量小的優(yōu)點，但是不能有效保證噪聲段的搜索精度。
[0065]經(jīng)研究發(fā)現(xiàn)，在音頻信號的初始部分，主流聲信號出現(xiàn)的概率比較低，而純環(huán)境噪聲出現(xiàn)的概率比較高。
[0066]因此，為了能夠有效保證噪聲段的搜索精度，在申請的一種優(yōu)選實施例中，所述在部分待降噪音頻信號中搜索能量最小的音頻信號段，作為噪聲段的步驟，可以進一步包括:
[0067]子步驟S111、遍歷所述待降噪音頻信號的初始部分，并比較所述初始部分中每個音頻信號段的能量；其中，所述每個音頻信號段的時域長度相等；
[0068]在具體實現(xiàn)中，本領(lǐng)域技術(shù)人員可以根據(jù)實際情況選擇所述待降噪音頻信號的前N秒作為所述初始部分，其中，N為自然數(shù)，例如，N=IO等等。另外，本領(lǐng)域技術(shù)人員也可以根據(jù)實際情況確定所述每個音頻信號段的時域長度，例如，在本申請的一種應(yīng)用示例中，每個音頻信號段的時域長度為2秒等等?？傊?，所述初始部分的長度和其中每個信號段的時域長度并不作為本申請實施例的應(yīng)用限制。
[0069]子步驟S112、從所有音頻信號段中選取能量最小的一個音頻信號段，作為噪聲段。
[0070]步驟102、對所述噪聲段進行頻譜分析得到其頻域特征，作為噪聲特征；
[0071]本申請實施例中，對所述噪聲段進行頻譜分析得到其頻域特征的過程也即噪聲特征學(xué)習(xí)的過程，其具體可以包括:通過快速傅里葉變換(FFT, Fast FourierTransformation)等時頻轉(zhuǎn)換處理將噪音段數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù),并記錄它的頻率特征。
[0072]在本申請的一種優(yōu)選實施例中，所述對所述噪聲段進行頻譜分析得到其頻域特征，作為噪聲特征的步驟102，具體可以包括:
[0073]子步驟S121、將所述噪聲段在時域上劃分為多個大小相等的第一窗口；
[0074]這里的大小相等是指每個第一窗口的字節(jié)數(shù)相等。例如，可以將2S的噪聲段劃分為以1024個字節(jié)為基本單位的若干個第一窗口，類型為INT或者FLOAT?？梢岳斫?，上述只是作為示例，本申請實施例對具體的第一窗口的個數(shù)、字節(jié)長度和類型不加以限制。
[0075]子步驟S122、對所述每個第一窗口進行時頻轉(zhuǎn)換處理；
[0076]公式(I)為本申請一種通過FFT進行時頻轉(zhuǎn)換處理的示例:
【權(quán)利要求】
1.一種音頻降噪方法，其特征在于，包括: 在待降噪音頻信號中搜索能量最小的音頻信號段，將其作為噪聲段；對所述噪聲段進行頻譜分析得到其頻域特征，作為噪聲特征；依據(jù)所述噪聲特征對所述待降噪音頻信號進行降噪處理。
2.如權(quán)利要求1所述的方法，其特征在于，所述在待降噪音頻信號中搜索能量最小的音頻信號段，將其作為噪聲段的步驟，包括: 在全部或部分待降噪音頻信號中搜索能量最小的音頻信號段，作為噪聲段。
3.如權(quán)利要求2所述的方法，其特征在于，所述在部分待降噪音頻信號中搜索能量最小的音頻信號段，作為噪聲段的步驟，包括: 遍歷所述待降噪音頻信號的初始部分，并比較所述初始部分中每個音頻信號段的能量；其中，所述每個音頻信號段的時域長度相等；從所有音頻信號段中選取能量最小的一個音頻信號段，作為噪聲段。
4.如權(quán)利要求1或2或3所述的方法，其特征在于，對所述噪聲段進行頻譜分析得到其頻域特征，作為噪聲特征的步驟，包括: 將所述噪聲段在時域上劃分為多個大小相等的第一窗口；對所述每個第一窗口進行時頻轉(zhuǎn)換處理；依據(jù)所述每個第一窗口的頻域數(shù)據(jù)，確定所述噪聲段的所有第一窗口在每個頻率上的頻譜最大值；` 將所述每個頻率上的頻譜最大值記錄為所述噪聲段對應(yīng)的噪聲特征。
5.如權(quán)利要求1或2或3所述的方法，其特征在于，所述依據(jù)所述噪聲特征對所述待降噪音頻信號進行降噪處理的步驟，包括: 將所述待降噪音頻信號與所述噪聲特征進行頻譜比較；根據(jù)頻譜比較結(jié)果對所述待降噪音頻信號進行頻譜增益處理。
6.如權(quán)利要求5所述的方法，其特征在于，所述根據(jù)頻譜比較結(jié)果對所述待降噪音頻信號進行頻譜增益處理的步驟包括: 依據(jù)所述頻譜比較結(jié)果確定下調(diào)參數(shù)，使得所述下調(diào)參數(shù)隨著所述頻譜比較結(jié)果的增大而減??；依據(jù)所述下調(diào)參數(shù)對所述待降噪音頻信號進行頻譜下調(diào)處理。
7.如權(quán)利要求6所述的方法，其特征在于，所述依據(jù)所述頻譜比較結(jié)果確定下調(diào)參數(shù)，使得所述下調(diào)參數(shù)隨著所述頻譜比較結(jié)果的增大而減小的步驟，包括: 按照大小順序?qū)㈩l譜比較結(jié)果劃分為若干個階段，其中階段對應(yīng)下調(diào)參數(shù)的大小順序與階段間頻譜比較結(jié)果的大小順序相反。
8.一種音頻降噪裝置，其特征在于，包括: 噪聲搜索模塊，用于在待降噪音頻信號中搜索能量最小的音頻信號段，將其作為噪聲段；噪聲特征學(xué)習(xí)模塊，用于對所述噪聲段進行頻譜分析得到其頻域特征，作為噪聲特征；及降噪處理模塊，用于依據(jù)所述噪聲特征對所述待降噪音頻信號進行降噪處理。
9.如權(quán)利要求8所述的裝置，其特征在于，所述噪聲搜索模塊，具體用于在全部或部分待降噪音頻信號中搜索能量最小的音頻信號段，作為噪聲段。
10.如權(quán)利要求9所述的裝置，其特征在于，所述噪聲搜索模塊包括: 遍歷比較子模塊，用于遍歷所述待降噪音頻信號的初始部分，并比較所述初始部分中每個音頻信號段的能量；其中，所述每個音頻信號段的時域長度相等；及選取子模塊，用于從所有音頻信號段中選取能量最小的一個音頻信號段，作為噪聲段。
11.如權(quán)利要求8或9或10所述的裝置，其特征在于，所述噪聲特征學(xué)習(xí)模塊包括: 窗口劃分子模塊，用于將所述噪聲段在時域上劃分為多個大小相等的第一窗口；時頻轉(zhuǎn)換處理子模塊，用于對所述每個第一窗口進行時頻轉(zhuǎn)換處理；最大值確定子模塊，用于依據(jù)所述每個第一窗口的頻域數(shù)據(jù)，確定所述噪聲段的所有第一窗口在每個頻率上的頻譜最大值；及記錄子模塊，用于將所述每個頻率上的頻譜最大值記錄為所述噪聲段對應(yīng)的噪聲特征。
12.如權(quán)利要求8或9或10所述的裝置，其特征在于，所述降噪處理模塊包括: 頻譜比較子模塊，用于將所述待降噪音頻信號與所述噪聲特征進行頻譜比較；及頻譜增益處理子模塊，用于根據(jù)頻譜比較結(jié)果對所述待降噪音頻信號進行頻譜增益處理。.
13.如權(quán)利要求12所述的裝置，其特征在于，所述頻譜增益處理子模塊包括: 參數(shù)確定單元，用于依據(jù)所述頻譜比較結(jié)果確定下調(diào)參數(shù)，使得所述下調(diào)參數(shù)隨著所述頻譜比較結(jié)果的增大而減??；及頻譜下調(diào)處理單元，用于依據(jù)所述下調(diào)參數(shù)對所述待降噪音頻信號進行頻譜下調(diào)處理。
14.如權(quán)利要求13所述的裝置，其特征在于，所述參數(shù)確定單元包括: 階段劃分子單元，用于按照大小順序?qū)㈩l譜比較結(jié)果劃分為若干個階段，其中階段對應(yīng)下調(diào)參數(shù)的大小順序與階段間頻譜比較結(jié)果的大小順序相反。
【文檔編號】G10L21/0208GK103440870SQ201310359719
【公開日】2013年12月11日申請日期:2013年8月16日優(yōu)先權(quán)日:2013年8月16日
【發(fā)明者】鐘勁申請人:北京奇藝世紀(jì)科技有限公司

完整全部詳細(xì)技術(shù)資料下載