專利名稱:一種雙端發(fā)音魯棒結(jié)構(gòu)及其消除聲學(xué)回聲的方法
技術(shù)領(lǐng)域:
本發(fā)明屬于移動(dòng)通信語音增強(qiáng)技術(shù)領(lǐng)域,特別涉及一種移動(dòng)通信系統(tǒng)中聲學(xué)回聲消除的裝置及方法,具體的說,是ー種雙端發(fā)音魯棒結(jié)構(gòu)及其消除聲學(xué)回聲的方法。
背景技術(shù):
聲學(xué)回聲是指近端揚(yáng)聲器播放的遠(yuǎn)端語音被近端麥克風(fēng)采集后又傳輸?shù)竭h(yuǎn)端,使得遠(yuǎn)端用戶聽到自己之前說話的聲音。聲學(xué)回聲的存在嚴(yán)重干擾了通信質(zhì)量。聲學(xué)回聲消除器是解決這ー問題的有效途徑。因此,在移動(dòng)通信系統(tǒng)中,回聲消除器是必不可少的組成部分。為了使語音信號(hào)不受聲學(xué)回聲干擾,回聲消除器在單端發(fā)音(single talk, ST)的情況下,加權(quán)的終端耦合損耗至少要達(dá)到46dB ;而在雙端發(fā)音(double talk, DT)的情況下要大于26dB?;芈曄鞯脑硎且赃h(yuǎn)端語音作為參考信號(hào),通過自適應(yīng)濾波器來逼近從揚(yáng)聲器到麥克風(fēng)的耦合回聲路徑,得到近似的回聲信號(hào),并從近端信號(hào)中減去這部分估計(jì)的回聲。理想的回聲消除器在保證低失配值(mi sal i gnment)的前提下,應(yīng)該具有快速收斂和跟蹤(應(yīng)對回聲路徑的時(shí)變特性)能力。這兩個(gè)特性都取決于濾波器所采用的自適應(yīng)算法。在ST情況下,現(xiàn)有的自適應(yīng)算法都能得到滿意的回聲消除效果。在DT情況下,由于受近端語音的干擾,這些自適應(yīng)算法將會(huì)發(fā)散,偏離實(shí)際的回聲信道,使得回聲消除的性能急劇惡化。根據(jù)統(tǒng)計(jì)結(jié)果,在一次通話過程中,DT發(fā)生的時(shí)間約占20%左右。因此DT時(shí)回聲消除器的性能很重要。常用的解決方案是引入雙端發(fā)音檢測器(double talk detector, DTD)。當(dāng)DTD檢測到雙端發(fā)音吋,自適應(yīng)濾波器停止更新。這種解決方案的缺點(diǎn)是,在DTD檢測到雙端發(fā)音時(shí)濾波器可能已經(jīng)發(fā)散。針對這ー問題,人們提出了各種變步長自適應(yīng)算法。其思路是根據(jù)遠(yuǎn)、近端的語音特性,自動(dòng)調(diào)節(jié)自適應(yīng)濾波器的更新步長,ST時(shí)步長較大,DT時(shí)步長較小。但是這些變步長方法在ST和回聲路徑發(fā)生變化時(shí)收斂速度會(huì)受到影響。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是針對現(xiàn)有技術(shù)的現(xiàn)狀,提供一種單端發(fā)音和回聲路徑發(fā)生變化的情況下具有快速跟蹤能力從而保證全雙エ通信中的語音質(zhì)量,避免了雙端發(fā)音情況下濾波器發(fā)散問題的ー種雙端發(fā)音魯棒結(jié)構(gòu)及其消除聲學(xué)回聲的方法。本發(fā)明解決上述技術(shù)問題所采用的技術(shù)方案為
一種雙端發(fā)音魯棒結(jié)構(gòu),包括有用于接收并保存遠(yuǎn)端語音數(shù)據(jù)的遠(yuǎn)端語音數(shù)據(jù)緩存模塊及接收并保存近端語音數(shù)據(jù)的近端語音數(shù)據(jù)緩存模塊,其中,遠(yuǎn)端語音數(shù)據(jù)緩存模塊及近端語音數(shù)據(jù)緩存模塊信號(hào)連接有自回歸模型,自回歸模型包括有能根據(jù)估計(jì)誤差進(jìn)行自適應(yīng)學(xué)習(xí)的自適應(yīng)濾波器,自回歸模型連接有能將處理后信號(hào)輸出至遠(yuǎn)端的殘留回聲抑制模塊;自適應(yīng)濾波器在雙端發(fā)音時(shí)進(jìn)行自適應(yīng)調(diào)節(jié),降低學(xué)習(xí)速度。為優(yōu)化上述技術(shù)方案,采取的措施還包括
上述的殘留回聲抑制模塊連接有連接有均衡化處理器。上述的殘留回聲抑制模塊連接有連接有自動(dòng)增益控制處理器。
—種雙端發(fā)音魯棒結(jié)構(gòu)消除聲學(xué)回聲的方法,其中,包括以下步驟
步驟ー通過遠(yuǎn)端語音數(shù)據(jù)緩存模塊將遠(yuǎn)端語音數(shù)據(jù)緩存后作為回聲估計(jì)參考信號(hào); 步驟ニ 通過近端語音數(shù)據(jù)緩存模塊將近端語音數(shù)據(jù)緩存后作為麥克語音估計(jì)參考信
號(hào); 步驟三根據(jù)近端語音估計(jì)參考信號(hào),用自回歸模型估計(jì)近端語音信號(hào),自回歸模型的系數(shù)根據(jù)估計(jì)誤差進(jìn)行自適應(yīng)學(xué)習(xí);
步驟四根據(jù)回聲估計(jì)參考信號(hào),通過自適應(yīng)濾波器估計(jì)從揚(yáng)聲器耦合到麥克的回聲,并根據(jù)殘留回聲、近端語音和遠(yuǎn)端語音的能量自適應(yīng)調(diào)節(jié)規(guī)則化因子,調(diào)整自適應(yīng)濾波器學(xué)習(xí)速度;
步驟五將近端語音減去估計(jì)的回聲得到誤差信號(hào);
步驟六將步驟五得到的誤差信號(hào)作為殘留回聲抑制模塊的輸入;
步驟七將殘留回聲抑制模塊的輸出經(jīng)過均衡化處理器、自動(dòng)增益控制處理器的處理后,發(fā)送到遠(yuǎn)端。上述的自適應(yīng)濾波器為自適應(yīng)FIR濾波器。上述的自適應(yīng)濾波器在單端發(fā)音或回聲路徑發(fā)生變化時(shí)的學(xué)習(xí)速度高于在雙端發(fā)音時(shí)的學(xué)習(xí)速度。上述的殘留回聲抑制模塊根據(jù)通信狀態(tài),對近端及遠(yuǎn)端語音進(jìn)行衰減。與現(xiàn)有技術(shù)相比,本發(fā)明ー種雙端發(fā)音魯棒結(jié)構(gòu),包括有用于接收并保存遠(yuǎn)端語音數(shù)據(jù)的遠(yuǎn)端語音數(shù)據(jù)緩存模塊及接收并保存近端語音數(shù)據(jù)的近端語音數(shù)據(jù)緩存模塊,其中,遠(yuǎn)端語音數(shù)據(jù)緩存模塊及近端語音數(shù)據(jù)緩存模塊信號(hào)連接有自回歸模型,自回歸模型包括有能根據(jù)估計(jì)誤差進(jìn)行自適應(yīng)學(xué)習(xí)的自適應(yīng)濾波器,自回歸模型連接有能將處理后信號(hào)輸出至遠(yuǎn)端的殘留回聲抑制模塊;自適應(yīng)濾波器在雙端發(fā)音時(shí)進(jìn)行自適應(yīng)調(diào)節(jié),降低學(xué)習(xí)速度。單端發(fā)音或回聲路徑發(fā)生變化的情況下自適應(yīng)濾波器學(xué)習(xí)速度較快,雙端發(fā)音情況下學(xué)習(xí)速度較慢。由于采用了自回歸模型和自適應(yīng)濾波器更新技木,用白噪聲通過自回歸模型估計(jì)近端語音可加快收斂速度,同時(shí)根據(jù)通信場景自適應(yīng)調(diào)節(jié)學(xué)習(xí)速度避免了雙端發(fā)音情況下濾波器發(fā)散的問題。自適應(yīng)濾波器僅能消除線性回聲,對于非線性回聲,還需要經(jīng)過殘留回聲抑制模塊的處理。本發(fā)明可保證全雙エ通信中的語音信號(hào)質(zhì)量,能廣泛應(yīng)用于移動(dòng)通信領(lǐng)域中。
圖I是本發(fā)明雙端發(fā)音魯棒結(jié)構(gòu)示意 圖2為本發(fā)明聲學(xué)回聲消除的示意 圖3為本發(fā)明聲學(xué)回聲消除方法在單端發(fā)音情況下的ー個(gè)能量統(tǒng)計(jì)結(jié)果;
圖4為本發(fā)明聲學(xué)回聲消除方法在雙端發(fā)音情況下的ー個(gè)能量統(tǒng)計(jì)結(jié)果;
圖5為本發(fā)明聲學(xué)回聲消除方法在回聲路徑發(fā)生改變情況下的ー個(gè)能量統(tǒng)計(jì)結(jié)果。
具體實(shí)施例方式以下結(jié)合附圖實(shí)施例對本發(fā)明作進(jìn)ー步詳細(xì)描述。如圖I至圖5所示,圖標(biāo)號(hào)說明如下遠(yuǎn)端語音數(shù)據(jù)緩存模塊I、近端語音數(shù)據(jù)緩存模塊2、自回歸模型3、自適應(yīng)濾波器4、殘留回聲抑制模塊5、均衡化處理器6、自動(dòng)增益控制處理器7。圖I至圖5所示本發(fā)明的一種雙端發(fā)音魯棒結(jié)構(gòu),包括有用于接收并保存遠(yuǎn)端語音數(shù)據(jù)的遠(yuǎn)端語音數(shù)據(jù)緩存模塊I及接收并保存近端語音數(shù)據(jù)的近端語音數(shù)據(jù)緩存模塊2,其中,遠(yuǎn)端語音數(shù)據(jù)緩存模塊I及近端語音數(shù)據(jù)緩存模塊2信號(hào)連接有自回歸模型3,自回歸模型3包括有能根據(jù)估計(jì)誤差進(jìn)行自適應(yīng)學(xué)習(xí)的自適應(yīng)濾波器4,自回歸模型3連接有能將處理后信號(hào)輸出至遠(yuǎn)端的殘留回聲抑制模塊5 ;自適應(yīng)濾波器4在雙端發(fā)音時(shí)進(jìn)行自適應(yīng)調(diào)節(jié),降低學(xué)習(xí)速度。實(shí)施例中,殘留回聲抑制模塊5連接有連接有均衡化處理器6。實(shí)施例中,殘留回聲抑制模塊5連接有連接有自動(dòng)增益控制處理器7。一種通過雙端發(fā)音魯棒消除聲學(xué)回聲的方法,其中,包括以下步驟
步驟ー通過遠(yuǎn)端語音數(shù)據(jù)緩存模塊I將遠(yuǎn)端語音數(shù)據(jù)緩存后作為回聲估計(jì)參考信
號(hào);
步驟ニ 通過近端語音數(shù)據(jù)緩存模塊2將近端語音數(shù)據(jù)緩存后作為麥克語音估計(jì)參考信號(hào);
步驟三根據(jù)近端語音估計(jì)參考信號(hào),用自回歸模型3估計(jì)近端語音信號(hào),自回歸模型3的系數(shù)根據(jù)估計(jì)誤差進(jìn)行自適應(yīng)學(xué)習(xí);
步驟四根據(jù)回聲估計(jì)參考信號(hào),通過自適應(yīng)濾波器4估計(jì)從揚(yáng)聲器耦合到麥克的回聲,并根據(jù)殘留回聲、近端語音和遠(yuǎn)端語音的能量自適應(yīng)調(diào)節(jié)規(guī)則化因子,調(diào)整自適應(yīng)濾波器4學(xué)習(xí)速度;
步驟五將近端語音減去估計(jì)的回聲得到誤差信號(hào);
步驟六將步驟五得到的誤差信號(hào)作為殘留回聲抑制模塊5的輸入;
步驟七將殘留回聲抑制模塊5的輸出經(jīng)過均衡化處理器6、自動(dòng)增益控制處理器7的處理后,發(fā)送到遠(yuǎn)端。實(shí)施例中,自適應(yīng)濾波器4為自適應(yīng)FIR濾波器。實(shí)施例中,自適應(yīng)濾波器4在單端發(fā)音或回聲路徑發(fā)生變化時(shí)的學(xué)習(xí)速度高于在雙端發(fā)音時(shí)的學(xué)習(xí)速度。實(shí)施例中,殘留回聲抑制模塊5根據(jù)通信狀態(tài),對近端及遠(yuǎn)端語音進(jìn)行衰減。單端發(fā)音或回聲路徑發(fā)生變化的情況下自適應(yīng)濾波器4學(xué)習(xí)速度較快,雙端發(fā)音情況下學(xué)習(xí)速度較慢。由于采用了自回歸模型3和自適應(yīng)濾波器4更新技術(shù),用白噪聲通過自回歸模型3估計(jì)近端語音可加快收斂速度,同時(shí)根據(jù)通信場景自適應(yīng)調(diào)節(jié)學(xué)習(xí)速度避免了雙端發(fā)音情況下濾波器發(fā)散的問題。自適應(yīng)濾波器4僅能消除線性回聲,對于非線性回聲,還需要經(jīng)過殘留回聲抑制模塊5的處理。本發(fā)明可保證全雙エ通信中的語音信號(hào)質(zhì)量,能廣泛應(yīng)用于移動(dòng)通信領(lǐng)域中。本發(fā)明的主要構(gòu)思是,利用自回歸模型3將近端語音和遠(yuǎn)端語音去相關(guān),以達(dá)到加快收斂速度的目的;同時(shí)根據(jù)近、遠(yuǎn)端信號(hào)和殘留回聲的能量統(tǒng)計(jì)特性調(diào)整自適應(yīng)濾波器4的學(xué)習(xí)速度,在保證單端發(fā)音和回聲路徑改變情況下收斂速度的同時(shí),避免了雙端發(fā)音情況下濾波器的發(fā)散。下面結(jié)合附圖及具體實(shí)施方法,對本發(fā)明采用的技術(shù)方案作進(jìn)ー步詳細(xì)說明。
參見圖3,以I階自回歸模型為例,假設(shè):?、葹榻苏Z音信號(hào),xifl)為遠(yuǎn)端語音信號(hào),hifl)表示估計(jì)的回聲耦合路徑?jīng)_激響應(yīng),L表示h(n)的階數(shù),afc)為自回歸模型系數(shù),d{n)為估計(jì)的回聲,<n)表示自回歸模型3對近端語音的估計(jì)誤差,eifl)為y(n)減去估計(jì)回聲ゴfc)得到的誤差信號(hào),ポ00、ゼ00、ゼ00和べ(》)分別表示近端語音估計(jì)誤差、6( )、^( )和ァ(《)的能量估計(jì),Jltt、禹、毛和冬分別表示計(jì)算這些能量估計(jì)時(shí)所采用的遺忘因子,Pk(H)和PI1(H)分別表示力(/7)和a(/ )的梯度矢量。
權(quán)利要求
1.一種雙端發(fā)音魯棒結(jié)構(gòu),包括有用于接收并保存遠(yuǎn)端語音數(shù)據(jù)的遠(yuǎn)端語音數(shù)據(jù)緩存模塊(I)及接收并保存近端語音數(shù)據(jù)的近端語音數(shù)據(jù)緩存模塊(2),其特征是所述的遠(yuǎn)端語音數(shù)據(jù)緩存模塊(I)及近端語音數(shù)據(jù)緩存模塊(2)信號(hào)連接有自回歸模型(3),所述的自回歸模型(3)包括有能根據(jù)估計(jì)誤差進(jìn)行自適應(yīng)學(xué)習(xí)的自適應(yīng)濾波器(4),所述的自回歸模型(3)連接有能將處理后信號(hào)輸出至遠(yuǎn)端的殘留回聲抑制模塊(5);所述的自適應(yīng)濾波器(4)在雙端發(fā)音時(shí)進(jìn)行自適應(yīng)調(diào)節(jié),降低學(xué)習(xí)速度。
2.根據(jù)根據(jù)權(quán)利要求I所述的ー種雙端發(fā)音魯棒結(jié)構(gòu),其特征是所述的殘留回聲抑制模塊(5)連接有連接有均衡化處理器(6)。
3.根據(jù)根據(jù)權(quán)利要求2所述的ー種雙端發(fā)音魯棒結(jié)構(gòu),其特征是所述的殘留回聲抑制模塊(5)連接有連接有自動(dòng)增益控制處理器(7)。
4.通過如權(quán)利要求I所述的ー種雙端發(fā)音魯棒結(jié)構(gòu)消除聲學(xué)回聲的方法,其特征是包括以下步驟 步驟ー通過遠(yuǎn)端語音數(shù)據(jù)緩存模塊(I)將遠(yuǎn)端語音數(shù)據(jù)緩存后作為回聲估計(jì)參考信號(hào); 步驟ニ 通過近端語音數(shù)據(jù)緩存模塊(2)將近端語音數(shù)據(jù)緩存后作為麥克語音估計(jì)參考信號(hào); 步驟三根據(jù)近端語音估計(jì)參考信號(hào),用自回歸模型(3)估計(jì)近端語音信號(hào),自回歸模型(3)的系數(shù)根據(jù)估計(jì)誤差進(jìn)行自適應(yīng)學(xué)習(xí); 步驟四根據(jù)回聲估計(jì)參考信號(hào),通過自適應(yīng)濾波器(4)估計(jì)從揚(yáng)聲器耦合到麥克的回聲,并根據(jù)殘留回聲、近端語音和遠(yuǎn)端語音的能量自適應(yīng)調(diào)節(jié)規(guī)則化因子,調(diào)整自適應(yīng)濾波器(4)學(xué)習(xí)速度; 步驟五將近端語音減去估計(jì)的回聲得到誤差信號(hào); 步驟六將步驟五得到的誤差信號(hào)作為殘留回聲抑制模塊(5)的輸入; 步驟七將殘留回聲抑制模塊(5)的輸出經(jīng)過均衡化處理器(6)、自動(dòng)增益控制處理器(7)的處理后,發(fā)送到遠(yuǎn)端。
5.根據(jù)權(quán)利要求4所述的ー種雙端發(fā)音魯棒結(jié)構(gòu)消除聲學(xué)回聲的方法,其特征是所述的自適應(yīng)濾波器⑷為自適應(yīng)FIR濾波器。
6.根據(jù)權(quán)利要求5所述的ー種雙端發(fā)音魯棒結(jié)構(gòu)消除聲學(xué)回聲的方法,其特征是所述的自適應(yīng)濾波器(4)在單端發(fā)音或回聲路徑發(fā)生變化時(shí)的學(xué)習(xí)速度高于在雙端發(fā)音時(shí)的學(xué)習(xí)速度。
7.根據(jù)權(quán)利要求6所述的ー種雙端發(fā)音魯棒結(jié)構(gòu)消除聲學(xué)回聲的方法,其特征是所述的殘留回聲抑制模塊(5)根據(jù)通信狀態(tài),對近端及遠(yuǎn)端語音進(jìn)行衰減。
全文摘要
本發(fā)明一種雙端發(fā)音魯棒結(jié)構(gòu),包括有用于接收并保存遠(yuǎn)端語音數(shù)據(jù)的遠(yuǎn)端語音數(shù)據(jù)緩存模塊及接收并保存近端語音數(shù)據(jù)的近端語音數(shù)據(jù)緩存模塊,其中,遠(yuǎn)端語音數(shù)據(jù)緩存模塊及近端語音數(shù)據(jù)緩存模塊信號(hào)連接有自回歸模型,自回歸模型包括有能根據(jù)估計(jì)誤差進(jìn)行自適應(yīng)學(xué)習(xí)的自適應(yīng)濾波器,自回歸模型連接有能將處理后信號(hào)輸出至遠(yuǎn)端的殘留回聲抑制模塊;自適應(yīng)濾波器在雙端發(fā)音時(shí)進(jìn)行自適應(yīng)調(diào)節(jié),降低學(xué)習(xí)速度。本發(fā)明采用自回歸模型和自適應(yīng)濾波器更新技術(shù),用白噪聲通過自回歸模型估計(jì)近端語音加快收斂速度,同時(shí)根據(jù)通信場景自適應(yīng)調(diào)節(jié)學(xué)習(xí)速度避免了雙端發(fā)音情況下濾波器發(fā)散的問題。保證全雙工通信中的語音信號(hào)質(zhì)量,能廣泛應(yīng)用于移動(dòng)通信領(lǐng)域中。
文檔編號(hào)H04M9/08GK102655558SQ201210158169
公開日2012年9月5日 申請日期2012年5月21日 優(yōu)先權(quán)日2012年5月21日
發(fā)明者吳少群, 朱仁祥, 袁紅星, 諸葛霞, 陳天 申請人:寧波工程學(xué)院