亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種近端語音信號(hào)檢測方法及裝置的制造方法

文檔序號(hào):10665992閱讀:363來源:國知局
一種近端語音信號(hào)檢測方法及裝置的制造方法
【專利摘要】本發(fā)明公開了一種近端語音信號(hào)檢測方法及裝置,包括:接收第一輸入信號(hào)以及第二輸入信號(hào),所述第一輸入信號(hào)通過對(duì)遠(yuǎn)端語音信號(hào)進(jìn)行線性變換或非線性變換獲得,所述第二輸入信號(hào)為音頻接收傳感器的輸出信號(hào);根據(jù)所述第一輸入信號(hào)確定出所述第一輸入信號(hào)的第一聲紋特征矢量,根據(jù)所述第二輸入信號(hào)確定出所述第二輸入信號(hào)的第二聲紋特征矢量;確定出所述第一聲紋特征與所述第二聲紋特征之間的距離,并根據(jù)所述距離確定是否發(fā)生雙講。
【專利說明】
一種近端語音信號(hào)檢測方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及語音信號(hào)檢測技術(shù)領(lǐng)域,尤其涉及一種近端語音信號(hào)檢測方法及裝 置。
【背景技術(shù)】
[0002] 聲學(xué)回波抵消器(Acoustic Echo canceller,AEC)是電話會(huì)議系統(tǒng)、免提通信終 端等設(shè)備的一個(gè)重要模塊,是用來抵消由揚(yáng)聲器到麥克風(fēng)的聲學(xué)耦合反饋效應(yīng),即揚(yáng)聲器 到麥克風(fēng)之間的聲學(xué)回波。
[0003] 在聲學(xué)回波抵消器中,用一個(gè)濾波器對(duì)回波路徑進(jìn)行自適應(yīng)地?cái)?shù)學(xué)建模,并由此 合成一個(gè)聲學(xué)回波的有效估計(jì),然后在麥克風(fēng)的接收信號(hào)的輸出信號(hào)中減去該聲學(xué)回波的 有效估計(jì),從而實(shí)現(xiàn)聲學(xué)回波抵消的目的。當(dāng)麥克風(fēng)的接收信號(hào)中出現(xiàn)近端語音信號(hào)時(shí),BP 發(fā)生雙講(Double-Talk,DT)情形,由于它與遠(yuǎn)端語音信號(hào)統(tǒng)計(jì)上不相關(guān),因而其猶如一個(gè) 突發(fā)的噪聲,使得濾波器的系數(shù)將偏離實(shí)際聲學(xué)回波路徑所對(duì)應(yīng)的真值而發(fā)生發(fā)散現(xiàn)象。 這便相應(yīng)地增大了回波殘留量,使聲學(xué)回波抵消器的性能惡化。為使聲學(xué)回波抵消器的工 作性能穩(wěn)定可靠,準(zhǔn)確而及時(shí)地檢測出麥克風(fēng)接收信號(hào)中是否發(fā)生雙講,便是一項(xiàng)非常重 要和必要的任務(wù)。在DT發(fā)生的條件下,濾波器系數(shù)的自適應(yīng)學(xué)習(xí)必須停止進(jìn)行,以避免在 該情況下濾波器系數(shù)持續(xù)學(xué)習(xí)所致的發(fā)散現(xiàn)象。
[0004] 為克服這一問題,一種自然的處理方法是:濾波器的濾波器系數(shù)矢量的學(xué)習(xí)算法 應(yīng)該在發(fā)生雙講的情況下被停止執(zhí)行,而在未發(fā)生雙講時(shí)將持續(xù)進(jìn)行。由此,雙講檢測器 (DTD)便應(yīng)運(yùn)而生。目前,雙講檢測器主要是基于互相關(guān)(Cross-Correlation)準(zhǔn)則實(shí)現(xiàn) 的。在基于互相關(guān)準(zhǔn)則的DTD中,較典型的技術(shù)方案有以下兩種:
[0005] 第一種方案,利用聲學(xué)回波抵消器中的誤差信號(hào)e(n)和遠(yuǎn)端語音信號(hào)矢量^>〇 之間互相關(guān)來進(jìn)行雙講檢測,誤差信號(hào)e (η)和遠(yuǎn)端語音信號(hào)矢量沿〇j之間互相關(guān)系數(shù)如 下:
[0006]
(1)
[0007] 在由放大器過載和編碼解碼器引入的非線性失真可以忽略不計(jì),以及環(huán)境噪聲是 平穩(wěn)的假設(shè)條件下(在無特別注明的情況下,以下均假設(shè)該條件成立),式(1)變?yōu)椋?br>[0008]
(2)
[0009] 其中
為聲學(xué)回波的回波路徑中線性部分的 沖擊響應(yīng),L為回波路徑的長度:
濾波器的沖擊響應(yīng);
1為遠(yuǎn)端語音信號(hào)的自相關(guān)矩陣。
[0010] 式⑵中的氣0高度依賴于回波路徑的變化,因而適合用于檢測聲學(xué)回波路徑是 否發(fā)生變化,而不是用來檢測雙講是否發(fā)生。
[0011] 第二種方案,利用遠(yuǎn)端語音信號(hào)矢量交(漢|和麥克風(fēng)輸出信號(hào)y(n)之間的互相關(guān) 來構(gòu)造一個(gè)決策統(tǒng)計(jì)量用于雙講檢測。矢量和y(η)之間的互相關(guān)%^可表達(dá)為:
[0012]
(3)
[0013] 考慮到麥克風(fēng)輸出信號(hào)y (η)的方差of可表示成下式:
[0014]
.(4)
[0015] 其中和分別為環(huán)境噪聲和近端語音信號(hào)的功率。
[0016] 在無DT,即u (η) = 0時(shí),式⑷即為:
[0017]
(5)
[0018] 將決策統(tǒng)計(jì)量ξ B_sty定義為用式(5)除以式(4)后再開方,ΒΡ :
[0019]
(6)
[0020] 根據(jù)式(6)可以確定,在無雙講時(shí),決策統(tǒng)計(jì)量ξ B_sty取值為1 ;在有雙講時(shí),決 策統(tǒng)計(jì)量l[fenf3Sty取值小于1。因此可定義一個(gè)門限值參數(shù)T Benesty,€ Benesty T Benesty,貝U 確定發(fā)生雙講;否則,確定無雙講發(fā)生。
[0021] 還可以利用誤差信號(hào)e(n)和麥克風(fēng)輸出信號(hào)y(n)之間的互相關(guān)來構(gòu)造DTD的決 策統(tǒng)計(jì)量,具體的,將誤差信號(hào) e(n)和麥克風(fēng)輸出信號(hào)y(n)之間的互相關(guān)定義為:
[0022]
[0023] 構(gòu)造的決策統(tǒng)計(jì)量ξ Iqbal如下:
[0024]
(8)
[0025] 在濾波器收斂時(shí),濾波器的沖擊響應(yīng)趨于回波路徑的沖擊響應(yīng),即fn 那么在 無雙講的情況下ξ Iqbal 1,而在有雙講時(shí)ξ Iqbal 1 0 因此可定義一個(gè)門限值參數(shù)T Iqbal' 當(dāng)€ Iqbal< T Iqbal,則確定發(fā)生雙講;否則,就確定未發(fā)生雙講。
[0026] 上述介紹的雙講檢測技術(shù)都是基于以下兩個(gè)假設(shè):1、聲學(xué)回波路徑中非線性失真 很小而忽略不計(jì);2、環(huán)境噪聲是平穩(wěn)的。然而實(shí)際系統(tǒng)中,由于放大器過載和編碼解碼器所 引發(fā)的非線性失真不可忽略,使得現(xiàn)有基于互相關(guān)技術(shù)的雙講檢測技術(shù)的性能較差;此外, 實(shí)際環(huán)境中的噪聲也并非是平穩(wěn)的,這一非平穩(wěn)性也將進(jìn)一步加劇該類雙講檢測技術(shù)性能 的惡化程度,乃至有時(shí)無法正常檢測出是否發(fā)生雙講。

【發(fā)明內(nèi)容】

[0027] 本發(fā)明實(shí)施例提供了一種近端語音信號(hào)檢測方法及裝置,用以提高雙講檢測性 能。
[0028] 本發(fā)明實(shí)施例提供了一種近端語音信號(hào)檢測方法,包括:
[0029] 接收第一輸入信號(hào)以及第二輸入信號(hào),所述第一輸入信號(hào)為移動(dòng)終端接收到的遠(yuǎn) 端信號(hào)被線性或非線性變換后所得到的信號(hào),所述第二輸入信號(hào)為所述移動(dòng)終端接收到的 近端信號(hào);
[0030] 提取所述第一輸入信號(hào)的第一聲紋特征,以及所述第二輸入信號(hào)的第二聲紋特 征;
[0031] 確定所述第一聲紋特征與所述第二聲紋特征的距離;
[0032] 根據(jù)所述距離確定所述第二輸入信號(hào)中是否存在近端語音信號(hào)。
[0033] 較佳的,所述第一輸入信號(hào)為所述移動(dòng)終端的自適應(yīng)濾波器輸出的回波估計(jì)信 號(hào),所述回波估計(jì)信號(hào)是所述自適應(yīng)濾波器對(duì)所述遠(yuǎn)端信號(hào)進(jìn)行線性或非線性濾波得到 的。
[0034] 較佳的,所述第一輸入信號(hào)為所述遠(yuǎn)端信號(hào)被線性延時(shí)后得到的信號(hào)。
[0035] 較佳的,所述根據(jù)所述距離確定所述第二輸入信號(hào)中是否存在近端語音信號(hào),包 括:
[0036] 判斷所述距離是否小于第一門限值,若是,則確定所述第二輸入信號(hào)中不存在近 端語音信號(hào),否則,確定所述第二輸入信號(hào)中存在近端語音信號(hào)。
[0037] 較佳的,所述確定所述第二輸入信號(hào)中存在近端語音信號(hào)之后,還包括:
[0038] 向所述移動(dòng)終端的自適應(yīng)濾波器發(fā)送指示信息,所述指示信息用于指示所述自適 應(yīng)濾波器暫停更新濾波器系數(shù)。
[0039] 本發(fā)明實(shí)施例提供了一種近端語音信號(hào)檢測方法,包括:
[0040] 接收第一輸入信號(hào)以及第二輸入信號(hào),所述第一輸入信號(hào)為移動(dòng)終端接收到的遠(yuǎn) 端信號(hào),所述第二輸入信號(hào)為所述移動(dòng)終端接收到的近端信號(hào);
[0041] 檢測所述第一輸入信號(hào)是否大于第二門限值,以及檢測所述第二輸入信號(hào)是否大 于第三門限值;
[0042] 若所述第一輸入信號(hào)大于第二門限值,且所述第二輸入信號(hào)大于第三門限值,則 提取所述第一輸入信號(hào)的第一聲紋特征,以及提取所述第二輸入信號(hào)的第二聲紋特征,確 定所述第一聲紋特征與所述第二聲紋特征的距離,根據(jù)所述距離確定所述第二輸入信號(hào)中 是否存在近端語音信號(hào)。
[0043] 較佳的,所述檢測所述第一輸入信號(hào)是否大于第二門限值,以及檢測所述第二輸 入信號(hào)是否大于第三門限值,包括:
[0044] 檢測所述第一輸入信號(hào)在第一時(shí)間點(diǎn)是否大于所述第二門限值,以及檢測所述第 二輸入信號(hào)在第二時(shí)間點(diǎn)是否大于所述第三門限值,所述第二時(shí)間點(diǎn)為所述第一時(shí)間點(diǎn)經(jīng) 過延時(shí)后的時(shí)間點(diǎn)。
[0045] 較佳的,所述根據(jù)所述距離確定所述第二輸入信號(hào)中是否存在近端語音信號(hào),包 括:
[0046] 若所述距離小于第四門限值,則確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)不存在 近端語音信號(hào),否則,確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)存在近端語音信號(hào)。
[0047] 較佳的,還包括:
[0048] 若所述第二輸入信號(hào)小于所述第三門限值,則確定所述第二輸入信號(hào)在所述第二 時(shí)間點(diǎn)不存在近端語音信號(hào);或者,
[0049] 若所述第一輸入信號(hào)小于所述第二門限值,且所述第二輸入信號(hào)大于所述第三門 限值,則確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)存在近端語音信號(hào)。
[0050] 較佳的,確定所述第二輸入信號(hào)中存在近端語音信號(hào)之后,還包括:
[0051] 向所述移動(dòng)終端的自適應(yīng)濾波器發(fā)送指示信息,所述指示信息用于指示所述自適 應(yīng)濾波器暫停更新濾波器系數(shù)。
[0052] 本發(fā)明實(shí)施例提供了一種近端語音信號(hào)檢測裝置,包括:
[0053] 接收單元,用于接收第一輸入信號(hào)以及第二輸入信號(hào),所述第一輸入信號(hào)為移動(dòng) 終端接收到的遠(yuǎn)端信號(hào)被線性或非線性變換后所得到的信號(hào),所述第二輸入信號(hào)為所述移 動(dòng)終端接收到的近端信號(hào);
[0054] 提取單元,用于提取所述第一輸入信號(hào)的第一聲紋特征,以及所述第二輸入信號(hào) 的第二聲紋特征;
[0055] 確定單元,用于確定所述第一聲紋特征與所述第二聲紋特征的距離,根據(jù)所述距 離確定所述第二輸入信號(hào)中是否存在近端語音信號(hào)。
[0056] 較佳的,所述第一輸入信號(hào)為所述移動(dòng)終端的自適應(yīng)濾波器輸出的回波估計(jì)信 號(hào),所述回波估計(jì)信號(hào)是所述自適應(yīng)濾波器對(duì)所述遠(yuǎn)端信號(hào)進(jìn)行線性或非線性濾波得到 的。
[0057] 較佳的,所述第一輸入信號(hào)為所述遠(yuǎn)端信號(hào)被線性延時(shí)后得到的信號(hào)。
[0058] 較佳的,所述確定單元具體用于:
[0059] 判斷所述距離是否小于第一門限值,若是,則確定所述第二輸入信號(hào)中不存在近 端語音信號(hào),否則,確定所述第二輸入信號(hào)中存在近端語音信號(hào)。
[0060] 較佳的,所述確定單元還用于:
[0061] 向所述移動(dòng)終端的自適應(yīng)濾波器發(fā)送指示信息,所述指示信息用于指示所述自適 應(yīng)濾波器暫停更新濾波器系數(shù)。
[0062] 本發(fā)明實(shí)施例提供了一種近端語音信號(hào)檢測裝置,包括:
[0063] 接收單元,用于接收第一輸入信號(hào)以及第二輸入信號(hào),所述第一輸入信號(hào)為移動(dòng) 終端接收到的遠(yuǎn)端信號(hào),所述第二輸入信號(hào)為所述移動(dòng)終端接收到的近端信號(hào);
[0064] 檢測單元,用于檢測所述第一輸入信號(hào)是否大于第二門限值,以及檢測所述第二 輸入信號(hào)是否大于第三門限值;
[0065] 確定單元,用于確定所述第一輸入信號(hào)大于第二門限值,且所述第二輸入信號(hào)大 于第三門限值時(shí),提取所述第一輸入信號(hào)的第一聲紋特征,以及提取所述第二輸入信號(hào)的 第二聲紋特征,確定所述第一聲紋特征與所述第二聲紋特征的距離,根據(jù)所述距離確定所 述第二輸入信號(hào)中是否存在近端語音信號(hào)。
[0066] 較佳的,所述檢測單元用于:
[0067] 檢測所述第一輸入信號(hào)在第一時(shí)間點(diǎn)是否大于所述第二門限值,以及檢測所述第 二輸入信號(hào)在第二時(shí)間點(diǎn)是否大于所述第三門限值,所述第二時(shí)間點(diǎn)為所述第一時(shí)間點(diǎn)經(jīng) 過延時(shí)后的時(shí)間點(diǎn)。
[0068] 較佳的,所述確定單元具體用于:
[0069] 若所述距離小于第四門限值,則確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)不存在 近端語音信號(hào),否則,確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)存在近端語音信號(hào)。
[0070] 較佳的,所述確定單元還用于:
[0071] 若所述第二輸入信號(hào)小于所述第三門限值,則確定所述第二輸入信號(hào)在所述第二 時(shí)間點(diǎn)不存在近端語音信號(hào);或者,
[0072] 若所述第一輸入信號(hào)小于所述第二門限值,且所述第二輸入信號(hào)大于所述第三門 限值,則確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)存在近端語音信號(hào)。
[0073] 較佳的,所述確定單元還用于:
[0074] 向所述移動(dòng)終端的自適應(yīng)濾波器發(fā)送指示信息,所述指示信息用于指示所述自適 應(yīng)濾波器暫停更新濾波器系數(shù)。
[0075] 根據(jù)本發(fā)明實(shí)施例提供的方法及裝置,提取遠(yuǎn)端信號(hào)的第一聲紋特征,以及近端 信號(hào)中的第二聲紋特征之后,通過對(duì)比第一聲紋特征與第二聲紋特征確定是否發(fā)生雙講。 由于本發(fā)明實(shí)施例是根據(jù)遠(yuǎn)端信號(hào)和近端信號(hào)的聲紋特征來進(jìn)行近端語音信號(hào)的判決,即 判斷是否發(fā)生雙講,沒有像現(xiàn)有技術(shù)一樣基于互相關(guān)技術(shù)以及以下兩個(gè)假設(shè):1、聲學(xué)回波 路徑中非線性失真很小而忽略不計(jì),2、環(huán)境噪聲是平穩(wěn)的,來進(jìn)行雙講檢測,因此一定程度 上避免了現(xiàn)有技術(shù)中以假設(shè)聲學(xué)回波路徑中非線性失真很小而忽略不計(jì)以及假設(shè)環(huán)境噪 聲平穩(wěn)為前提條件去檢測是否發(fā)生雙講時(shí)產(chǎn)生的誤判等情況,從而更準(zhǔn)確的實(shí)現(xiàn)雙講檢 測 。
【附圖說明】
[0076] 圖1為現(xiàn)有技術(shù)中聲學(xué)回波抵消器的結(jié)構(gòu)示意圖;
[0077] 圖2為本發(fā)明實(shí)施例提供的一種近端語音信號(hào)檢測方法流程示意圖;
[0078] 圖3為本發(fā)明實(shí)施例提供的聲紋特征提取流程示意圖;
[0079] 圖4為本發(fā)明實(shí)施例提供的一種近端語音信號(hào)檢測方法流程示意圖;
[0080] 圖5為本發(fā)明實(shí)施例提供的一種近端語音信號(hào)檢測裝置結(jié)構(gòu)圖;
[0081] 圖6為本發(fā)明實(shí)施例提供的一種近端語音信號(hào)檢測方法流程示意圖;
[0082] 圖7為本發(fā)明實(shí)施例提供的第二種近端語音信號(hào)檢測裝置應(yīng)用場景示意圖;
[0083] 圖8為本發(fā)明實(shí)施例提供的一種近端語音信號(hào)檢測裝置結(jié)構(gòu)圖;
[0084] 圖9為本發(fā)明實(shí)施例提供的一種近端語音信號(hào)檢測裝置結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0085] 如圖1所示,為現(xiàn)有技術(shù)中聲學(xué)回波抵消器的結(jié)構(gòu)示意圖,包括揚(yáng)聲器101,自適 應(yīng)濾波器102,雙講檢測器103,麥克風(fēng)104。遠(yuǎn)端語音信號(hào)X (η)從揚(yáng)聲器101輸出時(shí),揚(yáng) 聲器101中放大器過載和編碼解碼器會(huì)導(dǎo)致遠(yuǎn)端語音信號(hào)X (η)非線性失真;遠(yuǎn)端語音信號(hào) X (η)從揚(yáng)聲器101傳輸?shù)禁溈孙L(fēng)104的過程中,揚(yáng)聲器101傳輸?shù)禁溈孙L(fēng)104之間的聲學(xué) 回波路徑也會(huì)對(duì)遠(yuǎn)端語音信號(hào)χ(η)產(chǎn)生影響。
[0086] 現(xiàn)假設(shè)導(dǎo)致遠(yuǎn)端語音信號(hào)χ(η)非線性失真的非線性沖擊響應(yīng)很小,可以忽略不 計(jì),那么有:
[0087]
(9)
[0088] 其中,y(n)為麥克風(fēng)104的接收信號(hào),u(n)為近端語音信號(hào),ν(η)為系統(tǒng)噪聲, xl (η)為遠(yuǎn)端語音信號(hào)X (η)經(jīng)過非線性沖擊響應(yīng)后的語音信號(hào),它們均為零均值;χ2 (η)為 回波信號(hào),由下式確定:
[0089]
(1〇)
[0090] 其中,〖U: [h(0:);h(:U、、.、/n(L 為揚(yáng)聲器101到麥克風(fēng)104之間的聲學(xué) 回波路徑中線性部分的沖擊響應(yīng),L為回波路徑的長度;
[0091]
[0092] 這時(shí)用自適應(yīng)濾波器102對(duì)揚(yáng)聲器101饋入麥克風(fēng)104的回波信號(hào)χ2 (η)進(jìn)行估 計(jì),得估計(jì)信號(hào)x2 如下:
_3] ............(11)
[0094] 其中
為自適應(yīng)濾波器102的系數(shù)矢量。
[0095] 將χ2<η)ι從麥克風(fēng)104的輸出信號(hào)y (η)中減去,獲得相應(yīng)的誤差信號(hào)e (η)為:
[0096]
(12)
[0097] 自適應(yīng)濾波器102的系數(shù)矢量g是通過自適應(yīng)算法學(xué)習(xí)獲得的,在g收斂于g的條 件下,誤差信號(hào)e(n)中的回波信號(hào)x2(n)會(huì)被抵消,從而達(dá)到消除回波信號(hào)的目的。當(dāng)近 端語音信號(hào)u(n)出現(xiàn),即發(fā)生雙講時(shí),由于近端語音信號(hào)u(n)與遠(yuǎn)端語音信號(hào)x(n)之間 統(tǒng)計(jì)上不相關(guān),因此近端語音信號(hào)u (η)對(duì)于遠(yuǎn)端語音信號(hào)X (η)來說猶如一個(gè)突發(fā)干擾信 號(hào),致使自適應(yīng)濾波器102的系數(shù)矢量g的自適應(yīng)學(xué)習(xí)算法發(fā)散,由此導(dǎo)致誤差信號(hào)e (η)中 將出現(xiàn)較大的殘留回波。
[0098] 目前通過檢測雙講是否發(fā)生,并在檢測到雙講發(fā)生時(shí)停止自適應(yīng)濾波器102的系 數(shù)矢量g的更新,從而避免導(dǎo)致誤差信號(hào)e(n)中將出現(xiàn)較大的殘留回波。
[0099] 現(xiàn)有技術(shù)中,在檢測雙講是否發(fā)生時(shí),都是基于以下兩個(gè)假設(shè):1、聲學(xué)回波路徑中 非線性失真很小而忽略不計(jì);2、環(huán)境噪聲是平穩(wěn)的。然而,實(shí)際情況中,聲學(xué)回波路徑中非 線性失真往往很大,或者環(huán)境噪聲非常不平穩(wěn),導(dǎo)致基于這兩個(gè)假設(shè)條件的雙講檢測技術(shù) 的性能很不穩(wěn)定,有時(shí)無法正常檢測出是否發(fā)生雙講。
[0100] 本發(fā)明實(shí)施例中將摒棄這兩個(gè)假設(shè)條件,從另外一個(gè)角度去實(shí)現(xiàn)雙講檢測,下面 詳細(xì)描述本發(fā)明實(shí)施例提供的雙講檢測方法是如何檢測雙講是否發(fā)生。需要說明的是,本 發(fā)明實(shí)施例提供的雙講檢測方法并不僅僅是應(yīng)用于帶有聲學(xué)回波抵消器的電話會(huì)議系統(tǒng)、 免提通信終端等設(shè)備,還可以應(yīng)用于其他設(shè)備和系統(tǒng),在此并不限定其應(yīng)用場景。
[0101] 如圖2所示,本發(fā)明實(shí)施例提供的一種近端語音信號(hào)檢測方法,該方法包括:
[0102] 步驟201 :接收第一輸入信號(hào)以及第二輸入信號(hào),所述第一輸入信號(hào)為移動(dòng)終端 接收到的遠(yuǎn)端信號(hào)被線性或非線性變換后所得到的信號(hào),所述第二輸入信號(hào)為所述移動(dòng)終 端接收到的近端信號(hào);
[0103] 步驟202 :提取所述第一輸入信號(hào)的第一聲紋特征,以及所述第二輸入信號(hào)的第 二聲紋特征;
[0104] 步驟203 :確定所述第一聲紋特征與所述第二聲紋特征的距離;
[0105] 步驟204 :根據(jù)所述距離確定所述第二輸入信號(hào)中是否存在近端語音信號(hào)。
[0106] 本發(fā)明實(shí)施例中的移動(dòng)終端可以為手機(jī)、平板電腦、會(huì)議電話等設(shè)備。
[0107] 在步驟201中,第一輸入信號(hào)為移動(dòng)終端接收到的遠(yuǎn)端信號(hào)被線性或非線性變換 后所得到的信號(hào)。遠(yuǎn)端信號(hào)是經(jīng)過編碼、調(diào)制,并需要被揚(yáng)聲器等設(shè)備播放的信號(hào)。
[0108] 第二輸入信號(hào),即近端信號(hào)由麥克風(fēng)等音頻接收傳感器接收到的信號(hào),可能包括 遠(yuǎn)端信號(hào)經(jīng)過回聲路徑形成的聲學(xué)回波信號(hào)、環(huán)境噪聲信號(hào)以及近端語音信號(hào)中的一種或 多種組合,第二輸入信號(hào)中的聲學(xué)回波信號(hào)是需要消除的信號(hào)。第二輸入信號(hào)中包含由遠(yuǎn) 端信號(hào)經(jīng)過回聲路徑形成的聲學(xué)回波信號(hào)時(shí),會(huì)產(chǎn)生一定的延時(shí),導(dǎo)致與遠(yuǎn)端信號(hào)之間不 同步,如果不對(duì)遠(yuǎn)端信號(hào)進(jìn)行延時(shí)處理,直接采用遠(yuǎn)端信號(hào)與第二輸入信號(hào)進(jìn)行雙講檢測, 會(huì)降低檢測的準(zhǔn)確性。因此需要將遠(yuǎn)端信號(hào)進(jìn)行線性變換或非線性變換,形成與第二輸入 信號(hào)中聲學(xué)回波信號(hào)同步的第一輸入信號(hào)。
[0109] 實(shí)現(xiàn)將遠(yuǎn)端信號(hào)進(jìn)行線性變換或非線性變換形成第一輸入信號(hào)的方法有多種。第 一輸入信號(hào)可以為移動(dòng)終端的自適應(yīng)濾波器輸出的回波估計(jì)信號(hào),所述回波估計(jì)信號(hào)是所 述自適應(yīng)濾波器對(duì)所述遠(yuǎn)端信號(hào)進(jìn)行線性或非線性濾波得到的;也可以通過延時(shí)單元對(duì)遠(yuǎn) 端語音信號(hào)延時(shí),將延時(shí)后的遠(yuǎn)端語音信號(hào)作為第一輸入信號(hào)。需要說明的是,該延時(shí)單元 對(duì)信號(hào)的延時(shí)與回波路徑的延時(shí)相匹配,可以通過聲學(xué)回聲路徑延時(shí)估計(jì)算法確定出延時(shí) 單元,也可以通過其他方法確定出延時(shí)單元,本發(fā)明對(duì)此并不限定。
[0110] 在步驟201中,獲得第一輸入信號(hào)以及第二輸入信號(hào)之前,還可以檢測輸入的第 一輸入信號(hào)和\或第二輸入信號(hào)中是否有語音信號(hào),在未獲得第一輸入信號(hào)或者獲得的第 一輸入信號(hào)中不包含語音信號(hào)時(shí),移動(dòng)終端中的自適應(yīng)濾波器的濾波器系數(shù)可以停止系數(shù) 的更新,以便節(jié)省功耗;獲得的第一輸入信號(hào)中包含語音信號(hào)時(shí),若第二輸入信號(hào)中存在近 端語音信號(hào)時(shí),移動(dòng)終端中的自適應(yīng)濾波器的濾波器系數(shù)可以停止系數(shù)的更新,若第二輸 入信號(hào)中不存在近端語音信號(hào)時(shí),可以直接確定未發(fā)生雙講,此時(shí)移動(dòng)終端中的自適應(yīng)濾 波器需要根據(jù)殘差信號(hào)進(jìn)行濾波器系數(shù)的更新。
[0111] 檢測輸入的第一輸入信號(hào)和\或第二輸入信號(hào)中是否有語音信號(hào)的方法有多種, 例如可以通過語音活動(dòng)檢測(Voice activity detection,VAD)來檢測輸入的信號(hào)是否包 含語音信號(hào)。
[0112] 步驟202中,在獲得第一輸入信號(hào)以及第二輸入信號(hào)之后,分別提取第一輸入信 號(hào)的第一聲紋特征,以及第二輸入信號(hào)第二聲紋特征。
[0113] 聲紋(Voiceprint)是攜帶語音信息的聲波頻譜,由于人在講話時(shí)使用的發(fā)生器 在尺寸和形態(tài)方面各自有差異,所以任何兩個(gè)人的聲紋都存在差異;另一方面,人耳能在吵 雜的背景噪聲中及各種變異的情況下聽到語音信號(hào),該特性是得益于這樣一個(gè)事實(shí):耳蝸 實(shí)質(zhì)上相當(dāng)于一個(gè)濾波器組,其濾波作用是在對(duì)數(shù)頻率尺度上進(jìn)行的,從而使得人耳對(duì)低 頻信號(hào)比對(duì)高頻信號(hào)更敏感。綜合考慮人耳的聽覺感知和人的語音產(chǎn)生的機(jī)理,在本發(fā)明 實(shí)施例中選擇Mel頻率的倒譜系數(shù)(Mel-Frequency Cepstral Coefficient,MFCC)作為語 音信號(hào)的聲紋特征參數(shù),用來進(jìn)行雙講檢測。其基本原理是:首先分別提取第一輸入信號(hào)和 第二輸入信號(hào)的MFCC特征參數(shù)矢量,然后計(jì)算它們之間的距離,根據(jù)距離判斷有無發(fā)生雙 講。在未發(fā)生雙講的情況下,第二輸入信號(hào)中僅含回波信號(hào),因而第一輸入信號(hào)和第二輸入 信號(hào)的MFCC特征參數(shù)矢量間的距離較小;在發(fā)生雙講的情況下,第二輸入信號(hào)中不僅含近 端語音信號(hào)u (η),而且還可能包含回波信號(hào)(在有遠(yuǎn)端語音信號(hào)的前提下),此時(shí)第一輸入 信號(hào)和第二輸入信號(hào)的MFCC特征參數(shù)矢量間的距離較大。由于聲紋特征參數(shù)對(duì)聲學(xué)回波 路徑中的非線性失真和噪聲干擾具有較強(qiáng)的不敏感特性,因而本發(fā)明提出的基于聲紋特征 參數(shù)之DTD對(duì)環(huán)境噪聲和聲學(xué)回波路徑中的非線性退變,具有較好的魯棒性。
[0114] 需要說明的是,本發(fā)明實(shí)施例中從音頻信號(hào)中提取的聲紋特征包括但不限于 MFCC,可以是能有效表征和鑒別信號(hào)的任何特征參數(shù),并且該類參數(shù)對(duì)信號(hào)的噪聲污染和 非線性畸變具有較好的抵免性。
[0115] 針對(duì)一個(gè)輸入信號(hào),根據(jù)預(yù)加重函數(shù)對(duì)所述輸入信號(hào)進(jìn)行預(yù)加重,獲得預(yù)加重后 的輸入信號(hào);通過窗函數(shù)對(duì)所述預(yù)加重后的輸入信號(hào)進(jìn)行加窗,并計(jì)算所述加窗后的輸入 信號(hào)的頻譜;通過Mel濾波器組對(duì)所述加窗后的輸入信號(hào)的頻譜進(jìn)行濾波,并對(duì)濾波后的 所述加窗后的輸入信號(hào)的頻譜進(jìn)行離散余弦變換,獲得所述輸入信號(hào)的聲紋特征。
[0116] 具體的,如圖3所示,本發(fā)明實(shí)施例提供的提取聲紋特征流程圖。
[0117] 步驟301 :預(yù)加重處理;
[0118] 將輸入信號(hào)通過預(yù)加重函數(shù)進(jìn)行預(yù)加重處理,預(yù)加重函數(shù)為:
[0119] z (n) = X (η) - α · X (n_l) (13)
[0120] 其中,0. 9〈α〈1. 〇為預(yù)加重系數(shù),α -般取〇. 95,x(n)為輸入信號(hào),可以為第一輸 入信號(hào)或者第二輸入信號(hào),ζ (η)為預(yù)加重后的輸入信號(hào)。對(duì)輸入信號(hào)進(jìn)行預(yù)加重可以提升 信號(hào)的高頻分量進(jìn)而補(bǔ)償聲門脈沖形狀和口唇輻射對(duì)語音信號(hào)產(chǎn)生的影響,從而提高檢測 的準(zhǔn)確性。
[0121] 步驟302:加窗;
[0122] 通過窗函數(shù)對(duì)預(yù)加重后的輸入信號(hào)進(jìn)行加窗,獲得加窗后的輸入信號(hào)ζ(ηΜη); 其中w(n)為長度Ν的窗函數(shù),可以為漢明窗函數(shù)、高斯窗函數(shù)、矩形窗函數(shù)等。
[0123] 步驟303:計(jì)算頻譜;
[0124] 對(duì)加窗后的輸入信號(hào)進(jìn)行離散傅立葉變換,獲得第t幀輸入信號(hào)的頻譜Z(t,k):
[0125] Z(ty k) - 2(n)w(t - o)exp k=0, 1,,, .SN-1 (14)
[0126] 步驟304 :Mel濾波器組濾波;
[0127] 采用 Μ 組Mel 濾波器{Hjk),!!! = 0,1,2,. . .,M-1}對(duì) Z(t,k)進(jìn)行處理,每個(gè)Mel 濾波器的輸出能量E(t,m)為:
[0128]
(15)
[0129] 這里Hjk)為Mel濾波器組第m個(gè)濾波器的頻響函數(shù),它定義為:
[0130]
(16)
[0131] 其中圪為第m個(gè)Mel濾波器的中心頻率,它由下式定義:
[0132]
(17)
[0133] 式(17)中flOT和f _分別為Mel濾波器組的最低和最高頻率,F(xiàn)s為采樣率,Μ為 濾波器組的數(shù)目,函I
[0134] 步驟305:取對(duì)數(shù);
[0135] 首先對(duì)式(17)取對(duì)數(shù),獲得Mel濾波器組中每個(gè)濾波器輸出的對(duì)數(shù)能量S(t,m):
[0136] S (t,m) = logeE (t,m),m = 0,1,· · ·,M-1 (18)
[0137] 步驟306 :離散余弦變換:
[0138] 然后對(duì)(18)式經(jīng)離散余弦變換(DCT)變換得MFCC的系數(shù)如下:
[0139]
[0140] 由此提取到輸入信號(hào)的的聲紋特征矢量歹|||:_為:
[0141]
[0142] 根據(jù)上述提取信號(hào)聲紋特征的流程,可以提取第一輸入信號(hào)的第一聲紋特征 以及第二輸入信號(hào)第二聲紋特征歹€。
[0143] 在步驟203中,根據(jù)式(20)計(jì)算第一聲紋特征歹獲與第二聲紋特征ff、,之間的距 ? 'JhA 離D :
[0144]
(20)
[0145] 其中,II · II為矢量的范數(shù),可為1-范數(shù)、2-范數(shù)或者-范數(shù)。
[0146] 最后,在步驟204中,當(dāng)?shù)谝宦暭y特征與第二聲紋特征^之間的距離D大于 或等于門限值T時(shí)(為了與其他門限值相區(qū)別,此處可稱該門限值為第一門限值),確定第 二輸入信號(hào)中包含近端語音信號(hào),即發(fā)生雙講,否則確定未發(fā)生雙講,即處于單講狀態(tài),具 體如式(21)所示:
[0147]
(21)
[0148] 在確定發(fā)生雙講之后,向移動(dòng)終端的自適應(yīng)濾波器發(fā)送指示信息,所述指示信息 用于指示所述自適應(yīng)濾波器暫停更新濾波器系數(shù)。
[0149] 根據(jù)以上圖2所示流程的描述,圖4和圖5分別示出了兩種具體應(yīng)用場景的示意 圖。
[0150] 圖4示出了利用麥克風(fēng)輸出信號(hào)y (η)和自適應(yīng)濾波器輸出信號(hào)來進(jìn)行雙 講檢測的實(shí)施例。如圖4所示,遠(yuǎn)端輸入信號(hào)χ(η)經(jīng)過自適應(yīng)濾波器濾波后形成 y (η)為麥克風(fēng)輸出信號(hào)。對(duì)麥克風(fēng)輸出信號(hào)y (η)和x#r〇分別進(jìn)行聲紋特征提取,對(duì)所提 取的聲紋特征矢量進(jìn)行匹配處理,若兩路信號(hào)的聲紋特征矢量是模式匹配的,則判為單講 狀態(tài);否則,判為雙講狀態(tài)。這里所提取的聲紋特征矢量可以是MFCC型特征參數(shù),也可以是 能有效表征和鑒別輸入信號(hào)的任何其它類型的特征參數(shù)。所采用的"模式匹配"技術(shù)可以 是特征矢量間的距離匹配技術(shù),也可以是特征矢量間的其它"相似度"匹配技術(shù)。
[0151] 圖5給出了利用麥克風(fēng)輸出信號(hào)y (η)和遠(yuǎn)端輸入信號(hào)x(n)來進(jìn)行雙講檢測的實(shí) 施例。如圖所示,對(duì)x(n)通過延時(shí)單元進(jìn)行延時(shí)處理后進(jìn)行特征提取,所延時(shí)的長度由聲 學(xué)回聲路徑延時(shí)估計(jì)算法決定,并對(duì)y (η)進(jìn)行特征提??;然后,對(duì)所提取的聲紋特征矢量 進(jìn)行匹配處理,若兩路信號(hào)的聲紋特征矢量是模式匹配的,則判為單講狀態(tài);否則,判為雙 講狀態(tài)。這里所提取的聲紋特征矢量可以是MFCC型特征參數(shù),也可以是能有效表征和鑒別 輸入信號(hào)的任何其它類型的特征參數(shù)。所采用的"模式匹配"技術(shù)可以是特征矢量間的距 離匹配技術(shù),也可以是特征矢量間的其它"相似度"匹配技術(shù)。
[0152] 上述實(shí)施例中,通過將第一輸入信號(hào)的第一聲紋特征與第二輸入信號(hào)的第二聲紋 特征進(jìn)行比較,在第一聲紋特征與第二聲紋特征相近時(shí),認(rèn)為第一輸入信號(hào)與第二輸入信 號(hào)中均包含遠(yuǎn)端信號(hào),且第二輸入信號(hào)中不包含近端語音信號(hào),因此可以認(rèn)為并未發(fā)生雙 講,否則認(rèn)為發(fā)生雙講。
[0153] 由于語音信號(hào)是非平穩(wěn)信號(hào),表現(xiàn)在時(shí)域或頻域上為非連續(xù)信號(hào)。因此并不需要 一直檢測第一輸入信號(hào)的第一聲紋特征,或第二輸入信號(hào)的第二聲紋特征,可以先檢測第 一輸入信號(hào)或第二輸入信號(hào)中是否有語音信號(hào),如果存在語音信號(hào),則提取第一輸入信號(hào) 或第二輸入信號(hào)的聲紋特征。下面通過具體的實(shí)施例來詳細(xì)描述。
[0154] 如圖6所示,本發(fā)明實(shí)施例提供的一種近端語音信號(hào)檢測方法,包括:
[0155] 步驟601 :接收第一輸入信號(hào)以及第二輸入信號(hào),所述第一輸入信號(hào)為移動(dòng)終端 接收到的遠(yuǎn)端信號(hào),所述第二輸入信號(hào)為所述移動(dòng)終端接收到的近端信號(hào);
[0156] 步驟602 :檢測所述第一輸入信號(hào)是否大于第二門限值,以及檢測所述第二輸入 信號(hào)是否大于第三門限值;
[0157] 步驟603:若所述第一輸入信號(hào)大于第二門限值,且所述第二輸入信號(hào)大于第三 門限值,則提取所述第一輸入信號(hào)的第一聲紋特征,以及提取所述第二輸入信號(hào)的第二聲 紋特征,確定所述第一聲紋特征與所述第二聲紋特征的距離,根據(jù)所述距離確定所述第二 輸入信號(hào)中是否存在近端語音信號(hào)。
[0158] 本發(fā)明實(shí)施例中的移動(dòng)終端可以為手機(jī)、平板電腦、會(huì)議電話等設(shè)備。
[0159] 在步驟601中接收到的第一輸入信號(hào)為遠(yuǎn)端信號(hào)。遠(yuǎn)端信號(hào)是經(jīng)過編碼、調(diào)制,并 需要被揚(yáng)聲器等設(shè)備播放的信號(hào)。
[0160] 第二輸入信號(hào),即近端信號(hào),是由麥克風(fēng)等音頻接收傳感器接收到的信號(hào),可能包 括遠(yuǎn)端信號(hào)經(jīng)過回聲路徑形成的聲學(xué)回波信號(hào)、環(huán)境噪聲信號(hào)以及近端語音信號(hào)中的一種 或多種組合,第二輸入信號(hào)中的聲學(xué)回波信號(hào)是需要消除的信號(hào)。
[0161] 在步驟602中,分別檢測第一輸入信號(hào)以及第二輸入信號(hào)中是否具有語音信號(hào)特 征的信號(hào),檢測的方法有多種,可以通過語音活性檢測算法進(jìn)行檢測,也可以通過其他方法 進(jìn)行檢測,本發(fā)明實(shí)施例對(duì)此并不限定。
[0162] 在步驟602中,第二門限值可以是預(yù)設(shè)的信號(hào)能量與噪聲能量比的短時(shí)能量差, 當(dāng)檢測到第一輸入信號(hào)的短時(shí)能量差高于第二門限值時(shí),確定第一輸入信號(hào)為語音信號(hào)。 對(duì)應(yīng)的,第三門限值可以是預(yù)設(shè)的信號(hào)能量與噪聲能量比的短時(shí)能量差
[0163] 在步驟602中,由于第二輸入信號(hào)中包含由遠(yuǎn)端信號(hào)經(jīng)過回聲路徑形成的聲學(xué)回 波信號(hào)時(shí),會(huì)產(chǎn)生一定的延時(shí),導(dǎo)致與第一輸入信號(hào)之間不同步,第二輸入信號(hào)相對(duì)于第一 輸入信號(hào)有一定的滯后。如果不對(duì)第一輸入信號(hào)進(jìn)行延時(shí)處理,直接檢測第一輸入信號(hào)是 否大于所述第二門限值,那么需要將第一輸入信號(hào)的檢測結(jié)果與第二輸入信號(hào)在經(jīng)過延時(shí) 后的檢測結(jié)果相比較;如果對(duì)第一輸入信號(hào)進(jìn)行延時(shí)處理,那么需要將第一輸入信號(hào)的檢 測結(jié)果與同一時(shí)間點(diǎn)第二輸入信號(hào)的檢測結(jié)果相比較。
[0164] 綜上所述,檢測第一輸入信號(hào)在第一時(shí)間點(diǎn)是否大于所述第二門限值,以及檢測 第二輸入信號(hào)在第二時(shí)間點(diǎn)是否大于第三門限值,其中,第二時(shí)間點(diǎn)為第一時(shí)間點(diǎn)經(jīng)過延 時(shí)后的時(shí)間點(diǎn),延時(shí)的時(shí)間長度可以根據(jù)實(shí)際情況確定。由上面的描述可知,延時(shí)的時(shí)間長 度的取值可以分為下面兩種情況:
[0165] 第一種,不對(duì)第一輸入信號(hào)進(jìn)行延時(shí)處理,此時(shí)延時(shí)的時(shí)間長度大于0,即第二時(shí) 間點(diǎn)為第一時(shí)間點(diǎn)之后的時(shí)間點(diǎn);延時(shí)的時(shí)間長度的具體取值可以根據(jù)遠(yuǎn)端信號(hào)在回波路 徑中的延時(shí)確定;
[0166] 第二種,對(duì)第一輸入信號(hào)進(jìn)行延時(shí)處理,此時(shí)延時(shí)的時(shí)間長度等于0,即第二時(shí)間 點(diǎn)與第一時(shí)間點(diǎn)重合。
[0167] 最后,在步驟603中,對(duì)第一輸入信號(hào)和第二輸入信號(hào)的檢測結(jié)果可以分為以下 三種情況:
[0168] -、若第二輸入信號(hào)小于第三門限值,則確定第二輸入信號(hào)在第二時(shí)間點(diǎn)不存在 近端語音信號(hào);
[0169] 二、若第一輸入信號(hào)小于第二門限值,且第二輸入信號(hào)大于第三門限值,則確定第 二輸入信號(hào)在第二時(shí)間點(diǎn)存在近端語音信號(hào)。
[0170] 三、若第一輸入信號(hào)大于第二門限值,且第二輸入信號(hào)大于第三門限值,則提取第 一輸入信號(hào)的第一聲紋特征,以及提取第二輸入信號(hào)的第二聲紋特征,確定第一聲紋特征 與第二聲紋特征的距離,根據(jù)距離確定所述第二輸入信號(hào)中是否存在近端語音信號(hào)。
[0171] 第三種情況中,若第一聲紋特征與第二聲紋特征的距離小于第四門限值,則確定 第二輸入信號(hào)在第二時(shí)間點(diǎn)不存在近端語音信號(hào),否則,確定第二輸入信號(hào)在所述第二時(shí) 間點(diǎn)存在近端語音信號(hào)。其中,這里的"第四門限值"與圖2所示流程中的"第一門限值"取 值可以相同也可以不同。
[0172] 具體如何提取第一輸入信號(hào)的第一聲紋特征,以及提取第二輸入信號(hào)的第二聲紋 特征,可以參考前一實(shí)施例的描述,在此不再贅述。
[0173] 當(dāng)確定第二輸入信號(hào)中存在近端語音信號(hào)之后,向移動(dòng)終端的自適應(yīng)濾波器發(fā)送 指示信息,所述指示信息用于指示所述自適應(yīng)濾波器暫停更新濾波器系數(shù)。
[0174] 根據(jù)以上圖6所不流程的描述,圖7不出了兩種具體應(yīng)用場景的不意圖。
[0175] 圖7給出了基于VAD并利用麥克風(fēng)輸出信號(hào)y (η)和遠(yuǎn)端輸入信號(hào)X (η)來進(jìn)行雙 講檢測的實(shí)施例。如圖所示,對(duì)遠(yuǎn)端輸入信號(hào)x(n)進(jìn)行VAD監(jiān)測,如果有語音信號(hào),則對(duì)信 號(hào)x(n)提取聲紋特征矢量VPx,否則,不作處理。對(duì)下行鏈路中的麥克風(fēng)輸出信號(hào)y(n)進(jìn) 行VAD監(jiān)測,如果有語音信號(hào),則對(duì)信號(hào)y(n)提取聲紋特征矢量VPy,否則,不作處理。在 聲紋特征矢量VPx可使用時(shí)開始等待直到聲紋特征矢量VPy可使用時(shí)即刻進(jìn)行模式匹配處 理。具體如下:
[0176] 為了方便,標(biāo)記下行鏈路的VAD在第t個(gè)時(shí)刻的值為DL_VAD (t),上行鏈路的VAD 在第t個(gè)時(shí)刻的值為UL_VAD (t),如果DL_VAD (t) = 0并且UL_VAD (t) = 1時(shí),則判定為雙 講;如果DL_VAD(t) = 0并且UL_VAD(t) = 0時(shí),則判定為單講;如果DL_VAD(t) = 1并且 UL_VAD(t+tO) = 1(這里t0>0)時(shí),則按聲紋識(shí)別技術(shù)判決是否為雙講。這里所提取的聲紋 特征矢量可以是MFCC型特征參數(shù),也可以是能有效表征和鑒別輸入信號(hào)的任何其它類型 的特征參數(shù)。所采用的"模式匹配"技術(shù)可以是特征矢量間的距離匹配技術(shù),也可以是特征 矢量間的其它"相似度"匹配技術(shù)。
[0177] 針對(duì)上述方法流程,本發(fā)明實(shí)施例還提供一種近端語音信號(hào)檢測裝置,該裝置的 具體內(nèi)容可以參照上述方法實(shí)施,在此不再贅述。
[0178] 如圖8所示,本發(fā)明實(shí)施例提供了一種近端語音信號(hào)檢測裝置,包括:
[0179] 接收單元801,用于接收第一輸入信號(hào)以及第二輸入信號(hào),所述第一輸入信號(hào)為移 動(dòng)終端接收到的遠(yuǎn)端信號(hào)被線性或非線性變換后所得到的信號(hào),所述第二輸入信號(hào)為所述 移動(dòng)終端接收到的近端信號(hào);
[0180] 提取單元802,用于提取所述第一輸入信號(hào)的第一聲紋特征,以及所述第二輸入信 號(hào)的第二聲紋特征;
[0181] 確定單元803,用于確定所述第一聲紋特征與所述第二聲紋特征的距離;根據(jù)所 述距離確定所述第二輸入信號(hào)中是否存在近端語音信號(hào)。
[0182] 較佳的,所述第一輸入信號(hào)為所述移動(dòng)終端的自適應(yīng)濾波器輸出的回波估計(jì)信 號(hào),所述回波估計(jì)信號(hào)是所述自適應(yīng)濾波器對(duì)所述遠(yuǎn)端信號(hào)進(jìn)行線性或非線性濾波得到 的。
[0183] 較佳的,所述第一輸入信號(hào)為所述遠(yuǎn)端信號(hào)被線性延時(shí)后得到的信號(hào)。
[0184] 較佳的,所述確定單元803具體用于:
[0185] 判斷所述距離是否小于第一門限值,若是,則確定所述第二輸入信號(hào)中不存在近 端語音信號(hào),否則,確定所述第二輸入信號(hào)中存在近端語音信號(hào)。
[0186] 較佳的,所述確定單元803還用于:
[0187] 向所述移動(dòng)終端的自適應(yīng)濾波器發(fā)送指示信息,所述指示信息用于指示所述自適 應(yīng)濾波器暫停更新濾波器系數(shù)。
[0188] 如圖9所示,本發(fā)明實(shí)施例提供了一種近端語音信號(hào)檢測裝置,包括:
[0189] 接收單元901,用于接收第一輸入信號(hào)以及第二輸入信號(hào),所述第一輸入信號(hào)為移 動(dòng)終端接收到的遠(yuǎn)端信號(hào),所述第二輸入信號(hào)為所述移動(dòng)終端接收到的近端信號(hào);
[0190] 檢測單元902,用于檢測所述第一輸入信號(hào)是否大于第二門限值,以及檢測所述第 二輸入信號(hào)是否大于第三門限值;
[0191] 確定單元903,用于確定所述第一輸入信號(hào)大于第二門限值,且所述第二輸入信號(hào) 大于第三門限值時(shí),提取所述第一輸入信號(hào)的第一聲紋特征,以及提取所述第二輸入信號(hào) 的第二聲紋特征,確定所述第一聲紋特征與所述第二聲紋特征的距離,根據(jù)所述距離確定 所述第二輸入信號(hào)中是否存在近端語音信號(hào)。
[0192] 較佳的,所述檢測單元902用于:
[0193] 檢測所述第一輸入信號(hào)在第一時(shí)間點(diǎn)是否大于所述第二門限值,以及檢測所述第 二輸入信號(hào)在第二時(shí)間點(diǎn)是否大于所述第三門限值,所述第二時(shí)間點(diǎn)為所述第一時(shí)間點(diǎn)經(jīng) 過延時(shí)之后的時(shí)間點(diǎn)。
[0194] 較佳的,所述確定單元903具體用于:
[0195] 若所述距離小于第四門限值,則確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)不存在 近端語音信號(hào),否則,確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)存在近端語音信號(hào)。
[0196] 較佳的,所述確定單元903還用于:
[0197] 若所述第二輸入信號(hào)小于所述第三門限值,則確定所述第二輸入信號(hào)在所述第二 時(shí)間點(diǎn)不存在近端語音信號(hào);或者,
[0198] 若所述第一輸入信號(hào)小于所述第二門限值,且所述第二輸入信號(hào)大于所述第三門 限值,則確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)存在近端語音信號(hào)。
[0199] 較佳的,所述確定單元903還用于:
[0200] 向所述移動(dòng)終端的自適應(yīng)濾波器發(fā)送指示信息,所述指示信息用于指示所述自適 應(yīng)濾波器暫停更新濾波器系數(shù)。
[0201] 綜上所述,根據(jù)本發(fā)明實(shí)施例提供的方法及裝置,本發(fā)明實(shí)施例中通過提取遠(yuǎn)端 語音信號(hào)的第一聲紋特征,以及音頻接收設(shè)備的輸出信號(hào)中的第二聲紋特征,通過對(duì)比第 一聲紋特征與第二聲紋特征確定是否發(fā)生雙講。通過本發(fā)明實(shí)施例提供的方法,避免了現(xiàn) 有技術(shù)中以假設(shè)聲學(xué)回波路徑中非線性失真很小而忽略不計(jì)以及假設(shè)環(huán)境噪聲平穩(wěn)為前 提條件去檢測是否發(fā)生雙講時(shí)產(chǎn)生的誤判等情況,從而更準(zhǔn)確的實(shí)現(xiàn)雙講檢測。
[0202] 本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序 產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí) 施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī) 可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器和光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形 式。
[0203] 本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程 圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一 流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算 機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理 器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生 用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能 的裝置。
[0204] 這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特 定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指 令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或 多個(gè)方框中指定的功能。
[0205] 這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì) 算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或 其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖 一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0206] 顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精 神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍 之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
【主權(quán)項(xiàng)】
1. 一種近端語音信號(hào)檢測方法,其特征在于,包括: 接收第一輸入信號(hào)以及第二輸入信號(hào),所述第一輸入信號(hào)為移動(dòng)終端接收到的遠(yuǎn)端信 號(hào)被線性或非線性變換后所得到的信號(hào),所述第二輸入信號(hào)為所述移動(dòng)終端接收到的近端 信號(hào); 提取所述第一輸入信號(hào)的第一聲紋特征,以及所述第二輸入信號(hào)的第二聲紋特征; 確定所述第一聲紋特征與所述第二聲紋特征的距離; 根據(jù)所述距離確定所述第二輸入信號(hào)中是否存在近端語音信號(hào)。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一輸入信號(hào)為所述移動(dòng)終端的自 適應(yīng)濾波器輸出的回波估計(jì)信號(hào),所述回波估計(jì)信號(hào)是所述自適應(yīng)濾波器對(duì)所述遠(yuǎn)端信號(hào) 進(jìn)行線性或非線性濾波得到的。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一輸入信號(hào)為所述遠(yuǎn)端信號(hào)被線 性延時(shí)后得到的信號(hào)。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述距離確定所述第二輸入信 號(hào)中是否存在近端語音信號(hào),包括: 判斷所述距離是否小于第一門限值,若是,則確定所述第二輸入信號(hào)中不存在近端語 音信號(hào),否則,確定所述第二輸入信號(hào)中存在近端語音信號(hào)。5. 根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其特征在于,所述確定所述第二輸入信號(hào) 中存在近端語音信號(hào)之后,還包括: 向所述移動(dòng)終端的自適應(yīng)濾波器發(fā)送指示信息,所述指示信息用于指示所述自適應(yīng)濾 波器暫停更新濾波器系數(shù)。6. -種近端語音信號(hào)檢測方法,其特征在于,包括: 接收第一輸入信號(hào)以及第二輸入信號(hào),所述第一輸入信號(hào)為移動(dòng)終端接收到的遠(yuǎn)端信 號(hào),所述第二輸入信號(hào)為所述移動(dòng)終端接收到的近端信號(hào); 檢測所述第一輸入信號(hào)是否大于第二門限值,以及檢測所述第二輸入信號(hào)是否大于第 三門限值; 若所述第一輸入信號(hào)大于第二門限值,且所述第二輸入信號(hào)大于第三門限值,則提取 所述第一輸入信號(hào)的第一聲紋特征,以及提取所述第二輸入信號(hào)的第二聲紋特征,確定所 述第一聲紋特征與所述第二聲紋特征的距離,根據(jù)所述距離確定所述第二輸入信號(hào)中是否 存在近端語音信號(hào)。7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述檢測所述第一輸入信號(hào)是否大于第 二門限值,以及檢測所述第二輸入信號(hào)是否大于第三門限值,包括: 檢測所述第一輸入信號(hào)在第一時(shí)間點(diǎn)是否大于所述第二門限值,以及檢測所述第二輸 入信號(hào)在第二時(shí)間點(diǎn)是否大于所述第三門限值,所述第二時(shí)間點(diǎn)為所述第一時(shí)間點(diǎn)經(jīng)過延 時(shí)后的時(shí)間點(diǎn)。8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述根據(jù)所述距離確定所述第二輸入信 號(hào)中是否存在近端語音信號(hào),包括: 若所述距離小于第四門限值,則確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)不存在近端 語音信號(hào),否則,確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)存在近端語音信號(hào)。9. 根據(jù)權(quán)利要求7所述的方法,其特征在于,還包括: 若所述第二輸入信號(hào)小于所述第三門限值,則確定所述第二輸入信號(hào)在所述第二時(shí)間 點(diǎn)不存在近端語音信號(hào);或者, 若所述第一輸入信號(hào)小于所述第二門限值,且所述第二輸入信號(hào)大于所述第三門限 值,則確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)存在近端語音信號(hào)。10. 根據(jù)權(quán)利要求6至9任一項(xiàng)所述的方法,其特征在于,確定所述第二輸入信號(hào)中存 在近端語音信號(hào)之后,還包括: 向所述移動(dòng)終端的自適應(yīng)濾波器發(fā)送指示信息,所述指示信息用于指示所述自適應(yīng)濾 波器暫停更新濾波器系數(shù)。11. 一種近端語音信號(hào)檢測裝置,其特征在于,包括: 接收單元,用于接收第一輸入信號(hào)以及第二輸入信號(hào),所述第一輸入信號(hào)為移動(dòng)終端 接收到的遠(yuǎn)端信號(hào)被線性或非線性變換后所得到的信號(hào),所述第二輸入信號(hào)為所述移動(dòng)終 端接收到的近端信號(hào); 提取單元,用于提取所述第一輸入信號(hào)的第一聲紋特征,以及所述第二輸入信號(hào)的第 二聲紋特征; 確定單元,用于確定所述第一聲紋特征與所述第二聲紋特征的距離,根據(jù)所述距離確 定所述第二輸入信號(hào)中是否存在近端語音信號(hào)。12. 根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述第一輸入信號(hào)為所述移動(dòng)終端的 自適應(yīng)濾波器輸出的回波估計(jì)信號(hào),所述回波估計(jì)信號(hào)是所述自適應(yīng)濾波器對(duì)所述遠(yuǎn)端信 號(hào)進(jìn)行線性或非線性濾波得到的。13. 根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述第一輸入信號(hào)為所述遠(yuǎn)端信號(hào)被 線性延時(shí)后得到的信號(hào)。14. 根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述確定單元具體用于: 判斷所述距離是否小于第一門限值,若是,則確定所述第二輸入信號(hào)中不存在近端語 音信號(hào),否則,確定所述第二輸入信號(hào)中存在近端語音信號(hào)。15. 根據(jù)權(quán)利要求11至14中任一項(xiàng)所述的裝置,其特征在于,所述確定單元還用于: 向所述移動(dòng)終端的自適應(yīng)濾波器發(fā)送指示信息,所述指示信息用于指示所述自適應(yīng)濾 波器暫停更新濾波器系數(shù)。16. -種近端語音信號(hào)檢測裝置,其特征在于,包括: 接收單元,用于接收第一輸入信號(hào)以及第二輸入信號(hào),所述第一輸入信號(hào)為移動(dòng)終端 接收到的遠(yuǎn)端信號(hào),所述第二輸入信號(hào)為所述移動(dòng)終端接收到的近端信號(hào); 檢測單元,用于檢測所述第一輸入信號(hào)是否大于第二門限值,以及檢測所述第二輸入 信號(hào)是否大于第三門限值; 確定單元,用于確定所述第一輸入信號(hào)大于第二門限值,且所述第二輸入信號(hào)大于第 三門限值時(shí),提取所述第一輸入信號(hào)的第一聲紋特征,以及提取所述第二輸入信號(hào)的第二 聲紋特征,確定所述第一聲紋特征與所述第二聲紋特征的距離,根據(jù)所述距離確定所述第 二輸入信號(hào)中是否存在近端語音信號(hào)。17. 根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述檢測單元用于: 檢測所述第一輸入信號(hào)在第一時(shí)間點(diǎn)是否大于所述第二門限值,以及檢測所述第二輸 入信號(hào)在第二時(shí)間點(diǎn)是否大于所述第三門限值,所述第二時(shí)間點(diǎn)為所述第一時(shí)間點(diǎn)經(jīng)過延 時(shí)后的時(shí)間點(diǎn)。18. 根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述確定單元具體用于: 若所述距離小于第四門限值,則確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)不存在近端 語音信號(hào),否則,確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)存在近端語音信號(hào)。19. 根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述確定單元還用于: 若所述第二輸入信號(hào)小于所述第三門限值,則確定所述第二輸入信號(hào)在所述第二時(shí)間 點(diǎn)不存在近端語音信號(hào);或者, 若所述第一輸入信號(hào)小于所述第二門限值,且所述第二輸入信號(hào)大于所述第三門限 值,則確定所述第二輸入信號(hào)在所述第二時(shí)間點(diǎn)存在近端語音信號(hào)。20. 根據(jù)權(quán)利要求16至19任一項(xiàng)所述的裝置,其特征在于,所述確定單元還用于: 向所述移動(dòng)終端的自適應(yīng)濾波器發(fā)送指示信息,所述指示信息用于指示所述自適應(yīng)濾 波器暫停更新濾波器系數(shù)。
【文檔編號(hào)】G10L25/78GK106033673SQ201510102968
【公開日】2016年10月19日
【申請日】2015年3月9日
【發(fā)明人】梁民, 韓波
【申請人】電信科學(xué)技術(shù)研究院
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1