專利名稱:用于自適應(yīng)話音可懂度處理的系統(tǒng)的制作方法
用于自適應(yīng)話音可懂度處理的系統(tǒng)背景技術(shù)
移動(dòng)電話通常在包括高背景噪聲的區(qū)域中使用。這種噪聲通常具有使得來自移動(dòng)電話揚(yáng)聲器的口頭通信信息的可懂度的極大降低的級(jí)別。在大多數(shù)情況下,因?yàn)楦攮h(huán)境噪聲級(jí)別掩蓋或扭曲了呼叫方的話音,所以當(dāng)收聽者收聽時(shí),丟失或至少部分地丟失了一些通fe fn息ο
在存在高背景噪聲的情況下,使可懂度的損失最小化的嘗試已經(jīng)包括使用均衡器、限幅電路,或者簡(jiǎn)單地增大移動(dòng)電話的音量。均衡器和限幅電路自身就可能增大背景噪聲,因而不能解決該問題。增大移動(dòng)電話的聲音或揚(yáng)聲器音量的總級(jí)別,通常不能顯著地提高可懂度,并且可能造成其它問題,比如反饋和收聽者的不適感。發(fā)明內(nèi)容
在特定實(shí)施例中,一種用于自動(dòng)調(diào)整施加至音頻信號(hào)上的話音可懂度增強(qiáng)的系統(tǒng),包括增強(qiáng)模塊,接收包括共振峰的輸入話音信號(hào),并且對(duì)所述輸入話音信號(hào)施加音頻增強(qiáng),來提供增強(qiáng)話音信號(hào)。音頻增強(qiáng)可以加強(qiáng)所述輸入話音信號(hào)中的一個(gè)或多個(gè)共振峰。 該系統(tǒng)還包括增強(qiáng)控制器,具有一個(gè)或多個(gè)處理器。增強(qiáng)控制器可以至少部分地基于檢測(cè)到的環(huán)境噪聲量來調(diào)整由所述增強(qiáng)模塊施加的音頻增強(qiáng)的量。該系統(tǒng)還包括輸出增益控制器,可以至少部分地基于所述環(huán)境噪聲的量和所述輸入話音信號(hào),來調(diào)整增強(qiáng)話音信號(hào)的總增益,以及向增強(qiáng)話音信號(hào)施加所述總增益,以產(chǎn)生放大話音信號(hào)。該系統(tǒng)還可以包括失真控制模塊,可以至少通過將所述放大話音信號(hào)的一個(gè)或多個(gè)采樣映射到在正弦和表中存儲(chǔ)的一個(gè)或多個(gè)值,來減小所述放大話音信號(hào)中的限幅??梢愿鶕?jù)較低次正弦諧波之和來產(chǎn)生所述正弦和表。
在多種實(shí)施例中,調(diào)整話音可懂度增強(qiáng)的方法可以包括接收話音信號(hào)和具有近端環(huán)境含量的輸入信號(hào),利用一個(gè)或多個(gè)處理器計(jì)算所述輸入信號(hào)中的所述近端環(huán)境含量,利用所述一個(gè)或多個(gè)處理器,至少部分地基于所述近端環(huán)境含量來調(diào)整話音增強(qiáng)的級(jí)別,以及對(duì)所述話音信號(hào)施加所述話音增強(qiáng),以產(chǎn)生增強(qiáng)話音信號(hào)。所述話音增強(qiáng)可以加強(qiáng)所述話音信號(hào)的一個(gè)或多個(gè)共振峰。
此外,在特定實(shí)施例中,用于自動(dòng)地調(diào)整施加至音頻信號(hào)上的話音可懂度增強(qiáng)的系統(tǒng)可以包括增強(qiáng)模塊,所述增強(qiáng)模塊可以接收包括共振峰的輸入話音信號(hào),以及對(duì)所述輸入話音信號(hào)施加音頻增強(qiáng),以提供增強(qiáng)話音信號(hào)。所述音頻增強(qiáng)可以加強(qiáng)所述輸入話音信號(hào)中的一個(gè)或多個(gè)共振峰。該系統(tǒng)還可以包括增強(qiáng)控制器,所述增強(qiáng)控制器包括一個(gè)或多個(gè)處理器。所述增強(qiáng)控制器可以至少部分地基于檢測(cè)到的環(huán)境噪聲的量來調(diào)整由所述增強(qiáng)模塊施加的音頻增強(qiáng)的量。該系統(tǒng)還可以包括輸出增益控制器,所述輸出增益控制器可以至少部分地基于環(huán)境噪聲的量和所述輸入話音信號(hào)來調(diào)整增強(qiáng)話音信號(hào)的總增益,以及向所述增強(qiáng)話音信號(hào)施加所述總增益,以產(chǎn)生放大話音信號(hào)。
一種處理器可讀存儲(chǔ)介質(zhì),具有在其上存儲(chǔ)的指令,所述指令使得一個(gè)或多個(gè)處理器執(zhí)行調(diào)整話音可懂度增強(qiáng)的方法,所述方法可以包括接收來自遠(yuǎn)程電話的話音信號(hào)和來自麥克風(fēng)的噪聲信號(hào),計(jì)算所述噪聲信號(hào)的值,至少部分地基于所述噪聲信號(hào)的值來調(diào)整施加至所述話音信號(hào)的共振峰上的增益,以及對(duì)所述話音信號(hào)的共振峰施加所述增■、Λfrff. ο
在一些實(shí)現(xiàn)中,一種用于調(diào)整話音可懂度增強(qiáng)的噪聲閾值的系統(tǒng)可以包括話音增強(qiáng)模塊,可以利用接收設(shè)備來接收來自遠(yuǎn)程設(shè)備的輸入話音信號(hào),以及對(duì)所述輸入話音信號(hào)施加音頻增強(qiáng),以加強(qiáng)所述輸入話音信號(hào)中的一個(gè)或多個(gè)共振峰。該系統(tǒng)還可以包括話音增強(qiáng)控制器,所述話音增強(qiáng)控制器具有一個(gè)或多個(gè)處理器。所述話音增強(qiáng)控制器可以至少部分地基于第一噪聲閾值以上檢測(cè)到的環(huán)境噪聲量,來調(diào)整由所述增強(qiáng)模塊施加的音頻增強(qiáng)的量。該系統(tǒng)還可以包括噪聲靈敏度控制器,所述噪聲靈敏度控制器可以調(diào)整所述第一噪聲閾值。所述噪聲靈敏度控制器可以包括第一相關(guān)器、第一方差模塊、第二相關(guān)器、 第二方差模塊和噪聲靈敏度調(diào)節(jié)器,其中所述第一相關(guān)器可以根據(jù)從接收設(shè)備的麥克風(fēng)接收的麥克風(fēng)輸入信號(hào)計(jì)算第一自相關(guān)值,所述第一方差模塊可以計(jì)算第一自相關(guān)值的第一方差,所述第二相關(guān)器可以根據(jù)揚(yáng)聲器輸入信號(hào)計(jì)算第二自相關(guān)值,其中揚(yáng)聲器輸入信號(hào)包括話音增強(qiáng)模塊的輸出信號(hào),所述第二方差模塊可以計(jì)算第二自相關(guān)值的第二方差,所述噪聲靈敏度調(diào)節(jié)器可以使用所述第一和第二自相關(guān)值以及第一和第二方差值中的一個(gè)或多個(gè)來調(diào)整第一噪聲閾值,以產(chǎn)生第二噪聲閾值。因此,在特定實(shí)施例中,話音增強(qiáng)控制器可以至少部分地基于第二噪聲閾值以上檢測(cè)到的環(huán)境噪聲第二量,來調(diào)整施加至第二輸入音頻信號(hào)上的音頻增強(qiáng)的量。
在特定實(shí)施例中,一種用于調(diào)整話音可懂度增強(qiáng)的靈敏度的系統(tǒng)包括話音增強(qiáng)模塊,可以利用接收設(shè)備接收由接收設(shè)備從遠(yuǎn)程設(shè)備處接收的輸入話音信號(hào),以及向所述輸入話音信號(hào)施加音頻增強(qiáng),以加強(qiáng)所述輸入話音信號(hào)中的一個(gè)或多個(gè)共振峰。該系統(tǒng)還可以包括增強(qiáng)控制器,所述增強(qiáng)控制器可以至少部分地基于所述輸入話音信號(hào)中存在的環(huán)境噪聲的量來調(diào)整由所述話音增強(qiáng)模塊施加的所述音頻增強(qiáng)的量。該系統(tǒng)還可以包括具有一個(gè)或多個(gè)處理器的噪聲靈敏度控制器,所述噪聲靈敏度控制器可以至少部分地基于麥克風(fēng)輸入信號(hào)和揚(yáng)聲器輸入信號(hào)中的至少一個(gè)或二者的統(tǒng)計(jì)分析來調(diào)整所述增強(qiáng)控制器對(duì)環(huán)境噪聲的靈敏度,其中麥克風(fēng)輸入信號(hào)從接收設(shè)備的麥克風(fēng)獲得,揚(yáng)聲器束信號(hào)作為話音增強(qiáng)模塊的輸出信號(hào)來提供。
在特定實(shí)施例中,一種用于調(diào)整話音增強(qiáng)的靈敏度的方法包括接收輸入音頻信號(hào);檢測(cè)輸入音頻信號(hào)中的相關(guān)含量,其中檢測(cè)包括使用一個(gè)或多個(gè)處理器來計(jì)算對(duì)所述輸入音頻信號(hào)的統(tǒng)計(jì)分析;以及響應(yīng)于執(zhí)行所述檢測(cè),調(diào)整施加至所述輸入音頻信號(hào)的增強(qiáng)級(jí)別。
此外,在多種實(shí)施例中,一種音頻信號(hào)處理方法包括接收麥克風(fēng)輸入信號(hào);檢測(cè)所述麥克風(fēng)輸入信號(hào)中的實(shí)質(zhì)上周期性含量;以及利用一個(gè)或多個(gè)處理器,至少部分地基于在所述麥克風(fēng)輸入信號(hào)中檢測(cè)到的實(shí)質(zhì)上周期性含量來調(diào)整音頻增強(qiáng)。所述音頻增強(qiáng)可以至少部分地基于所述麥克風(fēng)輸入信號(hào)的級(jí)別來選擇性地加強(qiáng)音頻輸出信號(hào)。所述方法還可以包括向揚(yáng)聲器提供所述音頻輸出信號(hào)。
為了概括本公開,本文已經(jīng)描述了本發(fā)明的特定方面、優(yōu)點(diǎn)和新穎特征。應(yīng)該理解,根據(jù)本文公開的本發(fā)明的任何特定實(shí)施例,可能沒有必要實(shí)現(xiàn)所有這些優(yōu)點(diǎn)。因此,可以以下方式實(shí)現(xiàn)或執(zhí)行本文公開的本發(fā)明實(shí)現(xiàn)或優(yōu)化本文教導(dǎo)的一個(gè)或一組優(yōu)點(diǎn),而沒有必要實(shí)現(xiàn)可能由本文教導(dǎo)或建議的其它優(yōu)點(diǎn)。
貫穿附圖,可以重復(fù)使用參考數(shù)字,以指示參考元件之間的對(duì)應(yīng)性。提供附圖來指示本文描述的本發(fā)明的實(shí)施例,而非限制其范圍。
圖1示出了用于實(shí)現(xiàn)話音增強(qiáng)系統(tǒng)的移動(dòng)電話環(huán)境的實(shí)施例;
圖2示出了圖1的與增強(qiáng)系統(tǒng)的實(shí)施例;
圖3示出了由話音增強(qiáng)系統(tǒng)使用的話音增強(qiáng)控制過程的實(shí)施例;
圖4示出了由話音增強(qiáng)系統(tǒng)使用的輸出音量控制過程的實(shí)施例;
圖5A、5B、5C和6示出了由話音增強(qiáng)系統(tǒng)使用的噪聲靈敏度控制過程的實(shí)施例
圖7示出了圖1的系統(tǒng)的示例失真控制模塊;
圖8示出了正弦波的示例時(shí)域圖示;
圖9示出了圖8的正弦波的示例頻譜;
圖10示出了限幅正弦波的示例時(shí)域圖示;
圖11示出了圖10的限幅正弦波的示例頻譜;
圖12示出了與圖11的限幅正弦波頻譜相比諧波數(shù)目減少的示例頻譜,;
圖13示出了與圖12的頻譜相對(duì)應(yīng)的部分飽和波的示例時(shí)域圖示;
圖14示出了正弦和映射函數(shù)的實(shí)施例;
圖15示出了音頻信號(hào)和該信號(hào)的失真控制版本的示例時(shí)域圖示。
具體實(shí)施方式
I.介紹
移動(dòng)電話以及其它類似尺寸的設(shè)備傾向具有小揚(yáng)聲器,其中在小揚(yáng)聲器生產(chǎn)時(shí), 其聲音的音量就受到了限制。因此,在存在環(huán)境噪聲的情況下,很難聽到移動(dòng)電話上的對(duì)話。
本公開描述了一種用于基于環(huán)境噪聲、語(yǔ)音級(jí)別(speech level)、兩者的結(jié)合等來調(diào)整話音可懂度處理的系統(tǒng)和方法。話音可懂度處理可以包括加強(qiáng)語(yǔ)音中共振峰的技術(shù)。例如,話音可懂度處理可以用于使移動(dòng)電話對(duì)話等的語(yǔ)音清晰。話音可懂度處理可以適于至少部分地基于環(huán)境噪聲增大或減小話音共振峰或其它聲音特性。通過增強(qiáng)話音可懂度處理,可以加強(qiáng)講話者語(yǔ)音中的共振峰,以使得收聽者感覺到更清楚。然而,在存在相當(dāng)大的環(huán)境噪聲的情況下,加強(qiáng)語(yǔ)音中的共振峰可能使得語(yǔ)音聽起來刺耳。因此,如果環(huán)境噪聲減小,則可以降低話音可懂度處理的量,以避免語(yǔ)音中的刺耳聲。
此外,還可以至少部分地基于噪聲級(jí)別和/或話音級(jí)別,自適應(yīng)地增大音頻信號(hào)的總增益。然而,如果將音頻信號(hào)的總增益增大到超出特定級(jí)別,則可能發(fā)生音頻信號(hào)飽和,從而引起諧波失真。在特定實(shí)施例中,為了減少飽和的失真效應(yīng),可以使用失真控制處理。失真控制處理可以減少高增益情形期間發(fā)生的失真,同時(shí)允許發(fā)生一些失真,以保持或增大響度。在特定實(shí)施例中,可以通過將音頻信號(hào)映射到輸出信號(hào)來執(zhí)行失真控制,其中與全飽和信號(hào)相比,該輸出信號(hào)具有較少的諧波。
II.系統(tǒng)概要
圖1示出了用于實(shí)現(xiàn)話音增強(qiáng)系統(tǒng)110的移動(dòng)電話環(huán)境100的實(shí)施例。在示例移動(dòng)電話環(huán)境100中,示出了呼叫方電話104和接收方電話108。呼叫方電話104和接收方電話108可以是移動(dòng)電話、基于互聯(lián)網(wǎng)協(xié)議的話音(VOIP)電話、智能電話、地面通信線電話等。呼叫方電話104可以被看作是位于移動(dòng)電話環(huán)境100的遠(yuǎn)端,而接收方電話可以被看作是位于移動(dòng)電話環(huán)境100的近端。當(dāng)移動(dòng)電話108的用戶說話時(shí),近端與遠(yuǎn)端可以顛倒。
在所描述的實(shí)施例中,呼叫方向呼叫方電話104提供話音輸入102。呼叫方電話 104中的發(fā)射機(jī)106向接收方電話108發(fā)送話音輸入信號(hào)102。發(fā)射機(jī)106可以根據(jù)呼叫方電話104的類型無(wú)線地或通過地面通信線發(fā)送話音輸入信號(hào)102。接收方電話108的話音增強(qiáng)系統(tǒng)110可以接收話音輸入信號(hào)102。話音增強(qiáng)系統(tǒng)110可以包括用于提高話音輸入信號(hào)102的可懂度的硬件和/或軟件。例如,話音增強(qiáng)系統(tǒng)110可以利用話音增強(qiáng)來處理話音輸入信號(hào)102,其中話音增強(qiáng)加強(qiáng)了口聲的區(qū)別特性。
話音增強(qiáng)系統(tǒng)110還可以利用接收方電話108的麥克風(fēng)來檢測(cè)環(huán)境噪聲112。環(huán)境噪聲或含量112可以包括背景噪聲或周圍噪聲(ambient noise)。除了其普通含義之外, 環(huán)境噪聲或或含量還可以包括一些或全部近端噪音。例如,除了接收方電話108的麥克風(fēng)接收到的背景聲音之外,環(huán)境噪聲或含量還包括來自揚(yáng)聲器輸出114的回聲。在一些情況下,環(huán)境噪聲還可以包括來自接收方電話108的用戶的話音輸入,包括咳嗽、清嗓子以及雙講(double talk)(參見以下的“噪聲靈敏度控制(Noise Sensitivity Control)”)。
有利地,在特定實(shí)施例中,話音增強(qiáng)系統(tǒng)110至少部分地基于環(huán)境噪聲112的量來調(diào)整施加至話音輸入信號(hào)102上的話音增強(qiáng)的強(qiáng)度。例如,如果環(huán)境噪聲112增大,則話音增強(qiáng)系統(tǒng)110可以增大所施加的話音增強(qiáng)的量,反之亦然。因此,話音增強(qiáng)可以至少部分地跟蹤檢測(cè)到的環(huán)境噪聲112的量。
此外,話音增強(qiáng)系統(tǒng)110可以至少部分地基于環(huán)境噪聲112的量來增大施加至話音輸入信號(hào)102上的總增益。然而,當(dāng)存在較小的環(huán)境噪聲112時(shí),話音增強(qiáng)系統(tǒng)110可以減少所施加的話音增強(qiáng)和/或增益增大的量。這種減少有益于收聽者,原因在于當(dāng)存在低級(jí)別的背景噪聲112時(shí),話音增強(qiáng)和/或音量增大可能聽起來刺耳或者討厭。
因此,在特定實(shí)施例中,話音增強(qiáng)系統(tǒng)110將話音輸入信號(hào)變換為增強(qiáng)的輸出信號(hào)114,其中存在變化的環(huán)境噪聲級(jí)別的情況下,所述增強(qiáng)的輸出信號(hào)114對(duì)于收聽者而言可能更好理解。在一些實(shí)施例中,還可以在呼叫方電話104中包括話音增強(qiáng)系統(tǒng)110。話音增強(qiáng)系統(tǒng)110可以至少部分地基于呼叫方電話104檢測(cè)到的環(huán)境噪聲的量,來對(duì)話音輸入信號(hào)102施加增強(qiáng)。因此,可以在呼叫方電話104、接收方電話108,或者兩者中使用話音增強(qiáng)系統(tǒng)110。
盡管示出的話音增強(qiáng)系統(tǒng)110是電話108的一部分,但是替換地,可以在任何通信設(shè)備或與電話通信的設(shè)備中實(shí)現(xiàn)話音增強(qiáng)系統(tǒng)110。例如,可以在與支持VOIP的電話進(jìn)行通信或耦合的計(jì)算機(jī)、路由器、模擬電話適配器等中實(shí)現(xiàn)話音增強(qiáng)系統(tǒng)110。還可以在公共地址(“PA”)設(shè)備(包括因特網(wǎng)協(xié)議上的PA)、無(wú)線電收發(fā)機(jī)、助聽設(shè)備(例如,助聽器)、 對(duì)講電話以及其它音頻系統(tǒng)中使用話音增強(qiáng)系統(tǒng)110。此外,可以在向一個(gè)或多個(gè)揚(yáng)聲器提供音頻輸出的任何基于處理器的系統(tǒng)中實(shí)現(xiàn)話音增強(qiáng)系統(tǒng)110。
圖2示出了話音增強(qiáng)系統(tǒng)210的更詳細(xì)的實(shí)施例。話音增強(qiáng)系統(tǒng)210可以具有話音增強(qiáng)系統(tǒng)110的全部特征??梢栽谝韵略O(shè)備中實(shí)現(xiàn)話音增強(qiáng)系統(tǒng)210:移動(dòng)電話、峰窩電話、智能電話或包括任何上述設(shè)備的其它計(jì)算設(shè)備。有利地,在特定實(shí)施例中,話音增強(qiáng)系統(tǒng)210至少部分地基于檢測(cè)到的環(huán)境噪聲的量和/或話音信號(hào)的級(jí)別來調(diào)整話音可懂度處理和音量處理。
話音增強(qiáng)系統(tǒng)210包括話音增強(qiáng)模塊220。話音增強(qiáng)模塊220可以包括用于對(duì)話音輸入信號(hào)202施加話音增強(qiáng)的硬件和/或軟件。話音增強(qiáng)可以加強(qiáng)話音輸入信號(hào)202中的口聲的區(qū)別特性。在某些實(shí)施例中,這些區(qū)別特性包括在人(例如,使用電話的呼叫方) 的聲道中產(chǎn)生的共振峰。人類話音的可懂度可能很大程度上取決于共振峰的頻率分布的圖案。因此,話音增強(qiáng)模塊220可以選擇性地增強(qiáng)共振峰,以在存在背景噪聲的情況下提供更容易理解的話音。
在特定實(shí)施例中,話音增強(qiáng)模塊220利用1995年10月17日提交的發(fā)明名稱為 “公共地址可懂度系統(tǒng)”的美國(guó)專利NO. 5459813( “813專利”)中描述的一些或全部特征來施加話音增強(qiáng),其全部?jī)?nèi)容通過引用合并于此。盡管‘813專利在電路的上下文中描述了這些特征,但是話音增強(qiáng)模塊220可以利用在諸如數(shù)字信號(hào)處理器(DSP)之類的處理器中執(zhí)行的指令來實(shí)現(xiàn)這些特征的一部分或全部。此外,話音增強(qiáng)模塊220還可以使用‘813專利中沒有公開的話音增強(qiáng)技術(shù)。
話音增強(qiáng)模塊220可以通過將話音輸入信號(hào)202劃分為頻率子帶來處理共振峰。 話音增強(qiáng)模塊220可以將話音輸入信號(hào)202劃分為兩個(gè)或多個(gè)子帶等等。話音增強(qiáng)模塊 220可以通過應(yīng)用具有中心頻率的帶通濾波器來執(zhí)行這種頻率劃分,其中,在所述中心頻率處傾向于出現(xiàn)共振峰或者在所述中心頻率附近傾向于出現(xiàn)共振峰。在實(shí)施例中,這種頻率劃分可以通過例如在‘813專利的第4列第50行至第5列第M行以及第7列中的第10行至32行中描述的頻譜分析器42或IM來完成,在此特別并入‘813專利的該部分以供參考。
話音增強(qiáng)模塊220可以通過獨(dú)立地放大子帶中的共振峰,并且選擇性地對(duì)其加權(quán)來施加話音增強(qiáng)。對(duì)共振峰加權(quán)可以使得特定共振峰被加強(qiáng),從而提高可懂度。話音增強(qiáng)模塊220可以將加權(quán)后的共振峰與基帶話音分量相結(jié)合,以向(以下描述的)輸出增益控制器230提供輸出話音信號(hào)。話音增強(qiáng)模塊220還可以增強(qiáng)其它的有聲區(qū)別特性,比如爆破音和摩擦音。
例如,話音增強(qiáng)模塊220還可以以與‘813專利的以下部分中描述的方式相同或類似的方式執(zhí)行這些放大、加權(quán)和組合功能(或者其數(shù)字實(shí)現(xiàn))第5列第1-7行;第5列第 46行至第6列第19行;以及第9列第8行至39行。因此,特別并入‘813專利的這些部分以供參考。為了對(duì)可以如何數(shù)字地實(shí)現(xiàn)這些功能中的某些功能的示例進(jìn)行舉例說明,‘813 專利描述了利用可變電阻來對(duì)特定子帶中的信號(hào)加權(quán)(例如,參見第5列第66行至第6列第19行)。話音增強(qiáng)模塊220可以通過將增益值存儲(chǔ)在存儲(chǔ)器中并利用處理器對(duì)信號(hào)施加該增益值,來數(shù)字地實(shí)現(xiàn)這些權(quán)重。
有利地,在特定實(shí)施例中,提供一種話音增強(qiáng)控制器222,該話音增強(qiáng)控制器可以控制話音增強(qiáng)模塊220提供的話音增強(qiáng)的級(jí)別。話音增強(qiáng)控制器222可以包括硬件和/或軟件。話音增強(qiáng)控制器222可以向話音增強(qiáng)模塊220提供增強(qiáng)級(jí)別控制信號(hào)或值,該話音增強(qiáng)模塊220增大或減小施加的話音增強(qiáng)的級(jí)別。在一個(gè)實(shí)施例中,增強(qiáng)級(jí)別控制信號(hào)調(diào)整子帶的加權(quán)。例如,控制信號(hào)可以包括與一些或全部子帶的輸出(或輸入)相乘的一個(gè)或多個(gè)增益值。同樣地,控制信號(hào)可以用于加上或減去一些或全部子帶的輸入或輸出。當(dāng)環(huán)境噪聲204增大和減小時(shí),控制信號(hào)可以逐采樣地進(jìn)行調(diào)整。
在特定實(shí)施例中,在檢測(cè)到環(huán)境噪聲204的閾值能量之后,話音增強(qiáng)控制器222調(diào)整話音增強(qiáng)的級(jí)別。在閾值以上時(shí),話音增強(qiáng)控制器222可以使得話音增強(qiáng)的級(jí)別跟隨或?qū)嵸|(zhì)上跟隨環(huán)境噪聲204的量。在一個(gè)實(shí)施例中,例如,所提供的噪聲閾值以上的噪聲增強(qiáng)的級(jí)別和噪聲能量(或功率)與閾值的比例成比例。在備選實(shí)施例中,調(diào)整話音增強(qiáng)的級(jí)別,而不管存在的環(huán)境噪聲的量,例如沒有使用閾值。
所描述的話音增強(qiáng)系統(tǒng)210的實(shí)施例包括噪聲靈敏度控制器2M和額外增強(qiáng)控制 226,所述額外增強(qiáng)控制2 用于進(jìn)一步調(diào)整由話音增強(qiáng)控制器222提供的控制量。噪聲靈敏度控制器2M可以向話音增強(qiáng)控制器222提供噪聲靈敏度控制值,以調(diào)整話音增強(qiáng)控制器222對(duì)存在的噪聲204量敏感的程度。如以下將更詳細(xì)地描述的,噪聲靈敏度控制器2M 可以影響噪聲閾值,在該噪聲閾值以下,話音增強(qiáng)控制器222不可以調(diào)整話音增強(qiáng)的級(jí)別。
在特定實(shí)施例中,噪聲靈敏度控制器2M至少部分地基于從麥克風(fēng)和/或揚(yáng)聲器輸入獲得的音頻采樣自動(dòng)地產(chǎn)生噪聲靈敏度控制。有利地,在特定實(shí)施例中,噪聲靈敏度控制器2M可以自動(dòng)地調(diào)整噪聲靈敏度,以解決由麥克風(fēng)獲得的揚(yáng)聲器回聲以及其它噪聲偽跡。以下將參考圖5和6更詳細(xì)地描述這些特征。此外,在一些實(shí)施例中,噪聲靈敏度控制器2M提供用戶接口,該用戶接口允許用戶調(diào)整噪聲靈敏度控制。因此,噪聲靈敏度控制器 224可以提供對(duì)話音增強(qiáng)控制器222的自動(dòng)和/或手動(dòng)控制。
額外增強(qiáng)控制2 可以向話音增強(qiáng)控制器222提供額外增強(qiáng)控制信號(hào),該額外增強(qiáng)控制信號(hào)可以用作在其下增強(qiáng)級(jí)別不再下降的值。可以經(jīng)由用戶接口向用戶顯現(xiàn)額外增強(qiáng)控制226。該控制2 還允許用戶將增強(qiáng)級(jí)別增大到超出由話音增強(qiáng)控制器222確定的增強(qiáng)級(jí)別。在一個(gè)實(shí)施例中,話音增強(qiáng)控制器222可以將來自額外增強(qiáng)控制226的額外增強(qiáng)加到由話音增強(qiáng)控制器222確定的增強(qiáng)級(jí)別中。對(duì)于可能想要更強(qiáng)的話音增強(qiáng)處理或者想要頻繁施加話音增強(qiáng)處理的聽力受損者而言,額外增強(qiáng)控制2 可能特別有用。
在特定實(shí)施例中,輸出增益控制器230可以控制施加至話音增強(qiáng)模塊220的輸出信號(hào)上的總增益的量??梢砸杂布?或軟件實(shí)現(xiàn)輸出增益控制器230。輸出增益控制器 230至少部分地基于噪聲輸入204的級(jí)別和話音輸入202的級(jí)別來調(diào)整施加至輸出信號(hào)的增益。除了諸如電話的音量控制之類的任何用戶設(shè)置的增益之外,可以施加這種增益。有利地,基于環(huán)境噪聲204和/或話音輸入202來調(diào)整音頻信號(hào)的增益可能有助于收聽者進(jìn)一步感知話音輸入信號(hào)202。
在所描述的實(shí)施例中,還示出了自適應(yīng)級(jí)別控制232,其可以進(jìn)一步調(diào)整由輸出增益控制器230提供的增益量。用戶接口還可以向用戶顯現(xiàn)自適應(yīng)級(jí)別控制232。增大這種控制232可以在來電話音輸入202級(jí)別下降或者當(dāng)噪聲輸入204增大時(shí)使控制器230的增益增大得更多。減小這種控制232能夠在來電話音輸入202級(jí)別下降或者當(dāng)噪聲輸入204 下降時(shí)使控制器230的增益增大得更少。
在一些情況下,話音增強(qiáng)模塊220、話音增強(qiáng)控制器222和/或輸出增益控制器 230施加的增益可以使得話音信號(hào)被限幅或飽和。飽和可能導(dǎo)致令收聽者不愉快的諧波失真。因此,在特定實(shí)施例中,還提供了失真控制模塊140。失真控制模塊140可以接收輸出增益控制器230的調(diào)整增益后的話音信號(hào)。失真控制模塊140可以包括硬件和/或軟件, 在至少部分地保持或者甚至增大由話音增強(qiáng)模塊220、話音增強(qiáng)控制器222和/或輸出增益控制器230提供的信號(hào)能量的同時(shí)控制失真。
在特定實(shí)施例中,失真控制模塊140通過將話音信號(hào)中的一個(gè)或多個(gè)采樣映射到輸出信號(hào)來控制話音信號(hào)中的失真,與全飽和信號(hào)相比,該輸出信號(hào)具有較少的諧波。對(duì)于不飽和的采樣,該映射可以線性地或近似線性地跟隨話音信號(hào)。對(duì)于飽和的采樣,該映射可以是施加控制失真上非線性變換。因此,在特定實(shí)施例中,與全飽和信號(hào)相比,失真控制模塊140可以允許話音信號(hào)聽起來更響亮,具有更少的失真。因此,在特定實(shí)施例中,失真控制模塊140將代表物理話音信號(hào)的數(shù)據(jù)轉(zhuǎn)換為代表了具有控制失真的另一物理話音信號(hào)的數(shù)據(jù)。
III.話咅增強(qiáng)控制
圖3示出了話音增強(qiáng)控制過程300的實(shí)施例。可以通過話音增強(qiáng)系統(tǒng)110或210 來實(shí)現(xiàn)話音增強(qiáng)控制過程300。具體地,可以通過話音增強(qiáng)控制器222來實(shí)現(xiàn)話音增強(qiáng)控制過程300。有利地,在特定實(shí)施例中,話音增強(qiáng)控制過程300至少部分地基于環(huán)境噪聲能量的級(jí)別來調(diào)整話音增強(qiáng)處理。
在方框302,通過諸如電話之類的通信設(shè)備接收環(huán)境噪聲輸入信號(hào)。該環(huán)境噪聲輸入信號(hào)可以通過通信設(shè)備的麥克風(fēng)來檢測(cè)。在判定框304,確定是否啟用環(huán)境控制。如果不啟用環(huán)境控制,則向方框306提供零值。在一個(gè)實(shí)施例中,可以由用戶通過通信設(shè)備的用戶接口啟用或禁用環(huán)境控制。禁用環(huán)境控制可能使得話音增強(qiáng)控制過程基于噪聲級(jí)別以外的因素(諸如上述額外控制級(jí)別)來調(diào)整話音增強(qiáng)處理。
在方框306,可以通過采用噪聲信號(hào)的絕對(duì)值來計(jì)算環(huán)境噪聲信號(hào)的能量,以及在方框308中,通過對(duì)噪聲信號(hào)施加噪聲平滑濾波器來計(jì)算環(huán)境噪聲信號(hào)的能量。噪聲平滑濾波器可以是一階濾波器或者較高階濾波器。例如,平滑濾波器可以是低通濾波器等。在一些實(shí)施例中,噪聲平滑濾波器提供每采樣的平均(例如,移動(dòng)平均)噪聲能量級(jí)別。在備選實(shí)施例中,計(jì)算噪聲信號(hào)的功率,而非能量。
在方框310,可以向輸出增益控制過程提供環(huán)境噪聲信號(hào)的能量。以下參考圖4描述示例輸出增益控制過程。還可以向判定框312提供環(huán)境噪聲能量,所述判定框312可以確定是否能量已經(jīng)達(dá)到(例如,大于或者等于)噪聲閾值。在一個(gè)實(shí)施例中,如下計(jì)算噪聲閾值
噪聲閾值=1-(α *噪聲靈敏度控制)(1)
其中,α是常量,其中噪聲靈敏度控制可以是由圖2的噪聲靈敏度控制器2 產(chǎn)生的值。噪聲靈敏度控制可以影響話音增強(qiáng)控制器222對(duì)環(huán)境噪聲輸入302的靈敏度。噪聲靈敏度控制可以基于多種因素而改變,從而使得噪聲閾值改變(參見圖5和6)。在實(shí)施例中,α和噪聲靈敏度控制可以在范圍
之間,或者可以具有在該示例范圍之外的其它值。
在所描述的實(shí)施例中,如果噪聲能量大于或等于閾值,則將噪聲能量傳送至乘法框314。否則,向乘法框314提供零控制級(jí)別。因?yàn)榭刂萍?jí)別可以乘以以上參考圖2描述的話音信號(hào)子帶,所以零控制級(jí)別可能潛在地造成不向話音信號(hào)應(yīng)用話音增強(qiáng)處理(例如, 在以下的方框316處,沒有提供額外處理)。
在乘法方框314,將判定方框312的輸出與噪聲閾值的的乘法逆元素 (multiplicative inverse)相乘。備選地,判定框312的輸出除以噪聲閾值判定。乘法框314的輸出可以是初步增強(qiáng)級(jí)別。因此,在特定實(shí)施例中,增強(qiáng)級(jí)別可以是噪聲能量與噪聲閾值的比值。
在框316,可以將以上參考圖2描述的額外增強(qiáng)控制添加至初步增強(qiáng)控制級(jí)別中。 額外增強(qiáng)控制可以在范圍W,l]之間,或者具有一些其它值。在判定框318,確定是否已經(jīng)達(dá)到高控制級(jí)別。高控制級(jí)別可以是預(yù)定峰值或最大控制級(jí)別。如果已經(jīng)達(dá)到了高控制級(jí)別,則在判定框318,將增強(qiáng)控制級(jí)別限制到高控制級(jí)別。否則,判定框318向判定方框320 傳遞增強(qiáng)控制級(jí)別。
在判定框320,可以確定是否啟用話音增強(qiáng)控制。如果否,則用戶輸入可以用于調(diào)整話音增強(qiáng)處理級(jí)別??梢越?jīng)由用戶接口等向用戶顯現(xiàn)用戶輸入。如果啟用控制,則在方框322,可以將在方框302至318中計(jì)算的增強(qiáng)控制級(jí)別作為輸出控制級(jí)別。
盡管在本示例中使用了噪聲閾值,但是不需要在所有實(shí)施例中使用噪聲閾值。在特定實(shí)施例中,可以基于任何噪聲級(jí)別調(diào)整話音增強(qiáng)處理。然而,在一些情況下,使用閾值可能是有益的。例如,在低環(huán)境噪聲的情況下,話音增強(qiáng)處理可能是刺耳或者令人不快的。 因此,使用閾值來確定何時(shí)開啟話音增強(qiáng)控制可以使得在存在更大噪聲級(jí)別時(shí)使用話音增強(qiáng)處理。
IV.輸出增益控制
圖4示出了輸出增益控制過程400的實(shí)施例。輸出增益控制過程400可以通過話音增強(qiáng)系統(tǒng)110或210來實(shí)現(xiàn)。具體地,可以通過輸出增益控制器230來實(shí)現(xiàn)輸出增益控制過程400。有利地,在特定實(shí)施例中,輸出增益控制過程400至少部分地基于環(huán)境噪聲能量的級(jí)別以及話音輸入級(jí)別來調(diào)整輸出增益。
在框402,通過諸如電話之類的通信設(shè)備接收來自遠(yuǎn)程呼叫方的話音輸入信號(hào)。在方框404和406,可以通過在方框404采用話音輸入的絕對(duì)值來確定話音輸入信號(hào)中的能量,以及通過在方框406應(yīng)用話音平滑濾波器來計(jì)算話音輸入信號(hào)中的能量。話音平滑濾波器可以是低通濾波器等,提供每采樣(sample per sample basis)的平均(例如,移動(dòng)平均)話音級(jí)別。
在框408,接收環(huán)境噪聲能量。在上述音量控制過程300中計(jì)算該環(huán)境噪聲能量。 在判定框410,將話音平滑濾波器的輸出與接收增益閾值相比較,以及將環(huán)境噪聲能量與麥克風(fēng)增益閾值相比較。接收增益閾值可以至少部分地取決于以上參考圖2描述的自適應(yīng)增益控制。麥克風(fēng)增益閾值可以至少部分地基于以上參考圖2描述的噪聲靈敏度控制。
在一個(gè)實(shí)施例中,如下計(jì)算接收增益閾值
接收增益閾值=0.5+( Y *自適應(yīng)增益控制)(2)
其中,Y是范圍在W,l]之間的常量,以及自適應(yīng)增益控制可以是與圖2的自適應(yīng)增益控制232相對(duì)應(yīng)的值。同樣,可以如下計(jì)算麥克風(fēng)增益閾值
麥克風(fēng)增益閾值=1_( η*噪聲靈敏度控制) (3)
其中,η是范圍在
之間的常量,以及噪聲靈敏度控制是由上述噪聲靈敏度控制器2Μ產(chǎn)生的值。噪聲靈敏度控制可以改變值(也參見圖5和6),從而使得在一些實(shí)施例中麥克風(fēng)增益閾值也改變。
在判定方框410,如果滿足條件,則向乘法框412提供環(huán)境噪聲能量。否則,可以向乘法框412提供低增益級(jí)別。低增益級(jí)別可以是最小增益級(jí)別等。例如,在環(huán)境噪聲能量相對(duì)低并且話音輸入相對(duì)高的情況下,可以使用低增益級(jí)別。在這些情況下,因?yàn)樵捯粜盘?hào)可能已經(jīng)是相對(duì)容易理解的,所以可能期望進(jìn)行細(xì)微的增益調(diào)整。
在乘法框412,將判定方框410的輸出乘以麥克風(fēng)增益閾值的乘法逆元素,以產(chǎn)生增益級(jí)別。備選地,判定框410的輸出可以除以麥克風(fēng)增益閾值。因此,增益級(jí)別可以是環(huán)境噪聲能量與麥克風(fēng)增益閾值的比值。在方框414,確定是否已經(jīng)達(dá)到了高增益級(jí)別。如果沒有達(dá)到高增益級(jí)別,則向輸出增益平滑濾波器416傳遞乘法框412的輸出。否則,向輸出增益平滑濾波器提供高增益級(jí)別。高增益級(jí)別可以是最大增益級(jí)別等。
在方框416,向判定框414的輸出施加輸出增益平滑濾波器。輸出增益平滑濾波器可以是低通濾波器等,對(duì)乘法方框412和/或判定方框414處計(jì)算的增益級(jí)別進(jìn)行平均。 該平滑濾波器可以減少增益級(jí)別的突然變化。在方框418處,將增益平滑濾波器的輸出乘以輸出增益控制,其中所述輸出增益控制可以是用戶設(shè)置的值。例如,可以經(jīng)由用戶接口向用戶顯現(xiàn)輸出增益控制。在方框420,提供乘法方框418的輸出作為輸出增益級(jí)別。
V.噪聲靈敏度控制
如上所述,可以自動(dòng)地或者在用戶控制之下改變由噪聲靈敏度控制器2M產(chǎn)生的噪聲靈敏度控制。在特定實(shí)施例中,改變?cè)肼曥`敏度控制影響了話音增強(qiáng)控制器222和/ 或輸出增益控制器230對(duì)噪聲的靈敏度。在一個(gè)實(shí)施例中,增大噪聲靈敏度控制使得話音增強(qiáng)控制器222通過極大地增強(qiáng)話音的可懂度來極大地響應(yīng)環(huán)境噪聲,反之亦然。類似地, 增大噪聲靈敏度控制可以使得輸出增益控制器230極大地增大施加至增強(qiáng)音頻信號(hào)的輸出增益,反之亦然。
在若干情況下,自動(dòng)地減小話音增強(qiáng)控制器222和/或輸出增益控制器230的靈敏度可能是有益的。例如,如果圖1的接收電話108僅接收噪聲,而不會(huì)接收來自呼叫方電話104的話音信號(hào)(例如,由于對(duì)話暫停),則施加話音增強(qiáng)可能增大噪聲的響度。此外,當(dāng)接收電話108的麥克風(fēng)獲得來自電話108的揚(yáng)聲器輸出114的話音信號(hào)時(shí),可能發(fā)生令人不快的效果。這種揚(yáng)聲器反饋可以被話音增強(qiáng)控制器222解釋為環(huán)境噪聲,這可以使得話音增強(qiáng)對(duì)揚(yáng)聲器反饋進(jìn)行調(diào)制。得到的調(diào)制后的輸出信號(hào)114可能是令收聽者不愉快的。 當(dāng)收聽者與接收方電話108通話的同時(shí)接收方電話108輸出從呼叫方電話104接收到的話音信號(hào)時(shí),可能發(fā)生類似的問題。接收電話108的麥克風(fēng)可以檢測(cè)到雙講,并且話音增強(qiáng)控制器222可以使得話音增強(qiáng)調(diào)制該雙講,從而導(dǎo)致令人不快的聲音。
在特定實(shí)施例中,噪聲靈敏度控制器2M可以通過自動(dòng)調(diào)整話音增強(qiáng)控制器222 和/或輸出增益控制器230對(duì)噪聲的靈敏度來克服這些和其它問題。備選地,噪聲靈敏度控制器2M可以觸發(fā)(例如,開啟或關(guān)閉)話音增強(qiáng)控制器222和/或輸出增益控制器230。 參考圖5A、5B和5C,示出了更詳細(xì)的噪聲靈敏度控制器52^、524b和52 的實(shí)施例。圖 5A的噪聲靈敏度控制器52 可以調(diào)整控制器222、230的噪聲靈敏度或者觸發(fā)控制器222、 230,以說明接收電話108只接收噪聲而不接收來自遠(yuǎn)端(例如,來自呼叫方電話104)的話音信號(hào)的情形。圖5B的噪聲靈敏度控制器52 可以調(diào)整控制器222、230的噪聲靈敏度或者觸發(fā)控制器222、230,以說明揚(yáng)聲器反饋和/或雙講的情形。圖5C的噪聲靈敏度控制器 524c結(jié)合了圖5A和5B所示的控制器52^、5Mb的特征。
在圖5A中,噪聲靈敏度控制器52 接收揚(yáng)聲器輸入502a。揚(yáng)聲器輸入50 可以包括在緩沖器等中存儲(chǔ)的一個(gè)或多個(gè)輸出采樣,其中所述一個(gè)或多個(gè)輸出采樣還被提供至諸如電話108之類的通信設(shè)備的揚(yáng)聲器。揚(yáng)聲器輸入50 可以是上述話音增強(qiáng)系統(tǒng)210 的輸出信號(hào)250。向相關(guān)器530a提供揚(yáng)聲器輸入50加,其中相關(guān)器530a可以計(jì)算或估計(jì)揚(yáng)聲器輸入50 的自相關(guān)。在實(shí)施例中,相關(guān)器530a計(jì)算揚(yáng)聲器輸入50 中的一組采樣的自相關(guān)。
話音信號(hào)傾向于是周期性的或者實(shí)質(zhì)上周期性的。因此,如果揚(yáng)聲器輸入50 包括話音信號(hào),則由于自相關(guān)的性質(zhì),揚(yáng)聲器輸入50 的自相關(guān)函數(shù)也可能是周期性的或?qū)嵸|(zhì)上周期性的。另一方面,噪聲信號(hào)通常是不相關(guān)的,并且不是周期性的(以下描述一些異常)。對(duì)周期性的或?qū)嵸|(zhì)上周期性的信號(hào)的自相關(guān)進(jìn)行評(píng)估可能導(dǎo)致比很多噪聲信號(hào)的自相關(guān)要大的值。
向靈敏度調(diào)節(jié)器550a提供由相關(guān)器530a所計(jì)算得的自相關(guān)。在一個(gè)實(shí)施例中, 如果自相關(guān)較小或低于閾值,則揚(yáng)聲器輸入50 極可能是噪聲。因此,靈敏度調(diào)節(jié)器550a 可以減小與以上等式(1)和(3)的噪聲靈敏度控制相對(duì)應(yīng)的噪聲靈敏度控制5(Ma。因此, 噪聲靈敏度控制50 可以調(diào)整話音增強(qiáng)控制器222使用的噪聲閾值和/或輸出增益控制器230使用的麥克風(fēng)增益閾值。因此,話音增強(qiáng)控制器222和/或輸出增益控制器230可以不太積極響應(yīng)環(huán)境噪聲。如果自相關(guān)較大的或者大于閾值(表示揚(yáng)聲器輸入50 可能包括話音),則靈敏度調(diào)節(jié)器550a可以增大噪聲靈敏度控制50如。因此,話音增強(qiáng)控制器 222和/或輸出增益控制器230可以積極地響應(yīng)環(huán)境噪聲。
在特定實(shí)施例中,靈敏度調(diào)節(jié)器550a提供的靈敏度調(diào)整量可以與自相關(guān)的級(jí)別相對(duì)應(yīng)。例如,自相關(guān)越低,靈敏度調(diào)節(jié)器550a就可以使噪聲靈敏度控制50 越小,反之亦然。
在所描述的實(shí)施例中,相關(guān)器530a還向可選的方差模塊MOa提供自相關(guān)值。方差模塊MOa可以計(jì)算或估計(jì)一組自相關(guān)值的方差。方差模塊MOa可以向靈敏度調(diào)節(jié)器 ^Oa提供得到的方差值,靈敏度調(diào)節(jié)器550a可以使用該方差值,以細(xì)化對(duì)噪聲靈敏度控制 504a的調(diào)整。較大的方差值可以反映話音信號(hào)的存在,而較小的方差值則可以反映主要噪聲的存在。因此,靈敏度調(diào)節(jié)器550a可以包括邏輯,以當(dāng)自相關(guān)和方差值都較大時(shí)增大噪聲靈敏度控制50 ,以及當(dāng)自相關(guān)和方差值中的一個(gè)值為小或者兩個(gè)都較小時(shí)減小噪聲靈敏度控制504b。
可以提供用于所示示例噪聲靈敏度控制器52 的多種備選配置。例如,可以省略方差模塊MOa。備選地,相關(guān)器530a可以僅向方差模塊提供值,以及靈敏度調(diào)節(jié)器550a可以只基于方差值來調(diào)整噪聲靈敏度控制504a。此外,相關(guān)器530a可以使用其它統(tǒng)計(jì)措施來分析揚(yáng)聲器輸入502a。例如,相關(guān)器530a可以使用任何歸一化的無(wú)偏估計(jì)器。在一個(gè)實(shí)施例中,相關(guān)器530a通過一組采樣的總功率或能量來歸一化所述相關(guān)。通過功率來歸一化所述相關(guān)可以使得靈敏度調(diào)節(jié)器^Oa基于輸入信號(hào)50 的特性而非基于輸入信號(hào)50 的功率方差來調(diào)整噪聲靈敏度控制5(Ma。
參考圖5B,示例噪聲靈敏度控制器524b包括圖5A的特征中的大多數(shù)特征。然而, 噪聲靈敏度控制器524b接收麥克風(fēng)(“mic”)輸入502b,而非揚(yáng)聲器輸入50 ,其中麥克風(fēng)輸入520b可以包括由麥克風(fēng)接收的一組采樣。對(duì)麥克風(fēng)輸入502b應(yīng)用以上描述的相關(guān)和/或方差技術(shù)可以允許噪聲靈敏度控制器524b在存在揚(yáng)聲器反饋和/或雙講的情況下改善話音可懂度處理。
向能夠提供相同上述自相關(guān)特征的相關(guān)器530b提供麥克風(fēng)輸入502b。在揚(yáng)聲器反饋或雙講的情況下,麥克風(fēng)輸入502b可以包括周期性的或?qū)嵸|(zhì)上周期性的信息。因此, 自相關(guān)函數(shù)可以是周期性的或?qū)嵸|(zhì)上周期性的,以及相關(guān)器530b計(jì)算的自相關(guān)值可以大于許多形式的噪聲的自相關(guān)。
如前,相關(guān)器530b可以向靈敏度調(diào)節(jié)器550b提供自相關(guān)值。如果自相關(guān)值較大或大于閾值,則靈敏度調(diào)節(jié)器^Ob可以減小噪聲靈敏度控制504b,以減小由揚(yáng)聲器反饋和 /或雙講造成的話音增強(qiáng)調(diào)制。類似地,如果自相關(guān)值較小或者小于閾值,則靈敏度調(diào)節(jié)器 550b可以增大噪聲靈敏度控制504b。如上,靈敏度調(diào)節(jié)器550b可以至少部分地基于自相關(guān)的級(jí)別來調(diào)整噪聲靈敏度控制504b的量。
相關(guān)器530b還向可選的方差模塊MOb提供自相關(guān)值。方差模塊MOb可以計(jì)算一組自相關(guān)值的方差或方差的近似值。方差模塊MOb可以向靈敏度調(diào)節(jié)器550b提供得到的方差值,靈敏度調(diào)節(jié)器^Ob可以使用該方差值來細(xì)化對(duì)噪聲靈敏度控制504b的調(diào)整。較大的方差值可以反映話音反饋和/或雙講的存在,而較小的方差值可以主要反映噪聲的存在。因此,當(dāng)方差較大時(shí),靈敏度調(diào)節(jié)器550b還可以減小噪聲靈敏度控制504b,反之亦然。
有益地,方差模塊MOb可以解決具有諧波分量的某些噪聲信號(hào)。一些噪聲信號(hào), 比如由汽車和飛機(jī)產(chǎn)生的這些噪聲信號(hào),具有低頻諧波含量,其可以導(dǎo)致較高的相關(guān)值。 然而,與針對(duì)話音信號(hào)的方差值相比,這些噪聲信號(hào)的自相關(guān)可以具有較低的方差值。因此,靈敏度調(diào)節(jié)器^Ob可以包括邏輯,以當(dāng)自相關(guān)和方差值都較大時(shí)減小噪聲靈敏度控制 504b,以及當(dāng)自相關(guān)和方差值中的一個(gè)值或者兩個(gè)值都較小時(shí),增大噪聲靈敏度控制504b。
在多種實(shí)施例中,以上參考噪聲靈敏度控制器52 描述的備選配置還可以用于修改噪聲靈敏度控制器524b。此外,在備選實(shí)施例中,可以使用聲學(xué)回聲消除器來替代相關(guān)器530b、方差模塊MOb和/或靈敏度調(diào)節(jié)器550b (或者除了相關(guān)器530b、方差模塊MOb 和/或靈敏度調(diào)節(jié)器陽(yáng)此以外還可以使用聲學(xué)回聲消除器)。聲學(xué)回聲消除器可以在麥克風(fēng)輸入502b處減少或消除從揚(yáng)聲器接收到的回聲。例如,可以采用實(shí)現(xiàn)了 1993年3月的 ITU-T建議G. 167中描述的特征的聲學(xué)回聲消除器,因而并入其全部作為參考。然而,有利地,在某些實(shí)施例中,可以利用比聲學(xué)回聲消除器要少的處理資源來實(shí)現(xiàn)本文描述的相關(guān)和/或方差特征。
參考圖5C,噪聲靈敏度控制器52 組合了噪聲靈敏度控制器52 和524b的特征。特別地,噪聲靈敏度控制器52 接收麥克風(fēng)輸入502b和揚(yáng)聲器輸入5(Ma。向相關(guān)器 530a提供揚(yáng)聲器輸入502a,相關(guān)器530a向靈敏度調(diào)節(jié)器550c以及方差模塊MOa提供自相關(guān)值,方差模塊MOa向靈敏度調(diào)節(jié)器550c提供方差值。向相關(guān)器530a提供麥克風(fēng)輸入 502b,相關(guān)器530b向靈敏度調(diào)節(jié)器550c以及方差模塊MOb提供自相關(guān)值,方差模塊MOb 向靈敏度調(diào)節(jié)器^Oc提供方差值。
靈敏度調(diào)節(jié)器550c可以包括邏輯,以至少部分地基于從以下部件中的任何一個(gè)部件接收的信息來調(diào)整噪聲靈敏度控制5(Mc 部件530a、530b、MOa和MOb。在特定實(shí)施例中,靈敏度調(diào)節(jié)器^Oc執(zhí)行軟判定,以調(diào)整噪聲靈敏度控制5(Mc。在圖6中描述了可以由靈敏度調(diào)節(jié)器^Oc執(zhí)行的過程600的一個(gè)示例。在過程600的判定框602,確定是否麥克風(fēng)方差值大于閾值。麥克風(fēng)方差值可以由方差模塊MOb來計(jì)算。如果麥克風(fēng)輸入502b 的自相關(guān)的方差大于閾值,則可能由于語(yǔ)音反饋或雙講而存在周期性的或?qū)嵸|(zhì)上周期性的信號(hào)。因此,在方框604,靈敏度調(diào)節(jié)器550c至少部分地基于來自相關(guān)器530b的相關(guān)值來減小噪聲靈敏度控制,其中相關(guān)值越大,潛在地導(dǎo)致更大的減小。
如果麥克風(fēng)方差小于閾值,則在判定框606處確定是否揚(yáng)聲器方差小于閾值。方差模塊MOa可以根據(jù)揚(yáng)聲器輸入50 的自相關(guān)來計(jì)算揚(yáng)聲器方差值。如果揚(yáng)聲器方差大于等于閾值,則在揚(yáng)聲器輸入信號(hào)50 中可能存在語(yǔ)音信號(hào)。因此,在方框608處,靈敏度調(diào)節(jié)器550c將噪聲靈敏度控制設(shè)置為缺省級(jí)別。
如果揚(yáng)聲器方差小于閾值,則在揚(yáng)聲器輸入50 中可能存在噪聲。因此,靈敏度調(diào)節(jié)器550c至少部分地基于來自相關(guān)器530a的相關(guān)值來減小噪聲靈敏度控制,其中相關(guān)值越小,潛在地導(dǎo)致更大的減小。
過程600示出了靈敏度調(diào)節(jié)器550c的一個(gè)示例實(shí)現(xiàn)方式。在其它實(shí)施例中,可以向過程600中描述的閾值之一或兩個(gè)閾值提供滯后量。在其它實(shí)施例中,在方框604中,將噪聲靈敏度控制設(shè)置為不直接取決于相關(guān)值的特定較小值。同樣地,在方框610中,可以將噪聲靈敏度控制設(shè)置為不取決于相關(guān)值的值。此外,可以使用自相關(guān)和方差以外的其它統(tǒng)計(jì)措施來調(diào)整噪聲靈敏度,包括標(biāo)準(zhǔn)偏差、高階矩、聲學(xué)回聲消除等。多種其它配置也是可能的。
更一般地,以上描述的任何噪聲靈敏度控制器可以被看作是話音、對(duì)話或語(yǔ)音分類器,其檢測(cè)輸入音頻信號(hào)中的一個(gè)或多個(gè)聲音、對(duì)話或語(yǔ)音分量,和/或?qū)斎胍纛l信號(hào)中的一個(gè)或多個(gè)聲音、對(duì)話或語(yǔ)音分量進(jìn)行分類。噪聲靈敏度控制器還可以被看作是話音檢測(cè)器或普通信號(hào)分類器。噪聲靈敏度控制器至少部分地通過使用一個(gè)或多個(gè)處理器來執(zhí)行話音或信號(hào)分類或檢測(cè),以分析輸入音頻信號(hào)的一個(gè)或多個(gè)統(tǒng)計(jì)特征。自相關(guān)和方差、聲學(xué)回聲消除及估計(jì)器僅是噪聲靈敏度控制器可以采用的技術(shù)的示例。包括其它統(tǒng)計(jì)技術(shù)的其它技術(shù)可以用于檢測(cè)輸入信號(hào)的話音或其它分量。
此外,話音反饋和雙講也僅是可以檢測(cè)的聲音分量的示例。以上參考圖5和6描述的噪聲靈敏度控制器的特征可以用于檢測(cè)音頻信號(hào)中的其它話音分量,包括任何媒體內(nèi)容(比如,電視、無(wú)線電、音樂和其它內(nèi)容)中的話音。例如,控制器可以使用媒體內(nèi)容中的音頻的自相關(guān)來檢測(cè)媒體內(nèi)容中的話音分量。在一個(gè)實(shí)施例中,控制器可以向?qū)υ捲鰪?qiáng)提供檢測(cè)到的話音分量,以增大或減小所施加的對(duì)話增強(qiáng)的量,從而使能該對(duì)話增強(qiáng)更有效地增強(qiáng)對(duì)話。
VI.失真控制
話音增強(qiáng)控制器222和/或輸出增益控制器230可以增大施加至話音信號(hào)的一個(gè)或多個(gè)增益。在一些情況下,使增益增大以超過特定點(diǎn)可以導(dǎo)致信號(hào)飽和,這可以造成失真。有利地,在特定實(shí)施例中,以上描述的失真控制模塊240可以提供控制失真,從而提供較大的響度。
圖7示出了更詳細(xì)的失真控制模塊740的實(shí)施例,其可以具有以上描述的失真控制模塊140的所有特征。可以以硬件和/或軟件實(shí)現(xiàn)失真控制模塊740。在特定實(shí)施例中, 失真控制模塊740可以導(dǎo)致音頻信號(hào)中的選定失真,以增大信號(hào)能量,并從而增大響度。該選定失真可以是控制失真,其增加了比全飽和信號(hào)中存在的諧波要少的諧波。
如上所述,失真控制模塊740可以至少部分地通過將輸入采樣映射成輸出采樣來導(dǎo)致選定失真。失真控制模塊740可以通過將輸入信號(hào)702的采樣用作進(jìn)入正弦和(sum-of-sines)表714或表的索引來執(zhí)行這種映射。正弦和表714可以包括將諧波相關(guān)的正弦波求和來產(chǎn)生的值。
舉例說明,如果輸入信號(hào)702具有值為m的采樣,則失真控制模塊740可以將輸入采樣映射到正弦和表714中索引m處的輸出采樣。如果輸入信號(hào)702的采樣落在表714的索引值之間,則失真控制模塊740可以對(duì)索引值進(jìn)行內(nèi)插。使用內(nèi)插可以允許減小正弦和表714的大小,以節(jié)約存儲(chǔ)器。然而,在特定實(shí)施例中,正弦和表714可以被設(shè)計(jì)為足夠大, 以避免使用內(nèi)插。失真控制模塊740可以使用正弦和表714中映射后的輸出值作為針對(duì)輸出信號(hào)722的輸出采樣。
正弦和表714可以被實(shí)現(xiàn)為任何數(shù)據(jù)結(jié)構(gòu),比如數(shù)組、矩陣等。產(chǎn)生表714,以包括任意數(shù)目的諧波正弦波,該任意數(shù)目的諧波正弦波包括奇次諧波、偶次諧波或其結(jié)合。在特定實(shí)施例中,奇次諧波可以提供針對(duì)話音音頻信號(hào)的良好失真控制。偶次諧波可以在其它實(shí)現(xiàn)方式中使用,并且有利于減少音樂信號(hào)中的限幅。奇次諧波或偶次諧波可以用于混合的話音和音樂信號(hào)。然而,這僅是說明性示例,以及奇次諧波或偶次諧波或者兩者可以用于任何應(yīng)用中。
當(dāng)使用更多正弦波來產(chǎn)生表714時(shí),信號(hào)能量和失真方面的潛在增大就越大,反之亦然。因?yàn)槭褂么罅康恼也梢詫?dǎo)致顯著的諧波失真,所以在特定實(shí)施例中,有益地, 使用相對(duì)小數(shù)目的低頻正弦波來構(gòu)建正弦和表714。
例如,可以根據(jù)兩個(gè)或三個(gè)諧波相關(guān)正弦波、四個(gè)正弦波、五個(gè)正弦波、或者更多正弦波之和來構(gòu)建表714。可以在存儲(chǔ)器中存儲(chǔ)多個(gè)正弦和表714,并且可以基于不同的目的而由失真控制模塊740使用。例如,具有多個(gè)諧波的正弦和表714可以用于話音信號(hào),而具有較少諧波的表714可以用于音樂,以構(gòu)建較少的失真。
失真控制模塊740還可以提供用戶接口,該用戶接口向用戶提供失真控制,以調(diào)整信號(hào)能量增大和/或失真的量。例如,可以提供圖形化游標(biāo)、鈕等,或者用戶能夠按壓物理或軟按鈕來調(diào)整所施加的能量增大或失真的量。增大失真控制可以使得能夠使用具有更多諧波的表,反之亦然。
現(xiàn)在使用與三個(gè)奇次諧波相關(guān)正弦波來描述用于產(chǎn)生正弦和表714的示例過程。 在該示例中,可以通過填充具有選定大小的第一表格來產(chǎn)生正弦和表714,其中所述選定大小的第一表格具有一個(gè)正弦波周期的值(例如,從0弧度至2pi)。填充大小為N(N是整數(shù)) 的表格可以包括將一個(gè)正弦波周期劃分成N個(gè)值,以及將該N個(gè)值分配給表格中的N個(gè)空位。該第一正弦波表格可以表示基諧波或一次諧波。
可以以類似的方式(通過將三個(gè)正弦周期劃分為N個(gè)值),利用正弦波的三個(gè)周期來填充與第一表格相同大小的第二表格。第二表格中的值可以表示第一正弦波的三次諧波。類似地,可以利用五個(gè)正弦波周期來填充與前兩個(gè)表格相同大小的第三表格,該第三表格表示五次諧波。可以根據(jù)需要來縮放第一、第二和第三表格中的值。例如,可以縮小第二表格中的值,以使其幅度小于第一表格中那些值的幅度,以及可以縮放第三表格中的值,以包括比第二表格中的值要小的值。
因?yàn)樵谔囟▽?shí)施例中,三個(gè)表格大小相同(例如,具有相同數(shù)目的N個(gè)條目),所以可以將三個(gè)表格的相應(yīng)索引中的值加在一起,以創(chuàng)建新正弦和表714,該新正弦和表714包括一次、三次和五次諧波之和。因此,在特定實(shí)施例中,如果要繪制正弦和表714中的值,則應(yīng)當(dāng)示出經(jīng)求和后的波形的一個(gè)周期的近似圖形。在特定實(shí)施例中,使用的正弦波越多,繪制的這個(gè)波形將越近似于方波。在多種實(shí)施例中,可以以與描述三個(gè)奇次諧波的方式相類似的方式,來構(gòu)建具有不同諧波的其它正弦和表。備選地,可以使用正弦波周期的一些部分而非完整的周期來構(gòu)建正弦和表714。
由于失真控制模塊740將來自輸入信號(hào)702的采樣映射到正弦和表714中,表714 中的諧波頻率可以依賴于表查找速率,表查找速率繼而可以依賴于輸入信號(hào)的頻率。在特定實(shí)施例中,這種頻率依賴性使得失真控制模塊740以與輸入信號(hào)702的頻率相同速率或者以接近該速率的速率執(zhí)行表查找操作。
作為說明,對(duì)于具有給定頻率的簡(jiǎn)單正弦波輸入信號(hào)702,失真控制模塊740可以以相同頻率執(zhí)行映射操作。得到的諧波可以具有取決于正弦波頻率的特定頻率。因此,使正弦波的頻率加倍可以使得諧波頻率加倍。對(duì)于包括多個(gè)疊加頻率的輸入信號(hào)702,由失真控制模塊740執(zhí)行的映射可能導(dǎo)致諧波疊加。
圖8至15示出了失真和正弦波和的示例。作為參考,圖8示出了正弦波802的示例時(shí)域曲線800。示出了在沒有限幅的情況下正弦波802的峰值804。正弦波802的峰值電平804處于Odb處,在一些實(shí)施例中,峰值電平804可以是峰值可能數(shù)字電平。圖9示出了示例曲線900,該示例曲線900示出了圖8的正弦波802的頻譜902。因?yàn)閳D9是正弦曲線,所以代表了一個(gè)頻率。
在特定實(shí)施例中,使正弦波802的幅度增大到超出峰值電平可能導(dǎo)致硬限幅。圖 10的曲線1000中示出了正弦曲線1002的硬限幅。限幅后的正弦曲線1002包括在峰值電平處飽和的限幅部分1004。在圖11中示出的頻域圖示1102中,可以看見限幅后的正弦波 1002的諧波1104的示例。如所示,諧波1104可以擴(kuò)展為與采樣頻率一樣高(在所示示例圖中大約22kHz)。諧波1106的特定部分還是混淆的,從而造成進(jìn)一步的失真。
為了避免硬限幅的完全失真,同時(shí)仍然允許增大音量,如上所述,失真控制模塊 740可以使用較低頻諧波的復(fù)合波。圖12示出了這種波的一組諧波的示例,其包括復(fù)合波的示例頻率響應(yīng)曲線1200,可以響應(yīng)于400Hz的輸入正弦波而產(chǎn)生所述復(fù)合波。與圖11的全限幅情況相比,曲線1200中的頻譜包括較少的諧波1202。在所描述的實(shí)施例中,已經(jīng)產(chǎn)生了五次諧波1202。與圖11的高頻諧波1104相比,最高次諧波1202處于較低頻率下。在該實(shí)施例中不存在混淆諧波1106。
所示示例實(shí)施例包括大約400Hz、1200Hz、2000Hz、^OOHz和3600Hz的諧波。這些諧波1202是奇次諧波1202,其包括一次諧波1204、三次諧波1206、五次諧波1208、七次諧波1210和九次諧波1212。一次諧波1204具有約OdB的幅度,在特定實(shí)施例中,OdB的幅度是最大可能數(shù)字幅度。相繼的諧波1202的幅度隨著頻率的增大而變小。在實(shí)施例中,諧波 1202的幅度單調(diào)遞減。在其它實(shí)施例中,這些幅度可以改變。
由較低頻率諧波提供的控制失真的結(jié)果可以是圓潤(rùn)且更自然的聲音波形,該聲音波形具有較高的信號(hào)能量或者較高的平均信號(hào)能量。圖13示出了波1302的示例時(shí)域曲線 1300,該示例時(shí)域曲線1300示出了映射至圖12的諧波1204上的正弦波。所示示例波1302 具有部分限幅部分1306和部分圓潤(rùn)部分1308。波1302與硬限幅波1002之間的比較結(jié)果, 示出了波1302比硬限幅波1002更圓潤(rùn)。此外,波1302的部分1304是線性的或者近似線性的。彎曲部分1308從限幅部分1306在大約-3dB處開始彎曲。
圖14示出了示例曲線1400,該示例曲線1400描繪了正弦和映射函數(shù)1410的實(shí)施例??梢酝ㄟ^繪制正弦和表(例如上述表714)中的值來繪制所示正弦和映射函數(shù)1410。 正弦和映射函數(shù)1410包括四分之一周期的正弦和波。為了最佳化,可以使用正弦和波的四分之一周期來替代完整波,這將在下文進(jìn)行描述。
在χ軸上繪出了輸入信號(hào)值,其包括范圍在0至1之間的正幅度值。類似地,在y 軸上繪出了輸出信號(hào)值,也包括范圍在0至1之間的幅度值。將在下文描述負(fù)幅度值。當(dāng)失真控制模塊140或740將輸入采樣映射到輸出采樣時(shí),在特定實(shí)施例中,將輸入采樣映射到映射函數(shù)1410上的點(diǎn)。與輸入采樣相比,映射后的輸出采樣可以具有更大或更小的值, 這取決于輸入采樣被映射到了何位置。
為了清楚起見,示出正弦和映射函數(shù)1410作為連續(xù)函數(shù)。然而,當(dāng)在數(shù)字系統(tǒng)中實(shí)現(xiàn)時(shí),映射函數(shù)1410可以是離散的。此外,如上所述,不可能為所有的輸入信號(hào)值定義映射函數(shù)1410。因此,例如,失真控制模塊140或740可以在映射函數(shù)1410上的兩個(gè)最近點(diǎn)之間對(duì)輸出信號(hào)值進(jìn)行內(nèi)插。
作為參考,示出了虛線1420,其與線y = x相對(duì)應(yīng)。如果根據(jù)虛線1420映射輸入采樣,則輸出采樣可以與輸入采樣相同。映射函數(shù)1410包括線性或近似線性的映射區(qū)域 1412以及非線性或近似非線性的映射區(qū)域1414。隨著落在線性映射區(qū)域1412中的輸入采樣值增大,線性映射區(qū)域1412中的相應(yīng)輸出采樣也線性地或?qū)嵸|(zhì)上線性地增大。落在非線性區(qū)域1414中的某些輸入采樣值非線性地或?qū)嵸|(zhì)上非線性地增大,具有變化的增大級(jí)別。
映射函數(shù)1410的大多數(shù)值大于虛線1420的值,使得大多數(shù)輸入采樣可以被映射到更大的值。然而,在非線性映射區(qū)域1414的區(qū)域1416中,映射函數(shù)1410的值小于或者等于虛線1420的值。在該區(qū)域1416,輸入采樣被映射到了更小的值。因此,例如,可以減小硬限幅采樣的值(例如,具有1. 0或近似1. 0的值)。
如上所述,映射函數(shù)1410包括正弦和波的四分之一,而非完整的波。使用四分之一的波(或者甚至是二分之一波)可以使得能夠減小正弦和表714的大小,從而節(jié)約存儲(chǔ)器。對(duì)于負(fù)輸入信號(hào)值,(例如,在范圍[_1,0]之間等),失真控制模塊140、740可以反轉(zhuǎn) χ軸上的映射函數(shù)1410,并且顛倒y軸上的映射函數(shù)1410。此后,失真控制模塊140、740可以將映射函數(shù)1410應(yīng)用到輸入采樣上。備選地,可以反轉(zhuǎn)負(fù)值,并將其歸一化到范圍
。然后,可以應(yīng)用映射函數(shù)1410,并且可以將得到的輸出采樣求反,以恢復(fù)到負(fù)值。
在備選實(shí)施例中,例如,根據(jù)用于產(chǎn)生正弦和表714的諧波的數(shù)目,所示函數(shù)1410 可以看起來不同。例如,線性映射區(qū)域1412可以具有更大或更小的斜率。非線性映射區(qū)域 1414可以是不同的形狀;例如,可以具有更少的峰值。同樣地,區(qū)域1416可以在幅度上更小或更大。
在特定實(shí)施例中,χ軸和/或y軸的范圍可以不同于上述范圍W,l]。將Χ軸的范圍縮減到
可以增大至少一部分輸入信號(hào)的放大率,其中a小于1。反之,將χ軸范圍增大到
可以減小至少一部分輸入信號(hào)的放大率,其中b大于1。有益地,在一些實(shí)施例中,使用大于1的b值可以減少限幅。類似地,可以將y軸改變?yōu)?br>
,其中c小于或大于1。
圖15示出了在施加失真控制之前的音頻信號(hào)1512的示例時(shí)域圖示的曲線1500。 此外,圖15示出了施加了失真控制之后相同音頻信號(hào)1514的示例時(shí)域圖示。使用失真控制的示例實(shí)現(xiàn)將近似6dB的附加增益引入到了該波形中。
失真控制可以用于其它應(yīng)用中,例如,失真控制可以用于增大低音音量,而減小失真。失真控制還可以被用于頻率展開應(yīng)用中。此外,例如,失真控制還可以用于通過選擇多種諧波創(chuàng)建期望的樂器音質(zhì),來合成樂器聲音或其它聲音。
VII.結(jié)論
根據(jù)實(shí)施例,這里描述的任何算法的特定動(dòng)作、事件或功能可以以不同順序來執(zhí)行,可以添加、合并或一起省去(例如,不是所有所描述的動(dòng)作或事件對(duì)于算法的實(shí)行是必需的)。此外,在特定實(shí)施例中,例如可以通過多線程處理、中斷處理或多處理器或處理器核來同時(shí)執(zhí)行動(dòng)作或事件,而非順序執(zhí)行。
結(jié)合這里所公開的實(shí)施例描述的各個(gè)示意邏輯塊、模塊和算法步驟可以實(shí)現(xiàn)為電子硬件、計(jì)算機(jī)軟件或二者的組合。為了清楚示意硬件和軟件的可互換性,上述通常在它們的功能方面描述了各個(gè)示意組件、塊、模塊和步驟。將這種功能實(shí)現(xiàn)為硬件或軟件取決于特定應(yīng)用并設(shè)計(jì)施加于總體系統(tǒng)的約束。針對(duì)每個(gè)特定應(yīng)用,可以以變化的方式來實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)方式的決定不應(yīng)當(dāng)解釋為導(dǎo)致對(duì)本公開范圍的背離。
可以利用通用處理器、數(shù)字信號(hào)處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場(chǎng)可編程門陣列(FPGA)或其他可編程邏輯器件、離散門或晶體管邏輯、離散硬件組件、或其任何組合(被設(shè)計(jì)為執(zhí)行這里描述功能),來實(shí)現(xiàn)或執(zhí)行結(jié)合這里公開的實(shí)施例而描述的各個(gè)示意邏輯塊和模塊。通用處理器可以是微處理器,但可選地,該處理器可以是處理器、控制器、 微控制器或狀態(tài)機(jī)及其組合等。處理器還可以實(shí)現(xiàn)為計(jì)算設(shè)備的組合(例如,DSP和微處理器的組合)、多個(gè)微處理器、與DSP內(nèi)核結(jié)合的一個(gè)或多個(gè)微處理器、或任何其他的這種配置。
結(jié)合這里公開的實(shí)施例描述的方法或算法的步驟可以直接以硬件、由處理器執(zhí)行的軟件模塊或二者的組合的形式來實(shí)現(xiàn)。軟件模塊可以駐留在RAM存儲(chǔ)器、閃存存儲(chǔ)器、 ROM存儲(chǔ)器、EPROM存儲(chǔ)器、EEPROM存儲(chǔ)器、寄存器、硬盤、可拆卸盤、CD-ROM或本領(lǐng)域已知的任何其他形式的存儲(chǔ)介質(zhì)中。示例性存儲(chǔ)介質(zhì)可以耦合至處理器,使得處理器可以從存儲(chǔ)介質(zhì)讀取信息,并向存儲(chǔ)介質(zhì)寫入信息??蛇x地,存儲(chǔ)介質(zhì)可以與處理器集成。處理器和存儲(chǔ)介質(zhì)可以駐留在ASIC中。ASIC可以駐留在用戶終端中??蛇x地,處理器和存儲(chǔ)介質(zhì)可以作為分立組件駐留在用戶終端中。
除非另有聲明否則將在所使用的上下文理解,這里使用的諸如“可以”、“例如”等之類的條件性語(yǔ)言通常傾向于覆蓋特定的實(shí)施例包括而其他實(shí)施例不包括的特定特征、元素和/或狀態(tài)。因此,這種條件性語(yǔ)言通常不傾向于暗示對(duì)于一個(gè)或多個(gè)實(shí)施例按照任意方式要求所述特征、元素和/或狀態(tài),或者一個(gè)或多個(gè)實(shí)施例需要包括利用作者的輸入或提示包括來決定是否在任意具體的實(shí)施例中要包括或執(zhí)行這些特征、元素和/或狀態(tài)的邏輯。
盡管上述詳細(xì)描述已示出、描述并指出了應(yīng)用于各個(gè)實(shí)施例的新穎特征,但將理解,在不背離本公開的精神的前提下,可以對(duì)所示設(shè)備或算法的形式和細(xì)節(jié)進(jìn)行各種省略、 替換和改變。將認(rèn)識(shí)到,由于一些特征可以與其他特征分離地使用或?qū)崿F(xiàn),因此這里描述的本發(fā)明的特定實(shí)施例可以以不能提供這里所述的所有特征和優(yōu)點(diǎn)的形式來實(shí)現(xiàn)。這里公開的本發(fā)明的范圍由所附權(quán)利要求而不是由上述描述來指示。在權(quán)利要求的等同意義和范圍內(nèi)的所有改變應(yīng)包括在其范圍內(nèi)。
權(quán)利要求
1.一種用于自動(dòng)調(diào)整施加至音頻信號(hào)的話音可懂度增強(qiáng)的系統(tǒng),所述系統(tǒng)包括增強(qiáng)模塊,被配置為接收包括共振峰的輸入話音信號(hào),以及對(duì)輸入話音信號(hào)施加音頻增強(qiáng),以提供增強(qiáng)話音信號(hào),所述音頻增強(qiáng)被配置為加強(qiáng)輸入話音信號(hào)中的一個(gè)或多個(gè)共振峰;增強(qiáng)控制器,包括一個(gè)或多個(gè)處理器,所述增強(qiáng)控制器被配置為至少部分地基于檢測(cè)到的環(huán)境噪聲的量來調(diào)整由所述增強(qiáng)模塊施加的音頻增強(qiáng)的量;輸出增益控制器被配置為至少部分地基于環(huán)境噪聲的量和輸入話音信號(hào),來調(diào)整增強(qiáng)話音信號(hào)的總增益,以及向增強(qiáng)話音信號(hào)施加所述總增益,以產(chǎn)生放大話音信號(hào);以及失真控制模塊,被配置為通過至少將放大話音信號(hào)的一個(gè)或多個(gè)采樣映射到在正弦和表中存儲(chǔ)的一個(gè)或多個(gè)值來減小放大話音信號(hào)中的限幅,其中所述正弦和表是根據(jù)較低次正弦諧波之和來產(chǎn)生。
2.如權(quán)利要求1所述的系統(tǒng),其中,所述增強(qiáng)模塊還操作于通過對(duì)輸入話音信號(hào)的頻率子帶施加增益來加強(qiáng)所述一個(gè)或多個(gè)共振峰。
3.—種調(diào)整話音可懂度增強(qiáng)的方法,所述方法包括接收話音信號(hào)以及包括近端環(huán)境含量的輸入信號(hào);利用一個(gè)或多個(gè)處理器計(jì)算輸入信號(hào)中的近端環(huán)境含量;利用所述一個(gè)或多個(gè)處理器,至少部分地基于近端環(huán)境含量來調(diào)整話音增強(qiáng)的級(jí)別;以及對(duì)所述話音信號(hào)施加所述話音增強(qiáng),以產(chǎn)生增強(qiáng)話音信號(hào),所述話音增強(qiáng)被配置為加強(qiáng)所述話音信號(hào)的一個(gè)或多個(gè)共振峰。
4.如權(quán)利要求3所述的方法,其中所述計(jì)算包括獲得所述近端環(huán)境含量的幅度,以及平滑所述近端環(huán)境含量的幅度。
5.如權(quán)利要求3所述的方法,其中所述利用一個(gè)或多個(gè)處理器調(diào)整話音增強(qiáng)的級(jí)別包括當(dāng)所述近端環(huán)境含量在閾值之上時(shí),跟隨近端環(huán)境含量。
6.如權(quán)利要求5所述的方法,其中至少部分地基于用戶可調(diào)整噪聲靈敏度級(jí)別來確定閾值。
7.如權(quán)利要求3所述的方法,還包括至少部分地基于近端環(huán)境含量和話音信號(hào)中的能量總量,調(diào)整增強(qiáng)話音信號(hào)的總增益。
8.如權(quán)利要求7所述的方法,其中所述調(diào)整總增益包括計(jì)算與近端環(huán)境含量成比例的增益級(jí)別。
9.如權(quán)利要求3所述的方法,還包括將增強(qiáng)話音信號(hào)的一個(gè)或多個(gè)采樣映射到正弦和表中存儲(chǔ)的一個(gè)或多個(gè)值,以減小增強(qiáng)話音信號(hào)中的限幅。
10.一種用于自動(dòng)調(diào)整施加至音頻信號(hào)的話音可懂度增強(qiáng)的系統(tǒng),所述系統(tǒng)包括增強(qiáng)模塊,被配置為接收包括共振峰的輸入話音信號(hào),并且對(duì)輸入話音信號(hào)施加音頻增強(qiáng),以提供增強(qiáng)話音信號(hào),所述音頻增強(qiáng)被配置為加強(qiáng)輸入話音信號(hào)中的一個(gè)或多個(gè)共振峰;增強(qiáng)控制器,包括一個(gè)或多個(gè)處理器,所述增強(qiáng)控制器被配置為至少部分地基于檢測(cè)到的環(huán)境噪聲的量來調(diào)整由增強(qiáng)模塊施加的音頻增強(qiáng)的量;以及輸出增益控制器被配置為至少部分地基于環(huán)境噪聲的量和輸入話音信號(hào)來調(diào)整增強(qiáng)話音信號(hào)的總增益,以及向所述增強(qiáng)話音信號(hào)施加所述總增益,以產(chǎn)生放大話音信號(hào)。
11.如權(quán)利要求10所述的系統(tǒng),其中,增強(qiáng)控制器還被配置為至少部分地基于環(huán)境噪聲的量與閾值的比值來調(diào)整所施加的環(huán)境增強(qiáng)的量。
12.如權(quán)利要求10所述的系統(tǒng),其中,增強(qiáng)模塊還操作用于通過對(duì)輸入話音信號(hào)的頻率子帶施加增益來加強(qiáng)一個(gè)或多個(gè)共振峰。
13.如權(quán)利要求12所述的系統(tǒng),其中,增強(qiáng)控制器還被配置為通過至少對(duì)輸入話音信號(hào)的頻率子帶施加附加增益來調(diào)整所施加的音頻增強(qiáng)的量。
14.如權(quán)利要求10所述的系統(tǒng),其中,輸出增益控制器還被配置為通過提供與環(huán)境噪聲的量成比例的增益級(jí)別來調(diào)整總增益。
15.如權(quán)利要求10所述的系統(tǒng),其中,輸出增益控制器被配置為響應(yīng)于閾值之下的話音信號(hào)的能量,來調(diào)整總增益。
16.如權(quán)利要求10所述的系統(tǒng),還包括失真控制模塊,用于減少放大話音信號(hào)中的限幅。
17.—種處理器可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有使得一個(gè)或多個(gè)處理器執(zhí)行調(diào)整話音可懂度增強(qiáng)的方法的指令,所述方法包括接收來自遠(yuǎn)程電話的話音信號(hào)和來自麥克風(fēng)的噪聲信號(hào); 計(jì)算噪聲信號(hào)的值;至少部分地基于噪聲信號(hào)的值,調(diào)整施加至話音信號(hào)的共振峰的增益;以及對(duì)話音信號(hào)的共振峰施加增益。
18.如權(quán)利要求17所述的處理器可讀存儲(chǔ)介質(zhì),還包括至少部分地基于話音信號(hào)的能量總量來調(diào)整話音信號(hào)的總增益。
19.如權(quán)利要求18所述的處理器可讀存儲(chǔ)介質(zhì),其中,響應(yīng)于閾值以下的話音信號(hào)的能量,來調(diào)整總增益。
20.一種用于調(diào)整話音可懂度增強(qiáng)的噪聲閾值的系統(tǒng),所述系統(tǒng)包括話音增強(qiáng)模塊,被配置為利用接收設(shè)備接收來自遠(yuǎn)程設(shè)備的輸入話音信號(hào),并且對(duì)輸入話音信號(hào)施加音頻增強(qiáng),以加強(qiáng)輸入話音信號(hào)中的一個(gè)或多個(gè)共振峰;話音增強(qiáng)控制器,包括一個(gè)或多個(gè)處理器,所述話音增強(qiáng)控制器被配置為至少部分地基于第一噪聲閾值以上的檢測(cè)到的環(huán)境噪聲的量,來調(diào)整由所述增強(qiáng)模塊施加的音頻增強(qiáng)的量;以及噪聲靈敏度控制器,被配置為調(diào)整所述第一噪聲閾值,所述噪聲靈敏度控制器包括 第一相關(guān)器,被配置為根據(jù)從接收設(shè)備的麥克風(fēng)接收的麥克風(fēng)輸入信號(hào)來計(jì)算第一自相關(guān)值;第一方差模塊,操作用于計(jì)算所述第一自相關(guān)值的第一方差; 第二相關(guān)器,被配置為根據(jù)揚(yáng)聲器輸入信號(hào)計(jì)算第二自相關(guān)值,其中所述揚(yáng)聲器輸入信號(hào)包括話音增強(qiáng)模塊的輸出信號(hào);第二方差模塊,操作用于計(jì)算所述第二自相關(guān)值的第二方差;以及噪聲靈敏度調(diào)節(jié)器,被配置為使用第一和第二自相關(guān)值和第一和第二方差值中的一個(gè)或多個(gè)來調(diào)整第一噪聲閾值,以產(chǎn)生第二噪聲閾值,其中,話音增強(qiáng)控制器被配置為至少部分地基于第二噪聲閾值以上的檢測(cè)到的環(huán)境噪聲的第二量,來調(diào)整施加至第二輸入音頻信號(hào)的音頻增強(qiáng)的量。
21.如權(quán)利要求20所述的系統(tǒng),其中,所述噪聲靈敏度調(diào)節(jié)器還被配置為響應(yīng)于預(yù)定量以上的第一方差,來產(chǎn)生小于第一噪聲閾值的第二噪聲閾值。
22.如權(quán)利要求21所述的系統(tǒng),其中,所述噪聲靈敏度調(diào)節(jié)器還被配置為至少部分地基于第一自相關(guān)值中的一個(gè)或多個(gè),來減小第二噪聲閾值。
23.如權(quán)利要求21所述的系統(tǒng),其中,所述噪聲靈敏度調(diào)節(jié)器還被配置為針對(duì)較大的第一自相關(guān)值,提供對(duì)第二噪聲閾值的更大減小。
24.如權(quán)利要求23所述的系統(tǒng),其中,所述噪聲靈敏度調(diào)節(jié)器還被配置為至少部分地基于所述第二自相關(guān)值中的一個(gè)或多個(gè),減小所述第二噪聲閾值。
25.如權(quán)利要求21所述的系統(tǒng),其中,所述噪聲靈敏度調(diào)節(jié)器還被配置為對(duì)于較小的第二自相關(guān)值,提供對(duì)第二噪聲閾值的更大減小。
26.如權(quán)利要求20所述的系統(tǒng),其中,所述噪聲靈敏度調(diào)節(jié)器還被配置為響應(yīng)于小于預(yù)定量的第二方差,來產(chǎn)生小于所述第一噪聲閾值的第二噪聲閾值。
27.一種用于調(diào)整話音可懂度增強(qiáng)的靈敏度的系統(tǒng),所述系統(tǒng)包括話音增強(qiáng)模塊,被配置為利用接收設(shè)備來接收接收設(shè)備從遠(yuǎn)程設(shè)備處接收到的輸入話音信號(hào),并且向輸入話音信號(hào)施加音頻增強(qiáng),以加強(qiáng)輸入話音信號(hào)中的一個(gè)或多個(gè)共振峰;增強(qiáng)控制器,被配置為至少部分地基于輸入話音信號(hào)中存在的環(huán)境噪聲的量來調(diào)整由話音增強(qiáng)模塊施加的音頻增強(qiáng)的量;以及噪聲靈敏度控制器,包括一個(gè)或多個(gè)處理器,被配置為至少部分地基于從接收設(shè)備的麥克風(fēng)獲得的麥克風(fēng)輸入信號(hào)和作為話音增強(qiáng)模塊的輸出信號(hào)提供的揚(yáng)聲器輸入信號(hào)中的至少一個(gè)信號(hào)或者兩者的統(tǒng)計(jì)分析,來調(diào)整增強(qiáng)控制器對(duì)環(huán)境噪聲的靈敏度。
28.如權(quán)利要求27所述的系統(tǒng),其中,所述噪聲靈敏度控制器包括相關(guān)器,被配置為計(jì)算麥克風(fēng)輸入信號(hào)和揚(yáng)聲器輸入信號(hào)中的一個(gè)或者兩個(gè)的自相關(guān)。
29.如權(quán)利要求觀所述的系統(tǒng),其中,所述噪聲靈敏度控制器還包括方差模塊,被配置為估計(jì)自相關(guān)的方差。
30.如權(quán)利要求觀所述的系統(tǒng),其中,所述噪聲靈敏度控制器還包括靈敏度調(diào)節(jié)器, 被配置為至少部分地基于計(jì)算的自相關(guān),來調(diào)整增強(qiáng)控制器對(duì)環(huán)境噪聲的靈敏度。
31.如權(quán)利要求觀所述的系統(tǒng),其中,所述噪聲靈敏度控制器還包括靈敏度調(diào)節(jié)器, 被配置為至少部分地基于估計(jì)的方差,來調(diào)整增強(qiáng)控制器對(duì)環(huán)境噪聲的靈敏度。
32.一種用于調(diào)整話音增強(qiáng)的靈敏度的方法,所述方法包括接收輸入音頻信號(hào);檢測(cè)輸入音頻信號(hào)中的相關(guān)含量,所述檢測(cè)包括使用一個(gè)或多個(gè)處理器來計(jì)算輸入視頻信號(hào)的統(tǒng)計(jì)分析;以及響應(yīng)于所述檢測(cè),調(diào)整施加至輸入音頻信號(hào)的增強(qiáng)級(jí)別。
33.如權(quán)利要求32所述的方法,其中,所述計(jì)算輸入音頻信號(hào)的統(tǒng)計(jì)信息包括計(jì)算輸入音頻信號(hào)的自相關(guān)。
34.如權(quán)利要求33所述的方法,其中,所述檢測(cè)還包括計(jì)算自相關(guān)的方差。
35.如權(quán)利要求32所述的方法,其中,所述調(diào)整包括增大施加至輸入音頻信號(hào)的增強(qiáng)級(jí)別。
36.如權(quán)利要求32所述的方法,其中,所述增強(qiáng)包括對(duì)話增強(qiáng)。
37.如權(quán)利要求32所述的系統(tǒng),其中,所述統(tǒng)計(jì)分析包括聲學(xué)回聲消除。
38.一種音頻信號(hào)處理方法,所述方法包括接收麥克風(fēng)輸入信號(hào);檢測(cè)麥克風(fēng)輸入信號(hào)中的實(shí)質(zhì)上周期性含量;利用一個(gè)或多個(gè)處理器,至少部分地基于在麥克風(fēng)輸入信號(hào)中檢測(cè)到的實(shí)質(zhì)上周期性含量來調(diào)整音頻增強(qiáng);所述音頻增強(qiáng)被配置為至少部分地基于麥克風(fēng)輸入信號(hào)的級(jí)別來選擇性地增強(qiáng)音頻輸出信號(hào);以及向揚(yáng)聲器提供所述音頻輸出信號(hào)。
39.如權(quán)利要求38所述的方法,其中,所述實(shí)質(zhì)上周期性含量包括來自揚(yáng)聲器的回聲。
40.如權(quán)利要求38所述的方法,其中,所述實(shí)質(zhì)上周期性含量包括來自通信設(shè)備的收聽者的話音,所述通信設(shè)備被配置為實(shí)現(xiàn)所述音頻信號(hào)處理方法。
41.如權(quán)利要求38所述的方法,其中,所述麥克風(fēng)輸入信號(hào)包括近端環(huán)境含量。
42.如權(quán)利要求38所述的方法,其中,所述檢測(cè)實(shí)質(zhì)上周期性含量包括使用一種或多種統(tǒng)計(jì)技術(shù)來檢測(cè)所述實(shí)質(zhì)上周期性含量。
43.如權(quán)利要求38所述的方法,其中,所述調(diào)整包括調(diào)整音頻增強(qiáng)對(duì)麥克風(fēng)輸入信號(hào)的級(jí)別的靈敏度。
44.如權(quán)利要求38所述的方法,其中,所述調(diào)整包括關(guān)斷所述音頻增強(qiáng)。
45.如權(quán)利要求38所述的方法,其中,所述音頻增強(qiáng)包括話音可懂度增強(qiáng)。
46.如權(quán)利要求38所述的方法,其中,在通信設(shè)備中實(shí)現(xiàn)所述音頻信號(hào)處理方法。
全文摘要
自適應(yīng)音頻系統(tǒng)可以在通信設(shè)備中實(shí)現(xiàn)。自適應(yīng)音頻系統(tǒng)可以增強(qiáng)由通信設(shè)備接收的音頻信號(hào)中的話音,以提高話音的可懂度。音頻系統(tǒng)可以至少部分地基于由通信設(shè)備接收的環(huán)境含量(例如,噪聲)的級(jí)別來調(diào)整音頻增強(qiáng)。例如,對(duì)于更高的環(huán)境含量級(jí)別,該音頻系統(tǒng)可以更強(qiáng)地施加音頻增強(qiáng)。此外,該自適應(yīng)音頻系統(tǒng)可以檢測(cè)環(huán)境含量中的實(shí)質(zhì)上周期性含量。自適應(yīng)音頻系統(tǒng)還可以響應(yīng)于環(huán)境含量來調(diào)整音頻增強(qiáng)。
文檔編號(hào)G06F15/16GK102498482SQ200980161425
公開日2012年6月13日 申請(qǐng)日期2009年9月14日 優(yōu)先權(quán)日2009年9月14日
發(fā)明者何星, 楊鈞, 理查德·J·奧利弗, 詹姆斯·特雷西 申請(qǐng)人:Srs實(shí)驗(yàn)室有限公司