亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種音量控制方法和系統(tǒng)的制作方法

文檔序號(hào):7614534閱讀:199來(lái)源:國(guó)知局
專利名稱:一種音量控制方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音通信技術(shù),尤其涉及一種語(yǔ)音通信中的音量自動(dòng)增益控制方法和系統(tǒng)。
背景技術(shù)
目前,用于解決聲道音量控制所普遍采用的自動(dòng)增益控制(AGC)方法的核心思想是將語(yǔ)音流分成固定大小的處理塊(block),每個(gè)處理塊包含若干個(gè)樣本點(diǎn)量化振幅值數(shù)據(jù)。通過(guò)當(dāng)前音量的高低,以某種算法,為每個(gè)處理塊計(jì)算出一個(gè)放大倍數(shù)(Gain),然后將這個(gè)放大倍數(shù)乘于每個(gè)樣本點(diǎn)的音量振幅值,作為輸出。
音量的自動(dòng)增益控制(AGC)目前用于數(shù)字式擴(kuò)音電話。此類數(shù)字式擴(kuò)音電話一般包括一個(gè)擴(kuò)音器,從遠(yuǎn)處及當(dāng)?shù)赜脩裟抢锓謩e接收輸入及輸出信號(hào),并相應(yīng)產(chǎn)生和比較輸入和輸出包絡(luò)信號(hào)及底噪聲信號(hào)電平并抑制輸入或輸出信號(hào)中的一個(gè),實(shí)現(xiàn)輸出信號(hào)的自動(dòng)增益控制(AGC)以允許其平滑轉(zhuǎn)接并抑制由送話器傳輸?shù)谋尘霸肼暋O嚓P(guān)技術(shù)參見中國(guó)專利85108662。
在數(shù)字信號(hào)處理中,目前也使用數(shù)字信號(hào)處理器中的自動(dòng)增益控制(AGC)方法。該方法首先建立一個(gè)預(yù)定的門檻值,一個(gè)預(yù)定的自動(dòng)增益控制值及一個(gè)預(yù)定的計(jì)數(shù)門檻值,并存入與信號(hào)處理器相聯(lián)的數(shù)據(jù)存貯器中。將每個(gè)輸入信號(hào)的樣值乘以自動(dòng)增益控制(AGC)值,并將乘積存入該數(shù)據(jù)存貯器。取該乘積的絕對(duì)值,并將其與該預(yù)定的門檻值相加。如運(yùn)算結(jié)果使信號(hào)處理器溢出,則AGC值減小,并存回該數(shù)據(jù)存貯器。相關(guān)技術(shù)參見中國(guó)專利86106498。
現(xiàn)有技術(shù)的缺點(diǎn)是,首先,現(xiàn)有的AGC方法中缺少一種在靜音期間有效的增益處理。當(dāng)發(fā)送端不說(shuō)話時(shí),在接收端收到的樣本點(diǎn)的音量振幅值很低,稱之為靜音期間,這時(shí)根據(jù)現(xiàn)有AGC方法所計(jì)算出的自動(dòng)增益值將很大,即需要放大很大的倍數(shù),最終導(dǎo)致發(fā)送端的背景噪聲被大幅度放大,而且在接收端還會(huì)出現(xiàn)嘈雜聲和嘯叫聲。
其次現(xiàn)有的方法在計(jì)算自動(dòng)增益值時(shí)都是普遍存在只增不減的現(xiàn)象。即對(duì)小音量樣本的放大效果顯著,但對(duì)大音量樣本的限制效果不明顯。

發(fā)明內(nèi)容
本發(fā)明目的在于提供一種語(yǔ)音通信中的區(qū)分音量狀態(tài)的音量自動(dòng)增益控制方法和系統(tǒng),以解決現(xiàn)有技術(shù)中在靜音期間背景噪聲被大幅度放大,出現(xiàn)嘈雜和嘯叫聲的問(wèn)題,并解決現(xiàn)有技術(shù)的自動(dòng)增益音量控制中對(duì)高音量狀態(tài)的語(yǔ)音流音量只增不減,導(dǎo)致音量過(guò)大的問(wèn)題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供了以下技術(shù)方案一種自動(dòng)增益音量控制方法,其特征在于包括以下步驟a)定義語(yǔ)音流音量狀態(tài);b)采集語(yǔ)音流,并將其處理成相同大小的若干個(gè)處理塊;c)判斷語(yǔ)音流的音量狀態(tài);d)根據(jù)步驟c)中判斷結(jié)果、對(duì)語(yǔ)音流進(jìn)行相應(yīng)的音量自動(dòng)增益調(diào)整;e)輸出經(jīng)過(guò)音量調(diào)整的語(yǔ)音流。
較佳地,所述的音量控制方法中所述步驟a)中的音量狀態(tài)包括靜音狀態(tài)高、音量狀態(tài)和正常音量狀態(tài)。
較佳地,所述的音量控制方法中所述步驟b)中的每個(gè)處理塊包含若干個(gè)音量樣本點(diǎn)。
較佳地,所述的音量控制方法,其特征在于測(cè)量當(dāng)前處理塊的最大音量值和平均音量值。
較佳地,所述的音量控制方法,其特征在于,所述的當(dāng)前處理塊最大音量值為該處理塊中音量最大的樣本點(diǎn)的音量,所述的當(dāng)前處理塊平均音量值為當(dāng)前處理塊中所有樣本點(diǎn)的音量的平均值。
較佳地,所述的音量控制方法,其特征在于所述步驟c)包括c1)設(shè)置一個(gè)靜音門檻值,一個(gè)靜音持續(xù)長(zhǎng)度值和一個(gè)高音量門檻值;
c2)在連續(xù)的靜音持續(xù)長(zhǎng)度值所代表的時(shí)間內(nèi)比較所述的靜音門檻值和所述的當(dāng)前處理塊最大音量值;c3)當(dāng)所述的靜音門檻值在連續(xù)的靜音持續(xù)長(zhǎng)度值所代表的時(shí)間內(nèi)大于當(dāng)前處理塊最大音量值時(shí),判定語(yǔ)音流處于靜音狀態(tài);c4)當(dāng)所述的靜音門檻值在連續(xù)的靜音持續(xù)長(zhǎng)度值所代表的時(shí)間內(nèi)小于當(dāng)前處理塊最大音量值,則比較所述的高音量門檻值和所述的平均音量值;如果所述的高音量門檻值小于所述的平均音量值,則判定語(yǔ)音流處于高音量狀態(tài);如果所述的高音量門檻值大于所述的平均音量值,則判定語(yǔ)音流處于正常音量狀態(tài)。
較佳地,所述的音量控制方法,其特征在于步驟d)中所述的根據(jù)步驟c)中判斷結(jié)果對(duì)語(yǔ)音流進(jìn)行相應(yīng)的音量自動(dòng)增益調(diào)整包括當(dāng)語(yǔ)音流處于正常音量狀態(tài)時(shí),對(duì)語(yǔ)音流進(jìn)行自動(dòng)增益調(diào)整,作為語(yǔ)音流的輸出音量。
較佳地,所述的音量控制方法,其特征在于步驟d)中所述的根據(jù)步驟c)中判斷結(jié)果對(duì)語(yǔ)音流進(jìn)行相應(yīng)的音量自動(dòng)增益調(diào)整包括當(dāng)語(yǔ)音流處于靜音狀態(tài)時(shí),具體調(diào)整方法包括以下步驟d1)獲取靜音前的最后一個(gè)處理塊的自動(dòng)增益值Gain;d2)比較靜音前處理塊自動(dòng)增益值Gain與1,當(dāng)Gain大于1時(shí),逐漸縮小自動(dòng)增益值,使其趨近1;當(dāng)Gain小于1時(shí),逐漸增大自動(dòng)增益值,使其趨近1;當(dāng)Gain等于1時(shí),則保持自動(dòng)增益值Gain不變。
較佳地,所述的音量控制方法,其特征在于逐漸縮小自動(dòng)增益值的每次縮小幅度相同和逐漸增大自動(dòng)增益值的每次增大幅度相同。
較佳地,所述的音量控制方法,其特征在于步驟d)中所述的根據(jù)步驟c)中判斷結(jié)果對(duì)語(yǔ)音流進(jìn)行相應(yīng)的音量自動(dòng)增益調(diào)整包括當(dāng)語(yǔ)音流處于高音量狀態(tài)時(shí),下調(diào)自動(dòng)增益值,以減小音量。
較佳地,所述的音量控制方法,其特征在于下調(diào)自動(dòng)增益值的幅度為所述高音量門檻值與所述平均音量值的比值。
本發(fā)明還提供了一種音量控制系統(tǒng),包括通過(guò)網(wǎng)絡(luò)互相連接的語(yǔ)音流發(fā)送端,語(yǔ)音流接收端和語(yǔ)音服務(wù)器,其特征在于還包括用于在接收端播放語(yǔ)音流前調(diào)整音量的音量控制器。
較佳地,所述的音量控制系統(tǒng),其特征在于所述的音量控制器包括用于從所述語(yǔ)音流發(fā)送端采集并保存語(yǔ)音流的語(yǔ)音流輸入模快,用于對(duì)所保存語(yǔ)音流進(jìn)行預(yù)處理的語(yǔ)音流處理模塊,用于判斷語(yǔ)音流的音量狀態(tài)的音量狀態(tài)判斷模塊,用于調(diào)整語(yǔ)音流音量的音量調(diào)整模塊和用于輸出經(jīng)過(guò)音量調(diào)整的語(yǔ)音流給語(yǔ)音流接收端的語(yǔ)音流輸出模塊。
較佳地,所述的音量控制系統(tǒng),其特征在于所述的音量控制器可在發(fā)送端或接收端,也可在語(yǔ)音服務(wù)器端。
較佳地,所述的音量控制系統(tǒng),其特征在于所述的語(yǔ)音流發(fā)送端和語(yǔ)音流接收端是運(yùn)行視頻會(huì)議程序語(yǔ)音通訊程序、或其他包含語(yǔ)音通訊模塊的客戶端程序的計(jì)算機(jī)。
較佳地,所述的音量控制系統(tǒng),其特征在于所述的語(yǔ)音流發(fā)送端和語(yǔ)音流接收端可以是數(shù)字電話,移動(dòng)電話和PDA等語(yǔ)音通訊設(shè)備。
較佳地,所述的音量控制系統(tǒng),其特征在于系統(tǒng)通過(guò)對(duì)多個(gè)所述的語(yǔ)音流發(fā)送端的音量都進(jìn)行控制,使所述的多個(gè)語(yǔ)音流發(fā)送端在所述的語(yǔ)音流接收端的輸出音量一致,達(dá)到多聲道平衡。
本發(fā)明還提供了一種音量自動(dòng)增益控制中的靜音控制方法,其特征在于包括以下步驟設(shè)定一個(gè)靜音門檻值和一個(gè)靜音持續(xù)長(zhǎng)度值;采集語(yǔ)音流,并將其保存成相同大小的若干個(gè)處理塊,并測(cè)量每個(gè)處理塊的最高音量值;在連續(xù)的靜音持續(xù)長(zhǎng)度值所代表的時(shí)間里連續(xù)比較語(yǔ)音流中連續(xù)的處理塊的最高音量值和靜音門檻值;當(dāng)在連續(xù)的靜音持續(xù)長(zhǎng)度值所代表的時(shí)間里,語(yǔ)音流中連續(xù)的處理塊的最高音量值都小于靜音門檻值,對(duì)語(yǔ)音流進(jìn)行靜音控制;
較佳地,所述的音量自動(dòng)增益控制中的靜音控制方法,其特征在于所述處理塊最大音量值為該處理塊中音量最大的樣本點(diǎn)的音量值。
較佳地,所述的音量自動(dòng)增益控制中的靜音控制方法,其特征在于所述靜音控制包括以下步驟獲取靜音前的最后一個(gè)處理塊的自動(dòng)增益值Gain;比較靜音前處理塊自動(dòng)增益值Gain與1,當(dāng)Gain大于1時(shí),逐漸縮小自動(dòng)增益值,使其趨近1;當(dāng)Gain小于1時(shí),逐漸增大自動(dòng)增益值,使其趨近1;當(dāng)Gain等于1時(shí),則保持自動(dòng)增益值Gain不變。
較佳地,所述的音量自動(dòng)增益控制中的靜音控制方法,其特征在于逐漸縮小自動(dòng)增益值的每次縮小幅度相同和逐漸增大自動(dòng)增益值的每次增大幅度相同。
本發(fā)明還提供了一種音量自動(dòng)增益控制中的高音量控制方法,其特征在于包括以下步驟設(shè)定一個(gè)高音量音門檻值;采集語(yǔ)音流,并將其保存成相同大小的若干個(gè)處理塊,并計(jì)算每個(gè)處理塊的平均音量值;比較所述的高音量門檻值和所述的平均音量值;如果所述的高音量門檻值小于所述的平均音量值,則下調(diào)自動(dòng)增益值以減小音量;較佳地,所述的音量自動(dòng)增益控制中的高音量控制方法,其特征在于所述的平均音量值為每個(gè)處理塊中所有樣本點(diǎn)的音量的平均值。
較佳地,所述的音量自動(dòng)增益控制中的高音量控制方法,其特征在于下調(diào)自動(dòng)增益值的幅度為所述高音量門檻值與所述平均音量值的比值。
本發(fā)明通過(guò)預(yù)先定義語(yǔ)音流音量狀態(tài),判斷當(dāng)前語(yǔ)音流的音量狀態(tài),然后根據(jù)判斷結(jié)果對(duì)語(yǔ)音流進(jìn)行相應(yīng)調(diào)整。由于區(qū)分語(yǔ)音流的音量狀態(tài),從而可以針對(duì)不同音量狀態(tài)的語(yǔ)音流進(jìn)行相應(yīng)的調(diào)整,在判斷語(yǔ)音流處于靜音狀態(tài)時(shí),以每次相同的幅度逐漸縮小或逐漸增大自動(dòng)增益值,使之平滑過(guò)渡到1,消除發(fā)送端背景噪聲被過(guò)度放大帶來(lái)的嘈雜聲和嘯叫聲;在判斷語(yǔ)音流處于高音量狀態(tài)時(shí),下調(diào)自動(dòng)增益值以減小音量,實(shí)現(xiàn)對(duì)高音量語(yǔ)音流的音量限制,從而達(dá)到語(yǔ)音流的平滑流暢。由于本發(fā)明的方案對(duì)多個(gè)語(yǔ)音流發(fā)送端的語(yǔ)音分別流進(jìn)行相應(yīng)調(diào)整,使得多個(gè)語(yǔ)音流發(fā)送端的音量在接收端達(dá)到一致大小,從而實(shí)現(xiàn)語(yǔ)音通訊中的多聲道平衡。


圖1為本發(fā)明的音量控制方法的流程圖;圖2為本發(fā)明的音量控制系統(tǒng)結(jié)構(gòu)圖;圖3為本發(fā)明在即時(shí)通訊客戶端應(yīng)用的示意圖;圖4為本發(fā)明的多個(gè)語(yǔ)音流發(fā)送端在語(yǔ)音流接收端的音量輸出的多聲道平衡示意圖;具體實(shí)施方式
下面結(jié)合附圖以具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)描述。
本發(fā)明為一種音量控制方法和系統(tǒng),在目前普遍采用的音量自動(dòng)增益控制的基礎(chǔ)上,預(yù)先定義語(yǔ)音流音量狀態(tài),判斷當(dāng)前語(yǔ)音流的音量狀態(tài),并根據(jù)判斷結(jié)果對(duì)語(yǔ)音流進(jìn)行相應(yīng)的音量調(diào)整,最后輸出經(jīng)過(guò)音量調(diào)整的語(yǔ)音流。
圖1所示為應(yīng)用本發(fā)明的流程示意圖。
步驟101,定義語(yǔ)音流音量狀態(tài)。
本方案預(yù)先將語(yǔ)音流區(qū)分定義為幾種音量狀態(tài),在本方案的一個(gè)實(shí)施例中,語(yǔ)音流被預(yù)先定義為三種音量狀態(tài),如圖1所示,分別是正常音量狀態(tài),靜音狀態(tài)和高音量狀態(tài),并設(shè)定相應(yīng)的判斷語(yǔ)音流音量狀態(tài)的門檻值,分別為靜音門檻值,靜音持續(xù)長(zhǎng)度值和高音量門檻值。靜音門檻值,靜音持續(xù)長(zhǎng)度值和高音量門檻值經(jīng)過(guò)實(shí)際測(cè)量獲得。
步驟102,采集并保存語(yǔ)音流。
和現(xiàn)有自動(dòng)增益音量控制方法相同地,語(yǔ)音流被采集保存成若干個(gè)相同大小的處理快,每個(gè)處理塊包含若干個(gè)樣本點(diǎn)量化振幅值數(shù)據(jù)。本方案的音量控制方法是對(duì)當(dāng)前語(yǔ)音流的每個(gè)處理塊判斷音量狀態(tài),并計(jì)算該處理塊相應(yīng)的放大倍數(shù),即自動(dòng)增益值,然后再給該處理塊里的每個(gè)樣本點(diǎn)乘以計(jì)算出的放大倍數(shù),作為輸出。在計(jì)算放大倍數(shù)時(shí),同時(shí)考慮自動(dòng)增益值必須小于當(dāng)前處理塊的最大放大倍數(shù),即控制放大后的振幅值不能超過(guò)最大的量化等級(jí),例如當(dāng)當(dāng)前處理的語(yǔ)音流的采樣率為8000Hz,量化等級(jí)為16位,帶符號(hào)時(shí),要保證放大后的樣本點(diǎn)振幅值不能超過(guò)215-1(32767)。
步驟103,判斷語(yǔ)音流音量狀態(tài)。
對(duì)已保存的語(yǔ)音流根據(jù)預(yù)先設(shè)定的門檻值進(jìn)行音量狀態(tài)的判斷。語(yǔ)音流音量狀態(tài)的判斷還需要測(cè)量計(jì)算兩個(gè)參數(shù),當(dāng)前處理塊最大音量值和當(dāng)前處理塊平均音量值。優(yōu)選的,當(dāng)前處理塊最大音量值為該處理塊中音量最大的樣本點(diǎn)的音量,當(dāng)前處理塊平均音量值為當(dāng)前處理塊中所有樣本點(diǎn)的音量的平均值。首先在連續(xù)的靜音持續(xù)長(zhǎng)度值所代表的時(shí)間內(nèi)比較所述的靜音門檻值和所述的當(dāng)前處理塊最大音量值,當(dāng)所述的靜音門檻值在連續(xù)的靜音持續(xù)長(zhǎng)度值所代表的時(shí)間內(nèi)大于當(dāng)前處理塊最大音量值時(shí),判定語(yǔ)音流處于靜音狀態(tài);當(dāng)所述的靜音門檻值在連續(xù)的靜音持續(xù)長(zhǎng)度值所代表的時(shí)間內(nèi)小于當(dāng)前處理塊最大音量值,則比較所述的高音量門檻值和所述的平均音量值;如果所述的高音量門檻值小于所述的平均音量值,則判定語(yǔ)音流處于高音量狀態(tài);如果所述的高音量門檻值大于所述的平均音量值,則判定語(yǔ)音流處于正常音量狀態(tài)。
步驟1041,當(dāng)語(yǔ)音流處于正常音量狀態(tài)時(shí),進(jìn)行自動(dòng)增益音量調(diào)整,以普通自動(dòng)增益調(diào)整的任何一種算法為語(yǔ)音流中的每個(gè)處理塊計(jì)算一個(gè)放大倍數(shù),然后給處理塊中每個(gè)樣本點(diǎn)的音量振幅值乘以計(jì)算出的放大倍數(shù),作為語(yǔ)音流的輸出音量。
步驟1042,靜音狀態(tài)時(shí),比較靜音前增益值Gain和1。在靜音狀態(tài)時(shí),為了不放大背景噪聲,自動(dòng)增益值應(yīng)為1。通常情況下,靜音前自動(dòng)增益值一般不為1,為保持語(yǔ)音流音量的連貫平滑,采取逐漸微調(diào)的策略,每次調(diào)整幅度相同,使自動(dòng)增益值趨近1。
步驟1043,高音量狀態(tài)時(shí),下調(diào)增益值以減小音量。通過(guò)實(shí)際測(cè)試,優(yōu)選的,下調(diào)的幅度為步驟1051,靜音前增益值Gain大于1時(shí),逐漸縮小Gain使之趨近1。
步驟1052,靜音前增益值Gain小于1時(shí),逐漸增大Gain使之趨近1。
步驟1052,靜音前增益值Gain等于1時(shí),保持Gain值不變。
步驟106,輸出音量調(diào)整后的語(yǔ)音流。
本發(fā)明的一個(gè)實(shí)施例中,靜音期間的自動(dòng)增益控制方案分為兩部分:
一是如何有效地判斷出當(dāng)前是否處于靜音期間;二是當(dāng)判斷出當(dāng)前處于靜音期間時(shí),如何調(diào)節(jié)當(dāng)前的自動(dòng)增益值。
如何判斷當(dāng)前是否處于靜音期間,首先必須選定一個(gè)判斷是否靜音的振幅門限值SILENCE_THRESHOLD。通過(guò)實(shí)際測(cè)試,選擇SILENCE_THRESHOLD=700,當(dāng)振幅值小于SILENCE_THRESHOLD時(shí)語(yǔ)音流被定義為靜音狀態(tài),反之我為非靜音狀態(tài)。接下來(lái),計(jì)算每個(gè)處理塊的最大振幅值(取絕對(duì)值),并和SILENCE_THRESHOLD進(jìn)行比較。同時(shí),再設(shè)置一個(gè)靜音持續(xù)長(zhǎng)度值SILENCE_DURATION。通過(guò)實(shí)際測(cè)試,選定SILENCE_DURATION=2秒。當(dāng)連續(xù)的SILENCE_DURATION時(shí)間內(nèi)都出現(xiàn)處理塊的最大振幅值小于SILENCE_THRESHOLD時(shí),判定,當(dāng)前處于靜音期間,執(zhí)行靜音期間的自動(dòng)增益調(diào)整。
靜音期間的自動(dòng)增益調(diào)整追求的目標(biāo)是在靜音期間應(yīng)該不能對(duì)語(yǔ)音流做任何處理,即自動(dòng)增益值為1,不放大也不縮小,保持背景噪聲原樣。但是,在靜音期間之前,自動(dòng)增益值Gain可能不為1,如果一判斷出靜音就立刻將自動(dòng)增益值設(shè)置為1,會(huì)造成靜音前和靜音一開始的音量突變,同樣會(huì)造成語(yǔ)音的不連貫性。因此,在此設(shè)計(jì)方案中,當(dāng)判斷為靜音期間時(shí),進(jìn)行如下操作if(Gain>1.0)Gain=Gain*0.95;else if(Gain<0.95)Gain=Gain*1.05這樣的處理就使得在靜音期間,自動(dòng)增益值緩緩地平滑過(guò)渡到1,達(dá)到音量平滑過(guò)度的效果。
對(duì)于高音量的自動(dòng)增益控制方案,同樣存在兩個(gè)方面的問(wèn)題一是如何有效地判斷出當(dāng)前是否處于高音量期間;二是當(dāng)判斷出當(dāng)前處于高音量期間時(shí),應(yīng)如何有效地下調(diào)自動(dòng)增益值。
僅僅通過(guò)統(tǒng)計(jì)出的處理塊的最大振幅值,不能進(jìn)行高音量的判斷。因此,引入另一個(gè)統(tǒng)計(jì)值Block_average,當(dāng)前處理塊的平均振幅值(絕對(duì)值)。通過(guò)Block_average值來(lái)進(jìn)行判斷。同時(shí),定義一個(gè)確定高音量的振幅門限值HIGH_THRESHOLD,并通過(guò)實(shí)際測(cè)試選定為15000。
if(Block_average>HIGH_THRESHOLD)Gain=HIGH_THRESHOLD/Block_average;當(dāng)平均振幅值大于HIGH_THRESHOLD,則將Gain值進(jìn)行下調(diào)處理,下調(diào)幅度為HIGH_THRESHOLD/Block_average。
通過(guò)這樣的處理,可以有效限制高音量的樣本點(diǎn)的音量。
圖2所示為應(yīng)用本發(fā)明的音量控制系統(tǒng)結(jié)構(gòu)圖。圖2中所示的音量控制系統(tǒng)包括語(yǔ)音流發(fā)送端201,語(yǔ)音流接收端202,語(yǔ)音服務(wù)器203,和音量控制器204組成的。音量控制器204的語(yǔ)音流輸入模塊205直接從語(yǔ)音流發(fā)送端201采集語(yǔ)音流。語(yǔ)音流處理模塊206將所采集的語(yǔ)音流保存成若干個(gè)相同大小的處理塊,每個(gè)處理塊包含若干個(gè)樣本點(diǎn),并測(cè)量計(jì)算每個(gè)處理塊的最高音量值和平均音量值。音量狀態(tài)判斷模塊207根據(jù)預(yù)先設(shè)定的門檻值判斷語(yǔ)音流的音量狀態(tài)。音量調(diào)整模塊208根據(jù)音量狀態(tài)判斷模塊207的判斷結(jié)果,分別對(duì)不同狀態(tài)的語(yǔ)音流進(jìn)行相應(yīng)的音量調(diào)整。語(yǔ)音流輸出模塊209輸出經(jīng)過(guò)音量調(diào)整以后的語(yǔ)音流給語(yǔ)音流接收端202。語(yǔ)音流輸入模塊205也可從語(yǔ)音服務(wù)器203處采集語(yǔ)音流,這時(shí),語(yǔ)音流發(fā)送端201和語(yǔ)音流接收端202之間的通訊是通過(guò)語(yǔ)音服務(wù)器203中轉(zhuǎn)完成的。
圖3所示為多個(gè)語(yǔ)音流發(fā)送端在同一接收端的多聲道平衡效果。音量控制器204從發(fā)送端301和發(fā)送端306分別采集語(yǔ)音流,分別保存并判斷語(yǔ)音流的音量狀態(tài),并分別根據(jù)判斷結(jié)果調(diào)整語(yǔ)音流音量,最后分別輸出經(jīng)音量調(diào)整的語(yǔ)音流給接收端302。由于對(duì)發(fā)送端301和306的語(yǔ)音流都分別做了相應(yīng)的音量調(diào)整,所以無(wú)論301和306的音量設(shè)置如何,它們發(fā)送的語(yǔ)音流在接收端302的音量達(dá)到一致。在服務(wù)器中轉(zhuǎn)通訊情況下,發(fā)送端301和306分別將語(yǔ)音流發(fā)送到語(yǔ)音服務(wù)器304,音量控制器204從語(yǔ)音服務(wù)器采集保存語(yǔ)音流,經(jīng)過(guò)相應(yīng)的音量調(diào)整,輸出到接收端302。圖中發(fā)送端306為移動(dòng)電話,306的語(yǔ)音信息通過(guò)移動(dòng)通訊網(wǎng)關(guān)303發(fā)送給語(yǔ)音服務(wù)器304,再轉(zhuǎn)發(fā)給音量控制器204。如圖4所示,接收端305為移動(dòng)通訊工具PDA,音量控制器204發(fā)送經(jīng)過(guò)音量調(diào)整后的語(yǔ)音流給語(yǔ)音服務(wù)器304,再由語(yǔ)音服務(wù)器304轉(zhuǎn)發(fā)給移動(dòng)通訊網(wǎng)關(guān)303,最后由移動(dòng)通訊網(wǎng)關(guān)303發(fā)送給接收端305。
圖4所示為本發(fā)明在即時(shí)通訊系統(tǒng)里的應(yīng)用。圖4所示的即時(shí)通訊系統(tǒng)包括互為對(duì)端的即時(shí)通訊客戶端401和402,即時(shí)通訊服務(wù)器403,語(yǔ)音服務(wù)器404。即時(shí)通訊客戶端401和402都包括即時(shí)通訊模塊405,語(yǔ)音通訊模塊406和音量控制器204。當(dāng)啟動(dòng)集成在即時(shí)通訊客戶端401的語(yǔ)音通訊工具,如語(yǔ)音聊天工具、視頻會(huì)議工具等時(shí),即時(shí)通訊模塊405調(diào)用語(yǔ)音通訊模塊406,通過(guò)即時(shí)通訊服務(wù)器402發(fā)送語(yǔ)音通訊請(qǐng)求給即時(shí)通訊客戶端402,即時(shí)通訊客戶端402響應(yīng)該語(yǔ)音通訊請(qǐng)求,在對(duì)端401和402之間建立語(yǔ)音通訊通道,此時(shí)即時(shí)通訊客戶端401為發(fā)送端,402為接收端。接收端402的音量控制器204從語(yǔ)音通訊模塊406采集接收到的語(yǔ)音流,進(jìn)行音量調(diào)整后輸出。在服務(wù)器中轉(zhuǎn)通訊情況下,即時(shí)通訊客戶端401發(fā)送語(yǔ)音流給語(yǔ)音服務(wù)器404,語(yǔ)音服務(wù)器404轉(zhuǎn)發(fā)給即時(shí)通訊客戶端402,即時(shí)通訊客戶端402的音量控制器204對(duì)接收到的語(yǔ)音流進(jìn)行音量調(diào)整后輸出。同樣地,發(fā)送端405的音量控制器204也可從405的語(yǔ)音通訊模塊406采集語(yǔ)音流,經(jīng)過(guò)音量調(diào)整后再發(fā)送。在服務(wù)器中轉(zhuǎn)通訊情況下,音量控制器也可不設(shè)在即時(shí)通訊客戶端401和402,而是設(shè)置在語(yǔ)音服務(wù)器404,語(yǔ)音服務(wù)器404接收到語(yǔ)音流后,先進(jìn)行音量調(diào)整,再轉(zhuǎn)發(fā)給接收端。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種自動(dòng)增益音量控制方法,其特征在于包括以下步驟a)定義語(yǔ)音流音量狀態(tài);b)采集語(yǔ)音流,并將其處理成相同大小的若干個(gè)處理塊;c)判斷語(yǔ)音流的音量狀態(tài);d)根據(jù)步驟c)中判斷結(jié)果、對(duì)語(yǔ)音流進(jìn)行相應(yīng)的音量自動(dòng)增益調(diào)整;e)輸出經(jīng)過(guò)音量調(diào)整的語(yǔ)音流。
2.如權(quán)利要求1所述的音量控制方法,其特征在于所述步驟a)中的音量狀態(tài)包括靜音狀態(tài)高、音量狀態(tài)和正常音量狀態(tài)。
3.如權(quán)利要求1所述的音量控制方法,其特征在于所述步驟b)中的每個(gè)處理塊包含若干個(gè)音量樣本點(diǎn)。
4.如權(quán)利要求3所述的音量控制方法,其特征在于測(cè)量當(dāng)前處理塊的最大音量值和平均音量值。
5.如權(quán)利要求4所述的音量控制方法,其特征在于,所述的當(dāng)前處理塊最大音量值為該處理塊中音量最大的樣本點(diǎn)的音量,所述的當(dāng)前處理塊平均音量值為當(dāng)前處理塊中所有樣本點(diǎn)的音量的平均值。
6.如權(quán)利要求1所述的音量控制方法,其特征在于所述步驟c)包括c1)設(shè)置一個(gè)靜音門檻值,一個(gè)靜音持續(xù)長(zhǎng)度值和一個(gè)高音量門檻值;c2)在連續(xù)的靜音持續(xù)長(zhǎng)度值所代表的時(shí)間內(nèi)比較所述的靜音門檻值和所述的當(dāng)前處理塊最大音量值;c3)當(dāng)所述的靜音門檻值在連續(xù)的靜音持續(xù)長(zhǎng)度值所代表的時(shí)間內(nèi)大于當(dāng)前處理塊最大音量值時(shí),判定語(yǔ)音流處于靜音狀態(tài);c4)當(dāng)所述的靜音門檻值在連續(xù)的靜音持續(xù)長(zhǎng)度值所代表的時(shí)間內(nèi)小于當(dāng)前處理塊最大音量值,則比較所述的高音量門檻值和所述的平均音量值如果所述的高音量門檻值小于所述的平均音量值,則判定語(yǔ)音流處于高音量狀態(tài);如果所述的高音量門檻值大于所述的平均音量值,則判定語(yǔ)音流處于正常音量狀態(tài)。
7.如權(quán)利要求6所述的音量控制方法,其特征在于步驟d)中所述的根據(jù)步驟c)中判斷結(jié)果對(duì)語(yǔ)音流進(jìn)行相應(yīng)的音量自動(dòng)增益調(diào)整包括當(dāng)語(yǔ)音流處于正常音量狀態(tài)時(shí),對(duì)語(yǔ)音流進(jìn)行自動(dòng)增益調(diào)整,作為語(yǔ)音流的輸出音量。
8.如權(quán)利要求6所述的音量控制方法,其特征在于步驟d)中所述的根據(jù)步驟c)中判斷結(jié)果對(duì)語(yǔ)音流進(jìn)行相應(yīng)的音量自動(dòng)增益調(diào)整包括當(dāng)語(yǔ)音流處于靜音狀態(tài)時(shí),具體調(diào)整方法包括以下步驟d1)獲取靜音前的最后一個(gè)處理塊的自動(dòng)增益值Gain;d2)比較靜音前處理塊自動(dòng)增益值Gain與1,當(dāng)Gain大于1時(shí),逐漸縮小自動(dòng)增益值,使其趨近1;當(dāng)Gain小于1時(shí),逐漸增大自動(dòng)增益值,使其趨近1;當(dāng)Gain等于1時(shí),則保持自動(dòng)增益值Gain不變。
9.如權(quán)利要求8所述的音量控制方法,其特征在于逐漸縮小自動(dòng)增益值的每次縮小幅度相同和逐漸增大自動(dòng)增益值的每次增大幅度相同。
10.如權(quán)利要求6所述的音量控制方法,其特征在于步驟d)中所述的根據(jù)步驟c)中判斷結(jié)果對(duì)語(yǔ)音流進(jìn)行相應(yīng)的音量自動(dòng)增益調(diào)整包括當(dāng)語(yǔ)音流處于高音量狀態(tài)時(shí),下調(diào)自動(dòng)增益值,以減小音量。
11.如權(quán)利要求10所述的音量控制方法,其特征在于下調(diào)自動(dòng)增益值的幅度為所述高音量門檻值與所述平均音量值的比值。
12.一種音量控制系統(tǒng),包括通過(guò)網(wǎng)絡(luò)互相連接的語(yǔ)音流發(fā)送端,語(yǔ)音流接收端和語(yǔ)音服務(wù)器,其特征在于還包括用于在接收端播放語(yǔ)音流前調(diào)整音量的音量控制器。
13.如權(quán)利要求12所述的音量控制系統(tǒng),其特征在于所述的音量控制器包括用于從所述語(yǔ)音流發(fā)送端采集并保存語(yǔ)音流的語(yǔ)音流輸入???,用于對(duì)所保存語(yǔ)音流進(jìn)行預(yù)處理的語(yǔ)音流處理模塊,用于判斷語(yǔ)音流的音量狀態(tài)的音量狀態(tài)判斷模塊,用于調(diào)整語(yǔ)音流音量的音量調(diào)整模塊和用于輸出經(jīng)過(guò)音量調(diào)整的語(yǔ)音流給語(yǔ)音流接收端的語(yǔ)音流輸出模塊。
14.如權(quán)利要求12所述的音量控制系統(tǒng),其特征在于所述的音量控制器可在發(fā)送端或接收端,也可在語(yǔ)音服務(wù)器端。
15.如權(quán)利要求12所述的音量控制系統(tǒng),其特征在于所述的語(yǔ)音流發(fā)送端和語(yǔ)音流接收端是運(yùn)行視頻會(huì)議程序語(yǔ)音通訊程序、或其他包含語(yǔ)音通訊模塊的客戶端程序的計(jì)算機(jī)。
16.如權(quán)利要求12所述的音量控制系統(tǒng),其特征在于所述的語(yǔ)音流發(fā)送端和語(yǔ)音流接收端可以是數(shù)字電話,移動(dòng)電話和PDA等語(yǔ)音通訊設(shè)備。
17.如權(quán)利要求12所述的音量控制系統(tǒng),其特征在于系統(tǒng)通過(guò)對(duì)多個(gè)所述的語(yǔ)音流發(fā)送端的音量都進(jìn)行控制,使所述的多個(gè)語(yǔ)音流發(fā)送端在所述的語(yǔ)音流接收端的輸出音量一致,達(dá)到多聲道平衡。
18.一種音量自動(dòng)增益控制中的靜音控制方法,其特征在于包括以下步驟設(shè)定一個(gè)靜音門檻值和一個(gè)靜音持續(xù)長(zhǎng)度值;采集語(yǔ)音流,并將其保存成相同大小的若干個(gè)處理塊,并測(cè)量每個(gè)處理塊的最高音量值;在連續(xù)的靜音持續(xù)長(zhǎng)度值所代表的時(shí)間里連續(xù)比較語(yǔ)音流中連續(xù)的處理塊的最高音量值和靜音門檻值;當(dāng)在連續(xù)的靜音持續(xù)長(zhǎng)度值所代表的時(shí)間里,語(yǔ)音流中連續(xù)的處理塊的最高音量值都小于靜音門檻值,對(duì)語(yǔ)音流進(jìn)行靜音控制;
19.如權(quán)利要求18所述的音量自動(dòng)增益控制中的靜音控制方法,其特征在于所述處理塊最大音量值為該處理塊中音量最大的樣本點(diǎn)的音量值。
20.如權(quán)利要求18所述的音量自動(dòng)增益控制中的靜音控制方法,其特征在于所述靜音控制包括以下步驟獲取靜音前的最后一個(gè)處理塊的自動(dòng)增益值Gain;比較靜音前處理塊自動(dòng)增益值Gain與1,當(dāng)Gain大于1時(shí),逐漸縮小自動(dòng)增益值,使其趨近1;當(dāng)Gain小于1時(shí),逐漸增大自動(dòng)增益值,使其趨近1;當(dāng)Gain等于1時(shí),則保持自動(dòng)增益值Gain不變。
21.如權(quán)利要求20所述的音量自動(dòng)增益控制中的靜音控制方法,其特征在于逐漸縮小自動(dòng)增益值的每次縮小幅度相同和逐漸增大自動(dòng)增益值的每次增大幅度相同。
22.一種音量自動(dòng)增益控制中的高音量控制方法,其特征在于包括以下步驟設(shè)定一個(gè)高音量音門檻值;采集語(yǔ)音流,并將其保存成相同大小的若干個(gè)處理塊,并計(jì)算每個(gè)處理塊的平均音量值;比較所述的高音量門檻值和所述的平均音量值;如果所述的高音量門檻值小于所述的平均音量值,則下調(diào)自動(dòng)增益值以減小音量;
23.如權(quán)利要求22所述的音量自動(dòng)增益控制中的高音量控制方法,其特征在于所述的平均音量值為每個(gè)處理塊中所有樣本點(diǎn)的音量的平均值。
24.如權(quán)利要求22所述的音量自動(dòng)增益控制中的高音量控制方法,其特征在于下調(diào)自動(dòng)增益值的幅度為所述高音量門檻值與所述平均音量值的比值。
全文摘要
本發(fā)明公開了一種語(yǔ)音通信時(shí)的自動(dòng)增益音量控制方法和系統(tǒng)。通過(guò)預(yù)先定義語(yǔ)音流的音量狀態(tài)并在傳輸中判斷,根據(jù)判斷結(jié)果進(jìn)行相應(yīng)自動(dòng)增益控制(AGC)控制,實(shí)現(xiàn)語(yǔ)音流的音量從高音到靜音的平滑過(guò)度,解決語(yǔ)音傳輸中的音量突變和語(yǔ)音的不連貫等問(wèn)題。該方法是通過(guò)采集語(yǔ)音流并根據(jù)預(yù)先設(shè)定的門檻值判斷所采集語(yǔ)音流的音量狀態(tài),再根據(jù)判斷結(jié)果進(jìn)行相應(yīng)的自動(dòng)增益控制,從而達(dá)到語(yǔ)音流的平滑連貫。在一個(gè)實(shí)施例中,該方法在視頻會(huì)議中的應(yīng)用通過(guò)對(duì)各個(gè)聲道語(yǔ)音流的特殊音量自動(dòng)增益(AGC)控制,達(dá)到各個(gè)聲道的音量的一致,即多聲道平衡。
文檔編號(hào)H04N7/15GK1885711SQ20051003557
公開日2006年12月27日 申請(qǐng)日期2005年6月24日 優(yōu)先權(quán)日2005年6月24日
發(fā)明者王麒 申請(qǐng)人:騰訊科技(深圳)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1