專利名稱:一種amr語音編碼的源控制速率實(shí)現(xiàn)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音編碼領(lǐng)域,具體的涉及AMR語音編碼中的源控制速率的實(shí)現(xiàn)方法。
背景技術(shù):
自適應(yīng)多速率(AMRAdaptive Multi Rate)語音編碼是第三代移動通信標(biāo)準(zhǔn)化的伙伴項(xiàng)目(3GPP)制定的用于第三代移動通信WCDMA系統(tǒng)中的語音壓縮編碼技術(shù)。它與以前的移動通信語音編碼方式區(qū)別之一在于,以前的移動通信語音編碼采用的是固定的編碼速率。但人類在進(jìn)行語音通信時(shí),大約有70%左右的空閑時(shí)間是沒有講話的,因此,始終用一個(gè)速率進(jìn)行語音編碼對信道資源是一種浪費(fèi)。另外,隨著移動通信的發(fā)展,尤其是第三代移動通信系統(tǒng),對采用較低的編碼速率進(jìn)行語音編碼,從而增加系統(tǒng)容量和獲得較高的語音通話質(zhì)量方面提出了更高的要求。因此,傳統(tǒng)的移動語音編碼技術(shù),因?yàn)槠鋯我坏娜蒎e度的特點(diǎn),所以很難同時(shí)滿足這兩個(gè)要求。
AMR聲碼器原理方面,它采用了多速率碼激勵線性預(yù)測(MR-ACELP)的編碼技術(shù)。這種方式基于碼激勵線性預(yù)測(CELP)編碼模式,用全極點(diǎn)線性濾波器模擬語音特性。
AMR聲碼器由以下幾個(gè)部分組成多速率語音編碼器,源控制速率(SCR)方案(包括語音激勵檢測器和舒適噪聲生成系統(tǒng)),對抗傳輸錯誤和丟包帶來的影響的差錯隱藏機(jī)制。AMR語音編碼是讓容錯度隨無線信道和傳輸環(huán)境的改變而改變,動態(tài)地在信源編碼和信道編碼之間調(diào)整比特分配,即所謂的自適應(yīng)。AMR以20ms的語音作為一幀進(jìn)行處理,每一幀又分為4個(gè)5ms的子幀。AMR提供了八種速率模式12.2kbps、10.2kbps、7.95kbps、7.40kbps、6.70kbps、5.90kbps、5.15kbps和4.75kbps,并且在每幀的邊界處可以在8種源速率之間進(jìn)行切換,實(shí)際采用哪種語音速率主要取決于現(xiàn)存的無線信道環(huán)境,這樣就使得無線資源的配置與利用更加靈活高效。
源控制速率(SCR)技術(shù)是AMR編碼器的重要組成部分。該操作是針對輸入信號僅為背景噪聲的情況下,采用比通常情況低的比特速率(1.80kbps)進(jìn)行編碼,以節(jié)省用戶設(shè)備的耗電量并降低整個(gè)網(wǎng)絡(luò)的干擾與負(fù)載。
SCR機(jī)制要求發(fā)射端的語音激勵檢測器(VAD)對背景噪聲進(jìn)行評價(jià),并將特征參數(shù)發(fā)送給接收端;如果發(fā)送端被關(guān)掉或接收端沒有收到有效的語音信號,則接收端要生成舒適噪聲。另外,如果接收端接收到的參數(shù)由于傳輸差錯而嚴(yán)重惡化,則在接收端必須由替代的數(shù)據(jù)生成語音或舒適噪聲(comfort noise),從而避免產(chǎn)生令人討厭的效果。
SCR的一個(gè)基本問題是如果發(fā)送端被關(guān)掉,則和語音一起發(fā)送的背景噪聲也會消失,從而導(dǎo)致背景噪聲不連續(xù)。由于SCR的切換是頻繁發(fā)生的,因此這種背景噪聲不連續(xù)的效果會使接聽者非常惱火,尤其是在背景噪聲很大的情況下,例如在汽車?yán)?。在惡劣的情況下,語音可能甚至?xí)缀趼牪欢?br>
解決的方法是,接收端通過生成與發(fā)射端背景噪聲類似的合成噪聲,來克服這種問題。當(dāng)不存在語音信號時(shí),發(fā)送端會進(jìn)行舒適噪聲參數(shù)的估計(jì),所得結(jié)果發(fā)送到接收端。這使得接收端生成的舒適噪聲可以適應(yīng)發(fā)射端噪聲水平的變化。
具體來說,SCR操作會在發(fā)送端進(jìn)行語音激活檢測(VAD),這個(gè)檢測用于判決當(dāng)前的會話狀態(tài)是出于語音狀態(tài)還是無聲狀態(tài),并相應(yīng)的對背景噪聲進(jìn)行評價(jià),將所得有關(guān)的特征參數(shù)傳送給接收端(RX)。對沒有語音信號的期間,接收端就依據(jù)這些特征參數(shù)生成與發(fā)送端類似的舒適背景噪聲。
AMR中SCR操作如圖1所示。其中,發(fā)送端的SCR操作包括3部分,分別是語音編碼、語音激活檢測(VAD)、舒適背景噪聲計(jì)算。其中,語音編碼部分發(fā)送語音的信息比特,VAD部分發(fā)送模式指示部分,舒適背景噪聲計(jì)算部分計(jì)算發(fā)射端的背景噪聲的有關(guān)特征參數(shù),并發(fā)送到傳輸網(wǎng)絡(luò)。這些信息被打包傳輸?shù)骄W(wǎng)絡(luò)部分并分類,再由接收端接收。接收端的SCR操作也包括3部分,分別是語音解碼、信息隱藏、舒適背景噪聲生成。其中,語音解碼部分把接收到的信息比特解碼成語音,錯誤隱藏部分接收VAD的模式指示,舒適背景噪聲生成部分根據(jù)接收類型,生成舒適背景噪聲。
如果網(wǎng)絡(luò)發(fā)出了有關(guān)命令,在發(fā)送端的用戶設(shè)備中已經(jīng)執(zhí)行SCR操作,則在接收端,無論接收方是否采用SCR接收,都將進(jìn)行SCR操作。
在3GPP發(fā)布的技術(shù)規(guī)范26.093《源控制速率操作》中規(guī)定,接收方所有的SCR操作都是由接收方SCR控制器控制的,接收方SCR控制器包括了2個(gè)主要的模式語音模式和舒適噪聲模式,其中語音模式是它的初始模式。
SCR中,幀的內(nèi)容包括信息比特、速率指示和發(fā)送類型,其中發(fā)送類型用于說明發(fā)送幀中的類型。它包括2種語音信息幀和3種靜音幀(Silence Description,即SID)和1種空幀,其中,根據(jù)3GPP發(fā)布的技術(shù)規(guī)范26.101《AMR語音編解碼器;幀結(jié)構(gòu)》,如果接收方接收到SID_FIRST,SID_UPDATE或者SID_BAD幀,接收方SCR控制器會進(jìn)入舒適噪聲狀態(tài)并且引起舒適噪聲產(chǎn)生,其中SID_BAD幀會被替代或者靜音處理。只要接收方SCR控制器在舒適噪聲模式下,它將忽略所有無用的信息幀(譬如NO_DATA幀,SPEECH_BAD幀),這樣舒適噪聲會一直產(chǎn)生。表1給出了6種幀的類型
表1這些幀識別信息會隨著幀信息在網(wǎng)絡(luò)中傳輸。其中,SPEECH_GOOD幀表示當(dāng)前幀是一個(gè)有效的語音信息被編碼后的信息幀;SID_FIRST幀出現(xiàn)在語音結(jié)束之后,表示從當(dāng)前幀開始處于靜音模式;如果出現(xiàn)持續(xù)的靜音時(shí)段,就會出現(xiàn)SID_UPDATE幀,這個(gè)幀具體在SID_FIRST幀后的第三個(gè)幀出現(xiàn),并以每8個(gè)幀為周期重復(fù)出現(xiàn),直到靜音時(shí)段結(jié)束。
如果遇突發(fā)事件使發(fā)送端SCR功能喪失,發(fā)送端將連續(xù)產(chǎn)生語音幀,并且將幀類型標(biāo)志為“SPEECH_GOOD”;如果發(fā)送端SCR操作正常運(yùn)行,則采用VAD標(biāo)志(VAD flag)來控制SCR操作。
為確保發(fā)送端SCR操作正常運(yùn)行,在系統(tǒng)重新設(shè)置后,所有幀都被視為無限長的語音幀。在接收端,為確保舒適背景噪聲參數(shù)的正確估計(jì),重新設(shè)置后的前7幀都必須指示為語音幀(即幀類型標(biāo)志為“SPEECH_GOOD”),即使VAD指示為無聲狀態(tài)(VAD flag=“0”)。
VAD將一直運(yùn)行,以便對每幀進(jìn)行評估,確定當(dāng)前幀是否為語音幀。其輸出VAD指示(VAD flag)是一個(gè)二進(jìn)制標(biāo)志符,當(dāng)VAD flag=“1”時(shí),語音編碼輸出幀將被加上“SPEECH_GOOD”型標(biāo)志,意味著當(dāng)前幀是個(gè)有效的語音幀,并直接通過網(wǎng)絡(luò)發(fā)送出去。
當(dāng)VAD flag=“1”轉(zhuǎn)變?yōu)閂AD flag=“0”時(shí),即表示一段語音結(jié)束,這時(shí)會出現(xiàn)8個(gè)連續(xù)幀用于表示一個(gè)靜音幀(SID),即所謂的延遲保護(hù)。具體操作是在語音結(jié)束后的前7幀都加上“SPEECH_GOOD”標(biāo)示,并直接傳輸?shù)骄W(wǎng)絡(luò),而第8幀標(biāo)示為“SID_FIRST”,SID_FIRST幀不包含數(shù)據(jù)。
一旦SID_FIRST幀被發(fā)送出去,只要VAD flag=“0”,即表示出現(xiàn)連續(xù)的無語音時(shí)段,發(fā)送端就會周期的(每8幀)發(fā)送SID_UPDATE幀。需要注意的是,第1個(gè)SID_UPDATE幀是在SID_FIRST幀后的第3個(gè)幀發(fā)送出。
AMR中SCR接收端方面,與發(fā)送端類似。接收幀的類型指示表2所示,這些類型與SCR發(fā)送部分的類型指示基本一致
表2接收端SCR操作和發(fā)送端SCR操作類似,有兩個(gè)主要模式語音模式(SPEECH)和舒適噪聲模式(COMFORT_NOISE)。初始的模式是語音模式,其具體操作過程是當(dāng)接收幀被確認(rèn)是SPEECH_GOOD幀時(shí),接收端SCR操作就進(jìn)入語音模式,并將接收到的幀直接傳送給語音解碼器。
如果接收到的幀被確定為SPEECH_BAD或NO_DATA,且此時(shí)的SCR操作是SPEECH模式,則接收到的語音幀將被替代或被弱化。
對于SCR操作處于舒適噪聲模式(COMFORT_NOISE)的情況,如果接收幀是SID_FIRST幀或SID_UPDATE幀,則SCR操作將會產(chǎn)生舒適背景噪聲;如果接收幀為SID_BAD的幀,則用靜音替代;如果接收幀為無用幀(NO_DATA,SPEECH_BAD),則忽略幀信息而持續(xù)產(chǎn)生舒適背景噪聲。
這樣的SCR機(jī)制,在某些情況下,語音編碼傳輸是存在編碼冗余的。這是因?yàn)椋瑢τ诎l(fā)送方通信環(huán)境變化緩慢的情況,也就是說,當(dāng)通話出現(xiàn)靜音時(shí)段,背景噪聲的變化是相對平穩(wěn)的,這時(shí)的SID_UPDATE幀依然是每8幀產(chǎn)生一個(gè)并發(fā)送到網(wǎng)絡(luò)傳輸,這顯然是沒有必要的。
因此,通過判決發(fā)送方通信環(huán)境的變化是否緩慢,而對變化緩慢的情況,延長SID_UPDATE幀的生成和發(fā)送周期,從而簡化編碼,降低網(wǎng)絡(luò)傳輸?shù)谋忍芈?,減輕網(wǎng)絡(luò)負(fù)擔(dān),是有可能實(shí)現(xiàn)的。
發(fā)明內(nèi)容
(一)要解決的技術(shù)問題本發(fā)明的目的是要克服目前現(xiàn)有技術(shù)的缺陷,提出一種能減小靜音模式時(shí)網(wǎng)絡(luò)傳輸速率的自適應(yīng)多速率(AMR)語音編碼中的源控制速率(SCR)實(shí)現(xiàn)方法,從而減少傳輸時(shí)對帶寬的占用,有效的節(jié)約網(wǎng)絡(luò)帶寬資源。
(二)技術(shù)方案本發(fā)明提出一種AMR語音編碼發(fā)送端的源控制速率(SCR)實(shí)現(xiàn)方法,其實(shí)現(xiàn)方法是,當(dāng)?shù)谝粋€(gè)SID_UPDATE幀傳送到網(wǎng)絡(luò)而且系統(tǒng)處于靜音模式,發(fā)送端SCR控制器以NL+8為周期計(jì)算并且傳送一個(gè)SID_UPDATE幀到網(wǎng)絡(luò)。
上述的AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方法,一種優(yōu)選的方案是,NL是8的倍數(shù)。
本發(fā)明還提出一種AMR語音編碼接收端的源控制速率(SCR)實(shí)現(xiàn)方法,它包括以下步驟(1)開始接收一個(gè)SID_UPDATE幀或SID_BAD幀;(2)SCR控制器中的內(nèi)存記錄步驟(1)所接收到的幀信息;(3)接收方SCR控制器中的計(jì)數(shù)器清零;(4)接收下一個(gè)幀,并進(jìn)行判決,如果這個(gè)幀是SID_UPDATE幀或SID_BAD幀,返回步驟(3),否則繼續(xù)步驟(5);(5)計(jì)數(shù)器加1;(6)判決計(jì)數(shù)器,如果計(jì)數(shù)器已經(jīng)加到7,繼續(xù)步驟(7),否則返回步驟(4);(7)用內(nèi)存中已記錄到的SID_UPDATE幀或SID_BAD幀作為當(dāng)前幀,替代的生成舒適噪聲。
上述的接收端的SCR實(shí)現(xiàn)方法,其中,步驟(1)所使用的內(nèi)存,位于接收端的SCR控制器內(nèi),用于存儲所接收的SID_UPDATE幀或SID_BAD幀的信息;步驟(2)所使用的計(jì)數(shù)器,位于接收端的SCR控制器內(nèi),用于計(jì)算所接收的幀的數(shù)目。
本發(fā)明提出一種AMR語音編碼的源控制速率(SCR)實(shí)現(xiàn)方法,它包括上述的AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方法,和上述的AMR語音編碼接收端的SCR實(shí)現(xiàn)方法。
(三)有益效果采用本發(fā)明的AMR語音編碼的源控制速率實(shí)現(xiàn)方法,具有以下優(yōu)點(diǎn)(1)使用了NO_DATA幀代替了一部分SID_UPDATE幀,由于NO_DATA幀是不含數(shù)據(jù)的,直接減少了需要在網(wǎng)絡(luò)里傳輸?shù)臄?shù)據(jù)量,所以節(jié)省了網(wǎng)絡(luò)的帶寬。
(2)節(jié)省了終端的計(jì)算量。具體的說就是,采用本發(fā)明的實(shí)現(xiàn)方法后,每(NL+8)幀傳送才一個(gè)SID_UPDATE幀,其余部分均傳送的是NO_DATA幀,因此減少了接收方的編碼運(yùn)算量。
雖然接收方SCR控制器需要加入一個(gè)計(jì)數(shù)器并且需要增加一些內(nèi)存,用于計(jì)數(shù)以及記錄上一個(gè)SID_UPDATE或者是SID_BAD幀,但是這些代價(jià)將比SID_UPDATE產(chǎn)生和傳送小的多。而且在發(fā)送方通信環(huán)境變化比較緩慢的情況下,接收方收到SID_UPDATE幀變少,使用上一次接收到的SID_UPDATE或者SID_BAD幀代替新的SID_UPDATE或者SID_BAD幀,對于語音質(zhì)量的影響是可以忽略的。
圖1為AMR語音編碼發(fā)送和接收的示意圖;圖2為采用本發(fā)明的實(shí)現(xiàn)方法和采用目前現(xiàn)有技術(shù)的標(biāo)準(zhǔn)方法,SCR的不同方案的對比示意圖;圖3為采用本發(fā)明的AMR語音編碼接收端的SCR實(shí)現(xiàn)方法的流程圖;圖4為采用本發(fā)明的AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方式,對不同的NL的取值,減少3幀所需要分析的幀的個(gè)數(shù)的函數(shù)關(guān)系圖;圖5為采用本發(fā)明的AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方式,對不同的N的取值,平均每一幀所能節(jié)省的幀數(shù)的個(gè)數(shù)的函數(shù)關(guān)系圖其中,1發(fā)送方;2、傳輸網(wǎng)絡(luò);3、接收方;4、NO_DATA幀;U1、U2、U3、U4、U5為SID_UPDATE幀;N為NO_DATA幀;具體實(shí)施方式
本發(fā)明提出AMR語音編碼源控制速率的實(shí)現(xiàn)方法,結(jié)合附圖和實(shí)施例說明如下。以下實(shí)施方式僅用于說明本發(fā)明,而并非對本發(fā)明的限制,有關(guān)技術(shù)領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明的精神和范圍的情況下,還可以做出各種變化和變型,因此所有等同的技術(shù)方案也屬于本發(fā)明的范疇,本發(fā)明的專利保護(hù)范圍應(yīng)由各權(quán)利要求限定。
(實(shí)施例一)現(xiàn)有技術(shù)的標(biāo)準(zhǔn)編碼方法中,靜音模式時(shí)(即VAD flag=“0”),當(dāng)?shù)谝粋€(gè)SID_FIRST幀傳送到網(wǎng)絡(luò)之后,發(fā)送端SCR控制器就要每隔一段時(shí)間計(jì)算并且傳送一個(gè)SID_UPDATE幀(即舒適背景噪聲)到網(wǎng)絡(luò)。SID_UPDATE幀是每8個(gè)幀產(chǎn)生并且傳送一次,即連續(xù)7個(gè)NO_DATA幀然后傳送1個(gè)SID_UPDATE幀。
在本實(shí)施例中,舉例說明NL=24的情況。
例如如圖1所示,在發(fā)送端,對32幀舒適噪聲,現(xiàn)有技術(shù)的編碼中,這32個(gè)幀內(nèi)含有4個(gè)SID_UPDATE幀和28個(gè)NO_DATA幀,而采用本發(fā)明的方法后,這32個(gè)幀內(nèi)只有1個(gè)SID_UPDATE幀,另外31個(gè)為NO_DATA幀。由于SID_UPDATE幀是含有信息量而NO_DATA幀是不含信息量的,因此采用本發(fā)明的方法后,在發(fā)送端。這32個(gè)幀中節(jié)省了3個(gè)幀的處理。
另一方面在接收端。對于這32個(gè)幀,其中只有1個(gè)SID_UPDATE幀,相對于現(xiàn)有標(biāo)準(zhǔn)編碼技術(shù),在本實(shí)施例中,網(wǎng)絡(luò)少傳輸了3個(gè)SID_UPDATE幀到接收端。因此,在接收端,必須相應(yīng)的生成3個(gè)SID_UPDATE幀,用于替代缺省的信息。具體的操作是,從接收端開始收到第一個(gè)SID_UPDATE幀開始,計(jì)數(shù)器清零。每收到一個(gè)NO_DATA幀計(jì)數(shù)器就加1,當(dāng)計(jì)數(shù)器加到7時(shí),這時(shí)接收端實(shí)際收到的還是NO_DATA幀,一個(gè)本應(yīng)接收到的SID_UPDATE幀被省略,因此,接收端把內(nèi)存中已記錄到的上一個(gè)SID_UPDATE幀替代這個(gè)缺省的幀,以便系統(tǒng)能正常的生成舒適噪聲。因此在這32個(gè)幀中,接收端會生成總共3個(gè)SID_UPDATE幀,替代缺省掉的信息。
可見,采用本發(fā)明的實(shí)施方法后,由原來的每8幀傳送一個(gè)SID_UPDATE幀,變?yōu)槊?NL+8)幀才傳送一個(gè)SID_UPDATE幀(包括1個(gè)SID_UPDATE幀和(NL+7)個(gè)NO_DATA幀,其中NO_DATA幀不含數(shù)據(jù)),有效的減少了NL/8個(gè)幀的傳輸。
(實(shí)施例二)本實(shí)施例中,以平均每減少3幀為例,平均所需要分析的幀數(shù),如表3所示
表3經(jīng)分析,可以發(fā)現(xiàn)每減少3幀平均所需幀數(shù)F滿足F=4+3*ModeMode+1·8]]>或F=24(NL+8)NL]]>其中,Mode為各種情況的取值,即可取0,1,2,3。
如實(shí)施例1所述的,對于NL=24的情況,每32個(gè)幀能減少3個(gè)SID_UPDATE幀。而對于極限的情況,例如對NL取無限大,平均計(jì)算下來的結(jié)果,由于limNL→∞24(NL+8)NL=24,]]>所以可知平均每減少3幀所需幀數(shù)的極限值為24。從表3中可以看出4種情況,其中對于情況3,每104幀生成一個(gè)SID_UPDATE幀,總共可以節(jié)省12幀,即平均每節(jié)省3幀所需要分析的幀數(shù)是26,這個(gè)效率已經(jīng)比較接近極限情況了。
函數(shù)關(guān)系如圖4所示,其中,橫軸為NL,縱軸為當(dāng)前NL的取值下,減少3幀所需要分析的幀的個(gè)數(shù)。
可見,由于limNL→∞NL/8NL+8=18=324,]]>所以在NL=N3=96即總共分析104幀時(shí),幀數(shù)節(jié)省的情況已經(jīng)很接近上限了。
對于圖5,其中NL=N0=24時(shí),幀產(chǎn)生和傳送的減少率為9.375%;NL=N1=48時(shí),幀產(chǎn)生和傳送的減少率為10.714%;NL=N2=72,幀產(chǎn)生和傳送的減少率為11.249%;NL=N3=96,幀產(chǎn)生和傳送的減少率為11.538%??梢婋S著NL的增加,幀產(chǎn)生和傳送的減少率會上升,其極限值是12.500%。
(實(shí)施例三)本發(fā)明的方法可以工作在兩種工作模式下面原始模式和增強(qiáng)模式。原始模式和現(xiàn)有技術(shù)的標(biāo)準(zhǔn)編碼方法是一致的,增強(qiáng)方法即采用本發(fā)明的方法。在實(shí)施例中,將模式表示為一個(gè)比特,其中“0”表示系統(tǒng)工作原始模式,即采用現(xiàn)有技術(shù)的標(biāo)準(zhǔn)編碼,“1”表現(xiàn)系統(tǒng)處于增強(qiáng)模式,即采用本發(fā)明的方法進(jìn)行編碼;再定義2個(gè)比特x和y,用于表示所采用的NL的值,N0=24,N1=48,N2=72,N3=96,對應(yīng)的x和y的值分別是00、01、10、11。將這三個(gè)比特的信息都放進(jìn)SID_FIRST的幀型表示域中。具體值定義如表4和表5所示
表4
表5這樣,當(dāng)系統(tǒng)解析這些信息,例如得到的數(shù)據(jù)是“100”時(shí),表示這時(shí)系統(tǒng)工作于增強(qiáng)模式,采用本發(fā)明提出的方法進(jìn)行編碼。其中NL的取值是24,也就是說,在靜音狀態(tài)下,AMR語音編碼發(fā)送端的SCR控制器以32個(gè)幀為周期,發(fā)送一個(gè)SID_UPDATE幀到網(wǎng)絡(luò)。而接收端在正常的情況下,每32個(gè)幀才會收到一個(gè)SID_UPDATE幀,相對于標(biāo)準(zhǔn)的編碼方法,在同樣長的靜音時(shí)段內(nèi)少接收了3個(gè)SID_UPDATE幀,因此接收端會把內(nèi)存中存儲的上一次接收到的惡SID_UPDATE幀作為替代的幀信息,替代這3個(gè)被省略了的SID_UPDATE幀,以保證舒適噪聲能正常生成。
關(guān)于通信環(huán)境變化是否緩慢的方面。發(fā)送方可以根據(jù)物理層的技術(shù)獲得發(fā)送方移動速度的信息。如果移動速度比較慢或者根本不動,就認(rèn)為通信環(huán)境變化變化緩慢;反之,如果移動速度很快,就認(rèn)為通信環(huán)境變化不緩慢。根據(jù)物理層的技術(shù)獲得發(fā)送方移動快速度的信息屬于現(xiàn)有技術(shù),因此不再贅述。對于發(fā)送方的通信環(huán)境變化的比較快的情況,可以在傳送SID_FIRST和SID_UPDATE幀時(shí)將它們的模式比特標(biāo)示為“0”,這時(shí)系統(tǒng)恢復(fù)工作在標(biāo)準(zhǔn)模式,因此接收方會采用現(xiàn)有技術(shù)中標(biāo)準(zhǔn)編碼方法工作。而對于發(fā)送方的通信環(huán)境變化的比較慢,則可以在傳送SID_FIRST和SID_UPDATE幀時(shí)將模式比特標(biāo)示為“1”,讓系統(tǒng)工作在增強(qiáng)模式,即采用本發(fā)明的方法進(jìn)行SCR操作。
權(quán)利要求
1.一種AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方法,其特征在于,當(dāng)?shù)谝粋€(gè)SID_UPDATE幀傳送到網(wǎng)絡(luò)而且系統(tǒng)處于靜音模式,發(fā)送端SCR控制器以NL+8為周期計(jì)算并且傳送一個(gè)SID_UPDATE幀到網(wǎng)絡(luò)。
2.如權(quán)利要求1所述的AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方法,其特征在于,NL是8的倍數(shù)。
3.一種AMR語音編碼接收端的SCR實(shí)現(xiàn)方法,其特征在于,它包括以下步驟(1)開始接收一個(gè)SID_UPDATE幀或SID_BAD幀;(2)SCR控制器中的內(nèi)存記錄步驟(1)所接收到的幀信息;(3)接收方SCR控制器中的計(jì)數(shù)器清零;(4)接收下一個(gè)幀,并進(jìn)行判決,如果這個(gè)幀是SID_UPDATE幀或SID_BAD幀,返回步驟(3),否則繼續(xù)步驟(5);(5)計(jì)數(shù)器加1;(6)判決計(jì)數(shù)器,如果計(jì)數(shù)器已經(jīng)加到7,繼續(xù)步驟(7),否則返回步驟(4);(7)用內(nèi)存中已記錄到的SID_UPDATE幀或SID_BAD幀作為當(dāng)前幀,替代的生成舒適噪聲。
4.如權(quán)利要求3所述的接收端的SCR實(shí)現(xiàn)方法,其特征在于,步驟(1)所使用的內(nèi)存,位于接收端的SCR控制器內(nèi),用于存儲所接收的SID_UPDATE幀或SID_BAD幀的信息。
5.如權(quán)利要求4所述的接收端的SCR實(shí)現(xiàn)方法,其特征在于,步驟(2)所使用的計(jì)數(shù)器,位于接收端的SCR控制器內(nèi),用于計(jì)算所接收的幀的數(shù)目。
6.一種AMR語音編碼的SCR實(shí)現(xiàn)方法,其特征在于,它包括如權(quán)利要求2所述的AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方法,以及如權(quán)利要求5所述的AMR語音編碼接收端的SCR實(shí)現(xiàn)方法。
全文摘要
本發(fā)明涉及語音編碼領(lǐng)域。本文提出一種AMR語音編碼的源控制速率(SCR)實(shí)現(xiàn)方法,它包括AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方法,和AMR語音編碼接收端的SCR實(shí)現(xiàn)方法。其中AMR語音編碼發(fā)送端相隔更長的時(shí)間周期才發(fā)送一個(gè)靜音幀,而接收端每隔一段時(shí)間需要計(jì)算并生成一個(gè)靜音幀,用以替代被發(fā)送端缺省掉的靜音幀,使得舒適噪聲能順利生成。采用本發(fā)明的方法,能有效的能減小網(wǎng)絡(luò)對靜音幀的發(fā)送,降低靜音模式時(shí)網(wǎng)絡(luò)的傳輸速率,從而減少傳輸時(shí)對帶寬的占用,有效的節(jié)約網(wǎng)絡(luò)帶寬資源。
文檔編號G10L19/00GK1753349SQ20051008674
公開日2006年3月29日 申請日期2005年10月31日 優(yōu)先權(quán)日2005年10月31日
發(fā)明者何志斌, 李從兵, 郭更生, 王民 申請人:連展科技(天津)有限公司