一種amr語音編碼的源控制速率實(shí)現(xiàn)方法

文檔序號：2822392閱讀：260來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種amr語音編碼的源控制速率實(shí)現(xiàn)方法
技術(shù)領(lǐng)域：
本發(fā)明涉及語音編碼領(lǐng)域，具體的涉及AMR語音編碼中的源控制速率的實(shí)現(xiàn)方法。
背景技術(shù)：
自適應(yīng)多速率(AMRAdaptive Multi Rate)語音編碼是第三代移動通信標(biāo)準(zhǔn)化的伙伴項(xiàng)目(3GPP)制定的用于第三代移動通信WCDMA系統(tǒng)中的語音壓縮編碼技術(shù)。它與以前的移動通信語音編碼方式區(qū)別之一在于，以前的移動通信語音編碼采用的是固定的編碼速率。但人類在進(jìn)行語音通信時(shí)，大約有70％左右的空閑時(shí)間是沒有講話的，因此，始終用一個(gè)速率進(jìn)行語音編碼對信道資源是一種浪費(fèi)。另外，隨著移動通信的發(fā)展，尤其是第三代移動通信系統(tǒng)，對采用較低的編碼速率進(jìn)行語音編碼，從而增加系統(tǒng)容量和獲得較高的語音通話質(zhì)量方面提出了更高的要求。因此，傳統(tǒng)的移動語音編碼技術(shù)，因?yàn)槠鋯我坏娜蒎e度的特點(diǎn)，所以很難同時(shí)滿足這兩個(gè)要求。
AMR聲碼器原理方面，它采用了多速率碼激勵線性預(yù)測(MR-ACELP)的編碼技術(shù)。這種方式基于碼激勵線性預(yù)測(CELP)編碼模式，用全極點(diǎn)線性濾波器模擬語音特性。
AMR聲碼器由以下幾個(gè)部分組成多速率語音編碼器，源控制速率(SCR)方案(包括語音激勵檢測器和舒適噪聲生成系統(tǒng))，對抗傳輸錯誤和丟包帶來的影響的差錯隱藏機(jī)制。AMR語音編碼是讓容錯度隨無線信道和傳輸環(huán)境的改變而改變，動態(tài)地在信源編碼和信道編碼之間調(diào)整比特分配，即所謂的自適應(yīng)。AMR以20ms的語音作為一幀進(jìn)行處理，每一幀又分為4個(gè)5ms的子幀。AMR提供了八種速率模式12.2kbps、10.2kbps、7.95kbps、7.40kbps、6.70kbps、5.90kbps、5.15kbps和4.75kbps，并且在每幀的邊界處可以在8種源速率之間進(jìn)行切換，實(shí)際采用哪種語音速率主要取決于現(xiàn)存的無線信道環(huán)境，這樣就使得無線資源的配置與利用更加靈活高效。
源控制速率(SCR)技術(shù)是AMR編碼器的重要組成部分。該操作是針對輸入信號僅為背景噪聲的情況下，采用比通常情況低的比特速率(1.80kbps)進(jìn)行編碼，以節(jié)省用戶設(shè)備的耗電量并降低整個(gè)網(wǎng)絡(luò)的干擾與負(fù)載。
SCR機(jī)制要求發(fā)射端的語音激勵檢測器(VAD)對背景噪聲進(jìn)行評價(jià)，并將特征參數(shù)發(fā)送給接收端；如果發(fā)送端被關(guān)掉或接收端沒有收到有效的語音信號，則接收端要生成舒適噪聲。另外，如果接收端接收到的參數(shù)由于傳輸差錯而嚴(yán)重惡化，則在接收端必須由替代的數(shù)據(jù)生成語音或舒適噪聲(comfort noise)，從而避免產(chǎn)生令人討厭的效果。
SCR的一個(gè)基本問題是如果發(fā)送端被關(guān)掉，則和語音一起發(fā)送的背景噪聲也會消失，從而導(dǎo)致背景噪聲不連續(xù)。由于SCR的切換是頻繁發(fā)生的，因此這種背景噪聲不連續(xù)的效果會使接聽者非常惱火，尤其是在背景噪聲很大的情況下，例如在汽車?yán)?。在惡劣的情況下，語音可能甚至?xí)缀趼牪欢?br> 解決的方法是，接收端通過生成與發(fā)射端背景噪聲類似的合成噪聲，來克服這種問題。當(dāng)不存在語音信號時(shí)，發(fā)送端會進(jìn)行舒適噪聲參數(shù)的估計(jì)，所得結(jié)果發(fā)送到接收端。這使得接收端生成的舒適噪聲可以適應(yīng)發(fā)射端噪聲水平的變化。
具體來說，SCR操作會在發(fā)送端進(jìn)行語音激活檢測(VAD)，這個(gè)檢測用于判決當(dāng)前的會話狀態(tài)是出于語音狀態(tài)還是無聲狀態(tài)，并相應(yīng)的對背景噪聲進(jìn)行評價(jià)，將所得有關(guān)的特征參數(shù)傳送給接收端(RX)。對沒有語音信號的期間，接收端就依據(jù)這些特征參數(shù)生成與發(fā)送端類似的舒適背景噪聲。
AMR中SCR操作如圖1所示。其中，發(fā)送端的SCR操作包括3部分，分別是語音編碼、語音激活檢測(VAD)、舒適背景噪聲計(jì)算。其中，語音編碼部分發(fā)送語音的信息比特，VAD部分發(fā)送模式指示部分，舒適背景噪聲計(jì)算部分計(jì)算發(fā)射端的背景噪聲的有關(guān)特征參數(shù)，并發(fā)送到傳輸網(wǎng)絡(luò)。這些信息被打包傳輸?shù)骄W(wǎng)絡(luò)部分并分類，再由接收端接收。接收端的SCR操作也包括3部分，分別是語音解碼、信息隱藏、舒適背景噪聲生成。其中，語音解碼部分把接收到的信息比特解碼成語音，錯誤隱藏部分接收VAD的模式指示，舒適背景噪聲生成部分根據(jù)接收類型，生成舒適背景噪聲。
如果網(wǎng)絡(luò)發(fā)出了有關(guān)命令，在發(fā)送端的用戶設(shè)備中已經(jīng)執(zhí)行SCR操作，則在接收端，無論接收方是否采用SCR接收，都將進(jìn)行SCR操作。
在3GPP發(fā)布的技術(shù)規(guī)范26.093《源控制速率操作》中規(guī)定，接收方所有的SCR操作都是由接收方SCR控制器控制的，接收方SCR控制器包括了2個(gè)主要的模式語音模式和舒適噪聲模式，其中語音模式是它的初始模式。
SCR中，幀的內(nèi)容包括信息比特、速率指示和發(fā)送類型，其中發(fā)送類型用于說明發(fā)送幀中的類型。它包括2種語音信息幀和3種靜音幀(Silence Description，即SID)和1種空幀，其中，根據(jù)3GPP發(fā)布的技術(shù)規(guī)范26.101《AMR語音編解碼器；幀結(jié)構(gòu)》，如果接收方接收到SID_FIRST，SID_UPDATE或者SID_BAD幀，接收方SCR控制器會進(jìn)入舒適噪聲狀態(tài)并且引起舒適噪聲產(chǎn)生，其中SID_BAD幀會被替代或者靜音處理。只要接收方SCR控制器在舒適噪聲模式下，它將忽略所有無用的信息幀(譬如NO_DATA幀，SPEECH_BAD幀)，這樣舒適噪聲會一直產(chǎn)生。表1給出了6種幀的類型

表1這些幀識別信息會隨著幀信息在網(wǎng)絡(luò)中傳輸。其中，SPEECH_GOOD幀表示當(dāng)前幀是一個(gè)有效的語音信息被編碼后的信息幀；SID_FIRST幀出現(xiàn)在語音結(jié)束之后，表示從當(dāng)前幀開始處于靜音模式；如果出現(xiàn)持續(xù)的靜音時(shí)段，就會出現(xiàn)SID_UPDATE幀，這個(gè)幀具體在SID_FIRST幀后的第三個(gè)幀出現(xiàn)，并以每8個(gè)幀為周期重復(fù)出現(xiàn)，直到靜音時(shí)段結(jié)束。
如果遇突發(fā)事件使發(fā)送端SCR功能喪失，發(fā)送端將連續(xù)產(chǎn)生語音幀，并且將幀類型標(biāo)志為“SPEECH_GOOD”；如果發(fā)送端SCR操作正常運(yùn)行，則采用VAD標(biāo)志(VAD flag)來控制SCR操作。
為確保發(fā)送端SCR操作正常運(yùn)行，在系統(tǒng)重新設(shè)置后，所有幀都被視為無限長的語音幀。在接收端，為確保舒適背景噪聲參數(shù)的正確估計(jì)，重新設(shè)置后的前7幀都必須指示為語音幀(即幀類型標(biāo)志為“SPEECH_GOOD”)，即使VAD指示為無聲狀態(tài)(VAD flag＝“0”)。
VAD將一直運(yùn)行，以便對每幀進(jìn)行評估，確定當(dāng)前幀是否為語音幀。其輸出VAD指示(VAD flag)是一個(gè)二進(jìn)制標(biāo)志符，當(dāng)VAD flag＝“1”時(shí)，語音編碼輸出幀將被加上“SPEECH_GOOD”型標(biāo)志，意味著當(dāng)前幀是個(gè)有效的語音幀，并直接通過網(wǎng)絡(luò)發(fā)送出去。
當(dāng)VAD flag＝“1”轉(zhuǎn)變?yōu)閂AD flag＝“0”時(shí)，即表示一段語音結(jié)束，這時(shí)會出現(xiàn)8個(gè)連續(xù)幀用于表示一個(gè)靜音幀(SID)，即所謂的延遲保護(hù)。具體操作是在語音結(jié)束后的前7幀都加上“SPEECH_GOOD”標(biāo)示，并直接傳輸?shù)骄W(wǎng)絡(luò)，而第8幀標(biāo)示為“SID_FIRST”，SID_FIRST幀不包含數(shù)據(jù)。
一旦SID_FIRST幀被發(fā)送出去，只要VAD flag＝“0”，即表示出現(xiàn)連續(xù)的無語音時(shí)段，發(fā)送端就會周期的(每8幀)發(fā)送SID_UPDATE幀。需要注意的是，第1個(gè)SID_UPDATE幀是在SID_FIRST幀后的第3個(gè)幀發(fā)送出。
AMR中SCR接收端方面，與發(fā)送端類似。接收幀的類型指示表2所示，這些類型與SCR發(fā)送部分的類型指示基本一致

表2接收端SCR操作和發(fā)送端SCR操作類似，有兩個(gè)主要模式語音模式(SPEECH)和舒適噪聲模式(COMFORT_NOISE)。初始的模式是語音模式，其具體操作過程是當(dāng)接收幀被確認(rèn)是SPEECH_GOOD幀時(shí)，接收端SCR操作就進(jìn)入語音模式，并將接收到的幀直接傳送給語音解碼器。
如果接收到的幀被確定為SPEECH_BAD或NO_DATA，且此時(shí)的SCR操作是SPEECH模式，則接收到的語音幀將被替代或被弱化。
對于SCR操作處于舒適噪聲模式(COMFORT_NOISE)的情況，如果接收幀是SID_FIRST幀或SID_UPDATE幀，則SCR操作將會產(chǎn)生舒適背景噪聲；如果接收幀為SID_BAD的幀，則用靜音替代；如果接收幀為無用幀(NO_DATA，SPEECH_BAD)，則忽略幀信息而持續(xù)產(chǎn)生舒適背景噪聲。
這樣的SCR機(jī)制，在某些情況下，語音編碼傳輸是存在編碼冗余的。這是因?yàn)椋瑢τ诎l(fā)送方通信環(huán)境變化緩慢的情況，也就是說，當(dāng)通話出現(xiàn)靜音時(shí)段，背景噪聲的變化是相對平穩(wěn)的，這時(shí)的SID_UPDATE幀依然是每8幀產(chǎn)生一個(gè)并發(fā)送到網(wǎng)絡(luò)傳輸，這顯然是沒有必要的。
因此，通過判決發(fā)送方通信環(huán)境的變化是否緩慢，而對變化緩慢的情況，延長SID_UPDATE幀的生成和發(fā)送周期，從而簡化編碼，降低網(wǎng)絡(luò)傳輸?shù)谋忍芈?，減輕網(wǎng)絡(luò)負(fù)擔(dān)，是有可能實(shí)現(xiàn)的。

發(fā)明內(nèi)容
(一)要解決的技術(shù)問題本發(fā)明的目的是要克服目前現(xiàn)有技術(shù)的缺陷，提出一種能減小靜音模式時(shí)網(wǎng)絡(luò)傳輸速率的自適應(yīng)多速率(AMR)語音編碼中的源控制速率(SCR)實(shí)現(xiàn)方法，從而減少傳輸時(shí)對帶寬的占用，有效的節(jié)約網(wǎng)絡(luò)帶寬資源。
(二)技術(shù)方案本發(fā)明提出一種AMR語音編碼發(fā)送端的源控制速率(SCR)實(shí)現(xiàn)方法，其實(shí)現(xiàn)方法是，當(dāng)?shù)谝粋€(gè)SID_UPDATE幀傳送到網(wǎng)絡(luò)而且系統(tǒng)處于靜音模式，發(fā)送端SCR控制器以NL+8為周期計(jì)算并且傳送一個(gè)SID_UPDATE幀到網(wǎng)絡(luò)。
上述的AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方法，一種優(yōu)選的方案是，NL是8的倍數(shù)。
本發(fā)明還提出一種AMR語音編碼接收端的源控制速率(SCR)實(shí)現(xiàn)方法，它包括以下步驟(1)開始接收一個(gè)SID_UPDATE幀或SID_BAD幀；(2)SCR控制器中的內(nèi)存記錄步驟(1)所接收到的幀信息；(3)接收方SCR控制器中的計(jì)數(shù)器清零；(4)接收下一個(gè)幀，并進(jìn)行判決，如果這個(gè)幀是SID_UPDATE幀或SID_BAD幀，返回步驟(3)，否則繼續(xù)步驟(5)；(5)計(jì)數(shù)器加1；(6)判決計(jì)數(shù)器，如果計(jì)數(shù)器已經(jīng)加到7，繼續(xù)步驟(7)，否則返回步驟(4)；(7)用內(nèi)存中已記錄到的SID_UPDATE幀或SID_BAD幀作為當(dāng)前幀，替代的生成舒適噪聲。
上述的接收端的SCR實(shí)現(xiàn)方法，其中，步驟(1)所使用的內(nèi)存，位于接收端的SCR控制器內(nèi)，用于存儲所接收的SID_UPDATE幀或SID_BAD幀的信息；步驟(2)所使用的計(jì)數(shù)器，位于接收端的SCR控制器內(nèi)，用于計(jì)算所接收的幀的數(shù)目。
本發(fā)明提出一種AMR語音編碼的源控制速率(SCR)實(shí)現(xiàn)方法，它包括上述的AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方法，和上述的AMR語音編碼接收端的SCR實(shí)現(xiàn)方法。
(三)有益效果采用本發(fā)明的AMR語音編碼的源控制速率實(shí)現(xiàn)方法，具有以下優(yōu)點(diǎn)(1)使用了NO_DATA幀代替了一部分SID_UPDATE幀，由于NO_DATA幀是不含數(shù)據(jù)的，直接減少了需要在網(wǎng)絡(luò)里傳輸?shù)臄?shù)據(jù)量，所以節(jié)省了網(wǎng)絡(luò)的帶寬。
(2)節(jié)省了終端的計(jì)算量。具體的說就是，采用本發(fā)明的實(shí)現(xiàn)方法后，每(NL+8)幀傳送才一個(gè)SID_UPDATE幀，其余部分均傳送的是NO_DATA幀，因此減少了接收方的編碼運(yùn)算量。
雖然接收方SCR控制器需要加入一個(gè)計(jì)數(shù)器并且需要增加一些內(nèi)存，用于計(jì)數(shù)以及記錄上一個(gè)SID_UPDATE或者是SID_BAD幀，但是這些代價(jià)將比SID_UPDATE產(chǎn)生和傳送小的多。而且在發(fā)送方通信環(huán)境變化比較緩慢的情況下，接收方收到SID_UPDATE幀變少，使用上一次接收到的SID_UPDATE或者SID_BAD幀代替新的SID_UPDATE或者SID_BAD幀，對于語音質(zhì)量的影響是可以忽略的。

圖1為AMR語音編碼發(fā)送和接收的示意圖；圖2為采用本發(fā)明的實(shí)現(xiàn)方法和采用目前現(xiàn)有技術(shù)的標(biāo)準(zhǔn)方法，SCR的不同方案的對比示意圖；圖3為采用本發(fā)明的AMR語音編碼接收端的SCR實(shí)現(xiàn)方法的流程圖；圖4為采用本發(fā)明的AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方式，對不同的NL的取值，減少3幀所需要分析的幀的個(gè)數(shù)的函數(shù)關(guān)系圖；圖5為采用本發(fā)明的AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方式，對不同的N的取值，平均每一幀所能節(jié)省的幀數(shù)的個(gè)數(shù)的函數(shù)關(guān)系圖其中，1發(fā)送方；2、傳輸網(wǎng)絡(luò)；3、接收方；4、NO_DATA幀；U1、U2、U3、U4、U5為SID_UPDATE幀；N為NO_DATA幀；具體實(shí)施方式
本發(fā)明提出AMR語音編碼源控制速率的實(shí)現(xiàn)方法，結(jié)合附圖和實(shí)施例說明如下。以下實(shí)施方式僅用于說明本發(fā)明，而并非對本發(fā)明的限制，有關(guān)技術(shù)領(lǐng)域的普通技術(shù)人員，在不脫離本發(fā)明的精神和范圍的情況下，還可以做出各種變化和變型，因此所有等同的技術(shù)方案也屬于本發(fā)明的范疇，本發(fā)明的專利保護(hù)范圍應(yīng)由各權(quán)利要求限定。
(實(shí)施例一)現(xiàn)有技術(shù)的標(biāo)準(zhǔn)編碼方法中，靜音模式時(shí)(即VAD flag＝“0”)，當(dāng)?shù)谝粋€(gè)SID_FIRST幀傳送到網(wǎng)絡(luò)之后，發(fā)送端SCR控制器就要每隔一段時(shí)間計(jì)算并且傳送一個(gè)SID_UPDATE幀(即舒適背景噪聲)到網(wǎng)絡(luò)。SID_UPDATE幀是每8個(gè)幀產(chǎn)生并且傳送一次，即連續(xù)7個(gè)NO_DATA幀然后傳送1個(gè)SID_UPDATE幀。
在本實(shí)施例中，舉例說明NL＝24的情況。
例如如圖1所示，在發(fā)送端，對32幀舒適噪聲，現(xiàn)有技術(shù)的編碼中，這32個(gè)幀內(nèi)含有4個(gè)SID_UPDATE幀和28個(gè)NO_DATA幀，而采用本發(fā)明的方法后，這32個(gè)幀內(nèi)只有1個(gè)SID_UPDATE幀，另外31個(gè)為NO_DATA幀。由于SID_UPDATE幀是含有信息量而NO_DATA幀是不含信息量的，因此采用本發(fā)明的方法后，在發(fā)送端。這32個(gè)幀中節(jié)省了3個(gè)幀的處理。
另一方面在接收端。對于這32個(gè)幀，其中只有1個(gè)SID_UPDATE幀，相對于現(xiàn)有標(biāo)準(zhǔn)編碼技術(shù)，在本實(shí)施例中，網(wǎng)絡(luò)少傳輸了3個(gè)SID_UPDATE幀到接收端。因此，在接收端，必須相應(yīng)的生成3個(gè)SID_UPDATE幀，用于替代缺省的信息。具體的操作是，從接收端開始收到第一個(gè)SID_UPDATE幀開始，計(jì)數(shù)器清零。每收到一個(gè)NO_DATA幀計(jì)數(shù)器就加1，當(dāng)計(jì)數(shù)器加到7時(shí)，這時(shí)接收端實(shí)際收到的還是NO_DATA幀，一個(gè)本應(yīng)接收到的SID_UPDATE幀被省略，因此，接收端把內(nèi)存中已記錄到的上一個(gè)SID_UPDATE幀替代這個(gè)缺省的幀，以便系統(tǒng)能正常的生成舒適噪聲。因此在這32個(gè)幀中，接收端會生成總共3個(gè)SID_UPDATE幀，替代缺省掉的信息。
可見，采用本發(fā)明的實(shí)施方法后，由原來的每8幀傳送一個(gè)SID_UPDATE幀，變?yōu)槊?NL+8)幀才傳送一個(gè)SID_UPDATE幀(包括1個(gè)SID_UPDATE幀和(NL+7)個(gè)NO_DATA幀，其中NO_DATA幀不含數(shù)據(jù))，有效的減少了NL/8個(gè)幀的傳輸。
(實(shí)施例二)本實(shí)施例中，以平均每減少3幀為例，平均所需要分析的幀數(shù)，如表3所示

表3經(jīng)分析，可以發(fā)現(xiàn)每減少3幀平均所需幀數(shù)F滿足F=4+3*ModeMode+1·8]]>或F=24(NL+8)NL]]>其中，Mode為各種情況的取值，即可取0，1，2，3。
如實(shí)施例1所述的，對于NL＝24的情況，每32個(gè)幀能減少3個(gè)SID_UPDATE幀。而對于極限的情況，例如對NL取無限大，平均計(jì)算下來的結(jié)果，由于limNL&RightArrow;∞24(NL+8)NL=24,]]>所以可知平均每減少3幀所需幀數(shù)的極限值為24。從表3中可以看出4種情況，其中對于情況3，每104幀生成一個(gè)SID_UPDATE幀，總共可以節(jié)省12幀，即平均每節(jié)省3幀所需要分析的幀數(shù)是26，這個(gè)效率已經(jīng)比較接近極限情況了。
函數(shù)關(guān)系如圖4所示，其中，橫軸為NL，縱軸為當(dāng)前NL的取值下，減少3幀所需要分析的幀的個(gè)數(shù)。
可見，由于limNL&RightArrow;∞NL/8NL+8=18=324,]]>所以在NL＝N3＝96即總共分析104幀時(shí)，幀數(shù)節(jié)省的情況已經(jīng)很接近上限了。
對于圖5，其中NL＝N0＝24時(shí)，幀產(chǎn)生和傳送的減少率為9.375％；NL＝N1＝48時(shí)，幀產(chǎn)生和傳送的減少率為10.714％；NL＝N2＝72，幀產(chǎn)生和傳送的減少率為11.249％；NL＝N3＝96，幀產(chǎn)生和傳送的減少率為11.538％?？梢婋S著NL的增加，幀產(chǎn)生和傳送的減少率會上升，其極限值是12.500％。
(實(shí)施例三)本發(fā)明的方法可以工作在兩種工作模式下面原始模式和增強(qiáng)模式。原始模式和現(xiàn)有技術(shù)的標(biāo)準(zhǔn)編碼方法是一致的，增強(qiáng)方法即采用本發(fā)明的方法。在實(shí)施例中，將模式表示為一個(gè)比特，其中“0”表示系統(tǒng)工作原始模式，即采用現(xiàn)有技術(shù)的標(biāo)準(zhǔn)編碼，“1”表現(xiàn)系統(tǒng)處于增強(qiáng)模式，即采用本發(fā)明的方法進(jìn)行編碼；再定義2個(gè)比特x和y，用于表示所采用的NL的值，N0＝24，N1＝48，N2＝72，N3＝96，對應(yīng)的x和y的值分別是00、01、10、11。將這三個(gè)比特的信息都放進(jìn)SID_FIRST的幀型表示域中。具體值定義如表4和表5所示

表4

表5這樣，當(dāng)系統(tǒng)解析這些信息，例如得到的數(shù)據(jù)是“100”時(shí)，表示這時(shí)系統(tǒng)工作于增強(qiáng)模式，采用本發(fā)明提出的方法進(jìn)行編碼。其中NL的取值是24，也就是說，在靜音狀態(tài)下，AMR語音編碼發(fā)送端的SCR控制器以32個(gè)幀為周期，發(fā)送一個(gè)SID_UPDATE幀到網(wǎng)絡(luò)。而接收端在正常的情況下，每32個(gè)幀才會收到一個(gè)SID_UPDATE幀，相對于標(biāo)準(zhǔn)的編碼方法，在同樣長的靜音時(shí)段內(nèi)少接收了3個(gè)SID_UPDATE幀，因此接收端會把內(nèi)存中存儲的上一次接收到的惡SID_UPDATE幀作為替代的幀信息，替代這3個(gè)被省略了的SID_UPDATE幀，以保證舒適噪聲能正常生成。
關(guān)于通信環(huán)境變化是否緩慢的方面。發(fā)送方可以根據(jù)物理層的技術(shù)獲得發(fā)送方移動速度的信息。如果移動速度比較慢或者根本不動，就認(rèn)為通信環(huán)境變化變化緩慢；反之，如果移動速度很快，就認(rèn)為通信環(huán)境變化不緩慢。根據(jù)物理層的技術(shù)獲得發(fā)送方移動快速度的信息屬于現(xiàn)有技術(shù)，因此不再贅述。對于發(fā)送方的通信環(huán)境變化的比較快的情況，可以在傳送SID_FIRST和SID_UPDATE幀時(shí)將它們的模式比特標(biāo)示為“0”，這時(shí)系統(tǒng)恢復(fù)工作在標(biāo)準(zhǔn)模式，因此接收方會采用現(xiàn)有技術(shù)中標(biāo)準(zhǔn)編碼方法工作。而對于發(fā)送方的通信環(huán)境變化的比較慢，則可以在傳送SID_FIRST和SID_UPDATE幀時(shí)將模式比特標(biāo)示為“1”，讓系統(tǒng)工作在增強(qiáng)模式，即采用本發(fā)明的方法進(jìn)行SCR操作。
權(quán)利要求
1.一種AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方法，其特征在于，當(dāng)?shù)谝粋€(gè)SID_UPDATE幀傳送到網(wǎng)絡(luò)而且系統(tǒng)處于靜音模式，發(fā)送端SCR控制器以NL+8為周期計(jì)算并且傳送一個(gè)SID_UPDATE幀到網(wǎng)絡(luò)。
2.如權(quán)利要求1所述的AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方法，其特征在于，NL是8的倍數(shù)。
3.一種AMR語音編碼接收端的SCR實(shí)現(xiàn)方法，其特征在于，它包括以下步驟(1)開始接收一個(gè)SID_UPDATE幀或SID_BAD幀；(2)SCR控制器中的內(nèi)存記錄步驟(1)所接收到的幀信息；(3)接收方SCR控制器中的計(jì)數(shù)器清零；(4)接收下一個(gè)幀，并進(jìn)行判決，如果這個(gè)幀是SID_UPDATE幀或SID_BAD幀，返回步驟(3)，否則繼續(xù)步驟(5)；(5)計(jì)數(shù)器加1；(6)判決計(jì)數(shù)器，如果計(jì)數(shù)器已經(jīng)加到7，繼續(xù)步驟(7)，否則返回步驟(4)；(7)用內(nèi)存中已記錄到的SID_UPDATE幀或SID_BAD幀作為當(dāng)前幀，替代的生成舒適噪聲。
4.如權(quán)利要求3所述的接收端的SCR實(shí)現(xiàn)方法，其特征在于，步驟(1)所使用的內(nèi)存，位于接收端的SCR控制器內(nèi)，用于存儲所接收的SID_UPDATE幀或SID_BAD幀的信息。
5.如權(quán)利要求4所述的接收端的SCR實(shí)現(xiàn)方法，其特征在于，步驟(2)所使用的計(jì)數(shù)器，位于接收端的SCR控制器內(nèi)，用于計(jì)算所接收的幀的數(shù)目。
6.一種AMR語音編碼的SCR實(shí)現(xiàn)方法，其特征在于，它包括如權(quán)利要求2所述的AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方法，以及如權(quán)利要求5所述的AMR語音編碼接收端的SCR實(shí)現(xiàn)方法。
全文摘要
本發(fā)明涉及語音編碼領(lǐng)域。本文提出一種AMR語音編碼的源控制速率(SCR)實(shí)現(xiàn)方法，它包括AMR語音編碼發(fā)送端的SCR實(shí)現(xiàn)方法，和AMR語音編碼接收端的SCR實(shí)現(xiàn)方法。其中AMR語音編碼發(fā)送端相隔更長的時(shí)間周期才發(fā)送一個(gè)靜音幀，而接收端每隔一段時(shí)間需要計(jì)算并生成一個(gè)靜音幀，用以替代被發(fā)送端缺省掉的靜音幀，使得舒適噪聲能順利生成。采用本發(fā)明的方法，能有效的能減小網(wǎng)絡(luò)對靜音幀的發(fā)送，降低靜音模式時(shí)網(wǎng)絡(luò)的傳輸速率，從而減少傳輸時(shí)對帶寬的占用，有效的節(jié)約網(wǎng)絡(luò)帶寬資源。
文檔編號G10L19/00GK1753349SQ20051008674
公開日2006年3月29日申請日期2005年10月31日優(yōu)先權(quán)日2005年10月31日
發(fā)明者何志斌, 李從兵, 郭更生, 王民申請人:連展科技(天津)有限公司

完整全部詳細(xì)技術(shù)資料下載