一種amr語音編碼的源控制速率中降低sid幀傳輸速率的方法

文檔序號：7621142閱讀：675來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：一種amr語音編碼的源控制速率中降低sid幀傳輸速率的方法
技術(shù)領(lǐng)域：
本發(fā)明涉及語音編碼領(lǐng)域，具體的涉及在AMR語音編碼的源控制速率中降低SID幀傳輸速率的方法。
背景技術(shù)：
自適應(yīng)多速率(AMRAdaptive Multi Rate)語音編碼是第三代移動通信標(biāo)準(zhǔn)化的伙伴項(xiàng)目(3GPP)制定的用于第三代移動通信WCDMA系統(tǒng)中的語音壓縮編碼技術(shù)。它與以前的移動通信語音編碼方式區(qū)別之一在于，以前的移動通信語音編碼采用的是固定的編碼速率。但人類在進(jìn)行語音通信時(shí)，大約有70％左右的空閑時(shí)間是沒有講話的，因此，始終用一個(gè)速率進(jìn)行語音編碼對信道資源是一種浪費(fèi)。另外，隨著移動通信的發(fā)展，尤其是第三代移動通信系統(tǒng)，對采用較低的編碼速率進(jìn)行語音編碼，從而增加系統(tǒng)容量和獲得較高的語音通話質(zhì)量方面提出了更高的要求。因此，傳統(tǒng)的移動語音編碼技術(shù)，因?yàn)槠鋯我坏娜蒎e度的特點(diǎn)，所以很難同時(shí)滿足這兩個(gè)要求。
AMR聲碼器由以下幾個(gè)部分組成多速率語音編碼器，源控制速率(SCR)方案(包括語音激勵檢測器和舒適噪聲生成系統(tǒng))，對抗傳輸錯誤和丟包帶來的影響的差錯隱藏機(jī)制。
其中，源控制速率(SCR)技術(shù)是AMR編碼器的重要組成部分。該操作是針對輸入信號僅為背景噪聲的情況下，采用比通常情況低的比特速率(1.80kbps)進(jìn)行編碼，以節(jié)省用戶設(shè)備的耗電量并降低整個(gè)網(wǎng)絡(luò)的干擾與負(fù)載。
SCR機(jī)制要求發(fā)射端的語音激勵檢測器(VAD)對背景噪聲進(jìn)行評價(jià)，并將特征參數(shù)發(fā)送給接收端；接收端接收相關(guān)信息，并以此生成舒適背景噪聲(comfort noise)。如果發(fā)送端被關(guān)掉或接收端沒有收到有效的語音信號，則接收端要生成舒適噪聲。另外，如果接收端接收到的參數(shù)由于傳輸差錯而嚴(yán)重惡化，則在接收端必須由替代的數(shù)據(jù)生成語音或舒適噪聲，從而避免產(chǎn)生令人討厭的效果。
在3GPP發(fā)布的技術(shù)規(guī)范26.093《源控制速率操作》中規(guī)定，接收方所有的SCR操作都是由接收方SCR控制器控制的，接收方SCR控制器包括了2個(gè)主要的模式語音模式和舒適噪聲模式，其中語音模式是它的初始模式。
SCR中，幀的內(nèi)容包括信息比特、速率指示和發(fā)送類型，其中發(fā)送類型用于說明發(fā)送幀中的類型。它包括2種語音信息幀和3種靜音幀(Silence Description，即SID)和1種空幀，其中，根據(jù)3GPP發(fā)布的技術(shù)規(guī)范26.101《AMR語音編解碼器；幀結(jié)構(gòu)》，如果接收方接收到SID_FIRST，SID_UPDATE或者SID_BAD幀，接收方SCR控制器會進(jìn)入舒適噪聲狀態(tài)并且引起舒適噪聲產(chǎn)生，其中SID_BAD幀會被替代或者靜音處理。只要接收方SCR控制器在舒適噪聲模式下，它將忽略所有無用的信息幀(譬如NO_DATA幀，SPEECH_BAD幀)，這樣舒適噪聲會一直產(chǎn)生。表1給出了6種幀的類型

表1這些幀識別信息會隨著幀信息在網(wǎng)絡(luò)中傳輸。其中，SPEECH_GOOD幀表示當(dāng)前幀是一個(gè)有效的語音信息被編碼后的信息幀；SID_FIRST幀出現(xiàn)在語音結(jié)束之后，表示從當(dāng)前幀開始處于靜音模式；如果出現(xiàn)持續(xù)的靜音時(shí)段，就會出現(xiàn)SID_UPDATE幀，并以每8個(gè)幀為周期重復(fù)出現(xiàn)，直到靜音時(shí)段結(jié)束。
接收端通常在接到一個(gè)有效的SID幀后即合成舒適背景噪聲。當(dāng)語音幀被接收時(shí)，前7幀的LP(線性預(yù)測)參數(shù)和能量參數(shù)將被保存在寄存器中。解碼端對從上一次SID幀進(jìn)行更新以來經(jīng)過幀的數(shù)目計(jì)數(shù)，來決定在語音尾端是否進(jìn)行延遲保護(hù)。一旦接收到SID幀，譯碼端就開始產(chǎn)生舒適背景噪聲。
根據(jù)3GPP發(fā)布的技術(shù)規(guī)范26.092《強(qiáng)制的語音編解碼器語音處理功能；AMR語音編解碼器；舒適噪聲方面》，在發(fā)送端，舒適背景噪聲估計(jì)算法是利用AMR算法中的非量化線性預(yù)測參數(shù)和12.2kb/s速率算法中的第二組未量化的LSF(線性譜頻率)參數(shù)。進(jìn)而計(jì)算出以下參數(shù)以產(chǎn)生舒適背景噪聲平均LSF矢量fmean和幀能量的對數(shù)平均enlogmean。這些參數(shù)給出了背景噪聲的能量和譜信息。這些信息被編碼成靜音幀(SID)，并傳送到接收端，接收端以此生成舒適背景噪聲。靜音幀的比特分配見表2

表2可見，SID幀每幀長為20ms，總比特?cái)?shù)為35，因此SID速率為1.8kb/s。其中，量化幀能量的S30-S35這6個(gè)比特不能減少；參照LSF矢量的S1-S3這3個(gè)比特索引值也不可以。如果能減少其余的26個(gè)比特中的一部分信息，那么，從而獲得一種可以降低SID幀傳輸速率的方法，是有可能實(shí)現(xiàn)的。

發(fā)明內(nèi)容
(一)要解決的技術(shù)問題本發(fā)明的目的是要克服目前現(xiàn)有技術(shù)的缺陷，提出一種AMR語音編碼的源控制速率中，降低SID幀傳輸速率的方法，從而減少靜音模式傳輸時(shí)對帶寬的占用，有效的節(jié)約網(wǎng)絡(luò)帶寬資源。
(二)技術(shù)方案本發(fā)明提出一種AMR語音編碼的源控制速率中降低SID幀傳輸速率的方法，具體的說，在發(fā)送端采用低速率模式的碼本量化舒適噪聲的線譜頻率矢量。
上述的AMR語音編碼的源控制速率中降低SID幀傳輸速率的方法，一種優(yōu)選的方案是，所采用的速率模式是5.15kb/s模式。
上述的AMR語音編碼的源控制速率中降低SID幀傳輸速率的方法，另一種優(yōu)選的方案是，所采用的速率模式是4.75kb/s模式。
(三)有益效果采用本發(fā)明，具有以下優(yōu)點(diǎn)使SID幀的傳輸速率由原來的1.8kb/s下降到1.6kb/s，下降幅度達(dá)11.1％，提高系統(tǒng)資源利用率，節(jié)省帶寬占用，進(jìn)而提供系統(tǒng)容量，并且方法簡便易行，在接收端不需要任何額外的處理，不會增加系統(tǒng)的復(fù)雜度。

圖1為輸入的語音樣本的背景噪聲部分的波形。
圖2為現(xiàn)有技術(shù)產(chǎn)生的舒適背景噪聲波形。
圖3為采用本發(fā)明所述方法產(chǎn)生的舒適背景噪聲波形。
圖4為圖1和圖3的對比圖，其中，黑色波形為輸入的語音樣本的背景噪音部分的波形，灰色波形為采用本發(fā)明所述的方法產(chǎn)生的舒適背景噪音波形。
具體實(shí)施例方式
以下實(shí)施方式僅用于說明本發(fā)明，而并非對本發(fā)明的限制，有關(guān)技術(shù)領(lǐng)域的普通技術(shù)人員，在不脫離本發(fā)明的精神和范圍的情況下，還可以做出各種變化和變型，因此所有等同的技術(shù)方案也屬于本發(fā)明的范疇，本發(fā)明的專利保護(hù)范圍應(yīng)由各權(quán)利要求限定。
在源速率控制機(jī)制SCR中，可采取舒適背景噪聲來解決背景噪聲不連續(xù)的問題。即，在發(fā)送端對舒適背景噪聲的參數(shù)進(jìn)行估計(jì)，然后以一定速率發(fā)送到接收端。
在發(fā)送端，舒適背景噪聲估計(jì)算法利用AMR算法中的非量化線性預(yù)測參數(shù)和12.2kb/s速率算法中的第二組未量化的LSF(線性譜頻率)參數(shù)，計(jì)算出以下參數(shù)以產(chǎn)生舒適背景噪聲平均LSF矢量fmean和幀能量的對數(shù)平均enlogmean。平均LSF矢量的計(jì)算公式是
fmean(i)=18Σn=07f(i-n)]]>其中，f(i)為當(dāng)前幀的LSF參數(shù)，f(i-n)為當(dāng)前幀(n＝0)前面第n幀的LSF參數(shù)?？梢娫诎l(fā)送端，對LSF參數(shù)的量化精度要求并不高。
因此，可以采用較現(xiàn)有技術(shù)的更低的速率模式下的碼本對LSF進(jìn)行量化，從而減少SID幀的比特?cái)?shù)。
因此，本實(shí)施例中以5.15kb/s速率模式下的碼本對LSF進(jìn)行量化。采用各種速率模式下的碼本量化后的比特分配見表3

表3可見，在本實(shí)施例中，采用5.15kb/s速率模式的碼本量化LSF矢量，其LSF矢量子幀劃分為8、8、7。量化后的SID幀的總比特?cái)?shù)從原有的35比特減少至32個(gè)比特，因此傳輸速率由現(xiàn)有技術(shù)的1.8kb/s下降到1.6kb/s。
因?yàn)長SF參數(shù)是短期分析得出的反應(yīng)語音波形包絡(luò)結(jié)構(gòu)的頻域采樣點(diǎn)，其儲存著關(guān)于語音信號的包絡(luò)信息。對于高斯噪聲，其頻譜是平坦的，而精細(xì)結(jié)構(gòu)是隨機(jī)無序的。由于背景噪聲近似于高斯噪聲，其包絡(luò)有些微起伏，因此要求SID幀只需要傳送反應(yīng)包絡(luò)信息的LSF參數(shù)，而反映信號精細(xì)結(jié)構(gòu)的固定碼本激勵不需要傳送。
在接收端，在舒適背景噪聲產(chǎn)生期間，舒適背景噪聲的譜和能量是在新舊SID幀間進(jìn)行內(nèi)插而得到的。為使舒適背景噪聲效果更好，在接收端對LSF矢量添加了一些噪聲。先求前8幀的平均LSF矢量，然后將前8幀的每一幀LSF矢量減去這個(gè)平均LSF矢量，將這些殘差組成一個(gè)新的矩陣，最后從這個(gè)矩陣隨機(jī)抽取一個(gè)矢量，與內(nèi)插的LSF矢量進(jìn)行相加。產(chǎn)生舒適噪聲的固定碼本激勵不從參數(shù)中獲得，是由接收端隨機(jī)產(chǎn)生的，SID的兩個(gè)參數(shù)只決定產(chǎn)生舒適噪聲的包絡(luò)結(jié)構(gòu)。也就是說，采用本發(fā)明的方法，在接收端方面，不需要現(xiàn)有技術(shù)以外的額外處理。
因此，在采用低速率模式的碼本進(jìn)行LSF量化，并不會很大的影響產(chǎn)生的舒適背景噪聲的噪聲質(zhì)量，下面由仿真程序來進(jìn)行驗(yàn)證。
本實(shí)施例的仿真程序由C語言編寫，在MicroSoft Vitual C++6.0環(huán)境下執(zhí)行。程序執(zhí)行結(jié)果通過Microcal Origin 6.0得到各波形圖。輸入語音樣本為DTX2.INP，而語音傳輸模式采用MR74(7.4kb/s)。
輸入波形為圖1所示的語音樣本，對其LSF量化采用和7.40kb/s模式相同的碼本，三個(gè)LSF子幀的比特分配如表3，子矢量分別為8、9、9，SID幀總比特?cái)?shù)為35，傳輸速率為1.8kb/s，則產(chǎn)生圖2所示的舒適背景噪聲波形；采用本發(fā)明的方法，LSF量化采用和5.15kb/s模式相同的碼本，三個(gè)LSF子幀的比特分配如表3，子矢量分別為8、8、7，SID幀總比特?cái)?shù)為32，速率為1.6kb/s，產(chǎn)生圖3所示的舒適背景噪聲波形。
由圖2和圖3的比較，可以看到，采用5.15kb/s模式下量化LSF矢量的SID幀所產(chǎn)生的舒適背景噪聲與在7.40kb/s模式下量化LSF矢量的SID幀所產(chǎn)生的舒適背景噪聲波形圖差別很小。
通過圖1和圖3的對比圖——圖4可以看出，采用5.15kb/s模式下量化后生成的舒適背景噪聲與發(fā)送端原始的背景噪聲匹配得比較好，其包絡(luò)與發(fā)送端得背景噪聲波形保持一致。
從本實(shí)施例中說明，可以通過在發(fā)送端采用較低速率模式下的碼本來量化LSF矢量，達(dá)到縮減所發(fā)送的SID幀比特?cái)?shù)，從而降低SID傳送速率；并且在接收端不需要額外的處理，不增加任何系統(tǒng)負(fù)擔(dān)。采用本發(fā)明的方法，能有效的減少對帶寬資源的占用，而且對產(chǎn)生的舒適背景噪聲質(zhì)量影響幾乎可以忽略。
權(quán)利要求
1.一種AMR語音編碼的源控制速率中降低SID幀傳輸速率的方法，其特征在于，在發(fā)送端采用低速率模式的碼本量化舒適噪聲的線譜頻率矢量。
2.如權(quán)利要求1所述的AMR語音編碼的源控制速率中降低SID幀傳輸速率的方法，其特征在于所采用的速率模式是5.15kb/s模式。
3.如權(quán)利要求1所述的AMR語音編碼的源控制速率中降低SID幀傳輸速率的方法，其特征在于所采用的速率模式是4.75kb/s模式。
全文摘要
本發(fā)明涉及語音編碼領(lǐng)域。本發(fā)明提出了一種在AMR語音編碼的源控制速率中，降低靜音幀傳輸速率的方法，它采用較低的速率模式的碼本量化LSF(線譜頻率)矢量，將LSF矢量子幀劃分為8、8、7，減少靜音幀的比特?cái)?shù)，從而降低靜音模式時(shí)的傳輸速率。本發(fā)明具有以下優(yōu)點(diǎn)使SID幀的傳輸速率由原來的1.8kb/s下降到1.6kb/s，下降幅度達(dá)11.1％，提高系統(tǒng)資源利用率，節(jié)省寶貴的無線帶寬，進(jìn)而提供系統(tǒng)容量，并且方法簡便易行，不會增加系統(tǒng)的復(fù)雜度。
文檔編號H04L1/00GK1767421SQ20051008674
公開日2006年5月3日申請日期2005年10月31日優(yōu)先權(quán)日2005年10月31日
發(fā)明者鄒麗恒, 張林, 郭更生申請人:連展科技(天津)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：鄒麗恒;張林;郭更生
技術(shù)所有人：連展科技(天津)有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時(shí)頻分析理論與測試系統(tǒng)設(shè)計(jì) 2.汽車檢測系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

volte語音編碼速率相關(guān)技術(shù)

gsm語音編碼速率相關(guān)技術(shù)

語音編碼速率相關(guān)技術(shù)

cdma語音編碼速率相關(guān)技術(shù)

低速率語音編碼相關(guān)技術(shù)

語音業(yè)務(wù)的承載速率相關(guān)技術(shù)

語音傳輸速率相關(guān)技術(shù)

volte語音業(yè)務(wù)速率相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種amr語音編碼的源控制速率中降低sid幀傳輸速率的方法