專利名稱:一種amr語音編碼的源控制速率中降低sid幀傳輸速率的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音編碼領(lǐng)域,具體的涉及在AMR語音編碼的源控制速率中降低SID幀傳輸速率的方法。
背景技術(shù):
自適應(yīng)多速率(AMRAdaptive Multi Rate)語音編碼是第三代移動通信標(biāo)準(zhǔn)化的伙伴項(xiàng)目(3GPP)制定的用于第三代移動通信WCDMA系統(tǒng)中的語音壓縮編碼技術(shù)。它與以前的移動通信語音編碼方式區(qū)別之一在于,以前的移動通信語音編碼采用的是固定的編碼速率。但人類在進(jìn)行語音通信時(shí),大約有70%左右的空閑時(shí)間是沒有講話的,因此,始終用一個(gè)速率進(jìn)行語音編碼對信道資源是一種浪費(fèi)。另外,隨著移動通信的發(fā)展,尤其是第三代移動通信系統(tǒng),對采用較低的編碼速率進(jìn)行語音編碼,從而增加系統(tǒng)容量和獲得較高的語音通話質(zhì)量方面提出了更高的要求。因此,傳統(tǒng)的移動語音編碼技術(shù),因?yàn)槠鋯我坏娜蒎e度的特點(diǎn),所以很難同時(shí)滿足這兩個(gè)要求。
AMR聲碼器由以下幾個(gè)部分組成多速率語音編碼器,源控制速率(SCR)方案(包括語音激勵檢測器和舒適噪聲生成系統(tǒng)),對抗傳輸錯誤和丟包帶來的影響的差錯隱藏機(jī)制。
其中,源控制速率(SCR)技術(shù)是AMR編碼器的重要組成部分。該操作是針對輸入信號僅為背景噪聲的情況下,采用比通常情況低的比特速率(1.80kbps)進(jìn)行編碼,以節(jié)省用戶設(shè)備的耗電量并降低整個(gè)網(wǎng)絡(luò)的干擾與負(fù)載。
SCR機(jī)制要求發(fā)射端的語音激勵檢測器(VAD)對背景噪聲進(jìn)行評價(jià),并將特征參數(shù)發(fā)送給接收端;接收端接收相關(guān)信息,并以此生成舒適背景噪聲(comfort noise)。如果發(fā)送端被關(guān)掉或接收端沒有收到有效的語音信號,則接收端要生成舒適噪聲。另外,如果接收端接收到的參數(shù)由于傳輸差錯而嚴(yán)重惡化,則在接收端必須由替代的數(shù)據(jù)生成語音或舒適噪聲,從而避免產(chǎn)生令人討厭的效果。
在3GPP發(fā)布的技術(shù)規(guī)范26.093《源控制速率操作》中規(guī)定,接收方所有的SCR操作都是由接收方SCR控制器控制的,接收方SCR控制器包括了2個(gè)主要的模式語音模式和舒適噪聲模式,其中語音模式是它的初始模式。
SCR中,幀的內(nèi)容包括信息比特、速率指示和發(fā)送類型,其中發(fā)送類型用于說明發(fā)送幀中的類型。它包括2種語音信息幀和3種靜音幀(Silence Description,即SID)和1種空幀,其中,根據(jù)3GPP發(fā)布的技術(shù)規(guī)范26.101《AMR語音編解碼器;幀結(jié)構(gòu)》,如果接收方接收到SID_FIRST,SID_UPDATE或者SID_BAD幀,接收方SCR控制器會進(jìn)入舒適噪聲狀態(tài)并且引起舒適噪聲產(chǎn)生,其中SID_BAD幀會被替代或者靜音處理。只要接收方SCR控制器在舒適噪聲模式下,它將忽略所有無用的信息幀(譬如NO_DATA幀,SPEECH_BAD幀),這樣舒適噪聲會一直產(chǎn)生。表1給出了6種幀的類型
表1這些幀識別信息會隨著幀信息在網(wǎng)絡(luò)中傳輸。其中,SPEECH_GOOD幀表示當(dāng)前幀是一個(gè)有效的語音信息被編碼后的信息幀;SID_FIRST幀出現(xiàn)在語音結(jié)束之后,表示從當(dāng)前幀開始處于靜音模式;如果出現(xiàn)持續(xù)的靜音時(shí)段,就會出現(xiàn)SID_UPDATE幀,并以每8個(gè)幀為周期重復(fù)出現(xiàn),直到靜音時(shí)段結(jié)束。
接收端通常在接到一個(gè)有效的SID幀后即合成舒適背景噪聲。當(dāng)語音幀被接收時(shí),前7幀的LP(線性預(yù)測)參數(shù)和能量參數(shù)將被保存在寄存器中。解碼端對從上一次SID幀進(jìn)行更新以來經(jīng)過幀的數(shù)目計(jì)數(shù),來決定在語音尾端是否進(jìn)行延遲保護(hù)。一旦接收到SID幀,譯碼端就開始產(chǎn)生舒適背景噪聲。
根據(jù)3GPP發(fā)布的技術(shù)規(guī)范26.092《強(qiáng)制的語音編解碼器語音處理功能;AMR語音編解碼器;舒適噪聲方面》,在發(fā)送端,舒適背景噪聲估計(jì)算法是利用AMR算法中的非量化線性預(yù)測參數(shù)和12.2kb/s速率算法中的第二組未量化的LSF(線性譜頻率)參數(shù)。進(jìn)而計(jì)算出以下參數(shù)以產(chǎn)生舒適背景噪聲平均LSF矢量fmean和幀能量的對數(shù)平均enlogmean。這些參數(shù)給出了背景噪聲的能量和譜信息。這些信息被編碼成靜音幀(SID),并傳送到接收端,接收端以此生成舒適背景噪聲。靜音幀的比特分配見表2
表2可見,SID幀每幀長為20ms,總比特?cái)?shù)為35,因此SID速率為1.8kb/s。其中,量化幀能量的S30-S35這6個(gè)比特不能減少;參照LSF矢量的S1-S3這3個(gè)比特索引值也不可以。如果能減少其余的26個(gè)比特中的一部分信息,那么,從而獲得一種可以降低SID幀傳輸速率的方法,是有可能實(shí)現(xiàn)的。
發(fā)明內(nèi)容
(一)要解決的技術(shù)問題本發(fā)明的目的是要克服目前現(xiàn)有技術(shù)的缺陷,提出一種AMR語音編碼的源控制速率中,降低SID幀傳輸速率的方法,從而減少靜音模式傳輸時(shí)對帶寬的占用,有效的節(jié)約網(wǎng)絡(luò)帶寬資源。
(二)技術(shù)方案本發(fā)明提出一種AMR語音編碼的源控制速率中降低SID幀傳輸速率的方法,具體的說,在發(fā)送端采用低速率模式的碼本量化舒適噪聲的線譜頻率矢量。
上述的AMR語音編碼的源控制速率中降低SID幀傳輸速率的方法,一種優(yōu)選的方案是,所采用的速率模式是5.15kb/s模式。
上述的AMR語音編碼的源控制速率中降低SID幀傳輸速率的方法,另一種優(yōu)選的方案是,所采用的速率模式是4.75kb/s模式。
(三)有益效果采用本發(fā)明,具有以下優(yōu)點(diǎn)使SID幀的傳輸速率由原來的1.8kb/s下降到1.6kb/s,下降幅度達(dá)11.1%,提高系統(tǒng)資源利用率,節(jié)省帶寬占用,進(jìn)而提供系統(tǒng)容量,并且方法簡便易行,在接收端不需要任何額外的處理,不會增加系統(tǒng)的復(fù)雜度。
圖1為輸入的語音樣本的背景噪聲部分的波形。
圖2為現(xiàn)有技術(shù)產(chǎn)生的舒適背景噪聲波形。
圖3為采用本發(fā)明所述方法產(chǎn)生的舒適背景噪聲波形。
圖4為圖1和圖3的對比圖,其中,黑色波形為輸入的語音樣本的背景噪音部分的波形,灰色波形為采用本發(fā)明所述的方法產(chǎn)生的舒適背景噪音波形。
具體實(shí)施例方式
以下實(shí)施方式僅用于說明本發(fā)明,而并非對本發(fā)明的限制,有關(guān)技術(shù)領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明的精神和范圍的情況下,還可以做出各種變化和變型,因此所有等同的技術(shù)方案也屬于本發(fā)明的范疇,本發(fā)明的專利保護(hù)范圍應(yīng)由各權(quán)利要求限定。
在源速率控制機(jī)制SCR中,可采取舒適背景噪聲來解決背景噪聲不連續(xù)的問題。即,在發(fā)送端對舒適背景噪聲的參數(shù)進(jìn)行估計(jì),然后以一定速率發(fā)送到接收端。
在發(fā)送端,舒適背景噪聲估計(jì)算法利用AMR算法中的非量化線性預(yù)測參數(shù)和12.2kb/s速率算法中的第二組未量化的LSF(線性譜頻率)參數(shù),計(jì)算出以下參數(shù)以產(chǎn)生舒適背景噪聲平均LSF矢量fmean和幀能量的對數(shù)平均enlogmean。平均LSF矢量的計(jì)算公式是
fmean(i)=18Σn=07f(i-n)]]>其中,f(i)為當(dāng)前幀的LSF參數(shù),f(i-n)為當(dāng)前幀(n=0)前面第n幀的LSF參數(shù)??梢娫诎l(fā)送端,對LSF參數(shù)的量化精度要求并不高。
因此,可以采用較現(xiàn)有技術(shù)的更低的速率模式下的碼本對LSF進(jìn)行量化,從而減少SID幀的比特?cái)?shù)。
因此,本實(shí)施例中以5.15kb/s速率模式下的碼本對LSF進(jìn)行量化。采用各種速率模式下的碼本量化后的比特分配見表3
表3可見,在本實(shí)施例中,采用5.15kb/s速率模式的碼本量化LSF矢量,其LSF矢量子幀劃分為8、8、7。量化后的SID幀的總比特?cái)?shù)從原有的35比特減少至32個(gè)比特,因此傳輸速率由現(xiàn)有技術(shù)的1.8kb/s下降到1.6kb/s。
因?yàn)長SF參數(shù)是短期分析得出的反應(yīng)語音波形包絡(luò)結(jié)構(gòu)的頻域采樣點(diǎn),其儲存著關(guān)于語音信號的包絡(luò)信息。對于高斯噪聲,其頻譜是平坦的,而精細(xì)結(jié)構(gòu)是隨機(jī)無序的。由于背景噪聲近似于高斯噪聲,其包絡(luò)有些微起伏,因此要求SID幀只需要傳送反應(yīng)包絡(luò)信息的LSF參數(shù),而反映信號精細(xì)結(jié)構(gòu)的固定碼本激勵不需要傳送。
在接收端,在舒適背景噪聲產(chǎn)生期間,舒適背景噪聲的譜和能量是在新舊SID幀間進(jìn)行內(nèi)插而得到的。為使舒適背景噪聲效果更好,在接收端對LSF矢量添加了一些噪聲。先求前8幀的平均LSF矢量,然后將前8幀的每一幀LSF矢量減去這個(gè)平均LSF矢量,將這些殘差組成一個(gè)新的矩陣,最后從這個(gè)矩陣隨機(jī)抽取一個(gè)矢量,與內(nèi)插的LSF矢量進(jìn)行相加。產(chǎn)生舒適噪聲的固定碼本激勵不從參數(shù)中獲得,是由接收端隨機(jī)產(chǎn)生的,SID的兩個(gè)參數(shù)只決定產(chǎn)生舒適噪聲的包絡(luò)結(jié)構(gòu)。也就是說,采用本發(fā)明的方法,在接收端方面,不需要現(xiàn)有技術(shù)以外的額外處理。
因此,在采用低速率模式的碼本進(jìn)行LSF量化,并不會很大的影響產(chǎn)生的舒適背景噪聲的噪聲質(zhì)量,下面由仿真程序來進(jìn)行驗(yàn)證。
本實(shí)施例的仿真程序由C語言編寫,在MicroSoft Vitual C++6.0環(huán)境下執(zhí)行。程序執(zhí)行結(jié)果通過Microcal Origin 6.0得到各波形圖。輸入語音樣本為DTX2.INP,而語音傳輸模式采用MR74(7.4kb/s)。
輸入波形為圖1所示的語音樣本,對其LSF量化采用和7.40kb/s模式相同的碼本,三個(gè)LSF子幀的比特分配如表3,子矢量分別為8、9、9,SID幀總比特?cái)?shù)為35,傳輸速率為1.8kb/s,則產(chǎn)生圖2所示的舒適背景噪聲波形;采用本發(fā)明的方法,LSF量化采用和5.15kb/s模式相同的碼本,三個(gè)LSF子幀的比特分配如表3,子矢量分別為8、8、7,SID幀總比特?cái)?shù)為32,速率為1.6kb/s,產(chǎn)生圖3所示的舒適背景噪聲波形。
由圖2和圖3的比較,可以看到,采用5.15kb/s模式下量化LSF矢量的SID幀所產(chǎn)生的舒適背景噪聲與在7.40kb/s模式下量化LSF矢量的SID幀所產(chǎn)生的舒適背景噪聲波形圖差別很小。
通過圖1和圖3的對比圖——圖4可以看出,采用5.15kb/s模式下量化后生成的舒適背景噪聲與發(fā)送端原始的背景噪聲匹配得比較好,其包絡(luò)與發(fā)送端得背景噪聲波形保持一致。
從本實(shí)施例中說明,可以通過在發(fā)送端采用較低速率模式下的碼本來量化LSF矢量,達(dá)到縮減所發(fā)送的SID幀比特?cái)?shù),從而降低SID傳送速率;并且在接收端不需要額外的處理,不增加任何系統(tǒng)負(fù)擔(dān)。采用本發(fā)明的方法,能有效的減少對帶寬資源的占用,而且對產(chǎn)生的舒適背景噪聲質(zhì)量影響幾乎可以忽略。
權(quán)利要求
1.一種AMR語音編碼的源控制速率中降低SID幀傳輸速率的方法,其特征在于,在發(fā)送端采用低速率模式的碼本量化舒適噪聲的線譜頻率矢量。
2.如權(quán)利要求1所述的AMR語音編碼的源控制速率中降低SID幀傳輸速率的方法,其特征在于所采用的速率模式是5.15kb/s模式。
3.如權(quán)利要求1所述的AMR語音編碼的源控制速率中降低SID幀傳輸速率的方法,其特征在于所采用的速率模式是4.75kb/s模式。
全文摘要
本發(fā)明涉及語音編碼領(lǐng)域。本發(fā)明提出了一種在AMR語音編碼的源控制速率中,降低靜音幀傳輸速率的方法,它采用較低的速率模式的碼本量化LSF(線譜頻率)矢量,將LSF矢量子幀劃分為8、8、7,減少靜音幀的比特?cái)?shù),從而降低靜音模式時(shí)的傳輸速率。本發(fā)明具有以下優(yōu)點(diǎn)使SID幀的傳輸速率由原來的1.8kb/s下降到1.6kb/s,下降幅度達(dá)11.1%,提高系統(tǒng)資源利用率,節(jié)省寶貴的無線帶寬,進(jìn)而提供系統(tǒng)容量,并且方法簡便易行,不會增加系統(tǒng)的復(fù)雜度。
文檔編號H04L1/00GK1767421SQ20051008674
公開日2006年5月3日 申請日期2005年10月31日 優(yōu)先權(quán)日2005年10月31日
發(fā)明者鄒麗恒, 張 林, 郭更生 申請人:連展科技(天津)有限公司