一種基于主觀視頻質(zhì)量的h.264碼率控制方法
【專利摘要】本發(fā)明提出了一種基于主觀視頻質(zhì)量的H.264碼率控制方法,一種結(jié)構(gòu)相似性預(yù)測(cè)模型,通過提出的線性預(yù)測(cè)模型預(yù)測(cè)得到當(dāng)前幀的結(jié)構(gòu)相似性,在此基礎(chǔ)上定義了一個(gè)表征幀主觀復(fù)雜度的結(jié)構(gòu)相似性因子來分配當(dāng)前幀的目標(biāo)比特?cái)?shù)。該方法在未增加計(jì)算復(fù)雜度和保證碼率控制精度的基礎(chǔ)上,提高了編碼視頻圖像的結(jié)構(gòu)相似性,更加符合人的主觀感受,可用于實(shí)時(shí)編碼環(huán)境。本發(fā)明的方法包括如下步驟:A.計(jì)算第i個(gè)GOP層未編碼幀的剩余比特?cái)?shù);B.通過線性預(yù)測(cè)模型計(jì)算當(dāng)前幀的結(jié)構(gòu)相似性;C.計(jì)算當(dāng)前幀的結(jié)構(gòu)相似性因子FC;D.根據(jù)結(jié)構(gòu)相似性因子分配當(dāng)前幀的目標(biāo)比特?cái)?shù);E.計(jì)算量化參數(shù);F.率失真優(yōu)化。
【專利說明】一種基于主觀視頻質(zhì)量的H.264碼率控制方法
[0001]【技術(shù)領(lǐng)域】:
本發(fā)明涉及視頻編碼【技術(shù)領(lǐng)域】,具體涉及一種基于主觀視頻質(zhì)量的H.264幀層碼率控制方法。
[0002]【背景技術(shù)】:
在過去十多年中,視頻通信技術(shù)得到了飛速發(fā)展和廣泛的應(yīng)用,并制定了一系列視頻編碼標(biāo)準(zhǔn)?,F(xiàn)有的國(guó)際視頻編碼標(biāo)準(zhǔn)主要包括國(guó)際標(biāo)準(zhǔn)化組織(ISO)推出的MPEG-1,MPEG-2, MPEG-4(參見文獻(xiàn):IS0/IEC 13818-2.1nformation technology-Genericcoding of moving pictures and associated audio Part 2:Video[S].1996 ;IS0/IEC14496-2.1nformation technology-Generic coding of audio-visual objectsPart2:Visual[S].1998.),以及國(guó)際電信聯(lián)盟標(biāo)準(zhǔn)化部(ITU-T)推出的H.26x系列,如H.261 (參見文獻(xiàn):ITU-T.Draft ITU-T Recommendation H.261.Video codec for audiovisual services, at px64kbps [S], 1993.), H.263 (參見文獻(xiàn):ITU_T.Draft ITU-TRecommendationH.263.Video coding for low bit rate communication[S].1996.)等。2003年,由ISO與ITU-T合作成立的聯(lián)合視頻工作組JVT推出了最新的視頻標(biāo)準(zhǔn) H.264(參見文獻(xiàn):IS0/IEC11496-10.1TU-T Recommendation H.264 Advanced videocoding[S].2002.)。H.264吸收了以往各種編碼標(biāo)準(zhǔn)方案的優(yōu)點(diǎn),在預(yù)測(cè)編碼、變換量化和容錯(cuò)編碼等方面進(jìn)行了較大的改進(jìn)。目前H.264正逐漸取代原有視頻壓縮標(biāo)準(zhǔn)在各應(yīng)用領(lǐng)域占據(jù)主導(dǎo)地位。
[0003]碼率控制是H.264視頻壓縮編碼過程中的關(guān)鍵環(huán)節(jié),作用于整個(gè)視頻編碼過程,其有效性不僅影響碼流的碼率穩(wěn)定,還將影響到整個(gè)視頻序列的圖象質(zhì)量。碼率控制的主要任務(wù)是采集緩沖區(qū)狀態(tài)和 圖像活動(dòng)性等信息,來給每幅圖像分配一定的比特?cái)?shù),使得輸出碼率能控制在給定的標(biāo)準(zhǔn)上,并使圖像失真最小。
[0004]在H.264的碼率控制方法中,由于同時(shí)在碼率控制和率失真優(yōu)化環(huán)節(jié)使用了量化參數(shù),導(dǎo)致了“蛋雞悼論” [Ma S.ff, Gao W and Lu Y.Rate control on JVTstandard, Document JVT-D030 [S] ? 2002]。為了提高H.264碼率控制的性能,很多學(xué)者做了大量的研究,文獻(xiàn)[Shin I H,Lee Y L, Park H ff.Rate control using linearrate-P model for H.264[J].Signal Process Image Com- munication, 2004,19:341-352.]在P域模型的基礎(chǔ)上作了改進(jìn),應(yīng)用在H.264的碼率控制中,文獻(xiàn)[MaSiwei, Gao Wen, Lu Yan.Rate-distortion analysis for H.264/AVC video codingand its application to rate control[J].1EEE Trans on Circuit Syst for VideoTechnol, 2005, 15 (12): 1533-1544.]提出了碼率與量化步長(zhǎng)與量化步長(zhǎng)間的關(guān)系模型及相應(yīng)的碼率控制方法,文獻(xiàn)[Ma S.ff, Gao W,Wu F and Lu Y.Rate control for JVTvideo coding scheme with HRD considerations.Proceeding of IEEE InternationalConference on Image and Processing, 2003, vol.3, pp: 793-796.]將 HRD 一致性約束、平均絕對(duì)誤差比綜合考慮,提出了一種新的碼率控制方法。Li Zhengguo提出的JVT-G012方法利用線性MAD模型來預(yù)測(cè)當(dāng)前基本單元的MAD值,這一方法可以獲得比較好的編碼效果,引起了廣泛的關(guān)注[Li Zhengguo, Gao Wen, Pan Feng, etal.Adaptive rate control for H.264[J].Journal of Visual Communication andImage Representation, 2006,17 (2): 376-406.]。JVT-G012 方法雖然較好地解決了蛋雞悖論問題,然而仍然存在很多問題。比如方法中沒有明確的討論幀內(nèi)的碼率-量化(R-Q)模型,因此文獻(xiàn)[X.Jing, L.P.Chau, and ff.-C Siu, "Frame complexity-basedrate-quantization model for H.264/AVC intraframe rate control, 〃IEEE SignalProcessing Letters, vol.15, pp.373-376,2008.]提出 了一種自適應(yīng)的巾貞內(nèi) R-Q 模型,這種方法通過考慮基于灰度的幀復(fù)雜度,自適應(yīng)的更新模型參數(shù),來更精確地選擇幀內(nèi)編碼幀的量化參數(shù)。又比如在基于傳統(tǒng)變換的視頻編碼系統(tǒng)中彩色視頻信號(hào)的率失真(R-D)參數(shù)分別為亮度和色度分量模型化,所以文獻(xiàn)[Z.Z.Chen and K.N.Ngan,“Towardsrate-distortion tradeoff in real-time color video coding,,,IEEE Trans.CircuitsSyst.Video Technol.,2007,vol.17, n0.2, pp.158-167]提出為彩色視頻編碼建立獨(dú)立的R-D模型。
[0005]基于幀復(fù)雜度的H.264碼率控制方法(ZL201010235061.8)中公開了一種基于幀復(fù)雜度的H.264碼率控制方法。該方法包括以下步驟:A、根據(jù)幀復(fù)雜度確定當(dāng)前編碼幀的目標(biāo)比特?cái)?shù);B、計(jì)算量化參數(shù)并進(jìn)行率失真優(yōu)化;其中,幀復(fù)雜度是通過一個(gè)復(fù)雜度系數(shù)來衡量,該復(fù)雜度系數(shù)定義為圖像灰度直方圖的平均差值和圖像亮度分量的平均絕對(duì)誤差比率的加權(quán)之和,在該復(fù)雜度系數(shù)基礎(chǔ)上,通過經(jīng)驗(yàn)公式對(duì)現(xiàn)有的目標(biāo)比特公式進(jìn)行了修正。一種H.264碼率控制方法(ZL201010239407.1)提供一種結(jié)合圖像復(fù)雜度并對(duì)量化參數(shù)進(jìn)行調(diào)整的幀層碼率控制方法,提高視頻輸出序列的平均峰值信噪比,并能夠減小視頻圖像巾貞間質(zhì)量波動(dòng),從而提聞視頻圖像質(zhì)量。
[0006]上述方法主要從自然圖像內(nèi)容的復(fù)雜性分配碼率,存在著一些缺點(diǎn):根據(jù)圖像內(nèi)容的客觀特性分配碼率,沒有根據(jù)人眼的主觀特性分配碼率,得到的圖像不一定符合人眼的主觀特性。
[0007]Z.Wang, A.C.Bovik 等人提出結(jié)構(gòu)相似性(SSIM, Structural Similarity)作為一種衡量?jī)煞鶊D像相似度的指標(biāo)。由于人類視覺很容易從圖像中抽取出結(jié)構(gòu)信息,因此計(jì)算兩幅圖像的SSIM就可以用來評(píng)價(jià)圖像主觀質(zhì)量的好壞??紤]SSIM,許多學(xué)者提出了新的H.264編碼方法。有人將SSIM用于H.264視頻編碼的率失真優(yōu)化(崔子冠,朱秀昌.基于結(jié)構(gòu)相似的札264主觀率失真性能改進(jìn)機(jī)制.電子與信息學(xué)報(bào),2012,34(2): 433-439)。一種基于a 264視頻編碼標(biāo)準(zhǔn)的宏塊層碼率控制方法(申請(qǐng)?zhí)?01310044341.4)給出一種結(jié)合SSIM和MAD的宏塊層碼率控制,取得了一定的效果。一種基于結(jié)構(gòu)相似性系數(shù)的H.264幀層碼率控制方法(申請(qǐng)?zhí)?01310164640.1)給出一種用結(jié)構(gòu)相似性系數(shù)進(jìn)行幀層碼率控制,結(jié)構(gòu)相似性系數(shù)根據(jù)前兩幀的SSIM計(jì)算得出,未考慮當(dāng)前幀的SSIM。
[0008]
【發(fā)明內(nèi)容】
:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提出了一種結(jié)構(gòu)相似性預(yù)測(cè)模型,通過提出的線性預(yù)測(cè)模型預(yù)測(cè)得到當(dāng)前幀的結(jié)構(gòu)相似性,在此基礎(chǔ)上定義了一個(gè)表征幀主觀復(fù)雜度的結(jié)構(gòu)相似性因子來分配當(dāng)前幀的目標(biāo)比特?cái)?shù)。該方法在未增加計(jì)算復(fù)雜度和保證碼率控制精度的基礎(chǔ)上,提高了編碼視頻圖像的結(jié)構(gòu)相似性,更加符合人的主觀感受,可用于實(shí)時(shí)編碼環(huán)境。[0009]本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
本發(fā)明的方法包括如下步驟:
A、計(jì)算第i個(gè)GOP層未編碼幀的剩余比特?cái)?shù);
B、通過線性預(yù)測(cè)模型計(jì)算當(dāng)前幀的結(jié)構(gòu)相似性;
C、計(jì)算當(dāng)前幀的結(jié)構(gòu)相似性因子FC;
D、根據(jù)結(jié)構(gòu)相似性因子分配當(dāng)前幀的目標(biāo)比特?cái)?shù);
E、計(jì)算量化參數(shù);
F、率失真優(yōu)化;
其特征在于,
步驟B中當(dāng)前幀的結(jié)構(gòu)相似性通過下式計(jì)算:
【權(quán)利要求】
1.一種基于主觀視頻質(zhì)量的a 264幀層碼率控制方法,該方法包括如下步驟: A、計(jì)算第i個(gè)GOP層未編碼幀的剩余比特?cái)?shù); B、通過線性預(yù)測(cè)模型計(jì)算當(dāng)前幀的結(jié)構(gòu)相似性; C、計(jì)算當(dāng)前幀的結(jié)構(gòu)相似性因子FC; D、根據(jù)結(jié)構(gòu)相似性因子分配當(dāng)前幀的目標(biāo)比特?cái)?shù); E、計(jì)算量化參數(shù); F、率失真優(yōu)化; 其特征在于, 步驟B中當(dāng)前幀的結(jié)構(gòu)相似性通過下式的線性預(yù)測(cè)模型計(jì)算:
【文檔編號(hào)】H04N19/567GK103618906SQ201310660447
【公開日】2014年3月5日 申請(qǐng)日期:2013年12月9日 優(yōu)先權(quán)日:2013年12月9日
【發(fā)明者】陳曉, 顧冬玨 申請(qǐng)人:南京信息工程大學(xué)