基于最優(yōu)停止理論的高效視頻快速編碼方法

文檔序號：8002369閱讀：252來源：國知局

基于最優(yōu)停止理論的高效視頻快速編碼方法
【專利摘要】本發(fā)明涉及一種基于最優(yōu)停止理論的高效視頻快速編碼方法，該方法包括以下步驟：1)獲取視頻序列中的待編碼幀和N個高效視頻編碼模式，并初始化待編碼幀中每個PU的概率信息；2)計算當前待編碼PU在每個編碼模式下對應的概率^，k＝1，2，...，N，并將N個編碼模式按其概率降序排列；3)應用最優(yōu)停止理論根據(jù)步驟2)的順序依次檢查各編碼模式，計算并獲得最佳編碼模式和最優(yōu)停止點；4)采用得到的最佳編碼模式對當前待編碼PU進行編碼，并根據(jù)當前最佳編碼模式和最優(yōu)停止點更新參數(shù)，直至整個視頻序列編碼完成。與現(xiàn)有技術相比，本發(fā)明降低了HEVC在預測單元模式?jīng)Q定部分的計算量，提高編碼速度，促進其在實際中的廣泛應用。
【專利說明】基于最優(yōu)停止理論的高效視頻快速編碼方法

【技術領域】
[0001] 本發(fā)明涉及視頻壓縮編碼領域，尤其是涉及一種基于最優(yōu)停止理論的高效視頻快速編碼方法。

【背景技術】
[0002] 隨著高清視頻，甚至是超高清視頻的興起，大分辨率視頻的應用在市場上愈發(fā)普及，并且廣受歡迎。超高清視頻的分辨率可以達到4Kx2K，甚至8Kx4K，這對視頻壓縮效率提出了新的挑戰(zhàn)。目前廣泛使用的視頻壓縮編碼標準H. 264/AVC于1999年至2003年間初步制定，并于2003年至2009年間又做了多次擴展和補充。迄今為止，H. 264/AVC標準已經(jīng)廣泛應用于衛(wèi)星視頻廣播、有線電視、視頻會議、視頻聊天和安保監(jiān)控等眾多領域。然而，針對目前新興的高清視頻領域，H. 264/AVC標準的壓縮效率和性能還不能很好地滿足要求。在這種情況下，高效視頻編碼標準（High Efficiency Video Coding, HEVC)應運而生。
[0003] HEVC是ITU-T視頻編碼專家組（VCEG)和IS0/IEC運動圖像專家組（MPEG)組成的聯(lián)合視頻編碼組（JCT-VC)制定的，旨在H. 264/AVC的基礎上進一步提高壓縮效率，并且在相同視頻質量的情況下，達到2倍于H. 264/AVC的壓縮比。和H. 264/AVC相比，HEVC編碼技術最大的不同在于其四叉樹結構。H. 264/AVC中的宏塊（MB)兼具預測和變換信息；在 HEVC中，基本的編碼單元是Coding Tree Unit (CTU)。CTU和MB的功能類似，但是CTU的預測信息攜帶單位是PU (Prediction Unit)。針對每一個⑶(Coding Unit)，可進一步劃分為 4個子PU。在HEVC中，CU的大小可以是以下值：64義64、32132、16116、818。當對(^進行幀間（Inter)預測時，PU 的大小可以為 2Nx2N、2NxN、Nx2N、NxN、2NxnU、2NxnD、nLx2N、nRx2N。在這里，2Nx2N代表不進行子劃分的⑶大小，2NxN代表寬度為原⑶一半的PU，2NxnU中η 的大小為四分之一，各TO的大小如圖1所示；當對CU進行幀內(nèi)（Intra)預測時，PU的大小可以是2Nx2N或NxN(對亮度分量，N=32、16、8、4)。相對于H. 264/AVC中最多有9種幀內(nèi)預測方式（分別是垂直預測、水平預測、平均預測、左對角預測、右對角預測、垂直右對角預測、水平向下預測、垂直左對角預測和水平向上預測），HEVC的幀內(nèi)預測方式最多可達35 種。當進行幀內(nèi)預測時，每個PU都需要在35種預測方式中選擇一種最佳模式進行預測編碼。在HEVC中，采用RQT(Residual QuadTree)技術對預測產(chǎn)生的殘差進行量化；和PU類似，HEVC采用TU(Transform Unit)對殘差進行基于四叉樹的量化和變換編碼。對于亮度分量，TU的大小可以是32x32、16xl6、8x8和4x4 ;對于色度分量，其TU的長寬分別是對應亮度分量TU長寬的二分之一。
[0004] 和H. 264/AVC相似，HEVC采用了基于拉格朗日率失真優(yōu)化策略RD0 (Rate Distortion Optimization)技術的模式選擇算法，即通過遍歷所有可能的模式，最后選擇率失真代價最小的模式作為最佳編碼模式，公式為：
[0005] J(s,c,m|QP, λ m) = D (s, c, m | QP) + λ mR(s, c, m | QP)
[0006] 式中，QP是量化參數(shù)；λ m是拉格朗日常數(shù)，與QP有關；D是原始像素塊s與重建塊c之間的失真；R是利用模式m進行編碼后產(chǎn)生的比特數(shù)。
[0007] 相比于H. 264/AVC中僅僅需要對MB進行所有模式的遍歷計算選擇，HEVC需要分別對每一層的CU、PU和TU進行最優(yōu)選擇，選擇出最佳單元大小和模式進行編碼。因此，HEVC 中模式選擇的計算復雜度是巨大的，在移動設備和實時環(huán)境下很難應用HEVC進行高效編碼。這就需要快速算法來縮短編碼時間以滿足實際需要，同時又要在一定范圍內(nèi)滿足視頻質量的要求。
[0008] 最優(yōu)停止理論可以在某個適當?shù)狞c停止，從而避免遍歷待編碼CU的所有模式來達到縮短編碼時間的目的。最優(yōu)停止理論問題可以歸結如下：存在一個聯(lián)合分布已知的隨機變量的序列和一組實值獎勵函數(shù)，決策者按照順序一個個檢查這些變量，同時獲得相應的獎勵函數(shù)值，并且在合適的時間停止檢查余下的變量，最終的目的是獲得的獎勵函數(shù)值最大，這樣獲得最好的候選變量的概率也最大。通過把各種編碼模式當作上面提到的變量，并且研究各種模式相互之間的關系，最優(yōu)停止理論就可以應用到模式?jīng)Q定的快速算法中。
[0009] Ferguson等又提出了名為持續(xù)問題的一種最優(yōu)停止問題，簡單敘述為：在決策的過程中，如果某個變量比其他變量的觀測值更好，那么它便成為是一個Relative Best Object (RB0)。持續(xù)問題的目標是在遇到下一個RB0之前，找到一個適當?shù)臅r間停止觀測，同時獲得觀測值最大的變量。持續(xù)問題的期望值越大，表明在停止點之后遇到下一個RB0 的時間越長，同時能夠節(jié)約的不必要時間也越多。換句話說，持續(xù)問題的解決方法在判定準確性和時間減少比例上能夠很好地進行權衡，這點可以借鑒到視頻編碼的快速算法中，相對應的是既要盡可能選擇到編碼的最佳模式，同時又要盡量減少編碼時間，這和持續(xù)問題的目的很類似。

【發(fā)明內(nèi)容】

[0010] 本發(fā)明的目的就是為了克服上述現(xiàn)有技術存在的計算量大、編碼速度慢等缺陷提供一種基于最優(yōu)停止理論的高效視頻快速編碼方法，降低了 HEVC在預測單元模式?jīng)Q定部分的計算量，提高編碼速度，促進其在實際中的廣泛應用。
[0011] 本發(fā)明的目的可以通過以下技術方案來實現(xiàn)：
[0012] 一種基于最優(yōu)停止理論的高效視頻快速編碼方法，該方法包括以下步驟：
[0013] 1)獲取視頻序列中的待編碼幀和N個高效視頻編碼模式，并初始化待編碼幀中每個PU的概率信息；
[0014] 2)計算當前待編碼PU在每個編碼模式下對應的概率pk，k = 1，2, . . .，N，并將N 個編碼模式按其概率降序排列；
[0015] 3)應用最優(yōu)停止理論根據(jù)步驟2)的順序依次檢查各編碼模式，計算并獲得最佳編碼模式和最優(yōu)停止點；
[0016] 4)采用得到的最佳編碼模式對當前待編碼PU進行編碼，并根據(jù)當前最佳編碼模式和最優(yōu)停止點更新參數(shù)；
[0017] 5)返回步驟2)，直至當前待編碼幀的所有PU全部編碼完成；
[0018] 6)返回步驟1)，直至整個視頻序列編碼完成。
[0019] 所述的當前待編碼PU在每個編碼模式下對應的概率pk通過以下公式獲?。?br> [0020]

【權利要求】
1. 一種基于最優(yōu)停止理論的高效視頻快速編碼方法，其特征在于，該方法包括以下步驟： 1) 獲取視頻序列中的待編碼幀和N個高效視頻編碼模式，并初始化待編碼幀中每個PU 的概率信息； 2) 計算當前待編碼PU在每個編碼模式下對應的概率pk，k = 1，2, . . .，N，并將N個編碼模式按其概率降序排列； 3) 應用最優(yōu)停止理論根據(jù)步驟2)的順序依次檢查各編碼模式，計算并獲得最佳編碼模式和最優(yōu)停止點； 4) 采用得到的最佳編碼模式對當前待編碼TO進行編碼，并根據(jù)當前最佳編碼模式和最優(yōu)停止點更新參數(shù)； 5) 返回步驟2)，直至當前待編碼幀的所有PU全部編碼完成； 6) 返回步驟1)，直至整個視頻序列編碼完成。
2. 根據(jù)權利要求1所述的一種基于最優(yōu)停止理論的高效視頻快速編碼方法，其特征在于，所述的當前待編碼PU在每個編碼模式下對應的概率p k通過以下公式獲?。?u(Ms,r) + T rml 其中，TU(MU，k)為當前待編碼PU的上方PU最佳編碼模式為Mu時，當前待編碼PU最佳編碼模式為k的概率預測矩陣；1\ (Mp k)為當前待編碼PU的左方PU最佳編碼模式為吣時，當前待編碼PU最佳編碼模式為k的概率預測矩陣。
3. 根據(jù)權利要求2所述的一種基于最優(yōu)停止理論的高效視頻快速編碼方法，其特征在于，所述的步驟3)具體為： 3. 1)依次檢查各候選模式，在第k個模式停止檢查，設在模式k后的下一個相對最佳目標為Tk,則Tk = j的概率為：取=Λ =汽美+| ；> 1，、重》 fmkU =Σρ,(ιτ-~) hPr r-i I 其中，j為自然數(shù)且j e (k，N]，Xr(r = k+l，k+2，...，j-l)表示第k+l、k+2 -直到第 j_l個模式在所有N個模式中被選為最佳模式的概率排名，P (X」=1)表示第j個模式是N 個模式中的最佳模式的概率； Tk的位置由下式得到 m) = (N + l)· P(Tk =N .pg·^ = j，屠爭I =Λ+Σ^Στ^~ ?1 Μ Λ 廣若E(Tk)大于設定的閾值τ，τ e [Ν，Ν+1)，則當前的第k個模式為最佳編碼模式； 3. 2)計算最優(yōu)停止點K# : K* = max{Ka, K0} 式中 = mk {* > 1 ； I； Λ I； > r ^ w r*3 A, = rnin{/：>l：A+i2^i?^lK J相言 Mr f r*l
4. 根據(jù)權利要求3所述的一種基于最優(yōu)停止理論的高效視頻快速編碼方法，其特征在于，所述的更新參數(shù)是指根據(jù)當前的編碼模式對各概率預測矩陣進行更新，更新公式如下： (M, k) = T(M, k) · (l-y)+pm · y 其中，T(M，k)為更新前的概率預測矩陣，Τ' (M，k)為更新后的概率預測矩陣，γ為更新參數(shù)，Pm表示在已編碼PU的最佳模式為j，且滿足j < K#的前提下，模式m成為最佳模式的后驗概率，由以下公式計算得到： 'κ. · YdPr,m = j rm\ pm /1 ^ pm,otherwise
【文檔編號】H04N19/147GK104301723SQ201310297983
【公開日】2015年1月21日申請日期:2013年7月16日優(yōu)先權日:2013年7月16日
【發(fā)明者】王瀚漓, 衡岳申請人:同濟大學

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：王瀚漓;衡岳
技術所有人：同濟大學
我是此專利的發(fā)明人

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術及應用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術 5.逆向工程技術研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設計 2.汽車檢測系統(tǒng)設計 3.汽車電子控制系統(tǒng)設計
4、畢老師：機構動力學與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

最優(yōu)化理論與算法相關技術

最優(yōu)化理論相關技術

最優(yōu)控制理論與應用相關技術

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于最優(yōu)停止理論的高效視頻快速編碼方法