基于最優(yōu)停止理論的高效視頻快速編碼方法
【專利摘要】本發(fā)明涉及一種基于最優(yōu)停止理論的高效視頻快速編碼方法,該方法包括以下步驟:1)獲取視頻序列中的待編碼幀和N個高效視頻編碼模式,并初始化待編碼幀中每個PU的概率信息;2)計算當前待編碼PU在每個編碼模式下對應的概率^,k=1,2,...,N,并將N個編碼模式按其概率降序排列;3)應用最優(yōu)停止理論根據(jù)步驟2)的順序依次檢查各編碼模式,計算并獲得最佳編碼模式和最優(yōu)停止點;4)采用得到的最佳編碼模式對當前待編碼PU進行編碼,并根據(jù)當前最佳編碼模式和最優(yōu)停止點更新參數(shù),直至整個視頻序列編碼完成。與現(xiàn)有技術相比,本發(fā)明降低了HEVC在預測單元模式?jīng)Q定部分的計算量,提高編碼速度,促進其在實際中的廣泛應用。
【專利說明】基于最優(yōu)停止理論的高效視頻快速編碼方法
【技術領域】
[0001] 本發(fā)明涉及視頻壓縮編碼領域,尤其是涉及一種基于最優(yōu)停止理論的高效視頻快 速編碼方法。
【背景技術】
[0002] 隨著高清視頻,甚至是超高清視頻的興起,大分辨率視頻的應用在市場上愈發(fā)普 及,并且廣受歡迎。超高清視頻的分辨率可以達到4Kx2K,甚至8Kx4K,這對視頻壓縮效率提 出了新的挑戰(zhàn)。目前廣泛使用的視頻壓縮編碼標準H. 264/AVC于1999年至2003年間初步 制定,并于2003年至2009年間又做了多次擴展和補充。迄今為止,H. 264/AVC標準已經(jīng)廣 泛應用于衛(wèi)星視頻廣播、有線電視、視頻會議、視頻聊天和安保監(jiān)控等眾多領域。然而,針對 目前新興的高清視頻領域,H. 264/AVC標準的壓縮效率和性能還不能很好地滿足要求。在 這種情況下,高效視頻編碼標準(High Efficiency Video Coding, HEVC)應運而生。
[0003] HEVC是ITU-T視頻編碼專家組(VCEG)和IS0/IEC運動圖像專家組(MPEG)組成 的聯(lián)合視頻編碼組(JCT-VC)制定的,旨在H. 264/AVC的基礎上進一步提高壓縮效率,并且 在相同視頻質量的情況下,達到2倍于H. 264/AVC的壓縮比。和H. 264/AVC相比,HEVC編 碼技術最大的不同在于其四叉樹結構。H. 264/AVC中的宏塊(MB)兼具預測和變換信息;在 HEVC中,基本的編碼單元是Coding Tree Unit (CTU)。CTU和MB的功能類似,但是CTU的預 測信息攜帶單位是PU (Prediction Unit)。針對每一個⑶(Coding Unit),可進一步劃分為 4個子PU。在HEVC中,CU的大小可以是以下值:64義64、32132、16116、818。當對(^進行幀 間(Inter)預測時,PU 的大小可以為 2Nx2N、2NxN、Nx2N、NxN、2NxnU、2NxnD、nLx2N、nRx2N。 在這里,2Nx2N代表不進行子劃分的⑶大小,2NxN代表寬度為原⑶一半的PU,2NxnU中η 的大小為四分之一,各TO的大小如圖1所示;當對CU進行幀內(nèi)(Intra)預測時,PU的大小 可以是2Nx2N或NxN(對亮度分量,N=32、16、8、4)。相對于H. 264/AVC中最多有9種幀 內(nèi)預測方式(分別是垂直預測、水平預測、平均預測、左對角預測、右對角預測、垂直右對角 預測、水平向下預測、垂直左對角預測和水平向上預測),HEVC的幀內(nèi)預測方式最多可達35 種。當進行幀內(nèi)預測時,每個PU都需要在35種預測方式中選擇一種最佳模式進行預測編 碼。在HEVC中,采用RQT(Residual QuadTree)技術對預測產(chǎn)生的殘差進行量化;和PU類 似,HEVC采用TU(Transform Unit)對殘差進行基于四叉樹的量化和變換編碼。對于亮度 分量,TU的大小可以是32x32、16xl6、8x8和4x4 ;對于色度分量,其TU的長寬分別是對應亮 度分量TU長寬的二分之一。
[0004] 和H. 264/AVC相似,HEVC采用了基于拉格朗日率失真優(yōu)化策略RD0 (Rate Distortion Optimization)技術的模式選擇算法,即通過遍歷所有可能的模式,最后選擇 率失真代價最小的模式作為最佳編碼模式,公式為:
[0005] J(s,c,m|QP, λ m) = D (s, c, m | QP) + λ mR(s, c, m | QP)
[0006] 式中,QP是量化參數(shù);λ m是拉格朗日常數(shù),與QP有關;D是原始像素塊s與重建 塊c之間的失真;R是利用模式m進行編碼后產(chǎn)生的比特數(shù)。
[0007] 相比于H. 264/AVC中僅僅需要對MB進行所有模式的遍歷計算選擇,HEVC需要分別 對每一層的CU、PU和TU進行最優(yōu)選擇,選擇出最佳單元大小和模式進行編碼。因此,HEVC 中模式選擇的計算復雜度是巨大的,在移動設備和實時環(huán)境下很難應用HEVC進行高效編 碼。這就需要快速算法來縮短編碼時間以滿足實際需要,同時又要在一定范圍內(nèi)滿足視頻 質量的要求。
[0008] 最優(yōu)停止理論可以在某個適當?shù)狞c停止,從而避免遍歷待編碼CU的所有模式來 達到縮短編碼時間的目的。最優(yōu)停止理論問題可以歸結如下:存在一個聯(lián)合分布已知的隨 機變量的序列和一組實值獎勵函數(shù),決策者按照順序一個個檢查這些變量,同時獲得相應 的獎勵函數(shù)值,并且在合適的時間停止檢查余下的變量,最終的目的是獲得的獎勵函數(shù)值 最大,這樣獲得最好的候選變量的概率也最大。通過把各種編碼模式當作上面提到的變量, 并且研究各種模式相互之間的關系,最優(yōu)停止理論就可以應用到模式?jīng)Q定的快速算法中。
[0009] Ferguson等又提出了名為持續(xù)問題的一種最優(yōu)停止問題,簡單敘述為:在決策 的過程中,如果某個變量比其他變量的觀測值更好,那么它便成為是一個Relative Best Object (RB0)。持續(xù)問題的目標是在遇到下一個RB0之前,找到一個適當?shù)臅r間停止觀測, 同時獲得觀測值最大的變量。持續(xù)問題的期望值越大,表明在停止點之后遇到下一個RB0 的時間越長,同時能夠節(jié)約的不必要時間也越多。換句話說,持續(xù)問題的解決方法在判定準 確性和時間減少比例上能夠很好地進行權衡,這點可以借鑒到視頻編碼的快速算法中,相 對應的是既要盡可能選擇到編碼的最佳模式,同時又要盡量減少編碼時間,這和持續(xù)問題 的目的很類似。
【發(fā)明內(nèi)容】
[0010] 本發(fā)明的目的就是為了克服上述現(xiàn)有技術存在的計算量大、編碼速度慢等缺陷提 供一種基于最優(yōu)停止理論的高效視頻快速編碼方法,降低了 HEVC在預測單元模式?jīng)Q定部 分的計算量,提高編碼速度,促進其在實際中的廣泛應用。
[0011] 本發(fā)明的目的可以通過以下技術方案來實現(xiàn):
[0012] 一種基于最優(yōu)停止理論的高效視頻快速編碼方法,該方法包括以下步驟:
[0013] 1)獲取視頻序列中的待編碼幀和N個高效視頻編碼模式,并初始化待編碼幀中每 個PU的概率信息;
[0014] 2)計算當前待編碼PU在每個編碼模式下對應的概率pk,k = 1,2, . . .,N,并將N 個編碼模式按其概率降序排列;
[0015] 3)應用最優(yōu)停止理論根據(jù)步驟2)的順序依次檢查各編碼模式,計算并獲得最佳 編碼模式和最優(yōu)停止點;
[0016] 4)采用得到的最佳編碼模式對當前待編碼PU進行編碼,并根據(jù)當前最佳編碼模 式和最優(yōu)停止點更新參數(shù);
[0017] 5)返回步驟2),直至當前待編碼幀的所有PU全部編碼完成;
[0018] 6)返回步驟1),直至整個視頻序列編碼完成。
[0019] 所述的當前待編碼PU在每個編碼模式下對應的概率pk通過以下公式獲?。?br>
[0020]
【權利要求】
1. 一種基于最優(yōu)停止理論的高效視頻快速編碼方法,其特征在于,該方法包括以下步 驟: 1) 獲取視頻序列中的待編碼幀和N個高效視頻編碼模式,并初始化待編碼幀中每個PU 的概率信息; 2) 計算當前待編碼PU在每個編碼模式下對應的概率pk,k = 1,2, . . .,N,并將N個編 碼模式按其概率降序排列; 3) 應用最優(yōu)停止理論根據(jù)步驟2)的順序依次檢查各編碼模式,計算并獲得最佳編碼 模式和最優(yōu)停止點; 4) 采用得到的最佳編碼模式對當前待編碼TO進行編碼,并根據(jù)當前最佳編碼模式和 最優(yōu)停止點更新參數(shù); 5) 返回步驟2),直至當前待編碼幀的所有PU全部編碼完成; 6) 返回步驟1),直至整個視頻序列編碼完成。
2. 根據(jù)權利要求1所述的一種基于最優(yōu)停止理論的高效視頻快速編碼方法,其特征在 于,所述的當前待編碼PU在每個編碼模式下對應的概率p k通過以下公式獲?。?u(Ms,r) + T rml 其中,TU(MU,k)為當前待編碼PU的上方PU最佳編碼模式為Mu時,當前待編碼PU最佳 編碼模式為k的概率預測矩陣;1\ (Mp k)為當前待編碼PU的左方PU最佳編碼模式為吣時, 當前待編碼PU最佳編碼模式為k的概率預測矩陣。
3. 根據(jù)權利要求2所述的一種基于最優(yōu)停止理論的高效視頻快速編碼方法,其特征在 于,所述的步驟3)具體為: 3. 1)依次檢查各候選模式,在第k個模式停止檢查,設在模式k后的下一個相對最佳目 標為Tk,則Tk = j的概率為: 取=Λ =汽美+| ;> 1,、重》 fmkU =Σρ,(ιτ-~) hPr r-i I 其中,j為自然數(shù)且j e (k,N],Xr(r = k+l,k+2,...,j-l)表示第k+l、k+2 -直到第 j_l個模式在所有N個模式中被選為最佳模式的概率排名,P (X」=1)表示第j個模式是N 個模式中的最佳模式的概率; Tk的位置由下式得到 m) = (N + l)· P(Tk =N .pg·^ = j,屠爭I =Λ+Σ^Στ^~ ?1 Μ Λ 廣 若E(Tk)大于設定的閾值τ,τ e [Ν,Ν+1),則當前的第k個模式為最佳編碼模式; 3. 2)計算最優(yōu)停止點K# : K* = max{Ka, K0} 式中 = mk {* > 1 ; I; Λ I; > r ^ w r*3 A, = rnin{/:>l:A+i2^i?^lK J相言 Mr f r*l
4. 根據(jù)權利要求3所述的一種基于最優(yōu)停止理論的高效視頻快速編碼方法,其特征 在于,所述的更新參數(shù)是指根據(jù)當前的編碼模式對各概率預測矩陣進行更新,更新公式如 下: (M, k) = T(M, k) · (l-y)+pm · y 其中,T(M,k)為更新前的概率預測矩陣,Τ' (M,k)為更新后的概率預測矩陣,γ為更 新參數(shù),Pm表示在已編碼PU的最佳模式為j,且滿足j < K#的前提下,模式m成為最佳模式 的后驗概率,由以下公式計算得到: 'κ. · YdPr,m = j rm\ pm /1 ^ pm,otherwise
【文檔編號】H04N19/147GK104301723SQ201310297983
【公開日】2015年1月21日 申請日期:2013年7月16日 優(yōu)先權日:2013年7月16日
【發(fā)明者】王瀚漓, 衡岳 申請人:同濟大學