具有低延遲的用于殘差編碼的模式依賴變換的制作方法
【專利摘要】本發(fā)明提供了一種用于處理視頻數(shù)據(jù)的設備和方法。所述方法包括:在編碼器中確定用于應用于殘差數(shù)據(jù)的初級變換CN;確定用于應用于殘差數(shù)據(jù)的二次變換TrK;將初級變換CN應用于殘差數(shù)據(jù);將二次變換TrK選擇性地應用于殘差數(shù)據(jù),其中,N表示應用了初級變換CN的輸入向量的長度尺寸,K表示應用了二次變換TrK的初級變換輸出的前幾個系數(shù)的長度。在解碼器中執(zhí)行類似的逆操作,即,在解碼器中對于輸入殘差數(shù)據(jù)選擇性地應用逆二次變換inv(TrK),然后應用逆初級變換inv(CN)。
【專利說明】具有低延遲的用于殘差編碼的模式依賴變換
【技術領域】
[0001]本發(fā)明涉及一種用于視頻編碼的設備和方法。更具體地講,本發(fā)明涉及一種確定用于殘差編碼的變換的設備和方法。
【背景技術】
[0002]在高效率視頻編碼(HEVC)的現(xiàn)行標準中,針對幀內(nèi)預測殘差提出對標準離散余弦變換(DCT)的替代變換。這些變換可大致上被分類為基于訓練的變換或基于模式的變換。在基于訓練的變換中的突出變換是模式依賴的方向變換(MDDT)。在MDDT中,針對每個幀內(nèi)預測模式收集誤差殘差的大的訓練集,然后使用殘差訓練集來計算最優(yōu)變換矩陣。然而,MDDT需要大量的變換矩陣(例如,按N=4和N=8的塊尺寸多達18個)?;谀J降淖儞Q假設視頻信號被建模為一階高斯-馬爾可夫處理并然后解析地推導出最優(yōu)變換。這些基于模式的變換僅需要按塊尺寸的兩個變換矩陣。
[0003]當邊界信息在一個方向上可用時,針對一階高斯-馬爾可夫模型推導出具有與傳統(tǒng)DCT不同的頻率和相位分量的離散正弦變換(DST)類型7,如在H.264/先進視頻編碼(AVC)標準中的幀內(nèi)預測。還示出,如果預測沒有沿著特定方向被執(zhí)行,則執(zhí)行接近于最優(yōu)卡洛南-洛伊((Karhunen-Loeve))變換(KLT)的DCT。這種思想被應用于H.264/AVC中的幀內(nèi)預測中的垂直模式和水平模式,并且提出的DST類型-7和傳統(tǒng)的DCT的組合被適應性地使用。DST和DCT的組合還被應用于H.264/AVC中的其他預測模式,并顯示出與MDDT相比在性能上僅存在較少的損失。例如,DST被應用于針對HEVC的統(tǒng)一幀內(nèi)方向預測中的各種模式。然而,在一些情況下,量化和反量化表的另外的集合是必須的。在其他情況下,存在針對DCT的兩種不同的實現(xiàn)。在其他情況下,不使用量化表和反量化表的另外的集合,并且僅使用DCT的單個實現(xiàn),但是不存在針對DST類型7變換矩陣的快速實現(xiàn),并且全矩陣乘法被用來針對DST和反DST矩陣執(zhí)行DST操作。
[0004]為了克服針對適當縮放的DST類型7的全矩陣乘法的缺點(即,為了保持量化矩陣和反量化矩陣的相同集合),介紹針對4X4DST的快速DST實現(xiàn),在所述快速DST實現(xiàn)中,正DST采用了 9次乘法而反DST僅使用了 8次乘法。
[0005]然而,8X8DST變換沒有針對用于HEVC的統(tǒng)一幀內(nèi)方向預測的所有幀內(nèi)預測模式提供顯著的增益。首要的原因是,針對傾斜模式(即,除了垂直和水平之外的模式),DST可能不是在大于4X4的塊尺寸的情況下的最優(yōu)變換。因此,需要設計用于8X8以及大于8X8的塊尺寸的幀內(nèi)預測殘差的最優(yōu)變換。
[0006]另外,通過對用于尺寸8的幀內(nèi)預測殘差(具有P =1)的相關矩陣進行平滑并僅采用8X8相關矩陣的頂部的4X4部分設計了 4點二次變換。然后,得到的4點二次變換被應用于尺寸8X8、16X 16和32X32的塊。然而,由于這種變換是僅針對于尺寸8X8的塊被設計的并在其他塊尺寸被再次使用,因此這種變換針對于16X 16和32X32的塊尺寸并不是最優(yōu)的。因此,需要推導出針對所有的塊尺寸(例如,8\8、16\16、32父32)和可能更高的塊尺寸運行良好的最優(yōu)變換。[0007]此外,通常,一旦2-d初級變換(例如,DCT)完成,就應用2-d 二次變換。這暗示著,(在延遲方面)開銷會大致等于針對二次變換的循環(huán)與針對初次變換的循環(huán)的比率。但是對于實際的實現(xiàn),二次變換的延遲應該是低的。因此,針對在初次變換之后的二次變換,需要不同的低延遲結構。
【發(fā)明內(nèi)容】
[0008]解決方案
[0009]本發(fā)明的各方面將至少解決上述問題和/或缺點,并至少提供以下所述優(yōu)點。
[0010]根據(jù)本發(fā)明的一方面,提供一種用于對視頻數(shù)據(jù)進行編碼的方法。所述方法包括:確定應用于殘差數(shù)據(jù)的初級變換Cn ;確定應用于殘差數(shù)據(jù)的二次變換TrK ;將初級變換(;應用于殘差數(shù)據(jù);將二次變換TrK選擇性地應用于殘差數(shù)據(jù),其中,N表示應用了初級變換Cn的輸入向量的長度尺寸,K表示應用了二次變換TrK的初級變換輸出的前幾個系數(shù)的長度。
[0011]在實施例中,確定二次變換TrK的步驟包括:確定用于長度N的輸入數(shù)據(jù)的第一相關矩陣Rn ;確定用于作為初級變換Cn的應用結果而獲得的數(shù)據(jù)的第二相關矩陣Un ;確定矩陣\N為第二相關矩陣Un的頂部K行和K列;將VK,N的卡洛南-洛伊變換(KLT)確定為WK,N,并將WK,N的基于整數(shù)的近似確定為YK,N并將YK,N用作TrK。
[0012]在實施例中,所述方法還包括:將WK,N乘以2m;將乘法結果取整為最接近的整數(shù),其中,m是大于O的整數(shù)并表示所需的精度。
[0013]在實施例中,獲得子集矩陣的步驟包括:應用以下等式:
【權利要求】
1.一種用于對視頻數(shù)據(jù)進行編碼的方法,所述方法包括: 確定應用于殘差數(shù)據(jù)的初級變換Cn ; 確定應用于殘差數(shù)據(jù)的二次變換TrK ; 將初級變換Cn應用于殘差數(shù)據(jù); 將二次變換TrK選擇性地應用于殘差數(shù)據(jù), 其中,N表示應用了初級變換Cn的輸入向量的長度尺寸,K表示應用了二次變換TrK的初級變換輸出的前幾個系數(shù)的長度。
2.如權利要求1所述的方法,其中,確定二次變換TrK的步驟包括: 確定用于長度N的輸入數(shù)據(jù)的第一相關矩陣Rn ; 確定用于作為初級變換Cn的應用結果而獲得的數(shù)據(jù)的第二相關矩陣Un ; 確定矩陣\N為第二相關矩陣Un的頂部K行和K列; 將\N的卡洛南-洛伊變換(KLT)確定為WK,N ; 將WK,N的基于整數(shù)的近似確定為YK,N,并將YK,N用作TrK。
3.如權利要求2所述的方法,還包括: 將WK,N乘以2m ; 將乘法結果取整為最接近的整數(shù), 其中,m是大于O的整數(shù)并表示所需的精度。
4.如權利要求2所述的方法,還包括對第一相關矩陣Rn進行平滑。
5.如權利要求1所述的方法,其中,將二次變換TrK選擇性地應用于殘差數(shù)據(jù)的步驟包括: 確定預測模式; 根據(jù)確定的預測模式,在水平方向和垂直方向中的至少一個上應用二次變換TrK。
6.如權利要求8所述的方法,其中,在水平方向和垂直方向上將初級變換Cn應用于殘差數(shù)據(jù),在水平方向和垂直方向上將二次變換TrK應用于殘差,并且在水平方向上應用初級變換Cn、在垂直方向上應用初級變換Cn、在水平方向上應用二次變換TrK以及在垂直方向上應用二次變換TrK的順序根據(jù)塊尺寸和變換尺寸的值而變化。
7.如權利要求1所述的方法,還包括:在將初級變換Cn應用于殘差數(shù)據(jù)之前翻轉所述殘差數(shù)據(jù)。
8.一種用于對視頻數(shù)據(jù)進行解碼的方法,所述方法包括: 確定應用于殘差數(shù)據(jù)的逆二次變換inv (TrK),其中,inv ()表示逆運算; 確定應用于殘差數(shù)據(jù)或逆二次變換單元的輸出的逆初級變換inv (Cn); 將逆二次變換inv (TrK)選擇性地應用于殘差數(shù)據(jù); 將逆初級變換inv (Cn)應用于殘差數(shù)據(jù), 其中,N表示應用了逆初級變換inv (Cn)的輸入向量的長度尺寸,K表示應用了逆二次變換inv (TrK)的殘差數(shù)據(jù)的前幾個系數(shù)的長度。
9.如權利要求8所述的方法,其中,確定逆二次變換inv(TrK)的步驟包括: 確定在編碼器中的用于長度N的輸入數(shù)據(jù)的第一相關矩陣Rn ; 確定用于作為在編碼期間對輸入數(shù)據(jù)應用初級變換Cn的結果而獲得的數(shù)據(jù)的第二相關矩陣Un ;確定矩陣\N為矩陣Un的頂部K行和K列; 將\N的卡洛南-洛伊變換(KLT)確定為WK,N ; 將WK,N的基于整數(shù)的近似確定為YK,N,并將YK,N用作TrK。
10.如權利要求9所述的方法,還包括: 將WK,N乘以2m ; 將乘法結果取整為最接近的整數(shù), 其中,m是大于O的整數(shù)并表示所需的精度。
11.如權利要求9所述的方法,還包括對第一相關矩陣Rn進行平滑。
12.如權利要求8所述的方法,其中,將逆二次變換inv(TrK)選擇性地應用于殘差數(shù)據(jù)的步驟包括: 確定預測模式; 根據(jù)確定的預測模式,在水平方向和垂直方向中的至少一個上應用逆二次變換inv(TrK)。
13.如權利要求8所述的方法,還包括:在將逆初級變換inv(Cn)應用于殘差數(shù)據(jù)之后翻轉該殘差數(shù)據(jù)。
14.一種電子裝置 ,包括: 視頻編碼器,操作以根據(jù)權利要求1至權利要求7中的任意一個的方法來對視頻數(shù)據(jù)進行編碼。
15.一種電子裝置,包括: 視頻解碼器,操作以根據(jù)權利要求8至權利要求13中的任意一個的方法來對視頻數(shù)據(jù)進行解碼。
【文檔編號】H04N19/103GK103636205SQ201280033089
【公開日】2014年3月12日 申請日期:2012年7月2日 優(yōu)先權日:2011年7月1日
【發(fā)明者】安克·塞克森納, 菲利克斯·卡洛斯·費爾南德斯 申請人:三星電子株式會社