具有低延遲的用于殘差編碼的模式依賴變換的制作方法

文檔序號：7990907閱讀：382來源：國知局

具有低延遲的用于殘差編碼的模式依賴變換的制作方法
【專利摘要】本發(fā)明提供了一種用于處理視頻數(shù)據(jù)的設備和方法。所述方法包括：在編碼器中確定用于應用于殘差數(shù)據(jù)的初級變換CN；確定用于應用于殘差數(shù)據(jù)的二次變換TrK；將初級變換CN應用于殘差數(shù)據(jù)；將二次變換TrK選擇性地應用于殘差數(shù)據(jù)，其中，N表示應用了初級變換CN的輸入向量的長度尺寸，K表示應用了二次變換TrK的初級變換輸出的前幾個系數(shù)的長度。在解碼器中執(zhí)行類似的逆操作，即，在解碼器中對于輸入殘差數(shù)據(jù)選擇性地應用逆二次變換inv（TrK），然后應用逆初級變換inv（CN）。
【專利說明】具有低延遲的用于殘差編碼的模式依賴變換
【技術領域】
[0001]本發(fā)明涉及一種用于視頻編碼的設備和方法。更具體地講，本發(fā)明涉及一種確定用于殘差編碼的變換的設備和方法。
【背景技術】
[0002]在高效率視頻編碼(HEVC)的現(xiàn)行標準中，針對幀內(nèi)預測殘差提出對標準離散余弦變換(DCT)的替代變換。這些變換可大致上被分類為基于訓練的變換或基于模式的變換。在基于訓練的變換中的突出變換是模式依賴的方向變換(MDDT)。在MDDT中，針對每個幀內(nèi)預測模式收集誤差殘差的大的訓練集，然后使用殘差訓練集來計算最優(yōu)變換矩陣。然而，MDDT需要大量的變換矩陣(例如，按N=4和N=8的塊尺寸多達18個)?；谀Ｊ降淖儞Q假設視頻信號被建模為一階高斯-馬爾可夫處理并然后解析地推導出最優(yōu)變換。這些基于模式的變換僅需要按塊尺寸的兩個變換矩陣。
[0003]當邊界信息在一個方向上可用時，針對一階高斯-馬爾可夫模型推導出具有與傳統(tǒng)DCT不同的頻率和相位分量的離散正弦變換(DST)類型7，如在H.264/先進視頻編碼(AVC)標準中的幀內(nèi)預測。還示出，如果預測沒有沿著特定方向被執(zhí)行，則執(zhí)行接近于最優(yōu)卡洛南-洛伊((Karhunen-Loeve))變換(KLT)的DCT。這種思想被應用于H.264/AVC中的幀內(nèi)預測中的垂直模式和水平模式，并且提出的DST類型-7和傳統(tǒng)的DCT的組合被適應性地使用。DST和DCT的組合還被應用于H.264/AVC中的其他預測模式，并顯示出與MDDT相比在性能上僅存在較少的損失。例如，DST被應用于針對HEVC的統(tǒng)一幀內(nèi)方向預測中的各種模式。然而，在一些情況下，量化和反量化表的另外的集合是必須的。在其他情況下，存在針對DCT的兩種不同的實現(xiàn)。在其他情況下，不使用量化表和反量化表的另外的集合，并且僅使用DCT的單個實現(xiàn)，但是不存在針對DST類型7變換矩陣的快速實現(xiàn)，并且全矩陣乘法被用來針對DST和反DST矩陣執(zhí)行DST操作。
[0004]為了克服針對適當縮放的DST類型7的全矩陣乘法的缺點(即，為了保持量化矩陣和反量化矩陣的相同集合)，介紹針對4X4DST的快速DST實現(xiàn)，在所述快速DST實現(xiàn)中，正DST采用了 9次乘法而反DST僅使用了 8次乘法。
[0005]然而，8X8DST變換沒有針對用于HEVC的統(tǒng)一幀內(nèi)方向預測的所有幀內(nèi)預測模式提供顯著的增益。首要的原因是，針對傾斜模式(即，除了垂直和水平之外的模式)，DST可能不是在大于4X4的塊尺寸的情況下的最優(yōu)變換。因此，需要設計用于8X8以及大于8X8的塊尺寸的幀內(nèi)預測殘差的最優(yōu)變換。
[0006]另外，通過對用于尺寸8的幀內(nèi)預測殘差(具有P =1)的相關矩陣進行平滑并僅采用8X8相關矩陣的頂部的4X4部分設計了 4點二次變換。然后，得到的4點二次變換被應用于尺寸8X8、16X 16和32X32的塊。然而，由于這種變換是僅針對于尺寸8X8的塊被設計的并在其他塊尺寸被再次使用，因此這種變換針對于16X 16和32X32的塊尺寸并不是最優(yōu)的。因此，需要推導出針對所有的塊尺寸(例如，8\8、16\16、32父32)和可能更高的塊尺寸運行良好的最優(yōu)變換。[0007]此外，通常，一旦2-d初級變換(例如，DCT)完成，就應用2-d 二次變換。這暗示著，(在延遲方面)開銷會大致等于針對二次變換的循環(huán)與針對初次變換的循環(huán)的比率。但是對于實際的實現(xiàn)，二次變換的延遲應該是低的。因此，針對在初次變換之后的二次變換，需要不同的低延遲結構。

【發(fā)明內(nèi)容】

[0008]解決方案
[0009]本發(fā)明的各方面將至少解決上述問題和/或缺點，并至少提供以下所述優(yōu)點。
[0010]根據(jù)本發(fā)明的一方面，提供一種用于對視頻數(shù)據(jù)進行編碼的方法。所述方法包括:確定應用于殘差數(shù)據(jù)的初級變換Cn ;確定應用于殘差數(shù)據(jù)的二次變換TrK ;將初級變換(；應用于殘差數(shù)據(jù)；將二次變換TrK選擇性地應用于殘差數(shù)據(jù)，其中，N表示應用了初級變換Cn的輸入向量的長度尺寸，K表示應用了二次變換TrK的初級變換輸出的前幾個系數(shù)的長度。
[0011]在實施例中，確定二次變換TrK的步驟包括:確定用于長度N的輸入數(shù)據(jù)的第一相關矩陣Rn ;確定用于作為初級變換Cn的應用結果而獲得的數(shù)據(jù)的第二相關矩陣Un ;確定矩陣\N為第二相關矩陣Un的頂部K行和K列；將VK，N的卡洛南-洛伊變換(KLT)確定為WK，N，并將WK，N的基于整數(shù)的近似確定為YK，N并將YK，N用作TrK。
[0012]在實施例中，所述方法還包括:將WK，N乘以2m;將乘法結果取整為最接近的整數(shù)，其中，m是大于O的整數(shù)并表示所需的精度。
[0013]在實施例中，獲得子集矩陣的步驟包括:應用以下等式:
【權利要求】
1.一種用于對視頻數(shù)據(jù)進行編碼的方法，所述方法包括: 確定應用于殘差數(shù)據(jù)的初級變換Cn ；確定應用于殘差數(shù)據(jù)的二次變換TrK ；將初級變換Cn應用于殘差數(shù)據(jù)；將二次變換TrK選擇性地應用于殘差數(shù)據(jù)，其中，N表示應用了初級變換Cn的輸入向量的長度尺寸，K表示應用了二次變換TrK的初級變換輸出的前幾個系數(shù)的長度。
2.如權利要求1所述的方法，其中，確定二次變換TrK的步驟包括: 確定用于長度N的輸入數(shù)據(jù)的第一相關矩陣Rn ；確定用于作為初級變換Cn的應用結果而獲得的數(shù)據(jù)的第二相關矩陣Un ；確定矩陣\N為第二相關矩陣Un的頂部K行和K列；將\N的卡洛南-洛伊變換(KLT)確定為WK，N ；將WK，N的基于整數(shù)的近似確定為YK，N，并將YK，N用作TrK。
3.如權利要求2所述的方法，還包括: 將WK，N乘以2m ；將乘法結果取整為最接近的整數(shù)，其中，m是大于O的整數(shù)并表示所需的精度。
4.如權利要求2所述的方法，還包括對第一相關矩陣Rn進行平滑。
5.如權利要求1所述的方法，其中，將二次變換TrK選擇性地應用于殘差數(shù)據(jù)的步驟包括: 確定預測模式；根據(jù)確定的預測模式，在水平方向和垂直方向中的至少一個上應用二次變換TrK。
6.如權利要求8所述的方法，其中，在水平方向和垂直方向上將初級變換Cn應用于殘差數(shù)據(jù)，在水平方向和垂直方向上將二次變換TrK應用于殘差，并且在水平方向上應用初級變換Cn、在垂直方向上應用初級變換Cn、在水平方向上應用二次變換TrK以及在垂直方向上應用二次變換TrK的順序根據(jù)塊尺寸和變換尺寸的值而變化。
7.如權利要求1所述的方法，還包括:在將初級變換Cn應用于殘差數(shù)據(jù)之前翻轉所述殘差數(shù)據(jù)。
8.一種用于對視頻數(shù)據(jù)進行解碼的方法，所述方法包括: 確定應用于殘差數(shù)據(jù)的逆二次變換inv (TrK)，其中，inv ()表示逆運算；確定應用于殘差數(shù)據(jù)或逆二次變換單元的輸出的逆初級變換inv (Cn)；將逆二次變換inv (TrK)選擇性地應用于殘差數(shù)據(jù)；將逆初級變換inv (Cn)應用于殘差數(shù)據(jù)，其中，N表示應用了逆初級變換inv (Cn)的輸入向量的長度尺寸，K表示應用了逆二次變換inv (TrK)的殘差數(shù)據(jù)的前幾個系數(shù)的長度。
9.如權利要求8所述的方法，其中，確定逆二次變換inv(TrK)的步驟包括: 確定在編碼器中的用于長度N的輸入數(shù)據(jù)的第一相關矩陣Rn ；確定用于作為在編碼期間對輸入數(shù)據(jù)應用初級變換Cn的結果而獲得的數(shù)據(jù)的第二相關矩陣Un ；確定矩陣\N為矩陣Un的頂部K行和K列；將\N的卡洛南-洛伊變換(KLT)確定為WK，N ；將WK，N的基于整數(shù)的近似確定為YK，N，并將YK，N用作TrK。
10.如權利要求9所述的方法，還包括: 將WK，N乘以2m ；將乘法結果取整為最接近的整數(shù)，其中，m是大于O的整數(shù)并表示所需的精度。
11.如權利要求9所述的方法，還包括對第一相關矩陣Rn進行平滑。
12.如權利要求8所述的方法，其中，將逆二次變換inv(TrK)選擇性地應用于殘差數(shù)據(jù)的步驟包括: 確定預測模式；根據(jù)確定的預測模式，在水平方向和垂直方向中的至少一個上應用逆二次變換inv(TrK)。
13.如權利要求8所述的方法，還包括:在將逆初級變換inv(Cn)應用于殘差數(shù)據(jù)之后翻轉該殘差數(shù)據(jù)。
14.一種電子裝置，包括: 視頻編碼器，操作以根據(jù)權利要求1至權利要求7中的任意一個的方法來對視頻數(shù)據(jù)進行編碼。
15.一種電子裝置，包括: 視頻解碼器，操作以根據(jù)權利要求8至權利要求13中的任意一個的方法來對視頻數(shù)據(jù)進行解碼。
【文檔編號】H04N19/103GK103636205SQ201280033089
【公開日】2014年3月12日申請日期:2012年7月2日優(yōu)先權日:2011年7月1日
【發(fā)明者】安克·塞克森納, 菲利克斯·卡洛斯·費爾南德斯申請人:三星電子株式會社

完整全部詳細技術資料下載