數(shù)字媒體數(shù)據(jù)的編/譯碼方法及其比特流的處理方法

文檔序號：7708782閱讀：267來源：國知局

專利名稱：數(shù)字媒體數(shù)據(jù)的編/譯碼方法及其比特流的處理方法
技術領域：
本發(fā)明涉及用于視頻編碼(video coding)的多參考幀架構(multiplereference frame architecture)，尤其涉及數(shù)字媒體數(shù)據(jù)的編碼方法、已編碼的數(shù)字媒體數(shù)據(jù)的譯碼方法以及數(shù)字媒體數(shù)據(jù)的比特流的處理方法。
背景技術：
考慮一種多參考幀架構(例如符合H. 264規(guī)范的裝置)，當實施多幀運動補償 (motion compensation)時會產生一些問題，諸如復雜的內存訪問行為(access behavior) 以及對主存儲器的高內存訪問率等問題，其中的主存儲器可以是由所述裝置的處理器訪問的動態(tài)隨機存儲器(Dynamic RandomAccess Memory, DRAM)。通常處理器與主存儲器分別位于裝置內的不同芯片中，而由于上述復雜的內存訪問行為與/或對主存儲器的高內存訪問率的問題，可能會導致主存儲器的內存帶寬不足。根據(jù)現(xiàn)有技術，已提出一些關于減少相應的內存需求(如對DRAM的內存需求)的方案，以解決部分上述問題。其中一種方案包含縮放譯碼圖像(scaling decoded pictures)，然而，經過縮放的圖像質量通常會降低。另一種方案是以一種簡單的方式來壓縮譯碼圖像，而這種簡單方式無須隨機地訪問宏區(qū)塊(MacroBlock, MB)。然而根據(jù)這種方案，同樣難以防止圖像質量下降的問題。再根據(jù)另一種方案，可應用對特定幀的及時 (just-in-time)譯碼技術，但是對于低成本效益(cost-efficient)的硬件架構而言，其相應的計算負擔非常沉重。如上所述，以上述方案中的至少一種實施的架構，其總體性能通常都會由于多幀運動補償?shù)囊恍┳陨硖匦远鴾p低。圖l顯示根據(jù)現(xiàn)有技術實施多幀運動補償?shù)那闆r。例如，參考圖l所示的情況，宏區(qū)塊的參考數(shù)據(jù)可來自多幅幀。另外，相對于單一幀運動補償而言，多幀運動補償引入更多的運動向量與更多的幀內預測信息(intra information)。并且，還可能遇到關于長期的內存管理的一些問題。因此，根據(jù)現(xiàn)有技術，盡管可能達成減少相應的內存需求的目標，但難以防止產生的令人不悅的副作用(side effect)。
考慮到現(xiàn)有技術的多參考幀架構的一項基本特征(essentialcharacteristic) 是在同一宏區(qū)塊層中編碼過多的信息，如宏區(qū)塊類型、參考幀列表、運動向量差 (difference)、編碼區(qū)塊樣式(coded block pattern)、轉換類型、殘余(residual)等信息，傳統(tǒng)的編碼方法必然會由于譯碼的結果有時包含冗余信息而不夠完善。
特別地，在同一宏區(qū)塊層內，根據(jù)傳統(tǒng)的語法對預測信息(舉例而言，如包含運動向量信息以及參考幀信息等信息的幀間預測信息，或者如包含幀內預測模式信息等信息的幀內預測信息)以及預測誤差信息(舉例而言，編碼區(qū)塊樣式信息或殘余信息)進行編碼，其中單獨對每一參考幀列表進行編碼，并且每一參考幀獨立于其它的參考幀。圖2顯示的是根據(jù)現(xiàn)有技術的利用傳統(tǒng)語法在宏區(qū)塊層中處理程序的流程圖。因此，根據(jù)如圖2所示的程序10中使用的傳統(tǒng)語法(如H. 264標準第7. 3. 5節(jié)所述的宏區(qū)塊層語法)，以此實施的多參考幀架構會遭受沉重的計算負擔。所以，需要一種新的方法來減少上述的冗余信息數(shù)量以降低這種沉重的負擔。

發(fā)明內容
為了解決上述數(shù)字媒體數(shù)據(jù)的編譯碼中復雜的內存訪問行為以及對主存儲器的高內存訪問率等問題，本發(fā)明提供一種數(shù)字媒體數(shù)據(jù)的編碼方法、已編碼的數(shù)字媒體數(shù)據(jù)的譯碼方法以及數(shù)字媒體數(shù)據(jù)的比特流的處理方法。根據(jù)本發(fā)明之一實施例，提供一種數(shù)字媒體數(shù)據(jù)的編碼方法，包含獲取所述數(shù)字媒體數(shù)據(jù)的至少一部分預測信息與至少一部分預測誤差信息；以及將所述數(shù)字媒體數(shù)據(jù)編碼為比特流，其中所述比特流包含第一比特流區(qū)段以及第二比特流區(qū)段，所述第一比特流區(qū)段與所述第二比特流區(qū)段分別承載所述部分預測信息與所述部分預測誤差信息；其中，在所述比特流中，所述部分預測信息與所述部分預測誤差信息承載于非同一宏區(qū)塊中或宏區(qū)塊的非同一子單元中。根據(jù)本發(fā)明之一實施例，提供一種已編碼的數(shù)字媒體數(shù)據(jù)的譯碼方法，包含接收代表所述已編碼的數(shù)字媒體數(shù)據(jù)的比特流，其中所述比特流包含第一比特流區(qū)段以及第二比特流區(qū)段，所述第一比特流區(qū)段與所述第二比特流區(qū)段分別承載所述數(shù)字媒體數(shù)據(jù)的至少一部分預測信息與所述數(shù)字媒體數(shù)據(jù)的至少一部分預測誤差信息；以及根據(jù)所述部分預測信息與所述部分預測誤差信息將所述比特流譯碼為數(shù)字媒體數(shù)據(jù)；其中，在所述比特流中，所述部分預測信息與所述部分預測誤差信息承載于非同一宏區(qū)塊中或一宏區(qū)塊的非同一子單元中。根據(jù)本發(fā)明之一實施例，提供一種數(shù)字媒體數(shù)據(jù)的編碼方法，包含為所述數(shù)字媒體數(shù)據(jù)的多個宏區(qū)塊確定初始編碼模式，其中，根據(jù)所述初始編碼模式，所述多個宏區(qū)塊的至少一部分第一信息與至少一部分第二信息，分別由第一比特流區(qū)段以及第二比特流區(qū)段承載，其中所述第一比特流區(qū)段與所述第二比特流區(qū)段位于由所述數(shù)字媒體數(shù)據(jù)編碼得到的比特流中；分析自初始程序獲取得到的統(tǒng)計信息，以確定應當對至少一部分的語法元素使用何種編碼方法，其中所述初始程序是在所述初始編碼模式中實施；以及將所述數(shù)字媒體數(shù)據(jù)編碼為所述比特流。根據(jù)本發(fā)明之一實施例，提供一種數(shù)字媒體數(shù)據(jù)的比特流的處理方法，包含處理第一比特流區(qū)段與第二比特流區(qū)段，其中所述第一比特流區(qū)段與所述第二比特流區(qū)段分別承載所述數(shù)字媒體數(shù)據(jù)的至少一部分預測信息與所述數(shù)字媒體數(shù)據(jù)的至少一部分預測誤差信息；其中每一比特流區(qū)段承載多于一個最小已編碼單元的信息。與現(xiàn)有技術對比，本發(fā)明待編碼的數(shù)字媒體數(shù)據(jù)的至少一部分預測信息與至少一部分預測誤差信息無須屬于同一比特流區(qū)段的同一宏區(qū)塊層，對預測信息與預測誤差信息的獲取可部分獨立或完全獨立，從而可以僅暫時儲存必要信息，減少內存訪問負擔，而且減少譯碼結果中的冗余信息，降低硬件架構的計算負擔，因此相比于現(xiàn)有技術性能得以提升。

圖1顯示根據(jù)現(xiàn)有技術實施多幀運動補償?shù)那闆r。圖2顯示的是根據(jù)現(xiàn)有技術的利用傳統(tǒng)語法在宏區(qū)塊層中處理程序的流程圖。
圖3為根據(jù)本發(fā)明的第一實施例，分別在預測誤差信息區(qū)段以及預測信息區(qū)段，
6利用一種新的語法實施宏區(qū)塊層處理的程序900的流程圖。
圖4為圖3所示的步驟910A中的子程序的流程圖。
圖5為圖3所示的步驟910B中的子程序的流程圖。圖6顯示的是根據(jù)本發(fā)明第二實施例的切片層中比特流的比特流結構示意圖。
圖7顯示的是根據(jù)本發(fā)明第三實施例的圖像層中的比特流的比特流結構示意圖。
圖8顯示的是根據(jù)本發(fā)明第四實施例的GOP層中的比特流的比特流結構示意圖。
圖9與圖10顯示了第五實施例的編碼方法與先關技術中的傳統(tǒng)編碼方法的對比示意圖。圖11進一步顯示了圖10中所示的編碼方法中使用的符碼的多個推廣的比特流形式。圖12顯示了第五實施例的變形與現(xiàn)有技術的傳統(tǒng)編碼方法的對比示意圖。
具體實施例方式
在說明書及前述的權利要求當中使用了某些詞匯來指稱特定的元件。所屬領域中普通技術人員應可理解，硬件制造商可能會用不同的名詞來稱呼同一個元件。本說明書及前述的權利要求并不以名稱的差異來作為區(qū)分元件的方式，而是以元件在功能上的差異來作為區(qū)分的準則。在通篇說明書及前述的權利要求當中所提及的"包含"為一開放式的用語，故應解釋成"包含但不限定于"。以外，"耦接"一詞在此包含任何直接及間接的電氣連接手段。因此，若文中描述第一裝置耦接于第二裝置，則代表該第一裝置可直接電氣連接于該第二裝置，或透過其它裝置或連接手段間接地電氣連接至該第二裝置。另外，編碼(coding)可泛指狹義的編碼(encoding)與譯碼(decoding)，具體視在文中的含義而定。
本發(fā)明提供一種數(shù)字媒體數(shù)據(jù)的編碼方法，其中數(shù)字媒體數(shù)據(jù)具有至少一部分預測信息與至少一部分預測誤差信息由不同的比特流區(qū)段(section)分別承載，并且進一步提供一種已編碼的數(shù)字媒體數(shù)據(jù)的譯碼方法，其中數(shù)字媒體數(shù)據(jù)具有至少一部分預測信息與至少一部分預測誤差信息由不同的比特流區(qū)段分別承載。特別地，數(shù)字媒體數(shù)據(jù)代表運動圖像，而數(shù)字媒體數(shù)據(jù)的編碼方法通常產生運動圖像的比特流，其中本發(fā)明的編/譯碼方法可視需求而相結合。根據(jù)本發(fā)明的不同實施例，原本利用傳統(tǒng)編碼語法在同一宏區(qū)塊層編碼的一部分信息，可以分開在如宏區(qū)塊層的不同的宏區(qū)塊層級(level)中編碼。例如，由于至少一部分信息可視為若干宏區(qū)塊的通用信息(globalinformation)，所以上文述及的宏區(qū)塊類型、參考幀列表與/或運動向量差等信息可不在同一宏區(qū)塊層中編碼。請參照圖3、圖4與圖5。圖3為根據(jù)本發(fā)明的第一實施例，分別在預測誤差信息區(qū)段以及預測信息區(qū)段，利用一種新的語法實施宏區(qū)塊層處理的程序900的流程圖。在圖3所示的步驟910A中，于預測誤差信息區(qū)段實施宏區(qū)塊層處理。在圖3所示的步驟910B中，于預測信息區(qū)段實施宏區(qū)塊層處理。根據(jù)本發(fā)明的一個實施例，圖4為圖3所示的步驟910A中的子程序的流程圖。根據(jù)本發(fā)明的另一個實施例，圖5為圖3所示的步驟910B中的子程序的流程圖。如圖3所示，步驟910A與步驟910B彼此獨立執(zhí)行而無須同時實施，接著在步驟920中實施后處理(post-processing)。此處需注意，盡管圖4中所示的步 912A、步驟914、步驟916與步驟918分別對應于圖2中所示的步驟12、步驟14、步驟16與步驟18，然而圖4所示的實施例的步驟910A中的子程序不同于圖2中所示的程序10。步驟910A中的宏區(qū)塊層處理不包含準備預測信息的步驟(如在步驟10M中宏區(qū)塊層處理的步驟13)，步驟910A中需要利用所述的新語法(或另一種新語法)，而非傳統(tǒng)語法。因此，在步驟912A中，判斷參數(shù)mb_type是否等于默認值I_PCM(mb_type == I_PCM )，其中I_PCM代表幀內編碼的特定類型。當參數(shù)mb—type等于默認值LPCM時，則進入步驟918以實施脈沖編碼調制(Pulse Code Modulation,PCM)采樣處理；否則，進入步驟914以確定CBP(即codecLblock—pattern，代表編碼區(qū)塊樣式)以及轉換大小，接著在步驟916中確定mb_qp_delta(代表當前宏區(qū)塊與現(xiàn)有宏區(qū)塊的量化參數(shù)差)以及殘余信息。相似的，盡管圖5中所示的步驟912B與步驟913分別對應于圖2中所示的步驟12與步驟13，但圖5所示的實施例的步驟910B中的子程序不同于圖2中的程序10。步驟910B中的宏區(qū)塊層處理不包含準備預測誤差信息的步驟(如在步驟10M中宏區(qū)塊層處理的步驟14或步驟16)，步驟910B中需要利用所述的新語法(或另一種新語法)，而非傳統(tǒng)語法。因此，在步驟912B中，判斷參數(shù)mb—type是否等于默認值I_PCM(mb_type == I_PCM )，其中LPCM代表幀內編碼的特定類型。當參數(shù)mb—type等于默認值LPCM時，則跳過步驟913以終止子程序；否則，進入步驟913以獲取預測信息，即運行sub_mp_pred(mb_type)或mp—pred(mb_type)。預測誤差信息區(qū)段以及預測信息區(qū)段分別代表比特流中的兩個不同的比特流區(qū)段?？傮w而言，在本發(fā)明的不同實施例中，比特流可為待譯碼的比特流或是由編碼產生的比特流，其中比特流中的兩個比特流區(qū)段對應于一個大于宏區(qū)塊的編碼單元(在視頻應用中宏區(qū)塊可視為最小的已編碼單元)。更具體地，預測誤差信息區(qū)段與預測信息區(qū)段代表兩個不同的比特流區(qū)段，所述的兩個不同的比特流區(qū)段位于多宏區(qū)塊層(multiple-MB layer)、切片層、圖像層、圖像組(Group Of Picture, G0P)層或大于GOP層的一層中。此處術語"多宏區(qū)塊層"對應于包含多個宏區(qū)塊的組，且如上所述的術語"多宏區(qū)塊層"代表在該組中，當對這些宏區(qū)塊的預測信息進行編碼時，將這些宏區(qū)塊的預測信息收集到一起(gatheredtogether)，當對這些宏區(qū)塊的預測誤差信息進行編碼時，將這些宏區(qū)塊的預測誤差信息收集到一起。藉此，對于該組而言，可以分別對預測信息與預測誤差信息進行譯碼。相似的，當預測誤差信息區(qū)段與預測信息區(qū)段代表位于切片層的兩個不同的比特流區(qū)段時，意味著，當對切片的宏區(qū)塊的預測信息進行編碼時，將該切片的這些宏區(qū)塊的預測信息收集到一起，當對同一切片的這些宏區(qū)塊的預測誤差信息進行編碼時，將同一切片的這些宏區(qū)塊的預測誤差信息收集到一起。藉此，對于該切片而言，可以分別對預測信息與預測誤差信息進行譯碼。對于圖像層、GOP層或大于GOP層的一層而言，具體描述均與上述相似，在此不再贅述。因此，與現(xiàn)有技術對比，利用新語法，待編碼的數(shù)字媒體數(shù)據(jù)的至少一部分預測信息與至少一部分預測誤差信息無須屬于同一比特流分區(qū)(partition)的同一宏區(qū)塊層。換言之，當需要獲取預測信息時，無須首先獲取預測誤差信息，這是由于對預測信息與預測誤差信息的獲取可在宏區(qū)塊層處理中部分獨立或完全獨立。另外，當譯碼兩個連續(xù)的宏區(qū)塊的預測信息時，無須譯碼兩個連續(xù)的宏區(qū)塊的預測誤差信息。圖6顯示的是根據(jù)本發(fā)明第二實施例的切片層中比特流的比特流結構示意圖。圖
86中示例性的切片fe包含切片起始碼、分區(qū)Ps(n，l)、分區(qū)Ps(n，2)與分區(qū)Pjn，3)。第二實施例中的分區(qū)Pjn，l)承載信息，如切片標頭信息及宏區(qū)塊類型信息。分區(qū)Pjn，2)與分區(qū)Ps(n，3)分別代表比特流中的兩個各自的(respective)比特流區(qū)段，如前述的兩個比特流區(qū)段。根據(jù)第二實施例的第一實施選擇，分區(qū)Ps (n， 2)與分區(qū)Ps (n， 3)分別承載預測信息
(如預測模式信息)以及預測誤差信息。根據(jù)第二實施例的第二實施選擇，分區(qū)Pjn，2)與
分區(qū)Ps (n， 3)分別承載預測誤差信息與預測信息(如預測模式信息)。根據(jù)第二實施例，當以本發(fā)明的方法實施的編碼裝置將數(shù)字媒體數(shù)據(jù)編碼為比特
流時，編碼裝置分別獲取數(shù)字媒體數(shù)據(jù)的至少一部分預測信息與至少一部分預測誤差信
息，其中代表已編碼的數(shù)字媒體數(shù)據(jù)的比特流包含兩個比特流區(qū)段，該兩個比特流區(qū)段分
別承載所述的部分預測信息與所述的部分預測誤差信息。因此，所述的部分預測信息與所
述的部分預測誤差信息承載于非同一宏區(qū)塊或是宏區(qū)塊的非同一子單元中。在第二實施例中，部分預測誤差信息包含殘余信息。另外，部分預測信息包含運動
向量信息與/或幀內預測信息，其中至少一部分運動向量信息包含參考幀信息。另一方面，當以本發(fā)明的方法實施的譯碼裝置譯碼上述已編碼的數(shù)字媒體數(shù)據(jù)
時，譯碼裝置接收代表已編碼的數(shù)字媒體數(shù)據(jù)的比特流，其中的比特流包含兩個比特流區(qū)
段，該兩個比特流區(qū)段分別承載數(shù)字媒體數(shù)據(jù)的部分預測信息與部分預測誤差信息，其中
數(shù)字媒體數(shù)據(jù)是現(xiàn)有被編碼為已編碼的數(shù)字媒體數(shù)據(jù)。對于I切片、P切片或B切片而言，可能存在幀內編碼的(intra-coded)宏區(qū)塊，其中此種宏區(qū)塊可利用當前圖像的采樣作為參考。傳統(tǒng)的譯碼器通常儲存當前宏區(qū)塊的信息，視其為對隨后的宏區(qū)塊進行譯碼的有用信息，而由此導致冗余內存訪問以及不必要的內存訪問負擔。與此相反，參考圖5，利用本發(fā)明方法的新的比特流結構(如圖6所示)，可從比特流中單獨譯碼預測信息(如預測模式信息)，并且相應地可知整個切片的所有宏區(qū)塊所利用的參考。因此，根據(jù)幀內預測信息的譯碼結果，本實施例的譯碼裝置確定是否暫時儲存當前宏區(qū)塊的相關信息，其中儲存的當前宏區(qū)塊的相關信息被用于幀內預測模式中，以對之后的另一待處理宏區(qū)塊進行譯碼。此處僅暫時儲存必要信息，可減少內存訪問負擔，因此相比于現(xiàn)有技術性能得以提升。對于P切片或B切片而言，可能存在幀間編碼的(inter-coded)宏區(qū)塊，其中此種宏區(qū)塊可利用另一圖像的采樣作為參考。參考圖5，利用本發(fā)明方法的新的比特流結構(如圖6所示)，可從比特流中單獨譯碼預測信息(如預測模式信息)，并且由于相應地可知整個切片的所有宏區(qū)塊利用的參考，根據(jù)幀間預測信息的譯碼結果，本實施例的譯碼裝置確定是否暫時儲存當前宏區(qū)塊的相關信息。儲存的當前宏區(qū)塊的相關信息被用于幀間預測模式中，以對之后的另一待處理宏區(qū)塊進行譯碼。此處可預先實施對參考的一些預處理，以防止整個譯碼過程中的處理負擔/內存訪問負擔陡增。例如，由于參考中的一些參考數(shù)據(jù)可能已被壓縮，譯碼裝置提前解壓縮要用到的參考或解壓縮要用到的參考中的一些區(qū)域，因此相比于現(xiàn)有技術性能得以提升。根據(jù)本實施例的變形，以本發(fā)明的方法實施的譯碼裝置進一步確定，是否根據(jù)幀間預測信息的譯碼結果在重建宏區(qū)塊上實施后處理。圖7顯示的是根據(jù)本發(fā)明第三實施例的圖像層中的比特流的比特流結構示意圖。其中，第三實施例是第二實施例的一種變形。在圖7中，示例性的圖像fe包含圖像起始碼、分區(qū)Pp(n，l)、Pp(n，2)以及Pp(n，3)。與圖6相比，圖7中由圖像層替代切片層，切片層的分區(qū)Ps(n，l)、Ps(n，2)以及Ps(n，3)分別由圖像層的分區(qū)PP (n， 1) 、PP(n， 2)以及Pp(n，3)替代，其中分區(qū)Pp(n，2)以及Pp(n，3)代表前述的比特流區(qū)段。根據(jù)第三實施例的第一實施選擇，分區(qū)Pp(n，2)與分區(qū)Pp(n，3)分別承載預測信息(如預測模式信息)以及預測誤差信息。根據(jù)第三實施例的第二實施選擇，分區(qū)Pp(n，2)與分區(qū)Pp(n，3)分別承載預測誤差信息與預測信息(如預測模式信息)。本實施例中的分區(qū)具有各自的切片層信息。
圖8顯示的是根據(jù)本發(fā)明第四實施例的G0P層中的比特流的比特流結構示意圖。其中，第四實施例是第二實施例的另一種變形。在圖8中，示例性的G0Pfe包含分區(qū)P①p(n，1)、Pe。P(n，2)。與圖6相比，在圖8中由G0P層替代切片層，切片層的分區(qū)Ps(n，2)以及Pjn，3)分別由G0P層的分區(qū)P①p(n，l)、Pe。p(n，2)替代，其中分區(qū)Pe。P(n， 1)以及P^(n，2)代表前述的比特流區(qū)段。根據(jù)第四實施例的第一實施選擇，分區(qū)Pc;。p(n，1)與分區(qū)P^(n，2)分別承載預測信息(如預測模式信息)以及預測誤差信息。根據(jù)第四實施例的第二實施選擇，分區(qū)P^(n，1)與分區(qū)P^(n，2)分別承載預測誤差信息與預測信息(如預測模式信息)。本實施例中的分區(qū)具有各自的圖像層信息與切片層信息等。 —種特定的視頻編碼標準允許幀間編碼的宏區(qū)塊參考多幅參考幀，在這種情況中，本發(fā)明的方法(尤其是第四實施例)可便捷地適用于這種特定的視頻編碼標準。由于整個GOP的所有圖像所利用的參考(如參考圖像)都是已知的，那么可以進一步減少本實施例的譯碼裝置對外部內存的利用需求以及相應的內存訪問負擔，而使得根據(jù)特定的視頻編碼標準實施本發(fā)明的方法具有較高的可行性(feasibility)以及/或較高的彈性(flexibility)。舉例而言，除了圖像Pic(m)中的特定的區(qū)域之外，并沒有參考圖像Pic(m)中的其它區(qū)域。在實際操作中，當已經播放過圖像Pic(m)時，本實施例的譯碼裝置僅暫時儲存圖像Pic(m)特定區(qū)域的相關信息，而不是儲存整個圖像Pic(m)的數(shù)據(jù)。相似的，當除了作為參考幀之外不再需要利用到圖像Pic(m)時，本實施例的譯碼裝置僅暫時儲存圖像Pic(m)特定區(qū)域的相關信息，而不是儲存整個圖像Pic (m)的數(shù)據(jù)。根據(jù)第二實施例的另一種變形，用于安置(arranging)所述兩個比特流區(qū)段的切片層由用于安置所述兩個比特流區(qū)段的序列替代，其中一個比特流區(qū)段承載預測信息(如預測模式信息)而另一個比特流區(qū)段承載預測誤差信息。此變形與上文相似之處不再贅述。考慮上述的新語法，相較于根據(jù)傳統(tǒng)語法實施的編碼方法，本發(fā)明的方法提供表示參考幀系數(shù)(index)的更好的編碼方法，其中，參考幀系數(shù)在幀間預測模式中使用到。在第五實施例中，處理裝置可用于將數(shù)字媒體數(shù)據(jù)編碼為比特流。第五實施例是第一實施例的一種變形。處理裝置可進一步用于將所述比特流譯碼為數(shù)字媒體數(shù)據(jù)，或者在必要時將比特流的再生形式(r印roduced form)譯碼為數(shù)字媒體數(shù)據(jù)。例如，處理裝置可為用于在數(shù)字錄像機(video recorder)中實施圖像處理的微處理器。根據(jù)本發(fā)明的第五實施例，當將數(shù)字媒體數(shù)據(jù)編碼為比特流時，處理裝置可首先確定媒體數(shù)字數(shù)據(jù)的多個宏區(qū)塊的初始編碼模式，其中，取決于本實施例的不同實施選擇，多個宏區(qū)塊可代表圖像、切片或一組區(qū)塊。根據(jù)初始編碼模式，數(shù)字媒體數(shù)據(jù)的宏區(qū)塊的至少一部分預測信息(可稱為第一信息)與至少一部分預測誤差信息(可稱為第二信息)，分別由兩個不同的比特流區(qū)段承載(例如前述的兩個比特流區(qū)段)。另外，處理裝置從初始程序中獲取特定的統(tǒng)計信息，其中初始程序是在初始編碼模式中實施的。通過分析統(tǒng)計信息，處理裝置確定應對至少一部分的語法元素使用何種編碼方法(如熵編碼方法)。例如，語法元素包含預測信息與/或預測誤差信息。在另一些例子中，語法元素包含參考幀信息、運動向量信息與/或殘余的非零信息。在本實施例中，處理裝置根據(jù)統(tǒng)計信息確定對參考幀使用何種編碼方法，其中參
考幀的編碼方法由兩個比特流區(qū)段前方的標頭承載。通常，從多個編碼方法中選擇出上述
編碼方法，而較佳的編碼方法取決于宏區(qū)塊中所使用到的參考幀系數(shù)的數(shù)量。在實踐中，編碼方法取決于所使用的參考幀的數(shù)量。更具體地，處理裝置對不同
的情況確定不同的編碼方法，其中所述的不同情況中分別使用1、2、3.....k個參考幀。例
如，對于這些不同的情況，可使用不同的編碼方案(如不同的編碼對應表)。需要注意，根據(jù) 本實施例，對統(tǒng)計信息獨立地計算前向預測使用的參考幀數(shù)量與后向預測使用的參考幀數(shù) 量。舉例而言，在一種情況中，前向預測使用一個參考幀而后向預測也使用一個參考幀，無論對于前向預測還是后向預測，都認為是使用一個參考幀的情況來確定編碼方法。
此外，編碼方法取決于當前宏區(qū)塊中所使用的參考幀系數(shù)的數(shù)量。更具體地，由于使用了兩個比特流區(qū)段(如圖6 8顯示的實施例之一中的比特流區(qū)段)以分別承載一部分預測信息與一部分預測誤差信息，處理裝置可獲取宏區(qū)塊使用的參考幀系數(shù)的最大可能數(shù)量。例如，特定宏區(qū)塊的宏區(qū)塊分區(qū)是16X8或8X16的。如果特定宏區(qū)塊位于P圖像中，應當僅有兩個參考幀系數(shù)。如果特定宏區(qū)塊位于B圖像中，應當有四個參考幀系數(shù)。
以特定宏區(qū)塊位于P圖像為例，請參照圖9與圖10以了解根據(jù)第五實施例的不同實施選擇的相關編碼方法的實施詳情。圖9與圖10顯示了第五實施例的編碼方法與先關技術中的傳統(tǒng)編碼方法的對比示意圖。根據(jù)第五實施例的第一實施選擇，當僅使用三個參考幀時，在圖9中顯示的九個數(shù)據(jù)行(row)中列出了九種不同情形，在該模式中使用兩個參考幀系數(shù)block—a、block—b。其中所示的傳統(tǒng)編碼方法，當參考幀系數(shù)等于0、1、2時，傳統(tǒng) 編碼方法的符碼(code)分別等于1、010、011。根據(jù)第五實施例的第二實施選擇，當使用四個參考幀時，在圖10中顯示的十六個數(shù)據(jù)列中列出了十六種不同情形，在該模式中使用兩個參考幀系數(shù)block—a、block—b。其中所示的傳統(tǒng)編碼方法，當系數(shù)等于0、1、2、3時，傳統(tǒng) 編碼方法的符碼分別等于1 、 010 、 011 、 00100 。根據(jù)第五實施例的第三實施選擇，圖11進一步顯示了圖10中所示的編碼方法中使用的符碼的多個推廣的比特流形式?？紤]圖10中所示的編碼方法的符碼，第一符碼"l" 對應于圖11中所示的比特流形式"1"，而符碼"010"與"011"對應于圖11中所示的比特流形式"01X。"。類似地，符碼"00100"、"00101"、"00110"對應于圖11中所示的比特流形式 "0 0 1 X丄X。"，符碼"0001000"、"0001001"、 . . . 、"0001111"對應于圖11中所示的比特流形式"0 0 0 1 X2 & X。"，等等。請注意圖11中所示的每一比特流形式，是根據(jù)與圖10中所示的編碼方法相應符碼的符碼數(shù)量codeNum的二進制數(shù)表示的。圖11中列出了每一比特流形式的符碼數(shù)量codeNum的范圍。根據(jù)第五實施例的一種變形，圖12顯示的是在特定宏區(qū)塊位于P圖像中的情況下相關編碼方法的實施詳情。圖12顯示了第五實施例的變形與現(xiàn)有技術的傳統(tǒng)編碼方法的對比示意圖。其中所示的傳統(tǒng)編碼方法，當系數(shù)等于0、1、2、3時，傳統(tǒng)編碼方法的符碼分別等于1、010、011、00100。依照第五實施例的變形，編碼方法是根據(jù)處理裝置預測得到的特定概率數(shù)值，從第五實施例中所使用的那些編碼方法調整而來。例如，當參考幀系數(shù)(block_ a，block_b)等于(0，2)時，相應的編碼方法提供5位的符碼"00100"。另外，當參考幀系數(shù) (block_a， block_b)等于(l，O)時，相應的編碼方法提供3位的符碼"011"。
盡管第五實施例及圖12所示的其變形是以CAVLC熵編碼來敘述的，但本發(fā)明并不僅限于此。根據(jù)第五實施例的另一變形，可以利用其它種類的熵編碼來替代CAVLC熵編碼。
雖然本發(fā)明已就較佳實施例揭露如上，然其并非用以限定本發(fā)明。本發(fā)明所屬技術領域中普通技術人員，在不脫離本發(fā)明的精神和范圍內，當可作各種的變更和潤飾。因此，本發(fā)明的保護范圍當視之前的權利要求書所界定者為準。
1權利要求
一種數(shù)字媒體數(shù)據(jù)的編碼方法，其特征在于，包含獲取所述數(shù)字媒體數(shù)據(jù)的至少一部分預測信息與至少一部分預測誤差信息；以及將所述數(shù)字媒體數(shù)據(jù)編碼為比特流，其中所述比特流包含第一比特流區(qū)段以及第二比特流區(qū)段，所述第一比特流區(qū)段與所述第二比特流區(qū)段分別承載所述部分預測信息與所述部分預測誤差信息；其中，在所述比特流中，所述部分預測信息與所述部分預測誤差信息承載于非同一宏區(qū)塊中或宏區(qū)塊的非同一子單元中。
2. 根據(jù)權利要求1所述的數(shù)字媒體數(shù)據(jù)的編碼方法，其特征在于，所述部分預測誤差信息包含殘余信息。
3. 根據(jù)權利要求1所述的數(shù)字媒體數(shù)據(jù)的編碼方法，其特征在于，所述部分預測信息包含幀間預測信息或幀內預測信息。
4. 根據(jù)權利要求3所述的數(shù)字媒體數(shù)據(jù)的編碼方法，其特征在于，至少一部分所述幀間預測信息包含參考幀信息。
5. —種已編碼的數(shù)字媒體數(shù)據(jù)的譯碼方法，其特征在于，包含接收代表所述已編碼的數(shù)字媒體數(shù)據(jù)的比特流，其中所述比特流包含第一比特流區(qū)段以及第二比特流區(qū)段，所述第一比特流區(qū)段與所述第二比特流區(qū)段分別承載所述數(shù)字媒體數(shù)據(jù)的至少一部分預測信息與所述數(shù)字媒體數(shù)據(jù)的至少一部分預測誤差信息；以及根據(jù)所述部分預測信息與所述部分預測誤差信息將所述比特流譯碼為數(shù)字媒體數(shù)據(jù)；其中，在所述比特流中，所述部分預測信息與所述部分預測誤差信息承載于非同一宏區(qū)塊中或宏區(qū)塊的非同一子單元中。
6. 根據(jù)權利要求5所述的已編碼的數(shù)字媒體數(shù)據(jù)的譯碼方法，其特征在于，所述部分預測誤差信息包含殘余信息。
7. 根據(jù)權利要求5所述的已編碼的數(shù)字媒體數(shù)據(jù)的譯碼方法，其特征在于，所述部分預測信息包含幀間預測信息或幀內預測信息。
8. 根據(jù)權利要求7所述的已編碼的數(shù)字媒體數(shù)據(jù)的譯碼方法，其特征在于，至少一部分幀間預測信息包含參考幀信息。
9. 根據(jù)權利要求7所述的已編碼的數(shù)字媒體數(shù)據(jù)的譯碼方法，其特征在于，進一步包含根據(jù)所述幀內預測信息的譯碼結果，確定是否暫時儲存宏區(qū)塊的相關信息，其中，在幀內預測模式中使用所述宏區(qū)塊的相關信息以譯碼另一宏區(qū)塊；以及根據(jù)確定的結果儲存所述宏區(qū)塊的相關信息。
10. 根據(jù)權利要求7所述的已編碼的數(shù)字媒體數(shù)據(jù)的譯碼方法，其特征在于，進一步包含根據(jù)所述幀間預測信息的譯碼結果，確定是否暫時儲存宏區(qū)塊的相關信息，其中，在幀間預測模式中使用所述宏區(qū)塊的相關信息以譯碼另一宏區(qū)塊；以及根據(jù)確定的結果儲存所述宏區(qū)塊的相關信息。
11. 根據(jù)權利要求7所述的已編碼的數(shù)字媒體數(shù)據(jù)的譯碼方法，其特征在于，進一步包含根據(jù)所述幀間預測信息的譯碼結果，確定是否于重建宏區(qū)塊上實施后處理；以及根據(jù)確定的結果于所述重建宏區(qū)塊上實施后處理。
12. 根據(jù)權利要求5所述的已編碼的數(shù)字媒體數(shù)據(jù)的譯碼方法，其特征在于，當譯碼兩個連續(xù)的宏區(qū)塊的預測信息時，無須譯碼所述兩個連續(xù)的宏區(qū)塊的預測誤差信息。
13. —種數(shù)字媒體數(shù)據(jù)的編碼方法，其特征在于，包含為所述數(shù)字媒體數(shù)據(jù)的多個宏區(qū)塊確定初始編碼模式，其中，根據(jù)所述初始編碼模式，所述多個宏區(qū)塊的至少一部分第一信息與至少一部分第二信息，分別由第一比特流區(qū)段以及第二比特流區(qū)段承載，其中所述第一比特流區(qū)段與所述第二比特流區(qū)段位于由所述數(shù)字媒體數(shù)據(jù)編碼得到的比特流中；分析自初始程序獲取得到的統(tǒng)計信息，以確定應當對至少一部分的語法元素使用何種編碼方法，其中所述初始程序是在所述初始編碼模式中實施；以及將所述數(shù)字媒體數(shù)據(jù)編碼為所述比特流。
14. 根據(jù)權利要求13所述的數(shù)字媒體數(shù)據(jù)的編碼方法，其特征在于，在為所述數(shù)字媒體數(shù)據(jù)的多個宏區(qū)塊確定初始編碼模式的步驟中，所述多個宏區(qū)塊代表圖像、切片或一組區(qū)塊。
15. 根據(jù)權利要求13所述的數(shù)字媒體數(shù)據(jù)的編碼方法，其特征在于，所述第一信息代表所述多個宏區(qū)塊的預測信息，所述第二信息代表所述多個宏區(qū)塊的預測誤差信息；以及所述語法元素包含所述預測信息以及/或所述預測誤差信息。
16. 根據(jù)權利要求13所述的數(shù)字媒體數(shù)據(jù)的編碼方法，其特征在于，所述語法元素包含參考幀信息、運動向量信息以及/或殘余非零信息。
17. 根據(jù)權利要求13所述的數(shù)字媒體數(shù)據(jù)的編碼方法，其特征在于，根據(jù)所述統(tǒng)計信息確定參考幀的編碼方法，以及所述參考幀的所述編碼方法由所述第一比特流區(qū)段與所述第二比特流區(qū)段前方的標頭承載。
18. 根據(jù)權利要求13所述的數(shù)字媒體數(shù)據(jù)的編碼方法，其特征在于，進一步包含根據(jù)所述統(tǒng)計信息確定參考幀的編碼方法，其中所述編碼方法從多個編碼方法中選擇得到，并且所述編碼方法取決于宏區(qū)塊中使用的參考幀系數(shù)的數(shù)量。
19. 一種數(shù)字媒體數(shù)據(jù)的比特流的處理方法，其特征在于，包含處理第一比特流區(qū)段與第二比特流區(qū)段，其中所述第一比特流區(qū)段與所述第二比特流區(qū)段分別承載所述數(shù)字媒體數(shù)據(jù)的至少一部分預測信息與所述數(shù)字媒體數(shù)據(jù)的至少一部分預測誤差信息；其中每一比特流區(qū)段承載多于一個最小已編碼單元的信息。
20. 根據(jù)權利要求19所述的數(shù)字媒體數(shù)據(jù)的比特流處理方法，其特征在于，所述處理包含譯碼與編碼。
21. 根據(jù)權利要求19所述的數(shù)字媒體數(shù)據(jù)的比特流處理方法，其特征在于，所述最小已編碼單元在視頻應用中為宏區(qū)塊。
22. 根據(jù)權利要求19所述的數(shù)字媒體數(shù)據(jù)的比特流處理方法，其特征在于，所述部分預測誤差信息包含殘余信息。
23. 根據(jù)權利要求19所述的數(shù)字媒體數(shù)據(jù)的比特流處理方法，其特征在于，所述部分預測信息包含幀間預測信息或幀內預測信息。
24. 根據(jù)權利要求23所述的數(shù)字媒體數(shù)據(jù)的比特流處理方法，其特征在于，至少一部分所述幀間預測信息包含參考幀信息:
全文摘要
一種數(shù)字媒體數(shù)據(jù)的編/譯碼方法及其比特流的處理方法。其中，數(shù)字媒體數(shù)據(jù)的編碼方法包含獲取數(shù)字媒體數(shù)據(jù)的至少一部分預測信息與至少一部分預測誤差信息；以及將數(shù)字媒體數(shù)據(jù)編碼為比特流，其中比特流包含第一比特流區(qū)段以及第二比特流區(qū)段，第一比特流區(qū)段與第二比特流區(qū)段分別承載部分預測信息與部分預測誤差信息；其中，在比特流中，部分預測信息與部分預測誤差信息承載于非同一宏區(qū)塊或宏區(qū)塊的非同一子單元中。本發(fā)明可減少冗余信息，降低內存訪問負擔與硬件架構的計算負擔。
文檔編號H04N7/26GK101729889SQ20091014671
公開日2010年6月9日申請日期2009年6月16日優(yōu)先權日2008年10月12日
發(fā)明者李坤儐申請人:聯(lián)發(fā)科技股份有限公司

完整全部詳細技術資料下載