描述, 通過使用基于按照樹結構的編碼單元的預測單元對視頻解碼的設備200被稱為"視頻解碼 設備200"。
[0086] 用于視頻解碼設備200的各種操作的各種術語(諸如編碼單元、深度、預測單元、變 換單元以及關于各種編碼模式的信息)的定義與參照圖1和視頻編碼設備100所描述的術語 的定義相同。
[0087]接收器210接收并解析已編碼的視頻的比特流。圖像數(shù)據(jù)和編碼信息提取器220從 解析的比特流中提取每個編碼單元的編碼的圖像數(shù)據(jù),并將提取的圖像數(shù)據(jù)輸出到圖像數(shù) 據(jù)解碼器230,其中,編碼單元具有根據(jù)每個最大編碼單元的樹結構。圖像數(shù)據(jù)和編碼信息 提取器220可從接收的比特流中關于當前畫面的頭、SPS和PPS中的至少一個提取關于當前 畫面的編碼單元的尺寸和可變深度的編碼單元結構信息以及關于編碼深度和編碼模式的 fg息。
[0088]圖像數(shù)據(jù)和編碼信息提取器220可從編碼信息中提取關于可變深度的信息以及關 于序列、畫面、像條或G0P的每個數(shù)據(jù)單元的具有樹結構的編碼單元中的編碼單元的可允許 的最大尺寸的信息和關于可允許的最小尺寸的信息中的一個。圖像數(shù)據(jù)解碼器230可通過 使用關于可變深度的信息、關于編碼單元的最大尺寸的信息以及關于編碼單元的最小尺寸 的信息中的至少兩條來確定序列、畫面、像條或GOP的每個數(shù)據(jù)單元的具有樹結構的編碼單 元中的編碼單元的可允許的最大尺寸和可允許的最小尺寸。
[0089] 可從編碼信息中提取針對每個畫面、像條或G0P確定的關于可變深度的信息、關于 編碼單元的最大尺寸的信息以及關于編碼單元的最小尺寸的信息中的至少兩條,并且可基 于讀取的信息來確定當前數(shù)據(jù)單元的可允許的最大尺寸和可允許的最小尺寸。此外,圖像 數(shù)據(jù)和編碼信息提取器220從解析的比特流提取關于編碼單元的編碼深度和編碼模式的信 息,其中,編碼單元具有根據(jù)每個最大編碼單元的樹結構。提取的關于編碼深度和編碼模式 的信息被輸出到圖像數(shù)據(jù)解碼器230。換句話說,比特流中的圖像數(shù)據(jù)被分割為最大編碼單 元,從而圖像數(shù)據(jù)解碼器230對每個最大編碼單元的圖像數(shù)據(jù)解碼。
[0090] 可針對關于與編碼深度對應的至少一個編碼單元的信息設置關于根據(jù)最大編碼 單元的編碼深度和編碼模式的信息,關于編碼模式的信息可包括關于與編碼深度對應的相 應的編碼單元的的分塊類型的信息、關于預測模式以及變換單元的尺寸的信息。另外,根據(jù) 深度的分割信息可被提取作為關于編碼深度的信息。
[0091 ]此外,圖像數(shù)據(jù)解碼器230可從自解析的比特流提取的編碼信息讀取關于變換索 引的信息。圖像數(shù)據(jù)解碼器230可基于由圖像數(shù)據(jù)和編碼信息提取器220提取的圖像數(shù)據(jù)和 變換索引信息來構造當前編碼單元的變換單元,可基于變換單元執(zhí)行當前編碼單元的逆變 換,從而可對編碼的數(shù)據(jù)解碼。作為對編碼單元解碼的結構,可恢復當前畫面。
[0092] 關于由圖像數(shù)據(jù)和編碼信息提取器220提取的根據(jù)每個最大編碼單元的編碼模式 和編碼深度的信息是這樣的信息,即:關于被確定為當編碼器(諸如視頻編碼設備1〇〇)根據(jù) 每個最大編碼單元針對根據(jù)深度的每個更深的編碼單元重復執(zhí)行編碼時產(chǎn)生最小編碼誤 差的編碼深度和編碼模式的信息。因此,視頻解碼設備200可通過根據(jù)產(chǎn)生最小編碼誤差的 編碼深度和編碼模式對圖像數(shù)據(jù)解碼來恢復圖像。
[0093] 因為關于編碼深度和編碼模式的編碼信息可被分配給相應的編碼單元、預測單元 和最小單元中的預定數(shù)據(jù)單元,所以圖像數(shù)據(jù)和編碼信息提取器220可根據(jù)預定數(shù)據(jù)單元 提取關于編碼深度和編碼模式的信息。被分配有相同的關于編碼深度和編碼模式的信息的 預定數(shù)據(jù)單元可被推斷為是包括在同一最大編碼單元中的數(shù)據(jù)單元。
[0094]圖像數(shù)據(jù)解碼器230通過基于關于根據(jù)最大編碼單元的編碼深度和編碼模式的信 息,對每個最大編碼單元中的圖像數(shù)據(jù)解碼來恢復當前畫面。換句話說,圖像數(shù)據(jù)解碼器 230可基于針對包括在每個最大編碼單元中的具有樹結構的編碼單元中的每個編碼單元提 取的關于分塊類型、預測模式和變換單元的信息,來對編碼的圖像數(shù)據(jù)解碼。解碼處理可包 括預測和逆變換,所述預測包括幀內預測和運動補償??筛鶕?jù)逆正交變換或逆整數(shù)變換的 方法來執(zhí)行逆變換。
[0095] 圖像數(shù)據(jù)解碼器230可基于關于根據(jù)編碼深度的編碼單元的預測單元的預測模式 和分塊類型的信息,根據(jù)每個編碼單元的預測模式和分塊執(zhí)行幀內預測或運動補償。
[0096] 此外,圖像數(shù)據(jù)解碼器230可通過讀取根據(jù)樹結構的變換單元以及關于根據(jù)編碼 深度的編碼單元的變換單元的尺寸的信息,根據(jù)編碼單元中的每個變換單元來執(zhí)行逆變 換,以根據(jù)最大編碼單元執(zhí)行逆變換。
[0097] 圖像數(shù)據(jù)解碼器230可通過使用根據(jù)深度的分割信息,確定當前最大編碼單元的 至少一個編碼深度。如果所述分割信息指示在當前深度中不再分割圖像數(shù)據(jù),則當前深度 是編碼深度。因此,圖像數(shù)據(jù)解碼器230可通過使用關于預測單元的分塊類型、預測模式、針 對與編碼深度相應的每個編碼單元的變換單元的尺寸的信息,對當前最大編碼單元中的與 每個編碼深度相應的至少一個編碼單元的已編碼的數(shù)據(jù)進行解碼,并輸出當前最大編碼單 元的圖像數(shù)據(jù)。
[0098] 換句話說,可通過觀察為編碼單元、預測單元和最小單元中的預定數(shù)據(jù)單元分配 的編碼信息,聚集包含編碼信息(所述編碼信息包括相同的分割信息)的編碼單元,并且聚 集的數(shù)據(jù)單元可被考慮為一個數(shù)據(jù)單元,從而通過圖像數(shù)據(jù)解碼器230以相同的編碼模式 被解碼。
[0099] 視頻解碼設備200可在對每個最大編碼單元遞歸地執(zhí)行編碼時,獲得關于產(chǎn)生最 小編碼誤差的至少一個編碼單元的信息,并且視頻解碼設備200可使用所述信息來對當前 畫面解碼。換句話說,可以對在每個最大編碼單元中被確定為最佳編碼單元的具有樹結構 的編碼單元解碼。此外,考慮圖像數(shù)據(jù)的分辨率和數(shù)據(jù)量來確定編碼單元的最大尺寸。 [0100]因此,即使圖像數(shù)據(jù)具有高分辨率和大數(shù)據(jù)量,也可通過使用編碼單元的尺寸和 編碼模式對所述圖像數(shù)據(jù)進行有效地解碼和恢復,其中,通過使用從編碼器接收的關于最 佳編碼模式的信息,根據(jù)圖像數(shù)據(jù)的特性來自適應地確定編碼單元的尺寸和編碼模式。
[0101] 現(xiàn)在將參照圖3至圖13描述根據(jù)本發(fā)明實施例的確定具有樹結構的編碼單元、預 測單元和變換單元的方法。
[0102] 圖3是用于描述根據(jù)本發(fā)明實施例的編碼單元的概念的示圖。
[0103] 可以以寬度X高度來表示編碼單元的尺寸,并且編碼單元的尺寸可以是64 X 64、 32X32、16X16 和 8X8。
[0104]在視頻數(shù)據(jù)310中,分辨率是1920 X 1080,編碼單元的最大尺寸是64,最大深度是 2。在視頻數(shù)據(jù)320中,分辨率是1920 X 1080,編碼單元的最大尺寸是64,最大深度是3。在視 頻數(shù)據(jù)330中,分辨率是352 X 288,編碼單元的最大尺寸是16,最大深度是1。圖3中示出的最 大深度表示從最大編碼單元到最小編碼單元的分割的總數(shù)。
[0105] 如果分辨率高或者數(shù)據(jù)量大,則編碼單元的最大尺寸可能大,以便不僅提高編碼 效率,還精確地反映圖像的特性。因此,具有比視頻數(shù)據(jù)330高的分辨率的視頻數(shù)據(jù)310和 320的編碼單元的最大尺寸可以為64。
[0106] 因為視頻數(shù)據(jù)310的最大深度是2,所以視頻數(shù)據(jù)310的編碼單元315可包括具有64 的長軸(long axis)大小的最大編碼單元,以及由于通過分割最大編碼單元兩次將深度加 深至兩級而具有32和16的長軸大小的編碼單元。同時,因為視頻數(shù)據(jù)330的最大深度是1,所 以視頻數(shù)據(jù)330的編碼單元335可包括具有16的長軸大小的最大編碼單元,以及由于通過分 割最大編碼單元一次將深度加深至一級而具有8的長軸大小的編碼單元。
[0107] 因為視頻數(shù)據(jù)320的最大深度是3,所以視頻數(shù)據(jù)320的編碼單元325可包括具有64 的長軸大小的最大編碼單元,以及由于通過分割最大編碼單元三次將深度加深至3級而具 有32、16和8的長軸大小的編碼單元。隨著深度加深,詳細信息可被精確地表示。
[0108] 具有64 X 64、64 X 32、32 X 64尺寸的分塊類型可被設置到具有64 X 64尺寸的編碼 單元。因為具有64X64尺寸的編碼單元不是關于多條視頻數(shù)據(jù)310、320和330的最小解碼單 元,所以不會設置具有32X32尺寸的分塊類型。
[0109] 具有32 X 32、32 X 16、16 X 32尺寸的分塊類型可被設置到具有32 X 32尺寸的編碼 單元。因為具有32X32尺寸的編碼單元不是關于多條視頻數(shù)據(jù)310、320和330的最小解碼單 元,所以不會設置具有16X16尺寸的分塊類型。
[0110] 具有16 X 16、16 X 8、8 X 16尺寸的分塊類型可被設置到具有16 X 16尺寸的編碼單 元。因為具有16X16尺寸的編碼單元是關于視頻數(shù)據(jù)310的最小解碼單元,所以可設置具有 8 X 8尺寸的分塊類型。然而,具有16 X 16尺寸的編碼單元不是關于多條視頻數(shù)據(jù)320和330 的最小解碼單元,所以不會設置具有8X8尺寸的分塊類型。 在這點上,因為具有8X8尺寸的編碼單元是關于多條視頻數(shù)據(jù)310、320和330的最 小解碼單元,所以不僅可設置具有8\8、8\4、4\8尺寸的分塊類型,而且可設置具有4乂4 尺寸的分塊類型。
[0112] 圖4是根據(jù)本發(fā)明實施例的基于編碼單元的圖像編碼器400的框圖。
[0113] 圖像編碼器400執(zhí)行視頻編碼設備100的編碼單元確定器120的操作,以對圖像數(shù) 據(jù)編碼。換句話說,在當前幀405中,幀內預測器410在幀內模式下對編碼單元執(zhí)行幀內預 測,運動估計器420和運動補償器425通過使用當前幀405和參考幀495,在當前幀405中,在 幀間模式下對編碼單元執(zhí)行幀間估計和運動補償。
[0114] 從幀內預測器410、運動估計器420和運動補償器425輸出的數(shù)據(jù)通過變換器430和 量化器440被輸出為量化的變換系數(shù)。量化的變換系數(shù)通過反量化器460和逆變換器470被 恢復為在空間域中的數(shù)據(jù),并且空間域中的恢復的數(shù)據(jù)在通過去塊單元480和環(huán)路濾波單 元490進行后處理之后,被輸出為參考幀495。量化的變換系數(shù)可通過熵編碼器450被輸出為 比特流455。
[0115] 為了在視頻編碼設備100中應用圖像編碼器400,圖像編碼器400的所有部件(即, 幀內預測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器450、反 量化器460、逆變換器470、去塊單元480和環(huán)路濾波單元490)在考慮每個最大編碼單元的最 大深度的同時,基于具有樹結構的編碼單元中的每個編碼單元執(zhí)行操作。
[0116] 具體地講,幀內預測器410、運動估計器420以及運動補償器425在考慮當前最大編 碼單元的最大尺寸和最大深度的同時,確定具有樹結構的編碼單元中的每個編碼單元的分 塊和預測模式,變換器430確定在具有樹結構的編碼單元中的每個編碼單元中的變換單元 的尺寸。
[0117] 圖5是根據(jù)本發(fā)明實施例的基于編碼單元的圖像解碼器500的框圖。
[0118] 解析器510從比特流505對將被解碼的已編碼的視頻數(shù)據(jù)以及關于進行解碼所需 的編碼的信息進行解析。編碼的視頻數(shù)據(jù)通過熵解碼器520和反量化器530被輸出為反量化 的數(shù)據(jù),并且反量化的數(shù)據(jù)通過逆變換器540被恢復為在空間域中的圖像數(shù)據(jù)。
[0119] 幀內預測器550針對空間域中的圖像數(shù)據(jù),在幀內模式下對編碼單元執(zhí)行幀內預 測,運動補償器560通過使用參考幀585,在幀間模式下對編碼單元執(zhí)行運動補償。
[0120] 經(jīng)過幀內預測器550和運動補償器560的空間域中的圖像數(shù)據(jù)可在通過去塊單元 570和環(huán)路濾波單元580進行后處理之后,被輸出為恢復的幀595。另外,通過去塊單元570和 環(huán)路濾波單元580進行后處理的圖像數(shù)據(jù)可被輸出為參考幀585。
[0121] 為了在圖像解碼設備200的圖像數(shù)據(jù)解碼器230中對圖像數(shù)據(jù)解碼,圖像解碼器 500可執(zhí)行在解析器510之后執(zhí)行的操作。
[0122] 為了在視頻解碼設備200中應用圖像解碼器500,圖像解碼器500的所有部件(即, 解析器510、熵解碼器520、反量化器530、逆變換器540、幀內預測器550、運動補償器560、去 塊單元570以及