空間的第二視頻塊進(jìn)行譯碼。
[0050] 明確地說,源裝置12經(jīng)由計(jì)算機(jī)可讀媒體16將視頻數(shù)據(jù)提供到目的地裝置14。 源裝置12及目的地裝置14可包括多種多樣的裝置中的任一者,包含桌上型計(jì)算機(jī)、筆記型 (即,膝上型)計(jì)算機(jī)、平板計(jì)算機(jī)、機(jī)頂盒、電話手持機(jī)(例如所謂的"智能"電話)、所謂 的"智能"平板計(jì)算機(jī)、電視機(jī)、相機(jī)、顯示裝置、數(shù)字媒體播放器、視頻游戲控制臺、視頻流 式傳輸裝置或類似者。在一些情況下,源裝置12和目的地裝置14可經(jīng)裝備以用于無線通 {目。
[0051] 目的地裝置14可經(jīng)由計(jì)算機(jī)可讀媒體16接收待解碼的經(jīng)編碼的視頻數(shù)據(jù)。計(jì)算 機(jī)可讀媒體16可包括能夠?qū)⒔?jīng)編碼視頻數(shù)據(jù)從源裝置12移動到目的地裝置14的任何類 型的媒體或裝置。在一個(gè)實(shí)例中,計(jì)算機(jī)可讀媒體16可包括使得源裝置12能夠?qū)崟r(shí)將經(jīng) 編碼的視頻數(shù)據(jù)直接發(fā)射到目的地裝置14的通信媒體。計(jì)算機(jī)可讀媒體16可包含瞬時(shí)媒 體,例如無線廣播或有線網(wǎng)絡(luò)發(fā)射,或存儲媒體(即,非暫時(shí)性存儲媒體),例如硬盤、快閃 驅(qū)動器、壓縮光盤、數(shù)字視頻光盤、藍(lán)光光盤或其它計(jì)算機(jī)可讀媒體。在一些實(shí)例中,網(wǎng)絡(luò)服 務(wù)器(未圖示)可以從源裝置12接收經(jīng)編碼視頻數(shù)據(jù),并且例如經(jīng)由網(wǎng)絡(luò)發(fā)射將經(jīng)編碼視 頻數(shù)據(jù)提供到目的地裝置14。類似地,媒體生產(chǎn)設(shè)施(例如光盤沖壓設(shè)施)的計(jì)算裝置可 以從源裝置12接收經(jīng)編碼的視頻數(shù)據(jù)并且生產(chǎn)容納經(jīng)編碼的視頻數(shù)據(jù)的光盤。因此,在各 種實(shí)例中,計(jì)算機(jī)可讀媒體16可以理解為各種形式的一或多個(gè)計(jì)算機(jī)可讀媒體。
[0052] 經(jīng)編碼視頻數(shù)據(jù)可以根據(jù)通信標(biāo)準(zhǔn)(例如,無線通信協(xié)議)來調(diào)制,并且被發(fā)射到 目的地裝置14。通信媒體可包括任何無線或有線通信媒體,例如射頻(RF)頻譜或一或多 個(gè)物理發(fā)射線路。通信媒體可形成基于包的網(wǎng)絡(luò)(例如局域網(wǎng)、廣域網(wǎng)或全球網(wǎng)絡(luò),例如因 特網(wǎng))的一部分。通信媒體可包含路由器、交換器、基站或任何其它可以用于促進(jìn)從源裝置 12到目的地裝置14的通信的設(shè)備。
[0053] 在一些實(shí)例中,輸出接口 22可將經(jīng)編碼數(shù)據(jù)輸出到存儲裝置。類似地,輸入接口 28可從存儲裝置存取經(jīng)編碼數(shù)據(jù)。存儲裝置可包含多種分布式或本地存取的數(shù)據(jù)存儲媒體 中的任一者,例如硬盤驅(qū)動器、藍(lán)光光盤、DVD、CD-ROM、快閃存儲器、易失性或非易失性存儲 器或任何其它用于存儲經(jīng)編碼的視頻數(shù)據(jù)的合適的數(shù)字存儲媒體。在另一實(shí)例中,存儲裝 置可以對應(yīng)于文件服務(wù)器或可存儲由源裝置12產(chǎn)生的經(jīng)編碼視頻的另一中間存儲裝置。 目的地裝置14可(例如,經(jīng)由流式傳輸或下載)從存儲裝置存取經(jīng)存儲的視頻數(shù)據(jù)。文件 服務(wù)器可為能夠存儲經(jīng)編碼的視頻數(shù)據(jù)且將經(jīng)編碼的視頻數(shù)據(jù)發(fā)射到目的地裝置14的任 何類型的服務(wù)器。實(shí)例文件服務(wù)器包含網(wǎng)絡(luò)服務(wù)器(例如,用于網(wǎng)站)、FTP服務(wù)器、網(wǎng)絡(luò)附 接存儲(NAS)裝置、超文本傳送協(xié)議(HTTP)流式傳輸服務(wù)器或局部磁盤驅(qū)動器。目的地裝 置14可通過標(biāo)準(zhǔn)數(shù)據(jù)連接(包含因特網(wǎng)連接)來存取經(jīng)編碼視頻數(shù)據(jù)。此可包含適合于 存取存儲于文件服務(wù)器上的經(jīng)編碼的視頻數(shù)據(jù)的無線信道(例如,Wi-Fi連接)、有線連接 (例如,DSL、電纜調(diào)制解調(diào)器等)或兩者的組合。經(jīng)編碼視頻數(shù)據(jù)從存儲裝置的傳輸可能 是流式傳輸發(fā)射、下載發(fā)射或其組合。
[0054] 本發(fā)明的技術(shù)不必限于無線應(yīng)用或設(shè)置。所述技術(shù)可以應(yīng)用于視頻譯碼并且支持 多種多媒體應(yīng)用中的任一者,例如空中協(xié)議電視廣播、有線電視發(fā)射、衛(wèi)星電視發(fā)射、因特 網(wǎng)流式傳輸視頻發(fā)射(例如動態(tài)自適應(yīng)HTTP流式傳輸(DASH))、經(jīng)編碼到數(shù)據(jù)存儲媒體上 的數(shù)字視頻,存儲在數(shù)據(jù)存儲媒體上的數(shù)字視頻的解碼,或其它應(yīng)用。在一些實(shí)例中,系統(tǒng) 10可經(jīng)配置以支持單向或雙向視頻發(fā)射,以支持例如視頻流式傳輸、視頻重放、視頻廣播和 /或視頻電話等應(yīng)用。
[0055] 圖1的系統(tǒng)10僅是一個(gè)實(shí)例。用于使用多個(gè)顏色變換中的顏色變換將具有第一 顏色空間的數(shù)據(jù)塊變換到具有第二顏色空間的第二視頻數(shù)據(jù)塊的技術(shù)可由任何數(shù)字視頻 編碼和/或解碼裝置執(zhí)行。盡管本發(fā)明的技術(shù)總體上由視頻編碼裝置執(zhí)行,但是所述技術(shù) 還可通過視頻編碼器/解碼器(通常被稱作"編解碼器")執(zhí)行。此外,本發(fā)明的技術(shù)還可 通過視頻預(yù)處理器執(zhí)行。源裝置12及目的地裝置14僅為這些譯碼裝置的實(shí)例,其中源裝 置12產(chǎn)生用于發(fā)射到目的地裝置14的經(jīng)譯碼視頻數(shù)據(jù)。在一些實(shí)例中,裝置12、14可以 實(shí)質(zhì)上對稱的方式操作,使得裝置12、14中的每一者包含視頻編碼和解碼組件。因此,系統(tǒng) 10可支持視頻裝置12、14之間的單向或雙向視頻發(fā)射,例如用于視頻流式傳輸、視頻重放、 視頻廣播或視頻電話。
[0056] 源裝置12的視頻源18可包含視頻俘獲裝置,例如攝像機(jī)、含有先前所俘獲視頻的 視頻存檔及/或用于從視頻內(nèi)容提供者接收視頻的視頻饋送接口。在一些實(shí)例中,視頻源 18產(chǎn)生基于計(jì)算機(jī)圖形的數(shù)據(jù)作為源視頻,或?qū)崨r視頻、所存檔視頻和計(jì)算機(jī)產(chǎn)生的視頻 的組合。在一些情況下,視頻源18可為攝像機(jī)。在一些實(shí)例中,視頻源18可為攝像機(jī)。在 一些實(shí)例中,源裝置12和目的地裝置14可為所謂的相機(jī)電話或視頻電話。在各種實(shí)例中, 視頻源18可輸出具有RGB顏色空間的輸入信號。然而,如上文所提及,本發(fā)明中所描述的 技術(shù)可大體上適用于視頻譯碼,且可應(yīng)用于無線及/或有線應(yīng)用。在每一情況下,可由視頻 編碼器20來編碼經(jīng)俘獲的、經(jīng)預(yù)先俘獲的或計(jì)算機(jī)產(chǎn)生的視頻。輸出接口 22可將經(jīng)編碼 視頻信息輸出到計(jì)算機(jī)可讀媒體16上。
[0057] 計(jì)算機(jī)可讀媒體16可包含瞬時(shí)媒體,例如無線廣播或有線網(wǎng)絡(luò)發(fā)射,或存儲媒體 (即,非暫時(shí)性存儲媒體),例如硬盤、快閃驅(qū)動器、壓縮光盤、數(shù)字視頻光盤、藍(lán)光光盤或其 它計(jì)算機(jī)可讀媒體。在一些實(shí)例中,網(wǎng)絡(luò)服務(wù)器(未圖示)可以從源裝置12接收經(jīng)編碼視 頻數(shù)據(jù),并且例如經(jīng)由網(wǎng)絡(luò)發(fā)射將經(jīng)編碼視頻數(shù)據(jù)提供到目的地裝置14。類似地,媒體生產(chǎn) 設(shè)施(例如光盤沖壓設(shè)施)的計(jì)算裝置可以從源裝置12接收經(jīng)編碼的視頻數(shù)據(jù)并且生產(chǎn) 容納經(jīng)編碼的視頻數(shù)據(jù)的光盤。因此,在各種實(shí)例中,計(jì)算機(jī)可讀媒體16可以理解為包含 各種形式的一或多個(gè)計(jì)算機(jī)可讀媒體。
[0058]在圖1的實(shí)例中,目的地裝置14的輸入接口 28從計(jì)算機(jī)可讀媒體16接收信息。 計(jì)算機(jī)可讀媒體16的信息可包含由視頻編碼器20界定的語法信息,其包含描述塊和其它 經(jīng)譯碼單元(例如,G0P)的特性和/或處理的語法元素。顯示裝置32向用戶顯示經(jīng)解碼視 頻數(shù)據(jù)。顯示裝置32可包括多種顯示裝置中的任一者,例如陰極射線管(CRT)顯示器、液 晶顯示器(IXD)、等離子顯示器、有機(jī)發(fā)光二極管(0LED)顯示器,或另一類型的顯示裝置。
[0059] 視頻編碼器20及視頻解碼器30可根據(jù)由視頻譯碼聯(lián)合合作小組(JCT-VC)開 發(fā)的視頻譯碼標(biāo)準(zhǔn)操作,所述視頻譯碼標(biāo)準(zhǔn)例如最近完成的高效率視頻譯碼(HEVC)以及 HEVC范圍擴(kuò)展。或者,視頻編碼器20和視頻解碼器30可以根據(jù)其它專有或業(yè)界標(biāo)準(zhǔn)來操 作,所述標(biāo)準(zhǔn)例如是ITU-TH. 264標(biāo)準(zhǔn),也被稱為MPEG-4第10部分高級視頻譯碼(AVC),或 此類標(biāo)準(zhǔn)的擴(kuò)展。然而,本發(fā)明的技術(shù)不限于任何特定譯碼標(biāo)準(zhǔn)。視頻譯碼標(biāo)準(zhǔn)的其它實(shí) 例包含MPEG-2 和ITU-TH. 263。
[0060] 盡管圖1中未展示,但在一些方面中,視頻編碼器20及視頻解碼器30可各自與音 頻編碼器及解碼器集成,并且可包含適當(dāng)多路復(fù)用器-多路分用器(MUX-DEMUX)單元或其 它硬件及軟件,以處置對共同數(shù)據(jù)流或單獨(dú)數(shù)據(jù)流中的音頻及視頻兩者的編碼。如果適用 的話,MUX-DEMUX單元可符合ITUH. 223多路復(fù)用器協(xié)議,或例如用戶數(shù)據(jù)報(bào)協(xié)議(UDP)等 其它協(xié)議。
[0061] 視頻編碼器20和視頻解碼器30各自可實(shí)施為例如一或多個(gè)微處理器、數(shù)字信號 處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、離散邏輯、軟件、硬件、固 件或其任何組合等多種合適的編碼器電路中的任一者。當(dāng)部分以軟件實(shí)施所述技術(shù)時(shí),裝 置可將用于所述軟件的指令存儲于合適的非暫時(shí)性計(jì)算機(jī)可讀媒體中并使用一或多個(gè)處 理器用硬件執(zhí)行所述指令以執(zhí)行本發(fā)明的技術(shù)。視頻編碼器20和視頻解碼器30中的每一 者可包含在一或多個(gè)編碼器或解碼器中,所述編碼器或解碼器中的任一者可以集成為相應(yīng) 裝置中的組合編碼器/解碼器(編解碼器)的部分。
[0062] 視頻序列通常包含一系列視頻幀或圖片。圖片群組(G0P) -般包括一系列的視頻 圖片中的一或多者。G0P可包含描述G0P中所包含的圖片數(shù)目的G0P的標(biāo)頭中、圖片中的一 或多者的標(biāo)頭中或別處的語法數(shù)據(jù)。圖片的每一切片可包含描述用于相應(yīng)的切片的編碼模 式的切片語法數(shù)據(jù)。視頻編碼器20通常對個(gè)別視頻切片內(nèi)的視頻塊進(jìn)行操作以便編碼視 頻數(shù)據(jù)。
[0063] HEVC描述視頻幀或圖片可劃分成樹塊(S卩,最大譯碼單元(LCU)或"譯碼樹單 元"(CTU))的序列。樹塊可包含明度和/或色度樣本。位流內(nèi)的語法數(shù)據(jù)可界定LCU的大 小,LCU是在像素?cái)?shù)目方面的最大譯碼單元。在一些實(shí)例中,CTU中的每一者包括明度樣本 的譯碼樹塊、色度樣本的兩個(gè)對應(yīng)的譯碼樹塊,以及用以對譯碼樹塊的樣本進(jìn)行譯碼的語 法結(jié)構(gòu)。在單色圖片或具有三個(gè)單獨(dú)顏色平面的圖片中,CTU可包括單個(gè)譯碼樹塊及用于 對所述譯碼樹塊的樣本進(jìn)行譯碼的語法結(jié)構(gòu)。譯碼樹塊可為樣本的NxN塊。視頻幀或圖片 可以被分割成一或多個(gè)切片。切片包含呈譯碼次序(例如,光柵掃描次序)的若干連續(xù)樹 塊。
[0064] 每一樹塊可根據(jù)四叉樹分裂成一或多個(gè)譯碼單元(CU)??偟膩碚f,四叉樹數(shù)據(jù)結(jié) 構(gòu)包含每個(gè)CU-個(gè)節(jié)點(diǎn),其中根節(jié)點(diǎn)對應(yīng)于所述樹塊。如果CU分裂成四個(gè)子CU,那么對應(yīng) 于CU的節(jié)點(diǎn)包含四個(gè)葉節(jié)點(diǎn),其中葉節(jié)點(diǎn)中的每一者對應(yīng)于所述子CU中的一者。
[0065] 四叉樹數(shù)據(jù)結(jié)構(gòu)的每一節(jié)點(diǎn)可提供對應(yīng)CU的語法數(shù)據(jù)。舉例來說,四叉樹中的節(jié) 點(diǎn)可包含分裂旗標(biāo),從而指示對應(yīng)于所述節(jié)點(diǎn)的所述CU是否分裂成子CU。用于CU的語法 元素可以遞歸地來定義,且可以取決于CU是否分裂成子CU。如果CU未進(jìn)一步分裂,那么所 述⑶稱為葉⑶。
[0066] 視頻編碼器20可對CTU的譯碼樹塊遞歸地執(zhí)行四叉樹分割以將譯碼樹塊劃分為 譯碼塊,因此名稱為"譯碼樹單元"。譯碼塊可以是樣本的NxN塊。在一些實(shí)例中,CU包括 具有明度樣本陣列、Cb樣本陣列和Cr樣本陣列的圖片的明度樣本的譯碼塊以及色度樣本 的兩個(gè)對應(yīng)的譯碼塊,以及用以對譯碼塊的樣本進(jìn)行譯碼的語法結(jié)構(gòu)。在單色圖片或具有 三個(gè)單獨(dú)顏色平面的圖片中,CU可包括單個(gè)譯碼塊及用于對所述譯碼塊的樣本進(jìn)行譯碼的 語法結(jié)構(gòu)。
[0067] ⑶具有類似于H. 264標(biāo)準(zhǔn)的宏塊的用途,但是⑶并不具有大小區(qū)別。舉例來說, 樹塊可分裂成四個(gè)子節(jié)點(diǎn)(也被稱作子CU),且每一子節(jié)點(diǎn)又可為父節(jié)點(diǎn)且可分裂成另外 四個(gè)子節(jié)點(diǎn)。最后的未經(jīng)分裂子節(jié)點(diǎn)(被稱作四叉樹的葉節(jié)點(diǎn))包括譯碼節(jié)點(diǎn),也稱為葉 CU。與經(jīng)譯碼位流相關(guān)聯(lián)的語法數(shù)據(jù)可界定樹塊可分裂的最大次數(shù),被稱作最大CU深度, 且還可界定譯碼節(jié)點(diǎn)的最小大小。因此,位流還可定義最小譯碼單元(SCU)。本發(fā)明使用 術(shù)語"塊"指代HEVC的上下文中可進(jìn)一步包含一或多個(gè)預(yù)測單元(PU)或變換單元(TU)的 CU或其它標(biāo)準(zhǔn)的上下文中的相似數(shù)據(jù)結(jié)構(gòu)(例如,H. 264/AVC中的宏塊及其子塊)中的任 一者。
[0068] ⑶包含一或多個(gè)預(yù)測單元(PU)和一或多個(gè)變換單元(TU)。⑶的大小對應(yīng)可為正 方形或矩形形狀。CU的大小范圍可從8x8像素到具有最大64x64像素或更大的樹塊的大 小。舉例來說,與CU相關(guān)聯(lián)的語法數(shù)據(jù)可描述CU到一或多個(gè)PU的分割。分割模式可在CU 被跳過或經(jīng)直接模式編碼、幀內(nèi)預(yù)測模式編碼或幀間預(yù)測模式編碼之間有區(qū)別。CU可經(jīng)分 割以使得CU的PU可為非正方形形狀。舉例來說,與CU相關(guān)聯(lián)的語法數(shù)據(jù)還可描述CU根 據(jù)四叉樹分割成一或多個(gè)TU。
[0069] 視頻編碼器20可以將CU的譯碼塊分割成一或多個(gè)預(yù)測塊。預(yù)測塊可為應(yīng)用相同 預(yù)測的樣本的矩形(即,正方形還是非正方形)塊。CU的PU可包括圖片的明度樣本的預(yù)測 塊、圖片的色度樣本的兩個(gè)對應(yīng)的預(yù)測塊,以及用以對預(yù)測塊樣本進(jìn)行預(yù)測的語法結(jié)構(gòu)。在 單色圖像或具有三個(gè)單獨(dú)彩色平面的圖片中,PU可包括單個(gè)預(yù)測塊,及用以對預(yù)測塊樣本 進(jìn)行預(yù)測的語法結(jié)構(gòu)。
[0070] 變換塊可以是對其應(yīng)用相同變換的樣本的矩形塊。CU的變換單元(TU)可包括明 度樣本的變換塊、色度樣本的兩個(gè)對應(yīng)變換塊及用以對變換塊樣本進(jìn)行變換的語法結(jié)構(gòu)。 因此,CU的每一TU可具有明度變換塊、Cb變換塊以及Cr變換塊。TU的明度變換塊可為CU 的明度殘余塊的子塊。Cb變換塊可以是CU的Cb殘余塊的子塊。Cr變換塊可以是CU的Cr 殘余塊的子塊。在單色圖像或具有三個(gè)單獨(dú)彩色平面的圖片中,TU可包括單個(gè)變換塊,及 用以對變換塊樣本進(jìn)行變換的語法結(jié)構(gòu)。TU可以是正方形或非正方形(例如,矩形)形狀。 換句話說,對應(yīng)于TU的變換塊可為正方形或非正方形形狀。
[0071]HEVC標(biāo)準(zhǔn)允許根據(jù)TU進(jìn)行的變換,TU可針對不同⑶而有所不同。TU的大小通 常是基于針對經(jīng)分割LCU定義的給定CU內(nèi)的PU的大小而確定,但情況可能并非始終如此。 TU通常與PU大小相同或小于PU。在一些實(shí)例中,對應(yīng)于CU的殘余樣本可使用被稱為"殘 余四叉樹"(RQT)的四叉樹結(jié)構(gòu)細(xì)分成較小單元。RQT的葉節(jié)點(diǎn)可被稱作變換單元(TU)???變換與TU相關(guān)聯(lián)的像素差值以產(chǎn)生可經(jīng)量化的變換系數(shù)。
[0072] 總的來說,表示對應(yīng)于對應(yīng)⑶的全部或一部分的空間區(qū)域,并且可包含用于檢 索PU的參考樣本的數(shù)據(jù)。此外,PU包含與預(yù)測有關(guān)的數(shù)據(jù)。在一些實(shí)例中,可使用幀內(nèi)模 式或幀間模式對PU進(jìn)行編碼。作為另一實(shí)例,當(dāng)經(jīng)幀間模式編碼時(shí),PU可包含界定PU 的一或多個(gè)運(yùn)動向量的數(shù)據(jù)。界定PU的運(yùn)動向量的數(shù)據(jù)可描述(例如)運(yùn)動向量的水平 分量、運(yùn)動向量的垂直分量、運(yùn)動向量的分辨率(例如,四分之一像素精度或八分之一像素 精度)、運(yùn)動向量所指向的參考圖片,及/或運(yùn)動向量的參考圖片列表(例如,列表0、列表 1或列表C)。
[0073] 如上文所指出,具有一或多個(gè)的葉⑶也可包含一或多個(gè)TU。TU可以使用RQT(還被稱作TU四叉樹結(jié)構(gòu))來指定,如上文所論述。舉例來說,分裂旗標(biāo)可以指示葉CU 是否分裂成四個(gè)變換單元。隨后,每一TU可進(jìn)一步分裂為另外的若干子TU。當(dāng)TU未進(jìn)一 步分裂時(shí),其可被稱作葉TU。通常,對于幀內(nèi)譯碼,所有屬于葉CU的葉TU共享相同的幀內(nèi) 預(yù)測模式。也就是說,通常應(yīng)用相同幀內(nèi)預(yù)測模式來計(jì)算葉CU的所有TU的預(yù)測值。對于 幀內(nèi)譯碼,視頻編碼器可以使用幀內(nèi)預(yù)測模式針對每一葉TU計(jì)算殘余值,作為CU的對應(yīng)于 TU的部分與原始塊之間的差。TU不一定限于PU的大小。因此,TU可比PU大或小。對于 幀內(nèi)譯碼,可與同一⑶的對應(yīng)葉TU位于同一地點(diǎn)。在一些實(shí)例中,葉TU的最大大小可 以對應(yīng)于對應(yīng)的葉CU的大小。
[0074] 此外,葉⑶的TU也可以與稱為RQT的相應(yīng)四叉樹數(shù)據(jù)結(jié)構(gòu)相關(guān)聯(lián)。S卩,葉⑶可 包含指示葉CU如何分割成TU的四叉樹。TU四叉樹的根節(jié)點(diǎn)總體上對應(yīng)于葉CU,而CU四 叉樹的根節(jié)點(diǎn)總體上對應(yīng)于樹塊。未經(jīng)分裂的RQT的TU被稱作葉TU。一般來說,除非另有 陳述,否則本發(fā)明分別使用術(shù)語CU和TU來指代葉CU和葉TU。
[0075] 和TU兩者可含有(S卩,對應(yīng)于)對應(yīng)于與所述塊相關(guān)聯(lián)的顏色空間的通道中的 每一者的一或多個(gè)樣本塊。PU的塊可包含預(yù)測性塊的樣本,且TU的塊可為包含對應(yīng)于原始 塊與預(yù)測性塊之間的差的殘余樣本的塊。對于與YCbCr顏色空間相關(guān)聯(lián)的塊,明度樣本的 塊可對應(yīng)于"Y"通道,且色度塊的兩個(gè)不同通道可分別對應(yīng)于Cb和Cr通道。
[0076] 作為一實(shí)例,HEVC支持各種PU大小的預(yù)測。假設(shè)特定⑶的大小為2Nx2N,那么 HEVC支持2Nx2N或NxN的PU大小的幀內(nèi)預(yù)測,及2Nx2N、2NxN、Nx2N或NxN的對稱PU大小 的幀間預(yù)測。HEVC還支持用于2NxnU、2NxnD、nLx2N和nRx2N的PU大小的幀間預(yù)測的不對 稱分割。在不對稱分割中,不分割CU的一個(gè)方向,而另一方向分割成25%及75%。CU的對 應(yīng)于25%分區(qū)的部分通過"η"接著是"向上"、"向下"、"左"或"右"的指示來指示。因而,舉 例來說,"2NxnU"是指水平地分割的2Nx2NCU,其中上方有2ΝχΟ. 5ΝPU,而下方有2Nxl. 5Ν PU〇
[0077] 在本發(fā)明中,"NxN"與"N乘N"可互換地使用以依據(jù)垂直和水平尺寸來指代視頻 塊的像素尺寸,例如,16x16像素或16乘16像素。一般來說,16x16塊在垂直方向上具有16 個(gè)像素(y= 16),且在水平方向上具有16個(gè)像素(X= 16)。同樣地,NxN塊一般在垂直方 向上具有N個(gè)像素,且在水平方向上具有N個(gè)像素,其中N表示非負(fù)整數(shù)值。塊中的像素可 按行及列布置。此外,塊未必需要在水平方向與垂直方向上具有相同數(shù)目個(gè)像素。舉例來 說,塊可包括NxM像素,其中Μ未必等于N。
[0078] 在使用⑶的進(jìn)行幀內(nèi)預(yù)測譯碼或幀間預(yù)測譯碼之后,視頻編碼器20或視頻解 碼器30可計(jì)算用于CU的TU的殘余數(shù)據(jù)。PU可包括描述在空間域(還稱為像素域)中產(chǎn) 生預(yù)測性像素?cái)?shù)據(jù)的方法或模式的語法數(shù)據(jù),并且TU可包括在對殘余視頻數(shù)據(jù)應(yīng)用了變 換(例如離散余弦變換(DCT)、整數(shù)變換、小波變換或概念上類似的變換)變換域中的系數(shù)。 殘余數(shù)據(jù)可對應(yīng)于未經(jīng)編碼圖片的像素與對應(yīng)于PU的預(yù)測值之間的像素差。視頻編碼器 20或視頻解碼器30可形成包含用于⑶的殘余數(shù)據(jù)的TU,且接著變換TU以生成用于⑶的 變換系數(shù)。換句話說,視頻編碼器20可將變換應(yīng)用于TU的變換塊以產(chǎn)生TU的變換系數(shù)塊。 視頻解碼器30可將逆變換應(yīng)用于TU的變換系數(shù)塊以重構(gòu)TU的變換塊。
[0079] 在應(yīng)用變換(如果存在)以產(chǎn)生變換系數(shù)后,視頻編碼器20或視頻解碼器30可 執(zhí)行變換系數(shù)的量化。換句話說,視頻編碼器20可量化變換系數(shù)塊的變換系數(shù)。視頻解 碼器30可解量化變換系數(shù)塊的變換系數(shù)。量化通常是指變換系數(shù)經(jīng)量化以可能減少用于 表示系數(shù)的數(shù)據(jù)量從而提供進(jìn)一步壓縮的過程。量化過程可減少與系數(shù)中的一些或全部相 關(guān)聯(lián)的位深度。舉例來說,η位值可在量化期間被下舍入到m位值,其中η大于m。逆量化 (即,解量化)可增加系數(shù)中的一些或全部的位深度。
[0080] 在量化之后,視頻編碼器20可掃描變換系數(shù),從包含經(jīng)量化變換系數(shù)的二維矩陣 產(chǎn)生一維向量。所述掃描可經(jīng)設(shè)計(jì)以將較高能量(并且因此較低頻率)系數(shù)放置在陣列的 前面,并且將較低能量(并且因此較高頻率)系數(shù)放置在陣列的后面。在一些實(shí)例中,視頻 編碼器20或視頻解碼器30可利用預(yù)定義的掃描次序來掃描經(jīng)量化的變換系數(shù)以產(chǎn)生可經(jīng) 熵編碼的串行化向量。在其它實(shí)例中,視頻編碼器20或視頻解碼器30可執(zhí)行自適應(yīng)掃描。 在掃描經(jīng)量化的變換系數(shù)以形成一維向量之后,視頻編碼器20或視頻解碼器30可以例如 根據(jù)上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(CABAC)、上下文自適應(yīng)可變長度譯碼(CAVLC)、基于語 法的上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(SBAC)、概率區(qū)間分割熵(PIPE)譯碼或另一熵編碼方 法來熵編碼一維向量。視頻編碼器20還可熵編碼與經(jīng)編碼視頻數(shù)據(jù)相關(guān)聯(lián)的語法元素以 供視頻解碼器30在解碼視頻數(shù)據(jù)時(shí)使用。
[0081] 為了執(zhí)行CABAC,視頻編碼器20可向待發(fā)射的符號指派上下文模型內(nèi)的上下文。 上下文可涉及(例如)符號的相鄰值是否為非零。為執(zhí)行CAVLC,視頻編碼器20可選擇用 于待發(fā)射的符號的可變長度碼??勺冮L度譯碼(VLC)中的碼字可經(jīng)構(gòu)造使得相對較短碼對 應(yīng)于更可能的符號,而較長碼對應(yīng)于較不可能的符號。以此方式,使用VLC可與例如對待發(fā) 射的每一符號使用等長碼字相比實(shí)現(xiàn)位節(jié)省。概率確定可基于指派到符號的上下文。
[0082] 視頻編碼器20可例如在幀標(biāo)頭、塊標(biāo)頭、切片標(biāo)頭或G0P標(biāo)頭中進(jìn)一步將例如基 于塊的語法數(shù)據(jù)、基于幀的語法數(shù)據(jù)及基于G0P的語法數(shù)據(jù)等語法數(shù)據(jù)發(fā)送到視頻解碼器 30。G0P語法數(shù)據(jù)可描述相應(yīng)G0P中的數(shù)個(gè)幀,且?guī)Z法數(shù)據(jù)可指示用以對對應(yīng)幀進(jìn)行編碼 的編碼/預(yù)測模式。
[0083] 本發(fā)明的技術(shù)中的一或多者是針對用于將視頻數(shù)據(jù)從第一顏色空間變換到第二 顏色空間的技術(shù)。因此,視頻編碼器20表示視頻譯碼器的實(shí)例,所述視頻譯碼器經(jīng)配置以: 確定與關(guān)聯(lián)于譯碼單元的多個(gè)顏色變換相關(guān)聯(lián)的成本,選擇所述多個(gè)顏色變換中具有最低 相關(guān)聯(lián)成本的顏色變換,使用所述多個(gè)顏色變換中的選定顏色變換變換具有第一紅、綠、藍(lán) (RGB)顏色空間的第一視頻數(shù)據(jù)塊以產(chǎn)生具有第二顏色空間的第二視頻數(shù)據(jù)塊,且對具有 第二顏色空間的第二視頻塊進(jìn)行編碼。
[0084] 視頻解碼器30表示視頻譯碼器的實(shí)例,所述視頻譯碼器經(jīng)配置以:在位流中接收 與經(jīng)譯碼單元