本申請(qǐng)是申請(qǐng)日為2012年10月29日,申請(qǐng)?zhí)枮椤?01280065429.8”,標(biāo)題為“用于幀間預(yù)測(cè)的方法及其裝置和用于運(yùn)動(dòng)補(bǔ)償?shù)姆椒捌溲b置”的發(fā)明專利申請(qǐng)的分案申請(qǐng)。
本發(fā)明涉及一種幀間預(yù)測(cè)方法和運(yùn)動(dòng)補(bǔ)償方法。
背景技術(shù):
隨著用于再現(xiàn)和存儲(chǔ)高分辨率或高質(zhì)量視頻內(nèi)容的硬件的開發(fā)和提供,對(duì)于用于有效地對(duì)高分辨率或高質(zhì)量視頻內(nèi)容進(jìn)行編碼或解碼的視頻編解碼器的需求正在增加。根據(jù)傳統(tǒng)的視頻編解碼器,基于具有預(yù)定尺寸的宏塊,根據(jù)受限的編碼方法來對(duì)視頻進(jìn)行編碼。
空間域的圖像數(shù)據(jù)經(jīng)由頻率變換被變換為頻率域的系數(shù)。根據(jù)視頻編解碼器,將圖像劃分為具有預(yù)定尺寸的塊,對(duì)每個(gè)塊執(zhí)行離散余弦變換(dct),并在塊單元中對(duì)頻率系數(shù)進(jìn)行編碼,以進(jìn)行頻率變換的快速計(jì)算。與空間域的圖像數(shù)據(jù)相比,頻率域的系數(shù)容易被壓縮。具體地,由于根據(jù)經(jīng)由視頻編解碼器的幀間預(yù)測(cè)或幀內(nèi)預(yù)測(cè)的預(yù)測(cè)誤差來表示空間域的圖像像素值,因此當(dāng)對(duì)預(yù)測(cè)誤差執(zhí)行頻率變換時(shí),大量數(shù)據(jù)可被變換為0。根據(jù)視頻編解碼器,可通過使用小量數(shù)據(jù)來代替連續(xù)并重復(fù)產(chǎn)生的數(shù)據(jù),來減少數(shù)據(jù)量。
技術(shù)實(shí)現(xiàn)要素:
技術(shù)問題
本發(fā)明提供一種使用長(zhǎng)期參考圖像的幀間預(yù)測(cè)方法和幀間預(yù)測(cè)設(shè)備,以及一種使用長(zhǎng)期參考圖像的運(yùn)動(dòng)補(bǔ)償方法和運(yùn)動(dòng)補(bǔ)償設(shè)備。本發(fā)明還提供一種涉及使用長(zhǎng)期參考圖像的幀間預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償?shù)囊曨l編碼方法和視頻編碼設(shè)備,以及一種涉及使用長(zhǎng)期參考圖像的運(yùn)動(dòng)補(bǔ)償?shù)囊曨l解碼方法和視頻解碼設(shè)備。
解決方案
根據(jù)本發(fā)明的一方面,提供一種幀間預(yù)測(cè)方法,包括:通過使用存儲(chǔ)在解碼畫面緩沖器中的長(zhǎng)期參考圖像對(duì)當(dāng)前圖像執(zhí)行幀間預(yù)測(cè);確定經(jīng)由幀間預(yù)測(cè)產(chǎn)生的當(dāng)前圖像的殘差數(shù)據(jù)和運(yùn)動(dòng)矢量;通過將長(zhǎng)期參考圖像的畫面順序計(jì)數(shù)(poc)信息劃分為最高有效位(msb)信息和最低有效位(lsb)信息,將lsb信息確定為指示長(zhǎng)期參考圖像的長(zhǎng)期參考索引。
有益效果
根據(jù)本發(fā)明的運(yùn)動(dòng)補(bǔ)償方法,長(zhǎng)期參考圖像的畫面順序計(jì)數(shù)(poc)信息的最低有效位(lsb)信息可用作指示用于對(duì)圖像進(jìn)行幀間預(yù)測(cè)的參考圖像之中的長(zhǎng)期參考圖像的參考索引。長(zhǎng)期參考圖像可通過使用圖像的poc信息來指示,而不必使用用于識(shí)別長(zhǎng)期參考圖像的長(zhǎng)期參考圖像的單獨(dú)圖像編號(hào)。因此,可節(jié)省用于存儲(chǔ)長(zhǎng)期參考圖像的單獨(dú)圖像編號(hào)的存儲(chǔ)空間。此外,指示長(zhǎng)期參考圖像的索引的范圍可以是無限的。
附圖說明
圖1a是根據(jù)本發(fā)明的實(shí)施例的幀間預(yù)測(cè)設(shè)備的框圖;
圖1b是示出根據(jù)本發(fā)明的實(shí)施例的幀間預(yù)測(cè)方法的流程圖;
圖2a是根據(jù)本發(fā)明的實(shí)施例的運(yùn)動(dòng)補(bǔ)償設(shè)備的框圖;
圖2b是示出根據(jù)本發(fā)明的實(shí)施例的運(yùn)動(dòng)補(bǔ)償方法的流程圖;
圖3是示出根據(jù)本發(fā)明的實(shí)施例的長(zhǎng)期參考圖像的畫面順序計(jì)數(shù)(poc)信息的最低有效位(lsb)信息和最高有效位(msb)信息的表;
圖4是根據(jù)本發(fā)明的實(shí)施例的執(zhí)行幀間預(yù)測(cè)的視頻編碼設(shè)備的框圖;
圖5是根據(jù)本發(fā)明的實(shí)施例的執(zhí)行運(yùn)動(dòng)補(bǔ)償?shù)囊曨l解碼設(shè)備的框圖;
圖6是根據(jù)本發(fā)明的實(shí)施例的基于根據(jù)樹結(jié)構(gòu)的編碼單元的視頻編碼設(shè)備的框圖;
圖7是根據(jù)本發(fā)明的實(shí)施例的基于根據(jù)樹結(jié)構(gòu)的編碼單元的視頻解碼設(shè)備的框圖;
圖8是用于描述根據(jù)本發(fā)明的實(shí)施例的編碼單元的概念的示圖;
圖9是根據(jù)本發(fā)明的實(shí)施例的基于編碼單元的圖像編碼器的框圖;
圖10是根據(jù)本發(fā)明的實(shí)施例的基于編碼單元的圖像解碼器的框圖;
圖11是示出根據(jù)本發(fā)明的實(shí)施例的根據(jù)深度的較深層編碼單元以及分區(qū)的示圖;
圖12是用于描述根據(jù)本發(fā)明的實(shí)施例的編碼單元與變換單元之間的關(guān)系的示圖;
圖13是用于描述根據(jù)本發(fā)明的實(shí)施例的與編碼深度相應(yīng)的編碼單元的編碼信息的示圖;
圖14是根據(jù)本發(fā)明的實(shí)施例的根據(jù)深度的較深層編碼單元的示圖;
圖15至圖17是用于描述根據(jù)本發(fā)明的實(shí)施例的編碼單元、預(yù)測(cè)單元和變換單元之間的關(guān)系的示圖;
圖18是用于描述根據(jù)表1的編碼模式信息的編碼單元、預(yù)測(cè)單元和變換單元之間的關(guān)系的示圖;
圖19是根據(jù)本發(fā)明的實(shí)施例的存儲(chǔ)程序的盤的物理結(jié)構(gòu)的示圖;
圖20是用于通過使用盤來記錄和讀取程序的盤驅(qū)動(dòng)器的示圖;
圖21是用于提供內(nèi)容分配服務(wù)的內(nèi)容供應(yīng)系統(tǒng)的整體結(jié)構(gòu)的示圖;
圖22和圖23分別是根據(jù)本發(fā)明的實(shí)施例的應(yīng)用了視頻編碼方法和視頻解碼方法的移動(dòng)電話的外部結(jié)構(gòu)和內(nèi)部結(jié)構(gòu)的示圖;
圖24是根據(jù)本發(fā)明的實(shí)施例的應(yīng)用通信系統(tǒng)的數(shù)字廣播系統(tǒng)的示圖;
圖25是根據(jù)本發(fā)明的實(shí)施例的使用視頻編碼設(shè)備和視頻解碼設(shè)備的云計(jì)算系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)的示圖。
最佳實(shí)施方式
根據(jù)本發(fā)明的一方面,提供一種幀間預(yù)測(cè)方法,包括:通過使用存儲(chǔ)在解碼畫面緩沖器中的長(zhǎng)期參考圖像對(duì)當(dāng)前圖像執(zhí)行幀間預(yù)測(cè);確定經(jīng)由幀間預(yù)測(cè)產(chǎn)生的當(dāng)前圖像的殘差數(shù)據(jù)和運(yùn)動(dòng)矢量;通過將長(zhǎng)期參考圖像的畫面順序計(jì)數(shù)(poc)信息劃分為最高有效位(msb)信息和最低有效位(lsb)信息,來將lsb信息確定為指示長(zhǎng)期參考圖像的長(zhǎng)期參考索引。
確定lsb信息的步驟可包括:將用于當(dāng)前條帶進(jìn)行幀間預(yù)測(cè)的長(zhǎng)期參考圖像的poc信息的lsb信息作為長(zhǎng)期參考索引插入到條帶頭中。
確定lsb信息的步驟可包括:將當(dāng)前圖像的poc信息和長(zhǎng)期參考圖像的poc信息之間的差信息劃分為msb信息和lsb信息,來將差信息的lsb信息確定為長(zhǎng)期參考索引。
所述幀間預(yù)測(cè)方法還可包括:通過使用存儲(chǔ)在解碼畫面緩沖器中的短期參考圖像對(duì)當(dāng)前圖像執(zhí)行幀間預(yù)測(cè);將短期參考圖像的poc信息的lsb信息確定為指示短期參考圖像的短期參考索引。
確定殘差數(shù)據(jù)和運(yùn)動(dòng)矢量的步驟可包括:基于根據(jù)當(dāng)前圖像的塊執(zhí)行的幀間預(yù)測(cè)的結(jié)果,確定根據(jù)當(dāng)前圖像的塊的殘差數(shù)據(jù)和運(yùn)動(dòng)矢量。
根據(jù)本發(fā)明的另一方面,提供一種運(yùn)動(dòng)補(bǔ)償方法,包括:接收編碼的圖像數(shù)據(jù)、運(yùn)動(dòng)矢量、和長(zhǎng)期參考索引;通過對(duì)編碼的圖像數(shù)據(jù)進(jìn)行解碼來恢復(fù)當(dāng)前圖像的殘差數(shù)據(jù);通過從長(zhǎng)期參考索引讀取當(dāng)前圖像的長(zhǎng)期參考圖像的poc信息的最低有效位(lsb)信息,使用長(zhǎng)期參考圖像的最高有效位(msb)信息和lsb信息,來確定畫面順序計(jì)數(shù)(poc)信息;通過基于在存儲(chǔ)在解碼畫面緩沖器中的參考圖像之中的與確定的poc信息相應(yīng)的長(zhǎng)期參考圖像,使用運(yùn)動(dòng)矢量和殘差數(shù)據(jù)執(zhí)行運(yùn)動(dòng)補(bǔ)償,來恢復(fù)當(dāng)前圖像。
確定poc信息的步驟可包括:在用于當(dāng)前圖像的多個(gè)長(zhǎng)期參考圖像之中,從第一長(zhǎng)期參考圖像的poc信息的msb信息預(yù)測(cè)第二長(zhǎng)期參考圖像的poc信息的msb信息;通過將從接收到的長(zhǎng)期參考索引讀取的第二長(zhǎng)期參考圖像的poc信息的lsb信息和第二長(zhǎng)期參考圖像的poc信息的msb信息組合,來恢復(fù)第二長(zhǎng)期參考圖像的poc信息。
確定poc信息的步驟可包括:通過將長(zhǎng)期參考圖像的poc信息的msb信息和lsb信息組合來恢復(fù)在當(dāng)前圖像的poc信息和長(zhǎng)期參考圖像的poc信息之間的差信息;通過將所述差信息與當(dāng)前圖像的poc信息相加,或從當(dāng)前圖像的poc信息減去所述差信息,來確定長(zhǎng)期參考圖像的poc編號(hào)。
接收的步驟可包括:從條帶頭解析長(zhǎng)期參考索引,其中,長(zhǎng)期參考索引指示用于對(duì)當(dāng)前條帶進(jìn)行運(yùn)動(dòng)補(bǔ)償?shù)拈L(zhǎng)期參考圖像。
所述運(yùn)動(dòng)補(bǔ)償方法還可包括:接收用于對(duì)當(dāng)前圖像進(jìn)行幀間預(yù)測(cè)的短期參考索引;從短期參考索引讀取用于對(duì)當(dāng)前圖像進(jìn)行幀間預(yù)測(cè)的短期參考圖像的poc信息的lsb信息;通過使用讀取的短期參考圖像的lsb信息和先前短期參考圖像的msb信息,來確定短期參考圖像的poc信息;通過使用在存儲(chǔ)在解碼畫面緩沖器中的參考圖像之中的與確定的poc信息相應(yīng)的短期參考圖像對(duì)當(dāng)前圖像執(zhí)行運(yùn)動(dòng)補(bǔ)償。
接收的步驟可包括:接收根據(jù)當(dāng)前圖像的塊的編碼的圖像數(shù)據(jù),恢復(fù)殘差數(shù)據(jù)的步驟可包括:根據(jù)所述塊恢復(fù)殘差數(shù)據(jù)和運(yùn)動(dòng)矢量,恢復(fù)當(dāng)前圖像的步驟可包括:通過根據(jù)所述塊執(zhí)行使用殘差數(shù)據(jù)和運(yùn)動(dòng)矢量的運(yùn)動(dòng)補(bǔ)償來恢復(fù)當(dāng)前圖像。
根據(jù)本發(fā)明的另一方面,提供一種幀間預(yù)測(cè)設(shè)備,包括:幀間預(yù)測(cè)單元,用于通過使用存儲(chǔ)在解碼畫面緩沖器中的長(zhǎng)期參考圖像對(duì)當(dāng)前圖像執(zhí)行幀間預(yù)測(cè);輸出單元,用于通過將長(zhǎng)期參考圖像的畫面順序計(jì)數(shù)(poc)信息劃分為最高有效位(msb)信息和最低有效位(lsb)信息,將lsb信息輸出為指示長(zhǎng)期參考圖像的長(zhǎng)期參考索引,并用于輸出經(jīng)由幀間預(yù)測(cè)產(chǎn)生的當(dāng)前圖像的殘差數(shù)據(jù)和運(yùn)動(dòng)矢量。
根據(jù)本發(fā)明的另一方面,提供一種運(yùn)動(dòng)補(bǔ)償設(shè)備,包括:接收單元,用于接收編碼的圖像數(shù)據(jù)、運(yùn)動(dòng)矢量和長(zhǎng)期參考索引;運(yùn)動(dòng)補(bǔ)償單元,用于通過對(duì)編碼的圖像數(shù)據(jù)進(jìn)行解碼來恢復(fù)當(dāng)前圖像的殘差數(shù)據(jù),從長(zhǎng)期參考索引讀取當(dāng)前圖像的長(zhǎng)期參考圖像的畫面順序計(jì)數(shù)(poc)信息的最低有效位(lsb)信息,通過使用長(zhǎng)期參考圖像的最高有效位(msb)信息和lsb信息來確定poc信息,并通過基于在存儲(chǔ)在解碼畫面緩沖器中的參考圖像之中的與確定的poc信息相應(yīng)的長(zhǎng)期參考圖像,使用運(yùn)動(dòng)矢量和殘差數(shù)據(jù)執(zhí)行運(yùn)動(dòng)補(bǔ)償,來恢復(fù)當(dāng)前圖像。
根據(jù)本發(fā)明的另一方面,提供一種記錄有用于執(zhí)行所述幀間預(yù)測(cè)方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)。
根據(jù)本發(fā)明的另一方面,提供一種記錄有用于執(zhí)行所述運(yùn)動(dòng)補(bǔ)償方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)。
根據(jù)本發(fā)明的另一方面,提供一種視頻編碼設(shè)備,包括:解碼畫面緩沖器,存儲(chǔ)用于對(duì)圖像進(jìn)行幀間預(yù)測(cè)的參考圖像;幀間預(yù)測(cè)單元,通過使用存儲(chǔ)在解碼畫面緩沖器中的長(zhǎng)期參考圖像對(duì)當(dāng)前圖像執(zhí)行幀間預(yù)測(cè)來產(chǎn)生殘差數(shù)據(jù);變換量化單元,通過對(duì)殘差數(shù)據(jù)執(zhí)行變換和量化來產(chǎn)生量化的變換系數(shù);熵編碼單元,通過將長(zhǎng)期參考圖像的畫面順序計(jì)數(shù)(poc)信息劃分為最高有效位(msb)信息和最低有效位(lsb)信息,對(duì)lsb信息和符號(hào)執(zhí)行熵編碼,其中,lsb信息是指示長(zhǎng)期參考圖像的長(zhǎng)期參考索引,所述符號(hào)包括量化的變換系數(shù)和運(yùn)動(dòng)矢量。
根據(jù)本發(fā)明的另一方面,提供一種視頻解碼設(shè)備,包括:接收單元,接收視頻流,并通過對(duì)接收到的視頻流執(zhí)行熵解碼來解析編碼的圖像數(shù)據(jù)、運(yùn)動(dòng)矢量和長(zhǎng)期參考索引;反量化和逆變換單元,通過對(duì)編碼的圖像數(shù)據(jù)執(zhí)行反量化和逆變換來恢復(fù)殘差數(shù)據(jù);解碼畫面緩沖器,存儲(chǔ)用于運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像;運(yùn)動(dòng)補(bǔ)償單元,通過對(duì)編碼的圖像數(shù)據(jù)進(jìn)行解碼來恢復(fù)當(dāng)前圖像的殘差數(shù)據(jù),從長(zhǎng)期參考索引讀取當(dāng)前圖像的長(zhǎng)期參考圖像的畫面順序計(jì)數(shù)(poc)信息的最低有效位(lsb)信息,通過使用長(zhǎng)期參考圖像的最高有效位(msb)信息和lsb信息來確定poc信息,并基于在存儲(chǔ)在解碼畫面緩沖器中的參考圖像之中的與確定的poc信息相應(yīng)的長(zhǎng)期參考圖像,使用運(yùn)動(dòng)矢量和殘差數(shù)據(jù)來執(zhí)行運(yùn)動(dòng)補(bǔ)償;環(huán)路濾波單元,對(duì)經(jīng)由運(yùn)動(dòng)補(bǔ)償產(chǎn)生的恢復(fù)圖像執(zhí)行去塊濾波。
具體實(shí)施方式
以下,將參照?qǐng)D1至圖3描述根據(jù)本發(fā)明的實(shí)施例的使用長(zhǎng)期參考圖像的幀間預(yù)測(cè)方法和幀間預(yù)測(cè)設(shè)備以及運(yùn)動(dòng)補(bǔ)償方法和運(yùn)動(dòng)補(bǔ)償設(shè)備。此外,將參照?qǐng)D4和圖5描述根據(jù)本發(fā)明的實(shí)施例的執(zhí)行幀間預(yù)測(cè)的視頻編碼設(shè)備和執(zhí)行運(yùn)動(dòng)補(bǔ)償?shù)囊曨l解碼設(shè)備。此外,將參考圖6至圖18描述根據(jù)本發(fā)明的實(shí)施例的與基于具有樹結(jié)構(gòu)的編碼單元的幀間預(yù)測(cè)有關(guān)的視頻編碼技術(shù)和視頻解碼技術(shù)。以下,術(shù)語(yǔ)“圖像”可以指靜止圖像或視頻的運(yùn)動(dòng)圖像(即,視頻本身)。
首先,將參照?qǐng)D1至圖3描述根據(jù)本發(fā)明的實(shí)施例的使用長(zhǎng)期參考圖像的幀間預(yù)測(cè)方法和幀間預(yù)測(cè)設(shè)備。然后,將參照?qǐng)D4和圖5描述根據(jù)本發(fā)明的實(shí)施例的涉及幀間預(yù)測(cè)的視頻編碼方法和視頻解碼方法。
圖1a是根據(jù)本發(fā)明的實(shí)施例的幀間預(yù)測(cè)設(shè)備10的框圖。
幀間預(yù)測(cè)設(shè)備10包括幀間預(yù)測(cè)單元12和輸出單元14。
幀間預(yù)測(cè)使用當(dāng)前圖像和另一圖像之間的相似性。從在當(dāng)前圖像之前被恢復(fù)的參考圖像檢測(cè)與當(dāng)前圖像的當(dāng)前區(qū)域相似的參考區(qū)域。當(dāng)前區(qū)域和參考區(qū)域之間的關(guān)于坐標(biāo)的距離被表示為運(yùn)動(dòng)矢量,當(dāng)前區(qū)域和參考區(qū)域的像素值之間的差被表示為殘差數(shù)據(jù)。因此,可通過對(duì)當(dāng)前區(qū)域進(jìn)行幀間預(yù)測(cè)來輸出指示參考圖像的索引、運(yùn)動(dòng)矢量和殘差數(shù)據(jù),而不是直接輸出當(dāng)前區(qū)域的圖像信息。
根據(jù)實(shí)施例的幀間預(yù)測(cè)設(shè)備10可根據(jù)視頻的每個(gè)圖像的塊執(zhí)行幀間預(yù)測(cè)。塊可具有正方形形狀、矩形形狀或任何幾何形狀,不受限于具有預(yù)測(cè)尺寸的數(shù)據(jù)單元。根據(jù)實(shí)施例的塊可以是根據(jù)樹結(jié)構(gòu)的編碼單元之中的最大編碼單元、編碼單元、預(yù)測(cè)單元或變換單元。隨后將參考圖6至圖18描述基于根據(jù)樹結(jié)構(gòu)的編碼單元的視頻編碼和解碼方法。
用于對(duì)當(dāng)前圖像進(jìn)行幀間預(yù)測(cè)的參考圖像必須在當(dāng)前圖像之間被解碼。根據(jù)實(shí)施例的用于幀間預(yù)測(cè)的參考圖像可被分類為短期參考圖像和長(zhǎng)期參考圖像。解碼畫面緩沖器存儲(chǔ)經(jīng)由對(duì)先前圖像進(jìn)行運(yùn)動(dòng)補(bǔ)償而產(chǎn)生的恢復(fù)圖像。產(chǎn)生的恢復(fù)圖像可用作用于對(duì)其他圖像進(jìn)行幀間預(yù)測(cè)的參考圖像。因此,可從存儲(chǔ)在解碼畫面緩沖器中的恢復(fù)圖像中選擇用于對(duì)當(dāng)前圖像進(jìn)行幀間預(yù)測(cè)的至少一個(gè)短期參考圖像或至少一個(gè)長(zhǎng)期參考圖像。短期參考圖像可以是根據(jù)解碼順序在當(dāng)前畫面之前立即被解碼或最近被解碼的圖像,而長(zhǎng)期參考圖像可以是解碼比當(dāng)前圖像早得多但被選擇并被存儲(chǔ)在解碼畫面緩沖器中以用作對(duì)其它圖像進(jìn)行幀間預(yù)測(cè)的參考圖像的圖像。
在存儲(chǔ)在解碼畫面緩沖器中的恢復(fù)圖像中,短期參考圖像和長(zhǎng)期參考圖像被彼此分類。長(zhǎng)期參考圖像是能夠參考以對(duì)多個(gè)圖像進(jìn)行幀間預(yù)測(cè)的圖像,并在很長(zhǎng)一段時(shí)間內(nèi)存儲(chǔ)在解碼畫面緩沖器中。另一方面,可更新短期參考圖像,其中,短期參考圖像中的每一個(gè)被參考以用于對(duì)當(dāng)前圖像和后續(xù)圖像進(jìn)行幀間預(yù)測(cè)并且每個(gè)圖像需要短期參考圖像,因此可頻繁更新解碼畫面緩沖器中的短期參考圖像。因此,當(dāng)新的短期參考圖像被存儲(chǔ)在解碼畫面緩沖器中時(shí),在預(yù)先存儲(chǔ)的短期參考圖像之中的最早的短期參考圖像可被順序地刪除。
幀間預(yù)測(cè)單元12可通過使用存儲(chǔ)在解碼畫面緩沖器中的長(zhǎng)期參考圖像對(duì)當(dāng)前圖像執(zhí)行幀間預(yù)測(cè)。
輸出單元14可輸出經(jīng)由幀間預(yù)測(cè)單元12的幀間預(yù)測(cè)產(chǎn)生的當(dāng)前圖像的殘差數(shù)據(jù)和運(yùn)動(dòng)矢量。
輸出單元14可將長(zhǎng)期參考圖像的畫面順序計(jì)數(shù)(poc)信息的最低有效位(lsb)信息確定為指示長(zhǎng)期參考圖像的長(zhǎng)期參考索引。輸出單元14可將長(zhǎng)期參考圖像的poc信息劃分為最高有效位(msb)信息和lsb信息,并僅將lsb信息輸出為指示長(zhǎng)期參考圖像的長(zhǎng)期參考索引。
幀間預(yù)測(cè)單元12可確定每個(gè)條帶的長(zhǎng)期參考圖像。因此,輸出單元14可將用于對(duì)當(dāng)前條帶進(jìn)行幀間預(yù)測(cè)的長(zhǎng)期參考圖像的poc信息的lsb信息作為長(zhǎng)期參考索引插入到條帶頭。用于當(dāng)前條帶的塊的參考圖像的poc信息的lsb信息可被插入到條帶頭,然后被發(fā)送。
根據(jù)條帶確定長(zhǎng)期參考圖像,并根據(jù)條帶中的塊執(zhí)行幀間預(yù)測(cè)。換言之,幀間預(yù)測(cè)單元12可通過參考長(zhǎng)期參考圖像根據(jù)當(dāng)前條帶的塊來執(zhí)行幀間預(yù)測(cè)。因此,根據(jù)當(dāng)前條帶的塊從長(zhǎng)期參考圖像確定參考?jí)K,并根據(jù)塊針對(duì)參考?jí)K確定運(yùn)動(dòng)矢量和殘差數(shù)據(jù)。因此,輸出單元14可根據(jù)當(dāng)前條帶的塊輸出運(yùn)動(dòng)矢量和殘差數(shù)據(jù)。
可選地,輸出單元14可將長(zhǎng)期參考圖像的poc信息和當(dāng)前圖像的poc信息之間的差信息劃分為msb信息和lsb信息,并將差信息的lsb信息輸出為長(zhǎng)期參考索引。
幀間預(yù)測(cè)單元12可通過參考短期參考圖像對(duì)當(dāng)前圖像執(zhí)行幀間預(yù)測(cè)。在此情況下,在短期參考圖像的poc信息的msb信息和lsb信息之中,輸出單元14可僅輸出lsb信息作為指示短期參考圖像的短期參考索引。
幀間預(yù)測(cè)設(shè)備10可包括總體控制幀間預(yù)測(cè)單元12和輸出單元14的中央處理器(未示出)??蛇x地,幀間預(yù)測(cè)單元12和輸出單元14可均由自身的處理器(未示出)來操作,并且自身的處理器可互相系統(tǒng)地進(jìn)行操作以使得對(duì)幀間預(yù)測(cè)設(shè)備10進(jìn)行操作??蛇x地,可根據(jù)幀間預(yù)測(cè)設(shè)備10的外部處理器(未示出)來控制幀間預(yù)測(cè)單元12和輸出單元14。
幀間預(yù)測(cè)設(shè)備10可包括存儲(chǔ)幀間預(yù)測(cè)單元12和輸出單元14的輸入數(shù)據(jù)和輸出數(shù)據(jù)的一個(gè)或更多個(gè)數(shù)據(jù)存儲(chǔ)單元(未示出)。幀間預(yù)測(cè)設(shè)備10可包括用于控制數(shù)據(jù)存儲(chǔ)單元的數(shù)據(jù)輸入和輸出的存儲(chǔ)器控制單元(未示出)。
圖1b是示出根據(jù)本發(fā)明的實(shí)施例的幀間預(yù)測(cè)方法的流程圖。
在操作13,幀間預(yù)測(cè)設(shè)備10可通過使用存儲(chǔ)在解碼畫面緩沖器中的長(zhǎng)期參考圖像對(duì)當(dāng)前圖像執(zhí)行幀間預(yù)測(cè)。在操作15,幀間預(yù)測(cè)設(shè)備10可確定根據(jù)幀間預(yù)測(cè)的當(dāng)前圖像的殘差數(shù)據(jù)和運(yùn)動(dòng)矢量。在操作17,幀間預(yù)測(cè)設(shè)備10可將長(zhǎng)期參考圖像的poc信息劃分為msb信息和lsb信息,并將長(zhǎng)期參考圖像的poc信息的lsb信息確定為長(zhǎng)期參考索引。
可輸出當(dāng)前圖像的殘差數(shù)據(jù)和運(yùn)動(dòng)矢量,并且可將長(zhǎng)期參考圖像的poc信息的lsb信息輸出為用于指示當(dāng)前圖像的長(zhǎng)期參考圖像的信息,作為在操作13至17中幀間預(yù)測(cè)設(shè)備10通過使用長(zhǎng)期參考圖像對(duì)當(dāng)前圖像執(zhí)行幀間預(yù)測(cè)的結(jié)果。
圖2a是根據(jù)本發(fā)明的實(shí)施例的運(yùn)動(dòng)補(bǔ)償設(shè)備20的框圖。
運(yùn)動(dòng)補(bǔ)償設(shè)備20包括接收單元22和運(yùn)動(dòng)補(bǔ)償單元24。
接收單元22可接收編碼的圖像數(shù)據(jù)、運(yùn)動(dòng)矢量和長(zhǎng)期參考索引。
作為幀間預(yù)測(cè)的結(jié)果,當(dāng)前圖像和參考圖像之間的運(yùn)動(dòng)矢量和殘差數(shù)據(jù)被產(chǎn)生。通過使用參考圖像、殘差數(shù)據(jù)和運(yùn)動(dòng)矢量來恢復(fù)當(dāng)前圖像的處理是運(yùn)動(dòng)補(bǔ)償。運(yùn)動(dòng)補(bǔ)償單元24可通過使用由接收單元22接收的當(dāng)前圖像的殘差數(shù)據(jù)和運(yùn)動(dòng)矢量執(zhí)行運(yùn)動(dòng)補(bǔ)償來恢復(fù)當(dāng)前圖像。
運(yùn)動(dòng)補(bǔ)償單元24可通過對(duì)編碼的圖像數(shù)據(jù)進(jìn)行解碼來恢復(fù)當(dāng)前圖像的殘差數(shù)據(jù)。當(dāng)編碼的圖像數(shù)據(jù)是量化后的變換系數(shù)時(shí),運(yùn)動(dòng)補(bǔ)償單元24可通過對(duì)編碼的圖像數(shù)據(jù)執(zhí)行反量化和逆變換來恢復(fù)當(dāng)前圖像的殘差數(shù)據(jù),然后對(duì)殘差數(shù)據(jù)執(zhí)行運(yùn)動(dòng)補(bǔ)償。
詳細(xì)地講,運(yùn)動(dòng)補(bǔ)償單元24可根據(jù)圖像的塊執(zhí)行運(yùn)動(dòng)補(bǔ)償。塊可具有正方形形狀、矩形形狀或任意幾何形狀,并可以是預(yù)測(cè)單元的樹結(jié)構(gòu)的編碼單元。如以上參照?qǐng)D1a所描述的,塊不限于具有預(yù)定尺寸的數(shù)據(jù)單元。
因此,接收單元22可接收根據(jù)當(dāng)前圖像的塊的編碼的圖像數(shù)據(jù),運(yùn)動(dòng)補(bǔ)償單元24可根據(jù)塊恢復(fù)殘差數(shù)據(jù)和運(yùn)動(dòng)矢量以根據(jù)所述塊執(zhí)行使用殘差數(shù)據(jù)和運(yùn)動(dòng)矢量的運(yùn)動(dòng)補(bǔ)償??赏ㄟ^對(duì)圖像中的所有塊執(zhí)行運(yùn)動(dòng)補(bǔ)償來恢復(fù)當(dāng)前圖像。
運(yùn)動(dòng)補(bǔ)償單元24可從長(zhǎng)期參考索引中讀取當(dāng)前圖像的長(zhǎng)期參考圖像的poc信息的lsb信息。運(yùn)動(dòng)補(bǔ)償單元24可通過將長(zhǎng)期參考圖像的poc信息的msb信息和從長(zhǎng)期參考索引讀取的lsb信息組合,來確定長(zhǎng)期參考圖像的poc信息。
運(yùn)動(dòng)補(bǔ)償單元24可從存儲(chǔ)在解碼畫面緩沖器中的參考圖像之中確定與確定的poc信息相應(yīng)的長(zhǎng)期參考圖像。運(yùn)動(dòng)補(bǔ)償單元24可基于確定的長(zhǎng)期參考圖像,通過使用運(yùn)動(dòng)矢量和殘差數(shù)據(jù)對(duì)當(dāng)前圖像執(zhí)行運(yùn)動(dòng)補(bǔ)償。當(dāng)前圖像可經(jīng)由運(yùn)動(dòng)補(bǔ)償被恢復(fù)。
運(yùn)動(dòng)補(bǔ)償單元24可從存儲(chǔ)在解碼圖像緩沖器中的用于當(dāng)前圖像的多個(gè)長(zhǎng)期參考圖像之中的第一長(zhǎng)期參考圖像的msb信息,預(yù)測(cè)第二長(zhǎng)期參考圖像的msb信息。
例如,運(yùn)動(dòng)補(bǔ)償單元24可對(duì)第二長(zhǎng)期參考圖像的poc信息的lsb信息與第一長(zhǎng)期參考圖像的poc信息的lsb信息進(jìn)行比較,以確定第二長(zhǎng)期參考圖像的poc信息的msb信息是高于、低于還是等于第一長(zhǎng)期參考圖像的poc信息的msb信息。因此,可從第一長(zhǎng)期參考圖像的poc信息的msb信息預(yù)測(cè)第二長(zhǎng)期參考圖像的poc信息的msb信息。運(yùn)動(dòng)補(bǔ)償單元24可通過將從接收到的長(zhǎng)期參考索引讀取的第二長(zhǎng)期參考圖像的poc信息的lsb信息和預(yù)測(cè)的第二長(zhǎng)期參考圖像的poc信息的msb信息組合,來恢復(fù)第二長(zhǎng)期參考圖像的poc信息。
可選地,運(yùn)動(dòng)補(bǔ)償單元24可接收作為用于當(dāng)前圖像的長(zhǎng)期參考索引的長(zhǎng)期參考圖像的poc信息的lsb信息和長(zhǎng)期參考圖像的poc信息的msb信息兩者。在此情況下,運(yùn)動(dòng)補(bǔ)償單元24可通過將從接收到的長(zhǎng)期參考索引讀取的長(zhǎng)期參考圖像的poc信息的lsb信息和msb信息組合,來恢復(fù)長(zhǎng)期參考圖像的poc信息。
運(yùn)動(dòng)補(bǔ)償單元24可從長(zhǎng)期參考索引讀取在當(dāng)前圖像的poc信息和長(zhǎng)期參考圖像的poc信息之間的差信息的lsb信息。這里,運(yùn)動(dòng)補(bǔ)償單元24可通過將msb信息和lsb信息組合來恢復(fù)差信息。運(yùn)動(dòng)補(bǔ)償單元24可通過從當(dāng)前圖像的poc信息減去恢復(fù)的差信息或?qū)⒒謴?fù)的差信息添加到當(dāng)前圖像的poc信息來確定長(zhǎng)期參考圖像的poc編號(hào)。
接收單元22可從條帶頭解析當(dāng)前條帶的長(zhǎng)期參考索引??蓮臈l帶頭解析用于當(dāng)前條帶的塊的參考圖像的poc信息的lsb信息。
可選地,接收單元22可接收用于對(duì)當(dāng)前圖像進(jìn)行幀間預(yù)測(cè)的短期參考索引??蓮亩唐趨⒖妓饕x取用于對(duì)當(dāng)前圖像進(jìn)行幀間預(yù)測(cè)的短期參考圖像的poc信息的lsb信息。運(yùn)動(dòng)補(bǔ)償單元24可通過使用讀取的短期參考圖像的poc信息的lsb信息和短期參考圖像的msb信息來確定短期參考圖像的poc信息。運(yùn)動(dòng)補(bǔ)償單元24可通過使用存儲(chǔ)在解碼畫面緩沖器中的參考圖像之中的與確定的poc信息相應(yīng)的短期參考圖像對(duì)當(dāng)前圖像執(zhí)行運(yùn)動(dòng)補(bǔ)償。
圖2b是根據(jù)本發(fā)明的實(shí)施例的運(yùn)動(dòng)補(bǔ)償方法的流程圖。
在操作21,運(yùn)動(dòng)補(bǔ)償設(shè)備20可接收編碼的圖像數(shù)據(jù)、運(yùn)動(dòng)矢量和長(zhǎng)期參考索引。在操作23,運(yùn)動(dòng)補(bǔ)償設(shè)備20可通過對(duì)編碼的圖像數(shù)據(jù)進(jìn)行解碼來恢復(fù)當(dāng)前圖像的殘差數(shù)據(jù)。在操作25,運(yùn)動(dòng)補(bǔ)償設(shè)備20可從長(zhǎng)期參考索引讀取當(dāng)前圖像的長(zhǎng)期參考圖像的poc信息的lsb信息,并通過使用長(zhǎng)期參考圖像的poc信息的msb信息和lsb信息來確定長(zhǎng)期參考圖像的poc信息。在操作27,運(yùn)動(dòng)補(bǔ)償設(shè)備20可通過基于在存儲(chǔ)在解碼畫面緩沖器中的參考圖像之中的與在操作25確定的poc信息相應(yīng)的長(zhǎng)期參考圖像,使用運(yùn)動(dòng)矢量和殘差數(shù)據(jù)執(zhí)行運(yùn)動(dòng)補(bǔ)償,來恢復(fù)當(dāng)前圖像。
換言之,運(yùn)動(dòng)補(bǔ)償設(shè)備20可在存儲(chǔ)在解碼畫面緩沖器中的恢復(fù)圖像之中選擇與在操作25確定的poc信息相應(yīng)的長(zhǎng)期參考圖像,并從選擇的長(zhǎng)期參考圖像中確定由運(yùn)動(dòng)矢量指示的參考區(qū)域。運(yùn)動(dòng)補(bǔ)償設(shè)備20可通過將殘差數(shù)據(jù)與確定的參考區(qū)域組合來執(zhí)行運(yùn)動(dòng)補(bǔ)償以確定當(dāng)前區(qū)域。運(yùn)動(dòng)補(bǔ)償設(shè)備20可通過根據(jù)當(dāng)前圖像的塊執(zhí)行運(yùn)動(dòng)補(bǔ)償來恢復(fù)當(dāng)前圖像。
根據(jù)以上參照?qǐng)D1a和圖1b描述的幀間預(yù)測(cè)設(shè)備10和以上參照?qǐng)D2a和圖2b描述的運(yùn)動(dòng)補(bǔ)償設(shè)備20,可將長(zhǎng)期參考圖像的poc信息的lsb信息用作指示在用于對(duì)圖像進(jìn)行幀間預(yù)測(cè)的參考圖像之中的長(zhǎng)期參考圖像的長(zhǎng)期參考索引。長(zhǎng)期參考圖像可通過使用poc信息來指示,而不必使用用于識(shí)別長(zhǎng)期參考圖像的長(zhǎng)期參考圖像的單獨(dú)圖像編號(hào)。因此,可節(jié)省用于存儲(chǔ)長(zhǎng)期參考圖像的單獨(dú)圖像編號(hào)的存儲(chǔ)空間。此外,指示長(zhǎng)期參考圖像的索引的范圍可以是無限的。
圖3是示出根據(jù)本發(fā)明的實(shí)施例的長(zhǎng)期參考圖像的poc信息的lsb信息和msb信息的表。
幀間預(yù)測(cè)設(shè)備10和運(yùn)動(dòng)補(bǔ)償設(shè)備20使用長(zhǎng)期參考圖像的poc信息來指示長(zhǎng)期參考圖像。此外,poc信息被劃分為msb信息和lsb信息??深A(yù)先設(shè)置lsb信息的最大大小。在圖3中,lsb信息的范圍是從0到15,因此lsb信息的最大大小為16,即,4比特。
當(dāng)poc信息除以lsb信息的最大大小時(shí),商可以是msb信息,余數(shù)可以是lsb信息。
因此,當(dāng)poc信息從0增加到15時(shí),poc信息的msb信息是0,lsb信息從0增加到15。此外,當(dāng)poc信息從16增加到31時(shí),msb信息是1,lsb信息從0增加到15。此外,當(dāng)poc信息從32增加到47時(shí),msb信息是2,lsb信息從0增加到15。此外,當(dāng)poc信息是48時(shí),msb信息是3,lsb信息是0。
在圖3中,msb信息0、1、2和3都是十六進(jìn)制數(shù),并且分別表示十進(jìn)制數(shù)的0、16、32和48。
當(dāng)poc信息從15增加到16,從31增加到32,或從47增加到48時(shí),lsb信息從15返回到0。換言之,每當(dāng)lsb信息在連續(xù)增加時(shí)增加到最大大小的倍數(shù)時(shí),lsb信息可從最大值返轉(zhuǎn)到最小值。
當(dāng)lsb信息僅在poc信息的msb信息被預(yù)先檢查之后才被另外確定時(shí),可通過將msb信息和lsb信息組合來確定poc信息。
因此,幀間預(yù)測(cè)設(shè)備10可僅輸出長(zhǎng)期參考圖像的poc信息的lsb信息,以便輸出指示長(zhǎng)期參考圖像的長(zhǎng)期參考索引。運(yùn)動(dòng)補(bǔ)償設(shè)備20可從接收自幀間預(yù)測(cè)設(shè)備10的參考索引中,讀取長(zhǎng)期參考圖像的poc信息的lsb信息,并通過將lsb信息與預(yù)先獲得的msb信息組合來恢復(fù)長(zhǎng)期參考圖像的poc信息。
可選地,長(zhǎng)期參考索引可表示在當(dāng)前圖像的poc信息和參考圖像的poc信息之間的差信息的lsb信息。這里,運(yùn)動(dòng)補(bǔ)償設(shè)備20可從長(zhǎng)期參考索引中讀取在當(dāng)前圖像的poc信息和長(zhǎng)期參考圖像的poc信息之間的差信息的lsb信息(deltapocltm1lsb)。運(yùn)動(dòng)補(bǔ)償設(shè)備20可通過將預(yù)先確定的msb信息(deltapocltm1msb)和讀取的lsb信息(deltapocltm1lsb)組合,來確定在當(dāng)前圖像的poc信息和長(zhǎng)期參考圖像的poc信息之間的差信息(deltapocltm1)(deltapocltm1=deltapocltm1lsb+deltapocltm1msb)。此外,當(dāng)從當(dāng)前圖像的poc信息(picordercnt)減去確定的差信息(deltapocltm1)時(shí),可確定當(dāng)前圖像的長(zhǎng)期參考圖像的poc信息(refpicsetltcurr)(refpicsetltcurr=picordercnt-deltapocltm1)。
運(yùn)動(dòng)補(bǔ)償設(shè)備20可從幀間預(yù)測(cè)設(shè)備10接收長(zhǎng)期參考圖像的poc信息的msb信息。這里,運(yùn)動(dòng)補(bǔ)償設(shè)備20可通過將接收到的msb信息和長(zhǎng)期參考圖像的poc信息的lsb信息,來恢復(fù)長(zhǎng)期參考圖像的poc信息。
可選地,運(yùn)動(dòng)補(bǔ)償設(shè)備20可基于在多個(gè)長(zhǎng)期參考圖像之中的預(yù)先確定的先前長(zhǎng)期參考圖像的poc信息的msb信息,來確定當(dāng)前長(zhǎng)期參考圖像的poc信息的msb信息。例如,當(dāng)前長(zhǎng)期參考圖像的poc信息的msb信息(pocltm1msb)可i)比先前長(zhǎng)期參考圖像的poc信息的msb信息(prevpocltm1msb)高lsb信息的最大大小(maxpocltlsb),ii)比先前長(zhǎng)期參考圖像的poc信息的msb信息(prevpocltm1msb)低lsb信息的最大大小(maxpocltlsb),或iii)等于先前長(zhǎng)期參考圖像的poc信息的msb信息(prevpocltm1msb)。
例如,運(yùn)動(dòng)補(bǔ)償設(shè)備20可將先前長(zhǎng)期參考圖像的poc信息的lsb信息與當(dāng)前長(zhǎng)期參考圖像的poc信息的lsb信息進(jìn)行比較,以確定當(dāng)前長(zhǎng)期參考圖像的poc信息的msb信息是否高于或等于先前長(zhǎng)期參考圖像的poc信息的msb信息。
根據(jù)第一條件,當(dāng)前長(zhǎng)期參考圖像的poc信息的lsb信息(pocltlsbm1)可小于先前長(zhǎng)期參考圖像的poc信息的lsb信息(prevpocltlsbm1),并且當(dāng)前長(zhǎng)期參考圖像的poc信息的lsb信息和先前長(zhǎng)期參考圖像的poc信息的lsb信息之間的距離高于或等于lsb信息的最大大小的一半(maxpocltlsb/2)。當(dāng)?shù)谝粭l件被滿足時(shí),當(dāng)前長(zhǎng)期參考圖像的poc信息的msb信息(pocltm1msb)可比先前長(zhǎng)期參考圖像的poc信息的msb信息(prevpocltm1msb)高lsb信息的最大大小(maxpocltlsb)。
[根據(jù)第一條件的關(guān)系表達(dá)式]
if((pocltm1lsb<prevpocltm1lsb)&&
((prevpocltm1lsb-pocltm1lsb)>=(maxpocltlsb/2)))
pocltm1msb=prevpocltm1msb+maxpocltlsb
換言之,在第一條件中,確定lsb信息按從先前長(zhǎng)期參考圖像的poc信息到當(dāng)前長(zhǎng)期參考圖像的poc信息的增加的方向折回(wraparound),并因此可相對(duì)地增加當(dāng)前長(zhǎng)期參考圖像的poc信息的msb信息。
根據(jù)第二條件,當(dāng)前長(zhǎng)期參考圖像的poc信息的lsb信息(pocltlsbm1)可高于先前長(zhǎng)期參考圖像的poc信息的lsb信息(prevpocltlsbm1),并且當(dāng)前長(zhǎng)期參考圖像的poc信息的lsb信息和先前長(zhǎng)期參考圖像的poc信息的lsb信息之間的距離高于或等于lsb信息的最大大小的一半(maxpocltlsb/2)。當(dāng)?shù)诙l件被滿足時(shí),當(dāng)前長(zhǎng)期參考圖像的poc信息的msb信息(pocltm1msb)可比先前長(zhǎng)期參考圖像的poc信息的msb信息(prevpocltm1msb)低lsb信息的最大大小(maxpocltlsb)。
[根據(jù)第二條件的關(guān)系表達(dá)式]
if((pocltm1lsb>prevpocltm1lsb)&&
((prevpocltm1lsb-pocltm1lsb)>=(maxpocltlsb/2)))
pocltm1msb=prevpocltm1msb-maxpocltlsb
換言之,在第二條件中,確定lsb信息按從先前長(zhǎng)期參考圖像的poc信息到當(dāng)前長(zhǎng)期參考圖像的poc信息的減小的方向折回,因此可相對(duì)地減小當(dāng)前長(zhǎng)期參考圖像的poc信息的msb信息。
當(dāng)無法應(yīng)用第一條件和第二條件時(shí),應(yīng)用第三條件。在第三條件中,當(dāng)前長(zhǎng)期參考圖像的poc信息的msb信息(pocltm1msb)可等于先前長(zhǎng)期參考圖像的poc信息的msb信息(prevpocltm1msb)。
[根據(jù)第三條件的關(guān)系表達(dá)式]
pocltm1msb=prevpocltm1msb
通過考慮所有的第一條件至第三條件來確定當(dāng)前長(zhǎng)期參考圖像的poc信息的msb信息(pocltm1msb),并且可通過將從長(zhǎng)期參考索引讀取的當(dāng)前長(zhǎng)期參考圖像的poc信息的lsb信息(pocltm1lsb)與確定的msb信息(pocltm1msb)組合,來確定當(dāng)前長(zhǎng)期參考圖像的poc信息(pocltm1)(pocltm1=pocltm1msb+pocltm1lsb)。
即使當(dāng)以上描述的當(dāng)前圖像的poc信息和長(zhǎng)期參考圖像的poc信息之間的差信息的lsb信息被用作長(zhǎng)期參考索引時(shí),仍可確定當(dāng)前圖像的poc信息和當(dāng)前長(zhǎng)期參考圖像的poc信息之間的差信息的lsb信息是高于、低于還是等于當(dāng)前圖像的poc信息和預(yù)先確定的先前長(zhǎng)期參考圖像的poc信息之間的差信息的lsb信息。
圖4是根據(jù)本發(fā)明的實(shí)施例的執(zhí)行幀間預(yù)測(cè)的視頻編碼設(shè)備40的框圖。
視頻編碼設(shè)備40包括解碼畫面緩沖器42、幀間預(yù)測(cè)單元44、變換量化單元46和熵編碼單元48。
解碼畫面緩沖器42存儲(chǔ)先前恢復(fù)的圖像。可從存儲(chǔ)在解碼畫面緩沖器42中的恢復(fù)圖像之中確定用于對(duì)圖像進(jìn)行幀間預(yù)測(cè)的參考圖像。幀間預(yù)測(cè)單元44可通過使用從存儲(chǔ)在解碼畫面緩沖器42中的恢復(fù)圖像之中選擇的長(zhǎng)期參考圖像對(duì)當(dāng)前圖像執(zhí)行幀間預(yù)測(cè),來產(chǎn)生殘差數(shù)據(jù)。幀間預(yù)測(cè)單元44可執(zhí)行與以上描述的幀間預(yù)測(cè)設(shè)備10相同的操作。
變換量化單元46可通過對(duì)由幀間預(yù)測(cè)單元44產(chǎn)生的殘差數(shù)據(jù)執(zhí)行變換和量化來產(chǎn)生量化的變換系數(shù)。熵編碼單元48可對(duì)包括量化的變換系數(shù)和運(yùn)動(dòng)矢量的符號(hào)執(zhí)行熵編碼。
因此,視頻編碼設(shè)備40可根據(jù)視頻的圖像的塊執(zhí)行幀間預(yù)測(cè),通過對(duì)經(jīng)由幀間預(yù)測(cè)根據(jù)塊所產(chǎn)生的殘差數(shù)據(jù)執(zhí)行變換和量化來根據(jù)塊產(chǎn)生量化的變換系數(shù),并通過對(duì)量化的變換系數(shù)執(zhí)行熵編碼來輸出比特流,從而對(duì)視頻進(jìn)行編碼。
熵編碼單元48可輸出經(jīng)由幀間預(yù)測(cè)確定的運(yùn)動(dòng)矢量連同量化的變換系數(shù)。因此,可對(duì)包括量化的變換系數(shù)和運(yùn)動(dòng)矢量的符號(hào)執(zhí)行熵編碼。
此外,由幀間預(yù)測(cè)單元44所確定的長(zhǎng)期參考索引可被輸出為符號(hào)。長(zhǎng)期參考索引可以是長(zhǎng)期參考圖像的poc信息的lsb信息。相應(yīng)地,熵編碼單元48可對(duì)符號(hào)執(zhí)行熵編碼,其中,所述符號(hào)包括量化的變換系數(shù)、運(yùn)動(dòng)矢量和長(zhǎng)期參考索引。熵編碼單元48可輸出根據(jù)熵編碼產(chǎn)生的比特流。
此外,視頻編碼設(shè)備40可通過參考存儲(chǔ)在解碼畫面緩沖器42中的恢復(fù)圖像,使用當(dāng)前圖像的殘差數(shù)據(jù)和運(yùn)動(dòng)矢量來執(zhí)行運(yùn)動(dòng)補(bǔ)償,以產(chǎn)生當(dāng)前圖像的恢復(fù)圖像,從而產(chǎn)生用于對(duì)其他圖像進(jìn)行幀間預(yù)測(cè)的參考圖像。因此,視頻編碼設(shè)備40可執(zhí)行運(yùn)動(dòng)補(bǔ)償設(shè)備20的操作以執(zhí)行運(yùn)動(dòng)補(bǔ)償。
換言之,視頻編碼設(shè)備40可從長(zhǎng)期參考索引中讀取poc信息的lsb信息,并通過使用讀取的lsb信息來恢復(fù)長(zhǎng)期參考圖像的poc信息,以便選擇用于運(yùn)動(dòng)補(bǔ)償?shù)拈L(zhǎng)期參考圖像。視頻編碼設(shè)備40可從存儲(chǔ)在解碼畫面緩沖器42中的恢復(fù)圖像之中選擇與恢復(fù)的poc信息相應(yīng)的長(zhǎng)期參考圖像,并基于選擇的長(zhǎng)期參考圖像使用當(dāng)前圖像的殘差數(shù)據(jù)和運(yùn)動(dòng)矢量來執(zhí)行運(yùn)動(dòng)補(bǔ)償。
為了輸出視頻編碼結(jié)果,視頻編碼設(shè)備40可與安裝在其中的視頻編碼處理器或外部視頻編碼處理器協(xié)作地進(jìn)行操作,以便執(zhí)行包括幀內(nèi)預(yù)測(cè)、幀間預(yù)測(cè)、變換和量化的視頻編碼操作。視頻編碼操作不僅可在視頻編碼設(shè)備40包括單獨(dú)內(nèi)部視頻編碼處理器時(shí)被執(zhí)行,而且可在視頻編碼設(shè)備40或用于控制視頻編碼設(shè)備40的中央處理設(shè)備或圖形處理設(shè)備包括視頻編碼處理模塊時(shí)被執(zhí)行。
圖5是根據(jù)本發(fā)明的實(shí)施例的執(zhí)行運(yùn)動(dòng)補(bǔ)償?shù)囊曨l解碼設(shè)備50的框圖。
視頻解碼設(shè)備50可包括接收單元52、反量化和逆變換單元54、解碼畫面緩沖器56、運(yùn)動(dòng)補(bǔ)償單元58和環(huán)路濾波單元59。
接收單元52可接收視頻流,并對(duì)接收的視頻流執(zhí)行熵解碼以解析編碼的圖像數(shù)據(jù)。
反量化和逆變換單元54可通過對(duì)經(jīng)由接收單元52解析的編碼的圖像數(shù)據(jù)執(zhí)行反量化和逆變換來恢復(fù)殘差數(shù)據(jù)。
接收單元52可從視頻流中解析運(yùn)動(dòng)矢量。解碼畫面緩沖器56可存儲(chǔ)先前恢復(fù)的圖像,其中,先前恢復(fù)的圖像可用作用于對(duì)其他圖像進(jìn)行運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像。運(yùn)動(dòng)補(bǔ)償單元58可基于存儲(chǔ)在解碼畫面緩沖器56中的參考圖像,使用運(yùn)動(dòng)矢量和殘差數(shù)據(jù)來執(zhí)行運(yùn)動(dòng)補(bǔ)償。
環(huán)路濾波單元59可對(duì)由運(yùn)動(dòng)補(bǔ)償單元58恢復(fù)并輸出的恢復(fù)圖像執(zhí)行去塊濾波。環(huán)路濾波單元59可輸出最終的恢復(fù)圖像。此外,環(huán)路濾波單元59的輸出圖像可存儲(chǔ)在解碼畫面緩沖器56中,并且所述輸出圖像可用作用于對(duì)后續(xù)圖像進(jìn)行運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像。
視頻解碼設(shè)備50可通過根據(jù)視頻的圖像的塊執(zhí)行解碼來恢復(fù)視頻。接收單元52可根據(jù)塊解析編碼的圖像數(shù)據(jù)和運(yùn)動(dòng)矢量,反量化和逆變換單元54可通過根據(jù)塊執(zhí)行反量化和逆變換來根據(jù)塊恢復(fù)殘差數(shù)據(jù)。運(yùn)動(dòng)補(bǔ)償單元58可根據(jù)塊從參考圖像之中確定由運(yùn)動(dòng)矢量指示的參考?jí)K,并通過將參考?jí)K和殘差數(shù)據(jù)組合來產(chǎn)生恢復(fù)塊。
接收單元52可從視頻流解析長(zhǎng)期參考索引。運(yùn)動(dòng)補(bǔ)償單元58可執(zhí)行與以上描述的運(yùn)動(dòng)補(bǔ)償設(shè)備20相同的操作。運(yùn)動(dòng)補(bǔ)償單元58可從長(zhǎng)期參考索引中讀取當(dāng)前圖像的長(zhǎng)期參考圖像的poc信息的lsb信息,并通過使用長(zhǎng)期參考圖像的msb信息和lsb信息來確定長(zhǎng)期參考圖像的poc信息。運(yùn)動(dòng)補(bǔ)償單元58可基于在存儲(chǔ)在解碼畫面緩沖器56中的恢復(fù)圖像之中的與poc信息相應(yīng)的長(zhǎng)期參考圖像,使用運(yùn)動(dòng)矢量和殘差數(shù)據(jù)來執(zhí)行運(yùn)動(dòng)補(bǔ)償。換言之,運(yùn)動(dòng)補(bǔ)償單元58可在長(zhǎng)期參考圖像中確定由運(yùn)動(dòng)矢量指示的參考?jí)K,并通過將參考?jí)K和殘差數(shù)據(jù)組合來恢復(fù)當(dāng)前塊。
為了輸出視頻解碼結(jié)果,視頻解碼設(shè)備50可與安裝在其中的視頻解碼處理器或外部視頻解碼處理器協(xié)作地進(jìn)行操作,以執(zhí)行包括反量化、逆變換、幀內(nèi)預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償?shù)囊曨l解碼操作。視頻解碼操作不僅可在視頻解碼設(shè)備50包括單獨(dú)內(nèi)部視頻解碼處理器時(shí)被執(zhí)行,而且可在視頻解碼設(shè)備50或用于控制視頻解碼設(shè)備50的中央處理設(shè)備或圖形處理設(shè)備包括視頻解碼處理模塊時(shí)被執(zhí)行。
如以上所描述的,幀間預(yù)測(cè)設(shè)備10可將視頻數(shù)據(jù)的塊劃分為具有樹結(jié)構(gòu)的編碼單元,并且用于編碼單元的幀間預(yù)測(cè)的預(yù)測(cè)單元可被使用。以下,將參照?qǐng)D6至圖18描述基于具有樹結(jié)構(gòu)的編碼單元和變換單元的視頻編碼方法、視頻編碼設(shè)備、視頻解碼方法和視頻解碼設(shè)備。
圖6是根據(jù)本發(fā)明的實(shí)施例的基于根據(jù)樹結(jié)構(gòu)的編碼單元的視頻編碼設(shè)備100的框圖。
涉及基于根據(jù)樹結(jié)構(gòu)的編碼單元的視頻預(yù)測(cè)的視頻編碼設(shè)備100包括最大編碼單元?jiǎng)澐制?10、編碼單元確定器120和輸出單元130。
最大編碼單元?jiǎng)澐制?10可基于最大編碼單元?jiǎng)澐之?dāng)前畫面,其中,最大編碼單元是具有用于圖像的當(dāng)前畫面的最大尺寸的編碼單元。如果當(dāng)前畫面大于最大編碼單元,則可將當(dāng)前畫面的圖像數(shù)據(jù)劃分為至少一個(gè)最大編碼單元。根據(jù)本發(fā)明的實(shí)施例的最大編碼單元可以是尺寸為32×32、64×64、128×128、256×256等的數(shù)據(jù)單元,其中,數(shù)據(jù)單元的形狀是寬度和長(zhǎng)度為2的若干次方的正方形。圖像數(shù)據(jù)可根據(jù)至少一個(gè)最大編碼單元被輸出到編碼單元確定器120。
根據(jù)本發(fā)明的實(shí)施例的編碼單元可由最大尺寸和深度表征。深度表示編碼單元從最大編碼單元空間被劃分的次數(shù),并且隨著深度加深,根據(jù)深度的較深層編碼單元可從最大編碼單元被劃分到最小編碼單元。最大編碼單元的深度為最高深度,最小編碼單元的深度為最低深度。由于隨著最大編碼單元的深度加深,與每個(gè)深度相應(yīng)的編碼單元的尺寸減小,因此與更高深度相應(yīng)的編碼單元可包括多個(gè)與更低深度相應(yīng)的編碼單元。
如上所述,當(dāng)前畫面的圖像數(shù)據(jù)根據(jù)編碼單元的最大尺寸被劃分為最大編碼單元,并且每個(gè)最大編碼單元可包括根據(jù)深度被劃分的較深層編碼單元。由于根據(jù)深度對(duì)根據(jù)本發(fā)明的實(shí)施例的最大編碼單元進(jìn)行劃分,因此可根據(jù)深度對(duì)包括在最大編碼單元中的空間域的圖像數(shù)據(jù)進(jìn)行分層地分類。
可預(yù)先確定編碼單元的最大深度和最大尺寸,所述最大深度和最大尺寸限制最大編碼單元的高度和寬度被分層劃分的總次數(shù)。
編碼單元確定器120對(duì)通過根據(jù)深度對(duì)最大編碼單元的區(qū)域進(jìn)行劃分而獲得的至少一個(gè)劃分區(qū)域進(jìn)行編碼,并且根據(jù)所述至少一個(gè)劃分區(qū)域來確定用于輸出最終編碼的圖像數(shù)據(jù)的深度。換言之,編碼單元確定器120通過根據(jù)當(dāng)前畫面的最大編碼單元以根據(jù)深度的較深層編碼單元對(duì)圖像數(shù)據(jù)進(jìn)行編碼,并選擇具有最小編碼誤差的深度,來確定編碼深度。確定的編碼深度和根據(jù)確定的編碼深度的被編碼的圖像數(shù)據(jù)被輸出到輸出單元130。
基于與等于或低于最大深度的至少一個(gè)深度相應(yīng)的較深層編碼單元,對(duì)最大編碼單元中的圖像數(shù)據(jù)進(jìn)行編碼,并且基于每個(gè)較深層編碼單元比較對(duì)圖像數(shù)據(jù)進(jìn)行編碼的結(jié)果。在對(duì)與較深層編碼單元的編碼誤差進(jìn)行比較之后,可選擇具有最小編碼誤差的深度。可針對(duì)每個(gè)最大編碼單元選擇至少一個(gè)編碼深度。
隨著編碼單元根據(jù)深度而被分層地劃分并且編碼單元的數(shù)量增加,最大編碼單元的尺寸被劃分。另外,即使在一個(gè)最大編碼單元中編碼單元與同一深度相應(yīng),也通過分別測(cè)量每個(gè)編碼單元的圖像數(shù)據(jù)的編碼誤差來確定是否將與同一深度相應(yīng)的每個(gè)編碼單元?jiǎng)澐譃楦蜕疃?。因此,即使圖像數(shù)據(jù)被包括在一個(gè)最大編碼單元中,在一個(gè)最大編碼單元中編碼誤差根據(jù)區(qū)域而不同,因此在圖像數(shù)據(jù)中編碼深度可根據(jù)區(qū)域而不同。因此,可在一個(gè)最大編碼單元中確定一個(gè)或更多個(gè)編碼深度,并且可根據(jù)至少一個(gè)編碼深度的編碼單元來對(duì)最大編碼單元的圖像數(shù)據(jù)進(jìn)行劃分。
因此,編碼單元確定器120可確定包括在最大編碼單元中的具有樹結(jié)構(gòu)的編碼單元。根據(jù)本發(fā)明的實(shí)施例的“具有樹結(jié)構(gòu)的編碼單元”包括在最大編碼單元中包括的所有較深層編碼單元中的與確定為編碼深度的深度相應(yīng)的編碼單元??筛鶕?jù)最大編碼單元的相同區(qū)域中的深度來分層地確定編碼深度的編碼單元,并可在不同區(qū)域中獨(dú)立地確定編碼深度的編碼單元。類似地,可從另一區(qū)域的編碼深度獨(dú)立地確定當(dāng)前區(qū)域中的編碼深度。
根據(jù)本發(fā)明的實(shí)施例的最大深度是與從最大編碼單元到最小編碼單元的劃分次數(shù)有關(guān)的索引。根據(jù)本發(fā)明的實(shí)施例的第一最大深度可表示從最大編碼單元到最小編碼單元的總劃分次數(shù)。根據(jù)本發(fā)明實(shí)施例的第二最大深度可表示從最大編碼單元到最小編碼單元的深度等級(jí)的總數(shù)。例如,當(dāng)最大編碼單元的深度是0時(shí),對(duì)最大編碼單元?jiǎng)澐忠淮蔚木幋a單元的深度可被設(shè)置為1,對(duì)最大編碼單元?jiǎng)澐謨纱蔚木幋a單元的深度可被設(shè)置為2。這里,如果最小編碼單元是對(duì)最大編碼單元?jiǎng)澐炙拇蔚木幋a單元,則存在深度0、1、2、3和4的5個(gè)深度等級(jí),并因此第一最大深度可被設(shè)置為4,第二最大深度可被設(shè)置為5。
可根據(jù)最大編碼單元執(zhí)行預(yù)測(cè)編碼和變換。還根據(jù)最大編碼單元,基于根據(jù)等于或小于最大深度的深度的較深層編碼單元來執(zhí)行預(yù)測(cè)編碼和變換。
由于每當(dāng)根據(jù)深度對(duì)最大編碼單元進(jìn)行劃分時(shí),較深層編碼單元的數(shù)量增加,因此對(duì)隨著深度加深而產(chǎn)生的所有較深層編碼單元執(zhí)行包括預(yù)測(cè)編碼和變換的編碼。為了便于描述,在最大編碼單元中,現(xiàn)在將基于當(dāng)前深度的編碼單元來描述預(yù)測(cè)編碼和變換。
視頻編碼設(shè)備100可不同地選擇用于對(duì)圖像數(shù)據(jù)進(jìn)行編碼的數(shù)據(jù)單元的尺寸或形狀。為了對(duì)圖像數(shù)據(jù)進(jìn)行編碼,執(zhí)行諸如預(yù)測(cè)編碼、變換和熵編碼的操作,此時(shí),可針對(duì)所有操作使用相同的數(shù)據(jù)單元,或者可針對(duì)每個(gè)操作使用不同的數(shù)據(jù)單元。
例如,視頻編碼設(shè)備100不僅可選擇用于對(duì)圖像數(shù)據(jù)進(jìn)行編碼的編碼單元,還可選擇不同于編碼單元的數(shù)據(jù)單元,以便對(duì)編碼單元中的圖像數(shù)據(jù)執(zhí)行預(yù)測(cè)編碼。
為了對(duì)最大編碼單元執(zhí)行預(yù)測(cè)編碼,可基于與編碼深度相應(yīng)的編碼單元(即,基于不再被劃分為與更低深度相應(yīng)的編碼單元的編碼單元)來執(zhí)行預(yù)測(cè)編碼。以下,不再被劃分且成為用于預(yù)測(cè)編碼的基本單元的編碼單元現(xiàn)在將被稱為“預(yù)測(cè)單元”。通過劃分預(yù)測(cè)單元獲得的分區(qū)可包括預(yù)測(cè)單元以及通過對(duì)預(yù)測(cè)單元的高度和寬度中的至少一個(gè)進(jìn)行劃分而獲得的數(shù)據(jù)單元。分區(qū)是編碼單元的預(yù)測(cè)單元被劃分的數(shù)據(jù)單元,預(yù)測(cè)單元可以是具有與編碼單元相同尺寸的分區(qū)。
例如,當(dāng)2n×2n(其中,n是正整數(shù))的編碼單元不再被劃分,并且成為2n×2n的預(yù)測(cè)單元時(shí),分區(qū)的尺寸可以是2n×2n、2n×n、n×2n或n×n。分區(qū)類型的示例包括通過對(duì)預(yù)測(cè)單元的高度或?qū)挾冗M(jìn)行對(duì)稱地劃分而獲得的對(duì)稱分區(qū)、通過對(duì)預(yù)測(cè)單元的高度或?qū)挾冗M(jìn)行非對(duì)稱地劃分(諸如,1:n或n:1)而獲得的分區(qū)、通過對(duì)預(yù)測(cè)單元進(jìn)行幾何地劃分而獲得的分區(qū)、以及具有任意形狀的分區(qū)。
預(yù)測(cè)單元的預(yù)測(cè)模式可以是幀內(nèi)模式、幀間模式和跳過模式中的至少一個(gè)。例如,可對(duì)2n×2n、2n×n、n×2n或n×n的分區(qū)執(zhí)行幀內(nèi)模式或幀間模式。另外,可僅對(duì)2n×2n的分區(qū)執(zhí)行跳過模式。可對(duì)編碼單元中的一個(gè)預(yù)測(cè)單元獨(dú)立地執(zhí)行編碼,從而選擇具有最小編碼誤差的預(yù)測(cè)模式。
視頻編碼設(shè)備100不僅可基于用于對(duì)圖像數(shù)據(jù)進(jìn)行編碼的編碼單元還可基于與編碼單元不同的數(shù)據(jù)單元,來對(duì)編碼單元中的圖像數(shù)據(jù)執(zhí)行變換。為了對(duì)編碼單元執(zhí)行變換,可基于具有小于或等于編碼單元的尺寸的數(shù)據(jù)單元,來執(zhí)行變換。例如,用于變換的數(shù)據(jù)單元可包括幀內(nèi)模式的數(shù)據(jù)單元和幀間模式的數(shù)據(jù)單元。
編碼單元中的變換單元可以以與根據(jù)樹結(jié)構(gòu)的編碼單元相似的方式被遞歸地劃分為更小尺寸的區(qū)域。因此,可基于根據(jù)變換深度的具有樹結(jié)構(gòu)的變換單元,對(duì)編碼單元中的殘差數(shù)據(jù)進(jìn)行劃分。
還可在變換單元中設(shè)置變換深度,其中,變換深度表示通過對(duì)編碼單元的高度和寬度進(jìn)行劃分以達(dá)到變換單元的劃分次數(shù)。例如,在2n×2n的當(dāng)前編碼單元中,當(dāng)變換單元的尺寸是2n×2n時(shí),變換深度可以是0,當(dāng)變換單元的尺寸是n×n時(shí),變換深度可以是1,當(dāng)變換單元的尺寸是n/2×n/2時(shí),變換深度可以是2。換言之,還可根據(jù)變換深度設(shè)置具有樹結(jié)構(gòu)的變換單元。
根據(jù)與編碼深度相應(yīng)的編碼單元的編碼信息不僅需要關(guān)于編碼深度的信息,還需要關(guān)于與預(yù)測(cè)編碼和變換相關(guān)的信息的信息。因此,編碼單元確定器120不僅確定具有最小編碼誤差的編碼深度,還確定預(yù)測(cè)單元中的分區(qū)類型、根據(jù)預(yù)測(cè)單元的預(yù)測(cè)模式和用于變換的變換單元的尺寸。
稍后將參照?qǐng)D8至圖18詳細(xì)描述根據(jù)本發(fā)明的實(shí)施例的最大編碼單元中的根據(jù)樹結(jié)構(gòu)的編碼單元,以及確定預(yù)測(cè)單元/分區(qū)和變換單元的方法。
編碼單元確定器120可通過使用基于拉格朗日乘數(shù)的率失真優(yōu)化,來測(cè)量根據(jù)深度的較深層編碼單元的編碼誤差。
輸出單元130在比特流中輸出最大編碼單元的圖像數(shù)據(jù)和關(guān)于根據(jù)編碼深度的編碼模式的信息,其中,所述最大編碼單元的圖像數(shù)據(jù)基于由編碼單元確定器120確定的至少一個(gè)編碼深度被編碼。
可通過對(duì)圖像的殘差數(shù)據(jù)進(jìn)行編碼來獲得編碼圖像數(shù)據(jù)。
關(guān)于根據(jù)編碼深度的編碼模式的信息可包括關(guān)于編碼深度的信息、關(guān)于在預(yù)測(cè)單元中的分區(qū)類型的信息、關(guān)于預(yù)測(cè)模式的信息和關(guān)于變換單元的尺寸的信息。
可通過使用根據(jù)深度的劃分信息來定義關(guān)于編碼深度的信息,其中,根據(jù)深度的劃分信息指示是否對(duì)更低深度而不是當(dāng)前深度的編碼單元執(zhí)行編碼。如果當(dāng)前編碼單元的當(dāng)前深度是編碼深度,則對(duì)當(dāng)前編碼單元中的圖像數(shù)據(jù)進(jìn)行編碼并輸出,因此可定義劃分信息以不將當(dāng)前編碼單元?jiǎng)澐值礁蜕疃???蛇x地,如果當(dāng)前編碼單元的當(dāng)前深度不是編碼深度,則對(duì)更低深度的編碼單元執(zhí)行編碼,并因此可定義劃分信息以對(duì)當(dāng)前編碼單元進(jìn)行劃分來獲得更低深度的編碼單元。
如果當(dāng)前深度不是編碼深度,則對(duì)被劃分到更低深度的編碼單元的編碼單元執(zhí)行編碼。由于更低深度的至少一個(gè)編碼單元存在于當(dāng)前深度的一個(gè)編碼單元中,因此對(duì)更低深度的每個(gè)編碼單元重復(fù)執(zhí)行編碼,并因此可對(duì)具有相同深度的編碼單元遞歸地執(zhí)行編碼。
由于針對(duì)一個(gè)最大編碼單元確定具有樹結(jié)構(gòu)的編碼單元,并且針對(duì)編碼深度的編碼單元確定關(guān)于至少一個(gè)編碼模式的信息,所以可針對(duì)一個(gè)最大編碼單元確定關(guān)于至少一個(gè)編碼模式的信息。另外,由于根據(jù)深度對(duì)圖像數(shù)據(jù)進(jìn)行分層劃分,因此最大編碼單元的圖像數(shù)據(jù)的編碼深度可根據(jù)位置而不同,因此可針對(duì)圖像數(shù)據(jù)設(shè)置關(guān)于編碼深度和編碼模式的信息。
因此,輸出單元130可將關(guān)于相應(yīng)的編碼深度和編碼模式的編碼信息分配給包括在最大編碼單元中的編碼單元、預(yù)測(cè)單元和最小單元中的至少一個(gè)。
根據(jù)本發(fā)明的實(shí)施例的最小單元是通過將構(gòu)成最低深度的最小編碼單元?jiǎng)澐譃?份而獲得的方形數(shù)據(jù)單元。可選擇地,根據(jù)實(shí)施例的最小單元可以是可包括在最大編碼單元中所包括的所有編碼單元、預(yù)測(cè)單元、分區(qū)單元和變換單元中的最大方形數(shù)據(jù)單元。
例如,通過輸出單元130輸出的編碼信息可被分類為根據(jù)較深層編碼單元的編碼信息和根據(jù)預(yù)測(cè)單元的編碼信息。根據(jù)較深層編碼單元的編碼信息可包括關(guān)于預(yù)測(cè)模式的信息和關(guān)于分區(qū)尺寸的信息。根據(jù)預(yù)測(cè)單元的編碼信息可包括關(guān)于幀間模式的估計(jì)方向的信息、關(guān)于幀間模式的參考圖像索引的信息、關(guān)于運(yùn)動(dòng)矢量的信息、關(guān)于幀內(nèi)模式的色度分量的信息、以及關(guān)于幀內(nèi)模式的插值方法的信息。
根據(jù)畫面、條帶或gop定義的關(guān)于編碼單元的最大尺寸的信息和關(guān)于最大深度的信息可被插入到比特流的頭、序列參數(shù)集或畫面參數(shù)集。
還可經(jīng)由比特流的頭、序列參數(shù)集或畫面參數(shù)集輸出關(guān)于針對(duì)當(dāng)前視頻允許的變換單元的最大尺寸的信息和關(guān)于變換單元的最小尺寸的信息。輸出單元130可對(duì)以上參照?qǐng)D1至圖6描述的與預(yù)測(cè)有關(guān)的參考信息、預(yù)測(cè)信息和條帶類型信息進(jìn)行編碼,并輸出這些信息。
在視頻編碼設(shè)備100中,較深層編碼單元可以是通過將更高深度的編碼單元(更高一層)的高度或?qū)挾葎澐殖蓛煞荻@得的編碼單元。換言之,當(dāng)當(dāng)前深度的編碼單元的尺寸是2n×2n時(shí),更低深度的編碼單元的尺寸是n×n。另外,尺寸為2n×2n的具有當(dāng)前深度的編碼單元可包括最多4個(gè)具有更低深度的編碼單元。
因此,視頻編碼設(shè)備100可基于考慮當(dāng)前畫面的特征而確定的最大編碼單元的尺寸和最大深度,通過針對(duì)每個(gè)最大編碼單元確定具有最優(yōu)形狀和最優(yōu)尺寸的編碼單元來形成具有樹結(jié)構(gòu)的編碼單元。另外,由于可通過使用各種預(yù)測(cè)模式和變換中的任意一個(gè)對(duì)每個(gè)最大編碼單元執(zhí)行編碼,因此可考慮各種圖像尺寸的編碼單元的特征來確定最優(yōu)編碼模式。
因此,如果以傳統(tǒng)宏塊對(duì)具有高分辨率或大數(shù)據(jù)量的圖像進(jìn)行編碼,則每個(gè)畫面的宏塊的數(shù)量極度增加。因此,針對(duì)每個(gè)宏塊產(chǎn)生的壓縮信息的條數(shù)增加,因此難以發(fā)送壓縮的信息,并且數(shù)據(jù)壓縮效率降低。然而,通過使用視頻編碼設(shè)備100,由于考慮圖像的尺寸,在增加編碼單元的最大尺寸的同時(shí),基于圖像的特征來調(diào)整編碼單元,因此可增加圖像壓縮效率。
圖6的視頻編碼設(shè)備100可執(zhí)行圖1a的幀間預(yù)測(cè)設(shè)備10或圖4的視頻編碼設(shè)備40的操作。
編碼單元確定器120和輸出單元130可執(zhí)行幀間預(yù)測(cè)設(shè)備10或幀間預(yù)測(cè)單元44的操作。可針對(duì)每個(gè)最大編碼單元,根據(jù)具有樹結(jié)構(gòu)的編碼單元確定用于幀間預(yù)測(cè)的預(yù)測(cè)單元,并且可對(duì)每個(gè)預(yù)測(cè)單元執(zhí)行幀間預(yù)測(cè)。
具體地,當(dāng)長(zhǎng)期參考圖像用于在幀間模式下對(duì)當(dāng)前預(yù)測(cè)單元進(jìn)行幀間預(yù)測(cè)時(shí),長(zhǎng)期參考圖像的poc信息可用作用于識(shí)別存儲(chǔ)在解碼畫面緩沖器中的長(zhǎng)期參考圖像的長(zhǎng)期參考索引。輸出單元130可將長(zhǎng)期參考圖像的poc信息的lsb信息輸出為參考索引。此外,指示將在當(dāng)前條帶中被參考的長(zhǎng)期參考圖像的參考索引可被存儲(chǔ)在條帶頭中。因此,輸出單元130可通過條帶頭發(fā)送作為參考索引的長(zhǎng)期參考圖像的poc信息的lsb信息。
此外,編碼單元確定器120可通過參考存儲(chǔ)在解碼畫面緩沖期中的先前恢復(fù)圖像對(duì)當(dāng)前圖像執(zhí)行運(yùn)動(dòng)補(bǔ)償,以便產(chǎn)生用于對(duì)其他圖像進(jìn)行幀間預(yù)測(cè)的參考圖像。因此,編碼單元確定器120可執(zhí)行參照?qǐng)D5描述的視頻解碼設(shè)備50的操作。
換言之,編碼單元確定器120還可從長(zhǎng)期參考索引讀取poc信息的lsb信息,并通過使用讀取的lsb信息恢復(fù)長(zhǎng)期參考圖像的poc信息,以便選擇用于運(yùn)動(dòng)補(bǔ)償?shù)拈L(zhǎng)期參考圖像。編碼單元確定器120可從存儲(chǔ)在解碼畫面緩沖器中的恢復(fù)圖像之中選擇與恢復(fù)的poc信息相應(yīng)的長(zhǎng)期參考圖像,并基于選擇的長(zhǎng)期參考圖像使用運(yùn)動(dòng)矢量和殘差數(shù)據(jù)來執(zhí)行運(yùn)動(dòng)補(bǔ)償。
由于編碼單元確定器120根據(jù)預(yù)測(cè)單元執(zhí)行運(yùn)動(dòng)補(bǔ)償,因此編碼單元確定器120可從選擇的長(zhǎng)期參考圖像中確定由當(dāng)前預(yù)測(cè)單元的運(yùn)動(dòng)矢量指示的參考預(yù)測(cè)單元,并通過將當(dāng)前預(yù)測(cè)單元的殘差數(shù)據(jù)與確定的參考預(yù)測(cè)單元組合來恢復(fù)當(dāng)前預(yù)測(cè)單元。可通過恢復(fù)預(yù)測(cè)單元來恢復(fù)編碼單元,可通過恢復(fù)編碼單元來恢復(fù)最大編碼單元,并且可通過恢復(fù)最大編碼單元來恢復(fù)圖像。
圖7是根據(jù)本發(fā)明的實(shí)施例的基于具有樹結(jié)構(gòu)的編碼單元的視頻解碼設(shè)備200的框圖。
涉及基于具有樹結(jié)構(gòu)的編碼單元的視頻預(yù)測(cè)的視頻解碼設(shè)備200包括接收器210、圖像數(shù)據(jù)和編碼信息提取器220、圖像數(shù)據(jù)解碼器230。
用于視頻解碼設(shè)備200的解碼操作的各種術(shù)語(yǔ)(諸如編碼單元、深度、預(yù)測(cè)單元、變換單元和關(guān)于各種編碼模式的信息)的定義與參照?qǐng)D6和視頻編碼設(shè)備100描述的定義相同。
接收器210接收和解析編碼視頻的比特流。圖像數(shù)據(jù)和編碼信息提取器220從解析的比特流,針對(duì)每個(gè)編碼單元提取編碼圖像數(shù)據(jù),并將提取的圖像數(shù)據(jù)輸出到圖像數(shù)據(jù)解碼器230,其中,編碼單元具有根據(jù)每個(gè)最大編碼單元的樹結(jié)構(gòu)。圖像數(shù)據(jù)和編碼信息提取器220可從關(guān)于當(dāng)前畫面的頭、序列參數(shù)集或畫面參數(shù)集提取關(guān)于當(dāng)前畫面的編碼單元的最大尺寸的信息。
另外,圖像數(shù)據(jù)和編碼信息提取器220從解析的比特流,根據(jù)每個(gè)最大編碼單元,提取關(guān)于具有樹結(jié)構(gòu)的編碼單元的編碼深度和編碼模式的信息。提取的關(guān)于編碼深度和編碼模式的信息被輸出到圖像數(shù)據(jù)解碼器230。換言之,比特流中的圖像數(shù)據(jù)被劃分為最大編碼單元,使得圖像數(shù)據(jù)解碼器230針對(duì)每個(gè)最大編碼單元對(duì)圖像數(shù)據(jù)進(jìn)行解碼。
可針對(duì)關(guān)于與編碼深度相應(yīng)的至少一個(gè)編碼單元的信息設(shè)置關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信息,關(guān)于編碼模式的信息可包括關(guān)于與編碼深度相應(yīng)的相應(yīng)編碼單元的分區(qū)類型的信息、關(guān)于預(yù)測(cè)模式的信息和關(guān)于變換單元的尺寸的信息。另外,根據(jù)深度的劃分信息可被提取為關(guān)于編碼深度的信息。
關(guān)于由圖像數(shù)據(jù)和編碼信息提取器220提取的根據(jù)每個(gè)最大編碼單元的編碼深度和編碼模式的信息是關(guān)于在以下情況下被確定為產(chǎn)生最小編碼誤差的編碼深度和編碼模式的信息,即,在編碼器(諸如,視頻編碼設(shè)備100)根據(jù)最大編碼單元對(duì)根據(jù)深度的每個(gè)較深層編碼單元重復(fù)地執(zhí)行編碼的時(shí)候。因此,視頻解碼設(shè)備200可通過根據(jù)產(chǎn)生最小編碼誤差的編碼深度和編碼模式對(duì)圖像數(shù)據(jù)進(jìn)行解碼來恢復(fù)圖像。
由于關(guān)于編碼深度和編碼模式的編碼信息可被分配給相應(yīng)的編碼單元、預(yù)測(cè)單元和最小單元中的預(yù)定數(shù)據(jù)單元,因此圖像數(shù)據(jù)和編碼信息提取器220可根據(jù)預(yù)定數(shù)據(jù)單元,提取關(guān)于編碼深度和編碼模式的信息。如果關(guān)于相應(yīng)最大編碼單元的編碼深度和編碼模式的信息根據(jù)預(yù)定數(shù)據(jù)單元被記錄,則可將被分配了相同的關(guān)于編碼深度和編碼模式的信息的預(yù)定數(shù)據(jù)單元推斷為是包括在同一最大編碼單元中的數(shù)據(jù)單元。
圖像數(shù)據(jù)解碼器230基于關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信息,通過對(duì)每個(gè)最大編碼單元中的圖像數(shù)據(jù)進(jìn)行解碼,來恢復(fù)當(dāng)前畫面。換言之,圖像數(shù)據(jù)解碼器230可基于提取出的關(guān)于包括在每個(gè)最大編碼單元中的具有樹結(jié)構(gòu)的編碼單元之中的每個(gè)編碼單元的分區(qū)類型、預(yù)測(cè)模式和變換單元的信息,對(duì)編碼的圖像數(shù)據(jù)進(jìn)行解碼。解碼處理可包括預(yù)測(cè)(包含幀內(nèi)預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償)和逆變換。
圖像數(shù)據(jù)解碼器230可基于關(guān)于根據(jù)編碼深度的編碼單元的預(yù)測(cè)單元的分區(qū)類型和預(yù)測(cè)模式的信息,根據(jù)每個(gè)編碼單元的分區(qū)和預(yù)測(cè)模式,執(zhí)行幀內(nèi)預(yù)測(cè)或運(yùn)動(dòng)補(bǔ)償。
另外,為了對(duì)每個(gè)最大編碼單元執(zhí)行逆變換,圖像數(shù)據(jù)解碼器230可讀取關(guān)于每個(gè)編碼單元的根據(jù)樹結(jié)構(gòu)的變換單元的信息,從而基于每個(gè)編碼單元的變換單元執(zhí)行逆變換。通過逆變換,可恢復(fù)編碼單元的空間域的像素值。
圖像數(shù)據(jù)解碼器230可通過使用根據(jù)深度的劃分信息來確定當(dāng)前最大編碼單元的編碼深度。如果劃分信息指示圖像數(shù)據(jù)在當(dāng)前深度中不再被劃分,則當(dāng)前深度是編碼深度。因此,圖像數(shù)據(jù)解碼器230可通過使用關(guān)于與編碼深度相應(yīng)的每個(gè)編碼單元的預(yù)測(cè)單元的分區(qū)類型、預(yù)測(cè)模式和變換單元的尺寸的信息,對(duì)當(dāng)前最大編碼單元中的編碼數(shù)據(jù)進(jìn)行解碼。
換言之,可通過觀察分配給編碼單元、預(yù)測(cè)單元和最小單元中的預(yù)定數(shù)據(jù)單元的編碼信息集來收集包含包括相同劃分信息的編碼信息的數(shù)據(jù)單元,并且收集的數(shù)據(jù)單元可被認(rèn)為是將由圖像數(shù)據(jù)解碼器230以相同編碼模式進(jìn)行解碼的一個(gè)數(shù)據(jù)單元。因此,可通過獲得關(guān)于每個(gè)編碼單元的編碼模式的信息對(duì)當(dāng)前編碼單元進(jìn)行解碼。
此外,圖7的視頻解碼設(shè)備200的圖像數(shù)據(jù)解碼器230可執(zhí)行圖2a的運(yùn)動(dòng)補(bǔ)償設(shè)備20或圖5的運(yùn)動(dòng)補(bǔ)償單元58的操作。
圖像數(shù)據(jù)和編碼信息提取器220可從接收到的比特流解析長(zhǎng)期參考索引。可從條帶頭解析長(zhǎng)期參考索引。
針對(duì)每個(gè)最大編碼單元,根據(jù)具有樹結(jié)構(gòu)的編碼單元,圖像數(shù)據(jù)解碼器230可確定用于幀間預(yù)測(cè)的預(yù)測(cè)單元,并對(duì)每個(gè)預(yù)測(cè)單元執(zhí)行幀間預(yù)測(cè)。
具體地,圖像數(shù)據(jù)解碼器230可從長(zhǎng)期參考索引讀取長(zhǎng)期參考圖像的poc信息的lsb信息。圖像數(shù)據(jù)解碼器230可通過將長(zhǎng)期參考圖像的poc信息的預(yù)先確定的msb信息和讀取的lsb信息組合來恢復(fù)長(zhǎng)期參考圖像的poc信息。
由于圖像數(shù)據(jù)解碼器230根據(jù)預(yù)測(cè)單元執(zhí)行運(yùn)動(dòng)補(bǔ)償,因此圖像數(shù)據(jù)解碼器230可從長(zhǎng)期參考圖像中確定由當(dāng)前預(yù)測(cè)單元的運(yùn)動(dòng)矢量指示的參考預(yù)測(cè)單元,并通過將當(dāng)前預(yù)測(cè)單元的殘差數(shù)據(jù)與參考預(yù)測(cè)單元組合來恢復(fù)當(dāng)前預(yù)測(cè)單元??赏ㄟ^恢復(fù)預(yù)測(cè)單元來恢復(fù)編碼單元,可通過恢復(fù)編碼單元來恢復(fù)最大編碼單元,并通過恢復(fù)最大編碼單元來恢復(fù)圖像。
因此,視頻解碼設(shè)備200可獲得關(guān)于當(dāng)對(duì)每個(gè)最大編碼單元迭代地執(zhí)行編碼時(shí)產(chǎn)生最小編碼誤差的至少一個(gè)編碼單元的信息,并使用所述信息來對(duì)當(dāng)前畫面進(jìn)行解碼。換言之,可對(duì)在每個(gè)最大編碼單元中被確定為最佳編碼單元的具有樹結(jié)構(gòu)的編碼單元進(jìn)行解碼。
因此,即使圖像數(shù)據(jù)具有高分辨率和大數(shù)據(jù)量,也可通過使用編碼單元的尺寸和編碼模式,對(duì)圖像數(shù)據(jù)進(jìn)行有效地解碼和恢復(fù),其中,通過使用從編碼器接收到的關(guān)于最優(yōu)編碼模式的信息,根據(jù)圖像數(shù)據(jù)的特征自適應(yīng)地確定所述編碼單元的尺寸和編碼模式。
圖8是用于描述根據(jù)本發(fā)明的實(shí)施例的編碼單元的概念的示圖。
編碼單元的尺寸可被表示為寬度×高度,并可以是64×64、32×32、16×16和8×8。64×64的編碼單元可被劃分為64×64、64×32、32×64或32×32的分區(qū),32×32的編碼單元可被劃分為32×32、32×16、16×32或16×16的分區(qū),16×16的編碼單元可被劃分為16×16、16×8、8×16或8×8的分區(qū),8×8的編碼單元可被劃分為8×8、8×4、4×8或4×4的分區(qū)。
在視頻數(shù)據(jù)310中,分辨率是1920×1080,編碼單元的最大尺寸是64,最大深度是2。在視頻數(shù)據(jù)320中,分辨率是1920×1080,編碼單元的最大尺寸是64,最大深度是3。在視頻數(shù)據(jù)330中,分辨率是352×288,編碼單元的最大尺寸是16,最大深度是1。圖8中示出的最大深度表示從最大編碼單元到最小編碼單元的劃分總次數(shù)。
如果分辨率高或數(shù)據(jù)量大,則編碼單元的最大尺寸可能較大,從而不僅提高編碼效率,而且準(zhǔn)確地反映圖像的特征。因此,具有比視頻數(shù)據(jù)330更高分辨率的視頻數(shù)據(jù)310和320的編碼單元的最大尺寸可以是64。
由于視頻數(shù)據(jù)310的最大深度是2,因此由于通過對(duì)最大編碼單元?jiǎng)澐謨纱?,深度加深至兩層,因此視頻數(shù)據(jù)310的編碼單元315可包括長(zhǎng)軸尺寸為64的最大編碼單元和長(zhǎng)軸尺寸為32和16的編碼單元。由于視頻數(shù)據(jù)330的最大深度是1,因此由于通過對(duì)最大編碼單元?jiǎng)澐忠淮?,深度加深至一層,因此視頻數(shù)據(jù)330的編碼單元335可包括長(zhǎng)軸尺寸為16的最大編碼單元和長(zhǎng)軸尺寸為8的編碼單元。
由于視頻數(shù)據(jù)320的最大深度是3,因此由于通過對(duì)最大編碼單元?jiǎng)澐秩?,深度加深?層,因此視頻數(shù)據(jù)320的編碼單元325可包括長(zhǎng)軸尺寸為64的最大編碼單元和長(zhǎng)軸尺寸為32、16和8的編碼單元。隨著深度加深,詳細(xì)信息可被精確地表示。
圖9是根據(jù)本發(fā)明的實(shí)施例的基于編碼單元的圖像編碼器400的框圖。
圖像編碼器400執(zhí)行視頻編碼設(shè)備100的編碼單元確定器120的操作來對(duì)圖像數(shù)據(jù)進(jìn)行編碼。換言之,幀內(nèi)預(yù)測(cè)器410在幀內(nèi)模式下對(duì)當(dāng)前幀405中的編碼單元執(zhí)行幀內(nèi)預(yù)測(cè),運(yùn)動(dòng)估計(jì)器420和運(yùn)動(dòng)補(bǔ)償器425通過使用當(dāng)前幀405和參考幀495,在幀間模式下對(duì)當(dāng)前幀405中的編碼單元分別執(zhí)行幀間預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償。
從幀內(nèi)預(yù)測(cè)器410、運(yùn)動(dòng)估計(jì)器420和運(yùn)動(dòng)補(bǔ)償器425輸出的數(shù)據(jù)通過變換器430和量化器440被輸出為量化后的變換系數(shù)。量化后的變換系數(shù)通過反量化器460和逆變換器470被恢復(fù)為空間域中的數(shù)據(jù),恢復(fù)的空間域中的數(shù)據(jù)在通過去塊單元480和環(huán)路濾波單元490后處理之后被輸出為參考幀495。量化后的變換系數(shù)可通過熵編碼器450被輸出為比特流455。
為了將圖像編碼器400應(yīng)用到視頻編碼設(shè)備100中,圖像編碼器400的所有元件(即,幀內(nèi)預(yù)測(cè)器410、運(yùn)動(dòng)估計(jì)器420、運(yùn)動(dòng)補(bǔ)償器425、變換器430、量化器440、熵編碼器450、反量化器460、逆變換器470、去塊單元480和環(huán)路濾波單元490)在考慮每個(gè)最大編碼單元的最大深度的同時(shí),基于具有樹結(jié)構(gòu)的編碼單元中的每個(gè)編碼單元執(zhí)行操作。
具體地,幀內(nèi)預(yù)測(cè)器410、運(yùn)動(dòng)估計(jì)器420和運(yùn)動(dòng)補(bǔ)償器425在考慮當(dāng)前最大編碼單元的最大尺寸和最大深度的同時(shí),確定具有樹結(jié)構(gòu)的編碼單元中的每個(gè)編碼單元的分區(qū)和預(yù)測(cè)模式,變換器430確定具有樹結(jié)構(gòu)的編碼單元中的每個(gè)編碼單元中的變換單元的尺寸。
具體地,當(dāng)運(yùn)動(dòng)估計(jì)器420使用長(zhǎng)期參考幀執(zhí)行幀間預(yù)測(cè)時(shí),長(zhǎng)期參考幀的poc信息可被輸出為長(zhǎng)期參考索引。熵編碼器450可將長(zhǎng)期參考幀的poc信息到的lsb信息編碼為長(zhǎng)期參考索引,并輸出所述lsb信息。用于當(dāng)前條帶的預(yù)測(cè)單元的長(zhǎng)期參考幀的poc信息的lsb信息可被包括在條帶頭中,然后被發(fā)送。
運(yùn)動(dòng)補(bǔ)償器425還可通過使用從長(zhǎng)期參考索引讀取的poc信息的lsb信息來確定長(zhǎng)期參考幀的poc信息。運(yùn)動(dòng)補(bǔ)償單元425可從存儲(chǔ)在解碼畫面緩沖器中的參考幀中選擇與恢復(fù)的poc信息相應(yīng)的長(zhǎng)期參考幀,并基于選擇的長(zhǎng)期參考幀使用當(dāng)前幀的殘差數(shù)據(jù)和運(yùn)動(dòng)矢量來執(zhí)行運(yùn)動(dòng)補(bǔ)償。
圖10是根據(jù)本發(fā)明的實(shí)施例的基于編碼單元的圖像解碼器500的框圖。
解析器510從比特流505解析將被解碼的編碼圖像數(shù)據(jù)和解碼所需的編碼信息。編碼圖像數(shù)據(jù)通過熵解碼器520和反量化器530被輸出為反量化的數(shù)據(jù),反量化的數(shù)據(jù)通過逆變換器540被恢復(fù)為空間域中的圖像數(shù)據(jù)。
針對(duì)空間域中的圖像數(shù)據(jù),幀內(nèi)預(yù)測(cè)器550在幀內(nèi)模式下對(duì)編碼單元執(zhí)行幀內(nèi)預(yù)測(cè),運(yùn)動(dòng)補(bǔ)償器560通過使用參考幀585在幀間模式下編碼單元執(zhí)行運(yùn)動(dòng)補(bǔ)償。
通過幀內(nèi)預(yù)測(cè)器550和運(yùn)動(dòng)補(bǔ)償器560的空間域中的圖像數(shù)據(jù)可在通過去塊單元570和環(huán)路濾波單元580后處理之后被輸出為恢復(fù)幀595。另外,通過去塊單元570和環(huán)路濾波單元580后處理的圖像數(shù)據(jù)可被輸出為參考幀585。
為了在視頻解碼設(shè)備200的圖像數(shù)據(jù)解碼器230中對(duì)圖像數(shù)據(jù)進(jìn)行解碼,圖像解碼器500可執(zhí)行在解析器510之后執(zhí)行的操作。
為了將圖像解碼器500應(yīng)用到視頻解碼設(shè)備200中,圖像解碼器500的所有元件(即,解析器510、熵解碼器520、反量化器530、逆變換器540、幀內(nèi)預(yù)測(cè)器550、運(yùn)動(dòng)補(bǔ)償器560、去塊單元570和環(huán)路濾波單元580)針對(duì)每個(gè)最大編碼單元,基于具有樹結(jié)構(gòu)的編碼單元執(zhí)行操作。
具體地,幀內(nèi)預(yù)測(cè)器550和運(yùn)動(dòng)補(bǔ)償器560基于具有樹結(jié)構(gòu)的每個(gè)編碼單元的分區(qū)和預(yù)測(cè)模式來執(zhí)行操作,逆變換器540基于每個(gè)編碼單元的變換單元的尺寸來執(zhí)行操作。
具體地,解析器510可從比特流505解析長(zhǎng)期參考索引。可從條帶頭解析用于當(dāng)前條帶的預(yù)測(cè)單元的長(zhǎng)期參考圖像的poc信息的lsb信息。運(yùn)動(dòng)補(bǔ)償器560通過將當(dāng)前長(zhǎng)期參考圖像的poc信息的msb信息和lsb信息組合來恢復(fù)當(dāng)前長(zhǎng)期參考圖像的poc信息,并從存儲(chǔ)在解碼畫面緩沖器中的長(zhǎng)期參考圖像之中確定與恢復(fù)的poc信息相應(yīng)的當(dāng)前長(zhǎng)期參考圖像。運(yùn)動(dòng)補(bǔ)償器560可從當(dāng)前長(zhǎng)期參考圖像中確定由用于當(dāng)前預(yù)測(cè)單元的運(yùn)動(dòng)矢量指示的參考預(yù)測(cè)單元,并通過將參考預(yù)測(cè)單元和當(dāng)前預(yù)測(cè)單元的殘差數(shù)據(jù)組合來恢復(fù)當(dāng)前預(yù)測(cè)單元。
圖11是示出根據(jù)本發(fā)明的實(shí)施例的根據(jù)深度的較深層編碼單元以及分區(qū)的示圖。
視頻編碼設(shè)備100和視頻解碼設(shè)備200使用分層編碼單元以考慮圖像的特征。可根據(jù)圖像的特征自適應(yīng)地確定編碼單元的最大高度、最大寬度和最大深度,或可由用戶不同地設(shè)置編碼單元的最大高度、最大寬度和最大深度??筛鶕?jù)編碼單元的預(yù)定最大尺寸來確定根據(jù)深度的較深層編碼單元的尺寸。
在根據(jù)本發(fā)明的實(shí)施例的編碼單元的分層結(jié)構(gòu)600中,編碼單元的最大高度和最大寬度均是64,最大深度是4。在這種情況下,最大深度表示編碼單元從最大編碼單元被劃分到最小編碼單元的總次數(shù)。由于沿著分層結(jié)構(gòu)600的垂直軸深度加深,因此較深層編碼單元的高度和寬度均被劃分。另外,預(yù)測(cè)單元和分區(qū)沿著分層結(jié)構(gòu)600的水平軸被示出,其中,所述預(yù)測(cè)單元和分區(qū)是對(duì)每個(gè)較深層編碼單元進(jìn)行預(yù)測(cè)編碼的基礎(chǔ)。
換言之,在分層結(jié)構(gòu)600中,編碼單元610是最大編碼單元,其中,深度為0,尺寸(即,高度乘寬度)為64×64。隨著深度沿著垂直軸加深,編碼單元620的尺寸為32×32深度為1,編碼單元630的尺寸為16×16深度為2,編碼單元640的尺寸為8×8深度為3。尺寸為8×8和深度為3的編碼單元640是最小編碼單元。
編碼單元的預(yù)測(cè)單元和分區(qū)根據(jù)每個(gè)深度沿著水平軸被排列。換言之,如果尺寸為64×64和深度為0的編碼單元610是預(yù)測(cè)單元,則可將預(yù)測(cè)單元?jiǎng)澐殖砂ㄔ诰幋a單元610中的分區(qū),即,尺寸為64×64的分區(qū)610、尺寸為64×32的分區(qū)612、尺寸為32×64的分區(qū)614或尺寸為32×32的分區(qū)616。
類似地,可將尺寸為32×32和深度為1的編碼單元620的預(yù)測(cè)單元?jiǎng)澐殖砂ㄔ诰幋a單元620中的分區(qū),即,尺寸為32×32的分區(qū)620、尺寸為32×16的分區(qū)622、尺寸為16×32的分區(qū)624和尺寸為16×16的分區(qū)626。
類似地,可將尺寸為16×16和深度為2的編碼單元630的預(yù)測(cè)單元?jiǎng)澐殖砂ㄔ诰幋a單元630中的分區(qū),即,包括在編碼度單元630中的尺寸為16×16的分區(qū)630、尺寸為16×8的分區(qū)632、尺寸為8×16的分區(qū)634和尺寸為8×8的分區(qū)636。
類似地,可將尺寸為8×8和深度為3的編碼單元640的預(yù)測(cè)單元?jiǎng)澐殖砂ㄔ诰幋a單元640中的分區(qū),即,包括在編碼單元640中的尺寸為8×8的分區(qū)、尺寸為8×4的分區(qū)642、尺寸為4×8的分區(qū)644和尺寸為4×4的分區(qū)646。
為了確定構(gòu)成最大編碼單元610的編碼單元的至少一個(gè)編碼深度,視頻編碼設(shè)備100的編碼單元確定器120對(duì)包括在最大編碼單元610中的與每個(gè)深度相應(yīng)的編碼單元執(zhí)行編碼。
隨著深度加深,包括具有相同范圍和相同尺寸的數(shù)據(jù)的根據(jù)深度的較深層編碼單元的數(shù)量增加。例如,需要四個(gè)與深度2相應(yīng)的編碼單元來覆蓋包括在與深度1相應(yīng)的一個(gè)編碼單元中的數(shù)據(jù)。因此,為了根據(jù)深度比較對(duì)相同數(shù)據(jù)進(jìn)行編碼的結(jié)果,與深度1相應(yīng)的編碼單元和四個(gè)與深度2相應(yīng)的編碼單元均被編碼。
為了針對(duì)深度之中的當(dāng)前深度執(zhí)行編碼,可沿著分層結(jié)構(gòu)600的水平軸,通過對(duì)與當(dāng)前深度相應(yīng)的編碼單元中的每個(gè)預(yù)測(cè)單元執(zhí)行編碼,來針對(duì)當(dāng)前深度選擇最小編碼誤差??蛇x地,隨著深度沿著分層結(jié)構(gòu)600的垂直軸加深,可通過針對(duì)每個(gè)深度執(zhí)行編碼,比較根據(jù)深度的最小編碼誤差,來搜索最小編碼誤差。在編碼單元610中的具有最小編碼誤差的深度和分區(qū)可被選為編碼單元610的編碼深度和分區(qū)類型。
圖12是用于描述根據(jù)本發(fā)明的實(shí)施例的在編碼單元710和變換單元720之間的關(guān)系的示圖。
視頻編碼設(shè)備100或視頻解碼設(shè)備200針對(duì)每個(gè)最大編碼單元,根據(jù)具有小于或等于最大編碼單元的尺寸的編碼單元,對(duì)圖像進(jìn)行編碼或解碼??苫诓淮笥谙鄳?yīng)的編碼單元的數(shù)據(jù)單元,來選擇用于在編碼期間進(jìn)行變換的變換單元的尺寸。
例如,在視頻編碼設(shè)備100或視頻解碼設(shè)備200中,如果編碼單元710的尺寸是64×64,則可通過使用尺寸為32×32的變換單元720來執(zhí)行變換。
此外,可通過對(duì)小于64×64的尺寸為32×32、16×16、8×8和4×4的每個(gè)變換單元執(zhí)行變換,來對(duì)尺寸為64×64的編碼單元710的數(shù)據(jù)進(jìn)行編碼,然后可選擇具有最小編碼誤差的變換單元。
圖13是用于描述根據(jù)本發(fā)明的實(shí)施例的與編碼深度相應(yīng)的編碼單元的編碼信息的示圖。
視頻編碼設(shè)備100的輸出單元130可對(duì)與編碼深度相應(yīng)的每個(gè)編碼單元的關(guān)于分區(qū)類型的信息800、關(guān)于預(yù)測(cè)模式的信息810以及關(guān)于變換單元尺寸的信息820進(jìn)行編碼,并將信息800、信息810和信息820作為關(guān)于編碼模式的信息來發(fā)送。
信息800指示關(guān)于通過劃分當(dāng)前編碼單元的預(yù)測(cè)單元而獲得的分區(qū)的形狀的信息,其中,所述分區(qū)是用于對(duì)當(dāng)前編碼單元進(jìn)行預(yù)測(cè)編碼的數(shù)據(jù)單元。例如,可將尺寸為2n×2n的當(dāng)前編碼單元cu_0劃分成以下分區(qū)中的任意一個(gè):尺寸為2n×2n的分區(qū)802、尺寸為2n×n的分區(qū)804、尺寸為n×2n的分區(qū)806以及尺寸為n×n的分區(qū)808。這里,關(guān)于分區(qū)類型的信息800被設(shè)置來指示尺寸為2n×n的分區(qū)804、尺寸為n×2n的分區(qū)806以及尺寸為n×n的分區(qū)808中的一個(gè)。
信息810指示每個(gè)分區(qū)的預(yù)測(cè)模式。例如,信息810可指示對(duì)由信息800指示的分區(qū)執(zhí)行的預(yù)測(cè)編碼的模式,即,幀內(nèi)模式812、幀間模式814或跳過模式816。
信息820指示當(dāng)對(duì)當(dāng)前編碼單元執(zhí)行變換時(shí)所基于的變換單元。例如,變換單元可以是第一幀內(nèi)變換單元822、第二幀內(nèi)變換單元824、第一幀間變換單元826或第二幀內(nèi)變換單元828。
視頻解碼設(shè)備200的圖像數(shù)據(jù)和編碼信息提取器220可根據(jù)每個(gè)較深層編碼單元,提取并使用用于解碼的信息800、810和820。
圖14是根據(jù)本發(fā)明的實(shí)施例的根據(jù)深度的較深層編碼單元的示圖。
劃分信息可用來指示深度的改變。劃分信息指示當(dāng)前深度的編碼單元是否被劃分成更低深度的編碼單元。
用于對(duì)深度為0和尺寸為2n_0×2n_0的編碼單元900進(jìn)行預(yù)測(cè)編碼的預(yù)測(cè)單元910可包括以下分區(qū)類型的分區(qū):尺寸為2n_0×2n_0的分區(qū)類型912、尺寸為2n_0×n_0的分區(qū)類型914、尺寸為n_0×2n_0的分區(qū)類型916和尺寸為n_0×n_0的分區(qū)類型918。圖14僅示出了通過對(duì)稱地劃分預(yù)測(cè)單元910而獲得的分區(qū)類型912至918,但是分區(qū)類型不限于此,并且預(yù)測(cè)單元910的分區(qū)可包括非對(duì)稱分區(qū)、具有預(yù)定形狀的分區(qū)和具有幾何形狀的分區(qū)。
根據(jù)每種分區(qū)類型,對(duì)尺寸為2n_0×2n_0的一個(gè)分區(qū)、尺寸為2n_0×n_0的兩個(gè)分區(qū)、尺寸為n_0×2n_0的兩個(gè)分區(qū)和尺寸為n_0×n_0的四個(gè)分區(qū)重復(fù)地執(zhí)行預(yù)測(cè)編碼??蓪?duì)尺寸為2n_0×2n_0、n_0×2n_0、2n_0×n_0和n_0×n_0的分區(qū)執(zhí)行幀內(nèi)模式和幀間模式下的預(yù)測(cè)編碼??蓛H對(duì)尺寸為2n_0×2n_0的分區(qū)執(zhí)行跳過模式下的預(yù)測(cè)編碼。
如果在分區(qū)類型912至916中的一個(gè)分區(qū)類型中編碼誤差最小,則可不將預(yù)測(cè)單元910劃分到更低深度。
如果在分區(qū)類型918中編碼誤差最小,則深度從0改變到1以在操作920中劃分分區(qū)類型918,并對(duì)深度為2和尺寸為n_0×n_0的編碼單元930重復(fù)地執(zhí)行編碼來搜索最小編碼誤差。
用于對(duì)深度為1和尺寸為2n_1×2n_1(=n_0×n_0)的編碼單元930進(jìn)行預(yù)測(cè)編碼的預(yù)測(cè)單元940可包括以下分區(qū)類型的分區(qū):尺寸為2n_1×2n_1的分區(qū)類型942、尺寸為2n_1×n_1的分區(qū)類型944、尺寸為n_1×2n_1的分區(qū)類型946以及尺寸為n_1×n_1的分區(qū)類型948。
如果在分區(qū)類型948中編碼誤差最小,則深度從1改變到2以在操作950中劃分分區(qū)類型948,并對(duì)深度為2和尺寸為n_2×n_2的編碼單元960重復(fù)執(zhí)行編碼來搜索最小編碼誤差。
當(dāng)最大深度是d時(shí),根據(jù)每個(gè)深度的劃分操作可被執(zhí)行直到深度變成d-1,并且劃分信息可被編碼直到深度是0到d-2中的一個(gè)。換句話說,當(dāng)編碼被執(zhí)行直到在與d-2的深度相應(yīng)的編碼單元在操作970中被劃分之后深度是d-1時(shí),用于對(duì)深度為d-1和尺寸為2n_(d-1)×2n_(d-1)的編碼單元980進(jìn)行預(yù)測(cè)編碼的預(yù)測(cè)單元990可包括以下分區(qū)類型的分區(qū):尺寸為2n_(d-1)×2n(d-1)的分區(qū)類型992、尺寸為2n_(d-1)×n(d-1)的分區(qū)類型994、尺寸為n_(d-1)×2n(d-1)的分區(qū)類型996和尺寸為n_(d-1)×n(d-1)的分區(qū)類型998。
可對(duì)分區(qū)類型992至998中的尺寸為2n_(d-1)×2n_(d-1)的一個(gè)分區(qū)、尺寸為2n_(d-1)×n_(d-1)的兩個(gè)分區(qū)、尺寸為n_(d-1)×2n_(d-1)的兩個(gè)分區(qū)、尺寸為n_(d-1)×n_(d-1)的四個(gè)分區(qū)重復(fù)地執(zhí)行預(yù)測(cè)編碼,以搜索具有最小編碼誤差的分區(qū)類型。
即使當(dāng)分區(qū)類型998具有最小編碼誤差時(shí),由于最大深度是d,因此深度為d-1的編碼單元cu_(d-1)也不再被劃分到更低深度,構(gòu)成當(dāng)前最大編碼單元900的編碼單元的編碼深度被確定為d-1,并且當(dāng)前最大編碼單元900的分區(qū)類型可被確定為n_(d-1)×n(d-1)。此外,由于最大深度是d,并且具有最低深度d-1的最小編碼單元980不再被劃分到更低深度,因此不設(shè)置最小編碼單元980的劃分信息。
數(shù)據(jù)單元999可以是用于當(dāng)前最大編碼單元的“最小單元”。根據(jù)本發(fā)明的實(shí)施例的最小單元可以是通過將最小編碼單元980劃分成4份而獲得的方形數(shù)據(jù)單元。通過重復(fù)地執(zhí)行編碼,視頻編碼設(shè)備100可通過比較根據(jù)編碼單元900的深度的編碼誤差來選擇具有最小編碼誤差的深度以確定編碼深度,并將相應(yīng)分區(qū)類型和預(yù)測(cè)模式設(shè)置為編碼深度的編碼模式。
這樣,在所有深度1至d中對(duì)根據(jù)深度的最小編碼誤差進(jìn)行比較,并且具有最小編碼誤差的深度可被確定為編碼深度。編碼深度、預(yù)測(cè)單元的分區(qū)類型和預(yù)測(cè)模式可作為關(guān)于編碼模式的信息被編碼并發(fā)送。另外,由于編碼單元從0的深度被劃分到編碼深度,因此僅編碼深度的劃分信息被設(shè)置為0,并且除了編碼深度以外的深度的劃分信息被設(shè)置為1。
視頻解碼設(shè)備200的圖像數(shù)據(jù)和編碼信息提取器220可提取并使用關(guān)于編碼單元900的編碼深度和預(yù)測(cè)單元的信息,來對(duì)分區(qū)912進(jìn)行解碼。視頻解碼設(shè)備200可通過使用根據(jù)深度的劃分信息,將劃分信息為0的深度確定為編碼深度,并且使用關(guān)于相應(yīng)深度的編碼模式的信息來進(jìn)行解碼。
圖15至圖17是用于描述根據(jù)本發(fā)明的實(shí)施例的編碼單元1010、預(yù)測(cè)單元1060和變換單元1070之間的關(guān)系的示圖。
編碼單元1010是最大編碼單元中的與由視頻編碼設(shè)備100確定的編碼深度相應(yīng)的具有樹結(jié)構(gòu)的編碼單元。預(yù)測(cè)單元1060是每個(gè)編碼單元1010中的預(yù)測(cè)單元的分區(qū),變換單元1070是每個(gè)編碼單元1010的變換單元。
當(dāng)在編碼單元1010中最大編碼單元的深度是0時(shí),編碼單元1012和編碼單元1054的深度是1,編碼單元1014、1016、1018、1028、1050和1052的深度是2,編碼單元1020、1022、1024、1026、1030、1032和1048的深度是3,編碼單元1040、1042、1044和1046的深度是4。
在預(yù)測(cè)單元1060中,通過劃分編碼單元1010中的編碼單元來獲得一些編碼單元1014、1016、1022、1032、1048、1050、1052和1054。換句話說,編碼單元1014、1022、1050和1054中的分區(qū)類型的尺寸是2n×n,編碼單元1016、1048和1052中的分區(qū)類型的尺寸是n×2n,編碼單元1032的分區(qū)類型的尺寸就n×n。編碼單元1010的預(yù)測(cè)單元和分區(qū)小于或等于每個(gè)編碼單元。
在小于編碼單元1052的數(shù)據(jù)單元中的變換單元1070中,對(duì)編碼單元1052的圖像數(shù)據(jù)執(zhí)行變換或逆變換。另外,在尺寸和形狀方面,變換單元1070中的編碼單元1014、1016、1022、1032、1048、1050和1052不同于預(yù)測(cè)單元1060中的編碼單元1014、1016、1022、1032、1048、1050和1052。換句話說,視頻編碼設(shè)備100和視頻解碼設(shè)備200可對(duì)同一編碼單元中的數(shù)據(jù)單元獨(dú)立地執(zhí)行幀內(nèi)預(yù)測(cè)、運(yùn)動(dòng)估計(jì)、運(yùn)動(dòng)補(bǔ)償、變換和逆變換。
因此,對(duì)最大編碼單元的每個(gè)區(qū)域中的具有分層結(jié)構(gòu)的每個(gè)編碼單元遞歸地執(zhí)行編碼來確定最優(yōu)編碼單元,從而可獲得具有遞歸樹結(jié)構(gòu)的編碼單元。編碼信息可包括關(guān)于編碼單元的劃分信息、關(guān)于分區(qū)類型的信息、關(guān)于預(yù)測(cè)模式的信息和關(guān)于變換單元的尺寸的信息。表1示出可由視頻編碼設(shè)備100和視頻解碼設(shè)備200設(shè)置的編碼信息。
[表1]
視頻編碼設(shè)備100的輸出單元130可輸出關(guān)于具有樹結(jié)構(gòu)的編碼單元的編碼信息,視頻解碼設(shè)備200的圖像數(shù)據(jù)和編碼信息提取器220可從接收到的比特流提取關(guān)于具有樹結(jié)構(gòu)的編碼單元的編碼信息。
劃分信息指示是否將當(dāng)前編碼單元?jiǎng)澐殖筛蜕疃鹊木幋a單元。如果當(dāng)前深度d的劃分信息是0,則當(dāng)前編碼單元不再被劃分成更低深度的深度是編碼深度,從而可針對(duì)所述編碼深度來定義關(guān)于分區(qū)類型、預(yù)測(cè)模式和變換單元的尺寸的信息。如果當(dāng)前編碼單元根據(jù)劃分信息被進(jìn)一步劃分,則對(duì)更低深度的四個(gè)劃分編碼單元獨(dú)立地執(zhí)行編碼。
預(yù)測(cè)模式可以是幀內(nèi)模式、幀間模式和跳過模式中的一種??舍槍?duì)所有分區(qū)類型定義幀內(nèi)模式和幀間模式,僅針對(duì)尺寸為2n×2n的分區(qū)類型定義跳過模式。
關(guān)于分區(qū)類型的信息可指示通過對(duì)稱地劃分預(yù)測(cè)單元的高度或?qū)挾榷@得的尺寸為2n×2n、2n×n、n×2n和n×n的對(duì)稱分區(qū)類型,以及通過非對(duì)稱地劃分預(yù)測(cè)單元的高度或?qū)挾榷@得的尺寸為2n×nu、2n×nd、nl×2n和nr×2n的非對(duì)稱分區(qū)類型??赏ㄟ^按1:3和3:1來劃分預(yù)測(cè)單元的高度來分別獲得尺寸為2n×nu和2n×nd的非對(duì)稱分區(qū)類型,可通過按1:3和3:1來劃分預(yù)測(cè)單元的寬度來分別獲得尺寸為nl×2n和nr×2n的非對(duì)稱分區(qū)類型。
可將變換單元的尺寸設(shè)置成幀內(nèi)模式下的兩種類型和幀間模式下的兩種類型。換句話說,如果變換單元的劃分信息是0,則變換單元的尺寸可以是2n×2n,即當(dāng)前編碼單元的尺寸。如果變換單元的劃分信息是1,則可通過對(duì)當(dāng)前編碼單元進(jìn)行劃分來獲得變換單元。另外,如果尺寸為2n×2n的當(dāng)前編碼單元的分區(qū)類型是對(duì)稱分區(qū)類型時(shí),則變換單元的尺寸可以是n×n,如果當(dāng)前編碼單元的分區(qū)類型是非對(duì)稱分區(qū)類型,則變換單元的尺寸可以是n/2×n/2。
關(guān)于具有樹結(jié)構(gòu)的編碼單元的編碼信息可包括與編碼深度相應(yīng)的編碼單元、預(yù)測(cè)單元和最小單元中的至少一個(gè)。與編碼深度相應(yīng)的編碼單元可包括包含相同編碼信息的預(yù)測(cè)單元和最小單元中的至少一個(gè)。
因此,通過比較鄰近數(shù)據(jù)單元的編碼信息來確定鄰近數(shù)據(jù)單元是否被包括在與編碼深度相應(yīng)的同一編碼單元中。另外,通過使用數(shù)據(jù)單元的編碼信息來確定與編碼深度相應(yīng)的相應(yīng)編碼單元,并因此可確定最大編碼單元中的編碼深度的分布。
因此,如果基于鄰近數(shù)據(jù)單元的編碼信息來對(duì)當(dāng)前編碼單元進(jìn)行預(yù)測(cè),則可直接參考并使用與當(dāng)前編碼單元鄰近的較深層編碼單元中的數(shù)據(jù)單元的編碼信息。
可選地,如果基于鄰近數(shù)據(jù)單元的編碼信息來對(duì)當(dāng)前編碼單元進(jìn)行預(yù)測(cè),則使用數(shù)據(jù)單元的編碼信息來搜索與當(dāng)前編碼單元鄰近的數(shù)據(jù)單元,并可參考搜索到的鄰近編碼單元以對(duì)當(dāng)前編碼單元進(jìn)行預(yù)測(cè)。
圖18是用于描述根據(jù)表1的編碼模式信息的編碼單元、預(yù)測(cè)單元和變換單元之間的關(guān)系的示圖。
最大編碼單元1300包括多個(gè)編碼深度的編碼單元1302、1304、1306、1312、1314、1316和1318。這里,由于編碼單元1318是一個(gè)編碼深度的編碼單元,因此劃分信息可以被設(shè)置成0??蓪㈥P(guān)于尺寸為2n×2n的編碼單元1318的分區(qū)類型的信息設(shè)置成以下分區(qū)類型中的一種:尺寸為2n×2n的分區(qū)類型1322、尺寸為2n×n的分區(qū)類型1324、尺寸為n×2n的分區(qū)類型1326、尺寸為n×n的分區(qū)類型1328、尺寸為2n×nu的分區(qū)類型1332、尺寸為2n×nd的分區(qū)類型1334、尺寸為nl×2n的分區(qū)類型1336以及尺寸為nr×2n的分區(qū)類型1338。
變換單元的劃分信息(tu尺寸標(biāo)記)是一類變換索引。與變換索引相應(yīng)的變換單元的尺寸可根據(jù)編碼單元的預(yù)測(cè)單元類型或分區(qū)類型而改變。
例如,當(dāng)分區(qū)類型被設(shè)置成對(duì)稱(即,分區(qū)類型1322、1324、1326或1328)時(shí),如果變換單元的tu尺寸標(biāo)記是0,則設(shè)置尺寸為2n×2n的變換單元1342,如果tu尺寸標(biāo)記是1,則設(shè)置尺寸為n×n的變換單元1344。
當(dāng)分區(qū)類型被設(shè)置成非對(duì)稱(例如,分區(qū)類型1332、1334、1336或1338)時(shí),如果tu尺寸標(biāo)記是0,則設(shè)置尺寸為2n×2n的變換單元1352,如果tu尺寸標(biāo)記是1,則設(shè)置尺寸為n/2×n/2的變換單元1354。
參照?qǐng)D18,tu尺寸標(biāo)記是具有值0或1的標(biāo)記,但是tu尺寸標(biāo)記不限于1比特,在tu尺寸標(biāo)記從0增加的同時(shí),變換單元可被分層劃分以具有樹結(jié)構(gòu)。變換單元的劃分信息(tu尺寸標(biāo)記)可以是變換索引的示例。
在這種情況下,根據(jù)本發(fā)明的實(shí)施例,可通過使用變換單元的tu尺寸標(biāo)記以及變換單元的最大尺寸和最小尺寸來表示實(shí)際上已使用的變換單元的尺寸。視頻編碼設(shè)備100能夠?qū)ψ畲笞儞Q單元尺寸信息、最小變換單元尺寸信息和最大tu尺寸標(biāo)記進(jìn)行編碼。對(duì)最大變換單元尺寸信息、最小變換單元尺寸信息和最大tu尺寸標(biāo)記進(jìn)行編碼的結(jié)果可被插入sps。視頻解碼設(shè)備200可通過使用最大變換單元尺寸信息、最小變換單元尺寸信息和最大tu尺寸標(biāo)記來對(duì)視頻進(jìn)行解碼。
例如,(a)如果當(dāng)前編碼單元的尺寸是64×64并且最大變換單元尺寸是32×32,則(a-1)當(dāng)tu尺寸標(biāo)記為0時(shí),變換單元的尺寸可以是32×32,(a-2)當(dāng)tu尺寸標(biāo)記為1時(shí),變換單元的尺寸可以是16×16,(a-3)當(dāng)tu尺寸標(biāo)記為2時(shí),變換單元的尺寸可以是8×8。
作為另一示例,(b)如果當(dāng)前編碼單元的尺寸是32×32并且最小變換單元尺寸是32×32,則(b-1)當(dāng)tu尺寸標(biāo)記為0時(shí),變換單元的尺寸可以是32×32。這里,由于變換單元的尺寸不能夠小于32×32,因此tu尺寸標(biāo)記不能夠被設(shè)置為除了0以外的值。
作為另一示例,(c)如果當(dāng)前編碼單元的尺寸是64×64并且最大tu尺寸標(biāo)記為1,則tu尺寸標(biāo)記可以是0或1。這里,tu尺寸標(biāo)記不能夠被設(shè)置為除了0或1以外的值。
因此,當(dāng)tu尺寸標(biāo)記為0時(shí),如果定義最大tu尺寸標(biāo)記為“maxtransformsizeindex”,最小變換單元尺寸為“mintransformsize”,變換單元尺寸為“roottusize”,則可通過等式(1)來定義可在當(dāng)前編碼單元中確定的當(dāng)前最小變換單元尺寸“currmintusize”:
currmintusize=max(mintransformsize,roottusize/(2^maxtransformsizeindex))…(1)
與可在當(dāng)前編碼單元中確定的當(dāng)前最小變換單元尺寸“currmintusize”相比,當(dāng)tu尺寸標(biāo)記為0時(shí),變換單元尺寸“roottusize”可指示可在系統(tǒng)中選擇的最大變換單元尺寸。在等式(1)中,“roottusize/(2∧maxtransformsizeindex)”指示當(dāng)tu尺寸標(biāo)記為0時(shí),變換單元尺寸“roottusize”被劃分了與最大tu尺寸標(biāo)記相應(yīng)的次數(shù)時(shí)的變換單元尺寸,“mintransformsize”指示最小變換尺寸。因此,“roottusize/(2^maxtransformsizeindex)”和“mintransformsize”中較小的值可以是可在當(dāng)前編碼單元中確定的當(dāng)前最小變換單元尺寸“currmintusize”。
根據(jù)本發(fā)明的實(shí)施例,最大變換單元尺寸roottusize可根據(jù)預(yù)測(cè)模式的類型而改變。
例如,如果當(dāng)前預(yù)測(cè)模式是幀間模式,則可通過使用以下的等式(2)來確定“roottusize”。在等式(2)中,“maxtransformsize”指示最大變換單元尺寸,“pusize”指示當(dāng)前預(yù)測(cè)單元尺寸。
roottusize=min(maxtransformsize,pusize)……(2)
也就是說,如果當(dāng)前預(yù)測(cè)模式是幀間模式,則當(dāng)tu尺寸標(biāo)記為0時(shí)的變換單元尺寸“roottusize”可以是最大變換單元尺寸和當(dāng)前預(yù)測(cè)單元尺寸中較小的值。
如果當(dāng)前分區(qū)單元的預(yù)測(cè)模式是幀內(nèi)模式,則可通過使用以下的等式(3)來確定“roottusize”。在等式(3)中,“partitionsize”指示當(dāng)前分區(qū)單元的尺寸:
roottusize=min(maxtransformsize,partitionsize)……(3)
也就是說,如果當(dāng)前預(yù)測(cè)模式是幀內(nèi)模式,則當(dāng)tu尺寸標(biāo)記為0時(shí)的變換單元尺寸“roottusize”可以是最大變換單元尺寸和當(dāng)前分區(qū)單元的尺寸之中較小的值。
然而,根據(jù)分區(qū)單元中的預(yù)測(cè)模式的類型而改變的當(dāng)前最大變換單元尺寸“roottusize”僅是示例,本發(fā)明不限于此。
根據(jù)如上參照?qǐng)D6至圖18描述的基于具有樹結(jié)構(gòu)的編碼單元的視頻編碼方法,針對(duì)樹結(jié)構(gòu)的每個(gè)編碼單元對(duì)空間域的圖像數(shù)據(jù)進(jìn)行編碼。根據(jù)基于具有樹結(jié)構(gòu)的編碼單元的視頻解碼方法,針對(duì)每個(gè)最大編碼單元執(zhí)行解碼以恢復(fù)空間域的圖像數(shù)據(jù)。因此,可恢復(fù)畫面和視頻(即,畫面序列)?;謴?fù)后的視頻可通過再現(xiàn)設(shè)備被再現(xiàn),可被存儲(chǔ)在存儲(chǔ)介質(zhì)中,或者可通過網(wǎng)絡(luò)被發(fā)送。
根據(jù)本發(fā)明的實(shí)施例可被編寫為計(jì)算機(jī)程序,并可在使用計(jì)算機(jī)可讀記錄介質(zhì)執(zhí)行程序的通用數(shù)字計(jì)算機(jī)中被實(shí)現(xiàn)。計(jì)算機(jī)可讀記錄介質(zhì)的示例包括磁存儲(chǔ)介質(zhì)(例如,rom、軟盤、硬盤等)和光記錄介質(zhì)(例如,cd-rom或dvd)。
雖然已參照本發(fā)明的示例性實(shí)施例具體示出并描述了本發(fā)明,但是本領(lǐng)域的普通技術(shù)人員將理解,在不脫離根據(jù)由權(quán)利要求限定的本發(fā)明的精神和范圍的情況下,可在示例性實(shí)施例中做出形式和細(xì)節(jié)上的各種改變。
由于用于實(shí)現(xiàn)參照?qǐng)D1至圖18描述的幀間預(yù)測(cè)方法、運(yùn)動(dòng)補(bǔ)償方法、視頻編碼方法和視頻解碼方法的程序可被存儲(chǔ)在計(jì)算機(jī)可讀記錄介質(zhì)中,因此獨(dú)立的計(jì)算機(jī)系統(tǒng)可根據(jù)存儲(chǔ)在計(jì)算機(jī)可讀記錄介質(zhì)中的所述程序容易地實(shí)現(xiàn)操作。
為了便于解釋,參照?qǐng)D1至圖18描述的幀間預(yù)測(cè)方法和視頻編碼方法將被統(tǒng)稱為“根據(jù)本發(fā)明的視頻編碼方法”。另外,參照?qǐng)D1至圖18描述的運(yùn)動(dòng)補(bǔ)償方法和視頻解碼方法將被稱為“根據(jù)本發(fā)明的視頻解碼方法”。
此外,已參照?qǐng)D1至圖18描述的視頻編碼設(shè)備(包括幀間預(yù)測(cè)設(shè)備10、視頻編碼設(shè)備40、視頻編碼設(shè)備100或圖像編碼器400)將被稱為“根據(jù)本發(fā)明的視頻編碼設(shè)備”。另外,已參照?qǐng)D1至圖18描述的視頻解碼設(shè)備(包括運(yùn)動(dòng)補(bǔ)償設(shè)備20、視頻解碼設(shè)備50、視頻解碼設(shè)備200或圖像解碼器500)將被稱為“根據(jù)本發(fā)明的視頻解碼設(shè)備”。
現(xiàn)在將詳細(xì)描述根據(jù)本發(fā)明的實(shí)施例的存儲(chǔ)程序的計(jì)算機(jī)可讀記錄介質(zhì)(例如,盤26000)。
圖19是根據(jù)本發(fā)明的實(shí)施例的存儲(chǔ)程序的盤26000的物理結(jié)構(gòu)的示圖。作為存儲(chǔ)介質(zhì)的盤26000可以是硬盤驅(qū)動(dòng)器、致密盤只讀存儲(chǔ)器(cd-rom)盤、藍(lán)光盤或數(shù)字多功能盤(dvd)。盤26000包括多個(gè)同心磁道tf,每個(gè)同心磁道tf沿盤26000的圓周方向被劃分成特定數(shù)量的扇區(qū)se。在盤26000的特定區(qū)域中,可分配并存儲(chǔ)執(zhí)行以上所描述的幀間預(yù)測(cè)方法、運(yùn)動(dòng)補(bǔ)償方法、視頻編碼方法和視頻解碼方法的程序。
現(xiàn)在將參照?qǐng)D20來描述使用存儲(chǔ)以下程序的存儲(chǔ)介質(zhì)來實(shí)現(xiàn)的計(jì)算機(jī)系統(tǒng),其中,所述程序用于執(zhí)行如上所述的視頻編碼方法和視頻解碼方法。
圖20是通過使用盤26000來記錄并讀取程序的盤驅(qū)動(dòng)器26800的示圖。計(jì)算機(jī)系統(tǒng)26700可經(jīng)由盤驅(qū)動(dòng)器26800將執(zhí)行根據(jù)本發(fā)明的實(shí)施例的視頻編碼方法和視頻解碼方法中的至少一個(gè)的程序存儲(chǔ)在盤26000中。為了在計(jì)算機(jī)系統(tǒng)26700中運(yùn)行存儲(chǔ)在盤26000中的程序,可通過使用盤驅(qū)動(dòng)器26800從盤26000讀取程序并將程序發(fā)送到計(jì)算機(jī)系統(tǒng)26700。
執(zhí)行根據(jù)本發(fā)明的實(shí)施例的視頻編碼方法和視頻解碼方法中的至少一個(gè)的程序不僅可被存儲(chǔ)在圖19或圖20中示出的盤26000中,還可被存儲(chǔ)在存儲(chǔ)卡、rom卡帶或固態(tài)驅(qū)動(dòng)器(ssd)中。
以下將描述應(yīng)用以上所描述的視頻編碼方法和視頻解碼方法的系統(tǒng)。
圖21是用于提供內(nèi)容分布服務(wù)的內(nèi)容供應(yīng)系統(tǒng)11000的整體結(jié)構(gòu)的示圖。將通信系統(tǒng)的服務(wù)區(qū)域劃分成預(yù)定大小的小區(qū),并將無線基站11700、11800、11900和12000分別安裝在這些小區(qū)中。
內(nèi)容供應(yīng)系統(tǒng)11000包括多個(gè)獨(dú)立裝置。例如,諸如計(jì)算機(jī)12100、個(gè)人數(shù)字助理(pda)12200、視頻相機(jī)12300和移動(dòng)電話12500的多個(gè)獨(dú)立裝置經(jīng)由互聯(lián)網(wǎng)服務(wù)提供商11200、通信網(wǎng)絡(luò)11400和無線基站11700、11800、11900和12000連接到互聯(lián)網(wǎng)11100。
然而,內(nèi)容供應(yīng)系統(tǒng)11000不限于如圖21中所示,并且裝置可選擇性地被連接到內(nèi)容供應(yīng)系統(tǒng)11000。多個(gè)獨(dú)立裝置可不經(jīng)由無線基站11700、11800、11900和12000而直接連接到通信網(wǎng)絡(luò)11400。
視頻相機(jī)12300是能夠捕捉視頻圖像的成像裝置,例如,數(shù)字視頻相機(jī)。移動(dòng)電話12500可利用各種協(xié)議(例如,個(gè)人數(shù)字通信(pdc)、碼分多址(cdma)、寬帶碼分多址(w-cdma)、全球移動(dòng)通信系統(tǒng)(gsm)和個(gè)人手持電話系統(tǒng)(phs))中的至少一種通信方法。
視頻相機(jī)12300可經(jīng)由無線基站11900和通信網(wǎng)絡(luò)11400連接到流服務(wù)器11300。流服務(wù)器11300允許經(jīng)由視頻相機(jī)12300從用戶接收到的內(nèi)容經(jīng)由實(shí)時(shí)廣播被流傳輸。可使用視頻相機(jī)12300或流服務(wù)器11300來對(duì)從視頻相機(jī)12300接收到的內(nèi)容進(jìn)行編碼。通過視頻相機(jī)12300捕捉到的視頻數(shù)據(jù)可經(jīng)由計(jì)算機(jī)12100被發(fā)送到流服務(wù)器11300。
通過相機(jī)12600捕捉到的視頻數(shù)據(jù)也可經(jīng)由計(jì)算機(jī)12100被發(fā)送到流服務(wù)器11300。與數(shù)碼相機(jī)類似,相機(jī)12600是能夠捕捉靜止圖像和視頻圖像兩者的成像裝置。可使用相機(jī)12600或計(jì)算機(jī)12100對(duì)通過相機(jī)12600捕捉到的視頻數(shù)據(jù)進(jìn)行編碼??蓪?duì)視頻執(zhí)行編碼和解碼的軟件存儲(chǔ)在可由計(jì)算機(jī)12100訪問的計(jì)算機(jī)可讀記錄介質(zhì)(例如,cd-rom盤、軟盤、硬盤驅(qū)動(dòng)器、ssd或存儲(chǔ)卡)中。
如果視頻數(shù)據(jù)通過內(nèi)置在移動(dòng)電話12500中的相機(jī)被捕捉到,則可從移動(dòng)電話12500接收視頻數(shù)據(jù)。
還可通過安裝在視頻相機(jī)12300、移動(dòng)電話12500或相機(jī)12600中的大規(guī)模集成電路(lsi)系統(tǒng)來對(duì)視頻數(shù)據(jù)進(jìn)行編碼。
內(nèi)容供應(yīng)系統(tǒng)1100可對(duì)由用戶使用視頻相機(jī)12300、相機(jī)12600、移動(dòng)電話12500或另一成像裝置所記錄的內(nèi)容數(shù)據(jù)(例如,在音樂會(huì)期間記錄的內(nèi)容)進(jìn)行編碼,并將編碼后的內(nèi)容數(shù)據(jù)發(fā)送到流服務(wù)器11300。流服務(wù)器11300可將編碼后的內(nèi)容數(shù)據(jù)以流內(nèi)容的形式發(fā)送到請(qǐng)求內(nèi)容數(shù)據(jù)的其它客戶端。
客戶端是能夠?qū)幋a后的內(nèi)容數(shù)據(jù)進(jìn)行解碼的裝置,例如,計(jì)算機(jī)12100、pda12200、視頻相機(jī)12300或移動(dòng)電話12500。因此,內(nèi)容供應(yīng)系統(tǒng)11000允許客戶端接收并再現(xiàn)編碼后的內(nèi)容數(shù)據(jù)。此外,內(nèi)容供應(yīng)系統(tǒng)11000允許客戶端實(shí)時(shí)接收編碼后的內(nèi)容數(shù)據(jù)并對(duì)編碼后的內(nèi)容數(shù)據(jù)進(jìn)行解碼和再現(xiàn),從而能夠進(jìn)行個(gè)人廣播。
包括在內(nèi)容供應(yīng)系統(tǒng)11000中的多個(gè)獨(dú)立裝置的編碼和解碼操作可類似于根據(jù)本發(fā)明的實(shí)施例的視頻編碼設(shè)備和視頻解碼設(shè)備的編碼和解碼操作。
現(xiàn)在將參照?qǐng)D22和圖23更加詳細(xì)地描述包括在根據(jù)本發(fā)明的實(shí)施例的內(nèi)容供應(yīng)系統(tǒng)11000中的移動(dòng)電話12500。
圖22示出根據(jù)本發(fā)明的實(shí)施例的應(yīng)用視頻編碼方法和視頻解碼方法的移動(dòng)電話12500的外部結(jié)構(gòu)。移動(dòng)電話12500可以是智能電話,所述智能電話的功能不受限,并且所述智能電話的大多數(shù)功能可被改變或擴(kuò)展。
移動(dòng)電話12500包括可與圖21的無線基站12000交換射頻(rf)信號(hào)的內(nèi)部天線12510,并包括用于顯示由相機(jī)12530捕捉到的圖像或經(jīng)由天線12510接收到的和解碼的圖像的顯示屏12520(例如,液晶顯示器(lcd)或有機(jī)發(fā)光二極管(oled)屏幕)。智能手機(jī)12500包括操作面板12540,操作面板12540包含有控制按鈕和觸摸面板。如果顯示屏12520是觸摸屏,則操作面板12540還包括顯示屏12520的觸摸感測(cè)面板。移動(dòng)電話12500包括用于輸出語(yǔ)音和聲音的揚(yáng)聲器12580或另一類型聲音輸出單元、以及用于輸入語(yǔ)音和聲音的麥克風(fēng)12550或另一類型聲音輸入單元。移動(dòng)電話12500還包括用于捕捉視頻和靜止圖像的相機(jī)12530,諸如電荷耦合器件(ccd)相機(jī)。移動(dòng)電話12500還可包括:存儲(chǔ)介質(zhì)12570,用于存儲(chǔ)通過相機(jī)12530捕捉到的、經(jīng)由電子郵件接收到的、或根據(jù)各種方式獲得的編碼/解碼數(shù)據(jù)(例如,視頻或靜止圖像);插槽12560,存儲(chǔ)介質(zhì)12570經(jīng)由插槽12560被裝入移動(dòng)電話12500中。存儲(chǔ)介質(zhì)12570可以是閃存,例如,包括在塑料殼中的安全數(shù)字(sd)卡或電可擦和可編程只讀存儲(chǔ)器(eeprom)。
圖23示出根據(jù)本發(fā)明的實(shí)施例的移動(dòng)電話12500的內(nèi)部結(jié)構(gòu)。為了系統(tǒng)地控制包括顯示屏12520和操作面板12540的移動(dòng)電話12500的部件,供電電路12700、操作輸入控制器12640、圖像編碼單元12720、相機(jī)接口12630、lcd控制器12620、圖像解碼單元12690、復(fù)用器/解復(fù)用器12680、記錄/讀取單元12670、調(diào)制/解調(diào)單元12660以及聲音處理器12650經(jīng)由同步總線12730被連接到中央控制器12710。
如果用戶操作電源按鈕,并從“電源關(guān)閉”狀態(tài)設(shè)置為“電源開啟”狀態(tài),則供電電路12700從電池組向移動(dòng)電話12500的所有部件供電,從而將移動(dòng)電話12500設(shè)置為操作模式。
中央控制器12710包括中央處理單元(cpu)、rom和ram。
在移動(dòng)電話12500將通信數(shù)據(jù)發(fā)送到外部的同時(shí),在中央控制器12710的控制下,由移動(dòng)電話12500產(chǎn)生數(shù)字信號(hào)。例如,聲音處理器12650可產(chǎn)生數(shù)字聲音信號(hào),圖像編碼單元12720可產(chǎn)生數(shù)字圖像信號(hào),并且消息的文本數(shù)據(jù)可經(jīng)由操作面板12540和操作輸入控制器12640被產(chǎn)生。當(dāng)在中央控制器12710的控制下數(shù)字信號(hào)被傳送到調(diào)制/解調(diào)單元12660時(shí),調(diào)制/解調(diào)單元12660對(duì)數(shù)字信號(hào)的頻帶進(jìn)行調(diào)制,并且通信電路12610對(duì)頻帶調(diào)制數(shù)字聲音信號(hào)執(zhí)行數(shù)模轉(zhuǎn)換(dac)和頻率轉(zhuǎn)換。從通信電路12610輸出的發(fā)送信號(hào)可經(jīng)由天線12510被發(fā)送到語(yǔ)音通信基站或無線基站12000。
例如,當(dāng)移動(dòng)電話12500處于通話模式時(shí),在中央控制器12710的控制下,經(jīng)由麥克風(fēng)12550獲得的聲音信號(hào)通過聲音處理器12650被變換成數(shù)字聲音信號(hào)。數(shù)字聲音信號(hào)可經(jīng)由調(diào)制/解調(diào)單元12660和通信電路12610被變換成發(fā)送信號(hào),并可經(jīng)由天線12510被發(fā)送。
當(dāng)文本消息(例如,電子郵件)在數(shù)據(jù)通信模式下被發(fā)送時(shí),文本消息的文本數(shù)據(jù)經(jīng)由操作面板12540被輸入,并經(jīng)由操作輸入控制器12640被發(fā)送到中央控制器12710。在中央控制器12710的控制下,文本數(shù)據(jù)經(jīng)由調(diào)制/解調(diào)單元12660和通信電路12610被變換成發(fā)送信號(hào),并經(jīng)由天線12510被發(fā)送到無線基站12000。
為了在數(shù)據(jù)通信模式下發(fā)送圖像數(shù)據(jù),由相機(jī)12530捕捉到的圖像數(shù)據(jù)經(jīng)由相機(jī)接口12630被提供給圖像編碼單元12720。捕捉到的圖像數(shù)據(jù)可經(jīng)由相機(jī)接口12630和lcd控制器12620被直接顯示在顯示屏12520上。
圖像編碼單元12720的結(jié)構(gòu)可與以上描述的視頻編碼設(shè)備100的結(jié)構(gòu)相應(yīng)。圖像編碼單元12720可根據(jù)由以上描述的視頻編碼設(shè)備100或圖像編碼器400所使用的視頻編碼方法,將從相機(jī)12530接收到的圖像數(shù)據(jù)變換為壓縮和編碼后的圖像數(shù)據(jù),并然后將編碼后的圖像數(shù)據(jù)輸出到復(fù)用器/解復(fù)用器12680。在相機(jī)12530的記錄操作期間,由移動(dòng)電話12500的麥克風(fēng)12550獲得的聲音信號(hào)可經(jīng)由聲音處理器12650被變換成數(shù)字聲音數(shù)據(jù),并且數(shù)字聲音數(shù)據(jù)可被傳送到復(fù)用器/解復(fù)用器12680。
復(fù)用器/解復(fù)用器12680對(duì)從圖像編碼單元12720接收到的編碼后的圖像數(shù)據(jù)與從聲音處理器12650接收到的聲音數(shù)據(jù)一起進(jìn)行復(fù)用。對(duì)數(shù)據(jù)進(jìn)行復(fù)用的結(jié)果可經(jīng)由調(diào)制/解調(diào)單元12660和通信電路12610被變換成發(fā)送信號(hào),然后可經(jīng)由天線12510被發(fā)送。
當(dāng)移動(dòng)電話12500從外部接收通信數(shù)據(jù)時(shí),可對(duì)經(jīng)由天線12510接收到的信號(hào)執(zhí)行頻率恢復(fù)和adc以將信號(hào)變換成數(shù)字信號(hào)。調(diào)制/解調(diào)單元12660對(duì)數(shù)字信號(hào)的頻帶進(jìn)行調(diào)制。根據(jù)頻帶調(diào)制后的數(shù)字信號(hào)的類型,將所述數(shù)字信號(hào)發(fā)送到視頻解碼單元12690、聲音處理器12650或lcd控制器12620。
在通話模式下,移動(dòng)電話12500對(duì)經(jīng)由天線12510接收到的信號(hào)進(jìn)行放大,并通過對(duì)放大后的信號(hào)執(zhí)行頻率轉(zhuǎn)換和adc來獲得數(shù)字聲音信號(hào)。在中央控制器12710的控制下,接收到的數(shù)字聲音信號(hào)經(jīng)由調(diào)制/解調(diào)單元12660和聲音處理器12650被變換成模擬聲音信號(hào),并且模擬聲音信號(hào)經(jīng)由揚(yáng)聲器12580被輸出。
當(dāng)在數(shù)據(jù)通信模式下時(shí),接收在互聯(lián)網(wǎng)網(wǎng)站上訪問的視頻文件的數(shù)據(jù),經(jīng)由調(diào)制/解調(diào)單元12660將經(jīng)由天線12510從無線基站12000接收到的信號(hào)輸出為復(fù)用數(shù)據(jù),并將復(fù)用數(shù)據(jù)發(fā)送到復(fù)用器/解復(fù)用器12680。
為了對(duì)經(jīng)由天線12510接收到的復(fù)用數(shù)據(jù)進(jìn)行解碼,復(fù)用器/解復(fù)用器12680將復(fù)用數(shù)據(jù)解復(fù)用成編碼后的視頻數(shù)據(jù)流和編碼后的音頻數(shù)據(jù)流。經(jīng)由同步總線12730,編碼后的視頻數(shù)據(jù)流和編碼后的音頻數(shù)據(jù)流分別被提供給視頻解碼單元12690和聲音處理器12650。
圖像解碼單元12690的結(jié)構(gòu)可與以上描述的視頻解碼設(shè)備200的結(jié)構(gòu)相應(yīng)。圖像解碼單元12690可根據(jù)由以上描述的視頻解碼設(shè)備200或圖像解碼器500所使用的視頻解碼方法,對(duì)編碼后的視頻數(shù)據(jù)進(jìn)行解碼來獲得恢復(fù)后的視頻數(shù)據(jù),并經(jīng)由lcd控制器12620將恢復(fù)后的視頻數(shù)據(jù)提供給顯示屏12520。
因此,可將在互聯(lián)網(wǎng)網(wǎng)站上訪問的視頻文件的數(shù)據(jù)顯示在顯示屏12520上。同時(shí),聲音處理器12650可將音頻數(shù)據(jù)變換成模擬聲音信號(hào),并將模擬聲音信號(hào)提供給揚(yáng)聲器12580。因此,也可經(jīng)由揚(yáng)聲器12580再現(xiàn)在互聯(lián)網(wǎng)網(wǎng)站上訪問的視頻文件中包含的音頻數(shù)據(jù)。
移動(dòng)電話12500或另一類型的通信終端可以是包括根據(jù)本發(fā)明的實(shí)施例的視頻編碼設(shè)備和視頻解碼設(shè)備兩者的收發(fā)終端,可以是僅包括視頻編碼設(shè)備的收發(fā)終端,或者可以是僅包括視頻解碼設(shè)備的收發(fā)終端。
根據(jù)本發(fā)明的通信系統(tǒng)不限于以上參照?qǐng)D21描述的通信系統(tǒng)。例如,圖24示出根據(jù)本發(fā)明的實(shí)施例的采用通信系統(tǒng)的數(shù)字廣播系統(tǒng)。圖24的數(shù)字廣播系統(tǒng)可通過使用根據(jù)本發(fā)明的實(shí)施例的視頻編碼設(shè)備和視頻解碼設(shè)備來接收經(jīng)由衛(wèi)星或地面網(wǎng)絡(luò)發(fā)送的數(shù)字廣播。
具體地,廣播站12890通過使用無線電波將視頻數(shù)據(jù)流發(fā)送到通信衛(wèi)星或廣播衛(wèi)星12900。廣播衛(wèi)星12900發(fā)送廣播信號(hào),廣播信號(hào)經(jīng)由家用天線12860被發(fā)送到衛(wèi)星廣播接收器。在每個(gè)房屋中,可通過tv接收器12810、機(jī)頂盒12870或另一裝置對(duì)編碼后的視頻流進(jìn)行解碼并再現(xiàn)。
當(dāng)根據(jù)本發(fā)明的實(shí)施例的視頻解碼設(shè)備被實(shí)現(xiàn)在再現(xiàn)設(shè)備12830中時(shí),再現(xiàn)設(shè)備12830可對(duì)記錄在存儲(chǔ)介質(zhì)12820(諸如用于恢復(fù)數(shù)字信號(hào)的盤或存儲(chǔ)卡)上的編碼后的視頻流進(jìn)行解析和解碼。因此,可在例如監(jiān)視器12840上再現(xiàn)恢復(fù)后的視頻信號(hào)。
在被連接到用于衛(wèi)星/地面廣播的天線12860或用于接收有線電視(tv)廣播的線纜天線12850的機(jī)頂盒12870中,可安裝根據(jù)本發(fā)明的實(shí)施例的視頻解碼設(shè)備。從機(jī)頂盒12870輸出的數(shù)據(jù)也可被再現(xiàn)在tv監(jiān)視器12880上。
如另一示例,可將根據(jù)本發(fā)明的實(shí)施例的視頻解碼設(shè)備安裝在tv接收器12810中,而不是機(jī)頂盒12870中。
具有適當(dāng)天線12910的汽車12920可接收從圖21的衛(wèi)星12900或無線基站11700發(fā)送的信號(hào)。可在安裝在汽車12920中的汽車導(dǎo)航系統(tǒng)12930的顯示屏上再現(xiàn)解碼后的視頻。
視頻信號(hào)可由根據(jù)本發(fā)明的實(shí)施例的視頻編碼設(shè)備來編碼,然后可被存儲(chǔ)在存儲(chǔ)介質(zhì)中。具體地,可由dvd記錄器將圖像信號(hào)存儲(chǔ)在dvd盤12960中,或可由硬盤記錄器12950將圖像信號(hào)存儲(chǔ)在硬盤中。如另一示例,可將視頻信號(hào)存儲(chǔ)在sd卡12970中。如果硬盤記錄器12950包括根據(jù)本發(fā)明的實(shí)施例的視頻解碼設(shè)備,則記錄在dvd盤12960、sd卡12970或另一存儲(chǔ)介質(zhì)上的視頻信號(hào)可被再現(xiàn)在tv監(jiān)視器12880上。
汽車導(dǎo)航系統(tǒng)12930可不包括圖23的相機(jī)12530、相機(jī)接口12630和圖像編碼單元12720。例如,計(jì)算機(jī)12100和tv接收器12810可不包括在圖23的相機(jī)12530、相機(jī)接口12630和圖像編碼單元12720中。
圖25是示出根據(jù)本發(fā)明的實(shí)施例的使用視頻編碼設(shè)備和視頻解碼設(shè)備的云計(jì)算系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)的示圖。
云計(jì)算系統(tǒng)可包括云計(jì)算服務(wù)器14000、用戶數(shù)據(jù)庫(kù)(db)14100、多個(gè)計(jì)算資源14200和用戶終端。
響應(yīng)于來自用戶終端的請(qǐng)求,云計(jì)算系統(tǒng)經(jīng)由數(shù)據(jù)通信網(wǎng)絡(luò)(例如,互聯(lián)網(wǎng))提供多個(gè)計(jì)算資源14200的點(diǎn)播外包服務(wù)。在云計(jì)算環(huán)境下,服務(wù)提供商通過使用虛擬技術(shù)組合位于不同的物理位置的數(shù)據(jù)中心處的計(jì)算資源,來為用戶提供想要的服務(wù)。服務(wù)用戶不必將計(jì)算資源(例如,應(yīng)用、存儲(chǔ)器、操作系統(tǒng)(os)和安全)安裝在他/她擁有的終端中以使用它們,但可在想要的時(shí)間點(diǎn)在通過虛擬技術(shù)產(chǎn)生的虛擬空間中從服務(wù)中選擇和使用想要的服務(wù)。
被指定的服務(wù)用戶的用戶終端經(jīng)由包括互聯(lián)網(wǎng)和移動(dòng)通信網(wǎng)絡(luò)的數(shù)據(jù)通信網(wǎng)絡(luò)被連接到云計(jì)算服務(wù)器14000??蓮脑朴?jì)算服務(wù)器14000向用戶終端提供云計(jì)算服務(wù),特別是視頻再現(xiàn)服務(wù)。用戶終端可以是能夠被連接到互聯(lián)網(wǎng)的各種類型的電子裝置,例如,桌上型pc14300、智能tv14400、智能電話14500、筆記本計(jì)算機(jī)14600、便攜式多媒體播放器(pmp)14700、平板pc14800等。
云計(jì)算服務(wù)器14000可組合分布在云網(wǎng)絡(luò)中的多個(gè)計(jì)算資源14200,并向用戶終端提供組合的結(jié)果。所述多個(gè)計(jì)算資源14200可包括各種數(shù)據(jù)服務(wù),并可包括從用戶終端上載的數(shù)據(jù)。如上所描述的,云計(jì)算服務(wù)器14000可通過根據(jù)虛擬技術(shù)組合分布在不同區(qū)域中的視頻數(shù)據(jù)庫(kù)來向用戶終端提供想要的服務(wù)。
將關(guān)于已經(jīng)訂購(gòu)云計(jì)算服務(wù)的用戶的用戶信息存儲(chǔ)在用戶db14100中。用戶信息可包括用戶的注冊(cè)信息、地址、姓名和個(gè)人信用信息。用戶信息還可包括視頻的索引。這里,所述索引可包括已經(jīng)被再現(xiàn)的視頻的列表、正在被再現(xiàn)的視頻的列表,之前被再現(xiàn)的視頻的暫停點(diǎn)等。
可在用戶裝置之間共享存儲(chǔ)在用戶db14100中的關(guān)于視頻的信息。例如,當(dāng)響應(yīng)于來自筆記本計(jì)算機(jī)14600的請(qǐng)求將視頻服務(wù)提供給筆記本計(jì)算機(jī)14600時(shí),視頻服務(wù)的再現(xiàn)歷史被存儲(chǔ)在用戶db14100中。當(dāng)從智能電話14500接收到用于再現(xiàn)此視頻服務(wù)的請(qǐng)求時(shí),云計(jì)算服務(wù)器14000基于用戶db14100搜索并再現(xiàn)此視頻服務(wù)。當(dāng)智能電話14500從云計(jì)算服務(wù)器14000接收到視頻數(shù)據(jù)流時(shí),通過對(duì)視頻數(shù)據(jù)流進(jìn)行解碼來再現(xiàn)視頻的處理與以上參照?qǐng)D22和圖23描述的移動(dòng)電話12500的操作類似。
云計(jì)算服務(wù)器14000可參考存儲(chǔ)在用戶db14100中的想要的視頻服務(wù)的再現(xiàn)歷史。例如,云計(jì)算服務(wù)器14000從用戶終端接收用于再現(xiàn)存儲(chǔ)在用戶db14100中的視頻的請(qǐng)求。如果此視頻之前被再現(xiàn)過,則由云計(jì)算服務(wù)器14000執(zhí)行的對(duì)此視頻進(jìn)行流傳輸?shù)姆椒筛鶕?jù)來自用戶終端的請(qǐng)求(即,根據(jù)是將從視頻的起點(diǎn)還是視頻的暫停點(diǎn)來再現(xiàn)視頻)而不同。例如,如果用戶終端請(qǐng)求從視頻的起點(diǎn)開始再現(xiàn)視頻,則云計(jì)算服務(wù)器14000將從視頻的第一幀開始的視頻的流數(shù)據(jù)發(fā)送到用戶終端。如果用戶終端請(qǐng)求從視頻的暫停點(diǎn)開始再現(xiàn)視頻,則云計(jì)算服務(wù)器14000將從與暫停點(diǎn)相應(yīng)的幀開始的視頻的流數(shù)據(jù)發(fā)送到用戶終端。
在此情況下,用戶終端可包括如以上參照?qǐng)D1至圖18描述的視頻解碼設(shè)備。如另一示例,用戶終端可包括如以上參照?qǐng)D1至圖18描述的視頻編碼設(shè)備??蛇x地,用戶終端可包括如以上參照?qǐng)D1至圖18描述的視頻解碼設(shè)備和視頻編碼設(shè)備兩者。
以上已經(jīng)參照?qǐng)D19至圖25描述了以上參照?qǐng)D1至圖18描述的根據(jù)本發(fā)明的實(shí)施例的視頻編碼方法、視頻解碼方法、視頻編碼設(shè)備和視頻解碼設(shè)備的各種應(yīng)用。然而,根據(jù)本發(fā)明的各種實(shí)施例的將視頻編碼方法和視頻解碼方法存儲(chǔ)在存儲(chǔ)介質(zhì)中的方法,或者將視頻編碼設(shè)備和視頻解碼設(shè)備實(shí)現(xiàn)在裝置中的方法不限于以上參照?qǐng)D19至圖25描述的實(shí)施例。