利用小波變換的視頻編碼方法

文檔序號(hào)：7514886閱讀：227來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>電子電路裝置的制造及其應(yīng)用技術(shù)

專(zhuān)利名稱(chēng)：利用小波變換的視頻編碼方法
技術(shù)領(lǐng)域：
本發(fā)明涉及用于壓縮分成幀或幀組的視頻序列的編碼方法，該幀或幀組通過(guò)小波變換分解，該小波變換導(dǎo)出對(duì)應(yīng)于所述變換分解等級(jí)的給定的連續(xù)分辨率等級(jí)數(shù)，所述編碼方法根據(jù)稱(chēng)為“用分級(jí)樹(shù)分割集合”(SPIHT)的分級(jí)子頻帶編碼處理、并且從視頻序列的原始像素集合導(dǎo)出用二進(jìn)制格式編碼的小波變換系數(shù)；所述系數(shù)成樹(shù)形組織并且按次序排列成對(duì)應(yīng)于各重要性等級(jí)的分集；所述分集通過(guò)振幅測(cè)試來(lái)定義，該振幅測(cè)試促成“重要性”信息劃分成三個(gè)有序表非重要集合表(LIS)、非重要像素表(LIP)、重要像素表(LSP)；進(jìn)行所述測(cè)試以便隨著分劃處理將所述原始像素集合分解成所述分集，直至所述二進(jìn)制表示中每個(gè)重要系數(shù)都被編碼。
可認(rèn)為傳統(tǒng)視頻壓縮方案包括四大模塊運(yùn)動(dòng)估計(jì)和補(bǔ)償、系數(shù)變換(例如，離散余弦變換或小波分解)、系數(shù)量化和編碼、以及平均信息編碼。當(dāng)一視頻編碼器可升級(jí)時(shí)，這意味著它須能從低比特率到高比特率編碼圖像，以隨比特率增加提高視頻信號(hào)質(zhì)量。小波分解的變換方法自然提供圖像的分級(jí)顯示，顯然比傳統(tǒng)的離散余弦變換(DCT)更適合于可升級(jí)的方案。
小波分解允許原始輸入信號(hào)由子頻帶信號(hào)集合描述。每個(gè)子頻帶實(shí)際上代表給定分辨率等級(jí)的、一定頻率范圍內(nèi)的原始信號(hào)。通常采用一套一維濾波器組將圖像分解成互不關(guān)聯(lián)的子頻帶，該濾波器組先濾波當(dāng)前圖像行，再濾波濾波后的圖像列。該操作的例子描述見(jiàn)S.S.Goh著的“圖像的小波分解置換”，Signal Processing，卷44，No.1，1995年6月，27頁(yè)至38頁(yè)。實(shí)際采用兩個(gè)濾波器------低通和高通濾波器來(lái)分離圖像的低頻和高頻。首先對(duì)圖像行進(jìn)行該操作，再用因數(shù)2進(jìn)行二次抽樣操作，接著對(duì)二次抽樣后的圖像列進(jìn)行該操作，再用因數(shù)2對(duì)取得的圖像進(jìn)行下降抽樣。這樣就取得4個(gè)比原圖像小4倍的圖像一個(gè)低頻子圖像(或“平滑圖像”)，它包括相關(guān)的原始圖像的初始內(nèi)容的主要部分，因此顯示了所述圖像的近似性；三個(gè)高頻子圖像，它們僅包括所述原始圖像的水平、垂直及對(duì)角細(xì)節(jié)。該分解處理過(guò)程一直持續(xù)到顯然不再有有用信息從上一平滑圖像中導(dǎo)出。
有一種采用二維(2D)小波分解的計(jì)算上更為簡(jiǎn)單的圖像壓縮技術(shù)，描述見(jiàn)A.Said和W.A.Pearlman著的“基于分級(jí)樹(shù)分割集合(SPIHT)的新型、快速而有效的圖像編解碼器”，IEEE Transactions on Circuitsand Systems for Video Technology，卷6，No.3，1996年6月，第243頁(yè)至250頁(yè)。如所述文件中解釋的，原始圖像可用一組像素值p(x，y)定義(其中x和y是像素坐標(biāo))，并通過(guò)分級(jí)子頻帶變換編碼，表示為以下公式(1)c(x，y)＝Ω(p(x，y))(1)其中，Ω表示變換，而每個(gè)元素c(x，y)稱(chēng)為“像素坐標(biāo)(x，y)的轉(zhuǎn)換系數(shù)”。
主要目的是選最重要的信息先發(fā)送，這樣就可使這些變換系數(shù)按照它們的振幅排序(具備大振幅的系數(shù)包含較多信息內(nèi)容，應(yīng)優(yōu)先發(fā)送，或至少將它們的最高有效位先發(fā)送)。如果該排序信息以顯式的方式發(fā)送給解碼器，那么發(fā)送相對(duì)小部分的像素坐標(biāo)，便可恢復(fù)較好質(zhì)量的圖像。如果該排序信息未能以顯式的方式發(fā)送，那么可設(shè)想該編碼算法的執(zhí)行路徑由關(guān)于其分支點(diǎn)的比較結(jié)果定義，并且采用同樣分類(lèi)算法的解碼器如果收到該振幅比較結(jié)果便能復(fù)制該編碼器的這一執(zhí)行路徑。然后可從該執(zhí)行路徑中恢復(fù)該排序信息。
所述排序算法中重要一點(diǎn)是不必對(duì)所有系數(shù)排序，只需排如2n≤|cx，y|＜2n+1(n按每個(gè)通道遞減)的系數(shù)。給定n，如果|cx，y|≥2n(n稱(chēng)為重要性等級(jí))，那么某系數(shù)便是重要系數(shù)；否則就不重要。該排序算法將像素集合分成分隔子集Tm并執(zhí)行振幅測(cè)試(2)max(x,y)&Element;Tm{|cx,y|}&GreaterEqual;2n ---(2)]]>如果解碼器收到信息“否”(所有相關(guān)子集不重要)，就知子集Tm的系數(shù)不重要。如果答案是“是”(所述子集是重要的)，那么編碼器和解碼器所分享的預(yù)定規(guī)則用于將Tm分成新子集Tm，∈，重要性測(cè)試?yán)^續(xù)用于這些新子集。該集合分割處理一直持續(xù)到對(duì)所有單坐標(biāo)重要子集都進(jìn)行了振幅測(cè)試，以便標(biāo)示每一個(gè)重要系數(shù)，并允許對(duì)其進(jìn)行二進(jìn)制編碼。
為減少發(fā)送的振幅比較(即、關(guān)于信息位)的次數(shù)，可定義集合分割規(guī)則，它采用子頻帶金字塔所定義的期待的分級(jí)排序。目的是要?jiǎng)?chuàng)建新的分割使認(rèn)為不重要的分集包含大量元素，而使認(rèn)為重要的分集只包含一個(gè)元素。為弄清楚振幅比較與信息位之間的關(guān)系，可采用以下公式來(lái)表示坐標(biāo)子集T的重要性。
另外，曾觀察到子頻帶間存在空間自相似性。若沿同樣空間方向在金字塔上向下移，可期望系數(shù)有更好的振幅排序。例如，如果期望低活動(dòng)率區(qū)在金字塔最高等級(jí)上標(biāo)示出，那么它們會(huì)以較低級(jí)別復(fù)制在相同空間位置，但具備更高分辨率。稱(chēng)為空間定向樹(shù)的樹(shù)結(jié)構(gòu)自然定義小波分解的分級(jí)子頻帶金字塔的空間關(guān)系。

圖1顯示出在由遞歸的4-子頻帶分割構(gòu)成的金字塔中如何定義空間定向樹(shù)。樹(shù)的每個(gè)節(jié)點(diǎn)或者沒(méi)有子節(jié)點(diǎn)(葉)或者有4子節(jié)點(diǎn)(其常形成2×2相鄰像素組)，它們由此與有相同空間指向的像素相對(duì)應(yīng)。圖1中，箭頭從母節(jié)點(diǎn)指向其子節(jié)點(diǎn)。金字塔最高級(jí)別的像素是樹(shù)的根部，并且按2×2相鄰像素進(jìn)行分組。然而，它們的子節(jié)點(diǎn)分支規(guī)則是不同的，并且每一組中，它們中間的一個(gè)(圖1中以墨點(diǎn)表示)沒(méi)有后代。
以下坐標(biāo)集合用以表示該編碼方法，(x，y)表示系數(shù)位置O(x，y)節(jié)點(diǎn)(x，y)的所有子節(jié)點(diǎn)的坐標(biāo)集合；D(x，y)節(jié)點(diǎn)(x，y)的所有后代節(jié)點(diǎn)的坐標(biāo)集合；H所有空間定向樹(shù)根(金字塔最高級(jí)別節(jié)點(diǎn))的坐標(biāo)集合；L(x，y)＝D(x，y)-O(x，y)。
正如所觀察到的，測(cè)試子集重要性等級(jí)所遵循的順序是重要的，實(shí)際操作時(shí)“重要性”信息存儲(chǔ)在三個(gè)有序表中，稱(chēng)為非重要集合表(LIS)、非重要像素表(LIP)、重要像素表(LSP)。所有這些表中，每個(gè)條目都由坐標(biāo)(x，y)標(biāo)識(shí)，在LIP和LSP中該坐標(biāo)表示各個(gè)像素，在LIS中或者表示集合D(x，y)或者表示集合L(x，y)(稱(chēng)表示D(x，y)的LIS條目為A類(lèi)，表示L(x，y)的為B類(lèi)，以示區(qū)別)。SPIHT算法實(shí)際上是以操縱LIS、LIP和LSP三個(gè)表為基礎(chǔ)的。
對(duì)于平均信息編碼模塊來(lái)說(shuō)，算術(shù)編碼技術(shù)比Huffmann編碼對(duì)視頻壓縮更有效，因?yàn)槿〉玫拇a長(zhǎng)非常接近于最佳長(zhǎng)度，該方法尤其適用于自適應(yīng)模塊(高速評(píng)估源統(tǒng)計(jì)數(shù)字)，并且可分為兩個(gè)獨(dú)立的模塊(建模模塊和編碼模塊)。下面主要介紹建模模塊，包括某些源串操作(source-string)事件及其上下文的確定，和估計(jì)相關(guān)統(tǒng)計(jì)數(shù)字的方法。
上下文用來(lái)捕捉相關(guān)的整個(gè)源串操作集合的冗余。在原始視頻序列中，像素值實(shí)際上取決于其周?chē)南袼刂?。小波分解后，所有子頻帶仍保持同樣的“地理”互依性。如果系數(shù)發(fā)送的順序保持著這種互依性，那么就有可能利用有界記憶樹(shù)源的通用編碼框架中的“地理”信息，例子描述見(jiàn)M.J.Weinberger等的《通用有限記憶源》，IEEE Transactions on Information Theory，卷41，No.3，1995年5月，643頁(yè)至652頁(yè)。有限記憶樹(shù)源有這樣的特點(diǎn)，即下一符號(hào)概率取決于最近符號(hào)的實(shí)際值。有限記憶樹(shù)源的二進(jìn)制順序通用源編碼處理經(jīng)常采用上下文樹(shù)，在給定考慮的上下文的情況下它包括每個(gè)串(上下文)中0和1出現(xiàn)的次數(shù)。在給定d個(gè)先前的比特的情況下，該樹(shù)允許估計(jì)符號(hào)概率^P(Xn|xn-1···xn-d)，其中，xn是所檢查的比特值，xn-1···xn-d表示上下文，即先前的比特序列。當(dāng)條件事件因上下文稀度問(wèn)題或模型成本而增多時(shí)，評(píng)估任務(wù)會(huì)比較艱巨。
解決這一問(wèn)題，一個(gè)辦法是上下文樹(shù)加權(quán)，詳見(jiàn)F.M.J.Willems等的《上下文樹(shù)加權(quán)方法基本特性》，IEEE Transactions on InformationTheory，卷41，No.3，1995年5月，653頁(yè)至664頁(yè)。該法的主旨是采用所檢查的比特的最有效上下文估計(jì)來(lái)加權(quán)概率。實(shí)際上，有時(shí)采用更短的上下文來(lái)對(duì)某比特位編碼(如果上下文中后面的比特位對(duì)當(dāng)前比特位沒(méi)有影響，可以不予考慮)會(huì)更有效。該技術(shù)縮短了最終碼長(zhǎng)。因此在算術(shù)編碼中，有效模型和上下文的確定是關(guān)鍵一步。
2D SPIHT算法主要是拿與不同分辨率的同一圖像區(qū)對(duì)應(yīng)的像素集與先前稱(chēng)為“重要性等級(jí)”的值作比較，它的基礎(chǔ)是一重要概念利用原始圖像中固有的自相似性預(yù)測(cè)小波分解范圍的重要信息的缺席。這意味著如果小波分解最低等級(jí)的系數(shù)不重要，那么同區(qū)域其他等級(jí)的系數(shù)也極可能不重要。不幸的是，利用子頻帶之間冗余的SPIHT算法“破壞”了每個(gè)子頻帶內(nèi)相鄰像素間的互依性。
因此，本發(fā)明第一目的是改進(jìn)SPIHT算法的掃描順序，以重建每個(gè)子頻帶內(nèi)像素間的相鄰關(guān)系。
為此目的，本發(fā)明涉及用于壓縮包含連續(xù)幀的視頻序列的編碼方法，每個(gè)幀通過(guò)二維(2D)小波變換分解，該小波變換導(dǎo)出對(duì)應(yīng)于所述變換的分解等級(jí)的給定的連續(xù)分辨率等級(jí)數(shù)；所述編碼方法基于稱(chēng)為“用分級(jí)樹(shù)分割集合”(SPIHT)的分級(jí)子頻帶編碼處理，從視頻序列的原始像素集合導(dǎo)出用二進(jìn)制格式編碼的小波變換系數(shù)；所述系數(shù)組織成空間定向樹(shù)，該樹(shù)起植于最低頻率，或空間近似性、子頻帶，結(jié)束于高頻子頻帶的某子集；所述樹(shù)中的系數(shù)被進(jìn)一步排序成為對(duì)應(yīng)于各重要性等級(jí)的分集，并通過(guò)振幅測(cè)試來(lái)定義；該振幅測(cè)試促成把“重要性”信息劃分為三個(gè)有序表非重要集合表(LIS)、非重要像素表(LIP)、重要像素表(LSP)；所述測(cè)試根據(jù)分解過(guò)程將所述原始像素集合分解成所述分集，該分解過(guò)程持續(xù)至對(duì)所述二進(jìn)制表示中每個(gè)重要系數(shù)進(jìn)行了編碼；所述方法的特征還在于包括以下步驟(A)初始化步驟，所有坐標(biāo)為(x，y)的像素分別從0變化到_x，從0變化到_y，用所述空間相似子頻帶的系數(shù)(坐標(biāo)為x＝0(模2)和y＝0(模2)的除外)將所述LIS表初始化，初始化順序如下所述(a) 把所有x＝1(模2)和y＝0(模2)的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(b) 把所有x＝1(模2)和y＝1(模2)的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(c) 把所有x＝0(模2)和y＝1(模2)的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(B)開(kāi)發(fā)步驟，從最低分辨率到最高分辨率開(kāi)發(fā)定義小波分解的分級(jí)子頻帶金字塔空間關(guān)系的空間定向樹(shù)，同時(shí)保持相鄰像素在一起，并兼顧圖像細(xì)節(jié)的定向；多虧子系數(shù)的鋸齒掃描順序，所述子系數(shù)得以開(kāi)發(fā)；對(duì)于水平和對(duì)角的細(xì)節(jié)子頻帶，圖7顯示出4子系數(shù)組及該組沿水平方向?qū)蛳乱唤M的路徑，圖8顯示出4子系數(shù)組及該組沿豎直方向?qū)蛳乱唤M的路徑，圖9和圖10分別顯示最差分辨率和較好分辨率的情況。
本發(fā)明的又一目的是用三維(3D)SPIHT算法貫徹同樣的原理。
為此目的，本發(fā)明涉及用于壓縮包含連續(xù)幀組的視頻序列的編碼方法，每個(gè)幀組通過(guò)三維(3D)小波變換分解，該小波變換導(dǎo)出對(duì)應(yīng)于所述變換分解等級(jí)的給定的連續(xù)分辨率等級(jí)數(shù)；所述編碼方法基于稱(chēng)為“用分級(jí)樹(shù)分割集合”(SPIHT)的分級(jí)子頻帶編碼處理，從視頻序列的原始像素集合導(dǎo)出用二進(jìn)制編碼的小波變換系數(shù)；所述系數(shù)組織成時(shí)空定向樹(shù)，該樹(shù)起植于最低頻率，或時(shí)空近似性、子頻帶，結(jié)束于高頻子頻帶的某子集；所述樹(shù)中的系數(shù)被進(jìn)一步排序成為對(duì)應(yīng)于各重要性等級(jí)的分集，并由振幅測(cè)試來(lái)定義；該振幅測(cè)試促成把“重要性”信息劃分為三個(gè)有序表非重要集合表(LIS)、非重要像素表(LIP)、重要像素表(LSP)；所述測(cè)試根據(jù)分解過(guò)程將所述原始像素集合分解成所述分集，該分解過(guò)程持續(xù)至對(duì)所述二進(jìn)制表示中每個(gè)重要系數(shù)進(jìn)行了編碼；所述方法的特征還在于包括以下步驟(A)初始化步驟，3D小波變換導(dǎo)致的時(shí)空相似子頻帶包括時(shí)間相似子頻帶中兩幀的空間相似子頻帶，以z＝0和z＝1標(biāo)記，同時(shí)，所有坐標(biāo)為(x，y，z)的像素的x和y分別從0變化到_x，從0變化到_y，用所述時(shí)空相似子頻帶的系數(shù)(坐標(biāo)為z＝0(模2)、x＝0(模2)和y＝0(模2)的除外)將所述LIS表初始化，初始化順序如下所述(a)把所有x＝0(模2)、y＝0(模2)和z＝1的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(b)把所有x＝1(模2)、y＝0(模2)和z＝0的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(c)把所有x＝1(模2)、y＝1(模2)和z＝0的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(d)把所有x＝0(模2)、y＝1(模2)和z＝0的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(B)開(kāi)發(fā)步驟，從最低分辨率到最高分辨率開(kāi)發(fā)定義小波分解的分級(jí)子頻帶金字塔時(shí)空關(guān)系的時(shí)空定向樹(shù)，同時(shí)保持相鄰像素在一起，并兼顧圖像細(xì)節(jié)的定向；多虧子系數(shù)的鋸齒掃描順序，所述子系數(shù)得以開(kāi)發(fā)；對(duì)于水平和對(duì)角的細(xì)節(jié)子頻帶，圖7顯示出4子系數(shù)組及該組沿水平方向?qū)蛳乱唤M的路徑，圖8顯示出4子系數(shù)組及該組沿豎直方向?qū)蛳乱唤M的路徑，圖9和圖10分別顯示最差分辨率和較好分辨率的情況。
LIS初始化在該算法中扮演重要角色。該表的特殊組織、子系數(shù)的特殊掃描及原始算法的細(xì)小改動(dòng)都可深層探測(cè)所述樹(shù)，同時(shí)保持相鄰像素在一起，并兼顧圖像細(xì)節(jié)的定向。
下面參照附圖更詳細(xì)地描述本發(fā)明，附圖中圖1顯示2D情況下空間定向樹(shù)的母-子互依性的實(shí)例；圖2顯示在水平細(xì)節(jié)子頻帶中具有子系數(shù)的根子頻帶系數(shù)的建議的掃描順序；圖3顯示在對(duì)角細(xì)節(jié)子頻帶中具有子系數(shù)的根子頻帶系數(shù)的建議的掃描順序；圖4顯示在豎直細(xì)節(jié)子頻帶中具有子系數(shù)的根子頻帶系數(shù)的建議的掃描順序；圖5顯示對(duì)細(xì)節(jié)子頻帶有組織的定向掃描；圖6顯示時(shí)空定向樹(shù)(3D SPIHT)的母-子互依性的實(shí)例；圖7顯示具有4子系數(shù)的組的建議的掃描順序及從一個(gè)組水平導(dǎo)向另一組的路徑(子頻帶細(xì)節(jié)在水平或?qū)欠较?；圖8顯示具有4子系數(shù)的組的建議的掃描順序及從一個(gè)組豎直導(dǎo)向另一組的路徑(子頻帶細(xì)節(jié)在豎直方向)；圖9顯示最低分辨率子頻帶系數(shù)的掃描順序；圖10顯示對(duì)具有水平取向細(xì)節(jié)的子頻帶兩種分辨率等級(jí)的掃描順序(在像素附近，特別注意從一像素組導(dǎo)向另一像素組的路徑)。
可以看得出，將算術(shù)編碼有效插入SPIHT算法的主要挑戰(zhàn)在于保持上下文中的相鄰。LIS的初始組織和讀取子集的特殊順序允許部分重建系數(shù)的地理掃描，這在僅限于亮度分量的2D SPIHT算法中首先解釋?zhuān)笥衷谧鳛閿U(kuò)展的包含色度分量的3D SPIHT算法中解釋。
2D SPIHT算法掃描所有采用母-子互依性的空間子頻帶的像素，以原先儲(chǔ)存在LIP表的根子頻帶系數(shù)(一部分儲(chǔ)存在LIS中)作為起點(diǎn)。通過(guò)對(duì)空間子樹(shù)的根的不同排序，可以一個(gè)接一個(gè)地重建較高水平子頻帶的連貫檢查順序，甚至兼顧細(xì)節(jié)的空間取向(當(dāng)考慮用最佳方向掃描時(shí)可以更好開(kāi)發(fā)細(xì)節(jié)的取向)。
因此，建議采用以下掃描方法用相近子頻帶(坐標(biāo)為(x，y)的像素，x從0變化到_x，y從0變化到_y)的系數(shù)將LIS初始化(a)通過(guò)水平掃描子頻帶，將所有x＝1(模2)和y＝0(模2)的像素(x，y)列入所述表中(第一例對(duì)應(yīng)于圖2)；(b)通過(guò)水平掃描子頻帶，將所有x＝1(模2)和y＝1(模2)的像素(x，y)列入所述表中(第二例對(duì)應(yīng)于圖3)；(c)通過(guò)豎直掃描子頻帶，把所有x＝0(模2)和y＝1(模2)的像素(x，y)列入所述表中，該例對(duì)應(yīng)于圖4的第三種情況(x＝0(模2)和y＝0(模2)的像素(x，y)未插入LIS)。多虧LIS如此組織，2D算法以規(guī)定的細(xì)節(jié)檢查順序掃描子頻帶先讀取包含水平細(xì)節(jié)的子頻帶，再讀取包含對(duì)角細(xì)節(jié)(順序?qū)ζ洳皇呛苤匾?的子頻帶，最后讀取包含豎直細(xì)節(jié)的子頻帶，從最低分辨率到最高分辨率，如圖5所示(R＝根；D＝細(xì)節(jié))。
依據(jù)本發(fā)明的技術(shù)措施可擴(kuò)展至三維的情況。3D SPIHT算法的描述見(jiàn)例如“采用三維的分級(jí)樹(shù)分割集合(SPIHT)的嵌入式小波視頻編碼器”，B.J.Kim和W.A.Pearlman所著，Proceedings of DCC’97，1997年3月25-27，Snowbird，Utah，USA，251頁(yè)到260頁(yè)，它與之前二維的情況差別不大。對(duì)幀組(GOF)進(jìn)行3D小波分解操作。按照所述時(shí)間方向?qū)崿F(xiàn)運(yùn)動(dòng)補(bǔ)償和時(shí)間濾波。3D時(shí)空集合代替空間集合(2D)，也可定義系數(shù)樹(shù)具備同樣的時(shí)空取向并依賴(lài)母-子關(guān)系連結(jié)。3D情況下的這些連結(jié)見(jiàn)圖6。樹(shù)根由最低分辨率的相近子頻帶的像素組成(“根子頻帶”)。3D SPIHT算法中，除葉子外的所有子頻帶中，每個(gè)像素有8個(gè)子像素，相應(yīng)地，每個(gè)像素有一個(gè)母像素。該規(guī)則的一個(gè)例外是樹(shù)根中，8個(gè)像素有一個(gè)沒(méi)有子像素。
2D的情況下，時(shí)空定向樹(shù)自然定義分級(jí)小波分解的時(shí)空關(guān)系，采用了以下系數(shù)集合O(x，y，z chroma)節(jié)點(diǎn)(x，y，z chroma)的所有子節(jié)點(diǎn)的系數(shù)集合；D(x，y，z chroma)節(jié)點(diǎn)(x，y，z chroma)的所有后代節(jié)點(diǎn)的系數(shù)集合；H(x，y，z chroma)所有時(shí)空定向樹(shù)根(最高金字塔級(jí)別的節(jié)點(diǎn))的系數(shù)集合；L(x，y，z chroma)＝D(x，y，z chroma)-O(x，y，z chroma)；其中，(x，y，z)表示系數(shù)位置，“chroma”表示Y、U或V。有三個(gè)有序表LIS(非重要集合表)、LIP(非重要像素表)、LSP(重要像素表)。所有這些有序表用坐標(biāo)(x，y，z chroma)標(biāo)示每個(gè)條目，它在LIP和LSP中表示個(gè)體像素，而在LIS中表示D(x，y，z chroma)或L(x，y，z chroma)集合。將表示D(x，y，z，chroma)的LIS條目稱(chēng)為A類(lèi)，表示L(x，y，z，chroma)的LIS條目稱(chēng)為B類(lèi)，以示區(qū)別。同先前2D的情況一樣，3D SPIHT算法也以操縱LIS、LIP和LSP三個(gè)表為基礎(chǔ)。
根據(jù)本發(fā)明對(duì)該方法的3D擴(kuò)展沒(méi)有對(duì)時(shí)間軸進(jìn)行任何特別的初始化。時(shí)間近似子頻帶的兩個(gè)幀用z＝0和z＝1標(biāo)記，現(xiàn)建議以下初始化順序(a)將所有x＝0(模2)、y＝0(模2)和z＝1的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(b)將所有x＝1(模2)、y＝0(模2)和z＝0的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(c)將所有x＝1(模2)、y＝1(模2)和z＝0的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(d)將所有x＝0(模2)、y＝1(模2)和z＝0的像素列入所述表中，先是亮度分量Y接著是色度分量U和V。
(d)是豎直掃描，而其他是水平掃描。
本方法的第二主要方面是子系數(shù)的不同的校驗(yàn)順序。大致原則是沿每個(gè)子頻帶的細(xì)節(jié)取向掃描。這使得大量使用1S和2S的幾率增大，算術(shù)編碼器能容易地壓縮這些1S和2S。每種分辨率等級(jí)掃描兩個(gè)4子系數(shù)集合(或圖中GOC指定的子集合)，圖7顯示出水平和對(duì)角的細(xì)節(jié)子頻帶的情況，圖8顯示出豎直的細(xì)節(jié)子頻帶的情況。圖9描述像素電平的掃描順序，舉例說(shuō)明最低分辨率等級(jí)的掃描。像素的掃描以4個(gè)組來(lái)進(jìn)行，圖6描述一個(gè)組指向另一個(gè)組的路徑(該路徑方向亦沿每個(gè)子頻帶的細(xì)節(jié)取向(見(jiàn)1、2、3點(diǎn)))。較好分辨率的掃描順序參照“地理”近似性，即可以盡可能的不從一行跳至另一行。取而代之的是，可以采用圖10給出的掃描順序。4像素的組的掃描同以前一樣。圖10描述一個(gè)組指向另一個(gè)組的路徑，圖6描述組等級(jí)的情況(4、5、6點(diǎn))。
需要注意的是，根據(jù)所描述的編碼方法，可提出任何不超越本發(fā)明范疇的修正或改進(jìn)。例如，很顯然可以用有線(xiàn)電路實(shí)現(xiàn)本編碼方法，也可以通過(guò)一套儲(chǔ)存在電子、磁或光學(xué)計(jì)算機(jī)可讀介質(zhì)或其它類(lèi)型存儲(chǔ)器中的指令來(lái)實(shí)現(xiàn)，所述指令應(yīng)至少取代所述電路的一部分，而且在合適的計(jì)算機(jī)、數(shù)據(jù)處理器、中央處理單元、專(zhuān)用集成電路或任何其他類(lèi)型處理器的控制下可以實(shí)施，以便執(zhí)行被代替電路所實(shí)現(xiàn)的相同的功能。本發(fā)明也可采用這樣一種計(jì)算機(jī)可讀介質(zhì)，該介質(zhì)包括含有計(jì)算機(jī)可執(zhí)行指令的軟件模塊，用以執(zhí)行所述方法的步驟或部分步驟。
根據(jù)以上提及的文件“新型、快速而有效的圖像編解碼器......”中描述的編碼方法和相關(guān)軟件，以3D的情況為例，根據(jù)本發(fā)明所修改的算法如下所示1.初始化輸出n＝「log2(max(x，y，z，chroma){|Cx，y，zchroma|})」，設(shè)置LSP為空表，以預(yù)定的順序，把坐標(biāo)(x，y，z，chroma)εH加到LIP，并且把那些有后代的也加到LIS，作為A類(lèi)條目。
2.排序掃描
2.1對(duì)于LIP中的每個(gè)(x，y，z，chroma)條目進(jìn)行2.1.1 輸出比特＝Sn(x，y，z，chroma)；2.1.2 如果(bit＝1)，那么將(x，y，z，chroma)移到LSP，并輸出比特＝sign(x，y，z，chroma)；2.2對(duì)于LIS中的每個(gè)(x，y，z，chroma)條目進(jìn)行2.2.1 如果該條目屬A類(lèi)，那么輸出比特＝Sn(D(x，y，z，chroma))；如果(bit＝1)，那么a)對(duì)于每個(gè)(x’，y’，z’，chroma)εO(x，y，z，chroma)進(jìn)行輸出比特＝Sn(x’，y’，z’，chroma)；如果(bit＝1)，那么將(x’，y’，z’，chroma)移到LSP末尾，并輸出比特＝sign(x’，y’，z’，chroma)；或者將(x’，y’，z’，chroma)移到LIP末尾b)如果L(x，y，z，chroma)≠0，將(x，y，z，chroma)作為B類(lèi)移到LIS末尾，重復(fù)步驟2.2.2，或者將條目(x，y，z，chroma)從LIS中清除；如果該條目是B類(lèi)條目，那么輸出比特＝Sn(L(x，y，z，chroma))；如果(bit＝1)，那么a) 將每個(gè)(x’，y’，z’，chroma)εO(x，y，z，chroma)作為A類(lèi)條目添加到LIS列尾；b) 從LIS中清除(x，y，z，chroma)。
3.提純對(duì)于LSP的每個(gè)條目(x，y，z，chroma)，除去那些最近的排序掃描所包含的條目(即有相同n的條目)外，輸出C(x，y，z，chroma)的第n個(gè)最重要比特；4.更新量化步驟n減去1，回到步驟2。
權(quán)利要求
1.一種用于壓縮包含連續(xù)幀的視頻序列的編碼方法，每個(gè)幀通過(guò)二維(2D)小波變換分解，所述小波變換導(dǎo)出對(duì)應(yīng)于所述變換的分解等級(jí)的給定的連續(xù)分辨率等級(jí)數(shù)；所述編碼方法基于稱(chēng)為“用分級(jí)樹(shù)分割集合”(SPIHT)的分級(jí)子頻帶編碼操作，從視頻序列的原始像素集合導(dǎo)出用二進(jìn)制編碼的小波變換系數(shù)；所述系數(shù)組織成空間定向樹(shù)，所述樹(shù)起植于最低頻率，或空間近似性、子頻帶，結(jié)束于高頻子頻帶的某子集；所述樹(shù)中的系數(shù)被進(jìn)一步排序成為對(duì)應(yīng)于各重要性等級(jí)的分集，并通過(guò)振幅測(cè)試來(lái)定義；所述振幅測(cè)試促成把“重要性”信息劃分為三個(gè)有序表非重要集合表(LIS)、非重要像素表(LIP)、重要像素表(LSP)；所述測(cè)試根據(jù)分解過(guò)程將所述原始像素集合分解成所述分集，所述分解過(guò)程持續(xù)至對(duì)所述二進(jìn)制表示中每個(gè)重要系數(shù)進(jìn)行了編碼；所述方法的特征在于包括以下步驟(A)初始化步驟，所有坐標(biāo)為(x，y)的像素分別從0變化到_x，從0變化到_y，用所述空間相似子頻帶的系數(shù)(坐標(biāo)為x＝0(模2)和y＝0(模2)的除外)將所述LIS表初始化，初始化順序如下所述(a)把所有x＝1(模2)和y＝0(模2)的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(b)把所有x＝1(模2)和y＝1(模2)的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(c)把所有x＝0(模2)和y＝1(模2)的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(B)開(kāi)發(fā)步驟，從最低分辨率到最高分辨率開(kāi)發(fā)定義小波分解的分級(jí)子頻帶金字塔空間關(guān)系的空間定向樹(shù)，同時(shí)保持相鄰像素在一起，并兼顧圖像細(xì)節(jié)的定向；多虧子系數(shù)的鋸齒掃描順序，所述子系數(shù)得以開(kāi)發(fā)；對(duì)于水平和對(duì)角的細(xì)節(jié)子頻帶，圖7顯示出4子系數(shù)組及所述組沿水平方向?qū)蛳乱唤M的路徑，圖8顯示出4子系數(shù)組及所述組沿豎直方向?qū)蛳乱唤M的路徑，圖9和圖10分別顯示最差分辨率和較好分辨率的情況。
2.一種用于壓縮包含連續(xù)幀組的視頻序列的編碼方法，每個(gè)幀組通過(guò)三維(3D)小波變換分解，所述小波變換導(dǎo)出對(duì)應(yīng)于所述變換分解等級(jí)的給定的連續(xù)分辨率等級(jí)數(shù)；所述編碼方法基于稱(chēng)為“用分級(jí)樹(shù)分割集合”(SPIHT)的分級(jí)子頻帶編碼操作，從視頻序列的原始像素集合導(dǎo)出用二進(jìn)制編碼的小波變換系數(shù)；所述系數(shù)組織成時(shí)空定向樹(shù)，所述樹(shù)起植于最低頻率，或時(shí)空近似性、子頻帶，結(jié)束于高頻子頻帶的某子集；所述樹(shù)中的系數(shù)被進(jìn)一步排序成為對(duì)應(yīng)于各重要性等級(jí)的分集，并由振幅測(cè)試來(lái)定義；所述振幅測(cè)試促成把“重要性”信息劃分為三個(gè)有序表非重要集合表(LIS)、非重要像素表(LIP)、重要像素表(LSP)；所述測(cè)試根據(jù)分解過(guò)程將所述原始像素集合分解成所述分集，所述分解過(guò)程持續(xù)至對(duì)所述二進(jìn)制表示中每個(gè)重要系數(shù)進(jìn)行了編碼；所述方法的特征在于包括以下步驟(A) 初始化步驟，3D小波變換導(dǎo)致的時(shí)空相似子頻帶包括時(shí)間相似子頻帶中兩幀的空間相似子頻帶，以z＝0和z＝1標(biāo)記，同時(shí)，所有坐標(biāo)為(x，y，z)的像素的x和y分別從0變化到_x，從0變化到_y，用所述時(shí)空相似子頻帶的系數(shù)(坐標(biāo)為z＝0(模2)、x＝0(模2)和y＝0(模2)的除外)將所述LIS表初始化，初始化順序如下所述(a) 把所有x＝0(模2)、y＝0(模2)和z＝1的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(b) 把所有x＝1(模2)、y＝0(模2)和z＝0的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(c) 把所有x＝1(模2)、y＝1(模2)和z＝0的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(d) 把所有x＝0(模2)、y＝1(模2)和z＝0的像素列入所述表中，先是亮度分量Y接著是色度分量U和V；(B) 開(kāi)發(fā)步驟，從最低分辨率到最高分辨率開(kāi)發(fā)定義小波分解的分級(jí)子頻帶金字塔時(shí)空關(guān)系的時(shí)空定向樹(shù)，同時(shí)保持相鄰像素在一起，并兼顧圖像細(xì)節(jié)的定向；多虧子系數(shù)的鋸齒掃描順序，所述子系數(shù)得以開(kāi)發(fā)；對(duì)于水平和對(duì)角的細(xì)節(jié)子頻帶，圖7顯示出4子系數(shù)組及所述組沿水平方向?qū)蛳乱唤M的路徑，圖8顯示出4子系數(shù)組及所述組沿豎直方向?qū)蛳乱患系穆窂?，圖9和圖10分別顯示最差分辨率和較好分辨率的情況。
3.一種為對(duì)包含連續(xù)幀的視頻序列進(jìn)行編碼而設(shè)置的計(jì)算機(jī)可執(zhí)行程序步驟，所述程序步驟存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中并且是為實(shí)施根據(jù)權(quán)利要求1的編碼方法而設(shè)置的。
4.一種包含一個(gè)或一個(gè)以上為實(shí)施根據(jù)權(quán)利要求1的編碼方法而設(shè)置的軟件程序的計(jì)算機(jī)可讀介質(zhì)。
5.一種為對(duì)包含連續(xù)幀的視頻序列進(jìn)行編碼而設(shè)置的計(jì)算機(jī)可執(zhí)行程序步驟，所述程序步驟存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中并且是為實(shí)施根據(jù)權(quán)利要求2的編碼方法而設(shè)置的。
6.一種包含一個(gè)或一個(gè)以上為實(shí)施根據(jù)權(quán)利要求2的編碼方法而設(shè)置的軟件程序的計(jì)算機(jī)可讀介質(zhì)。
全文摘要
本發(fā)明涉及用于壓縮視頻序列的編碼方法,該視頻序列劃分成通過(guò)小波變換分解的幀。所述方法基于稱(chēng)為“用分級(jí)樹(shù)分割集合”(SPIHT)的分級(jí)子頻帶編碼過(guò)程,從視頻序列的原始象素集合導(dǎo)出用二進(jìn)制編碼的小波變換系數(shù)。這些系數(shù)成樹(shù)形組織,通過(guò)振幅測(cè)試排序成為對(duì)應(yīng)于各重要性等級(jí)的分集,該振幅測(cè)試促成三個(gè)有序表的劃分:非重要集合表(LIS)、非重要象素表(LIP)、重要象素表(LSP)。本發(fā)明提出特殊的LIS初始化順序。而且,描述小波分解的分級(jí)金字塔關(guān)系的定向樹(shù)從最低分辨率開(kāi)發(fā)至最高分辨率,同時(shí)保持相鄰象素在一起,并兼顧圖象細(xì)節(jié)的取向。
文檔編號(hào)H03M7/30GK1381146SQ01801568
公開(kāi)日2002年11月20日申請(qǐng)日期2001年3月26日優(yōu)先權(quán)日2000年4月4日
發(fā)明者B·菲爾茨, B·佩斯奎特－波佩斯庫(kù) 申請(qǐng)人:皇家菲利浦電子有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：B.菲爾茨;B.佩斯奎特-波佩斯庫(kù)
技術(shù)所有人：皇家菲利浦電子有限公司
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、田老師：1: 建筑節(jié)能綠色建筑能耗的模擬與檢測(cè)(EnergyPlus)；建筑碳排放和生命周期評(píng)價(jià)；城市微氣候、建筑能耗與太陽(yáng)能技術(shù)的相互影響；地理信息系統(tǒng)(GIS)和空間回歸方法用于城市建筑能耗分析；不確定性、敏感性分析和機(jī)器學(xué)習(xí)方法應(yīng)用于建筑能耗分析(R)；貝葉斯方法用于城市和單體建筑能源分析 2: 過(guò)
2、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
3、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、周老師：1.智能機(jī)器人技術(shù) 2.智能檢測(cè)與控制技術(shù) 3.機(jī)構(gòu)運(yùn)動(dòng)學(xué)與動(dòng)力學(xué) 4.機(jī)電一體化技術(shù)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

小波變換編碼相關(guān)技術(shù)

小波變換方法相關(guān)技術(shù)

小波變換方法去噪相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

利用小波變換的視頻編碼方法