專利名稱:視頻編碼方法
技術(shù)領(lǐng)域:
本發(fā)明通常涉及基于對(duì)象的視頻編碼領(lǐng)域,且更具體地涉及根據(jù)一種處理來編碼視頻數(shù)據(jù)序列的方法,在所述處理中幾類數(shù)據(jù)被識(shí)別,所述數(shù)據(jù)由所謂的多個(gè)視頻對(duì)象平面(VOP)所組成,該VOP或者是內(nèi)部編碼的VOP(I-VOP),其僅僅利用從它們自身得到的信息進(jìn)行編碼,或者是預(yù)測(cè)編碼VOP(P-VOP),其利用一個(gè)從過去的參考VOP得到的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)進(jìn)行編碼,或者是雙向預(yù)測(cè)的VOP(B-VOP),其利用一個(gè)從過去和將來的參考VOP得到的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)進(jìn)行編碼。
背景技術(shù):
MPEG-4視頻標(biāo)準(zhǔn)提供了多種技術(shù),其以較大范圍的比特率在許多應(yīng)用領(lǐng)域,例如數(shù)字電視、流動(dòng)視頻、移動(dòng)多媒體、游戲等等之內(nèi)觀看、訪問和操作對(duì)象(而不是如以前的MPEG標(biāo)準(zhǔn)去操作像素)。所述標(biāo)準(zhǔn)對(duì)視頻對(duì)象(VO)進(jìn)行操作,所述視頻對(duì)象由時(shí)間和空間信息所限定,所述時(shí)間和空間信息以形狀、運(yùn)動(dòng)和結(jié)構(gòu)信息的形式表現(xiàn),并分別在位流中被編碼(這些VO是用戶能夠訪問和操作的實(shí)體)。
MPEG-4方法依賴于一序列連續(xù)場(chǎng)景的基于內(nèi)容的視覺數(shù)據(jù)顯示,每一個(gè)場(chǎng)景是VO的復(fù)合體,VO帶有它自身固有的特性形狀、運(yùn)動(dòng)和結(jié)構(gòu)。除了VO的概念之外,MPEG-4標(biāo)準(zhǔn)介紹了其它的一些東西,如視頻對(duì)象層(依賴于應(yīng)用,每一個(gè)VO或者以一個(gè)可縮放,或者以不能縮放的形式被編碼,其由視頻對(duì)象層或者VOL表現(xiàn))和視頻對(duì)象平面(VOP)(=在時(shí)間上的VO實(shí)例)??梢约俣ㄒ粋€(gè)輸入視頻序列的每一幀被分割成許多任意形狀的圖像區(qū)域(VO),且屬于同一個(gè)VO的VOP的形狀、運(yùn)動(dòng)和結(jié)構(gòu)信息被編碼并且被傳送到相應(yīng)于特定的時(shí)間或空間分辨率的分離的VOL中(其允許隨后去單獨(dú)地解碼每一個(gè)VOP且促成了所需要的對(duì)視頻序列的靈活操作)。
下面是由這樣一個(gè)編碼結(jié)構(gòu)處理過的幀的三種類型I-VOP、P-VOP、和B-VOP。I-VOP是一個(gè)內(nèi)部編碼的VOP該編碼操作僅僅使用從其自身得到的信息(其是使用了最大數(shù)量的位的VOP)。P-VOP是預(yù)測(cè)編碼的VOP,且該編碼操作則是使用一個(gè)從過去的參考VOP中得到的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè),該過去的參考VOP或者可以是一個(gè)I-VOP或者可以是另一個(gè)P-VOP(與一個(gè)I-VOP相反,僅編碼當(dāng)前運(yùn)動(dòng)補(bǔ)償P-VOP與它的參考VOP之間的差因此,一個(gè)P-VOP通常比一個(gè)I-VOP使用更少的位)。B-VOP是使用從過去和將來的參考VOP(I-VOP或者P-VOP)的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)進(jìn)行編碼得到的VOP,分別基于所謂的向前的和向后的運(yùn)動(dòng)估計(jì)而被編碼的VOP。一個(gè)B-VOP不能作參考VOP,且象P-VOP,僅有當(dāng)前運(yùn)動(dòng)補(bǔ)償B-VOP與它的參考VOP之間的差被編碼。
不幸地,這時(shí),使用所述B-VOP預(yù)測(cè)(也叫做內(nèi)插或者雙向模式)經(jīng)常得不到壓縮方面的效果。如果壓縮有時(shí)能被改善大約20%,在一些情形下也會(huì)急劇地降低。
發(fā)明內(nèi)容
于是本發(fā)明的一個(gè)目的是提出一種編碼方法,其僅僅在B-VOP預(yù)測(cè)有效時(shí)才使用這樣的B-VOP預(yù)測(cè)。
為此,本發(fā)明涉及一種在說明書的前序部分中限定的編碼方法,所述編碼方法包括對(duì)每一個(gè)VOP的編碼步驟和一個(gè)在所述編碼步驟之前在當(dāng)前的VOP和先前的一個(gè)VOP之間執(zhí)行的運(yùn)動(dòng)估計(jì)步驟,所述運(yùn)動(dòng)估計(jì)步驟本身包括一個(gè)關(guān)于要被編碼的VOP的類型的判定處理且基于下面的子步驟-在一個(gè)序號(hào)為N的VOP(VOP N)和先前的一個(gè)VOP(VOP N-1)之間執(zhí)行一個(gè)運(yùn)動(dòng)估計(jì);-以所述運(yùn)動(dòng)估計(jì)為基礎(chǔ),計(jì)算一個(gè)所謂的相干系數(shù),提供對(duì)序列運(yùn)動(dòng)的量化;-基于所述相干系數(shù)與一個(gè)預(yù)定閾值的比較結(jié)果,對(duì)當(dāng)前的VOP的類型作出最終的判定,根據(jù)所述相干系數(shù)相對(duì)于所述閾值的值判定所述當(dāng)前VOP是一個(gè)B-VOP或者不是一個(gè)B-VOP。
本發(fā)明現(xiàn)在參照附圖,以示例的方式進(jìn)行描述,其中圖1圖示了根據(jù)本發(fā)明的編碼方法的主要步驟。
具體實(shí)施例方式
一個(gè)MPEG-4編碼器包括幾個(gè)功能塊,在所述功能塊中一個(gè)或者幾個(gè)存儲(chǔ)器用于以標(biāo)準(zhǔn)所需要的傳輸順序輸出VOP。例如,如果輸入順序是IBBPBBP...,那么輸出或者傳輸順序?qū)?huì)是IPBBPBB...(為了能夠向后預(yù)測(cè),編碼器必須將自然順序的圖像重新排序?yàn)樗龅膫鬏旐樞?,以使B-VOP在它們所參考過去和將來的VOP之后被傳輸)。所述編碼器還包括一個(gè)運(yùn)動(dòng)估計(jì)器,用于接收當(dāng)前的VOP和先前的一個(gè)VOP(或者參考VOP),并且判定對(duì)于當(dāng)前VOP將執(zhí)行哪種預(yù)測(cè)對(duì)于I-VOP為沒有預(yù)測(cè),對(duì)于P-VOP為向前預(yù)測(cè),對(duì)于B-VOP為雙向預(yù)測(cè)。
如圖1顯示了在運(yùn)動(dòng)估計(jì)器中關(guān)于預(yù)測(cè)的判定過程的步驟,根據(jù)本發(fā)明,所述判定基于以下步驟的執(zhí)行過程。首先,捕捉當(dāng)前的VOP(序號(hào)N)(步驟CAP-VN)。然后在VOP N和先前的VOP(序號(hào)N-1)之間執(zhí)行運(yùn)動(dòng)估計(jì)(M-EST),且為了量化序列運(yùn)動(dòng),計(jì)算一個(gè)命名為“相干系數(shù)”的系數(shù)(步驟CF-CPT),且將所述相干系數(shù)與一個(gè)預(yù)定的閾值進(jìn)行比較(步驟CF-TEST)。根據(jù)比較結(jié)果(Y=低于,或者N=不低于),VOP N被允許(N-AL)或者不被允許(N-NAL)作為一個(gè)B-VOP。然后執(zhí)行關(guān)于預(yù)測(cè)模式的最終判定(步驟V-DEC),并且能夠執(zhí)行對(duì)當(dāng)前VOP(=I-VOP、或者P-VOP、或者B-VOP)的編碼步驟(步驟COD)。
對(duì)于在比較測(cè)試中使用的相干系數(shù)可以提出幾種表示法,而這并不限制本發(fā)明的范圍。不過,一個(gè)優(yōu)選的相干系數(shù)可以是例如下面所表述的在同一個(gè)VOP中的宏塊(以16×16像素模式或者8×8像素模式估計(jì))的運(yùn)動(dòng)矢量與它的先前宏塊的運(yùn)動(dòng)矢量之間的絕對(duì)差的總和與前一個(gè)VOP的類似總和的比率(在此被重新調(diào)用,即對(duì)于大小為k×k的宏塊,SAD的表示式是SAD=Σi=0K×K|A(i)-B(i)|]]>其中B(i)和A(i)分別表示所考慮的當(dāng)前宏塊和參考VOP中與在所述參考VOP中定義的搜索范圍內(nèi)的最大宏塊相匹配的宏塊)。
權(quán)利要求
1.一個(gè)根據(jù)一種處理來編碼一序列視頻數(shù)據(jù)的方法,在所述處理中數(shù)據(jù)的幾種類型被識(shí)別,所述數(shù)據(jù)由所謂的視頻對(duì)象平面(VOP)組成,VOP或者是內(nèi)部編碼的VOP(I-VOP),其僅僅利用從它們自身得到的信息進(jìn)行編碼,或者是預(yù)測(cè)編碼VOP(P-VOP),其利用一個(gè)從過去的參考VOP得到的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)進(jìn)行編碼,或者是雙向預(yù)測(cè)的VOP(B-VOP),其利用一個(gè)從過去和將來的參考VOP得到的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)進(jìn)行編碼,所述編碼方法包括對(duì)每一個(gè)VOP進(jìn)行編碼的步驟,在所述編碼步驟之前在當(dāng)前VOP和先前的一個(gè)VOP之間執(zhí)行一個(gè)運(yùn)動(dòng)估計(jì)步驟,所述運(yùn)動(dòng)估計(jì)步驟本身包括一個(gè)關(guān)于要被編碼的VOP的類型的判定處理,并且基于以下子步驟-在一個(gè)序號(hào)為N的VOP(VOP N)和先前的一個(gè)VOP(VOP N-1)之間執(zhí)行運(yùn)動(dòng)估計(jì);-以所述運(yùn)動(dòng)估計(jì)為基礎(chǔ),計(jì)算一個(gè)所謂的相干系數(shù),提供對(duì)序列運(yùn)動(dòng)的量化;-基于所述相干系數(shù)與一個(gè)預(yù)定閾值的比較結(jié)果,對(duì)當(dāng)前的VOP的類型作出最終的判定,根據(jù)所述相干系數(shù)相對(duì)于所述閾值的值判定所述當(dāng)前VOP是一個(gè)B-VOP或者不是一個(gè)B-VOP。
2.根據(jù)權(quán)利要求1所述的編碼方法,其中所述相干系數(shù)被表述為由所述運(yùn)動(dòng)估計(jì)產(chǎn)生的同一個(gè)VOP中的宏塊和它先前宏塊的運(yùn)動(dòng)矢量之間的絕對(duì)差的總和(SAD)同先前的VOP的類似總和的比率。
全文摘要
本發(fā)明涉及一種編碼方法,該方法對(duì)I、P或者B類型的視頻對(duì)象平面(VOP)進(jìn)行處理且包括對(duì)所述VOP的動(dòng)態(tài)分配。根據(jù)所述方法,對(duì)于每一個(gè)輸入幀,在當(dāng)前幀和先前幀之間執(zhí)行一個(gè)初步的前向運(yùn)動(dòng)估計(jì)。然后使用當(dāng)前和先前運(yùn)動(dòng)場(chǎng)來求取相干系數(shù)的值,其表示為與當(dāng)前和先前運(yùn)動(dòng)場(chǎng)中的局部差的總和相關(guān)聯(lián)。根據(jù)所述相干系數(shù)相對(duì)于實(shí)驗(yàn)確定的閾值的值,最后判定要被編碼的幀的類型。
文檔編號(hào)G06T9/00GK1706199SQ200380101555
公開日2005年12月7日 申請(qǐng)日期2003年10月13日 優(yōu)先權(quán)日2002年10月16日
發(fā)明者M·德里尤西, F·戈羅里雷, D·斯努克 申請(qǐng)人:皇家飛利浦電子股份有限公司