亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種自適應(yīng)運(yùn)動估計(jì)方法

文檔序號:7919359閱讀:304來源:國知局
專利名稱:一種自適應(yīng)運(yùn)動估計(jì)方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種自適應(yīng)運(yùn)動估計(jì)方法,屬于視頻編解碼技術(shù)領(lǐng)域,應(yīng)用于視頻編碼過程 中的運(yùn)動估計(jì)。
背景技術(shù)
視頻序列圖像在時(shí)間上存在很強(qiáng)的相關(guān)性,采用運(yùn)動估計(jì)和運(yùn)動補(bǔ)償技術(shù)可以消除時(shí)間 冗余以提高編碼效率,這種技術(shù)廣泛用于視頻壓縮的一些國際標(biāo)準(zhǔn)中,如H. 261、H. 263、H. 264、 MPEG-1、 MPEG-2、 MPEG-4。運(yùn)動估計(jì)方法根據(jù)作用對象的不同可以分為基于象素點(diǎn)的運(yùn)動估 計(jì),基于塊匹配的運(yùn)動估計(jì),基于區(qū)域的運(yùn)動估計(jì)和基于網(wǎng)格的運(yùn)動估計(jì),其中塊匹配運(yùn)動 估計(jì)因方法簡單、便于硬件實(shí)現(xiàn)得到廣泛應(yīng)用。
塊匹配運(yùn)動估計(jì)的基本思想是將圖像序列的每一幀分成許多互不重疊的宏塊,并認(rèn)為宏 塊內(nèi)所有象素的位移量都相同,然后對每個宏塊到參考幀某一給定搜索范圍內(nèi)根據(jù)一定的匹 配準(zhǔn)則找出與當(dāng)前塊最相似的塊,即匹配塊,匹配塊與當(dāng)前塊的相對位移即為運(yùn)動矢量。視 頻壓縮的時(shí)候,只需保存運(yùn)動矢量和殘差數(shù)據(jù)就可以完全恢復(fù)出當(dāng)前塊。
塊匹配運(yùn)動估計(jì)有眾多的運(yùn)動搜索方法,其中最簡單的是全搜索法。全搜索法對搜索窗 內(nèi)的所有點(diǎn)進(jìn)行窮盡搜索,這種方法精度最高,但技術(shù)復(fù)雜度大;許多快速方法能夠有效降 低技術(shù)復(fù)雜度,如三步法[l],菱形法[2], PMVFAST[3]以及非對稱六角形法[4]。
在一個視頻編碼器中,宏塊編碼過程依次為幀內(nèi)預(yù)測,運(yùn)動估計(jì),模式?jīng)Q策,DCT變換 和量化和熵編碼,如圖2(a)所示。在視頻壓縮過程中,運(yùn)動估計(jì)模塊需要最多的技術(shù)資源。 視頻編碼器的ASIC設(shè)計(jì)出于技術(shù)資源、存儲空間和訪問帶寬的考慮,對運(yùn)動估計(jì)方法在搜索 點(diǎn)數(shù)、方法規(guī)則性、以及搜索窗大小有著嚴(yán)格的要求。上述的傳統(tǒng)快速運(yùn)動估計(jì)方法多采用 分級搜索、早期截止以及不規(guī)則的搜索窗,盡管搜索點(diǎn)數(shù)大幅度減少,但不利于硬件實(shí)現(xiàn)。 全搜索運(yùn)動估計(jì)采用規(guī)則的搜索窗口,但需要窮盡搜索導(dǎo)致搜索點(diǎn)數(shù)過多,增加了運(yùn)動估計(jì) 的技術(shù)復(fù)雜度。

發(fā)明內(nèi)容
所要解決的問題
本發(fā)明針對現(xiàn)有方法在處理包含劇烈運(yùn)動高清晰度圖像時(shí)壓縮性能偏低,技術(shù)復(fù)雜度高
或不適合硬件實(shí)現(xiàn)的不足而提供了一種基于全局運(yùn)動的自適應(yīng)運(yùn)動估計(jì)方法。
技術(shù)方案1、本發(fā)明包括運(yùn)動矢量信息、宏塊編碼模式信息采集,全局運(yùn)動信息分析和 自適應(yīng)運(yùn)動估計(jì)。
運(yùn)動矢量信息、宏塊編碼模式信息采集通過直方圖記錄一幀中不同大小運(yùn)動矢量的頻率, 并記錄一幀中各宏塊編碼模式的頻率;對于每個運(yùn)動矢量還需統(tǒng)計(jì)水平分量與垂直分量之間 比率的頻率。
對于不同尺寸的塊幀間編碼模式,需要記錄的運(yùn)動矢量個數(shù)分別為l個幀間16x16模 式,2個幀間16x8和幀間8x16, 4個幀間8x8, 8個幀間8x4, 8個幀間4x8, 16個幀間4x4。
全局運(yùn)動信息統(tǒng)計(jì)分析使用運(yùn)動矢量直方圖確定全局運(yùn)動矢量,并通過統(tǒng)計(jì)方法分析當(dāng) 前幀中景物在水平、垂直方向的運(yùn)動特征。
運(yùn)動矢量直方圖中頻率最大的運(yùn)動矢量表示為gmvMax, gmvMaxFrq表示gmvMax歸一后的 頻率;運(yùn)動矢量直方圖中頻率最大的3個運(yùn)動矢量的中值表示為gmvMedian。當(dāng)gmvMax與 gmvMedian之間整象素距離大于4且gmvMaxFrq小于0. 6,此時(shí)GMV等于gmvMedian,否則GMV 等于gmvMax 。
如果所有宏塊運(yùn)動矢量的水平分量大于2倍垂直分量的概率達(dá)到80%,將標(biāo)識符 horizontalMotionFlag置為1;如果所有宏塊運(yùn)動矢量的垂直分量大于2倍水平分量的概率 達(dá)到80%,將標(biāo)識符verticalMotionFlag置為1;否則horizontalMotionFlag和 verticalMotionFlag者卩被置為0。
自適應(yīng)運(yùn)動估計(jì)包括的步驟為
第一步驟當(dāng)GMV與MVP之間的整象素距離超過W1寬度的一半時(shí),將使用2個搜索窗 W1和W2,其中Wl以MVP為搜索窗中心,W2以GMV為搜索窗中心;
第二步驟如果不滿足上述條件,檢査當(dāng)前宏塊相鄰左邊和上邊宏塊的編碼模式是否均 滿足以下條件為幀內(nèi)4x4模式,或?yàn)閹瑑?nèi)16x16模式且宏塊SAD大于5000;如果當(dāng)前宏塊 相鄰左邊和上邊宏塊均滿足條件,則檢査全局運(yùn)動優(yōu)勢方向標(biāo)識符horizontalMotionFlag和 verticalMotionFlag,若horizontalMotionFlag為TRUE,則選擇W3作為搜索窗,若 verticalMotionFlag為TRUE,則選擇W4作為搜索窗;如果上述條件仍不滿足,則選擇搜索 窗W5。
基于全局運(yùn)動的自適應(yīng)運(yùn)動估計(jì)方法在視頻編碼器中的應(yīng)用(l)視頻序列的第一幀按照 I幀編碼,對每個宏塊進(jìn)行幀內(nèi)預(yù)測,然后當(dāng)前塊的預(yù)測值與原始值之間的差值進(jìn)行DCT變 換和量化,最后對量化后的DCT系數(shù)和宏塊頭等信息進(jìn)行熵編碼;所有宏塊編碼結(jié)束后,進(jìn)
入第二幀的編碼;
(2) 第二幀的編碼首先對每個宏塊分別進(jìn)行幀內(nèi)預(yù)測和運(yùn)動估計(jì),由于此時(shí)前一幀的全局 運(yùn)動信息無效,這里的運(yùn)動估計(jì)未使用自適應(yīng)運(yùn)動估計(jì)方法;之后,編碼器根據(jù)率失真成本 進(jìn)行模式?jīng)Q策,得到宏塊編碼模式;此時(shí),需要采集全局運(yùn)動信息分析步驟需要的運(yùn)動矢量 和宏塊編碼模式信息;然后對當(dāng)前塊和參考塊之間的殘差進(jìn)行DCT變換和量化,最后對量化 后的DCT系數(shù)和運(yùn)動矢量、宏塊頭等信息進(jìn)行熵編碼;當(dāng)?shù)诙泻陦K全部編碼結(jié)束后, 本發(fā)明需要根據(jù)之前采集的所有宏塊的運(yùn)動矢量和宏塊編碼模式信息,進(jìn)行全局運(yùn)動信息分 析;
(3) 第三幀及之后若干幀的編碼首先對每個宏塊分別進(jìn)行幀內(nèi)預(yù)測和運(yùn)動估計(jì),此時(shí),運(yùn) 動估計(jì)使用自適應(yīng)運(yùn)動估計(jì)方法;之后,編碼器根據(jù)率失真成本進(jìn)行模式?jīng)Q策,得到宏塊編 碼模式;此時(shí),需要采集全局運(yùn)動信息分析步驟需要的運(yùn)動矢量和宏塊編碼模式信息;然后 對當(dāng)前塊和參考塊之間的殘差進(jìn)行DCT變換和量化,最后對量化后的DCT系數(shù)和運(yùn)動矢量、 宏塊頭等信息進(jìn)行熵編碼;當(dāng)前幀所有宏塊全部編碼結(jié)束后,需要根據(jù)之前采集的所有宏塊 的運(yùn)動矢量和宏塊編碼模式信息,進(jìn)行全局運(yùn)動信息分析,用于下一幀的自適應(yīng)運(yùn)動估計(jì)。
有益效果-
本發(fā)明提出的自適應(yīng)運(yùn)動估計(jì)方法能夠有效克服現(xiàn)有方法在處理包含劇烈運(yùn)動的高清晰 度圖像時(shí)壓縮性能偏低的不足,該方法由于自適應(yīng)地選擇搜索窗的中心、搜索窗的大小和形 狀,能夠在不增加搜索點(diǎn)數(shù)的前提下,增大搜索范圍,提高運(yùn)動搜索的精度。此外,本發(fā)明 提出的方法采用規(guī)則的搜索窗,非分級、非提前截止的搜索策略,適合硬件實(shí)現(xiàn)。最后,本 發(fā)明描述的方法在全局運(yùn)動劇烈的特定環(huán)境下發(fā)生作用,不會影響處理運(yùn)動相對平緩視頻序 列的性能。


圖1為搜索窗尺寸對編碼性能的影響示圖; 圖2 (a)為現(xiàn)有技術(shù)中視頻編碼流程圖; 圖2 (b)為本發(fā)明應(yīng)用于視頻編碼器的流程圖; 圖3為自適應(yīng)運(yùn)動估計(jì)搜索窗形狀選擇。
具體實(shí)施方式
原理
運(yùn)動相對平緩的序列對于搜索窗的大小并不十分敏感。此外,H.264中的幀內(nèi)模式在編 碼紋理簡單的宏塊比編碼紋理相對復(fù)雜的宏塊效率高的多[5]。因此編碼紋理簡單的宏塊時(shí), 編碼器選擇幀內(nèi)模式或跳過模式(Skip)的概率較大。這種情況下,即使該宏塊編碼為幀內(nèi) 塊,所消耗的比特也不會很多。對于紋理比較復(fù)雜的區(qū)域,通常情況下,如沒有全局運(yùn)動或 全局運(yùn)動較小時(shí),編碼模式為幀間預(yù)測的宏塊消耗的比特要遠(yuǎn)小于編碼模式為幀內(nèi)的宏塊, 因此該區(qū)域的宏塊傾向于編碼為幀間模式。但當(dāng)全局運(yùn)動較大并超出搜索窗的搜索范圍時(shí), 采用幀間模式編碼的率失真成本(R-D Cost)很可能大于采用幀內(nèi)模式編碼,使得編碼器最終 以幀內(nèi)模式編碼該宏塊,由于采用幀內(nèi)預(yù)測處理這類宏塊的效率很低,導(dǎo)致編碼比特顯著增 加。這種情況下,如果能夠找到當(dāng)前序列的全局運(yùn)動矢量,并令該宏塊的起始搜索點(diǎn)沿全局 運(yùn)動矢量方向移動,將有利于找到真實(shí)的最優(yōu)運(yùn)動矢量,提高編碼效率。
本發(fā)明提出的自適應(yīng)運(yùn)動估計(jì)方法,應(yīng)用于通用標(biāo)準(zhǔn)的視頻編碼器(如MPEG-4, H.264 等),能夠有效提高編碼器壓縮效率。該方法通過統(tǒng)計(jì)信息判斷視頻序列的運(yùn)動劇烈程度,找 到全局運(yùn)動矢量,并以該全局運(yùn)動矢量所指向的參考宏塊為中心,根據(jù)圖像分辨率、全局運(yùn) 動和編碼模式的統(tǒng)計(jì)信息自適應(yīng)地決定搜索窗口的大小和形狀。該搜索窗口與以相鄰塊預(yù)測 運(yùn)動矢量為中心的搜索窗口配合,能夠在不增加搜索點(diǎn)數(shù)的條件下,有效地處理劇烈全局運(yùn) 動的情況。
下面結(jié)合附圖和具體實(shí)施方式
對本發(fā)明作進(jìn)一步詳細(xì)地說明。 圖2 (b),設(shè)編碼幀序列結(jié)構(gòu)為IPPP:
1、 視頻序列的第一幀按照I幀編碼,對每個宏塊進(jìn)行幀內(nèi)預(yù)測,然后當(dāng)前塊的預(yù)測值與 原始值之間的差值進(jìn)行DCT變換和量化,最后對量化后的DCT系數(shù)和宏塊頭等信息進(jìn)行熵編 碼;所有宏塊編碼結(jié)束后,進(jìn)入第二幀的編碼;
2、 第二幀的編碼首先對每個宏塊分別進(jìn)行幀內(nèi)預(yù)測和運(yùn)動估計(jì),由于此時(shí)前一幀的全局 運(yùn)動信息無效,這里的運(yùn)動估計(jì)未使用本發(fā)明提出的自適應(yīng)運(yùn)動估計(jì)方法;之后,編碼器根 據(jù)率失真成本進(jìn)行模式?jīng)Q策,得到宏塊編碼模式;此時(shí),本發(fā)明需要采集全局運(yùn)動信息分析 步驟需要的運(yùn)動矢量和宏塊編碼模式信息;然后對當(dāng)前塊和參考塊之間的殘差進(jìn)行DCT變換 和量化,最后對量化后的DCT系數(shù)和運(yùn)動矢量、宏塊頭等信息進(jìn)行熵編碼;當(dāng)?shù)诙泻?塊全部編碼結(jié)束后,本發(fā)明需要根據(jù)之前采集的所有宏塊的運(yùn)動矢量和宏塊編碼模式信息, 進(jìn)行全局運(yùn)動信息分析;
3、 第三幀及之后若干幀的編碼首先對每個宏塊分別進(jìn)行幀內(nèi)預(yù)測和運(yùn)動估計(jì),此時(shí),運(yùn) 動估計(jì)使用本發(fā)明提出的自適應(yīng)運(yùn)動估計(jì)方法;之后,編碼器根據(jù)率失真成本進(jìn)行模式?jīng)Q策,
得到宏塊編碼模式;此時(shí),本發(fā)明需要采集全局運(yùn)動信息分析步驟需要的運(yùn)動矢量和宏塊編 碼模式信息;然后對當(dāng)前塊和參考塊之間的殘差進(jìn)行DCT變換和量化,最后對量化后的DCT 系數(shù)和運(yùn)動矢量、宏塊頭等信息進(jìn)行熵編碼;當(dāng)前幀所有宏塊全部編碼結(jié)束后,本發(fā)明需要 根據(jù)之前采集的所有宏塊的運(yùn)動矢量和宏塊編碼模式信息,進(jìn)行全局運(yùn)動信息分析,用于下 一幀的自適應(yīng)運(yùn)動估計(jì)。
本發(fā)明提出的自適應(yīng)運(yùn)動估計(jì)方法分為三部分運(yùn)動矢量信息、宏塊編碼模式信息采集, 全局運(yùn)動信息分析和自適應(yīng)運(yùn)動估計(jì)。
1、 運(yùn)動矢量信息、宏塊編碼模式信息采集。本發(fā)明提出的運(yùn)動矢量、宏塊編碼模式信息 采集通過直方圖記錄一幀中不同大小運(yùn)動矢量的頻率,并記錄一幀中各宏塊編碼模式的頻率。 對于不同尺寸的塊幀間編碼模式,需要記錄的運(yùn)動矢量個數(shù)分別為幀間16x16模式(l個), 幀間16x8和幀間8x16 (2個),幀間8x8 (4個),幀間8x4 (8個),幀間4x8 (8個),幀間 4x4 (16個)。對于每個運(yùn)動矢量還需統(tǒng)計(jì)水平分量與垂直分量之間比率的頻率。
2、 全局運(yùn)動信息統(tǒng)計(jì)分析。本發(fā)明提出的全局運(yùn)動信息統(tǒng)計(jì)分析使用運(yùn)動矢量直方圖確 定全局運(yùn)動矢量,并通過統(tǒng)計(jì)方法分析當(dāng)前幀中景物在水平、垂直方向的運(yùn)動特征。
運(yùn)動矢量直方圖中頻率最大的運(yùn)動矢量表示為gmvMax, gmvMaxFrq表示gmvMax歸一后的 頻率;運(yùn)動矢量直方圖中頻率最大的3個運(yùn)動矢量的中值表示為gmvMedian。當(dāng)gmvMax與 gmvMedian之間整象素距離大于4且gmvMaxFrq小于0. 6,表明當(dāng)前幀中運(yùn)動相對散亂,全局 運(yùn)動并不明顯,此時(shí)GMV等于gmvMedian,否則GMV等于gmvMax。
如果所有宏塊運(yùn)動矢量的水平分量大于2倍垂直分量的概率達(dá)到80%,表明前一幀中水 平運(yùn)動占優(yōu),將標(biāo)識符horizontalMotionFlag置為1;如果所有宏塊運(yùn)動矢量的垂直分量大 于2倍水平分量的概率達(dá)到80% ,表明前一幀中垂直運(yùn)動占優(yōu),將標(biāo)識符verticalMotionFlag 置為1;否則horizontalMotionFlag和verticalMotionFlag都被置為0。
3、 自適應(yīng)運(yùn)動估計(jì)。本發(fā)明提出的自適應(yīng)運(yùn)動估計(jì)根據(jù)全局運(yùn)動矢量(GMV)與預(yù)測運(yùn) 動矢量(MVP)之間的關(guān)系,以及相鄰宏塊的編碼模式來選擇搜索模式。搜索窗大小的選擇與 圖像分辨率有關(guān),本發(fā)明提出的自適應(yīng)運(yùn)動估計(jì)方法需要用到五個大小不同的搜索窗,分別 命名為Wl、 W2、 W3、 W4、 W5。上述五個搜索窗的大小與所處理的圖像尺寸有關(guān),對于1920x1080 的圖像,上述五個搜索窗尺寸分別為16x16、 16x8、 48x8、 16x32、 32x16。自適應(yīng)運(yùn)動估計(jì) 的方法流程如下所示
1)、首先,當(dāng)GMV與MVP之間的整象素距離超過W1寬度的一半時(shí),本發(fā)明使用2個搜索 窗W1和W2,其中Wl以MVP為搜索窗中心,W2以GMV為搜索窗中心。2)、如果不滿足上述條件,檢查當(dāng)前宏塊相鄰左邊和上邊宏塊的編碼模式是否均滿足以 下條件為幀內(nèi)4x4模式,或?yàn)閹瑑?nèi)16x16模式且宏塊SAD大于5000。如果當(dāng)前宏塊相鄰左 邊和上邊宏塊均滿足條件,則檢查全局運(yùn)動優(yōu)勢方向標(biāo)識符horizontalMotionFlag和 verticalMotionFlag,若horizontalMotionFlag為TRUE,則選擇W3作為搜索窗,若 verticalMotionFlag為TRUE,則選擇W4作為搜索窗;如果上述條件仍不滿足,則選擇搜索 窗W5。
圖3(a廣(c)表示使用兩個搜索窗時(shí)Wl和W2不同相對位置的三種典型情況,(d廣(f)分 別表示W(wǎng)3、 W4、 W5。圖中VI表示預(yù)測運(yùn)動矢量MVP, V2表示全局運(yùn)動矢量GMV, 0表示當(dāng)前 塊位置。當(dāng)W1與W2有重疊區(qū)域時(shí),重疊區(qū)域的搜索點(diǎn)不會參與重復(fù)技術(shù)。 為了說明運(yùn)動估計(jì)方法特別是搜索窗大小對編碼性能的影響,我們進(jìn)行了相關(guān)試驗(yàn),針對包 含劇烈運(yùn)動的高清晰度圖像測試了運(yùn)動估計(jì)的性能。出于對比目的,試驗(yàn)選用了 Mobile (720x480), Suzie (720x480), Vcref (1280x720), RushHour (1920x1088)共4個運(yùn)動相對 平緩的序列,以及Cheerleader (720x480), Football (720x480), Race一seg0 (1920x1088), Race_segl(1920x1088)共4個運(yùn)動相對劇烈的序列。上述序列中,Race—seg0和Race—segl 是從游戲畫面截取的視頻序列,內(nèi)容包括高速運(yùn)動的賽車和劇烈的攝像機(jī)運(yùn)動,其他序列均 為標(biāo)準(zhǔn)測試序列,可以從[6]、 [7]下載。運(yùn)動估計(jì)方法采用全搜索。針對上述八個序列,測 試了搜索窗大小對編碼性能的影響。測試數(shù)據(jù)如圖Ua) (h)所示,其中圖1 (a)為Mobile (720x480)序列;圖1 (b)為Suzie (720x480)序列;圖1 (c)為RushHour (1920x1088)序列; 圖1 (d)為Vcref (1280x720)序列;圖1 (e)為Cheerleader (720x480)序列;圖1 (f)為Football (720x480)序列;圖1 (g)為Race—segO (1920x1088)序列;圖1 (h)為Race—segl (1920x1088) 序列。測試中搜索窗高度為搜索窗寬度的1/2。圖1中的碼率增加值是指不同搜索窗尺寸相 對于512x256的碼率增加值。搜索窗尺寸對編碼性能的影響
通過對試驗(yàn)數(shù)據(jù)分析可以發(fā)現(xiàn),運(yùn)動相對平緩的序列,如序列Mobile (720x480), Suzie (720x480), Vcref (1280x720), RushHour (1920x1088), 搜索窗尺寸的減小對R-D性能的 影響很小,上述序列當(dāng)搜索窗寬度為64以上時(shí),碼率變化范圍在-1 1%;當(dāng)搜索窗尺寸降 到32x16時(shí),上述序列碼率大約有1 2%的增加。
運(yùn)動相對劇烈的序列,如序列Cheerleader (720x480), Football (720x480), Race_seg0 (1920x1088), Race一segl (1920x1088)搜索窗尺寸的減小對R-D性能的影響較大。當(dāng)搜索窗大 小為64x32時(shí),碼率增加分別為2. 6%, 2. 58%, 4. 06%和5. 11%;當(dāng)搜索窗口大小進(jìn)一步減 小到32xl6時(shí),碼率增加增大為5.85%, 7.53%, 14.02%, 11.05%。由上述分析可以知道,搜索窗的大小對運(yùn)動估計(jì)方法處理運(yùn)動相對劇烈的視頻序列時(shí)的 性能有很大影響。搜索窗尺寸越大,運(yùn)動估計(jì)在處理上述序列時(shí)性能就越好。但是對于硬件 實(shí)現(xiàn),技術(shù)資源有限,如何在有限搜索點(diǎn)數(shù)下提高運(yùn)動估計(jì)方法的性能,同時(shí)保持方法的易 實(shí)現(xiàn)性,是本發(fā)明解決的主要問題。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原 則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包括在本發(fā)明的保護(hù)范圍之內(nèi)。 Li R., Liu M. L., Liu M. L., "A New Three-step Search Algorithm for Block Motion Estimation", P438-442, IEEE Transactions on Circuits and Systems for Video Technology, Apr. 1994 Zhu S.,"A New Diamond Search Algorithm for Fast Block-matching Motion Estimation",P287-290,IEEE Transactions on Image Processing, Sep.2000 Zhibo Chen, Yun He, "Fast Integer and Fractional Pel Motion estimation", JVT-E045.doc A. M. Tourapis, O. C. Au, and M. L. Liou, "Fast Motion Estimation using Circular Zonal Search", ISO/IEC JTC1/SC29/WG11 MPEG9/m4038, Atlantic City, NJ, USA, Oct. 1998. ISO publication page: ISO/IEC 14496-10:2005 - Information technology — Coding of audio-visual objects — Part 10: Advanced Video Coding". Retrieved on 2007-09-13. ftp:〃ftp.imte-files.org/ivt-experts/members/sequences/ ftp:〃59.226.42.5權(quán)利要求
1、一種自適應(yīng)運(yùn)動估計(jì)方法,其特征在于包括運(yùn)動矢量信息、宏塊編碼模式信息采集,全局運(yùn)動信息分析和自適應(yīng)運(yùn)動估計(jì)。
2、 根據(jù)權(quán)利要求l所述的一種自適應(yīng)運(yùn)動估計(jì)方法,其特征在于運(yùn)動矢量信息、宏塊 編碼模式信息采集通過直方圖記錄一幀中不同大小運(yùn)動矢量的頻率,并記錄一幀中各宏塊編 碼模式的頻率;對于每個運(yùn)動矢量還需統(tǒng)計(jì)水平分量與垂直分量之間比率的頻率。
3、 根據(jù)權(quán)利要求2所述的一種自適應(yīng)運(yùn)動估計(jì)方法,其特征在于對于不同尺寸的塊幀 間編碼模式,需要記錄的運(yùn)動矢量個數(shù)分別為l個幀間16x16模式,2個幀間16x8和幀間 8x16, 4個幀間8x8, 8個幀間8x4, 8個幀間4x8, 16個幀間4x4。
4、 根據(jù)權(quán)利要求l所述的一種自適應(yīng)運(yùn)動估計(jì)方法,其特征在于全局運(yùn)動信息統(tǒng)計(jì)分 析使用運(yùn)動矢量直方圖確定全局運(yùn)動矢量,并通過統(tǒng)計(jì)方法分析當(dāng)前幀中景物在水平、垂直 方向的運(yùn)動特征。
5、 根據(jù)權(quán)利要求4所述的一種自適應(yīng)運(yùn)動估計(jì)方法,其特征在于運(yùn)動矢量直方圖中頻 率最大的運(yùn)動矢量表示為gmvMax, gnwMaxFrq表示gmvMax歸一后的頻率;運(yùn)動矢量直方圖中 頻率最大的3個運(yùn)動矢量的中值表示為gmvMedian。當(dāng)gmvMax與gravMedian之間整象素距離 大于4且gmvMaxFrq小于0.6,此時(shí)GMV等于gmvMedian,否則GMV等于gmvMax。
6、 根據(jù)權(quán)利要求4所述的一種自適應(yīng)運(yùn)動估計(jì)方法,其特征在于如果所有宏塊運(yùn)動矢 量的水平分量大于2倍垂直分量的概率達(dá)到80%,將標(biāo)識符horizontalMotionFlag置為1; 如果所有宏塊運(yùn)動矢量的垂直分量大于2倍水平分量的概率達(dá)到80%,將標(biāo)識符 verticalMotionFlag置為1;否則horizontalMotionFlag和verticalMotionFlag都被置為 0。
7、 根據(jù)權(quán)利要求l所述的一種自適應(yīng)運(yùn)動估計(jì)方法,其特征在于自適應(yīng)運(yùn)動估計(jì)包括 的步驟為第一步驟當(dāng)GMV與MVP之間的整象素距離超過Wl寬度的一半時(shí),將使用2個搜索窗 Wl和W2,其中Wl以MVP為搜索窗中心,W2以GMV為搜索窗中心; 第二步驟如果不滿足上述條件,檢査當(dāng)前宏塊相鄰左邊和上邊宏塊的編碼模式是否均 滿足以下條件為幀內(nèi)4x4模式,或?yàn)閹瑑?nèi)16x16模式且宏塊SAD大于5000;如果當(dāng)前宏塊 相鄰左邊和上邊宏塊均滿足條件,則檢查全局運(yùn)動優(yōu)勢方向標(biāo)識符horizontalMotionFlag和 verticalMotionFlag,若horizontalMotionFlag為TRUE,則選擇W3作為搜索窗,若 verticalMotionFlag為TRUE,則選擇W4作為搜索窗;如果上述條件仍不滿足,則選擇搜索 窗W5。
8、根據(jù)權(quán)利要求1所述的一種自適應(yīng)運(yùn)動估計(jì)方法在視頻編碼器中的應(yīng)用,其特征在于 (l)視頻序列的第一幀按照I幀編碼,對每個宏塊進(jìn)行幀內(nèi)預(yù)測,然后當(dāng)前塊的預(yù)測值與原始 值之間的差值進(jìn)行DCT變換和量化,最后對量化后的DCT系數(shù)和宏塊頭等信息進(jìn)行熵編碼; 所有宏塊編碼結(jié)束后,進(jìn)入第二幀的編碼;(2) 第二幀的編碼首先對每個宏塊分別進(jìn)行幀內(nèi)預(yù)測和運(yùn)動估計(jì),由于此時(shí)前一幀的全局 運(yùn)動信息無效,這里的運(yùn)動估計(jì)未使用自適應(yīng)運(yùn)動估計(jì)方法;之后,編碼器根據(jù)率失真成本 進(jìn)行模式?jīng)Q策,得到宏塊編碼模式;此時(shí),需要采集全局運(yùn)動信息分析步驟需要的運(yùn)動矢量 和宏塊編碼模式信息;然后對當(dāng)前塊和參考塊之間的殘差進(jìn)行DCT變換和量化,最后對量化 后的DCT系數(shù)和運(yùn)動矢量、宏塊頭等信息進(jìn)行熵編碼;當(dāng)?shù)诙泻陦K全部編碼結(jié)束后, 本發(fā)明需要根據(jù)之前采集的所有宏塊的運(yùn)動矢量和宏塊編碼模式信息,進(jìn)行全局運(yùn)動信息分 析;(3) 第三幀及之后若干幀的編碼首先對每個宏塊分別進(jìn)行幀內(nèi)預(yù)測和運(yùn)動估計(jì),此時(shí),運(yùn) 動估計(jì)使用自適應(yīng)運(yùn)動估計(jì)方法;之后,編碼器根據(jù)率失真成本進(jìn)行模式?jīng)Q策,得到宏塊編 碼模式;此時(shí),需要采集全局運(yùn)動信息分析步驟需要的運(yùn)動矢量和宏塊編碼模式信息;然后 對當(dāng)前塊和參考塊之間的殘差進(jìn)行DCT變換和量化,最后對量化后的DCT系數(shù)和運(yùn)動矢量、 宏塊頭等信息進(jìn)行熵編碼;當(dāng)前幀所有宏塊全部編碼結(jié)束后,需要根據(jù)之前采集的所有宏塊 的運(yùn)動矢量和宏塊編碼模式信息,進(jìn)行全局運(yùn)動信息分析,用于下一幀的自適應(yīng)運(yùn)動估計(jì)。
全文摘要
本發(fā)明涉及一種自適應(yīng)運(yùn)動估計(jì)方法,包括運(yùn)動矢量信息、宏塊編碼模式信息采集,全局運(yùn)動信息分析和自適應(yīng)運(yùn)動估計(jì)。運(yùn)動矢量信息、宏塊編碼模式信息采集通過直方圖記錄一幀中不同大小運(yùn)動矢量的頻率,并記錄一幀中各宏塊編碼模式的頻率;對于每個運(yùn)動矢量還需統(tǒng)計(jì)水平分量與垂直分量之間比率的頻率。全局運(yùn)動信息統(tǒng)計(jì)分析使用運(yùn)動矢量直方圖確定全局運(yùn)動矢量,并通過統(tǒng)計(jì)方法分析當(dāng)前幀中景物在水平、垂直方向的運(yùn)動特征。本發(fā)明提出的自適應(yīng)運(yùn)動估計(jì)根據(jù)全局運(yùn)動矢量與預(yù)測運(yùn)動矢量之間的關(guān)系,以及相鄰宏塊的編碼模式來選擇搜索模式。
文檔編號H04N7/26GK101389023SQ20081015535
公開日2009年3月18日 申請日期2008年10月21日 優(yōu)先權(quán)日2008年10月21日
發(fā)明者翼 孫, 李維衡, 偉 高 申請人:鎮(zhèn)江唐橋微電子有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1