專利名稱:實(shí)時(shí)運(yùn)動(dòng)圖像編碼的高速運(yùn)動(dòng)估計(jì)方法及其裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種實(shí)時(shí)運(yùn)動(dòng)圖像編碼的超高速運(yùn)動(dòng)估計(jì)方法,更具體地涉及這樣一種運(yùn)動(dòng)估計(jì)方法,它通過對(duì)諸如MPEG-2的運(yùn)動(dòng)畫面編碼按運(yùn)動(dòng)估計(jì)在低分辨率下確定多個(gè)候選運(yùn)動(dòng)矢量、利用相鄰塊的運(yùn)動(dòng)矢量相關(guān)性確定各候選運(yùn)動(dòng)矢量、選擇以多個(gè)運(yùn)動(dòng)矢量為中心的搜索區(qū)、以及計(jì)算運(yùn)動(dòng)矢量,來減少運(yùn)動(dòng)矢量的計(jì)算量。
在運(yùn)動(dòng)圖像編碼中廣泛采用了通過除去時(shí)域重復(fù)(temporal duplication)來獲得高數(shù)據(jù)壓縮率的運(yùn)動(dòng)補(bǔ)償編碼,該編碼在國際視頻編碼標(biāo)準(zhǔn)如MPEG-1、2、和4或H-263標(biāo)準(zhǔn)中有著重要作用。
運(yùn)動(dòng)補(bǔ)償編碼通過運(yùn)動(dòng)估計(jì)預(yù)測(cè)一個(gè)與從先前幀信息接收的圖像最相近的圖像,并轉(zhuǎn)換編碼一個(gè)通過從接收?qǐng)D像中減去估計(jì)圖像獲得的減法圖像。
圖1中示出了一種通常的運(yùn)動(dòng)圖像編碼裝置。參照?qǐng)D1,通常的運(yùn)動(dòng)圖像編碼裝置包括幀存儲(chǔ)器102、運(yùn)動(dòng)估計(jì)器104和106、運(yùn)動(dòng)補(bǔ)償器108、減法器110、離散余弦變換器112、量化器114、逆離散余弦變換器118、加法器120、幀延遲器122、前向分析和編碼率控制器124、可變長度編碼器126以及緩沖器128。
按幀單元輸入的圖像被存儲(chǔ)在幀存儲(chǔ)器102中。第一運(yùn)動(dòng)估計(jì)器104按整數(shù)象素單元來計(jì)算圖像的運(yùn)動(dòng)矢量。第二運(yùn)動(dòng)估計(jì)器106利用從第一運(yùn)動(dòng)估計(jì)器104接收的運(yùn)動(dòng)矢量、從幀存儲(chǔ)器102接收的視頻信號(hào)、和從幀延遲器122接收的先前幀信息,按半象素單元來計(jì)算當(dāng)前輸入圖像的運(yùn)動(dòng)矢量。
運(yùn)動(dòng)補(bǔ)償器108根據(jù)從第二運(yùn)動(dòng)估計(jì)器106接收的運(yùn)動(dòng)矢量和從幀延遲器122接收的先前幀信息,執(zhí)行運(yùn)動(dòng)補(bǔ)償,以輸出當(dāng)前幀的估計(jì)圖像。通過獲得由減法器110從接收自幀存儲(chǔ)器102的當(dāng)前運(yùn)動(dòng)圖像中減去運(yùn)動(dòng)補(bǔ)償后的估計(jì)圖像所得到的減法圖像,去除運(yùn)動(dòng)圖象時(shí)域重復(fù)。這種運(yùn)動(dòng)估計(jì)和補(bǔ)償處理是按16×16的塊單元來執(zhí)行的,通常,將這樣的塊稱作宏塊。在運(yùn)動(dòng)估計(jì)和補(bǔ)償后得到的減法圖像,還要經(jīng)受離散余弦變換器112和量化器114的離散余弦變換和量化處理。于是,去除了減法圖像的剩余空間重復(fù)。運(yùn)動(dòng)矢量和量化后的減法圖像由可變長度編碼器126編碼,并按位流的形式經(jīng)緩沖器128傳送。
前向分析和編碼率控制器124控制可變長度編碼器126的編碼率。逆量化器116和逆離散余弦變換器118內(nèi)插和恢復(fù)量化后的視頻信號(hào)。加法器120將內(nèi)插和恢復(fù)的結(jié)果與運(yùn)動(dòng)補(bǔ)償后的視頻信號(hào)相加,在幀延遲器122中存儲(chǔ)相加結(jié)果。幀延遲器122存儲(chǔ)的圖像幀是當(dāng)前圖像幀的前一圖像幀,幀延遲器122存儲(chǔ)的該先前圖象幀信息被輸入到第二運(yùn)動(dòng)估計(jì)器106和運(yùn)動(dòng)補(bǔ)償器108。
目前,本領(lǐng)域技術(shù)人員已經(jīng)公知在處理運(yùn)動(dòng)圖像的運(yùn)動(dòng)估計(jì)和補(bǔ)償方法中按幀單元進(jìn)行運(yùn)動(dòng)估計(jì)和補(bǔ)償?shù)姆椒ê桶磮?chǎng)單元進(jìn)行運(yùn)動(dòng)估計(jì)和補(bǔ)償?shù)姆椒?,因此這些方法的說明在本說明書中被省略。
在通過整塊規(guī)模匹配的分析(FSBMA)來進(jìn)行運(yùn)動(dòng)估計(jì)的常規(guī)方法中,通過將當(dāng)前幀劃分成均一尺寸的塊、將所劃分的各個(gè)塊按照給定的匹配標(biāo)準(zhǔn)與在參考幀的搜索區(qū)中所有塊進(jìn)行比較、并搜索最佳匹配塊位置,來估計(jì)各個(gè)塊的兩維運(yùn)動(dòng)矢量。在這種常規(guī)塊匹配方法中采用計(jì)算相對(duì)簡單的平均絕對(duì)差值(MAD)作為搜索最佳匹配塊的匹配標(biāo)準(zhǔn)。利用方程1計(jì)算MAD。MAD(i,j)=1N2Σk=1NΣI=1N|ft(k,I)-ft-1(k+i,I+j)|----(1)]]>其中,ft(k,I)是當(dāng)前幀在(k,1)位置上的象素的亮度值,ft-1(k+i,I+j)是從(k,1)移動(dòng)(i,j)后所處位置上的象素的亮度值。
在這種塊匹配方法中,根據(jù)在進(jìn)行編碼時(shí)實(shí)際圖像的運(yùn)動(dòng)來確定最大的運(yùn)動(dòng)估計(jì)范圍。通過比較在運(yùn)動(dòng)估計(jì)范圍中的所有塊與當(dāng)前塊來估計(jì)運(yùn)動(dòng)矢量的FSBMA在估計(jì)增益上具有最佳性能。然而,需要過多的計(jì)算量。例如,若一幀中的最大運(yùn)動(dòng)位移在尺寸為M×N的塊中為±p(間距/幀),則在參考幀中搜索區(qū)的尺寸為(M+2p)×(N+2p)。即,由于按照該匹配標(biāo)準(zhǔn)要比較的候選塊的數(shù)量為(2p+1)2,所以隨著p變大,要實(shí)現(xiàn)實(shí)時(shí)運(yùn)動(dòng)圖像編碼就更困難了。
在電氣與電子工程師協(xié)會(huì)的《視頻技術(shù)的電路與系統(tǒng)》會(huì)刊1995年5月第4期第344至351頁(IEEE Trans.of Circuits & Systems for VideoTechnology,1995,5,(4),pp344-351)的作者為K.M.Nam,J.S.Kim,R.H.Park,Y.S.Shim題目為“采用等分錐的快速分級(jí)運(yùn)動(dòng)矢量估計(jì)算法(A FastHierarchical Motion vector Estimation Algorithm Using Mean Pyramid)”、以及電氣與電子工程師協(xié)會(huì)的《視頻技術(shù)的電路與系統(tǒng)》會(huì)刊1994年4月第1期第88至90頁(IEEE Trans.of Circuits & Systems for Video Technology,1994,4,(1),pp88-90)的題目為“提高用于視頻編碼的3級(jí)搜索區(qū)匹配算法的精度并減小其成本(Accuracy Improvement And Cost Reduction of 3-step SearchRegion Matching Algorithm for Video Coding)”文中提供了解決這種問題的另一種現(xiàn)有技術(shù)。在上述文件中,描述了采用多個(gè)候選方案來代替FSBMA的高速分級(jí)搜索方法。
采用多個(gè)候選方案的該方法能夠解決因分級(jí)搜索而產(chǎn)生的局部最小值問題。然而,要達(dá)到近于FSBMA的性能,仍需要大量的計(jì)算。而且,由于這些方法基于三級(jí)分級(jí)搜索方法,所以它們的共同缺點(diǎn)是不適于估計(jì)大搜索區(qū)中的運(yùn)動(dòng)。
為了解決上述問題,本發(fā)明的目的是提供一種運(yùn)動(dòng)估計(jì)方法,通過它,能夠減小用于計(jì)算運(yùn)動(dòng)矢量的計(jì)算量,從而高速估計(jì)運(yùn)動(dòng)矢量。
本發(fā)明的另一個(gè)目的是提供一種采用該運(yùn)動(dòng)矢量估計(jì)方法實(shí)現(xiàn)的運(yùn)動(dòng)估計(jì)裝置。
因此,為了實(shí)現(xiàn)第一目的,提供了一種通過塊匹配來壓縮運(yùn)動(dòng)圖像的運(yùn)動(dòng)估計(jì)方法,它包括下列步驟(a)通過減小層0的分辨率來提供層1,并通過減小層1的分辨率來提供層2,其中層0是輸入圖像幀;(b)計(jì)算相對(duì)于層2的一搜索區(qū)的平均絕對(duì)差值(MAD);(c)確定至少兩個(gè)使步驟(b)計(jì)算的MAD最小的位置,作為在層1中的初始搜索中心點(diǎn);(d)利用當(dāng)前塊的各相鄰塊的相關(guān)性,在層1中進(jìn)一步確定至少一個(gè)初始搜索中心點(diǎn);(e)在層1中計(jì)算相對(duì)于以初始搜索中心點(diǎn)為中心的各搜索區(qū)的MAD;(f)選擇使步驟(e)計(jì)算的MAD最小的位置,作為在層0中的搜索中心點(diǎn);(g)在層0中相對(duì)于在步驟(f)所選擇的初始搜索中心點(diǎn)為中心計(jì)算搜索區(qū)的MAD;以及(h)根據(jù)在步驟(g)計(jì)算的MAD的位置和原點(diǎn)之間距離的信息,確定最終運(yùn)動(dòng)矢量。
為了實(shí)現(xiàn)第一目的,提供了另一種通過塊匹配來壓縮運(yùn)動(dòng)圖像的運(yùn)動(dòng)估計(jì)方法,它包括下列步驟(a)在輸入圖像幀是層0時(shí),則通過減小層0的分辨率來提供層1,并通過減小層1的分辨率來提供層2;(b)計(jì)算相對(duì)于層2的一搜索區(qū)的平均絕對(duì)差值(MAD);(c)確定兩個(gè)使步驟(b)計(jì)算的MAD最小的位置,作為在層1中的初始搜索中心點(diǎn);(d)利用當(dāng)前塊的各相鄰塊的相關(guān)性,進(jìn)一步確定一個(gè)初始搜索中心點(diǎn);(e)在層1中計(jì)算相對(duì)于以三個(gè)初始搜索中心點(diǎn)為搜索中心的搜索區(qū)的MAD;(f)選擇使步驟(e)計(jì)算的MAD最小的位置,作為在該層中的初始搜索中心點(diǎn);(g)計(jì)算相對(duì)于層0的該搜索區(qū)的MAD;以及(h)利用在步驟(g)計(jì)算的MAD最小的位置和原點(diǎn)之間距離的信息,確定最終運(yùn)動(dòng)矢量。
最好是,所述步驟(a)通過在水平和垂直方向上將輸入層0的分辨率減小到1/2和1/4,來提供層1和層2。
最好是,所述步驟(d)通過計(jì)算各塊的運(yùn)動(dòng)矢量的平均值來選擇使MAD最小的位置,作為在層1中的初始搜索中心點(diǎn);在所述各塊中,各外圍塊之間運(yùn)動(dòng)矢量的絕對(duì)差值不大于預(yù)定閾值。
最好是,在所述步驟(e)和(g)中的搜索區(qū)由5×5個(gè)象素組成。
為了實(shí)現(xiàn)第二目的,提供了一種通過塊匹配來壓縮運(yùn)動(dòng)圖像的運(yùn)動(dòng)估計(jì)裝置,包括分辨率控制裝置,用于通過降低層0的分辨率來提供層1,并且通過降低層1的分辨率來提供層2,其中層0是輸入圖像幀;MAD計(jì)算裝置,用于計(jì)算相對(duì)于層2搜索區(qū)的第一MAD,計(jì)算相對(duì)于層1中將對(duì)應(yīng)于各候選運(yùn)動(dòng)矢量的位置作為搜索中心點(diǎn)的搜索區(qū)的第二MAD,并且計(jì)算相對(duì)于層0中將使第二MAD最小的位置作為層0的搜索中心點(diǎn)的搜索區(qū)的第三MAD;初始搜索中心點(diǎn)判定裝置,用于確定至少兩個(gè)使第一MAD最小的位置,作為在層1中的初始搜索中心點(diǎn),并且進(jìn)一步利用當(dāng)前塊的各外圍塊的相關(guān)性來選擇至少一個(gè)初始搜索中心點(diǎn);以及,最終運(yùn)動(dòng)矢量判定裝置,用于根據(jù)在第三MAD最小的位置和原點(diǎn)之間距離的信息,來確定最終運(yùn)動(dòng)矢量。
本發(fā)明的上述目的和優(yōu)點(diǎn)將通過參照附圖對(duì)其優(yōu)選實(shí)施例的詳細(xì)說明來更清楚地體現(xiàn),附圖中圖1是應(yīng)用本發(fā)明的運(yùn)動(dòng)圖像編碼裝置原理結(jié)構(gòu)的方框圖;圖2是表示本發(fā)明一實(shí)施例的運(yùn)動(dòng)估計(jì)方法主要步驟的流程圖;圖3描述本發(fā)明該實(shí)施例在由運(yùn)動(dòng)估計(jì)方法執(zhí)行分級(jí)搜索時(shí)的分級(jí)搜索位置;圖4A至圖4F描述本發(fā)明該實(shí)施例在運(yùn)動(dòng)估計(jì)方法中采用當(dāng)前塊與外圍塊的相關(guān)性來確定候選運(yùn)動(dòng)矢量的過程。
以下,將參照附圖對(duì)本發(fā)明用于實(shí)時(shí)運(yùn)動(dòng)圖像編碼的超高速運(yùn)動(dòng)估計(jì)方法及其裝置的優(yōu)選實(shí)施例進(jìn)行詳細(xì)說明。
圖2是表示本發(fā)明一實(shí)施例的運(yùn)動(dòng)估計(jì)方法主要步驟的流程圖。圖3描述了由該運(yùn)動(dòng)估計(jì)方法執(zhí)行分級(jí)搜索時(shí)的分級(jí)搜索位置。參照?qǐng)D2,在本發(fā)明的運(yùn)動(dòng)估計(jì)方法中,在水平和垂直方向上將接收?qǐng)D像幀的分辨率減小到1/2和1/4,于是形成了層1和層2(步驟202)。減小分辨率是為了通過減小搜索區(qū)尺寸來減小用于計(jì)算運(yùn)動(dòng)矢量的計(jì)算量。例如,若整個(gè)搜索區(qū)尺寸為R×R,則本實(shí)施例中搜索區(qū)的范圍為(R/4)×(R/4)。
計(jì)算相對(duì)于層2的搜索區(qū)SR(2)(圖3)的平均絕對(duì)差值(MAD)(步驟204)。由于所確定的搜索區(qū)SR(2)(圖3)是來自-Ns到+Ns-1的區(qū)域,其中Ns為預(yù)定正整數(shù),則它為寬度和長度均為2Ns且包含0的區(qū)域,于是搜索位置的數(shù)量為(2Ns×2Ns)/16,即(Ns×Ns)/4。
然后,選擇使在步驟204中計(jì)算的MAD最小即估計(jì)誤差最小的兩個(gè)位置,作為下一步(在層1中)的初始搜索中心點(diǎn)(步驟206)。
進(jìn)一步選擇一個(gè)初始搜索中心點(diǎn)。下面將參照?qǐng)D4來說明選擇進(jìn)一步的初始中心點(diǎn)的過程。按諸如宏塊等的塊單元進(jìn)行數(shù)字運(yùn)動(dòng)圖像的壓縮。例如,可以逐行地順序處理各塊。
如圖4中所示,本發(fā)明中采用的外圍塊是三個(gè)相關(guān)的塊。而且,根據(jù)運(yùn)動(dòng)矢量間的相關(guān)性,可將外圍塊劃分成如圖4所示的五個(gè)組。例如,若外圍塊的運(yùn)動(dòng)矢量MV為如圖4A所示的各MV,則在外圍塊之間的運(yùn)動(dòng)矢量的絕對(duì)差值由方程2來定義。
S1=‖MV1-MV2‖,S2=‖MV2-MV3‖, ...(2)S3=‖MV3-MV1‖之后,定義D為用于檢查兩個(gè)運(yùn)動(dòng)矢量之間相似性的閾值。然后,根據(jù)運(yùn)動(dòng)矢量之間的相關(guān)性,將外圍塊分成五組。即,參照?qǐng)D4B,組1滿足ξ1≤D、ξ2≤D以及ξ3≤D的條件。參照?qǐng)D4C,組2滿足ξ1≤D、ξ2>D以及ξ3>D的條件。參照?qǐng)D4D,組3滿足ξ1>D、ξ2≤D以及ξ3>D的條件。參照?qǐng)D4E,組4滿足的ξ1>D、ξ2>D以及ξ3≤D的條件。若不滿足上述條件,就對(duì)應(yīng)于組5。分別在組1、2、3和4的情況下,計(jì)算的運(yùn)動(dòng)矢量分別為MV=(MVi+MV2+MV3)/3、MV=(MVi+MV2)/2、MV=(MV2+MV3)/2、以及MV=(MVi+MV3)/2。選擇使計(jì)算的運(yùn)動(dòng)矢量的平均值最小的位置,作為初始搜索中心點(diǎn)。
在此實(shí)施例中,只是為了解釋的目的,說明了按照運(yùn)動(dòng)矢量的絕對(duì)差值將外圍塊分成五組并通過計(jì)算各組中平均運(yùn)動(dòng)矢量來確定初始搜索點(diǎn)的一種方法,然而,可將其修改成另一種利用外圍塊運(yùn)動(dòng)矢量相關(guān)性來選擇一初始搜索中心點(diǎn)的方法,所以它沒有限制由所附權(quán)利要求限定的本發(fā)明的范圍。
然后,在層1中計(jì)算基于三個(gè)初始搜索中心點(diǎn)的搜索區(qū)SR1(1)、SR2(1)和SR3(1)的各MAD(步驟210)。在本實(shí)施例中,所設(shè)置的第一層中的搜索區(qū)按搜索中心點(diǎn)的±2個(gè)象素來構(gòu)成,即總共有5×5個(gè)象素。
然后,選擇使在步驟210中計(jì)算的MAD最小的位置,作為在層0中的初始搜索中心點(diǎn)(步驟212)。采用相對(duì)于所選擇的初始搜索中心點(diǎn)的±2個(gè)象素的區(qū)域作為層0的搜索區(qū),來計(jì)算MAD(步驟214)。
利用使所計(jì)算的MAD最小的位置和原點(diǎn)之間距離的信息,來確定最終的運(yùn)動(dòng)矢量(步驟216)。在兩維圖像的情況下,所確定的最終運(yùn)動(dòng)矢量是x-y軸坐標(biāo)值。
利用MPEG-2試驗(yàn)圖像進(jìn)行一模擬試驗(yàn),以評(píng)價(jià)本發(fā)明的運(yùn)動(dòng)估計(jì)方法的性能。在本領(lǐng)域技術(shù)人員所公知的試驗(yàn)圖像中,采用五個(gè)MPEG-2圖像序列,即‘足球’(fb)、‘轎車’(car)、‘蘇茜’(sus)、‘汽車與日歷’(mob),‘激昂的啦啦隊(duì)隊(duì)長’(cheer),作為輸入圖像。
所有圖像具有30Hz的幀速率,并分別由150幀組成。各幀的尺寸為720×480。在層2、1和0中選擇搜索點(diǎn)距離分別為4、2和1的尺寸為64×64(Ns=32)、10×10、和5×5的搜索區(qū)。在層0中的塊尺寸NB為16??紤]到相似性在偏離8個(gè)象素時(shí)會(huì)降低,將用于檢查外圍塊之間相關(guān)性的閾值D設(shè)置為8。該值是層2中搜索點(diǎn)距離值的兩倍。
為了證明本發(fā)明的運(yùn)動(dòng)估計(jì)方法的效果,將FSBMA的性能與一般分級(jí)搜索方法的性能相比較。只將具有最小估計(jì)差值的三個(gè)運(yùn)動(dòng)矢量確定為采用多個(gè)候選運(yùn)動(dòng)矢量的一般分級(jí)搜索方法中層2的候選運(yùn)動(dòng)矢量。同時(shí),在FSBMA中從相鄰塊的運(yùn)動(dòng)矢量中估計(jì)第三候選運(yùn)動(dòng)矢量。表1示出對(duì)MPEG-2試驗(yàn)圖像的首批150幀進(jìn)行的運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償?shù)谋容^結(jié)果。
表1
參照表1,與FSBMA相比,本發(fā)明的運(yùn)動(dòng)估計(jì)方法的性能略低大約0.2dB,然而,其復(fù)雜度僅為FSBMA方法的1.5%。如果計(jì)算每個(gè)象素的MAD所需的運(yùn)算次數(shù)和塊數(shù)量分別為N和NB,則復(fù)雜度可通過表示式
來估算。這里
和25分別代表在層2、層1和層0分辨率下的計(jì)算量的比值。因此,對(duì)于32和64的NS,本發(fā)明運(yùn)動(dòng)估計(jì)方法的復(fù)雜度是FSBMA的復(fù)雜度的1.5%和0.7%。
而且,表2示出了對(duì)需要相對(duì)大搜索區(qū)的MPEG-2編碼器應(yīng)用本發(fā)明運(yùn)動(dòng)估計(jì)方法的結(jié)果。在本試驗(yàn)中,畫面組(GOP)的數(shù)目N、P幀之間的距離以及目標(biāo)位速率T分別設(shè)置為12、2和6Mbps。表2示出了再現(xiàn)圖像的PSNR的比較結(jié)果。
表2
參照表2,本發(fā)明的運(yùn)動(dòng)估計(jì)方法的計(jì)算量顯著減少到FSBMA的計(jì)算量的0.9%,而兩者的PSNR幾乎相等。
如上所述,在本發(fā)明的運(yùn)動(dòng)估計(jì)方法中,計(jì)算量小,并且,由于有效地利用了基于幀間最小估計(jì)差值的多個(gè)候選運(yùn)動(dòng)矢量和運(yùn)動(dòng)矢量空間的相關(guān)性,所以能夠估計(jì)高速運(yùn)動(dòng)。
本發(fā)明的用于實(shí)時(shí)運(yùn)動(dòng)圖像編碼的超高速運(yùn)動(dòng)估計(jì)方法可以實(shí)現(xiàn)為裝置。運(yùn)動(dòng)估計(jì)裝置(未示出)包括分辨率控制器、MAD計(jì)算器、初始搜索中心點(diǎn)判定器、以及最終運(yùn)動(dòng)矢量判定器。
分辨率控制器在接收到的圖像幀是層0時(shí)通過降低層0的分辨率來提供層1,并且通過降低層1的分辨率來提供層2。例如,在分辨率減小到1/2時(shí)可以利用兩個(gè)相鄰象素的平均值來實(shí)現(xiàn)一個(gè)圖像幀,并且在分辨率減小到1/4時(shí),可以利用四個(gè)相鄰象素的平均值來實(shí)現(xiàn)一個(gè)圖像幀。
計(jì)算MAD要計(jì)算相對(duì)于層2中搜索區(qū)的第一MAD,計(jì)算相對(duì)于層1中采用候選運(yùn)動(dòng)矢量所對(duì)應(yīng)的位置作為搜索中心點(diǎn)的搜索區(qū)的第二MAD,計(jì)算相對(duì)于層0中采用使第二MAD最小的位置作為層0的搜索中心點(diǎn)的搜索區(qū)的第三MAD。
初始搜索中心點(diǎn)判定器確定至少兩個(gè)使第一MAD最小的位置,作為下一步(層1)的初始搜索中心點(diǎn)。而且,初始搜索中心點(diǎn)判定器進(jìn)一步利用當(dāng)前塊的各外圍塊的相關(guān)性來確定至少一個(gè)初始搜索中心點(diǎn),作為下一步(層1)的初始搜索中心點(diǎn)。最終運(yùn)動(dòng)矢量判定器根據(jù)使第三MAD最小的位置和原點(diǎn)之間距離的信息來確定最終運(yùn)動(dòng)矢量。
而且,本發(fā)明運(yùn)動(dòng)估計(jì)方法的各個(gè)步驟可以寫成程序,該程序能夠在計(jì)算機(jī)中執(zhí)行,而且,這些步驟可以在通常的數(shù)字計(jì)算機(jī)中實(shí)現(xiàn)以使運(yùn)行來自計(jì)算機(jī)所用媒體的程序。這些媒體可以是如軟盤或硬盤的磁記錄媒體、如CD-ROM或DVD的光記錄媒體、或如通過因特網(wǎng)傳輸?shù)妮d波。而且,本發(fā)明所述領(lǐng)域的任何程序員都可容易推斷出這些功能性程序、代碼、和代碼段。
權(quán)利要求
1.一種通過塊匹配來壓縮運(yùn)動(dòng)圖像的運(yùn)動(dòng)估計(jì)方法,其特征在于該方法包括下列步驟(a)通過減小層0的分辨率來提供層1,并通過減小層1的分辨率來提供層2,其中層0是輸入圖像幀;(b)計(jì)算相對(duì)于層2的一搜索區(qū)的平均絕對(duì)差值(MAD);(c)確定至少兩個(gè)使步驟(b)計(jì)算的MAD最小的位置,作為在層1中的初始搜索中心點(diǎn);(d)利用當(dāng)前塊的各相鄰塊的相關(guān)性,在層1中進(jìn)一步確定至少一個(gè)初始搜索中心點(diǎn);(e)在層1中計(jì)算相對(duì)于以初始搜索中心點(diǎn)為中心的各搜索區(qū)的MAD;(f)選擇使步驟(e)計(jì)算的MAD最小的位置,作為在層0中的搜索中心點(diǎn);(g)在層0中相對(duì)于在步驟(f)所選擇的初始搜索中心點(diǎn)為中心計(jì)算搜索區(qū)的MAD;(h)根據(jù)在步驟(g)計(jì)算的MAD的位置和原點(diǎn)之間距離的信息,確定最終運(yùn)動(dòng)矢量。
2.一種通過塊匹配來壓縮運(yùn)動(dòng)圖像的運(yùn)動(dòng)估計(jì)方法,其特征在于該方法包括下列步驟(a)在輸入圖像幀是層0時(shí),則通過減小層0的分辨率來提供層1,并通過減小層1的分辨率來提供層2;(b)計(jì)算相對(duì)于層2的一搜索區(qū)的平均絕對(duì)差值(MAD);(c)確定兩個(gè)使步驟(b)計(jì)算的MAD最小的位置,作為在層1中的初始搜索中心點(diǎn);(d)利用當(dāng)前塊的各相鄰塊的相關(guān)性,進(jìn)一步確定一個(gè)初始搜索中心點(diǎn);(e)在層1中計(jì)算相對(duì)于以三個(gè)初始搜索中心點(diǎn)為搜索中心的搜索區(qū)的MAD;(f)選擇使步驟(e)計(jì)算的MAD最小的位置,作為在該層中的初始搜索中心點(diǎn);(g)計(jì)算相對(duì)于層0的該搜索區(qū)的MAD;以及(h)利用使步驟(g)計(jì)算的MAD最小的位置和原點(diǎn)之間距離的信息,確定最終運(yùn)動(dòng)矢量。
3.如權(quán)利要求2所述的方法,其特征在于,所述步驟(a)通過在水平和垂直方向上將輸入層0的分辨率減小到1/2和1/4,來提供層1和層2。
4.如權(quán)利要求2所述的方法,其特征在于,所述步驟(d)通過計(jì)算各塊的運(yùn)動(dòng)矢量的平均值來選擇使MAD最小的位置,作為在層1中的初始搜索中心點(diǎn);在所述各塊中,各外圍塊之間運(yùn)動(dòng)矢量的絕對(duì)差值不大于預(yù)定閾值。
5.如權(quán)利要求2所述的方法,其特征在于,在所述步驟(e)和(g)中的搜索區(qū)由5×5個(gè)象素組成。
6.一種通過塊匹配來壓縮運(yùn)動(dòng)圖像的運(yùn)動(dòng)估計(jì)裝置,其特征在于該裝置包括分辨率控制裝置,用于通過降低層0的分辨率來提供層1,并且通過降低層1的分辨率來提供層2,其中層0是輸入圖像幀;MAD計(jì)算裝置,用于計(jì)算相對(duì)于層2搜索區(qū)的第一MAD,相對(duì)于層1中將對(duì)應(yīng)于各候選運(yùn)動(dòng)矢量的位置作為搜索中心點(diǎn)的搜索區(qū)計(jì)算第二MAD,并且相對(duì)于層0中將使第二MAD最小的位置作為層0的搜索中心點(diǎn)的搜索區(qū)計(jì)算第三MAD;初始搜索中心點(diǎn)判定裝置,用于確定至少兩個(gè)使第一MAD最小的位置,作為在層1中的初始搜索中心點(diǎn),并且進(jìn)一步利用當(dāng)前塊的各外圍塊的相關(guān)性來選擇至少一個(gè)初始搜索中心點(diǎn);以及最終運(yùn)動(dòng)矢量判定裝置,用于根據(jù)使第三MAD最小的位置和原點(diǎn)之間距離的信息,來確定最終運(yùn)動(dòng)矢量。
7.如權(quán)利要求6所述的裝置,其特征在于,所述分辨率控制裝置分別通過將接收層0的分辨率減小到1/2和1/4,來提供層1和層2。
8.如權(quán)利要求6所述的裝置,其特征在于,所述初始搜索中心點(diǎn)判定裝置計(jì)算各塊的運(yùn)動(dòng)矢量的平均值并且選擇使各運(yùn)動(dòng)矢量的平均值最小的位置,作為在層1中的初始搜索中心點(diǎn);在所述各塊中,各外圍塊之間運(yùn)動(dòng)矢量的絕對(duì)差值不大于預(yù)定閾值。
9.如權(quán)利要求6所述的裝置,其特征在于,所述搜索區(qū)由5×5個(gè)象素組成。
全文摘要
一種通過塊匹配來壓縮運(yùn)動(dòng)圖像的運(yùn)動(dòng)估計(jì)方法及其裝置,其中:依次減小輸入圖像幀的分辨率以分別形成層0、1和2;分別根據(jù)相對(duì)于層2搜索區(qū)的平均絕對(duì)差值(MAD)和當(dāng)前塊的各相鄰塊的相關(guān)性,在層1中確定三個(gè)搜索區(qū);根據(jù)相對(duì)于層1中各搜索區(qū)的MAD,在層0中選擇一搜索區(qū);根據(jù)使相對(duì)于層0中搜索區(qū)的MAD最小的位置和原點(diǎn)之間距離,確定最終運(yùn)動(dòng)矢量。與整塊匹配分析(FSBMA)相比,顯著降低了復(fù)雜度,能夠高速地進(jìn)行運(yùn)動(dòng)估計(jì)。
文檔編號(hào)G06T9/00GK1272031SQ9910519
公開日2000年11月1日 申請(qǐng)日期1999年4月27日 優(yōu)先權(quán)日1999年4月27日
發(fā)明者羅鐘范, 林慶院, 崔健榮 申請(qǐng)人:三星電子株式會(huì)社, 韓國科學(xué)技術(shù)院