專利名稱:對二進制圖象進行輪廓運動估計的方法和裝置的制作方法
技術領域:
本發(fā)明涉及一種用于通過使用一加權塊匹配算法找出產(chǎn)生最小加權誤差的一最佳運動矢量的方法和裝置;而且,更具體地,涉及一種用于通過分配一隨一視頻幀中的象素而變化的權重來確定加權誤差的方法和裝置。
數(shù)字視頻信號的傳輸能夠傳遞比以模擬信號傳輸?shù)囊曨l圖象的質量高得多的視頻圖象。當一包含一序列圖象幀的圖象信號被以一數(shù)字形式表示時,就產(chǎn)生了大量的數(shù)據(jù),尤其是在高清晰度電視系統(tǒng)的情況下。然而,由于常規(guī)傳輸信道的可用頻率帶寬有限,為了通過此有限的信道帶寬發(fā)送這些大量的數(shù)字數(shù)據(jù),就需要壓縮或減少傳輸數(shù)據(jù)量。在各種視頻壓縮技術中,所謂的混和編碼技術被認為是最有效的,該混合編碼技術將時間和空間壓縮技術與統(tǒng)計編碼技術結合在一起。
大多數(shù)混和編碼技術采用一運動補償DPCM(差分脈沖碼調制)、二維DCT(離散余弦變換)、DCT系數(shù)量化,和VLC(可變長度編碼)。運動補償DPCM是一確定一目標在當前幀和其基準幀(例如一先前幀)之間的運動,根據(jù)該目標的運動流預測當前幀,并產(chǎn)生一代表該當前幀和其預測值之間的差值的差分信號的過程。
減少或去除諸如運動補償DPCM數(shù)據(jù)的圖象數(shù)據(jù)之間的空間冗余的二維DCT,將一數(shù)字圖象數(shù)據(jù)塊,例如8×8象素的一塊,轉換成一組DCT系數(shù)數(shù)據(jù)。此項技術被描述于Chen和Pratt的“Scene Adaptive Coder”(場景自適應編碼器)上,刊于IEEE Transctions on Communications,COM-32,NO.3,第225-231頁(1984年3月)。通過用一量化器、鋸齒掃描器、和VLC處理此PCT系數(shù)數(shù)據(jù),待被發(fā)送的數(shù)據(jù)量能被有效地壓縮。
特別地,在運動補償DPCM中,例如通過使用塊匹配算法,根據(jù)對當前幀和先前幀之間的運動的估計,當前幀數(shù)據(jù)被從先前幀數(shù)據(jù)預測出(見例如J.R.J ain等人的“Displacement Measurement and Its Application inInterframe Image Coding”(位移測量及其在幀間圖象編碼中的應用)刊于IEEE Transactions of Communications,COM-29,NO.12,第1799-1808頁(1981年12月))。該被估計的運動可以根據(jù)表示象素在當前幀和先前幀之間的位移的二維運動矢量來被描述。
根據(jù)塊匹配算法,一當前幀被分成多個搜索塊。一搜索塊的大小典型地介于8×8和32×32象素之間的范圍。為在一當前幀中確定一搜索塊的運動矢量,在該當前幀的搜索塊和一先前幀內的一通常較大的搜索區(qū)內所包括的多個相等大小的候選塊中的每一個之間執(zhí)行一相似性計算。使用諸如平均絕對誤差或均方差的一誤差函數(shù)來執(zhí)行該當前幀的該搜索塊和該搜索區(qū)中的每一候選塊之間的相似性計算。并且,通過定義,一運動矢量代表了該搜索塊和產(chǎn)生一最小誤差函數(shù)的一候選塊之間的位移。
眾所周知,二進制圖象中的每一象素具有一識別其所屬的一個區(qū)的標識例如,在一背景中的一象素被標識為“0”;而在一目標中的象素被標識為非0值。因此,如果將使用作為誤差函數(shù)的平均絕對誤差的常規(guī)塊匹配算法用于二進制圖象的一輪廓運動估計,則該誤差函數(shù)的作用只是計數(shù)未匹配象素的數(shù)目,其中每一未匹配象素是一候選塊中的一象素,該候選塊的在一搜索塊中的相應的象素具有與其不同的標識值。
參考
圖1,示出了一搜索塊SB,一第一候選塊CB1和一第二候選塊CB2,帶有標為“0”的未匹配象素。如例示,當搜索塊SB與第一候選塊CB1相重疊時,未匹配象素數(shù)為6;而當搜索塊SB與第二候選塊CB2相重疊時,未匹配象素數(shù)為7。于是,第一候選塊CB1被選作產(chǎn)生最小誤差函數(shù)的塊,且第一候選塊CB1距搜索塊SB的位移被選作為最佳運動矢量,即使第二候選塊CB2比第一候選塊CB1在形狀上與搜索塊SB更相似。
如果用這種方法選出運動矢量,則在確定一目標形狀中的真正有效的輪廓信息可能在確定一目標的形狀中不能起適當?shù)淖饔靡虼?,本發(fā)明的一主要目的是提供一種用于通過使用一加權塊匹配算法來找出一產(chǎn)生最小加權誤差的最佳運動矢量的方法和裝置。
根據(jù)本發(fā)明,提供了一種方法,用于進行二進制視頻圖象的當前幀和先前幀之間的運動估計,其中當前幀被分成多個大小相等的搜索塊,該方法包括下列步驟a)在先前幀內形成多個搜索區(qū),其中每一搜索區(qū)相應于每一搜索塊;b)在各搜索區(qū)內形成多個候選塊,每一候選塊具有與搜索塊相同的大小,從而將每一候選塊距該搜索塊的位移提供為每一候選塊的位移矢量;c)用每一候選塊重疊該搜索塊,從而確定一未匹配區(qū)、一匹配區(qū)的邊界和該搜索塊的邊界;d)分配一權重給未匹配區(qū)內的每一象素;e)通過利用在步驟(d)中分配給未匹配區(qū)內的每一象素的權重來計算每一候選塊的一加權誤差;f)將這些加權誤差作相互比較,從而選擇最小加權誤差,并提供一選擇信號,其中該選擇信號指示哪一個位移矢量相應于最小加權誤差;及g)響應于該選擇信號,選擇相應于最小加權誤差的位移矢量,從而將其提供作為最佳運動矢量。
本發(fā)明以上和其它目的和特點將通過參考附圖對優(yōu)選實施例的描述而變得顯然,附圖中圖1示出了一種用于通過一常規(guī)塊匹配算法來確定一搜索塊和一候選塊之間的誤差函數(shù)的方法;圖2表示根據(jù)本發(fā)明的包含有運動估計單元的一輪廓編碼裝置的方框圖;圖3A和3B說明了圖2所示的運動估計單元的一詳細視圖;圖4A說明了根據(jù)本發(fā)明的第一實施例的一種用于根據(jù)匹配區(qū)的邊界象素,來分配權重的方法;及圖4B說明了根據(jù)本發(fā)明的第二實施例的一種用于根據(jù)搜索塊的邊界象素來分配權重的方法。
參考圖2,說明了根據(jù)本發(fā)明的包含有一運動估計單元的輪廓編碼裝置1的方框圖。
當前幀的二進制圖象數(shù)據(jù),即當前幀數(shù)據(jù),以分段掩碼(segmentatim mask)的形式被提供給一搜索塊形成單元100,其中該分段掩碼中的每一象素具有一識別其所屬于的區(qū)域的標識。例如,背景中的一象素被標識為“0”而一目標中的每一象素被標識為非0值。搜索塊形成單元100將該當前幀分成多個大小相等的搜索塊,從而通過線路L10向減法單元200和運動估計單元400提供搜索塊數(shù)據(jù)。
運動估計單元400被提供有來自幀存儲器300經(jīng)線路L20以分段掩碼形式的先前幀的二進制圖象數(shù)據(jù),即先前幀數(shù)據(jù)。隨后,運動估計單元400形成對應于該搜索塊的一搜索區(qū)域,從而將其分成多個與搜索塊大小相等的候選塊。運動估計單元400被提供有來自搜索塊形成單元400經(jīng)線路L10的搜索塊數(shù)據(jù),從而通過利用加權塊匹配算法來計算該搜索塊和每一候選塊之間的加權誤差,并確定一最佳候選塊和與其相應的最佳運動矢量。利用加權塊匹配算法的運動估計技術還將參考圖3和圖4被詳細描述。最佳運動矢量被提供給一運動補償單元500。
運動補償單元500被提供有來自運動估計單元400的最佳運動矢量,及經(jīng)線路L20來自幀存儲器300的相應于該最佳運動矢量的最佳候選塊的象素數(shù)據(jù)。隨后,運動補償單元500通過利用該最佳運動矢量對該最佳候選塊進行運動補償,從而產(chǎn)生一運動補償?shù)淖罴押蜻x塊并經(jīng)線路L30將該運動補償?shù)淖罴押蜻x塊提供給減法單元200和加法單元800。
減法單元200從線路L10上的搜索塊中減去線路L30上的運動補償?shù)淖罴押蜻x塊,從而向編碼器600提供一減法結果,即一誤差信號。
編碼器600通過利用例如基于基準輪廓的編碼技術來對該誤差信號進行編碼,從而向一發(fā)送器(未示出)和解碼器700提供該經(jīng)編碼的誤差信號。
解碼器700對該經(jīng)編碼的誤差信號進行解碼并將該已解碼的誤差信號發(fā)送給加法單元800。加法單元800將該已解碼的誤差信號加至線路L30上的運動補償?shù)淖罴押蜓a塊,從而產(chǎn)生該當前幀的一重構信號。該當前幀的該重構信號被存儲在幀存儲器300中。
參考圖3A和圖3B,示出了圖2所示的運動估計單元400的詳細方框圖。
先前幀數(shù)據(jù)被從幀存儲器300經(jīng)線路L20提供給搜索區(qū)形成單元410。搜索區(qū)形成單元410用一定大小、形狀和搜索模式來定義與該搜索塊相應的一搜索區(qū),由此執(zhí)行搜索塊的運動估計。在搜索區(qū)形成單元410確定了搜索區(qū)之后,該搜索區(qū)數(shù)據(jù)則被提供給候選塊形成單元420-1至420-N,N是一代表所形成的候選塊的總數(shù)的正整數(shù)。
可能有多個候選塊形成單元,然而為了簡化起見,只描述了3個單元。在每一候選塊形成單元420-1至420-N,在該搜索區(qū)內產(chǎn)生與該搜索塊相同大小的一候選塊;而每一候選塊的象素數(shù)據(jù)被由此輸出給每一塊匹配單元430-1至430-N。這些候選塊距當前幀的搜索塊的位置的相對位移也被作為位移矢量DV1至DVN從候選塊形成單元420-1至420-N輸出給一多路復用器(MUX)470。
如上所述,線路L10上的來自搜索塊形成單元100的搜索塊數(shù)據(jù)也被提供給塊匹配單元430-1至430-N。在每一塊匹配單元430-1至430-N,搜索塊的象素值和相應候選塊的象素值被相互比較。特別地,每一塊匹配單元430-1至430-N用其中一相應的候選塊與該搜索塊相重疊;且給搜索塊數(shù)據(jù)上的該搜索塊的邊界象素、未匹配區(qū)的象素、和匹配區(qū)的邊界象素作上標識。
由于搜索塊數(shù)據(jù)和候選塊數(shù)據(jù)都是分段掩碼形式的,因此如果該象素屬于背景,則該象素值是“0”;而如果該象素屬于一目標則該象素值是,例如為1。該搜索塊的邊界象素是該搜索塊內的一個象素,其象素值為“1”,而與其相鄰的象素的象素值為“0”;未匹配區(qū)域的象素是該搜索塊內的一個象素,該象素在相應候選塊內的相應象素具有與其不同的象素值;而該匹配區(qū)的邊界象素是該搜索塊內的一象素,該象素與未匹配區(qū)的一象素相鄰或當其象素值是“1”時與象素值為“0”的一象素相鄰。
在該搜索塊的邊界的象素處、在未匹配區(qū)內的象素處、和在匹配區(qū)的邊界象素處的被作標識的該搜索塊數(shù)據(jù)經(jīng)線路L50-1至L50-N分別被提供給權重分配單元440-1至440-N。
根據(jù)本發(fā)明的第一實施例,每一權重分配單元440-1至440-N給相應候選塊內的每一未匹配象素分配一權重,其中這些未匹配象素是該未匹配區(qū)域內的象素,而該權重依據(jù)其與匹配區(qū)的邊界象素的接近程度隨未匹配象素的不同而變化。離此匹配區(qū)的邊界象素較近的未匹配象素的被加的權重小于離此匹配區(qū)的邊界象素較遠的未匹配象素的權重。這就是說,位于匹配區(qū)的邊界象素附近的一未匹配象素相比于離此匹配區(qū)的邊界象素較遠的一未匹配象素被分配一較小的權重。
參考圖4A,示出根據(jù)本發(fā)明的第一實施例的示例圖。SBi(i為1或2)指示在一匹配區(qū)的邊界象素處標識的并在一未匹配區(qū)處著色的搜索塊數(shù)據(jù),作為將圖1所示的搜索塊SB和圖1所示的第i個候選塊CBi作比較的結果。著黑色的象素是此匹配區(qū)的邊界象索;與此匹配區(qū)的邊界象素相鄰的每一未匹配象素被分配有W1;離開該匹配區(qū)的邊界象素一個象素處的每一未匹配的象素分配有W2;離開該匹配區(qū)的邊界象素2個象素處的每一象素被分配有W3,其中W1是一正值,W2大于W1,W3大于W2。
根據(jù)本發(fā)明的第二實施例,另一方面,每一權重分配單元440-1至440-N給一相應候選塊內的每一未匹配象素分配一權重,其中該權重依據(jù)未匹配象素與該搜索塊的邊界象素的接近程度隨未匹配象素的不同而變化。離該搜索塊的邊界象素較近的未匹配象素被分配有比離該搜索塊的邊界象素較遠的未匹配象素較小的權重。這就是說,位于與該搜索塊的邊界象素相同位置處的一未匹配象素被分配有最小權重;而離開該搜索塊的邊界象素較遠的未匹配象素被分配有較大的權重。
參考圖4B,示出了根據(jù)本發(fā)明的第二實施例的一示例性圖。SBi(i為1或2)也指示在一匹配區(qū)的邊界象素處標識的并在一未匹配區(qū)處著色的搜索塊數(shù)據(jù),作為將圖1所示的搜索塊SB和圖1所示的第i個候選塊CBi作比較的結果。著黑色的象素是該搜索塊的邊界象素;位于與該匹配區(qū)的邊界象素相同位置的每一未匹配象素被分配有W1;與該匹配區(qū)的象素相鄰的每一未匹配象素被分配有W2;而離開該匹配區(qū)的象素一個象素處的每一未匹配象素被分配有W3;而離開該匹配區(qū)的象素二個象素處的每一未匹配象素被分配有W4,其中W1是一正值,W2大于W1,W3大于W2,W4大于W3。
其未匹配象素被加權的搜索塊數(shù)據(jù)被提供給加權誤差計算單元450-1至450-N。每一加權誤差計算單元450-1至450-N計算相應候選塊的加權誤差。尤其是,在每一加權誤差計算單元450-1至450-N,被分配給相應候選塊中未匹配象素的所有權重值被加起來以產(chǎn)生加權誤差,計算出的相應候選塊的加權誤差被提供給比較器460。
回過來參考圖4,現(xiàn)在將描述根據(jù)本發(fā)明的第一實施例怎樣計算加權誤差。假設W1是1,W2是2,W3是3,SB1的未匹配象素數(shù)是6,而計算出的加權誤差WE1(SB1)是12,如下WE1(SB1)=W3+W2+W1+W1+W2+W3=2(W1+W2+W3)=12而且,SB2的未匹配象素數(shù)是7,則計算出的加權誤差WE1(SB2)是7,如下WE1(SB2)=W1+W1+W1+W1+W1+W1+W1=7W1=7參考圖4B,它可以說明怎樣根據(jù)本發(fā)明第二實施例計算加權誤差。假設W1是1,W2是2,W3是3,W4是4,SB1的未匹配象素數(shù)是6,而計算出的加權誤差WE2(SB1)是12,如下WE2(SB1)=W2+W3+W4+W1+W1+W1=3W1+W2+W3+W4=12而且,SB2的未匹配象素數(shù)是7,則計算出的加權誤差WE2(SB2)是8,如下WE2(SB2)=W1+W1+W1+W1+W1+W2+W1=6W1+W2=8通過根據(jù)本發(fā)明的第一和第二實施例計算加權誤差,相應于SB2的第二候選塊CB2具有最小加權誤差。
同時,比較器460將加權誤差相互比較,從而選擇一最小加權誤差,并提供一選擇信號,該信號使多路復用器470能夠選擇相應于該最小加權誤差的位移矢量。
多路復用器470被提供有來自候選塊形成單元420-1至420-N的位移矢量DV1至DVN,并響應于來自比較器460的選擇信號選擇相應于最小加權誤差的位移矢量作為最佳運動矢量。該最佳運動矢量被提供給圖2所示的運動補償單元500。
如上所示,通過利用加權塊匹配算法,一輪廓運動根據(jù)本發(fā)明被更有效地估計出。
雖然對本發(fā)明的描述是根據(jù)特定實施例進行的,但對本領域的熟練技術人員而言,顯在不背離所附權利要求定義的精神和范圍的前提下可對本發(fā)明作出各種變化和修改。
權利要求
1.一種方法,用于進行二進制圖象信號的當前幀和先前幀之間的運動估計,其中當前幀被分成多個大小相等的搜索塊,該方法包括下列步驟a)在先前幀內形成多個搜索區(qū),其中每一搜索區(qū)相應于每一搜索塊;b)在各搜索區(qū)內形成多個候選塊,每一候選塊具有與搜索塊相同的大小,從而將每一候選塊距該搜索塊的位移提供為每一候選塊的位移矢量;c)用每一候選塊重疊該搜索塊,從而確定一未匹配區(qū)、一匹配區(qū)的邊界和該搜索塊的邊界;d)分配一權重給未匹配區(qū)內的每一象素;e)通過利用在步驟(d)中分配給未匹配區(qū)內的每一象素的權重來計算每一候選塊的一加權誤差;f)將這些加權誤差作相互比較,從而選擇最小加權誤差,并提供一選擇信號,其中該選擇信號指示哪一個位移矢量相應于最小加權誤差;及g)響應于該選擇信號,選擇相應于最小加權誤差的位移矢量并將其提供為最佳運動矢量。
2.根據(jù)權利要求1的方法,其中所述步驟(c)包括以下步驟(c1)用每一候選塊與該搜索塊相重疊;(c2)將該搜索塊的每一象素值與該候選塊的相應象素值作比較,其中該候選塊的相應象素值是位于與同其進行比較的該搜索塊中一象素相同位置處的一象素的值;及(c3)確定未匹配區(qū)、匹配區(qū)的邊界、及搜索塊的邊界,其中該搜索塊內的未匹配區(qū)由多個象素組成,這些象素在相應候選塊內的相應象素具有與其不同的象素值,該搜索塊內的匹配區(qū)的邊界由其象素值為1且與未匹配區(qū)相鄰或與象素值為0的象素相鄰的象素組成,而該搜索塊的邊界由其象素值是1且與象素值為0的象素相鄰的象素組成。
3.根據(jù)權利要求2的方法,其中所述步驟(e)通過將所有分配給該未匹配區(qū)內的象素的權重進行相加來計算加權誤差。
4.根據(jù)權利要求3的方法,其中所述步驟(d)根據(jù)該象素與匹配區(qū)的邊界的接近程度給未區(qū)配區(qū)內的每一象素分配一權重,以便,較小的權重被分給離該匹配區(qū)的邊界較近的象素,而較大的權重被分給離該匹配區(qū)的邊界較遠的象素。
5.根據(jù)權利要求3的方法,其中所述步驟(d)根據(jù)該象素與搜索塊的邊界的接近程度給未匹配區(qū)內的每一象素分配一權重,以便,較小的權重被分給位于該搜索塊的邊界處的象素,而較大的權重被分給離開該搜索塊的邊界的象素。
6.一種裝置,用于進行二進制圖象信號的當前幀和先前幀之間的運動估計,其中當前幀被分成多個大小相等的搜索塊,該裝置包括一搜索區(qū)形成裝置,用于在先前幀內形成多個搜索區(qū),其中每一搜索區(qū)相應于每一搜索塊;一候選塊形成裝置,用于在各搜索區(qū)內形成多個候選塊,每一候選塊具有與搜索塊相同的大小,從而將每一候選塊距該搜索塊的位移提供為每一候選塊的位移矢量;一塊匹配裝置,用于用每一候選塊重疊該搜索塊,從而確定一未匹配區(qū)、一匹配區(qū)的邊界和該搜索塊的邊界;一權重分配裝置,用于分配一權重給未匹配區(qū)內的每一象素;一加權誤差計算裝置,用于通過利用在權重分配裝置中分配給未匹配區(qū)內的每一象素的權重來計算每一候選塊的一加權誤差;一比較裝置,用于將這些加權誤差作相互比較,從而選擇最小加權誤差,并提供一選擇信號,其中該選擇信號指示哪一個位移矢量相應于最小加權誤差;一多路復用裝置,用于響應于該選擇信號,選擇相應于最小加權誤差的位移矢量并將其提供為最佳運動矢量。
7.根據(jù)權利6的裝置,其中所述塊匹配裝置包括一重疊裝置,用于用每一候選塊與該搜索塊相重疊;一匹配裝置,用于將該搜索塊的每一象素值與該候選塊的相應象素值作比較,其中該候選塊的相應象素值是位于與同其進行比較的該搜索塊中一象素相同位置處的一象素的值;一確定裝置,用于確定未匹配區(qū)、匹配區(qū)的邊界、及搜索塊的邊界,其中該搜索塊內的未匹配區(qū)由多個象素組成,這些象素在相應候選塊內的相應象素具有與其不同的象素值,該搜索塊內的匹配區(qū)的邊界由其象素值為1且與未匹配區(qū)相鄰或與象素值為0的象素相鄰的象素組成,而該搜索塊的邊界由其象素值是1且與象素值為0的象素相鄰的象素組成。
8.根據(jù)權利要求7的方法,其中所述加權誤差計算裝置通過將所有分配給該未匹配區(qū)內的象素的權重進行相加來計算加權誤差。
9.根據(jù)權利要求8的方法,其中所述權重分配裝置根據(jù)該象素與匹配區(qū)的邊界的接近程度給未區(qū)配區(qū)內的每一象素分配一權重,以便,較小的權重被分給離該匹配區(qū)的邊界較近的象素,而較大的權重被分給離該匹配區(qū)的邊界較遠的象素。
10.根據(jù)權利要求8的方法,其中所述權重分配裝置根據(jù)該象素與搜索塊的邊界的接近程度給未匹配區(qū)內的每一象素分配一權重,以便,較小的權重被分給位于該搜索塊的邊界處的象素,而較大的權重被分給離開該搜索塊的邊界的象素。
全文摘要
一種用于估計二進制視頻圖象的當前和先前幀之間的運動的方法,其中當前幀被分成多個大小相等的搜索塊,形成多個具有與搜索塊相同的大小的候選塊,將每一候選塊離開該搜索塊的位移提供為每一候選塊的位移矢量。隨后用每一候選塊與該搜索塊相重疊以由此確定未匹配區(qū)、匹配區(qū)邊界和搜索塊的邊界,給未匹配區(qū)內的每一象素分配一權,其中該權可能隨象素的不同而變化。然后計算每一候選塊的加權誤差并選擇具有最小誤差位移矢量作為最佳運動矢量。
文檔編號H04N7/32GK1206299SQ97116879
公開日1999年1月27日 申請日期1997年9月3日 優(yōu)先權日1997年9月3日
發(fā)明者金鎮(zhèn)憲 申請人:大宇電子株式會社