專利名稱:利用圖象變換技術(shù)編碼具有靜止目標(biāo)的圖象信號(hào)的裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于編碼低比特率圖象信號(hào)的裝置,更具體地,涉及一種用于通過(guò)利用圖象變換(Warping)技術(shù)編碼具有靜止目標(biāo)的圖象信號(hào)的裝置。
在諸如可視電話、高清晰度電視或電視會(huì)議系統(tǒng)等數(shù)字化電視系統(tǒng)中,由于圖象幀信號(hào)中的各行包含有一序列稱為“象素”的數(shù)字?jǐn)?shù)據(jù),需要大量的數(shù)字?jǐn)?shù)據(jù)來(lái)限定各圖象幀信號(hào)。但是,由于在傳統(tǒng)的傳送信道中可利用的頻帶寬度是有限的,為了通過(guò)其傳送大量的數(shù)字?jǐn)?shù)據(jù),不可避免地要利用各種數(shù)據(jù)壓縮技術(shù)壓縮或減少數(shù)據(jù)量,特別是在諸如可視電話或電視會(huì)議系統(tǒng)的低比特率圖象信號(hào)編碼系統(tǒng)中。
對(duì)于低比特率編碼系統(tǒng),用于編碼圖象信號(hào)的這種方法之一是所謂的面向目標(biāo)的分解-合成編碼技術(shù)(參看Michael Hotter的“基于運(yùn)動(dòng)二維目標(biāo)的面向目標(biāo)的分解-合成編碼”,該文登載于signal ProcessingI mage communication,2,409-428,1990年)。
根據(jù)該面向目標(biāo)的分解-合成編碼技術(shù),一個(gè)具有運(yùn)動(dòng)目標(biāo)的輸入圖象信號(hào)被劃分為多個(gè)目標(biāo),用于限定各目標(biāo)的運(yùn)動(dòng)、輪廓及象素?cái)?shù)據(jù)的三組參數(shù)通過(guò)不同的編碼通道被處理。
在該面向目標(biāo)的分解-合成編碼技術(shù)中,在處理位于一“靜止目標(biāo)”內(nèi)的圖象數(shù)據(jù)或象素時(shí),主要采用一種僅用于減少包含在圖象數(shù)據(jù)中的空間冗余的變換編碼技術(shù)。用于圖象數(shù)據(jù)壓縮的最常用的變換編碼技術(shù)之一是基于塊變換編碼的DCT(離散余弦變換),其將數(shù)字圖象數(shù)據(jù)的一個(gè)塊,例如一個(gè)8×8象素的塊,轉(zhuǎn)換為一組變換系數(shù)數(shù)據(jù)。該方法在例如Chen和Pratt的“場(chǎng)景自適應(yīng)編碼器”(IEEE Transactios on Communications,COM-32,No.3,pp.225-232,1984年3月)中有所介紹。
在基于塊變換編碼的DCT中,在一塊內(nèi)的非目標(biāo)區(qū)域被填以平均象素值或塊中目標(biāo)的鏡象,然后變換被執(zhí)行。
雖然這種方法具有可以利用用于傳統(tǒng)方法(諸如聯(lián)合照象專家組JPEG,運(yùn)動(dòng)畫面專家組MPEG,H.261等)中的二維DCT塊,但它在圖象的非目標(biāo)區(qū)域中仍包含有不必要或不希望的數(shù)據(jù),因此,從數(shù)據(jù)壓縮的觀點(diǎn)看仍是低效的。
因此,本發(fā)明的主要目的即在于提供一種用于利用圖象變換技術(shù)有效地編碼具有靜止目標(biāo)的圖象信號(hào)的裝置,以提高數(shù)據(jù)壓縮的效率。
根據(jù)本發(fā)明,提供了一種用于編碼一具有靜止目標(biāo)的視頻幀中的圖象信號(hào)的裝置,其中該圖象信號(hào)包括分配給靜止目標(biāo)中的象素的非零值及分配給該靜止目標(biāo)之外的象素的零值,該裝置包括一輪廓檢測(cè)器,用于檢測(cè)包含在圖象幀中的目標(biāo)的邊界以生成一個(gè)提供用于表述該目標(biāo)邊界的邊界信息的輪廓信號(hào);一輪廓編碼器,用于編碼該輪廓信號(hào)以生成一個(gè)第一編碼圖象信號(hào);一塊發(fā)生器,用于將該視頻幀劃分為多個(gè)具有預(yù)定相同大小的處理塊;一控制器,用于生成一個(gè)表示是否該視頻幀中的目標(biāo)邊界的一部分存在于各處理塊中的控制信號(hào);一開(kāi)關(guān)電路,用于根據(jù)所述控制信號(hào)提供一第一和一第二組處理塊;一圖象重建裝置,用于基于該第一組處理塊生成一重建的處理塊;一編碼通道,用于編碼該重建的處理塊或第二組處理塊,由此生成一第二編碼圖象信號(hào);以及一個(gè)格式化電路,用于格式化該第一和第二編碼圖象信號(hào)。
本發(fā)明的上述及其它目的和特征將從以下結(jié)合附圖對(duì)優(yōu)選實(shí)施例的說(shuō)明中變得明了,附圖中
圖1是說(shuō)明根據(jù)本發(fā)明的圖象信號(hào)編碼裝置的方框圖;圖2示出了一具有靜止目標(biāo)的示例性視頻幀;圖3A示出了一包含目標(biāo)邊界的示例性處理塊;圖3B示出了用于解釋一邊界映射(mapped)處理的一邊界映射的處理塊;圖4給出對(duì)應(yīng)于在一塊邊界上的象素的第一組位移矢量;圖5表示由本發(fā)明的圖象變換方案生成的重建的處理塊。
參看圖1,其示出了用于編碼一視頻幀中的數(shù)字圖象信號(hào)的創(chuàng)造性裝置的方框圖。該編碼裝置10包括第一及第二編碼通道100和500,以及用于生成重建的處理塊以有效地編碼視頻幀中一目標(biāo)的邊界的一部分的圖象重建裝置400,其中,該第一編碼通道100用于該目標(biāo)的輪廓信號(hào),而該第二編碼通道500用于在逐塊的基礎(chǔ)上編碼數(shù)字圖象數(shù)據(jù)。
從已知的圖象源(未示),例如硬盤或光盤生成的數(shù)字圖象信號(hào)被輸入一幀存儲(chǔ)器50以存儲(chǔ)之。該數(shù)字圖象信號(hào)具有一靜止目標(biāo)且包括分配給該目標(biāo)內(nèi)象素的非零值以及分配給該目標(biāo)外象素的零值。來(lái)自幀存儲(chǔ)器50的圖象信號(hào)然后被取至在該第一編碼通道100的輪廓檢測(cè)器110和一塊發(fā)生器200。
包括輪廓檢測(cè)器110及輪廓編碼器120的該第一編碼通道100用于利用已知的輪廓檢測(cè)及編碼技術(shù)檢測(cè)及編碼來(lái)自幀存儲(chǔ)器50的視頻幀中該目標(biāo)的輪廓信號(hào)以生成一編碼的輪廓信號(hào)。更具體地,如圖2所示,該輪廓檢測(cè)則器110通過(guò)利用了已知的邊緣檢測(cè)算子(如Sobel算子)的已知邊緣檢測(cè)技術(shù)檢測(cè)表示視頻幀11中的目標(biāo)12的輪廓16的輪廓信號(hào)。如本領(lǐng)域內(nèi)公知的,該目標(biāo)的輪廓信號(hào)可以從邊緣點(diǎn)得出,邊緣點(diǎn)定義為圖象信號(hào)的發(fā)生顯著物理變化的象素位置。這種變化可以通過(guò)將從具有一欲被檢測(cè)的象素的M×M(例如3×3)象素的值或灰度得到的象素值與一預(yù)定閾值比較而檢測(cè)到,其中該欲被檢測(cè)的象素位于該M×M個(gè)象素的中心。在輪廓檢測(cè)器110檢測(cè)到的輪廓信號(hào)然后被送至輪廓編碼器120以對(duì)其編碼。
在輪廓編碼器120,來(lái)自輪廓檢測(cè)器110的輪廓信號(hào)通過(guò)利用例如一JPEG(聯(lián)合照象專家組)的二進(jìn)制算術(shù)碼被編碼且該編碼的輪廓信號(hào)被送至一格式化電路600。
同時(shí),塊發(fā)生器200將來(lái)自幀存儲(chǔ)器50的視頻幀信號(hào)劃分為多個(gè)具有N×N象素的等大小的處理塊(N為一個(gè)大于3的整數(shù)),并將這些處理塊逐塊地提供給一開(kāi)關(guān)電路300。在開(kāi)關(guān)電路300,根據(jù)來(lái)自一系統(tǒng)控制器(未示)的控制信號(hào)CS,來(lái)自塊發(fā)生器200的各處理塊被選擇地送給圖象重建裝置400或第二編碼通道500。該系統(tǒng)控制器根據(jù)該視頻幀中的目標(biāo)的輪廓信息生成控制信號(hào)CS,該控制信號(hào)CS表示是否有視頻幀中的該目標(biāo)邊界的一部分存在于各處理塊中。如果該目標(biāo)邊界的一部分存在于一處理塊中,即該控制信號(hào)CS為邏輯高,則該處理塊被送至圖象重建裝置400以生成一重建的處理塊;否則,該塊被送至第二編碼通道500。
根據(jù)本發(fā)明,包括一邊界映射部分410、一位移內(nèi)插部分420及一圖象變換部分430的該圖象重建裝置400將來(lái)自開(kāi)關(guān)裝置300的各處理塊轉(zhuǎn)換為重建的處理塊以提高在第二編碼通道500的數(shù)據(jù)壓縮效率。
如圖1所示,來(lái)自輪廓檢測(cè)器110的包括輪廓信息的輪廓信號(hào)被送至邊界映射部分410。該邊界映射部分410將來(lái)自位于該目標(biāo)邊界上的一組目標(biāo)邊界象素的象素值分配給位于一個(gè)不構(gòu)成該目標(biāo)的一部分的塊邊界上的與該組目標(biāo)邊界象素最近的非目標(biāo)區(qū)的塊邊界象素并計(jì)算這些非目標(biāo)區(qū)塊邊界象素與對(duì)應(yīng)于這些非目標(biāo)區(qū)塊邊界象素的目標(biāo)邊界象素之間的位移,由此為各處理塊的塊邊界象素提供一圖象映射的處理塊以及一第一組位移矢量。
參看圖3A及3B,它們示出了一圖2中的處理塊18的放大的示意圖和一個(gè)示例性的圖象映射處理塊。具有例如4×4個(gè)象素P1至P16的處理塊18包括一個(gè)目標(biāo)區(qū)R1和一個(gè)非目標(biāo)區(qū)R2,其中,在各括號(hào)內(nèi)的數(shù)字表示該處理塊18中的各象素的象素值,該目標(biāo)區(qū)具有目標(biāo)邊界象素P12、P13、P16及P7。為了確定該處理塊的塊邊界象素P1至P12的第一組位移矢量,目標(biāo)邊界象素值A(chǔ)、B、E及I首先被分配給R2中的非目標(biāo)區(qū)塊邊界象素P1至P6,如圖3B所示。在將該目標(biāo)邊界象素值分配給R2中的非目標(biāo)區(qū)塊邊界象素之后,確定各該非目標(biāo)區(qū)塊邊界象素與其相應(yīng)目標(biāo)邊界象素之間的位移。
在本發(fā)明的一優(yōu)選實(shí)施例中,為各非目標(biāo)區(qū)塊邊界象素P1至P6確定一個(gè)單一值是通過(guò)向其分配該各目標(biāo)邊界象素值中具有一較高優(yōu)先權(quán)的一個(gè)而完成的。該優(yōu)選權(quán)給予具有與R2中的一非目標(biāo)區(qū)塊邊界象素最小距離的目標(biāo)邊界象素。如果一個(gè)以上的目標(biāo)邊界象素具有相同的最小距離,優(yōu)先權(quán)將按它們之間位移的x分量遞增的順序給予一目標(biāo)象素。例如,P6與兩個(gè)目標(biāo)邊界象素P7和P16距離相同,從P7到P6和從P16到P6的位移分別為(0,1)和(1,0),在這一情況下,即從兩個(gè)目標(biāo)邊界象素P7和P16到一非目標(biāo)區(qū)塊邊界象素P6的距離相同,但從該兩個(gè)象素P7和P16到象素P6的位移不同時(shí),具有x分量較小的位移的象素即P7具有較高的優(yōu)先權(quán)。
具體地,對(duì)于圖3A所示的一組非目標(biāo)區(qū)塊邊界象素P1至P6,P12的象素值A(chǔ)被分配給P1,P13的象素值B被分配給P2,P3及P4,P16的象素值E給P5,P7的象素值I給P6,且示于圖3B的該圖象映射的處理塊被生成。非目標(biāo)區(qū)塊邊界象素P1至P6的位移矢量為(0,1),(0,1),(1,1),(2,1),(1,1)及(0,1),而R1中的目標(biāo)區(qū)塊邊界象素P7至P12的位移矢量都是(0,0)。在圖4中,示出了第一組位移矢量M1至M12,其中各括號(hào)內(nèi)的數(shù)字表示從它們相應(yīng)的目標(biāo)邊界象素測(cè)算的x及y分量。
返回圖1,從邊界映射部分410生成的該第一組位移矢量M1至M12以及圖象映射的處理塊被分別提供給位移內(nèi)插部分420及圖象變換部分430。在位移內(nèi)插部分420,通過(guò)例如線性地內(nèi)插該第一組位移矢量,用于不形成該處理塊的塊邊界一部分的非塊邊界象素的第二組位移矢量被生成。
在本發(fā)明的優(yōu)選實(shí)施例中,用于非塊邊界象素的位移矢量由以下方法內(nèi)插。首先,下面給出的公式Eq.1被用于計(jì)算用于非塊邊界象素的位移d(x,y)d(x,y)=Σi=1121DiMiΣi=1121Di]]>其中,x及y分別為一非塊邊界象素的水平及垂直分量,Di表示該非塊邊界象素與各塊邊界象素之間的距離,Mi用于表示各塊邊界象素的第一組位移矢量。其次,如果x或y不是整數(shù),則所述非整數(shù)分量被四舍五入為最相近的整數(shù)。以此方式,示于圖3A中的所有非邊界象素P13至P16的位移被得到并作為第二組位移矢量送至圖象變換部分430以生成重構(gòu)的處理塊。
該圖象變換部分430基于來(lái)自位移內(nèi)插部分420的該第二組位移矢量以及來(lái)自圖象映射的處理塊的象素值更新目標(biāo)區(qū)R1中的P13、P15及P16的象素值并分配R1中的一個(gè)象素值給R2中的P14,并生成該重建的處理塊送至第二編碼通道500。如圖5所示,如果用于非塊邊界象素P13至P16的第二組位移矢量為(0,0),(0,1),(1,1)及(1,0),則非塊邊界象素P13至P16將分別被賦以B、E、F及D。
該第二編碼通道500包括一變換編碼器510、一量化器520及一熵編碼器530,用于利用一傳統(tǒng)的變換及統(tǒng)計(jì)編碼技術(shù)編碼包含于來(lái)自圖象重建裝置400的圖象變換部分430的各重建的處理塊或來(lái)自開(kāi)關(guān)電路300的一個(gè)非重建的處理塊的圖象數(shù)據(jù)。亦即,變換編碼器510利用例如離散余弦變換(DCT)將來(lái)自圖象變換部分430或開(kāi)關(guān)電路300的各空間域中的處理塊的圖象數(shù)據(jù)轉(zhuǎn)換為頻域中的一組變換系數(shù)并將該組變換系數(shù)提供給量化器520。在量化器520,利用已知的量化方法將該組變換系數(shù)量化;然后該組量化的變換系數(shù)被送至熵編碼器530用于進(jìn)一步處理。
該熵編碼器530利用例如掃描寬度及可變長(zhǎng)編碼的組合,為各非重建的或重建的處理塊編碼來(lái)自量化器520的該組量化的變換系數(shù),以生成一編碼的圖象信號(hào)。由熵編碼器530編碼的該圖象信號(hào)然后被送至格式化電路600。
該格式化電路600格式化來(lái)自第一編碼通道100中的輪廓編碼器120的編碼的輪廓信號(hào)以及來(lái)自第二編碼通道500中的熵編碼器530的編碼的圖象信號(hào),由此提供一個(gè)格式化的數(shù)字圖象信號(hào)給一發(fā)送機(jī)(未示)以發(fā)送該圖象信號(hào)。
如上所述,本發(fā)明可以在利用創(chuàng)造性的圖象變換技術(shù)的編碼處理中顯著地減少在一靜止目標(biāo)中的象素和該目標(biāo)之外的象素之間出現(xiàn)的高頻分量,由此提高整體編碼效率。
雖然結(jié)合特定的實(shí)施例說(shuō)明了本發(fā)明,但對(duì)于本領(lǐng)域的技術(shù)人員,顯然可以不脫離由以下權(quán)利要求限定的本發(fā)明的精神和范圍而做出各種變化及修正。
權(quán)利要求
1.一種用于編碼一具有靜止目標(biāo)的視頻幀中的圖象信號(hào)的裝置,其中該圖象信號(hào)包括分配給靜止目標(biāo)中的象素的非零值及分配給該靜止目標(biāo)之外的象素的零值,該裝置包括一用于檢測(cè)包含在圖象幀中的目標(biāo)的邊界以生成一個(gè)提供用于表述該目標(biāo)邊界的邊界信息的輪廓信號(hào)的裝置;一用于編碼該輪廓信號(hào)以生成一個(gè)第一編碼圖象信號(hào)的裝置;一用于將該視頻幀劃分為多個(gè)具有預(yù)定相同大小的處理塊的裝置;一用于生成一個(gè)表示是否該視頻幀中的目標(biāo)邊界的一部分存在于各處理塊中的控制信號(hào)的裝置;一用于根據(jù)所述控制信號(hào)提供一第一和一第二組處理塊的裝置;一用于基于該第一組處理塊生成一重建的處理塊的裝置;一用于編碼該重建的處理塊或第二組處理塊,由此生成一第二編碼圖象信號(hào)的裝置;以及一個(gè)用于格式化該第一和第二編碼圖象信號(hào)的裝置。
2.如權(quán)利要求1的裝置,其中所述重建的處理塊發(fā)生裝置包括用于基于該視頻幀中的輪廓信息將來(lái)自位于該目標(biāo)邊界上的一組目標(biāo)邊界象素的象素值分配給與它們最近的位于不構(gòu)成該目標(biāo)的一部分的一塊邊界上的非目標(biāo)區(qū)塊邊界象素,及計(jì)算這些非目標(biāo)區(qū)塊邊界象素和與它們相應(yīng)的目標(biāo)邊界象素之間的位移,從而生成第一組位移矢量和一個(gè)圖象映射的處理塊的裝置;用于通過(guò)線性地內(nèi)插該第一組位移矢量生成用于不構(gòu)成該各第一組處理塊的塊邊界的一部分的非塊邊界象素的第二組位移矢量的裝置;以及用于基于該第一組位移矢量及圖象映射的處理塊數(shù)據(jù)生成重建的處理塊的裝置。
全文摘要
一種用于編碼具有靜止目標(biāo)的圖象信號(hào)的裝置,通過(guò)編碼在第一編碼通道檢測(cè)的輪廓信號(hào)生成一第一編碼圖象角信號(hào),該輪廓信號(hào)提供用于表述一視頻幀中的目標(biāo)邊界的邊界信息。該視頻幀被分為多個(gè)等大小的處理塊。根據(jù)表示一處理塊中是否存在目標(biāo)邊界的一部分的一個(gè)控制信號(hào),各處理塊被選擇地送至一圖象重建裝置或一第二編碼通道。該圖象重建裝置基于送給其的處理塊生成重建的處理塊。
文檔編號(hào)H04N7/36GK1131882SQ9511735
公開(kāi)日1996年9月25日 申請(qǐng)日期1995年9月29日 優(yōu)先權(quán)日1995年3月20日
發(fā)明者丁海默 申請(qǐng)人:大宇電子株式會(huì)社