專利名稱:數(shù)字圖像編碼解碼方法及使用它的數(shù)字圖像編碼解碼裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于存儲(chǔ)或者傳送數(shù)字圖像數(shù)據(jù)的編碼、解碼方法和裝置。特別涉及對(duì)圖像預(yù)測(cè)的活動(dòng)信息進(jìn)行編碼、解碼,高精度地生成預(yù)測(cè)圖像的方法和裝置。
背景技術(shù):
為了有效地存儲(chǔ)或者傳送數(shù)字圖像數(shù)據(jù),需要進(jìn)行壓縮編碼。
作為用于壓縮編碼數(shù)字圖像的方法,以往除以JPEG和MPEG為代表的離散余弦變換(DCT)外,還有Subband和Wearplate以及Flactale等的波形編碼方法。此外,在去除圖像間的冗余信號(hào)時(shí),進(jìn)行使用活動(dòng)補(bǔ)償?shù)膱D像間預(yù)測(cè),對(duì)差分信號(hào)進(jìn)行波形編碼。
這里,對(duì)以活動(dòng)補(bǔ)償為基礎(chǔ)的MPEG方式進(jìn)行說(shuō)明。將輸入圖像分割成多個(gè)16×16的宏塊進(jìn)行處理。1個(gè)宏塊進(jìn)一步分割成8×8的塊,在施行8×8的DCT后進(jìn)行量化。這稱為幀內(nèi)編碼。另一方面,以塊匹配為首的活動(dòng)檢測(cè)方法中,從時(shí)間上相鄰的其它幀內(nèi)檢測(cè)對(duì)象宏塊中誤差最小的預(yù)測(cè)宏塊,并基于檢測(cè)出的變化,從過(guò)去的圖像進(jìn)行活動(dòng)補(bǔ)償,取得最佳預(yù)測(cè)塊。表示誤差最小的預(yù)測(cè)宏塊的信號(hào)是活動(dòng)向量。接著,求出對(duì)應(yīng)于對(duì)象塊的預(yù)測(cè)塊的差分,進(jìn)行DCT,對(duì)變換系數(shù)進(jìn)行量化,同時(shí)傳送或者存儲(chǔ)活動(dòng)信息。這稱為幀頻間編碼。
在接收側(cè),在將被量化的變換系數(shù)復(fù)原到原來(lái)的差分信號(hào)后,根據(jù)活動(dòng)向量取得預(yù)測(cè)塊,并與差分信號(hào)相加,進(jìn)行圖像的再現(xiàn)。
雖然預(yù)測(cè)圖像的生成以塊為單位進(jìn)行,但也有取全景和變焦那樣圖像整體移動(dòng)的場(chǎng)合,并對(duì)這種場(chǎng)合圖像整體進(jìn)行活動(dòng)補(bǔ)償。活動(dòng)補(bǔ)償或者預(yù)測(cè)圖像的生成包括從單純平行移動(dòng)到帶有放大、縮小、旋轉(zhuǎn)等變形的各種情況。
式(1)到式(4)示出了表示移動(dòng)和變形的公式。(x,y)是象素的坐標(biāo),(u,v)是變換后的坐標(biāo),是(x,y)的活動(dòng)向量。其它的變量是表示移動(dòng)和變形的變換參數(shù)。
(u,v)=(x+e,y+f) (1)(u,v)=(ax+e,dy+f) (2)(u,v)=(ax+by+e,cx+dy+f) (3)(u,v)=(gx2+pxy+ry2+ax+by+e,hx2+qxy+sy2+cx+dy+f) (4)式(3)的變換稱為仿射變換,下面,以其為例進(jìn)行說(shuō)明。仿射變換的參數(shù)(a,b,c,d,e,f)能象以下所述那樣求得。
首先,將圖像分割成多個(gè)塊(2×2,4×4,8×8等),用塊匹配的方法求得各塊的活動(dòng)向量。從求得的活動(dòng)向量中至少選擇3個(gè)可靠性高的,利用對(duì)6個(gè)式(3)的聯(lián)立方程式求解,得到仿射參數(shù)。為了減小誤差,通常選擇較多的點(diǎn),用最小二乘法求得仿射參數(shù)。在預(yù)測(cè)圖像生成中使用這樣求得的仿射參數(shù)。為了在接收側(cè)也能同樣進(jìn)行預(yù)測(cè)圖像生成,需要傳送仿射參數(shù)。
但是,以往的幀間編碼以對(duì)象圖像和參照?qǐng)D像有相同的大小為前提,對(duì)不同大小的圖像不能充分適應(yīng)。
鄰接的2個(gè)圖像的大小的變化多數(shù)起因于該圖像中物體的活動(dòng)。例如,由于放下兩手站立的人物(圖7A)舉起兩手,圍住人物的長(zhǎng)方形大小發(fā)生變化(圖7B)。在考慮編碼效率時(shí),為了減少活動(dòng)向量的編碼量,需要在同一坐標(biāo)空間變換對(duì)象圖像和參照?qǐng)D像。此外,由于圖像大小的變化,被分割的圖像的宏塊的配置變化。例如,從圖7A變化到圖7B時(shí),因?yàn)閷⒑陦K701分成宏塊703和宏塊704兩個(gè)并進(jìn)行壓縮編碼,在圖7B的再現(xiàn)圖像中,人物的面孔上出現(xiàn)量化造成的垂直失真,使視覺(jué)上的圖像質(zhì)量降低。
為了高精度地進(jìn)行仿射變換,因仿射參數(shù)(a,b,c,d,e,f等)一般是小數(shù)點(diǎn)以下的實(shí)數(shù),所以如果希望傳送精度高,則要用長(zhǎng)的位數(shù)進(jìn)行傳送。過(guò)去,因用固定長(zhǎng)度或者可變長(zhǎng)度編碼簡(jiǎn)單地量化并傳送仿射參數(shù),所以使仿射變換的精度降低,不能得到高精度的仿射變換,不能生成所要的預(yù)測(cè)圖像。
由式(1)到(4)可知,變換參數(shù)的個(gè)數(shù)是2到10個(gè)或者更多。在傳送變換參數(shù)時(shí),如果按照其最多的個(gè)數(shù)進(jìn)行編碼,則有在傳送參數(shù)少時(shí)傳送冗余碼的問(wèn)題。
發(fā)明概述本發(fā)明的第一個(gè)目的,是提供在仿射變換那樣其參數(shù)具有不是整數(shù)的多位數(shù)的場(chǎng)合,能用較少的數(shù)據(jù)傳送量實(shí)現(xiàn)正確變換的數(shù)字圖像數(shù)據(jù)編碼、解碼裝置。
為達(dá)到這種目的,本發(fā)明的圖像預(yù)測(cè)編碼裝置,包括對(duì)輸入圖像進(jìn)行編碼并進(jìn)行數(shù)據(jù)壓縮的圖像壓縮手段;對(duì)將該圖像壓縮手段壓縮后的圖像解碼而得到的圖像進(jìn)行坐標(biāo)變換,輸出因進(jìn)行該坐標(biāo)變換而產(chǎn)生的坐標(biāo)數(shù)據(jù)的坐標(biāo)變換手段;從這種坐標(biāo)變換手段的坐標(biāo)數(shù)據(jù)生成變換參數(shù)的變換參數(shù)生成手段;用由這種變換參數(shù)生成手段生成的變換參數(shù),從輸入圖像生成預(yù)測(cè)圖像的預(yù)測(cè)圖像生成手段;傳送所述壓縮圖像和坐標(biāo)數(shù)據(jù)的傳送手段。
此外,數(shù)字圖像解碼裝置,包括輸入壓縮圖像數(shù)據(jù)和坐標(biāo)數(shù)據(jù),進(jìn)行可變長(zhǎng)度解碼的可變長(zhǎng)度解碼手段;從所述可變長(zhǎng)度解碼手段解碼后的坐標(biāo)數(shù)據(jù)生成變換參數(shù)的變換參數(shù)生成手段;用由所述變換參數(shù)生成手段生成的變換參數(shù),生成預(yù)測(cè)圖像數(shù)據(jù)的預(yù)測(cè)圖像生成手段;對(duì)來(lái)自所述預(yù)測(cè)圖像生成手段的預(yù)測(cè)圖像和進(jìn)行所述可變長(zhǎng)度解碼后的壓縮圖像數(shù)據(jù)進(jìn)行加法運(yùn)算,從而生成解碼圖像的加法運(yùn)算手段。
具體地說(shuō),這是變換參數(shù)生成手段從N個(gè)(N是自然數(shù))象素的坐標(biāo)點(diǎn)和由規(guī)定的線性多項(xiàng)式變換所述N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn),生成變換參數(shù)的數(shù)字圖像編碼、解碼裝置。此外,這是變換參數(shù)生成手段輸入大小不同的第1到第N個(gè)對(duì)象圖像,對(duì)所述第1到第N個(gè)對(duì)象圖像設(shè)定共同空間坐標(biāo),并對(duì)所述第1到第N個(gè)對(duì)象圖像,用規(guī)定的的方法進(jìn)行壓縮編碼,生成第1到第N個(gè)壓縮圖像,而且對(duì)所述第1到第N個(gè)壓縮圖像進(jìn)行解碼,變換成所述共同空間坐標(biāo),在生成第1到第N個(gè)擴(kuò)展圖像加以存儲(chǔ),同時(shí)輸出將所述第1到第N個(gè)擴(kuò)展圖像變換成所述共同空間坐標(biāo)生成的變換參數(shù)的數(shù)字圖像編碼、解碼裝置。
本發(fā)明的第二個(gè)目的,是特別提供作為坐標(biāo)數(shù)據(jù),傳送大小不同的圖像進(jìn)行預(yù)測(cè)編碼時(shí),將對(duì)象圖像和參照?qǐng)D像變換成相同坐標(biāo)空間的坐標(biāo)數(shù)據(jù),從而改善活動(dòng)檢測(cè)的精度,同時(shí)減少活動(dòng)向量的編碼量,謀得提高圖像質(zhì)量的數(shù)字圖像編碼、解碼裝置。
為達(dá)到這種目的,本發(fā)明的圖像預(yù)測(cè)編碼裝置,
輸入大小不同的第1到第N個(gè)對(duì)象圖像,對(duì)第1到第N個(gè)對(duì)象圖像設(shè)定共同空間坐標(biāo),并對(duì)第1對(duì)象圖像,用規(guī)定的的方法進(jìn)行壓縮編碼,生成第1壓縮圖像后,對(duì)第1壓縮圖像進(jìn)行解碼,變換成共同空間坐標(biāo),生成第1擴(kuò)展圖像加以存儲(chǔ),同時(shí)對(duì)將第1擴(kuò)展圖像變換成共同空間坐標(biāo)而生成的第1偏移信號(hào)(座標(biāo)數(shù)據(jù))進(jìn)行編碼,并與第1壓縮圖像一起傳送,對(duì)第n(n=2,3,……,N)對(duì)象圖像,變換成共同空間坐標(biāo),參照第(n-1)的擴(kuò)展圖像生成預(yù)測(cè)圖像,由第n對(duì)象圖像和預(yù)測(cè)圖像生成差分圖像并進(jìn)行壓縮編碼,生成第n壓縮圖像后,對(duì)第n壓縮圖像進(jìn)行解碼,變換成共同空間坐標(biāo),生成第n擴(kuò)展圖像加以存儲(chǔ)同時(shí)對(duì)將第n擴(kuò)展圖像變換成共同空間坐標(biāo)而生成的第n偏移信號(hào)(座標(biāo)數(shù)據(jù))進(jìn)行編碼后,與第n壓縮圖像一起傳送。
本發(fā)明的圖像預(yù)測(cè)解碼裝置,包括輸入端、數(shù)據(jù)分析器、解碼器、加法運(yùn)算器、坐標(biāo)變換器、活動(dòng)補(bǔ)償器和幀存儲(chǔ)器,在輸入端上對(duì)大小不同的從第1到第N個(gè)對(duì)象圖像進(jìn)行編碼,輸入包含將第n(n=1,2,3,……,N)對(duì)象圖像變換成共同空間坐標(biāo)而生成的第n偏移信號(hào)的第1到第N個(gè)壓縮圖像數(shù)據(jù),用數(shù)據(jù)分析器分析第1壓縮圖像數(shù)據(jù),輸出第1壓縮圖像信號(hào)和第1偏移信號(hào),將第1壓縮圖像信號(hào)輸入到解碼器,復(fù)原為第1再現(xiàn)圖像后,用坐標(biāo)變換器以第1偏移信號(hào)為基礎(chǔ),使第1再現(xiàn)圖像坐標(biāo)變換后,存儲(chǔ)在幀存儲(chǔ)器中,又對(duì)第n(n=2,3,………,N)壓縮圖像數(shù)據(jù),用數(shù)據(jù)分析器分析第n壓縮圖像數(shù)據(jù)。輸出第n壓縮圖像信號(hào)和第n偏移信號(hào)以及第n活動(dòng)信號(hào),將第n壓縮圖像信號(hào)輸入到解碼器中,復(fù)原為第n擴(kuò)展差分圖像,將第n偏移信號(hào)和第n活動(dòng)信號(hào)輸入到活動(dòng)補(bǔ)償器中,以第n偏移信號(hào)和第n活動(dòng)信號(hào)為基礎(chǔ),從存儲(chǔ)在幀存儲(chǔ)器中的第(n-1)再現(xiàn)圖像取得第n預(yù)測(cè)圖像,在用加法運(yùn)算器對(duì)第n擴(kuò)展差分圖像和第n預(yù)測(cè)圖像進(jìn)行加法運(yùn)算,復(fù)原為第n再現(xiàn)圖像并輸出,同時(shí)在坐標(biāo)變換器以第n偏移信號(hào)為基礎(chǔ)使第n再現(xiàn)圖像坐標(biāo)變換后,存儲(chǔ)在幀存儲(chǔ)器中。
本發(fā)明的第三個(gè)目的,是提供作為坐標(biāo)數(shù)據(jù),高精度傳送包含在傳送數(shù)據(jù)中的進(jìn)行仿射變換時(shí)的仿射變換參數(shù),能生成高精度的預(yù)測(cè)圖像的數(shù)字圖像編碼、解碼裝置。
采用本發(fā)明,則在包括可變長(zhǎng)度解碼單元、差分圖像擴(kuò)展單元、加法運(yùn)算單元、變換參數(shù)生成單元、預(yù)測(cè)圖像生成單元和幀存儲(chǔ)器的數(shù)字圖像解碼裝置中,將數(shù)據(jù)輸入到可變長(zhǎng)度解碼單元中,從數(shù)據(jù)分出差分圖像數(shù)據(jù)并傳送到差分圖像擴(kuò)展單元,同時(shí)分出坐標(biāo)數(shù)據(jù)并輸入到變換參數(shù)生成單元,在差分圖像生成單元擴(kuò)展差分圖像數(shù)據(jù),并傳送到加法運(yùn)算單元,在變換參數(shù)生成單元從坐標(biāo)數(shù)據(jù)生成變換參數(shù),并傳送到預(yù)測(cè)圖像生成單元,在預(yù)測(cè)圖像生成單元從變換參數(shù)和幀存儲(chǔ)器輸入的圖像生成預(yù)測(cè)圖像,并傳送到加法運(yùn)算單元中,加法運(yùn)算單元將預(yù)測(cè)圖像與被擴(kuò)展的差分圖像相加,生成圖像并輸出,同時(shí)存儲(chǔ)在幀存儲(chǔ)器中。
前述的坐標(biāo)數(shù)據(jù),是N個(gè)象素的坐標(biāo)點(diǎn)和由規(guī)定的線性多項(xiàng)式變換N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn),或者是N個(gè)象素的坐標(biāo)點(diǎn)和由規(guī)定的線性多項(xiàng)式變換N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)的差分值,或者是由規(guī)定的線性多項(xiàng)式變換規(guī)定的N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn),或者是由規(guī)定的線性多項(xiàng)式變換規(guī)定的N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)和預(yù)測(cè)值的差分值,這種預(yù)測(cè)值是規(guī)定的N個(gè)坐標(biāo)點(diǎn),或者是前幀的N個(gè)變換后坐標(biāo)點(diǎn)。
采用本發(fā)明,則數(shù)字圖像編碼裝置,包括變換參數(shù)推定單元、預(yù)測(cè)圖像生成單元、第1加法運(yùn)算單元、差分圖像壓縮單元、差分圖像擴(kuò)展單元、第2加法運(yùn)算單元、幀存儲(chǔ)器和傳送單元,輸入數(shù)字圖像,在變換參數(shù)推定單元從存儲(chǔ)在幀存儲(chǔ)器中的圖像和數(shù)字圖像推定變換參數(shù),將所推定的變換參數(shù)和存儲(chǔ)在幀存儲(chǔ)器中的圖像輸入到預(yù)測(cè)圖像生成單元中,根據(jù)所推定的變換參數(shù)生成預(yù)測(cè)圖像,在第1加法運(yùn)算單元求得數(shù)字圖像和預(yù)測(cè)圖像的差分,用差分圖像壓縮單元壓縮成壓縮差分?jǐn)?shù)據(jù),送到傳送單元,同時(shí)差分圖像擴(kuò)展單元將壓縮差分?jǐn)?shù)據(jù)擴(kuò)展成擴(kuò)展差分?jǐn)?shù)據(jù),在第2加法運(yùn)算單元與預(yù)測(cè)圖像相加后,存儲(chǔ)到幀存儲(chǔ)器,在這種數(shù)字圖像編碼裝置中,從變換參數(shù)推定單元將坐標(biāo)數(shù)據(jù)送到傳送單元,與壓縮差分?jǐn)?shù)據(jù)一起傳送。
前述的坐標(biāo)數(shù)據(jù),是N個(gè)象素的坐標(biāo)點(diǎn)和由變換參數(shù)變換N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn),或者是N個(gè)象素的坐標(biāo)點(diǎn)和N個(gè)變換后坐標(biāo)點(diǎn)與N個(gè)象素的坐標(biāo)點(diǎn)的差分,或者是由變換參數(shù)變換規(guī)定的N個(gè)象素的坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn),并且是N個(gè)變換后坐標(biāo)點(diǎn)與規(guī)定的N個(gè)象素的坐標(biāo)點(diǎn)的差分,或者是由N個(gè)變換后坐標(biāo)點(diǎn)與過(guò)去的幀的N個(gè)變換后坐標(biāo)點(diǎn)的差分。
采用本發(fā)明,則數(shù)字圖像解碼裝置,包括可變長(zhǎng)度解碼單元、差分圖像擴(kuò)展單元、加法運(yùn)算單元、變換參數(shù)生成單元、預(yù)測(cè)圖像生成單元和幀存儲(chǔ)器,將數(shù)據(jù)輸入到可變長(zhǎng)度解碼單元,從數(shù)據(jù)分出差分圖像數(shù)據(jù)并傳送到差分圖像擴(kuò)展單元,同時(shí)將坐標(biāo)數(shù)據(jù)的個(gè)數(shù)和坐標(biāo)數(shù)據(jù)輸入到變換參數(shù)生成單元中,在差分圖像擴(kuò)展單元擴(kuò)展差分圖像,并傳送到加法運(yùn)算單元,在變換參數(shù)生成單元根據(jù)變換參數(shù)的個(gè)數(shù)切換變換參數(shù)生成方法,從坐標(biāo)數(shù)據(jù)生成變換參數(shù),并傳送到預(yù)測(cè)圖像生成單元,在預(yù)測(cè)圖像生成單元從變換參數(shù)和幀存儲(chǔ)器輸入的圖像、生成預(yù)測(cè)圖像并傳送到加法運(yùn)算單元中,加法運(yùn)算單元將預(yù)測(cè)圖像與被擴(kuò)展的差分圖像相加,生成圖像生成并輸出,同時(shí)存儲(chǔ)在幀存儲(chǔ)器中。
前述的坐標(biāo)數(shù)據(jù)是N個(gè)象素的坐標(biāo)點(diǎn)和由規(guī)定的線性多項(xiàng)式變換N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn),或者坐標(biāo)數(shù)據(jù)是N個(gè)象素的坐標(biāo)點(diǎn)和由規(guī)定的線性多項(xiàng)式變換N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)與N個(gè)象素的坐標(biāo)點(diǎn)差分,或者坐標(biāo)數(shù)據(jù)是N個(gè)象素的坐標(biāo)點(diǎn)與過(guò)去的幀的N個(gè)圖像的坐標(biāo)點(diǎn)的差分和由規(guī)定的線性多項(xiàng)式變換N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)與過(guò)去的幀的N個(gè)變換后坐標(biāo)點(diǎn)差分,或者坐標(biāo)數(shù)據(jù)是由規(guī)定的線性多項(xiàng)式變換規(guī)定的N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn),或者坐標(biāo)數(shù)據(jù)是由規(guī)定的線性多項(xiàng)式變換規(guī)定的N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)與規(guī)定的N個(gè)坐標(biāo)點(diǎn)的差分,或者坐標(biāo)數(shù)據(jù)是由規(guī)定的線性多項(xiàng)式變換規(guī)定的N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)與過(guò)去的幀的N個(gè)變換后坐標(biāo)點(diǎn)的差分。
原樣地傳送變換參數(shù)時(shí),在用圖像尺寸使變換參數(shù)倍增后,進(jìn)行量化,加以編碼,或者求得變換參數(shù)的最大值的指數(shù)部分,用指數(shù)部分將變換參數(shù)歸一化,并傳送指數(shù)部分和歸一化后的變換參數(shù)。
附圖簡(jiǎn)要說(shuō)明
圖1表示基于本發(fā)明實(shí)施例1的圖像預(yù)測(cè)編碼裝置的方框圖。
圖2A表示本發(fā)明實(shí)施例1、2中圖像坐標(biāo)變換的第一模式圖。
圖2B表示本發(fā)明實(shí)施例1、2中圖像坐標(biāo)變換的第一模式圖。
圖2C表示本發(fā)明實(shí)施例1、2中圖像坐標(biāo)變換的第一模式圖。
圖3表示基于本發(fā)明實(shí)施例1的圖像預(yù)測(cè)編碼裝置的編碼圖像數(shù)據(jù)序列的模式圖。
圖4A表示本發(fā)明實(shí)施例1、2中圖像坐標(biāo)變換的第二模式圖。
圖4B表示本發(fā)明實(shí)施例1、2中圖像坐標(biāo)變換的第二模式圖。
圖5表示基于本發(fā)明實(shí)施例2的圖像預(yù)測(cè)解碼裝置的方框圖。
圖6A表示在本發(fā)明實(shí)施例1、2中被分割的圖像的模式圖。
圖6B表示在本發(fā)明實(shí)施例1、2中被分割的圖像的模式圖。
圖7A表示在以往的方法中被分割的圖像的模式圖。
圖7B表示在以往的方法中被分割的圖像的模式圖。
圖8表示本發(fā)明實(shí)施例3的數(shù)字圖像解碼裝置的方框圖。
圖9表示本發(fā)明實(shí)施例3的數(shù)字圖像編碼裝置的方框圖。
圖10表示本發(fā)明實(shí)施例4的數(shù)字圖像解碼裝置的方框圖。
圖11表示本發(fā)明實(shí)施例5的數(shù)字圖像解碼裝置的方框圖。
圖12表示本發(fā)明實(shí)施例5的數(shù)字圖像編碼裝置的方框圖。
實(shí)施發(fā)明的最佳方式下面,參照附圖1到附圖12對(duì)本發(fā)明的實(shí)施例進(jìn)行說(shuō)明。
實(shí)施例1圖1表示基于本發(fā)明實(shí)施例1的圖像預(yù)測(cè)編碼裝置的方框圖,在圖1中,101是輸入端,102是第1加法運(yùn)算器,103是編碼器,106是輸出端,107是解碼器,110是第2加法運(yùn)算器,111是第1坐標(biāo)變換器,112是第2坐標(biāo)變換器,113是活動(dòng)檢測(cè)器,114是活動(dòng)補(bǔ)償器,115是幀存儲(chǔ)器。
下面,對(duì)前述結(jié)構(gòu)的圖像預(yù)測(cè)編碼裝置的動(dòng)作進(jìn)行說(shuō)明。在輸入端101上輸入大小不同的從第1到第N的對(duì)象圖像。根據(jù)圖像的長(zhǎng)度決定N。首先,在輸入端101上輸入第1對(duì)象圖像,通過(guò)第1加法運(yùn)算器102后,用編碼器103進(jìn)行壓縮編碼。這種場(chǎng)合,第一加法運(yùn)算器102不作減法運(yùn)算。在本實(shí)施例中,將對(duì)象圖像分割成多個(gè)鄰接的塊(8×8象素),用離散余弦變換器(DCT)104,將空間區(qū)域的信號(hào)變換成頻率區(qū)域的信號(hào),并生成變換塊。量化器(Q)105對(duì)變換塊進(jìn)行量化,生成第1壓縮圖像,并輸出到輸出端106中,變換成固定長(zhǎng)度或者可變長(zhǎng)度的編碼進(jìn)行傳送(未圖示)。同時(shí),用解碼器107將第1壓縮圖像復(fù)原為擴(kuò)展圖像。在本實(shí)施例中,由反量化器IQ(108)進(jìn)行反量化后,在反離散余弦變換器(IDCT)109變換成空間信號(hào),用第1坐標(biāo)變換器111對(duì)這樣得到的再現(xiàn)圖像進(jìn)行坐標(biāo)變換,形成第1再現(xiàn)圖像并存儲(chǔ)在幀存儲(chǔ)器115中。
下面,對(duì)第1坐標(biāo)變換器111的操作進(jìn)行說(shuō)明。以圖2A為第1對(duì)象圖像。圖像201的象素a1在坐標(biāo)系203中具有(0,0)的坐標(biāo)。在圖2C中設(shè)定新的坐標(biāo)系205。這種坐標(biāo)系也可以是顯示畫(huà)面的坐標(biāo)系,或者也可以是以對(duì)象圖像的中心點(diǎn)為原點(diǎn)的坐標(biāo)系。對(duì)任何一種場(chǎng)合,坐標(biāo)系205都在開(kāi)始編碼前被預(yù)先設(shè)定。圖2C示出了將對(duì)象圖像201映射到坐標(biāo)系205。利用這種坐標(biāo)變換,對(duì)象圖像201的象素a1的坐標(biāo)成為(x_a,y_a)。此外,有時(shí)也進(jìn)行包含旋轉(zhuǎn)的坐標(biāo)變換。將x_a,y_a的值編碼成8位固定長(zhǎng)度,并與第1壓縮圖像一起傳送。
接著,將第n(n=2,3,………,N)個(gè)對(duì)象圖像輸入到輸入端101中。通過(guò)導(dǎo)線126,將第n個(gè)對(duì)象圖像輸入到第2坐標(biāo)變換器112,并變換到坐標(biāo)系205中。以圖2B的圖像202作為第n個(gè)對(duì)象圖像。將其映射到坐標(biāo)系205,將象素b1的坐標(biāo)變換成(x_b,y_b)(圖2C)。被坐標(biāo)變換后的對(duì)象圖像202又輸入到活動(dòng)檢測(cè)器113,分割成多個(gè)塊,參照存儲(chǔ)在幀存儲(chǔ)器115中的第(n-1)個(gè)再現(xiàn)圖像,用塊匹配等方法進(jìn)行活動(dòng)檢測(cè),并生成活動(dòng)向量。將生成的活動(dòng)向量在導(dǎo)線128上輸出,進(jìn)行編碼并傳送(未圖示),同時(shí)傳送到補(bǔ)償器114中,對(duì)存儲(chǔ)在幀存儲(chǔ)器115中的第(n-1)個(gè)再現(xiàn)圖像進(jìn)行訪問(wèn),生成預(yù)測(cè)塊。例如,在USP5,193,004中公開(kāi)了關(guān)于活動(dòng)檢測(cè)和活動(dòng)補(bǔ)償?shù)膶?shí)施例。
在第1加法運(yùn)算器102上輸入第n個(gè)對(duì)象圖像的塊及其預(yù)測(cè)塊,生成差分塊。用編碼器103壓縮差分塊,生成第n個(gè)壓縮圖像,并輸出到輸出端106上,同時(shí)用解碼器107復(fù)原成擴(kuò)展差分塊。在第2加法運(yùn)算器110將通過(guò)導(dǎo)線125傳送擴(kuò)展預(yù)測(cè)塊與擴(kuò)展差分塊相加,對(duì)圖像進(jìn)行再現(xiàn)。將這樣再現(xiàn)的圖像輸入到第1坐標(biāo)變換器111中,進(jìn)行與圖2C的圖像202相同的坐標(biāo)變換,并作為第n個(gè)再現(xiàn)圖像存儲(chǔ)在幀存儲(chǔ)器115中,同時(shí)對(duì)象素b1的坐標(biāo)(x_b,y_b)進(jìn)行編碼,并與第n個(gè)壓縮圖像一起傳送。
圖3表示基于本發(fā)明實(shí)施例的圖像預(yù)測(cè)編碼裝置的編碼圖像數(shù)據(jù)序列的模式圖。在編碼圖像數(shù)據(jù)的前頭是圖像同步信號(hào)303,接著是基于坐標(biāo)變換的參數(shù)x_a(304)、y_a(305),圖像的尺寸306、307,量化中所用量化級(jí)的值308。然后接著活動(dòng)向量和圖像的壓縮數(shù)據(jù)。也就是說(shuō),傳送作為坐標(biāo)數(shù)據(jù)傳,傳送x_a(304)、y_a(305)和圖像的尺寸306、307。
圖4表示本發(fā)明實(shí)施例的圖像坐標(biāo)變換的其它形態(tài)。這種場(chǎng)合,將對(duì)象圖像分割成多個(gè)區(qū)域,并對(duì)各區(qū)域分別進(jìn)行坐標(biāo)變換。例如,將圖像201分割成三個(gè)區(qū)域R1,R2,R3,在壓縮、擴(kuò)展各區(qū)域后,用第1坐標(biāo)變換器111分別使被再現(xiàn)的R1,R2,R3的區(qū)域坐標(biāo)變換,并存儲(chǔ)在幀存儲(chǔ)器115中。同時(shí)編碼并傳送在坐標(biāo)變換中使用的參數(shù)(x_a1,y_a1),(x_a2,y_a2),(x_a3,y_a3)。
接著,輸入圖像202,分割成區(qū)域R4,R5,R6,用第2坐標(biāo)變換器112對(duì)各自的區(qū)域進(jìn)行坐標(biāo)變換。對(duì)各坐標(biāo)變換后的區(qū)域,參照存儲(chǔ)在幀存儲(chǔ)器115中的區(qū)域進(jìn)行活動(dòng)檢測(cè)和活動(dòng)補(bǔ)償,生成預(yù)測(cè)信號(hào),并在第1加法運(yùn)算器102生成差分信號(hào),進(jìn)行壓縮、擴(kuò)展后,在第2加法運(yùn)算器與預(yù)測(cè)信號(hào)相加。對(duì)這樣再現(xiàn)的各區(qū)域分別進(jìn)行坐標(biāo)變換,并存儲(chǔ)到幀存儲(chǔ)器115中。同時(shí)編碼并傳送在坐標(biāo)變換中使用的參數(shù)(x_b1,y_b1),(x_b2,y_b2),(x_b3,y_b3)。
借助于將大小不同的圖像變換成共同的空間坐標(biāo),能提高活動(dòng)檢測(cè)的精度,同時(shí)能減少活動(dòng)向量的編碼量并改善圖像質(zhì)量。借助于讓圖6A和圖6B的圖像在點(diǎn)605上坐標(biāo)一致,使塊601和塊603、塊602和塊604重合,所以能正確地確定活動(dòng)檢測(cè)。在本例中,因塊603和塊604的活動(dòng)向量值接近于0,所以能減少活動(dòng)向量的編碼量。對(duì)于一般的圖像,可以說(shuō)相鄰的兩個(gè)圖像也是這樣。與圖7B不同,圖6B中臉部在一個(gè)塊內(nèi),所以臉不會(huì)出現(xiàn)量化帶來(lái)的垂直失真。
實(shí)施例2圖5表示基于本發(fā)明實(shí)施例2的圖像預(yù)測(cè)解碼裝置的方框圖。在圖5中,501是輸入端,502是數(shù)據(jù)分析器,503是解碼器,506是加法運(yùn)算器,507是輸出端,508是坐標(biāo)變換器,509是活動(dòng)檢測(cè)器,510是幀存儲(chǔ)器。
下面,對(duì)前述結(jié)構(gòu)的圖像預(yù)測(cè)解碼裝置的動(dòng)作進(jìn)行說(shuō)明。在輸入端501上對(duì)大小不同的從第1到第N的對(duì)象圖像進(jìn)行編碼,輸入包含將第n(n=1,2,3,……,N)個(gè)對(duì)象圖像變換成共同空間坐標(biāo)所生成的第n個(gè)變換參數(shù)的從第1到第N個(gè)壓縮圖像數(shù)據(jù)。圖3的模式圖示出了壓縮圖像數(shù)據(jù)的一例。用數(shù)據(jù)分析器502分析輸入后的壓縮圖像數(shù)據(jù)。
首先,用數(shù)據(jù)分析器502分析第1個(gè)壓縮圖像數(shù)據(jù),將第1壓縮圖像輸出到解碼器503中。通過(guò)導(dǎo)線520,將進(jìn)行共同空間坐標(biāo)變換所生成的第1個(gè)變換參數(shù)(圖2C的x_a,y_a)送到坐標(biāo)變換器508中。在解碼器503,將第1個(gè)壓縮圖像復(fù)原成擴(kuò)展圖像,并輸出到輸出端508中。在本實(shí)施例中,進(jìn)行反量化,施行IDCT,并復(fù)原成空間區(qū)域的信號(hào)。在坐標(biāo)變換器508,以第1個(gè)變換參數(shù)為基礎(chǔ),將擴(kuò)展圖像映射到共同空間坐標(biāo)系,作為第1個(gè)再現(xiàn)圖像輸出,并存儲(chǔ)在幀存儲(chǔ)器510中。關(guān)于坐標(biāo)變換,與實(shí)施例1中的說(shuō)明相同。
接著,用數(shù)據(jù)分析器502分析第n(n=1,2,3,……,N)個(gè)壓縮圖像數(shù)據(jù),將第n個(gè)壓縮差分圖像輸出到解碼器503中。通過(guò)導(dǎo)線521將生成的第n個(gè)活動(dòng)數(shù)據(jù)送到活動(dòng)補(bǔ)償器509中,通過(guò)導(dǎo)線502將進(jìn)行共同空間坐標(biāo)變換所生成的第n個(gè)變換參數(shù)(相當(dāng)于圖2C的x_b,y_b)送到坐標(biāo)變換器508和活動(dòng)補(bǔ)償器509。在解碼器503中,將第n個(gè)壓縮差分圖像復(fù)原成第n個(gè)擴(kuò)展差分圖像,并輸出到加法運(yùn)算器506。在本實(shí)施例中,將對(duì)象塊的差分信號(hào)進(jìn)行反量化并進(jìn)行IDCT后,作為擴(kuò)展差分塊輸出。另一方面,在活動(dòng)補(bǔ)償器509中,用第n個(gè)變換參數(shù)和該塊的活動(dòng)向量,從幀存儲(chǔ)器510取得預(yù)測(cè)塊。在本實(shí)施例中,用變換參數(shù)變換對(duì)象塊的坐標(biāo),即借助于在對(duì)象塊的坐標(biāo)上加上第n個(gè)變換參數(shù)(例如圖2C的x_b,y_b),并在其和上加上活動(dòng)向量,決定幀存儲(chǔ)器510的地址。將這樣得到的預(yù)測(cè)塊送到加法運(yùn)算器506中,與擴(kuò)展差分塊相加,并對(duì)圖像進(jìn)行再現(xiàn)。將被再現(xiàn)的圖像輸出到輸出端507,同時(shí)在坐標(biāo)變換器508用第n個(gè)變換參數(shù)進(jìn)行坐標(biāo)變換,并存儲(chǔ)到幀存儲(chǔ)器510中。
此外,不用坐標(biāo)變換器508,而在活動(dòng)補(bǔ)償器509或者其前后添加具有在對(duì)象塊的坐標(biāo)上加上第n個(gè)圖像和第n-1個(gè)圖像的變換參數(shù)的差分(x_b-x_a,y_b-y_a),并在其上加上活動(dòng)向量的功能的其它裝置,決定幀存儲(chǔ)器510地址,當(dāng)然也有相同的效果。
下面,考慮在輸入端501上輸入其它的壓縮圖像數(shù)據(jù)的場(chǎng)合。也就是說(shuō),將大小不同的從第1到第N個(gè)對(duì)象圖像分割成多個(gè)對(duì)象區(qū)域并進(jìn)行編碼,并輸入包含將各對(duì)象區(qū)域變換成共同空間坐標(biāo)所生成的變換參數(shù)的從第1到第N個(gè)壓縮圖像數(shù)據(jù)。
首先,用數(shù)據(jù)分析器502對(duì)第1壓縮圖像數(shù)據(jù)進(jìn)行分析,并將第m(m=1,2,3,……,M)個(gè)壓縮區(qū)域輸出到解碼器503。在圖4A中M=3。通過(guò)導(dǎo)線520將進(jìn)行共同空間坐標(biāo)變換所生成的第m個(gè)變換參數(shù)(圖4A的x_am,y_am,m=1,2,3)送到坐標(biāo)變換器508。在解碼器503,將第m個(gè)壓縮區(qū)域復(fù)原成第m個(gè)擴(kuò)展區(qū)域,并輸出到輸出端507上。同時(shí),將第m個(gè)擴(kuò)展區(qū)域輸入到坐標(biāo)變換器508。這里,以第m個(gè)變換參數(shù)為基礎(chǔ),將第m個(gè)擴(kuò)展區(qū)域映射到共同空間坐標(biāo)系,作為第m個(gè)再現(xiàn)區(qū)域輸出,并存儲(chǔ)在幀存儲(chǔ)器510中。方法與前文所述相同。
接著,用數(shù)據(jù)分析器502對(duì)第n(n=2,3,……,N)個(gè)壓縮圖像數(shù)據(jù)進(jìn)行分析,并將其中的第k(k=1,2,3,………,K)個(gè)壓縮差分區(qū)域輸出到解碼器503中。在圖4A中K=3。通過(guò)導(dǎo)線521將對(duì)應(yīng)的活動(dòng)數(shù)據(jù)送到活動(dòng)檢測(cè)器509,并將進(jìn)行共同空間坐標(biāo)變換所生成的第k個(gè)變換參數(shù)(圖4B的x_bk,y_bk,k=1,2,3)送到坐標(biāo)變換器508和活動(dòng)補(bǔ)償器509。在解碼器503,將第k個(gè)壓縮差分區(qū)域復(fù)原成第k個(gè)擴(kuò)展差分區(qū)域,并輸出到加法運(yùn)算器506。在本實(shí)施例中,將對(duì)象塊的差分信號(hào)進(jìn)行反量化并進(jìn)行IDCT后,作為擴(kuò)展差分塊輸出。另一方面,在活動(dòng)補(bǔ)償器509中,用第k個(gè)變換參數(shù)和相當(dāng)塊的活動(dòng)向量,從幀存儲(chǔ)器510取得預(yù)測(cè)塊。在本實(shí)施例中,用第k個(gè)變換參數(shù)變換對(duì)象塊的坐標(biāo),即借助于在對(duì)象塊的坐標(biāo)上加上第k個(gè)變換參數(shù)(例如圖4B的x_bk,y_bk,k=1,2,3),并在其和上加上活動(dòng)向量,決定幀存儲(chǔ)器510的地址。將這樣得到的預(yù)測(cè)塊送到加法運(yùn)算器506,與擴(kuò)展差分塊相加,并對(duì)圖像進(jìn)行再現(xiàn)。在將被再現(xiàn)的圖像輸出到輸出端507的同時(shí),用坐標(biāo)變換器508使該圖像坐標(biāo)變換,并存儲(chǔ)在幀存儲(chǔ)器510中。
實(shí)施例3圖8表示本發(fā)明實(shí)施例3的解碼裝置的方框圖。包括輸入端801、可變長(zhǎng)度解碼器802、差分圖像擴(kuò)展單元803、加法運(yùn)算器804、輸出端805、變換參數(shù)生成單元806、幀存儲(chǔ)器807和預(yù)測(cè)圖像生成單元808。
將被壓縮編碼的數(shù)據(jù)輸入到輸入端801上。在可變長(zhǎng)度解碼器802,分析輸入數(shù)據(jù),分離差分圖像數(shù)據(jù)和坐標(biāo)數(shù)據(jù),并通過(guò)導(dǎo)線8002和8003分別送到差分圖像擴(kuò)展單元803和變換參數(shù)生成單元806中。在差分圖像數(shù)據(jù)中包含進(jìn)行過(guò)DCT且量化的變換系數(shù)和量化寬度。在差分圖像擴(kuò)展單元803,利用量化寬度,將變換系數(shù)反量化后進(jìn)行逆DCT,并擴(kuò)展成差分圖像。
另一方面,在坐標(biāo)數(shù)據(jù)中包含用于生成變換參數(shù)的數(shù)據(jù),用變換參數(shù)生成單元806生成變換參數(shù)。例如,在式(3)所示的仿射變換的場(chǎng)合,生成(a,b,c,d,e,f)。下面,說(shuō)明其詳況。
將變換參數(shù)生成單元806生成的變換參數(shù)和存儲(chǔ)在幀存儲(chǔ)器中的圖像輸入到預(yù)測(cè)圖像生成單元808。在式(3)所示的仿射變換的場(chǎng)合。按照式(3),使用從變換參數(shù)生成單元806送來(lái)的(a,b,c,d,e,f),在(x,y)處的象素的預(yù)測(cè)值變?yōu)榇鎯?chǔ)在幀存儲(chǔ)器中的圖像(u,v)中的象素。對(duì)于式(1)、式(2)、式(4)的場(chǎng)合也相同。
將這樣生成的預(yù)測(cè)圖像送到加法運(yùn)算單元804,與差分圖像并對(duì)圖像進(jìn)行再現(xiàn)。被再現(xiàn)的圖像輸出到輸出端805,同時(shí)存儲(chǔ)在幀存儲(chǔ)器807中。
前述的坐標(biāo)數(shù)據(jù)能取多種形態(tài),下面進(jìn)行說(shuō)明。
考慮坐標(biāo)數(shù)據(jù)由N個(gè)象素的坐標(biāo)點(diǎn)和規(guī)定的線性多項(xiàng)式變換該N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)組成的場(chǎng)合。這里,N是用于求得變換參數(shù)所需的點(diǎn)的個(gè)數(shù)。因在仿射參數(shù)的場(chǎng)合有6個(gè)參數(shù),為了求得6個(gè)變量,需要6個(gè)式子。因在一個(gè)坐標(biāo)點(diǎn)上有(x,y)的分量,所以如果N=3,則能解6個(gè)仿射變換參數(shù)。在式(1)的場(chǎng)合,N=1,式(2)的場(chǎng)合,N=2,式(4)的場(chǎng)合,N=5。N個(gè)變換后坐標(biāo)點(diǎn)是活動(dòng)向量,相當(dāng)于從式(1)到式(4)的左邊的(u,v)。
在仿射變換的場(chǎng)合,通過(guò)導(dǎo)線8003,3個(gè)坐標(biāo)點(diǎn)(x0,y0)、(x1,y1)、(x2,y2)和變換后坐標(biāo)點(diǎn)(u0,v0)、(u1,v1)、(u2,v2)輸入到變換參數(shù)生成單元806中。在變換參數(shù)生成單元806,借助于求解式(5)的聯(lián)立方程式,能得到仿射參數(shù)。
(u0,v0)=(ax0+by0+e,cx0+dy0+f)(u1,v1)=(ax1+by1+e,cx1+dy1+f)(5)(u2,v2)=(ax2+by2+e,cx2+dy2+f)此外,能用更多的坐標(biāo)數(shù)據(jù)求得變換參數(shù)。在其它的場(chǎng)合也能同樣解變換參數(shù)。借助于很好地選擇N個(gè)(x,y)能求得非常高精度的變換參數(shù)。正交配置的N個(gè)(x,y)是令人滿意的。
此外,對(duì)變換后坐標(biāo)點(diǎn)(u0,v0)、(u1,v1)、(u2,v2)求對(duì)應(yīng)的坐標(biāo)點(diǎn)(x0,y0)、(x1,y1)、(x2,y2)時(shí),也可以用式(6)的聯(lián)立方程式代替式(5)。
(x0,y0)=(Au0+Bv0+E,Cu0+Dv0+F)(x1,y1)=(Au1+Bv1+E,Cu1+Dv1+F)(6)(x2,y2)=(Au2+Bv2+E,Cu2+Dv2+F)接著,考慮坐標(biāo)數(shù)據(jù)由N個(gè)象素的坐標(biāo)點(diǎn)和規(guī)定的線性多項(xiàng)式變換該N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)的差分值的場(chǎng)合。在用于取差分的預(yù)測(cè)值是N個(gè)象素的坐標(biāo)點(diǎn)的場(chǎng)合,用變換參數(shù)生成單元806對(duì)N個(gè)象素的坐標(biāo)點(diǎn)和N個(gè)變換后坐標(biāo)點(diǎn)的差分值進(jìn)行加法運(yùn)算,由N個(gè)象素的坐標(biāo)點(diǎn)和加法運(yùn)算后的N個(gè)變換后坐標(biāo)點(diǎn)生成變換參數(shù)。此外,在用于取差分的預(yù)測(cè)值是前幀的N個(gè)象素的變換后坐標(biāo)點(diǎn)的場(chǎng)合,用變換參數(shù)生成單元806對(duì)前幀的N個(gè)變換后坐標(biāo)點(diǎn)和N個(gè)變換后坐標(biāo)點(diǎn)的差分值進(jìn)行加法運(yùn)算,由N個(gè)象素的坐標(biāo)點(diǎn)和加法運(yùn)算后的N個(gè)變換后坐標(biāo)點(diǎn)生成變換參數(shù)。將加法運(yùn)算后的N個(gè)變換后坐標(biāo)點(diǎn)作為下一個(gè)幀的預(yù)測(cè)值預(yù)先進(jìn)行存儲(chǔ)。
接著,考慮坐標(biāo)數(shù)據(jù)是由規(guī)定的線性多項(xiàng)式變換規(guī)定的N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)的場(chǎng)合。規(guī)定的N個(gè)坐標(biāo)點(diǎn)是預(yù)先確定的坐標(biāo)點(diǎn),不必進(jìn)行傳送。用變換參數(shù)生成單元806,由規(guī)定的N個(gè)象素的坐標(biāo)點(diǎn)和N個(gè)變換后坐標(biāo)點(diǎn)生成變換參數(shù)。
接著,考慮坐標(biāo)點(diǎn)是由規(guī)定的線性多項(xiàng)式變換規(guī)定的N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)的差分值的場(chǎng)合。在用于取差分的預(yù)測(cè)值是N個(gè)象素的坐標(biāo)點(diǎn)的場(chǎng)合,用變換參數(shù)生成單元806對(duì)N個(gè)象素的坐標(biāo)點(diǎn)和N個(gè)變換后坐標(biāo)點(diǎn)的差分值進(jìn)行加法運(yùn)算,由N個(gè)象素的坐標(biāo)點(diǎn)和加法運(yùn)算后的N個(gè)變換后坐標(biāo)點(diǎn)生成變換參數(shù)。此外,在用于取差分的預(yù)測(cè)值是前幀的N個(gè)象素的變換后坐標(biāo)點(diǎn)的場(chǎng)合,用變換參數(shù)生成單元806對(duì)前幀的N個(gè)象素的變換后坐標(biāo)點(diǎn)和N個(gè)變換后坐標(biāo)點(diǎn)的差分值進(jìn)行加法運(yùn)算,由N個(gè)象素的坐標(biāo)點(diǎn)和加法運(yùn)算后的N個(gè)變換后坐標(biāo)點(diǎn)生成變換參數(shù)。將加法運(yùn)算后的N個(gè)變換后坐標(biāo)點(diǎn)作為下一個(gè)幀的預(yù)測(cè)值預(yù)先進(jìn)行存儲(chǔ)。
圖9表示本發(fā)明實(shí)施例3的編碼裝置的方框圖。包括輸入端901、變換參數(shù)推定單元903、預(yù)測(cè)圖像生成單元908、第1加法運(yùn)算單元904、差分圖像壓縮單元905、差分圖像擴(kuò)展單元910、第2加法運(yùn)算單元911、幀存儲(chǔ)器909和傳送單元906。將數(shù)字圖像輸入到輸入端901上,用變換參數(shù)推定單元903,由存儲(chǔ)在幀存儲(chǔ)器中的圖像和數(shù)字圖像推定變換參數(shù)。關(guān)于仿射參數(shù)的推定方法與前文所述相同。
此外,也可以用其原圖像代替存儲(chǔ)在幀存儲(chǔ)器中的圖像。通過(guò)導(dǎo)線9002將用變換參數(shù)推定單元903推定的變換參數(shù)送到預(yù)測(cè)圖像生成單元908中。通過(guò)導(dǎo)線9009將用變換參數(shù)變換的坐標(biāo)數(shù)據(jù)送到傳送單元906中。關(guān)于坐標(biāo)數(shù)據(jù),如前所述也可以具有多種形態(tài)。在預(yù)測(cè)圖像生成單元908,輸入被推定的變換參數(shù)和存儲(chǔ)在幀存儲(chǔ)器909中的圖像,并根據(jù)被推定的變換參數(shù),如前所述地生成預(yù)測(cè)圖像。接著,用第1加法運(yùn)算單元904,求得數(shù)字圖像和預(yù)測(cè)圖像的差分,用差分圖像壓縮單元905,對(duì)差分圖像進(jìn)行DCT后量化。同時(shí),用差分圖像擴(kuò)展單元910,將壓縮差分?jǐn)?shù)據(jù)擴(kuò)展成擴(kuò)展差分?jǐn)?shù)據(jù)。在差分圖像擴(kuò)展單元910施行反量化和反DCT。用第2加法運(yùn)算單元,對(duì)擴(kuò)展差分?jǐn)?shù)據(jù)和預(yù)測(cè)圖像進(jìn)行加法運(yùn)算,并存儲(chǔ)在幀存儲(chǔ)器中。在傳送單元906,對(duì)壓縮差分?jǐn)?shù)據(jù)、量化寬度、坐標(biāo)數(shù)據(jù)進(jìn)行編碼,并加以復(fù)接后進(jìn)行傳送和存儲(chǔ)。
實(shí)施例4圖10表示本發(fā)明實(shí)施例4的數(shù)字圖像解碼裝置。包括輸入端1001、可變長(zhǎng)度解碼單元1002、差分圖像擴(kuò)展單元1003、加法運(yùn)算單元1004、變換參數(shù)生成單元1006、預(yù)測(cè)圖像生成單元1008和幀存儲(chǔ)器1007?;緞?dòng)作與圖8相同。僅對(duì)不同的地方進(jìn)行說(shuō)明。變換參數(shù)生成單元1006形成能生成多種變換參數(shù)的結(jié)構(gòu)。參數(shù)生成單元1006a包括式(2)所示的參數(shù)(a,e,d,f),參數(shù)生成單元1006b包括式(3)所示的參數(shù)(a,b,c,d,e,f),參數(shù)生成單元1006c包括式(4)所示的參數(shù)(g,p,r,a,b,e,h,q,s,c,d,f)。如果式(2)有2個(gè)坐標(biāo)點(diǎn),式(3)有6個(gè)坐標(biāo)點(diǎn),式(4)有12個(gè)坐標(biāo)點(diǎn),則能生成參數(shù)。這種坐標(biāo)點(diǎn)的個(gè)數(shù)通過(guò)導(dǎo)線10010控制開(kāi)關(guān)1009和1010。當(dāng)坐標(biāo)點(diǎn)的個(gè)數(shù)是2時(shí),將開(kāi)關(guān)1009和1010分別與端子1011a和1012a連接,通過(guò)導(dǎo)線10003將坐標(biāo)數(shù)據(jù)送到參數(shù)生成單元1006a中,借助于求解聯(lián)立方程式,生成式(2)的參數(shù),并從端子1012a輸出。當(dāng)坐標(biāo)點(diǎn)的個(gè)數(shù)是3、6時(shí),分別與參數(shù)生成單元1006b和1006c連接。這樣,根據(jù)坐標(biāo)點(diǎn)的個(gè)數(shù)信息,知道傳送的坐標(biāo)數(shù)據(jù)的種類,能切換并生成變換參數(shù)。通過(guò)導(dǎo)線10003的坐標(biāo)數(shù)據(jù)的形態(tài)如前所述。此外,在已知從式(2)到式(4)的右邊的(x,y)的場(chǎng)合,因不必進(jìn)行傳送,所以通過(guò)導(dǎo)線10010的坐標(biāo)點(diǎn)的個(gè)數(shù)對(duì)應(yīng)于式(2)是1、對(duì)應(yīng)于式(3)是3、對(duì)應(yīng)于式(4)是6。此外,變換參數(shù)生成單元不限于3,也可以是大于3。
實(shí)施例5圖11和圖12表示本發(fā)明實(shí)施例5的數(shù)字圖像解碼裝置和編碼裝置的方框圖?;旧吓c圖8和圖9相同。不同的地方是用變換參數(shù)擴(kuò)展單元1106代替變換參數(shù)生成單元806,此外,變換參數(shù)推定單元903與1203的動(dòng)作有些不同。下面,對(duì)此進(jìn)行說(shuō)明。在圖12的變換參數(shù)推定單元1203推定變換參數(shù),乘以圖像尺寸進(jìn)行倍增,并在量化后、通過(guò)導(dǎo)線12009傳送到傳送單元1206中。變換參數(shù)是實(shí)數(shù)值,倍增后需要進(jìn)一步取整數(shù)。在仿射參數(shù)的場(chǎng)合,需要高精度地表現(xiàn)(a,b,c,d)。a和c是垂直坐標(biāo)參數(shù),乘以圖像的垂直象素?cái)?shù)V。b與d是水平坐標(biāo)的參數(shù),乘以圖像的水平象素?cái)?shù)H。如式(4)所示,在有二次項(xiàng)的場(chǎng)合,同樣能使起倍增作用圖像尺寸形成二次項(xiàng)(H2、V2、HV)。在圖11的變換參數(shù)擴(kuò)展單元1106,對(duì)倍增后的參數(shù)進(jìn)行除法運(yùn)算,并再現(xiàn)參數(shù)。
圖12的變換參數(shù)推定單元1203在推定變換參數(shù)后,確定變換參數(shù)的最大值。最好是絕對(duì)值的最大值。用該最大值的指數(shù)部分(最好是2次冪的指數(shù)部分),對(duì)變換參數(shù)進(jìn)行歸一化。也就是說(shuō),在各變換參數(shù)上乘以指數(shù)部分的值。這樣,將被歸一化的變換參數(shù)和指數(shù)部分送到傳送單元1206中,變換成固定長(zhǎng)度編碼進(jìn)行傳送。在圖11的變換參數(shù)擴(kuò)展單元1106,將歸一化后的變換參數(shù)除以指數(shù)部分,擴(kuò)展成變換參數(shù)。在仿射參數(shù)(a,b,c,d)的場(chǎng)合,從(a,b,c,d)中求得最大值。雖然也可以包含平行移動(dòng)的參數(shù)(e,f),但因普通值的大小位數(shù)不同,所以沒(méi)有包含。關(guān)于式(4)的參數(shù)也相同,雖然分開(kāi)二次項(xiàng)與一次項(xiàng)的參數(shù)進(jìn)行歸一化是令人滿意的,但是也不限于此。
如前所述,在實(shí)施例中,雖然對(duì)差分圖像為非零的場(chǎng)合進(jìn)行了說(shuō)明,但差分圖像為全零的場(chǎng)合也相同。這種場(chǎng)合,預(yù)測(cè)圖像原樣地輸出。此外,雖然對(duì)圖像整體的變換進(jìn)行了說(shuō)明,但將二維或者三維的圖像分割成多個(gè)小區(qū)域,在各小區(qū)域施行以仿射變換為首的變換的場(chǎng)合,也同樣能用。
工業(yè)上的實(shí)用性如前所述,采用本發(fā)明,則借助于將大小不同的圖像變換到同一坐標(biāo)系中后,進(jìn)行活動(dòng)檢測(cè)并生成預(yù)測(cè)圖像,能得到在提高活動(dòng)檢測(cè)精度的同時(shí),減少活動(dòng)向量的編碼量的效果。借助于在解碼側(cè)從坐標(biāo)數(shù)據(jù)確定變換參數(shù),能得到高精度的變換參數(shù),并能生成高精度的預(yù)測(cè)圖像。借助于變換參數(shù)一邊歸一化、一邊用圖像尺寸進(jìn)行倍增,能用對(duì)應(yīng)于圖像的精度傳送參數(shù)。此外,借助于根據(jù)坐標(biāo)數(shù)據(jù)的個(gè)數(shù),切換變換參數(shù)的生成,能對(duì)變換參數(shù)的生成進(jìn)行最佳處理,同時(shí)能高效率傳送坐標(biāo)數(shù)據(jù)。
權(quán)利要求
1.一種數(shù)字圖像編碼裝置,其特征在于,包括對(duì)輸入圖像進(jìn)行編碼并進(jìn)行數(shù)據(jù)壓縮的圖像壓縮手段;對(duì)將所述圖像壓縮手段壓縮后的圖像解碼而得到的圖像進(jìn)行坐標(biāo)變換,并輸出因進(jìn)行該坐標(biāo)變換而產(chǎn)生的坐標(biāo)數(shù)據(jù)的坐標(biāo)變換手段;從所述坐標(biāo)變換手段的坐標(biāo)數(shù)據(jù)生成變換參數(shù)的變換參數(shù)生成手段;用由所述變換參數(shù)生成手段生成的變換參數(shù),從所述輸入圖像生成預(yù)測(cè)圖像的預(yù)測(cè)圖像生成手段;傳送所述壓縮圖像和坐標(biāo)數(shù)據(jù)的傳送手段。
2.如權(quán)利要求1所述的數(shù)字圖像編碼裝置,其特征在于,變換參數(shù)生成手段從N個(gè)(N是自然數(shù))象素的坐標(biāo)點(diǎn)和由規(guī)定的線性多項(xiàng)式變換所述N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn),生成變換參數(shù)。
3.如權(quán)利要求1所述的數(shù)字圖像編碼裝置,其特征在于,變換參數(shù)生成手段輸入大小不同的第1到第N個(gè)對(duì)象圖像,對(duì)所述第1到第N個(gè)對(duì)象圖像,設(shè)定共同空間坐標(biāo),對(duì)所述第1到第N個(gè)對(duì)象圖像,用規(guī)定的的方法進(jìn)行壓縮編碼,生成第1到第N個(gè)壓縮圖像,而且對(duì)所述第1到第N個(gè)壓縮圖像進(jìn)行解碼,變換成所述共同空間坐標(biāo),生成第1到第N個(gè)擴(kuò)展圖像加以存儲(chǔ)同時(shí)輸出將所述第1到第N個(gè)擴(kuò)展圖像變換成所述共同空間坐標(biāo)而生成的變換參數(shù)。
4.一種數(shù)字圖像解碼裝置,其特征在于,包括輸入壓縮圖像數(shù)據(jù)和坐標(biāo)數(shù)據(jù),進(jìn)行可變長(zhǎng)度解碼的可變長(zhǎng)度解碼手段;從所述可變長(zhǎng)度解碼手段解碼后的坐標(biāo)數(shù)據(jù)生成變換參數(shù)的變換參數(shù)生成手段;用由所述變換參數(shù)生成手段生成的變換參數(shù),生成預(yù)測(cè)圖像數(shù)據(jù)的預(yù)測(cè)圖像生成手段;對(duì)來(lái)自所述預(yù)測(cè)圖像生成手段的預(yù)測(cè)圖像和進(jìn)行所述可變長(zhǎng)度解碼后的壓縮圖像數(shù)據(jù)進(jìn)行加法運(yùn)算,從而生成解碼圖像的加法運(yùn)算手段。
5.如權(quán)利要求4所述的數(shù)字圖像解碼裝置,其特征在于,變換參數(shù)生成手段從N個(gè)(N是自然數(shù))象素的坐標(biāo)點(diǎn)和由規(guī)定的線性多項(xiàng)式變換所述N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn),生成變換參數(shù)。
6.如權(quán)利要求4所述的數(shù)字圖像解碼裝置,其特征在于,變換參數(shù)生成手段輸入大小不同的第1到第N個(gè)對(duì)象圖像,對(duì)所述第1到第N個(gè)對(duì)象圖像,設(shè)定共同空間坐標(biāo),對(duì)所述第1到第N個(gè)對(duì)象圖像,用規(guī)定的的方法進(jìn)行壓縮編碼,生成第1到第N個(gè)壓縮圖像,對(duì)所述第1到第N個(gè)壓縮圖像進(jìn)行解碼,變換成所述共同空間坐標(biāo),生成從第1到第N個(gè)擴(kuò)展圖像加以存儲(chǔ)。同時(shí)輸出將所述第1到第N個(gè)擴(kuò)展圖像變換成所述共同空間坐標(biāo)而生成的變換參數(shù)。
7.一種圖像預(yù)測(cè)編碼裝置,其特征在于,輸入大小不同的第1到第N個(gè)對(duì)象圖像,對(duì)所述第1到第N個(gè)對(duì)象圖像,設(shè)定共同空間坐標(biāo),對(duì)所述第1對(duì)象圖像,用規(guī)定的的方法進(jìn)行壓縮編碼,生成第1壓縮圖像,對(duì)所述第1壓縮圖像進(jìn)行解碼,變換成所述共同空間坐標(biāo),生成第1擴(kuò)展圖像加以存儲(chǔ),同時(shí)對(duì)將所述第1擴(kuò)展圖像變換成所述共同空間坐標(biāo)而生成的第1偏移信號(hào)進(jìn)行編碼,并與所述第1壓縮圖像一起傳送,對(duì)所述第n(n=2,3,……,N)對(duì)象圖像,變換成所述共同空間坐標(biāo),參照第(n-1)的擴(kuò)展圖像,生成預(yù)測(cè)圖像,由生成所述第n對(duì)象圖像和所述預(yù)測(cè)圖像生成差分圖像并進(jìn)行壓縮編碼,生成第n壓縮圖像后,對(duì)所述第n壓縮圖像進(jìn)行解碼,變換成所述共同空間坐標(biāo),生成并存儲(chǔ)第n擴(kuò)展圖像加以存儲(chǔ)同時(shí)將把所述第n擴(kuò)展圖像變換成所述共同空間坐標(biāo)而生成的第n偏移信號(hào)編碼后,與所述第n壓縮圖像一起傳送。
8.一種圖像預(yù)測(cè)編碼裝置,其特征在于,輸入大小不同的第1到第N個(gè)對(duì)象圖像,對(duì)所述第1到第N個(gè)對(duì)象圖像,設(shè)定共同空間坐標(biāo),將所述第1對(duì)象圖像分割成M個(gè)區(qū)域,用規(guī)定的方法對(duì)所述第m(m=1,2,……,M)區(qū)域進(jìn)行壓縮編碼,生成第m壓縮區(qū)域,對(duì)所述第m壓縮區(qū)域進(jìn)行解碼,變換成所述共同空間坐標(biāo),在生成第m擴(kuò)展區(qū)域加以存儲(chǔ),同時(shí)對(duì)將所述第m擴(kuò)展區(qū)域變換成所述共同空間坐標(biāo)而生成的第m偏移信號(hào)進(jìn)行編碼,并與所述第m壓縮區(qū)域一起傳送,將所述第n(n=2,3,……,N)對(duì)象圖像分割成K個(gè)區(qū)域,將所述第k(k=1,2,3,……,K)區(qū)域變換成所述共同空間坐標(biāo),參照第m擴(kuò)展區(qū)域,生成預(yù)測(cè)圖像由所述第k區(qū)域和所述預(yù)測(cè)圖像生成差分區(qū)域并進(jìn)行壓縮編碼后,生成第k壓縮區(qū)域,對(duì)所述第k壓縮區(qū)域進(jìn)行解碼,變換成所述共同空間坐標(biāo),生成第k擴(kuò)展區(qū)域加以存儲(chǔ),同時(shí)將把所述第k擴(kuò)展區(qū)域變換成所述共同空間坐標(biāo)而生成的第k偏移信號(hào)進(jìn)行編碼后,與所述第壓縮區(qū)域一起傳送。
9.一種圖像預(yù)測(cè)解碼裝置,其特征在于,包括輸入端、數(shù)據(jù)分析器、解碼器、加法運(yùn)算器、坐標(biāo)變換器、活動(dòng)補(bǔ)償器和幀存儲(chǔ)器,在所述輸入端上對(duì)大小不同的第1到第N個(gè)對(duì)象圖像進(jìn)行編碼,輸入包含將第n(n=1,2,3,……,N)對(duì)象圖像變換成共同空間坐標(biāo)而生成的第n偏移信號(hào)的第1到第N個(gè)壓縮圖像數(shù)據(jù),用所述數(shù)據(jù)分析器分析所述第1壓縮圖像數(shù)據(jù),輸出第1壓縮圖像信號(hào)和第1偏移信號(hào),將所述第1壓縮圖像信號(hào)輸入到所述解碼器中,并復(fù)原為第1再現(xiàn)圖像,用所述坐標(biāo)變換器以所述第1偏移信號(hào)為基礎(chǔ),使第1再現(xiàn)圖像坐標(biāo)變換后,存儲(chǔ)在所述幀存儲(chǔ)器中,又對(duì)第n(n=2,3,……,N)壓縮圖像數(shù)據(jù),用所述數(shù)據(jù)分析器分析所述第n壓縮圖像數(shù)據(jù),輸出第n壓縮圖像信號(hào)和第n偏移信號(hào)以及第n活動(dòng)信號(hào),將所述第n壓縮圖像信號(hào)輸入到所述解碼器中,并復(fù)原為第n擴(kuò)展差分圖像,將所述第n偏移信號(hào)和所述第n活動(dòng)信號(hào)輸入到所述活動(dòng)補(bǔ)償器中,以所述第n偏移信號(hào)和第n活動(dòng)信號(hào)為基礎(chǔ),從存儲(chǔ)在所述幀存儲(chǔ)器中的第(n-1)的再現(xiàn)圖像取得第n預(yù)測(cè)圖像,在所述加法運(yùn)算器對(duì)所述第n擴(kuò)展差分圖像和所述第n預(yù)測(cè)圖像進(jìn)行加法運(yùn)算,復(fù)原為第n再現(xiàn)圖像并輸出,同時(shí),在所述坐標(biāo)變換器以所述第n偏移信號(hào)為基礎(chǔ)使第n再現(xiàn)圖像坐標(biāo)變換后,存儲(chǔ)在所述幀存儲(chǔ)器中。
10.一種圖像預(yù)測(cè)解碼裝置,其特征在于,包括輸入端、數(shù)據(jù)分析器、解碼器、加法運(yùn)算器、坐標(biāo)變換器、活動(dòng)補(bǔ)償器和幀存儲(chǔ)器,在所述輸入端上將大小不同的第1到第N個(gè)對(duì)象圖像分割成多個(gè)對(duì)象區(qū)域并進(jìn)行編碼,輸入包含將所述多個(gè)對(duì)象區(qū)域變換成共同空間坐標(biāo)而生成的偏移信號(hào)的第1到第N個(gè)壓縮圖像數(shù)據(jù),用所述數(shù)據(jù)分析器分析所述第1壓縮圖像數(shù)據(jù),輸出第m(m=2,3,……,M)壓縮區(qū)域信號(hào)和第m偏移信號(hào),將所述第m壓縮區(qū)域信號(hào)輸入到所述解碼器中,并復(fù)原為第m再現(xiàn)區(qū)域,用所述坐標(biāo)變換器以所述第m偏移信號(hào)為基礎(chǔ),使第m再現(xiàn)區(qū)域坐標(biāo)變換后,存儲(chǔ)在所述幀存儲(chǔ)器中,對(duì)第n(n=2,3,……,N)壓縮圖像數(shù)據(jù),用所述數(shù)據(jù)分析器分析所述第n壓縮圖像數(shù)據(jù),輸出第k(k=1,2,…,K)壓縮區(qū)域信號(hào)、第k偏移信號(hào)以及第k活動(dòng)信號(hào),將所述第k壓縮區(qū)域信號(hào)輸入到所述解碼器中,并復(fù)原為第k擴(kuò)展差分區(qū)域,將所述第k偏移信號(hào)和所述第k活動(dòng)信號(hào)輸入到所述活動(dòng)補(bǔ)償器中,以所述第k偏移信號(hào)和第k活動(dòng)信號(hào)為基礎(chǔ),從存儲(chǔ)在所述幀存儲(chǔ)器中的所述第m再現(xiàn)區(qū)域取得第k預(yù)測(cè)區(qū)域,在所述加法運(yùn)算器對(duì)所述第k擴(kuò)展差分區(qū)域和所述第k預(yù)測(cè)區(qū)域進(jìn)行加法運(yùn)算,復(fù)原第k再現(xiàn)區(qū)域并輸出,同時(shí)在所述坐標(biāo)變換器以所述第k偏移信號(hào)為基礎(chǔ)使第k再現(xiàn)區(qū)域坐標(biāo)變換后,存儲(chǔ)在所述幀存儲(chǔ)器中。
11.一種數(shù)字圖像解碼裝置,其特征在于,包括可變長(zhǎng)度解碼單元、差分圖像擴(kuò)展單元、加法運(yùn)算單元、變換參數(shù)生成單元、預(yù)測(cè)圖像生成單元和幀存儲(chǔ)器,將數(shù)據(jù)輸入到所述可變長(zhǎng)度解碼單元中,從所述數(shù)據(jù)分出差分圖像數(shù)據(jù)并傳送到所述差分圖像擴(kuò)展單元,同時(shí)將N個(gè)象素的坐標(biāo)點(diǎn)和由規(guī)定的線性多項(xiàng)式變換所述N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)輸入到所述變換參數(shù)生成單元,用所述差分圖像生成單元將所述差分圖像數(shù)據(jù)擴(kuò)展后,傳送到所述加法運(yùn)算單元,用所述變換參數(shù)生成單元從所述N個(gè)象素的坐標(biāo)點(diǎn)和N個(gè)變換后坐標(biāo)點(diǎn)生成變換參數(shù),并傳送到所述預(yù)測(cè)圖像生成單元,用所述預(yù)測(cè)圖像生成單元從所述變換參數(shù)和由所述幀存儲(chǔ)器輸入的圖像生成預(yù)測(cè)圖像并傳送到所述加法運(yùn)算單元,所述加法運(yùn)算單元將所述預(yù)測(cè)圖像與進(jìn)行所述擴(kuò)展后的差分圖像相加,生成圖像并輸出,同時(shí)存儲(chǔ)在所述幀存儲(chǔ)器中。
12.一種數(shù)字圖像解碼裝置,其特征在于,包括可變長(zhǎng)度解碼單元、差分圖像擴(kuò)展單元、加法運(yùn)算單元、變換參數(shù)生成單元、預(yù)測(cè)圖像生成單元和幀存儲(chǔ)器,將數(shù)據(jù)輸入到所述可變長(zhǎng)度解碼單元中,從所述數(shù)據(jù)分出差分圖像數(shù)據(jù)并傳送到所述差分圖像擴(kuò)展單元,同時(shí)將N個(gè)象素的坐標(biāo)點(diǎn)和由規(guī)定的線性多項(xiàng)式變換所述N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)的差分值輸入到所述變換參數(shù)生成單元,用所述差分圖像生成單元將所述差分圖像數(shù)據(jù)擴(kuò)展后,傳送到所述加法運(yùn)算單元,用所述變換參數(shù)生成單元對(duì)所述N個(gè)象素的坐標(biāo)點(diǎn)和N個(gè)變換后坐標(biāo)點(diǎn)的差分值進(jìn)行加法運(yùn)算,從所述N個(gè)象素的坐標(biāo)點(diǎn)和所述加法運(yùn)算后的N個(gè)變換后坐標(biāo)點(diǎn)生成變換參數(shù),并傳送到所述預(yù)測(cè)圖像生成單元,所述預(yù)測(cè)圖像生成單元從所述變換參數(shù)和由所述幀存儲(chǔ)器輸入的圖像生成預(yù)測(cè)圖像,并傳送到所述加法運(yùn)算單元,所述加法運(yùn)算單元將所述預(yù)測(cè)圖像與進(jìn)行所述擴(kuò)展后的差分圖像相加,生成圖像并輸出,同時(shí)存儲(chǔ)在所述幀存儲(chǔ)器中。
13.一種數(shù)字圖像解碼裝置,其特征在于,包括可變長(zhǎng)度解碼單元、差分圖像擴(kuò)展單元、加法運(yùn)算單元、變換參數(shù)生成單元、預(yù)測(cè)圖像生成單元和幀存儲(chǔ)器,將數(shù)據(jù)輸入到所述可變長(zhǎng)度解碼單元中,從所述數(shù)據(jù)分出差分圖像數(shù)據(jù)并傳送到所述差分圖像擴(kuò)展單元,同時(shí)將N個(gè)象素的坐標(biāo)點(diǎn)和由規(guī)定的線性多項(xiàng)式變換所述N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)輸入到所述變換參數(shù)生成單元,用所述差分圖像生成單元將所述差分圖像數(shù)據(jù)擴(kuò)展后,傳送到所述加法運(yùn)算單元,用所述變換參數(shù)生成單元從所述規(guī)定的N個(gè)象素的坐標(biāo)點(diǎn)和所述N個(gè)變換后坐標(biāo)點(diǎn)生成變換參數(shù),并傳送到所述預(yù)測(cè)圖像生成單元,用所述預(yù)測(cè)圖像生成單元從所述變換參數(shù)和由所述幀存儲(chǔ)器輸入的圖像生成預(yù)測(cè)圖像,并傳送到所述加法運(yùn)算單元,所述加法運(yùn)算單元將所述預(yù)測(cè)圖像加與進(jìn)行所述擴(kuò)展后的差分圖像相加,生成圖像并輸出,同時(shí)存儲(chǔ)在所述幀存儲(chǔ)器中。
14.一種數(shù)字圖像解碼裝置,其特征在于,包括可變長(zhǎng)度解碼單元、差分圖像擴(kuò)展單元、加法運(yùn)算單元、變換參數(shù)生成單元、預(yù)測(cè)圖像生成單元和幀存儲(chǔ)器,將數(shù)據(jù)輸入到所述可變長(zhǎng)度解碼單元中,從所述數(shù)據(jù)分出差分圖像數(shù)據(jù)并傳送到所述差分圖像擴(kuò)展單元,同時(shí)將N個(gè)象素的坐標(biāo)點(diǎn)和由規(guī)定的線性多項(xiàng)式變換所述N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)的差分值輸入到所述變換參數(shù)生成單元,用所述差分圖像生成單元將所述差分圖像數(shù)據(jù)擴(kuò)展后,傳送到所述加法運(yùn)算單元,用所述變換參數(shù)生成單元對(duì)所述N個(gè)變換后的坐標(biāo)點(diǎn)的預(yù)測(cè)值和所述N個(gè)變換后坐標(biāo)點(diǎn)的差分值進(jìn)行加法運(yùn)算,從所述規(guī)定的N個(gè)象素的坐標(biāo)點(diǎn)和所述加法運(yùn)算后的N個(gè)變換后坐標(biāo)點(diǎn)生成變換參數(shù),并傳送到所述預(yù)測(cè)圖像生成單元,用所述預(yù)測(cè)圖像生成單元由所述變換參數(shù)和從所述幀存儲(chǔ)器輸入的圖像生成預(yù)測(cè)圖像,并傳送到所述加法運(yùn)算單元,所述加法運(yùn)算單元將所述預(yù)測(cè)圖像與進(jìn)行所述擴(kuò)展后的差分圖像相加,生成圖像并輸出,同時(shí)存儲(chǔ)在所述幀存儲(chǔ)器中。
15.如權(quán)利要求14所述的數(shù)字圖像解碼裝置,其特征在于,N個(gè)變換后坐標(biāo)點(diǎn)的預(yù)測(cè)值是規(guī)定的N個(gè)坐標(biāo)點(diǎn)。
16.如權(quán)利要求14所述的數(shù)字圖像解碼裝置,其特征在于,N個(gè)變換后坐標(biāo)點(diǎn)的預(yù)測(cè)值是前幀的N個(gè)變換后坐標(biāo)點(diǎn)。
17.一種數(shù)字圖像編碼裝置,包括變換參數(shù)推定單元、預(yù)測(cè)圖像生成單元、第1加法運(yùn)算單元、差分圖像壓縮單元、差分圖像擴(kuò)展單元、第2加法運(yùn)算單元、幀存儲(chǔ)器和傳送單元,輸入數(shù)字圖像,用所述變換參數(shù)推定單元從存儲(chǔ)在所述幀存儲(chǔ)器中的圖像和所述數(shù)字圖像推定變換參數(shù),將所述推定得到的變換參數(shù)和存儲(chǔ)在所述幀存儲(chǔ)器中的圖像輸入到所述預(yù)測(cè)圖像生成單元,根據(jù)所述推定得到的變換參數(shù)生成預(yù)測(cè)圖像,在所述第1加法運(yùn)算單元求得所述數(shù)字圖像和所述預(yù)測(cè)圖像的差分,用所述差分圖像壓縮單元壓縮成壓縮差分?jǐn)?shù)據(jù),送到所述傳送單元,同時(shí),所述差分圖像擴(kuò)展單元將所述壓縮差分?jǐn)?shù)據(jù)擴(kuò)展成擴(kuò)展差分?jǐn)?shù)據(jù),在所述第2加法運(yùn)算單元與所述預(yù)測(cè)圖像相加后,存儲(chǔ)在所述幀存儲(chǔ)器中,其特征在于,將N個(gè)象素的坐標(biāo)點(diǎn)和由所述變換參數(shù)變換所述N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)送到所述傳送單元,與所述壓縮差分?jǐn)?shù)據(jù)一起傳送。
18.如權(quán)利要求17所述的數(shù)字圖像編碼裝置,其特征在于,不是將所述N個(gè)變換后坐標(biāo)點(diǎn),而是將所述N個(gè)變換后坐標(biāo)點(diǎn)與所述N個(gè)象素的坐標(biāo)點(diǎn)之間的差分送到所述傳送單元,與所述壓縮差分?jǐn)?shù)據(jù)一起傳送。
19.一種數(shù)字圖像編碼裝置,包括變換參數(shù)推定單元、預(yù)測(cè)圖像生成單元、第1加法運(yùn)算單元、差分圖像壓縮單元、差分圖像擴(kuò)展單元、第2加法運(yùn)算單元、幀存儲(chǔ)器和傳送單元,輸入數(shù)字圖像,用所述變換參數(shù)推定單元從存儲(chǔ)在所述幀存儲(chǔ)器中的圖像和所述數(shù)字圖像推定變換參數(shù),將所述推定得到的變換參數(shù)和存儲(chǔ)在所述幀存儲(chǔ)器中的圖像輸入到所述預(yù)測(cè)圖像生成單元,根據(jù)所述推定得到的變換參數(shù)生成預(yù)測(cè)圖像,在所述第1加法運(yùn)算單元求得所述數(shù)字圖像和所述預(yù)測(cè)圖像的差分,用所述差分圖像壓縮單元壓縮成壓縮差分?jǐn)?shù)據(jù),送到所述傳送單元,同時(shí)所述差分圖像擴(kuò)展單元將所述壓縮差分?jǐn)?shù)據(jù)擴(kuò)展成擴(kuò)展差分?jǐn)?shù)據(jù),在所述第2加法運(yùn)算單元與所述預(yù)測(cè)圖像相加后,存儲(chǔ)在所述幀存儲(chǔ)器中,其特征在于,從所述變換參數(shù)推定單元將由所述變換參數(shù)變換規(guī)定的N個(gè)象素的坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)送到所述傳送單元,與所述壓縮差分?jǐn)?shù)據(jù)一起傳送。
20.如權(quán)利要求19所述的數(shù)字圖像編碼裝置,其特征在于,不是將所述N個(gè)變換后坐標(biāo)點(diǎn),而是將所述N個(gè)變換后坐標(biāo)點(diǎn)與所述規(guī)定的N個(gè)象素的坐標(biāo)點(diǎn)之間的差分送到所述傳送單元,與所述壓縮差分?jǐn)?shù)據(jù)一起傳送。
21.如權(quán)利要求19所述的數(shù)字圖像編碼裝置,其特征在于,不是將所述N個(gè)變換后坐標(biāo)點(diǎn),而是將所述N個(gè)變換后坐標(biāo)點(diǎn)與過(guò)去的幀的N個(gè)變換后坐標(biāo)點(diǎn)之間差分送到所述傳送單元,與所述壓縮差分?jǐn)?shù)據(jù)一起傳送。
22.一種數(shù)字圖像解碼裝置,其特征在于,包括可變長(zhǎng)度解碼單元、差分圖像擴(kuò)展單元、加法運(yùn)算單元、變換參數(shù)生成單元、預(yù)測(cè)圖像生成單元和幀存儲(chǔ)器,將數(shù)據(jù)輸入到所述可變長(zhǎng)度解碼單元中,從所述數(shù)據(jù)分出差分圖像數(shù)據(jù)并傳送到所述差分圖像擴(kuò)展單元中的同時(shí)將坐標(biāo)數(shù)據(jù)的個(gè)數(shù)和所述坐標(biāo)數(shù)據(jù)輸入到所述變換參數(shù)生成單元,用所述差分圖像擴(kuò)展單元將所述差分圖像擴(kuò)展后,傳送到所述加法運(yùn)算單元,在所述變換參數(shù)生成單元根據(jù)變換參數(shù)的個(gè)數(shù)切換變換參數(shù)生成方法,從所述坐標(biāo)數(shù)據(jù)生成變換參數(shù),并傳送到所述預(yù)測(cè)圖像生成單元,所述預(yù)測(cè)圖像生成單元從所述變換參數(shù)和由所述幀存儲(chǔ)器輸入的圖像生成預(yù)測(cè)圖像,并傳送到所述加法運(yùn)算單元,所述加法運(yùn)算單元將所述預(yù)測(cè)圖像與進(jìn)行所述擴(kuò)展后的差分圖像相加上,生成圖像并在輸出,同時(shí)存儲(chǔ)在所述幀存儲(chǔ)器中。
23.如權(quán)利要求22所述的數(shù)字圖像解碼裝置,其特征在于,所述坐標(biāo)數(shù)據(jù)是N個(gè)象素的坐標(biāo)點(diǎn)和由規(guī)定的線性多項(xiàng)式變換所述N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)。
24.如權(quán)利要求22所述的數(shù)字圖像解碼裝置,其特征在于,所述坐標(biāo)數(shù)據(jù)是N個(gè)象素的坐標(biāo)點(diǎn)和由規(guī)定的線性多項(xiàng)式變換所述N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)與所述N個(gè)象素的坐標(biāo)點(diǎn)之間的差分。
25.如權(quán)利要求22所述的數(shù)字圖像解碼裝置,其特征在于,所述坐標(biāo)數(shù)據(jù)是N個(gè)象素的坐標(biāo)點(diǎn)與過(guò)去的幀的N個(gè)圖像的坐標(biāo)點(diǎn)之間的差分和由規(guī)定的線性多項(xiàng)式變換所述N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)與過(guò)去的幀的N個(gè)變換后坐標(biāo)點(diǎn)之間的差分。
26.如權(quán)利要求22所述的數(shù)字圖像解碼裝置,其特征在于,所述坐標(biāo)數(shù)據(jù)是由規(guī)定的線性多項(xiàng)式變換規(guī)定的N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)。
27.如權(quán)利要求22所述的數(shù)字圖像解碼裝置,其特征在于,所述坐標(biāo)數(shù)據(jù)是由規(guī)定的線性多項(xiàng)式變換規(guī)定的N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)與所述規(guī)定的N個(gè)坐標(biāo)點(diǎn)之間的差分。
28.如權(quán)利要求22所述的數(shù)字圖像解碼裝置,其特征在于,所述坐標(biāo)數(shù)據(jù)是由規(guī)定的線性多項(xiàng)式變換規(guī)定的N個(gè)坐標(biāo)點(diǎn)后的N個(gè)變換后坐標(biāo)點(diǎn)與過(guò)去的幀的N個(gè)變換后坐標(biāo)點(diǎn)之間的差分。
29.一種數(shù)字圖像編碼裝置,包括變換參數(shù)推定單元、預(yù)測(cè)圖像生成單元、第1加法運(yùn)算單元、差分圖像壓縮單元、差分圖像擴(kuò)展單元、第2加法運(yùn)算單元、幀存儲(chǔ)器和傳送單元,輸入數(shù)字圖像,用所述變換參數(shù)推定單元從存儲(chǔ)在所述幀存儲(chǔ)器中的圖像和所述數(shù)字圖像推定變換參數(shù),將所述推定得到的變換參數(shù)和存儲(chǔ)在所述幀存儲(chǔ)器中的圖像輸入到所述預(yù)測(cè)圖像生成單元,根據(jù)所述推定得到的變換參數(shù)生成預(yù)測(cè)圖像,在所述第1加法運(yùn)算單元求得所述數(shù)字圖像和所述預(yù)測(cè)圖像的差分,用所述差分圖像壓縮單元壓縮成壓縮差分?jǐn)?shù)據(jù),送到所述傳送單元,同時(shí)所述差分圖像擴(kuò)展單元將所述壓縮差分?jǐn)?shù)據(jù)擴(kuò)展成擴(kuò)展差分?jǐn)?shù)據(jù),在所述第2加法運(yùn)算單元與所述預(yù)測(cè)圖像相加后,存儲(chǔ)在所述幀存儲(chǔ)器中,其特征在于,在所述變換參數(shù)推定單元以圖像尺寸使所述變換參數(shù)倍增后,進(jìn)行量化,加以編碼并送到所述傳送單元,與所述壓縮差分?jǐn)?shù)據(jù)一起傳送。
30.一種數(shù)字圖像編碼裝置,包括變換參數(shù)推定單元、預(yù)測(cè)圖像生成單元、第1加法運(yùn)算單元、差分圖像壓縮單元、差分圖像擴(kuò)展單元、第2加法運(yùn)算單元、幀存儲(chǔ)器和傳送單元,輸入數(shù)字圖像,用所述變換參數(shù)推定單元從存儲(chǔ)在所述幀存儲(chǔ)器中的圖像和所述數(shù)字圖像推定變換參數(shù),將所述推定得到的變換參數(shù)和存儲(chǔ)在所述幀存儲(chǔ)器中的圖像輸入到所述預(yù)測(cè)圖像生成單元,根據(jù)所述推定得到的變換參數(shù)生成預(yù)測(cè)圖像,在所述第1加法運(yùn)算單元求得所述數(shù)字圖像和所述預(yù)測(cè)圖像的差分,用所述差分圖像壓縮單元壓縮成壓縮差分?jǐn)?shù)據(jù),送到所述傳送單元,同時(shí)所述差分圖像擴(kuò)展單元將所述壓縮差分?jǐn)?shù)據(jù)擴(kuò)展成擴(kuò)展差分?jǐn)?shù)據(jù),在所述第2加法運(yùn)算單元與所述預(yù)測(cè)圖像相加后,存儲(chǔ)在所述幀存儲(chǔ)器中,其特征在于,在所述變換參數(shù)推定單元求得所述變換參數(shù)的最大值的指數(shù)部分,用所述指數(shù)部分對(duì)所述變換參數(shù)進(jìn)行歸一化,將所述指數(shù)部分和所述歸一化后的變換參數(shù)送到所述傳送單元中,與所述壓縮差分?jǐn)?shù)據(jù)一起傳送。
31.一種數(shù)字圖像解碼裝置,其特征在于,包括可變長(zhǎng)度解碼單元、差分圖像擴(kuò)展單元、加法運(yùn)算單元、變換參數(shù)擴(kuò)展單元、預(yù)測(cè)圖像生成單元和幀存儲(chǔ)器,將數(shù)據(jù)輸入到所述可變長(zhǎng)度解碼單元中,從所述數(shù)據(jù)分出差分圖像數(shù)據(jù)并傳送到所述差分圖像擴(kuò)展單元,同時(shí),將壓縮變換參數(shù)輸入到所述變換參數(shù)擴(kuò)展單元,用所述差分圖像擴(kuò)展單元將所述差分圖像數(shù)據(jù)擴(kuò)展后,傳送到加法運(yùn)算單元,在所述變換參數(shù)擴(kuò)展單元除以圖像尺寸倍增的所述壓縮變換參數(shù)除以圖尺寸,擴(kuò)展為變換參數(shù),并傳送到所述預(yù)測(cè)圖像生成單元,所述預(yù)測(cè)圖像生成單元從所述變換參數(shù)和從所述幀存儲(chǔ)器輸入的圖像生成預(yù)測(cè)圖像,并傳送到所述加法運(yùn)算單元,所述加法運(yùn)算單元將所述預(yù)測(cè)圖像與進(jìn)行所述擴(kuò)展后的差分圖像相加,生成圖像并輸出同時(shí)存儲(chǔ)在所述幀存儲(chǔ)器中。
32.一種數(shù)字圖像解碼裝置,其特征在于,包括可變長(zhǎng)度解碼單元、差分圖像擴(kuò)展單元、加法運(yùn)算單元、變換參數(shù)擴(kuò)展單元、預(yù)測(cè)圖像生成單元和幀存儲(chǔ)器,將數(shù)據(jù)輸入到所述可變長(zhǎng)度解碼單元中,從所述數(shù)據(jù)分出差分圖像數(shù)據(jù)并傳送到所述差分圖像擴(kuò)展單元,同時(shí),將壓縮變換參數(shù)輸入到所述變換參數(shù)擴(kuò)展單元,用所述差分圖像擴(kuò)展單元將所述差分圖像數(shù)據(jù)擴(kuò)展后,傳送到加法運(yùn)算單元,在所述變換參數(shù)擴(kuò)展單元進(jìn)行所述被歸一化的變換參數(shù)除以所述指數(shù)部分,擴(kuò)展為變換參數(shù),并傳送到所述預(yù)測(cè)圖像生成單元,所述預(yù)測(cè)圖像生成單元從所述變換參數(shù)和從所述幀存儲(chǔ)器輸入的圖像生成預(yù)測(cè)圖像,并傳送到所述加法運(yùn)算單元,所述加法運(yùn)算單元將所述預(yù)測(cè)圖像與進(jìn)行所述擴(kuò)展后的差分圖像相加,生成圖像并輸出,同時(shí)存儲(chǔ)在所述幀存儲(chǔ)器中。
全文摘要
本發(fā)明揭示一種數(shù)字圖像編碼解碼方法及使用它的數(shù)字圖像編碼解碼裝置,包括:對(duì)輸入圖像進(jìn)行編碼并進(jìn)行數(shù)據(jù)壓縮的圖像壓縮手段對(duì)將該圖像壓縮手段壓縮后的圖像解碼而得的圖像進(jìn)行坐標(biāo)變換,并輸出因進(jìn)行該坐標(biāo)變換而產(chǎn)生的坐標(biāo)數(shù)據(jù)的坐標(biāo)變換手段;從這種坐標(biāo)變換手段的坐標(biāo)數(shù)據(jù)生成變換參數(shù)的變換參數(shù)生成手段;用由這種變換參數(shù)生成手段生成的變換參數(shù),從輸入圖像生成預(yù)測(cè)圖像的預(yù)測(cè)圖像生成手段;傳送壓縮圖像和坐標(biāo)數(shù)據(jù)的傳送手段。本發(fā)明提供在仿射變換那樣其參數(shù)具有不是整數(shù)的多位數(shù)的場(chǎng)合,能用較少的數(shù)據(jù)傳送量實(shí)現(xiàn)正確變換的數(shù)字圖像數(shù)據(jù)編碼、解碼裝置。
文檔編號(hào)H04N7/26GK1209933SQ97191777
公開(kāi)日1999年3月3日 申請(qǐng)日期1997年1月21日 優(yōu)先權(quán)日1996年1月22日
發(fā)明者C·S·布恩 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社