專利名稱:著重區(qū)編碼方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在靜態(tài)圖像編碼方案中著重區(qū)(ROI)編碼的方法和系統(tǒng)。該方法和系統(tǒng)特別適用于JPEG2000標(biāo)準(zhǔn)及其他基于小波的編碼器(如在MPEG4中)用以壓縮靜態(tài)圖像。
在JPEG2000中,轉(zhuǎn)換的圖像被按位面方式編碼。這意味著,有關(guān)高轉(zhuǎn)換系數(shù)的信息將比其余的信息較早地置于比特流中。目前,用于ROI編碼的“基于比例縮放的編碼方式”就是以此事實為基礎(chǔ)的。對應(yīng)于ROI的系數(shù)在算術(shù)編碼之前被向上移位。這意味著與其不移位的情況相比,關(guān)于這些系數(shù)的信息將在比特流中更早地發(fā)送出去。在傳輸?shù)脑缙?,ROI將以比背景(BG)更好的質(zhì)量重構(gòu)。整個操作在分辨率和質(zhì)量上都有改進(jìn)。
而且,E.Atsumi和N.Farvardin發(fā)表的“基于在層次樹中設(shè)立分區(qū)的有損/無損著重區(qū)編碼”,見于1998年10月4日至7日在美國伊利諾伊州芝加哥舉辦的有關(guān)圖像處理的IEEE國際會議記錄(ICIP-98),描述了基于比例縮放的編碼方法的總體思想。另外,ROI編碼是在1996年10月8目美國專利5,563,960中公開的,盡管該文中所述的ROI編碼方法僅執(zhí)行對圖像數(shù)據(jù)的比例縮放而非對其系數(shù)的比例縮放。
使用上述方法對圖像以不同比特率編碼時,編碼器需要有關(guān)于圖象的哪部分應(yīng)該以何比特率編碼的信息。鑒于ROI或許容易在空間域內(nèi)描述,它在轉(zhuǎn)換域內(nèi)將更復(fù)雜。至此編碼器和解碼器必須獲得有關(guān)ROI形狀的信息,因此在表示紋理信息的比特之外還需要額外的比特。另外,需要形狀編碼器(在發(fā)射機中)和形狀解碼器(在接收機中),令整個系統(tǒng)實現(xiàn)起來更加復(fù)雜和昂貴。該解碼器還不得不產(chǎn)生ROI掩碼,即它不得不定義哪些是重建ROI所需的系數(shù),參閱Charilaos Christopoulos(編者)于1998年10月5日出版的ISO/IECJTC1/SC29/WG1 N988 JPEG2000驗證模型2.0/2.1版,并且這增加了接收器的計算復(fù)雜性和存儲要求,而接收器本應(yīng)該盡可能地簡單。
目前解決這些問題所用的方法是將對ROI的描述包含在比特流的空間域中。于是在編碼器和解碼器兩者中產(chǎn)生轉(zhuǎn)換域必需的ROI系數(shù)的掩碼(ROI掩碼),參閱例如Charilaos Christopoulos(編者)于1998年10月5日出版的ISO/IEC JTC1/SC29/WG1 N988 JPEG2000驗證模型2.0/2.1版。該編碼器將形狀信息編碼并且攜帶形狀信息的編碼比特流被加至總比特流中,且被發(fā)送到接收機。該接收機從形狀信息中解碼得到形狀,產(chǎn)生ROI掩碼然后將圖像的紋理信息解碼。
在ROI形狀簡單(如矩形或圓)的情況下,形狀信息不需要很多比特。然而,既使在這些簡單情況下,接收機也不得不產(chǎn)生ROI掩碼,這意味著接收機需要具有與整個圖像(僅1比特/象素)一樣大的存儲空間,并且具有相當(dāng)?shù)挠嬎銖?fù)雜性(因為生成掩碼類似于作小波變換)。對于復(fù)雜的ROI,這意味著在編碼器和解碼器之間需要傳遞很多信息,且計算復(fù)雜性成為一個問題。關(guān)于形狀信息的附加的開銷是值得注意的,尤其是對于低比特率。
而且,共同未決的瑞典專利申請9703690-9和9800088-8描述了一種方法,其中編碼器和解碼器兩者都需要使用和定義ROI掩碼,即,需要找出哪些系數(shù)屬于該ROI或是該ROI所必需的。概要本發(fā)明的一個目的是提供一種方法和系統(tǒng),從而無須在ROI編碼方案中發(fā)送形狀信息。
通過以下方法和系統(tǒng)來達(dá)到所述目的,在所述方法和系統(tǒng)中ROI系數(shù)被這樣編碼使得它們被最先發(fā)送出去并且能被接收機解碼而無須發(fā)送ROI的邊界。
在最佳實施例中,屬于ROI的系數(shù)被移位,使得最小的ROI系數(shù)比最大的背景系數(shù)還大。接收機則可執(zhí)行相反程序并由此得到ROI。
通過指定該系數(shù)需要被移位多少以避免發(fā)送形狀信息,可以獲得幾點好處。由此,就可能避免發(fā)送形狀信息和避免在編碼器側(cè)進(jìn)行形狀編碼。而且,在接收機側(cè)不需要形狀解碼器,也不需要接收機產(chǎn)生ROI掩碼。
而且在另一最佳實施例中,還避免了在編碼器和解碼器端所需的移位(或比例縮放操作)。
圖2是說明在依照第二實施例的編碼器中執(zhí)行的步驟的流程圖。
圖3是說明在依照第三實施例的編碼器中執(zhí)行的步驟的流程圖。
圖4是說明在依照第一和第二實施例的解碼器中執(zhí)行的步驟的流程圖。
圖5是說明在依照第三實施例的解碼器中執(zhí)行的步驟的流程圖。
圖6是說明在依照第四實施例的編碼器中執(zhí)行的步驟的流程圖。
圖7是說明在依照第四實施例的解碼器中執(zhí)行的步驟的流程圖。
圖8是所用的比特流語法的圖表說明。
圖9是另一可選的比特流語法的圖表說明。
詳細(xì)描述
圖1中示出說明依照第一實施例的編碼器中執(zhí)行的步驟的流程圖。由此,首先在步驟101收到輸入圖像且指定其著重區(qū)(ROI)。接著,在步驟103,接收到ROI和背景(BG)所要求的比特率或質(zhì)量。因此在步驟105,圖像被轉(zhuǎn)換到小波域。接著在步驟107,例如采用在Charilaos Christopoulos(編者)于1998年10月5日出版的ISO/IECJTC1/SC29/WG1 N988 JPEG2000驗證模型2.0/2.1版中所描述的方法,計算ROI掩碼。
因此在步驟109,得到在BG(背景)或整個圖像中最大小波系數(shù)(MAX-Coeff)。在步驟111中ROI掩碼中所有系數(shù)被移位如此之多以致ROI掩碼中最小系數(shù)大于MAX-Coeff。然后在步驟113,圖像被熵編碼直到獲得在步驟103指定的ROI質(zhì)量或比特率和BG質(zhì)量或比特率。
接著,在步驟115,移位值被加進(jìn)比特流以便解碼器能發(fā)現(xiàn)并讀取它。這對于解碼器是需要的,因為解碼器需要知道系數(shù)應(yīng)向下移位多少。隨后,在步驟117,加上對ROI掩碼中的系數(shù)編碼所需的字節(jié)數(shù)。在步驟119,步驟117的結(jié)果被用作編碼器的輸出。
如果這樣選擇移位值,使得ROI掩碼中最小系數(shù)大于BG中的最大系數(shù),則在編碼中僅將ROI系數(shù)編碼,直到BG系數(shù)變得不容忽視。在該階段,所有ROI系數(shù)已被編碼并且必須在接收機中向下移位,而剩余的系數(shù)對應(yīng)于BG并且無須向下移位。接收機需要知道對應(yīng)于ROI系數(shù)全編碼(即在第一個BG系數(shù)開始被編碼的時刻)的字節(jié)(或比特)數(shù)。這個信息被放入比特流信頭中并由接收機提取。
作為例子,假設(shè)ROI系數(shù)被向左移位8次(即每個ROI系數(shù)乘上28),這樣所有ROI系數(shù)則變得大于最大的BG系數(shù)。然后編碼開始并且當(dāng)所有ROI系數(shù)都被編碼后,ROI系數(shù)所需的移位值和字節(jié)數(shù)(Nbytes-ROI)被放入比特流信頭。編碼又象平常一樣繼續(xù)。解碼器收到比特流并開始解碼。當(dāng)解碼器解碼到少于Nbytes-ROI的一定字節(jié)數(shù)時,它把每個系數(shù)向下移位。
應(yīng)該注意的是,有一些重建的BG系數(shù)為零,因為他們在此階段未被編碼,并且既然解碼器對此一無所知,他們將被向下移位。直到接收的字節(jié)數(shù)等于Nbytes-ROI時,所有系數(shù)在接收機中被向下移位。此階段之后,沒有系數(shù)被向下移位。此處應(yīng)注意,ROI系數(shù)從他們?yōu)榱憔幋a時起不再被更新。
使用這個方法,解碼器不需要任何形狀信息。解碼器不需要知道哪些系數(shù)對應(yīng)于一個ROI,因為它將把所有系數(shù)向下移位,即BG系數(shù)將為零直至所有ROI系數(shù)被編碼。解碼器無須產(chǎn)生任何ROI掩碼,使編碼方案更加簡單。解碼器要做的唯一事情是將接收的ROI系數(shù)向下移位。
圖2中示出說明編碼器的第二實施例中執(zhí)行的步驟的流程圖。圖2中流程圖與圖1中流程圖幾乎完全一樣,除了在步驟109和111中如步驟209和211所示,得到最大量化系數(shù)并將其移位。
使用依照第二實施例的方法和編碼器,存儲移位后的系數(shù)所需的存儲空間更少,因為量化系數(shù)小于初始系數(shù)。
圖3中示出說明編碼器的第三實施例中執(zhí)行的步驟的流程圖。圖3中流程圖不同于圖1和圖2的流程圖,其中對ROI掩碼中系數(shù)編碼所需的字節(jié)數(shù)不存儲在比特流中。因而,圖3中流程圖不包括相當(dāng)于步驟117和217的步驟317。即使該字節(jié)數(shù)被存儲,也不會在解碼器中用到。因而,第三實施例與第一和第二實施例類似,但需要存儲在比特流中的信息更少。
下面將說明對應(yīng)于以上結(jié)合圖1-3所描述的不同編碼方案的解碼器操作。由此,圖4中示出說明依照第一和第二實施例的解碼器中執(zhí)行的步驟。
首先,在步驟401,收到比特流的信頭,該信頭是按照結(jié)合圖1和圖2在上文描述的算法被編碼的。獲得了關(guān)于所用移位值的信息和對應(yīng)于ROI系數(shù)(即那些被移位的)的字節(jié)數(shù)(ROI-bytes)。接著,在步驟403,收到比特流中的其余部分。在步驟405,如果收到的字節(jié)數(shù)小于ROI-bytes,在對系數(shù)進(jìn)行熵解碼后,他們被按移位值向下移位。應(yīng)注意,直到這個階段BG系數(shù)都是被編碼至零,所以向下移位不影響他們。通過逆小波變換可獲得中間重建的圖像。
接著,在步驟407,評估收到的字節(jié)數(shù)是否小于ROI-bytes,如果是,則返回步驟403;否則繼續(xù)進(jìn)行到步驟409。在步驟409,收到比特流的剩余部分。現(xiàn)在這對應(yīng)于BG數(shù)據(jù),因而從該階段起,不再將系數(shù)向下移位。最后,在步驟411,逆小波變換給出重建的圖像。
應(yīng)注意,對于解碼器并不真正需要知道字節(jié)數(shù)。這是因為解碼器可以按比例縮小以上所有系數(shù),其中移位值shitf-value是上述所用的移位值。
圖5中示出說明被安排來將比特流解碼的解碼器中執(zhí)行的步驟的流程圖,該比特流是按照結(jié)合圖3的上述第三實施例編碼的。
由此,首先在步驟501,收到該編碼的比特流。獲得有關(guān)所用移位值的信息。接著,在步驟503,評估收到的系數(shù)是否大于2(移位值),如果是,則在步驟504按該移位值向下移位該系數(shù);否則程序繼續(xù)進(jìn)行至505。在步驟505,確定不向下移位該系數(shù)。最后,在步驟507,對從步驟504和505的輸出值作逆小波變換,給出重建的圖像。
應(yīng)注意,在浮點小波中或許會出現(xiàn)一些問題,其中一些系數(shù)可能在0和1之間,因而他們在編碼器中移位后永遠(yuǎn)不會變得大于2(移位值)。這意味著它們在解碼器從未被向下移位。為避免此類問題,可以采用依照第二實施例的編碼器,其中量化系數(shù)被移位,因為量化系數(shù)都是整數(shù)。
上述方法要求編碼器將系數(shù)向上移位,即把他們乘以一定的系數(shù)。盡管該操作的計算復(fù)雜性小,但另一種替代方法有時更好,它避免發(fā)送形狀信息和將解碼器的計算復(fù)雜性最小化,這也避免了解碼器中的向下移位操作。
圖6中示出說明在提供編碼的比特流而無須向下移位的編碼器中執(zhí)行的步驟的流程圖。
由此,首先在步驟601,收到要被編碼的輸入圖像,其ROI已被指定。在步驟603,收到ROI和BG所要求的比特率或質(zhì)量。接著,在步驟605圖像被轉(zhuǎn)換到小波域并且存儲到第一存儲器(MEM1)。
因此,在步驟607,如上文所述生成ROI掩碼。在步驟609,第一存儲器(MEM1)的內(nèi)容被拷貝到第二存儲器(MEM2)。步驟609僅在BG信息要用在后來的階段上時才需要。然后在步驟611所有ROI掩碼外的MEM1的系數(shù)被置為零。在步驟613,利用 JPEG2000編碼方法將MEM1中小波系數(shù)編碼。
應(yīng)注意,對于所有系數(shù)都作了編碼。然而,既然BG系數(shù)為零,實際上僅對ROI系數(shù)作了編碼(相當(dāng)于零的BG系數(shù)也被編碼,但他們不占用很多比特率)。
MEM1的編碼一直執(zhí)行,直到所要求的比特率(ROI質(zhì)量的ROI率),然后在步驟615,編碼器將切換并從MEM2中的系數(shù)開始編碼。在步驟617,所有ROI掩碼中的系數(shù)則在MEM2中被設(shè)置為零。這意味著BG系數(shù)將被編碼。
最后,在步驟619,執(zhí)行MEM2(其中把ROI掩碼中的系數(shù)設(shè)置為零)的編碼直至獲得為BG指定的比特率或質(zhì)量。
圖7中示出說明被安排來將比特流解碼的解碼器中執(zhí)行的步驟的流程圖,該比特流被按照以上結(jié)合圖6所描述的實施例編碼。
由此,首先在步驟701,接收按照以上結(jié)合圖6所描述的算法編碼的比特流,直到獲得用于MEM1的字節(jié)數(shù)為止。執(zhí)行熵解碼并且獲得MEM1系數(shù)。應(yīng)注意,如果需要的話有可能執(zhí)行一種逆小波變換以產(chǎn)生中間重建圖像。
接著,在步驟703,接收比特流剩余部分直至收到總字節(jié)數(shù)為止。執(zhí)行熵解碼并且獲得MEM2系數(shù)。MEM2系數(shù)被加至MEM1系數(shù)。對于相加后的系數(shù)作逆小波變換產(chǎn)生帶有ROI和BG的重建圖像。
應(yīng)注意,當(dāng)收到對應(yīng)于MEM2系數(shù)的比特時,接收機可以作小波變換以重建僅僅對應(yīng)于MEM2的圖像(即僅有BG)。然后它能將MEM1和MEM2的重建圖像加在一起,代替上述在步驟403和503中將系數(shù)相加。
從編碼器發(fā)出的比特流必須具有關(guān)于在為MEM1圖象編碼處(該處BG被設(shè)置為零)有多少字節(jié)(或比特)的信息。這是因為接收機必須知道它何時開始接收MEM2(該處ROI掩碼中的系數(shù)被設(shè)置為零)。在這種情況下,接收機能將重建的MEM2系數(shù)加至重建的MEM1系數(shù)上。
這種方法避免了在編碼器和解碼器中完全移位系數(shù),避免了發(fā)送形狀信息,避免了使用形狀編碼器和形狀解碼器,還避免了在解碼器中產(chǎn)生ROI掩碼。解碼器必須知道的僅為何時停止接收MEM1系數(shù)并開始接收MEM2系數(shù),所以它能把這些系數(shù)加在一起。
對于實時編碼和發(fā)送(編碼與發(fā)送同時進(jìn)行),接收機可能不知道為ROI編碼而發(fā)送的總字節(jié)數(shù)。在這種情況下,發(fā)射機不得不在ROI編碼已結(jié)束的階段在傳輸過程中發(fā)出一個信號,通知接收機ROI系數(shù)已被編碼,并且此階段后,接收機不應(yīng)再將任何系數(shù)向下移位。這可通過發(fā)送一個不能從算術(shù)編碼器仿真的碼流來實現(xiàn)。
應(yīng)注意,當(dāng)使用依照第三實施例的編碼器時,則在實時應(yīng)用中不會出現(xiàn)問題。這是因為關(guān)于ROI系數(shù)的字節(jié)數(shù)不是真正需要的。需要的是移位值,它總是包含在比特流中。既然解碼器將上述所有系數(shù)向下移位,它完全不需任何信號。因而,依照第三實施例的編碼器與其他方案相比具有優(yōu)勢。
還應(yīng)當(dāng)注意,盡管上述的方法都考慮了存在一個ROI,實際上可能有不止一個。這些方法同樣適用。在這種情況下,可以考慮對于第一個ROI(ROI1),所有系數(shù)均被按前面部分所描述的方法移位。然后對第二個ROI(ROI2),所有系數(shù)以類似方式移位但是用一種方法使得他們大于移位的ROI的系數(shù)。然后以類似方式繼續(xù)這個程序。解碼器借助具有關(guān)于每個ROI的移位值的信息而可以發(fā)現(xiàn)哪些系數(shù)屬于ROI1,哪些屬于ROI2。
還要注意,對于矩形的形狀,如果在每個子帶都發(fā)送了ROI形狀的信息,則可避免在解碼器中產(chǎn)生掩碼。矩形ROI’S具有在每個子帶產(chǎn)生矩形ROI形狀的特性,因此對于每個子帶(例如左上角和右下角)可以發(fā)送ROI形狀的信息。這避免了在解碼器中產(chǎn)生ROI掩碼,然而,這僅適用于矩形的ROI形狀。而上面陳述的方法對任何形狀都有效。
如果按上述方式進(jìn)行編碼,則無須傳送關(guān)于ROI的信息,除了系數(shù)被按其向上移位的移位值和包含已向上移位的信息的比特流的比特數(shù)。
這意味著*無須發(fā)送關(guān)于ROI形狀的信息。這節(jié)省了比特流中很多比特,尤其是對于復(fù)雜的形狀。
*無須在解碼器中產(chǎn)生關(guān)于ROI系數(shù)的掩碼。這節(jié)省了存儲空間和解碼器的計算復(fù)雜性。
*不需要形狀編碼。
*不需要形狀解碼。
*可能從比特流中大致提取ROI形狀信息。
*因為ROI掩碼在較高子帶中擴展了,所以它會開始在較高子帶掩蓋一部分BG,或者甚至全部BG。這意味著BG信息將會與ROI信息一起被編碼。因此,在解碼過程中,接收機在傳輸?shù)脑缙趯⒃偕鷪D像的大部分(尤其是實現(xiàn)了分辨率的提高時)。這避免在早期重建黑色BG的問題。
圖8中給出可能的比特流語法。應(yīng)注意,這可能是整個比特流語法的一部分,其中包含有關(guān)圖像類型等的信息。如果先編碼后發(fā)送,比特流語法應(yīng)包含下列信息ROI編碼方式(ROI-CM),在第一字段801中發(fā)送;移位值(SV),在第二字段803中發(fā)送;用于ROI的字節(jié)數(shù)(Nbytes-ROI)(如需要),在第三字段805中發(fā)送;剩余的信頭信息和比特(參閱Charilaos Christopoulos(編者)于1998年10月5日出版的ISO/IEC JTC1/SC29/WG1 N988 JPEG2000驗證模型2.0/2.1版),在第四字段807發(fā)送。
其中,ROI-CM指定使用所設(shè)定的ROI編碼方法;SV指定ROI系數(shù)被向上移位的值;Nbytes-ROI指定對于ROI系數(shù)編碼所用的總字節(jié)數(shù)(不是對所有上面所指的編碼方案都必需的)。
如果考慮到實時的情況(即編碼和發(fā)送同時進(jìn)行),則比特流可能被更改為圖9所示的語法。
ROI編碼方式(ROI-CM),在第一字段901發(fā)送;移位值(SV),在第二字段903發(fā)送;對應(yīng)于剩余的信頭和系數(shù)的比特,在第三字段905發(fā)送;信號,在第四字段發(fā)送;其中,信號=無法從算術(shù)編碼器中仿真的碼流(不是對所有上面指定的編碼方案都必需的)。
權(quán)利要求
1.一種對具有至少一個著重區(qū)(ROI)的靜止圖像編碼并發(fā)送的方法,其中所述圖像被轉(zhuǎn)換到頻率域,其特征在于對應(yīng)于所述ROI的系數(shù)被這樣編碼、使得他們能最早發(fā)送出去,并且使得為了對所述至少一個ROI進(jìn)行解碼不需要發(fā)送關(guān)于所述至少一個ROI的形狀信息。
2.按照權(quán)利要求1的方法,其特征在于所述轉(zhuǎn)換到頻率域且屬于所述ROI的所述系數(shù)被移位,使得所述最小的ROI系數(shù)變得大于所述剩余系數(shù)中最大系數(shù)。
3.按照權(quán)利要求2的方法,其特征在于所述系數(shù)在被移位之前被量化。
4.按照權(quán)利要求1-3中任何一個的方法,其特征在于所述圖像利用小波變換轉(zhuǎn)換到頻率域。
5.一種用于對靜止圖像編碼的裝置,其包括用于定義至少一個著重區(qū)(ROI)的裝置和用于將所述圖像轉(zhuǎn)換到頻率域的裝置,其特征在于用于將對應(yīng)于所述ROI的系數(shù)編碼,使得他們能最早發(fā)送,并且使得為了對所述至少一個ROI進(jìn)行解碼不需要發(fā)送關(guān)于所述至少一個ROI形狀的信息的裝置。
6.權(quán)利要求5的裝置,其特征在于用于將被轉(zhuǎn)換到所述頻率域且屬于所述ROI的所述系數(shù)移位、使得所述最小的ROI系數(shù)變得大于所述剩余系數(shù)中的最大系數(shù)的裝置。
7.按照權(quán)利要求6的裝置,其特征在于連接到所述移位裝置、用于在移位所述系數(shù)前將其量化的裝置。
8.按照權(quán)利要求5-7中任何一個的裝置,其特征在于利用小波變換將所述圖像轉(zhuǎn)換到所述頻率域的裝置。
9.對靜止圖像編碼的方法,其特征在于下述步驟指定至少一著重區(qū)(ROI),使用小波變換轉(zhuǎn)換所述圖像,產(chǎn)生ROI掩碼,確定所述圖像中最大的小波系數(shù),將所述ROI掩碼中所有所述系數(shù)移位,使得最小的ROI系數(shù)變得大于圖像其余部分的最大系數(shù)。
10.按照權(quán)利要求9的方法,其特征在于當(dāng)確定最大小波系數(shù)時,僅搜索ROI之外的所述系數(shù)。
11.按照權(quán)利要求9或10的方法,其特征在于還包括以下步驟確定用于所述編碼的圖像的比特數(shù),對所述圖像編碼直至獲得所述確定的比特數(shù)。
12.按照權(quán)利要求11的方法,其特征在于所述圖像用熵編碼進(jìn)行編碼。
13.按照權(quán)利要求9-12中任何一個的方法,其特征在于還包括以下步驟在確定所述最大小波系數(shù)之前,量化所述小波變換系數(shù)。
14.從發(fā)射機發(fā)送按照權(quán)利要求9-13中任何一個編碼的圖像至接收機的方法,其特征在于用于將所述小波系數(shù)移位的所述值被加進(jìn)發(fā)送的比特流中。
15.按照權(quán)利要求14的方法,其特征在于用于對所述ROI掩碼中所述系數(shù)編碼的字節(jié)數(shù)被加進(jìn)所述發(fā)送的比特流中。
16.準(zhǔn)備按照權(quán)利要求9-13中任何一個對靜止圖像編碼的編碼器。
17.準(zhǔn)備按照權(quán)利要求9-13中任何一個對靜止圖像解碼的解碼器。
18.一種對靜止圖像編碼的方法,其特征在于包括下述步驟確定至少一個著重區(qū)(ROI),利用小波變換轉(zhuǎn)換所述圖像,將所述轉(zhuǎn)換后的圖像存儲至第一存儲器,產(chǎn)生ROI掩碼,將所述第一存儲器內(nèi)容拷貝到第二存儲器中,將所述ROI掩碼外的所述第一存儲器中所有系數(shù)設(shè)置為零,將所述ROI掩碼內(nèi)的所述第二存儲器中所有系數(shù)設(shè)置為零,以及對所述第一存儲器中所述系數(shù)編碼,并且當(dāng)所述第一存儲器中所有系數(shù)均被編碼后,開始對所述第二存儲器中所述系數(shù)編碼。
19.按照權(quán)利要求18的方法,其特征在于還包括下述步驟確定用于所述編碼的圖像的比特數(shù),對所述圖像編碼直至獲得所述確定的比特數(shù)。
20.準(zhǔn)備按照權(quán)利要求18-19中任何一個對靜止圖像編碼的編碼器。
21.準(zhǔn)備按照權(quán)利要求18-19的任何一個對靜止圖像解碼的解碼器。
全文摘要
在用于對具有至少一個著重區(qū)(ROI)的靜態(tài)圖像編碼和發(fā)送的方法和系統(tǒng)中,對最好利用小波變換轉(zhuǎn)換至頻率域的圖像的ROI系數(shù)進(jìn)行編碼,使得他們能最先發(fā)送并且無須傳輸ROI邊界即可被接收機解碼。在最佳實施例中,屬于ROI的系數(shù)被移位,使得最小ROI系數(shù)大于最大背景系數(shù)。接收機則可執(zhí)行相反的程序并由此獲得ROI。通過指定系數(shù)需要被移位多少以避免發(fā)送形狀信息可獲得幾個好處。由此,可能避免發(fā)送形狀信息和避免在編碼器側(cè)對形狀信息編碼。在接收機側(cè)無需形狀解碼器,也不需要該接收機產(chǎn)生ROI掩碼。而且,在另一最佳實施例中,編碼器和解碼器中所需的移位(或比例縮放操作)也可免除。
文檔編號H04N7/26GK1320337SQ99811479
公開日2001年10月31日 申請日期1999年10月6日 優(yōu)先權(quán)日1998年10月9日
發(fā)明者C·克里斯托普洛斯, J·阿斯克勒夫, M·拉松 申請人:艾利森電話股份有限公司