亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

視頻圖象的高精度編碼和解碼的制作方法

文檔序號(hào):7725269閱讀:197來源:國知局
專利名稱:視頻圖象的高精度編碼和解碼的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及視頻壓縮,尤其,涉及基于MPEG類的編碼和解碼系統(tǒng)的新穎改進(jìn)的提高質(zhì)量的視頻壓縮。
背景MPEG背景MPEG-2和MPEG-4是定義視頻語法的國際視頻壓縮標(biāo)準(zhǔn),所述語法提供一種有效的方法,以多個(gè)壓縮編碼數(shù)據(jù)的形式來表示視頻圖象序列。編碼位的語言是“語法”。例如,幾個(gè)標(biāo)記可以表示整個(gè)取樣塊(例如,MPEG-2的64個(gè)取樣)。兩種MPEG標(biāo)準(zhǔn)還描述解碼(重構(gòu))過程,其中,把編碼位從壓縮表示映射到圖象序列原始格式的近似。例如,在編碼位流中的一個(gè)標(biāo)志給出信號(hào)表示,跟隨在后的一些位是否在用離散余弦變換(DCT)算法進(jìn)行解碼之前是否前面有一個(gè)預(yù)測算法。通過由這些MPEG標(biāo)準(zhǔn)定義的語義學(xué)來調(diào)整包括解碼過程的所述算法。可以把這個(gè)語法應(yīng)用于開發(fā)公共視頻特征,諸如空間冗余、時(shí)間冗余、一致運(yùn)動(dòng)、空間掩模等。事實(shí)上,這些MPEG標(biāo)準(zhǔn)定義編程語言以及數(shù)據(jù)格式。MPEG解碼器必須能夠?qū)斎霐?shù)據(jù)流進(jìn)行分析和解碼,但是只要數(shù)據(jù)流符合相應(yīng)的MPEG語法,就可以使用寬廣范圍的多種可能的數(shù)據(jù)結(jié)構(gòu)以及壓縮技術(shù)。還有可能在另外的語法中攜帶所需要的語義學(xué)。
這些MPEG標(biāo)準(zhǔn)使用多種壓縮方法,包括幀內(nèi)方法以及幀間方法。在大多數(shù)視頻情景中,背景保持相當(dāng)穩(wěn)定而在前景中發(fā)生動(dòng)作。背景可以移動(dòng),但是大量情景是冗余的。這些MPEG標(biāo)準(zhǔn)通過創(chuàng)建被稱為“內(nèi)部”幀或“I幀”的參考幀來開始?jí)嚎s。壓縮I幀而無需參考其它幀,因此包含視頻信息的整個(gè)幀。I幀提供用于隨機(jī)訪問的數(shù)據(jù)位流的進(jìn)入點(diǎn),但是只可以進(jìn)行適度的壓縮。一般,在位流中每12到15幀放置表示I幀的數(shù)據(jù)。此后,由于只有小部分落在參考I幀之間的幀與括號(hào)I幀不同,所以只捕獲、壓縮和存儲(chǔ)圖象差異。對(duì)于這種差異使用兩類幀-預(yù)測幀或P幀以及雙向內(nèi)插幀或B幀。
一般參考過去幀(I幀或以前的P幀)對(duì)P幀進(jìn)行編碼,并且一般使用P幀作為后繼P幀的參考。P幀接收十分高的壓縮量。B幀提供最高的壓縮量,但是需要過去和將來兩種參考幀,以便進(jìn)行編碼。從來不把雙向幀用作為參考幀。
宏模塊是圖象象素的區(qū)域。對(duì)于MPEG-2,宏模塊是四個(gè)8×8DCT(離散余弦變換)模塊組成的16×16象素,以及用于P幀的一個(gè)運(yùn)動(dòng)矢量和用于B幀的一個(gè)或兩個(gè)運(yùn)動(dòng)矢量??梢允褂脙?nèi)部幀編碼或幀間(預(yù)測)編碼對(duì)P幀中的宏模塊進(jìn)行單獨(dú)編碼??梢允褂脙?nèi)部幀編碼、正向預(yù)測編碼、反向預(yù)測編碼、或正向和反向(即,雙向內(nèi)插)兩種預(yù)測編碼對(duì)B幀中的宏模塊進(jìn)行單獨(dú)編碼。
在編碼之后,MPEG數(shù)據(jù)位流包括I、P和B幀的一個(gè)序列。一個(gè)序列可以包括幾乎I、P和B幀的任何模式(在它們的放置上有幾個(gè)次要的語義的限制)。然而,在工業(yè)實(shí)踐中較普通的是具有固定模式(例如,IBBPBBPBBPBBPBB)。
已經(jīng)知道了有一些時(shí)候,當(dāng)通過利用分層運(yùn)動(dòng)搜索來確定運(yùn)動(dòng)矢量時(shí),減少了計(jì)算。例如,MPEG算法試圖尋找“宏模塊”區(qū)域之間的匹配。MPEG型以及其它經(jīng)運(yùn)動(dòng)補(bǔ)償?shù)腄CT(離散余弦變換)編碼器試圖使當(dāng)前幀中的每個(gè)宏模塊區(qū)域與以前幀(P幀)中的一個(gè)位置或以前和后繼幀(B幀)中的一個(gè)位置匹配。然而,不是始終需要尋找優(yōu)良匹配,由于在這種情況下MPEG可以對(duì)新的宏模塊進(jìn)行編碼作為刷新的獨(dú)立(“內(nèi)部”)宏模塊而無需使用以前或后繼幀。在這種運(yùn)動(dòng)補(bǔ)償DCT系統(tǒng)中對(duì)于MPEG-2的每個(gè)宏模塊區(qū)域需要一個(gè)宏模塊運(yùn)動(dòng)矢量。在MPEG-4中,相應(yīng)于每個(gè)8×8區(qū)域有一個(gè)矢量的4個(gè)運(yùn)動(dòng)矢量的一個(gè)組(即,每個(gè)宏模塊4個(gè)矢量)也是一種任選的編碼模式。
MPEG精度參考MPEG-2和MPEG-4視頻編解碼器實(shí)施利用下列編碼方法a)當(dāng)從RGB轉(zhuǎn)換到Y(jié)UV顏色空間時(shí),只保留要編碼的位數(shù)(例如,在編碼中把MPEG-2限制到8位,因此YUV值也限制到8位)。
b)當(dāng)編碼和解碼時(shí),只保存已經(jīng)編碼的位數(shù),小心地施加舍入以減少偽象。
c)當(dāng)轉(zhuǎn)換回RGB時(shí),由于保存位數(shù)的限制(諸如對(duì)于MPEG-2,最多為8位)而限制了精度。


圖1是現(xiàn)有技術(shù)MPEG-2參考視頻編碼方法的方框圖。把按每種顏色8位/象素進(jìn)行編碼的RGB輸入幀102施加于RGB到Y(jié)UV轉(zhuǎn)換器104,它有意地在它的輸出端限制為每種顏色8位的精度。把結(jié)果施加于DCT功能106,然后施加于量化器功能108,然后到反DCT功能110,按相同的精度存儲(chǔ)最終輸出作為輸出數(shù)據(jù)。
用相同方法實(shí)施MPEG-4的參考視頻編碼器,雖然中間精度可以擴(kuò)展到12位(雖然VLC-可變長度編碼-表不支持全范圍的使用)。
利用隨機(jī)地抖動(dòng)受限制的精度值(在MPEG-2中,最大為每種顏色分量8位)的技術(shù)來減少步長改變時(shí)的明顯的可見性。然而,由于這種抖動(dòng),還由于使用了有限的中間處理精度,產(chǎn)生了編碼中的噪聲和偽象。
除了有限的中間處理精度之外,MPEG-2和MPEG-4允許在編碼期間使用的反DCT(IDCT)算法(經(jīng)常以高精度浮點(diǎn)表示來實(shí)施)與解碼期間使用的IDCT算法略有不同。這是眾知的“IDCT”失配。IDCT失配導(dǎo)致信號(hào)離開指定解碼值的不可預(yù)測的逐漸漂移。傳統(tǒng)上通過使用ICDT最高頻率中的低階位(MPEG-2和MPEG-4中使用的8×8DCT模塊尺寸的7次諧波)的隨機(jī)抖動(dòng)而使這種漂移減少。這種抖動(dòng)在信號(hào)上增加附加的噪聲和偽象。
圖2是現(xiàn)有技術(shù)MPEG-2參考視頻解碼方法的方框圖。把經(jīng)編碼的輸入位流202施加于具有與輸入位流的精度(一般對(duì)于MPEG-2為8位)匹配的有限精度的去量化器功能204。把結(jié)果施加于IDCT功能206(它可能和編碼器的IDCT功能110不匹配),它輸出有符號(hào)的8-比特值208。這個(gè)輸出包括I幀210,或與來自先前幀212或后繼幀214(兩者都具有相同的精度)的數(shù)據(jù)組合而產(chǎn)生的新幀216。因此,MPEG-2解碼過程限制了中間處理精度到最大為8位。相似地,還把MPEG-4視頻解碼的中間處理精度限制到在編碼中使用的位數(shù)(最大為12位,但是經(jīng)常設(shè)置成8位)。
在MPEG-2和MPEG-4中的有限精度還限制了動(dòng)態(tài)范圍(即,可以顯示的圖象亮度等級(jí)數(shù))以及對(duì)比度范圍(即,分配給相似對(duì)比度的圖象區(qū)域的不同級(jí)別數(shù))。相應(yīng)地,與原始輸入圖象相比,在MPEG-2和MPEG-4中使用的編碼和解碼方法降低了輸出的、經(jīng)壓縮的圖象的潛在質(zhì)量。本發(fā)明致力于解決這些限制。
概要根據(jù)對(duì)于MPEG類編碼和解碼系統(tǒng)的新穎改進(jìn),本發(fā)明針對(duì)提高質(zhì)量的視頻壓縮。在一個(gè)方面,本發(fā)明提供一種方法,用于通過在中間編碼和解碼處理步驟期間保存較多位數(shù)而顯著地提高來自MPEG型的視頻編碼的圖象質(zhì)量。令人驚訝地,這種質(zhì)量的提高并不導(dǎo)致對(duì)圖象序列進(jìn)行編碼所需要的總位數(shù)成比例地增加。此外,通過使解碼器的IDCT功能數(shù)值算法與編碼器的解碼部分所使用的IDCT功能數(shù)值算法正確地匹配,可以排除IDCT失配的問題。排除IDCT失配允許通過減少所需要的I幀數(shù)來增加壓縮比。
在另一個(gè)方面中,本發(fā)明包括通過擴(kuò)展“量化參數(shù)”或“QP”的范圍而把高精度壓縮施加于寬動(dòng)態(tài)范圍圖象。動(dòng)態(tài)范圍擴(kuò)展把低QP用于暗區(qū)以及把高QP用于亮區(qū)??梢酝ㄟ^直接增加QP的范圍或間接地通過非線性變換(諸如一個(gè)函數(shù)或查找表)來完成QP的擴(kuò)展,所述非線性變換把QP值的小范圍映射到用于除(壓縮)或乘(解壓縮)的輸出QP值的寬廣范圍。
在另一個(gè)方面中,本發(fā)明包括應(yīng)用經(jīng)擴(kuò)展的中間處理精度和經(jīng)擴(kuò)展的QP范圍,以減小圖象的對(duì)比度范圍,以擴(kuò)展對(duì)低對(duì)比度部分進(jìn)行壓縮編碼所具有的精度??梢耘c低對(duì)比度(常常是遠(yuǎn)的)區(qū)域一起利用低QP,而對(duì)于高對(duì)比度(常常是前景)區(qū)域利用高QP。如此,例如,如果攝像機(jī)傳感器具有足夠的比特分辨率,則當(dāng)解壓縮時(shí),完全可以辨別在模糊日子的空中或地上的遠(yuǎn)目標(biāo)。
尤其,在本發(fā)明的一個(gè)方面中包括一種方法,用于對(duì)包括第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列進(jìn)行壓縮,所述方法包括把幀序列變換成第二顏色空間中按比第一精度高的第二精度的顯示,并按第二精度執(zhí)行后繼的編碼步長,以產(chǎn)生經(jīng)壓縮的輸出。
本發(fā)明的另一個(gè)方面是一種方法,用于對(duì)包括第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列進(jìn)行壓縮,所述方法包括把幀序列變換成第二顏色空間中按比第一精度高的第二精度的顯示;按第二精度在幀序列上執(zhí)行運(yùn)動(dòng)補(bǔ)償離散余弦變換,以產(chǎn)生第一編碼輸出;按第二精度對(duì)第一編碼輸出進(jìn)行量化,以產(chǎn)生經(jīng)量化輸出;在經(jīng)量化輸出上按第二精度執(zhí)行反離散余弦變換,以產(chǎn)生按第二精度的經(jīng)壓縮輸出。
在另一個(gè)方面中,本發(fā)明包括一種方法,用于對(duì)包括第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列進(jìn)行壓縮和解壓縮,所述方法包括對(duì)幀序列進(jìn)行編碼,以產(chǎn)生經(jīng)壓縮位流,并按高于第一精度的第二精度在經(jīng)壓縮位流上執(zhí)行解碼步長。
本發(fā)明的另一個(gè)方面是一種方法,用于對(duì)包括第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列進(jìn)行壓縮和解壓縮,所述方法包括把幀序列變換成第二顏色空間中按比第一精度高的第二精度的表示;按第二精度執(zhí)行后繼的編碼步長,以產(chǎn)生經(jīng)壓縮位流;以及通過對(duì)經(jīng)壓縮位流按第二精度進(jìn)行去量化而對(duì)經(jīng)壓縮位流進(jìn)行解碼,以產(chǎn)生經(jīng)去量化的輸出,在經(jīng)去量化輸出上按第二精度施加反離散余弦變換,以產(chǎn)生經(jīng)解壓縮輸出,以及按第二精度從經(jīng)解壓縮輸出產(chǎn)生圖象幀。
本發(fā)明的再另一個(gè)方面是一種方法,用于對(duì)包括第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列進(jìn)行壓縮和解壓縮,所述方法包括把幀序列變換成第二顏色空間中按比第一精度高的第二精度的表示;按第二精度執(zhí)行后繼的編碼步長以產(chǎn)生經(jīng)壓縮位流包括施加反離散余弦變換數(shù)值算法;按第二精度在經(jīng)壓縮位流上執(zhí)行后繼的解碼步長包括施加匹配的反離散余弦變換數(shù)值算法。
本發(fā)明的另一個(gè)方面是一種方法,用于在把包括幀序列的數(shù)字化視頻圖象序列壓縮成包括I幀的經(jīng)壓縮位流期間增加平均壓縮比,所述方法包括通過施加與后繼的解碼過程期間施加的反離散余弦變換數(shù)值算法匹配的反離散余弦變換數(shù)值算法對(duì)幀序列進(jìn)行編碼,從而產(chǎn)生在I幀之間具有增加空間的經(jīng)壓縮位流。
本發(fā)明的另一個(gè)方面是一種方法,用于對(duì)具有寬動(dòng)態(tài)范圍或?qū)拰?duì)比度范圍中至少一種范圍的數(shù)字化視頻圖象序列進(jìn)行壓縮,視頻圖象包括按第一精度表示的幀,每個(gè)幀包括多個(gè)定義區(qū)域的宏模塊,所述方法包括確定量化參數(shù),QP,所述量化參數(shù)具有表示可能值的直接對(duì)應(yīng)或表示可能值的擴(kuò)展范圍的代碼;確定每個(gè)幀的每個(gè)宏模塊的QP值;按比第一精度高的第二精度對(duì)每個(gè)幀進(jìn)行壓縮以產(chǎn)生經(jīng)壓縮的幀,這種壓縮包括施加這種幀的確定的QP值以減少對(duì)這種幀進(jìn)行編碼所需要的位數(shù);使QP代碼與壓縮期間使用的確定QP值相關(guān)聯(lián);以及輸出每個(gè)經(jīng)壓縮幀以及相關(guān)聯(lián)的QP代碼。
本發(fā)明包括相應(yīng)的計(jì)算機(jī)程序?qū)嵤┮约霸O(shè)備實(shí)施。
在下面的附圖和說明書中陳述本發(fā)明的一個(gè)或多個(gè)實(shí)施例的詳細(xì)說明。從說明書和附圖以及從權(quán)利要求書。本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將變得明白。
附圖的說明圖1是現(xiàn)有技術(shù)MPEG-2參考視頻編碼方法的方框圖;圖2是現(xiàn)有技術(shù)MPEG-2參考視頻解碼方法的方框圖;圖3是根據(jù)本發(fā)明的MPEG類編碼方法的方框圖;
圖4是根據(jù)本發(fā)明的MPEG類解碼方法的方框圖;圖5是概括在圖象壓縮期間擴(kuò)展動(dòng)態(tài)范圍和/或?qū)Ρ榷鹊妮^佳方法的流程圖。
在各附圖中的相同參考符號(hào)表示相同元件。
較高精度中間圖象處理設(shè)計(jì)MPEG-2和MPEG-4中的有限精度假設(shè)和技術(shù),以使存儲(chǔ)I、B和P幀需要的存儲(chǔ)器的量最少。然而,幀存儲(chǔ)器是當(dāng)前十分買得起的。本發(fā)明部分地基于一個(gè)發(fā)現(xiàn),即,通過保存中間編碼和解碼處理步驟期間的較多數(shù)目的位數(shù),可以從MPEG風(fēng)格的視頻編碼得到顯著提高的圖象質(zhì)量。令人驚訝地,這種質(zhì)量的提高并不導(dǎo)致對(duì)圖象序列進(jìn)行解碼所需要的總位數(shù)成比例地增加。事實(shí)上,使用本發(fā)明通常使位數(shù)減少。
圖3是根據(jù)本發(fā)明的MPEG類編碼方法的方框圖。把RGB輸入幀302施加于RGB到Y(jié)UV轉(zhuǎn)換器304。因?yàn)檎{(diào)制解調(diào)器幀產(chǎn)生裝置(例如,視頻攝像機(jī)和高分辨率膠片掃描器)可以輸出較大的顏色范圍(例如,每種顏色10位/象素)的圖象,這種裝置作為輸入源是較佳的。然而,輸入源可以是傳統(tǒng)的MPEG-2或MPEG-4的8-位裝置。把結(jié)果施加于DCT功能306,它保存比原始輸入信號(hào)中存在的精度位數(shù)更多的精度位數(shù)(例如,16位)。把DCT功能306的輸出施加于量化器功能308,然后到IDCT功能310,它再保存比原始輸入信號(hào)中存在的精度位數(shù)(諸如16位,對(duì)于P和B幀是有符號(hào)的,對(duì)于I幀是無符號(hào)的,16位是數(shù)字硬件和軟件系統(tǒng)的方便表示)更多的精度位數(shù)(例如,16位)。一般,最終輸出信號(hào)312是YUV信號(hào)按相同精度存儲(chǔ)作為中間處理精度。在輸出中的這種增加精度的重要特征在于它允許改進(jìn)后繼的P和B幀的預(yù)測。
在MPEG-2和MPEG-4視頻編碼中體現(xiàn)的IDCT失配的概念是基于一種假設(shè),即,解碼所使用的計(jì)算可能與編碼的解碼部分所使用的計(jì)算不同。如上所述,即使在出現(xiàn)高次諧波低位DCT失配抖動(dòng)時(shí),這種失配也會(huì)導(dǎo)致漂移(還增加噪聲)。MPEG-2中的普通實(shí)踐是使I幀的位置相互接近(約每半秒),以再校正這種漂移以及限制差錯(cuò)的擴(kuò)展。然而,I幀是相當(dāng)無效率的,通常,耗費(fèi)的位數(shù)約為P幀位數(shù)的3倍那么多,以及B幀的5倍那么多。在“調(diào)準(zhǔn)”到運(yùn)動(dòng)畫面序列期間,I幀還形成再起動(dòng)和參考點(diǎn)。然而,可以有用地增加它們?cè)诖鎯?chǔ)媒體上的出現(xiàn)頻率到數(shù)秒(例如,平均在約1到5秒的范圍內(nèi))以提高效率,如果沒有IDCT失配的話。
通過使解碼器的IDCT功能的數(shù)值算法與編碼器的解碼部分使用IDCT功能的數(shù)值算法確切地匹配可以排除IDCT失配。由于從一個(gè)P幀到下一個(gè)P幀通過對(duì)它的差信號(hào)(它包括IDCT精度限制的差)編碼而出現(xiàn)的固有反饋機(jī)構(gòu),在每個(gè)P幀處自動(dòng)校正了這些匹配IDCT功能中的任何精度的限制。數(shù)值算法的“確切匹配”意味著把輸入變換成輸出的算法的這些部分應(yīng)該應(yīng)用相同的分辨率來進(jìn)行乘法和加法功能、相同的數(shù)值表示、相同的精度等。然而,就計(jì)算機(jī)程序或集成電路實(shí)施而論,數(shù)值算法不需要相同。因此,例如,可以使用不同的計(jì)算機(jī)語言和二進(jìn)制產(chǎn)生模式(例如,解譯對(duì)編譯)。
因此,通過IDCT功能中的足夠精度可以得到高質(zhì)量編碼。然而,IDCT功能不需要極高的精度。例如,在MPEG-4視頻參考軟件中,使用雙寬度浮點(diǎn)(64位)IDCT實(shí)施。完全不需要這樣,由于16位IDCT實(shí)施足以提供對(duì)于高達(dá)12-位動(dòng)態(tài)范圍編碼所需要的改進(jìn)??梢允褂弥T如32位浮點(diǎn)實(shí)施之類的大于16位的編碼器和解碼器IDCT實(shí)施(精確匹配),以擴(kuò)展動(dòng)態(tài)范圍達(dá)16位(這導(dǎo)致在小于百分之零點(diǎn)幾的對(duì)數(shù)步長中大于十億到1的動(dòng)態(tài)范圍,超過人類視覺極限)。因此通過精確匹配編碼器和解碼器IDCT實(shí)施,本發(fā)明大大地減少了IDCT實(shí)施所需要的計(jì)算量,同時(shí)排除了IDCT失配的問題。此外,反直覺地,使用精確匹配編碼器和解碼器IDCT實(shí)施,即使具有增加的中間精度,實(shí)際上也增加總效率(即,更高的平均壓縮比),由于可以使耗費(fèi)位的I幀在時(shí)間上隔開更遠(yuǎn)(例如,平均在約1到5秒的范圍內(nèi))。的確,通過實(shí)際上無限制的時(shí)間可以使I幀隔開,僅受到的限制是能夠跳轉(zhuǎn)到程序中間或校正從有損分布信道產(chǎn)生的誤差所要求的。
圖4是根據(jù)本發(fā)明的MPEG類解碼方法的方框圖。把高精度編碼輸入位流402施加于具有與輸入位流的精度匹配的“中間”處理精度的去量化功能404。把結(jié)果較佳地施加于與對(duì)應(yīng)的編碼器的IDCT功能310精確匹配的IDCT功能406。IDCT功能406輸出與所有以前內(nèi)部處理步驟的中間精度(例如,16位)相同的有符號(hào)的值408。這個(gè)輸出包括I幀410,或與來自以前幀412或后繼幀414(兩者都具有相同的精度)的數(shù)據(jù)組合而產(chǎn)生的新幀416。
此外,應(yīng)該排除所有形式的抖動(dòng),因此減小了噪聲和偽象。尤其,應(yīng)該排除來自舍入的抖動(dòng)(除了全精度之外,諸如16位,即,舍入第17位),以及來自IDCT失配的高次諧波的低位的抖動(dòng)。還有,在較佳實(shí)施例中,在解碼期間的任何最終顏色空間轉(zhuǎn)換步驟期間(例如,YUV到RGB或其它轉(zhuǎn)換,諸如YUV 4:2:0到Y(jié)UV 4:2:2,用于觀看、利用或存儲(chǔ)經(jīng)轉(zhuǎn)換圖象),使用附加的中間象素精度,僅在最終步驟處進(jìn)行舍入。
應(yīng)該注意,可以使用在圖3和圖4中示出的高精度技術(shù)對(duì)標(biāo)準(zhǔn)精度輸入(例如,MPEG-2使用的8-位精度輸入)進(jìn)行編碼和接著進(jìn)行解碼。盡管結(jié)果的質(zhì)量沒有象對(duì)較高精度輸入進(jìn)行編碼和解碼的質(zhì)量那么高,但是對(duì)于現(xiàn)有的MPEG編碼和解碼仍是一種改進(jìn)。此外,通過在中間處理和存儲(chǔ)期間增加精度可以改進(jìn)編碼和解碼兩種處理。不需要使這種精度相等以得到改進(jìn),但是當(dāng)編碼和解碼的解碼部分在精度和數(shù)值算法方面精確切匹配時(shí),使改進(jìn)最優(yōu)化。
下面是對(duì)改進(jìn)壓縮圖象質(zhì)量的本發(fā)明的較佳實(shí)施例的一個(gè)概括1)在中間處理期間保存比輸入精度多的精度位(例如在編碼期間從RGB到Y(jié)UV轉(zhuǎn)換步驟保存更多精度位,以及從IDCT步驟的更多精度位)。
2)存儲(chǔ)所增加的中間精度結(jié)果。
3)任選地,在編碼器和解碼器中利用精確匹配的IDCT實(shí)施。
4)任選地,排除所有形式的抖動(dòng)。
5)在解碼期間的這種顏色空間轉(zhuǎn)換步驟期間,利用附加的象素精度,僅在最終步驟處舍入。
動(dòng)態(tài)范圍和對(duì)比度擴(kuò)展本發(fā)明人已經(jīng)在前面討論了逐漸增加基于象素的圖象表示的比色范圍和動(dòng)態(tài)范圍,例如,見Gray Demos在1990年10月的SMPTE會(huì)議上提出的,在SMPTE雜志(1990年10月,第10卷,第10期)發(fā)表的“The Use of Logarithmicand Density Units for Pixels(象素的對(duì)數(shù)單位和密度單位的使用)”。還有,見Gray Demos在1993年10月的SMPTE會(huì)議上提出的,并在進(jìn)展和預(yù)發(fā)稿版上發(fā)表的“An Example Representation for Image Color And Dynamic RangeWhich Is Scalable,Interoperable,and Extensible(象素壓縮和可定標(biāo)的、可中間操作的、以及可擴(kuò)展的動(dòng)態(tài)范圍的示例表示)”。
使用對(duì)數(shù)表示象素值有許多優(yōu)點(diǎn)。例如,YUV編碼方法計(jì)算U作為R-Y,計(jì)算V作為B-Y。在對(duì)數(shù)表示中,U變成R/Y而V變成B/Y,在1993年SMPTE文章“An Example Representation for Image Color And Dynamic Range WhichIs Scalable,Interoperable,and Extensible(象素壓縮和可定標(biāo)的、可中間操作的、以及可擴(kuò)展的動(dòng)態(tài)范圍的示例表示)”中制造的術(shù)語中,兩者都是“相同發(fā)光”,如上所述。即,在照射改變下,U和V兩個(gè)通道都不包含信號(hào),如果它們具有恒定的色調(diào)的話。在使用U和V通道對(duì)顏色編碼時(shí),這提供了高效率。此外,在總亮度的很寬的動(dòng)態(tài)范圍上得到這種色調(diào)編碼效率。對(duì)數(shù)表示還提供容易的系統(tǒng)測量和定標(biāo)方法,以及在極寬的亮度范圍上在感知上是一致的。
表1表示在9到14位/象素范圍中各種位數(shù)的范圍和色調(diào)分辨率能力。從該表可以看到,使用對(duì)數(shù)表示,可以使用小于16位精度而達(dá)到在亮度范圍、顏色范圍以及色調(diào)分辨率(按1/8百分?jǐn)?shù)步長)中的跨度為約10,000,000-到-1的范圍的人的視覺范圍。
總對(duì)比度范圍 所需要的位數(shù)1%步長 .5%步長 .25%步長.125%步長

使用整個(gè)、半個(gè)、四分之一和八分之一百分?jǐn)?shù)的對(duì)數(shù)步長所需要的位數(shù)表1當(dāng)前高質(zhì)量電子攝像機(jī)和放映機(jī)能夠在約10位/象素每顏色的動(dòng)態(tài)范圍和顏色范圍處操作。例如,Polaroid//Philips LDK 9000攝像機(jī)提供具有寬顏色范圍的低噪聲圖象。這個(gè)攝像機(jī)具有11微米的CCD象素尺寸以及約25,000個(gè)電子的完整的較優(yōu)良電子計(jì)數(shù)。較大的傳感器尺寸是極可能的,具有增加完整的較優(yōu)良電子計(jì)數(shù)的潛力,以對(duì)成千上萬或成百萬的電子進(jìn)行計(jì)數(shù)。在圖象投射方面,具有10位伽馬輸入的微鏡放映機(jī)能夠得到具有適當(dāng)色調(diào)差別的1000∶1的動(dòng)態(tài)范圍,從而到達(dá)電影膠片的質(zhì)量。雖然最佳膠片可以得到具有高色調(diào)保真度和寬顏色范圍的較寬動(dòng)態(tài)范圍(約3000∶1),但是現(xiàn)在有可能預(yù)見數(shù)字成象和呈現(xiàn)在競爭并最終超過這種性能。
如上所述,通過保留在中間處理期間的經(jīng)擴(kuò)展的精度可以顯著地提高運(yùn)動(dòng)圖象壓縮的質(zhì)量。還可以利用相同的機(jī)構(gòu),較大地?cái)U(kuò)展可以有效壓縮的圖象信息的動(dòng)態(tài)范圍,例如,如果保留中間精度的14位,則這個(gè)位范圍可以按1/8%對(duì)數(shù)步長來表示7000,000,000∶1的動(dòng)態(tài)范圍。
還有用的是進(jìn)行不包括在參考文章中的附加觀察,亮度的區(qū)分是局部的。因此不可能區(qū)分緊鄰極亮目標(biāo)的暗陰影中的小的亮度變化。因此,只需要保留相對(duì)于圖象所在的相同區(qū)域中的局部亮度的色調(diào)和動(dòng)態(tài)范圍區(qū)分。然而,圖象的不同部分,可能具有暗陰影,可能離實(shí)質(zhì)上看到細(xì)節(jié)區(qū)分的亮區(qū)域足夠遠(yuǎn),需要在局部亮度顯示的色調(diào)范圍中的相應(yīng)的細(xì)節(jié)。
可以把結(jié)合了中間處理期間經(jīng)擴(kuò)展精度的使用的這些概念施加于運(yùn)動(dòng)圖象壓縮。尤其,一旦把保留在壓縮系統(tǒng)中的中間精度擴(kuò)展到較多位數(shù),諸如13、14、15或16位,則這個(gè)經(jīng)擴(kuò)展的精度還能夠顯示寬動(dòng)態(tài)范圍圖象。此外,為了得到有效的壓縮,可以利用在亮區(qū)域中的色調(diào)區(qū)分的感知極限相對(duì)陰影中經(jīng)擴(kuò)展的區(qū)分的關(guān)系。
在MPEG類壓縮系統(tǒng)中,通過“量化參數(shù)”或“QP”來確定色調(diào)區(qū)分。把QP分成DCT頻率系數(shù)以減少對(duì)運(yùn)動(dòng)圖象流編碼所需要的位數(shù)。在解碼期間,在計(jì)算IDCT之前使QP乘以DCT系數(shù)。因此,雖然在頻率(DCT)空間中應(yīng)用QP,它仍表示色調(diào)精度參數(shù)。
根據(jù)上述區(qū)域區(qū)分特征,在高亮度區(qū)域中可以利用高QP而沒有可見的清晰度或色調(diào)的損失,由于色調(diào)區(qū)分是相對(duì)于全亮度的。然而,在暗圖象陰影區(qū)域中,必須利用低QP來提供精確的色調(diào)精度。
在MPEG-1、MPEG-2以及MPEG-4中利用1-32范圍中的線性QP因子是普通的。而這適合于諸如MPEG-2提供的8位動(dòng)態(tài)范圍,對(duì)于更多位數(shù)(諸如10位或12位),或?qū)τ谳^寬的動(dòng)態(tài)范圍,這個(gè)范圍是不夠的。在MPEG-2和MPEG-4中,有可能從一個(gè)宏模塊到下一個(gè)宏模塊改變QP。這一般是一種機(jī)構(gòu),通過該機(jī)構(gòu)調(diào)節(jié)位速率使之保持恒定位速率。較高的QP產(chǎn)生較少的編碼位,而較低的QP產(chǎn)生較多的編碼位。因此,在1-32的范圍中改變QP是所需要的一切,以便在諸如MPEG-1或MPEG-2之類的8位能力的有限精度系統(tǒng)中保持給定的恒定位速率。然而,對(duì)于10位或12位精度,如在MPEG-4中,情景變化量較寬地改變(高情景強(qiáng)度),并且需要低的恒定位速率,32個(gè)可能值的QP范圍可能就不夠。對(duì)于10位的32個(gè)值的QP范圍等效于8位的8個(gè)值的QP范圍,只有四分之一的范圍可用于諸如MPEG-2之類的8位編碼系統(tǒng)。對(duì)于諸如MPEG-4之類的12位編碼系統(tǒng),32個(gè)值的范圍等效于8位編碼的2個(gè)值的QP范圍,只有QP范圍的開始的十六之一可用于8位編碼系統(tǒng)。
因此,在一般情況中擴(kuò)展QP的范圍是有用的。然而,注意,使用高精度中間編碼和/或解碼連同QP的范圍和QP值之間的直接對(duì)應(yīng)(即,值x與顯示數(shù)x相同;因此,值14等于顯示數(shù)14)可以導(dǎo)致高質(zhì)量壓縮和解壓縮。
如果要求改變?cè)趲械腝P,則希望在QP中保持較少的步長數(shù)目(諸如32個(gè)或64個(gè)值,或某些相似的小數(shù)目),由于在MPEG-4中把對(duì)每宏模塊的QP改變進(jìn)行編碼所需要的位限制為2個(gè)單元。如果每幀只改變一次QP,或每幅或相似大的結(jié)構(gòu)改變一次,則QP的值的數(shù)目可能較大。
如果需要,通過取得動(dòng)態(tài)范圍的感知對(duì)數(shù)特性的優(yōu)點(diǎn),可以把QP的有效范圍擴(kuò)展到在較少數(shù)目顯示代碼中的確定值(即,在壓縮和解壓縮期間實(shí)際應(yīng)用的QP值)的較寬范圍。相應(yīng)地??梢允褂梅蔷€性查找表把較少數(shù)目的顯示QP代碼(諸如1到32,或1到128的范圍)映射到確定QP值(諸如1到128、1到256、1到1024或1到4096)的更寬范圍。在如此的表中,低QP代碼輸入幾乎是一對(duì)一地映射以確定QP值。例如,QP代碼1到4可能映射來確定1到4的QP輸出值。然而,在對(duì)數(shù)模型中,映射將逐漸變得更陡峭,致使QP代碼8可能映射來確定QP值16,QP代碼16可能映射來確定QP值64,而QP代碼32可能映射來確定QP值256。注意,MPEG-2對(duì)于從1-31的線性QP模式提供雙步長QP模式,即映射每個(gè)從1-31的代碼到它的值的兩倍(即,到2-62),以及把代碼1-31映射到確定值1-112的非線性QP模式。在MPEG-2中,這些大的確定QP值導(dǎo)致使用8位象素值的極粗糙的編碼。例如,62和112的QP值分別對(duì)應(yīng)于8-位值中只有兩或一位的編碼。因此,使用這些值的任何編碼圖象將具有極差的質(zhì)量。
另一方面,如果每幀或每幅或其它大的結(jié)構(gòu)規(guī)定QP一次,則不限制可用于QP的位數(shù),并且可以在任何適當(dāng)?shù)奈粩?shù)(包括16位、32位、32位浮點(diǎn),甚至更多的位數(shù))中的極寬范圍上完整地表示QP值。然而,寬動(dòng)態(tài)范圍圖象的概念化框架是如此的,圖象某些部分的亮度高,需要高的確定QP值,而其它部分亮度低,需要低的確定QP值。因此,使用在區(qū)域基礎(chǔ)上有效地規(guī)定QP值的一種方法是有益的。如果限制QP代碼的范圍(諸如1到32,如同在MPEG-4中),則允許QP值每宏模塊變化±2單位的編碼系統(tǒng)的現(xiàn)有機(jī)構(gòu)(諸如MPEG-4)是足夠的。然而,如果需要大的QP值范圍,則規(guī)定區(qū)域性QP值的其它簡單方法也是適當(dāng)?shù)暮陀幸娴摹?br> 因此,使用區(qū)域性變化的QP值以允許極寬動(dòng)態(tài)范圍顯示是十分普通的,所述極寬動(dòng)態(tài)范圍顯示是可以高度壓縮的,并在視覺上與原始運(yùn)動(dòng)圖象不能區(qū)分。
必須注意除以確定QP值之后的可用于編碼顯示的位數(shù)(還把DCT輸出被QP除稱為“量化”)。在量化之后,必須把余留的位編碼成位流。除了內(nèi)部幀和內(nèi)部宏模塊情況之外的經(jīng)編碼的位表示以前或后繼幀,以及當(dāng)前幀和當(dāng)前宏模塊中的最佳運(yùn)動(dòng)矢量預(yù)測匹配之間的差異。這個(gè)量化的DCT-編碼的差異的編碼表示將確定可以得到的壓縮比。
在MPEG-2和MPEG-4中,最大編碼值范圍是±2047(受到VLC表表示的限制)。這對(duì)應(yīng)于8位的未量化的精度。因此,對(duì)于10位圖象的未量化的(即QP=1)編碼,有可能超過這個(gè)最大編碼范圍達(dá)一個(gè)4倍的因子。這可能發(fā)生,如果最佳匹配預(yù)測器塊包括DC中的滿刻度黑到白過渡,或等效的滿刻度AC系數(shù)改變(諸如從平坦-灰度區(qū)域預(yù)測的清晰的黑白邊緣)。最優(yōu)化的預(yù)測器難得提供如此差的匹配,因此在這10位例子情況中,如果有過的話,也是偶爾要求滿刻度編碼的。然而,在12位運(yùn)動(dòng)圖象或在甚至更寬的14或16位圖象中,經(jīng)常會(huì)超過范圍極限,諸如±2047。在容易擴(kuò)展±2047極限的同時(shí),在概念上有益的是試圖限制進(jìn)行編碼的位的平均數(shù)。通過使用QP值能直接使位的平均數(shù)以及最大編碼范圍兩者減少。例如,為4的一個(gè)QP擴(kuò)展了用±2047編碼表示的可得到的動(dòng)態(tài)范圍,以包括10位編碼的所有可能情況,以及12位運(yùn)動(dòng)畫面編碼的所有可能情況。因此可以看到,擴(kuò)展QP值到更高數(shù)目的值,諸如16、32或64,可以進(jìn)一步擴(kuò)展可以通過諸如±2047范圍之類的受限制編碼位的數(shù)目表示的運(yùn)動(dòng)圖象動(dòng)態(tài)范圍。這種更高的QP值不但擴(kuò)展范圍,而且還減少進(jìn)行編碼的位的平均數(shù),因此產(chǎn)生了高度的壓縮。
這種概念的關(guān)鍵是在寬動(dòng)態(tài)范圍圖象中的高QP值對(duì)應(yīng)于不需要精細(xì)的色調(diào)區(qū)分的具有高亮度的圖象區(qū)域。通過保持幀的擴(kuò)展精度,以及通過在亮區(qū)域中利用高QP值和在暗區(qū)域中利用低QP值而對(duì)寬動(dòng)態(tài)范圍圖象進(jìn)行編碼的這種方法可以得到高壓縮比,具有在感知上與原始編碼不能區(qū)分的完美的編碼。
因此,可以擴(kuò)展MPEG類壓縮技術(shù)的效用,用于壓縮運(yùn)動(dòng)的寬動(dòng)態(tài)范圍圖象。當(dāng)攝像機(jī)、放映機(jī)以及其它圖象系統(tǒng)部件擴(kuò)展它們的范圍能力時(shí),可以施加這種壓縮方法而得到高效的壓縮。因此,在圖象系統(tǒng)中的將來許多代的技術(shù)改進(jìn)上,所產(chǎn)生的壓縮系統(tǒng)是可以擴(kuò)展的。
概括地說,本發(fā)明的一個(gè)方面包括通過擴(kuò)展QP值的范圍而把高精度壓縮施加于寬動(dòng)態(tài)范圍圖象??梢酝ㄟ^直接增加QP值的范圍,或間接地通過非線性變換(諸如一種功能或查找表)而完成擴(kuò)展,所述非線性變換把QP代碼的小范圍映射到用于除(壓縮)或乘(解壓縮)的QP值的較寬范圍。本發(fā)明的另一個(gè)方面是根據(jù)區(qū)域性信息,或通過檢查壓縮期間可得到的信息(例如,DCT系數(shù),或候選QP值的給定數(shù)目產(chǎn)生的位數(shù),從所述候選QP值選擇一個(gè)適當(dāng)?shù)闹?,或兩種確定方法的組合來確定這種寬范圍QP值。
還可以把經(jīng)擴(kuò)展的中間處理精度和經(jīng)擴(kuò)展的QP值范圍應(yīng)用于運(yùn)動(dòng)圖象中的擴(kuò)展的對(duì)比度范圍區(qū)域和降低的對(duì)比度范圍區(qū)域兩者的編碼。例如,在陰霾的日子使前景目標(biāo)具有高對(duì)比度是很普通的,但是具有隨距離降低的對(duì)比度。遠(yuǎn)離的目標(biāo)經(jīng)常具有極低的對(duì)比度。諸如在建筑物窗口后面以及汽車擋風(fēng)玻璃后面的情景之類的其它普通情況,也由于玻璃和玻璃的反射而具有降低的對(duì)比度。反射也呈現(xiàn)降低的對(duì)比度。
可以把經(jīng)擴(kuò)展的精度和QP值范圍的原理施加于圖象的對(duì)比度降低區(qū)域以擴(kuò)展精度,用該精度對(duì)低對(duì)比度部分進(jìn)行壓縮編碼。正如對(duì)于暗區(qū)域使用低QP值和對(duì)于亮區(qū)域使用高QP值的動(dòng)態(tài)范圍擴(kuò)展的情況一樣,低對(duì)比度區(qū)域(通常較遠(yuǎn))可以利用低QP值,而高對(duì)比度區(qū)域(通常是前景)利用高QP值。如此,如果攝像機(jī)傳感器具有足夠的位分辨率,則當(dāng)解壓縮時(shí),完全可以區(qū)分在空中的、或地面上的、或陰霾日子的遠(yuǎn)目標(biāo)。接著可以人工地增強(qiáng)它們的對(duì)比度,從而顯示具有正常動(dòng)態(tài)范圍的清晰圖象。
雖然當(dāng)前攝像機(jī)和膠片限制到約10位的伽馬或?qū)?shù)動(dòng)態(tài)范圍,將來的攝像機(jī)十分可能具有更高的精度。除了擴(kuò)展動(dòng)態(tài)范圍之外,這種經(jīng)擴(kuò)展的攝像機(jī)圖象亮度區(qū)分對(duì)于觀看低對(duì)比度區(qū)域中的細(xì)節(jié)是有用的。正如攝像機(jī)的情況一樣,當(dāng)放映機(jī)擴(kuò)展它們的動(dòng)態(tài)范圍和它們的最大亮度時(shí),有可能區(qū)分這個(gè)經(jīng)擴(kuò)展的范圍中的低對(duì)比度細(xì)節(jié)。在寬動(dòng)態(tài)范圍放映機(jī)上比在有限動(dòng)態(tài)范圍的觀看監(jiān)視器上更容易看到諸如落下的雨滴之類亮度中的精細(xì)變化。容易區(qū)分通過寬動(dòng)態(tài)范圍放映機(jī)顯示的目標(biāo),因?yàn)樗鼘?duì)于觀看者具有較寬范圍的亮度變化,而在計(jì)算機(jī)CRT(陰極射線管)顯示器上,亮度變化范圍較小。因此,當(dāng)攝像機(jī)和顯示器擴(kuò)展它們的動(dòng)態(tài)范圍和色調(diào)區(qū)分(即,增加附加的分辨率位使之超過當(dāng)前10位的能力)時(shí),希望不但擴(kuò)展動(dòng)態(tài)范圍而且還擴(kuò)展對(duì)比度區(qū)分。
重要的是,與支持經(jīng)擴(kuò)展的動(dòng)態(tài)范圍的技術(shù)相同技術(shù)還支持低對(duì)比度區(qū)域的高區(qū)分編碼。尤其,以與通常進(jìn)行特別編碼(以提高DC項(xiàng)編碼效率)的DC系數(shù)的方式不同的方式,把QP值應(yīng)用于DCT輸出的AC系數(shù)。因而AC系數(shù)的標(biāo)度自然地大約復(fù)蓋了主要DC值。例如,在模糊灰暗的低對(duì)比度區(qū)域具有在DC模糊平均值周圍的低幅度AC系數(shù)。因此,施加低QP值將自然地保存在低對(duì)比度區(qū)域中的精細(xì)的色調(diào)變化。正如經(jīng)擴(kuò)展的動(dòng)態(tài)范圍的情況一樣,高QP值允許高對(duì)比度前景區(qū)域的正常編碼。
為了調(diào)節(jié)QP值使之適合于暗區(qū)域和模糊區(qū)域,還適合于正常對(duì)比度的亮度區(qū)域,應(yīng)該相對(duì)于每個(gè)畫面區(qū)域的對(duì)比度和亮度而區(qū)域性地確定QP值。如果對(duì)于每個(gè)宏模塊設(shè)置QP值,致使在一個(gè)區(qū)域中的每個(gè)宏模塊產(chǎn)生近似相同的位數(shù),則也可以自動(dòng)地確定QP值。對(duì)于具有包括暗區(qū)域和低對(duì)比度區(qū)域的寬動(dòng)態(tài)范圍圖象,把恒定的位數(shù)給予每個(gè)宏模塊將自動(dòng)地使亮度和對(duì)比度的整個(gè)范圍上的表示最優(yōu)化。然而,還希望把比提供給低細(xì)節(jié)區(qū)域的位數(shù)更多的位提供給高細(xì)節(jié)區(qū)域,以及向運(yùn)動(dòng)區(qū)域提供比靜態(tài)區(qū)域更多的位數(shù)。
通過檢查每個(gè)宏模塊中的DCT系數(shù)的相對(duì)幅度可以自動(dòng)地確定每個(gè)宏模塊的QP值。可以向包括表示細(xì)節(jié)的DCT系數(shù)和表示運(yùn)動(dòng)的DCT系數(shù)的宏模塊提供比那些包括表示低細(xì)節(jié)或低變化(運(yùn)動(dòng))的系數(shù)的相對(duì)權(quán)重的宏模塊更多的位。然而,還須要考慮攝像機(jī)傳感器的噪聲,因?yàn)樵肼暤男阅芫拖笞兓?運(yùn)動(dòng))和細(xì)節(jié)(高頻系數(shù))兩者一樣。當(dāng)與真的寬動(dòng)態(tài)范圍和合適的低噪聲電平的高區(qū)分傳感器一起使用時(shí),相對(duì)于DCT系數(shù)自己加權(quán)的DCT系數(shù)可以形成合適的指示符(indicator),用于自動(dòng)地設(shè)置QP值。尤其,較大的DCT系數(shù)產(chǎn)生較大的QP值。相應(yīng)地,可以完全跟據(jù)經(jīng)驗(yàn)確定DCT系數(shù)和所要求的對(duì)應(yīng)QP值之間的映射或相關(guān)。
諸如最大區(qū)域亮度和對(duì)比度之類簡單的區(qū)域性算法是可以用來確定(或與其它機(jī)構(gòu)一起幫助確定)合適的QP值的另一種方法。通過區(qū)域性細(xì)節(jié)幅度(畫面的高頻靜態(tài))測量算法還可以提供附加的信息。每種方法具有它自己的優(yōu)點(diǎn)。然而,在內(nèi)部宏模塊的情況中,DCT系數(shù)自己足以確定QP值。即,DCT系數(shù)是與預(yù)測的宏模塊的運(yùn)動(dòng)組合的細(xì)節(jié)的量度,所以使用獨(dú)立的細(xì)節(jié)量度(諸如平行的內(nèi)部DCT變換)可以幫助從當(dāng)前幀圖象宏模塊的細(xì)節(jié)(在運(yùn)動(dòng)補(bǔ)償之后的靜態(tài),諸如具有慢運(yùn)動(dòng)攝像機(jī)的草的葉片(grass of blades))析出運(yùn)動(dòng)細(xì)節(jié)變化(諸如雨滴或水平方向上運(yùn)動(dòng)的水波浪)。使用DCT系數(shù)本身來表示QP的簡單性使之成為特別吸引人的實(shí)際實(shí)施。
圖5是概括在圖象壓縮期間擴(kuò)展動(dòng)態(tài)范圍和/或?qū)Ρ榷鹊囊环N較佳方法的流程圖。
步長500以寬動(dòng)態(tài)范圍或?qū)拰?duì)比度范圍的源畫面開始。
步長502如果需要,擴(kuò)展量化參數(shù)(QP)代碼組的有效的值范圍。例如,這可以通過下列技術(shù)中之一來完成1)把QP代碼的組從額定范圍(一般是32級(jí))擴(kuò)展到較大的實(shí)際范圍(128、1024或4096級(jí),或無論什么適合于圖象范圍的)。因此,額定值直接表示可能值的經(jīng)擴(kuò)展的范圍。
2)使用非線性查找表或映射函數(shù),以非線性的方式使額定QP代碼相關(guān)成值的較大有效范圍。在低值處,映射一般是線性的,但是當(dāng)值向一般范圍最大值增加時(shí),增加有效的QP乘和除步長增加大小。例如,使用非線性查找表或映射功能可以擴(kuò)展32或64個(gè)代碼,以產(chǎn)生具有諸如128、1024、4096或無論什么適合于圖象范圍之類的較大最大值的較大有效范圍。
步長504確定在進(jìn)行壓縮的一個(gè)圖象的每個(gè)宏模塊的應(yīng)該編碼的QP值,最好使用下列方法中之一1)使用算法確定合適的QP值,以從運(yùn)動(dòng)圖象流的分析確定每個(gè)幀中的局部圖象區(qū)域的對(duì)比度,在每個(gè)幀中的局部動(dòng)態(tài)范圍,在每個(gè)幀中的局部細(xì)節(jié)幅度以及一個(gè)或多個(gè)順序幀之間的局部運(yùn)動(dòng)(如上所述)。
2)在量化之前,根據(jù)在壓縮過程中產(chǎn)生的信息,根據(jù)所產(chǎn)生的位數(shù)(對(duì)于QP的許多候選值),和DCT系數(shù)的幅度和頻率確定QP值。
3)應(yīng)用來自1)和2)的信息的組合,利用區(qū)域性信息以及從壓縮過程產(chǎn)生的信息確定每個(gè)宏模塊的QP值。
步長506如上所述,對(duì)于所有中間處理使用經(jīng)擴(kuò)展的精度,以使用從步長504確定的QP值對(duì)圖象進(jìn)行壓縮。可以按需要存儲(chǔ)或發(fā)送經(jīng)壓縮的圖象和相關(guān)聯(lián)的標(biāo)稱QP代碼,所述相關(guān)聯(lián)的標(biāo)稱QP代碼對(duì)應(yīng)于在壓縮期間使用的所確定的QP值。
步長508使用如上所述的高精度解壓縮,對(duì)存儲(chǔ)的或發(fā)送的圖象進(jìn)行解壓縮,使之成為供各種應(yīng)用的寬動(dòng)態(tài)范圍、寬對(duì)比度范圍、高分辨率圖象。如果需要,把這種解壓縮的相關(guān)聯(lián)的標(biāo)稱QP代碼映射回對(duì)應(yīng)的確定的QP值。這種應(yīng)用包括電影和運(yùn)動(dòng)的家庭和戲院顯示,把存儲(chǔ)的圖象存檔,運(yùn)動(dòng)圖象顯示的商務(wù)應(yīng)用,政府應(yīng)用(例如,監(jiān)督、軍事命令和控制)以及等等。可以在寬動(dòng)態(tài)范圍顯示器裝置上觀看經(jīng)解壓縮的圖象,和/或?yàn)榱颂峁┳顑?yōu)化分析,用作為從(或需要)高質(zhì)量寬動(dòng)態(tài)范圍圖象而得益的使用算法的圖象分析的源(這種算法不屬于本揭示的范圍)。
實(shí)施可以在硬件或軟件、或它們的組合(例如,可編程邏輯陣列)中實(shí)施本發(fā)明。除非另行規(guī)定,不使作為本發(fā)明的一部分包括在內(nèi)的算法與任何它計(jì)算機(jī)或其它設(shè)備固有地相關(guān)。尤其,可以使用具有根據(jù)這里的學(xué)說編寫的程序的各種通用途機(jī)器,或可以更方便地構(gòu)成更專用(例如,集成電路)的設(shè)備,以執(zhí)行所需要的方法步長。因此,可以在一個(gè)或多個(gè)可編程計(jì)算機(jī)系統(tǒng)(每個(gè)計(jì)算機(jī)系統(tǒng)包括至少一個(gè)處理器、至少一個(gè)數(shù)據(jù)存儲(chǔ)系統(tǒng)(包括易失性和非易失性存儲(chǔ)器和/或存儲(chǔ)單元)、至少一個(gè)輸入裝置或端口以及至少一個(gè)輸出裝置或端口)上執(zhí)行的一個(gè)或多個(gè)計(jì)算機(jī)程序中實(shí)施本發(fā)明。把程序代碼施加于輸入數(shù)據(jù)以執(zhí)行這里描述的功能以及產(chǎn)生輸出信息。按已知的方式把輸出信息施加于一個(gè)或多個(gè)輸出裝置。
可以按任何要求的計(jì)算機(jī)語言(包括機(jī)器、匯編或高級(jí)過程的、邏輯的或面向?qū)ο蟮木幊陶Z言)來實(shí)施每個(gè)如此的程序,以與計(jì)算機(jī)系統(tǒng)進(jìn)行通信。在任何情況中,語言可以是編譯語言或解譯語言。
最好把每個(gè)如此的計(jì)算機(jī)程序存儲(chǔ)在、或下載到可以通過通用途或?qū)S玫目删幊逃?jì)算機(jī)讀出的存儲(chǔ)媒體或器件(例如,固態(tài)存儲(chǔ)器或媒體、或磁性媒體或光學(xué)媒體)中,當(dāng)計(jì)算機(jī)系統(tǒng)讀出存儲(chǔ)媒體或器件時(shí),用于配置和操作計(jì)算機(jī)以執(zhí)行這里描述的過程。還可以考慮實(shí)施本發(fā)明的系統(tǒng)作為配置有計(jì)算機(jī)程序的計(jì)算機(jī)可讀出存儲(chǔ)媒體,如此配置的存儲(chǔ)媒體導(dǎo)致計(jì)算機(jī)系統(tǒng)在規(guī)定的和預(yù)定的方式中操作以執(zhí)行這里描述的功能。
已經(jīng)描述了本發(fā)明的許多實(shí)施例。但是,可以理解,可以進(jìn)行各種修改而不偏離本發(fā)明的精神和范圍。例如,上述某些步長可以有獨(dú)立的排序,因此可以以與所描述的次序不同的次序來執(zhí)行。相應(yīng)地,其它實(shí)施例在下列權(quán)利要求書的范圍內(nèi)。
權(quán)利要求
1.一種方法,用于壓縮包括在第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列,所述方法包括下列步長(a)把所述幀序列變換成在第二顏色空間中按比第一精度高的第二精度的表示;以及(b)按第二精度執(zhí)行后繼的編碼步長,以產(chǎn)生經(jīng)壓縮的輸出。
2.一種方法,用于壓縮包括在第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列,所述方法包括下列步長(a)把所述幀序列變換成在第二顏色空間中按比第一精度高的第二精度的表示;(b)按第二精度在幀序列上執(zhí)行運(yùn)動(dòng)補(bǔ)償離散余弦變換,以產(chǎn)生第一編碼輸出;(c)按第二精度對(duì)第一編碼輸出進(jìn)行量化,以產(chǎn)生經(jīng)量化輸出;以及(d)在經(jīng)量化輸出上按第二精度執(zhí)行反離散余弦變換,以產(chǎn)生按第二精度的經(jīng)壓縮輸出。
3.一種方法,用于對(duì)包括按第一精度表示的幀序列的數(shù)字化視頻圖象序列進(jìn)行壓縮和解壓縮,所述方法包括按比第一精度高的第二精度對(duì)幀序列進(jìn)行編碼,以產(chǎn)生經(jīng)壓縮位流。
4.如權(quán)利要求3所述的方法,其特征在于,進(jìn)一步包括按第二精度對(duì)所述經(jīng)壓縮位流進(jìn)行解碼。
5.如權(quán)利要求3所述的方法,其特征在于,對(duì)幀序列編碼包括把幀序列變換成第二顏色空間中按第二精度的表示。
6.一種方法,用于壓縮和解壓縮包括在第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列,所述方法包括下列步長(a)把所述幀序列變換成在第二顏色空間中按比第一精度高的第二精度的表示;(b)按第二精度執(zhí)行后繼的編碼步長,以產(chǎn)生經(jīng)壓縮的位流;以及(c)對(duì)經(jīng)壓縮的位流進(jìn)行解碼,通過(1)按第二精度對(duì)所述經(jīng)壓縮位流進(jìn)行去量化,以產(chǎn)生經(jīng)去量化的輸出;(2)在經(jīng)去量化輸出上按第二精度施加反離散余弦變換,以產(chǎn)生經(jīng)解壓縮輸出;(3)按第二精度從經(jīng)解壓縮輸出產(chǎn)生圖象幀。
7.如權(quán)利要求6所述的方法,其特征在于,所述后繼編碼步長包括施加反離散余弦變換數(shù)值算法,其中,對(duì)經(jīng)壓縮位流進(jìn)行解碼包括在經(jīng)去量化的輸出上施加反離散余弦變換數(shù)值算法。
8.如權(quán)利要求6所述的方法,其特征在于,進(jìn)一步包括按第二精度產(chǎn)生P幀。
9.如權(quán)利要求6所述的方法,其特征在于,進(jìn)一步包括按第二精度產(chǎn)生B幀。
10.一種方法,用于對(duì)包括第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列進(jìn)行壓縮和解壓縮,所述方法包括下列步長(a)把幀序列變換成第二顏色空間中按比第一精度高的第二精度的表示;(b)按第二精度執(zhí)行后繼的編碼步長以產(chǎn)生經(jīng)壓縮位流,包括施加反離散余弦變換數(shù)值算法;以及(c)按第二精度在經(jīng)壓縮位流上執(zhí)行后繼的解碼步長,包括施加匹配反離散余弦變換數(shù)值算法。
11.一種方法,用于在把包括幀序列的數(shù)字化視頻圖象的序列壓縮成包括I幀的經(jīng)壓縮的位流的期間增加平均壓縮比,所述方法包括通過施加與后繼的解碼過程期間施加的反離散余弦變換數(shù)值算法匹配的反離散余弦變換數(shù)值算法對(duì)幀序列進(jìn)行編碼,從而產(chǎn)生在I幀之間具有增加空間的經(jīng)壓縮位流。
12.如權(quán)利要求11所述的方法,其特征在于,進(jìn)一步包括對(duì)所述經(jīng)壓縮位流進(jìn)行解碼,包括施加與編碼期間施加的反離散余弦變換數(shù)值算法匹配的反離散余弦變換數(shù)值算法。
13.一種方法,用于對(duì)具有寬動(dòng)態(tài)范圍或?qū)拰?duì)比度范圍中至少一種范圍的數(shù)字化視頻圖象序列進(jìn)行壓縮,視頻圖象包括按第一精度表示的幀,每個(gè)幀包括多個(gè)定義區(qū)域的宏模塊,所述方法包括下列步長(a)確定量化參數(shù),QP,所述量化參數(shù)具有表示可能值的直接對(duì)應(yīng)或表示可能值的擴(kuò)展范圍的代碼;(b)確定每個(gè)幀的每個(gè)宏模塊的QP值;(c)按比第一精度高的第二精度對(duì)每個(gè)幀進(jìn)行壓縮以產(chǎn)生經(jīng)壓縮的幀,這種壓縮包括施加為這種幀的確定的QP值以減少對(duì)這種幀進(jìn)行編碼所需要的位數(shù);(d)使QP代碼與壓縮期間使用的確定QP值相關(guān)聯(lián);以及(e)輸出每個(gè)經(jīng)壓縮幀以及相關(guān)聯(lián)的QP代碼。
14.如權(quán)利要求13所述的方法,其特征在于,進(jìn)一步包括通過增加表示QP代碼的位數(shù)而直接擴(kuò)展可能QP值的范圍。
15.如權(quán)利要求13所述的方法,其特征在于,進(jìn)一步包括通過把QP代碼映射到可能QP值的較寬范圍而有效地?cái)U(kuò)展可能QP值的范圍。
16.如權(quán)利要求13所述的方法,其特征在于,確定每個(gè)幀的每個(gè)宏模塊的QP值是基于相對(duì)于一個(gè)或多個(gè)幀的區(qū)域性信息的。
17.如權(quán)利要求16所述的方法,其特征在于,所述區(qū)域性信息包括每個(gè)幀中的局部圖象區(qū)域?qū)Ρ榷取?br> 18.如權(quán)利要求16所述的方法,其特征在于,所述區(qū)域性信息包括每個(gè)幀中的局部動(dòng)態(tài)范圍。
19.如權(quán)利要求16所述的方法,其特征在于,所述區(qū)域性信息包括每個(gè)幀中的局部細(xì)節(jié)幅度。
20.如權(quán)利要求16所述的方法,其特征在于,所述區(qū)域性信息包括一個(gè)或多個(gè)順序幀之間的局部運(yùn)動(dòng)。
21.如權(quán)利要求13所述的方法,其特征在于,確定每個(gè)幀的每個(gè)宏模塊的QP值是基于在壓縮步長期間產(chǎn)生的信息的。
22.如權(quán)利要求21所述的方法,其特征在于,在壓縮步長期間產(chǎn)生的所述信息包括每個(gè)宏模塊的離散余弦變換系數(shù)的相對(duì)幅度。
23.如權(quán)利要求21所述的方法,其特征在于,在壓縮步長期間產(chǎn)生的所述信息包括對(duì)于幀區(qū)域中的每個(gè)宏模塊進(jìn)行編碼所分配的對(duì)恒定位數(shù)。
24.如權(quán)利要求13所述的方法,其特征在于,進(jìn)一步包括下列步長(a)對(duì)于每個(gè)經(jīng)壓縮的幀,重新確定與這種經(jīng)壓縮的幀相關(guān)聯(lián)的每個(gè)QP代碼的QP值;以及(b)按第二精度對(duì)每個(gè)經(jīng)壓縮的幀進(jìn)行解壓縮,以產(chǎn)生具有寬動(dòng)態(tài)范圍或?qū)拰?duì)比度范圍中的至少一個(gè)范圍的經(jīng)解壓縮的幀,這種解壓縮包括施加這種幀的重新確定的QP值。
25.存儲(chǔ)在計(jì)算機(jī)可讀出媒體上的一種計(jì)算機(jī)程序,用于壓縮包括在第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列,所述計(jì)算機(jī)程序包括指令,用于使計(jì)算機(jī)(a)把所述幀序列變換成在第二顏色空間中按比第一精度高的第二精度的表示;以及(b)按第二精度執(zhí)行后繼的編碼步長,以產(chǎn)生經(jīng)壓縮的輸出。
26.存儲(chǔ)在計(jì)算機(jī)可讀出媒體上的一種計(jì)算機(jī)程序,用于壓縮包括在第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列,所述計(jì)算機(jī)程序包括指令,用于使計(jì)算機(jī)(a)把所述幀序列變換成在第二顏色空間中按比第一精度高的第二精度的表示;(b)按第二精度在幀序列上執(zhí)行運(yùn)動(dòng)補(bǔ)償離散余弦變換,以產(chǎn)生第一編碼輸出;(c)按第二精度對(duì)第一編碼輸出進(jìn)行量化,以產(chǎn)生經(jīng)量化輸出;以及(d)在經(jīng)量化輸出上按第二精度執(zhí)行反離散余弦變換,以產(chǎn)生按第二精度的經(jīng)壓縮輸出。
27.存儲(chǔ)在計(jì)算機(jī)可讀出媒體上的一種計(jì)算機(jī)程序,用于對(duì)包括按第一精度表示的幀序列的數(shù)字化視頻圖象序列進(jìn)行壓縮和解壓縮,所述計(jì)算機(jī)程序包括指令,用于使計(jì)算機(jī)按比第一精度高的第二精度對(duì)幀序列進(jìn)行編碼,以產(chǎn)生經(jīng)壓縮位流。
28.如權(quán)利要求27所述的計(jì)算機(jī)程序,其特征在于,進(jìn)一步包括使計(jì)算機(jī)按第二精度對(duì)所述經(jīng)壓縮位流進(jìn)行解碼的指令。
29.如權(quán)利要求27所述的計(jì)算機(jī)程序,其特征在于,用于使計(jì)算機(jī)對(duì)幀序列進(jìn)行編碼的指令包括用于使計(jì)算機(jī)把幀序列變換成在第二顏色空間中按第二精度表示的指令。
30.存儲(chǔ)在計(jì)算機(jī)可讀出媒體上的一種計(jì)算機(jī)程序,用于壓縮和解壓縮包括在第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列,所述計(jì)算機(jī)程序包括指令,用于使計(jì)算機(jī)(a)把所述幀序列變換成在第二顏色空間中按比第一精度高的第二精度的表示;(b)按第二精度執(zhí)行后繼的編碼步長,以產(chǎn)生經(jīng)壓縮的位流;以及(c)對(duì)經(jīng)壓縮的位流進(jìn)行解碼,通過(1)按第二精度對(duì)所述經(jīng)壓縮位流進(jìn)行去量化,以產(chǎn)生經(jīng)去量化的輸出;(2)在經(jīng)去量化輸出上按第二精度施加反離散余弦變換,以產(chǎn)生經(jīng)解壓縮輸出;(3)按第二精度從經(jīng)解壓縮的輸出產(chǎn)生圖象幀。
31.如權(quán)利要求30所述的計(jì)算機(jī)程序,其特征在于,所述后繼編碼步長包括用于使計(jì)算機(jī)施加反離散余弦變換數(shù)值算法的指令,其中,用于使計(jì)算機(jī)對(duì)經(jīng)壓縮位流進(jìn)行解碼的指令包括使計(jì)算機(jī)在經(jīng)量化的輸出上施加匹配反離散余弦變換數(shù)值算法的指令。
32.如權(quán)利要求31所述的計(jì)算機(jī)程序,其特征在于,進(jìn)一步包括用于使計(jì)算機(jī)按第二精度產(chǎn)生P幀的指令。
33.如權(quán)利要求31所述的計(jì)算機(jī)程序,其特征在于,進(jìn)一步包括用于使計(jì)算機(jī)按第二精度產(chǎn)生B幀的指令。
34.存儲(chǔ)在計(jì)算機(jī)可讀出媒體上的一種計(jì)算機(jī)程序,用于壓縮和解壓縮包括在第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列,所述計(jì)算機(jī)程序包括指令,用于使計(jì)算機(jī)(a)把所述幀序列變換成在第二顏色空間中按比第一精度高的第二精度的表示;(b)按第二精度執(zhí)行后繼的編碼步長,以產(chǎn)生經(jīng)壓縮的位流,包括施加反離散余弦變換數(shù)值算法;以及(c)按第二精度對(duì)所述經(jīng)壓縮位流執(zhí)行后繼的解碼步長,包括施加匹配反離散余弦變換數(shù)值算法。
35.存儲(chǔ)在計(jì)算機(jī)可讀出媒體上的一種計(jì)算機(jī)程序,用于在把包括幀序列的數(shù)字化視頻圖象序列壓縮成包括I幀的經(jīng)壓縮的位流期間增加平均壓縮比,所述計(jì)算機(jī)程序包括使計(jì)算機(jī)通過施加與后繼的解碼過程期間施加的反離散余弦變換數(shù)值算法匹配的反離散余弦變換數(shù)值算法而對(duì)幀序列進(jìn)行編碼,從而產(chǎn)生在I幀之間具有增加空間的經(jīng)壓縮位流。
36.如權(quán)利要求35所述的計(jì)算機(jī)程序,其特征在于,進(jìn)一步包括用于使計(jì)算機(jī)對(duì)經(jīng)壓縮位流進(jìn)行解碼的指令,包括使計(jì)算機(jī)施加與編碼期間施加的反離散余弦變換數(shù)值算法匹配的反離散余弦變換數(shù)值算法的指令。
37.存儲(chǔ)在計(jì)算機(jī)可讀出媒體上的一種計(jì)算機(jī)程序,用于壓縮具有寬動(dòng)態(tài)范圍或?qū)拰?duì)比度范圍中的至少一個(gè)范圍的數(shù)字化視頻圖象序列,所述視頻圖象包括按第一精度表示的幀,每個(gè)幀包括多個(gè)定義區(qū)域的宏模塊,所述計(jì)算機(jī)程序包括指令,用于使計(jì)算機(jī)(a)確定量化參數(shù),QP,所述量化參數(shù)具有表示可能值的直接對(duì)應(yīng)或表示可能值的擴(kuò)展范圍的代碼;(b)確定每個(gè)幀的每個(gè)宏模塊的QP值;(c)按比第一精度高的第二精度對(duì)每個(gè)幀進(jìn)行壓縮以產(chǎn)生經(jīng)壓縮的幀,這種壓縮包括施加為這種幀的確定的QP值以減少對(duì)這種幀進(jìn)行編碼所需要的位數(shù);(d)使QP代碼與壓縮期間使用的確定QP值相關(guān)聯(lián);以及(e)輸出每個(gè)經(jīng)壓縮幀以及相關(guān)聯(lián)的QP代碼。
38.如權(quán)利要求37所述的計(jì)算機(jī)程序,其特征在于,進(jìn)一步包括用于使計(jì)算機(jī)通過增加表示QP代碼的位數(shù)而直接擴(kuò)展可能QP值的范圍的指令。
39.如權(quán)利要求37所述的計(jì)算機(jī)程序,其特征在于,進(jìn)一步包括用于使計(jì)算機(jī)通過把QP代碼映射到可能QP值的較寬范圍而有效地?cái)U(kuò)展可能QP值的范圍的指令。
40.如權(quán)利要求37所述的計(jì)算機(jī)程序,其特征在于,確定每個(gè)幀的每個(gè)宏模塊的QP值是基于相對(duì)于一個(gè)或多個(gè)幀的區(qū)域性信息。
41.如權(quán)利要求40所述的計(jì)算機(jī)程序,其特征在于,所述區(qū)域性信息包括每個(gè)幀中的局部圖象區(qū)域?qū)Ρ榷取?br> 42.如權(quán)利要求40所述的計(jì)算機(jī)程序,其特征在于,所述區(qū)域性信息包括每個(gè)幀中的局部動(dòng)態(tài)范圍。
43.如權(quán)利要求40所述的計(jì)算機(jī)程序,其特征在于,所述區(qū)域性信息包括每個(gè)幀中的局部細(xì)節(jié)幅度。
44.如權(quán)利要求40所述的計(jì)算機(jī)程序,其特征在于,所述區(qū)域性信息包括一個(gè)或多個(gè)順序幀之間的局部運(yùn)動(dòng)。
45.如權(quán)利要求37所述的計(jì)算機(jī)程序,其特征在于,確定每個(gè)幀的每個(gè)宏模塊的QP值是基于在壓縮步長期間產(chǎn)生的信息。
46.如權(quán)利要求45所述的計(jì)算機(jī)程序,其特征在于,在壓縮步長期間產(chǎn)生的所述信息包括每個(gè)宏模塊的離散余弦變換系數(shù)的相對(duì)幅度。
47.如權(quán)利要求45所述的計(jì)算機(jī)程序,其特征在于,在壓縮步長期間產(chǎn)生的所述信息包括對(duì)于幀區(qū)域中的每個(gè)宏模塊進(jìn)行編碼所分配的恒定位數(shù)。
48.如權(quán)利要求47所述的計(jì)算機(jī)程序,其特征在于,進(jìn)一步包括指令,使計(jì)算機(jī)(a)對(duì)于每個(gè)經(jīng)壓縮的幀,重新確定與這種經(jīng)壓縮的幀相關(guān)聯(lián)的每個(gè)QP代碼的QP值;以及(b)按第二精度對(duì)每個(gè)經(jīng)壓縮的幀進(jìn)行解壓縮,以產(chǎn)生具有寬動(dòng)態(tài)范圍或?qū)拰?duì)比度范圍中的至少一個(gè)范圍的經(jīng)解壓縮的幀,這種解壓縮包括施加對(duì)這種幀的重新確定的QP值。
49.一種系統(tǒng),用于壓縮包括在第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列,所述系統(tǒng)包括(a)一種手段,用于把所述幀序列變換成在第二顏色空間中按比第一精度高的第二精度的表示;以及(b)一種手段,用于按第二精度執(zhí)行后繼的編碼步長,以產(chǎn)生經(jīng)壓縮的輸出。
50.一種系統(tǒng),用于壓縮包括在第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列,所述系統(tǒng)包括(a)一種手段,用于把所述幀序列變換成在第二顏色空間中按比第一精度高的第二精度的表示;(b)一種手段,用于按第二精度在幀序列上執(zhí)行運(yùn)動(dòng)補(bǔ)償離散余弦變換,以產(chǎn)生第一編碼輸出;(c)一種手段,用于按第二精度對(duì)第一編碼輸出進(jìn)行量化,以產(chǎn)生經(jīng)量化輸出;以及(d)一種手段,用于在經(jīng)量化輸出上按第二精度執(zhí)行反離散余弦變換,以產(chǎn)生按第二精度的經(jīng)壓縮輸出。
51.一種系統(tǒng),用于對(duì)包括在第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列進(jìn)行壓縮和解壓縮,所述系統(tǒng)包括按比第一精度高的第二精度對(duì)幀序列進(jìn)行編碼,以產(chǎn)生經(jīng)壓縮位流。
52.如權(quán)利要求51所述的系統(tǒng),其特征在于,進(jìn)一步包括一種手段,用于按第二精度對(duì)所述經(jīng)壓縮位流進(jìn)行解碼。
53.如權(quán)利要求51所述的系統(tǒng),其特征在于,用于對(duì)幀序列編碼的手段包括把幀序列變換成第二顏色空間中按第二精度的表示的手段。
54.一種系統(tǒng),用于壓縮和解壓縮包括在第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列,所述系統(tǒng)包括(a)一種手段,用于把所述幀序列變換成在第二顏色空間中按比第一精度高的第二精度的表示;(b)一種手段,用于按第二精度執(zhí)行后繼的編碼步長,以產(chǎn)生經(jīng)壓縮的位流;以及(c)一種手段,用于對(duì)經(jīng)壓縮的位流進(jìn)行解碼,通過(1)按第二精度對(duì)所述經(jīng)壓縮位流進(jìn)行去量化,以產(chǎn)生經(jīng)去量化的輸出;(2)在經(jīng)去量化輸出上按第二精度施加反離散余弦變換,以產(chǎn)生經(jīng)解壓縮輸出;(3)按第二精度從經(jīng)解壓縮輸出產(chǎn)生圖象幀。
55.如權(quán)利要求54所述的系統(tǒng),其特征在于,用于執(zhí)行所述后繼編碼步長的手段包括用于施加反離散余弦變換數(shù)值算法的手段,其中,用于對(duì)經(jīng)壓縮位流進(jìn)行解碼的手段包括在經(jīng)量化的輸出上施加匹配反離散余弦變換數(shù)值算法的手段。
56.如權(quán)利要求54所述的系統(tǒng),其特征在于,進(jìn)一步包括用于按第二精度產(chǎn)生P幀的手段。
57.如權(quán)利要求54所述的系統(tǒng),其特征在于,進(jìn)一步包括用于按第二精度產(chǎn)生B幀的手段。
58.一種系統(tǒng),用于對(duì)包括第一顏色空間中按第一精度表示的幀序列的數(shù)字化視頻圖象序列進(jìn)行壓縮和解壓縮,所述系統(tǒng)包括(a)一種手段,用于把幀序列變換成第二顏色空間中按比第一精度高的第二精度的表示;(b)一種手段,用于按第二精度執(zhí)行后繼的編碼步長以產(chǎn)生經(jīng)壓縮位流,包括施加反離散余弦變換數(shù)值算法;以及(c)一種手段,用于按第二精度在經(jīng)壓縮位流上執(zhí)行后繼的解碼步長,包括施加匹配反離散余弦變換數(shù)值算法。
59.一種系統(tǒng),用于在把包括幀序列的數(shù)字化視頻圖象的序列壓縮成包括I幀的經(jīng)壓縮的位流的期間增加平均壓縮比,所述系統(tǒng)包括一種手段,用于通過施加與后繼的解碼過程期間施加的反離散余弦變換數(shù)值算法匹配的反離散余弦變換數(shù)值算法對(duì)幀序列進(jìn)行編碼,從而產(chǎn)生在I幀之間具有增加空間的經(jīng)壓縮位流。
60.如權(quán)利要求51所述的系統(tǒng),其特征在于,進(jìn)一步包括用于對(duì)所述經(jīng)壓縮位流進(jìn)行解碼的手段,包括一種手段,用于施加與編碼期間施加的反離散余弦變換數(shù)值算法匹配的反離散余弦變換數(shù)值算法。
61.一種系統(tǒng),用于對(duì)具有寬動(dòng)態(tài)范圍或?qū)拰?duì)比度范圍中至少一種范圍的數(shù)字化視頻圖象序列進(jìn)行壓縮,所述視頻圖象包括按第一精度表示的幀,每個(gè)幀包括多個(gè)定義區(qū)域的宏模塊,所述系統(tǒng)包括(a)一種手段,用于確定量化參數(shù),QP,所述量化參數(shù)具有表示可能值的直接對(duì)應(yīng)或表示可能值的擴(kuò)展范圍的代碼;(b)一種手段,用于確定每個(gè)幀的每個(gè)宏模塊的QP值;(c)一種手段,用于按比第一精度高的第二精度對(duì)每個(gè)幀進(jìn)行壓縮以產(chǎn)生經(jīng)壓縮的幀,包括一種手段,用于施加這種幀的確定的QP值以減少對(duì)這種幀進(jìn)行編碼所需要的位數(shù);(d)一種手段,用于使QP代碼與壓縮期間使用的確定QP值相關(guān)聯(lián);以及(e)一種手段,用于輸出每個(gè)經(jīng)壓縮幀以及相關(guān)聯(lián)的QP代碼。
62.如權(quán)利要求61所述的系統(tǒng),其特征在于,進(jìn)一步包括通過增加表示QP代碼的位數(shù)而直接擴(kuò)展可能QP值的范圍的手段。
63.如權(quán)利要求61所述的系統(tǒng),其特征在于,進(jìn)一步包括通過把QP代碼映射到可能QP值的較寬范圍而有效地?cái)U(kuò)展可能QP值的范圍的手段。
64.如權(quán)利要求61所述的系統(tǒng),其特征在于,確定每個(gè)幀的每個(gè)宏模塊的QP值的手段包括一種手段,用于使這種確定基于相對(duì)于一個(gè)或多個(gè)幀的區(qū)域性信息。
65.如權(quán)利要求64所述的系統(tǒng),其特征在于,所述區(qū)域性信息包括每個(gè)幀中的局部圖象區(qū)域?qū)Ρ榷取?br> 66.如權(quán)利要求64所述的系統(tǒng),其特征在于,所述區(qū)域性信息包括每個(gè)幀中的局部動(dòng)態(tài)范圍。
67.如權(quán)利要求64所述的系統(tǒng),其特征在于,所述區(qū)域性信息包括每個(gè)幀中的局部細(xì)節(jié)幅度。
68.如權(quán)利要求64所述的系統(tǒng),其特征在于,所述區(qū)域性信息包括一個(gè)或多個(gè)順序幀之間的局部運(yùn)動(dòng)。
69.如權(quán)利要求61所述的系統(tǒng),其特征在于,確定每個(gè)幀的每個(gè)宏模塊的QP值的手段包括一種手段,用于使這種確定基于在壓縮步長期間產(chǎn)生的信息。
70.如權(quán)利要求69所述的系統(tǒng),其特征在于,壓縮手段產(chǎn)生的所述信息包括每個(gè)宏模塊的離散余弦變換系數(shù)的相對(duì)幅度。
71.如權(quán)利要求69所述的系統(tǒng),其特征在于,壓縮手段產(chǎn)生的所述信息包括對(duì)于幀區(qū)域中的每個(gè)宏模塊進(jìn)行編碼所分配的對(duì)恒定的位數(shù)。
72.如權(quán)利要求61所述的系統(tǒng),其特征在于,進(jìn)一步包括(a)一種手段,用于對(duì)于與每個(gè)經(jīng)壓縮的幀相關(guān)聯(lián)的每個(gè)QP代碼重新確定QP值;以及(b)一種手段,用于按第二精度對(duì)每個(gè)經(jīng)壓縮的幀進(jìn)行解壓縮,以產(chǎn)生具有寬動(dòng)態(tài)范圍或?qū)拰?duì)比度范圍中的至少一個(gè)范圍的經(jīng)解壓縮的幀,這種解壓縮包括施加這種幀的重新確定的QP值。
全文摘要
用于提高視頻壓縮質(zhì)量的方法、系統(tǒng)和計(jì)算機(jī)程序。通過在中間編碼和解碼處理步驟期間保存較多數(shù)目的位,可以使來自MPEG型視頻編碼的圖象質(zhì)量提高。通過使解碼器的反離散余弦變換(IDCT)功能數(shù)值算法與編碼器的解碼部分所使用的IDCT功能數(shù)值算法確切匹配,可以消除反離散余弦變換失配的問題。還包括通過擴(kuò)展“量化參數(shù)”或“QP”的范圍而把高精度壓縮施加于寬動(dòng)態(tài)范圍圖象。通過直接增加QP的范圍或間接地通過非線性變換可以完成QP的擴(kuò)展。還包括把經(jīng)擴(kuò)展的中間處理精度和經(jīng)擴(kuò)展的QP范圍施加于圖象對(duì)比度降低的區(qū)域來擴(kuò)展精度,用該擴(kuò)展精度對(duì)低—對(duì)比度部分進(jìn)行壓縮編碼。
文檔編號(hào)H04N7/30GK1550108SQ02805857
公開日2004年11月24日 申請(qǐng)日期2002年3月1日 優(yōu)先權(quán)日2001年3月2日
發(fā)明者G·A·迪莫斯, G A 迪莫斯, D·魯霍夫, 舴 申請(qǐng)人:杜比實(shí)驗(yàn)室許可股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1