本發(fā)明涉及計算機信息技術領域,具體地涉及圖像壓縮領域。
背景技術:
現(xiàn)今是網(wǎng)絡信息時代,圖像信息利用網(wǎng)絡進行傳輸已經(jīng)逐漸占據(jù)主導地位,隨著使用者對圖像質量的要求越來越高,圖像的傳輸壓力越來越大,雖然在硬件方面不斷進行改進,但是也無法及時滿足使用者的需求,所以研究圖像的壓縮方法也是當今電子信息技術的一項重大課題。在壓縮過程中,為了實現(xiàn)更高的壓縮效率,我們常常采用有損壓縮方式,DCT變化(離散余弦變換)作為一種性能較高的編碼方法,能夠得到更高的壓縮比,但是圖像重建后,與原圖像誤差較大;所以本發(fā)明在DCT變換的基礎上,設計了高頻系數(shù)選擇機制、引入視覺感知修正量化手段,在不大量增加計算復雜度的情況下,實現(xiàn)高壓縮比、高效率,高還原性的圖像壓縮方法。
技術實現(xiàn)要素:
針對上述不足之處,本發(fā)明要解決的技術問題是現(xiàn)有技術下圖像壓縮后與原圖像誤差較大,且計算復雜度高從而導致壓縮時間長的問題。因此本發(fā)明提供一種基于DCT變換下的視覺感知修正圖像壓縮方法解決上述問題。
本發(fā)明所采用的技術方案是:一種基于DCT變換下的視覺感知修正圖像壓縮方法。該方案首先:將圖像經(jīng)過域空間變換,轉化為Ycrcb格式;然后將圖像分解成8*8大小的圖像子塊,對每一個圖像子塊進行DCT變化;在每一個子塊的DCT系數(shù)中,系數(shù)通過判定方法進行處理分解成高頻系數(shù)和低頻系數(shù),高頻系數(shù)采用誤差補償機制,低頻系數(shù)進行視覺感知修正變換;然后進入編碼程序;最后重構圖像,過程為壓縮過程的逆運算。
本發(fā)明的有益效果是:本發(fā)明較傳統(tǒng)的DCT變換,建立高頻系數(shù)修正和引入了人眼視覺特性,先根據(jù)方差大小和邊緣信息對變換系數(shù)進行自適應調整,保留低頻區(qū)域的部分系數(shù),然后按照閾值法再去除一些保留的低頻系數(shù),量化時在一定范圍內引起的圖像變換域頻譜系數(shù)的量化誤差不能為人眼所覺,圖像不僅獲得了更高的壓縮比,而且并未因為增加計算量而降低圖像的壓縮效率;同時,對重建后的圖像進行分析,圖像還原程度增加,信噪比增強,圖像的還原質量得到顯著提升。
附圖說明
圖1表示本發(fā)明的詳細流程圖
圖2表示圖像轉換到三基色空間的示例圖
圖3表示DCT變換后,能量集中于左上的示例圖
圖4表示解碼(解壓)示例圖
具體實施方式
本發(fā)明用于圖像的有損壓縮,首先圖像經(jīng)過域空間變換,轉化為Ycrcb格式,然后將圖像分解成8*8大小的圖像子塊,對每一個圖像子塊進行DCT變化,在每一個子塊的DCT系數(shù)中,系數(shù)通過判定方法進行處理分解成高頻系數(shù)和低頻系數(shù),高頻系數(shù)采用誤差補償機制,低頻系數(shù)進行視覺感知修正變換,然后在進入編碼;重構圖像的過程為壓縮過程的逆運算。
一種基于DCT變換下的視覺感知修正圖像壓縮方法,結合圖1,該發(fā)明的執(zhí)行步驟如下:
步驟一:圖像由RGB空間轉化為YCrCb三基色空間,分解為三幅(Y,Cr,Cb)能量圖;
步驟二:能量圖按照像素分割為8*8大小的圖像子塊;
步驟三:對每一個圖像子塊進行DCT變換;
步驟四:按照指定的DCT篩選方法,篩選DCT系數(shù),重構DCT系數(shù)矩陣;
步驟五:重構后的DCT系數(shù)矩陣,按照視覺感知修正方法進行量化處理;
步驟六:量化后的系數(shù)進行SPIHT編碼,輸出壓縮數(shù)據(jù);
步驟七:解碼(解壓),解碼過程為壓縮過程的逆運算,補全DCT系數(shù)再進行DT逆變換。
下面,結合圖1到圖4對本發(fā)明詳細描述。
一、圖像轉化和分解
由于RGB顏色空間在顯示時候受顯示設備的影響較大,所以在進行壓縮前將RGB圖像轉化到不受干擾的YCrCb色空間,然后在分解為3個基色分量對應的亮度圖,結合圖2示例圖,設圖像為F(x,y),則變化分解后記為FY(x,y)、Fcr(x,y)、Fcb(x,y),
YCrCb色空間的正變化為:
正變換(用于圖像壓縮過程):式(1)
逆變換(用于解碼過程):式(2)
二、DCT變化
圖像經(jīng)過域空間變換后,表示為三基色分量,F(xiàn)Y(x,y)、Fcr(x,y)、Fcb(x,y);由于對整幅圖像進行DCT變化的話,圖像誤差極大,所以先將每個基色圖分割為8*8大小的圖像子塊,圖像自子塊的大小影響圖像重構的質量。然后對每一個8*8的圖像子塊進行二維DCT變換,二維DCT解析式如下表示,以三基色中FY進行表述:
式(3)
式中,x,y,u,v=0,1,…,N-1。
由于圖像分割為8*8,所以式中N=8,所以
式(4)
式中,x,y,u,v=0,1,…,N-1。
圖像經(jīng)過DCT變換后得到的是一個DCT系數(shù)矩陣,由于圖像能量多集中于左上部分,即圖像的背景部分如圖3所示,所以在編碼過程中,左上部分的系數(shù)有較大價值。而右下部分的數(shù)據(jù)較小,與左上相比,趨于0,其表示的細節(jié)紋理部分,如果全部舍棄,則會造成圖像還原后細節(jié)部分失真過大,但是保留下來的話,又會造成數(shù)據(jù)冗余,不利于編碼,所以如何處理高頻區(qū)域的系數(shù)也是關系到壓縮和重建的重要因素。
三、DCT系數(shù)的分域和取舍
經(jīng)過DCT變換后,每一個8*8圖像子塊得到一個8*8的DCT變換系數(shù)矩陣,由于DCT變換將能量集中到了左上部分,系數(shù)值比較大。而其他的系數(shù)較小或者趨近于0,但是這些趨近于0的系數(shù)卻是用來體現(xiàn)圖像細節(jié)紋理的參數(shù),如果系數(shù)一并取0,雖然能得到很好的壓縮比,但是在重建的圖像中,失去了部分細節(jié)的描述,圖像還原質量不高,所以在系數(shù)取舍上,本發(fā)明制定以下篩選策略:
設D={d1,d2,···,dn}是8*8DCT變換后的系數(shù)集,Q={dj},設定一個參量u:
式(5)
按從左至右的順序掃描系數(shù),按以下方式判定:
如果abs(di)≥u,則di=dj進入低頻區(qū)域系數(shù)集合Q;(j,i≤n);
如果則di=0.75u=dj,dj進入低頻區(qū)域系數(shù)集合Q;(j,i≤n)
如果則di=0.5u=dj,dj進入低頻區(qū)域系數(shù)集合Q;(j,i≤n)
如果則di=0=dj,dj進入低頻區(qū)域系數(shù)集合Q;(j,i≤n)
經(jīng)過以上計算,DCT變換后的系數(shù)絕大部分被舍棄,只留下能被人眼感知的細節(jié)部分,極大的減少了編碼數(shù)據(jù)。此時圖像表示為F`Y(x,y)等價于{Qj}。
四、視覺感知修正
DCT系數(shù)經(jīng)過調整后得到{Qj},可以用來等價描述FY(x,y)變換后的圖像F`Y(x,y),{Qj}是描述DCT變換后低頻區(qū)域的系數(shù),圖像的主要信息集中在這里,
圖像的信噪比可描述為:
式(6)
均方誤差描述為:
式(7)
由式6結合式7,定義視覺修正感知系數(shù)為:
式(8)
其中Tx,Ty為對角矩陣,e為給定的系數(shù)分布向量,由式8可求得
所以,令(Txe,Tye)=T,在編碼前,DCT變換系數(shù)集{Qj},先乘以T,得到視覺感知修正后的DCT系數(shù)集TQ,再對TQ進行編碼。
五、編碼和解壓
對TQ編碼,采用SPIHT算法,對經(jīng)過處理的DCT系數(shù)矩陣進行編碼,輸出碼流。圖像的解壓過程為壓縮過程的逆過程,結合圖4解碼示例圖:首先讀取碼流,在碼流中消去視覺感知系數(shù)(Txe Tye),然后按照壓縮過程中系數(shù)的取舍式5逆運算重構DCT系數(shù),此時變換的系數(shù)就由新的系數(shù)所代替,空缺的位置由0補足,重構出三基色分量,F(xiàn)Y(x,y)、Fcr(x,y)、Fcb(x,y)的三個能量圖,再將三基色圖按照下式合成圖像F`(x,y)
上述結合附圖對本發(fā)明的實施例作了詳細描述,應該理解上述只是示例性的,因此,本發(fā)明的保護范圍應當由所附的權利要求書的內容確定。