專利名稱::一種對數字圖像jpeg壓縮的識別方法
技術領域:
:本發(fā)明屬于數字圖像的信息安全和信息取證領域。具體涉及到一種能快速、有效地判別給定圖像是否經過JPEG壓縮的方法。
背景技術:
:JPEG是一種應用廣泛的數字圖像格式,如各類數碼相機的輸出大多為JPEG格式,常用的圖像處理軟件(如Photoshop,GMP等)都支持JPEG壓縮處理。因此,研究這類圖像的統計特性有助于分析圖像的真?zhèn)涡?、完整性、來源性等圖像認證問題。然而,在某些情況下,數字圖像常會以BMP格式進行處理或保存。此時將無法從圖像的頭文件中得知其是否經過了JPEG壓縮?,F有的JPEG圖像識別技術主要是基于檢測JPEG圖像的分塊效應(BlockingArtifacts)。然而,這種方法的檢測效率往往依賴于圖像內容、圖像大小及壓縮時所采用的量化表。一般而言,對于紋理相對復雜、或面積小于32X32、又或是經過較高壓縮因子(如QF>95)壓縮后的圖像,其檢測效率較差。故而需要研發(fā)一種簡單有效的方法用于判別圖像是否經過JPEG壓縮處理,這對于某些隱寫分析算法、圖像篡改定位算法等都是十分關鍵的第一步。
發(fā)明內容本發(fā)明的目的在于針對現有JPEG圖像檢測算法的檢測效率不佳等缺陷,提供了一種簡單有效地對數字圖像JPEG壓縮的識別方法。為實現上述發(fā)明目的,采用的技術方案如下(1)將圖像進行分塊處理,并計算圖像中非飽和分塊的DCT系數;(2)統計步驟(l)AC系數在區(qū)域Ri=(-1,+1)及區(qū)域<formula>formulaseeoriginaldocumentpage3</formula>的個數,記為巧,r2;(3)以s=r2/ri作為圖像的特征,并以閾值T對該特征進行判別,若s小于等于閾值T,則判別為圖像經過了JPEG壓縮處理,否則判別圖像沒有經過JPEG壓縮處理。本發(fā)明主要分析了JPEG壓縮過程中的量化誤差、舍入誤差及截斷誤差的關系,以及這些誤差對AC系數直方圖的影響。通過大量的實驗統計得到如下結論對于原始的、沒有經過JPEG壓縮的圖像其AC系數會呈現以0為中心的廣義高斯分布;而經過JPEG壓縮后的圖像其系數在區(qū)域(-l,l)的數量會增多,在區(qū)域(-2,-l)U(+l,+2)上的系數則會明顯減少??梢岳碚撋献C明當量化步長大于等于2的時候,該結論是正確的。本發(fā)明正是基于該結論作為識別的依據。上述技術方案中,所述步驟(1)計算非飽和分塊的DCT系數的具體方法是首先將給定的大小為MXN的圖像無重疊地分解為8X8的小分塊,對于每一個分塊,判斷它內部是否存在數值為0或255的像素,若不存在則作為非飽和分塊,并計算該分塊的DCT系數。所述步驟(2)統計步驟(1)AC系數在區(qū)域I^及區(qū)域R2的個數的具體方法是將從步驟(1)中得到的DCT系數分類,對AC系數落在區(qū)域(-1,+1)及(-2,-1)U(+1,+2)分別進行統計得到其個數iViv所述步驟(3)計算圖像的特征s,并判別圖像是否經過JPEG壓縮的具體方法是將步驟(2)中得到的數值a和r2相除得到圖像特征s=r2/ri,并將該特征與預先訓練得到的閾值T做比較,s>T則認為圖像沒有經過JPEG壓縮,否則判別圖像之前經過了JPEG壓縮處理。其中,閾值T的選取方法具體如下首先選取一定數量的大小與待測圖像一致的無JPEG壓縮的原始圖像,并以壓縮因子QF對原始圖像進行JPEG壓縮得到JPEG圖像,然后采用步驟(1)和步驟(2)對原始圖像及JPEG圖像在區(qū)域I^和區(qū)域&中AC系數的個數iviV并分別計算每個圖像的特征s=iV^,最后利用極大似然估計方法對得到的所有圖像特征進行訓練,從中選取閾值T使得訓練集中數據的分類效果達到最優(yōu)。利用本發(fā)明能夠簡單有效地判別出給定的圖像是否經過了JPEG壓縮。與現有的基于檢測圖像分塊效應的方法相比,本發(fā)明方法的檢測效果有質的提高。圖1為本發(fā)明的流程示意圖;圖2為圖像無重復分塊示意圖;圖3為實施例采用的Lena測試圖像;圖4為無壓縮Lena圖像DCT系數在(1,1)頻率分量上的直方圖;圖5為Lena圖像以質量因子為85JPEG壓縮后其DCT系數在(1,1)頻率分量上的直方圖;圖6為5000幅大小為32X32圖像在不同JPEG壓縮情況下(質量因子分別為98,95和85)及無壓縮時特征s的分布示意圖;圖7為5000幅大小為32X32圖像在JPEG壓縮(質量因子在5098選取)前后特征s的直方圖;圖8為5000幅大小為32X32圖像在JPEG壓縮(質量因子在5098選取)前后分塊效應特征K的直方圖。具體實施例方式下面結合附圖對本發(fā)明作進一步說明。本發(fā)明的流程圖如附圖l所示,包括步驟(l)計算圖像非飽和分塊的DCT系數;(2)統計AC系數在區(qū)域I^=(-1,+1)和區(qū)域r2=(-2,-1)U(+1,+2)的個數;(3)計算圖像特征并判別圖像是否經過JPEG壓縮。每個步驟具體如下步驟(1)、計算非飽和分塊的DCT系數假設待測的圖像為I,其大小為MXN。如附圖2所示,首先將I分解為無重疊區(qū)域的BzXBz(設定Bz=8)圖像塊,記為Blk(j),j=1,2,..[M/Bz][N/Bz]。對每一個圖像小分塊Blk(j),判斷塊中是否存在0和255的像素,若存在則處理下一個圖像分塊,否則計算該分塊的DCT系數。步驟(2)、統計AC系數在區(qū)域&=(-1,+1)和區(qū)域R2=(-2,_1)U(+1,+2)的個數,具體為統計步驟(1)得到的DCT系數,分別記錄落在區(qū)域&及區(qū)域R2的AC系數個數ri,r2。步驟(3)計算圖像特征并判別圖像是否經過JPEG壓縮,本發(fā)明的圖像特征為s=iV巧,根據該特征與一個訓練得到的閾值T進行比較,當s《T時,判別圖像I為經過JPEG壓縮后的圖像。其中閾值選取的方式如下隨機選取大量原始的沒有經過JPEG壓縮的圖像,要求其大小于待測圖像一致。然后對圖像進行JPEG壓縮,其質量因子可設為固定值或根據實際情況在考察區(qū)域里隨機選取。分別抽取所有原始圖像及JPEG圖像的圖像特征s,利用極大似然估計方法對這些圖像特征進行訓練,確定閾值T使得訓練集中數據的分類效果達到最優(yōu)。下面通過具體的測試例子對本發(fā)明做進一步的說明。測試l:附圖3是無壓縮的Lena圖像,圖4是其DCT系數在(l,l)頻率分量上的直方圖;附圖5是圖像經過質量因子為85的JPEG壓縮后圖像在對應位置上的直方圖??梢悦黠@看到經過JPEG后的圖像其系數在區(qū)域(-l,l)的數量會增多,而在區(qū)域(-2,-l)U(+1,+2)上的系數會減少。測試2:附圖6所示的是5000幅大小為32X32圖像在不同壓縮情況下(質量因子分別為98,95和85)及無壓縮時圖像特征s分布情況,可以看出即使經過較輕微的壓縮,如質量因子大于95,本發(fā)明的特征仍然有較好的區(qū)分能力。測試3:附圖7所示為5000幅大小為32X32圖像在JPEG壓縮(質量因子在5098選取)前后特征r的直方圖;附圖8所示為5000幅大小為32X32圖像壓縮(質量因子在5098選取)前后分塊效應特征K的直方圖??梢钥吹嚼帽景l(fā)明特征能有較好的區(qū)分能力。測試4:從5個不同圖像庫中各隨機地挑選1000幅無經過JPEG壓縮的原始圖像,從中剪切出大小不同的分塊作測試,分別為8X8,16X16,32X32,64X64和128X128。對于不同大小的圖像庫,分別進行JPEG壓縮得到對應的JPEG圖像庫。然后分別提取原始圖像及其JPEG圖像的特征s,并隨機將這些圖像特征分為兩組,一組作為訓練集,另外一組作為測試集。利用極大似然估計算法對訓練集中的圖像特征做訓練得到最優(yōu)的T,該閾值T對測試集中的圖像進行分類,如此重復10次計算平均檢測結果。根據質量因子的選取不同,本發(fā)明與現有的基于分塊效應檢測算法做了如下的對比測試質量因子為98,95,85,75和50,利用本發(fā)明與現有方法相比,在不同大小圖像庫下的平均檢測結果如下表所示(%):<table>tableseeoriginaldocumentpage6</column></row><table>質量因子在區(qū)域[50,98]中隨機選取,利用本發(fā)明與現有方法相比,在不同大小圖像庫下的平均檢測結果如下表所示(%):<table>tableseeoriginaldocumentpage6</column></row><table>從以上的對比數據可以明顯看到本發(fā)明在絕大多數情況下的檢測效果均優(yōu)于現有的基于檢測分塊效應的方法。即使圖像大小為8X8,壓縮因子大于95仍能準確檢測出來JPEG圖像。權利要求一種對數字圖像JPEG壓縮的識別方法,其特征在于包括如下步驟(1)將圖像進行分塊處理,并計算圖像中非飽和分塊的DCT系數;(2)統計步驟(1)AC系數在區(qū)域R1=(-1,+1)及區(qū)域R2=(-2,-1)∪(+1,+2)的個數,記為r1,r2;(3)以s=r2/r1作為圖像的特征,并以閾值T對該特征進行判別,若s小于等于閾值T,則判別為圖像經過了JPEG壓縮處理,否則判別圖像沒有經過JPEG壓縮處理。2.根據權利要求l所述的對數字圖像JPEG壓縮的識別方法,其特征在于所述步驟(1)中對圖像進行分塊處理的方法為把圖像無重復地分解為8x8大小的塊。3.根據權利要求1或2所述的對數字圖像JPEG壓縮的識別方法,其特征在于所述非飽和分塊為不存在取值為0和255的像素的分塊。4.根據權利要求l所述的對數字圖像JPEG壓縮的識別方法,其特征在于所述步驟(3)中閾值T的確定方法為首先選取一定數量的大小與待測圖像一致的無JPEG壓縮的原始圖像,并以壓縮因子QF對原始圖像進行JPEG壓縮得到相應的JPEG圖像,然后采用步驟(1)和步驟(2)計算出所有原始圖像及JPEG圖像在區(qū)域&,R2中AC系數的個數巧,r2,并分別計算出每個圖像的特征s=iv^,最后利用極大似然估計方法對這些圖像特征進行訓練,得到閾值T使得這些圖像特征分類效果達到最優(yōu)。全文摘要本發(fā)明提供一種對數字圖像JPEG壓縮的識別方法,包括步驟(1)將圖像進行分塊處理,并計算圖像中非飽和分塊的DCT系數;(2)統計步驟(1)AC系數在區(qū)域R1=(-1,+1)及區(qū)域R2=(-2,-1)∪(+1,+2)的個數,記為r1,r2;(3)以s=r2/r1作為圖像的特征,并以閾值T對該特征進行判別,若s小于等于閾值T,則判別為圖像經過了JPEG壓縮處理,否則判別圖像沒有經過JPEG壓縮處理。利用本發(fā)明能夠快速、有效識別出圖像之前是否經過了JPEG壓縮。與現有方法相比,本發(fā)明的識別效率有質的提高,能有效判別出小至8×8大小的圖像塊及壓縮因子高于95的JPEG圖像。文檔編號H04N7/26GK101710989SQ200910193718公開日2010年5月19日申請日期2009年11月6日優(yōu)先權日2009年11月6日發(fā)明者駱偉祺,黃繼武申請人:中山大學