專利名稱:基于視覺注意模型的壓縮域敏感圖像識(shí)別方法
基于視覺注意模型的壓縮域敏感圖像識(shí)別方法技術(shù)領(lǐng)域
本發(fā)明以網(wǎng)絡(luò)中JPEG壓縮格式的敏感圖像為研究對(duì)象(本發(fā)明特指色情圖像), 運(yùn)用壓縮域圖像處理技術(shù),根據(jù)人眼注意視覺機(jī)制建立針對(duì)敏感圖像的視覺注意模型,重點(diǎn)分析圖像中的敏感(色情)區(qū)域,提取敏感區(qū)域內(nèi)的顏色、紋理、亮度和膚色特征,構(gòu)建描述敏感圖像內(nèi)容的視覺單詞庫,然后根據(jù)這些敏感視覺單詞在圖像中的分布情況,采用支持向量機(jī)的圖像識(shí)別方法進(jìn)行敏感圖像的識(shí)別與過濾,為網(wǎng)絡(luò)信息監(jiān)管領(lǐng)域提供基于人眼視覺注意的敏感圖像識(shí)別與過濾方法。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)成為了人們傳播和分享信息的重要媒介,但至今缺乏一個(gè)有效的機(jī)構(gòu)對(duì)這些信息進(jìn)行監(jiān)管,導(dǎo)致色情圖像不良信息大量傳播。受此影響, 互聯(lián)網(wǎng)色情信息服務(wù)產(chǎn)業(yè)得以快速發(fā)展,并已形成了一個(gè)巨大的產(chǎn)業(yè)鏈,其年利潤(rùn)遠(yuǎn)超過以下著名企業(yè)的總和微軟、谷歌、雅虎、蘋果和EarthLink。網(wǎng)絡(luò)中色情信息的大量傳播、 蔓延,極大地危害了社會(huì)穩(wěn)定和人們的身心健康,尤其影響了青少年的健康成長(zhǎng)。此外,許多色情網(wǎng)站在提供色情信息的同時(shí)還傳播病毒、木馬以及流氓軟件,從而竊取重要的私人信息,嚴(yán)重妨礙了人們的正常上網(wǎng)。因此,采取相關(guān)技術(shù)手段,遏制互聯(lián)網(wǎng)色情產(chǎn)業(yè)發(fā)展,嚴(yán)厲打擊從事非法色情服務(wù)的網(wǎng)站是一個(gè)需要重視的社會(huì)問題。
為了讓青少年遠(yuǎn)離敏感信息的侵?jǐn)_,方便家長(zhǎng)對(duì)子女網(wǎng)上沖浪進(jìn)行監(jiān)控,從上個(gè)世紀(jì)開始,陸續(xù)出現(xiàn)了很多家用反黃軟件,這些敏感信息過濾軟件的實(shí)現(xiàn)主要采用兩種技術(shù)一種是網(wǎng)址過濾和文本信息分析技術(shù);另一種則結(jié)合了基于圖像內(nèi)容分析的過濾技術(shù)。前一種技術(shù)不能適用于圖像識(shí)別,無法準(zhǔn)確地自動(dòng)過濾包含敏感信息的圖像。而后一種技術(shù)則利用圖像處理技術(shù)和模式識(shí)別的方法,提取描述圖像信息的視覺特征,檢測(cè)圖像中是否含有敏感信息,并取得了較好的效果。但是,這類方法也面臨著巨大的挑戰(zhàn),圖像是否包含色情信息是一種高層語義概念,具有不同教育程度、背景、經(jīng)歷的用戶有著不同的解釋,因而從它的定義上來說就不具有統(tǒng)一的標(biāo)準(zhǔn)。由于在不同的背景、光照條件下,色情圖像會(huì)表現(xiàn)出各種各樣的形式,因此很難找到一些穩(wěn)定的特征來準(zhǔn)確、完整地表征這類圖像, 這給敏感圖像的準(zhǔn)確識(shí)別帶來了很大的難度。另外,對(duì)于網(wǎng)絡(luò)環(huán)境來說,處理的實(shí)時(shí)性也是必須考慮的一個(gè)重要因素,識(shí)別算法自身的復(fù)雜程度過高所帶來的延時(shí)往往會(huì)造成網(wǎng)絡(luò)鏈接的中斷。
基于視覺單詞的敏感圖像識(shí)別與過濾技術(shù)是通過尋找圖像中局部突出的興趣點(diǎn), 并對(duì)這些興趣點(diǎn)建立旋轉(zhuǎn)、尺度、仿射不變的局部描述,從而建立視覺單詞庫,描述圖像的語義內(nèi)容,然后引入模式識(shí)別技術(shù)完成類別的判定。它為缺乏準(zhǔn)確描述圖像敏感信息的特征描述算子這一問題,提供了一種重要的解決思路。壓縮域圖像處理技術(shù)是充分利用圖像壓縮算法及其所形成壓縮數(shù)據(jù)的特點(diǎn),直接在盡量少解碼的壓縮數(shù)據(jù)上進(jìn)行圖像處理。與傳統(tǒng)的圖像壓縮與處理相互分離的方式不同,它省略了解壓縮和再壓縮的附加環(huán)節(jié),減少了圖像處理的數(shù)據(jù)量,有效地提高了圖像處理的速度。將上述兩種技術(shù)有機(jī)地結(jié)合在一起,并引入視覺注意模型在壓縮域檢測(cè)敏感區(qū)域,然后提取區(qū)域內(nèi)顏色、紋理、亮度和膚色特征作為視覺單詞,完成敏感圖像的識(shí)別與過濾,不但能提高系統(tǒng)的識(shí)別準(zhǔn)確率,而且可以滿足敏感圖像實(shí)時(shí)處理的要求,對(duì)網(wǎng)絡(luò)信息的監(jiān)管具有重要的研究意義發(fā)明內(nèi)容
本發(fā)明與已有的基于視覺單詞的敏感圖像識(shí)別方法不同,針對(duì)網(wǎng)絡(luò)上大部分以 JPEG壓縮格式存在的敏感圖像,引入壓縮域圖像處理技術(shù),并根據(jù)人眼視覺注意機(jī)制,建立視覺注意模型檢測(cè)符合人主觀感受的敏感區(qū)域,通過提取區(qū)域內(nèi)的顏色、紋理、亮度和膚色特征建立視覺單詞庫,完成敏感圖像的識(shí)別。這個(gè)方法主要分為兩大步驟視覺單詞庫構(gòu)建和敏感圖像識(shí)別。其中,視覺單詞庫構(gòu)建又可細(xì)分為四個(gè)步驟視覺注意模型建立,敏感區(qū)域檢測(cè),特征提取和聚類分析,整個(gè)流程如附圖
I所示。敏感圖像的識(shí)別則可細(xì)分為訓(xùn)練和測(cè)試兩個(gè)階段,其中訓(xùn)練階段分為五個(gè)步驟,視覺注意模型建立,敏感區(qū)域檢測(cè),特征提取,視覺單詞直方圖建立和支持向量機(jī)分類器建立。而測(cè)試階段也分為五個(gè)步驟,前四步與訓(xùn)練階段相同,最后一步則是利用訓(xùn)練階段建立的分類器對(duì)圖像進(jìn)行識(shí)別,敏感圖像識(shí)別流程如附圖2所示。
當(dāng)用戶輸入圖像進(jìn)行識(shí)別時(shí),首先檢測(cè)圖像的敏感區(qū)域,然后提取顏色、紋理、亮度和膚色特征,并根據(jù)視覺單詞庫構(gòu)建描述圖像內(nèi)容的視覺單詞直方圖,最后通過支持向量機(jī)分類器對(duì)圖像類別進(jìn)行判決,得到圖像識(shí)別結(jié)果。
本發(fā)明以網(wǎng)絡(luò)中JPEG壓縮格式的敏感圖像為研究對(duì)象(本發(fā)明特指色情圖像), 運(yùn)用壓縮域圖像處理技術(shù),根據(jù)人眼視覺注意機(jī)制建立針對(duì)敏感圖像的視覺注意模型,重點(diǎn)分析圖像中的敏感區(qū)域,分別提取區(qū)域內(nèi)顏色、紋理、亮度和膚色特征,構(gòu)建描述圖像內(nèi)容的視覺單詞庫,然后根據(jù)這些單詞在圖像中的分布情況,采用支持向量機(jī)的圖像識(shí)別方法進(jìn)行敏感圖像的識(shí)別與過濾,為網(wǎng)絡(luò)信息監(jiān)管領(lǐng)域提供基于人眼視覺注意的敏感圖像識(shí)別與過濾方法。
I.視覺單詞庫構(gòu)建
本發(fā)明從敏感圖像特點(diǎn)出發(fā),運(yùn)用壓縮域圖像處理技術(shù),根據(jù)人眼視覺注意機(jī)制, 建立視覺注意模型,檢測(cè)出敏感區(qū)域,然后提取敏感區(qū)域的顏色、紋理、亮度和膚色壓縮域特征,構(gòu)建視覺單詞庫。
I)視覺注意模型建立本發(fā)明首先尋找圖像中最容易引起注意的顯著部分,并用一幅灰度圖像表示顯著度,圖中越亮的地方即灰度值越大的區(qū)域越能引起人的注意。與大部分正常圖像相比,網(wǎng)絡(luò)中的敏感圖像往往包含大量裸露的膚色區(qū)域,通過分析這些區(qū)域, 能夠比較容易地得到暴露的人體性器官所在的位置,而這些圖像內(nèi)容恰恰是人們最為關(guān)注的。因此,對(duì)圖像進(jìn)行膚色檢測(cè),計(jì)算圖像的視覺顯著度,建立視覺注意模型。實(shí)際中,主要是利用壓縮域圖像處理技術(shù)進(jìn)行膚色檢測(cè)。利用從大量標(biāo)記的膚色和非膚色圖像塊中提取的顏色和紋理特征,建立決策樹模型,通過分析找到與膚色相關(guān)度最大的一組特征對(duì)應(yīng)的規(guī)則作為最終膚色模型。隨后,根據(jù)膚色判決規(guī)則計(jì)算膚色似然圖,該圖反映了原始圖像的膚色概率分布信息,圖中各點(diǎn)像素值越高膚色的可能性越大。接著,本發(fā)明采用公式(I)對(duì)膚色似然圖進(jìn)行閾值分割,將大于閾值的圖像像素點(diǎn)判定為膚色,反之為非膚色。然后,將膚色似然圖作為顏色關(guān)注圖,并從JPEG圖像的壓縮碼流中得到圖像的亮度信息計(jì)算亮度關(guān)注圖,然后分別進(jìn)行多尺度高斯濾波,計(jì)算中央周邊差,最后進(jìn)行歸一化合并和線性組合得到視覺顯著圖,整個(gè)計(jì)算過程如附圖3所示。視覺顯著圖是一幅灰度圖,圖中各點(diǎn)像素值反映了顯著度的大小,即人眼關(guān)注度的大小。
權(quán)利要求
1.基于視覺注意模型的壓縮域敏感圖像識(shí)別方法,其特征在于分為兩個(gè)步驟視覺單詞庫構(gòu)建和敏感圖像識(shí)別,其中,視覺單詞庫構(gòu)建又可細(xì)分為四個(gè)步驟視覺注意模型建立,敏感區(qū)域檢測(cè),特征提取和聚類分析;敏感圖像的識(shí)別則可細(xì)分為訓(xùn)練和測(cè)試兩個(gè)階段,其中訓(xùn)練階段分為五個(gè)步驟視覺注意模型建立,敏感區(qū)域檢測(cè),特征提取,視覺單詞直方圖建立和支持向量機(jī)分類器建立;而測(cè)試階段也分為五個(gè)步驟,前四步與訓(xùn)練階段相同, 最后一步則是利用訓(xùn)練階段建立的分類器對(duì)圖像進(jìn)行識(shí)別;當(dāng)用戶輸入圖像進(jìn)行識(shí)別時(shí),首先檢測(cè)圖像的敏感區(qū)域,然后提取顏色、紋理、亮度和膚色特征構(gòu)建視覺單詞庫,并根據(jù)視覺單詞庫構(gòu)建描述圖像內(nèi)容的視覺單詞直方圖,最后通過支持向量機(jī)分類器對(duì)圖像類別進(jìn)行判決,得到圖像識(shí)別結(jié)果;I).視覺單詞庫構(gòu)架從敏感圖像特點(diǎn)出發(fā),運(yùn)用壓縮域圖像處理技術(shù),根據(jù)人眼視覺注意機(jī)制,建立視覺注意模型,檢測(cè)出敏感區(qū)域,提取敏感區(qū)域的顏色、紋理、亮度和膚色壓縮域特征,構(gòu)建視覺單詞庫,具體步驟如下I. I視覺注意模型建立利用壓縮域圖像處理技術(shù)進(jìn)行膚色檢測(cè),利用從大量標(biāo)記的膚色和非膚色圖像塊中提取的顏色和紋理特征,建立決策樹模型,通過分析找到與膚色相關(guān)度最大的一組特征對(duì)應(yīng)的規(guī)則作為最終膚色模型;隨后,根據(jù)膚色判決規(guī)則計(jì)算膚色似然圖,該圖反映了原始圖像的膚色概率分布信息,圖中各點(diǎn)像素值越高膚色的可能性越大;接著,采用公式(I)對(duì)膚色似然圖進(jìn)行閾值分割,將大于閾值的圖像像素點(diǎn)判定為膚色,反之為非膚色;然后,將膚色似然圖作為顏色關(guān)注圖,并從JPEG圖像的壓縮碼流中得到圖像的亮度信息計(jì)算亮度關(guān)注圖,然后分別進(jìn)行多尺度高斯濾波,計(jì)算中央周邊差,最后進(jìn)行歸一化合并和線性組合得到視覺顯著圖,視覺顯著圖是一幅灰度圖,圖中各點(diǎn)像素值反映了顯著度的大小,即人眼關(guān)注度的大??;
全文摘要
基于視覺注意模型的壓縮域敏感圖像識(shí)別方法屬于圖像識(shí)別領(lǐng)域。本發(fā)明對(duì)現(xiàn)有的基于視覺單詞的敏感圖像識(shí)別方法進(jìn)行改進(jìn),根據(jù)人眼視覺注意機(jī)制,建立視覺注意模型,檢測(cè)出符合人主觀感受的敏感區(qū)域,然后提取相關(guān)特征,生成視覺單詞庫,從而有效地提高了視覺單詞的表征性,得到了能夠準(zhǔn)確描述圖像敏感信息的特征,進(jìn)而達(dá)到提高敏感圖像識(shí)別準(zhǔn)確率的目的。此外,本發(fā)明還引入了壓縮域圖像處理技術(shù),利用JPEG圖像壓縮數(shù)據(jù)的特點(diǎn),快速檢測(cè)圖像的敏感區(qū)域并提取其特征,有效地提高了視覺單詞庫構(gòu)建和圖像識(shí)別的速度。
文檔編號(hào)G06K9/66GK102938054SQ20121032883
公開日2013年2月20日 申請(qǐng)日期2012年9月6日 優(yōu)先權(quán)日2012年9月6日
發(fā)明者張菁, 隋磊, 卓力, 李振偉 申請(qǐng)人:北京工業(yè)大學(xué)