亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

色情圖像識別方法和裝置制造方法

文檔序號:6505542閱讀:233來源:國知局
色情圖像識別方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種色情圖像識別方法,所述方法包括:獲取待識別圖像;查找預(yù)先存儲的人體敏感部位索引中與所述待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù);根據(jù)所述匹配的特征數(shù)據(jù)計算所述待識別圖像對應(yīng)的置信度;根據(jù)所述待識別圖像對應(yīng)的置信度判斷所述待識別圖像是否為色情圖像。本發(fā)明提供的色情圖像識別方法,通過檢索的方式判斷待識別圖像是否為色情圖像,對含有人體敏感部位的待識別圖片有很高的識別度,可以有效降低色情圖像的誤檢率。本發(fā)明還提供了一種色情圖像識別裝置。
【專利說明】色情圖像識別方法和裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像【技術(shù)領(lǐng)域】,特別是涉及一種色情圖像識別方法和裝置。

【背景技術(shù)】
[0002]現(xiàn)代通信技術(shù)的發(fā)展,方便了人們的交流溝通,但也使得色情圖像的傳播越來越容易。傳統(tǒng)的識別色情圖像的方法,是通過檢測圖中是否含有皮膚顏色較大的區(qū)域,以及使用膚色區(qū)域的幾何特性(面積、在當前圖像中的面積占比、外接矩形的高寬比等)來判斷當前圖像是否為色情圖像。
[0003]發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題:
[0004]人體的膚色并不是一個顯著的、區(qū)分性很強的特征,自然界以及人工制品中存在大量與人體的膚色顏色相似的物體,而且由于光照、衣服、姿勢等原因,膚色區(qū)域所呈現(xiàn)的幾何特性的聚合性也不好,導致利用膚色區(qū)域識別色情圖像誤檢率比較高。


【發(fā)明內(nèi)容】

[0005]基于此,有必要針對上述利用膚色區(qū)域識別色情圖像誤檢率高的問題,提供一種色情圖像識別方法和裝置。
[0006]一種色情圖像識別方法,所述方法包括:
[0007]獲取待識別圖像;
[0008]查找預(yù)先存儲的人體敏感部位索引中與所述待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù);
[0009]根據(jù)所述匹配的特征數(shù)據(jù)計算所述待識別圖像對應(yīng)的置信度;
[0010]根據(jù)所述待識別圖像對應(yīng)的置信度判斷所述待識別圖像是否為色情圖像。
[0011]一種色情圖像識別裝置,所述裝置包括:
[0012]圖像獲取模塊,用于獲取待識別圖像;
[0013]索引查找模塊,用于查找預(yù)先存儲的人體敏感部位索引中與所述待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù);
[0014]置信度計算模塊,用于根據(jù)所述匹配的特征數(shù)據(jù)計算所述待識別圖像對應(yīng)的置信度;
[0015]判斷模塊,用于根據(jù)所述待識別圖像對應(yīng)的置信度判斷所述待識別圖像是否為色情圖像。
[0016]上述色情圖像識別方法和裝置,通過從人體敏感部位索引查找與待識別圖像匹配的人體敏感圖片對應(yīng)的特征數(shù)據(jù),計算待識別圖像對應(yīng)的置信度,并根據(jù)待識別圖像對應(yīng)的置信度判斷待識別圖像是否為色情圖像。通過檢索的方式判斷待識別圖像是否為色情圖像,對含有人體敏感部位的待識別圖片有很高的識別度,可以有效降低色情圖像的誤檢率。

【專利附圖】

【附圖說明】
[0017]圖1為一個實施例中色情圖像識別方法的流程示意圖;
[0018]圖2為一個實施例中生成檢索樹的流程示意圖;
[0019]圖3為一個實施例中檢索樹的結(jié)構(gòu)示意圖;
[0020]圖4為一個實施例中查找檢索樹中與待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)的流程示意圖;
[0021]圖5為另一個實施例中色情圖像識別方法的流程示意圖;
[0022]圖6為一個實施例中色情圖像識別裝置的結(jié)構(gòu)框圖;
[0023]圖7為另一個實施例中色情圖像識別裝置的結(jié)構(gòu)框圖;
[0024]圖8為一個實施例中索引查找模塊的結(jié)構(gòu)框圖;
[0025]圖9為另一個實施例中索引查找模塊的結(jié)構(gòu)框圖;
[0026]圖10為一個實施例中置信度計算模塊的結(jié)構(gòu)框圖;
[0027]圖11為一個實施例中色情圖像識別終端的結(jié)構(gòu)框圖。

【具體實施方式】
[0028]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。應(yīng)當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0029]如圖1所示,在一個實施例中,提供了一種色情圖像識別方法,該方法可以應(yīng)用于服務(wù)器,該服務(wù)器包括但不限于各種計算機,包括個人計算機、大型計算機、超級計算機和計算機集群等;該方法還可以應(yīng)用于終端,該終端可以包括智能手機、平板電腦、個人數(shù)字助理、電子書閱讀器、MP3 (Moving Picture Experts Group Aud1 Layer III,動態(tài)影像專家壓縮標準音頻層面 3)或 MP4 (Moving Picture Experts Group Aud1 Layer IV,動態(tài)影像專家壓縮標準音頻層面4)播放器、P0S終端、車載電腦、膝上型便攜計算機和臺式計算機等等。該方法包括:
[0030]步驟102,獲取待識別圖像。
[0031 ] 待識別圖像可以是任意給定的圖像或從視頻中截取的圖像。
[0032]步驟104,查找預(yù)先存儲的人體敏感部位索引中與待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)。
[0033]人體敏感部位索引可以將人體敏感部位圖片的特征數(shù)據(jù)按一定方式有序地組織、存儲起來,方便查找。人體敏感部位圖片可以通過在色情圖片中標注出人體敏感部位并生成圖片而獲得。特征數(shù)據(jù)可以是向量特征,該向量特征可以是現(xiàn)有圖像識別方法中的任意特征,比如描述紋理、H0G(Histogram of Oriented Gradient,圖像梯度方向直方圖)或LBP(Local Binary Patterns,局部二值模式)等等。
[0034]可以通過提取待識別圖像的特征數(shù)據(jù),并計算待識別圖像的特征數(shù)據(jù)與人體敏感部位圖片的特征數(shù)據(jù)的距離,從而根據(jù)距離判斷待識別圖片與人體敏感部位圖片是否匹配。比如,可以使用歐氏距離來表示距離,如果待識別圖像的特征數(shù)據(jù)與其中一個人體敏感部位圖片的特征數(shù)據(jù)的歐氏距離最短,且該歐式距離小于歐式距離閾值,則待識別圖像與該人體敏感部位圖片是匹配的??梢岳斫獾氖?,還可以通過其他的相似性度量來判斷是否匹配,比如相關(guān)系數(shù)等,這里不一一列舉。
[0035]在一個實施例中,人體敏感部位索引為檢索樹,檢索樹包括對應(yīng)人體敏感部位圖片的特征數(shù)據(jù)的葉子節(jié)點和從葉子節(jié)點開始進行逐層合并后得到的節(jié)點。檢索樹可以包括一個或多個樹,多個樹具有相同的層數(shù),一個或多個樹的各層構(gòu)成檢索樹的各層。檢索樹的葉子節(jié)點與人體敏感部位圖片的特征--對應(yīng),檢索樹的各個非葉子節(jié)點可以通過合并該節(jié)點的子節(jié)點獲得,比如通過計算該節(jié)點的子節(jié)點的平均值獲得。
[0036]步驟106,根據(jù)匹配的特征數(shù)據(jù)計算待識別圖像對應(yīng)的置信度。
[0037]置信度用來衡量某種判斷與實際觀測結(jié)果之間匹配程度的函數(shù)。置信度越高,待識別圖像與人體敏感部位圖片的匹配程度越高。在一個實施例中,待識別圖像的特征數(shù)據(jù)與匹配的特征數(shù)據(jù)之間的歐式距離和置信度是負相關(guān)的關(guān)系,可以使用一個負相關(guān)的函數(shù)表示兩者之間的關(guān)系,比如c=e-X,其中X是待識別圖像的特征數(shù)據(jù)與匹配的特征數(shù)據(jù)之間的歐式距離,c是置信度。
[0038]步驟108,根據(jù)待識別圖像對應(yīng)的置信度判斷待識別圖像是否為色情圖像。
[0039]當置信度高于第一置信度閾值時,說明待識別圖像與匹配的人體敏感部位圖片的匹配程度很高,待識別圖像是色情圖像。
[0040]本實施例中,通過從人體敏感部位索引查找與待識別圖像匹配的人體敏感圖片對應(yīng)的特征數(shù)據(jù),計算待識別圖像對應(yīng)的置信度,并根據(jù)待識別圖像對應(yīng)的置信度判斷待識別圖像是否為色情圖像。通過檢索的方式判斷待識別圖像是否為色情圖像,對含有人體敏感部位的待識別圖片有很高的識別度,可以有效降低色情圖像的誤檢率。
[0041 ] 在一個實施例中,人體敏感部位索引記錄了檢索入口數(shù)據(jù)和人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)的映射關(guān)系;步驟104具體包括:從檢索入口數(shù)據(jù)開始,根據(jù)檢索入口數(shù)據(jù)和人體敏感部位圖片對應(yīng)的特征數(shù)據(jù)的映射關(guān)系,查找與待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)??梢酝ㄟ^一定算法(比如哈希算法、聚類算法等)建立檢索入口數(shù)據(jù)和人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)的映射關(guān)系,通過檢索入口數(shù)據(jù)查找比直接通過人體敏感部位圖片對應(yīng)的特征數(shù)據(jù)查找計算復雜度要低,可以提高檢索的效率。
[0042]在一個實施例中,人體敏感部位索引為哈希表,哈希表中包含哈希值,哈希值根據(jù)哈希函數(shù)計算獲得。哈希(Hash)函數(shù)可以把任意長度的輸入變換成固定長度的哈希值,哈希值可以理解為一塊連續(xù)存儲空間的單元地址。本實施例中,將人體敏感部位圖片對應(yīng)的特征數(shù)據(jù)代入哈希函數(shù)計算,得到對應(yīng)的哈希值,并將該哈希值對應(yīng)的特征數(shù)據(jù)存儲到該哈希值對應(yīng)的存儲單元,從而生成哈希表。哈希表中的哈希值即是入口數(shù)據(jù),與人體敏感圖片對應(yīng)的特征數(shù)據(jù)形成映射關(guān)系。查找時,提取待識別圖像的特征數(shù)據(jù)并代入哈希函數(shù)計算,獲得待識別圖像對應(yīng)的哈希運算結(jié)果,從哈希表中查找與該哈希運算結(jié)果匹配的目標哈希值(可以用某種距離(比如漢明碼距離等)來衡量兩個哈希值是否匹配,當該距離小于哈希閾值時,說明兩個哈希值是匹配的;還可以通過計算兩個哈希值的誤碼個數(shù)來判斷是否匹配),獲取與該目標哈希值對應(yīng)的存儲單元中存儲的特征數(shù)據(jù),作為與待識別圖像匹配的人體敏感部位圖片對應(yīng)的特征數(shù)據(jù)。本實施例中通過哈希表查找與待識別圖像匹配的人體敏感部位圖片所對應(yīng)的的特征數(shù)據(jù),可以降低計算復雜度,提高色情圖像的識別效率。
[0043]如圖2所示,在一個實施例中,檢索樹可以通過以下步驟獲得:
[0044]步驟202,獲取包含人體敏感部位圖片的訓練集。
[0045]由于人的體態(tài)、拍攝角度或膚色等原因,人體敏感部位具有不同的形態(tài),因此訓練集中的人體敏感部位圖片數(shù)量越多,覆蓋的人體敏感部位的形態(tài)也越多,識別的結(jié)果也越準確,但會因此帶來更大的計算量,因此需要構(gòu)建檢索樹,降低計算復雜度。
[0046]步驟204,提取訓練集中的人體敏感部位圖片的特征數(shù)據(jù)。
[0047]圖片或圖像以像素為單位具有相當高的維數(shù),所以以像素為單位作為特征數(shù)據(jù)具有相當高的計算復雜度。另外由于光照、視角、噪聲等因素的干擾,對于表示同一人體敏感部位的不同圖像,像素的差別也很大。因此需要在圖片像素表示的基礎(chǔ)上,提取能夠表示人體敏感部位的一組低維向量作為判別與分析的標準,這一過程就是特指數(shù)據(jù)的提取過程,比如上文提到的描述紋理、HOG、LBP等特征數(shù)據(jù)的提取。
[0048]步驟206,將特征數(shù)據(jù)對應(yīng)葉子節(jié)點,從葉子節(jié)點開始,逐層對節(jié)點進行合并,構(gòu)成檢索樹。
[0049]本實施例中,逐層合并節(jié)點可以通過逐層聚類實現(xiàn)。具體的,首先將葉子節(jié)點進行聚類得到聚類簇,每個聚類簇包含至少一個葉子節(jié)點,計算聚類簇中的葉子節(jié)點所對應(yīng)的特征數(shù)據(jù)的平均值,這些平均值對應(yīng)檢索樹的倒數(shù)第二層中的節(jié)點;再從倒數(shù)第二層開始聚類,形成倒數(shù)第三層,重復執(zhí)行聚類的步驟,直到形成指定層數(shù)的檢索樹。其中,聚類可以通過系統(tǒng)聚類、層次聚類等多種聚類方法實現(xiàn),這里不做限制。
[0050]參考圖3,其為一個實施例中檢索樹的結(jié)構(gòu)示意圖。本實施例中,C31、C32、C33、C34、C35、C36、C37、C38和C39是該檢索樹的9個葉子節(jié)點,分別對應(yīng)9個人體敏感部位圖片的特征,9個葉子節(jié)點構(gòu)成檢索樹的第三層。對葉子節(jié)點進行聚類,使用歐氏距離作為聚類的標準,將C31、C32和C33聚為一類,C34和C35聚為一類,C36單獨為一類,C37、C38和C39聚為一類。C31、C32和C33對應(yīng)的特征數(shù)據(jù)的平均值對應(yīng)C21,C34和C35對應(yīng)的特征數(shù)據(jù)的平均值對應(yīng)C22,C23對應(yīng)C36,C37、C38和C39對應(yīng)的特征數(shù)據(jù)的平均值對應(yīng)C24,C21、C22、C23和C24構(gòu)成該檢索樹的第二層。接著,對第二層中的節(jié)點進行聚類,C21和C22聚為一類,C23和C24聚為一類,C21和C22對應(yīng)的特征數(shù)據(jù)的平均值對應(yīng)Cll,C23和C24對應(yīng)的特征數(shù)據(jù)的平均值對應(yīng)C12,C11和C12構(gòu)成該檢索樹的第一層,于是形成了 3層的檢索樹。需要說明的是,本實施例使用了 9個人體敏感部位圖片、3層的檢索樹只是用以說明檢索樹的生成過程,實際應(yīng)用中圖片的數(shù)量要遠超過9個,層數(shù)可以根據(jù)需要確定。
[0051]本實施例中,通過檢索樹可以快速查找到與待識別圖像匹配的人體敏感部位圖片對應(yīng)的特征,提高色情圖像的識別效率。
[0052]如圖4所示,在一個實施例中,步驟104包括:
[0053]步驟402,對待識別圖像進行窗口掃描,獲得多個窗口圖像。
[0054]由于色情圖像可以局部包含人體敏感部位的圖像,因此需要通過窗口掃描獲取多個窗口圖像,根據(jù)這些窗口圖像進而判斷待識別圖像是否為色情圖像。
[0055]在一個實施例中,可以使用尺寸固定的窗口對多個尺度下的待識別圖像進行掃描,獲得多個窗口圖像。具體的,可以使用一個尺寸固定的窗口,以預(yù)定步長、預(yù)定方向在待識別圖像中移動,進行掃描,掃描結(jié)束后,按照一定比例因子將待識別圖像縮小,重新用該尺寸固定的窗口進行掃描,直到當圖像縮小到無法進行窗口掃描(比如待識別圖像的高度小于窗口的高度,或待識別圖像的寬度小于窗口的寬度)時為止,從而獲得多個窗口圖像。窗口可以是矩形窗口,其尺寸可以根據(jù)實際需要而定。預(yù)定步長也可以根據(jù)實際需要而定,例如,該預(yù)定步長可以是一個或多個像素,還可以與當前窗口的尺寸成比例關(guān)系。預(yù)定方向可以是從左到右、從上到下的,還可以是從右到左、從下而上的,對此不作限制。
[0056]在另一個實施例中,可以使用多個尺度的窗口對待識別圖像進行掃描,獲得多個窗口圖像。具體的,可以先以一定尺寸的窗口在待識別圖像中掃描;掃描結(jié)束后,按照一定比例因子放大窗口尺寸,重新用放大的窗口對待識別圖像進行掃描,直到當窗口放大到無法進行窗口掃描時為止,從而獲得多個窗口圖像。
[0057]在一個實施例中,步驟402之后,還包括:對窗口圖像進行膚色識別,過濾掉非膚色窗口圖像。本實施例中,膚色識別可以通過膚色分類器對窗口圖像作出膚色圖像或非膚色圖像的分類判別。用一個簡單的膚色分類器舉例說明:預(yù)設(shè)膚色的顏色特征范圍,在該顏色特征范圍內(nèi)的顏色特征形成的區(qū)域為膚色區(qū)域。對于輸入該分類器的圖像,計算膚色區(qū)域的面積,如果該面積超過膚色區(qū)域閾值,則判定為膚色圖像;否則判定為非膚色圖像。提取窗口圖像的顏色特征,使用該膚色分類器進行判別,從而過濾掉非膚色的窗口圖像。本實施例中,通過對窗口圖像進行膚色識別,過濾掉非膚色窗口圖像,可以大大降低后續(xù)步驟的計算復雜度,提高色情圖像的識別效率。
[0058]步驟404,從檢索樹的第一層開始,逐層查找與窗口圖像匹配的節(jié)點,直到查找到與窗口圖像匹配的葉子節(jié)點。
[0059]如果查找到一個窗口圖像與一個葉子節(jié)點匹配,該葉子節(jié)點所對應(yīng)的特征數(shù)據(jù)就是檢索樹中與待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù),可以再通過執(zhí)行后續(xù)步驟判斷待識別圖像是否為色情圖像。
[0060]在一個實施例中,步驟404包括:從檢索樹的第一層開始,逐層查找與窗口圖像匹配的節(jié)點,其中當查找的節(jié)點為子節(jié)點時,只查找上一層中與窗口圖像匹配的節(jié)點的子節(jié)點。
[0061]舉例說明,參考圖3,提取窗口圖像的特征數(shù)據(jù),假設(shè)在檢索樹的第一層中,窗口圖像的特征數(shù)據(jù)與C11距離最短,那么在第二層中,只查找C11的子節(jié)點C21和C22 ;假設(shè)第二層中該窗口圖像的特征數(shù)據(jù)與C21的距離最短,那么在第三層中,只查找C21的子節(jié)點C31、C32和C33,而不再查找C22的子節(jié)點,直到查找到與窗口圖像匹配的葉子節(jié)點,比如C31。本實施例中,在逐層查找過程中,當查找的節(jié)點為子節(jié)點時,只查找上一層中與窗口圖像匹配的節(jié)點的子節(jié)點,可以降低計算復雜度,提高查找的效率。
[0062]本實施例中,通過窗口掃描獲取窗口圖像,再從檢索樹中查找與窗口圖像匹配的人體敏感部位圖片對應(yīng)的葉子節(jié)點,可以覆蓋待識別圖像中的各個局部細節(jié),進一步降低了誤檢率。
[0063]如圖5所示,在一個實施例中,提供了另一種色情圖像識別方法,該方法包括:
[0064]步驟502,獲取待識別圖像。
[0065]步驟504,使用尺寸固定的窗口對多個尺度下的待識別圖像進行掃描,獲得多個窗口圖像。
[0066]多尺度可以理解為不同比例尺,本實施例中,可以先以固定尺寸的窗口在待識別圖像中掃描;掃描結(jié)束后,按照一定的比例因子將待識別圖像縮小,重新用該窗口對縮小后的待識別圖像進行掃描,直到當圖像縮小到無法進行窗口掃描(比如待識別圖像的高度小于窗口的高度,或待識別圖像的寬度小于窗口的寬度)時為止。
[0067]在一個實施例中,步驟504之后,還包括:對窗口圖像進行膚色識別,過濾掉非膚色窗口圖像。
[0068]步驟506,從檢索樹的第一層開始,逐層查找與窗口圖像匹配的節(jié)點,直到查找到與窗口圖像匹配的葉子節(jié)點。
[0069]可以通過計算窗口圖像的特征數(shù)據(jù)與節(jié)點的距離判斷是否匹配。在一個實施例中,在檢索樹的每一層,如果窗口圖像的特征數(shù)據(jù)與各個節(jié)點的距離都高于某一預(yù)設(shè)的閾值,那么判定該窗口圖像與該層所有節(jié)點不匹配,可以停止在檢索樹中查找與該窗口圖像匹配節(jié)點的過程,繼續(xù)處理下一個窗口圖像,這樣可以進一步提高查找的效率。
[0070]步驟508,根據(jù)與窗口圖像匹配的葉子節(jié)點對應(yīng)的特征數(shù)據(jù),計算窗口圖像對應(yīng)的置信度。
[0071]本實施例中,如果窗口圖像對應(yīng)的置信度低于某一閾值,可以舍棄該窗口圖像,降低后續(xù)步驟的計算復雜度,提高識別的效率。
[0072]步驟510,將匹配相同葉子節(jié)點的窗口圖像調(diào)整為同一尺度,并將調(diào)整后的窗口圖像對應(yīng)到相同尺度下的待識別圖像中。
[0073]由于窗口圖像是通過固定尺寸的窗口對多尺度的待識別圖像進行掃描獲得的,因此窗口圖像可能不在同一尺度上,因此需要將匹配相同葉子節(jié)點的窗口圖像調(diào)整為同一尺度,比如調(diào)整為與待識別圖像相同的尺度。
[0074]進一步的,將調(diào)整后的窗口圖像對應(yīng)到與調(diào)整后的窗口圖像在相同尺度下的待識別圖像中,獲取窗口圖像在該相同尺度下的待識別圖像中的位置與尺寸。
[0075]步驟512,獲取相同尺度下的待識別圖像中位置相鄰、尺寸相差在指定范圍內(nèi)的調(diào)整后的窗口圖像對應(yīng)的置信度,根據(jù)獲取到的窗口圖像對應(yīng)的置信度計算待識別圖像對應(yīng)的置信度。
[0076]在掃描過程中由于各種原因(例如窗口圖像中的人體敏感部位圖像的尺寸大于窗口,或者窗口掃描的步長過小,或者該人體敏感部位圖像的位置恰好跨越窗口邊界),可能導致有多個窗口圖像與葉子節(jié)點匹配。因此需要獲取該相同尺度下的待識別圖像中位置相鄰(比如相差一個或多個像素)、尺寸相差在指定范圍內(nèi)(比如以像素為單位,矩形的邊長或面積相差一個或多個像素)的調(diào)整后的窗口圖像對應(yīng)的置信度,再根據(jù)獲取到的窗口圖像對應(yīng)的置信度計算待識別圖像對應(yīng)的置信度。比如可以計算各個調(diào)整后的窗口圖像對應(yīng)的置信度的平均值或和,作為待識別圖像對應(yīng)的置信度;或者可以將位置相鄰、尺寸相差在指定范圍內(nèi)的調(diào)整后的窗口圖像合并(比如取平均值),然后計算合并后的窗口圖像對應(yīng)的置信度作為待識別圖像的置信度,比如計算合并的窗口圖像的特征數(shù)據(jù)與匹配的特征數(shù)據(jù)之間的歐氏距離,將該歐式距離代入一個負相關(guān)的函數(shù)(比如c=e_x)獲得合并的窗口圖像對應(yīng)的置信度。
[0077]步驟514,根據(jù)待識別圖像對應(yīng)的置信度判斷待識別圖像是否為色情圖像。
[0078]具體地,如果待識別圖像對應(yīng)的置信度高于第二置信度閾值,可以判定該待識別圖像是色情圖像。
[0079]本實施例中,待識別圖像被識別為為色情圖像后,可確定待識別圖像為色情圖片,自動刪除該色情圖片。通過綜合多個匹配的窗口圖像的置信度計算待識別圖像的置信度,進一步降低了色情圖像識別的誤檢率,使得色情圖片的自動刪除成為可能。
[0080]如圖6所示,在一個實施例中,還提供了一種色情圖像識別裝置,該裝置包括:
[0081]圖像獲取模塊602,用于獲取待識別圖像。
[0082]索引查找模塊604,用于查找預(yù)先存儲的人體敏感部位索引中與待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)。
[0083]置信度計算模塊606,用于根據(jù)匹配的特征數(shù)據(jù)計算待識別圖像對應(yīng)的置信度。
[0084]判斷模塊608,用于根據(jù)待識別圖像對應(yīng)的置信度判斷待識別圖像是否為色情圖像。
[0085]在一個實施例中,人體敏感部位索引記錄了檢索入口數(shù)據(jù)和人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)的映射關(guān)系;索引查找模塊604還用于從檢索入口數(shù)據(jù)開始,根據(jù)檢索入口數(shù)據(jù)和人體敏感部位圖片對應(yīng)的特征數(shù)據(jù)的映射關(guān)系,查找與待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)。
[0086]在一個實施例中,人體敏感部位索引為哈希表,哈希表包括對人體敏感部位圖片的特征數(shù)據(jù)進行哈希運算后得到的哈希值;索引查找模塊604還用于對待識別圖像進行哈希運算,得到哈希運算結(jié)果;從哈希表中查找與哈希運算結(jié)果匹配的哈希值,根據(jù)哈希值獲取與待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)。
[0087]在一個實施例中,人體敏感部位索引為檢索樹;檢索樹包括對應(yīng)人體敏感部位圖片的特征數(shù)據(jù)的葉子節(jié)點和從葉子節(jié)點開始進行逐層合并后得到的節(jié)點。
[0088]如圖7所示,在一個實施例中,該裝置還包括:
[0089]訓練集獲取模塊612,用于獲取包含人體敏感部位圖片的訓練集。
[0090]特征提取模塊614,用于提取訓練集中的人體敏感部位圖片的特征數(shù)據(jù)。
[0091]檢索樹生成模塊616,用于將特征數(shù)據(jù)對應(yīng)葉子節(jié)點,從葉子節(jié)點開始,逐層對節(jié)點進行合并,構(gòu)成檢索樹。
[0092]如圖8所示,在一個實施例中,索引查找模塊604包括:
[0093]窗口掃描模塊604a,用于對待識別圖像進行窗口掃描,獲得多個窗口圖像。
[0094]在一個實施例中,窗口掃描模塊604a用于使用尺寸固定的窗口對多個尺度下的待識別圖像進行掃描,獲得多個窗口圖像;或者使用多個尺度的窗口對待識別圖像進行掃描,獲得多個窗口圖像。
[0095]逐層查找模塊604c,用于從檢索樹的第一層開始,逐層查找與窗口圖像匹配的節(jié)點,直到查找到與窗口圖像匹配的葉子節(jié)點。
[0096]如圖9所示,在一個實施例中,在圖8所示實施例的基礎(chǔ)上,索引查找模塊604還包括:
[0097]膚色過濾模塊604b,用于對窗口圖像進行膚色識別,過濾掉非膚色窗口圖像。
[0098]在一個實施例中,逐層查找模塊604c用于從檢索樹的第一層開始,逐層查找與窗口圖像匹配的節(jié)點,其中當查找的節(jié)點為子節(jié)點時,只查找上一層中與窗口圖像匹配的節(jié)點的子節(jié)點。
[0099]如圖10所示,在一個實施例中,置信度計算模塊606包括:
[0100]窗口圖像置信度計算模塊606a,用于根據(jù)與窗口圖像匹配的葉子節(jié)點對應(yīng)的特征數(shù)據(jù),計算窗口圖像對應(yīng)的置信度。
[0101]窗口圖像調(diào)整模塊606b,用于將匹配相同葉子節(jié)點的窗口圖像調(diào)整為同一尺度,并將調(diào)整后的窗口圖像對應(yīng)到相同尺度下的待識別圖像中。
[0102]待識別圖像置信度計算模塊606c,用于獲取相同尺度下的待識別圖像中位置相鄰、尺寸相差在指定范圍內(nèi)的調(diào)整后的窗口圖像對應(yīng)的置信度,根據(jù)獲取到的窗口圖像對應(yīng)的置信度計算待識別圖像對應(yīng)的置信度。
[0103]本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以通過計算機程序來指令相關(guān)的硬件來完成,程序可存儲于一計算機可讀取存儲介質(zhì)中,如本發(fā)明實施例中,該程序存儲于終端的存儲介質(zhì)中,并被該終端中的至少一個處理器執(zhí)行,以實現(xiàn)包括如上述各方法的實施例的流程。其中,存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory, ROM)或隨機存儲記憶體(Random Access Memory, RAM)等。
[0104]本發(fā)明實施例還提供了另一種色情圖像識別終端,如圖11所示,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分,具體技術(shù)細節(jié)未揭示的,請參照本發(fā)明實施例方法部分。該終端可以為包括手機、平板電腦、PDA (Personal Digital Assistant,個人數(shù)字助理)、P0S (Point of Sales,銷售終端)、車載電腦等任意終端設(shè)備,以終端為手機為例:
[0105]圖11示出的是與本發(fā)明實施例提供的終端相關(guān)的手機的部分結(jié)構(gòu)的框圖。參考圖11,手機包括:射頻(Rad1 Frequency,RF)電路1110、存儲器1120、輸入單元1130、顯示單元1140、傳感器1150、音頻電路1160、無線通信模塊1170、處理器1180、以及電源1190等部件。本領(lǐng)域技術(shù)人員可以理解,圖11中示出的手機結(jié)構(gòu)并不構(gòu)成對手機的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。
[0106]下面結(jié)合圖11對手機的各個構(gòu)成部件進行具體的介紹:
[0107]RF電路1110可用于收發(fā)信息或通話過程中,信號的接收和發(fā)送,特別地,將基站的下行信息接收后,給處理器1180處理;另外,將設(shè)計上行的數(shù)據(jù)發(fā)送給基站。通常,RF電路包括但不限于天線、至少一個放大器、收發(fā)信機、耦合器、低噪聲放大器(LowNoise Amplifier, LNA)、雙工器等。此外,RF電路110還可以通過無線通信與網(wǎng)絡(luò)和其他設(shè)備通信。上述無線通信可以使用任一通信標準或協(xié)議,包括但不限于全球移動通訊系統(tǒng)(Global System of Mobile communicat1n, GSM)、通用分組無線服務(wù)(GeneralPacket Rad1 Service, GPRS)、碼分多址(Code Divis1n Multiple Access, CDMA)、寬帶碼分多址(Wideband Code Divis1n Multiple Access, WCDMA)、長期演進(Long TermEvolut1n, LTE))、電子郵件、短消息服務(wù)(Short Messaging Service, SMS)等。
[0108]存儲器1120可用于存儲軟件程序以及模塊,處理器1180通過運行存儲在存儲器1120的軟件程序以及模塊,從而執(zhí)行手機的各種功能應(yīng)用以及數(shù)據(jù)處理。存儲器1120中的軟件程序可用于執(zhí)行一種色情圖像識別方法,該方法包括:獲取待識別圖像;查找預(yù)先存儲的人體敏感部位索引中與待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù);根據(jù)匹配的特征數(shù)據(jù)計算待識別圖像對應(yīng)的置信度;根據(jù)待識別圖像對應(yīng)的置信度判斷待識別圖像是否為色情圖像。存儲器1120可主要包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng)、至少一個功能所需的應(yīng)用程序(比如聲音播放功能、圖像播放功能等)等;存儲數(shù)據(jù)區(qū)可存儲根據(jù)手機的使用所創(chuàng)建的數(shù)據(jù)(比如音頻數(shù)據(jù)、電話本等)等。此外,存儲器1120可以包括高速隨機存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他易失性固態(tài)存儲器件。
[0109]輸入單元1130可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與手機的用戶設(shè)置以及功能控制有關(guān)的鍵信號輸入。具體地,輸入單元1130可包括觸控面板1131以及其他輸入設(shè)備1132。觸控面板1131,也稱為觸摸屏,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸控面板1131上或在觸控面板1131附近的操作),并根據(jù)預(yù)先設(shè)定的程式驅(qū)動相應(yīng)的連接裝置??蛇x的,觸控面板1131可包括觸摸檢測裝置和觸摸控制器兩個部分。其中,觸摸檢測裝置檢測用戶的觸摸方位,并檢測觸摸操作帶來的信號,將信號傳送給觸摸控制器;觸摸控制器從觸摸檢測裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點坐標,再送給處理器1180,并能接收處理器1180發(fā)來的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實現(xiàn)觸控面板1131。除了觸控面板1131,輸入單元1130還可以包括其他輸入設(shè)備1132。具體地,其他輸入設(shè)備1132可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開關(guān)按鍵等)、軌跡球、鼠標、操作桿等中的一種或多種。
[0110]顯示單元1140可用于顯示由用戶輸入的信息或提供給用戶的信息以及手機的各種菜單。顯示單元1140可包括顯示面板1141,可選的,可以采用液晶顯示器(LiquidCrystal Display, LCD)、有機發(fā)光二極管(Organic Light-Emitting D1de, 0LED)等形式來配置顯示面板1141。進一步的,觸控面板1131可覆蓋顯示面板1141,當觸控面板1131檢測到在其上或附近的觸摸操作后,傳送給處理器1180以確定觸摸事件的類型,隨后處理器1180根據(jù)觸摸事件的類型在顯示面板1141上提供相應(yīng)的視覺輸出。雖然在圖11中,觸控面板1131與顯示面板1141是作為兩個獨立的部件來實現(xiàn)手機的輸入和輸入功能,但是在某些實施例中,可以將觸控面板1131與顯示面板1141集成而實現(xiàn)手機的輸入和輸出功倉泛。
[0111]手機還可包括至少一種傳感器1150,比如光傳感器、運動傳感器以及其他傳感器。具體地,光傳感器可包括環(huán)境光傳感器及接近傳感器,其中,環(huán)境光傳感器可根據(jù)環(huán)境光線的明暗來調(diào)節(jié)顯示面板1141的亮度,接近傳感器可在手機移動到耳邊時,關(guān)閉顯示面板1141和/或背光。作為運動傳感器的一種,加速計傳感器可檢測各個方向上(一般為三軸)加速度的大小,靜止時可檢測出重力的大小及方向,可用于識別手機姿態(tài)的應(yīng)用(比如橫豎屏切換、相關(guān)游戲、磁力計姿態(tài)校準)、振動識別相關(guān)功能(比如計步器、敲擊)等;至于手機還可配置的陀螺儀、氣壓計、濕度計、溫度計、紅外線傳感器等其他傳感器,在此不再贅述。
[0112]音頻電路1160、揚聲器1161,傳聲器1162可提供用戶與手機之間的音頻接口。音頻電路1160可將接收到的音頻數(shù)據(jù)轉(zhuǎn)換后的電信號,傳輸?shù)綋P聲器1161,由揚聲器1161轉(zhuǎn)換為聲音信號輸出;另一方面,傳聲器1162將收集的聲音信號轉(zhuǎn)換為電信號,由音頻電路1160接收后轉(zhuǎn)換為音頻數(shù)據(jù),再將音頻數(shù)據(jù)輸出處理器1180處理后,經(jīng)RF電路1110以發(fā)送給比如另一手機,或者將音頻數(shù)據(jù)輸出至存儲器1120以便進一步處理。
[0113]無線通信模塊1170包括但不限于無線保真(wireless fidelity, WiFi, —種短距離無線傳輸技術(shù))模塊、藍牙模塊、紅外通信模塊等。手機通過無線通信模塊1170可以幫助用戶收發(fā)電子郵件、瀏覽網(wǎng)頁和訪問流式媒體等,它為用戶提供了無線的寬帶互聯(lián)網(wǎng)訪問。雖然圖11示出了無線通信模塊1170,但是可以理解的是,其并不屬于手機的必須構(gòu)成,完全可以根據(jù)需要在不改變發(fā)明的本質(zhì)的范圍內(nèi)而省略。
[0114]處理器1180是手機的控制中心,利用各種接口和線路連接整個手機的各個部分,通過運行或執(zhí)行存儲在存儲器1120內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲在存儲器1120內(nèi)的數(shù)據(jù),執(zhí)行手機的各種功能和處理數(shù)據(jù),從而對手機進行整體監(jiān)控。可選的,處理器1180可包括一個或多個處理單元;優(yōu)選的,處理器1180可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無線通信??梢岳斫獾氖?,上述調(diào)制解調(diào)處理器也可以不集成到處理器1180中。
[0115]手機還包括給各個部件供電的電源1190 (比如電池),優(yōu)選的,電源可以通過電源管理系統(tǒng)與處理器1180邏輯相連,從而通過電源管理系統(tǒng)實現(xiàn)管理充電、放電、以及功耗管理等功能。
[0116]盡管未示出,手機還可以包括攝像頭、藍牙模塊等,在此不再贅述。
[0117]在本發(fā)明實施例中,該終端所包括的處理器1180還具有以下功能:用于獲取待識別圖像;查找預(yù)先存儲的人體敏感部位索引中與待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù);根據(jù)匹配的特征數(shù)據(jù)計算待識別圖像對應(yīng)的置信度;根據(jù)待識別圖像對應(yīng)的置信度判斷待識別圖像是否為色情圖像。
[0118]在一個實施例中,人體敏感部位索引記錄了檢索入口數(shù)據(jù)和人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)的映射關(guān)系;處理器1180還具有以下功能:用于從檢索入口數(shù)據(jù)開始,根據(jù)檢索入口數(shù)據(jù)和人體敏感部位圖片對應(yīng)的特征數(shù)據(jù)的映射關(guān)系,查找與待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)。
[0119]在一個實施例中,人體敏感部位索引為哈希表,哈希表包括對人體敏感部位圖片的特征數(shù)據(jù)進行哈希運算后得到的哈希值;處理器1180還具有以下功能:用于對待識別圖像進行哈希運算,得到哈希運算結(jié)果;從哈希表中查找與哈希運算結(jié)果匹配的哈希值,根據(jù)哈希值獲取與待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)。
[0120]在一個實施例中,人體敏感部位索引為檢索樹;檢索樹包括對應(yīng)人體敏感部位圖片的特征數(shù)據(jù)的葉子節(jié)點和從葉子節(jié)點開始進行逐層合并后得到的節(jié)點。
[0121 ] 在一個實施例中,處理器1180還具有以下功能:用于獲取包含人體敏感部位圖片的訓練集;提取訓練集中的人體敏感部位圖片的特征數(shù)據(jù);將特征數(shù)據(jù)對應(yīng)葉子節(jié)點,從葉子節(jié)點開始,逐層對節(jié)點進行合并,構(gòu)成檢索樹。
[0122]在一個實施例中,處理器1180還具有以下功能:用于對待識別圖像進行窗口掃描,獲得多個窗口圖像;從檢索樹的第一層開始,逐層查找與窗口圖像匹配的節(jié)點,直到查找到與窗口圖像匹配的葉子節(jié)點。
[0123]在一個實施例中,處理器1180還具有以下功能:用于對窗口圖像進行膚色識別,過濾掉非膚色窗口圖像。
[0124]在一個實施例中,處理器1180還具有以下功能:用于從檢索樹的第一層開始,逐層查找與窗口圖像匹配的節(jié)點,其中當查找的節(jié)點為子節(jié)點時,只查找上一層中與窗口圖像匹配的節(jié)點的子節(jié)點。
[0125]在一個實施例中,處理器1180還具有以下功能:用于使用尺寸固定的窗口對多個尺度下的待識別圖像進行掃描,獲得多個窗口圖像;或者用于使用多個尺度的窗口對待識別圖像進行掃描,獲得多個窗口圖像。
[0126]在一個實施例中,處理器1180還具有以下功能:用于根據(jù)與窗口圖像匹配的葉子節(jié)點對應(yīng)的特征數(shù)據(jù),計算窗口圖像對應(yīng)的置信度;將匹配相同葉子節(jié)點的窗口圖像調(diào)整為同一尺度,并將調(diào)整后的窗口圖像對應(yīng)到相同尺度下的待識別圖像中;獲取相同尺度下的待識別圖像中位置相鄰、尺寸相差在指定范圍內(nèi)的調(diào)整后的窗口圖像對應(yīng)的置信度,根據(jù)獲取到的窗口圖像對應(yīng)的置信度計算待識別圖像對應(yīng)的置信度。
[0127]以上實施例僅表達了本發(fā)明的幾種實施方式,其描述較為具體和詳細,但并不能因此而理解為對本發(fā)明專利范圍的限制。應(yīng)當指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進,這些都屬于本發(fā)明的保護范圍。因此,本發(fā)明專利的保護范圍應(yīng)以所附權(quán)利要求為準。
【權(quán)利要求】
1.一種色情圖像識別方法,所述方法包括: 獲取待識別圖像; 查找預(yù)先存儲的人體敏感部位索引中與所述待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù); 根據(jù)所述匹配的特征數(shù)據(jù)計算所述待識別圖像對應(yīng)的置信度; 根據(jù)所述待識別圖像對應(yīng)的置信度判斷所述待識別圖像是否為色情圖像。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述人體敏感部位索引記錄了檢索入口數(shù)據(jù)和所述人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)的映射關(guān)系;所述查找預(yù)先存儲的人體敏感部位索引中與所述待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù),包括:從所述檢索入口數(shù)據(jù)開始,根據(jù)所述檢索入口數(shù)據(jù)和所述人體敏感部位圖片對應(yīng)的特征數(shù)據(jù)的映射關(guān)系,查找與所述待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述人體敏感部位索引為哈希表,所述哈希表包括對人體敏感部位圖片的特征數(shù)據(jù)進行哈希運算后得到的哈希值; 所述查找預(yù)先存儲的人體敏感部位索引中與所述待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù),包括: 對所述待識別圖像進行哈希運算,得到哈希運算結(jié)果; 從所述哈希表中查找與所述哈希運算結(jié)果匹配的哈希值,根據(jù)所述哈希值獲取與所述待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述人體敏感部位索引為檢索樹;所述檢索樹包括對應(yīng)人體敏感部位圖片的特征數(shù)據(jù)的葉子節(jié)點和從所述葉子節(jié)點開始進行逐層合并后得到的節(jié)點。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述方法還包括: 獲取包含人體敏感部位圖片的訓練集; 提取所述訓練集中的人體敏感部位圖片的特征數(shù)據(jù); 將所述特征數(shù)據(jù)對應(yīng)葉子節(jié)點,從葉子節(jié)點開始,逐層對節(jié)點進行合并,構(gòu)成檢索樹。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述查找預(yù)先存儲的人體敏感部位索引中與所述待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù),包括: 對所述待識別圖像進行窗口掃描,獲得多個窗口圖像; 從所述檢索樹的第一層開始,逐層查找與所述窗口圖像匹配的節(jié)點,直到查找到與所述窗口圖像匹配的葉子節(jié)點。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述對所述待識別圖像進行窗口掃描,獲得多個窗口圖像之后,還包括: 對所述窗口圖像進行膚色識別,過濾掉非膚色窗口圖像。
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述從所述檢索樹的第一層開始,逐層查找與所述窗口圖像匹配的節(jié)點,包括: 從所述檢索樹的第一層開始,逐層查找與所述窗口圖像匹配的節(jié)點,其中當查找的節(jié)點為子節(jié)點時,只查找上一層中與所述窗口圖像匹配的節(jié)點的子節(jié)點。
9.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述對所述待識別圖像進行窗口掃描,獲得多個窗口圖像,包括: 使用尺寸固定的窗口對多個尺度下的所述待識別圖像進行掃描,獲得多個窗口圖像;或者使用多個尺度的窗口對所述待識別圖像進行掃描,獲得多個窗口圖像。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述根據(jù)匹配的特征數(shù)據(jù)計算所述待識別圖像對應(yīng)的置信度,包括: 根據(jù)與所述窗口圖像匹配的葉子節(jié)點對應(yīng)的特征數(shù)據(jù),計算所述窗口圖像對應(yīng)的置信度; 將匹配相同葉子節(jié)點的所述窗口圖像調(diào)整為同一尺度,并將調(diào)整后的所述窗口圖像對應(yīng)到相同尺度下的待識別圖像中; 獲取所述相同尺度下的待識別圖像中位置相鄰、尺寸相差在指定范圍內(nèi)的所述調(diào)整后的窗口圖像對應(yīng)的置信度,根據(jù)所述獲取到的窗口圖像對應(yīng)的置信度計算所述待識別圖像對應(yīng)的置信度。
11.一種色情圖像識別裝置,其特征在于,所述裝置包括: 圖像獲取模塊,用于獲取待識別圖像; 索引查找模塊,用于查找預(yù)先存儲的人體敏感部位索引中與所述待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù); 置信度計算模塊,用于根據(jù)所述匹配的特征數(shù)據(jù)計算所述待識別圖像對應(yīng)的置信度; 判斷模塊,用于根據(jù)所述待識別圖像對應(yīng)的置信度判斷所述待識別圖像是否為色情圖像。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述人體敏感部位索引記錄了檢索入口數(shù)據(jù)和所述人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)的映射關(guān)系;所述索引查找模塊還用于從所述檢索入口數(shù)據(jù)開始,根據(jù)所述檢索入口數(shù)據(jù)和所述人體敏感部位圖片對應(yīng)的特征數(shù)據(jù)的映射關(guān)系,查找與所述待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)。
13.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述人體敏感部位索引為哈希表,所述哈希表包括對人體敏感部位圖片的特征數(shù)據(jù)進行哈希運算后得到的哈希值;所述索引查找模塊還用于對所述待識別圖像進行哈希運算,得到哈希運算結(jié)果;從所述哈希表中查找與所述哈希運算結(jié)果匹配的哈希值,根據(jù)所述哈希值獲取與所述待識別圖像匹配的人體敏感部位圖片所對應(yīng)的特征數(shù)據(jù)。
14.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述人體敏感部位索引為檢索樹;所述檢索樹包括對應(yīng)人體敏感部位圖片的特征數(shù)據(jù)的葉子節(jié)點和從所述葉子節(jié)點開始進行逐層合并后得到的節(jié)點。
15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述裝置還包括: 訓練集獲取模塊,用于獲取包含人體敏感部位圖片的訓練集; 特征提取模塊,用于提取所述訓練集中的人體敏感部位圖片的特征數(shù)據(jù); 檢索樹生成模塊,用于將所述特征數(shù)據(jù)對應(yīng)葉子節(jié)點,從葉子節(jié)點開始,逐層對節(jié)點進行合并,構(gòu)成檢索樹。
16.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述索引查找模塊包括: 窗口掃描模塊,用于對所述待識別圖像進行窗口掃描,獲得多個窗口圖像; 逐層查找模塊,用于從所述檢索樹的第一層開始,逐層查找與所述窗口圖像匹配的節(jié)點,直到查找到與所述窗口圖像匹配的葉子節(jié)點。
17.根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述索引查找模塊還包括: 膚色過濾模塊,用于對所述窗口圖像進行膚色識別,過濾掉非膚色窗口圖像。
18.根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述逐層查找模塊用于從所述檢索樹的第一層開始,逐層查找與所述窗口圖像匹配的節(jié)點,其中當查找的節(jié)點為子節(jié)點時,只查找上一層中與所述窗口圖像匹配的節(jié)點的子節(jié)點。
19.根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述窗口掃描模塊用于使用尺寸固定的窗口對多個尺度下的所述待識別圖像進行掃描,獲得多個窗口圖像;或者 所述窗口掃描模塊用于使用多個尺度的窗口對所述待識別圖像進行掃描,獲得多個窗口圖像。
20.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述置信度計算模塊包括: 窗口圖像置信度計算模塊,用于根據(jù)與所述窗口圖像匹配的葉子節(jié)點對應(yīng)的特征數(shù)據(jù),計算所述窗口圖像對應(yīng)的置信度; 窗口圖像調(diào)整模塊,用于將匹配相同葉子節(jié)點的所述窗口圖像調(diào)整為同一尺度,并將調(diào)整后的所述窗口圖像對應(yīng)到相同尺度下的待識別圖像中; 待識別圖像置信度計算模塊,用于獲取所述相同尺度下的待識別圖像中位置相鄰、尺寸相差在指定范圍內(nèi)的所述調(diào)整后的窗口圖像對應(yīng)的置信度,根據(jù)所述獲取到的窗口圖像對應(yīng)的置信度計算所述待識別圖像對應(yīng)的置信度。
【文檔編號】G06K9/62GK104281833SQ201310284730
【公開日】2015年1月14日 申請日期:2013年7月8日 優(yōu)先權(quán)日:2013年7月8日
【發(fā)明者】梅樹起 申請人:深圳市騰訊計算機系統(tǒng)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1