一種基于視覺一致性約束的圖像目標分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及的是一種圖像目標分類方法,具體地說,涉及的是一種基于視覺一致 性約束的圖像目標分類方法。
【背景技術(shù)】
[0002] 目前,智能圖像監(jiān)控由于其廣闊的應(yīng)用范圍吸引了大量的關(guān)注。在圖像監(jiān)控技術(shù) 中,自動目標檢測與分類已經(jīng)成為智能監(jiān)控系統(tǒng)的一項主要任務(wù)。當前的圖像監(jiān)控系統(tǒng),雖 然數(shù)量龐大、清晰度越來越高,但除了卡口、閘機等能夠近距離有約束取像的場所,可以進 行有效的車牌檢測識別、人臉檢測識別應(yīng)用外,其他大量道路等室外監(jiān)控視頻系統(tǒng),因為成 像角度、距離、光照等難以有效約束,仍然存在圖像目標難以精確、魯棒地檢測和分類識別 問題,導(dǎo)致圖像監(jiān)控系統(tǒng)的應(yīng)用效能難以有效發(fā)揮。因此,監(jiān)控圖像目標的準確分類成為當 前一個具有挑戰(zhàn)性的任務(wù)。
[0003]國內(nèi)外的研宄者在目標的檢測領(lǐng)域,做出了大量卓有成效的工作。近年來,大量的 研宄工作從判別性特征提取和分類器模型設(shè)計等角度來解決目標分類問題。根據(jù)分類器訓(xùn) 練手段的不同,可以把檢測模型分為兩大類:一類是基于各種全局或局部判別性特征的統(tǒng) 計模型,包括利用人工選取的特征和機器學(xué)習(xí)到的特征,如目前最為關(guān)注的深度學(xué)習(xí)模型; 一類是基于范例(Exemplar,也有文獻稱為實例,Instance,本文統(tǒng)稱為范例)等的相似性 認知模型(簡稱范例模型)。
[0004] 基于判別性特征的統(tǒng)計檢測模型。目前統(tǒng)計模型在目標檢測中處于主流地位,大 多數(shù)的模型都屬于統(tǒng)計學(xué)習(xí)模型。該類模型基于目標人工選取或者機器學(xué)習(xí)到的、具有一 定尺度、角度、光照不變性的一個特征或多個判別性特征,進行模板統(tǒng)計訓(xùn)練,然后進行候 選區(qū)域與目標模板的匹配檢測。用于目標檢測的判別性特征,包括外觀等底層特征、全局 與局部等混合特征、機器學(xué)習(xí)到的特征等。底層特征指的是基本的圖像特征,如顏色、紋 理、梯度、形狀等于直觀視覺特征和其對應(yīng)的簡單統(tǒng)計特征。主要的統(tǒng)計特征包括Navneet Dalai和BillTriggs等在CVPR2005 的文獻"Histogramsoforientedgradientsfor humandetection" 中提出的H0G(HistogramofOrientedGradient)特征,Ojala等在 文獻〃Multiresolutiongray-scaleandrotationinvarianttextureclassification withlocalbinarypatterns〃提出的LBP(LocalBinaryPattern)特征,DavidLowe 在 2004 年文獻"Distinctiveimagefeaturesfromscale-invariantkeypoints" 提 出的尺度不變特征(SIFT),Wu等 2011 年在文獻"CENTRISTSVisualDescriptorfor SceneCategorization" 提出的CENTRIST(CENsusTRansformhISTogram)方法,文獻 "Evaluatingbag-〇f-visual-wordsrepresentationsinsceneclassification" 給出 的Bag-of-visual-words模型,以及Bay等在SIFT的基礎(chǔ)上做了部分改進得到了SURF特 征(文獻"SURF:Speededuprobustfeatures"),其主要通過引入Hessian矩陣以及運用 積分圖的思想基本實現(xiàn)了圖像中目標匹配的實時化處理,在目標檢測識別領(lǐng)域得到了廣泛 的運用。
[0005] SIFT、SURF、LBP和HOG等的直方圖特征,雖然在目前的目標檢測算法中被廣泛用 來進行目標的可靠表征。這類方法,都致力于學(xué)習(xí)更為魯棒的、能夠容忍大量類內(nèi)特征變化 的目標分類檢測器。但是,這種以剛性的類別屬性作為區(qū)分量度的檢測方法,很容易受到每 類目標在視覺上的不一致性的影響,導(dǎo)致檢測識別性能大幅下降甚至完全失效。而這種視 覺不一致性,在監(jiān)控圖像中更為顯著:實際的監(jiān)控應(yīng)用系統(tǒng)中,成像條件往往復(fù)雜多變,目 標視覺特征將會因為視角差異、光照效應(yīng)、目標形變、遮擋等而劇烈變化,導(dǎo)致同類目標嚴 重的視覺不一致。
[0006] 基于相似性認知的范例檢測模型。認知學(xué)的研宄(文獻"MosheBar,The proactivebrain:usinganalogiesandassociationstogeneratepredictions.TRENDS inCognitiveSciences,Vol.llNo. 7,June2007")表明,大腦對于新事物的識別一個看〃 它像什么〃的問題,而不是直接分類判斷〃它是什么〃的問題。我們是通過和它最像的物體 的信息來得知它是什么。最近幾年,以范例為出發(fā)點、基于相似性認知的目標檢測識別方法 引起了學(xué)術(shù)界的廣泛關(guān)注。不同于基于類別的方法,基于范例的方法通過對正樣本的特殊 處理,來避免視覺不一致的問題,因此基于單一或多個范例表示的目標檢測技術(shù)在這些年 得到了大力的發(fā)展。其核心思想對訓(xùn)練集中的檢測樣例,每一個都訓(xùn)練自己的分類器,綜合 所有的一類目標的分類器實現(xiàn)對于該類目標的檢測(文獻"李強,基于范例度量學(xué)習(xí)的物 體檢測,碩士學(xué)位論文,華中科技大學(xué),武漢,2013年")。Malisiewicz等人在文獻"Ensemble ofexemplar-svmsforobjectdetectionandbeyond"借鑒了局部范例學(xué)習(xí)的思想,通過 使用SVM分類器來尋找范例特征的最佳分類投影方向。該文作者認為傳統(tǒng)類屬SVM不能有 效地處理正樣本訓(xùn)練集內(nèi)的巨大變化,尤其是與范例不相似的正樣本會嚴重影響類屬SVM 分類器的投影方向。因此,他們設(shè)計了以單一范例為中心的ESVM(Exemplar-SVMS)分類器, 試圖僅僅從負樣本中學(xué)習(xí)范例特征的最佳分類投影方向。
[0007] 雖然以范例為主的相似認知檢測方法能夠注重單一目標范例的個性特征,但卻存 在對不同范例之間共性特征重視不夠的問題,同一類別的目標往往因類內(nèi)個體的千差萬別 產(chǎn)生數(shù)目眾多的范例,如果對范例逐一建模,將使分類復(fù)雜性的大大增加,從而導(dǎo)致分類效 能低下。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明針對現(xiàn)有技術(shù)中存在的上述技術(shù)問題,提供一種基于視覺一致性約束的圖 像目標分類方法,有效地解決了圖像類內(nèi)目標視覺不一致導(dǎo)致的分類精度和魯棒性不足問 題。
[0009]