一種視覺目標檢測與識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于視覺目標檢測與識別領(lǐng)域,具體設(shè)及一種視覺目標檢測與識別方法。
【背景技術(shù)】
[0002] 目標檢測是把感興趣的目標(如標志、車輛、行人等)從圖像或者視頻帖的背景中 檢測出來并精確定位的過程,通常是利用目標的特征和位置區(qū)域來實現(xiàn)目標檢測。由于圖 像背景復(fù)雜、目標與背景相互交錯、各種仿射變換W及光照不均等條件的限制,到目前為止 要取得理想的目標檢測結(jié)果仍是一個難題。
[0003] 近年來,經(jīng)過研究人員的不斷努力,在某些約束環(huán)境下已經(jīng)提出了一些有效的目 標檢測方法。傳統(tǒng)的目標檢測方法包括背景差法、帖差法、光流法和基于模板的檢測方法 等。然而,由于目標形狀和外貌千差萬別,使得運用常規(guī)的基于圖像處理的目標檢測方法往 往不能達到較好的檢測效果。為此,研究人員提出了基于統(tǒng)計學(xué)習的目標檢測方法,如 Viola等人在文獻"Robust Real-Time Object Detection"中提出了一種快速的人臉檢測 算法,采用化ar特征描述待檢測區(qū)域的信息,并結(jié)合級聯(lián)分類器和滑動窗定位對待檢測區(qū) 域是否包含目標進行判別,得益于積分圖像和級聯(lián)分類器的加速作用,該算法可W實現(xiàn)人 臉目標的實時檢測,且具有較高的檢測率。Dalal等人在文獻巧istograms of Oriented Gradients for Human Detection"中提出了利用冊G特征和SVM分類器的行人檢測算法,該 方法分為訓(xùn)練和預(yù)測兩個階段:在訓(xùn)練階段,對訓(xùn)練樣本提取冊G特征,并利用SVM分類器訓(xùn) 練得到一個行人分類器;在預(yù)測階段,利用滑動窗口對圖像進行掃描,利用訓(xùn)練得到的分類 器對候選窗口進行判別,最后在尺度空間融合檢測結(jié)果,得到最終的行人區(qū)域。另外, Felzenszwalb等人在文南犬('A Discriminatively Trained,Multiscale ,Deformable Part Model"中提出了利用可變形部件模型進行目標檢測的方法,首先通過冊G特征模板來刻畫 目標整體及其每一個可變形部件,然后對運些部件進行匹配,在較大分辨率尺度下使用根 濾波器匹配整個目標,在較細分辨率尺度下使用部件濾波器匹配目標的局部組成區(qū)域,最 后將不同分辨率尺度下的匹配結(jié)果相結(jié)合,在目標檢測過程中,每個檢測窗口的得分等于 所有部件的匹配得分減去模型變化的代價。該方法在訓(xùn)練模型時需要訓(xùn)練得到每一個可變 形部件的HOG模型,W及衡量部件位置分布的代價參數(shù)。運些基于統(tǒng)計學(xué)習的目標檢測方法 在一些公開的數(shù)據(jù)集上取得了很好的結(jié)果,然而,在實際應(yīng)用中,使用單一方法往往并不能 得到比較理想的檢測結(jié)果,主要原因在于一方面,實際應(yīng)用中所要處理的圖像或者視頻帖 往往比數(shù)據(jù)集要復(fù)雜,單一視覺特征或模型無法很好適用于運些復(fù)雜情況,為了提高檢測 的準確性,往往需要同時使用多種視覺特征和目標模型;另一方面,運些方法的計算復(fù)雜度 一般都比較高,如果不加改動直接使用的話時間代價太大,所W通常會根據(jù)實際應(yīng)用場景 結(jié)合多種方法,取長補短,在檢測效果和檢測速度上取得平衡。
[0004] 綜上所述,現(xiàn)有的目標檢測技術(shù)的不足之處主要在于:常規(guī)的基于圖像處理的目 標檢測方法無法適用于形狀復(fù)雜和外貌差別很大的目標;而基于統(tǒng)計學(xué)習的目標檢測方法 由于魯棒性和復(fù)雜度的原因,需要根據(jù)實際應(yīng)用場景做出相應(yīng)調(diào)整和優(yōu)化。
【發(fā)明內(nèi)容】
[0005] 針對現(xiàn)有技術(shù)的不足,本發(fā)明提出了一種視覺目標檢測與識別方法,該技術(shù)首先 結(jié)合多種視覺特征和級聯(lián)分類器從圖像中獲取目標的候選區(qū)域,快速過濾掉大部分非目標 的圖像區(qū)域,然后利用強視覺特征和強分類器對候選區(qū)域進行二次判別驗證,進一步去除 較難分辨的非目標區(qū)域,獲得最終更準確的檢測結(jié)果。
[0006] 本發(fā)明所提出的一種視覺目標檢測與識別方法,包括W下步驟:
[0007] (1)對于待檢測的每種目標,準備一定數(shù)量的正樣本,同時準備不少于正樣本數(shù)量 的負樣本,所述正樣本和負樣本一起構(gòu)成了訓(xùn)練樣本;
[000引(2)對所述訓(xùn)練樣本提取多種基本視覺特征,然后基于運些特征訓(xùn)練一個級聯(lián)分 類器,作為目標的初步檢測模型;
[0009] (3)對所述訓(xùn)練樣本提取強視覺特征,并基于此特征訓(xùn)練一個強分類器,作為目標 的二次判別驗證模型;
[0010] (4)在檢測階段,利用滑動窗策略對待檢測圖像進行掃描,對每個掃描窗口利用步 驟(2)中所述的目標初步檢測模型進行檢測,獲得目標的候選區(qū)域;
[0011] (5)利用步驟(3)中所述的二次判別驗證模型對步驟(4)中所述目標的候選區(qū)域進 行二次判別驗證,進一步去除較難分辨的非目標區(qū)域,獲得最終的目標檢測結(jié)果。
[0012] 進一步,上述一種基于多特征級聯(lián)分類器和二次判別驗證的目標檢測方法,所述 步驟(1)中準備的正樣本數(shù)量一般不少于300個,負樣本數(shù)量一般為正樣本數(shù)量的2-5倍,另 外需要從樣本中截取出目標區(qū)域,并將目標區(qū)域縮放到統(tǒng)一大小。
[0013] 進一步,上述一種基于多特征級聯(lián)分類器和二次判別驗證的目標檢測方法,所述 步驟(2)中目標初步檢測模型訓(xùn)練,提取的基本視覺特征包括顏色、梯度幅值和梯度方向直 方圖等,將運些特征作為輸入,并利用Adaboost算法訓(xùn)練級聯(lián)分類器。
[0014] 進一步,上述一種視覺目標檢測與識別方法,所述步驟(3)中目標二次判別模型訓(xùn) 練,提取的強視覺特征包括SIFT (Sca Ie-In variant Feature Trans form)特征、SURF (Speeded Up Robust FeaUires)特征等,對特征進行聚類量化,并統(tǒng)一特征維度,利用量化 后的特征作為輸入訓(xùn)練強分類器。
[0015] 進一步,上述一種視覺目標檢測與識別方法,所述步驟(4)中利用滑動窗策略從檢 測圖像中得到多個檢測窗口,并采用所述的級聯(lián)分類器對每個窗口進行預(yù)測,保留那些預(yù) 測得分超過闊值的窗口作為目標候選區(qū)域,在滑動過程中對窗口進行一定范圍的尺度縮 放,W適應(yīng)尺度變化。
[0016] 進一步,上述一種視覺目標檢測與識別方法,所述步驟(5)中二次判別驗證過程, 對上述目標候選區(qū)域采用所述的強分類器(比如SVM分類器)進行進一步預(yù)測,去掉那些預(yù) 測得分小于預(yù)先設(shè)定闊值的候選區(qū)域,將留下的區(qū)域作為最終的檢測結(jié)果。
[0017] 本發(fā)明的有益效果在于:與現(xiàn)有方法相比,本發(fā)明能夠更好地兼顧檢測速度與檢 測準確率,并且對實際應(yīng)用環(huán)境下的圖像和視頻數(shù)據(jù)具有較好的魯棒性。本發(fā)明之所W具 有上述效果,其原因在于:本發(fā)明在獲得候選區(qū)域階段利用了多種視覺特征,增強了對復(fù)雜 目標的魯棒性;然后利用級聯(lián)分類器快速過濾掉大部分非目標區(qū)域,保證了檢測速度,也為 后續(xù)基于強特征和強分類器的二次判別驗證奠定了基礎(chǔ);最后,利用描述能力更強的局部 特征和分類性能更好的強分類器對候選區(qū)域進行二次判別驗證,進一步去除較難分辨的非 目標區(qū)域,有效提高了檢測的準確性。
【附圖說明】
[0018] 圖1是本發(fā)明的技術(shù)流程圖。
[0019] 圖2是獲取候選窗示意圖。
【具體實施方式】
[0020] 下面結(jié)合附圖和具體實施例對本發(fā)明作進一步詳細的描述。
[0021] 本發(fā)明是一種視覺目標檢測與識別方法,其整體流程如圖1所示,具體包含W下步 驟:
[0022] (1)對于待檢測的目標類別,準備訓(xùn)練正樣本和負樣本,并提取多種視覺特征。
[0023] 對于待檢測的每種目標,準備一定數(shù)量的正樣本(一般數(shù)目不少于300),和一定數(shù) 量的負樣本(數(shù)量不少于正樣本,一般為正樣本的2~5倍),并從正樣本中截取出目標區(qū)域, 將它們縮放到統(tǒng)一大小W方便后續(xù)特征提取。
[0024] 接著對訓(xùn)練樣本提取多種視覺特征,本實施例中,提取的視覺特征包括顏色 化SV)、梯度幅值和梯度方向直方圖化0G)S種,并將運S種特征拼接起來得到魯棒性更好 的組合特征。
[0025] (2)利用組合特征訓(xùn)練一個級聯(lián)分類器,作為目標的初步檢測模型。
[0026] 本實施例中采用Adaboost算法實現(xiàn)基于組合特征的級聯(lián)分類器訓(xùn)練,訓(xùn)練過程為 迭代循環(huán)優(yōu)化方式。具體地,首先在給定的樣本空間S上初始化一個分布Dinit,然后采用循 環(huán)迭代的方式不斷優(yōu)化:算法執(zhí)行T輪選擇,其中T為預(yù)先設(shè)定的最大循環(huán)迭代次數(shù),在每次 循環(huán)t中,選擇一個分類誤差et = err化t,S,Dt)最小的弱分類器,并根據(jù)此誤差計算相應(yīng)的 權(quán)1