一種視覺目標檢測與識別方法

文檔序號：9929805閱讀：799來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種視覺目標檢測與識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于視覺目標檢測與識別領(lǐng)域，具體設(shè)及一種視覺目標檢測與識別方法。
【背景技術(shù)】
[0002] 目標檢測是把感興趣的目標(如標志、車輛、行人等)從圖像或者視頻帖的背景中檢測出來并精確定位的過程，通常是利用目標的特征和位置區(qū)域來實現(xiàn)目標檢測。由于圖像背景復(fù)雜、目標與背景相互交錯、各種仿射變換W及光照不均等條件的限制，到目前為止要取得理想的目標檢測結(jié)果仍是一個難題。
[0003] 近年來，經(jīng)過研究人員的不斷努力，在某些約束環(huán)境下已經(jīng)提出了一些有效的目標檢測方法。傳統(tǒng)的目標檢測方法包括背景差法、帖差法、光流法和基于模板的檢測方法等。然而，由于目標形狀和外貌千差萬別，使得運用常規(guī)的基于圖像處理的目標檢測方法往往不能達到較好的檢測效果。為此，研究人員提出了基于統(tǒng)計學(xué)習的目標檢測方法，如 Viola等人在文獻"Robust Real-Time Object Detection"中提出了一種快速的人臉檢測算法，采用化ar特征描述待檢測區(qū)域的信息，并結(jié)合級聯(lián)分類器和滑動窗定位對待檢測區(qū) 域是否包含目標進行判別，得益于積分圖像和級聯(lián)分類器的加速作用，該算法可W實現(xiàn)人臉目標的實時檢測，且具有較高的檢測率。Dalal等人在文獻巧istograms of Oriented Gradients for Human Detection"中提出了利用冊G特征和SVM分類器的行人檢測算法，該方法分為訓(xùn)練和預(yù)測兩個階段:在訓(xùn)練階段，對訓(xùn)練樣本提取冊G特征，并利用SVM分類器訓(xùn) 練得到一個行人分類器;在預(yù)測階段，利用滑動窗口對圖像進行掃描，利用訓(xùn)練得到的分類器對候選窗口進行判別，最后在尺度空間融合檢測結(jié)果，得到最終的行人區(qū)域。另外， Felzenszwalb等人在文南犬('A Discriminatively Trained,Multiscale ,Deformable Part Model"中提出了利用可變形部件模型進行目標檢測的方法，首先通過冊G特征模板來刻畫目標整體及其每一個可變形部件，然后對運些部件進行匹配，在較大分辨率尺度下使用根濾波器匹配整個目標，在較細分辨率尺度下使用部件濾波器匹配目標的局部組成區(qū)域，最后將不同分辨率尺度下的匹配結(jié)果相結(jié)合，在目標檢測過程中，每個檢測窗口的得分等于所有部件的匹配得分減去模型變化的代價。該方法在訓(xùn)練模型時需要訓(xùn)練得到每一個可變形部件的HOG模型，W及衡量部件位置分布的代價參數(shù)。運些基于統(tǒng)計學(xué)習的目標檢測方法在一些公開的數(shù)據(jù)集上取得了很好的結(jié)果，然而，在實際應(yīng)用中，使用單一方法往往并不能得到比較理想的檢測結(jié)果，主要原因在于一方面，實際應(yīng)用中所要處理的圖像或者視頻帖往往比數(shù)據(jù)集要復(fù)雜，單一視覺特征或模型無法很好適用于運些復(fù)雜情況，為了提高檢測的準確性，往往需要同時使用多種視覺特征和目標模型；另一方面，運些方法的計算復(fù)雜度一般都比較高，如果不加改動直接使用的話時間代價太大，所W通常會根據(jù)實際應(yīng)用場景結(jié)合多種方法，取長補短，在檢測效果和檢測速度上取得平衡。
[0004] 綜上所述，現(xiàn)有的目標檢測技術(shù)的不足之處主要在于：常規(guī)的基于圖像處理的目標檢測方法無法適用于形狀復(fù)雜和外貌差別很大的目標;而基于統(tǒng)計學(xué)習的目標檢測方法由于魯棒性和復(fù)雜度的原因，需要根據(jù)實際應(yīng)用場景做出相應(yīng)調(diào)整和優(yōu)化。

【發(fā)明內(nèi)容】

[0005] 針對現(xiàn)有技術(shù)的不足，本發(fā)明提出了一種視覺目標檢測與識別方法，該技術(shù)首先結(jié)合多種視覺特征和級聯(lián)分類器從圖像中獲取目標的候選區(qū)域，快速過濾掉大部分非目標的圖像區(qū)域，然后利用強視覺特征和強分類器對候選區(qū)域進行二次判別驗證，進一步去除較難分辨的非目標區(qū)域，獲得最終更準確的檢測結(jié)果。
[0006] 本發(fā)明所提出的一種視覺目標檢測與識別方法，包括W下步驟：
[0007] (1)對于待檢測的每種目標，準備一定數(shù)量的正樣本，同時準備不少于正樣本數(shù)量的負樣本，所述正樣本和負樣本一起構(gòu)成了訓(xùn)練樣本；
[000引（2)對所述訓(xùn)練樣本提取多種基本視覺特征，然后基于運些特征訓(xùn)練一個級聯(lián)分類器，作為目標的初步檢測模型；
[0009] (3)對所述訓(xùn)練樣本提取強視覺特征，并基于此特征訓(xùn)練一個強分類器，作為目標的二次判別驗證模型；
[0010] (4)在檢測階段，利用滑動窗策略對待檢測圖像進行掃描，對每個掃描窗口利用步驟(2)中所述的目標初步檢測模型進行檢測，獲得目標的候選區(qū)域；
[0011] (5)利用步驟(3)中所述的二次判別驗證模型對步驟(4)中所述目標的候選區(qū)域進行二次判別驗證，進一步去除較難分辨的非目標區(qū)域，獲得最終的目標檢測結(jié)果。
[0012] 進一步，上述一種基于多特征級聯(lián)分類器和二次判別驗證的目標檢測方法，所述步驟(1)中準備的正樣本數(shù)量一般不少于300個，負樣本數(shù)量一般為正樣本數(shù)量的2-5倍，另外需要從樣本中截取出目標區(qū)域，并將目標區(qū)域縮放到統(tǒng)一大小。
[0013] 進一步，上述一種基于多特征級聯(lián)分類器和二次判別驗證的目標檢測方法，所述步驟(2)中目標初步檢測模型訓(xùn)練，提取的基本視覺特征包括顏色、梯度幅值和梯度方向直方圖等，將運些特征作為輸入，并利用Adaboost算法訓(xùn)練級聯(lián)分類器。
[0014] 進一步，上述一種視覺目標檢測與識別方法，所述步驟(3)中目標二次判別模型訓(xùn) 練，提取的強視覺特征包括SIFT (Sca Ie-In variant Feature Trans form)特征、SURF (Speeded Up Robust FeaUires)特征等，對特征進行聚類量化，并統(tǒng)一特征維度，利用量化后的特征作為輸入訓(xùn)練強分類器。
[0015] 進一步，上述一種視覺目標檢測與識別方法，所述步驟(4)中利用滑動窗策略從檢測圖像中得到多個檢測窗口，并采用所述的級聯(lián)分類器對每個窗口進行預(yù)測，保留那些預(yù) 測得分超過闊值的窗口作為目標候選區(qū)域，在滑動過程中對窗口進行一定范圍的尺度縮放，W適應(yīng)尺度變化。
[0016] 進一步，上述一種視覺目標檢測與識別方法，所述步驟(5)中二次判別驗證過程，對上述目標候選區(qū)域采用所述的強分類器（比如SVM分類器)進行進一步預(yù)測，去掉那些預(yù) 測得分小于預(yù)先設(shè)定闊值的候選區(qū)域，將留下的區(qū)域作為最終的檢測結(jié)果。
[0017] 本發(fā)明的有益效果在于：與現(xiàn)有方法相比，本發(fā)明能夠更好地兼顧檢測速度與檢測準確率，并且對實際應(yīng)用環(huán)境下的圖像和視頻數(shù)據(jù)具有較好的魯棒性。本發(fā)明之所W具有上述效果，其原因在于:本發(fā)明在獲得候選區(qū)域階段利用了多種視覺特征，增強了對復(fù)雜目標的魯棒性;然后利用級聯(lián)分類器快速過濾掉大部分非目標區(qū)域，保證了檢測速度，也為后續(xù)基于強特征和強分類器的二次判別驗證奠定了基礎(chǔ);最后，利用描述能力更強的局部特征和分類性能更好的強分類器對候選區(qū)域進行二次判別驗證，進一步去除較難分辨的非目標區(qū)域，有效提高了檢測的準確性。
【附圖說明】
[0018] 圖1是本發(fā)明的技術(shù)流程圖。
[0019] 圖2是獲取候選窗示意圖。
【具體實施方式】
[0020] 下面結(jié)合附圖和具體實施例對本發(fā)明作進一步詳細的描述。
[0021] 本發(fā)明是一種視覺目標檢測與識別方法，其整體流程如圖1所示，具體包含W下步驟：
[0022] (1)對于待檢測的目標類別，準備訓(xùn)練正樣本和負樣本，并提取多種視覺特征。
[0023] 對于待檢測的每種目標，準備一定數(shù)量的正樣本(一般數(shù)目不少于300)，和一定數(shù) 量的負樣本(數(shù)量不少于正樣本，一般為正樣本的2~5倍），并從正樣本中截取出目標區(qū)域，將它們縮放到統(tǒng)一大小W方便后續(xù)特征提取。
[0024] 接著對訓(xùn)練樣本提取多種視覺特征，本實施例中，提取的視覺特征包括顏色化SV)、梯度幅值和梯度方向直方圖化0G)S種，并將運S種特征拼接起來得到魯棒性更好的組合特征。
[0025] (2)利用組合特征訓(xùn)練一個級聯(lián)分類器，作為目標的初步檢測模型。
[0026] 本實施例中采用Adaboost算法實現(xiàn)基于組合特征的級聯(lián)分類器訓(xùn)練，訓(xùn)練過程為迭代循環(huán)優(yōu)化方式。具體地，首先在給定的樣本空間S上初始化一個分布Dinit,然后采用循環(huán)迭代的方式不斷優(yōu)化:算法執(zhí)行T輪選擇，其中T為預(yù)先設(shè)定的最大循環(huán)迭代次數(shù)，在每次循環(huán)t中，選擇一個分類誤差et = err化t，S，Dt)最小的弱分類器，并根據(jù)此誤差計算相應(yīng)的權(quán)1

完整全部詳細技術(shù)資料下載

當前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：彭宇新;唐攀攀;
技術(shù)所有人：北京大學(xué);
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

視覺目標檢測與跟蹤相關(guān)技術(shù)

目標檢測與識別相關(guān)技術(shù)

目標檢測與識別的區(qū)別相關(guān)技術(shù)

目標檢測和目標識別相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種視覺目標檢測與識別方法