專利名稱:一種視覺目標(biāo)識別與跟蹤方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像分析技術(shù)領(lǐng)域,尤其涉及一種視覺目標(biāo)識別與跟蹤方法。
背景技術(shù):
視覺目標(biāo)識別與跟蹤是從序列圖像中識別視覺目標(biāo)的位置,計(jì)算感興趣目標(biāo)狀 態(tài),針對目標(biāo)性質(zhì)、自由度和跟蹤條件,采用不同跟蹤策略。視覺目標(biāo)識別與跟蹤技術(shù)在身 份確認(rèn)的指紋識別、人臉識別、圖像處理、智能交通管理、仿真機(jī)器人等領(lǐng)域都有較好的應(yīng) 用情景。目前,視覺目標(biāo)識別與跟蹤技術(shù)已成為國內(nèi)外信息處理技術(shù)發(fā)展的重點(diǎn)。現(xiàn)有的 視覺目標(biāo)識別主要有以下幾種方法(1)經(jīng)典的統(tǒng)計(jì)模式識別方法。該方法主要是利用目標(biāo)特征的統(tǒng)計(jì)分布,依靠目標(biāo) 識別系統(tǒng)的大量訓(xùn)練和基于模式空間距離度量的特征匹配分類技術(shù),在較窄的場景定義域 內(nèi)獲得有效地識別。但是,該方法為早期使用的方法,僅在很窄的場景定義域內(nèi),且在目標(biāo) 圖像和周圍背景變化不大的情況下才比較有效,難以解決姿態(tài)變化、目標(biāo)污損變模糊、目標(biāo) 部分被遮蔽等問題。(2)基于知識的目標(biāo)識別方法。20世紀(jì)70年代末,人工智能專家系統(tǒng)開始應(yīng)用到 目標(biāo)識別的研究,形成了基于知識的目標(biāo)識別技術(shù),即知識基(Knowledge Based,KB)系統(tǒng)。 基于知識的目標(biāo)識別算法在一定程度上克服了經(jīng)典統(tǒng)計(jì)模式識別方法的局限性和缺陷。但 是,該方法目前存在的主要問題是可供利用的知識源的辨識和知識的驗(yàn)證很困難,同時(shí)難 以在適應(yīng)新場景中有效地組織知識。(3)基于模型的自動目標(biāo)識別方法。模型基(Model Based, MB)的方法首先是將 復(fù)雜的目標(biāo)識別的樣本空間模型化,這些模型提供了一種描述樣本空間各種重要變化特性 的簡便途徑。典型的模型基系統(tǒng)抽取一定的目標(biāo)特性,并利用這些特性和一些輔助知識來 登記目標(biāo)的模型參數(shù),從而選擇一些初始假設(shè),實(shí)現(xiàn)目標(biāo)特性的預(yù)測。一個模型基系統(tǒng)的最 終目標(biāo)是匹配實(shí)際的特性和預(yù)測后面的特性。若標(biāo)記準(zhǔn)確,匹配過程則會成功和有效。但 是,所述的基于模型的自動目標(biāo)識別方法目前尚處于研究階段,應(yīng)用于實(shí)際還需時(shí)日。(4)基于傳感器信息融合的目標(biāo)識別方法。單一傳感器的導(dǎo)引頭在有光、電干擾的 復(fù)雜環(huán)境中,目標(biāo)搜索和知識識別的能力、抗干擾能力及其工作可靠性都將降低。20世紀(jì) 80年代興起的基于多傳感器信息融合(Multi-sensorlnformation Fusion Based,MIFB)的 目標(biāo)識別方法克服了單一傳感器系統(tǒng)的缺陷,每個傳感器將數(shù)據(jù)饋入各自的信號處理機(jī), 先分別進(jìn)行目標(biāo)檢測,得出有無目標(biāo)的判決以及目標(biāo)的位置信息或運(yùn)動軌跡。然后將這些 信息送入數(shù)據(jù)融合單元,對目標(biāo)位置或運(yùn)動軌跡進(jìn)行關(guān)聯(lián)后再做進(jìn)一步的判決。但是,所述 基于多傳感器信息融合的自動目標(biāo)識別方法,這些方法特征指標(biāo)權(quán)重選取是認(rèn)為確定,具 有較大的主觀隨意性。(5)基于人工神經(jīng)網(wǎng)絡(luò)和專家系統(tǒng)的目標(biāo)識別方法。專家系統(tǒng)是以邏輯推理為基 礎(chǔ),模擬人類思維的人工智能方法。人工神經(jīng)網(wǎng)絡(luò)(ANN)是以神經(jīng)元連接結(jié)構(gòu)為基礎(chǔ),通過模擬人腦結(jié)構(gòu)來模擬人類形象思維的一種非邏輯、非語言的人工智能方法。神經(jīng)網(wǎng)絡(luò)應(yīng)用 到模式識別中能解決很多傳統(tǒng)的識別方法所不能克服的困難,神經(jīng)網(wǎng)絡(luò)對有遮擋的目標(biāo)進(jìn) 行識別也獲得了較高的識別準(zhǔn)確率。但是,所述基于人工神經(jīng)網(wǎng)絡(luò)和專家系統(tǒng)的目標(biāo)識別 方法,神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)工程應(yīng)用具有實(shí)時(shí)性欠佳的瓶頸。 針對現(xiàn)有技術(shù)存在的問題,本案設(shè)計(jì)人憑借從事此行業(yè)多年的經(jīng)驗(yàn),積極研究改 良,于是有了本發(fā)明一種視覺目標(biāo)識別與跟蹤方法。
發(fā)明內(nèi)容
本發(fā)明是針對現(xiàn)有技術(shù)中,現(xiàn)有的視覺目標(biāo)識別和跟蹤方法精確度低,實(shí)時(shí)性差 等缺陷,提供一種視覺目標(biāo)識別方法。本發(fā)明的又一目的是針對現(xiàn)有技術(shù)中,現(xiàn)有的視覺目標(biāo)識別和跟蹤方法精確度 低,實(shí)時(shí)性差等缺陷,提供一種利用所述視覺目標(biāo)識別方法識別的視覺目標(biāo)的跟蹤方法。為了解決上述問題,本發(fā)明提供一種視覺目標(biāo)識別方法,所述視覺目標(biāo)識別方法 包括將采集到的原始圖像轉(zhuǎn)換成二值圖像;在所述二值圖像的基礎(chǔ)上計(jì)算出視覺目標(biāo)的 包圍框;在所述包圍框內(nèi)尋找特征點(diǎn)。可選的,所述特征點(diǎn)的個數(shù)為8個。其中,所述原始圖像轉(zhuǎn)換成二值圖像進(jìn)一步包括將原始圖像轉(zhuǎn)換成256級灰度 圖像;將灰度圖像采用閾值分割法分割為二值圖像。所述原始圖像轉(zhuǎn)換成灰度圖像的方法包括通過Matrox捕捉卡取得原始圖像的 RGB格式的彩色圖像,其中每個像素都使用R、G、B三個字節(jié)存儲;將RGB色彩系統(tǒng)的圖像轉(zhuǎn) 換到Y(jié)UV色彩系統(tǒng),其中Y信號代表像素的亮度;直接取出每個像素的Y信號,便獲得一個 代表256級的灰度圖像。所述RGB色彩系統(tǒng)到Y(jié)UV色彩系統(tǒng)的轉(zhuǎn)化公式為
"7"U=V
0.299 0.587 0.114 -0.148 - 0.289 0.437
0.615
-0.515 -0.100 B
R
G 所述灰度圖像采用閾值分割法分割為二值圖像的方法進(jìn)一步包括求出灰度圖像 中最小灰度值Zmin和最大灰度值Zmax,并令閾值Ttl = (Zmin+Zmax) /2 ;根據(jù)閾值Tk將灰度圖像 分割成目標(biāo)圖像和背景圖像兩部分,分別求出兩部分的平均灰度值Z1ot和Zhigh。
Σ J)^ N(iJ) Σ J)^ N(iJ)
「_1 7 =zId^ll_7 = z(lSy>Tk_
Σ N{r,f)廣h·— Σ N{r,f)其中,Z(i,j)和N(i,j)分別是灰度圖像上點(diǎn)(i,j)的灰度值和權(quán),計(jì)算中,令 N(i,j) = 1 ;求出新的閾值,所述閾值Tk+1 = (Zmin+Zmax) /2 ;若Tk = Tk+1,則該運(yùn)算結(jié)束;若 Tk φ Tk+1,則取k為k+Ι值,并循環(huán)執(zhí)行上述步驟。所述視覺目標(biāo)包圍框的計(jì)算進(jìn)一步包括檢測視覺目標(biāo)的外框;在所述外框的區(qū) 域內(nèi)搜索特征點(diǎn)。所述檢測視覺目標(biāo)的外框的方法還包括采用圖像腐蝕的方法來實(shí)現(xiàn)二值圖像的消噪;提取視覺目標(biāo)邊框;計(jì)算這個四邊形邊框的坐標(biāo)。所述特征點(diǎn)的計(jì)算進(jìn)一步包括對候選特征點(diǎn)集合的η個特征點(diǎn)的區(qū)域進(jìn)行掃 描,并統(tǒng)計(jì)其面積,將面積差距不大的歸為一類,如果其中一類面積值出現(xiàn)次數(shù)少于8次, 便將其從候選特征點(diǎn)集合中刪除,刪除后的候選特征點(diǎn)集合S所含有元素個數(shù)為η’ ;取出 候選特征點(diǎn)集合S中所有η個特征點(diǎn)元素的質(zhì)心坐標(biāo),進(jìn)行Hough變換,擬合出兩條概率上 最有可能的直線,并計(jì)算出交點(diǎn)A ;取出候選特征點(diǎn)S中與點(diǎn)A距離最小的點(diǎn)A’,從A’出 發(fā),如果沿著兩條直線某方向分別能夠搜索到4個和3個特征點(diǎn),則搜索成功,清除S,把這 七個特征點(diǎn)和A’點(diǎn)放入S集合;否則搜索失敗,不清除S。為實(shí)現(xiàn)本發(fā)明的又一目的,本發(fā)明提供一種利用所述的視覺目標(biāo)識別方法所識別 的視覺目標(biāo)的跟蹤方法,所述視覺目標(biāo)跟蹤方法包括初始情況默認(rèn)處理了第零幀,該幀的 搜索窗口和整個圖像一樣大??;在第一幀時(shí)候搜索窗口和整個圖像一樣大小,對搜索窗口 內(nèi)圖像調(diào)用視覺目標(biāo)識別算法進(jìn)行靜態(tài)識別,反復(fù)調(diào)節(jié),確保在較簡單背景下,第一幀圖像 成功識別,取得標(biāo)志的特征點(diǎn)集合的一個適當(dāng)包圍框;在第二幀圖像以后,每次回看前兩幀 搜索窗口的四個頂點(diǎn),根據(jù)這兩個頂點(diǎn)組的空間移動關(guān)系,推算第三次搜索窗口的四個頂 點(diǎn)可能的運(yùn)動方向,并按這四個方向修正搜索窗口的尺寸和區(qū)域,作為擴(kuò)大、縮小或移動的 策略。如果上一幀檢測到的特征點(diǎn)數(shù)少于實(shí)際數(shù)目,那么搜索窗口向四個方向各擴(kuò)大一定 距離;反之縮小。其中,擴(kuò)大和縮小的距離為特征點(diǎn)外圍框的平均邊長。綜上所述,本發(fā)明利用圖像處理方法,對包圍框和其中特征點(diǎn)進(jìn)行計(jì)算。同時(shí),在 目標(biāo)跟蹤技術(shù)上,提出了一種基于可預(yù)測的搜索窗口的方法,對標(biāo)志進(jìn)行運(yùn)動預(yù)測和跟蹤, 明顯減小了搜索范圍,提高了目標(biāo)跟蹤方法的實(shí)時(shí)性。
圖1是本發(fā)明一種視覺目標(biāo)識別與跟蹤方法的視覺目標(biāo)識別方法的流程圖;圖2是本發(fā)明一種視覺目標(biāo)識別與跟蹤方法的視覺目標(biāo)識別過程中原始圖像轉(zhuǎn) 換成二值圖像的示意圖;圖3是本發(fā)明一種視覺目標(biāo)識別與跟蹤方法的視覺目標(biāo)識別過程中消除噪音的 示意圖;圖4是本發(fā)明一種視覺目標(biāo)識別與跟蹤方法的視覺目標(biāo)邊框提取前后圖像的變 化的示意圖;圖5是本發(fā)明一種視覺目標(biāo)識別與跟蹤方法的視覺目標(biāo)跟蹤方法的流程圖;圖6是本發(fā)明一種視覺目標(biāo)識別與跟蹤方法的搜索窗口預(yù)測方法的示意圖。
具體實(shí)施例方式為詳細(xì)說明本發(fā)明創(chuàng)造的技術(shù)內(nèi)容、構(gòu)造特征、所達(dá)成目的及功效,下面將結(jié)合實(shí) 施例并配合附圖予以詳細(xì)說明。請參閱圖1,圖1所示為視覺目標(biāo)識別方法流程圖。在視覺目標(biāo)識別中,可利用的 信息是視覺目標(biāo)的邊緣信息、幾何信息和色度信息。所述視覺目標(biāo)識別方法1包括以下步 驟步驟Sll 將采集到的原始圖像10轉(zhuǎn)化為二值圖像20,所述原始圖像10為RGB格式的彩色圖像。所述二值圖像20為黑白兩色圖像;步驟S12 在所述二值圖像20的基礎(chǔ)上計(jì)算出視覺目標(biāo)的包圍框;步驟S13 在所述包圍框內(nèi)尋找特征點(diǎn)。為了提高算法的實(shí)時(shí)性能,本發(fā)明采用將原始圖形10轉(zhuǎn)換成二值圖形20的方法。 從多媒體圖像的信息量而言,原始圖像10的每個像素帶有24bit信息,二值圖像20的每個 像素只有Ibit信息,因此處理二值圖像20能夠顯著的加快圖像處理的速度。所述原始圖 像10轉(zhuǎn)換成二值圖像20的方法進(jìn)一步包括以下步驟 20。
步驟Slll 將原始圖像10轉(zhuǎn)換成256級灰度圖像30 ;
步驟S112 采用圖像處理技術(shù)中的閾值分割算法,將灰度圖像30分割為二值圖像
執(zhí)行步驟S111,具體包括
步驟S1111,通過Matrox捕捉卡取得原始圖像10的RGB格式的彩色圖像,其中每 個像素都使用R、G、B三個字節(jié)存儲;步驟S1112,將RGB色彩系統(tǒng)的圖像轉(zhuǎn)換到Y(jié)UV色彩系統(tǒng),其中Y信號代表像素的
亮度;步驟S1113,直接取出每個像素的Y信號,便獲得一個代表256級的灰度圖像30。 所述RGB色彩系統(tǒng)到Y(jié)UV色彩系統(tǒng)的轉(zhuǎn)換公式如下
「0.299 0.587 0.114 J「iTU = -0.148 - 0.289 0.437 G ?!筟0.615 - 0.515 -O.IOOJ [_B應(yīng)用中,對每個像素只進(jìn)行Y計(jì)算,不用計(jì)算U,V。執(zhí)行步驟Sl 12,具體包括步驟S1121 求出灰度圖像30中最小灰度值Zmin和最大灰度值Zmax,并令閾值Ttl =
(Zmin+Zmax) /2 ;步驟S1122,根據(jù)閾值Tk將灰度圖像30分割成目標(biāo)圖像和背景圖像兩部分,分別 求出兩部分的平均灰度值Z1ot和Zhigh ;
Σ J)^ N (i J) Σ J)^ N(iJ)
「1 ry —_ry — ^hf)>T_
Z W _ ^Σ N(r,f) Z 喊 _ ^Σ N(r,f)其中,Z(i,j)和N(i,j)分別是灰度圖像30上點(diǎn)(i,j)的灰度值和權(quán),計(jì)算中,令 N(i,j) = 1 ;步驟S1123,求出新的閾值,所述閾值Tk+1 = (Zmin+Zmax)/2 ;步驟S1124,若Tk = Tk+1,則該運(yùn)算結(jié)束;若Tk Φ Tk+1,則取k為k+Ι值,并循環(huán)執(zhí)行 步驟S1122。請參閱圖2,圖2所示為原始圖像10轉(zhuǎn)換成二值圖像20的示意圖。所述原始圖像 10通過灰度化步驟轉(zhuǎn)換成256級灰度圖像30,并通過閾值分割將所述灰度圖形30轉(zhuǎn)換成
二值圖像20。原始圖像10轉(zhuǎn)換成二值圖像20后,便可以快速的計(jì)算視覺目標(biāo)的圖像信息。在本發(fā)明中,需要獲得視覺目標(biāo)的8個特征點(diǎn)坐標(biāo)。但由于圖像干擾可能大,需要對特征點(diǎn)搜 索區(qū)域進(jìn)行限制,于是所述視覺目標(biāo)包圍框的計(jì)算進(jìn)一步包括以下步驟步驟S121 檢測視覺目標(biāo)的外框;步驟S122 在所述外框的區(qū)域內(nèi)搜索特征點(diǎn)。執(zhí)行步驟S121,具體包括步驟S1211,消除噪音,采用圖像腐蝕的方法來實(shí)現(xiàn)二值圖像20的消噪。腐蝕的 結(jié)果是消除連通區(qū)域的外框。請參閱圖3,當(dāng)對二值圖像20進(jìn)行腐蝕時(shí),所有黑色連通區(qū) 域40都適當(dāng)變小。其中,一些小的黑色連通區(qū)域40被消除,表明消噪性能不錯,這樣就完 成二值圖像20的消噪。消噪性能與模板選擇有很大關(guān)系,模板越大消噪能力越強(qiáng),但對視 覺目標(biāo)的破壞也越強(qiáng)。在本發(fā)明中,優(yōu)選的消噪模板為4X4的滑塊。步驟S1212,提取視覺目標(biāo)邊框。在本發(fā)明中,采用輪廓提起技術(shù)提取,掏空內(nèi)部 點(diǎn)。請參閱圖4,圖4所示為二值圖像20經(jīng)過腐蝕后的邊框提取前后圖像的變化示意圖。 經(jīng)過所述視覺目標(biāo)邊框提取操作后,密閉連通區(qū)域40消失,二值圖像20中只剩下少量黑點(diǎn) 50。步驟S1213,計(jì)算這個四邊形邊框的坐標(biāo)。本發(fā)明中,采用直線擬合方法,分析圖像 中所有點(diǎn),首先構(gòu)造這些點(diǎn)可能擬合一些直線,然后通過四邊形幾何限制找出四條最接近 邊框的直線,根據(jù)這四條直線的交點(diǎn)求出視覺目標(biāo)的包圍框。直線擬合方法中Hough變換 能通過多次運(yùn)行擬合多條直線。所述Hough變化方法進(jìn)一步包括步驟S12131,初始化一個變換域r、θ空間的數(shù)組,r方向上的量化數(shù)目為圖像對 角線方向像素?cái)?shù),θ方向上的量化數(shù)目為90,角度從0-180° ;步驟S12132,順序搜索圖像中的所有黑點(diǎn)50,對每個黑點(diǎn)50,在變換的對應(yīng)各點(diǎn) 上加1 ;步驟S12133,求出變換域中最大值記錄;步驟S12134,將最大值點(diǎn)及附近的點(diǎn)清零;步驟S12135,求出這個最大值所對應(yīng)的直線,并存儲下來,如果累計(jì)了六條直線則 轉(zhuǎn)向步驟S12136,否則轉(zhuǎn)向步驟S12135 ;步驟S12136,利用四邊形幾何約束關(guān)系,在候選的六條直線內(nèi)找出最接近視覺目 標(biāo)投影的四條直線,認(rèn)為這是視覺目標(biāo)的外框;步驟S12137,根據(jù)這四條直線計(jì)算視覺目標(biāo)的四個頂點(diǎn)。其中的四邊形幾何約束, 即是對于斜率相近的直線,最多只選距離較遠(yuǎn)的兩條;對于斜率相關(guān)很大的直線,則選擇起 來比較自由。最后確保選擇四條直線,基本是兩組平行線,兩組平等線夾角較大,并且之間 相隔距離相似。對視覺目標(biāo)的識別,是為了給視覺目標(biāo)跟蹤提供空間特征點(diǎn)不同角度的投影坐 標(biāo),并且視覺目標(biāo)的分類識別中也會使用這些特征點(diǎn),因此視覺目標(biāo)的識別最后需要確定 視覺目標(biāo)的特征點(diǎn)。在本發(fā)明中,按照需要檢測出8個特征點(diǎn)做視覺目標(biāo)識別與跟蹤,并選 取由η個元素所構(gòu)成的集合為候選特征點(diǎn)集合。從候選特征點(diǎn)集合S中選取8個特征點(diǎn)的 方法進(jìn)一步包括步驟S131,對候選特征點(diǎn)集合S的η個特征點(diǎn)的區(qū)域進(jìn)行掃描,并統(tǒng)計(jì)其面積,將 面積差距不大的歸為一類。如果其中一類面積值出現(xiàn)次數(shù)少于8次,便將其從候選特征點(diǎn)集合S中刪除。刪除后的候選特征點(diǎn)集合S所含有元素個數(shù)為η’ ;步驟S132,取出候選特征點(diǎn)集合S中所有η個特征點(diǎn)元素的質(zhì)心坐標(biāo),進(jìn)行Hough 變換,擬合出兩條概率上最有可能的直線,并計(jì)算出交點(diǎn)A ;步驟S133,取出候選特征點(diǎn)S中與點(diǎn)A距離最小的點(diǎn)A’,從A’出發(fā),如果沿著兩 條直線某方向分別能夠搜索到4個和3個特征點(diǎn),則搜索成功,清除S,把這七個特征點(diǎn)和 A’點(diǎn)放入S集合;否則搜索失敗,不清除S。至此,我們完成了整個視覺目標(biāo)的識別方法,所述視覺目標(biāo)的識別方法通過將采 集到的原始圖像10轉(zhuǎn)換為二值圖像20,計(jì)算出視覺目標(biāo)的包圍框與特征點(diǎn),為后續(xù)目標(biāo)跟 蹤作好準(zhǔn)備。在視覺目標(biāo)跟蹤時(shí),對視覺目標(biāo)套上一個方形外框,并定義所述外框?yàn)樗阉鞔翱冢?每次僅對所述搜索窗口內(nèi)的圖形進(jìn)行處理。搜索窗口隨著視覺目標(biāo)的移動而不停的移動, 確保視覺目標(biāo)每次都落入所述搜索窗口。其中,搜索窗口坐標(biāo)系圖像和坐標(biāo)系有一定偏移 關(guān)系,計(jì)算結(jié)構(gòu)需要通過平移轉(zhuǎn)換而傳遞給三位重建塊,但所述時(shí)間復(fù)雜度對計(jì)算機(jī)而言 忽略不計(jì)。因此,所述視覺目標(biāo)的跟蹤方法在不影響立體重建的情況下,減小了圖像處理的 復(fù)雜度。請參閱圖5,圖5所示為視覺目標(biāo)跟蹤方法2的流程圖。在情況比較理想、每次都 能檢測到視覺標(biāo)志時(shí),基于搜索窗口的視覺目標(biāo)跟蹤方法包括步驟S21 初始情況默認(rèn)處理了第零幀,該幀的搜索窗口和整個圖像一樣大?。徊襟ES22 在第一幀時(shí)候搜索窗口和整個圖像一樣大小。對搜索窗口內(nèi)圖像調(diào)用 視覺目標(biāo)識別算法進(jìn)行靜態(tài)識別。反復(fù)調(diào)節(jié),確保在較簡單背景下,第一幀圖像成功識別, 取得標(biāo)志的特征點(diǎn)集合的一個適當(dāng)包圍框;步驟S23 在第二幀圖像以后,每次回看前兩幀搜索窗口的四個頂點(diǎn),根據(jù)這兩個 頂點(diǎn)組的空間移動關(guān)系,推算第三次搜索窗口的四個頂點(diǎn)可能的運(yùn)動方向,并按這四個方 向修正搜索窗口的尺寸和區(qū)域,作為擴(kuò)大、縮小或移動的策略;同時(shí),在情況不太理想、不能夠檢測到視覺目標(biāo)時(shí),所述視覺目標(biāo)跟蹤方法還需考 慮如果上一幀檢測到的特征點(diǎn)數(shù)少于實(shí)際數(shù)目,那么搜索窗口向四個方向各擴(kuò)大一定距 離;反之縮小。實(shí)際實(shí)現(xiàn)時(shí),擴(kuò)大和縮小的距離為特征點(diǎn)外圍框的平均邊長。請參閱圖6,圖6所示為搜索窗口預(yù)測方法的示意圖。在第N-I次搜索窗口 60與 第N次搜索窗口 70搜索結(jié)果的基礎(chǔ)上,使用物體慣性規(guī)則判斷預(yù)測第N+1次搜索窗口 80, 并對該區(qū)域適當(dāng)放大?;谒阉鞔翱诟櫡椒ǖ氖褂媒档土藞D像處理的復(fù)雜度,提高處理 速度,為提供實(shí)時(shí)的視覺三維跟蹤注冊提供了可能。綜上所述,本發(fā)明利用圖像處理方法,對包圍框和其中特征點(diǎn)進(jìn)行計(jì)算。同時(shí),在 目標(biāo)跟蹤技術(shù)上,提出了一種基于可預(yù)測的搜索窗口的方法,對標(biāo)志進(jìn)行運(yùn)動預(yù)測和跟蹤, 明顯減小了搜索范圍,提高了目標(biāo)跟蹤方法的實(shí)時(shí)性。本領(lǐng)域技術(shù)人員均應(yīng)了解,在不脫離本發(fā)明的精神或范圍的情況下,可以對本發(fā) 明進(jìn)行各種修改和變型。因而,如果任何修改或變型落入所附權(quán)利要求書及等同物的保護(hù) 范圍內(nèi)時(shí),認(rèn)為本發(fā)明涵蓋這些修改和變型。
權(quán)利要求
一種視覺目標(biāo)識別方法,其特征在于,所述視覺目標(biāo)識別方法包括將采集到的原始圖像轉(zhuǎn)換成二值圖像;在所述二值圖像的基礎(chǔ)上計(jì)算出視覺目標(biāo)的包圍框;在所述包圍框內(nèi)尋找特征點(diǎn)。
2.如權(quán)利要求1所述的一種視覺目標(biāo)識別方法,其特征在于,所述原始圖像轉(zhuǎn)換成二 值圖像進(jìn)一步包括將原始圖像轉(zhuǎn)換成256級灰度圖像; 將灰度圖像采用閾值分割法分割為二值圖像。
3.如權(quán)利要求2所述的一種視覺目標(biāo)識別方法,其特征在于,所述原始圖像轉(zhuǎn)換成灰 度圖像的方法包括通過Matrox捕捉卡取得原始圖像的RGB格式的彩色圖像,其中每個像素都使用R、G、B 三個字節(jié)存儲;將RGB色彩系統(tǒng)的圖像轉(zhuǎn)換到Y(jié)UV色彩系統(tǒng),其中Y信號代表像素的亮度; 直接取出每個像素的Y信號,便獲得一個代表256級的灰度圖像。
4.如權(quán)利要求3所述的一種視覺目標(biāo)識別方法,其特征在于,所述RGB色彩系統(tǒng)到Y(jié)UV 色彩系統(tǒng)的轉(zhuǎn)化公式為
5.如權(quán)利要求2所述的一種視覺目標(biāo)識別方法,其特征在于,所述灰度圖像采用閾值 分割法分割為二值圖像的方法進(jìn)一步包括求出灰度圖像中最小灰度值Zmin和最大灰度值Zmax,并令閾值Ttl = (Zmin+Zmax)/2 ; 根據(jù)閾值Tk將灰度圖像分割成目標(biāo)圖像和背景圖像兩部分,分別求出兩部分的平均灰 度值Zlw和
6.如權(quán)利要求1所述的一種視覺目標(biāo)識別方法,其特征在于,所述視覺目標(biāo)包圍框的 計(jì)算進(jìn)一步包括檢測視覺目標(biāo)的外框; 在所述外框的區(qū)域內(nèi)搜索特征點(diǎn)。
7.如權(quán)利要求6所述的一種視覺目標(biāo)識別方法,其特征在于,所述檢測視覺目標(biāo)的外 框的方法還包括采用圖像腐蝕的方法來實(shí)現(xiàn)二值圖像的消噪;提取視覺目標(biāo)邊框;計(jì)算這個四邊形邊框的坐標(biāo)。
8.如權(quán)利要求1所述的一種視覺目標(biāo)識別方法,其特征在于,所述特征點(diǎn)的個數(shù)為8個。
9.如權(quán)利要求1所述的一種視覺目標(biāo)識別方法,其特征在于,所述特征點(diǎn)的計(jì)算進(jìn)一 步包括對候選特征點(diǎn)集合的η個特征點(diǎn)的區(qū)域進(jìn)行掃描,并統(tǒng)計(jì)其面積,將面積差距不大的 歸為一類,如果其中一類面積值出現(xiàn)次數(shù)少于8次,便將其從候選特征點(diǎn)集合中刪除,刪除 后的候選特征點(diǎn)集合S所含有元素個數(shù)為η’ ;取出候選特征點(diǎn)集合S中所有η個特征點(diǎn)元素的質(zhì)心坐標(biāo),進(jìn)行Hough變換,擬合出兩 條概率上最有可能的直線,并計(jì)算出交點(diǎn)A ;取出候選特征點(diǎn)S中與點(diǎn)A距離最小的點(diǎn)A’,從A’出發(fā),如果沿著兩條直線某方向分 別能夠搜索到4個和3個特征點(diǎn),則搜索成功,清除S,把這七個特征點(diǎn)和A’點(diǎn)放入S集合; 否則搜索失敗,不清除S。
10.一種利用如權(quán)利要求1所述的視覺目標(biāo)識別方法所識別的視覺目標(biāo)的跟蹤方法, 其特征在于,所述視覺目標(biāo)跟蹤方法包括初始情況默認(rèn)處理了第零幀,該幀的搜索窗口和整個圖像一樣大小;在第一幀時(shí)候搜索窗口和整個圖像一樣大小,對搜索窗口內(nèi)圖像調(diào)用視覺目標(biāo)識別算 法進(jìn)行靜態(tài)識別,反復(fù)調(diào)節(jié),確保在較簡單背景下,第一幀圖像成功識別,取得標(biāo)志的特征 點(diǎn)集合的一個適當(dāng)包圍框;在第二幀圖像以后,每次回看前兩幀搜索窗口的四個頂點(diǎn),根據(jù)這兩個頂點(diǎn)組的空間 移動關(guān)系,推算第三次搜索窗口的四個頂點(diǎn)可能的運(yùn)動方向,并按這四個方向修正搜索窗 口的尺寸和區(qū)域,作為擴(kuò)大、縮小或移動的策略。
11.如權(quán)利要求10所述的一種視覺目標(biāo)的跟蹤方法,其特征在于,所述視覺目標(biāo)跟蹤 方法還包括如果上一幀檢測到的特征點(diǎn)數(shù)少于實(shí)際數(shù)目,那么搜索窗口向四個方向各擴(kuò) 大一定距離;反之縮小。
12.如權(quán)利要求11所述的一種視覺目標(biāo)的跟蹤方法,其特征在于,擴(kuò)大和縮小的距離 為特征點(diǎn)外圍框的平均邊長。
全文摘要
一種視覺目標(biāo)識別方法,所述視覺目標(biāo)識別方法包括將采集到的原始圖像轉(zhuǎn)換成二值圖像;在所述二值圖像的基礎(chǔ)上計(jì)算出視覺目標(biāo)的包圍框;在所述包圍框內(nèi)尋找特征點(diǎn)。一種視覺目標(biāo)跟蹤方法包括默認(rèn)第零幀搜索窗口與圖像等大;第一幀圖像識別,并獲得包圍框;搜索窗口預(yù)測。本發(fā)明利用圖像處理方法,對包圍框和其中特征點(diǎn)進(jìn)行計(jì)算。同時(shí),在目標(biāo)跟蹤技術(shù)上,提出了一種基于可預(yù)測的搜索窗口的方法,對標(biāo)志進(jìn)行運(yùn)動預(yù)測和跟蹤,明顯減小了搜索范圍,提高了目標(biāo)跟蹤方法的實(shí)時(shí)性。
文檔編號G06T7/20GK101986348SQ20101053784
公開日2011年3月16日 申請日期2010年11月9日 優(yōu)先權(quán)日2010年11月9日
發(fā)明者寧建紅, 熊玉梅, 閆俊英 申請人:上海電機(jī)學(xué)院