專(zhuān)利名稱(chēng):基于圖像特征分析的目標(biāo)辨識(shí)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于圖像特征分析的目標(biāo)辨識(shí)方法,尤其涉及一種在智能移動(dòng)機(jī) 器人探測(cè)未知空間的局部環(huán)境領(lǐng)域內(nèi),基于圖像特征分析的目標(biāo)辨識(shí)方法。
背景技術(shù):
人類(lèi)對(duì)外界環(huán)境信息的獲取有70%以上都來(lái)自于視覺(jué),可見(jiàn)視覺(jué)導(dǎo)航方式是智能 移動(dòng)機(jī)器人導(dǎo)航的一個(gè)主要發(fā)展方向?,F(xiàn)有技術(shù)公開(kāi)的文獻(xiàn)(李桂芝和安成萬(wàn).基于場(chǎng)景 識(shí)別的移動(dòng)機(jī)器人定位方法研究[J].機(jī)器人,2005. 27 (2) 23-26)提出了一種基于電荷耦 合元件(Charge-coupled Device, CCD)視頻采集對(duì)場(chǎng)景進(jìn)行識(shí)別的移動(dòng)機(jī)器人定位方法, 以全局特征場(chǎng)景識(shí)別對(duì)移動(dòng)機(jī)器人定位,通過(guò)Gabor濾波器提取圖像的全局紋理特征,并 使用支持向量機(jī)(Support VectorMachine,SVM)對(duì)其進(jìn)行分類(lèi),實(shí)現(xiàn)基于圖像的場(chǎng)景識(shí)別。 由于每類(lèi)圖像對(duì)應(yīng)于機(jī)器人工作環(huán)境中的某個(gè)位置,從而實(shí)現(xiàn)機(jī)器人的邏輯定位。此種方 法的不足之處在于機(jī)器人在未知環(huán)境中采集的場(chǎng)景樣本圖像很多,屬于小樣本識(shí)別問(wèn)題 的向量機(jī)并不適用于大樣本的基于全局特征的場(chǎng)景匹配問(wèn)題。現(xiàn)有技術(shù)公開(kāi)的另一文獻(xiàn)(莊嚴(yán),徐曉東和王偉,移動(dòng)機(jī)器人幾何_拓?fù)浠旌系?圖的構(gòu)建及自定位研究[J].控制與決策,2005. 20(7) 817-822.)提出基于墻角、房門(mén)和 通路等高級(jí)環(huán)境特征的辨識(shí)與提取,以對(duì)局部環(huán)境特征進(jìn)行辨識(shí)。也有學(xué)者根據(jù)移動(dòng)機(jī) 器人工作環(huán)境和具體導(dǎo)航要求的不同,采取相應(yīng)的數(shù)字圖像處理技術(shù)對(duì)室內(nèi)環(huán)境中的垂 直邊緣與激光傳感器提取的水平線段特征進(jìn)行處理,以此作為機(jī)器人進(jìn)行定位的簡(jiǎn)單幾 何特征。加拿大科學(xué)家David Lowe提出尺度不變特征轉(zhuǎn)換(Scale-invariant feature transform, SIFT)技術(shù),詳見(jiàn)公開(kāi)文獻(xiàn)(Lowe, D. G. , Distinctive Image Features from Scale-Invariant Keypoints[J]. International Journal of Computer Vision 2004. 60 (2) :91-110.)。該方法在尺度空間上計(jì)算高斯之差,并根據(jù)其最大最小值決定具有 尺度、旋轉(zhuǎn)和平移不變性的興趣點(diǎn)位置,數(shù)據(jù)經(jīng)過(guò)處理后作為路標(biāo)。正因?yàn)樘峁┝艘环N自底 向上的良好的自然環(huán)境特征提取方案,且所提取的特征具有良好的尺度等不變性,SIFT方 法很快在移動(dòng)機(jī)器人視覺(jué)建模與定位領(lǐng)域得到了比較廣泛的采用。SIFT方法在特征提取的 可靠性、穩(wěn)定性、計(jì)算效率、匹配精度等方面的綜合性高。然而,在上述SIFT方法中,標(biāo)準(zhǔn)的SIFT特征描述向量維度有128位,無(wú)論在計(jì)算 或是儲(chǔ)存過(guò)程中都需要占用大量的資源。而且每幅圖像的特征點(diǎn)較多,例如,150幅圖像庫(kù) 的特征點(diǎn)數(shù)量可達(dá)近40,000個(gè),如此龐大的數(shù)據(jù)不僅對(duì)實(shí)時(shí)在線的特征匹配計(jì)算造成重 要的負(fù)擔(dān),而且還容易形成錯(cuò)誤的匹配。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種能夠減少SIFT特征向量的維數(shù)和減少特征點(diǎn)的數(shù)量 而不影響圖像匹配效果的基于圖像特征分析的目標(biāo)辨識(shí)方法。一種基于圖像特征分析的目標(biāo)辨識(shí)方法,包括如下步驟以SIFT特征點(diǎn)為中心,選取2X2個(gè)子區(qū)域;將每個(gè)所述子區(qū)域的8個(gè)梯度方向的梯度幅值進(jìn)行規(guī)范化處理,從所 述8個(gè)梯度方向中選取梯度幅值最大的梯度方向,將所述梯度幅值最大的梯度方向旋轉(zhuǎn)至 X軸或者Y軸,旋轉(zhuǎn)后,選取位于X軸和Y軸上的4個(gè)梯度方向;計(jì)算并比較梯度幅值的大 小,在特征點(diǎn)向量匹配閾值范圍內(nèi),選取梯度方向集中的特征點(diǎn)作為所述圖像的SIFT特征點(diǎn)。本發(fā)明優(yōu)選的一種技術(shù)方案,所述SIFT特征點(diǎn)向量為2x2x4 = 16維數(shù)。本發(fā)明優(yōu)選的一種技術(shù)方案,所述將梯度幅值進(jìn)行規(guī)范化處理的步驟通過(guò)將梯度 幅值除以某一常數(shù)或者最大梯度幅值實(shí)現(xiàn)。本發(fā)明優(yōu)選的一種技術(shù)方案,將所述梯度幅值最大的梯度方向旋轉(zhuǎn)至X軸正方 向。本發(fā)明優(yōu)選的一種技術(shù)方案,選取梯度方向集中的特征點(diǎn)作為所述圖像的SIFT 特征點(diǎn)的步驟中,選取的特征點(diǎn)占總的特征點(diǎn)數(shù)的25% 30%。本發(fā)明優(yōu)選的一種技術(shù)方案,當(dāng)所述圖像為320x240的圖像時(shí),選取的特征點(diǎn)的 個(gè)數(shù)為50。本發(fā)明優(yōu)選的一種技術(shù)方案,采用計(jì)算兩個(gè)特征點(diǎn)向量之間的歐幾里得距離,并 將所述距離與所述閾值比較,若所述距離在所述閾值范圍內(nèi),則所述兩個(gè)特征點(diǎn)之間匹配。與現(xiàn)有技術(shù)相比,本發(fā)明的基于圖像特征分析的目標(biāo)辨識(shí)方法可以顯著地減少 SIFT特征向量的維數(shù)和圖像的SIFT特征點(diǎn)的數(shù)量,減少了占用的儲(chǔ)存資源和計(jì)算時(shí)間,對(duì) 于實(shí)時(shí)在線計(jì)算要求嚴(yán)格的任務(wù)來(lái)說(shuō),本方法有著較大的優(yōu)勢(shì)。另外梯度向量經(jīng)過(guò)旋轉(zhuǎn)處 理后,對(duì)圖像發(fā)生旋轉(zhuǎn)的影響產(chǎn)生了較好的魯棒性,提高了實(shí)時(shí)在線的運(yùn)算速度和準(zhǔn)確度。
圖1是本發(fā)明的基于圖像特征分析的目標(biāo)辨識(shí)方法的流程圖。圖2是以特征點(diǎn)為中心的領(lǐng)域梯度方向的示意圖。圖3是圖2所示的關(guān)鍵特征點(diǎn)的向量示意圖。圖4是本發(fā)明的基于圖像特征分析的目標(biāo)辨識(shí)方法中最大梯度旋轉(zhuǎn)前的示意圖。圖5是本發(fā)明的基于圖像特征分析的目標(biāo)辨識(shí)方法中最大梯度旋轉(zhuǎn)后的示意圖。
具體實(shí)施例方式本發(fā)明的基于圖像特征分析的目標(biāo)辨識(shí)方法主要包括如下三個(gè)步驟降低特征點(diǎn) 向量的維度;最大梯度旋轉(zhuǎn)規(guī)范化;減少特征點(diǎn)的數(shù)量。下面結(jié)合附圖對(duì)本發(fā)明的基于圖 像特征分析的目標(biāo)辨識(shí)方法作進(jìn)一步的詳細(xì)描述。請(qǐng)參閱圖1,圖1是本發(fā)明的基于圖像特征分析的目標(biāo)辨識(shí)方法的流程圖。首先, 以SIFT特征點(diǎn)為中心,選取2X2個(gè)子區(qū)域。因?yàn)閭鹘y(tǒng)的SIFT特征點(diǎn)向量維度是128位, 也就是4x4x8,每個(gè)子區(qū)域的梯度方向有8個(gè)方向組成,這8個(gè)方向在直角坐標(biāo)系上間隔45 度分布,而這樣的子區(qū)域以特征點(diǎn)為中心共有4x4= 16個(gè)。實(shí)際上,在標(biāo)準(zhǔn)的SIFT算法 中,在計(jì)算子區(qū)域的梯度向量時(shí),由于以特征點(diǎn)為中心的二維高斯加權(quán)函數(shù)的約束,使遠(yuǎn)離 特征點(diǎn)中心的子區(qū)域梯度幅值減小,其參與特征點(diǎn)梯度計(jì)算的權(quán)值也相應(yīng)的降低了,因而, 離特征點(diǎn)中心最近的子區(qū)域在SIFT特征向量的計(jì)算中起主導(dǎo)作用,如圖2、圖3所示。而且,在機(jī)器人SLAM (Simultaneous Localization And Mapping)環(huán)境中,機(jī)器人需要識(shí)別的 是較大的局部環(huán)境特征,而不是像醫(yī)學(xué)圖像(如組織器官等)的辨認(rèn)、樣本產(chǎn)品分析那樣進(jìn) 行局部微小片斷的識(shí)別。因此,本方法只取以特征點(diǎn)為中心的2x2個(gè)子區(qū)域,每個(gè)子區(qū)域取 4個(gè)梯度方向,由此得出的特征點(diǎn)向量就變成了 2x2x4 = 16維數(shù)。最大梯度旋轉(zhuǎn)規(guī)范化主要包括兩個(gè)步驟將每個(gè)子區(qū)域的8個(gè)梯度方向的梯度幅 值進(jìn)行規(guī)范化處理;從所述8個(gè)梯度方向中選取梯度幅值最大的梯度方向,旋轉(zhuǎn)所述幅值 最大梯度的方向。優(yōu)選的,所述將梯度幅值進(jìn)行規(guī)范化處理的步驟通過(guò)將梯度幅值除以某 一常數(shù)或者最大梯度幅值實(shí)現(xiàn)。將8個(gè)梯度方向的梯度幅值進(jìn)行規(guī)范化處理后,得到幅值 規(guī)范化的一組梯度向量,以具備對(duì)圖像明暗變化的魯棒性(Robustness)。從8個(gè)梯度方向 中找到幅值最大的梯度方向,并將該方向旋轉(zhuǎn)至Y軸的正向,如圖4所示。梯度經(jīng)過(guò)旋轉(zhuǎn)處 理后,對(duì)圖像發(fā)生旋轉(zhuǎn)的影響產(chǎn)生魯棒性,此時(shí),取位于X軸和Y軸上的4個(gè)梯度方向,如圖 5所示。至此,完成特征向量維度的優(yōu)化,該過(guò)程是在圖像的SIFT產(chǎn)生過(guò)程中實(shí)現(xiàn)的。本發(fā) 明的基于圖像特征分析的目標(biāo)辨識(shí)方法中,減少向量的維度只有在非常細(xì)微辨別方面的辨 識(shí)功能降低了。最后,減少特征點(diǎn)的數(shù)量,此過(guò)程在特征點(diǎn)匹配的過(guò)程中進(jìn)行。兩個(gè)對(duì)應(yīng)的特征點(diǎn) 向量的匹配方法是采用計(jì)算其歐幾里得(Euclidean)距離來(lái)決定的,當(dāng)這個(gè)距離在一定的 門(mén)限內(nèi)時(shí),就認(rèn)為兩點(diǎn)是匹配的,定義這個(gè)匹配最小距離值為閾值,當(dāng)這個(gè)閾值越小時(shí),可 能匹配的點(diǎn)就越少,但是匹配的正確率卻越高。因此,在計(jì)算一幅圖像的特征點(diǎn)時(shí),選取具 有明顯特征的特征點(diǎn),通過(guò)計(jì)算比較其梯度的幅值(Magnitude)大小,選取梯度方向集中 (mono-Orientation)的特征點(diǎn)作為所述圖像的SIFT特征點(diǎn)。當(dāng)區(qū)域中有3 5個(gè)正確的 特征點(diǎn)就可以完成識(shí)別的任務(wù)。優(yōu)選的,選取的特征點(diǎn)占總的特征點(diǎn)數(shù)的25% 30%。當(dāng) 所述圖像為320x240的圖像時(shí),所述特征點(diǎn)的個(gè)數(shù)為50。與現(xiàn)有技術(shù)相比,本發(fā)明的基于圖像特征分析的目標(biāo)辨識(shí)方法可以顯著地減少 SIFT特征向量的維數(shù),使SIFT特征向量從128維/點(diǎn)變成16維/點(diǎn),并且圖像的SIFT特 征點(diǎn)的數(shù)據(jù)減少到原來(lái)的25%左右,因此,不僅存在儲(chǔ)存方面的優(yōu)勢(shì),在計(jì)算時(shí)間上也有很 大提高,對(duì)于實(shí)時(shí)在線計(jì)算要求嚴(yán)格的任務(wù)來(lái)說(shuō),本方法有著較大的優(yōu)勢(shì)。本發(fā)明雖然減少了維度的數(shù)量,會(huì)出現(xiàn)一些假的匹配點(diǎn),但是通過(guò)提高特征點(diǎn)匹 配的要求,即降低匹配閾值,實(shí)現(xiàn)正確選取少的特征點(diǎn),并不會(huì)降低圖像匹配率。另外梯度 向量經(jīng)過(guò)旋轉(zhuǎn)處理后,對(duì)圖像發(fā)生旋轉(zhuǎn)的影響產(chǎn)生了較好的魯棒性,提高了實(shí)時(shí)在線的運(yùn) 算速度和準(zhǔn)確度。本發(fā)明的基于圖像特征分析的目標(biāo)辨識(shí)方法有效地降低了基于視覺(jué)的移動(dòng)機(jī)器 人的導(dǎo)航與定位算法的復(fù)雜度,通過(guò)對(duì)周?chē)h(huán)境的圖像分析和理解,加強(qiáng)對(duì)局部環(huán)境中目 標(biāo)特征的識(shí)別效率,提高了實(shí)時(shí)在線的運(yùn)算速度和定位的準(zhǔn)確度,對(duì)于智能移動(dòng)機(jī)器人在 探測(cè)未知空間環(huán)境應(yīng)用上,有效地提高了機(jī)器人的自身定位和創(chuàng)建環(huán)境地圖的可靠性、穩(wěn) 定性以及高效性。本發(fā)明的基于圖像特征分析的目標(biāo)辨識(shí)方法的最大梯度旋轉(zhuǎn)規(guī)范化步驟中,從8 個(gè)梯度方向中找到幅值最大的梯度方向,并將該方向旋轉(zhuǎn)至Y軸的正向,也可以將該方向 旋轉(zhuǎn)至Y軸的負(fù)向、或者X軸的正向或者負(fù)向上,但并不限于上述實(shí)施方式所述。在不偏離本發(fā)明的精神和范圍的情況下還可以構(gòu)成許多有很大差別的實(shí)施例。應(yīng)當(dāng)理解,除了如所附的權(quán)利要求所限定的,本發(fā)明不限于在說(shuō)明書(shū)中所述的具體實(shí)施例。
權(quán)利要求
1.一種基于圖像特征分析的目標(biāo)辨識(shí)方法,其特征在于,包括如下步驟以SIFT特征點(diǎn)為中心,選取2X2個(gè)子區(qū)域;將每個(gè)所述子區(qū)域的8個(gè)梯度方向的梯度幅值進(jìn)行規(guī)范化處理,從所述8個(gè)梯度方向 中選取梯度幅值最大的梯度方向,將所述梯度幅值最大的梯度方向旋轉(zhuǎn)至X軸或者Y軸,旋 轉(zhuǎn)后,選取位于X軸和Y軸上的4個(gè)梯度方向;計(jì)算并比較梯度幅值的大小,在特征點(diǎn)向量匹配閾值范圍內(nèi),選取梯度方向集中的特 征點(diǎn)作為所述圖像的SIFT特征點(diǎn)。
2.如權(quán)利要求1所述的基于圖像特征分析的目標(biāo)辨識(shí)方法,其特征在于,所述SIFT特 征點(diǎn)向量為2x2x4 = 16維數(shù)。
3.如權(quán)利要求1所述的基于圖像特征分析的目標(biāo)辨識(shí)方法,其特征在于,所述將梯度 幅值進(jìn)行規(guī)范化處理的步驟通過(guò)將梯度幅值除以某一常數(shù)或者最大梯度幅值實(shí)現(xiàn)。
4.如權(quán)利要求1所述的基于圖像特征分析的目標(biāo)辨識(shí)方法,其特征在于,將所述梯度 幅值最大的梯度方向旋轉(zhuǎn)至X軸正方向。
5.如權(quán)利要求1所述的基于圖像特征分析的目標(biāo)辨識(shí)方法,其特征在于,選取梯度方 向集中的特征點(diǎn)作為所述圖像的SIFT特征點(diǎn)的步驟中,選取的特征點(diǎn)占總的特征點(diǎn)數(shù)的 25% 30%。
6.如權(quán)利要求1所述的基于圖像特征分析的目標(biāo)辨識(shí)方法,其特征在于,當(dāng)所述圖像 為320x240的圖像時(shí),選取的特征點(diǎn)的個(gè)數(shù)為50。
7.如權(quán)利要求1所述的基于圖像特征分析的目標(biāo)辨識(shí)方法,其特征在于,采用計(jì)算兩 個(gè)特征點(diǎn)向量之間的歐幾里得距離,并將所述距離與所述閾值比較,若所述距離在所述閾 值范圍內(nèi),則所述兩個(gè)特征點(diǎn)之間匹配。
全文摘要
本發(fā)明涉及一種基于圖像特征分析的目標(biāo)辨識(shí)方法,包括如下步驟以SIFT特征點(diǎn)為中心,選取2×2個(gè)子區(qū)域;將每個(gè)所述子區(qū)域的8個(gè)梯度方向的梯度幅值進(jìn)行規(guī)范化處理,從所述8個(gè)梯度方向中選取梯度幅值最大的梯度方向,將所述梯度幅值最大的梯度方向旋轉(zhuǎn)至X軸或者Y軸,旋轉(zhuǎn)后,選取位于X軸和Y軸上的4個(gè)梯度方向;計(jì)算并比較梯度幅值的大小,在特征點(diǎn)向量匹配閾值范圍內(nèi),選取梯度方向集中的特征點(diǎn)作為所述圖像的SIFT特征點(diǎn)。本發(fā)明的方法減少了SIFT特征向量的維數(shù)和特征點(diǎn)的數(shù)量而不影響圖像匹配效果,加強(qiáng)了對(duì)環(huán)境目標(biāo)識(shí)別的速度和準(zhǔn)確度,提高了整個(gè)算法的實(shí)時(shí)在線運(yùn)行速度和匹配的準(zhǔn)確度。
文檔編號(hào)G06T7/00GK102004921SQ20101055985
公開(kāi)日2011年4月6日 申請(qǐng)日期2010年11月24日 優(yōu)先權(quán)日2010年11月24日
發(fā)明者孫強(qiáng), 王海軍 申請(qǐng)人:上海電機(jī)學(xué)院