專利名稱:基于稀疏表示和視皮層注意機(jī)制的目標(biāo)檢測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,更進(jìn)ー步涉及自然場(chǎng)景圖像處理技術(shù)領(lǐng)域中的一種基于稀疏表示和視皮層注意機(jī)制的目標(biāo)檢測(cè)方法。本發(fā)明可用于道路標(biāo)志檢測(cè)、視頻監(jiān)控、眼動(dòng)預(yù)測(cè)和目標(biāo)識(shí)別。
背景技術(shù):
目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)和模式識(shí)別系統(tǒng)中非常關(guān)鍵的技術(shù)之一,目標(biāo)檢測(cè)的效果直接影響著整個(gè)系統(tǒng)的可靠性和有效性。然而基于圖像處理、機(jī)器學(xué)習(xí)等簡(jiǎn)單的方法并不能夠完全適用于大多數(shù)的圖像。因此,需要關(guān)注人類視覺(jué)注意機(jī)制,研究人類眼睛是如何搜尋、查找和檢測(cè)自然場(chǎng)景中的目標(biāo)的。視覺(jué)注意機(jī)制,是靈長(zhǎng)目類動(dòng)物視覺(jué)系統(tǒng)的ー個(gè)內(nèi)在的屬性。它是ー種將人目光注視引導(dǎo)到場(chǎng)景中感興趣物體的機(jī)制。通常,進(jìn)入人們視野的視覺(jué)信息是海量的,但是從這些海量的信息中,人們依然能夠搜尋到想要的信息。根據(jù)心理學(xué)的很多研究實(shí)驗(yàn)成果,已經(jīng)模擬出了許多人類大腦感知事物的模型,而這些模型大都僅僅適用于解釋某些心理物理學(xué)實(shí)驗(yàn)的結(jié)果,并不能直接用于自然圖像處理中的目標(biāo)檢測(cè)?,F(xiàn)有最著名的視覺(jué)注意計(jì)算方法就是視覺(jué)顯著性計(jì)算方法,視覺(jué)注意是與周圍環(huán)境完全與眾不同的目標(biāo)物會(huì)自動(dòng)的從視野環(huán)境中“跳出”并且吸引注意力的關(guān)注。選擇性注意力機(jī)制可以將人們的視覺(jué)關(guān)注引導(dǎo)到在場(chǎng)景中稱之為“顯著性區(qū)域”的那一部分。視覺(jué)的顯著性計(jì)算方法提供了關(guān)于這些可能吸引觀測(cè)者注意力的預(yù)測(cè)區(qū)域。在視覺(jué)顯著性計(jì)算方法中有一種視覺(jué)顯著性檢測(cè)的方法。例如,杭州電子科技大學(xué)在其專利申請(qǐng)“基于韋伯定理和中央-周圍假設(shè)的視覺(jué)顯著性檢測(cè)方法”(專利申請(qǐng)?zhí)?201110002235.0,公開(kāi)號(hào)CN102103750A)中提出了ー種視覺(jué)顯著性檢測(cè)方法。該專利申請(qǐng)利用彩色變換方法提取于是圖像的CIELAB空間彩色分量圖,再根據(jù)韋伯定理計(jì)算各個(gè)彩色分量圖中每個(gè)像素點(diǎn)的水平梯度差勵(lì)值和遲滯梯度差勵(lì)值,接著由水平梯度差勵(lì)值和遲滯梯度差勵(lì)值計(jì)算任意梯度方向的差勵(lì)值,統(tǒng)計(jì)差勵(lì)直方圖,最后每個(gè)像素點(diǎn)建立其局部顯著性激勵(lì)矢量,得到局部顯著性判決值和全局顯著性激勵(lì)值,并由此得到顯著性判決值。 該方法雖然能夠能夠獲得與輸入圖像相同分辨率的視覺(jué)顯著性圖,但仍存在的不足是,計(jì)算復(fù)雜度高,并且沒(méi)有更好的模擬人類視皮層注意機(jī)制,使得到的顯著性圖不能很好的符合人眼對(duì)目標(biāo)的感知。在視覺(jué)顯著性計(jì)算方法中還有ー種基于HMAX的目標(biāo)分類方法。例如, Riesenhuber 禾ロ Poggio 在又獻(xiàn)“Riesenhuber M,Poggio Τ. Hierarchical models of object recognition in cortex[J]. Nature Neuroscience,1999,2(11) :1019-1025. ” 中提出了ー種目標(biāo)分類方法。Serre等人改進(jìn)了該方法。該方法將原始圖像經(jīng)過(guò)四層分解,分別得到Sl単元圖、Cl単元圖、S2單元圖和C2特征矢量,該方法提取的特征具有旋轉(zhuǎn)、平移等不變性,并且保留了局部特征的幾何特性,對(duì)位置和尺度不敏感,即使對(duì)于有稍許變形和失真的輸入圖像,仍能取得很好的分類效果方法。但是,該方法存在的不足之處是,不能直接用來(lái)尋找圖像的顯著性區(qū)域,忽略了顯著性或者目標(biāo)的位置,即不能模擬人腦的“位置通路”。
發(fā)明內(nèi)容
本發(fā)明針對(duì)上述現(xiàn)有技術(shù)存在的不足,提出了 ー種基于稀疏表示和視皮層注意機(jī)制的目標(biāo)檢測(cè)方法。本發(fā)明在尋找自然場(chǎng)景圖像的顯著性上更能符合人眼的感知特性,既降低了現(xiàn)有技術(shù)復(fù)雜度,又具有較高的正確率和較低的誤檢率;在心理學(xué)刺激模式圖片上的與傳統(tǒng)的顯著圖檢測(cè)方法相比也有較好有效性和準(zhǔn)確性。本發(fā)明實(shí)現(xiàn)上述目的的思路是首先,使用多尺度,多方向的Gabor濾波器組對(duì)輸入的待檢測(cè)圖像進(jìn)行Gabor濾波,提取得到HMAX模型的Sl層細(xì)胞;其次使用取樣和最大化操作獲得HMAX模型的Cl層細(xì)胞;再次,利用獨(dú)立成分分析ICA,用HMAX模型的Cl層細(xì)胞構(gòu)造稀疏基;最后,利用對(duì)尺度和平移具有不變性的C2層細(xì)胞以及香農(nóng)熵理論,構(gòu)造用于視覺(jué)顯著性區(qū)域檢測(cè)的測(cè)度,得到原始圖像的顯著性圖。本發(fā)明的步驟包括如下(1)輸入待檢測(cè)圖像;(2)使用多尺度,多方向的Gabor濾波器組對(duì)輸入的待檢測(cè)圖像進(jìn)行Gabor濾波, 提取得到HMAX模型的Sl層細(xì)胞;(3)對(duì)Sl層細(xì)胞采樣并使用最大化操作,提取得到HMAX模型的Cl層細(xì)胞;(4)獲得稀疏基4a)對(duì)Cl層細(xì)胞的各個(gè)方向隨機(jī)抽取大小為4X4的采樣塊,將抽取的采樣塊內(nèi)像素按從左至右,從上至下的順序?qū)懗闪邢蛄啃问?;重?fù)抽取2000次,得到2000個(gè)列向量;4b)將2000個(gè)列向量同時(shí)輸入到獨(dú)立成分分析ICA系統(tǒng)中,獲得稀疏基;(5)提取S2層細(xì)胞5a)將訓(xùn)練圖像作為樣本圖像,對(duì)輸入的樣本圖像依次進(jìn)行步驟(2)和(3)的操作,得到樣本圖像的Cl層細(xì)胞,對(duì)樣本圖像的Cl層細(xì)胞使用取樣方法產(chǎn)生特征塊模板,每個(gè)特征塊模板用一個(gè)矩陣表示;5b)對(duì)Cl層細(xì)胞使用取樣方法產(chǎn)生Cl層細(xì)胞采樣塊,每個(gè)Cl層細(xì)胞的采樣塊用一個(gè)矩陣表示;5c)將特征塊模板與Cl層細(xì)胞采樣塊按照徑向基函數(shù)匹配方法,獲得HMAX模型的 S2層細(xì)胞;(6)對(duì)輸出的S2層細(xì)胞使用最大值操作,獲得HMAX模型的C2層細(xì)胞;(7)按如下公式計(jì)算C2層細(xì)胞的信息熵
權(quán)利要求
1.基于稀疏表示和視皮層注意機(jī)制的目標(biāo)檢測(cè)方法,包括如下步驟(1)輸入待檢測(cè)圖像;(2)使用多尺度,多方向的Gabor濾波器組對(duì)輸入的待檢測(cè)圖像進(jìn)行Gabor濾波,提取得到HMAX模型的Sl層細(xì)胞;(3)對(duì)Sl層細(xì)胞采樣并使用最大化操作,提取得到HMAX模型的Cl層細(xì)胞;(4)獲得稀疏基4a)對(duì)Cl層細(xì)胞的各個(gè)方向隨機(jī)抽取大小為4X4的采樣塊,將抽取的采樣塊內(nèi)像素按從左至右,從上至下的順序?qū)懗闪邢蛄啃问剑恢貜?fù)抽取2000次,得到2000個(gè)列向量;4b)將2000個(gè)列向量同時(shí)輸入到獨(dú)立成分分析ICA系統(tǒng)中,獲得稀疏基;(5)提取S2層細(xì)胞5a)將訓(xùn)練圖像作為樣本圖像,對(duì)輸入的樣本圖像依次進(jìn)行步驟(2)和(3)的操作,得到樣本圖像的Cl層細(xì)胞,對(duì)樣本圖像的Cl層細(xì)胞使用取樣方法產(chǎn)生特征塊模板,每個(gè)特征塊模板用一個(gè)矩陣表示;5b)對(duì)Cl層細(xì)胞使用取樣方法產(chǎn)生Cl層細(xì)胞采樣塊,每個(gè)Cl層細(xì)胞的采樣塊用ー個(gè)矩陣表示;5c)將特征塊模板與Cl層細(xì)胞采樣塊按照徑向基函數(shù)匹配方法,獲得HMAX模型的S2 層細(xì)胞;(6)對(duì)輸出的S2層細(xì)胞使用最大值操作,獲得HMAX模型的C2層細(xì)胞;(7)按如下公式計(jì)算C2層細(xì)胞的信息熵
2.根據(jù)權(quán)利要求1所述的基于稀疏表示和視皮層注意機(jī)制的目標(biāo)檢測(cè)方法,其特征在于步驟( 所述的Gabor濾波步驟是第一歩,構(gòu)造由4個(gè)方向,16個(gè)尺度組成的Gabor濾波器組
3.根據(jù)權(quán)利要求1所述的基于稀疏表示和視皮層注意機(jī)制的目標(biāo)檢測(cè)方法,其特征在于步驟(3)所述的采樣并進(jìn)行最大化操作提取Cl層細(xì)胞的步驟是第一歩,將8個(gè)子帶各個(gè)方向的任一響應(yīng)圖劃分成對(duì)應(yīng)于各個(gè)子帶采樣寬度的正方形子格,然后再將這些子格劃分成同樣大小的正方形格子,完成減采樣過(guò)程;在每個(gè)正方形格子中取響應(yīng)的最大值,得到最大值圖;第二歩,對(duì)每個(gè)子帶兩個(gè)相鄰尺度的最大值圖進(jìn)行比較,求其對(duì)應(yīng)格子的最大值,得到具有不變性質(zhì)的Cl層細(xì)胞。
4.根據(jù)權(quán)利要求1所述的基于稀疏表示和視皮層注意機(jī)制的目標(biāo)檢測(cè)方法,其特征在于步驟5a)所述的取樣產(chǎn)生特征塊模板的方法是從所有樣本圖像的Cl層細(xì)胞中隨機(jī)選擇ー個(gè)子帯,在該子帶包含的各個(gè)方向上抽取不同位置的正方形區(qū)域,將抽取的每個(gè)區(qū)域作為ー個(gè)特征塊模板。
5.根據(jù)權(quán)利要求1所述的基于稀疏表示和視皮層注意機(jī)制的目標(biāo)檢測(cè)方法,其特征在于步驟5b)所述的取樣產(chǎn)生Cl細(xì)胞采樣塊的方法是從Cl層細(xì)胞中每個(gè)子帶的各個(gè)方向上抽取不同位置的正方形區(qū)域,將抽取的所有區(qū)域作為Cl層細(xì)胞采樣塊。
6.根據(jù)權(quán)利要求1所述的基于稀疏表示和視皮層注意機(jī)制的目標(biāo)檢測(cè)方法,其特征在于步驟5c)所述的徑向基函數(shù)匹配方法是按照下式將特征塊模板與Cl層細(xì)胞采樣塊進(jìn)行匹配運(yùn)算得到S2層細(xì)胞;Ys = exp (- y Il Xt-Ps Il 2)其中,Ys 層細(xì)胞的響應(yīng)值,exp為指數(shù)運(yùn)算符號(hào),、為縱橫比,Il Il 2為歐式距離的平方運(yùn)算符號(hào),)(τ為Cl層細(xì)胞采樣塊構(gòu)成的矩陣,T= 1,2,…M,M為Cl層細(xì)胞采樣塊的個(gè)數(shù),Ps為特征值模板構(gòu)成的矩陣,S= 1,2,…N,N為特征塊模板的個(gè)數(shù)。
7.根據(jù)權(quán)利要求1所述的基于稀疏表示和視皮層注意機(jī)制的目標(biāo)檢測(cè)方法,其特征在于步驟(6)所述的最大化操作提取C2層細(xì)胞的方法是對(duì)屬于各個(gè)特征塊模板的S2層細(xì)胞選其中的最大值作為C2層細(xì)胞,N個(gè)模板得到N個(gè)最大值,共得到N個(gè)C2層細(xì)胞。
全文摘要
本發(fā)明公開(kāi)了一種基于稀疏表示和視皮層注意機(jī)制的目標(biāo)檢測(cè)方法,其實(shí)現(xiàn)步驟為(1)使用多尺度,多方向的Gabor濾波器組對(duì)輸入的待檢測(cè)圖像進(jìn)行Gabor濾波,提取得到HMAX模型的S1層細(xì)胞;(2)利用獨(dú)立成分分析ICA,用HMAX模型的C1層細(xì)胞構(gòu)造稀疏基;(3)利用對(duì)尺度和平移具有不變性的C2層細(xì)胞以及香農(nóng)熵理論,得到C2層細(xì)胞的信息熵,更進(jìn)一步構(gòu)造用于視覺(jué)顯著性區(qū)域檢測(cè)的測(cè)度,得到原始圖像的顯著性圖。本發(fā)明在尋找自然場(chǎng)景圖像的顯著性上更能符合人眼的感知特性,具有較高的正確率和較低的誤檢率;在心理學(xué)刺激模式圖片上的與傳統(tǒng)的顯著圖檢測(cè)方法相比也有較好有效性和準(zhǔn)確性。
文檔編號(hào)G06T7/00GK102567997SQ20121000167
公開(kāi)日2012年7月11日 申請(qǐng)日期2012年1月4日 優(yōu)先權(quán)日2012年1月4日
發(fā)明者李潔, 王秀美, 王穎, 趙曉靜, 路文, 鄧成, 韓冰, 高新波 申請(qǐng)人:西安電子科技大學(xué)