一種基于稀疏自編碼和稀疏表示進(jìn)行交通標(biāo)志識(shí)別的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)自動(dòng)控制應(yīng)用領(lǐng)域,具體涉及一種基于基于稀疏自編碼和稀疏 表示進(jìn)行交通標(biāo)志識(shí)別的方法。
【背景技術(shù)】
[0002] 智能交通系統(tǒng)由于其安全、可靠、高效的特性,受到交通管理部門越來越多的重 視。交通標(biāo)志識(shí)別是智能交通的重要組成部分,在無人駕駛、輔助駕駛、交通標(biāo)志維護(hù)等多 方面有著重要作用。人類視覺系統(tǒng)可以容易地識(shí)別交通標(biāo)志,然而,讓計(jì)算機(jī)對(duì)交通標(biāo)志進(jìn) 行識(shí)別仍是一個(gè)極具挑戰(zhàn)性的課題。在真實(shí)的交通場(chǎng)景中,由于天氣變化,光照條件,局部 遮擋,尺度變化,背景干擾,某些不同類交通標(biāo)志之間較小的類間距離等問題使得交通標(biāo)志 識(shí)別方法的研究遠(yuǎn)未達(dá)到成熟。因此,找到一種能夠克服上述困難,對(duì)交通標(biāo)志圖片進(jìn)行有 效識(shí)別方法具有重要意義。
[0003] 當(dāng)前的交通標(biāo)志識(shí)別方法一般分為兩個(gè)步驟:特征提取和分類器設(shè)計(jì)。在特征提 取階段,研究者使用的特征通常是Haar特征,類別顯著性特征,距離變換特征,H0G特征等。 然而,這些特征通常是根據(jù)某些先驗(yàn)知識(shí)手動(dòng)設(shè)計(jì)得到的,對(duì)于交通標(biāo)志識(shí)別任務(wù)來說,手 動(dòng)設(shè)計(jì)的方式無法提取足夠充分的特征;在分類器設(shè)計(jì)階段,通常需要確定分類器的參數(shù), 增加整個(gè)識(shí)別算法的計(jì)算復(fù)雜度。稀疏自編碼模型可以自動(dòng)提取輸入數(shù)據(jù)的充分有效特 征,運(yùn)用稀疏表示原理完成測(cè)試樣本的重構(gòu)可以避免分類過程的分類器設(shè)計(jì)。
[0004] 近來,稀疏自編碼模型成為機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn),該模型可以在無人工干預(yù) 的情況下,提取輸入數(shù)據(jù)的充分有效特征,該模型提取的特征信息包含在權(quán)重字典中。稀疏 表示在計(jì)算機(jī)視覺領(lǐng)域有著廣泛應(yīng)用,它將輸入信號(hào)建模成字典中少數(shù)原子的線性組合。 使用稀疏自編碼模型獲得的權(quán)重字典,采用稀疏表示原理獲得測(cè)試圖像塊的稀疏系數(shù),從 而獲得重構(gòu)圖像塊,最后根據(jù)重構(gòu)圖像塊與測(cè)試圖像塊之間距離的大小完成識(shí)別。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種基于基于稀疏自編碼和稀疏表示進(jìn)行交通標(biāo)志識(shí)別 的方法,有效解決現(xiàn)有識(shí)別方法特征提取不充分、分類器設(shè)計(jì)帶來的高計(jì)算復(fù)雜度問題。
[0006] -種基于稀疏自編碼和稀疏表示進(jìn)行交通標(biāo)志識(shí)別的方法,包括:
[0007] (1)搜集包含有交通標(biāo)志的圖片,手工將其分成1類,分別記為:. . .,C1;
[0008] (2)對(duì)每一類含有交通標(biāo)志的圖片進(jìn)行取塊,圖像塊的大小相同,每一類的圖像塊 分別記為:Ρι,Ρ2,…,Ρι;
[0009] (3)對(duì)圖像塊Ρι,Ρ2,...,Ρι進(jìn)行預(yù)處理(包括正規(guī)化和白化),預(yù)處理后的圖像塊記 為:ΡΛΡ 2,,···,Ρι,;
[0010] ⑷將?^,ρ2',...,Pi'作為訓(xùn)練樣本,分別訓(xùn)練1個(gè)稀疏自編碼器,獲取的權(quán)重字 典分別記為:Di,D2, · · ·,Di;
[0011] (5)取一幅包含未知交通標(biāo)志的測(cè)試圖片,取與(1)中大小相同的圖像塊,記為:X;
[0012] (6)運(yùn)用稀疏表示原理,采用OMP算法,分別計(jì)算X在權(quán)重字典DiA,. . .,Di下的稀 疏系數(shù):αι,α2, · · ·,α1;
[0013] (7)分別計(jì)算 I |X-DlC[1| |F,| |X-D2a2| |F,...,| Ιχ-Dicnl |F,選擇 F 范數(shù)最小的字典類 別作為測(cè)試圖片的交通標(biāo)志識(shí)別結(jié)果。
[0014] 上述步驟(1)的具體步驟為:搜集含有交通標(biāo)志的圖片,人工將其分成1類,記為: &,C2,. . .,Ci。&,C2,. . .,Ci中的圖片,盡量包含多張不同光照、天氣、尺度、遮擋等情況的照 片,并將每幅圖片變成128X128。
[0015] 所述步驟(2)中的取塊步驟為:對(duì)&,&,...,&分別進(jìn)行取塊,運(yùn)用滑動(dòng)窗技術(shù),步 長為1,取塊大小為8X8,并將圖像塊拉成64維的列向量,獲得的圖像塊記為
[0016] 所述步驟(3)中的預(yù)處理操作包括正規(guī)化和白化,具體方法為:
[0017] (i)用Μ(Ρ〇表示第i類圖像塊?1中的樣本均值,用D(P〇表示Pi中的樣本方差,正規(guī) 化具體為:M(Pi)/D(Pi);
[0018] (ii)正規(guī)化后的圖像塊進(jìn)行白化操作。白化操作的目的是去除相關(guān)性。用Σ(Ρ〇 表示Pi的協(xié)方差,計(jì)算Σ (Ρ〇特征值和特征向量,特征值組成的列向量記為Si,記
,Σ (Ρ,)的特征向量組成的矩陣記為U,,白化操作可表示為: = U fS、?
[0019] 所述步驟(4)中的稀疏自編碼器,基本結(jié)構(gòu)是包括輸入層(64個(gè)節(jié)點(diǎn))、隱含層 (1600個(gè)節(jié)點(diǎn))和輸出層(64個(gè)節(jié)點(diǎn))的神經(jīng)網(wǎng)絡(luò),所不同的是,稀疏自編碼器逼近的是樣本 自身。稀疏自編碼器的具體訓(xùn)練過程為:
[0020] (i)令巧=式},.選取隱含層的激活函數(shù)為sigmoid函數(shù):g(z) = 1 /(1+exp (-z)),則隱含層的輸出為abihaWpi+bO,其中Wi即為權(quán)重字典Di,bi為偏置向量;
[0021] (ii)設(shè)稀疏自編碼器的輸出值為:月=隹;,瓦2,.··,瓦},則泛+ 4為和bs分 別為隱含層到輸出層的權(quán)重和偏置向量;
[0022] (i i i)稀疏自編碼器的方差代價(jià)函數(shù)為:
[0023] (vi)權(quán)重衰減項(xiàng)表示為:
,其中λ是權(quán)重衰減參數(shù);
[0024] (V)稀疏自編碼器的代價(jià)函數(shù)用J表示,則優(yōu)化目標(biāo)是
[0026]其中β是稀疏性懲罰因子權(quán)重系數(shù),用aJpO表示第j個(gè)隱含層節(jié)點(diǎn)的輸出,
表示第j個(gè)隱含層節(jié)點(diǎn)平均輸出值,燈(廣|/77)=/ 71〇§(廣//^)+<1-沖〇g(【-/V 1-A-)! ρ是稀疏性系數(shù),可取ρ=〇. 05。
[0027]使用L-BFGS算法完成J的優(yōu)化,獲得最優(yōu)的I,也就是第i類交通標(biāo)志的權(quán)重字典 Di,采用相同方法獲得其他類的權(quán)重字典:. . .,Di。
[0028]所述步驟(5)的具體步驟是:選取大小為128X128的包含未知交通標(biāo)志的圖片,無 重疊取8X8大小的塊,每一個(gè)塊均拉成列向量,組成測(cè)試圖像塊:X={X1,X2, . . .,X64},Xe ^64X256
[0029] 所述步驟(6)中的稀疏表示原理,對(duì)權(quán)重字典Di,和X中的每個(gè)圖像塊Xj,j = 1, 2, . . .,64,
j = l,2, . . .,64,找到X的稀疏系數(shù),記為: α,. = {α),α,2,…,<4丨,具體求解方法使用0ΜΡ算法(Pati Y C,Rezaiifar R,Krishnaprasad P S. Orthogonal matching pursuit:Recursive function approximation with applications to wavelet decomposition[C]. Signals , Systems and Computers , 1993.1993 Conference Record of The Twenty-Seventh AsilomarConference on.IEEE, 1993:40-44.)。使用同樣方法,獲得X在權(quán)重字典DiD%. . .,Di下的稀疏系數(shù)W2,. . .,ai。
[0030] 所述步驟(7)中的01〇14 = 1,2,...,1完成圖像塊的重構(gòu),計(jì)算重構(gòu)圖像塊與原圖 像塊之間的F范數(shù),選擇F范數(shù)最小的字典類別作為測(cè)試圖片的交通標(biāo)志識(shí)別結(jié)果。
[0031 ]相對(duì)于目前現(xiàn)有交通標(biāo)志識(shí)別方法,本發(fā)明的有益效果是:
[0032] 1.本發(fā)明使用稀疏自編碼器作為特征提取模型,相對(duì)于現(xiàn)有的基于手工設(shè)計(jì)的特 征提取方法,該模型提取的特征更加充分,能更有效地進(jìn)行識(shí)別。
[0033] 2.本發(fā)明在識(shí)別階段計(jì)算重構(gòu)圖像塊與原圖像塊之間的距離,并將