一種基于主成分分析網(wǎng)框架的車型識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于圖像處理、模式分類和數(shù)據(jù)挖掘技術(shù)領(lǐng)域,特別涉及一種基于主成分分析網(wǎng)框架的車型識(shí)別方法。
[0002]發(fā)明背景
[0003]基于視覺(jué)語(yǔ)義的圖像分類一直以來(lái)都是一個(gè)充滿挑戰(zhàn)的研究領(lǐng)域,不僅僅待識(shí)別的圖像種類繁多,在每一類圖像的內(nèi)部也存在諸多變數(shù),包括光照變化、不匹配不對(duì)齊、形變因素、遮擋因素等等。針對(duì)這些變數(shù),學(xué)者們做了各種各樣的努力,提出各種各樣的特征來(lái)應(yīng)對(duì)這些變化。比較典型的例子有文本分類、車型分類中用到的LBP特征、目標(biāo)識(shí)別中用到的SIFT和H0G特征。雖然這些手選的底層特征能夠很好的應(yīng)對(duì)特定情況下的數(shù)據(jù)處理任務(wù),但是這些特征的泛化能力有限,對(duì)待新問(wèn)題往往需要構(gòu)建新的特征。
[0004]從數(shù)據(jù)中學(xué)習(xí)得到感興趣的特征被認(rèn)為是克服手選特征局限性的一個(gè)好的方法,最典型的一個(gè)例子就是通過(guò)深度神經(jīng)網(wǎng)路來(lái)進(jìn)行特征學(xué)習(xí)。深度學(xué)習(xí)的基本思想是通過(guò)構(gòu)建多層網(wǎng)絡(luò),對(duì)目標(biāo)進(jìn)行多層表示,以期通過(guò)多層的高層次特征來(lái)表示數(shù)據(jù)的抽象語(yǔ)義信息,獲得更好的特征魯棒性。目前深度學(xué)習(xí)中一個(gè)關(guān)鍵的、相對(duì)成功的框架是卷積網(wǎng)絡(luò)框架。一個(gè)深度卷積網(wǎng)絡(luò)結(jié)構(gòu)包含多層訓(xùn)練結(jié)構(gòu)以及有監(jiān)督的分類器,每一層都包含三個(gè)子層,分別為卷積層、非線性處理層以及下采樣層。對(duì)于這種卷積網(wǎng)絡(luò)結(jié)構(gòu)一般都通過(guò)梯度下降法對(duì)其進(jìn)行訓(xùn)練。然而要想學(xué)習(xí)得到一個(gè)優(yōu)質(zhì)的卷及網(wǎng)絡(luò)分類結(jié)構(gòu),需要有各種各樣的調(diào)參經(jīng)驗(yàn)和技巧。
[0005]目前,針對(duì)不同的視覺(jué)識(shí)別任務(wù),人們提出了許多各種各樣的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),并取得了顯著效果。例如較為成功的小波散射模型,其通過(guò)將卷積核改為小波核來(lái)避免算法學(xué)習(xí)的步驟。然而就是這一簡(jiǎn)單改動(dòng),使其能夠在手寫(xiě)數(shù)字識(shí)別和文本識(shí)別等方面超過(guò)相同層次的卷積網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò),不過(guò)它在車型識(shí)別方面表現(xiàn)不佳,難以應(yīng)對(duì)光照變化和遮擋影響。
[0006]根據(jù)以上所述,本發(fā)明提出了一種基于主成分分析網(wǎng)框架的車型識(shí)別方法,提出了一個(gè)很簡(jiǎn)潔的關(guān)于車型識(shí)別的深度學(xué)習(xí)框架,這個(gè)框架主要依賴幾個(gè)基本的數(shù)據(jù)處理方法:(1)主成分分析PCA; (2)二值化哈希編碼;(3)分塊直方圖。在這個(gè)框架中,首先通過(guò)PCA方法來(lái)學(xué)習(xí)多層濾波器核,然后使用二值化哈希編碼以及塊直方圖特征來(lái)進(jìn)行下采樣和編碼操作,可以很好地解決上述問(wèn)題,算法快速高效,提高了識(shí)別速度,消耗內(nèi)存少,具有較高的實(shí)用性和魯棒性。
【發(fā)明內(nèi)容】
[0007]本發(fā)明中所述方法是為了克服上述現(xiàn)有技術(shù)的缺點(diǎn),主要針對(duì)車型圖像進(jìn)行特征提取和對(duì)車型進(jìn)行細(xì)分識(shí)別的問(wèn)題,提出了一種基于主成分分析網(wǎng)框架的車型識(shí)別方法。具體的技術(shù)方案如下所述。
[0008]—種基于主成分分析網(wǎng)框架的車型識(shí)別方法,包括以下步驟:
[0009]步驟1:對(duì)訓(xùn)練車型圖像庫(kù)的車型圖像,進(jìn)行滑動(dòng)窗口選取特征和去平均操作,得到圖像的初步特征;
[0010]步驟2:所有圖像的初步特征塊構(gòu)成矩陣X,對(duì)X做PCA,取前L1個(gè)特征向量,將其每列重排,得到L1個(gè)新窗口;
[0011 ]步驟3:對(duì)每個(gè)車型圖像,用L1個(gè)新窗口做卷積,都得到L1個(gè)卷積圖像;
[0012]步驟4:對(duì)當(dāng)前圖像的每個(gè)卷積圖像再次執(zhí)行步驟1-步驟3的操作,得到L1組卷積圖像的集合,L1中每組有L2個(gè)卷積圖像;
[0013]步驟5:對(duì)集合中每組卷積圖像進(jìn)行二值化和權(quán)值相加處理,得到新的L1張圖像;
[0014]步驟6:將新的L1張圖像進(jìn)行分塊直方圖操作,聯(lián)合后得到當(dāng)前圖像的主成分分析網(wǎng)框架特征表示;
[0015]步驟7:將得到的所有圖像的主成分分析網(wǎng)框架特征表示進(jìn)行SVM訓(xùn)練,得到車型識(shí)別系統(tǒng);
[0016]步驟8:對(duì)測(cè)試車型圖像,提取其主成分分析網(wǎng)框架特征,導(dǎo)入系統(tǒng)進(jìn)行測(cè)試,識(shí)別出車型。
[0017]上述技術(shù)方案中,所述步驟1對(duì)車型圖像,進(jìn)行滑動(dòng)窗口選取特征和去平均操作,得到圖像的初步特征,包括以下幾個(gè)步驟:
[0018]步驟1.1:選取大小為luXk2的窗口,滑動(dòng)提取大小為mXn的訓(xùn)練圖像的局部特征,得到一個(gè)luXk2行,mXn列的矩陣,每一列代表一個(gè)局部特征塊;
[0019]步驟1.2:對(duì)步驟1.1中得到的矩陣進(jìn)行按列去平均,得到當(dāng)前車輛圖像的特征表不ο
[0020]上述技術(shù)方案中,所述步驟2所有圖像的初步特征塊構(gòu)成矩陣X,對(duì)X做PCA,取前L1個(gè)特征向量,將其每列重排,得到L1個(gè)新窗口,包括以下幾個(gè)步驟:
[0021]步驟2.1:對(duì)所有Ν張訓(xùn)練圖片進(jìn)行步驟1的操作,將得到的特征并排在一起,得到一個(gè)新的數(shù)據(jù)矩陣X;
[0022]步驟2.2:對(duì)得到的矩陣X做PCA降維處理,取前L1個(gè)特征向量,作為濾波器;
[0023]步驟2.3:把這L1個(gè)特征向量的每一列重排列為一個(gè)新的特征塊,得到LlfkiXks的窗口。
[0024]上述技術(shù)方案中,所述步驟5對(duì)集合中每組卷積圖像進(jìn)行二值化和權(quán)值相加處理,得到新的L1張圖像,包括以下幾個(gè)步驟:
[0025]步驟5.1:對(duì)步驟4中得到的每個(gè)卷積圖像做二值化處理,原卷積圖像中元素大于0,則新的圖像元素矩陣對(duì)應(yīng)的位置為1,否則為0;
[0026]步驟5.2:對(duì)每一張車型圖像,都有L1組每組L2張的二值化圖像,將每組的L2張二值圖像進(jìn)行權(quán)值相加。權(quán)值大小依次對(duì)應(yīng)步驟2.2中濾波器的大?。?br>[0027]步驟5.3:得到每張車型圖像的新的L1張圖像。
[0028]上述技術(shù)方案中,所述步驟6將新的L1張圖像進(jìn)行分塊直方圖操作,聯(lián)合后得到當(dāng)前圖像的主成分分析網(wǎng)框架特征表示,包括以下幾個(gè)步驟:
[0029]步驟6.1:對(duì)步驟5中得到的L1幅圖像,將每一幅圖分成B個(gè)塊,對(duì)每個(gè)塊進(jìn)行直方圖統(tǒng)計(jì);
[0030]步驟6.2:將步驟6.1中的B個(gè)塊的直方圖連接起來(lái)成為一個(gè)向量,然后將L1幅圖像對(duì)應(yīng)的向量都連接起來(lái),得到當(dāng)前圖像的主成分分析網(wǎng)框架特征表示。
[0031]上述技術(shù)方案中,所述步驟7將得到的所有圖像的特征表示進(jìn)行SVM訓(xùn)練,得到車型識(shí)別系統(tǒng),包括以下幾個(gè)步驟:
[0032]步驟7.1:將當(dāng)前類別車型圖像的主成分分析網(wǎng)框架特征表示作為正樣本,其他類別車型圖像的主成分分析網(wǎng)框架特征表示作為負(fù)樣本;
[0033]步驟7.2:使用線性SVM訓(xùn)練這兩個(gè)樣本,得到當(dāng)前類別車型圖像的分類器;
[0034]步驟7.3:重復(fù)步驟7.1到步驟7.2的操作,得到所有類別車型圖像的分類器,聯(lián)合后構(gòu)成車型識(shí)別系統(tǒng)。
[0035]上述技術(shù)方案中,所述步驟8對(duì)測(cè)試車型圖像,提取其主成分分析網(wǎng)框架特征,導(dǎo)入系統(tǒng)進(jìn)行測(cè)試,識(shí)別出車型,包括以下幾個(gè)步驟:
[0036]步驟8.1:對(duì)測(cè)試車型圖像,通過(guò)步驟1到步驟6的操作,得到其主成分分析網(wǎng)框架特征表示;
[0037]步驟8.2:將得到的測(cè)試車型圖像的主成分分析網(wǎng)框架特征表示,導(dǎo)入步驟7中的車型識(shí)別系統(tǒng)進(jìn)行測(cè)試,根據(jù)最大概率匹配,識(shí)別出車型。
[0038]因?yàn)楸景l(fā)明采用上述技術(shù)方案,因此具備以下有益效果:
[0039]本發(fā)明采用了主成分分析網(wǎng)框架來(lái)構(gòu)建車型圖像的特征表示,提出了一個(gè)很簡(jiǎn)潔的關(guān)于車型識(shí)別的深度學(xué)習(xí)框架,這個(gè)框架主要依賴幾個(gè)基本的數(shù)據(jù)處理方法:(1)主成分分析PCA; (2)二值化哈希編碼;(3)分塊直方圖。在這個(gè)框架中,首先通過(guò)PCA方法來(lái)學(xué)習(xí)多層濾波器核,然后使用二值化哈希編碼以及塊直方圖特征來(lái)進(jìn)行下采樣和編碼操作,可以很好地實(shí)現(xiàn)車型識(shí)別,算法快速高效,提高了識(shí)別速度,消耗內(nèi)存少,具有較高的實(shí)用性和魯棒性。
【附圖說(shuō)明】
[0040]圖1為圖像的主成分分析網(wǎng)框架表示的算法實(shí)現(xiàn)示意圖。
【具體實(shí)施方式】
[0041]為詳細(xì)說(shuō)明本發(fā)明的技術(shù)內(nèi)容、構(gòu)造特征、所實(shí)現(xiàn)目的及效果,以下結(jié)合實(shí)施方式并配合附圖詳予說(shuō)明。
[0042]本發(fā)明提出了一種基于主成分分析網(wǎng)框架的車型識(shí)別方法,在車輛車型識(shí)別上取得良好的效果。整個(gè)算法實(shí)現(xiàn)示意圖如圖1所示,包括步驟:
[0043]步驟1:對(duì)車型圖像,進(jìn)行滑動(dòng)窗口選取特征和去平均操作,得到圖像的初步特征;
[0044]假設(shè)有N張訓(xùn)練圖像樣本,每個(gè)樣本的尺寸為mXn,設(shè)置每層的濾波器尺寸為hXk2,對(duì)于每個(gè)像素,都在其周圍進(jìn)行一次lu X k2的塊采樣,收集所有的采樣塊,進(jìn)行級(jí)聯(lián),得到圖像的局部特征塊,具體地,包括以下幾個(gè)步驟:
[0045]步驟1.1:選取大小為luXk2的窗口,滑動(dòng)提取大小為mXn的訓(xùn)練圖像的局部特征,得到一個(gè)luXk2行,mXn列的矩陣,每一列代表一個(gè)局部特征塊;
[0046]步驟1.2:對(duì)步驟1.1中得到的矩陣進(jìn)行按列去平均,得到當(dāng)前車輛圖像的特征表不ο
[0047]步驟2:所有圖像的初步特征塊構(gòu)成矩陣X,對(duì)X做PCA,取前L1個(gè)特征向量,將其每列重排,得到L1個(gè)新窗口;
[0048]具體地,所有圖像的初步特征塊構(gòu)成矩陣X,對(duì)X做PCA,取前L1個(gè)特征向量,將其每列重排,