一種基于局部特征聚合描述符的車型識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于模式分類技術(shù)領(lǐng)域,特別涉及一種基于局部特征聚合描述符的車型識(shí) 別方法。
[0002] 發(fā)明背景
[0003] 隨著信息技術(shù)的高速發(fā)展,越來(lái)越多的智能交通系統(tǒng)走進(jìn)了人們的生活,如道路 自動(dòng)收費(fèi)系統(tǒng)、車輛識(shí)別技術(shù)、電子警察系統(tǒng)、全球定位系統(tǒng)以及車載導(dǎo)航系統(tǒng)等。這些智 能交通運(yùn)輸管理體系是通過(guò)集成最前沿的軟、硬件技術(shù)來(lái)搭建完成的,包括了數(shù)據(jù)通訊傳 輸技術(shù)、電控技術(shù)、電子傳感技術(shù)以及信息技術(shù)等。智能交通系統(tǒng)需要在大區(qū)域中發(fā)揮全局 性的作用,實(shí)時(shí)、高效率地管理交通,以最終實(shí)現(xiàn)道路交通與車輛的智能化管理,達(dá)到抑制 交通違法行為、提高交通運(yùn)行效率、降低警察執(zhí)法成本、緩解交通擁堵?tīng)顟B(tài)、提高路網(wǎng)流通 量、降低意外交通事故發(fā)生頻率、降低碳排量減少能耗、加強(qiáng)環(huán)保等目的。
[0004] 在智能交通中,基于計(jì)算機(jī)視覺(jué)的車輛檢測(cè)與識(shí)別系統(tǒng)在近年來(lái)得到了迅速地發(fā) 展,車輛檢測(cè)與識(shí)別系統(tǒng)廣泛的應(yīng)用于城市交通狀況監(jiān)控、園區(qū)與停車場(chǎng)管理以及高速公 路收費(fèi)等領(lǐng)域,同時(shí)該系統(tǒng)在防止犯罪與抵御恐怖襲擊方面也有重要應(yīng)用價(jià)值。在該系統(tǒng) 中,汽車號(hào)牌的自動(dòng)識(shí)別技術(shù)發(fā)展最為成熟,并且得到了廣泛的商業(yè)應(yīng)用,為自動(dòng)化管理道 路交通提供了經(jīng)典的范例。然而,當(dāng)汽車號(hào)牌被偽造、汽車使用假號(hào)牌或者號(hào)牌受到遮擋時(shí) 車牌識(shí)別就面臨失效的問(wèn)題。在這種情況下,車型識(shí)別(技術(shù)可以為車輛檢測(cè)與識(shí)別系統(tǒng) 提供額外安全保障。車型識(shí)別希望實(shí)現(xiàn)的目標(biāo)是,將汽車按照其具體的型號(hào)進(jìn)行分類,如將 汽車分為奧迪、寶馬、大眾高爾夫等等。如果該技術(shù)能夠?qū)崿F(xiàn),即可通過(guò)車牌號(hào)碼與車型的 匹配,解決汽車盜竊、車牌偽造等安全隱患,大大提升智能交通系統(tǒng)的功能,提升警察維持 交通與偵破案件的效率。
[0005] 在圖像分類領(lǐng)域,對(duì)數(shù)量龐大的圖像分類主要有兩種方法:一種方法是神經(jīng)網(wǎng)絡(luò) 算法,神經(jīng)網(wǎng)絡(luò)是一種模擬動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué) 模型。但這些方法難以解決模式識(shí)別中存在的復(fù)雜性和推廣性的矛盾,神經(jīng)網(wǎng)絡(luò)雖然有強(qiáng) 大的建模能力,但對(duì)大規(guī)模圖像進(jìn)行分類,其巨大的參數(shù)空間使尋找優(yōu)良的優(yōu)化初始值較 為困難。另一種應(yīng)用很廣的方法是為提取每張照片的局部特征,將提取的特征進(jìn)行聚類和 編碼得到一個(gè)高維向量,然后將其用分類器分類或者使用最近鄰算法進(jìn)行匹配。其中編碼 的方法有視覺(jué)詞袋模型編碼,稀疏編碼和費(fèi)舍爾向量編碼等。
[0006] 視覺(jué)詞袋模型編碼和費(fèi)舍爾向量編碼在圖片檢索和分類中應(yīng)用廣泛,但是在數(shù)據(jù) 量很大的情況下,由于字典大小的限制,視覺(jué)詞袋模型編碼的特征表達(dá)會(huì)越來(lái)越粗略,特征 信息損失較多,使得搜索精度降低,而費(fèi)舍爾向量編碼雖然能更細(xì)致地描述圖片,但是也損 失了很多特征。
[0007] 在此基礎(chǔ)之上,本專利結(jié)合費(fèi)舍爾向量編碼和視覺(jué)詞袋模型編碼的優(yōu)點(diǎn),提出一 種基于局部特征聚合描述符的車型識(shí)別方法來(lái)解決上述問(wèn)題。本發(fā)明能夠?qū)崿F(xiàn)大規(guī)模車輛 圖像的車型識(shí)別,且識(shí)別準(zhǔn)確率高,運(yùn)行速度快,消耗內(nèi)存少,具有較高的實(shí)用性和魯棒性。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明中所述方法是為了克服上述現(xiàn)有技術(shù)的缺點(diǎn),主要針對(duì)已經(jīng)提取的車輛特 征對(duì)車型進(jìn)行細(xì)分識(shí)別的問(wèn)題,提出了一種基于局部特征聚合描述符的車型識(shí)別方法。具 體的技術(shù)方案如下所述。
[0009] -種基于局部特征聚合描述符的車型識(shí)別方法,包括以下步驟:
[0010] 步驟1 :對(duì)車型數(shù)據(jù)庫(kù)的車輛圖像進(jìn)行SIFT特征提??;
[0011] 步驟2 :對(duì)所有車型圖像提取到的SIFT特征向量X進(jìn)行KMeans聚類,得到具有K 個(gè)視覺(jué)單詞的字典;
[0012] 步驟3 :針對(duì)每張車型圖像,將提取到的每個(gè)SIFT特征向量X賦給離其最近的視 覺(jué)單詞;
[0013] 步驟4 :統(tǒng)計(jì)每個(gè)視覺(jué)單詞周圍的SIFT特征向量X與當(dāng)前視覺(jué)單詞的殘差累積 量,得到當(dāng)前車輛圖片的局部特征聚合描述符;
[0014] 步驟5 :將訓(xùn)練模塊的η張車型圖像的局部特征聚合描述符,通過(guò)量化編碼,得到 一個(gè)可索引的η類車型類別的編碼圖像庫(kù);
[0015] 步驟6 :對(duì)測(cè)試車輛圖像,同樣提取其局部特征聚合描述符,作為查詢向量,導(dǎo)入 步驟5中得到的圖像庫(kù)進(jìn)行索引,通過(guò)近似最近鄰搜索方法進(jìn)行匹配,識(shí)別出測(cè)試車輛車 型。
[0016] 上述技術(shù)方案中,所述步驟1中對(duì)車型數(shù)據(jù)庫(kù)的車輛圖像進(jìn)行SIFT特征提取,包 括以下幾個(gè)步驟:
[0017] 步驟1. 1 :尺度空間極值檢測(cè):針對(duì)構(gòu)建的高斯金字塔圖像,利用差分函數(shù)在所有 尺度上檢測(cè)候選極值點(diǎn);
[0018] 步驟1. 2 :關(guān)鍵點(diǎn)定位:通過(guò)函數(shù)擬合來(lái)定位極值點(diǎn)的準(zhǔn)確位置和尺度,同時(shí)過(guò)濾 掉候選極值點(diǎn)集合中的邊緣點(diǎn);
[0019] 步驟1. 3 :方向確定:結(jié)合關(guān)鍵點(diǎn)鄰域像素的梯度信息,給每個(gè)關(guān)鍵點(diǎn)賦予一個(gè)主 方向;
[0020] 步驟1. 4 :特征描述子生成:對(duì)關(guān)鍵點(diǎn)鄰域像素的梯度幅值和方向進(jìn)行統(tǒng)計(jì),得到 關(guān)鍵點(diǎn)的特征描述。
[0021] 上述技術(shù)方案中,所述步驟2中對(duì)所有車型圖像提取到的SIFT特征向量X進(jìn)行 KMeans聚類,得到具有K個(gè)視覺(jué)單詞的字典,包括以下幾個(gè)步驟:
[0022] 步驟2. 1 :隨機(jī)選取K個(gè)SIFT特征向量作為初始聚類中心;
[0023] 步驟2. 1 :計(jì)算其他SIFT特征向量到這K個(gè)聚類中心的距離;
[0024] 步驟2. 3 :如果某個(gè)SIFT特征向量離第η個(gè)聚類中心更近,則該SIFT特征向量屬 于聚類n,并對(duì)其設(shè)置標(biāo)簽;
[0025] 步驟2. 4 :計(jì)算同一聚類中,所有SIFT特征向量的均值,作為新的聚類中心;
[0026] 步驟2.5 :迭代至所有聚類中心不變化為止,得到具有K個(gè)視覺(jué)單詞的字典:
[0027] C={Cl,.",ck}
[0028] 其中C為字典,ck表示每一個(gè)聚類中心,也即視覺(jué)單詞。
[0029] 上述技術(shù)方案中,所述步驟3將每張車型圖像提取到的每個(gè)SIFT特征向量X賦給 離其最近的視覺(jué)單詞:
[0030] c;=NN(x)
[0031] 其中,NN(x)為最近鄰算法,Cl為離x最近的視覺(jué)單詞,此時(shí),每個(gè)視覺(jué)單詞周圍的 SIFT特征向量與當(dāng)前視覺(jué)單詞構(gòu)成了一個(gè)聚類塊。
[0032] 上述技術(shù)方案中,所述步驟4中統(tǒng)計(jì)每個(gè)視覺(jué)單詞周圍的SIFT特征向量與當(dāng)前視 覺(jué)單詞的殘差累積量,得到當(dāng)前車輛圖片的局部特征聚合描述符,包括以下幾個(gè)步驟:
[0033] 步驟4. 1 :對(duì)步驟3中構(gòu)成的每一個(gè)聚類塊,求取每個(gè)聚類塊中的SIFT特征向量 與視覺(jué)單詞的差值:
[0034] x-Cl
[0035] 步驟4. 2 :對(duì)步驟4. 1中求得的每個(gè)差值求累加和,得到當(dāng)前視覺(jué)單詞的局部特征 聚合描述符Vi:
[0036]
[0037] 其中,Vl表示當(dāng)前視覺(jué)單詞的局部特征聚合描述符,X,表示當(dāng)前聚類塊中的SIFT 特征向量,q表示當(dāng)前聚類塊中的視覺(jué)單詞;
[0038] 步驟4. 3 :聯(lián)合所有視覺(jué)單詞的局部特征聚合描述符,再將其進(jìn)行L2歸一化,得到 整幅車型圖像的局部特征聚合描述符y。
[0039] 上述技術(shù)方案中,所述步驟5中將訓(xùn)練模塊的η張車型圖像的局部特征聚合描述 符Y= {yi,…,yn},通過(guò)量化編碼,得到一個(gè)可索引的η類車型類別的編碼圖像庫(kù),包括以 下步驟:
[0040] 步驟5. 1 :將每張車型圖像的局部特征聚合特征向量y,將其等分成m個(gè)部分:
[0041] y= {y1,y2,…,ym}
[0042] 步驟5. 2 :對(duì)每張車型圖像,將其等分成的m個(gè)部分使用統(tǒng)一量化函數(shù)q( ·)進(jìn)行 量化:
[0043] q(y) = (q^y1), ???xqm(ym))
[0044] 其中,qm( ·)是對(duì)向量ym進(jìn)行KMeans聚類得到的k5個(gè)量化值,即聚類中心, '為當(dāng)前圖像的局部特征聚合特征向量的量化結(jié)果;
[0045] 步驟5. 3 :得到一個(gè)可索引的η類車型類別的編碼圖像庫(kù)。
[0046] 上述技術(shù)方案中,所述步驟6對(duì)測(cè)試車輛圖像,同樣提取其局部特征聚合描述符, 作為查詢向量,導(dǎo)入步驟5中得到的圖像庫(kù)進(jìn)行索引,通過(guò)近似最近鄰搜索方法進(jìn)行匹配, 識(shí)別出測(cè)試車輛車型,包括以下幾個(gè)步驟:
[0047] 步驟6. 1 :提取測(cè)試車輛圖像的局部特征聚合描述符#
[0048] 步驟6.2 :將導(dǎo)入步驟5中得到的圖像庫(kù)進(jìn)行索引,通過(guò)近似最近鄰算法,找出 其最優(yōu)匹配:
[0049]
[0050] 其中,|是查詢向量,將其同樣等分成m個(gè)部分,_>V為第j個(gè)部分,Υι是訓(xùn)練車輛 的局部特征聚合描述符,q(yi)是量化編碼后的訓(xùn)練向量集,為查詢向量?·的最優(yōu)匹 配,也即最終識(shí)別出的測(cè)試車輛的車型。
[0051] 因?yàn)楸景l(fā)明采用上述技術(shù)方案,因此具備以下有益效果:
[0052] 本發(fā)明公開(kāi)了一種基于局部聚合描述符的車輛圖像表示方法,來(lái)進(jìn)行車型識(shí)別, 局部聚合描述符結(jié)合了費(fèi)舍爾向量編碼和視覺(jué)詞袋模型編碼的優(yōu)點(diǎn),能夠解決在車輛圖像 庫(kù)十分龐大的情況下進(jìn)行快速運(yùn)算,實(shí)現(xiàn)大規(guī)模車輛圖像的車型識(shí)別,且識(shí)別準(zhǔn)確率高,消 耗內(nèi)存少,具有較高的實(shí)用性和魯棒性。
【附圖說(shuō)明】
[0053] 圖1為局部特征聚合描述符算法實(shí)現(xiàn)示意圖;
[0054] 圖2為求取殘差累積量示意圖。
【具體實(shí)施方式】
[0055] 為詳細(xì)說(shuō)明本發(fā)明的技術(shù)內(nèi)容、構(gòu)造特征、所實(shí)現(xiàn)目的及效果,以下結(jié)合實(shí)施方式 并配合附圖詳予說(shuō)明。
[0056] 本專利提出了一種基于局部特征聚合描述符的車型識(shí)別方法,在車輛車型識(shí)別上 取得良好的效果。整個(gè)算法實(shí)現(xiàn)示意圖如圖1所示,包括步驟:
[0057] 步驟1 :對(duì)車型數(shù)據(jù)庫(kù)的車輛圖像進(jìn)行SIFT特征提??;
[0058] 提取SIFT特征描述子可以由以下步驟完成:
[0059] 步驟1. 1 :尺度空間極值檢測(cè):針對(duì)構(gòu)建的高斯金字塔圖像,利用差分函數(shù)在所有 尺度上檢測(cè)候選極值點(diǎn)。
[0060] 步驟1. 2 :關(guān)鍵點(diǎn)定位:通過(guò)函數(shù)擬合來(lái)定位極值點(diǎn)的準(zhǔn)確位置和尺度,同時(shí)過(guò)濾 掉候選極值點(diǎn)集合中的邊緣點(diǎn)。
[0061] 步驟1. 3 :方向確定:結(jié)合關(guān)鍵點(diǎn)鄰域像素的梯度信息,給每個(gè)關(guān)鍵點(diǎn)賦予一個(gè)主 方向。
[0062] 步驟1. 4 :特征描述子生成:對(duì)關(guān)鍵點(diǎn)鄰域像素的梯度幅值和方向進(jìn)行統(tǒng)計(jì),得到 關(guān)鍵點(diǎn)的特征描述。
[0063] 步驟2 :對(duì)提取到的SIFT特征向量X進(jìn)行KMeans聚類,得到具有K個(gè)視覺(jué)單詞的 字