基于稀疏表示lbp和hog融合的行人檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于模式識(shí)別下的行人檢測(cè)領(lǐng)域,具體設(shè)及一種基于稀疏表示LBP和HOG融 合的行人檢測(cè)方法。
【背景技術(shù)】
[0002] 行人檢測(cè)可定義為:判斷輸入圖片(或視頻帖)是否包含行人,如果有,給出位置信 息.。行人檢測(cè)系統(tǒng)(PDS-Pedeshian Detection System)旨在行進(jìn)的汽車(chē)上建立一個(gè)自 主、智能的行人檢測(cè)、智能輔助駕駛系統(tǒng),具有提高駕駛安全性、保障行人生命財(cái)產(chǎn)安全的 重要意義和實(shí)用價(jià)值。在行人檢測(cè)系統(tǒng)中,通常包括感興趣區(qū)域提取、特征提取、目標(biāo)識(shí)別, Ξ個(gè)階段。
[0003] 行人檢測(cè)通常提取的簡(jiǎn)單特征有,目標(biāo)的長(zhǎng)寬比、占空比、物體的相對(duì)移動(dòng)速度 等,相對(duì)復(fù)雜些的特征有haa;r-l;Lke、hog、sift、shape let、LBP特征。
[0004] 對(duì)于行人檢測(cè)而言,沒(méi)有一個(gè)單獨(dú)的特征提取算法的性能優(yōu)于HOG算法。HOG特征 描述了行人目標(biāo)區(qū)域梯度強(qiáng)度和梯度方向的分布情況,能很好地表征行人的外觀和形狀, 而且對(duì)光照不敏感。但當(dāng)背景覆蓋凌亂的噪聲邊緣時(shí),冊(cè)G處理效果很差。
[0005] 由于單一類(lèi)型的特征僅能從某一方面刻畫(huà)行人特征,描述能力較弱,因此組合應(yīng) 用多種底層特征的越來(lái)越具有應(yīng)用價(jià)值。LBP紋理特征在圖像處理和模式識(shí)別領(lǐng)域是主要 的特征之一,它可W過(guò)濾出噪聲,結(jié)合了邊緣/局部形狀信息還有紋理信息,能夠很好的捕 捉到人的外表。且不受背景顏色和光照的影響將冊(cè)G特征和紋理特征聯(lián)合起來(lái)共同表征行 人,運(yùn)樣在獲取了行人的梯度信息的同時(shí),還獲得了描述行的紋理特征,運(yùn)對(duì)復(fù)雜環(huán)境中的 行人檢測(cè)有良好的改善效果。
[0006] 但是標(biāo)準(zhǔn)的LBP直方圖大多都是針對(duì)圖像中的各個(gè)分區(qū)分別計(jì)算的,對(duì)于一個(gè)普 通大小的分塊區(qū)域,標(biāo)準(zhǔn)LBP算子得到的二進(jìn)制模式數(shù)目較多,而實(shí)際位于該分塊區(qū)域中的 像素?cái)?shù)目去相對(duì)較少,運(yùn)將會(huì)得到一個(gè)過(guò)于稀疏的直方圖,從而使直方圖失去統(tǒng)計(jì)意義。
[0007] 多特征融合技術(shù)使得行人檢測(cè)的識(shí)別率有了進(jìn)一步的提升,但同時(shí)過(guò)高的維度也 會(huì)增加計(jì)算的復(fù)雜度,給后續(xù)的分類(lèi)問(wèn)題帶來(lái)負(fù)擔(dān)。實(shí)際上維數(shù)過(guò)高的特征向量對(duì)于分類(lèi) 性能(識(shí)別率)也會(huì)造成很多負(fù)面影響。需要進(jìn)一步的對(duì)特征進(jìn)行降維等處理。
【發(fā)明內(nèi)容】
[000引本發(fā)明提出了基于稀疏表示LBP和冊(cè)G融合的行人檢測(cè)的方法,解決單個(gè)冊(cè)G算法 對(duì)行人描述不足的缺點(diǎn)、采用統(tǒng)一化LBP算子解決了傳統(tǒng)LBP直方圖過(guò)于稀疏的問(wèn)題,采用 稀疏表示解決了融合特征中直接將特征融合造成維度過(guò)高的問(wèn)題,在降低維度的同時(shí)也提 高了識(shí)別率。結(jié)合說(shuō)明書(shū)附圖,本發(fā)明的技術(shù)方案如下:
[0009] -種基于稀疏表示LBP和HOG融合的行人檢測(cè)方法,該方法首先利用訓(xùn)練樣本訓(xùn)練 分類(lèi)器模型,然后利用分類(lèi)器模型識(shí)別檢測(cè)樣本,其特征在于:
[0010] 所述利用訓(xùn)練樣本訓(xùn)練分類(lèi)器模型的具體步驟如下:
[0011] Al:輸入訓(xùn)練樣本組圖片;
[0012] A2:判斷訓(xùn)練樣本組圖片是否為灰度圖像,若不是,將其轉(zhuǎn)化為灰度圖像;
[0013] A3:提取訓(xùn)練樣本圖片的LBP特征,并進(jìn)行歸一化處理;
[0014] A4:獲得訓(xùn)練樣本組圖片的LBP特征;
[0015] A5:選取歸一化后的K個(gè)訓(xùn)練樣本的LBP特征矩陣作為初始矩陣D,利用K-SVD算法 進(jìn)行字典學(xué)習(xí),得到更新后的字典D;
[0016] A6:利用字典D對(duì)步驟A4中歸一化的訓(xùn)練樣本組圖片的LBP特征進(jìn)行稀疏表示,得 到稀疏系數(shù);
[0017] A7:提取訓(xùn)練樣本組圖片的冊(cè)G特征,獲得供分類(lèi)使用的特征向量;
[0018] A8:將步驟A7中得到的冊(cè)G特征與步驟A6中得到的稀疏系數(shù)進(jìn)行融合,串聯(lián)形成融 合特征向量;
[0019] A9:使用SVM算法訓(xùn)練得出SVM分類(lèi)器模型,并保存SVM分類(lèi)器模型;
[0020] 所述利用分類(lèi)器模型識(shí)別檢測(cè)樣本的具體步驟如下:
[0021] B1:輸入檢測(cè)樣本圖片;
[0022] B2:判斷檢測(cè)樣本圖片是否為灰度圖像,若不是,將其轉(zhuǎn)化為灰度圖像;
[0023] B3:提取檢測(cè)樣本圖片的LBP特征,并進(jìn)行歸一化處理;
[0024] B4:利用字典D對(duì)歸一化的檢測(cè)樣本圖片的LBP特征進(jìn)行稀疏表示,得到稀疏系數(shù); [002引 B5:提取檢測(cè)樣本的HOG特征,獲得特征向量;
[0026] B6:將HOG特征向量與稀疏系數(shù)進(jìn)行融合,串聯(lián)形成融合特征向量;
[0027] B7:利用步驟A9中所述的SVM分類(lèi)器模型對(duì)檢測(cè)樣本的融合特征進(jìn)行分類(lèi),判別檢 測(cè)樣本是否為行人;
[00%]所述步驟A3與B3中提取圖片的LBP特征,并進(jìn)行歸一化處理的步驟如下:
[0029] 第一步:圖像分割,將圖像分割為圖像塊;
[0030] 第二步:求取每個(gè)圖像塊LBP特征直方圖,針對(duì)每塊圖像塊,根據(jù)LBP82算子求取圖 像的紋理特征,得到特征向量,再將特征向量進(jìn)行提取轉(zhuǎn)化;
[0031] 第Ξ步:歸一化直方圖,采用L2-范式
巧得歸一化后向 量,
[0032] 其中:S為待歸一化向量,ε為避免分母為零的常量,為歸一化后的向量;
[003引第四步:獲得單幅圖像LBP特征,得到腺隹LBP向量。
[0034] 所述步驟A4中獲得訓(xùn)練樣本組圖片的LBP特征的具體方法為:使用m個(gè)正樣本和η 個(gè)負(fù)樣本,將單個(gè)圖像形成的Ν維向量形成一行,共得到(m+n)XN維特征向量,其中前m個(gè) LBP特征為正樣本特征,后η個(gè)為負(fù)樣本特征。
[0035] 所述步驟Α5中得到字典D的具體步驟為:
[0036] 第一步:選取歸一化后的Κ個(gè)行人樣本的LBP特征矩陣作為初始矩陣D;
[0037] 第二步:固定字典D,通過(guò)正交匹配追蹤算法確定稀疏矩陣X,且
[0038] 第Ξ步:將j從1循環(huán)至Κ,通過(guò)式
[0039]
[0040] 計(jì)算護(hù)^,并對(duì)E/j進(jìn)行SVD分解,更新字典D第j列dj;
[0041] 其中,稀疏矩陣X的第j行為χ/j,樣本Y與DX的差異為E,E/徒示去掉原子dj后在所 有樣本中造成的誤差
[0042] 第四步:循環(huán)步驟二和步驟Ξ,直到
最終得到更新后的字典 D。
[0043] 所述步驟A6和B4中稀疏表示的具體步驟為:
[0044] 根據(jù)稀疏表示模型
[0045] Y = DX
[0046] 其中,Y是需要稀疏表示的LBP行人特征,D為步驟A6中得出的字典,X為稀疏系數(shù)。
[0047] 所述步驟A7和B5中提取HOG特征的具體步驟為:
[004引第一步:采用Gamma校正法對(duì)輸入圖像進(jìn)行顏色空間的標(biāo)準(zhǔn)化;
[0049] 第二步:計(jì)算圖像每個(gè)像素的梯度,包括大小和方向;
[0050] 第Ξ步:將圖像劃分為若干個(gè)單元
[0051] 第四步:統(tǒng)計(jì)每個(gè)單元的梯度直方圖,即可形成每個(gè)單元的特征;
[0052] 第五步:將若干個(gè)單元平均劃分組成若干個(gè)塊,將每個(gè)塊內(nèi)所述有的單元特征串 聯(lián)起來(lái)獲得該塊的HOG特征;
[0053] 第六步:將圖像內(nèi)所有的塊的HOG特征串聯(lián)起來(lái)得到該圖像的HOG特征,即供分類(lèi) 使用的特征向量。
[0054] 所述步驟A9中采用LIBSVM算法,用+巧日-1作為類(lèi)別標(biāo)簽來(lái)標(biāo)記由步驟A8得到的行 人檢測(cè)的訓(xùn)練數(shù)據(jù),+1標(biāo)記正樣本,-1標(biāo)記負(fù)樣本,將類(lèi)別標(biāo)簽和訓(xùn)練樣本送入分類(lèi)器,得 出分類(lèi)器模型,并保存分類(lèi)器模型。
[0055] 與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:
[0056] 1、本發(fā)明使用基于稀疏表示LBP和HOG融合特征來(lái)進(jìn)行行人檢測(cè),克服了單一行人 特征描述能力不足的缺點(diǎn);結(jié)合了梯度特征和紋理特征,加強(qiáng)了對(duì)圖像邊緣的描述能力,很 好的捕捉到行人的外表,在復(fù)雜背景下的行人檢測(cè)獲得了較好的效果。且在背景顏色和光 照較為復(fù)雜的情況下,該算法的融合特征要優(yōu)于HOG特征。
[0057] 本算法使用統(tǒng)一模式的LBP特征,且針對(duì)各個(gè)分區(qū)圖像進(jìn)行計(jì)算的,克服了統(tǒng)一模 式的LBP特征過(guò)于稀疏從而導(dǎo)致失去統(tǒng)計(jì)意義的缺點(diǎn),采用的分區(qū)描述方法加強(qiáng)了對(duì)圖像 結(jié)構(gòu)信息的描述。本算法雖然采用融合特征的方法使得識(shí)別率獲得了進(jìn)一步的提高,但由 于采用對(duì)LBP特征進(jìn)行稀疏表示的方法使得特征維度得到很大降低。大大縮短了檢測(cè)的時(shí) 間,并且提高了魯棒性,由于采用稀疏表示的方法,使得在行人遮擋的情況下檢測(cè)效果較 好。
【附圖說(shuō)明】
[005引圖1為本發(fā)明中利用訓(xùn)練樣本訓(xùn)練分類(lèi)器模型的過(guò)程框圖;
[0059]圖2為本發(fā)明中利用分類(lèi)器模型識(shí)別檢測(cè)樣本的過(guò)程框圖
[0060] 圖3為本發(fā)明與HOG+SVM行人檢測(cè)方法的實(shí)驗(yàn)效果對(duì)比圖。
【具體實(shí)施方式】
[0061] 為了進(jìn)一步闡述本發(fā)明的技術(shù)方案,結(jié)合說(shuō)明書(shū)附圖,本發(fā)明的【具體實(shí)施方式】如 下:
[0062] 本發(fā)明公開(kāi)了一種基于稀疏表示LBP和冊(cè)G融合的行人檢測(cè)方法,該方法首先利用 訓(xùn)練樣本訓(xùn)練分類(lèi)器模型,然后利用分類(lèi)器模型識(shí)別檢測(cè)樣本。其中:
[0063] 如圖1所示,利用訓(xùn)練樣本訓(xùn)練分類(lèi)器模型的具體步驟如下:
[0064] A1 :輸入訓(xùn)練樣本組圖片Itrain;
[0065] A2:由于LBP特征的提取過(guò)程是基于灰度圖像的,所W判斷訓(xùn)練樣本組圖片是否為 灰度圖像,若不是,將其轉(zhuǎn)化為灰度圖像;
[0066] A3:提取訓(xùn)練樣本圖片的LBP特征,并進(jìn)行歸一化處理;具體步驟如下:
[0067] 第一步:圖像分割,本實(shí)施例中采用的圖像尺寸為128X64,將其按照8X8的尺寸 分割,分割為128個(gè)圖像塊;
[0068] 第二步:求取每個(gè)圖像塊LBP特征直方圖,針對(duì)每塊8 X 8的圖像,根據(jù)LBP82算子求 取圖像的紋理特征,得到256維特征向量,再將256維特征向量轉(zhuǎn)化為59維特征向量;
[0069] 第Ξ步:歸一化直方圖,為了提高特征向量的魯棒性,克服一些噪聲的干擾,同HOG 特征類(lèi)似,需要對(duì)提取的59維特征向量按塊進(jìn)行歸一化操作。根據(jù)實(shí)驗(yàn)對(duì)比各種歸一化因 子,最終采用L2-范式化2-norm)歸一化因子取得的效果最好。
[0070] L2-范式為:
[0071]
C1)
[0072] 其中:S為待歸一化向量,ε為一個(gè)很小的常亮值用來(lái)避免分母為零,s/為歸一化后 的向量;
[0073] 第四步:獲得單幅圖像LBP特征,本實(shí)施例圖像為64X128,檢測(cè)窗口分為128個(gè)單 元(ce 11 ),每個(gè)ce 11的特征向量為59維,最終得到7552維的LBP特征向量。
[0074] A4:獲得訓(xùn)練樣本組圖片的LBP特征;
[0075] 本實(shí)施例中使用820個(gè)正樣本和820個(gè)負(fù)樣本,將單個(gè)圖像形成的7552向量形成一 行,共得到1640 X 7552維特征向量,其中前820個(gè)LBP特征為正樣本特征,后820個(gè)位負(fù)樣本 特征。
[0076] A5:選取歸一化后的K個(gè)訓(xùn)練樣本的LBP特征矩陣作為初始矩陣D,利用K-SVD算法 進(jìn)行字典學(xué)習(xí),得到字典D;具體步驟如下:
[0077] 第一步:選取歸一化后的K個(gè)行人樣本的LBP特征矩陣作為初始矩陣D;
[0078] 第二步:固定字典D,通過(guò)正交匹配追蹤(0