一種基于區(qū)域稀疏積分通道的行人特征提取和表示方法
【專利摘要】本發(fā)明提供一種基于區(qū)域稀疏積分通道的行人特征表示方法,首先利用均勻隨機(jī)采樣的區(qū)域和子區(qū)域的空間布局信息,其次提取繼承了多種異構(gòu)源信息的各子區(qū)域內(nèi)的特征通道值,再將子區(qū)域特征融合成區(qū)域特征,最后級(jí)聯(lián)所有區(qū)域特征即為行人描述子。本發(fā)明提出的行人特征提取和表示方法,從而在統(tǒng)一框架下解決行人特征提取和表示面臨的兩難選擇問題。既有空間布局信息,又包含多種異構(gòu)源信息。本發(fā)明利用了區(qū)域和子區(qū)域的細(xì)粒度空間布局信息,又自然地集成了子區(qū)域內(nèi)的多種異構(gòu)源信息,兼顧到描述性和靈活性。
【專利說明】一種基于區(qū)域稀疏積分通道的行人特征提取和表示方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計(jì)算機(jī)視覺【技術(shù)領(lǐng)域】,涉及行人檢測(cè)中的特征提取和表示技術(shù)。
【背景技術(shù)】
[0002] 行人檢測(cè)和跟蹤是近年來計(jì)算機(jī)視覺領(lǐng)域研究的熱點(diǎn)課題之一,它的目的是在視 頻圖像序列中準(zhǔn)確而實(shí)時(shí)地找到人體或部分人體或跟蹤行人,是實(shí)現(xiàn)人體活動(dòng)分析的基礎(chǔ) 和關(guān)鍵步驟。它融合了圖像處理、模式識(shí)別、人工智能及自動(dòng)控制等諸多相關(guān)領(lǐng)域的知識(shí), 在車輛輔助駕駛、智能視頻監(jiān)控、機(jī)器人視覺和高級(jí)人機(jī)交互等領(lǐng)域有著廣泛的應(yīng)用前景 和潛在經(jīng)濟(jì)價(jià)值。在實(shí)際應(yīng)用中,由于場(chǎng)景的復(fù)雜性、視角與尺度的變化、人體姿態(tài)與著裝 的多樣性以及部分遮擋等因素,使得行人檢測(cè)和跟蹤具有極大的挑戰(zhàn)性。
[0003] 為達(dá)到實(shí)時(shí)性的需求,快速行人特征提取和表示是近年來圍繞行人檢測(cè)和跟蹤研 究工作的重難點(diǎn)之一。評(píng)價(jià)特征提取和表示的主要指標(biāo)有三個(gè):判別能力、魯棒性、實(shí)時(shí)性。 不同的特征提取方法往往構(gòu)建出不同的行人描述子。行人兼具剛性和柔性物體的特性,因 此行人特征提取和表示面臨兩難選擇:一方面如果行人描述子對(duì)行人的描述過于精致,會(huì) 導(dǎo)致難于處理形變問題,即會(huì)降低魯棒性;另一方面如果行人描述子對(duì)形變問題具有高容 忍,會(huì)導(dǎo)致對(duì)行人的定位不精確或者誤檢,即會(huì)降低判別能力;此外,如果特征提取過程過 于繁瑣,會(huì)增加運(yùn)算和存儲(chǔ)成本,即減低實(shí)時(shí)性。行人特征大體可分為三類:底層特征、基 于學(xué)習(xí)的特征和混合特征。
[0004] 1、底層特征指的是顏色、紋理和梯度等基本的圖像特征;例如,HOG特征是目 前廣泛使用的行人底層特征描述子。其優(yōu)點(diǎn)是特征單一,可利用積分圖技術(shù)快速計(jì)算; 缺點(diǎn)是僅利用單一方面的圖像特征刻畫行人,判別力較差。詳見文獻(xiàn):Dalai N,Triggs B. Histograms of oriented gradients for human detection[C]//Computer Vision and Pattern Recognition, IEEE Computer Society Conference on.IEEE,2005,1:886-893.
[0005] 2、基于學(xué)習(xí)的特征指的是通過機(jī)器學(xué)習(xí)的方法,從大量的行人樣本中學(xué)習(xí)到的行 人特征表示;例如,利用Boosting技術(shù)進(jìn)行特征選擇。其優(yōu)點(diǎn)是通過學(xué)習(xí),能從大量的樣本 中選擇出判別能力較強(qiáng)的特征;缺點(diǎn)是特征的選擇與訓(xùn)練樣本密切相關(guān),若樣本集不具有 代表性,難以選擇出判別力強(qiáng)的特征。詳見文獻(xiàn):Viola P, Jones M J, Snow D. Detecting pedestrians using patterns of motion and appearance[J]. International Journal of Computer Vision, 2005, 63 (2):153-161.
[0006] 3、混合特征指的是多種底層特征的融合,或者是底層特征的高階統(tǒng)計(jì)特征; 例如,積分通道特征利用積分圖技術(shù)對(duì)圖像的多個(gè)特征通道進(jìn)行快速計(jì)算。其優(yōu)點(diǎn) 是能夠從不同側(cè)面描述行人特征,提高檢測(cè)準(zhǔn)確率;缺點(diǎn)是隨著特征維數(shù)的增加,特 征計(jì)算開銷增加,進(jìn)而導(dǎo)致分類器的預(yù)測(cè)時(shí)間增加,影響實(shí)時(shí)性。詳見文獻(xiàn):Dolldr P, Tu Z, Perona P, et al. Integral Channel Features[C]//British Machine Vision Conference, 2009, 2 (4) : 5.
[0007] 行人檢測(cè)和跟蹤最明顯的行人特征是不同人體部位的空間布局信息,例如頭、肩、 上下肢的位置關(guān)系往往是固定的。此外,行人特征還需要集合不同區(qū)域內(nèi)的多異構(gòu)源信息, 例如顏色、梯度等多種底層特征。采用積分圖技術(shù)時(shí),若從小區(qū)域提取特征容易提供良好的 局部定位能力,但是易受各種變化的影響;從大區(qū)域提取特征能夠容忍更多的變化,但是欠 缺準(zhǔn)確定位能力。底層特征實(shí)時(shí)性強(qiáng)但判別力弱,混合特征判別力強(qiáng)但實(shí)時(shí)性差,基于學(xué)習(xí) 的特征過于依賴樣本的選取。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明所要解決的技術(shù)問題是,提供一種能兼具小區(qū)域特征提取與大區(qū)域特征提 取優(yōu)點(diǎn)的特征表示方法。
[0009] 本發(fā)明為解決上述技術(shù)問題所采用的技術(shù)方案是,一種基于區(qū)域稀疏積分通道的 行人特征表示方法,包括以下步驟:
[0010] 步驟1)滑動(dòng)窗口遍歷待測(cè)圖像產(chǎn)生候選區(qū)域,在每個(gè)候選區(qū)域中選取N個(gè)子區(qū) 域,各子區(qū)域之間的相對(duì)重疊面積不超過預(yù)設(shè)比例T ;
[0011] 步驟2)計(jì)算候選區(qū)域中子區(qū)域的積分通道特征:
[0012] 2-1)將候選區(qū)域圖像轉(zhuǎn)換到LUV色彩空間;
[0013] 2-2)計(jì)算候選區(qū)域的子區(qū)域的各通道內(nèi)各像素對(duì)應(yīng)的通道值,所述通道包括梯 度幅值通道和方向梯度通道:輸入子區(qū)域圖像,5//&和況/辦分別是子區(qū)域圖像I(x,y) 的水平和垂直方向的梯度,則圖像內(nèi)任意像素(i,j)處的梯度幅值M(i,j)和方向梯度值 〇(i, j):
【權(quán)利要求】
1. 一種基于區(qū)域稀疏積分通道的行人特征提取和表示方法,其特征在于,包括以下步 驟: 步驟1)滑動(dòng)窗口遍歷待測(cè)圖像產(chǎn)生候選區(qū)域,在每個(gè)候選區(qū)域中選取N個(gè)子區(qū)域,各 子區(qū)域之間的相對(duì)重疊面積不超過預(yù)設(shè)比例T; 步驟2)計(jì)算候選區(qū)域中子區(qū)域的積分通道特征: 2-1)將候選區(qū)域圖像轉(zhuǎn)換到LUV色彩空間; 2-2)計(jì)算候選區(qū)域的子區(qū)域的各通道內(nèi)各像素對(duì)應(yīng)的通道值,所述通道包括梯度幅值 通道和方向梯度通道:輸入子區(qū)域圖像,以/&和分別是子區(qū)域圖像I(x,y)的水平和 垂直方向的梯度,則圖像內(nèi)任意像素(i,j)處的梯度幅值M(i,j)和方向梯度值0(i,j):
步驟3)對(duì)每一個(gè)通道內(nèi)的所有通道求和得到一階特征,再將所有通道的一階特征級(jí) 聯(lián)得到一個(gè)高維特征矢量Xtl = (Xl,...,xm)τ作為子區(qū)域積分通道特征; 步驟4)計(jì)算子區(qū)域的稀疏積分通道特征: 將子區(qū)域積分通道特征左乘一個(gè)稀疏隨機(jī)度量矩陣A進(jìn)行降維得到稀疏積分通道特 XjX-AXq; 稀疏隨機(jī)度量矩陣A中各元素au通過以下方式生成:。
謂 其中,,m是區(qū)域積分通道特征的維數(shù); 步驟5)將區(qū)域中全部子區(qū)域的稀疏積分通道特征進(jìn)行融合得到區(qū)域稀疏積分通道特 征; 步驟6)將所有區(qū)域稀疏積分通道特征按照從左到右、從上到下的順序級(jí)聯(lián)得行人描 述子。
2. 如權(quán)利要求1所述一種基于區(qū)域稀疏積分通道的行人特征提取和表示方法,其特征 在于,子區(qū)域個(gè)數(shù)N的取值范圍為3-5。
3. 如權(quán)利要求1所述一種基于區(qū)域稀疏積分通道的行人特征提取和表示方法,其特征 在于,預(yù)設(shè)比例T為40%。
4. 如權(quán)利要求1所述一種基于區(qū)域稀疏積分通道的行人特征提取和表示方法,其特征 在于,所述通道包括梯度1個(gè)幅值通道和6個(gè)方向梯度通道,6個(gè)方向梯度通道包括0°方 向梯度通道、30°方向梯度通道、60°方向梯度通道、90°方向梯度通道、120°方向梯度通 道、150°方向梯度通道。
5. 如權(quán)利要求1所述一種基于區(qū)域稀疏積分通道的行人特征提取和表示方法,其特征 在于,將區(qū)域中全部子區(qū)域的稀疏積分通道特征進(jìn)行融合得到區(qū)域稀疏積分通道特征的具 體方法是,使用maxpooling算法,提取除全部子區(qū)域的稀疏積分通道特征中各通道的最大 值組成區(qū)域稀疏積分通道特征。
【文檔編號(hào)】G06K9/00GK104239854SQ201410439293
【公開日】2014年12月24日 申請(qǐng)日期:2014年8月30日 優(yōu)先權(quán)日:2014年8月30日
【發(fā)明者】解梅, 蔡勇, 何磊, 蔡家柱 申請(qǐng)人:電子科技大學(xué)