化處理后的圖像進(jìn)行劃分包括:將圖像劃分為若干個塊,再將 每個塊劃分為若干個單元格。
[0074]可選的,終端對歸一化處理后的圖像進(jìn)行劃分包括:將圖像劃分為若干個單元格, 再將相連的單元格組成一個塊,每個塊中包含有若干個單元格,比如:將兩兩相鄰的四個呈 田字形排列的單元格組成一個塊。
[0075]本實(shí)施例中,在圖像劃分過程中,對劃分塊和劃分單元格的順序不作具體限定,可 以先劃分塊再劃分單元格,也可以先劃分單元格再組合成塊。
[0076]本實(shí)施例中,對圖像劃分的塊與塊之間是否存在重疊區(qū)域不作具體限定,塊與塊 之間可以存在重疊區(qū)域也可以不存在重疊區(qū)域。
[0077]比如:將128像素*128像素的圖像20先劃分為16像素*16像素互不重疊的塊21,再 將每個16像素*16像素的塊21劃分為8像素*8像素的單元格22,則圖像中包含有8個*8個= 64個互不重疊的塊21,每個塊中包含有2個*2個=4個單元格,如圖2B所示。
[0078]比如:將128像素*128像素的圖像20先劃分為16像素*16像素存在重疊區(qū)域的塊 23,再將每個16像素*16像素的塊23劃分為8像素*8像素的單元格24,則圖像中包含有16個* 16個=256個存在重疊區(qū)域的塊23,每個塊中包含有2個*2個=4個單元格,如圖2C所示。 [0079] 在步驟203中,對每個單元格進(jìn)行DCT變換。
[0080] 對于圖像中的每個單元格而言,假定每個單元格的像素組成的矩陣A的大小為Μ像 素*Ν像素,則矩陣Α的DCT(Discrete Cosine Transform,離散余弦變換)變換系數(shù)如下公 式:
[0081]
[0082] ,.BP.q 為矩陣 A 的 DCT 系數(shù),ρ = 0,1,2···,Μ-1,πι = 0,1,2···,Μ-?4 = 0,1,2···,Ν-1,η = 0,1,2···,Ν-1。
[0083] 將圖像中的每個單元格都進(jìn)行DCT變換,從而將圖像從空間域轉(zhuǎn)換為頻率域。
[0084] 可選的,終端對每個單元格進(jìn)行DFT變換(Discrete Fourier Transform,離散傅 里葉變換)。
[0085] 對于圖像中的每個單元格而言,假定每個單元格的大小為Μ像素 *N像素,像素(X, y)組成的函數(shù)為f (X,y),則函數(shù)f (X,y)的DFT系數(shù)Πu,v)如下公式:
[0086]
[0087] 其中,ιι = 0,1,2···,Μ-1,ν = 0,1,2···,Ν_1。
[0088] 終端將圖像中的每個單元格都進(jìn)行DFT變換,從而將圖像從空間域轉(zhuǎn)換為頻率域。
[0089] 在步驟204中,計(jì)算頻率域中每個單元格的梯度大小和梯度方向,得到每個單元格 的描述子。
[0090] 終端利用梯度算子計(jì)算經(jīng)過DCT變換或DFT變換后的每個單元格中的每個像素的 橫向梯度和縱向梯度。示例性的,常用的梯度算子如下表一所示:
[0091]
[0092] 表一
[0093] 本實(shí)施例中,在計(jì)算每個單元格中像素的梯度大小時可以選擇表一中的任意一個 梯度算子,也可以選擇其他的梯度算子,本實(shí)施例中對梯度算子的選擇不作具體限定。
[0094] 假定像素(X,y)的橫向梯度為H( X,y),縱向梯度為V (X,y),則每個像素的梯度方向 和梯度幅值的計(jì)算分別如下公式(1)和公式(2):
[0095] 0(x,y)=tan-1[V(x,y)/H(x,y)] (1)
[0096] m(x,y) = [H(x,y)2+V(x,y)2]1/2 (2)
[0097] 其中,9(x,y)為像素(x,y)的梯度方向,m(x,y)為像素(x,y)的梯度大小。
[0098] 梯度方向0(X,y)的取值范圍為-90度到90度,將梯度方向0(X,y)平均分成z份,對 每個單元格中的所有像素按照權(quán)重m(x,y)在梯度方向劃分的每一份進(jìn)行統(tǒng)計(jì),最后每個單 元格得到一個z維的向量,也即得到每個單元格對應(yīng)的描述子。
[0099]比如:將梯度方向θ (X,y)平均分成9份,每一份對應(yīng)的角度為20度,對每個單元格 中所有像素按照權(quán)重m(x,y)在各個20度中進(jìn)行統(tǒng)計(jì),最后對應(yīng)每個單元格得到一個9維的 向量。
[0100]本實(shí)施例中,對將梯度方向劃分為多少份不作具體限定。
[0101 ]在步驟205中,統(tǒng)計(jì)頻率域中每個塊內(nèi)的各個描述子,得到每個塊的H0G特征。
[0102] 終端對每個塊內(nèi)包含的各個單元格中計(jì)算得到的描述子進(jìn)行統(tǒng)計(jì),得到每個塊的 H0G特征。
[0103] 在對各個單元格中計(jì)算得到的描述子進(jìn)行統(tǒng)計(jì)時,終端可以將各個單元格對應(yīng)的 描述子進(jìn)行串聯(lián),使得每個塊的H0G特征是一個向量,該向量的維數(shù)是該塊內(nèi)包含單元格對 應(yīng)的描述子維數(shù)的k倍。
[0104]比如:各個單元格中的描述子為9維的向量,每個塊包含有4個單元格,則將4個單 元格中的9維描述子進(jìn)行串聯(lián),形成一個36維的向量,將該36維的向量作為對應(yīng)塊的H0G特 征。
[0105] 在步驟206中,統(tǒng)計(jì)圖像在頻率域中各個塊的H0G特征,得到圖像的H0G特征。
[0106] 終端統(tǒng)計(jì)各個塊的H0G特征,得到圖像的H0G特征。將圖像中各個塊的H0G特征串聯(lián) 成一個矩陣,得到圖像的H0G特征,矩陣的每一列為一個塊的H0G特征。
[0107] 比如:圖像中包含有K個塊,各個塊的H0G特征為Ki,則將Ki個H0G特征串聯(lián)成一個 矩陣25,將心放在串聯(lián)成的矩陣的第一列26,將1( 2放在串聯(lián)的矩陣的第二列27,以此類推。如 圖2D所示。
[0108] 綜上所述,本公開實(shí)施例中提供的特征提取方法,通過將圖像劃分為若干個塊,每 個塊包括若干個單元格;對每個單元格進(jìn)行DCT變換或DFT變換;計(jì)算頻率域中每個單元格 的梯度大小和梯度方向,得到每個單元格的描述子;統(tǒng)計(jì)頻率域中每個塊內(nèi)的各個描述子, 得到每個塊的H0G特征;統(tǒng)計(jì)圖像在頻率域中各個塊的H0G特征,得到圖像的H0G特征;解決 了在H0G特征提取過程中是針對圖像的空間域直接計(jì)算得到,導(dǎo)致在模式識別中的檢測率 和準(zhǔn)確度較低的問題;達(dá)到了在頻率域提取圖像的H0G特征,提高了在模式識別中的檢測率 和準(zhǔn)確度的效果。
[0109] 在基于圖2A所示的可選實(shí)施例中,在統(tǒng)計(jì)圖像中各個塊的H0G特征得到圖像的H0G 特征的過程中,可以按照在圖像的對應(yīng)位置的形式進(jìn)行排列。步驟206可替換成為如下步驟 206a和206b,如圖3A所示:
[0110] 在步驟206a中,將圖像中每個塊的H0G特征由初始的L*1維向量調(diào)整為M*N的矩陣, 每個塊包括M*N個像素,L=M*N。
[0111] 每個塊的HOG特征是將各個單元格對應(yīng)的描述子進(jìn)行串聯(lián)得到的L*1維向量,將L* 1維向量調(diào)整為M*N的矩陣,也即,終端將各個塊中的L*1維向量按照包含的單元格調(diào)整為對 應(yīng)的矩陣,該對應(yīng)的矩陣的每一列為一個單元格的描述子;再將每個單元格的描述子按照 對應(yīng)的像素進(jìn)行調(diào)整,調(diào)整后得到的矩陣的每一列為對應(yīng)塊中對應(yīng)列的像素對應(yīng)的H0G特 征。
[0112] 在步驟206b中,根據(jù)每個塊的調(diào)整后的H0G特征和每個塊在圖像中的對應(yīng)位置,得 到圖像的H0G特征。
[0113] 根據(jù)每個塊的調(diào)整后的H0G特征和每個塊在圖像中的對應(yīng)位置,得到圖像中對應(yīng) 像素位置的H0G特征。
[0114] 比如:圖像中包含有K個塊,各個塊的H0G特征為Ki,則將Ki個H0G特征調(diào)整為M*N的 矩陣,將L調(diào)整后的矩陣31放在第一個塊32在圖像中的對應(yīng)位置,將K 2調(diào)整后的矩陣33放在 第二個塊34在圖像中的對應(yīng)位置,以此類推,最后一個將矩陣ΜΝ放在最后一個塊ΜΝ在圖像 中的對應(yīng)位置。如圖3Β所示。
[0115] 綜上所述,本實(shí)施例提供的特征提取方法,通過將圖像中每個塊的H0G特征由初始 的L* 1維向量調(diào)整為M*N的矩陣,每個塊包括M*N個像素,L=M*N;根據(jù)每個塊的調(diào)整后的H0G 特征和每個塊在圖像中的對應(yīng)位置,得到圖像的HOG特征;使得提取后的圖像的HOG特征與 對應(yīng)于圖像中每個塊的對應(yīng)位置,可以更好地突出圖像中各個塊的特征。
[0116] 下述為本公開裝置實(shí)施例,可以用于執(zhí)行本公開方法實(shí)施例。對于本公開裝置實(shí) 施例中未披露的細(xì)節(jié),請參照本公開方法實(shí)施例。
[0117] 圖4是根據(jù)一示例性實(shí)施例示出的一種特征提取裝置的框圖,如圖4所示,該特征 提取裝置包括但不限于:
[0118]劃分模塊420,被配置為將圖像劃分為若干個塊,每個塊包括若干個單元格。
[0119]轉(zhuǎn)化模塊440,被配置為將每個單元格從空間域轉(zhuǎn)化為頻率域。
[0120]轉(zhuǎn)化模塊440對每個單元格進(jìn)行轉(zhuǎn)化,將圖像從空間域轉(zhuǎn)化為頻率域。
[0121 ]提取模塊460,被配置為提取圖像在頻率域中的方向梯度直方圖H0G特征。
[0122]綜上所述,本公開實(shí)施例中提供的特征提取裝置,通過將圖像劃分為若干個塊,每 個塊包括若干個單元格;將每個單元格從空間域轉(zhuǎn)化為頻率域;提取圖像在頻率域中的方 向梯度直方圖HOG特征;解決了在HOG特征提取過程中是針對圖像的空間域直接計(jì)算得到, 導(dǎo)致在模式識別中的檢測率和準(zhǔn)確度較低的問題;達(dá)到了在頻率域提取圖像的HOG特