征,提 高了在模式識別中的檢測率和準確度的效果。
[0123] 圖5是根據(jù)另一示例性實施例示出的一種特征提取裝置的框圖,如圖5所示,該特 征提取裝置包括但不限于:
[0124] 處理模塊410,被配置為將圖像進行歸一化處理,得到預(yù)定尺寸大小的圖像。
[0125] 在模式識別中,一般會涉及到對多個圖像的特征提取。
[0126] 在對圖像進行特征提取之前,處理模塊410對圖像進行歸一化處理,將不同大小的 圖像處理為預(yù)定尺寸大小的圖像,以便于對圖像的統(tǒng)一處理。
[0127] 劃分模塊420,被配置為將圖像劃分為若干個塊,每個塊包括若干個單元格。
[0128]可選的,劃分模塊420對歸一化處理后的圖像進行劃分包括:將圖像劃分為若干個 塊,再將每個塊劃分為若干個單元格。
[0129]可選的,劃分模塊420對歸一化處理后的圖像進行劃分包括:將圖像劃分為若干個 單元格,再將相連的單元格組成一個塊,每個塊中包含有若干個單元格,比如:將兩兩相鄰 的四個呈田字形排列的單元格組成一個塊。
[0130]本實施例中,劃分模塊420在圖像劃分過程中,對劃分塊和劃分單元格的順序不作 具體限定,可以先劃分塊再劃分單元格,也可以先劃分單元格再組合成塊。
[0131]本實施例中,劃分模塊420對圖像劃分的塊與塊之間是否存在重疊區(qū)域不作具體 限定,塊與塊之間可以存在重疊區(qū)域也可以不存在重疊區(qū)域。
[0132] 轉(zhuǎn)化模塊440,被配置為對每個單元格進行離散余弦變換DCT。
[0133] 對于圖像中的每個單元格而言,假定每個單元格的像素組成的矩陣A的大小為Μ像 素*Ν像素,則矩陣Α的DCT(Discrete Cosine Transform,離散余弦變換)變換系數(shù)如下公 式:
[0134]
[0135] .BP.q 為矩陣 A 的 DCT 系數(shù),ρ = 0,1,2···,Μ-1,πι = 0,1,2···,Μ-?4 = 0,1,2···,Ν-1,η = 0,1,2···,Ν-1。
[0136] 轉(zhuǎn)化模塊440將圖像中的每個單元格都進行DCT變換,從而將圖像從空間域轉(zhuǎn)換為 頻率域。
[0137] 可選的,轉(zhuǎn)化模塊440,被配置為對每個單元格進行DFT變換(Discrete Fourier Transform,離散傅里葉變換)。
[0138] 對于圖像中的每個單元格而言,假定每個單元格的大小為Μ像素*N像素,組成的函 數(shù)為f(x,y),則函數(shù)f(x,y)的DFT系數(shù)F(u,v)如下公式:
[0139]
[0140]其中,u = 0,l,2...,M-l,v = 0,l,2.",N-l,(x,y)為像素的位置。
[0141]轉(zhuǎn)化模塊440將圖像中的每個單元格都進行DFT變換,從而將圖像從空間域轉(zhuǎn)換為 頻率域。
[0142] 提取模塊460,被配置為提取圖像在頻率域中的方向梯度直方圖H0G特征。
[0143] 本實施例中,提取模塊460可以包括如下子模塊:
[0144] 計算子模塊461,被配置為計算頻率域中每個單元格的梯度大小和梯度方向,得 到每個單元格的描述子。
[0145] 計算子模塊461利用梯度算子計算經(jīng)過DCT變換或DFT變換后的每個單元格中的每 個像素的橫向梯度和縱向梯度。
[0146] 本實施例中對梯度算子的選擇不作具體限定。
[0147] 假定像素的橫向梯度為H(X,y),縱向梯度為V(X,y),則每個像素的梯度方向和梯 度幅值的計算分別如下公式(1)和公式(2):
[0148] 0(x,y)=tan_1[V(x,y)/H(x,y)] (1)
[0149] m(x,y) = [H(x,y)2+V(x,y)2]1/2 (2)
[0150] 其中,9(x,y)為像素(x,y)的梯度方向,m(x,y)為像素(x,y)的梯度大小。
[0151] 梯度方向0(X,y)的取值范圍為-90度到90度,將梯度方向0(X,y)平均分成z份,對 每個單元格中的所有像素按照權(quán)重m(x,y)在梯度方向劃分的每一份進行統(tǒng)計,最后每個單 元格得到一個z維的向量,也即得到每個單元格對應(yīng)的描述子。
[0152] 本實施例中,對將梯度方向劃分為多少份不作具體限定。
[0153] 第一統(tǒng)計子模塊462,被配置為統(tǒng)計頻率域中每個塊內(nèi)的各個描述子,得到每個塊 的H0G特征。
[0154] 第一統(tǒng)計子模塊462對每個塊內(nèi)包含的各個單元格中計算得到的描述子進行統(tǒng) 計,得到每個塊的H0G特征。
[0155] 在對各個單元格中計算得到的描述子進行統(tǒng)計時,第一統(tǒng)計子模塊462可以將各 個單元格對應(yīng)的描述子進行串聯(lián),使得每個塊的H0G特征是一個向量,該向量的維數(shù)是該塊 內(nèi)包含單元格對應(yīng)的描述子維數(shù)的k倍。
[0156]第二統(tǒng)計子模塊463,被配置為統(tǒng)計圖像在頻率域中各個塊的H0G特征,得到圖像 的H0G特征。
[0157]第二統(tǒng)計子模塊463統(tǒng)計各個塊的H0G特征,得到圖像的H0G特征。
[0158]可選的,第二統(tǒng)計子模塊463,被配置為將圖像中各個塊的H0G特征串聯(lián)成一個矩 陣,得到圖像的H0G特征,矩陣的每一列為一個塊的H0G特征。
[0159] 綜上所述,本公開實施例中提供的特征提取裝置,通過將圖像劃分為若干個塊,每 個塊包括若干個單元格;對每個單元格進行DCT變換或DFT變換;計算頻率域中每個單元格 的梯度大小和梯度方向,得到每個單元格的描述子;統(tǒng)計頻率域中每個塊內(nèi)的各個描述子, 得到每個塊的H0G特征;統(tǒng)計圖像在頻率域中各個塊的H0G特征,得到圖像的H0G特征;解決 了在H0G特征提取過程中是針對圖像的空間域直接計算得到,導(dǎo)致在模式識別中的檢測率 和準確度較低的問題;達到了在頻率域提取圖像的H0G特征,提高了在模式識別中的檢測率 和準確度的效果。
[0160] 在基于圖5所示的可選實施例中,第二統(tǒng)計子模塊463可以包括如下子模塊,如圖6 所示:
[0161]調(diào)整子模塊610,被配置為將圖像中每個塊的HOG特征由初始的L* 1維向量調(diào)整為 M*N的矩陣,每個塊包括M*N個像素,L=M*N。
[0162 ]每個塊的H0G特征是將各個單元格對應(yīng)的描述子進行串聯(lián)得到的L* 1維向量,調(diào)整 子模塊610將L* 1維向量調(diào)整為M*N的矩陣,也即,將各個塊中的L* 1維向量按照包含的單元 格調(diào)整為對應(yīng)的矩陣,該對應(yīng)的矩陣的每一列為一個單元格的描述子;再將每個單元格的 描述子按照對應(yīng)的像素進行調(diào)整,調(diào)整后得到的矩陣的每一列為對應(yīng)塊中對應(yīng)列的像素對 應(yīng)的H0G特征。
[0163] 特征提取子模塊620,被配置為根據(jù)每個塊的調(diào)整后的H0G特征和每個塊在圖像中 的對應(yīng)位置,得到圖像的H0G特征。
[0164] 特征提取子模塊620根據(jù)每個塊的調(diào)整后的H0G特征和每個塊在圖像中的對應(yīng)位 置,得到圖像中對應(yīng)像素位置的H0G特征。
[0165] 綜上所述,本實施例提供的特征提取裝置,通過將圖像中每個塊的H0G特征由初始 的L* 1維向量調(diào)整為M*N的矩陣,每個塊包括M*N個像素,L=M*N;根據(jù)每個塊的調(diào)整后的H0G 特征和每個塊在圖像中的對應(yīng)位置,得到圖像的HOG特征;使得提取后的圖像的HOG特征與 對應(yīng)于圖像中每個塊的對應(yīng)位置,可以更好地突出圖像中各個塊的特征。
[0166] 關(guān)于上述實施例中的裝置,其中各個模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法 的實施例中進行了詳細描述,此處將不做詳細闡述說明。
[0167] 本公開一示例性實施例提供了一種特征提取裝置,能夠?qū)崿F(xiàn)本公開提供的特征提 取方法,該特征提取裝置包括:處理器、用于存儲處理器可執(zhí)行指令的存儲器;
[0168] 其中,處理器被配置為:
[0169] 將圖像劃分為若干個塊,每個塊包括若干個單元格;
[0170] 將每個單元格從空間域轉(zhuǎn)化為頻率域;
[0171] 提取圖像在頻率域中的方向梯度直方圖H0G特征。
[0172] 圖7是根據(jù)一示例性實施例示出的一種特征提取裝置的框圖。例如,裝置700可以 是移動電話,計算機,數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺,平板設(shè)備,醫(yī)療設(shè)備,健身 設(shè)備,個人數(shù)字助理等。
[0173] 參照圖7,裝置700可以包括以下一個或多個組件:處理組件702,存儲器704,電源 組件706,多媒體組件708,音頻組件710,輸入/輸出(1/0)接口 712,傳感器組件714,以及通 信組件716。
[0174] 處理組件702通??刂蒲b置700的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相 機操作和記錄操作相關(guān)聯(lián)的操作。處理組件702可以包括一個或多個處理器718來執(zhí)行指 令,以完成上述的方法的全部或部分步驟。此外,處理組件702可以包括一個或多個模塊,便 于處理組件702和其他組件之間的交互。例如,處理組件702可以包括多媒體模塊,以方便多 媒體組件708和處理組件702之間的交互。
[0175] 存儲器704被配置為存儲各種類型的數(shù)據(jù)以支持在裝置700的操作。這些數(shù)據(jù)的示 例包括用于在裝置700上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消 息,圖片,視頻等。存儲器704可以由任何類型的易失性或非易失