亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于球哈希二值編碼的人臉識(shí)別方法及裝置的制造方法

文檔序號(hào):10570389閱讀:598來源:國知局
基于球哈希二值編碼的人臉識(shí)別方法及裝置的制造方法
【專利摘要】本發(fā)明提供一種基于球哈希二值編碼的人臉識(shí)別方法。該方法包括提取訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像的各個(gè)局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量;根據(jù)球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù);根據(jù)球哈希函數(shù)的參數(shù)對像素差值向量進(jìn)行二值編碼,得到第一二值向量;對第一二值向量進(jìn)行聚類,得到多個(gè)視覺單詞;提取測試人臉圖像的局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量;根據(jù)球哈希函數(shù)的參數(shù)對測試人臉圖像對應(yīng)的多個(gè)像素差值向量進(jìn)行二值編碼,得到第二二值向量;根據(jù)視覺單詞對第二二值向量進(jìn)行特征表示得到特征向量,并根據(jù)特征向量進(jìn)行人臉識(shí)別。本發(fā)明存儲(chǔ)量小,計(jì)算速度快,對局部變化的敏感度較低,而且數(shù)據(jù)適應(yīng)性較高,數(shù)據(jù)描述能力較強(qiáng)。
【專利說明】
基于球哈希二值編碼的人臉識(shí)別方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及人臉識(shí)別技術(shù)領(lǐng)域,尤其涉及一種基于球哈希二值編碼的人臉識(shí)別方 法及裝置。
【背景技術(shù)】
[0002] 人臉識(shí)別技術(shù),是一種通過分析比較人臉視覺特征信息進(jìn)行身份鑒別的計(jì)算機(jī)技 術(shù)。人臉識(shí)別算法可以分為:基于全局特征的算法和基于局部特征的算法。其中,基于全局 特征的人臉識(shí)別算法對于局部變化較為敏感,如:表情、遮擋等。而基于局部特征的人臉識(shí) 別算法則是將圖像視為多個(gè)局部塊的組合,分別從每個(gè)局部塊中提取局部特征,再將這些 局部特征拼接成為一個(gè)長向量,從而表示一幅人臉圖像。該類算法對于局部變化較為魯棒。 因此,基于局部特征的人臉識(shí)別算法的應(yīng)用較為廣泛。
[0003] 現(xiàn)有的基于局部特征的人臉識(shí)別算法中包括基于特征學(xué)習(xí)的人臉識(shí)別算法,是通 過從實(shí)際數(shù)據(jù)中來學(xué)習(xí)算法的組織形式或先驗(yàn)知識(shí),即數(shù)據(jù)依賴型的算法。因此只需要訓(xùn) 練數(shù)據(jù)與實(shí)際應(yīng)用場景中的數(shù)據(jù)具有較高的一致性,在加入少量甚至不加入先驗(yàn)知識(shí)的情 況下,就能夠應(yīng)對實(shí)際場景中出現(xiàn)的類內(nèi)變化。而現(xiàn)有的基于特征學(xué)習(xí)的人臉識(shí)別算法大 多是基于實(shí)值的特征表示,即首先利用設(shè)計(jì)的目標(biāo)函數(shù)從輸入的人臉圖像中提取基于實(shí)數(shù) 值的人臉特征表示,然后利用模式識(shí)別方法判斷輸入圖像到底屬于哪個(gè)人。
[0004] 但該類算法存在以下缺點(diǎn):首先,由于特征是基于實(shí)數(shù)值的,當(dāng)外界因素發(fā)生變化 時(shí),學(xué)習(xí)得到的特征也必然會(huì)隨之變化,當(dāng)變化的程度超過某一閾值時(shí),分類器就會(huì)將兩個(gè) 原本屬于同一個(gè)人的特征識(shí)別為不同人。即該類算法對于人臉圖像的局部變化較為敏感, 即提取得到的人臉特征向量的數(shù)值容易隨著圖像的變化而隨之變化。而且,基于實(shí)值的特 征學(xué)習(xí)算法的時(shí)間、空間復(fù)雜度高。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明提供一種基于球哈希二值編碼的人臉識(shí)別方法及裝置,以克服現(xiàn)有技術(shù)中 基于實(shí)值的特征學(xué)習(xí)算法的時(shí)間、空間復(fù)雜度高的問題。
[0006] 第一方面,本發(fā)明提供一種基于球哈希二值編碼的人臉識(shí)別方法,包括:
[0007] 分別將訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像進(jìn)行局部塊的劃分,得到所述訓(xùn)練人臉圖 像對應(yīng)的多個(gè)局部塊,并提取各個(gè)所述訓(xùn)練人臉圖像的各個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng) 的像素差值向量;
[0008] 根據(jù)所述像素差值向量和球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù);所述球哈希函 數(shù)的參數(shù)包括:中心點(diǎn)和半徑;
[0009] 根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編碼,得到所述像素差 值向量對應(yīng)的第一二值向量;
[0010] 對所述第一二值向量進(jìn)行聚類,獲取聚類得到的多個(gè)視覺單詞;
[0011]對測試人臉圖像進(jìn)行局部塊的劃分,得到所述測試人臉圖像對應(yīng)的多個(gè)局部塊, 并提取測試人臉圖像中每個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量;
[0012] 根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè)像素差值向量進(jìn)行 二值編碼,得到所述像素差值向量對應(yīng)的第二二值向量;
[0013] 根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特征向量,并根據(jù)所述 特征向量進(jìn)行人臉識(shí)別。
[0014] 第二方面,本發(fā)明提供一種基于球哈希二值編碼的人臉識(shí)別裝置,包括:
[0015] 第一提取模塊,用于分別將訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像進(jìn)行局部塊的劃分, 得到所述訓(xùn)練人臉圖像對應(yīng)的多個(gè)局部塊,并提取各個(gè)所述訓(xùn)練人臉圖像的各個(gè)所述局部 塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量;
[0016] 優(yōu)化模塊,用于根據(jù)所述像素差值向量和球哈希優(yōu)化算法得到球哈希函數(shù)的參 數(shù);所述球哈希函數(shù)的參數(shù)包括:中心點(diǎn)和半徑;
[0017] 第一編碼模塊,用于根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編 碼,得到所述像素差值向量對應(yīng)的第一二值向量;
[0018] 聚類模塊,用于對所述第一二值向量進(jìn)行聚類,獲取聚類得到的多個(gè)視覺單詞;
[0019] 第二提取模塊,用于對測試人臉圖像進(jìn)行局部塊的劃分,得到所述測試人臉圖像 對應(yīng)的多個(gè)局部塊,并提取測試人臉圖像中每個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值 向量;
[0020] 第二編碼模塊,用于根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè) 像素差值向量進(jìn)行二值編碼,得到所述像素差值向量對應(yīng)的第二二值向量;
[0021 ]處理模塊,用于根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特征向 量,并根據(jù)所述特征向量進(jìn)行人臉識(shí)別。
[0022] 本發(fā)明基于球哈希二值編碼的人臉識(shí)別方法及裝置,首先提取訓(xùn)練樣本中的多個(gè) 訓(xùn)練人臉圖像的局部塊中的像素點(diǎn)對應(yīng)的像素差值向量,然后根據(jù)球哈希優(yōu)化算法得到球 哈希函數(shù)的參數(shù);進(jìn)一步的,根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編 碼,得到所述像素差值向量對應(yīng)的第一二值向量;然后,對所述第一二值向量進(jìn)行聚類,獲 取聚類得到的多個(gè)視覺單詞;進(jìn)一步的,提取測試人臉圖像的局部塊中的像素點(diǎn)對應(yīng)的像 素差值向量;根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè)像素差值向量進(jìn) 行二值編碼,得到所述像素差值向量對應(yīng)的第二二值向量;根據(jù)所述視覺單詞對所述第二 二值向量進(jìn)行特征表示得到特征向量,并根據(jù)所述特征向量進(jìn)行人臉識(shí)別,由于采用了二 值編碼,因此計(jì)算存儲(chǔ)消耗量小,計(jì)算速度快,而且對局部變化的敏感度較低,而且利用無 監(jiān)督的聚類算法將利用球哈希二值編碼算法得到的二值向量進(jìn)一步表示為詞袋模型,數(shù)據(jù) 適應(yīng)性較高,而且由于采用的是球哈希算法,因此數(shù)據(jù)描述能力較強(qiáng)。
【附圖說明】
[0023] 為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
[0024] 圖1為本發(fā)明基于球哈希二值編碼的人臉識(shí)別方法一實(shí)施例的流程示意圖;
[0025] 圖2為本發(fā)明方法一實(shí)施例的實(shí)現(xiàn)流程示意圖;
[0026] 圖3為本發(fā)明方法一實(shí)施例的像素差值向量提取示意圖;
[0027] 圖4為本發(fā)明基于球哈希二值編碼的人臉識(shí)別裝置一實(shí)施例的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0028] 為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例 中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是 本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員 在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0029] 本發(fā)明實(shí)施例的方法,可應(yīng)用于所有自然條件(即非約束條件)下的人臉識(shí)別任 務(wù)。如:在人機(jī)交互系統(tǒng)中的用戶身份識(shí)別、表情識(shí)別等;人員密集場所下的黑名單監(jiān)控和 VIP監(jiān)控等;在社交網(wǎng)絡(luò)中,含有人臉的上傳照片中的用戶標(biāo)簽推薦等。由于本發(fā)明利用基 于球哈希二值編碼的人臉識(shí)別算法,算法的運(yùn)算速度極快,可完成某些非實(shí)時(shí)的人臉識(shí)別 算法無法完成的識(shí)別任務(wù)。
[0030] 圖1為本發(fā)明基于球哈希二值編碼的人臉識(shí)別方法一實(shí)施例的流程示意圖。圖2為 本發(fā)明方法一實(shí)施例的實(shí)現(xiàn)流程示意圖。圖3為本發(fā)明方法一實(shí)施例的像素差值向量提取 示意圖。如圖1、圖2所示,本實(shí)施例的方法,包括:
[0031] 步驟101、分別將訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像進(jìn)行局部塊的劃分,得到所述訓(xùn) 練人臉圖像對應(yīng)的多個(gè)局部塊,并提取各個(gè)所述訓(xùn)練人臉圖像的各個(gè)所述局部塊中每個(gè)像 素點(diǎn)對應(yīng)的像素差值向量;
[0032] 訓(xùn)練樣本中包括多個(gè)訓(xùn)練人臉圖像,即至少包括兩個(gè)訓(xùn)練人臉圖像。
[0033] 可選地,提取局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量具體可以通過如下方式實(shí) 現(xiàn):
[0034]以每個(gè)像素點(diǎn)為中心,以R為半徑,提取位于所述像素點(diǎn)四周的鄰域像素點(diǎn),并以 順時(shí)針方向依次將所述鄰域像素點(diǎn)的像素值與所述像素點(diǎn)的像素值進(jìn)行差值運(yùn)算,得到所 述像素點(diǎn)對應(yīng)的N維像素差值向量;R為預(yù)設(shè)值;N= (2 XR+l) X (2 XR+l)-1。
[0035] 具體的,如圖3所示,該局部塊中的中心像素塊中像素點(diǎn)g對應(yīng)的像素差值向量的 提取過程如下:
[0036] 以像素點(diǎn)g為中心點(diǎn),以R=1為半徑,提取位于該像素點(diǎn)四周的鄰域像素點(diǎn),并以 順時(shí)針方向依次將鄰域像素點(diǎn)的像素值與該像素點(diǎn)的像素值進(jìn)行差值運(yùn)算,得到的N=8維 像素差值向量為(a-g,f-g,k-g,1 -g,m-g,h-g,c-g,b-g)。
[0037] 該中心像素塊中的其他像素點(diǎn)對應(yīng)的像素差值向量如圖3中所示,即像素差值矩 陣的每一列為一個(gè)像素點(diǎn)對應(yīng)的像素差值向量,具體提取過程與上述過程類似,此處不再 贅述。
[0038] 圖3中的鄰域像素塊分別表示了像素點(diǎn)g、q、s和i的鄰域像素塊。
[0039] R取值范圍為大于0的整數(shù)。
[0040] 圖2中的像素差值向量只列出了一個(gè)像素點(diǎn)的像素差值向量(_8,7,3,0,-2,-1,9, 2)〇
[0041] 步驟102、根據(jù)所述像素差值向量和球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù);所述 球哈希函數(shù)的參數(shù)包括:中心點(diǎn)和半徑;
[0042] 利用球哈希優(yōu)化算法,計(jì)算球哈希函數(shù)中每個(gè)球哈希函數(shù)的參數(shù),即每個(gè)超球體 的中心點(diǎn)和半徑。
[0043] 步驟103、根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編碼,得到所 述像素差值向量對應(yīng)的第一二值向量;
[0044] 可選地,步驟103具體可以采用如下方式實(shí)現(xiàn):
[0045] 將所述像素差值向量分別代入所述球哈希函數(shù)中,將所述球哈希函數(shù)的值作為所 述第一二值向量對應(yīng)位置的元素。
[0046] 如圖2所示,假設(shè)球哈希函數(shù)的個(gè)數(shù)為4個(gè),則將像素差值向量分別代入4個(gè)球哈希 函數(shù)中,將球哈希函數(shù)的值作為第一二值向量對應(yīng)位置的元素,即得到向量(〇,1,1,〇)。 [0047]例如,假設(shè)在二維空間中,我們學(xué)習(xí)得到了三個(gè)球哈希函數(shù)(即三個(gè)圓形A,B,C), 假設(shè)它們的半徑均為1,中心點(diǎn)分別為4:(-1,1),8:(0,0)和(: :(1,-1)。那么,基于實(shí)值的像 素差值向量5)不在圓A,B的范圍內(nèi),在圓C的范圍內(nèi),因此,它對應(yīng)的二值向量為(0, 〇,1);同理,(-V 2/2, V 2/2)位于圓A和B的范圍內(nèi),不在圓C的范圍內(nèi),因此,它對應(yīng)的二值 向量為(1,1,〇);再比如:(-1,-1)不在任何一個(gè)球的范圍內(nèi),故其二值向量為(〇,〇,〇)。
[0048] 步驟104、對所述第一二值向量進(jìn)行聚類,獲取聚類得到的多個(gè)視覺單詞;
[0049] 可選的,可以利用K-Means算法對第一二值向量進(jìn)行聚類,分別將聚類得到的k個(gè) 類別中的幾何中心點(diǎn)作為所述視覺單詞;k為預(yù)設(shè)的大于0的整數(shù)。
[0050] 例如,以二維空間為例,二維空間共有4個(gè)二值向量,即(0,0),(0,1),(1,0)和(1, 1 )。利用K-Means方式聚類,可以將(0,0),(0,1)聚成一堆,將(1,0),(1,1)聚成一堆。當(dāng)然也 可以(0,0),(1,0)-堆,另兩個(gè)一堆。反正就是將距離近的多個(gè)二值向量聚在一起。并取這 一堆中的幾何中心點(diǎn)作為視覺單詞,在我們的例子中,可以取(〇,〇. 5)和(1,0.5)作為單詞。 這樣,任何二值向量均可以用這兩個(gè)單詞線性表示;高維空間類似。
[0051] 本發(fā)明實(shí)施例中還可以利用無監(jiān)督的聚類算法進(jìn)行聚類。
[0052]步驟105、對測試人臉圖像進(jìn)行局部塊的劃分,得到所述測試人臉圖像對應(yīng)的多個(gè) 局部塊,并提取測試人臉圖像中每個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量;
[0053]該步驟中提取像素差值向量的過程與步驟101中的相同,此處不再贅述。
[0054]步驟106、根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè)像素差值 向量進(jìn)行二值編碼,得到所述像素差值向量對應(yīng)的第二二值向量;
[0055] 該步驟中而孩子編碼的過程與步驟103中的相同,此處不再贅述。
[0056] 步驟107、根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特征向量,并 根據(jù)所述特征向量進(jìn)行人臉識(shí)別。
[0057] 具體的,可以根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行線性表示,即將多個(gè)視 覺單詞(多個(gè)二值向量)的加權(quán)和作為第二二值向量的特征向量,并利用多個(gè)像素點(diǎn)對應(yīng)的 特征向量進(jìn)行人臉識(shí)別。
[0058] 權(quán)重的取值可以采用如下的方式:
[0059] 將每一個(gè)視覺單詞(即二值向量)與其他所有的視覺單詞計(jì)算歐氏距離,得到歐氏 距離最小值的個(gè)數(shù),進(jìn)行歸一化,得到各個(gè)視覺單詞對應(yīng)的權(quán)重。
[0060] 綜上所述,本發(fā)明實(shí)施例的人臉識(shí)別方法,具體可分為訓(xùn)練階段和測試階段。如圖 2所示,其中,在訓(xùn)練階段中,我們首先從訓(xùn)練樣本中的每個(gè)訓(xùn)練人臉圖像的局部塊中提取 每個(gè)像素點(diǎn)對應(yīng)的像素差值向量;然后利用球哈希優(yōu)化算法,計(jì)算球哈希函數(shù)中每個(gè)球哈 希函數(shù)的參數(shù)(即每個(gè)超球體的中心點(diǎn)和半徑);最后,利用計(jì)算得到的球哈希參數(shù),分別將 訓(xùn)練樣本中提取的各個(gè)像素差值向量編碼為二值向量的形式,即得到多個(gè)第一二值向量, 并利用聚類算法(如K-Means算法)對多個(gè)第一二值向量進(jìn)行聚類,得到聚類的多個(gè)類別分 別對應(yīng)的視覺單詞,形成詞袋模型。
[0061]在測試階段中,我們同樣從測試人臉圖像的局部塊中提取每個(gè)像素點(diǎn)對應(yīng)的像素 差值向量;然后利用訓(xùn)練階段計(jì)算得到的球哈希參數(shù),將測試人臉圖像中提取的像素差值 向量編碼為二值向量的形式,即得到多個(gè)第二二值向量;最后,利用訓(xùn)練階段學(xué)習(xí)得到的詞 袋模型,對第二二值向量進(jìn)行特征表示。
[0062]本發(fā)明實(shí)施例的方法在以下方面均得到了優(yōu)化:
[0063] 1、存儲(chǔ)量方面。由于存儲(chǔ)一個(gè)二值數(shù)據(jù)只需要1個(gè)字節(jié),是存儲(chǔ)一個(gè)double類型的 實(shí)值數(shù)據(jù)所需空間的1/8。且在使用稀疏存儲(chǔ)的情況下,存儲(chǔ)大規(guī)模數(shù)據(jù)所需的空間會(huì)進(jìn)一 步減少。在使用本發(fā)明的基礎(chǔ)上,利用64個(gè)比特存儲(chǔ)一副圖像,對于一個(gè)擁有64G內(nèi)存的工 作站,可以存儲(chǔ)近10億張人臉圖像,幾乎能夠滿足現(xiàn)有的所有人臉識(shí)別應(yīng)用。
[0064] 2、計(jì)算速度方面。二值運(yùn)算只需要對0和1進(jìn)行數(shù)值計(jì)算,而計(jì)算機(jī)底層的邏輯電 路可以極快地完成這項(xiàng)運(yùn)算。因此,使用二值編碼能夠加快人臉識(shí)別算法的訓(xùn)練過程和測 試過程。本發(fā)明比現(xiàn)有水平的基于實(shí)值的人臉識(shí)別算法快近10倍。
[0065] 3、人臉圖像中的局部變化是否敏感方面。本發(fā)明是基于二值編碼的人臉識(shí)別算 法,當(dāng)人臉圖像中像素點(diǎn)的值發(fā)生變化時(shí),基于二值編碼的人臉特征向量有很大可能保持 不變。從而保證了類內(nèi)差異減小,類間差異增加。實(shí)驗(yàn)結(jié)果表明,本發(fā)明在面對各種應(yīng)用場 景下的人臉識(shí)別問題時(shí),均獲得了比基于實(shí)值編碼的人臉識(shí)別算法更為優(yōu)秀的識(shí)別性能。
[0066] 4、先驗(yàn)知識(shí)的依賴性方面。由于本發(fā)明實(shí)施例的算法是通過從訓(xùn)練樣本中學(xué)習(xí)得 到特征向量,從而避免了依賴于先驗(yàn)知識(shí)的準(zhǔn)確性,只要訓(xùn)練樣本中存在的類內(nèi)變化與實(shí) 際應(yīng)用場景中的具有較高的一致性,即使不加入先驗(yàn)先驗(yàn)知識(shí),依然可以得到能夠準(zhǔn)確描 述人臉圖像的特征。
[0067] 5、數(shù)據(jù)適應(yīng)性方面。本發(fā)明利用無監(jiān)督的聚類算法將利用球哈希二值編碼算法得 到的二值向量進(jìn)一步表示為詞袋模型。詞袋模型中的每個(gè)"單詞"即為聚類算法得到的聚類 中心。使用聚類中心表示基于二值的特征向量,使得該發(fā)明在保存了對人臉圖像中的局部 變化具有魯棒性的前提下,還能夠?yàn)樗惴P吞峁└鼉?yōu)秀的數(shù)據(jù)適應(yīng)性。從而使得在某一 應(yīng)用場景下訓(xùn)練得到的算法模型,可以直接應(yīng)用于其他應(yīng)用場景下,而不需要做出任何改 變。
[0068] 6、描述能力方面。本發(fā)明利用球哈希算法,該算法在高維原始空間中具有較強(qiáng)的 空間封閉能力。對提取得到的像素差值向量進(jìn)行有效編碼。因此,本發(fā)明利用的球哈希算 法,能夠?qū)⑾嗤说娜四槇D像特征聚集在一起,同時(shí)將不同人的人臉圖像特征盡可能地分 隔。相比于現(xiàn)有技術(shù)而言,本發(fā)明具有更強(qiáng)的結(jié)構(gòu)信息(包括:底層結(jié)構(gòu)信息和中高層結(jié)構(gòu) 信息)描述能力。
[0069] 本實(shí)施例提供的方法,通過基于球哈希的二值編碼算法對人臉圖像進(jìn)行特征表 示,使人臉識(shí)別算法能夠同時(shí)具有計(jì)算存儲(chǔ)消耗量小,計(jì)算速度快和對人臉圖像中的局部 變化具有魯棒性等特點(diǎn)。并且利用K-Means等無監(jiān)督聚類算法,對學(xué)習(xí)得到的基于二值的人 臉特征向量進(jìn)行聚類,并得到相應(yīng)的詞袋模型。使得本發(fā)明能夠?qū)τ诓煌愋偷臄?shù)據(jù)(即, 不同應(yīng)用場景下的數(shù)據(jù))具有較好的適應(yīng)性。
[0070] 本實(shí)施例提供的方法,首先提取訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像的局部塊中的像 素點(diǎn)對應(yīng)的像素差值向量,然后根據(jù)球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù);進(jìn)一步的,根 據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編碼,得到所述像素差值向量對應(yīng) 的第一二值向量;然后,對所述第一二值向量進(jìn)行聚類,獲取聚類得到的多個(gè)視覺單詞;進(jìn) 一步的,提取測試人臉圖像的局部塊中的像素點(diǎn)對應(yīng)的像素差值向量;根據(jù)所述球哈希函 數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè)像素差值向量進(jìn)行二值編碼,得到所述像素差值 向量對應(yīng)的第二二值向量;根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特征 向量,并根據(jù)所述特征向量進(jìn)行人臉識(shí)別,由于采用了二值編碼,因此計(jì)算存儲(chǔ)消耗量小, 計(jì)算速度快,而且對局部變化的敏感度較低,而且利用無監(jiān)督的聚類算法將利用球哈希二 值編碼算法得到的二值向量進(jìn)一步表示為詞袋模型,數(shù)據(jù)適應(yīng)性較高,而且由于采用的是 球哈希算法,因此數(shù)據(jù)描述能力較強(qiáng)。
[0071] 在上述實(shí)施例的基礎(chǔ)上,本實(shí)施例中,步驟102具體可以通過如下方式實(shí)現(xiàn):
[0072]根據(jù)如下公式(1)和公式(2)的目標(biāo)函數(shù)進(jìn)行優(yōu)化,使得所述公式(1)的取值為n/ 2,所述公式⑵的取值為n/4,得到第i個(gè)球哈希函數(shù)的中心點(diǎn)pf = pfi+fi;
[0073] vi= | sg | hi(sg) =+1, l^g^n | ; (1)
[0074] vij= |sg|hi(sg)=+l,hj(sg)=+l,l^g^n| ;(2)
[0075] 其中
[0076]其中,| ? |表示變量的非零元素的數(shù)量,所述sg為像素差值向量,n表示像素差值 向量的個(gè)數(shù);lu(Sg)和h」(Sg)分別表示參數(shù)為&的第i個(gè)和第j個(gè)球哈希函數(shù);i的取值范圍為 1至K;j的取值范圍為1至K-1;K為大于1的整數(shù); Ple表示在第c次迭代時(shí)的第i個(gè)球哈希函數(shù) 的中心點(diǎn);pf1表示在第c-1次迭代時(shí)的第i個(gè)球哈希函數(shù)的中心點(diǎn);P/表示在第c次迭代時(shí) 的第j個(gè)球哈希函數(shù)的中心點(diǎn);c為大于0的整數(shù);pf 1在。=1時(shí)的初始值為預(yù)設(shè)的初始值。
[0077]具體地,球哈希優(yōu)化得到的數(shù)據(jù)具有平衡的比特分布利于數(shù)據(jù)攜帶更多的具有判 別性的消息,且哈希函數(shù)之間的獨(dú)立則有利于平衡的二值比特分布。為了實(shí)現(xiàn)這兩個(gè)目標(biāo), 我們提出了如下的目標(biāo)函數(shù):
[0079] 其中,lu(X)表示第i個(gè)球哈希函數(shù)。h」(X)表示第j個(gè)球哈希函數(shù)。x表示像素差值向 量。為了使學(xué)習(xí)得到的二值編碼數(shù)據(jù)能夠盡可能地滿足上述條件,我們使用兩階段的迭代 優(yōu)化算法,分別對空間中的超球體的中心點(diǎn)和半徑進(jìn)行優(yōu)化。在優(yōu)化其中一個(gè)變量時(shí),使另 一個(gè)變量保持不變,通過多次迭代運(yùn)算,最終求得滿足上述條件的超球體。為了清楚地表示 優(yōu)化的計(jì)算過程,我們設(shè)置兩個(gè)變量來描述上述的目標(biāo)函數(shù):
[0080] vi= | sg | hi(sg) =+1, l^g^n | ; (1)
[0081] vij= |sg|hi(sg)=+l,hj(sg)=+l,l^g^n| ;(2)
[0082] 根據(jù)上述公式(1)和公式(2)進(jìn)行優(yōu)化,使得所述公式(1)的取值為n/2,所述公式 ⑵的取值為n/4,得到第i個(gè)球哈希函數(shù)的中心點(diǎn)pf = p^+fi;
[0083]其中,| ? |表示變量的非零元素的數(shù)量,所述sg為像素差值向量,n表示像素差值 向量的個(gè)數(shù);lu(Sg)和h」(Sg)分別表示參數(shù)為&的第i個(gè)和第j個(gè)球哈希函數(shù);i的取值范圍為 1至K;j的取值范圍為1至K-U Vl描述的是在訓(xùn)練樣本中的像素差值向量的集合中對于第i 個(gè)球哈希函數(shù),有多少個(gè)數(shù)值為+1的像素差值向量,它用于描述式(a)中的變化情況;描 述的是在訓(xùn)練樣本中的像素差值向量的集合中對于第i個(gè)和第j個(gè)球哈希函數(shù)的數(shù)據(jù)點(diǎn)對 (像素差值向量對),有多少對數(shù)據(jù)點(diǎn)(數(shù)據(jù)點(diǎn)即像素差值向量)滿足數(shù)值同時(shí)為+1的情況, 它用于描述式(b)中的變化情況。為了求解上述目標(biāo)函數(shù),具體的優(yōu)化過程如下所示:
[0084]首先,假設(shè)半徑固定,計(jì)算中心點(diǎn)。
[0085]在這種情況下,我們即通過調(diào)整中心點(diǎn)的數(shù)值,使得學(xué)習(xí)得到的參數(shù)盡可能滿足 式(2)中的目標(biāo)函數(shù),即使變量的數(shù)值盡可能接近n/4。對于任意一對第i個(gè)和第j個(gè)球哈 希函數(shù)(即兩個(gè)超球體i和j)而言,當(dāng)vu的數(shù)值大于n/4時(shí),表明兩個(gè)超球體距離過近,需要 一個(gè)"排斥力"將二者分來;相反,則需要一個(gè)"吸引力"將二者拉近。如果萬有引力定律一 樣,超球體j對于超球體i的吸引力或排斥力如下定義:
[0087]其中,pf表示在第c次迭代時(shí)的第i個(gè)球哈希函數(shù)的中心點(diǎn);p/表示在第c次迭代 時(shí)的第j個(gè)球哈希函數(shù)的中心點(diǎn)。故所有其他超球體中心對超球體i的合力如下所示:
[0089] 故,第i個(gè)球哈希函數(shù)的中心點(diǎn)即可被更新為
[0090] 其中,pf1在。=1時(shí)的初始值為預(yù)設(shè)的初始值,即也可以采用隨機(jī)的初始值。
[0091] 在上述實(shí)施例的基礎(chǔ)上,根據(jù)已經(jīng)求出的中心點(diǎn)計(jì)算半徑:
[0092] 根據(jù)所述第i個(gè)球哈希函數(shù)的中心點(diǎn)pf得到所述第i個(gè)球哈希函數(shù)的半徑為ri = d (pi , Sn/2 );
[0093]其中,sn/2表示分別將n個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn)的距離進(jìn)行 升序排列之后的第n/2個(gè)像素差值向量;
[0094] d( ?)表示計(jì)算歐氏距離的函數(shù)。
[0095]具體的,假設(shè)中心點(diǎn)固定,即已經(jīng)求出中心點(diǎn),然后計(jì)算半徑。
[0096]在這種情況下,我們即通過調(diào)整中心點(diǎn)的數(shù)值,使得學(xué)習(xí)得到的參數(shù)盡可能滿足 式(1)中的目標(biāo)函數(shù),即使變量Vl的數(shù)值盡可能接近n/2。在各個(gè)像素差值向量已經(jīng)根據(jù)其 對于中心點(diǎn)的距離進(jìn)行升序排序的條件下,我們可以簡單地將第i個(gè)球哈希函數(shù)的半徑設(shè) 置為 ri = d(Ple,Sn/2),其中d( ?)表示計(jì)算歐氏距離的函數(shù)。
[0097]其中,在實(shí)際應(yīng)用中,雖然從理論上來說,上述目標(biāo)函數(shù)(a)和(b)能夠得到最小的 量化誤差,即使得學(xué)習(xí)得到的二值向量與原有特征向量之間的差值最小。但該目標(biāo)函數(shù)會(huì) 使得迭代過程變得漫長,又幾乎沒有提高人臉識(shí)別算法的識(shí)別準(zhǔn)確率。因此,我們考慮利用 表示作為迭代過程停止的指示器。
[0098] 具體地,理想條件下,Vi,」的均值和標(biāo)準(zhǔn)差分別為n/4和0。我們考慮當(dāng)Vi, j的均值和 標(biāo)準(zhǔn)差的誤差分別為理想情況的10%和15%時(shí),即可以認(rèn)為該迭代過程已足夠收斂,從而 停止迭代過程。實(shí)驗(yàn)結(jié)果表明,在幾乎不損失精度的情況下,能夠加速上述方法的迭代過 程。
[0099] 在上述實(shí)施例的基礎(chǔ)上,由于在上述的具體實(shí)施例中,將第i個(gè)球哈希函數(shù)的半徑 設(shè)置為^icKpAsw)。但這種半徑賦值方法在~ /2附近數(shù)據(jù)點(diǎn)比較密集的情況下難以獲得 很好的區(qū)分效果。因此,本實(shí)施例中,可以根據(jù)如下方式計(jì)算半徑:
[0100] 根據(jù)所述第i個(gè)球哈希函數(shù)的中心點(diǎn)pf以及公式(3)得到第i個(gè)球哈希函數(shù)的半徑 ri;
[0102]其中,根據(jù)公式(4)得到j(luò)的取值;
[0105] ~+1表示分別將n個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn)的距離進(jìn)行升序排 列之后的第j+1個(gè)像素差值向量;^表示分別將n個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中 心點(diǎn)的距離進(jìn)行升序排列之后的第j個(gè)像素差值向量;
[0106] a為預(yù)設(shè)值。
[0107]具體的,在實(shí)際應(yīng)用中,我們可以放松對式(a)的要求,獲得基于最大邊緣的超球 體的半徑。同樣是在各個(gè)像素差值向量已經(jīng)根據(jù)其對于中心點(diǎn)的距離進(jìn)行升序排序的條件 下,我們選擇靠近sn/2點(diǎn)附近的一系列數(shù)據(jù)點(diǎn),用于最大邊緣的優(yōu)化。
[0109] 其中,a用于控制對于式(a)的松弛程度,可以為預(yù)設(shè)值。而最大化邊緣的數(shù)據(jù)點(diǎn)可 定義為:
[0110] /=argrnax[t/(;;/ ,.y;+l)-^/(/;; ,5,.)] ; (4) j . J
[0111] 即求使得cKpAsj+d-cKpAsj)最大的j的取值,且jGj。
[0112] 因此,最終基于最大邊緣的超球體半徑為:
[0114] 需要說明的是,對于上述具體實(shí)施例而言,由于其基本相應(yīng)于圖1所示的方法實(shí)施 例,所以相關(guān)之處參見圖1所示方法實(shí)施例的部分說明即可。
[0115] 圖4為本發(fā)明基于球哈希二值編碼的人臉識(shí)別裝置一實(shí)施例的結(jié)構(gòu)示意圖。如圖4 所示,本實(shí)施例的基于球哈希二值編碼的人臉識(shí)別裝置,包括:
[0116] 第一提取模塊401,用于分別將訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像進(jìn)行局部塊的劃 分,得到所述訓(xùn)練人臉圖像對應(yīng)的多個(gè)局部塊,并提取各個(gè)所述訓(xùn)練人臉圖像的各個(gè)所述 局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量;
[0117] 優(yōu)化模塊402,用于根據(jù)所述像素差值向量和球哈希優(yōu)化算法得到球哈希函數(shù)的 參數(shù);所述球哈希函數(shù)的參數(shù)包括:中心點(diǎn)和半徑;
[0118] 第一編碼模塊403,用于根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二 值編碼,得到所述像素差值向量對應(yīng)的第一二值向量;
[0119] 聚類模塊404,用于對所述第一二值向量進(jìn)行聚類,獲取聚類得到的多個(gè)視覺單 詞;
[0120] 第二提取模塊405,用于對測試人臉圖像進(jìn)行局部塊的劃分,得到所述測試人臉圖 像對應(yīng)的多個(gè)局部塊,并提取測試人臉圖像中每個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差 值向量;
[0121] 第二編碼模塊406,用于根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的 多個(gè)像素差值向量進(jìn)行二值編碼,得到所述像素差值向量對應(yīng)的第二二值向量;
[0122] 處理模塊407,用于根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特 征向量,并根據(jù)所述特征向量進(jìn)行人臉識(shí)別。
[0123] 可選地,作為一種可實(shí)施的方式,所述第一提取模塊401,具體用于:
[0124] 以每個(gè)像素點(diǎn)為中心,以R為半徑,提取位于所述像素點(diǎn)四周的鄰域像素點(diǎn),并以 順時(shí)針方向依次將所述鄰域像素點(diǎn)的像素值與所述像素點(diǎn)的像素值進(jìn)行差值運(yùn)算,得到所 述像素點(diǎn)對應(yīng)的N維像素差值向量;R為預(yù)設(shè)的大于0的整數(shù);N= (2 XR+1) X (2 XR+1)-1。
[0125] 可選地,作為一種可實(shí)施的方式,所述第二提取模塊405,具體用于:
[0126] 以每個(gè)像素點(diǎn)為中心,以R為半徑,提取位于所述像素點(diǎn)四周的鄰域像素點(diǎn),并以 順時(shí)針方向依次將所述鄰域像素點(diǎn)的像素值與所述像素點(diǎn)的像素值進(jìn)行差值運(yùn)算,得到所 述像素點(diǎn)對應(yīng)的N維像素差值向量;R為預(yù)設(shè)的大于0的整數(shù);N= (2 XR+1) X (2 XR+1)-1。
[0127] 可選地,作為一種可實(shí)施的方式,優(yōu)化模塊402,具體用于:
[0128] 根據(jù)如下公式(1)和公式(2)的目標(biāo)函數(shù)進(jìn)行優(yōu)化,使得所述公式(1)的取值為n/ 2,所述公式⑵的取值為n/4,得到第i個(gè)球哈希函數(shù)的中心點(diǎn)pf = pfi+fi;
[0129] vi= | sg | hi(sg) =+1, l^g^n | ; (1)
[0130] vij= |sg|hi(sg)=+l,hj(sg)=+l,l^g^n| ;(2)
[0131] 其中:
[0132] 其中,| ? |表示變量的非零元素的數(shù)量,所述Sg為像素差值向量,n表示像素差值 向量的個(gè)數(shù);lu( Sg)和h」(Sg)分別表示參數(shù)為&的第i個(gè)和第j個(gè)球哈希函數(shù);i的取值范圍為 1至K;j的取值范圍為1至K_1;K為大于1的整數(shù); Ple表示在第c次迭代時(shí)的第i個(gè)球哈希函數(shù) 的中心點(diǎn);pf1表示在第c-1次迭代時(shí)的第i個(gè)球哈希函數(shù)的中心點(diǎn);P/表示在第c次迭代時(shí) 的第j個(gè)球哈希函數(shù)的中心點(diǎn);c為大于0的整數(shù);pf 1在。=1時(shí)的初始值為預(yù)設(shè)的初始值。
[0133] 可選地,作為一種可實(shí)施的方式,優(yōu)化模塊402,具體用于:
[0134] 根據(jù)所述第i個(gè)球哈希函數(shù)的中心點(diǎn)pf得到所述第i個(gè)球哈希函數(shù)的半徑為ri = d (pi , Sn/2 );
[0135] 其中,sn/2表示分別將n個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn)的距離進(jìn)行 升序排列之后的第n/2個(gè)像素差值向量;
[0136] d( ?)表示計(jì)算歐氏距離的函數(shù)。
[0137] 可選地,作為一種可實(shí)施的方式,優(yōu)化模塊402,具體用于:
[0138] 根據(jù)所述第i個(gè)球哈希函數(shù)的中心點(diǎn)Ple以及公式(3)得到第i個(gè)球哈希函數(shù)的半徑 ri;
[0140] 其中,根據(jù)公式(4)得到j(luò)的取值;
[0141] ./ = argmax[//(/;; ,5/+,)-1/{/;;,5,)], /&J: (4)
[0142] 其中
[0143] Sj+1表示分別將n個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn)的距離進(jìn)行升序排 列之后的第j+1個(gè)像素差值向量;^表示分別將n個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中 心點(diǎn)的距離進(jìn)行升序排列之后的第j個(gè)像素差值向量;
[0144] a為預(yù)設(shè)值。
[0145] 可選地,作為一種可實(shí)施的方式,第一編碼模塊403,具體用于:
[0146] 將所述像素差值向量分別代入所述球哈希函數(shù)中,將所述球哈希函數(shù)的值作為所 述第一二值向量對應(yīng)位置的元素。
[0147] 可選地,作為一種可實(shí)施的方式,第二編碼模塊406,具體用于:
[0148] 將所述像素差值向量分別代入所述球哈希函數(shù)中,將所述球哈希函數(shù)的值作為所 述第二二值向量對應(yīng)位置的元素。
[0149] 可選地,作為一種可實(shí)施的方式,聚類模塊404,用于:
[0150] 利用K-Means算法對所述第一二值向量進(jìn)行聚類,分別將聚類得到的k個(gè)類別中的 幾何中心點(diǎn)作為所述視覺單詞;k為預(yù)設(shè)的大于0的整數(shù)。
[0151] 可選地,作為一種可實(shí)施的方式,所述處理模塊402,具體用于:
[0152] 將所述視覺單詞的加權(quán)和作為特征表示得到的特征向量。
[0153] 本實(shí)施例的裝置,可以用于執(zhí)行如圖1所示方法實(shí)施例的技術(shù)方案,其實(shí)現(xiàn)原理和 技術(shù)效果類似,此處不再贅述。
[0154] 本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過 程序指令相關(guān)的硬件來完成,前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序 在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:ROM、RAM、磁碟或者光 盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0155] 最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡 管參照前述各實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依 然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分或者全部技術(shù)特征進(jìn) 行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù) 方案的范圍。
【主權(quán)項(xiàng)】
1. 一種基于球哈希二值編碼的人臉識(shí)別方法,其特征在于,包括: 分別將訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像進(jìn)行局部塊的劃分,得到所述訓(xùn)練人臉圖像對 應(yīng)的多個(gè)局部塊,并提取各個(gè)所述訓(xùn)練人臉圖像的各個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像 素差值向量; 根據(jù)所述像素差值向量和球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù);所述球哈希函數(shù)的 參數(shù)包括:中心點(diǎn)和半徑; 根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編碼,得到所述像素差值向 量對應(yīng)的第一二值向量; 對所述第一二值向量進(jìn)行聚類,獲取聚類得到的多個(gè)視覺單詞; 對測試人臉圖像進(jìn)行局部塊的劃分,得到所述測試人臉圖像對應(yīng)的多個(gè)局部塊,并提 取測試人臉圖像中每個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量; 根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè)像素差值向量進(jìn)行二值 編碼,得到所述像素差值向量對應(yīng)的第二二值向量; 根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特征向量,并根據(jù)所述特征 向量進(jìn)行人臉識(shí)別。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,提取各個(gè)所述訓(xùn)練人臉圖像的各個(gè)所述局 部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量,包括: 以每個(gè)像素點(diǎn)為中心,以R為半徑,提取位于所述像素點(diǎn)四周的鄰域像素點(diǎn),并以順時(shí) 針方向依次將所述鄰域像素點(diǎn)的像素值與所述像素點(diǎn)的像素值進(jìn)行差值運(yùn)算,得到所述像 素點(diǎn)對應(yīng)的N維像素差值向量;R為預(yù)設(shè)的大于O的整數(shù);N=(2XR+1)X(2XR+1)-1。3. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,根據(jù)所述像素差值向量和球哈希優(yōu)化 算法得到球哈希函數(shù)的參數(shù),包括: 根據(jù)如下公式(1)和公式(2)的目標(biāo)函數(shù)進(jìn)行優(yōu)化,使得所述公式(1)的取值為n/2,所 述公式⑵的取值為n/4,得到第i個(gè)球哈希函數(shù)的中心點(diǎn)pf = Pi=1+;^; Vi= |sg|hi(sg)=+l,l^g^n| ; (I) Vij= |sg|hi(sg)=+l,hj(sg)=+l,l^g^n| ; (2)其中,I · I表示變量的非零元素的數(shù)量,所述sg為像素差值向量,η表示像素差值向量的 個(gè)數(shù);hi(sg)和hj(sg)分別表示參數(shù)為Sg的第i個(gè)和第j個(gè)球哈希函數(shù);i的取值范圍為1至Κ; j 的取值范圍為1至K-I ;K為大于1的整數(shù);pf表示在第c次迭代時(shí)的第i個(gè)球哈希函數(shù)的中心 點(diǎn);Pf1表示在第c-1次迭代時(shí)的第i個(gè)球哈希函數(shù)的中心點(diǎn);P/表示在第c次迭代時(shí)的第j 個(gè)球哈希函數(shù)的中心點(diǎn);c為大于O的整數(shù);Pf1在。=1時(shí)的初始值為預(yù)設(shè)的初始值。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括: 根據(jù)所述第i個(gè)球哈希函數(shù)的中心點(diǎn)Pie得到所述第i個(gè)球哈希函數(shù)的半徑為ri = d(pie, Sn/2); 其中,Sn/2表示分別將η個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn)的距離進(jìn)行升序 排列之后的第n/2個(gè)像素差值向量; d( ·)表示計(jì)算歐氏距離的函數(shù)。5. 根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括: 根據(jù)所述第i個(gè)球哈希函數(shù)的中心點(diǎn)以及公式(3)得到第i個(gè)球哈希函數(shù)的半徑r1;其中,根據(jù)公式(4)得到j(luò)的取值;sJ+1表示分別將η個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn)的距離進(jìn)行升序排列之 后的第j + Ι個(gè)像素差值向量;Sj表示分別將η個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn) 的距離進(jìn)行升序排列之后的第j個(gè)像素差值向量;α為預(yù)設(shè)值。6. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,根據(jù)所述球哈希函數(shù)的參數(shù)對所述像 素差值向量進(jìn)行二值編碼,得到所述像素差值向量對應(yīng)的第一二值向量,包括: 將所述像素差值向量分別代入所述球哈希函數(shù)中,將所述球哈希函數(shù)的值作為所述第 一二值向量對應(yīng)位置的元素。7. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,對所述第一二值向量進(jìn)行聚類,獲取聚 類得到的多個(gè)視覺單詞,包括: 利用K-Means算法對所述第一二值向量進(jìn)行聚類,分別將聚類得到的k個(gè)類別中的幾何 中心點(diǎn)作為所述視覺單詞;k為預(yù)設(shè)的大于O的整數(shù)。8. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,根據(jù)所述視覺單詞對所述第二二值向 量進(jìn)行特征表示,包括: 將所述視覺單詞的加權(quán)和作為特征表示得到的特征向量。9. 一種基于球哈希二值編碼的人臉識(shí)別裝置,其特征在于,包括: 第一提取模塊,用于分別將訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像進(jìn)行局部塊的劃分,得到 所述訓(xùn)練人臉圖像對應(yīng)的多個(gè)局部塊,并提取各個(gè)所述訓(xùn)練人臉圖像的各個(gè)所述局部塊中 每個(gè)像素點(diǎn)對應(yīng)的像素差值向量; 優(yōu)化模塊,用于根據(jù)所述像素差值向量和球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù);所 述球哈希函數(shù)的參數(shù)包括:中心點(diǎn)和半徑; 第一編碼模塊,用于根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編碼, 得到所述像素差值向量對應(yīng)的第一二值向量; 聚類模塊,用于對所述第一二值向量進(jìn)行聚類,獲取聚類得到的多個(gè)視覺單詞; 第二提取模塊,用于對測試人臉圖像進(jìn)行局部塊的劃分,得到所述測試人臉圖像對應(yīng) 的多個(gè)局部塊,并提取測試人臉圖像中每個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向 量; 第二編碼模塊,用于根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè)像素 差值向量進(jìn)行二值編碼,得到所述像素差值向量對應(yīng)的第二二值向量; 處理模塊,用于根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特征向量, 并根據(jù)所述特征向量進(jìn)行人臉識(shí)別。10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述第一提取模塊,具體用于: 以每個(gè)像素點(diǎn)為中心,以R為半徑,提取位于所述像素點(diǎn)四周的鄰域像素點(diǎn),并以順時(shí) 針方向依次將所述鄰域像素點(diǎn)的像素值與所述像素點(diǎn)的像素值進(jìn)行差值運(yùn)算,得到所述像 素點(diǎn)對應(yīng)的N維像素差值向量;R為預(yù)設(shè)的大于0的整數(shù);N=(2XR+1)X(2XR+1)-1。
【文檔編號(hào)】G06K9/62GK105930834SQ201610513332
【公開日】2016年9月7日
【申請日】2016年7月1日
【發(fā)明人】明悅, 范春曉, 田雷, 吳岳辛, 李陽, 史家昆, 翟正元, 吳瓊
【申請人】北京郵電大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1