基于球哈希二值編碼的人臉識(shí)別方法及裝置的制造方法

文檔序號(hào)：10570389閱讀：598來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于球哈希二值編碼的人臉識(shí)別方法及裝置的制造方法
【專利摘要】本發(fā)明提供一種基于球哈希二值編碼的人臉識(shí)別方法。該方法包括提取訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像的各個(gè)局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量；根據(jù)球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù)；根據(jù)球哈希函數(shù)的參數(shù)對像素差值向量進(jìn)行二值編碼，得到第一二值向量；對第一二值向量進(jìn)行聚類，得到多個(gè)視覺單詞；提取測試人臉圖像的局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量；根據(jù)球哈希函數(shù)的參數(shù)對測試人臉圖像對應(yīng)的多個(gè)像素差值向量進(jìn)行二值編碼，得到第二二值向量；根據(jù)視覺單詞對第二二值向量進(jìn)行特征表示得到特征向量，并根據(jù)特征向量進(jìn)行人臉識(shí)別。本發(fā)明存儲(chǔ)量小，計(jì)算速度快，對局部變化的敏感度較低，而且數(shù)據(jù)適應(yīng)性較高，數(shù)據(jù)描述能力較強(qiáng)。
【專利說明】
基于球哈希二值編碼的人臉識(shí)別方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及人臉識(shí)別技術(shù)領(lǐng)域，尤其涉及一種基于球哈希二值編碼的人臉識(shí)別方法及裝置。
【背景技術(shù)】
[0002] 人臉識(shí)別技術(shù)，是一種通過分析比較人臉視覺特征信息進(jìn)行身份鑒別的計(jì)算機(jī)技術(shù)。人臉識(shí)別算法可以分為:基于全局特征的算法和基于局部特征的算法。其中，基于全局特征的人臉識(shí)別算法對于局部變化較為敏感，如:表情、遮擋等。而基于局部特征的人臉識(shí) 別算法則是將圖像視為多個(gè)局部塊的組合，分別從每個(gè)局部塊中提取局部特征，再將這些局部特征拼接成為一個(gè)長向量，從而表示一幅人臉圖像。該類算法對于局部變化較為魯棒。因此，基于局部特征的人臉識(shí)別算法的應(yīng)用較為廣泛。
[0003] 現(xiàn)有的基于局部特征的人臉識(shí)別算法中包括基于特征學(xué)習(xí)的人臉識(shí)別算法，是通過從實(shí)際數(shù)據(jù)中來學(xué)習(xí)算法的組織形式或先驗(yàn)知識(shí)，即數(shù)據(jù)依賴型的算法。因此只需要訓(xùn) 練數(shù)據(jù)與實(shí)際應(yīng)用場景中的數(shù)據(jù)具有較高的一致性，在加入少量甚至不加入先驗(yàn)知識(shí)的情況下，就能夠應(yīng)對實(shí)際場景中出現(xiàn)的類內(nèi)變化。而現(xiàn)有的基于特征學(xué)習(xí)的人臉識(shí)別算法大多是基于實(shí)值的特征表示，即首先利用設(shè)計(jì)的目標(biāo)函數(shù)從輸入的人臉圖像中提取基于實(shí)數(shù) 值的人臉特征表示，然后利用模式識(shí)別方法判斷輸入圖像到底屬于哪個(gè)人。
[0004] 但該類算法存在以下缺點(diǎn)：首先，由于特征是基于實(shí)數(shù)值的，當(dāng)外界因素發(fā)生變化時(shí)，學(xué)習(xí)得到的特征也必然會(huì)隨之變化，當(dāng)變化的程度超過某一閾值時(shí)，分類器就會(huì)將兩個(gè) 原本屬于同一個(gè)人的特征識(shí)別為不同人。即該類算法對于人臉圖像的局部變化較為敏感，即提取得到的人臉特征向量的數(shù)值容易隨著圖像的變化而隨之變化。而且，基于實(shí)值的特征學(xué)習(xí)算法的時(shí)間、空間復(fù)雜度高。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明提供一種基于球哈希二值編碼的人臉識(shí)別方法及裝置，以克服現(xiàn)有技術(shù)中基于實(shí)值的特征學(xué)習(xí)算法的時(shí)間、空間復(fù)雜度高的問題。
[0006] 第一方面，本發(fā)明提供一種基于球哈希二值編碼的人臉識(shí)別方法，包括：
[0007] 分別將訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像進(jìn)行局部塊的劃分，得到所述訓(xùn)練人臉圖像對應(yīng)的多個(gè)局部塊，并提取各個(gè)所述訓(xùn)練人臉圖像的各個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng) 的像素差值向量；
[0008] 根據(jù)所述像素差值向量和球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù);所述球哈希函數(shù)的參數(shù)包括:中心點(diǎn)和半徑；
[0009] 根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第一二值向量；
[0010] 對所述第一二值向量進(jìn)行聚類，獲取聚類得到的多個(gè)視覺單詞；
[0011]對測試人臉圖像進(jìn)行局部塊的劃分，得到所述測試人臉圖像對應(yīng)的多個(gè)局部塊，并提取測試人臉圖像中每個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量；
[0012] 根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè)像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第二二值向量；
[0013] 根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特征向量，并根據(jù)所述特征向量進(jìn)行人臉識(shí)別。
[0014] 第二方面，本發(fā)明提供一種基于球哈希二值編碼的人臉識(shí)別裝置，包括：
[0015] 第一提取模塊，用于分別將訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像進(jìn)行局部塊的劃分，得到所述訓(xùn)練人臉圖像對應(yīng)的多個(gè)局部塊，并提取各個(gè)所述訓(xùn)練人臉圖像的各個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量；
[0016] 優(yōu)化模塊，用于根據(jù)所述像素差值向量和球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù);所述球哈希函數(shù)的參數(shù)包括:中心點(diǎn)和半徑；
[0017] 第一編碼模塊，用于根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第一二值向量；
[0018] 聚類模塊，用于對所述第一二值向量進(jìn)行聚類，獲取聚類得到的多個(gè)視覺單詞；
[0019] 第二提取模塊，用于對測試人臉圖像進(jìn)行局部塊的劃分，得到所述測試人臉圖像對應(yīng)的多個(gè)局部塊，并提取測試人臉圖像中每個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量；
[0020] 第二編碼模塊，用于根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè) 像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第二二值向量；
[0021 ]處理模塊，用于根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特征向量，并根據(jù)所述特征向量進(jìn)行人臉識(shí)別。
[0022] 本發(fā)明基于球哈希二值編碼的人臉識(shí)別方法及裝置，首先提取訓(xùn)練樣本中的多個(gè) 訓(xùn)練人臉圖像的局部塊中的像素點(diǎn)對應(yīng)的像素差值向量，然后根據(jù)球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù);進(jìn)一步的，根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第一二值向量;然后，對所述第一二值向量進(jìn)行聚類，獲取聚類得到的多個(gè)視覺單詞；進(jìn)一步的，提取測試人臉圖像的局部塊中的像素點(diǎn)對應(yīng)的像素差值向量;根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè)像素差值向量進(jìn) 行二值編碼，得到所述像素差值向量對應(yīng)的第二二值向量;根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特征向量，并根據(jù)所述特征向量進(jìn)行人臉識(shí)別，由于采用了二值編碼，因此計(jì)算存儲(chǔ)消耗量小，計(jì)算速度快，而且對局部變化的敏感度較低，而且利用無監(jiān)督的聚類算法將利用球哈希二值編碼算法得到的二值向量進(jìn)一步表示為詞袋模型，數(shù)據(jù) 適應(yīng)性較高，而且由于采用的是球哈希算法，因此數(shù)據(jù)描述能力較強(qiáng)。
【附圖說明】
[0023] 為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作一簡單地介紹，顯而易見地，下面描述中的附圖是本發(fā) 明的一些實(shí)施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動(dòng)性的前提下，還可以根據(jù)這些附圖獲得其他的附圖。
[0024] 圖1為本發(fā)明基于球哈希二值編碼的人臉識(shí)別方法一實(shí)施例的流程示意圖；
[0025] 圖2為本發(fā)明方法一實(shí)施例的實(shí)現(xiàn)流程示意圖；
[0026] 圖3為本發(fā)明方法一實(shí)施例的像素差值向量提取示意圖；
[0027] 圖4為本發(fā)明基于球哈希二值編碼的人臉識(shí)別裝置一實(shí)施例的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0028] 為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。
[0029] 本發(fā)明實(shí)施例的方法，可應(yīng)用于所有自然條件（即非約束條件）下的人臉識(shí)別任務(wù)。如:在人機(jī)交互系統(tǒng)中的用戶身份識(shí)別、表情識(shí)別等;人員密集場所下的黑名單監(jiān)控和 VIP監(jiān)控等;在社交網(wǎng)絡(luò)中，含有人臉的上傳照片中的用戶標(biāo)簽推薦等。由于本發(fā)明利用基于球哈希二值編碼的人臉識(shí)別算法，算法的運(yùn)算速度極快，可完成某些非實(shí)時(shí)的人臉識(shí)別算法無法完成的識(shí)別任務(wù)。
[0030] 圖1為本發(fā)明基于球哈希二值編碼的人臉識(shí)別方法一實(shí)施例的流程示意圖。圖2為本發(fā)明方法一實(shí)施例的實(shí)現(xiàn)流程示意圖。圖3為本發(fā)明方法一實(shí)施例的像素差值向量提取示意圖。如圖1、圖2所示，本實(shí)施例的方法，包括：
[0031] 步驟101、分別將訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像進(jìn)行局部塊的劃分，得到所述訓(xùn) 練人臉圖像對應(yīng)的多個(gè)局部塊，并提取各個(gè)所述訓(xùn)練人臉圖像的各個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量；
[0032] 訓(xùn)練樣本中包括多個(gè)訓(xùn)練人臉圖像，即至少包括兩個(gè)訓(xùn)練人臉圖像。
[0033] 可選地，提取局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量具體可以通過如下方式實(shí) 現(xiàn)：
[0034]以每個(gè)像素點(diǎn)為中心，以R為半徑，提取位于所述像素點(diǎn)四周的鄰域像素點(diǎn)，并以順時(shí)針方向依次將所述鄰域像素點(diǎn)的像素值與所述像素點(diǎn)的像素值進(jìn)行差值運(yùn)算，得到所述像素點(diǎn)對應(yīng)的N維像素差值向量;R為預(yù)設(shè)值;N= (2 XR+l) X (2 XR+l)-1。
[0035] 具體的，如圖3所示，該局部塊中的中心像素塊中像素點(diǎn)g對應(yīng)的像素差值向量的提取過程如下：
[0036] 以像素點(diǎn)g為中心點(diǎn)，以R=1為半徑，提取位于該像素點(diǎn)四周的鄰域像素點(diǎn)，并以順時(shí)針方向依次將鄰域像素點(diǎn)的像素值與該像素點(diǎn)的像素值進(jìn)行差值運(yùn)算，得到的N=8維像素差值向量為(a-g，f-g，k-g，1 -g，m-g，h-g，c-g，b-g)。
[0037] 該中心像素塊中的其他像素點(diǎn)對應(yīng)的像素差值向量如圖3中所示，即像素差值矩陣的每一列為一個(gè)像素點(diǎn)對應(yīng)的像素差值向量，具體提取過程與上述過程類似，此處不再贅述。
[0038] 圖3中的鄰域像素塊分別表示了像素點(diǎn)g、q、s和i的鄰域像素塊。
[0039] R取值范圍為大于0的整數(shù)。
[0040] 圖2中的像素差值向量只列出了一個(gè)像素點(diǎn)的像素差值向量(_8,7,3,0，-2，-1，9， 2)〇
[0041] 步驟102、根據(jù)所述像素差值向量和球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù);所述球哈希函數(shù)的參數(shù)包括:中心點(diǎn)和半徑；
[0042] 利用球哈希優(yōu)化算法，計(jì)算球哈希函數(shù)中每個(gè)球哈希函數(shù)的參數(shù)，即每個(gè)超球體的中心點(diǎn)和半徑。
[0043] 步驟103、根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第一二值向量；
[0044] 可選地，步驟103具體可以采用如下方式實(shí)現(xiàn)：
[0045] 將所述像素差值向量分別代入所述球哈希函數(shù)中，將所述球哈希函數(shù)的值作為所述第一二值向量對應(yīng)位置的元素。
[0046] 如圖2所示，假設(shè)球哈希函數(shù)的個(gè)數(shù)為4個(gè)，則將像素差值向量分別代入4個(gè)球哈希函數(shù)中，將球哈希函數(shù)的值作為第一二值向量對應(yīng)位置的元素，即得到向量(〇，1，1，〇)。 [0047]例如，假設(shè)在二維空間中，我們學(xué)習(xí)得到了三個(gè)球哈希函數(shù)（即三個(gè)圓形A，B，C)，假設(shè)它們的半徑均為1，中心點(diǎn)分別為4:(-1，1)，8:(0,0)和(：：（1，-1)。那么，基于實(shí)值的像素差值向量5)不在圓A，B的范圍內(nèi)，在圓C的范圍內(nèi)，因此，它對應(yīng)的二值向量為(0，〇，1);同理，（-V 2/2, V 2/2)位于圓A和B的范圍內(nèi)，不在圓C的范圍內(nèi)，因此，它對應(yīng)的二值向量為(1，1，〇);再比如：（-1，-1)不在任何一個(gè)球的范圍內(nèi)，故其二值向量為(〇,〇,〇)。
[0048] 步驟104、對所述第一二值向量進(jìn)行聚類，獲取聚類得到的多個(gè)視覺單詞；
[0049] 可選的，可以利用K-Means算法對第一二值向量進(jìn)行聚類，分別將聚類得到的k個(gè) 類別中的幾何中心點(diǎn)作為所述視覺單詞;k為預(yù)設(shè)的大于0的整數(shù)。
[0050] 例如，以二維空間為例，二維空間共有4個(gè)二值向量，即（0，0)，（0，1)，（1，0)和（1， 1 )。利用K-Means方式聚類，可以將(0，0)，（0,1)聚成一堆，將（1，0)，（1，1)聚成一堆。當(dāng)然也可以（0,0)，（1，0)-堆，另兩個(gè)一堆。反正就是將距離近的多個(gè)二值向量聚在一起。并取這一堆中的幾何中心點(diǎn)作為視覺單詞，在我們的例子中，可以取(〇,〇. 5)和（1，0.5)作為單詞。這樣，任何二值向量均可以用這兩個(gè)單詞線性表示;高維空間類似。
[0051] 本發(fā)明實(shí)施例中還可以利用無監(jiān)督的聚類算法進(jìn)行聚類。
[0052]步驟105、對測試人臉圖像進(jìn)行局部塊的劃分，得到所述測試人臉圖像對應(yīng)的多個(gè) 局部塊，并提取測試人臉圖像中每個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量；
[0053]該步驟中提取像素差值向量的過程與步驟101中的相同，此處不再贅述。
[0054]步驟106、根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè)像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第二二值向量；
[0055] 該步驟中而孩子編碼的過程與步驟103中的相同，此處不再贅述。
[0056] 步驟107、根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特征向量，并根據(jù)所述特征向量進(jìn)行人臉識(shí)別。
[0057] 具體的，可以根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行線性表示，即將多個(gè)視覺單詞（多個(gè)二值向量)的加權(quán)和作為第二二值向量的特征向量，并利用多個(gè)像素點(diǎn)對應(yīng)的特征向量進(jìn)行人臉識(shí)別。
[0058] 權(quán)重的取值可以采用如下的方式：
[0059] 將每一個(gè)視覺單詞（即二值向量)與其他所有的視覺單詞計(jì)算歐氏距離，得到歐氏距離最小值的個(gè)數(shù)，進(jìn)行歸一化，得到各個(gè)視覺單詞對應(yīng)的權(quán)重。
[0060] 綜上所述，本發(fā)明實(shí)施例的人臉識(shí)別方法，具體可分為訓(xùn)練階段和測試階段。如圖 2所示，其中，在訓(xùn)練階段中，我們首先從訓(xùn)練樣本中的每個(gè)訓(xùn)練人臉圖像的局部塊中提取每個(gè)像素點(diǎn)對應(yīng)的像素差值向量;然后利用球哈希優(yōu)化算法，計(jì)算球哈希函數(shù)中每個(gè)球哈希函數(shù)的參數(shù)（即每個(gè)超球體的中心點(diǎn)和半徑）；最后，利用計(jì)算得到的球哈希參數(shù)，分別將訓(xùn)練樣本中提取的各個(gè)像素差值向量編碼為二值向量的形式，即得到多個(gè)第一二值向量，并利用聚類算法(如K-Means算法)對多個(gè)第一二值向量進(jìn)行聚類，得到聚類的多個(gè)類別分別對應(yīng)的視覺單詞，形成詞袋模型。
[0061]在測試階段中，我們同樣從測試人臉圖像的局部塊中提取每個(gè)像素點(diǎn)對應(yīng)的像素差值向量;然后利用訓(xùn)練階段計(jì)算得到的球哈希參數(shù)，將測試人臉圖像中提取的像素差值向量編碼為二值向量的形式，即得到多個(gè)第二二值向量;最后，利用訓(xùn)練階段學(xué)習(xí)得到的詞袋模型，對第二二值向量進(jìn)行特征表示。
[0062]本發(fā)明實(shí)施例的方法在以下方面均得到了優(yōu)化：
[0063] 1、存儲(chǔ)量方面。由于存儲(chǔ)一個(gè)二值數(shù)據(jù)只需要1個(gè)字節(jié)，是存儲(chǔ)一個(gè)double類型的實(shí)值數(shù)據(jù)所需空間的1/8。且在使用稀疏存儲(chǔ)的情況下，存儲(chǔ)大規(guī)模數(shù)據(jù)所需的空間會(huì)進(jìn)一步減少。在使用本發(fā)明的基礎(chǔ)上，利用64個(gè)比特存儲(chǔ)一副圖像，對于一個(gè)擁有64G內(nèi)存的工作站，可以存儲(chǔ)近10億張人臉圖像，幾乎能夠滿足現(xiàn)有的所有人臉識(shí)別應(yīng)用。
[0064] 2、計(jì)算速度方面。二值運(yùn)算只需要對0和1進(jìn)行數(shù)值計(jì)算，而計(jì)算機(jī)底層的邏輯電路可以極快地完成這項(xiàng)運(yùn)算。因此，使用二值編碼能夠加快人臉識(shí)別算法的訓(xùn)練過程和測試過程。本發(fā)明比現(xiàn)有水平的基于實(shí)值的人臉識(shí)別算法快近10倍。
[0065] 3、人臉圖像中的局部變化是否敏感方面。本發(fā)明是基于二值編碼的人臉識(shí)別算法，當(dāng)人臉圖像中像素點(diǎn)的值發(fā)生變化時(shí)，基于二值編碼的人臉特征向量有很大可能保持不變。從而保證了類內(nèi)差異減小，類間差異增加。實(shí)驗(yàn)結(jié)果表明，本發(fā)明在面對各種應(yīng)用場景下的人臉識(shí)別問題時(shí)，均獲得了比基于實(shí)值編碼的人臉識(shí)別算法更為優(yōu)秀的識(shí)別性能。
[0066] 4、先驗(yàn)知識(shí)的依賴性方面。由于本發(fā)明實(shí)施例的算法是通過從訓(xùn)練樣本中學(xué)習(xí)得到特征向量，從而避免了依賴于先驗(yàn)知識(shí)的準(zhǔn)確性，只要訓(xùn)練樣本中存在的類內(nèi)變化與實(shí) 際應(yīng)用場景中的具有較高的一致性，即使不加入先驗(yàn)先驗(yàn)知識(shí)，依然可以得到能夠準(zhǔn)確描述人臉圖像的特征。
[0067] 5、數(shù)據(jù)適應(yīng)性方面。本發(fā)明利用無監(jiān)督的聚類算法將利用球哈希二值編碼算法得到的二值向量進(jìn)一步表示為詞袋模型。詞袋模型中的每個(gè)"單詞"即為聚類算法得到的聚類中心。使用聚類中心表示基于二值的特征向量，使得該發(fā)明在保存了對人臉圖像中的局部變化具有魯棒性的前提下，還能夠?yàn)樗惴Ｐ吞峁└鼉?yōu)秀的數(shù)據(jù)適應(yīng)性。從而使得在某一應(yīng)用場景下訓(xùn)練得到的算法模型，可以直接應(yīng)用于其他應(yīng)用場景下，而不需要做出任何改變。
[0068] 6、描述能力方面。本發(fā)明利用球哈希算法，該算法在高維原始空間中具有較強(qiáng)的空間封閉能力。對提取得到的像素差值向量進(jìn)行有效編碼。因此，本發(fā)明利用的球哈希算法，能夠?qū)⑾嗤说娜四槇D像特征聚集在一起，同時(shí)將不同人的人臉圖像特征盡可能地分隔。相比于現(xiàn)有技術(shù)而言，本發(fā)明具有更強(qiáng)的結(jié)構(gòu)信息（包括:底層結(jié)構(gòu)信息和中高層結(jié)構(gòu) 信息)描述能力。
[0069] 本實(shí)施例提供的方法，通過基于球哈希的二值編碼算法對人臉圖像進(jìn)行特征表示，使人臉識(shí)別算法能夠同時(shí)具有計(jì)算存儲(chǔ)消耗量小，計(jì)算速度快和對人臉圖像中的局部變化具有魯棒性等特點(diǎn)。并且利用K-Means等無監(jiān)督聚類算法，對學(xué)習(xí)得到的基于二值的人臉特征向量進(jìn)行聚類，并得到相應(yīng)的詞袋模型。使得本發(fā)明能夠?qū)τ诓煌愋偷臄?shù)據(jù)（即，不同應(yīng)用場景下的數(shù)據(jù))具有較好的適應(yīng)性。
[0070] 本實(shí)施例提供的方法，首先提取訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像的局部塊中的像素點(diǎn)對應(yīng)的像素差值向量，然后根據(jù)球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù);進(jìn)一步的，根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng) 的第一二值向量;然后，對所述第一二值向量進(jìn)行聚類，獲取聚類得到的多個(gè)視覺單詞;進(jìn) 一步的，提取測試人臉圖像的局部塊中的像素點(diǎn)對應(yīng)的像素差值向量;根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè)像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第二二值向量;根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特征向量，并根據(jù)所述特征向量進(jìn)行人臉識(shí)別，由于采用了二值編碼，因此計(jì)算存儲(chǔ)消耗量小，計(jì)算速度快，而且對局部變化的敏感度較低，而且利用無監(jiān)督的聚類算法將利用球哈希二值編碼算法得到的二值向量進(jìn)一步表示為詞袋模型，數(shù)據(jù)適應(yīng)性較高，而且由于采用的是球哈希算法，因此數(shù)據(jù)描述能力較強(qiáng)。
[0071] 在上述實(shí)施例的基礎(chǔ)上，本實(shí)施例中，步驟102具體可以通過如下方式實(shí)現(xiàn)：
[0072]根據(jù)如下公式（1)和公式(2)的目標(biāo)函數(shù)進(jìn)行優(yōu)化，使得所述公式（1)的取值為n/ 2，所述公式⑵的取值為n/4，得到第i個(gè)球哈希函數(shù)的中心點(diǎn)pf = pfi+fi;
[0073] vi= | sg | hi(sg) =+1, l^g^n | ； (1)
[0074] vij= |sg|hi(sg)=+l,hj(sg)=+l,l^g^n| ；(2)
[0075] 其中
[0076]其中，| ? |表示變量的非零元素的數(shù)量，所述sg為像素差值向量，n表示像素差值向量的個(gè)數(shù);lu(Sg)和h」(Sg)分別表示參數(shù)為&的第i個(gè)和第j個(gè)球哈希函數(shù);i的取值范圍為 1至K;j的取值范圍為1至K-1;K為大于1的整數(shù); Ple表示在第c次迭代時(shí)的第i個(gè)球哈希函數(shù) 的中心點(diǎn);pf1表示在第c-1次迭代時(shí)的第i個(gè)球哈希函數(shù)的中心點(diǎn);P/表示在第c次迭代時(shí) 的第j個(gè)球哈希函數(shù)的中心點(diǎn);c為大于0的整數(shù);pf 1在。=1時(shí)的初始值為預(yù)設(shè)的初始值。
[0077]具體地，球哈希優(yōu)化得到的數(shù)據(jù)具有平衡的比特分布利于數(shù)據(jù)攜帶更多的具有判別性的消息，且哈希函數(shù)之間的獨(dú)立則有利于平衡的二值比特分布。為了實(shí)現(xiàn)這兩個(gè)目標(biāo)，我們提出了如下的目標(biāo)函數(shù)：
[0079] 其中，lu(X)表示第i個(gè)球哈希函數(shù)。h」(X)表示第j個(gè)球哈希函數(shù)。x表示像素差值向量。為了使學(xué)習(xí)得到的二值編碼數(shù)據(jù)能夠盡可能地滿足上述條件，我們使用兩階段的迭代優(yōu)化算法，分別對空間中的超球體的中心點(diǎn)和半徑進(jìn)行優(yōu)化。在優(yōu)化其中一個(gè)變量時(shí)，使另一個(gè)變量保持不變，通過多次迭代運(yùn)算，最終求得滿足上述條件的超球體。為了清楚地表示優(yōu)化的計(jì)算過程，我們設(shè)置兩個(gè)變量來描述上述的目標(biāo)函數(shù)：
[0080] vi= | sg | hi(sg) =+1, l^g^n | ； (1)
[0081] vij= |sg|hi(sg)=+l,hj(sg)=+l,l^g^n| ；(2)
[0082] 根據(jù)上述公式（1)和公式(2)進(jìn)行優(yōu)化，使得所述公式（1)的取值為n/2,所述公式 ⑵的取值為n/4，得到第i個(gè)球哈希函數(shù)的中心點(diǎn)pf = p^+fi;
[0083]其中，| ? |表示變量的非零元素的數(shù)量，所述sg為像素差值向量，n表示像素差值向量的個(gè)數(shù);lu(Sg)和h」(Sg)分別表示參數(shù)為&的第i個(gè)和第j個(gè)球哈希函數(shù);i的取值范圍為 1至K;j的取值范圍為1至K-U Vl描述的是在訓(xùn)練樣本中的像素差值向量的集合中對于第i 個(gè)球哈希函數(shù)，有多少個(gè)數(shù)值為+1的像素差值向量，它用于描述式(a)中的變化情況;描述的是在訓(xùn)練樣本中的像素差值向量的集合中對于第i個(gè)和第j個(gè)球哈希函數(shù)的數(shù)據(jù)點(diǎn)對 (像素差值向量對），有多少對數(shù)據(jù)點(diǎn)（數(shù)據(jù)點(diǎn)即像素差值向量)滿足數(shù)值同時(shí)為+1的情況，它用于描述式(b)中的變化情況。為了求解上述目標(biāo)函數(shù)，具體的優(yōu)化過程如下所示：
[0084]首先，假設(shè)半徑固定，計(jì)算中心點(diǎn)。
[0085]在這種情況下，我們即通過調(diào)整中心點(diǎn)的數(shù)值，使得學(xué)習(xí)得到的參數(shù)盡可能滿足式(2)中的目標(biāo)函數(shù)，即使變量的數(shù)值盡可能接近n/4。對于任意一對第i個(gè)和第j個(gè)球哈希函數(shù)（即兩個(gè)超球體i和j)而言，當(dāng)vu的數(shù)值大于n/4時(shí)，表明兩個(gè)超球體距離過近，需要一個(gè)"排斥力"將二者分來;相反，則需要一個(gè)"吸引力"將二者拉近。如果萬有引力定律一樣，超球體j對于超球體i的吸引力或排斥力如下定義：
[0087]其中，pf表示在第c次迭代時(shí)的第i個(gè)球哈希函數(shù)的中心點(diǎn)；p/表示在第c次迭代時(shí)的第j個(gè)球哈希函數(shù)的中心點(diǎn)。故所有其他超球體中心對超球體i的合力如下所示：
[0089] 故，第i個(gè)球哈希函數(shù)的中心點(diǎn)即可被更新為
[0090] 其中，pf1在。=1時(shí)的初始值為預(yù)設(shè)的初始值，即也可以采用隨機(jī)的初始值。
[0091] 在上述實(shí)施例的基礎(chǔ)上，根據(jù)已經(jīng)求出的中心點(diǎn)計(jì)算半徑：
[0092] 根據(jù)所述第i個(gè)球哈希函數(shù)的中心點(diǎn)pf得到所述第i個(gè)球哈希函數(shù)的半徑為ri = d (pi , Sn/2 )；
[0093]其中，sn/2表示分別將n個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn)的距離進(jìn)行升序排列之后的第n/2個(gè)像素差值向量；
[0094] d( ?)表示計(jì)算歐氏距離的函數(shù)。
[0095]具體的，假設(shè)中心點(diǎn)固定，即已經(jīng)求出中心點(diǎn)，然后計(jì)算半徑。
[0096]在這種情況下，我們即通過調(diào)整中心點(diǎn)的數(shù)值，使得學(xué)習(xí)得到的參數(shù)盡可能滿足式（1)中的目標(biāo)函數(shù)，即使變量Vl的數(shù)值盡可能接近n/2。在各個(gè)像素差值向量已經(jīng)根據(jù)其對于中心點(diǎn)的距離進(jìn)行升序排序的條件下，我們可以簡單地將第i個(gè)球哈希函數(shù)的半徑設(shè) 置為 ri = d(Ple，Sn/2)，其中d( ?)表示計(jì)算歐氏距離的函數(shù)。
[0097]其中，在實(shí)際應(yīng)用中，雖然從理論上來說，上述目標(biāo)函數(shù)(a)和(b)能夠得到最小的量化誤差，即使得學(xué)習(xí)得到的二值向量與原有特征向量之間的差值最小。但該目標(biāo)函數(shù)會(huì) 使得迭代過程變得漫長，又幾乎沒有提高人臉識(shí)別算法的識(shí)別準(zhǔn)確率。因此，我們考慮利用表示作為迭代過程停止的指示器。
[0098] 具體地，理想條件下，Vi,」的均值和標(biāo)準(zhǔn)差分別為n/4和0。我們考慮當(dāng)Vi, j的均值和標(biāo)準(zhǔn)差的誤差分別為理想情況的10%和15%時(shí)，即可以認(rèn)為該迭代過程已足夠收斂，從而停止迭代過程。實(shí)驗(yàn)結(jié)果表明，在幾乎不損失精度的情況下，能夠加速上述方法的迭代過程。
[0099] 在上述實(shí)施例的基礎(chǔ)上，由于在上述的具體實(shí)施例中，將第i個(gè)球哈希函數(shù)的半徑設(shè)置為^icKpAsw)。但這種半徑賦值方法在~ /2附近數(shù)據(jù)點(diǎn)比較密集的情況下難以獲得很好的區(qū)分效果。因此，本實(shí)施例中，可以根據(jù)如下方式計(jì)算半徑：
[0100] 根據(jù)所述第i個(gè)球哈希函數(shù)的中心點(diǎn)pf以及公式(3)得到第i個(gè)球哈希函數(shù)的半徑 ri；
[0102]其中，根據(jù)公式(4)得到j(luò)的取值；
[0105] ~+1表示分別將n個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn)的距離進(jìn)行升序排列之后的第j+1個(gè)像素差值向量;^表示分別將n個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn)的距離進(jìn)行升序排列之后的第j個(gè)像素差值向量；
[0106] a為預(yù)設(shè)值。
[0107]具體的，在實(shí)際應(yīng)用中，我們可以放松對式(a)的要求，獲得基于最大邊緣的超球體的半徑。同樣是在各個(gè)像素差值向量已經(jīng)根據(jù)其對于中心點(diǎn)的距離進(jìn)行升序排序的條件下，我們選擇靠近sn/2點(diǎn)附近的一系列數(shù)據(jù)點(diǎn)，用于最大邊緣的優(yōu)化。
[0109] 其中，a用于控制對于式(a)的松弛程度，可以為預(yù)設(shè)值。而最大化邊緣的數(shù)據(jù)點(diǎn)可定義為：
[0110] /=argrnax[t/(;;/ ,.y;+l)-^/(/;； ,5,.)] ； (4) j . J
[0111] 即求使得cKpAsj+d-cKpAsj)最大的j的取值，且jGj。
[0112] 因此，最終基于最大邊緣的超球體半徑為：
[0114] 需要說明的是，對于上述具體實(shí)施例而言，由于其基本相應(yīng)于圖1所示的方法實(shí)施例，所以相關(guān)之處參見圖1所示方法實(shí)施例的部分說明即可。
[0115] 圖4為本發(fā)明基于球哈希二值編碼的人臉識(shí)別裝置一實(shí)施例的結(jié)構(gòu)示意圖。如圖4 所示，本實(shí)施例的基于球哈希二值編碼的人臉識(shí)別裝置，包括：
[0116] 第一提取模塊401，用于分別將訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像進(jìn)行局部塊的劃分，得到所述訓(xùn)練人臉圖像對應(yīng)的多個(gè)局部塊，并提取各個(gè)所述訓(xùn)練人臉圖像的各個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量；
[0117] 優(yōu)化模塊402,用于根據(jù)所述像素差值向量和球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù);所述球哈希函數(shù)的參數(shù)包括:中心點(diǎn)和半徑；
[0118] 第一編碼模塊403,用于根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第一二值向量；
[0119] 聚類模塊404,用于對所述第一二值向量進(jìn)行聚類，獲取聚類得到的多個(gè)視覺單詞；
[0120] 第二提取模塊405,用于對測試人臉圖像進(jìn)行局部塊的劃分，得到所述測試人臉圖像對應(yīng)的多個(gè)局部塊，并提取測試人臉圖像中每個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量；
[0121] 第二編碼模塊406,用于根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè)像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第二二值向量；
[0122] 處理模塊407,用于根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特征向量，并根據(jù)所述特征向量進(jìn)行人臉識(shí)別。
[0123] 可選地，作為一種可實(shí)施的方式，所述第一提取模塊401，具體用于：
[0124] 以每個(gè)像素點(diǎn)為中心，以R為半徑，提取位于所述像素點(diǎn)四周的鄰域像素點(diǎn)，并以順時(shí)針方向依次將所述鄰域像素點(diǎn)的像素值與所述像素點(diǎn)的像素值進(jìn)行差值運(yùn)算，得到所述像素點(diǎn)對應(yīng)的N維像素差值向量;R為預(yù)設(shè)的大于0的整數(shù);N= (2 XR+1) X (2 XR+1)-1。
[0125] 可選地，作為一種可實(shí)施的方式，所述第二提取模塊405，具體用于：
[0126] 以每個(gè)像素點(diǎn)為中心，以R為半徑，提取位于所述像素點(diǎn)四周的鄰域像素點(diǎn)，并以順時(shí)針方向依次將所述鄰域像素點(diǎn)的像素值與所述像素點(diǎn)的像素值進(jìn)行差值運(yùn)算，得到所述像素點(diǎn)對應(yīng)的N維像素差值向量;R為預(yù)設(shè)的大于0的整數(shù);N= (2 XR+1) X (2 XR+1)-1。
[0127] 可選地，作為一種可實(shí)施的方式，優(yōu)化模塊402,具體用于：
[0128] 根據(jù)如下公式（1)和公式(2)的目標(biāo)函數(shù)進(jìn)行優(yōu)化，使得所述公式（1)的取值為n/ 2，所述公式⑵的取值為n/4，得到第i個(gè)球哈希函數(shù)的中心點(diǎn)pf = pfi+fi;
[0129] vi= | sg | hi(sg) =+1, l^g^n | ； (1)
[0130] vij= |sg|hi(sg)=+l,hj(sg)=+l,l^g^n| ；(2)
[0131] 其中：
[0132] 其中，| ? |表示變量的非零元素的數(shù)量，所述Sg為像素差值向量，n表示像素差值向量的個(gè)數(shù);lu( Sg)和h」(Sg)分別表示參數(shù)為&的第i個(gè)和第j個(gè)球哈希函數(shù);i的取值范圍為 1至K;j的取值范圍為1至K_1;K為大于1的整數(shù); Ple表示在第c次迭代時(shí)的第i個(gè)球哈希函數(shù) 的中心點(diǎn);pf1表示在第c-1次迭代時(shí)的第i個(gè)球哈希函數(shù)的中心點(diǎn);P/表示在第c次迭代時(shí) 的第j個(gè)球哈希函數(shù)的中心點(diǎn);c為大于0的整數(shù);pf 1在。=1時(shí)的初始值為預(yù)設(shè)的初始值。
[0133] 可選地，作為一種可實(shí)施的方式，優(yōu)化模塊402,具體用于：
[0134] 根據(jù)所述第i個(gè)球哈希函數(shù)的中心點(diǎn)pf得到所述第i個(gè)球哈希函數(shù)的半徑為ri = d (pi , Sn/2 )；
[0135] 其中，sn/2表示分別將n個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn)的距離進(jìn)行升序排列之后的第n/2個(gè)像素差值向量；
[0136] d( ?)表示計(jì)算歐氏距離的函數(shù)。
[0137] 可選地，作為一種可實(shí)施的方式，優(yōu)化模塊402,具體用于：
[0138] 根據(jù)所述第i個(gè)球哈希函數(shù)的中心點(diǎn)Ple以及公式(3)得到第i個(gè)球哈希函數(shù)的半徑 ri；
[0140] 其中，根據(jù)公式(4)得到j(luò)的取值；
[0141] ./ = argmax[//(/;； ,5/+,)-1/{/;；,5,)]， /&J： (4)
[0142] 其中
[0143] Sj+1表示分別將n個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn)的距離進(jìn)行升序排列之后的第j+1個(gè)像素差值向量;^表示分別將n個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn)的距離進(jìn)行升序排列之后的第j個(gè)像素差值向量；
[0144] a為預(yù)設(shè)值。
[0145] 可選地，作為一種可實(shí)施的方式，第一編碼模塊403,具體用于：
[0146] 將所述像素差值向量分別代入所述球哈希函數(shù)中，將所述球哈希函數(shù)的值作為所述第一二值向量對應(yīng)位置的元素。
[0147] 可選地，作為一種可實(shí)施的方式，第二編碼模塊406,具體用于：
[0148] 將所述像素差值向量分別代入所述球哈希函數(shù)中，將所述球哈希函數(shù)的值作為所述第二二值向量對應(yīng)位置的元素。
[0149] 可選地，作為一種可實(shí)施的方式，聚類模塊404，用于：
[0150] 利用K-Means算法對所述第一二值向量進(jìn)行聚類，分別將聚類得到的k個(gè)類別中的幾何中心點(diǎn)作為所述視覺單詞;k為預(yù)設(shè)的大于0的整數(shù)。
[0151] 可選地，作為一種可實(shí)施的方式，所述處理模塊402,具體用于：
[0152] 將所述視覺單詞的加權(quán)和作為特征表示得到的特征向量。
[0153] 本實(shí)施例的裝置，可以用于執(zhí)行如圖1所示方法實(shí)施例的技術(shù)方案，其實(shí)現(xiàn)原理和技術(shù)效果類似，此處不再贅述。
[0154] 本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成，前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中，該程序在執(zhí)行時(shí)，執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:ROM、RAM、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0155] 最后應(yīng)說明的是：以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案，而非對其限制;盡管參照前述各實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明，本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改，或者對其中部分或者全部技術(shù)特征進(jìn) 行等同替換；而這些修改或者替換，并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù) 方案的范圍。
【主權(quán)項(xiàng)】
1. 一種基于球哈希二值編碼的人臉識(shí)別方法，其特征在于，包括：分別將訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像進(jìn)行局部塊的劃分，得到所述訓(xùn)練人臉圖像對應(yīng)的多個(gè)局部塊，并提取各個(gè)所述訓(xùn)練人臉圖像的各個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量；根據(jù)所述像素差值向量和球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù);所述球哈希函數(shù)的參數(shù)包括:中心點(diǎn)和半徑；根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第一二值向量；對所述第一二值向量進(jìn)行聚類，獲取聚類得到的多個(gè)視覺單詞；對測試人臉圖像進(jìn)行局部塊的劃分，得到所述測試人臉圖像對應(yīng)的多個(gè)局部塊，并提取測試人臉圖像中每個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量；根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè)像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第二二值向量；根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特征向量，并根據(jù)所述特征向量進(jìn)行人臉識(shí)別。2. 根據(jù)權(quán)利要求1所述的方法，其特征在于，提取各個(gè)所述訓(xùn)練人臉圖像的各個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量，包括：以每個(gè)像素點(diǎn)為中心，以R為半徑，提取位于所述像素點(diǎn)四周的鄰域像素點(diǎn)，并以順時(shí) 針方向依次將所述鄰域像素點(diǎn)的像素值與所述像素點(diǎn)的像素值進(jìn)行差值運(yùn)算，得到所述像素點(diǎn)對應(yīng)的N維像素差值向量;R為預(yù)設(shè)的大于O的整數(shù);N=(2XR+1)X(2XR+1)-1。3. 根據(jù)權(quán)利要求1或2所述的方法，其特征在于，根據(jù)所述像素差值向量和球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù)，包括：根據(jù)如下公式（1)和公式(2)的目標(biāo)函數(shù)進(jìn)行優(yōu)化，使得所述公式（1)的取值為n/2,所述公式⑵的取值為n/4，得到第i個(gè)球哈希函數(shù)的中心點(diǎn)pf = Pi=1+;^; Vi= |sg|hi(sg)=+l,l^g^n| ； (I) Vij= |sg|hi(sg)=+l,hj(sg)=+l,l^g^n| ； (2)其中，I · I表示變量的非零元素的數(shù)量，所述sg為像素差值向量，η表示像素差值向量的個(gè)數(shù);hi(sg)和hj(sg)分別表示參數(shù)為Sg的第i個(gè)和第j個(gè)球哈希函數(shù);i的取值范圍為1至Κ; j 的取值范圍為1至K-I ;K為大于1的整數(shù);pf表示在第c次迭代時(shí)的第i個(gè)球哈希函數(shù)的中心點(diǎn);Pf1表示在第c-1次迭代時(shí)的第i個(gè)球哈希函數(shù)的中心點(diǎn)；P/表示在第c次迭代時(shí)的第j 個(gè)球哈希函數(shù)的中心點(diǎn);c為大于O的整數(shù);Pf1在。=1時(shí)的初始值為預(yù)設(shè)的初始值。4. 根據(jù)權(quán)利要求3所述的方法，其特征在于，還包括：根據(jù)所述第i個(gè)球哈希函數(shù)的中心點(diǎn)Pie得到所述第i個(gè)球哈希函數(shù)的半徑為ri = d(pie, Sn/2); 其中，Sn/2表示分別將η個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn)的距離進(jìn)行升序排列之后的第n/2個(gè)像素差值向量； d( ·)表示計(jì)算歐氏距離的函數(shù)。5. 根據(jù)權(quán)利要求3所述的方法，其特征在于，還包括：根據(jù)所述第i個(gè)球哈希函數(shù)的中心點(diǎn)以及公式(3)得到第i個(gè)球哈希函數(shù)的半徑r1;其中，根據(jù)公式(4)得到j(luò)的取值；sJ+1表示分別將η個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn)的距離進(jìn)行升序排列之后的第j + Ι個(gè)像素差值向量;Sj表示分別將η個(gè)像素差值向量與第i個(gè)球哈希函數(shù)的中心點(diǎn) 的距離進(jìn)行升序排列之后的第j個(gè)像素差值向量;α為預(yù)設(shè)值。6. 根據(jù)權(quán)利要求1或2所述的方法，其特征在于，根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第一二值向量，包括：將所述像素差值向量分別代入所述球哈希函數(shù)中，將所述球哈希函數(shù)的值作為所述第一二值向量對應(yīng)位置的元素。7. 根據(jù)權(quán)利要求1或2所述的方法，其特征在于，對所述第一二值向量進(jìn)行聚類，獲取聚類得到的多個(gè)視覺單詞，包括：利用K-Means算法對所述第一二值向量進(jìn)行聚類，分別將聚類得到的k個(gè)類別中的幾何中心點(diǎn)作為所述視覺單詞;k為預(yù)設(shè)的大于O的整數(shù)。8. 根據(jù)權(quán)利要求1或2所述的方法，其特征在于，根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示，包括：將所述視覺單詞的加權(quán)和作為特征表示得到的特征向量。9. 一種基于球哈希二值編碼的人臉識(shí)別裝置，其特征在于，包括：第一提取模塊，用于分別將訓(xùn)練樣本中的多個(gè)訓(xùn)練人臉圖像進(jìn)行局部塊的劃分，得到所述訓(xùn)練人臉圖像對應(yīng)的多個(gè)局部塊，并提取各個(gè)所述訓(xùn)練人臉圖像的各個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量；優(yōu)化模塊，用于根據(jù)所述像素差值向量和球哈希優(yōu)化算法得到球哈希函數(shù)的參數(shù);所述球哈希函數(shù)的參數(shù)包括:中心點(diǎn)和半徑；第一編碼模塊，用于根據(jù)所述球哈希函數(shù)的參數(shù)對所述像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第一二值向量；聚類模塊，用于對所述第一二值向量進(jìn)行聚類，獲取聚類得到的多個(gè)視覺單詞；第二提取模塊，用于對測試人臉圖像進(jìn)行局部塊的劃分，得到所述測試人臉圖像對應(yīng) 的多個(gè)局部塊，并提取測試人臉圖像中每個(gè)所述局部塊中每個(gè)像素點(diǎn)對應(yīng)的像素差值向量；第二編碼模塊，用于根據(jù)所述球哈希函數(shù)的參數(shù)對所述測試人臉圖像對應(yīng)的多個(gè)像素差值向量進(jìn)行二值編碼，得到所述像素差值向量對應(yīng)的第二二值向量；處理模塊，用于根據(jù)所述視覺單詞對所述第二二值向量進(jìn)行特征表示得到特征向量，并根據(jù)所述特征向量進(jìn)行人臉識(shí)別。10.根據(jù)權(quán)利要求9所述的裝置，其特征在于，所述第一提取模塊，具體用于：以每個(gè)像素點(diǎn)為中心，以R為半徑，提取位于所述像素點(diǎn)四周的鄰域像素點(diǎn)，并以順時(shí) 針方向依次將所述鄰域像素點(diǎn)的像素值與所述像素點(diǎn)的像素值進(jìn)行差值運(yùn)算，得到所述像素點(diǎn)對應(yīng)的N維像素差值向量;R為預(yù)設(shè)的大于0的整數(shù);N=(2XR+1)X(2XR+1)-1。
【文檔編號(hào)】G06K9/62GK105930834SQ201610513332
【公開日】2016年9月7日
【申請日】2016年7月1日
【發(fā)明人】明悅, 范春曉, 田雷, 吳岳辛, 李陽, 史家昆, 翟正元, 吳瓊
【申請人】北京郵電大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：明悅;范春曉;田雷;吳岳辛;李陽;史家昆;翟正元;吳瓊;
技術(shù)所有人：北京郵電大學(xué);
我是此專利的發(fā)明人

上一篇：增強(qiáng)型圖像識(shí)別系統(tǒng)及方法
上一篇：一種基于視頻監(jiān)控的車輛跟蹤與分割方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

哈希編碼相關(guān)技術(shù)

哈希校驗(yàn)編碼相關(guān)技術(shù)

感知哈希編碼相關(guān)技術(shù)

北京地鐵人臉識(shí)別相關(guān)技術(shù)

人臉識(shí)別相關(guān)技術(shù)

高鐵人臉識(shí)別驗(yàn)票相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于球哈希二值編碼的人臉識(shí)別方法及裝置的制造方法