基于高維流形學(xué)習(xí)的人臉特征庫(kù)構(gòu)建方法

文檔序號(hào)：9433100閱讀：2362來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于高維流形學(xué)習(xí)的人臉特征庫(kù)構(gòu)建方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及人臉特征庫(kù)構(gòu)建領(lǐng)域，更具體地說(shuō)，本發(fā)明涉及一種基于高維流形學(xué) 習(xí)的人臉特征庫(kù)構(gòu)建方法。
【背景技術(shù)】
[0002] 在線人臉識(shí)別系統(tǒng)能夠自動(dòng)檢測(cè)給定視頻幀中的人臉圖像，提取人臉特征與人臉特征數(shù)據(jù)庫(kù)進(jìn)行匹配，從而完成人臉的圖像特征識(shí)別。在線人臉識(shí)別系統(tǒng)在監(jiān)控，信息安全，入口控制等領(lǐng)域有著廣泛的應(yīng)用前景。在線人臉識(shí)別系統(tǒng)一個(gè)重要的問(wèn)題就是如何選擇人臉特征庫(kù)，由于視頻圖像序列中人臉圖像有多姿態(tài)，多表情，多視角的問(wèn)題，人臉特征庫(kù)中的人臉圖像應(yīng)最大程度的包含多姿態(tài)，多表情，多視角特性，同時(shí)考慮到算法運(yùn)行的耗時(shí)問(wèn)題，每人的人臉特征庫(kù)不應(yīng)該太大。
[0003] -般，人臉識(shí)別就是對(duì)于輸入的圖像，判斷其中是否存在人臉，如果存在人臉，則進(jìn)一步的給出每個(gè)人臉的位置、大小和各個(gè)主要面部器官的位置信息，并依據(jù)這些信息，進(jìn) 一步提取每個(gè)人臉中所蘊(yùn)含的身份特征，將其與已知人臉庫(kù)中的人臉進(jìn)行匹配，從而識(shí)別每個(gè)人臉的身份。人臉識(shí)別系統(tǒng)可以如圖1所示。
[0004] 基于特征空間變換的人臉識(shí)別方法將人臉圖像像素作為在圖像空間中的一個(gè)向量，利用某種變換W將高維的圖像空間映射到低維的特征空間。在識(shí)別階段，將人臉圖像投影至特征空間，利用得到的低維特征向量與數(shù)據(jù)庫(kù)中的特征進(jìn)行匹配。主分量分析，獨(dú)立分量分析，線性判別分析都是經(jīng)典的線性空間變換的算法，他們的不同之處在于基向量的定義以及變換矩陣W的構(gòu)建，對(duì)于特征空間的線性投影都是相同的。以上的線性空間變換算法在很多場(chǎng)合都取得了不錯(cuò)的結(jié)果，然而對(duì)于那些臉部光照條件，臉部姿態(tài)變化較大等情況下人臉圖像的特征提取效果卻一般，原因在于人臉模式在高維空間中往往是非線性的關(guān)系，繼而出現(xiàn)了非線性空間變換的人臉識(shí)別算法，原理就是將人臉圖像空間映射到線性的高維特征空間，然后再使用傳統(tǒng)的線性變換算法，為此出現(xiàn)了核PCA(Kernal Principle Components analysis, KPCA)，核 ICA(Kernal Independent Component Analysis, KICA)，廣義辨別分析（Generalized Discriminant Analysis, GDA)。近年來(lái)也出現(xiàn)了一些新的非線性投影的方法，它們既繼承了線性空間變換的簡(jiǎn)單特性，又繼承了非線性處理數(shù)據(jù)的能力，如Roweis，Junping提出的局部線性嵌入算法（Locally Linear Embedding, LLE)和 Tenenbaum 提出的等量特征映射算法（Isometric feature mapping, Isomap)等。
[0005] 但是，傳統(tǒng)在線人臉識(shí)別算法中，每個(gè)學(xué)習(xí)樣本在圖像空間中都是當(dāng)作為孤立的單個(gè)穩(wěn)定狀態(tài)，不考慮樣本之間的相關(guān)性，而現(xiàn)實(shí)中的在線人臉圖像序列中的人臉表現(xiàn)為一個(gè)連續(xù)的運(yùn)動(dòng)狀態(tài)，每種狀態(tài)之間體現(xiàn)了一種幾何結(jié)構(gòu)關(guān)系。由此，傳統(tǒng)在線人臉識(shí)別技術(shù)的效果并不是太好。

【發(fā)明內(nèi)容】

[0006] 本發(fā)明所要解決的技術(shù)問(wèn)題是針對(duì)現(xiàn)有技術(shù)中存在上述缺陷，提供一種能夠采用高維流形學(xué)習(xí)的方法來(lái)改善上述缺陷的人臉特征庫(kù)構(gòu)建方法。
[0007] 為了實(shí)現(xiàn)上述技術(shù)目的，根據(jù)本發(fā)明，提供了一種基于高維流形學(xué)習(xí)的人臉特征庫(kù)構(gòu)建方法，包括：
[0008] 第一步驟：為各個(gè)系統(tǒng)參數(shù)賦初值；
[0009] 第二步驟：確定高維數(shù)空間中的內(nèi)在維數(shù)d，作為人臉特征在高維空間中的內(nèi)在維數(shù)d ;
[0010] 第三步驟：構(gòu)建近鄰圖，尋找和每個(gè)樣本距離最近的K個(gè)樣本點(diǎn)作為近鄰，在每個(gè)樣本和它的近鄰之間建立連接，從而構(gòu)成一個(gè)近鄰圖，兩點(diǎn)之間的距離來(lái)表示近鄰圖的邊；
[0011] 第四步驟：計(jì)算近鄰圖中任意兩個(gè)樣本之間的測(cè)地距離；計(jì)算該近鄰圖上兩點(diǎn)之間的最短路徑，作為樣本點(diǎn)之間的測(cè)線距離的近似；
[0012] 第五步驟：利用計(jì)算得到的測(cè)地距離以及測(cè)線距離的近似，獲得近鄰圖的低維投影，從而構(gòu)造一個(gè)保持本質(zhì)幾何結(jié)構(gòu)的d維歐氏空間；
[0013] 第六步驟：對(duì)低維空間進(jìn)行聚類，選擇聚類中心為代表性人臉圖像構(gòu)建人臉低維特征庫(kù)。
[0014] 優(yōu)選地，在第一步驟中，鄰域值和內(nèi)在維數(shù)都賦初值為1。
[0015] 優(yōu)選地，在第五步驟中采用經(jīng)典的MDS算法。
[0016] 優(yōu)選地，在第六步驟中使用K均值算法。
[0017] 優(yōu)選地，在第二步驟根據(jù)Sammon系數(shù)方法來(lái)確定高維數(shù)空間中的內(nèi)在維數(shù)。
[0018] 由于現(xiàn)實(shí)中的視頻圖像序列中的人臉表現(xiàn)為一個(gè)連續(xù)的運(yùn)動(dòng)狀態(tài)，所以每種狀態(tài) 之間體現(xiàn)了一種幾何結(jié)構(gòu)關(guān)系；在本發(fā)明中，采用人臉流形學(xué)習(xí)的目的就是在人臉圖像空間中提取內(nèi)在的幾何結(jié)構(gòu)及其規(guī)律性，尋找內(nèi)在低維結(jié)構(gòu)與高維觀測(cè)數(shù)據(jù)間的聯(lián)系，將高維圖像空間降維到低維特征空間，從而大大降低人臉圖像特征庫(kù)的圖像匹配運(yùn)算時(shí)間，提高在線人臉識(shí)別的效率。
【附圖說(shuō)明】
[0019] 結(jié)合附圖，并通過(guò)參考下面的詳細(xì)描述，將會(huì)更容易地對(duì)本發(fā)明有更完整的理解并且更容易地理解其伴隨的優(yōu)點(diǎn)和特征，其中：
[0020] 圖1示意性地示出了根據(jù)現(xiàn)有技術(shù)的人臉識(shí)別系統(tǒng)的示意流程。
[0021] 圖2示意性地示出了人臉流形示意圖。
[0022] 圖3A示意性地示出了非線性降維實(shí)例。
[0023] 圖3B示意性地示出了是從圖3A中提取的樣本點(diǎn)（三維）。
[0024] 圖3C示意性地示出了與圖3B相對(duì)應(yīng)的二維空間。
[0025] 圖4示意性地示出了根據(jù)本發(fā)明優(yōu)選實(shí)施例的基于高維流形學(xué)習(xí)的人臉特征庫(kù) 構(gòu)建方法的流程圖。
[0026] 需要說(shuō)明的是，附圖用于說(shuō)明本發(fā)明，而非限制本發(fā)明。注意，表示結(jié)構(gòu)的附圖可能并非按比例繪制。并且，附圖中，相同或者類似的元件標(biāo)有相同或者類似的標(biāo)號(hào)。
【具體實(shí)施方式】
[0027] 為了使本發(fā)明的內(nèi)容更加清楚和易懂，下面結(jié)合具體實(shí)施例和附圖對(duì)本發(fā)明的內(nèi) 容進(jìn)行詳細(xì)描述。
[0028] 傳統(tǒng)在線人臉識(shí)別算法中，每個(gè)學(xué)習(xí)樣本在圖像空間中都是當(dāng)作為孤立的單個(gè)穩(wěn) 定狀態(tài)，不考慮樣本之間的相關(guān)性，而現(xiàn)實(shí)中的在線人臉圖像序列中的人臉表現(xiàn)為一個(gè)連續(xù)的運(yùn)動(dòng)狀態(tài)，每種狀態(tài)之間體現(xiàn)了一種幾何結(jié)構(gòu)關(guān)系，而人臉流形學(xué)習(xí)的目的就是在人臉圖像空間尋找人臉數(shù)據(jù)集中提取內(nèi)在的幾何結(jié)構(gòu)及其規(guī)律性，將高維圖像空間降維到低維特征空間，并尋找內(nèi)在低維結(jié)構(gòu)與高維觀測(cè)數(shù)據(jù)間的聯(lián)系，因?yàn)榈途S流形能夠用作下一步的分類，識(shí)別的特征，因此，本發(fā)明采用流形學(xué)習(xí)算法LLE算法，K 一均值聚類算法，提取視頻圖像序列的代表性人臉，構(gòu)建人臉特征庫(kù)，用于人臉識(shí)別系統(tǒng)。
[0029] 本文采用局部線性嵌入算法（Locally Linear Embedding, LLE)對(duì)人臉圖像進(jìn)行非線性降維，使得類似的人臉圖像數(shù)據(jù)盡量接近，再通過(guò)K均值聚類，將聚類中心作為系統(tǒng) 的代表性人臉圖像，用作構(gòu)建人臉特征庫(kù)。
[0030] 本發(fā)明的目的在于克服傳統(tǒng)在線人臉識(shí)別過(guò)程中，人臉特征庫(kù)構(gòu)建過(guò)程中，學(xué)習(xí) 耗時(shí)量大，占用內(nèi)存大的問(wèn)題。本發(fā)明的重點(diǎn)在于如何在眾多訓(xùn)練圖像中選取一些具有代表性的圖像進(jìn)行人臉特征庫(kù)的構(gòu)建，在盡量保持人臉識(shí)別率的同時(shí)，大大減少了訓(xùn)練的間和占用的內(nèi)存，進(jìn)行高速地處理。
[0031] 下面將具體說(shuō)明本發(fā)明的原理。
[0032] ( -）人臉流形：
[0033] 用f(N，p)表示人N在參數(shù)p情況下的人臉圖像，參數(shù)p表示不同的人臉表情，人臉姿態(tài)，人臉表面光照等情況。
[0034] Fn= {f(N,p) Ip e P} (1)
[0035] 公式（1)表示人N在各種情況下的人臉集合，也稱為人N的人臉流形。此外，所有人的人臉流形的并稱為人臉流形，即
圖2是一個(gè)人臉從左到右依次旋轉(zhuǎn)人臉角度形成的流形示意圖。
[0036] 人臉流形學(xué)習(xí)的目的就是尋找隱藏在高維圖像空間內(nèi)在的人臉圖像幾何結(jié)構(gòu)關(guān) 系，并將高維圖像空間降維到低維特征空間，同時(shí)也能在低維特征空間中重構(gòu)這種幾何結(jié) 構(gòu)關(guān)系。這是一個(gè)非常有用，并且又是一個(gè)具有挑戰(zhàn)性的非監(jiān)督學(xué)習(xí)問(wèn)題，有用在于將高維人臉數(shù)據(jù)映射為低維特征數(shù)據(jù)便于進(jìn)一步分析，同時(shí)能夠避免"維數(shù)災(zāi)難"的問(wèn)題，挑戰(zhàn)性在于在不同姿態(tài)，光照，表情等情況下的人臉流形是非線性和非凸性的。
[0037] (二）流形學(xué)習(xí)的主要原理一LLE算法：
[0038] 主分量分析和多元尺度分析是經(jīng)典的線性數(shù)據(jù)降維技術(shù)，主要研究在高維空間中如何涉及線性模型的特征向量，它們的優(yōu)勢(shì)是運(yùn)算快捷，方便，并能產(chǎn)生簡(jiǎn)單的變換函數(shù)，對(duì)線性結(jié)構(gòu)的數(shù)據(jù)集效果好，同時(shí)不存在局部最優(yōu)解的問(wèn)題，但是對(duì)于那些非線性數(shù)據(jù)如人臉流形，這些線性方法效果并不理想。非線性降維技術(shù)，如自組織映射（Self-Organizing Mapping, SOM)，生成式拓?fù)溆成洌℅enerative Topology Mapping, GTM)，雖然這些算法能夠處理非線性流形問(wèn)題，但是這些方法都牽涉到幾個(gè)自由參數(shù)，如學(xué)習(xí)速率，收斂標(biāo)準(zhǔn)，此外這些方法并不能夠保證得到的解是全局最優(yōu)解。
[0039] 近年來(lái)，出現(xiàn)了一些新的非線性流形學(xué)習(xí)算法，這些算法都是基于特征值分解技術(shù)，因此與主分量分析，多尺度分析（Multidimensional Scaling, MDS) -樣，易于實(shí)現(xiàn)，運(yùn) 算快捷，全局優(yōu)化，不存在局部最優(yōu)解的問(wèn)題，這些算法中主要是局部線性嵌套LLE，等度規(guī) 映射ISOMAP，Laplacian特征映射，相比SOM算法，這些算法能夠在低維特征空間中保留在高維圖像空間中潛在的流形間的幾何結(jié)構(gòu)關(guān)系。
[0040] Sam T. Roweis和Lawrence K. Saul在2000年左右提出LLE算法，它是針對(duì)非線性數(shù)據(jù)的一種新的降維技術(shù)，并且能夠使降維后的數(shù)據(jù)保持原有的拓?fù)浣Y(jié)構(gòu)。它是一種強(qiáng)悍的特征向量法，也屬于非線性降維算法。LLE算法前提是假設(shè)樣本數(shù)據(jù)是在高維空間中非線性分布，然后將其映射到低維空間中。許多高維數(shù)據(jù)都是非線性分布的，例如：三維物體的不同視角所產(chǎn)生的圖像。該算法研究的模型具有：簡(jiǎn)單設(shè)置、無(wú)需先驗(yàn)知識(shí)、具有低自由度的數(shù)據(jù)集。LLE的基本思想是將全局非線性轉(zhuǎn)化為局部線性，而相互重疊的局部領(lǐng)域能夠提供全局結(jié)構(gòu)的信息。這樣對(duì)每個(gè)局部進(jìn)行線性降維后，再按照某種規(guī)則將結(jié)果組合在一起，就能夠得到低維的全局坐標(biāo)表示。
[0041 ] LLE算法可以有圖3所示的一個(gè)例子來(lái)描述。在

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：胡靜;
技術(shù)所有人：上海電機(jī)學(xué)院;
我是此專利的發(fā)明人

上一篇：光學(xué)指紋檢測(cè)裝置及顯示設(shè)備的制造方法
上一篇：一種人體身份識(shí)別方法及裝置的制造方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于高維流形學(xué)習(xí)的人臉特征庫(kù)構(gòu)建方法