亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于高維流形學(xué)習(xí)的人臉特征庫(kù)構(gòu)建方法

文檔序號(hào):9433100閱讀:2362來(lái)源:國(guó)知局
基于高維流形學(xué)習(xí)的人臉特征庫(kù)構(gòu)建方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及人臉特征庫(kù)構(gòu)建領(lǐng)域,更具體地說(shuō),本發(fā)明涉及一種基于高維流形學(xué) 習(xí)的人臉特征庫(kù)構(gòu)建方法。
【背景技術(shù)】
[0002] 在線人臉識(shí)別系統(tǒng)能夠自動(dòng)檢測(cè)給定視頻幀中的人臉圖像,提取人臉特征與人臉 特征數(shù)據(jù)庫(kù)進(jìn)行匹配,從而完成人臉的圖像特征識(shí)別。在線人臉識(shí)別系統(tǒng)在監(jiān)控,信息安 全,入口控制等領(lǐng)域有著廣泛的應(yīng)用前景。在線人臉識(shí)別系統(tǒng)一個(gè)重要的問(wèn)題就是如何選 擇人臉特征庫(kù),由于視頻圖像序列中人臉圖像有多姿態(tài),多表情,多視角的問(wèn)題,人臉特征 庫(kù)中的人臉圖像應(yīng)最大程度的包含多姿態(tài),多表情,多視角特性,同時(shí)考慮到算法運(yùn)行的耗 時(shí)問(wèn)題,每人的人臉特征庫(kù)不應(yīng)該太大。
[0003] -般,人臉識(shí)別就是對(duì)于輸入的圖像,判斷其中是否存在人臉,如果存在人臉,則 進(jìn)一步的給出每個(gè)人臉的位置、大小和各個(gè)主要面部器官的位置信息,并依據(jù)這些信息,進(jìn) 一步提取每個(gè)人臉中所蘊(yùn)含的身份特征,將其與已知人臉庫(kù)中的人臉進(jìn)行匹配,從而識(shí)別 每個(gè)人臉的身份。人臉識(shí)別系統(tǒng)可以如圖1所示。
[0004] 基于特征空間變換的人臉識(shí)別方法將人臉圖像像素作為在圖像空間中的一個(gè)向 量,利用某種變換W將高維的圖像空間映射到低維的特征空間。在識(shí)別階段,將人臉圖像投 影至特征空間,利用得到的低維特征向量與數(shù)據(jù)庫(kù)中的特征進(jìn)行匹配。主分量分析,獨(dú)立 分量分析,線性判別分析都是經(jīng)典的線性空間變換的算法,他們的不同之處在于基向量的 定義以及變換矩陣W的構(gòu)建,對(duì)于特征空間的線性投影都是相同的。以上的線性空間變換 算法在很多場(chǎng)合都取得了不錯(cuò)的結(jié)果,然而對(duì)于那些臉部光照條件,臉部姿態(tài)變化較大等 情況下人臉圖像的特征提取效果卻一般,原因在于人臉模式在高維空間中往往是非線性的 關(guān)系,繼而出現(xiàn)了非線性空間變換的人臉識(shí)別算法,原理就是將人臉圖像空間映射到線性 的高維特征空間,然后再使用傳統(tǒng)的線性變換算法,為此出現(xiàn)了核PCA(Kernal Principle Components analysis, KPCA),核 ICA(Kernal Independent Component Analysis, KICA), 廣義辨別分析(Generalized Discriminant Analysis, GDA)。近年來(lái)也出現(xiàn)了一些新的 非線性投影的方法,它們既繼承了線性空間變換的簡(jiǎn)單特性,又繼承了非線性處理數(shù)據(jù)的 能力,如Roweis,Junping提出的局部線性嵌入算法(Locally Linear Embedding, LLE)和 Tenenbaum 提出的等量特征映射算法(Isometric feature mapping, Isomap)等。
[0005] 但是,傳統(tǒng)在線人臉識(shí)別算法中,每個(gè)學(xué)習(xí)樣本在圖像空間中都是當(dāng)作為孤立的 單個(gè)穩(wěn)定狀態(tài),不考慮樣本之間的相關(guān)性,而現(xiàn)實(shí)中的在線人臉圖像序列中的人臉表現(xiàn)為 一個(gè)連續(xù)的運(yùn)動(dòng)狀態(tài),每種狀態(tài)之間體現(xiàn)了一種幾何結(jié)構(gòu)關(guān)系。由此,傳統(tǒng)在線人臉識(shí)別技 術(shù)的效果并不是太好。

【發(fā)明內(nèi)容】

[0006] 本發(fā)明所要解決的技術(shù)問(wèn)題是針對(duì)現(xiàn)有技術(shù)中存在上述缺陷,提供一種能夠采用 高維流形學(xué)習(xí)的方法來(lái)改善上述缺陷的人臉特征庫(kù)構(gòu)建方法。
[0007] 為了實(shí)現(xiàn)上述技術(shù)目的,根據(jù)本發(fā)明,提供了一種基于高維流形學(xué)習(xí)的人臉特征 庫(kù)構(gòu)建方法,包括:
[0008] 第一步驟:為各個(gè)系統(tǒng)參數(shù)賦初值;
[0009] 第二步驟:確定高維數(shù)空間中的內(nèi)在維數(shù)d,作為人臉特征在高維空間中的內(nèi)在 維數(shù)d ;
[0010] 第三步驟:構(gòu)建近鄰圖,尋找和每個(gè)樣本距離最近的K個(gè)樣本點(diǎn)作為近鄰,在每 個(gè)樣本和它的近鄰之間建立連接,從而構(gòu)成一個(gè)近鄰圖,兩點(diǎn)之間的距離來(lái)表示近鄰圖的 邊;
[0011] 第四步驟:計(jì)算近鄰圖中任意兩個(gè)樣本之間的測(cè)地距離;計(jì)算該近鄰圖上兩點(diǎn)之 間的最短路徑,作為樣本點(diǎn)之間的測(cè)線距離的近似;
[0012] 第五步驟:利用計(jì)算得到的測(cè)地距離以及測(cè)線距離的近似,獲得近鄰圖的低維投 影,從而構(gòu)造一個(gè)保持本質(zhì)幾何結(jié)構(gòu)的d維歐氏空間;
[0013] 第六步驟:對(duì)低維空間進(jìn)行聚類,選擇聚類中心為代表性人臉圖像構(gòu)建人臉低維 特征庫(kù)。
[0014] 優(yōu)選地,在第一步驟中,鄰域值和內(nèi)在維數(shù)都賦初值為1。
[0015] 優(yōu)選地,在第五步驟中采用經(jīng)典的MDS算法。
[0016] 優(yōu)選地,在第六步驟中使用K均值算法。
[0017] 優(yōu)選地,在第二步驟根據(jù)Sammon系數(shù)方法來(lái)確定高維數(shù)空間中的內(nèi)在維數(shù)。
[0018] 由于現(xiàn)實(shí)中的視頻圖像序列中的人臉表現(xiàn)為一個(gè)連續(xù)的運(yùn)動(dòng)狀態(tài),所以每種狀態(tài) 之間體現(xiàn)了一種幾何結(jié)構(gòu)關(guān)系;在本發(fā)明中,采用人臉流形學(xué)習(xí)的目的就是在人臉圖像空 間中提取內(nèi)在的幾何結(jié)構(gòu)及其規(guī)律性,尋找內(nèi)在低維結(jié)構(gòu)與高維觀測(cè)數(shù)據(jù)間的聯(lián)系,將高 維圖像空間降維到低維特征空間,從而大大降低人臉圖像特征庫(kù)的圖像匹配運(yùn)算時(shí)間,提 高在線人臉識(shí)別的效率。
【附圖說(shuō)明】
[0019] 結(jié)合附圖,并通過(guò)參考下面的詳細(xì)描述,將會(huì)更容易地對(duì)本發(fā)明有更完整的理解 并且更容易地理解其伴隨的優(yōu)點(diǎn)和特征,其中:
[0020] 圖1示意性地示出了根據(jù)現(xiàn)有技術(shù)的人臉識(shí)別系統(tǒng)的示意流程。
[0021] 圖2示意性地示出了人臉流形示意圖。
[0022] 圖3A示意性地示出了非線性降維實(shí)例。
[0023] 圖3B示意性地示出了是從圖3A中提取的樣本點(diǎn)(三維)。
[0024] 圖3C示意性地示出了與圖3B相對(duì)應(yīng)的二維空間。
[0025] 圖4示意性地示出了根據(jù)本發(fā)明優(yōu)選實(shí)施例的基于高維流形學(xué)習(xí)的人臉特征庫(kù) 構(gòu)建方法的流程圖。
[0026] 需要說(shuō)明的是,附圖用于說(shuō)明本發(fā)明,而非限制本發(fā)明。注意,表示結(jié)構(gòu)的附圖可 能并非按比例繪制。并且,附圖中,相同或者類似的元件標(biāo)有相同或者類似的標(biāo)號(hào)。
【具體實(shí)施方式】
[0027] 為了使本發(fā)明的內(nèi)容更加清楚和易懂,下面結(jié)合具體實(shí)施例和附圖對(duì)本發(fā)明的內(nèi) 容進(jìn)行詳細(xì)描述。
[0028] 傳統(tǒng)在線人臉識(shí)別算法中,每個(gè)學(xué)習(xí)樣本在圖像空間中都是當(dāng)作為孤立的單個(gè)穩(wěn) 定狀態(tài),不考慮樣本之間的相關(guān)性,而現(xiàn)實(shí)中的在線人臉圖像序列中的人臉表現(xiàn)為一個(gè)連 續(xù)的運(yùn)動(dòng)狀態(tài),每種狀態(tài)之間體現(xiàn)了一種幾何結(jié)構(gòu)關(guān)系,而人臉流形學(xué)習(xí)的目的就是在人 臉圖像空間尋找人臉數(shù)據(jù)集中提取內(nèi)在的幾何結(jié)構(gòu)及其規(guī)律性,將高維圖像空間降維到低 維特征空間,并尋找內(nèi)在低維結(jié)構(gòu)與高維觀測(cè)數(shù)據(jù)間的聯(lián)系,因?yàn)榈途S流形能夠用作下一 步的分類,識(shí)別的特征,因此,本發(fā)明采用流形學(xué)習(xí)算法LLE算法,K 一均值聚類算法,提取 視頻圖像序列的代表性人臉,構(gòu)建人臉特征庫(kù),用于人臉識(shí)別系統(tǒng)。
[0029] 本文采用局部線性嵌入算法(Locally Linear Embedding, LLE)對(duì)人臉圖像進(jìn)行 非線性降維,使得類似的人臉圖像數(shù)據(jù)盡量接近,再通過(guò)K均值聚類,將聚類中心作為系統(tǒng) 的代表性人臉圖像,用作構(gòu)建人臉特征庫(kù)。
[0030] 本發(fā)明的目的在于克服傳統(tǒng)在線人臉識(shí)別過(guò)程中,人臉特征庫(kù)構(gòu)建過(guò)程中,學(xué)習(xí) 耗時(shí)量大,占用內(nèi)存大的問(wèn)題。本發(fā)明的重點(diǎn)在于如何在眾多訓(xùn)練圖像中選取一些具有代 表性的圖像進(jìn)行人臉特征庫(kù)的構(gòu)建,在盡量保持人臉識(shí)別率的同時(shí),大大減少了訓(xùn)練的間 和占用的內(nèi)存,進(jìn)行高速地處理。
[0031] 下面將具體說(shuō)明本發(fā)明的原理。
[0032] ( -)人臉流形:
[0033] 用f(N,p)表示人N在參數(shù)p情況下的人臉圖像,參數(shù)p表示不同的人臉表情,人 臉姿態(tài),人臉表面光照等情況。
[0034] Fn= {f(N,p) Ip e P} (1)
[0035] 公式(1)表示人N在各種情況下的人臉集合,也稱為人N的人臉流形。此外,所有 人的人臉流形的并稱為人臉流形,即
圖2是一個(gè)人臉從左到右依次旋轉(zhuǎn)人臉角 度形成的流形示意圖。
[0036] 人臉流形學(xué)習(xí)的目的就是尋找隱藏在高維圖像空間內(nèi)在的人臉圖像幾何結(jié)構(gòu)關(guān) 系,并將高維圖像空間降維到低維特征空間,同時(shí)也能在低維特征空間中重構(gòu)這種幾何結(jié) 構(gòu)關(guān)系。這是一個(gè)非常有用,并且又是一個(gè)具有挑戰(zhàn)性的非監(jiān)督學(xué)習(xí)問(wèn)題,有用在于將高維 人臉數(shù)據(jù)映射為低維特征數(shù)據(jù)便于進(jìn)一步分析,同時(shí)能夠避免"維數(shù)災(zāi)難"的問(wèn)題,挑戰(zhàn)性 在于在不同姿態(tài),光照,表情等情況下的人臉流形是非線性和非凸性的。
[0037] (二)流形學(xué)習(xí)的主要原理一LLE算法:
[0038] 主分量分析和多元尺度分析是經(jīng)典的線性數(shù)據(jù)降維技術(shù),主要研究在高維空間中 如何涉及線性模型的特征向量,它們的優(yōu)勢(shì)是運(yùn)算快捷,方便,并能產(chǎn)生簡(jiǎn)單的變換函數(shù), 對(duì)線性結(jié)構(gòu)的數(shù)據(jù)集效果好,同時(shí)不存在局部最優(yōu)解的問(wèn)題,但是對(duì)于那些非線性數(shù)據(jù)如 人臉流形,這些線性方法效果并不理想。非線性降維技術(shù),如自組織映射(Self-Organizing Mapping, SOM),生成式拓?fù)溆成洌℅enerative Topology Mapping, GTM),雖然這些算法能夠 處理非線性流形問(wèn)題,但是這些方法都牽涉到幾個(gè)自由參數(shù),如學(xué)習(xí)速率,收斂標(biāo)準(zhǔn),此外 這些方法并不能夠保證得到的解是全局最優(yōu)解。
[0039] 近年來(lái),出現(xiàn)了一些新的非線性流形學(xué)習(xí)算法,這些算法都是基于特征值分解技 術(shù),因此與主分量分析,多尺度分析(Multidimensional Scaling, MDS) -樣,易于實(shí)現(xiàn),運(yùn) 算快捷,全局優(yōu)化,不存在局部最優(yōu)解的問(wèn)題,這些算法中主要是局部線性嵌套LLE,等度規(guī) 映射ISOMAP,Laplacian特征映射,相比SOM算法,這些算法能夠在低維特征空間中保留在 高維圖像空間中潛在的流形間的幾何結(jié)構(gòu)關(guān)系。
[0040] Sam T. Roweis和Lawrence K. Saul在2000年左右提出LLE算法,它是針對(duì)非線性 數(shù)據(jù)的一種新的降維技術(shù),并且能夠使降維后的數(shù)據(jù)保持原有的拓?fù)浣Y(jié)構(gòu)。它是一種強(qiáng)悍 的特征向量法,也屬于非線性降維算法。LLE算法前提是假設(shè)樣本數(shù)據(jù)是在高維空間中非線 性分布,然后將其映射到低維空間中。許多高維數(shù)據(jù)都是非線性分布的,例如:三維物體的 不同視角所產(chǎn)生的圖像。該算法研究的模型具有:簡(jiǎn)單設(shè)置、無(wú)需先驗(yàn)知識(shí)、具有低自由度 的數(shù)據(jù)集。LLE的基本思想是將全局非線性轉(zhuǎn)化為局部線性,而相互重疊的局部領(lǐng)域能夠提 供全局結(jié)構(gòu)的信息。這樣對(duì)每個(gè)局部進(jìn)行線性降維后,再按照某種規(guī)則將結(jié)果組合在一起, 就能夠得到低維的全局坐標(biāo)表示。
[0041 ] LLE算法可以有圖3所示的一個(gè)例子來(lái)描述。在
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1