基于概率態(tài)受限玻爾茲曼機級聯(lián)的人臉檢測方法

文檔序號：9646797閱讀：387來源：國知局

基于概率態(tài)受限玻爾茲曼機級聯(lián)的人臉檢測方法
【技術領域】
[0001] 本發(fā)明屬于生物特征識別及信息安全的技術領域，特別涉及一種基于概率態(tài)受限玻爾茲曼機（P-RBM)級聯(lián)的人臉檢測方法。
【背景技術】
[0002] 人臉檢測一直是計算機視覺和模式識別領域一個非?；钴S的研究課題，它具有不易被觀測對象發(fā)現(xiàn)的顯著優(yōu)勢。伴隨著視頻網(wǎng)絡的覆蓋程度迅速增長，視頻人臉檢測由于在視頻監(jiān)控、智能化設備、智慧城市以及安全等領域所具有的應用價值受到越來越多的關注。但是由于視頻圖像是在自然環(huán)境下采集的，因此檢測背景多變，且人臉在豎直或水平方向具有一定的旋轉角度，這給基于視頻幀的人臉檢測帶來了一定的困難。而在現(xiàn)有的人臉檢測算法中，基于機器學習的檢測算法雖然不會受到人為選定先驗知識或者匹配特征所帶來的局限性的影響，但是傳統(tǒng)的淺層機器學習網(wǎng)絡在有限樣本和計算能力的限制下，如果設計的相對簡單，則有較好的魯棒性，但分類正確率不高；如果采用復雜結構，可以實現(xiàn)較高的正確率但魯棒性差。
[0003] 多隱藏層神經(jīng)網(wǎng)絡模仿人類的學習層次，通過建立類似于人腦分層次分析問題的機制，對輸入數(shù)據(jù)逐級提取從底層到高層的特征，從而建立從底層信號到高層語義的映射關系。同時，多隱藏層神經(jīng)網(wǎng)絡通過學習隱藏在數(shù)據(jù)內部的關系，從而使得學習到的特征更具有推廣性和表達力。逐層貪婪學習算法的提出使得以受限玻爾茲曼機為核心的多隱藏層神經(jīng)網(wǎng)絡得以實現(xiàn)。目前多層受限玻爾茲曼機神經(jīng)網(wǎng)絡已經(jīng)在語音識別，圖像識別，自然語言處理，搜索廣告點擊率預估等領域取得了較好的研究成果，但是根據(jù)已經(jīng)公開的文獻資料，多層受限玻爾茲曼機神經(jīng)網(wǎng)絡還未在人臉檢測上面得到應用，并且受限玻爾茲曼機中神經(jīng)元對信號的響應狀態(tài)和人腦神經(jīng)元的真實響應狀態(tài)并不十分相符。

【發(fā)明內容】

[0004] 本發(fā)明的目的就是根據(jù)人腦神經(jīng)元的激活響應狀態(tài)，提出一種基于概率態(tài)受限玻爾茲曼機（P-RBM)級聯(lián)的人臉檢測方法，本發(fā)明方法以概率態(tài)受限玻爾茲曼機（P-RBM)為核心，構建級聯(lián)型P-RMB神經(jīng)網(wǎng)絡，并將其應用于人臉檢測領域。
[0005] 本發(fā)明具體包括如下步驟：
[0006] 步驟1、根據(jù)人腦對圖像分層次學習過程，以P-RBM為基礎，構建一個具有一層可視層、四層隱藏層和一層分類層的級聯(lián)型P-RBM神經(jīng)網(wǎng)絡，其中可視層與隱藏層構成一個 P-RBM、相鄰的隱藏層亦構成三個P-RBM，從而組成四層級聯(lián)P-RBM結構；
[0007] 步驟2、利用逐層貪婪學習算法和對比差異算法訓練四層級聯(lián)P-RBM結構；然后利用交叉熵和共輒梯度法訓練分類層，最后再利用交叉熵和共輒梯度法優(yōu)化整個級聯(lián)型 P-RBM神經(jīng)網(wǎng)絡；
[0008] 步驟3、利用膚色橢圓擬合算法提取人臉候選區(qū)域，再將候選區(qū)域逐個輸入至級聯(lián) 型P-RBM神經(jīng)網(wǎng)絡，根據(jù)分類層的分類結果完成候選區(qū)域的人臉分類，從而實現(xiàn)人臉檢測。
[0009] 步驟1所述級聯(lián)型P-RBM神經(jīng)網(wǎng)絡由一層可視層、四層隱藏層以及一層分類層組成；其中可視層神經(jīng)元數(shù)為輸入圖片維數(shù)；第一隱藏層神經(jīng)元數(shù)大于可視層神經(jīng)元數(shù)，且之后相鄰的隱藏層的神經(jīng)元數(shù)逐層遞減；分類層為兩個神經(jīng)元。
[0010] 步驟2所述的利用逐層貪婪學習算法和對比差異算法訓練四層級聯(lián)P-RBM結構；具體如下：
[0011] 2-1、將訓練樣本輸入四層級聯(lián)P-RBM結構，即將輸入圖像的像素值歸一化后逐個賦給可視層神經(jīng)元，作為其初始激活狀態(tài)；
[0012] 2-2、根據(jù)單個P-RBM的性質獲得隱藏層神經(jīng)元被激活的概率P:
[0014] 其中卜表示隱藏層第j個神經(jīng)元；V表示可視層；b^表示隱藏層中第j個神經(jīng)元的偏置;Wj表示相鄰層連接權值W的第j列；
[0015] 所述的P-RBM的性質為同一層神經(jīng)元彼此之間條件獨立的性質；
[0016] 2-3、采用對比差異算法調整網(wǎng)絡參數(shù)，完成單個P-RBM訓練，網(wǎng)絡參數(shù)的更新公式具體如下：
[0017]Δ￥^=momentum*ΔwiS+ε(<vihj>P〇-<vihj>P1-wcost*wis)
[0018] Wij=wΔ
[0019]Λbj=momentum*Λbj+ε(<hj>p0-〈hj>P1)
[0020] bj=bj+Δbj
[0021] Δ〇；=momentum*Δc；+ε(<vi>P〇-<vi>P1)
[0022] cx=cx+Δcx
[0023] 其中ΛWlj，Λbj，ΛCl分別表示相鄰層連接權值W的第i行第j列的更新量，隱藏層中第j個神經(jīng)元的偏置的更新量，可視層中第i個神經(jīng)元的偏置的更新量；Vl表示可視層第i個神經(jīng)元；Cl表示可視層第i個神經(jīng)元的偏置；表示數(shù)據(jù)在Pi下的均值；ε表示學習率；momentum表示動量因子；weC]St表示權重衰減因子；
[0024] 2-4、在獲得單個P-RBM最優(yōu)參數(shù)情況下，求得第一隱藏層神經(jīng)元的概率值，然后把該概率值作為第二個P-RBM的輸入數(shù)據(jù)，即在此時，第一隱藏層變?yōu)榱说诙[藏層的輸入層，然后按照第一個P-RBM的訓練方式訓練該P-RBM，直至訓練完四個P-RBM。
[0025] 步驟2所述的利用交叉熵和共輒梯度法訓練分類層，具體如下：
[0026] 2-5、獲取第四隱藏層神經(jīng)元的概率，并將第四隱藏層作為分類層的輸入層，具體的：采用sigmoid函數(shù)作為傳遞函數(shù)，將第四隱藏層的數(shù)據(jù)傳遞至分類層；然后根據(jù)分類結果和真實結果的交叉熵來判斷該神經(jīng)網(wǎng)絡的分類性能；交叉熵的值越小則表示分類準確率越尚；
[0027] 2-6、采用共輒梯度法來調整分類層參數(shù)，從而使交叉熵最小即神經(jīng)網(wǎng)絡分類性能最優(yōu)，具體如下：
[0028] 1)、從初始化參數(shù)值X(1) =(Wdm, 開始，計算交叉熵/y(Kih在該參數(shù)值下的梯度gl=(#-廠，)(々-，>"-!);
[0030]2)、若I|gl||〈σ，則X(1)為所求的極小值點，即此時的網(wǎng)絡參數(shù)是最優(yōu)參數(shù)，結束調整；否則在最優(yōu)搜索步長λJ沿負梯度方向d⑴=-g遛索到點X(2) =X(1)+λlCl(1);
[0031]3)、計算交叉熵if(pj)在點x(2)下的梯度g2 =((>-;
[0032] 若||g2||〈σ，則x(2)為所求的極小值點，即此時的網(wǎng)絡參數(shù)是最優(yōu)參數(shù)，結束調整；否則在最優(yōu)搜索步長λ2下沿d(1)的共輒方向d(2)= _g2+i32d(1)搜索到點X(3)= X⑵+A2d⑵；
[0033]重復步驟3)，直至滿足條件或者完成所要求的迭代次數(shù)Ν;當超過迭代次數(shù)Ν時，結束調整，并將第Ν次迭代時的調整結果最為最優(yōu)參數(shù)；

[0034] 表示第k次搜索時的最優(yōu)搜索步長；，. 子；σ表示所要求的精度；w^ss表示分類層與第四隱藏層的連接權值，B^ss表示分類層偏置W表示數(shù)據(jù)的真實結果，！>表示數(shù)據(jù)的分類結果，H4表示第四隱藏層。
[0035] 步驟2所述的利用交叉熵和共輒梯度法優(yōu)化整個級聯(lián)型P-RBM神經(jīng)網(wǎng)絡，即將訓練獲得的P-RBM和分類層單個最優(yōu)參數(shù)優(yōu)化為整個神經(jīng)網(wǎng)絡的最優(yōu)參數(shù)；具體如下：
[0036] 1)、從初始化參數(shù)值X-(Wclass?^classJW4,B4,W3,B3,W2,B2,Wu開始，計算交叉熵 mp力在該參數(shù)值下的梯度& = ((A-ff);
[0037] 2)、若I|gl| |〈〇，則χ

完整全部詳細技術資料下載

當前第1頁1 2 3 4

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：葉學義;陳雪婷;呂秋云;顧亞風;陳華華;
技術所有人：杭州電子科技大學;
我是此專利的發(fā)明人

上一篇：一種多模式自動實施人體狀態(tài)感知的實現(xiàn)方法
上一篇：基于灰度圖像的識別方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

破解人臉動態(tài)識別軟件相關技術

人臉姿態(tài)估計相關技術

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于概率態(tài)受限玻爾茲曼機級聯(lián)的人臉檢測方法