專利名稱:一種基于人臉識(shí)別的人臉定位算法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及人臉識(shí)別的領(lǐng)域,尤其是一種基于人臉識(shí)別的人臉定位算法。
背景技術(shù):
所謂人臉的定位,就是在照片(靜態(tài)圖像)或視頻(動(dòng)態(tài)圖像)中標(biāo)出人臉?biāo)诘奈恢?,把人臉選取出來(lái)。而人臉的識(shí)別就是把選取出來(lái)的人臉與數(shù)據(jù)庫(kù)中已有的人臉進(jìn)行比較,找出匹配的檔案來(lái)。有的文獻(xiàn)把人臉的定位和識(shí)別統(tǒng)稱為人臉識(shí)別,定位和識(shí)別則是兩個(gè)主要的步驟。完整的人臉識(shí)別系統(tǒng)涉及到?jīng)Q定照片或視頻中有無(wú)人臉,并計(jì)數(shù),定位,定出大小,然后根據(jù)數(shù)據(jù)庫(kù)識(shí)別出個(gè)人,可能的話還要識(shí)別表情,以及根據(jù)臉的圖像做出描述(瓜子臉,丹鳳眼等等就是日常生活中“描述”的例子),或者反過(guò)來(lái)根據(jù)描述挑選匹配的人臉圖像。
在日常生活中,我們主要根據(jù)臉來(lái)識(shí)別一個(gè)人。交談中,我們往往看著對(duì)方的臉,尤其是眼睛。臉上的表情也是進(jìn)行交談的一個(gè)重要部分。所以,人臉在人與人的交流過(guò)程中起著極其重要的作用。這就決定了在現(xiàn)代社會(huì)中,使用計(jì)算機(jī)自動(dòng)進(jìn)行人臉的定位和識(shí)別工作有著重要的意義。其應(yīng)用領(lǐng)域包括很多方面,比如身份鑒別,保安系統(tǒng),人機(jī)交互界面等等。人臉識(shí)別系統(tǒng)雖然有誘人的應(yīng)用前景,但是在現(xiàn)實(shí)中卻還沒(méi)有開(kāi)始大規(guī)模的使用。其主要原因之一就是用計(jì)算機(jī)自動(dòng)進(jìn)行人臉的定位和識(shí)別十分困難,目前的識(shí)別效果(正確率,速度)不如其他的生物識(shí)別技術(shù),如指紋識(shí)別,視網(wǎng)膜識(shí)別等等。人們?cè)谌粘I钪芯瓦M(jìn)行了大量的人臉定位和識(shí)別工作,當(dāng)然全部是由人的視覺(jué)系統(tǒng)和大腦“自動(dòng)”進(jìn)行的。目前還不清楚人的視覺(jué)系統(tǒng)和大腦的工作原理,因此這項(xiàng)人可以輕而易舉完成的任務(wù),對(duì)于目前還只會(huì)死板地執(zhí)行程序指令的計(jì)算機(jī)來(lái)說(shuō)卻是極端困難。困難主要存在于兩個(gè)方面人臉的圖像數(shù)據(jù)具有高度的隨機(jī)性。光照條件,臉的偏向,表情,發(fā)型,胡子,化妝,衣飾(眼鏡,帽子)等等略有變化,就可以給識(shí)別系統(tǒng)帶來(lái)巨大的困難。人臉的圖像數(shù)據(jù)量巨大。目前出于計(jì)算量的考慮,人臉定位和識(shí)別算法研究大多使用尺寸很小的灰度圖像。一張64X64像素的256級(jí)灰度圖像就有4096個(gè)數(shù)據(jù),每個(gè)數(shù)據(jù)有256種可能的取值。定位和識(shí)別算法一般都很復(fù)雜,在人臉庫(kù)較大的情況下,計(jì)算量十分大,很多情況下速度令人難以忍受。而灰度數(shù)據(jù)事實(shí)上是喪失了象色彩,運(yùn)動(dòng)等等的有用信息的。如果要使用全部的有用信息,計(jì)算量就更大了。因此,研究人臉的定位和識(shí)別不僅僅有實(shí)用上的考慮,而且對(duì)人們理解人腦的工作方式、研究人工智能和數(shù)字圖像處理有重要的意義。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題是為了克服上述中存在的問(wèn)題,提供一種基于人臉識(shí)別的人臉定位算法,本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是一種基于人臉識(shí)別的人臉定位的方法,具體方法如下a.人臉定位算法(1)利用人臉各器官之間的幾何關(guān)系的方法;(2)利用標(biāo)準(zhǔn)人臉圖像、變換結(jié)果直接或經(jīng)特征提取后進(jìn)行匹配的方法;b.分割算法(1)按像素或處理過(guò)的像素的灰度值進(jìn)行分割;(2)提取邊緣,利用邊緣進(jìn)行分割;(3)區(qū)域生長(zhǎng)法(31)局部法根據(jù)像素的性質(zhì)或像素的臨近像素的性質(zhì)決定像素分在什么區(qū)域;(32)總體法根據(jù)遍及整幅圖中大量像素的性質(zhì)決定把一群像素劃分到一個(gè)區(qū)域中;(33)分裂合并法利用狀態(tài)空間技術(shù)分裂或合并區(qū)域,用圖結(jié)構(gòu)表示區(qū)域和邊界。b中區(qū)域生長(zhǎng)法包括分合算法和運(yùn)行長(zhǎng)度表方法。本發(fā)明的有益效果是,本發(fā)明的一種基于人臉識(shí)別的人臉定位的方法,采用此種方法來(lái)識(shí)別人臉,其抗噪聲能力好,識(shí)別速度快。
具體實(shí)施例方式現(xiàn)在結(jié)合本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。一種基于人臉識(shí)別的人臉定位的方法,具體方法如下a.人臉定位算法(1)利用人臉各器官之間的幾何關(guān)系的方法;(2)利用標(biāo)準(zhǔn)人臉圖像、變換結(jié)果直接或經(jīng)特征提取后進(jìn)行匹配的方法;b.分割算法(1)按像素或處理過(guò)的像素的灰度值進(jìn)行分割;(2)提取邊緣,利用邊緣進(jìn)行分割;(3)區(qū)域生長(zhǎng)法(31)局部法根據(jù)像素的性質(zhì)或像素的臨近像素的性質(zhì)決定像素分在什么區(qū)域;(32)總體法根據(jù)遍及整幅圖中大量像素的性質(zhì)決定把一群像素劃分到一個(gè)區(qū)域中;(33)分裂合并法利用狀態(tài)空間技術(shù)分裂或合并區(qū)域,用圖結(jié)構(gòu)表示區(qū)域和邊界。對(duì)分割算法有兩個(gè)要求1. 一定的抗噪聲能力。經(jīng)過(guò)二值化的黑白圖像中,難免會(huì)有很多與主旨無(wú)關(guān)的細(xì)碎黑色像素連接了本應(yīng)分開(kāi)的特征,而某些單一的特征也可能會(huì)破碎成幾塊。要求分割算法具有一定的能力抵抗這些噪聲,將應(yīng)該分開(kāi)的特征分開(kāi),應(yīng)該成為整體的部分連起來(lái);2.運(yùn)行速度要快。人臉定位和識(shí)別系統(tǒng)常常作為實(shí)時(shí)應(yīng)用,在這些場(chǎng)合要求系統(tǒng)的運(yùn)行不能耗時(shí)過(guò)長(zhǎng),否則就失去意義了。從幾何匹配方法來(lái)看,最耗時(shí)的步驟就是圖像分割這一步。所以這一步的速度決定了整個(gè)人臉定位方法的運(yùn)行速度。由于我們需要的是能夠把黑色連通的區(qū)域分別標(biāo)記出來(lái)的分割算法,選擇區(qū)域生長(zhǎng)法就是最自然的了。在區(qū)域生長(zhǎng)法中,有兩類算法最常見(jiàn)分合算法和運(yùn)行長(zhǎng)度表方法,分合算法抗噪聲能力好一些,所以它成為了我首選的算法。但是經(jīng)過(guò)實(shí)踐發(fā)現(xiàn)它的最大弱點(diǎn)是計(jì)算量大,而且計(jì)算量隨問(wèn)題規(guī)模的增長(zhǎng)是非線性的,這就導(dǎo)致對(duì)大的或者復(fù)雜圖像的處理時(shí)間很長(zhǎng)。運(yùn)行長(zhǎng)度表方法優(yōu)點(diǎn)是速度快,缺點(diǎn)則是沒(méi)有多少抗噪聲能力。以上述依據(jù)本發(fā)明的理想實(shí)施例為啟示,通過(guò)上述的說(shuō)明內(nèi)容,相關(guān)工作人員完全可以在不偏離本項(xiàng)發(fā)明技術(shù)思想的范圍內(nèi),進(jìn)行多樣的變更以及修改。本項(xiàng)發(fā)明的技術(shù)性范圍并不局限于說(shuō)明書上的內(nèi)容,必須要根據(jù)權(quán)利要求范圍來(lái)確定其技術(shù)性范圍。
權(quán)利要求
1.一種基于人臉識(shí)別的人臉定位的方法,其特征是具體方法如下 a.人臉定位算法(I)利用人臉各器官之間的幾何關(guān)系的方法; (2)利用標(biāo)準(zhǔn)人臉圖像、變換結(jié)果直接或經(jīng)特征提取后進(jìn)行匹配的方法; b.分割算法(I)按像素或處理過(guò)的像素的灰度值進(jìn)行分割;(2)提取邊緣,利用邊緣進(jìn)行分割;(3)區(qū)域生長(zhǎng)法(31)局部法根據(jù)像素的性質(zhì)或像素的臨近像素的性質(zhì)決定像素分在什么區(qū)域;(32)總體法根據(jù)遍及整幅圖中大量像素的性質(zhì)決定把一群像素劃分到一個(gè)區(qū)域中;(33)分裂合并法利用狀態(tài)空間技術(shù)分裂或合并區(qū)域,用圖結(jié)構(gòu)表示區(qū)域和邊界。
2.根據(jù)權(quán)利要求I所述的一種基于人臉識(shí)別的人臉定位算法,其特征是b中區(qū)域生長(zhǎng)法包括分合算法和運(yùn)行長(zhǎng)度表方法。
全文摘要
本發(fā)明涉及人臉識(shí)別的領(lǐng)域,尤其是一種基于人臉識(shí)別的人臉定位算法,具體方法如下a.人臉定位算法;b.分割算法(1)按像素或處理過(guò)的像素的灰度值進(jìn)行分割;(2)提取邊緣,利用邊緣進(jìn)行分割;(3)區(qū)域生長(zhǎng)法。本發(fā)明的一種基于人臉識(shí)別的人臉定位的方法,采用此種方法來(lái)識(shí)別人臉,其抗噪聲能力好,識(shí)別速度快。
文檔編號(hào)G06K9/00GK102831395SQ20121025535
公開(kāi)日2012年12月19日 申請(qǐng)日期2012年7月23日 優(yōu)先權(quán)日2012年7月23日
發(fā)明者吳軍 申請(qǐng)人:常州藍(lán)城信息科技有限公司