一種基于面向場(chǎng)景判別性分析的圖像到視頻人臉識(shí)別方法
【專(zhuān)利摘要】本發(fā)明的實(shí)施方式提供了一種基于面向場(chǎng)景判別性分析的圖像到視頻人臉識(shí)別方法,其包括步驟:1)檢測(cè)輸入靜止圖像及人臉視頻中的人臉區(qū)域,并將所述人臉區(qū)域歸一化到相同大?。?)提取所述歸一化處理后的人臉區(qū)域的特征,并進(jìn)行降維;3)對(duì)所提取的靜止場(chǎng)景人臉和視頻場(chǎng)景人臉建立不同的映射矩陣,計(jì)算原始特征在映射空間中的特征表示;4)根據(jù)身份耦合的圖像視頻人臉訓(xùn)練數(shù)據(jù),通過(guò)約束映射空間中人臉特征的類(lèi)內(nèi)緊致性和類(lèi)間分離性,優(yōu)化靜止場(chǎng)景和視頻場(chǎng)景的映射矩陣參數(shù);5)將測(cè)試的人臉視頻和數(shù)據(jù)庫(kù)中的人臉圖片分別輸入對(duì)應(yīng)的映射矩陣計(jì)算新特征,采用最近鄰算法識(shí)別視頻人臉身份。本發(fā)明對(duì)不同的場(chǎng)景建立不同的映射矩陣,有效地建模不同場(chǎng)景的數(shù)據(jù)特征,并利用線性判別分析學(xué)習(xí)優(yōu)化面向場(chǎng)景的映射矩陣,使得變換后的特征具有良好的區(qū)分性。
【專(zhuān)利說(shuō)明】一種基于面向場(chǎng)景判別性分析的圖像到視頻人臉識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于視頻人臉識(shí)別【技術(shù)領(lǐng)域】,具體涉及一種基于面向場(chǎng)景判別性分析的圖像到視頻人臉識(shí)別方法。
【背景技術(shù)】
[0002]隨著攝像頭等信息采集設(shè)備的普及,視頻數(shù)據(jù)資源逐漸在日常生活中得到廣泛的應(yīng)用。其中一個(gè)重要的應(yīng)用包括各種場(chǎng)景中的面部照片匹配,如識(shí)別駕照,護(hù)照,身份證中的人臉圖像。因此,基于視頻數(shù)據(jù)的人臉識(shí)別研究稱(chēng)為了一個(gè)緊急而重要的任務(wù)。這里,我們主要關(guān)注現(xiàn)實(shí)世界中的圖像到視頻的人臉識(shí)別應(yīng)用。在這種場(chǎng)景中,數(shù)據(jù)庫(kù)中的每個(gè)人只注冊(cè)單張或者少量的高質(zhì)量靜止圖片,而查詢(xún)圖片是多個(gè)視頻片段。這些視頻通常是從不同環(huán)境中獲取的,受光照、姿態(tài)、運(yùn)動(dòng)模糊等因素干擾,視頻幀的質(zhì)量較低且比較模糊。由于不同場(chǎng)景中的數(shù)據(jù)通常表現(xiàn)出非常不同的特征,而且這些場(chǎng)景變化帶來(lái)的圖片差異可能使得同一個(gè)人的不同場(chǎng)景人臉圖片位于不同的子空間。這些因素導(dǎo)致圖片到視頻的人臉識(shí)別問(wèn)題存在很大的挑戰(zhàn)。
[0003]目前大多數(shù)研究主要致力于圖片到圖片或視頻到視頻的人臉識(shí)別問(wèn)題。CN101668176A的中國(guó)專(zhuān)利提供了一種霧天圖像中人臉的識(shí)別方法和識(shí)別裝置,CN102955933A提供了一種基于人臉識(shí)別的家居門(mén)禁控制方法,CN102223520A中提供的智能人臉識(shí)別監(jiān)控系統(tǒng),這些方法通常假設(shè)注冊(cè)數(shù)據(jù)和查詢(xún)數(shù)據(jù)都是圖片或者視頻,并且采用相同的特征提取或者特征變換方法來(lái)來(lái)提取數(shù)據(jù)信息,然后直接計(jì)算它們的相似度,進(jìn)行人臉識(shí)別。盡管常用的基于轉(zhuǎn)換的方法,如主成分分析(PCA)、線性判別分析(LDA),能獲得比較好的投影空間用于圖像表述。但是當(dāng)注冊(cè)數(shù)據(jù)和測(cè)試數(shù)據(jù)的分布存在較大的差異的情況下,這些方法的性能會(huì)嚴(yán)重的退化。為了解決這個(gè)問(wèn)題,有人提出了一種改進(jìn)的LDA方法,這個(gè)方法采用偏權(quán)重和局部權(quán)重策略來(lái)強(qiáng)調(diào)交叉場(chǎng)景的人臉圖像對(duì)。這類(lèi)方法的缺點(diǎn)在于只用單一的映射來(lái)建模所有場(chǎng)景的數(shù)據(jù)特征。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是要解決交叉場(chǎng)景人臉識(shí)別中人臉數(shù)據(jù)特征分布差異大的問(wèn)題,為此,本發(fā)明提供了一種基于面向場(chǎng)景判別性分析的圖像到視頻人臉識(shí)別方法。
[0005]為了實(shí)現(xiàn)所述目的,本發(fā)明的一種基于面向場(chǎng)景判別性分析的圖像到視頻人臉識(shí)別方法,其特征在于,包括以下具體步驟:
A)首先,檢測(cè)輸入靜止人臉圖片和人臉視頻中的人臉位置,提取人臉區(qū)域圖像,將人臉區(qū)域歸一化為大小為Zixifr的矩形圖像區(qū)域,H表示矩形圖像區(qū)域的高度,W表示矩形圖像區(qū)域的寬度;
B)在歸一化的人臉區(qū)域圖像上提取特征,并用主成分分析方法對(duì)特征降維;
C)對(duì)靜止場(chǎng)景和視頻場(chǎng)景分別假設(shè)不同的映射矩陣,將原始的靜止圖片人臉特征和視頻人臉特征分別輸入到對(duì)應(yīng)的變換矩陣后,獲得在映射空間中的特征表述;D)訓(xùn)練集中的每個(gè)人都提供一張靜止人臉圖片和多個(gè)環(huán)境變化的人臉視頻片段;通過(guò)約束映射空間中同一人在靜止場(chǎng)景和視頻場(chǎng)景中的人臉特征距離小,而不同人的人臉特征距離大,構(gòu)造面向場(chǎng)景的判別分析優(yōu)化目標(biāo);利用梯度下降法求解目標(biāo)函數(shù),得到最優(yōu)的映射矩陣參數(shù),使得不同場(chǎng)景人臉特征在映射空間中達(dá)到良好的區(qū)分性能;
E)將測(cè)試視頻人臉圖片輸入視頻場(chǎng)景映射矩陣,數(shù)據(jù)庫(kù)中所有的靜止圖片人臉輸入靜止場(chǎng)景映射矩陣,分別得到轉(zhuǎn)換后的新特征;計(jì)算測(cè)試人臉視頻到數(shù)據(jù)庫(kù)中所有靜止人臉圖片的距離,選擇與測(cè)試視頻距離最小的圖片人臉作為測(cè)試視頻的身份。
[0006]進(jìn)一步,所述步驟B)中,圖像上提取的特征類(lèi)型是紋理特征、幅值特征、相位特征LPQ或上述特征的組合;基于原始圖像提取的特征維數(shù)比較高,而且含有很多的冗余信息和干擾信息,因此采用主成分分析方法獲得降維矩陣,原始特征通過(guò)降維矩陣后獲得低維特征。
[0007]進(jìn)一步,紋理特征為L(zhǎng)BP或HLBP,幅值特征為Gabor幅值,相位特征為L(zhǎng)PQ。
[0008]進(jìn)一步,所述步驟C)中,;對(duì)靜止場(chǎng)景和視頻場(chǎng)景分別對(duì)應(yīng)不同的映射矩陣
(?:巧?,用它們來(lái)分別建模兩種場(chǎng)景的數(shù)據(jù)特征;原始特征I輸入映射矩陣F后,在映射空間中的特征表示為
[0009]進(jìn)一步,所述步驟D)中,訓(xùn)練集包括高質(zhì)量的靜止人臉圖片集S和低質(zhì)量的人臉視頻集F ;包含巧個(gè)人的靜止人臉集表示為
【權(quán)利要求】
1.一種基于面向場(chǎng)景判別性分析的圖像到視頻人臉識(shí)別方法,其特征在于,包括以下具體步驟:A)首先,檢測(cè)輸入靜止人臉圖片和人臉視頻中的人臉位置,提取人臉區(qū)域圖像,將人臉區(qū)域歸一化為大小為的矩形圖像區(qū)域,H表示矩形圖像區(qū)域的高度,W表示矩形圖像區(qū)域的寬度;B)在歸一化的人臉區(qū)域圖像上提取特征,并用主成分分析方法對(duì)特征降維;C)對(duì)靜止場(chǎng)景和視頻場(chǎng)景分別假設(shè)不同的映射矩陣,將原始的靜止圖片人臉特征和視頻人臉特征分別輸入到對(duì)應(yīng)的變換矩陣后,獲得在映射空間中的特征表述;D)訓(xùn)練集中的每個(gè)人都提供一張靜止人臉圖片和多個(gè)環(huán)境變化的人臉視頻片段;通過(guò)約束映射空間中同一人在靜止場(chǎng)景和視頻場(chǎng)景中的人臉特征距離小,而不同人的人臉特征距離大,構(gòu)造面向場(chǎng)景的判別分析優(yōu)化目標(biāo);利用梯度下降法求解目標(biāo)函數(shù),得到最優(yōu)的映射矩陣參數(shù),使得不同場(chǎng)景人臉特征在映射空間中達(dá)到良好的區(qū)分性能;Ε)將測(cè)試視頻人臉圖片輸入視頻場(chǎng)景映射矩陣,數(shù)據(jù)庫(kù)中所有的靜止圖片人臉輸入靜止場(chǎng)景映射矩陣,分別得到轉(zhuǎn)換后的新特征;計(jì)算測(cè)試人臉視頻到數(shù)據(jù)庫(kù)中所有靜止人臉圖片的距離,選擇與測(cè)試視頻距離最小的圖片人臉作為測(cè)試視頻的身份。
2.權(quán)利要求1所述的圖像到視頻人臉識(shí)別方法,其特征在于,所述步驟B)中,圖像上提取的特征類(lèi)型是紋理特征、幅值特征、相位特征LPQ或上述特征的組合;基于原始圖像提取的特征維數(shù)比較高,而且含有很多的冗余信息和干擾信息,因此采用主成分分析方法獲得降維矩陣,原始特征通過(guò)降維矩陣后獲得低維特征。
3.根據(jù)權(quán)利要求2所述的圖像到視頻人臉識(shí)別方法,其特征在于:紋理特征為L(zhǎng)BP或HLBP,幅值特征為Gabor幅值,相位特征為L(zhǎng)PQ。
4.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的圖像到視頻人臉識(shí)別方法,其特征在于,所述步驟C)中,對(duì)靜止場(chǎng)景和視頻場(chǎng)景分別對(duì)應(yīng)不同的映射矩,用它們來(lái)分別建模兩種場(chǎng)景的數(shù)據(jù)特征;原始特征X輸入映射矩陣F后,在映射空間中的特征表示為
5.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的圖像到視頻人臉識(shí)別方法,其特征在于,所述步驟D)中,訓(xùn)練集包括高質(zhì)量的靜止人臉圖片集S和低質(zhì)量的人臉視頻集F ;包含巧個(gè)人的靜止人臉集表示為
6.根據(jù)權(quán)利要求5所述的圖像到視頻人臉識(shí)別方法,其特征在于:形成靜止場(chǎng)景和視頻場(chǎng)景中映射矩陣參數(shù)的具體步驟為:I)分別構(gòu)建映射空間中人臉特征的類(lèi)內(nèi)緊致性約束及和類(lèi)間分離性約束^ ;類(lèi)內(nèi)緊致性計(jì)算同一人的視頻場(chǎng)景圖片幀V和靜止場(chǎng)景圖片七的距離;類(lèi)間分離性計(jì)算不同人的視頻場(chǎng)視頻片段的平均值和靜止場(chǎng)景圖片&的距離;計(jì)算表達(dá)式為
7.根據(jù)權(quán)利要求6中所述的圖像到視頻人臉識(shí)別方法,其特征在于,所述Ε)步中,將測(cè)試視頻集& =吣仁P I輸入視頻場(chǎng)景映射矩陣,新特征計(jì)算為:
【文檔編號(hào)】G06K9/00GK103605993SQ201310641441
【公開(kāi)日】2014年2月26日 申請(qǐng)日期:2013年12月4日 優(yōu)先權(quán)日:2013年12月4日
【發(fā)明者】不公告發(fā)明人 申請(qǐng)人:康江科技(北京)有限責(zé)任公司