亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于流形距離分析的視覺對象識別方法和裝置的制作方法

文檔序號:6471054閱讀:238來源:國知局
專利名稱:一種基于流形距離分析的視覺對象識別方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及視覺對象識別領(lǐng)域,特別是涉及一種基于流形距離分析的視覺 對象識別方法和裝置。
背景技術(shù)
模式識別是一種從大量信息和數(shù)據(jù)出發(fā),在專家經(jīng)驗和已有認(rèn)識的基礎(chǔ) 上,利用計算機和數(shù)學(xué)推理的方法對形狀、模式、曲線、數(shù)字、字符格式和圖 形自動完成識別的過程。視覺對象識別作為模式識別的主要應(yīng)用領(lǐng)域之一,在 諸如人臉識別、身份識別等方面正發(fā)揮著越來越重要的作用。
在^L覺對象識別領(lǐng)域,通常關(guān)注的對象都^皮從少量的樣本中進行訓(xùn)練。隨 著視頻攝像頭及大容量多媒體數(shù)據(jù)存儲技術(shù)的快速發(fā)展,用于對象模式識別的 數(shù)據(jù)量也在不斷增長,從而用于訓(xùn)練的對象的圖像數(shù)量也變得很大。在這種情 況下,視覺對象識別已經(jīng)發(fā)展成基于一個對象圖片集合的訓(xùn)練及在一個圖像庫 中進行尋找的狀況。媒體數(shù)據(jù)的巨大以及不同圖像數(shù)據(jù)之間的關(guān)系的復(fù)雜性增 加了視覺對象識別的難度,從而對視覺對象識別技術(shù)提出了新的挑戰(zhàn)。近年來 很多方法關(guān)注于應(yīng)用流形對視覺對象集合進行建模,通過對流形之間的距離比 較分析進行視覺對象識別。
流形是指抽象的彎曲空間中的一個超曲面,它在局部具有歐氏幾何結(jié)構(gòu)。 流形中的一個點可以用可變參數(shù)的一組特定值來表示,而所有的這些點的全體 構(gòu)成流形本身,可變參數(shù)稱為流形的坐標(biāo)。通常,流形是由高維數(shù)據(jù)組成的高 維空間中的圖形,將高維的流形降低維數(shù)得到的低維數(shù)據(jù)稱作流形的子空間, 流形中的點就是高維空間中的點。如果把單個圖像樣本看作流形中的一個點, 那么流形的子空間就是由流形的部分樣本組成的具有局部線性特征的部分。在 視覺對象識別中,識別的勤出是視覺對象的相似度, 一種簡單的相似度可用區(qū) 域特征空間中的距離來定義。具體到流形,就是用流形之間的距離來定義相似
度,流形之間的距離越小,相似度就越高;距離越大,相似度越低。將被檢索
的對象圖片集合看作一個流形,將用于檢索的對象圖片集合視為另外的流形, 則視覺對象識別可被認(rèn)為是找出多個流形之間相似度最高的目標(biāo)對象的過程。
美國電氣及電子工程師學(xué)會計算機視覺及模式識別國際會議2008年會論 文集(In Proceedings of IEEE International Conference on Computer Vision and Pattern Recognition 2008 )中的名為"流形距離在基于圖像集的人臉識別中的應(yīng) 用"(Manifold-Manifold Distance With Application to Face Recognition based on Image Set)的論文公布了一種最新的流形距離分析方法,該方法通過定義流形 中點和點的距離,點和子空間之間的距離,子空間和子空間之間的距離以及點 和流形之間的距離,從而得到流形和流形之間的距離,最后基于流形距離分析 識別視覺對象。該方法對媒體數(shù)據(jù)具有較高的敏感性,可以有效處理大量、復(fù) 雜的視覺對象媒體數(shù)據(jù)。但是,該方法提供的流形距離分析方法只關(guān)注兩個流 形之間最相近部分的距離,且將其做為通用的流形距離。這樣做雖然簡化了流 形距離計算,但因為,流形之間最相近部分的距離往往對噪聲數(shù)據(jù)非常敏感, 當(dāng)兩個流形中由于噪聲數(shù)據(jù)的影響使得其具有較近的子空間時,則流形距離計 算分析容易產(chǎn)生錯誤的結(jié)果,從而導(dǎo)致視覺對象的誤識別。
總之,需要本領(lǐng)域技術(shù)人員迫切解決的一個技術(shù)問題就是如何能夠有效 降低流形距離分析過程中對噪聲數(shù)據(jù)的敏感程度,提高視覺對象識別率。

發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種基于流形距離分析的視覺對象識 別方法和裝置,能夠有效降低流形距離分析過程中對噪聲數(shù)據(jù)的敏感程度,提 高一見覺對象識別率。
為了解決上述問題,本發(fā)明實施例提供了一種基于流形距離分析的視覺對 象識別方法,包括
依據(jù)待識別視覺對象數(shù)據(jù)構(gòu)造一個非線性的待識別對象流形,以及,依據(jù) 已知視覺對象數(shù)據(jù)構(gòu)造一個或多個非線性的已知對象流形;
將所述待識別對象流形和已知對象流形從高維降維到低維的子空間;
提取所述待識別對象流形每一個子空間的特征數(shù)據(jù),以及,所述已知對象
流形每一個子空間的特征數(shù)據(jù);
計算所述待識別對象流形每一個子空間與已知對象流形每一個子空間的 距離,進而獲得所述待識別對象流形和已知對象流形的距離;
當(dāng)所述待識別對象流形和已知對象流形的距離滿足識別條件時,則將所述 已知對象流形對應(yīng)的對象確定為待視別視覺對象。
優(yōu)選的,所述將流形從高維降維到低維的子空間為通過應(yīng)用局部線性嵌入 方法進行降維。
優(yōu)選的,所述每一個子空間的特征數(shù)據(jù)為每一個子空間的標(biāo)準(zhǔn)正交基。 優(yōu)選的,所述待識別對象流形每一個子空間與已知對象流形每一個子空間
的距離為所述子空間的標(biāo)準(zhǔn)正交基之間的距離。
優(yōu)選的,所述待識別對象流形和已知對象流形的距離為基于子空間的距離
的豪斯多夫距離。
相應(yīng)的,本發(fā)明實施例還提供了一種基于流形距離分析的視覺對象識別裝 置,包括
流形構(gòu)造模塊,用于依據(jù)待識別視覺對象數(shù)據(jù)構(gòu)造一個非線性的待識別對 象流形,以及,依據(jù)已知視覺對象數(shù)據(jù)構(gòu)造一個或多個非線性的已知對象流形;
子空間構(gòu)造模塊,用于將所述待識別對象流形和已知對象流形從高維降維 到低維的子空間;
特征數(shù)據(jù)提取模塊,用于提取所述待識別對象流形每一個子空間的特征數(shù) 據(jù),以及,所述已知對象流形每一個子空間的特征數(shù)據(jù);
距離計算模塊,用于計算所述待識別對象流形每一個子空間與已知對象流 形每一個子空間的距離,進而獲得所述待識別對象流形和已知對象流形的距
離;
識別條件判斷模塊,用于判斷所述待識別對象流形和已知對象流形的距離
是否滿足識別條件;
對象識別模塊,用于當(dāng)識別條件判斷模塊的結(jié)果為是時,則將所述已知對
象流形對應(yīng)的對象確定為待視別視覺對象。優(yōu)選的,所述距離計算模塊進一步包括子空間距離計算子模塊,用于計算所述待識別對象流形每一個子空間與已 知對象流形每一個子空間的距離;流形距離計算子模塊,用于依據(jù)子空間距離計算子模塊獲得的子空間距 離,計算待識別對象流形和已知對象流形的距離。優(yōu)選的,所述將流形從高維降維到低維的子空間為通過應(yīng)用局部線性嵌入 方法進行降維。優(yōu)選的,所述每一個子空間的特征數(shù)據(jù)為每一個子空間的標(biāo)準(zhǔn)正交基。 優(yōu)選的,所述待識別對象流形每一個子空間與已知對象流形每一個子空間的距離為所述子空間的標(biāo)準(zhǔn)正交基之間的距離。優(yōu)選的,所述待識別對象流形和已知對象流形的距離為基于子空間的距離的豪斯多夫距離。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點首先,本發(fā)明對待識別對象流形和已知對象流形的所有子空間的距離進行 了比較分析,綜合考慮了流形之間的整體位置關(guān)系,因此對噪聲數(shù)據(jù)不敏感, 在存在一定噪聲的情況下仍能獲得較好的效果,而且對流形之間距離的比較分 析更加有效。其次,本發(fā)明通過計算每一個子空間的標(biāo)準(zhǔn)正交基提取該子空間的特征數(shù) 據(jù),進而計算子空間之間的距離,與其它子空間距離計算方法相比,如主成分 角(Principal angels)法只適用于兩個子空間維數(shù)相同情況下的距離計算,該 方法即使兩個子空間維數(shù)不相等,仍然可以有效計算子空間之間的距離,且使 用標(biāo)準(zhǔn)正交基提取子空間的特征數(shù)據(jù)計算方法簡便,計算復(fù)雜度低,設(shè)計簡單, 易于實現(xiàn)。


圖l是本發(fā)明的一種基于流形距離分析的視覺對象識別方法實施例1的步
驟流程圖;圖2是本發(fā)明的一種基于流形距離分析的視覺對象識別方法實施例2的步 驟流程圖;圖3是本發(fā)明的一種基于流形距離分析的視覺對象識別裝置實施例的結(jié) 構(gòu)框圖;圖4是本發(fā)明應(yīng)用圖2所示的裝置實施例進行一見覺對象識別的步驟流程圖。
具體實施方式
為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實施方式
對本發(fā)明作進一步詳細(xì)的說明。本發(fā)明實施例的核心構(gòu)思之一在于,通過對待識別對象流形和已知對象流 形的所有子空間的距離進行比較分析,綜合考慮流形之間的整體位置關(guān)系,使 視覺對象識別過程對噪聲數(shù)據(jù)不敏感,取得較好的識別效果。參考圖1,示出了本發(fā)明一種基于流形距離分析的視覺對象識別方法實施 例l的步驟流程圖,具體可以包括以下步驟步驟101:依據(jù)待識別視覺對象數(shù)據(jù)構(gòu)造一個非線性的待識別對象流形, 依據(jù)已知視覺對象數(shù)據(jù)構(gòu)造一個或多個非線性的已知對象流形;流形是現(xiàn)代數(shù)學(xué)的概念,在實際應(yīng)用中,流形可以視為近看起來像歐氏空 間或其他相對簡單的空間的物體。例如人們曾經(jīng)以為地球是平坦的,因為我 們相對于地^M艮小,這是一個可以理解的,支象。所以, 一個理想的數(shù)學(xué)上的J求 在足夠小的區(qū)域也象一個線性的平面,這使它成為 一個局部線性的流形。在視覺對象識別中,通常一個對象的一組相關(guān)圖像被^L為一個流形。這是 因為,同一個對象在不同距離、不同方向或不同姿態(tài)和光照強度下,能夠形成 多種不同的圖像。 一個對象所有圖像的集合可以看做是以位置、尺度、姿態(tài)、 光照等為參數(shù)的一個高維空間流形,且這組圖像因為都是關(guān)于同 一個對象的因 而具有較強的相關(guān)性。如果每一個像素均對應(yīng)于空間中的一維,那么一幅圖像 就可以看做高維圖像抽象空間中的 一個點, 一個對象在不同方向上所有圖像的
集合就是圖像空間中的一個連續(xù)流形。因此,在本實施例中,可以以一組同一待識別視覺對象的相關(guān)圖像構(gòu)造待識別對象流形;而以可供用來識別的其他一組或多組已知視覺對象的相關(guān)圖像構(gòu)造一個或多個非線性的已知對象流形。需要說明的是, 一個流形可以以不同方式構(gòu)造,如圖集、貼補、函數(shù)的零 點集等,在應(yīng)用時,本領(lǐng)域技術(shù)人員可根據(jù)需要選擇合適的方法,本發(fā)明無須 對此作出限制。步驟102:將所述待識別對象流形和已知對象流形從高維降維到低維的子 空間;在視覺對象識別過程中,往往面臨龐大的高維數(shù)據(jù)量。這些高維數(shù)據(jù)一方 面提供了有關(guān)描述對象的極其豐富、詳細(xì)的信息,但另一方面,這些數(shù)據(jù)通常 包含許多冗余。在通常情況下,首先將數(shù)據(jù)的維數(shù)降低到一個合理的大小,同 時盡可能多的保留原始的信息,然后再對降維后的數(shù)據(jù)進行處理是一個行之有 效的方法。但要在保證數(shù)據(jù)信息足夠完整的條件下合理地約簡數(shù)據(jù)集,是一個 嚴(yán)峻的挑戰(zhàn)。以往大多使用線性方法(如維數(shù)約簡中的線性主成分分析(PCA) 等),通過特征的線性組合來降維,其本質(zhì)是把數(shù)據(jù)投影到線性子空間,這種 方法相對筒單且容易計算。但是,由于視覺對象識別中的流形是非線性的,因 此線性方法不能有效地處理龐大的高維非線性流形的數(shù)據(jù)。局部線性嵌入法 (Locally Linear Embedding, LLE )是多種非線性降維方法中的一種,該方法 主要利用局部的線性來逼近全局的非線性,保持局部的幾何結(jié)構(gòu)不變,通過相 互重疊的局部鄰域來提供整體的信息,從而保持整體的幾何性質(zhì)。LLE方法采 用由N個D維向量組成的矩陣XoxN作為輸入,輸出則是一個由N個d維向量 (cK〈D)組成的矩陣YdxN。矩陣Y的第k列對應(yīng)的是矩陣X中的第k列。因為LLE算法能夠計算出較好的低維線性子空間,本實施例使用此方法 將所述待識別對象流形和已知對象流形從高維降維到低維的子空間。當(dāng)然,本 領(lǐng)域技術(shù)人員也可以采用其它的非線性降維方法如保距映射法、拉普拉斯特征 映射法等對高維流形進行降維,本發(fā)明無須對此作出限制。步驟103:提取所述待識別對象流形每一個子空間的特征數(shù)據(jù),以及所述已知對象流形每一個子空間的特征數(shù)據(jù);一個子空間的特征數(shù)據(jù)較好地反映了 一個子空間的特征,可以作為這個子 空間的代表性數(shù)據(jù)。本實施例通過計算每一個子空間的標(biāo)準(zhǔn)正交基的方式提取 所述待識別對象流形每一個子空間的特征數(shù)據(jù)和已知對象流形每一個子空間 的特征數(shù)據(jù)。當(dāng)然,本領(lǐng)域技術(shù)人員也可以根據(jù)需要采用其它適用的方式。步驟104:計算所述待識別對象流形每一個子空間與已知對象流形每一個 子空間的距離;本實施例依據(jù)步驟103中得到的每一個子空間的標(biāo)準(zhǔn)正交基計算子空間 的距離。以待識別對象流形的一個子空間和一個已知對象流形的一個子空間為 例,4叚設(shè)待識別對象流形M,和已知對象流形M2的兩個子空間分別為t/和r , 其中C/為9^中的m維子空間,r為f中的n維子空間,f/的標(biāo)準(zhǔn)正交基為 A,"2,...,^ , r的標(biāo)準(zhǔn)正交基為v,,v^...,、,則子空間和f之間的距離為它們的 標(biāo)準(zhǔn)正交基之間的距離,其計算方法為若已知對象流形為多個,可采用相同方法計算待識別對象流形和不同已知 對象流形子空間之間的距離。需要說明的是,本領(lǐng)域技術(shù)人員可采用其它方法計算子空間之間的距離, 如核方法,本發(fā)明無須對此作出限制。步驟105:依據(jù)所述待識別對象流形每一個子空間與已知對象流形每一個 子空間的距離,獲得待識別對象流形和已知對象流形的距離;本步驟以d(C/p, ^ )表示由步驟104計算出的待識別對象流形的子空間與 已知對象流形m2的子空間的距離,其中和&分別是來自所述m,和m2兩個 流型的第;?個和第《個子空間,應(yīng)用豪斯多夫(Hausdorff)距離分析方法對流 型M^口M2進行距離計算。Hausdorff距離是一種定義于兩個點集上的最大最小(max-min)距離,給定 有限的兩個點集A和B, A和B之間的Hausdorff距離定義為
式中,<formula>formula see original document page 11</formula>h(A,B)稱有向Hausdorff距離。如果/^,"=^,則每一個」中的點離5中 至少一個點的距離不大于A而且對于X中某些(至少一個)點來說,這個距 離恰好是d,這些點就是"最不匹配點"。所以Hausdorff距離表征了兩個點集 之間的最不相似程度,把它作為相似性度量必須使它最小化。本實施例使用Hausdorff距離分析方法,以子空間距離取代點集距離,計 算所述M,和M2兩個流型的距離,具體方法如下D(M, , M,) = max min 4"丄)待識別對象流形M,和其它已知對象流形M,的距離計算可依照上述方法進 行。其中,t的取值范圍為從2到n+l, n為已知對象流形的個數(shù)。本領(lǐng)域技術(shù)人員也可根據(jù)其熟悉的其它方法計算流形之間的距離,本發(fā)明 無須對此作出限制。步驟106:判斷所述待識別對象流形和已知對象流形的距離是否滿足識別 條件,若是,則將滿足條件的已知對象流形對應(yīng)的對象確定為待識別視覺對象; 若否,則已知對象流形對應(yīng)的對象不為待識別視覺對象。本實施例以流形之間的距離作為度量流形相似度的標(biāo)準(zhǔn),兩個流形之間距 離越小則相似度越高;反之,距離越大,相似度越低。當(dāng)相似度滿足一定的條 件,即流形之間的距離符合一定的識別條件時,則認(rèn)為已知對象流形與待識別 對象流形相似,已知對象流形對應(yīng)的對象為待識別視覺對象;若否,則已知對 象流形對應(yīng)的對象不為待識別視覺對象。其中,識別條件可根據(jù)實際需要情況 由本領(lǐng)域技術(shù)人員合理設(shè)置,本發(fā)明無須對此作出限制。需要說明的是,本方法實施例為了簡單描述,將其表述為一系列的動 作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序 的限制,因為依據(jù)本發(fā)明,某些步驟可以采用其他順序或者同時進行。其 次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實施例均屬于優(yōu)選實 施例,所涉及的動作和模塊并不 一 定是本發(fā)明所必須的。
參考圖2,示出了本發(fā)明的一種基于流形距離分析的視覺對象識別方法實施例2的步驟流程圖,該實施例將本發(fā)明的視覺對象識別方法應(yīng)用于CMU Mobo數(shù)據(jù)庫進行人臉識別。CMU(Carnegie Mellon University)的MoBo( Motion of Body)數(shù)據(jù)庫是CMU大學(xué)機器人研究所提供的用于人臉識別研究的數(shù)據(jù) 庫,該數(shù)據(jù)庫包含了 24個對象的96段一見頻序列,每個視頻序列包含300幀圖 像。每個人臉圖像的大小均為30x30。對于每個人臉對象,應(yīng)用其中一個作為 檢索對象,其他的所有數(shù)據(jù)作為測試數(shù)據(jù)。
本實施例具體可以包括以下步驟
步驟201:將與待識別人臉的有關(guān)的一組相關(guān)圖像數(shù)據(jù)構(gòu)造成一個非線性 的待識別人臉流形,其它每組相關(guān)人臉數(shù)據(jù)構(gòu)造成多個非線性的已知人臉流 形;
步驟202:使用LLE方法將所述待識別人臉流形和已知人臉流形從高維降 維到低維的子空間;
步驟203:計算所述待識別人臉流形每一個子空間的標(biāo)準(zhǔn)正交基,以及所 述已知人臉流形每一個子空間的標(biāo)準(zhǔn)正交基;
本步驟通過計算每一個子空間的標(biāo)準(zhǔn)正交基提取它的特征數(shù)據(jù)。
步驟204:計算待識別人臉流形每一個子空間與已知人臉流形每一個子空 間的標(biāo)準(zhǔn)正交基之間的距離;
計算方法為<formula>formula see original document page 12</formula>
其中d(Up, Vq)表示待識別人臉流形的子空間與某個已知人臉流形的子空 間的距離,其中Up和Vq分別是來自所述待識別人臉流形和已知人臉流型的第p 個和第q個子空間,Up為W中的m維子空間,Vq為9^中的n維子空間,Up的 標(biāo)準(zhǔn)正交基為u1,u2,...,um , Vq的標(biāo)準(zhǔn)正交基為v1,V2,…,vn 。步驟205:依據(jù)所述待識別人臉流形每一個子空間與已知人臉流形每一個 子空間的距離,獲得待識別人臉流形和已知人臉流形的Hausdorff距離;
應(yīng)用Hausdorf距離分析方法,以子空間的距離取代點集距離,計算流型之間的Hausdorff距離,具體方法如下D(M"M,—max-min4"",K) , H2,…,n+1)其中,t的取值范圍為從2到n+l, n為已知對象流形的個數(shù)。 步驟206:判斷所述待識別人臉流形和已知人臉流形的Hausdorff距離是 否滿足識別條件,若是,則將滿足條件的已知人臉流形對應(yīng)的人臉確定為待識 別人臉對象;若否,則已知人臉流形對應(yīng)的人臉不為待識別人臉對象。本實施例應(yīng)用于CMU MoBo數(shù)據(jù)庫人臉識別試驗的結(jié)果及與傳統(tǒng)人臉識 別算法的比較如下表所示本發(fā)明的方法EigenfaceFisherface識別率89.3%80.5%86.7%可以看出,本實施例在人臉識別的平均識別率上,與傳統(tǒng)方法相比,能取 得更好的效果。需要說明的是,本實施例描述的是實施例1的視覺對象識別方法在CMU MoBo數(shù)據(jù)庫中的具體應(yīng)用,因此描述較為筒略,相關(guān)部分參見實施例1即可。參考圖3,示出了本發(fā)明的一種基于流形距離分析的視覺對象識別裝置 實施例的結(jié)構(gòu)框圖,可以包括流形構(gòu)造模塊301,用于依據(jù)待識別視覺對象數(shù)據(jù)構(gòu)造一個非線性的待識 別對象流形,以及,依據(jù)已知視覺對象數(shù)據(jù)構(gòu)造一個或多個非線性的已知對象 流形;子空間構(gòu)造模塊302,用于將所述待識別對象流形和已知對象流形從高維 降維到^[氐維的子空間;優(yōu)選的,本實施例通過應(yīng)用局部線性嵌入方法對流形進行降維。 特征數(shù)據(jù)提取模塊303,用于提取所述待識別對象流形每一個子空間的特 征數(shù)據(jù),以及,所述已知對象流形每一個子空間的特征數(shù)據(jù);優(yōu)選的,所述每一個子空間的特征數(shù)據(jù)為每一個子空間的標(biāo)準(zhǔn)正交基。 距離計算模塊304,用于計算所述待識別對象流形每一個子空間與已知對
象流形每一個子空間的距離,并獲得所述待識別對象流形和已知對象流形的距離;優(yōu)選的,所述待識別對象流形每一個子空間與已知對象流形每一個子空間 的距離為所述子空間的標(biāo)準(zhǔn)正交基之間的距離。優(yōu)選的,所述待識別對象流形和已知對象流形的距離為基于子空間的距離 的豪斯多夫距離。識別條件判斷模塊305,用于判斷所述待識別對象流形和已知對象流形的距離是否滿足識別條件;對象識別模塊306,用于如果識別條件判斷模塊的結(jié)果為是,則將所述已 知對象流形對應(yīng)的對象確定為纟寺一見別纟見覺對象。優(yōu)選的,距離計算模塊304還可以進一步包括子空間距離計算子模塊3041,用于計算所述待識別對象流形每一個子空 間與已知對象流形每一個子空間的距離;流形距離計算子模塊3042,用于依據(jù)子空間距離計算子模塊獲得的子空 間距離,計算待識別對象流形和已知對象流形的距離。參考圖4,示出了本發(fā)明應(yīng)用圖3所示的裝置實施例進行視覺對象識別 的步驟流程圖,具體可以包括以下步驟步驟401:流形構(gòu)造模塊依據(jù)待識別視覺對象數(shù)據(jù)構(gòu)造一個非線性的待識 別對象流形,依據(jù)已知視覺對象數(shù)據(jù)構(gòu)造一個或多個非線性的已知對象流形;流形構(gòu)造模塊依據(jù)不同對象的相關(guān)圖像構(gòu)造不同的流形。步驟402:子空間構(gòu)造模塊將所述待識別對象流形和已知對象流形從高維 降維到低維的子空間;本實施例中,子空間構(gòu)造^t塊應(yīng)用局部線性嵌入方法對流形進^f亍降維,將 流形從高維降維到低維的子空間。本領(lǐng)域技術(shù)人員也可根據(jù)實際需要采用其它 的降維方法,本發(fā)明無須對此作出限制。步驟403:特征數(shù)據(jù)提取模塊提取所述待識別對象流形每一個子空間的特 征數(shù)據(jù),以及已知對象流形每一個子空間的特征數(shù)據(jù);
本實施例的特征數(shù)據(jù)提取模塊通過計算每一個子空間的標(biāo)準(zhǔn)正交基提取 子空間的特征數(shù)據(jù),本領(lǐng)域技術(shù)人員也可根據(jù)情況使用其它方法提取子空間的 特征數(shù)據(jù)。步驟404:距離計算模塊的子空間距離計算子模塊計算所述待識別對象流 形每一個子空間與已知對象流形每一個子空間的距離;子空間距離計算子模塊依據(jù)特征數(shù)據(jù)提取模塊計算得到的子空間的標(biāo)準(zhǔn) 正交基計算所述待識別對象流形每一個子空間與已知對象流形每一個子空間 的的距離,并交給流形距離計算子模塊處理,具體計算方式可以為其中,d(t/p,^)表示待識別對象流形的子空間與某一 已知對象流形的子空 間的距離,其中C/p和^;分別是來自所述待識別對象流形和已知對象流型的第p 個和第《個子空間, 為5^中的m維子空間,^為9^中的n維子空間,^的 標(biāo)準(zhǔn)正交基為"1,"2,…,"m ,^的標(biāo)準(zhǔn)正叉基為V"V2,…,V"。步驟405:距離計算模塊的流形距離計算子模塊依據(jù)子空間距離計算子模 塊獲得的子空間距離,計算待識別對象流形和已知對象流形的距離;本實施例中,流形距離計算子才莫塊應(yīng)用Hausdorf距離分析方法,以子空 間距離取代點集距離,計算流型之間的距離,具體方法如下其中,t的取值范圍為從2到n+l, n為已知對象流形的個數(shù),d(^,f;)為 子空間之間的距離。步驟406:識別條件判斷^t塊判斷所述待識別對象流形和已知對象流形的 距離是否滿足識別條件;識別條件判斷模塊判斷流形距離計算子模塊的計算結(jié)果D(M,,M,)是否滿 足識別條件。步驟407:當(dāng)識別條件判斷模塊的結(jié)果為是時,對象識別模塊將滿足條件 的已知對象流形對應(yīng)的對象識別為待識別視覺對象;當(dāng)識別條件判斷;f莫塊的結(jié)Z)(MpM,卜"力電,、),f(2,…,n. 果為否時,對象識別模塊識別已知對象流形對應(yīng)的對象不為待識別視覺對象。由于圖4所示的實施例都可以對應(yīng)適用于前述的;f見覺對象識別方法實 施例中,所以描述專交為簡略,未詳盡之處可以參見本說明書前面相應(yīng)部分 的描述。以上對本發(fā)明所提供的一種基于流形距離分析的視覺對象識別方法和裝 置進行了詳細(xì)介紹,文中應(yīng)用了具體個例對本發(fā)明的核心思想及實施方式進行 了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同 時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實施方式
及應(yīng)用 范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
權(quán)利要求
1、一種基于流形距離分析的視覺對象識別方法,其特征在于,包括以下步驟依據(jù)待識別視覺對象數(shù)據(jù)構(gòu)造一個非線性的待識別對象流形,以及,依據(jù)已知視覺對象數(shù)據(jù)構(gòu)造一個或多個非線性的已知對象流形;將所述待識別對象流形和已知對象流形從高維降維到低維的子空間;提取所述待識別對象流形每一個子空間的特征數(shù)據(jù),以及,所述已知對象流形每一個子空間的特征數(shù)據(jù);計算所述待識別對象流形每一個子空間與已知對象流形每一個子空間的距離,進而獲得所述待識別對象流形和已知對象流形的距離;當(dāng)所述待識別對象流形和已知對象流形的距離滿足識別條件時,則將所述已知對象流形對應(yīng)的對象確定為待視別視覺對象。
2、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將流形從高維降維到 低維的子空間為通過應(yīng)用局部線性嵌入方法進行降維。
3、 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述每一個子空間的 特征數(shù)據(jù)為每一個子空間的標(biāo)準(zhǔn)正交基。
4、 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述待識別對象流形每一 個子空間與已知對象流形每一個子空間的距離為所述子空間的標(biāo)準(zhǔn)正交基之 間的距離。
5、 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述待識別對象流形和已 知對象流形的距離為基于子空間的距離的豪斯多夫距離。
6、 一種基于流形距離分析的視覺對象識別裝置,其特征在于,包括 流形構(gòu)造模塊,用于依據(jù)待識別視覺對象數(shù)據(jù)構(gòu)造一個非線性的待識別對象流形,以及,依據(jù)已知視覺對象數(shù)據(jù)構(gòu)造一個或多個非線性的已知對象流形; 子空間構(gòu)造模塊,用于將所述待識別對象流形和已知對象流形從高維降維 到低維的子空間;特征數(shù)據(jù)提取模塊,用于提取所述待識別對象流形每一個子空間的特征數(shù) 據(jù),以及,所述已知對象流形每一個子空間的特征數(shù)據(jù);距離計算模塊,用于計算所述待識別對象流形每一個子空間與已知對象流 形每一個子空間的距離,進而獲得所述待識別對象流形和已知對象流形的距離;識別條件判斷模塊,用于判斷所述待識別對象流形和已知對象流形的距離是否滿足識別條件;對象識別模塊,用于當(dāng)識別條件判斷模塊的結(jié)果為是時,則將所述已知對 象流形對應(yīng)的對象確定為待視別視覺對象。
7、 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述距離計算模塊進一步 包括子空間距離計算子模塊,用于計算所述待識別對象流形每一個子空間與已 知對象流形每一個子空間的距離;流形距離計算子模塊,用于依據(jù)子空間距離計算子模塊獲得的子空間距 離,計算待識別對象流形和已知對象流形的距離。
8、 根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述將流形從高維降 維到低維的子空間為通過應(yīng)用局部線性嵌入方法進行降維。
9、 根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述每一個子空間的 特征數(shù)據(jù)為每一個子空間的標(biāo)準(zhǔn)正交基。
10、 根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述待識別對象流形 每一個子空間與已知對象流形每一個子空間的距離為所述子空間的標(biāo)準(zhǔn)正交 基之間的距離。
11、 根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述待識別對象流形 和已知對象流形的距離為基于子空間的距離的豪斯多夫距離。
全文摘要
本發(fā)明提供了一種基于流形距離分析的視覺對象識別方法,包括依據(jù)待識別視覺對象數(shù)據(jù)構(gòu)造待識別對象流形,依據(jù)已知視覺對象數(shù)據(jù)構(gòu)造已知對象流形;將所述待識別對象流形和已知對象流形降維到子空間;提取待識別對象流形和已知對象流形每一個子空間的特征數(shù)據(jù);計算子空間之間的距離,進而獲得待識別對象流形和已知對象流形的距離;當(dāng)所述待識別對象流形和已知對象流形的距離滿足識別條件時,則將所述已知對象流形對應(yīng)的對象確定為待識別視覺對象。本發(fā)明對待識別對象流形和已知對象流形的所有子空間的距離進行了比較分析,綜合考慮了流形之間的整體位置關(guān)系,因此對噪聲數(shù)據(jù)不敏感,有較好的視覺對象識別效果。
文檔編號G06K9/00GK101393608SQ20081022552
公開日2009年3月25日 申請日期2008年11月4日 優(yōu)先權(quán)日2008年11月4日
發(fā)明者戴瓊海, 謝旭東, 躍 高 申請人:清華大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1