一種基于稀疏感知的多流形鄰域點選擇方法
【專利摘要】本發(fā)明涉及一種基于稀疏感知的多流形鄰域點選擇方法。其技術方案是:本發(fā)明提出了基于稀疏感知的多流形鄰域點選擇方法,首先采用K近鄰方法確定任一樣本點Xi的局部鄰域點Xi1,Xi2,...,Xik,然后通過建立任一樣本點Xi與局部鄰域點Xi1,Xi2,...,Xik線性重構誤差在局部切空間投影的L1范數(shù)最小和線性重構L1范數(shù)最小的模型,得到線性重構系數(shù)Wij,確定多流形局鄰域點,實現(xiàn)與任一樣本點Xi分布在同一流形的局部多流形鄰域點的選擇。本發(fā)明能有效地從多流形分布數(shù)據(jù)中選擇與樣本點位于同一流形的多流形鄰域點。
【專利說明】ー種基于稀疏感知的多流形鄰域點選擇方法
[0001]所屬領域
[0002]本發(fā)明屬于多流形鄰域【技術領域】。具體涉及ー種基于稀疏感知的多流形鄰域點選擇方法。
【背景技術】
[0003]隨著流形學習方法的發(fā)展,基于多流形的聚類和分類方法成為當前機器學習領域的研究熱點,在iccv、ECCV、CVPR和NIPS等國際頂級會議和模式識別領域相關的國內(nèi)外期刊上不斷有新研究公開。在這些方法中,Wang利用局部切空間和K近鄰重新定義近鄰邊權值并進行譜聚類;后來,又提出一種基于歐式距離和切空間距離的組合距離來確定近鄰點的譜聚類方法。Gordberg提出了一種多流形半監(jiān)瞀學習方法,采用Hellinger距離作為近鄰關系的度量。Yang利用樣本的類別信息來劃分子圖,實現(xiàn)多流形判別學習。Lu提出基于流形距離的多流形判別學習方法應用于單個訓練樣本的人臉識別。這些方法實質(zhì)上還是以K近鄰或超球標準來確定近鄰關系。但是面對多流形數(shù)據(jù)時,通過K近鄰或超球標準確定的近鄰點極有可能分布于不同流形而不是同一流形上。因此基于K近鄰或超球標準的數(shù)據(jù)分析方法不具備充分學習多流形局部結構信息的能力,也極大地影響這些方法的應用效果。如何建立一種有效的多流形鄰域選擇方法是多流形學習方法及應用的難點和關鍵問題。
[0004]近年來稀疏感知理論的提出引起智能信息處理領域的普遍關注,形成了模式識別和機器學習領域新發(fā)展的契機。稀疏感知理論是利用信號本身的稀疏先驗信息建立起來并應用于信號獲取和重建的理論和方法。稀疏感知理論也為多流形學習中圖的構建提供參考,LI圖就是ー種基于稀疏表示的圖模型。在LI圖中,每ー個樣本點都由全部數(shù)據(jù)點進行線性表示,通過線性表示系數(shù)的LI范數(shù)最小化,從中選取線性表示系數(shù)非0的點作為近鄰點,設置近鄰邊權值為線性表示系數(shù)。LI圖是ー種全局線性的圖構建方法,也不能有效探測和學習樣本點局部結構信息特別是多流形鄰域信息。
[0005]綜上所述,關于多流形數(shù)據(jù)的多流形鄰域選擇,目前還沒有一種比較有效的方法。傳統(tǒng)K近鄰方法可能選取分布于不同流形上的數(shù)據(jù)點,而LI圖是ー個全局線性模型,所選取的近鄰點有可能分布于同一流形上,但是卻不能保證這些近鄰點是位于ー個流形局部,從而無法學習多流形的局部結構。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的在于提供ー種基于稀疏感知的多流形鄰域點的選擇方法,該方法能有效地從多流形分布數(shù)據(jù)中選擇與樣本點位于同一流形的多流形鄰域點。
[0007]為實現(xiàn)上述目的,本發(fā)明采用的技術方案的具體步驟是:
[0008]( I)確定任一樣本點Xi的局部鄰域點
[0009]計算任一樣本點Xi與其他樣本點之間的歐式距離,取歐式距離由小到大排列的前K個樣本點Xn,Xi2,...,Xik作為樣本點Xi的局部鄰域點。
[0010](2)從任ー樣本點Xi的局部鄰域點Xil, Xi2,...,Xik中選擇有限個樣本點作為任ー樣本點Xi的多流形鄰域點。
[0011]A.先將任一樣本點Xi通過局部鄰域點Xn,Xi2,...,Xik進行線性重構,再將所述線性重構的誤差投影到局部切空間,建立線性重構的誤差投影到局部切空間的LI范數(shù)最小模型
[0012]
【權利要求】
1.一種基于稀疏感知的多流形鄰域點選擇方法,其特征在于所述多流形鄰域點選擇方法的具體步驟是:(1)確定任一樣本點\的局部鄰域點計算任一樣本點Xi與其他樣本點之間的歐式距離,取歐式距離由小到大排列的前K個樣本點Xil, Xi2,...,Xik作為樣本點Xi的局部鄰域點;(2)從任一樣本點Xi的局部鄰域點Xil,Xi2,...,Xik中選擇有限個樣本點作為任一樣本點Xi的多流形鄰域點;A.先將任一樣本點Xi通過局部鄰域點Xil, Xi2,...,Xik進行線性重構,再將所述線性重構的誤差投影到局部切空間,建立線性重構的誤差投影到局部切空間的LI范數(shù)最小模型
2.根據(jù)權利要求1所述的基于稀疏感知的多流形鄰域點選擇方法,其特征在于所述的 K為不小于5的自然數(shù)。
【文檔編號】G06F17/16GK103530277SQ201310481695
【公開日】2014年1月22日 申請日期:2013年10月15日 優(yōu)先權日:2013年10月15日
【發(fā)明者】李波, 田貝貝, 黃德雙, 張曉龍 申請人:武漢科技大學