一種局部分塊的一類支持向量數(shù)據(jù)描述方法
【專利摘要】一種局部分塊的一類支持向量數(shù)據(jù)描述方法,通過局部分塊和局部樣本重構(gòu),使異常數(shù)據(jù)檢測方法能夠捕捉數(shù)據(jù)的全局幾何結(jié)構(gòu),而且具備揭示數(shù)據(jù)局部幾何結(jié)構(gòu)信息的能力,具有較好監(jiān)測異常數(shù)據(jù)的性能優(yōu)勢。
【專利說明】一種局部分塊的一類支持向量數(shù)據(jù)描述方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)異常檢測領(lǐng)域,尤其涉及一種局部分塊的一類支持向量數(shù)據(jù)描述方法。
【背景技術(shù)】
[0002]現(xiàn)有通過對正常樣本數(shù)據(jù)的學(xué)習(xí)進而獲得其特征屬性的過程稱為異常檢測,隸屬于一類分類問題。在許多應(yīng)用領(lǐng)域,如假幣識別,醫(yī)療診斷,機器故障診斷,生物發(fā)酵過程異常監(jiān)測,通信領(lǐng)域輻射源個體識別等,獲得異常數(shù)據(jù)的可能性很小,且獲取的過程需要花費大量的人力和物力。因此,異常檢測在近幾十年里得到了廣泛關(guān)注。
[0003]一類支持向量數(shù)據(jù)描述的異常檢測方法一直得到較大關(guān)注。許多學(xué)者提出了諸多改進版本,如小球體大間隔方法、多球支持向量數(shù)據(jù)描述方法等。上述異常檢測方法在構(gòu)建數(shù)學(xué)模型時,僅僅考慮到數(shù)據(jù)的全局幾何結(jié)構(gòu),而忽略了數(shù)據(jù)的局部幾何結(jié)構(gòu),導(dǎo)致隱藏在局部結(jié)構(gòu)中的信息丟失,降低了上述方法在異常數(shù)據(jù)檢測中的識別精度。
【發(fā)明內(nèi)容】
[0004]本發(fā)明為了解決現(xiàn)有技術(shù)問題,既考慮到數(shù)據(jù)的全局幾何結(jié)構(gòu),也考慮到數(shù)據(jù)的局部幾何結(jié)構(gòu),設(shè)計一種實現(xiàn)有效的異常數(shù)據(jù)檢測的局部分塊的一類支持向量數(shù)據(jù)描述方法。
[0005]本發(fā)明的技術(shù)方案是:一種局部分塊的一類支持向量數(shù)據(jù)描述方法,包括如下步驟:
[0006]步驟1:對樣本集X= (x1;-,xN)進行局部分塊,得到各個局部分塊Pi (i = Ir..,N),具體方法為:把Xi對應(yīng)最近鄰個數(shù)K的最近鄰樣本集
【權(quán)利要求】
1.一種局部分塊的一類支持向量數(shù)據(jù)描述方法,其特征在于:包括如下步驟: 步驟1:對樣本集X= (X1,…,XN)進行局部分塊,得到各個局部分塊Pi(i = 1,…,N),具體方法為:把Xi對應(yīng)最近鄰個數(shù)K的最近鄰樣本集
2.根據(jù)權(quán)利要求1所述的一種局部分塊的一類支持向量數(shù)據(jù)描述方法,其特征在于:步驟I中的最近鄰個數(shù)K從網(wǎng)格{2,3,…,14}中選擇。
3.根據(jù)權(quán)利要求1所述的一種局部分塊的一類支持向量數(shù)據(jù)描述方法,其特征在于:步驟2中的熱核參數(shù)h從網(wǎng)格表{2_14,2_13,…,213,214}中選擇。
4.根據(jù)權(quán)利要求1所述的一種局部分塊的一類支持向量數(shù)據(jù)描述方法,其特征在于:步驟3中的核函數(shù)k(.,.)選為高斯核函數(shù)
k (Xi, Xj) = exp (-1 I X1-Xj I 12/2 σ 2) 其中核帶寬參數(shù) σ =2-003=(-4.5,-4.0, -,4.0,4.5}, σ^是樣本數(shù)據(jù)平均2范數(shù)的平方根。
【文檔編號】G06F19/00GK103870682SQ201410071393
【公開日】2014年6月18日 申請日期:2014年2月28日 優(yōu)先權(quán)日:2014年2月28日
【發(fā)明者】蔣云良, 胡文軍, 王培良, 陶劍文, 樓俊鋼, 皋軍 申請人:湖州師范學(xué)院