亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種球型分布數(shù)據(jù)專用線性二分類計算方法

文檔序號:6491745閱讀:431來源:國知局
一種球型分布數(shù)據(jù)專用線性二分類計算方法
【專利摘要】本發(fā)明屬于于模式識別與人工智能【技術(shù)領(lǐng)域】,具體涉及一種球型分布數(shù)據(jù)專用線性二分類計算方法。本發(fā)明的方法包括以下步驟:輸入球型分布數(shù)據(jù)及標(biāo)號集,設(shè)定變量初值、預(yù)設(shè)容忍度及初始海森矩陣;生成核矩陣;求解最小化問題;若有當(dāng)前目標(biāo)函數(shù)梯度的下降值小于預(yù)設(shè)的收斂容忍度,則步驟終止,得到分類結(jié)果;否則返回步驟三進(jìn)行下一次迭代。本發(fā)明的方法解決了現(xiàn)有線性二分類方法分類精度不高的技術(shù)問題;給出面向球型分布數(shù)據(jù)的核,有效實現(xiàn)球型分隔面到線性分隔面的映射,提升球型分布數(shù)據(jù)的線性二分類精度。
【專利說明】一種球型分布數(shù)據(jù)專用線性二分類計算方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于于模式識別與人工智能【技術(shù)領(lǐng)域】,具體涉及一種球型分布數(shù)據(jù)專用線性二分類計算方法。
【背景技術(shù)】
[0002]線性二分類是將目標(biāo)數(shù)據(jù)用線性函數(shù)加以分割的計算方法,是模式識別領(lǐng)域中的一類重要計算方法。在處理非線性分布數(shù)據(jù)時,由于數(shù)據(jù)分割面的非線性化,線性二分類算法往往需要先將數(shù)據(jù)映射到特征空間,使得數(shù)據(jù)在特種空間中線性可分后,再進(jìn)行分類處理。映射一般通過“核”來實現(xiàn)。核是影響線性二分類算法的重要指標(biāo),也是分類結(jié)果的主要誤差源,直接決定著分類效率以及分類精度。依據(jù)非線性數(shù)據(jù)的分布特性先驗知識,有針對性的設(shè)計專用核,對于提高線性二分類算法的效率及精度有著重要的實用意義和工程價值。
[0003]球型分布數(shù)據(jù)是指可被球面分割的數(shù)據(jù),是模式識別領(lǐng)域中需要處理的一類重要非線性分布數(shù)據(jù),常見于故障判斷、醫(yī)療診斷等問題。
[0004]現(xiàn)有線性二分類算法一般應(yīng)用多項式核、高斯核、Sigmoid核、向量核或頻譜核等處理球型分布數(shù)據(jù)。多項式核、高斯核與Sigmoid核屬通用性核,適用范圍廣泛,但對球型分布數(shù)據(jù)往往缺乏針對性,面臨維數(shù)災(zāi)難問題;向量核適用于具有較強關(guān)聯(lián)性數(shù)據(jù)的分類,如文本數(shù)據(jù),對隨機化的球型分布數(shù)據(jù)只能起到弱化的作用;頻譜核是面向結(jié)構(gòu)型數(shù)據(jù)而設(shè)計的,如字符串、鏈表、樹等,適用于具有較強結(jié)構(gòu)性的數(shù)據(jù)分類,在球型分布數(shù)據(jù)分類中只能作為一種補充方法。以上這幾類核雖然在某些應(yīng)用問題上都獲得了較好的分類效果,但在處理球型分布數(shù)據(jù)時,要么過于通用化,要么過于平凡化,難以實現(xiàn)球型分隔面到線性分隔面的有效映射,導(dǎo)致分類精度不高,給工程應(yīng)用帶來較大困難。因而亟需一種球型分布數(shù)據(jù)專用的線性二分類計算方法。

【發(fā)明內(nèi)容】

[0005]本發(fā)明要解決的技術(shù)問題為:提出一種球型分布數(shù)據(jù)專用線性二分類計算方法,給出面向球型分布數(shù)據(jù)的核,有效實現(xiàn)球型分隔面到線性分隔面的映射,提升球型分布數(shù)據(jù)的線性二分類精度。
[0006]本發(fā)明的技術(shù)方案如下所述:
[0007]—種球型分布數(shù)據(jù)專用線性二分類計算方法,包括以下步驟:
[0008]步驟一:輸入球型分布數(shù)據(jù)(X1,...,X1),及標(biāo)號集{y”..., Yil ,變量初值α。,預(yù)設(shè)容忍度ε,初始海森矩陣H ;1為球型分布數(shù)據(jù)個數(shù);
[0009]步驟二:遍歷Xi,i = 1,...,1,生成核矩陣1(,1(為方陣,矩陣元素
[0010]Ki; J = K (Xi, Xj) = Φ (Xi) τφ (Xj).[0011]其中,Φ為特征映射,i, j = I, 2,..., I ;
[0012]生成矩陣Q, Qi, j = Ki; J-YiYj ;[0013]步驟三:求解最小化問題
[0014]min aTQa-2eTa
[0015]s.t.yT α = 0, α ^ O,
[0016]其中,α= [ α j,..., α Jt, α ≥ O 表示 α ^ ≥ 0,i = 1,2,...,I ;y = [y”..., yj
T ;e為單位向量;
[0017]步驟四:若有當(dāng)前目標(biāo)函數(shù)梯度的下降值小于預(yù)設(shè)的收斂容忍度,則步驟終止,得到分類結(jié)果;否則返回步驟三進(jìn)行下一次迭代。
[0018]作為優(yōu)選方案,步驟一中,球型分布數(shù)據(jù)Xi e Rn,i = 1,...,l,yi e=I,..., I, Yi = +1表示數(shù)據(jù)Xi屬于正類,Yi = -1表示數(shù)據(jù)Xi屬于負(fù)類;初始變量值α。=[1,...]Τ,預(yù)設(shè)容忍度ε = 10_3,初始海森矩陣Hk = E0
[0019]步驟二中,Ki,」的具體計算方法可以為:
【權(quán)利要求】
1.一種球型分布數(shù)據(jù)專用線性二分類計算方法,其特征在于:包括以下步驟: 步驟一:輸入球型分布數(shù)據(jù){Xl,..., X1I ,及標(biāo)號集{yi,...,yj,變量初值α O,預(yù)設(shè)容忍度ε,初始海森矩陣H ;1為球型分布數(shù)據(jù)個數(shù); 步驟二:遍歷Xi,i = 1,...,1,生成核矩陣K,K為方陣,矩陣元素
Ki, j = K (Xi, Xj) = Φ (Xi) τφ (Xj).其中,Φ為特征映射,i,j = 1,2,...,I ;
生成矩陣Q,Qi,」=Ki; JyiYj ; 步驟二:求解最小化問題
2.根據(jù)權(quán)利要求1所述的球型分布數(shù)據(jù)專用線性二分類計算方法,其特征在于:步驟一中,球型分布數(shù)據(jù) Xi e Rn,i = 1,...,1,yi e {-1, +1}, i = I,..., I, Yi = +1 表示數(shù)據(jù)Xi屬于正類,Yi =-1表示數(shù)據(jù)Xi屬于負(fù)類;初始變量值[1,...1]τ,預(yù)設(shè)容忍度ε=10_3,初始海森矩陣Hk = E0
3.根據(jù)權(quán)利要求2所述的球型分布數(shù)據(jù)專用線性二分類計算方法,其特征在于:步驟二中,
4.根據(jù)權(quán)利要求3所述的球型分布數(shù)據(jù)專用線性二分類計算方法,其特征在于:步驟三中,求解最小化問題采用梯度下降方式迭代計算。
5.根據(jù)權(quán)利要求4所述的球型分布數(shù)據(jù)專用線性二分類計算方法,其特征在于:步驟三中,所述梯度下降方式迭代具體過程為: 在第k步迭代中,優(yōu)化目標(biāo)變量a,的更新方向為λ,,λ k通過線性規(guī)劃過程得到;更新步長為Pk,計算Pk要用到Hk值和gk值,gk為當(dāng)前目標(biāo)函數(shù)梯度值;更新α,后,計算Hk+1的值,用于下次迭代過程,E為單位矩陣,計算公式如下:
【文檔編號】G06F17/15GK103838705SQ201210488810
【公開日】2014年6月4日 申請日期:2012年11月26日 優(yōu)先權(quán)日:2012年11月26日
【發(fā)明者】賈磊 申請人:中國航天科工集團第三研究院第八三五七研究所
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1