基于樣本先驗(yàn)信息的支持向量機(jī)核函數(shù)選擇方法及應(yīng)用的制作方法
【專利摘要】本發(fā)明涉及一種基于樣本數(shù)據(jù)先驗(yàn)信息的支持向量機(jī)核函數(shù)選擇方法及應(yīng)用,尤其適用于實(shí)時(shí)在線的支持向量機(jī)模型預(yù)測(cè)控制場(chǎng)所。本發(fā)明包括如下步驟:輸入樣本數(shù)據(jù),其中Rn為n維數(shù)據(jù)空間,并對(duì)X進(jìn)行變換使數(shù)據(jù)的范數(shù)小于1;對(duì)給定樣本數(shù)據(jù)進(jìn)行超球體的數(shù)學(xué)描述以及確定超球體的重心O和半徑R;建立樣本分布能量熵函數(shù),并計(jì)算各樣本的能量熵;構(gòu)建樣本分布判別函數(shù)及計(jì)算其判別結(jié)果;根據(jù)其判別結(jié)果與核函數(shù)性質(zhì)(如黎曼度量、距離度量等)的相似性選擇核函數(shù)類型;合理確定樣本訓(xùn)練集和測(cè)試集后,SVM模型及參數(shù)優(yōu)化;輸出預(yù)測(cè)結(jié)果。其提高了SVM學(xué)習(xí)能力和泛化能力,并具有運(yùn)算速度快、非常適合實(shí)時(shí)在線SVM模型預(yù)測(cè)控制場(chǎng)所等特點(diǎn)。
【專利說(shuō)明】基于樣本先驗(yàn)信息的支持向量機(jī)核函數(shù)選擇方法及應(yīng)用
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于樣本數(shù)據(jù)先驗(yàn)信息的支持向量機(jī)核函數(shù)選擇方法及應(yīng)用,尤其適用于實(shí)時(shí)在線的支持向量機(jī)模型預(yù)測(cè)控制場(chǎng)所。
【背景技術(shù)】
[0002]支持向量機(jī)(Support Vector Machine, SVM)是20世紀(jì)90年代Vapnik基于統(tǒng)計(jì)學(xué)習(xí)理論提出的一種新的機(jī)器學(xué)習(xí)方法。與傳統(tǒng)統(tǒng)計(jì)學(xué)相比,支持向量機(jī)有完備的理論基礎(chǔ)和嚴(yán)格的理論體系,能夠解決有限樣本的學(xué)習(xí)問(wèn)題,具有很強(qiáng)的泛化能力。由于這一方法具有許多優(yōu)良特性,并在不少領(lǐng)域如模式識(shí)別、回歸估計(jì)、數(shù)據(jù)挖掘、生物信息學(xué)等領(lǐng)域均取得成功的應(yīng)用。SVM建立在結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則基礎(chǔ)之上,其核心思想之一是引入核函數(shù)技術(shù),巧妙地解決了在高維特征空間中計(jì)算的“維數(shù)災(zāi)難”等問(wèn)題。然而,不同的核函數(shù)所呈現(xiàn)出的特性各異,選擇不同的核函數(shù)會(huì)導(dǎo)致SVM的推廣性能有所不同。目前,如何針對(duì)具體問(wèn)題選擇(或構(gòu)造)合適的核函數(shù),缺乏相應(yīng)的理論指導(dǎo),存在很大的隨意性和局限性,也是SVM應(yīng)用領(lǐng)域遇到的一個(gè)重大難題。因此,構(gòu)建一種能充分挖掘給定具體問(wèn)題的樣本數(shù)據(jù)先驗(yàn)信息,以及結(jié)合核函數(shù)蘊(yùn)藏的度量特征進(jìn)行SVM核函數(shù)選擇機(jī)制,對(duì)于SVM技術(shù)的發(fā)展和核方法的完善有著積極的指導(dǎo)意義和實(shí)用價(jià)值。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的是提供一種基于樣本先驗(yàn)信息的支持向量機(jī)核函數(shù)選擇方法及應(yīng)用,從樣本數(shù)據(jù)先驗(yàn)信息出發(fā)構(gòu)建一種有監(jiān)督的SVM核函數(shù)選擇機(jī)制,完善SVM核函數(shù)選擇方法,有助于SVM學(xué)習(xí)能力和泛化能力的提高。
[0004]本發(fā)明的技術(shù)方案:一種基于樣本先驗(yàn)信息的支持向量機(jī)核函數(shù)選擇方法,包括如下步驟:
[0005]步驟1.輸入樣本數(shù)據(jù)尤=e iT,其中Rn為η維數(shù)據(jù)空間,并對(duì)X進(jìn)行變換使數(shù)據(jù)的范數(shù)小于I ;
[0006]步驟2.對(duì)給定樣本數(shù)據(jù)進(jìn)行超球體的數(shù)學(xué)描述以及確定超球體的重心O和半徑R;
[0007]步驟3.建立樣本分布能量熵函數(shù),并計(jì)算各樣本的能量熵;
[0008]步驟4.構(gòu)建樣本分布判別函數(shù)及計(jì)算其判別結(jié)果;
[0009]步驟5.根據(jù)其判別結(jié)果與核函數(shù)性質(zhì)(如黎曼度量、距離度量等)的相似性選擇核函數(shù)類型;
[0010]步驟6.合理確定樣本訓(xùn)練集和測(cè)試集后,SVM模型及參數(shù)優(yōu)化;
[0011]步驟7.輸出預(yù)測(cè)結(jié)果。
[0012]一種基于樣本先驗(yàn)信息的支持向量機(jī)核函數(shù)選擇方法在印度肝臟病人數(shù)據(jù)集、天平平衡測(cè)量數(shù)據(jù)集、澳大利亞的信用審批數(shù)據(jù)集、三連棋游戲結(jié)局?jǐn)?shù)據(jù)集得到應(yīng)用。
[0013]本發(fā)明構(gòu)建了一種基于樣本先驗(yàn)信息進(jìn)行SVM核函數(shù)選擇的機(jī)制,克服了傳統(tǒng)的支持向量機(jī)模型選擇方法中人為指定核函數(shù)類型而導(dǎo)致模型不能達(dá)到最優(yōu)性能的缺點(diǎn),提高了 SVM學(xué)習(xí)能力和泛化能力,并具有運(yùn)算速度快、非常適合實(shí)時(shí)在線SVM模型預(yù)測(cè)控制場(chǎng)所等特點(diǎn)。
【具體實(shí)施方式】
[0014]下面結(jié)合具體實(shí)例對(duì)本發(fā)明作進(jìn)一步說(shuō)明。
[0015]①所涉及的實(shí)例均來(lái)自UCI基準(zhǔn)庫(kù),且為帶標(biāo)簽的數(shù)據(jù);
[0016]②以具有全局特性的多項(xiàng)式核函數(shù)和局部特性的徑向基核函數(shù)為例進(jìn)行預(yù)測(cè)結(jié)果比較;
[0017]③實(shí)例中第i個(gè)樣本的能量熵函數(shù)取& =<,其中屯。為第i個(gè)樣本與重心O的歐氏距離;
[0018]④實(shí)例中樣本分布判別函數(shù)定義為α= +,式中α為閾值,I為樣本總數(shù),1*為樣
本中S,<丨/?2的個(gè)數(shù)。結(jié)合核函數(shù)所蘊(yùn)藏的度量特性,實(shí)例中取α =0.5為臨界點(diǎn)。當(dāng)計(jì)算
出α >0.5,則判斷該樣本數(shù)據(jù)呈局部分布特性;當(dāng)α <0.5,則判斷該樣本數(shù)據(jù)呈全局分布特性。
[0019]⑤訓(xùn)練集與測(cè)試集的數(shù)據(jù)樣本數(shù)量按照8:2比例予以隨機(jī)劃分;
[0020]⑥實(shí)例中SVM模型參數(shù)優(yōu)化均采取粒子群算法(PSO)進(jìn)行尋優(yōu);
[0021]⑦百分?jǐn)?shù)均為SVM模型輸出結(jié)果預(yù)測(cè)準(zhǔn)確率。
[0022]實(shí)例1:印度肝臟病人數(shù)據(jù)集(Indian Liver Patient Dataset)
[0023]A步驟:樣本共有579個(gè)數(shù)據(jù),維數(shù)為10。經(jīng)數(shù)據(jù)預(yù)處理后計(jì)算出超球體的重心O坐標(biāo)為(0.5058,0.0000,0.1073,0.1786,0.085,0.3473,0.1652,0.4493,0.5326,0.4500),R=0.4984, α =0.9048。
[0024]由此判斷該樣本數(shù)據(jù)呈局部分布特性,則選取具有局部特性的徑向基核函數(shù)為SVM核函數(shù)類型。
[0025]B步驟:按照已知樣本的80%作為訓(xùn)練集、20%作為測(cè)試集,則取樣本中的464個(gè)作為訓(xùn)練集、115組做為測(cè)試集。
[0026]C步驟:隨機(jī)選出3組數(shù)據(jù):
[0027]①第一組訓(xùn)練集分別取自編號(hào)為1#至154#、194#至348#、388#至542#,共計(jì)464個(gè)樣本數(shù)據(jù)。測(cè)試集分別取自編號(hào)為155#至193#、349#至387#、543#至579#,共計(jì)115個(gè)樣本數(shù)據(jù)。
[0028]②第二組訓(xùn)練集分別取自編號(hào)為39#至193#、349#至387#、427#至579#,共計(jì)464個(gè)樣本數(shù)據(jù)。測(cè)試集分別取自編號(hào)為1#至38#、194#至232#、388#至426#,共計(jì)115個(gè)樣本數(shù)據(jù)。
[0029]③第三組訓(xùn)練集取自編號(hào)為1#至464#,測(cè)試集取自編號(hào)為465#至579#。
[0030]實(shí)例I獲得的實(shí)驗(yàn)結(jié)果:
[0031]①?gòu)较蚧撕瘮?shù):83.65%多項(xiàng)式核函數(shù):73.08%[0032]②徑向基核函數(shù):87.50%多項(xiàng)式核函數(shù):77.88%
[0033]③徑向基核函數(shù):90.38%多項(xiàng)式核函數(shù):85.58%
[0034]實(shí)例2:天平平衡測(cè)量數(shù)據(jù)集(Balance Scale Data Set)
[0035]A步驟:樣本共有625個(gè)數(shù)據(jù),維數(shù)為4。經(jīng)數(shù)據(jù)預(yù)處理后計(jì)算出超球體的重心O坐標(biāo)為(0.6250,0.5000,0.2500,0.7500),R=0.4507,α =0.2944。
[0036]由此判斷該樣本數(shù)據(jù)呈全局分布特性,則選取具有全局特性的多項(xiàng)式核函數(shù)為SVM核函數(shù)類型。
[0037]B步驟:按照已知樣本的80%作為訓(xùn)練集、20%作為測(cè)試集,則取樣本中的500個(gè)作為訓(xùn)練集、125組做為測(cè)試集。
[0038]C步驟:隨機(jī)選出3組數(shù)據(jù):
[0039]①第一組訓(xùn)練集分別取自編號(hào)為1#至166#、209#至375#、418#至584#,共500個(gè)樣本數(shù)據(jù)。測(cè)試集分別取自編號(hào)為167#至208#、376#至#417#、585#至625#,共125個(gè)樣本數(shù)據(jù)。
[0040]②第二組訓(xùn)練集分別取自編號(hào)為42#至208#、251#至417#、460#至625#,共500個(gè)樣本數(shù)據(jù)。測(cè)試集分別取自編號(hào)為1#至41#、209#至250#、418#至459#,共125個(gè)樣本數(shù)據(jù)。
[0041]③第三組訓(xùn)練集取自編號(hào)為1#至500#,測(cè)試集取自編號(hào)為501#至625#。
[0042]實(shí)例2獲得的實(shí)驗(yàn)結(jié)果:
[0043]①?gòu)较蚧撕瘮?shù):90.40%多項(xiàng)式核函數(shù):100.00%
[0044]②徑向基核函數(shù):92.80%多項(xiàng)式核函數(shù):97.60%
[0045]③徑向基核函數(shù):91.20%多項(xiàng)式核函數(shù):98.40%
[0046]實(shí)例3:澳大利亞的信用審批數(shù)據(jù)集(Australian Credit Approval Data Set)
[0047]A步驟:樣本共有690個(gè)數(shù)據(jù),維數(shù)為14。經(jīng)數(shù)據(jù)預(yù)處理后計(jì)算出超球體的重心O坐標(biāo)為(0.5000,0.1479,0.0105,0.2500,0.1923,0.1875,0.0007,0.0000,0.5000,0.0299,
0.0000,0.5000,0.1050,0.0050), R=0.8007,α =0.9610。
[0048]由此判斷該樣本數(shù)據(jù)呈局部分布特性,則選取具有局部特性的徑向基核函數(shù)為SVM核函數(shù)類型。
[0049]B步驟:取總樣本數(shù)的80%作為訓(xùn)練集(即552個(gè)樣本),20%作為測(cè)試集(即138個(gè)樣本)。
[0050]C步驟:隨機(jī)選出3組數(shù)據(jù):
[0051]①第一組訓(xùn)練集分別取自編號(hào)為1#至184#、232#至416#、464#至648#,共計(jì)552個(gè)樣本。測(cè)試集分別取自編號(hào)為185#至231#、417#至463#、649#至690#,共計(jì)138個(gè)樣本。
[0052]②第二組訓(xùn)練集分別取自編號(hào)為47#至131#、179#至363#、411#至690#,共計(jì)552個(gè)樣本。測(cè)試集分別取自編號(hào)為1#至46#、132#至178#、364#至410#,共計(jì)138個(gè)樣本。
[0053]③第三組訓(xùn)練集取自編號(hào)為1#至552#,測(cè)試集取自編號(hào)為553#至690#。
[0054]實(shí)例3獲得的實(shí)驗(yàn)結(jié)果:
[0055]①?gòu)较蚧撕瘮?shù):87.55%多項(xiàng)式核函數(shù):85.29%
[0056]②徑向基核函數(shù):87.10%多項(xiàng)式核函數(shù):85.71%
[0057]③徑向基核函數(shù):87.68%多項(xiàng)式核函數(shù):84.78%
[0058]實(shí)例4:三連棋游戲結(jié)局?jǐn)?shù)據(jù)集(Tic-Tac-Toe Endgame Data Set)[0059]A步驟:樣本共有958個(gè)數(shù)據(jù),維數(shù)為9。經(jīng)數(shù)據(jù)預(yù)處理后計(jì)算出超球體的重心 O 坐標(biāo)為(0.2500,0.0000,0.5000,0.2500,0.2500,0.5000,1.0000,0.2500,0.7500),R=0.7500,α=0.0000。
[0060]由此判斷該樣本數(shù)據(jù)呈全局分布特性,則選取具有全局特性的多項(xiàng)式核函數(shù)為SVM核函數(shù)類型。
[0061]B步驟:按照樣本的80%作為訓(xùn)練集,20%作為測(cè)試集,即取樣本中的766個(gè)作為訓(xùn)練集,192個(gè)作為測(cè)試集。
[0062]C步驟:隨機(jī)選出3組數(shù)據(jù):
[0063]①第一組訓(xùn)練集分別取自編號(hào)為1#至255#、321#至576#、642#至897#,共計(jì)766個(gè)樣本。測(cè)試集分別取自編號(hào)為256#至320#、577#至641#、898#至958,共計(jì)192個(gè)樣本。
[0064]②第二組訓(xùn)練集分別取自編號(hào)為1#至383#、481#至864#,共計(jì)766個(gè)樣本。測(cè)試集分別取自編號(hào)為384#至480#、865#至958#,共計(jì)192個(gè)樣本。
[0065]③第三組訓(xùn)練集分別取自編號(hào)為1#至191#、251#至442#、492#至683#、733#至924#,共計(jì)766個(gè)樣本。測(cè)試集分別取自編號(hào)為192#至250#、443#至491#、684#至732#、925#至958#,共計(jì)192個(gè)樣本。
[0066]實(shí)例4獲得的實(shí)驗(yàn)結(jié)果:
[0067]①?gòu)较蚧撕瘮?shù):84.82%多項(xiàng)式核函數(shù):95.29% [0068]②徑向基核函數(shù):79.58%多項(xiàng)式核函數(shù):85.86%
[0069]③徑向基核函數(shù):82.20%多項(xiàng)式核函數(shù):93.19%
[0070]通過(guò)以上4例樣本數(shù)據(jù)的隨機(jī)分組測(cè)試,可以看出:基于樣本數(shù)據(jù)先驗(yàn)信息和核函數(shù)蘊(yùn)藏的度量特征的相似性選擇的SVM核函數(shù)類型分類的預(yù)測(cè)準(zhǔn)確率,要高于選擇其他類型核函數(shù)的SVM模型分類的預(yù)測(cè)準(zhǔn)確率,其差異程度甚至高達(dá)10%以上。因此,本發(fā)明基于樣本數(shù)據(jù)先驗(yàn)信息,結(jié)合核函數(shù)蘊(yùn)藏的度量特征進(jìn)行SVM核函數(shù)選擇,是一種有監(jiān)督的實(shí)用方法,克服了傳統(tǒng)的支持向量機(jī)模型選擇方法中人為指定核函數(shù)類型而導(dǎo)致模型不能達(dá)到最優(yōu)性能的缺點(diǎn),并具有運(yùn)算速度快、非常適合實(shí)時(shí)在線SVM模型預(yù)測(cè)控制場(chǎng)所等特點(diǎn)。
【權(quán)利要求】
1.一種基于樣本先驗(yàn)信息的支持向量機(jī)核函數(shù)選擇方法,包括如下步驟: 步驟1:輸入樣本數(shù)據(jù)I = (Xi)Il e ir,其中Rn為n維數(shù)據(jù)空間,并對(duì)X進(jìn)行變換使數(shù)據(jù)的范數(shù)小于I ; 步驟2:對(duì)給定樣本數(shù)據(jù)進(jìn)行超球體的數(shù)學(xué)描述以及確定超球體的重心O和半徑R ; 步驟3:建立樣本分布能量熵函數(shù),并計(jì)算各樣本的能量熵; 步驟4:構(gòu)建樣本分布判別函數(shù)及計(jì)算其判別結(jié)果; 步驟5:根據(jù)其判別結(jié)果與核函數(shù)性質(zhì)的相似性選擇核函數(shù)類型; 步驟6:合理確定樣本訓(xùn)練集和測(cè)試集后,SVM模型及參數(shù)優(yōu)化; 步驟7:輸出預(yù)測(cè)結(jié)果。
2.一種基于樣本先驗(yàn)信息的支持向量機(jī)核函數(shù)選擇方法在印度肝臟病人數(shù)據(jù)集的應(yīng)用,其特征是:包括如下步驟: A步驟:樣本共有579個(gè)數(shù)據(jù),維數(shù)為10 ;經(jīng)數(shù)據(jù)預(yù)處理后計(jì)算出超球體的重心O坐標(biāo)為:0.5058,0.0000,0.1073,0.1786,0.085,0.3473,0.1652,0.4493,0.5326,0.4500,R=0.4984,α =0.9048 ; 由此判斷該樣本數(shù)據(jù)呈局部分布特性,則選取具有局部特性的徑向基核函數(shù)為SVM核函數(shù)類型;` B步驟:按照已知樣本的80%作為訓(xùn)練集、20%作為測(cè)試集,則取樣本中的464個(gè)作為訓(xùn)練集、115組做為測(cè)試集; C步驟:隨機(jī)選出3組數(shù)據(jù): ①第一組訓(xùn)練集分別取自編號(hào)為1#至154#、194#至348#、388#至542#,共計(jì)464個(gè)樣本數(shù)據(jù);測(cè)試集分別取自編號(hào)為155#至193#、349#至387#、543#至579#,共計(jì)115個(gè)樣本數(shù)據(jù); ②第二組訓(xùn)練集分別取自編號(hào)為39#至193#、349#至387#、427#至579#,共計(jì)464個(gè)樣本數(shù)據(jù);測(cè)試集分別取自編號(hào)為1#至38#、194#至232#、388#至426#,共計(jì)115個(gè)樣本數(shù)據(jù); ③第三組訓(xùn)練集取自編號(hào)為1#至464#,測(cè)試集取自編號(hào)為465#至579#; 獲得的結(jié)果: ①?gòu)较蚧撕瘮?shù):83.65%,多項(xiàng)式核函數(shù):73.08% ; ②徑向基核函數(shù):87.50%,多項(xiàng)式核函數(shù):77.88% ; ③徑向基核函數(shù)=90.38%,多項(xiàng)式核函數(shù):85.58%。
3.一種基于樣本先驗(yàn)信息的支持向量機(jī)核函數(shù)選擇方法在天平平衡測(cè)量數(shù)據(jù)集的應(yīng)用,其特征是:包括如下步驟: A步驟:樣本共有625個(gè)數(shù)據(jù),維數(shù)為4,經(jīng)數(shù)據(jù)預(yù)處理后計(jì)算出超球體的重心O坐標(biāo)為:0.6250,0.5000,0.2500,0.7500,R=0.4507,α =0.2944 ; 由此判斷該樣本數(shù)據(jù)呈全局分布特性,則選取具有全局特性的多項(xiàng)式核函數(shù)為SVM核函數(shù)類型; B步驟:按照已知樣本的80%作為訓(xùn)練集、20%作為測(cè)試集,則取樣本中的500個(gè)作為訓(xùn)練集、125組做為測(cè)試集; C步驟:隨機(jī)選出3組數(shù)據(jù): ①第一組訓(xùn)練集分別取自編號(hào)為1#至166#、209#至375#、418#至584#,共500個(gè)樣本數(shù)據(jù);測(cè)試集分別取自編號(hào)為167#至208#、376#至#417#、585#至625#,共125個(gè)樣本數(shù)據(jù); ②第二組訓(xùn)練集分別取自編號(hào)為42#至208#、251#至417#、460#至625#,共500個(gè)樣本數(shù)據(jù);測(cè)試集分別取自編號(hào)為1#至41#、209#至250#、418#至459#,共125個(gè)樣本數(shù)據(jù); ③第三組訓(xùn)練集取自編號(hào)為1#至500#,測(cè)試集取自編號(hào)為501#至625#; 獲得的結(jié)果: ①?gòu)较蚧撕瘮?shù)=90.40%,多項(xiàng)式核函數(shù):100.00% ; ②徑向基核函數(shù)=92.80%,多項(xiàng)式核函數(shù):97.60% ; ③徑向基核函數(shù)=91.20%,多項(xiàng)式核函數(shù):98.40%。
4.一種基于樣本先驗(yàn)信息的支持向量機(jī)核函數(shù)選擇方法在澳大利亞的信用審批數(shù)據(jù)集的應(yīng)用,其特征是:包括如下步驟: A步驟:樣本共有690個(gè)數(shù)據(jù),維數(shù)為14,經(jīng)數(shù)據(jù)預(yù)處理后計(jì)算出超球體的重心O坐標(biāo)為:0.5000,0.1479,0.0105,0.2500,0.1923,0.1875,0.0007,0.0000,0.5000,0.0299,0.0000,0.5000,0.1050,0.0050,R=0.8007,α =0.9610 ; 由此判斷該樣本數(shù)據(jù)呈局部分布特性,則選取具有局部特性的徑向基核函數(shù)為SVM核函數(shù)類型; B步驟:取總樣本數(shù)的80%作為訓(xùn)練集,即552個(gè)樣本;20%作為測(cè)試集,即138個(gè)樣本; C步驟:隨機(jī)選出3組數(shù)據(jù): ①第一組訓(xùn)練集分別取自編號(hào)為1#至184#、232#至416#、464#至648#,共計(jì)552個(gè)樣本;測(cè)試集分別取自編號(hào)為185#至231#、417#至463#、649#至690#,共計(jì)138個(gè)樣本; ②第二組訓(xùn)練集分別取自編號(hào)為47#至131#、179#至363#、411#至690#,共計(jì)552個(gè)樣本;測(cè)試集分別取自編號(hào)為1#至46#、132#至178#、364#至410#,共計(jì)138個(gè)樣本; ③第三組訓(xùn)練集取自編號(hào)為1#至552#,測(cè)試集取自編號(hào)為553#至690#; 獲得的結(jié)果: ①?gòu)较蚧撕瘮?shù)=87.55%,多項(xiàng)式核函數(shù):85.29% ; ②徑向基核函數(shù):87.10%,多項(xiàng)式核函數(shù):85.71% ; ③徑向基核函數(shù)=87.68%,多項(xiàng)式核函數(shù):84.78%。
5.一種基于樣本先驗(yàn)信息的支持向量機(jī)核函數(shù)選擇方法在三連棋游戲結(jié)局?jǐn)?shù)據(jù)集的應(yīng)用,其特征是:包括如下步驟: A步驟:樣本共有958個(gè)數(shù)據(jù),維數(shù)為9,經(jīng)數(shù)據(jù)預(yù)處理后計(jì)算出超球體的重心O坐標(biāo)為:0.2500,0.0000,0.5000,0.2500,0.2500,0.5000,1.0000,0.2500,0.7500,R=0.7500,α=0.0000 ; 由此判斷該樣本數(shù)據(jù)呈全局分布特性,則選取具有全局特性的多項(xiàng)式核函數(shù)為SVM核函數(shù)類型; B步驟:按照樣本的80%作為訓(xùn)練集,20%作為測(cè)試集,即取樣本中的766個(gè)作為訓(xùn)練集,192個(gè)作為測(cè)試集; C步驟:隨機(jī)選出3組數(shù)據(jù): ①第一組訓(xùn)練集分別取自編號(hào)為1#至255#、321#至576#、642#至897#,共計(jì)766個(gè)樣本;測(cè)試集分別取自編號(hào)為256#至320#、577#至641#、898#至958,共計(jì)192個(gè)樣本; ②第二組訓(xùn)練集分別取自編號(hào)為1#至383#、481#至864#,共計(jì)766個(gè)樣本;測(cè)試集分別取自編號(hào)為384#至480#、865#至958#,共計(jì)192個(gè)樣本; ③第三組訓(xùn)練集分別取自編號(hào)為1#至191#、251#至442#、492#至683#、733#至924#,共計(jì)766個(gè)樣本;測(cè)試集分別取自編號(hào)為192#至250#、443#至491#、684#至732#、925#至958#,共計(jì)192個(gè)樣本; 獲得的結(jié)果: ①?gòu)较蚧撕瘮?shù)=84.82%,多項(xiàng)式核函數(shù):95.29% ; ②徑向基核函數(shù)=79.58%,多項(xiàng)式核函數(shù):85.86% ; ③徑向基核函數(shù)=82.20%,多項(xiàng)式核函數(shù):93.19%。
【文檔編號(hào)】G06K9/62GK103489007SQ201310475813
【公開(kāi)日】2014年1月1日 申請(qǐng)日期:2013年10月13日 優(yōu)先權(quán)日:2013年10月13日
【發(fā)明者】梁禮明, 鐘震, 楊國(guó)亮, 葛繼, 翁發(fā)祿 申請(qǐng)人:江西理工大學(xué)