一種正則化rbf網(wǎng)絡(luò)多標(biāo)簽分類方法

文檔序號(hào)：9327496閱讀：850來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種正則化rbf網(wǎng)絡(luò)多標(biāo)簽分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于多標(biāo)簽分類技術(shù)領(lǐng)域，具體涉及一種正則化RBF網(wǎng)絡(luò)多標(biāo)簽分類方法。
【背景技術(shù)】
[0002] 在傳統(tǒng)機(jī)器學(xué)習(xí)的框架下，分類問題研究如何將待分類樣本準(zhǔn)確的劃分到唯一的某一類中。如果候選類別只有兩個(gè)，這類問題被稱作二值分類問題。如果候選類別有多個(gè)，這類問題被稱作多類分類問題。二值分類問題和多類分類問題都是單標(biāo)簽分類問題。然而，在真實(shí)世界中，同時(shí)具有多個(gè)概念標(biāo)記的歧義性對(duì)象廣泛存在。例如在文檔分類中，每篇文檔可能同時(shí)屬于多個(gè)主題，從不同的角度分析一篇新聞報(bào)道，可將其劃分為"政治"和 "經(jīng)濟(jì)"類；在功能基因組研究中，每個(gè)基因可能同時(shí)具有"新陳代謝"和"轉(zhuǎn)錄"等多種功能；在場(chǎng)景分類中，每幅圖像可能同時(shí)包含"海灘"和"落日"等多種語義信息。這樣的分類問題被稱作多標(biāo)簽分類問題。
[0003] M. -L. Zhang. ML-RBF:RBF neural networks for multi-label learning. Neural Processing Letters, 2009, 29 (2) :61-74.提出了 RBF神經(jīng)網(wǎng)絡(luò)的多標(biāo)簽分類算法，該方法包括：首先，對(duì)于訓(xùn)練集中的每一個(gè)標(biāo)簽，利用Kmeans算法對(duì)其聚類，聚類得出的中心點(diǎn)作為RBF的隱藏層節(jié)點(diǎn)；其次，通過最小化平方和誤差函數(shù)解得輸出層權(quán)重向量。但是該方法沒有進(jìn)行正則化處理，使得分類結(jié)果不能達(dá)到最優(yōu)的效果。
[0004] M.-L. Zhang, Z.-J. Wang. MIMLRBF: RBF neural networks for multi-instance multi-label learning. Neurocomputing, 2009, 72 (16-18) :3951-3956.提出了多實(shí)例多標(biāo)簽問題的RBF神經(jīng)網(wǎng)絡(luò)算法，該方法包括：首先，對(duì)于訓(xùn)練集中的每一個(gè)標(biāo)簽，利用 k-MED0IDS算法對(duì)其聚類，聚類得出的中心點(diǎn)作為網(wǎng)絡(luò)的隱藏層神經(jīng)元；其次，通過最小化平方和誤差函數(shù)，優(yōu)化隱藏層神經(jīng)元與輸出層神經(jīng)元之間的權(quán)值矩陣。該方法是針對(duì)多實(shí)例多標(biāo)簽問題的，不能直接用于解決單獨(dú)的多標(biāo)簽分類問題，并且該方法也沒有進(jìn)行正則化處理，使得分類方法不能得到最優(yōu)的分類結(jié)果。
[0005] 上述RBF網(wǎng)絡(luò)多標(biāo)簽分類方法，都沒有使用正則化技術(shù)，限制了分類方法的分類結(jié)果，降低了分類方法的泛化性能。

【發(fā)明內(nèi)容】

[0006] 為了克服上述現(xiàn)有技術(shù)存在的缺陷，本發(fā)明的目的在于提供一種正則化RBF網(wǎng)絡(luò) 多標(biāo)簽分類方法，該方法聚類速度快、泛化性能好，能夠增強(qiáng)RBF網(wǎng)絡(luò)的泛化性能。
[0007] 本發(fā)明是通過以下技術(shù)方案來實(shí)現(xiàn)：
[0008] -種正則化RBF網(wǎng)絡(luò)多標(biāo)簽分類方法，包括以下步驟：
[0009] 步驟1 :構(gòu)建RBF網(wǎng)絡(luò)
[0010] 包括構(gòu)造網(wǎng)絡(luò)的輸入層結(jié)點(diǎn)、隱藏層結(jié)點(diǎn)及輸出層結(jié)點(diǎn)；
[0011] 輸入層結(jié)點(diǎn)，由η個(gè)結(jié)點(diǎn)組成，每一個(gè)結(jié)點(diǎn)對(duì)應(yīng)輸入樣本向量的一個(gè)特征；
[0012] 隱藏層結(jié)點(diǎn)，依次對(duì)數(shù)據(jù)集對(duì)應(yīng)的標(biāo)簽集中的每一個(gè)標(biāo)簽.1的正樣本集％進(jìn)行聚類，聚類之后得到A = 個(gè)聚類中心，α為常量參數(shù)；所有的標(biāo)簽聚類形成的聚類中心構(gòu)成了徑向基函數(shù)RBF的隱藏層結(jié)點(diǎn)；
[0013] 輸出層結(jié)點(diǎn)，由q個(gè)結(jié)點(diǎn)組成，每一個(gè)輸出層結(jié)點(diǎn)都是一個(gè)潛在的輸出標(biāo)簽；
[0014] 步驟2 :用訓(xùn)練數(shù)據(jù)訓(xùn)練RBF網(wǎng)絡(luò)
[0015] 建立帶正則項(xiàng)的RBF網(wǎng)絡(luò)多標(biāo)簽分類模型，選取公開多標(biāo)簽數(shù)據(jù)集，選擇其中的一部分作為訓(xùn)練數(shù)據(jù)集，對(duì)RBF網(wǎng)絡(luò)多標(biāo)簽分類器進(jìn)行正則參數(shù)尋優(yōu)，得到連接隱藏層和輸出層的權(quán)值矩陣；
[0016] 步驟3 :利用RBF網(wǎng)絡(luò)預(yù)測(cè)標(biāo)簽
[0017] 對(duì)于RBF網(wǎng)絡(luò)的輸出層結(jié)點(diǎn)，設(shè)定常量0為閾值；利用連接隱藏層和輸出層的權(quán)值矩陣值，得出網(wǎng)絡(luò)中每個(gè)結(jié)點(diǎn)的輸出值，比較每個(gè)結(jié)點(diǎn)輸出值與閾值〇的大小關(guān)系，大于閾值〇的作為樣本的潛在標(biāo)簽，實(shí)現(xiàn)多標(biāo)簽分類。
[0018] 步驟1所述的RBF網(wǎng)絡(luò)構(gòu)建，具體包括以下步驟：
[0019] 1)設(shè);T = ITi或者f，表示維度為η的樣本空間；其中，JT表示維度為η的實(shí)數(shù)空間，Σ?表示維度為η的復(fù)數(shù)空間
表示具有q個(gè)可能的類標(biāo)簽的標(biāo)簽空間，多標(biāo)簽訓(xùn)練集為：
[0020]
[0021] 包含m個(gè)樣本數(shù)據(jù)，g e.；r;是一個(gè)η維的特征向量(?,?,…X 是與Χι 相對(duì)應(yīng)的標(biāo)簽集；
[0022] 網(wǎng)絡(luò)的輸入層由η個(gè)結(jié)點(diǎn)組成，用于將η維的樣本X1輸入網(wǎng)絡(luò)；
[0023] 2)對(duì)標(biāo)簽空間…M中的每一個(gè)標(biāo)簽&的正樣本集"進(jìn)行聚類；
[0024] 3)標(biāo)簽空間;F = 的維度為q，網(wǎng)絡(luò)的輸出層結(jié)點(diǎn)由q個(gè)結(jié)點(diǎn)組成，一個(gè) 輸出結(jié)點(diǎn)對(duì)應(yīng)標(biāo)簽空間中的一個(gè)標(biāo)簽，則網(wǎng)絡(luò)輸出為向量f :
[0025] 向量 f = [A, f2, . . .，fq];
[0026] 向量f的每一個(gè)分量值Λ對(duì)應(yīng)網(wǎng)絡(luò)的一個(gè)輸出結(jié)點(diǎn)的輸出值。
[0027] 步驟2)所述對(duì)正樣本集K.進(jìn)行聚類的具體步驟為：
中的每一個(gè)標(biāo)簽&，找出正樣本集合
[0029] 其中，Uj, Yj為多標(biāo)簽訓(xùn)練集中的一個(gè)樣本，x, 是一個(gè)η維的特征向量， K =>'是與Xj相對(duì)應(yīng)的標(biāo)簽集，）??是集合Yj的一個(gè)元素；
[0030] (2)利用SOM聚類法，對(duì)正樣本集合％聚類，聚類之后得到k個(gè)聚類中心， # =仏|%1，α為常量參數(shù)，形成聚類中心為向i

[0031] (3)重復(fù)步驟⑴和（2)，直至標(biāo)簽集中的每一個(gè)標(biāo)簽對(duì)應(yīng)的正樣本集合都聚類產(chǎn) 生聚類中心，并將這些聚類中心合并，得到網(wǎng)絡(luò)隱藏層結(jié)點(diǎn)為向量隱藏層結(jié)點(diǎn)數(shù)量為L(zhǎng)
9
[0032] 步驟2所述訓(xùn)練RBF網(wǎng)絡(luò)，具體包括以下步驟：
[0033] 1)對(duì)于樣本\，夂?是一個(gè)η維的特征向量，RBF網(wǎng)絡(luò)輸出層的第￡個(gè)輸出結(jié) 點(diǎn)，其輸出值/；形式化的定義如下：
[0038] β為連接隱藏層和輸出層的權(quán)值矩陣，見為矩陣β的第i行第《列元素，L為網(wǎng) 絡(luò)的隱藏層結(jié)點(diǎn)數(shù)量，m為多標(biāo)簽訓(xùn)練集的總訓(xùn)練樣本數(shù)量；Φ i (X]，C1)為RBF網(wǎng)絡(luò)的隱藏層結(jié)點(diǎn)C1在網(wǎng)絡(luò)輸入樣本為X ,時(shí)，隱藏層結(jié)點(diǎn)c 輸出函數(shù)值；
[0039] RBF網(wǎng)絡(luò)的隱藏層函數(shù)采用高斯函數(shù)作為徑向基函數(shù)，則（J)1 (X]，C1)函數(shù)形式化的定義如下：
[0041] 其中，C1為徑向基函數(shù)Φ J ·)的中心，即RBF網(wǎng)絡(luò)隱藏層結(jié)點(diǎn)，σ稱為徑向基函數(shù)的擴(kuò)展常數(shù)，反應(yīng)函數(shù)圖像的寬度，通過計(jì)算每對(duì)網(wǎng)絡(luò)隱藏層結(jié)點(diǎn)之間的距離來獲得，形式化的定義為：
[0043] 其中，μ為調(diào)節(jié)參數(shù)，為網(wǎng)絡(luò)的隱藏層結(jié)點(diǎn)數(shù)量，dP Ch為網(wǎng)絡(luò)隱藏層結(jié)點(diǎn)；
[0044] 則，RBF網(wǎng)絡(luò)輸出向量f = [4 f2, · · ·，fq]形式化的定義為：
[0045] f = Ηβ (6)
[0046] H和β定義如式⑵和式（3)，向量f的每一個(gè)分量值/)為網(wǎng)絡(luò)的一個(gè)輸出結(jié)點(diǎn) 的輸出值，定義如式⑴所示；
[0047] 2)最小化網(wǎng)絡(luò)輸出誤差值，如下式：
[0049] 其中，T為多標(biāo)簽訓(xùn)練集的m個(gè)訓(xùn)練樣本的目標(biāo)標(biāo)簽矩陣，f為RBF網(wǎng)絡(luò)輸出向量， λ Ω (f)為正則項(xiàng)，λ為正則參數(shù)：
[0050] 則有，最小化
丨等價(jià)于：
[0051 ] minw(| |Ηβ-Τ| | + λ β) ⑶
[0052] 利用嶺回歸的方法求解，隱藏層和輸出層的權(quán)值矩陣β表示為：
[0053] β = (ΗΤΗ+ λ I) 1Ht

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3 4

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：孫霞;王佳榮;馮筠;陳勇;吳寧海;
技術(shù)所有人：西北大學(xué);西安麥多信息科技有限公司;陜西瑞海電力工程有限公司;
我是此專利的發(fā)明人

上一篇：一種基于移動(dòng)神經(jīng)網(wǎng)絡(luò)的高程異常擬合內(nèi)插計(jì)算方法
上一篇：一種絲杠故障診斷方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

正則化方法相關(guān)技術(shù)

正則化參數(shù)選取方法相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種正則化rbf網(wǎng)絡(luò)多標(biāo)簽分類方法