亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種時序網(wǎng)絡(luò)與時序數(shù)據(jù)的多態(tài)聚類方法

文檔序號:6551644閱讀:777來源:國知局
一種時序網(wǎng)絡(luò)與時序數(shù)據(jù)的多態(tài)聚類方法
【專利摘要】本發(fā)明提出了多態(tài)聚類的概念,并公開了一種時序網(wǎng)絡(luò)與時序數(shù)據(jù)的多態(tài)聚類分析方法。多態(tài)聚類是一種針對時序網(wǎng)絡(luò)或時序數(shù)據(jù),以多種標準作為相似性度量指標的聚類分析方法,包括以下步驟:首先,如果處理對象為時序數(shù)據(jù),則只對時序數(shù)據(jù)加工成特定的形式,而如果處理對象為時序網(wǎng)絡(luò),則通過譜映射的方法把時序網(wǎng)絡(luò)映射為特定形式的時序數(shù)據(jù)。其次建立此時序數(shù)據(jù)的多態(tài)向量,最后,對多態(tài)向量采用改進的同步化聚類方法聚類得到多態(tài)聚類結(jié)果。本發(fā)明允許人們從不同的角度觀察時序網(wǎng)絡(luò)或時序數(shù)據(jù)的社區(qū)結(jié)構(gòu),從而得到更全面的分析結(jié)果。
【專利說明】一種時序網(wǎng)絡(luò)與時序數(shù)據(jù)的多態(tài)聚類方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于數(shù)據(jù)挖掘與圖挖掘【技術(shù)領(lǐng)域】,更具體地,涉及一種時序網(wǎng)絡(luò)與時序數(shù) 據(jù)的多態(tài)聚類方法。

【背景技術(shù)】
[0002] 為了識別時序網(wǎng)絡(luò)與時序數(shù)據(jù)中的社區(qū)結(jié)構(gòu),在靜態(tài)網(wǎng)絡(luò)、靜態(tài)數(shù)據(jù)分析中流 行的聚類方法已經(jīng)不能滿足要求。2006年Chakrabarti等人提出了演化聚類的概念, 他們隨時間變化聚類數(shù)據(jù),并且為兩個常用的數(shù)據(jù)聚類方法k-means和合成聚類算法 (Agglomerative Hierarchical Clustering)提出 了演化版本。
[0003] 然而,現(xiàn)有的方法中,復雜網(wǎng)絡(luò)聚類是以節(jié)點間的連接結(jié)構(gòu)作為聚類的標準,經(jīng)過 這種聚類,相互間連接緊密的節(jié)點被劃分到同一聚類中??臻g聚類方法大都僅以點目標的 空間距離作為相似性度量指標進行聚類,僅考慮了點目標的空間鄰近特性,而忽略了非空 間屬性特征。
[0004] 對于時序網(wǎng)絡(luò),我們認為聚類的標準可以不再只是網(wǎng)絡(luò)的連接結(jié)構(gòu),它可以是節(jié) 點聯(lián)系范圍的變化趨勢,也可以是節(jié)點脫離原簇進入新簇的活動規(guī)律等等,即便是原有的 以連接結(jié)構(gòu)作為標準的聚類也可以更加靈活。而在序列數(shù)據(jù)尤其是時序數(shù)據(jù)的挖掘中,聚 類的標準同樣的可以擴展為節(jié)點的變化規(guī)律。


【發(fā)明內(nèi)容】

[0005] 針對現(xiàn)有分析方法的不足,本發(fā)明的目的在于提供一種新的多態(tài)聚類分析方法, 旨在從不同的角度觀察時序網(wǎng)絡(luò)或時序數(shù)據(jù)的社區(qū)結(jié)構(gòu),從而得到更全面的分析結(jié)果。
[0006] 為實現(xiàn)上述目的,本發(fā)明提供了一種新的多態(tài)聚類分析方法,包括以下步驟:
[0007] (1)判斷數(shù)據(jù)形式,如果是時序網(wǎng)絡(luò),則轉(zhuǎn)步驟(2);如果是時序數(shù)據(jù),則轉(zhuǎn)步驟 (6);
[0008] (2)將時序網(wǎng)絡(luò)按照設(shè)定時間間隔劃分為m個有序的靜態(tài)網(wǎng)絡(luò);
[0009] (3)采用基于譜方法的靜態(tài)網(wǎng)絡(luò)映射方法,將每一個靜態(tài)網(wǎng)絡(luò)的頂點,映射到k維 空間;一個有η個節(jié)點的靜態(tài)網(wǎng)絡(luò)可得到nXk的數(shù)據(jù)矩陣。
[0010] ⑷將m個靜態(tài)網(wǎng)絡(luò)映射得到的數(shù)據(jù)矩陣按順序拼接,得到數(shù)據(jù)矩陣Μ ;M的每一 行,為同一節(jié)點不同時刻映射值的順序組合,對節(jié)點不存在時對應維度的映射值用"-1"標 記,"-1"表示節(jié)點缺失;
[0011] (5)處理矩陣Μ得到多態(tài)向量矩陣,包括3個趨勢向量矩陣,分別為范圍變化趨勢 矩陣、疏密變化趨勢矩陣、強弱變化趨勢矩陣,和1個活躍度向量矩陣,活躍度向量矩陣由 鄰域內(nèi)變化節(jié)點的個數(shù)向量組合而成;
[0012] (6)利用同步化聚類算法,設(shè)置調(diào)節(jié)因子后,對矩陣Μ進行聚類,得到可調(diào)節(jié)的聯(lián) 系聚類結(jié)果;
[0013] (7)利用同步化聚類算法,分別對三個趨勢向量矩陣聚類,得到三個有不同側(cè)重點 的趨勢聚類結(jié)果,其中三個不同側(cè)重點分別為范圍趨勢、疏密趨勢、綜合強弱趨勢;
[0014] (8)利用同步化聚類算法,對活躍度向量矩陣聚類,得到活躍度聚類結(jié)果。
[0015] 本發(fā)明的一個實施例中,所述步驟(3)中采用基于譜方法的靜態(tài)網(wǎng)絡(luò)映射,這種 映射就是將網(wǎng)絡(luò)圖中的每個頂點映射到一個k維空間中的對應點表示,這個頂點在K維空 間中的坐標可由它在其拉普拉斯矩陣(拉普拉斯矩陣定義為L = D-C,其中C為圖的鄰接矩 陣,D為圖的度矩陣)的前k個非平凡特征向量方向上的映射得到。
[0016] 本發(fā)明的一個實施例中,所述步驟(3)中,若靜態(tài)網(wǎng)絡(luò)為非聯(lián)通圖,則通過加入虛 擬節(jié)點的方式連接各聯(lián)通分支,以降低映射過程中導致網(wǎng)絡(luò)結(jié)構(gòu)的損失。
[0017] 本發(fā)明的一個實施例中,k的值為2可滿足聚類分析要求,值越大聚類精度越高, 計算復雜度也越高。
[0018] 根據(jù)以下描述處理矩陣Μ可得到多態(tài)聚類矩陣:
[0019] a.范圍變化趨勢矩陣是由所有節(jié)點的鄰域內(nèi)節(jié)點數(shù)向量組成,一個節(jié)點的鄰域內(nèi) 節(jié)點數(shù)向量是該節(jié)點各時刻鄰域內(nèi)節(jié)點數(shù)的有序排列(共m維),且節(jié)點數(shù)不包括所考查節(jié) 點,它刻畫了節(jié)點的聯(lián)系范圍;
[0020] b.疏密變化趨勢矩陣是由所有節(jié)點的鄰域內(nèi)節(jié)點平均距離向量組成,一個節(jié)點的 鄰域內(nèi)節(jié)點平均距離向量是該節(jié)點各時刻鄰域內(nèi)節(jié)點平均距離的有序排列(共m維),它刻 畫了節(jié)點聯(lián)系的緊密程度;
[0021] c.強弱變化趨勢矩陣是由所有節(jié)點的強弱向量組成,一個節(jié)點的強弱向量由上述 令上或內(nèi)韋'占 兩個向量得到(共m維),每個維度的值,它綜合反映節(jié)點與周圍節(jié)點聯(lián) 鄰域內(nèi)平均距禺 系的強弱。
[0022] d.活躍度向量矩陣由各節(jié)點鄰域內(nèi)變化節(jié)點的個數(shù)向量組成,鄰域內(nèi)變化節(jié)點的 個數(shù)向量是m-Ι維向量,每個維度為相鄰時間片鄰域內(nèi)發(fā)生變化節(jié)點的個數(shù),即為增加節(jié) 點的個數(shù)與減少節(jié)點的個數(shù)之和。
[0023] Christian B0hm等人提出的Sync算法通過模擬同步化實現(xiàn)聚類,為了適應對時 序數(shù)據(jù)聚類的需要,在Sync算法中,使用以下方法表示時序節(jié)點,并計算距離矩陣:

【權(quán)利要求】
1. 一種針對時序網(wǎng)絡(luò)與時序數(shù)據(jù)的聚類方法,其特征在于,包括以下步驟: (1) 判斷數(shù)據(jù)形式,如果是時序網(wǎng)絡(luò),則轉(zhuǎn)步驟(2);如果是時序數(shù)據(jù),則轉(zhuǎn)步驟(6); (2) 將時序網(wǎng)絡(luò)按照設(shè)定時間間隔劃分為m個有序的靜態(tài)網(wǎng)絡(luò); (3) 采用基于譜方法的靜態(tài)網(wǎng)絡(luò)映射方法,將每一個靜態(tài)網(wǎng)絡(luò)的頂點,映射到k維空 間;一個有η個節(jié)點的靜態(tài)網(wǎng)絡(luò)可得到nXk的數(shù)據(jù)矩陣; (4) 將m個靜態(tài)網(wǎng)絡(luò)映射得到的數(shù)據(jù)矩陣按順序拼接,得到數(shù)據(jù)矩陣Μ ;M的每一行, 為同一節(jié)點不同時刻映射值的順序組合,對節(jié)點不存在時對應維度的映射值用"-1"標記, "-1"表示節(jié)點缺失; (5) 處理矩陣Μ得到多態(tài)向量矩陣,包括3個趨勢向量矩陣,分別為范圍變化趨勢矩陣、 疏密變化趨勢矩陣、強弱變化趨勢矩陣,和1個活躍度向量矩陣,活躍度向量矩陣由鄰域內(nèi) 變化節(jié)點的個數(shù)向量組合而成; (6) 利用同步化聚類算法,設(shè)置調(diào)節(jié)因子后,對矩陣Μ進行聚類,得到可調(diào)節(jié)的聯(lián)系聚 類結(jié)果; (7) 利用同步化聚類算法,分別對三個趨勢向量矩陣聚類,得到三個有不同側(cè)重點的趨 勢聚類結(jié)果,其中三個不同側(cè)重點分別為范圍趨勢、疏密趨勢、綜合強弱趨勢; (8) 利用同步化聚類算法,對活躍度向量矩陣聚類,得到活躍度聚類結(jié)果。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟(3)中采用基于譜方法的靜態(tài)網(wǎng) 絡(luò)映射,即將網(wǎng)絡(luò)圖中的每個頂點映射到一個k維空間中的對應點表示,這個頂點在Κ維空 間中的坐標由它在其拉普拉斯矩陣的前k個非平凡特征向量方向上的映射得到。
3. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述步驟(3)中,若靜態(tài)網(wǎng)絡(luò)為非聯(lián) 通圖,則通過加入虛擬節(jié)點的方式連接各聯(lián)通分支,以降低映射過程中導致網(wǎng)絡(luò)結(jié)構(gòu)的損 失。
4. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述范圍變化趨勢矩陣由所有節(jié)點的 鄰域內(nèi)節(jié)點數(shù)向量組成;其中,一個節(jié)點的鄰域內(nèi)節(jié)點數(shù)向量是該節(jié)點各時刻鄰域內(nèi)節(jié)點 數(shù)的有序排列,共m維,且節(jié)點數(shù)不包括所考查節(jié)點,它用于刻畫節(jié)點的聯(lián)系范圍。
5. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述疏密變化趨勢矩陣是由所有節(jié)點 的鄰域內(nèi)節(jié)點平均距離向量組成;其中,一個節(jié)點的鄰域內(nèi)節(jié)點平均距離向量是該節(jié)點各 時刻鄰域內(nèi)節(jié)點平均距離的有序排列,共m維,它用于刻畫節(jié)點聯(lián)系的緊密程度。

9.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述k的值取為2。
【文檔編號】G06F17/30GK104090940SQ201410305660
【公開日】2014年10月8日 申請日期:2014年6月27日 優(yōu)先權(quán)日:2014年6月27日
【發(fā)明者】付才, 曲樹彥, 韓蘭勝, 劉銘, 崔永泉, 湯學明, 駱婷, 李敏 申請人:華中科技大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1