亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于模糊聚類的多分辨率社區(qū)發(fā)現(xiàn)方法

文檔序號(hào):10512761閱讀:783來源:國知局
基于模糊聚類的多分辨率社區(qū)發(fā)現(xiàn)方法
【專利摘要】本發(fā)明提供了一種基于模糊聚類的多分辨率社區(qū)發(fā)現(xiàn)方法,根據(jù)鄰居節(jié)點(diǎn)的局部交互信息,引入結(jié)構(gòu)相似度來度量節(jié)點(diǎn)間的模糊關(guān)系,局部考慮節(jié)點(diǎn)間的模糊相似度在網(wǎng)絡(luò)拓?fù)渲械哪:齻鬟f性,并用模糊參數(shù)在模糊傳遞矩陣上截集而獲得不同分辨率下的社區(qū)結(jié)構(gòu),從而實(shí)現(xiàn)網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)。本發(fā)明采用矩陣轉(zhuǎn)換運(yùn)算,建立基于模糊聚類的網(wǎng)絡(luò)社區(qū)檢測(cè)模型,減少了傳統(tǒng)方法中的迭代優(yōu)化過程,降低了時(shí)間復(fù)雜度,通過大量實(shí)驗(yàn)證明了本方法能有效揭示網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu),普適性較強(qiáng),具有較高的應(yīng)用價(jià)值;能有效實(shí)現(xiàn)了網(wǎng)絡(luò)結(jié)構(gòu)分析和社區(qū)結(jié)構(gòu)可視化。
【專利說明】
基于模糊聚類的多分辨率社區(qū)發(fā)現(xiàn)方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及復(fù)雜網(wǎng)絡(luò)分析技術(shù)研究領(lǐng)域,具體地,涉及一種基于模糊聚類的多分 辨率社區(qū)發(fā)現(xiàn)方法。
【背景技術(shù)】
[0002] 復(fù)雜網(wǎng)絡(luò)作為一個(gè)廣泛的交叉學(xué)科,其涉及計(jì)算機(jī)、物理、數(shù)學(xué)、信息科學(xué)、系統(tǒng)科 學(xué)、網(wǎng)絡(luò)科學(xué)等學(xué)科領(lǐng)域,逐漸成為解決復(fù)雜問題的一個(gè)強(qiáng)有力工具,并在眾多領(lǐng)域有著廣 泛的應(yīng)用,如社交網(wǎng)絡(luò)分析,生物工程、經(jīng)濟(jì)金融、電力與交通、人類行為分析、大數(shù)據(jù)分析 等。對(duì)復(fù)雜網(wǎng)絡(luò)的研究分析,極大地拓展了人們理解世界的廣度和深度,有著重大的現(xiàn)實(shí)意 義。在大量的復(fù)雜網(wǎng)絡(luò)研究中,對(duì)復(fù)雜網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)的研究,是一個(gè)重大的研究焦點(diǎn)。一般 說來,對(duì)于給定的網(wǎng)絡(luò)結(jié)構(gòu)劃分,社區(qū)內(nèi)部節(jié)點(diǎn)相對(duì)于社區(qū)之間有著更緊密的連接。復(fù)雜網(wǎng) 絡(luò)中的社區(qū)結(jié)構(gòu)特性已被大量的研究證明。例如,對(duì)蛋白質(zhì)交互網(wǎng)絡(luò)中社區(qū)結(jié)構(gòu)的研究,可 以分析不同的已知或未知蛋白質(zhì)功能模塊,進(jìn)一步了解蛋白質(zhì)結(jié)構(gòu)的復(fù)雜特性。在社交網(wǎng) 絡(luò)中,由于社會(huì)交互性的增強(qiáng),基于不同興趣、主題、職業(yè)、地域等特征形成的大量群體,社 區(qū)結(jié)構(gòu)特征尤為明顯。因此,挖掘網(wǎng)絡(luò)中緊密聯(lián)系的社區(qū)結(jié)構(gòu)對(duì)理解和分析網(wǎng)絡(luò)結(jié)構(gòu)屬性、 信息傳播規(guī)律、人類社會(huì)組織結(jié)構(gòu)等有重要的理論意義和廣泛的應(yīng)用價(jià)值。
[0003] 社區(qū)結(jié)構(gòu)發(fā)現(xiàn)旨在檢測(cè)網(wǎng)絡(luò)中帶有某種自然屬性的社區(qū)結(jié)構(gòu),即根據(jù)一定的規(guī) 貝1J,將網(wǎng)絡(luò)中相互連接的節(jié)點(diǎn)劃分為若干模塊,使得各模塊內(nèi)部的聯(lián)系相對(duì)稠密,模塊間的 連接相對(duì)稀疏。盡管社區(qū)結(jié)構(gòu)的概念便于理解,但由于網(wǎng)絡(luò)結(jié)構(gòu)的多樣性和復(fù)雜性,社區(qū)發(fā) 現(xiàn)方法也復(fù)雜多樣。在復(fù)雜網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)研究中,大量的社區(qū)發(fā)現(xiàn)算法被提出,如基于圖 分割、層次聚類、派系過濾、中心度測(cè)量、譜聚類、基于模塊度優(yōu)化、連邊檢測(cè)等。盡管如此, 大部分方法需要先驗(yàn)知識(shí)指導(dǎo)才能實(shí)現(xiàn)有效劃分,同時(shí)沒有提出一個(gè)統(tǒng)一的度量準(zhǔn)則,因 此有其局限性。根據(jù)社區(qū)結(jié)構(gòu)的定義,一個(gè)網(wǎng)絡(luò)可以看作是多個(gè)社區(qū)組合而成。對(duì)于社區(qū)結(jié) 構(gòu)劃分,有兩個(gè)關(guān)鍵問題需要解決:一是確定社區(qū)的數(shù)量,對(duì)于未知的網(wǎng)絡(luò)結(jié)構(gòu),其社區(qū)劃 分和結(jié)構(gòu)特征是未知的;另一個(gè)就是每個(gè)社區(qū)成員確定,避免社區(qū)結(jié)構(gòu)的不合理劃分。傳統(tǒng) 的社區(qū)劃分方法如圖分割將網(wǎng)絡(luò)中的每一個(gè)節(jié)點(diǎn)硬性地劃分到一個(gè)特定的社區(qū),而忽略了 其內(nèi)在聯(lián)系。在現(xiàn)實(shí)網(wǎng)絡(luò)中,由于網(wǎng)絡(luò)機(jī)構(gòu)的復(fù)雜性和多樣性,一個(gè)節(jié)點(diǎn)可能同時(shí)屬于多個(gè) 社區(qū),即在劃分過程中,存在節(jié)點(diǎn)的不確定性或模糊性,社區(qū)結(jié)構(gòu)的模糊性劃分更接近真實(shí) 的網(wǎng)絡(luò)結(jié)構(gòu)。
[0004] 其次,就社區(qū)結(jié)構(gòu)本身來說,其內(nèi)部節(jié)點(diǎn)之間是基于某種相似性或共同特征如社 交網(wǎng)絡(luò)中的不同興趣、愛好、主題等關(guān)系聯(lián)系在一起,這是人們研究社區(qū)劃分的出發(fā)點(diǎn)之 一。然而,大量現(xiàn)存的社區(qū)結(jié)構(gòu)檢測(cè)方法將這種相似性關(guān)系作為一種確定性或硬性的度量, 如此的劃分會(huì)導(dǎo)致社區(qū)的不合理劃分.實(shí)際上,在真實(shí)網(wǎng)絡(luò)結(jié)構(gòu)如社交網(wǎng)絡(luò)中實(shí)體間的相 似關(guān)系是模糊的或不確定性的,而以一種確定性度量來劃分將忽略網(wǎng)絡(luò)中其他重要信息。 本發(fā)明基于模糊理論的思想提出一種網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)的模糊劃分方法。解決模糊劃分問題的 基礎(chǔ)就是模糊集合理論。在網(wǎng)絡(luò)結(jié)構(gòu)中,節(jié)點(diǎn)間模糊關(guān)系強(qiáng)調(diào)網(wǎng)絡(luò)節(jié)點(diǎn)以不同的程度隸屬 于多個(gè)社區(qū)類別,而非嚴(yán)格劃分到某一特定社區(qū)。同時(shí),模糊性的相似性關(guān)系可看作是確定 性關(guān)系的一種泛化。
[0005] 針對(duì)社區(qū)結(jié)構(gòu)檢測(cè)中社區(qū)有效劃分與劃分?jǐn)?shù)目兩個(gè)基本問題,本發(fā)明提出了一種 基于模糊聚類技術(shù)的網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)發(fā)現(xiàn)方法,同時(shí)揭示了在不同分辨率條件下的網(wǎng)絡(luò)社區(qū) 的層次結(jié)構(gòu)。本發(fā)明提出用模糊聚類的思想來發(fā)現(xiàn)復(fù)雜網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu),實(shí)現(xiàn)模糊劃分, 此方法是基于一種模糊關(guān)系模型而非以往的圖模型來解決社區(qū)發(fā)現(xiàn)問題。

【發(fā)明內(nèi)容】

[0006] 針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明的目的是提供一種基于模糊聚類的多分辨率社區(qū) 發(fā)現(xiàn)方法。
[0007] 根據(jù)本發(fā)明提供的基于模糊聚類的多分辨率社區(qū)發(fā)現(xiàn)方法,包括如下步驟:
[0008] 模糊轉(zhuǎn)換步驟:根據(jù)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)建立鄰接矩陣A,并基于鄰接矩陣A計(jì)算相鄰節(jié) 點(diǎn)間的模糊關(guān)系,將得到的模糊關(guān)系矩陣進(jìn)行模糊傳遞轉(zhuǎn)換,獲得模糊等價(jià)矩陣;
[0009] 模糊截取步驟:將模糊等價(jià)矩陣映射到網(wǎng)絡(luò)結(jié)構(gòu)中,得到模糊等價(jià)類,利用模糊閾 值來截取該模糊等價(jià)類,得到對(duì)應(yīng)模糊閾值水平上的模糊社區(qū)結(jié)構(gòu)聚類,并用模塊度來評(píng) 價(jià)模糊社區(qū)的聚類效果。
[0010] 優(yōu)選地,所述模糊轉(zhuǎn)換步驟包括:
[0011] 步驟Ml:對(duì)待分析網(wǎng)絡(luò)建立網(wǎng)絡(luò)的鄰接矩陣A,根據(jù)節(jié)點(diǎn)順序?qū)?jié)點(diǎn)進(jìn)行編號(hào),編 號(hào)從1開始,構(gòu)建元素為0或1的N階方陣,其中N為網(wǎng)絡(luò)節(jié)點(diǎn)總個(gè)數(shù);
[0012] 步驟M2:得到相鄰節(jié)點(diǎn)間的相似度,將確定性的鄰接關(guān)系轉(zhuǎn)化為模糊相似關(guān)系,實(shí) 現(xiàn)將鄰接矩陣A轉(zhuǎn)換為模糊關(guān)系矩陣R;
[0013] 步驟M3:為進(jìn)一步度量非相鄰節(jié)點(diǎn)間的相似性,對(duì)模糊關(guān)系矩陣R進(jìn)行模糊傳遞變 換,使節(jié)點(diǎn)間的相似性達(dá)到一致的穩(wěn)定性;
[0014] 步驟M4:通過模糊傳遞函數(shù)得到的一致收斂的模糊關(guān)系,建立模糊傳遞矩陣,并獲 得模糊等價(jià)矩陣。
[0015] 優(yōu)選地,所述步驟M2中,根據(jù)定義的結(jié)構(gòu)相似性度量算法得到相鄰節(jié)點(diǎn)間的相似 度,所述結(jié)構(gòu)相似性度量算法的計(jì)算公式如下:
[0017]式中,u,v*別為網(wǎng)絡(luò)節(jié)點(diǎn)集合中的任意節(jié)點(diǎn),Γ( ·)表示某節(jié)點(diǎn)的鄰接節(jié)點(diǎn)集 合,Γ (u)表示節(jié)點(diǎn)u的鄰接節(jié)點(diǎn)集合,Γ (ν)表示節(jié)點(diǎn)ν的鄰接節(jié)點(diǎn)集合,w( ·)表示某兩節(jié) 點(diǎn)間連邊的權(quán)重,W(u,x)表示節(jié)點(diǎn)U與節(jié)點(diǎn)X間連邊的權(quán)重,W(V,X)表示節(jié)點(diǎn)V與節(jié)點(diǎn)X間連 邊的權(quán)重結(jié)構(gòu)相似度,S(u,v) e [0, 1];對(duì)于無向無權(quán)重網(wǎng)絡(luò)任意節(jié)點(diǎn)間連邊的權(quán)重w( ·) =1,則結(jié)構(gòu)相似性度量算法的公式進(jìn)一步簡化為如下形式:
[0019]優(yōu)選地,所述步驟M3中的模糊傳遞變換函數(shù)如下:
[0021] 式中,η表示矩陣的維數(shù),n= I V|,V表示網(wǎng)絡(luò)節(jié)點(diǎn)序列向量,R表示模糊關(guān)系矩陣,t (R)表示模糊等價(jià)關(guān)系,U表示模糊關(guān)系合成運(yùn)算,k表示模糊關(guān)系合成運(yùn)算的次數(shù),其滿足 K [吻幻+ 1;模糊等價(jià)關(guān)系滿足i?以⑷。
[0022] 優(yōu)選地,所述模糊等價(jià)矩陣,具有以下性質(zhì):
[0023]性質(zhì)1:對(duì)稱性;對(duì)于無向網(wǎng)絡(luò)結(jié)構(gòu),節(jié)點(diǎn)間的模糊關(guān)系滿足對(duì)稱性;即節(jié)點(diǎn)i到節(jié) 點(diǎn)j的模糊關(guān)系r(i,j)等價(jià)于節(jié)點(diǎn)j到節(jié)點(diǎn)i的模糊關(guān)系r( j,i);
[0024] 性質(zhì)2:自反性;在模糊關(guān)系矩陣中,任何節(jié)點(diǎn)到自身的模糊關(guān)系恒為1,即r(i,i) =1 ;
[0025] 性質(zhì)3:傳遞性;對(duì)于經(jīng)過模糊傳遞變換的模糊等價(jià)矩陣,滿足e t(/?)。
[0026] 優(yōu)選地,所述模糊截取步驟包括:
[0027] 步驟N1:將得到的模糊等價(jià)關(guān)系矩陣與網(wǎng)絡(luò)節(jié)點(diǎn)一一對(duì)應(yīng),得到模糊等價(jià)類,所述 模糊等價(jià)類等價(jià)于網(wǎng)絡(luò)的層次聚類樹結(jié)構(gòu);
[0028] 步驟N2:選定任意的模糊閾值ε e [0,1 ],對(duì)模糊等價(jià)類進(jìn)行截取,得到對(duì)應(yīng)的模糊 社區(qū)劃分結(jié)果;
[0029]步驟N3:計(jì)算對(duì)應(yīng)的模糊社區(qū)劃分結(jié)果的模塊度值;
[0030]步驟N4:調(diào)節(jié)模糊閾值ε,得到不同分辨率條件下的社區(qū)結(jié)構(gòu)。
[0031 ]優(yōu)選地,所述步驟Ν3中模塊度值Q的計(jì)算公式如下:
[0033] 式中,i表示網(wǎng)絡(luò)劃分中的社區(qū)數(shù)量,eii表示第i個(gè)社區(qū)內(nèi)部節(jié)點(diǎn)間連邊的數(shù)量占 整個(gè)網(wǎng)絡(luò)邊數(shù)的比例,ai表示一段與第i個(gè)社區(qū)中節(jié)點(diǎn)相連的連邊數(shù)量的比例。
[0034] 與現(xiàn)有技術(shù)相比,本發(fā)明具有如下的有益效果:
[0035] 1、本發(fā)明在傳統(tǒng)網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的基礎(chǔ)上,運(yùn)用模糊聚類方法實(shí)現(xiàn)網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)的 有效劃分;與現(xiàn)有算法不同的是,其模糊化處理節(jié)點(diǎn)與社區(qū)間的相似關(guān)系而非一種確定性 的硬劃分,從而避免了網(wǎng)絡(luò)結(jié)構(gòu)的不合理劃分。
[0036] 2、本發(fā)明在對(duì)模糊策略的控制上實(shí)現(xiàn)了不同分辨率下的網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)劃分,進(jìn)一 步挖掘出了復(fù)雜網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)特性。
[0037] 3、本發(fā)明基于模糊特性,結(jié)合節(jié)點(diǎn)的局部結(jié)構(gòu)信息,提出了有效的結(jié)構(gòu)相似性度 量方法,提升了社區(qū)結(jié)構(gòu)劃分的合理性和可靠性。
【附圖說明】
[0038]通過閱讀參照以下附圖對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、 目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0039] 圖1為本發(fā)明所提供方法與其他方法在GN網(wǎng)絡(luò)上的性能對(duì)比圖。
[0040] 圖2為本發(fā)明所提供方法與其他方法在LFR網(wǎng)絡(luò)上的性能對(duì)比圖。
[0041 ]圖3為本發(fā)明對(duì)上述GN網(wǎng)絡(luò)上的模糊閾值取值的分布圖。
[0042] 圖4為本發(fā)明對(duì)上述LFR網(wǎng)絡(luò)上的模糊閾值取值的分布圖。
[0043] 圖5(a)為本發(fā)明分析一個(gè)真實(shí)網(wǎng)絡(luò)的一種劃分結(jié)果示意圖,圖5(b)為另一種劃分 結(jié)果示意圖。
[0044]圖6為本發(fā)明對(duì)上述真實(shí)網(wǎng)絡(luò)進(jìn)行模糊聚類得到不同分辨率下的網(wǎng)絡(luò)社區(qū)分布 圖。
【具體實(shí)施方式】
[0045]下面結(jié)合具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)說明。以下實(shí)施例將有助于本領(lǐng)域的技術(shù) 人員進(jìn)一步理解本發(fā)明,但不以任何形式限制本發(fā)明。應(yīng)當(dāng)指出的是,對(duì)本領(lǐng)域的普通技術(shù) 人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變化和改進(jìn)。這些都屬于本發(fā)明 的保護(hù)范圍。
[0046] 根據(jù)本發(fā)明提供的基于模糊聚類的多分辨率社區(qū)發(fā)現(xiàn)方法,包括如下步驟:
[0047] 模糊轉(zhuǎn)換步驟:根據(jù)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)建立鄰接矩陣A,并基于鄰接矩陣A計(jì)算相鄰節(jié) 點(diǎn)間的模糊關(guān)系,將得到的模糊關(guān)系矩陣進(jìn)行模糊傳遞轉(zhuǎn)換,獲得模糊等價(jià)矩陣;
[0048] 模糊截取步驟:將模糊等價(jià)矩陣映射到網(wǎng)絡(luò)結(jié)構(gòu)中,得到模糊等價(jià)類,利用模糊閾 值來截取該模糊等價(jià)類,得到此模糊閾值水平上的模糊社區(qū)結(jié)構(gòu)聚類,并用模塊度來評(píng)價(jià) 模糊社區(qū)的聚類效果。
[0049] 所述模糊轉(zhuǎn)換步驟包括:
[0050] 步驟Ml:對(duì)待分析網(wǎng)絡(luò)建立網(wǎng)絡(luò)的鄰接矩陣A,根據(jù)節(jié)點(diǎn)順序?qū)?jié)點(diǎn)進(jìn)行編號(hào),編 號(hào)從1開始,構(gòu)建元素為〇或1的N階方陣,其中N為節(jié)點(diǎn)總個(gè)數(shù);
[0051] 步驟M2:根據(jù)定義的結(jié)構(gòu)相似性度量算法得到相鄰節(jié)點(diǎn)間的相似度,將確定性的 鄰接關(guān)系轉(zhuǎn)化為模糊相似關(guān)系,實(shí)現(xiàn)將鄰接矩陣A轉(zhuǎn)換為模糊關(guān)系矩陣R;
[0052]步驟M3:為進(jìn)一步度量非相鄰節(jié)點(diǎn)間的相似性,對(duì)模糊關(guān)系矩陣R進(jìn)行模糊傳遞變 換,使節(jié)點(diǎn)間的相似性達(dá)到一致的穩(wěn)定性;
[0053]步驟M4:通過模糊傳遞函數(shù)得到的一致收斂的模糊關(guān)系,建立模糊傳遞矩陣,并獲 得模糊等價(jià)矩陣。
[0054]所述步驟M2中的結(jié)構(gòu)相似性度量算法如下:
[0056]式中,u,v分別為網(wǎng)絡(luò)節(jié)點(diǎn)集合中的任意節(jié)點(diǎn),Γ (·)表示某節(jié)點(diǎn)的鄰接節(jié)點(diǎn)集 合,Γ (u)表示節(jié)點(diǎn)u的鄰接節(jié)點(diǎn)集合,Γ (v)表示節(jié)點(diǎn)v的鄰接節(jié)點(diǎn)集合,w( ·)表示某節(jié)點(diǎn) 間連邊的權(quán)重,W(U,X)表示節(jié)點(diǎn)U間連邊的權(quán)重,W(V,X)表示節(jié)點(diǎn)V間連邊的權(quán)重結(jié)構(gòu)相似 度,s(u,v) e [0, 1];對(duì)于無向無權(quán)重網(wǎng)絡(luò)任意節(jié)點(diǎn)間連邊的權(quán)重w( · ) = 1,則結(jié)構(gòu)相似性 度量算法的公式進(jìn)一步簡化為如下形式:
[0058]所述步驟M3中的模糊傳遞變換函數(shù)如下:
[0059] t(R) = Uk;
[0060] 式中,η表示矩陣的維數(shù),其滿足=|V|(V表示網(wǎng)絡(luò)節(jié)點(diǎn)序列),R表示模糊關(guān)系矩 陣,t(R)表示模糊等價(jià)關(guān)系,U表示模糊關(guān)系合成運(yùn)算,k表示模糊關(guān)系合成運(yùn)算的次數(shù),其 滿足+1;模糊等價(jià)關(guān)系滿足_.i? :s
[0061 ]所述模糊等價(jià)矩陣,具有以下性質(zhì):
[0062] 性質(zhì)1:對(duì)稱性;對(duì)于無向網(wǎng)絡(luò)結(jié)構(gòu),節(jié)點(diǎn)間的模糊關(guān)系滿足對(duì)稱性;即節(jié)點(diǎn)i到節(jié) 點(diǎn)j的模糊關(guān)系r(i,j)等價(jià)于節(jié)點(diǎn)j到節(jié)點(diǎn)i的模糊關(guān)系r( j,i);
[0063] 性質(zhì)2:自反性;在模糊關(guān)系矩陣中,任何節(jié)點(diǎn)到自身的模糊關(guān)系恒為1,即r(i,i) =1〇
[0064] 性質(zhì)3:傳遞性;對(duì)于經(jīng)過模糊傳遞變換的模糊等價(jià)矩陣,滿足i? £ t(/?J <
[0065] 所述模糊截取步驟包括:
[0066] 步驟N1:將得到的模糊等價(jià)關(guān)系矩陣與網(wǎng)絡(luò)節(jié)點(diǎn)一一對(duì)應(yīng),得到模糊等價(jià)類,所述 模糊等價(jià)類等價(jià)于網(wǎng)絡(luò)的層次聚類樹結(jié)構(gòu);
[0067] 步驟N2:選定任意的模糊閾值ε e [0, 1],對(duì)模糊等價(jià)類進(jìn)行截取,得到對(duì)應(yīng)的模糊 社區(qū)劃分結(jié)果;
[0068] 步驟N3:計(jì)算對(duì)應(yīng)的模糊社區(qū)劃分結(jié)果的模塊度值;
[0069] 步驟N4:調(diào)節(jié)模糊閾值ε,得到不同分辨率條件下的社區(qū)結(jié)構(gòu)。
[0070] 所述步驟Ν3中模塊度值Q的計(jì)算公式如下:
[0072]式中,i表示網(wǎng)絡(luò)劃分中的社區(qū)數(shù)量,eii表示社區(qū)i內(nèi)部節(jié)點(diǎn)間連邊的數(shù)量占整個(gè) 網(wǎng)絡(luò)邊數(shù)的比例,&1表示一段與社區(qū)i中節(jié)點(diǎn)相連的連邊數(shù)量的比例。一般地,模塊度值越 大,表示網(wǎng)絡(luò)社區(qū)劃分的效果越好。
[0073] 具體地,包括如下步驟:
[0074] 步驟S1:根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)信息建立網(wǎng)絡(luò)的鄰接矩陣A,根據(jù)節(jié)點(diǎn)順序?qū)?jié)點(diǎn)進(jìn)行編 號(hào),編號(hào)從1開始,構(gòu)建N階方陣,其中N為節(jié)點(diǎn)總個(gè)數(shù),如果兩節(jié)點(diǎn)間有直接連邊用1表示,否 則為〇;
[0075] 步驟S2:轉(zhuǎn)換模糊關(guān)系。根據(jù)定義的結(jié)構(gòu)相似性度量計(jì)算相鄰節(jié)點(diǎn)間的相似度,將 確定性的鏈接關(guān)系轉(zhuǎn)化為模糊相似關(guān)系,實(shí)現(xiàn)將鄰接矩陣A轉(zhuǎn)換為模糊關(guān)系矩陣R;
[0076]步驟S3:模糊傳遞轉(zhuǎn)換。為進(jìn)一步度量非相鄰節(jié)點(diǎn)間的相似性,對(duì)模糊關(guān)系矩陣R 進(jìn)行傳遞變換,使節(jié)點(diǎn)間的相似性達(dá)到一致的穩(wěn)定性,對(duì)R矩陣按模糊傳遞函數(shù)進(jìn)行模糊傳 遞變換;
[0077] 步驟S4:模糊等價(jià)矩陣;根據(jù)通過模糊傳遞函數(shù)計(jì)算得到的一致收斂的模糊關(guān)系 建立模糊等價(jià)矩陣;
[0078] 步驟S5:模糊等價(jià)類,將得到的模糊等價(jià)關(guān)系矩陣,與網(wǎng)絡(luò)節(jié)點(diǎn)一一對(duì)應(yīng),得到模 糊等價(jià)類,此等價(jià)類等價(jià)于網(wǎng)絡(luò)的層次聚類樹結(jié)構(gòu);
[0079] 步驟S6:選定任意的模糊閾值ε e [0, 1],對(duì)模糊等價(jià)類進(jìn)行截取,得到對(duì)應(yīng)的模糊 群體劃分;
[0080] 步驟S7:根據(jù)上述模塊度定義,計(jì)算對(duì)應(yīng)的模糊社區(qū)劃分的模塊度值,模塊度值越 大,說明網(wǎng)絡(luò)社區(qū)劃分效果越好;
[0081] 步驟S8:調(diào)節(jié)模糊閾值ε,得到不同分辨率條件下的社區(qū)結(jié)構(gòu)。
[0082] 為詳細(xì)說明所提供方法的有效性和可擴(kuò)展性,本發(fā)明通過實(shí)驗(yàn)進(jìn)行了下面的實(shí)施 例。
[0083] 1)實(shí)驗(yàn)條件:CPU Intel Pentium Dual-Core 2.0-GHz,RAM 4.00GB,Windows 7操 作系統(tǒng),仿真軟件RS tud i o。
[0084] 2)實(shí)驗(yàn)對(duì)象:
[0085] 實(shí)驗(yàn)分別選取人工合成網(wǎng)絡(luò)和真實(shí)世界網(wǎng)絡(luò)。
[0086]人工合成網(wǎng)絡(luò)
[0087] 更進(jìn)一步地,Girvan和Newman于2002年在論文 "Community structure in social and biological networks"Girvan M,Newman M.E.Proceedings of the National Academy of Sciences of the United States of America.2002,99(12) :7821-6.(人工 生成網(wǎng)絡(luò)分別使用GN基準(zhǔn)網(wǎng)絡(luò)和LFR基準(zhǔn)網(wǎng)絡(luò))中提出。該網(wǎng)絡(luò)由128個(gè)節(jié)點(diǎn)組成四個(gè)相等 規(guī)模的社區(qū)結(jié)構(gòu),節(jié)點(diǎn)具有相同的度分布,而節(jié)點(diǎn)的出度和入度可調(diào)節(jié),其用混合參數(shù)μ表 示節(jié)點(diǎn)的出入度比例以調(diào)整網(wǎng)絡(luò)的模糊程度,μ值越大,網(wǎng)絡(luò)社區(qū)間的界限越模糊。
[0088] Lancichinetti等人在2008年提出(Lancichinetti A,F(xiàn)ortunato S,Radicchi F.Benchmark graphs for testing community detection algorithms.Physical Review E.2008,78(4): 046110.) LFR基準(zhǔn)網(wǎng)絡(luò);實(shí)際上,LFR基準(zhǔn)網(wǎng)絡(luò)是GN基準(zhǔn)網(wǎng)絡(luò)的擴(kuò)展,其反映 了節(jié)點(diǎn)度分布和社區(qū)結(jié)構(gòu)規(guī)模分布的同質(zhì)性,即節(jié)點(diǎn)度分布和社區(qū)規(guī)模滿足冪律分布,使 得網(wǎng)絡(luò)結(jié)果更接近真實(shí)網(wǎng)絡(luò)。為了評(píng)價(jià)發(fā)明方法的性能,使用標(biāo)準(zhǔn)互信息(NMI)來度量劃分 結(jié)果。若NMI值越接近于1,說明發(fā)現(xiàn)的網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)越接近真實(shí)的社區(qū)結(jié)構(gòu)。
[0089] 本發(fā)明所描述方法在實(shí)驗(yàn)中用Strsim表示。同時(shí),為體現(xiàn)其性能效果,本方法與其 他幾個(gè)經(jīng)典的社區(qū)發(fā)現(xiàn)方法進(jìn)行了比較。這些方法包括:Pons等人于2005年在《20th International Symposium on Computer and Information Sciences》上發(fā)表的 "Computing communities in large networks using random walks" 中提出的Walktrap 方法,Vincent等人于2008年在《Journal of Statistical Mechanics》上發(fā)表的 "Fast unfolding of communities in large networks" 中提出的BGLL方法,以及Rosvall和 Bergstrom于2008年在《Proceedings of the National Academy of Sciences of the United States of America》上發(fā)表的 "Maps of random walks on complex networks reveal community structure" 中提出白勺Infomap方t去。
[0090] 基于GN基準(zhǔn)網(wǎng)絡(luò)的仿真實(shí)驗(yàn)結(jié)果如圖1所示。當(dāng)混合系數(shù)小于0.4時(shí),所有方法都 能有效檢測(cè)真實(shí)的網(wǎng)絡(luò)社區(qū)結(jié)構(gòu),即NMI = 1。隨著混合系數(shù)逐漸增大,各方法的社區(qū)結(jié)構(gòu)識(shí) 別能力呈現(xiàn)不同程度下降。如圖所示,當(dāng)混合系數(shù)大于〇。5時(shí),Infomap方法的社區(qū)識(shí)別能力 急劇下降為0,Walktrap和BGLL方法的性能也逐步降低,而本發(fā)明所提供方法的性能卻呈現(xiàn) 穩(wěn)定。原因在于本方法采取了一種局部搜索策略來度量節(jié)點(diǎn)間的相似度,在網(wǎng)絡(luò)社區(qū)邊界 模糊的情況下,仍然能識(shí)別最近鄰的節(jié)點(diǎn)而保持一定的識(shí)別能力。顯而易見,本發(fā)明所提供 方法對(duì)于社區(qū)邊界模糊的網(wǎng)絡(luò)結(jié)構(gòu)具有明顯優(yōu)勢(shì)。
[0091] 基于LFR基準(zhǔn)網(wǎng)絡(luò)的仿真實(shí)驗(yàn)結(jié)果如圖2所示。在LFR網(wǎng)絡(luò)中,節(jié)點(diǎn)度分布、社區(qū)數(shù) 量和社區(qū)規(guī)模均有變化。當(dāng)混合系數(shù)不大于0.5時(shí),所有方法對(duì)LFR網(wǎng)絡(luò)中的絡(luò)社區(qū)結(jié)構(gòu)都 有很好的識(shí)別能力。隨著混合系數(shù)不斷增大,各方法的性能也呈現(xiàn)不同程度的下降。當(dāng)混合 系數(shù)超過0.6時(shí),Infomap方法已無法識(shí)別出其中的網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)(匪I = 0),而其他方法的 性能也逐漸降低。如圖所示,當(dāng)混合系數(shù)為0.6時(shí),BGLL方法能獲得較好效果,然而,當(dāng)網(wǎng)絡(luò) 社區(qū)邊界更加模糊時(shí),其性能較Walktrap和Strsim方法較差。而本發(fā)明所描述方法在混合 系數(shù)不斷降低時(shí)仍然能保持一定的識(shí)別能力。該實(shí)驗(yàn)進(jìn)一步體現(xiàn)了本方法的有效性和穩(wěn)定 性。
[0092]針對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的模糊聚類,本方法對(duì)模糊閾值的選取進(jìn)行了評(píng)價(jià),并得到模糊閾 值最優(yōu)的經(jīng)驗(yàn)取值區(qū)間,如圖3和圖4所示。圖3為本方法在GN基準(zhǔn)網(wǎng)絡(luò)上在不同模糊系數(shù)條 件下的匪I取值分布。該分布呈現(xiàn)階梯狀分布,并在不同的混合系數(shù)下,呈現(xiàn)相似的趨勢(shì),最 終達(dá)到穩(wěn)定狀態(tài),此與上述實(shí)驗(yàn)結(jié)果一致。如圖所示,當(dāng)模糊閾值取值范圍為[0.2,0.4]時(shí), 本方法能取得最優(yōu)結(jié)果。同時(shí),通過分析圖4可以看出,當(dāng)混合系數(shù)小于0.5時(shí),模糊閾值取 值結(jié)果分布差別較大。當(dāng)混合系數(shù)大于〇. 5時(shí),呈現(xiàn)相似的趨勢(shì),并達(dá)到穩(wěn)定的結(jié)果。比較可 以發(fā)現(xiàn),當(dāng)模糊閾值取值范圍為[0.2,0.4]時(shí),本方法能取得最優(yōu)結(jié)果。
[0093] 真實(shí)世界網(wǎng)絡(luò)
[0094] 本實(shí)驗(yàn)中的真實(shí)世界網(wǎng)絡(luò)選用Zachary空手道倶樂部社交網(wǎng)絡(luò)。此網(wǎng)絡(luò)廣泛用于 測(cè)試社區(qū)檢測(cè)算法的有效性和可靠性。此網(wǎng)絡(luò)是基于Zachery對(duì)該倶樂部成員間的社會(huì)交 互進(jìn)行了長達(dá)兩年時(shí)間的調(diào)查和觀察,并構(gòu)建了一個(gè)具有34個(gè)倶樂部成員78條邊的交互網(wǎng) 絡(luò)。在觀察過程中,由于倶樂部管理者(節(jié)點(diǎn)1)和教練(節(jié)點(diǎn)33)之間的意見分歧,最終倶樂 部分裂成兩個(gè)較小的社區(qū)結(jié)構(gòu)。本方法應(yīng)用于該網(wǎng)絡(luò)的結(jié)果如圖5所示。圖中僅給出了其中 兩種劃分結(jié)果。當(dāng)對(duì)模糊閾值進(jìn)行調(diào)節(jié),可以得到不同的分辨率下的社區(qū)結(jié)構(gòu),其社區(qū)數(shù)目 與劃分結(jié)構(gòu)的模塊度值如圖6所示。當(dāng)該網(wǎng)絡(luò)得到4社區(qū)結(jié)構(gòu)時(shí),模塊度取得最大值。
[0095] 在實(shí)驗(yàn)中,本發(fā)明所提方法能有效檢測(cè)出網(wǎng)絡(luò)結(jié)構(gòu)中的分裂現(xiàn)象。實(shí)驗(yàn)結(jié)果表明, 兩個(gè)帶有明顯社區(qū)結(jié)構(gòu)的群組被檢測(cè)出,如圖5(a)所示,不同的網(wǎng)絡(luò)社區(qū)用不同的節(jié)點(diǎn)形 狀表示。通過調(diào)節(jié)模糊參數(shù),可以得到更高分辨率的網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)。如圖5(b)所示,該網(wǎng)絡(luò) 被劃分為3個(gè)社區(qū),圖中分別用不同的形狀表示。在該劃分中,由于節(jié)點(diǎn)間緊密的相似性,節(jié) 點(diǎn)25,26,29和32作為一個(gè)單獨(dú)的社區(qū)被提取。同時(shí),通過調(diào)節(jié)聚類參數(shù)ε,社區(qū)內(nèi)部的緊密 聯(lián)系的更小粒度的社區(qū)被發(fā)現(xiàn)。當(dāng)選取更大的模糊參數(shù)值時(shí),該網(wǎng)絡(luò)被劃分為4個(gè)社區(qū)結(jié) 構(gòu),其與Clauset等人提出的CNM算法劃分的結(jié)果一致。通過調(diào)節(jié)合適的參數(shù)值,不同數(shù)量的 社區(qū)結(jié)構(gòu)被提取,并對(duì)應(yīng)不同的模塊度值,如圖6所示。當(dāng)被劃分為4個(gè)社區(qū)結(jié)構(gòu)時(shí)有最大的 模塊度,而實(shí)際網(wǎng)絡(luò)對(duì)應(yīng)的2個(gè)社區(qū)的劃分并非最優(yōu),因此在模塊度水平相當(dāng)時(shí),應(yīng)根據(jù)更 有效的準(zhǔn)則來適當(dāng)選擇。而在本實(shí)驗(yàn)中,根據(jù)所提出方法,其社區(qū)劃分結(jié)構(gòu)是精確而有效 的。
[0096] 以上對(duì)本發(fā)明的具體實(shí)施例進(jìn)行了描述。需要理解的是,本發(fā)明并不局限于上述 特定實(shí)施方式,本領(lǐng)域技術(shù)人員可以在權(quán)利要求的范圍內(nèi)做出各種變化或修改,這并不影 響本發(fā)明的實(shí)質(zhì)內(nèi)容。在不沖突的情況下,本申請(qǐng)的實(shí)施例和實(shí)施例中的特征可以任意相 互組合。
【主權(quán)項(xiàng)】
1. 一種基于模糊聚類的多分辨率社區(qū)發(fā)現(xiàn)方法,其特征在于,包括如下步驟: 模糊轉(zhuǎn)換步驟:根據(jù)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)建立鄰接矩陣A,并基于鄰接矩陣A計(jì)算相鄰節(jié)點(diǎn)間 的模糊關(guān)系,將得到的模糊關(guān)系矩陣進(jìn)行模糊傳遞轉(zhuǎn)換,獲得模糊等價(jià)矩陣; 模糊截取步驟:將模糊等價(jià)矩陣映射到網(wǎng)絡(luò)結(jié)構(gòu)中,得到模糊等價(jià)類,利用模糊閾值來 截取該模糊等價(jià)類,得到對(duì)應(yīng)模糊閾值水平上的模糊社區(qū)結(jié)構(gòu)聚類,并用模塊度來評(píng)價(jià)模 糊社區(qū)的聚類效果。2. 根據(jù)權(quán)利要求1所述的基于模糊聚類的多分辨率社區(qū)發(fā)現(xiàn)方法,其特征在于,所述模 糊轉(zhuǎn)換步驟包括: 步驟Ml:對(duì)待分析網(wǎng)絡(luò)建立網(wǎng)絡(luò)的鄰接矩陣A,根據(jù)節(jié)點(diǎn)順序?qū)?jié)點(diǎn)進(jìn)行編號(hào),編號(hào)從1 開始,構(gòu)建元素為〇或1的N階方陣,其中N為網(wǎng)絡(luò)節(jié)點(diǎn)總個(gè)數(shù); 步驟M2:得到相鄰節(jié)點(diǎn)間的相似度,將確定性的鄰接關(guān)系轉(zhuǎn)化為模糊相似關(guān)系,實(shí)現(xiàn)將 鄰接矩陣A轉(zhuǎn)換為模糊關(guān)系矩陣R; 步驟M3:為進(jìn)一步度量非相鄰節(jié)點(diǎn)間的相似性,對(duì)模糊關(guān)系矩陣R進(jìn)行模糊傳遞變換, 使節(jié)點(diǎn)間的相似性達(dá)到一致的穩(wěn)定性; 步驟M4:通過模糊傳遞函數(shù)得到的一致收斂的模糊關(guān)系,建立模糊傳遞矩陣,并獲得模 糊等價(jià)矩陣。3. 根據(jù)權(quán)利要求2所述的基于模糊聚類的多分辨率社區(qū)發(fā)現(xiàn)方法,其特征在于,所述步 驟M2中,根據(jù)定義的結(jié)構(gòu)相似性度量算法得到相鄰節(jié)點(diǎn)間的相似度,所述結(jié)構(gòu)相似性度量 算法的計(jì)算公式如下-式中,u,v分別為網(wǎng)絡(luò)節(jié)點(diǎn)集合中的任意節(jié)點(diǎn),Γ (·)表示某節(jié)點(diǎn)的鄰接節(jié)點(diǎn)集合,Γ (u)表示節(jié)點(diǎn)u的鄰接節(jié)點(diǎn)集合,Γ (v)表示節(jié)點(diǎn)v的鄰接節(jié)點(diǎn)集合,w( ·)表示某兩節(jié)點(diǎn)間連 邊的權(quán)重,W(u,x)表示節(jié)點(diǎn)U與節(jié)點(diǎn)X間連邊的權(quán)重,W(V,X)表示節(jié)點(diǎn)V與節(jié)點(diǎn)X間連邊的權(quán) 重結(jié)構(gòu)相似度,S(u,v) e [〇, 1];對(duì)于無向無權(quán)重網(wǎng)絡(luò)任意節(jié)點(diǎn)間連邊的權(quán)重w( · ) = 1,則 結(jié)構(gòu)相似性度量算法的公式進(jìn)一步簡化為如下形式:4. 根據(jù)權(quán)利要求2所述的基于模糊聚類的多分辨率社區(qū)發(fā)現(xiàn)方法,其特征在于,所述步 驟M3中的模糊傳遞變換函數(shù)如下:式中,η表示矩陣的維數(shù),n= | V|,V表示網(wǎng)絡(luò)節(jié)點(diǎn)序列向量,R表示模糊關(guān)系矩陣,t(R) 表示模糊等價(jià)關(guān)系,U表示模糊關(guān)系合成運(yùn)算,k表示模糊關(guān)系合成運(yùn)算的次數(shù),其滿足 fc s LZ〇W] + 1;模糊等價(jià)關(guān)系滿足/? g £(/〇。5. 根據(jù)權(quán)利要求2所述的基于模糊聚類的多分辨率社區(qū)發(fā)現(xiàn)方法,其特征在于,所述模 糊等價(jià)矩陣,具有以下性質(zhì): 性質(zhì)1:對(duì)稱性;對(duì)于無向網(wǎng)絡(luò)結(jié)構(gòu),節(jié)點(diǎn)間的模糊關(guān)系滿足對(duì)稱性;即節(jié)點(diǎn)i到節(jié)點(diǎn)j的 模糊關(guān)系r(i,j)等價(jià)于節(jié)點(diǎn)j到節(jié)點(diǎn)i的模糊關(guān)系r( j,i); 性質(zhì)2:自反性;在模糊關(guān)系矩陣中,任何節(jié)點(diǎn)到自身的模糊關(guān)系恒為1,即r(i,i) = 1; 性質(zhì)3:傳遞性;對(duì)于經(jīng)過模糊傳遞變換的模糊等價(jià)矩陣,滿足i? ^ t(i?)。6. 根據(jù)權(quán)利要求1所述的基于模糊聚類的多分辨率社區(qū)發(fā)現(xiàn)方法,其特征在于,所述模 糊截取步驟包括: 步驟N1:將得到的模糊等價(jià)關(guān)系矩陣與網(wǎng)絡(luò)節(jié)點(diǎn)一一對(duì)應(yīng),得到模糊等價(jià)類,所述模糊 等價(jià)類等價(jià)于網(wǎng)絡(luò)的層次聚類樹結(jié)構(gòu); 步驟N2:選定任意的模糊閾值ee[〇,l],對(duì)模糊等價(jià)類進(jìn)行截取,得到對(duì)應(yīng)的模糊社區(qū) 劃分結(jié)果; 步驟N3:計(jì)算對(duì)應(yīng)的模糊社區(qū)劃分結(jié)果的模塊度值; 步驟N4:調(diào)節(jié)模糊閾值ε,得到不同分辨率條件下的社區(qū)結(jié)構(gòu)。7. 根據(jù)權(quán)利要求6所述的基于模糊聚類的多分辨率社區(qū)發(fā)現(xiàn)方法,其特征在于,所述步 驟Ν3中模塊度值Q的計(jì)算公式如下式中,i表示網(wǎng)絡(luò)劃分中的社區(qū)數(shù)量,eii表示第i個(gè)社區(qū)內(nèi)部節(jié)點(diǎn)間連邊的數(shù)量占整個(gè) 網(wǎng)絡(luò)邊數(shù)的比例,ai表示一段與第i個(gè)社區(qū)中節(jié)點(diǎn)相連的連邊數(shù)量的比例。
【文檔編號(hào)】G06K9/62GK105868791SQ201610237640
【公開日】2016年8月17日
【申請(qǐng)日】2016年4月15日
【發(fā)明人】潘理, 汪曉鋒, 李建華
【申請(qǐng)人】上海交通大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1