亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

適用論文合作網絡的基于社團結構的影響最大化算法

文檔序號:10656693閱讀:232來源:國知局
適用論文合作網絡的基于社團結構的影響最大化算法
【專利摘要】本發(fā)明提供一種適用論文合作網絡的基于社團結構的影響最大化算法(COMAX算法),包括如下步驟:1)社團發(fā)現(xiàn)階段a構建論文合作網絡圖;b合并局部社團;c構建新的網絡圖;d結束;2)種子節(jié)點選取階段a計算每個社團的影響力;b選擇影響力最大社團中對應的節(jié)點;c結束。本發(fā)明的基于社團結構的影響最大化算法為論文合作網絡的影響最大化問題提供了新的解決方案,結果表明,在ICM模型上,我們提出的COMAX算法在影響覆蓋范圍上與貪心算法接近,而且時間效率非常好。
【專利說明】
適用論文合作網絡的基于社團結構的影響最大化算法
技術領域
[0001] 本發(fā)明設及一種論文合作網絡的影響最大化問題求解方法,尤其設及基于社團結 構的影響最大化問題求解方法。
【背景技術】
[0002] 近些年來,在線社交網絡迅猛發(fā)展,出現(xiàn)了越來越多的社交網站。運些社交網絡中 的信息傳播,無論是規(guī)模還是效率都已經超越了現(xiàn)實生活。影響最大化問題關注的是如何 選取固定數(shù)量的種子節(jié)點,使得信息傳播的覆蓋范圍最大化。當我們需要對某一學科或領 域做調查或深入理解時,我們不會查看該領域的全部資料,我們會挑選一部分高影響力的 作者的作品,如何尋找運些高影響力的作者就是種子節(jié)點選取的過程。
[0003] 2003年,Kempe、Kleinberg和!"ardosS人[Maximizing the Spread of Influence through a Social化twork]形式化的定義了影響最大化問題,將影響最大化問題轉為一 個離散優(yōu)化問題,并且證明該問題是NP-化rd難度。在線性闊值模型和獨立級聯(lián)模型下,他 們給出了貪屯、算法,并且證明了貪屯、算法與最優(yōu)算法的近似比為(l-1/e)。但是貪屯、算法的 時間復雜度非常高,它沒有考慮網絡的度分度情況,沒有考慮網絡的社團結構,每次選取種 子節(jié)點時都需要重新計算每個種子節(jié)點的影響力,時間效率比較低。
[0004] 2007年,針對貪屯、算法時間復雜度高的問題,Leskovec等人[Cost-effective Outbreak Detection in Networks]運用影響最大化中的子模特性,提出了 "Lazy 化rward"的優(yōu)化策略,并提出了CELF算法,化EF算法由于運用了子模特性,在種子選取階 段,減少了計算規(guī)模,在一定程度上提高了貪屯、算法的效率,但還不適用于大規(guī)模的社會網 絡。
[0005] 2009年,Chen Wei等人[Efficient Influence Maximization in Social Networks]在貪屯、算法的高時間復雜度的基礎上,提出了化wGreedy算法和MixGreedy算法。 其中化WGreedy算法是對原網絡圖進行預處理,將與傳播過程無關的邊進行刪除,最終的問 題就變成了求種子節(jié)點集合在新的網絡圖中的可達節(jié)點集。MixGreedy算法是化wGreedy算 法與CELF算法的結合,選取第一個節(jié)點時使用化WGreedy算法,計算出每個節(jié)點的初始影響 力,之后選取種子節(jié)點時使用CELF算法。結果表明,NewGreedy算法與MixGreedy算法的覆蓋 范圍接近貪屯、算法,時間效率比貪屯、算法高,但也需要多次運用蒙特卡羅模擬實驗,總體效 率還比較低,不適用于大規(guī)模的社會網絡。
[0006] 很多影響最大化算法,未考慮到網絡的社團結構,但社團內部的節(jié)點間的聯(lián)系比 社團外部聯(lián)系緊密,相應的在信息傳播過程中,節(jié)點激活與其處于同一社團內部的其他節(jié) 點可能性也比激活社團外部節(jié)點可能性更大。我們提出了基于社團結構的影響最大化算 法,將整個網絡劃分成一個個相對獨立的社團,在每個社團內部計算節(jié)點影響力,然后將最 大影響力作為社團影響力。選取了種子節(jié)點之后,只需要重新計算一個社團的影響力值,不 需要全部重新計算,大大加快了選取種子節(jié)點的效率。

【發(fā)明內容】

[0007] 本發(fā)明所要解決的技術問題是提供一種適用論文合作網絡的影響最大化問題的 種子節(jié)點選取方法。
[0008] 技術方案:為解決上述問題,本發(fā)明的適用論文合作網絡的基于社團結構的影響 最大化算法包括如下步驟:
[0009] 1)社團發(fā)現(xiàn)階段;
[0010] a構建初始論文合作網絡圖;
[00川 13合并局部社團;
[0012] C構建新的網絡圖;
[001引 d結束;
[0014] 2)種子節(jié)點選取階段
[0015] a計算社團影響力;
[0016] b選擇種子節(jié)點;
[0017] C 結束。
[0018] 本發(fā)明中,步驟l)-a中構建的網絡圖中節(jié)點代表作者,網絡圖中的邊表示作者之 間存在合作關系,共同發(fā)表過論文,邊的權值表示共同發(fā)表過的論文的數(shù)量。
[0019] 本發(fā)明中,步驟l)-b中合并局部社團是指,將每個節(jié)點都當做是一個局部社團,每 個節(jié)點選取與自己相連且合并之后模塊度值增量最大的社團合并,其中模塊度值的公式 為:
[0020;
[0021] 其中,nc表示所有社團的數(shù)量,inc表示社團C內部的邊的數(shù)量,tote表示與社團C中 節(jié)點相連的所有的邊的數(shù)量。
[0022] 節(jié)點i與社團C合并之后模塊度值的增量為:
[0023;
[0024] 其中表示節(jié)點i與社團C相連的邊的數(shù)量,合并之后變成了新社團的內部邊, ki表示節(jié)點i的度數(shù)。
[0025] 本發(fā)明中,步驟l)-c中構建新的網絡圖是指,將步驟l)-b中得到的合并之后的社 團里的所有節(jié)點用一個節(jié)點表示作為新的網絡圖中的節(jié)點,原來社團之間的連邊變成新的 網絡圖中節(jié)點之間的連邊。
[0026] 本發(fā)明中,步驟2)-a中計算社團影響力是指將社團內部中,影響力最大節(jié)點的影 響值作為社團的影響力,并記錄對應節(jié)點。
[0027] 本發(fā)明中,步驟2)-b中選擇種子節(jié)點是指選取影響力最大社團中對應的節(jié)點,并 且需要重新計算對應社團的影響力。
[0028] 本發(fā)明的有益效果:本發(fā)明的基于社團結構的論文合作網絡的影響最大化算法為 解決影響最大化問題提供了一種新的啟發(fā)式的解決方案,選取的種子節(jié)點的影響傳播范圍 與貪屯、算法接近,而且時間效率比較高,適用于解決大規(guī)模社會網絡的影響最大化問題。
【附圖說明】
[0029] 圖1為本發(fā)明實施例的基于社團結構的論文合作網絡的影響最大化方法的流程 圖。
[0030] 圖2為圖1中社團發(fā)現(xiàn)階段流程圖。
[0031 ]圖3為圖1中種子階段選取階段的流程圖。
[0032] 圖4為發(fā)明提出的算法(COMAX)與其他方法在化P數(shù)據集上選取的種子節(jié)點的影響 覆蓋范圍的對比。
【具體實施方式】
[0033] 為了更了解本發(fā)明的技術內容,特舉具體實施例并配合所附圖式說明如下。
[0034] 如圖1所示,本方法一共有兩個階段,社團發(fā)現(xiàn)階段和種子節(jié)點選取階段。
[0035] 適用論文合作網絡的基于社團結構的影響最大化算法包括如下步驟:
[0036] 1)社團發(fā)現(xiàn)階段;
[0037] a構建初始論文合作網絡圖;
[003引b合并局部社團;
[0039] C構建新的網絡圖;
[0040] d 結束;
[0041] 2)種子節(jié)點選取階段
[0042] a計算社團影響力;
[0043] b選擇種子節(jié)點;
[0044] C 結束。
[0045] 如圖2所示為社團發(fā)現(xiàn)階段的流程圖,分為=大主要部分,構建原始網絡圖、合并 局部社團W及構建新的網絡圖。其中合并了局部社團之后,需要將同一局部社團內的所有 節(jié)點抽象成一個節(jié)點,組建新的網絡,再次進行合并。當模塊度值增量為正時才進行合并。
[0046] 社團發(fā)現(xiàn)階段的具體步驟如下:
[0047] 步驟1-0為方法開始;
[0048] 步驟1-1為遍歷論文集,運是構建網絡的第一步,需要將所有相關的論文集的作者 信息記錄下來。
[0049] 步驟1-2為抽取合作關系,步驟1-1構建好了網絡的節(jié)點,但是節(jié)點之間的邊W及 邊的權值還未知,作者之間合作過論文,就在兩者之間構建一條邊,最終邊的權值為兩個作 者合作過的論文的總的數(shù)量。
[0050] 步驟1-3為構建合作網絡圖,利用步驟1-1構建的節(jié)點W及步驟1-2構建的邊,構建 一個無向加權圖G(V,E,W) dV表示作者,E表示作者之間的合作關系,W表示作者之間合作論 文的數(shù)量。
[0051] 步驟1-4為計算節(jié)點與相連社團合并的模塊度值增量,節(jié)點i與社團C合并之后的 模塊度值增量為:
[0052]
庚中杉,樹。表示節(jié)點i與社團C相連的邊的數(shù)量,合并之后 變成了新社團的內部邊,ki表示節(jié)點i的度數(shù)。在運一步,對于每個節(jié)點,需要計算其與所有 相連社團合并之后的模塊度值增量,并記錄最大增量值W及對應社團。
[0053] 步驟1-5為判斷在所有節(jié)點當中,是否存在某個節(jié)點與相連社團合并之后的最大 模塊度值增量大于0,如果不存在,則跳轉到步驟1-8,社團發(fā)現(xiàn)階段結束。
[0054] 步驟1-6為合并階段,對于每個節(jié)點,將其與大于0的最大模塊度值增量的社團合 并。
[0055] 步驟1-7為構建新的網絡圖,將步驟1-6中合并之后的處于同一社團的所有節(jié)點抽 象為一個節(jié)點,原來的社團之間的邊作為新圖中的節(jié)點之間的邊,運樣新的網絡圖中的節(jié) 點數(shù)量與步驟1-6中合并之后的社團數(shù)量一致,每個節(jié)點代表之前的一個社團。然后再跳轉 到步驟1-4。
[0056] 步驟1-8為返回社團網絡的社團結構,社團發(fā)現(xiàn)階段至此結束。
[0057] 如圖3所示為種子節(jié)點選取階段的流程圖,分為兩大主要部分,計算社團影響力W 及選取種子節(jié)點。我們首先需要計算所有社團的影響力,然后選取最大影響力社團對應的 節(jié)點,之后只需要重新計算被選中的社團的影響力即可,其他社團無需重新計算。
[005引種子節(jié)點選取階段的具體步驟如下:
[0059] 步驟2-0為方法開始;
[0060] 步驟2-1為計算社團內部節(jié)點的影響力。我們使用信息傳播模型是獨立級聯(lián)模型, 對于加權網絡圖,節(jié)點V的影響力的期望值為:
[0061]
其中inv為節(jié)點V與社團內部相連節(jié)點的邊權 值之和,tv為節(jié)點V的鄰居中已經成為種子節(jié)點的邊權值之和,P為每條邊成功激活的概率。 對于節(jié)點U和節(jié)點V,它們之間的邊權值為t,假如U處于激活狀態(tài),則U激活V的概率為I-Q- p)t。
[0062] 步驟2-2為計算社團影響力,社團的影響力為社團內部所有節(jié)點的最大影響力值, 并記錄對應該影響力值的節(jié)點。
[0063] 步驟2-3為選取種子節(jié)點,首先定位到影響力最大的社團,然后選取社團對應的節(jié) 點,將節(jié)點加入到種子節(jié)點集合當中。
[0064] 步驟2-4為判斷種子節(jié)點選取過程是否結束,如果選取的種子節(jié)點數(shù)量已經達到K 個,貝峭巧專到步驟2-6,算法結束。
[0065] 步驟2-5為重新計算步驟2-3中影響力最大社團內部所有節(jié)點的影響值,然后計算 社團的影響力,并跳轉到步驟2-3。
[0066] 步驟2-6返回選取到的種子節(jié)點集合,至此種子選取完成。
[0067] 圖4中所使用的數(shù)據集化P是影響最大化問題經常使用的一個數(shù)據集,是高能物理 方向的合作網絡圖。從圖中可W發(fā)現(xiàn),隨著種子節(jié)點數(shù)量的增加,種子節(jié)點集合的影響覆蓋 范圍都在增大,COMAX算法選取的種子節(jié)點集合的影響覆蓋范圍與加速之后的貪屯、算法 CELF算法非常接近,但時間效率卻比CELF算法高多個數(shù)量級。
[0068] 綜上所述,本發(fā)明的基于社團結構的影響最大化算法為論文合作網絡發(fā)現(xiàn)高影響 力節(jié)點提供了一種新的方法,該方法首先通過將網絡劃分成相對獨立的社團結構,然后計 算社團影響力,選取影響力最大的社團中的對應節(jié)點加入到種子節(jié)點,并重新計算社團影 響力,如此循環(huán)找到K個種子節(jié)點。
[0069]雖然本發(fā)明已W較佳實施例掲露如上,然其并非用W限定本發(fā)明。本發(fā)明所屬技 術領域中具有通常知識者,在不脫離本發(fā)明的精神和范圍內,當可作各種的更動與潤飾。因 此,本發(fā)明的保護范圍當視權利要求書所界定者為準。
【主權項】
1. 一種適用論文合作網絡的基于社團結構的影響最大化算法,其特征在于,包括如下 步驟: 1) 社團發(fā)現(xiàn)階段; a構建初始論文合作網絡圖; b合并局部社團; c構建新的網絡圖; d結束; 2) 種子節(jié)點選取階段 a計算社團影響力; b選擇種子節(jié)點; c結束。2. 根據權利要求1所述的適用論文合作網絡的基于社團結構的影響最大化算法,其特 征在于,其中步驟l)_a中構建合作網絡圖指的是,構建的網絡圖中,節(jié)點表示作者,圖中的 邊表示兩個作者之間存在合作關系,共同發(fā)表過論文,并且邊的權值表示共同發(fā)表的論文 的數(shù)量,構建好的網絡圖為無向圖。3. 根據權利要求1所述的適用論文合作網絡的基于社團結構的影響最大化算法,其特 征在于,其中步驟l)-b中合并局部社團是指,將每個節(jié)點都當做是一個局部社團,每個節(jié)點 選取與自己相連且合并之后模塊度值增量最大的社團合并,模塊度值的公式如下:其中,nc表示所有社團的數(shù)量,in。表示社團c內部的邊的數(shù)量,tot。表示與社團c中節(jié)點 相連的所有的邊的數(shù)量,m表示網絡中所有的邊的數(shù)量; 節(jié)點i與社團c合并之后模塊度值的增量為:其中&,?^表示節(jié)點i與社團c相連的邊的數(shù)量,合并之后變成了新社團的內部邊,ki表 示節(jié)點i的度數(shù)。4. 根據權利要求1所述的適用論文合作網絡的基于社團結構的影響最大化算法,其特 征在于,其中步驟l)-c中構建新的網絡圖是指,將步驟l)-b中得到的合并之后的社團里的 所有節(jié)點用一個節(jié)點表示作為新的網絡圖中的節(jié)點,原來社團之間的連邊變成新的網絡圖 中節(jié)點之間的連邊。5. 根據權利要求1所述的適用論文合作網絡的基于社團結構的影響最大化算法,其特 征在于,其中步驟2)-a中計算社團影響力是指將社團內部中,影響力最大節(jié)點的影響值作 為社團的影響力,并記錄對應節(jié)點。6. 根據權利要求1所述的適用論文合作網絡的基于社團結構的影響最大化算法,其特 征在于,其中步驟2)-b中選擇種子節(jié)點是指選取影響力最大社團中對應的節(jié)點,并且需要 重新計算對應社團的影響力。
【文檔編號】G06Q50/00GK106022936SQ201610353585
【公開日】2016年10月12日
【申請日】2016年5月25日
【發(fā)明人】吳駿, 陳厚兵, 張梓雄, 王曉彤, 吳和生, 王崇駿
【申請人】南京大學
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1