亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于圖結(jié)構(gòu)匹配的社交網(wǎng)絡分析方法

文檔序號:9396887閱讀:630來源:國知局
基于圖結(jié)構(gòu)匹配的社交網(wǎng)絡分析方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及社交網(wǎng)絡分析方法,特別涉及基于圖結(jié)構(gòu)匹配的社交網(wǎng)絡分析方法。
【背景技術(shù)】
[0002]近年來,互聯(lián)網(wǎng)的持續(xù)快速發(fā)展,社交網(wǎng)絡等新興信息模式的迅猛發(fā)展,對個人和社會群體的行為產(chǎn)生了深遠影響。以Facebook為例,我們發(fā)現(xiàn)其:(I)用戶規(guī)模大,全球注冊用戶超8.5億,用戶間聯(lián)系逾千億;(2)使用頻繁,超過一半的用戶每天登陸Facebook,所有用戶每月在線時間達7000億分鐘;(3)商業(yè)價值高,是排名第一的廣告發(fā)布接受網(wǎng)站,每天有超過10億條包括視頻、照片、新聞等信息在用戶間分享。
[0003]龐大的社交網(wǎng)絡為人們提供了豐富的信息,然而如何快速有效地發(fā)現(xiàn)社交網(wǎng)絡海量信息背后所蘊含的知識,是亟待人們解決的問題。
[0004]由于社交網(wǎng)絡可以抽象為圖結(jié)構(gòu)一一用戶可被視為圖的頂點,用戶之間的關(guān)系可被看作圖的邊,因此,基于圖結(jié)構(gòu)匹配的分析技術(shù)已成為社交網(wǎng)絡分析的主要技術(shù)之一,并且已經(jīng)和正在幫助人們進行專家推薦、社交圈子識別,社會位置分析等。簡言之,圖結(jié)構(gòu)匹配是在一個大圖G中查詢與給定模式圖Q匹配的子圖(可形式化描述為Q(G))。然而,由于社交網(wǎng)絡圖數(shù)據(jù)“海量”及“非結(jié)構(gòu)化”的特點,通過傳統(tǒng)技術(shù)對社交網(wǎng)絡“大數(shù)據(jù)”進行分析已難以滿足人們的迫切需要。具體原因表現(xiàn)在:(I)圖結(jié)構(gòu)匹配兼顧數(shù)據(jù)和拓撲結(jié)構(gòu),從而導致對該問題的運算往往較為復雜,例如:基于子圖同構(gòu)的圖結(jié)構(gòu)匹配屬于一類極難解決的問題一一NP完全問題;(2)社交網(wǎng)絡的數(shù)據(jù)往往是分布式存儲的。例如=Twitter社交圖的FlockDB,Yahoo !互聯(lián)網(wǎng)應用的PNUTS,開源社區(qū)的Neo4j和HypergraphDB等。另一方面,圖結(jié)構(gòu)匹配經(jīng)常需要訪問多個數(shù)據(jù)節(jié)點,例如:訪問多個數(shù)據(jù)站點以取得匹配計算所需要的全部信息。因此,在分布式環(huán)境下,圖結(jié)構(gòu)匹配的求值更加困難;(3)現(xiàn)實世界的社交網(wǎng)絡是不斷變化的。在一周內(nèi)有10%的節(jié)點及節(jié)點關(guān)系更新是常見的情況。當更新出現(xiàn)的時候,昂貴的查詢需要被重新計算。這樣的計算在面對頻繁的請求時往往是無法進行的。
[4]可視化管理工具的缺失。與關(guān)鍵詞搜索和結(jié)構(gòu)化查詢不同,圖結(jié)構(gòu)匹配查詢條件(如模式圖Q)的描述更加復雜,且對結(jié)果的理解也需要更加直觀的方式。

【發(fā)明內(nèi)容】

[0005]本發(fā)明所要解決的技術(shù)問題,就是提供一種基于圖結(jié)構(gòu)匹配的社交網(wǎng)絡分析方法以實現(xiàn)高效、便捷的數(shù)據(jù)分析與維護,進而為專家推薦、社交圈子識別,社會位置分析等熱點應用提供關(guān)鍵技術(shù)支撐。
[0006]本發(fā)明解決所述技術(shù)問題,采用的技術(shù)方案是,基于圖結(jié)構(gòu)匹配的社交網(wǎng)絡分析方法,包括以下步驟:
[0007]步驟1、用戶通過系統(tǒng)構(gòu)建模式圖Q,選擇待分析的圖數(shù)據(jù),并發(fā)出模式圖Q的匹配查詢請求;
[0008]步驟2、系統(tǒng)采用十字鏈表作為待分析的圖數(shù)據(jù)的基礎(chǔ)數(shù)據(jù)結(jié)構(gòu),并對十字鏈表結(jié)構(gòu)的圖數(shù)據(jù)G進行數(shù)據(jù)管理操作;
[0009]步驟3、系統(tǒng)將模式圖Q的匹配查詢請求發(fā)送至十字鏈表結(jié)構(gòu)的圖數(shù)據(jù)G的各個數(shù)據(jù)站點,數(shù)據(jù)站點計為(S1, S2...Sn);我們將數(shù)據(jù)量很大的圖數(shù)據(jù)G分割成很多個子圖,并存放在不同的網(wǎng)絡站點中,數(shù)據(jù)站點是指各個子圖所在的網(wǎng)絡站點。
[0010]步驟4、系統(tǒng)對各數(shù)據(jù)站點并行執(zhí)行本地計算,計算出匹配結(jié)果;
[0011]步驟5、系統(tǒng)對匹配結(jié)果進行排序顯示。
[0012]具體的,所述步驟3中,系統(tǒng)接收模式圖Q的匹配查詢請求后,首先檢測當前站點S1的邊界節(jié)點V ^,如果其與模式圖Q中的某個節(jié)點Uci具有相同的節(jié)點標簽,則S 1向其他站點S,請求邊界節(jié)點V ^的鄰居節(jié)點,S i接收到S ,返回的數(shù)據(jù)后,進入步驟4。
[0013]具體的,所述步驟4中,系統(tǒng)并行調(diào)用經(jīng)全雙工方式優(yōu)化后的VF2算法對十字鏈表結(jié)構(gòu)的圖數(shù)據(jù)G的各數(shù)據(jù)站點并行執(zhí)行本地計算。傳統(tǒng)的VF2將整個圖作為輸入,而經(jīng)全雙工方式優(yōu)化后的VF2算法只將可能與Q匹配的子結(jié)構(gòu)作為輸入,進行結(jié)構(gòu)匹配計算。
[0014]具體的,所述步驟5中,系統(tǒng)根據(jù)匹配結(jié)果的出入度對匹配結(jié)果進行排序顯示,出度及入度的和越大,系統(tǒng)排序越靠前。
[0015]具體的,所述方法還包括系統(tǒng)通過運用增量算法,對匹配結(jié)果進行增量計算,具體包括以下步驟:
[0016]步驟61、系統(tǒng)將模式圖Q轉(zhuǎn)換為無向圖Q’,并計算出Q’的直徑d ;
[0017]步驟62、系統(tǒng)將十字鏈表結(jié)構(gòu)的圖數(shù)據(jù)G中每一條邊的更新計為Δ e = (V,V’),分別計算V和V’在d步內(nèi)可達的節(jié)點;
[0018]步驟63、系統(tǒng)并十字鏈表結(jié)構(gòu)的圖數(shù)據(jù)G中導出包含上述節(jié)點的子圖,計為G(Ae1Q);
[0019]步驟64、系統(tǒng)對子圖G(Ae,Q)進行模式圖Q的同構(gòu)計算,得出新的匹配結(jié)果,返回步驟4。
[0020]具體的,所述步驟I中,用戶通過輸入節(jié)點和邊,構(gòu)建模式圖Q。
[0021]具體的,所述步驟I中,對十字鏈表結(jié)構(gòu)的圖數(shù)據(jù)G進行數(shù)據(jù)管理操作包括節(jié)點查詢、節(jié)點的增刪改和/或邊的增刪改。
[0022]本發(fā)明的有益效果是:系統(tǒng)通過全雙工方式,對經(jīng)典的VF2算法進行拓展,實現(xiàn)分布式圖結(jié)構(gòu)匹配計算;基礎(chǔ)數(shù)據(jù)采用十字鏈表結(jié)構(gòu),便于雙向(延父節(jié)點,或子節(jié)點)遍歷,在十字鏈表的基礎(chǔ)上,實現(xiàn)了非常高效的節(jié)點、邊的增刪改操作,使得圖數(shù)據(jù)的維護非常便利;從輸入輸出變化的角度,設(shè)計增量維護算法,使得對查詢結(jié)果的動態(tài)維護更加高效,實現(xiàn)了增量維護計算,以克服社交網(wǎng)絡更新頻繁,而批量計算又開銷巨大的嚴重瓶頸;通過“所見即所得”的可視化方式幫助用戶構(gòu)建查詢,管理圖數(shù)據(jù),并可視化查詢結(jié)果。
【具體實施方式】
[0023]下面結(jié)合實施例詳細描述本發(fā)明的技術(shù)方案:
[0024]本發(fā)明針對現(xiàn)有技術(shù)中由于社交網(wǎng)絡圖數(shù)據(jù)“海量”及“非結(jié)構(gòu)化”的特點,通過傳統(tǒng)技術(shù)對社交網(wǎng)絡“大數(shù)據(jù)”進行分析已難以滿足人們的迫切需要的問題,提供一種基于圖結(jié)構(gòu)匹配的社交網(wǎng)絡分析方法,首先,用戶構(gòu)建模式圖Q,選擇待分析的圖數(shù)據(jù),并發(fā)出模式圖Q的匹配查詢請求;其次,系統(tǒng)采用十字鏈表作為待分析的圖數(shù)據(jù)的基礎(chǔ)數(shù)據(jù)結(jié)構(gòu),并對十字鏈表結(jié)構(gòu)的圖數(shù)據(jù)G進行數(shù)據(jù)管理操作;然后,系統(tǒng)將模式圖Q的匹配查詢請求發(fā)送至十字鏈表結(jié)構(gòu)的圖數(shù)據(jù)G的各個數(shù)據(jù)站點,數(shù)據(jù)站點計為(S1, S2...SJ ;再然后,系統(tǒng)對各數(shù)據(jù)站點并行執(zhí)行本地計算,計算出匹配結(jié)果;最后,系統(tǒng)對匹配結(jié)果進行排序顯示。系統(tǒng)通過全雙工方式,對經(jīng)典的VF2算法進行拓展,實現(xiàn)分布式圖結(jié)構(gòu)匹配計算;基礎(chǔ)數(shù)據(jù)采用十字鏈表結(jié)構(gòu),便于雙向(延父節(jié)點,或子節(jié)點)遍歷,在十字鏈表的基礎(chǔ)上,實現(xiàn)了非常高效的節(jié)點、邊的增刪改操作,使得圖數(shù)據(jù)的維護非常便利;從輸入輸出變化的角度,設(shè)計增量維護算法,使得對查詢結(jié)果的動態(tài)維護更加高效,實現(xiàn)了增量維護計算,以克服社交網(wǎng)絡更新頻繁,而批量計算又開銷巨大的嚴重瓶頸;通過“所見即所得”的可視化方式幫助用戶構(gòu)建查詢,管理圖數(shù)據(jù),并可視化查詢結(jié)果。
[0025]實施例
[0026]本例針對社交網(wǎng)絡“大數(shù)據(jù)”,通過分布式,可視化及增量計算技術(shù),實現(xiàn)高效、便捷的數(shù)據(jù)分析與維護,進而為專家推薦、社交圈子識別,社會位置分析等熱點應用提供關(guān)鍵技術(shù)支撐。為了有效的克服以上困難,更加高效、便捷地對社交網(wǎng)絡“大數(shù)據(jù)”進行分析,我們對傳統(tǒng)技術(shù)進行了如下三方面的擴展:(I)采用分布式技術(shù)管理
當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1