亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于圖結構匹配的社交網(wǎng)絡分析方法

文檔序號:9417432閱讀:2149來源:國知局
基于圖結構匹配的社交網(wǎng)絡分析方法
【技術領域】
[0001]本發(fā)明涉及圖結構匹配技術、社交網(wǎng)絡分析技術、分布式計算技術、增量計算技術等領域;具體涉及基于圖結構匹配的社交網(wǎng)絡分析方法。
【背景技術】
[0002]近年來,互聯(lián)網(wǎng)的持續(xù)快速發(fā)展,社交網(wǎng)絡等新興信息模式的迅猛發(fā)展,對個人和社會群體的行為產(chǎn)生了深遠影響。以Facebook為例,我們發(fā)現(xiàn)其:(I)用戶規(guī)模大,全球注冊用戶超8.5億,用戶間聯(lián)系逾千億;(2)使用頻繁,超過一半的用戶每天登陸Facebook,所有用戶每月在線時間達7000億分鐘;(3)商業(yè)價值高,是排名第一的廣告發(fā)布接受網(wǎng)站,每天有超過10億條包括視頻、照片、新聞等信息在用戶間分享。
[0003]龐大的社交網(wǎng)絡為人們提供了豐富的信息,然而如何快速有效地發(fā)現(xiàn)社交網(wǎng)絡海量信息背后所蘊含的知識,是亟待人們解決的問題。
[0004]由于社交網(wǎng)絡可以抽象為圖結構一一用戶可被視為圖的頂點,用戶之間的關系可被看作圖的邊,因此,基于圖結構匹配的分析技術已成為社交網(wǎng)絡分析的主要技術之一,并且已經(jīng)和正在幫助人們進行專家推薦、社交圈子識別,社會位置分析等。簡言之,圖結構匹配是在一個大圖G中查詢與給定模式圖Q匹配的子圖(可形式化描述為Q(G))。然而,由于社交網(wǎng)絡圖數(shù)據(jù)“海量”及“非結構化”的特點,通過傳統(tǒng)技術對社交網(wǎng)絡“大數(shù)據(jù)”進行分析已難以滿足人們的迫切需要。具體原因表現(xiàn)在:(I)圖結構匹配兼顧數(shù)據(jù)和拓撲結構,從而導致對該問題的運算往往較為復雜,例如:基于子圖同構的圖結構匹配屬于一類極難解決的問題一一NP完全問題;(2)社交網(wǎng)絡的數(shù)據(jù)往往是分布式存儲的。例如=Twitter社交圖的FlockDB,Yahoo !互聯(lián)網(wǎng)應用的PNUTS,開源社區(qū)的Neo4j和HypergraphDB等。另一方面,圖結構匹配經(jīng)常需要訪問多個數(shù)據(jù)節(jié)點,例如:訪問多個數(shù)據(jù)站點以取得匹配計算所需要的全部信息。因此,在分布式環(huán)境下,圖結構匹配的求值更加困難;(3)現(xiàn)實世界的社交網(wǎng)絡是不斷變化的。在一周內(nèi)有10%的節(jié)點及節(jié)點關系更新是常見的情況。當更新出現(xiàn)的時候,昂貴的查詢需要被重新計算。這樣的計算在面對頻繁的請求時往往是無法進行的。
[4]可視化管理工具的缺失。與關鍵詞搜索和結構化查詢不同,圖結構匹配查詢條件(如模式圖Q)的描述更加復雜,且對結果的理解也需要更加直觀的方式。

【發(fā)明內(nèi)容】

[0005]本發(fā)明的目的是為了有效的克服以上困難,更加高效、便捷地對社交網(wǎng)絡“大數(shù)據(jù)”進行分析,我們對傳統(tǒng)技術進行了如下三方面的擴展:(I)采用分布式技術管理、查詢數(shù)據(jù),實現(xiàn)圖結構匹配計算的并行化;(II)實現(xiàn)匹配結果(視圖)的增量維護;(III)實現(xiàn)模式圖構造和匹配結果的可視化。
[0006]為了達到上述的技術效果,本發(fā)明采取以下技術方案:基于圖結構匹配的社交網(wǎng)絡分析方法,包括下述步驟(以下步驟不分先后順序):
[0007]a、圖形化界面幫助用戶管理圖數(shù)據(jù),構建模式圖及可視化查詢結果。
[0008]b、查詢引擎調(diào)用分布式算法執(zhí)行結構匹配計算,同時對匹配結果進行評估,選取top-K個結果,并將它們可視化在圖形界面上。
[0009]C、運用增量算法,對已有的匹配結果進行增量計算,以保證結果的正確性和完整性。
[0010]進一步的技術方案是:步驟b通過以下步驟實現(xiàn):
[0011 ] bl、查詢引擎接收查詢請求后,將請求分發(fā)到各個數(shù)據(jù)站點。
[0012]b2、各站點收到查詢請求后,并行地調(diào)用優(yōu)化了的VF2算法執(zhí)行本地計算。
[0013]b3、查詢引擎收集到所有返回的計算結果后,查詢引擎利用排序功能識別top-K個匹配項,排序功能利用匹配結果的度數(shù)對結果進行整合。
[0014]進一步的技術方案是:步驟c通過以下步驟實現(xiàn):
[0015]Cl、將模式圖Q視為無向圖Q’,并計算出無向圖Q’的直徑d。
[0016]c2、對于給定的圖G中每一條邊的更新Ae= (V, V’),分別計算V和V’在d步內(nèi)可達的節(jié)點,并從圖G中導出該子圖,稱為圖G( △ e,Q);對圖G( △ e, Q)和模式圖Q進行同構計算。
[0017]本發(fā)明與現(xiàn)有技術相比,具有以下的有益效果:
[0018]針對社交網(wǎng)絡“大數(shù)據(jù)”,通過分布式,可視化及增量計算技術,實現(xiàn)高效、便捷的數(shù)據(jù)分析與維護,進而為專家推薦、社交圈子識別,社會位置分析等熱點應用提供關鍵技術支撐。
[0019]本發(fā)明所提供的技術包括:(I)分布式圖結構匹配技術,(II)圖數(shù)據(jù)管理技術,
(III)匹配結果(視圖)增量維護技術,(IV)查詢可視化技術。
[0020](I)分布式圖結構匹配技術:通過全雙工方式,對經(jīng)典的VF2算法進行拓展,實現(xiàn)分布式圖結構匹配計算。
[0021](II)圖數(shù)據(jù)管理技術:基礎數(shù)據(jù)采用十字鏈表結構,便于雙向(延父節(jié)點,或子節(jié)點)遍歷;同時由于采用了更加“簡潔”的數(shù)據(jù)結構,使得數(shù)據(jù)的空間開銷更小。
[0022](III)匹配結果增量維護技術:從輸入輸出變化的角度,設計增量維護算法,使得對查詢結果的動態(tài)維護更加高效。
[0023](IV)查詢可視化技術:通過“所見即所得”的可視化方式幫助用戶構建查詢,管理圖數(shù)據(jù),并可視化查詢結果。
【附圖說明】
[0024]圖1是本發(fā)明系統(tǒng)架構示意圖
【具體實施方式】
[0025]下面結合本發(fā)明的實施例對本發(fā)明作進一步的闡述和說明。
[0026]實施例:
[0027]基于圖結構匹配的社交網(wǎng)絡分析方法,通過以下三大模塊實現(xiàn):
[0028]一、圖形化界面:
[0029]圖形化界面幫助用戶管理圖數(shù)據(jù),構建模式圖,及可視化查詢結果。用戶一方面可以通過在面板上“畫出” 一系列的節(jié)點和邊,便利地構建模式圖
當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1