亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種社交網(wǎng)絡(luò)分析方法和裝置的制作方法

文檔序號(hào):7995529閱讀:697來源:國知局
專利名稱:一種社交網(wǎng)絡(luò)分析方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種業(yè)務(wù)支撐技術(shù),尤其涉及一種社交網(wǎng)絡(luò)分析方法和裝置。
背景技術(shù)
社交網(wǎng)絡(luò)(social network)是指社會(huì)個(gè)體成員之間因?yàn)榛?dòng)而形成的相對穩(wěn)定的關(guān)系體系,社交網(wǎng)絡(luò)關(guān)注的是人們之間的互動(dòng)和聯(lián)系,社會(huì)互動(dòng)會(huì)影響人們的社會(huì)行為。社交網(wǎng)絡(luò)分析(social network analysis)是從社交網(wǎng)絡(luò)角度出發(fā),對大規(guī)模數(shù)據(jù)進(jìn)行全面的,多維度的分析。社交網(wǎng)絡(luò)可看作是由圖表示的異構(gòu)多關(guān)系數(shù)據(jù)集,圖中節(jié)點(diǎn)表示對象,邊表示對象間聯(lián)系或相互作用的鏈接過去的幾十年間,社交網(wǎng)絡(luò)受到越來越多的關(guān)注。特別是移動(dòng)電信網(wǎng)絡(luò)和互聯(lián)網(wǎng)的發(fā)展,產(chǎn)生了大量的,容易被計(jì)算機(jī)處理的社交網(wǎng)絡(luò)數(shù)據(jù)。從這些海量數(shù)據(jù)中獲取知識(shí),從而理解商業(yè)行為,識(shí)別業(yè)務(wù)模式,分析用戶行為,更好利用資源,提高服務(wù)質(zhì)量,將成為運(yùn)營商的核心競爭力之一。電信社群網(wǎng)絡(luò)是一種以用戶為節(jié)點(diǎn)、用戶之間的通話為邊構(gòu)造的網(wǎng)絡(luò),該網(wǎng)絡(luò)既體現(xiàn)了電信用戶之間的通信關(guān)聯(lián)關(guān)系,又在一定程度上體現(xiàn)了社會(huì)中人與人之間的社交關(guān)系。利用通話數(shù)據(jù)的多維屬性,如通話時(shí)間、通話時(shí)長、頻率等,從多個(gè)視角對人們?nèi)粘5耐ㄔ捫袨檫M(jìn)行了刻畫,從而深刻揭示了人們交往行為的模式和內(nèi)在特征。相對于傳統(tǒng)的基于屬性向量的分析,社交網(wǎng)絡(luò)分析(social network analysis)通過考慮對象間連接關(guān)系,可以獲得如下新知識(shí):根據(jù)對象的屬性和連接,以及連接到它的對象的屬性預(yù)測對象的類型;根據(jù)所涉及的對象的性質(zhì),預(yù)測二者間交往鏈接的類型或目的;預(yù)測對象間是否存在交往鏈接;根據(jù)對象的屬性和鏈接,預(yù)測兩個(gè)對象是否事實(shí)上相同;根據(jù)對象屬性和鏈接結(jié)構(gòu),預(yù)測對象是否處于一個(gè)組或簇。目前,對電信通信網(wǎng)絡(luò)和互聯(lián)網(wǎng)這樣大規(guī)模的社交網(wǎng)絡(luò)進(jìn)行分析,是一個(gè)比較困難的問題。一方面,電信領(lǐng)域的用戶通話記錄通常是以數(shù)據(jù)庫表的方式存儲(chǔ),而傳統(tǒng)的關(guān)系數(shù)據(jù)庫和數(shù)據(jù)倉庫沒有專門的網(wǎng)絡(luò)/圖數(shù)據(jù)生成和計(jì)算能力。因此,在數(shù)據(jù)倉庫上進(jìn)行社交網(wǎng)絡(luò)分析,首先需要采用SQL編程的方式生成網(wǎng)絡(luò)數(shù)據(jù),再進(jìn)行計(jì)算,導(dǎo)致社交網(wǎng)絡(luò)分析的能力非常有限。目前,中國移動(dòng)經(jīng)營分析系統(tǒng)用于用戶行為分析的客戶流失預(yù)測中使用到社會(huì)交往圈信息,采用的技術(shù)方案是用類似“Select主叫號(hào)碼,被叫號(hào)碼,sum(時(shí)長)from詳單表where條件Groupby主叫號(hào)碼”的SQL語句,從數(shù)據(jù)倉庫中查詢得到客戶間主叫與被叫、時(shí)長的記錄表,代表網(wǎng)絡(luò)上節(jié)點(diǎn)、節(jié)點(diǎn)間連接、權(quán)重信息。然后將這些信息用于客戶流失預(yù)測應(yīng)用中。以一個(gè)擁有3000萬用戶的中等規(guī)模省公司為例,平均每個(gè)用戶每月有100條通話記錄,則每月的話單記錄數(shù)為3000萬*60% *100條/月=18億條/月,目前即使只處理一個(gè)月的18億條話單數(shù)據(jù)生成交往圈記錄表,就需要2天的時(shí)間。實(shí)際分析應(yīng)用中,為保證分析效果,通常需要3 6個(gè)月的詳單進(jìn)行分析,因此現(xiàn)有方案無法適應(yīng)從大規(guī)模數(shù)據(jù)生成社交網(wǎng)絡(luò)。另外,現(xiàn)有技術(shù)方案也僅對具有直接通過交往行為的用戶之間生成了邊表格式的單層網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),而對用戶之間的間接交往行為基本無法分析,即無法得到網(wǎng)絡(luò)整體拓?fù)涮卣髦?。另一方面,針對大?guī)模數(shù)據(jù),即使生成了社交網(wǎng)絡(luò),傳統(tǒng)的社交網(wǎng)絡(luò)分析軟件也往往是單機(jī)應(yīng)用,很難擴(kuò)展以支持電信級(jí)和互聯(lián)網(wǎng)級(jí)大規(guī)模海量數(shù)據(jù)的分析。社交網(wǎng)絡(luò)中網(wǎng)絡(luò)整體拓?fù)涮卣鞯姆治觯磮D上各節(jié)點(diǎn)和邊的各種特征值的計(jì)算,是各種社交網(wǎng)絡(luò)分析應(yīng)用的基礎(chǔ),也是決定社交網(wǎng)絡(luò)分析系統(tǒng)效率的關(guān)鍵計(jì)算環(huán)節(jié)。這些特征值的計(jì)算,經(jīng)常需要對整個(gè)網(wǎng)絡(luò)上所有節(jié)點(diǎn)和邊遍歷求解,這也是制約現(xiàn)有社交網(wǎng)絡(luò)分析系統(tǒng)無法適應(yīng)大規(guī)模海量數(shù)據(jù)分析的關(guān)鍵因素。比如,社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)和邊的pagerank值、單源和多源最短路徑值求解,都需要對整個(gè)圖進(jìn)行遍歷。如果是大規(guī)模網(wǎng)絡(luò),則基于單機(jī)的分析軟件,可能會(huì)出現(xiàn)內(nèi)存無法承受的情況;或者由于各特征值的求解方法通常是η3時(shí)間復(fù)雜度,導(dǎo)致系統(tǒng)無法響應(yīng)大規(guī)模網(wǎng)絡(luò)特征計(jì)算任務(wù)?,F(xiàn)有技術(shù)的主要缺點(diǎn)包括:1、現(xiàn)有基于數(shù)據(jù)倉庫/數(shù)據(jù)庫的社交網(wǎng)絡(luò)生成和分析應(yīng)用,無法處理由大規(guī)模數(shù)據(jù)生成社交網(wǎng)絡(luò)的任務(wù),且網(wǎng)絡(luò)分析只能針對網(wǎng)絡(luò)的單層拓?fù)浣Y(jié)構(gòu)特征進(jìn)行分析,對網(wǎng)絡(luò)整體拓?fù)浣Y(jié)構(gòu)特征的分析基本無能為力。2、現(xiàn)有社交網(wǎng)絡(luò)分析軟件是基于單機(jī)的應(yīng)用,無法適應(yīng)電信級(jí)和互聯(lián)網(wǎng)級(jí)海量數(shù)據(jù)形成的大規(guī)模社交網(wǎng)絡(luò)的分析任務(wù),尤其是對網(wǎng)絡(luò)整體拓?fù)涮卣髦捣治鰰r(shí),需要對全部節(jié)點(diǎn)和邊在整個(gè)網(wǎng)絡(luò)上遍歷求解的情形,成為制約系統(tǒng)效率和處理能力的瓶頸。

發(fā)明內(nèi)容
本發(fā)明的目的在于,提供一種社交網(wǎng)絡(luò)分析方法和裝置,可以針對大規(guī)模的社交網(wǎng)絡(luò)進(jìn)行快速、高效的分析。為實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供一種社交網(wǎng)絡(luò)分析方法,包括:根據(jù)社交網(wǎng)絡(luò)文件生成針對每個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)信息;控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)根據(jù)相應(yīng)的節(jié)點(diǎn)信息進(jìn)行遍歷,遍歷所述社交網(wǎng)絡(luò)所有節(jié)點(diǎn)后,得到所述社交網(wǎng)絡(luò)的拓?fù)涮卣髦?。其中,所述?jié)點(diǎn)信息包括:節(jié)點(diǎn)ID,鄰接點(diǎn)列表及本節(jié)點(diǎn)當(dāng)前已知遍歷信息;控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)根據(jù)相應(yīng)的節(jié)點(diǎn)信息進(jìn)行遍歷包括:控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)發(fā)送各自的當(dāng)前已知遍歷信息到其鄰接節(jié)點(diǎn),同時(shí)接收其鄰接節(jié)點(diǎn)發(fā)送來的鄰接節(jié)點(diǎn)的當(dāng)前已知遍歷信息。優(yōu)選地,該方法還包括:根據(jù)推進(jìn)標(biāo)識(shí)控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)根據(jù)相應(yīng)的節(jié)點(diǎn)信息進(jìn)行遍歷:當(dāng)所述推進(jìn)標(biāo)識(shí)為待推進(jìn)狀態(tài)時(shí),控制所述社交網(wǎng)絡(luò)中的所有節(jié)點(diǎn)繼續(xù)進(jìn)行遍歷;當(dāng)所述推進(jìn)標(biāo)識(shí)為停止推進(jìn)狀態(tài)時(shí),控制所述社交網(wǎng)絡(luò)中的所有節(jié)點(diǎn)停止遍歷。優(yōu)選地,該方法還包括:當(dāng)任意節(jié)點(diǎn)接收到的遍歷信息被更新時(shí),將所述推進(jìn)標(biāo)識(shí)設(shè)置為待推進(jìn)狀態(tài)。
具體地,根據(jù)社交網(wǎng)絡(luò)文件生成針對每個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)信息的操作包括:對于鄰接表格式的社交網(wǎng)絡(luò)文件,將所述社交網(wǎng)絡(luò)文件中每條鄰接表格式記錄直接映射為節(jié)點(diǎn)的節(jié)點(diǎn)信息;對于邊表格式的社交網(wǎng)絡(luò)文件,依照邊表記錄,將具有相同源節(jié)點(diǎn)的記錄匯總,形成所述源節(jié)點(diǎn)對應(yīng)的鄰接表格式記錄,并映射為所述源節(jié)點(diǎn)的節(jié)點(diǎn)信息。優(yōu)選地,該方法還包括:根據(jù)交往記錄文件生成社交網(wǎng)絡(luò)文件的,該操作包括:根據(jù)預(yù)設(shè)的過濾規(guī)則對所述交往記錄文件中的交往記錄進(jìn)行過濾;將過濾后的交往記錄形成邊表格式或鄰接表格式的社交網(wǎng)絡(luò)文件。其中,利用多個(gè)計(jì)算節(jié)點(diǎn)并行執(zhí)行上述操作。為實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的另一個(gè)方面,提供一種社交網(wǎng)絡(luò)分析裝置,包括:節(jié)點(diǎn)信息生成模塊,用于根據(jù)社交網(wǎng)絡(luò)文件生成針對每個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)信息;遍歷模塊,用于控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)根據(jù)相應(yīng)的節(jié)點(diǎn)信息進(jìn)行遍歷,遍歷所述社交網(wǎng)絡(luò)所有節(jié)點(diǎn)后,得到所述社交網(wǎng)絡(luò)的拓?fù)涮卣髦?。其中,所述?jié)點(diǎn)信息包括:節(jié)點(diǎn)ID,鄰接點(diǎn)列表及本節(jié)點(diǎn)當(dāng)前已知遍歷信息;所述遍歷模塊,用于控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)發(fā)送各自的當(dāng)前已知遍歷信息到其鄰接節(jié)點(diǎn),同時(shí)接收其鄰接節(jié)點(diǎn)發(fā)送來的鄰接節(jié)點(diǎn)的當(dāng)前已知遍歷信息。優(yōu)選地,該裝置還包括: 標(biāo)識(shí)狀態(tài)分析模塊,用于分析所述推進(jìn)標(biāo)識(shí)的狀態(tài);所述遍歷模塊,用于根據(jù)推進(jìn)標(biāo)識(shí)控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)根據(jù)相應(yīng)的節(jié)點(diǎn)信息進(jìn)行遍歷:當(dāng)所述推進(jìn)標(biāo)識(shí)為待推進(jìn)狀態(tài)時(shí),控制所述社交網(wǎng)絡(luò)中的所有節(jié)點(diǎn)繼續(xù)進(jìn)行遍歷;當(dāng)所述推進(jìn)標(biāo)識(shí)為停止推進(jìn)狀態(tài)時(shí),控制所述社交網(wǎng)絡(luò)中的所有節(jié)點(diǎn)停止遍歷。優(yōu)選地,該裝置還包括:節(jié)點(diǎn)狀態(tài)分析模塊,用于分析所述社交網(wǎng)絡(luò)中的節(jié)點(diǎn)接收到的遍歷信息是否被更新;推進(jìn)標(biāo)識(shí)設(shè)置模塊,用于當(dāng)任意節(jié)點(diǎn)接收到的遍歷信息被更新時(shí),將推進(jìn)標(biāo)識(shí)設(shè)置為待推進(jìn)狀態(tài)。其中,所述節(jié)點(diǎn)信息生成模塊包括:映射子模塊,對于鄰接表格式的社交網(wǎng)絡(luò)文件,將所述社交網(wǎng)絡(luò)文件中每條鄰接表格式記錄直接映射為節(jié)點(diǎn)的節(jié)點(diǎn)信息;或所述節(jié)點(diǎn)信息生成模塊包括:格式轉(zhuǎn)換子模塊,用于對于邊表格式的社交網(wǎng)絡(luò)文件,依照邊表記錄,將具有相同源節(jié)點(diǎn)的記錄匯總,形成所述源節(jié)點(diǎn)對應(yīng)的鄰接表格式記錄;和映射子模塊,用于將所述鄰接表格式記錄映射為源節(jié)點(diǎn)的節(jié)點(diǎn)信息。上述各個(gè)裝置所進(jìn)行的操作由多個(gè)計(jì)算節(jié)點(diǎn)并行執(zhí)行。本發(fā)明的社交網(wǎng)絡(luò)分析方法和裝置,通過采用多個(gè)節(jié)點(diǎn)同時(shí)并發(fā)的機(jī)制,即所有節(jié)點(diǎn)都并行推送遍歷信息,解決了社交網(wǎng)絡(luò)中需要多次迭代才能遍歷完數(shù)據(jù)的問題,降低了分析的時(shí)間復(fù)雜度,提高分析效率。另外,本發(fā)明通過采用根據(jù)推進(jìn)標(biāo)識(shí)確定是否遍歷完信息,解決如何確保并發(fā)過程中數(shù)據(jù)遍歷完成的問題,從而實(shí)現(xiàn)對網(wǎng)絡(luò)整體拓?fù)浣Y(jié)構(gòu)的分析,進(jìn)一步降低了分析的時(shí)間復(fù)雜度,提高分析效率。另外,本發(fā)明通過采用并行數(shù)據(jù)處理機(jī)制,即將需要處理的文件分割成數(shù)據(jù)分片后,由多個(gè)計(jì)算節(jié)點(diǎn)分別進(jìn)行處理后并行輸出操作結(jié)果,在進(jìn)行匯總得到文件的最終處理結(jié)果,更好的適應(yīng)大規(guī)模海量社交網(wǎng)絡(luò)的特征分析任務(wù);可以通過增加計(jì)算節(jié)點(diǎn)來應(yīng)對網(wǎng)絡(luò)數(shù)據(jù)規(guī)模不斷增加的問題;另外,降低了對數(shù)據(jù)處理時(shí)間復(fù)雜度,提高數(shù)據(jù)處理效率。


圖1是本發(fā)明社交網(wǎng)絡(luò)分析方法實(shí)施例的流程圖;圖2是本發(fā)明社交網(wǎng)絡(luò)分析方法另一實(shí)施例的流程圖;圖3是本發(fā)明并行數(shù)據(jù)處理的流程示意圖;圖4是本發(fā)明社交網(wǎng)絡(luò)分析裝置實(shí)施例的結(jié)構(gòu)圖;圖5是本發(fā)明節(jié)點(diǎn)狀態(tài)分析模塊實(shí)施例的結(jié)構(gòu)圖;圖6是發(fā)明社交網(wǎng)絡(luò)分析裝置另一實(shí)施例的結(jié)構(gòu)圖。
具體實(shí)施例方式本發(fā)明主要是通過對社交網(wǎng)絡(luò)進(jìn)行分析,得到網(wǎng)絡(luò)整體拓?fù)涮卣髦?,如pagerank值、betweenness值、單源最短路徑、多源最短路徑等。以下結(jié)合附圖對本發(fā)明進(jìn)行詳細(xì)說明。

方法實(shí)施例如圖1所示,本發(fā)明社交網(wǎng)絡(luò)分析方法實(shí)施例包括:步驟101,從業(yè)務(wù)記錄中提取節(jié)點(diǎn)間的交往記錄,得到包含所述交往記錄的交往記錄文件;例如,通信交往圈分析中,需要從詳單中提取出主叫號(hào)碼、被叫號(hào)碼、通話時(shí)長、通話開始時(shí)間、短信發(fā)送號(hào)碼、短信接收號(hào)碼等屬性列,這些屬性列將用于生成語音通話或短信交往圈網(wǎng)絡(luò)中節(jié)點(diǎn)對象、邊、權(quán)重。數(shù)據(jù)提取步驟輸出的是包含了對象間交往明細(xì)的交往記錄文件,該文件是被提取列的全表記錄文件,該文件中的每一行代表兩個(gè)對象間的一次交往活動(dòng),如下表I所示。表I
權(quán)利要求
1.一種社交網(wǎng)絡(luò)分析方法,其特征在于,包括: 根據(jù)社交網(wǎng)絡(luò)文件生成針對每個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)信息; 控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)根據(jù)相應(yīng)的節(jié)點(diǎn)信息進(jìn)行遍歷,遍歷所述社交網(wǎng)絡(luò)所有節(jié)點(diǎn)后,得到所述社交網(wǎng)絡(luò)的拓?fù)涮卣髦怠?br> 2.根據(jù)權(quán)利要求1所述的社交網(wǎng)絡(luò)分析方法,其特征在于,所述節(jié)點(diǎn)信息包括:節(jié)點(diǎn)ID,鄰接點(diǎn)列表及本節(jié)點(diǎn)當(dāng)前已知遍歷信息; 控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)根據(jù)相應(yīng)的節(jié)點(diǎn)信息進(jìn)行遍歷包括: 控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)發(fā)送各自的當(dāng)前已知遍歷信息到其鄰接節(jié)點(diǎn),同時(shí)接收其鄰接節(jié)點(diǎn)發(fā)送來的鄰接節(jié)點(diǎn)的當(dāng)前已知遍歷信息。
3.根據(jù)權(quán)利要求1所述的社交網(wǎng)絡(luò)分析方法,其特征在于,還包括: 根據(jù)推進(jìn)標(biāo)識(shí)控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)根據(jù)相應(yīng)的節(jié)點(diǎn)信息進(jìn)行遍歷: 當(dāng)所述推進(jìn)標(biāo)識(shí)為待推進(jìn)狀態(tài)時(shí),控制所述社交網(wǎng)絡(luò)中的所有節(jié)點(diǎn)繼續(xù)進(jìn)行遍歷; 當(dāng)所述推進(jìn)標(biāo)識(shí)為停止推進(jìn)狀態(tài)時(shí),控制所述社交網(wǎng)絡(luò)中的所有節(jié)點(diǎn)停止遍歷。
4.根據(jù)權(quán)利要求3所述的社交網(wǎng)絡(luò)分析方法,其特征在于,還包括: 當(dāng)任意節(jié)點(diǎn)接收到的遍歷信息被更新時(shí),將所述推進(jìn)標(biāo)識(shí)設(shè)置為待推進(jìn)狀態(tài)。
5.根據(jù)權(quán)利要求1所述的社交網(wǎng)絡(luò)分析方法,其特征在于,根據(jù)社交網(wǎng)絡(luò)文件生成針對每個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)信息的操作包括:對于鄰接表格式的社交網(wǎng)絡(luò)文件,將所述社交網(wǎng)絡(luò)文件中每條鄰接表格式記錄直接映射為節(jié)點(diǎn)的節(jié)點(diǎn)信息; 對于邊表格式的社交網(wǎng)絡(luò)文件,依照邊表記錄,將具有相同源節(jié)點(diǎn)的記錄匯總,形成所述源節(jié)點(diǎn)對應(yīng)的鄰接表格式記錄,并映射為所述源節(jié)點(diǎn)的節(jié)點(diǎn)信息。
6.根據(jù)權(quán)利要求1所述的社交網(wǎng)絡(luò)分析方法,其特征在于,還包括:根據(jù)交往記錄文件生成社交網(wǎng)絡(luò)文件的,該操作包括: 根據(jù)預(yù)設(shè)的過濾規(guī)則對所述交往記錄文件中的交往記錄進(jìn)行過濾; 將過濾后的交往記錄形成邊表格式或鄰接表格式的社交網(wǎng)絡(luò)文件。
7.根據(jù)權(quán)利要求1-6任一所述的社交網(wǎng)絡(luò)分析方法,其特征在于, 利用多個(gè)計(jì)算節(jié)點(diǎn)并行執(zhí)行上述操作。
8.一種社交網(wǎng)絡(luò)分析裝置,其特征在于,包括: 節(jié)點(diǎn)信息生成模塊,用于根據(jù)社交網(wǎng)絡(luò)文件生成針對每個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)信息; 遍歷模塊,用于控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)根據(jù)相應(yīng)的節(jié)點(diǎn)信息進(jìn)行遍歷,遍歷所述社交網(wǎng)絡(luò)所有節(jié)點(diǎn)后,得到所述社交網(wǎng)絡(luò)的拓?fù)涮卣髦怠?br> 9.根據(jù)權(quán)利要求8所述的社交網(wǎng)絡(luò)分析裝置,其特征在于,所述節(jié)點(diǎn)信息包括:節(jié)點(diǎn)ID,鄰接點(diǎn)列表及本節(jié)點(diǎn)當(dāng)前已知遍歷信息; 所述遍歷模塊,用于控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)發(fā)送各自的當(dāng)前已知遍歷信息到其鄰接節(jié)點(diǎn),同時(shí)接收其鄰接節(jié)點(diǎn)發(fā)送來的鄰接節(jié)點(diǎn)的當(dāng)前已知遍歷信息。
10.根據(jù)權(quán)利要求8所述的社交網(wǎng)絡(luò)分析裝置,其特征在于,還包括: 標(biāo)識(shí)狀態(tài)分析模塊,用于分析所述推進(jìn)標(biāo)識(shí)的狀態(tài); 所述遍歷模塊,用于根據(jù)推進(jìn)標(biāo)識(shí)控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)根據(jù)相應(yīng)的節(jié)點(diǎn)信息進(jìn)行遍歷:當(dāng)所述推進(jìn)標(biāo)識(shí)為待推進(jìn)狀態(tài)時(shí),控制所述社交網(wǎng)絡(luò)中的所有節(jié)點(diǎn)繼續(xù)進(jìn)行遍歷;當(dāng)所述推進(jìn)標(biāo)識(shí)為停止推進(jìn)狀態(tài)時(shí),控制所述社交網(wǎng)絡(luò)中的所有節(jié)點(diǎn)停止遍歷。
11.根據(jù)權(quán)利要求10所述的社交網(wǎng)絡(luò)分析裝置,其特征在于,還包括: 節(jié)點(diǎn)狀態(tài)分析模塊,用于分析所述社交網(wǎng)絡(luò)中的節(jié)點(diǎn)接收到的遍歷信息是否被更新;推進(jìn)標(biāo)識(shí)設(shè)置模塊,用于當(dāng)任意節(jié)點(diǎn)接收到的遍歷信息被更新時(shí),將推進(jìn)標(biāo)識(shí)設(shè)置為待推進(jìn)狀態(tài)。
12.根據(jù)權(quán)利要求8所述的社交網(wǎng)絡(luò)分析裝置,其特征在于,所述節(jié)點(diǎn)信息生成模塊包括: 映射子模塊,對于鄰接表格式的社交網(wǎng)絡(luò)文件,將所述社交網(wǎng)絡(luò)文件中每條鄰接表格式記錄直接映射為節(jié)點(diǎn)的節(jié)點(diǎn)信息; 或所述節(jié)點(diǎn)信息生成模塊包括: 格式轉(zhuǎn)換子模塊,用于對于邊表格式的社交網(wǎng)絡(luò)文件,依照邊表記錄,將具有相同源節(jié)點(diǎn)的記錄匯總,形成所述源節(jié)點(diǎn)對應(yīng)的鄰接表格式記錄; 和映射子模塊,用于將所述鄰接表格式記錄映射為源節(jié)點(diǎn)的節(jié)點(diǎn)信息。
13.根據(jù)權(quán)利要求8-12任一所述的社交網(wǎng)絡(luò)分析裝置,其特征在于, 上述各個(gè)裝置所進(jìn)行的操作 由多個(gè)計(jì)算節(jié)點(diǎn)并行執(zhí)行。
全文摘要
本發(fā)明公開了一種社交網(wǎng)絡(luò)分析方法和裝置。其中該方法包括根據(jù)社交網(wǎng)絡(luò)文件生成針對每個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)信息;控制所述社交網(wǎng)絡(luò)中所有節(jié)點(diǎn)根據(jù)相應(yīng)的節(jié)點(diǎn)信息進(jìn)行遍歷,遍歷所述社交網(wǎng)絡(luò)所有節(jié)點(diǎn)后,得到所述社交網(wǎng)絡(luò)的拓?fù)涮卣髦怠1景l(fā)明通過采用多個(gè)節(jié)點(diǎn)同時(shí)并發(fā)的機(jī)制,即所有節(jié)點(diǎn)都并行推送遍歷信息,解決了社交網(wǎng)絡(luò)中需要多次迭代才能遍歷完數(shù)據(jù)的問題,降低了分析的時(shí)間復(fù)雜度,提高分析效率。
文檔編號(hào)H04L12/24GK103138981SQ20111039129
公開日2013年6月5日 申請日期2011年11月30日 優(yōu)先權(quán)日2011年11月30日
發(fā)明者鄧超, 高丹, 江志雄, 徐萌, 羅治國, 錢嶺, 孫少陵 申請人:中國移動(dòng)通信集團(tuán)公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1