一種獲取l個(gè)具有最佳傳播影響力用戶的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及計(jì)算機(jī)技術(shù)領(lǐng)域,具體設(shè)及一種獲取L個(gè)具有最佳傳播影響力用戶的 方法和裝置。
【背景技術(shù)】
[0002] 社交網(wǎng)絡(luò)的發(fā)展對(duì)人類生活有著極大影響,無論是交友,工作還是購物,人們已經(jīng) 習(xí)慣依賴社交網(wǎng)絡(luò)來獲取信息。具有高影響力的用戶在社交網(wǎng)絡(luò)中可W作為信息傳播源 頭,促進(jìn)社交網(wǎng)絡(luò)上有效信息的傳播。為了讓信息在網(wǎng)絡(luò)中傳播得更快,范圍更廣,關(guān)鍵就 在于尋找到最具有傳播影響力的節(jié)點(diǎn)。由于網(wǎng)絡(luò)中總用戶數(shù)量巨大,網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,網(wǎng)絡(luò)中 大部分節(jié)點(diǎn)的傳播能力極為有限,尋找有高傳播影響力的用戶一直是一大挑戰(zhàn)。并且,隨著 社交網(wǎng)絡(luò)規(guī)模的進(jìn)一步擴(kuò)大,在網(wǎng)絡(luò)中只尋找一個(gè)最有影響力的用戶作為傳播源時(shí),傳播 的效率比較低下,此時(shí)就需要尋找多個(gè)用戶同時(shí)作為信息源,即網(wǎng)絡(luò)的多源傳播問題。多個(gè) 用戶作為信息源進(jìn)行傳播時(shí),他們的傳播范圍并不是單個(gè)節(jié)點(diǎn)傳播的簡單疊加,實(shí)證研究 發(fā)現(xiàn),一般情況下多個(gè)高影響力的用戶的傳播范圍會(huì)有一定程度的重合,即多個(gè)高影響力 用戶的傳播效果會(huì)小于運(yùn)些用戶分別單獨(dú)傳播的效果之和,如何精確選擇一批傳播過程中 互不重疊的高影響力用戶是一個(gè)熱點(diǎn)問題。本發(fā)明主要用于在網(wǎng)絡(luò)中尋找L個(gè)具有最佳傳 播影響力的用戶。
[000引目前現(xiàn)有技術(shù)中尋找最佳傳播影響力用戶的方法有度中屯、性(Degree Centrrality),介數(shù)中屯、性(Betweenness Centrality),接近中性(Closeness Centrality)等方法。度中屯、性方法認(rèn)為擁有最大度的節(jié)點(diǎn)同時(shí)也具有較大的傳播影響力, 即該方法認(rèn)為與一個(gè)節(jié)點(diǎn)相關(guān)聯(lián)的邊的條數(shù)最大該節(jié)點(diǎn)就具有最佳傳播影響力。介數(shù)中屯、 性方法認(rèn)為網(wǎng)絡(luò)中所有節(jié)點(diǎn)對(duì)的最短路徑中(一般情況下一對(duì)節(jié)點(diǎn)之間存在多條最短路 徑),經(jīng)過一個(gè)節(jié)點(diǎn)的最短路徑數(shù)越多,運(yùn)個(gè)節(jié)點(diǎn)對(duì)信息傳播的控制力就越大,運(yùn)個(gè)節(jié)點(diǎn)的 影響力就越巨大。接近中屯、性方法認(rèn)為一個(gè)節(jié)點(diǎn)與網(wǎng)絡(luò)中其他節(jié)點(diǎn)的平均距離越小,該節(jié) 點(diǎn)的信息到達(dá)其他節(jié)點(diǎn)就越快,影響力也就越大。然而運(yùn)些方法都是離散地計(jì)算某一個(gè)節(jié) 點(diǎn)的影響力值,雖然能夠用于區(qū)分將一個(gè)節(jié)點(diǎn)作為傳播源頭時(shí),哪一個(gè)節(jié)點(diǎn)的傳播更快、范 圍更廣,但是如果是選取多個(gè)具有影響力的節(jié)點(diǎn)同時(shí)作為傳播源頭時(shí),運(yùn)些節(jié)點(diǎn)的傳播范 圍很可能出現(xiàn)很多重合區(qū)域,從而整體傳播效果不佳。
[0004]本發(fā)明的發(fā)明人在實(shí)現(xiàn)本發(fā)明的過程中發(fā)現(xiàn),上述尋找最佳傳播影響力用戶的方 法僅能用于網(wǎng)絡(luò)中尋找單一的最佳傳播影響力用戶,但是信息在網(wǎng)絡(luò)中的傳播不能僅僅依 賴于一個(gè)節(jié)點(diǎn),而是需要同時(shí)尋找一群具有最佳傳播影響力的用戶,而現(xiàn)有的上述方法無 法適用于同時(shí)尋找多個(gè)具有最佳傳播影響力的用戶。
【發(fā)明內(nèi)容】
[000引本發(fā)明的目的在于提供一種獲取L個(gè)具有最佳傳播影響力用戶的方法和裝置,用 于同時(shí)獲取到多個(gè)具有最佳傳播影響力的用戶,提高信息的傳播效率。
[0006] 為了達(dá)到上述目的,本發(fā)明采用運(yùn)樣的如下技術(shù)方案: 一方面,本發(fā)明提供一種獲取L個(gè)具有最佳傳播影響力用戶的方法,包括: 從網(wǎng)絡(luò)信息數(shù)據(jù)庫中獲取拓?fù)渚W(wǎng)絡(luò)的結(jié)構(gòu)數(shù)據(jù),所述結(jié)構(gòu)數(shù)據(jù)包括:用戶集、所述用戶 集中不同用戶之間的關(guān)聯(lián)關(guān)系,所述用戶集中包括至少N個(gè)用戶,所述N為非零的自然數(shù); 根據(jù)所述拓?fù)渚W(wǎng)絡(luò)的結(jié)構(gòu)數(shù)據(jù)將所述拓?fù)渚W(wǎng)絡(luò)表示為無向圖,所述無向圖包括:N個(gè)節(jié) 點(diǎn)和所述N個(gè)節(jié)點(diǎn)之間連接兩個(gè)節(jié)點(diǎn)的連邊,所述無向圖中包括的每一個(gè)節(jié)點(diǎn)唯一地對(duì)應(yīng) 于所述用戶集的一個(gè)用戶,所述無向圖中存在關(guān)聯(lián)關(guān)系的兩個(gè)用戶對(duì)應(yīng)的節(jié)點(diǎn)之間用一條 邊相連; 按照預(yù)置的重復(fù)次數(shù)t對(duì)所述無向圖進(jìn)行t次的節(jié)點(diǎn)賦值處理,其中,每一次的節(jié)點(diǎn)賦 值處理都包括:對(duì)所述無向圖進(jìn)行邊滲流處理,W及邊滲流處理之后進(jìn)行的資源值分配處 理,其中,所述邊滲流處理包括:對(duì)所述無向圖中的每條連邊W1-Pc的概率進(jìn)行刪除、Wpc 的概率繼續(xù)保留,刪除連邊完成后的無向圖得到m個(gè)連通子圖,所述P。為根據(jù)所述拓?fù)渚W(wǎng)絡(luò) 的結(jié)構(gòu)數(shù)據(jù)預(yù)先確定的滲流闊值,所述m為非零的自然數(shù),所述資源值分配處理包括:將所 述m個(gè)連通子圖按其包含的節(jié)點(diǎn)數(shù)目從大到小排列,將每個(gè)連通子圖中的節(jié)點(diǎn)按度值降序 排列,將L個(gè)單位的資源值依次分配給完成節(jié)點(diǎn)數(shù)目排列和度值排列后的m個(gè)連通子圖內(nèi)的 節(jié)點(diǎn),直至將所述L個(gè)單位的資源值分配完畢為止,其中在每一次的節(jié)點(diǎn)賦值處理過程中所 述m個(gè)連通子圖內(nèi)的一個(gè)節(jié)點(diǎn)只能分配到一個(gè)單位的資源,所述L為預(yù)置的需要獲取到具有 最佳傳播影響力的用戶個(gè)數(shù); 對(duì)所述無向圖進(jìn)行t次的節(jié)點(diǎn)賦值處理之后,將所述無向圖中所有節(jié)點(diǎn)按照各個(gè)節(jié)點(diǎn) 得到的總資源值從大到小排序,排序中的前L個(gè)節(jié)點(diǎn)所對(duì)應(yīng)的用戶作為需要獲取的L個(gè)具有 最佳傳播影響力的用戶。
[0007] 另一方面,本發(fā)明提供一種獲取L個(gè)具有最佳傳播影響力用戶的裝置,包括: 結(jié)構(gòu)數(shù)據(jù)獲取模塊,用于從網(wǎng)絡(luò)信息數(shù)據(jù)庫中獲取拓?fù)渚W(wǎng)絡(luò)的結(jié)構(gòu)數(shù)據(jù),所述結(jié)構(gòu)數(shù) 據(jù)包括:用戶集、所述用戶集中不同用戶之間的關(guān)聯(lián)關(guān)系,所述用戶集中包括至少N個(gè)用戶, 所述N為非零的自然數(shù); 無向圖獲取模塊,用于根據(jù)所述拓?fù)渚W(wǎng)絡(luò)的結(jié)構(gòu)數(shù)據(jù)將所述拓?fù)渚W(wǎng)絡(luò)表示為無向圖, 所述無向圖包括:N個(gè)節(jié)點(diǎn)和所述N個(gè)節(jié)點(diǎn)之間連接兩個(gè)節(jié)點(diǎn)的連邊,所述無向圖中包括的 每一個(gè)節(jié)點(diǎn)唯一地對(duì)應(yīng)于所述用戶集的一個(gè)用戶,所述無向圖中存在關(guān)聯(lián)關(guān)系的兩個(gè)用戶 對(duì)應(yīng)的節(jié)點(diǎn)之間用一條邊相連; 節(jié)點(diǎn)賦值模塊,用于按照預(yù)置的重復(fù)次數(shù)t對(duì)所述無向圖進(jìn)行t次的節(jié)點(diǎn)賦值處理,其 中,每一次的節(jié)點(diǎn)賦值處理都包括:對(duì)所述無向圖進(jìn)行邊滲流處理,W及邊滲流處理之后進(jìn) 行的資源值分配處理,其中,所述邊滲流處理包括:對(duì)所述無向圖中的每條連邊W1-Pc的 概率進(jìn)行刪除、Wpc的概率繼續(xù)保留,刪除連邊完成后的無向圖得到m個(gè)連通子圖,所述Pc為 根據(jù)所述拓?fù)渚W(wǎng)絡(luò)的結(jié)構(gòu)數(shù)據(jù)預(yù)先確定的滲流闊值,所述資源值分配處理包括:將所述m個(gè) 連通子圖按其包含的節(jié)點(diǎn)數(shù)目從大到小排列,將每個(gè)連通子圖中的節(jié)點(diǎn)按度值降序排列, 將L個(gè)單位的資源值依次分配給完成節(jié)點(diǎn)數(shù)目排列和度值排列后的m個(gè)連通子圖內(nèi)的節(jié)點(diǎn), 直至將所述L個(gè)單位的資源值分配完畢為止,其中在每一次的節(jié)點(diǎn)賦值處理過程中所述m個(gè) 連通子圖內(nèi)的一個(gè)節(jié)點(diǎn)只能分配到一個(gè)單位的資源,所述L為預(yù)置的需要獲取到具有最佳 傳播影響力的用戶個(gè)數(shù); 最佳傳播影響力用戶確定模塊,用于對(duì)所述無向圖進(jìn)行t次的節(jié)點(diǎn)賦值處理之后,將所 述無向圖中所有節(jié)點(diǎn)按照各個(gè)節(jié)點(diǎn)得到的總資源值從大到小排序,排序中的前L個(gè)節(jié)點(diǎn)所 對(duì)應(yīng)的用戶作為需要獲取的L個(gè)具有最佳傳播影響力的用戶。
[0008] 采用上述技術(shù)方案后,本發(fā)明提供的技術(shù)方案將有如下優(yōu)點(diǎn): 首先從網(wǎng)絡(luò)信息數(shù)據(jù)庫中獲取拓?fù)渚W(wǎng)絡(luò)的結(jié)構(gòu)數(shù)據(jù),然后根據(jù)拓?fù)渚W(wǎng)絡(luò)的結(jié)構(gòu)數(shù)據(jù)將 拓?fù)渚W(wǎng)絡(luò)表示為無向圖,接下來按照預(yù)置的重復(fù)次數(shù)t對(duì)無向圖進(jìn)行t次的節(jié)點(diǎn)賦值處理, 其中,每一次的節(jié)點(diǎn)賦值處理都包括:對(duì)無向圖進(jìn)行邊滲流處理,W及邊滲流處理之后進(jìn)行 的資源值分配處理,對(duì)無向圖進(jìn)行t次的節(jié)點(diǎn)賦值處理之后,將無向圖中所有節(jié)點(diǎn)按照各個(gè) 節(jié)點(diǎn)得到的總資源值從大到小排序,將無向圖中總資源值降序排列最大的前L個(gè)節(jié)點(diǎn)作為 具有最佳傳播影響力的用戶。本發(fā)明實(shí)施例中采用邊滲流的方法將無向圖劃分為若干個(gè)連 通子圖,然后給連通子圖中的節(jié)點(diǎn)分配單位的資源值,最后通過對(duì)無向圖中的所有節(jié)點(diǎn)得 到的總資源值來確定出L個(gè)具有最佳傳播影響力的用戶,本發(fā)明實(shí)施例通過重復(fù)t次的執(zhí)行 邊滲流處理和資源值分配處理可W同時(shí)選擇出L個(gè)具有最佳傳播影響力的用戶,運(yùn)些L個(gè)具 有最佳傳播影響力的用戶作為信息的傳播源時(shí)能夠提供信息的傳播效率。
【附圖說明】
[0009] 圖1為本發(fā)明實(shí)施例提供一種獲取L個(gè)具有最佳傳播影響力用戶的方法的流程方 框示意圖; 圖2-a為本發(fā)明實(shí)施例提供的一種獲取L個(gè)具有最佳傳播影響力用戶的裝置的組成結(jié) 構(gòu)示意圖; 圖2-b為本發(fā)明實(shí)施例提供的節(jié)點(diǎn)賦值模塊的組成結(jié)構(gòu)示意圖; 圖2-C為本發(fā)明實(shí)施例提供的另一種獲取L個(gè)具有最佳傳播影響力用戶的裝置的組成 結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0010] 本發(fā)明實(shí)施例提供了一種獲取L個(gè)具有最佳傳播影響力用戶的方法和裝置,用于 同時(shí)獲取到多個(gè)具有最佳傳播影響力的用戶,提高信息的傳播效率。
[0011] 為使得本發(fā)明的發(fā)明目的、特征、優(yōu)點(diǎn)能夠更加的明顯和易懂,下面將結(jié)合本發(fā)明 實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,下面所描述 的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而非全部實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域的 技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0012] 本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語"第一"、"第二"等是用于區(qū)別 類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解運(yùn)樣使用的術(shù)語在適當(dāng)情 況下可W互換,運(yùn)僅僅是描述本發(fā)明的實(shí)施例中對(duì)相同屬性的對(duì)象在描述時(shí)所采用的區(qū)分 方式。此外,術(shù)語"包括"和"具有"W及他們的任何變形,意圖在于覆蓋不排他的包含,W便 包含一系列單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于那些單元,而是可包