用于識(shí)別社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者及其社區(qū)的系統(tǒng)和方法
【專利摘要】一種由服務(wù)器執(zhí)行用于確定對(duì)于話題而言有影響力的至少一個(gè)用戶賬戶的系統(tǒng)和方法,其包括:獲取所述話題;確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的多個(gè)用戶賬戶;將所述用戶賬戶中的每個(gè)用戶賬戶表示為連通圖中的節(jié)點(diǎn)并且確定所述用戶賬戶中的每個(gè)用戶賬戶之間存在關(guān)系;將所述用戶賬戶中的每個(gè)用戶賬戶用作節(jié)點(diǎn)并且將相應(yīng)的關(guān)系用作所述節(jié)點(diǎn)中的每個(gè)節(jié)點(diǎn)之間的邊緣來計(jì)算話題網(wǎng)絡(luò)圖;將所述話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶進(jìn)行排名以過濾所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點(diǎn);識(shí)別所述經(jīng)過濾的話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶當(dāng)中的至少兩個(gè)不同的社區(qū),每個(gè)社區(qū)與所述用戶賬戶的子集相關(guān)聯(lián);識(shí)別與每個(gè)社區(qū)相關(guān)聯(lián)的屬性;輸出與所述相應(yīng)屬性相關(guān)聯(lián)的每個(gè)社區(qū)。
【專利說明】用于識(shí)別社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者及其社區(qū)的系統(tǒng)和方法 相關(guān)申請(qǐng)的交叉引用
[0001] 本申請(qǐng)要求20 13年10月25日提交的標(biāo)題為"Sy s terns and Me thods for Determining Influencers in a Social Data Network(用于確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響 者的系統(tǒng)和方法)"的61/895,539號(hào)美國(guó)臨時(shí)專利申請(qǐng)、2013年11月22日提交的標(biāo)題為 "Systems and Methods for Identifying Influencers and Their Communities in a Social Data Network(用于識(shí)別社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者及其社區(qū)的系統(tǒng)和方法)"的61/ 907,87號(hào)美國(guó)臨時(shí)專利申請(qǐng)、和2014年7月3日提交的標(biāo)題為"Systems and Methods for Dynamically Determining Influencers in a Social Data Network Using Weighted Analysis(用于使用加權(quán)分析動(dòng)態(tài)地確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者的系統(tǒng)和方法)"的62/ 020,833號(hào)美國(guó)臨時(shí)專利申請(qǐng)的優(yōu)先權(quán),并且其全部?jī)?nèi)容通過援引并入本文。
技術(shù)領(lǐng)域
[0002] 以下內(nèi)容總體上涉及分析社交網(wǎng)絡(luò)數(shù)據(jù)。 背景
[0001] 近年來,社交媒體已經(jīng)成為個(gè)人和消費(fèi)者在線(例如,在互聯(lián)網(wǎng)上)交互的流行方 式。社交媒體還影響企業(yè)目的在于和其客戶、粉絲、和潛在客戶在線交互的方式。
[0002] 關(guān)于具體話題的、具有大量追隨者的一些博客主被識(shí)別并且用于對(duì)特定產(chǎn)品代言 或贊助。例如,受歡迎的博客主的網(wǎng)站上的廣告空間用于對(duì)相關(guān)產(chǎn)品和服務(wù)做廣告。
[0003] 社交網(wǎng)絡(luò)平臺(tái)也用于影響人群。社交網(wǎng)絡(luò)平臺(tái)的示例包括以商標(biāo)名臉書 (Facebook)、推特(Twitter)、領(lǐng)英(LinkedIn)、湯博樂(Tumblr)和拼趣(Pinterest)著稱的 那些社交網(wǎng)絡(luò)平臺(tái)。社交網(wǎng)絡(luò)平臺(tái)內(nèi)的受歡迎的或?qū)<覀€(gè)人可以用于將向其他人進(jìn)行營(yíng) 銷。當(dāng)社交網(wǎng)絡(luò)內(nèi)的用戶數(shù)量增長(zhǎng)時(shí),快速識(shí)別受歡迎或有影響力的個(gè)人變得更困難。此 外,準(zhǔn)確識(shí)別受歡迎的話題內(nèi)的有影響力的個(gè)人是困難的。專家或在社交網(wǎng)絡(luò)內(nèi)受歡迎的 那些用戶在本文中可互換地稱為"影響者"。 附圖鑒于說明
[0004] 現(xiàn)在參考附圖僅通過舉例方式來描述實(shí)施例,在附圖中:
[0005] 圖1是展示了在社交數(shù)據(jù)網(wǎng)絡(luò)中彼此連接的用戶的圖解。
[0006] 圖2是與計(jì)算設(shè)備通信的服務(wù)器的示意圖。
[0007] 圖3是用于確定與話題相關(guān)聯(lián)的影響者的計(jì)算機(jī)可執(zhí)行指令的示例實(shí)施例的流程 圖。
[0008] 圖4是用于確定與話題相關(guān)聯(lián)的影響者的計(jì)算機(jī)可執(zhí)行指令的另一個(gè)示例實(shí)施例 的流程圖。
[0009] 圖5是用于獲取并存儲(chǔ)社交聯(lián)網(wǎng)數(shù)據(jù)的計(jì)算機(jī)可執(zhí)行指令的示例實(shí)施例的流程 圖。
[0010] 圖6是索引存儲(chǔ)器中的示例數(shù)據(jù)部件的框圖。
[0011] 圖7是配置文件存儲(chǔ)器中的示例數(shù)據(jù)部件的框圖。
[0012] 圖8是示例用戶列表和用戶在不同的用戶列表內(nèi)被列出的次數(shù)的記錄的示意圖。
[0013] 圖9是用于確定話題的計(jì)算機(jī)可執(zhí)行指令的示例實(shí)施例的流程圖,在這些話題中, 認(rèn)為給定的用戶是專家。
[0014] 圖10是用于確定給定用戶感興趣的話題的計(jì)算機(jī)可執(zhí)行指令的示例實(shí)施例的流 程圖。
[0015] 圖11是用于確定在索引存儲(chǔ)器中搜索被認(rèn)為是話題專家的用戶的計(jì)算機(jī)可執(zhí)行 指令的示例實(shí)施例的流程圖。
[0016] 圖12是用于識(shí)別對(duì)話題感興趣的用戶的計(jì)算機(jī)可執(zhí)行指令的示例實(shí)施例的流程 圖。
[0017]圖13是話題"麥咖啡(McCaf e)"的示例話題網(wǎng)絡(luò)圖的圖示。
[0018] 圖14是圖13中的話題網(wǎng)絡(luò)圖的圖示,展示了主聚類和離散值聚類的分解。
[0019] 圖15是用于基于社區(qū)的分解來識(shí)別和過濾話題網(wǎng)絡(luò)中的離群值的計(jì)算機(jī)可執(zhí)行 指令的示例實(shí)施例的流程圖。
[0020] 圖16是用于識(shí)別并且提供每個(gè)話題網(wǎng)絡(luò)的社區(qū)聚類的計(jì)算機(jī)可執(zhí)行指令的示例 實(shí)施例的流程圖。
[0021] 圖17A至圖17D示出了與顯示話題網(wǎng)絡(luò)內(nèi)的影響者社區(qū)的GUI交互的示例性屏幕截 圖。
[0022] 圖18示出了示例性社區(qū)網(wǎng)絡(luò)圖。
[0023] 圖19A至圖19C展示了具體話題的示例性社區(qū)和特征。
[0024] 圖20A至圖20B展示了第二選擇的話題的示例性社區(qū)和特征。 附圖詳細(xì)說明
[0025] 應(yīng)當(dāng)認(rèn)識(shí)的是,為了說明的簡(jiǎn)化和清晰,在認(rèn)為適當(dāng)時(shí),參考數(shù)字可在圖中被重復(fù) 以指示相應(yīng)或相似的元件。此外,陳述了許多特定細(xì)節(jié),以提供對(duì)本文中所描述的實(shí)施例的 透徹理解。然而,本領(lǐng)域的普通技術(shù)人員將理解的是,沒有這些特定細(xì)節(jié)也可以實(shí)踐本文中 所描述的實(shí)施例。在其他情形下,沒有詳細(xì)描述公知方法、程序和部件,以不使本文中所描 述的實(shí)施例難理解。并且,本說明不被認(rèn)為是限制本文中所描述的實(shí)施例的范圍。
[0026] 社交聯(lián)網(wǎng)平臺(tái)包括生成并發(fā)帖其他用戶的內(nèi)容來觀看、聽取等的用戶(例如,經(jīng)由 通過與社交聯(lián)網(wǎng)平板相關(guān)聯(lián)的網(wǎng)站通信的計(jì)算設(shè)備網(wǎng)絡(luò))。社交聯(lián)網(wǎng)平臺(tái)的非限制性示例 是 Facebook、Twitter、LinkedIn、Pinterest、Tumblr、博客圈、網(wǎng)站、合作維基、網(wǎng)上新聞組、 網(wǎng)上論壇、電子郵件、和即時(shí)消息傳送服務(wù)。目前已知的和未來認(rèn)識(shí)的社交聯(lián)網(wǎng)平臺(tái)可以與 本文中所描述的原理一起使用。社交聯(lián)網(wǎng)平臺(tái)可以用于向平臺(tái)的用戶推銷和做廣告。應(yīng)認(rèn) 識(shí)到,難以識(shí)別與給定話題相關(guān)的用戶。這包括識(shí)別關(guān)于給定話題的有影響力的用戶。
[0027] 如本文中所使用的,術(shù)語"影響者"是指主要產(chǎn)生并共享與話題相關(guān)的內(nèi)容的用戶 賬戶并且被認(rèn)為對(duì)社交數(shù)據(jù)網(wǎng)絡(luò)中的其他用戶是有影響的。如本文中所使用的,術(shù)語"追隨 者"是指追隨第二用戶賬戶(例如,與第一用戶賬戶的至少一個(gè)社交聯(lián)網(wǎng)平臺(tái)相關(guān)聯(lián)并且經(jīng) 由計(jì)算設(shè)備訪問的第二用戶賬戶)的第一用戶賬戶(例如,與一個(gè)或多個(gè)經(jīng)由計(jì)算設(shè)備訪問 的社交聯(lián)網(wǎng)平臺(tái)相關(guān)聯(lián)的第一用戶賬戶),這樣使得第二用戶賬戶所發(fā)帖的內(nèi)容被發(fā)布以 供第一用戶賬戶閱讀、消費(fèi)等。例如,當(dāng)?shù)谝挥脩糇冯S第二用戶,第一用戶(即,追隨者)將接 收第二用戶所發(fā)帖的內(nèi)容。對(duì)具體話題感"興趣"的用戶在本文中是指追隨具體話題的許多 專家的用戶賬戶(例如,與社交聯(lián)網(wǎng)平臺(tái)相關(guān)聯(lián))。在一些情況下,追隨者與其他用戶所發(fā)帖 的內(nèi)容(例如,通過分享或轉(zhuǎn)帖該內(nèi)容)互動(dòng)。
[0028] 識(shí)別關(guān)鍵影響者對(duì)于公司而言是可取的,以便例如將可能潛在地廣播和支持品牌 消息的個(gè)人定為目標(biāo)。雇傭這些個(gè)人能夠控制品牌的在線消息和可以減少可能發(fā)生的潛在 負(fù)面情緒。這個(gè)過程的小心管理可以引起在線注意力份額呈指數(shù)增長(zhǎng),例如,在病毒式營(yíng)銷 活動(dòng)情況下。
[0029] 大多數(shù)過去確定影響者的方法聚焦于可容易計(jì)算的度量,如追隨者或朋友的數(shù) 量、帖子的數(shù)量。雖然總的追隨者或朋友的計(jì)數(shù)可能接近于整個(gè)社交網(wǎng)絡(luò),但其關(guān)于指示用 戶或個(gè)人對(duì)公司或品牌的影響的計(jì)算度量方面提供極少數(shù)據(jù)。這通過大量的潛在用戶而引 起嘈雜的影響者結(jié)果和浪費(fèi)的時(shí)間篩選。
[0030] 若干社交媒體分析公司要求提供為社交網(wǎng)絡(luò)提供影響者分?jǐn)?shù)。然而,本文中應(yīng)認(rèn) 識(shí)到許多公司使用不是真影響者度量、而是追隨者和該提到的內(nèi)容(例如,推特的"推文"帖 子、消息等)的數(shù)量的代數(shù)公式的度量。例如,一些已知的方法中使用這些數(shù)量的對(duì)數(shù)歸一 化,該對(duì)數(shù)歸一化向追隨者計(jì)數(shù)分配權(quán)重的大致80 %并且向提到的內(nèi)容的數(shù)量分配余數(shù)。
[0031] 使用代數(shù)公式的原因是追隨者和提到的內(nèi)容的計(jì)數(shù)或記錄在社交網(wǎng)絡(luò)的用戶配 置文件中被立即更新。因此,計(jì)算非??觳⑶胰菀讏?bào)告。這經(jīng)常被稱為權(quán)威度量或權(quán)威分?jǐn)?shù) 以將其與真實(shí)影響者分析區(qū)分開。然而,權(quán)威分?jǐn)?shù)方法有若干個(gè)顯著缺點(diǎn)。
[0032] 本文中應(yīng)認(rèn)識(shí)到,這個(gè)權(quán)威分?jǐn)?shù)與上下文不相關(guān)。這是靜態(tài)度量,而不管話題或查 詢?nèi)绾?。例如,不管話題如何,大眾媒體機(jī)構(gòu)像紐約時(shí)報(bào)(New York Times)或美國(guó)有線新聞 網(wǎng)絡(luò)(CNN)會(huì)獲得最高排名,因?yàn)樗鼈兙哂袛?shù)百萬追隨者。因此,其不與上下文相關(guān)。
[0033] 本文中還應(yīng)認(rèn)識(shí)到,這個(gè)權(quán)威度量具有高追隨者計(jì)數(shù)偏差。如果在某個(gè)領(lǐng)域的定 義明確的專家有有線數(shù)量的追隨者,但這些追隨者全都是專家,由于其追隨者計(jì)數(shù)低,它們 將絕不會(huì)出現(xiàn)在前20至100個(gè)結(jié)果中。有效地,所有追隨者被視作具有相等的權(quán)重,這已經(jīng) 被展示為網(wǎng)絡(luò)分析研究中不正確的假設(shè)。
[0034] 本文中描述的所提出的系統(tǒng)和方法可以動(dòng)態(tài)地計(jì)算關(guān)于查詢?cè)掝}的影響者,并且 可以對(duì)其追隨者的影響做出解釋。
[0035] 還應(yīng)認(rèn)識(shí)到,影響者關(guān)系的遞歸性質(zhì)在大規(guī)模實(shí)施影響者識(shí)別時(shí)是一項(xiàng)挑戰(zhàn)。舉 例來講,考慮存在個(gè)人A、B和C的情形:A追隨B和C;B追隨C和A;并且C僅追隨A。然后,A的影響 取決于C,反過來C取決于A和B,等等。以此方式,影響者關(guān)系具有遞歸性質(zhì)。
[0036] 更普遍地,所提出的系統(tǒng)和方法提供了一種確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者的方 式。
[0037] 舉例來講,在圖1考慮了具體話題的簡(jiǎn)化追隨者網(wǎng)絡(luò)。顯示每個(gè)用戶(實(shí)際上是用 戶賬戶,或與用戶賬戶或用戶數(shù)據(jù)地址相關(guān)聯(lián)的用戶名)與其他用戶有關(guān)系。用戶之間的線 (又稱為邊緣)表示用戶之間的關(guān)系。例如,從用戶賬戶"戴夫(Dave)"指向用戶賬戶"卡羅爾 (Carol)"的箭頭是指戴夫閱讀卡羅爾發(fā)布的消息。換言之,戴夫追隨卡羅爾。艾米(Amy)與 布萊恩(Brian)之間的雙向箭頭是指例如艾米追隨戴夫而戴夫追隨艾米。除了圖1中的每個(gè) 用戶賬戶,提供了網(wǎng)頁排名分?jǐn)?shù)。網(wǎng)頁排名算法是谷歌用來測(cè)量網(wǎng)絡(luò)中網(wǎng)頁的重要性的一 種已知算法并且還可以應(yīng)用于測(cè)量社交數(shù)據(jù)網(wǎng)絡(luò)中的用戶的重要性。
[0038]繼續(xù)圖1,用戶艾米具有最大的追隨者數(shù)量(即,戴夫、卡羅爾和埃迪(Eddie))并且 是這個(gè)網(wǎng)絡(luò)中最有影響力的用戶(即,網(wǎng)頁排名分?jǐn)?shù)為46.1%)。然而,僅具有一個(gè)追隨者 (即艾米)的布萊恩比具有兩個(gè)追隨者(即,埃迪和戴夫)的卡羅爾更有影響力,主要是因?yàn)?布萊恩具有艾米的注意力份額的一大部分。換言之,使用本文中提出的系統(tǒng)和方法,盡管卡 羅爾比布萊恩具有更多的追隨者,但她不一定比布萊恩具有更大的影響。因此,使用本文中 所描述的所提出的系統(tǒng)和方法,用戶的追隨者的數(shù)量并不是影響力的唯一確定因素。在示 例實(shí)施例中,識(shí)別誰是用戶的追隨者還可以被分解成影響的計(jì)算。
[0039] 表1中表示圖1中的示例網(wǎng)絡(luò),但該表展示了網(wǎng)頁排名可以如何顯著不同于追隨者 的數(shù)量。
衣i :囹1十衣不的杵小FJ瑨的惟苻坦隨有訂數(shù)和FJ貝俳名甘數(shù)。
[0040] 艾米明顯是具有最大數(shù)量追隨者和最高網(wǎng)頁排名分?jǐn)?shù)的最高影響者。盡管卡羅爾 具有兩個(gè)追隨者,但她具有比具有一個(gè)追隨者的布萊恩更低的網(wǎng)頁排名度量。然而,布萊恩 的一個(gè)追隨者是最有影響力的艾米(具有四個(gè)追隨者),而卡羅爾的兩個(gè)追隨者是各自具有 〇追隨者的低影響者。直覺是如果幾個(gè)專家認(rèn)為某人是專家,則她/他也是專家。然而,網(wǎng)頁 排名算法得出比僅對(duì)追隨者的數(shù)量計(jì)數(shù)更好的影響力測(cè)量。如將在下文描述的,本文中所 描述的所提出的系統(tǒng)和方法可以使用網(wǎng)頁排名算法和其他類似排名算法。
[0041] 所提出的系統(tǒng)和方法可以用于確定社交數(shù)據(jù)網(wǎng)絡(luò)中給定話題的關(guān)鍵影響者。
[0042] 在示例實(shí)施例中,所提出的系統(tǒng)和方法可以用于確定話題A的影響者還是一個(gè)或 多個(gè)其他話題(例如,話題A、話題B、話題C等)的影響者。
[0043] 轉(zhuǎn)到圖2,展示了所提出的系統(tǒng)的示意圖。服務(wù)器100通過網(wǎng)絡(luò)102與計(jì)算設(shè)備101 通信。服務(wù)器100獲取并分析社交網(wǎng)絡(luò)數(shù)據(jù)并通過網(wǎng)絡(luò)向計(jì)算設(shè)備101提供結(jié)果。計(jì)算設(shè)備 101可以通過GUI接收用戶輸入以控制供分析的參數(shù)。
[0044] 可以認(rèn)識(shí)到,社交網(wǎng)絡(luò)數(shù)據(jù)包括關(guān)于社交網(wǎng)絡(luò)平臺(tái)的用戶的數(shù)據(jù)、以及用戶生成 或組織、或既生成也組織的內(nèi)容。社交網(wǎng)絡(luò)數(shù)據(jù)的非限制性示例包括用戶賬戶ID或用戶名、 對(duì)用戶或用戶賬戶的描述、用戶發(fā)帖的消息或其他數(shù)據(jù)、用戶與其他用戶之間的連接、位置 信息等。連接的示例是在本文中又稱為"列表"的"用戶列表",該用戶列表包括列表的名稱、 對(duì)該列表的描述、和給定用戶所追隨的一個(gè)或多個(gè)其他用戶。該用戶列表是例如由給定用 戶創(chuàng)建的。
[0045] 繼續(xù)圖2,服務(wù)器100包括處理器103和存儲(chǔ)器設(shè)備104。在示例實(shí)施例中,該服務(wù)器 包括一個(gè)或多個(gè)處理器和大量存儲(chǔ)器容量。在另一個(gè)示例實(shí)施例中,存儲(chǔ)器設(shè)備104或多個(gè) 存儲(chǔ)器設(shè)備是固態(tài)驅(qū)動(dòng)器以便提高讀出/寫入性能。在另一個(gè)示例實(shí)施例中,多個(gè)服務(wù)器用 于實(shí)施本文中所描述的方法。換言之,在示例實(shí)施例中,服務(wù)器100是指服務(wù)器系統(tǒng)。在另一 個(gè)示例實(shí)施例中,使用其他目前已知的計(jì)算硬件或未來認(rèn)識(shí)的計(jì)算硬件,或使用兩者。 [0046] 服務(wù)器100還包括經(jīng)由網(wǎng)絡(luò)102通信的通信設(shè)備105。網(wǎng)絡(luò)102可以是有線或無線網(wǎng) 絡(luò)、或是兩者。服務(wù)器100還包括用于經(jīng)由計(jì)算設(shè)備101顯示和接收數(shù)據(jù)的⑶I模塊106。服務(wù) 器還包括社交聯(lián)網(wǎng)數(shù)據(jù)模塊107;索引器模塊108;用戶賬戶關(guān)系模塊109;專家識(shí)別模塊 110;興趣識(shí)別模塊111;查詢模塊114,用于識(shí)別對(duì)話題A(例如,給定話題)感興趣的用戶;社 區(qū)識(shí)別模塊112和特征識(shí)別模塊113。如將描述的,社區(qū)識(shí)別模塊112被配置成用于基于專家 識(shí)別模塊識(shí)別的關(guān)系網(wǎng)絡(luò)圖來定義社區(qū)或數(shù)據(jù)聚類。
[0047]服務(wù)器100還包括多個(gè)數(shù)據(jù)庫(kù),包括數(shù)據(jù)存儲(chǔ)器116;索引存儲(chǔ)器117;社交圖數(shù)據(jù) 庫(kù)118;配置文件存儲(chǔ)器119;專業(yè)知識(shí)向量數(shù)據(jù)庫(kù)120;興趣向量數(shù)據(jù)庫(kù)121、用于存儲(chǔ)社區(qū) 圖信息的數(shù)據(jù)庫(kù)128、和用于存儲(chǔ)每個(gè)社區(qū)的受歡迎的特征并且存儲(chǔ)在每個(gè)社區(qū)(社區(qū)識(shí)別 模塊112定義的社區(qū))內(nèi)搜索的預(yù)定義特征的數(shù)據(jù)庫(kù)129。
[0048]社交聯(lián)網(wǎng)數(shù)據(jù)模塊107用于接收社交聯(lián)網(wǎng)數(shù)據(jù)流。在示例實(shí)施例中,每天且實(shí)時(shí)向 社交聯(lián)網(wǎng)數(shù)據(jù)模塊107傳遞數(shù)百萬條新消息。社交聯(lián)網(wǎng)數(shù)據(jù)模塊107接收的社交聯(lián)網(wǎng)數(shù)據(jù)存 儲(chǔ)在數(shù)據(jù)存儲(chǔ)器116中。
[0049] 索引器模塊108對(duì)數(shù)據(jù)存儲(chǔ)器116中的數(shù)據(jù)執(zhí)行索引器進(jìn)程并且將索引的數(shù)據(jù)存 儲(chǔ)在索引存儲(chǔ)器117中。在示例實(shí)施例中,能夠更容易搜索索引存儲(chǔ)器117中的索引數(shù)據(jù),并 且索引存儲(chǔ)器中的識(shí)別符可以用于檢索實(shí)際數(shù)據(jù)(例如,完整消息)。
[0050] 還從社交聯(lián)網(wǎng)平臺(tái)服務(wù)器(未示出)獲取社交圖,并且將其存儲(chǔ)在社交圖數(shù)據(jù)庫(kù) 118中。當(dāng)給定用戶作為查詢的輸入時(shí),社交圖可以用于返回追隨所查詢的用戶的所有用 戶。
[0051] 配置文件存儲(chǔ)器119存儲(chǔ)與用戶配置文件相關(guān)的元數(shù)據(jù)。配置文件相關(guān)元數(shù)據(jù)的 示例包括給定用戶的追隨者的總數(shù)、給定用戶的自公開個(gè)人信息、給定用戶的位置信息等。 可以查詢配置文件存儲(chǔ)器119中的數(shù)據(jù)。
[0052] 在示例實(shí)施例中,用戶賬戶關(guān)系模塊109可以使用社交圖118和配置文件存儲(chǔ)器 119以確定哪些用戶追隨具體用戶。
[0053]專家識(shí)別模塊110被配置成用于識(shí)別列出用戶賬戶所在的所有用戶列表的集合, 被稱為專業(yè)知識(shí)向量。用戶的專業(yè)知識(shí)向量存儲(chǔ)在專業(yè)知識(shí)向量數(shù)據(jù)庫(kù)120中。興趣識(shí)別模 塊111被配置成用于識(shí)別給定用戶感興趣的話題,被稱為興趣向量。用戶的興趣向量存儲(chǔ)在 興趣向量數(shù)據(jù)庫(kù)121中。
[0054] 再次參照?qǐng)D2,服務(wù)器100進(jìn)一步包括社區(qū)識(shí)別模塊112,該社區(qū)識(shí)別模塊被配置成 用于識(shí)別話題網(wǎng)絡(luò)內(nèi)的社區(qū)(例如,所查詢的話題,如話題A,內(nèi)的信息聚類)和由專家識(shí)別 模塊110識(shí)別的相關(guān)聯(lián)影響者。如將參照?qǐng)D3描述的,話題網(wǎng)絡(luò)示出了有影響力的用戶及其 關(guān)系(例如,專家識(shí)別模塊110和/或社交圖118所定義的)的圖。社區(qū)識(shí)別模塊112的輸出包 括被定義為話題網(wǎng)絡(luò)的包含共同特征和/或受同一社區(qū)中的其他實(shí)體(例如,影響者)比另 一個(gè)社區(qū)中的那些實(shí)體的影響程度更高的聚類的直觀識(shí)別(例如,顏色編碼)。服務(wù)器100進(jìn) 一步包括特征識(shí)別t吳塊113。
[0055] 特征識(shí)別模塊113被配置成用于從社區(qū)識(shí)別模塊112接收所識(shí)別的社區(qū)并提供在 社區(qū)成員之間受歡迎的特征(例如,談話話題)的識(shí)別。特征識(shí)別模塊113的結(jié)果可以可視地 與在社區(qū)識(shí)別模塊112中提供的社區(qū)的相應(yīng)可視化關(guān)聯(lián)。如將描述的,一方面,社區(qū)識(shí)別模 塊112(例如,多個(gè)社區(qū))和/或特征識(shí)別模塊113(例如,每個(gè)社區(qū)內(nèi)多個(gè)受歡迎的特征)的結(jié) 果顯示在顯示屏125上,作為至計(jì)算設(shè)備101的輸出。在另一方面,GUI模塊106被配置成用于 從計(jì)算設(shè)備101接收輸入以選擇社區(qū)識(shí)別模塊112識(shí)別的具體社區(qū)。然后,GUI模塊106被配 置成用于與特征識(shí)別模塊113通信,以提供與所選擇的社區(qū)(例如,所選擇的社區(qū)內(nèi)的所有 有影響力的用戶)相關(guān)聯(lián)的具體特征(例如,定義受歡迎的談話)的結(jié)果輸出。特征識(shí)別模塊 112的結(jié)果(例如,可視地定義所選擇的社區(qū)中的用戶之間的受歡迎的談話的詞云)可以和 具體選擇的社區(qū)和/或具體選擇的社區(qū)內(nèi)的用戶列表一起顯示在顯示屏125上。
[0056] 繼續(xù)圖2,計(jì)算設(shè)備101包括通過網(wǎng)絡(luò)102與服務(wù)器100通信的通信設(shè)備122、處理器 123、存儲(chǔ)器設(shè)備124、顯示屏125、和互聯(lián)網(wǎng)瀏覽器126。在示例實(shí)施例中,服務(wù)器100提供的 GUI通過互聯(lián)網(wǎng)瀏覽器由計(jì)算設(shè)備101顯示。在分析應(yīng)用127可在計(jì)算設(shè)備101上使用的另一 個(gè)示例實(shí)施例中,GUI通過分析應(yīng)用127由計(jì)算設(shè)備顯示??梢哉J(rèn)識(shí)到,顯示設(shè)備125可以是 計(jì)算設(shè)備(例如,像移動(dòng)設(shè)備、平板、膝上計(jì)算機(jī)等)的一部分或可以與計(jì)算設(shè)備(例如,像臺(tái) 式計(jì)算機(jī)等等一樣)分開。
[0057]盡管沒有展示,但各種用戶輸入設(shè)備(例如,觸摸屏、滾動(dòng)球、光鼠標(biāo)、按鈕、鍵盤、 麥克風(fēng)等)可以用于方便用戶與計(jì)算設(shè)備101之間的交互。
[0058] 應(yīng)認(rèn)識(shí)到,本文中例示的執(zhí)行指令的任何模塊或部件可以包括或以其他方式訪問 計(jì)算機(jī)可讀介質(zhì),如存儲(chǔ)介質(zhì)、計(jì)算機(jī)存儲(chǔ)介質(zhì)、或如例如磁盤、光盤或磁帶等數(shù)據(jù)存儲(chǔ)設(shè) 備(可移除和/或不可移除)。計(jì)算機(jī)存儲(chǔ)介質(zhì)可以包括在任何方法或技術(shù)中實(shí)現(xiàn)的用于存 儲(chǔ)信息(如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊、或其他數(shù)據(jù))的易失性和非易失性、可移 除和不可移除介質(zhì)。計(jì)算機(jī)存儲(chǔ)介質(zhì)的示例包括RAM、ROM、EEPROM、閃存或其他存儲(chǔ)器技術(shù)、 CD-ROM、數(shù)字多功能盤(DVD)或其他光存儲(chǔ)設(shè)備、磁帶盒、磁帶、磁盤存儲(chǔ)設(shè)備或其他磁性存 儲(chǔ)設(shè)備、或者能夠用于存儲(chǔ)所需信息且可以由應(yīng)用、模塊或兩者訪問的任何其他介質(zhì)。任何 這類計(jì)算機(jī)存儲(chǔ)介質(zhì)可以是服務(wù)器100、或計(jì)算設(shè)備101的一部分,或者是可訪問的或可與 其連接。本文中所描述的任何應(yīng)用或模塊可以使用計(jì)算機(jī)可讀/可執(zhí)行指令來實(shí)現(xiàn),這些指 令可以由這類計(jì)算機(jī)可讀介質(zhì)存儲(chǔ)或以其他方式保留。
[0059] 轉(zhuǎn)至圖3,展示了計(jì)算機(jī)可執(zhí)行指令的示例實(shí)施例,用于確定給定話題的一個(gè)或多 個(gè)影響者。圖3中所示的過程假設(shè)社交網(wǎng)絡(luò)數(shù)據(jù)可被服務(wù)器100獲得,并且社交網(wǎng)絡(luò)數(shù)據(jù)包 括被表示為集合U的多個(gè)用戶。在框301,服務(wù)器100獲取被表示為T的話題。例如,用戶可以 經(jīng)由顯示在計(jì)算設(shè)備101處的GUI錄入話題,并且計(jì)算設(shè)備101向服務(wù)器100發(fā)送該話題。在 框302,服務(wù)器使用該話題從社交網(wǎng)絡(luò)數(shù)據(jù)中確定與該話題相關(guān)聯(lián)的用戶。這種確定可以用 不同的方式實(shí)施,并且將在下文進(jìn)行詳細(xì)的討論。與話題相關(guān)聯(lián)的用戶集合被表示為Ut,其 中Ut是U的子集。
[0060] 繼續(xù)圖3,服務(wù)器將用戶集合Ut中的每個(gè)用戶模擬為節(jié)點(diǎn)并且確定用戶Ut(框303) 之間的關(guān)系。服務(wù)器計(jì)算分別與用戶Ut和用戶Ut(框304)之間的關(guān)系相對(duì)應(yīng)的節(jié)點(diǎn)和邊緣的 網(wǎng)絡(luò)。換言之,服務(wù)器創(chuàng)建分別與用戶Ut及其關(guān)系相對(duì)應(yīng)的節(jié)點(diǎn)和邊緣的網(wǎng)絡(luò)圖。網(wǎng)絡(luò)圖被 稱為"話題網(wǎng)絡(luò)"。可以認(rèn)識(shí)到,本文應(yīng)用了圖論的原理。定義了兩個(gè)實(shí)體或用戶Ut之間的邊 緣或連通性的關(guān)系可以包括例如:具體社交聯(lián)網(wǎng)平臺(tái)內(nèi)的兩個(gè)實(shí)體之間的朋友連接和/或 追隨者-被追隨者連接。在附加方面,這些關(guān)系可以包括定義了兩個(gè)實(shí)體(如朋友連接的朋 友)之間的社交媒體連通性的其他類型的關(guān)系。在另一方面,該關(guān)系可以包括在不同社交網(wǎng) 絡(luò)平臺(tái)(例如,Instagram和Facebook)上朋友或追隨者連接。在另一方面,由邊緣定義的用 戶Ut之間的關(guān)系可以包括例如:經(jīng)由一個(gè)用戶轉(zhuǎn)帖另一個(gè)用戶(例如,推特上的轉(zhuǎn)推)原始 發(fā)帖的消息連接的用戶、和/或通過經(jīng)由社交聯(lián)網(wǎng)平臺(tái)對(duì)一個(gè)用戶發(fā)帖的并且被另一個(gè)用 戶評(píng)論的消息的回復(fù)連接的用戶。再次參照?qǐng)D3,兩個(gè)實(shí)體之間存在邊緣表明在一個(gè)或多個(gè) 社交聯(lián)網(wǎng)平臺(tái)中存在至少一種類型的關(guān)系或連通性(例如,兩個(gè)用戶之間的朋友或追隨者 連接性)。
[0061] 然后,服務(wù)器對(duì)話題網(wǎng)絡(luò)內(nèi)的用戶進(jìn)行排名(框305)。例如,服務(wù)器使用網(wǎng)頁排名 測(cè)量話題網(wǎng)絡(luò)內(nèi)的用戶的重要性并且基于該測(cè)量對(duì)用戶進(jìn)行排名??梢允褂玫呐琶惴ǖ?其他非限制性示例包括:特征向量中心性、加權(quán)度、中間狀態(tài)、樞紐和權(quán)威度量。
[0062] 服務(wù)器識(shí)別并過濾掉話題網(wǎng)絡(luò)內(nèi)的離群值節(jié)點(diǎn)(框306)。離群值節(jié)點(diǎn)是被認(rèn)為與 話題網(wǎng)絡(luò)中的較大的人群或用戶聚類分開的離群值用戶。話題網(wǎng)絡(luò)中的離群值用戶或節(jié)點(diǎn) 的集合被表示為Uo,其中Uo是Ut的子集。下文描述了關(guān)于識(shí)別和過濾離群值節(jié)點(diǎn)的另外的細(xì) -K- To
[0063] 在框307,根據(jù)排名,服務(wù)器輸出用戶Uo被去除的用戶Ut。
[0064] 在替代示例實(shí)施例中,框306在框305之前執(zhí)行。
[0065] 在框308,服務(wù)器識(shí)別用戶Uo被去除的用戶Ut當(dāng)中的社區(qū)(例如,C1, C2,"_,Cn)。這些 社區(qū)的識(shí)別可以取決于與另一個(gè)社區(qū)內(nèi)的節(jié)點(diǎn)相比較一個(gè)社區(qū)內(nèi)的節(jié)點(diǎn)之間的連通性程 度。也就是,社區(qū)是由與所定義的社區(qū)外部的實(shí)體相比內(nèi)部(例如,相對(duì)于同一社區(qū)中的其 他節(jié)點(diǎn))具有更高連通性程度的實(shí)體或節(jié)點(diǎn)定義的。如將定義的,可以預(yù)定義(例如,由社區(qū) 圖數(shù)據(jù)庫(kù)128提供和/或從計(jì)算設(shè)備101由用戶定義)用于將一個(gè)社區(qū)與另一個(gè)社區(qū)分開的 連通性程度的值和閾值。該解決方案因此定義了社區(qū)內(nèi)的節(jié)點(diǎn)的互連性密度。每個(gè)識(shí)別的 社區(qū)圖因此是在框304針對(duì)每個(gè)社區(qū)定義的節(jié)點(diǎn)和邊緣(話題網(wǎng)絡(luò))的網(wǎng)絡(luò)圖的子集。一方 面,社區(qū)圖進(jìn)一步顯示了社區(qū)內(nèi)的用戶(例如,作為節(jié)點(diǎn))的視覺表示(用社區(qū)圖)和社區(qū)(例 如,提供給圖1的顯示屏125)內(nèi)的用戶的文本列表兩者。在另一方面,根據(jù)在社區(qū)內(nèi)和/或在 話題T的所有社區(qū)內(nèi)的影響度,對(duì)社區(qū)內(nèi)的用戶列表的顯示進(jìn)行排名(例如,提供給圖1的顯 示屏125)。根據(jù)框308,用戶Ut于是被分成其社區(qū)圖類別,如U C1、UC2、…UCn。
[0066] 在框309,針對(duì)每個(gè)給定社區(qū)(例如,C1),服務(wù)器基于給定社區(qū)內(nèi)的用戶(例如,Uc 1) 的社交網(wǎng)絡(luò)數(shù)據(jù)確定與其相關(guān)聯(lián)的預(yù)定義特征(例如,以下各項(xiàng)中的一項(xiàng)或多項(xiàng):常見的詞 和短語、談話的話題、常見的位置、常見的圖片、常見的元數(shù)據(jù))的受歡迎特征值。所選擇的 特征(例如,話題或位置)可以是用戶定義的(例如,經(jīng)由計(jì)算設(shè)備101的輸入)和/或自動(dòng)生 成的(例如,基于同一話題網(wǎng)絡(luò)內(nèi)的其他社區(qū)的特征、或基于同一話題T的之前使用的特 征)。在框310,服務(wù)器輸出所識(shí)別的社區(qū)(例如,&χ 2、···χη)和與每個(gè)給定社區(qū)相關(guān)聯(lián)的受 歡迎特征??梢宰鳛榕c每個(gè)社區(qū)的預(yù)定義特征的特征值視覺相關(guān)聯(lián)的社區(qū)圖來輸出(例如, 經(jīng)由服務(wù)器以便顯示在顯示屏125上)所識(shí)別的社區(qū)。
[0067] 轉(zhuǎn)至圖4,展示了計(jì)算機(jī)可執(zhí)行指令的另一個(gè)示例實(shí)施例,用于確定給定話題的一 個(gè)或多個(gè)影響者???01至404與框301至304相對(duì)應(yīng)。在框404之后,服務(wù)器100使用第一排名 方法對(duì)話題網(wǎng)絡(luò)內(nèi)的用戶進(jìn)行排名(框405)。第一排名方法可以與或可以不與框305中使用 的排名方法相同。完成該排名以識(shí)別針對(duì)給定話題在給定話題網(wǎng)絡(luò)中哪些用戶最有影響 力。
[0068]在框406,服務(wù)器識(shí)別并過濾掉話題網(wǎng)絡(luò)內(nèi)的離群值節(jié)點(diǎn)(用戶Uo),其中Uo是Ut的 子集。在框407,服務(wù)器使用基于在某一時(shí)期內(nèi)來自用戶的帖子的數(shù)量的第二排名方法來調(diào) 整用戶Uo被去除的用戶Ut的排名。例如,服務(wù)器確定如果與在同一時(shí)期內(nèi)第二用戶的帖子數(shù) 量相比第一用戶在上兩個(gè)月內(nèi)具有更高數(shù)量的帖子,則第一用戶的原始排名(從框405)可 以提升,而第二用戶的排名保持不變或降低。
[0069] 應(yīng)認(rèn)識(shí)到,基于所有用戶U的網(wǎng)絡(luò)圖可以非常大。例如,在集合U中可能存在數(shù)以億 計(jì)的用戶。分析與U相關(guān)的整個(gè)數(shù)據(jù)集可能在計(jì)算上是昂貴的且耗時(shí)。因此,使用以上方法 找出與話題T相關(guān)的更小的用戶集合Ut減少了待分析的數(shù)據(jù)量。這也減少了處理時(shí)間。在示 例實(shí)施例中,當(dāng)分析推特的整個(gè)社交網(wǎng)絡(luò)平臺(tái)時(shí),已經(jīng)產(chǎn)生影響者的近實(shí)時(shí)結(jié)果。使用更小 的用戶Ut集合和與用戶Ut相關(guān)聯(lián)的數(shù)據(jù),計(jì)算新話題網(wǎng)絡(luò)。該話題網(wǎng)絡(luò)比包括所有用戶U的 社交網(wǎng)絡(luò)圖更小(即,更少的節(jié)點(diǎn)和更少的邊緣)?;谠掝}網(wǎng)絡(luò)對(duì)用戶進(jìn)行排名比基于包 括所有用戶U的社交網(wǎng)絡(luò)圖對(duì)用戶排名快得多。
[0070] 此外,識(shí)別和過濾話題網(wǎng)絡(luò)中的離群值節(jié)點(diǎn)幫助進(jìn)一步提高結(jié)果的品質(zhì)。
[0071] 在框409,服務(wù)器被配置成用于以與之前關(guān)于框308所描述的相似的方式識(shí)別用戶 U0被去除的用戶Ut當(dāng)中的社區(qū)(例如,···,&〇(例如,利用圖2的社區(qū)識(shí)別模塊112)。在 框410,針對(duì)每個(gè)給定社區(qū)(例如,C 1),服務(wù)器被配置成用于基于給定社區(qū)(例如,C1)內(nèi)的用 戶(例如,Uci)的社交網(wǎng)絡(luò)數(shù)據(jù)以與之前關(guān)于框309所描述的相似的方式確定與所述用戶相 關(guān)聯(lián)的預(yù)定義特征(例如,常見的關(guān)鍵字和短語、談話的話題、常見的位置、常見的圖片、常 見的元數(shù)據(jù))的受歡迎特征值。在框411,服務(wù)器被配置成用于以與框310相似的方式輸出所 識(shí)別的社區(qū)和與每個(gè)給定社區(qū)(例如,C 1-Cn)相關(guān)聯(lián)的受歡迎特征的特征值(例如,經(jīng)由與圖 2中所示的服務(wù)器100和/或計(jì)算設(shè)備101相關(guān)聯(lián)的顯示屏)。
[0072] 以下描述了圖3和圖4中所描述的方法的另外細(xì)節(jié)。
[0073] 獲取社交網(wǎng)絡(luò)數(shù)據(jù);
[0074] 關(guān)于獲取社交網(wǎng)絡(luò)數(shù)據(jù),盡管沒有在圖3或圖4中展示,但將認(rèn)識(shí)到服務(wù)器100獲取 社交網(wǎng)絡(luò)數(shù)據(jù)。可以用各種方式獲取社交網(wǎng)絡(luò)數(shù)據(jù)。以下是獲取社交網(wǎng)絡(luò)數(shù)據(jù)的非限制示 例實(shí)施例。
[0075] 轉(zhuǎn)至圖5,展示了用于獲取社交網(wǎng)絡(luò)數(shù)據(jù)的計(jì)算機(jī)可執(zhí)行指令的示例實(shí)施例。數(shù)據(jù) 可以作為數(shù)據(jù)流被實(shí)時(shí)接收,包括消息和元數(shù)據(jù)。例如使用壓縮行格式將此數(shù)據(jù)存儲(chǔ)在數(shù) 據(jù)存儲(chǔ)器116中(框501)。在非限制性示例中,使用MySQL數(shù)據(jù)庫(kù)???00和501例如由社交聯(lián) 網(wǎng)數(shù)據(jù)模塊107實(shí)施。
[0076] 在示例實(shí)施例中,社交聯(lián)網(wǎng)模塊107接收的社交網(wǎng)絡(luò)數(shù)據(jù)被拷貝,并且社交網(wǎng)絡(luò)數(shù) 據(jù)的副本存儲(chǔ)在多個(gè)服務(wù)器上。這方便在分析社交網(wǎng)絡(luò)數(shù)據(jù)時(shí)并行處理。換言之,一個(gè)服務(wù) 器能夠分析數(shù)據(jù)網(wǎng)絡(luò)數(shù)據(jù)的一方面,而另一個(gè)服務(wù)器分析社交網(wǎng)絡(luò)數(shù)據(jù)的另一方面。
[0077]服務(wù)器100使用索引器進(jìn)程索引消息(框502)。例如,索引器進(jìn)程是與存儲(chǔ)過程分 開的過程,該過程包括當(dāng)消息實(shí)體化在數(shù)據(jù)存儲(chǔ)器116中時(shí)掃描這些消息。在示例實(shí)施例 中,索引器進(jìn)程自己在單獨(dú)的服務(wù)器上運(yùn)行。這方便并行處理。索引器進(jìn)程是例如使每天或 某個(gè)其他給定時(shí)期的索引數(shù)據(jù)表實(shí)體化的多線程進(jìn)程。索引數(shù)據(jù)被輸出并存儲(chǔ)在索引存儲(chǔ) 器117(框504)中。
[0078]簡(jiǎn)略轉(zhuǎn)到圖6,該圖展示了示例索引存儲(chǔ)器117,表格中的每行是唯一用戶賬戶識(shí) 別符和那一天或那個(gè)給定時(shí)期產(chǎn)生的所有消息識(shí)別符的相應(yīng)列表。在示例實(shí)施例中,每天 數(shù)百萬行數(shù)據(jù)可以被讀出和寫入索引存儲(chǔ)器117,并且可以當(dāng)新數(shù)據(jù)被實(shí)體化或添加至數(shù) 據(jù)存儲(chǔ)器116時(shí)進(jìn)行這個(gè)進(jìn)程。在示例實(shí)施例中,可以在索引存儲(chǔ)器117中使用壓縮后的行 格式。在另一個(gè)示例實(shí)施例中,通過運(yùn)行松弛事務(wù)語義來避免死鎖,因?yàn)楫?dāng)讀出和寫入表格 時(shí),這增加了多個(gè)線程上的通量。通過背景的方式,由于每個(gè)任務(wù)可以鎖住其他任務(wù)正嘗試 鎖住的資源,當(dāng)兩個(gè)或更多任務(wù)永久性地相互阻礙時(shí)發(fā)生死鎖。
[0079] 轉(zhuǎn)回到圖5,服務(wù)器100進(jìn)一步獲取關(guān)于哪些用戶賬戶追隨其他用戶賬戶的信息 (框503)。這個(gè)過程包括識(shí)別配置文件相關(guān)元數(shù)據(jù)并將其存儲(chǔ)在配置文件存儲(chǔ)器中(框 505) 〇
[0080] 在圖7中,配置文件存儲(chǔ)器119的示例展示了對(duì)于每個(gè)用戶賬戶,存在相關(guān)聯(lián)的配 置文件相關(guān)元數(shù)據(jù)。配置文件相關(guān)元數(shù)據(jù)包括例如用戶的追隨者的總數(shù)、自公開的個(gè)人信 息、位置信息、和用戶列表。
[0081] 在獲取并存儲(chǔ)數(shù)據(jù)之后,可以對(duì)其進(jìn)行分析以例如識(shí)別專家和興趣。
[0082] 確定與話題相關(guān)的用戶:
[0083] 關(guān)于確定與話題相關(guān)的用戶,按照框302和402,將認(rèn)識(shí)到可以用各種方式進(jìn)行這 類操作。以下是可以用于確定與話題相關(guān)的用戶的非限制性示例實(shí)施例。
[0084]在示例實(shí)施例中,確定與話題相關(guān)的用戶的操作(例如,框302和框402)基于 Sysomos搜索引擎,并且在2009年7月10日提交的標(biāo)題為"Method and System for Information Discovery and Text A nalysis(用于信息發(fā)現(xiàn)和文本分析的方法和系統(tǒng))" 的公開號(hào)為2009/0319518的美國(guó)專利申請(qǐng)中進(jìn)行了描述,該專利申請(qǐng)的全部?jī)?nèi)容通過援引 并入本文。根據(jù)公開號(hào)為2009/0319518的美國(guó)專利申請(qǐng)中所描述的方法,話題用于識(shí)別某 個(gè)時(shí)間間隔內(nèi)的受歡迎的文件。本文中認(rèn)識(shí)到這個(gè)過程可以用于識(shí)別與話題相關(guān)的用戶。 特別地,當(dāng)話題(例如,關(guān)鍵字)提供給公開號(hào)為2009/0319518的美國(guó)專利申請(qǐng)的系統(tǒng)時(shí),該 系統(tǒng)返回與該話題相關(guān)的并且受歡迎的文件(例如,帖子、推文、消息、文章等)。使用本文中 描述的所提出的系統(tǒng)和方法,可執(zhí)行指令包括服務(wù)器100確定受歡迎的文件的作者或多個(gè) 作者。以此方式,作者或多個(gè)作者被識(shí)別為與給定話題相關(guān)的頂端用戶??梢蕴峁┥舷蕈且?識(shí)別與給定話題相關(guān)的前η個(gè)用戶,其中,η是整數(shù)。在示例實(shí)施例中,η是5000,盡管可以使 用其他數(shù)目??梢愿鶕?jù)已知的或未來認(rèn)識(shí)的排名算法、或?qū)⒁阎幕蛭磥碚J(rèn)識(shí)的權(quán)威評(píng)分 算法用于社交媒體分析來確定前η個(gè)用戶。對(duì)于前η個(gè)用戶中的每個(gè)用戶,服務(wù)器確定追隨 前η個(gè)用戶中的每個(gè)用戶的用戶。不被認(rèn)為是前η個(gè)用戶的一部分、或不追隨前η個(gè)用戶的那 些用戶不是話題網(wǎng)絡(luò)中的用戶Ut的一部分。在示例實(shí)施例中,用戶Ut的集合包括前η個(gè)用戶 及其追隨者。
[0085]在進(jìn)行確定與話題相關(guān)的用戶的操作(例如,框302和框402)的另一個(gè)示例實(shí)施例 中,計(jì)算機(jī)可執(zhí)行指令包括:確定與給定話題相關(guān)的文件(例如,帖子、文章、推文、消息等); 確定這些文件的作者或多個(gè)作者;并且將該作者或這些作者確立為與給定話題Ut相關(guān)聯(lián)的 用戶。
[0086]在進(jìn)行確定與話題相關(guān)的用戶的操作(例如,框302和框402)的另一個(gè)示例實(shí)施例 中,該操作包括識(shí)別用戶的專業(yè)知識(shí)向量。使用圖8至圖11解釋這個(gè)示例實(shí)施例。
[0087]舉例來講,并且轉(zhuǎn)到圖8,用戶可以具有他或她可能追隨的其他用戶的列表。例如, 用戶A具有包括用戶A所追隨的用戶Β、用戶C和用戶D的列表。這些用戶(例如,用戶Β、用戶C 和用戶D)被分組在以列表A命名的列表下,并且該列表具有相關(guān)聯(lián)的列表描述(例如,描述 A)。換言之,用戶A認(rèn)為用戶B、用戶C和用戶D是話題A的專家或?qū)υ撛掝}有淵博的知識(shí)。
[0088] 另一個(gè)用戶,用戶E,可以具有相同或相似的列表名和描述(例如,與列表A、描述A 相同或相似),但可以具有除了用戶A列出的那些以外的不同用戶。例如,用戶E追隨用戶B、 用戶C和用戶D。換言之,用戶E認(rèn)為用戶B、用戶C和用戶G是話題A的專家或?qū)υ撛掝}有淵博 的知識(shí)。
[0089] 另一個(gè)用戶,用戶F,可以具有相同或相似的列表名和描述(例如,與列表A、描述A 相同或相似),但可以具有除了用戶A列出的那些以外的不同用戶。例如,用戶F追隨用戶B、 用戶H和用戶I,因?yàn)橛脩鬎認(rèn)為這些用戶是話題A的專家或者對(duì)該話題有淵博的知識(shí)。
[0090] 基于以上示例情境,可以認(rèn)識(shí)到,不同的用戶可以具有相同或相似命名或相似描 述的列表,但每個(gè)列表中的用戶可以不同。換言之,不同的用戶可以認(rèn)為其他不同用戶是給 定話題的專家。
[0091] 繼續(xù)圖8中的示例,對(duì)于給定話題,基于用戶在另一個(gè)用戶的列表中被列出的次 數(shù),服務(wù)器100可以確定其他用戶是否認(rèn)為該用戶是專家。例如,用戶B列出在與話題A相關(guān) 的三個(gè)不同列表上;用戶C列出在兩個(gè)不同的列表上;并且用戶D、用戶G、用戶H和用戶I中的 每一者僅列出在一個(gè)列表上。因此,在這個(gè)示例中,認(rèn)為用戶B是話題A的最前面的專家,后 面是用戶C。
[0092] 轉(zhuǎn)至圖9,提供了計(jì)算機(jī)可執(zhí)行指令的示例實(shí)施例用于確定給定用戶被認(rèn)為是其 專家的話題。在框901,服務(wù)器100獲取其中列出了給定用戶的一組列表。在框902,服務(wù)器 100使用該組列表確定與給定用戶相關(guān)聯(lián)的話題。在框903,服務(wù)器輸出給定用戶被認(rèn)為是 其專家的話題。這些話題形成給定用戶的專業(yè)知識(shí)向量。例如,如果在鮑勃(Bob)的釣魚列 表,席琳(Celine)的藝術(shù)列表和大衛(wèi)(David)的攝影列表中列出了用戶愛麗絲(Alice),則 愛麗絲的專業(yè)知識(shí)向量包括:釣魚、藝術(shù)和攝影。
[0093] 在示例實(shí)施例中,通過不斷地抓取用戶列表來獲取用戶列表,因?yàn)橛脩魟?dòng)態(tài)更新 用戶列表,并且經(jīng)常創(chuàng)建新列表。在示例實(shí)施例中,使用Apache Lucene(搜索引擎)索引處 理用戶列表。使用Lucene算法處理給定用戶的專業(yè)知識(shí)向量以填入與給定用戶相關(guān)聯(lián)的話 題的索引。這個(gè)索引支持例如全Lucene查詢句法,包括短語查詢和布爾邏輯(Boolean logic)。從背景來看,Apache Lucene是一種適合于全文索引和搜索的信息檢索軟件庫(kù)。由 于其在實(shí)現(xiàn)互聯(lián)網(wǎng)搜索引擎和本地單站點(diǎn)搜索中的用途,Lucene也是眾所周知的??梢哉J(rèn) 識(shí)到,可以使用其他當(dāng)前已知的或未來認(rèn)識(shí)的搜索和索引算法。
[0094] 在示例實(shí)施例中,圖9的計(jì)算機(jī)可執(zhí)行指令由模塊110實(shí)施。
[0095] 轉(zhuǎn)至圖10,提供了計(jì)算機(jī)可執(zhí)行指令的示例實(shí)施例,用于確定給定用戶感興趣的 話題。在框1001,服務(wù)器100獲取給定用戶追隨的輔助用戶。
[0096]在框1002,執(zhí)行多個(gè)指令,但是特定于每個(gè)輔助用戶。具體而言,在框1003,服務(wù)器 獲取其中列出了輔助用戶的一組列表(例如,輔助用戶的專業(yè)知識(shí)向量)。在框1004,服務(wù)器 使用該組列表確定與輔助用戶相關(guān)聯(lián)的話題???004的輸出是與輔助用戶相關(guān)聯(lián)的話題 (框1005)。在示例實(shí)施例中,框1002可以僅僅訪問圖9中介紹的算法,但應(yīng)用于每個(gè)輔助用 戶。
[0097]在示例實(shí)施例中,在框1006,服務(wù)器將來自所有輔助用戶的話題組合。組合后的話 題形成給定用戶的感興趣的話題的輸出1007(例如,給定用戶的興趣向量)。
[0098]在另一個(gè)示例實(shí)施例中,框1006和1007的替代方案是確定在輔助用戶當(dāng)中哪些話 題是常見的、或最常見的(框1008)。例如,給定用戶愛麗絲(Alice)追隨輔助用戶鮑勃 (Bob)、席琳(Celine)和大衛(wèi)(David)。鮑勃被認(rèn)為是釣魚和攝影專家(例如,鮑勃的專業(yè)知 識(shí)向量)。席琳被認(rèn)為是釣魚、攝影和藝術(shù)專家(例如,席琳的專業(yè)知識(shí)向量)。大衛(wèi)被認(rèn)為是 釣魚和音樂專家(例如,大衛(wèi)的專業(yè)知識(shí)向量)。因此,由于釣魚話題在所有輔助用戶當(dāng)中是 常見的,所以識(shí)別出愛麗絲對(duì)釣魚話題感興趣?;蛘?,由于攝影在輔助用戶當(dāng)中更常見(例 如,在釣魚后面的第二最常見話題),則攝影話題也被識(shí)別為愛麗絲感興趣的話題。由于藝 術(shù)和音樂在輔助用戶當(dāng)中不常見,所以不認(rèn)為這些話題是愛麗絲感興趣的話題。
[0099]在示例實(shí)施例中,模塊111實(shí)施圖10中呈現(xiàn)的計(jì)算機(jī)可執(zhí)行指令。
[0100]在示例實(shí)施例中,來自專業(yè)知識(shí)向量的數(shù)據(jù)和來自興趣向量的數(shù)據(jù)供應(yīng)給Lucene 算法,用于索引。
[0101]轉(zhuǎn)到圖11,示例計(jì)算機(jī)可執(zhí)行指令被提供用于在索引存儲(chǔ)器117中搜索被認(rèn)為是 話題的專家的用戶。在框1101,服務(wù)器獲取話題來進(jìn)行查詢。在框1102,服務(wù)器識(shí)別將話題A (例如,查詢的話題)列入其專業(yè)知識(shí)向量中的用戶。在框1103,在所識(shí)別的用戶中,服務(wù)器 確定哪些用戶出現(xiàn)在與話題A相關(guān)聯(lián)的數(shù)量最高的列表中。在框1104,出現(xiàn)在數(shù)量最高的列 表上的前η個(gè)用戶是話題A的專家。換言之,服務(wù)器將用戶Ut的集合創(chuàng)建成包括前η個(gè)用戶及 其追隨者。
[0102]在確定用戶的另一個(gè)實(shí)施例中,其包括圖8至圖11中所描述的原理,追隨者最大達(dá) 到值可以用于識(shí)別前η個(gè)用戶。達(dá)到最大值計(jì)算確定有多少唯一追隨者與用戶集合(例如, 專家、影響者)相關(guān)聯(lián)。例如,如果第一專家和第二專家組合起來具有總計(jì)二百個(gè)唯一追隨 者,并且第二專家和第三專家組合起來具有總計(jì)三百個(gè)唯一追隨者,則與第一專家和第二 專家相比較,第二專家和第三專家具有更大的追隨者"達(dá)到值"。轉(zhuǎn)到圖12,示例計(jì)算機(jī)可執(zhí) 行指令用于識(shí)別對(duì)話題A有興趣的用戶,這些指令可以由模塊114實(shí)施。在框1201,服務(wù)器 100例如通過GUI中的用戶輸入獲取話題Α。在框1202,服務(wù)器搜索對(duì)話題A有興趣的用戶(例 如,通過分析每個(gè)用戶的興趣向量)。在框1203,輸出從框1202識(shí)別的用戶。
[0103] 為了確定對(duì)話題A感興趣的用戶的最大達(dá)到值,服務(wù)器確定η個(gè)用戶的哪個(gè)組合提 供用戶的數(shù)量最高的唯一追隨者(框1204)。所確定的前η個(gè)用戶與其追隨者一起被輸出(框 1205)。換言之,話題網(wǎng)絡(luò)中的用戶Ut包括前η個(gè)用戶及其追隨者。
[0104] 將認(rèn)識(shí)到,識(shí)別與話題相關(guān)的用戶的其他已知和未來認(rèn)識(shí)的方式可以用于其他示 例實(shí)施例中。
[0105] 識(shí)別并過濾話題網(wǎng)絡(luò)中的離群值用戶:
[0106] 關(guān)于識(shí)別并過濾話題網(wǎng)絡(luò)內(nèi)的離群值節(jié)點(diǎn)(例如,用戶),按照框306和406,將認(rèn)識(shí) 到可以使用不同的計(jì)算。以下是實(shí)施框306和406的非限制示例實(shí)施例。
[0107] 應(yīng)認(rèn)識(shí)到,可以通過去除有問題的離群值改進(jìn)來自話題網(wǎng)絡(luò)的數(shù)據(jù)。例如,也發(fā)生 使用是指麥當(dāng)勞咖啡品牌的話題"麥咖啡(McCafe)"的查詢從而將來自菲律賓的是具有相 同名稱的卡拉ok酒吧/咖啡館的粉絲的一些用戶帶回。因?yàn)樗鼈兣銮墒蔷o密的社區(qū),所以其 影響者分?jǐn)?shù)經(jīng)常高到足以排名在關(guān)鍵的前十列表中。
[0108] 轉(zhuǎn)到圖13,展示了話題網(wǎng)絡(luò)1301的示例實(shí)施例的圖示,展示了未經(jīng)過濾的結(jié)果。節(jié) 點(diǎn)表示與話題McCafe相關(guān)的用戶集合U T。一些節(jié)點(diǎn)1302或用戶來自菲律賓,是具有相同名 稱McCaf e的卡拉ok酒吧/咖啡館的粉絲。
[0109] 這種現(xiàn)象有時(shí)在測(cè)試案例中發(fā)生,但不局限于話題McCafe的測(cè)試案例。在本文中 應(yīng)認(rèn)識(shí)到,尋找McCafe的用戶沒有尋找麥當(dāng)勞咖啡和菲律賓卡拉ok酒吧兩者,并且因此這 個(gè)子網(wǎng)絡(luò)1302被認(rèn)為有噪聲。
[0110] 為了實(shí)現(xiàn)降噪,在示例實(shí)施例中,服務(wù)器使用被稱為模塊性的網(wǎng)絡(luò)社區(qū)檢測(cè)算法 來識(shí)別和過濾話題查詢中的這些類型的離群值聚類。在紐曼M.E.J. (2006)引用的文章 "Modularity and community structure in networks(網(wǎng)絡(luò)中的模塊性和社區(qū)結(jié)構(gòu))"美 國(guó)國(guó)家科學(xué)院論文集103(23) :8577-8696中描述模塊性算法,其全部?jī)?nèi)容通過引用并入本 文。
[0111] 將認(rèn)識(shí)到,可以應(yīng)用其他類型的聚類和社區(qū)檢測(cè)算法來確定話題網(wǎng)絡(luò)中的離群 值。過濾幫助去除正在尋找與話題相關(guān)聯(lián)的影響者的用戶無意的或?qū)で蟮慕Y(jié)果。
[0112] 如圖14中所示,相對(duì)于話題網(wǎng)絡(luò)1301中的主要聚類1402識(shí)別離群值聚類1401。從 話題網(wǎng)絡(luò)中去除用戶Uo離群值聚類1401,并且主要聚類1402中的剩余的用戶用于形成所輸 出的影響者的排名列表。
[0113] 在示例實(shí)施例中,服務(wù)器100計(jì)算過濾掉離群值的以下指令:
[0114] 1.在話題網(wǎng)絡(luò)上執(zhí)行模塊性算法。
[0115] 2.模塊函數(shù)將話題網(wǎng)絡(luò)分解成多個(gè)模塊化社區(qū)或子網(wǎng)絡(luò),并且將每個(gè)節(jié)點(diǎn)加標(biāo)到 X個(gè)聚類/社區(qū)之一中。在示例實(shí)施例中,X〈N/2,因?yàn)樯鐓^(qū)具有多于一個(gè)成員,并且N是集合 Ut中的用戶數(shù)量。
[0116] 3.按社區(qū)內(nèi)的用戶的數(shù)量對(duì)社區(qū)排序,并且接受數(shù)量最大的社區(qū)。
[0117] 4.當(dāng)節(jié)點(diǎn)數(shù)量的累積總和超過總數(shù)的80%時(shí),從話題網(wǎng)絡(luò)中去除剩余的最小的社 區(qū)。
[0118] 關(guān)于圖15描述了用于識(shí)別并過濾話題網(wǎng)絡(luò)的計(jì)算機(jī)可執(zhí)行指令的一般示例實(shí)施 例??梢哉J(rèn)識(shí)到,這些指令可以用于執(zhí)行框306和406。
[0119] 在框1501,服務(wù)器100將找社區(qū)算法應(yīng)用于話題網(wǎng)絡(luò)從而將網(wǎng)絡(luò)分解為多個(gè)社區(qū)。 用于找出社區(qū)的算法的非限制性示例包括最小割除法、層次聚類、格文-紐曼算法(Girvan-Newman algorithm)、以上參考的模塊性算法、和基于團(tuán)集(Clique-based)的方法。
[0120] 在框1502,服務(wù)器將每個(gè)節(jié)點(diǎn)(即,用戶)加標(biāo)到X個(gè)社區(qū)之一中,其中X〈N/2,并且N 是話題網(wǎng)絡(luò)中的節(jié)點(diǎn)的數(shù)量。
[0121] 在框1503,服務(wù)器識(shí)別每個(gè)社區(qū)內(nèi)的節(jié)點(diǎn)的數(shù)量。
[0122] 如果節(jié)點(diǎn)數(shù)量最大的社區(qū)還沒有被添加至經(jīng)過濾的話題網(wǎng)絡(luò),則服務(wù)器然后將那 個(gè)社區(qū)添加至經(jīng)過濾的話題網(wǎng)絡(luò)(框1504)。可以認(rèn)識(shí)到,首先,經(jīng)過濾的話題網(wǎng)絡(luò)包括零社 區(qū),并且添加至經(jīng)過濾的話題網(wǎng)絡(luò)的第一社區(qū)是最大的社區(qū)。來自未經(jīng)過濾的話題網(wǎng)絡(luò)的 同一社區(qū)不能不止一次被添加至經(jīng)過濾的話題網(wǎng)絡(luò)。
[0123] 在框1505,服務(wù)器確定經(jīng)過濾的話題網(wǎng)絡(luò)的中的節(jié)點(diǎn)的數(shù)量是否超過或大于原始 或未經(jīng)過濾的話題網(wǎng)絡(luò)中的節(jié)點(diǎn)的數(shù)量的Y%。在示例實(shí)施例中,Y%是80% 3其他百分比 值也是適用的。如果沒有超過,則該過程環(huán)回到框1504。當(dāng)框1505的條件是真的時(shí),該過程 前進(jìn)到框1506。
[0124] 通常,當(dāng)經(jīng)過濾的話題網(wǎng)絡(luò)中的節(jié)點(diǎn)的數(shù)量達(dá)到或超過未經(jīng)過濾的話題網(wǎng)絡(luò)中的 節(jié)點(diǎn)的總數(shù)的多數(shù)百分比時(shí),則已經(jīng)識(shí)別出主聚類并且也識(shí)別出是離群值節(jié)點(diǎn)(例如,U0) 的剩余節(jié)點(diǎn)。
[0125] 在框1506,輸出不包括離群值用戶Uo的經(jīng)過濾的話題網(wǎng)絡(luò)。
[0126] 示例:McCafe案例研究
[0127] McCafe是麥當(dāng)勞(McDonald)創(chuàng)建的咖啡屋式餐飲品牌。其包含各種各樣的菜單 項(xiàng),如咖啡、拿鐵咖啡、濃咖啡、和冰沙。表2中展示了將本文中所描述的系統(tǒng)和方法用于 "McCafe"的影響者結(jié)果。社交網(wǎng)絡(luò)數(shù)據(jù)來自推特。
表2.按話題查詢"McCafe"的影響分?jǐn)?shù)和權(quán)威分?jǐn)?shù)排序的排名靠前的推特句柄。
[0128] 對(duì)這些結(jié)果有幾點(diǎn)觀察。
[0129] 影響分?jǐn)?shù)準(zhǔn)確列出了句柄McCafe作為查詢的頭名影響者,而權(quán)威分?jǐn)?shù)是8。這沒有 出現(xiàn)在權(quán)威分?jǐn)?shù)的第一頁上。
[0130] 許多本地/地區(qū)麥當(dāng)勞句柄基于影響而評(píng)級(jí)較高,但具有的權(quán)威分?jǐn)?shù)低于10。
[0131] 基于影響,具有低權(quán)威分?jǐn)?shù)7的Rick Wion是評(píng)級(jí)第九高的用戶。Rick Wion是麥當(dāng) 勞的社交媒體互動(dòng)VP,其明顯是推特上的麥當(dāng)勞影響者。
[0132] 權(quán)威分?jǐn)?shù)列表中存在許多不適當(dāng)?shù)拿?,這些名字可能已經(jīng)提到McCafe和具有許 多追隨者,但他們明顯不是影響者。
[0133] 以上觀察顯示了當(dāng)使用本文中所描述的系統(tǒng)和方法時(shí)影響者結(jié)果的更好質(zhì)量。
[0134] 不例:Fanexpo案例石開究
[0135] Fanexpo是加拿大多倫多市舉辦的漫畫、科幻小說和虛幻娛樂的年度大會(huì)。話題查 詢"Fanexpo"的排名靠前的影響者展示在表3中的左側(cè),其中,在右側(cè)展示了基于權(quán)威分?jǐn)?shù) 的比較結(jié)果。使用本文中所描述的系統(tǒng)和方法確定影響者。
表3.按話題查詢"Fanexpo"的影響分?jǐn)?shù)和權(quán)威分?jǐn)?shù)排序的排名靠前的推特句柄。
[0136] 當(dāng)分析這些結(jié)果時(shí),可以看到若干個(gè)有趣的觀察。
[0137] 本文中所描述的影響者方法準(zhǔn)確列出了句柄加拿大Fan Expo,作為查詢的頭名影 響者,而權(quán)威方法給出其分?jǐn)?shù)為8。
[0138] 排名第二的影響者C.B. Cebulski是漫威漫畫的著名作家,其被認(rèn)為在這個(gè)領(lǐng)域中 非常有影響力。
[0139] 注意到,在靠前的權(quán)威排名中,以上兩個(gè)影響者(即,加拿大Fan Expo和 C. B. Cebulski)沒有出現(xiàn)在關(guān)鍵的第一頁中。
[0140] 接下來的四個(gè)影響者SiIver Snail、SpaceChanneI、Torontoist和黑馬漫畫公司 是多倫多市中的漫畫商店、科幻小說頻道、多倫多市娛樂博客和漫畫出版商。
[0141] 權(quán)威排名靠前的一般新聞媒體國(guó)家郵報(bào)、多倫多市CTV、CBC頭條新聞是不適合這 個(gè)話題的用戶賬戶。
[0142] 接下來一系列影響者(例如,推特賬戶名)是漫威漫畫或DC漫畫的作者,或科幻或 奇幻電影或電視連續(xù)劇中的演員。注意到,他們當(dāng)中許多具有小于10的權(quán)威分?jǐn)?shù)。
[0143] 再次,以上觀察顯示了當(dāng)使用本文中所描述的系統(tǒng)和方法時(shí)影響者結(jié)果的更好質(zhì) 量。
[0144] 示例:而f克Livestrong案例研究
[0145] Livestrong是現(xiàn)在名譽(yù)掃地的自行車運(yùn)動(dòng)員蘭斯?阿姆斯特朗(Lance Armstrong)成立的為癌癥研究謀福利的組織。在Armstrong關(guān)于興奮劑丑聞而被控告之后, 耐克最近解除了與Livestrong的關(guān)系。使用來自推特的社交網(wǎng)絡(luò)數(shù)據(jù)在表4中的右側(cè)展示 了查詢"耐克Livestrong"的影響者結(jié)果。在右側(cè)展示了使用權(quán)威方法的結(jié)果。
表4.按話題查詢"耐克Li vestrong"的影響分?jǐn)?shù)和權(quán)威分?jǐn)?shù)排序的排名靠前的推特句 柄。
[0146] 表4中存在若干個(gè)有趣點(diǎn)。
[0147] 權(quán)威分?jǐn)?shù)為10的靠前的影響者許多是大篇幅編寫Armstrong興奮劑丑聞的體育新 聞句柄或體育記者。
[0148] 具體而言,基于影響,Juliet Macur排名第三,而她的權(quán)威分?jǐn)?shù)是8。她是編寫了書 "Cycle of Lies: the Fall of Lance Armstrong" 的紐約時(shí)報(bào)的體育記者。
[0149] Joseph Weisenthal是根據(jù)耐克Livestrong合作關(guān)系關(guān)于興奮劑丑聞發(fā)推文的體 育商業(yè)內(nèi)幕者。
[0150] 雖然可能難以根據(jù)權(quán)威分?jǐn)?shù)10在所有推特用戶賬戶之間進(jìn)行區(qū)分,但影響排名對(duì) 影響者的相對(duì)排名給出了更大程度的特異性。
[0151] 以下描述了圖3和圖4中描述的方法步驟的具體與社區(qū)識(shí)別、每個(gè)社區(qū)內(nèi)受歡迎的 特征及其值的識(shí)別、和結(jié)果的顯示相關(guān)的進(jìn)一步細(xì)節(jié)。
[0152] 識(shí)別社區(qū)
[0153] 轉(zhuǎn)至圖16,展示了用于從社交網(wǎng)絡(luò)數(shù)據(jù)識(shí)別社區(qū)的計(jì)算機(jī)可執(zhí)行指令的示例實(shí)施 例。
[0154] 社交網(wǎng)絡(luò)平臺(tái)的特征是用戶追隨(或定義為朋友)另一個(gè)用戶。如之前所描述的, 話題網(wǎng)絡(luò)內(nèi)的多個(gè)節(jié)點(diǎn)和邊緣圖示的用戶之間存在其他類型的關(guān)系或互連性。在話題網(wǎng)絡(luò) 內(nèi),影響者可以在不同程度上影響不同的用戶聚類。也就是,基于關(guān)于圖16所描述的用于識(shí) 別社區(qū)的過程,服務(wù)器被配置成用于識(shí)別單個(gè)話題網(wǎng)絡(luò)內(nèi)的被稱為社區(qū)的多個(gè)聚類。由于 影響在社交網(wǎng)絡(luò)平臺(tái)上不均勻,所以關(guān)于圖16定義的社區(qū)識(shí)別過程是有利的,因?yàn)槠渥R(shí)別 每個(gè)影響者在話題網(wǎng)絡(luò)上的影響程度或深度(例如,通過使一個(gè)社區(qū)與另一個(gè)社區(qū)相關(guān) 聯(lián))。
[0155] 如將在圖16中定義的,服務(wù)器被配置成用于提供不同的社區(qū)集合(例如,Cl,…, Cn)、和每個(gè)社區(qū)內(nèi)的靠前的影響者。在另一個(gè)優(yōu)選方面,服務(wù)器被配置成用于提供所有社 區(qū)上的靠前的高影響者的匯總列表,從而提供所有影響者的相對(duì)順序。
[0156] 在步驟1601,服務(wù)器被配置成用于從如之前描述的(例如,圖3和圖4)社交聯(lián)網(wǎng)數(shù) 據(jù)獲取話題網(wǎng)絡(luò)圖信息。話題網(wǎng)絡(luò)可視地圖示了節(jié)點(diǎn)之間的關(guān)系,用戶集合(Ut)各自被表 示為話題網(wǎng)絡(luò)圖中的節(jié)點(diǎn)并且通過邊緣連接以表明話題網(wǎng)絡(luò)圖中的兩個(gè)用戶之間的關(guān)系 (例如,朋友或追隨者-被追隨者、或其他社交媒體互連性)。在框1602,服務(wù)器獲取內(nèi)部和/ 或外部互連性的預(yù)定義的程度或測(cè)量值(例如,分辨率)用于定義社區(qū)之間的邊界。
[0157] 在框1603,服務(wù)器被配置成用于根據(jù)預(yù)定義的互連性程度(例如,分辨率)計(jì)算每 個(gè)節(jié)點(diǎn)(例如,影響者)和邊緣的得分。也就是,在一個(gè)示例中,每個(gè)用戶句柄被分配一個(gè)模 塊性類別標(biāo)識(shí)符(Mod ID)和一個(gè)網(wǎng)頁排名分?jǐn)?shù)(定義影響程度)。一方面,分辨率參數(shù)被配 置成用于控制所識(shí)別的社區(qū)的密度和數(shù)量。在優(yōu)選方面,服務(wù)器利用提供2到10個(gè)社區(qū)的默 認(rèn)分辨率值2。在另一方面,分辨率值是由使用者定義的(例如,經(jīng)由圖2中的計(jì)算設(shè)備101), 從而根據(jù)社區(qū)信息的可視化需要生成更高或更低的社區(qū)粒度。
[0158]在框1604,服務(wù)器被配置成用于定義并輸出不同的社區(qū)聚類(例如,&,&,···,&〇, 由此將用戶Ut分區(qū)成Ucr"UCn,使得由網(wǎng)絡(luò)中的節(jié)點(diǎn)定義的每個(gè)用戶映射到相應(yīng)的社區(qū)。一 方面,模塊性分析用于定義社區(qū),這樣使得每個(gè)社區(qū)在社區(qū)內(nèi)的節(jié)點(diǎn)聚類之間具有稠密的 連接(高連接性)但與不同的社區(qū)中的節(jié)點(diǎn)具有稀疏的連接(低連接性)。一方面,可以利用 模塊性算法和/或密度算法(其策略內(nèi)部連接性)實(shí)施社區(qū)檢測(cè)方法步驟1603-1606。此外, 在一方面,利用Gephi、開放源圖形分析包、和/或java script庫(kù)來實(shí)施結(jié)果的可視化。
[0159] 在框1605,服務(wù)器被配置成用于定義并輸出所有社區(qū)上的靠前的影響者和/或每 個(gè)社區(qū)內(nèi)的靠前的影響者并且提供所有影響者的相對(duì)排序。一方面,當(dāng)選擇具體社區(qū)時(shí),靠 前的影響者和其社區(qū)一起可視地顯示。在另一個(gè)方面,在框1605,服務(wù)器被配置成用于提供 所有社區(qū)上的靠前的影響者的匯總列表,從而提供所有影響者的相對(duì)順序。
[0160] 在框1606,服務(wù)器被配置成用于可視地描繪和區(qū)分每個(gè)社區(qū)聚類(例如,通過顏色 編碼或其他視覺識(shí)別以將一個(gè)社區(qū)與另一個(gè)社區(qū)區(qū)分開)。另外一方面,在框1606,服務(wù)器 被配置成用于提供可視地與相應(yīng)社區(qū)關(guān)聯(lián)的每個(gè)社區(qū)中的靠前的影響者的集合。在又另外 一方面,在框1606,服務(wù)器被配置為將社區(qū)圖中的每個(gè)節(jié)點(diǎn)的大小改變成與相應(yīng)的影響者 的分?jǐn)?shù)(例如,影響分?jǐn)?shù))相對(duì)應(yīng)。如從框1606輸出的,來自節(jié)點(diǎn)的邊緣展示了用戶的社區(qū)內(nèi) 和多個(gè)其他社區(qū)上的每個(gè)用戶之間的連接。
[0161] 相應(yīng)地,如將在圖19A-19C和圖20A-20B中展示的,社區(qū)和影響者(例如,每個(gè)社區(qū) 內(nèi)排名靠前的影響者和/或所有社區(qū)上的靠前的影響者的列表)的可視化能夠使最終用戶 (例如,圖2中的計(jì)算設(shè)備1的用戶)可視化影響者的相關(guān)聯(lián)社區(qū)中的每個(gè)影響者的尺度和相 對(duì)重要性。 識(shí)別給定社區(qū)內(nèi)受歡迎的特征
[0162] 如關(guān)于圖3和圖4描述的,在又一方面,針對(duì)框1603提供的每個(gè)給定社區(qū)(例如, C1),服務(wù)器被配置成用于基于給定社區(qū)(例如,C1)內(nèi)的用戶(例如,Uci)的社交網(wǎng)絡(luò)數(shù)據(jù)確 定與其相關(guān)聯(lián)的預(yù)定義特征(例如,常見的關(guān)鍵字和短語、談話的話題、常見的位置、常見的 圖像、常見的元數(shù)據(jù))的受歡迎特征值。相應(yīng)地,可以定義每個(gè)社區(qū)(^內(nèi)的用戶U ci的通過檢 查預(yù)定義的特征集合(例如,談話的話題)的趨勢(shì)或共同點(diǎn)。一方面,在框1605描繪了特征值 的靠前列表(例如,每個(gè)社區(qū)內(nèi)的所有用戶之間的靠前的談話話題)并且將其輸出至計(jì)算設(shè) 備101(圖2中所示)以便聯(lián)合每個(gè)社區(qū)來顯示。 顯示社區(qū)和受歡迎的特征
[0163] 參照?qǐng)D17A-17D,展示了從服務(wù)器的⑶I模塊106提供并且輸出至計(jì)算設(shè)備(圖2)的 顯示屏125的屏幕截圖以便可視化來自話題網(wǎng)絡(luò)的社區(qū)聚類和可視化每個(gè)社區(qū)中的受歡迎 的特征。如圖17A-17D中所示,服務(wù)器提供交互界面用于選擇社區(qū)和/或話題網(wǎng)絡(luò)/具體社區(qū) 內(nèi)的節(jié)點(diǎn),以便可視地揭示每個(gè)節(jié)點(diǎn)的細(xì)節(jié)(例如,用戶、社區(qū)信息和影響程度)。相應(yīng)地,圖 17A-17D顯示了影響者社區(qū)及其特征(例如,詞云可視化技術(shù)中每個(gè)社區(qū)的談話)的交互式 可視化。還如圖17A-17D所示,每個(gè)社區(qū)(例如,由邊緣和節(jié)點(diǎn)組成)可視地與另一個(gè)社區(qū)不 同(例如,按照顏色編碼)并且根據(jù)整個(gè)話題網(wǎng)絡(luò)內(nèi)的影響程度確定每個(gè)節(jié)點(diǎn)的大小。用戶 的影響程度例如與社區(qū)或整個(gè)話題網(wǎng)絡(luò)內(nèi)的用戶莊戶的排名相對(duì)應(yīng)。此外,通過選擇具體 的社區(qū)(例如,使用鼠標(biāo)或指針從話題網(wǎng)絡(luò)選擇社區(qū)),然后描繪社區(qū)值(例如,使話題網(wǎng)絡(luò) 圖內(nèi)的社區(qū)高亮,揭示社區(qū)內(nèi)的靠前的影響者,并且揭示所選擇的社區(qū)的靠前的談話話題 的受歡迎的特征值)。在圖17A-17D中,顯示屏(例如,圖2中的計(jì)算設(shè)備101的屏幕)上的受歡 迎的特征值的可視化展示為詞云,該詞云描繪了所選擇的社區(qū)內(nèi)靠前的談話話題以及具體 社區(qū)中的所有用戶內(nèi)的每個(gè)話題的使用頻率指示。
[0164] 參照?qǐng)D17A,展示了(例如,圖2中的計(jì)算設(shè)備101的)屏幕1701,顯示了在話題搜索 (例如,搜索術(shù)語"阿迪達(dá)斯(adidas)")內(nèi),社交網(wǎng)絡(luò)的若干個(gè)社區(qū)(聚類、段)內(nèi)發(fā)生多個(gè)談 話。
[0165] 參照?qǐng)D18,展示了屏幕,顯示在另一個(gè)話題搜索內(nèi),優(yōu)選地在整個(gè)話題網(wǎng)絡(luò)內(nèi),話 題網(wǎng)絡(luò)具有多個(gè)社區(qū)聚類(每個(gè)社區(qū)聚類可視地與另一個(gè)社區(qū)聚類不同)和多個(gè)節(jié)點(diǎn),這些 節(jié)點(diǎn)大小被確定為反映影響程度。
[0166] 參照?qǐng)D17B,展示了屏幕1702,描繪了節(jié)點(diǎn)被顏色編碼成可視地使它們與其相應(yīng)的 社區(qū)相關(guān)聯(lián),并且相對(duì)于整體話題網(wǎng)絡(luò),每個(gè)節(jié)點(diǎn)的大小與其社區(qū)(顏色編碼)內(nèi)的影響者 分?jǐn)?shù)成比例。圖17B進(jìn)一步說明了通過選擇節(jié)點(diǎn)(例如,使鼠標(biāo)指針懸停在節(jié)點(diǎn)之上),推特 句柄(例如,adidasrunning)彈出,并且那個(gè)句柄的信息顯示在屏幕1702上(例如,在信息下 面的右手側(cè)列表中)。
[0167] 參照?qǐng)D17C,展示了屏幕1703,并且選擇子圖,該子圖可視地使那個(gè)選擇的社區(qū)中 的靠前的影響者高亮,并且在屏幕1703上給出視覺表示(例如,那個(gè)社區(qū)中的談話的詞云)。 如圖17中所示,展示了對(duì)社區(qū)行為的深刻見解;積極評(píng)論/消極評(píng)論。
[0168] 參照?qǐng)D17D,展示了屏幕1704,其中,選擇(例如,通過經(jīng)由圖2的計(jì)算設(shè)備101的用 戶輸入選擇)社區(qū)(例如,社區(qū)1),并且可視地描繪了社區(qū)內(nèi)的靠前的影響者和被高亮以展 示所選擇的社區(qū)的話題網(wǎng)絡(luò)。圖17D展示了用于社區(qū)檢測(cè)(例如,模塊性)和影響(使用網(wǎng)頁 排名)的高級(jí)網(wǎng)絡(luò)分析的示例性用途。圖17A-17D中的方法是有利的,因?yàn)槠淠軌虼笠?guī)模處 理社交聯(lián)網(wǎng)數(shù)據(jù)(例如,整個(gè)推特、防火帶(Firehose))而不是對(duì)漏掉少量但潛在地大量影 響者社區(qū)的社交網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行采樣。
[0169] 定義社區(qū)內(nèi)的受歡迎的特征(例如,談話話題)
[0170] 參照?qǐng)D19A-19C和圖20A-20B,展示了兩個(gè)不同話題網(wǎng)絡(luò)(例如,分別是Adidas和 Dove)內(nèi)的各影響者社區(qū)的示例性屏幕截圖。如這些圖中所示,雖然每個(gè)社區(qū)中的用戶句柄 的身份能夠給出對(duì)社區(qū)的人口統(tǒng)計(jì)的某種程度的深刻見解,但期望展示社區(qū)的更具體的描 述。相應(yīng)地,一方面(例如,圖3和圖4的示例實(shí)施方式),識(shí)別了從話題搜索查詢返回的推文 的示例,并且在相關(guān)項(xiàng)上生成頻率計(jì)數(shù)以生成每個(gè)社區(qū)的談話中受歡迎項(xiàng)的詞云。根據(jù)這 種可視化,因此可以容易可視地識(shí)別每個(gè)社區(qū)的行為特征并且使用此信息來形成對(duì)每個(gè)社 區(qū)中的影響者的更具針對(duì)性的消息。
[0171] 圖19A-19C和圖20A-20B顯不了用于確定和可視化話題網(wǎng)絡(luò)內(nèi)的社區(qū)聚類和每個(gè) 社區(qū)的相關(guān)聯(lián)的受歡迎特征值的示例實(shí)施方式(例如,圖3或圖4中的示例實(shí)施方式)。根據(jù) 一個(gè)實(shí)施方式,圖19A-19C和圖20A-20B利用從Sysomos搜索引擎獲得底層推特?cái)?shù)據(jù),在一個(gè) 實(shí)施方式中,該搜索引擎在一段指定的時(shí)期內(nèi)由用戶定義的布爾(Boolean)關(guān)鍵字搜索項(xiàng) 形成。
[0172] 不例:Adidas Running案例石開究-圖 19A-19C
[0?73 ]圖19A-19C中的較暗的陰影組分別對(duì)應(yīng)于"Adidas Runn ing"話題中的三個(gè)最大的 社區(qū)。圖19A中的高亮社區(qū)(藍(lán)色)對(duì)應(yīng)于最大的影響者集合。
[0174] 如可以從圖19A看到的,詞云和用戶句柄顯示這個(gè)社區(qū)中的談話好像是圍繞 Adidas運(yùn)動(dòng)鞋和鞋子。
[0175] 在圖19B,第二大社區(qū)(橙色)具有圍繞Adidas Micoach訓(xùn)練用智能手表的談話。這 個(gè)社區(qū)中還有許多小配件審查句柄,如Engadget、CNET、Mashable、FastCompany、和 Gizmodo0
[0176] 在圖19C中,主要的AdidasRunning句柄是這個(gè)較小的社區(qū)(綠色)的一部分,具有 重要跑步句柄,如YohanBlake、RunBlogRun、LondonMarathon (倫敦馬拉松)、B_A_A(波士頓 運(yùn)動(dòng)協(xié)會(huì))RunningNetwork 等。
[0177] 當(dāng)審查圖19A-19C中的社區(qū)及其特征的可視化屏幕時(shí),可以看到AdidasRunning可 以良好連接至重要的跑步社區(qū)(綠色),但沒有良好連接至運(yùn)動(dòng)鞋愛好者的較大的影響者社 區(qū)(藍(lán)色)和小配件審查(橙色)社區(qū)。相應(yīng)地,可以確定為有效的影響者營(yíng)銷, AdidasRunning應(yīng)與其他社區(qū)中的關(guān)鍵影響者連接,并且其消息應(yīng)為其他社區(qū)所定制,以便 于其他社區(qū)有更好的重疊和連接。
[0178] 示例:Dove案例研究
[0179] 圖20A和圖20B以較暗的陰影展示了Dove(肥皂)產(chǎn)品話題的兩個(gè)最大社區(qū)。圖20A 具有影響者相對(duì)低的最大社區(qū)(藍(lán)色)。如可以從圖20A和圖20B的用戶句柄和詞云可視地揭 示的,用戶句柄和詞云可以反映影響/影響話題的用戶好像是對(duì)節(jié)省、購(gòu)物、中獎(jiǎng)、獎(jiǎng)品、克 羅格公司(Kroger)(超市)感興趣的"媽媽博客主"。
[0180] 同樣,Dove的"girlsunstoppable"活動(dòng)在這個(gè)社區(qū)內(nèi)有影響。
[0181]圖20B描繪了具有正式Dove公司句柄(Dove加拿大、Dove英國(guó)、聯(lián)合利華等)以及一 些有半影響力的美容博客主。
[0182] 因此,在審查圖20A和圖20B時(shí),可以可視地揭示雖然Dove(作為話題查詢)良好連 接在有影響力的美容博客主之間,但可以存在于媽媽博客主更強(qiáng)的連接,因?yàn)榕c美容博客 主相比較,它們是更大的社區(qū)。再次,可以為整個(gè)社區(qū)中的影響者有區(qū)別地定制消息而不疏 遠(yuǎn)其他影響者。
[0183] 因此,如參照?qǐng)D(例如,圖2、圖3-4、圖16_20b)所討論的,介紹了一種針對(duì)給定的查 詢?cè)掝}識(shí)別影響者的社交社區(qū)內(nèi)的影響者的系統(tǒng)和方法(基于所獲取的社交聯(lián)網(wǎng)數(shù)據(jù))。還 可以看到影響者不具有統(tǒng)一的特征,并且實(shí)際上甚至給定的話題網(wǎng)絡(luò)內(nèi)存在影響者社區(qū)。 本文中所介紹的系統(tǒng)和方法用于輸出在計(jì)算設(shè)備(例如,計(jì)算設(shè)備101)輸出以網(wǎng)絡(luò)圖可視 化的可視化以顯示實(shí)體或個(gè)人及其各自的社區(qū)的相對(duì)影響者。此外,在用于每個(gè)社區(qū)的計(jì) 算設(shè)備的顯示屏上可視地描繪了受歡迎的特征值(例如,基于預(yù)定義的特征,如談話話題), 展示了靠前的或相關(guān)的話題。這些話題可以被描繪成每個(gè)社區(qū)的談話的詞語從而可視地揭 示單獨(dú)社區(qū)的行為特征。
[0184] 以下提供了這些方法和系統(tǒng)的一般示例。
[0185] 在示例實(shí)施例中,一種由服務(wù)器執(zhí)行用于確定對(duì)于話題而言有影響力的至少一個(gè) 用戶賬戶的方法。所述方法包括:獲取所述話題;確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的多 個(gè)用戶賬戶;將所述用戶賬戶中的每個(gè)用戶賬戶表示為連通圖中的節(jié)點(diǎn)并且確定所述用戶 賬戶中的每個(gè)用戶賬戶之間存在關(guān)系;將所述用戶賬戶中的每個(gè)用戶賬戶用作節(jié)點(diǎn)并且將 相應(yīng)的關(guān)系用作所述節(jié)點(diǎn)中的每個(gè)節(jié)點(diǎn)之間的邊緣來計(jì)算話題網(wǎng)絡(luò)圖;將所述話題網(wǎng)絡(luò)圖 內(nèi)的所述用戶賬戶進(jìn)行排名以過濾所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點(diǎn);識(shí)別所述經(jīng)過濾的話 題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶當(dāng)中的至少兩個(gè)不同的社區(qū),每個(gè)社區(qū)與所述用戶賬戶的子集 相關(guān)聯(lián);識(shí)別與每個(gè)社區(qū)相關(guān)聯(lián)的屬性;并且輸出與所述相應(yīng)屬性相關(guān)聯(lián)的每個(gè)社區(qū)。
[0186] 在示例方面,所述方法進(jìn)一步包括對(duì)每個(gè)社區(qū)內(nèi)的用戶賬戶進(jìn)行排名并且為每個(gè) 社區(qū)提供映射到所述相應(yīng)社區(qū)的所述用戶賬戶的排名列表。
[0187] 在示例方面,其中,對(duì)所述用戶賬戶進(jìn)行排名進(jìn)一步包括:將每個(gè)排名后的用戶賬 戶映射到各自的社區(qū)并且輸出所述至少兩個(gè)社區(qū)的所述用戶賬戶的排名列表。
[0188] 在示例方面,其中,所述屬性與每個(gè)用戶賬戶的與所述社交數(shù)據(jù)網(wǎng)絡(luò)的交互相關(guān) 聯(lián)。
[0189] 在示例方面,其中,所述屬性聯(lián)合所述用戶賬戶的屬性的組合頻率一起顯示。
[0190] 在示例方面,其中,所述屬性是具體社區(qū)內(nèi)的用戶的談話話題的頻率。
[0191] 在示例方面,所述方法進(jìn)一步包括在圖形用戶界面中顯示所述至少兩個(gè)不同的社 區(qū),所述社區(qū)包括顏色編碼的節(jié)點(diǎn)和邊緣,其中,至少所述顏色編碼的節(jié)點(diǎn)和邊緣的第一部 分是與第一社區(qū)相關(guān)聯(lián)的第一顏色,并且至少所述顏色編碼的節(jié)點(diǎn)和邊緣的第二部分是與 第二社區(qū)相關(guān)聯(lián)的第二顏色。
[0192] 在示例方面,其中,給定的顏色編碼的節(jié)點(diǎn)的大小與由所述給定的顏色編碼的節(jié) 點(diǎn)所表示的給定用戶賬戶的影響程度相關(guān)聯(lián)。
[0193] 在示例方面,所述方法進(jìn)一步包括顯示與給定社區(qū)相關(guān)聯(lián)的詞,所述詞對(duì)應(yīng)于所 述給定社區(qū)的屬性。
[0194] 在示例方面,所述方法進(jìn)一步包括檢測(cè)在所述圖像用戶界面中與給定社區(qū)交互的 用戶控制指針、和以下各項(xiàng)中的至少一項(xiàng):顯示所述給定社區(qū)內(nèi)的一個(gè)或多個(gè)排名靠前的 用戶賬戶;可視地使所述給定社區(qū)高亮;并且顯示與給定社區(qū)相關(guān)聯(lián)的詞,所述詞對(duì)應(yīng)于所 述給定社區(qū)的屬性。
[0195] 在另一個(gè)示例實(shí)施例中,提供了一種計(jì)算系統(tǒng)用于確定對(duì)于話題而言有影響力的 至少一個(gè)用戶賬戶。所述計(jì)算系統(tǒng)包括:通信設(shè)備;存儲(chǔ)器;以及處理器,所述處理器被配置 成用于至少:獲取所述話題;確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的多個(gè)用戶賬戶;將所述 用戶賬戶中的每個(gè)用戶賬戶表示為連通圖中的節(jié)點(diǎn)并且確定所述用戶賬戶中的每個(gè)用戶 賬戶之間存在關(guān)系;將所述用戶賬戶中的每個(gè)用戶賬戶用作節(jié)點(diǎn)并且將相應(yīng)的關(guān)系用作所 述節(jié)點(diǎn)中的每個(gè)節(jié)點(diǎn)之間的邊緣來計(jì)算話題網(wǎng)絡(luò)圖;將所述話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶 進(jìn)行排名以過濾所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點(diǎn);識(shí)別所述經(jīng)過濾的話題網(wǎng)絡(luò)圖內(nèi)的所述 用戶賬戶當(dāng)中的至少兩個(gè)不同的社區(qū),每個(gè)社區(qū)與所述用戶賬戶的子集相關(guān)聯(lián);識(shí)別與每 個(gè)社區(qū)相關(guān)聯(lián)的屬性;并且輸出與所述相應(yīng)屬性相關(guān)聯(lián)的每個(gè)社區(qū)。
[0196] 在另一個(gè)示例實(shí)施例中,提供了一種由服務(wù)器執(zhí)行用于確定對(duì)于話題而言有影響 力的至少一個(gè)用戶的方法。所述方法包括:獲取話題;確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān) 的多個(gè)用戶;將所述用戶中的每個(gè)用戶模擬為節(jié)點(diǎn)并且確定所述用戶中的每個(gè)用戶之間的 關(guān)系;通過將所述用戶用作節(jié)點(diǎn)并且將所述關(guān)系用作邊緣來計(jì)算話題網(wǎng)絡(luò)圖;對(duì)所述話題 網(wǎng)絡(luò)圖內(nèi)的所述用戶進(jìn)行排名;識(shí)別并過濾所述話題網(wǎng)絡(luò)中的離群值節(jié)點(diǎn):并且根據(jù)所述 話題網(wǎng)絡(luò)圖內(nèi)其余的用戶的相關(guān)聯(lián)排名輸出所述用戶。
[0197] 在示例方面,進(jìn)行包括所述話題的內(nèi)容的消費(fèi)和生成中的至少一項(xiàng)的用戶被認(rèn)為 是與所述話題相關(guān)的用戶。
[0198] 在另一個(gè)示例方面,在所述話題網(wǎng)絡(luò)圖中,在至少兩個(gè)用戶之間定義的邊緣表示 所述兩個(gè)用戶之間的朋友連接。
[0199] 在另一個(gè)示例方面,在所述話題網(wǎng)絡(luò)圖中,在至少兩個(gè)用戶之間定義的邊緣表示 所述至少兩個(gè)用戶之間的追隨者-被追隨者連接,并且其中,所述至少兩個(gè)用戶中的一個(gè)用 戶是追隨者而所述至少兩個(gè)用戶中的另一個(gè)用戶是被追隨者。
[0200] 在另一個(gè)示例方面,在所述話題網(wǎng)絡(luò)圖中,在至少兩個(gè)用戶之間定義的邊緣表示 所述至少兩個(gè)用戶之間的答復(fù)連接,并且其中,所述至少兩個(gè)用戶中的一個(gè)用戶答復(fù)所述 至少兩個(gè)用戶中的另一個(gè)用戶進(jìn)行的發(fā)帖。
[0201] 在另一個(gè)示例方面,在所述話題網(wǎng)絡(luò)圖中,在至少兩個(gè)用戶之間定義的邊緣表示 所述至少兩個(gè)用戶之間的轉(zhuǎn)帖連接,并且其中,所述至少兩個(gè)用戶中的一個(gè)用戶轉(zhuǎn)帖所述 至少兩個(gè)用戶中的另一個(gè)用戶進(jìn)行的發(fā)帖。
[0202] 在另一個(gè)示例方面,所述排名包括使用網(wǎng)頁排名算法來測(cè)量所述話題網(wǎng)絡(luò)圖內(nèi)的 給定用戶的重要性。
[0203] 在另一個(gè)示例方面,所述排名包括使用特征向量中心性、加權(quán)度、中間狀態(tài)、和樞 紐和權(quán)威度量中的至少一者。
[0204] 在另一個(gè)示例方面,識(shí)別并過濾話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點(diǎn)包括:將聚類算法、模 塊性算法和社區(qū)檢測(cè)算法中的至少一者應(yīng)用在所述話題網(wǎng)絡(luò)圖上以輸出多個(gè)社區(qū);按照所 述多個(gè)社區(qū)中的每個(gè)社區(qū)內(nèi)的用戶數(shù)量對(duì)所述多個(gè)社區(qū)進(jìn)行排序;選擇具有最大用戶數(shù)量 的η個(gè)社區(qū),其中,所述η個(gè)社區(qū)中的用戶的累積和至少滿足所述話題網(wǎng)絡(luò)圖中的用戶總數(shù) 的百分比閾值;并且將未選擇的社區(qū)中的用戶設(shè)立為離群值節(jié)點(diǎn)。
[0205]在另一個(gè)示例實(shí)施例中,提供了一種計(jì)算系統(tǒng)用于確定對(duì)于話題而言有影響力的 一個(gè)或多個(gè)用戶。所述計(jì)算系統(tǒng)包括:通信設(shè)備;存儲(chǔ)器以及一個(gè)處理器。所述處理器被配 置成用于至少:獲取話題;確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的多個(gè)用戶;將所述用戶中 的每個(gè)用戶建模為節(jié)點(diǎn)并且確定所述用戶中的每個(gè)用戶之間的關(guān)系;通過將所述用戶用作 節(jié)點(diǎn)并且將所述關(guān)系用作邊緣來計(jì)算話題網(wǎng)絡(luò)圖;對(duì)所述話題網(wǎng)絡(luò)圖內(nèi)的所述用戶進(jìn)行排 名;識(shí)別并過濾所述話題網(wǎng)絡(luò)內(nèi)的離群值節(jié)點(diǎn):并且根據(jù)所述話題網(wǎng)絡(luò)圖內(nèi)其余的用戶的 相關(guān)聯(lián)排名輸出所述用戶。
[0206] 將認(rèn)識(shí)到,本文中所描述的系統(tǒng)和方法的示例實(shí)施例的不同特征可以用不同的方 式相互組合。換言之,盡管沒有具體闡明,但根據(jù)其他示例實(shí)施例,不同的模塊、操作和部件 可以一起使用。
[0207] 本文中描述的所流程圖中的步驟或操作僅是示例。在不脫離本發(fā)明或這些發(fā)明的 精神的情況下,這些步驟或操作可以有許多變化。例如,這些步驟可以按不同的順序進(jìn)行, 或者可以添加、刪除或修改。
[0208] 本文中所描述的GUI和屏幕截圖僅是示例。在不脫離本發(fā)明或這些發(fā)明的精神的 情況下,圖形元件和交互元件可以有多個(gè)變化。例如,這類元件可以定位在不同的位置、或 被添加、刪除、或修改。
[0209] 盡管已經(jīng)參照某些特定實(shí)施例對(duì)以上內(nèi)容進(jìn)行了描述,但在不脫離所附權(quán)利要求 書的范圍的情況下,其各種修改對(duì)于本領(lǐng)域的技術(shù)人員而言將是明顯的。
【主權(quán)項(xiàng)】
1. 一種由服務(wù)器執(zhí)行用于確定對(duì)于話題而言有影響力的至少一個(gè)用戶賬戶的方法,所 述方法包括: 獲取所述話題; 確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的多個(gè)用戶賬戶; 將所述用戶賬戶中的每個(gè)用戶賬戶表示為連通圖中的節(jié)點(diǎn)并且確定所述用戶賬戶中 的每個(gè)用戶賬戶之間存在關(guān)系; 將所述用戶賬戶中的每個(gè)用戶賬戶用作節(jié)點(diǎn)并且將相應(yīng)的關(guān)系用作所述節(jié)點(diǎn)中的每 個(gè)節(jié)點(diǎn)之間的邊緣來計(jì)算話題網(wǎng)絡(luò)圖; 將所述話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶進(jìn)行排名以過濾所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié) 占 . 識(shí)別所述經(jīng)過濾的話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶當(dāng)中的至少兩個(gè)不同的社區(qū),每個(gè)社 區(qū)與所述用戶賬戶的子集相關(guān)聯(lián); 識(shí)別與每個(gè)社區(qū)相關(guān)聯(lián)的屬性;并且 輸出與所述相應(yīng)屬性相關(guān)聯(lián)的每個(gè)社區(qū)。2. 根據(jù)權(quán)利要求1所述方法,進(jìn)一步包括:對(duì)每個(gè)社區(qū)內(nèi)的用戶賬戶進(jìn)行排名并且為每 個(gè)社區(qū)提供映射到所述相應(yīng)社區(qū)的所述用戶賬戶的排名列表。3. 根據(jù)權(quán)利要求1所述的方法,其中,對(duì)所述用戶賬戶進(jìn)行排名進(jìn)一步包括:將每個(gè)排 名后的用戶賬戶映射到各自的社區(qū)并且輸出所述至少兩個(gè)社區(qū)的所述用戶賬戶的排名列 表。4. 根據(jù)權(quán)利要求1所述的方法,其中,所述屬性與每個(gè)用戶賬戶的與所述社交數(shù)據(jù)網(wǎng)絡(luò) 的交互相關(guān)聯(lián)。5. 根據(jù)權(quán)利要求4所述的方法,其中,所述屬性聯(lián)合所述用戶賬戶的屬性的組合頻率一 起顯示。6. 根據(jù)權(quán)利要求1所述的方法,其中,所述屬性是具體社區(qū)內(nèi)的用戶的談話話題的頻 率。7. 根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括在圖形用戶界面中顯示所述至少兩個(gè)不同 的社區(qū),所述社區(qū)包括顏色編碼的節(jié)點(diǎn)和邊緣,其中,至少所述顏色編碼的節(jié)點(diǎn)和邊緣的第 一部分是與第一社區(qū)相關(guān)聯(lián)的第一顏色,并且至少所述顏色編碼的節(jié)點(diǎn)和邊緣的第二部分 是與第二社區(qū)相關(guān)聯(lián)的第二顏色。8. 根據(jù)權(quán)利要求7所述的方法,其中,給定的顏色編碼的節(jié)點(diǎn)的大小與由所述給定的顏 色編碼的節(jié)點(diǎn)所表示的給定用戶賬戶的影響程度相關(guān)聯(lián)。9. 根據(jù)權(quán)利要求7所述的方法,進(jìn)一步包括顯示與給定社區(qū)相關(guān)聯(lián)的詞,所述詞對(duì)應(yīng)于 所述給定社區(qū)的屬性。10. 根據(jù)權(quán)利要求7所述的方法,進(jìn)一步包括檢測(cè)在所述圖像用戶界面中與給定社區(qū)交 互的用戶控制指針、和以下各項(xiàng)中的至少一項(xiàng):顯示所述給定社區(qū)內(nèi)的一個(gè)或多個(gè)排名靠 前的用戶賬戶;可視地使所述給定社區(qū)高亮;并且顯示與給定社區(qū)相關(guān)聯(lián)的詞,所述詞對(duì)應(yīng) 于所述給定社區(qū)的屬性。11. 一種用于確定對(duì)于話題而言有影響力的至少一個(gè)用戶賬戶的計(jì)算系統(tǒng),所述計(jì)算 系統(tǒng)包括: 通信設(shè)備; 存儲(chǔ)器;以及 處理器,所述處理器被配置成用于至少: 獲取所述話題; 確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的多個(gè)用戶賬戶; 將所述用戶賬戶中的每個(gè)用戶賬戶表示為連通圖中的節(jié)點(diǎn)并且確定所述用戶賬戶中 的每個(gè)用戶賬戶之間存在關(guān)系; 將所述用戶賬戶中的每個(gè)用戶賬戶用作節(jié)點(diǎn)并且將相應(yīng)的關(guān)系用作所述節(jié)點(diǎn)中的每 個(gè)節(jié)點(diǎn)之間的邊緣來計(jì)算話題網(wǎng)絡(luò)圖; 將所述話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶進(jìn)行排名以過濾所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié) 占 . 識(shí)別所述經(jīng)過濾的話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶當(dāng)中的至少兩個(gè)不同的社區(qū),每個(gè)社 區(qū)與所述用戶賬戶的子集相關(guān)聯(lián); 識(shí)別與每個(gè)社區(qū)相關(guān)聯(lián)的屬性;并且 輸出與所述相應(yīng)屬性相關(guān)聯(lián)的每個(gè)社區(qū)。12. 根據(jù)權(quán)利要求11所述計(jì)算系統(tǒng),其中,所述處理器被進(jìn)一步配置成用于:對(duì)每個(gè)社 區(qū)內(nèi)的用戶賬戶進(jìn)行排名并且為每個(gè)社區(qū)提供映射到所述相應(yīng)社區(qū)的所述用戶賬戶的排 名列表。13. 根據(jù)權(quán)利要求11所述計(jì)算系統(tǒng),其中,對(duì)所述用戶賬戶進(jìn)行排名進(jìn)一步包括:將每 個(gè)排名后的用戶賬戶映射到各自的社區(qū)并且輸出所述至少兩個(gè)社區(qū)的所述用戶賬戶的排 名列表。14. 根據(jù)權(quán)利要求11所述計(jì)算系統(tǒng),其中,所述屬性與每個(gè)用戶賬戶的與所述社交數(shù)據(jù) 網(wǎng)絡(luò)的交互相關(guān)聯(lián)。15. 根據(jù)權(quán)利要求14所述計(jì)算系統(tǒng),進(jìn)一步包括顯示器,并且其中,所述屬性聯(lián)合所述 用戶賬戶的屬性的組合頻率一起顯示。16. 根據(jù)權(quán)利要求11所述的計(jì)算系統(tǒng),其中,所述屬性是具體社區(qū)內(nèi)的用戶的談話話題 的頻率。17. 根據(jù)權(quán)利要求11所述的計(jì)算系統(tǒng),進(jìn)一步包括顯示器,并且所述處理被進(jìn)一步配置 成用于在圖形用戶界面中顯示所述至少兩個(gè)不同的社區(qū),所述社區(qū)包括顏色編碼的節(jié)點(diǎn)和 邊緣,其中,至少所述顏色編碼的節(jié)點(diǎn)和邊緣的第一部分是與第一社區(qū)相關(guān)聯(lián)的第一顏色, 并且至少所述顏色編碼的節(jié)點(diǎn)和邊緣的第二部分是與第二社區(qū)相關(guān)聯(lián)的第二顏色。18. 根據(jù)權(quán)利要求17所述的計(jì)算系統(tǒng),其中,給定的顏色編碼的節(jié)點(diǎn)的大小與由所述給 定的顏色編碼的節(jié)點(diǎn)所表示的給定用戶賬戶的影響程度相關(guān)聯(lián)。19. 根據(jù)權(quán)利要求17所述的計(jì)算系統(tǒng),進(jìn)一步包括顯示與給定社區(qū)相關(guān)聯(lián)的詞,所述詞 對(duì)應(yīng)于所述給定社區(qū)的屬性。20. 根據(jù)權(quán)利要求17所述的計(jì)算系統(tǒng),其中,所述處理器被進(jìn)一步配置成用于檢測(cè)在所 述圖像用戶界面中與給定社區(qū)交互的用戶控制指針、和以下各項(xiàng)中的至少一項(xiàng):顯示所述 給定社區(qū)內(nèi)的一個(gè)或多個(gè)排名靠前的用戶賬戶;可視地使所述給定社區(qū)高亮;并且顯示與 給定社區(qū)相關(guān)聯(lián)的詞,所述詞對(duì)應(yīng)于所述給定社區(qū)的屬性。
【文檔編號(hào)】G06Q50/00GK105849764SQ201480070204
【公開日】2016年8月10日
【申請(qǐng)日】2014年10月23日
【發(fā)明人】愛德華·東晉·金, 布萊恩·佳利·耿
【申請(qǐng)人】西斯摩斯公司