一種基于社交網(wǎng)絡的多重關(guān)聯(lián)挖掘的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種基于社交網(wǎng)絡的多重關(guān)聯(lián)挖掘的方法和裝置。
【背景技術(shù)】
[0002]社交網(wǎng)絡擁有海量的用戶散布世界各地,但這些海量的用戶又會基于某些共同愛好、目的或某種關(guān)聯(lián)關(guān)系自然聚合,形成多種群體。群體中的成員一般擁有多重網(wǎng)絡身份,他們可利用多重身份使用多種社交網(wǎng)絡應用與群體中的其他成員建立聯(lián)系,形成特定社交網(wǎng)。如何挖掘出特定團體成員之間的關(guān)聯(lián)關(guān)系,并通過定量分析得出關(guān)系間的強弱聯(lián)系,已成為社交網(wǎng)絡分析的重要方面。目前,針對社交網(wǎng)絡關(guān)聯(lián)關(guān)系強弱分析的方法主要是基于圖模型的加權(quán)鏈接矩陣算法或其改進算法。該方法將用戶之間的聯(lián)系用加權(quán)鏈接矩陣表示,根據(jù)交互行為的不同形成多個加權(quán)鏈接矩陣,反映用戶之間的關(guān)聯(lián)關(guān)系,通過最優(yōu)化矩陣重構(gòu),矩陣的稀疏和低秩表達算法,獲得社交網(wǎng)絡用戶之間相互關(guān)系的度量。該方法能夠較真實的反映用戶之間的關(guān)聯(lián)關(guān)系,但是不具有完備性,它更側(cè)重于社交網(wǎng)絡某個特有應用的分析,對于多個應用的綜合分析方面缺乏有力支持。另一種分析方法為節(jié)點遍歷統(tǒng)計法,節(jié)點遍歷統(tǒng)計法則是通過采用多個節(jié)點同時并發(fā)的機制,即所有節(jié)點都并行推送遍歷信息,還原了點對點的虛擬賬號交互軌跡,解決了社交網(wǎng)絡中需要多次迭代才能遍歷完數(shù)據(jù)的問題,降低了分析的時間復雜度,但是隨著網(wǎng)絡應用的與日倶增,單一的分析點對點的網(wǎng)絡交互情況,越來越難反映出真實用戶網(wǎng)絡交互情況,該方法使用的局限性也越來越大。
【發(fā)明內(nèi)容】
[0003]本發(fā)明要解決的技術(shù)問題是,提供一種基于社交網(wǎng)絡的多重關(guān)聯(lián)挖掘的方法和裝置,通過對互聯(lián)網(wǎng)中各個虛擬人之間的聯(lián)系進行定量分析,展現(xiàn)出各個虛擬人之間聯(lián)系的強弱程度。
[0004]本發(fā)明采用的技術(shù)方案是,所述基于社交網(wǎng)絡的多重關(guān)聯(lián)挖掘的方法,包括:
[0005]步驟1:針對具備已知互聯(lián)網(wǎng)賬號的虛擬人,利用聯(lián)想算法,在互聯(lián)網(wǎng)中挖掘出所述虛擬人的其他互聯(lián)網(wǎng)賬號;
[0006]步驟2:通過多重身份關(guān)聯(lián)算法對所述虛擬人的所有互聯(lián)網(wǎng)賬號進行處理,得到所述虛擬人的每個互聯(lián)網(wǎng)賬號的一度關(guān)聯(lián)結(jié)果集;所述一度關(guān)聯(lián)結(jié)果集中包括:與所述虛擬人的任一互聯(lián)網(wǎng)賬號有直接聯(lián)系的一度賬號,以及每個所述一度賬號的一度賬號積分;
[0007]步驟3:通過深度聯(lián)系分析算法對每個一度關(guān)聯(lián)結(jié)果集進行處理,得到每個所述一度關(guān)聯(lián)結(jié)果集的設定數(shù)量的重要聯(lián)系人以及每個所述重要聯(lián)系人的重要聯(lián)系人賬號集;
[0008]步驟4:針對每個所述重要聯(lián)系人的重要聯(lián)系人賬號集,利用多重關(guān)聯(lián)加權(quán)算法,得到每個所述重要聯(lián)系人的多重關(guān)聯(lián)加權(quán)值;多重關(guān)聯(lián)加權(quán)值的數(shù)值從高到低代表重要聯(lián)系人與虛擬人的關(guān)系的緊密程度從高到低。
[0009]進一步的,步驟I中,利用聯(lián)想算法,在互聯(lián)網(wǎng)中挖掘出所述虛擬人的其他互聯(lián)網(wǎng)賬號,包括:
[0010]根據(jù)所述虛擬人的已知互聯(lián)網(wǎng)賬號,在互聯(lián)網(wǎng)中找到所述已知互聯(lián)網(wǎng)賬號的上線時刻、下線時刻以及IP地址,并在互聯(lián)網(wǎng)中找到所述上線時刻到下線時刻的時間段內(nèi)使用所述IP地址的其他互聯(lián)網(wǎng)賬號;或者,
[0011]根據(jù)所述虛擬人使用已知互聯(lián)網(wǎng)賬號時的登錄密碼,在互聯(lián)網(wǎng)中找到使用所述登錄密碼的其他互聯(lián)網(wǎng)賬號。
[0012]進一步的,步驟2中,通過多重身份關(guān)聯(lián)算法對所述虛擬人的所有互聯(lián)網(wǎng)賬號進行處理,得到所述虛擬人的每個互聯(lián)網(wǎng)賬號的一度關(guān)聯(lián)結(jié)果集,包括:
[0013]步驟21:在互聯(lián)網(wǎng)中找到與所述虛擬人的任一互聯(lián)網(wǎng)賬號有直接聯(lián)系的一度賬號;
[0014]步驟22:計算每個所述一度賬號的一度賬號積分,所述一度賬號積分等于在待測時間段內(nèi)所述一度賬號與所述虛擬人的任一互聯(lián)網(wǎng)賬號之間單向聯(lián)系的次數(shù);
[0015]步驟23:將與所述虛擬人的任一互聯(lián)網(wǎng)賬號有直接聯(lián)系的一度賬號以及每個所述一度賬號的一度賬號積分組成所述虛擬人的所述互聯(lián)網(wǎng)賬號的一度關(guān)聯(lián)結(jié)果集。
[0016]進一步的,步驟3,包括:
[0017]步驟31:根據(jù)每個所述一度關(guān)聯(lián)結(jié)果集中一度賬號的一度賬號積分的高低,從高到低的選出設定數(shù)量的一度賬號;
[0018]步驟32:針對具備選出的所述設定數(shù)量的一度賬號的重要聯(lián)系人,利用聯(lián)想算法,在互聯(lián)網(wǎng)中挖掘出每個重要聯(lián)系人的其他互聯(lián)網(wǎng)賬號;每個重要聯(lián)系人的所有互聯(lián)網(wǎng)賬號,構(gòu)成了重要聯(lián)系人賬號集合。
[0019]進一步的,步驟4中,利用多重關(guān)聯(lián)加權(quán)算法,得到所述每個重要聯(lián)系人的多重關(guān)聯(lián)加權(quán)值,包括:
[0020]步驟41:將任一重要聯(lián)系人賬號集與所有一度關(guān)聯(lián)結(jié)果集進行匹配,若所述重要聯(lián)系人賬號集中的一個互聯(lián)網(wǎng)賬號與所有一度關(guān)聯(lián)結(jié)果集中的一個一度賬號相同,則匹配成功,記錄所有匹配成功的一度賬號,以及對應的一度賬號積分;
[0021]步驟42:根據(jù)匹配成功的一度賬號的應用類型,賦予每個匹配成功的一度賬號一個對應的權(quán)重值;
[0022]步驟43:先將每個匹配成功的一度賬號的一度賬號積分與對應的權(quán)重值相乘,得到每個匹配成功的一度賬號的乘積結(jié)果,再將每個所述乘積結(jié)果相加,得到重要聯(lián)系人的多重關(guān)聯(lián)加權(quán)值。
[0023]本發(fā)明還提供一種基于社交網(wǎng)絡的多重關(guān)聯(lián)挖掘的裝置,包括:
[0024]虛擬身份聯(lián)系挖掘模塊:用于針對具備已知互聯(lián)網(wǎng)賬號的虛擬人,利用聯(lián)想算法,在互聯(lián)網(wǎng)中挖掘出所述虛擬人的其他互聯(lián)網(wǎng)賬號;
[0025]多重身份關(guān)聯(lián)模塊:用于通過多重身份關(guān)聯(lián)算法對所述虛擬人的所有互聯(lián)網(wǎng)賬號進行處理,得到所述虛擬人的每個互聯(lián)網(wǎng)賬號的一度關(guān)聯(lián)結(jié)果集;所述一度關(guān)聯(lián)結(jié)果集中包括:與所述虛擬人的任一互聯(lián)網(wǎng)賬號有直接聯(lián)系的一度賬號,以及每個所述一度賬號的一度賬號積分;
[0026]深度聯(lián)系分析模塊:用于通過深度聯(lián)系分析算法對每個一度關(guān)聯(lián)結(jié)果集進行處理,得到每個所述一度關(guān)聯(lián)結(jié)果集的設定數(shù)量的重要聯(lián)系人以及每個所述重要聯(lián)系人的重要聯(lián)系人賬號集;
[0027]多重關(guān)聯(lián)加權(quán)模塊:用于針對每個所述重要聯(lián)系人的重要聯(lián)系人賬號集,利用多重關(guān)聯(lián)加權(quán)算法,得到每個所述重要聯(lián)系人的多重關(guān)聯(lián)加權(quán)值;多重關(guān)聯(lián)加權(quán)值的數(shù)值從高到低代表重要聯(lián)系人與虛擬人的關(guān)系的緊密程度從高到低。
[0028]進一步的,所述虛擬身份聯(lián)系挖掘模塊,具體用于:
[0029]根據(jù)所述虛擬人的已知互聯(lián)網(wǎng)賬號,在互聯(lián)網(wǎng)中找到所述已知互聯(lián)網(wǎng)賬號的上線時刻、下線時刻以及IP地址,并在互聯(lián)網(wǎng)中找到所述上線時刻到下線時刻的時間段內(nèi)使用所述IP地址的其他互聯(lián)網(wǎng)賬號;或者,根據(jù)所述虛擬人使用已知互聯(lián)網(wǎng)賬號時的登錄密碼,在互聯(lián)網(wǎng)中找到使用所述登錄密碼的其他互聯(lián)網(wǎng)賬號。
[0030]進一步的,所述多重身份關(guān)聯(lián)模塊,包括:
[0031]查找模塊:用于在互聯(lián)網(wǎng)中找到與所述虛擬人的任一互聯(lián)網(wǎng)賬號有直接聯(lián)系的一度賬號;
[0032]計算模塊:用于計算每個所述一度賬號的一度賬號積分,所述一度賬號積分等于在待測時間段內(nèi)所述一度賬號與所述虛擬人的任一互聯(lián)網(wǎng)賬號之間單向聯(lián)系的次數(shù);
[0033]確定模塊:用于將與所述虛擬人的任一互聯(lián)網(wǎng)賬號有直接聯(lián)系的一度賬號以及每個所述一度賬號的一度賬號積分組成所述虛擬人的所述互聯(lián)網(wǎng)賬號的一度關(guān)聯(lián)結(jié)果集。
[0034]進一步的,所