一種更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的方法及系統(tǒng),該方法基于用戶綜合客觀行為采用局部動(dòng)態(tài)的方法更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖,所述方法包含:更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖中的源節(jié)點(diǎn)信息的步驟,所述源節(jié)點(diǎn)的信息包含:用戶威脅度和節(jié)點(diǎn)擴(kuò)散能力;基于對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖以源節(jié)點(diǎn)為廣播源,向該源節(jié)點(diǎn)的若干鄰居節(jié)點(diǎn)廣播更新指令的步驟;收到廣播指令的各鄰居節(jié)點(diǎn)更新其所在節(jié)點(diǎn)信息的步驟,所述的節(jié)點(diǎn)信息包含:用戶威脅度和節(jié)點(diǎn)擴(kuò)散能力;其中,所述的源節(jié)點(diǎn)為對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖中的任意一個(gè)內(nèi)容節(jié)點(diǎn),且該節(jié)點(diǎn)滿足啟動(dòng)更新操作的條件。本發(fā)明充分考慮用戶客觀行為,對(duì)CCSG更新方法做出重要改進(jìn)。
【專利說明】一種更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及P2P網(wǎng)絡(luò)版權(quán)內(nèi)容傳播過程中內(nèi)容相似度圖的局部動(dòng)態(tài)更新方法,具體涉及一種更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的方法及系統(tǒng)。
【背景技術(shù)】
[0002]內(nèi)容關(guān)系網(wǎng)絡(luò)挖掘旨在通過揭示內(nèi)容之間的相似度關(guān)系來深入發(fā)掘P2P用戶之間的文件共享關(guān)系,深刻反映出對(duì)等網(wǎng)絡(luò)內(nèi)容交互與分布的內(nèi)部結(jié)構(gòu),為傳播分析與管控提供有效支持。部分研究者對(duì)此提出的P2P網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖(Copyright ContentSimilarity Graph7CCSG)的概念來描述內(nèi)容關(guān)系網(wǎng)絡(luò),本發(fā)明的發(fā)明人在另一篇申請(qǐng)?zhí)枮椤?01210240796.9”、名稱為《一種對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的構(gòu)建方法及系統(tǒng)》的申請(qǐng)文件中針對(duì)內(nèi)容相似度圖CCSG的構(gòu)建進(jìn)行分析研究并提出改進(jìn)的構(gòu)建方法,且具體的構(gòu)建方法是基于如表1所示的構(gòu)建模型的。而本發(fā)明延續(xù)對(duì)P2P網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖CCSG的研究,探討在完成構(gòu)建過程后,如何對(duì)CCSG進(jìn)行更好的更新的方法。
[0003]為清楚表述本
【發(fā)明內(nèi)容】
,首先對(duì)CCSG的結(jié)構(gòu)和構(gòu)建進(jìn)行簡(jiǎn)要描述。從圖1可知,所述內(nèi)容相似度圖中包含的元素為:若干內(nèi)容節(jié)點(diǎn)、連接內(nèi)容節(jié)點(diǎn)間的無向邊及對(duì)應(yīng)于各無向邊權(quán)重值;且所述內(nèi)容節(jié)點(diǎn)表示某個(gè)音/視頻內(nèi)容,可以綜合運(yùn)用內(nèi)容名稱及內(nèi)容描述元數(shù)據(jù)來標(biāo)識(shí);若存在某個(gè)用戶同時(shí)擁有兩個(gè)內(nèi)容,則對(duì)應(yīng)的內(nèi)容節(jié)點(diǎn)通過所述無向邊連接。在無向邊權(quán)重計(jì)算方面,CCSG基于如下事實(shí),即如果同時(shí)擁有兩個(gè)內(nèi)容的用戶數(shù)目越大,則意味著內(nèi)容之間的相似度越大,對(duì)應(yīng)的無向邊權(quán)重也越大。
[0004]本申請(qǐng)的發(fā)明人在上述《一種對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的構(gòu)建方法及系統(tǒng)》提出用戶綜合客觀行為模型——COB模型,以及基于用戶綜合客觀行為COB模型的用戶威脅程度判斷模型和內(nèi)容擴(kuò)散能力預(yù)測(cè)模型進(jìn)而提出了改進(jìn)的CCSG構(gòu)建流程。其中,在CCSG構(gòu)建過程中提出的各種模型如表1所示。
[0005]表1.針對(duì)改進(jìn)的CCSG構(gòu)建過程提出的模型
[0006]
【權(quán)利要求】
1.一種更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的方法,該方法基于用戶綜合客觀行為采用局部動(dòng)態(tài)的方法更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖,所述方法包含: 步驟101)更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖中的源節(jié)點(diǎn)信息的步驟,所述源節(jié)點(diǎn)的信息包含:用戶威脅度和節(jié)點(diǎn)擴(kuò)散能力;其中,所述用戶威脅度是指通過系統(tǒng)設(shè)定的量化指標(biāo)針對(duì)用戶在P2P網(wǎng)絡(luò)中上傳下載版權(quán)內(nèi)容的客觀行為計(jì)算出的衡量用戶行為性質(zhì)的量化指標(biāo),所述節(jié)點(diǎn)擴(kuò)散能力是指對(duì)與其相關(guān)的所有用戶的用戶威脅度進(jìn)行加權(quán)求和而得到的衡量版權(quán)內(nèi)容傳播能力和程度的量化標(biāo)準(zhǔn); 步驟102)基于對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖以源節(jié)點(diǎn)為廣播源,向該源節(jié)點(diǎn)的若干鄰居節(jié)點(diǎn)廣播更新指令的步驟; 步驟103)收到廣播指令的各鄰居節(jié)點(diǎn)更新其所在節(jié)點(diǎn)信息的步驟,所述的節(jié)點(diǎn)信息包含:用戶威脅度和節(jié)點(diǎn)擴(kuò)散能力; 其中,所述的源節(jié)點(diǎn)為對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖中的任意一個(gè)內(nèi)容節(jié)點(diǎn),且該節(jié)點(diǎn)滿足啟動(dòng)更新操作的條件,所述的啟動(dòng)更新操作的條件具體為:基于用戶行為質(zhì)變引起相關(guān)版權(quán)內(nèi)容質(zhì)變時(shí),啟動(dòng)該版權(quán)內(nèi)容節(jié)點(diǎn)的更新操作,所述用戶行為質(zhì)變的程度是通過用戶客觀行為狀態(tài)、行為持續(xù)時(shí)間、行為累積次數(shù)以及行為性質(zhì)共同參與計(jì)算得到的量化指標(biāo)。
2.根據(jù)權(quán)利要求1所述的更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的方法,其特征在于,所述源節(jié)點(diǎn)通過更新隊(duì)列選取傳輸指令的節(jié)點(diǎn)。
3.根據(jù)權(quán)利要求2所述的更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的方法,其特征在于,所述步驟102)進(jìn)一步包含: 步驟102-1)將所述源節(jié)點(diǎn)的所有鄰居節(jié)點(diǎn)放入更新隊(duì)列作為候選參與更新的節(jié)點(diǎn)集; 步驟102-2)依次從更新隊(duì)列中取出節(jié)點(diǎn),計(jì)算其與源節(jié)點(diǎn)關(guān)聯(lián)的無向邊權(quán)重在所有與源節(jié)點(diǎn)關(guān)聯(lián)的無向邊權(quán)重和中的占比以及該無向邊存在時(shí)長(zhǎng); 步驟102-3)判斷權(quán)重占比是否大于系統(tǒng)設(shè)定閾值ξ,或者無向邊存在時(shí)長(zhǎng)是否大于系統(tǒng)參數(shù)Θ與該邊權(quán)重的商,只要滿足該兩個(gè)條件之一,該無向邊對(duì)應(yīng)的候選節(jié)點(diǎn)就會(huì)入選; 步驟102-4)拋棄不符合步驟102-3)所述條件的候選節(jié)點(diǎn),將符合條件的候選節(jié)點(diǎn)加入到源節(jié)點(diǎn)緩存中; 步驟102-5)對(duì)于該滿足條件的候選節(jié)點(diǎn),判斷其到源節(jié)點(diǎn)的路徑跳數(shù)是否小于系統(tǒng)設(shè)定的擴(kuò)散半徑λ,如果小于λ,那么跳回步驟102-1),否則繼續(xù)向下執(zhí)行步驟102-6); 步驟102-6)判斷源節(jié)點(diǎn)的更新隊(duì)列是否為空,如果不為空,則跳回步驟102-2),否則繼續(xù)向下執(zhí)行步驟102-7); 步驟102-7)對(duì)緩存中的每一個(gè)更新節(jié)點(diǎn),從數(shù)據(jù)庫(kù)中獲取與該節(jié)點(diǎn)相關(guān)的用戶信息,借此更新節(jié)點(diǎn)自身的版權(quán)內(nèi)容擴(kuò)散能力和與父節(jié)點(diǎn)的擴(kuò)散能力相似度信息,并據(jù)此更新自身的顏色標(biāo)定,待對(duì)緩存中所有節(jié)點(diǎn)完成更新后,即完成CCSG的一次局部動(dòng)態(tài)更新。
4.根據(jù)權(quán)利要求3所述的更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的方法,其特征在于,所述源頭節(jié)點(diǎn)將參與一次更新操作的節(jié)點(diǎn)都加入到源節(jié)點(diǎn)緩存中;對(duì)加入源節(jié)點(diǎn)緩存的每一個(gè)節(jié)點(diǎn),系統(tǒng)都為其附加一個(gè)更新計(jì)數(shù)器;利用計(jì)數(shù)器記錄每次更新操作后,緩存節(jié)點(diǎn)自身信息實(shí)際發(fā)生變化的次數(shù);如果系統(tǒng)有新的節(jié)點(diǎn)需要加入到緩存中,則需要判斷源節(jié)點(diǎn)緩存是否已滿,如果已滿那么在緩存中檢查每一個(gè)節(jié)點(diǎn)的計(jì)數(shù)器,挑出計(jì)數(shù)器值為O的節(jié)點(diǎn),即每次更新操作都沒有對(duì)其自身信息產(chǎn)生影響的節(jié)點(diǎn),剔除這些節(jié)點(diǎn),并添加新節(jié)點(diǎn),完成源節(jié)點(diǎn)的緩存更新。
5.一種更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的系統(tǒng),該系統(tǒng)基于用戶綜合客觀行為采用局部動(dòng)態(tài)的方法更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖,所述系統(tǒng)包含: 啟動(dòng)更新操作的源節(jié)點(diǎn)、對(duì)等網(wǎng)絡(luò)的其余各節(jié)點(diǎn)及更新命令擴(kuò)散半徑設(shè)置模塊; 所述源節(jié)點(diǎn)進(jìn)一步包含: 更新驅(qū)動(dòng)模塊,用于基于用戶行為質(zhì)變引起相關(guān)版權(quán)內(nèi)容質(zhì)變的原則啟動(dòng)該節(jié)點(diǎn)的更新操作; 廣播模塊,用于將更新操作向其若干鄰居節(jié)點(diǎn)進(jìn)行廣播; 所述其余各節(jié)點(diǎn)包含: 廣播傳輸模塊,用于接收源節(jié)點(diǎn)或其余節(jié)點(diǎn)發(fā)送的更新操作指令,并向它的若干鄰居節(jié)點(diǎn)繼續(xù)傳輸該更新指令; 更新驅(qū)動(dòng)模塊,用于基于廣播指令啟動(dòng)該節(jié)點(diǎn)的更新操作; 所述更新命令擴(kuò)散半徑設(shè)置模塊,用戶設(shè)置更新命令的擴(kuò)散半徑,對(duì)源節(jié)點(diǎn)廣播的更新操作的擴(kuò)散命令的擴(kuò)散范圍進(jìn)行限制; 其中,所述的源節(jié)點(diǎn)為對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖中的任意一個(gè)內(nèi)容節(jié)點(diǎn),且該節(jié)點(diǎn)滿足啟動(dòng)更新操作的條件,所述的更新操作的條件具體為:基于用戶行為質(zhì)變引起相關(guān)版權(quán)內(nèi)容質(zhì)變時(shí),啟動(dòng)該版權(quán)內(nèi)容節(jié)點(diǎn)的更新操作,所述用戶行為質(zhì)變的程度是通過用戶客觀行為狀態(tài)、行為持續(xù)時(shí)間、行為累積次數(shù)以及行為性質(zhì)共同參與計(jì)算得到的量化指標(biāo)。
6.根據(jù)權(quán)利要求5所述的更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的系統(tǒng),其特征在于,所述源節(jié)點(diǎn)和其余各節(jié)點(diǎn)均還包含: 鄰居節(jié)點(diǎn)獲取模塊,用于獲取節(jié)點(diǎn)的所有鄰居節(jié)點(diǎn); 信息收集模塊,用于獲取各鄰居節(jié)點(diǎn)與源節(jié)點(diǎn)的內(nèi)容相似度的值,并獲取源節(jié)點(diǎn)與各鄰居節(jié)點(diǎn)組成的無向邊的存在時(shí)間的長(zhǎng)度值; 第一級(jí)節(jié)點(diǎn)集篩選處理模塊,用于依據(jù)由權(quán)重條件和時(shí)間條件組成的擴(kuò)散概率模型的函數(shù)值從鄰居節(jié)點(diǎn)獲取模塊得到鄰居節(jié)點(diǎn)中選擇第一級(jí)節(jié)點(diǎn)集; 其中,所述擴(kuò)散概率模型為:
7.根據(jù)權(quán)利要求6所述的更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的系統(tǒng),其特征在于,所述擴(kuò)散概率模型還采用源節(jié)點(diǎn)與某個(gè)鄰居節(jié)點(diǎn)間的無向邊權(quán)重占該源節(jié)點(diǎn)所有無向邊權(quán)重和的比例和源節(jié)點(diǎn)與某個(gè)鄰居節(jié)點(diǎn)的關(guān)聯(lián)時(shí)間長(zhǎng)度值兩個(gè)因素選中第一級(jí)節(jié)點(diǎn)集中的各節(jié)點(diǎn); 即當(dāng)源節(jié)點(diǎn)與某個(gè)鄰居節(jié)點(diǎn)間的無向邊權(quán)重占該源節(jié)點(diǎn)所有無向邊權(quán)重和的比例大于等于設(shè)置的權(quán)重比例閾值并且源節(jié)點(diǎn)與某個(gè)鄰居節(jié)點(diǎn)的關(guān)聯(lián)時(shí)間長(zhǎng)度值大于等于為該邊設(shè)置的存在時(shí)長(zhǎng)時(shí)將節(jié)點(diǎn)歸入第一級(jí)節(jié)點(diǎn)集。
8.根據(jù)權(quán)利要7所述的更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的系統(tǒng),其特征在于,所述各節(jié)點(diǎn)還設(shè)置有緩存策略執(zhí)行模塊,用于在執(zhí)行下次更新時(shí),直接從緩存中讀取待更新的第一級(jí)節(jié)點(diǎn),而無需重復(fù)計(jì)算并篩選鄰居節(jié)點(diǎn)的操作。
9.根據(jù)權(quán)利要求8所述的更新對(duì)等網(wǎng)絡(luò)版權(quán)內(nèi)容相似度圖的系統(tǒng),其特征在于,所述緩存策略執(zhí)行模塊進(jìn)一步包含如下子模塊: 待更新節(jié)點(diǎn)加入緩存模塊:源頭節(jié)點(diǎn)會(huì)將本次滿足更新條件并將接收更新指令的節(jié)點(diǎn)緩存起來,并對(duì)每個(gè)緩存的節(jié)點(diǎn)增加一個(gè)計(jì)數(shù)器; 節(jié)點(diǎn)更新頻率統(tǒng)計(jì)模塊:利用對(duì)每個(gè)節(jié)點(diǎn)附加的計(jì)數(shù)器累計(jì)得到每個(gè)節(jié)點(diǎn)的在接收到更新指令后自身信息實(shí)際發(fā)生變化的頻率; 緩存更新模塊:用于依據(jù) 節(jié)點(diǎn)更新頻率統(tǒng)計(jì)模塊獲得的更新頻率統(tǒng)計(jì)值剔除緩存中的更新頻率為零的節(jié)點(diǎn)并添加新節(jié)點(diǎn)。
【文檔編號(hào)】G06F21/10GK103595740SQ201210288837
【公開日】2014年2月19日 申請(qǐng)日期:2012年8月14日 優(yōu)先權(quán)日:2012年8月14日
【發(fā)明者】曲本科, 牛溫佳, 童恩棟, 苗光勝, 唐暉, 譚紅艷, 慈松 申請(qǐng)人:中國(guó)科學(xué)院聲學(xué)研究所