網(wǎng)站的分布數(shù)量及在各論壇的跟帖網(wǎng)友的數(shù)量 的參數(shù)。
[0041] 根據(jù)事件熱點指數(shù)計算模型計算每個話題事件的熱點指數(shù)的具體方式為:
[0042] 事件熱點指數(shù)=(數(shù)量維度值X數(shù)量維度權(quán)重+顯著維度值X顯著維度權(quán)重+ 分布維度值X分布維度權(quán)重)X平均網(wǎng)站權(quán)重;
[0043] 其中,數(shù)量維度值=(信息數(shù)量得分+總點擊數(shù)量得分+總跟帖數(shù)量得分)X數(shù)量 維度權(quán)重;
[0044] 顯著維度值=(網(wǎng)站首頁得分+加精得分+置頂?shù)梅?推薦得分)X顯著維度權(quán) 重;
[0045] 分布維度值=(網(wǎng)站分布數(shù)量得分+網(wǎng)友分布數(shù)量得分)X分布維度權(quán)重;
[0046] 網(wǎng)站平均權(quán)重為事件所包含的所有文章所在網(wǎng)站的網(wǎng)站權(quán)重的均值;網(wǎng)友分布數(shù) 量是指事件分布的所有網(wǎng)站的跟帖網(wǎng)友數(shù)量。
[0047] 在具體實施過程中,可以通過用戶界面方式對數(shù)量維度、顯著維度、分布維度、網(wǎng) 站權(quán)重進行配置,配置原則是每個維度區(qū)間對應(yīng)不同分值。每個維度中的具體項的分值可 采用十分制或者百分制,并配置每個模型所占權(quán)重,按百分比來表示,配置完成后保存到數(shù) 據(jù)庫,其中數(shù)量維度權(quán)重、顯著維度權(quán)重和分布維度權(quán)重之和為1〇〇%。之后根據(jù)上述的事件 熱點指數(shù)計算模型計算每個話題事件的熱點指數(shù),得到每個話題事件的熱點指數(shù),事件的 熱點指數(shù)越大,熱度越高。通過熱點指數(shù)可以更準(zhǔn)確的衡量一個時間的熱度情況,可以利用 美觀的前臺統(tǒng)計展示,較直觀的反映當(dāng)前的網(wǎng)絡(luò)熱點。
[0048] 下面結(jié)合具體實施例對本發(fā)明建立事件熱點指數(shù)計算模型、以及根據(jù)該模型計算 每個話題事件的熱點指數(shù)的過程進行說明。
[0049] 實施例
[0050] 本實施例以論壇數(shù)據(jù)為例進行說明。
[0051] 完成數(shù)據(jù)的采集及聚類分析后,建立事件熱點指數(shù)計算模型,本實施例的熱點計 算模型中包括事件的數(shù)量維度、顯著維度和分布維度三個方面計算模型的建立,以及網(wǎng)站 權(quán)重的設(shè)置,具體如下:
[0052] 數(shù)量維度A :用于反映事件的相似信息數(shù)量、總點擊數(shù)量、總跟帖數(shù)量。其中,相似 信息可根據(jù)信息的關(guān)鍵字進行判定。
[0053] 設(shè)置數(shù)量維度的權(quán)重(數(shù)量參數(shù)在整個事件熱點分析中的重要性),本實施例中數(shù) 量維度所占權(quán)重為30%。
[0054] 對數(shù)量維度A的上述各項指標(biāo)的不同區(qū)間配置不同分值,本實施例中采用百分 制,具體如下:
【主權(quán)項】
1. 一種網(wǎng)絡(luò)輿情事件的熱度分析方法,包括w下步驟: (1) 對所要采集的網(wǎng)站進行數(shù)據(jù)的采集與保存; (2) 對采集的數(shù)據(jù)進行聚類分析,將采集的數(shù)據(jù)分類成不同的話題事件; (3) 根據(jù)事件熱點指數(shù)計算模型計算每個話題事件的熱點指數(shù)。
2. 如權(quán)利要求1所述的一種輿情事件的熱度分析方法,其特征在于,步驟(1)中,進行 數(shù)據(jù)采集時,所采集的數(shù)據(jù)的基本屬性包括事件的標(biāo)題、鏈接地址、正文、所屬網(wǎng)站和所屬 頻道。
3. 如權(quán)利要求2所述的一種輿情事件的熱度分析方法,其特征在于,步驟(1)中,如果 所采集的數(shù)據(jù)為論壇數(shù)據(jù),所采集的數(shù)據(jù)的基本屬性還包括事件的點擊數(shù)量、回帖數(shù)量、是 否置為網(wǎng)站首頁、是否加精、是否置頂、是否推薦、W及跟帖內(nèi)容和跟帖網(wǎng)名。
4. 如權(quán)利要求1所述的一種輿情事件的熱度分析方法,其特征在于,步驟(3)中,所述 的事件熱點指數(shù)計算模型是根據(jù)事件的多維度參數(shù)和網(wǎng)站權(quán)重建立的計算事件熱度的模 型,所述的多維度參數(shù)包括數(shù)量維度、顯著維度和分布維度。
5. 如權(quán)利要求4所述的一種輿情事件的熱度分析方法,其特征在于,所述的數(shù)量維度A 是反映話題事件的信息數(shù)量、總點擊數(shù)量和總跟帖數(shù)量的參數(shù); 所述的顯著維度B是反映話題事件的信息在論壇或者網(wǎng)站中是否加精、置頂、置為網(wǎng) 站首頁或者推薦的參數(shù); 所述的分布參數(shù)C是反映話題事件在網(wǎng)站的分布數(shù)量及在各論壇的跟帖網(wǎng)友的數(shù)量 的參數(shù)。
6. 如權(quán)利要求4所述的一種輿情事件的熱度分析方法,其特征在于,根據(jù)網(wǎng)站的影響 力設(shè)置網(wǎng)站權(quán)重,影響力越大,網(wǎng)站權(quán)重值越大。
7. 如權(quán)利要求4至6之一所述的一種輿情事件的熱度分析方法,其特征在于,根據(jù)事件 熱點指數(shù)計算模型計算每個話題事件的熱點指數(shù)的具體方式為: 事件熱點指數(shù)=(數(shù)量維度值X數(shù)量維度權(quán)重+顯著維度值X顯著維度權(quán)重+分布 維度值X分布維度權(quán)重)X平均網(wǎng)站權(quán)重; 其中,數(shù)量維度值=(信息數(shù)量得分+總點擊數(shù)量得分+總跟帖數(shù)量得分)X數(shù)量維度 權(quán)重; 顯著維度值=(網(wǎng)站首頁得分+加精得分+置頂?shù)梅?推薦得分)X顯著維度權(quán)重; 分布維度值=(網(wǎng)站分布數(shù)量得分+網(wǎng)友分布數(shù)量得分)X分布維度權(quán)重; 網(wǎng)站平均權(quán)重為事件所包含的所有文章所在網(wǎng)站的網(wǎng)站權(quán)重的均值。
8. -種輿情事件的熱度分析系統(tǒng),包括: 數(shù)據(jù)采集模塊,用于對所要采集的網(wǎng)站進行數(shù)據(jù)的采集與保存; 聚類分析模塊,對采集的數(shù)據(jù)進行聚類分析,將采集的數(shù)據(jù)分類成不同的話題事件; 熱點指數(shù)計算模塊,根據(jù)事件熱點指數(shù)計算模型計算每個話題事件的熱點指數(shù)。
9. 如權(quán)利要求8所述的一種輿情事件的熱度分析系統(tǒng),其特征在于,所述的事件熱點 指數(shù)計算模型是根據(jù)事件的多維度參數(shù)和網(wǎng)站權(quán)重建立的計算事件熱度的模型,所述的多 維度參數(shù)包括數(shù)量維度、顯著維度和分布維度。
10. 如權(quán)利要求9所述的一種輿情事件的熱度分析系統(tǒng),其特征在于,所述的熱點指數(shù) 計算模塊根據(jù)事件熱點指數(shù)計算模型計算每個話題事件的熱點指數(shù)的具體方式為: 事件熱點指數(shù)=(數(shù)量維度值X數(shù)量維度權(quán)重+顯著維度值X顯著維度權(quán)重+分布 維度值X分布維度權(quán)重)X平均網(wǎng)站權(quán)重; 其中,數(shù)量維度值=(信息數(shù)量得分+總點擊數(shù)量得分+總跟帖數(shù)量得分)x數(shù)量維度 權(quán)重; 顯著維度值=(網(wǎng)站首頁得分+加精得分+置頂?shù)梅?推薦得分)X顯著維度權(quán)重; 分布維度值=(網(wǎng)站分布數(shù)量得分+網(wǎng)友分布數(shù)量得分)X分布維度權(quán)重; 網(wǎng)站平均權(quán)重為事件所包含的所有文章所在網(wǎng)站的網(wǎng)站權(quán)重的均值。
【專利摘要】本發(fā)明公開了一種網(wǎng)絡(luò)輿情事件的熱度分析方法及系統(tǒng),屬于網(wǎng)絡(luò)事件熱度分析領(lǐng)域,首先對所要采集的網(wǎng)站進行數(shù)據(jù)的采集與保存,并對采集的數(shù)據(jù)進行聚類分析,將采集的數(shù)據(jù)分類成不同的話題事件,之后根據(jù)事件熱點指數(shù)計算模型計算每個話題事件的熱點指數(shù)。該方法及系統(tǒng)將網(wǎng)絡(luò)輿情和民意數(shù)字化,通過建立多維度的模型及網(wǎng)站權(quán)重來計算一個話題的熱點指數(shù),可以更準(zhǔn)確的衡量一個事件的熱度情況,實現(xiàn)多維度的網(wǎng)絡(luò)輿情事件的熱度分析。
【IPC分類】G06F17-30
【公開號】CN104598450
【申請?zhí)枴緾N201310525071
【發(fā)明人】趙增峰, 梁汝峰, 楊建武
【申請人】北大方正集團有限公司, 北京大學(xué), 北京北大方正電子有限公司
【公開日】2015年5月6日
【申請日】2013年10月30日