一種網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送系統(tǒng)及方法
【專利摘要】本發(fā)明公開了一種網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送系統(tǒng)及方法,包括網(wǎng)絡(luò)輿情采集模塊、網(wǎng)絡(luò)輿情處理模塊和網(wǎng)絡(luò)輿情發(fā)布模塊,所述模塊包括以下子模塊:定向精確采集子模塊、非定向采集子模塊、熱點(diǎn)和敏感話題識別子模塊、主題跟蹤子模塊、自動摘要子模塊和綜合分析子模塊、輿情預(yù)警子模塊和多維度輿情信息展示子模塊;本發(fā)明采用特有的“輿情漏斗”算法,采用與我相關(guān)、輿情、正負(fù)面三類關(guān)鍵詞詞庫,對采集的數(shù)據(jù)進(jìn)行分析、判斷、分類和預(yù)警,掌握潛在的變化規(guī)律。本發(fā)明的有益效果是:減輕人工巡檢輿情事件的負(fù)擔(dān),及時準(zhǔn)確撐控輿情事件的發(fā)展態(tài)勢,形成近期互聯(lián)網(wǎng)上最新、最熱、敏感的話題,第一時間內(nèi)將用戶關(guān)心的輿情信息檢測與預(yù)警出來。
【專利說明】
一種網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)信息處理【技術(shù)領(lǐng)域】,尤其涉及一種網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送系統(tǒng)及方法。
【背景技術(shù)】
[0002]互聯(lián)網(wǎng)在全球范圍內(nèi)的飛速發(fā)展,網(wǎng)絡(luò)的開放性和虛擬性,決定了網(wǎng)絡(luò)輿情具有以下特點(diǎn):1、直接性:通過BBS,新聞點(diǎn)評和博客網(wǎng)站,網(wǎng)民可以立即發(fā)表意見;下情直接上達(dá),民意表達(dá)更加暢通;2、突發(fā)性:網(wǎng)絡(luò)輿論的形成往往非常迅速,一個熱點(diǎn)事件的存在加上一種情緒化的意見,就可以成為點(diǎn)燃一片輿論的導(dǎo)火索;3、偏差性:由于發(fā)言者身份隱蔽,并且缺少規(guī)則限制和有效監(jiān)督,網(wǎng)絡(luò)自然成為一些網(wǎng)民發(fā)泄情緒的空間;在現(xiàn)實(shí)生活中遇到挫折,對社會問題片面認(rèn)識等等,都會利用網(wǎng)絡(luò)得以宣泄。因此在網(wǎng)絡(luò)上更容易出現(xiàn)庸俗、灰色的言論。
[0003]互聯(lián)網(wǎng)上的信息量十分巨大,并且形式多樣,依靠人工巡檢輿情的方法很難應(yīng)對網(wǎng)上海量信息的收集和處理,并且還浪費(fèi)人力、物力和時間,從而延誤輿情事件的引導(dǎo)和輿情處置。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送系統(tǒng)及方法,實(shí)現(xiàn)“第一時間” “一站式”對各種網(wǎng)絡(luò)載體(如新聞、論壇、博客、微博、報干1J、電視、搜索引擎)采集的海量數(shù)據(jù)進(jìn)行智能分析,穩(wěn)、準(zhǔn)、狠、快地把互聯(lián)網(wǎng)讀懂、讀薄。在海量數(shù)據(jù)中快捷、準(zhǔn)確的自動推送用戶真正關(guān)心的輿情信息。
[0005]本發(fā)明的目的是通過以下技術(shù)方案來實(shí)現(xiàn)的:一種網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送系統(tǒng),包括網(wǎng)絡(luò)輿情采集模塊、網(wǎng)絡(luò)輿情處理模塊和網(wǎng)絡(luò)輿情發(fā)布模塊,所述網(wǎng)絡(luò)輿情采集模塊包括定向精確采集子模塊和非定向采集子模塊,所述定向精確采集子模塊,用于采集新聞、論壇、微博、博客、電子報、網(wǎng)絡(luò)電視輿情高發(fā)區(qū)的媒體類型站點(diǎn),保證重要信息在第一時間優(yōu)先采集不丟失;所述非定向采集子模塊,用于采集百度、G00GLE.360主流搜索引擎數(shù)據(jù),進(jìn)行輿情數(shù)據(jù)搜索采集補(bǔ)充,保證信息收集的全面性;
所述網(wǎng)絡(luò)輿情處理模塊包括熱點(diǎn)和敏感話題識別子模塊、主題跟蹤子模塊、自動摘要子模塊和綜合分析子模塊;所述熱點(diǎn)和敏感話題識別子模塊用于根據(jù)系統(tǒng)內(nèi)設(shè)置的與我相關(guān)、輿情、正負(fù)面三大類關(guān)鍵詞詞庫識別出給定時間段內(nèi)的熱門話題、敏感話題以及正負(fù)面輿情信息;所述主題跟蹤子模塊用于分析新發(fā)表文章、帖子的話題是否與已有主題相同;所述自動摘要子模塊用于對各類主題,各類傾向形成自動摘要;所述綜合分析子模塊,用于根據(jù)形成的自動摘要,分析某個主題在不同時段間的關(guān)注程度,預(yù)測發(fā)展趨勢;對突發(fā)事件進(jìn)行跨時間、跨空間綜合分析,獲知事件發(fā)生的全貌并預(yù)測事件發(fā)展的趨勢;
所述網(wǎng)絡(luò)輿情發(fā)布模塊包括輿情預(yù)警子模塊和多維度輿情信息展示子模塊,所述輿情預(yù)警子模塊用于對突發(fā)事件、涉及內(nèi)容安全的敏感話題及時發(fā)現(xiàn)并報警,所述多維度輿情信息展示子模塊,用于對輿情分析結(jié)果形成簡報、報告、圖表,自動推送給用戶。
[0006]網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送方法,包括以下步驟:
(1)網(wǎng)絡(luò)輿情采集:對境內(nèi)外網(wǎng)絡(luò)中的新聞網(wǎng)頁、論壇、微博、博客、電子報、網(wǎng)絡(luò)電視輿情高發(fā)區(qū)的媒體類型站點(diǎn)進(jìn)行定向精確采集,對百度、G00GLE,360主流搜索引擎數(shù)據(jù)進(jìn)行非定向采集,對采集回的信息進(jìn)行去重、過濾后存入采集數(shù)據(jù)庫;
(2)網(wǎng)絡(luò)輿情處理,包括以下子步驟:
51、系統(tǒng)對采集數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析,根據(jù)與我相關(guān)詞庫進(jìn)行分析是否與我相關(guān),分出與我有關(guān)的信息和與我無關(guān)的信息;
52、系統(tǒng)對與我有關(guān)的信息進(jìn)行分析,根據(jù)輿情詞庫分析是否屬于輿情信息,分出輿情信息和非輿情信息;
53、系統(tǒng)對輿情信息進(jìn)行分析,根據(jù)本條輿情信息出處的站點(diǎn)級別數(shù)、本條輿情正負(fù)關(guān)鍵詞級別數(shù)、本條輿情數(shù)據(jù)相似度和相關(guān)度進(jìn)行聚類后的總條數(shù),三個數(shù)據(jù)相乘積得到本條輿情信息的熱點(diǎn)值,識別出熱點(diǎn)信息和非熱點(diǎn)信息;
54、系統(tǒng)根據(jù)正負(fù)面詞庫,采用自然語言智能分詞技術(shù),識別出信息的正負(fù)面關(guān)系,分出負(fù)面信息和非負(fù)面信息;所述正負(fù)面詞庫包括情感語料庫和正負(fù)面輿情詞典;
55、系統(tǒng)進(jìn)行主題跟蹤,分析新發(fā)布的文章、帖子等的話題是否與已有的主題相同;對各類主題形成自動摘要;系統(tǒng)將采集回來的信息進(jìn)行輿情關(guān)鍵詞統(tǒng)計(jì)分析出輿情關(guān)鍵詞的分布情況并進(jìn)行關(guān)鍵詞聚類處理,最后再對文章標(biāo)題相似度進(jìn)行綜合分析比較判斷生成相似度關(guān)聯(lián)數(shù)據(jù),從而實(shí)現(xiàn)某一事件主題跟蹤分析;
56、系統(tǒng)根據(jù)形成的自動摘要,分析某個主題在不同時段間的關(guān)注程度,預(yù)測發(fā)展趨勢;系統(tǒng)輿情庫中詳細(xì)記錄了每條輿情信息的發(fā)布時間,站點(diǎn),載體等相關(guān)信息資料,這些信息通過我們之前的主題跟蹤分析算法,可以很方便的分析出某一個事件主題的詳細(xì)的輿情傳播途徑以及傳播載體,統(tǒng)計(jì)出輿情在什么時間段和什么載體上所出現(xiàn)的頻率以及概率值,最后統(tǒng)生成出一個直觀的輿情發(fā)展趨勢圖;
57、系統(tǒng)對突發(fā)事件進(jìn)行跨時間、跨空間綜合分析,系統(tǒng)將每條采集回來的輿情數(shù)據(jù)進(jìn)行聚類整合分析出輿情正負(fù)面級別、發(fā)布在各站點(diǎn)時間、發(fā)布在各站點(diǎn)的頻率以及根據(jù)發(fā)布時間形成的時間和站點(diǎn)的輿情傳播途徑等熱點(diǎn)相關(guān)因素,并按照突發(fā)輿情事件的性質(zhì)、嚴(yán)重程度、擴(kuò)散速度、影響范圍、持續(xù)時間等要素自動將突發(fā)輿情事件分為特別重大輿情事件、重大輿情事件、較大輿情事件和一般輿情事件;
58、系統(tǒng)根據(jù)突發(fā)輿情事件的級別,進(jìn)行輿情預(yù)警;
(3)網(wǎng)絡(luò)輿情發(fā)布:系統(tǒng)透過圖表分析趨勢,掌握潛在的變化規(guī)律,對輿情分析結(jié)果形成簡報、報告、圖表等方式,自動推送給用戶所關(guān)心的輿情信息。
[0007]步驟(I)所述的采集方法是采用互聯(lián)網(wǎng)信息采集、文本挖掘技術(shù)和全文檢索技術(shù)米集/[目息。
[0008]步驟(2)所述的輿情預(yù)警包括短信預(yù)警、郵件預(yù)警、彈窗預(yù)警。
[0009]本發(fā)明的有益效果是:實(shí)現(xiàn)用戶的網(wǎng)絡(luò)輿情監(jiān)測和定向追蹤等信息需求,形成簡報、報告、圖表等分析結(jié)果,幫助用戶及時掌握輿情動向,準(zhǔn)確捕捉預(yù)警信息,對有較大影響的重要事件快速發(fā)現(xiàn)、快速處理,并為用戶做出相應(yīng)的決策提供信息依據(jù),大大節(jié)約了人力和物力成本。
【專利附圖】
【附圖說明】
[0010]圖1為本發(fā)明流程圖。
【具體實(shí)施方式】
[0011]下面結(jié)合附圖進(jìn)一步詳細(xì)描述本發(fā)明的技術(shù)方案,但本發(fā)明的保護(hù)范圍不局限于以下所述。
[0012]如圖1所示,一種網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送系統(tǒng),包括網(wǎng)絡(luò)輿情采集模塊、網(wǎng)絡(luò)輿情處理模塊和網(wǎng)絡(luò)輿情發(fā)布模塊,所述網(wǎng)絡(luò)輿情采集模塊包括定向精確采集子模塊和非定向采集子模塊,所述定向精確采集子模塊,用于采集新聞、論壇、微博、博客、電子報、網(wǎng)絡(luò)電視輿情高發(fā)區(qū)的媒體類型站點(diǎn),保證重要信息在第一時間優(yōu)先采集不丟失;所述非定向采集子模塊,用于采集百度、G00GLE、360主流搜索引擎數(shù)據(jù),進(jìn)行輿情數(shù)據(jù)搜索采集補(bǔ)充,保證信息收集的全面性;
所述網(wǎng)絡(luò)輿情處理模塊包括熱點(diǎn)和敏感話題識別子模塊、主題跟蹤子模塊、自動摘要子模塊和綜合分析子模塊;所述熱點(diǎn)和敏感話題識別子模塊用于根據(jù)系統(tǒng)內(nèi)設(shè)置的與我相關(guān)、輿情、正負(fù)面三大類關(guān)鍵詞詞庫識別出給定時間段內(nèi)的熱門話題、敏感話題以及正負(fù)面輿情信息;所述主題跟蹤子模塊用于分析新發(fā)表文章、帖子的話題是否與已有主題相同;所述自動摘要子模塊用于對各類主題,各類傾向形成自動摘要;所述綜合分析子模塊,用于根據(jù)形成的自動摘要,分析某個主題在不同時段間的關(guān)注程度,預(yù)測發(fā)展趨勢;對突發(fā)事件進(jìn)行跨時間、跨空間綜合分析,獲知事件發(fā)生的全貌并預(yù)測事件發(fā)展的趨勢;
所述網(wǎng)絡(luò)輿情發(fā)布模塊包括輿情預(yù)警子模塊和多維度輿情信息展示子模塊,所述輿情預(yù)警子模塊用于對突發(fā)事件、涉及內(nèi)容安全的敏感話題及時發(fā)現(xiàn)并報警,所述多維度輿情信息展示子模塊,用于對輿情分析結(jié)果形成簡報、報告、圖表,自動推送給用戶。
[0013]網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送方法,包括以下步驟:
(1)網(wǎng)絡(luò)輿情采集:對境內(nèi)外網(wǎng)絡(luò)中的新聞網(wǎng)頁、論壇、微博、博客、電子報、網(wǎng)絡(luò)電視輿情高發(fā)區(qū)的媒體類型站點(diǎn)進(jìn)行定向精確采集,對百度、GOOGLE,360主流搜索引擎數(shù)據(jù)進(jìn)行非定向采集,對采集回的信息進(jìn)行去重、過濾后存入采集數(shù)據(jù)庫;
(2)網(wǎng)絡(luò)輿情處理,包括以下子步驟:
51、系統(tǒng)對采集數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析,根據(jù)與我相關(guān)詞庫進(jìn)行分析是否與我相關(guān),分出與我有關(guān)的信息和與我無關(guān)的信息;
52、系統(tǒng)對與我有關(guān)的信息進(jìn)行分析,根據(jù)輿情詞庫分析是否屬于輿情信息,分出輿情信息和非輿情信息;
53、系統(tǒng)對輿情信息進(jìn)行分析,根據(jù)本條輿情信息出處的站點(diǎn)級別數(shù)、本條輿情正負(fù)關(guān)鍵詞級別數(shù)、本條輿情數(shù)據(jù)相似度和相關(guān)度進(jìn)行聚類后的總條數(shù),三個數(shù)據(jù)相乘積得到本條輿情信息的熱點(diǎn)值,識別出熱點(diǎn)信息和非熱點(diǎn)信息;
54、系統(tǒng)根據(jù)正負(fù)面詞庫,采用自然語言智能分詞技術(shù),識別出信息的正負(fù)面關(guān)系,分出負(fù)面信息和非負(fù)面信息;所述正負(fù)面詞庫包括情感語料庫和正負(fù)面輿情詞典;其中“情感語料”庫大約9萬篇,正負(fù)面輿情詞典大約3萬條,并且對每條負(fù)面關(guān)鍵詞進(jìn)行了級別評定以及分類,重點(diǎn)監(jiān)測負(fù)面輿情,尤其是涉腐、涉法、涉紀(jì)、涉毒、涉黃、涉黑、涉恐等重大輿情事件、輿情語料和輿情詞典每天都在通過人工和機(jī)器自我學(xué)習(xí)技術(shù)進(jìn)行不斷擴(kuò)充中;
55、系統(tǒng)進(jìn)行主題跟蹤,分析新發(fā)布的文章、帖子等的話題是否與已有的主題相同;對各類主題形成自動摘要;系統(tǒng)將采集回來的信息進(jìn)行輿情關(guān)鍵詞統(tǒng)計(jì)分析出輿情關(guān)鍵詞的分布情況并進(jìn)行關(guān)鍵詞聚類處理,最后再對文章標(biāo)題相似度進(jìn)行綜合分析比較判斷生成相似度關(guān)聯(lián)數(shù)據(jù),從而實(shí)現(xiàn)某一事件主題跟蹤分析;
56、系統(tǒng)根據(jù)形成的自動摘要,分析某個主題在不同時段間的關(guān)注程度,預(yù)測發(fā)展趨勢;系統(tǒng)輿情庫中詳細(xì)記錄了每條輿情信息的發(fā)布時間,站點(diǎn),載體等相關(guān)信息資料,這些信息通過我們之前的主題跟蹤分析算法,可以很方便的分析出某一個事件主題的詳細(xì)的輿情傳播途徑以及傳播載體,統(tǒng)計(jì)出輿情在什么時間段和什么載體上所出現(xiàn)的頻率以及概率值,最后統(tǒng)生成出一個直觀的輿情發(fā)展趨勢圖;
57、系統(tǒng)對突發(fā)事件進(jìn)行跨時間、跨空間綜合分析,系統(tǒng)將每條采集回來的輿情數(shù)據(jù)進(jìn)行聚類整合分析出輿情正負(fù)面級別、發(fā)布在各站點(diǎn)時間、發(fā)布在各站點(diǎn)的頻率以及根據(jù)發(fā)布時間形成的時間和站點(diǎn)的輿情傳播途徑等熱點(diǎn)相關(guān)因素,并按照突發(fā)輿情事件的性質(zhì)、嚴(yán)重程度、擴(kuò)散速度、影響范圍、持續(xù)時間等要素自動將突發(fā)輿情事件分為特別重大輿情事件、重大輿情事件、較大輿情事件和一般輿情事件;
58、系統(tǒng)根據(jù)突發(fā)輿情事件的級別,進(jìn)行輿情預(yù)警;
(3)網(wǎng)絡(luò)輿情發(fā)布:系統(tǒng)透過圖表分析趨勢,掌握潛在的變化規(guī)律,對輿情分析結(jié)果形成簡報、報告、圖表等方式,自動推送給用戶所關(guān)心的輿情信息。
[0014]步驟(I)所述的采集方法是采用互聯(lián)網(wǎng)信息采集、文本挖掘技術(shù)和全文檢索技術(shù)米集彳目息O
[0015]步驟(2)所述的輿情預(yù)警包括短信預(yù)警、郵件預(yù)警、彈窗預(yù)警。
【權(quán)利要求】
1.一種網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送系統(tǒng),包括網(wǎng)絡(luò)輿情采集模塊、網(wǎng)絡(luò)輿情處理模塊和網(wǎng)絡(luò)輿情發(fā)布模塊,其特征在于:所述網(wǎng)絡(luò)輿情采集模塊包括定向精確采集子模塊和非定向采集子模塊,所述定向精確采集子模塊,用于采集新聞、論壇、微博、博客、電子報、網(wǎng)絡(luò)電視輿情高發(fā)區(qū)的媒體類型站點(diǎn),保證重要信息第一時間優(yōu)先采集不丟失;所述非定向采集子模塊,用于采集百度、G00GLE、360當(dāng)前主流搜索引擎數(shù)據(jù),進(jìn)行輿情數(shù)據(jù)搜索采集補(bǔ)充,保證了信息收集的全面性; 所述網(wǎng)絡(luò)輿情處理模塊包括熱點(diǎn)和敏感話題識別子模塊、主題跟蹤子模塊、自動摘要子模塊和綜合分析子模塊;所述熱點(diǎn)和敏感話題識別子模塊用于根據(jù)系統(tǒng)內(nèi)設(shè)置的與我相關(guān)、輿情、正負(fù)面三大類關(guān)鍵詞詞庫識別出給定時間段內(nèi)的熱門話題、敏感話題以及正負(fù)面輿情信息;所述主題跟蹤子模塊用于分析新發(fā)表文章、帖子的話題是否與已有主題相同;所述自動摘要子模塊用于對各類主題,各類傾向形成自動摘要;所述綜合分析子模塊,用于根據(jù)形成的自動摘要,分析某個主題在不同時段間的關(guān)注程度,預(yù)測發(fā)展趨勢;對突發(fā)事件進(jìn)行跨時間、跨空間綜合分析,獲知事件發(fā)生的全貌并預(yù)測事件發(fā)展的趨勢; 所述網(wǎng)絡(luò)輿情發(fā)布模塊包括輿情預(yù)警子模塊和多維度輿情信息展示子模塊,所述輿情預(yù)警子模塊用于對突發(fā)事件、涉及內(nèi)容安全的敏感話題及時發(fā)現(xiàn)并報警,所述多維度輿情信息展示子模塊,用于對輿情分析結(jié)果形成簡報、報告、圖表,自動推送給用戶。
2.網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送方法,其特征在于:包括以下步驟: (1)網(wǎng)絡(luò)輿情采集:對境內(nèi)外網(wǎng)絡(luò)中的新聞網(wǎng)頁、論壇、微博、博客、電子報、網(wǎng)絡(luò)電視輿情高發(fā)區(qū)的媒體類型站點(diǎn)進(jìn)行定向精確采集,對百度、GOOGLE,360主流搜索引擎數(shù)據(jù)進(jìn)行非定向采集,對采集回的信息進(jìn)行去重、過濾后存入采集數(shù)據(jù)庫; (2)網(wǎng)絡(luò)輿情處理,包括以下子步驟: 51、系統(tǒng)對采集數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析,根據(jù)與我相關(guān)詞庫進(jìn)行分析是否與我相關(guān),分出與我有關(guān)的信息和與我無關(guān)的信息; 52、系統(tǒng)對與我有關(guān)的信息進(jìn)行分析,根據(jù)輿情詞庫分析是否屬于輿情信息,分出輿情信息和非輿情信息; 53、系統(tǒng)對輿情信息進(jìn)行分析,根據(jù)本條輿情信息出處的站點(diǎn)級別數(shù)、本條輿情正負(fù)關(guān)鍵詞級別數(shù)、本條輿情數(shù)據(jù)相似度和相關(guān)度進(jìn)行聚類后的總條數(shù),三個數(shù)據(jù)相乘積得到本條輿情信息的熱點(diǎn)值,識別出熱點(diǎn)信息和非熱點(diǎn)信息; 54、系統(tǒng)根據(jù)正負(fù)面詞庫,采用自然語言智能分詞技術(shù),識別出信息的正負(fù)面關(guān)系,分出負(fù)面信息和非負(fù)面信息;所述正負(fù)面詞庫包括情感語料庫和正負(fù)面輿情詞典; 55、系統(tǒng)進(jìn)行主題跟蹤,分析新發(fā)布的文章、帖子的話題是否與已有的主題相同;對各類主題形成自動摘要;系統(tǒng)將采集回來的信息進(jìn)行輿情關(guān)鍵詞統(tǒng)計(jì)分析出輿情關(guān)鍵詞的分布情況并進(jìn)行關(guān)鍵詞聚類處理,對文章標(biāo)題相似度進(jìn)行綜合分析比較判斷生成相似度關(guān)聯(lián)數(shù)據(jù),實(shí)現(xiàn)對某一事件主題跟蹤分析; 56、系統(tǒng)根據(jù)形成的自動摘要,分析某個主題在不同時段間的關(guān)注程度,預(yù)測發(fā)展趨勢;系統(tǒng)輿情庫中詳細(xì)記錄有每條輿情信息的發(fā)布時間,站點(diǎn)和載體信息資料,通過主題跟蹤分析算法,分析出某一個事件主題的詳細(xì)的輿情傳播途徑以及傳播載體,統(tǒng)計(jì)出輿情在什么時間段和什么載體上所出現(xiàn)的頻率以及概率值,生成一個直觀的輿情發(fā)展趨勢圖; 57、系統(tǒng)對突發(fā)事件進(jìn)行跨時間、跨空間綜合分析,系統(tǒng)將每條采集回來的輿情數(shù)據(jù)進(jìn)行聚類整合分析出輿情正負(fù)面級別、發(fā)布在各站點(diǎn)時間、發(fā)布在各站點(diǎn)的頻率以及根據(jù)發(fā)布時間形成的時間和站點(diǎn)的輿情傳播途徑這些熱點(diǎn)因素,并按照突發(fā)輿情事件的性質(zhì)、嚴(yán)重程度、擴(kuò)散速度、影響范圍、持續(xù)時間要素自動將突發(fā)輿情事件分為特別重大輿情事件、重大輿情事件、較大輿情事件和一般輿情事件; S8、系統(tǒng)根據(jù)突發(fā)輿情事件的級別,進(jìn)行輿情預(yù)警; (3)網(wǎng)絡(luò)輿情發(fā)布:系統(tǒng)透過圖表分析趨勢,掌握潛在的變化規(guī)律,對輿情分析結(jié)果形成簡報、報告、圖表等方式,自動推送給用戶所關(guān)心的輿情信息。
3.根據(jù)權(quán)利要求2所述的網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送方法,其特征在于:步驟(1)所述的采集方法是采用互聯(lián)網(wǎng)信息采集、文本挖掘技術(shù)和全文檢索技術(shù)采集信息。
4.根據(jù)權(quán)利要求2所述的網(wǎng)絡(luò)輿情漏斗式數(shù)據(jù)采集分析推送方法,其特征在于:步驟(2)所述的輿情預(yù)警包括短信預(yù)警、郵件預(yù)警、彈窗預(yù)警。
【文檔編號】G06F17/30GK104408157SQ201410730979
【公開日】2015年3月11日 申請日期:2014年12月5日 優(yōu)先權(quán)日:2014年12月5日
【發(fā)明者】吳雪, 黃正強(qiáng), 劉明所 申請人:四川誠品電子商務(wù)有限公司