一種基于電視報道的輿情分析方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及電視廣播信息處理技術(shù)領(lǐng)域,特別涉及一種基于電視報道的輿情分析方法和系統(tǒng)。
【背景技術(shù)】
[0002]輿情是“輿論情況”的簡稱,是指在一定的社會空間內(nèi),圍繞中介性社會事件的發(fā)生、發(fā)展和變化,作為主體的民眾對作為客體的社會管理者、企業(yè)、個人及其他各類組織及其政治、社會、道德等方面的取向產(chǎn)生和持有的社會態(tài)度。它是較多群眾關(guān)于社會中各種現(xiàn)象、問題所表達(dá)的信念、態(tài)度、意見和情緒等等表現(xiàn)的總和。
[0003]從傳統(tǒng)的社會學(xué)理論上講,輿情本身是民意理論中的一個概念,它是民意的一種綜合反映。隨著現(xiàn)代社會的高速發(fā)展,輿情的反映渠道表現(xiàn)在多種途徑上,如:電視、廣播、報紙、互聯(lián)網(wǎng)以及正在飛速發(fā)展的自媒體等。而在多種途徑中,電視報道依然是表現(xiàn)社會公眾對組織機(jī)構(gòu)或人員所持有的社會態(tài)度的主要方式。
[0004]2014年3月17日,由中國社科院中國輿情調(diào)查實(shí)驗(yàn)室主編,社科文獻(xiàn)出版社出版的《中國輿情指數(shù)報告(2013)》正式發(fā)布。研宄指出,電視和報紙依舊是國人最信任的媒體,重要度及影響力仍超網(wǎng)絡(luò)。該報告顯示,與6年前相比,我國公眾每天上網(wǎng)時間已從I個多小時增加到了近3個小時,與看電視的時間基本持平。盡管如此,在人們非常信任或比較信任的媒體中,排名前兩位的仍分別是電視(81.1%)和報紙(70.3%),之后才是網(wǎng)絡(luò)(50.4% )。
[0005]因此可以看到,盡管在多媒體飛速發(fā)展的今天,電視報道依然是最受廣大社會公眾關(guān)注和信賴的輿情反映方式。然而,由于電視媒體的多樣性,如在我國,每個省、市、縣幾乎都有自己的電視頻道,當(dāng)眾多的電視頻道對同一對象進(jìn)行報道時,如對某企業(yè)的報道,可能會產(chǎn)生差異:例如可能在不同的時間段進(jìn)行報道、也可能表現(xiàn)出不同的輿情結(jié)果等,這對判斷該企業(yè)在各地的影響力產(chǎn)生了不便?,F(xiàn)有技術(shù)中,缺少一種有效的基于電視報道的輿情分析方法,來對特定行業(yè)、特定對象的輿情進(jìn)行分析。
【發(fā)明內(nèi)容】
[0006]本發(fā)明提供一種基于電視報道的輿情分析方法和系統(tǒng),用以對多個區(qū)域的電視報道數(shù)據(jù)進(jìn)行采集和計(jì)算,實(shí)現(xiàn)對特定的分析對象在不同區(qū)域的輿情進(jìn)行分析的目的。
[0007]本發(fā)明提供一種基于電視報道的輿情分析方法,包括:
[0008]根據(jù)預(yù)設(shè)的關(guān)鍵詞在預(yù)設(shè)的電視報道采集區(qū)域內(nèi)采集視頻報道數(shù)據(jù),并分別記錄在不同區(qū)域的視頻報道數(shù)量,所述關(guān)鍵詞是與需要進(jìn)行輿情分析的對象關(guān)聯(lián)的關(guān)鍵詞;
[0009]根據(jù)采集到的不同區(qū)域的視頻報道數(shù)據(jù),計(jì)算所述視頻報道數(shù)據(jù)的各視頻數(shù)據(jù)輿情分析要素的值,視頻數(shù)據(jù)輿情分析要素包括:視頻播放時段、視頻播放時長、關(guān)鍵詞出現(xiàn)次數(shù);
[0010]根據(jù)所述視頻報道數(shù)量和計(jì)算得到的視頻數(shù)據(jù)輿情分析要素的值,計(jì)算所述需要進(jìn)行輿情分析的對象在不同區(qū)域的影響力參數(shù)。
[0011]本發(fā)明實(shí)施例的一些有益效果可以包括:
[0012]通過預(yù)先對輿情分析的電視報道的區(qū)域范圍和對象進(jìn)行設(shè)置,在采集到待輿情分析對象在不同區(qū)域的電視報道數(shù)據(jù)后,對視頻報道數(shù)據(jù)進(jìn)行記錄,并對視頻報道數(shù)據(jù)中的不同輿情分析要素進(jìn)行提取,通過提取得到的輿情分析要素,能夠計(jì)算出待輿情分析對象在不同區(qū)域的影響力參數(shù),從而直觀地反映出了該對象在不同區(qū)域的影響力高低,并且該影響力參數(shù)還能夠與設(shè)定的影響力參數(shù)水平線進(jìn)行比較,根據(jù)比較結(jié)果,得出不同的輿情分析結(jié)論。
[0013]在一個實(shí)施例中,還包括:
[0014]根據(jù)計(jì)算得到的不同區(qū)域的影響力參數(shù),將所述不同區(qū)域的影響力參數(shù)與預(yù)設(shè)的影響力水平線進(jìn)行比較;
[0015]如果某區(qū)域的影響力參數(shù)低于所述影響力水平線,則增加該區(qū)域?qū)λ鲚浨榉治鰧ο蟮囊曨l報道數(shù)量;
[0016]如果某區(qū)域的影響力參數(shù)高于或等于所述影響力水平線,則保持該區(qū)域內(nèi)當(dāng)前視頻播放數(shù)量不變。
[0017]該實(shí)施例中通過對計(jì)算得到影響力參數(shù)與預(yù)設(shè)的影響力水平線進(jìn)行比較,得出影響力參數(shù)在不同水平時的輿情分析結(jié)果,該預(yù)設(shè)的影響力水平線可根據(jù)實(shí)際經(jīng)驗(yàn)進(jìn)行設(shè)置。在得出影響力參數(shù)與影響力水平線之間的比較結(jié)果后,根據(jù)該比較結(jié)果直接得出輿情分析結(jié)果,進(jìn)而對該輿情分析結(jié)果進(jìn)行處理。如在某地的影響力較低(低于影響力水平線)時,即在該區(qū)域增加視頻報道數(shù)量,以提高該輿情分析對象在該地的影響力。
[0018]在一個實(shí)施例中,還包括:
[0019]當(dāng)所述需要進(jìn)行輿情分析的對象所在行業(yè)發(fā)生行業(yè)事件時,采集該行業(yè)事件的全部視頻報道數(shù)據(jù),并分析該行業(yè)事件的正負(fù)面屬性;
[0020]根據(jù)所述全部視頻報道數(shù)據(jù),統(tǒng)計(jì)該行業(yè)內(nèi)不同對象的視頻報道數(shù)據(jù)的數(shù)量;
[0021]當(dāng)所述行業(yè)事件為正面時,則根據(jù)該行業(yè)內(nèi)不同對象的視頻報道數(shù)據(jù)的數(shù)量從高到低依次對不同對象的影響力參數(shù)進(jìn)行排名;
[0022]當(dāng)所述行業(yè)事件為負(fù)面時,則根據(jù)該行業(yè)內(nèi)不同對象的視頻報道數(shù)據(jù)的數(shù)量從低到高依次對不同對象的影響力參數(shù)進(jìn)行排名。
[0023]該實(shí)施例,對所述待輿情分析對象所在行業(yè)發(fā)生群體性行業(yè)事件時,根據(jù)對該行業(yè)事件進(jìn)行電視報道時的相關(guān)數(shù)據(jù)數(shù)據(jù),分析行業(yè)內(nèi)各個對象在本行業(yè)的影響力排名。如果該行業(yè)事件是正面事件,則在該事件相關(guān)的電視報道中出現(xiàn)次數(shù)最多的用戶在本行業(yè)的影響力最高,出現(xiàn)次數(shù)最低的用戶在本行業(yè)的影響力最低;當(dāng)該行業(yè)事件為負(fù)面事件時,則結(jié)果相反。通過本實(shí)施例,能夠通過對行業(yè)事件的相關(guān)視頻報道數(shù)據(jù)進(jìn)行采集,對行業(yè)內(nèi)的各個用戶的影響力進(jìn)行初步的排名,獲得了各用戶的影響力水平高低關(guān)系。
[0024]在一個實(shí)施例中,所述根據(jù)所述視頻報道數(shù)量和計(jì)算得到的視頻數(shù)據(jù)輿情分析要素的值,計(jì)算所述需要進(jìn)行輿情分析的對象在不同區(qū)域的影響力參數(shù)包括:
[0025]根據(jù)該對象在不同區(qū)域的視頻報道數(shù)據(jù)的數(shù)量和預(yù)設(shè)的視頻報道數(shù)量加成算法計(jì)算第一影響力參數(shù);
[0026]根據(jù)該對象在不同區(qū)域的視頻報道數(shù)據(jù)播放的時間段和預(yù)設(shè)的時間段加成算法計(jì)算第二影響力參數(shù);
[0027]根據(jù)該對象在不同區(qū)域的視頻報道數(shù)據(jù)的播放時長和預(yù)設(shè)的時長加成算法計(jì)算第三影響力參數(shù);
[0028]根據(jù)該對象在不同區(qū)域的視頻報道數(shù)據(jù)中出現(xiàn)的關(guān)鍵詞次數(shù)和預(yù)設(shè)的關(guān)鍵詞次數(shù)加成算法計(jì)算第四影響力參數(shù);
[0029]將所述第一影響力參數(shù)、第二影響力參數(shù)、第三影響力參數(shù)、第四影響力參數(shù)相加,得到該對象在不同區(qū)域的影響力參數(shù)。
[0030]該實(shí)施例對計(jì)算待輿情分析對象的影響力參數(shù)的方法進(jìn)行了限定,分別通過將視頻報道數(shù)據(jù)的數(shù)量、視頻報道數(shù)據(jù)播放的時間段、視頻報道數(shù)據(jù)的播放時長、視頻報道數(shù)據(jù)中關(guān)鍵詞出現(xiàn)次數(shù)與對應(yīng)的加成算法進(jìn)行加成運(yùn)算,獲取不同的影響力指標(biāo),再將所有指標(biāo)進(jìn)行相加,即得到了需要計(jì)算的影響力參數(shù),該計(jì)算方法考慮到了不同因素可能會對影響力參數(shù)帶來的影響,計(jì)算簡單、快捷,其中,各種加成算法可事先進(jìn)行預(yù)設(shè)。該實(shí)施例不僅實(shí)現(xiàn)了如何計(jì)算待輿情分析對象在不同區(qū)域的影響力參數(shù)的計(jì)算,而且將可能的影響因素都計(jì)算在內(nèi),提高了輿情分析的效率。
[0031]在一個實(shí)施例中,所述分析該行業(yè)事件的正負(fù)面屬性包括:
[0032]預(yù)先在本地設(shè)置正面詞庫和負(fù)面詞庫,判斷所述全部視頻報道數(shù)據(jù)是否包含該正面詞庫或負(fù)面詞庫;
[0033]如果只包含正面詞庫,未包含負(fù)面詞庫,則將該行業(yè)事件的正負(fù)面屬性確定為正面;
[0034]如果只包含負(fù)面詞庫,未包含正面詞庫,則將該行業(yè)事件的正負(fù)面屬性確定為負(fù)面;
[0035]如果同時包含正面詞庫和負(fù)面詞庫,則將該行業(yè)事件的正負(fù)面屬性確定為出現(xiàn)次數(shù)最多的詞庫屬性。
[0036]該實(shí)施例對如何確定行業(yè)事件的正負(fù)面屬性進(jìn)行了限定,首先在本地預(yù)設(shè)正面詞庫和負(fù)面詞庫,根據(jù)視頻報道數(shù)據(jù)是否包含相應(yīng)的詞庫來確定該行業(yè)事件的正負(fù)面屬性。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)了解,當(dāng)僅包含正面詞庫或負(fù)面詞庫時,該行業(yè)事件的正負(fù)面屬性即可直接確定為正面或負(fù)面,如果同時包含正面詞庫和負(fù)面詞庫,則以出現(xiàn)次數(shù)最多的詞庫屬性確定該行業(yè)事件的正負(fù)面屬性。通過本實(shí)施例的方法能夠方便、快捷地確定行業(yè)事件的正負(fù)面屬性,提高了工作效率,節(jié)省了工作時間。
[0037]一種基于電視報道的輿情分析系統(tǒng),包括:
[0038]數(shù)據(jù)采集模塊,用于根據(jù)預(yù)設(shè)的關(guān)鍵詞在預(yù)設(shè)的電視報道采集區(qū)域內(nèi)采集視頻報道數(shù)據(jù),并分別記錄在不同區(qū)域的視頻報道數(shù)量,所述關(guān)鍵詞是與需要進(jìn)行輿情分析的對象關(guān)聯(lián)的關(guān)鍵詞;
[0039]要素計(jì)算模塊,用于根據(jù)采集到的不同區(qū)域的視頻報道數(shù)據(jù),計(jì)算所述視頻報道數(shù)據(jù)的各視頻數(shù)據(jù)輿情分析要素的值,視頻數(shù)據(jù)輿情分析要素包括:視頻播放時段、視頻播放時長、關(guān)鍵詞出現(xiàn)次數(shù);
[0040]參數(shù)計(jì)算模塊,用于根據(jù)所述視頻報道數(shù)量和計(jì)算得到的視頻數(shù)據(jù)輿情分析要素的值,計(jì)算所述需要進(jìn)行輿情