亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種網(wǎng)絡(luò)言論監(jiān)控方法、設(shè)備及系統(tǒng)的制作方法

文檔序號:7620214閱讀:306來源:國知局
專利名稱:一種網(wǎng)絡(luò)言論監(jiān)控方法、設(shè)備及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)言論安全監(jiān)控技術(shù)領(lǐng)域,尤其涉及一種網(wǎng)絡(luò)言論監(jiān)控方法、設(shè)備及系統(tǒng)。
背景技術(shù)
隨著網(wǎng)絡(luò)的普及,越來越多的人利用網(wǎng)絡(luò)進(jìn)行交流,比如網(wǎng)絡(luò)留言、網(wǎng)絡(luò)評論、發(fā)表各種網(wǎng)絡(luò)言論等等,網(wǎng)絡(luò)的快捷給人們的生活帶來便利的同時,也讓許多惡意分子有機(jī)可乘,比如惡意分子利用網(wǎng)絡(luò)發(fā)布中獎詐騙信息、廣告信息、惡意言論信息等,給網(wǎng)絡(luò)的應(yīng)用帶來了極壞的影響,嚴(yán)重?fù)p壞了用戶的業(yè)務(wù)體驗。
請參見圖1,為現(xiàn)有的網(wǎng)絡(luò)言論系統(tǒng)的結(jié)構(gòu)示意圖。用戶通過客戶端發(fā)布網(wǎng)絡(luò)言論(如網(wǎng)絡(luò)留言、論壇評論等),客戶端將用戶發(fā)布的網(wǎng)絡(luò)言論發(fā)送至業(yè)務(wù)服務(wù)器,業(yè)務(wù)服務(wù)器處理業(yè)務(wù)邏輯,包括驗證發(fā)布者的用戶名(ID)、密碼等信息,并將用戶發(fā)布的該網(wǎng)絡(luò)言論添加至相應(yīng)的發(fā)布隊列中,將發(fā)布隊列返回給客戶端進(jìn)行顯示,用戶即可查看到自己發(fā)布的網(wǎng)絡(luò)言論。業(yè)務(wù)服務(wù)器將該網(wǎng)絡(luò)言論傳送至數(shù)據(jù)服務(wù)器進(jìn)行存儲和管理。為了防止惡意分子對網(wǎng)絡(luò)應(yīng)用進(jìn)行破壞,現(xiàn)有的網(wǎng)絡(luò)言論的安全監(jiān)控方案基于關(guān)鍵詞技術(shù)進(jìn)行網(wǎng)絡(luò)言論的安全控制,具體為在業(yè)務(wù)服務(wù)器中預(yù)先存儲不安全網(wǎng)絡(luò)言論的關(guān)鍵詞庫,對關(guān)鍵詞庫中的各個關(guān)鍵詞進(jìn)行級別劃分,如可劃分為嚴(yán)重惡意、惡意、輕微惡意三個級別,針對不同級別制定相應(yīng)的控制方式,如嚴(yán)重惡意級別對應(yīng)的控制方式為“封號”,惡意級別對應(yīng)的控制方式為“禁言”,輕微惡意級別對應(yīng)的控制方式為“禁止發(fā)表該條言論”。當(dāng)接收到用戶發(fā)表的各種網(wǎng)絡(luò)言論時,業(yè)務(wù)服務(wù)器首先對各種網(wǎng)絡(luò)言論進(jìn)行解析,當(dāng)解析出網(wǎng)絡(luò)言論中包含關(guān)鍵詞庫中的關(guān)鍵詞,確定該關(guān)鍵詞的級別,井根據(jù)確定的級別對應(yīng)的控制方式對網(wǎng)絡(luò)言論進(jìn)行控制。發(fā)明人發(fā)現(xiàn),現(xiàn)有的網(wǎng)絡(luò)言論的安全監(jiān)控方案里然能在一定程度上過濾掉部分不安全網(wǎng)絡(luò)言論(如惡意言論),但這種基于關(guān)鍵詞技術(shù)的方案在應(yīng)用中存在一些缺陷
I、控制過于武斷?,F(xiàn)有的網(wǎng)絡(luò)言論的安全監(jiān)控方案往往在判斷網(wǎng)絡(luò)言論中存在某ー個匹配的關(guān)鍵詞吋,即認(rèn)為該網(wǎng)絡(luò)言論為不安全網(wǎng)絡(luò)言論,隨即采取相應(yīng)的控制方式進(jìn)行控制,這種僅僅憑借ー個關(guān)鍵詞來判定一段網(wǎng)絡(luò)言論的方式太過草率和武斷,容易影響用戶的業(yè)務(wù)體驗。2、對中性詞很難界定,容易形成控制盲區(qū)?,F(xiàn)有的網(wǎng)絡(luò)言論的安全監(jiān)控方案對于模糊性質(zhì)的中性詞很難處理,比如“獎品”一詞,在中獎詐騙類言論中,該詞用于欺騙用戶,屬于惡意關(guān)鍵詞,但是正常用戶交流中,該詞可能是用戶發(fā)表的正常言論;對于這ー類中性詞,現(xiàn)有方案往往無法準(zhǔn)確進(jìn)行判斷和處理,因此可能造成許多安全控制的盲區(qū),從而降低了對網(wǎng)絡(luò)言論的安全保護(hù)カ度。

發(fā)明內(nèi)容
本發(fā)明實施例所要解決的技術(shù)問題在于,提供一種網(wǎng)絡(luò)言論監(jiān)控方法、設(shè)備及系統(tǒng),可有效地對不安全網(wǎng)絡(luò)言論進(jìn)行理解識別和過濾,提高對網(wǎng)絡(luò)言論的安全保護(hù)カ度。為了解決上述技術(shù)問題,本發(fā)明實施例提供了一種網(wǎng)絡(luò)言論監(jiān)控方法,包括 獲取用戶發(fā)表的網(wǎng)絡(luò)言論;
判斷所述網(wǎng)絡(luò)言論是否與預(yù)設(shè)的識別規(guī)則相匹配,若判斷結(jié)果為是,為所述網(wǎng)絡(luò)言論標(biāo)注相應(yīng)的標(biāo)識;
根據(jù)預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系,采用與所述網(wǎng)絡(luò)言論的標(biāo)識相對應(yīng)的控制方式對所述網(wǎng)絡(luò)言論進(jìn)行安全控制。其中,所述獲取用戶發(fā)表的網(wǎng)絡(luò)言論包括
接收客戶端發(fā)送的用戶發(fā)表的網(wǎng)絡(luò)言論;或者,
接收業(yè)務(wù)服務(wù)器上報的用戶發(fā)表的網(wǎng)絡(luò)言論;
其中,所述網(wǎng)絡(luò)言論包括微博留言、微博評論、微博回復(fù)、論壇留言、論壇評論、留言板留言、日志評論及博客留言中的任ー種或多種。其中,所述判斷所述網(wǎng)絡(luò)言論是否與預(yù)設(shè)的識別規(guī)則相匹配,若判斷結(jié)果為是,為所述網(wǎng)絡(luò)言論標(biāo)注相應(yīng)的標(biāo)識,包括
解析所述網(wǎng)絡(luò)言論,獲得至少ー個獨(dú)立的短句;
對所述短句進(jìn)行識別,判斷所述短句是否與所述預(yù)設(shè)的識別規(guī)則相匹配;
若判斷結(jié)果為是,為所述短句標(biāo)注相應(yīng)的標(biāo)識。其中,所述解析所述網(wǎng)絡(luò)言論,獲得至少ー個獨(dú)立的短句,包括
基于標(biāo)點(diǎn)符號對所述網(wǎng)絡(luò)言論進(jìn)行分割,獲得至少ー個獨(dú)立的短句;或者,
基于短句長度的統(tǒng)計規(guī)律對所述網(wǎng)絡(luò)言論進(jìn)行分割,獲得至少ー個獨(dú)立的短句。其中,所述獲取用戶發(fā)表的網(wǎng)絡(luò)言論之前,還包括
預(yù)先設(shè)定各種識別規(guī)則,及預(yù)先設(shè)定各種標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系;
所述預(yù)設(shè)的識別規(guī)則包括以下規(guī)則中的任ー種或多種廣告類言論識別規(guī)則、詐騙類言論識別規(guī)則、惡意言論識別規(guī)則、反動類言論識別規(guī)則、色情類言論識別規(guī)則、政治類言論識別規(guī)則;
所述標(biāo)識包括以下標(biāo)識中的任ー種或多種廣告標(biāo)識、詐騙標(biāo)識、惡意標(biāo)識、反動標(biāo)識、色情標(biāo)識、政治標(biāo)識;
所述控制方式包括禁止所述網(wǎng)絡(luò)言論的發(fā)表、封鎖所述網(wǎng)絡(luò)言論的發(fā)起方ID、禁止所述網(wǎng)絡(luò)言論的發(fā)起方ID的所有網(wǎng)絡(luò)言論的發(fā)表、向所述網(wǎng)絡(luò)言論的發(fā)起方發(fā)送警告信息中的任ー種或多種;
所述預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系為任一種標(biāo)識對應(yīng)ー種控制方式,或者,多種標(biāo)識的組合對應(yīng)至少一種控制方式。其中,所述預(yù)先設(shè)定各種識別規(guī)則,包括
從網(wǎng)絡(luò)中獲取各種不安全網(wǎng)絡(luò)言論的樣本;
從所述樣本中提取每種不安全網(wǎng)絡(luò)言論的共有特征,并從所述樣本中提煉每種不安全網(wǎng)絡(luò)言論的必要信息要素;
根據(jù)每種不安全網(wǎng)絡(luò)言論的共有特征和必要信息要素,生成每種不安全網(wǎng)絡(luò)言論的識別規(guī)則。相應(yīng)地,本發(fā)明實施例還提供了一種網(wǎng)絡(luò)言論監(jiān)控設(shè)備,包括獲取模塊,用于獲取用戶發(fā)表的網(wǎng)絡(luò)言論;
標(biāo)注模塊,用于判斷所述獲取模塊獲取的所述網(wǎng)絡(luò)言論是否與預(yù)設(shè)的識別規(guī)則相匹配,當(dāng)判斷結(jié)果為是時,為所述網(wǎng)絡(luò)言論標(biāo)注相應(yīng)的標(biāo)識;
安全控制模塊,用于根據(jù)預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系,采用與所述標(biāo)注模塊為所述網(wǎng)絡(luò)言論標(biāo)注的標(biāo)識相對應(yīng)的控制方式對所述網(wǎng)絡(luò)言論進(jìn)行安全控制。其中,所述獲取模塊接收客戶端發(fā)送的用戶發(fā)表的網(wǎng)絡(luò)言論;或者,所述獲取模塊接收業(yè)務(wù)服務(wù)器上報的用戶發(fā)表的網(wǎng)絡(luò)言論;
其中,所述網(wǎng)絡(luò)言論包括微博留言、微博評論、微博回復(fù)、論壇留言、論壇評論、留言板留言、日志評論及博客留言中的任ー種或多種。 其中,所述標(biāo)注模塊包括
解析単元,用于解析所述網(wǎng)絡(luò)言論,獲得至少ー個獨(dú)立的短句;
識別判斷単元,用于對所述解析單元獲得的短句進(jìn)行識別,判斷所述短句是否與所述預(yù)設(shè)的識別規(guī)則相匹配;
標(biāo)注單元,用于當(dāng)所述識別判斷単元判斷結(jié)果為是時,為所述短句標(biāo)注相應(yīng)的標(biāo)識。其中,所述解析単元用于基于標(biāo)點(diǎn)符號對所述網(wǎng)絡(luò)言論進(jìn)行分割,獲得至少ー個獨(dú)立的短句;或者,基于短句長度的統(tǒng)計規(guī)律對所述網(wǎng)絡(luò)言論進(jìn)行分割,獲得至少ー個獨(dú)立的短句。其中,所述設(shè)備還包括
存儲模塊,用于存儲預(yù)先設(shè)定的各種識別規(guī)則,及預(yù)先設(shè)定的各種標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系;
所述預(yù)設(shè)的識別規(guī)則包括以下規(guī)則中的任ー種或多種廣告類言論識別規(guī)則、詐騙類言論識別規(guī)則、惡意言論識別規(guī)則、反動類言論識別規(guī)則、色情類言論識別規(guī)則、政治類言論識別規(guī)則;
所述標(biāo)識包括以下標(biāo)識中的任ー種或多種廣告標(biāo)識、詐騙標(biāo)識、惡意標(biāo)識、反動標(biāo)識、色情標(biāo)識、政治標(biāo)識;
所述控制方式包括禁止所述網(wǎng)絡(luò)言論的發(fā)表、封鎖所述網(wǎng)絡(luò)言論的發(fā)起方ID、禁止所述網(wǎng)絡(luò)言論的發(fā)起方ID的所有網(wǎng)絡(luò)言論的發(fā)表、向所述網(wǎng)絡(luò)言論的發(fā)起方發(fā)送警告信息中的任ー種或多種;
所述預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系為任一種標(biāo)識對應(yīng)ー種控制方式,或者,多種標(biāo)識的組合對應(yīng)至少一種控制方式。相應(yīng)地,本發(fā)明實施例還提供了一種網(wǎng)絡(luò)言論監(jiān)控系統(tǒng),包括上述的網(wǎng)絡(luò)言論監(jiān)控設(shè)備。實施本發(fā)明實施例,具有如下有益效果
1、本發(fā)明實施例采用預(yù)設(shè)的識別規(guī)則對用戶發(fā)表的網(wǎng)絡(luò)言論進(jìn)行識別和判斷,當(dāng)判斷所述網(wǎng)絡(luò)言論與預(yù)設(shè)的識別規(guī)則相匹配吋,自動為該網(wǎng)絡(luò)言論標(biāo)注相應(yīng)的標(biāo)識,并采用與該標(biāo)識相對應(yīng)的控制方式進(jìn)行安全控制,基于該識別規(guī)則對網(wǎng)絡(luò)言論進(jìn)行監(jiān)控,可有效過濾掉不安全的網(wǎng)絡(luò)言論,提高對網(wǎng)絡(luò)言論的安全保護(hù)カ度;
2、本發(fā)明實施例的網(wǎng)絡(luò)監(jiān)控所基于的預(yù)設(shè)的識別規(guī)則,是從網(wǎng)絡(luò)中各種不安全網(wǎng)絡(luò)言論的樣本的指導(dǎo)學(xué)習(xí)過程中提煉而成,能夠有效地對各種不安全網(wǎng)絡(luò)言論進(jìn)行理解識別,有利于提高網(wǎng)絡(luò)言論安全的監(jiān)控カ度。


為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖I為現(xiàn)有的網(wǎng)絡(luò)言論系統(tǒng)的結(jié)構(gòu)示意 圖2為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控系統(tǒng)的第一實施例的結(jié)構(gòu)示意 圖3為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控系統(tǒng)的第二實施例的結(jié)構(gòu)示意 圖4為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控系統(tǒng)的第三實施例的結(jié)構(gòu)示意圖;
圖5為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控設(shè)備的第一實施例的結(jié)構(gòu)示意 圖6為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控設(shè)備的第二實施例的結(jié)構(gòu)示意 圖7為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控設(shè)備的標(biāo)注模塊的實施例的結(jié)構(gòu)示意 圖8為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控方法的第一實施例的流程 圖9為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控方法的第二實施例的流程圖。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。請參見圖2,為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控系統(tǒng)的第一實施例的結(jié)構(gòu)示意圖;所述網(wǎng)絡(luò)言論監(jiān)控系統(tǒng)包括客戶端、業(yè)務(wù)服務(wù)器和數(shù)據(jù)服務(wù)器,還包括網(wǎng)絡(luò)言論監(jiān)控設(shè)備。本實施例中,網(wǎng)絡(luò)言論監(jiān)控設(shè)備可以為安全保護(hù)服務(wù)器,其采用異步離線的方式去保護(hù)系統(tǒng)的網(wǎng)絡(luò)言論的安全,如圖2所示,用戶通過客戶端發(fā)表網(wǎng)絡(luò)言論,業(yè)務(wù)服務(wù)器接收到客戶端發(fā)送的用戶的網(wǎng)絡(luò)言論時,一方面進(jìn)行正常的業(yè)務(wù)邏輯處理;另ー方面,業(yè)務(wù)服務(wù)器將接收到的網(wǎng)絡(luò)言論上報至安全保護(hù)服務(wù)器,安全保護(hù)服務(wù)器基于預(yù)設(shè)的識別規(guī)則對業(yè)務(wù)服務(wù)器上報的網(wǎng)絡(luò)言論進(jìn)行識別判斷,并采用相應(yīng)的控制方式控制該網(wǎng)絡(luò)言論,過濾惡意的網(wǎng)絡(luò)言論,保護(hù)系統(tǒng)的網(wǎng)絡(luò)言論安全;最后,安全保護(hù)服務(wù)器還需要到數(shù)據(jù)服務(wù)器中對所述安全控制后的網(wǎng)絡(luò)言論進(jìn)行離線清理,刪除被安全保護(hù)服務(wù)器識別并進(jìn)行安全控制的網(wǎng)絡(luò)言論,避免這些網(wǎng)絡(luò)言論干擾到正常用戶的業(yè)務(wù)體驗。請ー并參見圖3,為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控系統(tǒng)的第二實施例的結(jié)構(gòu)示意圖;與上一實施例相同,所述網(wǎng)絡(luò)言論監(jiān)控系統(tǒng)包括客戶端、業(yè)務(wù)服務(wù)器、數(shù)據(jù)服務(wù)器和網(wǎng)絡(luò)言論監(jiān)控設(shè)備。本實施例中,網(wǎng)絡(luò)言論監(jiān)控設(shè)備可以為安全過濾網(wǎng),其采用同步的方式去保護(hù)系統(tǒng)的網(wǎng)絡(luò)言論的安全,如圖3所示,該安全過濾網(wǎng)設(shè)置于業(yè)務(wù)邏輯的關(guān)鍵路徑上,在進(jìn)行業(yè)務(wù)邏輯處理時直接進(jìn)行保護(hù)。安全過濾網(wǎng)對系統(tǒng)的網(wǎng)絡(luò)言論的安全保護(hù)過程與上一實施例過程相同,在此不贅述。
請ー并參見圖4,為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控系統(tǒng)的第三實施例的結(jié)構(gòu)示意圖;與上一實施例相同,所述網(wǎng)絡(luò)言論監(jiān)控系統(tǒng)包括客戶端、業(yè)務(wù)服務(wù)器、數(shù)據(jù)服務(wù)器和網(wǎng)絡(luò)言論監(jiān)控設(shè)備。本實施例中,網(wǎng)絡(luò)言論監(jiān)控設(shè)備可以為安全防火墻,該安全防火墻可以為軟件防火墻或硬件防火墻,其采用同步的方式去保護(hù)系統(tǒng)的網(wǎng)絡(luò)言論的安全,如圖4所示,該安全防火墻設(shè)置于業(yè)務(wù)服務(wù)器與客戶端之間,直接接收客戶端發(fā)送的網(wǎng)絡(luò)言論,并在進(jìn)行業(yè)務(wù)邏輯之前對系統(tǒng)的網(wǎng)絡(luò)言論進(jìn)行過濾和保護(hù)。安全防火墻對系統(tǒng)的網(wǎng)絡(luò)言論的安全保護(hù)過程與上一實施例過程類似,在此不贅述。為了更清楚地說明本發(fā)明,下面將對本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控系統(tǒng)中的網(wǎng)絡(luò)言論監(jiān)控設(shè)備進(jìn)行詳細(xì)介紹。請參見圖5,為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控設(shè)備的第一實施例的結(jié)構(gòu)示意圖;所述網(wǎng)絡(luò)言論監(jiān)控設(shè)備包括 獲取模塊10,用于獲取用戶發(fā)表的網(wǎng)絡(luò)言論。具體實現(xiàn)中,所述獲取模塊10可以接收客戶端發(fā)送的用戶發(fā)表的網(wǎng)絡(luò)言論,如圖4所示實施例中,網(wǎng)絡(luò)言論監(jiān)控設(shè)備設(shè)置于客戶端與業(yè)務(wù)服務(wù)器之間,此時所述獲取模塊10則直接接收客戶端發(fā)送的用戶發(fā)表的網(wǎng)絡(luò)言論;所述獲取模塊10也可以接收業(yè)務(wù)服務(wù)器上報的用戶發(fā)表的網(wǎng)絡(luò)言論,如圖2所示實施列中,網(wǎng)絡(luò)言論監(jiān)控設(shè)備設(shè)置于業(yè)務(wù)邏輯的關(guān)鍵路徑之外,其接收業(yè)務(wù)服務(wù)器上報的用戶發(fā)表的網(wǎng)絡(luò)言論;如圖3所示實施例中,網(wǎng)絡(luò)言論監(jiān)控設(shè)備設(shè)置于業(yè)務(wù)邏輯的關(guān)鍵路徑上,其也可接收業(yè)務(wù)服務(wù)器上報的用戶發(fā)表的網(wǎng)絡(luò)言論。具體地,所述網(wǎng)絡(luò)言論包括但不限干微博留言、微博評論、微博回復(fù)、論壇留言、論壇評論、留言板留言、日志評論及博客留言中的任ー種或多種。標(biāo)注模塊20,用于判斷所述獲取模塊10獲取的所述網(wǎng)絡(luò)言論是否與預(yù)設(shè)的識別規(guī)則相匹配,當(dāng)判斷結(jié)果為是時,為所述網(wǎng)絡(luò)言論標(biāo)注相應(yīng)的標(biāo)識。所述預(yù)設(shè)的識別規(guī)則包括但不限于以下規(guī)則中的任ー種或多種廣告類言論識別規(guī)則、詐騙類言論識別規(guī)則、惡意言論識別規(guī)則、反動類言論識別規(guī)則、色情類言論識別規(guī)貝1J、政治類言論識別規(guī)則。所述標(biāo)注模塊20首先將所述獲取模塊10獲取的網(wǎng)絡(luò)言論進(jìn)行解析,獲得至少ー個獨(dú)立的短句,然后基于所述預(yù)設(shè)的識別規(guī)則識別各個短句,當(dāng)識別到所述短句與所述預(yù)設(shè)的識別規(guī)則相匹配時,為所述網(wǎng)絡(luò)言論自動標(biāo)注相應(yīng)的標(biāo)識,所述標(biāo)識包括但不限于以下標(biāo)識中的任ー種或多種廣告標(biāo)識、詐騙標(biāo)識、惡意標(biāo)識、反動標(biāo)識、色情標(biāo)識、政治標(biāo)識。安全控制模塊30,用于根據(jù)預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系,采用與所述標(biāo)注模塊20為所述網(wǎng)絡(luò)言論標(biāo)注的標(biāo)識相對應(yīng)的控制方式對所述網(wǎng)絡(luò)言論進(jìn)行安全控制。具體實現(xiàn)中,所述預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系為任一種標(biāo)識對應(yīng)ー種控制方式,或者,多種標(biāo)識的組合對應(yīng)至少一種控制方式。所述控制方式包括但不限于禁止所述網(wǎng)絡(luò)言論的發(fā)表、封鎖所述網(wǎng)絡(luò)言論的發(fā)起方ID、禁止所述網(wǎng)絡(luò)言論的發(fā)起方ID的所有網(wǎng)絡(luò)言論的發(fā)表、向所述網(wǎng)絡(luò)言論的發(fā)起方發(fā)送警告信息中的任ー種或多種。需要說明的是,標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系可以根據(jù)實際需要進(jìn)行設(shè)定,比如根據(jù)實際需要,可預(yù)設(shè)“廣告標(biāo)識”與“禁止所述網(wǎng)絡(luò)言論的發(fā)表”的控制方式相對應(yīng);也可預(yù)設(shè)“廣告標(biāo)識+惡意標(biāo)識”與“封鎖所述網(wǎng)絡(luò)言論的發(fā)起方ID”的控制方式對應(yīng);還可預(yù)設(shè)“廣告標(biāo)識”與“禁止所述網(wǎng)絡(luò)言論的發(fā)表”及“封鎖所述網(wǎng)絡(luò)言論的發(fā)起方ID”兩種控制方式相對應(yīng),等等,其他情況可類似分析,在此不贅述。所述安全控制模塊30針對不同標(biāo)識的網(wǎng)絡(luò)言論,采用相對應(yīng)的適當(dāng)措施來對該網(wǎng)絡(luò)言論進(jìn)行対抗,有效地阻止了惡意的網(wǎng)絡(luò)言論泛濫,保護(hù)了系統(tǒng)的網(wǎng)絡(luò)言論安全。本發(fā)明實施例可有效地對不安全的網(wǎng)絡(luò)言論進(jìn)行過濾,提高對網(wǎng)絡(luò)言論的安全保護(hù)カ度。請參見圖6,為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控設(shè)備的第二實施例的結(jié)構(gòu)示意圖;與上一實施例相同,所述網(wǎng)絡(luò)言論監(jiān)控設(shè)備包括獲取模塊10、標(biāo)注模塊20和安全控制模塊30。本實施例中,所述網(wǎng)絡(luò)言論監(jiān)控設(shè)備還包括
存儲模塊40,用于存儲預(yù)先設(shè)定的各種識別規(guī)則,及預(yù)先設(shè)定的各種標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系。 所述預(yù)設(shè)的識別規(guī)則包括但不限于以下規(guī)則中的任ー種或多種廣告類言論識別規(guī)則、詐騙類言論識別規(guī)則、惡意言論識別規(guī)則、反動類言論識別規(guī)則、色情類言論識別規(guī)貝1J、政治類言論識別規(guī)則。所述存儲模塊40則用于存儲所述預(yù)設(shè)的識別規(guī)則的集合,具體實現(xiàn)中,所述存儲模塊40可構(gòu)建ー個知識庫,該知識庫的構(gòu)建過程包括各種識別規(guī)則的設(shè)置過程及更新修正過程。下面以中獎詐騙類言論識別規(guī)則為例,來具體說明識別規(guī)則的設(shè)置過程和更新修正過程。首先,所述存儲模塊40從網(wǎng)絡(luò)中獲取大量的中獎詐騙類言論的樣本,比如“恭喜用戶,你獲得了某官方3萬元大獎ー份,請來www. zhongjiang. com領(lǐng)??! ”、“尊敬的用戶,某公司成立10周年慶典活動,有大禮相送,請登錄www. af. com ! ”、“恭喜你,您是第100萬開通農(nóng)場業(yè)務(wù)的用戶,你獲得了某官方贈送精美大禮包ー份,請登錄www. jiangpin. cn領(lǐng)??!”,等等。其次,所述存儲模塊40從上述各種中獎詐騙類言論樣本中提取共有特征,一相 同的信息傳達(dá)對象。上述中獎詐騙類的信息傳達(dá)對象都是針對第二人稱的,如“你”、“您”、“用戶”;ニ均帶有與“獎品”相關(guān)或相似的詞,包括“獎品”、“中獎”、“獎金”、“禮物”、“禮品”、“禮包”、“回饋等;三均帶有欺騙性網(wǎng)站的鏈接。再次,所述存儲模塊40模擬人腦抽象理解一句話關(guān)鍵信息要素的過程,提煉出中獎詐騙類言論的信息要素,表達(dá)如下{某某原因} {你} {中獎了} U青登錄某網(wǎng)姑} {匯款領(lǐng)獎},所述存儲模塊40提煉得到的信息要素對具有共有特征的不同表現(xiàn)形式的中獎詐騙類言論進(jìn)行了高度概括和抽象。最后,所述存儲模塊40基于上述提取的共有特征,以及提煉得到的各個信息要素,從中提取出必要的、不可缺失的信息要素抽象出中獎詐騙類言論的識別規(guī)則{中獎詐騙類言論}= {第二人稱}+ {獎品}+ {外網(wǎng)鏈接}。上述過程即為中獎詐騙類言論識別規(guī)則的預(yù)設(shè)過程,該過程是基于對現(xiàn)有出現(xiàn)的中獎詐騙類言論的樣本的指導(dǎo)學(xué)習(xí)形成的,也是對機(jī)器(網(wǎng)絡(luò)言論監(jiān)控設(shè)備)進(jìn)行訓(xùn)練的過程??梢岳斫獾氖?,上述過程僅為舉例,其他識別規(guī)則,比如茶葉廣告類言論的識別規(guī)則為{茶葉廣告類言論}= {茶葉}+ {外網(wǎng)鏈接};再如色情類言論的識別規(guī)則為{色情空間}= {空間有}+ {色情}+ {圖,視頻,電影};又如強(qiáng)制別人傳播,否則詛咒別人的惡意言論識別規(guī)則為{強(qiáng)制轉(zhuǎn)發(fā)惡意言論}= {不}+ {傳播該評論}+ {詛咒} + {你,全家};上述各種識別規(guī)則的形成過程可類似分析,在此不贅述?;趯ΜF(xiàn)有出現(xiàn)的各種不安全網(wǎng)絡(luò)言論的樣本的指導(dǎo)學(xué)習(xí),形成各種識別規(guī)則,所述存儲模塊40將所有的識別規(guī)則聚集存儲,即構(gòu)建得到包含識別規(guī)則集合的知識庫{中獎詐騙類言論}= {{廣告類言論識別規(guī)則}、{詐騙類言論識別規(guī)則}、{悪意言論識別規(guī)貝1J}、{反動類言論識別規(guī)則}、{色情類言論識別規(guī)則}、{政治類言論識別規(guī)則}……}。需要說明的是,隨著各種不安全網(wǎng)絡(luò)言論的變種,所述預(yù)設(shè)的識別規(guī)則也會根據(jù)不斷的指導(dǎo)學(xué)習(xí)過程進(jìn)行不斷更新和修正,該知識庫也相應(yīng)的進(jìn)行不斷更新和修正,該更新修正過程與上述識別規(guī)則的形成過程類似,在此不贅述。構(gòu)建好所述知識庫后,所述存儲模塊40需要將其轉(zhuǎn)化為所述網(wǎng)絡(luò)言論監(jiān)控設(shè)備能夠識別的命令邏輯,由網(wǎng)絡(luò)言論監(jiān)控設(shè)備執(zhí)行該命令邏輯來完成對預(yù)設(shè)的識別規(guī)則的應(yīng)用。依上述例子,基于預(yù)設(shè)的中獎詐騙類言論識別規(guī)則,其命令邏輯如下
Function knowledgebase. Label (comment)// 自動你注邏輯
{
Foreach rule in knowledgebase //對預(yù)設(shè)的所有識別規(guī)則進(jìn)行逐一識別
{
If rule. Recognize (comment) ; then // 如果某規(guī)則識別了短句 comment got rule. Label//為短句標(biāo)注規(guī)則對應(yīng)的標(biāo)識
Endif
}
}
Function rule. Recognize (comment)// 識別規(guī)則的識別邏輯
{
IF comment. Contains {第二人稱} && comment Contains {獎品} && commentContains {外網(wǎng)鏈接};then
//判斷該網(wǎng)絡(luò)言論是否匹配了識別規(guī)則包含的所有信息要素 Return rule recognize this comment //信息要素全部包含,則該網(wǎng)絡(luò)言論與該識別規(guī)則相匹配 Else
Return rule do not recognize this comment
//該網(wǎng)絡(luò)言論與該識別規(guī)則不匹配
Endif
}
Function comment. Contains {第二人稱}//信息要素的識別邏輯
{
If (comment. Contains keyword 你 | | comment. Contains Keyword 您 | |comment. Contains keyword 〃用戶 〃 )then
//短句評論是否含有信息要素的具體化內(nèi)容特征Return comment contain {第二人稱} Il短句含有{第二人稱}信息 Else
Return comment do not contain i 弟二人稱}
Endif
}
所述標(biāo)注模塊20通過執(zhí)行上述命令邏輯,可判斷網(wǎng)絡(luò)言論是否與知識庫中預(yù)設(shè)的中獎詐騙類言論的識別規(guī)則相匹配,且當(dāng)判斷結(jié)果為是時,自動對該網(wǎng)絡(luò)言論標(biāo)注所述預(yù)設(shè)的中獎詐騙類言論的識別規(guī)則對應(yīng)的標(biāo)識,如中獎詐騙標(biāo)識。
需要說明的是,所述存儲模塊40還用于存儲預(yù)先設(shè)定的各種標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系;所述標(biāo)識包括但不限于以下標(biāo)識中的任ー種或多種廣告標(biāo)識、詐騙標(biāo)識、惡意標(biāo)識、反動標(biāo)識、色情標(biāo)識、政治標(biāo)識;所述預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系為任一種標(biāo)識對應(yīng)ー種控制方式,或者,多種標(biāo)識的組合對應(yīng)至少一種控制方式;所述控制方式包括但不限于禁止所述網(wǎng)絡(luò)言論的發(fā)表、封鎖所述網(wǎng)絡(luò)言論的發(fā)起方ID、禁止所述網(wǎng)絡(luò)言論的發(fā)起方ID的所有網(wǎng)絡(luò)言論的發(fā)表、向所述網(wǎng)絡(luò)言論的發(fā)起方發(fā)送警告信息中的任ー種或多種。本發(fā)明實施例可有效地對不安全的網(wǎng)絡(luò)言論進(jìn)行理解識別和過濾,提高對網(wǎng)絡(luò)言論的安全保護(hù)カ度。為了更清楚地說明本發(fā)明,下面將對本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控設(shè)備中的標(biāo)注模塊進(jìn)行詳細(xì)介紹。請參見圖7,為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控設(shè)備的標(biāo)注模塊的實施例的結(jié)構(gòu)示意圖;所述標(biāo)注模塊20包括
解析単元201,用于解析所述網(wǎng)絡(luò)言論,獲得至少ー個獨(dú)立的短句。所謂短句,指采用高度提煉的短語或一句話表達(dá)一個觀點(diǎn)或主題。用戶通過客戶端發(fā)布網(wǎng)絡(luò)言論,該網(wǎng)絡(luò)言論可以是ー長段的言論(多個獨(dú)立的短句構(gòu)成),也可以為ー個短句。當(dāng)所述網(wǎng)絡(luò)言論為ー個短句時,所述解析単元201直接獲得該短句;當(dāng)所述網(wǎng)絡(luò)言論為ー長段的言論時,所述解析単元201對該長段的言論進(jìn)行分割,獲得多個獨(dú)立的短句,所述解析単元201對長段言論的分割方式可以為基于標(biāo)點(diǎn)符號的分割方式,即按照標(biāo)點(diǎn)符號進(jìn)行分割獲得短句;基于統(tǒng)計規(guī)律進(jìn)行分割,即按照短句平均的長度對長段的言論進(jìn)行分割;等等。識別判斷単元202,用于對所述解析単元201獲得的短句進(jìn)行識別,判斷所述短句是否與所述預(yù)設(shè)的識別規(guī)則相匹配。所述識別判斷単元202基于所述預(yù)設(shè)的識別規(guī)則對所述解析単元201獲得的各個短句進(jìn)行識別,具體地,所述識別判斷単元202通過執(zhí)行上一實施例中的命令邏輯來進(jìn)行識別判斷。標(biāo)注單元203,用于當(dāng)所述識別判斷単元202判斷結(jié)果為是時,為所述短句標(biāo)注相應(yīng)的標(biāo)識。當(dāng)所述識別判斷単元202判斷短句與預(yù)設(shè)的識別規(guī)則相匹配時,所述標(biāo)注単元203通過執(zhí)行上一實施例中的命令邏輯,自動對該匹配的網(wǎng)絡(luò)言論標(biāo)注所述預(yù)設(shè)的中獎詐騙類言論的識別規(guī)則對應(yīng)的標(biāo)識,如中獎詐騙標(biāo)識。需要說明的是,若所述識別判斷単元202的判斷結(jié)果為否,表明所述網(wǎng)絡(luò)言論為正常的言論,則采用正常的業(yè)務(wù)邏輯對該網(wǎng)絡(luò)言論進(jìn)行處理,此過程與現(xiàn)有技術(shù)相同,在此不贅述。本發(fā)明實施例可有效地對不安全的網(wǎng)絡(luò)言論進(jìn)行過濾,提高對網(wǎng)絡(luò)言論的安全保護(hù)カ度。為了更清楚地說明本發(fā)明,下面將對本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控設(shè)備所執(zhí)行的網(wǎng)絡(luò)言論監(jiān)控方法進(jìn)行詳細(xì)介紹。
請參見圖8,為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控方法的第一實施例的流程圖;所述方法包括
S101,獲取用戶發(fā)表的網(wǎng)絡(luò)言論。具體實現(xiàn)中,所述SlOl可以接收客戶端發(fā)送的用戶發(fā)表的網(wǎng)絡(luò)言論,如圖4所示實施例中,網(wǎng)絡(luò)言論監(jiān)控設(shè)備設(shè)置于客戶端與業(yè)務(wù)服務(wù)器之間,此時所述網(wǎng)絡(luò)言論監(jiān)控設(shè)備則執(zhí)行所述S101,直接接收客戶端發(fā)送的用戶發(fā)表的網(wǎng)絡(luò)言論;所述SlOl也可以接收業(yè)務(wù)服務(wù)器上報的用戶發(fā)表的網(wǎng)絡(luò)言論,如圖2所示實施列中,網(wǎng)絡(luò)言論監(jiān)控設(shè)備設(shè)置于業(yè)務(wù)邏輯的關(guān)鍵路徑之外,其執(zhí)行所述S101,接收業(yè)務(wù)服務(wù)器上報的用戶發(fā)表的網(wǎng)絡(luò)言論;如圖3所示實施例中,網(wǎng)絡(luò)言論監(jiān)控設(shè)備設(shè)置于業(yè)務(wù)邏輯的關(guān)鍵路徑上,其執(zhí)行所述S101,接收業(yè)務(wù)服務(wù)器上報的用戶發(fā)表的網(wǎng)絡(luò)言論。具體地,所述網(wǎng)絡(luò)言論包括但不限于微博留言、微博評論、微博回復(fù)、論壇留言、論壇評論、留言板留言、日志評論及博客留言中的任一種或多種。S102,判斷所述網(wǎng)絡(luò)言論是否與預(yù)設(shè)的識別規(guī)則相匹配,若判斷結(jié)果為是,轉(zhuǎn)入S103 ;否則,結(jié)束。所述預(yù)設(shè)的識別規(guī)則包括但不限于以下規(guī)則中的任ー種或多種廣告類言論識別規(guī)則、詐騙類言論識別規(guī)則、惡意言論識別規(guī)則、反動類言論識別規(guī)則、色情類言論識別規(guī)貝1J、政治類言論識別規(guī)則。所述S102首先將所述獲取的網(wǎng)絡(luò)言論進(jìn)行解析,獲得至少ー個獨(dú)立的短句,然后基于所述預(yù)設(shè)的識別規(guī)則識別各個短句,當(dāng)識別到所述短句與所述預(yù)設(shè)的識別規(guī)則相匹配吋,轉(zhuǎn)入執(zhí)行S103,否則,結(jié)束。S103,為所述網(wǎng)絡(luò)言論標(biāo)注相應(yīng)的標(biāo)識。當(dāng)所述S102識別到所述短句與所述預(yù)設(shè)的識別規(guī)則相匹配時,所述S103為所述網(wǎng)絡(luò)言論自動標(biāo)注相應(yīng)的標(biāo)識,所述標(biāo)識包括但不限于以下標(biāo)識中的任ー種或多種廣告標(biāo)識、詐騙標(biāo)識、惡意標(biāo)識、反動標(biāo)識、色情標(biāo)識、政治標(biāo)識。S104,根據(jù)預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系,采用與所述網(wǎng)絡(luò)言論的標(biāo)識相對應(yīng)的控制方式對所述網(wǎng)絡(luò)言論進(jìn)行安全控制。具體實現(xiàn)中,所述預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系為任一種標(biāo)識對應(yīng)ー種控制方式,或者,多種標(biāo)識的組合對應(yīng)至少一種控制方式。所述控制方式包括但不限于禁止所述網(wǎng)絡(luò)言論的發(fā)表、封鎖所述網(wǎng)絡(luò)言論的發(fā)起方ID、禁止所述網(wǎng)絡(luò)言論的發(fā)起方ID的所有網(wǎng)絡(luò)言論的發(fā)表、向所述網(wǎng)絡(luò)言論的發(fā)起方發(fā)送警告信息中的任ー種或多種。需要說明的是,標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系可以根據(jù)實際需要進(jìn)行設(shè)定,比如根據(jù)實際需要,可預(yù)設(shè)“廣告標(biāo)識”與“禁止所述網(wǎng)絡(luò)言論的發(fā)表”的控制方式相對應(yīng);也可預(yù)設(shè)“廣告標(biāo)識+惡意標(biāo)識”與“封鎖所述網(wǎng)絡(luò)言論的發(fā)起方ID”的控制方式對應(yīng);還可預(yù)設(shè)“廣告標(biāo)識”與“禁止所述網(wǎng)絡(luò)言論的發(fā)表”及“封鎖所述網(wǎng)絡(luò)言論的發(fā)起方ID”兩種控制方式相對應(yīng),等等,其他情況可類似分析,在此不贅述。所述S104針對不同標(biāo)識的網(wǎng)絡(luò)言論,采用相對應(yīng)的適當(dāng)措施來對該網(wǎng)絡(luò)言論進(jìn)行對抗,有效地阻止了不安全的網(wǎng)絡(luò)言論泛濫,保護(hù)了系統(tǒng)的網(wǎng)絡(luò)言論安全。本發(fā)明實施例可有效地對不安全的網(wǎng)絡(luò)言論進(jìn)行過濾,提高對網(wǎng)絡(luò)言論的安全保護(hù)カ度。請參見圖9,為本發(fā)明的網(wǎng)絡(luò)言論監(jiān)控方法的第二實施例的流程圖;所述方法包括
S201,預(yù)先設(shè)定各種識別規(guī)則,及預(yù)先設(shè)定各種標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系。所述預(yù)設(shè)的識別規(guī)則包括但不限于以下規(guī)則中的任ー種或多種廣告類言論識別規(guī)則、詐騙類言論識別規(guī)則、惡意言論識別規(guī)則、反動類言論識別規(guī)則、色情類言論識別規(guī)貝1J、政治類言論識別規(guī)則。所述S201對各種識別規(guī)則的設(shè)置過程,即為對包含各種識別規(guī) 則的知識庫的構(gòu)建過程,該知識庫的構(gòu)建過程包括各種識別規(guī)則的設(shè)置過程及更新修正過程。下面以中獎詐騙類言論識別規(guī)則為例,來具體說明所述識別規(guī)則的設(shè)置過程和更新修正過程。首先,所述S201從網(wǎng)絡(luò)中獲取大量的中獎詐騙類言論的樣本,比如“恭喜用戶,你獲得了某官方3萬元大獎ー份,請來www. zhongjiang. com領(lǐng)?。?”、“尊敬的用戶,某公司成立10周年慶典活動,有大禮相送,請登錄www. af. com ! ”、“恭喜你,您是第100萬開通農(nóng)場業(yè)務(wù)的用戶,你獲得了某官方贈送精美大禮包ー份,請登錄www. jiangpin. cn領(lǐng)??! ”,等
坐寸ο其次,所述S201上述各種中獎詐騙類言論樣本中提取共有特征,一相同的信息傳達(dá)對象。上述中獎詐騙類的信息傳達(dá)對象都是針對第二人稱的,如“你”、“您”、“用戶”;ニ均帶有與“獎品”相關(guān)或相似的詞,包括“獎品”、“中獎”、“獎金”、“禮物”、“禮品”、“禮包”、“回饋等;三均帶有欺騙性網(wǎng)站的鏈接。再次,所述S201模擬人腦抽象理解一句話關(guān)鍵信息要素的過程,提煉出中獎詐騙類言論的信息要素,表達(dá)如下{某某原因} {你} {中獎了} U青登錄某網(wǎng)姑} {匯款領(lǐng)獎},所述S201提煉得到的信息要素對具有共有特征的不同表現(xiàn)形式的中獎詐騙類言論進(jìn)行了高度概括和抽象。最后,所述S201基于上述提取的共有特征,以及提煉得到的各個信息要素,從中提取出必要的、不可缺失的信息要素抽象出中獎詐騙類言論的識別規(guī)則{中獎詐騙類言論}= {第二人稱}+ {獎品}+ {外網(wǎng)鏈接}。上述過程即為中獎詐騙類言論識別規(guī)則的預(yù)設(shè)過程,該過程是基于對現(xiàn)有出現(xiàn)的中獎詐騙類言論的樣本的指導(dǎo)學(xué)習(xí)形成的??梢岳斫獾氖?,上述過程僅為舉例,其他識別規(guī)則,比如茶葉廣告類言論的識別規(guī)則為{茶葉廣告類言論}= {茶葉}+ {外網(wǎng)鏈接};再如色情類言論的識別規(guī)則為{色情空間}= {空間有}+ {色情}+ {圖,視頻,電影};又如強(qiáng)制別人傳播,否則詛咒別人的惡意言論識別規(guī)則為{強(qiáng)制轉(zhuǎn)發(fā)惡意言論}= {不}+ {傳播該評論}+ {詛咒} + {你,全家};上述各種識別規(guī)則的形成過程可類似分析,在此不贅述?;趯ΜF(xiàn)有出現(xiàn)的各種不安全網(wǎng)絡(luò)言論的樣本的指導(dǎo)學(xué)習(xí),形成各種識別規(guī)則,所述S201將所有的識別規(guī)則聚集,即構(gòu)建得到包含識別規(guī)則集合的知識庫{中獎詐騙類言論}= {{廣告類言論識別規(guī)則}、{詐騙類言論識別規(guī)則}、{悪意言論識別規(guī)則}、{反動類言論識別規(guī)則}、{色情類言論識別規(guī)則}、{政治類言論識別規(guī)則}……}。需要說明的是,隨著各種不安全的網(wǎng)絡(luò)言論的變種,所述預(yù)設(shè)的識別規(guī)則也會根據(jù)不斷的指導(dǎo)學(xué)習(xí)過程進(jìn)行不斷更新和修正,該知識庫也相應(yīng)的進(jìn)行不斷更新和修正,該更新修正過程與上述識別規(guī)則的形成過程類似,在此不贅述。構(gòu)建好所述知識庫后,所述S201需要將其轉(zhuǎn)化為所述網(wǎng)絡(luò)言論監(jiān)控設(shè)備能夠識別的命令邏輯,由網(wǎng)絡(luò)言論監(jiān)控設(shè)備執(zhí)行該命令邏輯來完成對預(yù)設(shè)的識別規(guī)則的應(yīng)用。依上述例子,基于預(yù)設(shè)的中獎詐騙類言論識別規(guī)則,其命令邏輯如下
Function knowledgebase. Label (,comment)// 自動你注邏輯
{
Foreach rule in knowledgebase //對預(yù)設(shè)的所有識別規(guī)則進(jìn)行逐一識別
{
If rule. Recognize (comment) ; then // 如果某規(guī)則識別了短句 comment got rule. Label//為短句標(biāo)注規(guī)則對應(yīng)的標(biāo)識
Endif
}
}
Function rule. Recognize (comment)// 識別規(guī)則的識別邏輯
{
IF comment. Contains {第二人稱} && comment Contains {獎品} && commentContains {外網(wǎng)鏈接};then
//判斷該網(wǎng)絡(luò)言論是否匹配了識別規(guī)則包含的所有信息要素 Return rule recognize this comment //信息要素全部包含,則該網(wǎng)絡(luò)言論與該識別規(guī)則相匹配 Else
Return rule do not recognize this comment
//該網(wǎng)絡(luò)言論與該識別規(guī)則不匹配
Endif
}
Function comment. Contains {第二人稱}//信息要素的識別邏輯
{
If (comment. Contains keyword 你 | | comment. Contains Keyword 您 | |comment. Contains keyword 〃用戶 〃 )then
//短句評論是否含有信息要素的具體化內(nèi)容特征
Return comment contain {第二人稱} //短句含有{第二人稱}信息 Else
Return comment do not contain i 弟二人稱}
Endif
}S202,接收客戶端發(fā)送的用戶發(fā)表的網(wǎng)絡(luò)言論,或接收業(yè)務(wù)服務(wù)器上報的用戶發(fā)表的網(wǎng)絡(luò)言論。本實施例中,所述S202與上一實施例中的SlOl的步驟類似,在此不贅述。S203,解析所述網(wǎng)絡(luò)言論,獲得至少ー個獨(dú)立的短句。所謂短句,指采用高度提煉的短語或一句話表達(dá)一個觀點(diǎn)或主題。用戶通過客戶端發(fā)布網(wǎng)絡(luò)言論,該網(wǎng)絡(luò)言論可以是ー長段的言論(多個獨(dú)立的短句構(gòu)成),也可以為ー個短句。當(dāng)所述網(wǎng)絡(luò)言論為ー個短句時,所述S203直接獲得該短句;當(dāng)所述網(wǎng)絡(luò)言論為ー長段的言論時,所述S203對該長段的言論進(jìn)行分割,獲得多個獨(dú)立的短句,所述S203對長段言論的分割方式可以為基于標(biāo)點(diǎn)符號的分割方式,即按照標(biāo)點(diǎn)符號進(jìn)行分割獲得短句;基于統(tǒng)計規(guī)律進(jìn)行分割,即按照短句平均的長度對長段的言論進(jìn)行分割;等等。S204,對所述短句進(jìn)行識別,判斷所述短句是否與所述預(yù)設(shè)的識別規(guī)則相匹配;若判斷結(jié)果為是,轉(zhuǎn)入S205 ;否則,結(jié)束。 所述S204基于所述預(yù)設(shè)的識別規(guī)則對所述S203獲得的各個短句進(jìn)行識別,具體地,所述S204通過所述S201中的命令邏輯來進(jìn)行識別判斷。S205,若判斷結(jié)果為是,為所述短句標(biāo)注相應(yīng)的標(biāo)識。當(dāng)所述S204判斷短句與預(yù)設(shè)的識別規(guī)則相匹配時,所述S205通過執(zhí)行上ー實施例中的命令邏輯,自動對該匹配的網(wǎng)絡(luò)言論標(biāo)注所述預(yù)設(shè)的中獎詐騙類言論的識別規(guī)則對應(yīng)的標(biāo)識,如中獎詐騙標(biāo)識。需要說明的是,若所述S204的判斷結(jié)果為否,表明所述網(wǎng)絡(luò)言論為正常的言論,則采用正常的業(yè)務(wù)邏輯對該網(wǎng)絡(luò)言論進(jìn)行處理,此過程與現(xiàn)有技術(shù)相同,在此不贅述。本實施例中,所述S203-S205為上ー實施例的S102-S103的具體細(xì)化步驟。S206,根據(jù)預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系,采用與所述網(wǎng)絡(luò)言論的標(biāo)識相對應(yīng)的控制方式對所述網(wǎng)絡(luò)言論進(jìn)行安全控制。本實施例中,所述S206與上一實施例的S104的步驟相同,在此不贅述。本發(fā)明實施例可有效地對不安全的網(wǎng)絡(luò)言論進(jìn)行理解識別和過濾,提高對網(wǎng)絡(luò)言論的安全保護(hù)カ度。通過上述實施例的描述,本發(fā)明實施例采用預(yù)設(shè)的識別規(guī)則對用戶發(fā)表的網(wǎng)絡(luò)言論進(jìn)行識別和判斷,當(dāng)判斷所述網(wǎng)絡(luò)言論與預(yù)設(shè)的識別規(guī)則相匹配吋,自動為該網(wǎng)絡(luò)言論標(biāo)注相應(yīng)的標(biāo)識,并采用與該標(biāo)識相對應(yīng)的控制方式進(jìn)行安全控制,基于該識別規(guī)則對網(wǎng)絡(luò)言論進(jìn)行監(jiān)控,可有效過濾掉不安全的網(wǎng)絡(luò)言論,提高對網(wǎng)絡(luò)言論的安全保護(hù)カ度;另夕卜,本發(fā)明實施例的網(wǎng)絡(luò)監(jiān)控所基于的預(yù)設(shè)的識別規(guī)則,是從網(wǎng)絡(luò)中各種不安全網(wǎng)絡(luò)言論的樣本的指導(dǎo)學(xué)習(xí)過程中提煉而成,能夠有效地對各種不安全網(wǎng)絡(luò)言論進(jìn)行理解識別,有利于提高網(wǎng)絡(luò)言論安全的監(jiān)控カ度。本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以通過計算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲于一計算機(jī)可讀取存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory, ROM)或隨機(jī)存儲記憶體(Random AccessMemory, RAM)等。以上所揭露的僅為本發(fā)明較佳實施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例的全部或部分流程,并依本發(fā)明權(quán)利要 求所作的等同變化,仍屬于發(fā)明所涵蓋的范圍。
權(quán)利要求
1.一種網(wǎng)絡(luò)言論監(jiān)控方法,其特征在于,包括 獲取用戶發(fā)表的網(wǎng)絡(luò)言論; 判斷所述網(wǎng)絡(luò)言論是否與預(yù)設(shè)的識別規(guī)則相匹配,若判斷結(jié)果為是,為所述網(wǎng)絡(luò)言論標(biāo)注相應(yīng)的標(biāo)識; 根據(jù)預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系,采用與所述網(wǎng)絡(luò)言論的標(biāo)識相對應(yīng)的控制方式對所述網(wǎng)絡(luò)言論進(jìn)行安全控制。
2.如權(quán)利要求I所述的方法,其特征在于,所述獲取用戶發(fā)表的網(wǎng)絡(luò)言論包括 接收客戶端發(fā)送的用戶發(fā)表的網(wǎng)絡(luò)言論;或者, 接收業(yè)務(wù)服務(wù)器上報的用戶發(fā)表的網(wǎng)絡(luò)言論; 其中,所述網(wǎng)絡(luò)言論包括微博留言、微博評論、微博回復(fù)、論壇留言、論壇評論、留言板留言、日志評論及博客留言中的任ー種或多種。
3.如權(quán)利要求I所述的方法,其特征在于,所述判斷所述網(wǎng)絡(luò)言論是否與預(yù)設(shè)的識別規(guī)則相匹配,若判斷結(jié)果為是,為所述網(wǎng)絡(luò)言論標(biāo)注相應(yīng)的標(biāo)識,包括 解析所述網(wǎng)絡(luò)言論,獲得至少ー個獨(dú)立的短句; 對所述短句進(jìn)行識別,判斷所述短句是否與所述預(yù)設(shè)的識別規(guī)則相匹配; 若判斷結(jié)果為是,為所述短句標(biāo)注相應(yīng)的標(biāo)識。
4.如權(quán)利要求3所述的方法,其特征在于,所述解析所述網(wǎng)絡(luò)言論,獲得至少ー個獨(dú)立的短句,包括 基于標(biāo)點(diǎn)符號對所述網(wǎng)絡(luò)言論進(jìn)行分割,獲得至少ー個獨(dú)立的短句;或者, 基于短句長度的統(tǒng)計規(guī)律對所述網(wǎng)絡(luò)言論進(jìn)行分割,獲得至少ー個獨(dú)立的短句。
5.如權(quán)利要求1-4任一項所述的方法,其特征在于,所述獲取用戶發(fā)表的網(wǎng)絡(luò)言論之前,還包括 預(yù)先設(shè)定各種識別規(guī)則,及預(yù)先設(shè)定各種標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系; 所述預(yù)設(shè)的識別規(guī)則包括以下規(guī)則中的任ー種或多種廣告類言論識別規(guī)則、詐騙類言論識別規(guī)則、惡意言論識別規(guī)則、反動類言論識別規(guī)則、色情類言論識別規(guī)則、政治類言論識別規(guī)則; 所述標(biāo)識包括以下標(biāo)識中的任ー種或多種廣告標(biāo)識、詐騙標(biāo)識、惡意標(biāo)識、反動標(biāo)識、色情標(biāo)識、政治標(biāo)識; 所述控制方式包括禁止所述網(wǎng)絡(luò)言論的發(fā)表、封鎖所述網(wǎng)絡(luò)言論的發(fā)起方ID、禁止所述網(wǎng)絡(luò)言論的發(fā)起方ID的所有網(wǎng)絡(luò)言論的發(fā)表、向所述網(wǎng)絡(luò)言論的發(fā)起方發(fā)送警告信息中的任ー種或多種; 所述預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系為任一種標(biāo)識對應(yīng)ー種控制方式,或者,多種標(biāo)識的組合對應(yīng)至少一種控制方式。
6.如權(quán)利要求5所述的方法,其特征在于,所述預(yù)先設(shè)定各種識別規(guī)則,包括 從網(wǎng)絡(luò)中獲取各種不安全網(wǎng)絡(luò)言論的樣本; 從所述樣本中提取每種不安全網(wǎng)絡(luò)言論的共有特征,并從所述樣本中提煉每種不安全網(wǎng)絡(luò)言論的必要信息要素; 根據(jù)每種不安全網(wǎng)絡(luò)言論的共有特征和必要信息要素,生成每種不安全網(wǎng)絡(luò)言論的識別規(guī)則。
7.—種網(wǎng)絡(luò)言論監(jiān)控設(shè)備,其特征在于,包括 獲取模塊,用于獲取用戶發(fā)表的網(wǎng)絡(luò)言論; 標(biāo)注模塊,用于判斷所述獲取模塊獲取的所述網(wǎng)絡(luò)言論是否與預(yù)設(shè)的識別規(guī)則相匹配,當(dāng)判斷結(jié)果為是時,為所述網(wǎng)絡(luò)言論標(biāo)注相應(yīng)的標(biāo)識; 安全控制模塊,用于根據(jù)預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系,采用與所述標(biāo)注模塊為所述網(wǎng)絡(luò)言論標(biāo)注的標(biāo)識相對應(yīng)的控制方式對所述網(wǎng)絡(luò)言論進(jìn)行安全控制。
8.如權(quán)利要求7所述的設(shè)備,其特征在于,所述獲取模塊接收客戶端發(fā)送的用戶發(fā)表的網(wǎng)絡(luò)言論;或者,所述獲取模塊接收業(yè)務(wù)服務(wù)器上報的用戶發(fā)表的網(wǎng)絡(luò)言論; 其中,所述網(wǎng)絡(luò)言論包括微博留言、微博評論、微博回復(fù)、論壇留言、論壇評論、留言板留言、日志評論及博客留言中的任ー種或多種。
9.如權(quán)利要求7所述的設(shè)備,其特征在于,所述標(biāo)注模塊包括 解析単元,用于解析所述網(wǎng)絡(luò)言論,獲得至少ー個獨(dú)立的短句; 識別判斷単元,用于對所述解析單元獲得的短句進(jìn)行識別,判斷所述短句是否與所述預(yù)設(shè)的識別規(guī)則相匹配; 標(biāo)注單元,用于當(dāng)所述識別判斷単元判斷結(jié)果為是時,為所述短句標(biāo)注相應(yīng)的標(biāo)識。
10.如權(quán)利要求9所述的設(shè)備,其特征在于,所述解析単元基于標(biāo)點(diǎn)符號對所述網(wǎng)絡(luò)言論進(jìn)行分割,獲得至少ー個獨(dú)立的短句;或者,基于短句長度的統(tǒng)計規(guī)律對所述網(wǎng)絡(luò)言論進(jìn)行分割,獲得至少ー個獨(dú)立的短句。
11.如權(quán)利要求7所述的設(shè)備,其特征在于,還包括 存儲模塊,用于存儲預(yù)先設(shè)定的各種識別規(guī)則,及預(yù)先設(shè)定的各種標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系; 所述預(yù)設(shè)的識別規(guī)則包括以下規(guī)則中的任ー種或多種廣告類言論識別規(guī)則、詐騙類言論識別規(guī)則、惡意言論識別規(guī)則、反動類言論識別規(guī)則、色情類言論識別規(guī)則、政治類言論識別規(guī)則; 所述標(biāo)識包括以下標(biāo)識中的任ー種或多種廣告標(biāo)識、詐騙標(biāo)識、惡意標(biāo)識、反動標(biāo)識、色情標(biāo)識、政治標(biāo)識; 所述控制方式包括禁止所述網(wǎng)絡(luò)言論的發(fā)表、封鎖所述網(wǎng)絡(luò)言論的發(fā)起方ID、禁止所述網(wǎng)絡(luò)言論的發(fā)起方ID的所有網(wǎng)絡(luò)言論的發(fā)表、向所述網(wǎng)絡(luò)言論的發(fā)起方發(fā)送警告信息中的任ー種或多種; 所述預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系為任一種標(biāo)識對應(yīng)ー種控制方式,或者,多種標(biāo)識的組合對應(yīng)至少一種控制方式。
12.—種網(wǎng)絡(luò)言論監(jiān)控系統(tǒng),其特征在于,包括如權(quán)利要求7-11任一項所述的網(wǎng)絡(luò)言論監(jiān)控設(shè)備。
全文摘要
本發(fā)明實施例公開了一種網(wǎng)絡(luò)言論監(jiān)控方法,包括獲取用戶發(fā)表的網(wǎng)絡(luò)言論;判斷所述網(wǎng)絡(luò)言論是否與預(yù)設(shè)的識別規(guī)則相匹配,若判斷結(jié)果為是,為所述網(wǎng)絡(luò)言論標(biāo)注相應(yīng)的標(biāo)識;根據(jù)預(yù)設(shè)的標(biāo)識與控制方式的邏輯對應(yīng)關(guān)系,采用與所述網(wǎng)絡(luò)言論的標(biāo)識相對應(yīng)的控制方式對所述網(wǎng)絡(luò)言論進(jìn)行安全控制。本發(fā)明實施例還公開了一種網(wǎng)絡(luò)言論監(jiān)控設(shè)備及系統(tǒng)。采用本發(fā)明,可有效地對不安全的網(wǎng)絡(luò)言論進(jìn)行過濾,提高對網(wǎng)絡(luò)言論的安全保護(hù)力度。
文檔編號H04L12/26GK102694673SQ20111007325
公開日2012年9月26日 申請日期2011年3月25日 優(yōu)先權(quán)日2011年3月25日
發(fā)明者何曄 申請人:騰訊科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1