亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

不良網(wǎng)頁(yè)檢測(cè)方法及裝置的制作方法

文檔序號(hào):8003246閱讀:263來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):不良網(wǎng)頁(yè)檢測(cè)方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)安全技術(shù),尤其涉及一種不良網(wǎng)頁(yè)檢測(cè)方法及裝置。
技術(shù)背景
互聯(lián)網(wǎng)技術(shù)的突飛猛進(jìn)推動(dòng)了信息社會(huì)的不斷發(fā)展,互聯(lián)網(wǎng)已經(jīng)成為社會(huì)活動(dòng)必不可少的一部分。但是,互聯(lián)網(wǎng)也成為了色情等不良信息傳播的媒介,嚴(yán)重影響網(wǎng)民、特別是青少年對(duì)互聯(lián)網(wǎng)的正常應(yīng)用,阻礙互聯(lián)網(wǎng)健康有序的發(fā)展。
對(duì)色情網(wǎng)站等不良網(wǎng)站的檢測(cè),關(guān)鍵詞過(guò)濾是一種簡(jiǎn)單、易于實(shí)現(xiàn),且容易進(jìn)行分布式處理的互聯(lián)網(wǎng)色情信息檢測(cè)技術(shù),被廣泛應(yīng)用。但純粹依賴(lài)關(guān)鍵詞進(jìn)行不良網(wǎng)站的檢測(cè)會(huì)造成對(duì)眾多網(wǎng)站的誤檢,檢測(cè)效果不佳。發(fā)明內(nèi)容
本發(fā)明提供一種不良網(wǎng)頁(yè)檢測(cè)方法及裝置,以提高對(duì)不良網(wǎng)頁(yè)的檢測(cè)效果。
本發(fā)明第一個(gè)方面提供一種不良網(wǎng)頁(yè)檢測(cè)方法,包括
根據(jù)不良關(guān)鍵詞獲取所述不良關(guān)鍵詞對(duì)應(yīng)的疑似不良網(wǎng)頁(yè),獲取所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址,生成包含有所述原始地址的不良網(wǎng)址列表;
對(duì)所述疑似不良網(wǎng)頁(yè)進(jìn)行解析,生成解析結(jié)果;
當(dāng)根據(jù)所述解析結(jié)果識(shí)別出所述疑似不良網(wǎng)頁(yè)中存在惡意跳轉(zhuǎn)時(shí),將所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
本發(fā)明另一個(gè)方面提供一種不良網(wǎng)頁(yè)檢測(cè)裝置,其特征在于,包括
不良網(wǎng)址列表生成模塊,用于根據(jù)不良關(guān)鍵詞獲取所述不良關(guān)鍵詞對(duì)應(yīng)的疑似不良網(wǎng)頁(yè),獲取所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址,生成包含有所述原始地址的不良網(wǎng)址列表;
解析模塊,用于對(duì)所述疑似不良網(wǎng)頁(yè)進(jìn)行解析,生成解析結(jié)果;
第一刪除模塊,用于當(dāng)根據(jù)所述解析結(jié)果識(shí)別出所述疑似不良網(wǎng)頁(yè)中存在惡意跳轉(zhuǎn)時(shí),將所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
由上述技術(shù)方案可知,本發(fā)明第一個(gè)方面提供的不良網(wǎng)頁(yè)檢測(cè)方法,根據(jù)不良關(guān)鍵詞獲取不良關(guān)鍵詞對(duì)應(yīng)的疑似不良網(wǎng)頁(yè),獲取疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址,生成包含有原始地址的不良網(wǎng)址列表,對(duì)疑似不良網(wǎng)頁(yè)進(jìn)行解析,若疑似不良網(wǎng)頁(yè)中存在惡意跳轉(zhuǎn), 則將疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。由于對(duì)通過(guò)不良關(guān)鍵詞獲取的疑似不良網(wǎng)頁(yè)進(jìn)行了進(jìn)一步地分析,排除了存在惡意跳轉(zhuǎn)的網(wǎng)頁(yè),提高了對(duì)不良網(wǎng)頁(yè)的檢測(cè)效果。
本發(fā)明另一個(gè)方面提供的不良網(wǎng)頁(yè)檢測(cè)裝置,不良網(wǎng)址列表生成模塊根據(jù)不良關(guān)鍵詞獲取不良關(guān)鍵詞對(duì)應(yīng)的疑似不良網(wǎng)頁(yè),獲取疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址,生成包含有原始地址的不良網(wǎng)址列表,解析模塊對(duì)疑似不良網(wǎng)頁(yè)進(jìn)行解析,若疑似不良網(wǎng)頁(yè)中存在惡意跳轉(zhuǎn),則第一刪除模塊將疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。由于對(duì)通過(guò)不良關(guān)鍵詞獲取的疑似不良網(wǎng)頁(yè)進(jìn)行了進(jìn)一步地分析,排除了存在惡意跳轉(zhuǎn)的網(wǎng)頁(yè),提高了對(duì)不良網(wǎng)頁(yè)的檢測(cè)效果。


圖1為本發(fā)明實(shí)施例一提供的不良網(wǎng)頁(yè)檢測(cè)方法流程圖2為本發(fā)明實(shí)施例二提供的不良網(wǎng)頁(yè)檢測(cè)方法流程圖3為本發(fā)明實(shí)施例三提供的不良網(wǎng)頁(yè)檢測(cè)裝置結(jié)構(gòu)示意圖4為本發(fā)明實(shí)施例四提供的不良網(wǎng)頁(yè)檢測(cè)裝置結(jié)構(gòu)示意圖。
具體實(shí)施方式
實(shí)施例一
圖1為本發(fā)明實(shí)施例一提供的不良網(wǎng)頁(yè)檢測(cè)方法流程圖。如圖1所示,本實(shí)施例提供的不良網(wǎng)頁(yè)檢測(cè)方法具體可以應(yīng)用于對(duì)不良網(wǎng)站的檢測(cè),不良網(wǎng)站具體可以包括色情、 賭博、暴力以及反動(dòng)等網(wǎng)站。可以通過(guò)不良網(wǎng)頁(yè)檢測(cè)裝置來(lái)執(zhí)行,該不良網(wǎng)頁(yè)檢測(cè)裝置具體可以通過(guò)軟和/或硬件的方式來(lái)實(shí)現(xiàn)。
本實(shí)施例提供的不良網(wǎng)頁(yè)檢測(cè)方法具體包括
步驟10、根據(jù)不良關(guān)鍵詞獲取不良關(guān)鍵詞對(duì)應(yīng)的疑似不良網(wǎng)頁(yè),獲取疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址,生成包含有原始地址的不良網(wǎng)址列表;
具體地,不良關(guān)鍵詞可以包括涉黃詞匯等不良信息,可以通過(guò)搜索引擎對(duì)不良關(guān)鍵詞進(jìn)行搜索,以獲取不良關(guān)鍵詞對(duì)應(yīng)的疑似不良網(wǎng)頁(yè),即疑似不良網(wǎng)頁(yè)中包含有該不良關(guān)鍵詞。不良關(guān)鍵詞可以根據(jù)具體的檢測(cè)需要來(lái)設(shè)置。疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址即為通過(guò)搜索引擎被不良關(guān)鍵詞進(jìn)行搜索時(shí),搜索到的網(wǎng)頁(yè)所顯示的地址,但是該疑似不良網(wǎng)頁(yè)在加載過(guò)程中可能會(huì)發(fā)生跳轉(zhuǎn)。該跳轉(zhuǎn)可以是Jav必cript跳轉(zhuǎn),Meta跳轉(zhuǎn)和統(tǒng)一資源定位符(Uniform/Universal Resource Locator,簡(jiǎn)稱(chēng)URL)跳轉(zhuǎn),則跳轉(zhuǎn)到的地址即為目標(biāo)地址。將搜索到的疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址記錄形成不良網(wǎng)址列表。
步驟20、對(duì)疑似不良網(wǎng)頁(yè)進(jìn)行解析,生成解析結(jié)果;
具體地,可以對(duì)疑似不良網(wǎng)頁(yè)的源代碼和動(dòng)態(tài)腳本等進(jìn)行解析,動(dòng)態(tài)腳本通常為 JavaScript腳本。Javakript腳本既包含網(wǎng)頁(yè)內(nèi)的Javakript腳本,也包含嵌入的外部 JavaScript Ρ*。
步驟30、當(dāng)根據(jù)解析結(jié)果識(shí)別出疑似不良網(wǎng)頁(yè)中存在惡意跳轉(zhuǎn)時(shí),將疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。
具體地,若疑似不良網(wǎng)頁(yè)中存在JavMcript跳轉(zhuǎn),即該跳轉(zhuǎn)行為是通過(guò) Jav必cript行為實(shí)現(xiàn)的,則該跳轉(zhuǎn)為網(wǎng)頁(yè)跳轉(zhuǎn)作弊,即惡意跳轉(zhuǎn)。通常網(wǎng)頁(yè)跳轉(zhuǎn)作弊行為的網(wǎng)站不是色情、賭博等網(wǎng)站,可以將存在惡意跳轉(zhuǎn)的疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。
本實(shí)施例提供的不良網(wǎng)頁(yè)檢測(cè)方法,根據(jù)不良關(guān)鍵詞獲取不良關(guān)鍵詞對(duì)應(yīng)的疑似不良網(wǎng)頁(yè),獲取疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址,生成包含有原始地址的不良網(wǎng)址列表,對(duì)疑似不良網(wǎng)頁(yè)進(jìn)行解析,若疑似不良網(wǎng)頁(yè)中存在惡意跳轉(zhuǎn),則將疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。由于對(duì)通過(guò)不良關(guān)鍵詞獲取的疑似不良網(wǎng)頁(yè)進(jìn)行了進(jìn)一步地分析,排除了存在惡意跳轉(zhuǎn)的網(wǎng)頁(yè),提高了對(duì)不良網(wǎng)頁(yè)的檢測(cè)效果。
實(shí)施例二
圖2為本發(fā)明實(shí)施例二提供的不良網(wǎng)頁(yè)檢測(cè)方法流程圖。如圖2所示,本實(shí)施例提供的不良網(wǎng)頁(yè)檢測(cè)方法在實(shí)施例一的基礎(chǔ)上,進(jìn)一步地,步驟20,對(duì)疑似不良網(wǎng)頁(yè)進(jìn)行解析,生成解析結(jié)果之后,還可以包括如下步驟
步驟40、當(dāng)根據(jù)解析結(jié)果識(shí)別出疑似不良網(wǎng)頁(yè)中存在隱藏作弊時(shí),將疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。
具體地,疑似不良網(wǎng)頁(yè)中存在被隱藏的、人的眼睛無(wú)法直接看到的文字,即為隱藏作弊。通常存在隱藏作弊行為的網(wǎng)站都不是色情、賭博等網(wǎng)站。對(duì)疑似不良網(wǎng)頁(yè)進(jìn)行解析, 若該疑似不良網(wǎng)頁(yè)中存在隱藏作弊,則將該疑似不良網(wǎng)頁(yè)的原始地址從不良網(wǎng)址列表中刪除。通過(guò)對(duì)存在隱藏作弊的網(wǎng)頁(yè)的檢測(cè),可以進(jìn)一步提高對(duì)不良網(wǎng)頁(yè)檢測(cè)的準(zhǔn)確性。
進(jìn)一步地,步驟20,對(duì)疑似不良網(wǎng)頁(yè)進(jìn)行解析,生成解析結(jié)果之后,還可以包括如下步驟
步驟50、當(dāng)根據(jù)解析結(jié)果識(shí)別出疑似不良網(wǎng)頁(yè)中存在的預(yù)設(shè)共現(xiàn)詞的數(shù)量超過(guò)預(yù)設(shè)閾值時(shí),將疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。
疑似不良網(wǎng)頁(yè)是基于一系列不良關(guān)鍵詞過(guò)濾所得,這樣導(dǎo)致了相當(dāng)數(shù)量的正規(guī)成人網(wǎng)站、美容類(lèi)網(wǎng)站和醫(yī)療類(lèi)網(wǎng)站等進(jìn)入該疑似數(shù)據(jù)集,本實(shí)施例進(jìn)行共現(xiàn)詞分析,共現(xiàn)詞可以包括“價(jià)格”、“熱線(xiàn)”、“電話(huà)”、“促銷(xiāo)”、“醫(yī)院”、“公司”、“整形”、“銷(xiāo)售”、“專(zhuān)家”等,若疑似不良網(wǎng)頁(yè)中包含的上述共現(xiàn)詞的數(shù)量超過(guò)預(yù)設(shè)閾值,則可以認(rèn)為該網(wǎng)頁(yè)不是不良網(wǎng)頁(yè), 則將該網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。通過(guò)共現(xiàn)詞對(duì)疑似不良網(wǎng)頁(yè)進(jìn)行進(jìn)一步地的過(guò)濾,可以進(jìn)一步提高對(duì)不良網(wǎng)頁(yè)檢測(cè)的準(zhǔn)確性。
在本實(shí)施例中,步驟30,當(dāng)根據(jù)解析結(jié)果識(shí)別出疑似不良網(wǎng)頁(yè)中存在惡意跳轉(zhuǎn)時(shí), 將疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除,具體可以包括如下步驟
當(dāng)根據(jù)解析結(jié)果識(shí)別出在允許動(dòng)態(tài)腳本執(zhí)行狀態(tài)下疑似不良網(wǎng)頁(yè)的目標(biāo)地址對(duì)應(yīng)的域名與在禁止動(dòng)態(tài)腳本執(zhí)行狀態(tài)下疑似不良網(wǎng)頁(yè)的目標(biāo)地址對(duì)應(yīng)的域名不同時(shí),將疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。
具體地,對(duì)Jav必cript腳本進(jìn)行解析,可以通過(guò)匹配以下字符串“window, location, href ">"window. navigate,,、"self, location,,禾口"top. location,,,角軍析出重新定位的URL,即目標(biāo)地址。進(jìn)一步將URL映射到域名,例如URL為http //sports, sina. com. cn/basket2010/,該URL對(duì)應(yīng)的域名為sina. com. cn。在實(shí)際網(wǎng)頁(yè)解析過(guò)程中,可以通過(guò)如下代碼對(duì)惡意跳轉(zhuǎn)進(jìn)行檢測(cè)
if (destDomain(EnableJS) = domainName) {不存在惡意跳轉(zhuǎn); }else if (destDomain(EnableJS) !=destDomain(DisableJS)){存在惡意跳轉(zhuǎn); }else{不存在惡意跳轉(zhuǎn);}
其中,domainName、destDomain(EnableJS)禾口 destDomain(DisableJS)分另Ij表示原始地址對(duì)應(yīng)的原始域名、允許動(dòng)態(tài)腳本執(zhí)行狀態(tài)下的目標(biāo)地址對(duì)應(yīng)的域名和禁止動(dòng)態(tài)執(zhí)行狀態(tài)下的目標(biāo)地址對(duì)應(yīng)的域名。當(dāng)destDomain(EnableJS)與destDomain(DisableJS) 不同時(shí),說(shuō)明存在惡意跳轉(zhuǎn)。
在本實(shí)施例中,步驟40中的識(shí)別出疑似不良網(wǎng)頁(yè)中存在隱藏作弊具體可以包括下述至少一種
當(dāng)識(shí)別到疑似不良網(wǎng)頁(yè)的可視范圍外存在不良關(guān)鍵詞時(shí),確定識(shí)別出疑似不良網(wǎng)頁(yè)中存在隱藏作弊;
當(dāng)識(shí)別到疑似不良網(wǎng)頁(yè)的快速滾動(dòng)內(nèi)容中存在不良關(guān)鍵詞時(shí),確定識(shí)別出疑似不良網(wǎng)頁(yè)中存在隱藏作弊;
當(dāng)識(shí)別到疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的級(jí)聯(lián)樣式表隱藏內(nèi)容中存在不良關(guān)鍵詞時(shí),確定識(shí)別出疑似不良網(wǎng)頁(yè)中存在隱藏作弊;
當(dāng)識(shí)別到疑似不良網(wǎng)頁(yè)中的不良關(guān)鍵詞的顏色與疑似不良網(wǎng)頁(yè)的背景顏色相同時(shí),確定識(shí)別出疑似不良網(wǎng)頁(yè)中存在隱藏作弊。
其中,對(duì)疑似不良網(wǎng)頁(yè)的可視范圍外存在不良關(guān)鍵詞的檢測(cè),可以對(duì)不良關(guān)鍵詞對(duì)應(yīng)的超文本標(biāo)記語(yǔ)言(Hypertext Markup Language,簡(jiǎn)稱(chēng)HTML)標(biāo)簽進(jìn)行分析,若top或 left等屬性的值為負(fù)數(shù),則說(shuō)明該疑似不良網(wǎng)頁(yè)的可視范圍外存在不良關(guān)鍵詞。
對(duì)疑似不良網(wǎng)頁(yè)的快速滾動(dòng)內(nèi)容中存在不良關(guān)鍵詞的檢測(cè),首先解析網(wǎng)頁(yè)中有無(wú)存在用于指示文字滾動(dòng)的關(guān)鍵字Marquee,若存在該關(guān)鍵字且該關(guān)鍵字對(duì)應(yīng)的文字內(nèi)容中存在不良關(guān)鍵詞,則對(duì)根據(jù)延時(shí)時(shí)間進(jìn)行判斷,若延時(shí)時(shí)間很短,以致肉眼無(wú)法看清文字, 則可以判定該疑似不良網(wǎng)頁(yè)存在包含有不良關(guān)鍵詞的快速滾動(dòng)內(nèi)容。
對(duì)疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的級(jí)聯(lián)樣式表(Cascading Style Sieet,簡(jiǎn)稱(chēng)CSS)隱藏內(nèi)容中存在不良關(guān)鍵詞的檢測(cè),具體可以根據(jù)<div style = " display:none" >或<(1& style ="visibility:hidden〃 >等來(lái)進(jìn)行檢測(cè)。
對(duì)疑似不良網(wǎng)頁(yè)中的不良關(guān)鍵詞的顏色與疑似不良網(wǎng)頁(yè)的背景顏色相同的檢測(cè), 由于網(wǎng)頁(yè)顏色的決定因素眾多,包括HTML、CSS和JavMcript等,可以分別對(duì)上述因素進(jìn)行檢測(cè)。也可以只對(duì)HTML Tag進(jìn)行判斷,對(duì)color元素(包括bgcolor、font color等)進(jìn)行匹配,以不良關(guān)鍵詞的顏色與網(wǎng)頁(yè)背景是否相同,而對(duì)隱藏作弊進(jìn)行檢測(cè),實(shí)現(xiàn)簡(jiǎn)單。
實(shí)施例三
圖3為本發(fā)明實(shí)施例三提供的不良網(wǎng)頁(yè)檢測(cè)裝置結(jié)構(gòu)示意圖。如圖3所示,本實(shí)施例提供的不良網(wǎng)頁(yè)檢測(cè)裝置具體可以實(shí)現(xiàn)本發(fā)明任意實(shí)施例提供的不良網(wǎng)頁(yè)檢測(cè)方法的各個(gè)步驟,此不再贅述。
本實(shí)施例提供的不良網(wǎng)頁(yè)檢測(cè)裝置具體包括不良網(wǎng)址列表生成模塊11、解析模塊 12和第一刪除模塊13。不良網(wǎng)址列表生成模塊11用于根據(jù)不良關(guān)鍵詞獲取不良關(guān)鍵詞對(duì)應(yīng)的疑似不良網(wǎng)頁(yè),獲取疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址,生成包含有原始地址的不良網(wǎng)址列表。解析模塊12用于對(duì)疑似不良網(wǎng)頁(yè)進(jìn)行解析,生成解析結(jié)果。第一刪除模塊13用于當(dāng)根據(jù)解析結(jié)果識(shí)別出疑似不良網(wǎng)頁(yè)中存在惡意跳轉(zhuǎn)時(shí),將疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。
本實(shí)施例提供的不良網(wǎng)頁(yè)檢測(cè)裝置,不良網(wǎng)址列表生成模塊11根據(jù)不良關(guān)鍵詞獲取不良關(guān)鍵詞對(duì)應(yīng)的疑似不良網(wǎng)頁(yè),獲取疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址,生成包含有原始地址的不良網(wǎng)址列表,解析模塊12對(duì)疑似不良網(wǎng)頁(yè)進(jìn)行解析,若疑似不良網(wǎng)頁(yè)中存在惡意跳轉(zhuǎn),則第一刪除模塊13將疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。由于對(duì)通過(guò)不良關(guān)鍵詞獲取的疑似不良網(wǎng)頁(yè)進(jìn)行了進(jìn)一步地分析,排除了存在惡意跳轉(zhuǎn)的網(wǎng)頁(yè),提高了對(duì)不良網(wǎng)頁(yè)的檢測(cè)效果。
實(shí)施例四
圖4為本發(fā)明實(shí)施例四提供的不良網(wǎng)頁(yè)檢測(cè)裝置結(jié)構(gòu)示意圖。如圖4所示,在本實(shí)施例中,不良網(wǎng)頁(yè)檢測(cè)裝置具體還可以包括第二刪除模塊14,第二刪除模塊14用于當(dāng)根據(jù)解析結(jié)果識(shí)別出疑似不良網(wǎng)頁(yè)中存在隱藏作弊時(shí),將疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。通過(guò)第二刪除模塊14的設(shè)置,對(duì)存在隱藏作弊的網(wǎng)頁(yè)的檢測(cè),可以進(jìn)一步提高對(duì)不良網(wǎng)頁(yè)檢測(cè)的準(zhǔn)確性。
進(jìn)一步地,在本實(shí)施例中,該不良網(wǎng)頁(yè)檢測(cè)裝置還可以包括第三刪除模塊15。第三刪除模塊15用于當(dāng)根據(jù)解析結(jié)果識(shí)別出疑似不良網(wǎng)頁(yè)中存在的預(yù)設(shè)共現(xiàn)詞的數(shù)量超過(guò)預(yù)設(shè)閾值時(shí),將疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。通過(guò)第三刪除模塊的設(shè)置15,可以通過(guò)共現(xiàn)詞對(duì)疑似不良網(wǎng)頁(yè)進(jìn)行進(jìn)一步地的過(guò)濾,可以進(jìn)一步提高對(duì)不良網(wǎng)頁(yè)檢測(cè)的準(zhǔn)確性。
在本實(shí)施例中,第一刪除模塊13還可以用于當(dāng)根據(jù)解析結(jié)果識(shí)別出在允許動(dòng)態(tài)腳本執(zhí)行狀態(tài)下疑似不良網(wǎng)頁(yè)的目標(biāo)地址對(duì)應(yīng)的域名與在禁止動(dòng)態(tài)腳本執(zhí)行狀態(tài)下疑似不良網(wǎng)頁(yè)的目標(biāo)地址對(duì)應(yīng)的域名不同時(shí),將疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。通過(guò)將允許動(dòng)態(tài)腳本執(zhí)行狀態(tài)下疑似不良網(wǎng)頁(yè)的目標(biāo)地址對(duì)應(yīng)的域名與在禁止動(dòng)態(tài)腳本執(zhí)行狀態(tài)下疑似不良網(wǎng)頁(yè)的目標(biāo)地址對(duì)應(yīng)的域名進(jìn)行比較,可以便捷地檢測(cè)出惡意跳轉(zhuǎn),提高檢測(cè)效率。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過(guò)程序指令相關(guān)的硬件來(lái)完成,前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括R0M、RAM、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。
最后應(yīng)說(shuō)明的是以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。
權(quán)利要求
1.一種不良網(wǎng)頁(yè)檢測(cè)方法,其特征在于,包括根據(jù)不良關(guān)鍵詞獲取所述不良關(guān)鍵詞對(duì)應(yīng)的疑似不良網(wǎng)頁(yè),獲取所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址,生成包含有所述原始地址的不良網(wǎng)址列表;對(duì)所述疑似不良網(wǎng)頁(yè)進(jìn)行解析,生成解析結(jié)果;當(dāng)根據(jù)所述解析結(jié)果識(shí)別出所述疑似不良網(wǎng)頁(yè)中存在惡意跳轉(zhuǎn)時(shí),將所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
2.根據(jù)權(quán)利要求1所述的不良網(wǎng)頁(yè)檢測(cè)方法,其特征在于,對(duì)所述疑似不良網(wǎng)頁(yè)進(jìn)行解析,生成解析結(jié)果之后,還包括當(dāng)根據(jù)所述解析結(jié)果識(shí)別出所述疑似不良網(wǎng)頁(yè)中存在隱藏作弊時(shí),將所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
3.根據(jù)權(quán)利要求1或2所述的不良網(wǎng)頁(yè)檢測(cè)方法,其特征在于,對(duì)所述疑似不良網(wǎng)頁(yè)進(jìn)行解析,生成解析結(jié)果之后,還包括當(dāng)根據(jù)所述解析結(jié)果識(shí)別出所述疑似不良網(wǎng)頁(yè)中存在的預(yù)設(shè)共現(xiàn)詞的數(shù)量超過(guò)預(yù)設(shè)閾值時(shí),將所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
4.根據(jù)權(quán)利要求3所述的不良網(wǎng)頁(yè)檢測(cè)方法,其特征在于,當(dāng)根據(jù)所述解析結(jié)果識(shí)別出所述疑似不良網(wǎng)頁(yè)中存在惡意跳轉(zhuǎn)時(shí),將所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除,包括當(dāng)根據(jù)所述解析結(jié)果識(shí)別出在允許動(dòng)態(tài)腳本執(zhí)行狀態(tài)下所述疑似不良網(wǎng)頁(yè)的目標(biāo)地址對(duì)應(yīng)的域名與在禁止動(dòng)態(tài)腳本執(zhí)行狀態(tài)下所述疑似不良網(wǎng)頁(yè)的目標(biāo)地址對(duì)應(yīng)的域名不同時(shí),將所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
5.根據(jù)權(quán)利要求2所述的不良網(wǎng)頁(yè)檢測(cè)方法,其特征在于,識(shí)別出所述疑似不良網(wǎng)頁(yè)中存在隱藏作弊包括下述至少一種當(dāng)識(shí)別到所述疑似不良網(wǎng)頁(yè)的可視范圍外存在所述不良關(guān)鍵詞時(shí),確定識(shí)別出所述疑似不良網(wǎng)頁(yè)中存在隱藏作弊;當(dāng)識(shí)別到所述疑似不良網(wǎng)頁(yè)的快速滾動(dòng)內(nèi)容中存在所述不良關(guān)鍵詞時(shí),確定識(shí)別出所述疑似不良網(wǎng)頁(yè)中存在隱藏作弊;當(dāng)識(shí)別到所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的級(jí)聯(lián)樣式表隱藏內(nèi)容中存在所述不良關(guān)鍵詞時(shí),確定識(shí)別出所述疑似不良網(wǎng)頁(yè)中存在隱藏作弊;當(dāng)識(shí)別到所述疑似不良網(wǎng)頁(yè)中的所述不良關(guān)鍵詞的顏色與所述疑似不良網(wǎng)頁(yè)的背景顏色相同時(shí),確定識(shí)別出所述疑似不良網(wǎng)頁(yè)中存在隱藏作弊。
6.一種不良網(wǎng)頁(yè)檢測(cè)裝置,其特征在于,包括不良網(wǎng)址列表生成模塊,用于根據(jù)不良關(guān)鍵詞獲取所述不良關(guān)鍵詞對(duì)應(yīng)的疑似不良網(wǎng)頁(yè),獲取所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址,生成包含有所述原始地址的不良網(wǎng)址列表;解析模塊,用于對(duì)所述疑似不良網(wǎng)頁(yè)進(jìn)行解析,生成解析結(jié)果;第一刪除模塊,用于當(dāng)根據(jù)所述解析結(jié)果識(shí)別出所述疑似不良網(wǎng)頁(yè)中存在惡意跳轉(zhuǎn)時(shí),將所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
7.根據(jù)權(quán)利要求6所述的不良網(wǎng)頁(yè)檢測(cè)裝置,其特征在于,還包括第二刪除模塊,用于當(dāng)根據(jù)所述解析結(jié)果識(shí)別出所述疑似不良網(wǎng)頁(yè)中存在隱藏作弊時(shí),將所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
8.根據(jù)權(quán)利要求6或7所述的不良網(wǎng)頁(yè)檢測(cè)裝置,其特征在于,還包括第三刪除模塊,用于當(dāng)根據(jù)所述解析結(jié)果識(shí)別出所述疑似不良網(wǎng)頁(yè)中存在的預(yù)設(shè)共現(xiàn)詞的數(shù)量超過(guò)預(yù)設(shè)閾值時(shí),將所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
9.根據(jù)權(quán)利要求8所述的不良網(wǎng)頁(yè)檢測(cè)裝置,其特征在于所述第一刪除模塊還用于當(dāng)根據(jù)所述解析結(jié)果識(shí)別出在允許動(dòng)態(tài)腳本執(zhí)行狀態(tài)下所述疑似不良網(wǎng)頁(yè)的目標(biāo)地址對(duì)應(yīng)的域名與在禁止動(dòng)態(tài)腳本執(zhí)行狀態(tài)下所述疑似不良網(wǎng)頁(yè)的目標(biāo)地址對(duì)應(yīng)的域名不同時(shí), 將所述疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
全文摘要
本發(fā)明提供一種不良網(wǎng)頁(yè)檢測(cè)方法及裝置,該不良網(wǎng)頁(yè)檢測(cè)方法包括根據(jù)不良關(guān)鍵詞獲取不良關(guān)鍵詞對(duì)應(yīng)的疑似不良網(wǎng)頁(yè),獲取疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址,生成包含有原始地址的不良網(wǎng)址列表;對(duì)疑似不良網(wǎng)頁(yè)進(jìn)行解析,生成解析結(jié)果;當(dāng)根據(jù)解析結(jié)果識(shí)別出疑似不良網(wǎng)頁(yè)中存在惡意跳轉(zhuǎn),則將疑似不良網(wǎng)頁(yè)對(duì)應(yīng)的原始地址從不良網(wǎng)址列表中刪除。本發(fā)明提供的不良網(wǎng)頁(yè)檢測(cè)方法及裝置,由于對(duì)通過(guò)不良關(guān)鍵詞獲取的疑似不良網(wǎng)頁(yè)進(jìn)行了進(jìn)一步地分析,排除了存在惡意跳轉(zhuǎn)的網(wǎng)頁(yè),提高了對(duì)不良網(wǎng)頁(yè)的檢測(cè)效果。
文檔編號(hào)H04L29/06GK102523130SQ201110401720
公開(kāi)日2012年6月27日 申請(qǐng)日期2011年12月6日 優(yōu)先權(quán)日2011年12月6日
發(fā)明者洪博, 王利明, 耿光剛 申請(qǐng)人:中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1