專利名稱:一種用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法、設(shè)備和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)安全,尤其涉及一種用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法、設(shè)備和系統(tǒng)。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,提供各種網(wǎng)絡(luò)服務(wù)的網(wǎng)站大量出現(xiàn),這些網(wǎng)站可能因?yàn)橹T如操作系統(tǒng)漏洞、應(yīng)用程序漏洞、權(quán)限配置之類的問題,而存在各種安全隱患。因此,需要對(duì)這些網(wǎng)站進(jìn)行安全檢測(cè)。一種網(wǎng)站安全檢測(cè)的方式是從網(wǎng)站外部去抓取網(wǎng)站的所有網(wǎng)頁(yè),分析這些網(wǎng)頁(yè)的內(nèi)容是否存在安全隱患。在網(wǎng)站的安全檢測(cè)過程中,需要判斷所抓取的頁(yè)面是真實(shí)的頁(yè)面、還是網(wǎng)址重寫的頁(yè)面。 網(wǎng)址重寫是指在網(wǎng)絡(luò)服務(wù)器上,為了讓網(wǎng)站更容易被訪問并且更容易被搜索引擎收錄,將網(wǎng)址重寫成網(wǎng)站可以處理的另一個(gè)網(wǎng)址的過程。例如,如果原先網(wǎng)址是“WWW.
a.com/UserProf ile. aspx ID=l”,則可以將其重寫為“www. a. com/UserProf ile/1. aspx”這樣的網(wǎng)址。如何準(zhǔn)確判斷頁(yè)面是否是網(wǎng)址重寫頁(yè)面是一大技術(shù)難點(diǎn),現(xiàn)有的網(wǎng)站安全檢測(cè)方法不能判斷出頁(yè)面是否為網(wǎng)址重寫頁(yè)面。而且,網(wǎng)址重寫的方法隨著網(wǎng)站數(shù)量的增加,也在急劇增加,每個(gè)不同的網(wǎng)站都有可能使用不同的網(wǎng)址重寫規(guī)則,也就增加了判斷網(wǎng)址重寫頁(yè)面的規(guī)則的數(shù)量。因此,如何準(zhǔn)確識(shí)別頁(yè)面是正常頁(yè)面還是網(wǎng)址重寫頁(yè)面存在很大的難度。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明,以便提供一種克服上述問題或者至少部分地解決上述問題的用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法以及相應(yīng)的設(shè)備和系統(tǒng)。依據(jù)本發(fā)明的一個(gè)方面,提供了一種用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法,包括以下步驟獲取目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼;獲取與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址所指向的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼;以及根據(jù)所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別、或者所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼、或者所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼與所述目標(biāo)網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼之間的區(qū)別,判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)??蛇x地,在根據(jù)本發(fā)明的實(shí)施例的用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法中,所述獲取目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼的步驟包括訪問所述目標(biāo)網(wǎng)頁(yè)一次或多次,并且保存每次訪問的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼??蛇x地,在根據(jù)本發(fā)明的實(shí)施例的用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法中,所述獲取與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址所指向的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼的步驟包括訪問所述錯(cuò)誤網(wǎng)頁(yè)一次或多次,并且保存每次訪問的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼。
可選地,在根據(jù)本發(fā)明的實(shí)施例的用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法中,所述根據(jù)所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)的步驟包括比較所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容;以及在所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容相同的情況下,將所述目標(biāo)網(wǎng)頁(yè)判斷為網(wǎng)址重寫的網(wǎng)頁(yè);或者在所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容不同的情況下,從所述錯(cuò)誤網(wǎng)頁(yè)與所述目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容中獲取錯(cuò)誤關(guān)鍵字,并且根據(jù)所述錯(cuò)誤關(guān)鍵字來判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)??蛇x地,在根據(jù)本發(fā)明的實(shí)施例的用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法中,所述根據(jù)所述錯(cuò)誤關(guān)鍵字來判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)的步驟包括在所述錯(cuò)誤關(guān)鍵字的長(zhǎng)度小于預(yù)先定義的長(zhǎng)度的情況下,將所述目標(biāo)網(wǎng)頁(yè)判斷為網(wǎng)址重寫的網(wǎng)頁(yè)??蛇x地,在根據(jù)本發(fā)明的實(shí)施例的用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法中,所述從所述錯(cuò)誤網(wǎng)頁(yè)與所述目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容中獲取錯(cuò)誤關(guān)鍵字的步驟包括從保存所述錯(cuò)誤網(wǎng)頁(yè)一次或多次得到的內(nèi)容與保存所述目標(biāo)網(wǎng)頁(yè)一次或多次得到的內(nèi)容中,分別提取每次保存的錯(cuò)誤網(wǎng)頁(yè)與相應(yīng)的目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容;從所述特有的內(nèi)容的交集中提取潛在 錯(cuò)誤關(guān)鍵字;以及獲取出現(xiàn)次數(shù)最多的一個(gè)或多個(gè)潛在錯(cuò)誤關(guān)鍵字作為錯(cuò)誤關(guān)鍵字。可選地,在根據(jù)本發(fā)明的實(shí)施例的用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法中,所述根據(jù)所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)的步驟包括在所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼指示該錯(cuò)誤網(wǎng)頁(yè)的網(wǎng)址不可訪問的情況下,將所述目標(biāo)網(wǎng)頁(yè)判斷為非網(wǎng)址重寫的網(wǎng)頁(yè)??蛇x地,所述與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址是與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的、實(shí)際不存在的網(wǎng)址??蛇x地,所述網(wǎng)址是統(tǒng)一資源定位符。依據(jù)本發(fā)明的另一方面,提供了一種用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的網(wǎng)絡(luò)檢測(cè)設(shè)備,包括網(wǎng)絡(luò)接口,適于獲取目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼、以及與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址所指向的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼。所述網(wǎng)絡(luò)檢測(cè)設(shè)備還包括網(wǎng)址重寫判斷器,適于根據(jù)所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別、或者所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼、或者所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼與所述目標(biāo)網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼之間的區(qū)別,判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)??蛇x地,根據(jù)本發(fā)明的實(shí)施例的所述網(wǎng)絡(luò)檢測(cè)設(shè)備還包括網(wǎng)址構(gòu)造器,適于構(gòu)造與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的、實(shí)際不存在的所述錯(cuò)誤網(wǎng)址,并將所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址和錯(cuò)誤網(wǎng)址發(fā)送給所述網(wǎng)絡(luò)接口??蛇x地,根據(jù)本發(fā)明的實(shí)施例的所述網(wǎng)絡(luò)檢測(cè)設(shè)備還包括網(wǎng)頁(yè)存儲(chǔ)器,適于存儲(chǔ)由所述網(wǎng)絡(luò)接口獲取的目標(biāo)網(wǎng)頁(yè)的內(nèi)容及其對(duì)應(yīng)的狀態(tài)代碼、以及所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼,并提供給所述網(wǎng)址重寫判斷器??蛇x地,在根據(jù)本發(fā)明的實(shí)施例的所述網(wǎng)絡(luò)檢測(cè)設(shè)備中,所述網(wǎng)絡(luò)接口訪問所述目標(biāo)網(wǎng)頁(yè)一次或多次,并且將每次訪問的目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼保存到所述網(wǎng)頁(yè)存儲(chǔ)器中??蛇x地,在根據(jù)本發(fā)明的實(shí)施例的所述網(wǎng)絡(luò)檢測(cè)設(shè)備中,所述網(wǎng)絡(luò)接口訪問所述錯(cuò)誤網(wǎng)頁(yè)一次或多次,并且將每次訪問的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼保存到所述網(wǎng)頁(yè)存儲(chǔ)器中??蛇x地,在根據(jù)本發(fā)明的實(shí)施例的所述網(wǎng)絡(luò)檢測(cè)設(shè)備中,所述網(wǎng)址重寫判斷器包括網(wǎng)頁(yè)內(nèi)容比較器,適于比較所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容;錯(cuò)誤關(guān)鍵字獲取器,適于在所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容不同的情況下,從所述錯(cuò)誤網(wǎng)頁(yè)與所述目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容中獲取錯(cuò)誤關(guān)鍵字;以及網(wǎng)址重寫子判斷器,適于在所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容相同的情況下,將所述目標(biāo)網(wǎng)頁(yè)判斷為網(wǎng)址重寫的網(wǎng)頁(yè),并且在所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容不同的情況下,根據(jù)所述錯(cuò)誤關(guān)鍵字來判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)??蛇x地,在根據(jù)本發(fā)明的實(shí)施例的所述網(wǎng)絡(luò)檢測(cè)設(shè)備中,在所述錯(cuò)誤關(guān)鍵字的長(zhǎng)度小于預(yù)先定義的長(zhǎng)度的情況下,所述網(wǎng)址重寫子判斷器將所述目標(biāo)網(wǎng)頁(yè)判斷為網(wǎng)址重寫的網(wǎng)頁(yè)??蛇x地,在根據(jù)本發(fā)明的實(shí)施例的所述網(wǎng)絡(luò)檢測(cè)設(shè)備中,在所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容·與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容不同的情況下,所述網(wǎng)址重寫子判斷器從保存所述錯(cuò)誤網(wǎng)頁(yè)一次或多次得到的內(nèi)容與保存所述目標(biāo)網(wǎng)頁(yè)一次或多次得到的內(nèi)容中,分別提取每次保存的錯(cuò)誤網(wǎng)頁(yè)與相應(yīng)的目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容;從所述特有的內(nèi)容的交集中提取潛在錯(cuò)誤關(guān)鍵字;并且獲取出現(xiàn)次數(shù)最多的一個(gè)或多個(gè)潛在錯(cuò)誤關(guān)鍵字作為錯(cuò)誤關(guān)鍵字??蛇x地,在根據(jù)本發(fā)明的實(shí)施例的所述網(wǎng)絡(luò)檢測(cè)設(shè)備中,在所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼指示該錯(cuò)誤網(wǎng)頁(yè)的網(wǎng)址不可訪問的情況下,所述網(wǎng)址重寫判斷器將所述目標(biāo)網(wǎng)頁(yè)判斷為非網(wǎng)址重寫的網(wǎng)頁(yè)。可選地,所述與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址是與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的、實(shí)際不存在的網(wǎng)址??蛇x地,所述網(wǎng)址是統(tǒng)一資源定位符。依據(jù)本發(fā)明的又一方面,提供了一種用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的網(wǎng)絡(luò)檢測(cè)系統(tǒng),包括根據(jù)本發(fā)明的實(shí)施例的上述網(wǎng)絡(luò)檢測(cè)設(shè)備、以及一個(gè)或者多個(gè)目標(biāo)服務(wù)器,適于響應(yīng)于所述網(wǎng)絡(luò)檢測(cè)設(shè)備提供的所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址和所述錯(cuò)誤網(wǎng)址,向所述網(wǎng)絡(luò)檢測(cè)設(shè)備提供所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼、以及所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼。本發(fā)明提供了用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法以及相應(yīng)的設(shè)備和系統(tǒng)。根據(jù)本發(fā)明的實(shí)施例,可以利用目標(biāo)網(wǎng)頁(yè)以及與其相對(duì)應(yīng)的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容和狀態(tài)代碼,來準(zhǔn)確有效地判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè),能夠適用于各種形式的網(wǎng)址重寫的網(wǎng)頁(yè)。在網(wǎng)頁(yè)為網(wǎng)址重寫的網(wǎng)頁(yè)的情況下,在網(wǎng)站的安全檢測(cè)過程中,就不再需要對(duì)該網(wǎng)頁(yè)相關(guān)目錄下的鏈接進(jìn)行進(jìn)一步的分析和判斷,可以很大程度地節(jié)省安全檢測(cè)所需要的掃描時(shí)間。而在網(wǎng)頁(yè)為非網(wǎng)址重寫的網(wǎng)頁(yè)時(shí),可以準(zhǔn)確提取錯(cuò)誤關(guān)鍵字以進(jìn)行漏洞判斷,從而減少漏洞誤報(bào)。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式
。
通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中 圖I是根據(jù)本發(fā)明的實(shí)施例的用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法的流程圖;圖2是根據(jù)本發(fā)明的實(shí)施例的根據(jù)錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)的步驟的流程圖;圖3是根據(jù)本發(fā)明的實(shí)施例的用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的網(wǎng)絡(luò)檢測(cè)設(shè)備的框圖;圖4是根據(jù)本發(fā)明的實(shí)施例的網(wǎng)址重寫判斷器的框圖;以及圖5是根據(jù)本發(fā)明的實(shí)施例的用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的網(wǎng)絡(luò)檢測(cè)系統(tǒng)的框圖。
具體實(shí)施例方式下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。圖I示意性地圖示了根據(jù)本發(fā)明的實(shí)施例的用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法100的流程圖。如圖I所示,在根據(jù)本發(fā)明的實(shí)施例的用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法100中,一開始,執(zhí)行步驟SlOl :獲取目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼;接著,執(zhí)行步驟S103 :獲取與目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址所指向的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼;最后,執(zhí)行步驟S105:根據(jù)錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別、或者錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼、或者錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼與目標(biāo)網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼之間的區(qū)別,判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)。根據(jù)本發(fā)明的實(shí)施例,網(wǎng)址例如可以是URL(Uniform ResourceLocator,統(tǒng)一資源定位符),下文中以URL為例進(jìn)行描述,但網(wǎng)址并不僅限于URL,而是可以包括任何標(biāo)識(shí)網(wǎng)站地址的方式。在步驟SlOl中,獲取目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼??蛇x地,可以訪問目標(biāo)網(wǎng)頁(yè)一次或多次,并且保存每次訪問的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼。例如,在訪問目標(biāo)網(wǎng)頁(yè)多次的情況下,可以將多次訪問的內(nèi)容保存為html_okl、html_ok2、*“、html_okn,將這些次訪問結(jié)果的狀態(tài)代碼保存為 http_status_okl、http_status_ok2、…、http_status_okn。接下來,在步驟S103中,獲取與目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址所指向的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼。根據(jù)本發(fā)明的實(shí)施例,與目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址是與目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的、實(shí)際不存在的網(wǎng)址,例如,如果目標(biāo)網(wǎng)頁(yè)的網(wǎng)址是/site/content/1/,則錯(cuò)誤網(wǎng)址則可以是 /site/content/1/neverexistpage??蛇x地,同樣,可以訪問錯(cuò)誤網(wǎng)頁(yè)一次或多次,并且保存每次訪問的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼。例如,在訪問錯(cuò)誤網(wǎng)頁(yè)多次的情況下,可以將多次訪問的內(nèi)容保存為html_err I、html_err 2、…、html_errn,將這些次訪問結(jié)果的狀態(tài)代碼保存為ht tp_s tatus_err I、http_status_err2、…、http_status_errn。隨后,在步驟S105中,可以根據(jù)以下三者之一來判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)(I)錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼、或者(2)錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼與目標(biāo)網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼之間的區(qū)別、或者(3 )錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別。下面分別針對(duì)以上三種情況進(jìn)行描述。第一,可以根據(jù)錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼來判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)。例如,根據(jù)本發(fā)明的實(shí)施例,如果訪問錯(cuò)誤URL的訪問結(jié)果的狀態(tài)代碼指示該錯(cuò)誤URL不可訪問(例如狀態(tài)代碼為404 服務(wù)器找不到請(qǐng)求的網(wǎng)頁(yè)”),則可以判斷出目標(biāo)網(wǎng)頁(yè)不是網(wǎng)址重寫的網(wǎng)頁(yè),即非網(wǎng)址重寫的網(wǎng)頁(yè)。第二,可以根據(jù)錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼與目標(biāo)網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼之間的區(qū)別來判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)。例如,根據(jù)本發(fā)明的實(shí)施例,如果訪問錯(cuò)誤URL的訪問結(jié)果的狀態(tài)代碼為200 (“服務(wù)器已成功處理了請(qǐng)求”),而訪問對(duì)應(yīng)的正常URL的訪問結(jié)果的狀態(tài)代碼為302 (“服務(wù)器目前從不同位置的網(wǎng)頁(yè)響應(yīng)請(qǐng)求,但請(qǐng)求者應(yīng)繼續(xù)使用原有位置來進(jìn)行以后的請(qǐng)求”),則可以判斷目標(biāo)網(wǎng)頁(yè)是網(wǎng)址重寫的網(wǎng)頁(yè)。第三,可以根據(jù)錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別來判斷目標(biāo)網(wǎng)頁(yè)是 否為網(wǎng)址重寫的網(wǎng)頁(yè)。圖2示意性地圖示了根據(jù)本發(fā)明的實(shí)施例的根據(jù)錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)的步驟的流程圖,如圖2所示,首先執(zhí)行步驟S105al :比較錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容。之后,在錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容相同的情況下,執(zhí)行步驟S105a2 :將目標(biāo)網(wǎng)頁(yè)判斷為網(wǎng)址重寫的網(wǎng)頁(yè)。而在錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容不同的情況下,則執(zhí)行步驟S105a2’ 從錯(cuò)誤網(wǎng)頁(yè)與目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容中獲取錯(cuò)誤關(guān)鍵字,并且根據(jù)錯(cuò)誤關(guān)鍵字來判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)。其中,可以通過如下方式從錯(cuò)誤網(wǎng)頁(yè)與目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容中獲取錯(cuò)誤關(guān)鍵字。首先,可以從保存錯(cuò)誤網(wǎng)頁(yè)一次或多次得到的內(nèi)容與保存目標(biāo)網(wǎng)頁(yè)一次或多次得到的內(nèi)容中,分別提取每次保存的錯(cuò)誤網(wǎng)頁(yè)與相應(yīng)的目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容。仍以訪問目標(biāo)網(wǎng)頁(yè)多次并且訪問錯(cuò)誤網(wǎng)頁(yè)多次為例進(jìn)行描述,可以分別比較上述的html_errl〈==>html_okl到html_errn〈==>html_okn,并且將錯(cuò)誤網(wǎng)頁(yè)所特有的內(nèi)容分別保存為html_err_specialI>…、html_err_specialn。具體而言,可以采用本領(lǐng)域常用的一種開源(opensource)項(xiàng)目 “dtl: :Diff”(請(qǐng)參見 http://code, google, com/p/dtl-cpp/),利用該項(xiàng)目,可以提取出每個(gè)錯(cuò)誤網(wǎng)頁(yè)特有的一段或者多段內(nèi)容(字符串),并且每段特有的內(nèi)容之間用分割標(biāo)記分隔開。之后,可以從特有的內(nèi)容的交集中提取潛在錯(cuò)誤關(guān)鍵字,例如,可以從上述的html_err_specialI> ···>html_err_specialn 中提取交集,保存為 html_err_join。具體而言,同樣可以米用開源項(xiàng)目 “dtl: :Diff ”來從 html_err_speciall、…、html_err_specialn中提取交集,并保存為html_err_join,這里是提取內(nèi)容一致的部分,每段相同的內(nèi)容(字符串)之間同樣有分割標(biāo)記分割開。然后,可以從交集html_err_join中提取錯(cuò)誤關(guān)鍵字,也就是從一段一段的文本中提取關(guān)鍵字(不區(qū)分語(yǔ)言),提取出的結(jié)構(gòu)是錯(cuò)誤關(guān)鍵字列表。舉例而言,所提取出來的錯(cuò)誤關(guān)鍵字包括但不限于“網(wǎng)頁(yè)未找到”(或者“page not found”)、“頁(yè)面不存在”(或者“page does not exist”)、“404 錯(cuò)誤”(或者“404error”)、“找不到文件”(或者“file notfound,,)等等。之后,可選地,還可以對(duì)所提取出來的錯(cuò)誤關(guān)鍵字進(jìn)行排序和去重等處理,以保證錯(cuò)誤關(guān)鍵字列表中每個(gè)錯(cuò)誤關(guān)鍵字的唯一性,排序例如可以采用錯(cuò)誤關(guān)鍵字出現(xiàn)的次數(shù)來作為排序條件。并且,可選地,作為復(fù)查,從錯(cuò)誤關(guān)鍵字列表中排除正確頁(yè)面中存在的關(guān)鍵字,以確保錯(cuò)誤關(guān)鍵字的正確性。然后,可選地,可以從錯(cuò)誤關(guān)鍵字列表中提取排名第一(或者根據(jù)需要,提取排名前η)的錯(cuò)誤關(guān)鍵字作為有效錯(cuò)誤關(guān)鍵字。即,獲取出現(xiàn)次數(shù)最多的一個(gè)或多個(gè)潛在錯(cuò)誤關(guān)鍵字作為最終的錯(cuò)誤關(guān)鍵字。如果依據(jù)上述步驟,沒有獲取到錯(cuò)誤關(guān)鍵字,則可以判斷目標(biāo)網(wǎng)頁(yè)為網(wǎng)址重寫的網(wǎng)頁(yè)。在獲取了錯(cuò)誤關(guān)鍵字之后,可以根據(jù)其來判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)??蛇x地,在錯(cuò)誤關(guān)鍵字的長(zhǎng)度小于預(yù)先定義的長(zhǎng)度的情況下,將目標(biāo)網(wǎng)頁(yè)判斷為網(wǎng)址重寫的網(wǎng)頁(yè)。預(yù)先定義的長(zhǎng)度可以根據(jù)實(shí)際需要來進(jìn)行選擇,例如2或3個(gè)字符,即,在錯(cuò)誤關(guān) 鍵字的長(zhǎng)度小于2或3個(gè)字符的情況下,將目標(biāo)網(wǎng)頁(yè)判斷為網(wǎng)址重寫的網(wǎng)頁(yè)。在不滿足上述條件的情況下,可以將目標(biāo)網(wǎng)頁(yè)判斷為非網(wǎng)址重寫的網(wǎng)頁(yè),并且保存錯(cuò)誤關(guān)鍵字。隨后,根據(jù)本發(fā)明的網(wǎng)站安全檢測(cè)系統(tǒng)可以利用上述錯(cuò)誤關(guān)鍵字來確定該網(wǎng)站存在的問題,錯(cuò)誤關(guān)鍵字是在網(wǎng)站處理錯(cuò)誤請(qǐng)求時(shí)產(chǎn)生的頁(yè)面中的特定內(nèi)容。在對(duì)網(wǎng)站進(jìn)行安全檢測(cè)時(shí),會(huì)構(gòu)造一些惡意攻擊鏈接,如果網(wǎng)站同樣對(duì)其進(jìn)行了處理,并返回了包括特定關(guān)鍵字的內(nèi)容,則說明網(wǎng)站已經(jīng)注意到這種惡意攻擊并且進(jìn)行了相應(yīng)的處理,因此可以認(rèn)為該網(wǎng)站對(duì)這種惡意攻擊進(jìn)行了防范,就可以不再進(jìn)行進(jìn)一步的檢測(cè),從而節(jié)省了檢測(cè)時(shí)間。本發(fā)明提供了一種用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法。根據(jù)本發(fā)明的實(shí)施例,可以利用目標(biāo)網(wǎng)頁(yè)以及與其相對(duì)應(yīng)的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容和狀態(tài)代碼,來準(zhǔn)確有效地判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè),能夠適用于各種形式的網(wǎng)址重寫的網(wǎng)頁(yè)。在網(wǎng)頁(yè)為網(wǎng)址重寫的網(wǎng)頁(yè)的情況下,在網(wǎng)站的安全檢測(cè)過程中,就不再需要對(duì)該網(wǎng)頁(yè)相關(guān)目錄下的鏈接進(jìn)行進(jìn)一步的分析和判斷,可以很大程度地節(jié)省安全檢測(cè)所需要的掃描時(shí)間。而在網(wǎng)頁(yè)為非網(wǎng)址重寫的網(wǎng)頁(yè)時(shí),可以準(zhǔn)確提取錯(cuò)誤關(guān)鍵字以進(jìn)行漏洞判斷,從而減少漏洞誤報(bào)。與上述的方法100相對(duì)應(yīng),本發(fā)明還提供了一種用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的網(wǎng)絡(luò)檢測(cè)設(shè)備200。圖3示意性地圖示了根據(jù)本發(fā)明的實(shí)施例的用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的網(wǎng)絡(luò)檢測(cè)設(shè)備200的框圖,參見圖3,網(wǎng)絡(luò)檢測(cè)設(shè)備200主要包括網(wǎng)絡(luò)接口 201以及網(wǎng)址重寫判斷器203,并且可選地還可以包括網(wǎng)址構(gòu)造器205以及網(wǎng)頁(yè)存儲(chǔ)器207。根據(jù)本發(fā)明的實(shí)施例,網(wǎng)絡(luò)接口 201適于利用目標(biāo)網(wǎng)頁(yè)的網(wǎng)址和與目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址向例如一個(gè)或者多個(gè)目標(biāo)服務(wù)器請(qǐng)求網(wǎng)頁(yè),并且從一個(gè)或者多個(gè)目標(biāo)服務(wù)器獲取目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼、以及錯(cuò)誤網(wǎng)址所指向的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼。網(wǎng)絡(luò)接口 201可以用于執(zhí)行上述方法100中的步驟SlOl和步驟S103。網(wǎng)址重寫判斷器203適于根據(jù)錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別、或者錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼、或者錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼與目標(biāo)網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼之間的區(qū)別,判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè),網(wǎng)址重寫判斷器203可以用于執(zhí)行上述方法100中的步驟S105。
根據(jù)本發(fā)明的實(shí)施例,網(wǎng)絡(luò)檢測(cè)設(shè)備200還可以包括網(wǎng)址構(gòu)造器205,其適于構(gòu)造與目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的、實(shí)際不存在的錯(cuò)誤網(wǎng)址,并將目標(biāo)網(wǎng)頁(yè)的網(wǎng)址和錯(cuò)誤網(wǎng)址發(fā)送給網(wǎng)絡(luò)接口 201。可選地,網(wǎng)絡(luò)檢測(cè)設(shè)備200還可以包括網(wǎng)頁(yè)存儲(chǔ)器207,其適于存儲(chǔ)由網(wǎng)絡(luò)接口 201獲取的目標(biāo)網(wǎng)頁(yè)的內(nèi)容及其對(duì)應(yīng)的狀態(tài)代碼、以及錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼,并提供給網(wǎng)址重寫判斷器203。根據(jù)本發(fā)明的實(shí)施例,網(wǎng)絡(luò)接口 201可以訪問目標(biāo)網(wǎng)頁(yè)一次或多次,并且將每次訪問的目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼保存到網(wǎng)頁(yè)存儲(chǔ)器207中。類似地,網(wǎng)絡(luò)接口201也可以訪問錯(cuò)誤網(wǎng)頁(yè)一次或多次,并且將每次訪問的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼保存到網(wǎng)頁(yè)存儲(chǔ)器207中。在網(wǎng)址重寫判斷器203從網(wǎng)頁(yè)存儲(chǔ)器207獲取到目標(biāo)網(wǎng)頁(yè)的內(nèi)容及其對(duì)應(yīng)的狀態(tài)代碼、以及錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼之后,就可以根據(jù)錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別、或者錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼、或者錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼與目標(biāo)網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼之間的區(qū)別,判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)。 其中,在錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼指示該錯(cuò)誤網(wǎng)頁(yè)的網(wǎng)址不可訪問(例如狀態(tài)代碼為404 服務(wù)器找不到請(qǐng)求的網(wǎng)頁(yè)”)的情況下,網(wǎng)址重寫判斷器203將目標(biāo)網(wǎng)頁(yè)判斷為非網(wǎng)址重寫的網(wǎng)頁(yè)。另外,根據(jù)本發(fā)明的實(shí)施例,例如,如果訪問錯(cuò)誤URL的訪問結(jié)果的狀態(tài)代碼為200 (“服務(wù)器已成功處理了請(qǐng)求”),而訪問對(duì)應(yīng)的正常URL的訪問結(jié)果的狀態(tài)代碼為302(“服務(wù)器目前從不同位置的網(wǎng)頁(yè)響應(yīng)請(qǐng)求,但請(qǐng)求者應(yīng)繼續(xù)使用原有位置來進(jìn)行以后的請(qǐng)求”),則網(wǎng)址重寫判斷器203可以判斷目標(biāo)網(wǎng)頁(yè)是網(wǎng)址重寫的網(wǎng)頁(yè)。圖4示意性地圖示了根據(jù)本發(fā)明的實(shí)施例的網(wǎng)址重寫判斷器203的框圖。根據(jù)本發(fā)明的實(shí)施例,如圖4所示,網(wǎng)址重寫判斷器203可以包括網(wǎng)頁(yè)內(nèi)容比較器203a,適于比較錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容,可以用于執(zhí)行上述方法100中的步驟S105al ;錯(cuò)誤關(guān)鍵字獲取器203b,適于在錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容不同的情況下,從錯(cuò)誤網(wǎng)頁(yè)與目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容中獲取錯(cuò)誤關(guān)鍵字;以及網(wǎng)址重寫子判斷器203c,適于在錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容相同的情況下,將目標(biāo)網(wǎng)頁(yè)判斷為網(wǎng)址重寫的網(wǎng)頁(yè),并且在錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容不同的情況下,根據(jù)錯(cuò)誤關(guān)鍵字來判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)。錯(cuò)誤關(guān)鍵字獲取器203b和網(wǎng)址重寫子判斷器203c可以用于執(zhí)行上述方法100中的步驟S105a2以及步驟S105a2’。根據(jù)本發(fā)明的實(shí)施例,在錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容不同的情況下,網(wǎng)址重寫子判斷器203c從保存錯(cuò)誤網(wǎng)頁(yè)一次或多次得到的內(nèi)容與保存目標(biāo)網(wǎng)頁(yè)一次或多次得到的內(nèi)容中,分別提取每次保存的錯(cuò)誤網(wǎng)頁(yè)與相應(yīng)的目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容,從特有的內(nèi)容的交集中提取潛在錯(cuò)誤關(guān)鍵字,并且獲取出現(xiàn)次數(shù)最多的一個(gè)或多個(gè)潛在錯(cuò)誤關(guān)鍵字作為錯(cuò)誤關(guān)鍵字。如果依據(jù)上述步驟,沒有獲取到錯(cuò)誤關(guān)鍵字,則網(wǎng)址重寫判斷器203可以判斷目標(biāo)網(wǎng)頁(yè)為網(wǎng)址重寫的網(wǎng)頁(yè)。在獲取了錯(cuò)誤關(guān)鍵字之后,網(wǎng)址重寫判斷器203可以根據(jù)其來判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)??蛇x地,在錯(cuò)誤關(guān)鍵字的長(zhǎng)度小于預(yù)先定義的長(zhǎng)度的情況下,網(wǎng)址重寫判斷器203將目標(biāo)網(wǎng)頁(yè)判斷為網(wǎng)址重寫的網(wǎng)頁(yè)。預(yù)先定義的長(zhǎng)度可以根據(jù)實(shí)際需要來進(jìn)行選擇,例如2或3個(gè)字符,即,在錯(cuò)誤關(guān)鍵字的長(zhǎng)度小于2或3個(gè)字符的情況下,網(wǎng)址重寫判斷器203將目標(biāo)網(wǎng)頁(yè)判斷為網(wǎng)址重寫的網(wǎng)頁(yè)。在不滿足上述條件的情況下,網(wǎng)址重寫判斷器203可以將目標(biāo)網(wǎng)頁(yè)判斷為非網(wǎng)址重寫的網(wǎng)頁(yè),并且保存錯(cuò)誤關(guān)鍵字。由于上述各設(shè)備(裝置)實(shí)施例與前述各方法實(shí)施例相對(duì)應(yīng),因此不再對(duì)各裝置實(shí)施例進(jìn)行詳細(xì)描述。根據(jù)本發(fā)明的又一方面,還提供了一種用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的網(wǎng)絡(luò)檢測(cè)系統(tǒng)1000。圖5示意性地圖示了根據(jù)本發(fā)明的實(shí)施例的用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的網(wǎng)絡(luò)檢測(cè)系統(tǒng)1000的框圖,參見圖5,網(wǎng)絡(luò)監(jiān)測(cè)系統(tǒng)1000可以包括上述的網(wǎng)絡(luò)檢測(cè)設(shè)備200、以及一個(gè)或者多個(gè)目標(biāo)服務(wù)器300-1,…,300-n,這一個(gè)或者多個(gè)目標(biāo)服務(wù)器可以響應(yīng)于網(wǎng)絡(luò)檢測(cè)設(shè)備200通過其中的網(wǎng)絡(luò)接口 201提供的目標(biāo)網(wǎng)頁(yè)的網(wǎng)址和錯(cuò)誤網(wǎng)址,來向網(wǎng)絡(luò)檢測(cè)設(shè)備200中的網(wǎng)絡(luò)接口 201提供目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼、以及錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼,以供網(wǎng)絡(luò)檢測(cè)設(shè)備200中的網(wǎng)址重寫判斷器203根據(jù)錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別、或者錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼、或者錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼與·目標(biāo)網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼之間的區(qū)別,判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)。在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對(duì)任何特定編程語(yǔ)言。應(yīng)當(dāng)明白,可以利用各種編程語(yǔ)言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語(yǔ)言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說明書的理解。類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式
的權(quán)利要求書由此明確地并入該具體實(shí)施方式
,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的裝置中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)裝置中。可以把實(shí)施例中的若干模塊組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過程或者模塊中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的替代特征來代替。此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。本發(fā)明的各個(gè)裝置實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP )來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的裝置中的一些或者全部模塊的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在
未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過同一個(gè)硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序。可將這些單詞解釋為名稱。
權(quán)利要求
1.一種用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法(100),包括以下步驟 獲取目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼(SlOl); 獲取與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址所指向的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼(S103);以及 根據(jù)所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別、或者所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼、或者所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼與所述目標(biāo)網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼之間的區(qū)另IJ,判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)(S105)。
2.如權(quán)利要求I所述的方法,其中所述獲取目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼(SlOl)的步驟包括訪問所述目標(biāo)網(wǎng)頁(yè)一次或多次,并且保存每次訪問的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼。
3.如權(quán)利要求I所述的方法,其中所述獲取與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址所指向的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼(S103)的步驟包括訪問所述錯(cuò)誤網(wǎng)頁(yè)一次或多次,并且保存每次訪問的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼。
4.如權(quán)利要求I至3中的任一項(xiàng)所述的方法,其中所述根據(jù)所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)的步驟包括 比較所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容(S105al);以及 在所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容相同的情況下,將所述目標(biāo)網(wǎng)頁(yè)判斷為網(wǎng)址重寫的網(wǎng)頁(yè)(S105a2);或者 在所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容不同的情況下,從所述錯(cuò)誤網(wǎng)頁(yè)與所述目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容中獲取錯(cuò)誤關(guān)鍵字,并且根據(jù)所述錯(cuò)誤關(guān)鍵字來判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)(S105a2’)。
5.如權(quán)利要求4所述的方法,其中所述根據(jù)所述錯(cuò)誤關(guān)鍵字來判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)的步驟包括在所述錯(cuò)誤關(guān)鍵字的長(zhǎng)度小于預(yù)先定義的長(zhǎng)度的情況下,將所述目標(biāo)網(wǎng)頁(yè)判斷為網(wǎng)址重寫的網(wǎng)頁(yè)。
6.如權(quán)利要求4所述的方法,其中所述從所述錯(cuò)誤網(wǎng)頁(yè)與所述目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容中獲取錯(cuò)誤關(guān)鍵字的步驟包括 從保存所述錯(cuò)誤網(wǎng)頁(yè)一次或多次得到的內(nèi)容與保存所述目標(biāo)網(wǎng)頁(yè)一次或多次得到的內(nèi)容中,分別提取每次保存的錯(cuò)誤網(wǎng)頁(yè)與相應(yīng)的目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容; 從所述特有的內(nèi)容的交集中提取潛在錯(cuò)誤關(guān)鍵字;以及 獲取出現(xiàn)次數(shù)最多的一個(gè)或多個(gè)潛在錯(cuò)誤關(guān)鍵字作為錯(cuò)誤關(guān)鍵字。
7.如權(quán)利要求I至6中的任一項(xiàng)所述的方法,其中所述根據(jù)所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)的步驟包括在所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼指示該錯(cuò)誤網(wǎng)頁(yè)的網(wǎng)址不可訪問的情況下,將所述目標(biāo)網(wǎng)頁(yè)判斷為非網(wǎng)址重寫的網(wǎng)頁(yè)。
8.如權(quán)利要求I至7中的任一項(xiàng)所述的方法,其中所述與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址是與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的、實(shí)際不存在的網(wǎng)址。
9.如權(quán)利要求I至8中的任一項(xiàng)所述的方法,其中所述網(wǎng)址是統(tǒng)一資源定位符。
10.一種用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的網(wǎng)絡(luò)檢測(cè)設(shè)備(200),包括 網(wǎng)絡(luò)接口(201),適于獲取目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼、以及與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址所指向的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼;以及網(wǎng)址重寫判斷器(203),適于根據(jù)所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別、或者所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼、或者所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼與所述目標(biāo)網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼之間的區(qū)別,判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)。
11.如權(quán)利要求10所述的網(wǎng)絡(luò)檢測(cè)設(shè)備(200),還包括網(wǎng)址構(gòu)造器(205),適于構(gòu)造與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的、實(shí)際不存在的所述錯(cuò)誤網(wǎng)址,并將所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址和錯(cuò)誤網(wǎng)址發(fā)送給所述網(wǎng)絡(luò)接口(201)。
12.如權(quán)利要求10或者11所述的網(wǎng)絡(luò)檢測(cè)設(shè)備(200),還包括網(wǎng)頁(yè)存儲(chǔ)器(207),適于存儲(chǔ)由所述網(wǎng)絡(luò)接口(201)獲取的目標(biāo)網(wǎng)頁(yè)的內(nèi)容及其對(duì)應(yīng)的狀態(tài)代碼、以及所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼,并提供給所述網(wǎng)址重寫判斷器(203)。
13.如權(quán)利要求10-12中的任一項(xiàng)所述的網(wǎng)絡(luò)檢測(cè)設(shè)備(200),其中所述網(wǎng)絡(luò)接口(201)訪問所述目標(biāo)網(wǎng)頁(yè)一次或多次,并且將每次訪問的目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼保存到所述網(wǎng)頁(yè)存儲(chǔ)器(207)中。
14.如權(quán)利要求10-13中的任一項(xiàng)所述的網(wǎng)絡(luò)檢測(cè)設(shè)備(200),其中所述網(wǎng)絡(luò)接口(201)訪問所述錯(cuò)誤網(wǎng)頁(yè)一次或多次,并且將每次訪問的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼保存到所述網(wǎng)頁(yè)存儲(chǔ)器(207)中。
15.如權(quán)利要求10至14中的任一項(xiàng)所述的網(wǎng)絡(luò)檢測(cè)設(shè)備(200),其中所述網(wǎng)址重寫判斷器(203)包括: 網(wǎng)頁(yè)內(nèi)容比較器(203a),適于比較所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容; 錯(cuò)誤關(guān)鍵字獲取器(203b),適于在所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容不同的情況下,從所述錯(cuò)誤網(wǎng)頁(yè)與所述目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容中獲取錯(cuò)誤關(guān)鍵字;以及 網(wǎng)址重寫子判斷器(203c),適于在所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容相同的情況下,將所述目標(biāo)網(wǎng)頁(yè)判斷為網(wǎng)址重寫的網(wǎng)頁(yè),并且在所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容不同的情況下,根據(jù)所述錯(cuò)誤關(guān)鍵字來判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)。
16.如權(quán)利要求15所述的網(wǎng)絡(luò)檢測(cè)設(shè)備(200),其中在所述錯(cuò)誤關(guān)鍵字的長(zhǎng)度小于預(yù)先定義的長(zhǎng)度的情況下,所述網(wǎng)址重寫子判斷器(203c)將所述目標(biāo)網(wǎng)頁(yè)判斷為網(wǎng)址重寫的網(wǎng)頁(yè)。
17.如權(quán)利要求15或16所述的網(wǎng)絡(luò)檢測(cè)設(shè)備(200),其中在所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容不同的情況下,所述網(wǎng)址重寫子判斷器(203c) 從保存所述錯(cuò)誤網(wǎng)頁(yè)一次或多次得到的內(nèi)容與保存所述目標(biāo)網(wǎng)頁(yè)一次或多次得到的內(nèi)容中,分別提取每次保存的錯(cuò)誤網(wǎng)頁(yè)與相應(yīng)的目標(biāo)網(wǎng)頁(yè)相比特有的內(nèi)容; 從所述特有的內(nèi)容的交集中提取潛在錯(cuò)誤關(guān)鍵字;并且 獲取出現(xiàn)次數(shù)最多的一個(gè)或多個(gè)潛在錯(cuò)誤關(guān)鍵字作為錯(cuò)誤關(guān)鍵字。
18.如權(quán)利要求10至17中的任一項(xiàng)所述的網(wǎng)絡(luò)檢測(cè)設(shè)備(200),其中在所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼指示該錯(cuò)誤網(wǎng)頁(yè)的網(wǎng)址不可訪問的情況下,所述網(wǎng)址重寫判斷器(203)將所述目標(biāo)網(wǎng)頁(yè)判斷為非網(wǎng)址重寫的網(wǎng)頁(yè)。
19.如權(quán)利要求10至18中的任一項(xiàng)所述的網(wǎng)絡(luò)檢測(cè)設(shè)備(200),其中所述與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址是與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的、實(shí)際不存在的網(wǎng)址。
20.如權(quán)利要求10至19中的任一項(xiàng)所述的網(wǎng)絡(luò)檢測(cè)設(shè)備(200),其中所述網(wǎng)址是統(tǒng)一資源定位符。
21.一種用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的網(wǎng)絡(luò)檢測(cè)系統(tǒng)(1000),包括 如權(quán)利要求10-20所述的網(wǎng)絡(luò)檢測(cè)設(shè)備(200);以及 一個(gè)或者多個(gè)目標(biāo)服務(wù)器(300-1,…,300-n),適于響應(yīng)于 所述網(wǎng)絡(luò)檢測(cè)設(shè)備(200)提供的所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址和所述錯(cuò)誤 網(wǎng)址,向所述網(wǎng)絡(luò)檢測(cè)設(shè)備(200 )提供所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼、以及所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼。
全文摘要
本發(fā)明公開了一種用于判斷網(wǎng)頁(yè)網(wǎng)址重寫的方法、網(wǎng)絡(luò)檢測(cè)設(shè)備、以及網(wǎng)絡(luò)檢測(cè)系統(tǒng),其中所述方法包括以下步驟獲取目標(biāo)網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼;獲取與所述目標(biāo)網(wǎng)頁(yè)的網(wǎng)址相對(duì)應(yīng)的錯(cuò)誤網(wǎng)址所指向的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容以及對(duì)應(yīng)的狀態(tài)代碼;以及根據(jù)所述錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容與所述目標(biāo)網(wǎng)頁(yè)的內(nèi)容之間的區(qū)別、或者所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼、或者所述錯(cuò)誤網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼與所述目標(biāo)網(wǎng)頁(yè)對(duì)應(yīng)的狀態(tài)代碼之間的區(qū)別,判斷所述目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè)。根據(jù)本發(fā)明的實(shí)施例,可以利用目標(biāo)網(wǎng)頁(yè)以及與其相對(duì)應(yīng)的錯(cuò)誤網(wǎng)頁(yè)的內(nèi)容和狀態(tài)代碼,來準(zhǔn)確有效地判斷目標(biāo)網(wǎng)頁(yè)是否為網(wǎng)址重寫的網(wǎng)頁(yè),能夠適用于各種形式的網(wǎng)址重寫的網(wǎng)頁(yè)。
文檔編號(hào)G06F17/30GK102917053SQ20121039747
公開日2013年2月6日 申請(qǐng)日期2012年10月18日 優(yōu)先權(quán)日2012年10月18日
發(fā)明者龍專, 趙武 申請(qǐng)人:北京奇虎科技有限公司