亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

釣魚網頁的檢測方法和裝置制造方法

文檔序號:7806200閱讀:254來源:國知局
釣魚網頁的檢測方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種釣魚網頁的檢測方法,包括:提取待檢測網頁的網頁模板特征,并獲取網頁模板特征的第一摘要信息;確定第一摘要信息是否屬于預設數(shù)據(jù)庫中的第二摘要信息,第二摘要信息是根據(jù)目標網頁的網頁模板特征所獲取的摘要信息;在確定第一摘要信息屬于預設數(shù)據(jù)庫中的第二摘要信息時,進一步確定待檢測網頁的域名和目標網頁的域名是否一致;以及在確定待檢測網頁的域名和目標網頁的域名不一致時,確定待檢測網頁是仿冒目標網頁的釣魚網頁。本發(fā)明實施例的方法避免了釣魚網頁的域名具有時效性特點的問題,提高了檢測的準確度,并且能夠從根本上檢測釣魚網站,從而提高了可行性和可用性。本發(fā)明還公開了一種釣魚網頁的檢測裝置。
【專利說明】釣魚網頁的檢測方法和裝置

【技術領域】
[0001] 本發(fā)明涉及互聯(lián)網【技術領域】,尤其涉及一種釣魚網頁的檢測方法和裝置。

【背景技術】
[0002] 隨著互聯(lián)網技術的快速發(fā)展,互聯(lián)網中的黑色利益鏈組織已經形成,且發(fā)展快速。 隨著殺毒技術的成熟,利用二進制木馬病毒獲利變得越來越難,黑色利益鏈組織開始將目 標轉向釣魚網頁進行欺詐,由于釣魚網頁的成本低、獲益快、傳播快、反釣魚技術不完善等, 使得各種釣魚網頁層出不窮。
[0003] 針對層出不窮的各種釣魚網頁,相關技術可采用以下兩種方式進行防范:一種是 網絡保護產品,例如,網購保鏢,賬號保護產品等,這些網絡保護產品給用戶提供一個安全 入口,使得用戶從安全入口進行登錄,但是這種方式存在的問題是,無法從根本上檢測釣魚 網站,只能給特定網頁起到保護作用。另一種是收集釣魚網頁形成釣魚網頁庫,當用戶訪問 某個網頁時通過查詢釣魚網頁庫來判斷用戶訪問的網頁是否為釣魚網頁,但是這種方式存 在的問題是,釣魚網頁的時效性很短,一般幾個小時,有些甚至不到一個小時,很多情況下 釣魚網頁還沒入庫就已經失效。


【發(fā)明內容】

[0004] 本發(fā)明的目的旨在至少在一定程度上解決上述的技術問題之一。
[0005] 為此,本發(fā)明的第一個目的在于提出一種釣魚網頁的檢測方法。該方法可以避免 釣魚網頁的域名具有時效性特點的問題,提高了檢測的準確度,并且能夠從根本上檢測釣 魚網站,從而提高了可行性和可用性。
[0006] 本發(fā)明的第二個目的在于提出一種釣魚網頁的檢測裝置。
[0007] 為了實現(xiàn)上述目的,本發(fā)明第一方面實施例的釣魚網頁的檢測方法,包括:提取待 檢測網頁的網頁模板特征,并獲取所述網頁模板特征的第一摘要信息;確定所述第一摘要 信息是否屬于預設數(shù)據(jù)庫中的第二摘要信息,所述第二摘要信息是根據(jù)目標網頁的網頁模 板特征所獲取的摘要信息;在確定所述第一摘要信息屬于預設數(shù)據(jù)庫中的第二摘要信息 時,進一步確定所述待檢測網頁的域名和所述目標網頁的域名是否一致;以及在確定所述 待檢測網頁的域名和所述目標網頁的域名不一致時,確定所述待檢測網頁是仿冒所述目標 網頁的釣魚網頁。
[0008] 本發(fā)明實施例的釣魚網頁的檢測方法,可提取待檢測網頁的網頁模板特征并獲取 其第一摘要信息,并在確定第一摘要信息屬于預設數(shù)據(jù)庫中的第二摘要信息時,進一步確 定待檢測網頁的域名和目標網頁的域名是否一致,當不一致時,確定待檢測網頁是仿冒目 標網頁的釣魚網頁,避免了釣魚網頁的域名具有時效性特點的問題,提高了檢測的準確度, 并且能夠從根本上檢測釣魚網站,從而提高了可行性和可用性。
[0009] 為了實現(xiàn)上述目的,本發(fā)明第二方面實施例的釣魚網頁的檢測裝置,包括:獲取模 塊,用于提取待檢測網頁的網頁模板特征,并獲取所述網頁模板特征的第一摘要信息;第一 確定模塊,用于確定所述第一摘要信息是否屬于預設數(shù)據(jù)庫中的第二摘要信息,所述第二 摘要信息是根據(jù)目標網頁的網頁模板特征所獲取的摘要信息;第二確定模塊,用于在所述 第一確定模塊確定所述第一摘要信息屬于預設數(shù)據(jù)庫中的第二摘要信息時,進一步確定所 述待檢測網頁的域名和所述目標網頁的域名是否一致;以及第三確定模塊,用于所述第二 確定模塊確定所述待檢測網頁的域名和所述目標網頁的域名不一致時,確定所述待檢測網 頁是仿冒所述目標網頁的釣魚網頁。
[0010] 本發(fā)明實施例的釣魚網頁的檢測裝置,可通過獲取模塊提取待檢測網頁的網頁模 板特征并獲取其第一摘要信息,第二確定模塊在第一確定模塊確定第一摘要信息屬于預設 數(shù)據(jù)庫中的第二摘要信息時,進一步確定待檢測網頁的域名和目標網頁的域名是否一致, 在不一致時,第三確定模塊確定待檢測網頁是仿冒目標網頁的釣魚網頁,避免了釣魚網頁 的域名具有時效性特點的問題,提高了檢測的準確度,并且能夠從根本上檢測釣魚網站,從 而提高了可行性和可用性。
[0011] 本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實踐了解到。

【專利附圖】

【附圖說明】
[0012] 本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結合附圖對實施例的描述中將變 得明顯和容易理解,其中,
[0013] 圖1是根據(jù)本發(fā)明一個實施例的釣魚網頁的檢測方法的流程圖;
[0014] 圖2是根據(jù)本發(fā)明另一個實施例的釣魚網頁的檢測方法的流程圖;
[0015] 圖3是根據(jù)本發(fā)明又一個實施例的釣魚網頁的檢測方法的流程圖;
[0016] 圖4是根據(jù)本發(fā)明再一個實施例的釣魚網頁的檢測方法的流程圖;
[0017] 圖5是根據(jù)本發(fā)明一個實施例的釣魚網頁的檢測裝置的結構示意圖;
[0018] 圖6是根據(jù)本發(fā)明另一個實施例的釣魚網頁的檢測裝置的結構示意圖。

【具體實施方式】
[0019] 下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考 附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。相反, 本發(fā)明的實施例包括落入所附加權利要求書的精神和內涵范圍內的所有變化、修改和等同 物。
[0020] 在本發(fā)明的描述中,需要理解的是,術語"第一"、"第二"等僅用于描述目的,而不 能理解為指示或暗示相對重要性。此外,在本發(fā)明的描述中,除非另有說明,"多個"的含義 是兩個或兩個以上。
[0021] 流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括 一個或更多個用于實現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部 分,并且本發(fā)明的優(yōu)選實施方式的范圍包括另外的實現(xiàn),其中可以不按所示出或討論的順 序,包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,這應被本發(fā)明 的實施例所屬【技術領域】的技術人員所理解。
[0022] 下面參考附圖描述根據(jù)本發(fā)明實施例的釣魚網頁的檢測方法和裝置。
[0023] 本發(fā)明提出了一種釣魚網頁的檢測方法,包括:提取待檢測網頁的網頁模板特征, 并獲取網頁模板特征的第一摘要信息;確定第一摘要信息是否屬于預設數(shù)據(jù)庫中的第二摘 要信息,第二摘要信息是根據(jù)目標網頁的網頁模板特征所獲取的摘要信息;在確定第一摘 要信息屬于預設數(shù)據(jù)庫中的第二摘要信息時,進一步確定待檢測網頁的域名和目標網頁的 域名是否一致;以及在確定待檢測網頁的域名和目標網頁的域名不一致時,確定待檢測網 頁是仿冒目標網頁的釣魚網頁。
[0024] 圖1是根據(jù)本發(fā)明一個實施例的釣魚網頁的檢測方法的流程圖。
[0025] 如圖1所示,該釣魚網頁的檢測方法包括:
[0026] S101,提取待檢測網頁的網頁模板特征,并獲取網頁模板特征的第一摘要信息。
[0027] 其中,在本發(fā)明的一個實施例中,待檢測網頁可以是用戶登錄頁面。應當理解,目 前網頁數(shù)量非常龐大,保護每個網頁是不現(xiàn)實也是沒必要的,釣魚網站的最終目的是要盜 取用戶的有用信息(如賬號、密碼等信息),由此可知,只需檢測用戶登錄頁面即可有效地 保護了用戶信息,這樣大大的縮減了保護范圍,且將一個不收斂的問題變成了一個收斂的 問題,提高了可行性。
[0028] 此外,在本發(fā)明的一個實施例中,網頁模板特征可包括網頁標題、網頁的描述信 息、網頁的版權信息、網頁的〈hl>〈h2Xh3Xh4>標簽的內容信息、網頁的<p>標簽的內容信 息、網頁的樣式表信息、網頁的表單信息、網頁的導航信息、網頁的標簽框架信息、網頁的顯 示圖標信息等中的至少一種。
[0029] 另外,第一摘要信息可以是HTML(Hyper Text Markup language,超文本標記語言) 文件的信息。應當理解,由于釣魚網頁的URL (Uniform Resource Locator,統(tǒng)一資源定位器) 均具有時效性,且釣魚網頁的頁面模板會跟被仿冒的目標網頁的模板基本相似,因此,判斷 待檢測網頁是否是釣魚網頁時還需獲取待檢測網頁對應的HTML文件信息,這樣可有效地 對付自動生成的釣魚網頁識別和隨機更新域名的釣魚網站。
[0030] 也就是說,可先從待檢測網頁(即用戶登錄頁面)中提取網頁模板特征,之后可從 網頁模板特征中獲取網頁中的HTML文件的信息。
[0031] S102,確定第一摘要信息是否屬于預設數(shù)據(jù)庫中的第二摘要信息,第二摘要信息 是根據(jù)目標網頁的網頁模板特征所獲取的摘要信息。
[0032] 其中,在本發(fā)明的一個實施例中,第二摘要信息可以是HTML文件的信息。
[0033] 具體而言,可根據(jù)本地預設的數(shù)據(jù)庫,確定第一摘要信息是否屬于第二摘要信息; 和/或,可將第一摘要信息發(fā)送給云端,以使云端根據(jù)云端數(shù)據(jù)庫確定第一摘要信息是否 屬于預設數(shù)據(jù)庫中的第二摘要信息。也就是說,本地的預設的數(shù)據(jù)庫可存儲一些熱度比較 大的網頁對應的第二摘要信息,可先通過本地引擎對本地預設的數(shù)據(jù)庫進行掃描,如果本 地引擎根據(jù)第一摘要信息在本地預設的數(shù)據(jù)庫中沒有檢測到對應的第二摘要信息,則可將 第一摘要信息發(fā)送給云端,云端根據(jù)云端數(shù)據(jù)庫確定第一摘要信息是否屬于預設數(shù)據(jù)庫中 的第二摘要信息。由此,通過本地引擎和云端引擎雙效結合,提高了可用性。
[0034] 進一步地,在本發(fā)明的一個實施例中,該釣魚網頁的檢測方法還可以包括:建立預 設數(shù)據(jù)庫。具體而言,可先獲取目標網頁,并判斷目標網頁的訪問量是否超過預設訪問量, 和/或,目標網頁的仿冒次數(shù)是否超過預設仿冒次數(shù)。之后,在判斷目標網頁的訪問量超過 預設訪問量,和/或,目標網頁的仿冒次數(shù)超過預設仿冒次數(shù)時,提取目標網頁的網頁模板 特征,并獲取目標網頁的網頁模板特征的第二摘要信息以建立預設數(shù)據(jù)庫。
[0035] 需要說明的是,在本發(fā)明的一個實施例中,在確定第一摘要信息不屬于預設數(shù)據(jù) 庫中的第二摘要信息時,可返回未知信息,并結束待檢測網頁是否是釣魚網頁的檢測。之 后,可通過人工分析該待檢測網頁是否是釣魚網頁,若不是,則可提取該網頁的網頁模板特 征,并獲取網頁模板特征的第二摘要信息,并將其保存至預設數(shù)據(jù)庫中。由此,可擴大和完 善預設數(shù)據(jù)庫。
[0036] S103,在確定第一摘要信息屬于預設數(shù)據(jù)庫中的第二摘要信息時,進一步確定待 檢測網頁的域名和目標網頁的域名是否一致。
[0037] S104,在確定待檢測網頁的域名和目標網頁的域名不一致時,確定待檢測網頁是 仿冒目標網頁的釣魚網頁。
[0038] 應當理解,在本發(fā)明的實施例中,在確定第一摘要信息屬于預設數(shù)據(jù)庫中的第二 摘要信息,并確定待檢測網頁的域名和目標網頁的域名一致時,可確定該待檢測網頁是安 全網頁,不是釣魚網頁。
[0039] 本發(fā)明實施例的釣魚網頁的檢測方法,可提取待檢測網頁的網頁模板特征并獲取 其第一摘要信息,并在確定第一摘要信息屬于預設數(shù)據(jù)庫中的第二摘要信息時,進一步確 定待檢測網頁的域名和目標網頁的域名是否一致,當不一致時,確定待檢測網頁是仿冒目 標網頁的釣魚網頁,避免了釣魚網頁的域名具有時效性特點的問題,提高了檢測的準確度, 并且能夠從根本上檢測釣魚網站,從而提高了可行性和可用性。
[0040] 圖2是根據(jù)本發(fā)明另一個實施例的釣魚網頁的檢測方法的流程圖。
[0041] 為了提升用戶體驗,在本發(fā)明的實施例中,在確定待檢測網頁是仿冒目標網頁的 釣魚網頁之后,可向用戶發(fā)送警告信息并提供目標網頁。具體地,如圖2所示,該釣魚網頁 的檢測方法可以包括:
[0042] S201,提取待檢測網頁的網頁模板特征,并獲取網頁模板特征的第一摘要信息。
[0043] S202,確定第一摘要信息是否屬于預設數(shù)據(jù)庫中的第二摘要信息,第二摘要信息 是根據(jù)目標網頁的網頁模板特征所獲取的摘要信息。
[0044] S203,在確定第一摘要信息屬于預設數(shù)據(jù)庫中的第二摘要信息時,進一步確定待 檢測網頁的域名和目標網頁的域名是否一致。
[0045] S204,在確定待檢測網頁的域名和目標網頁的域名不一致時,確定待檢測網頁是 仿冒目標網頁的釣魚網頁。
[0046] S205,向用戶發(fā)送警告信息并提供目標網頁。
[0047] 具體地,在確定待檢測網頁是仿冒目標網頁的釣魚網頁之后,可向用戶發(fā)送警告 信息,以提示用戶正在打開或查看的網頁為釣魚網頁,并將被仿冒的目標網頁的正確網址 展現(xiàn)給用戶,以便用戶到目標網頁去登錄。
[0048] 本發(fā)明實施例的釣魚網頁的檢測方法,在確定待檢測網頁是仿冒目標網頁的釣魚 網頁之后,可向用戶發(fā)送警告信息并提供目標網頁,以便用戶到目標網頁去登錄,提升了用 戶體驗。
[0049] 圖3是根據(jù)本發(fā)明又一個實施例的釣魚網頁的檢測方法的流程圖。
[0050] 為了提高檢測效率,提高檢測準確度,在提取待檢測網頁的網頁模板特征之前,還 可確定待檢測網頁的網址是否在白名單網址列表中,若在,則結束待檢測網頁是否是釣魚 網頁的檢測。具體地,如圖3所示,該釣魚網頁的檢測方法可以包括:
[0051] S301,確定待檢測網頁的網址是否在白名單網址列表中。
[0052] 具體地,當用戶打開或查看待檢測網頁時,可先獲取待檢測網頁的網址,之后可判 斷待檢測網頁的網址是否在白名單網址列表中。
[0053] S302,在確定待檢測網頁的網址不在白名單網址列表中時,提取待檢測網頁的網 頁模板特征,并獲取網頁模板特征的第一摘要信息。
[0054] S303,確定第一摘要信息是否屬于預設數(shù)據(jù)庫中的第二摘要信息,第二摘要信息 是根據(jù)目標網頁的網頁模板特征所獲取的摘要信息。
[0055] S304,在確定第一摘要信息屬于預設數(shù)據(jù)庫中的第二摘要信息時,進一步確定待 檢測網頁的域名和目標網頁的域名是否一致。
[0056] S305,在確定待檢測網頁的域名和目標網頁的域名不一致時,確定待檢測網頁是 仿冒目標網頁的釣魚網頁。
[0057] S306,向用戶發(fā)送警告信息并提供目標網頁。
[0058] S307,在確定待檢測網頁的網址在白名單網址列表中時,結束待檢測網頁是否是 釣魚網頁的檢測。
[0059] 具體地,在確定待檢測網頁的網址在白名單網址列表中時,可確定用戶訪問的待 檢測網頁是正常網頁,可結束待檢測網頁是否是釣魚網頁的檢測,省去了之后的檢測過程。 由此,提高了檢測效率,提高了檢測準確度。
[0060] 本發(fā)明實施例的釣魚網頁的檢測方法,在提取待檢測網頁的網頁模板特征之前, 可確定待檢測網頁的網址是否在白名單網址列表中,若在,則可結束待檢測網頁是否是釣 魚網頁的檢測,省去了之后的檢測過程,提高了檢測效率,并提高了檢測準確度。
[0061] 圖4是根據(jù)本發(fā)明再一個實施例的釣魚網頁的檢測方法的流程圖。
[0062] 為了進一步提高檢測效率,在提取待檢測網頁的網頁模板特征之前,還可確定待 檢測網頁中是否包含登錄標簽信息,若不包含,則可結束待檢測網頁是否是釣魚網頁的檢 測。具體地,如圖4所示,該釣魚網頁的檢測方法可以包括 :
[0063] S401,確定待檢測網頁的網址是否在白名單網址列表中。
[0064] S402,在確定待檢測網頁的網址不在白名單網址列表中時,確定待檢測網頁中是 否包含登錄標簽信息。
[0065] 例如,可通過判斷待檢測網頁中是否包含〈input type ='password'/>,以確定待 檢測網頁中是否包含登錄標簽信息。
[0066] S403,在確定待檢測網頁中包含登錄標簽信息時,提取待檢測網頁的網頁模板特 征,并獲取網頁模板特征的第一摘要信息。
[0067] S404,確定第一摘要信息是否屬于預設數(shù)據(jù)庫中的第二摘要信息,第二摘要信息 是根據(jù)目標網頁的網頁模板特征所獲取的摘要信息。
[0068] S405,在確定第一摘要信息屬于預設數(shù)據(jù)庫中的第二摘要信息時,進一步確定待 檢測網頁的域名和目標網頁的域名是否一致。
[0069] S406,在確定待檢測網頁的域名和目標網頁的域名不一致時,確定待檢測網頁是 仿冒目標網頁的釣魚網頁。
[0070] S407,向用戶發(fā)送警告信息并提供目標網頁。
[0071] S408,在確定待檢測網頁的網址在白名單網址列表中,或,確定待檢測網頁中不包 含登錄標簽信息時,結束待檢測網頁是否是釣魚網頁的檢測。
[0072] 具體地,在確定待檢測網頁中不包含登錄標簽信息時,可確定用戶訪問的待檢測 網頁不包含登錄頁面,即用戶不需要輸入有關自己的隱私信息(如賬號、密碼等信息)就可 訪問網頁,這樣釣魚網頁對于用戶來說危害會大大減小,此時可結束待檢測網頁是否是釣 魚網頁的檢測,省去了之后的檢測過程。由此,提高了檢測效率。
[0073] 需要說明的是,在本發(fā)明的一個實施例中,步驟S401(即確定待檢測網頁的網址 是否在白名單網址列表中)是可選的。應當理解,在本發(fā)明的另一個實施例中,步驟S402 也可在步驟S401之前執(zhí)行。也就是說,可先確定待檢測網頁中是否包含登錄標簽信息;若 包含,則再確定待檢測網頁的網址是否在白名單網址列表中。
[0074] 本發(fā)明實施例的釣魚網頁的檢測方法,在提取待檢測網頁的網頁模板特征之前, 可確定待檢測網頁的網址是否包含登錄標簽信息,若不包含,則可結束待檢測網頁是否是 釣魚網頁的檢測,省去了之后的檢測過程,進一步提高了檢測效率。
[0075] 為了實現(xiàn)上述實施例,本發(fā)明的實施例還提出一種釣魚網頁的檢測裝置,包括:獲 取模塊,用于提取待檢測網頁的網頁模板特征,并獲取網頁模板特征的第一摘要信息;第一 確定模塊,用于確定第一摘要信息是否屬于預設數(shù)據(jù)庫中的第二摘要信息,第二摘要信息 是根據(jù)目標網頁的網頁模板特征所獲取的摘要信息;第二確定模塊,用于在第一確定模塊 確定第一摘要信息屬于預設數(shù)據(jù)庫中的第二摘要信息時,進一步確定待檢測網頁的域名和 目標網頁的域名是否一致;以及第三確定模塊,用于第二確定模塊確定待檢測網頁的域名 和目標網頁的域名不一致時,確定待檢測網頁是仿冒目標網頁的釣魚網頁。
[0076] 圖5是根據(jù)本發(fā)明一個實施例的釣魚網頁的檢測裝置的結構示意圖。
[0077] 如圖5所示,該釣魚網頁的檢測裝置包括:獲取模塊10、第一確定模塊20、第二確 定模塊30和第三確定模塊40。
[0078] 具體地,獲取模塊10可用于提取待檢測網頁的網頁模板特征,并獲取網頁模板特 征的第一摘要信息。其中,在本發(fā)明的一個實施例中,待檢測網頁可以是用戶登錄頁面。應 當理解,目前網頁數(shù)量非常龐大,保護每個網頁是不現(xiàn)實也是沒必要的,釣魚網站的最終目 的是要盜取用戶的有用信息(如賬號、密碼等信息),由此可知,只需檢測用戶登錄頁面即 可有效地保護了用戶信息,這樣大大的縮減了保護范圍,且將一個不收斂的問題變成了一 個收斂的問題,提高了可行性。
[0079] 此外,在本發(fā)明的一個實施例中,網頁模板特征可包括網頁標題、網頁的描述信 息、網頁的版權信息、網頁的〈hl>〈h2Xh3Xh4>標簽的內容信息、網頁的<p>標簽的內容信 息、網頁的樣式表信息、網頁的表單信息、網頁的導航信息、網頁的標簽框架信息、網頁的顯 示圖標信息等中的至少一種。
[0080] 另外,第一摘要信息可以是HTML文件的信息。應當理解,由于釣魚網頁的URL均 具有時效性,且釣魚網頁的頁面模板會跟被仿冒的目標網頁的模板基本相似,因此,判斷待 檢測網頁是否是釣魚網頁時還需獲取待檢測網頁對應的HTML文件信息,這樣可有效地對 付自動生成的釣魚網頁識別和隨機更新域名的釣魚網站。
[0081] 也就是說,獲取模塊10可先從待檢測網頁(即用戶登錄頁面)中提取網頁模板特 征,之后可從網頁模板特征中獲取網頁中的HTML文件的信息。
[0082] 第一確定模塊20可用于確定第一摘要信息是否屬于預設數(shù)據(jù)庫中的第二摘要信 息,第二摘要信息是根據(jù)目標網頁的網頁模板特征所獲取的摘要信息。其中,在本發(fā)明的一 個實施例中,第二摘要信息可以是HTML文件的信息。
[0083] 具體而言,第一確定模塊20可根據(jù)本地預設的數(shù)據(jù)庫,確定第一摘要信息是否屬 于第二摘要信息;和/或,可將第一摘要信息發(fā)送給云端,以使云端根據(jù)云端數(shù)據(jù)庫確定第 一摘要信息是否屬于預設數(shù)據(jù)庫中的第二摘要信息。。也就是說,本地的預設的數(shù)據(jù)庫可存 儲一些熱度比較大的網頁對應的第二摘要信息,第一確定模塊20可先通過本地引擎對本 地預設的數(shù)據(jù)庫進行掃描,如果本地引擎根據(jù)第一摘要信息在本地預設的數(shù)據(jù)庫中沒有檢 測到對應的第二摘要信息,則可將第一摘要信息發(fā)送給云端,云端根據(jù)云端數(shù)據(jù)庫確定第 一摘要信息是否屬于預設數(shù)據(jù)庫中的第二摘要信息。由此,通過本地引擎和云端引擎雙效 結合,提高了可用性。
[0084] 需要說明的是,在本發(fā)明的一個實施例中,在確定第一摘要信息不屬于預設數(shù)據(jù) 庫中的第二摘要信息時,可返回未知信息,并結束待檢測網頁是否是釣魚網頁的檢測。之 后,可通過人工分析該待檢測網頁是否是釣魚網頁,若不是,則可提取該網頁的網頁模板特 征,并獲取網頁模板特征的第二摘要信息,并將其保存至預設數(shù)據(jù)庫中。由此,可擴大和完 善預設數(shù)據(jù)庫。
[0085] 第二確定模塊30可用于在第一確定模塊20確定第一摘要信息屬于預設數(shù)據(jù)庫中 的第二摘要信息時,進一步確定待檢測網頁的域名和目標網頁的域名是否一致。第三確定 模塊40可用于第二確定模塊確定30待檢測網頁的域名和目標網頁的域名不一致時,確定 待檢測網頁是仿冒目標網頁的釣魚網頁。
[0086] 應當理解,在本發(fā)明的實施例中,在確定第一摘要信息屬于預設數(shù)據(jù)庫中的第二 摘要信息,并確定待檢測網頁的域名和目標網頁的域名一致時,可確定該待檢測網頁是安 全網頁,不是釣魚網頁。
[0087] 本發(fā)明實施例的釣魚網頁的檢測裝置,可通過獲取模塊提取待檢測網頁的網頁模 板特征并獲取其第一摘要信息,第二確定模塊在第一確定模塊確定第一摘要信息屬于預設 數(shù)據(jù)庫中的第二摘要信息時,進一步確定待檢測網頁的域名和目標網頁的域名是否一致, 在不一致時,第三確定模塊確定待檢測網頁是仿冒目標網頁的釣魚網頁,避免了釣魚網頁 的域名具有時效性特點的問題,提高了檢測的準確度,并且能夠從根本上檢測釣魚網站,從 而提高了可行性和可用性。
[0088] 圖6是根據(jù)本發(fā)明另一個實施例的釣魚網頁的檢測裝置的結構示意圖。
[0089] 如圖6所示,該釣魚網頁的檢測裝置可以包括:獲取模塊10、第一確定模塊20、第 二確定模塊30、第三確定模塊40、發(fā)送模塊50。
[0090] 具體地,發(fā)送模塊50可用于在第三確定模塊40確定待檢測網頁是仿冒目標網頁 的釣魚網頁之后,向用戶發(fā)送警告信息并提供目標網頁。更具體地,發(fā)送模塊50在第三確 定模塊40確定待檢測網頁是仿冒目標網頁的釣魚網頁之后,可向用戶發(fā)送警告信息,以提 示用戶正在打開或查看的網頁為釣魚網頁,并將被仿冒的目標網頁的正確網址展現(xiàn)給用 戶,以便用戶到目標網頁去登錄。由此,提升了用戶體驗。
[0091] 可選地,在本發(fā)明的一個實施例中,如圖6所示,該釣魚網頁的檢測裝置還可以包 括第四確定模塊60和退出模塊70。第四確定模塊60可用于在獲取模塊10提取待檢測網 頁的網頁模板特征之前,確定待檢測網頁的網址是否在白名單網址列表中。退出模塊70可 用于在第四確定模塊60確定待檢測網頁的網址在白名單網址列表中時,結束待檢測網頁 是否是釣魚網頁的檢測。
[0092] 更具體地,當用戶打開或查看待檢測網頁時,第四確定模塊60可先獲取待檢測網 頁的網址,之后可判斷待檢測網頁的網址是否在白名單網址列表中。退出模塊70在第四確 定模塊60確定待檢測網頁的網址在白名單網址列表中時,可確定用戶訪問的待檢測網頁 是正常網頁,可結束待檢測網頁是否是釣魚網頁的檢測,省去了之后的檢測過程。由此,提 高了檢測效率,并提高了檢測準確度。
[0093] 可選地,在本發(fā)明的一個實施例中,如圖6所示,該釣魚網頁的檢測裝置還可以包 括第五確定模塊80,第五確定模塊80可用于在獲取模塊10提取待檢測網頁的網頁模板特 征之前,確定待檢測網頁中是否包含登錄標簽信息。其中,在本發(fā)明的一個實施例中,退出 模塊70還可用于在第五確定模塊80確定待檢測網頁中不包含登錄標簽信息時,結束待檢 測網頁是否是釣魚網頁的檢測。
[0094] 例如,第五確定模塊80可通過判斷待檢測網頁中是否包含〈input type =' password' />,以確定待檢測網頁中是否包含登錄標簽信息。退出模塊70在第五確定 模塊80確定待檢測網頁中不包含登錄標簽信息時,可確定用戶訪問的待檢測網頁不包含 登錄頁面,即用戶不需要輸入有關自己的隱私信息(如賬號、密碼等信息)即可訪問網頁, 這樣釣魚網頁對于用戶來說危害會大大減小,此時可結束待檢測網頁是否是釣魚網頁的檢 測,省去了之后的檢測過程。由此,提高了檢測效率。
[0095] 進一步地,在本發(fā)明的一個實施例中,如圖6所示,該釣魚網頁的檢測裝置還可包 括建立模塊90,建立模塊90可用于建立預設數(shù)據(jù)庫。具體而言,在本發(fā)明的實施例中,建立 模塊90可包括獲取單元91、判斷單元92和建立單元93。獲取單元91可用于獲取目標網 頁。判斷單元92可用于判斷目標網頁的訪問量是否超過預設訪問量,和/或,目標網頁的 仿冒次數(shù)是否超過預設仿冒次數(shù)。建立單元93可用于在判斷單元92判斷目標網頁的訪問 量超過預設訪問量,和/或,目標網頁的仿冒次數(shù)超過預設仿冒次數(shù)時,提取目標網頁的網 頁模板特征,并獲取目標網頁的網頁模板特征的第二摘要信息以建立預設數(shù)據(jù)庫。由此,根 據(jù)預設數(shù)據(jù)庫方便確定第一摘要信息是否屬于預設數(shù)據(jù)庫中的第二摘要信息,提高了可用 性。
[0096] 在本發(fā)明的描述中,需要理解的是,術語"第一"、"第二"僅用于描述目的,而不能 理解為指示或暗示相對重要性或者隱含指明所指示的技術特征的數(shù)量。由此,限定有"第 一"、"第二"的特征可以明示或者隱含地包括至少一個該特征。在本發(fā)明的描述中,"多個" 的含義是至少兩個,例如兩個,三個等,除非另有明確具體的限定。
[0097] 流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括 一個或更多個用于實現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部 分,并且本發(fā)明的優(yōu)選實施方式的范圍包括另外的實現(xiàn),其中可以不按所示出或討論的順 序,包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,這應被本發(fā)明 的實施例所屬【技術領域】的技術人員所理解。
[0098] 在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認為是 用于實現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實現(xiàn)在任何計算機可讀介質中,以 供指令執(zhí)行系統(tǒng)、裝置或設備(如基于計算機的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指 令執(zhí)行系統(tǒng)、裝置或設備取指令并執(zhí)行指令的系統(tǒng))使用,或結合這些指令執(zhí)行系統(tǒng)、裝置 或設備而使用。就本說明書而言,"計算機可讀介質"可以是任何可以包含、存儲、通信、傳 播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設備或結合這些指令執(zhí)行系統(tǒng)、裝置或設備而使 用的裝置。計算機可讀介質的更具體的示例(非窮盡性列表)包括以下:具有一個或多個 布線的電連接部(電子裝置),便攜式計算機盤盒(磁裝置),隨機存取存儲器(RAM),只讀 存儲器(ROM),可擦除可編輯只讀存儲器(EPROM或閃速存儲器),光纖裝置,以及便攜式光 盤只讀存儲器(⑶ROM)。另外,計算機可讀介質甚至可以是可在其上打印所述程序的紙或其 他合適的介質,因為可以例如通過對紙或其他介質進行光學掃描,接著進行編輯、解譯或必 要時以其他合適方式進行處理來以電子方式獲得所述程序,然后將其存儲在計算機存儲器 中。
[0099] 應當理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實現(xiàn)。在上述 實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件 或固件來實現(xiàn)。例如,如果用硬件來實現(xiàn),和在另一實施方式中一樣,可用本領域公知的下 列技術中的任一項或他們的組合來實現(xiàn):具有用于對數(shù)據(jù)信號實現(xiàn)邏輯功能的邏輯門電路 的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場 可編程門陣列(FPGA)等。
[0100] 本【技術領域】的普通技術人員可以理解實現(xiàn)上述實施例方法攜帶的全部或部分步 驟是可以通過程序來指令相關的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介 質中,該程序在執(zhí)行時,包括方法實施例的步驟之一或其組合。
[0101] 此外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理模塊中,也可以 是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模 塊既可以采用硬件的形式實現(xiàn),也可以采用軟件功能模塊的形式實現(xiàn)。所述集成的模塊如 果以軟件功能模塊的形式實現(xiàn)并作為獨立的產品銷售或使用時,也可以存儲在一個計算機 可讀取存儲介質中。
[0102] 上述提到的存儲介質可以是只讀存儲器,磁盤或光盤等。
[0103] 在本說明書的描述中,參考術語"一個實施例"、"一些實施例"、"示例"、"具體示 例"、或"一些示例"等的描述意指結合該實施例或示例描述的具體特征、結構、材料或者特 點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不 一定指的是相同的實施例或示例。而且,描述的具體特征、結構、材料或者特點可以在任何 的一個或多個實施例或示例中以合適的方式結合。
[0104] 盡管已經示出和描述了本發(fā)明的實施例,本領域的普通技術人員可以理解:在不 脫離本發(fā)明的原理和宗旨的情況下可以對這些實施例進行多種變化、修改、替換和變型,本 發(fā)明的范圍由權利要求及其等同物限定。
【權利要求】
1. 一種釣魚網頁的檢測方法,其特征在于,包括: 提取待檢測網頁的網頁模板特征,并獲取所述網頁模板特征的第一摘要信息; 確定所述第一摘要信息是否屬于預設數(shù)據(jù)庫中的第二摘要信息,所述第二摘要信息是 根據(jù)目標網頁的網頁模板特征所獲取的摘要信息; 在確定所述第一摘要信息屬于預設數(shù)據(jù)庫中的第二摘要信息時,進一步確定所述待檢 測網頁的域名和所述目標網頁的域名是否一致;以及 在確定所述待檢測網頁的域名和所述目標網頁的域名不一致時,確定所述待檢測網頁 是仿冒所述目標網頁的釣魚網頁。
2. 根據(jù)權利要求1所述的方法,其特征在于,所述待檢測網頁是用戶登錄頁面。
3. 根據(jù)權利要求1所述的方法,其特征在于,所述第一摘要信息和所述第二摘要信息 是HTML文件的信息。
4. 根據(jù)權利要求1所述的方法,其特征在于,所述確定所述第一摘要信息是否屬于預 設數(shù)據(jù)庫中的第二摘要信息,包括: 根據(jù)本地預設的數(shù)據(jù)庫,確定所述第一摘要信息是否屬于第二摘要信息;和/或, 將所述第一摘要信息發(fā)送給云端,以使所述云端根據(jù)云端數(shù)據(jù)庫確定所述第一摘要信 息是否屬于預設數(shù)據(jù)庫中的第二摘要信息。
5. 根據(jù)權利要求1所述的方法,其特征在于,在所述確定所述待檢測網頁是仿冒所述 目標網頁的釣魚網頁之后,還包括: 向用戶發(fā)送警告信息并提供所述目標網頁。
6. 根據(jù)權利要求1或5所述的方法,其特征在于,在所述提取待檢測網頁的網頁模板特 征之前,所述方法還包括: 確定所述待檢測網頁的網址是否在白名單網址列表中; 在確定所述待檢測網頁的網址在白名單網址列表中時,結束所述待檢測網頁是否是所 述釣魚網頁的檢測。
7. 根據(jù)權利要求1或5所述的方法,其特征在于,在所述提取待檢測網頁的網頁模板特 征之前,所述方法還包括: 確定所述待檢測網頁中是否包含登錄標簽信息; 在確定所述待檢測網頁中不包含登錄標簽信息時,結束所述待檢測網頁是否是所述釣 魚網頁的檢測。
8. 根據(jù)權利要求1或5所述的方法,其特征在于,還包括:建立所述預設數(shù)據(jù)庫,所述 建立所述預設數(shù)據(jù)庫,包括: 獲取所述目標網頁,并判斷所述目標網頁的訪問量是否超過預設訪問量,和/或,所述 目標網頁的仿冒次數(shù)是否超過預設仿冒次數(shù); 在判斷所述目標網頁的訪問量超過預設訪問量,和/或,所述目標網頁的仿冒次數(shù)超 過預設仿冒次數(shù)時,提取所述目標網頁的網頁模板特征,并獲取所述目標網頁的網頁模板 特征的第二摘要信息以建立所述預設數(shù)據(jù)庫。
9. 根據(jù)權利要求1或5所述的方法,其特征在于,所述網頁模板特征包括網頁標題、網 頁的描述信息、網頁的版權信息、網頁的〈hl>〈h2Xh3Xh4>標簽的內容信息、網頁的<p>標 簽的內容信息、網頁的樣式表信息、網頁的表單信息、網頁的導航信息、網頁的標簽框架信 息、網頁的顯示圖標信息中的至少一種。
10. -種釣魚網頁的檢測裝置,其特征在于,包括: 獲取模塊,用于提取待檢測網頁的網頁模板特征,并獲取所述網頁模板特征的第一摘 要信息; 第一確定模塊,用于確定所述第一摘要信息是否屬于預設數(shù)據(jù)庫中的第二摘要信息, 所述第二摘要信息是根據(jù)目標網頁的網頁模板特征所獲取的摘要信息; 第二確定模塊,用于在所述第一確定模塊確定所述第一摘要信息屬于預設數(shù)據(jù)庫中的 第二摘要信息時,進一步確定所述待檢測網頁的域名和所述目標網頁的域名是否一致;以 及 第三確定模塊,用于所述第二確定模塊確定所述待檢測網頁的域名和所述目標網頁的 域名不一致時,確定所述待檢測網頁是仿冒所述目標網頁的釣魚網頁。
11. 根據(jù)權利要求10所述的裝置,其特征在于,所述待檢測網頁是用戶登錄頁面。
12. 根據(jù)權利要求10所述的裝置,其特征在于,所述第一摘要信息和所述第二摘要信 息是HTML文件的信息。
13. 根據(jù)權利要求10所述的裝置,其特征在于,所述第一確定模塊具體用于: 根據(jù)本地預設的數(shù)據(jù)庫,確定所述第一摘要信息是否屬于第二摘要信息;和/或, 將所述第一摘要信息發(fā)送給云端,以使所述云端根據(jù)云端數(shù)據(jù)庫確定所述第一摘要信 息是否屬于預設數(shù)據(jù)庫中的第二摘要信息。
14. 根據(jù)權利要求10所述的裝置,其特征在于,還包括: 發(fā)送模塊,用于在所述第三確定模塊確定所述待檢測網頁是仿冒所述目標網頁的釣魚 網頁之后,向用戶發(fā)送警告信息并提供所述目標網頁。
15. 根據(jù)權利要求10或14所述的裝置,其特征在于,還包括: 第四確定模塊,用于在所述獲取模塊提取所述待檢測網頁的網頁模板特征之前,確定 所述待檢測網頁的網址是否在白名單網址列表中;以及 退出模塊,用于在所述第四確定模塊確定所述待檢測網頁的網址在白名單網址列表中 時,結束所述待檢測網頁是否是所述釣魚網頁的檢測。
16. 根據(jù)權利要求10或14所述的裝置,其特征在于,還包括: 第五確定模塊,用于在所述獲取模塊提取所述待檢測網頁的網頁模板特征之前,確定 所述待檢測網頁中是否包含登錄標簽信息;其中, 所述退出模塊還用于在所述第五確定模塊確定所述待檢測網頁中不包含登錄標簽信 息時,結束所述待檢測網頁是否是所述釣魚網頁的檢測。
17. 根據(jù)權利要求10或14所述的裝置,其特征在于,還包括:建立模塊,用于檢測所述 預設數(shù)據(jù)庫,所述建立模塊包括: 獲取單元,用于獲取所述目標網頁; 判斷單元,用于判斷所述目標網頁的訪問量是否超過預設訪問量,和/或,所述目標網 頁的仿冒次數(shù)是否超過預設仿冒次數(shù); 建立單元,用于在所述判斷單元判斷所述目標網頁的訪問量超過預設訪問量,和/或, 所述目標網頁的仿冒次數(shù)超過預設仿冒次數(shù)時,提取所述目標網頁的網頁模板特征,并獲 取所述目標網頁的網頁模板特征的第二摘要信息以建立所述預設數(shù)據(jù)庫。
18.根據(jù)權利要求10或14所述的裝置,其特征在于,所述網頁模板特征包括網頁標題、 網頁的描述信息、網頁的版權信息、網頁的〈hl>〈h2Xh3Xh4>標簽的內容信息、網頁的<p> 標簽的內容信息、網頁的樣式表信息、網頁的表單信息、網頁的導航信息、網頁的標簽框架 信息、網頁的顯示圖標信息中的至少一種。
【文檔編號】H04L29/06GK104050257SQ201410265323
【公開日】2014年9月17日 申請日期:2014年6月13日 優(yōu)先權日:2014年6月13日
【發(fā)明者】梅銀明, 鄒榮新, 劉軍 申請人:百度國際科技(深圳)有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1