本申請實(shí)施例涉及通信技術(shù)領(lǐng)域,特別涉及一種釣魚網(wǎng)站檢測方法和設(shè)備。
背景技術(shù):
現(xiàn)有的釣魚網(wǎng)站檢測方案中,是在用戶被欺詐之后向安全廠商反饋,安全廠商再通過客戶端或人工的方式來對釣魚網(wǎng)站的域名進(jìn)行收集,這樣的方式存在嚴(yán)重的滯后性,無法針對發(fā)布的新釣魚網(wǎng)站進(jìn)行及時(shí)有效地防御,另外釣魚網(wǎng)站的生命周期很短,經(jīng)常更換域名,這樣即使相同的釣魚網(wǎng)站周期性更換域名,現(xiàn)有的檢測方式無法檢測出來。
技術(shù)實(shí)現(xiàn)要素:
本申請?zhí)岢隽艘环N釣魚網(wǎng)站檢測方法和設(shè)備,用以實(shí)現(xiàn)對釣魚網(wǎng)站的實(shí)時(shí)準(zhǔn)確的檢測。
為此,本申請?zhí)岢隽艘环N釣魚網(wǎng)站檢測方法,包括:
檢測待檢測網(wǎng)站中是否存在所述多層次釣魚網(wǎng)站特征樣本集中的特征,所述多層次釣魚網(wǎng)站特征樣本集包含與已知釣魚網(wǎng)站相關(guān)的特征;
若所述待檢測網(wǎng)站中存在所述多層次釣魚網(wǎng)站特征樣本集中的特征,且所述待檢測網(wǎng)站中存在的多層次釣魚網(wǎng)站特征樣本集中的特征的風(fēng)險(xiǎn)評估值總和超過閾值,則確定所述待檢測網(wǎng)站為釣魚網(wǎng)站。
可選的,所述多層次釣魚網(wǎng)站特征樣本集的生成,具體包括:
獲取多層次特征數(shù)據(jù);
在所述多層次特征數(shù)據(jù)中獲取與已知釣魚網(wǎng)站相關(guān)的特征的集合作為多 層次釣魚網(wǎng)站特征樣本集,并基于危害程度和與已知釣魚網(wǎng)站的特征的相關(guān)程度為所述多層次釣魚網(wǎng)站特征樣本集中的特征賦予風(fēng)險(xiǎn)評估值。
可選的,所述網(wǎng)站數(shù)據(jù)包括:新增的網(wǎng)站數(shù)據(jù),更新的網(wǎng)站數(shù)據(jù),預(yù)定領(lǐng)域的網(wǎng)站數(shù)據(jù);
所述獲取網(wǎng)站數(shù)據(jù),具體包括:
定時(shí)獲取預(yù)定時(shí)間內(nèi)新增的網(wǎng)站數(shù)據(jù);和/或
定時(shí)獲取預(yù)定時(shí)間內(nèi)更新的網(wǎng)站數(shù)據(jù);和/或
定時(shí)基于預(yù)定關(guān)鍵字獲取預(yù)定領(lǐng)域的網(wǎng)站數(shù)據(jù)。
可選的,在所述多層次特征數(shù)據(jù)中獲取與已知釣魚網(wǎng)站相關(guān)的特征的集合作為多層次釣魚網(wǎng)站特征樣本集,并基于危害程度和與已知釣魚網(wǎng)站的特征的相關(guān)程度為所述多層次釣魚網(wǎng)站特征樣本集中的特征賦予風(fēng)險(xiǎn)評估值,具體包括:
在所述多層次特征數(shù)據(jù)中獲取與已知釣魚網(wǎng)站相關(guān)的特征的集合作為多層次釣魚網(wǎng)站特征樣本集,并根據(jù)與已知釣魚網(wǎng)站的特征的相關(guān)程度為所述多層次釣魚網(wǎng)站特征樣本集中的特征分別賦予相關(guān)程度值,其中,相關(guān)程度越高,相關(guān)程度值越大;
基于所述多層次釣魚網(wǎng)站特征樣本集中的特征在所述多層次特征數(shù)據(jù)出現(xiàn)的頻率確定所述多層次釣魚網(wǎng)站特征樣本集中的特征的危害程度,并基于危害程度為所述多層次釣魚網(wǎng)站特征樣本集中的特征分別賦予危害程度值;
基于所述相關(guān)程度值和所述危害程度值為所述多層次釣魚網(wǎng)站特征樣本集中的特征賦予風(fēng)險(xiǎn)評估值。
可選的,所述已知釣魚網(wǎng)站的特征是通過對已知的釣魚網(wǎng)站進(jìn)行聚類分析提取的;
所述已知釣魚網(wǎng)站的特征,包括:
網(wǎng)站代碼信息,網(wǎng)站域名信息,網(wǎng)站所屬人信息。
可選的,所述方法還包括:
當(dāng)確定所述網(wǎng)站為釣魚網(wǎng)站時(shí),提取所述網(wǎng)站的特征作為已知釣魚網(wǎng)站的特征,并攔截所述網(wǎng)站,以及通知給用戶。
本申請還提出了一種釣魚網(wǎng)站檢測設(shè)備,包括:
檢測模塊,用于檢測待檢測網(wǎng)站中是否存在所述多層次釣魚網(wǎng)站特征樣本集中的特征,所述多層次釣魚網(wǎng)站特征樣本集包含與已知釣魚網(wǎng)站相關(guān)的特征;
確定模塊,用于當(dāng)所述待檢測網(wǎng)站中存在所述多層次釣魚網(wǎng)站特征樣本集中的特征,且所述待檢測網(wǎng)站中存在的多層次釣魚網(wǎng)站特征樣本集中的特征的風(fēng)險(xiǎn)評估值總和超過閾值時(shí),確定所述待檢測網(wǎng)站為釣魚網(wǎng)站。
可選的,所述釣魚網(wǎng)站檢測設(shè)備還包括:還包括:獲取模塊和處理模塊;
其中,獲取模塊,用于獲取多層次特征數(shù)據(jù);
處理模塊,在所述多層次特征數(shù)據(jù)中獲取與已知釣魚網(wǎng)站相關(guān)的特征的集合作為多層次釣魚網(wǎng)站特征樣本集,并基于危害程度和與已知釣魚網(wǎng)站的特征的相關(guān)程度為所述多層次釣魚網(wǎng)站特征樣本集中的特征賦予風(fēng)險(xiǎn)評估值。
可選的,所述多層次特征數(shù)據(jù)包括:新增的網(wǎng)站數(shù)據(jù),更新的網(wǎng)站數(shù)據(jù),預(yù)定領(lǐng)域的網(wǎng)站數(shù)據(jù);
所述獲取模塊,具體用于:
定時(shí)獲取預(yù)定時(shí)間內(nèi)新增的網(wǎng)站數(shù)據(jù);和/或
定時(shí)獲取預(yù)定時(shí)間內(nèi)更新的網(wǎng)站數(shù)據(jù);和/或
定時(shí)基于預(yù)定關(guān)鍵字獲取預(yù)定領(lǐng)域的網(wǎng)站數(shù)據(jù)。
可選的,所述處理模塊,具體用于:
在所述多層次特征數(shù)據(jù)中獲取與已知釣魚網(wǎng)站相關(guān)的特征的集合作為多層次釣魚網(wǎng)站特征樣本集,并根據(jù)與已知釣魚網(wǎng)站的特征的相關(guān)程度為所述 多層次釣魚網(wǎng)站特征樣本集中的特征分別賦予相關(guān)程度值,其中,相關(guān)程度越高,相關(guān)程度值越大;
基于所述多層次釣魚網(wǎng)站特征樣本集中的特征在所述多層次特征數(shù)據(jù)出現(xiàn)的頻率確定所述多層次釣魚網(wǎng)站特征樣本集中的特征的危害程度,并基于危害程度為所述多層次釣魚網(wǎng)站特征樣本集中的特征分別賦予危害程度值;
基于所述相關(guān)程度值和所述危害程度值為所述多層次釣魚網(wǎng)站特征樣本集中的特征賦予風(fēng)險(xiǎn)評估值。
可選的,所述已知釣魚網(wǎng)站的特征是通過對已知的釣魚網(wǎng)站進(jìn)行聚類分析提取的;
所述已知釣魚網(wǎng)站的特征,包括:
網(wǎng)站代碼信息,網(wǎng)站域名信息,網(wǎng)站所屬人信息。
可選的,所述設(shè)備還包括:
攔截模塊,用于當(dāng)確定所述網(wǎng)站為釣魚網(wǎng)站時(shí),提取所述網(wǎng)站的特征作為已知釣魚網(wǎng)站的特征,并攔截所述網(wǎng)站,以及通知給用戶。
與現(xiàn)有技術(shù)相比,本申請中通過多層次特征數(shù)據(jù)和已知釣魚網(wǎng)站的特征來獲取與所述特征相關(guān)的多層次釣魚網(wǎng)站特征樣本集,基于危害程度和與已知釣魚網(wǎng)站的特征的相關(guān)程度為所述多層次釣魚網(wǎng)站特征樣本集中的特征賦予風(fēng)險(xiǎn)評估值,以便后續(xù)需要檢測所述網(wǎng)站時(shí),利用多層次釣魚網(wǎng)站特征樣本集對網(wǎng)站進(jìn)行檢測,以此實(shí)現(xiàn)了對釣魚網(wǎng)站的及時(shí)準(zhǔn)確的檢測。
附圖說明
圖1為本申請實(shí)施例提出的一種釣魚網(wǎng)站檢測方法的流程示意圖;
圖2為本申請實(shí)施例中的獲取多層次釣魚網(wǎng)站特征樣本集中特征的示意圖;
圖3為本申請實(shí)施例提出的一種釣魚網(wǎng)站檢測設(shè)備的結(jié)構(gòu)示意圖。
具體實(shí)施方式
如背景技術(shù),現(xiàn)有技術(shù)中無法實(shí)時(shí)準(zhǔn)確地檢測到釣魚網(wǎng)站,本申請中公開了一種釣魚網(wǎng)站檢測方法和設(shè)備,實(shí)現(xiàn)了對釣魚網(wǎng)站的實(shí)時(shí)準(zhǔn)確識別。
本申請實(shí)施例一公開了一種釣魚網(wǎng)站檢測方法,如圖1所示,包括以下步驟:
步驟101、檢測待檢測網(wǎng)站中是否存在多層次釣魚網(wǎng)站特征樣本集中的特征,多層次釣魚網(wǎng)站特征樣本集包含與已知釣魚網(wǎng)站相關(guān)的特征。
當(dāng)需要對網(wǎng)站進(jìn)行檢測時(shí),例如當(dāng)瀏覽到某個(gè)網(wǎng)站時(shí),啟動(dòng)對該網(wǎng)站的檢測,具體的,提取該待檢測網(wǎng)站的特征,并判斷該待檢測網(wǎng)站中的特征中是否存在多層次釣魚網(wǎng)站特征樣本集中的特征,例如檢測的結(jié)果為存在(例如存在多層次釣魚網(wǎng)站特征樣本集中的特征1、特征2、特征3)或者不存在任何特征;而具體的,多層次釣魚網(wǎng)站特征樣本集中的生成,具體包括以下步驟:
步驟A、獲取多層次特征數(shù)據(jù)。
其中,多層次特征數(shù)據(jù),具體用于查找與一個(gè)或多個(gè)特征相關(guān)的多個(gè)層次的特征,例如通過多層次特征數(shù)據(jù)查找特征1確定與特征1相關(guān)的特征(例如特征2),繼續(xù)查找與特征2相關(guān)的特征(例如特征3),以此類推,由于后續(xù)利用多層次特征數(shù)據(jù)查找與釣魚網(wǎng)站的特征相關(guān)的多層次釣魚網(wǎng)站特征數(shù)據(jù),因此多層次特征數(shù)據(jù)可以包括但不限于:新增的網(wǎng)站數(shù)據(jù),更新的網(wǎng)站數(shù)據(jù),預(yù)定領(lǐng)域的網(wǎng)站數(shù)據(jù);獲取多層次特征數(shù)據(jù),具體包括:定時(shí)獲取預(yù)定時(shí)間內(nèi)新增的網(wǎng)站數(shù)據(jù);和/或定時(shí)獲取預(yù)定時(shí)間內(nèi)更新的網(wǎng)站數(shù)據(jù);和/或定時(shí)基于預(yù)定關(guān)鍵字獲取預(yù)定領(lǐng)域的網(wǎng)站數(shù)據(jù)。
具體的,為了保證識別的準(zhǔn)確性,需要在一定范圍內(nèi)進(jìn)行已知釣魚網(wǎng)站的特征的匹配,而范圍越大,準(zhǔn)確性越高,因此獲取多層次特征數(shù)據(jù)以便后 續(xù)利用多層次特征數(shù)據(jù)對已知釣魚網(wǎng)站的特征進(jìn)行匹配,而考慮到多層次特征數(shù)據(jù)是實(shí)時(shí)變化的,不斷有新的網(wǎng)站產(chǎn)生,也不斷有網(wǎng)站的數(shù)據(jù)發(fā)生更新,因此定時(shí)獲取新增的網(wǎng)站數(shù)據(jù)和更新的網(wǎng)站數(shù)據(jù),另外,考慮到釣魚網(wǎng)站是用于竊取用戶提交的銀行帳號、密碼等私密信息的,以此來達(dá)到非法獲利的目的,因此可以有針對性的獲取在金融,電子商務(wù)等領(lǐng)域的網(wǎng)站的網(wǎng)站數(shù)據(jù);具體的網(wǎng)站數(shù)據(jù)可以利用關(guān)鍵字來獲取,例如以“中獎(jiǎng)”為關(guān)鍵詞獲取所有與之相關(guān)的網(wǎng)站的網(wǎng)站數(shù)據(jù),除此以外,還可以基于網(wǎng)站的特征(例如域名注冊信息、域名所屬人信息,域名注冊地信息等)來獲取與網(wǎng)站的特征相關(guān)網(wǎng)站的網(wǎng)站數(shù)據(jù)。
步驟B、在多層次特征數(shù)據(jù)中獲取與已知釣魚網(wǎng)站相關(guān)的特征的集合作為多層次釣魚網(wǎng)站特征樣本集,并基于危害程度和與已知釣魚網(wǎng)站的特征的相關(guān)程度為多層次釣魚網(wǎng)站特征樣本集中的特征賦予風(fēng)險(xiǎn)評估值。
具體的在獲取了多層次特征數(shù)據(jù)之后,需要基于已知釣魚網(wǎng)站的特征作為關(guān)鍵字來在多層次特征數(shù)據(jù)中找與已知釣魚網(wǎng)站的特征的相關(guān)特征的集合來作為多層次釣魚網(wǎng)站特征樣本集,而具體的已知釣魚網(wǎng)站的特征可以通過對已知的釣魚網(wǎng)站進(jìn)行聚類分析提取的。
例如已知的釣魚網(wǎng)站有網(wǎng)站1,網(wǎng)站2,網(wǎng)站3,對該三個(gè)網(wǎng)站進(jìn)行聚類分析,獲取這三個(gè)網(wǎng)站的特征,例如網(wǎng)站中網(wǎng)頁的源碼、域名及子域名、網(wǎng)站所屬人信息等;以此通過收集已知釣魚網(wǎng)站的數(shù)據(jù)來得到已知釣魚網(wǎng)站的特征;而具體的已知釣魚網(wǎng)站的特征中,可以包括:網(wǎng)站代碼信息(例如關(guān)鍵腳本等信息),網(wǎng)站域名信息(例如網(wǎng)站域名申請人,聯(lián)系人,注冊商、時(shí)間、域名服務(wù)器等信息),網(wǎng)站所屬人信息(例如網(wǎng)站域名所屬人姓名,網(wǎng)站所屬人的交際關(guān)系,網(wǎng)站所屬人經(jīng)常訪問的網(wǎng)站以及IP,所屬人的其他網(wǎng)站等信息),當(dāng)然除此以外,還可以包括很多其他的特征,例如已知釣魚網(wǎng)站的外鏈等,只要能體現(xiàn)釣魚網(wǎng)站的特征,該特征可以標(biāo)識釣魚網(wǎng)站就都可以,并不 限于以上的幾種特征,該特征可以是釣魚網(wǎng)站的所有特征。
在獲取了多層次特征數(shù)據(jù)以及已知釣魚網(wǎng)站的特征之后,需要在在多層次特征數(shù)據(jù)中獲取與已知釣魚網(wǎng)站相關(guān)的特征的集合作為多層次釣魚網(wǎng)站特征樣本集,并基于危害程度和與已知釣魚網(wǎng)站的特征的相關(guān)程度為多層次釣魚網(wǎng)站特征樣本集中的特征賦予風(fēng)險(xiǎn)評估值,其具體的過程如下:
在多層次特征數(shù)據(jù)中獲取與已知釣魚網(wǎng)站相關(guān)的特征的集合作為多層次釣魚網(wǎng)站特征樣本集,并根據(jù)與已知釣魚網(wǎng)站的特征的相關(guān)程度為多層次釣魚網(wǎng)站特征樣本集中的特征分別賦予相關(guān)程度值,其中,相關(guān)程度越高,相關(guān)程度值越大;基于多層次釣魚網(wǎng)站特征樣本集中的特征在多層次特征數(shù)據(jù)出現(xiàn)的頻率確定多層次釣魚網(wǎng)站特征樣本集中的特征的危害程度,并基于危害程度為多層次釣魚網(wǎng)站特征樣本集中的特征分別賦予危害程度值;基于相關(guān)程度值和危害程度值為多層次釣魚網(wǎng)站特征樣本集中的特征賦予風(fēng)險(xiǎn)評估值。
具體的,多層次釣魚網(wǎng)站特征樣本集中包含有與已知釣魚網(wǎng)站相關(guān)的特征數(shù)據(jù),以已知釣魚網(wǎng)站的特征中的網(wǎng)站域名信息來進(jìn)行說明,例如要查找的釣魚網(wǎng)站的網(wǎng)站域名信息是網(wǎng)站域名申請人(例如為申請人A),也即利用申請人A來作為第一層特征數(shù)據(jù),在多層次特征數(shù)據(jù)中查找與申請人A相關(guān)的其他層的特征數(shù)據(jù),例如第二層特征數(shù)據(jù)為申請人A申請的其他域名,申請人A的交際圈中的其他人(例如用戶B、用戶C等),申請人A經(jīng)常訪問的網(wǎng)站信息(例如網(wǎng)站1、網(wǎng)站2)等等,即第二層特征數(shù)據(jù)為與申請人A直接相關(guān)的特征數(shù)據(jù);除了直接相關(guān)的特征數(shù)據(jù),還可以有間接相關(guān)的特征數(shù)據(jù),例如第三層特征數(shù)據(jù),以上述為例,還可以查找用戶B,用戶C所申請的域名,用戶B,用戶C的人際關(guān)系中與之相關(guān)的其他人,用戶B,用戶C經(jīng)常訪問的網(wǎng)站信息,用戶B,用戶C的賬戶溝通信息等等,除此以外,還可以基于第二層特征數(shù)據(jù)查找第三層特征數(shù)據(jù),以此類推。除此以外,還有 其他的釣魚網(wǎng)站的特征數(shù)據(jù),例如代碼1,可以查找代碼1所存在的其他網(wǎng)站,與代碼1相識度達(dá)到一定程度的其他代碼(例如代碼2),以及代碼2所存在的網(wǎng)站(例如網(wǎng)站4),還可以繼續(xù)查找網(wǎng)站4的申請人,域名信息等等,其他的,例如網(wǎng)站所屬人信息等等與此類似,所查找到的特征數(shù)據(jù)(包括已知釣魚網(wǎng)站的特征)的集合即為多層次釣魚網(wǎng)站特征樣本集。
而具體的在生成多層次釣魚網(wǎng)站特征樣本集之后,為多層次釣魚網(wǎng)站特征樣本集中的特征進(jìn)行賦值,其中賦予的值有相關(guān)程度值和危害程度值,例如其他人(例如B)申請的域名等等,以此類推;例如網(wǎng)站域名申請人為A,則在多層次特征數(shù)據(jù)中查找A所申請的其他域名,例如A還申請了域名1(例如賦予相關(guān)程度值為0.5)以及域名2(例如賦予相關(guān)程度值為0.6)、該域名1和域名2是多層次釣魚網(wǎng)站特征樣本集中的特征,繼續(xù)在網(wǎng)站數(shù)據(jù)中查找域名1的網(wǎng)站特征(例如,源代碼,關(guān)鍵腳本,網(wǎng)站域名所屬人信息等等),和域名2的網(wǎng)站特征,域名1的網(wǎng)站特征與域名2的網(wǎng)站特征也同樣是多層次釣魚網(wǎng)站特征樣本集中的特征,并以查找到的域名1的網(wǎng)站特征和域名2的網(wǎng)站特征在多層次特征數(shù)據(jù)中繼續(xù)查找;另外還可以查找A的交際圈,例如查找到A經(jīng)常聯(lián)系的或者有經(jīng)濟(jì)往來的有B(例如賦予相關(guān)程度值為0.7)和C(例如賦予相關(guān)程度值為0.8),則繼續(xù)在多層次特征數(shù)據(jù)中對B和C進(jìn)行與A相同的查找,以此類推;上述的值都是相關(guān)程度值,至于危害程度值,則獲取上述查找到的多層次釣魚網(wǎng)站特征樣本集中的特征在多層次特征數(shù)據(jù)中的出現(xiàn)次數(shù),并按照次數(shù)多少賦予危害程度值,例如B出現(xiàn)的次數(shù)有109次,為其賦予危害程度值為9,則B作為多層次釣魚網(wǎng)站特征樣本集中的特征,基于相關(guān)程度值與危害程度值為該特征賦予風(fēng)險(xiǎn)評估值,其中該特征的風(fēng)險(xiǎn)評估值可以是該特征的相關(guān)程度值與危害程度值的乘積,即為6.3=0.7×9,也可以是相關(guān)程度值與危害程度值平方的乘積,如為56.7=0.7×92,當(dāng)然除此以外,還可以基于別的規(guī)則或者算法來確定風(fēng)險(xiǎn)評估值,只要是基于相關(guān)程 度和危害程度來確定的即可。以此在多層次特征數(shù)據(jù)中找到與已知釣魚網(wǎng)站的特征相關(guān)的多層次釣魚網(wǎng)站特征樣本集中的特征,形成如圖2所示的多層次釣魚網(wǎng)站特征樣本集的特征圖。
以已知釣魚網(wǎng)站的特征作為出發(fā)點(diǎn),不斷查找與已知釣魚網(wǎng)站相關(guān)的特征(例如命名為特征1),并繼續(xù)查找與特征1(例如為代碼1)相關(guān)的特征2(例如為代碼2),查找與特征2相關(guān)的特征3(例如為網(wǎng)站4),其中,特征1、2、3都是特征與已知釣魚網(wǎng)站的特征相關(guān)的多層次釣魚網(wǎng)站特征樣本集中的特征,除了特征1、2、3以外,還可以有其他的數(shù)據(jù),例如域名(例如123.168.02.15),釣魚網(wǎng)站的申請人(例如為姓名,劉某某)等等,其中在獲取多層次釣魚網(wǎng)站特征樣本集中的特征時(shí),是針對一個(gè)一個(gè)的釣魚網(wǎng)站的特征進(jìn)行查找的,可以繼續(xù)查找與域名123.168.2.15相關(guān)的特征,例如域名123.168.23.16與域名123.168.2.15屬于同一服務(wù)器,就可以將域名123.168.23.16設(shè)置為與域名123.168.2.15相關(guān)的下一層域名,至于申請人,可以查找與劉某某存在經(jīng)濟(jì)關(guān)系的其他人,例如陳某某等等,以此不斷的向深層次進(jìn)行查找,后續(xù)利用多層次釣魚網(wǎng)站特征樣本集中的特征則是首先提取待檢測的網(wǎng)站的特征,來一個(gè)一個(gè)匹配多層次釣魚網(wǎng)站特征數(shù)據(jù),若匹配上,則根據(jù)匹配上的特征的權(quán)值來對網(wǎng)站進(jìn)行識別,以此將所有看似沒有關(guān)聯(lián)的信息關(guān)聯(lián)起來,并根據(jù)相關(guān)程度賦予權(quán)值,具體的若權(quán)值越高,就說明與已知釣魚網(wǎng)站的相關(guān)程度越高,也即存在該特征的網(wǎng)站是釣魚網(wǎng)站的可能越高。
步驟102、若待檢測網(wǎng)站中存在多層次釣魚網(wǎng)站特征樣本集中的特征,且待檢測網(wǎng)站中存在的多層次釣魚網(wǎng)站特征樣本集中的特征的風(fēng)險(xiǎn)評估值總和超過閾值,則確定待檢測網(wǎng)站為釣魚網(wǎng)站。
仍以上述為例進(jìn)行說明,若檢測結(jié)果為網(wǎng)站中存在多層次釣魚網(wǎng)站特征樣本集中的特征,例如存在特征1(假設(shè)風(fēng)險(xiǎn)評估值為1.8)、特征2(假設(shè)風(fēng)險(xiǎn)評估值為3.2)、特征3(假設(shè)風(fēng)險(xiǎn)評估值為為4.5),其風(fēng)險(xiǎn)評估值總和為 10.3=1.8+3.2+4.5,而閾值為10,則可以確定該網(wǎng)站為釣魚網(wǎng)站;而若是風(fēng)險(xiǎn)評估值總和不超過閾值,則認(rèn)為該網(wǎng)站為正常網(wǎng)站,并繼續(xù)檢測需要檢測的網(wǎng)站。
在步驟104之后,也即在判斷了網(wǎng)站為釣魚網(wǎng)站后,提取網(wǎng)站的特征為已知釣魚網(wǎng)站的特征存儲在預(yù)設(shè)的釣魚網(wǎng)站數(shù)據(jù)庫中,同時(shí)攔截網(wǎng)站,以及將檢測的結(jié)果通知給用戶;以此不斷的豐富已知釣魚網(wǎng)站的特征,以便后續(xù)更好地識別釣魚網(wǎng)站。
為了對本申請進(jìn)行進(jìn)一步的說明,本申請實(shí)施例二還公開了一種釣魚網(wǎng)站檢測設(shè)備,如圖3所示,包括:
檢測模塊301,用于檢測待檢測網(wǎng)站中是否存在所述多層次釣魚網(wǎng)站特征樣本集中的特征,所述多層次釣魚網(wǎng)站特征樣本集包含與已知釣魚網(wǎng)站相關(guān)的特征;;
確定模塊302,用于當(dāng)所述待檢測網(wǎng)站中存在所述多層次釣魚網(wǎng)站特征樣本集中的特征,且所述待檢測網(wǎng)站中存在的多層次釣魚網(wǎng)站特征樣本集中的特征的風(fēng)險(xiǎn)評估值總和超過閾值時(shí),確定所述待檢測網(wǎng)站為釣魚網(wǎng)站。
具體的,所述釣魚網(wǎng)站檢測設(shè)備還包括:獲取模塊和處理模塊;其中,
獲取模塊,用于獲取多層次特征數(shù)據(jù);
處理模塊,用于在所述多層次特征數(shù)據(jù)中獲取與已知釣魚網(wǎng)站相關(guān)的特征的集合作為多層次釣魚網(wǎng)站特征樣本集,并基于危害程度和與已知釣魚網(wǎng)站的特征的相關(guān)程度為所述多層次釣魚網(wǎng)站特征樣本集中的特征賦予風(fēng)險(xiǎn)評估值。
所述多層次特征數(shù)據(jù)包括:新增的網(wǎng)站數(shù)據(jù),更新的網(wǎng)站數(shù)據(jù),預(yù)定領(lǐng)域的網(wǎng)站數(shù)據(jù);
所述獲取模塊,具體用于:
定時(shí)獲取預(yù)定時(shí)間內(nèi)新增的網(wǎng)站數(shù)據(jù);和/或
定時(shí)獲取預(yù)定時(shí)間內(nèi)更新的網(wǎng)站數(shù)據(jù);和/或
定時(shí)基于預(yù)定關(guān)鍵字獲取預(yù)定領(lǐng)域的網(wǎng)站數(shù)據(jù)。
具體的,所述處理模塊,具體用于:
在所述多層次特征數(shù)據(jù)中獲取與已知釣魚網(wǎng)站相關(guān)的特征的集合作為多層次釣魚網(wǎng)站特征樣本集,并根據(jù)與已知釣魚網(wǎng)站的特征的相關(guān)程度為所述多層次釣魚網(wǎng)站特征樣本集中的特征分別賦予相關(guān)程度值,其中,相關(guān)程度越高,相關(guān)程度值越大;
基于所述多層次釣魚網(wǎng)站特征樣本集中的特征在所述多層次特征數(shù)據(jù)出現(xiàn)的頻率確定所述多層次釣魚網(wǎng)站特征樣本集中的特征的危害程度,并基于危害程度為所述多層次釣魚網(wǎng)站特征樣本集中的特征分別賦予危害程度值;
基于所述相關(guān)程度值和所述危害程度值為所述多層次釣魚網(wǎng)站特征樣本集中的特征賦予風(fēng)險(xiǎn)評估值。
具體的,所述已知釣魚網(wǎng)站的特征是通過對已知的釣魚網(wǎng)站進(jìn)行聚類分析提取的;
所述已知釣魚網(wǎng)站的特征,包括:
網(wǎng)站代碼信息,網(wǎng)站域名信息,網(wǎng)站所屬人信息。
具體的,所述設(shè)備還包括:
攔截模塊,用于當(dāng)確定所述網(wǎng)站為釣魚網(wǎng)站時(shí),提取所述網(wǎng)站的特征作為已知釣魚網(wǎng)站的特征,并攔截所述網(wǎng)站,以及通知給用戶。
與現(xiàn)有技術(shù)相比,本申請中通過多層次特征數(shù)據(jù)和已知釣魚網(wǎng)站的特征來獲取與所述特征相關(guān)的多層次釣魚網(wǎng)站特征樣本集,基于危害程度和與已知釣魚網(wǎng)站的特征的相關(guān)程度為所述多層次釣魚網(wǎng)站特征樣本集中的特征賦予風(fēng)險(xiǎn)評估值,以便后續(xù)需要檢測所述網(wǎng)站時(shí),利用多層次釣魚網(wǎng)站特征樣 本集對網(wǎng)站進(jìn)行檢測,以此實(shí)現(xiàn)了對釣魚網(wǎng)站的及時(shí)準(zhǔn)確的檢測。
通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本申請可以通過硬件實(shí)現(xiàn),也可以借助軟件加必要的通用硬件平臺的方式來實(shí)現(xiàn)。基于這樣的理解,本申請的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來,該軟件產(chǎn)品可以存儲在一個(gè)非易失性存儲介質(zhì)(可以是CD-ROM,U盤,移動(dòng)硬盤等)中,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請各個(gè)實(shí)施場景所述的方法。
本領(lǐng)域技術(shù)人員可以理解附圖只是一個(gè)優(yōu)選實(shí)施場景的示意圖,附圖中的模塊或流程并不一定是實(shí)施本申請所必須的。
本領(lǐng)域技術(shù)人員可以理解實(shí)施場景中的裝置中的模塊可以按照實(shí)施場景描述進(jìn)行分布于實(shí)施場景的裝置中,也可以進(jìn)行相應(yīng)變化位于不同于本實(shí)施場景的一個(gè)或多個(gè)裝置中。上述實(shí)施場景的模塊可以合并為一個(gè)模塊,也可以進(jìn)一步拆分成多個(gè)子模塊。
上述本申請序號僅僅為了描述,不代表實(shí)施場景的優(yōu)劣。
以上公開的僅為本申請的幾個(gè)具體實(shí)施場景,但是,本申請并非局限于此,任何本領(lǐng)域的技術(shù)人員能思之的變化都應(yīng)落入本申請的保護(hù)范圍。