專利名稱:一種基于特征識(shí)別的欺詐信息過(guò)濾系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息安全領(lǐng)域,尤其涉及一種基于特征識(shí)別的欺詐信息過(guò)濾系統(tǒng)及方法。
背景技術(shù):
隨著網(wǎng)上銀行的普及,網(wǎng)銀欺詐類短信和郵件日益猖獗,通常這類欺詐短信或郵件中內(nèi)嵌有釣魚網(wǎng)站鏈接,由于其網(wǎng)址和網(wǎng)頁(yè)內(nèi)容與銀行的官方網(wǎng)站高度相仿,用戶很容易受其誘導(dǎo)而訪問(wèn)釣魚網(wǎng)站,并在釣魚網(wǎng)站上輸入自己的網(wǎng)上銀行賬號(hào)和密碼等信息,從而導(dǎo)致用戶的銀行賬戶被盜,給用戶造成直接的經(jīng)濟(jì)損失?,F(xiàn)有的垃圾短信過(guò)濾系統(tǒng)主要是通過(guò)貝葉斯、支持向量機(jī)(SVM)等分類算法來(lái)判斷并向用戶提示垃圾信息的。貝葉斯分類是利用概率統(tǒng)計(jì)知識(shí)進(jìn)行分類的算法,而支持向量機(jī)(SVM)是通過(guò)構(gòu)造最優(yōu)線性分類面來(lái)指導(dǎo)分類的,這兩種算法都是統(tǒng)計(jì)學(xué)習(xí)分類算法,即基于一定的特征集,通過(guò)自適應(yīng)的學(xué)習(xí),判斷出垃圾信息。上述垃圾短信過(guò)濾系統(tǒng)在判斷出垃圾信息后的處理也比較簡(jiǎn)單,只是將短信或郵件標(biāo)記為垃圾信息,不區(qū)分危害性更大的網(wǎng)銀欺詐類信息與一般的廣告類垃圾信息,更不會(huì)結(jié)合檢測(cè)出的垃圾信息做聯(lián)動(dòng)的防釣魚處理,因此無(wú)法防范用戶被釣魚。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題是提供一種基于特征識(shí)別的欺詐信息過(guò)濾系統(tǒng),它可以有效過(guò)濾欺詐類信息,降低用戶因資金賬號(hào)被盜而遭受經(jīng)濟(jì)損失的概率。為解決上述技術(shù)問(wèn)題,本發(fā)明的基于特征識(shí)別的欺詐信息過(guò)濾系統(tǒng),包括客戶端和服務(wù)端,客戶端包括特征識(shí)別子系統(tǒng)、分類過(guò)濾子系統(tǒng)和信息攔截中心,特征識(shí)別子系統(tǒng)設(shè)置在分類過(guò)濾子系統(tǒng)之前,用于根據(jù)接收到的信息的特征,識(shí)別出欺詐信息;分類過(guò)濾子系統(tǒng)與特征識(shí)別子系統(tǒng)連接,用于對(duì)進(jìn)入分類過(guò)濾子系統(tǒng)的信息進(jìn)行分類,識(shí)別出垃圾信息;信息攔截中心用于攔截上述兩個(gè)子系統(tǒng)識(shí)別出的欺詐信息和垃圾信息;服務(wù)端通過(guò)網(wǎng)絡(luò)連接與客戶端連接,且服務(wù)端設(shè)置有安全服務(wù)云中心,用于監(jiān)控客戶端的進(jìn)程,并通過(guò)網(wǎng)絡(luò)與客戶端保持?jǐn)?shù)據(jù)同步。所述特征識(shí)別子系統(tǒng)進(jìn)一步包括特征數(shù)據(jù)庫(kù),用于存儲(chǔ)欺詐信息的來(lái)源特征、行為特征以及內(nèi)容特征;來(lái)源識(shí)別模塊,與特征數(shù)據(jù)庫(kù)連接,用于根據(jù)特征數(shù)據(jù)庫(kù)中的來(lái)源特征,判斷用戶收到的信息是否是欺詐信息;行為識(shí)別模塊,與特征數(shù)據(jù)庫(kù)連接,用于根據(jù)特征數(shù)據(jù)庫(kù)中的行為特征,判斷用戶收到的信息是否是欺詐信息;可選的行為特征包括被叫號(hào)碼是否相鄰、短信發(fā)送頻率、短、信發(fā)送量、發(fā)送成功率、回復(fù)率等,相應(yīng)的判斷結(jié)果可以補(bǔ)充黑名單及分類模塊的學(xué)習(xí)素材;內(nèi)容識(shí)別模塊,與特征數(shù)據(jù)庫(kù)連接,用于根據(jù)特征數(shù)據(jù)庫(kù)中的內(nèi)容特征,判斷用戶收到的信息是否是欺詐信息。可選的內(nèi)容特征包括銀行名稱、官方網(wǎng)址、客服電話,短信中出現(xiàn)的網(wǎng)址、客服電話等。本發(fā)明要解決的另一技術(shù)問(wèn)題是提供上述系統(tǒng)的實(shí)現(xiàn)方法。為解決上述技術(shù)問(wèn)題,本發(fā)明的基于特征識(shí)別的欺詐信息過(guò)濾方法,包括以下步驟I)用戶收到新信息;
2)檢測(cè)該信息是否是欺詐信息,若是,則將該信息標(biāo)識(shí)為欺詐信息,并對(duì)其進(jìn)行攔截;若否,則轉(zhuǎn)到步驟3);3)檢測(cè)該彳目息是否是垃圾/[目息,若是,則將該 目息標(biāo)識(shí)為垃圾 目息,并對(duì)其進(jìn)行攔截;若否,則將該信息顯示給用戶。所述步驟2)中,通過(guò)將該信息的特征與欺詐信息的特征進(jìn)行比對(duì),來(lái)判斷該信息是否是欺詐息。所述特征包括信息的來(lái)源特征、行為特征以及內(nèi)容特征。識(shí)別出欺詐信息后,可以進(jìn)一步通知后臺(tái)的安全服務(wù)云中心監(jiān)控該欺詐信息,并進(jìn)行聯(lián)動(dòng)的防釣魚處理。與現(xiàn)有的垃圾信息過(guò)濾系統(tǒng)相比,本發(fā)明的欺詐信息過(guò)濾系統(tǒng)及其實(shí)現(xiàn)方法,具有以下優(yōu)點(diǎn)和有益效果I、通過(guò)特征檢測(cè),準(zhǔn)確識(shí)別出欺詐信息,從而能夠?qū)⑽:π愿蟮木W(wǎng)銀欺詐類信息與普通的廣告類垃圾信息區(qū)分開(kāi)來(lái),避免用戶受欺詐信息誘導(dǎo)而導(dǎo)致資金賬戶被盜。2、后臺(tái)的安全服務(wù)云中心能夠結(jié)合檢測(cè)出的欺詐信息做聯(lián)動(dòng)處理,同時(shí)根據(jù)后臺(tái)的賬號(hào)體系聯(lián)動(dòng)保護(hù)該手機(jī)用戶的網(wǎng)游賬號(hào),第三方支付賬號(hào)等,從而進(jìn)一步降低了用戶資金賬戶被盜的概率。
附圖是本發(fā)明的欺詐信息過(guò)濾系統(tǒng)架構(gòu)圖。
具體實(shí)施例方式為對(duì)本發(fā)明的技術(shù)內(nèi)容、特點(diǎn)與功效有更具體的了解,現(xiàn)結(jié)合圖示的實(shí)施方式,詳述如下該實(shí)施例的欺詐信息過(guò)濾系統(tǒng)的具體架構(gòu)如圖I所示,包括客戶端和服務(wù)端??蛻舳宋挥谑謾C(jī)終端,主要包括特征識(shí)別子系統(tǒng),用于根據(jù)接收到的短信的特征,判斷該短信是否是欺詐短信;該特征識(shí)別子系統(tǒng)進(jìn)一步包括來(lái)源識(shí)別模塊、行為識(shí)別模塊、內(nèi)容識(shí)別模塊以及特征數(shù)據(jù)庫(kù);特征數(shù)據(jù)庫(kù)與前述三個(gè)模塊分別連接,用于存儲(chǔ)黑名單(例如,惡意號(hào)碼黑名單、惡意號(hào)碼常在地黑名單等)、白名單(主要是用戶手機(jī)通訊錄中的號(hào)碼、銀行官方號(hào)碼以及用戶手工添加的號(hào)碼)以及欺詐短信的行為特征(例如,被叫號(hào)碼是否相鄰、短信發(fā)送頻率、短信發(fā)送量、發(fā)送成功率等)和文本特征(例如銀行名稱、釣魚網(wǎng)址、官方網(wǎng)址、卡號(hào)、客服電話等關(guān)鍵字),在手機(jī)聯(lián)網(wǎng)時(shí),該特征數(shù)據(jù)庫(kù)(除白名單外)與后臺(tái)安全服務(wù)云中心的數(shù)據(jù)同步;來(lái)源識(shí)別模塊用于根據(jù)特征數(shù)據(jù)庫(kù)中的黑、白名單,判斷用戶收到的短信是否是欺詐短信;行為識(shí)別模塊與來(lái)源識(shí)別模塊連接,用于根據(jù)特征數(shù)據(jù)庫(kù)中的行為特征數(shù)據(jù),判斷通過(guò)來(lái)源識(shí)別模塊檢測(cè)的短信是否是欺詐短信;內(nèi)容識(shí)別模塊與行為識(shí)別模塊連接,是特征識(shí)別子系統(tǒng)的核心模塊,用于根據(jù)特征數(shù)據(jù)庫(kù)中的文本特征,判斷通過(guò)行為識(shí)別模塊檢測(cè)的短信是否是欺詐短信。分類過(guò)濾子系統(tǒng),用于過(guò)濾垃圾短信,其架構(gòu)與現(xiàn)有的垃圾短信過(guò)濾系統(tǒng)的架構(gòu)相同,包括短信預(yù)處理模塊、樸素貝葉斯分類模塊、支持向量機(jī)分類模塊以及分類數(shù)據(jù)庫(kù),因此不再贅述;短信攔截中心,用于攔截特征識(shí)別子系統(tǒng)識(shí)別出的欺詐短信和分類過(guò)濾子系統(tǒng)過(guò)濾出的垃圾短信。服務(wù)端通過(guò)網(wǎng)絡(luò)與客戶端連接,且服務(wù)端設(shè)置有安全服務(wù)云中心,用于監(jiān)控客戶端的信息過(guò)濾進(jìn)程,并定期與客戶端的數(shù)據(jù)同步。以下對(duì)上述欺詐信息過(guò)濾系統(tǒng)的具體實(shí)現(xiàn)流程再做一詳細(xì)地說(shuō)明。 用戶手機(jī)接收到新短信后,首先進(jìn)入特征識(shí)別子系統(tǒng),檢測(cè)其是否是釣魚欺詐短信,具體步驟是(a)來(lái)源識(shí)別模塊首先將新短信的發(fā)送號(hào)碼與白名單中的號(hào)碼進(jìn)行比對(duì),如果發(fā)送號(hào)碼在白名單中,則檢測(cè)通過(guò);如果發(fā)送號(hào)碼不屬于白名單,再繼續(xù)查找黑名單;如果發(fā)送號(hào)碼在黑名單中,就將該短信標(biāo)識(shí)為欺詐短信,如果不在黑名單中,則轉(zhuǎn)到步驟(b)繼續(xù)檢測(cè);(b)行為識(shí)別模塊將該短信的發(fā)送行為屬性和特征數(shù)據(jù)庫(kù)中欺詐短信的行為特征進(jìn)行比對(duì),如果行為屬性匹配,則將該短信標(biāo)識(shí)為欺詐短信,并將該其發(fā)送行為特征記錄下來(lái),在聯(lián)網(wǎng)時(shí)同步到安全服務(wù)云中心;如果行為屬性不匹配,則轉(zhuǎn)到步驟(C)繼續(xù)檢測(cè);為了提高識(shí)別的效率,在手機(jī)聯(lián)網(wǎng)時(shí),由安全服務(wù)云中心根據(jù)短信的行為特征來(lái)判斷該短信是否是惡意欺詐短信;(C)內(nèi)容識(shí)別模塊提取該短信的內(nèi)容關(guān)鍵字(例如,銀行名稱,網(wǎng)址,客服電話等),與特征數(shù)據(jù)庫(kù)中欺詐信息的文本特征進(jìn)行比對(duì),例如,可以首先識(shí)別出短信中的銀行名稱和網(wǎng)址,再與官方網(wǎng)站進(jìn)行比對(duì);如果特征匹配,則將該短信標(biāo)識(shí)為欺詐短信;如果不匹配,則檢測(cè)通過(guò)。特征識(shí)別子系統(tǒng)檢測(cè)通過(guò)的短信,再進(jìn)入分類過(guò)濾子系統(tǒng),根據(jù)特征分類集和自學(xué)習(xí)的樸素貝葉斯或SVM算法判斷其是否是垃圾短信,若是,則將其標(biāo)識(shí)為垃圾短信,并通知短信攔截中心對(duì)其進(jìn)行攔截;若否,則正常顯示給用戶,并根據(jù)用戶后續(xù)的操作,判斷分類的正確與否,并用于反饋學(xué)習(xí)。特征識(shí)別子系統(tǒng)檢測(cè)未通過(guò)的短信,即被標(biāo)識(shí)為欺詐短信的短信,由短信攔截中心對(duì)其進(jìn)行攔截,同時(shí)通知后臺(tái)的安全服務(wù)云中心進(jìn)程聯(lián)動(dòng),對(duì)該欺詐短信進(jìn)行監(jiān)控,防范用戶在手機(jī)上訪問(wèn)釣魚網(wǎng)站,保護(hù)該手機(jī)用戶的網(wǎng)游賬號(hào)、第三方支付賬號(hào)等資金賬號(hào)不被盜取。
權(quán)利要求
1.一種基于特征識(shí)別的欺詐信息過(guò)濾系統(tǒng),包括客戶端和服務(wù)端,客戶端設(shè)置有分類過(guò)濾子系統(tǒng),用于對(duì)信息進(jìn)行分類,識(shí)別出垃圾信息,其特征在于 客戶端還包括有特征識(shí)別子系統(tǒng)和信息攔截中心,特征識(shí)別子系統(tǒng)與分類過(guò)濾子系統(tǒng)連接,并設(shè)置在分類過(guò)濾子系統(tǒng)之前,用于根據(jù)信息的特征,識(shí)別出欺詐信息; 信息攔截中心用于攔截特征識(shí)別子系統(tǒng)識(shí)別出的欺詐信息和分類過(guò)濾子系統(tǒng)識(shí)別出的垃圾信息; 服務(wù)端通過(guò)網(wǎng)絡(luò)與客戶端連接,且服務(wù)端設(shè)置有安全服務(wù)云中心,用于監(jiān)控客戶端的進(jìn)程,并通過(guò)網(wǎng)絡(luò)與客戶端保持?jǐn)?shù)據(jù)同步。
2.如權(quán)利要求I所述的欺詐信息過(guò)濾系統(tǒng),其特征在于,所述特征識(shí)別子系統(tǒng)進(jìn)一步包括 特征數(shù)據(jù)庫(kù),用于存儲(chǔ)欺詐信息的來(lái)源特征、行為特征和內(nèi)容特征; 來(lái)源識(shí)別模塊,與特征數(shù)據(jù)庫(kù)連接,用于根據(jù)特征數(shù)據(jù)庫(kù)中的來(lái)源特征,判斷用戶收到的息是否是欺詐息; 行為識(shí)別模塊,與特征數(shù)據(jù)庫(kù)連接,用于根據(jù)特征數(shù)據(jù)庫(kù)中的行為特征,判斷用戶收到的息是否是欺詐息; 內(nèi)容識(shí)別模塊,與特征數(shù)據(jù)庫(kù)連接,用于根據(jù)特征數(shù)據(jù)庫(kù)中的內(nèi)容特征,判斷用戶收到的息是否是欺詐息。
3.如權(quán)利要求2所述的欺詐信息過(guò)濾系統(tǒng),其特征在于,所述行為特征包括被叫號(hào)碼是否相鄰、短信發(fā)送頻率、短信發(fā)送量、發(fā)送成功率以及回復(fù)率。
4.如權(quán)利要求2所述的欺詐信息過(guò)濾系統(tǒng),其特征在于,所述內(nèi)容特征包括銀行名稱、官方網(wǎng)址和客服電話;短信中出現(xiàn)的網(wǎng)址和客服電話。
5.一種基于權(quán)利要求I的系統(tǒng)實(shí)現(xiàn)的欺詐信息過(guò)濾方法,其特征在于,包括以下步驟 1)用戶收到新信息; 2)檢測(cè)該信息是否是欺詐信息,若是,則將該信息標(biāo)識(shí)為欺詐信息,并對(duì)其進(jìn)行攔截;若否,則轉(zhuǎn)到步驟3); 3)檢測(cè)該信息是否是垃圾信息,若是,則將該信息標(biāo)識(shí)為垃圾信息,并對(duì)其進(jìn)行攔截;若否,則將該信息顯示給用戶。
6.如權(quán)利要求5所述的欺詐信息過(guò)濾方法,其特征在于步驟2)中,通過(guò)將該信息的特征與欺詐信息的特征進(jìn)行比對(duì),來(lái)判斷該信息是否是欺詐信息。
7.如權(quán)利要求6所述的欺詐信息過(guò)濾方法,其特征在于所述特征包括信息的來(lái)源特征、行為特征以及內(nèi)容特征。
8.如權(quán)利要求7所述的欺詐信息過(guò)濾方法,其特征在于所述行為特征包括被叫號(hào)碼是否相鄰、短信發(fā)送頻率、短信發(fā)送量、發(fā)送成功率以及回復(fù)率。
9.如權(quán)利要求7所述的欺詐信息過(guò)濾方法,其特征在于所述內(nèi)容特征包括銀行名稱、官方網(wǎng)址、客服電話、短信中出現(xiàn)的網(wǎng)址和客服電話。
10.如權(quán)利要求5所述的欺詐信息過(guò)濾方法,其特征在于,步驟2)之后,還包括步驟安全服務(wù)云中心對(duì)檢測(cè)出的欺詐信息進(jìn)行監(jiān)控。
全文摘要
本發(fā)明公開(kāi)了一種基于特征識(shí)別的欺詐信息過(guò)濾系統(tǒng),包括通過(guò)網(wǎng)絡(luò)連接的客戶端和服務(wù)端,客戶端包括特征識(shí)別子系統(tǒng)、分類過(guò)濾子系統(tǒng)和信息攔截中心,特征識(shí)別子系統(tǒng)設(shè)置在分類過(guò)濾子系統(tǒng)之前,用于識(shí)別欺詐信息,分類過(guò)濾子系統(tǒng)用于識(shí)別垃圾信息,信息攔截中心用于攔截前述兩個(gè)子系統(tǒng)識(shí)別出的欺詐信息和垃圾信息;服務(wù)端設(shè)有安全服務(wù)云中心,用于監(jiān)控客戶端的進(jìn)程,并通過(guò)網(wǎng)絡(luò)與客戶端數(shù)據(jù)同步。本發(fā)明還公開(kāi)了基于上述系統(tǒng)的欺詐信息過(guò)濾方法。該欺詐信息過(guò)濾系統(tǒng)及方法通過(guò)特征檢測(cè),在過(guò)濾垃圾信息之前,先過(guò)濾出危害性更大的欺詐信息,并通過(guò)客戶端與服務(wù)端的進(jìn)程聯(lián)動(dòng),進(jìn)一步防范用戶訪問(wèn)惡意網(wǎng)站,從而降低了用戶資金賬戶被盜的概率。
文檔編號(hào)H04L29/08GK102790752SQ20111013143
公開(kāi)日2012年11月21日 申請(qǐng)日期2011年5月20日 優(yōu)先權(quán)日2011年5月20日
發(fā)明者吳銳, 夏紅衛(wèi), 季昕華, 張赟, 楊暉, 林金明 申請(qǐng)人:盛樂(lè)信息技術(shù)(上海)有限公司