一種垃圾短信識別方法及裝置制造方法
【專利摘要】本發(fā)明提供一種垃圾短信識別方法及裝置,該方法包括:記錄本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信到所述本網(wǎng)內(nèi)的目標(biāo)號碼的第一條數(shù);針對每個短信發(fā)送號碼發(fā)送的首條短信,記錄所述首條短信的長度;統(tǒng)計所述每個短信發(fā)送號碼在當(dāng)天發(fā)送的與所述首條短信相近長度短信的第二條數(shù);當(dāng)所述每個短信發(fā)送號碼在設(shè)定時間間隔內(nèi)發(fā)送短信的頻度達(dá)到第一監(jiān)控閾值,所述第一條數(shù)大于第一設(shè)定值,所述第二條數(shù)大于第二設(shè)定值,則斷定所述號碼正在發(fā)送垃圾短信,所述短信為垃圾短信。本發(fā)明可以降低正常短信被誤攔的概率,同時又可以減少垃圾短信因鉆漏洞而當(dāng)作正常短信放過的數(shù)量,提高了垃圾短信判定的成功率。
【專利說明】一種垃圾短信識別方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于通信【技術(shù)領(lǐng)域】,具體是涉及一種垃圾短信識別方法及裝置。
【背景技術(shù)】
[0002]垃圾短信問題一直困惑著電信業(yè),各個移動運營商化了大量的投資和精力來對付垃圾短信,但效果一直不理想,給運營商的聲譽造成了很大的影響。當(dāng)前運營商治理垃圾短信主要從兩個方面入手,一是短信內(nèi)容的關(guān)鍵字匹配,二是單位時間的發(fā)送條數(shù)。當(dāng)前垃圾短信的攔截系統(tǒng),判定用戶是否正在發(fā)送垃圾短信的主要基于兩個特征之一,一是垃圾短信發(fā)送的速度,如每小時超過了 300條就加以攔截并關(guān)閉用戶手機(jī)的正常功能;二是短信內(nèi)容的關(guān)鍵字匹配,如果某條短信內(nèi)容包含關(guān)鍵字列表中的內(nèi)容,就把該短信當(dāng)作垃圾短信加以攔截。
[0003]現(xiàn)有技術(shù)中基于發(fā)送頻次的垃圾短信判斷方法,很容易把正常的短信當(dāng)作垃圾短加以攔截過濾,引起大量用戶的投訴,例如,一個用戶換號時,需要群發(fā)短信告訴他通訊錄里的朋友時,如果朋友數(shù)量超過攔截門檻就會被誤攔截?;趦?nèi)容關(guān)鍵字匹配的方法,很容易把正常短信誤判為垃圾短信,而真正的垃圾短信卻很容易逃過攔截,無法有效攔截和過濾,例如,關(guān)鍵字匹配的方法很容易發(fā)生誤攔,如“發(fā)票”是關(guān)鍵,結(jié)果正常用戶只要發(fā)一條包含發(fā)票的短信就會被誤攔。而真正的垃圾短信發(fā)送者很容易通過同音字、近音字、拼音替代、加分隔符等方法繞過關(guān)鍵字匹配算法。
【發(fā)明內(nèi)容】
[0004]針對現(xiàn)有技術(shù)中存在的問題,本發(fā)明提供一種垃圾短信識別方法及裝置,用以克服現(xiàn)有技術(shù)中錯誤攔截垃圾短信的缺陷。
[0005]本發(fā)明提供了一種垃圾短信識別方法,包括:
[0006]記錄本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信到所述本網(wǎng)內(nèi)的目標(biāo)號碼的第一條數(shù);
[0007]針對每個短信發(fā)送號碼發(fā)送的首條短信,記錄所述首條短信的長度;
[0008]統(tǒng)計所述每個短信發(fā)送號碼在當(dāng)天發(fā)送的與所述首條短信相近長度短信的第二條數(shù);
[0009]當(dāng)所述每個短信發(fā)送號碼在設(shè)定時間間隔內(nèi)發(fā)送短信的頻度達(dá)到第一監(jiān)控閾值,所述第一條數(shù)大于第一設(shè)定值,所述第二條數(shù)大于第二設(shè)定值,則斷定所述號碼正在發(fā)送垃圾短信,所述短信為垃圾短信。
[0010]本發(fā)明提供了一種垃圾短信識別裝置,包括:
[0011]第一記錄模塊,用于記錄本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信到所述本網(wǎng)內(nèi)的目標(biāo)號碼的第一條數(shù);
[0012]第二記錄模塊,用于針對每個短信發(fā)送號碼發(fā)送的首條短信,記錄所述首條短信的長度;[0013]統(tǒng)計模塊,用于統(tǒng)計所述每個短信發(fā)送號碼在當(dāng)天發(fā)送的與所述首條短信相近長度短信的第二條數(shù);
[0014]確定模塊,用于當(dāng)所述每個短信發(fā)送號碼在設(shè)定時間間隔內(nèi)發(fā)送短信的頻度達(dá)到第一監(jiān)控閾值,所述第一條數(shù)大于第一設(shè)定值,所述第二條數(shù)大于第二設(shè)定值,則斷定所述號碼正在發(fā)送垃圾短信,所述短信為垃圾短信。
[0015]本發(fā)明提供的垃圾短信識別方法及裝置,由于第一條數(shù)用于記錄本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信到所述本網(wǎng)內(nèi)的目標(biāo)號碼的數(shù)目,因此本發(fā)明是對短信發(fā)送號碼進(jìn)行了網(wǎng)內(nèi)和網(wǎng)外的區(qū)分,通過第一條數(shù)、第二條數(shù)以及第一監(jiān)控閾值的結(jié)合來確定是否是垃圾短信,由于第一條數(shù)、第二條數(shù)以及第一監(jiān)控閾值可以通過試驗調(diào)整,因此可以降低正常短信被誤攔的概率,同時又可以減少垃圾短信因鉆漏洞而當(dāng)作正常短信放過的數(shù)量,提高了垃圾短信判定的成功率,大幅度降低了正常短信的誤判率。
【專利附圖】
【附圖說明】
[0016]圖1為本發(fā)明提供的垃圾短信識別方法實施例一的流程圖;
[0017]圖2為本發(fā)明提供的垃圾短信識別方法實施例二的流程圖;
[0018]圖3為本發(fā)明提供的垃圾短信識別裝置實施例一的示意圖;
[0019]圖4為本發(fā)明提供的垃圾短信識別裝置實施例二的示意圖。
【具體實施方式】
[0020]圖1為本發(fā)明提供的垃圾短信識別方法實施例一的流程圖,如圖1所示,該方法包括:
[0021]步驟101、記錄本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信到所述本網(wǎng)內(nèi)的目標(biāo)號碼的第一條數(shù)。
[0022]步驟102、針對每個短信發(fā)送號碼發(fā)送的首條短信,記錄所述首條短信的長度。
[0023]步驟103、統(tǒng)計所述每個短信發(fā)送號碼在當(dāng)天發(fā)送的與所述首條短信相近長度短信的第二條數(shù)。
[0024]步驟104、當(dāng)所述每個短信發(fā)送號碼在設(shè)定時間間隔內(nèi)發(fā)送短信的頻度達(dá)到第一監(jiān)控閾值,所述第一條數(shù)大于第一設(shè)定值,所述第二條數(shù)大于第二設(shè)定值,則斷定所述號碼正在發(fā)送垃圾短信,所述短信為垃圾短信。
[0025]本發(fā)明實施例提供的垃圾短信識別方法,由于第一條數(shù)用于本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信到該本網(wǎng)內(nèi)的目標(biāo)號碼的數(shù)目,因此本發(fā)明是對短信發(fā)送號碼進(jìn)行了網(wǎng)內(nèi)和網(wǎng)外的區(qū)分,通過第一條數(shù)、第二條數(shù)以及第一監(jiān)控閾值的結(jié)合來確定是否是垃圾短信,由于第一條數(shù)、第二條數(shù)以及第一監(jiān)控閾值可以通過試驗調(diào)整,因此可以降低正常短信被誤攔的概率,同時又可以減少垃圾短信因鉆漏洞而當(dāng)作正常短信放過的數(shù)量,提高了垃圾短信判定的成功率,大幅度降低了正常短信的誤判率。
[0026]圖2為本發(fā)明提供的垃圾短信識別方法實施例二的流程圖,如圖2所示,該方法包括:
[0027]步驟201、檢測本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信的目標(biāo)號碼是否是本網(wǎng)內(nèi)的電話號碼,若是,執(zhí)行步驟202 ;若否,執(zhí)行步驟209。[0028]步驟202、記錄本網(wǎng)內(nèi)的短信發(fā)送號碼在當(dāng)天發(fā)送短信到所述本網(wǎng)內(nèi)的目標(biāo)號碼的第一條數(shù),執(zhí)行步驟203。
[0029]步驟203、針對每個短信發(fā)送號碼發(fā)送的首條短信,記錄所述首條短信的長度,執(zhí)行步驟204。
[0030]步驟204、檢測所述每個短信發(fā)送號碼在首條短信之后發(fā)送的短信的第二長度,執(zhí)行步驟205。
[0031]步驟205、確定第二長度與首條短信的第一長度的差值是否小于或者等于第二監(jiān)控閾值,若所述第二長度與所述首條短信的第一長度的差值小于或者等于第二監(jiān)控閾值,執(zhí)行步驟206 ;若第二長度與所述第一長度的差值大于所述第二監(jiān)控閾值,執(zhí)行步驟207。
[0032]步驟206、將第二條數(shù)加1,視為該條短信與所述首條短信長度相近,執(zhí)行步驟208。
[0033]步驟207、將所述第二條數(shù)置為1,該條短信與所述首條短信為不同的短信,將該條短信作為首條短信,并將該條短信的所述第二長度視為所述第一長度,執(zhí)行步驟204。
[0034]步驟208、當(dāng)所述每個短信發(fā)送號碼在設(shè)定時間間隔內(nèi)發(fā)送短信的頻度達(dá)到第一監(jiān)控閾值,所述第一條數(shù)大于第一設(shè)定值,所述第二條數(shù)大于第二設(shè)定值,則斷定所述號碼正在發(fā)送垃圾短信,所述短信為垃圾短信,應(yīng)該加以攔截,流程結(jié)束。
[0035]步驟209、若檢測到所述本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信的目標(biāo)號碼為外網(wǎng)的號碼,將所述第一條數(shù)復(fù)位為0,執(zhí)行步驟204。
[0036]為了更清楚的理解本發(fā)明實施例,下面以表1為例進(jìn)行示例性說明。
[0037]
【權(quán)利要求】
1.一種垃圾短信識別方法,其特征在于,包括: 記錄本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信到所述本網(wǎng)內(nèi)的目標(biāo)號碼的第一條數(shù); 針對每個短信發(fā)送號碼發(fā)送的首條短信,記錄所述首條短信的長度; 統(tǒng)計所述每個短信發(fā)送號碼在當(dāng)天發(fā)送的與所述首條短信相近長度短信的第二條數(shù); 當(dāng)所述每個短信發(fā)送號碼在設(shè)定時間間隔內(nèi)發(fā)送短信的頻度達(dá)到第一監(jiān)控閾值,所述第一條數(shù)大于第一設(shè)定值,所述第二條數(shù)大于第二設(shè)定值,則斷定所述號碼正在發(fā)送垃圾短信,所述短信為垃圾短信。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述統(tǒng)計所述每個短信發(fā)送號碼在當(dāng)天發(fā)送的與所述首條短信相近長度短信的第二條數(shù),包括: 檢測所述每個短信發(fā)送號碼在首條短信之后發(fā)送的短信的第二長度,若所述第二長度與所述首條短信的第一長度的差值小于或者等于第二監(jiān)控閾值,則視為該條短信與所述首條短信長度相近,將第二條數(shù)加I。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述第二監(jiān)控閾值由垃圾短信發(fā)送者在發(fā)送內(nèi)容中插入的干擾符的長度確定。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法還包括: 若該短信的所述第二長度與所述第一長度的差值大于所述第二監(jiān)控閾值,則該條短信與所述首條短信為不同的短信,將該條短信作為首條短信,并將該條短信的所述第二長度視為所述第一長度,執(zhí)行,并將所述第二條數(shù)置為I。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法還包括: 檢測所述本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信的目標(biāo)號碼是否是所述本網(wǎng)內(nèi)的電話號碼; 若檢測到所述本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信的目標(biāo)號碼是所述本網(wǎng)內(nèi)的電話號碼,執(zhí)行所述記錄本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信到所述本網(wǎng)內(nèi)的目標(biāo)號碼的第一條數(shù)的步驟; 若檢測到所述本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信的目標(biāo)號碼是外網(wǎng)的電話號碼,將所述第一條數(shù)復(fù)位為O,執(zhí)行檢測所述每個短信發(fā)送號碼在首條短信之后發(fā)送的短信的第二長度的步驟。
6.一種垃圾短信識別裝置,其特征在于,包括: 第一記錄模塊,用于記錄本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信到所述本網(wǎng)內(nèi)的目標(biāo)號碼的第一條數(shù); 第二記錄模塊, 用于針對每個短信發(fā)送號碼發(fā)送的首條短信,記錄所述首條短信的長度; 統(tǒng)計模塊,用于統(tǒng)計所述每個短信發(fā)送號碼在當(dāng)天發(fā)送的與所述首條短信相近長度短信的第二條數(shù); 確定模塊,用于當(dāng)所述每個短信發(fā)送號碼在設(shè)定時間間隔內(nèi)發(fā)送短信的頻度達(dá)到第一監(jiān)控閾值,所述第一條數(shù)大于第一設(shè)定值,所述第二條數(shù)大于第二設(shè)定值,則斷定所述號碼正在發(fā)送垃圾短信,所述短信為垃圾短信。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述統(tǒng)計模塊包括: 檢測單元,用于檢測所述每個短信發(fā)送號碼在首條短信之后發(fā)送的短信的第二長度; 計數(shù)單元,用于若所述第二長度與所述首條短信的第一長度的差值小于或者等于第二監(jiān)控閾值,則視為該條短信與所述首條短信長度相近,將所述第二條數(shù)加I。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述第二監(jiān)控閾值由垃圾短信發(fā)送者在發(fā)送內(nèi)容中插入的干擾符的長度確定。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于, 若所述檢測單元檢測到該短信的第二長度與所述第一長度的差值大于所述第二監(jiān)控閾值,則該條短信與所述首條短信為不同的短信,將該條短信作為首條短信,并將該條短信的所述第二長度視為所述第一長度,所述檢測單元檢測所述每個短信發(fā)送號碼在首條短信之后發(fā)送的短信的第二長度,并將所述第二條數(shù)置為I。
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 檢測模塊,用于檢測所述本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信到是否是所述本網(wǎng)內(nèi)的目標(biāo)號碼; 復(fù)位模塊,用于若檢測到所述本網(wǎng)內(nèi)的每個短信發(fā)送號碼在當(dāng)天發(fā)送短信到外網(wǎng)的目標(biāo)號碼,將所述第 一條數(shù)復(fù)位為O。
【文檔編號】H04W12/12GK103634797SQ201310657233
【公開日】2014年3月12日 申請日期:2013年12月6日 優(yōu)先權(quán)日:2013年12月6日
【發(fā)明者】黃文良, 楊丹, 顏珊珊 申請人:中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司