一種垃圾郵件過(guò)濾方法及裝置制造方法
【專利摘要】本發(fā)明公開(kāi)了一種垃圾郵件過(guò)濾方法及裝置,用以提高垃圾郵件過(guò)濾效果。該方法將接收到的各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)作為當(dāng)前標(biāo)識(shí),將預(yù)先記錄的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)作為歷史標(biāo)識(shí),當(dāng)未包含在由歷史標(biāo)識(shí)構(gòu)成的標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量大于第一設(shè)定閾值時(shí),拒絕發(fā)送各待發(fā)送郵件中的部分郵件。上述方法通過(guò)對(duì)比各待發(fā)送郵件的發(fā)送方標(biāo)識(shí)與已發(fā)送郵件的發(fā)送方標(biāo)識(shí),來(lái)確定當(dāng)前是否存在通過(guò)多個(gè)賬號(hào)發(fā)送垃圾郵件的用戶,一旦未包含在由歷史標(biāo)識(shí)構(gòu)成的標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量較多,就可確定當(dāng)前存在通過(guò)多個(gè)賬號(hào)發(fā)送垃圾郵件的用戶,從而對(duì)各待發(fā)送郵件進(jìn)行過(guò)濾,可有效過(guò)濾垃圾郵件。
【專利說(shuō)明】一種垃圾郵件過(guò)濾方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及反垃圾郵件技術(shù),尤其涉及一種垃圾郵件過(guò)濾方法及裝置。
【背景技術(shù)】
[0002]隨著電子商務(wù)與網(wǎng)絡(luò)技術(shù)的發(fā)展,電子郵箱已經(jīng)成為廣大用戶常用的信息交流工具之一,而越來(lái)越多的垃圾郵件也出現(xiàn)在用戶的郵箱中。垃圾郵件是指未經(jīng)用戶許可而強(qiáng)行發(fā)送到用戶郵箱中的任何電子郵件。
[0003]垃圾郵件在外發(fā)過(guò)程中不僅會(huì)占用大量的傳輸、存儲(chǔ)和運(yùn)算等的網(wǎng)絡(luò)資源,造成網(wǎng)絡(luò)資源的浪費(fèi),還可能會(huì)給收到垃圾郵件的用戶帶來(lái)諸多不便。此外,如果接收服務(wù)器接收到發(fā)送服務(wù)器發(fā)送的大量垃圾郵件后,很可能會(huì)將該發(fā)送服務(wù)器添加到黑名單中,從而拒絕接收該發(fā)送服務(wù)器發(fā)送的任何郵件,從而影響正常郵件的發(fā)送。
[0004]為了避免上述因垃圾郵件導(dǎo)致的各種問(wèn)題,需要在發(fā)送服務(wù)器中配置垃圾郵件過(guò)濾策略,來(lái)阻止垃圾郵件的發(fā)送。
[0005]在現(xiàn)有技術(shù)中,垃圾郵件過(guò)濾策略一般為:發(fā)送服務(wù)器在接收到一個(gè)用戶發(fā)送郵件的請(qǐng)求時(shí),確定該用戶在單位時(shí)間(如,一分鐘)內(nèi)發(fā)送的郵件的數(shù)量,如果確定的數(shù)量大于預(yù)設(shè)閾值,則拒絕為該用戶發(fā)送郵件。
[0006]但是,如果發(fā)送垃圾郵件的用戶通過(guò)多個(gè)賬號(hào)來(lái)發(fā)送郵件,每個(gè)賬號(hào)在單位時(shí)間內(nèi)發(fā)送的郵件的數(shù)量小于上述預(yù)設(shè)閾值,則上述現(xiàn)有技術(shù)中的垃圾郵件過(guò)濾方法就將失效,也即,現(xiàn)有技術(shù)中的垃圾郵件過(guò)濾方法不能有效的過(guò)濾垃圾郵件。
【發(fā)明內(nèi)容】
[0007]本發(fā)明實(shí)施例提供一種垃圾郵件過(guò)濾方法及裝置,用以提高對(duì)垃圾郵件的過(guò)濾效果O
[0008]本發(fā)明實(shí)施例提供的一種垃圾郵件過(guò)濾方法,包括:
[0009]接收各待發(fā)送郵件;
[0010]確定各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為當(dāng)前標(biāo)識(shí);
[0011]確定預(yù)先記錄的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為歷史標(biāo)識(shí);
[0012]根據(jù)由各歷史標(biāo)識(shí)所構(gòu)成的標(biāo)識(shí)集合,確定未包含在所述標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量;
[0013]當(dāng)所述數(shù)量大于第一設(shè)定閾值時(shí),拒絕發(fā)送各待發(fā)送郵件中的部分郵件。
[0014]本發(fā)明實(shí)施例提供的一種垃圾郵件過(guò)濾裝置,包括:
[0015]待發(fā)送郵件接收模塊,用于接收各待發(fā)送郵件;
[0016]當(dāng)前標(biāo)識(shí)確定模塊,用于確定各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為當(dāng)前標(biāo)識(shí);
[0017]歷史標(biāo)識(shí)確定模塊,用于確定預(yù)先記錄的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為歷史標(biāo)識(shí);
[0018]數(shù)量確定模塊,用于根據(jù)由各歷史標(biāo)識(shí)所構(gòu)成的標(biāo)識(shí)集合,確定未包含在所述標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量;
[0019]郵件處理模塊,用于當(dāng)所述數(shù)量大于第一設(shè)定閾值時(shí),拒絕發(fā)送各待發(fā)送郵件中的部分郵件。
[0020]本發(fā)明實(shí)施例提供的一種垃圾郵件過(guò)濾方法,該方法將接收到的各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)作為當(dāng)前標(biāo)識(shí),將預(yù)先記錄的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)作為歷史標(biāo)識(shí),當(dāng)未包含在由歷史標(biāo)識(shí)構(gòu)成的標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量大于第一設(shè)定閾值時(shí),拒絕發(fā)送各待發(fā)送郵件中的部分郵件。上述方法通過(guò)對(duì)比各待發(fā)送郵件的發(fā)送方標(biāo)識(shí)與已發(fā)送郵件的發(fā)送方標(biāo)識(shí),來(lái)確定當(dāng)前是否存在通過(guò)多個(gè)賬號(hào)發(fā)送垃圾郵件的用戶,一旦未包含在由歷史標(biāo)識(shí)構(gòu)成的標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量較多,就可確定當(dāng)前存在通過(guò)多個(gè)賬號(hào)發(fā)送垃圾郵件的用戶,從而對(duì)各待發(fā)送郵件進(jìn)行過(guò)濾,可有效過(guò)濾垃圾郵件。
【專利附圖】
【附圖說(shuō)明】
[0021]此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本發(fā)明的一部分,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0022]圖1為本發(fā)明實(shí)施例提供的垃圾郵件過(guò)濾的過(guò)程;
[0023]圖2為本發(fā)明實(shí)施例提供的垃圾郵件過(guò)濾的詳細(xì)過(guò)程;
[0024]圖3為本發(fā)明實(shí)施例提供的垃圾郵件過(guò)濾裝置結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0025]在現(xiàn)有技術(shù)中,如果發(fā)送垃圾郵件的用戶通過(guò)多個(gè)賬號(hào)(俗稱“小號(hào)”)來(lái)發(fā)送郵件,每個(gè)賬號(hào)在單位時(shí)間內(nèi)發(fā)送的郵件的數(shù)量小于設(shè)定閾值,則現(xiàn)有技術(shù)中垃圾郵件過(guò)濾方法就會(huì)失效。為了有效的過(guò)濾垃圾郵件,本發(fā)明實(shí)施例通過(guò)對(duì)比當(dāng)前各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)與已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),來(lái)確定當(dāng)前是否存在通過(guò)多個(gè)小號(hào)發(fā)送郵件的用戶,如果存在,則進(jìn)行相應(yīng)的郵件過(guò)濾。
[0026]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,以下將結(jié)合本發(fā)明具體實(shí)施例及相應(yīng)的附圖對(duì)本發(fā)明技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0027]以下將具體說(shuō)明本發(fā)明實(shí)施例提供的垃圾郵件過(guò)濾方法。
[0028]參見(jiàn)圖1,為本發(fā)明實(shí)施例提供的垃圾郵件過(guò)濾過(guò)程,包括:
[0029]SlOl:接收各待發(fā)送郵件。
[0030]在本發(fā)明實(shí)施例中,用戶編輯好郵件后,將郵件發(fā)送出去時(shí),該郵件首先會(huì)發(fā)送到發(fā)送服務(wù)器中,此時(shí),發(fā)送服務(wù)器接收到的該用戶編輯好的郵件就是待發(fā)送郵件。一般的,發(fā)送服務(wù)器接收到待發(fā)送郵件后,會(huì)先采用預(yù)設(shè)策略判斷該待發(fā)送郵件是否合法,如果合法,再根據(jù)該待發(fā)送郵件中攜帶的接收方標(biāo)識(shí),將該待發(fā)送郵件發(fā)送出去。
[0031]S102:確定各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為當(dāng)前標(biāo)識(shí)。
[0032]在本發(fā)明實(shí)施例中,待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)可以是該待發(fā)送郵件中攜帶的發(fā)件人郵箱地址,也就是發(fā)件人賬號(hào)。具體的,發(fā)送服務(wù)器接收到各待發(fā)送郵件后,可從每個(gè)待發(fā)送郵件中提取出發(fā)送方標(biāo)識(shí),并對(duì)提取出的發(fā)送方標(biāo)識(shí)進(jìn)行去重處理,將去重處理后得到的發(fā)送方標(biāo)識(shí)作為當(dāng)前標(biāo)識(shí)。
[0033]例如,發(fā)送服務(wù)器接收到5個(gè)待發(fā)送郵件,其中,第1、2個(gè)待發(fā)送郵件是賬號(hào)A發(fā)送的,第3、4個(gè)待發(fā)送郵件是賬號(hào)B發(fā)送的,第5個(gè)待發(fā)送郵件是賬號(hào)C發(fā)送的。發(fā)送服務(wù)器從這5待發(fā)送郵件中提取出來(lái)的發(fā)送方標(biāo)識(shí)包括:2個(gè)賬號(hào)A、2個(gè)賬號(hào)B、I個(gè)賬號(hào)C。對(duì)各賬號(hào)進(jìn)行去重處理,得到賬號(hào)A、賬號(hào)B、賬號(hào)C這三個(gè)賬號(hào),將這三個(gè)賬號(hào)作為當(dāng)前標(biāo)識(shí)。
[0034]S103:確定預(yù)先記錄的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為歷史標(biāo)識(shí)。
[0035]在本發(fā)明實(shí)施例中,發(fā)送服務(wù)器每發(fā)送一個(gè)郵件之后,可將發(fā)送該郵件的日志保存在歷史記錄中,該日志中至少包括:發(fā)送郵件的時(shí)間,發(fā)送方標(biāo)識(shí)和接收方標(biāo)識(shí)。因此,發(fā)送服務(wù)器就可以根據(jù)歷史記錄,獲取各已發(fā)送郵件的發(fā)送方標(biāo)識(shí),對(duì)獲取的各發(fā)送方標(biāo)識(shí)進(jìn)行去重處理,將去重處理后的發(fā)送方標(biāo)識(shí)作為歷史標(biāo)識(shí)。
[0036]繼續(xù)沿用上例,假設(shè)發(fā)送服務(wù)器之前已經(jīng)發(fā)送了 4個(gè)郵件,其中,這4個(gè)已發(fā)送郵件中,第I個(gè)已發(fā)送郵件是賬號(hào)A發(fā)送的,第2、3個(gè)已發(fā)送郵件是賬號(hào)D發(fā)送的,第4個(gè)已發(fā)送郵件是賬號(hào)E發(fā)送的。則發(fā)送服務(wù)器可根據(jù)歷史記錄中保存的這4個(gè)已發(fā)送郵件的發(fā)送日志,分別提取這4個(gè)已發(fā)送郵件的發(fā)件人賬號(hào),并進(jìn)行去重處理,得到賬號(hào)A、賬號(hào)D、賬號(hào)E,將這三個(gè)賬號(hào)作為歷史標(biāo)識(shí)。
[0037]S104:根據(jù)由各歷史標(biāo)識(shí)所構(gòu)成的標(biāo)識(shí)集合,確定未包含在所述標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量。
[0038]繼續(xù)沿用上例,發(fā)送服務(wù)器確定出的由歷史標(biāo)識(shí)所構(gòu)成的標(biāo)識(shí)集合即為{賬號(hào)A,賬號(hào)D,賬號(hào)E},當(dāng)前標(biāo)識(shí)包括賬號(hào)A、賬號(hào)B、賬號(hào)C,因此,可確定未包含在上述標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)為賬號(hào)B和賬號(hào)C,從而確定未包含在該標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量為2。
[0039]S105:當(dāng)該數(shù)量大于第一設(shè)定閾值時(shí),拒絕發(fā)送各待發(fā)送郵件中的部分郵件。
[0040]也就是說(shuō),發(fā)送服務(wù)器可判斷步驟S104確定出的未包含在標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量是否大于第一設(shè)定閾值,若是,則說(shuō)明當(dāng)前存在通過(guò)多個(gè)小號(hào)發(fā)送郵件的用戶,因此對(duì)各待發(fā)送郵件進(jìn)行過(guò)濾,拒絕發(fā)送各待發(fā)送郵件中的部分郵件,其余部分的郵件可以發(fā)送,否則,說(shuō)明當(dāng)前不存在通過(guò)多個(gè)小號(hào)發(fā)送郵件的用戶,可直接發(fā)送所有的待發(fā)送郵件。
[0041]繼續(xù)沿用上例,假設(shè)第一設(shè)定閾值為1,則由于發(fā)送服務(wù)器通過(guò)步驟S104確定出未包含在標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量為2,大于第一設(shè)定閾值,因此,拒絕發(fā)送5個(gè)待發(fā)送郵件中的部分郵件。其中,可隨機(jī)從各待發(fā)送郵件中選擇出部分郵件并拒絕發(fā)送。
[0042]具體的,對(duì)于每個(gè)待發(fā)送郵件來(lái)說(shuō),可預(yù)設(shè)拒絕發(fā)送每個(gè)待發(fā)送郵件的概率P,拒絕發(fā)送每個(gè)待發(fā)送郵件的概率P均相同,因此,發(fā)送服務(wù)器針對(duì)每個(gè)待發(fā)送郵件,可以概率P拒絕發(fā)送該待發(fā)送郵件,以概率(1-P)允許發(fā)送該待發(fā)送郵件。而由于預(yù)先針對(duì)每個(gè)待發(fā)送郵件設(shè)置的拒絕發(fā)送的概率P均相同,因此,發(fā)送服務(wù)器也可直接確定各待發(fā)送郵件的數(shù)量與預(yù)設(shè)百分比的乘積,對(duì)該乘積進(jìn)行取整,得到取整值,從各待發(fā)送郵件中,隨機(jī)選擇數(shù)量為該取整值的待發(fā)送郵件,并拒絕發(fā)送選擇出的待發(fā)送郵件,發(fā)送其余未被選擇的郵件。也即,上述的預(yù)設(shè)百分比就等于針對(duì)每個(gè)待發(fā)送郵件設(shè)置的拒絕發(fā)送的概率P。
[0043]其中,上述的取整方法可以為上取整、下取整或四舍五入取整等方法,本發(fā)明對(duì)此不做限定。
[0044]繼續(xù)沿用上例,假設(shè)針對(duì)每個(gè)待發(fā)送郵件設(shè)置的拒絕發(fā)送的概率P為0.7,則該預(yù)設(shè)百分比即為70%,發(fā)送服務(wù)器可確定各待發(fā)送郵件的數(shù)量5與預(yù)設(shè)百分比70%的乘積為5X70%= 3.5,對(duì)確定的值3.5進(jìn)行四舍五入取整,得到取整值4,從5個(gè)待發(fā)送郵件中,隨機(jī)選擇4個(gè)待發(fā)送郵件,拒絕發(fā)送選擇出的這4個(gè)郵件,發(fā)送其余的I個(gè)郵件。
[0045]上述圖1所示的方法,通過(guò)對(duì)比各待發(fā)送郵件的發(fā)送方標(biāo)識(shí)與已發(fā)送郵件的發(fā)送方標(biāo)識(shí),來(lái)確定當(dāng)前是否存在通過(guò)多個(gè)小號(hào)發(fā)送郵件的用戶,即使發(fā)送垃圾郵件的用戶通過(guò)多個(gè)小號(hào)來(lái)發(fā)送垃圾郵件,且每個(gè)小號(hào)在單位時(shí)間內(nèi)發(fā)送郵件的數(shù)量較少,上述方法也可確定出當(dāng)前存在通過(guò)多個(gè)小號(hào)發(fā)送垃圾郵件的用戶,從而對(duì)各待發(fā)送郵件進(jìn)行過(guò)濾,因此可以有效過(guò)濾垃圾郵件。
[0046]考慮到在實(shí)際應(yīng)用場(chǎng)景中,垃圾郵件發(fā)送期一般都是在某一特定的時(shí)間段內(nèi),t匕如在凌晨的1:00?3:00這一時(shí)間段內(nèi),為了使得本發(fā)明實(shí)施例上述圖1所示的垃圾郵件過(guò)濾方法在時(shí)間上更加有針對(duì)性,以避免資源的浪費(fèi),可以設(shè)定一個(gè)預(yù)設(shè)時(shí)間段,僅在該預(yù)設(shè)時(shí)間段內(nèi)采用圖1所示的方法過(guò)濾垃圾郵件。
[0047]具體的,發(fā)送服務(wù)器在通過(guò)步驟S105拒絕發(fā)送各待發(fā)送郵件中的部分郵件之前,需要確定當(dāng)前時(shí)刻在預(yù)設(shè)時(shí)間段內(nèi)。進(jìn)一步的,發(fā)送服務(wù)器可先判斷當(dāng)前時(shí)刻是否在預(yù)設(shè)時(shí)間段內(nèi),若是,則執(zhí)行如圖1所示的方法過(guò)濾垃圾郵件,否則,可采用其他方法過(guò)濾垃圾郵件。
[0048]進(jìn)一步的,在本發(fā)明實(shí)施例中,可將多個(gè)時(shí)間段設(shè)定為預(yù)設(shè)時(shí)間段,例如,由于垃圾郵件的發(fā)送時(shí)間一般集中在每天凌晨的1:00?3:00和中午12:00?13:00這兩個(gè)時(shí)間段,因此可以設(shè)置每天的1:00?3:00和12:00?13:00這兩個(gè)時(shí)間段為預(yù)設(shè)時(shí)間段。則發(fā)送服務(wù)器在接收到各待發(fā)送郵件之后,先判斷當(dāng)前時(shí)刻是否在1:00?3:00以及12:00?13:00之內(nèi),如果是,則執(zhí)行圖1所示的垃圾郵件過(guò)濾方法,否則,可采用其他方法過(guò)濾垃圾郵件。
[0049]相應(yīng)的,在上述步驟S103中,確定歷史標(biāo)識(shí)的方法具體可以為,通過(guò)在歷史記錄中,確定發(fā)送時(shí)刻不在預(yù)設(shè)時(shí)間段內(nèi)的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為歷史標(biāo)識(shí)。
[0050]例如,假設(shè)預(yù)設(shè)時(shí)間段為每天1:00?3:00,而歷史記錄中共保存的4個(gè)已發(fā)送郵件的發(fā)送日志,這4個(gè)已發(fā)送郵件分別由賬號(hào)A、賬號(hào)D、賬號(hào)E發(fā)送,其中,賬號(hào)A發(fā)送郵件的發(fā)送時(shí)刻為9:00,不在預(yù)設(shè)時(shí)間段(I:00?3:00)內(nèi),而賬號(hào)D和賬號(hào)E發(fā)送的郵件均在預(yù)設(shè)時(shí)間段內(nèi),因此,發(fā)送服務(wù)器在確定歷史標(biāo)識(shí)時(shí),確定發(fā)送時(shí)刻不在預(yù)設(shè)時(shí)間段內(nèi)的已發(fā)送郵件為賬號(hào)D和賬號(hào)E發(fā)送的郵件,從而確定賬號(hào)D和賬號(hào)E為歷史標(biāo)識(shí)。
[0051]考慮到在實(shí)際應(yīng)用場(chǎng)景中,用戶通常不會(huì)每時(shí)每刻都在發(fā)送郵件,在不同的時(shí)間段內(nèi),發(fā)送郵件的用戶不完全相同甚至完全不同是非常正常的現(xiàn)象,也就是說(shuō),在不同的時(shí)間段內(nèi),發(fā)送服務(wù)器接收到的各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)存在很大差異是非常正常的。因此,當(dāng)未包含在上述標(biāo)識(shí)集合(由各歷史標(biāo)識(shí)構(gòu)成)中的當(dāng)前標(biāo)識(shí)的數(shù)量較多(大于第一設(shè)定閾值)時(shí),仍不能完全說(shuō)明當(dāng)前存在通過(guò)多個(gè)小號(hào)發(fā)送垃圾郵件的用戶,這些未包含在標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)也有可能是正常用戶的標(biāo)識(shí),如果只要未包含在標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量大于第一設(shè)定閾值,就拒絕發(fā)送一部分待發(fā)送郵件,勢(shì)必會(huì)導(dǎo)致大量的正常郵件不能被發(fā)送。
[0052]因此,為了盡量保證正常郵件的發(fā)送,在本發(fā)明實(shí)施例中,發(fā)送服務(wù)器在拒絕發(fā)送各待發(fā)送郵件中的部分郵件之前,還可確定各待發(fā)送郵件的數(shù)量與各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)的數(shù)量的比值,并判斷該比值是否大于第二設(shè)定閾值,若是,則說(shuō)明當(dāng)前存在通過(guò)多個(gè)小號(hào)發(fā)送郵件的用戶,因此對(duì)各待發(fā)送郵件進(jìn)行過(guò)濾,拒絕發(fā)送各待發(fā)送郵件中的部分郵件,其余部分的郵件可以發(fā)送,否則,說(shuō)明當(dāng)前不存在通過(guò)多個(gè)小號(hào)發(fā)送郵件的用戶,可直接發(fā)送所有的待發(fā)送郵件。
[0053]例如,假設(shè)各待發(fā)送郵件的數(shù)量為500,各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)的數(shù)量為3,第二設(shè)定閾值為200,則發(fā)送服務(wù)器在確定出未包含在標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量大于第一設(shè)定閾值之后,可確定各待發(fā)送郵件的數(shù)量與各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)的數(shù)量的比值,為500/3。由于該比值小于第二設(shè)定閾值200,因此,可說(shuō)明當(dāng)前不存在通過(guò)多個(gè)小號(hào)發(fā)送郵件的用戶,可直接發(fā)送所有的待發(fā)送郵件。這樣,就可以保證正常郵件的發(fā)送。當(dāng)然,如果該比值大于第二設(shè)定閾值,則可確定存在通過(guò)多個(gè)小號(hào)發(fā)送郵件的用戶,拒絕發(fā)送各待發(fā)送郵件中的部分郵件。
[0054]其中,在設(shè)定上述第二設(shè)定閾值時(shí),可統(tǒng)計(jì)發(fā)送正常郵件的用戶在單位時(shí)間內(nèi)發(fā)送郵件的最大數(shù)量,將該最大數(shù)量作為該第二設(shè)定閾值即可。
[0055]較佳的,圖1所示的垃圾郵件過(guò)濾方法還可以結(jié)合其他一種或多種垃圾郵件過(guò)濾策略,以進(jìn)一步提高對(duì)垃圾郵件的過(guò)濾效果,盡量降低發(fā)送垃圾郵件的可能。
[0056]例如,可采用流量控制策略、黑名單策略、文本分析策略中的一種或幾種與圖1所示的方法結(jié)合。其中:
[0057]采用流量控制策略過(guò)濾郵件的方法一般是:發(fā)送服務(wù)器在接收到各待發(fā)送郵件后,針對(duì)每個(gè)發(fā)送方標(biāo)識(shí),當(dāng)確定該發(fā)送方標(biāo)識(shí)對(duì)應(yīng)的待發(fā)送郵件的數(shù)量大于第三設(shè)定閾值時(shí),拒絕發(fā)送該發(fā)送方標(biāo)識(shí)對(duì)應(yīng)的各待發(fā)送郵件。
[0058]需要說(shuō)明的是,如果先采用流量控制策略對(duì)各待發(fā)送郵件過(guò)濾,再采用如圖1所示的方法對(duì)各待發(fā)送郵件過(guò)濾,則上述的第二設(shè)定閾值需小于第三設(shè)定閾值,才能保證圖1所示的方法有效。
[0059]采用黑名單策略過(guò)濾郵件的方法一般是:發(fā)送服務(wù)器在接收到各待發(fā)送郵件后,針對(duì)每個(gè)發(fā)送方標(biāo)識(shí),當(dāng)確定該發(fā)送方標(biāo)識(shí)包含在預(yù)設(shè)的黑名單中時(shí),拒絕發(fā)送該發(fā)送方標(biāo)識(shí)對(duì)應(yīng)的各待發(fā)送郵件。
[0060]采用文本分析策略過(guò)濾郵件的方法一般是:發(fā)送服務(wù)器在接收到各待發(fā)送郵件后,針對(duì)每個(gè)待發(fā)送郵件,對(duì)該待發(fā)送郵件中的內(nèi)容進(jìn)行文本分析,以判斷該待發(fā)送郵件中的內(nèi)容中是否包含預(yù)設(shè)關(guān)鍵詞,若包含,則拒絕發(fā)送該待發(fā)送郵件,否則可發(fā)送該待發(fā)送郵件。
[0061]假設(shè)將流量控制策略、黑名單策略、文本分析策略三種方法與圖1所示的方法結(jié)合,則本發(fā)明實(shí)施例提供的垃圾郵件過(guò)濾的詳細(xì)過(guò)程如圖2所示。
[0062]參見(jiàn)圖2,為本發(fā)明實(shí)施例提供的垃圾郵件過(guò)濾方法,包括以下步驟:
[0063]S201、接收各待發(fā)送郵件。
[0064]S202、采用流量控制策略對(duì)各待發(fā)送郵件進(jìn)行過(guò)濾。
[0065]S203、采用黑名單策略對(duì)過(guò)濾后的待發(fā)送郵件進(jìn)行過(guò)濾。
[0066]其中,步驟S203中所述的過(guò)濾后的待發(fā)送郵件是指經(jīng)過(guò)流量控制策略過(guò)濾后剩余的各待發(fā)送郵件。
[0067]S204、采用文本分析策略對(duì)過(guò)濾后的待發(fā)送郵件進(jìn)行過(guò)濾。
[0068]其中,步驟S204中所述的過(guò)濾后的待發(fā)送郵件是指經(jīng)過(guò)黑名單策略過(guò)濾后剩余的各待發(fā)送郵件。
[0069]需要說(shuō)明的是,上述步驟S202、S203和S204的執(zhí)行順序可以互換。
[0070]S205、判斷當(dāng)前時(shí)刻是否在預(yù)設(shè)時(shí)間段內(nèi),若是,執(zhí)行步驟S206,否則,執(zhí)行步驟S214。
[0071]S206、確定過(guò)濾后的待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為當(dāng)前標(biāo)識(shí)。
[0072]其中,步驟S206中所述的過(guò)濾后的待發(fā)送郵件是指經(jīng)過(guò)流量控制策略、黑名單策略、文本分析策略過(guò)濾后剩余的各待發(fā)送郵件。
[0073]S207、在歷史記錄中,確定當(dāng)前時(shí)刻不在預(yù)設(shè)時(shí)間段內(nèi)的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為歷史標(biāo)識(shí)。
[0074]S208、確定未包含在由各歷史標(biāo)識(shí)所構(gòu)成的標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量。
[0075]S209、判斷該數(shù)量是否大于第一設(shè)定閾值,如果是,執(zhí)行步驟S210,否則,執(zhí)行步驟S214。
[0076]S210、確定各待發(fā)送郵件的數(shù)量與各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)的數(shù)量的比值。
[0077]S211、判斷該比值是否大于第二設(shè)定閾值,若是,執(zhí)行步驟S212,否則,執(zhí)行步驟S214。
[0078]S212、確定各待發(fā)送郵件的數(shù)量與預(yù)設(shè)百分比的乘積,對(duì)該乘積進(jìn)行取整,得到取整值。
[0079]S213、從各待發(fā)送郵件中,隨機(jī)選擇數(shù)量為該取整值的待發(fā)送郵件,并拒絕發(fā)送,發(fā)送未選擇的待發(fā)送郵件。
[0080]S214、發(fā)送過(guò)濾后的待發(fā)送郵件。
[0081]其中,步驟S214中所述的過(guò)濾后的待發(fā)送郵件是指經(jīng)過(guò)流量控制策略、黑名單策略、文本分析策略過(guò)濾后剩余的各待發(fā)送郵件。
[0082]以上為本發(fā)明實(shí)施例提供的垃圾郵件過(guò)濾方法,基于同樣的思路,本發(fā)明實(shí)施例還提供了一種垃圾郵件過(guò)濾裝置,如圖3所示,包括:
[0083]待發(fā)送郵件接收模塊31,用于接收各待發(fā)送郵件;
[0084]當(dāng)前標(biāo)識(shí)確定模塊32,用于確定發(fā)送各待發(fā)送郵件的當(dāng)前用戶標(biāo)識(shí);
[0085]歷史標(biāo)識(shí)確定模塊33,用于確定預(yù)先記錄的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為歷史標(biāo)識(shí);
[0086]數(shù)量確定模塊34,用于根據(jù)由各歷史標(biāo)識(shí)所構(gòu)成的標(biāo)識(shí)集合,確定未包含在所述標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量;
[0087]郵件處理模塊35,用于當(dāng)所述數(shù)量大于第一設(shè)定閾值時(shí),拒絕發(fā)送各待發(fā)送郵件中的部分郵件。
[0088]可選的,所述裝置還包括:
[0089]時(shí)間確定模塊36,用于在拒絕發(fā)送各待發(fā)送郵件中的部分郵件之前,確定當(dāng)前時(shí)刻在預(yù)設(shè)時(shí)間段內(nèi)。
[0090]可選的,歷史標(biāo)識(shí)確定模塊33,具體用于:在歷史記錄中,確定發(fā)送時(shí)刻不在預(yù)設(shè)時(shí)間段內(nèi)的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為歷史標(biāo)識(shí)。
[0091]可選的,所述裝置還包括:
[0092]比較模塊37,用于在拒絕發(fā)送各待發(fā)送郵件中的部分郵件之前,確定各待發(fā)送郵件的數(shù)量與各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)的數(shù)量的比值大于第二設(shè)定閾值。
[0093]郵件處理模塊35,具體用于:
[0094]確定各待發(fā)送郵件的數(shù)量與預(yù)設(shè)百分比的乘積;
[0095]對(duì)所述乘積進(jìn)行取整,得到取整值;
[0096]從各待發(fā)送郵件中,隨機(jī)選擇數(shù)量為所述取整值的待發(fā)送郵件;
[0097]拒絕發(fā)送選擇出的待發(fā)送郵件。
[0098]本發(fā)明實(shí)施例提供的一種垃圾郵件過(guò)濾方法,該方法將接收到的各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)作為當(dāng)前標(biāo)識(shí),將預(yù)先記錄的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)作為歷史標(biāo)識(shí),當(dāng)未包含在由歷史標(biāo)識(shí)構(gòu)成的標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量大于第一設(shè)定閾值時(shí),拒絕發(fā)送各待發(fā)送郵件中的部分郵件。上述方法通過(guò)對(duì)比各待發(fā)送郵件的發(fā)送方標(biāo)識(shí)與已發(fā)送郵件的發(fā)送方標(biāo)識(shí),來(lái)確定當(dāng)前是否存在通過(guò)多個(gè)賬號(hào)發(fā)送垃圾郵件的用戶,一旦未包含在由歷史標(biāo)識(shí)構(gòu)成的標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量較多,就可確定當(dāng)前存在通過(guò)多個(gè)賬號(hào)發(fā)送垃圾郵件的用戶,從而對(duì)各待發(fā)送郵件進(jìn)行過(guò)濾,可有效過(guò)濾垃圾郵件。
[0099]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0100]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
[0101]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
[0102]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0103]在一個(gè)典型的配置中,計(jì)算設(shè)備包括一個(gè)或多個(gè)處理器(CPU)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。
[0104]內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(ROM)或閃存(flash RAM)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。
[0105]計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來(lái)實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)、其他類型的隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、電可擦除可編程只讀存儲(chǔ)器(EEPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲(chǔ)器(CD-ROM)、數(shù)字多功能光盤(DVD)或其他光學(xué)存儲(chǔ)、磁盒式磁帶,磁帶磁磁盤存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其他非傳輸介質(zhì),可用于存儲(chǔ)可以被計(jì)算設(shè)備訪問(wèn)的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括暫存電腦可讀媒體(transitory media),如調(diào)制的數(shù)據(jù)信號(hào)和載波。
[0106]還需要說(shuō)明的是,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、商品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、商品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括要素的過(guò)程、方法、商品或者設(shè)備中還存在另外的相同要素。
[0107]本領(lǐng)域技術(shù)人員應(yīng)明白,本申請(qǐng)的實(shí)施例可提供為方法、系統(tǒng)或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)可采用完全硬件實(shí)施例、完全軟件實(shí)施例或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0108]以上僅為本申請(qǐng)的實(shí)施例而已,并不用于限制本申請(qǐng)。對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō),本申請(qǐng)可以有各種更改和變化。凡在本申請(qǐng)的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請(qǐng)的權(quán)利要求范圍之內(nèi)。
【權(quán)利要求】
1.一種垃圾郵件過(guò)濾方法,其特征在于,包括: 接收各待發(fā)送郵件; 確定各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為當(dāng)前標(biāo)識(shí); 確定預(yù)先記錄的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為歷史標(biāo)識(shí); 根據(jù)由各歷史標(biāo)識(shí)所構(gòu)成的標(biāo)識(shí)集合,確定未包含在所述標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量; 當(dāng)所述數(shù)量大于第一設(shè)定閾值時(shí),拒絕發(fā)送各待發(fā)送郵件中的部分郵件。
2.如權(quán)利要求1所述的方法,其特征在于,拒絕發(fā)送各待發(fā)送郵件中的部分郵件之前,所述方法還包括: 確定當(dāng)前時(shí)刻在預(yù)設(shè)時(shí)間段內(nèi)。
3.如權(quán)利要求1或2所述的方法,其特征在于,確定預(yù)先記錄的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),具體包括: 在歷史記錄中,確定發(fā)送時(shí)刻不在預(yù)設(shè)時(shí)間段內(nèi)的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)。
4.如權(quán)利要求1所述的方法,其特征在于,拒絕發(fā)送各待發(fā)送郵件中的部分郵件之前,所述方法還包括: 確定各待發(fā)送郵件的數(shù)量與各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)的數(shù)量的比值大于第二設(shè)定閾值。
5.如權(quán)利要求1所述的方法,其特征在于,拒絕發(fā)送各待發(fā)送郵件中的部分郵件,具體包括: 確定各待發(fā)送郵件的數(shù)量與預(yù)設(shè)百分比的乘積; 對(duì)所述乘積進(jìn)行取整,得到取整值; 從各待發(fā)送郵件中,隨機(jī)選擇數(shù)量為所述取整值的待發(fā)送郵件; 拒絕發(fā)送選擇出的待發(fā)送郵件。
6.一種垃圾郵件過(guò)濾裝置,其特征在于,包括: 待發(fā)送郵件接收模塊,用于接收各待發(fā)送郵件; 當(dāng)前標(biāo)識(shí)確定模塊,用于確定各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為當(dāng)前標(biāo)識(shí); 歷史標(biāo)識(shí)確定模塊,用于確定預(yù)先記錄的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為歷史標(biāo)識(shí); 數(shù)量確定模塊,用于根據(jù)由各歷史標(biāo)識(shí)所構(gòu)成的標(biāo)識(shí)集合,確定未包含在所述標(biāo)識(shí)集合中的當(dāng)前標(biāo)識(shí)的數(shù)量; 郵件處理模塊,用于當(dāng)所述數(shù)量大于第一設(shè)定閾值時(shí),拒絕發(fā)送各待發(fā)送郵件中的部分郵件。
7.如權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括: 時(shí)間確定模塊,用于在拒絕發(fā)送各待發(fā)送郵件中的部分郵件之前,確定當(dāng)前時(shí)刻在預(yù)設(shè)時(shí)間段內(nèi)。
8.如權(quán)利要求6或7所述的裝置,其特征在于, 歷史標(biāo)識(shí)確定模塊,具體用于:在歷史記錄中,確定發(fā)送時(shí)刻不在預(yù)設(shè)時(shí)間段內(nèi)的已發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí),作為歷史標(biāo)識(shí)。
9.如權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括: 比較模塊,用于在拒絕發(fā)送各待發(fā)送郵件中的部分郵件之前,確定各待發(fā)送郵件的數(shù)量與各待發(fā)送郵件對(duì)應(yīng)的發(fā)送方標(biāo)識(shí)的數(shù)量的比值大于第二設(shè)定閾值。
10.如權(quán)利要求6所述的裝置,其特征在于,郵件處理模塊,具體用于: 確定各待發(fā)送郵件的數(shù)量與預(yù)設(shè)百分比的乘積; 對(duì)所述乘積進(jìn)行取整,得到取整值; 從各待發(fā)送郵件中,隨機(jī)選擇數(shù)量為所述取整值的待發(fā)送郵件; 拒絕發(fā)送選擇出的待發(fā)送郵件。
【文檔編號(hào)】H04L12/58GK104348712SQ201410545491
【公開(kāi)日】2015年2月11日 申請(qǐng)日期:2014年10月15日 優(yōu)先權(quán)日:2014年10月15日
【發(fā)明者】宋健 申請(qǐng)人:新浪網(wǎng)技術(shù)(中國(guó))有限公司