垃圾郵件處理方法及系統(tǒng)的制作方法
【專利摘要】一種垃圾郵件處理方法,包括如下步驟:接收被攔截的郵件;判斷所述郵件的數(shù)據(jù)量是否大于閾值;如果是,以單文件的形式單獨(dú)存儲(chǔ)所述郵件;如果否,將所述郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)。上述垃圾郵件處理方法,通過(guò)判斷郵件的數(shù)據(jù)量與閾值的關(guān)系,將郵件分為兩種存儲(chǔ)方式:郵件的數(shù)據(jù)量大于閾值的,以單文件的形式單獨(dú)存儲(chǔ)郵件;郵件的數(shù)據(jù)量不大于閾值的,將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)。將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ),減少了文件的數(shù)量,可以減少磁盤輸入輸出操作的次數(shù),減少了郵件存儲(chǔ)耗時(shí)。此外,還提供一種垃圾郵件處理系統(tǒng)。
【專利說(shuō)明】垃圾郵件處理方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)技術(shù),特別是涉及一種垃圾郵件處理方法及系統(tǒng)。
【背景技術(shù)】
[0002]電子郵件(E-mail,又稱電子函件、電郵或郵件)是指通過(guò)互聯(lián)網(wǎng)進(jìn)行書(shū)寫(xiě)、發(fā)送和接收信件,目的是達(dá)成發(fā)信人和收信人之間的信息交互。
[0003]隨著計(jì)算機(jī)的普及,電子郵件的使用也越來(lái)越廣泛。然而,電子郵件也出現(xiàn)了被濫用的情況,即部分用戶使用電子郵件大量發(fā)送廣告等垃圾郵件,使得很多收到垃圾郵件的用戶不得不花很多時(shí)間清理。對(duì)此,部分郵件服務(wù)商提供了自動(dòng)過(guò)濾垃圾郵件的服務(wù),將系統(tǒng)自動(dòng)識(shí)別為垃圾郵件的郵件單獨(dú)放置到垃圾箱或是直接刪除等。直接刪除的方式容易導(dǎo)致系統(tǒng)錯(cuò)誤識(shí)別為垃圾郵件的有用郵件的丟失。放置到垃圾箱中的方式由于可以被恢復(fù),因而被廣泛使用。
[0004]隨著垃圾郵件數(shù)量的增加,郵件存儲(chǔ)耗費(fèi)的時(shí)間越來(lái)越長(zhǎng),也會(huì)導(dǎo)致讀取供用戶確認(rèn)是否是垃圾郵件、恢復(fù)為正常郵件的速度越來(lái)越慢。對(duì)此,部分郵件服務(wù)提供商將高概率為垃圾郵件的電子郵件直接刪除而不再存儲(chǔ),相對(duì)概率低一點(diǎn)的垃圾郵件則存儲(chǔ)下來(lái)以備用戶恢復(fù),這樣可以減少存儲(chǔ)空間的浪費(fèi)和對(duì)存儲(chǔ)、讀取郵件速度的影響。然而,這種方式還是難免會(huì)造成極個(gè)別的有用郵件被當(dāng)作垃圾郵件刪除。
【發(fā)明內(nèi)容】
[0005]基于此,有必要針對(duì)傳統(tǒng)的垃圾郵件處理耗時(shí)越來(lái)越長(zhǎng)的問(wèn)題,提供一種垃圾郵件處理方法。
[0006]一種垃圾郵件處理方法,包括:
[0007]接收被攔截的郵件;
[0008]判斷所述郵件的數(shù)據(jù)量是否大于閾值;
[0009]如果是,以單文件的形式單獨(dú)存儲(chǔ)所述郵件;
[0010]如果否,將所述郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)。
[0011]此外,還有必要針對(duì)大量郵件存儲(chǔ)耗時(shí)越來(lái)越長(zhǎng)的問(wèn)題,提供一種垃圾郵件處理系統(tǒng)。
[0012]一種垃圾郵件處理系統(tǒng),包括:
[0013]接收模塊,用于接收被攔截的郵件;
[0014]判斷模塊,用于判斷所述郵件的數(shù)據(jù)量是否大于閾值;
[0015]第一存儲(chǔ)模塊,如果所述郵件大于閾值,以單文件的形式單獨(dú)存儲(chǔ)所述郵件;
[0016]第二存儲(chǔ)模塊,如果所述郵件不大于閾值,將所述郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)。
[0017]上述垃圾郵件處理方法及系統(tǒng),通過(guò)判斷郵件的數(shù)據(jù)量與閾值的關(guān)系,將郵件分為兩種存儲(chǔ)方式:郵件的數(shù)據(jù)量大于閾值的,以單文件的形式單獨(dú)存儲(chǔ)郵件;郵件的數(shù)據(jù)量不大于閾值的,將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)。將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ),減少了文件的數(shù)量,可以減少磁盤輸入輸出操作的次數(shù),減少了郵件存儲(chǔ)耗時(shí)。
【專利附圖】
【附圖說(shuō)明】
[0018]圖1為第一實(shí)施方式的垃圾郵件處理方法的流程圖;
[0019]圖2為第二實(shí)施方式的垃圾郵件處理方法的流程圖;
[0020]圖3為第三實(shí)施方式的垃圾郵件處理方法的流程圖;
[0021]圖4為第四實(shí)施方式的垃圾郵件處理方法的流程圖;
[0022]圖5為第五實(shí)施方式的垃圾郵件處理方法的流程圖;
[0023]圖6為第一實(shí)施方式的郵件處理系統(tǒng)的模塊圖;
[0024]圖7為第二實(shí)施方式的郵件處理系統(tǒng)的模塊圖;
[0025]圖8為第三實(shí)施方式的郵件處理系統(tǒng)的模塊圖。
【具體實(shí)施方式】
[0026]由于傳統(tǒng)的垃圾郵件處理方法中,郵件存儲(chǔ)的方式通常存儲(chǔ)路徑固定,每個(gè)郵件作為一個(gè)單獨(dú)的文件,這樣某一文件夾下文件數(shù)較多,對(duì)于正常郵件和垃圾郵件非常多的用戶,同一文件夾下的文件也會(huì)非常多,從而影響存取的效率。并且,較多的郵件會(huì)導(dǎo)致較多的文件存儲(chǔ)操作,導(dǎo)致磁盤效率低,進(jìn)一步影響了存取的效率。
[0027]如圖1所示,一實(shí)施例中的垃圾郵件處理方法,包括如下步驟:
[0028]步驟S100,接收被攔截的郵件。郵件在被反垃圾郵件系統(tǒng)攔截時(shí),調(diào)用垃圾郵件處理方法提供的存儲(chǔ)接口(SaveMail)進(jìn)行被攔截郵件的臨時(shí)存儲(chǔ),即通過(guò)上述存儲(chǔ)接口(SaveMail)接收被反垃圾郵件系統(tǒng)攔截的郵件。攔截郵件的規(guī)則可以根據(jù)需要進(jìn)行設(shè)定,例如根據(jù)郵件地址、關(guān)鍵詞等攔截可能為垃圾郵件的郵件。
[0029]步驟S110,判斷郵件的數(shù)據(jù)量是否大于閾值。郵件的大小是指郵件數(shù)據(jù)的大小,閾值是指預(yù)設(shè)的郵件的數(shù)據(jù)量臨界值,例如512KBUMB等。通過(guò)對(duì)郵件的數(shù)據(jù)量和閾值進(jìn)行比較,判斷收到的郵件的數(shù)據(jù)量是否大于閾值,如果大于則進(jìn)入步驟S120,如果不大于,則進(jìn)入步驟S130。
[0030]步驟S120,以單文件的形式單獨(dú)存儲(chǔ)郵件。本步驟中,把郵件的數(shù)據(jù)量大于預(yù)設(shè)閾值的每個(gè)郵件(以下簡(jiǎn)稱大郵件)都以單個(gè)文件的形式單獨(dú)分別存儲(chǔ),即每個(gè)郵件單獨(dú)對(duì)應(yīng)一個(gè)文件。因?yàn)槭盏降泥]件的郵件的數(shù)據(jù)量相對(duì)較大,所以每個(gè)郵件都以單一文件的形式分別存儲(chǔ),便于管理。
[0031]步驟S130,將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)。預(yù)定文件是指預(yù)先設(shè)定的用來(lái)集中存儲(chǔ)大小小于閾值的郵件(以下簡(jiǎn)稱小郵件)的文件。例如,收到的郵件Ml經(jīng)判斷小于512KB,則將郵件Ml添加到某一預(yù)定文件Fl中,隨后如果收到郵件M2經(jīng)判斷小于512KB時(shí),可以再將郵件M2添加到該預(yù)定文件Fl中。這樣實(shí)現(xiàn)了將郵件Ml和郵件M2集中存儲(chǔ)在預(yù)定文件Fl中。也就是說(shuō),集中存儲(chǔ)是將多個(gè)郵件集中存儲(chǔ)到一個(gè)文件中,當(dāng)然,預(yù)定文件的數(shù)量也可以不止一個(gè),只要預(yù)定文件的數(shù)量大于郵件的數(shù)量即可達(dá)到集中存儲(chǔ)的目的。預(yù)定文件可以是Hash桶文件(哈希桶文件)、打包文件或是壓縮文件等。在進(jìn)行添加存儲(chǔ)操作時(shí),可以用0_APPEND的方式(以追加的方式打開(kāi)文件,每次寫(xiě)之前,都將標(biāo)志位移動(dòng)到文件的末端)在預(yù)定文件末位添加此次添加的郵件的大小及郵件的內(nèi)容數(shù)據(jù),當(dāng)然也可以只在預(yù)定文件末位添加郵件內(nèi)容數(shù)據(jù),并記錄郵件的起始和結(jié)束標(biāo)記。
[0032]上述垃圾郵件處理方法,通過(guò)判斷郵件的數(shù)據(jù)量與閾值的關(guān)系,將郵件分為兩種存儲(chǔ)方式:郵件的數(shù)據(jù)量大于閾值的,以單文件的形式單獨(dú)存儲(chǔ)郵件;郵件的數(shù)據(jù)量不大于閾值的,將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)。將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ),減少了文件的數(shù)量,可以減少磁盤輸入輸出操作的次數(shù),減少了郵件存儲(chǔ)耗時(shí)。
[0033]如圖2及圖3所示,在其中一個(gè)實(shí)施例中,還包括以郵件的標(biāo)識(shí)碼進(jìn)行映射獲得路徑的步驟(S102、S112或S114)。步驟S102在步驟SllO之前,不管是大郵件還是小郵件,映射路徑的方法相同;步驟S112或S114在步驟SllO之后,可以根據(jù)大郵件和小郵件制定不同的映射路徑的方法。每個(gè)郵件在接收時(shí)都會(huì)有一個(gè)標(biāo)識(shí)碼所標(biāo)識(shí),郵件的標(biāo)識(shí)碼通常是唯一的(又可以稱為唯一索引為消息id,MeSSageID),并且通常郵件的標(biāo)識(shí)碼中包括了郵件的投遞時(shí)間信息,格式為size_t類型,在存儲(chǔ)、讀取、刪除郵件時(shí)都會(huì)根據(jù)郵件的標(biāo)識(shí)碼對(duì)郵件進(jìn)行操作。存儲(chǔ)路徑可以通過(guò)以郵件的標(biāo)識(shí)碼進(jìn)行映射獲得,先把標(biāo)識(shí)碼通過(guò)一個(gè)Hash函數(shù)計(jì)算,轉(zhuǎn)換得到文件存儲(chǔ)路徑,所述路徑包括儲(chǔ)存郵件文件的各級(jí)文件夾名稱。在以單文件的形式單獨(dú)存儲(chǔ)郵件的步驟S120中,獲得路徑后,將郵件以單文件的形式單獨(dú)存儲(chǔ)在所述路徑下,并且可以以郵件的標(biāo)識(shí)碼作為文件名存儲(chǔ)文件,保證了存儲(chǔ)郵件的唯一性;在將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)的步驟S130中,將郵件添加在上述路徑下的預(yù)定文件中。由于采用了映射的方法,可以通過(guò)映射規(guī)則的設(shè)定,使得不同的郵件映射得到的路徑不同,從而使得郵件的存儲(chǔ)位置充分散列,即在同一文件夾下不會(huì)有過(guò)多的郵件,提高存取的速度。
[0034]在有些具體的應(yīng)用中,標(biāo)識(shí)碼包含有日期信息,上述以郵件的標(biāo)識(shí)碼進(jìn)行映射獲得存儲(chǔ)所述郵件的路徑的步驟S102、S112或S114中,可以將日期信息作為路徑的一部分。例如,收到的郵件攜帶的標(biāo)識(shí)碼為mx82tl332829582trzqgfrcg,其中1332829582為日期信息可以轉(zhuǎn)化為對(duì)應(yīng)的日期20120327。當(dāng)然,在其他實(shí)施例中,標(biāo)識(shí)碼中可以直接包含不需要轉(zhuǎn)化的日期信息。假設(shè)標(biāo)識(shí)碼通過(guò)Hash算法映射到磁盤號(hào)為09,子目錄為m的路徑,將日期作為上述路徑的一部分得到的存儲(chǔ)路徑為,/ BASE_DIR / 09/m/201203/27或/ BASE_DIR/09/m/2012/03/27等,其中BASE_DIR為基礎(chǔ)存儲(chǔ)目錄。通過(guò)將日期信息作為路徑的一部分,可以進(jìn)一步散列需要存儲(chǔ)的文件,得到的文件存儲(chǔ)路徑能有效的提高文件存取的速度,而且方便過(guò)期文件的清理工作。例如,對(duì)于超過(guò)郵件攔截恢復(fù)期限(3天、5天、10天等)的文件,清理程序可以根據(jù)路徑中攜帶的日期信息,直接清理整個(gè)目錄。
[0035]通常,郵件的標(biāo)識(shí)碼除了包含有日期信息外,還包含有非日期信息,上述郵件的標(biāo)識(shí)碼進(jìn)行映射獲得存儲(chǔ)所述郵件的路徑的步驟S102、S112或S114中,還可以將非日期信息中的部分或全部作為所述路徑的一部分。仍然以標(biāo)識(shí)碼mX82tl332829582trZqgfrcg為例進(jìn)行說(shuō)明,把后4位字符“frcg”提取出來(lái),作為郵件存儲(chǔ)路徑的一部分,例如可以是“/frcg/”或者“/fr/cg/”,從而得到最終的郵件存儲(chǔ)路徑/ BASE_DIR/09 / m/201203/27/frcg/或/ BASE_DIR / 09 / m/201203/27/fr/cg。把郵件標(biāo)識(shí)碼中非日期信息提取出來(lái)作為郵件存儲(chǔ)路徑中的一部分,可以使郵件文件充分散列,避免一個(gè)文件夾下文件數(shù)量過(guò)多、導(dǎo)致文件檢索效率變低。除了提取標(biāo)識(shí)碼中的后四位外,也可以提取后一位、后兩位或是中間的幾位等,這些都可以根據(jù)需要進(jìn)行設(shè)定。此外,也可以不將非日期信息作為路徑的一部分,例如對(duì)于小郵件的存儲(chǔ)來(lái)說(shuō),由于大量的小郵件已經(jīng)通過(guò)添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)的方式,大大減少了需要存儲(chǔ)的文件的數(shù)量,因此,可以不需要進(jìn)一步的散列,也就是不需要將非日期信息作為路徑的一部分,此時(shí)步驟SI 12和SI 14并不完全相同。
[0036]在其他實(shí)施例中,除了通過(guò)映射的方式獲得路徑外,還可以對(duì)每個(gè)文件夾存儲(chǔ)的文件或文件夾數(shù)量進(jìn)行限定,當(dāng)達(dá)到限定數(shù)量時(shí),即更換存儲(chǔ)路徑,也可避免在同一文件夾下存儲(chǔ)過(guò)多的郵件,提高存取的速度。
[0037]如圖4所示,為了在存儲(chǔ)郵件后能夠快速的讀取郵件,上述垃圾郵件處理方法還包括如下步驟:
[0038]步驟S122,本步驟位于步驟SllO之后,位于步驟S120之前或之后均可,即如果判斷郵件大于閾值,在指向文件中與郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位設(shè)置標(biāo)識(shí)郵件以單文件的形式單獨(dú)存儲(chǔ)。指向文件可以是Hash表文件,記錄了郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位,在標(biāo)識(shí)位設(shè)置有用以標(biāo)識(shí)郵件的存儲(chǔ)形式為以大郵件的形式存儲(chǔ)的數(shù)值,例如標(biāo)識(shí)位為O。在讀取郵件時(shí),根據(jù)標(biāo)識(shí)碼找到標(biāo)識(shí)位,再根據(jù)標(biāo)識(shí)位判斷郵件的存儲(chǔ)形式,有區(qū)別的采取相應(yīng)的郵件讀取方法。例如如果讀取到的標(biāo)識(shí)位為0,表明郵件是以單文件的形式單獨(dú)存儲(chǔ)的,則可以根據(jù)標(biāo)識(shí)碼映射得到路徑,在該路徑下讀取郵件等。當(dāng)然,也可以直接在指向文件中直接存儲(chǔ)步驟SI 12中映射獲得的路徑。
[0039]步驟S132,本步驟位于步驟SllO之后,位于步驟S130之前或之后均可,即如果判斷郵件不大于閾值,在指向文件中與郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位設(shè)置標(biāo)識(shí)郵件以集中存儲(chǔ)的形式存儲(chǔ)、在指向文件中設(shè)置存儲(chǔ)路徑與在預(yù)定文件中的存儲(chǔ)位置。指向文件可以是Hash表文件,記錄了郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位,在標(biāo)識(shí)位設(shè)置有用以標(biāo)識(shí)郵件的存儲(chǔ)形式為集中存儲(chǔ)的數(shù)值,例如標(biāo)識(shí)位為I。在指向文件中還保存有存儲(chǔ)該郵件的預(yù)定文件的路徑,以及對(duì)應(yīng)郵件在預(yù)定文件中的存儲(chǔ)位置。在讀取郵件時(shí),根據(jù)標(biāo)識(shí)碼找到標(biāo)識(shí)位,再根據(jù)標(biāo)識(shí)位判斷郵件的存儲(chǔ)形式,有區(qū)別的采取相應(yīng)的郵件讀取方法。在讀取郵件時(shí),就不需要再計(jì)算預(yù)定文件的路徑和郵件的存儲(chǔ)地址了,直接把指向文件讀入計(jì)算機(jī)內(nèi)存,在內(nèi)存中高速檢索,獲取郵件標(biāo)識(shí)碼對(duì)應(yīng)的預(yù)定文件地址和在預(yù)定文件中的存儲(chǔ)位置,存儲(chǔ)位置可以是預(yù)定文件數(shù)據(jù)段中的偏移地址。
[0040]以下結(jié)合更為具體的實(shí)施例對(duì)上述垃圾郵件處理方法進(jìn)行更為詳細(xì)的說(shuō)明,如圖5所示,該垃圾郵件處理方法包括如下步驟:
[0041]步驟S500,接收被攔截的郵件。每個(gè)郵件在接收時(shí)都會(huì)有一個(gè)標(biāo)識(shí)碼所標(biāo)識(shí),郵件的標(biāo)識(shí)碼通常是唯一的(又可以稱為唯一索引為消息id,MeSSageID),并且通常郵件的標(biāo)識(shí)碼中包括了郵件的投遞時(shí)間信息,格式為size_t類型,在存儲(chǔ)、讀取、刪除郵件時(shí)都會(huì)根據(jù)郵件的標(biāo)識(shí)碼對(duì)郵件進(jìn)行操作。除了郵件的標(biāo)識(shí)碼外,在接收被攔截的郵件時(shí)還可以獲得郵件內(nèi)容和郵件的數(shù)據(jù)量等信息。
[0042]步驟S510,判斷郵件的數(shù)據(jù)量是否大于閾值。郵件的大小是指郵件數(shù)據(jù)的大小,閾值是指預(yù)設(shè)的郵件的數(shù)據(jù)量臨界值,例如512KBUMB等,通過(guò)對(duì)郵件的數(shù)據(jù)量和預(yù)設(shè)的閾值進(jìn)行比較,判斷收到的郵件的數(shù)據(jù)量是否大于閾值,如果大于則進(jìn)入步驟S520,如果不大于,則進(jìn)入步驟S550。
[0043]步驟S520,以郵件的標(biāo)識(shí)碼進(jìn)行映射獲得路徑。存儲(chǔ)路徑可以通過(guò)以郵件的標(biāo)識(shí)碼進(jìn)行映射獲得,先把標(biāo)識(shí)碼通過(guò)一個(gè)Hash函數(shù)計(jì)算,轉(zhuǎn)換得到文件存儲(chǔ)路徑,所述路徑包括儲(chǔ)存郵件文件的各級(jí)文件夾名稱。例如,收到的郵件攜帶的標(biāo)識(shí)碼為mx82tl332829582trzqgfrcg,其中 1332829582 為日期信息,mx82t、trzqgfrcg 為非日期信息,1332829582可以轉(zhuǎn)化為對(duì)應(yīng)的日期20120327。假設(shè)標(biāo)識(shí)碼通過(guò)Hash算法映射到磁盤號(hào)為09,子目錄為m的路徑,將日期信息和非日期信息中的一部分作為上述路徑的一部分得到的存儲(chǔ)路徑為,/ BASE_DIR / 09 / m/201203/27/fr/cg,其中BASE_DIR為基礎(chǔ)存儲(chǔ)目錄。由于采用了映射的方法,可以通過(guò)映射規(guī)則的設(shè)定,使得不同的郵件映射得到的路徑不同,從而使得郵件的存儲(chǔ)位置充分散列,即在同一文件夾下不會(huì)有過(guò)多的郵件,提高存取的速度。通過(guò)將日期信息作為路徑的一部分,可以進(jìn)一步散列需要存儲(chǔ)的文件,得到的文件存儲(chǔ)路徑能有效的提高文件存取的速度,而且方便過(guò)期文件的清理工作。例如,對(duì)于超過(guò)郵件攔截恢復(fù)期限(3天、5天、10天等)的文件,清理程序可以根據(jù)路徑中攜帶的日期信息,直接清理整個(gè)目錄。
[0044]步驟S530,以單文件的形式單獨(dú)存儲(chǔ)郵件。本步驟中,把大郵件都以單個(gè)文件的形式單獨(dú)分別存儲(chǔ),即每個(gè)郵件單獨(dú)對(duì)應(yīng)一個(gè)文件存儲(chǔ)到步驟S520獲得的路徑中,當(dāng)然,如果不同郵件獲得的路徑相同,可以多個(gè)郵件對(duì)應(yīng)的文件存儲(chǔ)在相同的目錄中??梢砸脏]件的標(biāo)識(shí)碼作為文件名存儲(chǔ)文件,保證了存儲(chǔ)郵件的唯一性。因?yàn)槭盏降泥]件的數(shù)據(jù)量相對(duì)較大,所以每個(gè)郵件都以單一文件的形式分別存儲(chǔ),便于管理。
[0045]步驟S540,在指向文件中與郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位設(shè)置標(biāo)識(shí)郵件以單文件的形式單獨(dú)存儲(chǔ)。指向文件可以是Hash表文件,記錄了郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位,在標(biāo)識(shí)位設(shè)置有用以標(biāo)識(shí)郵件的存儲(chǔ)形式為以大郵件的形式存儲(chǔ)的數(shù)值,例如標(biāo)識(shí)位為O。在讀取郵件時(shí),根據(jù)標(biāo)識(shí)碼找到標(biāo)識(shí)位,再根據(jù)標(biāo)識(shí)位判斷郵件的存儲(chǔ)形式,有區(qū)別的采取相應(yīng)的郵件讀取方法。例如如果讀取到的標(biāo)識(shí)位為0,表明郵件是以單文件的形式單獨(dú)存儲(chǔ)的,則可以根據(jù)標(biāo)識(shí)碼映射得到路徑,在該路徑下讀取郵件等。當(dāng)然,也可以直接在指向文件中直接存儲(chǔ)步驟S520中映射獲得的路徑。
[0046]如果步驟S510的判斷結(jié)果為否,則進(jìn)入步驟S550,以郵件的標(biāo)識(shí)碼進(jìn)行映射獲得路徑。步驟S550與步驟S520相似,只是基礎(chǔ)存儲(chǔ)目錄可以不同或者不將非日期信息作為路徑的一部分。因?yàn)閷?duì)于小郵件的存儲(chǔ)來(lái)說(shuō),由于大量的小郵件已經(jīng)通過(guò)添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)的方式,大大減少了需要存儲(chǔ)的文件的數(shù)量,因此,可以不需要進(jìn)一步的散列,也就是不需要將非日期信息作為路徑的一部分。需要特別說(shuō)明的是,步驟S550與步驟S520也可以完全相同。
[0047]步驟S560,將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)。預(yù)定文件是指預(yù)先設(shè)定的用來(lái)集中存儲(chǔ)小郵件的文件。例如,收到的郵件Ml經(jīng)判斷小于512KB,則將郵件Ml添加到某一預(yù)定文件Fl中,隨后如果收到郵件M2經(jīng)判斷小于512KB時(shí),可以再將郵件M2添加到該預(yù)定文件Fl中。這樣實(shí)現(xiàn)了將郵件Ml和郵件M2集中存儲(chǔ)在預(yù)定文件Fl中。預(yù)定文件可以是Hash桶文件(哈希桶文件)、打包文件或是壓縮文件等。在進(jìn)行添加存儲(chǔ)操作時(shí),可以用0_APPEND的方式(以追加的方式打開(kāi)文件,每次寫(xiě)之前,都將標(biāo)志位移動(dòng)到文件的末端)在預(yù)定文件末位添加郵件的數(shù)據(jù)量、郵件內(nèi)容數(shù)據(jù),當(dāng)然也可以只在預(yù)定文件末位添加郵件內(nèi)容數(shù)據(jù),并記錄郵件的起始和結(jié)束標(biāo)記。
[0048]步驟S570,在指向文件中與郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位設(shè)置標(biāo)識(shí)郵件以集中存儲(chǔ)的形式存儲(chǔ)、在指向文件中設(shè)置存儲(chǔ)路徑與在預(yù)定文件中的存儲(chǔ)位置。指向文件可以是Hash表文件,記錄了郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位,在標(biāo)識(shí)位設(shè)置有用以標(biāo)識(shí)郵件的存儲(chǔ)形式為集中存儲(chǔ)的數(shù)值,例如標(biāo)識(shí)位為I。在指向文件中還保存有存儲(chǔ)該郵件的預(yù)定文件的路徑,以及對(duì)應(yīng)郵件在預(yù)定文件中的存儲(chǔ)位置。在讀取郵件時(shí),根據(jù)標(biāo)識(shí)碼找到標(biāo)識(shí)位,再根據(jù)標(biāo)識(shí)位判斷郵件的存儲(chǔ)形式,有區(qū)別的采取相應(yīng)的郵件讀取方法。在讀取郵件時(shí),就不需要再計(jì)算預(yù)定文件的路徑和郵件的存儲(chǔ)地址了,直接把指向文件讀入計(jì)算機(jī)內(nèi)存,在內(nèi)存中高速檢索,獲取郵件標(biāo)識(shí)碼對(duì)應(yīng)的預(yù)定文件地址和在預(yù)定文件中的存儲(chǔ)位置,存儲(chǔ)位置可以是預(yù)定文件數(shù)據(jù)段中的偏移地址。
[0049]上述垃圾郵件處理方法,通過(guò)判斷郵件的數(shù)據(jù)量與閾值的關(guān)系,將郵件分為兩種存儲(chǔ)方式:郵件的數(shù)據(jù)量大于閾值的,以單文件的形式單獨(dú)存儲(chǔ)郵件;郵件的數(shù)據(jù)量不大于閾值的,將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)。將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ),減少了文件的數(shù)量,可以減少磁盤輸入輸出操作的次數(shù),減少了郵件存儲(chǔ)耗時(shí)。同時(shí)以日期信息作為存儲(chǔ)的路徑,一方面便于充分散列需要存儲(chǔ)的文件,另一方面也便于集中以日期為單位進(jìn)行郵件的清理。通過(guò)指向文件的方式記錄郵件的存儲(chǔ)方式,可以快速讀取郵件。
[0050]反垃圾郵件系統(tǒng)攔截到被認(rèn)為是垃圾郵件的郵件時(shí),調(diào)用上述垃圾郵件處理方法提供的存儲(chǔ)接口(SaveMail)進(jìn)行被攔截郵件的臨時(shí)存儲(chǔ);上述垃圾郵件處理方法接收被攔截的郵件并按照上述過(guò)程進(jìn)行被攔截郵件的存儲(chǔ);當(dāng)用戶需要恢復(fù)被攔截的郵件時(shí),調(diào)用上述垃圾郵件處理方法提供的郵件讀取接口(ReadMail),完成被攔截郵件的讀取和轉(zhuǎn)存:在讀取郵件時(shí),根據(jù)標(biāo)識(shí)碼找到標(biāo)識(shí)位,再根據(jù)標(biāo)識(shí)位判斷郵件的存儲(chǔ)形式,有區(qū)別的采取相應(yīng)的郵件讀取方法。例如如果讀取到的標(biāo)識(shí)位為0,表明郵件是以單文件的形式單獨(dú)存儲(chǔ)的,則可以根據(jù)標(biāo)識(shí)碼映射得到路徑,在該路徑下讀取郵件;如果讀取到的標(biāo)識(shí)位為1,表明郵件是以添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)的,獲取郵件標(biāo)識(shí)碼對(duì)應(yīng)的預(yù)定文件地址和在預(yù)定文件中的數(shù)據(jù)段中的偏移地址,讀取相應(yīng)的數(shù)據(jù)以便進(jìn)行郵件的恢復(fù)。
[0051]此外,如圖6所示,本實(shí)施例提供了一種垃圾郵件處理系統(tǒng),包括接收模塊、判斷模塊、第一存儲(chǔ)模塊及第二存儲(chǔ)模塊。
[0052]接收模塊用于接收被攔截的郵件。郵件在被反垃圾郵件系統(tǒng)攔截時(shí),調(diào)用垃圾郵件處理系統(tǒng)提供的存儲(chǔ)接口(SaveMail)進(jìn)行被攔截郵件的臨時(shí)存儲(chǔ),即通過(guò)上述存儲(chǔ)接口(SaveMail)接收被反垃圾郵件系統(tǒng)攔截的郵件。攔截郵件的規(guī)則可以根據(jù)需要進(jìn)行設(shè)定,例如根據(jù)郵件地址、關(guān)鍵詞等攔截可能為垃圾郵件的郵件。
[0053]判斷模塊用于判斷所述郵件的數(shù)據(jù)量是否大于閾值。郵件的大小是指郵件數(shù)據(jù)的大小,閾值是指預(yù)設(shè)的郵件的數(shù)據(jù)量臨界值,例如512KBUMB等,通過(guò)對(duì)郵件的數(shù)據(jù)量和預(yù)設(shè)的閾值進(jìn)行比較,判斷收到的郵件的數(shù)據(jù)量是否大于閾值,如果大于則指令第一存儲(chǔ)模塊進(jìn)行存儲(chǔ),如果不大于,則指令第二存儲(chǔ)模塊進(jìn)行存儲(chǔ)。
[0054]如果判斷模塊判斷郵件大于閾值,第一存儲(chǔ)模塊以單文件的形式單獨(dú)存儲(chǔ)郵件。把郵件的數(shù)據(jù)量大于預(yù)設(shè)閾值的每個(gè)郵件(以下簡(jiǎn)稱大郵件)都以單個(gè)文件的形式單獨(dú)分別存儲(chǔ),即每個(gè)郵件單獨(dú)對(duì)應(yīng)一個(gè)文件。因?yàn)槭盏降泥]件的數(shù)據(jù)量相對(duì)較大,所以每個(gè)郵件都以單一文件的形式分別存儲(chǔ),便于管理。
[0055]如果判斷模塊判斷郵件不大于閾值,第二存儲(chǔ)模塊將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)。預(yù)定文件是指預(yù)先設(shè)定的用來(lái)集中存儲(chǔ)大小小于閾值的郵件(以下簡(jiǎn)稱小郵件)的文件。例如,收到的郵件Ml經(jīng)判斷小于512KB,則將郵件Ml添加到某一預(yù)定文件Fl中,隨后如果收到郵件M2經(jīng)判斷小于512KB時(shí),可以再將郵件M2添加到該預(yù)定文件Fl中。這樣實(shí)現(xiàn)了將郵件Ml和郵件M2集中存儲(chǔ)在預(yù)定文件Fl中。也就是說(shuō),集中存儲(chǔ)是將多個(gè)郵件集中存儲(chǔ)到一個(gè)文件中,當(dāng)然,預(yù)定文件的數(shù)量也可以不止一個(gè),只要預(yù)定文件的數(shù)量大于郵件的數(shù)量即可達(dá)到集中存儲(chǔ)的目的。預(yù)定文件可以是Hash桶文件(哈希桶文件)、打包文件或是壓縮文件等。在進(jìn)行添加存儲(chǔ)操作時(shí),可以用0_APPEND的方式(以追加的方式打開(kāi)文件,每次寫(xiě)之前,都將標(biāo)志位移動(dòng)到文件的末端)在預(yù)定文件末位添加此次添加的郵件的數(shù)據(jù)量及郵件的內(nèi)容數(shù)據(jù),當(dāng)然也可以只在預(yù)定文件末位添加郵件內(nèi)容數(shù)據(jù),并記錄郵件的起始和結(jié)束標(biāo)記。
[0056]上述垃圾郵件處理系統(tǒng),通過(guò)判斷郵件的數(shù)據(jù)量與閾值的關(guān)系,將郵件分為兩種存儲(chǔ)方式:郵件的數(shù)據(jù)量大于閾值的,以單文件的形式單獨(dú)存儲(chǔ)郵件;郵件的數(shù)據(jù)量不大于閾值的,將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)。將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ),減少了文件的數(shù)量,可以減少磁盤輸入輸出操作的次數(shù),減少了郵件存儲(chǔ)耗時(shí)。
[0057]如圖7所示,在其中一個(gè)實(shí)施例中,垃圾郵件處理系統(tǒng)還包括以郵件的標(biāo)識(shí)碼進(jìn)行映射獲得路徑的路徑模塊。每個(gè)郵件在接收時(shí)都會(huì)有一個(gè)標(biāo)識(shí)碼所標(biāo)識(shí),郵件的標(biāo)識(shí)碼通常是唯一的(又可以稱為唯一索引為消息id,MeSSageID),并且通常郵件的標(biāo)識(shí)碼中包括了郵件的投遞時(shí)間信息,格式為size_t類型,在存儲(chǔ)、讀取、刪除郵件時(shí)都會(huì)根據(jù)郵件的標(biāo)識(shí)碼對(duì)郵件進(jìn)行操作。路徑模塊可以通過(guò)以郵件的標(biāo)識(shí)碼進(jìn)行映射獲得存儲(chǔ)路徑,先把標(biāo)識(shí)碼通過(guò)一個(gè)Hash函數(shù)計(jì)算,轉(zhuǎn)換得到文件存儲(chǔ)路徑,所述路徑包括儲(chǔ)存郵件文件的各級(jí)文件夾名稱。路徑模塊獲得路徑后,第一存儲(chǔ)模塊將郵件以單文件的形式單獨(dú)存儲(chǔ)在所述路徑下,并且可以以郵件的標(biāo)識(shí)碼作為文件名存儲(chǔ)文件,保證了存儲(chǔ)郵件的唯一性;第二存儲(chǔ)模塊將郵件添加在上述路徑下的預(yù)定文件中。由于采用了映射的方法,可以通過(guò)映射規(guī)則的設(shè)定,使得不同的郵件映射得到的路徑不同,從而使得郵件的存儲(chǔ)位置充分散列,即在同一文件夾下不會(huì)有過(guò)多的郵件,提高存取的速度。
[0058]在有些具體的應(yīng)用中,標(biāo)識(shí)碼包含有日期信息,上述路徑模塊以郵件的標(biāo)識(shí)碼進(jìn)行映射獲得存儲(chǔ)所述郵件的路徑的過(guò)程中,可以將日期信息作為路徑的一部分。例如,收到的郵件攜帶的標(biāo)識(shí)碼為mx82tl332829582trzqgfrcg,其中1332829582為日期信息可以轉(zhuǎn)化為對(duì)應(yīng)的日期20120327。當(dāng)然,在其他實(shí)施例中,標(biāo)識(shí)碼中可以直接包含不需要轉(zhuǎn)化的日期信息。假設(shè)標(biāo)識(shí)碼通過(guò)Hash算法映射到磁盤號(hào)為09,子目錄為m的路徑,將日期作為上述路徑的一部分得到的存儲(chǔ)路徑為,/ BASE_DIR/09/m/201203/27或/ BASE_DIR / 09/m/2012/03/27等,其中BASE_DIR為基礎(chǔ)存儲(chǔ)目錄。通過(guò)將日期信息作為路徑的一部分,可以進(jìn)一步散列需要存儲(chǔ)的文件,得到的文件存儲(chǔ)路徑能有效的提高文件存取的速度,而且方便過(guò)期文件的清理工作。例如,對(duì)于超過(guò)郵件攔截恢復(fù)期限(3天、5天、10天等)的文件,清理程序可以根據(jù)路徑中攜帶的日期信息,直接清理整個(gè)目錄。
[0059]通常,郵件的標(biāo)識(shí)碼除了包含有日期信息外,還包含有非日期信息,上述路徑模塊以郵件的標(biāo)識(shí)碼進(jìn)行映射獲得存儲(chǔ)所述郵件的路徑的過(guò)程中,還可以將非日期信息中的部分或全部作為所述路徑的一部分。仍然以標(biāo)識(shí)碼mx82tl332829582trzqgfrcg為例進(jìn)行說(shuō)明,把后4位字符“frcg”提取出來(lái),作為郵件存儲(chǔ)路徑的一部分,例如可以是“/frcg/”或者“/fr/cg/”,從而得到最終的郵件存儲(chǔ)路徑/ BASE_DIR / 09 / m/201203/27/frcg/或/BASE_DIR / 09 / m/201203/27/fr/cg。把郵件標(biāo)識(shí)碼中非日期信息提取出來(lái)作為郵件存儲(chǔ)路徑中的一部分,可以使郵件文件充分散列,避免一個(gè)文件夾下文件數(shù)量過(guò)多、導(dǎo)致文件檢索效率變低。除了提取標(biāo)識(shí)碼中的后四位外,也可以提取后一位、后兩位或是中間的幾位等,這些都可以根據(jù)需要進(jìn)行設(shè)定。此外,也可以不將非日期信息作為路徑的一部分,例如對(duì)于小郵件的存儲(chǔ)來(lái)說(shuō),由于大量的小郵件已經(jīng)通過(guò)添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)的方式,大大減少了需要存儲(chǔ)的文件的數(shù)量,因此,可以不需要進(jìn)一步的散列,也就是不需要將非日期信息作為路徑的一部分。
[0060]在其他實(shí)施例中,路徑模塊除了通過(guò)映射的方式獲得路徑外,還可以對(duì)每個(gè)文件夾存儲(chǔ)的文件或文件夾數(shù)量進(jìn)行限定,當(dāng)達(dá)到限定數(shù)量時(shí),即更換存儲(chǔ)路徑,也可避免在同一文件夾下存儲(chǔ)過(guò)多的郵件,提高存取的速度。
[0061]如圖8所示,為了在存儲(chǔ)郵件后能夠快速的讀取郵件,上述垃圾郵件處理系統(tǒng)還包括第一指向模塊及第二指向模塊。
[0062]如果郵件大于閾值,第一指向模塊在指向文件中與郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位設(shè)置標(biāo)識(shí)郵件以單文件的形式單獨(dú)存儲(chǔ)。指向文件可以是Hash表文件,記錄了郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位,在標(biāo)識(shí)位設(shè)置有用以標(biāo)識(shí)郵件的存儲(chǔ)形式為以大郵件的形式存儲(chǔ)的數(shù)值,例如標(biāo)識(shí)位為O。在讀取郵件時(shí),根據(jù)標(biāo)識(shí)碼找到標(biāo)識(shí)位,再根據(jù)標(biāo)識(shí)位判斷郵件的存儲(chǔ)形式,有區(qū)別的采取相應(yīng)的郵件讀取方法。例如如果讀取到的標(biāo)識(shí)位為0,表明郵件是以單文件的形式單獨(dú)存儲(chǔ)的,則可以根據(jù)標(biāo)識(shí)碼映射得到路徑,在該路徑下讀取郵件等。當(dāng)然,也可以直接在指向文件中直接存儲(chǔ)路徑模塊映射獲得的路徑。
[0063]如果郵件不大于閾值,第二指向模塊在指向文件中與郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位設(shè)置標(biāo)識(shí)郵件以集中存儲(chǔ)的形式存儲(chǔ)、在指向文件中設(shè)置存儲(chǔ)路徑與在預(yù)定文件中的存儲(chǔ)位置。指向文件可以是Hash表文件,記錄了郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位,在標(biāo)識(shí)位設(shè)置有用以標(biāo)識(shí)郵件的存儲(chǔ)形式為集中存儲(chǔ)的數(shù)值,例如標(biāo)識(shí)位為I。在指向文件中還保存有存儲(chǔ)該郵件的預(yù)定文件的路徑,以及對(duì)應(yīng)郵件在預(yù)定文件中的存儲(chǔ)位置。在讀取郵件時(shí),根據(jù)標(biāo)識(shí)碼找到標(biāo)識(shí)位,再根據(jù)標(biāo)識(shí)位判斷郵件的存儲(chǔ)形式,有區(qū)別的采取相應(yīng)的郵件讀取方法。在讀取郵件時(shí),就不需要再計(jì)算預(yù)定文件的路徑和郵件的存儲(chǔ)地址了,直接把指向文件讀入計(jì)算機(jī)內(nèi)存,在內(nèi)存中高速檢索,獲取郵件標(biāo)識(shí)碼對(duì)應(yīng)的預(yù)定文件地址和在預(yù)定文件中的存儲(chǔ)位置,存儲(chǔ)位置可以是預(yù)定文件數(shù)據(jù)段中的偏移地址。
[0064]上述垃圾郵件處理系統(tǒng),通過(guò)判斷郵件的數(shù)據(jù)量與閾值的關(guān)系,將郵件分為兩種存儲(chǔ)方式:郵件的數(shù)據(jù)量大于閾值的,以單文件的形式單獨(dú)存儲(chǔ)郵件;郵件的數(shù)據(jù)量不大于閾值的,將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)。將郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ),減少了文件的數(shù)量,可以減少磁盤輸入輸出操作的次數(shù),減少了郵件存儲(chǔ)耗時(shí)。同時(shí)以日期信息作為存儲(chǔ)的路徑,一方面便于充分散列需要存儲(chǔ)的文件,另一方面也便于集中以日期為單位進(jìn)行郵件的清理。通過(guò)指向文件的方式記錄郵件的存儲(chǔ)方式,可以快速讀取郵件。
[0065]反垃圾郵件系統(tǒng)攔截到被認(rèn)為是垃圾郵件的郵件時(shí),調(diào)用上述垃圾郵件處理系統(tǒng)提供的存儲(chǔ)接口(SaveMail)進(jìn)行被攔截郵件的臨時(shí)存儲(chǔ);上述垃圾郵件處理系統(tǒng)接收被攔截的郵件并按照上述過(guò)程進(jìn)行被攔截郵件的存儲(chǔ);當(dāng)用戶需要恢復(fù)被攔截的郵件時(shí),調(diào)用上述垃圾郵件處理系統(tǒng)提供的郵件讀取接口(ReadMail),完成被攔截郵件的讀取和轉(zhuǎn)存:在讀取郵件時(shí),根據(jù)標(biāo)識(shí)碼找到標(biāo)識(shí)位,再根據(jù)標(biāo)識(shí)位判斷郵件的存儲(chǔ)形式,有區(qū)別的采取相應(yīng)的郵件讀取方法。例如如果讀取到的標(biāo)識(shí)位為O,表明郵件是以單文件的形式單獨(dú)存儲(chǔ)的,則可以根據(jù)標(biāo)識(shí)碼映射得到路徑,在該路徑下讀取郵件;如果讀取到的標(biāo)識(shí)位為1,表明郵件是以添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)的,獲取郵件標(biāo)識(shí)碼對(duì)應(yīng)的預(yù)定文件地址和在預(yù)定文件中的數(shù)據(jù)段中的偏移地址,讀取相應(yīng)的數(shù)據(jù)以便進(jìn)行郵件的恢復(fù)。
[0066]以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對(duì)本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
【權(quán)利要求】
1.一種垃圾郵件處理方法,其特征在于,包括: 接收被攔截的郵件; 判斷所述郵件的數(shù)據(jù)量是否大于閾值; 如果是,以單文件的形式單獨(dú)存儲(chǔ)所述郵件; 如果否,將所述郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)。
2.根據(jù)權(quán)利要求1所述的垃圾郵件處理方法,其特征在于,還包括以所述郵件的標(biāo)識(shí)碼進(jìn)行映射獲得路徑的步驟,所述以單文件的形式單獨(dú)存儲(chǔ)所述郵件的步驟中,將所述郵件以單文件的形式單獨(dú)存儲(chǔ)在所述路徑下;所述將所述郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)的步驟中,將所述郵件添加在所述路徑下的預(yù)定文件中。
3.根據(jù)權(quán)利要求2所述的垃圾郵件處理方法,其特征在于,所述標(biāo)識(shí)碼包含日期信息,所述以所述郵件的標(biāo)識(shí)碼進(jìn)行映射獲得存儲(chǔ)所述郵件的路徑的步驟中將所述日期信息作為所述路徑的一部分。
4.根據(jù)權(quán)利要求3所述的垃圾郵件處理方法,其特征在于,所述標(biāo)識(shí)碼還包含非日期信息,所述以所述郵件的標(biāo)識(shí)碼進(jìn)行映射獲得存儲(chǔ)所述郵件的路徑的步驟中將所述非日期信息中的部分或全部作為所述路徑的一部分。
5.根據(jù)權(quán)利要求1至4中任意一項(xiàng)所述的垃圾郵件處理方法,其特征在于, 如果判斷郵件大于閾值,還包括在指向文件中與所述郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位設(shè)置標(biāo)識(shí)所述郵件以單文件的形式單獨(dú)存儲(chǔ)的步驟; 如果判斷郵件不大于閾值,還包括在所述指向文件中與所述郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位設(shè)置標(biāo)識(shí)所述郵件以集中存儲(chǔ)的形式存儲(chǔ)、在所述指向文件中設(shè)置存儲(chǔ)路徑與在所述預(yù)定文件中的存儲(chǔ)位置的步驟。
6.一種垃圾郵件處理系統(tǒng),其特征在于,包括: 接收模塊,用于接收被攔截的郵件; 判斷模塊,用于判斷所述郵件的數(shù)據(jù)量是否大于閾值; 第一存儲(chǔ)模塊,如果所述郵件大于閾值,以單文件的形式單獨(dú)存儲(chǔ)所述郵件; 第二存儲(chǔ)模塊,如果所述郵件不大于閾值,將所述郵件添加在預(yù)定文件中進(jìn)行集中存儲(chǔ)。
7.根據(jù)權(quán)利要求6所述的垃圾郵件處理系統(tǒng),其特征在于,還包括以所述郵件的標(biāo)識(shí)碼進(jìn)行映射獲得路徑的路徑模塊,所述第一存儲(chǔ)模塊將所述郵件以單文件的形式單獨(dú)存儲(chǔ)在所述路徑下;所述第二存儲(chǔ)模塊將所述郵件添加在所述路徑下的預(yù)定文件中。
8.根據(jù)權(quán)利要求7所述的垃圾郵件處理系統(tǒng),其特征在于,所述路徑模塊將所述標(biāo)識(shí)碼中的日期信息作為所述路徑的一部分。
9.根據(jù)權(quán)利要求8所述的垃圾郵件處理系統(tǒng),其特征在于,所述路徑模塊將所述標(biāo)識(shí)碼中的部分或全部非日期信息作為所述路徑的一部分。
10.根據(jù)權(quán)利要求6至9中任意一項(xiàng)所述的垃圾郵件處理系統(tǒng),其特征在于,還包括: 第一指向模塊,如果所述郵件大于閾值,在指向文件中與所述郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位設(shè)置標(biāo)識(shí)所述郵件以單文件的形式單獨(dú)存儲(chǔ); 第二指向模塊,如果所述郵件不大于閾值,在所述指向文件中與所述郵件的標(biāo)識(shí)碼對(duì)應(yīng)的標(biāo)識(shí)位設(shè)置標(biāo)識(shí)所述郵件以集中存儲(chǔ)的形式存儲(chǔ)、在所述指向文件中設(shè)置存儲(chǔ)路徑與在所述預(yù)定文件中的存儲(chǔ)·位置。
【文檔編號(hào)】H04L12/58GK103580989SQ201210271378
【公開(kāi)日】2014年2月12日 申請(qǐng)日期:2012年7月31日 優(yōu)先權(quán)日:2012年7月31日
【發(fā)明者】黃鐵鳴, 文琛, 金烈勝 申請(qǐng)人:騰訊科技(深圳)有限公司