一種檢測網(wǎng)絡中內容的方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開一種檢測網(wǎng)絡中內容的方法和系統(tǒng),方法包括接收應用平臺發(fā)送的網(wǎng)絡中發(fā)布的內容,以及所述內容對應的指示是否進行重新檢測的指示標識;判斷接收的所述指示標識是否指示對所述內容進行重新檢測;在所述指示標識沒有指示對所述內容進行重新檢測時,根據(jù)檢測結果列表對所述內容進行檢測,返回檢測結果;在所述指示標識指示對所述內容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內容進行檢測,返回檢測結果。本發(fā)明解決了將危險內容誤判為通過的技術問題,取得了節(jié)約人力成本,避免危險內容危害網(wǎng)絡的技術效果。
【專利說明】一種檢測網(wǎng)絡中內容的方法和系統(tǒng)
【技術領域】
[0001]本發(fā)明涉及計算機網(wǎng)絡領域,特別涉及檢測網(wǎng)絡中內容的方法和系統(tǒng)。
【背景技術】
[0002]隨著互聯(lián)網(wǎng)應用的發(fā)展,網(wǎng)絡中發(fā)布的內容越來越多,這些內容中經(jīng)常包括垃圾信息或者惡意攻擊信息等,因此需要對網(wǎng)絡中內容進行檢測,以保證網(wǎng)絡環(huán)境的安全和潔凈。
[0003]現(xiàn)有技術中檢測網(wǎng)絡中內容的技術方案主要包括敏感詞檢測和人工檢測。其中,人工檢測的準確性高,能夠精確判斷內容是否適當。但是,因為網(wǎng)絡中內容量的急劇猛增,使得對所有內容都進行人工檢測,會增加巨額的人力成本,而且人工檢測的效率也相對較低。
[0004]敏感詞檢測為將網(wǎng)絡中內容與敏感詞庫中敏感詞進行匹配,如果匹配成功,則該內容命中了敏感詞庫中的敏感詞,由此判斷出該內容存在風險,之后對該內容進行人工檢測。如果內容沒有命中敏感詞庫中的敏感詞,則認為該內容安全,通過檢測。在該技術方案中,敏感詞庫中敏感詞的維護經(jīng)常滯后于網(wǎng)絡中內容的發(fā)展,經(jīng)常是內容中某個敏感詞出現(xiàn)一段時間后才會被發(fā)現(xiàn)。因此,導致部分危險內容不應被檢測通過卻被誤判為通過,因此對網(wǎng)絡環(huán)境造成了危害,使得內容檢測率降低。在現(xiàn)實統(tǒng)計結果中也表明未命中敏感詞的內容同樣存在大量垃圾信息,特別是各種廣告信息。
【發(fā)明內容】
[0005]本發(fā)明提供了檢測網(wǎng)絡中內容的方法和系統(tǒng),以解決將危險內容誤判為通過,內容檢測率降低的技術問題。
[0006]本發(fā)明公開了一種檢測網(wǎng)絡中內容的方法,所述方法包括:
[0007]接收應用平臺發(fā)送的網(wǎng)絡中發(fā)布的內容,以及所述內容對應的指示是否進行重新檢測的指示標識;其中當所述內容對應的配置參量的值達到預設的參量閥值時,所述指示標識指示對所述內容進行重新檢測,所述配置參量用于表征所述內容被關注的程度,所述配置參量的值越大,則所述內容被關注的程度越高;
[0008]判斷接收的所述指示標識是否指示對所述內容進行重新檢測;
[0009]在所述指示標識沒有指示對所述內容進行重新檢測時,根據(jù)檢測結果列表對所述內容進行檢測,返回檢測結果;所述檢測結果列表中保存內容的檢測結果;
[0010]在所述指示標識指示對所述內容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內容進行檢測,返回檢測結果。
[0011]其中,所述配置參量至少包括下列參量中的一種:
[0012]內容被評論的次數(shù);
[0013]內容被瀏覽的次數(shù);
[0014]內容被轉發(fā)的次數(shù);
[0015]內容在頁面中停留的時長。
[0016]其中,所述接收應用平臺發(fā)送的網(wǎng)絡中發(fā)布的內容后包括:
[0017]對所述內容進行哈希運算,獲得所述內容對應的哈希值;
[0018]所述檢測結果列表中對應地保存內容的哈希值和內容的檢測結果;
[0019]所述根據(jù)檢測結果列表對所述內容進行檢測具體包括:
[0020]判斷所述檢測結果列表中是否包括所述哈希值,如果不包括,則根據(jù)已接收的與所述內容相同和/或相似內容的數(shù)量對所述內容進行檢測;如果包括,則獲取所述哈希值在所述檢測結果列表中對應的檢測結果。
[0021]其中,所述對所述內容進行哈希運算,獲得所述內容對應的哈希值具體包括:
[0022]除去所述內容中冗余信息,對除去冗余信息的所述內容進行哈希運算,獲得所述內容對應的指紋哈希值。
[0023]其中,所述獲得所述內容對應的指紋哈希值后還包括:
[0024]將所述指紋哈希值對應的計數(shù)值加I ;
[0025]所述根據(jù)已接收的與所述內容相同和/或相似內容的數(shù)量對所述內容進行檢測具體包括:
[0026]判斷所述指紋哈希值對應的計數(shù)值是否大于預設的計數(shù)值閥值,
[0027]如果大于,則接收審核指令,根據(jù)所述審核指令對所述內容進行檢測;
[0028]否則,確定檢測結果為所述內容通過檢測。
[0029]其中,所述如果大于,則接收審核指令,根據(jù)所述審核指令對所述內容進行檢測后還包括:
[0030]在所述檢測結果列表中對應地保存所述哈希值和根據(jù)所述審核指令對所述內容進行檢測所得的檢測結果。
[0031]其中,所述根據(jù)已接收的與所述內容相同和/或相似內容的數(shù)量對所述內容進行檢測之前還包括:
[0032]判斷所述內容是否命中敏感詞庫中的敏感詞;
[0033]如果是,則接收審核指令,根據(jù)所述審核指令對所述內容進行檢測,獲取檢測結果;
[0034]所述返回檢測結果之后還包括:在所述檢測結果列表中對應地保存所述內容的哈希值和所得的根據(jù)所述審核指令對所述內容進行檢測所得的檢測結果;
[0035]如果否,進行所述根據(jù)已接收的與所述內容相同和/或相似內容的數(shù)量對所述內容進行檢測的步驟。
[0036]其中,所述在所述指示標識指示對所述內容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內容進行檢測,返回檢測結果后還包括:
[0037]在所述檢測結果列表中更新所述內容的檢測結果為根據(jù)所述審核指令對所述內容進行檢測所得的檢測結果。
[0038]根據(jù)本發(fā)明的另一方面,公開了一種檢測網(wǎng)絡中內容的系統(tǒng),包括:
[0039]接收單元,用于接收應用平臺發(fā)送的網(wǎng)絡中發(fā)布的內容,以及所述內容對應的指示是否進行重新檢測的指示標識;其中當所述內容對應的配置參量的值達到預設的參量閥值時,所述指示標識指示對所述內容進行重新檢測,所述配置參量用于表征所述內容被關注的程度,所述配置參量的值越大,則所述內容被關注的程度越高;
[0040]判斷單元,用于判斷接收的所述指示標識是否指示對所述內容進行重新檢測;
[0041]第一檢測單元,用于在所述指示標識沒有指示對所述內容進行重新檢測時,根據(jù)檢測結果列表對所述內容進行檢測,返回檢測結果;所述檢測結果列表中保存內容的檢測結果;
[0042]第二檢測單元,用于在所述指示標識指示對所述內容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內容進行檢測,返回檢測結果。
[0043]其中,所述系統(tǒng)還包括:哈希值計算單元;
[0044]所述哈希值計算單元,用于在所述接收單元接收到應用平臺發(fā)送的網(wǎng)絡中發(fā)布的內容后,對所述內容進行哈希運算,獲得所述內容對應的哈希值;
[0045]所述檢測結果列表中對應地保存內容的哈希值和內容的檢測結果;
[0046]所述根據(jù)檢測結果列表對所述內容進行檢測具體包括:
[0047]所述第一檢測單元,具體用于判斷所述檢測結果列表中是否包括所述哈希值,如果不包括,則根據(jù)已接收的與所述內容相同和/或相似內容的數(shù)量對所述內容進行檢測;如果包括,則獲取所述哈希值在所述檢測結果列表中對應的檢測結果。
[0048]本發(fā)明的有益效果是:通過本發(fā)明中技術方案,一方面,對于檢測結果進行保存,可以應用保存的檢測結果對重復內容進行檢測,另一方面,由于危險內容的危害性與該內容被關注的程度有關,因此,當內容被關注的程度達到預設閥值后,對該內容進行精確的人工檢測。由此,既可以避免對每個內容都進行人工檢測,又能夠在危險內容造成危害前,糾正對該危險內容的誤判,解決了將危險內容誤判為通過的技術問題。因為,能夠避免對每個內容都進行人工檢測,所以取得了節(jié)約人力成本、提高檢測效率的技術效果,同時因為能夠在危險內容造成危害前,糾正對該危險內容的誤判,取得了提高檢測正確率,避免危險內容危害網(wǎng)絡的技術效果。
【專利附圖】
【附圖說明】
[0049]圖1為根據(jù)本發(fā)明一實施例的檢測網(wǎng)絡中內容的方法的流程圖;
[0050]圖2為根據(jù)本發(fā)明一實施例的根據(jù)檢測結果列表對內容進行檢測的流程圖;
[0051]圖3為根據(jù)本發(fā)明一實施例的步驟S146中操作的流程圖;
[0052]圖4為根據(jù)本發(fā)明另一實施例的檢測網(wǎng)絡中內容的方法的流程圖;
[0053]圖5為根據(jù)本發(fā)明一實施例的檢測網(wǎng)絡中內容的系統(tǒng)的結構圖;
[0054]圖6為根據(jù)本發(fā)明另一實施例的檢測網(wǎng)絡中內容的系統(tǒng)的結構圖。
【具體實施方式】
[0055]為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合附圖對本發(fā)明實施方式作進一步地詳細描述。
[0056]參見圖1,為根據(jù)本發(fā)明一實施例的檢測網(wǎng)絡中內容的方法的流程圖。如圖1所示,該方法包括如下流程。
[0057]步驟S110,接收應用平臺發(fā)送的網(wǎng)絡中發(fā)布的內容,以及內容對應的指示是否進行重新檢測的指示標識。
[0058]在內容對應的配置參量的值達到預設的參量閥值時,應用平臺發(fā)送的指示標識指示對所述內容進行重新檢測。
[0059]在內容對應的配置參量的值未達到預設的參量閥值時,應用平臺發(fā)送的指示標識指示不對所述內容進行重新檢測。
[0060]配置參量用于表征內容被關注的程度,配置參量的值越大,則對應的內容被關注的程度越高。
[0061]因為各個內容所屬的業(yè)務不同,則內容的配置參量可以對應不同。
[0062]配置參量可以至少包括下列參量中的一種,但不局限于此:
[0063]內容被評論的次數(shù);
[0064]內容被瀏覽的次數(shù);
[0065]內容被轉發(fā)的次數(shù);
[0066]內容在頁面中停留的時長。
[0067]當配置參量的值大于參量閥值后,可以確定該配置參量對應的內容的被關注程度達到設置標準,需要對該內容進行精細的外部檢測。
[0068]此外,當配置參量的值大于參量閥值時,可以對該內容進行高危險標識,以使得該內容可以在人工檢測中被優(yōu)先處理。
[0069]通過上述操作,能夠在危險內容造成危害前,糾正對該危險內容的誤判,取得了提高檢測正確率,避免危險內容危害網(wǎng)絡的效果。
[0070]步驟S120,判斷接收的重新檢測的指示標識是否指示進行重新檢測,如果是,則執(zhí)行步驟S130,否則,執(zhí)行步驟S140。
[0071]舉例而言,指示標識可以為:1時,表示進行重新檢測,O時,表示不進行重新檢測。
[0072]步驟S130,接收審核指令,根據(jù)審核指令對接收的網(wǎng)絡中發(fā)布的該內容進行檢測,返回檢測結果。
[0073]此處,接收審核指令,根據(jù)審核指令對內容進行檢測可以是精細的人工檢測,或其他的根據(jù)外部指令進行精細檢測的方式。
[0074]較佳地,在執(zhí)行完步驟S130后還可以在檢測結果列表中更新該內容的檢測結果為該根據(jù)審核指令對內容進行檢測所得的檢測結果。
[0075]檢測結果列表中對應地保存內容的哈希值和內容的檢測結果。
[0076]步驟S140,根據(jù)檢測結果列表對接收的網(wǎng)絡中發(fā)布的該內容進行檢測,返回檢測結果。
[0077]該檢測結果列表中檢測結果可以是外部配置,也可以是檢測過程中所得檢查結果的記錄,并隨著檢測中結果的變化而實時更新。
[0078]由此,可以直接應用已有的檢測結果對內容進行檢測,提高了檢測效率。
[0079]具體而言,在步驟SllO和步驟S120間還可以包括步驟S120’,對接收的內容進行哈希運算,獲得該內容對應的哈希值;其中步驟S120’的執(zhí)行順序并不局限于此。
[0080]哈希值的計算可以有多種方法。
[0081]舉例而言,對于接收的內容計算MD5哈希值。該哈希值與內容中全部信息對應,此時,包含信息相同的兩個內容的哈希值相同。
[0082]也可以,將內容中冗余信息除去后,對除冗余后的內容進行哈希運算,該所得哈希值與內容中的有用信息對應。本發(fā)明中將對除冗余后的內容進行哈希運算所得哈希值稱為內容的指紋哈希值。包含信息相同或相似的兩個內容的指紋哈希值相同。
[0083]舉例而言,計算指紋哈希值的具體方式為:去掉內容中無關的字符,例如各種控制字符、全角半角標點符號;對內容進行切詞分析,濾除對文義沒有影響的信息,例如,將標點符號、空格、對文意沒有影響的“啊、的”等字詞去除。之后,對操作后保留的信息計算哈希值。
[0084]例如,兩條內容
[0085]“親們、還在#無聊么網(wǎng)絡Y%兼*職日結非誠6勿擾”
[0086]“Α親們、還在@Β無聊么網(wǎng)絡KD兼(職日結非誠GR勿擾”
[0087]該兩條內容除去掉冗余后信息為“親們、還在無聊么網(wǎng)絡兼職日結非誠勿擾”,兩者除去冗余后的部分相同,兩者為相似內容,兩者的指紋哈希值相同。
[0088]本發(fā)明中也可以將內容進行區(qū)分,對不同內容計算不同哈希值。例如,對于長度在預設最大和最小閥值內的內容進行去冗余操作,計算指紋哈希值;對于長度小于最小閥值和長度大于最大閥值的內容整體計算哈希值。
[0089]如圖2所示,步驟S140包括如下步驟。
[0090]步驟S142,判斷檢測結果列表中是否包括接收的網(wǎng)絡中發(fā)布的該內容的哈希值,如果不包括,則執(zhí)行步驟S146,如果包括,則執(zhí)行步驟S144。
[0091]步驟S144,返回所述哈希值在所述檢測結果列表中對應的檢測結果。
[0092]步驟S146,根據(jù)已接收的與上述內容相同和/或相似內容的數(shù)量對上述內容進行檢測。
[0093]相似內容是指除冗余的無意義信息外與接收的內容相同的內容。
[0094]較佳的,在根據(jù)與接收的內容相同和/或相似內容的數(shù)量對接收的內容進行檢測之前,判斷接收的內容是否命中敏感詞庫中的敏感詞;如果是,則接收審核指令,根據(jù)所述審核指令對所述內容進行檢測,獲取檢測結果,返回檢測結果,在檢測結果列表中對應地保存內容的哈希值和所得的根據(jù)審核指令對內容進行檢測所得的檢測結果;如果否,進行所述根據(jù)已接收的與所述內容相同和/或相似內容的數(shù)量對所述內容進行檢測的步驟。
[0095]舉例而言,如圖3所示,步驟S146中包括如下步驟。在該舉例中,根據(jù)之前已經(jīng)接收的、與步驟SllO中接收的內容相同和相似內容的數(shù)量,對步驟SI 10中接收的內容進行檢測。在步驟S120’中,除去接收的內容中冗余信息,對除去冗余信息的內容進行哈希運算,獲得該內容對應的指紋哈希值,并將該指紋哈希值對應的計數(shù)值加I。由此用計數(shù)值表示獲取已接收的與上述內容相同和/或相似內容的數(shù)量。
[0096]步驟S1462,判斷該指紋哈希值對應的計數(shù)值是否大于預設的計數(shù)值閥值,如果是,則執(zhí)行步驟S1464,否則,執(zhí)行步驟S1466。
[0097]其中,具有相同指紋哈希值的內容為相同或相似內容,指紋哈希值的計數(shù)值表示已經(jīng)接收的內容中,與步驟SllO中接收的內容相同或相似的內容數(shù)量。因為,在網(wǎng)絡中垃圾信息多為廣告,其特點為反復重復出現(xiàn),內容相同或相似。由此,通過計算接收的相同的指紋哈希值的累計數(shù)量,能夠檢測出此類垃圾信息。指紋哈希值的計數(shù)值達到預設的計數(shù)值閥值,則表示某一內容反復在網(wǎng)絡中發(fā)布,其很可能為垃圾信息,具有高危險性。
[0098]步驟S1464,接收審核指令,根據(jù)該審核指令對接收的網(wǎng)絡中發(fā)布的該內容進行檢測,檢測結果列表中對應地保存該哈希值和根據(jù)審核指令對內容進行檢測檢測所得的檢測結果。
[0099]步驟S1466,確定檢測結果為接收的內容通過檢測。
[0100]本實施例能夠避免對每個內容都進行人工檢測,所以取得了節(jié)約人力成本、提高檢測效率的技術效果,同時因為能夠在危險內容造成危害前,糾正對該危險內容的誤判,取得了提高檢測正確率,避免危險內容危害網(wǎng)絡的技術效果。
[0101]參見圖4,為根據(jù)本發(fā)明另一實施例的檢測網(wǎng)絡中內容的方法的流程圖。在該實施例中綜合應用敏感詞檢測和相似內容檢測,并在檢測結果列表中對檢測結果做記錄,以在后續(xù)中應用該檢測結果。具體方法包括如下步驟。
[0102]步驟S4010,接收應用平臺發(fā)送的網(wǎng)絡中發(fā)布的內容,以及該內容對應的指示是否進行重新檢測的指示標識。
[0103]步驟S4020,除去內容中冗余信息,對除去冗余信息的內容進行哈希運算,獲得內容對應的指紋哈希值,將該指紋哈希值對應的計數(shù)值加I。
[0104]步驟S4030,判斷接收的內容對應的指示標識是否指示進行重新檢測,如果否,則執(zhí)行步驟S4050,如果是,執(zhí)行步驟S4040。
[0105]步驟S4040,接收審核指令,根據(jù)該審核指令對網(wǎng)絡中發(fā)布的該內容進行檢測,返回檢測結果,在該檢測結果列表中更新接收的內容的指紋哈希值對應的檢測結果為根據(jù)該審核指令對內容進行檢測所得的檢測結果。
[0106]步驟S4050,判斷檢測結果列表中是否包括接收的內容的指紋哈希值,如果不包括,則執(zhí)行步驟S4070,如果包括,則執(zhí)行步驟S4060。
[0107]步驟S4060,返回內容對應的指紋哈希值在檢測結果列表中對應的檢測結果。
[0108]步驟S4070,判斷接收的內容是否命中敏感詞庫中的敏感詞,如果是,則執(zhí)行步驟S4080 ;否則,執(zhí)行步驟S4090。
[0109]步驟S4080,接收審核指令,根據(jù)該審核指令對網(wǎng)絡中發(fā)布的該內容進行檢測,返回檢測結果,在檢測結果列表中對應地保存該內容的指紋哈希值和所得檢測結果。
[0110]步驟S4090,判斷指紋哈希值的計數(shù)值是否大于預設的計數(shù)值閥值,如果大于,則執(zhí)行步驟S4080,否則,執(zhí)行步驟S4100。
[0111]步驟S4100,確定檢測結果為內容通過檢測。
[0112]如圖5所示,一種檢測網(wǎng)絡中內容的系統(tǒng)包括如下單元。
[0113]接收單元510,用于接收應用平臺發(fā)送的網(wǎng)絡中發(fā)布的內容,以及所述內容對應的指示是否進行重新檢測的指示標識。
[0114]其中,當所述內容對應的配置參量的值達到預設的參量閥值時,所述指示標識指示對所述內容進行重新檢測,所述配置參量用于表征所述內容被關注的程度,所述配置參量的值越大,則所述內容被關注的程度越高。
[0115]所述配置參量至少包括下列參量中的一種:
[0116]內容被評論的次數(shù);
[0117]內容被瀏覽的次數(shù);
[0118]內容被轉發(fā)的次數(shù);
[0119]內容在頁面中停留的時長。
[0120]判斷單元520,用于判斷接收的所述指示標識是否指示對所述內容進行重新檢測。
[0121]第一檢測單元530,用于在所述指示標識沒有指示對所述內容進行重新檢測時,根據(jù)檢測結果列表對所述內容進行檢測,返回檢測結果;所述檢測結果列表中保存內容的檢測結果。
[0122]第二檢測單元540,用于在所述指示標識指示對所述內容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內容進行檢測,返回檢測結果。
[0123]較佳地,所述系統(tǒng)還包括:哈希值計算單元550,如圖6所示。
[0124]哈希值計算單元550,用于在所述接收單元接收到應用平臺發(fā)送的網(wǎng)絡中發(fā)布的內容后,對所述內容進行哈希運算,獲得所述內容對應的哈希值。
[0125]所述檢測結果列表中對應地保存內容的哈希值和內容的檢測結果。
[0126]第一檢測單元530,具體用于判斷所述檢測結果列表中是否包括所述哈希值,如果不包括,則根據(jù)已接收的與所述內容相同和/或相似內容的數(shù)量對所述內容進行檢測;如果包括,則獲取所述哈希值在所述檢測結果列表中對應的檢測結果。
[0127]較佳地,哈希值計算單元550,具體用于除去所述內容中冗余信息,對除去冗余信息的所述內容進行哈希運算,獲得所述內容對應的指紋哈希值。
[0128]較佳地,哈希值計算單元550,還用于在獲得所述內容對應的指紋哈希值后,將所述指紋哈希值對應的計數(shù)值加I。
[0129]第一檢測單元530,具體用于判斷所述指紋哈希值對應的計數(shù)值是否大于預設的計數(shù)值閥值,如果大于,則接收審核指令,根據(jù)所述審核指令對所述內容進行檢測;否則,確定檢測結果為所述內容通過檢測。
[0130]較佳地,第一檢測單元530,還用于在所述檢測結果列表中對應地保存所述哈希值和根據(jù)所述審核指令對所述內容進行檢測所得的檢測結果。
[0131]較佳地,第一檢測單元530,還用于在根據(jù)已接收的與所述內容相同和/或相似內容的數(shù)量對所述內容進行檢測之前,判斷所述內容是否命中敏感詞庫中的敏感詞;如果是,則接收審核指令,根據(jù)所述審核指令對所述內容進行檢測,獲取檢測結果;所述返回檢測結果之后還包括:在所述檢測結果列表中對應地保存所述內容的哈希值和所得的根據(jù)所述審核指令對所述內容進行檢測所得的檢測結果;如果否,進行所述根據(jù)已接收的與所述內容相同和/或相似內容的數(shù)量對所述內容進行檢測的步驟。
[0132]較佳地,第二檢測單元540,還用于在所述指示標識指示對所述內容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內容進行檢測,返回檢測結果后,在所述檢測結果列表中更新所述內容的檢測結果為根據(jù)所述審核指令對所述內容進行檢測所得的檢測結果。
[0133]以上所述僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。凡在本發(fā)明的精神和原則之內所作的任何修改、等同替換、改進等,均包含在本發(fā)明的保護范圍內。
【權利要求】
1.一種檢測網(wǎng)絡中內容的方法,其特征在于,所述方法包括: 接收應用平臺發(fā)送的網(wǎng)絡中發(fā)布的內容,以及所述內容對應的指示是否進行重新檢測的指示標識;其中當所述內容對應的配置參量的值達到預設的參量閥值時,所述指示標識指示對所述內容進行重新檢測,所述配置參量用于表征所述內容被關注的程度,所述配置參量的值越大,則所述內容被關注的程度越高; 判斷接收的所述指示標識是否指示對所述內容進行重新檢測; 在所述指示標識沒有指示對所述內容進行重新檢測時,根據(jù)檢測結果列表對所述內容進行檢測,返回檢測結果;所述檢測結果列表中保存內容的檢測結果; 在所述指示標識指示對所述內容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內容進行檢測,返回檢測結果。
2.根據(jù)權利要求1所述的方法,其特征在于, 所述配置參量至少包括下列參量中的一種: 內容被評論的次數(shù); 內容被瀏覽的次數(shù); 內容被轉發(fā)的次數(shù); 內容在頁面中停留的時長。
3.根據(jù)權利要求1所述的方法,其特征在于, 所述接收應用平臺發(fā)送的網(wǎng)絡中發(fā)布的內容后,所述方法還包括: 對所述內容進行哈希運算,獲得所述內容對應的哈希值; 所述檢測結果列表中對應地保存內容的哈希值和內容的檢測結果; 所述根據(jù)檢測結果列表對所述內容進行檢測具體包括: 判斷所述檢測結果列表中是否包括所述哈希值,如果不包括,則根據(jù)已接收的與所述內容相同和/或相似內容的數(shù)量對所述內容進行檢測;如果包括,則獲取所述哈希值在所述檢測結果列表中對應的檢測結果。
4.根據(jù)權利要求3所述的方法,其特征在于, 所述對所述內容進行哈希運算,獲得所述內容對應的哈希值具體包括: 除去所述內容中冗余信息,對除去冗余信息的所述內容進行哈希運算,獲得所述內容對應的指紋哈希值。
5.根據(jù)權利要求4所述的方法,其特征在于, 所述獲得所述內容對應的指紋哈希值后還包括: 將所述指紋哈希值對應的計數(shù)值加I ; 所述根據(jù)已接收的與所述內容相同和/或相似內容的數(shù)量對所述內容進行檢測具體包括: 判斷所述指紋哈希值對應的計數(shù)值是否大于預設的計數(shù)值閥值, 如果大于,則接收審核指令,根據(jù)所述審核指令對所述內容進行檢測; 否則,確定檢測結果為所述內容通過檢測。
6.根據(jù)權利要求5所述的方法,其特征在于, 所述如果大于,則接收審核指令,根據(jù)所述審核指令對所述內容進行檢測后還包括: 在所述檢測結果列表中對應地保存所述哈希值和根據(jù)所述審核指令對所述內容進行檢測所得的檢測結果。
7.根據(jù)權利要求3所述的方法,其特征在于, 所述根據(jù)已接收的與所述內容相同和/或相似內容的數(shù)量對所述內容進行檢測之前還包括: 判斷所述內容是否命中敏感詞庫中的敏感詞; 如果是,則接收審核指令,根據(jù)所述審核指令對所述內容進行檢測,獲取檢測結果;所述返回檢測結果之后還包括:在所述檢測結果列表中對應地保存所述內容的哈希值和根據(jù)所述審核指令對所述內容進行檢測所得的檢測結果; 如果否,進行所述根據(jù)已接收的與所述內容相同和/或相似內容的數(shù)量對所述內容進行檢測的步驟。
8.根據(jù)權利要求1所述的方法,其特征在于, 所述在所述指示標識指示對所述內容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內容進行檢測,返回檢測結果后還包括: 在所述檢測結果列表中更新所述內容的檢測結果為根據(jù)所述審核指令對所述內容進行檢測所得的檢測結果。
9.一種檢測網(wǎng)絡中內容的系統(tǒng),其特征在于,包括: 接收單元,用于接收應用平臺發(fā)送的網(wǎng)絡中發(fā)布的內容,以及所述內容對應的指示是否進行重新檢測的指示標識;其中當所述內容對應的配置參量的值達到預設的參量閥值時,所述指示標識指示對所述內容進行重新檢測,所述配置參量用于表征所述內容被關注的程度,所述配置參量的值越大,則所述內容被關注的程度越高; 判斷單元,用于判斷接收的所述指示標識是否指示對所述內容進行重新檢測; 第一檢測單元,用于在所述指示標識沒有指示對所述內容進行重新檢測時,根據(jù)檢測結果列表對所述內容進行檢測,返回檢測結果;所述檢測結果列表中保存內容的檢測結果; 第二檢測單元,用于在所述指示標識指示對所述內容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內容進行檢測,返回檢測結果。
10.根據(jù)權利要求9所述的系統(tǒng),其特征在于, 所述系統(tǒng)還包括:哈希值計算單元; 所述哈希值計算單元,用于在所述接收單元接收到應用平臺發(fā)送的網(wǎng)絡中發(fā)布的內容后,對所述內容進行哈希運算,獲得所述內容對應的哈希值; 所述檢測結果列表中對應地保存內容的哈希值和內容的檢測結果; 所述第一檢測單元,具體用于判斷所述檢測結果列表中是否包括所述哈希值,如果不包括,則根據(jù)已接收的與所述內容相同和/或相似內容的數(shù)量對所述內容進行檢測;如果包括,則獲取所述哈希值在所述檢測結果列表中對應的檢測結果。
【文檔編號】H04L29/06GK104253809SQ201310271013
【公開日】2014年12月31日 申請日期:2013年6月29日 優(yōu)先權日:2013年6月29日
【發(fā)明者】田旭東 申請人:北京新媒傳信科技有限公司