專利名稱:統(tǒng)一資源定位符url的過濾方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)通信領(lǐng)域,更具體的說,是涉及統(tǒng)ー資源定位符URL的過濾方法及裝置。
背景技術(shù):
URL (Uniform Resource Locator統(tǒng)一資源定位符)過濾技術(shù)現(xiàn)已廣泛的應(yīng)用到通信領(lǐng)域中,成為應(yīng)用內(nèi)容安全領(lǐng)域中ー種成熟的技木。該技術(shù)能夠基于網(wǎng)頁所屬類別的不同,根據(jù)用戶的需要過濾掉設(shè)定類別的網(wǎng)頁,例如過濾掉新聞類的網(wǎng)頁。具備URL過濾功能的安全設(shè)備在檢測到有連接請求時,根據(jù)此連接請求要求連接的URL,通過遠(yuǎn)程查詢分類服務(wù)器來獲取此URL所屬的類別,然后緩存在本地存儲器中?,F(xiàn)有技術(shù)中,如果已獲取ー個URL所屬的類別,當(dāng)用戶在緩存的老化時間內(nèi)再次訪問所述URL時,就可以根據(jù)緩存的所述URL所屬的類別直接執(zhí)行過濾工作;而在緩存超過老化時間后,則需要再次進(jìn)行遠(yuǎn)程查詢以獲得所述URL所屬的類別。然而在實際情況中,很多網(wǎng)頁包含的內(nèi)容是動態(tài)的,也就是說,請求訪問的網(wǎng)頁在不同的時間段內(nèi),其具體內(nèi)容、所屬的類別可能都是不同的,而此時如果分類服務(wù)器沒有及時發(fā)現(xiàn)網(wǎng)頁內(nèi)容的變化,或分類服務(wù)器已經(jīng)更新,但安全設(shè)備中緩存的URL所屬的類別還處于老化時間內(nèi),就使得URL所屬的類別不能夠得到及時的更新,這種情況下,ー些原本應(yīng)該被過濾掉的ー些URL連接請求很可能就會被放行,使得URL分類識別不準(zhǔn)確,進(jìn)而無法準(zhǔn)確實現(xiàn)過濾功能。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例提供了ー種統(tǒng)ー資源定位符URL的過濾方法及裝置,以克服現(xiàn)有技術(shù)中由于分類服務(wù)器可能不能及時更新而導(dǎo)致的無法準(zhǔn)確過濾URL的問題。為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案ー種統(tǒng)ー資源定位符URL的過濾方法,包括接收客戶端發(fā)起的URL連接請求;從預(yù)存的類別信息表中的每個URL對應(yīng)的網(wǎng)頁類別中,查找到所述URL連接請求中攜帯的URL對應(yīng)的第一類別;判斷所述第一類別是否符合預(yù)設(shè)的URL通行策略,所述URL通行策略中包含允許通過的網(wǎng)頁類別;
若符合,則將所述URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容;
根據(jù)所述網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別,判斷所述第二類別是否符合所述預(yù)設(shè)的URL通行策略;若第二類別符合所述預(yù)設(shè)的URL通行策略,將所述網(wǎng)頁內(nèi)容發(fā)往所述客戶端;否則,阻斷所述網(wǎng)頁內(nèi)容。ー種統(tǒng)ー資源定位符URL的過濾裝置,包括請求接收模塊,用于接收客戶端發(fā)起的URL連接請求;第一類別獲取模塊,用于從預(yù)存的類別信息表中的每個URL對應(yīng)的網(wǎng)頁類別中,查找到所述URL連接請求中攜帯的URL對應(yīng)的第一類別;通行判斷模塊,用于判斷所述第一類別是否符合預(yù)設(shè)的URL通行策略,所述URL通行策略中包含允許通過的網(wǎng)頁類別;請求發(fā)送模塊,用于在所述通行判斷模塊的判斷結(jié)果為是時,將所述URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容;類別判斷模塊,用于根據(jù)所述網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別,判斷所述第二類別是否符合所述預(yù)設(shè)的URL通行策略;內(nèi)容返回模塊,用于在所述類別判斷模塊的判斷結(jié)果為是時,將所述網(wǎng)頁內(nèi)容發(fā)
往客戶端;阻斷模塊,用于在所述類別判斷模塊的判斷結(jié)果為否時,阻斷所述網(wǎng)頁內(nèi)容。本發(fā)明實施例公開了ー種URL的過濾方法和裝置,該方法能夠從預(yù)存的類別信息表中查找到URL連接請求中攜帯的URL對應(yīng)的第一類別,在所述URL連接請求符合預(yù)設(shè)的URL通行策略的情況下將所述URL連接請求轉(zhuǎn)發(fā)至相應(yīng)的服務(wù)器,并根據(jù)所述服務(wù)器返回的網(wǎng)頁內(nèi)容確定所述URL對應(yīng)的第二類別,再判斷第二類別是否符合預(yù)設(shè)的URL通行策略,如果第二類別符合所述預(yù)設(shè)的URL通行策略,將所述網(wǎng)頁內(nèi)容發(fā)往所述客戶端;否則,阻斷所述網(wǎng)頁內(nèi)容。上述URL過濾方法和裝置,能夠?qū)崟r確定URL所屬的類別,保證在網(wǎng)頁內(nèi)容發(fā)生變化或類別更新不及時的情況下,依然能夠?qū)Ψ判械?,但實際上應(yīng)該阻斷的URL連接請求及時阻斷,實現(xiàn)準(zhǔn)確分類過濾的功能。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。圖I為本發(fā)明實施例公開的URL第一過濾方法流程圖;圖2為本發(fā)明實施例公開的確定網(wǎng)頁內(nèi)容第二類別的流程圖;圖3a為本發(fā)明實施例公開的URL第二過濾方法流程圖;圖3b為本發(fā)明實施例公開的URL第三過濾方法流程圖;圖4為本發(fā)明實施例公開的URL過濾裝置的結(jié)構(gòu)示意圖;圖5為本發(fā)明實施例公開的第一類別獲取模塊的結(jié)構(gòu)示意圖;圖6為本發(fā)明實施例公開的類別判斷模塊的結(jié)構(gòu)示意圖;圖7為本發(fā)明實施例公開的第二種URL過濾裝置的結(jié)構(gòu)示意圖;圖8為本發(fā)明實施例公開的第三種URL過濾裝置的結(jié)構(gòu)示意圖9為本發(fā)明實施例公開的網(wǎng)關(guān)結(jié)構(gòu)示意圖。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。實施例一圖1為本發(fā)明實施例公開的URL第一過濾方法流程圖,參見圖I所示,所述URL過濾方法可以包括步驟101 :接收客戶端發(fā)起的URL連接請求;步驟102 :從預(yù)存的類別信息表中的每個URL對應(yīng)的網(wǎng)頁類別中,查找到所述URL連接請求中攜帯的URL對應(yīng)的第一類別;可選地,所述預(yù)存的類別信息表可以是本地緩存的或遠(yuǎn)程分類服務(wù)器上預(yù)存的,當(dāng)然,用戶也可以將已經(jīng)存在的所有URL對應(yīng)的類別信息存儲在本地,周期性的對其進(jìn)行更新,在一定程度下滿足URL連接請求過濾工作的需要;預(yù)存的類別信息表的形式可以有多種,例如,可以采用記錄表的形式,也可以采用文件的形式,當(dāng)然,存儲形式也并不僅僅局限于上述兩種,只要是能夠指示URL與網(wǎng)頁類別對應(yīng)關(guān)系的形式,就都可以被采用;當(dāng)然,如果本地緩存的類別信息表中沒有所述URL連接請求中攜帯的URL對應(yīng)的類別信息,或之前緩存的類別信息已過了老化時間,那么就需要從遠(yuǎn)程分類服務(wù)器獲取預(yù)存的類別信息表緩存至本地,然后根據(jù)所述類別信息表中URL與網(wǎng)頁類別的對應(yīng)關(guān)系,查找出所述URL連接請求中攜帯的URL對應(yīng)的第一類別;步驟103 :判斷所述第一類別是否符合預(yù)設(shè)的URL通行策略,所述URL通行策略中包含允許通過的網(wǎng)頁類別,如果是,進(jìn)入步驟104 ;所述URL通行策略規(guī)定了不被過濾的URL符合URL通行策略,被過濾出的URL不符合URL通行策略;在所述第一類別符合預(yù)設(shè)的URL通行策略時,進(jìn)入步驟104執(zhí)行相應(yīng)的步驟,在所述第一類別不符合預(yù)設(shè)的URL通行策略吋,阻斷所述URL連接請求;步驟104 :將所述URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容;在所述URL連接請求所要求連接的URL所屬的分類符合用戶設(shè)定的通行策略吋,相關(guān)裝置就會將這個URL連接請求發(fā)送至對應(yīng)的URL,URL在接收到這個連接請求吋,就將所述連接請求要求訪問的網(wǎng)頁內(nèi)容返回給相關(guān)裝置;步驟105 :根據(jù)所述網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別;可選地,確定URL第二類別的具體方法流程可參見圖2,圖2為本發(fā)明實施例公開的確定網(wǎng)頁內(nèi)容第二類別的流程圖,如圖所示,確定網(wǎng)頁內(nèi)容第二類別的步驟具體可以包括步驟201 :對所述網(wǎng)頁內(nèi)容進(jìn)行解碼,提取出所述網(wǎng)頁內(nèi)容的識別關(guān)鍵詞;這里提取出的識別關(guān)鍵詞例如明星、微博、短信等,當(dāng)然也可以是ー些敏感字符段,如非典型肺炎、美國總統(tǒng)等等; 步驟202 :根據(jù)本地詞庫列表中存儲的識別關(guān)鍵詞與網(wǎng)頁類別的對應(yīng)關(guān)系,確定所述URL對應(yīng)的第二類別為提取到的識別關(guān)鍵詞對應(yīng)的網(wǎng)頁類別;本地詞庫列表里對相關(guān)的ー些關(guān)鍵詞或敏感字符可以有如下分類休閑娛樂類別對應(yīng)的識別關(guān)鍵詞包括背景、QQ空間、祝福短信、搞笑短信等;新聞類別對應(yīng)的識別關(guān)鍵詞包括軍事、財經(jīng)、報道、報紙等;體育類別對應(yīng)的識別關(guān)鍵詞包括街球、籃球、足球、航海、健美操等。如果步驟301提取出的數(shù)據(jù)內(nèi)容中包括“足球”這ー關(guān)鍵字,那么所述數(shù)據(jù)內(nèi)容對應(yīng)的URL的網(wǎng)頁類別可能就被識別為體育類,而所述URL過濾方法的執(zhí)行主體又規(guī)定體育類的URL是不允許訪問的,那么包括所述數(shù)據(jù)內(nèi)容的網(wǎng)頁內(nèi)容就會被阻斷;當(dāng)然,根據(jù)網(wǎng)頁內(nèi)容來確定URL第二類別的方法不局限于上述流程,例如,從網(wǎng)頁內(nèi)容中提取語義關(guān)系,與預(yù)先存儲的語義庫中的語義關(guān)系模板進(jìn)行匹配,將匹配中的語義關(guān)系模板對應(yīng)的網(wǎng)頁類別作為第二類別,也可以實現(xiàn)根據(jù)網(wǎng)頁內(nèi)容確定第二類別的目的。在這里不再一一列舉根據(jù)網(wǎng)頁內(nèi)容確定第二類別的具體方式,只要是能夠根據(jù)網(wǎng)頁內(nèi)容確定URL第二類別的方法,都應(yīng)屬于本發(fā)明的保護(hù)范圍;步驟106 :判斷所述第二類別是否符合所述預(yù)設(shè)的URL通行策略,如果是,進(jìn)入步驟107,如果否,進(jìn)入步驟108 ;步驟107 :將所述網(wǎng)頁內(nèi)容發(fā)往所述客戶端;在步驟106判斷出的第二類別屬于用戶設(shè)定的通行策略中被允許通過的網(wǎng)頁類別時,返回的網(wǎng)頁內(nèi)容即被返回客戶端,為客戶端正常提供服務(wù);步驟108 :阻斷所述網(wǎng)頁內(nèi)容;在步驟106判斷出的第二類別不屬于用戶設(shè)定的通行策略中被允許通過的網(wǎng)頁類別時,就會直接被禁止通行,無法連接到對應(yīng)的URL上,相關(guān)返回的網(wǎng)頁內(nèi)容就會被阻斷。本實施例中,所述方法能夠從預(yù)存的類別信息表中查找到URL連接請求中攜帯的URL對應(yīng)的第一類別,并將第一類別符合預(yù)設(shè)的URL通行策略的URL連接請求放行,轉(zhuǎn)發(fā)至相應(yīng)的服務(wù)器,并根據(jù)所述服務(wù)器返回的網(wǎng)頁內(nèi)容確定所述URL對應(yīng)的第二類別,再判斷第二類別是否符合預(yù)設(shè)的URL通行策略,若第二類別符合所述預(yù)設(shè)的URL通行策略,將所述網(wǎng)頁內(nèi)容發(fā)往客戶端;否則,阻斷所述網(wǎng)頁內(nèi)容。通過本發(fā)明公開的URL過濾方法,能夠?qū)崟r確定URL所屬分類,保證在網(wǎng)頁內(nèi)容經(jīng)常變化、或分類更新不及時的情況下,依然能夠?qū)Ψ判械?,但實際上應(yīng)該阻斷的URL連接請求及時阻斷,實現(xiàn)準(zhǔn)確分類過濾的功能,提高了URL過濾的準(zhǔn)確性。實施例ニ圖3a為本發(fā)明實施例公開的URL第二過濾方法流程圖,參見圖3a所示,所述URL過濾方法可以包括步驟301 :接收客戶端發(fā)起的URL連接請求;步驟302 :從預(yù)存的類別信息表中的每個URL對應(yīng)的網(wǎng)頁類別中,查找到所述URL連接請求中攜帯的URL對應(yīng)的第一類別;步驟303 :判斷所述第一類別是否符合預(yù)設(shè)的URL通行策略,如果是,進(jìn)入步驟306,如果否,進(jìn)入步驟304 ;
步驟304 :阻斷所述URL連接請求,進(jìn)入步驟305 ;
步驟305 :從已阻斷的URL連接請求中,過濾得到其中帶有預(yù)設(shè)標(biāo)識的URL連接請求,進(jìn)入步驟306 ;因為在實際情況中,一些網(wǎng)頁的內(nèi)容是動態(tài)變化的,為了避免同一個URL在某個時間前所屬的類別不符合URL通行策略,而某個時間后實際所屬的類別符合URL通行策略,且所述URL的分類又沒有得到及時的更新,這樣使得原本應(yīng)被允許通過的URL連接請求被阻斷的情況發(fā)生,用戶可以采用本步驟所述的方法,所述預(yù)設(shè)標(biāo)識可以為特定的關(guān)鍵詞,也可以為某ー個固定的連接地址、或者用戶名等等;步驟306 :將所述URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容;步驟307 :根據(jù)所述網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別;步驟308 :判斷所述第二類別是否符合預(yù)設(shè)的URL通行策略,如果是,進(jìn)入步驟309,如果否,進(jìn)入步驟310 ;步驟309 :將所述網(wǎng)頁內(nèi)容發(fā)往客戶端,進(jìn)入步驟311 ;步驟310 :阻斷所述網(wǎng)頁內(nèi)容;步驟311 :將所述預(yù)存的類別信息表中所述URL連接請求中攜帯的URL對應(yīng)的網(wǎng)頁類別,更新為所述第二類別??蛇x地,附圖3a所示的流程也可以進(jìn)行如下調(diào)整將步驟305與步驟304的順序互換,即在阻斷ー個URL連接請求之前,先判斷所述URL連接請求中是否攜帯有預(yù)設(shè)標(biāo)識,若吋,再將該URL連接請求阻斷,否則允許該URL連接請求通過,即將批處理的方式調(diào)整為實時處理,具體請參照附圖3b所示步驟321,接收客戶端發(fā)起的URL連接請求;步驟322 :從預(yù)存的類別信息表中的每個URL對應(yīng)的網(wǎng)頁類別中,查找到所述URL連接請求中攜帯的URL對應(yīng)的第一類別;步驟323 :判斷所述第一類別是否符合預(yù)設(shè)的URL通行策略,如果是,進(jìn)入步驟326,如果否,進(jìn)入步驟324 ;步驟324,判斷所述URL連接請求中是否攜帯有預(yù)設(shè)標(biāo)識,若是進(jìn)入步驟326,否貝IJ,進(jìn)入步驟325 ;步驟325,阻斷所述URL連接請求;步驟326 :將所述URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容;步驟327 :根據(jù)所述網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別;步驟328 :判斷所述第二類別是否符合預(yù)設(shè)的URL通行策略,如果是,進(jìn)入步驟329,如果否,進(jìn)入步驟330 ;步驟329 :將所述網(wǎng)頁內(nèi)容發(fā)往客戶端,進(jìn)入步驟331 ;步驟330 :阻斷所述網(wǎng)頁內(nèi)容;步驟331 :將所述預(yù)存的類別信息表中所述URL連接請求中攜帯的URL對應(yīng)的網(wǎng)頁類別,更新為所述第二類別。在通過本實施例公開的方法判斷出返回的網(wǎng)頁內(nèi)容的第二類別符合預(yù)設(shè)的URL通行策略吋,即可知本地緩存的或遠(yuǎn)程獲取的分類服務(wù)器上的相關(guān)URL第一類別是不準(zhǔn)確的,可以將本地緩存的URL對應(yīng)的第一類別更新為根據(jù)網(wǎng)頁內(nèi)容判斷出的第二類別,或給遠(yuǎn)程分類服務(wù)器發(fā)送URL分類變更請求,以使分類服務(wù)器能夠根據(jù)所述URL分類變更請求做出相關(guān)后續(xù)動作本實施例中,所述URL過濾方法能夠根據(jù)預(yù)存的URL第一類別判斷客戶端發(fā)起的URL連接請求是否符合預(yù)設(shè)的URL通行策略,在所述URL連接請求滿足所述預(yù)設(shè)的URL過濾策略的情況下將所述URL連接請求轉(zhuǎn)發(fā)至相應(yīng)的服務(wù)器,并根據(jù)所述服務(wù)器返回的網(wǎng)頁內(nèi)容確定第二類別,并判斷第二類別是否符合預(yù)設(shè)的URL通行策略,如果不符合,就會阻斷所述返回的網(wǎng)頁內(nèi)容,且能夠避免一些應(yīng)當(dāng)被放行,但由于分類更新不及時而被阻斷的URL連接請求的情況。通過本發(fā)明公開的URL過濾方法,能夠?qū)崟r確定URL所屬的分類,保證在分類更新不及時的情況下,依然能夠?qū)Ψ判械?,但實際上應(yīng)該阻斷的URL連接請求及時阻斷,也能夠?qū)Ι`些沒有放行的,但是實際上應(yīng)該被放行的URL連接請求及時放行,實現(xiàn)準(zhǔn)確分類過濾的功能。實施例三圖4為本發(fā)明實施例公開的URL過濾裝置的結(jié)構(gòu)示意圖,參見圖4所示。所述URL過濾裝置40可以包括請求接收模塊401,用于接收客戶端發(fā)起的URL連接請求;第一類別獲取模塊402,用于從預(yù)存的類別信息表中的每個URL對應(yīng)的網(wǎng)頁類別中,查找到所述URL連接請求中攜帯的URL對應(yīng)的第一類別;所述第一類別獲取模塊402的具體結(jié)構(gòu)可以參見圖5,如圖所示,所述連接判斷模塊402具體可以包括信息表獲取子模塊4021,用于從遠(yuǎn)程分類服務(wù)器獲取預(yù)存的類別信息表緩存至本地;如果在本地緩存有URL連接請求對應(yīng)的URL的類別信息表,那么就可以直接從本地緩存中獲取類別信息表;第一類別確定子模塊4022,用于根據(jù)所述類別信息表中URL與網(wǎng)頁類別的對應(yīng)關(guān)系,查找出所述URL連接請求中攜帯的URL對應(yīng)的第一類別;通行判斷模塊403,用于判斷所述第一類別是否符合預(yù)設(shè)的URL通行策略,所述URL通行策略中包含允許通過的網(wǎng)頁類別;請求發(fā)送模塊404,用于在所述通行判斷模塊403的判斷結(jié)果為是時,將所述URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容;類別判斷模塊405,用于根據(jù)所述網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別,判斷所述第二類別是否符合所述預(yù)設(shè)的URL通行策略;所述類別判斷模塊405具體結(jié)構(gòu)可以參見圖6,如圖所示,可以包括網(wǎng)頁解碼子模塊4051,用于對所述網(wǎng)頁內(nèi)容進(jìn)行解碼,提取出所述網(wǎng)頁內(nèi)容的識別關(guān)鍵詞;第二類別確定子模塊4052,用于根據(jù)本地詞庫列表中存儲的識別關(guān)鍵詞與網(wǎng)頁類別的對應(yīng)關(guān)系,確定所述URL對應(yīng)的第二類別為提取到的識別關(guān)鍵詞對應(yīng)的網(wǎng)頁類別;類別判斷子模塊4053,用于判斷所述第二類別確定子模塊4052識別出的第二類別是否符合URL通行策略;內(nèi)容返回模塊406,用于在所述類別判斷模塊的判斷結(jié)果為是時,將所述網(wǎng)頁內(nèi)容
發(fā)往客戶端;阻斷模塊407,用于在所述類別判斷模塊的判斷結(jié)果為否時,阻斷所述網(wǎng)頁內(nèi)容。需要說明的是,本發(fā)明實施例的URL過濾裝置,并不僅限于上述一種結(jié)構(gòu),比如,第一類別獲取模塊402和通行判斷模塊403可以為集成于一體的ー個獨立模塊,完成URL連接請求的第一類別獲取及判斷所述第一類別是否符合預(yù)設(shè)的通行策略;再如,所述內(nèi)容返回模塊406和阻斷模塊407可以為一個模塊。在其他的實施例中,URL過濾裝置還可以包括分類更新模塊,用于在類別判斷模塊405判斷出識別分類不符合所述預(yù)設(shè)的URL通行策略的情況下,將所述本地緩存的類別信息表中所述URL連接請求中攜帯的URL對應(yīng)的網(wǎng)頁類別,更新為所述第二類別。 進(jìn)ー步地,參見圖7,在其他的實施例中,所述阻斷模塊407還用于在所述通行判斷模塊403判斷出所述第一類別不符合預(yù)設(shè)的URL通行策略的情況下,阻斷所述URL連接請求;URL過濾裝置還可以包括標(biāo)識過濾模701,用于從阻斷的URL連接請求中,過濾得到帶有預(yù)設(shè)標(biāo)識的URL連接請求;并觸發(fā)所述請求發(fā)送模塊404將所述URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容;所述類別判斷模塊405根據(jù)所述網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別,判斷所述第二類別是否符合所述預(yù)設(shè)的URL通行策略;若識別分類符合所述預(yù)設(shè)的URL通行策略,所述內(nèi)容返回模塊406將所述網(wǎng)頁內(nèi)容發(fā)往所述客戶端;否則,所述阻斷模塊407阻斷所述網(wǎng)頁內(nèi)容。進(jìn)ー步地,參見圖8,在其他實施例中,URL過濾裝置還可以包括標(biāo)識判決模塊702,用于在通行判斷模塊403的判斷結(jié)果為否吋,判斷所述URL連接請求中是否帶有預(yù)設(shè)標(biāo)識;若帶有預(yù)設(shè)標(biāo)識,則觸發(fā)所述請求發(fā)送模塊404將所述URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容;所述類別判斷模塊405根據(jù)所述網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別,判斷所述第二類別是否符合所述預(yù)設(shè)的URL通行策略;若識別分類符合所述預(yù)設(shè)的URL通行策略,所述內(nèi)容返回模塊406將所述網(wǎng)頁內(nèi)容發(fā)往所述客戶端;否則,觸發(fā)阻斷模塊407阻斷所述網(wǎng)頁內(nèi)容;若未帶有預(yù)設(shè)標(biāo)識,則觸發(fā)阻斷模塊407阻斷所述URL連接請求。本實施例中,所述裝置能夠從預(yù)存的類別信息表中查找到URL連接請求對應(yīng)的第一類別,并將第一類別符合預(yù)設(shè)的URL通行策略的URL連接請求放行,轉(zhuǎn)發(fā)至相應(yīng)的服務(wù)器,并根據(jù)所述服務(wù)器返回的網(wǎng)頁內(nèi)容確定所述URL對應(yīng)的第二類別,再判斷第二類別是否符合預(yù)設(shè)的URL通行策略,若第二類別符合所述預(yù)設(shè)的URL通行策略,將所述網(wǎng)頁內(nèi)容發(fā)往客戶端;否則,阻斷所述網(wǎng)頁內(nèi)容。通過本發(fā)明公開的URL過濾裝置,能夠?qū)崟r確定URL所屬分類,保證在分類更新不及時的情況下,依然能夠?qū)Ψ判械?,但實際上應(yīng)該阻斷的URL連接請求及時阻斷,實現(xiàn)準(zhǔn)確分類過濾的功能。此外,本發(fā)明實施例還公開一種網(wǎng)關(guān),如圖9所示,該網(wǎng)關(guān)90包含本發(fā)明實施例公開的URL過濾裝置40,首先能夠接收客戶端發(fā)起的URL連接請求;然后根據(jù)獲取的URL第ー類別判斷所述URL連接請求是否符合預(yù)設(shè)的URL通行策略;如果是將所述URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容;再確定所述網(wǎng)頁內(nèi)容的第二類別,判斷所述第二類別是否符合預(yù)設(shè)的URL通行策略;如果是將所述返回的網(wǎng)頁內(nèi)容發(fā)往客戶端;如果否阻斷所述返回的網(wǎng)頁內(nèi)容,所述網(wǎng)關(guān)能夠?qū)崟r確定URL所屬的分類,保證在分類更新不及時的情況下,依然能夠?qū)Ψ判械模珜嶋H上應(yīng)該阻斷的URL連接請求及時阻斷,實現(xiàn)準(zhǔn)確分類過濾的功能。本說明書中各個實施例采用遞進(jìn)的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似部分互相參見即可。對于實施例公開的裝置而言,由于其與實施例公開的方法相對應(yīng),所以描述的比較簡單,相關(guān)之處參見方法部分說明即可。
還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將ー個實體或者操作與另ー個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)
備所固有的要素。在沒有更多限制的情況下,由語句“包括ー個......”限定的要素,并不
排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。結(jié)合本文中所公開的實施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來實施。軟件模塊可以置于隨機存儲器(RAM)、內(nèi)存、只讀存儲器(ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬盤、可移動磁盤、CD-ROM、或技術(shù)領(lǐng)域內(nèi)所公知的任意其它形式的存儲介質(zhì)中。對所公開的實施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對這些實施例的多種修改對本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的范圍。
權(quán)利要求
1.一種統(tǒng)一資源定位符URL的過濾方法,其特征在于,包括 接收客戶端發(fā)起的URL連接請求; 從預(yù)存的類別信息表中的每個URL對應(yīng)的網(wǎng)頁類別中,查找到所述URL連接請求中攜帶的URL對應(yīng)的第一類別; 判斷所述第一類別是否符合預(yù)設(shè)的URL通行策略,所述URL通行策略中包含允許通過的網(wǎng)頁類別; 若符合,則將所述URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容; 根據(jù)所述網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別,判斷所述第二類別是否符合所述預(yù)設(shè)的URL通行策略;若第二類別符合所述預(yù)設(shè)的URL通行策略,將所述網(wǎng)頁內(nèi)容發(fā)往所述客戶端;否則,阻斷所述網(wǎng)頁內(nèi)容。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述根據(jù)所述網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別,包括 對所述網(wǎng)頁內(nèi)容進(jìn)行解碼,提取出所述網(wǎng)頁內(nèi)容的識別關(guān)鍵詞; 根據(jù)本地詞庫列表中存儲的識別關(guān)鍵詞與網(wǎng)頁類別的對應(yīng)關(guān)系,確定所述URL對應(yīng)的第二類別為提取到的識別關(guān)鍵詞對應(yīng)的網(wǎng)頁類別。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述從預(yù)存的類別信息表中的每個URL對應(yīng)的網(wǎng)頁類別中,查找到所述URL連接請求中攜帶的URL對應(yīng)的第一類別,包括 從遠(yuǎn)程分類服務(wù)器獲取預(yù)存的類別信息表緩存至本地; 根據(jù)所述類別信息表中URL與網(wǎng)頁類別的對應(yīng)關(guān)系,查找出所述URL連接請求中攜帶的URL對應(yīng)的第一類別。
4.根據(jù)權(quán)利要求I所述的方法,其特征在于,若識別分類不符合所述預(yù)設(shè)的URL通行策略,還包括 將所述預(yù)存的類別信息表中所述URL連接請求中攜帶的URL對應(yīng)的網(wǎng)頁類別,更新為所述第二類別。
5.根據(jù)權(quán)利要求1-4任一項所述的方法,其特征在于,若所述第一類別不符合預(yù)設(shè)的URL通行策略,還包括 阻斷所述URL連接請求; 從阻斷的URL連接請求中,過濾得到帶有預(yù)設(shè)標(biāo)識的URL連接請求, 將過濾得到的URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容; 根據(jù)返回的網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別,判斷所述第二類別是否符合所述預(yù)設(shè)的URL通行策略;若識別分類符合所述預(yù)設(shè)的URL通行策略,將所述網(wǎng)頁內(nèi)容發(fā)往所述客戶端;否則,阻斷所述網(wǎng)頁內(nèi)容。
6.根據(jù)權(quán)利要求1-4任一項所述的方法,其特征在于,若所述第一類別不符合預(yù)設(shè)的URL通行策略,還包括 判斷所述URL連接請求中是否帶有預(yù)設(shè)標(biāo)識; 若帶有預(yù)設(shè)標(biāo)識,則將所述URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容;根據(jù)所述網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別,判斷所述第二類別是否符合所述預(yù)設(shè)的URL通行策略;若識別分類符合所述預(yù)設(shè)的URL通行策略,將所述網(wǎng)頁內(nèi)容發(fā)往所述客戶端;否則,阻斷所述網(wǎng)頁內(nèi)容;若未帶有預(yù)設(shè)標(biāo)識,則阻斷所述URL連接請求。
7.一種統(tǒng)一資源定位符URL的過濾裝置,其特征在于,包括請求接收模塊,用于接收客戶端發(fā)起的URL連接請求;第一類別獲取模塊,用于從預(yù)存的類別信息表中的每個URL對應(yīng)的網(wǎng)頁類別中,查找到所述URL連接請求中攜帶的URL對應(yīng)的第一類別;通行判斷模塊,用于判斷所述第一類別是否符合預(yù)設(shè)的URL通行策略,所述URL通行策略中包含允許通過的網(wǎng)頁類別;請求發(fā)送模塊,用于在所述通行判斷模塊的判斷結(jié)果為是時,將所述URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容;類別判斷模塊,用于根據(jù)所述網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別,判斷所述第二類別是否符合所述預(yù)設(shè)的URL通行策略;內(nèi)容返回模塊,用于在所述類別判斷模塊的判斷結(jié)果為是時,將所述網(wǎng)頁內(nèi)容發(fā)往客戶端;阻斷模塊,用于在所述類別判斷模塊的判斷結(jié)果為否時,阻斷所述網(wǎng)頁內(nèi)容。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述類別判斷模塊包括網(wǎng)頁解碼子模塊,用于對所述網(wǎng)頁內(nèi)容進(jìn)行解碼,提取出所述網(wǎng)頁內(nèi)容的識別關(guān)鍵詞;第二類別確定子模塊,用于根據(jù)本地詞庫列表中存儲的識別關(guān)鍵詞與網(wǎng)頁類別的對應(yīng)關(guān)系,確定所述URL對應(yīng)的第二類別為提取到的識別關(guān)鍵詞對應(yīng)的網(wǎng)頁類別;類別判斷子模塊,用于判斷所述第二類別確定子模塊識別出的第二類別是否符合URL 通行策略。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述第一類別獲取模塊具體包括信息表獲取子模塊,用于從遠(yuǎn)程分類服務(wù)器獲取預(yù)存的類別信息表緩存至本地; 第一類別確定子模塊,用于根據(jù)所述類別信息表中URL與網(wǎng)頁類別的對應(yīng)關(guān)系,查找出所述URL連接請求中攜帶的URL對應(yīng)的第一類別。
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括分類更新模塊,用于在類別判斷模塊判斷出識別分類不符合所述預(yù)設(shè)的URL通行策略的情況下,將所述本地緩存的類別信息表中所述URL連接請求中攜帶的URL對應(yīng)的網(wǎng)頁類另Ij,更新為所述第二類別。
11.根據(jù)權(quán)利要求7-10任一項所述的裝置,其特征在于,所述阻斷模塊還用于在所述通行判斷模塊判斷出所述第一類別不符合預(yù)設(shè)的URL通行策略的情況下,阻斷所述URL連接請求;還包括標(biāo)識過濾模塊,用于從阻斷的URL連接請求中,過濾得到帶有預(yù)設(shè)標(biāo)識的URL連接請求;對于過濾得到的每個URL連接請求,所述請求發(fā)送模塊將所述URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容;所述類別判斷模塊根據(jù)返回的網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別,判斷所述第二類別是否符合所述預(yù)設(shè)的URL通行策略; 若識別分類符合所述預(yù)設(shè)的URL通行策略,所述內(nèi)容返回模塊將所述網(wǎng)頁內(nèi)容發(fā)往所述客戶端;否則,所述阻斷模塊阻斷所述網(wǎng)頁內(nèi)容。
12.根據(jù)權(quán)利要求7-10任一項所述的裝置,其特征在于,還包括 標(biāo)識判決模塊,用于在通行判斷模塊的 判斷結(jié)果為否時,判斷所述URL連接請求中是否帶有預(yù)設(shè)標(biāo)識;若帶有預(yù)設(shè)標(biāo)識,則觸發(fā)所述 請求發(fā)送模塊將所述URL連接請求發(fā)往與其對應(yīng)的服務(wù)器,并接收所述服務(wù)器返回的網(wǎng)頁內(nèi)容;所述類別判斷模塊根據(jù)所述網(wǎng)頁內(nèi)容,確定所述URL對應(yīng)的第二類別,判斷所述第二類別是否符合所述預(yù)設(shè)的URL通行策略;若識別分類符合所述預(yù)設(shè)的URL通行策略,所述內(nèi)容返回模塊將所述網(wǎng)頁內(nèi)容發(fā)往所述客戶端;否則,觸發(fā)阻斷模塊阻斷所述網(wǎng)頁內(nèi)容; 若未帶有預(yù)設(shè)標(biāo)識,則觸發(fā)阻斷模塊阻斷所述URL連接請求。
全文摘要
本發(fā)明公開了一種統(tǒng)一資源定位符URL的過濾方法及裝置,該方法能夠從預(yù)存的類別信息表中查找到URL連接請求對應(yīng)的第一類別,并將第一類別符合預(yù)設(shè)的URL通行策略的URL連接請求放行,轉(zhuǎn)發(fā)至相應(yīng)的服務(wù)器,并根據(jù)所述服務(wù)器返回的網(wǎng)頁內(nèi)容確定所述URL對應(yīng)的第二類別,再判斷第二類別是否符合預(yù)設(shè)的URL通行策略,若第二類別符合所述預(yù)設(shè)的URL通行策略,將所述網(wǎng)頁內(nèi)容發(fā)往客戶端;否則,阻斷所述網(wǎng)頁內(nèi)容。通過本發(fā)明公開的URL過濾方法和裝置,能夠?qū)崟r確定URL所屬分類,保證在分類更新不及時的情況下,依然能夠?qū)Ψ判械?,但實際上應(yīng)該阻斷的URL連接請求及時阻斷,實現(xiàn)準(zhǔn)確分類過濾的功能。
文檔編號H04L29/06GK102624703SQ20121002257
公開日2012年8月1日 申請日期2012年2月1日 優(yōu)先權(quán)日2011年12月31日
發(fā)明者萬時光, 李世光, 蔣武, 薛智慧 申請人:成都市華為賽門鐵克科技有限公司