網(wǎng)頁(yè)鏈接有效性驗(yàn)證方法及裝置制造方法
【專利摘要】本發(fā)明公開(kāi)了一種網(wǎng)頁(yè)鏈接有效性驗(yàn)證方法及裝置。該網(wǎng)頁(yè)鏈接有效性驗(yàn)證方法包括:確定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址;判斷待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)是否可以訪問(wèn);如果待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)可以訪問(wèn),則獲取待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè);判斷待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中是否包含預(yù)設(shè)域名或預(yù)設(shè)關(guān)鍵詞;如果待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中包含預(yù)設(shè)域名或者預(yù)設(shè)關(guān)鍵詞,則確定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址為有效的網(wǎng)頁(yè)鏈接地址。通過(guò)本發(fā)明,解決了通過(guò)人工驗(yàn)證網(wǎng)站鏈接有效性導(dǎo)致的準(zhǔn)確性差、效率低的問(wèn)題,通過(guò)判斷網(wǎng)頁(yè)中是否包含預(yù)設(shè)域名或預(yù)設(shè)關(guān)鍵詞,達(dá)到了自動(dòng)高效地驗(yàn)證網(wǎng)頁(yè)鏈接地址有效性的效果。
【專利說(shuō)明】網(wǎng)頁(yè)鏈接有效性驗(yàn)證方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,具體而言,涉及一種網(wǎng)頁(yè)鏈接有效性驗(yàn)證方法及裝置。
【背景技術(shù)】
[0002] 通常情況下,網(wǎng)站為增加訪客流量,會(huì)在眾多網(wǎng)站上通過(guò)合作或收費(fèi)的方式部署 指向到自身網(wǎng)站的鏈接,稱之為該網(wǎng)站的外部鏈接(也叫反向鏈接或友情鏈接)。這些鏈接 的部署往往由相關(guān)的代理商承接,因此涉及到計(jì)算虛擬資源的業(yè)務(wù)。在計(jì)算時(shí),理想的情況 是要根據(jù)鏈接網(wǎng)頁(yè)的真實(shí)存活情況來(lái)確定最終的計(jì)算結(jié)果;而對(duì)于未存活的鏈接是不應(yīng)該 計(jì)算在內(nèi)的。視為未存活的鏈接包括被部署的網(wǎng)站不能被有效訪問(wèn)、被部署的網(wǎng)站能夠有 效訪問(wèn)但網(wǎng)頁(yè)上并不存在指定的鏈接內(nèi)容兩種情況。
[0003] 為避免代理商利用死鏈接或者刪除鏈接等虛假手段偽造虛擬資源,需要檢測(cè)代理 商所提供的鏈接是否有效,進(jìn)而準(zhǔn)確計(jì)算網(wǎng)頁(yè)鏈接虛擬資源。
[0004] 現(xiàn)有方法是通過(guò)人工訪問(wèn)鏈接所在的頁(yè)面來(lái)驗(yàn)證鏈接是否有效。一個(gè)網(wǎng)站的鏈接 部署往往是數(shù)以千計(jì)的,因此,利用該方法工作量巨大,時(shí)效性往往難以保證;通過(guò)肉眼查 看頁(yè)面中是否包含指定的鏈接關(guān)鍵詞,難以得到全面和準(zhǔn)確的結(jié)果;同時(shí),在鏈接的部署驗(yàn) 證中,預(yù)匹配的統(tǒng)一資源定位符和關(guān)鍵詞是批量的,并且二者的存在是或的關(guān)系,因此,校 驗(yàn)邏輯的復(fù)雜性也導(dǎo)致了現(xiàn)有方法獲得的驗(yàn)證結(jié)果精確性較差。
[0005] 針對(duì)相關(guān)技術(shù)中通過(guò)人工驗(yàn)證網(wǎng)頁(yè)鏈接有效性導(dǎo)致的準(zhǔn)確性差、效率低的問(wèn)題, 目前尚未提出有效的解決方案。
【發(fā)明內(nèi)容】
[0006] 針對(duì)現(xiàn)有的通過(guò)人工驗(yàn)證網(wǎng)站鏈接有效性導(dǎo)致的準(zhǔn)確性差、效率低的問(wèn)題而提出 本發(fā)明,為此,本發(fā)明的主要目的在于提供一種網(wǎng)站鏈接有效性驗(yàn)證方法及裝置,以解決上 述問(wèn)題。
[0007] 為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種網(wǎng)頁(yè)鏈接有效性驗(yàn)證方 法。該方法包括:確定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址;判斷待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)是 否可以訪問(wèn);如果待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)可以訪問(wèn),則獲取待驗(yàn)證的網(wǎng)頁(yè)鏈接 地址對(duì)應(yīng)的網(wǎng)頁(yè);解析待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè),判斷待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì) 應(yīng)的網(wǎng)頁(yè)中是否包含預(yù)設(shè)域名或預(yù)設(shè)關(guān)鍵詞,其中,通過(guò)預(yù)設(shè)關(guān)鍵詞可以鏈接到預(yù)設(shè)域名 對(duì)應(yīng)的網(wǎng)站;如果待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中包含預(yù)設(shè)域名或者預(yù)設(shè)關(guān)鍵詞,則 確定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址為有效的網(wǎng)頁(yè)鏈接地址。
[0008] 進(jìn)一步地,判斷待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)是否可以訪問(wèn)包括:向待驗(yàn)證 的網(wǎng)頁(yè)鏈接地址發(fā)出訪問(wèn)請(qǐng)求;獲取待驗(yàn)證的網(wǎng)頁(yè)鏈接地址返回的對(duì)應(yīng)訪問(wèn)請(qǐng)求的狀態(tài) 碼;根據(jù)狀態(tài)碼判斷待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)是否可以訪問(wèn)。
[0009] 進(jìn)一步地,通過(guò)解析待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè),判斷待驗(yàn)證的網(wǎng)頁(yè)鏈接 地址對(duì)應(yīng)的網(wǎng)頁(yè)中是否包含預(yù)設(shè)域名或預(yù)設(shè)關(guān)鍵詞包括:讀取預(yù)設(shè)域名;將讀取的預(yù)設(shè)域 名與待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)進(jìn)行對(duì)比,判斷讀取的預(yù)設(shè)域名是否出現(xiàn)在待驗(yàn)證 的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中;如果讀取的預(yù)設(shè)域名沒(méi)有出現(xiàn)在待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì) 應(yīng)的網(wǎng)頁(yè)中,則讀取預(yù)設(shè)關(guān)鍵詞;以及將讀取的預(yù)設(shè)關(guān)鍵詞與待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng) 的網(wǎng)頁(yè)進(jìn)行對(duì)比,以及判斷讀取的預(yù)設(shè)關(guān)鍵詞是否出現(xiàn)在待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng) 頁(yè)中,或者,讀取預(yù)設(shè)關(guān)鍵詞;將讀取的預(yù)設(shè)關(guān)鍵詞與待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)進(jìn) 行對(duì)比,判斷讀取的預(yù)設(shè)關(guān)鍵詞是否出現(xiàn)在待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中;如果讀 取的預(yù)設(shè)關(guān)鍵詞沒(méi)有出現(xiàn)在待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中,則讀取預(yù)設(shè)域名;以及 將讀取的預(yù)設(shè)域名與待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)進(jìn)行對(duì)比,判斷讀取的預(yù)設(shè)域名是 否出現(xiàn)在待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中。
[0010] 進(jìn)一步地,確定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址包含確定多個(gè)待驗(yàn)證的網(wǎng)頁(yè)鏈接地址,確 定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址為有效的網(wǎng)頁(yè)鏈接地址之后,該方法還包括:統(tǒng)計(jì)待驗(yàn)證的網(wǎng)頁(yè) 鏈接地址的數(shù)量;統(tǒng)計(jì)有效的網(wǎng)頁(yè)鏈接地址的數(shù)量;根據(jù)有效的網(wǎng)頁(yè)鏈接地址的數(shù)量和待 驗(yàn)證的網(wǎng)頁(yè)鏈接地址的數(shù)量計(jì)算網(wǎng)頁(yè)鏈接存活率。
[0011] 進(jìn)一步地,確定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址為有效的網(wǎng)頁(yè)鏈接地址之后,該方法還包 括:獲取預(yù)設(shè)網(wǎng)頁(yè)鏈接虛擬資源結(jié)算公式,其中,預(yù)設(shè)網(wǎng)頁(yè)鏈接虛擬資源結(jié)算公式用于根據(jù) 有效的網(wǎng)頁(yè)鏈接地址的數(shù)量計(jì)算網(wǎng)頁(yè)鏈接虛擬資源;按照預(yù)設(shè)網(wǎng)鏈頁(yè)接虛擬資源結(jié)算公式 計(jì)算網(wǎng)頁(yè)鏈接虛擬資源。
[0012] 進(jìn)一步地,按照預(yù)設(shè)網(wǎng)頁(yè)鏈接虛擬資源結(jié)算公式計(jì)算網(wǎng)頁(yè)鏈接虛擬資源包括按照 以下方式計(jì)算網(wǎng)頁(yè)鏈接虛擬資源:統(tǒng)計(jì)有效的網(wǎng)頁(yè)鏈接地址的數(shù)量;確定網(wǎng)頁(yè)鏈接單價(jià); 按照以下公式計(jì)算網(wǎng)頁(yè)鏈接虛擬資源:Q = S*p,其中,Q為網(wǎng)頁(yè)鏈接虛擬資源,S為有效的 網(wǎng)頁(yè)鏈接地址的數(shù)量,P為網(wǎng)頁(yè)鏈接單價(jià)。
[0013] 進(jìn)一步地,判斷待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)是否可以訪問(wèn)之后,該方法還 包括:如果待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)不可訪問(wèn),則刪除待驗(yàn)證的網(wǎng)頁(yè)鏈接地址。
[0014] 進(jìn)一步地,判斷待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中是否包含預(yù)設(shè)域名或者預(yù)設(shè) 關(guān)鍵詞之后,該方法還包括:如果待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中不包含預(yù)設(shè)域名和 預(yù)設(shè)關(guān)鍵詞,則刪除待驗(yàn)證的網(wǎng)頁(yè)鏈接地址。
[0015] 為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種網(wǎng)頁(yè)鏈接有效性驗(yàn)證裝 置,該裝置包括:第一確定單元,用于確定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址;第一判斷單元,用于判 斷待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)是否可以訪問(wèn);獲取單元,用于在待驗(yàn)證的網(wǎng)頁(yè)鏈接 地址對(duì)應(yīng)的網(wǎng)頁(yè)可以訪問(wèn)時(shí),獲取待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè);第二判斷單元,用于 解析待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè),判斷待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中是否包 含預(yù)設(shè)域名或預(yù)設(shè)關(guān)鍵詞,其中,通過(guò)預(yù)設(shè)關(guān)鍵詞可以鏈接到預(yù)設(shè)域名對(duì)應(yīng)的網(wǎng)站;第二確 定單元,用于在待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中包含預(yù)設(shè)域名或者預(yù)設(shè)關(guān)鍵詞時(shí),確 定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址為有效的網(wǎng)頁(yè)鏈接地址。
[0016] 進(jìn)一步地,第一判斷單元包括:訪問(wèn)模塊,用于向待驗(yàn)證的網(wǎng)頁(yè)鏈接地址發(fā)出訪問(wèn) 請(qǐng)求;獲取模塊,用于獲取待驗(yàn)證的網(wǎng)頁(yè)鏈接地址返回的對(duì)應(yīng)訪問(wèn)請(qǐng)求的狀態(tài)碼;判斷模 塊,用于根據(jù)狀態(tài)碼判斷待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)是否可以訪問(wèn)。
[0017] 通過(guò)本發(fā)明,采用包括以下步驟的方法:確定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址;判斷待驗(yàn) 證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)是否可以訪問(wèn);如果待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)可以 訪問(wèn),則獲取待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè);解析待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè), 判斷待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中是否包含預(yù)設(shè)域名或預(yù)設(shè)關(guān)鍵詞,其中,通過(guò)預(yù) 設(shè)關(guān)鍵詞可以鏈接到預(yù)設(shè)域名對(duì)應(yīng)的網(wǎng)站;如果待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中包含 預(yù)設(shè)域名或者預(yù)設(shè)關(guān)鍵詞,則確定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址為有效的網(wǎng)頁(yè)鏈接地址,解決了 通過(guò)人工驗(yàn)證網(wǎng)站鏈接有效性導(dǎo)致的準(zhǔn)確性差、效率低的問(wèn)題,通過(guò)判斷待驗(yàn)證的網(wǎng)頁(yè)鏈 接地址對(duì)應(yīng)網(wǎng)頁(yè)的可訪問(wèn)性,獲取并解析可訪問(wèn)的待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè),進(jìn) 而判斷獲取的網(wǎng)頁(yè)中是否包含預(yù)設(shè)域名或預(yù)設(shè)關(guān)鍵詞,達(dá)到了自動(dòng)高效地驗(yàn)證網(wǎng)頁(yè)鏈接地 址的有效性的效果。
【專利附圖】
【附圖說(shuō)明】
[0018] 構(gòu)成本申請(qǐng)的一部分的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí) 施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0019] 圖1是根據(jù)本發(fā)明的網(wǎng)頁(yè)鏈接有效性驗(yàn)證方法的第一實(shí)施例的流程圖;
[0020] 圖2是根據(jù)本發(fā)明的網(wǎng)頁(yè)鏈接有效性驗(yàn)證方法的第二實(shí)施例的流程圖;
[0021] 圖3是根據(jù)本發(fā)明的網(wǎng)頁(yè)鏈接有效性驗(yàn)證方法的第三實(shí)施例的示意圖;
[0022] 圖4是根據(jù)本發(fā)明的計(jì)算網(wǎng)頁(yè)鏈接存活率及網(wǎng)頁(yè)鏈接虛擬資源的示意圖;以及
[0023] 圖5是根據(jù)本發(fā)明的網(wǎng)頁(yè)鏈接有效性驗(yàn)證裝置的第一實(shí)施例的示意圖。
【具體實(shí)施方式】
[0024] 為了使本【技術(shù)領(lǐng)域】的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的 附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是 本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù) 人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范 圍。
[0025] 需要說(shuō)明的是,本發(fā)明的說(shuō)明書(shū)和權(quán)利要求書(shū)及上述附圖中的術(shù)語(yǔ)"第一"、"第 二"等是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。此外,術(shù)語(yǔ)"包括" 和"具有"以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單 元的過(guò)程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒(méi) 有清楚地列出的或?qū)τ谶@些過(guò)程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
[0026] 在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將 參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明。
[0027] 圖1是根據(jù)本發(fā)明的網(wǎng)頁(yè)鏈接有效性驗(yàn)證方法的第一實(shí)施例的流程圖。如圖1所 示,該方法包括步驟S102至步驟S110。
[0028] 步驟S102,確定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址。
[0029] 網(wǎng)站為增加訪客訪問(wèn)量,往往在眾多其他網(wǎng)站上通過(guò)合作或者收費(fèi)的方式部署指 向自身網(wǎng)站的鏈接,稱之為該網(wǎng)站的外部鏈接、反向鏈接或者友情鏈接。這些鏈接的部署 一般由代理商承接。由于一個(gè)網(wǎng)站部署的外部鏈接可能是數(shù)以千計(jì)的,因此,優(yōu)選地,通過(guò) 代理商獲取所有待驗(yàn)證的網(wǎng)頁(yè)鏈接地址。獲取的所有待驗(yàn)證的網(wǎng)頁(yè)鏈接地址可以存儲(chǔ)在表 中,如表1所示。
[0030] 表 I
[0031]
【權(quán)利要求】
1. 一種網(wǎng)頁(yè)鏈接有效性驗(yàn)證方法,其特征在于,包括: 確定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址; 判斷所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)是否可以訪問(wèn); 如果所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)可以訪問(wèn),則獲取所述待驗(yàn)證的網(wǎng)頁(yè)鏈接 地址對(duì)應(yīng)的網(wǎng)頁(yè); 解析所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè),判斷所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的 網(wǎng)頁(yè)中是否包含預(yù)設(shè)域名或預(yù)設(shè)關(guān)鍵詞,其中,通過(guò)所述預(yù)設(shè)關(guān)鍵詞可以鏈接到所述預(yù)設(shè) 域名對(duì)應(yīng)的網(wǎng)站;以及 如果所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中包含所述預(yù)設(shè)域名或者所述預(yù)設(shè)關(guān)鍵 詞,則確定所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址為有效的網(wǎng)頁(yè)鏈接地址。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,判斷所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的 網(wǎng)頁(yè)是否可以訪問(wèn)包括: 向所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址發(fā)出訪問(wèn)請(qǐng)求; 獲取所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址返回的對(duì)應(yīng)所述訪問(wèn)請(qǐng)求的狀態(tài)碼;以及 根據(jù)所述狀態(tài)碼判斷所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)是否可以訪問(wèn)。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,通過(guò)解析所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì) 應(yīng)的網(wǎng)頁(yè),判斷所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中是否包含所述預(yù)設(shè)域名或所述預(yù) 設(shè)關(guān)鍵詞包括: 讀取所述預(yù)設(shè)域名; 將讀取的預(yù)設(shè)域名與所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)進(jìn)行對(duì)比,判斷所述讀取 的預(yù)設(shè)域名是否出現(xiàn)在所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中; 如果所述讀取的預(yù)設(shè)域名沒(méi)有出現(xiàn)在所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中,則讀 取所述預(yù)設(shè)關(guān)鍵詞;以及 將讀取的預(yù)設(shè)關(guān)鍵詞與所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)進(jìn)行對(duì)比,判斷所述讀 取的預(yù)設(shè)關(guān)鍵詞是否出現(xiàn)在所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中, 或者, 讀取所述預(yù)設(shè)關(guān)鍵詞; 將讀取的預(yù)設(shè)關(guān)鍵詞與所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)進(jìn)行對(duì)比,判斷所述讀 取的預(yù)設(shè)關(guān)鍵詞是否出現(xiàn)在所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中; 如果所述讀取的預(yù)設(shè)關(guān)鍵詞沒(méi)有出現(xiàn)在所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中,則 讀取所述預(yù)設(shè)域名;以及 將讀取的預(yù)設(shè)域名與所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)進(jìn)行對(duì)比,判斷所述讀取 的預(yù)設(shè)域名是否出現(xiàn)在所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,確定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址包含確定多 個(gè)待驗(yàn)證的網(wǎng)頁(yè)鏈接地址,確定所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址為有效的網(wǎng)頁(yè)鏈接地址之后, 所述方法還包括: 統(tǒng)計(jì)所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址的數(shù)量; 統(tǒng)計(jì)所述有效的網(wǎng)頁(yè)鏈接地址的數(shù)量;以及 根據(jù)所述有效的網(wǎng)頁(yè)鏈接地址的數(shù)量和所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址的數(shù)量計(jì)算網(wǎng)站 鏈接存活率。
5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,確定所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址為有效 的網(wǎng)頁(yè)鏈接地址之后,所述方法還包括: 獲取預(yù)設(shè)網(wǎng)頁(yè)鏈接虛擬資源結(jié)算公式,其中,所述預(yù)設(shè)網(wǎng)頁(yè)鏈接虛擬資源結(jié)算公式用 于根據(jù)所述有效的網(wǎng)頁(yè)鏈接地址的數(shù)量計(jì)算網(wǎng)頁(yè)鏈接虛擬資源;以及 按照所述預(yù)設(shè)網(wǎng)頁(yè)鏈接虛擬資源結(jié)算公式計(jì)算網(wǎng)頁(yè)鏈接虛擬資源。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,按照所述預(yù)設(shè)網(wǎng)頁(yè)鏈接虛擬資源結(jié)算公 式計(jì)算網(wǎng)頁(yè)鏈接虛擬資源包括按照以下方式計(jì)算所述網(wǎng)頁(yè)鏈接虛擬資源: 統(tǒng)計(jì)所述有效的網(wǎng)頁(yè)鏈接地址的數(shù)量; 確定網(wǎng)頁(yè)鏈接單價(jià);以及 按照以下公式計(jì)算所述網(wǎng)頁(yè)鏈接虛擬資源: Q = S*P, 其中,Q為所述網(wǎng)頁(yè)鏈接虛擬資源,S為所述有效的網(wǎng)頁(yè)鏈接地址的數(shù)量,P為所述網(wǎng)頁(yè) 鏈接單價(jià)。
7. 根據(jù)權(quán)利要求1所述的方法,其特征在于,判斷所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的 網(wǎng)頁(yè)是否可以訪問(wèn)之后,所述方法還包括:如果所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)不 可訪問(wèn),則刪除所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址。
8. 根據(jù)權(quán)利要求1所述的方法,其特征在于,判斷所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的 網(wǎng)頁(yè)中是否包含所述預(yù)設(shè)域名或者所述預(yù)設(shè)關(guān)鍵詞之后,所述方法還包括:如果所述待驗(yàn) 證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中不包含所述預(yù)設(shè)域名和所述預(yù)設(shè)關(guān)鍵詞,則刪除所述待驗(yàn) 證的網(wǎng)頁(yè)鏈接地址。
9. 一種網(wǎng)頁(yè)鏈接有效性驗(yàn)證裝置,其特征在于,包括: 第一確定單元,用于確定待驗(yàn)證的網(wǎng)頁(yè)鏈接地址; 第一判斷單元,用于判斷所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)是否可以訪問(wèn); 獲取單元,用于在所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)可以訪問(wèn)時(shí),獲取所述待驗(yàn) 證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè); 第二判斷單元,用于解析所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè),判斷所述待驗(yàn)證的 網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中是否包含預(yù)設(shè)域名或預(yù)設(shè)關(guān)鍵詞,其中,通過(guò)所述預(yù)設(shè)關(guān)鍵詞 可以鏈接到所述預(yù)設(shè)域名對(duì)應(yīng)的網(wǎng)站;以及 第二確定單元,用于在所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)中包含所述預(yù)設(shè)域名或 者所述預(yù)設(shè)關(guān)鍵詞時(shí),確定所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址為有效的網(wǎng)頁(yè)鏈接地址。
10. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述第一判斷單元包括: 訪問(wèn)模塊,用于向所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址發(fā)出訪問(wèn)請(qǐng)求; 獲取模塊,用于獲取所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址返回的對(duì)應(yīng)所述訪問(wèn)請(qǐng)求的狀態(tài)碼; 以及 判斷模塊,用于根據(jù)所述狀態(tài)碼判斷所述待驗(yàn)證的網(wǎng)頁(yè)鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)是否可以 訪問(wèn)。
【文檔編號(hào)】G06F17/30GK104317938SQ201410602695
【公開(kāi)日】2015年1月28日 申請(qǐng)日期:2014年10月31日 優(yōu)先權(quán)日:2014年10月31日
【發(fā)明者】楊韜, 王曉群, 余德樂(lè), 譚紫萱 申請(qǐng)人:北京國(guó)雙科技有限公司