亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種網(wǎng)頁(yè)請(qǐng)求的關(guān)聯(lián)方法及裝置制造方法

文檔序號(hào):6535476閱讀:170來(lái)源:國(guó)知局
一種網(wǎng)頁(yè)請(qǐng)求的關(guān)聯(lián)方法及裝置制造方法
【專(zhuān)利摘要】本申請(qǐng)公開(kāi)了一種網(wǎng)頁(yè)請(qǐng)求的關(guān)聯(lián)方法與裝置,該方法包括:獲取待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求;判斷所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段是否為空;若是,依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求;若否,依據(jù)所述referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求;將所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)到所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求。本申請(qǐng)判斷所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求referer字段是否為空,若是,依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,從而解決了現(xiàn)有技術(shù)中在referer字段為空時(shí)出現(xiàn)的關(guān)聯(lián)失敗,影響關(guān)聯(lián)可靠性的問(wèn)題。
【專(zhuān)利說(shuō)明】一種網(wǎng)頁(yè)請(qǐng)求的關(guān)聯(lián)方法及裝置
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及互聯(lián)網(wǎng)訪(fǎng)問(wèn)【技術(shù)領(lǐng)域】,尤其是一種網(wǎng)頁(yè)請(qǐng)求的關(guān)聯(lián)方法及裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的普及,越來(lái)越多的用戶(hù)在日常工作生活中需要訪(fǎng)問(wèn)互聯(lián)網(wǎng)網(wǎng)站中的網(wǎng)頁(yè)內(nèi)容。用戶(hù)訪(fǎng)問(wèn)的網(wǎng)頁(yè)通常是一個(gè)大頁(yè)面,所述大頁(yè)面中嵌入有多個(gè)小頁(yè)面,另外,所述小頁(yè)面中可能還嵌入有下一級(jí)小頁(yè)面。其中所述嵌入有小頁(yè)面的大頁(yè)面被認(rèn)為是網(wǎng)頁(yè)容器對(duì)象,所述各個(gè)小的頁(yè)面被認(rèn)為是網(wǎng)頁(yè)內(nèi)嵌對(duì)象。
[0003]用戶(hù)訪(fǎng)問(wèn)網(wǎng)頁(yè)的過(guò)程為,用戶(hù)點(diǎn)擊瀏覽器后瀏覽器自動(dòng)生成網(wǎng)頁(yè)請(qǐng)求,所述網(wǎng)頁(yè)請(qǐng)求被發(fā)送至服務(wù)器,其中,所述網(wǎng)頁(yè)請(qǐng)求中可能既包含有容器對(duì)象請(qǐng)求,也包含有內(nèi)嵌對(duì)象請(qǐng)求,服務(wù)器返回與所述各個(gè)網(wǎng)頁(yè)請(qǐng)求相對(duì)應(yīng)的頁(yè)面對(duì)象,將所述各個(gè)頁(yè)面對(duì)象中的內(nèi)嵌對(duì)象放入所述容器對(duì)象中,從而組合成為用戶(hù)訪(fǎng)問(wèn)的網(wǎng)頁(yè)頁(yè)面。在進(jìn)行所述組合前,需要建立內(nèi)嵌對(duì)象請(qǐng)求與相對(duì)應(yīng)的容器對(duì)象之間的關(guān)聯(lián)關(guān)系,即將內(nèi)嵌對(duì)象請(qǐng)求關(guān)聯(lián)至相對(duì)應(yīng)的容器對(duì)象請(qǐng)求,從而才能依據(jù)所述關(guān)聯(lián)關(guān)系,將各個(gè)頁(yè)面對(duì)象進(jìn)行組合形成最終用戶(hù)訪(fǎng)問(wèn)的網(wǎng)頁(yè)頁(yè)面。
[0004]現(xiàn)有的網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)方法主要依據(jù)網(wǎng)頁(yè)請(qǐng)求中的referer字段進(jìn)行關(guān)聯(lián),但該種關(guān)聯(lián)方案,在該網(wǎng)頁(yè)請(qǐng)求的referer字段為空時(shí)會(huì)出現(xiàn)關(guān)聯(lián)失敗,影響請(qǐng)求關(guān)聯(lián)的可靠性。

【發(fā)明內(nèi)容】

[0005]有鑒于此,本申請(qǐng)?zhí)峁┝艘环N網(wǎng)頁(yè)請(qǐng)求的關(guān)聯(lián)方法及裝置,用以解決現(xiàn)有技術(shù)中的依據(jù)網(wǎng)頁(yè)請(qǐng)求中的referer字段進(jìn)行關(guān)聯(lián),在所述referer字段為空時(shí)出現(xiàn)的關(guān)聯(lián)失敗,影響請(qǐng)求關(guān)聯(lián)的可靠性問(wèn)題。本申請(qǐng)?zhí)峁┑募夹g(shù)方案如下:
[0006]一種網(wǎng)頁(yè)請(qǐng)求的關(guān)聯(lián)方法,包括:
[0007]獲取待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求;
[0008]判斷所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段是否為空;
[0009]若是,依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求;
[0010]若否,依據(jù)所述referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求;
[0011]將所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)到所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0012]上述方法,優(yōu)選的,所述依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,包括:
[0013]獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí);
[0014]在接收到的各個(gè)網(wǎng)頁(yè)請(qǐng)求中,查找TCP連接標(biāo)識(shí)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)相同且referer字段不為空的網(wǎng)頁(yè)請(qǐng)求;
[0015]當(dāng)查找到時(shí),依據(jù)查找到的所述網(wǎng)頁(yè)請(qǐng)求的referer字段,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求;
[0016]當(dāng)未查找到時(shí),獲取至少一個(gè)容器對(duì)象請(qǐng)求,在所述容器對(duì)象請(qǐng)求中,查找生成時(shí)間與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間間隔最短的容器對(duì)象請(qǐng)求,并將查找到的所述容器對(duì)象請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0017]上述方法,優(yōu)選的,所述依據(jù)所述referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,包括:
[0018]獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段;
[0019]依據(jù)所述referer字段得到至少一個(gè)網(wǎng)頁(yè)請(qǐng)求;
[0020]在所述網(wǎng)頁(yè)請(qǐng)求為一個(gè)時(shí),依據(jù)查找到的所述網(wǎng)頁(yè)請(qǐng)求的referer字段,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求;
[0021]在所述網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),分別獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段及所述各個(gè)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段;
[0022]將User-Agent字段與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段相同的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0023]上述方法,優(yōu)選的,所述將User-Agent字段與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段相同的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求,包括:
[0024]依據(jù)所述User-Agent字段得到至少一個(gè)備選網(wǎng)頁(yè)請(qǐng)求;
[0025]在所述備選網(wǎng)頁(yè)請(qǐng)求為一個(gè)時(shí),將所述備選網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求;
[0026]在所述備選網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),分別計(jì)算所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間與所述各個(gè)備選網(wǎng)頁(yè)請(qǐng)求生成時(shí)間之間的時(shí)間差,并在所述各個(gè)時(shí)間差中確定最小值;依據(jù)所述最小值,在所述各個(gè)備選網(wǎng)頁(yè)請(qǐng)求中確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0027]本申請(qǐng)還提供了一種網(wǎng)頁(yè)請(qǐng)求的關(guān)聯(lián)裝置,包括:
[0028]獲取單元,用于獲取待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求;
[0029]判斷單元,用于判斷所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段是否為空;若是,觸發(fā)第一結(jié)果單元,若否,觸發(fā)第二結(jié)果單元;
[0030]第一結(jié)果單元,用于依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求;
[0031]第二結(jié)果單元,用于依據(jù)所述referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求;
[0032]關(guān)聯(lián)單元,用于將所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)到所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0033]上述裝置,優(yōu)選的,所述第一結(jié)果單元包括:
[0034]獲取子單元,用于獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí);
[0035]查找子單元,用于在接收到的各個(gè)網(wǎng)頁(yè)請(qǐng)求中,查找TCP連接標(biāo)識(shí)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)相同且referer字段不為空的網(wǎng)頁(yè)請(qǐng)求;當(dāng)查找到時(shí),觸發(fā)第一結(jié)果子單元,當(dāng)未查找到時(shí),觸發(fā)第二結(jié)果子單元;
[0036]第一結(jié)果子單元,用于依據(jù)查找到的所述網(wǎng)頁(yè)請(qǐng)求的referer字段,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求;
[0037]第二結(jié)果子單元,用于獲取至少一個(gè)容器對(duì)象請(qǐng)求,在所述容器對(duì)象請(qǐng)求中,查找生成時(shí)間與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間間隔最短的容器對(duì)象請(qǐng)求,并將查找到的所述容器對(duì)象請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0038]上述裝置,優(yōu)選的,所述第二結(jié)果單元包括:
[0039]第一字段獲取子單元,用于獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段;
[0040]請(qǐng)求獲得子單元,用于依據(jù)所述referer字段得到至少一個(gè)網(wǎng)頁(yè)請(qǐng)求;在所述網(wǎng)頁(yè)請(qǐng)求為一個(gè)時(shí),觸發(fā)第一確定單元;在所述網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),觸發(fā)第二字段獲取子單元;
[0041]第一確定子單元,用于依據(jù)查找到的所述網(wǎng)頁(yè)請(qǐng)求的referer字段,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求;
[0042]第二字段獲取子單元,用于分別獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段及所述各個(gè)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段,觸發(fā)第二確定子單元;
[0043]第二確定子單元,用于將User-Agent字段與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段相同的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0044]上述裝置,優(yōu)選的,所述第二確定子單元包括:
[0045]備選請(qǐng)求獲得子單元,用于依據(jù)所述User-Agent字段得到至少一個(gè)備選網(wǎng)頁(yè)請(qǐng)求;在所述備選網(wǎng)頁(yè)請(qǐng)求為一個(gè)時(shí),觸發(fā)第三確定子單元,在所述備選網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),觸發(fā)第四確定子單元;
[0046]第三確定子單元,用于將所述備選網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求;
[0047]第四確定子單元,用于分別計(jì)算所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間與所述各個(gè)備選網(wǎng)頁(yè)請(qǐng)求生成時(shí)間之間的時(shí)間差,并在所述各個(gè)時(shí)間差中確定最小值;依據(jù)所述最小值,在所述各個(gè)備選網(wǎng)頁(yè)請(qǐng)求中確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0048]由以上的技術(shù)方案可知,本申請(qǐng)?zhí)峁┝艘环N網(wǎng)頁(yè)請(qǐng)求的關(guān)聯(lián)方法與裝置,該方法通過(guò)獲取待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求,并判斷該待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段是否為空;若是,依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,若否,依據(jù)該referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,最終將該待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求與所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求進(jìn)行關(guān)聯(lián)。本申請(qǐng)?jiān)趯?duì)網(wǎng)頁(yè)請(qǐng)求進(jìn)行關(guān)聯(lián)之前判斷所述網(wǎng)頁(yè)請(qǐng)求的referer字段是否為空,在referer字段為空導(dǎo)致不能依據(jù)referer字段進(jìn)行目標(biāo)網(wǎng)頁(yè)請(qǐng)求的確定時(shí),則依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,并最終將所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求與確定出的所述欲關(guān)聯(lián)的目標(biāo)網(wǎng)頁(yè)請(qǐng)求進(jìn)行關(guān)聯(lián),從而有效地解決了現(xiàn)有技術(shù)中在referer字段為空時(shí)出現(xiàn)的關(guān)聯(lián)失敗,影響關(guān)聯(lián)可靠性的問(wèn)題。
【專(zhuān)利附圖】

【附圖說(shuō)明】
[0049]為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本申請(qǐng)的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0050]圖1為本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)方法實(shí)施例一的流程圖;
[0051]圖2為本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)方法實(shí)施例二的部分流程圖;
[0052]圖3為本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)方法實(shí)施例三的部分流程圖;
[0053]圖4為本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)方法實(shí)施例四的部分流程圖;
[0054]圖5為本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)裝置實(shí)施例五的結(jié)構(gòu)示意圖;
[0055]圖6為本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)裝置實(shí)施例六的部分結(jié)構(gòu)示意圖;
[0056]圖7為本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)裝置實(shí)施例七的部分結(jié)構(gòu)示意圖;
[0057]圖8為本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)裝置實(shí)施例八的部分結(jié)構(gòu)示意圖?!揪唧w實(shí)施方式】
[0058]下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。
[0059]請(qǐng)參閱圖1,其示出了本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)方法實(shí)施例一的流程圖,本實(shí)施例可以包括:
[0060]步驟101:獲取待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求;
[0061]用戶(hù)在訪(fǎng)問(wèn)網(wǎng)頁(yè)的過(guò)程中,點(diǎn)擊瀏覽器后瀏覽器自動(dòng)生成網(wǎng)頁(yè)請(qǐng)求,所述網(wǎng)頁(yè)請(qǐng)求需要被發(fā)送至服務(wù)器,服務(wù)器返回與所述網(wǎng)頁(yè)請(qǐng)求相對(duì)應(yīng)的響應(yīng)數(shù)據(jù)包,所述響應(yīng)數(shù)據(jù)包中包含有與所述網(wǎng)頁(yè)訪(fǎng)問(wèn)請(qǐng)求相對(duì)應(yīng)的網(wǎng)頁(yè)對(duì)象。
[0062]所述網(wǎng)頁(yè)請(qǐng)求中包含有內(nèi)嵌對(duì)象請(qǐng)求,所述內(nèi)嵌對(duì)象請(qǐng)求需要與相對(duì)應(yīng)的容器對(duì)象請(qǐng)求進(jìn)行關(guān)聯(lián),從而服務(wù)器返回的與所述內(nèi)嵌對(duì)象請(qǐng)求相對(duì)應(yīng)的網(wǎng)頁(yè)對(duì)象,才能與服務(wù)器返回的與所述容器對(duì)象請(qǐng)求相對(duì)應(yīng)的網(wǎng)頁(yè)對(duì)象進(jìn)行組合,形成用戶(hù)要訪(fǎng)問(wèn)的最終網(wǎng)頁(yè)頁(yè)面。
[0063]獲取所述網(wǎng)頁(yè)請(qǐng)求中的內(nèi)嵌對(duì)象請(qǐng)求,所述內(nèi)嵌對(duì)象請(qǐng)求即為待關(guān)聯(lián)的網(wǎng)頁(yè)請(qǐng)求,要將所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)到與其相對(duì)應(yīng)的容器對(duì)象請(qǐng)求。
[0064]步驟102:判斷所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段是否為空;若是,執(zhí)行步驟103,若否,執(zhí)行步驟104。
[0065]步驟101中獲取的所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求為基于HTTP協(xié)議的網(wǎng)頁(yè)請(qǐng)求,所述網(wǎng)頁(yè)請(qǐng)求是由瀏覽器生成,而基于某些設(shè)置的原因,生成的網(wǎng)頁(yè)請(qǐng)求中可能包含有referer字段,也可能referer字段為空。
[0066]所述referer字段指向某一網(wǎng)頁(yè)頁(yè)面,用于表示所述某一網(wǎng)頁(yè)頁(yè)面與包含所述referer字段的網(wǎng)頁(yè)請(qǐng)求存在關(guān)聯(lián)。例如,網(wǎng)頁(yè)請(qǐng)求H_1的referer字段為http://www.sina.com.cn/,表明http://www.sina.com.cn/指向的網(wǎng)頁(yè)頁(yè)面與所述網(wǎng)頁(yè)請(qǐng)求H_1存在關(guān)聯(lián),即所述http://www.sina.com.cn/指向的網(wǎng)頁(yè)頁(yè)面發(fā)出的所述網(wǎng)頁(yè)請(qǐng)求H_l。
[0067]步驟103:依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0068]各個(gè)客戶(hù)端瀏覽器發(fā)送的網(wǎng)頁(yè)請(qǐng)求,在傳輸過(guò)程中使用TCP協(xié)議進(jìn)行傳輸控制。TCP(Transmission Control Protocol,傳輸控制協(xié)議),是一種傳輸層通信協(xié)議。同一 TCP連接上傳輸?shù)母鱾€(gè)網(wǎng)頁(yè)請(qǐng)求通常是同一頁(yè)面發(fā)出的,即表明具有相同TCP連接標(biāo)識(shí)的網(wǎng)頁(yè)請(qǐng)求是處于同一頁(yè)面。
[0069]基于以上原理,與步驟101中獲取到的待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求(內(nèi)嵌對(duì)象請(qǐng)求),具有相同TCP連接標(biāo)識(shí)的網(wǎng)頁(yè)請(qǐng)求是處于同一 TCP連接上的,通常是由同一頁(yè)面發(fā)出的網(wǎng)頁(yè)請(qǐng)求,因此要確定所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的目標(biāo)網(wǎng)頁(yè)請(qǐng)求(容器對(duì)象請(qǐng)求),可以依據(jù)所述同一 TCP連接上的各個(gè)網(wǎng)頁(yè)請(qǐng)求。
[0070]具體的,所述確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求的過(guò)程可以是,獲取與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,所述網(wǎng)頁(yè)請(qǐng)求可以是一個(gè),也可以是多個(gè)。在所述至少一個(gè)網(wǎng)頁(yè)請(qǐng)求中查找是否存在referer字段不為空的網(wǎng)頁(yè)請(qǐng)求,若存在,將所述referer字段指向的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0071]當(dāng)然,所述獲取網(wǎng)頁(yè)請(qǐng)求的過(guò)程與查找所述referer字段是不是為空的過(guò)程可以是同時(shí)進(jìn)行,也可以是先查找與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,再在查找到的所述網(wǎng)頁(yè)請(qǐng)求中查找referer字段不為空的網(wǎng)頁(yè)請(qǐng)求。優(yōu)選的,選用第一種方式,以提高確定效率。
[0072]步驟104:依據(jù)所述referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0073]當(dāng)所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段不為空時(shí),將所述referer字段指向的網(wǎng)頁(yè)請(qǐng)求(容器對(duì)象請(qǐng)求)確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。例如:網(wǎng)頁(yè)請(qǐng)求11的referer字段為http://www.sina.com.cn/,則該 http://www.sina.com.cn/ 指向的網(wǎng)頁(yè)請(qǐng)求(容器對(duì)象請(qǐng)求)被確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0074]當(dāng)然,在依據(jù)所述referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求過(guò)程中同時(shí)利用所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求與所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求的IP地址,即所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求與所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求的IP地址是相同的,以此保證所述兩個(gè)網(wǎng)頁(yè)請(qǐng)求是由同一客戶(hù)端發(fā)出的,從而可以在多個(gè)客戶(hù)端使用不同IP地址同時(shí)訪(fǎng)問(wèn)同一網(wǎng)站網(wǎng)頁(yè)頁(yè)面時(shí)也可以將所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求進(jìn)行關(guān)聯(lián)。
[0075]步驟105:將所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)到所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0076]依據(jù)所述步驟103或步驟104中確定出的目標(biāo)網(wǎng)頁(yè)請(qǐng)求,將所述待關(guān)聯(lián)的網(wǎng)頁(yè)請(qǐng)求與其進(jìn)行關(guān)聯(lián)。所述關(guān)聯(lián)方式,可以是為所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求與所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求添加相同的標(biāo)識(shí),也可以是獲取所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求已具備的唯一標(biāo)識(shí),將所述唯一標(biāo)識(shí)添加到所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求中;也可以建立待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求與所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求的對(duì)應(yīng)關(guān)系表。當(dāng)然,關(guān)聯(lián)方式并不限定于上述三種,現(xiàn)有技術(shù)中能建立兩個(gè)網(wǎng)頁(yè)請(qǐng)求間對(duì)應(yīng)關(guān)系的方式都屬于本申請(qǐng)的保護(hù)范圍。
[0077]由以上的技術(shù)方案可知,本實(shí)施例提供了一種網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)方法,該方法通過(guò)獲取待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求,并判斷該待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段是否為空;若是,依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,若否,依據(jù)該referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,最終將該待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)到所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0078]本實(shí)施例在對(duì)網(wǎng)頁(yè)請(qǐng)求進(jìn)行關(guān)聯(lián)之前判斷所述網(wǎng)頁(yè)請(qǐng)求的referer字段是否為空,若為空,則依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,從而有效地解決了現(xiàn)有技術(shù)中在referer字段為空時(shí)出現(xiàn)的關(guān)聯(lián)失敗,影響關(guān)聯(lián)可靠性的問(wèn)題。
[0079]請(qǐng)參閱圖2,其示出了本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)方法實(shí)施例二的部分流程圖,實(shí)施例一中的步驟103可以包括:
[0080]步驟201:獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)。
[0081]TCP連接標(biāo)識(shí)由四個(gè)參數(shù)確定,即網(wǎng)頁(yè)請(qǐng)求的源IP、目的IP、源端口及目的端口。解析實(shí)施例一中步驟101中獲取到的待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的數(shù)據(jù)包,獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的源IP、目的IP、源端口及目的端口。
[0082]步驟202:在接收到的各個(gè)網(wǎng)頁(yè)請(qǐng)求中,查找TCP連接標(biāo)識(shí)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)相同且referer字段不為空的網(wǎng)頁(yè)請(qǐng)求。當(dāng)查找到時(shí),進(jìn)入步驟203,當(dāng)未查找到時(shí),進(jìn)入步驟204。
[0083]接收所述各個(gè)網(wǎng)頁(yè)請(qǐng)求,依次獲取所述各個(gè)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)并同時(shí)判斷該網(wǎng)頁(yè)請(qǐng)求的referer字段是否不為空,當(dāng)該網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)(源IP、目的IP、源端口及目的端口)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)相同,且referer字段不為空時(shí),則結(jié)束查找過(guò)程,進(jìn)入步驟203。當(dāng)查找完所述接收到的各個(gè)網(wǎng)頁(yè)請(qǐng)求,但不存在具有上述特征的網(wǎng)頁(yè)請(qǐng)求,則進(jìn)入步驟204。
[0084]需要說(shuō)明的是,上述查找過(guò)程中同時(shí)判斷TCP連接標(biāo)識(shí)是否與待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的相同及判斷referer是否為空,查找效率較高,從而待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的關(guān)聯(lián)效率也會(huì)相應(yīng)提聞。
[0085]步驟203:依據(jù)查找到的所述網(wǎng)頁(yè)請(qǐng)求的referer字段,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0086]所述確定過(guò)程為,獲取步驟202查找到的網(wǎng)頁(yè)請(qǐng)求中的referer字段,將所述referer字段指向的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0087]例如,待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的源IP地址為192.168.200.55,目的IP地址為218.30.13.36,源端口號(hào)為100,目的端口號(hào)為80。查找到的網(wǎng)頁(yè)請(qǐng)求的源IP地址為192.168.200.55,目的IP地址為218.30.13.36,源端口號(hào)為100,目的端口號(hào)為80,且referer 字段不為空,內(nèi)容為 http://www.sina.com.cn/,則將 http://www.sina.com.cn/對(duì)應(yīng)的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0088]步驟204:獲取至少一個(gè)容器對(duì)象請(qǐng)求,在所述容器對(duì)象請(qǐng)求中,查找生成時(shí)間與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間間隔最短的容器對(duì)象請(qǐng)求,并將查找到的所述容器對(duì)象請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0089]對(duì)于每一個(gè)用戶(hù),維護(hù)其發(fā)出的所有容器對(duì)象請(qǐng)求,并記錄所述容器對(duì)象請(qǐng)求的生成時(shí)間。將生成時(shí)間與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間間隔最短的容器對(duì)象請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0090]例如,待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的源IP地址為192.168.200.55,生成時(shí)間為2013-11-1911:31:29。該IP地址的用戶(hù)已經(jīng)發(fā)出的容器對(duì)象請(qǐng)求有A和B,其中A的生成時(shí)間為2013-11-1911:31:23,B的生成時(shí)間為2013-11-1911:31:28。容器對(duì)象請(qǐng)求B的生成時(shí)間與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間間隔為I秒,為最短的間隔時(shí)間,則將該容器對(duì)象請(qǐng)求B確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0091]由以上的技術(shù)方案可知,本實(shí)施例提供的一種網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)方法,當(dāng)所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段為空時(shí),在所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接中確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,確定方法為先在接收到的各個(gè)網(wǎng)頁(yè)請(qǐng)求中,查找TCP連接標(biāo)識(shí)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)相同且referer字段不為空的網(wǎng)頁(yè)請(qǐng)求;若查找到,則依據(jù)該referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,若否,則利用時(shí)間機(jī)制,即與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求間隔時(shí)間最短的容器對(duì)象請(qǐng)求被確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求,從而完成了目標(biāo)網(wǎng)頁(yè)請(qǐng)求的確定。所述確定方法中先利用網(wǎng)頁(yè)請(qǐng)求的referer字段,再利用時(shí)間機(jī)制,二者結(jié)合的判斷方法,可以提高關(guān)聯(lián)的可靠性。
[0092]當(dāng)實(shí)施例一中依據(jù)所述referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求過(guò)程中,可能會(huì)出現(xiàn)關(guān)聯(lián)歧義的問(wèn)題,即多個(gè)客戶(hù)端使用同一 IP地址訪(fǎng)問(wèn)同一頁(yè)面,則referer字段確定的目標(biāo)網(wǎng)頁(yè)請(qǐng)求是多個(gè)。請(qǐng)參閱圖3,其示出了本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)關(guān)聯(lián)方法實(shí)施例三的部分流程圖,實(shí)施例一中的步驟104可以包括:
[0093]步驟301:獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段。
[0094]解析所述網(wǎng)頁(yè)請(qǐng)求所在的HTTP請(qǐng)求數(shù)據(jù)包,獲取所述請(qǐng)求數(shù)據(jù)包中的referer字段。
[0095]步驟302:依據(jù)所述referer字段得到至少一個(gè)網(wǎng)頁(yè)請(qǐng)求,在所述網(wǎng)頁(yè)請(qǐng)求為一個(gè)時(shí),執(zhí)行步驟303,在所述網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),執(zhí)行步驟304。
[0096]網(wǎng)頁(yè)請(qǐng)求中的referer字段內(nèi)容為另一網(wǎng)頁(yè)請(qǐng)求的URL,用于表示所述網(wǎng)頁(yè)請(qǐng)求與該另一網(wǎng)頁(yè)請(qǐng)求存在關(guān)聯(lián)關(guān)系。依據(jù)步驟301中獲取referer字段的數(shù)據(jù)內(nèi)容,同時(shí)判斷發(fā)出網(wǎng)頁(yè)請(qǐng)求的客戶(hù)端的IP地址,查找具有所述referer字段內(nèi)容表示的URL且IP地址與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的IP地址相同的網(wǎng)頁(yè)請(qǐng)求。所述網(wǎng)頁(yè)請(qǐng)求可能為一個(gè),也可能為多個(gè)。導(dǎo)致所述網(wǎng)頁(yè)請(qǐng)求為多個(gè)的原因,是多個(gè)客戶(hù)端使用同一 IP地址同時(shí)訪(fǎng)問(wèn)同一網(wǎng)頁(yè)頁(yè)面,如NAT機(jī)制下經(jīng)常會(huì)遇到這種情況。
[0097]步驟303:依據(jù)查找到的所述網(wǎng)頁(yè)請(qǐng)求的referer字段,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,結(jié)束目標(biāo)網(wǎng)頁(yè)請(qǐng)求的確定過(guò)程。
[0098]步驟304:分別獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段及所述各個(gè)網(wǎng)頁(yè)請(qǐng)求的 User-Agent 字段。
[0099]步驟302中得到的所述網(wǎng)頁(yè)請(qǐng)求可能為多個(gè),例如,獲取到的網(wǎng)頁(yè)請(qǐng)求H_1的referer字段為http://www.sina.com.cn/,查找到網(wǎng)頁(yè)請(qǐng)求H_2及H_3的URL均為所述URL (http://www.sina.com.cn/)。
[0100]當(dāng)所述網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),分別獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求及各個(gè)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段。其中,所述User-Agent字段是網(wǎng)頁(yè)請(qǐng)求中的一個(gè)字段,用于記錄發(fā)出所述網(wǎng)頁(yè)請(qǐng)求的操作系統(tǒng)及瀏覽器的版本等信息。發(fā)明人通過(guò)研究發(fā)現(xiàn),User-Agent字段中包含的所述信息對(duì)于區(qū)分不同的客戶(hù)端具有較高的利用價(jià)值,尤其是包含的瀏覽器版本信息。不同客戶(hù)端可能使用同一瀏覽器,但通常在不同時(shí)間點(diǎn)進(jìn)行瀏覽器版本的更新,則所述User-Agent字段中包含的信息就會(huì)不同。
[0101]步驟305:將User-Agent字段與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段相同的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0102]依據(jù)步驟304中獲取的User-Agent字段,將與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent相同的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0103]由以上的技術(shù)方案可知,本實(shí)施例提供的一種網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)方法,在依據(jù)所述referer字段進(jìn)行目標(biāo)網(wǎng)頁(yè)請(qǐng)求的確定過(guò)程中,若由于多個(gè)客戶(hù)端使用同一 IP地址進(jìn)行網(wǎng)頁(yè)訪(fǎng)問(wèn)導(dǎo)致確定的網(wǎng)頁(yè)請(qǐng)求存在多個(gè)時(shí),利用網(wǎng)頁(yè)請(qǐng)求的User-Agent字段進(jìn)一步確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,從而有效地解決了關(guān)聯(lián)歧義問(wèn)題,提高了網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)的可靠性。
[0104]在上述實(shí)施例三的基礎(chǔ)上,也可能存在獲取到各個(gè)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段也完全相同的情況。請(qǐng)參閱圖4,其示出了本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)方法實(shí)施例四的部分流程圖,實(shí)施例三中的步驟305可以包括:
[0105]步驟401:依據(jù)所述User-Agent字段得到至少一個(gè)備選網(wǎng)頁(yè)請(qǐng)求。
[0106]步驟402:在所述備選網(wǎng)頁(yè)請(qǐng)求為一個(gè)時(shí),將所述備選網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。[0107]步驟403:在所述備選網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),分別計(jì)算所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間與所述各個(gè)備選網(wǎng)頁(yè)請(qǐng)求生成時(shí)間之間的時(shí)間差,并在所述各個(gè)時(shí)間差中確定最小值;依據(jù)所述最小值,在所述各個(gè)備選網(wǎng)頁(yè)請(qǐng)求中確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0108]當(dāng)所述備選網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),可以采用先到先關(guān)聯(lián)的機(jī)制,即將先接到的目標(biāo)網(wǎng)頁(yè)請(qǐng)求確定為該待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求(內(nèi)嵌對(duì)象請(qǐng)求)的目標(biāo)網(wǎng)頁(yè)請(qǐng)求(容器對(duì)象請(qǐng)求)。所述確定過(guò)程是,計(jì)算接收到所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的時(shí)間與所述各個(gè)備選網(wǎng)頁(yè)請(qǐng)求之間的時(shí)間間隔,將間隔最短的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0109]由以上的技術(shù)方案可知,本實(shí)施例提供的一種網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)方法,在多個(gè)客戶(hù)端使用的所述User-Agent字段相同時(shí),采用先到先關(guān)聯(lián)機(jī)制完成了目標(biāo)網(wǎng)頁(yè)請(qǐng)求的確定,進(jìn)一步提高了關(guān)聯(lián)方法的可靠性。
[0110]請(qǐng)參閱圖5,其示出了本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)裝置實(shí)施例五的結(jié)構(gòu)示意圖,本實(shí)施例可以包括:獲取單元501、判斷單元502、第一結(jié)果單元503、第二結(jié)果單元504及關(guān)聯(lián)單元505。
[0111]所述獲取單元501,用于獲取待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求;
[0112]用戶(hù)在訪(fǎng)問(wèn)網(wǎng)頁(yè)的過(guò)程中,點(diǎn)擊瀏覽器后瀏覽器自動(dòng)生成網(wǎng)頁(yè)請(qǐng)求,所述網(wǎng)頁(yè)請(qǐng)求需要被發(fā)送至服務(wù)器,服務(wù)器返回與所述網(wǎng)頁(yè)請(qǐng)求相對(duì)應(yīng)的響應(yīng)數(shù)據(jù)包,所述響應(yīng)數(shù)據(jù)包中包含有與所述網(wǎng)頁(yè)訪(fǎng)問(wèn)請(qǐng)求相對(duì)應(yīng)的網(wǎng)頁(yè)對(duì)象。
[0113]所述網(wǎng)頁(yè)請(qǐng)求中包含有內(nèi)嵌對(duì)象請(qǐng)求,所述內(nèi)嵌對(duì)象請(qǐng)求需要與相對(duì)應(yīng)的容器對(duì)象請(qǐng)求進(jìn)行關(guān)聯(lián),從而服務(wù)器返回的與所述內(nèi)嵌對(duì)象請(qǐng)求相對(duì)應(yīng)的網(wǎng)頁(yè)對(duì)象,才能與服務(wù)器返回的與所述容器對(duì)象請(qǐng)求相對(duì)應(yīng)的網(wǎng)頁(yè)對(duì)象進(jìn)行組合,形成用戶(hù)要訪(fǎng)問(wèn)的最終網(wǎng)頁(yè)頁(yè)面。
[0114]所述獲取單元501獲取所述網(wǎng)頁(yè)請(qǐng)求中的內(nèi)嵌對(duì)象請(qǐng)求,所述內(nèi)嵌對(duì)象請(qǐng)求即為待關(guān)聯(lián)的網(wǎng)頁(yè)請(qǐng)求,要將所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)到與其相對(duì)應(yīng)的容器對(duì)象請(qǐng)求。
[0115]所述判斷單元502,用于判斷所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段是否為空;若是,觸發(fā)第一結(jié)果單元503,若否,觸發(fā)第二結(jié)果單元504。
[0116]所述獲取單元501獲取的所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求為基于HTTP協(xié)議的網(wǎng)頁(yè)請(qǐng)求,所述網(wǎng)頁(yè)請(qǐng)求是由瀏覽器生成,而基于某些設(shè)置的原因,生成的網(wǎng)頁(yè)請(qǐng)求中可能包含有referer字段,也可能referer字段為空。
[0117]所述referer字段指向某一網(wǎng)頁(yè)頁(yè)面,用于表示所述某一網(wǎng)頁(yè)頁(yè)面與包含所述referer字段的網(wǎng)頁(yè)請(qǐng)求存在關(guān)聯(lián)。例如,網(wǎng)頁(yè)請(qǐng)求H_1的referer字段為http://www.sina.com.cn/,表明http://www.sina.com.cn/指向的網(wǎng)頁(yè)頁(yè)面與所述網(wǎng)頁(yè)請(qǐng)求H_1存在關(guān)聯(lián),即所述http://www.sina.com.cn/指向的網(wǎng)頁(yè)頁(yè)面發(fā)出的所述網(wǎng)頁(yè)請(qǐng)求H_l。
[0118]所述第一結(jié)果單元503,用于依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0119]各個(gè)客戶(hù)端瀏覽器發(fā)送的網(wǎng)頁(yè)請(qǐng)求,在傳輸過(guò)程中使用TCP協(xié)議進(jìn)行傳輸控制。TCP(Transmission Control Protocol,傳輸控制協(xié)議),是一種傳輸層通信協(xié)議。同一 TCP連接上傳輸?shù)母鱾€(gè)網(wǎng)頁(yè)請(qǐng)求通常是同一頁(yè)面發(fā)出的,即表明具有相同TCP連接標(biāo)識(shí)的網(wǎng)頁(yè)請(qǐng)求是處于同一頁(yè)面。
[0120]基于以上原理,與所述獲取單元501獲取到的待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求(內(nèi)嵌對(duì)象請(qǐng)求),具有相同TCP連接標(biāo)識(shí)的網(wǎng)頁(yè)請(qǐng)求是處于同一 TCP連接上的,通常是由同一頁(yè)面發(fā)出的網(wǎng)頁(yè)請(qǐng)求,因此要確定所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的目標(biāo)網(wǎng)頁(yè)請(qǐng)求(容器對(duì)象請(qǐng)求),可以依據(jù)所述同一 TCP連接上的各個(gè)網(wǎng)頁(yè)請(qǐng)求。
[0121]具體的,所述第一結(jié)果單元503確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求的過(guò)程可以是,獲取與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,所述網(wǎng)頁(yè)請(qǐng)求可以是一個(gè),也可以是多個(gè)。在所述至少一個(gè)網(wǎng)頁(yè)請(qǐng)求中查找是否存在referer字段不為空的網(wǎng)頁(yè)請(qǐng)求,若存在,將所述referer字段指向的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0122]當(dāng)然,所述第一結(jié)果單元503獲取網(wǎng)頁(yè)請(qǐng)求的過(guò)程與查找所述referer字段是不是為空的過(guò)程可以是同時(shí)進(jìn)行,也可以是先查找與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,再在查找到的所述網(wǎng)頁(yè)請(qǐng)求中查找referer字段不為空的網(wǎng)頁(yè)請(qǐng)求。優(yōu)選的,選用第一種方式,以提高確定效率。
[0123]所述第二結(jié)果單元504,用于依據(jù)所述referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0124]當(dāng)所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段不為空時(shí),所述第二結(jié)果單元504將所述referer字段指向的網(wǎng)頁(yè)請(qǐng)求(容器對(duì)象請(qǐng)求)確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。例如:網(wǎng)頁(yè)請(qǐng)求11的referer 字段為 http://www.sina.com.cn/,則該http://www.sina.com.cn/指向的網(wǎng)頁(yè)請(qǐng)求(容器對(duì)象請(qǐng)求)被確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0125]當(dāng)然,在所述第二結(jié)果單元504依據(jù)所述referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求過(guò)程中同時(shí)利用所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求與所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求的IP地址,即所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求與所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求的IP地址是相同的,以此保證所述兩個(gè)網(wǎng)頁(yè)請(qǐng)求是由同一客戶(hù)端發(fā)出的,從而可以在多個(gè)客戶(hù)端使用不同IP地址同時(shí)訪(fǎng)問(wèn)同一網(wǎng)站網(wǎng)頁(yè)頁(yè)面時(shí)也可以將所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求進(jìn)行關(guān)聯(lián)。
[0126]所述關(guān)聯(lián)單元505,用于將所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)到所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0127]依據(jù)所述第一結(jié)果單元503或所述第二結(jié)果單元504確定出的目標(biāo)網(wǎng)頁(yè)請(qǐng)求,所述關(guān)聯(lián)單元505將所述待關(guān)聯(lián)的網(wǎng)頁(yè)請(qǐng)求與其進(jìn)行關(guān)聯(lián)。所述關(guān)聯(lián)方式,可以是為所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求與所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求添加相同的標(biāo)識(shí),也可以是獲取所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求已具備的唯一標(biāo)識(shí),將所述唯一標(biāo)識(shí)添加到所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求中;也可以建立待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求與所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求的對(duì)應(yīng)關(guān)系表。當(dāng)然,關(guān)聯(lián)方式并不限定于上述三種,現(xiàn)有技術(shù)中能建立兩個(gè)網(wǎng)頁(yè)請(qǐng)求間對(duì)應(yīng)關(guān)系的方式都屬于本申請(qǐng)的保護(hù)范圍。
[0128]由以上的技術(shù)方案可知,本實(shí)施例提供了一種網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)裝置,該裝置通過(guò)獲取待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求,并判斷該待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段是否為空;若是,依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,若否,依據(jù)該referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,最終將該待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)到所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0129]本實(shí)施例在對(duì)網(wǎng)頁(yè)請(qǐng)求進(jìn)行關(guān)聯(lián)之前判斷所述網(wǎng)頁(yè)請(qǐng)求的referer字段是否為空,若為空,則依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,從而有效地解決了現(xiàn)有技術(shù)中在referer字段為空時(shí)出現(xiàn)的關(guān)聯(lián)失敗,影響關(guān)聯(lián)可靠性的問(wèn)題。
[0130]請(qǐng)參閱圖6,其示出了本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)裝置實(shí)施例六的部分結(jié)構(gòu)示意圖,實(shí)施例五中的第一結(jié)果單元503單元可以包括:獲取子單元601、查找子單元602、第一結(jié)果子單元603及第二結(jié)果子單元604。其中:[0131]所述獲取子單元601,用于獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)。
[0132]TCP連接標(biāo)識(shí)由四個(gè)參數(shù)確定,即網(wǎng)頁(yè)請(qǐng)求的源IP、目的IP、源端口及目的端口。解析實(shí)施例五獲取單元501中獲取到的待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的數(shù)據(jù)包,所述獲取子單元601獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的源IP、目的IP、源端口及目的端口。
[0133]所述查找子單元602,用于在接收到的各個(gè)網(wǎng)頁(yè)請(qǐng)求中,查找TCP連接標(biāo)識(shí)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)相同且referer字段不為空的網(wǎng)頁(yè)請(qǐng)求;當(dāng)查找到時(shí),觸發(fā)第一結(jié)果子單元603,當(dāng)未查找到時(shí),觸發(fā)第二結(jié)果子單元604。
[0134]接收所述各個(gè)網(wǎng)頁(yè)請(qǐng)求,所述查找子單元602依次獲取所述各個(gè)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)并同時(shí)判斷該網(wǎng)頁(yè)請(qǐng)求的referer字段是否不為空,當(dāng)該網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)(源IP、目的IP、源端口及目的端口)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)相同,且referer字段不為空時(shí),則結(jié)束查找過(guò)程,觸發(fā)第一結(jié)果子單元603。當(dāng)查找完所述接收到的各個(gè)網(wǎng)頁(yè)請(qǐng)求,但不存在具有上述特征的網(wǎng)頁(yè)請(qǐng)求,則觸發(fā)第二結(jié)果子單元604。
[0135]需要說(shuō)明的是,上述查找過(guò)程中同時(shí)判斷TCP連接標(biāo)識(shí)是否與待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的相同及判斷referer是否為空,查找效率較高,從而待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的關(guān)聯(lián)效率也會(huì)相應(yīng)提聞。
[0136]所述第一結(jié)果子單元603,用于依據(jù)查找到的所述網(wǎng)頁(yè)請(qǐng)求的referer字段,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0137]所述確定過(guò)程為,所述第一結(jié)果子單元603獲取所述查找子單元602查找到的網(wǎng)頁(yè)請(qǐng)求中的referer字段,將所述referer字段指向的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0138]例如,待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的源IP地址為192.168.200.55,目的IP地址為218.30.13.36,源端口號(hào)為100,目的端口號(hào)為80。所述查找子單元602查找到的網(wǎng)頁(yè)請(qǐng)求的源IP地址為192.168.200.55,目的IP地址為218.30.13.36,源端口號(hào)為100,目的端口號(hào)為80,且referer字段不為空,內(nèi)容為http://www.sina.com.cn/,則所述第一結(jié)果子單元603將http://www.sina.com.cn/對(duì)應(yīng)的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0139]所述第二結(jié)果子單元604,用于獲取至少一個(gè)容器對(duì)象請(qǐng)求,在所述容器對(duì)象請(qǐng)求中,查找生成時(shí)間與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間間隔最短的容器對(duì)象請(qǐng)求,并將查找到的所述容器對(duì)象請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0140]對(duì)于每一個(gè)用戶(hù),維護(hù)其發(fā)出的所有容器對(duì)象請(qǐng)求,并記錄所述容器對(duì)象請(qǐng)求的生成時(shí)間。所述第二結(jié)果子單元604將生成時(shí)間與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間間隔最短的容器對(duì)象請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0141]例如,待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的源IP地址為192.168.200.55,生成時(shí)間為2013-11-1911:31:29。該IP地址的用戶(hù)已經(jīng)發(fā)出的容器對(duì)象請(qǐng)求有A和B,其中A的生成時(shí)間為2013-11-1911:31:23,B的生成時(shí)間為2013-11-1911:31:28。所述第二結(jié)果子單元604判斷出容器對(duì)象請(qǐng)求B的生成時(shí)間與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間間隔為I秒,為最短的間隔時(shí)間,則將該容器對(duì)象請(qǐng)求B確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0142]由以上的技術(shù)方案可知,本實(shí)施例提供的一種網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)裝置,當(dāng)判斷單元501判斷所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段為空時(shí),在所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接中確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,確定方法為查找子單元602在接收到的各個(gè)網(wǎng)頁(yè)請(qǐng)求中,查找TCP連接標(biāo)識(shí)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)相同且referer字段不為空的網(wǎng)頁(yè)請(qǐng)求;若是,則第一結(jié)果子單元603依據(jù)該referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,若否,則第二結(jié)果子單元604利用時(shí)間機(jī)制,即與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求間隔時(shí)間最短的容器對(duì)象請(qǐng)求被確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求,從而完成了目標(biāo)網(wǎng)頁(yè)請(qǐng)求的確定。所述確定方法中先利用網(wǎng)頁(yè)請(qǐng)求的referer字段,再利用時(shí)間機(jī)制,可以提高關(guān)聯(lián)的可靠性。
[0143]當(dāng)實(shí)施例五中第二結(jié)果單元504依據(jù)所述referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求過(guò)程中,可能會(huì)出現(xiàn)關(guān)聯(lián)歧義的問(wèn)題,即多個(gè)客戶(hù)端使用同一 IP地址訪(fǎng)問(wèn)同一頁(yè)面,則referer字段確定的目標(biāo)網(wǎng)頁(yè)請(qǐng)求是多個(gè)。請(qǐng)參閱圖7,其示出了本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)關(guān)聯(lián)裝置實(shí)施例七的部分結(jié)構(gòu)示意圖,實(shí)施例五中的第二結(jié)果單元504可以包括:第一字段獲取子單元701、請(qǐng)求獲得子單元702、第一確定子單元703、第二字段獲取子單元704及第二確定子單元705。其中:
[0144]所述第一字段獲取子單元701,用于獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段。
[0145]所述第一字段獲取子單元701解析所述網(wǎng)頁(yè)請(qǐng)求所在的HTTP請(qǐng)求數(shù)據(jù)包,獲取所述請(qǐng)求數(shù)據(jù)包中的referer字段。
[0146]所述請(qǐng)求獲得子單元702,用于依據(jù)所述referer字段得到至少一個(gè)網(wǎng)頁(yè)請(qǐng)求。
[0147]網(wǎng)頁(yè)請(qǐng)求中的referer字段內(nèi)容為另一網(wǎng)頁(yè)請(qǐng)求的URL,用于表示所述網(wǎng)頁(yè)請(qǐng)求與該另一網(wǎng)頁(yè)請(qǐng)求存在關(guān)聯(lián)關(guān)系。所述請(qǐng)求獲得子單元702依據(jù)所述第一字段獲取子單元701獲取referer字段的數(shù)據(jù)內(nèi)容,同時(shí)判斷發(fā)出網(wǎng)頁(yè)請(qǐng)求的客戶(hù)端的IP地址,查找具有所述referer字段內(nèi)容表示的URL且IP地址與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的IP地址相同的網(wǎng)頁(yè)請(qǐng)求。所述網(wǎng)頁(yè)請(qǐng)求可能為一個(gè),也可能為多個(gè)。導(dǎo)致所述網(wǎng)頁(yè)請(qǐng)求為多個(gè)的原因,是多個(gè)客戶(hù)端使用同一 IP地址同時(shí)訪(fǎng)問(wèn)同一網(wǎng)頁(yè)頁(yè)面,如NAT機(jī)制下經(jīng)常會(huì)遇到這種情況。
[0148]所述第一確定子單元703,用于在所述網(wǎng)頁(yè)請(qǐng)求為一個(gè)時(shí),依據(jù)查找到的所述網(wǎng)頁(yè)請(qǐng)求的referer字段,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0149]所述第二字段獲取子單元704,用于在所述網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),分別獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段及所述各個(gè)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段。
[0150]所述請(qǐng)求獲得子單元702得到的所述網(wǎng)頁(yè)請(qǐng)求可能為多個(gè),例如,獲取到的網(wǎng)頁(yè)請(qǐng)求H_1的referer字段為http://www.sina.com.cn/,查找到網(wǎng)頁(yè)請(qǐng)求H_2及H_3的URL均為所述 URL (http://www.sina.com.cn/)。
[0151]當(dāng)所述網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),所述第二字段獲取子單元704分別獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求及各個(gè)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段。其中,所述User-Agent字段是網(wǎng)頁(yè)請(qǐng)求中的一個(gè)字段,用于記錄發(fā)出所述網(wǎng)頁(yè)請(qǐng)求的操作系統(tǒng)及瀏覽器的版本等信息。發(fā)明人通過(guò)研究發(fā)現(xiàn),User-Agent字段中包含的所述信息對(duì)于區(qū)分不同的客戶(hù)端具有較高的利用價(jià)值,尤其是包含的瀏覽器版本信息。不同客戶(hù)端可能使用同一瀏覽器,但通常在不同時(shí)間點(diǎn)進(jìn)行瀏覽器版本的更新,則所述User-Agent字段中包含的信息就會(huì)不同。
[0152]所述第二確定子單元705,用于將User-Agent字段與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段相同的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0153]依據(jù)所述第二字段獲取子單元704獲取的User-Agent字段,所述第二確定子單元705將與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent相同的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0154]由以上的技術(shù)方案可知,本實(shí)施例提供的一種網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)裝置,在依據(jù)所述referer字段進(jìn)行目標(biāo)網(wǎng)頁(yè)請(qǐng)求的確定過(guò)程中,若由于多個(gè)客戶(hù)端使用同一 IP地址進(jìn)行網(wǎng)頁(yè)訪(fǎng)問(wèn)導(dǎo)致確定的網(wǎng)頁(yè)請(qǐng)求存在多個(gè)時(shí),所述第二確定子單元705利用網(wǎng)頁(yè)請(qǐng)求的User-Agent字段進(jìn)一步確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,從而有效地解決了關(guān)聯(lián)歧義問(wèn)題,提高了網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)的可靠性。
[0155]在上述實(shí)施例七的基礎(chǔ)上,也可能存在所述第二字段獲取子單元704獲取到各個(gè)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段也完全相同的情況。請(qǐng)參閱圖8,其示出了本申請(qǐng)?zhí)峁┑囊环N網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)裝置實(shí)施例八的部分結(jié)構(gòu)示意圖,實(shí)施例七中的第二確定子單元705可以包括:備選請(qǐng)求獲得子單元801、第三確定子單元802及第四確定子單元803。其中:
[0156]所述備選請(qǐng)求獲得子單元801,用于依據(jù)所述User-Agent字段得到至少一個(gè)備選網(wǎng)頁(yè)請(qǐng)求;在所述備選網(wǎng)頁(yè)請(qǐng)求為一個(gè)時(shí),觸發(fā)第三確定子單元,在所述備選網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),觸發(fā)第四確定子單元。
[0157]所述第三確定子單元802,用于將所述備選網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0158]所述第四確定子單元803,用于分別計(jì)算所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間與所述各個(gè)備選網(wǎng)頁(yè)請(qǐng)求生成時(shí)間之間的時(shí)間差,并在所述各個(gè)時(shí)間差中確定最小值;依據(jù)所述最小值,在所述各個(gè)備選網(wǎng)頁(yè)請(qǐng)求中確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0159]當(dāng)所述備選請(qǐng)求獲得子單元801確定出的所述備選網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),所述第四確定子單元803可以采用先到先關(guān)聯(lián)的機(jī)制,即將先接到的目標(biāo)網(wǎng)頁(yè)請(qǐng)求確定為該待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求(內(nèi)嵌對(duì)象請(qǐng)求)的目標(biāo)網(wǎng)頁(yè)請(qǐng)求(容器對(duì)象請(qǐng)求)。所述第四確定子單元803的確定過(guò)程是,計(jì)算接收到所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的時(shí)間與所述各個(gè)備選網(wǎng)頁(yè)請(qǐng)求之間的時(shí)間間隔,將間隔最短的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
[0160]由以上的技術(shù)方案可知,本實(shí)施例提供的一種網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)裝置,在多個(gè)客戶(hù)端使用的所述User-Agent字段相同時(shí),所述第四確定子單元803采用先到先關(guān)聯(lián)機(jī)制完成了目標(biāo)網(wǎng)頁(yè)請(qǐng)求的確定,進(jìn)一步提高了關(guān)聯(lián)方法的可靠性。
[0161]需要說(shuō)明的是,本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可。
[0162]以上對(duì)本發(fā)明所提供的一種網(wǎng)頁(yè)請(qǐng)求的關(guān)聯(lián)方法及裝置進(jìn)行了詳細(xì)介紹,對(duì)所公開(kāi)的實(shí)施例的上述說(shuō)明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專(zhuān)業(yè)技術(shù)人員來(lái)說(shuō)將是顯而易見(jiàn)的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開(kāi)的原理和新穎特點(diǎn)相一致的最寬的范圍。
【權(quán)利要求】
1.一種網(wǎng)頁(yè)請(qǐng)求的關(guān)聯(lián)方法,其特征在于,包括: 獲取待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求; 判斷所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段是否為空; 若是,依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求; 若否,依據(jù)所述referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求; 將所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)到所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,包括: 獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí); 在接收到的各個(gè)網(wǎng)頁(yè)請(qǐng)求中,查找TCP連接標(biāo)識(shí)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)相同且referer字段不為空的網(wǎng)頁(yè)請(qǐng)求; 當(dāng)查找到時(shí),依據(jù)查找到的所述網(wǎng)頁(yè)請(qǐng)求的referer字段,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求; 當(dāng)未查找到時(shí),獲取至少一個(gè)容器對(duì)象請(qǐng)求,在所述容器對(duì)象請(qǐng)求中,查找生成時(shí)間與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間間隔最短的容器對(duì)象請(qǐng)求,并將查找到的所述容器對(duì)象請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求?!?br> 3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求,包括: 獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段; 依據(jù)所述referer字段得到至少一個(gè)網(wǎng)頁(yè)請(qǐng)求; 在所述網(wǎng)頁(yè)請(qǐng)求為一個(gè)時(shí),依據(jù)查找到的所述網(wǎng)頁(yè)請(qǐng)求的referer字段,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求; 在所述網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),分別獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段及所述各個(gè)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段; 將User-Agent字段與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段相同的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將User-Agent字段與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段相同的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求,包括: 依據(jù)所述User-Agent字段得到至少一個(gè)備選網(wǎng)頁(yè)請(qǐng)求; 在所述備選網(wǎng)頁(yè)請(qǐng)求為一個(gè)時(shí),將所述備選網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求; 在所述備選網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),分別計(jì)算所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間與所述各個(gè)備選網(wǎng)頁(yè)請(qǐng)求生成時(shí)間之間的時(shí)間差,并在所述各個(gè)時(shí)間差中確定最小值;依據(jù)所述最小值,在所述各個(gè)備選網(wǎng)頁(yè)請(qǐng)求中確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
5.一種網(wǎng)頁(yè)請(qǐng)求的關(guān)聯(lián)裝置,其特征在于,包括: 獲取單元,用于獲取待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求; 判斷單元,用于判斷所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段是否為空;若是,觸發(fā)第一結(jié)果單元,若否,觸發(fā)第二結(jié)果單元; 第一結(jié)果單元,用于依據(jù)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求處于同一 TCP連接上的網(wǎng)頁(yè)請(qǐng)求,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求;第二結(jié)果單元,用于依據(jù)所述referer字段確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求; 關(guān)聯(lián)單元,用于將所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求關(guān)聯(lián)到所述目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述第一結(jié)果單元包括: 獲取子單元,用于獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí); 查找子單元,用于在接收到的各個(gè)網(wǎng)頁(yè)請(qǐng)求中,查找TCP連接標(biāo)識(shí)與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的TCP連接標(biāo)識(shí)相同且referer字段不為空的網(wǎng)頁(yè)請(qǐng)求;當(dāng)查找到時(shí),觸發(fā)第一結(jié)果子單元,當(dāng)未查找到時(shí),觸發(fā)第二結(jié)果子單元; 第一結(jié)果子單元,用于依據(jù)查找到的所述網(wǎng)頁(yè)請(qǐng)求的referer字段,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求; 第二結(jié)果子單元,用于獲取至少一個(gè)容器對(duì)象請(qǐng)求,在所述容器對(duì)象請(qǐng)求中,查找生成時(shí)間與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間間隔最短的容器對(duì)象請(qǐng)求,并將查找到的所述容器對(duì)象請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
7.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述第二結(jié)果單元包括: 第一字段獲取子單元,用于獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的referer字段; 請(qǐng)求獲得子單元,用于依據(jù)所述referer字段得到至少一個(gè)網(wǎng)頁(yè)請(qǐng)求;在所述網(wǎng)頁(yè)請(qǐng)求為一個(gè)時(shí),觸發(fā)第一確定單元;在所述網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),觸發(fā)第二字段獲取子單元;第一確定子單元,用于依據(jù)查找到的所述網(wǎng)頁(yè)請(qǐng)求的referer字段,確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求; 第二字段獲取子單元,用于分別`獲取所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段及所述各個(gè)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段,觸發(fā)第二確定子單元; 第二確定子單元,用于將User-Agent字段與所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的User-Agent字段相同的網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述第二確定子單元包括: 備選請(qǐng)求獲得子單元,用于依據(jù)所述User-Agent字段得到至少一個(gè)備選網(wǎng)頁(yè)請(qǐng)求;在所述備選網(wǎng)頁(yè)請(qǐng)求為一個(gè)時(shí),觸發(fā)第三確定子單元,在所述備選網(wǎng)頁(yè)請(qǐng)求為多個(gè)時(shí),觸發(fā)第四確定子單元; 第三確定子單元,用于將所述備選網(wǎng)頁(yè)請(qǐng)求確定為目標(biāo)網(wǎng)頁(yè)請(qǐng)求; 第四確定子單元,用于分別計(jì)算所述待關(guān)聯(lián)網(wǎng)頁(yè)請(qǐng)求的生成時(shí)間與所述各個(gè)備選網(wǎng)頁(yè)請(qǐng)求生成時(shí)間之間的時(shí)間差,并在所述各個(gè)時(shí)間差中確定最小值;依據(jù)所述最小值,在所述各個(gè)備選網(wǎng)頁(yè)請(qǐng)求中確定目標(biāo)網(wǎng)頁(yè)請(qǐng)求。
【文檔編號(hào)】G06F17/30GK103714182SQ201410012342
【公開(kāi)日】2014年4月9日 申請(qǐng)日期:2014年1月10日 優(yōu)先權(quán)日:2014年1月10日
【發(fā)明者】徐翔, 張廣興 申請(qǐng)人:湖南神州祥網(wǎng)科技有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1