第二類采集數(shù)據(jù),所述第二類采集數(shù)據(jù)包括:所述頁(yè)面的標(biāo)識(shí)信息、所述頁(yè)面加載時(shí)生成的時(shí)間戳以及第二采集數(shù)據(jù)。在本發(fā)明的一些實(shí)施方式中,通過(guò)Java腳本采集數(shù)據(jù)的流程可以如圖3所不O
[0045]本發(fā)明實(shí)施方式中通過(guò)Java腳本采集的第二類采集數(shù)據(jù)可包括:用戶的訪問(wèn)請(qǐng)求所訪問(wèn)的頁(yè)面的標(biāo)識(shí)信息、該頁(yè)面加載時(shí)生成的時(shí)間戳以及第二采集信息。用戶所訪問(wèn)的頁(yè)面的標(biāo)識(shí)信息可包括URL,也可以是其他能夠唯一標(biāo)識(shí)該頁(yè)面的一個(gè)標(biāo)識(shí)信息或多個(gè)標(biāo)識(shí)信息組合。在本發(fā)明的一些實(shí)施方式中,該頁(yè)面的標(biāo)識(shí)信息為URL。頁(yè)面加載時(shí)生成的時(shí)間戳是每次頁(yè)面加載時(shí)均生成的時(shí)間戳,保存在頁(yè)面的cookie中,并且精確度可達(dá)到10—9秒級(jí)別。在其他實(shí)施方式中,根據(jù)所匹配的精確度需要的不同等因素,還可采用其他精確度的時(shí)間戳,例如,精確度在I O—1秒、10—2秒、10—3秒、10—4秒、10—5秒、10—6秒、10—7秒、10—8秒、10—1(3秒、10—11秒等時(shí)間戳。第二采集數(shù)據(jù)根據(jù)所訪問(wèn)的網(wǎng)站頁(yè)面的類型以及相應(yīng)的數(shù)據(jù)分析的目的而不同,例如,對(duì)于電商網(wǎng)站而言,第二采集數(shù)據(jù)可包括下述的一種或多種(例如,大于或等于2種):會(huì)話ID(sess1nlD)、用戶代理(UserAgent)、Flash版本、Cookie、屏幕參數(shù)和頁(yè)面停留時(shí)間等。
[0046]整合模塊43對(duì)第一采集模塊41采集的第一類采集數(shù)據(jù)和對(duì)第二采集模塊42采集的第二類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳對(duì)所述第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)進(jìn)行匹配以得到所述用戶的行為數(shù)據(jù)。具體而言,根據(jù)上述采集到的第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳對(duì)所述第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)進(jìn)行匹配可包括:將所述第一類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳與所述第二類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳進(jìn)行比對(duì),若比對(duì)一致,也就是說(shuō),第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳均相同,則將所述第一類采集數(shù)據(jù)和所述第二類采集數(shù)據(jù)合并作為所述用戶在所述頁(yè)面上所述時(shí)間戳對(duì)應(yīng)時(shí)刻的行為數(shù)據(jù)。若比對(duì)不一致,也就是說(shuō),第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳是不同的,則不對(duì)數(shù)據(jù)進(jìn)行合并處理。
[0047]本發(fā)明實(shí)施方式通過(guò)將不同方式采集的兩類用戶關(guān)聯(lián)數(shù)據(jù)基于頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳進(jìn)行整合,與現(xiàn)有的僅通過(guò)一種方式采集用戶關(guān)聯(lián)數(shù)據(jù)的方案相比,可擴(kuò)展用戶行為數(shù)據(jù)采集的方式,同時(shí)也可改善用戶行為數(shù)據(jù)采集的全面度。
[0048]通過(guò)以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件結(jié)合硬件平臺(tái)的方式來(lái)實(shí)現(xiàn)。基于這樣的理解,本發(fā)明的技術(shù)方案對(duì)【背景技術(shù)】做出貢獻(xiàn)的全部或者部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在存儲(chǔ)介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,智能手機(jī)或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。
[0049]本發(fā)明說(shuō)明書(shū)中使用的術(shù)語(yǔ)和措辭僅僅為了舉例說(shuō)明,并不意味構(gòu)成限定。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,在不脫離所公開(kāi)的實(shí)施方式的基本原理的前提下,對(duì)上述實(shí)施方式中的各細(xì)節(jié)可進(jìn)行各種變化。因此,本發(fā)明的范圍只由權(quán)利要求確定,在權(quán)利要求中,除非另有說(shuō)明,所有的術(shù)語(yǔ)應(yīng)按最寬泛合理的意思進(jìn)行理解。
【主權(quán)項(xiàng)】
1.一種用戶行為數(shù)據(jù)采集方法,其特征在于,所述方法包括: 通過(guò)Apache進(jìn)程記錄用戶對(duì)頁(yè)面的訪問(wèn)請(qǐng)求關(guān)聯(lián)的第一類采集數(shù)據(jù),所述第一類采集數(shù)據(jù)包括:所述頁(yè)面的標(biāo)識(shí)信息、所述頁(yè)面加載時(shí)生成的時(shí)間戳以及第一采集數(shù)據(jù); 通過(guò)Java腳本采集所述用戶對(duì)頁(yè)面的訪問(wèn)請(qǐng)求關(guān)聯(lián)的第二類采集數(shù)據(jù),所述第二類采集數(shù)據(jù)包括:所述頁(yè)面的標(biāo)識(shí)信息、所述頁(yè)面加載時(shí)生成的時(shí)間戳以及第二采集數(shù)據(jù); 根據(jù)所述第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳對(duì)所述第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)進(jìn)行匹配以得到所述用戶的行為數(shù)據(jù)。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述頁(yè)面的標(biāo)識(shí)信息包括統(tǒng)一資源定位符URL03.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述頁(yè)面加載時(shí)生成的時(shí)間戳保存在頁(yè)面的cookie中。4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其特征在于,所述第一采集數(shù)據(jù)包括下述的一種或多種= HTTP狀態(tài)碼、站內(nèi)搜索關(guān)鍵詞、瀏覽的商品和加入購(gòu)物車的商品。5.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其特征在于,所述第二采集數(shù)據(jù)包括下述的一種或多種:會(huì)話ID、用戶代理、Flash版本、cookie、屏幕參數(shù)和頁(yè)面停留時(shí)間。6.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳對(duì)所述第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)進(jìn)行匹配包括: 將所述第一類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳與所述第二類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳進(jìn)行比對(duì),若比對(duì)一致,則將所述第一類采集數(shù)據(jù)和所述第二類采集數(shù)據(jù)合并作為所述用戶在所述頁(yè)面上所述時(shí)間戳對(duì)應(yīng)時(shí)刻的行為數(shù)據(jù)。7.一種用戶行為數(shù)據(jù)采集系統(tǒng),其特征在于,所述系統(tǒng)包括: 第一采集模塊,用于通過(guò)Apache進(jìn)程記錄用戶對(duì)頁(yè)面的訪問(wèn)請(qǐng)求關(guān)聯(lián)的第一類采集數(shù)據(jù),所述第一類采集數(shù)據(jù)包括:所述頁(yè)面的標(biāo)識(shí)信息、所述頁(yè)面加載時(shí)生成的時(shí)間戳以及第一采集數(shù)據(jù); 第二采集模塊,通過(guò)Java腳本采集所述用戶對(duì)頁(yè)面的訪問(wèn)請(qǐng)求關(guān)聯(lián)的第二類采集數(shù)據(jù),所述第二類采集數(shù)據(jù)包括:所述頁(yè)面的標(biāo)識(shí)信息、所述頁(yè)面加載時(shí)生成的時(shí)間戳以及第二采集數(shù)據(jù); 整合模塊,用于根據(jù)所述第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳對(duì)所述第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)進(jìn)行匹配以得到所述用戶的行為數(shù)據(jù)。8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述頁(yè)面的標(biāo)識(shí)信息包括統(tǒng)一資源定位符URL09.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述頁(yè)面加載時(shí)生成的時(shí)間戳保存在頁(yè)面的cookie中。10.根據(jù)權(quán)利要求7至9中任一項(xiàng)所述的系統(tǒng),其特征在于,所述第一采集數(shù)據(jù)包括下述的一種或多種= HTTP狀態(tài)碼、站內(nèi)搜索關(guān)鍵詞、瀏覽的商品和加入購(gòu)物車的商品。11.根據(jù)權(quán)利要求7至9中任一項(xiàng)所述的系統(tǒng),其特征在于,所述第二采集數(shù)據(jù)包括下述的一種或多種:會(huì)話ID、用戶代理、Flash版本、cookie、屏幕參數(shù)和頁(yè)面停留時(shí)間。12.根據(jù)權(quán)利要求7至9中任一項(xiàng)所述的系統(tǒng),其特征在于,所述整合模塊根據(jù)所述第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳對(duì)所述第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)進(jìn)行匹配包括:將所述第一類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳與所述第二類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳進(jìn)行比對(duì),若比對(duì)一致,則將所述第一類采集數(shù)據(jù)和所述第二類采集數(shù)據(jù)合并作為所述用戶在所述頁(yè)面上所述時(shí)間戳對(duì)應(yīng)時(shí)刻的行為數(shù)據(jù)。
【專利摘要】本發(fā)明提供了用戶行為數(shù)據(jù)采集方法和系統(tǒng)。該方法包括:通過(guò)Apache進(jìn)程記錄用戶對(duì)頁(yè)面的訪問(wèn)請(qǐng)求關(guān)聯(lián)的第一類采集數(shù)據(jù),所述第一類采集數(shù)據(jù)包括:所述頁(yè)面的標(biāo)識(shí)信息、所述頁(yè)面加載時(shí)生成的時(shí)間戳以及第一采集數(shù)據(jù);通過(guò)Java腳本采集所述用戶對(duì)頁(yè)面的訪問(wèn)請(qǐng)求關(guān)聯(lián)的第二類采集數(shù)據(jù),所述第二類采集數(shù)據(jù)包括:所述頁(yè)面的標(biāo)識(shí)信息、所述頁(yè)面加載時(shí)生成的時(shí)間戳以及第二采集數(shù)據(jù);根據(jù)所述第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)中的頁(yè)面的標(biāo)識(shí)信息和時(shí)間戳對(duì)所述第一類采集數(shù)據(jù)和第二類采集數(shù)據(jù)進(jìn)行匹配以得到所述用戶的行為數(shù)據(jù)。根據(jù)本發(fā)明,可擴(kuò)展用戶行為數(shù)據(jù)采集的方式,改善用戶行為數(shù)據(jù)采集的全面性。
【IPC分類】H04L29/08
【公開(kāi)號(hào)】CN105721578
【申請(qǐng)?zhí)枴緾N201610089688
【發(fā)明人】王偉, 謝瀟宇, 趙金鑫, 張舜華, 何小鋒, 廖繼逢, 胡宗維, 王明龍, 盧穎輝, 汪楠
【申請(qǐng)人】中國(guó)建設(shè)銀行股份有限公司
【公開(kāi)日】2016年6月29日
【申請(qǐng)日】2016年2月17日