一種標(biāo)識(shí)互聯(lián)網(wǎng)用戶的方法,及裝置制造方法
【專利摘要】本發(fā)明實(shí)施例公開了一種標(biāo)識(shí)互聯(lián)網(wǎng)用戶的方法,及裝置,其中方法包括:獲取第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為;上述第一類用戶識(shí)別為場(chǎng)景類用戶身份識(shí)別,第二類為用戶告知的用戶身份識(shí)別;若第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限,則標(biāo)識(shí)上述第一類用戶識(shí)別與第二類用戶識(shí)別所對(duì)應(yīng)的用戶為同一用戶?;谝陨戏桨福鲜龅谝活愑脩糇R(shí)別,可以保證用戶標(biāo)識(shí)的比例,第二類用戶識(shí)別則可以保證用戶標(biāo)識(shí)的有效性和穩(wěn)定性,通過用戶行為的關(guān)聯(lián)性來確定是否是同一用戶,若確定是同一用戶則可以統(tǒng)一標(biāo)識(shí),在保證覆蓋范圍的前提下提升用戶身份標(biāo)識(shí)的成功率和有效性。
【專利說明】—種標(biāo)識(shí)互聯(lián)網(wǎng)用戶的方法,及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信【技術(shù)領(lǐng)域】,特別涉及一種標(biāo)識(shí)互聯(lián)網(wǎng)用戶的方法,及裝置。
【背景技術(shù)】
[0002]用戶行為分析在互聯(lián)網(wǎng)行業(yè)內(nèi)有諸多應(yīng)用,例如:個(gè)性化搜索、推薦系統(tǒng)、廣告系統(tǒng)等。這些應(yīng)用的實(shí)現(xiàn)一般需要對(duì)用戶歷史行為數(shù)據(jù)進(jìn)行分別分析和建模,從而需要對(duì)用戶身份進(jìn)行標(biāo)識(shí),以區(qū)分不同的用戶。
[0003]由于每個(gè)用戶具有不同的用戶身份標(biāo)識(shí),因此可以通過用戶身份標(biāo)識(shí)來區(qū)別不同的用戶,目前的用戶身份標(biāo)識(shí)方案一般可以有如下幾種:
[0004]登錄賬號(hào):用戶訪問網(wǎng)站時(shí)需要注冊(cè)并登陸賬號(hào),網(wǎng)站可以使用賬號(hào)來標(biāo)識(shí)用戶。[0005]第三方賬號(hào):與登錄賬號(hào)類似,只是網(wǎng)站通過OAuth (為用戶資源的授權(quán)提供了一個(gè)安全、開放且簡(jiǎn)易的標(biāo)準(zhǔn)協(xié)議)等認(rèn)證方式,讓用戶可以用第三方網(wǎng)站的賬號(hào)進(jìn)行登陸,省去了注冊(cè)新賬號(hào)的步驟。網(wǎng)站可以通過第三方賬號(hào)來標(biāo)識(shí)用戶。
[0006]瀏覽器cookie (臨時(shí)文件,是儲(chǔ)存在用戶本地終端上的一種數(shù)據(jù)):網(wǎng)站通過網(wǎng)頁(yè)代碼,讓瀏覽器在cookie中記錄一個(gè)標(biāo)識(shí)號(hào)(不妨稱為C00kie_id),以后每次訪問網(wǎng)站時(shí),該C00kie_id會(huì)被傳回服務(wù)器,服務(wù)器可以通過C00kie_id來標(biāo)識(shí)用戶。
[0007]程序內(nèi)部標(biāo)識(shí):與瀏覽器cookie類似,目前的一些客戶端軟件(如瀏覽器)會(huì)生成一個(gè)程序內(nèi)部標(biāo)識(shí),當(dāng)客戶端上報(bào)一些數(shù)據(jù)時(shí),會(huì)把該標(biāo)識(shí)附加在數(shù)據(jù)中,服務(wù)器可以使用該程序內(nèi)部標(biāo)識(shí)來標(biāo)識(shí)用戶。
[0008]其他標(biāo)識(shí):如IP(Internet Protocol,互聯(lián)網(wǎng)協(xié)議)地址,客戶端軟件版本等信息。本領(lǐng)域技術(shù)人員可以理解的是:只要是在網(wǎng)絡(luò)中唯一確定用戶身份的標(biāo)識(shí)都可以用來進(jìn)行用戶身份標(biāo)識(shí),本申請(qǐng)文件對(duì)于可能的用戶身份標(biāo)識(shí)的具體表現(xiàn)形式無(wú)法窮舉,因此以上舉例也不應(yīng)理解為本申請(qǐng)文件中所稱的用戶身份標(biāo)識(shí)的窮舉。
[0009]發(fā)明人在實(shí)現(xiàn)本發(fā)明實(shí)施例的過程中發(fā)現(xiàn):以上方案可以大致歸為兩類,一類是需要用戶告知身份標(biāo)識(shí)的方案如:登錄賬號(hào)、第三方賬號(hào)這類;由于需要用戶告知身份導(dǎo)致其覆蓋范圍較小。另一類是不需要用戶告知身份標(biāo)識(shí)的方案,該類方案以場(chǎng)景信息來區(qū)分用戶,例如:程序版本標(biāo)識(shí)、cookie_id, IP地址等,該類方案在場(chǎng)景發(fā)生改變或者多用戶相同場(chǎng)景時(shí)無(wú)法區(qū)分用戶,致使用戶身份標(biāo)識(shí)失敗,因此用戶身份標(biāo)識(shí)也是無(wú)效的。
【發(fā)明內(nèi)容】
[0010]本發(fā)明實(shí)施例提供了一種標(biāo)識(shí)互聯(lián)網(wǎng)用戶的方法,及裝置,在保證覆蓋范圍的前提下提升用戶身份標(biāo)識(shí)的成功率和有效性。
[0011]一種標(biāo)識(shí)互聯(lián)網(wǎng)用戶的方法,包括:
[0012]獲取第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為;上述第一類用戶識(shí)別為場(chǎng)景類用戶身份識(shí)別,第二類為用戶告知的用戶身份識(shí)別;
[0013]若第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限,則標(biāo)識(shí)上述第一類用戶識(shí)別與第二類用戶識(shí)別所對(duì)應(yīng)的用戶為同一用戶。
[0014]一種標(biāo)識(shí)互聯(lián)網(wǎng)用戶的裝置,包括:
[0015]行為獲取單元,用于獲取第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為;上述第一類用戶識(shí)別為場(chǎng)景類用戶身份識(shí)別,第二類為用戶告知的用戶身份識(shí)別;
[0016]關(guān)聯(lián)性確定單元,用于確定行為獲取單元獲取的第一用戶行為與第二用戶行為的關(guān)聯(lián)性是否達(dá)到預(yù)定門限;
[0017]標(biāo)識(shí)單元,用于若關(guān)聯(lián)性確定單元確定第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限,則標(biāo)識(shí)上述第一類用戶識(shí)別與第二類用戶識(shí)別所對(duì)應(yīng)的用戶為同一用戶。
[0018]從以上技術(shù)方案可以看出,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn):基于以上方案,上述第一類用戶識(shí)別,可以保證用戶標(biāo)識(shí)的比例,第二類用戶識(shí)別則可以保證用戶標(biāo)識(shí)的有效性和穩(wěn)定性,通過用戶行為的關(guān)聯(lián)性來確定是否是同一用戶,若確定是同一用戶則可以統(tǒng)一標(biāo)識(shí),在保證覆蓋范圍的前提下提升用戶身份標(biāo)識(shí)的成功率和有效性。
【專利附圖】
【附圖說明】
[0019]為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)要介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域的普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0020]圖1本發(fā)明實(shí)施例方法流程示意圖;
[0021]圖2為本發(fā)明實(shí)施例裝置結(jié)構(gòu)示意圖;
[0022]圖3為本發(fā)明實(shí)施例裝置結(jié)構(gòu)示意圖;
[0023]圖4為本發(fā)明實(shí)施例裝置結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0024]為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步地詳細(xì)描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部份實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0025]本發(fā)明實(shí)施例提供了一種標(biāo)識(shí)互聯(lián)網(wǎng)用戶的方法,如圖1所示,包括:
[0026]101:獲取第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為;上述第一類用戶識(shí)別為場(chǎng)景類用戶身份識(shí)別,第二類為用戶告知的用戶身份識(shí)別;
[0027]更具體地,上述第一類用戶識(shí)別包括:登錄賬號(hào)或第三方賬號(hào)。
[0028]更具體地,上述第二類用戶識(shí)別包括:瀏覽器臨時(shí)文件、程序內(nèi)部標(biāo)識(shí)、互聯(lián)網(wǎng)協(xié)議、客戶端軟件版本中的任意一項(xiàng)或者多項(xiàng)。
[0029]本領(lǐng)域技術(shù)人員可以理解的是:只要是在網(wǎng)絡(luò)中唯一確定用戶身份的標(biāo)識(shí)都可以用來進(jìn)行用戶身份標(biāo)識(shí),本申請(qǐng)文件對(duì)于可能的用戶身份標(biāo)識(shí)的具體表現(xiàn)形式無(wú)法窮舉,因此以上舉例也不應(yīng)理解為本申請(qǐng)文件中所稱的用戶身份標(biāo)識(shí)的窮舉。上述第一類用戶識(shí)另IJ,可以保證用戶標(biāo)識(shí)的比例,第二類用戶識(shí)別則可以保證用戶標(biāo)識(shí)的有效性和穩(wěn)定性。后續(xù)實(shí)施例將分別以cookiejd和即使通信軟件賬號(hào)為例進(jìn)行說明。
[0030]102:若第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限,則標(biāo)識(shí)上述第一類用戶識(shí)別與第二類用戶識(shí)別所對(duì)應(yīng)的用戶為同一用戶。
[0031]上述門限的門限值越高,則身份標(biāo)識(shí)的成功率和有效性越高,門限值越低則覆蓋范圍越高,以上門限值可以依據(jù)成功率和有效性以及覆蓋范圍的不同需求進(jìn)行靈活設(shè)置,具體的設(shè)置值本發(fā)明實(shí)施例不予限定。
[0032]基于以上方案,上述第一類用戶識(shí)別,可以保證用戶標(biāo)識(shí)的比例,第二類用戶識(shí)別則可以保證用戶標(biāo)識(shí)的有效性和穩(wěn)定性,通過用戶行為的關(guān)聯(lián)性來確定是否是同一用戶,若確定是同一用戶則可以統(tǒng)一標(biāo)識(shí),在保證覆蓋范圍的前提下提升用戶身份標(biāo)識(shí)的成功率和有效性。用戶識(shí)別并標(biāo)識(shí)以后,可以為標(biāo)識(shí)用戶后續(xù)可能的信息收集、分類整理、使用等應(yīng)用提供支持。后續(xù)的使用方案非常多,本發(fā)明實(shí)施例對(duì)此無(wú)法窮舉,以上可能的舉例不應(yīng)理解為對(duì)本發(fā)明實(shí)施例的限定。
[0033]可選地,本發(fā)明實(shí)施例給提供了新的用戶識(shí)別的組成方案,具體如下:上述標(biāo)識(shí)上述第一類用戶識(shí)別與第二類用戶識(shí)別所對(duì)應(yīng)的用戶為同一用戶包括:使用包含上述第一類用戶識(shí)別和第二類用戶識(shí)別的第三用戶識(shí)別作為用戶的用戶識(shí)別。
[0034]可選地,本發(fā)明實(shí)施例給出了如何構(gòu)造新的用戶識(shí)別的方案,具體地:上述使用包含上述第一類用戶識(shí)別和第二類用戶識(shí)別的第三用戶識(shí)別作為用戶的用戶識(shí)別包括:
[0035]將結(jié)構(gòu)化數(shù)據(jù)序列化技術(shù)(Protocol buffers)和或軟件框架技術(shù)(thrift)使用包含上述第一類用戶識(shí)別和第二類用戶識(shí)別的第三用戶識(shí)別作為用戶的用戶識(shí)別。
[0036]進(jìn)一步地,本發(fā)明實(shí)施例還提供了獲取的用戶行為的存儲(chǔ)以及分析方案舉例,具體地:在獲取第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為之后還包括:
[0037]將獲取的第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為記錄在日志文件中;
[0038]上述第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限包括:
[0039]對(duì)上述日志文件中的第一用戶行為和第二用戶行為進(jìn)行匹配得到第一用戶行為與第二用戶行為的關(guān)聯(lián)性,然后確定上述第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限。
[0040]進(jìn)一步地,本發(fā)明實(shí)施例還提供了上述第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限的可選實(shí)現(xiàn)方案,具體包括:上述第一用戶行為與第二用戶行為相同的比率達(dá)到預(yù)定門限,或者,上述第一用戶行為與第二用戶行為相似率達(dá)到預(yù)定門限。
[0041]進(jìn)一步地,本發(fā)明實(shí)施例還給出了標(biāo)識(shí)用戶以后的一個(gè)可選實(shí)現(xiàn)方案,具體地:上述標(biāo)識(shí)上述第一類用戶識(shí)別與第二類用戶識(shí)別所對(duì)應(yīng)的用戶為同一用戶后,還包括:將上述用戶的第一用戶行為和第二用戶行為作為整體進(jìn)行行為分析和建模,得到上述用戶的用戶行為習(xí)慣類數(shù)據(jù)。用戶行為習(xí)慣類數(shù)據(jù)可以體現(xiàn)用戶的習(xí)慣、興趣點(diǎn)等信息,這樣在服務(wù)器為其提供服務(wù)或推薦服務(wù)過程中,可以發(fā)送更加具有針對(duì)性的數(shù)據(jù),提升服務(wù)器發(fā)送的數(shù)據(jù)與用戶的契合度。
[0042] 本發(fā)明實(shí)施例給出了以C00kie_id和即使通信軟件賬號(hào)為例對(duì)以上方法實(shí)施例進(jìn)行更詳細(xì)的舉例說明,具體如下:[0043]為了提高用戶身份標(biāo)識(shí)比例,同時(shí)保證用戶身份標(biāo)識(shí)的有效性,可以綜兩類用戶識(shí)別方案:第一類用戶識(shí)別以及第二類用戶識(shí)別;上述第一類用戶識(shí)別為場(chǎng)景類用戶身份識(shí)別,第二類為用戶告知的用戶身份識(shí)別;場(chǎng)景類用戶身份識(shí)別以cookiejd為例,用戶告知的用戶身份識(shí)別以即時(shí)通信軟件賬號(hào)為例,主要分為如下幾個(gè)方面:
[0044]1、信息的收集:
[0045]對(duì)于第一類用戶識(shí)別,可以在運(yùn)營(yíng)商的系統(tǒng)中(例如搜索廣告平臺(tái)部情境廣告系統(tǒng)),對(duì)于所有網(wǎng)絡(luò)訪問流量都會(huì)用cookiejd進(jìn)行標(biāo)識(shí),這樣就保證了標(biāo)識(shí)比例。同時(shí),對(duì)于第二類用戶識(shí)別,如果用戶以登陸狀態(tài)訪問網(wǎng)站所屬域名下的站點(diǎn),那么這一次訪問記錄中會(huì)同時(shí)也記下用戶的即時(shí)通信軟件賬號(hào)。[0046]2、信息的分析:
[0047]在服務(wù)器端,可以將用戶訪問日志都記錄下來,然后通過分析日志,可能會(huì)發(fā)現(xiàn)某個(gè)cookiejd和某個(gè)即時(shí)通信軟件賬號(hào)共同出現(xiàn)在同一條訪問記錄中(即“共現(xiàn)”),這說明該cookiejd和即時(shí)通信軟件賬號(hào)對(duì)應(yīng)的用戶可能是同一個(gè)人,這種共同出現(xiàn)次數(shù)越頻繁,說明關(guān)聯(lián)性越強(qiáng),是同一個(gè)用戶的可能性越大。
[0048]經(jīng)過上述的“共現(xiàn)”分析,可以建立起cookiejd和即時(shí)通信軟件賬號(hào)的對(duì)應(yīng)表,這提供了幾個(gè)好處:1)即使有時(shí)用戶不是以登陸狀態(tài)訪問網(wǎng)站,也可以利用cookiejd定位到具體用戶;2)對(duì)于同一個(gè)用戶在不同場(chǎng)景(例如使用多臺(tái)不同的電腦)下使用的情況,可以發(fā)現(xiàn)多個(gè)cookiejd是對(duì)應(yīng)到同一個(gè)賬號(hào)的,因此這種情況下也能使得這種標(biāo)識(shí)方案不失效。
[0049]3、身份標(biāo)識(shí):
[0050]為了在服務(wù)器端分析和后續(xù)生成模型時(shí)能夠較好的融合這兩種標(biāo)識(shí),可以利用一種開源的技術(shù)"Protocol Buffers",該技術(shù)可以將自定義的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行編碼,編碼后的結(jié)果可以看作一個(gè)簡(jiǎn)單的字符串,并且該結(jié)構(gòu)定義有較好的可擴(kuò)展性。
[0051]更具體地,可以定義了一種結(jié)構(gòu)代表新的用戶標(biāo)識(shí),該結(jié)構(gòu)中包括多個(gè)字段,其中有cookie_id、賬號(hào)、第三方網(wǎng)站id以及在第三方網(wǎng)站上的cookie_id等等信息。這些字段也可以隨著實(shí)際情況進(jìn)行增刪。該標(biāo)識(shí)經(jīng)過編碼之后的字符串,就作為臺(tái)系統(tǒng)中統(tǒng)一的用戶標(biāo)識(shí),它融合了上述的各種標(biāo)識(shí)。
[0052]需要說明的是,"Protocol Buffers"還可以使用類似功能的開源庫(kù)thrift等來實(shí)現(xiàn),具體的可選實(shí)現(xiàn)方案本發(fā)明實(shí)施例不予限定。另需要說明的是,用戶標(biāo)識(shí)可以是上述方案中提到的cookiejd、賬號(hào)、IP地址、客戶端軟件版本等信息,本領(lǐng)域技術(shù)人員可以理解的是用戶標(biāo)識(shí)是用于區(qū)分各個(gè)用戶的,其表現(xiàn)形式種類繁多,以上舉例不應(yīng)理解為對(duì)本發(fā)明實(shí)施例的窮舉,因此不應(yīng)理解為對(duì)本發(fā)明實(shí)施例的限定。
[0053]本發(fā)明實(shí)施例還提供了一種標(biāo)識(shí)互聯(lián)網(wǎng)用戶的裝置,如圖2所示,包括:
[0054]行為獲取單元201,用于獲取第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為;上述第一類用戶識(shí)別為場(chǎng)景類用戶身份識(shí)別,第二類為用戶告知的用戶身份識(shí)別;
[0055]關(guān)聯(lián)性確定單元202,用于確定行為獲取單元201獲取的第一用戶行為與第二用戶行為的關(guān)聯(lián)性是否達(dá)到預(yù)定門限;
[0056]標(biāo)識(shí)單元203,用于若關(guān)聯(lián)性確定單元202確定第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限,則標(biāo)識(shí)上述第一類用戶識(shí)別與第二類用戶識(shí)別所對(duì)應(yīng)的用戶為同一用戶。
[0057]基于以上方案,上述第一類用戶識(shí)別,可以保證用戶標(biāo)識(shí)的比例,第二類用戶識(shí)別則可以保證用戶標(biāo)識(shí)的有效性和穩(wěn)定性,通過用戶行為的關(guān)聯(lián)性來確定是否是同一用戶,若確定是同一用戶則可以統(tǒng)一標(biāo)識(shí),在保證覆蓋范圍的前提下提升用戶身份標(biāo)識(shí)的成功率和有效性。用戶識(shí)別并標(biāo)識(shí)以后,可以為標(biāo)識(shí)用戶后續(xù)可能的信息收集、分類整理、使用等應(yīng)用提供支持。后續(xù)的使用方案非常多,本發(fā)明實(shí)施例對(duì)此無(wú)法窮舉,以上可能的舉例不應(yīng)理解為對(duì)本發(fā)明實(shí)施例的限定。
[0058]可選地,本發(fā)明實(shí)施例給提供了新的用戶識(shí)別的組成方案,具體如下:上述標(biāo)識(shí)單元203,具體用于使用包含上述第一類用戶識(shí)別和第二類用戶識(shí)別的第三用戶識(shí)別作為用戶的用戶識(shí)別。
[0059]可選地,本發(fā)明實(shí)施例給出了如何構(gòu)造新的用戶識(shí)別的方案,具體地:上述標(biāo)識(shí)單元203,具體用于將結(jié)構(gòu)化數(shù)據(jù)序列化技術(shù)和或軟件框架技術(shù)使用包含上述第一類用戶識(shí)別和第二類用戶識(shí)別的第三用戶識(shí)別作為用戶的用戶識(shí)別。
[0060]進(jìn)一步地,本發(fā)明實(shí)施例還提供了獲取的用戶行為的存儲(chǔ)以及分析方案舉例,具體地:如圖3所示,上述裝置還包括:
[0061]記錄單元301,用于在行為獲取單元201獲取第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為之后,將行為獲取單元201獲取的第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為記錄在日志文件中;
[0062]上述關(guān)聯(lián)性確定單元202,具體用于對(duì)上述日志文件中的第一用戶行為和第二用戶行為進(jìn)行匹配得到第一用戶行為與第二用戶行為的關(guān)聯(lián)性,然后確定上述第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限。
[0063]可選地,上述關(guān)聯(lián)性確定單元202,用于確定第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限包括:確定上述第一用戶行為與第二用戶行為相同的比率達(dá)到預(yù)定門限,或者,確定上述第一用戶行為與第二用戶行為相似率達(dá)到預(yù)定門限。
[0064]進(jìn)一步地,本發(fā)明實(shí)施例還給出了標(biāo)識(shí)用戶以后的一個(gè)可選實(shí)現(xiàn)方案,具體地:如圖4所示,上述裝置還包括:
[0065]分析建模單元401,用于在上述標(biāo)識(shí)單元203標(biāo)識(shí)上述第一類用戶識(shí)別與第二類用戶識(shí)別所對(duì)應(yīng)的用戶為同一用戶后,將上述用戶的第一用戶行為和第二用戶行為作為整體進(jìn)行行為分析和建模,得到上述用戶的用戶行為習(xí)慣類數(shù)據(jù)。
[0066]值得注意的是,上述裝置實(shí)施例中,所包括的各個(gè)單元只是按照功能邏輯進(jìn)行劃分的,但并不局限于上述的劃分,只要能夠?qū)崿F(xiàn)相應(yīng)的功能即可;另外,各功能單元的具體名稱也只是為了便于相互區(qū)分,并不用于限制本發(fā)明的保護(hù)范圍。
[0067]另外,本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述各方法實(shí)施例中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,相應(yīng)的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。
[0068]以上僅為本發(fā)明較佳的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本【技術(shù)領(lǐng)域】的技術(shù)人員在本發(fā) 明實(shí)施例揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
【權(quán)利要求】
1.一種標(biāo)識(shí)互聯(lián)網(wǎng)用戶的方法,其特征在于,包括: 獲取第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為;所述第一類用戶識(shí)別為場(chǎng)景類用戶身份識(shí)別,第二類為用戶告知的用戶身份識(shí)別; 若第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限,則標(biāo)識(shí)所述第一類用戶識(shí)別與第二類用戶識(shí)別所對(duì)應(yīng)的用戶為同一用戶。
2.根據(jù)權(quán)利要求1所述方法,其特征在于,所述標(biāo)識(shí)所述第一類用戶識(shí)別與第二類用戶識(shí)別所對(duì)應(yīng)的用戶為同一用戶包括: 使用包含所述第一類用戶識(shí)別和第二類用戶識(shí)別的第三用戶識(shí)別作為用戶的用戶識(shí)別。
3.根據(jù)權(quán)利要求2所述方法,其特征在于,所述使用包含所述第一類用戶識(shí)別和第二類用戶識(shí)別的第三用戶識(shí)別作為用戶的用戶識(shí)別包括: 將結(jié)構(gòu)化數(shù)據(jù)序列化技術(shù)和或軟件框架技術(shù)使用包含所述第一類用戶識(shí)別和第二類用戶識(shí)別的第三用戶識(shí)別作為用戶的用戶識(shí)別。
4.根據(jù)權(quán)利要求1所述方法,其特征在于,在獲取第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為之后還包括: 將獲取的第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為記錄在日志文件中; 所述第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限包括: 對(duì)所述日志文件中的第一用戶行為和第二用戶行為進(jìn)行匹配得到第一用戶行為與第二用戶行為的關(guān)聯(lián)性,然后確定所述第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限。
5.根據(jù)權(quán)利要求1至4任意一項(xiàng)所述方法,其特征在于, 所述第一類用戶識(shí)別包括:登錄賬號(hào)或第三方賬號(hào)。
6.根據(jù)權(quán)利要求1至4任意一項(xiàng)所述方法,其特征在于, 所述第二類用戶識(shí)別包括:瀏覽器臨時(shí)文件、程序內(nèi)部標(biāo)識(shí)、互聯(lián)網(wǎng)協(xié)議、客戶端軟件版本中的任意一項(xiàng)或者多項(xiàng)。
7.根據(jù)權(quán)利要求1至4任意一項(xiàng)所述方法,其特征在于,所述第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限包括: 所述第一用戶行為與第二用戶行為相同的比率達(dá)到預(yù)定門限,或者,所述第一用戶行為與第二用戶行為相似率達(dá)到預(yù)定門限。
8.根據(jù)權(quán)利要求1至4任意一項(xiàng)所述方法,其特征在于, 所述標(biāo)識(shí)所述第一類用戶識(shí)別與第二類用戶識(shí)別所對(duì)應(yīng)的用戶為同一用戶后,還包括:將所述用戶的第一用戶行為和第二用戶行為作為整體進(jìn)行行為分析和建模,得到所述用戶的用戶行為習(xí)慣類數(shù)據(jù)。
9.一種標(biāo)識(shí)互聯(lián)網(wǎng)用戶的裝置,其特征在于,包括: 行為獲取單元,用于獲取第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為;所述第一類用戶識(shí)別為場(chǎng)景類用戶身份識(shí)別,第二類為用戶告知的用戶身份識(shí)別; 關(guān)聯(lián)性確定單元,用于確定行為獲取單元獲取的第一用戶行為與第二用戶行為的關(guān)聯(lián)性是否達(dá)到預(yù)定門限; 標(biāo)識(shí)單元,用于若關(guān)聯(lián)性確定單元確定第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限,則標(biāo)識(shí)所述第一類用戶識(shí)別與第二類用戶識(shí)別所對(duì)應(yīng)的用戶為同一用戶。
10.根據(jù)權(quán)利要求9所述裝置,其特征在于, 所述標(biāo)識(shí)單元,具體用于使用包含所述第一類用戶識(shí)別和第二類用戶識(shí)別的第三用戶識(shí)別作為用戶的用戶識(shí)別。
11.根據(jù)權(quán)利要求10所述裝置,其特征在于, 所述標(biāo)識(shí)單元,具體用于將結(jié)構(gòu)化數(shù)據(jù)序列化技術(shù)和或軟件框架技術(shù)使用包含所述第一類用戶識(shí)別和第二類用戶識(shí)別的第三用戶識(shí)別作為用戶的用戶識(shí)別。
12.根據(jù)權(quán)利要求9所述裝置,其特征在于,還包括: 記錄單元,用于在行為獲取單元獲取第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為之后,將行為獲取單元獲取的第一類用戶識(shí)別的第一用戶行為以及第二類用戶識(shí)別的第二用戶行為記錄在日志文件中; 所述關(guān)聯(lián)性確定單元,具體用于對(duì)所述日志文件中的第一用戶行為和第二用戶行為進(jìn)行匹配得到第一用戶行為與第二用戶行為的關(guān)聯(lián)性,然后確定所述第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限。
13.根據(jù)權(quán)利要求9至12任意一項(xiàng)所述裝置,其特征在于, 所述關(guān)聯(lián)性確定單元,用于確定第一用戶行為與第二用戶行為的關(guān)聯(lián)性達(dá)到預(yù)定門限包括:確定所述第一用戶行為與第二用戶行為相同的比率達(dá)到預(yù)定門限,或者,確定所述第一用戶行為與第二用戶行為相似率達(dá)到預(yù)定門限。
14.根據(jù)權(quán)利要求9至12任意一項(xiàng)所述裝置,其特征在于,還包括: 分析建模單元,用于在所述標(biāo)識(shí)單元標(biāo)識(shí)所述第一類用戶識(shí)別與第二類用戶識(shí)別所對(duì)應(yīng)的用戶為同一用戶后,將所述用戶的第一用戶行為和第二用戶行為作為整體進(jìn)行行為分析和建模,得到所述用戶的用戶行為習(xí)慣類數(shù)據(jù)。
【文檔編號(hào)】H04L29/06GK103905379SQ201210572002
【公開日】2014年7月2日 申請(qǐng)日期:2012年12月25日 優(yōu)先權(quán)日:2012年12月25日
【發(fā)明者】嚴(yán)浩 申請(qǐng)人:騰訊科技(深圳)有限公司