合中具有所述關系模型中某一設備指紋的 每條曝光數(shù)據(jù),根據(jù)所述關系模型分配一個獨立訪問者標識,包括:
[0087] 對所述估算集合具有所述關系模型中設備指紋Fi的M條曝光數(shù)據(jù)分為k+1組, M=kN+M',其中,N為所述樣本集合中具有設備指紋Fi的曝光數(shù)據(jù)總數(shù),k,M'為自然數(shù);
[0088] 對其中的k組曝光數(shù)據(jù),將每一組的N條曝光數(shù)據(jù)再劃分為Q個子組,每一子組對 應設備指紋Fi的訪問子表中的一條記錄,每一子組的曝光數(shù)據(jù)條數(shù)等于對應記錄中的出 現(xiàn)次數(shù),Q為設備指紋Fi的訪問子表中的記錄數(shù);
[0089] 對余下的M'條曝光數(shù)據(jù)組成的一組曝光數(shù)據(jù),將所述M'條曝光數(shù)據(jù)分成Q'個子 組,Q' <Q,每一子組對應設備指紋Fi的訪問子表中的一條記錄,且至少有Q' -1個子組的 曝光數(shù)據(jù)條數(shù)等于對應記錄中的出現(xiàn)次數(shù);
[0090] 為同一組中同一子組的曝光數(shù)據(jù)分配相同的獨立訪問者標識,為不同組或同一組 中不同子組的曝光數(shù)據(jù)分配不同的獨立訪問者標識。
[0091] 優(yōu)選地,所述系統(tǒng)還包括補充統(tǒng)計模塊和補充估算模塊:
[0092] 所述補充統(tǒng)計模塊,用于根據(jù)所述樣本集合中各條曝光數(shù)據(jù)的cookie建立訪 問總表,在所述訪問總表的每條記錄中,保存所述樣本集合中的曝光數(shù)據(jù)所具有的一種 cookie及該cookie在該樣本集合的曝光數(shù)據(jù)中的出現(xiàn)次數(shù);
[0093] 補充估算模塊,用于對所述估算集合中不具有所述關系模型中任一設備指紋的每 條曝光數(shù)據(jù),根據(jù)所述訪問總表分配一個獨立訪問者標識。
[0094] 優(yōu)選地,補充估算模塊,用于對所述估算集合中不具有所述關系模型中任一設備 指紋的每條曝光數(shù)據(jù),根據(jù)所述訪問總表分配一個獨立訪問者標識,包括:
[0095] 將所述估算集合中的全部M條曝光數(shù)據(jù)分為k+1組,M=kN+M',其中,N為所述樣本 集合中的曝光數(shù)據(jù)總數(shù),k,M'為自然數(shù);
[0096] 對其中的k組曝光數(shù)據(jù),將每一組的N條曝光數(shù)據(jù)再劃分為Q個子組,每一子組對 應所述訪問總表中的一條記錄,每一子組的曝光數(shù)據(jù)條數(shù)等于對應記錄中的出現(xiàn)次數(shù),Q為 所述混合訪問表中的記錄數(shù);
[0097] 對余下的M'條曝光數(shù)據(jù)組成的一組曝光數(shù)據(jù),將所述M'條曝光數(shù)據(jù)分成Q'個子 組,Q' <Q,每一子組對應所述訪問總表中的一條記錄,且至少有Q' -1個子組的曝光數(shù)據(jù) 條數(shù)等于對應記錄中的出現(xiàn)次數(shù);
[0098] 為同一組中同一子組的曝光數(shù)據(jù)分配相同的獨立訪問者標識,為不同組或同一組 中不同子組的曝光數(shù)據(jù)分配不同的獨立訪問者標識。
[0099] 優(yōu)選地,該系統(tǒng)還包括一到達頻次計算模塊,
[0100] 到達頻次計算模塊,用于根據(jù)所述樣本集合的獨立訪問者標識以及所述估算集合 的獨立訪問者標識,統(tǒng)計所述全部流量的到達頻次。
[0101] 應用示例
[0102] (1)假設監(jiān)測到全流量的曝光數(shù)據(jù)74條,其中,表1所示為攜帶cookie信息的14 條曝光數(shù)據(jù),表2所示為沒有攜帶cookie信息的60條曝光數(shù)據(jù)。
[0103]
[0104]
[0105] 表1 (攜帶cookie和指紋)
[0106]
[0107]
[0108] 表2 (僅攜帶指紋)
[0109] (2)統(tǒng)計過程:如表3-1、表3-2、表3-3所示,根據(jù)所述樣本集合為設備指紋F1、 F2、F3建立各自的訪問子表T1 (如表3-1所示)、T2 (如表3-2所示)、T3 (如表3-3所示), 在該訪問子表的每條記錄中,保存具有該設備指紋的一組曝光數(shù)據(jù)所具有的一種cookie 及該cookie在該組曝光數(shù)據(jù)中的出現(xiàn)次數(shù)。
[0110]
[0111] 表3-1 (訪問子表T1)
[0112]
[0113] 表3-2 (訪問子表T2)
[0114]
[0115]
[0116] 表3-3 (訪問子表T3)
[0117] (3)估算過程:對表2中的具有設備指紋F1、F2、F3的曝光數(shù)據(jù),按照設備指紋進 行分組。F1分組的曝光數(shù)據(jù)共有19條,F(xiàn)1對應的訪問子表T1代表的曝光數(shù)據(jù)有6條,因 此,將F1分組分成4個子組,前3個子組每個子組有6條曝光數(shù)據(jù),最后1個小組有1條曝 光數(shù)據(jù)。F2分組的曝光數(shù)據(jù)共有15條,F(xiàn)2對應的訪問子表T2代表的曝光數(shù)據(jù)有5條,因 此,將F2分組分成3個子組,每個子組有5條曝光數(shù)據(jù)。F3分組的曝光數(shù)據(jù)共有12條,F(xiàn)3 對應的訪問子表T3代表的曝光數(shù)據(jù)有3條,因此,將F3分組分成4個子組,每個子組有3 條曝光數(shù)據(jù)。
[0118] 對F1的前3個子組,可以將每一個子組中的第1-3條曝光數(shù)據(jù)映射到cookie標 識C1,分配一個新的獨立用戶訪問標識,第4條曝光數(shù)據(jù)映射到cookie標識C2,分配一個 新的獨立用戶訪問標識,第5-6條曝光數(shù)據(jù)映射到cookie標識C3,分配一個新的獨立用戶 訪問標識。對F1的最后1個子組,可以將該小組的第1條曝光數(shù)據(jù)映射到cookie標識C1, 分配一個新的獨立用戶訪問標識。綜上,F(xiàn)1分組的19條曝光數(shù)據(jù)一共分配到10個獨立用 戶標識。
[0119] 對F2的3個子組,可以將每一個子組中的第1-2條曝光數(shù)據(jù)映射到cookie標識 C4,分配一個新的獨立用戶訪問標識,第3條曝光數(shù)據(jù)映射到cookie標識C5,分配一個新的 獨立用戶訪問標識,第4-5條曝光數(shù)據(jù)映射到cookie標識C6,分配一個新的獨立用戶訪問 標識。綜上,F(xiàn)2分組的15條曝光數(shù)據(jù)一共分配到9個獨立用戶標識。
[0120] 對F3的4個子組,可以將每一個子組中的第1條曝光數(shù)據(jù)映射到cookie標識C7, 分配一個新的獨立用戶訪問標識,第2條曝光數(shù)據(jù)映射到cookie標識C8,分配一個新的獨 立用戶訪問標識,第3條曝光數(shù)據(jù)映射到cookie標識C9,分配一個新的獨立用戶訪問標識。 綜上,F(xiàn)3分組的12條曝光數(shù)據(jù)一共分配到12個獨立用戶標識。
[0121] (4)補充統(tǒng)計過程:如表4所示,根據(jù)所述樣本集合建立訪問總表T4,在所述訪問 總表T4的每條記錄中,保存所述樣本集合中的曝光數(shù)據(jù)所具有的一種cookie及該cookie 在該樣本集合的曝光數(shù)據(jù)中的出現(xiàn)次數(shù)。
[0122]
[0123] 表4 (訪問總表T4)
[0124] (5)補充估計過程:對表2中的具有設備指紋F4、F5的曝光數(shù)據(jù),分為一組。該分 組的曝光數(shù)據(jù)共有14條,所述訪問總表T4代表的曝光數(shù)據(jù)有14條,因此,將該組曝光數(shù)據(jù) 分成1個子組。
[0125] 對這個子組的曝光數(shù)據(jù),可以將第1-3條曝光數(shù)據(jù)映射到cookie標識C1,分配一 個新的獨立用戶訪問標識,第4條曝光數(shù)據(jù)映射到cookie標識C2,分配一個新的獨立用 戶訪問標識,第5-6條曝光數(shù)據(jù)映射到cookie標識C3,分配一個新的獨立用戶訪問標識, 第7-8條曝光數(shù)據(jù)映射到cookie標識C4,分配一個新的獨立用戶訪問標識,第9條曝光數(shù) 據(jù)映射到cookie標識C5,分配一個新的獨立用戶訪問標識,第10-11條曝光數(shù)據(jù)映射到 cookie標識C6,分配一個新的獨立用戶訪問標識,第12條曝光數(shù)據(jù)映射到cookie標識C7, 分配一個新的獨立用戶訪問標識,第13條曝光數(shù)據(jù)映射到cookie標識C8,分配一個新的獨 立用戶訪問標識,第14條曝光數(shù)據(jù)映射到cookie標識C9,分配一個新的獨立用戶訪問標 識。綜上,該子組的14條曝光數(shù)據(jù)一共分配到9個獨立用戶標識。
[0126] (6)獨立訪問用戶統(tǒng)計:將所述估算集合中的每一條曝光數(shù)據(jù)的獨立訪問者標識 記錄在表5中,一共有40個獨立訪問用戶標識。
[0129] (7)計算全部流量的到達頻次:針對全部74條曝光數(shù)據(jù),根據(jù)所述樣本集合中的 9個cookie,以及所述估算集合中的40個獨立訪問用戶標識,統(tǒng)計所述全部流量的到達頻 次,其中,至少曝光1次的獨立訪問者數(shù)量為49,至少曝光2次的獨立訪問者數(shù)量為15,至 少曝光3次的獨立訪問者數(shù)量為5,至少曝光4次及4次以上的獨立訪問者數(shù)量為0。
[0130] 上述實施例提供的一種監(jiān)測網(wǎng)絡訪問活動的方法和系統(tǒng),監(jiān)測全流量的曝光數(shù) 據(jù),每一條曝光數(shù)據(jù)均攜帶獨立訪問者的設備指紋信息,將攜帶cookie的曝光數(shù)據(jù)保存在 樣本集合中,其他曝光數(shù)據(jù)保存在估算集合中,根據(jù)樣本集合建立設備指紋與cookie的關 系模型,對估算集合中具有所述關系模型中某一設備指紋的每條曝光數(shù)據(jù)根據(jù)所述關系模 型分配一個獨立訪問者標識,上述實施例的方法和系統(tǒng)能夠提高對網(wǎng)絡訪問行為監(jiān)測的準 確性。
[0131] 本領域普通技術人員可以理解上述方法中的全部或部分步驟