識(shí)別智能設(shè)備用戶(hù)的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種識(shí)別智能設(shè)備用戶(hù)的方法和裝置。
【背景技術(shù)】
[0002]用戶(hù)可以通過(guò)客戶(hù)端設(shè)備進(jìn)行網(wǎng)絡(luò)通信,客戶(hù)端設(shè)備可以包括非智能設(shè)備和智能設(shè)備,非智能設(shè)備例如個(gè)人電腦(Personal Computer, PC),智能設(shè)備例如智能手機(jī)或者平板電腦等。由于業(yè)務(wù)需要,一些情況下需要識(shí)別用戶(hù)是智能設(shè)備用戶(hù)還是非智能設(shè)備用戶(hù),以便進(jìn)行相應(yīng)的業(yè)務(wù)引導(dǎo),例如,對(duì)于智能設(shè)備用戶(hù),可以引導(dǎo)用戶(hù)進(jìn)行話(huà)費(fèi)充值或者進(jìn)行短信營(yíng)銷(xiāo)等。
[0003]相關(guān)技術(shù)中,識(shí)別智能設(shè)備用戶(hù)的方式主要是基于已有的包含智能設(shè)備型號(hào)的用戶(hù)訪(fǎng)問(wèn)日志,根據(jù)用戶(hù)訪(fǎng)問(wèn)日志中記錄的智能設(shè)備型號(hào)識(shí)別出智能設(shè)備用戶(hù)。
[0004]但是,當(dāng)智能設(shè)備用戶(hù)沒(méi)有采用智能設(shè)備進(jìn)行網(wǎng)絡(luò)訪(fǎng)問(wèn)時(shí),在用戶(hù)訪(fǎng)問(wèn)日志中不會(huì)記錄智能設(shè)備信息,此時(shí)采用上述的方式不能識(shí)別出智能設(shè)備用戶(hù),導(dǎo)致上述方式的識(shí)別效果不理想。
【發(fā)明內(nèi)容】
[0005]本申請(qǐng)旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問(wèn)題之一。
[0006]為此,本申請(qǐng)的一個(gè)目的在于提出一種識(shí)別智能設(shè)備用戶(hù)的方法,該方法能夠提高智能設(shè)備用戶(hù)的識(shí)別效果。
[0007]本申請(qǐng)的另一個(gè)目的在于提出一種識(shí)別智能設(shè)備用戶(hù)裝置。
[0008]為達(dá)到上述目的,本申請(qǐng)第一方面實(shí)施例提出的識(shí)別智能設(shè)備用戶(hù)的方法,包括:對(duì)用戶(hù)的網(wǎng)絡(luò)行為數(shù)據(jù)進(jìn)行提取,確定所述網(wǎng)絡(luò)行為數(shù)據(jù)中的特征變量;獲取第一變量值和第二變量值,所述第一變量值包括待檢測(cè)的設(shè)備用戶(hù)的所述特征變量的變量值,所述第二變量值包括預(yù)先確定的正樣本的所述特征變量的變量值;計(jì)算所述第一變量值與所述第二變量值之間的距離信息;根據(jù)所述距離信息,識(shí)別智能設(shè)備用戶(hù)。
[0009]本申請(qǐng)第一方面實(shí)施例提出的識(shí)別智能設(shè)備用戶(hù)的方法,通過(guò)對(duì)用戶(hù)的網(wǎng)絡(luò)行為數(shù)據(jù)進(jìn)行提取,確定網(wǎng)絡(luò)行為數(shù)據(jù)中的特征變量,計(jì)算待檢測(cè)的設(shè)備用戶(hù)的特征變量的變量值,與預(yù)先確定的正樣本的特征變量的變量值之間的距離信息,根據(jù)該距離信息,識(shí)別智能設(shè)備用戶(hù),可以實(shí)現(xiàn)基于用戶(hù)的網(wǎng)絡(luò)行為數(shù)據(jù)的智能設(shè)備用戶(hù)識(shí)別,由于本實(shí)施例不依賴(lài)用戶(hù)訪(fǎng)問(wèn)日志中的智能設(shè)備信息,因此,當(dāng)用戶(hù)訪(fǎng)問(wèn)日志中沒(méi)有智能設(shè)備信息時(shí),依然可以識(shí)別出智能設(shè)備用戶(hù),從而提高識(shí)別效果。
[0010]為達(dá)到上述目的,本申請(qǐng)第二方面實(shí)施例提出的識(shí)別智能設(shè)備用戶(hù)的裝置,包括:確定模塊,用于對(duì)用戶(hù)的網(wǎng)絡(luò)行為數(shù)據(jù)進(jìn)行提取,確定所述網(wǎng)絡(luò)行為數(shù)據(jù)中的特征變量;獲取模塊,用于獲取第一變量值和第二變量值,所述第一變量值包括待檢測(cè)的設(shè)備用戶(hù)的所述特征變量的變量值,所述第二變量值包括預(yù)先確定的正樣本的所述特征變量的變量值;計(jì)算模塊,用于計(jì)算所述第一變量值與所述第二變量值之間的距離信息;識(shí)別模塊,用于根據(jù)所述距離信息,識(shí)別智能設(shè)備用戶(hù)。
[0011]本申請(qǐng)第二方面實(shí)施例提出的識(shí)別智能設(shè)備用戶(hù)的裝置,通過(guò)對(duì)用戶(hù)的網(wǎng)絡(luò)行為數(shù)據(jù)進(jìn)行提取,確定網(wǎng)絡(luò)行為數(shù)據(jù)中的特征變量,計(jì)算待檢測(cè)的設(shè)備用戶(hù)的特征變量的變量值,與預(yù)先確定的正樣本的特征變量的變量值之間的距離信息,根據(jù)該距離信息,識(shí)別智能設(shè)備用戶(hù),可以實(shí)現(xiàn)基于用戶(hù)的網(wǎng)絡(luò)行為數(shù)據(jù)的智能設(shè)備用戶(hù)識(shí)別,由于本實(shí)施例不依賴(lài)用戶(hù)訪(fǎng)問(wèn)日志中的智能設(shè)備信息,因此,當(dāng)用戶(hù)訪(fǎng)問(wèn)日志中沒(méi)有智能設(shè)備信息時(shí),依然可以識(shí)別出智能設(shè)備用戶(hù),從而提高識(shí)別效果。
[0012]本申請(qǐng)附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本申請(qǐng)的實(shí)踐了解到。
【附圖說(shuō)明】
[0013]本申請(qǐng)上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
[0014]圖1是本申請(qǐng)一實(shí)施例提出的識(shí)別智能設(shè)備用戶(hù)的方法的流程示意圖;
[0015]圖2是本申請(qǐng)另一實(shí)施例提出的識(shí)別智能設(shè)備用戶(hù)的方法的流程示意圖;
[0016]圖3是本申請(qǐng)另一實(shí)施例提出的識(shí)別智能設(shè)備用戶(hù)的裝置的結(jié)構(gòu)示意圖;
[0017]圖4是本申請(qǐng)另一實(shí)施例提出的識(shí)別智能設(shè)備用戶(hù)的裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0018]下面詳細(xì)描述本申請(qǐng)的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類(lèi)似的標(biāo)號(hào)表示相同或類(lèi)似的元件或具有相同或類(lèi)似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,僅用于解釋本申請(qǐng),而不能理解為對(duì)本申請(qǐng)的限制。相反,本申請(qǐng)的實(shí)施例包括落入所附加權(quán)利要求書(shū)的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
[0019]圖1是本申請(qǐng)一實(shí)施例提出的識(shí)別智能設(shè)備用戶(hù)的方法的流程示意圖,該方法包括:
[0020]Sll:對(duì)用戶(hù)的網(wǎng)絡(luò)行為數(shù)據(jù)進(jìn)行提取,確定所述網(wǎng)絡(luò)行為數(shù)據(jù)中的特征變量。
[0021]其中,用戶(hù)的網(wǎng)絡(luò)行為數(shù)據(jù)包括:網(wǎng)站登錄時(shí)的數(shù)據(jù),例如,登錄時(shí)間,登錄地點(diǎn)等;訪(fǎng)問(wèn)記錄數(shù)據(jù),例如,用戶(hù)瀏覽的商品信息等;充值數(shù)據(jù);支付行為數(shù)據(jù);交易數(shù)據(jù);提現(xiàn)數(shù)據(jù);注冊(cè)手機(jī)號(hào)、購(gòu)物行為數(shù)據(jù)等中的一項(xiàng)或者多項(xiàng)。
[0022]特征變量是從用戶(hù)的網(wǎng)絡(luò)行為數(shù)據(jù)中提取出的預(yù)設(shè)個(gè)數(shù)的變量,是正樣本和負(fù)樣本差異較大的變量。
[0023]具體的,所述對(duì)用戶(hù)的網(wǎng)絡(luò)行為數(shù)據(jù)進(jìn)行提取,確定所述網(wǎng)絡(luò)行為數(shù)據(jù)中的特征變量,包括:
[0024]選取所述正樣本和負(fù)樣本,并獲取所述正樣本的網(wǎng)絡(luò)行為數(shù)據(jù)和所述負(fù)樣本的網(wǎng)絡(luò)行為數(shù)據(jù),所述正樣本是已知的智能設(shè)備用戶(hù),所述負(fù)樣本是已知的非智能設(shè)備用戶(hù);
[0025]對(duì)所述正樣本的網(wǎng)絡(luò)行為數(shù)據(jù)和所述負(fù)樣本的網(wǎng)絡(luò)行為數(shù)據(jù)進(jìn)行差異化計(jì)算,獲取所述網(wǎng)絡(luò)行為數(shù)據(jù)中每個(gè)變量的差異化得分;
[0026]根據(jù)所述差異化得分,確定特征變量。
[0027]其中,特征變量是正樣本和負(fù)樣本具有較大差異的變量,例如,可以按照差異化得分從大到小的順序?qū)ψ兞窟M(jìn)行排序,在排序后變量中依次選擇預(yù)設(shè)個(gè)數(shù)的變量作為特征變量。
[0028]S12:獲取第一變量值和第二變量值,所述第一變量值包括待檢測(cè)的設(shè)備用戶(hù)的所述特征變量的變量值,所述第二變量值包括預(yù)先確定的正樣本的所述特征變量的變量值。
[0029]其中,從待檢測(cè)的設(shè)備用戶(hù)的用戶(hù)訪(fǎng)問(wèn)日志中可以獲取第一變量值;
[0030]從正樣本的用戶(hù)訪(fǎng)問(wèn)日志中可以獲取第二變量值。
[0031]具體的,對(duì)于正樣本,第二變量值可以是從確定正樣本時(shí)采用的用戶(hù)訪(fǎng)問(wèn)日志中獲取的,例如,根據(jù)2012年初至2013年底確定出正樣本,之后可以根據(jù)正樣本在2012年初至2013年底的用戶(hù)訪(fǎng)問(wèn)日志中獲取第二變量值,例如獲取登錄時(shí)間的登錄值等。當(dāng)然,可以理解的是,由于智能設(shè)備或非智能設(shè)備在不同的時(shí)間段會(huì)具有一致的訪(fǎng)問(wèn)行為,因此也可以根據(jù)其他時(shí)間段的用戶(hù)訪(fǎng)問(wèn)日志獲取,例如,也可以從已經(jīng)存在的2014年的用戶(hù)訪(fǎng)問(wèn)日志中獲取,例如,智能手機(jī)在2012年初至2013年底的登錄時(shí)間通常是早上,那么該智能手機(jī)在2014年的登錄時(shí)間依然通常會(huì)是在早上。
[0032]預(yù)先確定的正樣本是指從已知的智能設(shè)備用戶(hù)中選取的預(yù)設(shè)個(gè)數(shù)的智能設(shè)備用戶(hù),已知的智能設(shè)備用戶(hù)可以是預(yù)設(shè)時(shí)間段內(nèi)的智能設(shè)備用戶(hù),選取時(shí)可以隨機(jī)選擇。具體的,可以根據(jù)服務(wù)端預(yù)先獲取的歷史數(shù)據(jù),確定智能設(shè)備用戶(hù)和非智能設(shè)備用戶(hù),從所述智能設(shè)備用戶(hù)中隨機(jī)選取預(yù)設(shè)個(gè)數(shù)的用戶(hù)確定為正樣本,從所述非智能設(shè)備用戶(hù)中隨機(jī)選擇所述預(yù)設(shè)個(gè)數(shù)的用戶(hù)確定為負(fù)樣本。
[0033]以智能設(shè)備是智能手機(jī)為例,例如,根據(jù)用戶(hù)訪(fǎng)問(wèn)日志,可以篩選出2012年初至2013年底有過(guò)智能手機(jī)訪(fǎng)問(wèn)記錄的用戶(hù),這些用戶(hù)是已知的智能設(shè)備用戶(hù),之后可以從這些已知的智能設(shè)備用戶(hù)中隨機(jī)挑取50萬(wàn)個(gè)用戶(hù)作為正樣本。
[0034]根據(jù)用戶(hù)訪(fǎng)問(wèn)日志,可以篩選出2013年底之前沒(méi)有過(guò)智能手機(jī)訪(fǎng)問(wèn)記錄的用戶(hù),而2013年底之后有過(guò)智能手機(jī)訪(fǎng)問(wèn)記錄的用戶(hù),這些用戶(hù)在2013年底之間可以看作非智能設(shè)備用戶(hù),之后可以從這些非智能設(shè)備用戶(hù)中隨機(jī)選取50萬(wàn)個(gè)用戶(hù)作為負(fù)樣本。
[0035]S1