亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種團(tuán)隊(duì)成員識(shí)別設(shè)備、方法及系統(tǒng)與流程

文檔序號(hào):11514913閱讀:303來(lái)源:國(guó)知局
一種團(tuán)隊(duì)成員識(shí)別設(shè)備、方法及系統(tǒng)與流程

本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種團(tuán)隊(duì)成員識(shí)別設(shè)備、方法及系統(tǒng)。



背景技術(shù):

目前很多用戶會(huì)在網(wǎng)站或應(yīng)用中填寫個(gè)人數(shù)據(jù),個(gè)人數(shù)據(jù)包括用戶所加入的團(tuán)隊(duì)、姓名以及愛(ài)好等數(shù)據(jù)?;谟脩籼顚懙钠浼尤氲膱F(tuán)隊(duì)的數(shù)據(jù),常用的團(tuán)隊(duì)成員識(shí)別方法為:

利用爬蟲技術(shù)從網(wǎng)絡(luò)側(cè)爬取用戶在一定時(shí)間段內(nèi)產(chǎn)生的網(wǎng)絡(luò)數(shù)據(jù);從網(wǎng)絡(luò)數(shù)據(jù)中提取用戶在網(wǎng)站以及應(yīng)用中填寫的該用戶所加入的團(tuán)隊(duì)的數(shù)據(jù);若該用戶所加入的團(tuán)隊(duì)的數(shù)據(jù)中包括指定團(tuán)隊(duì),則確定該用戶為指定團(tuán)隊(duì)的成員;若該用戶所加入的團(tuán)隊(duì)的數(shù)據(jù)中不包括指定團(tuán)隊(duì),則確定該用戶不是指定團(tuán)隊(duì)的成員。

發(fā)明人發(fā)現(xiàn),上述團(tuán)隊(duì)成員識(shí)別方法所依據(jù)的數(shù)據(jù)為用戶人為填寫,存對(duì)用戶加入的團(tuán)隊(duì)人為造假的可能,此外,用戶可能已在上述時(shí)間段之前加入或脫離指定團(tuán)隊(duì),但用戶未及時(shí)更新網(wǎng)站以及應(yīng)用中其所加入的團(tuán)隊(duì),此時(shí)所獲取的上述時(shí)間段內(nèi)的用戶所加入的團(tuán)隊(duì)的數(shù)據(jù)存在滯后性,因此,上述團(tuán)隊(duì)成員識(shí)別方法所依據(jù)的數(shù)據(jù)的不可靠,從而導(dǎo)致識(shí)別結(jié)果準(zhǔn)確性較差的問(wèn)題。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明提供一種團(tuán)隊(duì)成員識(shí)別方法、設(shè)備及系統(tǒng),用于提高用戶所屬團(tuán)隊(duì)識(shí)別結(jié)果的準(zhǔn)確性。

第一方面,本發(fā)明實(shí)施例提供一種團(tuán)隊(duì)成員識(shí)別設(shè)備,包括:

處理器,用于根據(jù)從數(shù)據(jù)庫(kù)服務(wù)器獲取的用于表征待識(shí)別用戶關(guān)注指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù),確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度;根據(jù)從所述數(shù)據(jù)庫(kù)服務(wù)器獲取的預(yù)設(shè)地理區(qū)域以及所述待識(shí)別用戶的地理位置數(shù)據(jù),確定所述待識(shí)別用戶與所述預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,其中,所述預(yù)設(shè)地理區(qū)域包含所述指定團(tuán)隊(duì)所在的地理位置,所述關(guān)聯(lián)度用于表征所述待識(shí)別用戶出現(xiàn)在所述預(yù)設(shè)地理區(qū)域的情況;根據(jù)所述關(guān)注度以及所述關(guān)聯(lián)度,利用預(yù)先訓(xùn)練得到的所述指定團(tuán)隊(duì)的二分類模型,識(shí)別所述待識(shí)別用戶是否為所述指定團(tuán)隊(duì)的成員;

發(fā)送器,用于將識(shí)別結(jié)果發(fā)送至所述數(shù)據(jù)庫(kù)服務(wù)器,以使所述數(shù)據(jù)庫(kù)服務(wù)器對(duì)所述識(shí)別結(jié)果進(jìn)行存儲(chǔ)。

第二方面,本發(fā)明實(shí)施例提供一種團(tuán)隊(duì)成員識(shí)別方法,包括:

根據(jù)獲取的用于表征待識(shí)別用戶關(guān)注指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù),確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度;

根據(jù)獲取的預(yù)設(shè)地理區(qū)域以及所述待識(shí)別用戶的地理位置數(shù)據(jù),確定所述待識(shí)別用戶與所述預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,其中,所述預(yù)設(shè)地理區(qū)域包含所述指定團(tuán)隊(duì)所在的地理位置,所述關(guān)聯(lián)度用于表征所述待識(shí)別用戶出現(xiàn)在所述預(yù)設(shè)地理區(qū)域的情況;

根據(jù)所述關(guān)注度以及所述關(guān)聯(lián)度,利用預(yù)先訓(xùn)練得到的所述指定團(tuán)隊(duì)的二分類模型,識(shí)別所述待識(shí)別用戶是否為所述指定團(tuán)隊(duì)的成員。

可選地,所述方法中,所述關(guān)注數(shù)據(jù)包括以下至少一項(xiàng):

關(guān)注所述指定團(tuán)隊(duì)微信公眾號(hào)的個(gè)數(shù)、關(guān)注所述指定團(tuán)隊(duì)微博的個(gè)數(shù)、下載所述指定團(tuán)隊(duì)開發(fā)的應(yīng)用程序的個(gè)數(shù)、與所述指定團(tuán)隊(duì)相關(guān)新聞的閱讀量、登錄所述指定團(tuán)隊(duì)的相關(guān)網(wǎng)站的次數(shù)。

可選地,所述方法中,確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度,具體包括:

若所述關(guān)注數(shù)據(jù)包括至少兩項(xiàng),則確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度為所述至少兩項(xiàng)對(duì)應(yīng)的數(shù)值之和。

可選地,所述方法中,確定所述待識(shí)別用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,具體包括:

針對(duì)獲取的所述待識(shí)別用戶在第一時(shí)間段內(nèi)的每條位置數(shù)據(jù),若該條位置數(shù)據(jù)對(duì)應(yīng)的地理位置屬于所述預(yù)設(shè)地理區(qū)域,則將該條位置數(shù)據(jù)保存至位置數(shù)據(jù)集合;

將位置數(shù)據(jù)集合中包含的位置數(shù)據(jù)的總條數(shù)與所述第一時(shí)間段對(duì)應(yīng)的時(shí)長(zhǎng)的比值,作為所述待識(shí)別用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度。

可選地,所述方法中,預(yù)先訓(xùn)練得到所述指定團(tuán)隊(duì)的二分類模型,具體包括:

根據(jù)樣本用戶的特征向量集以及樣本用戶的類別集,利用預(yù)設(shè)分類算法訓(xùn)練得到所述指定團(tuán)隊(duì)的二分類模型;其中,所述特征向量集用于保存每個(gè)樣本用戶的特征向量,所述特征向量包括對(duì)應(yīng)樣本用戶針對(duì)指定團(tuán)隊(duì)的關(guān)注度以及對(duì)應(yīng)樣本用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,所述類別集包括樣本用戶不是指定團(tuán)隊(duì)成員以及樣本用戶是指定團(tuán)隊(duì)的成員兩種類別。

可選地,所述方法中,所述預(yù)設(shè)分類算法為樸素貝葉斯分類算法或者邏輯回歸分類算法。

第三方面,本發(fā)明實(shí)施例提供一種團(tuán)隊(duì)成員識(shí)別裝置,包括:

第一確定模塊,用于根據(jù)獲取的用于表征待識(shí)別用戶關(guān)注指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù),確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度;

第二確定模塊,用于根據(jù)獲取的預(yù)設(shè)地理區(qū)域以及所述待識(shí)別用戶的地理位置數(shù)據(jù),確定所述待識(shí)別用戶與所述預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,其中,所述預(yù)設(shè)地理區(qū)域包含所述指定團(tuán)隊(duì)所在的地理位置,所述關(guān)聯(lián)度用于表征所述待識(shí)別用戶出現(xiàn)在所述預(yù)設(shè)地理區(qū)域的情況;

第三確定模塊,用于根據(jù)所述關(guān)注度以及所述關(guān)聯(lián)度,利用預(yù)先訓(xùn)練得到的所述指定團(tuán)隊(duì)的二分類模型,識(shí)別所述待識(shí)別用戶是否為所述指定團(tuán)隊(duì)的成員。

第四方面,本發(fā)明實(shí)施例提供一種團(tuán)隊(duì)成員識(shí)別系統(tǒng),包括:

數(shù)據(jù)庫(kù)服務(wù)器,用于存儲(chǔ)用于表征待識(shí)別用戶關(guān)注指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù)、預(yù)設(shè)地理區(qū)域、所述待識(shí)別用戶的地理位置數(shù)據(jù)以及計(jì)算機(jī)服務(wù)器發(fā)送的識(shí)別結(jié)果,其中,所述預(yù)設(shè)地理區(qū)域包含所述指定團(tuán)隊(duì)所在的地理位置,所述關(guān)聯(lián)度用于表征所述待識(shí)別用戶出現(xiàn)在所述預(yù)設(shè)地理區(qū)域的情況;

計(jì)算服務(wù)器,用于從所述數(shù)據(jù)庫(kù)服務(wù)器獲取所述關(guān)注數(shù)據(jù)、預(yù)設(shè)地理區(qū)域以及所述待識(shí)別用戶的地理位置數(shù)據(jù);根據(jù)所述關(guān)注數(shù)據(jù),確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度;根據(jù)所述預(yù)設(shè)地理區(qū)域以及所述待識(shí)別用戶的地理位置數(shù)據(jù),確定所述待識(shí)別用戶與所述預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度;根據(jù)所述關(guān)注度以及所述關(guān)聯(lián)度,利用預(yù)先訓(xùn)練得到的所述指定團(tuán)隊(duì)的二分類模型,識(shí)別所述待識(shí)別用戶是否為所述指定團(tuán)隊(duì)的成員,并將識(shí)別結(jié)果發(fā)送至所述數(shù)據(jù)庫(kù)服務(wù)器。

第五方面,本發(fā)明實(shí)施例提供了一種非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì),所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令,該計(jì)算機(jī)可執(zhí)行指令可執(zhí)行上述團(tuán)隊(duì)成員識(shí)別方法。

利用本發(fā)明實(shí)施例提供的團(tuán)隊(duì)成員識(shí)別設(shè)備、方法及系統(tǒng),具有以下有益效果:

相比于現(xiàn)有技術(shù)中僅依據(jù)用戶填寫的數(shù)據(jù)識(shí)別用戶所屬團(tuán)隊(duì)的方式,本發(fā)明實(shí)施例確定關(guān)注度所使用的關(guān)注指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù)以及確定關(guān)聯(lián)度所使用的待識(shí)別用戶所處的地理位置這兩種用戶數(shù)據(jù)的可信度和實(shí)時(shí)性較好,因此,利用這兩種用戶數(shù)據(jù)對(duì)待識(shí)別用戶進(jìn)行所屬團(tuán)隊(duì)識(shí)別,可提高識(shí)別結(jié)果的準(zhǔn)確性。

附圖說(shuō)明

圖1為本發(fā)明實(shí)施例提供的團(tuán)隊(duì)成員識(shí)別方法的流程示意圖;

圖2為本發(fā)明實(shí)施例提供的確定待識(shí)別用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度的方法流程示意圖;

圖3為本發(fā)明實(shí)施例提供的團(tuán)隊(duì)成員識(shí)別設(shè)備的硬件結(jié)構(gòu)示意圖;

圖4為本發(fā)明實(shí)施例提供的團(tuán)隊(duì)成員識(shí)別裝置的結(jié)構(gòu)示意圖;

圖5為本發(fā)明實(shí)施例提供的團(tuán)隊(duì)成員識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖。

具體實(shí)施方式

為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明可能的實(shí)施方式作進(jìn)一步描述。

實(shí)施例一

本發(fā)明實(shí)施例提供一種團(tuán)隊(duì)成員識(shí)別方法,如圖1所示,包括:

步驟101,根據(jù)獲取的用于表征待識(shí)別用戶關(guān)注指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù),確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度。

具體實(shí)施時(shí),可根據(jù)待識(shí)別用戶的標(biāo)識(shí),利用網(wǎng)絡(luò)爬蟲技術(shù),獲取該待識(shí)別用戶對(duì)應(yīng)的網(wǎng)絡(luò)數(shù)據(jù)。從獲取的待識(shí)別用戶對(duì)應(yīng)的網(wǎng)絡(luò)數(shù)據(jù)中,統(tǒng)計(jì)并提取該待識(shí)別用戶對(duì)指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù),以體現(xiàn)待識(shí)別用戶對(duì)指定團(tuán)隊(duì)的關(guān)注程度。用戶的標(biāo)識(shí)可以為該用戶在指定團(tuán)隊(duì)中的注冊(cè)賬號(hào),比如,用戶的標(biāo)識(shí)可以為qq賬號(hào)、微博賬號(hào)等,待識(shí)別用戶可以為任一用戶,這里不做限定。優(yōu)選地,將用于表征待識(shí)別用戶關(guān)注指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù)存儲(chǔ)至數(shù)據(jù)庫(kù)服務(wù)器。

其中,團(tuán)隊(duì)是由基層人員和管理層人員組成的一個(gè)共同體,團(tuán)隊(duì)可以包括機(jī)關(guān)單位、事業(yè)單位、企業(yè)、社團(tuán)、公益性組織等,比如企業(yè)可以為騰訊公司或西門子公司等。

作為一種可能的實(shí)施方式,待識(shí)別用戶對(duì)指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù)包括以下至少一項(xiàng):

關(guān)注所述指定團(tuán)隊(duì)微信公眾號(hào)的個(gè)數(shù)、關(guān)注所述指定團(tuán)隊(duì)微博的個(gè)數(shù)、下載所述指定團(tuán)隊(duì)開發(fā)的應(yīng)用程序的個(gè)數(shù)、與所述指定團(tuán)隊(duì)相關(guān)新聞的閱讀量、登錄所述指定團(tuán)隊(duì)的相關(guān)網(wǎng)站的次數(shù)。

具體的,團(tuán)隊(duì)通常會(huì)開通若干具有不同作用的公眾號(hào)、微博等,以騰訊公司為例,該公司的微信公眾號(hào)可以包括騰訊內(nèi)部使用的行政管理類微信公眾號(hào)、發(fā)布騰訊官方信息的官方微信公眾號(hào)以及騰訊產(chǎn)品的相關(guān)微信公眾號(hào)等。

其中,關(guān)注所述指定團(tuán)隊(duì)微信公眾號(hào)的個(gè)數(shù)可按照以下方式確定:

利用待識(shí)別用戶在微信客戶端中操作所產(chǎn)生的網(wǎng)絡(luò)數(shù)據(jù),統(tǒng)計(jì)在第二時(shí)間段內(nèi)處于被待識(shí)別用戶關(guān)注狀態(tài)的指定團(tuán)隊(duì)的微信公眾號(hào)個(gè)數(shù),作為關(guān)注所述指定團(tuán)隊(duì)微信公眾號(hào)的個(gè)數(shù)。

其中,關(guān)注所述指定團(tuán)隊(duì)微博的個(gè)數(shù)可按照以下方式確定:

利用待識(shí)別用戶在微信博客戶端中操作所產(chǎn)生的網(wǎng)絡(luò)數(shù)據(jù),統(tǒng)計(jì)在一定時(shí)間段內(nèi)處于被待識(shí)別用戶關(guān)注狀態(tài)的指定團(tuán)隊(duì)的微博個(gè)數(shù),作為關(guān)注所述指定團(tuán)隊(duì)微博的個(gè)數(shù)。

其中,下載所述指定團(tuán)隊(duì)開發(fā)的應(yīng)用程序的個(gè)數(shù)可按照以下方式確定:

利用待識(shí)別用戶對(duì)應(yīng)的網(wǎng)絡(luò)數(shù)據(jù),統(tǒng)計(jì)在一定時(shí)間段內(nèi)下載指定團(tuán)隊(duì)開發(fā)的應(yīng)用程序的個(gè)數(shù),作為下載所述指定團(tuán)隊(duì)開發(fā)的應(yīng)用程序的個(gè)數(shù)。

其中,與所述指定團(tuán)隊(duì)相關(guān)新聞的閱讀量按照以下方式確定:

從待識(shí)別用戶對(duì)應(yīng)的網(wǎng)絡(luò)數(shù)據(jù)中,提取該待識(shí)別用戶在一定時(shí)間段內(nèi)閱讀與指定團(tuán)隊(duì)相關(guān)新聞的閱讀數(shù)據(jù);統(tǒng)計(jì)閱讀數(shù)據(jù)的條數(shù),作為與所述指定團(tuán)隊(duì)相關(guān)信息的閱讀量。

其中,登錄所述指定團(tuán)隊(duì)的相關(guān)網(wǎng)站的次數(shù)按照以下方式確定:

從待識(shí)別用戶對(duì)應(yīng)的網(wǎng)絡(luò)數(shù)據(jù)中,提取該待識(shí)別用戶在一定時(shí)間段內(nèi)登錄指定團(tuán)隊(duì)的相關(guān)網(wǎng)站的登錄數(shù)據(jù);統(tǒng)計(jì)登錄數(shù)據(jù)的條數(shù),作為登錄所述指定團(tuán)隊(duì)的相關(guān)網(wǎng)站的次數(shù)。

需要說(shuō)明的是,上述第二時(shí)間段的結(jié)束時(shí)間點(diǎn)可以為當(dāng)前時(shí)間點(diǎn),第二時(shí)間段對(duì)應(yīng)的時(shí)長(zhǎng)可根據(jù)實(shí)際應(yīng)用場(chǎng)景設(shè)定,這里不做限定,比如第二時(shí)間段可以為2017年4月28日8:00至2017年4月29日8:00,其中,2017年4月28日8:00為開始時(shí)間點(diǎn),2017年4月29日8:00為當(dāng)前時(shí)間點(diǎn),第二時(shí)間段對(duì)應(yīng)的時(shí)長(zhǎng)為1天。

具體實(shí)施時(shí),若指定用戶針對(duì)指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù)包括至少兩項(xiàng),則確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度為所述至少兩項(xiàng)對(duì)應(yīng)的數(shù)值之和。比如關(guān)注數(shù)據(jù)包括關(guān)注所述指定團(tuán)隊(duì)微信公眾號(hào)的個(gè)數(shù)m和關(guān)注所述指定團(tuán)隊(duì)微博的個(gè)數(shù)n,則將m與n的和值作為待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度。或者,為每項(xiàng)關(guān)注數(shù)據(jù)設(shè)置權(quán)值,將多項(xiàng)關(guān)注數(shù)據(jù)的加權(quán)求和結(jié)果確定為待識(shí)別用戶針對(duì)指定團(tuán)隊(duì)的關(guān)注度,比如:關(guān)注數(shù)據(jù)包括關(guān)注所述指定團(tuán)隊(duì)微信公眾號(hào)的個(gè)數(shù)m和關(guān)注所述指定團(tuán)隊(duì)微博的個(gè)數(shù)n,其中,關(guān)注所述指定團(tuán)隊(duì)微信公眾號(hào)的個(gè)數(shù)對(duì)應(yīng)的權(quán)值為a,關(guān)注所述指定團(tuán)隊(duì)微博的個(gè)數(shù)對(duì)應(yīng)的權(quán)值為b,則將am+bn作為待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度。

若指定用戶針對(duì)指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù)僅包括一項(xiàng),則確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度為該項(xiàng)對(duì)應(yīng)的數(shù)值,比如關(guān)注度為關(guān)注所述指定團(tuán)隊(duì)微信公眾號(hào)的個(gè)數(shù)m。

步驟102,根據(jù)獲取的預(yù)設(shè)地理區(qū)域以及所述待識(shí)別用戶的地理位置數(shù)據(jù),確定所述待識(shí)別用戶與所述預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,其中,所述預(yù)設(shè)地理區(qū)域包含所述指定團(tuán)隊(duì)所在的地理位置,所述關(guān)聯(lián)度用于表征所述待識(shí)別用戶出現(xiàn)在所述預(yù)設(shè)地理區(qū)域的情況。

具體實(shí)施時(shí),從獲取的待識(shí)別用戶對(duì)應(yīng)的網(wǎng)絡(luò)數(shù)據(jù)中,提取待識(shí)別用戶在第一時(shí)間段內(nèi)上報(bào)至網(wǎng)絡(luò)側(cè)的地理位置數(shù)據(jù);其中,一條位置數(shù)據(jù)對(duì)應(yīng)一個(gè)地理位置,一個(gè)地理位置可能對(duì)應(yīng)多條位置數(shù)據(jù)。位置數(shù)據(jù)為待識(shí)別用戶通過(guò)lbs(locationbasedservice,基于位置的服務(wù))等定位服務(wù)上報(bào)的定位信息,或者,位置數(shù)據(jù)為待識(shí)別用戶在訪問(wèn)網(wǎng)絡(luò)時(shí)上報(bào)至網(wǎng)絡(luò)側(cè)的公網(wǎng)ip(internetprotocol,網(wǎng)絡(luò)協(xié)議)地址,其中,可將該公網(wǎng)ip地所屬的地域確定為待識(shí)別用戶的地理位置。進(jìn)一步地,提取待識(shí)別用戶在工作時(shí)間段內(nèi)上報(bào)至網(wǎng)絡(luò)側(cè)的地理位置數(shù)據(jù),其中工作時(shí)間段為第一時(shí)間段的子時(shí)間段,工作時(shí)間段屬于指定團(tuán)隊(duì)規(guī)定的其成員需在指定團(tuán)隊(duì)所在地點(diǎn)進(jìn)行辦公或者其他活動(dòng)的時(shí)間段。比如,第一時(shí)間段為15天,則工作時(shí)間段為這15天內(nèi)包含的工作日中的工作時(shí)間段,例如每個(gè)工作日上午9點(diǎn)到下午5點(diǎn)為工作時(shí)間段。

具體的,所述關(guān)聯(lián)度用于表征所述待識(shí)別用戶出現(xiàn)在所述預(yù)設(shè)地理區(qū)域的情況,即所述待識(shí)別用戶所處的地理位置與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度。待識(shí)別用戶在第一時(shí)間段內(nèi)在預(yù)設(shè)地理區(qū)域出現(xiàn)的越頻繁,表示待識(shí)別用戶與該預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度越高??赏ㄟ^(guò)分析獲取的地理位置數(shù)據(jù)對(duì)應(yīng)的地理位置與預(yù)設(shè)地理區(qū)域的從屬關(guān)系,確定所述待識(shí)別用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度。

第一時(shí)間段的起始時(shí)間點(diǎn)和結(jié)束時(shí)間點(diǎn)可根據(jù)實(shí)際應(yīng)用場(chǎng)景設(shè)定,第一時(shí)間段對(duì)應(yīng)的時(shí)長(zhǎng)也可根據(jù)實(shí)際應(yīng)用場(chǎng)景設(shè)定,這里不做限定,比如第一時(shí)間段的結(jié)束時(shí)間點(diǎn)可以為當(dāng)前時(shí)間點(diǎn),第一時(shí)間段對(duì)應(yīng)的時(shí)長(zhǎng)可以為30天或者15天。

指定團(tuán)隊(duì)所在的地理位置可能包括多個(gè),此時(shí),預(yù)設(shè)地理區(qū)域?yàn)槎鄠€(gè),其中,一個(gè)預(yù)設(shè)區(qū)域包括該指定團(tuán)隊(duì)所在的一個(gè)地理位置,比如騰訊在上海設(shè)置一個(gè)第一辦公地點(diǎn),在北京設(shè)置一個(gè)第二辦公地點(diǎn),則預(yù)設(shè)地理區(qū)域包括兩個(gè),即包含第一辦公地點(diǎn)所在地理位置的地理區(qū)域,以及包含第二辦公地點(diǎn)所在地理位置的地理區(qū)域。因此,本發(fā)明實(shí)施例中的預(yù)設(shè)地理區(qū)域至少包括一個(gè),當(dāng)預(yù)設(shè)地理區(qū)域包括多個(gè)時(shí),需要根據(jù)至少一個(gè)預(yù)設(shè)地理區(qū)域以及所述待識(shí)別用戶的地理位置數(shù)據(jù),確定所述待識(shí)別用戶與所有預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度。

在預(yù)設(shè)地理區(qū)域包含指定團(tuán)隊(duì)所在地理位置的前提下,預(yù)設(shè)地理區(qū)域的大小和覆蓋范圍可根據(jù)實(shí)際應(yīng)用場(chǎng)景設(shè)定,比如地域預(yù)設(shè)地理區(qū)域可以為一個(gè)圓形地理區(qū)域,該圓形地理區(qū)域的圓心為指定團(tuán)隊(duì)所在的地理位置的經(jīng)緯度,該圓形地理區(qū)域的半徑可根據(jù)實(shí)際應(yīng)用場(chǎng)景設(shè)定,這里不做限定。

需要說(shuō)明的是,這里不對(duì)步驟101和步驟102的執(zhí)行順序進(jìn)行限定,也可以先執(zhí)行步驟102,再執(zhí)行步驟101,或者二者同時(shí)執(zhí)行。

優(yōu)選地,將預(yù)設(shè)地理區(qū)域以及所述待識(shí)別用戶的地理位置數(shù)據(jù)存儲(chǔ)至數(shù)據(jù)庫(kù)服務(wù)器。

步驟103,根據(jù)所述關(guān)注度以及所述關(guān)聯(lián)度,利用預(yù)先訓(xùn)練得到的所述指定團(tuán)隊(duì)的二分類模型,識(shí)別所述待識(shí)別用戶是否為所述指定團(tuán)隊(duì)的成員。

具體實(shí)施時(shí),預(yù)先根據(jù)指定團(tuán)隊(duì)的樣本用戶的樣本集,訓(xùn)練得到指定團(tuán)隊(duì)的二分類模型,訓(xùn)練得到指定團(tuán)隊(duì)的二分類模型的方式將在下文進(jìn)行介紹。

本發(fā)明實(shí)施例,將待識(shí)別用戶針對(duì)指定團(tuán)隊(duì)的關(guān)注度以及待識(shí)別用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,構(gòu)成待識(shí)別用戶對(duì)應(yīng)的特征向量,將該特征向量作為指定團(tuán)隊(duì)的二分類模型的輸入,根據(jù)二分類模型的輸出確定待識(shí)別用戶是否為指定團(tuán)隊(duì)的成員,比如,指定團(tuán)隊(duì)為騰訊公司,則將待識(shí)別用戶對(duì)應(yīng)的特征向量作為騰訊公司的二分類模型的輸入,根據(jù)騰訊公司的二分類模型的輸出確定待識(shí)別用戶是否為騰訊公司的員工。

需要說(shuō)明的是,同一待識(shí)別用戶可對(duì)應(yīng)多個(gè)特征向量,比如該待識(shí)別用戶分別對(duì)應(yīng)針對(duì)第一團(tuán)隊(duì)的特征向量以及針對(duì)第二團(tuán)隊(duì)的特征向量,此時(shí),根據(jù)該待識(shí)別用戶針對(duì)第一團(tuán)隊(duì)的特征向量以及第一團(tuán)隊(duì)的二分類模型,確定該待識(shí)別用戶是否為第一團(tuán)隊(duì)的成員,相應(yīng)的,根據(jù)該待識(shí)別用戶針對(duì)第二團(tuán)隊(duì)的特征向量以及第二團(tuán)隊(duì)的二分類模型,確定該待識(shí)別用戶是否為第二團(tuán)隊(duì)的成員。

本發(fā)明實(shí)施例,利用獲取的待識(shí)別用戶關(guān)注指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù)以及保存的待識(shí)別用戶在所述的地理位置這兩種用戶數(shù)據(jù),分別確定出待識(shí)別用戶針對(duì)指定團(tuán)隊(duì)的關(guān)注度和關(guān)聯(lián)度,再根據(jù)待識(shí)別用戶針對(duì)指定團(tuán)隊(duì)的關(guān)注度和關(guān)聯(lián)度,利用指定團(tuán)隊(duì)的二分類模型,自適應(yīng)識(shí)別出該待識(shí)別用戶是否為指定團(tuán)隊(duì)的成員,即,通過(guò)分析待識(shí)別用戶針對(duì)指定團(tuán)隊(duì)的關(guān)注度和關(guān)聯(lián)度對(duì)用戶進(jìn)行分類,確定待識(shí)別用戶是否為指定團(tuán)隊(duì)的成員。相比于現(xiàn)有技術(shù)中僅依據(jù)用戶填寫的數(shù)據(jù)識(shí)別用戶所屬團(tuán)隊(duì)的方式,本發(fā)明實(shí)施例確定關(guān)注度所使用的關(guān)注指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù)以及確定關(guān)聯(lián)度所使用的待識(shí)別用戶所處的地理位置這兩種用戶數(shù)據(jù)的可信度和實(shí)時(shí)性較好,利用這兩種用戶數(shù)據(jù)對(duì)待識(shí)別用戶進(jìn)行所屬團(tuán)隊(duì)識(shí)別,可提高識(shí)別結(jié)果的準(zhǔn)確性。

在本發(fā)明實(shí)施例中的團(tuán)隊(duì)為企業(yè)的場(chǎng)景下,現(xiàn)有技術(shù)通過(guò)爬取用戶在前程無(wú)憂、領(lǐng)英(linkedin)等人才招聘網(wǎng)站中填寫的簡(jiǎn)歷數(shù)據(jù)中的所加入的企業(yè)的數(shù)據(jù),來(lái)識(shí)別該用戶當(dāng)前的任職企業(yè)是否為指定企業(yè)(即識(shí)別該用戶是否為指定企業(yè)的員工),但其中所使用的簡(jiǎn)歷數(shù)據(jù)是由用戶人為填寫的,存在人為的對(duì)所加入的企業(yè)的數(shù)據(jù)造假的可能,因此簡(jiǎn)歷數(shù)據(jù)的可靠性差,并且用戶在離開指定企業(yè)后,可能不會(huì)再對(duì)簡(jiǎn)歷數(shù)據(jù)中所加入的企業(yè)進(jìn)行更新,因此,簡(jiǎn)歷數(shù)據(jù)存在較嚴(yán)重的滯后性。本發(fā)明實(shí)施例中,用戶對(duì)確定關(guān)注度所使用的關(guān)注指定企業(yè)的關(guān)注數(shù)據(jù)以及確定關(guān)聯(lián)度所使用的待識(shí)別用戶所處的地理位置這兩種用戶數(shù)據(jù)進(jìn)行人為造假的難度高,并且,無(wú)需用戶進(jìn)行手動(dòng)更新。

作為一種可能的實(shí)施方式,可按照?qǐng)D2提供的內(nèi)容,確定所述待識(shí)別用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度:

步驟201,針對(duì)獲取的所述待識(shí)別用戶在第一時(shí)間段內(nèi)的每條位置數(shù)據(jù),若該條位置數(shù)據(jù)對(duì)應(yīng)的地理位置屬于所述預(yù)設(shè)地理區(qū)域,則將該條位置數(shù)據(jù)保存至位置數(shù)據(jù)集合。

具體實(shí)施時(shí),針對(duì)獲取的待識(shí)別用戶在第一時(shí)間段內(nèi)上報(bào)至網(wǎng)絡(luò)側(cè)的每條位置數(shù)據(jù),執(zhí)行以下操作后,從而確定位置數(shù)據(jù)集合,該操作為:判斷該位置數(shù)據(jù)對(duì)應(yīng)的地理位置是否屬于預(yù)設(shè)地理區(qū)域,如果是,將該條位置數(shù)據(jù)保存至為位置數(shù)據(jù)集合,如果否,丟棄該條位置數(shù)據(jù)。

步驟202,將位置數(shù)據(jù)集合中包含的位置數(shù)據(jù)的總條數(shù)與所述第一時(shí)間段對(duì)應(yīng)的時(shí)長(zhǎng)的比值,作為所述待識(shí)別用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度。

具體實(shí)施時(shí),統(tǒng)計(jì)位置數(shù)據(jù)集合中所包含的位置數(shù)據(jù)的總條數(shù),將該總條數(shù)與第一時(shí)間段對(duì)應(yīng)的時(shí)長(zhǎng)的比值,作為待識(shí)別用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度。

圖2提供的實(shí)施例僅為一種可能的實(shí)施方式,也可根據(jù)其它方式確定待識(shí)別用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,這里不做限定,比如:統(tǒng)計(jì)待識(shí)別用戶在第一時(shí)間段內(nèi)上報(bào)至網(wǎng)絡(luò)側(cè)的位置數(shù)據(jù)的總條數(shù)l,以及位置數(shù)據(jù)集合中位置數(shù)據(jù)的總條數(shù)q,將q與l的比值作為待識(shí)別用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,或者,將位置數(shù)據(jù)集合中位置數(shù)據(jù)的總條數(shù)作為待識(shí)別用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度。

基于待識(shí)別用戶為指定團(tuán)隊(duì)的成員的情況下,該用戶在一定時(shí)間段內(nèi)會(huì)出現(xiàn)在指定團(tuán)隊(duì)所在的地理區(qū)域的考慮,本發(fā)明實(shí)施例利用第一時(shí)間段內(nèi)待識(shí)別用戶出現(xiàn)在預(yù)設(shè)地理區(qū)域的次數(shù),確定出待識(shí)別用戶與包含指定團(tuán)隊(duì)地理位置的預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,從而在對(duì)待識(shí)別用戶進(jìn)行識(shí)別時(shí),將該關(guān)聯(lián)度作為參考因素之一,可提高識(shí)別結(jié)果的準(zhǔn)確性。

具體實(shí)施時(shí),可采用如下方式預(yù)先訓(xùn)練得到指定團(tuán)隊(duì)的二分類模型:

根據(jù)樣本用戶的特征向量集以及樣本用戶的類別集,利用預(yù)設(shè)分類算法訓(xùn)練得到所述指定團(tuán)隊(duì)的二分類模型;其中,所述特征向量集用于保存每個(gè)樣本用戶的特征向量,所述特征向量包括對(duì)應(yīng)樣本用戶針對(duì)指定團(tuán)隊(duì)的關(guān)注度以及對(duì)應(yīng)樣本用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,所述類別集包括樣本用戶不是指定團(tuán)隊(duì)成員以及樣本用戶是指定團(tuán)隊(duì)的成員兩種類別。

具體實(shí)施時(shí),利用指定團(tuán)隊(duì)的樣本用戶的特征向量集以及樣本用戶的類別集,對(duì)預(yù)設(shè)分類算法中的未知參數(shù)進(jìn)行訓(xùn)練,以確定未知參數(shù)的具體取值,將未知參數(shù)確定后的預(yù)設(shè)分類算法對(duì)應(yīng)的數(shù)學(xué)模型確定為指定團(tuán)隊(duì)的二分類模型。

作為一種可能的實(shí)施方式,所述預(yù)設(shè)分類算法為樸素貝葉斯分類算法或者邏輯回歸分類算法,也可以為其他分類算法,這里不做限定,比如還可以為支持向量機(jī)、決策樹、k近鄰、神經(jīng)網(wǎng)絡(luò)等分類算法。

在預(yù)設(shè)分類算法為邏輯回歸算法的情況下,可按照以下方式訓(xùn)練得到所述指定團(tuán)隊(duì)的二分類模型:

根據(jù)樣本用戶的特征向量集以及樣本用戶的類別集,利用梯度下降法訓(xùn)練得到邏輯回歸預(yù)測(cè)函數(shù)中的未知參數(shù),根據(jù)未知參數(shù)確定后的邏輯回歸預(yù)測(cè)函數(shù)與預(yù)設(shè)概率閾值,確定指定團(tuán)隊(duì)的二分類模型。其中,邏輯回歸預(yù)測(cè)函數(shù)為:其中,xi表示特征向量集中的任一特征向量,hθ(xi)表示特征向量xi對(duì)應(yīng)的樣本用戶為指定團(tuán)隊(duì)成員的概率,xi1表示特征向量xi中的關(guān)注度,xi2表示特征向量xi中的關(guān)聯(lián)度,θ0、θ1、θ2均為未知參數(shù),經(jīng)梯度下降法后,邏輯回歸預(yù)測(cè)參數(shù)中的未知參數(shù)即可確定,具體實(shí)施過(guò)程為現(xiàn)有技術(shù),這里不做贅述。

需要說(shuō)明的是,樣本用戶的特征向量輸入邏輯回歸預(yù)測(cè)函數(shù)hθ(xi)之前,優(yōu)選對(duì)樣本用戶特征向量中的關(guān)注度和關(guān)聯(lián)度進(jìn)行歸一化處理,以提高訓(xùn)練出的二分類模型的精度以及二分類模型在訓(xùn)練過(guò)程中使用梯度下降法求未知參數(shù)的速度,降低訓(xùn)練得到的二分類模型無(wú)法收斂的風(fēng)險(xiǎn)。

具體的,確定的指定團(tuán)隊(duì)的二分類模型為:

若hθ(xj)≥h,待識(shí)別用戶所屬的類別為1;若hθ(xj)<h,待識(shí)別用戶所屬的類別為0;其中,類別為1時(shí),表示待識(shí)別用戶是指定團(tuán)隊(duì)的成員,類別為0時(shí),表示待識(shí)別用戶不是執(zhí)行團(tuán)隊(duì)的成員,hθ(xj)為未知參數(shù)確定后的邏輯回歸預(yù)測(cè)函數(shù),用于表示待識(shí)別用戶是指定團(tuán)隊(duì)的成員的概率,xj表示待識(shí)別用戶對(duì)應(yīng)的特征向量,h表示預(yù)設(shè)概率閾值,h的大小可根據(jù)實(shí)際應(yīng)用場(chǎng)景設(shè)定,這里不做限定,比如h=0.5。

需要說(shuō)明的是,利用基于歸一化處理的樣本用戶特征向量訓(xùn)練出的二分類模型,進(jìn)行團(tuán)隊(duì)成員識(shí)別之前,優(yōu)選將待識(shí)別用戶的特征向量中的關(guān)注度和關(guān)聯(lián)度進(jìn)行歸一化處理。

具體實(shí)施時(shí),將待識(shí)別用戶針對(duì)指定團(tuán)隊(duì)的關(guān)注度xj1以及待識(shí)別用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度xj2代入得到hθ(xj),再將得到的hθ(xj)與h比較,若hθ(xj)≥h,確定待識(shí)別用戶是指定團(tuán)隊(duì)的成員,若hθ(xj)<h,確定待識(shí)別用戶不是指定團(tuán)隊(duì)的成員。

舉例說(shuō)明,假設(shè)訓(xùn)練出來(lái)的θ0=0.8、θ1=2、θ2=1,待識(shí)別用戶歸一化后的特征向量為[0.5,0.2],其中,xj1=0.5,xj2=0.2,h=0.5將xj1和xj2代入公式后,得到hθ(xj)=0.845,大于0.5,則確定該待識(shí)別用戶是指定團(tuán)隊(duì)的員工。

在預(yù)設(shè)分類算法為樸素貝葉斯算法的情況下,可按照以下方式訓(xùn)練得到所述指定團(tuán)隊(duì)的二分類模型:

根據(jù)樣本用戶的特征向量集,以及樣本用戶的類別集,利用樸素貝葉斯算法,訓(xùn)練得到所述指定團(tuán)隊(duì)的二分類模型;其中,所述特征向量集用于保存每個(gè)樣本用戶的特征向量xj,所述特征向量xj包括對(duì)應(yīng)樣本用戶針對(duì)指定團(tuán)隊(duì)的關(guān)注度xj1以及對(duì)應(yīng)樣本用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度xj2,所述類別集y包括樣本用戶不是指定團(tuán)隊(duì)成員以及樣本用戶是指定團(tuán)隊(duì)的成員兩種類別;

其中,假設(shè)特征向量集中的每個(gè)特征(關(guān)注度或關(guān)聯(lián)度)為連續(xù)值并假設(shè)各個(gè)特征服從高斯分布,則樸素貝葉斯算法對(duì)應(yīng)的公式如下:

其中,

其中,

樸素貝葉斯公式中,yi表示所述類別集y中的任一類別,xj表示所述特征向量集x中任一特征向量,p(yi|xj)表示特征向量為xj對(duì)應(yīng)的樣本用戶所屬的類別為yi的概率,p(xj)為特征向量xj在所述特征向量集x中出現(xiàn)的概率,p(yi)為類別yi在所述類別集y中出現(xiàn)的概率,σ'yi為所屬的類別為yi的樣本用戶對(duì)應(yīng)的特征向量中,特征xj1的標(biāo)準(zhǔn)差,η'yi為所屬的類別為yi的樣本用戶對(duì)應(yīng)的特征向量中,特征xj1的均值,σ″yi為所屬的類別為yi的樣本用戶對(duì)應(yīng)的特征向量中,特征xj2的標(biāo)準(zhǔn)差,η″yi為所屬的類別為yi的樣本用戶對(duì)應(yīng)的特征向量中,特征xj2的均值,σ'為所有樣本用戶對(duì)應(yīng)的特征向量中,特征xj1的標(biāo)準(zhǔn)差,η'為所有樣本用戶對(duì)應(yīng)的特征向量中,特征xj1的均值,σ”為所有樣本用戶對(duì)應(yīng)的特征向量中,特征xj2的標(biāo)準(zhǔn)差,η”為所有樣本用戶對(duì)應(yīng)的特征向量中,特征xj2的均值,xj1為特征向量xj中的關(guān)注度,xj2為特征向量xj中的關(guān)聯(lián)度。其中,標(biāo)準(zhǔn)差和均值的計(jì)算方式為現(xiàn)有計(jì)算方式,這里不做贅述。

具體實(shí)施,可令類別集y={y1=0,y2=1},其中,0表示用戶不是指定團(tuán)隊(duì)的成員,1表示用戶是指定團(tuán)隊(duì)的成員。

在預(yù)設(shè)分類算法為樸素貝葉斯算法的情況下,訓(xùn)練得到的指定團(tuán)隊(duì)的二分類模型為:若p(1|xt)>p(0|xt),待識(shí)別用戶所屬類別為1;若p(1|xt)≤p(0|xt),待識(shí)別用戶所屬類別為0。其中,xt為待識(shí)別用戶對(duì)應(yīng)的特征向量。

實(shí)施例二

基于與上述實(shí)施例一同樣的發(fā)明構(gòu)思,本發(fā)明實(shí)施例提供一種團(tuán)隊(duì)成員識(shí)別設(shè)備,用于執(zhí)行上述團(tuán)隊(duì)成員識(shí)別方法,如圖3所示,為本發(fā)明實(shí)施例二中所述的團(tuán)隊(duì)成員識(shí)別設(shè)備的硬件結(jié)構(gòu)示意圖。該團(tuán)隊(duì)成員識(shí)別設(shè)備具體可以為桌面計(jì)算機(jī)、便攜式計(jì)算機(jī)、智能手機(jī)、平板電腦等。具體地,本發(fā)明實(shí)施例二中所述的設(shè)備可以包括處理器301、發(fā)送器302,其中,處理器301,用于根據(jù)從數(shù)據(jù)庫(kù)服務(wù)器獲取的用于表征待識(shí)別用戶關(guān)注指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù),確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度;根據(jù)從所述數(shù)據(jù)庫(kù)服務(wù)器獲取的預(yù)設(shè)地理區(qū)域以及所述待識(shí)別用戶的地理位置數(shù)據(jù),確定所述待識(shí)別用戶與所述預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,其中,所述預(yù)設(shè)地理區(qū)域包含所述指定團(tuán)隊(duì)所在的地理位置,所述關(guān)聯(lián)度用于表征所述待識(shí)別用戶出現(xiàn)在所述預(yù)設(shè)地理區(qū)域的情況;根據(jù)所述關(guān)注度以及所述關(guān)聯(lián)度,利用預(yù)先訓(xùn)練得到的所述指定團(tuán)隊(duì)的二分類模型,識(shí)別所述待識(shí)別用戶是否為所述指定團(tuán)隊(duì)的成員。發(fā)送器302,用于將識(shí)別結(jié)果發(fā)送至所述數(shù)據(jù)庫(kù)服務(wù)器,以使所述數(shù)據(jù)庫(kù)服務(wù)器對(duì)所述識(shí)別結(jié)果進(jìn)行存儲(chǔ)。進(jìn)一步地,本發(fā)明實(shí)施例二中所述的設(shè)備還可以包括存儲(chǔ)器303、輸入裝置304以及輸出裝置305等。其中,存儲(chǔ)器303可以包括只讀存儲(chǔ)器(rom)和隨機(jī)存取存儲(chǔ)器(ram),并向處理器301提供存儲(chǔ)器303中存儲(chǔ)的程序指令和數(shù)據(jù),在本發(fā)明實(shí)施例中,存儲(chǔ)器303可以用于存儲(chǔ)團(tuán)隊(duì)成員識(shí)別方法對(duì)應(yīng)的程序;輸入裝置304可以包括鍵盤、鼠標(biāo)、觸摸屏等;輸出裝置305可以包括顯示設(shè)備,如液晶顯示器(liquidcrystaldisplay,lcd)、陰極射線管(cathoderaytube,crt)等。處理器301、發(fā)送器302、存儲(chǔ)器303、輸入裝置304和輸出裝置305可以通過(guò)總線或者其他方式連接,圖3中以通過(guò)總線連接為例。

處理器301調(diào)用存儲(chǔ)器303存儲(chǔ)的程序指令并按照獲得的程序指令執(zhí)行實(shí)施例一提供的團(tuán)隊(duì)成員識(shí)別方法。

可選地,所述關(guān)注數(shù)據(jù)包括以下至少一項(xiàng):

關(guān)注所述指定團(tuán)隊(duì)微信公眾號(hào)的個(gè)數(shù)、關(guān)注所述指定團(tuán)隊(duì)微博的個(gè)數(shù)、下載所述指定團(tuán)隊(duì)開發(fā)的應(yīng)用程序的個(gè)數(shù)、與所述指定團(tuán)隊(duì)相關(guān)新聞的閱讀量、登錄所述指定團(tuán)隊(duì)的相關(guān)網(wǎng)站的次數(shù)。

可選地,所述處理器301在確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度時(shí),具體用于:若所述關(guān)注數(shù)據(jù)包括至少兩項(xiàng),則確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度為所述至少兩項(xiàng)對(duì)應(yīng)的數(shù)值之和。

可選地,所述處理器301在確定所述待識(shí)別用戶與所述預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度時(shí),具體用于:

針對(duì)獲取的所述待識(shí)別用戶在第一時(shí)間段內(nèi)的每條位置數(shù)據(jù),若該條位置數(shù)據(jù)對(duì)應(yīng)的地理位置屬于所述預(yù)設(shè)地理區(qū)域,則將該條位置數(shù)據(jù)保存至位置數(shù)據(jù)集合;將位置數(shù)據(jù)集合中包含的位置數(shù)據(jù)的總條數(shù)與所述第一時(shí)間段對(duì)應(yīng)的時(shí)長(zhǎng)的比值,作為所述待識(shí)別用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度。

可選地,所述處理器301,還用于:按照以下方式預(yù)先訓(xùn)練得到所述指定團(tuán)隊(duì)的二分類模型:

根據(jù)樣本用戶的特征向量集以及樣本用戶的類別集,利用預(yù)設(shè)分類算法訓(xùn)練得到所述指定團(tuán)隊(duì)的二分類模型;其中,所述特征向量集用于保存每個(gè)樣本用戶的特征向量,所述特征向量包括對(duì)應(yīng)樣本用戶針對(duì)指定團(tuán)隊(duì)的關(guān)注度以及對(duì)應(yīng)樣本用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,所述類別集包括樣本用戶不是指定團(tuán)隊(duì)成員以及樣本用戶是指定團(tuán)隊(duì)的成員兩種類別。

可選地,所述預(yù)設(shè)分類算法為樸素貝葉斯分類算法或者邏輯回歸分類算法。

實(shí)施例三

基于與上述實(shí)施例一同樣的發(fā)明構(gòu)思,本發(fā)明實(shí)施例提供一種團(tuán)隊(duì)成員識(shí)別裝置,如圖4所示,包括:

第一確定模塊401,用于根據(jù)獲取的用于表征待識(shí)別用戶關(guān)注指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù),確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度;

第二確定模塊402,用于根據(jù)獲取的預(yù)設(shè)地理區(qū)域以及所述待識(shí)別用戶的地理位置數(shù)據(jù),確定所述待識(shí)別用戶與所述預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,其中,所述預(yù)設(shè)地理區(qū)域包含所述指定團(tuán)隊(duì)所在的地理位置,所述關(guān)聯(lián)度用于表征所述待識(shí)別用戶出現(xiàn)在所述預(yù)設(shè)地理區(qū)域的情況;

第三確定模塊403,用于根據(jù)所述關(guān)注度以及所述關(guān)聯(lián)度,利用預(yù)先訓(xùn)練得到的所述指定團(tuán)隊(duì)的二分類模型,識(shí)別所述待識(shí)別用戶是否為所述指定團(tuán)隊(duì)的成員。

可選地,所述裝置中,所述關(guān)注數(shù)據(jù)包括以下至少一項(xiàng):

關(guān)注所述指定團(tuán)隊(duì)微信公眾號(hào)的個(gè)數(shù)、關(guān)注所述指定團(tuán)隊(duì)微博的個(gè)數(shù)、下載所述指定團(tuán)隊(duì)開發(fā)的應(yīng)用程序的個(gè)數(shù)、與所述指定團(tuán)隊(duì)相關(guān)新聞的閱讀量、登錄所述指定團(tuán)隊(duì)的相關(guān)網(wǎng)站的次數(shù)。

可選地,所述裝置中,所述第一確定模塊,具體用于:

若所述關(guān)注數(shù)據(jù)包括至少兩項(xiàng),則確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度為所述至少兩項(xiàng)對(duì)應(yīng)的數(shù)值之和。

可選地,所述裝置中,所述第二確定模塊,具體包括:

保存單元,用于針對(duì)獲取的所述待識(shí)別用戶在第一時(shí)間段內(nèi)的每條位置數(shù)據(jù),若該條位置數(shù)據(jù)對(duì)應(yīng)的地理位置屬于所述預(yù)設(shè)地理區(qū)域,則將該條位置數(shù)據(jù)保存至位置數(shù)據(jù)集合;

確定單元,用于將位置數(shù)據(jù)集合中包含的位置數(shù)據(jù)的總條數(shù)與所述第一時(shí)間段對(duì)應(yīng)的時(shí)長(zhǎng)的比值,作為所述待識(shí)別用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度。

可選地,所述裝置,還包括:

訓(xùn)練模塊404,用于按照以下方式預(yù)先訓(xùn)練得到所述指定團(tuán)隊(duì)的二分類模型

根據(jù)樣本用戶的特征向量集以及樣本用戶的類別集,利用預(yù)設(shè)分類算法訓(xùn)練得到所述指定團(tuán)隊(duì)的二分類模型;其中,所述特征向量集用于保存每個(gè)樣本用戶的特征向量,所述特征向量包括對(duì)應(yīng)樣本用戶針對(duì)指定團(tuán)隊(duì)的關(guān)注度以及對(duì)應(yīng)樣本用戶與預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度,所述類別集包括樣本用戶不是指定團(tuán)隊(duì)成員以及樣本用戶是指定團(tuán)隊(duì)的成員兩種類別。

可選地,所述裝置中,所述預(yù)設(shè)分類算法為樸素貝葉斯分類算法或者邏輯回歸分類算法。

實(shí)施例四

本發(fā)明實(shí)施例還提供一種團(tuán)隊(duì)成員識(shí)別系統(tǒng),如圖5所示,包括:

數(shù)據(jù)庫(kù)服務(wù)器501,用于存儲(chǔ)用于表征待識(shí)別用戶關(guān)注指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù)、預(yù)設(shè)地理區(qū)域、所述待識(shí)別用戶的地理位置數(shù)據(jù)以及計(jì)算機(jī)服務(wù)器發(fā)送的識(shí)別結(jié)果,其中,所述預(yù)設(shè)地理區(qū)域包含所述指定團(tuán)隊(duì)所在的地理位置,所述關(guān)聯(lián)度用于表征所述待識(shí)別用戶出現(xiàn)在所述預(yù)設(shè)地理區(qū)域的情況;

計(jì)算服務(wù)器502,用于從所述數(shù)據(jù)庫(kù)服務(wù)器獲取所述關(guān)注數(shù)據(jù)、預(yù)設(shè)地理區(qū)域以及所述待識(shí)別用戶的地理位置數(shù)據(jù);根據(jù)所述關(guān)注數(shù)據(jù),確定所述待識(shí)別用戶針對(duì)所述指定團(tuán)隊(duì)的關(guān)注度;根據(jù)所述預(yù)設(shè)地理區(qū)域以及所述待識(shí)別用戶的地理位置數(shù)據(jù),確定所述待識(shí)別用戶與所述預(yù)設(shè)地理區(qū)域的關(guān)聯(lián)度;根據(jù)所述關(guān)注度以及所述關(guān)聯(lián)度,利用預(yù)先訓(xùn)練得到的所述指定團(tuán)隊(duì)的二分類模型,識(shí)別所述待識(shí)別用戶是否為所述指定團(tuán)隊(duì)的成員,并將識(shí)別結(jié)果發(fā)送至所述數(shù)據(jù)庫(kù)服務(wù)器。

其中,計(jì)算服務(wù)器502為實(shí)施例二中的團(tuán)隊(duì)成員識(shí)別設(shè)備。

實(shí)施例五

本申請(qǐng)實(shí)施例提供了一種非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì),所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令,該計(jì)算機(jī)可執(zhí)行指令可執(zhí)行上述實(shí)施例一中的任一團(tuán)隊(duì)成員識(shí)別方法。

利用本發(fā)明實(shí)施例提供的團(tuán)隊(duì)成員識(shí)別設(shè)備、方法及系統(tǒng),具有以下有益效果:

相比于現(xiàn)有技術(shù)中僅依據(jù)用戶填寫的數(shù)據(jù)識(shí)別用戶所屬團(tuán)隊(duì)的方式,本發(fā)明實(shí)施例確定關(guān)注度所使用的關(guān)注指定團(tuán)隊(duì)的關(guān)注數(shù)據(jù)以及確定關(guān)聯(lián)度所使用的待識(shí)別用戶所處的地理位置這兩種用戶數(shù)據(jù)可信度和實(shí)時(shí)性較好,因此,利用這兩種用戶數(shù)據(jù)對(duì)待識(shí)別用戶進(jìn)行所屬團(tuán)隊(duì)識(shí)別,可提高識(shí)別結(jié)果的準(zhǔn)確性。

應(yīng)當(dāng)注意,盡管在上文詳細(xì)描述中提及了團(tuán)隊(duì)成員識(shí)別裝置的若干模塊,但是這種劃分僅僅是示例性的并非強(qiáng)制性的。實(shí)際上,根據(jù)本發(fā)明的實(shí)施方式,上文描述的兩個(gè)或更多模塊的特征和功能可以在一個(gè)模塊中具體化。反之,上文描述的一個(gè)模塊的特征和功能可以進(jìn)一步劃分為由多個(gè)模塊來(lái)具體化。

本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。

這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。

這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。

盡管已描述了本發(fā)明的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對(duì)這些實(shí)施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本發(fā)明范圍的所有變更和修改。

顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1