一種位置信息確定的方法以及服務(wù)器的制造方法
【專利摘要】本發(fā)明實(shí)施例公開了一種位置信息確定的方法,包括:讀取待確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置信息,地理位置信息為關(guān)注目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所在的位置信息;根據(jù)地理位置信息,獲取特征編碼參數(shù);接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù),根據(jù)樣本標(biāo)注參數(shù)以及特征編碼參數(shù)確定模型訓(xùn)練參數(shù);根據(jù)模型訓(xùn)練參數(shù)以及特征編碼參數(shù),確定實(shí)際地理位置信息,實(shí)際地理位置信息用于指示目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。本發(fā)明實(shí)施例還提供一種服務(wù)器。本發(fā)明實(shí)施例可以考慮到關(guān)注該網(wǎng)絡(luò)賬號(hào)的用戶處于動(dòng)態(tài)變化的情況,根據(jù)關(guān)注該網(wǎng)絡(luò)賬號(hào)的用戶的地理位置來確定實(shí)際地理位置信息,從而降低數(shù)據(jù)的失真可能性,提高服務(wù)器確定網(wǎng)絡(luò)賬號(hào)實(shí)際服務(wù)信息的準(zhǔn)確度。
【專利說明】
-種位置信息確定的方法從及服務(wù)器
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及互聯(lián)網(wǎng)通信領(lǐng)域,尤其設(shè)及一種位置信息確定的方法W及服務(wù)器。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,網(wǎng)絡(luò)平臺(tái)開放能力不斷提升,網(wǎng)絡(luò)賬號(hào)的數(shù)量迅速增長, 而且網(wǎng)絡(luò)賬號(hào)的類型和服務(wù)逐步多樣化,不同類型的網(wǎng)絡(luò)賬號(hào)在地域特征上也出現(xiàn)多樣化 趨勢(shì)。
[0003] 在實(shí)際應(yīng)用過程中,通常將網(wǎng)絡(luò)賬號(hào)注冊(cè)的地理位置或者期望服務(wù)的地理位置作 為該網(wǎng)絡(luò)賬號(hào)的地理位置屬性,運(yùn)類信息可W直接獲取,或者進(jìn)行簡單的處理即可直接應(yīng) 用。
[0004] 然而,網(wǎng)絡(luò)賬號(hào)注冊(cè)的地理位置容易出現(xiàn)缺失或者失真等情況,而且關(guān)注網(wǎng)絡(luò)賬 號(hào)的用戶往往處于一個(gè)動(dòng)態(tài)變化的過程,而網(wǎng)絡(luò)賬號(hào)注冊(cè)時(shí)的地理位置或者期望服務(wù)的地 理位置是固定的,不能反映出運(yùn)類動(dòng)態(tài)變化,從而導(dǎo)致數(shù)據(jù)失真,并且不能很好地判斷網(wǎng)絡(luò) 賬號(hào)實(shí)際的服務(wù)范圍。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實(shí)施例提供了一種位置信息確定的方法W及服務(wù)器,可W考慮到關(guān)注該網(wǎng) 絡(luò)賬號(hào)的用戶處于動(dòng)態(tài)變化的情況,能夠根據(jù)關(guān)注該網(wǎng)絡(luò)賬號(hào)的用戶的地理位置來確定實(shí) 際地理位置信息,從而大大降低數(shù)據(jù)的失真可能性,更有效地提高服務(wù)器確定得到網(wǎng)絡(luò)賬 號(hào)的實(shí)際服務(wù)信息的準(zhǔn)確度。
[0006] 有鑒于此,本發(fā)明第一方面提供一種位置信息確定的方法,包括:
[0007] 讀取待確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置信息,所述地理位置信息為關(guān)注所述目標(biāo)網(wǎng) 絡(luò)賬號(hào)的用戶所在的位置信息;
[000引根據(jù)所述地理位置信息,獲取所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù);
[0009] 接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù),并根據(jù)所述樣本標(biāo)注參數(shù)W及所述特征編碼 參數(shù)確定模型訓(xùn)練參數(shù);
[0010] 根據(jù)所述模型訓(xùn)練參數(shù)W及所述特征編碼參數(shù),確定所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地 理位置信息,所述實(shí)際地理位置信息用于指示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。
[0011] 第二方面,本方面實(shí)施例還提供一種服務(wù)器,包括:
[0012] 讀取模塊,用于讀取待確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置信息,所述地理位置信息為 關(guān)注所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所在的位置信息;
[0013] 獲取模塊,用于根據(jù)所述讀取模塊讀取的所述地理位置信息,獲取所述目標(biāo)網(wǎng)絡(luò) 賬號(hào)的特征編碼參數(shù);
[0014] 接收模塊,用于接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù),并根據(jù)所述樣本標(biāo)注參數(shù)W 及所述獲取模塊獲取的所述特征編碼參數(shù)確定模型訓(xùn)練參數(shù);
[0015] 確定模塊,用于根據(jù)所述接收模塊確定的所述模型訓(xùn)練參數(shù)W及所述獲取模塊獲 取的所述特征編碼參數(shù),確定所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位置信息,所述實(shí)際地理位置 信息用于指示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。
[0016] 第=方面,本方面實(shí)施例還提供一種服務(wù)器,包括:存儲(chǔ)器、收發(fā)器、處理器W及總 線系統(tǒng);
[0017] 其中,所述存儲(chǔ)器用于存儲(chǔ)程序;
[0018] 所述處理器用于執(zhí)行所述存儲(chǔ)器中的程序,具體如下步驟:
[0019] 讀取待確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置信息,所述地理位置信息為關(guān)注所述目標(biāo)網(wǎng) 絡(luò)賬號(hào)的用戶所在的位置信息;
[0020] 根據(jù)所述地理位置信息,獲取所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù);
[0021] 接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù),并根據(jù)所述樣本標(biāo)注參數(shù)W及所述特征編碼 參數(shù)確定模型訓(xùn)練參數(shù);
[0022] 根據(jù)所述模型訓(xùn)練參數(shù)W及所述特征編碼參數(shù),確定所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地 理位置信息,所述實(shí)際地理位置信息用于指示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。
[0023] 從W上技術(shù)方案可W看出,本發(fā)明實(shí)施例具有W下優(yōu)點(diǎn):
[0024] 本發(fā)明實(shí)施例中,提供了一種位置信息確定的方法,服務(wù)器先讀取待確定目標(biāo)網(wǎng) 絡(luò)賬號(hào)的地理位置信息,然后根據(jù)地理位置信息,獲取目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù),然后 服務(wù)器接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù),并根據(jù)樣本標(biāo)注參數(shù)W及特征編碼參數(shù)確定模 型訓(xùn)練參數(shù),最后根據(jù)模型訓(xùn)練參數(shù)W及特征編碼參數(shù),確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位 置信息,實(shí)際地理位置信息用于指示目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。通過采用上述方 式確定網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍,可W考慮到關(guān)注該網(wǎng)絡(luò)賬號(hào)的用戶處于動(dòng)態(tài)變化的 情況,能夠根據(jù)關(guān)注該網(wǎng)絡(luò)賬號(hào)的用戶的地理位置來確定實(shí)際地理位置信息,從而大大降 低數(shù)據(jù)的失真可能性,更有效地提高服務(wù)器確定得到網(wǎng)絡(luò)賬號(hào)的實(shí)際服務(wù)信息的準(zhǔn)確度。
【附圖說明】
[0025] 圖1為本發(fā)明實(shí)施例中位置信息確定系統(tǒng)的架構(gòu)圖;
[0026] 圖2為本發(fā)明實(shí)施例中位置信息確定的方法一個(gè)交互實(shí)施例示意圖;
[0027] 圖3為本發(fā)明實(shí)施例中位置信息確定的方法一個(gè)實(shí)施例示意圖;
[0028] 圖4為本發(fā)明實(shí)施例中地理屬性分類系統(tǒng)訓(xùn)練模型圖;
[0029] 圖5為本發(fā)明實(shí)施例中分類器結(jié)構(gòu)示意圖;
[0030] 圖6為本發(fā)明實(shí)施例中服務(wù)器一個(gè)實(shí)施例示意圖;
[0031 ]圖7為本發(fā)明實(shí)施例中服務(wù)器另一個(gè)實(shí)施例示意圖;
[0032] 圖8為本發(fā)明實(shí)施例中服務(wù)器另一個(gè)實(shí)施例示意圖;
[0033] 圖9為本發(fā)明實(shí)施例中服務(wù)器另一個(gè)實(shí)施例示意圖;
[0034] 圖10為本發(fā)明實(shí)施例中服務(wù)器另一個(gè)實(shí)施例示意圖;
[0035] 圖11為本發(fā)明實(shí)施例中服務(wù)器另一個(gè)實(shí)施例示意圖;
[0036] 圖12為本發(fā)明實(shí)施例中服務(wù)器另一個(gè)實(shí)施例示意圖;
[0037] 圖13為本發(fā)明實(shí)施例中服務(wù)器另一個(gè)實(shí)施例示意圖;
[0038] 圖14為本發(fā)明實(shí)施例中服務(wù)器一個(gè)結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0039] 本發(fā)明實(shí)施例提供了一種位置信息確定的方法W及服務(wù)器,可W考慮到關(guān)注該網(wǎng) 絡(luò)賬號(hào)的用戶處于動(dòng)態(tài)變化的情況,能夠根據(jù)關(guān)注該網(wǎng)絡(luò)賬號(hào)的用戶的地理位置來確定實(shí) 際地理位置信息,從而大大降低數(shù)據(jù)的失真可能性,更有效地提高服務(wù)器確定得到網(wǎng)絡(luò)賬 號(hào)的實(shí)際服務(wù)信息的準(zhǔn)確度。
[0040] 本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語"第一"、"第二"、"第="、"第 四"等(如果存在)是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理 解運(yùn)樣使用的數(shù)據(jù)在適當(dāng)情況下可W互換,W便運(yùn)里描述的本發(fā)明的實(shí)施例例如能夠W除 了在運(yùn)里圖示或描述的那些W外的順序?qū)嵤4送?,術(shù)語"包括"和"具有"W及他們的任何 變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn) 品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶\(yùn) 些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
[0041] 應(yīng)理解,本發(fā)明實(shí)施例中信息推送的控制方法應(yīng)用于位置信息確定系統(tǒng)中,請(qǐng)參 閱圖1,圖1為本發(fā)明實(shí)施例中位置信息確定系統(tǒng)的架構(gòu)圖,如圖所示,用于提供服務(wù)的主移 動(dòng)終端與服務(wù)器之間建立通信連接,主移動(dòng)終端提供目標(biāo)網(wǎng)絡(luò)賬號(hào),多個(gè)獲取主移動(dòng)移動(dòng) 服務(wù)的副移動(dòng)終端關(guān)注了目標(biāo)網(wǎng)絡(luò)賬號(hào),也可W稱為是目標(biāo)網(wǎng)絡(luò)賬號(hào)的"粉絲",主移動(dòng)終 端將提供的服務(wù)上傳至服務(wù)器,其他的副移動(dòng)終端通過關(guān)注主移動(dòng)終端來獲取主移動(dòng)終端 提供的服務(wù)器。
[0042] 而不同類型的目標(biāo)網(wǎng)絡(luò)賬號(hào)在地域特征上也出現(xiàn)了多樣化的趨勢(shì),有一些目標(biāo)網(wǎng) 絡(luò)賬號(hào)面向全國粉絲體提供無差別服務(wù),而另一些目標(biāo)網(wǎng)絡(luò)賬號(hào)則針對(duì)目標(biāo)省份或者目標(biāo) 地區(qū)的粉絲提供面向本地生活和本地信息的定向服務(wù),運(yùn)些目標(biāo)網(wǎng)絡(luò)賬號(hào)在服務(wù)覆蓋的地 理范圍上都出現(xiàn)了較大的差異,伴隨著平臺(tái)商業(yè)推廣、捜索和廣告等業(yè)務(wù)的深入開展,因此 需要了解目標(biāo)網(wǎng)絡(luò)賬號(hào)實(shí)際服務(wù)的地理范圍信息。
[0043] 需要說明的是,本發(fā)明方案中的主移動(dòng)終端和副移動(dòng)終端可W是智能手機(jī)、平板 電腦、個(gè)人數(shù)字助理(英文全稱:Personal Digital Assistant,英文縮寫:PDA)或者車載電 腦等,此處不應(yīng)理解為對(duì)本發(fā)明的限定。
[0044] 為了便于理解,請(qǐng)參閱圖2,圖2為本發(fā)明實(shí)施例中位置信息確定的方法一個(gè)交互 實(shí)施例示意圖,如圖所示,步驟101中,移動(dòng)終端先向服務(wù)器發(fā)送目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置 信息,目標(biāo)網(wǎng)絡(luò)賬號(hào)可W是一個(gè)用于為用戶提供服務(wù)的公眾賬號(hào),多個(gè)移動(dòng)終端分別向服 務(wù)器發(fā)送其所在的地理位置信息,例如在哪個(gè)省市,或者具體的經(jīng)締度等信息。步驟102中, 服務(wù)器會(huì)從多個(gè)移動(dòng)終端提供的地理位置信息中提取對(duì)應(yīng)的特征編碼參數(shù)。接著在步驟 103中,用戶還可W通過移動(dòng)終端向服務(wù)器發(fā)送一組或多組用戶網(wǎng)絡(luò)賬號(hào)對(duì)應(yīng)的樣本標(biāo)注 參數(shù),服務(wù)器通過機(jī)器學(xué)習(xí)的方法,利用運(yùn)些樣本標(biāo)注參數(shù)計(jì)算出模型訓(xùn)練參數(shù),即生成分 類器。最后,服務(wù)器在步驟105中,利用生成的分類器,W及從目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置信息 中提取的特征編碼參數(shù),確定出目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位置信息。
[0045] 下面將從服務(wù)器的角度,對(duì)本發(fā)明中位置信息確定的方法進(jìn)行介紹,請(qǐng)參閱圖3, 本發(fā)明實(shí)施例中位置信息確定的方法一個(gè)實(shí)施例包括:
[0046] 201、讀取待確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置信息,地理位置信息為關(guān)注目標(biāo)網(wǎng)絡(luò)賬 號(hào)的用戶所在的位置信息;
[0047] 本實(shí)施例中,服務(wù)器首先讀取待確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置信息,其中,目標(biāo)網(wǎng) 絡(luò)賬號(hào)可W是一個(gè)為多用戶提供服務(wù)器的公眾賬號(hào),例如微博賬號(hào)或者微信公眾號(hào)等。而 地理位置信息為關(guān)注目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所在的位置信息,可W認(rèn)為是目標(biāo)網(wǎng)絡(luò)賬號(hào)的 "粉絲"所在的位置。
[0048] 目標(biāo)網(wǎng)絡(luò)賬號(hào)在注冊(cè)的時(shí)候,運(yùn)營者可W選擇所在的地理位置坐標(biāo)點(diǎn)或者所在的 國家、省份和城市信息,作為目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置屬性。運(yùn)類信息通常是目標(biāo)網(wǎng)絡(luò)賬號(hào) 屬主注冊(cè)或者期望服務(wù)的地點(diǎn),與目標(biāo)網(wǎng)絡(luò)賬號(hào)服務(wù)實(shí)際覆蓋的地理范圍往往有較大的差 異,而目標(biāo)網(wǎng)絡(luò)賬號(hào)粉絲的實(shí)際地理分布,更能客觀地反映出目標(biāo)網(wǎng)絡(luò)賬號(hào)服務(wù)實(shí)際覆蓋 的地理范圍。
[0049] 其中,獲取關(guān)注目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所在地理位置信息可W通過W下方式提取, 例如可W從無線保真(英文全稱:Wireless-Fidelity,英文縮寫:WiFi)、網(wǎng)絡(luò)之間互連的協(xié) 議(英文全稱:Internet Protocol,英文縮寫:IP)地址、基于位置服務(wù)(英文全稱:Location Based Service,英文縮寫:LBS)W及用戶屬性中所在的城市、省份或國家等信息中提取用 戶所在地理位置信息,此處不作限定。
[0050] 202、根據(jù)地理位置信息,獲取目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù);
[0051] 本實(shí)施例中,服務(wù)器根據(jù)獲取到關(guān)注者的地理位置信息,可W從中再提取和計(jì)算 運(yùn)些地理位置信息的特征編碼參數(shù)。
[0052] 203、接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù),并根據(jù)樣本標(biāo)注參數(shù)W及特征編碼參數(shù) 確定模型訓(xùn)練參數(shù);
[0053] 本實(shí)施例中,服務(wù)器為了生成可用于確定出關(guān)注目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所在的位置 信息屬于哪一種地域分布類型的模型,首先將接收用戶發(fā)送的一組或多組用戶網(wǎng)絡(luò)賬號(hào)的 樣本標(biāo)注參數(shù),根據(jù)機(jī)器學(xué)習(xí)算法,利用樣本標(biāo)注參數(shù)W及特征編碼參數(shù)訓(xùn)練出一組模型 訓(xùn)練參數(shù),即得到一組分類器。
[0054] 204、根據(jù)模型訓(xùn)練參數(shù)W及特征編碼參數(shù),確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位置信 息,實(shí)際地理位置信息用于指示目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。
[0055] 本實(shí)施例中,服務(wù)器根據(jù)訓(xùn)練得到的模型訓(xùn)練參數(shù),W及從關(guān)注目標(biāo)網(wǎng)絡(luò)賬號(hào)的 用戶所在地理位置信息中提取特征編碼參數(shù),計(jì)算得到目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位置信 息,實(shí)際地理位置信息用于指示目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。
[0056] 具體地,服務(wù)器根據(jù)模型訓(xùn)練參數(shù)得到一組分類器,然后將特征編碼參數(shù)輸入至 分類器中,分類器將目標(biāo)網(wǎng)絡(luò)賬號(hào)按照其關(guān)注人群的地域分布分成若干個(gè)類型。通過運(yùn)種 方法計(jì)算目標(biāo)網(wǎng)絡(luò)賬號(hào)關(guān)注用戶人群的地理分布屬性,將網(wǎng)絡(luò)賬號(hào)關(guān)注用戶人群地理分布 屬性作為目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置屬性。
[0057] 本發(fā)明實(shí)施例中,提供了一種位置信息確定的方法,服務(wù)器先讀取待確定目標(biāo)網(wǎng) 絡(luò)賬號(hào)的地理位置信息,然后根據(jù)地理位置信息,獲取目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù),然后 服務(wù)器接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù),并根據(jù)樣本標(biāo)注參數(shù)W及特征編碼參數(shù)確定模 型訓(xùn)練參數(shù),最后根據(jù)模型訓(xùn)練參數(shù)W及特征編碼參數(shù),確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位 置信息,實(shí)際地理位置信息用于指示目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。通過采用上述方 式確定網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍,可W考慮到關(guān)注該網(wǎng)絡(luò)賬號(hào)的用戶處于動(dòng)態(tài)變化的 情況,能夠根據(jù)關(guān)注該網(wǎng)絡(luò)賬號(hào)的用戶的地理位置來確定實(shí)際地理位置信息,從而大大降 低數(shù)據(jù)的失真可能性,更有效地提高服務(wù)器確定得到網(wǎng)絡(luò)賬號(hào)的實(shí)際服務(wù)信息的準(zhǔn)確度。
[0058] 可選地,在上述圖3對(duì)應(yīng)的實(shí)施例的基礎(chǔ)上,本發(fā)明實(shí)施例提供的位置信息確定的 方法第一個(gè)可選實(shí)施例中,特征編碼參數(shù)包括歸一化向量、規(guī)模系數(shù)W及峰度系數(shù);
[0059] 根據(jù)地理位置信息,獲取目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù),可W包括:
[0060] 根據(jù)地理位置信息計(jì)算規(guī)模系數(shù);
[0061] 根據(jù)地理位置信息計(jì)算歸一化向量;
[0062] 根據(jù)歸一化向量計(jì)算峰度系數(shù)。
[0063] 本實(shí)施例中,服務(wù)器根據(jù)地理位置信息,獲取目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù)具體 可W是,服務(wù)器先根據(jù)地理位置信息計(jì)算規(guī)模系數(shù),然后根據(jù)地理位置信息W及規(guī)模系數(shù) 計(jì)算得到歸一化向量,最后通過歸一化向量計(jì)算得到峰度系數(shù),
[0064] 為了便于介紹,請(qǐng)參閱圖4,圖4為本發(fā)明實(shí)施例中地理屬性分類系統(tǒng)訓(xùn)練模型圖, 如圖所示,實(shí)體箭頭表示數(shù)據(jù)的流向,虛線箭頭表示分類器控制信息的流向。地理屬性分類 系統(tǒng)訓(xùn)練模型中主要包含四個(gè)模塊,分別為特征編碼模塊、樣本標(biāo)注模塊、模型訓(xùn)練模塊和 分類器模塊。其中,特征編碼模塊用于獲取目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù),然后將特征編碼 參數(shù)分別輸入至模型訓(xùn)練模塊和分類器。
[0065] 其次,本發(fā)明實(shí)施例中,舉例了說明了目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù)包括了規(guī)模 系數(shù)、歸一化向量W及峰度系數(shù),并且服務(wù)器根據(jù)地理位置信息計(jì)算規(guī)模系數(shù)W及歸一化 向量,再根據(jù)歸一化相鄰計(jì)算出峰度系數(shù)。采用上述方式提升方案在實(shí)際應(yīng)用中的可行性。
[0066] 可選地,在上述圖3或圖3對(duì)應(yīng)的第一個(gè)實(shí)施例的基礎(chǔ)上,本發(fā)明實(shí)施例提供的位 置信息確定的方法第二個(gè)可選實(shí)施例中,根據(jù)地理位置信息計(jì)算規(guī)模系數(shù),可W包括:
[0067] 按照如下方式計(jì)算規(guī)模系數(shù):
[006引
[0069] Mf表示目標(biāo)網(wǎng)絡(luò)賬號(hào)f規(guī)模系數(shù)
[0070] Cfi表示目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為i區(qū)域的人數(shù),其中,Cf冷Cf(W);
[0071]
用于表示目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為從i = 〇到i=n區(qū)域中的總?cè)藬?shù),n表示總 區(qū)域數(shù)量。
[0072] 本實(shí)施例中,服務(wù)器采用地理屬性分類系統(tǒng)訓(xùn)練模型中的特征編碼模塊計(jì)算規(guī)模 系數(shù),運(yùn)些規(guī)模系數(shù)為關(guān)注目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶當(dāng)前地理位置信息所對(duì)應(yīng)的規(guī)模系數(shù),因 此在實(shí)際計(jì)算中會(huì)得到至少一個(gè)規(guī)模系數(shù)。此處為了便于說明,僅W計(jì)算一個(gè)規(guī)模系數(shù)為 例進(jìn)行介紹。
[0073] 假設(shè)當(dāng)前收集到目標(biāo)網(wǎng)絡(luò)賬號(hào)的各地關(guān)注人數(shù)如下表1所示:
[0074] 表 1 「007^11
[0076] 根據(jù)上表,可W按照地域?qū)傩詫?duì)運(yùn)些數(shù)據(jù)進(jìn)行聚合,生成一組變量Cf I,Cf 2,Cf 3, Cf4, ...,C迎,其中,Cf康示目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為i區(qū)域的人數(shù),退域具體可W是按照省 份劃分的區(qū)域,n則表示區(qū)域的總數(shù)。
[0077] 為了更準(zhǔn)確地提取關(guān)注目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶分布特征,需要采用人數(shù)從多到少的 排列方式,即Cf冷Cf (i+i)
[0078] 按照如下方式計(jì)算賬號(hào)f的規(guī)模系數(shù):
[0079]
[0080] 再次,本發(fā)明實(shí)施例中,服務(wù)器可W采用公式計(jì)算規(guī)模系數(shù),通過公式的計(jì)算得到 合理的規(guī)模系數(shù),W此提升方案的實(shí)用性和可行性。
[0081] 可選地,在上述圖3、圖3對(duì)應(yīng)的第一或第二個(gè)實(shí)施例的基礎(chǔ)上,本發(fā)明實(shí)施例提供 的位置信息確定的方法第=個(gè)可選實(shí)施例中,根據(jù)地理位置信息計(jì)算歸一化向量,可W包 括:
[00821 格昭々n下節(jié)井A管歸一化向量;
[008;
[0084] kfi表示目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為i區(qū)域的人數(shù)所對(duì)應(yīng)的歸一化值,多個(gè)歸一化值組 成歸一化向量,kfi的取值范圍為大于0且小于1。
[0085] 本實(shí)施例中,假設(shè)已經(jīng)根據(jù)表1計(jì)算得到當(dāng)前的規(guī)模系數(shù)為19939,于是可W結(jié)合 表1中的數(shù)據(jù)計(jì)算每個(gè)區(qū)域的歸一化值。
[0086] 按照如下方式計(jì)算廣東省的歸一化值:
[0087]
[0088] 其他區(qū)域的歸一化值也可W采用上述方式進(jìn)行計(jì)算,多個(gè)歸一化值最后可W組成 歸一化向量。
[0089] 進(jìn)一步地,本發(fā)明實(shí)施例中,在得到規(guī)模系數(shù)的基礎(chǔ)上,還可W利用公式計(jì)算得到 歸一化向量,W此提升服務(wù)器計(jì)算歸一化向量的可行性W及合理性。
[0090] 可選地,在上述圖3、圖3對(duì)應(yīng)的第一至第=個(gè)中任一項(xiàng)實(shí)施例的基礎(chǔ)上,本發(fā)明實(shí) 施例提供的位置信息確定的方法第四個(gè)可選實(shí)施例中,根據(jù)歸一化向量計(jì)算峰度系數(shù),可 W包括:
[0091] 按照化下方式計(jì)算峰麼系數(shù):
[0092]
[0093]
[0094] 表示目標(biāo)網(wǎng)絡(luò)賬號(hào)f預(yù)設(shè)的歸一化向量中歸一化值的平均值;
[00%] N表示預(yù)設(shè)的參數(shù),N的取值范圍為大于0且小于等于所述i;
[0096] kfN表不第N個(gè)歸一化向量中的歸一化值,化fi,kf2,kf3,kf4,. . . ,kfN)表不歸一化向 量中的一組子歸一化向量;
[0097] Kurtf表示目標(biāo)網(wǎng)絡(luò)賬號(hào)f的峰度系數(shù),峰度系數(shù)用于表示分布睹緩程度;
[0098] 笑注目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所分布的的四階矩;
[0099] g示關(guān)注目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所分布的的二階矩。
[0100] 本實(shí)施例中,假設(shè)已經(jīng)根據(jù)表1計(jì)算得到當(dāng)前的規(guī)模系數(shù)為19939,且廣東省的歸 一化值為0.07347,于是可W繼續(xù)結(jié)合表1中的數(shù)據(jù)計(jì)算每個(gè)區(qū)域的峰度系數(shù)。
[0101 ]首先根據(jù)表1中的各個(gè)數(shù)據(jù),采用如下公式:
[0102]
[0103] 計(jì)算得到目標(biāo)網(wǎng)絡(luò)賬號(hào)f預(yù)設(shè)的歸一化向量中歸一化值的平均值,然后采用如下 公式計(jì)算得到,目標(biāo)網(wǎng)絡(luò)賬號(hào)f的峰麼系數(shù):
[0104]
[0105] 更進(jìn)一步地,本發(fā)明實(shí)施例中,在服務(wù)器計(jì)算得到規(guī)模系數(shù)和歸一化向量的基礎(chǔ) 上,可W利用公式繼續(xù)計(jì)算得到峰度系數(shù),W此提升服務(wù)器計(jì)算峰度系數(shù)的可行性和合理 性。
[0106] 可選地,在上述圖3、圖3對(duì)應(yīng)的第一至第四個(gè)中任一項(xiàng)實(shí)施例的基礎(chǔ)上,本發(fā)明實(shí) 施例提供的位置信息確定的方法第五個(gè)可選實(shí)施例中,接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參 數(shù),可W包括:
[0107] 接收一組用戶網(wǎng)絡(luò)賬號(hào).
[0108] 按照地理位置分布類型生成一組用戶網(wǎng)絡(luò)賬號(hào)對(duì)應(yīng)的樣本標(biāo)注參數(shù)。
[0109] 本實(shí)施例中,地理屬性分類系統(tǒng)訓(xùn)練模型中的標(biāo)注樣本模塊為用戶提供了一個(gè)數(shù) 據(jù)標(biāo)注的接口模塊,用戶可W通過運(yùn)個(gè)接口將一組用戶網(wǎng)絡(luò)賬號(hào). . .,f 俞入標(biāo)注樣本模塊,標(biāo)注樣本模塊將按照地域分布類型生成樣本標(biāo)注參數(shù) ^/(〇)'^/(1),^/口)'^/'口),~^/^1),然后將樣本標(biāo)注參數(shù)傳遞給模型訓(xùn)練模塊,用于進(jìn)行 模型訓(xùn)練。
[0110] 其次,本發(fā)明實(shí)施例中,服務(wù)器在接收一組用戶網(wǎng)絡(luò)賬號(hào)后,可W按照地理位置分 布類型生成一組用戶網(wǎng)絡(luò)賬號(hào)對(duì)應(yīng)的樣本標(biāo)注參數(shù)。通過上述方式能夠靈活地獲取到用戶 提供的用戶網(wǎng)絡(luò)賬號(hào),并生成樣本標(biāo)注參數(shù),如果用戶提供的數(shù)據(jù)足夠多,所得到的樣本標(biāo) 注參數(shù)也越多,從而使得訓(xùn)練出的模型擬合度越高,從而提升方案的準(zhǔn)確度。
[0111] 可選地,在上述圖3、圖3對(duì)應(yīng)的第一至第五個(gè)中任一項(xiàng)實(shí)施例的基礎(chǔ)上,本發(fā)明實(shí) 施例提供的位置信息確定的方法第六個(gè)可選實(shí)施例中,根據(jù)樣本標(biāo)注參數(shù)W及特征編碼參 數(shù)確定模型訓(xùn)練參數(shù),可W包括:
[0112] 按照規(guī)模系數(shù)將樣本標(biāo)注參數(shù)分配至不同的標(biāo)注數(shù)據(jù)子集合;
[0113] 對(duì)每個(gè)標(biāo)注數(shù)據(jù)子集合進(jìn)行模型訓(xùn)練,并得到模型訓(xùn)練的結(jié)果;
[0114] 根據(jù)模型訓(xùn)練的結(jié)果確定模型訓(xùn)練參數(shù)。
[0115] 本實(shí)施例中,服務(wù)器根據(jù)樣本標(biāo)注參數(shù)W及特征編碼參數(shù)確定模型訓(xùn)練參數(shù)的步 驟可W是,服務(wù)器先按照峰度系數(shù)將樣本標(biāo)注數(shù)據(jù)分配至不同的標(biāo)注數(shù)據(jù)子集合,具體為:
[0116] 地理屬性分類系統(tǒng)訓(xùn)練模型中的模型訓(xùn)練模塊接收樣本標(biāo)注模塊輸出的樣本標(biāo) 注參數(shù)L/"),L/'(i),L尸2>,Lf。1>尸1 )和特征編碼模塊輸出的歸一化向量kfi,kf2,kf3, kf4, ...,kfN、規(guī)模系數(shù)Mf和峰度系數(shù)Kudf,模型訓(xùn)練模塊可W按照規(guī)模系數(shù)Mf將樣本標(biāo)注 參數(shù)L戶。>,Iy",L嚴(yán),,L戶,...,L戶",分配到不同的集合中,運(yùn)些集合為Si ,1 = 0,1,2,3,4, 5. .n。分配方式如下:
[0117]
[0118] I即表示每個(gè)標(biāo)注數(shù)據(jù)子集合,通過上述方式將標(biāo)注數(shù)據(jù)集合分成多個(gè)標(biāo)注數(shù)據(jù) 子集合,不同規(guī)模的目標(biāo)網(wǎng)絡(luò)賬號(hào)分到不同的集合中每個(gè)標(biāo)注數(shù)據(jù)子集合Si可W獨(dú)立地進(jìn) 行模型訓(xùn)練,并且針對(duì)不同"粉絲"規(guī)模的目標(biāo)網(wǎng)絡(luò)賬號(hào)獨(dú)立訓(xùn)練模型,可W提高模型分類 的準(zhǔn)確率。在對(duì)每個(gè)標(biāo)注數(shù)據(jù)子集合進(jìn)行模型訓(xùn)練后,可W得到模型訓(xùn)練的結(jié)果,最后根據(jù) 模型訓(xùn)練的結(jié)果確定模型訓(xùn)練參數(shù)。對(duì)每個(gè)標(biāo)注數(shù)據(jù)子集合進(jìn)行模型訓(xùn)練的過程將在下面 第屯個(gè)實(shí)施例中進(jìn)行具體介紹。
[0119] 再次,本發(fā)明實(shí)施例中,服務(wù)器根據(jù)樣本標(biāo)注參數(shù)W及特征編碼參數(shù)確定模型訓(xùn) 練參數(shù),可W是先按照規(guī)模系數(shù)將樣本標(biāo)注參數(shù)分配至不同的標(biāo)注數(shù)據(jù)子集合,然后對(duì)每 個(gè)標(biāo)注數(shù)據(jù)子集合進(jìn)行模型訓(xùn)練,并得到模型訓(xùn)練的結(jié)果,最后根據(jù)模型訓(xùn)練的結(jié)果確定 模型訓(xùn)練參數(shù)。通過上述方法,服務(wù)器可W針對(duì)不同"粉絲"規(guī)模的目標(biāo)網(wǎng)絡(luò)賬號(hào)獨(dú)立進(jìn)行 訓(xùn)練,W此提高模型分類的準(zhǔn)確率。
[0120] 可選地,在上述圖3、圖3對(duì)應(yīng)的第一至第六個(gè)中任一項(xiàng)實(shí)施例的基礎(chǔ)上,本發(fā)明實(shí) 施例提供的位置信息確定的方法第屯個(gè)可選實(shí)施例中,標(biāo)注數(shù)據(jù)子集合包括標(biāo)注數(shù)據(jù)測(cè)試 集合W及標(biāo)注數(shù)據(jù)訓(xùn)練集合;
[0121 ]標(biāo)注數(shù)據(jù)測(cè)試集合用于對(duì)標(biāo)注數(shù)據(jù)子集合中的第一標(biāo)注數(shù)據(jù)進(jìn)行迭代計(jì)算;
[0122] 標(biāo)注數(shù)據(jù)訓(xùn)練集合用于對(duì)標(biāo)注數(shù)據(jù)子集合中的第二標(biāo)注數(shù)據(jù)進(jìn)行模型訓(xùn)練。
[0123] 本實(shí)施例中,服務(wù)器包括的地理屬性分類系統(tǒng)訓(xùn)練模型中的模型訓(xùn)練模塊,會(huì)對(duì) 每個(gè)標(biāo)注數(shù)據(jù)子集合進(jìn)行模型訓(xùn)練,首先可W將標(biāo)注數(shù)據(jù)子集合劃分為標(biāo)注數(shù)據(jù)測(cè)試集合 W及標(biāo)注數(shù)據(jù)訓(xùn)練集合,
[0124] 下面對(duì)單個(gè)的標(biāo)注數(shù)據(jù)子集合Si模型訓(xùn)練的方式進(jìn)行說明。
[0125] 模型訓(xùn)練模塊采用監(jiān)督學(xué)習(xí)的方式,運(yùn)里可W采用常見的機(jī)器學(xué)習(xí)算法,可W是 決策樹、貝葉斯、線性判別式、邏輯回歸等。
[0126] 其中,決策樹是是直觀運(yùn)用概率分析的一種圖解法,在已知各種情況發(fā)生概率的 基礎(chǔ)上,通過構(gòu)成決策樹來求取凈現(xiàn)值的期望值大于等于零的概率,評(píng)價(jià)項(xiàng)目風(fēng)險(xiǎn),判斷其 可行性。在機(jī)器學(xué)習(xí)中,決策樹是一個(gè)預(yù)測(cè)模型,它代表的是對(duì)象屬性與對(duì)象值之間的一種 映射關(guān)系。
[0127] 貝葉斯為利用捜集到的信息對(duì)原有判斷進(jìn)行修正提供了有效手段。在采樣之前, 對(duì)各種假設(shè)有一個(gè)判斷,即先驗(yàn)概率,關(guān)于先驗(yàn)概率的分布,通??筛?jīng)驗(yàn)判斷確定,當(dāng)無 任何信息時(shí),一般假設(shè)各先驗(yàn)概率相同,較復(fù)雜精確的可利用包括最大賭技術(shù)或邊際分布 密度W及相互信息原理等方法來確定先驗(yàn)概率分布。
[0128] 線性判別式的基本思想是將高維的模式樣本投影到最佳鑒別矢量空間,W達(dá)到抽 取分類信息和壓縮特征空間維數(shù)的效果,投影后保證模式樣本在新的子空間有最大的類間 距離和最小的類內(nèi)距離,即模式在該空間中有最佳的可分離性。
[0129] 邏輯回歸是一種廣義線性回歸,與多重線性回歸分析有很多相同之處。它們的模 型形式基本上相同。
[0130] 需要說明的是,在實(shí)際應(yīng)用中,還可W存在其他的機(jī)器學(xué)習(xí)算法,此處不作限定。
[0131] 接下來,模型訓(xùn)練模塊選取的算法可W用Yi表示,模型訓(xùn)練模塊將標(biāo)注數(shù)據(jù)子集 合Si分為標(biāo)注數(shù)據(jù)測(cè)試集合S Wi和標(biāo)注數(shù)據(jù)訓(xùn)練集合,即將多個(gè)標(biāo)注數(shù)據(jù)子集合分為 第一標(biāo)注數(shù)據(jù)和第二標(biāo)注數(shù)據(jù),第一標(biāo)注數(shù)據(jù)的集合構(gòu)成了標(biāo)注數(shù)據(jù)測(cè)試集合,而第二標(biāo) 注數(shù)據(jù)的集合構(gòu)成了標(biāo)注數(shù)據(jù)訓(xùn)練集合。標(biāo)注數(shù)據(jù)訓(xùn)練集合用于訓(xùn)練模型的參數(shù),標(biāo) 注數(shù)據(jù)測(cè)試集合用于測(cè)試模型的準(zhǔn)確性,模型經(jīng)過多次迭代訓(xùn)練,直至模型的準(zhǔn)確率 收斂到一定狀態(tài)。
[0132] 模型訓(xùn)練針對(duì)不同規(guī)模31的訓(xùn)練出不同的模型,運(yùn)些模型的模型訓(xùn)練參數(shù)^:1'嚴(yán)作 為控制信號(hào)傳輸給分類器;模型訓(xùn)練模塊訓(xùn)練產(chǎn)生多組分類器控制參數(shù),運(yùn)組分類分別對(duì) 不同粉絲規(guī)模目標(biāo)網(wǎng)絡(luò)賬號(hào)進(jìn)行分類。
[0133] 進(jìn)一步地,本發(fā)明實(shí)施例中,可W將標(biāo)注數(shù)據(jù)子集合劃分為標(biāo)注數(shù)據(jù)測(cè)試集合W 及標(biāo)注數(shù)據(jù)訓(xùn)練集合,其中,標(biāo)注數(shù)據(jù)測(cè)試集合用于對(duì)標(biāo)注數(shù)據(jù)子集合中的第一標(biāo)注數(shù)據(jù) 進(jìn)行迭代計(jì)算,標(biāo)注數(shù)據(jù)訓(xùn)練集合用于對(duì)標(biāo)注數(shù)據(jù)子集合中的第二標(biāo)注數(shù)據(jù)進(jìn)行模型訓(xùn) 練。通過上述方式,可W訓(xùn)練出擬合度更高的模型,而且在對(duì)標(biāo)注數(shù)據(jù)的測(cè)試和訓(xùn)練中不斷 完善模型,提升模型的動(dòng)態(tài)適應(yīng)性。
[0134] 可選地,在上述圖3、圖3對(duì)應(yīng)的第一至第屯個(gè)中任一項(xiàng)實(shí)施例的基礎(chǔ)上,本發(fā)明實(shí) 施例提供的位置信息確定的方法第八個(gè)可選實(shí)施例中,根據(jù)模型訓(xùn)練參數(shù)W及特征編碼參 數(shù),確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位置信息,可W包括:
[0135] 根據(jù)規(guī)模系數(shù),將目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù)分配至子分類器中,子分類器用 于根據(jù)特征編碼參數(shù)輸出目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置屬性類別,地理位置屬性類別包括集中 型、局部分散型W及全局分散型中的一種;
[0136] 根據(jù)地理位置屬性類別確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位置信息。
[0137] 本實(shí)施例中,模型訓(xùn)練參數(shù)用于生成分類器,請(qǐng)參閱圖5,圖5為本發(fā)明實(shí)施例中分 類器結(jié)構(gòu)示意圖,如圖所示,分類器包括了分組函數(shù)W及多個(gè)子分類器Yl至Yn,子分類器通 ??蒞是指機(jī)器學(xué)習(xí)算法,不同的子分類器可W選擇不同的機(jī)器學(xué)習(xí)算法,例如決策樹、貝 葉斯、線性判別式或邏輯回歸等。
[0138] 分組函數(shù)按照特征編碼參數(shù)中的規(guī)模系數(shù),將特征編碼參數(shù)分配到相應(yīng)的子分類 器中,子分類器接收特征編碼參數(shù)中的歸一化向量和峰度系數(shù),然后輸出目標(biāo)網(wǎng)絡(luò)賬號(hào)的 地理位置屬性類別。
[0139] 地理位置屬性類別包括集中型、局部分散型W及全局分散型中的一種,其中,集中 型表示目標(biāo)網(wǎng)絡(luò)賬號(hào)的關(guān)注用戶集中分布在單一的城市,局部分散型表示目標(biāo)網(wǎng)絡(luò)賬號(hào)的 關(guān)注用戶集中分布在某一省份的城市或者地理位置相鄰的城市群,全局分散型表示目標(biāo)網(wǎng) 絡(luò)賬號(hào)的關(guān)注用戶分布在全國范圍內(nèi)的多個(gè)城市,運(yùn)些城市在地理位置上并不是相鄰的。
[0140] 對(duì)于集中型的目標(biāo)網(wǎng)絡(luò)賬號(hào),則可W進(jìn)一步確定該目標(biāo)網(wǎng)絡(luò)賬號(hào)集中的城市,即 采用統(tǒng)計(jì)法確定。對(duì)于局部分散性的目標(biāo)網(wǎng)絡(luò)賬號(hào),將可W進(jìn)一步計(jì)算出其分散區(qū)域所在 的省份。
[0141] 其次,本發(fā)明實(shí)施例中,服務(wù)器根據(jù)模型訓(xùn)練參數(shù)W及特征編碼參數(shù),確定目標(biāo)網(wǎng) 絡(luò)賬號(hào)的實(shí)際地理位置信息,具體可W先根據(jù)規(guī)模系數(shù),將目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù) 分配至子分類器中,子分類器用于根據(jù)特征編碼參數(shù)輸出目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置屬性類 另IJ,地理位置屬性類別包括集中型、局部分散型W及全局分散型中的一種,最后根據(jù)地理位 置屬性類別確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位置信息。采用上述方式,具體構(gòu)建了一個(gè)可用 于輸出目標(biāo)網(wǎng)絡(luò)賬號(hào)實(shí)際地理位置信息的模型,訓(xùn)練模型中的分類器引入了多個(gè)子分類 器,充分考慮到了目標(biāo)網(wǎng)絡(luò)賬號(hào)規(guī)模的多樣性,從數(shù)據(jù)層面訓(xùn)練出多個(gè)子分類器,每個(gè)子分 類器只針對(duì)某一個(gè)規(guī)模的目標(biāo)網(wǎng)絡(luò)賬號(hào),運(yùn)樣的模型能夠與訓(xùn)練數(shù)據(jù)更好地你擬合,提高 模型的識(shí)別能力。
[0142] 為便于理解,下面W-個(gè)具體應(yīng)用場(chǎng)景對(duì)本發(fā)明中一種位置信息確定的方法進(jìn)行 詳細(xì)描述,具體為:
[0143] 甲公司開設(shè)了一個(gè)公眾賬號(hào)A,目前有30個(gè)不同區(qū)域的用戶關(guān)注甲公司的公眾賬 號(hào)A,關(guān)注的情況如表2所示:
[0144] 表2
[0146]
[0147] 現(xiàn)在需要確定公眾賬號(hào)A實(shí)際服務(wù)的地區(qū),于是服務(wù)器采用地理屬性分類系統(tǒng)訓(xùn) 練模型中的特征編碼模塊計(jì)算規(guī)模系數(shù),即:
[014 引
[0149] 且上述計(jì)算已滿足Cfi^Cf(W)的條件。
[0150] 然后分別計(jì)算每個(gè)區(qū)域的歸一化值,W重慶市為例,即:
[0151]
[0152] W此類推,計(jì)算出各個(gè)地區(qū)的歸一化值,根據(jù)各個(gè)地區(qū)的歸一化值組成歸一化向 量,如表2所示。
[0153] 接下來,計(jì)算出歸一化向量中歸一化值的平均值,即: 「01541
[0155]最后,計(jì)算目標(biāo)網(wǎng)絡(luò)賬號(hào)的峰度系數(shù),即:
[0156]
[0157] 將運(yùn)些數(shù)據(jù)輸入至模型中的分類器,由于分類器根據(jù)規(guī)模系數(shù)15211將特征數(shù)據(jù) 分配到子分類器Y中,子分類器Y采用邏輯回歸算法。子分類器Y接收歸一化向量和峰度系 數(shù),輸出公眾賬號(hào)A最終地理位置屬性類別為局部分散型,并可W進(jìn)一步得到分散區(qū)域所在 的省份為重慶、北京、上海和天津。
[0158] 于是將公眾賬號(hào)A的實(shí)際服務(wù)區(qū)域確定為重慶。
[0159] 下面對(duì)本發(fā)明中的服務(wù)器進(jìn)行詳細(xì)描述,請(qǐng)參閱圖6,所述服務(wù)器包括:
[0160] 讀取模塊301,用于讀取待確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置信息,所述地理位置信息 為關(guān)注所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所在的位置信息;
[0161 ]獲取模塊302,用于根據(jù)所述讀取模塊301讀取的所述地理位置信息,獲取所述目 標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù);
[0162] 接收模塊303,用于接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù),并根據(jù)所述樣本標(biāo)注參數(shù) W及所述獲取模塊302獲取的所述特征編碼參數(shù)確定模型訓(xùn)練參數(shù);
[0163] 確定模塊304,用于根據(jù)所述接收模塊303確定的所述模型訓(xùn)練參數(shù)W及所述獲取 模塊302獲取的所述特征編碼參數(shù),確定所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位置信息,所述實(shí)際 地理位置信息用于指示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。
[0164] 本實(shí)施例中,讀取模塊301讀取待確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置信息,所述地理位 置信息為關(guān)注所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所在的位置信息,獲取模塊302根據(jù)所述讀取模塊 301讀取的所述地理位置信息,獲取所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù),接收模塊303接收 用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù),并根據(jù)所述樣本標(biāo)注參數(shù)W及所述獲取模塊302獲取的所 述特征編碼參數(shù)確定模型訓(xùn)練參數(shù),確定模塊304根據(jù)所述接收模塊303確定的所述模型訓(xùn) 練參數(shù)W及所述獲取模塊302獲取的所述特征編碼參數(shù),確定所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地 理位置信息,所述實(shí)際地理位置信息用于指示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。
[0165] 本發(fā)明實(shí)施例中,提供了一種位置信息確定的方法,服務(wù)器先讀取待確定目標(biāo)網(wǎng) 絡(luò)賬號(hào)的地理位置信息,然后根據(jù)地理位置信息,獲取目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù),然后 服務(wù)器接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù),并根據(jù)樣本標(biāo)注參數(shù)W及特征編碼參數(shù)確定模 型訓(xùn)練參數(shù),最后根據(jù)模型訓(xùn)練參數(shù)W及特征編碼參數(shù),確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位 置信息,實(shí)際地理位置信息用于指示目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。通過采用上述方 式確定網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍,可W考慮到關(guān)注該網(wǎng)絡(luò)賬號(hào)的用戶處于動(dòng)態(tài)變化的 情況,能夠根據(jù)關(guān)注該網(wǎng)絡(luò)賬號(hào)的用戶的地理位置來確定實(shí)際地理位置信息,從而大大降 低數(shù)據(jù)的失真可能性,更有效地提高服務(wù)器確定得到網(wǎng)絡(luò)賬號(hào)的實(shí)際服務(wù)信息的準(zhǔn)確度。
[0166] 可選地,在上述圖6所對(duì)應(yīng)的實(shí)施例的基礎(chǔ)上,請(qǐng)參閱圖7,本發(fā)明實(shí)施例提供的服 務(wù)器的另一實(shí)施例中,
[0167] 所述特征編碼參數(shù)包括歸一化向量、規(guī)模系數(shù)W及峰度系數(shù);
[0168] 所述獲取模塊302包括:
[0169] 第一計(jì)算單元3021,用于根據(jù)所述地理位置信息計(jì)算所述規(guī)模系數(shù);
[0170] 第二計(jì)算單元3022,用于根據(jù)所述地理位置信息計(jì)算所述歸一化向量;
[0171] 第=計(jì)算單元3023,用于根據(jù)所述第二計(jì)算單元3022計(jì)算的所述歸一化向量計(jì)算 所述峰度系數(shù)。
[0172] 其次,本發(fā)明實(shí)施例中,舉例了說明了目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù)包括了規(guī)模 系數(shù)、歸一化向量W及峰度系數(shù),并且服務(wù)器根據(jù)地理位置信息計(jì)算規(guī)模系數(shù)W及歸一化 向量,再根據(jù)歸一化相鄰計(jì)算出峰度系數(shù)。采用上述方式提升方案在實(shí)際應(yīng)用中的可行性。
[0173] 可選地,在上述圖7所對(duì)應(yīng)的實(shí)施例的基礎(chǔ)上,請(qǐng)參閱圖8,本發(fā)明實(shí)施例提供的服 務(wù)器的另一實(shí)施例中,
[0174] 所述第一計(jì)算單元3021包括:
[0175] 第一計(jì)算子單元30211,用于按照如下方式計(jì)算所述規(guī)模系數(shù):
[0176]
[0177] 所述Mf表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f所述規(guī)模系數(shù)
[0178] 所述Cfi表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為i區(qū)域的人數(shù),其中,Cfi^Cf(W);
[0179]
3于表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為從i=〇到i = n區(qū)域中的總?cè)藬?shù),n表 示總區(qū)域數(shù)量。
[0180] 再次,本發(fā)明實(shí)施例中,服務(wù)器可W采用公式計(jì)算規(guī)模系數(shù),通過公式的計(jì)算得到 合理的規(guī)模系數(shù),W此提升方案的實(shí)用性和可行性。
[0181] 可選地,在上述圖8所對(duì)應(yīng)的實(shí)施例的基礎(chǔ)上,請(qǐng)參閱圖9,本發(fā)明實(shí)施例提供的服 務(wù)器的另一實(shí)施例中,
[0182] 所述第二計(jì)算單元3022包括:
[0183] 笛^^管革苗-9^21,用于按照如下方式計(jì)算所述歸一化向量:
[0184]
[0185] 所述kfi表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為i區(qū)域的人數(shù)所對(duì)應(yīng)的歸一化值,多個(gè)所 述歸一化值組成所述歸一化向量,所述kfi的取值范圍為大于0且小于1。
[0186] 進(jìn)一步地,本發(fā)明實(shí)施例中,在得到規(guī)模系數(shù)的基礎(chǔ)上,還可W利用公式計(jì)算得到 歸一化向量,W此提升服務(wù)器計(jì)算歸一化向量的可行性W及合理性。
[0187] 可選地,在上述圖8所對(duì)應(yīng)的實(shí)施例的基礎(chǔ)上,請(qǐng)參閱圖10,本發(fā)明實(shí)施例提供的 服務(wù)器的另一實(shí)施例中,
[0188] 所述第=計(jì)算單元3023包括:
[0189] 第=計(jì)算子單元30231,用于按照如下方式計(jì)算所述峰度系數(shù):
[0190]
[0191]
[0192] 所述表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f預(yù)設(shè)的所述歸一化向量中所述歸一化值的平均 值;
[0193] 所述N表示預(yù)設(shè)的參數(shù),N的取值范圍為大于0且小于等于所述i;
[0194] 所述kfN表不第N個(gè)所述歸一化向量中的歸一化值,所述化fi,kf2,kf3,kf4, . . . ,kfN) 表示所述歸一化向量中的一組子歸一化向量,所述Sum表示求和運(yùn)算;
[01%]所述阮的:表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f的所述峰度系數(shù),所述峰度系數(shù)用于表示分布 睹緩程度;
[0196] 所a 表示關(guān)注所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所分布的的四階矩;
[0197] 所a 表示關(guān)注所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所分布的的二階矩。
[0198] 更進(jìn)一步地,本發(fā)明實(shí)施例中,在服務(wù)器計(jì)算得到規(guī)模系數(shù)和歸一化向量的基礎(chǔ) 上,可W利用公式繼續(xù)計(jì)算得到峰度系數(shù),W此提升服務(wù)器計(jì)算峰度系數(shù)的可行性和合理 性。
[0199] 可選地,在上述圖6所對(duì)應(yīng)的實(shí)施例的基礎(chǔ)上,請(qǐng)參閱圖11,本發(fā)明實(shí)施例提供的 服務(wù)器的另一實(shí)施例中,
[0200] 所述接收模塊303包括:
[0201] 接收單元3031,用于接收一組所述用戶網(wǎng)絡(luò)賬號(hào);
[0202] 生成單元3032,用于按照地理位置分布類型生成所述接收單元3031接收的所述一 組所述用戶網(wǎng)絡(luò)賬號(hào)對(duì)應(yīng)的所述樣本標(biāo)注參數(shù)。
[0203] 其次,本發(fā)明實(shí)施例中,服務(wù)器在接收一組用戶網(wǎng)絡(luò)賬號(hào)后,可W按照地理位置分 布類型生成一組用戶網(wǎng)絡(luò)賬號(hào)對(duì)應(yīng)的樣本標(biāo)注參數(shù)。通過上述方式能夠靈活地獲取到用戶 提供的用戶網(wǎng)絡(luò)賬號(hào),并生成樣本標(biāo)注參數(shù),如果用戶提供的數(shù)據(jù)足夠多,所得到的樣本標(biāo) 注參數(shù)也越多,從而使得訓(xùn)練出的模型擬合度越高,從而提升方案的準(zhǔn)確度。
[0204] 可選地,在上述圖11所對(duì)應(yīng)的實(shí)施例的基礎(chǔ)上,請(qǐng)參閱圖12,本發(fā)明實(shí)施例提供的 服務(wù)器的另一實(shí)施例中,
[02化]所述接收模塊303包括:
[0206] 分配單元3033,用于按照所述規(guī)模系數(shù)將所述樣本標(biāo)注參數(shù)分配至不同的標(biāo)注數(shù) 據(jù)子集合;
[0207] 訓(xùn)練單元3034,用于對(duì)所述分配單元3033分配的每個(gè)所述標(biāo)注數(shù)據(jù)子集合進(jìn)行模 型訓(xùn)練,并得到所述模型訓(xùn)練的結(jié)果;
[0208] 第一確定單元3035,用于根據(jù)所述訓(xùn)練單元3034訓(xùn)練得到的所述模型訓(xùn)練的結(jié)果 確定所述模型訓(xùn)練參數(shù)。
[0209] 再次,本發(fā)明實(shí)施例中,服務(wù)器根據(jù)樣本標(biāo)注參數(shù)W及特征編碼參數(shù)確定模型訓(xùn) 練參數(shù),可W是先按照規(guī)模系數(shù)將樣本標(biāo)注參數(shù)分配至不同的標(biāo)注數(shù)據(jù)子集合,然后對(duì)每 個(gè)標(biāo)注數(shù)據(jù)子集合進(jìn)行模型訓(xùn)練,并得到模型訓(xùn)練的結(jié)果,最后根據(jù)模型訓(xùn)練的結(jié)果確定 模型訓(xùn)練參數(shù)。通過上述方法,服務(wù)器可W針對(duì)不同"粉絲"規(guī)模的目標(biāo)網(wǎng)絡(luò)賬號(hào)獨(dú)立進(jìn)行 訓(xùn)練,W此提高模型分類的準(zhǔn)確率。
[0210] 可選地,在上述圖11所對(duì)應(yīng)的實(shí)施例的基礎(chǔ)上,本發(fā)明實(shí)施例提供的服務(wù)器的另 一實(shí)施例中,
[0211] 所述標(biāo)注數(shù)據(jù)子集合包括標(biāo)注數(shù)據(jù)測(cè)試集合W及標(biāo)注數(shù)據(jù)訓(xùn)練集合;
[0212] 所述標(biāo)注數(shù)據(jù)測(cè)試集合用于對(duì)所述標(biāo)注數(shù)據(jù)子集合中的第一標(biāo)注數(shù)據(jù)進(jìn)行迭代 計(jì)算;
[0213] 所述標(biāo)注數(shù)據(jù)訓(xùn)練集合用于對(duì)所述標(biāo)注數(shù)據(jù)子集合中的第二標(biāo)注數(shù)據(jù)進(jìn)行模型 訓(xùn)練。
[0214] 進(jìn)一步地,本發(fā)明實(shí)施例中,可W將標(biāo)注數(shù)據(jù)子集合劃分為標(biāo)注數(shù)據(jù)測(cè)試集合W 及標(biāo)注數(shù)據(jù)訓(xùn)練集合,其中,標(biāo)注數(shù)據(jù)測(cè)試集合用于對(duì)標(biāo)注數(shù)據(jù)子集合中的第一標(biāo)注數(shù)據(jù) 進(jìn)行迭代計(jì)算,標(biāo)注數(shù)據(jù)訓(xùn)練集合用于對(duì)標(biāo)注數(shù)據(jù)子集合中的第二標(biāo)注數(shù)據(jù)進(jìn)行模型訓(xùn) 練。通過上述方式,可W訓(xùn)練出擬合度更高的模型,而且在對(duì)標(biāo)注數(shù)據(jù)的測(cè)試和訓(xùn)練中不斷 完善模型,提升模型的動(dòng)態(tài)適應(yīng)性。
[0215] 可選地,在上述圖6至圖10中任一項(xiàng)所對(duì)應(yīng)的實(shí)施例的基礎(chǔ)上,請(qǐng)參閱圖13,本發(fā) 明實(shí)施例提供的服務(wù)器的另一實(shí)施例中,
[0216] 所述確定模塊304包括:
[0217] 輸出單元3041,用于根據(jù)所述規(guī)模系數(shù),將所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù)分 配至子分類器中,所述子分類器用于根據(jù)所述特征編碼參數(shù)輸出所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理 位置屬性類別,所述地理位置屬性類別包括集中型、局部分散型W及全局分散型中的一種;
[0218] 第二確定單元3042,用于根據(jù)所述輸出單元輸出的所述地理位置屬性類別確定所 述目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位置信息。
[0219] 其次,本發(fā)明實(shí)施例中,服務(wù)器根據(jù)模型訓(xùn)練參數(shù)W及特征編碼參數(shù),確定目標(biāo)網(wǎng) 絡(luò)賬號(hào)的實(shí)際地理位置信息,具體可W先根據(jù)規(guī)模系數(shù),將目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù) 分配至子分類器中,子分類器用于根據(jù)特征編碼參數(shù)輸出目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置屬性類 另IJ,地理位置屬性類別包括集中型、局部分散型W及全局分散型中的一種,最后根據(jù)地理位 置屬性類別確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位置信息。采用上述方式,具體構(gòu)建了一個(gè)可用 于輸出目標(biāo)網(wǎng)絡(luò)賬號(hào)實(shí)際地理位置信息的模型,訓(xùn)練模型中的分類器引入了多個(gè)子分類 器,充分考慮到了目標(biāo)網(wǎng)絡(luò)賬號(hào)規(guī)模的多樣性,從數(shù)據(jù)層面訓(xùn)練出多個(gè)子分類器,每個(gè)子分 類器只針對(duì)某一個(gè)規(guī)模的目標(biāo)網(wǎng)絡(luò)賬號(hào),運(yùn)樣的模型能夠與訓(xùn)練數(shù)據(jù)更好地你擬合,提高 模型的識(shí)別能力。
[0220] 圖14是本發(fā)明實(shí)施例提供的一種服務(wù)器結(jié)構(gòu)示意圖,該服務(wù)器400可因配置或性 能不同而產(chǎn)生比較大的差異,可W包括一個(gè)或一個(gè)W上中央處理器(英文全稱:central processing units,英文縮寫:CPU)422(例如,一個(gè)或一個(gè)W上處理器)和存儲(chǔ)器432,一個(gè) 或一個(gè)W上存儲(chǔ)應(yīng)用程序442或數(shù)據(jù)444的存儲(chǔ)介質(zhì)430(例如一個(gè)或一個(gè)W上海量存儲(chǔ)設(shè) 備)。其中,存儲(chǔ)器432和存儲(chǔ)介質(zhì)430可W是短暫存儲(chǔ)或持久存儲(chǔ)。存儲(chǔ)在存儲(chǔ)介質(zhì)430的程 序可W包括一個(gè)或一個(gè)W上模塊(圖示沒標(biāo)出),每個(gè)模塊可W包括對(duì)服務(wù)器中的一系列指 令操作。更進(jìn)一步地,中央處理器422可W設(shè)置為與存儲(chǔ)介質(zhì)430通信,在服務(wù)器400上執(zhí)行 存儲(chǔ)介質(zhì)430中的一系列指令操作。
[0221] 服務(wù)器400還可W包括一個(gè)或一個(gè)W上電源426,一個(gè)或一個(gè)W上有線或無線網(wǎng)絡(luò) 接口 450, 一個(gè)或一個(gè)W上輸入輸出接口 458,和/或,一個(gè)或一個(gè)W上操作系統(tǒng)441,例如 Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,化eeBSDTM等等。
[0222] 上述實(shí)施例中由服務(wù)器所執(zhí)行的步驟可W基于該圖14所示的服務(wù)器結(jié)構(gòu)。
[0223] 其中,中央處理器422用于,
[0224] 讀取待確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置信息,所述地理位置信息為關(guān)注所述目標(biāo)網(wǎng) 絡(luò)賬號(hào)的用戶所在的位置信息;
[0225] 根據(jù)所述地理位置信息,獲取所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù);
[0226] 接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù),并根據(jù)所述樣本標(biāo)注參數(shù)W及所述特征編碼 參數(shù)確定模型訓(xùn)練參數(shù);
[0227] 根據(jù)所述模型訓(xùn)練參數(shù)W及所述特征編碼參數(shù),確定所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地 理位置信息,所述實(shí)際地理位置信息用于指示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。
[022引其中,中央處理器422具體用于,
[0229] 根據(jù)所述地理位置信息計(jì)算所述規(guī)模系數(shù);
[0230] 根據(jù)所述地理位置信息計(jì)算所述歸一化向量;
[0231 ]根據(jù)所述歸一化向量計(jì)算所述峰度系數(shù)。
[0232] 其中,中央處理器422具體用于,
[0233] 按照如下方式計(jì)算所述規(guī)模系數(shù):
[0234]
[0235] 所述Mf表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f所述規(guī)模系數(shù)
[0236] 所述Cfi表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為i區(qū)域的人數(shù);
[0237]
目于表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為從i=〇到i = n區(qū)域中的總?cè)藬?shù),n表 示總區(qū)域數(shù)量。
[0238] 其中,中央處理器422具體用于,
[0239] 膚昭fm下市才A管聽述歸一化向量;
[0240]
[0241] 所述kfi表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為i區(qū)域的人數(shù)所對(duì)應(yīng)的歸一化值,所述 kfi的取值范圍為大于0且小于1。
[0242] 其中,中央處理器422具體用于,
[0243] 按照如下方式計(jì)算所述峰度系數(shù):
[0244]
[0245] 、,…i
/
[0246] 所述表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f預(yù)設(shè)的歸一化向量平均值;
[0247] 所述N表示預(yù)設(shè)的參數(shù),N的取值范圍為大于0且小于等于所述i;
[024引所述kfN表示第N個(gè)所述歸一化向量中的歸一化值,所述化fi,kf2,kf3,kf4, . . .,kfN) 表示所述歸一化向量中的一組子歸一化向量;
[0249] 所述1(11的:表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f的所述峰度系數(shù),所述峰度系數(shù)用于表示分布 睹緩程度;
[0250] 所i 示關(guān)注所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所分布的的四階矩;
[0巧1] 所i ^示關(guān)注所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所分布的的二階矩。
[0252] 其中,中央處理器422具體用于,
[0253] 接收一組所述用戶網(wǎng)絡(luò)賬號(hào);
[0254] 按照地理位置分布類型生成所述一組所述用戶網(wǎng)絡(luò)賬號(hào)對(duì)應(yīng)的所述樣本標(biāo)注參 數(shù)。
[0巧5] 其中,中央處理器422具體用于,
[0256] 按照所述峰度系數(shù)將所述樣本標(biāo)注參數(shù)分配至不同的標(biāo)注數(shù)據(jù)子集合;
[0257] 對(duì)每個(gè)所述標(biāo)注數(shù)據(jù)子集合進(jìn)行模型訓(xùn)練,并得到所述模型訓(xùn)練的結(jié)果;
[0258] 根據(jù)所述模型訓(xùn)練的結(jié)果確定所述模型訓(xùn)練參數(shù)。
[0259] 其中,中央處理器422具體用于,
[0260] 根據(jù)所述規(guī)模系數(shù),將所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù)分配至子分類器中,所 述子分類器用于根據(jù)所述特征編碼參數(shù)輸出所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置屬性類別,所述 地理位置屬性類別包括集中型、局部分散型W及全局分散型中的一種;
[0261] 根據(jù)所述地理位置屬性類別確定所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位置信息。
[0262] 所屬領(lǐng)域的技術(shù)人員可W清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng), 裝置和單元的具體工作過程,可W參考前述方法實(shí)施例中的對(duì)應(yīng)過程,在此不再寶述。
[0263] 在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所掲露的系統(tǒng),裝置和方法,可W 通過其它的方式實(shí)現(xiàn)。例如,W上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的 劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可W有另外的劃分方式,例如多個(gè)單元或組件 可W結(jié)合或者可W集成到另一個(gè)系統(tǒng),或一些特征可W忽略,或不執(zhí)行。另一點(diǎn),所顯示或 討論的相互之間的禪合或直接禪合或通信連接可W是通過一些接口,裝置或單元的間接禪 合或通信連接,可W是電性,機(jī)械或其它的形式。
[0264] 所述作為分離部件說明的單元可W是或者也可W不是物理上分開的,作為單元顯 示的部件可W是或者也可W不是物理單元,即可W位于一個(gè)地方,或者也可W分布到多個(gè) 網(wǎng)絡(luò)單元上??蒞根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目 的。
[0265] 另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可W集成在一個(gè)處理單元中,也可W 是各個(gè)單元單獨(dú)物理存在,也可W兩個(gè)或兩個(gè)W上單元集成在一個(gè)單元中。上述集成的單 元既可W采用硬件的形式實(shí)現(xiàn),也可W采用軟件功能單元的形式實(shí)現(xiàn)。
[0266] 所述集成的單元如果W軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用 時(shí),可W存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。基于運(yùn)樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上 或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可WW軟件產(chǎn)品的形式 體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用W使得一臺(tái)計(jì)算機(jī) 設(shè)備(可W是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全 部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(英文全稱:Read-化Iy Memory,英文縮寫:ROM)、隨機(jī)存取存儲(chǔ)器(英文全稱:Random Access Memory,英文縮寫: RAM)、磁碟或者光盤等各種可W存儲(chǔ)程序代碼的介質(zhì)。
[0267] W上所述,W上實(shí)施例僅用W說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前 述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可W對(duì)前 述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而運(yùn)些 修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。
【主權(quán)項(xiàng)】
1. 一種位置信息確定的方法,其特征在于,包括: 讀取待確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置信息,所述地理位置信息為關(guān)注所述目標(biāo)網(wǎng)絡(luò)賬 號(hào)的用戶所在的位置信息; 根據(jù)所述地理位置信息,獲取所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù); 接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù),并根據(jù)所述樣本標(biāo)注參數(shù)W及所述特征編碼參數(shù) 確定模型訓(xùn)練參數(shù); 根據(jù)所述模型訓(xùn)練參數(shù)W及所述特征編碼參數(shù),確定所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位 置信息,所述實(shí)際地理位置信息用于指示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述特征編碼參數(shù)包括歸一化向量、規(guī)模 系數(shù)W及峰度系數(shù); 所述根據(jù)所述地理位置信息,獲取所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù),包括: 根據(jù)所述地理位置信息計(jì)算所述規(guī)模系數(shù); 根據(jù)所述地理位置信息計(jì)算所述歸一化向量; 根據(jù)所述歸一化向量計(jì)算所述峰度系數(shù)。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述地理位置信息計(jì)算所述規(guī)模 系數(shù),包括: 按照如下方式計(jì)算所述規(guī)模系數(shù):所述Mf表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f所述規(guī)模系數(shù) 所述Cf康示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為i區(qū)域的人數(shù),其中,Cf冷Cf(w);用于表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為從i = 〇到i=n區(qū)域中的總?cè)藬?shù),η表示總 區(qū)域數(shù)量。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述地理位置信息計(jì)算所述歸一 化向量,包括: 按照如下方式計(jì)算所述歸一化向量:所述kfi表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為i區(qū)域的人數(shù)所對(duì)應(yīng)的歸一化值,多個(gè)所述歸 一化值組成所述歸一化向量,所述kfi的取值范圍為大于0且小于1。5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述歸一化向量計(jì)算所述峰度系 數(shù),包括: 按照如下方式計(jì)算所述峰度系數(shù):所述表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f預(yù)設(shè)的所述歸一化向量中所述歸一化值的平均值; 所述N表示預(yù)設(shè)的參數(shù),N的取值范圍為大于0且小于等于所述i; 所述kfN表不第N個(gè)所述歸一化向量中的歸一化值,所述化fl,kf2,kf3,kf4,...,kfN)表不 所述歸一化向量中的一組子歸一化向量,所述S皿表示求和運(yùn)算; 所述阮的:表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f的所述峰度系數(shù),所述峰度系數(shù)用于表示分布睹緩 程度; 所述表示關(guān)注所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所分布的的四階矩; 所過表示關(guān)注所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所分布的的二階矩。6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù), 包括: 接收一組所述用戶網(wǎng)絡(luò)賬號(hào); 按照地理位置分布類型生成所述一組所述用戶網(wǎng)絡(luò)賬號(hào)對(duì)應(yīng)的所述樣本標(biāo)注參數(shù)。7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)所述樣本標(biāo)注參數(shù)W及所述特征 編碼參數(shù)確定模型訓(xùn)練參數(shù),包括: 按照所述規(guī)模系數(shù)將所述樣本標(biāo)注參數(shù)分配至不同的標(biāo)注數(shù)據(jù)子集合; 對(duì)每個(gè)所述標(biāo)注數(shù)據(jù)子集合進(jìn)行模型訓(xùn)練,并得到所述模型訓(xùn)練的結(jié)果; 根據(jù)所述模型訓(xùn)練的結(jié)果確定所述模型訓(xùn)練參數(shù)。8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述標(biāo)注數(shù)據(jù)子集合包括標(biāo)注數(shù)據(jù)測(cè)試集 合W及標(biāo)注數(shù)據(jù)訓(xùn)練集合; 所述標(biāo)注數(shù)據(jù)測(cè)試集合用于對(duì)所述標(biāo)注數(shù)據(jù)子集合中的第一標(biāo)注數(shù)據(jù)進(jìn)行迭代計(jì)算; 所述標(biāo)注數(shù)據(jù)訓(xùn)練集合用于對(duì)所述標(biāo)注數(shù)據(jù)子集合中的第二標(biāo)注數(shù)據(jù)進(jìn)行模型訓(xùn)練。9. 根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述模型訓(xùn)練參數(shù) W及所述特征編碼參數(shù),確定所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位置信息,包括: 根據(jù)所述規(guī)模系數(shù),將所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù)分配至子分類器中,所述子 分類器用于根據(jù)所述特征編碼參數(shù)輸出所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置屬性類別,所述地理 位置屬性類別包括集中型、局部分散型W及全局分散型中的一種; 根據(jù)所述地理位置屬性類別確定所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位置信息。10. -種服務(wù)器,其特征在于,包括: 讀取模塊,用于讀取待確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置信息,所述地理位置信息為關(guān)注 所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所在的位置信息; 獲取模塊,用于根據(jù)所述讀取模塊讀取的所述地理位置信息,獲取所述目標(biāo)網(wǎng)絡(luò)賬號(hào) 的特征編碼參數(shù); 接收模塊,用于接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù),并根據(jù)所述樣本標(biāo)注參數(shù)W及所 述獲取模塊獲取的所述特征編碼參數(shù)確定模型訓(xùn)練參數(shù); 確定模塊,用于根據(jù)所述接收模塊確定的所述模型訓(xùn)練參數(shù)W及所述獲取模塊獲取的 所述特征編碼參數(shù),確定所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位置信息,所述實(shí)際地理位置信息 用于指示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。11. 根據(jù)權(quán)利要求10所述的服務(wù)器,其特征在于,所述特征編碼參數(shù)包括歸一化向量、 規(guī)模系數(shù)W及峰度系數(shù); 所述獲取模塊包括: 第一計(jì)算單元,用于根據(jù)所述地理位置信息計(jì)算所述規(guī)模系數(shù); 第二計(jì)算單元,用于根據(jù)所述地理位置信息計(jì)算所述歸一化向量; 第Ξ計(jì)算單元,用于根據(jù)所述第二計(jì)算單元計(jì)算的所述歸一化向量計(jì)算所述峰度系 數(shù)。12. 根據(jù)權(quán)利要求11所述的服務(wù)器,其特征在于,所述第一計(jì)算單元包括: 第一計(jì)算子單元,用于按照如下方式計(jì)算所述規(guī)模系數(shù):所述Mf表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f所述規(guī)模系數(shù) 所述Cf康示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為i區(qū)域的人數(shù),其中,Cf冷Cf(w);用于表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為從i = 〇到i=n區(qū)域中的總?cè)藬?shù),η表示總 區(qū)域數(shù)量。13. 根據(jù)權(quán)利要求12所述的服務(wù)器,其特征在于,所述第二計(jì)算單元包括: 第二計(jì)算子單元,用于按照如下方式計(jì)算所述歸一化向量:所述kfi表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f在編號(hào)為i區(qū)域的人數(shù)所對(duì)應(yīng)的歸一化值,多個(gè)所述歸 一化值組成所述歸一化向量,所述kfi的取值范圍為大于0且小于1。14. 根據(jù)權(quán)利要求13所述的服務(wù)器,其特征在于,所述第Ξ計(jì)算單元包括: 第Ξ計(jì)算子單元,用于按照如下方式計(jì)算所述峰度系數(shù):所述^表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f預(yù)設(shè)的所述歸一化向量中所述歸一化值的平均值; 所述N表示預(yù)設(shè)的參數(shù),N的取值范圍為大于0且小于等于所述i; 所述kfN表示第N個(gè)所述歸一化向量中的歸一化值,所述化fi,kf2,kf3,kf4, . . .,kfN)表示 所述歸一化向量中的一組子歸一化向量,所述S皿表示求和運(yùn)算; 所述1(11^:表示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)f的所述峰度系數(shù),所述峰度系數(shù)用于表示分布睹緩 程度; 所述表示關(guān)注所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所分布的的四階矩; 所過g示關(guān)注所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的用戶所分布的的二階矩。15. 根據(jù)權(quán)利要求10所述的服務(wù)器,其特征在于,所述接收模塊包括: 接收單元,用于接收一組所述用戶網(wǎng)絡(luò)賬號(hào); 生成單元,用于按照地理位置分布類型生成所述接收單元接收的所述一組所述用戶網(wǎng) 絡(luò)賬號(hào)對(duì)應(yīng)的所述樣本標(biāo)注參數(shù)。16. 根據(jù)權(quán)利要求15所述的服務(wù)器,其特征在于,所述接收模塊包括: 分配單元,用于按照所述規(guī)模系數(shù)將所述樣本標(biāo)注參數(shù)分配至不同的標(biāo)注數(shù)據(jù)子集 合; 訓(xùn)練單元,用于對(duì)所述分配單元分配的每個(gè)所述標(biāo)注數(shù)據(jù)子集合進(jìn)行模型訓(xùn)練,并得 到所述模型訓(xùn)練的結(jié)果; 第一確定單元,用于根據(jù)所述訓(xùn)練單元訓(xùn)練得到的所述模型訓(xùn)練的結(jié)果確定所述模型 訓(xùn)練參數(shù)。17. 根據(jù)權(quán)利要求16所述的服務(wù)器,其特征在于,所述標(biāo)注數(shù)據(jù)子集合包括標(biāo)注數(shù)據(jù)測(cè) 試集合W及標(biāo)注數(shù)據(jù)訓(xùn)練集合; 所述標(biāo)注數(shù)據(jù)測(cè)試集合用于對(duì)所述標(biāo)注數(shù)據(jù)子集合中的第一標(biāo)注數(shù)據(jù)進(jìn)行迭代計(jì)算; 所述標(biāo)注數(shù)據(jù)訓(xùn)練集合用于對(duì)所述標(biāo)注數(shù)據(jù)子集合中的第二標(biāo)注數(shù)據(jù)進(jìn)行模型訓(xùn)練。18. 根據(jù)權(quán)利要求10至14中任一項(xiàng)所述的服務(wù)器,其特征在于,所述確定模塊包括: 輸出單元,用于根據(jù)所述規(guī)模系數(shù),將所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù)分配至子分 類器中,所述子分類器用于根據(jù)所述特征編碼參數(shù)輸出所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置屬性 類別,所述地理位置屬性類別包括集中型、局部分散型W及全局分散型中的一種; 第二確定單元,用于根據(jù)所述輸出單元輸出的所述地理位置屬性類別確定所述目標(biāo)網(wǎng) 絡(luò)賬號(hào)的實(shí)際地理位置信息。19. 一種服務(wù)器,其特征在于,包括:存儲(chǔ)器、收發(fā)器、處理器W及總線系統(tǒng); 其中,所述存儲(chǔ)器用于存儲(chǔ)程序; 所述處理器用于執(zhí)行所述存儲(chǔ)器中的程序,具體如下步驟: 讀取待確定目標(biāo)網(wǎng)絡(luò)賬號(hào)的地理位置信息,所述地理位置信息為關(guān)注所述目標(biāo)網(wǎng)絡(luò)賬 號(hào)的用戶所在的位置信息; 根據(jù)所述地理位置信息,獲取所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的特征編碼參數(shù); 接收用戶網(wǎng)絡(luò)賬號(hào)的樣本標(biāo)注參數(shù),并根據(jù)所述樣本標(biāo)注參數(shù)w及所述特征編碼參數(shù) 確定模型訓(xùn)練參數(shù); 根據(jù)所述模型訓(xùn)練參數(shù)W及所述特征編碼參數(shù),確定所述目標(biāo)網(wǎng)絡(luò)賬號(hào)的實(shí)際地理位 置信息,所述實(shí)際地理位置信息用于指示所述目標(biāo)網(wǎng)絡(luò)賬號(hào)當(dāng)前服務(wù)的地理范圍。
【文檔編號(hào)】H04L29/08GK105939383SQ201610438602
【公開日】2016年9月14日
【申請(qǐng)日】2016年6月17日
【發(fā)明人】段培, 陳謙, 陳培炫, 鄭博
【申請(qǐng)人】騰訊科技(深圳)有限公司