亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種分析用戶軌跡的方法及裝置的制造方法

文檔序號:10618188閱讀:716來源:國知局
一種分析用戶軌跡的方法及裝置的制造方法
【專利摘要】本發(fā)明提供了一種分析用戶軌跡的方法及裝置,該方法包括:對采集到的用戶的信令數(shù)據(jù)進(jìn)行清洗;根據(jù)清洗后的信令數(shù)據(jù),得到用戶的運動軌跡參數(shù),運動軌跡參數(shù)包括用戶的唯一標(biāo)識、每個小區(qū)的唯一標(biāo)識、用戶進(jìn)入每個小區(qū)的最早時間和最晚時間以及用戶在每個小區(qū)內(nèi)的最短停留時間和最長停留時間;根據(jù)給定用戶的唯一標(biāo)識和用戶的運動軌跡參數(shù),確定給定用戶的軌跡,本發(fā)明的方法能簡單、高效地分析信令數(shù)據(jù)。
【專利說明】
一種分析用戶軌跡的方法及裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及移動通信及數(shù)據(jù)挖掘技術(shù)領(lǐng)域,特別涉及一種分析用戶軌跡的方法及裝置?!颈尘凹夹g(shù)】
[0002] 分析用戶軌跡可以預(yù)測用戶位置,挖掘用戶移動的行為特征。目前基于信令數(shù)據(jù)的用戶位置分析系統(tǒng),尤其是在移動通信領(lǐng)域中通過信令數(shù)據(jù)來挖掘用戶軌跡特征、預(yù)測用戶位置的方法有:第一種,通過用戶移動設(shè)備上安裝終端工具,收集用戶一定量的軌跡數(shù)據(jù),對其進(jìn)行抽象化處理,調(diào)用PrefixSpan挖掘算法得到基于用戶位置信息的運動模式并進(jìn)行建模,構(gòu)造模式樹(模式樹包含所有運動模式及其采用不同起點和終點的概率),同時分析用戶在線運動情況得到按照起點和終點位置數(shù)據(jù)進(jìn)行組織的運動模式集,將運動模式集結(jié)果和挖掘出的運動模式進(jìn)行匹配和查找來預(yù)測用戶位置。第二種,通過移動通信網(wǎng)用戶無線上網(wǎng)信息采集用戶實時位置數(shù)據(jù)如時間字段信息、地點字段信息,同時對獲取到的用戶移動數(shù)據(jù)進(jìn)行清洗處理,輸出一個已處理的用戶移動數(shù)據(jù)信息,并結(jié)合根據(jù)用戶的歷史移動行為分析得到的轉(zhuǎn)移概率矩陣,構(gòu)造馬爾科夫模型進(jìn)行分析計算,從而預(yù)測其訪問各個地點的可能性,做出用戶最大可能訪問的地點預(yù)測。但這兩種方法存在如下缺點:對信令數(shù)據(jù)采用的分析方法復(fù)雜且計算量大,同時缺少對歷史數(shù)據(jù)的優(yōu)化處理。
【發(fā)明內(nèi)容】

[0003]本發(fā)明實施例的目的在于提供一種分析用戶軌跡的方法及裝置,能簡單、高效地分析信令數(shù)據(jù)。
[0004] 為了達(dá)到上述目的,本發(fā)明的實施例提供了一種分析用戶軌跡的方法,該方法包括:
[0005]對采集到的用戶的信令數(shù)據(jù)進(jìn)行清洗;
[0006]根據(jù)清洗后的信令數(shù)據(jù),得到用戶的運動軌跡參數(shù),運動軌跡參數(shù)包括用戶的唯一標(biāo)識、每個小區(qū)的唯一標(biāo)識、用戶進(jìn)入每個小區(qū)的最早時間和最晚時間以及用戶在每個小區(qū)內(nèi)的最短停留時間和最長停留時間;
[0007]根據(jù)給定用戶的唯一標(biāo)識和用戶的運動軌跡參數(shù),確定給定用戶的軌跡。
[0008] 其中,對采集到的用戶的信令數(shù)據(jù)進(jìn)行清洗的步驟包括:
[0009]對采集到的用戶的信令數(shù)據(jù)中的殘缺信令數(shù)據(jù)進(jìn)行補全;
[0010]根據(jù)信令數(shù)據(jù)規(guī)則,判斷補全后的用戶的信令數(shù)據(jù)是否為錯誤信令數(shù)據(jù);[〇〇11] 若是錯誤信令數(shù)據(jù),則糾正該錯誤信令數(shù)據(jù);
[0012]對糾正后的用戶的信令數(shù)據(jù)進(jìn)行去重處理。
[0013] 其中,根據(jù)清洗后的信令數(shù)據(jù),得到用戶的運動軌跡參數(shù)的步驟包括:
[0014] 從清洗后的信令數(shù)據(jù)中獲取用戶每天的信令數(shù)據(jù),并按照用戶進(jìn)入不同小區(qū)的時間先后順序?qū)Λ@取到的每天的信令數(shù)據(jù)進(jìn)行排序;
[0015]根據(jù)排序后的信令數(shù)據(jù),得到預(yù)設(shè)天數(shù)內(nèi)用戶每天的軌跡參數(shù),每天的軌跡參數(shù)包括用戶的唯一標(biāo)識、每個小區(qū)的唯一標(biāo)識、用戶每天進(jìn)入每個小區(qū)的最早時間和最晚時間以及用戶每天在每個小區(qū)內(nèi)的最短停留時間和最長停留時間;
[0016]根據(jù)預(yù)設(shè)權(quán)值,對預(yù)設(shè)天數(shù)內(nèi)用戶每天的軌跡參數(shù)進(jìn)行加權(quán)處理,得到用戶的運動軌跡參數(shù),其中,距離當(dāng)前時刻越遠(yuǎn)的軌跡參數(shù)的預(yù)設(shè)權(quán)值越小。
[0017]其中,根據(jù)給定用戶的唯一標(biāo)識和用戶的運動軌跡參數(shù),確定給定用戶的軌跡的步驟包括:
[0018]根據(jù)給定用戶的唯一標(biāo)識,通過掃描用戶的運動軌跡參數(shù),獲取該給定用戶在小區(qū)內(nèi)的最短停留時間為第一預(yù)設(shè)時間對應(yīng)的運動軌跡數(shù)據(jù);
[0019]判斷該給定用戶進(jìn)入該小區(qū)的平均時間是否在第二預(yù)設(shè)時間段內(nèi);
[0020]若該給定用戶進(jìn)入該小區(qū)的平均時間在第二預(yù)設(shè)時間段內(nèi),則進(jìn)一步判斷該給定用戶在該小區(qū)的停留時間是否覆蓋第三預(yù)設(shè)時間段;
[0021]若該給定用戶在該小區(qū)的停留時間覆蓋第三預(yù)設(shè)時間段,則確定該小區(qū)為該給定用戶的居住地。
[0022]其中,根據(jù)給定用戶的唯一標(biāo)識,通過掃描用戶的運動軌跡參數(shù),獲取該給定用戶在小區(qū)內(nèi)的最短停留時間為第一預(yù)設(shè)時間對應(yīng)的運動軌跡數(shù)據(jù)的步驟之后,方法還包括:
[0023]判斷該給定用戶進(jìn)入該小區(qū)的平均時間是否在第四預(yù)設(shè)時間段內(nèi);
[0024]若該給定用戶進(jìn)入該小區(qū)的平均時間在第四預(yù)設(shè)時間段內(nèi),則進(jìn)一步判斷該給定用戶在該小區(qū)的停留時間是否覆蓋第五預(yù)設(shè)時間段和第六預(yù)設(shè)時間段;
[0025]若該給定用戶在該小區(qū)的停留時間覆蓋第五預(yù)設(shè)時間段和第六預(yù)設(shè)時間段,則確定該小區(qū)為該給定用戶的工作地。
[0026]其中,根據(jù)給定用戶的唯一標(biāo)識和用戶的運動軌跡參數(shù),確定給定用戶的軌跡的步驟包括:
[0027]根據(jù)給定用戶的唯一標(biāo)識、該給定用戶當(dāng)前所在小區(qū)的唯一標(biāo)識以及進(jìn)入該小區(qū)的時間,通過掃描用戶的運動軌跡參數(shù),得到該給定用戶離開當(dāng)前所在小區(qū)的時間。
[0028]其中,根據(jù)給定用戶的唯一標(biāo)識和用戶的運動軌跡參數(shù),確定給定用戶的軌跡的步驟包括:
[0029]根據(jù)給定用戶的唯一標(biāo)識、該給定用戶當(dāng)前所在小區(qū)的唯一標(biāo)識以及進(jìn)入該小區(qū)的時間,通過掃描用戶的運動軌跡參數(shù),得到該給定用戶下一個最可能出現(xiàn)的小區(qū)的唯一標(biāo)識以及在該小區(qū)中停留的時間。[〇〇3〇]本發(fā)明的實施例還提供了一種分析用戶軌跡的裝置,該裝置包括:
[0031]清洗模塊,用于對采集到的用戶的信令數(shù)據(jù)進(jìn)行清洗;
[0032]獲得模塊,用于根據(jù)清洗后的信令數(shù)據(jù),得到用戶的運動軌跡參數(shù),運動軌跡參數(shù)包括用戶的唯一標(biāo)識、每個小區(qū)的唯一標(biāo)識、用戶進(jìn)入每個小區(qū)的最早時間和最晚時間以及用戶在每個小區(qū)內(nèi)的最短停留時間和最長停留時間;
[0033]確定模塊,用于根據(jù)給定用戶的唯一標(biāo)識和用戶的運動軌跡參數(shù),確定給定用戶的軌跡。
[0034]其中,清洗模塊包括:
[0035]補全單元,用于對采集到的用戶的信令數(shù)據(jù)中的殘缺信令數(shù)據(jù)進(jìn)行補全;
[0036]判斷單元,用于根據(jù)信令數(shù)據(jù)規(guī)則,判斷補全后的用戶的信令數(shù)據(jù)是否為錯誤信令數(shù)據(jù),并當(dāng)補全后的用戶的信令數(shù)據(jù)是錯誤信令數(shù)據(jù)時,觸發(fā)糾正單元;
[0037]糾正單元,用于根據(jù)判斷單元的觸發(fā),糾正該錯誤信令數(shù)據(jù);
[0038]去重單元,用于對糾正后的用戶的信令數(shù)據(jù)進(jìn)行去重處理。
[0039]其中,獲得模塊包括:
[0040]第一單元,用于從清洗后的信令數(shù)據(jù)中獲取用戶每天的信令數(shù)據(jù),并按照用戶進(jìn)入不同小區(qū)的時間先后順序?qū)Λ@取到的每天的信令數(shù)據(jù)進(jìn)行排序;
[0041]第二單元,用于根據(jù)排序后的信令數(shù)據(jù),得到預(yù)設(shè)天數(shù)內(nèi)用戶每天的軌跡參數(shù),每天的軌跡參數(shù)包括用戶的唯一標(biāo)識、每個小區(qū)的唯一標(biāo)識、用戶每天進(jìn)入每個小區(qū)的最早時間和最晚時間以及用戶每天在每個小區(qū)內(nèi)的最短停留時間和最長停留時間;
[0042]第三單元,用于根據(jù)預(yù)設(shè)權(quán)值,對預(yù)設(shè)天數(shù)內(nèi)用戶每天的軌跡參數(shù)進(jìn)行加權(quán)處理, 得到用戶的運動軌跡參數(shù),其中,距離當(dāng)前時刻越遠(yuǎn)的軌跡參數(shù)的預(yù)設(shè)權(quán)值越小。
[0043]其中,確定模塊包括:
[0044]第四單元,用于根據(jù)給定用戶的唯一標(biāo)識,通過掃描用戶的運動軌跡參數(shù),獲取該給定用戶在小區(qū)內(nèi)的最短停留時間為第一預(yù)設(shè)時間對應(yīng)的運動軌跡數(shù)據(jù);
[0045]第五單元,用于判斷該給定用戶進(jìn)入該小區(qū)的平均時間是否在第二預(yù)設(shè)時間段內(nèi),并當(dāng)該給定用戶進(jìn)入該小區(qū)的平均時間在第二預(yù)設(shè)時間段內(nèi)時,觸發(fā)第六單元;
[0046]第六單元,用于根據(jù)第五單元的觸發(fā),進(jìn)一步判斷該給定用戶在該小區(qū)的停留時間是否覆蓋第三預(yù)設(shè)時間段,并當(dāng)該給定用戶在該小區(qū)的停留時間覆蓋第三預(yù)設(shè)時間段時,確定該小區(qū)為該給定用戶的居住地。
[0047]其中,確定模塊還包括:
[0048]第七單元,用于判斷該給定用戶進(jìn)入該小區(qū)的平均時間是否在第四預(yù)設(shè)時間段內(nèi),并當(dāng)該給定用戶進(jìn)入該小區(qū)的平均時間在第四預(yù)設(shè)時間段內(nèi)時,觸發(fā)第八單元;
[0049]第八單元,用于根據(jù)第七單元的觸發(fā),進(jìn)一步判斷該給定用戶在該小區(qū)的停留時間是否覆蓋第五預(yù)設(shè)時間段和第六預(yù)設(shè)時間段,并當(dāng)該給定用戶在該小區(qū)的停留時間覆蓋第五預(yù)設(shè)時間段和第六預(yù)設(shè)時間段時,確定該小區(qū)為該給定用戶的工作地。
[0050]其中,確定模塊還包括:
[0051]第九單元,用于根據(jù)給定用戶的唯一標(biāo)識、該給定用戶當(dāng)前所在小區(qū)的唯一標(biāo)識以及進(jìn)入該小區(qū)的時間,通過掃描用戶的運動軌跡參數(shù),得到該給定用戶離開當(dāng)前所在小區(qū)的時間。
[0052]其中,確定模塊還包括:
[0053]第十單元,用于根據(jù)給定用戶的唯一標(biāo)識、該給定用戶當(dāng)前所在小區(qū)的唯一標(biāo)識以及進(jìn)入該小區(qū)的時間,通過掃描用戶的運動軌跡參數(shù),得到該給定用戶下一個最可能出現(xiàn)的小區(qū)的唯一標(biāo)識以及在該小區(qū)中停留的時間。
[0054]本發(fā)明的上述方案至少包括以下有益效果:
[0055]在本發(fā)明的實施例的分析用戶軌跡的方法中,對采集到的用戶的信令數(shù)據(jù)進(jìn)行清洗,并根據(jù)清洗后的信令數(shù)據(jù),得到用戶的運動軌跡參數(shù),再根據(jù)給定用戶的唯一標(biāo)識從用戶的運動軌跡參數(shù)中確定出該給定用戶的軌跡,從而簡單、高效地分析信令數(shù)據(jù),確定出給定用戶的軌跡?!靖綀D說明】
[0056]圖1為本發(fā)明實施例中分析用戶軌跡的方法的流程圖;
[0057]圖2為本發(fā)明實施例中圖1中的步驟11的具體步驟流程圖;
[0058]圖3為本發(fā)明實施例中圖1中的步驟12的具體步驟流程圖;
[0059]圖4為本發(fā)明實施例中分析用戶軌跡的裝置的結(jié)構(gòu)示意圖。【具體實施方式】
[0060]為使本發(fā)明要解決的技術(shù)問題、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖及具體實施例進(jìn)行詳細(xì)描述。
[0061]本發(fā)明針對現(xiàn)有技術(shù)中分析信令數(shù)據(jù)較復(fù)雜的問題,提供了一種分析用戶軌跡的方法及裝置,能簡單、高效地分析信令數(shù)據(jù)。
[0062]如圖1所示,本發(fā)明的實施例提供了一種分析用戶軌跡的方法,該方法包括:
[0063]步驟11,對采集到的用戶的信令數(shù)據(jù)進(jìn)行清洗。
[0064]在本發(fā)明的具體實施例中,對采集到的用戶的信令數(shù)據(jù)進(jìn)行清洗可以提高后續(xù)數(shù)據(jù)分析的正確性。
[0065]步驟12,根據(jù)清洗后的信令數(shù)據(jù),得到用戶的運動軌跡參數(shù),運動軌跡參數(shù)包括用戶的唯一標(biāo)識、每個小區(qū)的唯一標(biāo)識、用戶進(jìn)入每個小區(qū)的最早時間和最晚時間以及用戶在每個小區(qū)內(nèi)的最短停留時間和最長停留時間。
[0066]在本發(fā)明的具體實施例中,根據(jù)清洗后的信令數(shù)據(jù),進(jìn)行用戶軌跡分析。具體地, 可以使用PrefixSpan算法對用戶的信令數(shù)據(jù)進(jìn)行分析,挖掘出用戶的居住地,工作地,及用戶習(xí)慣性的運動軌跡等。
[0067]步驟13,根據(jù)給定用戶的唯一標(biāo)識和用戶的運動軌跡參數(shù),確定給定用戶的軌跡。
[0068]在本發(fā)明的具體實施例中,可根據(jù)給定用戶的唯一標(biāo)識,從步驟12中得到的用戶的運動軌跡參數(shù)中確定出該給定用戶的軌跡。
[0069]在本發(fā)明的具體實施例中,利用PrefixSpan算法分析用戶行為軌跡,該分析方法簡單高效,以便實現(xiàn)簡單、高效地分析信令數(shù)據(jù)。其中利用PrefixSpan算法分析用戶行為軌跡對于本領(lǐng)域的技術(shù)人員來說是公知常識,在此不再贅述。
[0070]其中,在本發(fā)明的上述實施例中,如圖2所示,步驟11的具體步驟為:
[0071]步驟21,對采集到的用戶的信令數(shù)據(jù)中的殘缺信令數(shù)據(jù)進(jìn)行補全。
[0072]在本發(fā)明的具體實施例中,可以通過線性、均值等常見的方式對采集到的用戶的信令數(shù)據(jù)中的殘缺信令數(shù)據(jù)進(jìn)行補全。在補全的過程中,若出現(xiàn)無法補全的信令數(shù)據(jù),則舍棄該信令數(shù)據(jù)。
[0073]步驟22,根據(jù)信令數(shù)據(jù)規(guī)則,判斷補全后的用戶的信令數(shù)據(jù)是否為錯誤信令數(shù)據(jù)。
[0074]步驟23,若是錯誤信令數(shù)據(jù),則糾正該錯誤信令數(shù)據(jù)。
[0075]在本發(fā)明的具體實施例中,需要根據(jù)信令數(shù)據(jù)規(guī)則判斷出補全后的信令數(shù)據(jù)中的錯誤信令數(shù)據(jù),并糾正這些錯誤的信令數(shù)據(jù)。在糾正的過程中,若出現(xiàn)無法糾正的信令數(shù)據(jù),則舍棄該信令數(shù)據(jù)。
[0076]步驟24,對糾正后的用戶的信令數(shù)據(jù)進(jìn)行去重處理。
[0077]在本發(fā)明的具體實施例中,需要去除糾正后的信令數(shù)據(jù)中的重復(fù)的信令數(shù)據(jù),以便提高后續(xù)數(shù)據(jù)分析的正確性。
[0078]其中,在本發(fā)明的上述實施例中,如圖3所示,上述步驟12的具體步驟為:
[0079]步驟31,從清洗后的信令數(shù)據(jù)中獲取用戶每天的信令數(shù)據(jù),并按照用戶進(jìn)入不同小區(qū)的時間先后順序?qū)Λ@取到的每天的信令數(shù)據(jù)進(jìn)行排序。
[0080]步驟32,根據(jù)排序后的信令數(shù)據(jù),得到預(yù)設(shè)天數(shù)內(nèi)用戶每天的軌跡參數(shù),每天的軌跡參數(shù)包括用戶的唯一標(biāo)識、每個小區(qū)的唯一標(biāo)識、用戶每天進(jìn)入每個小區(qū)的最早時間和最晚時間以及用戶每天在每個小區(qū)內(nèi)的最短停留時間和最長停留時間。
[0081]在本發(fā)明的具體實施例中,從清洗后的信令數(shù)據(jù)中獲取用戶每一天的所有信令數(shù)據(jù),得到的信令數(shù)據(jù)的格式可以是{userlD, [cellIDl,entertime,residenceTime], [ce 11ID2, entertime, residenceTime],…},其中:userID 為某用戶的唯一標(biāo)識;cell ID 1 為用戶進(jìn)入此小區(qū)的唯一標(biāo)識;entertime為用戶userlD進(jìn)入小區(qū)celllDl的進(jìn)入時間; residenceTime為用戶userlD進(jìn)入小區(qū)celllDl的停留時間。獲得每一天的所有信令數(shù)據(jù)后,會按照用戶進(jìn)入不同小區(qū)在時間的先后順序?qū)τ脩粜帕顢?shù)據(jù)排序,從而得到用戶每一天的軌跡。進(jìn)一步地,還可以對上述每一天的信令數(shù)據(jù)進(jìn)行處理得到其它的軌跡參數(shù) (例如用戶一天中平均進(jìn)入小區(qū)celllDl的進(jìn)入時間等)。具體地,可以經(jīng)過分析處理得到如下格式的數(shù)據(jù):{userlD, [celllDl, firstEntertime,endEntertime,avgEntertime, minResidenceTime,maxResidenceTime],[cellID2, firstEntertime, endEntertime, minResidenceTime,maxResidenceTime,avgResidenceTime],Probability},其中:userlD 為某用戶的唯一標(biāo)識;celllDl為用戶進(jìn)入此小區(qū)的唯一標(biāo)識;firstEntertime為用戶 userlD 一天中最早進(jìn)入小區(qū)celllDl的進(jìn)入時間;endEntertime為用戶userlD —天中最晚進(jìn)入小區(qū)celllDl的進(jìn)入時間;avgEntertime為用戶userlD —天中平均進(jìn)入小區(qū) celllDl的進(jìn)入時間;minResidence為用戶userlD進(jìn)入小區(qū)celllDl的停留最短時間; maxResidence為用戶userlD進(jìn)入小區(qū)celllDl的停留最長時間;avgResidenceTime為用戶userlD進(jìn)入小區(qū)celllDl的平均停留時間;Probability為為用戶userlD已經(jīng)小區(qū) celllDl后,可能會進(jìn)入小區(qū)cellID2的概率。
[0082]步驟33,根據(jù)預(yù)設(shè)權(quán)值,對預(yù)設(shè)天數(shù)內(nèi)用戶每天的軌跡參數(shù)進(jìn)行加權(quán)處理,得到用戶的運動軌跡參數(shù),其中,距離當(dāng)前時刻越遠(yuǎn)的軌跡參數(shù)的預(yù)設(shè)權(quán)值越小。
[0083]在本發(fā)明的具體實施例中,可以根據(jù)用戶當(dāng)前的位置,實時更新用戶軌跡分析挖掘出來的數(shù)據(jù),且對最新(即離當(dāng)前時刻最近)的數(shù)據(jù)賦予更高的權(quán)重,弱化歷史數(shù)據(jù)的信息,從而為用戶軌跡的分析提供最新的可靠信息。
[0084]在本發(fā)明的具體實施例中,具體的預(yù)設(shè)天數(shù)可根據(jù)業(yè)務(wù)的需求進(jìn)行調(diào)整。接下來以35天為例進(jìn)行說明。在獲得用戶UserlD在小區(qū)celllDl的最近35天的數(shù)據(jù)后。將35 天數(shù)據(jù)分為5周,計算出用戶UserlD每周進(jìn)入小區(qū)celllDl的最早進(jìn)入時間,早進(jìn)入時間, 最晚進(jìn)入時間、最短停留時間,最長停留時間等,得到的每周的數(shù)據(jù)為{userlD, [celllDl, f irstEntertime, endEntertime,avgEntertime,minResidenceTime,maxResidenceTime],對五周數(shù)據(jù)進(jìn)行加權(quán)處理。計算加權(quán)公式可以為:5*最近第一周數(shù)據(jù)+4*最近第二周數(shù)據(jù)+3* 最近第三周數(shù)據(jù)+2*最近第四周數(shù)據(jù)+最近第五周數(shù)據(jù)A5+4+3+2+1),根據(jù)此公式對歷史數(shù)據(jù)進(jìn)行了弱化,對最新數(shù)據(jù)賦予更高的權(quán)重??傻玫接脩魎serlD在小區(qū)celllDl最終的最早進(jìn)入時間,最晚進(jìn)入時間、最短停留時間,最長停留時間等。可以理解的是,在本發(fā)明的實施例中,并不限定加權(quán)處理的具體公式,只要對最新的數(shù)據(jù)賦予更高的權(quán)重,弱化歷史數(shù)據(jù)即可。
[0085]在本發(fā)明的具體實施例中,根據(jù)用戶的實時位置信息動態(tài)調(diào)整用戶的軌跡參數(shù), 提高了確定用戶軌跡的精度。
[0086]其中,在本發(fā)明的具體實施例中,上述步驟13的具體步驟可以為:根據(jù)給定用戶的唯一標(biāo)識,通過掃描用戶的運動軌跡參數(shù),獲取該給定用戶在小區(qū)內(nèi)的最短停留時間為第一預(yù)設(shè)時間對應(yīng)的運動軌跡數(shù)據(jù);判斷該給定用戶進(jìn)入該小區(qū)的平均時間是否在第二預(yù)設(shè)時間段內(nèi);若該給定用戶進(jìn)入該小區(qū)的平均時間在第二預(yù)設(shè)時間段內(nèi),則進(jìn)一步判斷該給定用戶在該小區(qū)的停留時間是否覆蓋第三預(yù)設(shè)時間段;若該給定用戶在該小區(qū)的停留時間覆蓋第三預(yù)設(shè)時間段,則確定該小區(qū)為該給定用戶的居住地。
[0087]在本發(fā)明的具體實施例中,可以將第一預(yù)設(shè)時間設(shè)為5小時,第二預(yù)設(shè)時間段設(shè)為18點至24點,第三預(yù)設(shè)時間段設(shè)為凌晨1點至凌晨6點,可以理解的是,在本發(fā)明的實施例中,并不限定第一預(yù)設(shè)時間、第二預(yù)設(shè)時間段以及第三預(yù)設(shè)時間段的具體數(shù)值。
[0088]在本發(fā)明的具體實施例中,可根據(jù)給定用戶放入userlD,掃描上述分析數(shù)據(jù)獲取此用戶在某小區(qū)最短停留時間大約5小時的數(shù)據(jù),再獲取進(jìn)入此小區(qū)的平均進(jìn)入時間,若平均進(jìn)入時間為18點至24點,且停留時間可覆蓋凌晨1點凌至晨6點的小區(qū),可判斷此小區(qū)為用戶的居住地。
[0089]其中,在本發(fā)明的具體實施例中,根據(jù)給定用戶的唯一標(biāo)識,通過掃描用戶的運動軌跡參數(shù),獲取該給定用戶在小區(qū)內(nèi)的最短停留時間為第一預(yù)設(shè)時間對應(yīng)的運動軌跡數(shù)據(jù)的步驟之后,方法還包括:判斷該給定用戶進(jìn)入該小區(qū)的平均時間是否在第四預(yù)設(shè)時間段內(nèi);若該給定用戶進(jìn)入該小區(qū)的平均時間在第四預(yù)設(shè)時間段內(nèi),則進(jìn)一步判斷該給定用戶在該小區(qū)的停留時間是否覆蓋第五預(yù)設(shè)時間段和第六預(yù)設(shè)時間段;若該給定用戶在該小區(qū)的停留時間覆蓋第五預(yù)設(shè)時間段和第六預(yù)設(shè)時間段,則確定該小區(qū)為該給定用戶的工作地。
[0090]在本發(fā)明的具體實施例中,可將第四預(yù)設(shè)時間段設(shè)為7點至9點,第五預(yù)設(shè)時間段設(shè)為9點半至11點半,第六預(yù)設(shè)時間段設(shè)為14點半至17點半。可以理解的是,在本發(fā)明的實施例中并不限定第四預(yù)設(shè)時間段、第五預(yù)設(shè)時間段以及第六預(yù)設(shè)時間段的具體數(shù)值。
[0091]在本發(fā)明的具體實施例中,可根據(jù)給定用戶的userlD,掃描上述分析數(shù)據(jù)獲取此用戶在某小區(qū)最短停留時間大約5小時的數(shù)據(jù),再獲取進(jìn)入此小區(qū)的平均進(jìn)入時間,若平均進(jìn)入時間為7點至9點,且停留時間可覆蓋9點半至11點半及14點半至17點半的小區(qū), 可判斷此小區(qū)為用戶的工作地。
[0092]其中,在本發(fā)明的上述實施例中,上述步驟13的具體步驟還可以為:根據(jù)給定用戶的唯一標(biāo)識、該給定用戶當(dāng)前所在小區(qū)的唯一標(biāo)識以及進(jìn)入該小區(qū)的時間,通過掃描用戶的運動軌跡參數(shù),得到該給定用戶離開當(dāng)前所在小區(qū)的時間。
[0093]在本發(fā)明的具體實施例中,可根據(jù)給定用戶的userlD、用戶當(dāng)前所在小區(qū)的ID以及進(jìn)入此小區(qū)的時間,掃描上述分析數(shù)據(jù),獲取此用戶在此小區(qū)的平均停留時間,再根據(jù)用戶進(jìn)入該小區(qū)的時間,可得到用戶可能離開的時間。
[0094]其中,在本發(fā)明的上述實施例中,上述步驟13的具體步驟還可以為:根據(jù)給定用戶的唯一標(biāo)識、該給定用戶當(dāng)前所在小區(qū)的唯一標(biāo)識以及進(jìn)入該小區(qū)的時間,通過掃描用戶的運動軌跡參數(shù),得到該給定用戶下一個最可能出現(xiàn)的小區(qū)的唯一標(biāo)識以及在該小區(qū)中停留的時間。
[0095]在本發(fā)明的具體實施例中,可根據(jù)給定用戶的userlD、用戶當(dāng)前所在小區(qū)的ID以及進(jìn)入此小區(qū)的時間,掃描上述分析數(shù)據(jù),獲取用戶接下來最有可能出現(xiàn)在哪個小區(qū)。具體地,可從分析數(shù)據(jù)中的Probability字段中得到在下一小區(qū)出現(xiàn)的概率,及在下一小區(qū)的停留時間。
[0096]為了更好的實現(xiàn)上述目的,如圖4所示,本發(fā)明的實施例提供了一種分析用戶軌跡的裝置,該裝置包括:
[0097]清洗模塊41,用于對采集到的用戶的信令數(shù)據(jù)進(jìn)行清洗;
[0098]獲得模塊42,用于根據(jù)清洗后的信令數(shù)據(jù),得到用戶的運動軌跡參數(shù),運動軌跡參數(shù)包括用戶的唯一標(biāo)識、每個小區(qū)的唯一標(biāo)識、用戶進(jìn)入每個小區(qū)的最早時間和最晚時間以及用戶在每個小區(qū)內(nèi)的最短停留時間和最長停留時間;
[0099]確定模塊43,用于根據(jù)給定用戶的唯一標(biāo)識和用戶的運動軌跡參數(shù),確定給定用戶的軌跡。
[0100]其中,清洗模塊41包括:[〇1〇1]補全單元,用于對采集到的用戶的信令數(shù)據(jù)中的殘缺信令數(shù)據(jù)進(jìn)行補全;
[0102]判斷單元,用于根據(jù)信令數(shù)據(jù)規(guī)則,判斷補全后的用戶的信令數(shù)據(jù)是否為錯誤信令數(shù)據(jù),并當(dāng)補全后的用戶的信令數(shù)據(jù)是錯誤信令數(shù)據(jù)時,觸發(fā)糾正單元;
[0103]糾正單元,用于根據(jù)判斷單元的觸發(fā),糾正該錯誤信令數(shù)據(jù);
[0104]去重單元,用于對糾正后的用戶的信令數(shù)據(jù)進(jìn)行去重處理。
[0105]其中,獲得模塊42包括:
[0106]第一單元,用于從清洗后的信令數(shù)據(jù)中獲取用戶每天的信令數(shù)據(jù),并按照用戶進(jìn)入不同小區(qū)的時間先后順序?qū)Λ@取到的每天的信令數(shù)據(jù)進(jìn)行排序;
[0107]第二單元,用于根據(jù)排序后的信令數(shù)據(jù),得到預(yù)設(shè)天數(shù)內(nèi)用戶每天的軌跡參數(shù),每天的軌跡參數(shù)包括用戶的唯一標(biāo)識、每個小區(qū)的唯一標(biāo)識、用戶每天進(jìn)入每個小區(qū)的最早時間和最晚時間以及用戶每天在每個小區(qū)內(nèi)的最短停留時間和最長停留時間;
[0108]第三單元,用于根據(jù)預(yù)設(shè)權(quán)值,對預(yù)設(shè)天數(shù)內(nèi)用戶每天的軌跡參數(shù)進(jìn)行加權(quán)處理, 得到用戶的運動軌跡參數(shù),其中,距離當(dāng)前時刻越遠(yuǎn)的軌跡參數(shù)的預(yù)設(shè)權(quán)值越小。
[0109]其中,確定模塊43包括:
[0110]第四單元,用于根據(jù)給定用戶的唯一標(biāo)識,通過掃描用戶的運動軌跡參數(shù),獲取該給定用戶在小區(qū)內(nèi)的最短停留時間為第一預(yù)設(shè)時間對應(yīng)的運動軌跡數(shù)據(jù);
[0111]第五單元,用于判斷該給定用戶進(jìn)入該小區(qū)的平均時間是否在第二預(yù)設(shè)時間段內(nèi),并當(dāng)該給定用戶進(jìn)入該小區(qū)的平均時間在第二預(yù)設(shè)時間段內(nèi)時,觸發(fā)第六單元;
[0112]第六單元,用于根據(jù)第五單元的觸發(fā),進(jìn)一步判斷該給定用戶在該小區(qū)的停留時間是否覆蓋第三預(yù)設(shè)時間段,并當(dāng)該給定用戶在該小區(qū)的停留時間覆蓋第三預(yù)設(shè)時間段時,確定該小區(qū)為該給定用戶的居住地。
[0113]其中,確定模塊43還包括:
[0114]第七單元,用于判斷該給定用戶進(jìn)入該小區(qū)的平均時間是否在第四預(yù)設(shè)時間段內(nèi),并當(dāng)該給定用戶進(jìn)入該小區(qū)的平均時間在第四預(yù)設(shè)時間段內(nèi)時,觸發(fā)第八單元;
[0115]第八單元,用于根據(jù)第七單元的觸發(fā),進(jìn)一步判斷該給定用戶在該小區(qū)的停留時間是否覆蓋第五預(yù)設(shè)時間段和第六預(yù)設(shè)時間段,并當(dāng)該給定用戶在該小區(qū)的停留時間覆蓋第五預(yù)設(shè)時間段和第六預(yù)設(shè)時間段時,確定該小區(qū)為該給定用戶的工作地。
[0116]其中,確定模塊43還包括:
[0117]第九單元,用于根據(jù)給定用戶的唯一標(biāo)識、該給定用戶當(dāng)前所在小區(qū)的唯一標(biāo)識以及進(jìn)入該小區(qū)的時間,通過掃描用戶的運動軌跡參數(shù),得到該給定用戶離開當(dāng)前所在小區(qū)的時間。
[0118]其中,確定模塊43還包括:
[0119]第十單元,用于根據(jù)給定用戶的唯一標(biāo)識、該給定用戶當(dāng)前所在小區(qū)的唯一標(biāo)識以及進(jìn)入該小區(qū)的時間,通過掃描用戶的運動軌跡參數(shù),得到該給定用戶下一個最可能出現(xiàn)的小區(qū)的唯一標(biāo)識以及在該小區(qū)中停留的時間。
[0120]需要說明的是,本發(fā)明實施例提供的分析用戶軌跡的裝置是應(yīng)用上述方法的裝置,即上述方法的所有實施例均適用于該裝置,且均能達(dá)到相同或相似的有益效果。
[0121]以上所述是本發(fā)明的優(yōu)選實施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明所述原理的前提下,還可以作出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。
【主權(quán)項】
1.一種分析用戶軌跡的方法,其特征在于,包括:對采集到的用戶的信令數(shù)據(jù)進(jìn)行清洗;根據(jù)清洗后的信令數(shù)據(jù),得到用戶的運動軌跡參數(shù),所述運動軌跡參數(shù)包括用戶的唯 一標(biāo)識、每個小區(qū)的唯一標(biāo)識、用戶進(jìn)入每個小區(qū)的最早時間和最晚時間以及用戶在每個 小區(qū)內(nèi)的最短停留時間和最長停留時間;根據(jù)給定用戶的唯一標(biāo)識和所述用戶的運動軌跡參數(shù),確定給定用戶的軌跡。2.如權(quán)利要求1所述的方法,其特征在于,所述對采集到的用戶的信令數(shù)據(jù)進(jìn)行清洗 的步驟包括:對采集到的用戶的信令數(shù)據(jù)中的殘缺信令數(shù)據(jù)進(jìn)行補全;根據(jù)信令數(shù)據(jù)規(guī)則,判斷補全后的用戶的信令數(shù)據(jù)是否為錯誤信令數(shù)據(jù);若是錯誤信令數(shù)據(jù),則糾正該錯誤信令數(shù)據(jù);對糾正后的用戶的信令數(shù)據(jù)進(jìn)行去重處理。3.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)清洗后的信令數(shù)據(jù),得到用戶的運 動軌跡參數(shù)的步驟包括:從清洗后的信令數(shù)據(jù)中獲取用戶每天的信令數(shù)據(jù),并按照用戶進(jìn)入不同小區(qū)的時間先 后順序?qū)Λ@取到的每天的信令數(shù)據(jù)進(jìn)行排序;根據(jù)排序后的信令數(shù)據(jù),得到預(yù)設(shè)天數(shù)內(nèi)用戶每天的軌跡參數(shù),所述每天的軌跡參數(shù) 包括用戶的唯一標(biāo)識、每個小區(qū)的唯一標(biāo)識、用戶每天進(jìn)入每個小區(qū)的最早時間和最晚時 間以及用戶每天在每個小區(qū)內(nèi)的最短停留時間和最長停留時間;根據(jù)預(yù)設(shè)權(quán)值,對預(yù)設(shè)天數(shù)內(nèi)用戶每天的軌跡參數(shù)進(jìn)行加權(quán)處理,得到用戶的運動軌 跡參數(shù),其中,距離當(dāng)前時刻越遠(yuǎn)的軌跡參數(shù)的預(yù)設(shè)權(quán)值越小。4.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)給定用戶的唯一標(biāo)識和所述用戶 的運動軌跡參數(shù),確定給定用戶的軌跡的步驟包括:根據(jù)給定用戶的唯一標(biāo)識,通過掃描所述用戶的運動軌跡參數(shù),獲取該給定用戶在小 區(qū)內(nèi)的最短停留時間為第一預(yù)設(shè)時間對應(yīng)的運動軌跡數(shù)據(jù);判斷該給定用戶進(jìn)入該小區(qū)的平均時間是否在第二預(yù)設(shè)時間段內(nèi);若該給定用戶進(jìn)入該小區(qū)的平均時間在第二預(yù)設(shè)時間段內(nèi),則進(jìn)一步判斷該給定用戶 在該小區(qū)的停留時間是否覆蓋第三預(yù)設(shè)時間段;若該給定用戶在該小區(qū)的停留時間覆蓋第三預(yù)設(shè)時間段,則確定該小區(qū)為該給定用戶 的居住地。5.如權(quán)利要求4所述的方法,其特征在于,所述根據(jù)給定用戶的唯一標(biāo)識,通過掃描所 述用戶的運動軌跡參數(shù),獲取該給定用戶在小區(qū)內(nèi)的最短停留時間為第一預(yù)設(shè)時間對應(yīng)的 運動軌跡數(shù)據(jù)的步驟之后,所述方法還包括:判斷該給定用戶進(jìn)入該小區(qū)的平均時間是否在第四預(yù)設(shè)時間段內(nèi);若該給定用戶進(jìn)入該小區(qū)的平均時間在第四預(yù)設(shè)時間段內(nèi),則進(jìn)一步判斷該給定用戶 在該小區(qū)的停留時間是否覆蓋第五預(yù)設(shè)時間段和第六預(yù)設(shè)時間段;若該給定用戶在該小區(qū)的停留時間覆蓋第五預(yù)設(shè)時間段和第六預(yù)設(shè)時間段,則確定該 小區(qū)為該給定用戶的工作地。6.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)給定用戶的唯一標(biāo)識和所述用戶的運動軌跡參數(shù),確定給定用戶的軌跡的步驟包括:根據(jù)給定用戶的唯一標(biāo)識、該給定用戶當(dāng)前所在小區(qū)的唯一標(biāo)識以及進(jìn)入該小區(qū)的時 間,通過掃描所述用戶的運動軌跡參數(shù),得到該給定用戶離開當(dāng)前所在小區(qū)的時間。7.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)給定用戶的唯一標(biāo)識和所述用戶 的運動軌跡參數(shù),確定給定用戶的軌跡的步驟包括:根據(jù)給定用戶的唯一標(biāo)識、該給定用戶當(dāng)前所在小區(qū)的唯一標(biāo)識以及進(jìn)入該小區(qū)的時 間,通過掃描所述用戶的運動軌跡參數(shù),得到該給定用戶下一個最可能出現(xiàn)的小區(qū)的唯一 標(biāo)識以及在該小區(qū)中停留的時間。8.—種分析用戶軌跡的裝置,其特征在于,包括:清洗模塊,用于對采集到的用戶的信令數(shù)據(jù)進(jìn)行清洗;獲得模塊,用于根據(jù)清洗后的信令數(shù)據(jù),得到用戶的運動軌跡參數(shù),所述運動軌跡參數(shù) 包括用戶的唯一標(biāo)識、每個小區(qū)的唯一標(biāo)識、用戶進(jìn)入每個小區(qū)的最早時間和最晚時間以 及用戶在每個小區(qū)內(nèi)的最短停留時間和最長停留時間;確定模塊,用于根據(jù)給定用戶的唯一標(biāo)識和所述用戶的運動軌跡參數(shù),確定給定用戶 的軌跡。9.如權(quán)利要求8所述的裝置,其特征在于,所述清洗模塊包括:補全單元,用于對采集到的用戶的信令數(shù)據(jù)中的殘缺信令數(shù)據(jù)進(jìn)行補全;判斷單元,用于根據(jù)信令數(shù)據(jù)規(guī)則,判斷補全后的用戶的信令數(shù)據(jù)是否為錯誤信令數(shù) 據(jù),并當(dāng)補全后的用戶的信令數(shù)據(jù)是錯誤信令數(shù)據(jù)時,觸發(fā)糾正單元;糾正單元,用于根據(jù)所述判斷單元的觸發(fā),糾正該錯誤信令數(shù)據(jù);去重單元,用于對糾正后的用戶的信令數(shù)據(jù)進(jìn)行去重處理。10.如權(quán)利要求8所述的裝置,其特征在于,所述獲得模塊包括:第一單元,用于從清洗后的信令數(shù)據(jù)中獲取用戶每天的信令數(shù)據(jù),并按照用戶進(jìn)入不 同小區(qū)的時間先后順序?qū)Λ@取到的每天的信令數(shù)據(jù)進(jìn)行排序;第二單元,用于根據(jù)排序后的信令數(shù)據(jù),得到預(yù)設(shè)天數(shù)內(nèi)用戶每天的軌跡參數(shù),所述每 天的軌跡參數(shù)包括用戶的唯一標(biāo)識、每個小區(qū)的唯一標(biāo)識、用戶每天進(jìn)入每個小區(qū)的最早 時間和最晚時間以及用戶每天在每個小區(qū)內(nèi)的最短停留時間和最長停留時間;第三單元,用于根據(jù)預(yù)設(shè)權(quán)值,對預(yù)設(shè)天數(shù)內(nèi)用戶每天的軌跡參數(shù)進(jìn)行加權(quán)處理,得到 用戶的運動軌跡參數(shù),其中,距離當(dāng)前時刻越遠(yuǎn)的軌跡參數(shù)的預(yù)設(shè)權(quán)值越小。11.如權(quán)利要求8所述的裝置,其特征在于,所述確定模塊包括:第四單元,用于根據(jù)給定用戶的唯一標(biāo)識,通過掃描所述用戶的運動軌跡參數(shù),獲取該 給定用戶在小區(qū)內(nèi)的最短停留時間為第一預(yù)設(shè)時間對應(yīng)的運動軌跡數(shù)據(jù);第五單元,用于判斷該給定用戶進(jìn)入該小區(qū)的平均時間是否在第二預(yù)設(shè)時間段內(nèi),并 當(dāng)該給定用戶進(jìn)入該小區(qū)的平均時間在第二預(yù)設(shè)時間段內(nèi)時,觸發(fā)第六單元;第六單元,用于根據(jù)所述第五單元的觸發(fā),進(jìn)一步判斷該給定用戶在該小區(qū)的停留時 間是否覆蓋第三預(yù)設(shè)時間段,并當(dāng)該給定用戶在該小區(qū)的停留時間覆蓋第三預(yù)設(shè)時間段 時,確定該小區(qū)為該給定用戶的居住地。12.如權(quán)利要求11所述的裝置,其特征在于,所述確定模塊還包括:第七單元,用于判斷該給定用戶進(jìn)入該小區(qū)的平均時間是否在第四預(yù)設(shè)時間段內(nèi),并當(dāng)該給定用戶進(jìn)入該小區(qū)的平均時間在第四預(yù)設(shè)時間段內(nèi)時,觸發(fā)第八單元;第八單元,用于根據(jù)所述第七單元的觸發(fā),進(jìn)一步判斷該給定用戶在該小區(qū)的停留時 間是否覆蓋第五預(yù)設(shè)時間段和第六預(yù)設(shè)時間段,并當(dāng)該給定用戶在該小區(qū)的停留時間覆蓋 第五預(yù)設(shè)時間段和第六預(yù)設(shè)時間段時,確定該小區(qū)為該給定用戶的工作地。13.如權(quán)利要求8所述的裝置,其特征在于,所述確定模塊還包括:第九單元,用于根據(jù)給定用戶的唯一標(biāo)識、該給定用戶當(dāng)前所在小區(qū)的唯一標(biāo)識以及 進(jìn)入該小區(qū)的時間,通過掃描所述用戶的運動軌跡參數(shù),得到該給定用戶離開當(dāng)前所在小 區(qū)的時間。14.如權(quán)利要求8所述的裝置,其特征在于,所述確定模塊還包括:第十單元,用于根據(jù)給定用戶的唯一標(biāo)識、該給定用戶當(dāng)前所在小區(qū)的唯一標(biāo)識以及 進(jìn)入該小區(qū)的時間,通過掃描所述用戶的運動軌跡參數(shù),得到該給定用戶下一個最可能出 現(xiàn)的小區(qū)的唯一標(biāo)識以及在該小區(qū)中停留的時間。
【文檔編號】H04W24/02GK105989226SQ201510075261
【公開日】2016年10月5日
【申請日】2015年2月12日
【發(fā)明人】楊魁
【申請人】中興通訊股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1