亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

通勤訂單識別方法和裝置的制造方法

文檔序號:10535699閱讀:208來源:國知局
通勤訂單識別方法和裝置的制造方法
【專利摘要】本申請公開了通勤訂單識別方法和裝置。所述方法的一【具體實施方式】包括:獲取用戶的軌跡數(shù)據(jù),其中,所述軌跡數(shù)據(jù)包括多個軌跡點的位置信息;針對各個軌跡點的位置信息利用聚類算法對軌跡點進(jìn)行聚類,生成軌跡點的簇集合;將所述軌跡點的簇集合導(dǎo)入預(yù)先訓(xùn)練的通勤位置識別模型進(jìn)行識別,得到第一位置信息和第二位置信息;根據(jù)獲取到的所述用戶的多個歷史訂單的位置信息、所述第一位置信息和所述第二位置信息,識別出所述歷史訂單中的通勤訂單。該實施方式實現(xiàn)了通勤訂單的準(zhǔn)確識別。
【專利說明】
通勤訂單識別方法和裝置
技術(shù)領(lǐng)域
[0001]本申請涉及計算機技術(shù)領(lǐng)域,具體涉及互聯(lián)網(wǎng)訂單處理技術(shù)領(lǐng)域,尤其涉及通勤訂單識別方法和裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)用車業(yè)務(wù)的發(fā)展,一部分互聯(lián)網(wǎng)叫車用戶會在通勤過程中選擇專車和順風(fēng)車等互聯(lián)網(wǎng)用車業(yè)務(wù)。這些通勤訂單具有優(yōu)良的商業(yè)價值,如果能夠獲取到通勤訂單,就可以獲取到通勤用戶和通勤時間等重要信息,從而可以更好的分析用戶行為,理解用戶需求,有針對性的進(jìn)行車輛調(diào)度,也為精準(zhǔn)的營銷提供有力的數(shù)據(jù)支持。
[0003]然而,現(xiàn)有的通勤訂單識別方法通常是通過用戶預(yù)先設(shè)定的通勤線路清單來獲取的,而無法自動識別叫車業(yè)務(wù)中的通勤訂單。

【發(fā)明內(nèi)容】

[0004]本申請的目的在于提出一種改進(jìn)的通勤訂單識別方法和裝置,來解決以上【背景技術(shù)】部分提到的技術(shù)問題。
[0005]第一方面,本申請?zhí)峁┝艘环N通勤訂單識別方法,所述方法包括:獲取用戶的軌跡數(shù)據(jù),其中,所述軌跡數(shù)據(jù)包括多個軌跡點的位置信息;針對各個軌跡點的位置信息利用聚類算法對軌跡點進(jìn)行聚類,生成軌跡點的簇集合;將所述軌跡點的簇集合導(dǎo)入預(yù)先訓(xùn)練的通勤位置識別模型進(jìn)行識別,得到第一位置信息和第二位置信息;根據(jù)獲取到的所述用戶的多個歷史訂單的位置信息、所述第一位置信息和所述第二位置信息,識別出所述歷史訂單中的通勤訂單。
[0006]在一些實施例中,所述方法還包括:建立通勤位置識別模型的步驟,包括:獲取在預(yù)定應(yīng)用程序中提交了第一位置信息和第二位置信息的用戶,并獲取所述用戶的軌跡數(shù)據(jù),其中,所述軌跡數(shù)據(jù)包括多個軌跡點的位置信息;針對各個軌跡點的位置信息利用聚類算法對軌跡點進(jìn)行聚類,生成軌跡點的簇集合;基于所述軌跡點的簇集合和在預(yù)定時間段內(nèi)所述用戶的軌跡點落入所述軌跡點的簇集合中的相關(guān)信息,訓(xùn)練得到通勤位置識別模型。
[0007]在一些實施例中,所述訓(xùn)練得到通勤位置識別模型包括:利用分類器訓(xùn)練得到通勤位置識別模型,其中,所述分類器包括:決策樹、隨機森林、迭代決策樹和支持向量機。
[0008]在一些實施例中,所述方法還包括:基于通勤訂單的數(shù)量或比例,識別通勤用戶,包括:獲取所述用戶在歷史時間段內(nèi)所有訂單的數(shù)量,并統(tǒng)計所述所有訂單中所述用戶的通勤訂單的數(shù)量;確定所述通勤訂單的數(shù)量占所有訂單的數(shù)量的比例;將所述通勤訂單的數(shù)量大于預(yù)設(shè)閾值或所述比例大于預(yù)設(shè)閾值的用戶識別為通勤用戶。
[0009]在一些實施例中,在所述將所述通勤訂單的數(shù)量大于預(yù)設(shè)閾值或所述比例大于預(yù)設(shè)閾值的用戶識別為通勤用戶之后,所述方法還包括:識別所述通勤用戶的通勤時間,包括:采集所述通勤用戶在歷史時間段內(nèi)發(fā)生的通勤訂單的時間信息;將所述歷史時間段內(nèi)的所述時間信息在一天中對應(yīng)的不同的時間段內(nèi)出現(xiàn)的次數(shù)添加到所述時間段對應(yīng)的訂單數(shù)量列表中;將所述訂單數(shù)量列表中的訂單數(shù)量大于預(yù)設(shè)閾值并且所述訂單數(shù)量與所述訂單數(shù)量列表中的訂單總數(shù)量的比值大于預(yù)設(shè)閾值的訂單數(shù)量所對應(yīng)的時間段標(biāo)識為所述用戶的通勤時間。
[0010]在一些實施例中,所述根據(jù)獲取到的所述用戶的多個歷史訂單的位置信息、所述第一位置信息和所述第二位置信息,識別出所述歷史訂單中的通勤訂單,包括:獲取所述歷史訂單的位置信息中的軌跡起點坐標(biāo)位置與所述第一位置信息中的第一坐標(biāo)位置之間的距離;獲取所述歷史訂單的位置信息中的軌跡終點坐標(biāo)位置與所述第二位置信息中的第二坐標(biāo)位置之間的距離;識別所述距離小于預(yù)設(shè)閾值的訂單為通勤訂單。
[0011]在一些實施例中,所述聚類算法包括:基于密度的聚類算法。
[0012]第二方面,本申請?zhí)峁┝艘环N通勤訂單識別裝置,所述裝置包括:軌跡數(shù)據(jù)獲取單元,配置用于獲取用戶的軌跡數(shù)據(jù),其中,所述軌跡數(shù)據(jù)包括多個軌跡點的位置信息;簇集合生成單元,配置用于針對各個軌跡點的位置信息利用聚類算法對軌跡點進(jìn)行聚類,生成軌跡點的簇集合;第一位置信息和第二位置信息獲取單元,配置用于將所述軌跡點的簇集合導(dǎo)入預(yù)先訓(xùn)練的通勤位置識別模型進(jìn)行識別,得到第一位置信息和第二位置信息;通勤訂單識別單元,配置用于根據(jù)獲取到的所述用戶的多個歷史訂單的位置信息、所述第一位置信息和所述第二位置信息,識別出所述歷史訂單中的通勤訂單。
[0013]在一些實施例中,所述裝置還包括:通勤位置識別模型建立單元,配置用于建立通勤位置識別模型,包括:軌跡數(shù)據(jù)獲取子單元,配置用于獲取在預(yù)定應(yīng)用程序中提交了第一位置信息和第二位置信息的用戶,并獲取所述用戶的軌跡數(shù)據(jù),其中,所述軌跡數(shù)據(jù)包括多個軌跡點的位置信息;簇集合生成子單元,配置用于針對各個軌跡點的位置信息利用聚類算法對軌跡點進(jìn)行聚類,生成軌跡點的簇集合;通勤位置識別模型建立子單元,配置用于基于所述軌跡點的簇集合和在預(yù)定時間段內(nèi)所述用戶的軌跡點落入所述軌跡點的簇集合中的相關(guān)信息,訓(xùn)練得到通勤位置識別模型。
[0014]在一些實施例中,所述通勤位置識別模型建立子單元進(jìn)一步配置用于:利用分類器訓(xùn)練得到通勤位置識別模型,其中,所述分類器包括:決策樹、隨機森林、迭代決策樹和支持向量機。
[0015]在一些實施例中,所述裝置還包括:通勤用戶識別單元,配置用于基于通勤訂單的數(shù)量或比例,識別通勤用戶,包括:通勤訂單數(shù)量統(tǒng)計子單元,配置用于獲取所述用戶在歷史時間段內(nèi)所有訂單的數(shù)量,并統(tǒng)計所述所有訂單中所述用戶的通勤訂單的數(shù)量;比例確定子單元,配置用于確定所述通勤訂單的數(shù)量占所有訂單的數(shù)量的比例;通勤用戶識別子單元,配置用于將所述通勤訂單的數(shù)量大于預(yù)設(shè)閾值或所述比例大于預(yù)設(shè)閾值的用戶識別為通勤用戶。
[0016]在一些實施例中,所述裝置還包括:通勤時間識別單元,配置用于識別所述通勤用戶的通勤時間,包括:時間信息采集子單元,配置用于采集所述通勤用戶在歷史時間段內(nèi)發(fā)生的通勤訂單的時間信息;添加子單元,配置用于將所述歷史時間段內(nèi)的所述時間信息在一天中對應(yīng)的不同的時間段內(nèi)出現(xiàn)的次數(shù)添加到所述時間段對應(yīng)的訂單數(shù)量列表中;通勤時間標(biāo)識子單元,配置用于將所述訂單數(shù)量列表中的訂單數(shù)量大于預(yù)設(shè)閾值并且所述訂單數(shù)量與所述訂單數(shù)量列表中的訂單總數(shù)量的比值大于預(yù)設(shè)閾值的訂單數(shù)量所對應(yīng)的時間段標(biāo)識為所述用戶的通勤時間。
[0017]在一些實施例中,所述通勤訂單識別單元包括:第一獲取子單元,配置用于獲取所述歷史訂單的位置信息中的軌跡起點坐標(biāo)位置與所述第一位置信息中的第一坐標(biāo)位置之間的距離;第二獲取子單元,配置用于獲取所述歷史訂單的位置信息中的軌跡終點坐標(biāo)位置與所述第二位置信息中的第二坐標(biāo)位置之間的距離;通勤訂單識別子單元,配置用于識別所述距離小于預(yù)設(shè)閾值的訂單為通勤訂單。
[0018]在一些實施例中,所述聚類算法包括:基于密度的聚類算法。
[0019]本申請?zhí)峁┑耐ㄇ谟唵巫R別方法和裝置,通過利用通勤位置識別模型得到用戶的第一位置信息和第二位置信息,之后基于用戶的歷史訂單的位置信息和該用戶的第一位置信息和第二位置信息識別該用戶歷史訂單中的通勤訂單,從而有效的利用了已知第一位置信息和第二位置信息的用戶的相關(guān)信息,實現(xiàn)了通勤訂單的準(zhǔn)確識別。
【附圖說明】
[0020]通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細(xì)描述,本申請的其它特征、目的和優(yōu)點將會變得更明顯:
[0021]圖1是本申請可以應(yīng)用于其中的示例性系統(tǒng)架構(gòu)圖;
[0022]圖2是根據(jù)本申請的通勤訂單識別方法的一個實施例的流程圖;
[0023]圖3是根據(jù)本申請的通勤訂單識別方法的又一個實施例的流程圖;
[0024]圖4是根據(jù)本申請的通勤訂單識別裝置的一個實施例的結(jié)構(gòu)示意圖;
[0025]圖5是適于用來實現(xiàn)本申請實施例的服務(wù)器的計算機系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實施方式】
[0026]下面結(jié)合附圖和實施例對本申請作進(jìn)一步的詳細(xì)說明??梢岳斫獾氖?,此處所描述的具體實施例僅僅用于解釋相關(guān)發(fā)明,而非對該發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。
[0027]需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結(jié)合實施例來詳細(xì)說明本申請。
[0028]圖1示出了可以應(yīng)用本申請的通勤訂單識別方法及裝置的實施例的示例性系統(tǒng)架構(gòu) 100
[0029]如圖1所示,系統(tǒng)架構(gòu)100可以包括終端設(shè)備101、102、103,網(wǎng)絡(luò)104和服務(wù)器105。網(wǎng)絡(luò)104用以在終端設(shè)備101、102、103和服務(wù)器105之間提供通信鏈路的介質(zhì)。網(wǎng)絡(luò)104可以包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。
[0030]用戶可以使用終端設(shè)備101、102、103通過網(wǎng)絡(luò)104與服務(wù)器105交互,以接收或發(fā)送消息等。終端設(shè)備101、102、103上可以安裝有各種客戶端應(yīng)用,例如網(wǎng)頁瀏覽器應(yīng)用、地圖類應(yīng)用,位置服務(wù)類應(yīng)用、叫車服務(wù)類應(yīng)用等。
[0031]終端設(shè)備101、102、103可以是具有顯示屏并且支持網(wǎng)頁瀏覽的各種電子設(shè)備,包括但不限于智能手機、平板電腦、電子書閱讀器、MP3播放器(Moving Picture ExpertsGroup Aud1 Layer 111,動態(tài)影像專家壓縮標(biāo)準(zhǔn)音頻層面3)、MP4 (Moving PictureExperts Group Aud1 Layer IV,動態(tài)影像專家壓縮標(biāo)準(zhǔn)音頻層面4)播放器、膝上型便攜計算機和臺式計算機等等。
[0032]服務(wù)器105可以是提供各種服務(wù)的服務(wù)器,例如對終端設(shè)備101、102、103上識別的通勤訂單提供后臺支持的通勤訂單識別裝置。通勤訂單識別裝置可以對獲取到的用戶的軌跡數(shù)據(jù)進(jìn)行聚類、分析等處理,并將處理結(jié)果(例如通勤訂單識別結(jié)果信息)反饋給終端設(shè)備。
[0033]需要說明的是,本申請實施例所提供的通勤訂單識別方法一般由服務(wù)器105執(zhí)行。
[0034]應(yīng)該理解,圖1中的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器的數(shù)目僅僅是示意性的。根據(jù)實現(xiàn)需要,可以具有任意數(shù)目的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器。
[0035]繼續(xù)參考圖2,示出了根據(jù)本申請的通勤訂單識別方法的一個實施例的流程200。所述的通勤訂單識別方法,包括以下步驟:
[0036]步驟201,獲取用戶的軌跡數(shù)據(jù)。
[0037]在本實施例中,通勤訂單識別方法運行于其上的電子設(shè)備(例如圖1所示的服務(wù)器)可以通過有線連接方式或無線連接方式從用戶利用其進(jìn)行互聯(lián)網(wǎng)叫車的終端設(shè)備(客戶端)獲取到用戶的軌跡數(shù)據(jù)。上述電子設(shè)備可以向終端設(shè)備發(fā)出軌跡數(shù)據(jù)請求,并接收終端設(shè)備響應(yīng)于軌跡數(shù)據(jù)請求而發(fā)送的軌跡數(shù)據(jù)。終端設(shè)備也可以以一定的周期向上述電子設(shè)備上報軌跡數(shù)據(jù)。
[0038]在本實施例中,軌跡數(shù)據(jù)可以包括多個軌跡點的位置信息,其中,軌跡點可以是終端設(shè)備停留的地理位置點。在一些實施例中,軌跡點可以是停留時間超過一個閾值(例如30分鐘)的地理位置點??蛇x地,軌跡數(shù)據(jù)還可以包括時間連續(xù)的運動軌跡。
[0039]通常,用戶在使用終端設(shè)備的定位功能或打開位置服務(wù)應(yīng)用時,終端設(shè)備可以記錄用戶當(dāng)前的位置信息,并保存位置信息。終端設(shè)備可以將保存多個軌跡點的位置信息發(fā)送至服務(wù)器,還可以將軌跡點對應(yīng)的終端設(shè)備標(biāo)識和用戶標(biāo)識上報服務(wù)器。這樣,服務(wù)器可以將軌跡數(shù)據(jù)與用戶標(biāo)識或終端設(shè)備標(biāo)識對應(yīng)。
[0040]需要指出的是,上述無線連接方式可以包括但不限于3G/4G連接、WiFi連接、藍(lán)牙連接、WiMAX連接、Zigbee連接、UWB(ultra wideband)連接、以及其他現(xiàn)在已知或?qū)黹_發(fā)的無線連接方式。
[0041]步驟202,針對各個軌跡點的位置信息利用聚類算法對軌跡點進(jìn)行聚類,生成軌跡點的簇集合。
[0042]在本實施例中,上述電子設(shè)備獲取到軌跡點的位置信息之后,可以利用聚類算法對上述位置信息進(jìn)行聚類,從而生成軌跡點的簇集合。
[0043]在本實施例的一些可選的實現(xiàn)方式中,上述聚類算法可以是基于密度的聚類算法DBSCAN(Density-Based Spatial Clustering of Applicat1n with Noise)。上述基于密度的聚類算法DBSCAN可以將簇定義為密度相連的點的最大集合,它能夠把具有足夠高密度的區(qū)域劃分為簇,并可在噪聲的空間數(shù)據(jù)庫中發(fā)現(xiàn)任意形狀的聚類。
[0044]步驟203,將所述軌跡點的簇集合導(dǎo)入預(yù)先訓(xùn)練的通勤位置識別模型進(jìn)行識別,得到第一位置信息和第二位置信息。
[0045]在本實施例中,上述電子設(shè)備可以將步驟202中生成的軌跡點的簇集合導(dǎo)入預(yù)先訓(xùn)練的通勤位置識別模型以得到用戶的第一位置信息(如家庭住址信息)和第二位置信息(如公司地址信息)。
[0046]在本實施例的一些可選的實現(xiàn)方式中,上述方法還可以包括建立通勤位置識別模型的步驟,可以包括:首先,獲取在預(yù)定應(yīng)用程序中提交了第一位置信息(如家庭住址信息)和第二位置信息(如公司地址信息)的用戶,例如,上述電子設(shè)備可以在上述用戶的購物類應(yīng)用程序中獲取到用戶的收貨地址,上述電子設(shè)備也可以在外賣類應(yīng)用程序中獲取到用戶的收貨地址,其中,上述收貨地址可能是用戶的家庭住址,也可能是用戶的公司地址,通過對上述收貨地址進(jìn)行頻率分析得到用戶的常用地址(如將用戶選擇的次數(shù)占總次數(shù)40%以上的收貨地址設(shè)置為該用戶的常用地址),再通過對上述常用地址的屬性分析得到該用戶的家庭住址或公司地址(如將該常用地址為XX大廈、XX商場的地址設(shè)置為公司地址);上述電子設(shè)備還可以在地圖類應(yīng)用程序或打車類應(yīng)用程序中獲取到用戶注冊時填寫的家庭住址信息和公司地址信息,在獲取到這些已知家庭住址信息和公司地址信息的用戶之后,上述電子設(shè)備獲取上述用戶的軌跡數(shù)據(jù),其中,軌跡數(shù)據(jù)可以包括多個軌跡點的位置信息。然后,上述電子設(shè)備可以利用基于密度的聚類算法DBSCAN對上述位置信息進(jìn)行聚類,從而生成軌跡點的簇集合,上述電子設(shè)備可以將包含用戶家庭住址的簇標(biāo)記為home簇,也可以將包含用戶公司地址的簇標(biāo)記為company簇,還可以將剩余的簇標(biāo)記為useless簇。最后,利用機器學(xué)習(xí)方法,基于得到的軌跡點的簇集合和在預(yù)定時間段內(nèi)上述用戶的軌跡點落入上述軌跡點的簇集合中的相關(guān)信息,訓(xùn)練得到通勤位置識別模型,其中,相關(guān)信息包括但不限于:上述用戶在軌跡點的簇集合中出現(xiàn)的天數(shù)的比例(例如,在過去10天內(nèi),上述用戶在home簇中出現(xiàn)4天,在company簇中出現(xiàn)6天,貝Ij出現(xiàn)的天數(shù)的比例為4/6)、上述用戶在軌跡點的簇集合中的白天和夜間出現(xiàn)的比例(例如,在過去1天內(nèi),上述用戶在home簇中白天出現(xiàn)5次,夜間出現(xiàn)9次,則在home簇中白天和夜間出現(xiàn)的比例為5/9)、通過上述用戶在軌跡點的簇集合中連接的各個無線網(wǎng)的概率(例如,在過去1天內(nèi),上述用戶在company簇中3次連接到第一無線網(wǎng),2次連接到第二無線網(wǎng),則連接到第一無線網(wǎng)的概率為3/5,連接到第二無線網(wǎng)的概率為2/5)而計算出的無線網(wǎng)的熵、上述用戶在軌跡點的簇集合中的不同的時間段出現(xiàn)的比例(例如,將一天的時間分為三個時間段:6:00-14:00,14:00-20:00,20:00-次日6:00,在過去10天內(nèi),上述用戶在home簇中出現(xiàn)在時間段6:00-14:00的次數(shù)為7次,出現(xiàn)在時間段14:00-20:00的次數(shù)為6次,出現(xiàn)在時間段20:00-次日6:00的次數(shù)為1次,則在home簇的時間段6:00-14:00、時間段14:00-20:00、時間段20:00-次日6:00出現(xiàn)的比例為:7/6/10),基于得到的軌跡點的簇集合和上述相關(guān)信息,上述電子設(shè)備可以利用分類器訓(xùn)練得到通勤位置識別模型,其中,上述分類器可以包括但不限于:決策樹、隨機森林、迭代決策樹和支持向量機。
[0047]步驟204,根據(jù)獲取到的用戶的多個歷史訂單的位置信息、第一位置信息和第二位置信息,識別出歷史訂單中的通勤訂單。
[0048]在本實施例中,上述電子設(shè)備可以根據(jù)獲取到的上述用戶的多個歷史訂單的位置信息和步驟203中得到的第一位置信息和第二位置信息來識別歷史訂單中的通勤訂單,其中,歷史訂單的位置信息可以包括歷史訂單的軌跡起點的位置信息和軌跡終點的位置信息。
[0049]在本實施例的一些可選的實現(xiàn)方式中,上述電子設(shè)備可以首先獲取歷史訂單的軌跡起點的位置信息中的起點坐標(biāo)位置和軌跡終點的位置信息中的終點坐標(biāo)位置;然后,獲取上述起點坐標(biāo)位置與上述第一位置信息中的第一坐標(biāo)位置之間的距離,再獲取上述終點坐標(biāo)位置和上述第二位置信息中的第二坐標(biāo)位置之間的距離;最后,將上述距離均小于預(yù)設(shè)閾值(例如,300米)的訂單標(biāo)識為通勤訂單。
[0050]本申請的上述實施例提供的方法通過根據(jù)已知家庭住址和公司地址的用戶的軌跡點的簇集合和相關(guān)信息訓(xùn)練得到通勤位置識別模型,而后利用上述通勤位置識別模型識別家庭住址和公司地址未知的用戶,得到該用戶的家庭住址和公司地址,之后基于用戶的歷史訂單的位置信息和該用戶的家庭住址信息和公司地址信息識別用戶歷史訂單中的通勤訂單,實現(xiàn)了通勤訂單的準(zhǔn)確識別。
[0051]進(jìn)一步參考圖3,其示出了通勤訂單識別方法的又一個實施例的流程圖300。該通勤訂單識別方法的流程300,包括以下步驟:
[0052]步驟301,獲取用戶的軌跡數(shù)據(jù)。
[0053]在本實施例中,通勤訂單識別方法運行于其上的電子設(shè)備(例如圖1所示的服務(wù)器)可以通過有線連接方式或無線連接方式從用戶利用其進(jìn)行互聯(lián)網(wǎng)叫車的終端設(shè)備(客戶端)獲取到用戶的軌跡數(shù)據(jù)。
[0054]在本實施例中,軌跡數(shù)據(jù)可以包括多個軌跡點的位置信息,其中,軌跡點可以是終端設(shè)備停留的地理位置點。在一些實施例中,軌跡點可以是停留時間超過一個閾值(例如30分鐘)的地理位置點??蛇x地,軌跡數(shù)據(jù)還可以包括時間連續(xù)的運動軌跡。
[0055]步驟302,針對各個軌跡點的位置信息利用聚類算法對軌跡點進(jìn)行聚類,生成軌跡點的簇集合。
[0056]在本實施例中,上述電子設(shè)備獲取到步驟301中的軌跡點的位置信息之后,可以利用聚類算法對上述位置信息進(jìn)行聚類,從而生成軌跡點的簇集合。
[0057]步驟303,將軌跡點的簇集合導(dǎo)入預(yù)先訓(xùn)練的通勤位置識別模型進(jìn)行識別,得到第一位置信息和第二位置信息。
[0058]在本實施例中,上述電子設(shè)備將步驟302中生成的軌跡點的簇集合導(dǎo)入預(yù)先訓(xùn)練的通勤位置識別模型以得到用戶的第一位置信息(家庭住址信息)和第二位置信息(公司地址信息)。
[0059]步驟304,根據(jù)獲取到的用戶的多個歷史訂單的位置信息、第一位置信息和第二位置信息,識別出歷史訂單中的通勤訂單。
[0060]在本實施例中,上述電子設(shè)備可以根據(jù)獲取到的上述用戶的多個歷史訂單的位置信息和步驟303中得到的第一位置信息和第二位置信息來識別歷史訂單中的通勤訂單,其中,歷史訂單的位置信息可以包括歷史訂單的軌跡起點的位置信息和軌跡終點的位置信息。
[0061]步驟305,基于通勤訂單的數(shù)量或比例,識別通勤用戶。
[0062]在本實施例中,上述電子設(shè)備可以首先獲取到用戶在歷史時間段內(nèi)的所有訂單的數(shù)量,并統(tǒng)計上述所有訂單中所述用戶的通勤訂單的數(shù)量;然后,上述電子設(shè)備可以計算上述通勤訂單的數(shù)量占所有訂單的數(shù)量的比例;最后,可以將通勤訂單的數(shù)量超過預(yù)設(shè)閾值(例如5)或上述通勤訂單的數(shù)量占所有訂單的數(shù)量的比例超過預(yù)設(shè)閾值(例如50%)的用戶識別為通勤用戶。
[0063]作為示例,上述電子設(shè)備獲取到用戶在過去一個月內(nèi)的叫車訂單為24個,統(tǒng)計上述24個叫車訂單中標(biāo)識為通勤訂單的數(shù)量為18個;上述通勤訂單的數(shù)量18占所有訂單的數(shù)量24的比例為75%;上述通勤訂單的數(shù)量18大于預(yù)設(shè)閾值5,并且上述通勤訂單的數(shù)量18占所有訂單的數(shù)量24的比例75%大于預(yù)設(shè)閾值50%,則可以將上述用戶標(biāo)識為通勤用戶。
[0064]步驟306,識別通勤用戶的通勤時間。
[0065]在本實施例中,基于步驟305中得到的通勤用戶,上述電子設(shè)備可以標(biāo)識上述通勤用戶的通勤時間。可以包括:首先,采集上述通勤用戶在歷史時間段(過去10天)內(nèi)發(fā)生的通勤訂單的時間信息,其中,時間信息可以是上述通勤用戶的通勤訂單執(zhí)行的開始時間(例如,在基于互聯(lián)網(wǎng)的叫車服務(wù)訂單中,用戶從軌跡起點出發(fā)的時間),也可以是上述通勤用戶的通勤訂單執(zhí)行的結(jié)束時間(例如,在基于互聯(lián)網(wǎng)的叫車服務(wù)訂單中,用戶到達(dá)軌跡終點的時間),還可以是從通勤訂單執(zhí)行的開始時間到通勤訂單執(zhí)行的結(jié)束時間之間的時間段;然后,將采集到的多個時間信息在預(yù)先將一天的時間劃分成的不同的時間段中出現(xiàn)的次數(shù)添加到上述時間段所對應(yīng)的訂單數(shù)量列表中;最后,上述電子設(shè)備將上述訂單數(shù)量列表中的訂單數(shù)量大于預(yù)設(shè)閾值(例如5)并且上述訂單數(shù)量與上述訂單數(shù)量列表中的訂單總數(shù)量的比值大于預(yù)設(shè)閾值(例如25%)的訂單數(shù)量所對應(yīng)的時間段標(biāo)識為上述通勤用戶的通勤時間。
[0066]作為示例,上述電子設(shè)備將采集到的通勤用戶在過去一個月內(nèi)訂單執(zhí)行的開始時間在將一天按一小時進(jìn)行劃分得到的時間段中出現(xiàn)的次數(shù)添加到上述時間段所對應(yīng)的訂單數(shù)量列表中后,得到的訂單數(shù)量列表為(0,0,0,0,0,0,0,0,8,3,1,0,0,0,1,0,2,2,6,1,
0,0,0,0);將各個訂單數(shù)量與預(yù)設(shè)閾值5進(jìn)行比對,得到8:00-9:00和18:00-19:00時間段所對應(yīng)的訂單數(shù)量大于預(yù)設(shè)閾值5;再將上述訂單數(shù)量與上述訂單數(shù)量列表中的訂單總數(shù)量的比值與預(yù)設(shè)閾值25%進(jìn)行比對,得到8:00-9:00時間段所對應(yīng)的訂單數(shù)量8與上述訂單數(shù)量列表中的訂單總數(shù)量24的比值33.33%大于預(yù)設(shè)閾值25%,則8:00-9:00時間段為上述通勤用戶的通勤時間所在的時間區(qū)間。
[0067]從圖3中可以看出,與圖2對應(yīng)的實施例相比,本實施例中的通勤訂單識別方法的流程300突出了通勤用戶識別和通勤時間識別的步驟。由此,本實施例描述的方案可以基于通勤訂單識別該通勤訂單對應(yīng)的用戶是否為通勤用戶,以及確定通勤用戶的通勤時間,從而可以更加有針對性的分析用戶行為。
[0068]進(jìn)一步參考圖4,作為對上述各圖所示方法的實現(xiàn),本申請?zhí)峁┝艘环N通勤訂單識別裝置的一個實施例,該裝置實施例與圖2所示的方法實施例相對應(yīng),該裝置具體可以應(yīng)用于各種電子設(shè)備中。
[0069]如圖4所示,本實施例所述的通勤訂單識別裝置400包括:軌跡數(shù)據(jù)獲取單元401、簇集合生成單元402、第一位置信息和第二位置信息獲取單元403和通勤訂單識別單元404。其中,軌跡數(shù)據(jù)獲取單元401用于獲取用戶的軌跡數(shù)據(jù),其中,所述軌跡數(shù)據(jù)包括多個軌跡點的位置信息;簇集合生成單元402用于針對各個軌跡點的位置信息利用聚類算法對軌跡點進(jìn)行聚類,生成軌跡點的簇集合;第一位置信息和第二位置信息獲取單元403用于將所述軌跡點的簇集合導(dǎo)入預(yù)先訓(xùn)練的通勤位置識別模型進(jìn)行識別,得到第一位置信息和第二位置信息;通勤訂單識別單元404用于根據(jù)獲取到的所述用戶的多個歷史訂單的位置信息、所述第一位置信息和所述第二位置信息,識別出所述歷史訂單中的通勤訂單。
[0070]在本實施例中,通勤訂單識別裝置400的軌跡數(shù)據(jù)獲取單元401可以通過有線連接方式或無線連接方式從用戶利用其進(jìn)行互聯(lián)網(wǎng)叫車的終端設(shè)備(客戶端)獲取到用戶的軌跡數(shù)據(jù)。軌跡數(shù)據(jù)可以包括多個軌跡點的位置信息,其中,軌跡點可以是終端設(shè)備停留的地理位置點。在一些實施例中,軌跡點可以是停留時間超過一個閾值(例如30分鐘)的地理位置點??蛇x地,軌跡數(shù)據(jù)還可以包括時間連續(xù)的運動軌跡。
[0071]在本實施例中,基于軌跡數(shù)據(jù)獲取單元401獲取到的軌跡點的位置信息之后,上述簇集合生成單元402可以利用聚類算法對上述位置信息進(jìn)行聚類,從而生成軌跡點的簇集入口 ο
[0072]在本實施例中,上述第一位置信息和第二位置信息獲取單元403在得到簇集合生成單元402的軌跡點的簇集合后,可以將其導(dǎo)入預(yù)先訓(xùn)練的通勤位置識別模型以得到用戶的第一位置信息(如家庭住址信息)和第二位置信息(如公司地址信息)。
[0073]在本實施例中,上述通勤訂單識別單元404可以根據(jù)獲取到的上述用戶的多個歷史訂單的位置信息和上述第一位置信息和第二位置信息獲取單元403中得到的第一位置信息和第二位置信息來識別歷史訂單中的通勤訂單,其中,歷史訂單的位置信息可以包括歷史訂單的軌跡起點的位置信息和軌跡終點的位置信息。
[0074]在本實施例的一些可選的實現(xiàn)方式中,本實施例的通勤訂單識別裝置還可以包括:通勤位置識別模型建立單元(圖中未示出),用于建立通勤位置識別模型。通勤位置識別模型建立單元可以包括:軌跡數(shù)據(jù)獲取子單元(圖中未示出)、簇集合生成子單元(圖中未示出)和通勤位置識別模型建立子單元(圖中未示出)。其中,軌跡數(shù)據(jù)獲取子單元用于獲取在預(yù)定應(yīng)用程序中提交了第一位置信息和第二位置信息的用戶,并獲取所述用戶的軌跡數(shù)據(jù),其中,所述軌跡數(shù)據(jù)包括多個軌跡點的位置信息;簇集合生成子單元用于針對各個軌跡點的位置信息利用聚類算法對軌跡點進(jìn)行聚類,生成軌跡點的簇集合;通勤位置識別模型建立子單元用于基于所述軌跡點的簇集合和在預(yù)定時間段內(nèi)所述用戶的軌跡點落入所述軌跡點的簇集合中的相關(guān)信息,訓(xùn)練得到通勤位置識別模型。
[0075]在本實施例的一些可選的實現(xiàn)方式中,本實施例的通勤位置識別模型建立子單元進(jìn)一步配置用于:利用分類器訓(xùn)練得到通勤位置識別模型,其中,所述分類器包括:決策樹、隨機森林、迭代決策樹和支持向量機。
[0076]在本實施例的一些可選的實現(xiàn)方式中,本實施例的通勤訂單識別裝置還可以包括:通勤用戶識別單元(圖中未示出),用于基于通勤訂單的數(shù)量或比例,識別通勤用戶。通勤用戶識別單元可以包括:通勤訂單數(shù)量統(tǒng)計子單元(圖中未示出)、比例確定子單元(圖中未示出)和通勤用戶識別子單元(圖中未示出)。其中,通勤訂單數(shù)量統(tǒng)計子單元用于獲取所述用戶在歷史時間段內(nèi)所有訂單的數(shù)量,并統(tǒng)計所述所有訂單中所述用戶的通勤訂單的數(shù)量;比例確定子單元用于確定所述通勤訂單的數(shù)量占所有訂單的數(shù)量的比例;通勤用戶識別子單元用于將所述通勤訂單的數(shù)量大于預(yù)設(shè)閾值或所述比例大于預(yù)設(shè)閾值的用戶識別為通勤用戶。
[0077]在本實施例的一些可選的實現(xiàn)方式中,本實施例的通勤訂單識別裝置還可以包括:通勤時間識別單元(圖中未示出),用于識別所述通勤用戶的通勤時間。通勤時間識別單元可以包括:時間信息采集子單元(圖中未示出)、添加子單元(圖中未示出)和通勤時間標(biāo)識子單元(圖中未示出)。其中,時間信息采集子單元用于采集所述通勤用戶在歷史時間段內(nèi)發(fā)生的通勤訂單的時間信息;添加子單元用于將所述歷史時間段內(nèi)的所述時間信息在一天中對應(yīng)的不同的時間段內(nèi)出現(xiàn)的次數(shù)添加到所述時間段對應(yīng)的訂單數(shù)量列表中;通勤時間標(biāo)識子單元用于將所述訂單數(shù)量列表中的訂單數(shù)量大于預(yù)設(shè)閾值并且所述訂單數(shù)量與所述訂單數(shù)量列表中的訂單總數(shù)量的比值大于預(yù)設(shè)閾值的訂單數(shù)量所對應(yīng)的時間段標(biāo)識為所述用戶的通勤時間。
[0078]在本實施例的一些可選的實現(xiàn)方式中,本實施例的通勤訂單識別單元包括:第一獲取子單元(圖中未示出)、第二獲取子單元(圖中未示出)和通勤訂單識別子單元(圖中未示出)。其中,第一獲取子單元用于獲取所述歷史訂單的位置信息中的軌跡起點坐標(biāo)位置與所述第一位置信息中的第一坐標(biāo)位置之間的距離;第二獲取子單元用于獲取所述歷史訂單的位置信息中的軌跡終點坐標(biāo)位置與所述第二位置信息中的第二坐標(biāo)位置之間的距離;通勤訂單識別子單元用于識別所述距離小于預(yù)設(shè)閾值的訂單為通勤訂單。
[0079]在本實施例的一些可選的實現(xiàn)方式中,本實施例的聚類算法包括:基于密度的聚類算法。
[0080]下面參考圖5,其示出了適于用來實現(xiàn)本申請實施例的裝置的計算機系統(tǒng)500的結(jié)構(gòu)示意圖。
[0081 ]如圖5所示,計算機系統(tǒng)500包括中央處理單元(CPU)501,其可以根據(jù)存儲在只讀存儲器(R0M)502中的程序或者從存儲部分508加載到隨機訪問存儲器(RAM)503中的程序而執(zhí)行各種適當(dāng)?shù)膭幼骱吞幚?。在RAM503中,還存儲有系統(tǒng)500操作所需的各種程序和數(shù)據(jù)。CPU50UR0M502以及RAM503通過總線504彼此相連。輸入/輸出(I/O)接口 505也連接至總線504。
[0082]以下部件連接至I/O接口505:包括鍵盤、鼠標(biāo)等的輸入部分506 ;包括諸如陰極射線管(CRT)、液晶顯示器(LCD)等以及揚聲器等的輸出部分507;包括硬盤等的存儲部分508;以及包括諸如LAN卡、調(diào)制解調(diào)器等的網(wǎng)絡(luò)接口卡的通信部分509。通信部分509經(jīng)由諸如因特網(wǎng)的網(wǎng)絡(luò)執(zhí)行通信處理。驅(qū)動器510也根據(jù)需要連接至I/O接口 505??刹鹦督橘|(zhì)511,諸如磁盤、光盤、磁光盤、半導(dǎo)體存儲器等等,根據(jù)需要安裝在驅(qū)動器510上,以便于從其上讀出的計算機程序根據(jù)需要被安裝入存儲部分508。
[0083]特別地,根據(jù)本公開的實施例,上文參考流程圖描述的過程可以被實現(xiàn)為計算機軟件程序。例如,本公開的實施例包括一種計算機程序產(chǎn)品,其包括有形地包含在機器可讀介質(zhì)上的計算機程序,上述計算機程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實施例中,該計算機程序可以通過通信部分509從網(wǎng)絡(luò)上被下載和安裝,和/或從可拆卸介質(zhì)511被安裝。
[0084]附圖中的流程圖和框圖,圖示了按照本申請各種實施例的系統(tǒng)、方法和計算機程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,上述模塊、程序段、或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機指令的組合來實現(xiàn)。
[0085]描述于本申請實施例中所涉及到的單元可以通過軟件的方式實現(xiàn),也可以通過硬件的方式來實現(xiàn)。所描述的單元也可以設(shè)置在處理器中,例如,可以描述為:一種處理器包括軌跡數(shù)據(jù)獲取單元、簇集合生成單元、第一位置信息和第二位置信息獲取單元和通勤訂單識別單元。其中,這些單元的名稱在某種情況下并不構(gòu)成對該單元本身的限定。例如,簇集合生成單元還可以被描述為“軌跡點的簇集合生成單元”。
[0086]作為另一方面,本申請還提供了一種非易失性計算機存儲介質(zhì),該非易失性計算機存儲介質(zhì)可以是上述實施例中上述裝置中所包含的非易失性計算機存儲介質(zhì);也可以是單獨存在,未裝配入終端中的非易失性計算機存儲介質(zhì)。上述非易失性計算機存儲介質(zhì)存儲有一個或者多個程序,當(dāng)上述一個或者多個程序被一個設(shè)備執(zhí)行時,使得上述設(shè)備:獲取用戶的軌跡數(shù)據(jù),其中,所述軌跡數(shù)據(jù)包括多個軌跡點的位置信息;針對各個軌跡點的位置信息利用聚類算法對軌跡點進(jìn)行聚類,生成軌跡點的簇集合;將所述軌跡點的簇集合導(dǎo)入預(yù)先訓(xùn)練的通勤位置識別模型進(jìn)行識別,得到第一位置信息和第二位置信息;根據(jù)獲取到的所述用戶的多個歷史訂單的位置信息、所述第一位置信息和所述第二位置信息,識別出所述歷史訂單中的通勤訂單。
[0087]以上描述僅為本申請的較佳實施例以及對所運用技術(shù)原理的說明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本申請中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案,同時也應(yīng)涵蓋在不脫離所述發(fā)明構(gòu)思的情況下,由上述技術(shù)特征或其等同特征進(jìn)行任意組合而形成的其它技術(shù)方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術(shù)特征進(jìn)行互相替換而形成的技術(shù)方案。
【主權(quán)項】
1.一種通勤訂單識別方法,其特征在于,所述方法包括: 獲取用戶的軌跡數(shù)據(jù),其中,所述軌跡數(shù)據(jù)包括多個軌跡點的位置信息; 針對各個軌跡點的位置信息利用聚類算法對軌跡點進(jìn)行聚類,生成軌跡點的簇集合;將所述軌跡點的簇集合導(dǎo)入預(yù)先訓(xùn)練的通勤位置識別模型進(jìn)行識別,得到第一位置信息和第二位置信息; 根據(jù)獲取到的所述用戶的多個歷史訂單的位置信息、所述第一位置信息和所述第二位置信息,識別出所述歷史訂單中的通勤訂單。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 建立通勤位置識別模型的步驟,包括: 獲取在預(yù)定應(yīng)用程序中提交了第一位置信息和第二位置信息的用戶,并獲取所述用戶的軌跡數(shù)據(jù),其中,所述軌跡數(shù)據(jù)包括多個軌跡點的位置信息; 針對各個軌跡點的位置信息利用聚類算法對軌跡點進(jìn)行聚類,生成軌跡點的簇集合;基于所述軌跡點的簇集合和在預(yù)定時間段內(nèi)所述用戶的軌跡點落入所述軌跡點的簇集合中的相關(guān)信息,訓(xùn)練得到通勤位置識別模型。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述訓(xùn)練得到通勤位置識別模型包括: 利用分類器訓(xùn)練得到通勤位置識別模型,其中,所述分類器包括:決策樹、隨機森林、迭代決策樹和支持向量機。4.根據(jù)權(quán)利要求1-3之一所述的方法,其特征在于,所述方法還包括: 基于通勤訂單的數(shù)量或比例,識別通勤用戶,包括: 獲取所述用戶在歷史時間段內(nèi)所有訂單的數(shù)量,并統(tǒng)計所述所有訂單中所述用戶的通勤訂單的數(shù)量; 確定所述通勤訂單的數(shù)量占所有訂單的數(shù)量的比例; 將所述通勤訂單的數(shù)量大于預(yù)設(shè)閾值或所述比例大于預(yù)設(shè)閾值的用戶識別為通勤用戶。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,在所述將所述通勤訂單的數(shù)量大于預(yù)設(shè)閾值或所述比例大于預(yù)設(shè)閾值的用戶識別為通勤用戶之后,所述方法還包括: 識別所述通勤用戶的通勤時間,包括: 采集所述通勤用戶在歷史時間段內(nèi)發(fā)生的通勤訂單的時間信息; 將所述歷史時間段內(nèi)的所述時間信息在一天中對應(yīng)的不同的時間段內(nèi)出現(xiàn)的次數(shù)添加到所述時間段對應(yīng)的訂單數(shù)量列表中; 將所述訂單數(shù)量列表中的訂單數(shù)量大于預(yù)設(shè)閾值并且所述訂單數(shù)量與所述訂單數(shù)量列表中的訂單總數(shù)量的比值大于預(yù)設(shè)閾值的訂單數(shù)量所對應(yīng)的時間段標(biāo)識為所述用戶的通勤時間。6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)獲取到的所述用戶的多個歷史訂單的位置信息、所述第一位置信息和所述第二位置信息,識別出所述歷史訂單中的通勤訂單,包括: 獲取所述歷史訂單的位置信息中的軌跡起點坐標(biāo)位置與所述第一位置信息中的第一坐標(biāo)位置之間的距離; 獲取所述歷史訂單的位置信息中的軌跡終點坐標(biāo)位置與所述第二位置信息中的第二坐標(biāo)位置之間的距離; 識別所述距離小于預(yù)設(shè)閾值的訂單為通勤訂單。7.根據(jù)權(quán)利要求1-2之一所述的方法,其特征在于,所述聚類算法包括:基于密度的聚類算法。8.一種通勤訂單識別裝置,其特征在于,所述裝置包括: 軌跡數(shù)據(jù)獲取單元,配置用于獲取用戶的軌跡數(shù)據(jù),其中,所述軌跡數(shù)據(jù)包括多個軌跡點的位置信息; 簇集合生成單元,配置用于針對各個軌跡點的位置信息利用聚類算法對軌跡點進(jìn)行聚類,生成軌跡點的簇集合; 第一位置信息和第二位置信息獲取單元,配置用于將所述軌跡點的簇集合導(dǎo)入預(yù)先訓(xùn)練的通勤位置識別模型進(jìn)行識別,得到第一位置信息和第二位置信息; 通勤訂單識別單元,配置用于根據(jù)獲取到的所述用戶的多個歷史訂單的位置信息、所述第一位置信息和所述第二位置信息,識別出所述歷史訂單中的通勤訂單。9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括: 通勤位置識別模型建立單元,配置用于建立通勤位置識別模型,包括: 軌跡數(shù)據(jù)獲取子單元,配置用于獲取在預(yù)定應(yīng)用程序中提交了第一位置信息和第二位置信息的用戶,并獲取所述用戶的軌跡數(shù)據(jù),其中,所述軌跡數(shù)據(jù)包括多個軌跡點的位置信息; 簇集合生成子單元,配置用于針對各個軌跡點的位置信息利用聚類算法對軌跡點進(jìn)行聚類,生成軌跡點的簇集合; 通勤位置識別模型建立子單元,配置用于基于所述軌跡點的簇集合和在預(yù)定時間段內(nèi)所述用戶的軌跡點落入所述軌跡點的簇集合中的相關(guān)信息,訓(xùn)練得到通勤位置識別模型。10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述通勤位置識別模型建立子單元進(jìn)一步配置用于: 利用分類器訓(xùn)練得到通勤位置識別模型,其中,所述分類器包括:決策樹、隨機森林、迭代決策樹和支持向量機。11.根據(jù)權(quán)利要求8-10之一所述的裝置,其特征在于,所述裝置還包括: 通勤用戶識別單元,配置用于基于通勤訂單的數(shù)量或比例,識別通勤用戶,包括: 通勤訂單數(shù)量統(tǒng)計子單元,配置用于獲取所述用戶在歷史時間段內(nèi)所有訂單的數(shù)量,并統(tǒng)計所述所有訂單中所述用戶的通勤訂單的數(shù)量; 比例確定子單元,配置用于確定所述通勤訂單的數(shù)量占所有訂單的數(shù)量的比例; 通勤用戶識別子單元,配置用于將所述通勤訂單的數(shù)量大于預(yù)設(shè)閾值或所述比例大于預(yù)設(shè)閾值的用戶識別為通勤用戶。12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述裝置還包括: 通勤時間識別單元,配置用于識別所述通勤用戶的通勤時間,包括: 時間信息采集子單元,配置用于采集所述通勤用戶在歷史時間段內(nèi)發(fā)生的通勤訂單的時間信息; 添加子單元,配置用于將所述歷史時間段內(nèi)的所述時間信息在一天中對應(yīng)的不同的時間段內(nèi)出現(xiàn)的次數(shù)添加到所述時間段對應(yīng)的訂單數(shù)量列表中; 通勤時間標(biāo)識子單元,配置用于將所述訂單數(shù)量列表中的訂單數(shù)量大于預(yù)設(shè)閾值并且所述訂單數(shù)量與所述訂單數(shù)量列表中的訂單總數(shù)量的比值大于預(yù)設(shè)閾值的訂單數(shù)量所對應(yīng)的時間段標(biāo)識為所述用戶的通勤時間。13.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述通勤訂單識別單元包括: 第一獲取子單元,配置用于獲取所述歷史訂單的位置信息中的軌跡起點坐標(biāo)位置與所述第一位置信息中的第一坐標(biāo)位置之間的距離; 第二獲取子單元,配置用于獲取所述歷史訂單的位置信息中的軌跡終點坐標(biāo)位置與所述第二位置信息中的第二坐標(biāo)位置之間的距離; 通勤訂單識別子單元,配置用于識別所述距離小于預(yù)設(shè)閾值的訂單為通勤訂單。14.根據(jù)權(quán)利要求8-9之一所述的裝置,其特征在于,所述聚類算法包括:基于密度的聚類算法。
【文檔編號】G06Q30/06GK105894358SQ201610197051
【公開日】2016年8月24日
【申請日】2016年3月31日
【發(fā)明人】王超
【申請人】百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1