亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種時空規(guī)律的地鐵乘客聚類和邊緣檢測方法

文檔序號:6526852閱讀:258來源:國知局
一種時空規(guī)律的地鐵乘客聚類和邊緣檢測方法
【專利摘要】本發(fā)明屬于信息數(shù)據(jù)處理【技術領域】,提供了一種時空規(guī)律的地鐵乘客聚類和邊緣檢測方法,包括如下步驟:S1、從包含乘客所有乘車記錄的源數(shù)據(jù)中獲取時空規(guī)律的地鐵乘客的時空規(guī)律詳細信息;S2、根據(jù)所述獲取的時空規(guī)律詳細信息,對時空規(guī)律的地鐵乘客進行聚類;S3、對聚類后的時空規(guī)律的地鐵乘客進行邊緣檢測及邊緣特征分析。本發(fā)明基于時空數(shù)據(jù)挖掘?qū)Φ罔F乘客分類,按照時空規(guī)律乘客的規(guī)律時段數(shù)量將時空規(guī)律乘客做聚類,并對每一類時空規(guī)律乘客作分析和邊緣檢測,可以有效了解乘客的生活特征。
【專利說明】一種時空規(guī)律的地鐵乘客聚類和邊緣檢測方法
【技術領域】
[0001]本發(fā)明屬于信息數(shù)據(jù)處理【技術領域】,具體涉及一種時空規(guī)律的地鐵乘客聚類和邊緣檢測方法。
【背景技術】
[0002]相比傳統(tǒng)的公共交通付費方式,如現(xiàn)金支付、年卡、月卡,智能卡具有方便性、便捷性、成本低等優(yōu)點;相比傳統(tǒng)的公共交通數(shù)據(jù)采集、決策服務能力、生活服務能力等方面,智能卡具有數(shù)據(jù)完整性、一致性、數(shù)據(jù)采集成本低、分析結(jié)果精準性、可靠等優(yōu)點。
[0003]綜上,智能卡的使用已經(jīng)帶來了非常明顯的方便和好處,智能卡在現(xiàn)代公共交通方面已成為不可或缺的工具,得到了快速普及和廣泛的應用。在大數(shù)據(jù)時代,以交通智能卡消費數(shù)據(jù)為核心,挖掘市民生活特征及規(guī)律已成為智慧城市等領域研究的重要方向之一,目前對智能卡消費數(shù)據(jù)的分析主要集中在三個方面:1、基礎數(shù)據(jù)分析;2、乘客行為分析、乘客需求預測、個人出行模式分析;3、結(jié)合一、二兩方面做交通長期規(guī)劃,策略調(diào)整,提高交通質(zhì)量、生活服務能力和數(shù)據(jù)決策服務能力。
[0004]目前,基于乘客的時空規(guī)律對乘客進行分類的相關研究比較少,現(xiàn)有的相關研究主要集中于結(jié)合智能卡的類型對乘客做分析,并比較不同類型的乘客特征的差異性。而針對乘客的時空特征對乘客分類的相關研究比較少。

【發(fā)明內(nèi)容】

[0005]本發(fā)明要解決的技術問題在于提供一種時空規(guī)律的地鐵乘客聚類和邊緣檢測方法,具有高穩(wěn)定性、可靠性、安全性。
[0006]本發(fā)明的技術方案包括一種時空規(guī)律的地鐵乘客聚類和邊緣檢測方法,包括如下步驟:
[0007]S1、從包含乘客所有乘車記錄的源數(shù)據(jù)中獲取時空規(guī)律的地鐵乘客的時空規(guī)律詳細信息;
[0008]S2、根據(jù)所述獲取的時空規(guī)律詳細信息,對時空規(guī)律的地鐵乘客進行聚類;
[0009]S3、對聚類后的時空規(guī)律的地鐵乘客進行邊緣檢測及邊緣特征分析。
[0010]進一步地,所述源數(shù)據(jù)包括智能交通卡消費信息表和地鐵線路表;
[0011]所述智能交通卡消費信息表包括智能交通卡的卡號、地鐵站刷卡終端的終端號、用戶的刷卡時間、進站或出站標識;
[0012]所述地鐵線路表包括線路名稱、途經(jīng)站點、線路類型,所述線路類型包括上行和下行;
[0013]所述時空規(guī)律的地鐵乘客為出行時間和出行地點均比較規(guī)律的乘客。
[0014]進一步地,所述步驟SI具體包括:
[0015]S11、對包含乘客所有乘車記錄的源數(shù)據(jù)進行數(shù)據(jù)預處理;
[0016]S12、以智能交通卡的卡號作為唯一標識,從經(jīng)過數(shù)據(jù)預處理后的數(shù)據(jù)中讀取每張卡的乘車記錄;
[0017]S13、對乘客進行分類,將時空規(guī)律乘客的tag值設為一預定值;
[0018]S14、對于所述步驟S13中分類后的時空規(guī)律乘客,將全天分成η個時間段,計算時
空規(guī)律乘客乘車各時間段的乘車天數(shù)
【權利要求】
1.一種時空規(guī)律的地鐵乘客聚類和邊緣檢測方法,其特征在于,包括如下步驟: S1、從包含乘客所有乘車記錄的源數(shù)據(jù)中獲取時空規(guī)律的地鐵乘客的時空規(guī)律詳細信息; S2、根據(jù)所述獲取的時空規(guī)律詳細信息,對時空規(guī)律的地鐵乘客進行聚類; S3、對聚類后的時空規(guī)律的地鐵乘客進行邊緣檢測及邊緣特征分析。
2.根據(jù)權利要求1所述的方法,其特征在于,所述源數(shù)據(jù)包括智能交通卡消費信息表和地鐵線路表; 所述智能交通卡消費信息表包括智能交通卡的卡號、地鐵站刷卡終端的終端號、用戶的刷卡時間、進站或出站標識; 所述地鐵線路表包括線路名稱、途經(jīng)站點、線路類型,所述線路類型包括上行和下行; 所述時空規(guī)律的地鐵乘客為出行時間和出行地點均比較規(guī)律的乘客。
3.根據(jù)權利要求2所述的方法,其特征在于,所述步驟SI具體包括: S11、對包含乘客所有乘車記錄的源數(shù)據(jù)進行數(shù)據(jù)預處理; S12、以智能交通卡的卡號作為唯一標識,從經(jīng)過數(shù)據(jù)預處理后的數(shù)據(jù)中讀取每張卡的乘車記錄; S13、對乘客進行分類,將時空規(guī)律乘客的tag值設為一預定值; S14、對于所述步驟S13中分類后的時空規(guī)律乘客,將全天分成η個時間段,計算時空規(guī)



律乘客乘車各時間段的乘車天數(shù)
4.根據(jù)權利要求3所述的方法,其特征在于,所述步驟S2具體包括:S21、以智能交通卡的卡號作為唯一標識,從規(guī)律時空詳情列表sptmList中讀取一張卡的所有時空規(guī)律詳細信息P ; S22、判斷是否有任何簇建立,若沒有,則建立新簇C,并將對象P加入簇C,將對象P標識為已處理,簇C的中心值為對象P的峰值數(shù)量size ;若已經(jīng)有簇建立,則執(zhí)行步驟S23 ;S23、計算對象P與每個簇中心的距離;若存在某個簇Ci的中心與對象P的峰值數(shù)量size相等,則將所述對象P歸類到簇Ci ;否則,建立新簇Cj,并將對象P加入簇Cj ;S24、重復執(zhí)行步驟S21-S23,直到所有對象都被處理并歸入了某個簇,并按照簇中智能交通卡的卡號的數(shù)量對所有簇排序。
5.根據(jù)權利要求4所述的方法,其特征在于,所述步驟S3具體包括: 531、基于簇的大小,對所有簇分類,將簇劃分為邊緣簇abnCluster和非邊緣簇nCluster,其中所述邊緣簇abnCluster為簇的數(shù)量與平均簇的數(shù)量的比值小于設定閾值的簇,非邊緣簇nCluster為簇的數(shù)量與平均簇的數(shù)量的比值大于或等于設定閾值的簇; 532、依次讀取非邊緣簇nCluster中的每一個簇Ci,建立int[i] [η]數(shù)組Si,所述η為將全天分成η個時間段; 533、依次取出簇Ci中一位乘客的規(guī)律時空詳情列表sptmList,按高峰時段的大小對規(guī)律時空詳情列表sptmList排序和編號,并將對應的數(shù)組Si元素的η值加I ; 534、重復執(zhí)行步驟S33,直到簇Ci中所有的乘客都處理完; 535、分析所述數(shù)組Si的結(jié)果分布情況; 536、若非邊緣簇nCluster中的所有簇都分析完畢,執(zhí)行步驟S37;否則重復執(zhí)行步驟S32-S36 ; 537、依次讀取邊緣簇abnCluster中的每一個簇Ci,并按照乘客的時空特征按照步驟S32-S34進行分析; S8:若邊緣簇abnCluster中的所有簇都分析完畢,則結(jié)束;否則重復執(zhí)行步驟S37。
6.根據(jù)權利要求3所述的方法,其特征在于,所述步驟Sll具體包括: SI 11、過濾缺失字段的交易記錄; 5112、將智能交通卡過濾處 理后的所有交易記錄按時間排序,并計算智能交通卡中的每一乘車記錄; 5113、計算每一智能交通卡的總刷卡天數(shù); SI 14、將步驟SI 12、SI 13中的數(shù)據(jù)結(jié)果匯總; SI 15、對每一智能交通卡執(zhí)行步驟SI I 1-Sl 14,直到全部智能交通卡均被處理; S116、對輸出結(jié)果進行統(tǒng)計,計算乘車天數(shù)概率分布。
7.根據(jù)權利要求3所述的方法,其特征在于,所述步驟S13通過如下方式對乘客進行分類: 5131、提取每一智能交通卡的交易記錄; 5132、判斷刷卡天數(shù)是否小于一預設閾值,是則輸出類別1:極少出行乘客,執(zhí)行步驟S136 ;否則執(zhí)行步驟S133 ; 5133、利用基于時間的用戶出行規(guī)律算法Tm-ODCluster,計算最密集的時間段Sm和時間密集概率Pt,并判斷是否時間規(guī)律,是則為時間規(guī)律,執(zhí)行步驟S134,否則執(zhí)行步驟S135 ; 5134、在所述時間段Sm內(nèi),利用基于空間的用戶出行規(guī)律算法Sp-ODCluster,判斷出行地點是否規(guī)律,是則輸出類別4:時間和空間規(guī)律性乘客,否則輸出類別2:單時間規(guī)律性乘客;之后執(zhí)行步驟S136 ; 5135、利用基于空間的用戶出行規(guī)律算法Sp-ODCluster,判斷全天時間內(nèi)出行地點是否規(guī)律,是則輸出類別3:單空間規(guī)律性乘客,否則輸出類別5:時間和空間均不規(guī)律乘客; 5136、判斷全部智能交通卡是否均被處理,是則結(jié)束,否則返回執(zhí)行步驟S131; 其中所述類別4:時間和空間規(guī)律性乘客為所述時空規(guī)律乘客。
8.根據(jù)權利要求7所述的方法,其特征在于,所述基于時間的用戶出行規(guī)律算法Tm-ODCluster 包括: Al、以天為周期、m分鐘為時段間隔,計算每一天所有時間段的乘車狀態(tài)(0,1);


A2、計算所述每一時間段的乘車天數(shù)
9.根據(jù)權利要求7所述的方法,其特征在于,所述基于空間的用戶出行規(guī)律算法Sp-ODCluster 包括: B1、查詢時間段T內(nèi)所有乘車記錄,將所述乘車記錄以(0,D)標記,其中,O為入口站、D為出口站,并統(tǒng)計從O進D出的乘坐天數(shù); 形成數(shù)據(jù)記錄集ODLIST (O, D, daynum, timelst),其中,Daynum為天數(shù),timelst為時間集合; B2、采用OD-cluster算法對OD進行聚類,判斷兩站點之間的相似性:若兩站點為相鄰站點,則相似性為I,否則為O; B3、取出最大的簇的總天數(shù)Dmax,計算空間密集概率Ps=Dmax/Dnum,其中,Dnum為乘客刷卡總天數(shù); 若Ps大于空間密度閾值Thrs,則為空間規(guī)律性乘客;否則,為空間不規(guī)律性乘客。
10.根據(jù)權利要求9所述的方法,其特征在于,所述OD-cluster算法包括, Cl、從所述數(shù)據(jù)記錄集ODLIST中順序提取對象P,并判斷是否有簇,是則轉(zhuǎn)到步驟C2, 否則建立簇,以所述對象P為中心、總天數(shù)為所述對象P的天數(shù)建立新簇C,將所述對象P加入所述新簇C,并將所述對象P標識為已處理; C2、計算所述對象P與每個簇中心的距離; 若某個簇Ci的中心與對象P滿足相似性標準,則將所述對象P歸類到所述簇Ci,所述簇Ci的總天數(shù)=總天數(shù)+對象P的天數(shù)-(對象P的時間集與簇Ci中時間集交集的成員數(shù)量), 否則建立以對象P為中心、總天數(shù)為對象P的天數(shù)建立新簇C,并將所述對象P加入所述新簇C ; C3、重復上述步驟,直到所有記錄都被處理并歸入某個簇Ci,并按總天數(shù)對所有簇Ci從大到小排序。
【文檔編號】G06F19/00GK103699801SQ201310750251
【公開日】2014年4月2日 申請日期:2013年12月31日 優(yōu)先權日:2013年12月31日
【發(fā)明者】趙娟娟, 張帆, 白雪, 須成忠, 鄒瑜斌, 田臣, 熊文 申請人:深圳先進技術研究院
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1