一種地鐵乘客實時分布和地鐵實時密度預(yù)測方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種地鐵乘客實時分布和地鐵實時密度預(yù)測方法及系統(tǒng),所述方法包括:S1、獲取數(shù)據(jù)源,所述數(shù)據(jù)源包括歷史數(shù)據(jù)和實時數(shù)據(jù);S2、根據(jù)歷史數(shù)據(jù)分別建立個體乘客時空出行模型、各上車站點乘客線路選擇模型、和各線路乘客在各站點下車以及換乘模型;S3、根據(jù)個體乘客時空出行模型、各上車站點乘客線路選擇模型、和各線路乘客在各站點下車以及換乘模型對實時數(shù)據(jù)進行分析,獲取地鐵乘客實時分布和所有運行地鐵乘客的實時密度。本發(fā)明通過對乘客刷卡記錄以及地鐵到站時間記錄能夠?qū)崟r分析計算乘客實時分布和預(yù)測地鐵實時密度,預(yù)測精確度較高。
【專利說明】一種地鐵乘客實時分布和地鐵實時密度預(yù)測方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及時空數(shù)據(jù)挖掘及交通【技術(shù)領(lǐng)域】,尤其涉及一種地鐵乘客實時分布和地 鐵實時密度預(yù)測方法及系統(tǒng)。
【背景技術(shù)】
[0002] 針對地鐵系統(tǒng),預(yù)測每個站點乘客的實時分布以及地鐵的實時密度具有非常重要 的意義,包括:
[0003] (1)對于地鐵公司,通過了解這些信息,可以更好地做到災(zāi)難應(yīng)急處理,乘客驅(qū)散; 更好地規(guī)劃地鐵基礎(chǔ)設(shè)施的建設(shè),更好地制定地鐵調(diào)度策略等;
[0004] (2)對于乘客,通過了解這些信息,可以提高乘客的自身體驗,合理安排出行時間 等。
[0005] 智能卡作為一種付費手段已經(jīng)廣泛應(yīng)用于公交、地鐵等城市內(nèi)公共交通領(lǐng)域,通 過智能卡可以收集到大量的乘客出行相關(guān)信息,通過對這些數(shù)據(jù)深入挖掘可以得到很多有 用的信息,例如乘客的乘車特征、乘客的實時分布、地鐵的實時密度等。
[0006] 因此,針對上述技術(shù)問題,有必要提供一種地鐵乘客實時分布和地鐵實時密度預(yù) 測方法及系統(tǒng)。
【發(fā)明內(nèi)容】
[0007] 有鑒于此,本發(fā)明的目的在于提供一種地鐵乘客實時分布和地鐵實時密度預(yù)測方 法及系統(tǒng),首先通過對乘客歷史刷卡記錄的分析建立個體乘客出行規(guī)律模型、各站點進站 乘客對線路選擇模型、各線路乘客在各站點下車以及換乘模型,并在此基礎(chǔ)上,通過對乘客 刷卡記錄以及地鐵到站時間記錄實時分析計算乘客實時分布和預(yù)測地鐵實時密度。
[0008] 為了達到上述目的,本發(fā)明實施例提供的技術(shù)方案如下:
[0009] -種地鐵乘客實時分布和地鐵實時密度預(yù)測方法,所述方法包括:
[0010] S1、獲取數(shù)據(jù)源,所述數(shù)據(jù)源包括歷史數(shù)據(jù)和實時數(shù)據(jù);
[0011] S2、根據(jù)歷史數(shù)據(jù)分別建立個體乘客時空出行模型、各上車站點乘客線路選擇模 型、和各線路乘客在各站點下車以及換乘模型;
[0012] S3、根據(jù)個體乘客時空出行模型、各上車站點乘客線路選擇模型、和各線路乘客在 各站點下車以及換乘模型對實時數(shù)據(jù)進行分析,獲取地鐵乘客實時分布和所有運行地鐵乘 客的實時密度。
[0013] 作為本發(fā)明的進一步改進,所述步驟Sl中歷史數(shù)據(jù)包括智能卡交易數(shù)據(jù),實時數(shù) 據(jù)包括智能卡交易數(shù)據(jù)和實時的地鐵運營信息。
[0014] 作為本發(fā)明的進一步改進,所述智能卡交易數(shù)據(jù)包括智能卡編號、地鐵站的編號、 交易時間、交易類型;實時的地鐵運營信息包括地鐵線路名稱、地鐵車次、到達的站點名稱、 到達時間。
[0015] 作為本發(fā)明的進一步改進,所述個體乘客時空出行模型的建立方法具體為:
[0016] 對智能卡數(shù)據(jù)進行預(yù)處理,包括:智能卡交易數(shù)據(jù)的出錯處理;對于乘坐地鐵的 乘客,按卡號和時間將乘客的進站和出站記錄相匹配,按卡號匯總所有的乘車記錄,并計算 活躍天數(shù);
[0017] 過濾出行天數(shù)小于預(yù)設(shè)經(jīng)驗值的乘客;
[0018] 獲取乘客的集中出行時間以及出行空間。
[0019] 作為本發(fā)明的進一步改進,所述各上車站點乘客線路選擇模型的建立方法具體 為:
[0020] 分時段統(tǒng)計與站點、線路關(guān)系為上車狀態(tài)的乘客人數(shù),然后分析每一條出行記 錄t,用bestPath(t. 〇, t. d)獲取乘車路徑為pi - . . · - pn,則pi. 1為乘客從t. 〇進 站后選擇的線路,通過t. otime,t. 〇, pi. 1計算每個時間段每條線路從各站點進站上 車的人數(shù),用pssbrdnum(t, l,s)函數(shù)獲取在t時間段在s站上車乘坐1線路的人數(shù) pssbrdnum(t, li, s);
[0021] 則經(jīng)過S站的線路有:11,…,In,在t時間段在S站進站的乘客選擇乘坐線路Ii 的概率為: η
[0022] pssbrdprop (i, li, s) = pssbrdnum (t, li, s) ^ pssbrdnum (i, lk, s) 〇
[0023] 作為本發(fā)明的進一步改進,所述各線路乘客在各站點下車以及換乘模型的建立方 法具體為:
[0024] 分時段統(tǒng)計與站點、線路關(guān)系為下車出站、換乘和經(jīng)過三類狀態(tài)的乘客人數(shù), 用dprPssNum(t,l,s)函數(shù)獲取乘客乘坐1線路在t時間段在s站下車的人數(shù),用 trnsfPassNum(t, 11,s, 12)函數(shù)獲取乘客乘坐11地鐵在t時間段在s站換乘12線路的乘 客人數(shù),η為可換乘線路的條數(shù),用psthPassNum(t, I, s)函數(shù)得到乘坐1地鐵的乘客在t時 間段在s站經(jīng)過的人數(shù);
[0025] 則乘客乘坐Ii線路的地鐵在t時間段在s站下車出站的概率為 dprPssProp(t, li, s)為:
【權(quán)利要求】
1. 一種地鐵乘客實時分布和地鐵實時密度預(yù)測方法,其特征在于,所述方法包括: 51、 獲取數(shù)據(jù)源,所述數(shù)據(jù)源包括歷史數(shù)據(jù)和實時數(shù)據(jù); 52、 根據(jù)歷史數(shù)據(jù)分別建立個體乘客時空出行模型、各上車站點乘客線路選擇模型、和 各線路乘客在各站點下車以及換乘模型; 53、 根據(jù)個體乘客時空出行模型、各上車站點乘客線路選擇模型、和各線路乘客在各站 點下車以及換乘模型對實時數(shù)據(jù)進行分析,獲取地鐵乘客實時分布和所有運行地鐵乘客的 實時密度。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟Sl中歷史數(shù)據(jù)包括智能卡交易 數(shù)據(jù),實時數(shù)據(jù)包括智能卡交易數(shù)據(jù)和實時的地鐵運營信息。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述智能卡交易數(shù)據(jù)包括智能卡編號、地 鐵站的編號、交易時間、交易類型;實時的地鐵運營信息包括地鐵線路名稱、地鐵車次、到達 的站點名稱、到達時間。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述個體乘客時空出行模型的建立方法 具體為: 對智能卡數(shù)據(jù)進行預(yù)處理,包括:智能卡交易數(shù)據(jù)的出錯處理;對于乘坐地鐵的乘客, 按卡號和時間將乘客的進站和出站記錄相匹配,按卡號匯總所有的乘車記錄,并計算活躍 天數(shù); 過濾出行天數(shù)小于預(yù)設(shè)經(jīng)驗值的乘客; 獲取乘客的集中出行時間以及出行空間。
5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述各上車站點乘客線路選擇模型的建 立方法具體為: 分時段統(tǒng)計與站點、線路關(guān)系為上車狀態(tài)的乘客人數(shù),然后分析每一條出行記錄t,用bestPath(t. 〇,t.d)獲取乘車路徑為pi- . . · -pn,則pi. 1為乘客從t. 〇進 站后選擇的線路,通過t.otime,t. 〇,pi. 1計算每個時間段每條線路從各站點進站上 車的人數(shù),用pssbrdnum(t,l,s)函數(shù)獲取在t時間段在s站上車乘坐1線路的人數(shù) pssbrdnum(t,li,s); 則經(jīng)過s站的線路有:11,…,In,在t時間段在s站進站的乘客選擇乘坐線路Ii的概 率為: η pssbrdprop (t, li, s)=pssbrdnum(t, li, s)-r ^pssbrdnum (t, Ik, s)〇 k=0
6. 根據(jù)權(quán)利要求I所述的方法,其特征在于,所述各線路乘客在各站點下車以及換乘 模型的建立方法具體為: 分時段統(tǒng)計與站點、線路關(guān)系為下車出站、換乘和經(jīng)過三類狀態(tài)的乘客人數(shù), 用dprPssNum(t,l,s)函數(shù)獲取乘客乘坐1線路在t時間段在s站下車的人數(shù),用 trnsfPassNum(t, 11,s, 12)函數(shù)獲取乘客乘坐11地鐵在t時間段在s站換乘12線路的乘 客人數(shù),η為可換乘線路的條數(shù),用psthPassNum(t,I,s)函數(shù)得到乘坐1地鐵的乘客在t時 間段在s站經(jīng)過的人數(shù); 則乘客乘坐Ii線路的地鐵在t時間段在s站下車出站的概率為dprPssProp(t,li,s) 為:
乘客乘坐Ii線路的地鐵在t時間段在S站換乘到Ij線路的地鐵的概率trnsfPassProp(t,li,lj,s)%:
7. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S3具體為: 數(shù)據(jù)接收單元實時接收乘客進站刷卡記錄和地鐵實時到站時間,并通過個體乘客時空 出行模型判斷乘客的下車站點是否可推算; 若下車站點可推算,將乘客進站刷卡記錄添加出站信息后發(fā)送至第一處理單元,第一 處理單元實時預(yù)測下車站點可推算的乘客的實時分布和地鐵上的乘客人數(shù); 若下車站點不可推算,將乘客進站刷卡記錄發(fā)送至第二處理單元,第二處理單元實時 預(yù)測下車站點不可推算的乘客的實時分布和地鐵上的乘客人數(shù)。
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述第一處理單元的預(yù)測方法為: 建立四種隊列: (1) 針對每條線路的每個站點創(chuàng)建隊列bardwaitquu,此隊列存放進站和等待狀態(tài)的 乘客; (2) 針對每個換乘站的任意兩條線路11、12,創(chuàng)建從11換乘到12的乘客隊列 trnsfquu; (3) 針對每條線路的每個站點創(chuàng)建當(dāng)前處于出站狀態(tài)的乘客dprtquu; (4) 針對每一趟地鐵,倉ij建隊列ontrainquu,存放當(dāng)前乘坐此地鐵的所有乘客。 接受數(shù)據(jù)接收單元發(fā)送的乘客的乘客進站刷卡記錄和地鐵實時到站時間,實時更新以 上四個隊列的值,并將實時信息寫入數(shù)據(jù)庫中。
9. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述第二處理單元的預(yù)測方法為: 估算乘客上車的線路、以及在途徑站點下車或換乘的概率; 建立四種隊列: (1) 針對每條線路的每個站點創(chuàng)建隊列bardwaitquu2,此隊列存放進站和等待狀態(tài)的 乘客; (2) 針對每個換乘站s的任意兩條線路可換乘線路11,12,創(chuàng)建從11換乘到12的乘客 隊列trnsfquu2 ; (3) 針對每條線路的每個站點創(chuàng)建當(dāng)前處于出站狀態(tài)的乘客dprtquu2 ; (4) 針對每一趟列車,倉ij建隊列ontrainpssnum,存放當(dāng)前乘坐此列車的乘客的人數(shù); 接受數(shù)據(jù)接收單元發(fā)送的乘客的乘客進站刷卡記錄和地鐵實時到站時間,實時更新以 上四個隊列的值,并將實時信息寫入數(shù)據(jù)庫中。
10. -種如權(quán)利要求1所述的地鐵乘客實時分布和地鐵實時密度預(yù)測系統(tǒng),其特征在 于,所述系統(tǒng)包括:硬件模塊、云平臺模塊、數(shù)據(jù)分析模塊、及應(yīng)用模塊,其中: 所述云平臺模塊用于獲取數(shù)據(jù)源,所述數(shù)據(jù)源包括歷史數(shù)據(jù)和實時數(shù)據(jù); 所述數(shù)據(jù)分析模塊用于根據(jù)歷史數(shù)據(jù)分別建立個體乘客時空出行模型、各上車站點乘 客線路選擇模型、和各線路乘客在各站點下車以及換乘模型;并根據(jù)個體乘客時空出行模 型、各上車站點乘客線路選擇模型、和各線路乘客在各站點下車以及換乘模型對實時數(shù)據(jù) 進行分析,獲取地鐵乘客實時分布和所有運行地鐵乘客的實時密度。
【文檔編號】G06Q50/30GK104463364SQ201410734612
【公開日】2015年3月25日 申請日期:2014年12月4日 優(yōu)先權(quán)日:2014年12月4日
【發(fā)明者】趙娟娟, 張帆, 須成忠, 田臣 申請人:中國科學(xué)院深圳先進技術(shù)研究院