基于馬爾科夫鏈蒙特卡洛算法的交通流缺失數據估計方法
【技術領域】
[0001] 本發(fā)明涉及交通信息處理技術領域,特別涉及一種基于馬爾科夫鏈蒙特卡洛算法 的交通流缺失數據估計方法。
【背景技術】
[0002] 在智能交通系統中,交通數據(交通流是最重要參數之一)是所有交通控制和管 理系統的重要保障,是整個智能交通系統得以順利運行的基礎。工程上應用的交通模型都 需要完備的交通數據進行校正。
[0003] 然而在實際交通環(huán)境中,由于各種各樣的原因(例如交通信息檢測器的故障、網 絡傳輸失敗等),交通信息采集裝置采集到的交通數據往往存在數據缺失的問題。例如,北 京市的交通流數據缺失率約為10%,而美國的PeMS系統中,在個別監(jiān)測點,交通流缺失率 在個別檢測點高達25%。
[0004] 因此,在交通領域內,有很多研究者從事交通缺失數據估計的研究。由于交通流是 交通數據中最重要的參數之一,很多缺失數據估計模型都以交通流為研究對象,包括基于 預測類的缺失數據估計方法、基于插值類缺失估計方法以及基于統計學習的缺失數據估計 方法。例如,目前相關技術中提出了一種非固定k值的最近鄰填充方法,而該方法所關注的 問題是對于利用k鄰近法估計缺失數據時最近鄰個數k值的選擇問題,并沒有關注樣本數 據的統計模型。另一種基于小波神經網絡的退化數據缺失插補方法,該方法所關注的問題 是利用小波神經網絡對缺失數據進行插值估計,沒有關注數據本身的統計特性。還有一種 交通數據彌補方法,該方法所關注的問題是利用神經網絡對缺失數據進行彌補,并沒有關 注數據的統計學規(guī)律。
【發(fā)明內容】
[0005] 本發(fā)明旨在至少在一定程度上解決上述相關技術中的技術問題之一。
[0006] 為此,本發(fā)明的目的在于提出一種基于馬爾科夫鏈蒙特卡洛算法的交通流缺失數 據估計方法,該方法能夠極大地提升交通流缺失數據的估計精度與速度。
[0007] 為了實現上述目的,本發(fā)明的實施例提出了一種基于馬爾科夫鏈蒙特卡洛算法的 交通流缺失數據估計方法,包括以下步驟:S1:接收連續(xù)N天的交通流數據,并根據所述連 續(xù)N天的交通流數據得到交通流數據向量集Yc= [Y⑴,Y⑵,...,Y(N)],其中,第1天的交 通流數據向量為Y⑴=[yi (1),yi (2),. ..,yi (D) ]i= 1,2,. . .,N,其中,所述Y。包括觀測數 據和缺失數據Y_,所述N為正整數;S2 :根據所述第i天的交通流數據向量Y(i)設定 高斯模型,其中,所述高斯模型的參數空間為?;S3:根據所述參數空間?的估計值 算所述缺失數據的發(fā)生概率P(Y^ |Y^,?k),并根據當前的觀測數據和最新的缺失數據估 計值計算所述參數空間?的發(fā)生概率汽,以及根據所述參數空間0的發(fā)生概 率巧015^,,^^1)對所述高斯模型的參數空間0的估計值進行更新; S4 :重復執(zhí)行所述S3, 直至得到的馬爾科夫鏈.,?^,...,(/^^〃'?^^〃^,收斂時"古計得到所述交通流的缺 misifxis 失數據。
[0008] 根據本發(fā)明實施例的基于馬爾科夫鏈蒙特卡洛算法的交通流缺失數據估計方法, 通過貝葉斯估計的方式進行交通流數據的補償,能夠極大地提升缺失數據的估計精度與速 度。并且,該方法采用的基于馬爾科夫鏈蒙特卡洛算法的補償方法能夠適用于多種交通流 數據缺失模式,因此,適用范圍廣。
[0009] 另外,根據本發(fā)明上述實施例的基于馬爾科夫鏈蒙特卡洛算法的交通流缺失數據 估計方法,還可以具有如下附加的技術特征:
[0010] 在一些示例中,所述高斯模型的參數空間?包括參數C和0 2。
[0011] 在一些示例中,通過以下公式估計得到所述交通流的缺失數據,所述公式為:
[0012]
[0013] 其中,Nsaniple是總樣本數,NB_in是丟棄的數據數目。
[0014] 在一些示例中,所述Nsampl^ 1500,所述NB_in為500。
[0015] 本發(fā)明的附加方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實踐了解到。
【附圖說明】
[0016] 本發(fā)明的上述和/或附加的方面和優(yōu)點從結合下面附圖對實施例的描述中將變 得明顯和容易理解,其中:
[0017] 圖1是根據本發(fā)明一個實施例的基于馬爾科夫鏈蒙特卡洛算法的交通流缺失數 據估計方法的流程圖。
【具體實施方式】
[0018] 下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
[0019] 以下結合附圖描述根據本發(fā)明實施例的基于馬爾科夫鏈蒙特卡洛算法的交通流 缺失數據估計方法。
[0020] 圖1是根據本發(fā)明一個實施例的基于馬爾科夫鏈蒙特卡洛算法的交通流缺失數 據估計方法的流程圖。如圖1所示,該方法包括以下步驟:
[0021] 步驟S1 :接收連續(xù)N天的交通流數據,并根據連續(xù)N天的交通流數據得到交通 流數據向量集1=[¥(1),¥(2),...,¥(沁],其中,第1天的交通流數據向量為¥(1)= [yi (1),yi (2),…,yi⑶]i= 1,2,…,N,其中,Y。包括觀測數據Y如和缺失數據Y_,N為 正整數。
[0022] 步驟S2 :模型假設。即假設第i天的交通流數據向量Y(i)服從高斯分布,設定 Y(i)的高斯模型,其中,高斯模型的參數空間為?。其中,在本發(fā)明的一個實施例中,參數 空間?包括參數C和0 2。
[0023] 步驟S3:根據參數空間?的估計值?k計算缺失數據的發(fā)生概率 pK^IY^,?k)以獨立模擬每次觀察的缺失數據,然后根據當前的觀測數據和最新的缺失 數據估計值計算參數空間?的發(fā)生概率愾,以及根據參數空間?的發(fā)生概率P(0l];z?,y=1)對高斯模型的參數空間?的估計值進行更新。
[0024] 步驟S4 :重復執(zhí)行步驟S3,直至得到的馬爾科夫鏈 收斂時,估計得到交通流的缺失數據。其中,當得到的馬爾科夫鏈(