一種基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的交通流預(yù)測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的交通流預(yù)測(cè)方法,屬于交通預(yù)測(cè)的
技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 隨著我國(guó)汽車產(chǎn)業(yè)的發(fā)展,城市及高速公路道路擁堵問題日益嚴(yán)峻。通過對(duì)交通 流數(shù)據(jù)深入挖掘,并在此基礎(chǔ)上建立短期交通流預(yù)測(cè)模型,能夠有效預(yù)測(cè)交通擁堵狀況從 而引導(dǎo)車輛選擇合理出行路線。
[0003] 短時(shí)交通流預(yù)測(cè)某個(gè)路段或某條路徑上未來的交通狀況,時(shí)間間隔一般不超出15 分鐘。對(duì)管理者來說這一預(yù)測(cè)可以用以制訂和實(shí)施交通管理計(jì)劃,對(duì)交通流進(jìn)行調(diào)控,以減 緩這一期間可能出現(xiàn)的交通擁擠和安全隱患。相對(duì)于長(zhǎng)期預(yù)測(cè)分析來說,短時(shí)交通流預(yù)測(cè) 將作為歷史數(shù)據(jù)使用。
[0004] 短時(shí)交通流預(yù)測(cè)方法主要包括兩部分:交通流歷史數(shù)據(jù)標(biāo)準(zhǔn)庫的建立及預(yù)測(cè)模型 構(gòu)建。前者為短時(shí)交通流預(yù)測(cè)提供數(shù)據(jù)保障,后者未來交通狀態(tài)的預(yù)測(cè)提供準(zhǔn)確的方法。到 目前,已經(jīng)有一系列技術(shù)和手段被開發(fā)應(yīng)用于短期交通流的預(yù)測(cè),但結(jié)果卻不令人滿意的 課題。
[0005] 傳統(tǒng)的交通流數(shù)據(jù)預(yù)測(cè)方法主要有K-最近鄰分類、支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)和決 策樹等,這些方法在一定規(guī)模的交通流數(shù)據(jù)基礎(chǔ)上進(jìn)行建模,從而進(jìn)行預(yù)測(cè),取得了一定的 預(yù)測(cè)成效。但隨著大數(shù)據(jù)時(shí)代的到來,諸如支持向量機(jī)這類淺層模型難以有效發(fā)掘海量數(shù) 據(jù)下的隱含信息,無法獲得最佳性能。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目的在于,提供一種基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的交通流預(yù)測(cè)方法。本 發(fā)明的方法可以對(duì)交通流數(shù)據(jù)進(jìn)行更深入的挖掘分析,因此在對(duì)交通流進(jìn)行短期預(yù)測(cè)時(shí)更 為精準(zhǔn),性能更優(yōu)。
[0007] 本發(fā)明的技術(shù)方案:一種基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的交通流預(yù)測(cè)方法,其特點(diǎn) 是:通過采集各類交通流數(shù)據(jù),并利用深度自動(dòng)編碼器模型對(duì)采集各類交通流數(shù)據(jù)進(jìn)行訓(xùn) 練,在訓(xùn)練過程中對(duì)深度自動(dòng)編碼器模型進(jìn)行調(diào)整,最后利用調(diào)整后的深度自動(dòng)編碼器模 型對(duì)短期交通流進(jìn)行預(yù)測(cè)。
[0008] 上述的基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的交通流預(yù)測(cè)方法,具體包括以下步驟:
[0009] ①交通流數(shù)據(jù)的采集;
[0010] ②交通流數(shù)據(jù)的預(yù)處理;
[0011] ③利用深度自動(dòng)編碼器模型對(duì)交通流數(shù)據(jù)進(jìn)行訓(xùn)練;(深度自動(dòng)編碼器模型由編 碼器、解碼器和隱含層組成)
[0012] ④用有監(jiān)督學(xué)習(xí)算法對(duì)深度自動(dòng)編碼器模型進(jìn)行微調(diào);
[0013] ⑤根據(jù)步驟④得到的最終的深度自動(dòng)編碼器模型對(duì)短期的交通流進(jìn)行預(yù)測(cè)。
[0014] 前述的基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的交通流預(yù)測(cè)方法中,所述步驟①中的交通流 數(shù)據(jù)包括:
[0015] (1)運(yùn)用高速公路上安裝車流量檢測(cè)器采集的流量和車速交通流數(shù)據(jù);
[0016] (2)視頻圖像非結(jié)構(gòu)數(shù)據(jù)轉(zhuǎn)換而成的結(jié)構(gòu)型交通流數(shù)據(jù);
[0017] (3)道路(高速公路路基、路面、橋梁和隧道等)養(yǎng)護(hù)數(shù)據(jù);
[0018] (4)高速公路交通事故發(fā)生后事件報(bào)送數(shù)據(jù);
[0019] (5)同路段環(huán)比類似歷史交通流數(shù)據(jù)。
[0020] 前述的基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的交通流預(yù)測(cè)方法中,所述步驟①的具體方 法:將每一年的交通流數(shù)據(jù)劃分為M個(gè)組,每一組中按照周一至周日分別將各天的交通流 數(shù)據(jù)歸為7類,生成7*M個(gè)的交通流數(shù)據(jù)的集合,并將每個(gè)集合中的交通流數(shù)據(jù)按時(shí)間段劃 分為空閑時(shí)段數(shù)據(jù)和繁忙時(shí)段數(shù)據(jù)。(其中,所述交通流數(shù)據(jù)是關(guān)于時(shí)間序列的數(shù)據(jù),每一 個(gè)集合中包含5個(gè)以上所述被歸為同一類的原始交通流時(shí)間序列數(shù)據(jù)。)
[0021] 前述的基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的交通流預(yù)測(cè)方法中,所述集合內(nèi)的交通流數(shù) 據(jù)為關(guān)于時(shí)間間隔連續(xù)的數(shù)據(jù);若繁忙時(shí)段數(shù)據(jù)中出現(xiàn)時(shí)間間隔不連續(xù)情況,則認(rèn)定為原 始交通數(shù)據(jù)缺失,對(duì)于數(shù)據(jù)缺失點(diǎn),采用平均插值方法補(bǔ)齊,若某個(gè)時(shí)間點(diǎn)的交通流數(shù)據(jù)超 出了閾值,則認(rèn)定為錯(cuò)誤數(shù)據(jù),并對(duì)錯(cuò)誤數(shù)據(jù)的進(jìn)行剔除,同時(shí)采用平均插值方法進(jìn)行補(bǔ) 齊;若空閑時(shí)段數(shù)據(jù)中出現(xiàn)時(shí)間間隔不連續(xù)情況,則認(rèn)定為原始交通數(shù)據(jù)缺失,對(duì)于數(shù)據(jù)缺 失點(diǎn),采用其它集合的同時(shí)間點(diǎn)的交通流數(shù)據(jù)的平均值進(jìn)行補(bǔ)齊,若某個(gè)時(shí)間點(diǎn)的交通流 數(shù)據(jù)超出了閾值,則認(rèn)定為錯(cuò)誤數(shù)據(jù),并對(duì)錯(cuò)誤數(shù)據(jù)的進(jìn)行剔除,同時(shí)采用其它集合的同時(shí) 間點(diǎn)的交通流數(shù)據(jù)的平均值進(jìn)行補(bǔ)齊。
[0022] 前述的基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的交通流預(yù)測(cè)方法中,所述步驟③的具體方法 包括以下步驟:
[0023] (1)逐層構(gòu)建單層神經(jīng)元,每次構(gòu)造一個(gè)單層網(wǎng)絡(luò)。
[0024] (2)當(dāng)所有層構(gòu)造完后,每層采用wake-sle印算法進(jìn)行調(diào)優(yōu),每次僅調(diào)整一層,逐 層調(diào)整。
[0025] 前述的基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的交通流預(yù)測(cè)方法中,所述調(diào)優(yōu)的具體方法包 括以下步驟:
[0026] A、將交通流數(shù)據(jù)輸入第一層的編碼器,生成一個(gè)編碼,這個(gè)編碼為輸入的一個(gè)表 示,然后將這個(gè)編碼輸入解碼器,解碼器會(huì)輸出一個(gè)重建信息,再通過計(jì)算輸入的交通流數(shù) 據(jù)的特征和重建信息的殘差,使用梯度下降法修改第一層的編碼器的生成權(quán)重;
[0027] B、將第一層輸出的編碼當(dāng)成第二層的輸入數(shù)據(jù)流,采用與步驟A相同的方法修改 第二層的編碼器的生成權(quán)重,并重復(fù)此步驟直至所有層的編碼器的生成權(quán)重修改完畢。
[0028] 前述過程實(shí)際為無監(jiān)督學(xué)習(xí)。
[0029] 前述的基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的交通流預(yù)測(cè)方法中,所述步驟④的具體方 法:
[0030] 將最后一層輸出的編碼輸入支持向量機(jī)分類器(SVM),再使用有標(biāo)簽樣本進(jìn)行有 監(jiān)督訓(xùn)練,實(shí)現(xiàn)對(duì)各層的編碼器的微調(diào)。
[0031] 前述的基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的交通流預(yù)測(cè)方法中,數(shù)據(jù)的訓(xùn)練是通過在分 布式系統(tǒng)上的CPU集群進(jìn)行并行運(yùn)算來實(shí)現(xiàn)的,從而可以加速數(shù)據(jù)的挖掘與分析。
[0032] 與現(xiàn)有技術(shù)相比,本發(fā)明通過深度自動(dòng)編碼器模型對(duì)交通流數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí), 從而形成了可以對(duì)交通流數(shù)據(jù)進(jìn)行深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),它相對(duì)于傳統(tǒng)的交通流數(shù)據(jù) 預(yù)測(cè)模型而言,可以對(duì)數(shù)據(jù)進(jìn)行更深入的分析,并可有效提取數(shù)據(jù)的潛在分層特征,而且還 免去了人工提取數(shù)據(jù)特征的巨大工作量,提高了特征提取的效率,降低了原始輸入的維數(shù)。 因此使用本發(fā)明的預(yù)測(cè)模型進(jìn)行短期交通流預(yù)測(cè)時(shí),可以提高預(yù)測(cè)的精準(zhǔn)度。
[0033] 而且本發(fā)明的方法中通過采用對(duì)交通流數(shù)據(jù)的分組、分時(shí)段,并對(duì)不同時(shí)段的數(shù) 據(jù)進(jìn)行不同的補(bǔ)齊和糾錯(cuò)方法,不僅簡(jiǎn)化了輸入交通流數(shù)據(jù)的復(fù)雜性,降低了模型的計(jì)算 難度及計(jì)算量,而且在很大程度上也進(jìn)一步提高了短期交通流預(yù)測(cè)的精準(zhǔn)度,并可提高預(yù) 測(cè)的穩(wěn)定性,不易出現(xiàn)明顯錯(cuò)誤。
[0034] 隨著車輛的增多,各種交通流數(shù)據(jù)接踵而至,處理大量的交通流數(shù)據(jù)就需要一種 能處理海量數(shù)據(jù)的編碼模型,深度自動(dòng)編碼器模型在這一方面具有明顯優(yōu)勢(shì),它可以稱為 未來處理大數(shù)據(jù)的過程中不可或缺的模型工具。本發(fā)明將深度自動(dòng)編碼器模型應(yīng)用于交通 流的處理上面,將對(duì)車輛安排合理出行帶來極大方便,一方面可以緩解道路的擁堵現(xiàn)狀,另 一方面可減少車輛在等待的過程中石化燃料的消耗,從而起到緩解空氣污染的現(xiàn)狀。
【附圖說明】
[0035] 圖1是本發(fā)明的基本步驟流程圖。
【具體實(shí)施方式】
[0036] 下面結(jié)合實(shí)施例對(duì)本發(fā)明作進(jìn)一步的說明,但并不作為對(duì)本發(fā)明限制的依據(jù)。
[0037] 實(shí)施例。一種基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的交通流預(yù)測(cè)方法,其基本流程如圖1 所示,包括以下步驟:
[0038] ①交通流數(shù)據(jù)的采集;
[0039] ②交通流數(shù)據(jù)的預(yù)處理;
[0040] ③利用深度自動(dòng)編碼器模型對(duì)交通流數(shù)據(jù)進(jìn)行訓(xùn)練;
[0041] ④用有監(jiān)督學(xué)習(xí)算法對(duì)深度自動(dòng)編碼器模型進(jìn)行微調(diào);
[0042] ⑤根據(jù)步驟④得到的最終的深度自動(dòng)編碼器模型對(duì)短期的交通流進(jìn)行預(yù)測(cè)。
[0043] -、交通流數(shù)據(jù)的采集
[0044] 采集各類交通流數(shù)據(jù)為后續(xù)深度學(xué)習(xí)提供豐富的當(dāng)前數(shù)據(jù)和歷史數(shù)據(jù)。主要包含 以下方面:
[0045] (1)運(yùn)用高速公路上安裝車流量檢測(cè)器采集的流量和車速交通流數(shù)據(jù);
[0046] (2)視頻圖像非結(jié)構(gòu)數(shù)據(jù)轉(zhuǎn)換而成的結(jié)構(gòu)型交通流數(shù)據(jù);
[0047] (3)道路養(yǎng)護(hù)數(shù)據(jù);
[0048] (4)高速公路交通事故發(fā)生后事件報(bào)送數(shù)據(jù);
[0049] (5)同路段環(huán)比類似歷史交通流數(shù)據(jù)。
[0050] 二、數(shù)據(jù)的預(yù)處理
[0051] 考慮到道路中一天中不同時(shí)段交通流規(guī)律的不同,將一天的時(shí)間劃分為繁忙時(shí)段 和空閑時(shí)段,繁忙時(shí)段一般為6:00~0:00,空閑時(shí)段一般是0:00~6:00,可以根據(jù)各路段 的情況靈活設(shè)定。本發(fā)明實(shí)施例中對(duì)于繁忙時(shí)段和空閑時(shí)段采用不同的方法進(jìn)行處理,下 面進(jìn)行詳細(xì)說明。
[0052] 對(duì)于交通流數(shù)據(jù)要按照一定規(guī)律對(duì)其分組,形成相應(yīng)的數(shù)據(jù)集。以年為單位,對(duì)每 一天根據(jù)設(shè)定的采集周期采集原始交通流數(shù)據(jù),以獲得各天的原始交通流時(shí)間序列數(shù)據(jù), 原始交通流時(shí)間序列數(shù)據(jù)每間隔5分鐘采集一次。按照設(shè)定規(guī)律將一年劃分為M = 4個(gè)組 即4個(gè)季度,每一組中按照周一至周日分別將各天的原始交通流時(shí)間序列數(shù)據(jù)歸為7類,生 成7*M = 28個(gè)的原始交通流時(shí)間序列數(shù)據(jù)集合。其中,每一個(gè)集合中包含5個(gè)以上所述被 歸為同一類的原始交通流時(shí)間序列數(shù)據(jù)。
[0053] 根據(jù)設(shè)定的采集周期采集交通流數(shù)據(jù)以獲得當(dāng)天在當(dāng)前時(shí)間點(diǎn)之前的原始交通 流時(shí)間序列數(shù)據(jù)(X 1, X2, x;5. ..,xt,Xn),其中Xt為t時(shí)間點(diǎn)的交通數(shù)據(jù)流,X "為當(dāng)前點(diǎn)的交通 流數(shù)據(jù)。例如:采集周期可以為5分鐘,當(dāng)前時(shí)間點(diǎn)η為10:00,則交通流時(shí)間序列數(shù)據(jù)中 x n :為9:55的交通流數(shù)據(jù),依次類推。如果采集原始交通流數(shù)據(jù)從0:00開始,則交通流時(shí) 間序列數(shù)據(jù)中X1S 〇:〇〇的交通流數(shù)據(jù);如果采集原始交通流數(shù)據(jù)從6:00開始,則交通流 時(shí)間序列數(shù)據(jù)中X1S 6:00的交通流數(shù)據(jù)。
[0054] 在繁忙時(shí)段,若時(shí)間間隔不連續(xù)(如8:00,8:10),則定義為原始交通數(shù)據(jù)缺失。對(duì) 于數(shù)據(jù)缺失點(diǎn),采用平均插值方法補(bǔ)齊。對(duì)原始交通流時(shí)間序列數(shù)據(jù)錯(cuò)誤的判斷采用閾值 法,超出閾值的原始交通流數(shù)據(jù),定義為錯(cuò)誤數(shù)據(jù)。對(duì)于錯(cuò)誤數(shù)據(jù)的剔除,采用平均插值方 法補(bǔ)齊。
[0