亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺的制作方法

文檔序號:10725088閱讀:432來源:國知局
互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺的制作方法
【專利摘要】一種互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺,對車輛駕駛行為、汽車行駛風(fēng)險概率進行分析,其中包括步驟一、通過大數(shù)據(jù)平臺存儲汽車一段時間內(nèi)的行駛數(shù)據(jù)并采用MapReduce框架對這些數(shù)據(jù)進行處理和分析,步驟二、基于大數(shù)據(jù)平臺下對數(shù)據(jù)進行處理過后統(tǒng)計出某個區(qū)域和時間段內(nèi)汽車非正常駕駛次數(shù),包括超速、超載、急加速急減速、疲勞駕駛、夜間行駛,步驟三、對非正常駕駛行為統(tǒng)計后,利用自組織映射神經(jīng)網(wǎng)絡(luò)算法計算車輛風(fēng)險概率,并對后續(xù)車輛行駛風(fēng)險進行預(yù)測。本發(fā)明通過采集車輛的北斗/GPS導(dǎo)航數(shù)據(jù),利用大數(shù)據(jù)平臺對采集的數(shù)據(jù)進行預(yù)處理,在對數(shù)據(jù)進一步數(shù)據(jù)挖掘,可以分析和判斷駕駛者的駕駛行為。
【專利說明】
互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺
技術(shù)領(lǐng)域:
[0001] 本發(fā)明涉及物理領(lǐng)域,尤其涉及數(shù)據(jù)的存儲與處理技術(shù),特別是一種互聯(lián)網(wǎng)+時代 下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺。
【背景技術(shù)】:
[0002] 隨著信息化程度提高,生活中充滿著海量信息,在這些信息中有些與我們的生活 息息相關(guān),分析與挖掘它們可以為我們改善生活,服務(wù)公眾,提高社會信息化程度,為智慧 城市及信息化的動態(tài)管理方案提供了新的契機。
[0003] 隨著道路行駛的車輛不斷增加,因人的違規(guī)駕駛導(dǎo)致人員財產(chǎn)損失的風(fēng)險也在不 斷增加。不同地段區(qū)域內(nèi)車輛出現(xiàn)違規(guī)駕駛行為的風(fēng)險也不同,所以不能將簡單的將風(fēng)險 平均,要因地而異。這就是需要考慮到汽車行駛的環(huán)境因素,所以首先要對汽車行駛區(qū)域進 行劃分然后分析出每個區(qū)域內(nèi)的風(fēng)險概率。現(xiàn)有技術(shù)中,不能從生活中的海量信息分析車 輛駕駛行為。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明的目的在于提供一種互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù) 平臺,所述的這種互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺要解決現(xiàn)有技 術(shù)中不能從生活中的海量信息分析車輛駕駛行為的技術(shù)問題。
[0005] 本發(fā)明的這種互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺,包括對 車輛駕駛行為、汽車行駛風(fēng)險概率進行分析,其中包括以下步驟:
[0006] 步驟一、通過大數(shù)據(jù)平臺存儲汽車一段時間內(nèi)的行駛數(shù)據(jù)并采用MapReduce框架 對這些數(shù)據(jù)進行處理和分析,
[0007] 步驟二、基于大數(shù)據(jù)平臺下對數(shù)據(jù)進行處理過后統(tǒng)計出某個區(qū)域和時間段內(nèi)汽車 非正常駕駛次數(shù),包括超速、超載、急加速急減速、疲勞駕駛、夜間行駛,
[0008] 步驟三、對非正常駕駛行為統(tǒng)計后,利用自組織映射神經(jīng)網(wǎng)絡(luò)算法計算車輛風(fēng)險 概率,并對后續(xù)車輛行駛風(fēng)險進行預(yù)測。
[0009] 進一步的,對汽車駕駛數(shù)據(jù)進行處理分析,其中包括,第一步建立數(shù)據(jù)存儲層,主 要方案為基于Hadoop分布式文件系統(tǒng)(簡稱HDFS)存儲方案和基于HDFS+分布式面向列開源 數(shù)據(jù)庫(簡稱HBase)技術(shù)存儲方案;第二步建立數(shù)據(jù)處理層,在數(shù)據(jù)處理層中采用大規(guī)模并 行計算框架MapReduce (簡稱MR)框架來處理原始數(shù)據(jù),第三步建立數(shù)據(jù)分析層,對數(shù)據(jù)進一 步分析、建模和挖掘,第四步建立數(shù)據(jù)可視化,第五步建立安全層,為大數(shù)據(jù)平臺提供安全 保護系統(tǒng),對外提供統(tǒng)一的服務(wù)接口,用戶通過統(tǒng)一數(shù)據(jù)訪問接口或統(tǒng)一門戶頁面來訪問 大數(shù)據(jù)服務(wù)平臺。
[0010] 進一步的,利用隱馬爾科夫算法找到車輛行駛的路網(wǎng)路段,并通過地圖數(shù)據(jù)找到 汽車行駛的路段信息,最后將定位數(shù)據(jù)中行駛速度輸入時空限速模型中,最終得出車輛是 否超速的判斷。
[0011] 進一步的,利用大數(shù)據(jù)平臺實現(xiàn)支持向量機的算法,其中包括,第一步、將原始數(shù) 據(jù)進行標準化消除量綱的影響;第二步、通過原始數(shù)據(jù)中時間、速度和里程計算平均速度、 平均加速度和啟動加速度,并作為訓(xùn)練樣本;第三步、將大量的訓(xùn)練樣本上傳到HDFS中并做 分塊,每個節(jié)點會啟動HDFS的Map任務(wù)對塊中數(shù)據(jù)進行序列最小優(yōu)化(簡稱SM0)訓(xùn)練算出每 個塊數(shù)據(jù)的支持向量,最后將各個節(jié)點訓(xùn)練處的支持向量輸入到HDFS的Reduce任務(wù)中交于 SM0算法訓(xùn)練得到最終的支持向量;第四步、利用第三步中的支持向量得到分類器,并利用 分類器對車輛是否超載進行判別。
[0012] 進一步的,建立大數(shù)據(jù)平臺下線性回歸模型,其中包括,第一步、利用大數(shù)據(jù)平臺 找到該路段內(nèi)所有汽車行駛的數(shù)據(jù),并計算出相鄰兩個數(shù)據(jù)之間速度差值;第二步、利用統(tǒng) 計線性回歸算法得到某段道路上汽車以某個起始車速V。和行駛至下一時刻車速變化量A v 為輸入,以汽車在該段時間內(nèi)行駛距離S為輸出,并統(tǒng)計該路段內(nèi)所有行駛汽車的數(shù)據(jù),第 三步、計算回歸方程,得到該路段內(nèi)汽車速度變化量和行駛距離的模型S = f(Av,v。),最 后利用該方程判別該汽車發(fā)生急加速和急減速的概率,判斷規(guī)則為第i量汽車的距離與模 型距離誤差e=| IS-S1! |越大則說明汽車發(fā)生急加速和急減速概率越大,越小則說明概率 越低。
[0013] 具體的,首先通過大數(shù)據(jù)平臺從原始數(shù)據(jù)中找出某個路段所有時間所有車輛的行 駛數(shù)據(jù),對這些數(shù)據(jù)進行處理得出相鄰兩點速度的差值,接著利用回歸分析方法得出回歸 模型。通過回歸模型得出汽車在該路段發(fā)生急加速和急減速的概率。設(shè)同一個路段上兩個 時間點的速度差為A v,汽車的每個時間點的初始速度為V。。因為汽車在一段時間內(nèi)行駛距 離與速度差和初始速度成線性關(guān)系,所以可以該回歸模型為
[0014] S: = h0 + ^Αν +1)^0 ( 1)
[0015] 其中為變量Δν和VQ的偏回歸系數(shù)。
[0016] 通過訓(xùn)練數(shù)據(jù)和最小二乘原理得出偏回歸系數(shù)的值,并利用方差分析對得出的模 型進行檢驗,最后根據(jù)e = |s-S|的大小得出汽車發(fā)生急加速和急減速的概率。其中S為汽車 實際的行駛距離,f為滿足回歸模型下的行駛距離。
[0017] 進一步的,所述的計算車輛風(fēng)險概率的步驟中包括,第一步度量風(fēng)險概率,第二步 建立風(fēng)險概率模型,首先對歷史數(shù)據(jù)進行預(yù)處理,包括對數(shù)據(jù)進行聚類得到1個簇即C n = {I1J2……Ιι}其中^是其中的一個簇,然后針對聚類結(jié)果構(gòu)造預(yù)測模型包括求簇的平均 風(fēng)險概率和特征向量與平均向量的相似系數(shù),接著對風(fēng)險概率進行預(yù)測。
[0018] 具體的,風(fēng)險概率是風(fēng)險發(fā)生可能性的百分比,是對事物狀態(tài)發(fā)生可能性的衡量。 汽車在同一區(qū)域內(nèi)行駛數(shù)據(jù)具有較高的相似性,不同區(qū)域內(nèi)行駛數(shù)據(jù)差別性比較大。以一 個區(qū)域為一個簇,將汽車行駛數(shù)據(jù)按特征點進行聚類,可以得到不同區(qū)域內(nèi)的行駛數(shù)據(jù)。每 一個特征點(特征向量)都與簇中的點有關(guān),并假設(shè)簇中第i個特征向量為XUieN),那么風(fēng) 險概率可以表示為
[0020]其中| |Ν:(χ4 I I表示區(qū)域r中所有點的個數(shù),Nr#)為點xWr為半徑的領(lǐng)域。U(Nr (X1))為該簇中安全風(fēng)險發(fā)生的次數(shù)。有(2)可以看出,風(fēng)險概率就是該簇中所有點的平均 概率。也可以表示為
[0021] P(X')^s{X\X)xP,(X ) ( 3 )
[0022] 其中λ'(Α'叉)表示特征點X1與所有點的平均向量的相似度。
[0023]其中,風(fēng)險概率預(yù)測模型確定包括三部分:
[0024]對歷史數(shù)據(jù)的預(yù)處理
[0025] (1)從歷史數(shù)據(jù)中抽象出數(shù)據(jù)屬性,在汽車駕駛行為數(shù)據(jù)包括車牌號、經(jīng)煒度、行 駛速度、行駛方向、行駛時間。
[0026] (2)對歷史數(shù)據(jù)進行聚類得到1個簇即(^={1^12……Ιι},其中是其中的一個 簇,假設(shè)簇中有k個特征向量即(={4,4....4卜其中^是簇中第」個特征向量。
[0027] 構(gòu)造預(yù)測模型
[0028]聚類得到結(jié)果后對每個簇中的特征向量計算風(fēng)險概率,步驟如下:
[0029] (1)計算簇Ii中平均風(fēng)險概率。
[0031] 其中,|h|是簇I沖元素的個數(shù),如果表示的點為風(fēng)險發(fā)生,那么£({') = 1否則 為〇〇
[0032] (2)計算簇中所有點的平均特征向量果
[0033] (3)計算簇中每個特征向量Z/與乂的相似系數(shù)sCZ/,兄)
[0034] (4)計算每個特征向量的風(fēng)險概率P (λ'/)
[0035] 5.3風(fēng)險概率預(yù)測
[0036] 計算得到風(fēng)險概率模型之后就可以對新的汽車數(shù)據(jù)進行預(yù)測,步驟如下:
[0037] (1)對于新的汽車行駛數(shù)據(jù)乂1)進行聚類分析;
[0038] (2)-般聚類后會將新的數(shù)據(jù)聚類到某一簇中,然后計算該數(shù)據(jù)與平均向量筆的 相似系數(shù);
[0039] (3)那么新的數(shù)據(jù)點的概率計算公式為:
[0040] = ^ Α^χΡ?.?.) ( 5)
[0041] 進一步的,在對數(shù)據(jù)進行聚類的步驟中,采用基于hadoop的自組織映射的神經(jīng)網(wǎng) 絡(luò)聚類算法,使用Mapreduce并行計算框架對數(shù)據(jù)進行計算。
[0042] 進一步的,在使用Mapreduce并行計算框架對數(shù)據(jù)進行計算的步驟中,在Map階段 計算獲勝神經(jīng)元并計算權(quán)值修改量,Reducer階段對相同的獲勝神經(jīng)元,統(tǒng)計與其連接的每 個權(quán)值的總體更新量,然后對權(quán)值進行更新。
[0043]進一步的,在實現(xiàn)支持向量機的算法中,利用歐式距離態(tài)度量兩個向量之間的相 似度。
[0044]具體的,在上述基于hadoop的自組織映射(S0M)的神經(jīng)網(wǎng)絡(luò)聚類算法中,采用競爭 學(xué)習(xí)實現(xiàn)內(nèi)部自適應(yīng)和自組織的改變內(nèi)部結(jié)構(gòu),即在接受外界輸入后會自動地分為不同區(qū) 域,每個區(qū)域?qū)τ谳斎攵加胁煌捻憫?yīng)特征,而且這個過程是自動完成的。該算法的步驟如 下:
[0045] (1)初始化和歸一化。首先對當前輸入向量和競爭層中神經(jīng)元權(quán)值向量Wi進行歸 一化處理,并建立初始優(yōu)勝域Λ^(〇),并對增益μ(〇)進行賦值。
[0046] (2)尋找獲勝神經(jīng)元。將輸入向量與競爭層中所有響應(yīng)的權(quán)值向量進行相似性比 較,將最相思的權(quán)值向量最為獲勝神經(jīng)元。在數(shù)學(xué)中兩個向量最相似則他們的點積越大可 以表示為下面公式:
[0048] (3)對優(yōu)勝領(lǐng)域內(nèi)節(jié)點權(quán)值調(diào)整
[00511其中,y(t)為增益并隨著時間下降到0。
[0052] (4)如果增益下降到設(shè)定的閾值μΜη那么結(jié)束流程,否則繼續(xù)輸入數(shù)據(jù)從第一步開 始新的流程計算。
[0053] 將上述算法運行在Hadoop平臺運行,其實施步驟如下:
[0054] Map 階段
[0055] 輸入鍵值對〈key,value〉,其中key表示樣本序號value表示樣本特征集合。
[0056]根據(jù)競爭學(xué)習(xí)原則計算出競爭層的輸出值。
[0057]判定獲勝神經(jīng)元,將其狀態(tài)判定為1,其他狀態(tài)判定為0。設(shè)置flag為獲勝神經(jīng)元在 競爭層的位置。
[0058]計算與獲勝神經(jīng)元相連接的各權(quán)值更新量,其他權(quán)值保持不變。
[0059]輸出鍵值對其中key表示flag,value表示與獲勝神經(jīng)元相連接的權(quán)值更新量。
[0060] Reducer 階段
[0061 ]接受map函數(shù)的輸出作為re du c e函數(shù)的輸入,輸入key表示獲勝神經(jīng)元的位置, values表示與獲勝神經(jīng)元相連接的權(quán)值更新量的結(jié)合。
[0062]累計獲得每個權(quán)值的總體更新量,并計算平均更新量。
[0063]調(diào)整相應(yīng)的網(wǎng)絡(luò)權(quán)值。
[0064] 輸出鍵值對,key表示權(quán)值更新狀態(tài),value表示更新后的網(wǎng)絡(luò)權(quán)值。
[0065]更新全局向量,并重復(fù)MapReduce過程,直到權(quán)值向量和獲勝樣本誤差小于設(shè)定的 閾值則結(jié)束。
[0066]從上述計算步驟中可以看出S0M網(wǎng)絡(luò)的學(xué)習(xí)可以自適應(yīng)的根據(jù)樣本內(nèi)在的聯(lián)系進 行聚類,輸出神經(jīng)元權(quán)值向量Wi逐漸的向獲勝樣本靠近,權(quán)值向量集{Wi| i = l,2. . .1}看成 所有樣本的聚類中心。相似性度量方法描述如下:
[0067]特征向量X= {xi,X2. . . .xn}屬于特征空間某個簇Ii,該特征向量與平均向量爲 (聚類中心)相似系數(shù)可表示為,
[0069] 從式(9)中可以看出度量向量之間相似度使用歐式距離來測量的,兩個向量越相 似則兄)值越大最大值為1。
[0070] 本發(fā)明和已有技術(shù)相比較,其效果是積極和明顯的。本發(fā)明通過采集車輛的北斗/ GPS導(dǎo)航數(shù)據(jù),利用大數(shù)據(jù)平臺對采集的數(shù)據(jù)進行預(yù)處理,在對數(shù)據(jù)進一步數(shù)據(jù)挖掘,可以 分析和判斷駕駛者的駕駛行為。
【附圖說明】:
[0071] 圖1是本發(fā)明的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺的框架 圖。
[0072] 圖2是本發(fā)明中的基于自組織映射神經(jīng)網(wǎng)絡(luò)算法流程圖。
【具體實施方式】:
[0073] 實施例1:
[0074] 如圖1和圖2所示,本發(fā)明的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù) 平臺,包括四個部分:數(shù)據(jù)存儲層、數(shù)據(jù)處理層、數(shù)據(jù)分析層和數(shù)據(jù)可視化層。
[0075] 判斷汽車超速,第一步、利用隱馬爾科夫算法找到車輛行駛的最佳路段;第二步、 利用地圖數(shù)據(jù)找到汽車行駛的道路類型對應(yīng)的限速大小;第三步、將獲得數(shù)據(jù)中行駛速度 大小和路段限速大小進行對比判別車輛是否超速。
[0076] 判斷汽車超載,第一步、將原始數(shù)據(jù)進行標準化消除量綱的影響;第二步、通過原 始數(shù)據(jù)中時間、速度和里程計算平均速度、平均加速度和啟動加速度,并作為訓(xùn)練樣本;第 三步、利用第二步中的訓(xùn)練樣本訓(xùn)練出分類器;第四步、利用分類器對車輛是否超載進行判 別。
[0077] 急加速與急減速判斷,首先通過大數(shù)據(jù)平臺從原始數(shù)據(jù)中找出某個路段所有時間 所有車輛的行駛數(shù)據(jù),對這些數(shù)據(jù)進行處理得出相鄰兩點速度的差值,接著利用回歸分析 方法得出回歸模型。通過回歸模型得出汽車在該路段發(fā)生急加速和急減速的概率。設(shè)同一 個路段上兩個時間點的速度差為Α V,汽車的每個時間點的初始速度為ν。。因為汽車在一段 時間內(nèi)行駛距離與速度差和初始速度成線性關(guān)系,該回歸模型為:
[0078] S = h, + b,Av +(1)
[0079] 其中b。,!^,^為變量Δν和VQ的偏回歸系數(shù)。
[0080] 通過訓(xùn)練數(shù)據(jù)和最小二乘原理得出偏回歸系數(shù)的值,并利用方差分析對得出的模 型進行檢驗,最后根據(jù)β = ||5* -1||的大小得出汽車發(fā)生急加速和急減速的概率。其中S為汽車 實際的行駛距離,左為滿足回歸模型下的行駛距離。
[0081] 風(fēng)險概率是風(fēng)險發(fā)生可能性的百分比,是對事物狀態(tài)發(fā)生可能性的衡量。汽車在 同一區(qū)域內(nèi)行駛數(shù)據(jù)具有較高的相似性,不同區(qū)域內(nèi)行駛數(shù)據(jù)差別性比較大。以一個區(qū)域 為一個簇,將汽車行駛數(shù)據(jù)按特征點進行聚類,可以得到不同區(qū)域內(nèi)的行駛數(shù)據(jù)。每一個特 征點(特征向量)都與簇中的點有關(guān),并假設(shè)簇中第i個特征向量為xUieN),那么風(fēng)險概率 可以表示為
[0083] 其中| |Ν:(χ4 I I表示區(qū)域r中所有點的個數(shù),Nr#)為點xWr為半徑的領(lǐng)域。U(Nr (X1))為該簇中安全風(fēng)險發(fā)生的次數(shù)。有(1)可以看出,風(fēng)險概率就是該簇中所有點的平均 概率。也可以表示為
[0084] Pr(X')^s(X\X)xP(X ) 13)
[0085] 其中 <妒夕)表示特征點X1與所有點的平均向量的相似度。
[0086]其中,風(fēng)險概率預(yù)測模型需要分三個部分:
[0087]對歷史數(shù)據(jù)的預(yù)處理
[0088] 從歷史數(shù)據(jù)中抽象出數(shù)據(jù)屬性,在汽車駕駛行為數(shù)據(jù)包括車牌號、經(jīng)煒度、行駛速 度、行駛方向、行駛時間。
[0089] 對歷史數(shù)據(jù)進行聚類得到1個簇即(^={1^12.....IU,其中^是其中的一個簇,假 設(shè)簇中有k個特征向量即.....Zf卜其中X/是簇中第j個特征向量。
[0090] 構(gòu)造預(yù)測模型
[0091] 聚類得到結(jié)果后對每個簇中的特征向量計算風(fēng)險概率,步驟如下:
[0092] (1)計算簇Ii中平均風(fēng)險概率。
[0094] 其中,| |是簇I沖元素的個數(shù),如果X/表示的點為風(fēng)險發(fā)生,那么£(Λ7 )=丨否則 為0〇
[0095] (2)計算簇I i中所有點的平均特征向量尾
[0096] (3)計算簇中每個特征向量與萬的相似系數(shù)<巧,屬)
[0097] (4)計算每個特征向量的風(fēng)險概率/3 (Λ7)
[0098] 風(fēng)險概率預(yù)測
[0099] 計算得到風(fēng)險概率模型之后就可以對新的汽車數(shù)據(jù)進行預(yù)測,步驟如下:
[0100] 對于新的汽車行駛數(shù)據(jù)乂1)進行聚類分析;
[0101] 一般聚類后會將新的數(shù)據(jù)聚類到某一簇中,然后計算該數(shù)據(jù)與平均向量粟的相似 系數(shù);
[0102] 新的數(shù)據(jù)點的概率計算公式為:
[0103] P(X-'·) = ,v(X,X:)x P(X.) ( 5 )
[0104] 求數(shù)據(jù)點的風(fēng)險概率模型的關(guān)鍵技術(shù)是如何利用聚類算法對歷史數(shù)據(jù)進行聚 類。此處采用基于自組織映射(S0M)的神經(jīng)網(wǎng)絡(luò)聚類算法。該算法采用競爭學(xué)習(xí)實現(xiàn)內(nèi)部自 適應(yīng)和自組織的改變內(nèi)部結(jié)構(gòu),即在接受外界輸入后會自動地分為不同區(qū)域,每個區(qū)域?qū)?于輸入都有不同的響應(yīng)特征,而且這個過程是自動完成的。該算法的步驟如下:
[0105] 初始化和歸一化。首先對當前輸入向量和競爭層中神經(jīng)元權(quán)值向量Wi進行歸一化 處理,并建立初始優(yōu)勝域&*(0),并對增益μ(0)進行賦值。
[0106] 尋找獲勝神經(jīng)元。將輸入向量與競爭層中所有響應(yīng)的權(quán)值向量進行相似性比較, 將最相思的權(quán)值向量最為獲勝神經(jīng)元。在數(shù)學(xué)中兩個向量最相似則他們的點積越大可以表 示為下面公式:
[0108]對優(yōu)勝領(lǐng)域內(nèi)節(jié)點權(quán)值調(diào)整
[0111] 其中,y(t)為增益并隨著時間下降到0。
[0112] 如果增益下降到設(shè)定的閾值μηιη那么結(jié)束流程,否則繼續(xù)輸入數(shù)據(jù)從第一步開始 新的流程計算。
[0113] 將上述算法運行在Hadoop平臺運行,其實施步驟如下:
[0114] Map 階段
[0115] 輸入鍵值對〈key,value〉,其中key表示樣本序號value表示樣本特征集合
[0116]根據(jù)競爭學(xué)習(xí)原則計算出競爭層的輸出值。
[0117] 判定獲勝神經(jīng)元,將其狀態(tài)判定為1,其他狀態(tài)判定為0。設(shè)置flag為獲勝神經(jīng)元在 競爭層的位置。
[0118] 計算與獲勝神經(jīng)元相連接的各權(quán)值更新量,其他權(quán)值保持不變。
[0119] 輸出鍵值對其中key表示flag,value表示與獲勝神經(jīng)元相連接的權(quán)值更新量。
[0120] Reducer 階段
[0121 ]接受map函數(shù)的輸出作為re du c e函數(shù)的輸入,輸入key表示獲勝神經(jīng)元的位置, values表示與獲勝神經(jīng)元相連接的權(quán)值更新量的結(jié)合。
[0122] 累計獲得每個權(quán)值的總體更新量,并計算平均更新量。
[0123] 調(diào)整相應(yīng)的網(wǎng)絡(luò)權(quán)值。
[0124] 輸出鍵值對,key表示權(quán)值更新狀態(tài),value表示更新后的網(wǎng)絡(luò)權(quán)值。
[0125] 更新全局向量,并重復(fù)MapReduce過程,直到權(quán)值向量和獲勝樣本誤差小于設(shè)定的 閾值則結(jié)束。
[0126] 從上述計算步驟中可以看出S0M網(wǎng)絡(luò)的學(xué)習(xí)可以自適應(yīng)的根據(jù)樣本內(nèi)在的聯(lián)系進 行聚類,輸出神經(jīng)元權(quán)值向量Wi逐漸的向獲勝樣本靠近,那么權(quán)值向量集{Wi I i = l ,2. .. 1} 就可以看成所有樣本的聚類中心。相似性度量方法:
[0127] 特征向量X= {xi,X2. . . .xn}屬于特征空間某個簇Ii,該特征向量與平均向量足 (聚類中心)相似系數(shù)可表示為
[0129]從式(9)中可以看出度量向量之間相似度使用歐式距離來測量的,兩個向量越相 似則、( Α-?,.)值越大最大值為1。
【主權(quán)項】
1. 一種互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺,其特征在于,其特征 在于:對車輛駕駛行為、汽車行駛風(fēng)險概率進行分析,其中包括以下步驟: 步驟一、通過大數(shù)據(jù)平臺存儲汽車一段時間內(nèi)的行駛數(shù)據(jù)并采用MapReduce框架對這 些數(shù)據(jù)進行處理和分析, 步驟二、基于大數(shù)據(jù)平臺下對數(shù)據(jù)進行處理過后統(tǒng)計出某個區(qū)域和時間段內(nèi)汽車非正 常駕駛次數(shù),包括超速、超載、急加速急減速、疲勞駕駛、夜間行駛, 步驟三、對非正常駕駛行為統(tǒng)計后,利用自組織映射神經(jīng)網(wǎng)絡(luò)算法計算車輛風(fēng)險概率, 并對后續(xù)車輛行駛風(fēng)險進行預(yù)測。2. 如權(quán)利要求1所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺,其特 征在于:對汽車駕駛數(shù)據(jù)進行處理分析,其中包括,第一步建立數(shù)據(jù)存儲層,基于Hadoop分 布式文件系統(tǒng)存儲方案和基于Hadoop分布式文件系統(tǒng)+分布式面向列開源數(shù)據(jù)庫技術(shù)存儲 方案;第二步建立數(shù)據(jù)處理層,在數(shù)據(jù)處理層中采用大規(guī)模并行計算框架來處理原始數(shù)據(jù), 第三步建立數(shù)據(jù)分析層,對數(shù)據(jù)進一步分析、建模和挖掘,第四步建立數(shù)據(jù)可視化,第五步 建立安全層,為大數(shù)據(jù)平臺提供安全保護系統(tǒng),對外提供統(tǒng)一的服務(wù)接口,用戶通過統(tǒng)一數(shù) 據(jù)訪問接口或統(tǒng)一門戶頁面來訪問大數(shù)據(jù)服務(wù)平臺。3. 如權(quán)利要求1所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺,其特 征在于:利用隱馬爾科夫算法找到車輛行駛的路網(wǎng)路段,并通過地圖數(shù)據(jù)找到汽車行駛的 路段信息,最后將定位數(shù)據(jù)中行駛速度輸入時空限速模型中,最終得出車輛是否超速的判 斷。4. 如權(quán)利要求1所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺,其特 征在于:利用大數(shù)據(jù)平臺實現(xiàn)支持向量機的算法,其中包括,第一步、將原始數(shù)據(jù)進行標準 化消除量綱的影響;第二步、通過原始數(shù)據(jù)中時間、速度和里程計算平均速度、平均加速度 和啟動加速度,并作為訓(xùn)練樣本;第三步、將大量的訓(xùn)練樣本上傳到Hadoop分布式文件系統(tǒng) 中并做分塊,每個節(jié)點啟動Hadoop分布式處理平臺的Map任務(wù)對塊中數(shù)據(jù)進行序列最小優(yōu) 化訓(xùn)練算出每個塊數(shù)據(jù)的支持向量,最后將各個節(jié)點訓(xùn)練處的支持向量輸入到Hadoop分布 式處理平臺的Reduce任務(wù)中交于SM0算法訓(xùn)練得到最終的支持向量;第四步、利用第三步中 的支持向量得到分類器,并利用分類器對車輛是否超載進行判別。5. 如權(quán)利要求1所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺,其特 征在于:建立大數(shù)據(jù)平臺下線性回歸模型,其中包括,第一步、利用大數(shù)據(jù)平臺找到該路段 內(nèi)所有汽車行駛的數(shù)據(jù),并計算出相鄰兩個數(shù)據(jù)之間速度差值;第二步、利用統(tǒng)計線性回歸 算法得到某段道路上汽車以某個起始車速V。和行駛至下一時刻車速變化量△ v為輸入,以 汽車在該段時間內(nèi)行駛距離S為輸出,并統(tǒng)計該路段內(nèi)所有行駛汽車的數(shù)據(jù),第三步、計算 回歸方程,得到該路段內(nèi)汽車速度變化量和行駛距離的模型S = f(Av,v。),最后利用該方 程判別該汽車發(fā)生急加速和急減速的概率,判斷規(guī)則為第i量汽車的距離與模型距離誤差e =| Is-s1! |越大則說明汽車發(fā)生急加速和急減速概率越大,越小則說明概率越低。6. 如權(quán)利要求1所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺,其特 征在于:所述的計算車輛風(fēng)險概率的步驟中包括,第一步度量風(fēng)險概率,第二步建立風(fēng)險概 率模型,首先對歷史數(shù)據(jù)進行預(yù)處理,包括對數(shù)據(jù)進行聚類得到1個簇即(^={1:, 12……Ιι}其中^是其中的一個簇,然后針對聚類結(jié)果構(gòu)造預(yù)測模型包括求簇的平均風(fēng)險 概率和特征向量與平均向量的相似系數(shù),接著對風(fēng)險概率進行預(yù)測。7. 如權(quán)利要求6所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺,其特 征在于:在對數(shù)據(jù)進行聚類的步驟中,采用自組織映射的神經(jīng)網(wǎng)絡(luò)聚類算法,使用大規(guī)模并 行計算框架Mapreduce并行計算框架對數(shù)據(jù)進行計算。8. 如權(quán)利要求7所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺,其特 征在于:在使用大規(guī)模并行計算框架Mapreduce并行計算框架對數(shù)據(jù)進行計算的步驟中,在 Map階段計算獲勝神經(jīng)元并計算權(quán)值修改量,Reduce階段對相同的獲勝神經(jīng)元,統(tǒng)計與其連 接的每個權(quán)值的總體更新量,然后對權(quán)值進行更新。9. 如權(quán)利要求4所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺,其特 征在于:在實現(xiàn)支持向量機的算法中,利用歐式距離態(tài)度量兩個向量之間的相似度。
【文檔編號】G06K9/62GK106095963SQ201610430864
【公開日】2016年11月9日
【申請日】2016年6月17日
【發(fā)明人】文巨峰, 羅贊文, 穆祥強, 許偉
【申請人】上海經(jīng)達信息科技股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1