互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺的制作方法

文檔序號：10725088閱讀：432來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺的制作方法
【專利摘要】一種互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺，對車輛駕駛行為、汽車行駛風(fēng)險概率進行分析，其中包括步驟一、通過大數(shù)據(jù)平臺存儲汽車一段時間內(nèi)的行駛數(shù)據(jù)并采用MapReduce框架對這些數(shù)據(jù)進行處理和分析，步驟二、基于大數(shù)據(jù)平臺下對數(shù)據(jù)進行處理過后統(tǒng)計出某個區(qū)域和時間段內(nèi)汽車非正常駕駛次數(shù)，包括超速、超載、急加速急減速、疲勞駕駛、夜間行駛，步驟三、對非正常駕駛行為統(tǒng)計后，利用自組織映射神經(jīng)網(wǎng)絡(luò)算法計算車輛風(fēng)險概率，并對后續(xù)車輛行駛風(fēng)險進行預(yù)測。本發(fā)明通過采集車輛的北斗/GPS導(dǎo)航數(shù)據(jù)，利用大數(shù)據(jù)平臺對采集的數(shù)據(jù)進行預(yù)處理，在對數(shù)據(jù)進一步數(shù)據(jù)挖掘，可以分析和判斷駕駛者的駕駛行為。
【專利說明】
互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺
技術(shù)領(lǐng)域：
[0001] 本發(fā)明涉及物理領(lǐng)域，尤其涉及數(shù)據(jù)的存儲與處理技術(shù)，特別是一種互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺。
【背景技術(shù)】：
[0002] 隨著信息化程度提高，生活中充滿著海量信息，在這些信息中有些與我們的生活息息相關(guān)，分析與挖掘它們可以為我們改善生活，服務(wù)公眾，提高社會信息化程度，為智慧城市及信息化的動態(tài)管理方案提供了新的契機。
[0003] 隨著道路行駛的車輛不斷增加，因人的違規(guī)駕駛導(dǎo)致人員財產(chǎn)損失的風(fēng)險也在不斷增加。不同地段區(qū)域內(nèi)車輛出現(xiàn)違規(guī)駕駛行為的風(fēng)險也不同，所以不能將簡單的將風(fēng)險平均，要因地而異。這就是需要考慮到汽車行駛的環(huán)境因素，所以首先要對汽車行駛區(qū)域進行劃分然后分析出每個區(qū)域內(nèi)的風(fēng)險概率。現(xiàn)有技術(shù)中，不能從生活中的海量信息分析車輛駕駛行為。

【發(fā)明內(nèi)容】
：
[0004] 本發(fā)明的目的在于提供一種互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù) 平臺，所述的這種互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺要解決現(xiàn)有技術(shù)中不能從生活中的海量信息分析車輛駕駛行為的技術(shù)問題。
[0005] 本發(fā)明的這種互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺，包括對車輛駕駛行為、汽車行駛風(fēng)險概率進行分析，其中包括以下步驟：
[0006] 步驟一、通過大數(shù)據(jù)平臺存儲汽車一段時間內(nèi)的行駛數(shù)據(jù)并采用MapReduce框架對這些數(shù)據(jù)進行處理和分析，
[0007] 步驟二、基于大數(shù)據(jù)平臺下對數(shù)據(jù)進行處理過后統(tǒng)計出某個區(qū)域和時間段內(nèi)汽車非正常駕駛次數(shù)，包括超速、超載、急加速急減速、疲勞駕駛、夜間行駛，
[0008] 步驟三、對非正常駕駛行為統(tǒng)計后，利用自組織映射神經(jīng)網(wǎng)絡(luò)算法計算車輛風(fēng)險概率，并對后續(xù)車輛行駛風(fēng)險進行預(yù)測。
[0009] 進一步的，對汽車駕駛數(shù)據(jù)進行處理分析，其中包括，第一步建立數(shù)據(jù)存儲層，主要方案為基于Hadoop分布式文件系統(tǒng)(簡稱HDFS)存儲方案和基于HDFS+分布式面向列開源數(shù)據(jù)庫(簡稱HBase)技術(shù)存儲方案;第二步建立數(shù)據(jù)處理層，在數(shù)據(jù)處理層中采用大規(guī)模并行計算框架MapReduce (簡稱MR)框架來處理原始數(shù)據(jù)，第三步建立數(shù)據(jù)分析層，對數(shù)據(jù)進一步分析、建模和挖掘，第四步建立數(shù)據(jù)可視化，第五步建立安全層，為大數(shù)據(jù)平臺提供安全保護系統(tǒng)，對外提供統(tǒng)一的服務(wù)接口，用戶通過統(tǒng)一數(shù)據(jù)訪問接口或統(tǒng)一門戶頁面來訪問大數(shù)據(jù)服務(wù)平臺。
[0010] 進一步的，利用隱馬爾科夫算法找到車輛行駛的路網(wǎng)路段，并通過地圖數(shù)據(jù)找到汽車行駛的路段信息，最后將定位數(shù)據(jù)中行駛速度輸入時空限速模型中，最終得出車輛是否超速的判斷。
[0011] 進一步的，利用大數(shù)據(jù)平臺實現(xiàn)支持向量機的算法，其中包括，第一步、將原始數(shù) 據(jù)進行標準化消除量綱的影響；第二步、通過原始數(shù)據(jù)中時間、速度和里程計算平均速度、平均加速度和啟動加速度，并作為訓(xùn)練樣本;第三步、將大量的訓(xùn)練樣本上傳到HDFS中并做分塊，每個節(jié)點會啟動HDFS的Map任務(wù)對塊中數(shù)據(jù)進行序列最小優(yōu)化(簡稱SM0)訓(xùn)練算出每個塊數(shù)據(jù)的支持向量，最后將各個節(jié)點訓(xùn)練處的支持向量輸入到HDFS的Reduce任務(wù)中交于 SM0算法訓(xùn)練得到最終的支持向量;第四步、利用第三步中的支持向量得到分類器，并利用分類器對車輛是否超載進行判別。
[0012] 進一步的，建立大數(shù)據(jù)平臺下線性回歸模型，其中包括，第一步、利用大數(shù)據(jù)平臺找到該路段內(nèi)所有汽車行駛的數(shù)據(jù)，并計算出相鄰兩個數(shù)據(jù)之間速度差值;第二步、利用統(tǒng) 計線性回歸算法得到某段道路上汽車以某個起始車速V。和行駛至下一時刻車速變化量A v 為輸入，以汽車在該段時間內(nèi)行駛距離S為輸出，并統(tǒng)計該路段內(nèi)所有行駛汽車的數(shù)據(jù)，第三步、計算回歸方程，得到該路段內(nèi)汽車速度變化量和行駛距離的模型S = f(Av，v。），最后利用該方程判別該汽車發(fā)生急加速和急減速的概率，判斷規(guī)則為第i量汽車的距離與模型距離誤差e=| IS-S1! |越大則說明汽車發(fā)生急加速和急減速概率越大，越小則說明概率越低。
[0013] 具體的，首先通過大數(shù)據(jù)平臺從原始數(shù)據(jù)中找出某個路段所有時間所有車輛的行駛數(shù)據(jù)，對這些數(shù)據(jù)進行處理得出相鄰兩點速度的差值，接著利用回歸分析方法得出回歸模型。通過回歸模型得出汽車在該路段發(fā)生急加速和急減速的概率。設(shè)同一個路段上兩個時間點的速度差為A v，汽車的每個時間點的初始速度為V。。因為汽車在一段時間內(nèi)行駛距離與速度差和初始速度成線性關(guān)系，所以可以該回歸模型為
[0014] S: = h0 + ^Αν +1)^0 ( 1)
[0015] 其中為變量Δν和VQ的偏回歸系數(shù)。
[0016] 通過訓(xùn)練數(shù)據(jù)和最小二乘原理得出偏回歸系數(shù)的值，并利用方差分析對得出的模型進行檢驗，最后根據(jù)e = |s-S|的大小得出汽車發(fā)生急加速和急減速的概率。其中S為汽車實際的行駛距離，f為滿足回歸模型下的行駛距離。
[0017] 進一步的，所述的計算車輛風(fēng)險概率的步驟中包括，第一步度量風(fēng)險概率，第二步建立風(fēng)險概率模型，首先對歷史數(shù)據(jù)進行預(yù)處理，包括對數(shù)據(jù)進行聚類得到1個簇即C n = {I1J2……Ιι}其中^是其中的一個簇，然后針對聚類結(jié)果構(gòu)造預(yù)測模型包括求簇的平均風(fēng)險概率和特征向量與平均向量的相似系數(shù)，接著對風(fēng)險概率進行預(yù)測。
[0018] 具體的，風(fēng)險概率是風(fēng)險發(fā)生可能性的百分比，是對事物狀態(tài)發(fā)生可能性的衡量。汽車在同一區(qū)域內(nèi)行駛數(shù)據(jù)具有較高的相似性，不同區(qū)域內(nèi)行駛數(shù)據(jù)差別性比較大。以一個區(qū)域為一個簇，將汽車行駛數(shù)據(jù)按特征點進行聚類，可以得到不同區(qū)域內(nèi)的行駛數(shù)據(jù)。每一個特征點(特征向量)都與簇中的點有關(guān)，并假設(shè)簇中第i個特征向量為XUieN)，那么風(fēng) 險概率可以表示為
[0020]其中| |Ν:(χ4 I I表示區(qū)域r中所有點的個數(shù)，Nr#)為點xWr為半徑的領(lǐng)域。U(Nr (X1))為該簇中安全風(fēng)險發(fā)生的次數(shù)。有(2)可以看出，風(fēng)險概率就是該簇中所有點的平均概率。也可以表示為
[0021] P(X')^s{X\X)xP,(X ) ( 3 )
[0022] 其中λ'(Α'叉)表示特征點X1與所有點的平均向量的相似度。
[0023]其中，風(fēng)險概率預(yù)測模型確定包括三部分：
[0024]對歷史數(shù)據(jù)的預(yù)處理
[0025] (1)從歷史數(shù)據(jù)中抽象出數(shù)據(jù)屬性，在汽車駕駛行為數(shù)據(jù)包括車牌號、經(jīng)煒度、行駛速度、行駛方向、行駛時間。
[0026] (2)對歷史數(shù)據(jù)進行聚類得到1個簇即(^={1^12……Ιι}，其中是其中的一個簇，假設(shè)簇中有k個特征向量即（={4,4....4卜其中^是簇中第」個特征向量。
[0027] 構(gòu)造預(yù)測模型
[0028]聚類得到結(jié)果后對每個簇中的特征向量計算風(fēng)險概率，步驟如下：
[0029] (1)計算簇Ii中平均風(fēng)險概率。
[0031] 其中，|h|是簇I沖元素的個數(shù)，如果表示的點為風(fēng)險發(fā)生，那么￡({') = 1否則為〇〇
[0032] (2)計算簇中所有點的平均特征向量果
[0033] (3)計算簇中每個特征向量Z/與乂的相似系數(shù)sCZ/,兄）
[0034] (4)計算每個特征向量的風(fēng)險概率P (λ'/)
[0035] 5.3風(fēng)險概率預(yù)測
[0036] 計算得到風(fēng)險概率模型之后就可以對新的汽車數(shù)據(jù)進行預(yù)測，步驟如下：
[0037] (1)對于新的汽車行駛數(shù)據(jù)乂1)進行聚類分析；
[0038] (2)-般聚類后會將新的數(shù)據(jù)聚類到某一簇中，然后計算該數(shù)據(jù)與平均向量筆的相似系數(shù)；
[0039] (3)那么新的數(shù)據(jù)點的概率計算公式為：
[0040] = ^ Α^χΡ?.?.) ( 5)
[0041] 進一步的，在對數(shù)據(jù)進行聚類的步驟中，采用基于hadoop的自組織映射的神經(jīng)網(wǎng) 絡(luò)聚類算法，使用Mapreduce并行計算框架對數(shù)據(jù)進行計算。
[0042] 進一步的，在使用Mapreduce并行計算框架對數(shù)據(jù)進行計算的步驟中，在Map階段計算獲勝神經(jīng)元并計算權(quán)值修改量，Reducer階段對相同的獲勝神經(jīng)元，統(tǒng)計與其連接的每個權(quán)值的總體更新量，然后對權(quán)值進行更新。
[0043]進一步的，在實現(xiàn)支持向量機的算法中，利用歐式距離態(tài)度量兩個向量之間的相似度。
[0044]具體的，在上述基于hadoop的自組織映射(S0M)的神經(jīng)網(wǎng)絡(luò)聚類算法中，采用競爭學(xué)習(xí)實現(xiàn)內(nèi)部自適應(yīng)和自組織的改變內(nèi)部結(jié)構(gòu)，即在接受外界輸入后會自動地分為不同區(qū) 域，每個區(qū)域?qū)τ谳斎攵加胁煌捻憫?yīng)特征，而且這個過程是自動完成的。該算法的步驟如下：
[0045] (1)初始化和歸一化。首先對當前輸入向量和競爭層中神經(jīng)元權(quán)值向量Wi進行歸一化處理，并建立初始優(yōu)勝域Λ^(〇)，并對增益μ(〇)進行賦值。
[0046] (2)尋找獲勝神經(jīng)元。將輸入向量與競爭層中所有響應(yīng)的權(quán)值向量進行相似性比較，將最相思的權(quán)值向量最為獲勝神經(jīng)元。在數(shù)學(xué)中兩個向量最相似則他們的點積越大可以表示為下面公式：
[0048] (3)對優(yōu)勝領(lǐng)域內(nèi)節(jié)點權(quán)值調(diào)整
[00511其中，y(t)為增益并隨著時間下降到0。
[0052] (4)如果增益下降到設(shè)定的閾值μΜη那么結(jié)束流程，否則繼續(xù)輸入數(shù)據(jù)從第一步開始新的流程計算。
[0053] 將上述算法運行在Hadoop平臺運行，其實施步驟如下：
[0054] Map 階段
[0055] 輸入鍵值對〈key，value〉，其中key表示樣本序號value表示樣本特征集合。
[0056]根據(jù)競爭學(xué)習(xí)原則計算出競爭層的輸出值。
[0057]判定獲勝神經(jīng)元，將其狀態(tài)判定為1，其他狀態(tài)判定為0。設(shè)置flag為獲勝神經(jīng)元在競爭層的位置。
[0058]計算與獲勝神經(jīng)元相連接的各權(quán)值更新量，其他權(quán)值保持不變。
[0059]輸出鍵值對其中key表示flag，value表示與獲勝神經(jīng)元相連接的權(quán)值更新量。
[0060] Reducer 階段
[0061 ]接受map函數(shù)的輸出作為re du c e函數(shù)的輸入，輸入key表示獲勝神經(jīng)元的位置， values表示與獲勝神經(jīng)元相連接的權(quán)值更新量的結(jié)合。
[0062]累計獲得每個權(quán)值的總體更新量，并計算平均更新量。
[0063]調(diào)整相應(yīng)的網(wǎng)絡(luò)權(quán)值。
[0064] 輸出鍵值對，key表示權(quán)值更新狀態(tài)，value表示更新后的網(wǎng)絡(luò)權(quán)值。
[0065]更新全局向量，并重復(fù)MapReduce過程，直到權(quán)值向量和獲勝樣本誤差小于設(shè)定的閾值則結(jié)束。
[0066]從上述計算步驟中可以看出S0M網(wǎng)絡(luò)的學(xué)習(xí)可以自適應(yīng)的根據(jù)樣本內(nèi)在的聯(lián)系進行聚類，輸出神經(jīng)元權(quán)值向量Wi逐漸的向獲勝樣本靠近，權(quán)值向量集{Wi| i = l,2. . .1}看成所有樣本的聚類中心。相似性度量方法描述如下：
[0067]特征向量X= {xi,X2. . . .xn}屬于特征空間某個簇Ii，該特征向量與平均向量爲 (聚類中心)相似系數(shù)可表示為，
[0069] 從式(9)中可以看出度量向量之間相似度使用歐式距離來測量的，兩個向量越相似則兄)值越大最大值為1。
[0070] 本發(fā)明和已有技術(shù)相比較，其效果是積極和明顯的。本發(fā)明通過采集車輛的北斗/ GPS導(dǎo)航數(shù)據(jù)，利用大數(shù)據(jù)平臺對采集的數(shù)據(jù)進行預(yù)處理，在對數(shù)據(jù)進一步數(shù)據(jù)挖掘，可以分析和判斷駕駛者的駕駛行為。
【附圖說明】：
[0071] 圖1是本發(fā)明的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺的框架圖。
[0072] 圖2是本發(fā)明中的基于自組織映射神經(jīng)網(wǎng)絡(luò)算法流程圖。
【具體實施方式】：
[0073] 實施例1:
[0074] 如圖1和圖2所示，本發(fā)明的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù) 平臺，包括四個部分:數(shù)據(jù)存儲層、數(shù)據(jù)處理層、數(shù)據(jù)分析層和數(shù)據(jù)可視化層。
[0075] 判斷汽車超速，第一步、利用隱馬爾科夫算法找到車輛行駛的最佳路段;第二步、利用地圖數(shù)據(jù)找到汽車行駛的道路類型對應(yīng)的限速大小；第三步、將獲得數(shù)據(jù)中行駛速度大小和路段限速大小進行對比判別車輛是否超速。
[0076] 判斷汽車超載，第一步、將原始數(shù)據(jù)進行標準化消除量綱的影響；第二步、通過原始數(shù)據(jù)中時間、速度和里程計算平均速度、平均加速度和啟動加速度，并作為訓(xùn)練樣本;第三步、利用第二步中的訓(xùn)練樣本訓(xùn)練出分類器;第四步、利用分類器對車輛是否超載進行判別。
[0077] 急加速與急減速判斷，首先通過大數(shù)據(jù)平臺從原始數(shù)據(jù)中找出某個路段所有時間所有車輛的行駛數(shù)據(jù)，對這些數(shù)據(jù)進行處理得出相鄰兩點速度的差值，接著利用回歸分析方法得出回歸模型。通過回歸模型得出汽車在該路段發(fā)生急加速和急減速的概率。設(shè)同一個路段上兩個時間點的速度差為Α V，汽車的每個時間點的初始速度為ν。。因為汽車在一段時間內(nèi)行駛距離與速度差和初始速度成線性關(guān)系，該回歸模型為：
[0078] S = h, + b,Av +(1)
[0079] 其中b。，!^，^為變量Δν和VQ的偏回歸系數(shù)。
[0080] 通過訓(xùn)練數(shù)據(jù)和最小二乘原理得出偏回歸系數(shù)的值，并利用方差分析對得出的模型進行檢驗，最后根據(jù)β = ||5* -1||的大小得出汽車發(fā)生急加速和急減速的概率。其中S為汽車實際的行駛距離，左為滿足回歸模型下的行駛距離。
[0081] 風(fēng)險概率是風(fēng)險發(fā)生可能性的百分比，是對事物狀態(tài)發(fā)生可能性的衡量。汽車在同一區(qū)域內(nèi)行駛數(shù)據(jù)具有較高的相似性，不同區(qū)域內(nèi)行駛數(shù)據(jù)差別性比較大。以一個區(qū)域為一個簇，將汽車行駛數(shù)據(jù)按特征點進行聚類，可以得到不同區(qū)域內(nèi)的行駛數(shù)據(jù)。每一個特征點(特征向量)都與簇中的點有關(guān)，并假設(shè)簇中第i個特征向量為xUieN)，那么風(fēng)險概率可以表示為
[0083] 其中| |Ν:(χ4 I I表示區(qū)域r中所有點的個數(shù)，Nr#)為點xWr為半徑的領(lǐng)域。U(Nr (X1))為該簇中安全風(fēng)險發(fā)生的次數(shù)。有（1)可以看出，風(fēng)險概率就是該簇中所有點的平均概率。也可以表示為
[0084] Pr(X')^s(X\X)xP(X ) 13)
[0085] 其中 <妒夕)表示特征點X1與所有點的平均向量的相似度。
[0086]其中，風(fēng)險概率預(yù)測模型需要分三個部分：
[0087]對歷史數(shù)據(jù)的預(yù)處理
[0088] 從歷史數(shù)據(jù)中抽象出數(shù)據(jù)屬性，在汽車駕駛行為數(shù)據(jù)包括車牌號、經(jīng)煒度、行駛速度、行駛方向、行駛時間。
[0089] 對歷史數(shù)據(jù)進行聚類得到1個簇即(^={1^12.....IU，其中^是其中的一個簇，假設(shè)簇中有k個特征向量即.....Zf卜其中X/是簇中第j個特征向量。
[0090] 構(gòu)造預(yù)測模型
[0091] 聚類得到結(jié)果后對每個簇中的特征向量計算風(fēng)險概率，步驟如下：
[0092] (1)計算簇Ii中平均風(fēng)險概率。
[0094] 其中，| |是簇I沖元素的個數(shù)，如果X/表示的點為風(fēng)險發(fā)生，那么￡(Λ7 )=丨否則為0〇
[0095] (2)計算簇I i中所有點的平均特征向量尾
[0096] (3)計算簇中每個特征向量與萬的相似系數(shù)<巧,屬）
[0097] (4)計算每個特征向量的風(fēng)險概率/3 (Λ7)
[0098] 風(fēng)險概率預(yù)測
[0099] 計算得到風(fēng)險概率模型之后就可以對新的汽車數(shù)據(jù)進行預(yù)測，步驟如下：
[0100] 對于新的汽車行駛數(shù)據(jù)乂1)進行聚類分析；
[0101] 一般聚類后會將新的數(shù)據(jù)聚類到某一簇中，然后計算該數(shù)據(jù)與平均向量粟的相似系數(shù)；
[0102] 新的數(shù)據(jù)點的概率計算公式為：
[0103] P(X-'·) = ,v(X,X：)x P(X.) ( 5 )
[0104] 求數(shù)據(jù)點的風(fēng)險概率模型的關(guān)鍵技術(shù)是如何利用聚類算法對歷史數(shù)據(jù)進行聚類。此處采用基于自組織映射(S0M)的神經(jīng)網(wǎng)絡(luò)聚類算法。該算法采用競爭學(xué)習(xí)實現(xiàn)內(nèi)部自適應(yīng)和自組織的改變內(nèi)部結(jié)構(gòu)，即在接受外界輸入后會自動地分為不同區(qū)域，每個區(qū)域?qū)?于輸入都有不同的響應(yīng)特征，而且這個過程是自動完成的。該算法的步驟如下：
[0105] 初始化和歸一化。首先對當前輸入向量和競爭層中神經(jīng)元權(quán)值向量Wi進行歸一化處理，并建立初始優(yōu)勝域&*(0)，并對增益μ(0)進行賦值。
[0106] 尋找獲勝神經(jīng)元。將輸入向量與競爭層中所有響應(yīng)的權(quán)值向量進行相似性比較，將最相思的權(quán)值向量最為獲勝神經(jīng)元。在數(shù)學(xué)中兩個向量最相似則他們的點積越大可以表示為下面公式：
[0108]對優(yōu)勝領(lǐng)域內(nèi)節(jié)點權(quán)值調(diào)整
[0111] 其中，y(t)為增益并隨著時間下降到0。
[0112] 如果增益下降到設(shè)定的閾值μηιη那么結(jié)束流程，否則繼續(xù)輸入數(shù)據(jù)從第一步開始新的流程計算。
[0113] 將上述算法運行在Hadoop平臺運行，其實施步驟如下：
[0114] Map 階段
[0115] 輸入鍵值對〈key，value〉，其中key表示樣本序號value表示樣本特征集合
[0116]根據(jù)競爭學(xué)習(xí)原則計算出競爭層的輸出值。
[0117] 判定獲勝神經(jīng)元，將其狀態(tài)判定為1，其他狀態(tài)判定為0。設(shè)置flag為獲勝神經(jīng)元在競爭層的位置。
[0118] 計算與獲勝神經(jīng)元相連接的各權(quán)值更新量，其他權(quán)值保持不變。
[0119] 輸出鍵值對其中key表示flag，value表示與獲勝神經(jīng)元相連接的權(quán)值更新量。
[0120] Reducer 階段
[0121 ]接受map函數(shù)的輸出作為re du c e函數(shù)的輸入，輸入key表示獲勝神經(jīng)元的位置， values表示與獲勝神經(jīng)元相連接的權(quán)值更新量的結(jié)合。
[0122] 累計獲得每個權(quán)值的總體更新量，并計算平均更新量。
[0123] 調(diào)整相應(yīng)的網(wǎng)絡(luò)權(quán)值。
[0124] 輸出鍵值對，key表示權(quán)值更新狀態(tài)，value表示更新后的網(wǎng)絡(luò)權(quán)值。
[0125] 更新全局向量，并重復(fù)MapReduce過程，直到權(quán)值向量和獲勝樣本誤差小于設(shè)定的閾值則結(jié)束。
[0126] 從上述計算步驟中可以看出S0M網(wǎng)絡(luò)的學(xué)習(xí)可以自適應(yīng)的根據(jù)樣本內(nèi)在的聯(lián)系進行聚類，輸出神經(jīng)元權(quán)值向量Wi逐漸的向獲勝樣本靠近，那么權(quán)值向量集{Wi I i = l ,2. .. 1} 就可以看成所有樣本的聚類中心。相似性度量方法：
[0127] 特征向量X= {xi，X2. . . .xn}屬于特征空間某個簇Ii，該特征向量與平均向量足 (聚類中心)相似系數(shù)可表示為
[0129]從式(9)中可以看出度量向量之間相似度使用歐式距離來測量的，兩個向量越相似則、( Α-?,.)值越大最大值為1。
【主權(quán)項】
1. 一種互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺，其特征在于，其特征在于:對車輛駕駛行為、汽車行駛風(fēng)險概率進行分析，其中包括以下步驟：步驟一、通過大數(shù)據(jù)平臺存儲汽車一段時間內(nèi)的行駛數(shù)據(jù)并采用MapReduce框架對這些數(shù)據(jù)進行處理和分析，步驟二、基于大數(shù)據(jù)平臺下對數(shù)據(jù)進行處理過后統(tǒng)計出某個區(qū)域和時間段內(nèi)汽車非正常駕駛次數(shù)，包括超速、超載、急加速急減速、疲勞駕駛、夜間行駛，步驟三、對非正常駕駛行為統(tǒng)計后，利用自組織映射神經(jīng)網(wǎng)絡(luò)算法計算車輛風(fēng)險概率，并對后續(xù)車輛行駛風(fēng)險進行預(yù)測。2. 如權(quán)利要求1所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺，其特征在于:對汽車駕駛數(shù)據(jù)進行處理分析，其中包括，第一步建立數(shù)據(jù)存儲層，基于Hadoop分布式文件系統(tǒng)存儲方案和基于Hadoop分布式文件系統(tǒng)+分布式面向列開源數(shù)據(jù)庫技術(shù)存儲方案;第二步建立數(shù)據(jù)處理層，在數(shù)據(jù)處理層中采用大規(guī)模并行計算框架來處理原始數(shù)據(jù)，第三步建立數(shù)據(jù)分析層，對數(shù)據(jù)進一步分析、建模和挖掘，第四步建立數(shù)據(jù)可視化，第五步建立安全層，為大數(shù)據(jù)平臺提供安全保護系統(tǒng)，對外提供統(tǒng)一的服務(wù)接口，用戶通過統(tǒng)一數(shù) 據(jù)訪問接口或統(tǒng)一門戶頁面來訪問大數(shù)據(jù)服務(wù)平臺。3. 如權(quán)利要求1所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺，其特征在于:利用隱馬爾科夫算法找到車輛行駛的路網(wǎng)路段，并通過地圖數(shù)據(jù)找到汽車行駛的路段信息，最后將定位數(shù)據(jù)中行駛速度輸入時空限速模型中，最終得出車輛是否超速的判斷。4. 如權(quán)利要求1所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺，其特征在于:利用大數(shù)據(jù)平臺實現(xiàn)支持向量機的算法，其中包括，第一步、將原始數(shù)據(jù)進行標準化消除量綱的影響；第二步、通過原始數(shù)據(jù)中時間、速度和里程計算平均速度、平均加速度和啟動加速度，并作為訓(xùn)練樣本;第三步、將大量的訓(xùn)練樣本上傳到Hadoop分布式文件系統(tǒng) 中并做分塊，每個節(jié)點啟動Hadoop分布式處理平臺的Map任務(wù)對塊中數(shù)據(jù)進行序列最小優(yōu) 化訓(xùn)練算出每個塊數(shù)據(jù)的支持向量，最后將各個節(jié)點訓(xùn)練處的支持向量輸入到Hadoop分布式處理平臺的Reduce任務(wù)中交于SM0算法訓(xùn)練得到最終的支持向量;第四步、利用第三步中的支持向量得到分類器，并利用分類器對車輛是否超載進行判別。5. 如權(quán)利要求1所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺，其特征在于:建立大數(shù)據(jù)平臺下線性回歸模型，其中包括，第一步、利用大數(shù)據(jù)平臺找到該路段內(nèi)所有汽車行駛的數(shù)據(jù)，并計算出相鄰兩個數(shù)據(jù)之間速度差值;第二步、利用統(tǒng)計線性回歸算法得到某段道路上汽車以某個起始車速V。和行駛至下一時刻車速變化量△ v為輸入，以汽車在該段時間內(nèi)行駛距離S為輸出，并統(tǒng)計該路段內(nèi)所有行駛汽車的數(shù)據(jù)，第三步、計算回歸方程，得到該路段內(nèi)汽車速度變化量和行駛距離的模型S = f(Av，v。），最后利用該方程判別該汽車發(fā)生急加速和急減速的概率，判斷規(guī)則為第i量汽車的距離與模型距離誤差e =| Is-s1! |越大則說明汽車發(fā)生急加速和急減速概率越大，越小則說明概率越低。6. 如權(quán)利要求1所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺，其特征在于:所述的計算車輛風(fēng)險概率的步驟中包括，第一步度量風(fēng)險概率，第二步建立風(fēng)險概率模型，首先對歷史數(shù)據(jù)進行預(yù)處理，包括對數(shù)據(jù)進行聚類得到1個簇即(^={1:， 12……Ιι}其中^是其中的一個簇，然后針對聚類結(jié)果構(gòu)造預(yù)測模型包括求簇的平均風(fēng)險概率和特征向量與平均向量的相似系數(shù)，接著對風(fēng)險概率進行預(yù)測。7. 如權(quán)利要求6所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺，其特征在于:在對數(shù)據(jù)進行聚類的步驟中，采用自組織映射的神經(jīng)網(wǎng)絡(luò)聚類算法，使用大規(guī)模并行計算框架Mapreduce并行計算框架對數(shù)據(jù)進行計算。8. 如權(quán)利要求7所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺，其特征在于:在使用大規(guī)模并行計算框架Mapreduce并行計算框架對數(shù)據(jù)進行計算的步驟中，在 Map階段計算獲勝神經(jīng)元并計算權(quán)值修改量，Reduce階段對相同的獲勝神經(jīng)元，統(tǒng)計與其連接的每個權(quán)值的總體更新量，然后對權(quán)值進行更新。9. 如權(quán)利要求4所述的互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺，其特征在于:在實現(xiàn)支持向量機的算法中，利用歐式距離態(tài)度量兩個向量之間的相似度。
【文檔編號】G06K9/62GK106095963SQ201610430864
【公開日】2016年11月9日
【申請日】2016年6月17日
【發(fā)明人】文巨峰, 羅贊文, 穆祥強, 許偉
【申請人】上海經(jīng)達信息科技股份有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：文巨峰;羅贊文;穆祥強;許偉;
技術(shù)所有人：上海經(jīng)達信息科技股份有限公司;
我是此專利的發(fā)明人

上一篇：一種對數(shù)據(jù)進行可視化歸檔與搜索的方法
上一篇：加權(quán)模糊規(guī)則提取算法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

互聯(lián)網(wǎng)+時代下的車輛駕駛行為分析大數(shù)據(jù)公共服務(wù)平臺的制作方法