亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于svm的軌道交通故障診斷方法及系統(tǒng)的制作方法

文檔序號(hào):6535334閱讀:237來(lái)源:國(guó)知局
一種基于svm的軌道交通故障診斷方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種基于SVM的軌道交通故障診斷方法及系統(tǒng),該方法包括:采集軌道交通的歷史監(jiān)測(cè)數(shù)據(jù)及實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),并傳輸?shù)綌?shù)據(jù)分析服務(wù)器中,數(shù)據(jù)分析服務(wù)器對(duì)其進(jìn)行預(yù)處理、特征選擇、數(shù)據(jù)向量化和模型訓(xùn)練,然后根據(jù)由歷史監(jiān)測(cè)數(shù)據(jù)得到的分類模型,對(duì)實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)進(jìn)行計(jì)算分析和分類,判斷是否有故障并得出故障產(chǎn)生的原因。該系統(tǒng)包括數(shù)據(jù)歸集組件、數(shù)據(jù)存儲(chǔ)組件、數(shù)據(jù)預(yù)處理組件、特征選擇組件、數(shù)據(jù)向量化組件、模型訓(xùn)練組件和實(shí)時(shí)數(shù)據(jù)分析組件。本發(fā)明通過(guò)自動(dòng)化的監(jiān)測(cè)手段來(lái)代替人工在海量的監(jiān)測(cè)信號(hào)中進(jìn)行故障的判斷和分析,可以大量節(jié)約的人力成本以及故障原因分析的時(shí)間,為后續(xù)的維修、救援等工作提供時(shí)間保障。
【專利說(shuō)明】—種基于SVM的軌道交通故障診斷方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明提供一種基于SVM的軌道交通故障診斷方法及系統(tǒng),涉及鐵路信號(hào)數(shù)據(jù)、鐵路通信數(shù)據(jù)、鐵路知識(shí)數(shù)據(jù)、系統(tǒng)報(bào)警數(shù)據(jù)、機(jī)器學(xué)習(xí)、SVM (支持向量機(jī))、等【技術(shù)領(lǐng)域】,用以解決軌道交通監(jiān)測(cè)數(shù)據(jù)的數(shù)據(jù)分析問(wèn)題。
【背景技術(shù)】
[0002]目前,軌道交通(國(guó)有鐵路、企業(yè)鐵路和城市軌道交通)領(lǐng)域、監(jiān)測(cè)維護(hù)產(chǎn)品主要有三類:CSM(信號(hào)集中監(jiān)測(cè)系統(tǒng))、各設(shè)備維護(hù)機(jī)、通信網(wǎng)管系統(tǒng)。為了提高我國(guó)鐵路信號(hào)系統(tǒng)設(shè)備的現(xiàn)代化維修水平,從90年代開(kāi)始,先后自主研制了 TJWX-1型和TJWX-2000型等不斷升級(jí)中的信號(hào)集中監(jiān)測(cè)CSM系統(tǒng)。目前大部分車站都采用了計(jì)算機(jī)監(jiān)測(cè)系統(tǒng),實(shí)現(xiàn)了對(duì)車站信號(hào)設(shè)備狀態(tài)的實(shí)時(shí)監(jiān)測(cè),并通過(guò)監(jiān)測(cè)與記錄信號(hào)設(shè)備的主要運(yùn)行狀態(tài),為電務(wù)部門掌握設(shè)備的當(dāng)前狀態(tài)和進(jìn)行事故分析提供了基本依據(jù),發(fā)揮了重要作用。并且,對(duì)城市軌道交通信號(hào)設(shè)備,集中監(jiān)測(cè)CSM系統(tǒng)也被廣泛部署在城軌集中站/車輛段等處,供城軌運(yùn)維使用。此外,伴隨我國(guó)高速鐵路的建設(shè)發(fā)展,高鐵特有的RBC系統(tǒng)、TSRS系統(tǒng)、ATP系統(tǒng),也面臨著納入信號(hào)集中監(jiān)測(cè)系統(tǒng)的需求,也面臨著提高其監(jiān)測(cè)能力、運(yùn)維能力,以及設(shè)備自診斷能力的需求。
[0003]數(shù)據(jù)挖掘分析是利用統(tǒng)計(jì)分析的數(shù)學(xué)知識(shí),分析文本、圖像、數(shù)值等數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)的隱含規(guī)則、關(guān)系,建立數(shù)據(jù)模型,用于對(duì)數(shù)據(jù)進(jìn)行分類、聚類、統(tǒng)計(jì)等操作。SVM是非常成熟的數(shù)據(jù)分類算法,支持二類分類和多類分類。SVM的主要思想為:它是針對(duì)線性可分情況進(jìn)行分析,對(duì)于線性不可分的情況,通過(guò)使用非線性映射算法將低維輸入空間線性不可分的樣本轉(zhuǎn)化為高維特征空間使其線性可分,從而使得高維特征空間采用線性算法對(duì)樣本的非線性特征進(jìn)行線性分析成為可能。
[0004]軌道交通監(jiān)測(cè)數(shù)據(jù)的挖掘分析,對(duì)于判斷和分析軌道交通的技術(shù)故障具有重要的意義。目前多是靠人工在海量的監(jiān)測(cè)數(shù)據(jù)中進(jìn)行故障的判斷和分析,需要大量的人力成本以及故障原因分析的時(shí)間,從而難以為后續(xù)的維修、救援等工作提供時(shí)間保障,因而需要研究更高效的軌道交通監(jiān)測(cè)數(shù)據(jù)分析和故障分析方法。隨著軌道交通監(jiān)測(cè)技術(shù)的不斷發(fā)展,越來(lái)越多的監(jiān)測(cè)設(shè)備被安裝使用,采集得到的監(jiān)測(cè)數(shù)據(jù)的種類和數(shù)量也越來(lái)越多,使用算法在一定程度上替代人工分析是一個(gè)必然的趨勢(shì)。

【發(fā)明內(nèi)容】

[0005]本發(fā)明的目的是針對(duì)軌道交通監(jiān)測(cè)數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,利用SVM對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行分類,可以顯示故障原因分類等操作。通過(guò)自動(dòng)化的監(jiān)測(cè)手段來(lái)代替人工在海量的監(jiān)測(cè)數(shù)據(jù)中進(jìn)行故障的判斷和分析,大量節(jié)約的人力成本以及故障原因分析的時(shí)間,為后續(xù)的維修、救援等工作提供時(shí)間保障。
[0006]為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下:
[0007]一種基于SVM的軌道交通故障診斷方法,其步驟包括:[0008]I)通過(guò)數(shù)據(jù)歸集組件采集軌道交通的歷史監(jiān)測(cè)數(shù)據(jù)及實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),并將這些數(shù)據(jù)傳輸?shù)綌?shù)據(jù)分析服務(wù)器中;
[0009]2)數(shù)據(jù)分析服務(wù)器存儲(chǔ)各類監(jiān)測(cè)數(shù)據(jù),并對(duì)其進(jìn)行預(yù)處理以將其規(guī)范化;
[0010]3)數(shù)據(jù)分析服務(wù)器分析具體的故障以及故障產(chǎn)生的原因,對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行特征選擇,映射出與故障問(wèn)題相關(guān)的監(jiān)測(cè)數(shù)據(jù);
[0011]4)數(shù)據(jù)分析服務(wù)器對(duì)特征數(shù)據(jù)進(jìn)行向量化,將其轉(zhuǎn)換為可被SVM處理的空間向量模型數(shù)據(jù);
[0012]5)數(shù)據(jù)分析服務(wù)器根據(jù)空間向量模型對(duì)歷史監(jiān)測(cè)數(shù)據(jù)進(jìn)行模型訓(xùn)練,產(chǎn)生對(duì)應(yīng)的問(wèn)題分類模型;
[0013]6)數(shù)據(jù)分析服務(wù)器根據(jù)由歷史監(jiān)測(cè)數(shù)據(jù)得到的分類模型,對(duì)實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)進(jìn)行計(jì)算分析和分類,判斷是否有故障并得出故障產(chǎn)生的原因。
[0014]進(jìn)一步地,步驟I)所述數(shù)據(jù)歸集組件包括歷史監(jiān)測(cè)數(shù)據(jù)歸集和實(shí)時(shí)數(shù)據(jù)歸集,并與運(yùn)維部門如車站、電務(wù)段的集中監(jiān)測(cè)系統(tǒng)(CSM)連接。歷史數(shù)據(jù)可以從歷史數(shù)據(jù)庫(kù)中獲取,實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)則需要與相應(yīng)的數(shù)據(jù)采集設(shè)備進(jìn)行交互。
[0015]進(jìn)一步地,步驟2)中數(shù)據(jù)分析服務(wù)器在存儲(chǔ)監(jiān)測(cè)數(shù)據(jù)時(shí),將格式化的監(jiān)測(cè)數(shù)據(jù)以文本的格式存儲(chǔ)在本地文件系統(tǒng)之中,如存儲(chǔ)到Excel或者文本中,這樣更有助于數(shù)據(jù)的處理,并對(duì)數(shù)據(jù)預(yù)處理步驟提供數(shù)據(jù)支撐。
[0016]進(jìn)一步地,步驟2)中數(shù)據(jù)分析服務(wù)器對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行的預(yù)處理,包括檢查并處理得到的監(jiān)測(cè)數(shù)據(jù)中的異常點(diǎn),檢查數(shù)據(jù)的完整性,對(duì)不同車站、電務(wù)段的監(jiān)測(cè)數(shù)據(jù)進(jìn)行融合,對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行變換、歸一化等操作,以統(tǒng)一數(shù)據(jù)的格式和取值范圍。對(duì)歷史監(jiān)測(cè)數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)的清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)規(guī)范化等步驟,去掉噪音數(shù)據(jù)、不完整的數(shù)據(jù)等,將監(jiān)測(cè)數(shù)據(jù)規(guī)范化。
[0017]進(jìn)一步地,步驟3)中數(shù)據(jù)分析服務(wù)器進(jìn)行特征選擇時(shí),根據(jù)問(wèn)題的理解和數(shù)據(jù)的特點(diǎn),利用經(jīng)驗(yàn)或特征選擇算法選擇出于問(wèn)題相關(guān)的數(shù)據(jù)。將這些數(shù)據(jù)從原始數(shù)據(jù)中抽取出來(lái)。特征選擇支持人工、機(jī)器的特征選擇,針對(duì)問(wèn)題及SVM選擇合適的特征數(shù)據(jù)進(jìn)行處理。特征選擇模塊需要對(duì)問(wèn)題進(jìn)行分析,找出相關(guān)的特征,然后對(duì)預(yù)處理之后的監(jiān)測(cè)數(shù)據(jù)進(jìn)行選擇。將相關(guān)的特征作為模型訓(xùn)練的輸入數(shù)據(jù)進(jìn)行處理,而不是處理所有的數(shù)據(jù)。這里的特征指的是數(shù)據(jù)監(jiān)測(cè)的值,如某一個(gè)軌道設(shè)備的電壓值,可以作為一個(gè)特征來(lái)處理。
[0018]進(jìn)一步地,步驟4)中數(shù)據(jù)分析服務(wù)器對(duì)數(shù)據(jù)進(jìn)行向量化時(shí),通過(guò)對(duì)輸入數(shù)據(jù)格式的分析,編程實(shí)現(xiàn)數(shù)據(jù)格式的轉(zhuǎn)換,將輸入的數(shù)據(jù)轉(zhuǎn)換為向量模式,適用于SVM處理的空間向量模型格式。如果對(duì)一個(gè)問(wèn)題選擇了 η個(gè)相關(guān)的特征,并根據(jù)預(yù)處理的結(jié)果,包含了 m組數(shù)據(jù)。那么就是n*m個(gè)數(shù)據(jù),形成一個(gè)m行η列的二維矩陣。也相當(dāng)于得到了 m個(gè)向量,每個(gè)向量有η個(gè)數(shù)據(jù)。特征的取值就是對(duì)應(yīng)二維數(shù)組相應(yīng)位置的值。
[0019]進(jìn)一步地,步驟5)中數(shù)據(jù)分析服務(wù)器進(jìn)行模型訓(xùn)練時(shí),首先選擇合適的內(nèi)核,如線性核、圖核、樹(shù)核、多項(xiàng)式核、神經(jīng)網(wǎng)絡(luò)核、RBF核等,不同的核函數(shù)適用于不同類型的問(wèn)題。核函數(shù)的選擇主要是根據(jù)對(duì)問(wèn)題的理解,和不同核函數(shù)的經(jīng)驗(yàn)進(jìn)行選擇。在選擇了核函數(shù)之后,需要對(duì)數(shù)據(jù)進(jìn)行分類,分為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)兩部分。訓(xùn)練數(shù)據(jù)用于對(duì)模型訓(xùn)練,得到相應(yīng)的參數(shù),然后使用測(cè)試數(shù)據(jù)進(jìn)行測(cè)試,驗(yàn)證模型的泛化能力。利用十倍交叉驗(yàn)證的方式來(lái)增加模型分類的準(zhǔn)確率和召回率。在一個(gè)實(shí)施例中,可以將得到的VSM監(jiān)測(cè)數(shù)據(jù)平均的分成十組,編號(hào)為1-10,進(jìn)行十次模型訓(xùn)練,每次選用不重復(fù)的編號(hào)作為測(cè)試集,剩下的9份數(shù)據(jù)作為訓(xùn)練集進(jìn)行訓(xùn)練,然后使用不同的參數(shù)進(jìn)行十倍交叉驗(yàn)證,得到更為準(zhǔn)確的準(zhǔn)確率和召回率對(duì)應(yīng)的參數(shù)。
[0020]進(jìn)一步地,步驟6)數(shù)據(jù)分析服務(wù)器對(duì)實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析時(shí),需要對(duì)數(shù)據(jù)歸集組件在CSM系統(tǒng)中采集實(shí)時(shí)的軌道交通監(jiān)測(cè)數(shù)據(jù)進(jìn)行與歷史監(jiān)測(cè)數(shù)據(jù)相同的步驟,包括預(yù)處理、特征選擇、數(shù)據(jù)向量化等步驟,然后利用已經(jīng)得到的分類模型,對(duì)這些數(shù)據(jù)進(jìn)行分類,以判斷是否出現(xiàn)故障,以及產(chǎn)生故障的原因。
[0021]上面步驟I)到6)可以用于設(shè)備級(jí)和運(yùn)維級(jí)的故障監(jiān)測(cè)數(shù)據(jù)分析。設(shè)備級(jí)監(jiān)測(cè)數(shù)據(jù)分析是數(shù)據(jù)分析算法針對(duì)某一個(gè)指定的設(shè)備進(jìn)行監(jiān)測(cè)數(shù)據(jù)采集、處理、模型生成和故障分析;運(yùn)維級(jí)監(jiān)測(cè)數(shù)據(jù)分析是針對(duì)整個(gè)運(yùn)行系統(tǒng)的某一類故障進(jìn)行監(jiān)測(cè)數(shù)據(jù)的采集、處理、模型生成和故障分析。
[0022]一種基于SVM的軌道交通故障診斷系統(tǒng),包括:
[0023]數(shù)據(jù)歸集組件,位于軌道交通運(yùn)維部門,用于采集軌道交通的歷史監(jiān)測(cè)數(shù)據(jù)及實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),并將其傳輸?shù)綌?shù)據(jù)分析服務(wù)器中;
[0024]數(shù)據(jù)分析服務(wù)器,包括:
[0025]數(shù)據(jù)存儲(chǔ)組件,連接所述數(shù)據(jù)歸集組件,用于存儲(chǔ)數(shù)據(jù)歸集組件發(fā)送過(guò)來(lái)的各類監(jiān)測(cè)數(shù)據(jù);
[0026]數(shù)據(jù)預(yù)處理組件,連接所述數(shù)據(jù)存儲(chǔ)組件,用于對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行預(yù)處理以將其規(guī)范化;
[0027]特征選擇組件,連接所述數(shù)據(jù)預(yù)處理組件,用于分析具體的故障以及故障產(chǎn)生的原因,對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行特征選擇,映射出與故障問(wèn)題相關(guān)的監(jiān)測(cè)數(shù)據(jù);
[0028]數(shù)據(jù)向量化組件,連接所述特征選擇組件,用于對(duì)特征數(shù)據(jù)進(jìn)行向量化,轉(zhuǎn)換為SVM可以處理的空間向量模型數(shù)據(jù);
[0029]模型訓(xùn)練組件,連接所述數(shù)據(jù)向量化組件,用于對(duì)歷史監(jiān)測(cè)數(shù)據(jù)進(jìn)行模型訓(xùn)練,產(chǎn)生對(duì)應(yīng)的問(wèn)題分類模型;
[0030]實(shí)時(shí)數(shù)據(jù)分析組件,連接所述數(shù)據(jù)向量化組件和所述模型訓(xùn)練組件,用于對(duì)實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)進(jìn)行計(jì)算分析和分類,判斷是否有故障并得出故障產(chǎn)生的原因。
[0031]進(jìn)一步地,所述軌道交通運(yùn)維部門包括各車站、電務(wù)段,所述數(shù)據(jù)歸集組件與這些運(yùn)維部門的集中監(jiān)測(cè)系統(tǒng)(CSM)連接。歷史數(shù)據(jù)可以從歷史數(shù)據(jù)庫(kù)中獲取,實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)則需要與相應(yīng)的數(shù)據(jù)采集設(shè)備進(jìn)行交互。
[0032]本發(fā)明利用SVM對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行分類,通過(guò)自動(dòng)化的監(jiān)測(cè)手段來(lái)代替人工在海量的監(jiān)測(cè)數(shù)據(jù)中進(jìn)行故障的判斷和分析,與現(xiàn)有技術(shù)相比,優(yōu)點(diǎn)如下:
[0033]I)本發(fā)明加快了故障識(shí)別的速度,采用SVM分類器對(duì)軌道交通監(jiān)測(cè)數(shù)據(jù)進(jìn)行故障識(shí)別,可以加快故障識(shí)別的速度,通過(guò)對(duì)實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析,可以快速的發(fā)現(xiàn)故障,并識(shí)別出故障的類型。
[0034]2)本發(fā)明通過(guò)使用模型識(shí)別故障,節(jié)省了大量的人力成本,不再需要人工的去觀察監(jiān)測(cè)信息然后進(jìn)行故障識(shí)別和分析。
[0035]3)本發(fā)明通過(guò)云平臺(tái)進(jìn)行擴(kuò)展,對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行分布式存儲(chǔ)和并行計(jì)算,可以解決不斷增加的軌道交通監(jiān)測(cè)數(shù)據(jù)的存儲(chǔ)和處理問(wèn)題。從而可以比較從容的應(yīng)復(fù)雜的設(shè)備故障和行車事故原因。
[0036]4)在本發(fā)明的基礎(chǔ)上,加入算法的學(xué)習(xí)能力,則可以不斷的提高故障識(shí)別的能力,通過(guò)不斷的累積學(xué)習(xí)可以發(fā)現(xiàn)人工還沒(méi)有總結(jié)出現(xiàn)的新故障,以及故障產(chǎn)生的新原因,即能夠提高預(yù)警能力、預(yù)診斷能力。
【專利附圖】

【附圖說(shuō)明】
[0037]圖1是本發(fā)明的軌道交通監(jiān)測(cè)數(shù)據(jù)分析方法的步驟流程圖。
[0038]圖2是本發(fā)明的軌道交通監(jiān)測(cè)數(shù)據(jù)分析系統(tǒng)的組件連接示意圖。
[0039]圖3是本發(fā)明的運(yùn)維級(jí)軌道故障分析實(shí)例的流程圖。
[0040]圖4是本發(fā)明的設(shè)備級(jí)軌道故障分析實(shí)例的流程圖。
【具體實(shí)施方式】
[0041]下面通過(guò)具體實(shí)施例和附圖,對(duì)本發(fā)明做詳細(xì)的說(shuō)明。
[0042]本發(fā)明的基于SVM對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析處理的流程如圖1所示,主要分為模型訓(xùn)練階段和實(shí)時(shí)數(shù)據(jù)分析階段。輸入的數(shù)據(jù)包括歷史監(jiān)測(cè)數(shù)據(jù)和實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),輸出的是針對(duì)實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)的分析結(jié)果。通過(guò)本發(fā)明,可以快速的對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析,實(shí)時(shí)的得到故障原因等分析結(jié)果。
[0043]圖2是實(shí)現(xiàn)上述處理流程的相應(yīng)的系統(tǒng)組成圖。主要包括:位于運(yùn)維部門的數(shù)據(jù)歸集組件、位于數(shù)據(jù)分析服務(wù)器的數(shù)據(jù)存儲(chǔ)組件、數(shù)據(jù)預(yù)處理組件、特征選擇組件、數(shù)據(jù)向量化組件、模型訓(xùn)練組件和實(shí)時(shí)數(shù)據(jù)分析組件。
[0044]監(jiān)測(cè)數(shù)據(jù)分析模型主要由兩個(gè)步驟:一是根據(jù)給定的訓(xùn)練集找到合適的SVM核函數(shù)及參數(shù),通常稱為模型訓(xùn)練階段;二是使用第一步訓(xùn)練完成的函數(shù)模型分析實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),以得到系統(tǒng)是否出現(xiàn)故障以及故障產(chǎn)生的原因。下面結(jié)合圖1和圖2具體說(shuō)明各組件的功能。
[0045]1、數(shù)據(jù)歸集組件
[0046]以中國(guó)的鐵路系統(tǒng)為例,包括位于各車間、電務(wù)段、鐵路局、鐵路總公司的數(shù)據(jù)歸集組件;數(shù)據(jù)歸集組件與對(duì)應(yīng)位置的集中監(jiān)測(cè)系統(tǒng)(CSM)相連接,獲取其中的數(shù)據(jù)。其中獲取的監(jiān)測(cè)數(shù)據(jù)分為歷史監(jiān)測(cè)數(shù)據(jù)和實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù);歷史監(jiān)測(cè)數(shù)據(jù)在模型訓(xùn)練階段使用,用于對(duì)模型進(jìn)行訓(xùn)練以得到分類模型;訓(xùn)練得到的模型用于對(duì)實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)進(jìn)行分類,以得到系統(tǒng)當(dāng)前的運(yùn)行狀態(tài),如是否有故障以及故障的原因等。
[0047]數(shù)據(jù)歸集組件與數(shù)據(jù)分析服務(wù)器連接,數(shù)據(jù)歸集組件將獲取到的監(jiān)測(cè)數(shù)據(jù)傳輸給數(shù)據(jù)分析服務(wù)器上的數(shù)據(jù)存儲(chǔ)組件。具體實(shí)施時(shí),數(shù)據(jù)歸集組件可以為軟件模塊,CSM提供一個(gè)接口,數(shù)據(jù)歸集組件就是調(diào)用這個(gè)接口,定期的獲取數(shù)據(jù)。因?yàn)椴煌腃SM數(shù)據(jù)差別較大,歸集組件需要識(shí)別各種數(shù)據(jù)格式。
[0048]2、數(shù)據(jù)存儲(chǔ)組件
[0049]數(shù)據(jù)存儲(chǔ)組件位于數(shù)據(jù)分析服務(wù)器中,支持格式化、半格式化和非格式化的數(shù)據(jù)存儲(chǔ)。歷史監(jiān)測(cè)數(shù)據(jù)由于數(shù)據(jù)量較大,為了便于并行處理,一般采用文件的方式進(jìn)行存儲(chǔ)。進(jìn)一步的可以采用分布式文件系統(tǒng)進(jìn)行歷史監(jiān)測(cè)數(shù)據(jù)的存儲(chǔ),并且采用并行計(jì)算架構(gòu)對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行計(jì)算,以提高數(shù)據(jù)存儲(chǔ)的能力和數(shù)據(jù)計(jì)算的能力。數(shù)據(jù)存儲(chǔ)組件對(duì)外提供數(shù)據(jù)訪問(wèn)的接口。數(shù)據(jù)歸集組件利用其與數(shù)據(jù)分析服務(wù)器的連接,調(diào)用數(shù)據(jù)存儲(chǔ)組件的數(shù)據(jù)存儲(chǔ)接口,將歷史監(jiān)測(cè)數(shù)據(jù)和實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)分析服務(wù)器中。
[0050]3、數(shù)據(jù)預(yù)處理組件
[0051]數(shù)據(jù)預(yù)處理組件位于數(shù)據(jù)分析服務(wù)器中,通過(guò)與數(shù)據(jù)存儲(chǔ)組件之間的連接,調(diào)用數(shù)據(jù)訪問(wèn)的接口,對(duì)得到的監(jiān)測(cè)數(shù)據(jù)進(jìn)行預(yù)處理。首先檢查數(shù)據(jù)的正確性和完整性,然后進(jìn)行相應(yīng)的處理,如數(shù)據(jù)條刪除等。進(jìn)一步地,對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行歸一化,形成格式正確、樣本空間完整的監(jiān)測(cè)數(shù)據(jù)集。
[0052]4、特征選擇組件和數(shù)據(jù)向量化組件
[0053]特征選擇組件與數(shù)據(jù)預(yù)處理組件連接,在進(jìn)行了特征選擇之后,通過(guò)與數(shù)據(jù)預(yù)處理組件的連接,將處理好的監(jiān)測(cè)數(shù)據(jù)集進(jìn)行樣本抽取,映射出只和特征相關(guān)的部分?jǐn)?shù)據(jù),形成新的監(jiān)測(cè)數(shù)據(jù)集。特征選擇組件與數(shù)據(jù)向量化組件連接,將映射出的監(jiān)測(cè)數(shù)據(jù)集傳輸給數(shù)據(jù)向量化組件,數(shù)據(jù)向量化組件對(duì)數(shù)據(jù)進(jìn)行空間向量化,形成SVM支持的VSM格式的數(shù)據(jù)。
[0054]5、模型訓(xùn)練組件
[0055]模型訓(xùn)練組件與數(shù)據(jù)向量化組件連接,通過(guò)該連接獲取VSM格式的監(jiān)測(cè)數(shù)據(jù),然后使用不同的參數(shù)對(duì)該數(shù)據(jù)進(jìn)行十倍交叉驗(yàn)證。以得到分類和泛華能力最好的模型以及參數(shù)。通過(guò)與實(shí)時(shí)數(shù)據(jù)分析組件的連接,將訓(xùn)練好的模型傳輸給實(shí)時(shí)數(shù)據(jù)分析組件。
[0056]6、實(shí)時(shí)數(shù)據(jù)分析組件
[0057]實(shí)時(shí)數(shù)據(jù)分析組件與數(shù)據(jù)向量化組件連接,并與模型訓(xùn)練組件連接。實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)也需要經(jīng)歷與歷史監(jiān)測(cè)數(shù)據(jù)類似的流程,最后將VSM格式的實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)作為輸入,輸入到實(shí)時(shí)數(shù)據(jù)分析組件,通過(guò)計(jì)算就可以得到當(dāng)前的系統(tǒng)是否存在特定的故障,以及該故障產(chǎn)生的原因。
[0058]SVM在軌道交通監(jiān)測(cè)數(shù)據(jù)進(jìn)行數(shù)據(jù)分析中的意義在于對(duì)歷史監(jiān)測(cè)到的數(shù)據(jù)進(jìn)行分析處理,然后得到預(yù)測(cè)模型。然后利用該數(shù)學(xué)模型對(duì)采集到的實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析處理,可以得到實(shí)時(shí)的分析結(jié)果,如故障預(yù)警、異常報(bào)警等。避免了采用人工分析方式所造成的人力資源浪費(fèi),以及分析結(jié)果過(guò)于依賴分析經(jīng)驗(yàn)和專注度、人工分析所帶來(lái)的延遲以及海量監(jiān)測(cè)數(shù)據(jù)造成的分析困難。具體來(lái)說(shuō),本發(fā)明利用SVM進(jìn)行軌道交通監(jiān)測(cè)數(shù)據(jù)的分析時(shí),包括以下步驟:
[0059]I)歸集數(shù)據(jù)
[0060]SVM數(shù)據(jù)分析時(shí)需要利用到兩類數(shù)據(jù),軌道交通歷史監(jiān)測(cè)數(shù)據(jù)和軌道交通實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù):
[0061]軌道交通歷史監(jiān)測(cè)數(shù)據(jù):歷史監(jiān)測(cè)數(shù)據(jù)需要包含出現(xiàn)各類故障情況時(shí)的完整數(shù)據(jù),用于獲取各類情況下數(shù)據(jù)的特征;
[0062]軌道交通實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù):實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)是指從軌道交通采集到的實(shí)時(shí)數(shù)據(jù),SVM對(duì)這部分?jǐn)?shù)據(jù)進(jìn)行分析處理,可以監(jiān)測(cè)到當(dāng)前運(yùn)行環(huán)境下,是否已經(jīng)出現(xiàn)故障,以及故障的原因分析。
[0063]2)監(jiān)測(cè)數(shù)據(jù)預(yù)處理
[0064]對(duì)歷史監(jiān)測(cè)數(shù)據(jù)和實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)進(jìn)行處理分析時(shí),需要對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換和數(shù)據(jù)規(guī)約。[0065]軌道交通監(jiān)測(cè)數(shù)據(jù)存儲(chǔ)不完整、不一致等臟數(shù)據(jù),導(dǎo)致無(wú)法進(jìn)行數(shù)據(jù)分析或者挖掘結(jié)果比較差。為了提高數(shù)據(jù)分析的質(zhì)量產(chǎn)生了數(shù)據(jù)預(yù)處理技術(shù)。數(shù)據(jù)預(yù)處理有多種方法:數(shù)據(jù)清理,數(shù)據(jù)集成,數(shù)據(jù)變換,數(shù)據(jù)歸約等。這些數(shù)據(jù)處理技術(shù)在數(shù)據(jù)分析之前使用,大大提高了數(shù)據(jù)分析模式的質(zhì)量,降低實(shí)際挖掘所需要的時(shí)間。
[0066]數(shù)據(jù)清洗:數(shù)據(jù)清理通過(guò)填寫缺失的值、光滑噪聲數(shù)據(jù)、識(shí)別或刪除離群點(diǎn)并解決不一致性來(lái)“清理”數(shù)據(jù)。主要是達(dá)到如下目標(biāo):格式標(biāo)準(zhǔn)化,異常數(shù)據(jù)清除,錯(cuò)誤糾正,重復(fù)數(shù)據(jù)的清除。軌道監(jiān)測(cè)數(shù)據(jù)有時(shí)候會(huì)出現(xiàn)電壓、電路等監(jiān)測(cè)值的瞬間異常等信息,并不會(huì)對(duì)系統(tǒng)造成影響,因此需要對(duì)這些數(shù)據(jù)進(jìn)行清洗。去掉一些異常值,如果出現(xiàn)某些監(jiān)測(cè)值空缺的情況,依據(jù)經(jīng)驗(yàn)值進(jìn)行填補(bǔ),或者將對(duì)應(yīng)的監(jiān)測(cè)數(shù)據(jù)刪除。
[0067]數(shù)據(jù)集成:數(shù)據(jù)集成將多個(gè)數(shù)據(jù)源中的數(shù)據(jù)結(jié)合起來(lái)并統(tǒng)一存儲(chǔ),建立數(shù)據(jù)倉(cāng)庫(kù)的過(guò)程實(shí)際上就是數(shù)據(jù)集成。軌道交通監(jiān)測(cè)數(shù)據(jù)很不同設(shè)備、站點(diǎn)之間可能存在相互關(guān)系,將數(shù)據(jù)進(jìn)行集成有利于對(duì)設(shè)備、站點(diǎn)之間的關(guān)系進(jìn)行挖掘、分析,如進(jìn)行關(guān)聯(lián)分析等。
[0068]數(shù)據(jù)變換:通過(guò)平滑聚集,數(shù)據(jù)概化,規(guī)范化等方式將數(shù)據(jù)轉(zhuǎn)換成適用于數(shù)據(jù)分析的形式。監(jiān)測(cè)數(shù)據(jù)因?yàn)楸O(jiān)測(cè)的信號(hào)不同,如電流、電壓等,不同信號(hào)值的的類型和取值范圍區(qū)別較大,有些是模擬量,有些是布爾量的。需要對(duì)這些數(shù)據(jù)進(jìn)行規(guī)約,這樣更有利于模型的建立和分析的精確度。
[0069]數(shù)據(jù)規(guī)約:數(shù)據(jù)分析時(shí)往往數(shù)據(jù)量非常大,在少量數(shù)據(jù)上進(jìn)行挖掘分析需要很長(zhǎng)的時(shí)間,數(shù)據(jù)歸約技術(shù)可以用來(lái)得到數(shù)據(jù)集的歸約表示,它小得多,但仍然接近于保持原數(shù)據(jù)的完整性,并結(jié)果與歸約前結(jié)果相同或幾乎相同。
[0070]3)特征選擇
[0071]特征選擇也叫特征子集選擇(FSS, Feature Subset Selection)。是指從已有的M個(gè)特征(Feature)中選擇N個(gè)特征使得系統(tǒng)的特定指標(biāo)最優(yōu)化。在本文中,特征提取主要是根據(jù)具體的問(wèn)題進(jìn)行分析,找出與其相關(guān)的特征,然后利用SVM對(duì)這些特征進(jìn)行分析,而不是對(duì)全部的特征進(jìn)行分析。在本文中,特征指的是監(jiān)測(cè)數(shù)據(jù)得到的數(shù)據(jù),監(jiān)測(cè)數(shù)據(jù)的種類多、采樣頻率高,因此數(shù)據(jù)量較大。針對(duì)具體問(wèn)題如軌道電路故障判斷進(jìn)行分析的時(shí),它僅與很少的幾個(gè)特征相關(guān),而不是全部的監(jiān)測(cè)數(shù)據(jù)。通過(guò)特征選擇,可以大大減少數(shù)據(jù)的計(jì)算量,在提高計(jì)算速度的同時(shí),還可以避免引入過(guò)多的不相關(guān)特征,從而提高分析的精確度。
[0072]4)數(shù)據(jù)向量化
[0073]SVM對(duì)數(shù)據(jù)進(jìn)行處理分析時(shí),需要轉(zhuǎn)換為特定的格式一空間向量模型(VSM),空間向量模型最早被用于計(jì)算文本的相似度。VSM概念簡(jiǎn)單,把對(duì)文本內(nèi)容的處理簡(jiǎn)化為向量空間中的向量運(yùn)算,并且它以空間上的相似度表達(dá)語(yǔ)義的相似度,直觀易懂。當(dāng)文檔被表示為文檔空間的向量,就可以通過(guò)計(jì)算向量之間的相似性來(lái)度量文檔間的相似性。因此需要編程實(shí)現(xiàn)對(duì)預(yù)處理過(guò)的監(jiān)測(cè)數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換,變?yōu)榭臻g向量模型格式的數(shù)據(jù)。
[0074]5)模型訓(xùn)練
[0075]SVM的實(shí)質(zhì)是對(duì)數(shù)據(jù)進(jìn)行分類,針對(duì)有限樣本情況的學(xué)習(xí)機(jī)器,實(shí)現(xiàn)的是結(jié)構(gòu)風(fēng)險(xiǎn)最小化:在對(duì)給定的數(shù)據(jù)逼近的精度與逼近函數(shù)的復(fù)雜性之間尋求折衷,以期獲得最好的泛華能力。它最終解決的是一個(gè)凸二次規(guī)劃問(wèn)題,從理論上說(shuō),得到的將是全局最優(yōu)解,解決了在神經(jīng)網(wǎng)絡(luò)方法中無(wú)法避免的局部極值問(wèn)題。它將實(shí)際問(wèn)題通過(guò)非線性變換轉(zhuǎn)換到高維的特征空間,在高維空間中構(gòu)造線性決策函數(shù)來(lái)實(shí)現(xiàn)原空間中的非線性決策函數(shù),巧妙地解決了維數(shù)問(wèn)題,并保證了有較好的推廣能力,而且算法復(fù)雜度與樣本維數(shù)無(wú)關(guān)。最終目的是通過(guò)找到一個(gè)最優(yōu)的超平面對(duì)數(shù)據(jù)進(jìn)行劃分。
[0076]SVM支持多種類型的核函數(shù),如線性核、圖核、樹(shù)核、多項(xiàng)式核、神經(jīng)網(wǎng)絡(luò)核等。不同核函數(shù)針對(duì)不同的問(wèn)題,在本文的例子中選取RBF (徑向基函數(shù))核作為SVM的核函數(shù)。核函數(shù)的選擇一般是基于經(jīng)驗(yàn)的。
[0077]RBF核,是一種常用的核函數(shù)。它是支持向量機(jī)分類中最為常用的核函數(shù)。關(guān)于兩個(gè)樣本χ和X’的RBF核可表示為某個(gè)“輸入空間”(input space)的特征向量,它的定義如下所示:
[0078]
【權(quán)利要求】
1.一種基于SVM的軌道交通故障診斷方法,其步驟包括: 1)通過(guò)數(shù)據(jù)歸集組件采集軌道交通的歷史監(jiān)測(cè)數(shù)據(jù)及實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),并將其傳輸?shù)綌?shù)據(jù)分析服務(wù)器中; 2)數(shù)據(jù)分析服務(wù)器存儲(chǔ)各類監(jiān)測(cè)數(shù)據(jù),并對(duì)其進(jìn)行預(yù)處理以將其規(guī)范化; 3)數(shù)據(jù)分析服務(wù)器分析具體的故障以及故障產(chǎn)生的原因,對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行特征選擇,映射出與故障問(wèn)題相關(guān)的監(jiān)測(cè)數(shù)據(jù); 4)數(shù)據(jù)分析服務(wù)器對(duì)特征數(shù)據(jù)進(jìn)行向量化,將其轉(zhuǎn)換為可被SVM處理的空間向量模型數(shù)據(jù); 5)數(shù)據(jù)分析服務(wù)器根據(jù)空間向量模型對(duì)歷史監(jiān)測(cè)數(shù)據(jù)進(jìn)行模型訓(xùn)練,產(chǎn)生對(duì)應(yīng)的問(wèn)題分類模型; 6)數(shù)據(jù)分析服務(wù)器根據(jù)由歷史監(jiān)測(cè)數(shù)據(jù)得到的分類模型,對(duì)實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)進(jìn)行計(jì)算分析和分類,判斷是否有故障并得出故障產(chǎn)生的原因。
2.如權(quán)利要求1所述的方法,其特征在于:步驟2)中數(shù)據(jù)分析服務(wù)器在存儲(chǔ)監(jiān)測(cè)數(shù)據(jù)時(shí),將格式化的監(jiān)測(cè)數(shù)據(jù)以文本的格式存儲(chǔ)在本地文件系統(tǒng)之中,并對(duì)數(shù)據(jù)預(yù)處理步驟提供數(shù)據(jù)支撐。
3.如權(quán)利要求1所述的方法,其特征在于,步驟2)中數(shù)據(jù)分析服務(wù)器對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行的預(yù)處理包括數(shù)據(jù)清洗 、數(shù)據(jù)集成、數(shù)據(jù)變換和數(shù)據(jù)規(guī)約。
4.如權(quán)利要求1所述的方法,其特征在于:步驟3)中數(shù)據(jù)分析服務(wù)器進(jìn)行特征選擇時(shí),根據(jù)問(wèn)題的理解和數(shù)據(jù)的特點(diǎn),利用經(jīng)驗(yàn)或特征選擇算法選擇出與問(wèn)題相關(guān)的數(shù)據(jù),將其從原始數(shù)據(jù)中抽取出來(lái)。
5.如權(quán)利要求1所述的方法,其特征在于:步驟4)中數(shù)據(jù)分析服務(wù)器通過(guò)對(duì)輸入數(shù)據(jù)格式的分析,編程實(shí)現(xiàn)數(shù)據(jù)格式的轉(zhuǎn)換,將輸入的數(shù)據(jù)轉(zhuǎn)換為向量模式和適用于SVM處理的空間向量模型格式。
6.如權(quán)利要求1所述的方法,其特征在于:步驟5)中數(shù)據(jù)分析服務(wù)器進(jìn)行模型訓(xùn)練時(shí),首先選擇合適的內(nèi)核,然后將數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)兩部分,訓(xùn)練數(shù)據(jù)用于對(duì)模型訓(xùn)練,得到相應(yīng)的參數(shù),之后使用測(cè)試數(shù)據(jù)進(jìn)行測(cè)試,驗(yàn)證模型的泛華能力。
7.如權(quán)利要求6所述的方法,其特征在于:步驟5)利用十倍交叉驗(yàn)證的方式來(lái)增加模型分類的準(zhǔn)確率和召回率。
8.如權(quán)利要求7所述的方法,其特征在于:步驟5)將得到的VSM監(jiān)測(cè)數(shù)據(jù)平均分成十組,編號(hào)為1-10,進(jìn)行十次模型訓(xùn)練,每次選用不重復(fù)的編號(hào)作為測(cè)試集,剩下的9份數(shù)據(jù)作為訓(xùn)練集進(jìn)行訓(xùn)練,然后使用不同的參數(shù)進(jìn)行十倍交叉驗(yàn)證,得到更為準(zhǔn)確的準(zhǔn)確率和召回率對(duì)應(yīng)的參數(shù)。
9.一種基于SVM的軌道交通故障診斷系統(tǒng),其特征在于,包括: 數(shù)據(jù)歸集組件,位于軌道交通運(yùn)維部門,用于采集軌道交通的歷史監(jiān)測(cè)數(shù)據(jù)及實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),并將其傳輸?shù)綌?shù)據(jù)分析服務(wù)器中; 數(shù)據(jù)分析服務(wù)器,包括: 數(shù)據(jù)存儲(chǔ)組件,連接所述數(shù)據(jù)歸集組件,用于存儲(chǔ)數(shù)據(jù)歸集組件發(fā)送過(guò)來(lái)的各類監(jiān)測(cè)數(shù)據(jù); 數(shù)據(jù)預(yù)處理組件,連接所述數(shù)據(jù)存儲(chǔ)組件,用于對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行預(yù)處理以將其規(guī)范化; 特征選擇組件,連接所述數(shù)據(jù)預(yù)處理組件,用于分析具體的故障以及故障產(chǎn)生的原因,對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行特征選擇,映射出與故障問(wèn)題相關(guān)的監(jiān)測(cè)數(shù)據(jù); 數(shù)據(jù)向量化組件,連接所述特征選擇組件,用于對(duì)特征數(shù)據(jù)進(jìn)行向量化,轉(zhuǎn)換為SVM可以處理的空間向量模型數(shù)據(jù); 模型訓(xùn)練組件,連接所述數(shù)據(jù)向量化組件,用于對(duì)歷史監(jiān)測(cè)數(shù)據(jù)進(jìn)行模型訓(xùn)練,產(chǎn)生對(duì)應(yīng)的問(wèn)題分類模型; 實(shí)時(shí)數(shù)據(jù)分析組件,連接所述數(shù)據(jù)向量化組件和所述模型訓(xùn)練組件,用于對(duì)實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)進(jìn)行計(jì)算分析和分類,判斷是否有故障并得出故障產(chǎn)生的原因。
10.如權(quán)利要求9所述的系統(tǒng),其特征在于:所述數(shù)據(jù)歸集組件與所述數(shù)據(jù)分析服務(wù)器通過(guò)以太網(wǎng)進(jìn)行數(shù)據(jù)傳輸;或者所述數(shù)據(jù)歸集組件與所述數(shù)據(jù)分析服務(wù)器集成于一個(gè)工作站內(nèi),通過(guò)數(shù)據(jù)總線進(jìn)行數(shù)據(jù)傳輸。`
【文檔編號(hào)】G06K9/62GK103745229SQ201410009600
【公開(kāi)日】2014年4月23日 申請(qǐng)日期:2014年1月9日 優(yōu)先權(quán)日:2013年12月31日
【發(fā)明者】鮑俠 申請(qǐng)人:北京泰樂(lè)德信息技術(shù)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1