表電流值區(qū)間,縱坐標為道岔動作電流曲線上各電流值區(qū)間內所包 含的離散點,即用于統(tǒng)計該電流值區(qū)間的離散點的個數(shù),將道岔動作電流曲線對Y軸進行 投影,其投影圖如圖6a至圖6g所示,根據(jù)實際道岔數(shù)據(jù)的情況來看,通常情況下道岔轉換 區(qū)電流值平穩(wěn),轉換區(qū)時間占整個道岔動作的90%左右且保持在1.8A-2. OA左右,那么柱 狀圖的極大值點就幾乎包括了轉換區(qū)所有的電流值,本發(fā)明選取極大值柱狀圖時間值的 5% -95%作為轉換區(qū)段(即極大值柱狀圖區(qū)間),轉換區(qū)開始點作為解鎖區(qū)結束點,從轉換 區(qū)結束點向右搜索獲得均值較小區(qū)間作為緩放區(qū)(即鎖閉區(qū)),這樣就完成了道岔動作電 流曲線上的道岔動作區(qū)段的分段處理,道岔動作區(qū)段的分段算法流程圖如圖7所示。
[0094] 三個道岔動作區(qū)段(簡稱區(qū)段)分別為解鎖區(qū),轉換區(qū),鎖閉區(qū),提取各個區(qū)段的 特征值,從各個被診斷對象和區(qū)域提取的特征分別是,整條曲線長度特征P 1,解鎖區(qū):第一 高峰值點的值P2,均值P3,方差P4,包含的數(shù)據(jù)點數(shù)P 5;轉換區(qū):最大值P 6,均值P7,方差Ps, 數(shù)據(jù)點個數(shù)P9,鎖閉區(qū):最大值P 1(],均值Pn,方差值P12,區(qū)間點數(shù)P13。
[0095] 設一條樣本的數(shù)據(jù)集合為P,L是經過上述公式計算過的曲線的長度,HP代表解鎖 區(qū)的數(shù)據(jù)集合,BP是轉換區(qū)的數(shù)據(jù)集合,TP是鎖閉區(qū)數(shù)據(jù)集合,P為一條樣本的特征向量, 那么P由如下部分組成:
[0102] 上式中HPk代表第k條曲線的解鎖區(qū),h,t是解鎖區(qū)的電流值和時間值的集合,N 代表樣本數(shù);
[0108] 其中BPk代表第k條曲線的轉換區(qū),b,t是解鎖區(qū)的電流值和時間值的集合,N代 表樣本數(shù);
[0114] TPk代表第k條曲線的轉換區(qū),v,t是解鎖區(qū)的電流值和時間值的集合,N代表樣 本數(shù);最后每個樣本得到1*13維特征向量,所有特征向量集合為N*13。
[0115] 按照解鎖,轉換,鎖閉分區(qū)的方法對道岔動作電流曲線進行分段處理,按照公式 (17)-(32)提取曲線的特征值。
[0116] 以下對S300的道岔動作電流曲線的特征提取方法的【具體實施方式】進行詳細說 明,
[0117] S300的道岔動作電流曲線的特征提取方法包括以下步驟:
[0118] S310 :從鐵路相關部門的微機監(jiān)測系統(tǒng)獲取道岔動作的電流數(shù)據(jù),以道岔動作時 間為橫坐標,離散的電流數(shù)據(jù)(即電流值,也簡稱離散點)為縱坐標,生成道岔動作電流曲 線(簡稱動作電流曲線)。
[0119] S320:特征提取的首要目的是對動作電流曲線進行分段,將動作電流曲線分解為 解鎖區(qū)、轉換區(qū)、鎖閉區(qū)三個階段進行考慮,采用將道岔動作電流曲線轉換到投影坐標系的 方法,投影坐標系橫軸為電流值區(qū)間(所述電流值區(qū)間是在道岔動作電流曲線上對縱軸的 劃分),投影坐標系的縱軸為道岔動作電流曲線上各電流值區(qū)間內所包含的離散點(即離 散的電流數(shù)據(jù))的數(shù)量。即將動作電流曲線縱軸的電流值劃分為η個電流值區(qū)間,作為投 影坐標系下的橫軸,統(tǒng)計每個電流值區(qū)間內的離散點個數(shù),作為投影坐標系下的縱軸,以柱 狀圖直觀地表示了各個電流值區(qū)間的離散點的多少。整個投影過程為:道岔動作電流曲線 向其Y軸進行投影,將落在Y軸每個電流值區(qū)間的個數(shù)統(tǒng)計出來,畫出柱狀圖形式的分布曲 線。參考曲線的均值、方差、極值點、拐點、奇異值等統(tǒng)計信息,對曲線進行分段處理。
[0120] 進一步地,道岔動作電流曲線上的每個離散點的電流值和動作時間均被記錄在數(shù) 據(jù)庫中,從而使得在所述投影坐標系下的每個電流數(shù)據(jù)均能與原道岔動作電流曲線上的電 流值相對應。
[0121] S330 :確定所述投影坐標系下各道岔動作區(qū)段的分段。即在上述投影坐標系下將 所述道岔動作電流曲線上包括的三個道岔動作區(qū)段(對應三個道岔動作過程)一一解鎖 區(qū)、轉換區(qū)、鎖閉區(qū)加以區(qū)分、確定邊界。該過程需要完成三部分工作:S331,確定投影坐標 系下的極大值柱狀圖區(qū)間;S332,確定投影坐標系下的轉換區(qū)的兩個邊界;S333,確定解鎖 區(qū)的結束點和鎖閉區(qū)的起始點。
[0122] 在進行S331時,即確定極大值柱狀圖區(qū)間時,有多種方式,比如:比較與極大值柱 狀圖區(qū)間相鄰兩個區(qū)間的柱狀圖的大小,如果極大值柱狀圖區(qū)間的相鄰的兩個電流值區(qū)間 所包含的離散點數(shù)量與極大值柱狀圖區(qū)間所包含的離散值的絕對值之差小于設定的門限 值(所述門限值范圍通常為100~300),則認為轉換區(qū)沒有完全落入極大值柱狀圖區(qū)間,因 此繼續(xù)調整電流值區(qū)間的分段數(shù)量與分段間隔,直到極大值柱狀圖區(qū)間的相鄰的兩個電流 值區(qū)間所包含的離散點數(shù)量與極大值柱狀圖區(qū)間所包含的離散值的絕對值之差大于設定 的門限值,從而確定出極大值柱狀圖區(qū)間;
[0123] 還可以利用遺傳優(yōu)化算法:設計一個電流值區(qū)間的分段公式,公式中電流值區(qū)間 的分段間隔,分段數(shù)量為待定,采用遺傳優(yōu)化算法,將分段間隔、分段數(shù)量作為遺傳算法要 優(yōu)化的目標,然后采用遺傳算法來尋找最優(yōu)的分段參數(shù),使得所述道岔動作電流曲線中電 流值變化平緩的區(qū)域內的電流數(shù)據(jù)均落入一個電流值區(qū)間內形成唯一的極大值柱狀圖區(qū) 間,投影后得到投影坐標系下的柱狀圖。借鑒生物進化論,遺傳算法模擬自然選擇和生物進 化的過程,通過復制、交叉、突變等操作產生下一代的解,每次迭代過程都保留一組候選解, 并按設定的指標從解群中選取優(yōu)秀的個體,利用遺傳算子(選擇、交叉、變異)對這些個體 進行組合,產生新一代候選值,增加適應度函數(shù)值高的解,淘汰適應度函數(shù)值低的解,這樣 進化N代直到滿足某種收斂指標為止,從而進化出適應度函數(shù)值很高的個體,也就是我們 得到的最優(yōu)解。
[0124] 該情況下,要求轉換區(qū)的電流數(shù)據(jù)的離散點的數(shù)量最多,在所述的投影坐標系下 形成極大值柱狀圖區(qū)間。其中,所述"使得在所述道岔動作電流曲線中電流值變化平緩的區(qū) 域內的電流數(shù)據(jù)均落入極大柱狀圖范圍內"的方式很多,由于鐵路現(xiàn)場道岔發(fā)生故障的情 況很少,所以收集到的道岔故障曲線數(shù)量較少,我們采用軟件模擬故障曲線的方法,通過對 故障曲線的分析,在對電流值進行分段時,當分段值為6時,能夠使轉換區(qū)所有離散點落入 投影坐標系的極大值柱狀圖區(qū)間內,為了使得分段值更準確,我們可以比較與極大值柱狀 圖區(qū)間相鄰兩個區(qū)間的柱狀圖的大小,如果極大值柱狀圖區(qū)間的相鄰的兩個電流值區(qū)間所 包含的離散點數(shù)量與極大值柱狀圖區(qū)間所包含的離散值的絕對值之差小于1〇〇,則認為轉 換區(qū)沒有完全落入極大值柱狀圖區(qū)間,因此繼續(xù)調整電流值區(qū)間的分段數(shù)量(即η的大?。?與分段間隔,直到極大值柱狀圖區(qū)間的相鄰的兩個電流值區(qū)間所包含的離散點數(shù)量與極大 值柱狀圖區(qū)間所包含的離散值的絕對值之差大于1〇〇,從而確定出極大值柱狀圖區(qū)間。
[0125] S332,確定投影坐標系下的轉換區(qū)的兩個邊界:此過程也可以采用上述S330提到 的遺傳算法優(yōu)化參數(shù)的方法,將動作電流曲線的最大、最小電流值、電流均值、電流時間長 度作為輸入?yún)?shù),電流值分段參數(shù)和分段間隔的范圍作為搜索區(qū)間,在該區(qū)間內通過不斷 計算分段參數(shù)和分段間隔的適應度函數(shù),直至得到最優(yōu)的電流值區(qū)間的分段間隔和分段數(shù) 量,以在新的投影坐標系下得到唯一的極大值柱狀圖。由于在對數(shù)據(jù)處理的過程中,我們 使用了插值法,因此,在確定了極大之柱狀圖區(qū)間后,選擇電流數(shù)據(jù)的離散點對應的時間的 5%~95%的部分作為轉換區(qū)以減少波動值及噪聲對分段的影響,比如極大柱狀圖所包含 的離散電流值中,最小時間為ls,最大時間為5s,則轉換區(qū)起始時間為I. 2s到4. 8s。
[0126] S333:確定解鎖區(qū)的結束點和鎖閉區(qū)的起始點。轉換區(qū)開始點為解鎖區(qū)的結束點, 則從動作時間開始至I. 2s的動作電流數(shù)據(jù)的離散點屬于解鎖區(qū),類似的,轉換區(qū)結束點作 為鎖閉區(qū)的起始點,即緩放區(qū),所以4. 8s之后的電流數(shù)據(jù)處于"鎖閉區(qū)"。
[0127] S340 :輸出各道岔動作區(qū)段的開始點與結束點。
[0128] 3)特征選擇方法得到簡約的特征空間
[0129] 以下【具體實施方式】介紹S400步驟:采用基于ReliefF的特征選擇算法選擇對于區(qū) 分故障有意義的特征,得到高效簡約的特征空間。
[0130] 利用ReliefF算法計算各個特征的權重,樣本集如圖3所示流程采集,抽樣次數(shù)為 10次,運行次數(shù)為20,每類樣本中選擇8個與R最近鄰的樣本,計算后得到每個特征每次運 行的權重及權重均值,圖8為ReliefF算法的計算結果。
[0131] 特征6, 7, 27, 23, 5,10等特征的平均權值相對較大,在0. 2以上,其中特征6為轉 換區(qū)長度,特征7為轉換區(qū)的數(shù)值積分,即轉換區(qū)面積,特征27為小臺階區(qū)段的面積,特征 5為解鎖區(qū)段的面積,特征23為緩放區(qū)長度,幾個特征能夠大致反映道岔的工作狀態(tài),如轉 換區(qū)面積過大、長度過長,此時若緩放區(qū)長度過短,則說明道岔很可能發(fā)生了空轉的故障。 特征6、特征7對于區(qū)分故障一、故障四兩種故障比較有效,特征27、23同樣能夠區(qū)分故障一 與其他故障,特征5在故障三發(fā)生的情況下,其值小于其他故障。
[0132] 綜上,通過ReliefF算法對各特征提取方法提取的特征進行特征選擇,能夠得到 各個特征的權重,再根據(jù)相同特征在不同工作狀態(tài)下的值的情況,得出對于區(qū)分道岔各類 工作狀態(tài)有效的特征,特征選擇能夠降低特征維數(shù),降維后的特征都是可測性指標并具有 實在的意義,因為它不對變量進行組合,而是通過計算特征權值從原始的特征向量集合中 挑選一些權值較高的特征重新組合成一個特征集合,這些特征正是對分類較有效果的特 征,可以為診斷模型特征集提取提供依據(jù),經選擇的特征即可作為以下道岔故障診斷模型 的輸入?yún)?shù)。
[0133] 4)訓練診斷模型區(qū)分道岔故障
[01