一種基于mfcc特征提取的機器故障預測方法
【專利摘要】一種基于MFCC特征提取的機器故障預測方法,屬于機器故障預測方法。該故障預測方法,通過機器上安裝的聲傳感器獲得當前機器運行的聲音信號特征,聲音信號經(jīng)過預處理后,再將其進行Mel變換,獲得其MFCC特征向量。根據(jù)所得MFCC特征向量對機器健康狀況進行預測,具體聚類過程是支持向量機對機器正在運行時所提取的MFCC特征和所存機器之前正常運行樣本數(shù)據(jù)進行聚類,通過投票法對聚類結果進行分析,進而對機器故障進行預測。優(yōu)點:提取機器的聲音特征,將其變換至Mel域,再根據(jù)SVM對特征向量進行聚類分析,快速、準確、簡單的預測出機器健康狀態(tài)。具有操作簡單、預測精度高、預測速度快、抗噪性能好。對非線性、隨機性、時變性的信號能夠較為精確的預測。
【專利說明】—種基于MFCC特征提取的機器故障預測方法
【技術領域】
[0001]本發(fā)明涉及一種機器故障預測方法,特別是一種基于MFCC特征提取的機器故障預測方法。
【背景技術】
[0002]機器故障預測是指根據(jù)機器當前或者歷史運行時的狀態(tài)預測出未來一段時間內機器的健康狀態(tài)與是否存在漸變故障,其預測的準確性是機器日常維護、正常運行、安全生產(chǎn)等重要保證,直接關系到經(jīng)濟效益與維護成本。
[0003]與故障診斷不同的是故障預測能夠事先對有可能發(fā)生漸變故障的機器做出判斷,為有計劃的安排維修與維護提供了前提。聲音信號是對多數(shù)的機器都很敏感,對于正常運行的機器,其每次啟動、運行、結束的聲音特征變化不大。但是當機器出現(xiàn)漸變故障時,機器的聲音特征就會出現(xiàn)劇烈的變化,因而,通過聲音特征的提取對機器故障進行預測是可行的。
[0004]目前,在機器故障預測的特征提取中,時域振動烈度的特征提取是機器預測的基本參數(shù),通常通過傳感器采集到機器的震動烈度,然后進過分析找出符合該機器正常運行的正態(tài)分布,當下一次采集的信號特征符合正態(tài)分布,且越靠近均值,就表明機器越正常。頻域方面,主要分析頻帶寬度、或者進行小波變換后的頻帶能量,統(tǒng)計機器正常運行時各個頻帶的能量分布作為故障預測的樣本特征向量,接著提取到的機器特征作為測試樣本,再通過各種預測模型進行機器故障預測。但是由于機器運行時的表現(xiàn)出來信號具有非線性、時變性、隨機性,僅通過提取信號的時域或者頻域進行分析并不能很好地對機器進行故障預測。
[0005]現(xiàn)有的預測模型技術主要有曲線擬合、高斯混合模型(GMM)、神經(jīng)網(wǎng)絡(NN)、灰色模型、隱馬爾科夫模型(HMM)、支持向量機(support vector machine, SVM)。其中,曲線擬合僅僅通過回歸分析歷史的數(shù)據(jù)進行預測,雖然最為原理簡單但誤差較大;高斯混合模型通過概率密度函數(shù)將特征量化,統(tǒng)計各個量化后的特征出現(xiàn)的頻次,能夠實現(xiàn)機器進行故障預測,但是其穩(wěn)定性、精確性受到學習機制的影響較大;神經(jīng)網(wǎng)絡具有抗噪性能超強、不需建立具有一定規(guī)律的數(shù)學模型、極強的非線性映射能力等優(yōu)點在預測方面具有很好的應用前景,但是也存在收斂速度慢、容易陷入局部最優(yōu)解等問題;灰色模型和隱馬爾科夫模型在短期預測具有較高的預測精度、適應能力強等優(yōu)點,但是其精度依賴于特征參數(shù)的多少,當特征參數(shù)較少時,預測效果一般;SVM是一種新型的機器學習方法,具有唯一的全局最優(yōu)解與出色的機器學習能力,能夠很好的解決小樣本、非線性、高維化等問題,能不夠滿足機器故障特征的隨機性、時變性、非線性等。
【發(fā)明內容】
[0006]本發(fā)明的目的是克服現(xiàn)有技術中的不足之處,提供一種操作簡單、精確度高、能快速預測機器的健康狀態(tài)、維護機器方便的基于MFCC特征提取的機器故障預測方法。[0007]本發(fā)明的目的是這樣實現(xiàn)的,本發(fā)明的故障預測方法,通過機器上安裝的聲傳感器獲得當前機器運行的聲音信號特征,聲音信號經(jīng)過預處理后,再將其進行Mel變換,獲得其MFCC特征向量;根據(jù)所得MFCC特征向量對機器健康狀況進行預測,具體聚類過程是支持向量機(support vector machine, SVM)對機器正在運行時所提取的MFCC特征和所存機器之前正常運行樣本數(shù)據(jù)進行聚類,通過投票法對聚類結果進行分析,進而對機器故障進行預測;
[0008]具體實現(xiàn)過程如下:
[0009]( I)信號提取:在需要預測機器上安裝聲音傳感器,首先采集機器正常運行時η天的數(shù)據(jù),作為SVM分類器的對比參照可稱為樣本數(shù)據(jù)庫。然后通過聲傳感器獲取當前機器的聲音信號作為機器故障預測的測試樣本庫。
[0010](2)聲信號處理:針對機器正常運行時已獲得聲音樣本庫的MFCC特征向量,將聲音樣本數(shù)據(jù)與測試數(shù)據(jù)庫分別進行預處理,所述的預處理包括濾波、加重、分幀或加窗,然后將預處理后的聲音信號變換至與其成非線性對應關系的Mel域,最后得到機器正常運行時與當前機器運行時的MFCC特征向量;
[0011]3、預測模型建立:首先采集機器運行η天正常運行時的聲音信號,經(jīng)Mel域變換后存入樣本數(shù)據(jù)庫中;將機器正常運行η天時的MFCC特征向量樣本庫當作SVM聚類器,然后實時采集當前機器運行的聲音信號,并提取其對應的MFCC系數(shù);SVM預測包括線性可分與線性不可分兩種情況,當所采集信號為線性不可分時,構建非線性SVM聚類器,采用SVM機器預測模型的非線性分類算法,最后通過非線性SVM進行聚類分析給出該機器的健康狀況;若機器的運行狀態(tài)在一段時間內是平穩(wěn)的,且滿足給定的機器正常門限值,當前機器的MFCC特征向量作為SVM聚類器的測試樣本,構建基于SVM的機器預測模型;
[0012]4、預測結果:將所得聚類結果使用投票法對機器進行故障預測,對機器做出健康狀態(tài)、亞健康狀態(tài)與非健康狀態(tài)`的決策;機器健康評價指標,0.85到I之間表示機器運行健康,0.65到0.85之間表示機器處于亞健康,0.65以下表示機器有故障;以下給出健康度的定義:
[0013]健康度δ定義為:
[0014]δ =—
Wl
[0015]式中,Sffl為機器健康運行得票數(shù),m為機器健康預測總得票數(shù)。
[0016]所述聲信號處理的具體實現(xiàn)過程如下:
[0017](I)原始機器聲音信號設為s (η)經(jīng)過預濾波、預加重、分幀、加窗后可以得到每幀機器聲音的時域信號為X (η),對每一幀信號做離散傅里葉變換(DFT)得到頻域信號X(k),完成時域轉換成頻域。X(k)可以表示為:
N-1
[0018]Χ(/<) = [.χ⑷(:,, O < /i <
κ=0
[0019]式中,X(k)為頻域信號,x(n)為時域信號,k為采樣點數(shù),N為周期。
[0020](2)求X(k)的平方,即能量譜。通過使用M個Mel帶通濾波器對其進行濾波,第m個帶通濾波器的傳遞函數(shù)Hm (k)可以表示為:
[0021]
【權利要求】
1.一種基于MFCC特征提取的機器故障預測方法,其特征在于,該故障預測方法,通過機器上安裝的聲傳感器獲得當前機器運行的聲音信號特征,聲音信號經(jīng)過預處理后,再將其進行Mel變換,獲得其MFCC特征向量;根據(jù)所得MFCC特征向量對機器健康狀況進行預測,具體聚類過程是支持向量機對機器正在運行時所提取的MFCC特征和所存機器之前正常運行樣本數(shù)據(jù)進行聚類,通過投票法對聚類結果進行分析,進而對機器故障進行預測; 具體實現(xiàn)過程如下: (1)信號提取:在需要預測機器上安裝聲音傳感器,首先采集機器正常運行時η天的數(shù)據(jù),作為SVM分類器的對比參照可稱為樣本數(shù)據(jù)庫。然后通過聲傳感器獲取當前機器的聲音信號作為機器故障預測的測試樣本庫。 (2)聲信號處理:針對機器正常運行時已獲得聲音樣本庫的MFCC特征向量,將聲音樣本數(shù)據(jù)與測試數(shù)據(jù)庫分別進行預處理,所述的預處理包括濾波、加重、分幀或加窗,然后將預處理后的聲音信號變換至與其成非線性對應關系的Mel域,最后得到機器正常運行時與當前機器運行時的MFCC特征向量; (3)預測模型建立:首先采集機器運行η天正常運行時的聲音信號,經(jīng)Mel域變換后存入樣本數(shù)據(jù)庫中;將機器正常運行η天時的MFCC特征向量樣本庫當作SVM聚類器,然后實時采集當前機器運行的聲音信號,并提取其對應的MFCC系數(shù);SVM預測包括線性可分與線性不可分兩種情況,當所采集信號為線性不可分時,構建非線性SVM聚類器,采用SVM機器預測模型的非線性分類算法,最后通過非線性SVM進行聚類分析給出該機器的健康狀況;若機器的運行狀態(tài)在一段時間內是平穩(wěn)的,且滿足給定的機器正常門限值,當前機器的MFCC特征向量作為SVM聚類器的測試樣本,構建基于SVM的機器預測模型; (4)預測結果:將所得聚類 結果使用投票法對機器進行故障預測,對機器做出健康狀態(tài)、亞健康狀態(tài)與非健康狀態(tài)的決策;機器健康評價指標,0.85到I之間表示機器運行健康,0.65到0.85之間表示機器處于亞健康,0.65以下表示機器有故障;以下給出健康度的定義: 健康度S定義為:
δ = ^-
m 式中,Sffl為機器健康運行得票數(shù),m為機器健康預測總得票數(shù)。
2.根據(jù)權利要求書I所述的基于MFCC特征提取的機器故障預測方法,其特征在于:所述聲信號處理的具體實現(xiàn)過程如下: (1)原始機器聲音信號設為s(η)經(jīng)過預濾波、預加重、分幀、加窗后可以得到每幀機器聲音的時域信號為X (η),對每一幀信號做離散傅里葉變換(DFT)得到頻域信號X(k),完成時域轉換成頻域。X(k)可以表示為:
N-1
X(k) = Υ^χ(η)β-]2πΛ?Ν ,Q< k<N
?-O 式中,x(k)為頻域信號,x(n)為時域信號,k為采樣點數(shù),N為周期; (2)求X(k)的平方,即能量譜。通過使用M個Mel帶通濾波器對其進行濾波,第m個帶通濾波器的傳遞函數(shù)可以表示為:
3.根據(jù)權利要求書I所述的基于MFCC特征提取的機器故障預測方法,其特征在于:所述的SVM機器預測模型的非線性分類算法如下: 訓練樣本T =似,視,式中Xi e R1是第i個輸入模式,Cli e {+I, -1}是其對應的輸出期望; 通過非線性映射Φ GO IR1 — Rn,將原空間輸入向量映射到N維特征空間,其最優(yōu)分類超平面:
【文檔編號】G06F19/00GK103810374SQ201310662669
【公開日】2014年5月21日 申請日期:2013年12月9日 優(yōu)先權日:2013年12月9日
【發(fā)明者】張申, 常飛, 喬欣, 丁一珊, 王桃, 胡青松 申請人:中國礦業(yè)大學