專利名稱:基于隨機森林模型的電力變壓器故障診斷方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種電力變壓器故障診斷方法,特別是涉及一種基于隨機森林模型的電力變壓器故障診斷方法。
背景技術(shù):
電力變壓器是電力系統(tǒng)的重要設(shè)備,由于變壓器內(nèi)部結(jié)構(gòu)復(fù)雜,電場分布不均勻, 且隨著電壓水平增高,事故率成上升趨勢。據(jù)不完全統(tǒng)計,國內(nèi)每年都有幾次變壓器的大事故發(fā)生,造成直接經(jīng)濟損失達上百萬元。另外根據(jù)中國電力企業(yè)聯(lián)合會電力可靠性管理中心發(fā)布的近幾年全國電力可靠性統(tǒng)計分析結(jié)果來看,其故障率最大的部位是變壓器的內(nèi)絕緣,主要故障特點是變壓器絕緣老化嚴(yán)重、運行環(huán)境惡劣、變壓器制造質(zhì)量有問題。作為電力系統(tǒng)的主要設(shè)備的變壓器,其故障除給本身帶來重大損失外,還對電力系統(tǒng)安全產(chǎn)生造成很大的影響。目前電力變壓器故障診斷的技術(shù)和方法,主要有專家系統(tǒng)、人工神經(jīng)網(wǎng)絡(luò)、優(yōu)化技術(shù)、Petri網(wǎng)絡(luò)、模糊集理論、粗糙集理論等。近年來出現(xiàn)的隨機森林技術(shù)在圖像識別、文本分類、基因表達譜分析、經(jīng)濟模式識別等許多領(lǐng)域得到了很多的成功應(yīng)用。應(yīng)用實踐證明,隨機森林具有速度快、抗噪聲,可處理任意類型的數(shù)據(jù),可輸出因素的重要性等優(yōu)點,但尚未在電力變壓器故障診斷方面應(yīng)用。
發(fā)明內(nèi)容
本發(fā)明的目的是要提供一種基于隨機森林模型的電力變壓器故障診斷方法。為了達到上述目的,本發(fā)明的技術(shù)方案是一種基于隨機森林模型的電力變壓器故障診斷方法,采集變壓器狀態(tài)檢修數(shù)據(jù),利用變壓器狀態(tài)檢修數(shù)據(jù)訓(xùn)練隨機森林模型,并校驗隨機森林模型的靈敏度,以經(jīng)訓(xùn)練校驗后的隨機森林模型來診斷變壓器故障。具體的講,基于隨機森林模型的電力變壓器故障診斷方法包括以下步驟
a、建立模型,根據(jù)變壓器狀態(tài)檢測的歷史數(shù)據(jù)訓(xùn)練隨機森林,建立故障診斷的隨機森林模型;隨著新樣本的不斷增加,通過加入新樣本進行訓(xùn)練,可以重新建模。b、檢驗?zāi)P?,選擇起始時間和結(jié)束時間進行結(jié)果對比,得出預(yù)測效果。C、故障診斷,選擇起始時間和結(jié)束時間對待測狀態(tài)數(shù)據(jù)進行測試。d、影響因素重要性排序,利用隨機森林可以計算變量重要性計算出各個指標(biāo)的影響程度,并進行重要性排序。e、擴展模型,利用k-means聚類方法,對實際數(shù)據(jù)進行聚類分析,把數(shù)據(jù)分成故障、臨界和正常三個類;實際的故障診斷數(shù)據(jù)中,故障數(shù)據(jù)通常只占很小的一個比值,絕大多數(shù)的數(shù)據(jù)都為正常數(shù)據(jù)??紤]到正常數(shù)據(jù)中實際上有部分?jǐn)?shù)據(jù)是處在正常與故障的臨界狀況,因此如把數(shù)據(jù)分成故障、臨界和正常三個類,那么既可減弱原先兩類數(shù)據(jù)不平衡的現(xiàn)象,又可通過對臨界類的判斷,提高故障診斷系統(tǒng)的可靠性和預(yù)警能力。本發(fā)明的有益效果在于1、本發(fā)明取得了比其他診斷方法更好的性能;模型可根據(jù)數(shù)據(jù)的更新變化重新建模, 適應(yīng)能力強。2、本發(fā)明可以給出影響變量的重要性排序,故障診斷結(jié)果具有良好的可解釋性。3、本發(fā)明利用k-mean聚類方法,分離出了介于正常和故障之間的臨界類,使系統(tǒng)獲得了故障的早期預(yù)警能力。
具體實施例方式下面結(jié)合實施例對本發(fā)明進行進一步說明。基于隨機森林模型的電力變壓器故障診斷方法包括以下步驟
a、建立模型,根據(jù)變壓器狀態(tài)檢測的歷史數(shù)據(jù)訓(xùn)練隨機森林,建立故障診斷的隨機森林模型,隨著新樣本的不斷增加,通過加入新樣本進行訓(xùn)練,可以重新建模;
b、檢驗?zāi)P停x擇起始時間和結(jié)束時間進行結(jié)果對比,得出預(yù)測效果; C、故障診斷,選擇起始時間和結(jié)束時間對待測狀態(tài)數(shù)據(jù)進行測試;
d、影響因素重要性排序,利用隨機森林可以計算變量重要性計算出各個指標(biāo)的影響程度,并進行重要性排序;
e、擴展模型,利用k-means算法,對實際數(shù)據(jù)進行聚類分析,把數(shù)據(jù)分成故障、臨界和正常三個類。以上是對本發(fā)明做的示例性描述,凡在不脫離本發(fā)明核心的情況下做出的簡單的變形或修改均落入本發(fā)明的保護范圍。
權(quán)利要求
1.基于隨機森林模型的電力變壓器故障診斷方法,其特征在于,采集變壓器狀態(tài)檢修數(shù)據(jù),利用變壓器狀態(tài)檢修數(shù)據(jù)訓(xùn)練隨機森林模型,并校驗隨機森林模型的靈敏度,以經(jīng)訓(xùn)練校驗后的隨機森林模型來診斷變壓器故障。
2.根據(jù)權(quán)利要求1所述的基于隨機森林模型的電力變壓器故障診斷方法,其特征在于,該方法包括以下步驟a、建立模型,根據(jù)變壓器狀態(tài)檢測的歷史數(shù)據(jù)訓(xùn)練隨機森林,建立故障診斷的隨機森林模型,隨著新樣本的不斷增加,通過加入新樣本進行訓(xùn)練,可以重新建模;b、檢驗?zāi)P?,選擇起始時間和結(jié)束時間進行結(jié)果對比,得出預(yù)測效果;C、故障診斷,選擇起始時間和結(jié)束時間對待測狀態(tài)數(shù)據(jù)進行測試;d、影響因素重要性排序,利用隨機森林可以計算變量重要性計算出各個指標(biāo)的影響程度,并進行重要性排序;e、擴展模型,利用k-means聚類方法,對實際數(shù)據(jù)進行聚類分析,把數(shù)據(jù)分成故障、臨界和正常三個類。
全文摘要
本發(fā)明公開了一種基于隨機森林模型的電力變壓器故障診斷方法,采集變壓器狀態(tài)檢修數(shù)據(jù),利用變壓器狀態(tài)檢修數(shù)據(jù)訓(xùn)練隨機森林模型,并校驗隨機森林模型的靈敏度,以經(jīng)訓(xùn)練校驗后的隨機森林模型來診斷變壓器故障。本發(fā)明提供的方法適應(yīng)能力強,具有良好的可解釋性,利用k-means聚類方法,分離出了介于正常和故障之間的臨界類,使系統(tǒng)獲得了故障的早期預(yù)警能力。
文檔編號G01R31/00GK102221655SQ20111016244
公開日2011年10月19日 申請日期2011年6月16日 優(yōu)先權(quán)日2011年6月16日
發(fā)明者尹永根, 崔紅梅, 李晉城, 趙鋒, 郝福忠, 金翼, 霍明霞, 韓建國 申請人:河南省電力公司濟源供電公司