本發(fā)明涉及電力負(fù)荷預(yù)測(cè)技術(shù)領(lǐng)域,特別是涉及基于km-apso-svm模型的短期電力負(fù)荷預(yù)測(cè)方法。
背景技術(shù):
在電力工業(yè)快速發(fā)展的今天,國民經(jīng)濟(jì)的發(fā)展水平與電力負(fù)荷預(yù)測(cè)技術(shù)的優(yōu)劣程度息息相關(guān)。準(zhǔn)確的電力負(fù)荷預(yù)測(cè),有利于電網(wǎng)企業(yè)制定科學(xué)合理的電力輸送、調(diào)配計(jì)劃,有效規(guī)避風(fēng)險(xiǎn),保證供電的安全可靠性。短期電力負(fù)荷預(yù)測(cè)是依據(jù)歷史負(fù)荷數(shù)據(jù),考慮天氣、節(jié)假日、經(jīng)濟(jì)等因素的影響,掌握負(fù)荷的波動(dòng)規(guī)律及其與各因素的內(nèi)在聯(lián)系,選擇恰當(dāng)?shù)念A(yù)測(cè)技術(shù)并運(yùn)用數(shù)學(xué)方法,推知未來幾小時(shí)或是一天內(nèi)負(fù)荷的發(fā)展趨勢(shì)。短期電力負(fù)荷預(yù)測(cè)依托數(shù)據(jù)量大,受噪聲干擾和多種因素的影響而具有一定的隨機(jī)性,如何科學(xué)合理地進(jìn)行數(shù)據(jù)處理是提高預(yù)測(cè)精度的關(guān)鍵。
目前常用的短期負(fù)荷預(yù)測(cè)的方法大致分為兩類,經(jīng)典預(yù)測(cè)方法和智能預(yù)測(cè)方法。
常用的經(jīng)典預(yù)測(cè)方法有回歸分析法、時(shí)間序列法和灰色預(yù)測(cè)法等?;貧w分析法的原理和形式簡單,預(yù)測(cè)速度快,外推性能好,但是對(duì)歷史數(shù)據(jù)要求較高,不能描述比較復(fù)雜的問題;時(shí)間序列法需要少量歷史數(shù)據(jù),工作量小,計(jì)算速度快,但忽略負(fù)荷變化影響因素;灰色預(yù)測(cè)法可以削弱隨機(jī)因素對(duì)負(fù)荷變化的干擾,依托數(shù)據(jù)少,計(jì)算簡便,精度高且易于檢驗(yàn),但僅適用于負(fù)荷具有指數(shù)變化趨勢(shì)的情況。
智能預(yù)測(cè)方法有神經(jīng)網(wǎng)絡(luò)法。神經(jīng)網(wǎng)絡(luò)通過歷史數(shù)據(jù)的自學(xué)習(xí)獲得預(yù)測(cè)結(jié)果,但是神經(jīng)網(wǎng)絡(luò)的層數(shù)和神經(jīng)元個(gè)數(shù)的確定多依據(jù)主觀經(jīng)驗(yàn),收斂速度慢且易陷入局部極小。
數(shù)據(jù)挖掘是從大量的、不完全的、噪聲的、模糊的、隨機(jī)的實(shí)際數(shù)據(jù)中提取隱含但具有潛在利用價(jià)值的信息,聚類分析是數(shù)據(jù)挖掘技術(shù)的一種。聚類分析是采用某種相近程度度量方法,將數(shù)據(jù)分成一系列有意義的子集合,每一個(gè)集合中的數(shù)據(jù)性質(zhì)相近,不同集合之間的數(shù)據(jù)性質(zhì)相差較大。日負(fù)荷發(fā)展趨勢(shì)具有很大的相似性,受工作日類型、天氣狀況、節(jié)假日等因素影響波動(dòng)較大,同年同季度各日負(fù)荷曲線形狀相似,不同年份相同月份中各日負(fù)荷曲線形狀接近。
因此希望有一種基于km-apso-svm模型的短期電力負(fù)荷預(yù)測(cè)方法可以克服或至少減輕現(xiàn)有技術(shù)的上述缺陷。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供基于km-apso-svm模型的短期電力負(fù)荷預(yù)測(cè)方法,以提高短期負(fù)荷預(yù)測(cè)的精度。
為實(shí)現(xiàn)上述目的,本發(fā)明提供一種基于km-apso-svm模型的短期電力負(fù)荷預(yù)測(cè)方法,包括以下步驟:
(1)基于大數(shù)據(jù)進(jìn)行電網(wǎng)日負(fù)荷變化規(guī)律的分析:收集預(yù)測(cè)地點(diǎn)環(huán)境的數(shù)據(jù)信息,利用灰色關(guān)聯(lián)度分析各氣象因素與負(fù)荷間的關(guān)系,為建立負(fù)荷預(yù)測(cè)模型奠定基礎(chǔ);
(2)運(yùn)用k-medoids聚類算法對(duì)樣本進(jìn)行聚類分析:對(duì)收集的數(shù)據(jù)進(jìn)行整理,形成聚類樣本,設(shè)置分類數(shù)并選取相關(guān)因素構(gòu)成樣本的特征向量,運(yùn)用k-medoids聚類算法對(duì)樣本進(jìn)行聚類分析,通過無量綱化處理映射到特定的區(qū)間形成聚類結(jié)果;
(3)運(yùn)用apso-svm預(yù)測(cè)模型進(jìn)行負(fù)荷預(yù)測(cè):對(duì)收集的數(shù)據(jù)進(jìn)行累加預(yù)處理得到訓(xùn)練樣本;將聚類樣本的數(shù)據(jù)輸入到svm中訓(xùn)練,用apso優(yōu)化svm參數(shù)并建立預(yù)測(cè)模型,得到的預(yù)測(cè)結(jié)果進(jìn)行累減還原。
優(yōu)選地,所述步驟(2)中k-medoids聚類算法包括如下步驟:
①從包含m個(gè)數(shù)據(jù)的數(shù)據(jù)集中隨意選取k個(gè)代表對(duì)象作為聚類中心;
②分別計(jì)算非代表數(shù)據(jù)對(duì)象到各個(gè)聚類中心的距離,將它們分配到距離自己最近的聚類中;
③所有數(shù)據(jù)分配完成后,順序選取一個(gè)數(shù)據(jù)來代替原來的聚類中心,根據(jù)平方差函數(shù)值最小的原則更新每個(gè)聚類中心;
④與前一次的聚類相比較,如果聚類質(zhì)量發(fā)生變化則跳轉(zhuǎn)至步驟②;如果聚類質(zhì)量未發(fā)生變化執(zhí)行步驟⑤;
⑤輸出聚類結(jié)果。
優(yōu)選地,步驟③中所述平方差函數(shù)定義為:
其中,p為類ci中的樣本,oj為聚類中心。
優(yōu)選地,步驟④中所述聚類質(zhì)量由代價(jià)函數(shù)表示,該代價(jià)函數(shù)可以度量對(duì)象與其參照對(duì)象之間的平均相異度。
優(yōu)選地,步驟(3)中所述svm參數(shù)包括:懲罰因子c、核函數(shù)的寬度σ和不敏感損失函數(shù)ε。
優(yōu)選地,所述apso-svm預(yù)測(cè)模型進(jìn)行負(fù)荷預(yù)測(cè)的計(jì)算步驟如下:
(1)數(shù)據(jù)預(yù)處理:
設(shè)原始序列為{x(0)(1),x(0)(2),...x(0)(n)},進(jìn)行一次累加得到新序列{x(1)(1),x(1)(2),...x(1)(n)},其中:
累加后的數(shù)據(jù)進(jìn)行歸一化處理,計(jì)算公式如公式(3)所示:
(2)參數(shù)優(yōu)化步驟:
步驟①:設(shè)定粒子群初始值,最大迭代次數(shù)為tmax,慣性權(quán)值為w,c1和c2為加速因子,迭代時(shí)刻為t,初始的粒子群為x(t),x1,x2,…,xs代表粒子群中隨機(jī)產(chǎn)生的粒子,對(duì)應(yīng)的粒子速度為v1,v2,...,vs,種群的速度為v(t);
步驟②:評(píng)估粒子群,適應(yīng)度函數(shù)定義為
步驟③:通過個(gè)體最優(yōu)解pbest和全局最優(yōu)gbest更新每一個(gè)粒子的速度,更新方程如公式(4)和公式(5)所示:
vid(t+1)=wvid(t)+c1r1(pid(t)-xid(t))+c2r2(pgd(t)-xid(t))
(d=1,2,...,n;i=1,2,...,s)公式(4)
xid(t+1)=vid(t)+vid(t+1)公式(5)
式中:s表示種群規(guī)模,r1,r2是控制前面速度對(duì)當(dāng)前速度影響的隨機(jī)數(shù),區(qū)間為[0,1],pid是個(gè)體最優(yōu)解pbest;pgd是全局最優(yōu)解gbest;
步驟④:檢測(cè)循環(huán)迭代終止條件,當(dāng)?shù)螖?shù)大于最大迭代次數(shù)或搜尋到了小于設(shè)定誤差的精度值時(shí)終止迭代進(jìn)行步驟⑤,否則返回至步驟①;
步驟⑤:提取出此時(shí)得到的最優(yōu)參數(shù)賦給svm;
步驟⑥:用樣本數(shù)據(jù)對(duì)svm進(jìn)行訓(xùn)練,并用改進(jìn)的序列極小值法求解模型,計(jì)算公式(6)所示:
式中,αi,αi*為拉格朗日乘子,且滿足等式:αi×αi*=0,αi,αi*≥0,k(xi,xj)為核函數(shù);
步驟⑦:將步驟⑥中的參數(shù)代入公式(7),確定模型最終函數(shù)方程
本發(fā)明結(jié)合數(shù)據(jù)挖掘技術(shù)中的k-medoids聚類分析方法與svm預(yù)測(cè)方法,提出了一種基于聚類分析和數(shù)據(jù)累加預(yù)處理的km-apso-svm預(yù)測(cè)方法,該方法采用k-medoids聚類分析技術(shù)將相似日劃為一類,同時(shí)結(jié)合粒子群算法良好的尋優(yōu)性能和svm預(yù)測(cè)優(yōu)勢(shì),構(gòu)建了基于數(shù)據(jù)累加預(yù)處理的pso-svm(accumulativepso-svm,apso-svm)預(yù)測(cè)模型,通過對(duì)原始序列的累加弱化其中的不規(guī)則擾動(dòng)影響,增強(qiáng)序列的規(guī)律性,在預(yù)測(cè)過程中保證預(yù)測(cè)精度。
附圖說明
圖1是聚類結(jié)果示意圖。
圖2是km-apso-svm預(yù)測(cè)機(jī)制示意圖。
圖3是簇1擬合程度示意圖。
圖4是簇1相對(duì)誤差示意圖。
圖5是簇2擬合程度示意圖。
圖6是簇2相對(duì)誤差示意圖。
圖7是簇3擬合程度示意圖。
圖8是簇3相對(duì)誤差示意圖。
圖9是8月份的擬合程度示意圖。
圖10是8月份的相對(duì)誤差示意圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行更加詳細(xì)的描述。在附圖中,自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。下面通過參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。下面結(jié)合附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行詳細(xì)說明。
km-apso-svm:基于k-medoids聚類分析技術(shù)和數(shù)據(jù)累加預(yù)處理的粒子群優(yōu)化支持向量機(jī)算法。
svm是以vc維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則為理論基礎(chǔ),根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折中,從而獲得最好的推廣能力。svm能將實(shí)際問題通過非線性變換轉(zhuǎn)換到高維度的特征空間,并運(yùn)用核函數(shù)解決維數(shù)問題,得到全局最優(yōu)解,收斂速度快,計(jì)算精度高。
k-medoids算法是一種基于劃分的聚類算法,有較強(qiáng)的魯棒性和較高的準(zhǔn)確性。傳統(tǒng)的k-medoids算法的聚類思想是:首先為每個(gè)簇隨意選擇一個(gè)代表對(duì)象,將剩余的對(duì)象分配給與它距離最短的代表對(duì)象所代表的簇;然后反復(fù)用非代表對(duì)象來代替代表對(duì)象,從而提高聚類質(zhì)量。聚類質(zhì)量用一個(gè)代價(jià)函數(shù)來表示,該函數(shù)可以度量對(duì)象與其參照對(duì)象之間的平均相異度。
apso-svm預(yù)測(cè)模型首先對(duì)原始數(shù)據(jù)進(jìn)行一次累加預(yù)處理得到訓(xùn)練樣本;將樣本數(shù)據(jù)輸入到svm中訓(xùn)練,用pso優(yōu)化svm中主要參數(shù)(懲罰因子c、核函數(shù)的寬度σ、不敏感損失函數(shù)ε)并建立預(yù)測(cè)模型,得到的預(yù)測(cè)結(jié)果需進(jìn)行累減還原。
基于km-apso-svm模型的短期電力負(fù)荷預(yù)測(cè)方法,包括以下步驟:
(1)基于大數(shù)據(jù)進(jìn)行電網(wǎng)日負(fù)荷變化規(guī)律的分析:收集預(yù)測(cè)地點(diǎn)環(huán)境的數(shù)據(jù)信息,利用灰色關(guān)聯(lián)度分析各氣象因素與負(fù)荷間的關(guān)系,為建立負(fù)荷預(yù)測(cè)模型奠定基礎(chǔ);
(2)運(yùn)用k-medoids聚類算法對(duì)樣本進(jìn)行聚類分析:對(duì)收集的數(shù)據(jù)進(jìn)行整理,形成聚類樣本,設(shè)置分類數(shù)并選取相關(guān)因素構(gòu)成樣本的特征向量,運(yùn)用k-medoids聚類算法對(duì)樣本進(jìn)行聚類分析,通過無量綱化處理映射到特定的區(qū)間形成聚類結(jié)果;
(3)運(yùn)用apso-svm預(yù)測(cè)模型進(jìn)行負(fù)荷預(yù)測(cè):對(duì)收集的數(shù)據(jù)進(jìn)行累加預(yù)處理得到訓(xùn)練樣本;將聚類樣本的數(shù)據(jù)輸入到svm中訓(xùn)練,用apso優(yōu)化svm參數(shù)懲罰因子c、核函數(shù)的寬度σ和不敏感損失函數(shù)ε,并建立預(yù)測(cè)模型,得到的預(yù)測(cè)結(jié)果進(jìn)行累減還原。
其中,所述步驟(2)中k-medoids聚類算法包括如下步驟:
①從包含m個(gè)數(shù)據(jù)的數(shù)據(jù)集中隨意選取k個(gè)代表對(duì)象作為聚類中心;
②分別計(jì)算非代表數(shù)據(jù)對(duì)象到各個(gè)聚類中心的距離,將它們分配到距離自己最近的聚類中;
③所有數(shù)據(jù)分配完成后,順序選取一個(gè)數(shù)據(jù)來代替原來的聚類中心,根據(jù)平方差函數(shù)值最小的原則更新每個(gè)聚類中心,平方差函數(shù)定義為:
其中,p為類ci中的樣本,oj為聚類中心;
④與前一次的聚類相比較,聚類質(zhì)量由代價(jià)函數(shù)表示,該函數(shù)可以度量對(duì)象與其參照對(duì)象之間的平均相異度,如果聚類質(zhì)量發(fā)生變化則跳轉(zhuǎn)至步驟②;如果聚類質(zhì)量未發(fā)生變化執(zhí)行步驟⑤;
⑤輸出聚類結(jié)果。
apso-svm預(yù)測(cè)模型進(jìn)行負(fù)荷預(yù)測(cè)的計(jì)算步驟如下:
(1)數(shù)據(jù)預(yù)處理
設(shè)原始序列為{x(0)(1),x(0)(2),...x(0)(n)},進(jìn)行一次累加得到新序列{x(1)(1),x(1)(2),...x(1)(n)},其中:
由于svm對(duì)0到1之間的數(shù)據(jù)比較敏感,訓(xùn)練的速度較快,需要將累加后的數(shù)據(jù)進(jìn)行歸一化處理,計(jì)算公式如公式(3)所示:
(2)參數(shù)優(yōu)化步驟:
步驟①:設(shè)定粒子群初始值,最大迭代次數(shù)為tmax,慣性權(quán)值為w,c1和c2為加速因子,迭代時(shí)刻為t,初始的粒子群為x(t),x1,x2,...,xs代表粒子群中隨機(jī)產(chǎn)生的粒子,對(duì)應(yīng)的粒子速度為v1,v2,...,vs,種群的速度為v(t);
步驟②:評(píng)估粒子群,適應(yīng)度函數(shù)定義為
步驟③:通過個(gè)體最優(yōu)解pbest和全局最優(yōu)gbest更新每一個(gè)粒子的速度,更新方程如公式(4)和公式(5)所示:
vid(t+1)=wvid(t)+c1r1(pid(t)-xid(t))+c2r2(pgd(t)-xid(t))
(d=1,2,...,n;i=1,2,...,s)公式(11)
xid(t+1)=vid(t)+vid(t+1)公式(12)
式中:s表示種群規(guī)模,r1,r2是控制前面速度對(duì)當(dāng)前速度影響的隨機(jī)數(shù),區(qū)間為[0,1],pid是個(gè)體最優(yōu)解pbest;pgd是全局最優(yōu)解gbest;
步驟④:檢測(cè)循環(huán)迭代終止條件,當(dāng)?shù)螖?shù)大于最大迭代次數(shù)或搜尋到了小于設(shè)定誤差的精度值時(shí)終止迭代進(jìn)行步驟⑤,否則返回至步驟①;
步驟⑤:提取出此時(shí)得到的最優(yōu)參數(shù)賦給svm;
步驟⑥:用樣本數(shù)據(jù)對(duì)svm進(jìn)行訓(xùn)練,并用改進(jìn)的序列極小值法求解模型,計(jì)算公式(6)所示:
式中,αi,αi*為拉格朗日乘子,且滿足等式:αi×αi*=0,αi,αi*≥0,k(xi,xj)為核函數(shù);
步驟⑦:將步驟⑥中的參數(shù)代入公式(7),確定模型最終函數(shù)方程
在一具體實(shí)施例中,基于km-apso-svm模型的短期電力負(fù)荷預(yù)測(cè)方法包括以下步驟:
(1)數(shù)據(jù)收集:收集某電網(wǎng)2014年6月1日至2014年8月31日期間共92天負(fù)荷數(shù)據(jù)及氣象數(shù)據(jù)信息。該電網(wǎng)3個(gè)月期間負(fù)荷數(shù)據(jù)統(tǒng)計(jì)情況如表1所示:
表1負(fù)荷數(shù)據(jù)統(tǒng)計(jì)表(單位:mw)
(2)短期負(fù)荷聚類分析對(duì)收集的數(shù)據(jù)進(jìn)行整理,形成聚類樣本。如圖1所示的聚類結(jié)果,設(shè)分類數(shù)為3,選取日平均溫度、日類型和7天前最大負(fù)荷作為相關(guān)因素構(gòu)成樣本的特征向量,運(yùn)用k-medoids聚類算法對(duì)樣本進(jìn)行聚類分析。其中,日類型有周一至周四、周五、周六和周日四種,通過無量綱化處理映射到特定的區(qū)間。為便于定量表示,設(shè)1代表周一至周四,2代表周五,3代表周六,4代表周日。
基于聚類分析選擇相似日,選取相似日的日平均溫度、日類型及7天前最大歷史負(fù)荷三個(gè)因素作為svm的輸入向量,輸出負(fù)荷預(yù)測(cè)值。根據(jù)圖3的聚類結(jié)果分別建立svm訓(xùn)練樣本集和測(cè)試樣本集,訓(xùn)練樣本為六月份和七月份的數(shù)據(jù),測(cè)試樣本為八月份的數(shù)據(jù),統(tǒng)計(jì)結(jié)果如表2所示。
表2訓(xùn)練樣本集與測(cè)試樣本集統(tǒng)計(jì)表
簇1共有33個(gè)樣本,其中訓(xùn)練樣本數(shù)為16,測(cè)試樣本數(shù)為17。簇1中6月份和7月份的歷史數(shù)據(jù)訓(xùn)練svm主要參數(shù)σ、c和ε,輸入8月份測(cè)試集的特征向量得到負(fù)荷預(yù)測(cè)值,計(jì)算模型預(yù)測(cè)精度。簇2共有27個(gè)樣本(24個(gè)訓(xùn)練樣本,3個(gè)測(cè)試樣本),簇3共有32個(gè)樣本(21個(gè)訓(xùn)練樣本,11個(gè)測(cè)試樣本),同上可以計(jì)算出簇2和簇3的8月份的負(fù)荷預(yù)測(cè)值。
(3)負(fù)荷預(yù)測(cè)結(jié)果及討論:如圖2所示,運(yùn)用k-medoids聚類算法進(jìn)行相似日聚類分析,類簇中心點(diǎn)k=3,選取日類型、日平均氣溫和七日前日最高負(fù)荷作為特征向量,得到最終的聚類結(jié)果,即簇1、簇2和簇3。分別輸入每個(gè)簇中6月份和7月份原始向量訓(xùn)練apso-svm模型,得到各簇8月份的預(yù)測(cè)結(jié)果,進(jìn)而得到整個(gè)8月份的負(fù)荷預(yù)測(cè)值。
如圖3-8所示,簇1、簇2和簇3的預(yù)測(cè)結(jié)果由擬合程度和相對(duì)誤差可以看出,km-apso-svm與原始負(fù)荷的擬合程度明顯優(yōu)于km-pso-svm模型,說明apso相對(duì)于pso可以更好的優(yōu)化svm參數(shù),提高系統(tǒng)預(yù)測(cè)精度。
如圖9和10所示,8月份的預(yù)測(cè)結(jié)果由擬合程度和相對(duì)誤差獲得。
最后需要指出的是:以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制。盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。