亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于電力大數(shù)據(jù)的自適應(yīng)負(fù)荷預(yù)測(cè)選擇方法

文檔序號(hào):9888796閱讀:489來(lái)源:國(guó)知局
一種基于電力大數(shù)據(jù)的自適應(yīng)負(fù)荷預(yù)測(cè)選擇方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種負(fù)荷預(yù)測(cè)選擇方法,具體涉及一種基于電力大數(shù)據(jù)的自適應(yīng)負(fù)荷 預(yù)測(cè)選擇方法。
【背景技術(shù)】
[0002] 負(fù)荷預(yù)測(cè)是根據(jù)系統(tǒng)的運(yùn)行特性、增容決策、自然條件與社會(huì)影響等諸多因數(shù),在 滿足一定精度要求的條件下,確定未來(lái)某特定時(shí)刻的負(fù)荷數(shù)據(jù),其中負(fù)荷是指電力需求量 (功率)或用電量;負(fù)荷預(yù)測(cè)是電力系統(tǒng)經(jīng)濟(jì)調(diào)度中的一項(xiàng)重要內(nèi)容。
[0003] 自適應(yīng)的負(fù)荷預(yù)測(cè)是根據(jù)客戶(hù)類(lèi)別和客戶(hù)擁有的數(shù)據(jù)量和數(shù)據(jù)中負(fù)荷分布情況 調(diào)用最適合的負(fù)荷分類(lèi)方法,對(duì)重過(guò)載負(fù)荷進(jìn)行預(yù)測(cè)。因?yàn)椴煌蛻?hù)不同部門(mén)的電力數(shù)據(jù) 采集、存儲(chǔ)、運(yùn)行和數(shù)據(jù)的特征都有很大的差異。所以,很難建立一個(gè)統(tǒng)一的電力負(fù)荷預(yù)測(cè) 模型。故本發(fā)明綜合分析客戶(hù)信息和客戶(hù)所有的電力數(shù)據(jù)信息,自適應(yīng)選擇合適的分類(lèi)算 法構(gòu)造負(fù)荷預(yù)測(cè)模型,實(shí)現(xiàn)智能化管理。
[0004] 電力大數(shù)據(jù)負(fù)荷預(yù)測(cè)經(jīng)典的建模方法。電力負(fù)荷預(yù)測(cè)的方法在近年來(lái)已取得長(zhǎng)足 的進(jìn)步,傳統(tǒng)的建模方法也有幾十種,但隨著智能電網(wǎng)、通信網(wǎng)絡(luò)技術(shù)和傳感器技術(shù)的發(fā) 展,電力數(shù)據(jù)呈指數(shù)級(jí)增長(zhǎng)、復(fù)雜程度增大,逐步構(gòu)成電力大數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)分析模式已 無(wú)法滿足需求。因此,本發(fā)明重點(diǎn)介紹三種適合用于電力大數(shù)據(jù)負(fù)荷預(yù)測(cè)且高效的分類(lèi)算 法,并分析其優(yōu)缺點(diǎn),為下文的自適應(yīng)選擇模型做準(zhǔn)備。
[0005] AdaBoost 建模方法
[0006] 提升樹(shù)是把"弱學(xué)習(xí)算法"提升(boost)為"強(qiáng)學(xué)習(xí)算法"的經(jīng)典算法,即構(gòu)建多個(gè) 弱分類(lèi)模型,最后用一種非隨機(jī)的方式組合多個(gè)弱分類(lèi)器進(jìn)行決策。每輪的弱分類(lèi)器構(gòu)建 根據(jù)上一輪樣本的預(yù)測(cè)情況,賦予不同的權(quán)重,如果樣本不能正確的分類(lèi),則它的權(quán)重增 加。如果樣本正確分類(lèi),則它的權(quán)重減少。元組的權(quán)重反映對(duì)它們分類(lèi)的困難程度--權(quán)重 越高,越可能錯(cuò)誤的分類(lèi)。使用這些權(quán)重,為下一輪的分類(lèi)器產(chǎn)生訓(xùn)練樣本。其基本思想是, 希望算法更關(guān)注上一輪誤分類(lèi)的樣本。所以,該方法可以明顯提高分類(lèi)的準(zhǔn)確率。但是,由 于AdaBoost關(guān)注錯(cuò)誤分類(lèi)的樣本,所以存在結(jié)果負(fù)荷模型對(duì)數(shù)據(jù)過(guò)分?jǐn)M合的危險(xiǎn)。因此,對(duì) 于數(shù)據(jù)正負(fù)樣本分布不平衡的地區(qū),該方法容易產(chǎn)生過(guò)擬合的現(xiàn)象,即使分類(lèi)的總的正確 率會(huì)很高,但是對(duì)于小類(lèi)別樣本預(yù)測(cè)效果較差。
[0007] 隨機(jī)森林方法
[0008] 該方法的模型訓(xùn)練速度快、可擴(kuò)展性強(qiáng),對(duì)錯(cuò)誤和離群點(diǎn)更魯棒,可以防止過(guò)擬合 的現(xiàn)象的發(fā)生。其基本思想:多個(gè)基分類(lèi)模型構(gòu)成的集合就是一個(gè)"森林",單個(gè)的分類(lèi)模型 構(gòu)建都是對(duì)原始數(shù)據(jù)的獨(dú)立抽樣,如此循環(huán)構(gòu)建多個(gè)分類(lèi)模型,分類(lèi)時(shí),每個(gè)分類(lèi)模型都投 票返回得票最多的類(lèi)別。但是它的缺點(diǎn)就是,對(duì)多缺失值多類(lèi)別的數(shù)據(jù)的分類(lèi)效果較差。因 此,采用隨機(jī)森林算法建負(fù)荷預(yù)測(cè)模型時(shí)需判斷輸入數(shù)據(jù)集的質(zhì)量是否適合用該方法實(shí) 現(xiàn)。
[0009] SVM建模方法
[0010] 支持向量機(jī)適用于高維數(shù)據(jù)高精度的預(yù)測(cè),它是一種線性和非線性數(shù)據(jù)的分類(lèi)方 法,它使用非線性映射將原始數(shù)據(jù)映射到高維空間,在該空間內(nèi)搜索最佳分離超平面,從而 對(duì)數(shù)據(jù)分類(lèi)。用該方法實(shí)現(xiàn)對(duì)數(shù)據(jù)的分類(lèi)工作,精度很高,但是由于分類(lèi)過(guò)程中點(diǎn)積計(jì)算量 極大,存在運(yùn)行時(shí)間較長(zhǎng)的問(wèn)題。因此,采用SVM算法建分類(lèi)模型時(shí)需判斷輸入數(shù)據(jù)的數(shù)據(jù) 量和屬性的類(lèi)別是否滿足需求。

【發(fā)明內(nèi)容】

[0011] 為了克服上述現(xiàn)有技術(shù)的不足,本發(fā)明提供一種基于電力大數(shù)據(jù)的自適應(yīng)負(fù)荷預(yù) 測(cè)選擇方法,本發(fā)明對(duì)新客戶(hù)類(lèi)別進(jìn)行預(yù)測(cè),自適應(yīng)選擇負(fù)荷預(yù)測(cè)算法,實(shí)現(xiàn)智能電網(wǎng)管 理。
[0012]為了實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明采取如下技術(shù)方案:
[0013] -種基于電力大數(shù)據(jù)的自適應(yīng)負(fù)荷預(yù)測(cè)選擇方法,所述方法包括如下步驟:
[0014] (1)客戶(hù)類(lèi)別判斷;
[0015] (2)電力數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘和數(shù)據(jù)化簡(jiǎn);
[0016] (3)自適應(yīng)負(fù)荷預(yù)測(cè)建模。
[0017]優(yōu)選的,所述步驟(1)中,包括如下步驟:
[0018]步驟1-1、收集客戶(hù)的特征數(shù)據(jù);
[0019] 步驟1-2、調(diào)用已封裝好的兩步聚類(lèi)方法構(gòu)建客戶(hù)聚類(lèi)模型,建模時(shí)設(shè)置聚類(lèi)數(shù)為 3;
[0020] 步驟1-3、用客戶(hù)聚類(lèi)模型進(jìn)行預(yù)測(cè)時(shí)將預(yù)測(cè)結(jié)果為0的客戶(hù)定義為小客戶(hù),輸出 客戶(hù)類(lèi)型為1,將預(yù)測(cè)結(jié)果非〇的客戶(hù)定義為非小客戶(hù),客戶(hù)類(lèi)型為2。
[0021] 優(yōu)選的,所述特征數(shù)據(jù)包括:客戶(hù)所在地區(qū)信息、該地區(qū)經(jīng)濟(jì)水平、客戶(hù)的員工信 息和客戶(hù)的用戶(hù)量。
[0022] 優(yōu)選的,所述步驟(2)中,包括如下步驟:
[0023]步驟2-1、所述關(guān)聯(lián)規(guī)則挖掘用于從輸入的負(fù)荷數(shù)據(jù)集D中挖掘出與負(fù)荷強(qiáng)關(guān)聯(lián)的 屬性,即滿足最小支持度與最小置信度的規(guī)則中包含的屬性;
[0024]步驟2-2、提取強(qiáng)關(guān)聯(lián)屬性的數(shù)據(jù),從而對(duì)負(fù)荷數(shù)據(jù)集D進(jìn)行化簡(jiǎn),化簡(jiǎn)后的負(fù)荷數(shù) 據(jù)D'作為分類(lèi)的輸入數(shù)據(jù)。
[0025] 優(yōu)選的,所述關(guān)聯(lián)規(guī)則用于描述不同項(xiàng)集之間的相互依存性和關(guān)聯(lián)性,其基本形式為 ,其中A與B是兩個(gè)互斥的項(xiàng)集,所述關(guān)聯(lián)規(guī)則的度量包括支持度、置信度和提升度;所述 支持度是項(xiàng)集中包含A和B的項(xiàng)數(shù)與所有項(xiàng)數(shù)之比,公式為:support (Ai:B) = P (AUB) ,所述置信 度是包含項(xiàng)集A的事物中也包含項(xiàng)集B所占的百分比,公式為:_Mence (A二B)=尸(半),所述提升度 是置信度與包含項(xiàng)集B的事物所占百分比的比值,公式為
[0026] 優(yōu)選的,所述步驟2-2包括如步驟:
[0027] 步驟2-2-1、給定支持度的最小閾值,稱(chēng)為最小支持度,置信度的最小閾值,稱(chēng)為最 小置信度;
[0028] 步驟2-2-2、根據(jù)重載和過(guò)載樣本的實(shí)際比率設(shè)置不同的最小置信度和最小支持 度分別提取影響重載的規(guī)則rulel和過(guò)載的規(guī)則rule2;
[0029] 步驟2-2-3、提取所述rule 1和所述rule2中包含的屬性,作為與負(fù)荷強(qiáng)關(guān)聯(lián)的屬 性,從負(fù)荷數(shù)據(jù)集D保留只包含此強(qiáng)關(guān)聯(lián)屬性和負(fù)荷屬性的列數(shù)據(jù),作為分類(lèi)的輸入數(shù)據(jù) D,。
[0030] 優(yōu)選的,所述步驟(7)包括如下步驟:
[0031]步驟3-1、判斷客戶(hù)類(lèi)型,若是小客戶(hù),則執(zhí)行步驟3-2,否則執(zhí)行步驟3-4;
[0032]步驟3-2、判斷數(shù)據(jù)量是否在SVM建模方法適應(yīng)的范圍內(nèi),若是則分別采用SVM建模 方法和隨機(jī)森林方法構(gòu)建負(fù)荷預(yù)測(cè)模型,最終選擇選擇正確率和靈敏度較高的模型輸出, 方法結(jié)束;否則執(zhí)行步驟3-3;
[0033]步驟3-3、分別采用隨機(jī)森林方法和AdaBoost建模方法構(gòu)建負(fù)荷預(yù)測(cè)模型,最終選 擇正確率和靈敏度較高的模型輸出,方法結(jié)束;
[0034]步驟3-4、根據(jù)數(shù)據(jù)負(fù)荷類(lèi)別分布情況選擇分類(lèi)方法,當(dāng)負(fù)荷類(lèi)別分布不平衡即負(fù) 荷類(lèi)別的比例小于閾值min_rate時(shí),選擇隨機(jī)森林方法構(gòu)建負(fù)荷預(yù)測(cè)模型輸出,否則在隨 機(jī)森林方法和AdaBoost建模方法中選擇模型正確率較高的模型輸出。
[0035]優(yōu)選的,所述步驟3-2中,所述正確率為該分類(lèi)器正確分類(lèi)的元組所占的百分比, 表達(dá)式為:
[0036]
[0037]式中TP是真正例,指被分類(lèi)器正確分類(lèi)的正元組,TN是真負(fù)例,指被分類(lèi)其正確分 類(lèi)的負(fù)元組,P是正元組數(shù),N是負(fù)元組數(shù),accuracy為正確率;
[0038]所述靈敏度為正確識(shí)別的正元組的百分比,表達(dá)式為:
[0039]
[0040] 式中,sensitivity 為靈敏度。
[0041] 與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:
[0042] 本發(fā)明構(gòu)造客戶(hù)聚類(lèi)模型,對(duì)新客戶(hù)類(lèi)別進(jìn)行預(yù)測(cè),用客戶(hù)的類(lèi)別并結(jié)合電力數(shù) 據(jù)的分布,系統(tǒng)可自適應(yīng)選擇負(fù)荷預(yù)測(cè)算法,實(shí)現(xiàn)智能電網(wǎng)管理。
[0043] 本發(fā)明在負(fù)荷數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析,分別提取影響重載和過(guò)載的特征,刪除無(wú)影 響的特征,一方面可以解決電力大數(shù)據(jù)候選屬性過(guò)多,構(gòu)造電力負(fù)荷模型效率低的問(wèn)題,另 一方面管理者可以根據(jù)提取到的特征分析該地區(qū)重過(guò)載的原因,對(duì)發(fā)電、輸電、配電系統(tǒng)新 增容量的大小做出正確的決策,是電力系統(tǒng)管理的現(xiàn)代化手段。
【附圖說(shuō)明】
[0044] 圖1是本發(fā)明提供的一種基于電力大數(shù)據(jù)的自適應(yīng)負(fù)荷預(yù)測(cè)選擇方法流程圖, [0045]圖2是本發(fā)明提供的電力數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘和數(shù)據(jù)化簡(jiǎn)的流程圖,
[0046] 圖3是本發(fā)明提供的自適應(yīng)負(fù)荷預(yù)測(cè)建模流程圖。
【具體實(shí)施方式】
[0047] 下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。
[0048] 如圖1所示,為本發(fā)明提供的一種基于電力大數(shù)據(jù)的自適應(yīng)負(fù)荷預(yù)測(cè)選擇方法,所 述方法包括如下步驟:
[0049] 步驟1、客戶(hù)類(lèi)別判斷;
[0050] 在進(jìn)行電力負(fù)荷預(yù)測(cè)的時(shí)候由于電力數(shù)據(jù)中涉及用電用戶(hù)的地址、行業(yè)等敏感信 息,客戶(hù)不方便提供具體的負(fù)荷數(shù)據(jù)。電力負(fù)荷數(shù)據(jù)量大,根據(jù)數(shù)據(jù)去選擇合適的負(fù)荷預(yù)測(cè) 模型效率低。
[0051] 此時(shí)可以根據(jù)客戶(hù)的類(lèi)別去選擇適合的負(fù)荷預(yù)測(cè)模型。因?yàn)榭蛻?hù)的類(lèi)別與客戶(hù)電 網(wǎng)數(shù)據(jù)之間往往存在著密切的關(guān)聯(lián),如小客戶(hù)的電力數(shù)據(jù)量,電力數(shù)據(jù)的特征數(shù)小于大客 戶(hù)的電力數(shù)據(jù)量和數(shù)據(jù)特征數(shù)。由此可見(jiàn),相同類(lèi)別的客戶(hù)需要的電力負(fù)荷預(yù)測(cè)模型也相 似。因此,可以收集客戶(hù)的特征數(shù)據(jù):如客戶(hù)所在地區(qū)信息、該
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1