一種基于數(shù)據(jù)挖掘的水庫多目標調度規(guī)則參數(shù)優(yōu)選方法
【專利摘要】本發(fā)明公開了一種基于數(shù)據(jù)挖掘的水庫多目標調度規(guī)則參數(shù)優(yōu)選方法,采用多目標優(yōu)化算法得到水庫多目標調度非劣解集,并利用隨機森林模型建立所有水庫調度規(guī)則參數(shù)與非劣解集的關系,通過評價各參數(shù)對非劣解集的預測效果,優(yōu)選出信息量最大的水庫多目標調度規(guī)則參數(shù)。本發(fā)明能有效利用水庫優(yōu)化調度信息,大大減少水庫調度規(guī)則中的參數(shù)個數(shù),提高了水庫多目標優(yōu)化調度模型的求解效率,為水庫的科學決策提供更簡單且可操作性強的參考依據(jù)。
【專利說明】
一種基于數(shù)據(jù)挖掘的水庫多目標調度規(guī)則參數(shù)優(yōu)選方法
技術領域
[0001]本發(fā)明屬于水庫調度技術領域,涉及一種基于數(shù)據(jù)挖掘的水庫多目標調度規(guī)則參數(shù)優(yōu)選方法。
【背景技術】
[0002]水庫作為一種徑流調節(jié)的工具,在使水資源更適合人類社會發(fā)展以及維護生態(tài)環(huán)境方面發(fā)揮著重要作用,水庫調度規(guī)則是一種指導水庫運行的方式。隨著社會進步和經(jīng)濟發(fā)展,人們對水資源利用有了更多需求,一般通過智能多目標優(yōu)化算法得到滿足多種用水需求的水庫調度規(guī)則。但水庫多目標優(yōu)化問題往往存在著非線性、高維度的特點,增加了智能算法的尋優(yōu)成本,如何在多個水庫調度規(guī)則中優(yōu)選出最有價值的參數(shù),從而降低優(yōu)化維度,提高尋優(yōu)效率對水庫的運行管理有著重要意義。
[0003]數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程,近年來,數(shù)據(jù)挖掘引起了信息產(chǎn)業(yè)界的極大關注,其主要原因是存在大量數(shù)據(jù),可以廣泛使用,并且迫切需要將這些數(shù)據(jù)轉換成有用的信息和知識。隨機森林作為數(shù)據(jù)挖掘技術中的一種,并以其運算量小、預測精度高等特點而被用于分類和回歸分析([文獻I])。易堯華等([文獻2])提出了一種基于隨機森林的衛(wèi)星遙感影像云量計算方法,通過樣本獲取、影像回歸分類等步驟計算了遙感影像中的云量。隨著數(shù)據(jù)挖掘技術在水庫調度領域方面的深入發(fā)展,國內(nèi)學者提出了基于數(shù)據(jù)挖掘的水庫調度方法。例如:張弛([文獻3])等利用數(shù)據(jù)挖掘中的決策樹技術對多年水庫實際水文數(shù)據(jù)和調度數(shù)據(jù)進行分析和挖掘,結合預報入流從中挖掘出以調度樹形式的水庫調度規(guī)則。習樹峰等([文獻4])利用決策樹方法利用預報降雨數(shù)據(jù)、前期土壤含水量、當前庫水位等水庫調度數(shù)據(jù),提取了跨流域弓I水水庫的實時調度規(guī)則。在水庫多目標優(yōu)化調度方面,周研來等([文獻5])采用自適應遺傳算法編制多目標優(yōu)化調度圖,在保證水庫防洪安全的前提下最大限度地提高水庫調度的綜合效益。楊光等([文獻6])考慮未來徑流變化對水庫調度的影響,采用非支配排序遺傳算法(NSGA-1I)算法推求了兼顧丹江口水庫供水和發(fā)電的多目標調度規(guī)則。然而,他們并沒有將數(shù)據(jù)挖掘技術整合到水庫多目標優(yōu)化調度規(guī)則參數(shù)的提取中。決策樹作為一種數(shù)據(jù)挖掘技術在提取水庫調度規(guī)則時可能存在過擬合現(xiàn)象,而隨機森林能夠通過整合多個決策樹而降低過擬合概率。
[0004]隨機森林方法能夠從一組無規(guī)律的事例中利用信息論原理對大量樣本的屬性進行分析和歸納,提取隱藏信息,挖掘出數(shù)據(jù)間的相互關系,尋找出有價值的信息。所以該方法能夠從復雜的水庫調度規(guī)則中尋找出最有利于多目標優(yōu)化調度的參數(shù)?,F(xiàn)有的水庫多目標優(yōu)化模型往往直接對水庫調度規(guī)則進行優(yōu)化,沒有避開原有規(guī)則中的冗余信息,且目前尚未有研究采用隨機森林方法優(yōu)選水庫多目標調度規(guī)則參數(shù)。
[0005][文獻I]李欣海.隨機森林模型在分類與回歸分析中的應用[J].應用昆蟲學報,2013,50(4):1190-1197.
[0006][文獻2]易堯華,袁媛,張宇,等.一種基于隨機森林的衛(wèi)星遙感影像云量計算方法.專利號:CN105260729A.
[0007][文獻3]張弛,周惠成,王本德.決策樹技術在水庫興利調度中的應用研究[J].哈爾濱工業(yè)大學學報,2007,39(8): 1314-1318.
[0008][文獻4]習樹峰,彭勇,梁國華,等.基于決策樹方法的水庫跨流域引水調度規(guī)則研究[J].大連理工大學學報,2012,52(1): 74-78.
[0009][文獻5]周研來,郭生練,陳華,等.一種自適應氣候變化的水庫多目標優(yōu)化調度圖編制方法.專利號:CNl 0304967IA
[0010][文獻6]楊光,郭生練,李立平,等.考慮未來徑流變化的丹江口水庫多目標調度規(guī)則研究[J].水力發(fā)電學報,2015,34(12):54-63.
【發(fā)明內(nèi)容】
[0011]針對現(xiàn)有技術存在的不足,本發(fā)明提供了一種基于數(shù)據(jù)挖掘的水庫多目標調度規(guī)則參數(shù)優(yōu)選方法。
[0012]本發(fā)明所采用的技術方案是:一種基于數(shù)據(jù)挖掘的水庫多目標調度規(guī)則參數(shù)優(yōu)選方法,其特征在于,包括以下步驟:
[0013]步驟1:收集水庫上游站點觀測的數(shù)據(jù)資料,將水庫調度規(guī)則用數(shù)學公式的方式進行描述;
[0014]步驟2:采用多目標優(yōu)化算法,以水庫歷史入庫流量作為輸入,對水庫調度規(guī)則中的參數(shù)進行優(yōu)化,得到一系列能夠滿足水庫多目標利用需求的非劣解集;
[0015]步驟3:根據(jù)步驟2中得到的非劣解集及其對應的水庫調度規(guī)則參數(shù),采用隨機森林對它們的屬性進行分析和歸納,挖掘其間的相互聯(lián)系,并通過參數(shù)預測非劣解集;
[0016]步驟4:統(tǒng)計各水庫調度規(guī)則參數(shù)對非劣解集的預測效果,將預測精度最高的前M個參數(shù)作為描述水庫調度規(guī)則信息量最大的參數(shù);
[0017]步驟5:采用多目標算法優(yōu)化步驟4中優(yōu)選的參數(shù),得到新的水庫調度規(guī)則。
[0018]作為優(yōu)選,步驟I中所述上游站點觀測的數(shù)據(jù)包括入庫流量和各水庫之間的區(qū)間流量過程。
[0019]作為優(yōu)選,步驟2中所述多目標優(yōu)化算法,其具體實現(xiàn)包括以下子步驟:
[0020]步驟2.1:對水庫調度規(guī)則中的參數(shù)進行編碼,對編碼的參數(shù)進行隨機賦值,生成初始種群,對初始種群中每一組編碼值進行解碼,得到水庫調度規(guī)則參數(shù),并將歷史入庫數(shù)據(jù)作為輸入,按規(guī)則調度得到最后的調度結果;
[0021]步驟2.2:將步驟2.1中產(chǎn)生的調度結果進行篩選排序,并挑選出不被任何其余結果支配的解,作為本次調度產(chǎn)生的非劣解集;
[0022]步驟2.3:在步驟2.2中生成的非劣解集中隨機抽取預設個數(shù)的解,并將這些解對應的參數(shù)集作為子代進行編碼;
[0023]步驟2.4:對步驟2.3生成的子代進行雜交、變異操作,生成新的種群,并解碼得到水庫調度規(guī)則參數(shù),將歷史入庫數(shù)據(jù)作為輸入,按規(guī)則調度得到最后的調度結果;
[0024]步驟2.5:重復步驟2.2—步驟2.4,直到本次得到的調度結果與上一次得到的結果之間的差異在預設范圍內(nèi),將最后生成的一組參數(shù),作為水庫多目標優(yōu)化調度規(guī)則,并將對應的調度結果作為能夠滿足水庫多目標利用需求的非劣解集。
[0025]作為優(yōu)選,步驟3中所述采用隨機森林對它們的屬性進行分析和歸納,其具體實現(xiàn)包括以下子步驟:
[0026]步驟3.1:將歷史資料分為率定期和檢驗期部分,并將一類水庫調度規(guī)則參數(shù)和對應的非劣解集作為數(shù)據(jù)集,其中率定期的為訓練集,檢驗期的為測試集;
[0027]步驟3.2:在率定期的訓練集中進行η次重復隨機抽樣,形成多個訓練子集;按照一類規(guī)則參數(shù)對應一組非劣解集的原則,針對各訓練子集分別建立決策樹,構成隨機森林,以描述調度規(guī)則參數(shù)與非劣解集的回歸關系;
[0028]步驟3.3:采用檢驗期測試集數(shù)據(jù),利用步驟3.2中建立的調度規(guī)則參數(shù)與非劣解集的回歸關系,推求測試集中水庫調度規(guī)則參數(shù)對應的非劣解集;
[0029]步驟3.4:對步驟3.3中的預測結果進行綜合,得到最終的預測結果;
[0030]步驟3.5:重復步驟3.1一步驟3.4,直到遍歷完所有水庫調度規(guī)則參數(shù),采用隨機森林建立其與非劣解集的關系,并得到每一組水庫調度參數(shù)對非劣解集的預測結果。
[0031]作為優(yōu)選,步驟4中,將所有水庫調度規(guī)則參數(shù)預測的非劣解集與實際結果進行對比,并采用均方根誤差評價所有水庫調度規(guī)則參數(shù)的預測效果,將預測精度最高的前M個參數(shù)作為描述水庫調度規(guī)則信息量最大的參數(shù)。
[0032]與現(xiàn)有技術相比,本發(fā)明具有以下有益效果:
[0033]該模型合理利用水庫初始調度規(guī)則參數(shù)和非劣解集的信息,通過采用隨機森林模型優(yōu)選出最能反應水庫多目標調度規(guī)則的參數(shù),大大減少了被優(yōu)化參數(shù)的數(shù)量,降低了多目標算法的優(yōu)化成本,提高了水庫多目標優(yōu)化調度規(guī)則的推求效率,提供了更加簡單的調度規(guī)則,從而大大方便了水庫的運行管理。
【附圖說明】
[0034]圖1為本發(fā)明實施例的隨機森林建立及預測流程圖;
[0035]圖2為本發(fā)明實施例的多目標優(yōu)化算法流程圖;
[0036]圖3為本發(fā)明實施例的多目標非劣解集分布示意圖,其中(a)表示三個目標函數(shù)情形,(b)表示三個目標函數(shù)情形;
[0037]圖4為本發(fā)明實施例的水庫多目標調度規(guī)則參數(shù)優(yōu)選流程圖。
【具體實施方式】
[0038]為了便于本領域普通技術人員理解和實施本發(fā)明,下面結合附圖及實施例對本發(fā)明作進一步的詳細描述,應當理解,此處所描述的實施示例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0039]本發(fā)明將水庫多目標優(yōu)化調度模型與隨機森林模型相結合,提出了一種基于數(shù)據(jù)挖掘的水庫多目標調度規(guī)則參數(shù)優(yōu)選方法,水庫多目標調度規(guī)則參數(shù)優(yōu)選流程圖如圖1所不O
[0040]本發(fā)明的具體實現(xiàn)包括以下步驟:
[0041]步驟I,收集水庫上游站點觀測的入庫流量等數(shù)據(jù)資料,將水庫調度規(guī)則用數(shù)學公式的方式進行描述;具體公式如下:
[0042]Ot = at.(Vt+w.It)+bt;
[0043]式中:Ot為水庫第t時段出庫流量(m3/s);w為單位轉換系數(shù);at和bt為調度函數(shù)中以年為周期變化的規(guī)則參數(shù),即每個月對應不同的值,但每年的同一個月份里at(bt)取同樣的值。Vt為安康水庫第t時段初水庫可用蓄水量(m3/s); It為安康水庫第t時段入庫流量(m3/
S) O
[0044]步驟2,采用多目標優(yōu)化算法,以水庫歷史入庫流量作為輸入,對水庫調度規(guī)則中的參數(shù)進行優(yōu)化,得到一系列能夠滿足水庫多目標利用需求的非劣解集,多目標優(yōu)化算法流程圖及非劣解分布(示意圖)分別如圖2和圖3所示。
[0045]步驟2為本領域常規(guī)技術,進一步包括以下子步驟:
[0046](I)對水庫調度規(guī)則中的參數(shù)at和bt進行編碼,對編碼的參數(shù)進行隨機賦值,生成初始種群,對初始種群中每一組編碼值進行解碼,得到水庫調度規(guī)則參數(shù)at和bt,并將歷史入庫數(shù)據(jù)作為輸入,按規(guī)則調度得到最后的調度結果。
[0047](2)將(I)中產(chǎn)生的調度結果進行篩選排序,并挑選出不被任何其余結果支配的解,作為本次調度產(chǎn)生的非劣解集。
[0048](3)在(2)中生成的非劣解集中挑選結果較優(yōu)的解,并將這些解對應的參數(shù)集作為子代進行編碼。
[0049](4)對(3)生成的子代進行雜交、變異等操作,生成新的種群,并解碼得到水庫調度規(guī)則參數(shù)at和bt,將歷史入庫數(shù)據(jù)作為輸入,按規(guī)則調度得到最后的調度結果。
[0050](5)重復(2) — (4),直到滿足結束條件(本次得到的調度結果與上一次得到的結果之間的差異在預設范圍內(nèi)),將最后生成的一組參數(shù)at和bt,作為水庫多目標優(yōu)化調度規(guī)則,并將對應的調度結果作為能夠滿足水庫多目標利用需求的非劣解集。
[0051]步驟3,根據(jù)步驟2中得到的非劣解集及其對應的水庫調度規(guī)則參數(shù)at和bt,按照一類參數(shù)對應一組非劣解集的原則,分別采用隨機森林建立每一類水庫調度規(guī)則參數(shù)與所得非劣解集的關系,將它們的屬性進行分析和歸納,并通過選定的參數(shù)預測非劣解集,隨機森林建立及預測流程圖如圖4所示。
[0052]步驟3進一步包括以下子步驟:
[0053](I)將歷史資料分為率定期和檢驗期部分,并將一類水庫調度規(guī)則參數(shù)和對應的非劣解集作為數(shù)據(jù)集,其中率定期的為訓練集,檢驗期的為測試集。
[0054](2)在率定期的訓練集中進行η次重復隨機抽樣,形成多個訓練子集。按照一類規(guī)則參數(shù)對應一組非劣解集的原則,針對各訓練子集分別建立決策樹,構成隨機森林,以描述調度規(guī)則參數(shù)與非劣解集的回歸關系。
[0055](3)采用檢驗期測試集數(shù)據(jù),利用(2)中建立的調度規(guī)則參數(shù)與非劣解集的回歸關系,推求測試集中水庫調度規(guī)則參數(shù)對應的非劣解集。
[0056](4)對(3)中的預測結果進行綜合,得到最終的預測結果。
[0057](5)重復(I) 一 (4),直到遍歷完所有水庫調度規(guī)則參數(shù),采用隨機森林建立其與非劣解集的關系,并得到每一組水庫調度參數(shù)對非劣解集的預測結果。
[0058]步驟4,將所有水庫調度規(guī)則參數(shù)預測的非劣解集與實際結果進行對比,并采用均方根誤差評價所有水庫調度規(guī)則參數(shù)的預測效果,將預測精度最高的前M個參數(shù)作為描述水庫調度規(guī)則信息量最大的參數(shù)。
[0059]步驟5,采用多目標算法優(yōu)化步驟4中優(yōu)選的參數(shù),得到新的水庫調度規(guī)則。
[0060]本發(fā)明能有效利用水庫優(yōu)化調度信息,大大減少水庫調度規(guī)則中的參數(shù)個數(shù),提高了水庫多目標優(yōu)化調度模型的求解效率,為水庫的科學決策提供更簡單且可操作性強的參考依據(jù)。
[0061]應當理解的是,本說明書未詳細闡述的部分均屬于現(xiàn)有技術。
[0062]應當理解的是,上述針對較佳實施例的描述較為詳細,并不能因此而認為是對本發(fā)明專利保護范圍的限制,本領域的普通技術人員在本發(fā)明的啟示下,在不脫離本發(fā)明權利要求所保護的范圍情況下,還可以做出替換或變形,均落入本發(fā)明的保護范圍之內(nèi),本發(fā)明的請求保護范圍應以所附權利要求為準。
【主權項】
1.一種基于數(shù)據(jù)挖掘的水庫多目標調度規(guī)則參數(shù)優(yōu)選方法,其特征在于,包括以下步驟: 步驟1:收集水庫上游站點觀測的數(shù)據(jù)資料,將水庫調度規(guī)則用數(shù)學公式的方式進行描述; 步驟2:采用多目標優(yōu)化算法,以水庫歷史入庫流量作為輸入,對水庫調度規(guī)則中的參數(shù)進行優(yōu)化,得到一系列能夠滿足水庫多目標利用需求的非劣解集; 步驟3:根據(jù)步驟2中得到的非劣解集及其對應的水庫調度規(guī)則參數(shù),采用隨機森林對它們的屬性進行分析和歸納,挖掘其間的相互聯(lián)系,并通過參數(shù)預測非劣解集; 步驟4:統(tǒng)計各水庫調度規(guī)則參數(shù)對非劣解集的預測效果,將預測精度最高的前M個參數(shù)作為描述水庫調度規(guī)則信息量最大的參數(shù); 步驟5:采用多目標算法優(yōu)化步驟4中優(yōu)選的參數(shù),得到新的水庫調度規(guī)則。2.根據(jù)權利要求1所述的基于數(shù)據(jù)挖掘的水庫多目標調度規(guī)則參數(shù)優(yōu)選方法,其特征在于:步驟I中所述上游站點觀測的數(shù)據(jù)包括入庫流量和各水庫之間的區(qū)間流量過程。3.根據(jù)權利要求1所述的基于數(shù)據(jù)挖掘的水庫多目標調度規(guī)則參數(shù)優(yōu)選方法,其特征在于,步驟2中所述多目標優(yōu)化算法,其具體實現(xiàn)包括以下子步驟: 步驟2.1:對水庫調度規(guī)則中的參數(shù)進行編碼,對編碼的參數(shù)進行隨機賦值,生成初始種群,對初始種群中每一組編碼值進行解碼,得到水庫調度規(guī)則參數(shù),并將歷史入庫數(shù)據(jù)作為輸入,按規(guī)則調度得到最后的調度結果; 步驟2.2:將步驟2.1中產(chǎn)生的調度結果進行篩選排序,并挑選出不被任何其余結果支配的解,作為本次調度產(chǎn)生的非劣解集; 步驟2.3:在步驟2.2中生成的非劣解集中隨機抽取預設個數(shù)的解,并將這些解對應的參數(shù)集作為子代進行編碼; 步驟2.4:對步驟2.3生成的子代進行雜交、變異操作,生成新的種群,并解碼得到水庫調度規(guī)則參數(shù),將歷史入庫數(shù)據(jù)作為輸入,按規(guī)則調度得到最后的調度結果; 步驟2.5:重復步驟2.2—步驟2.4,直到本次得到的調度結果與上一次得到的結果之間的差異在預設范圍內(nèi),將最后生成的一組參數(shù),作為水庫多目標優(yōu)化調度規(guī)則,并將對應的調度結果作為能夠滿足水庫多目標利用需求的非劣解集。4.根據(jù)權利要求1所述的基于數(shù)據(jù)挖掘的水庫多目標調度規(guī)則參數(shù)優(yōu)選方法,其特征在于,步驟3中所述采用隨機森林對它們的屬性進行分析和歸納,其具體實現(xiàn)包括以下子步驟: 步驟3.1:將歷史資料分為率定期和檢驗期部分,并將一類水庫調度規(guī)則參數(shù)和對應的非劣解集作為數(shù)據(jù)集,其中率定期的為訓練集,檢驗期的為測試集; 步驟3.2:在率定期的訓練集中進行η次重復隨機抽樣,形成多個訓練子集;按照一類規(guī)則參數(shù)對應一組非劣解集的原則,針對各訓練子集分別建立決策樹,構成隨機森林,以描述調度規(guī)則參數(shù)與非劣解集的回歸關系; 步驟3.3:采用檢驗期測試集數(shù)據(jù),利用步驟3.2中建立的調度規(guī)則參數(shù)與非劣解集的回歸關系,推求測試集中水庫調度規(guī)則參數(shù)對應的非劣解集; 步驟3.4:對步驟3.3中的預測結果進行綜合,得到最終的預測結果; 步驟3.5:重復步驟3.1一步驟3.4,直到遍歷完所有水庫調度規(guī)則參數(shù),采用隨機森林建立其與非劣解集的關系,并得到每一組水庫調度參數(shù)對非劣解集的預測結果。5.根據(jù)權利要求1-4任意一項所述的基于數(shù)據(jù)挖掘的水庫多目標調度規(guī)則參數(shù)優(yōu)選方法,其特征在于:步驟4中,將所有水庫調度規(guī)則參數(shù)預測的非劣解集與實際結果進行對比,并采用均方根誤差評價所有水庫調度規(guī)則參數(shù)的預測效果,將預測精度最高的前M個參數(shù)作為描述水庫調度規(guī)則信息量最大的參數(shù)。
【文檔編號】G06F19/00GK106022960SQ201610338489
【公開日】2016年10月12日
【申請日】2016年5月19日
【發(fā)明人】郭生練, 楊光, 李立平, 尹家波, 劉章君
【申請人】武漢大學