多流域?qū)崟r智能水質(zhì)預(yù)測方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了多流域?qū)崟r智能水質(zhì)預(yù)測方法及系統(tǒng),利用遺傳算法對NARX模型進行優(yōu)化處理,解決NARX模型前期參數(shù)不確定的問題;通過模型存儲模塊儲存或調(diào)用GA-NARX模型,使其能實時預(yù)測多流域的水質(zhì)情況;對基礎(chǔ)數(shù)據(jù)、近期數(shù)據(jù)、歷史應(yīng)急數(shù)據(jù)進行三段式訓(xùn)練,使得優(yōu)化后的GA-NARX模型能基本包含河流的污染特征,提升預(yù)測的準(zhǔn)確性;本發(fā)明通過用天氣數(shù)據(jù)代替水文數(shù)據(jù),并進行模糊化處理,有效解決流量數(shù)據(jù)缺失對模型的影響。本發(fā)明通過改進后的DTW算法進行相似污染時間序列模板的匹配,迅速找到流域歷史上相似的污染過程,借鑒學(xué)習(xí)其經(jīng)驗,能更精準(zhǔn)地預(yù)測突發(fā)性應(yīng)急事故。本發(fā)明可廣泛應(yīng)用于水質(zhì)預(yù)測領(lǐng)域中。
【專利說明】多流域?qū)崟r智能水質(zhì)預(yù)測方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及水質(zhì)預(yù)測領(lǐng)域,尤其涉及一種多流域?qū)崟r智能水質(zhì)預(yù)測方法及系統(tǒng)。
【背景技術(shù)】
[0002] 水質(zhì)預(yù)測是一項前沿性工作,被廣泛用在在水環(huán)境規(guī)劃、評價、管理和科研中???學(xué)合理的水質(zhì)預(yù)測對水資源開發(fā)利用,實時了解河流水質(zhì)的發(fā)展趨勢,制訂水環(huán)境監(jiān)測和 保護實施計劃都有重要意義。隨著國家對水資源保護的重視以及長期的建設(shè)探索積累,地 表水自動監(jiān)測網(wǎng)絡(luò)逐漸完善,水質(zhì)監(jiān)測數(shù)據(jù)呈現(xiàn)"實時監(jiān)測、指標(biāo)多、網(wǎng)絡(luò)化"等特點,為大 尺度多流域水質(zhì)實時預(yù)測提供了重要的數(shù)據(jù)基礎(chǔ)。
[0003] 目前,國內(nèi)外對水質(zhì)預(yù)測方法的研究已經(jīng)推向?qū)嵱没A段,隨著環(huán)境科學(xué)及人工 智能、數(shù)據(jù)挖掘等研究進一步深入以及相關(guān)學(xué)科、領(lǐng)域的不斷發(fā)展,新的預(yù)測模式還在不斷 出現(xiàn)。但由于手工建模工作量大、預(yù)測影響因素的復(fù)雜性和水文信息的缺乏等因素的影響, 使大尺度多流域的水質(zhì)預(yù)測結(jié)果仍不能令人滿意,主要體現(xiàn)在以下幾方面: (1)水質(zhì)預(yù)測方法可分為基于機理模型方法和非機理模型方法兩大類。機理模型方法 主要是根據(jù)污染物在水中的擴散遷移規(guī)律建立數(shù)學(xué)模型,使用定量的方法來仿真污染物的 擴散趨勢。非機理模型方法主要使用統(tǒng)計分析、機器學(xué)習(xí)等數(shù)據(jù)挖掘方法建立數(shù)學(xué)模型來 預(yù)測水質(zhì)污染物變化趨勢。機理模型建模復(fù)雜,參數(shù)率定復(fù)雜,所需要的基礎(chǔ)資料與參數(shù) (如環(huán)境參數(shù)、傳輸參數(shù)、邊界參數(shù)、轉(zhuǎn)化參數(shù)等)很多,為確定這些參數(shù)需要大量物力和財 力,因而不適宜在多個流域同時建立機理模型。
[0004] (2)隨著現(xiàn)代統(tǒng)計學(xué)、數(shù)據(jù)挖掘、人工智能等技術(shù)的發(fā)展,非機理模型得到了廣泛 的應(yīng)用。本專利選神經(jīng)網(wǎng)絡(luò)中的NARX回歸神經(jīng)網(wǎng)絡(luò)作為智能水質(zhì)預(yù)測系統(tǒng)的模型,它是非 線性動態(tài)系統(tǒng)中應(yīng)用最廣泛的一種神經(jīng)網(wǎng)絡(luò),非常適合復(fù)雜的、非平穩(wěn)、非線性時間序列的 預(yù)測。
[0005] 典型的NARX回歸神經(jīng)網(wǎng)絡(luò)在應(yīng)用前一般要事先確定輸入和輸出的延時階數(shù)、隱 層神經(jīng)元個數(shù)等。由于它們的選取沒有成熟的理論依據(jù),只能由經(jīng)驗給出,因不確定因素太 多而影響了其應(yīng)用。
[0006] 同時,NARX神經(jīng)網(wǎng)絡(luò)連接權(quán)值和閾值的整體分布決定著數(shù)據(jù)擬合的效果,但目前 網(wǎng)絡(luò)的初始權(quán)值和閾值是隨機產(chǎn)生的,缺乏選擇依據(jù)。
[0007] (3)NARX模型適用于于確定性關(guān)系的學(xué)習(xí),但當(dāng)存在矛盾樣本和含有非實可測因 素的樣本時,預(yù)測精度將大打折扣。如突發(fā)性污染事故,由于訓(xùn)練樣本是歷史數(shù)據(jù)的平滑處 理,沒有對突發(fā)因素的描述,所以無法對這類突發(fā)污染事故進行精確預(yù)測。
[0008] 由于環(huán)境部門水質(zhì)監(jiān)測多年的發(fā)展,積累了大量的監(jiān)測數(shù)據(jù)。從歷史曾發(fā)生的污 染事故中學(xué)習(xí)其變化規(guī)律,能使NARX模型更好地應(yīng)對突發(fā)性污染事故的預(yù)測,但如何從數(shù) 據(jù)庫中找到最相似的污染事件并從中學(xué)習(xí)是一個尚未解決的技術(shù)難題。
[0009] (4)水質(zhì)監(jiān)測數(shù)據(jù)和水文監(jiān)測數(shù)據(jù)分別反映了水資源的質(zhì)與量,互相結(jié)合才能更 好地反映水資源的規(guī)律和特性。由于目前環(huán)境保護部門和水利部門的數(shù)據(jù)尚未實現(xiàn)實時共 享,因此進行水質(zhì)預(yù)測時沒有水文數(shù)據(jù)的支持,影響了預(yù)測的精度。
[0010] 針對上述現(xiàn)有技術(shù)中的缺陷,本發(fā)明的目的在于提供一種改進的多流域?qū)崟r水質(zhì) 預(yù)測系統(tǒng)和方法,實現(xiàn)自動、高效、準(zhǔn)確的多流域水質(zhì)實時預(yù)測。
【發(fā)明內(nèi)容】
[0011] 為了解決上述技術(shù)問題,本發(fā)明的目的是提供一種能實現(xiàn)自動、高效、準(zhǔn)確的多流 域?qū)崟r水質(zhì)預(yù)測方法及系統(tǒng)。
[0012] 本發(fā)明所采用的技術(shù)方案是: 多流域?qū)崟r智能水質(zhì)預(yù)測方法,包括以下步驟: A、 提取外源天氣數(shù)據(jù)庫的天氣數(shù)據(jù),并對其進行模糊化處理,得到天氣特征狀態(tài)量; B、 對基礎(chǔ)訓(xùn)練數(shù)據(jù)庫中的水質(zhì)監(jiān)測數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)數(shù)據(jù); C、 將天氣特征狀態(tài)量和標(biāo)準(zhǔn)數(shù)據(jù)融合到輸入訓(xùn)練集,并通過NARX模型和遺傳算法優(yōu) 化程序?qū)斎胗?xùn)練集進行訓(xùn)練,得到優(yōu)化后的GA-NARX模型,進而將其存入GA-NARX模型庫 中; D、 獲取各個點位的實時數(shù)據(jù)并對其進行污染檢測,判斷是否屬于突然性應(yīng)急事故,若 是,則通過改進的DTW方法查找流域污染特征庫的最相似污染時間序列并進行訓(xùn)練; E、 根據(jù)各點位的實時數(shù)據(jù)及其對應(yīng)的GA-NARX模型庫中的模型,將最近時間段的數(shù)據(jù) 對模型進行訓(xùn)練,進而對該點位進行水質(zhì)預(yù)測,得出預(yù)測結(jié)果。
[0013] 作為所述的多流域?qū)崟r智能水質(zhì)預(yù)測方法的進一步改進,所述步驟A包括: AU從外源天氣數(shù)據(jù)庫獲取降雨量和溫度值的數(shù)據(jù); A2、根據(jù)年均降雨量和年均溫度值,得到背景降雨量和背景溫度值; A3、根據(jù)最近若干年的年最大降雨量和年最高溫度值,計算得到影響上限降雨量和影 響上限溫度值; A4、根據(jù)背景降雨量、背景溫度值、影響上限降雨量和影響上限溫度值,得出降雨量隸 屬度函數(shù)和溫度隸屬度函數(shù); A5、根據(jù)降雨量隸屬度函數(shù)和溫度隸屬度函數(shù),得到降雨量和溫度模糊化處理后的天 氣特征狀態(tài)量。
[0014] 作為所述的多流域?qū)崟r智能水質(zhì)預(yù)測方法的進一步改進,所述步驟B中標(biāo)準(zhǔn)數(shù)據(jù) 的計算公式為:
【權(quán)利要求】
1. 多流域?qū)崟r智能水質(zhì)預(yù)測方法,其特征在于:包括以下步驟: A、 提取外源天氣數(shù)據(jù)庫的天氣數(shù)據(jù),并對其進行模糊化處理,得到天氣特征狀態(tài)量; B、 對基礎(chǔ)訓(xùn)練數(shù)據(jù)庫中的水質(zhì)監(jiān)測數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)數(shù)據(jù); C、 將天氣特征狀態(tài)量和標(biāo)準(zhǔn)數(shù)據(jù)融合到輸入訓(xùn)練集,并通過NARX模型和遺傳算法優(yōu) 化程序?qū)斎胗?xùn)練集進行訓(xùn)練,得到優(yōu)化后的GA-NARX模型,進而將其存入GA-NARX模型庫 中; D、 獲取各個點位的實時數(shù)據(jù)并對其進行污染檢測,判斷是否屬于突然性應(yīng)急事故,若 是,則通過改進的DTW方法查找流域污染特征庫的最相似污染時間序列并進行訓(xùn)練; E、 根據(jù)各點位的實時數(shù)據(jù)及其對應(yīng)的GA-NARX模型庫中的模型,將最近時間段的數(shù)據(jù) 對模型進行訓(xùn)練,進而對該點位進行水質(zhì)預(yù)測,得出預(yù)測結(jié)果。
2. 根據(jù)權(quán)利要求1所述的多流域?qū)崟r智能水質(zhì)預(yù)測方法,其特征在于:所述步驟A包 括: A1、從外源天氣數(shù)據(jù)庫獲取降雨量和溫度值的數(shù)據(jù); A2、根據(jù)年均降雨量和年均溫度值,得到背景降雨量和背景溫度值; A3、根據(jù)最近若干年的年最大降雨量和年最高溫度值,計算得到影響上限降雨量和影 響上限溫度值; A4、根據(jù)背景降雨量、背景溫度值、影響上限降雨量和影響上限溫度值,得出降雨量隸 屬度函數(shù)和溫度隸屬度函數(shù); A5、根據(jù)降雨量隸屬度函數(shù)和溫度隸屬度函數(shù),得到降雨量和溫度模糊化處理后的天 氣特征狀態(tài)量。
3. 根據(jù)權(quán)利要求1所述的多流域?qū)崟r智能水質(zhì)預(yù)測方法,其特征在于:所述步驟B中 標(biāo)準(zhǔn)數(shù)據(jù)的計算公式為:
4. 根據(jù)權(quán)利要求1所述的多流域?qū)崟r智能水質(zhì)預(yù)測方法,其特征在于:所述步驟C包 括: C1、將天氣特征狀態(tài)量和標(biāo)準(zhǔn)數(shù)據(jù)融合到輸入訓(xùn)練集; C2、根據(jù)輸入訓(xùn)練集,通過遺傳算法對NARX模型的網(wǎng)絡(luò)結(jié)構(gòu)和連接權(quán)進行優(yōu)化,得到 能自動尋優(yōu)運行的GA-NARX模型; C3、將GA-NARX模型存入GA-NARX模型庫中。
5. 根據(jù)權(quán)利要求1所述的多流域?qū)崟r智能水質(zhì)預(yù)測方法,其特征在于:所述步驟D包 括: D1、檢測各個點位的實時數(shù)據(jù)是否有更新,若是,則執(zhí)行步驟D2 ; D2、獲取各個點位更新的實時數(shù)據(jù),并將其與對應(yīng)點位所在水功能區(qū)的污染閾值進行 對比,判斷該點位的實時數(shù)據(jù)是否超標(biāo),若是,則執(zhí)行步驟D3 ;反之,則執(zhí)行步驟E; D3、根據(jù)超標(biāo)的實時數(shù)據(jù),從流域污染特征庫中搜索歷史上最相似的污染時間序列模 式; D4、將搜索得到的污染時間序列模式提供至GA-NARX模型庫中的模型進行訓(xùn)練。
6. 根據(jù)權(quán)利要求5所述的多流域?qū)崟r智能水質(zhì)預(yù)測方法,其特征在于:所述步驟D3包 括: D31、根據(jù)流域污染特征庫,查找其時間長度最短的模板,并計算得到其標(biāo)準(zhǔn)時間長 度; D32、計算流域污染特征庫中其余的模板的時間長度,并計算其與標(biāo)準(zhǔn)時間長度的比 例; D33、根據(jù)計算得到的比例,對相應(yīng)的模板進行相應(yīng)的時間壓縮; D34、當(dāng)實時數(shù)據(jù)的污染時間序列的時間長度超過預(yù)設(shè)的基準(zhǔn)時間長度時,則對污染時 間序列起止點進行匹配,并通過DTW算法對其與優(yōu)化后的流域污染特征庫中的模板進行匹 配,得到最短路徑距離的模板即為最相似的污染時間序列模式。
7. 根據(jù)權(quán)利要求6所述的多流域?qū)崟r智能水質(zhì)預(yù)測方法,其特征在于:所述步驟D34 中對污染時間序列起止點進行匹配,其具體為: D341、根據(jù)預(yù)設(shè)的超標(biāo)值,對實時數(shù)據(jù)在超標(biāo)前的若干個高值點計算其平均值,得到背 景能量值; D342、查找若干個高值點至超標(biāo)值的時間范圍里的第一個超過背景能量值的數(shù)據(jù),得 到污染時間序列起始點; D343、判斷時間序列中是否有連續(xù)預(yù)設(shè)個數(shù)的數(shù)據(jù)低于超標(biāo)值,若是,則查找最后一個 超過超標(biāo)值的數(shù)據(jù),得到污染時間序列終點。
8. 多流域?qū)崟r智能水質(zhì)預(yù)測系統(tǒng),其特征在于,包括: 天氣數(shù)據(jù)模糊化模塊,用于提取外源天氣數(shù)據(jù)庫的天氣數(shù)據(jù),并對其進行模糊化處理, 得到天氣特征狀態(tài)量; 基礎(chǔ)訓(xùn)練數(shù)據(jù)處理模塊,用于對基礎(chǔ)訓(xùn)練數(shù)據(jù)庫中的水質(zhì)監(jiān)測數(shù)據(jù)進行標(biāo)準(zhǔn)化處理, 得到標(biāo)準(zhǔn)數(shù)據(jù); 模型尋優(yōu)模塊,用于將天氣特征狀態(tài)量和標(biāo)準(zhǔn)數(shù)據(jù)融合到輸入訓(xùn)練集,并通過NARX模 型和遺傳算法優(yōu)化程序?qū)斎胗?xùn)練集進行訓(xùn)練,得到優(yōu)化后的GA-NARX模型,進而將其存 入GA-NARX模型庫中; 實時數(shù)據(jù)檢測模塊,用于獲取各個點位的實時數(shù)據(jù)并對其進行污染檢測,判斷是否屬 于突然性應(yīng)急事故,若是,則通過改進的DTW方法查找流域污染特征庫的最相似污染時間 序列并進行訓(xùn)練; 結(jié)果預(yù)測模塊,用于根據(jù)各點位的實時數(shù)據(jù)及其對應(yīng)的GA-NARX模型庫中的模型,將 最近時間段的數(shù)據(jù)對模型進行訓(xùn)練,進而對該點位進行水質(zhì)預(yù)測,得出預(yù)測結(jié)果。
9. 根據(jù)權(quán)利要求8所述的多流域?qū)崟r智能水質(zhì)預(yù)測系統(tǒng),其特征在于:所述模型尋優(yōu) 模塊包括: 數(shù)據(jù)融入模塊,用于將天氣特征狀態(tài)量和標(biāo)準(zhǔn)數(shù)據(jù)融合到輸入訓(xùn)練集; 模型優(yōu)化模塊,用于根據(jù)輸入訓(xùn)練集,通過遺傳算法對NARX模型的網(wǎng)絡(luò)結(jié)構(gòu)和連接權(quán) 進行優(yōu)化,得到能自動尋優(yōu)運行的GA-NARX模型; 模型存儲模塊,用于將GA-NARX模型存入GA-NARX模型庫中。
10. 根據(jù)權(quán)利要求8所述的多流域?qū)崟r智能水質(zhì)預(yù)測系統(tǒng),其特征在于:所述實時數(shù)據(jù) 檢測模塊包括: 數(shù)據(jù)更新檢測模塊,用于檢測各個點位的實時數(shù)據(jù)是否有更新,若是,則執(zhí)行數(shù)據(jù)超標(biāo) 檢測模塊; 數(shù)據(jù)超標(biāo)檢測模塊,用于獲取各個點位更新的實時數(shù)據(jù),并將其與對應(yīng)點位所在水功 能區(qū)的污染閾值進行對比,判斷該點位的實時數(shù)據(jù)是否超標(biāo),若是,則執(zhí)行污染時間序列模 式匹配模塊;反之,則執(zhí)行結(jié)果預(yù)測模塊; 污染時間序列模式匹配模塊,用于根據(jù)超標(biāo)的實時數(shù)據(jù),從流域污染特征庫中搜索歷 史上最相似的污染時間序列模式; 污染時間序列模式訓(xùn)練模塊,用于將搜索得到的污染時間序列模式提供至GA-NARX模 型庫中的模型進行訓(xùn)練。
【文檔編號】G06Q10/04GK104318325SQ201410543016
【公開日】2015年1月28日 申請日期:2014年10月14日 優(yōu)先權(quán)日:2014年10月14日
【發(fā)明者】黎如昊, 郭慶榮, 王強, 陳斐 申請人:廣東省環(huán)境監(jiān)測中心