一種基于小波變換和arma-svm的涌水量預(yù)測方法
【專利摘要】本發(fā)明屬于礦床水文地質(zhì)勘探【技術(shù)領(lǐng)域】,涉及一種基于小波變換和自回歸移動平均模型-支持向量機的涌水量預(yù)測方法;先收集并分析礦井涌水量臺賬資料,然后選取建模樣本和檢驗樣本,對建模樣本進行二進小波分解與重構(gòu),提取原始時間序列中的高頻信息和低頻信息,后利用自回歸移動平均模型對高頻信號建模,同時利用支持向量機模型對低頻信號建模,再將高頻信號模型和低頻信號模型合成,建成涌水量最終預(yù)測模型,最后利用檢驗樣本對最終預(yù)測模型進行檢驗,實現(xiàn)涌水量預(yù)測;其在充分?jǐn)M合低頻信息的同時,避免對高頻信息的過擬合,工作原理可靠,預(yù)測方法簡單,預(yù)測精度高,預(yù)測環(huán)境友好。
【專利說明】—種基于小波變換和ARMA-SVM的涌水量預(yù)測方法
【技術(shù)領(lǐng)域】
:
[0001]本發(fā)明屬于礦床水文地質(zhì)勘探【技術(shù)領(lǐng)域】,涉及一種涌水量預(yù)測方法,特別是一種基于小波變換和自回歸移動平均模型-支持向量機(ARMA-SVM)的涌水量預(yù)測方法。
【背景技術(shù)】
:
[0002]礦井涌水量是單位時間內(nèi)涌入礦坑(包括井、巷和開采系統(tǒng))的水量,它是確定礦床水文地質(zhì)條件復(fù)雜程度及礦井建設(shè)和合理開發(fā)的重要指標(biāo),也是礦井生產(chǎn)部門制定采掘方式,確定滿足所需排水能力且經(jīng)濟的排水設(shè)施的主要依據(jù),對礦井防治水工作具有十分重要的意義。礦井涌水量的預(yù)測是一項比較復(fù)雜和困難的工作,目前礦井涌水量預(yù)測常用方法大致分為兩大類:第一類為確定性的數(shù)學(xué)模型方法,包括水均衡法、解析法和數(shù)值法等,第二類為統(tǒng)計分析方法,包括水文地質(zhì)比擬法、相關(guān)分析法、時間序列分析法、神經(jīng)網(wǎng)絡(luò)方法、支持向量機法和灰色系統(tǒng)法等。確定性的數(shù)學(xué)模型方法要求獲得足夠多的水文地質(zhì)勘探數(shù)據(jù),準(zhǔn)確概化邊界條件,難以準(zhǔn)確建?;驕?zhǔn)確建模的地質(zhì)勘探成本過高;統(tǒng)計分析方法則受到實測資料累計程度和推廣性差等條件的限制。
[0003]統(tǒng)計分析方法中的時間序列方法著重研究具有隨機性的動態(tài)數(shù)據(jù),從頻域和時域的角度對礦山涌水量時間序列的變化規(guī)律進行定量分析;對于那些已建成、影響因素難以確定或量化,且隨后的采掘活動對其涌水量基本無影響的井巷系統(tǒng),可將其歷史觀測臺賬數(shù)據(jù)看成時間序列,該涌水系統(tǒng)的涌水量歷史觀測值就是該“涌水系統(tǒng)”在不同時間、不同條件下的響應(yīng)值,是該系統(tǒng)歷史行為的客觀記錄,因而包含了該系統(tǒng)結(jié)構(gòu)特征及運行規(guī)律,可以通過對該系統(tǒng)歷史時間序列的分析研究來認(rèn)識它的結(jié)構(gòu)特征,如波動的周期、振幅、趨勢,揭示其運行規(guī)律,進而用以預(yù)測。對于穩(wěn)定的時間序列,用自回歸移動平均(ARMA)模型預(yù)測效果較好,但是在實踐中遇到的涌水量時間序列一般是各種因素交織在一起的結(jié)果,大多是一個非平穩(wěn)的時間序列;目前對于非平穩(wěn)時間序列的預(yù)測,一般采用差分自回歸移動平均(ARIMA)模型進行分析與預(yù)測,其基本思想是用差分消除序列中的趨勢項和周期項,而對平穩(wěn)項用ARMA模型進行分析與預(yù)測,這種方法最大的缺點是其結(jié)果丟掉了最重要的信息即趨勢項和周期項,對預(yù)測精度產(chǎn)生不利影響;對于非平穩(wěn)涌水量時間序列預(yù)測,為了提高預(yù)測精度,除了模型的選擇外,關(guān)鍵取決于如何提取時間序列中的低頻和高頻成分并進行建模,以及如何避免對高頻信息的過擬合。現(xiàn)有技術(shù)中尚未見有對礦井涌水量非平穩(wěn)時間序列預(yù)測方法的公開,《電網(wǎng)技術(shù)》第34卷第一期《基于小波分解和最小二乘支持向量機的短期風(fēng)速預(yù)測》文章中寫道,利用二進小波分解與重構(gòu)和支持向量機建模能提高對風(fēng)速預(yù)測的準(zhǔn)確性,但該文章的描述僅僅針對發(fā)電領(lǐng)域風(fēng)速預(yù)測,無法適用于礦井涌水量預(yù)測方法的改善。
【發(fā)明內(nèi)容】
:
[0004]本發(fā)明的目的在于克服現(xiàn)有涌水量預(yù)測技術(shù)中存在的缺陷,尋求提供一種涌水量預(yù)測方法,為了解決涌水量非平穩(wěn)時間序列的預(yù)測問題,考慮到二進正交小波分解對非平穩(wěn)性時間序列的適應(yīng)性,對低頻的分離作用及支持向量機較好的泛化能力,提供一種基于小波變換和ARMA-SVM的涌水量預(yù)測方法,以提高預(yù)測精度。
[0005]為了實現(xiàn)上述目的,本發(fā)明的涌水量預(yù)測技術(shù)方案包括以下步驟:
[0006](I)獲取涌水量原始時間序列:收集礦井確定時間段內(nèi)觀測記錄的涌水量臺賬資料并進行分析,確定可靠的數(shù)據(jù)和必須剔除的數(shù)據(jù);
[0007](2)選取樣本:選取時間序列的前η個觀測樣本數(shù)據(jù)作為建模樣本,后m-n個觀測樣本數(shù)據(jù)作為檢驗樣本,η為隨機選取的建模樣本個數(shù),m為樣本總數(shù);
[0008](3) 二進小波分解與重構(gòu):對建模樣本的原始時間序列進行二進小波分解與重構(gòu),提取原始時間序列中的高頻信息和低頻信息;二進小波分解與重構(gòu)采用馬拉特(Mallat)算法,包括如下步驟:
[0009]①信號分解,將Ctl作為待分解的離散信號,則有:
[0010]cJ+1 = Hcj, dJ+1 = Gcj (j = O, I,…,J);
[0011]其中:H和G分別為低通濾波器和高通濾波器;(Vl和C^1分別為原始信號在分辯率2_?+1)下的低頻信號和高頻信號;j為分解尺度;J為最大分解層數(shù),最終將待分解離散信號 C0 分解為(I1, d2,...,dj 和 Cj ;
[0012]該分解算法利用二抽取,使每層分解比分解前的信號數(shù)據(jù)長度減半,總輸出數(shù)據(jù)長度與輸入待分解離散信號Ctl長度保持一致;待分解離散信號個數(shù)的減少對預(yù)測是不利的,經(jīng)Mallat算法分解后的信號采用重構(gòu)算法進行二插值重構(gòu);
[0013]②信號重構(gòu),重構(gòu)算法為:Cj = H*cJ+1+G*dJ+1 ;
[0014]其中:H*和 G* 是對偶算子;j = J-l, J-2,...0 ;
[0015]對Cl1, d2,...,dj 和 Cj 分別進行重構(gòu),得到 D1, D2,...,Dj 和 Cj,有
[0016]X = D^D2+*..+Dj+Cj ;
[0017]其中A1: {d1;1, d1;2,…},…,Dj: {dJ;1, dJ;2,...}為第一層至第J層的高頻信號重構(gòu);Cj:1cjil, Cj,2)…}為第J層的低頻信號重構(gòu);X為原始信號重構(gòu);
[0018](4)利用自回歸移動平均模型(ARMA)對高頻信號建模;其步驟如下:
[0019]①平穩(wěn)性檢驗:利用ADF(Augmented Dickey-Fuller)單位根檢驗法檢驗建模樣本時間序列的平穩(wěn)性,確定為平穩(wěn)時間序列,進行ARMA建模;
[0020]②確定模型的形式和階數(shù):模型的形式有三種:自回歸模型(AR(p))、移動平均模型(MA(q))和ARMA(P, q)模型,通過自相關(guān)函數(shù)和偏自相關(guān)函數(shù)的截尾性和拖尾性確定模型的形式;通過赤池信息量準(zhǔn)則(AIC)和貝葉斯信息量準(zhǔn)則(BIC)量化的計算結(jié)果判斷模型的階數(shù),通過自由度的調(diào)整,取均方誤差最小的模型階數(shù);
[0021]③估算模型參數(shù):利用Eviews軟件估算模型參數(shù);
[0022]④建立模型:求取參數(shù)后建立模型,并進行檢驗;
[0023](5)利用支持向量機(SVM)模型對低頻信號建模,步驟如下:
[0024]①選取時間序列的時間順序為輸入向量,低頻信號為目標(biāo)向量;
[0025]②數(shù)據(jù)歸一化處理:對輸入向量數(shù)據(jù)進行歸一化處理,使得所有數(shù)據(jù)處于[_1,1]之間;
[0026]③初始參數(shù)設(shè)置:選擇SVM類型和核函數(shù),確定模型所需的運行參數(shù),確定粒子群算法(PSO)的初始參數(shù);
[0027]④PSO參數(shù)尋優(yōu):調(diào)用PSO-SVM算法優(yōu)化SVM的懲罰參數(shù)c和核參數(shù)g,獲取最優(yōu)參數(shù);
[0028]⑤建立SVM模型:用步驟④獲得的最優(yōu)參數(shù)訓(xùn)練SVM回歸機,建立SVM低頻信號模型;
[0029](6)建立涌水量預(yù)測的最終模型:將高頻信號模型和低頻信號模型合成,即為涌水量最終預(yù)測模型;
[0030](7)模型檢驗:利用檢驗樣本對步驟(6)建好的最終預(yù)測模型進行檢驗,預(yù)測精度在90%以上,說明模型合格,實現(xiàn)涌水量預(yù)測。
[0031 ] 本發(fā)明與現(xiàn)有技術(shù)相比,采用二進小波變換提取原始涌水量序列中的高頻信息和低頻信息,對高頻信息和低頻信息分別建模,在充分?jǐn)M合低頻信息的同時,避免對高頻信息的過擬合,其工作原理可靠,預(yù)測方法簡單,預(yù)測精度高,預(yù)測環(huán)境友好。
【專利附圖】
【附圖說明】
[0032]圖1為本發(fā)明方法的流程原理示意框圖。
[0033]圖2為本發(fā)明涉及的建模樣本原始時間序列趨勢示意圖。
[0034]圖3為本發(fā)明涉及的二進小波分解重構(gòu)示意圖。
[0035]圖4為本發(fā)明涉及的高頻信號平穩(wěn)性檢驗示意圖。
[0036]圖5為本發(fā)明涉及的相關(guān)性和偏自相關(guān)性分析示意圖。
[0037]圖6為本發(fā)明涉及的參數(shù)估計示意圖。
[0038]圖7為本發(fā)明涉及的建模樣本高頻信號預(yù)測值與實際值對比示意圖。
[0039]圖8為本發(fā)明涉及的建模樣本低頻信號實際值與預(yù)測值對比示意圖。
【具體實施方式】
[0040]下面結(jié)合附圖并通過實施例對本發(fā)明做進一步說明。
[0041]實施例1:
[0042]本發(fā)明涉及的基于小波變換和ARMA-SVM的涌水量預(yù)測方法,包括以下步驟:
[0043](I)獲取涌水量原始時間序列:收集礦井確定時間段內(nèi)觀測記錄的涌水量臺賬資料并進行分析,確定可靠的數(shù)據(jù)和必須剔除的數(shù)據(jù);
[0044](2)選取樣本:選取時間序列的前η個觀測樣本數(shù)據(jù)作為建模樣本,后m-n個觀測樣本數(shù)據(jù)作為檢驗樣本,η為隨機選取的建模樣本個數(shù),m為樣本總數(shù);
[0045](3) 二進小波分解與重構(gòu):對建模樣本的原始時間序列進行二進小波分解與重構(gòu),提取原始時間序列中的高頻信息和低頻信息;二進小波分解與重構(gòu)采用馬拉特(Mallat)算法,包括如下步驟:
[0046]①信號分解:將Ctl作為待分解的離散信號,則有:
[0047]cJ+1 = Hcj, dJ+1 = Gcj (j = O, I,..., J);
[0048]其中:H和G分別為低通濾波器和高通濾波器;(Vl和C^1分別為原始信號在分辯率2_?+1)下的低頻信號和高頻信號;j為分解尺度;J為最大分解層數(shù),最終將待分解離散信號 C0 分解為(I1, d2,...,dj 和 Cj ;
[0049]該分解算法利用二抽取,使每層分解比分解前的信號數(shù)據(jù)長度減半,總輸出數(shù)據(jù)長度與輸入待分解離散信號Co長度保持一致;待分解離散信號個數(shù)的減少對預(yù)測是不利的,經(jīng)Mallat算法分解后的信號采用重構(gòu)算法進行二插值重構(gòu);
[0050]②信號重構(gòu):重構(gòu)算法為:Cj = H*cJ+1+G*dJ+1 ;
[0051]其中:Η*和(T是對偶算子;j = J-l, J-2,…O ;
[0052]對Cl1, d2,...,dj 和 Cj 分別進行重構(gòu),得到 D1, D2,...,Dj 和 Cj,有
[0053]X = D^D2+*..+Dj+Cj ;
[0054]其中=D1: {d1;1, d1;2,…},…,Dj: {dJ;1, dJ;2,…}為第一層至第J層的高頻信號重構(gòu);Cj:1cjil, Cj,2)…}為第J層的低頻信號重構(gòu);X為原始信號重構(gòu);
[0055](4)利用自回歸移動平均模型(ARMA)對高頻信號建模;其步驟如下:
[0056]①平穩(wěn)性檢驗:利用ADF(Augmented Dickey-Fuller)單位根檢驗法檢驗建模樣本時間序列的平穩(wěn)性,確定為平穩(wěn)時間序列,進行ARMA建模;
[0057]②確定模型的形式和階數(shù):模型的形式有三種:自回歸模型(AR(p))、移動平均模型(MA(q))和ARMA(P, q)模型,通過自相關(guān)函數(shù)和偏自相關(guān)函數(shù)的截尾性和拖尾性確定模型的形式;通過赤池信息量準(zhǔn)則(AIC)和貝葉斯信息量準(zhǔn)則(BIC)量化的計算結(jié)果判斷模型的階數(shù),通過自由度的調(diào)整,取均方誤差最小的模型階數(shù);
[0058]③估算模型參數(shù):利用Eviews軟件估算模型參數(shù);
[0059]④建立模型:求取參數(shù)后建立模型,并進行檢驗;
[0060](5)利用支持向量機(SVM)模型對低頻信號建模,步驟如下:
[0061]①選取時間序列的時間順序為輸入向量,低頻信號為目標(biāo)向量;
[0062]②數(shù)據(jù)歸一化處理:對輸入向量數(shù)據(jù)進行歸一化處理,使得所有數(shù)據(jù)處于[_1,1]之間;
[0063]③初始參數(shù)設(shè)置:選擇SVM類型和核函數(shù),確定模型所需的運行參數(shù),確定粒子群算法(PSO)的初始參數(shù);
[0064]④PSO參數(shù)尋優(yōu):調(diào)用PSO-SVM算法優(yōu)化SVM的懲罰參數(shù)c和核參數(shù)g,獲取最優(yōu)參數(shù);
[0065]⑤建立SVM模型:用步驟④獲得的最優(yōu)參數(shù)訓(xùn)練SVM回歸機,建立SVM低頻信號模型;
[0066](6)建立涌水量預(yù)測的最終模型:將高頻信號模型和低頻信號模型合成,即為涌水量最終預(yù)測模型;
[0067](7)模型檢驗:利用檢驗樣本對步驟(6)建好的最終預(yù)測模型進行檢驗,預(yù)測精度在90%以上,說明模型合格,實現(xiàn)涌水量預(yù)測。
[0068]實施例2:某礦井-810m水平涌水量預(yù)測,預(yù)測步驟按實施例1進行,具體的預(yù)測過程和結(jié)果如下:
[0069]根據(jù)2006年?2013年涌水量臺賬,獲取_810m水平涌水量時間序列,共261個樣本,取I?240號為建模樣本,241?261號為檢驗樣本。建模樣本時間序列趨勢見圖2,對建模樣本數(shù)據(jù)進行I層基于Mallat算法的二進小波分解與重構(gòu),提取高頻信息和低頻信息,結(jié)果見圖3 ;
[0070]利用ADF單位根檢驗法對分解后的高頻信息進行平穩(wěn)性檢驗結(jié)果見圖4,可見高頻信息序列為平穩(wěn)時間序列,進行ARMA建模;對其相關(guān)性和偏自相關(guān)性進行分析(圖5),自相關(guān)函數(shù)圖象都呈拖尾性,偏相關(guān)函數(shù)的圖象3階截尾,所以為AR(3)模型,由于常數(shù)項P值較大,去掉后重新估計參數(shù)結(jié)果見圖6,模型為:
[0071]xt = -1.260471xt_「l.263914xt_2_0.612376xt_3+ ε t,
[0072]式中:{ ε t}為白噪聲序列;
[0073]模型檢驗:滯后I~3階參數(shù)的P值都很小,參數(shù)顯著;殘差序列的ACF和PACF都沒有顯著異于零,Q統(tǒng)計量的P值都遠遠大于0.05,因此殘差序列為白噪聲序列;校正可決系數(shù)的平方為0.764227,擬合度較高;通過檢驗,說明建立的模型可靠,建模樣本預(yù)測值與實際值如圖7所示;
[0074]低頻信息SVM建模:首先對低頻信息樣本進行歸一化處理,利用I~240號樣本進行訓(xùn)練,并利用PSO方法自動搜索最優(yōu)參數(shù):c = 325.5766,g = 309.7017,經(jīng)過編程訓(xùn)練結(jié)果見圖8 ;
[0075]將上面建立的高頻信息模型與低頻信息模型合成,即建立涌水量預(yù)測的最終模型;利用檢驗樣本對上述建好的模型進行檢驗,結(jié)果見表1,平均相對誤差為4.1%,預(yù)測精度在95%以上,說明模型合格,預(yù)測精度高于90%以上。
[0076]表1基于小波變換和ARMA-SVM模型的涌水量預(yù)測結(jié)果
[0077]
【權(quán)利要求】
1.一種基于小波變換和ARMA-SVM的涌水量預(yù)測方法,其特征在于包括以下步驟: (1)獲取涌水量原始時間序列:收集礦井確定時間段內(nèi)觀測記錄的涌水量臺賬資料并進行分析,確定可靠的數(shù)據(jù)和必須剔除的數(shù)據(jù); (2)選取樣本:選取時間序列的前η個觀測樣本數(shù)據(jù)作為建模樣本,后m-η個觀測樣本數(shù)據(jù)作為檢驗樣本,η為隨機選取的建模樣本個數(shù),m為樣本總數(shù); (3)二進小波分解與重構(gòu):對建模樣本的原始時間序列進行二進小波分解與重構(gòu),提取原始時間序列中的高頻信息和低頻信息;二進小波分解與重構(gòu)采用馬拉特Mallat算法,包括如下步驟: ①信號分解,將Ctl作為待分解的離散信號,則有:
cJ+1 = Hcj, dJ+1 = Gcj (j = O, I,..., J); 其中:H和G分別為低通濾波器和高通濾波器;(Vl和C^1分別為原始信號在分辯率2-(J+1)下的低頻信號和高頻信號;j為分解尺度;J為最大分解層數(shù),最終將待分解離散信號C0 分解為(I1, d2,...,dj 和 Cj ; 該分解算法利用二抽取,使每層分解比分解前的信號數(shù)據(jù)長度減半,總輸出數(shù)據(jù)長度與輸入待分解離散信號Ctl長度保持一致;待分解離散信號個數(shù)的減少對預(yù)測是不利的,經(jīng)Mallat算法分解后的信號采用重構(gòu)算法進行二插值重構(gòu); ②號重構(gòu),重構(gòu)算法為:Cj= H*cJ+1+G*dJ+1 ; 其中:H*和G*是對偶算子;j = J-l, J-2,...0 ; 對Cl1, d2,...,dj和Cj分別進行重構(gòu),得到D1, D2,...,Dj和Cr有
X = D^D2+*..+Dj+Cj ; 其中^1: {d1;1, d1;2,...1,**., Dj: {dj’” dj’2,...}為第一層至第J層的高頻信號重構(gòu);Cj:1cjil, Cj,2)…}為第J層的低頻信號重構(gòu);X為原始信號重構(gòu); (4)利用自回歸移動平均模型對高頻信號建模;其步驟如下: ①平穩(wěn)性檢驗:利用ADF單位根檢驗法檢驗建模樣本時間序列的平穩(wěn)性,確定為平穩(wěn)時間序列,進行ARMA建模; ②確定模型的形式和階數(shù):模型的形式有三種:自回歸模型、移動平均模型和ARMA模型,通過自相關(guān)函數(shù)和偏自相關(guān)函數(shù)的截尾性和拖尾性確定模型的形式;通過赤池信息量準(zhǔn)則和貝葉斯信息量準(zhǔn)則量化的計算結(jié)果判斷模型的階數(shù),通過自由度的調(diào)整,取均方誤差最小的模型階數(shù); ③估算模型參數(shù):利用Eviews軟件估算模型參數(shù); ④建立模型:求取參數(shù)后建立模型,并進行檢驗; (5)利用支持向量機模型對低頻信號建模,步驟如下: ①選取時間序列的時間順序為輸入向量,低頻信號為目標(biāo)向量; ②數(shù)據(jù)歸一化處理:對輸入向量數(shù)據(jù)進行歸一化處理,使得所有數(shù)據(jù)處于[_1,1]之間; ③初始參數(shù)設(shè)置:選擇SVM類型和核函數(shù),確定模型所需的運行參數(shù),確定粒子群算法的初始參數(shù); ④PSO參數(shù)尋優(yōu):調(diào)用PSO-SVM算法優(yōu)化SVM的懲罰參數(shù)C和核參數(shù)g,獲取最優(yōu)參數(shù); ⑤建立SVM模型:用步驟④獲得的最優(yōu)參數(shù)訓(xùn)練SVM回歸機,建立SVM低頻信號模型; (6)建立涌水量預(yù)測的最終模型:將高頻信號模型和低頻信號模型合成,即為涌水量最終預(yù)測模型; (7)模型檢驗:利用檢驗樣本對步驟(6)建好的最終預(yù)測模型進行檢驗,預(yù)測精度在90%以上,說明模型合格,實現(xiàn)涌水量預(yù)測。
【文檔編號】G06F17/50GK104200291SQ201410505094
【公開日】2014年12月10日 申請日期:2014年9月28日 優(yōu)先權(quán)日:2014年9月28日
【發(fā)明者】邱梅, 施龍青, 韓進, 滕超, 牛超 申請人:山東科技大學(xué)