亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于在線多核回歸的城市監(jiān)測(cè)站點(diǎn)空氣質(zhì)量預(yù)測(cè)方法

文檔序號(hào):9489789閱讀:1420來(lái)源:國(guó)知局
一種基于在線多核回歸的城市監(jiān)測(cè)站點(diǎn)空氣質(zhì)量預(yù)測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及空氣質(zhì)量監(jiān)測(cè)領(lǐng)域,尤其涉及一種基于在線多核回歸的城市監(jiān)測(cè)站點(diǎn) 空氣質(zhì)量預(yù)測(cè)方法。
【背景技術(shù)】
[0002] 空氣是地球上生物賴以生存的物質(zhì)。空氣質(zhì)量與人們的日常生活息息相關(guān),在城 市環(huán)境綜合評(píng)價(jià)中占有重要地位。但是隨著人類文明和經(jīng)濟(jì)的發(fā)展,空氣污染越來(lái)越嚴(yán)重, 如何改善空氣質(zhì)量、準(zhǔn)確預(yù)測(cè)空氣質(zhì)量變得越來(lái)越重要。根據(jù)空氣質(zhì)量預(yù)測(cè)結(jié)果,人們可以 采取相應(yīng)措施(如帶口罩、避免外出等)以避免受到空氣污染物的侵害。另一方面,環(huán)境 保護(hù)是全社會(huì)的事業(yè),公眾對(duì)環(huán)保的參與程度是一個(gè)國(guó)家環(huán)保工作開(kāi)展是否成功的重要標(biāo) 志。如果城市空氣質(zhì)量能像天氣一樣每天公布預(yù)報(bào)結(jié)果,公眾就可以了解自己生活空間的 環(huán)境質(zhì)量真實(shí)情況,有利于人民群眾參與和監(jiān)督環(huán)境保護(hù)工作。
[0003] 傳統(tǒng)空氣質(zhì)量預(yù)測(cè)方法的問(wèn)題主要在于特征和模型兩方面:
[0004] 從特征層面來(lái)講,因?yàn)榭諝馕廴疚飼?huì)隨著大氣不斷流動(dòng),所以周邊城市的空氣污 染物水平是緊密相關(guān)的,比如若一個(gè)城市的空氣質(zhì)量為嚴(yán)重污染且刮北風(fēng),那么一段時(shí)間 之后位于該城市南方城市的空氣質(zhì)量也會(huì)受到影響。而傳統(tǒng)的空氣質(zhì)量預(yù)測(cè)方法僅考慮了 氣象、交通、本地空氣污染物等相關(guān)領(lǐng)域的特征,沒(méi)有考慮周邊城市的空氣質(zhì)量狀況對(duì)待預(yù) 測(cè)城市的影響,從而影響了預(yù)測(cè)結(jié)果的準(zhǔn)確性。另一方面,傳統(tǒng)的空氣質(zhì)量預(yù)測(cè)方法在模型 訓(xùn)練階段使用基于實(shí)時(shí)氣象數(shù)據(jù)的相關(guān)特征,預(yù)測(cè)階段則使用基于預(yù)報(bào)氣象數(shù)據(jù)的相關(guān)特 征,而實(shí)時(shí)和預(yù)報(bào)氣象數(shù)據(jù)都是與空氣質(zhì)量相關(guān)的,應(yīng)該給予同時(shí)考慮,否則會(huì)影響模型的 有效性。
[0005] 從模型層面來(lái)講,由于產(chǎn)生式模型(如馬爾科夫模型等)具有標(biāo)記偏置和獨(dú)立性 假設(shè)等固有缺陷,導(dǎo)致其預(yù)測(cè)準(zhǔn)確率不太理想;而判別式模型(如決策樹(shù)、支持向量機(jī)等) 雖然比產(chǎn)生式模型要簡(jiǎn)單,但是由于其黑盒操作,不能清楚展現(xiàn)數(shù)據(jù)間的關(guān)系,從而不能反 映訓(xùn)練數(shù)據(jù)本身的特性,進(jìn)而對(duì)其預(yù)測(cè)能力產(chǎn)生了負(fù)面影響。條件隨機(jī)場(chǎng)模型雖然既具有 判別式模型比較容易學(xué)習(xí)的優(yōu)點(diǎn),又可以像產(chǎn)生式模型一樣考慮上下文標(biāo)記間的轉(zhuǎn)移概 率,但是其跟傳統(tǒng)的產(chǎn)生式模型和判別式模型一樣,都是批量式的學(xué)習(xí)方式,當(dāng)有新的數(shù)據(jù) 時(shí),需要基于全部數(shù)據(jù)進(jìn)行重新訓(xùn)練。由于重新訓(xùn)練代價(jià)高,使得模型難以及時(shí)更新。在線 單核回歸雖然能克服批量式處理模型的上述缺點(diǎn),但是其往往在學(xué)習(xí)任務(wù)之前,就固定了 一個(gè)核函數(shù),如果數(shù)據(jù)流隨著時(shí)間不穩(wěn)定變化,就會(huì)導(dǎo)致不理想的預(yù)測(cè)效果。

【發(fā)明內(nèi)容】

[0006] 本發(fā)明為克服上述的不足之處,目的在于提供一種基于在線多核回歸的城市監(jiān)測(cè) 站點(diǎn)空氣質(zhì)量預(yù)測(cè)方法,首先基于歷史數(shù)據(jù)提取空氣質(zhì)量監(jiān)測(cè)站點(diǎn)的多領(lǐng)域特征,如氣象 特征、交通特征、本地和周邊城市空氣污染物特征等,然后基于提取的特征訓(xùn)練多核回歸模 型,并利用新的數(shù)據(jù)對(duì)多核回歸模型進(jìn)行在線調(diào)整;最后基于調(diào)整后的模型對(duì)監(jiān)測(cè)站點(diǎn)未 來(lái)一段時(shí)間內(nèi)的空氣質(zhì)量進(jìn)行逐小時(shí)的預(yù)測(cè)。本方法能夠更準(zhǔn)確地預(yù)測(cè)空氣質(zhì)量。
[0007] 本發(fā)明是通過(guò)以下技術(shù)方案達(dá)到上述目的:一種基于在線多核回歸的城市監(jiān)測(cè)站 點(diǎn)空氣質(zhì)量預(yù)測(cè)方法,包括如下步驟:
[0008] (1)對(duì)歷史原始數(shù)據(jù)進(jìn)行預(yù)處理得到歷史數(shù)據(jù)樣本,基于歷史數(shù)據(jù)樣本得到訓(xùn)練 數(shù)據(jù)集(\,Yk)和核池KP;
[0009] (2)結(jié)合訓(xùn)練數(shù)據(jù)集(Xk,Yk)和核池KP對(duì)子模塊Mk進(jìn)行訓(xùn)練,輸出預(yù)測(cè)模型Μ= {MkI1 ^k^h};
[0010] (3)利用實(shí)時(shí)新監(jiān)測(cè)數(shù)據(jù)對(duì)各子模型Mk(l彡k彡h)調(diào)整為A,并將預(yù)測(cè)模型Μ 更新為調(diào)整后的預(yù)測(cè)模型I
[0011] (4)基于預(yù)測(cè)模型I對(duì)未來(lái)每個(gè)待預(yù)測(cè)時(shí)刻ρ的空氣質(zhì)量進(jìn)行預(yù)測(cè)。
[0012] 作為優(yōu)選,所述步驟(1)的歷史原始數(shù)據(jù)包含預(yù)報(bào)氣象相關(guān)特征只、實(shí)時(shí)氣象相 關(guān)特征、空氣污染物相關(guān)特征、交通相關(guān)特征只-,、周邊監(jiān)測(cè)站點(diǎn)特征if和周邊城 市特征。
[0013] 作為優(yōu)選,所述步驟(1)得到訓(xùn)練數(shù)據(jù)集(Xk,Yk)和核池KP的方法流程如下:
[0014] 1)對(duì)歷史原始數(shù)據(jù)進(jìn)行數(shù)據(jù)對(duì)齊,并用平均值替換缺失值和極端值完成數(shù)據(jù)清 理,得到歷史數(shù)據(jù)樣本X=kj11 <j<η},其中,η表示樣本個(gè)數(shù),是第j個(gè)小時(shí)內(nèi)的歷 史原始數(shù)據(jù)以及以往的空氣質(zhì)量組成的向量;
[0015] 2)基于歷史數(shù)據(jù)樣本,為子模型#構(gòu)造訓(xùn)練數(shù)據(jù)集:
[0016] 2. 1)提取特征組成訓(xùn)練特征向量集爲(wèi)=俱11在/彡其中 np;:,p:,n,w
[0017] 2. 2)所有樣本的空氣質(zhì)量構(gòu)成標(biāo)記序列Yk={Υ·] | 1彡j彡η},Υ·^示樣本X。的 標(biāo)記;并得到\與Yk組成Μ啲訓(xùn)練數(shù)據(jù)集(Xk,Yk);
[0018] 3)重復(fù)h次步驟2),得到訓(xùn)練數(shù)據(jù)集D= {(Xk,Yk)I1彡k彡h},其中h表示預(yù)測(cè) 最大的時(shí)間范圍;
[0019] 4)選取m個(gè)不同的核函數(shù)構(gòu)成核池KP= {kfs| 1 <s<m},kfs表示核池中第s 個(gè)核函數(shù)。
[0020] 作為優(yōu)選,所述步驟(2)的子模塊#由!11個(gè)單核回歸器和權(quán)重向量集Weights'll 成,其中每個(gè)單核回歸器由支持向量集評(píng)f、參數(shù)集構(gòu)成。
[0021] 作為優(yōu)選,所述步驟(2)輸出預(yù)測(cè)模型Μ的步驟流程如下:
[0022] (i)通過(guò)樸素回歸誤差最小化算法訓(xùn)練第s個(gè)單核回歸器,得到支持向量集#和 參數(shù)集翻^
[0023] (ii)重復(fù)m次步驟⑴,得到m個(gè)單核回歸器的支持向量集把和參數(shù)集J 得到子模型Mk 的支持向量集 =?6Τ/' | 1S〃;},參數(shù)集 =i/i/pAa:' |?Ss·S?}:;
[0024] (iii)通過(guò)隨機(jī)梯度下降算法得到權(quán)重向量集Weights14;
[0025] (iv)重復(fù)h次步驟(i)至步驟(iii),完成對(duì)h個(gè)子模型的訓(xùn)練;得到并輸出預(yù)測(cè) 模型Μ= {Mk 11彡k彡h}。
[0026] 作為優(yōu)選,所述步驟(3)得到翁^與調(diào)整后的預(yù)測(cè)模型I所用的方法與步驟(2)所 用的方法相同。
[0027] 作為優(yōu)選,所述步驟(4)對(duì)未來(lái)每個(gè)待預(yù)測(cè)時(shí)刻p的空氣質(zhì)量進(jìn)行預(yù)測(cè),設(shè)待預(yù)測(cè) 時(shí)刻P與當(dāng)前時(shí)刻的間隔小時(shí)數(shù)為k,Kk<h,方法如下:
[0028] (I)基于時(shí)刻p的預(yù)報(bào)氣象數(shù)據(jù)和歷史數(shù)據(jù),提取特征組成待預(yù)測(cè)向量X\, Χ^ψ《,巧具,靡
[0029] (II)將乂\作為預(yù)測(cè)模型分的輸入,得到待預(yù)測(cè)時(shí)刻k的預(yù)測(cè)值Υ\;
[0030] (III)重復(fù)h次步驟(I)至步驟(II),完成對(duì)未來(lái)h個(gè)小時(shí)的空氣質(zhì)量的預(yù)測(cè);
[0031] (IV)輸出預(yù)測(cè)序列Y*= {Y\| 1彡k彡h}。
[0032] 本發(fā)明的有益效果在于:(1)引入氣象學(xué)、交通和本地空氣污染物等領(lǐng)域相關(guān)特 征,而且還引入周邊城市空氣污染物特征,考慮周邊城市空氣質(zhì)量對(duì)待預(yù)測(cè)城市空氣質(zhì)量 的影響,從而可以更準(zhǔn)確地預(yù)測(cè)空氣質(zhì)量;(2)考慮實(shí)時(shí)氣象數(shù)據(jù),還同時(shí)考慮預(yù)報(bào)氣象數(shù) 據(jù)對(duì)空氣質(zhì)量的影響,使得預(yù)測(cè)模型更高效;(3)采用在線多核回歸模型,不僅克服了傳統(tǒng) 批量式處理模型及時(shí)更新代價(jià)較大的缺陷,而且解決了在線單核回歸由于核函數(shù)固定引起 的性能問(wèn)題。
【附圖說(shuō)明】
[0033] 圖1是本發(fā)明基于在線多核回歸的城市監(jiān)測(cè)站點(diǎn)空氣質(zhì)量預(yù)測(cè)方法流程圖;
[0034] 圖2是本發(fā)明實(shí)施例模型建立部分流程圖;
[0035] 圖3是本發(fā)明實(shí)施例核函數(shù)詳細(xì)信息示意圖;
[0036] 圖4是本發(fā)明實(shí)施例在線模型調(diào)整及預(yù)測(cè)流程圖。
【具體實(shí)施方式】
[0037] 下面結(jié)合具體實(shí)施例對(duì)本發(fā)明進(jìn)行進(jìn)一步描述,但本發(fā)明的保護(hù)范圍并不僅限于 此:
[0038] 實(shí)施例:如圖1所示,一種基于在線多核回歸的城市監(jiān)測(cè)站點(diǎn)空氣質(zhì)量預(yù)測(cè)方法, 首先通過(guò)模型建立部分得到多核回歸模型,其次當(dāng)有新的數(shù)據(jù)時(shí),對(duì)模型進(jìn)行在線調(diào)整,得 到新的模型Μ;然后基于Μ進(jìn)行在線預(yù)測(cè)。
[0039] 該方法分為兩大部分:模型建立部分和在線部分。其中,模型建立部分包括數(shù)據(jù)預(yù) 處理和模型訓(xùn)練兩個(gè)階段;在線部分包括數(shù)據(jù)預(yù)處理、模型調(diào)整和預(yù)測(cè)三個(gè)階段。具體實(shí)施 步驟如下:
[0040] 模型建立部分:
[0041] 模型建立部分主要是基于歷史數(shù)據(jù)樣本建立預(yù)測(cè)模型Μ。因?yàn)槲磥?lái)每個(gè)待預(yù)測(cè)時(shí) 刻Ρ(時(shí)刻Ρ與當(dāng)前時(shí)刻的間隔小時(shí)數(shù)為k,1 <k<h,h表示預(yù)測(cè)最大范圍,在逐小時(shí)預(yù)測(cè) 的情況下,k和h都是整數(shù),單位為小時(shí))的空氣質(zhì)量都由一個(gè)相應(yīng)的子模型Mk進(jìn)行預(yù)測(cè), 所以Μ包含h個(gè)子模型。其流程圖如圖2所示。
[0042] 數(shù)據(jù)預(yù)處理階段:
[0043] 步驟1,針對(duì)一個(gè)城市的某個(gè)空氣質(zhì)量檢測(cè)站點(diǎn)s,對(duì)其各領(lǐng)域的歷史原始數(shù)據(jù) (如預(yù)報(bào)氣象數(shù)據(jù)、實(shí)時(shí)氣象數(shù)據(jù)、交通數(shù)據(jù)、空氣污染物數(shù)據(jù))進(jìn)行數(shù)據(jù)對(duì)齊(即以一個(gè)時(shí) 間空間單位統(tǒng)一各領(lǐng)域數(shù)據(jù)),以及數(shù)據(jù)清理(即用平均值替換缺失值和極端值等),得到 歷史數(shù)據(jù)樣本X=U, 11 <j<η},(X]是一個(gè)由站點(diǎn)S處第j個(gè)小時(shí)內(nèi)的預(yù)報(bào)氣象數(shù)據(jù)、 實(shí)時(shí)氣象數(shù)據(jù)、交通數(shù)據(jù)及空氣污染物數(shù)據(jù)組成的向量,η表示樣本個(gè)數(shù));
[0044] 步驟2,基于歷史數(shù)據(jù)樣本X,為子模型Mk構(gòu)造訓(xùn)練數(shù)據(jù)集:
[0045] 1)提取特征組成訓(xùn)練特征向量集不={X| 1 $ k/?}, 杉=(mu零*其中,只、分別表示預(yù)報(bào)氣象相關(guān)特征、 實(shí)時(shí)氣象相關(guān)特征、空氣污染物相關(guān)特征、交通相關(guān)特征、周邊監(jiān)測(cè)站點(diǎn)特征和周邊城市特 征;
[0046]a)預(yù)報(bào)氣象相關(guān)特征
[0047] 預(yù)報(bào)氣象相關(guān)特征主要是考慮站點(diǎn)s從待預(yù)測(cè)時(shí)刻算起過(guò)去一段時(shí)間的預(yù)報(bào)氣 象數(shù)據(jù)(如溫度、濕度、風(fēng)力)對(duì)其未來(lái)空氣質(zhì)量的影響,對(duì)預(yù)報(bào)氣象數(shù)據(jù)提取統(tǒng)計(jì)學(xué)特征 (如最大值、極差、平均值、中位數(shù)及方差等);
[0048]b)實(shí)時(shí)氣象相關(guān)特征
[0049] 實(shí)時(shí)氣象相關(guān)特征主要是考慮站點(diǎn)s從待預(yù)測(cè)時(shí)刻算起過(guò)去一段時(shí)間的實(shí)時(shí)氣 象數(shù)據(jù)(如溫度、濕度、風(fēng)力)對(duì)其未來(lái)空氣質(zhì)量的影響,對(duì)實(shí)時(shí)氣象數(shù)據(jù)提取統(tǒng)計(jì)學(xué)特征 (如最大值、極差、平均值、中位數(shù)及方差等);
[0050]c)空氣污染物相關(guān)特征
[0051] 空氣污染物相關(guān)特征主要是考慮站點(diǎn)s從當(dāng)期時(shí)刻算起過(guò)去一段時(shí)間的空氣污 染物數(shù)據(jù)(C0、N02、S02、03、PM2.5、PM1(])對(duì)其未來(lái)空氣質(zhì)量的影響,對(duì)空氣污染物數(shù)據(jù)提取統(tǒng) 計(jì)學(xué)特征(如最大值、極差、平均值、中位數(shù)及方差等);
[0052] d)交通相關(guān)特征
[0053] 交通相關(guān)特征主要是考慮站點(diǎn)s附近的η條路段過(guò)去一段時(shí)間的交通狀況(如時(shí) 速、交通擁堵指數(shù)等)對(duì)其未來(lái)空氣質(zhì)量的影響,對(duì)各路段時(shí)速提取統(tǒng)計(jì)學(xué)特征(如期望、 方差等);
[0054]e)周邊監(jiān)測(cè)站點(diǎn)特征
[0055]周邊檢測(cè)站點(diǎn)特征匕的具體提取步驟為:從當(dāng)前時(shí)刻算起,各空氣質(zhì)量檢測(cè)站點(diǎn) 的空氣質(zhì)量在過(guò)去1個(gè)小時(shí)內(nèi)的統(tǒng)計(jì)學(xué)特征,如最大值max;、極差r;、平均值mearii、中位數(shù) mediarii及方差vp艮PFs={maxr;,mearii,mediarii,v; 11 <i〈num},其中num為該城市空氣 質(zhì)量檢測(cè)站點(diǎn)的數(shù)量
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1