一種基于空間特征的細(xì)粒度空氣污染物濃度區(qū)域估計(jì)方法
【專利摘要】本發(fā)明涉及空氣污染物的細(xì)粒度區(qū)域估計(jì),尤其涉及一種基于空間特征的細(xì)粒度空氣污染物濃度區(qū)域估計(jì)方法,包括預(yù)處理階段、預(yù)測(cè)階段、估計(jì)階段;預(yù)處理階段進(jìn)行網(wǎng)格劃分得到訓(xùn)練樣本,預(yù)測(cè)階段采用距離度量學(xué)習(xí)方法學(xué)習(xí)馬氏距離函數(shù)來尋找區(qū)域最近的k個(gè)區(qū)域,再對(duì)這k個(gè)區(qū)域形成的特征向量進(jìn)行多元線性回歸訓(xùn)練,估計(jì)階段利用訓(xùn)練得到的多元線性回歸模型對(duì)區(qū)域的空氣污染物濃度進(jìn)行估計(jì)。本發(fā)明的有益效果在于:本發(fā)明可用來對(duì)無空氣質(zhì)量監(jiān)測(cè)站點(diǎn)的某個(gè)小區(qū)域的空氣污染物濃度進(jìn)行估計(jì),充分利用鄰近的空氣質(zhì)量監(jiān)測(cè)站點(diǎn),引入k個(gè)鄰近區(qū)域,可以更好地捕捉空氣污染物濃度在空間上的細(xì)粒度變化,更準(zhǔn)確地估計(jì)出當(dāng)前區(qū)域的污染物濃度。
【專利說明】一種基于空間特征的細(xì)粒度空氣污染物濃度區(qū)域估計(jì)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及空氣污染物的細(xì)粒度區(qū)域估計(jì),尤其涉及一種基于空間特征的細(xì)粒度空氣污染物濃度區(qū)域估計(jì)方法。
【背景技術(shù)】
[0002]近年來空氣污染越來越嚴(yán)重,多個(gè)城市經(jīng)常出現(xiàn)霧霾天氣,催生著人們生態(tài)環(huán)保意識(shí)的加強(qiáng),空氣污染越來越受到大家的關(guān)注。為了對(duì)空氣的污染物質(zhì)進(jìn)行監(jiān)測(cè),政府在城市建立了若干空氣質(zhì)量監(jiān)測(cè)點(diǎn),是空氣質(zhì)量控制和對(duì)空氣質(zhì)量進(jìn)行合理評(píng)估的基礎(chǔ)平臺(tái),是一個(gè)城市空氣環(huán)境保護(hù)的基礎(chǔ)設(shè)施。但是,建立一個(gè)空氣質(zhì)量監(jiān)測(cè)站需要一定建設(shè)資金、占地面積、人力等,因此每個(gè)城市所擁有的空氣監(jiān)測(cè)站都是有限的。而同一城市中的不同地點(diǎn)的空氣污染物濃度可能相差很大,人們?cè)谕獬龌顒?dòng)前,如騎行,無法確切知道經(jīng)過路段所在區(qū)域的空氣狀況,如果空氣質(zhì)量太差,人們可以選擇另一個(gè)空氣較好的區(qū)域進(jìn)行戶外運(yùn)動(dòng)。
[0003]傳統(tǒng)的空氣質(zhì)量區(qū)域估計(jì)方法一般僅考慮物理空間上的距離,然后進(jìn)行空間線性插值,比如Kriging方法。然而,因?yàn)榭諝馕廴疚锏臐舛仁怯啥鄠€(gè)因素共同影響的,例如天氣現(xiàn)象、交通、土地使用等,所以空氣污染物的濃度隨著空間位置上的變化是呈非線性變化的,不能簡(jiǎn)單的用線性插值法進(jìn)行估計(jì)。有一些非線性的估計(jì)方法很好的利用了大氣壓、濕度、交通等特征,但是其估計(jì)的是空氣質(zhì)量的等級(jí),而不是空氣污染物濃度的數(shù)值。此類方法存在一個(gè)弊端,假設(shè)空氣質(zhì)量等級(jí)分為A、B、C、D、E、F六個(gè)等級(jí),濃度值1-50屬于等級(jí)A,濃度值51-100屬于等級(jí)B。當(dāng)某個(gè)區(qū)域的真實(shí)濃度值為52 (空氣質(zhì)量等級(jí)為B)時(shí),若一種空氣質(zhì)量等級(jí)估計(jì)的方法估計(jì)該區(qū)域的空氣質(zhì)量等級(jí)為A,則判定這個(gè)估計(jì)結(jié)果不準(zhǔn),因?yàn)閷?shí)際的空氣質(zhì)量等級(jí)為B。但是若采用估計(jì)濃度值的方法,可能估計(jì)出該區(qū)域的空氣污染物濃度為48,雖然換算成空氣質(zhì)量等級(jí)也是A,但是其與真實(shí)值52僅僅相差4,可判定這個(gè)估計(jì)結(jié)果是準(zhǔn)確的。由上可見,采用估計(jì)濃度值的方法更為合理。
【發(fā)明內(nèi)容】
[0004]本發(fā)明為克服上述的不足之處,目的在于提供一種基于空間特征的細(xì)粒度空氣污染物濃度區(qū)域估計(jì)方法,該方法估計(jì)結(jié)果準(zhǔn)確性高,能根據(jù)帶空氣監(jiān)測(cè)點(diǎn)的區(qū)域和無空氣監(jiān)測(cè)點(diǎn)的區(qū)域在空間上的各種區(qū)別估計(jì)出后者的空氣污染物濃度,解決現(xiàn)有問題。
[0005]本發(fā)明是通過以下技術(shù)方案達(dá)到上述目的:一種基于空間特征的細(xì)粒度空氣污染物濃度區(qū)域估計(jì)方法,包括預(yù)處理階段、訓(xùn)練階段、估計(jì)階段;
[0006]預(yù)處理階段包括:
[0007]I)把城市劃分成不相交的網(wǎng)格,每個(gè)網(wǎng)格g內(nèi)的空氣污染物濃度相同;
[0008]2)網(wǎng)格g所在的城市有m個(gè)含有空氣監(jiān)測(cè)站點(diǎn)的網(wǎng)格,抽取這些網(wǎng)格對(duì)應(yīng)的每小時(shí)的空氣污染物濃度和空間特征,每個(gè)小時(shí)可以生成m個(gè)訓(xùn)練樣本;若歷史數(shù)據(jù)跨越η個(gè)小時(shí),則可以得到nXm個(gè)訓(xùn)練樣本;
[0009]訓(xùn)練階段:
[0010]l)k近鄰網(wǎng)格查找:學(xué)習(xí)兩個(gè)訓(xùn)練樣本之間的馬氏距離函數(shù),通過馬氏距離函數(shù)查找得到每個(gè)訓(xùn)練樣本最近的k個(gè)樣本;
[0011]2)多元線性回歸模型訓(xùn)練:根據(jù)每個(gè)樣本及其k個(gè)最近的鄰居樣本生成向量,nXm個(gè)訓(xùn)練樣本生成nXm個(gè)向量;對(duì)生成的nXm個(gè)向量進(jìn)行多元線性回歸,輸出擬合的多元線性回歸模型;
[0012]估計(jì)階段:
[0013]I)輸入待估計(jì)空氣質(zhì)量的位置的經(jīng)緯度信息,并根據(jù)經(jīng)緯度信息獲取所屬的網(wǎng)格g,抽取網(wǎng)格g的空間特征Fg ;抽取網(wǎng)格g所在城市的所有空氣質(zhì)量監(jiān)測(cè)站點(diǎn)所屬網(wǎng)格的空間特征,得到特征向量Fe ;
[0014]2)利用馬氏距離函數(shù)從Fe中查找到與Fg相近的k個(gè)最近的特征向量,k個(gè)最近的特征向量對(duì)應(yīng)k個(gè)網(wǎng)格,由k個(gè)網(wǎng)格得到網(wǎng)格集合G ;
[0015]3)網(wǎng)格g和網(wǎng)格集合G生成一個(gè)向量;
[0016]4)根據(jù)訓(xùn)練階段輸出的多元線性回歸模型對(duì)上一步得到的向量進(jìn)行線性回歸計(jì)算,計(jì)算結(jié)果為估計(jì)的空氣質(zhì)量值。
[0017]作為優(yōu)選,所述的空間特征包括:交通相關(guān)特征Ft、路網(wǎng)結(jié)構(gòu)相關(guān)特征FpPOI相關(guān)特征Fp、簽到特征F。。
[0018]作為優(yōu)選,所述訓(xùn)練階段的k近鄰網(wǎng)格查找步驟中,采用距離度量學(xué)習(xí)方法和空氣污染物濃度值的相似性標(biāo)準(zhǔn)計(jì)算兩個(gè)訓(xùn)練樣本之間的馬氏距離函數(shù),計(jì)算公式如下:
[0019]dA (Xi, Xj) = (X1-Xj)1A(X1-Xj);
[0020]其中,dA(Xi,Xj)表示兩個(gè)樣本X1、Xj之間的距離,A為半正定矩陣。
[0021]作為優(yōu)選,設(shè)置兩個(gè)空氣污染物濃度值的相似性標(biāo)準(zhǔn)。
[0022]本發(fā)明的有益效果在于:1)引入路網(wǎng)結(jié)構(gòu)、Ρ0Ι、交通等空間相關(guān)特征,可以更好的捕捉空氣污染物濃度在空間上的細(xì)粒度變化;(2)采用距離度量學(xué)習(xí)方法確定距離函數(shù),而不是傳統(tǒng)的歐氏距離,可以更準(zhǔn)確的度量?jī)蓚€(gè)區(qū)域之間的距離;(3)充分利用鄰近的空氣質(zhì)量監(jiān)測(cè)站點(diǎn),引入k個(gè)鄰近區(qū)域,而不是一個(gè)區(qū)域,可以更準(zhǔn)確的估計(jì)出當(dāng)前區(qū)域的污染物濃度。
【專利附圖】
【附圖說明】
[0023]圖1是本發(fā)明的方法步驟流程圖;
[0024]圖2是本發(fā)明實(shí)施例a城市的網(wǎng)格劃分示意圖;
[0025]圖3是本發(fā)明的訓(xùn)練階段步驟流程圖;
[0026]圖4是本發(fā)明的估計(jì)階段步驟流程圖。
【具體實(shí)施方式】
[0027]下面結(jié)合具體實(shí)施例對(duì)本發(fā)明進(jìn)行進(jìn)一步描述,但本發(fā)明的保護(hù)范圍并不僅限于此:
[0028]實(shí)施例1:如圖1所示,一種基于空間特征的細(xì)粒度空氣污染物濃度區(qū)域估計(jì)方法,包括預(yù)處理階段、訓(xùn)練階段、估計(jì)階段。
[0029]預(yù)處理階段的主要步驟包括:
[0030]I)把城市a劃分成不相交的網(wǎng)格,每個(gè)網(wǎng)格g = g.wXg.h具有相同的長(zhǎng)g.w和寬g.h,用g。表示網(wǎng)格g的中心點(diǎn)。用ga(w,h)表示將a劃分成不相交的長(zhǎng)為w寬為h的網(wǎng)格集合,則匕=屬于同一 g的空氣污染物濃度視為一樣。
令g.A表示g的影響區(qū)域,則g.A = (g.wX 3) X (g.hX3),g.A。= g。,由g及其周圍的八個(gè)網(wǎng)格組成。如圖2所示,每個(gè)小正方形是一個(gè)網(wǎng)格,小正方形陰影的網(wǎng)格的影響區(qū)域?yàn)榇蠛诳蛘叫螀^(qū)域;
[0031]2)找到含有空氣監(jiān)測(cè)站點(diǎn)的網(wǎng)格并抽取這些網(wǎng)格對(duì)應(yīng)的每小時(shí)的空氣污染物濃度和空間特征,包括交通相關(guān)特征Ft、P0I相關(guān)特征Fp、路網(wǎng)結(jié)構(gòu)相關(guān)特征Fp簽到特征F。。
[0032]交通相關(guān)特征Ft:
[0033]a)該網(wǎng)格g的影響區(qū)域包含的所有路段g.R = Ir I r e g.A}過去I小時(shí)的平均車速。首先根據(jù)公式(I)計(jì)算每條路r e g.R過去I小時(shí)的平均車速E (r.v),其中,Iri表示g.R集合的第i個(gè)元素,即g.A區(qū)域內(nèi)第i條道路;L表示I小時(shí)內(nèi),每條道路可獲得L個(gè)不同時(shí)刻的車速值;接著根據(jù)公式(2)計(jì)算g.A所有路段g.R在過去I小時(shí)的平均車速,其中
*|表示*集合中元素的個(gè)數(shù)。
【權(quán)利要求】
1.一種基于空間特征的細(xì)粒度空氣污染物濃度區(qū)域估計(jì)方法,其特征在于,包括預(yù)處理階段、訓(xùn)練階段、估計(jì)階段; 預(yù)處理階段包括: 1)把城市劃分成不相交的網(wǎng)格,每個(gè)網(wǎng)格g內(nèi)的空氣污染物濃度相同; 2)網(wǎng)格g所在的城市有m個(gè)含有空氣監(jiān)測(cè)站點(diǎn)的網(wǎng)格,抽取這些網(wǎng)格對(duì)應(yīng)的每小時(shí)的空氣污染物濃度和空間特征,每個(gè)小時(shí)可以生成m個(gè)訓(xùn)練樣本;若歷史數(shù)據(jù)跨越η個(gè)小時(shí),則可以得到nXm個(gè)訓(xùn)練樣本; 訓(xùn)練階段: 1)k近鄰網(wǎng)格查找:學(xué)習(xí)兩個(gè)訓(xùn)練樣本之間的馬氏距離函數(shù),通過馬氏距離函數(shù)查找得到每個(gè)訓(xùn)練樣本最近的k個(gè)樣本; 2)多元線性回歸模型訓(xùn)練:根據(jù)每個(gè)樣本及其k個(gè)最近的鄰居樣本生成向量,nXm個(gè)訓(xùn)練樣本生成nXm個(gè)向量;對(duì)生成的nXm個(gè)向量進(jìn)行多元線性回歸,輸出擬合的多元線性回歸模型; 估計(jì)階段: 1)輸入待估計(jì)空氣質(zhì)量的位置的經(jīng)緯度信息,并根據(jù)經(jīng)緯度信息獲取所屬的網(wǎng)格g,抽取網(wǎng)格g的空間特征Fg ;抽取網(wǎng)格g所在城市的所有空氣質(zhì)量監(jiān)測(cè)站點(diǎn)所屬網(wǎng)格的空間特征,得到特征向量Fe ; 2)利用馬氏距離函數(shù)從Fe中查找到與Fg相近的k個(gè)最近的特征向量,k個(gè)最近的特征向量對(duì)應(yīng)k個(gè)網(wǎng)格,由k個(gè)網(wǎng)格得到網(wǎng)格集合G ; 3)網(wǎng)格g和網(wǎng)格集合G生成一個(gè)向量; 4)根據(jù)訓(xùn)練階段輸出的多元線性回歸模型對(duì)上一步得到的向量進(jìn)行線性回歸計(jì)算,計(jì)算結(jié)果為估計(jì)的空氣質(zhì)量值。
2.根據(jù)權(quán)利要求1所述的一種基于空間特征的細(xì)粒度空氣污染物濃度區(qū)域估計(jì)方法,其特征在于,所述的空間特征包括:交通相關(guān)特征Ft、路網(wǎng)結(jié)構(gòu)相關(guān)特征匕、POI相關(guān)特征Fp、簽到特征F。。
3.根據(jù)權(quán)利要求1所述的一種基于空間特征的細(xì)粒度空氣污染物濃度區(qū)域估計(jì)方法,其特征在于,所述訓(xùn)練階段的k近鄰網(wǎng)格查找步驟中,采用距離度量學(xué)習(xí)方法和空氣污染物濃度值的相似性標(biāo)準(zhǔn)計(jì)算兩個(gè)訓(xùn)練樣本之間的馬氏距離函數(shù),計(jì)算公式如下:
, Xj) —(X1-Xj) A(XfXj); 其中,dA(Xi,Xj)表示兩個(gè)樣本X1、Xj之間的距離,A為半正定矩陣。
4.根據(jù)權(quán)利要求3所述的一種基于空間特征的細(xì)粒度空氣污染物濃度區(qū)域估計(jì)方法,其特征在于,設(shè)置兩個(gè)空氣污染物濃度值的相似性標(biāo)準(zhǔn)。
【文檔編號(hào)】G06F19/00GK104200104SQ201410452578
【公開日】2014年12月10日 申請(qǐng)日期:2014年9月4日 優(yōu)先權(quán)日:2014年9月4日
【發(fā)明者】王敬昌, 陳嶺, 趙江奇, 蔡雅雅, 徐精忠 申請(qǐng)人:浙江鴻程計(jì)算機(jī)系統(tǒng)有限公司