一種基于數(shù)據(jù)挖掘的建設(shè)用地承載效率測度方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及建設(shè)用地承載效率的研宄領(lǐng)域,特別涉及一種基于數(shù)據(jù)挖掘的建設(shè)用 地承載效率測度方法。
【背景技術(shù)】
[0002] 在建設(shè)用地承載效率的相關(guān)研宄中,近期國外有學(xué)者用有序響應(yīng)模型去研宄土 地發(fā)展強(qiáng)度和土地所有者的關(guān)系(NazneenFerdous, 2013),對于居住活動的多樣化發(fā)展 (Yin,elal,2011)也有所涉及。在國內(nèi),很早就有學(xué)者提出土地集約利用的必要性(顧湘 等,2006),曾勇等(2004)也對土地利用與人口規(guī)模的匹配有所研宄。許多學(xué)者從經(jīng)濟(jì)角度 出發(fā)研宄土地利用效率,包括建立全要素土地利用效率理論模型(趙曉波,2013),使用DEA 法進(jìn)行模型研宄(袁磊等,2009),石憶邵(2013)還利用熵值法對廣州大學(xué)城地區(qū)的土地 利用做出綜合性評價,也有在熵值法基礎(chǔ)上利用層次分析法做出評價的探索(尚天成等, 2009)。但綜合性的土地承載力測度直到近年才有學(xué)者涉及(祝秀芝,2013)。與此同時,國 內(nèi)的建設(shè)用地演化特征及影響也處于研宄當(dāng)中(李昶,2013)。然而既有的研宄多基于區(qū)域 經(jīng)濟(jì)層面,拙于在空間層面上的探討,這類以經(jīng)濟(jì)為主體的研宄模式的弊端在于過分強(qiáng)調(diào) 抽象的區(qū)域范圍層面,且由于數(shù)據(jù)更新遲滯,無法對具體的地塊進(jìn)行效率的評估,對分析結(jié) 果的準(zhǔn)確性和時效性有一定影響。
[0003] 信息技術(shù)的進(jìn)步加速了知識、技術(shù)、人才、資金等的時空交換,流空間成為區(qū)域、城 市以及居民活動的主要載體(Castells,1996),早期有學(xué)者提出城市是人群活動的高度聚 集體,人在城市的行為對城市研宄占據(jù)更主導(dǎo)的因素(I.Gordon,2008),而以統(tǒng)計年鑒數(shù)據(jù) 為主導(dǎo)的區(qū)域性建設(shè)用地產(chǎn)出效率分析恰恰忽略了社會個體的行為特征,這也是現(xiàn)有研宄 的缺陷之一。
[0004] 近年來,大數(shù)據(jù)的出現(xiàn)一定程度上解決了過去長期存在的數(shù)據(jù)短缺問題,使得部 分無法進(jìn)行的定量分析變得可行(Delyser、Sui,2013)。也在測度城市活動方面有了較大突 破,城市的經(jīng)濟(jì)、文化、交通、娛樂等方面都已經(jīng)和信息化的數(shù)字空間緊密結(jié)合(王靜遠(yuǎn)等 2014),人群活動及空間分布的數(shù)據(jù)研宄通過微博等社交工具成為可能。目前應(yīng)用大數(shù)據(jù) 探索居民出行和交通的研宄相對較多,且多從電信運(yùn)營商、社交網(wǎng)站、出租車及公交智能卡 等多種途徑獲取數(shù)據(jù)進(jìn)行研宄(Becker,2011 ;Kang,2012 ;Mark,2011 ;Naaman,2012 ;龍瀛, 張宇,崔承印,2012 ;Batty,2013)。相關(guān)研宄成果的涌現(xiàn),為新時期的城鄉(xiāng)規(guī)劃學(xué)科發(fā)展提 供了卓有成效的技術(shù)導(dǎo)引。由于互聯(lián)網(wǎng)數(shù)據(jù)更新的實時性,且能準(zhǔn)確定位使用者的地理位 置,通過人群活動數(shù)據(jù)研宄的范圍可縮小至具體街區(qū),由此,土地承載效率的大數(shù)據(jù)分析更 為有效,避免了一般統(tǒng)計數(shù)據(jù)無法判別具體用地效率的問題。
[0005] 現(xiàn)實中,國內(nèi)規(guī)劃領(lǐng)域一直拙于對建設(shè)用地的承載效率測度,多依賴于經(jīng)濟(jì)統(tǒng)計 年鑒數(shù)據(jù)等方式,這種粗口徑的研宄方式雖然能判別宏觀尺度下城市建成環(huán)境的優(yōu)劣,但 囿于空間尺度的有限性,無法更加細(xì)致的判別土地承載效率的空間特征。另一方面,建設(shè)用 地承載效率不能脫離社會個體的活動,借助于統(tǒng)計年鑒數(shù)據(jù)的承載效率測度雖然可以計算 整體的城市發(fā)達(dá)程度,但這種結(jié)構(gòu)性的測度容易忽略個體的空間活動,甚至與市民的日常 行為之間形成明顯的斷裂。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的主要目的在于克服現(xiàn)有技術(shù)的缺點與不足,提供基于數(shù)據(jù)挖掘的建設(shè)用 地承載效率測度方法。
[0007] 為了達(dá)到上述目的,本發(fā)明采用以下技術(shù)方案:
[0008] 一種基于數(shù)據(jù)挖掘的建設(shè)用地承載效率測度方法,包括下述步驟:
[0009] S1、數(shù)據(jù)挖掘,以網(wǎng)絡(luò)數(shù)據(jù)作為主要數(shù)據(jù)來源,并以人口普查等傳統(tǒng)數(shù)據(jù)作為補(bǔ) 充,通過對各項活動數(shù)據(jù)的挖掘和空間定位,探索建設(shè)用地承載效率的空間特征;所述網(wǎng)絡(luò) 數(shù)據(jù)包括居住活動數(shù)據(jù)、就業(yè)活動數(shù)據(jù)、游憩活動數(shù)據(jù)、社交網(wǎng)站和網(wǎng)絡(luò)購物消費(fèi)數(shù)據(jù);
[0010] S2、數(shù)據(jù)解析,對于網(wǎng)絡(luò)購物數(shù)據(jù)和企業(yè)數(shù)據(jù)中的地址進(jìn)行地址解析,通過百度 LBS開放平臺中WebAPI頁面下GeocodingAPI的服務(wù)功能,將地址的文本信息轉(zhuǎn)換為經(jīng)煒 坐標(biāo);
[0011] S3、空間匹配,在完成數(shù)據(jù)收集后,將前述方法得到的地址解析數(shù)據(jù)進(jìn)行坐標(biāo)轉(zhuǎn) 換,轉(zhuǎn)化為GIS平臺可以使用的位置數(shù)據(jù),并與建設(shè)用地進(jìn)行關(guān)聯(lián)匹配;
[0012] S4、在數(shù)據(jù)挖掘、解析以及空間降維的基礎(chǔ)上,基于數(shù)據(jù)的多元特征,通過綜合測 度實現(xiàn)建設(shè)用地承載效率的區(qū)位差異測度,具體包括單要素數(shù)據(jù)的空間測度和綜合數(shù)據(jù)的 空間疊合,具體為:
[0013] S4. 1、單要素數(shù)據(jù)的空間測度,對居住、企業(yè)、游憩的各項活動的分布密度進(jìn)行測 度,利用開放平臺、企事業(yè)名錄的多維數(shù)據(jù)進(jìn)行地址解析,獲取各項活動的區(qū)位分布,并結(jié) 合建設(shè)用地和人口的密度分布狀況,反映城市整體層面的單要素承載強(qiáng)度;
[0014] S4. 2、綜合數(shù)據(jù)的空間疊合,在每項指標(biāo)要素中,對各類指標(biāo)值進(jìn)行空間柵格化處 理后,綜合熵值法和層次分析法,確定指標(biāo)權(quán)重,對單要素承載強(qiáng)度進(jìn)行主客觀綜合加權(quán)計 算,由此形成建設(shè)用地承載效率的綜合評定,并對高值、低值區(qū)域進(jìn)行空間判別。
[0015] 優(yōu)選的,步驟Sl中,所述社交網(wǎng)絡(luò)數(shù)據(jù)包括新浪微博的數(shù)據(jù),對于新浪微博的數(shù) 據(jù)獲取,通過微博API服務(wù)中的微博接口和地理信息接口主要獲取其發(fā)布微博的文本信息 和地理坐標(biāo)信息,具體為:
[0016] SI.1、根據(jù)相關(guān)要求填寫網(wǎng)頁應(yīng)用信息,獲取AppKey以及AppSecret;
[0017]SI. 2、登陸新浪微博的開放平臺,進(jìn)入數(shù)據(jù)抓取界面,在參數(shù)設(shè)置區(qū)域內(nèi)設(shè)置參 數(shù),點擊調(diào)用接口,顯示請求返回的結(jié)果;
[0018] SL3、進(jìn)入地理信息接口中"2/place/nearby_timeline"子接口,根據(jù)請求參數(shù)編 寫請求URL,確定抓取的中心點、搜索半徑以及搜索的起止時間,Python文件批量獲取搜索 內(nèi)容,所述搜索內(nèi)容包括:發(fā)布微博的時間信息、地理坐標(biāo)信息、發(fā)布文本內(nèi)容、用戶id、距 離中心點距離、性別以及用戶所在地信息,通過Python文件批量獲取搜索內(nèi)容的具體步驟 如下:
[0019] SI. 3. 1、實例化APIClient類對象,向用戶發(fā)送Auth認(rèn)證請求,客戶端用已保存的 用戶賬戶密碼登陸,模擬同意授權(quán);
[0020] SL3. 2、獲得用戶同意授權(quán)后的的URL:
[0021] YOUR_REGISTERED_REDIRECT_URI/ ?code=CODE,監(jiān)聽HTTP過程,在回調(diào)網(wǎng)頁中 截取code的值;
[0022] SI. 3. 3、提交code給API服務(wù)器,使用獲得的 0Auth2.OAccessToken調(diào)用API;
[0023]SI. 3. 4、通過調(diào)用place/pois/users、place/pois/tips、place/poi_timeline等 接口得到包含POI點的簽到數(shù)、帶有地理位置的微博、用戶信息等信息的JSON格式數(shù)據(jù);
[0024]SI. 3. 5、解析Json格式的數(shù)據(jù),保存在本地。
[0025] 優(yōu)選的,所述網(wǎng)絡(luò)數(shù)據(jù)還包括圖片數(shù)據(jù),對于圖片數(shù)據(jù)的抓取,是通過panoramio 網(wǎng)站進(jìn)行,通過panoramio開放平臺中GeocodingAPI頁面下的WebAPI服務(wù)功能,根據(jù)其 參數(shù)要求,編寫發(fā)送http請求的URL,并借助LocoySpider軟件,批量發(fā)送和接收http請求 返回的數(shù)據(jù)。
[0026] 優(yōu)選的,步驟S2中,數(shù)據(jù)解析的具體方法為:
[0027]S2. 1、獲取API接口 密鑰;
[0028]S2. 2、使用獲取的密鑰,根據(jù)其參數(shù)要求,編寫發(fā)送http請求的URL;
[0029] S2. 3、借助LocoySpider軟件,批量發(fā)送和接收http請求返回的數(shù)據(jù),由此完成文 本信息的地址解析。
[0030] 優(yōu)選的,步驟S4. 1中,在建設(shè)用地承載效率的單要素測度方面,從三大類基本活 動的強(qiáng)度分布入手,首先對柵格內(nèi)的居住活動、游憩活動的原子化數(shù)據(jù)的數(shù)量進(jìn)行匯總,企 業(yè)活動則通過營業(yè)額進(jìn)行匯總,并計算第k項要素在空間單元i中的活動強(qiáng)度rik,并對各 項活動的絕對強(qiáng)度數(shù)據(jù)進(jìn)行歸一化處理,即:
【主權(quán)項】
1. 一種基于數(shù)據(jù)挖掘的建設(shè)用地承載效率測度方法,其特征在于,包括下述步驟: 51、 數(shù)據(jù)挖掘,以網(wǎng)絡(luò)數(shù)據(jù)作為主要數(shù)據(jù)來源,并以人口普查等傳統(tǒng)數(shù)據(jù)作為補(bǔ)充,通 過對各項活動數(shù)據(jù)的挖掘和空間定位,探索建設(shè)用地承載效率的空間特征;所述網(wǎng)絡(luò)數(shù)據(jù) 包括居住活動數(shù)據(jù)、就業(yè)活動數(shù)據(jù)、游憩活動數(shù)據(jù)、社交網(wǎng)站和網(wǎng)絡(luò)購物消費(fèi)數(shù)據(jù); 52、 數(shù)據(jù)解析,對于網(wǎng)絡(luò)購物數(shù)據(jù)和企業(yè)數(shù)據(jù)中的地址進(jìn)行地址解析,通過百度LBS開 放平臺中Web API頁面下Geocoding API的服務(wù)功能,將地址的文本信息轉(zhuǎn)換為經(jīng)煒坐標(biāo); 53、 空間匹配,在完成數(shù)據(jù)收集后,將前述方法得到的地址解析數(shù)據(jù)進(jìn)行坐標(biāo)轉(zhuǎn)換,轉(zhuǎn) 化為GIS平臺可以使用的位置數(shù)據(jù),并與建設(shè)用地進(jìn)行關(guān)聯(lián)匹配;