亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種地理區(qū)域格網(wǎng)劃分的微博簽到數(shù)據(jù)在線獲取方法

文檔序號(hào):6401942閱讀:1069來源:國知局
專利名稱:一種地理區(qū)域格網(wǎng)劃分的微博簽到數(shù)據(jù)在線獲取方法
技術(shù)領(lǐng)域
本發(fā)明涉及測繪技術(shù)領(lǐng)域,尤其涉及一種地理區(qū)域格網(wǎng)劃分的微博簽到數(shù)據(jù)在線獲取方法。
背景技術(shù)
隨著科技的快速發(fā)展,移動(dòng)社交網(wǎng)絡(luò)由于其無縫地將移動(dòng)計(jì)算和社會(huì)計(jì)算結(jié)合起來,極大地增強(qiáng)了用戶的真實(shí)性、地域性和交互的實(shí)時(shí)性,使得移動(dòng)社交網(wǎng)絡(luò)成為了當(dāng)下最有影響力的社交平臺(tái),其中便以微博的用戶群體最為龐大。微博,即微博客的簡稱,是一個(gè)基于用戶關(guān)系信息分享、傳播以及獲取平臺(tái),用戶可以通過WEB、WAP等各種客戶端組建個(gè)人社區(qū),以140字左右的文字更新信息,并實(shí)現(xiàn)即時(shí)分享。微博作為當(dāng)下最流行的社會(huì)化網(wǎng)絡(luò)服務(wù)媒體,微博設(shè)計(jì)的出發(fā)點(diǎn)是滿足日益增長的用戶社交的基本需求,他是基于交往而產(chǎn)生價(jià)值的網(wǎng)絡(luò)產(chǎn)品,其設(shè)計(jì)與運(yùn)營的核心是用戶關(guān)系,即人與人的關(guān)系。同時(shí)隨著Web2.0技術(shù)的日益成熟和普及,LBS (Location Based Service,基于位置服務(wù))成為了當(dāng)下發(fā)展最為迅猛的科技應(yīng)用之一?;谖恢玫姆?wù)是當(dāng)今發(fā)展比較成熟、普及程度較高的地理位置服務(wù)業(yè)務(wù)。簽到(Check In)是LBS所提供的服務(wù)之一,其與微博的結(jié)合使得“簽到”成為了人們標(biāo)記自我,記錄生活軌跡的一種方式。與此同時(shí)微博位置簽到數(shù)據(jù)應(yīng)運(yùn)而生,其是指通過微博簽到操作所獲取并存儲(chǔ)管理的地理位置數(shù)據(jù),其內(nèi)容包括了名稱、屬性以及地理坐標(biāo)
等信息。利用微博位置簽到數(shù)據(jù)為研究個(gè)人社交關(guān)系提供了一種基于時(shí)空關(guān)系的新思路,也得到了人們越來越多的關(guān)注。不過,隨著LBS的快速發(fā)展,其對位置信息數(shù)量以及時(shí)效性的要求也越來越高。POI (Point Of Interest,興趣點(diǎn))作為當(dāng)前位置信息的重要載體,已被廣泛應(yīng)用于車載導(dǎo)航系統(tǒng)等LBS應(yīng)用中,POI數(shù)據(jù)的實(shí)時(shí)性、數(shù)據(jù)來源的可靠性和廣泛性直接影響著LBS業(yè)務(wù)的發(fā)展,POI的更新也就成了一項(xiàng)關(guān)鍵性工作。傳統(tǒng)POI更新主要依靠人工現(xiàn)場采集后入庫的方法,與其他類型GIS數(shù)據(jù)一樣主要通過專業(yè)測繪部門采集管理,不僅費(fèi)時(shí)費(fèi)力、效率低下,其現(xiàn)勢性也已無法滿足位置服務(wù)和行業(yè)GIS應(yīng)用的整體需求。依靠移動(dòng)社交網(wǎng)絡(luò)提供的位置簽到數(shù)據(jù)來獲取更新POI的數(shù)據(jù)源成為了一個(gè)新的研究方向。位置簽到數(shù)據(jù)來自大量用戶帶有GPS定位功能的智能移動(dòng)終端上傳的信息,具有數(shù)據(jù)量大、現(xiàn)勢性高、具有社會(huì)化屬性等特點(diǎn),使其成為實(shí)現(xiàn)POI高效高質(zhì)更新的一種潛在可用數(shù)據(jù)源。
無論是基于位置簽到數(shù)據(jù)的社交關(guān)系,還是基于位置簽到數(shù)據(jù)的POI更新,亦或是其他基于位置簽到數(shù)據(jù)的應(yīng)用,其實(shí)現(xiàn)前提都是如何獲取位置簽到數(shù)據(jù)。但是由于移動(dòng)社交網(wǎng)絡(luò)用戶基數(shù)大,用戶上傳的位置簽到數(shù)據(jù)的數(shù)據(jù)量十分龐大,使得如何有效的、合理的、高效的獲取位置簽到數(shù)據(jù)成為了難題,同時(shí)如和將獲取的位置簽到數(shù)據(jù)進(jìn)行批量化、規(guī)范化的信息提取,以及如何快速的更新位置簽到數(shù)據(jù)數(shù)據(jù)庫等問題,也都成為了使用位置簽到數(shù)據(jù)的難題。當(dāng)前主流的微博平臺(tái)都提供了免費(fèi)的接口,支持多種SDK,包括多種SDK,包括C++、PHP、JAVA、Android等流行語言的軟件開發(fā)工具包。開發(fā)者在經(jīng)過授權(quán)之后可以通過調(diào)用微博平臺(tái)提供的API進(jìn)行數(shù)據(jù)獲取。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種快速、高效、批量式的微博簽到數(shù)據(jù)在線獲取方法,以滿足社會(huì)及LBS等行業(yè)領(lǐng)域?qū)Υ罅亢灥綌?shù)據(jù)的需求。本發(fā)明的技術(shù)方案為一種地理區(qū)域格網(wǎng)劃分的微博簽到數(shù)據(jù)在線獲取方法,其特征在于,包括以下步驟:
步驟1:配置數(shù)據(jù)庫;
步驟2:對地理區(qū)域進(jìn)行格網(wǎng)劃分;
步驟3:獲取所述的格網(wǎng)區(qū)域內(nèi)的POI點(diǎn)的基本信息;
步驟4:獲取所述的每個(gè)POI點(diǎn)的位置動(dòng)態(tài)信息;
步驟5:獲取用戶的簽到歷史軌跡。作為優(yōu)選,其所述的步驟I進(jìn)一步包括以下子步驟:
步驟1.1:選擇合適的數(shù)據(jù)庫管理系統(tǒng);
步驟1.2:使用所述的數(shù)據(jù)庫管理系統(tǒng)建立不同的數(shù)據(jù)表,以存儲(chǔ)不同類型的數(shù)據(jù)。作為優(yōu)選,所述的步驟2進(jìn)一步包括以下子步驟:
步驟2.1:獲取所述的地理區(qū)域的經(jīng)緯度坐標(biāo)范圍;
步驟2.2:設(shè)置合適的格網(wǎng)劃分閾值;
步驟2.3:對整個(gè)所述的地理區(qū)域進(jìn)行格網(wǎng)劃分。作為優(yōu)選,所述的POI點(diǎn)的基本信息,是通過循環(huán)調(diào)用微博平臺(tái)提供的接口而獲取的。作為優(yōu)選,所述的每個(gè)POI點(diǎn)的位置動(dòng)態(tài)信息,是根據(jù)所訴的每個(gè)POI點(diǎn)的ID號(hào),循環(huán)調(diào)用微博平臺(tái)提供的接口獲取在此POI點(diǎn)進(jìn)行過簽到的操作信息和用戶信息。作為優(yōu)選,所述的步驟5進(jìn)一步包括以下子步驟:
步驟5.1:對在所有POI點(diǎn)進(jìn)行過簽到操作的用戶ID進(jìn)行排序,可以得到按簽到頻率排序的用戶ID序列,排名第一的用戶即為在該地理區(qū)域進(jìn)行過簽到操作最多的用戶;
步驟5.2:根據(jù)需求,選擇不同頻率簽到操作的用戶,通過調(diào)用微博平臺(tái)提供的接口獲取所述用戶的簽到歷史軌跡。本發(fā)明具有以下優(yōu)點(diǎn)和積極效果:
1.實(shí)現(xiàn)了微博簽到數(shù)據(jù)的在線、快速、高效、批量下載,滿足了社會(huì)及LBS等行業(yè)領(lǐng)域?qū)Υ罅亢灥綌?shù)據(jù)的需求;
2.本發(fā)明使用微博平臺(tái)免費(fèi)提供的接口作為數(shù)據(jù)下載的媒介,方法效率高,成本低,易于實(shí)現(xiàn)。


圖1:是本發(fā)明的實(shí)施例流程圖。
具體實(shí)施例方式本發(fā)明利用微博平臺(tái)免費(fèi)提供的接口作為數(shù)據(jù)在線獲取的媒介,提出了一種地理區(qū)域格網(wǎng)劃分的微博簽到數(shù)據(jù)在線獲取方法。以下以新浪微博平臺(tái)為例結(jié)合附圖和實(shí)施例詳細(xì)說明本發(fā)明技術(shù)方案。請見圖1,本發(fā)明的技術(shù)方案為一種地理區(qū)域格網(wǎng)劃分的微博簽到數(shù)據(jù)在線獲取方法,包括以下步驟:
步驟1:配置數(shù)據(jù)庫;本步驟進(jìn)一步包括以下子步驟,
步驟1.1:選擇合適的數(shù)據(jù)庫管理系統(tǒng);具體實(shí)施時(shí),本領(lǐng)域技術(shù)人員可以根據(jù)不同的應(yīng)用需求選擇不同的數(shù)據(jù)庫管理系統(tǒng),并且在本地計(jì)算機(jī)安裝;
步驟1.2:使用數(shù)據(jù)庫管理系統(tǒng)建立不同的數(shù)據(jù)表,以存儲(chǔ)不同類型的數(shù)據(jù),并根據(jù)不同數(shù)據(jù)表所需的表屬性為每一個(gè)數(shù)據(jù)表設(shè)置好響應(yīng)的數(shù)據(jù)結(jié)構(gòu)和主屬性。步驟2:對地理區(qū)域進(jìn)行格網(wǎng)劃分;本步驟進(jìn)一步包括以下子步驟: 步驟2.1:獲取地理區(qū)域的經(jīng)緯度坐標(biāo)范圍,以上海市區(qū)域?yàn)槔?,起始?jīng)緯度為(31.44226389,121.0112722),終止經(jīng)緯度為(30.70359444,121.9588444);
步驟2.2:設(shè)置合適的格網(wǎng)劃分閾值;以新浪微博為例,其“place/nearby/pois”接口允許的最大查詢半徑為10000米,為了保證能將地理區(qū)域內(nèi)所有數(shù)據(jù)都能無遺漏地獲取,所以格網(wǎng)的劃分閾值也應(yīng)在10000米內(nèi);
步驟2.3:按照設(shè)置的格網(wǎng)劃分閾值和經(jīng)緯度坐標(biāo)范圍,對整個(gè)區(qū)域范圍進(jìn)行格網(wǎng)劃分。本實(shí)施例采用增量式的方法進(jìn)行格網(wǎng)劃分;
NewLat=Lat+AddLat
NewLon=Lon+AddLon
式中NewLat和NewLon是下一個(gè)格網(wǎng)中心坐標(biāo),Lat和Lon是前一個(gè)格網(wǎng)中心坐標(biāo),AddLat和AddLon是格網(wǎng)劃分增量。步驟3:獲取格網(wǎng)區(qū)域內(nèi)的POI點(diǎn)的基本信息;Ρ0Ι點(diǎn)的基本信息,是通過循環(huán)調(diào)用微博平臺(tái)提供的接口而獲取的;具體包括以下子步驟:
步驟3.1:將Lat、Lon、最大查詢半徑range等參數(shù)傳入“place/nearby/pois”接口,接口會(huì)返回以(Lat,Lon)坐標(biāo)為中心的格網(wǎng)范圍內(nèi)所有的POI點(diǎn)的信息,信息是一個(gè)Json字符串,主要屬性包括poiid (Ρ0Ι點(diǎn)唯一標(biāo)識(shí)符),title (名稱),address (地址),1n (經(jīng)度),Iat (纟韋度),category (類別),city (所在城市),province (所在省份),country (所在國家),url (網(wǎng)址),phone (電話),postcode (郵編),checkin_num (簽到次數(shù)),checkin_user_num (簽到人數(shù))等;
步驟3.2:循環(huán)調(diào)用該接口,獲取不同地理格網(wǎng)范圍內(nèi)的POI信息。該方法的偽代碼如
下:
權(quán)利要求
1.一種地理區(qū)域格網(wǎng)劃分的微博簽到數(shù)據(jù)在線獲取方法,其特征在于,包括以下步驟: 步驟1:配置數(shù)據(jù)庫; 步驟2:對地理區(qū)域進(jìn)行格網(wǎng)劃分; 步驟3:獲取所述的格網(wǎng)區(qū)域內(nèi)的POI點(diǎn)的基本信息,所述的POI點(diǎn)為興趣點(diǎn); 步驟4:獲取所述的每個(gè)POI點(diǎn)的位置動(dòng)態(tài)信息; 步驟5:獲取用戶的簽到歷史軌跡。
2.根據(jù)權(quán)利要求1所述的地理區(qū)域格網(wǎng)劃分的微博簽到數(shù)據(jù)在線獲取方法,其特征在于:所述的步驟I進(jìn)一步包括以下子步驟: 步驟1.1:選擇合適的數(shù)據(jù)庫管理系統(tǒng); 步驟1.2:使用所述的數(shù)據(jù)庫管理系統(tǒng)建立不同的數(shù)據(jù)表,以存儲(chǔ)不同類型的數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的地理區(qū)域格網(wǎng)劃分的微博簽到數(shù)據(jù)在線獲取方法,其特征在于:所述的步驟2進(jìn)一步包括以下子步驟: 步驟2.1:獲取所述的地理區(qū)域的經(jīng)緯度坐標(biāo)范圍; 步驟2.2:設(shè)置合適的格網(wǎng)劃分閾值; 步驟2.3:對整個(gè)所述的地理區(qū)域進(jìn)行格網(wǎng)劃分。
4.根據(jù)權(quán)利要求1所述的地理區(qū)域格網(wǎng)劃分的微博簽到數(shù)據(jù)在線獲取方法,其特征在于:所述的POI點(diǎn)的基本信息,是通過循環(huán)調(diào)用微博平臺(tái)提供的接口而獲取的。
5.根據(jù)權(quán)利要求1所述的地理區(qū)域格網(wǎng)劃分的微博簽到數(shù)據(jù)在線獲取方法,其特征在于:所述的每個(gè)POI點(diǎn)的位置動(dòng)態(tài)信息,是根據(jù)所訴的每個(gè)POI點(diǎn)的ID號(hào),循環(huán)調(diào)用微博平臺(tái)提供的接口獲取在此POI點(diǎn)進(jìn)行過簽到的操作信息和用戶信息。
6.根據(jù)權(quán)利要求1所述的地理區(qū)域格網(wǎng)劃分的微博簽到數(shù)據(jù)在線獲取方法,其特征在于:所述的步驟5進(jìn)一步包括以下子步驟: 步驟5.1:對在所有POI點(diǎn)進(jìn)行過簽到操作的用戶ID進(jìn)行排序,可以得到按簽到頻率排序的用戶ID序列,排名第一的用戶即為在該地理區(qū)域進(jìn)行過簽到操作最多的用戶; 步驟5.2:根據(jù)需求,選擇不同頻率簽到操作的用戶,通過調(diào)用微博平臺(tái)提供的接口獲取所述用戶的簽到歷史軌跡。
全文摘要
本發(fā)明涉及測繪技術(shù)領(lǐng)域,尤其涉及一種地理區(qū)域格網(wǎng)劃分的微博簽到數(shù)據(jù)在線獲取方法。包括以下步驟步驟1配置數(shù)據(jù)庫;步驟2對地理區(qū)域進(jìn)行格網(wǎng)劃分;步驟3獲取所述的格網(wǎng)區(qū)域內(nèi)的POI點(diǎn)的基本信息;步驟4獲取所述的每個(gè)POI點(diǎn)的位置動(dòng)態(tài)信息;步驟5獲取用戶的簽到歷史軌跡。本發(fā)明實(shí)現(xiàn)了微博簽到數(shù)據(jù)的在線、快速、高效、批量下載,滿足了社會(huì)及LBS等行業(yè)領(lǐng)域?qū)Υ罅亢灥綌?shù)據(jù)的需求;本發(fā)明使用微博平臺(tái)免費(fèi)提供的接口作為數(shù)據(jù)下載的媒介,方法效率高,成本低,易于實(shí)現(xiàn)。
文檔編號(hào)G06F17/30GK103198135SQ201310126829
公開日2013年7月10日 申請日期2013年4月12日 優(yōu)先權(quán)日2013年4月12日
發(fā)明者曹勁舟, 武紅宇 申請人:武漢大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1