一種對批量地址信息進行自動行政區(qū)劃劃分的方法
【專利摘要】本發(fā)明公開一種對批量地址信息進行自動行政區(qū)劃劃分的方法,包括以下步驟:10.準備階段:獲取各行政區(qū)名稱,將各行政區(qū)名稱、樹形關(guān)聯(lián)以及編碼存入數(shù)據(jù)庫中;20.開始階段,包括21.獲取批量原始地址信息,并各個原始地址進行優(yōu)化,優(yōu)化包括篩查與漏檢;22.調(diào)用地圖API獲取各原始地址的經(jīng)緯度信息;23.調(diào)用地圖API,采用地圖搜索功能;24.根據(jù)樹形關(guān)聯(lián)獲取匹配結(jié)果,該匹配結(jié)果是與該地址關(guān)聯(lián)的所有級別行政區(qū)名稱。30.結(jié)束階段,包括31.將匹配成功的結(jié)果存入數(shù)據(jù)庫;32.將匹配失敗的結(jié)果輸出日志;33.統(tǒng)計匹配數(shù)量并計算命中。本發(fā)明只需要地址信息作為依據(jù)條件便可支持多級同時查找、批量查找,最大限度地提升結(jié)果匹配的命中率,非常實用及高效。
【專利說明】
-種對批量地址信息進行自動行政區(qū)劃劃分的方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及一種對批量地址信息進行自動行政區(qū)劃劃分的方法。
【背景技術(shù)】
[0002] 在互聯(lián)網(wǎng)應(yīng)用技術(shù)、軟件開發(fā)等技術(shù)蓬勃發(fā)展的今天,常常會大批量地對各種個 樣的數(shù)據(jù)進行處理,而地理信息處理便是其中一種,在軟件設(shè)計和開發(fā)過程中,基于業(yè)務(wù)需 求,常常會遇到根據(jù)用戶地址獲取地址所屬行政區(qū)域信息的需要,中國現(xiàn)行行政區(qū)劃,即省 級、地級、縣級、鄉(xiāng)級、村級、組級,其中省、縣、鄉(xiāng)=級為基本行政區(qū)。在各種行業(yè)軟件開發(fā) 或互聯(lián)網(wǎng)網(wǎng)站建設(shè)等過程中,經(jīng)常會有需要對地址進行行政區(qū)劃分的需求,例如各級政府 網(wǎng)站、城市環(huán)衛(wèi)建設(shè)、物流派件系統(tǒng)的行政區(qū)劃分類、電子商務(wù)網(wǎng)站的地區(qū)分類等。
[0003] 目前,現(xiàn)有方法主要是利用電子地圖通過輸入地址信息來逐一查找,或者通過中 華人民共和國民政部的官網(wǎng)輸入省、市等行政區(qū)信息,后查看地圖通過肉眼判斷,從而獲得 開發(fā)者想要行政區(qū)劃信息,現(xiàn)有方法存在W下缺點: (1) 不支持一次性同時對地址進行市、區(qū),街道,社區(qū)四個級別的行政區(qū)查詢,需要分不 同的過濾條件查詢地址周邊; (2) 人工輸入效率低下,一人一次只能匹配一條,無法做到自動化批量匹配。
[0004] 本發(fā)明人經(jīng)過深入研究,提出一種對批量地址信息進行自動行政區(qū)劃劃分的方 法。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明為解決上述問題,提供了一種對批量地址信息進行自動行政區(qū)劃劃分的方 法,其是針對于省級W下,包含市、區(qū)、街道/鎮(zhèn)、社區(qū)/村最常見的四個小級別的行政區(qū)劃自 動劃分的方法,只需要地址信息作為依據(jù)條件便可支持多級同時查找、批量查找,最大限度 地提升結(jié)果匹配的命中率,非常實用及高效。
[0006] 為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案為: 一種對批量地址信息進行自動行政區(qū)劃劃分的方法,包括W下步驟: 10.準備階段:獲取各行政區(qū)名稱,根據(jù)市〉區(qū)〉街道/鎮(zhèn)〉社區(qū)/村的上下級關(guān)系建立樹 形關(guān)聯(lián),關(guān)聯(lián)規(guī)則是上級對下級為一對多,將各行政區(qū)名稱、樹形關(guān)聯(lián)W及編碼存入數(shù)據(jù)庫 中; 20. 開始階段,包括W下步驟: 21. 獲取批量原始地址信息,并各個原始地址進行優(yōu)化,優(yōu)化包括篩查與漏檢; 22. 調(diào)用地圖API獲取各原始地址的經(jīng)締度信息,若獲取經(jīng)締度信息失敗,則結(jié)束; 23. 調(diào)用地圖API,采用地圖捜索功能,捜索"經(jīng)締度信息+關(guān)鍵詞",獲取匹配該經(jīng)締度 信息+關(guān)鍵詞的社區(qū)/村級行政區(qū)域信息,若捜索失敗則切換下一個關(guān)鍵詞; 24. 截取匹配成功的社區(qū)/村級行政區(qū)域信息,解析出社區(qū)/村的名稱,將解析出的社 區(qū)/村名稱與數(shù)據(jù)庫存儲的各行政區(qū)名稱進行逐級向上匹配,根據(jù)樹形關(guān)聯(lián)獲取匹配結(jié)果, 該匹配結(jié)果是與該社區(qū)/村的名稱關(guān)聯(lián)的所有級別行政區(qū)名稱; 30. 結(jié)束階段,包括W下步驟: 31. 將匹配成功的結(jié)果存入數(shù)據(jù)庫; 32. 將匹配失敗的結(jié)果輸出日志; 33. 統(tǒng)計匹配數(shù)量并計算命中率。
[0007] 所述步驟10中還包括:對各行政區(qū)進行編碼,賦予個行政區(qū)一個PID值,該PID值為 該行政區(qū)的上一級的編碼。
[0008] 所述步驟21的篩查與漏檢地址過程為:過濾地址信息里面的特殊字符串,補充完 整市級信息。
[0009] 所述步驟23的關(guān)鍵詞可W是"社區(qū)"、"居委會"、"村"或"農(nóng)場"。
[0010] 所述步驟24采用的解析規(guī)則是:選取所有匹配結(jié)果在地圖的中屯、點,根據(jù)各匹配 地址與中屯、點的距離遠近升序排列,選擇距離最近的坐標點的名稱作為解析結(jié)果。
[0011] 采用上述方案后,本發(fā)明的有益效果是: 本發(fā)明解決了各類軟件開發(fā)、網(wǎng)站建設(shè)等過程中,獲取各級行政區(qū)劃信息時,因方法有 限而導(dǎo)致的工作效率低下,命中率不高,處理數(shù)據(jù)量小等問題,大大提高了行政區(qū)劃信息匹 配效率,命中率高。
【附圖說明】
[0012] 圖1是本發(fā)明的流程簡圖。
【具體實施方式】
[0013] 為了使本發(fā)明所要解決的技術(shù)問題、技術(shù)方案及有益效果更加清楚、明白,W下結(jié) 合附圖及實施例對本發(fā)明進行進一步詳細說明。應(yīng)當理解,此處所描述的具體實施例僅用 W解釋本發(fā)明,并不用于限定本發(fā)明。
[0014] 本發(fā)明掲示的一種對批量地址信息進行自動行政區(qū)劃劃分的方法,其包括W下步 驟: 10.準備階段:獲取各行政區(qū)名稱,根據(jù)市〉區(qū)〉街道/鎮(zhèn)〉社區(qū)/村的上下級關(guān)系建立樹 形關(guān)聯(lián),關(guān)聯(lián)規(guī)則是上級對下級為一對多,將各行政區(qū)名稱、樹形關(guān)聯(lián)W及編碼存入數(shù)據(jù)庫 中; 20. 開始階段,包括W下步驟: 21. 獲取批量原始地址信息,并各個原始地址進行優(yōu)化,優(yōu)化包括篩查與漏檢; 22. 調(diào)用地圖API獲取各原始地址的經(jīng)締度信息,若獲取經(jīng)締度信息失敗,則結(jié)束; 23. 調(diào)用地圖API,采用地圖捜索功能,捜索"經(jīng)締度信息+關(guān)鍵詞",獲取匹配該經(jīng)締度 信息+關(guān)鍵詞的社區(qū)/村級行政區(qū)域信息,若捜索失敗則切換下一個關(guān)鍵詞; 24. 截取匹配成功的社區(qū)/村級行政區(qū)域信息,解析出社區(qū)/村的名稱,將解析出的社 區(qū)/村名稱與數(shù)據(jù)庫存儲的各行政區(qū)名稱進行逐級向上匹配,根據(jù)樹形關(guān)聯(lián)獲取匹配結(jié)果, 該匹配結(jié)果是與該社區(qū)/村的名稱關(guān)聯(lián)的所有級別行政區(qū)名稱; 30. 結(jié)束階段,包括W下步驟: 31. 將匹配成功的結(jié)果存入數(shù)據(jù)庫; 32. 將匹配失敗的結(jié)果輸出日志; 33. 統(tǒng)計匹配數(shù)量并計算命中率。
[0015] 所述步驟10中還包括:對各行政區(qū)進行編碼,賦予個行政區(qū)一個PID值,該PID值為 該行政區(qū)的上一級的編碼。
[0016] 所述步驟21的篩查與漏檢地址過程為:過濾地址信息里面的特殊字符串,補充完 整市級信息。
[0017]所述步驟23的關(guān)鍵詞可W是"社區(qū)"、"居委會V'林'或%琢'。
[0018] 所述步驟24采用的解析規(guī)則是:選取所有匹配結(jié)果在地圖的中屯、點,根據(jù)各匹配 地址與中屯、點的距離遠近升序排列,選擇距離最近的坐標點的名稱作為解析結(jié)果。
[0019] W下為依據(jù)本發(fā)明的劃分方法的一個應(yīng)用實例,下表是對來自于廈口市的原始地 址劃分結(jié)果。
[0020] 上述說明示出并描述了本發(fā)明的優(yōu)選實施例,應(yīng)當理解本發(fā)明并非局限于本文所 披露的形式,不應(yīng)看作是對其他實施例的排除,而可用于各種其他組合、修改和環(huán)境,并能 夠在本文發(fā)明構(gòu)想范圍內(nèi),通過上述教導(dǎo)或相關(guān)領(lǐng)域的技術(shù)或知識進行改動。而本領(lǐng)域人 員所進行的改動和變化不脫離本發(fā)明的精神和范圍,則都應(yīng)在本發(fā)明所附權(quán)利要求的保護 范圍內(nèi)。
【主權(quán)項】
1. 一種對批量地址信息進行自動行政區(qū)劃劃分的方法,其特征在于,包括以下步驟:10.準備階段:獲取各行政區(qū)名稱,根據(jù)市〉區(qū)〉街道/鎮(zhèn)〉社區(qū)/村的上下級關(guān)系建立樹 形關(guān)聯(lián),關(guān)聯(lián)規(guī)則是上級對下級為一對多,將各行政區(qū)名稱、樹形關(guān)聯(lián)以及編碼存入數(shù)據(jù)庫 中;20. 開始階段,包括以下步驟:21. 獲取批量原始地址信息,并各個原始地址進行優(yōu)化,優(yōu)化包括篩查與漏檢;22. 調(diào)用地圖API獲取各原始地址的經(jīng)煒度信息,若獲取經(jīng)煒度信息失敗,則結(jié)束; 23 .調(diào)用地圖API,采用地圖搜索功能,搜索"經(jīng)煒度信息+關(guān)鍵詞",獲取匹配該經(jīng)煒度 信息+關(guān)鍵詞的社區(qū)/村級行政區(qū)域信息,若搜索失敗則切換下一個關(guān)鍵詞;24.截取匹配成功的社區(qū)/村級行政區(qū)域信息,解析出社區(qū)/村的名稱,將解析出的社 區(qū)/村名稱與數(shù)據(jù)庫存儲的各行政區(qū)名稱進行逐級向上匹配,根據(jù)樹形關(guān)聯(lián)獲取匹配結(jié)果, 該匹配結(jié)果是與該社區(qū)/村的名稱關(guān)聯(lián)的所有級別行政區(qū)名稱;30. 結(jié)束階段,包括以下步驟:31. 將匹配成功的結(jié)果存入數(shù)據(jù)庫;32. 將匹配失敗的結(jié)果輸出日志;33. 統(tǒng)計匹配數(shù)量并計算命中率。2. 如權(quán)利要求1所述的一種對批量地址信息進行自動行政區(qū)劃劃分的方法,其特征在 于:所述步驟10中還包括:對各行政區(qū)進行編碼,賦予個行政區(qū)一個PID值,該PID值為該行 政區(qū)的上一級的編碼。3. 如權(quán)利要求1所述的一種對批量地址信息進行自動行政區(qū)劃劃分的方法,其特征在 于,所述步驟21的篩查與漏檢地址過程為:過濾地址信息里面的特殊字符串,補充完整市級 信息。4. 如權(quán)利要求1所述的一種對批量地址信息進行自動行政區(qū)劃劃分的方法,其特征在 于:所述步驟23的關(guān)鍵詞可以是"社區(qū)"、"居委會"、"村"或"農(nóng)場"。5. 如權(quán)利要求1所述的一種對批量地址信息進行自動行政區(qū)劃劃分的方法,其特征在 于:所述步驟24采用的解析規(guī)則是:選取所有匹配結(jié)果在地圖的中心點,根據(jù)各匹配地址與 中心點的距離遠近升序排列,選擇距離最近的坐標點的名稱作為解析結(jié)果。
【文檔編號】G06F17/30GK106021336SQ201610299934
【公開日】2016年10月12日
【申請日】2016年5月9日
【發(fā)明人】鐘昌賢
【申請人】廈門四方中信科技有限公司