亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種動態(tài)地理網(wǎng)格聚類算法

文檔序號:6546344閱讀:339來源:國知局
一種動態(tài)地理網(wǎng)格聚類算法
【專利摘要】本申請公開一種動態(tài)地理網(wǎng)格聚類算法,首先找出區(qū)域中的最大、最小經(jīng)緯度,再根據(jù)步進長度step對最大、最小經(jīng)緯度之間的區(qū)域劃分網(wǎng)格;計算出每個點所在的網(wǎng)格的編號,對同一個網(wǎng)格內的點進行聚類,計算出聚合重心點;然后將網(wǎng)格分別向上、下、左、右方向移動,移動長度保持一致,互為對稱方向的移動次數(shù)保持一致,移動方向的順序不限,每次移動后都對滿足聚類條件的網(wǎng)格內的點進行聚類,所有的聚類點構成最終的聚類結果。本發(fā)明申請所述的方法解決了傳統(tǒng)的基于網(wǎng)格的聚類算法精度不高、效率低的問題,通過本專利申請所述方法可以實現(xiàn)動態(tài)畫網(wǎng)格,粗細粒度自由控制,靈活性高,且速度高效。
【專利說明】一種動態(tài)地理網(wǎng)格聚類算法
【技術領域】
[0001]本申請屬于數(shù)據(jù)挖掘【技術領域】,涉及聚類分析,尤其涉及一種動態(tài)地理網(wǎng)格的聚類分析算法。
【背景技術】
[0002]聚類分析是數(shù)據(jù)挖掘中廣為研究的課題之一,是從數(shù)據(jù)中尋找數(shù)據(jù)間的相似性,并依此對數(shù)據(jù)進行分類,從而發(fā)現(xiàn)數(shù)據(jù)中隱含的有用信息或知識。網(wǎng)格方法是空間數(shù)據(jù)處理中常用的將空間數(shù)據(jù)離散化的方法,基于網(wǎng)格的聚類算法由于易于增量實現(xiàn)和進行高維數(shù)據(jù)處理而被廣泛應用于聚類算法中。
[0003]傳統(tǒng)的地理網(wǎng)格地圖是一種比較簡單的地圖類型。將地圖區(qū)域按照平面坐標或者按照經(jīng)緯度劃分網(wǎng)格,以網(wǎng)格為單元描述地理位置信息。把這種特定的劃分方式延伸到與數(shù)據(jù)融合中來,可以用在區(qū)域綜合分析,統(tǒng)計空間制圖,以及數(shù)據(jù)挖掘等方面。
[0004]目前,研究人員已經(jīng)提出了很多基于網(wǎng)格的聚類算法,其中STING、WaveCluster和CLIQUE是具有代表性的基于網(wǎng)格的聚類算法,或者說是比較傳統(tǒng)的基于網(wǎng)格的聚類算法。此外聚類算法還有蟻群聚類算法等傳統(tǒng)的網(wǎng)格聚類算法,如STING,它的網(wǎng)格結構的最低層的劃分粒度決定了自身算法聚類的質量。如果網(wǎng)格結構的最低層的劃分粒度比較粗,網(wǎng)格單元的數(shù)量相對較少,則會減少聚類時間,聚類速度快,但是粗粒度會降低聚類精度;反之,如果網(wǎng)格結構的最低層的劃分粒度比較細,就會得到較高的聚類精度,但同時處理開銷會增加,從而導致聚類時間會較長。另一方面,如果網(wǎng)格結構的最低層的劃分粒度過小,就會增加網(wǎng)格單元的數(shù)量,可能會導致落入網(wǎng)格單元中的數(shù)據(jù)點數(shù)目過少,從而不滿足稠密度閾值要求而被忽略。蟻群聚類算法是聚類分析常用的算法,基于蟻群算法的聚類分析方法在聚類分析過程中,運行時間可能較長,對于要求實時性的系統(tǒng)性能不能達到要求。

【發(fā)明內容】

[0005]本專利申請要解決的技術問題是:針對傳統(tǒng)的基于網(wǎng)格的聚類算法的不足,提供一種新的地理網(wǎng)格聚類算法,提高聚類的精度和實時性。
[0006]為了解決上述技術問題,本專利申請?zhí)峁┝艘环N動態(tài)地理網(wǎng)格聚類算法。具體步驟包括:
[0007]I)找出區(qū)域中的最大、最小經(jīng)緯度,再根據(jù)步進長度step對最大、最小經(jīng)緯度之間的區(qū)域劃分網(wǎng)格,其中,步進長度可在聚合數(shù)據(jù)分析中根據(jù)實際情況自行調整;
[0008]2)計算出每個點所在的網(wǎng)格的編號,點Pn (Xn,Yn)網(wǎng)格編號的方法如下:
[0009](I)計算點 Pn 所在的列數(shù) C(Pn) = (Xn-Xmin) /step ;
[0010](2)計算點 Pn 所在的行數(shù) R(Pn) = (Yn-Ymin)/step ;
[0011](3)計算點 Pn 所在的網(wǎng)格編號 G(Pn) = 1+R(Pn)* (Xmax-Xmin)/step+C (Pn)
[0012]同一網(wǎng)格中的數(shù)據(jù)我們認為它們具有共同的聚類屬性,對同一個網(wǎng)格內的點進行聚類,計算出聚合重心點;聚合重心點的計算方法可采用常規(guī)的重心點計算方法;[0013]3)以第一次劃分的網(wǎng)格為基礎分別向上、下、左、右方向移動,移動方向的順序不限,移動長度根據(jù)區(qū)域范圍大小、點分布的密集程度以及聚類精度要求自行調整(一般小于步進長度),互為對稱方向的移動次數(shù)保持一致,每次移動后都重復步驟I)進行聚類。
[0014]較佳的,根據(jù)區(qū)域范圍大小、點分布的密集程度以及聚類精度要求選取合適的移動長度,將網(wǎng)格向上、下、左、右方向各移動一次,移動方向順序不限,每次移動后重復步驟I)進行聚類,所有的聚類點構成最終的聚類結果。
[0015]本申請的有益后果是:
[0016]1.傳統(tǒng)的網(wǎng)格劃分方法需要將整張地圖進行劃分然后對每個格子進行編號,本專利所述方法無需考慮地圖邊界,只取決于欲分析的數(shù)據(jù)的邊界值;
[0017]2.動態(tài)平移網(wǎng)格時,粗細粒度自由控制,靈活性高,且速度高效。
【專利附圖】

【附圖說明】
[0018]附圖1為實施例中第一次劃分的網(wǎng)格圖;
[0019]附圖2為網(wǎng)格右移示意圖。
【具體實施方式】
[0020]本專利申請所述的一種動態(tài)地理網(wǎng)格聚類算法,在實現(xiàn)本方法時,在出現(xiàn)經(jīng)緯度點的一塊區(qū)域中找出最大、最小經(jīng)緯度,例如,現(xiàn)有Pl-Pn個點Pl (xl,yl), P2(x2, y2),…Pn (xn, yn),首先取出Pl-Pn個點中的最大、最小經(jīng)諱度(Xmax, Xmin, Ymax, Ymin);再根據(jù)步進長度step對最大、最小經(jīng)緯度之間的區(qū)域劃分網(wǎng)格,并且計算出每個點所在的網(wǎng)格的編號。在聚合數(shù)據(jù)分析中結合區(qū)域大小、點的分布情況以及聚類精度等自行調整步進長度的大小,例如區(qū)域范圍較大,且點的分布較稀疏時,步進長度應稍大,反之,區(qū)域范圍較小,且點的分布較密集,對聚類精度要求較高時,步進長度應稍小。
[0021]如果此時算出的點Pm的網(wǎng)格編號G(Pm)和點Pn的網(wǎng)格編號G(Pn)相同,那么我們認為點Pm和點Pn為落在同一網(wǎng)格的點,它們具有相同的聚類屬性,可以進行聚類,然后計算出Pm和Pn的聚合重心點。
[0022]選取合適的移動長度,一般小于步進長度,此處以移動長度為半個步進長度為例,將網(wǎng)格上移,重新計算出最大、最小經(jīng)諱度(Xmaxl, Xminl, Ymaxl, Yminl):
[0023]Xmaxi = Xmax> Xminl = Xmin> Ymaxl = Ymax+(step/2)、Yminl = Ymin+ (step/2)
[0024]再次畫出網(wǎng)格,同樣按照上面的步驟,計算出每個點所在的網(wǎng)格的編號,如果有相同聚類屬性的點則再次進行聚合。
[0025]再將第一次劃分的網(wǎng)格分別左移、右移、下移,移動長度保持一致,移動方向的順序不限,互為對稱方向的移動次數(shù)保持一致,每次移動完成后進行聚類操作,所有的聚類點構成最終的聚類結果。
[0026]如圖1所示,在地圖上有黑色、白色經(jīng)緯度點,我們取中間的0,I,2,3...9這10個點為例,這10個點分別散列在3個網(wǎng)格(①,②,③)中。第一次根據(jù)步進長度step對最大、最小經(jīng)緯度之間的區(qū)域劃分網(wǎng)格后,我們可以直觀的看出此時網(wǎng)格I中經(jīng)緯度點1、2、3具有相同的聚類屬性,網(wǎng)格2中經(jīng)緯度點4、5、6、7具有相同聚類屬性,網(wǎng)格3中經(jīng)緯度點8,9,0具有相同聚類屬性。對同一個網(wǎng)格內的點進行聚類。[0027]此時會發(fā)現(xiàn)經(jīng)緯度點3和經(jīng)緯度點4位置非常接近,應處于同一網(wǎng)格,然而通過第一次網(wǎng)格劃分后卻割裂了兩者之間的聯(lián)系,這也是傳統(tǒng)網(wǎng)格劃分方法的弊端。為了減小誤差,我們將網(wǎng)格向右移動(移動長度可在實際聚合數(shù)據(jù)分析中自行調出整使落在同一網(wǎng)格的點盡可能多的擁有相同聚類屬性的最優(yōu)值),如附圖2所示,實線為第一次劃分的網(wǎng)格,虛線為右移后的網(wǎng)格。這時可以看出圖2中虛線框出的網(wǎng)格中包含了經(jīng)緯度點3,4,5,6,可以進行聚類操作。
[0028]同理,再以第一次劃分的網(wǎng)格為基礎分別向左、上、下移動,每次移動長度保持一致,每次移動后對同一網(wǎng)格內的點進行聚類操作。所有的聚類點構成最終的聚類結果。
[0029]以上實施方案的說明只適用于幫助理解本專利申請的原理,同時對本領域的一般技術人員,依據(jù)本專利申請實施例,在【具體實施方式】以及應用范圍上均會有改變之處,因此本說明書內容不應理解為對本專利申請的限制。
【權利要求】
1.一種動態(tài)地理網(wǎng)格聚類算法,其特征在于:1)找出區(qū)域中的最大、最小經(jīng)緯度,再根據(jù)步進長度Step對最大、最小經(jīng)緯度之間的區(qū)域劃分網(wǎng)格:2)計算出每個點所在的網(wǎng)格的編號,對同一個網(wǎng)格內的點進行聚類,計算出聚合重心點;3)以第一次劃分的網(wǎng)格為基礎向上、下、左、右方向移動,移動長度保持一致,互為對稱方向的移動次數(shù)保持一致,移動方向的順序不限,每次移動后重復步驟I)進行聚類,所有的聚類點構成最終的聚類結果。
2.如權利要求1所述的一種動態(tài)地理網(wǎng)格聚類算法,其特征在于,計算點Pn(Xn,Yn)網(wǎng)格編號的方法如下: 1)計算點Pn 所在的列數(shù) C(Pn) = (Xn-Xmin) /step: 2)計算點Pn 所在的行數(shù) R(Pn) = (Yn-Ymin)/step ; 3)計算點Pn 所在的網(wǎng)格編號 G(Pn) = 1+R(Pn)*(Xmax-Xmin)/step+C(Pn)。
3.如權利要求1所述的一種動態(tài)地理網(wǎng)格聚類算法,其特征在于:在聚合數(shù)據(jù)分析中根據(jù)區(qū)域范圍大小、點分布的密集程度以及聚類精度自行調整步進長度以及移動長度的大小。
4.如權利要求1所述的一種動態(tài)地理網(wǎng)格聚類算法,其特征在于:根據(jù)區(qū)域范圍大小、點分布的密集程度以及聚類精度要求選取合適的移動長度,將第一次劃分的網(wǎng)格向上、下、左、右方向各移動一 次,移動方向順序不限,每次移動后重復步驟I)進行聚類。
【文檔編號】G06F19/00GK104021274SQ201410199387
【公開日】2014年9月3日 申請日期:2014年5月8日 優(yōu)先權日:2014年5月8日
【發(fā)明者】凌晨, 胡亮, 邢長勝, 何宇 申請人:烽火通信科技股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1