專利名稱:挖掘熱帶氣旋移動軌跡通道方法
挖掘熱帶氣旋移動軌跡通道方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種挖掘熱帶氣旋移動軌跡通道方法。
背景技術(shù):
熱帶氣旋是生成于熱帶或副熱帶洋面上,具有有組織的對流和確定的氣旋性環(huán)流 的非鋒面性渦旋的統(tǒng)稱,包括熱帶低壓、熱帶風(fēng)暴、強(qiáng)熱帶風(fēng)暴、臺風(fēng)、強(qiáng)臺風(fēng)和超強(qiáng)臺風(fēng)。 關(guān)于熱帶氣旋的移動行為模式的研究對于預(yù)測和分類熱帶氣旋的移動有顯著的意義。軌跡 通道作為移動物體的一種時空模式,可以確定被頻繁訪問的有向空間區(qū)域,熱帶氣旋移動 軌跡通道即為被熱帶氣旋頻繁訪問過的有向空間區(qū)域。 數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或挖掘知識,聚類分析作為數(shù)據(jù)挖掘的一個重要方 法,可以根據(jù)數(shù)據(jù)的相似性把大型數(shù)據(jù)集合劃分成組。聚類分析可以獲得數(shù)據(jù)分布的情況, 觀察每個簇的特征,集中對某些特定的簇做進(jìn)一步的分析。聚類分析方法可以有效地幫助 找到可以被連接的熱帶氣旋移動軌跡簇,并且連接之后可以得到熱帶氣旋移動軌跡通道。 但是針對不同數(shù)據(jù)類型,聚類方法不盡相同,特別是對于軌跡數(shù)據(jù)類型,目前發(fā)明的聚類方 法還相當(dāng)有限,并且各自存在一定的缺陷和局限性,其中一個原因是軌跡數(shù)據(jù)面臨相似性 評估難題。
發(fā)明內(nèi)容
基于此,有必要提供一種能有效挖掘熱帶氣旋移動軌跡通道的方法。
—種挖掘熱帶氣旋移動軌跡通道方法,包括以下步驟A.網(wǎng)格切分熱帶氣旋移動 軌跡,獲取熱帶氣旋移動的子軌跡;B.利用調(diào)整的離散弗雷歇距離計(jì)算熱帶氣旋移動子 軌跡間的相似度;C.層次聚類熱帶氣旋移動子軌跡,獲取熱帶氣旋移動子軌跡的軌跡簇; D.連接熱帶氣旋移動子軌跡的軌跡簇,獲取熱帶氣旋移動軌跡通道。 優(yōu)選的,該方法還包括根據(jù)計(jì)算得到的熱帶氣旋移動子軌跡、軌跡簇、軌跡通道實(shí) 現(xiàn)可視化的步驟。 優(yōu)選的,步驟A中網(wǎng)格切分熱帶氣旋移動軌跡的步驟包括Al.通過按順序遍歷一 次全軌跡的全部數(shù)據(jù)點(diǎn),將整個平面空間切分成mX n個網(wǎng)格單元,實(shí)現(xiàn)空間網(wǎng)格化,m、n均 為正整數(shù);A2.將完整的熱帶氣旋移動軌跡在每一個網(wǎng)格單元的邊界切分開,形成熱帶子 軌跡,實(shí)現(xiàn)全軌跡的片斷化;A3.將含有不夠數(shù)目子軌跡的網(wǎng)格單元濾除。
優(yōu)選的,所述切分方法為通過按順序遍歷一次全部軌跡的全部數(shù)據(jù)點(diǎn),判定相鄰 的數(shù)據(jù)點(diǎn)是否存在于相同網(wǎng)格單元,當(dāng)相鄰數(shù)據(jù)點(diǎn)存在于不同的網(wǎng)格單元,則將相鄰數(shù)據(jù) 點(diǎn)連線所通過的所有網(wǎng)格單元邊界均為切分點(diǎn),原軌跡在切分點(diǎn)處斷開,形成子軌跡片斷。
優(yōu)選的,步驟B中利用調(diào)整的離散弗雷歇距離計(jì)算熱帶氣旋移動子軌跡間的相似 度的步驟包括Bl.調(diào)整離散弗雷歇距離定義將離散弗雷歇距離公式 8dF(P, 0) = ,nim, |p〗—q, |
中的I I運(yùn)算修正為時空影響因素的加權(quán)和,對于子軌跡的頂點(diǎn)對(Pi,q》來說,
所述的I I運(yùn)算被定義為
B2.對網(wǎng)格單元內(nèi)的子軌跡,兩兩計(jì)算調(diào)整的離散弗雷歇距離得到一個距離矩陣, 并且通過排序生成距離索引表。 優(yōu)選的,步驟C中層次聚類熱帶氣旋移動子軌跡的步驟包括Cl.將每一個子軌跡
分配到各不相同的軌跡簇中,從距離索引表中獲取當(dāng)前距離最近的兩個子軌跡,對于兩個
子軌跡存在的軌跡簇如果不包含任子軌跡對且兩軌跡簇之間距離超過設(shè)定閾值,將兩個軌
跡簇合并;C2.將所有不包含足夠子軌跡數(shù)目的軌跡簇或不包含軌跡簇的網(wǎng)格單元濾除。
優(yōu)選的,步驟D中連接熱帶氣旋移動子軌跡的軌跡簇的步驟包括網(wǎng)格單元順序
遍歷,單一方向檢查軌跡簇,遍歷到每一個網(wǎng)格單元,檢查所述網(wǎng)格單元所存在的所有軌跡
簇的終點(diǎn)和其他在相鄰網(wǎng)格單元的軌跡簇的起點(diǎn);當(dāng)網(wǎng)格單元所存在的所有軌跡簇的終點(diǎn)
和其他在相鄰網(wǎng)格單元的軌跡簇的起點(diǎn)符合設(shè)定條件時進(jìn)行笛卡兒積交叉連接。 優(yōu)選的,設(shè)定條件依據(jù)網(wǎng)格單元所存在的所有軌跡簇的終點(diǎn)和其他在相鄰網(wǎng)格單
元的軌跡簇的起點(diǎn)的空間位置關(guān)系或速度屬性進(jìn)行判斷,當(dāng)起點(diǎn)和終點(diǎn)屬性類似,位置接
近時,判斷為可連接。 上述挖掘熱帶氣旋移動軌跡通道方法,通過網(wǎng)格切分空間及熱帶氣旋移動軌跡, 可以獲取熱帶氣旋移動子軌跡片斷,以子軌跡片斷作為聚類單元可以有效識別同一熱帶氣 旋在不同時期屬于不同簇的情況,以網(wǎng)格作為操作單元,可以提高計(jì)算效率降低計(jì)算時間, 易于并行化處理。 通過調(diào)整離散弗雷歇距離定義,可以使得離散弗雷歇距離不僅能考慮到不同熱帶 氣旋的相對位置和形狀等空間因素,同時還能考慮到速度等時間因素。 同時,利用最近鄰凝聚層次聚類模式和全連接判定相結(jié)合的聚類方式可以有效避 免熱帶氣旋移動子軌跡相似性累加的影響。 通過遍歷生成的熱帶氣旋移動軌跡簇并且采用笛卡兒積交叉,可以在聚類分析之 后進(jìn)一步獲得熱帶氣旋全局行為行為模式,即得到熱帶氣旋移動軌跡通道。
圖1是挖掘熱帶氣旋移動軌跡通道方法的系統(tǒng)框架圖;
圖2是網(wǎng)格切分空間及熱帶氣旋移動軌跡的算法流程圖;
圖3是層次聚類熱帶氣旋移動子軌跡的算法流程圖;
圖4是連接熱帶氣旋移動子軌跡的軌跡簇的算法流程圖。
具體實(shí)施方式
下面主要結(jié)合
挖掘熱帶氣旋移動軌跡通道的方法。
如圖1所示,挖掘熱帶氣旋移動軌跡通道的方法包括如下流程步驟
A、網(wǎng)格切分熱帶氣旋移動軌跡,獲取熱帶氣旋移動子軌跡片斷。
首先利用網(wǎng)格切分空間及熱帶氣旋移動軌跡。在空間網(wǎng)格化步驟中,整個平面空
5間被切分為mXn個網(wǎng)格單元空間。在全軌跡片斷化步驟中,完整的熱帶氣旋移動軌跡在每 一個網(wǎng)格單元的邊界被切分開,形成子軌跡,從而每一個子軌跡都屬于某一個確定的網(wǎng)格 單元。切分方法通過按順序遍歷一次全部軌跡的全部數(shù)據(jù)點(diǎn),判定相鄰的數(shù)據(jù)點(diǎn)是否存在 于相同網(wǎng)格單元,從而決定是否進(jìn)行截?cái)嗖僮?。?dāng)相鄰數(shù)據(jù)點(diǎn)存在于不同的網(wǎng)格單元,相鄰 數(shù)據(jù)點(diǎn)連線所通過的所有網(wǎng)格單元邊界均為切分點(diǎn),原軌跡在切分點(diǎn)處斷開,形成子軌跡 片斷。在切分過程后,進(jìn)行網(wǎng)格過濾步驟,含有不夠數(shù)目子軌跡的網(wǎng)格單元將被濾除,因?yàn)?這些網(wǎng)格單元中不可能生成含有足夠數(shù)量子軌跡的軌跡簇。算法如圖2所示。 B、利用調(diào)整的離散弗雷歇距離計(jì)算熱帶氣旋移動子軌跡間的相似度。 在利用調(diào)整的離散弗雷歇距離計(jì)算熱帶氣旋移動子軌跡間的相似度的部分,每一
個操作均存在于某一個濾除過后被保留下的網(wǎng)格單元中。對某一個網(wǎng)格單元內(nèi)的所有子軌
跡,兩兩計(jì)算調(diào)整的離散弗雷歇距離得到一個距離矩陣,并且通過排序生成索引表。離散弗
雷歇距離公式為 s戰(zhàn)(p'切=,n r f m, JPi — q,
coupling G Ijpi,:q,JEG 其中原本I I運(yùn)算為歐幾里德距離或者其他空間標(biāo)準(zhǔn)距離。為了同時考慮時間 因素,例如速度,I I運(yùn)算被修正為時空影響因素加權(quán)和。即對于熱帶氣旋移動子軌跡的 頂點(diǎn)對(Pi, q》來說,I I定義為
Vajs(&c2 + ~2) +叫組2 這樣,通過動態(tài)程序運(yùn)行,可以計(jì)算出兩兩子軌跡的調(diào)整的離散弗雷歇距離。
C、層次聚類熱帶氣旋移動子軌跡,獲取熱帶氣旋移動子軌跡的軌跡簇。
在層次聚類熱帶氣旋移動子軌跡,獲取熱帶氣旋移動子軌跡的軌跡簇的部分,每 一個操作同樣存在于某一個濾除過后被保留下的網(wǎng)格單元中,并且在建立距離矩陣和距離 索引表之后。層次聚類熱帶氣旋移動子軌跡包括最近鄰凝聚層次聚類模式,全連接判定和 軌跡簇過濾三個步驟。初始化時,每一個子軌跡被分配到各不相同的軌跡簇中,每次從距 離索引表中獲取當(dāng)前距離最近的兩個子軌跡,兩個子軌跡存在的軌跡簇如果通過全連結(jié)判 定,即兩個軌跡簇中不包含任子軌跡對,其距離超過某一設(shè)定的閾值,則這兩個軌跡簇將合 并。直到距離索引表達(dá)到某一個停止條件,則不再進(jìn)行聚類。這種聚類通過逐層合并最鄰 近簇,最終得到更加合適的軌跡簇大小,通過全連結(jié)判定,可以有效避免距離累加造成的層 次聚類的誤差過大。最后所有不包含足夠多子軌跡數(shù)目的軌跡簇將被濾除,該濾除條件等 同于之前切分軌跡部分的濾除條件。同時不包含軌跡簇的網(wǎng)格單元也將進(jìn)一步被濾除。算 法如圖3所示。 D、連接熱帶氣旋移動子軌跡的軌跡簇,獲取熱帶氣旋移動軌跡通道。 在連接熱帶氣旋移動子軌跡的軌跡簇,獲取熱帶氣旋移動軌跡通道的部分中,僅
對于那些包含軌跡簇的網(wǎng)格單元進(jìn)行一次遍歷即可。該部分包括網(wǎng)格單元順序遍歷,單一
方向檢查軌跡簇以及笛卡兒積交叉連接兩個步驟。在遍歷到每一個網(wǎng)格單元時,檢查該網(wǎng)
格單元所存在的所有軌跡簇的終點(diǎn),如果有其他在相鄰網(wǎng)格單元的軌跡簇的起點(diǎn)可以與它
連接,則進(jìn)行笛卡爾積的交叉全連結(jié)。該方法可以僅遍歷一次所有網(wǎng)格單元,并且僅判斷每
一個網(wǎng)格中的軌跡簇的終點(diǎn),即可獲取所有可能存在的軌跡通道??蛇B接判定依據(jù)軌跡簇起訖點(diǎn)的空間位置關(guān)系,速度屬性等進(jìn)行判斷,當(dāng)起點(diǎn)和終點(diǎn)屬性相似,位置相近時,判斷 為可連接。算法如圖4所示。 E、根據(jù)計(jì)算得到的熱帶氣旋移動子軌跡、軌跡簇、軌跡通道實(shí)現(xiàn)可視化。
可視化軟件可以顯示熱帶氣旋的完整移動軌跡,切分之后獲得的子軌跡,以及聚 類之后的軌跡簇和連接之后的軌跡通道??勺儏?shù)包括濾除條件,聚類終止條件,全連結(jié) 判定依據(jù),網(wǎng)格單元大小,調(diào)整的離散弗雷歇距離中的時空權(quán)重比。 上述挖掘熱帶氣旋移動軌跡通道方法,通過網(wǎng)格切分空間及熱帶氣旋移動軌跡,
獲取熱帶氣旋移動子軌跡片斷;利用調(diào)整的離散弗雷歇距離計(jì)算熱帶氣旋移動子軌跡間的
相似度;層次聚類熱帶氣旋移動子軌跡,獲取熱帶氣旋移動子軌跡的軌跡簇;連接熱帶氣
旋移動子軌跡的軌跡簇,獲取熱帶氣旋移動軌跡通道;根據(jù)計(jì)算得到的熱帶氣旋移動子軌
跡,軌跡簇,軌跡通道實(shí)現(xiàn)可視化。最終可以量化并可視化得到所有熱帶氣旋移動軌跡通
道,該通道對于研究熱帶氣旋移動軌跡,預(yù)測和預(yù)防熱帶氣旋影響有重要作用。 本發(fā)明提供的挖掘熱帶氣旋移動軌跡通道方法基于數(shù)據(jù)挖掘技術(shù),獲取可靠且具
有足夠精確度的熱帶氣旋移動模式,將為氣象研究,特別是熱帶氣旋的預(yù)測和預(yù)防提供一
個掌握全局和決策輔助的工具。深入分析熱帶氣旋移動軌跡可以降低熱帶氣旋特別是臺風(fēng)
造成的人民生命財(cái)產(chǎn)的損失,同時最大程度的減免國家經(jīng)濟(jì)損失。 以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并 不能因此而理解為對本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對于本領(lǐng)域的普通技術(shù)人員 來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保 護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
權(quán)利要求
一種挖掘熱帶氣旋移動軌跡通道方法,其特征在于,包括以下步驟A.網(wǎng)格切分熱帶氣旋移動軌跡,獲取熱帶氣旋移動的子軌跡;B.利用調(diào)整的離散弗雷歇距離計(jì)算熱帶氣旋移動子軌跡間的相似度;C.層次聚類熱帶氣旋移動子軌跡,獲取熱帶氣旋移動子軌跡的軌跡簇;D.連接熱帶氣旋移動子軌跡的軌跡簇,獲取熱帶氣旋移動軌跡通道。
2. 如權(quán)利要求1所述的挖掘熱帶氣旋移動軌跡通道方法,其特征在于,還包括根據(jù)計(jì) 算得到的熱帶氣旋移動子軌跡、軌跡簇、軌跡通道實(shí)現(xiàn)可視化的步驟。
3. 根據(jù)權(quán)利要求1或2所述的挖掘熱帶氣旋移動軌跡通道方法,其特征在于,所述步驟 A中網(wǎng)格切分熱帶氣旋移動軌跡的步驟包括Al.通過按順序遍歷一次全軌跡的全部數(shù)據(jù)點(diǎn),將整個平面空間切分成mXn個網(wǎng)格單 元,實(shí)現(xiàn)空間網(wǎng)格化,m、n均為正整數(shù);A2.將完整的熱帶氣旋移動軌跡在每一個網(wǎng)格單元的邊界切分開,形成熱帶子軌跡,實(shí) 現(xiàn)全軌跡的片斷化;A3.將含有不夠數(shù)目子軌跡的網(wǎng)格單元濾除。
4. 根據(jù)權(quán)利要求3所述的挖掘熱帶氣旋移動軌跡通道方法,其特征在于,所述切分方 法為通過按順序遍歷一次全部軌跡的全部數(shù)據(jù)點(diǎn),判定相鄰的數(shù)據(jù)點(diǎn)是否存在于相同網(wǎng)格 單元,當(dāng)相鄰數(shù)據(jù)點(diǎn)存在于不同的網(wǎng)格單元,則將相鄰數(shù)據(jù)點(diǎn)連線所通過的所有網(wǎng)格單元 邊界均為切分點(diǎn),原軌跡在切分點(diǎn)處斷開,形成子軌跡片斷。
5. 根據(jù)權(quán)利要求1或2所述的挖掘熱帶氣旋移動軌跡通道方法,其特征在于,所述步驟 B中利用調(diào)整的離散弗雷歇距離計(jì)算熱帶氣旋移動子軌跡間的相似度的步驟包括Bl.調(diào)整離散弗雷歇距離定義將離散弗雷歇距離公式8dF(F,切=n|!imaf J化—^ |中的l l運(yùn)算修正為時空影響因素的加權(quán)和,對于子軌跡的頂點(diǎn)對(Pi, q》來說,所 述的l l運(yùn)算被定義為^/C1>SPX2 +智2) +叫艦2;B2.對網(wǎng)格單元內(nèi)的子軌跡,兩兩計(jì)算調(diào)整的離散弗雷歇距離得到一個距離矩陣,并且 通過排序生成距離索引表。
6. 根據(jù)權(quán)利要求1或2所述的挖掘熱帶氣旋移動軌跡通道方法,其特征在于,所述步驟 C中層次聚類熱帶氣旋移動子軌跡的步驟包括CI.將每一個子軌跡分配到各不相同的軌跡簇中,從距離索引表中獲取當(dāng)前距離最近 的兩個子軌跡,對于兩個子軌跡存在的軌跡簇如果不包含任子軌跡對且兩軌跡簇之間距離 超過設(shè)定閾值,將兩個軌跡簇合并;C2.將所有不包含足夠子軌跡數(shù)目的軌跡簇或不包含軌跡簇的網(wǎng)格單元濾除。
7. 根據(jù)權(quán)利要求1或2所述的挖掘熱帶氣旋移動軌跡通道方法,其特征在于,所述步 驟D中連接熱帶氣旋移動子軌跡的軌跡簇的步驟包括網(wǎng)格單元順序遍歷,單一方向檢查 軌跡簇,遍歷到每一個網(wǎng)格單元,檢查所述網(wǎng)格單元所存在的所有軌跡簇的終點(diǎn)和其他在 相鄰網(wǎng)格單元的軌跡簇的起點(diǎn);當(dāng)網(wǎng)格單元所存在的所有軌跡簇的終點(diǎn)和其他在相鄰網(wǎng)格單元的軌跡簇的起點(diǎn)符合設(shè)定條件時進(jìn)行笛卡兒積交叉連接。
8.根據(jù)權(quán)利要求7所述的挖掘熱帶氣旋移動軌跡通道方法,其特征在于,所述設(shè)定條 件依據(jù)網(wǎng)格單元所存在的所有軌跡簇的終點(diǎn)和其他在相鄰網(wǎng)格單元的軌跡簇的起點(diǎn)的空 間位置關(guān)系或速度屬性進(jìn)行判斷,當(dāng)所述的起點(diǎn)和所述的終點(diǎn)屬性類似,位置接近時,判斷 為可連接。
全文摘要
本發(fā)明提供了一種挖掘熱帶氣旋移動軌跡通道方法,該方法包括A,網(wǎng)格切分空間及熱帶氣旋移動軌跡,獲取熱帶氣旋移動子軌跡片斷;B,利用調(diào)整的離散弗雷歇距離計(jì)算熱帶氣旋移動子軌跡間的相似度;C,層次聚類熱帶氣旋移動子軌跡,獲取熱帶氣旋移動子軌跡的軌跡簇;D,連接熱帶氣旋移動子軌跡的軌跡簇,獲取熱帶氣旋移動軌跡通道。本發(fā)明能有效發(fā)現(xiàn)熱帶氣旋移動軌跡通道,結(jié)合歷史熱帶氣旋路徑數(shù)據(jù),挖掘特定區(qū)域熱帶氣旋移動行為模式,對臺風(fēng)災(zāi)害的分析和預(yù)測可以提供直接有效的工具,為防災(zāi)減災(zāi)提供決策支持。
文檔編號G06F17/30GK101770516SQ20101004277
公開日2010年7月7日 申請日期2010年1月12日 優(yōu)先權(quán)日2010年1月12日
發(fā)明者朱浩瀚, 羅軍 申請人:深圳先進(jìn)技術(shù)研究院