亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式快速挖掘方法

文檔序號(hào):6632727閱讀:342來源:國知局
基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式快速挖掘方法
【專利摘要】本發(fā)明提供一種基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式快速挖掘方法,基于空間轉(zhuǎn)換的數(shù)據(jù)預(yù)處理,首先對(duì)原始的移動(dòng)軌跡數(shù)據(jù)進(jìn)行時(shí)空劃分,并基于移動(dòng)軌跡數(shù)據(jù)與時(shí)空格的匹配得到對(duì)應(yīng)的時(shí)空格序列,然后建立時(shí)空格空間中2維幾何空間所對(duì)應(yīng)的有向無權(quán)圖,并基于無權(quán)圖的頂點(diǎn)與時(shí)空格序列的匹配得到對(duì)應(yīng)的時(shí)空格序列集合;基于圖的深度優(yōu)先遍歷的移動(dòng)軌跡序列模式挖掘,在深度優(yōu)先遍歷的過程中,采用基于時(shí)空鄰近搜索的方式進(jìn)行模式增長(zhǎng),并利用頂點(diǎn)的時(shí)空格序列集合的關(guān)系運(yùn)算進(jìn)行移動(dòng)軌跡序列模式支持度的計(jì)算。與現(xiàn)有方法相比,本發(fā)明具有挖掘速度快、效率高的優(yōu)勢(shì)。
【專利說明】基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式快速挖掘方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式快速挖掘方法,屬于時(shí)空 數(shù)據(jù)挖掘的技術(shù)研究領(lǐng)域。

【背景技術(shù)】
[0002] 隨著定位技術(shù)與移動(dòng)通信技術(shù)的快速發(fā)展,基于位置服務(wù)(Location Based Service=LB巧的應(yīng)用產(chǎn)生了大量具有時(shí)空特性的移動(dòng)軌跡數(shù)據(jù)。挖掘移動(dòng)軌跡數(shù)據(jù)并從 中發(fā)現(xiàn)隱含、有用的移動(dòng)軌跡序列模式,對(duì)于分析、預(yù)測(cè)人類或動(dòng)物的相關(guān)行為習(xí)慣具有重 要的參考價(jià)值。例如,在生態(tài)學(xué)中,分析動(dòng)物的運(yùn)動(dòng)路線,可W幫助更好的理解他們的行為 習(xí)慣;當(dāng)一些動(dòng)物的運(yùn)動(dòng)模式突然改變時(shí),有可能預(yù)示即將發(fā)生某些地質(zhì)災(zāi)難,例如,地震、 海嘯等。在城市智能交通系統(tǒng)中,從大量車輛、行人的運(yùn)動(dòng)軌跡數(shù)據(jù)中發(fā)現(xiàn)頻繁的移動(dòng)軌跡 序列模式,可W輔助進(jìn)行交通規(guī)劃、交通疏導(dǎo)等。在商業(yè)應(yīng)用領(lǐng)域,從記錄人們?nèi)粘3鲂行?為習(xí)慣的運(yùn)動(dòng)軌跡數(shù)據(jù)中,挖掘移動(dòng)軌跡序列模式并與商業(yè)管理系統(tǒng)中客戶信息關(guān)聯(lián),可 W實(shí)現(xiàn)位置場(chǎng)景感知的商品推薦、目標(biāo)客戶定向廣告投送等。
[0003] 傳統(tǒng)的序列模式數(shù)據(jù)挖掘方法,例如,Apriori All、FP-tree、PrefixSpan、SPADE、 Go-SPADE,由于在項(xiàng)集和序列模式的挖掘中沒有考慮到移動(dòng)軌跡數(shù)據(jù)的時(shí)空特性,不能直 接應(yīng)用于移動(dòng)軌跡序列模式的挖掘。
[0004] 目前,出現(xiàn)了一些改進(jìn)傳統(tǒng)的序列模式挖掘方法,實(shí)現(xiàn)移動(dòng)軌跡序列模式挖掘的 方法,例如:國外學(xué)者Tsoukatos和Gunopulos提出的一種基于Aprioi的算法,挖掘周期性 出現(xiàn)的空間區(qū)域序列的方法;國外學(xué)者Hwang等提出的可W挖掘一組運(yùn)動(dòng)物體運(yùn)動(dòng)模式的 方法;國內(nèi)學(xué)者Cao提出的一種通過查找不同對(duì)象之間相似移動(dòng)軌跡,發(fā)現(xiàn)頻繁的移動(dòng)軌 跡序列模式的方法。但是該些方法都存在的一個(gè)共性問題;移動(dòng)軌跡序列模式挖掘算法的 執(zhí)行效率太低。
[0005] 分析主要原因有兩點(diǎn);(1)沒有考慮到在實(shí)際應(yīng)用中產(chǎn)生的移動(dòng)軌跡數(shù)據(jù)具有的 時(shí)空鄰近特性,直接使用所有的頻繁項(xiàng)集,生成候選的移動(dòng)軌跡序列模式,會(huì)造成候選的移 動(dòng)軌跡序列模式的數(shù)量急劇增加。(2)需要對(duì)原始移動(dòng)軌跡數(shù)據(jù)的多次掃描,并使用計(jì)算復(fù) 雜的移動(dòng)軌跡序列模式匹配運(yùn)算。該兩點(diǎn)會(huì)大大增加算法執(zhí)行的系統(tǒng)資源開銷。


【發(fā)明內(nèi)容】

[0006] 通過在分析上述問題,本發(fā)明提出了一種基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式 快速挖掘方法,可W高效地從大數(shù)量的移動(dòng)軌跡數(shù)據(jù)庫中挖掘頻繁移動(dòng)軌跡序列模式。
[0007] 本發(fā)明為解決其技術(shù)問題采用如下技術(shù)方案:
[0008] -種基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式快速挖掘方法,包括:
[0009] 基于空間轉(zhuǎn)換的數(shù)據(jù)預(yù)處理,首先對(duì)原始的移動(dòng)軌跡數(shù)據(jù)進(jìn)行時(shí)空劃分,并基于 移動(dòng)軌跡數(shù)據(jù)與時(shí)空格的匹配得到對(duì)應(yīng)的時(shí)空格序列,然后建立時(shí)空格空間中2維幾何空 間所對(duì)應(yīng)的有向無權(quán)圖,并基于無權(quán)圖的頂點(diǎn)與時(shí)空格序列的匹配得到對(duì)應(yīng)的時(shí)空格序列 集合;
[0010] 基于圖的深度優(yōu)先遍歷的移動(dòng)軌跡序列模式挖掘,在深度優(yōu)先遍歷的過程中,采 用基于時(shí)空鄰近搜索的方式進(jìn)行模式增長(zhǎng),并利用頂點(diǎn)的時(shí)空格序列集合的關(guān)系運(yùn)算進(jìn)行 移動(dòng)軌跡序列模式支持度的計(jì)算。
[0011] 進(jìn)一步地,基于空間轉(zhuǎn)換預(yù)處理移動(dòng)軌跡數(shù)據(jù)的具體步驟為:
[0012] 步驟1)根據(jù)移動(dòng)軌跡數(shù)據(jù)的時(shí)空分布范圍,采用時(shí)空等間隔的劃分的方法,構(gòu)建 時(shí)空格空間;
[0013] 步驟2)根據(jù)移動(dòng)軌跡數(shù)據(jù)與時(shí)空格空間的匹配,得到時(shí)空格序列的集合;
[0014] 步驟3)剔除時(shí)空格序列中重復(fù)時(shí)空格,并根據(jù)空間格鄰近W及用戶指定的時(shí)段 鄰近闊值,對(duì)時(shí)空格序列集合進(jìn)行分離;
[0015] 步驟4)根據(jù)設(shè)定的轉(zhuǎn)換規(guī)則,建立時(shí)空格空間中2維幾何空間所對(duì)應(yīng)的有向無權(quán) 圖;
[0016] 步驟5)將有向無權(quán)圖中所有頂點(diǎn)與時(shí)空格序列集合進(jìn)行匹配,根據(jù)頂點(diǎn)與時(shí)空 格序列的包含關(guān)系,得到所有頂點(diǎn)的時(shí)空格序列集。
[0017] 進(jìn)一步地,基于圖的深度優(yōu)先遍歷挖掘頻繁的移動(dòng)軌跡序列模式
[0018] 步驟6)由頂點(diǎn)的時(shí)空格序列集,并根據(jù)用戶指定的支持度闊值,得到長(zhǎng)度為1的 頻繁頂點(diǎn)序列模式;
[0019] 步驟7)依次查找頻繁頂點(diǎn)序列模式的最后一個(gè)頂點(diǎn)的鄰近的、頻繁的頂點(diǎn),如果 結(jié)果為空,循環(huán)執(zhí)行本步驟,直至操作完成所有頻繁的頂點(diǎn)序列模式、退出循環(huán);否則,執(zhí)行 步驟8 ;
[0020] 步驟8)依次將鄰近的、頻繁的頂點(diǎn)附加到當(dāng)前頻繁頂點(diǎn)序列模式的最后一個(gè)頂 點(diǎn),并根據(jù)設(shè)定時(shí)間跨度闊值得到候選的頂點(diǎn)序列模式集;
[0021] 步驟9)依次取出候選的頂點(diǎn)序列模式,計(jì)算支持度,如果滿足闊值,得到新的頻 繁頂點(diǎn)序列模式,并對(duì)該模式從步驟7進(jìn)行遞歸操作,否則對(duì)下一個(gè)候選的頂點(diǎn)序列模式 循環(huán)執(zhí)行本步驟,直至操作完成所有候選的頂點(diǎn)序列模式,再返回步驟7,對(duì)其他頻繁的頂 點(diǎn)序列模式進(jìn)行循環(huán)操作;
[002引步驟10)基于步驟6?9的操作結(jié)果,得到所有頻繁的頂點(diǎn)序列模式。
[0023] 進(jìn)一步地,時(shí)空格空間的定義為:對(duì)于一個(gè)包含移動(dòng)軌跡數(shù)據(jù)集的離散時(shí)空域 STD = {池,T〉|r2 =也|1《i《m},T = {tj|l《j《n}},其中,R2表示2維幾何空間、 Pi表示移動(dòng)軌跡點(diǎn)的空間位置、T表示1維時(shí)間、ti表示具體的時(shí)間點(diǎn),其對(duì)應(yīng)的時(shí)空格空 間為:
[0024]

【權(quán)利要求】
1. 一種基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式快速挖掘方法,其特征在于,包括: 基于空間轉(zhuǎn)換的數(shù)據(jù)預(yù)處理,首先對(duì)原始的移動(dòng)軌跡數(shù)據(jù)進(jìn)行時(shí)空劃分,并基于移動(dòng) 軌跡數(shù)據(jù)與時(shí)空格的匹配得到對(duì)應(yīng)的時(shí)空格序列,然后建立時(shí)空格空間中2維幾何空間所 對(duì)應(yīng)的有向無權(quán)圖,并基于無權(quán)圖的頂點(diǎn)與時(shí)空格序列的匹配得到對(duì)應(yīng)的時(shí)空格序列集 合; 基于圖的深度優(yōu)先遍歷的移動(dòng)軌跡序列模式挖掘,在深度優(yōu)先遍歷的過程中,采用基 于時(shí)空鄰近搜索的方式進(jìn)行模式增長(zhǎng),并利用頂點(diǎn)的時(shí)空格序列集合的關(guān)系運(yùn)算進(jìn)行移動(dòng) 軌跡序列模式支持度的計(jì)算。
2. 如權(quán)利要求1所述的基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式快速挖掘方法,其特征 在于,基于空間轉(zhuǎn)換預(yù)處理移動(dòng)軌跡數(shù)據(jù)的具體步驟為: 步驟1)根據(jù)移動(dòng)軌跡數(shù)據(jù)的時(shí)空分布范圍,采用時(shí)空等間隔的劃分的方法,構(gòu)建時(shí)空 格空間; 步驟2)根據(jù)移動(dòng)軌跡數(shù)據(jù)與時(shí)空格空間的匹配,得到時(shí)空格序列的集合; 步驟3)剔除時(shí)空格序列中重復(fù)時(shí)空格,并根據(jù)空間格鄰近以及用戶指定的時(shí)段鄰近 閾值,對(duì)時(shí)空格序列集合進(jìn)行分離; 步驟4)根據(jù)設(shè)定的轉(zhuǎn)換規(guī)則,建立時(shí)空格空間中2維幾何空間所對(duì)應(yīng)的有向無權(quán)圖; 步驟5)將有向無權(quán)圖中所有頂點(diǎn)與時(shí)空格序列集合進(jìn)行匹配,根據(jù)頂點(diǎn)與時(shí)空格序 列的包含關(guān)系,得到所有頂點(diǎn)的時(shí)空格序列集。
3. 如權(quán)利要求2所述的基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式快速挖掘方法,其特征 在于,基于圖的深度優(yōu)先遍歷挖掘頻繁的移動(dòng)軌跡序列模式 步驟6)由頂點(diǎn)的時(shí)空格序列集,并根據(jù)用戶指定的支持度閾值,得到長(zhǎng)度為1的頻繁 頂點(diǎn)序列模式; 步驟7)依次查找頻繁頂點(diǎn)序列模式的最后一個(gè)頂點(diǎn)的鄰近的、頻繁的頂點(diǎn),如果結(jié)果 為空,循環(huán)執(zhí)行本步驟,直至操作完成所有頻繁的頂點(diǎn)序列模式、退出循環(huán);否則,執(zhí)行步驟 8 ; 步驟8)依次將鄰近的、頻繁的頂點(diǎn)附加到當(dāng)前頻繁頂點(diǎn)序列模式的最后一個(gè)頂點(diǎn),并 根據(jù)設(shè)定時(shí)間跨度閾值得到候選的頂點(diǎn)序列模式集; 步驟9)依次取出候選的頂點(diǎn)序列模式,計(jì)算支持度,如果滿足閾值,得到新的頻繁頂 點(diǎn)序列模式,并對(duì)該模式從步驟7進(jìn)行遞歸操作,否則對(duì)下一個(gè)候選的頂點(diǎn)序列模式循環(huán) 執(zhí)行本步驟,直至操作完成所有候選的頂點(diǎn)序列模式,再返回步驟7,對(duì)其他頻繁的頂點(diǎn)序 列模式進(jìn)行循環(huán)操作; 步驟10)基于步驟6?9的操作結(jié)果,得到所有頻繁的頂點(diǎn)序列模式。
4. 如權(quán)利要求1-3任一項(xiàng)所述的基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式快速挖掘方 法,其特征在于,時(shí)空格空間的定義為:對(duì)于一個(gè)包含移動(dòng)軌跡數(shù)據(jù)集的離散時(shí)空域STD = {〈R2,T>|R2= {Pi|l彡i彡m},T= Itjll彡j彡n}},其中,R2表示2維幾何空間、Pi表示 移動(dòng)軌跡點(diǎn)的空間位置、T表示1維時(shí)間、h表示具體的時(shí)間點(diǎn),其對(duì)應(yīng)的時(shí)空格空間為:
其中,DR2是基于時(shí)空格的2維幾何空間,DT是基于時(shí)空格的時(shí)間域,每個(gè) (Cell<Ml,row>,Periodk)稱為一個(gè)時(shí)空格,Cell <ral,MW>表示時(shí)空格的幾何空間跨度也稱空間 格,(3〇1,1'0¥表不時(shí)空格在幾何空間平面劃分中所處的列號(hào)、行號(hào),。61';[〇(115〈8,1:>表不時(shí) 空格的時(shí)間跨度也稱時(shí)間段,j是編號(hào),s,t表示時(shí)間域劃分中起、止時(shí)間,period_count、 col_count、row_count分別是根據(jù)用戶指定的時(shí)空分辨率而設(shè)定的時(shí)間劃分?jǐn)?shù)、幾何空間 劃分的列數(shù)、行數(shù)。
5. 如權(quán)利要求4所述的基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式快速挖掘方法,其特征 在于,移動(dòng)軌跡Tid= ((P1, t), (p2, t2),. . .,(pn, tn)),I^t2. . . <tn直接匹配到基于時(shí)空格的 三維空間STC時(shí)空格序列定義為:
其中,ID表示時(shí)空格序列的編號(hào)。
6. 如權(quán)利要求5所述的基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式快速挖掘方法,其特征 在于,時(shí)空格序列定義中,對(duì)于任一時(shí)空格(CeSn都滿足如下條件:
條件二:,也即移動(dòng)軌跡點(diǎn)時(shí)間包含于時(shí)間段。但是,依據(jù)移 動(dòng)軌跡數(shù)據(jù)的特性,以及后續(xù)數(shù)據(jù)分析的需要,對(duì)時(shí)空格序列進(jìn)行如下條件限定: 時(shí)空格序列中不能包含相同的時(shí)空格,也即對(duì)于任意兩個(gè)時(shí)空格 足以下條件:
時(shí)間段相等,也即/mW丨=; 條件三:時(shí)空格序列中兩個(gè)連續(xù)的時(shí)空格所包含的空間格,必須是空間上鄰近,也即對(duì) 于任意兩個(gè)連續(xù)的時(shí)空格 須滿足條件:(0 < I Cell1 ? col_CellJ ? col I < I)" (0 < I Cell1 ? row_CellJ ? row I < I), 否則需要將時(shí)空格序列在該處進(jìn)行分離生成兩個(gè)子時(shí)空格序列,分別是:
條件四:時(shí)空格序列中兩個(gè)連續(xù)的時(shí)空格所包含的時(shí)間段,必須是時(shí)間上鄰近,也即對(duì) 于任意兩個(gè)連續(xù)的時(shí)空格^ 必須滿足如下條件:〇 < (period3 ? k-period1 ? k) < T,T為用戶自定義的時(shí)間鄰近參 數(shù),否則同樣也需要將時(shí)空格序列在該處進(jìn)行分離。
7. 如權(quán)利要求6所述的基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式快速挖掘方法,其特征 在于,頂點(diǎn)的時(shí)空格序列集定義為:對(duì)于一個(gè)三維空間的有向無權(quán)圖G = <V,E>和一個(gè)時(shí)空 格序列集合SE = (SeSTC1, SeSTC2, ...,SeSTCn),頂點(diǎn)V G V的時(shí)空格序列集定義為:
其中,(SeSTCi ? Cellj ? col = V ? X) ~ (SeSTCi ? Cellj ? row = V ? y)表不時(shí)空格序列 SeSTCi在時(shí)段period」所處的網(wǎng)格CelP的列、行與頂點(diǎn)V的橫、縱坐標(biāo)值相等,也即時(shí)空格 序列SeSTCi在時(shí)段periodj通過頂點(diǎn)V所對(duì)應(yīng)的空間格;SEv中記錄所有通過頂點(diǎn)V的時(shí)空 格序列SeSTCi的編號(hào)i以及相應(yīng)的時(shí)間7IsTrfW/。
8. 如權(quán)利要求7所述的基于時(shí)空鄰近搜索的移動(dòng)軌跡序列模式快速挖掘方法, 其特征在于,時(shí)空格2維幾何空間的有向無權(quán)圖為:對(duì)于一個(gè)時(shí)空格的2維幾何空間
其中,V是頂點(diǎn)的集合,E是邊的集合; V是V中的一個(gè)頂點(diǎn),頂點(diǎn)V的X,y對(duì)應(yīng)DR2中空間格Cellar的列號(hào)i、行號(hào)j斤^是 連接頂點(diǎn)vm和頂點(diǎn)vn的一條邊,頂點(diǎn)vm與頂點(diǎn)vn不能相同,即m尹n,且他們所對(duì)應(yīng)的空 間格要空間相鄰,即滿足條件(〇彡I Vm ? x-vn ? X I彡1) ~ (0彡I Vm ? y_vn ? y I彡1)。
【文檔編號(hào)】G06F17/30GK104331466SQ201410605481
【公開日】2015年2月4日 申請(qǐng)日期:2014年10月31日 優(yōu)先權(quán)日:2014年10月31日
【發(fā)明者】張海濤, 張波波, 黃慧慧, 霍曉宇, 葛國棟, 姜杰, 胡棟, 沙超 申請(qǐng)人:南京郵電大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1