一種軌跡壓縮及解壓縮方法
【專利摘要】本發(fā)明公開了一種軌跡壓縮方法,包括:S1.對待壓縮的軌跡進行掃描,獲得待壓縮的軌跡中的定點;軌跡為一個運動物體在空間中運動所產(chǎn)生的路徑,定點為軌跡的起點、路段交叉點或者終點;S2.查詢預先配置的頻繁后繼表,判斷定點在待壓縮的軌跡中的后繼定點是否為定點的最頻繁后繼定點;后繼定點為定點相鄰的下一個定點;若是,則執(zhí)行步驟S3;S3.將最頻繁后繼定點用負數(shù)進行表示,獲得定點與負數(shù)的集合,定點與負數(shù)的集合即為壓縮軌跡。相應的,本發(fā)明還提供一種應用上述的軌跡壓縮方法得到的壓縮軌跡的解壓縮方法。采用本發(fā)明實施例,能夠利用軌跡特性來對軌跡進行高壓縮率、高效率的無損壓縮。
【專利說明】一種軌跡壓縮及解壓縮方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息【技術(shù)領(lǐng)域】,尤其涉及一種軌跡壓縮及解壓縮方法。
【背景技術(shù)】
[0002] 近幾年來,大數(shù)據(jù)及其相關(guān)研究已經(jīng)成為計算機界最熱問題,并逐漸成為主流研 究方向。人們開始意識到潛藏在數(shù)據(jù)中的信息帶來的價值,并開始越來越重視對于數(shù)據(jù) 的研究。而隨著技術(shù)的發(fā)展,各種能夠收集有價值數(shù)據(jù)的技術(shù)與相關(guān)裝置設備也在不斷產(chǎn) 生。其中,非常典型的一類設備就是能夠進行軌跡數(shù)據(jù)探測與收集的設備,如GPS(Global Positioning System,全球定位系統(tǒng))、智能手機、RFID (Radio Frequency Identification, 無線射頻識別)標簽等等。這種軌跡數(shù)據(jù)一般具有三個維度,即表示物體位置的經(jīng)度、緯 度,以及表示某個位置的時間點的時間戳。由于這些軌跡數(shù)據(jù)具有時間和空間的雙重特性, 也被稱為時空數(shù)據(jù)。這些時空軌跡數(shù)據(jù)往往體現(xiàn)著不同實體的運動規(guī)律甚至行為模式,從 這些規(guī)律中又能衍生出許多相關(guān)的研究,其潛在價值極高。
[0003] 然而,時空軌跡數(shù)據(jù)的規(guī)模是很大的。以GPS全球定位系統(tǒng)為例,在定位技術(shù)高度 發(fā)達的今時今日,生活中各個方面都可能需要定位或者導航,如駕駛車輛,旅游,尋物,甚至 是簡單的在某個不熟悉的地方約見。每天有無數(shù)來自于全球各地的導航、定位等服務請求, 而這些服務請求都將會產(chǎn)生相應的時空軌跡數(shù)據(jù)。可見,時空軌跡數(shù)據(jù)的規(guī)模是巨大的。
[0004] 如此巨大的數(shù)據(jù)規(guī)模必然會帶來一些問題。具體來說,大規(guī)模增長速度快的軌跡 數(shù)據(jù)帶來的問題有三點。第一,巨大的數(shù)據(jù)量會極大地壓榨有限的存儲空間,使得時空軌 跡數(shù)據(jù)存儲成為一個難題。由于其每個軌跡點間的時間間隔較小,時空軌跡數(shù)據(jù)會產(chǎn)生大 量的冗余數(shù)據(jù),這些冗余會浪費大量的存儲空間,并且增加I/Odnput/Output,輸入輸出端 口)時間。例如,我們以10秒的時間間隔檢測4000個運動物體的運動情況,如果不加以壓 縮,每天就會產(chǎn)生1GB的數(shù)據(jù)增量。而GPS服務產(chǎn)生的數(shù)據(jù)往往是涵蓋范圍極廣的,物體數(shù) 量遠遠超過千甚至萬數(shù)量級,其數(shù)據(jù)增加速度十分可觀。因此,存儲問題是顯而易見的。第 二,對如此巨大規(guī)模的數(shù)據(jù)進行傳輸、查詢等處理是昂貴且耗時的。將大規(guī)模數(shù)據(jù)通過蜂窩 網(wǎng)絡或者衛(wèi)星網(wǎng)絡進行傳輸會花費大量經(jīng)費。第三,當軌跡數(shù)據(jù)規(guī)模過于巨大,從中提取有 用信息等會變得非常困難,如分析運動模式。數(shù)據(jù)壓縮可以大大減少提取有用信息的時間。 因此,對時空數(shù)據(jù)軌跡進行壓縮是十分必要的。
[0005] 時空軌跡數(shù)據(jù)壓縮也是建立運動實體數(shù)據(jù)庫數(shù)據(jù)管理的關(guān)鍵部分。然而,基于信 息論的傳統(tǒng)壓縮方法雖然是無損壓縮,但會將時空數(shù)據(jù)與其他數(shù)據(jù)同等對待,即使用同樣 的壓縮方法。這種壓縮方法未考慮時空軌跡數(shù)據(jù)的特殊性質(zhì),必然無法達到最好效果。并 且,壓縮后的數(shù)據(jù)不可使用,如需要對壓縮后的數(shù)據(jù)進行進一步分析則必須解壓整個文件, 對于巨大的時空數(shù)據(jù)來說,解壓整個文件需要消耗很多時間和計算資源。并且,許多的軌跡 壓縮算法都是基于軌跡點的刪除,實際上是有損壓縮,壓縮后便無法還原成原始數(shù)據(jù),從而 導致算法的錯誤或壓縮過程中的誤刪都會對之后的數(shù)據(jù)分析有很大影響。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明實施例提出一種軌跡壓縮及解壓縮方法,能夠利用軌跡特性來對軌跡進行 高壓縮率、高效率的無損壓縮。
[0007] 本發(fā)明實施例提供一種軌跡壓縮方法,包括:
[0008] S1、對待壓縮的軌跡進行掃描,獲得所述待壓縮的軌跡中的定點;所述軌跡為一 個運動物體在空間中運動所產(chǎn)生的路徑,所述定點為所述軌跡的起點、路段交叉點或者終 占.
[0009] S2、查詢預先配置的頻繁后繼表,判斷所述定點在所述待壓縮的軌跡中的后繼定 點是否為所述定點的最頻繁后繼定點;所述后繼定點為所述定點相鄰的下一個定點;若 是,則執(zhí)行步驟S3 ;所述頻繁后繼表記錄各個定點及其最頻繁后繼定點的對應關(guān)系;
[0010] S3、將所述最頻繁后繼定點用負數(shù)進行表示,獲得所述定點與所述負數(shù)的集合,所 述定點與所述負數(shù)的集合即為壓縮軌跡。
[0011] 進一步地,所述步驟S3具體包括:
[0012] S31、計算連續(xù)出現(xiàn)最頻繁后繼定點的個數(shù)n,并將連續(xù)出現(xiàn)的最頻繁后繼定點用 負數(shù)進行表示;所述負數(shù)的絕對值為η ;
[0013] S32、獲得所述定點與所述負數(shù)的集合,所述定點與所述負數(shù)的集合即為壓縮軌 跡。
[0014] 相應地,本發(fā)明實施例還提供一種應用上述的軌跡壓縮方法得到的壓縮軌跡的解 壓縮方法,包括:
[0015] S01、對壓縮軌跡進行掃描,獲得所述壓縮軌跡中的定點和負數(shù);
[0016] S02、根據(jù)所述定點和頻繁后繼表,將所述負數(shù)還原為最頻繁后繼定點;
[0017] S03、獲得所述定點和所述最頻繁后繼定點的集合,所述定點和所述最頻繁后繼定 點的集合即為壓縮前的軌跡。
[0018] 進一步地,所述步驟S01具體包括:
[0019] 根據(jù)所述定點和頻繁后繼表,將所述負數(shù)還原為連續(xù)出現(xiàn)的m個最頻繁后繼定 點;m為所述負數(shù)的絕對值。
[0020] 實施本發(fā)明實施例,具有如下有益效果:
[0021] 本發(fā)明實施例提供的軌跡壓縮及解壓縮方法能夠利用軌跡的特性,將軌跡表示為 獨立定點的集合,通過對每個定點的最頻繁后繼定點進行壓縮來完成軌跡的壓縮,不會由 于壓縮對原數(shù)據(jù)產(chǎn)生損傷,最大程度地保持了數(shù)據(jù)的完整性、真實性;通過建立的頻繁后繼 表,對軌跡中的定點進行快速壓縮,具有高壓縮率、高效率和高實用性;根據(jù)定點和定點的 前定點來確定軌跡的運動方向,從而更加明確該定點的最頻繁后繼定點,使數(shù)據(jù)具有更好 的壓縮率和可用性;采用霍夫曼編碼算法,對軌跡進行進一步地的壓縮,同時達到無損壓縮 的目的;壓縮后的軌跡仍為可讀的文本文件,而并非二進制文件,從而可實現(xiàn)對壓縮后的軌 跡進行查詢和分析;軌跡為定點集合,可根據(jù)定點的經(jīng)緯度信息對軌跡的數(shù)據(jù)進行快速、準 確的局部還原分析,無需解壓整個壓縮文件。
【專利附圖】
【附圖說明】
[0022] 圖1是本發(fā)明提供的軌跡壓縮方法的一個實施例的流程示意圖;
[0023] 圖2是本發(fā)明提供的軌跡壓縮方法中的路網(wǎng)軌跡的一個實施例的示意圖;
[0024] 圖3是本發(fā)明提供的軌跡壓縮方法中的路網(wǎng)軌跡的另一個實施例的示意圖;
[0025] 圖4是本發(fā)明提供的解壓縮方法的一個實施例的流程示意圖。
【具體實施方式】
[0026] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于 本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0027] 參見圖1,是本發(fā)明提供的軌跡壓縮方法的一個實施例的流程示意圖,包括步驟 S1至步驟S3,具體如下:
[0028] S1、對待壓縮的軌跡進行掃描,獲得所述待壓縮的軌跡中的定點;所述軌跡為一個 運動物體在空間中運動所產(chǎn)生的路徑,所述定點為所述軌跡的起點、路段交叉點或者終點。
[0029] S2、查詢預先配置的頻繁后繼表,判斷所述定點在所述待壓縮的軌跡中的后繼定 點是否為所述定點的最頻繁后繼定點;所述后繼定點為所述定點相鄰的下一個定點;若 是,則執(zhí)行步驟S3 ;所述頻繁后繼表記錄各個定點及其最頻繁后繼定點的對應關(guān)系。
[0030] S3、將所述最頻繁后繼定點用負數(shù)進行表示,獲得所述定點與所述負數(shù)的集合,所 述定點與所述負數(shù)的集合即為壓縮軌跡。
[0031] 對待壓縮軌跡中的定點逐一進行掃描,將每一個定點的后繼定點與頻繁后繼表進 行匹配,從而判斷該定點的后繼定點是否為該定點的最頻繁后繼定點,若是,則將最頻繁后 繼定點用負數(shù)進行表示,若不是,則保留該后繼定點。
[0032] 進一步地,所述步驟S3具體包括:
[0033] S31、計算連續(xù)出現(xiàn)最頻繁后繼定點的個數(shù)n,并將連續(xù)出現(xiàn)的最頻繁后繼定點用 負數(shù)進行表示;所述負數(shù)的絕對值為η ;
[0034] S32、獲得所述定點與所述負數(shù)的集合,所述定點與所述負數(shù)的集合即為壓縮軌 跡。
[0035] 在完成待壓縮軌跡中的所有定點的掃描后,計算待壓縮軌跡中的連續(xù)出現(xiàn)最頻繁 后繼定點的個數(shù)η。若只出現(xiàn)一個最頻繁后繼定點,即η = 1,則用-1來代替該最頻繁后繼 定點;若連續(xù)出現(xiàn)多個最頻繁后繼定點,即η > 1,則用η的相反數(shù)來代替連續(xù)出現(xiàn)的多個 最頻繁后繼定點。
[0036] 進一步地,在所述步驟S1之前還包括步驟S101至步驟S103,具體如下:
[0037] S101、將路網(wǎng)中的軌跡用定點的集合來表示。
[0038] 需要說明的是,軌跡是用一系列的定點來進行表示的,且一系列的定點是按照軌 跡運行的方向來排列的,即集合中的第一個定點為軌跡的起點,最后一個定點為軌跡的終 點,中間部分的定點為軌跡依次經(jīng)過的路段交叉點。
[0039] S102、對路網(wǎng)中所有軌跡進行掃描,獲得所有軌跡中的定點。
[0040] S103、根據(jù)所有軌跡中的定點,建立頻繁后繼表。
[0041] 在一個優(yōu)選地實施方式中,所述根據(jù)所有軌跡中的定點,建立頻繁后繼表,具體包 括:
[0042] 統(tǒng)計每個定點的所有后繼定點出現(xiàn)的頻率,將每個定點和每個定點的最頻繁后繼 定點的對應關(guān)系保存在頻繁后繼表中;所述最頻繁后繼定點為在定點的所有后繼定點中出 現(xiàn)頻率最1?的后繼定點。
[0043] 在某個路網(wǎng)中,一個定點必有若干相鄰定點與它相連,在任意軌跡中,一個定點的 后繼定點為其相鄰定點之一。而路網(wǎng)中軌跡具有周期性,如每天上下班車輛的軌跡,每天的 軌跡是很相似的。因此,一些定點的使用必然比其他定點的使用頻率高,如城市主干道中的 定點。通過對路網(wǎng)中所有軌跡的定點進行掃描,統(tǒng)計出定點的最頻繁后繼定點。對于單向 路段中的定點來說,一個定點具有唯一的最頻繁后繼定點。
[0044] 下面基于圖2所示的路網(wǎng)中的單向路段的軌跡,對本發(fā)明實施例提供的軌跡壓縮 方法進行詳細描述。
[0045] 如圖2所示,當路網(wǎng)中具有3條軌跡T1、T2和T3時,對3條軌跡T1、T2和T3的壓 縮流程如下:
[0046] S201、根據(jù)定點的經(jīng)緯度信息,對路網(wǎng)中的所有定點進行編號,如Ρ1、Ρ2……Ρη。
[0047] S202、將軌跡ΤΙ、Τ2和Τ3用定點的集合進行表示,則ΤΙ = (Ρ1,Ρ2, Ρ3, Ρ6),Τ2 = (P1,P2,P5),T3 = (Ρ4,Ρ2,Ρ5)。
[0048] S203、對軌跡ΤΙ、Τ2和Τ3進行掃描,獲得軌跡ΤΙ、Τ2和Τ3中的所有定點PI、Ρ2、 Ρ3、Ρ4、Ρ5 和 Ρ6。
[0049] S204、統(tǒng)計每個定點的所有后繼定點出現(xiàn)的頻率,獲得每個定點的最頻繁后繼定 點。
[0050] 在軌跡Τ1、Τ2和Τ3中,定點Ρ2的后繼定點Ρ3出現(xiàn)次數(shù)為1,后繼定點Ρ5出現(xiàn)次 數(shù)為2,則后繼定點Ρ5為定點Ρ2的最頻繁后繼定點。同理,Ρ1的最頻繁后繼定點為Ρ2,Ρ3 的最頻繁后繼定點為Ρ6, Ρ4的最頻繁后繼定點為Ρ2。將每個定點和每個定點的最頻繁后 繼定點的對應關(guān)系保存在頻繁后繼表中,如表1 :
【權(quán)利要求】
1. 一種軌跡壓縮方法,其特征在于,包括: 51、 對待壓縮的軌跡進行掃描,獲得所述待壓縮的軌跡中的定點;所述軌跡為一個運動 物體在空間中運動所產(chǎn)生的路徑,所述定點為所述軌跡的起點、路段交叉點或者終點; 52、 查詢預先配置的頻繁后繼表,判斷所述定點在所述待壓縮的軌跡中的后繼定點是 否為所述定點的最頻繁后繼定點;所述后繼定點為所述定點相鄰的下一個定點;若是,則 執(zhí)行步驟S3 ;所述頻繁后繼表記錄各個定點及其最頻繁后繼定點的對應關(guān)系; 53、 將所述最頻繁后繼定點用負數(shù)進行表示,獲得所述定點與所述負數(shù)的集合,所述定 點與所述負數(shù)的集合即為壓縮軌跡。
2. 如權(quán)利要求1所述的軌跡壓縮方法,其特征在于,所述步驟S3具體包括: 531、 計算連續(xù)出現(xiàn)最頻繁后繼定點的個數(shù)n,并將連續(xù)出現(xiàn)的最頻繁后繼定點用負數(shù) 進行表示;所述負數(shù)的絕對值為η ; 532、 獲得所述定點與所述負數(shù)的集合,所述定點與所述負數(shù)的集合即為壓縮軌跡。
3. 如權(quán)利要求1所述的軌跡壓縮方法,其特征在于,在所述步驟S1之前還包括: 將路網(wǎng)中的軌跡用定點的集合來表示; 對路網(wǎng)中所有軌跡進行掃描,獲得所有軌跡中的定點; 根據(jù)所有軌跡中的定點,建立頻繁后繼表。
4. 如權(quán)利要求3所述的軌跡壓縮方法,其特征在于,所述根據(jù)所有軌跡中的定點,建立 頻繁后繼表,具體包括: 統(tǒng)計每個定點的所有后繼定點出現(xiàn)的頻率,將每個定點和每個定點的最頻繁后繼定點 的對應關(guān)系保存在頻繁后繼表中;所述最頻繁后繼定點為在定點的所有后繼定點中出現(xiàn)頻 率最1?的后繼定點。
5. 如權(quán)利要求3所述的軌跡壓縮方法,其特征在于,所述根據(jù)所有軌跡中的定點,建立 頻繁后繼表,具體包括: 統(tǒng)計每個定點在具有相同前定點時的所有后繼定點出現(xiàn)的頻率,將每個定點和每個定 點在具有相同前定點時的最頻繁后繼定點的對應關(guān)系保存在頻繁后繼表中;所述前定點為 所述定點相鄰的前一個定點。
6. 如權(quán)利要求3至5任一項所述的軌跡壓縮方法,其特征在于,所述定點的集合具體為 定點編號的集合,在所述步驟S1之前還包括: 根據(jù)定點的經(jīng)緯度信息,對路網(wǎng)中的所有定點進行編號。
7. 如權(quán)利要求1所述的軌跡壓縮方法,其特征在于,在所述步驟S3之后還包括: 根據(jù)霍夫曼編碼算法,對所述壓縮軌跡進一步壓縮,獲得無損壓縮軌跡。
8. -種應用如權(quán)利要求1至6任一項所述的軌跡壓縮方法得到的壓縮軌跡的解壓縮方 法,其特征在于,包括 : 501、 對壓縮軌跡進行掃描,獲得所述壓縮軌跡中的定點和負數(shù); 502、 根據(jù)所述定點和頻繁后繼表,將所述負數(shù)還原為最頻繁后繼定點; 503、 獲得所述定點和所述最頻繁后繼定點的集合,所述定點和所述最頻繁后繼定點的 集合即為壓縮前的軌跡。
9. 如權(quán)利要求8所述的解壓縮方法,其特征在于,所述步驟S02具體包括: 根據(jù)所述定點和頻繁后繼表,將所述負數(shù)還原為連續(xù)出現(xiàn)的m個最頻繁后繼定點;m為 所述負數(shù)的絕對值。
10.如權(quán)利要求8所述的解壓縮方法,其特征在于,在所述步驟SOI之前還包括: 根據(jù)霍夫曼解碼算法,對無損壓縮軌跡進行解碼,獲得壓縮軌跡;所述無損壓縮軌跡是 根據(jù)霍夫曼編碼算法對壓縮軌跡進行進一步壓縮而得到的。
【文檔編號】H03M7/30GK104242949SQ201410455230
【公開日】2014年12月24日 申請日期:2014年9月9日 優(yōu)先權(quán)日:2014年9月9日
【發(fā)明者】譚浩宇, 高民, 丁燁 申請人:廣州市香港科大霍英東研究院