亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于混合網(wǎng)格分層聚類的集群通信終端軌跡實(shí)時(shí)異常檢測(cè)方法與系統(tǒng)的制作方法

文檔序號(hào):10471528閱讀:228來源:國(guó)知局
基于混合網(wǎng)格分層聚類的集群通信終端軌跡實(shí)時(shí)異常檢測(cè)方法與系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及通信領(lǐng)域,提出一種基于混合網(wǎng)格分層聚類的集群通信終端軌跡實(shí)時(shí)異常檢測(cè)方法,包括以下步驟:步驟1、構(gòu)建基于網(wǎng)格的軌跡,確定最優(yōu)網(wǎng)格大??;步驟2、計(jì)算Hausdroff距離矩陣,利用Hausdroff距離公式計(jì)算基于網(wǎng)格的軌跡集中所有軌跡之間的距離,生成軌跡集的距離矩陣;步驟3、分層聚類,即在軌跡集的Hausdroff距離矩陣的基礎(chǔ)上應(yīng)用自下而上的凝聚分層聚類算法,實(shí)現(xiàn)大規(guī)模軌跡的正常與異常軌跡的分類;步驟4、異常檢測(cè)方法評(píng)估反饋,利用上述方法,對(duì)已經(jīng)有軌跡分類標(biāo)識(shí)的軌跡集的進(jìn)行異常軌跡檢測(cè),得到異常分類結(jié)果,進(jìn)行對(duì)比后評(píng)估模型參數(shù)是否合理并作出反饋。本發(fā)明的方法可實(shí)現(xiàn)對(duì)異常事件的在線實(shí)時(shí)檢測(cè),提高集群通信系統(tǒng)的上層調(diào)度指揮效率。
【專利說明】
基于混合網(wǎng)格分層聚類的集群通信終端軌跡實(shí)時(shí)異常檢測(cè)方 法與系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及通信技術(shù)領(lǐng)域,具體而言設(shè)及一種基于混合網(wǎng)格分層聚類的集群通信 終端軌跡實(shí)時(shí)異常檢測(cè)方法與系統(tǒng)。
【背景技術(shù)】
[0002] 隨著GPS、RFIDW及無線傳感器等移動(dòng)對(duì)象定位技術(shù)的迅速發(fā)展,越來越多的移動(dòng) 軌跡數(shù)據(jù)被收集和保存在應(yīng)用服務(wù)器。如何快速的從運(yùn)些軌跡數(shù)據(jù)集中發(fā)現(xiàn)有效信息日益 成為一個(gè)令人關(guān)注的研究課題。因此,一系列基于位置信息的服務(wù)化BS)相繼出現(xiàn),例如:出 租車打車服務(wù)、小孩和老年人的位置監(jiān)護(hù)W及重要設(shè)備的位置管理等。通過電信移動(dòng)運(yùn)營(yíng) 商的無線電通訊網(wǎng)絡(luò)(如GSM網(wǎng)、CDMA網(wǎng))或外部定位方式(如GPS)獲取移動(dòng)終端用戶的位置 信息(地理坐標(biāo)或大地坐標(biāo)),在地理信息系統(tǒng)(GIS)平臺(tái)的支持下,為用戶提供相應(yīng)服務(wù)的 一種增值業(yè)務(wù)。用戶可W實(shí)時(shí)查看自己關(guān)屯、的家人或車輛的位置信息,為人們的生活帶來 了極大的便利。在很多特定的場(chǎng)景下,人們需要識(shí)別場(chǎng)景中的人或物體的移動(dòng)行為是否符 合規(guī)范。因此,移動(dòng)軌跡的異常檢測(cè)成為了一項(xiàng)十分重要的應(yīng)用。
[0003] 隨著集群通信系統(tǒng)的規(guī)模的迅猛發(fā)展、業(yè)務(wù)的爆炸式增長(zhǎng),集群通信系統(tǒng)的終端 數(shù)量急劇增長(zhǎng)。目前絕不多數(shù)集群通信系統(tǒng)中的終端都配有GI^或者北斗定位裝置,位置采 集技術(shù)的日益普及促進(jìn)了人們對(duì)時(shí)間-空間數(shù)據(jù)的大規(guī)模采集,從而為發(fā)現(xiàn)珍貴的關(guān)于用 戶移動(dòng)位置的信屯、帶來了新的機(jī)遇。如何在海量的軌跡數(shù)據(jù)中發(fā)現(xiàn)終端的行為異常軌跡是 目前很熱口的課題。目前的異常軌跡檢測(cè)方法在小規(guī)模的軌跡數(shù)據(jù)上表現(xiàn)良好,但是在處 理海量數(shù)據(jù)時(shí)非常耗時(shí),系統(tǒng)的時(shí)間復(fù)雜度隨著數(shù)據(jù)的規(guī)模變得很大,大大降低了集群通 信系統(tǒng)的調(diào)度效率。

【發(fā)明內(nèi)容】

[0004] 為解決上述問題,本發(fā)明旨在提供一種基于混合網(wǎng)格分層聚類的集群通信終端軌 跡實(shí)時(shí)異常檢測(cè)方法與系統(tǒng),基于集群通信系統(tǒng)中移動(dòng)終端的軌跡數(shù)據(jù),利用數(shù)據(jù)挖掘技 術(shù)發(fā)現(xiàn)終端異常軌跡的時(shí)空特點(diǎn),并W此為依據(jù)實(shí)現(xiàn)對(duì)大規(guī)模軌跡數(shù)據(jù)的異常檢測(cè),實(shí)現(xiàn) 對(duì)異常事件的在線實(shí)時(shí)檢測(cè),提高集群通信系統(tǒng)的上層調(diào)度指揮效率。
[0005] 本發(fā)明的上述目的通過獨(dú)立權(quán)利要求的技術(shù)特征實(shí)現(xiàn),從屬權(quán)利要求W另選或有 利的方式發(fā)展獨(dú)立權(quán)利要求的技術(shù)特征。
[0006] 為達(dá)成上述目的,本發(fā)明提出一種基于混合網(wǎng)格分層聚類的集群通信終端軌跡實(shí) 時(shí)異常檢測(cè)方法,包括W下步驟:
[0007] 步驟1、構(gòu)建基于網(wǎng)格的軌跡,確定最優(yōu)網(wǎng)格大?。?br>[000引步驟2、計(jì)算化US化off距離矩陣,即利用化US化off距離公式計(jì)算基于網(wǎng)格的軌跡 集中所有軌跡之間的距離,生成軌跡集的距離矩陣M;
[0009] 步驟3、分層聚類,即在軌跡集的化US化off距離矩陣的基礎(chǔ)上應(yīng)用自下而上的凝 聚分層聚類算法,實(shí)現(xiàn)大規(guī)模軌跡的正常與異常軌跡的分類;
[0010] 步驟4、異常檢測(cè)方法評(píng)估反饋,利用上述步驟1~3的方法,對(duì)已經(jīng)有軌跡分類標(biāo) 識(shí)的軌跡集的進(jìn)行異常軌跡檢測(cè),得到異常分類結(jié)果,并與真實(shí)分類情況進(jìn)行對(duì)比,評(píng)估步 驟1,3中模型參數(shù)是否合理,并作出反饋。
[0011] 根據(jù)本發(fā)明的改進(jìn),還提出一種基于混合網(wǎng)格分層聚類的集群通信終端軌跡實(shí)時(shí) 異常軌跡檢測(cè)系統(tǒng),該系統(tǒng)包括:服務(wù)調(diào)度中屯、、集群通信網(wǎng)絡(luò)和移動(dòng)定位終端,其中
[0012] 服務(wù)調(diào)度中屯、包括:
[0013] 軌跡文件數(shù)據(jù)庫服務(wù)器,用于存儲(chǔ)所有移動(dòng)定位終端上傳的位置信息;
[0014] 異常軌跡檢測(cè)程序服務(wù)器,用于移動(dòng)定位終端的異常軌跡檢測(cè),優(yōu)化集群通信的 系統(tǒng)調(diào)度;
[0015] 可視化Web服務(wù)器,用于動(dòng)態(tài)展示移動(dòng)定位終端的歷史軌跡,并將異常軌跡檢測(cè)程 序服務(wù)器計(jì)算得到的異常軌跡顯示在地圖上;
[0016] 軌跡分析程序服務(wù)器包括:
[0017] 網(wǎng)格軌跡構(gòu)建模塊,化US化off距離矩陣計(jì)算模塊、網(wǎng)格軌跡凝聚分層聚類模塊W 及異常檢測(cè)方法評(píng)估反饋模塊。
[0018] 由W上技術(shù)方案可知,與現(xiàn)有技術(shù)相比,本發(fā)明的顯著優(yōu)點(diǎn)在于:
[0019] 1、將原始GPS軌跡數(shù)據(jù)利用網(wǎng)格分割結(jié)構(gòu)轉(zhuǎn)化為網(wǎng)格序列,簡(jiǎn)化了聚類算法的輸 入,大大降低了異常軌跡檢測(cè)算法的時(shí)間復(fù)雜度;
[0020] 2、本發(fā)明利用基于化versine公式的化US化off距離矩陣,可W有效表征網(wǎng)格序列 之間的相似程度;
[0021] 3、本發(fā)明提出的基于混合網(wǎng)格分層聚類的集群通信終端軌跡實(shí)時(shí)異常軌跡檢測(cè) 方法和系統(tǒng),在現(xiàn)有集群通信系統(tǒng)中添加了智能服務(wù)中屯、,利用基于移動(dòng)終端軌跡數(shù)據(jù)分 析技術(shù)為集群通信智能調(diào)度和應(yīng)急防范提供有效地決策。
[0022] 應(yīng)當(dāng)理解,前述構(gòu)思W及在下面更加詳細(xì)地描述的額外構(gòu)思的所有組合只要在運(yùn) 樣的構(gòu)思不相互矛盾的情況下都可W被視為本公開的發(fā)明主題的一部分。另外,所要求保 護(hù)的主題的所有組合都被視為本公開的發(fā)明主題的一部分。
[0023] 結(jié)合附圖從下面的描述中可W更加全面地理解本發(fā)明教導(dǎo)的前述和其他方面、實(shí) 施例和特征。本發(fā)明的其他附加方面例如示例性實(shí)施方式的特征和/或有益效果將在下面 的描述中顯見,或通過根據(jù)本發(fā)明教導(dǎo)的【具體實(shí)施方式】的實(shí)踐中得知。
【附圖說明】
[0024] 附圖不意在按比例繪制。在附圖中,在各個(gè)圖中示出的每個(gè)相同或近似相同的組 成部分可W用相同的標(biāo)號(hào)表示。為了清晰起見,在每個(gè)圖中,并非每個(gè)組成部分均被標(biāo)記。 現(xiàn)在,將通過例子并參考附圖來描述本發(fā)明的各個(gè)方面的實(shí)施例,其中:
[0025] 圖1是根據(jù)本發(fā)明某些實(shí)施例的基于混合網(wǎng)格分層聚類的集群通信終端軌跡實(shí)時(shí) 異常軌跡檢測(cè)方法的流程示意圖。
[00%]圖2是根據(jù)本發(fā)明某些實(shí)施例的GI^軌跡構(gòu)建網(wǎng)格序列示例示意圖。
[0027] 圖3是根據(jù)本發(fā)明某些實(shí)施例的網(wǎng)格尺寸與熱點(diǎn)區(qū)域個(gè)數(shù)的關(guān)系曲線示意圖。
[0028] 圖4是根據(jù)本發(fā)明某些實(shí)施例的網(wǎng)格尺寸與軌跡數(shù)據(jù)覆蓋率的關(guān)系曲線示意圖。
[0029] 圖5是根據(jù)本發(fā)明某些實(shí)施例的分層聚類樹狀圖。
[0030] 圖6是根據(jù)本發(fā)明某些實(shí)施例的異常軌跡可視化結(jié)果示意圖。 圖7是移動(dòng)定位終端與服務(wù)調(diào)度中屯、之間經(jīng)過集群通信網(wǎng)絡(luò)進(jìn)行通信的示意圖。
【具體實(shí)施方式】
[0031] 為了更了解本發(fā)明的技術(shù)內(nèi)容,特舉具體實(shí)施例并配合所附圖式說明如下。
[0032] 在本公開中參照附圖來描述本發(fā)明的各方面,附圖中示出了許多說明的實(shí)施例。 本公開的實(shí)施例不必定意在包括本發(fā)明的所有方面。應(yīng)當(dāng)理解,上面介紹的多種構(gòu)思和實(shí) 施例,W及下面更加詳細(xì)地描述的那些構(gòu)思和實(shí)施方式可很多方式中任意一種來實(shí) 施,運(yùn)是因?yàn)楸景l(fā)明所公開的構(gòu)思和實(shí)施例并不限于任何實(shí)施方式。另外,本發(fā)明公開的一 些方面可W單獨(dú)使用,或者與本發(fā)明公開的其他方面的任何適當(dāng)組合來使用。
[0033] 結(jié)合圖1所示,根據(jù)本發(fā)明的實(shí)施例,一種基于混合網(wǎng)格分層聚類的集群通信終端 軌跡實(shí)時(shí)異常檢測(cè)方法,包括W下步驟:步驟1、構(gòu)建基于網(wǎng)格的軌跡,確定最優(yōu)網(wǎng)格大??; 步驟2、計(jì)算化US化off距離矩陣,即利用化US化off距離公式計(jì)算基于網(wǎng)格的軌跡集中所有 軌跡之間的距離,生成軌跡集的距離矩陣Μ;步驟3、分層聚類,即在軌跡集的化US化of f距離 矩陣的基礎(chǔ)上應(yīng)用自下而上的凝聚分層聚類算法,實(shí)現(xiàn)大規(guī)模軌跡的正常與異常軌跡的分 類;步驟4、異常檢測(cè)方法評(píng)估反饋,利用上述步驟1~3的方法,對(duì)已經(jīng)有軌跡分類標(biāo)識(shí)的軌 跡集的進(jìn)行異常軌跡檢測(cè),得到異常分類結(jié)果,并與真實(shí)分類情況進(jìn)行對(duì)比,評(píng)估步驟1、3 中的參數(shù)是否合理,并作出反饋。
[0034] 上述方案的檢測(cè)方法,基于集群通信系統(tǒng)中移動(dòng)終端的軌跡數(shù)據(jù),利用數(shù)據(jù)挖掘 技術(shù)發(fā)現(xiàn)終端異常軌跡的時(shí)空特點(diǎn),并W此為依據(jù)實(shí)現(xiàn)對(duì)大規(guī)模軌跡數(shù)據(jù)的異常檢測(cè),實(shí) 現(xiàn)對(duì)異常事件的在線實(shí)時(shí)檢測(cè),提高集群通信系統(tǒng)的上層調(diào)度指揮效率。
[0035] 我們?cè)赪下內(nèi)容中對(duì)前述步驟1-步驟4的實(shí)現(xiàn)做具體的說明。
[0036] 步驟1、構(gòu)建基于網(wǎng)格的軌跡,確定最優(yōu)網(wǎng)格大小
[0037] 傳統(tǒng)分層聚類算法需要軌跡之間兩兩比較距離,假設(shè)軌跡數(shù)據(jù)規(guī)模為N,那么整個(gè) 聚類算法的時(shí)間復(fù)雜度〇(妒)。
[0038] 為了克服傳統(tǒng)算法的缺點(diǎn),同時(shí)避免路網(wǎng)結(jié)構(gòu)、地圖匹配等因素的限制,本例中提 出一種基于網(wǎng)格的聚類算法。該算法將整個(gè)目標(biāo)區(qū)域劃分為若干個(gè)小網(wǎng)格區(qū)域,并將終端 移動(dòng)軌跡映射為網(wǎng)格序列。
[0039] 給定一條GPS軌跡數(shù)據(jù)T = <(pi,tl),. . .,(Pi,ti),. . .(Pn,tn)〉、一個(gè)網(wǎng)格分割結(jié)構(gòu) 和網(wǎng)格容量闊值MinPts,一個(gè)基于網(wǎng)格的軌跡定義為G = <(gi,l/ 1),. . .,(gj,l/ j),. . .(gm, t'm)〉,其中g(shù)j = {(Pa,ta),. . .,(Pe,te)},t'j = ta,網(wǎng)格容量滿足gj > MinPtS。
[0040] 對(duì)于目標(biāo)區(qū)域中一個(gè)軌跡點(diǎn)p(lat,lng),該軌跡點(diǎn)對(duì)應(yīng)的網(wǎng)格編號(hào)(t,s)由如下 計(jì)算可得:
[0043] 其中,latmax和Ingmax分別是目標(biāo)區(qū)域經(jīng)締度坐標(biāo)軸上的最大值;latmin和Ingmin分 別是目標(biāo)區(qū)域經(jīng)締度坐標(biāo)軸上的最小值;mat和rung分別是經(jīng)締度坐標(biāo)軸上的網(wǎng)格數(shù)。
[0044] 不同的網(wǎng)格分割結(jié)構(gòu)會(huì)對(duì)接下來的異常檢測(cè)算法性能產(chǎn)生重要的影響。小的網(wǎng)格 更能還原原始GI^軌跡的移動(dòng)特性,但同時(shí)會(huì)使異常檢測(cè)算法的時(shí)間復(fù)雜度大大增加;大的 網(wǎng)格可W降低異常檢測(cè)算法的時(shí)間復(fù)雜度,但由于網(wǎng)格粒度過大會(huì)喪失原始的移動(dòng)特性。
[0045] 因此,本發(fā)明在保持原始軌跡移動(dòng)特性和算法時(shí)間復(fù)雜度之間做了權(quán)衡,獲得最 優(yōu)的網(wǎng)格分割結(jié)構(gòu)。
[0046] 步驟2、計(jì)算化US化off距離矩陣
[0047] 利用化US化off距離公式計(jì)算基于網(wǎng)格的軌跡集中所有軌跡之間的距離,生成軌 跡集的距離矩陣M。
[004引任意兩條基于網(wǎng)格的軌跡之間的無向化US化off距離如下:
[0049]
[(K)加]其中d(p,q)是haversine公式,如下:
[0051] d = 2Rarcsin(h)
[0化^ 其中
(1)。、(1)。和人。、人。分別是6口8 軌跡點(diǎn)的經(jīng)締度,R = 6371 km是地球的近似半徑。
[0053] 步驟3、網(wǎng)格軌跡凝聚分層聚類
[0054] 在軌跡集的化US化off距離矩陣的基礎(chǔ)上應(yīng)用自下而上的凝聚分層聚類算法,實(shí) 現(xiàn)大規(guī)模軌跡的正常與異常軌跡的分類。
[0055] 具體地,分層聚類的過程包括:初始,將每條軌跡分配在不同的簇中,然后根據(jù)最 大距離連接度量準(zhǔn)則,逐步將相似軌跡合并到同一個(gè)簇中。簇合并過程反復(fù)進(jìn)行,直到所有 軌跡最終合并形成一個(gè)大簇。
[0056] 使用聚類樹狀圖的樹形結(jié)構(gòu)實(shí)現(xiàn)對(duì)層次聚類過程的可視化,并且實(shí)現(xiàn)最優(yōu)軌跡分 類距離闊值的確定。
[0057] 本發(fā)明中,異常軌跡被定義為與絕大多數(shù)軌跡遠(yuǎn)離的小部分軌跡。因此,我們將遠(yuǎn) 離絕大多數(shù)軌跡簇的軌跡簇中的軌跡判定為異常軌跡,不同的軌跡集需要根據(jù)聚類樹狀圖 確定合適的分類距離闊值。
[005引步驟4、異常檢測(cè)方法評(píng)估反饋
[0059] 利用上述步驟1~3的方法,對(duì)已經(jīng)有軌跡分類標(biāo)識(shí)的軌跡集的進(jìn)行異常軌跡檢 測(cè),得到算法計(jì)算出來的異常分類結(jié)果,與真實(shí)分類情況進(jìn)行對(duì)比。在本發(fā)明中,運(yùn)用機(jī)器 學(xué)習(xí)中常用的評(píng)價(jià)標(biāo)準(zhǔn)混淆矩陣、精確度、召回率、F分?jǐn)?shù),評(píng)估步驟1、3中模型參數(shù)是否合 理,并作出正確的反饋,優(yōu)化異常軌跡算法的正確性和魯棒性。
[0060] 下面結(jié)合附圖1-附圖6所示,更加具體地描述前述各個(gè)步驟的示例性實(shí)現(xiàn)。
[0061 ]步驟 1:
[0062] 將整個(gè)目標(biāo)區(qū)域劃分為若干個(gè)小網(wǎng)格區(qū)域,并將終端GI^軌跡映射為網(wǎng)格序列,如 圖2所示。
[0063] 對(duì)于目標(biāo)區(qū)域中一個(gè)軌跡點(diǎn)p(lat,lng),該軌跡點(diǎn)對(duì)應(yīng)的網(wǎng)格編號(hào)(t,s)由如下 計(jì)算可得:
[0066] 其中,latmax和Ingmax分別是目標(biāo)區(qū)域經(jīng)締度坐標(biāo)軸上的最大值;latmin和Ingmin分 別是目標(biāo)區(qū)域經(jīng)締度坐標(biāo)軸上的最小值;mat和rung分別是經(jīng)締度坐標(biāo)軸上的網(wǎng)格數(shù)。
[0067] 定義網(wǎng)格中包含GPS軌跡點(diǎn)的個(gè)數(shù)為網(wǎng)格容量,保留滿足網(wǎng)格容量大于MinPts的 網(wǎng)格稱為熱點(diǎn)區(qū)域,由熱點(diǎn)區(qū)域組成網(wǎng)格序列。定義網(wǎng)格序列中包含的GI^軌跡點(diǎn)數(shù)占原始 GPS軌跡點(diǎn)總數(shù)的比率為軌跡數(shù)據(jù)覆蓋率。不同的網(wǎng)格尺寸下的網(wǎng)格分割結(jié)構(gòu)會(huì)導(dǎo)致熱點(diǎn) 區(qū)域個(gè)數(shù)和軌跡數(shù)據(jù)覆蓋率的變化。根據(jù)計(jì)算網(wǎng)格尺寸與熱點(diǎn)區(qū)域、軌跡數(shù)據(jù)覆蓋率的關(guān) 系曲線,最佳網(wǎng)格尺寸可W定為0.6X10-3度。在網(wǎng)格尺寸確定為0.6X10-3度的條件下,將G 原始GI^軌跡轉(zhuǎn)換為網(wǎng)格序列,如圖3、圖4所示。
[006引步驟2:
[0069] 在步驟1計(jì)算得到的網(wǎng)格序列集上,運(yùn)用化US化off距離公式計(jì)算基于網(wǎng)格的軌跡 集中所有軌跡之間的距離,生成軌跡集的距離矩陣M。任意兩條基于網(wǎng)格的軌跡之間的無向 化US化off距離如下:
[0070]
[0071 ]其中d(p,q)是haversine公式,如下:
[0072] d = 2Rarcsin(h)
[007;3]其中
Φρ、Φ。和λρ、λ。分別是GPS 軌跡點(diǎn)的經(jīng)締度,R = 6371 km是地球的近似半徑。
[0074] 表1網(wǎng)格序列的化US化off距離矩陣
[0075]
[0076] 步驟 3:
[0077] 凝聚分層聚類,軌跡類闊值設(shè)定
[0078] 在軌跡集的化US化off距離矩陣的基礎(chǔ)上應(yīng)用自下而上的凝聚分層聚類算法,實(shí) 現(xiàn)大規(guī)模軌跡的正常與異常軌跡的分類。初始,算法將每條軌跡分配在不同的簇中,然后根 據(jù)最大距離連接度量準(zhǔn)則,逐步將相似軌跡合并到同一個(gè)簇中。簇合并過程反復(fù)進(jìn)行,直到 所有軌跡最終合并形成一個(gè)大簇。使用聚類樹狀圖的樹形結(jié)構(gòu)實(shí)現(xiàn)對(duì)層次聚類過程的可視 化,并且實(shí)現(xiàn)最優(yōu)軌跡分類距離闊值的確定,如圖5所示為分層聚類樹狀圖的示例。本發(fā)明 中,異常軌跡被定義為與絕不多數(shù)軌跡遠(yuǎn)離的小部分軌跡。因此,我們將遠(yuǎn)離絕不多數(shù)軌跡 簇的軌跡簇中軌跡判定為異常軌跡,不同的軌跡集需要根據(jù)聚類樹狀圖確定合適的分類距 離闊值。
[0079] 根據(jù)示例樹狀圖中的聚類結(jié)果,軌跡3位于遠(yuǎn)離其他軌跡的簇中,因此軌跡3被標(biāo) 記為異常軌跡,如圖6所示。
[0080] 步驟 4:
[0081] 異常檢測(cè)方法評(píng)估反饋
[0082] 利用上述步驟1~3的方法,對(duì)已經(jīng)有軌跡分類標(biāo)識(shí)的軌跡集的進(jìn)行異常軌跡檢 測(cè),得到算法計(jì)算出來的異常分類結(jié)果,與真實(shí)分類情況進(jìn)行對(duì)比。在本發(fā)明中,運(yùn)用機(jī)器 學(xué)習(xí)中常用的評(píng)價(jià)標(biāo)準(zhǔn)混淆矩陣、精確度、召回率、F分?jǐn)?shù),評(píng)估步驟1、3中模型參數(shù)是否合 理,并作出正確的反饋,優(yōu)化異常軌跡算法的正確性和魯棒性。
[0083] 表2異常軌跡檢測(cè)算法性能測(cè)試
[0084]
[0085] ~結(jié)合圖1、圖7所示,根據(jù)本公開,還提出一種基于混合網(wǎng)格分層聚類的集群通信終 端軌跡實(shí)時(shí)異常軌跡檢測(cè)系統(tǒng),該系統(tǒng)包括:服務(wù)調(diào)度中屯、、集群通信網(wǎng)絡(luò)和移動(dòng)定位終 玉山 乂而。
[0086] 移動(dòng)定位終端與服務(wù)調(diào)度中屯、之間經(jīng)過集群通信網(wǎng)絡(luò)進(jìn)行通信。
[0087] 移動(dòng)定位終端包括數(shù)據(jù)終端、車載終端、單模終端。
[0088] 服務(wù)調(diào)度中屯、包括:
[0089] 軌跡文件數(shù)據(jù)庫服務(wù)器,用于存儲(chǔ)所有移動(dòng)定位終端上傳的位置信息;
[0090] 異常軌跡檢測(cè)程序服務(wù)器,用于移動(dòng)定位終端的異常軌跡檢測(cè),優(yōu)化集群通信的 系統(tǒng)調(diào)度;
[0091] 可視化Web服務(wù)器,用于動(dòng)態(tài)展示終端的歷史軌跡,并將異常軌跡檢測(cè)程序服務(wù)器 計(jì)算得到的終端異常軌跡顯示在地圖上。
[0092] 軌跡分析程序服務(wù)器包括:
[0093] 網(wǎng)格軌跡構(gòu)建模塊,用于將整個(gè)目標(biāo)區(qū)域劃分為若干個(gè)小網(wǎng)格區(qū)域,并將終端移 動(dòng)軌跡映射為網(wǎng)格序列。給定一條GPS軌跡數(shù)據(jù)T = <(pi,tl),. . .,(Pi,ti),. . .(Pn,tn)>和一 個(gè)網(wǎng)格分割結(jié)構(gòu),一個(gè)基于網(wǎng)格的軌跡定義為G = <(gl,t/l),...,(gj,t'j),...(gm,t'm)〉, 其中g(shù)j= {(Pa,ta),. . .,(Pe,te)},t'j = ta。
[0094] 對(duì)于目標(biāo)區(qū)域中一個(gè)軌跡點(diǎn)p(lat,lng),該軌跡點(diǎn)對(duì)應(yīng)的網(wǎng)格編號(hào)(t,s)由如下 計(jì)算可得:
[0097] 其中,latmax和Ingmax分別是目標(biāo)區(qū)域經(jīng)締度坐標(biāo)軸上的最大值;latmin和Ingmin分 別是目標(biāo)區(qū)域經(jīng)締度坐標(biāo)軸上的最小值;niat和rung分別是經(jīng)締度坐標(biāo)軸上的網(wǎng)格數(shù)。不同 的網(wǎng)格分割結(jié)構(gòu)會(huì)對(duì)接下來的異常檢測(cè)算法性能產(chǎn)生重要的影響。小的網(wǎng)格更能還原原始 GPS軌跡的移動(dòng)特性,但同時(shí)會(huì)使異常檢測(cè)算法的時(shí)間復(fù)雜度大大增加;大的網(wǎng)格可W降低 異常檢測(cè)算法的時(shí)間復(fù)雜度,但由于網(wǎng)格粒度過大會(huì)喪失原始的移動(dòng)特性。因此,本發(fā)明在 保持原始軌跡移動(dòng)特性和算法時(shí)間復(fù)雜度之間做了權(quán)衡,獲得最優(yōu)的網(wǎng)格分割結(jié)構(gòu)。
[0098] 化US化off距離矩陣計(jì)算模塊,利用化US化off距離公式計(jì)算基于網(wǎng)格的軌跡集中 所有軌跡之間的距離,生成軌跡集的距離矩陣M。任意兩條基于網(wǎng)格的軌跡之間的無向 化US化off距離如下:
[0099]
[0100] 其中d(p,q)是haversine公式,如下:
[0101] d = 2Rarcsin(h)
[010^ 其牛
Φρ、Φ。和λρ、λ。分別是GPS 軌跡點(diǎn)的經(jīng)締度,R = 6371km是地球的近似半徑。
[0103] 網(wǎng)格軌跡凝聚分層聚類模塊,初始,算法將每條軌跡分配在不同的簇中,然后根據(jù) 最大距離連接度量準(zhǔn)則,逐步將相似軌跡合并到同一個(gè)簇中。簇合并過程反復(fù)進(jìn)行,直到所 有軌跡最終合并形成一個(gè)大簇。使用聚類樹狀圖的樹形結(jié)構(gòu)實(shí)現(xiàn)對(duì)層次聚類過程的可視 化,并且實(shí)現(xiàn)最優(yōu)軌跡分類距離闊值的確定。本發(fā)明中,異常軌跡被定義為與絕不多數(shù)軌跡 遠(yuǎn)離的小部分軌跡。因此,我們將遠(yuǎn)離絕不多數(shù)軌跡簇的軌跡簇中軌跡判定為異常軌跡,不 同的軌跡集需要根據(jù)聚類樹狀圖確定合適的分類距離闊值。
[0104] 異常檢測(cè)評(píng)估反饋模塊,利用上述Ξ個(gè)模塊,對(duì)已經(jīng)有軌跡分類標(biāo)識(shí)的軌跡集的 進(jìn)行異常軌跡檢測(cè),得到算法計(jì)算出來的異常分類結(jié)果,與真實(shí)分類情況進(jìn)行對(duì)比。在本發(fā) 明中,運(yùn)用機(jī)器學(xué)習(xí)中常用的評(píng)價(jià)標(biāo)準(zhǔn)混淆矩陣、精確度、召回率、F分?jǐn)?shù),評(píng)估評(píng)估網(wǎng)格軌 跡構(gòu)建模塊、網(wǎng)格軌跡凝聚分層聚類模塊中模型參數(shù)是否合理,并作出正確的反饋,優(yōu)化異 常軌跡算法的正確性和魯棒性。
[0105] 雖然本發(fā)明已W較佳實(shí)施例掲露如上,然其并非用W限定本發(fā)明。本發(fā)明所屬技 術(shù)領(lǐng)域中具有通常知識(shí)者,在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可作各種的更動(dòng)與潤(rùn)飾。因 此,本發(fā)明的保護(hù)范圍當(dāng)視權(quán)利要求書所界定者為準(zhǔn)。
【主權(quán)項(xiàng)】
1. 一種基于混合網(wǎng)格分層聚類的集群通信終端軌跡實(shí)時(shí)異常檢測(cè)方法,其特征在于, 包括以下步驟: 步驟1、構(gòu)建基于網(wǎng)格的軌跡,確定最優(yōu)網(wǎng)格大?。? 步驟2、計(jì)算Hausdroff距離矩陣,即利用Hausdroff距離公式計(jì)算基于網(wǎng)格的軌跡集中 所有軌跡之間的距離,生成軌跡集的距離矩陣M; 步驟3、分層聚類,即在軌跡集的Hausdroff距離矩陣的基礎(chǔ)上應(yīng)用自下而上的凝聚分 層聚類算法,實(shí)現(xiàn)大規(guī)模軌跡的正常與異常軌跡的分類; 步驟4、異常檢測(cè)方法評(píng)估反饋,利用上述步驟1~3的方法,對(duì)已經(jīng)有軌跡分類標(biāo)識(shí)的 軌跡集的進(jìn)行異常軌跡檢測(cè),得到異常分類結(jié)果,并與真實(shí)分類情況進(jìn)行對(duì)比,評(píng)估步驟1、 3中模型參數(shù)是否合理,并作出反饋。2. 根據(jù)權(quán)利要求1所述的基于混合網(wǎng)格分層聚類的集群通信終端軌跡實(shí)時(shí)異常檢測(cè)方 法,其特征在于,所述步驟1的具體實(shí)現(xiàn)包括以下步驟: 將整個(gè)目標(biāo)區(qū)域劃分為若干個(gè)小網(wǎng)格區(qū)域,并將終端移動(dòng)軌跡映射為網(wǎng)格序列;給定 一條GPS軌跡數(shù)據(jù)T =〈(pi,ti),· · ·,(pi,ti),· · ·(pn,tn)>,其中pi是經(jīng)煒度坐標(biāo)值(lati, lngi),ti是時(shí)間戳,η是軌跡點(diǎn)的數(shù)目,一個(gè)網(wǎng)格分割結(jié)構(gòu)和網(wǎng)格容量閾值MinPts,一個(gè)基于 網(wǎng)格的軌跡定義為6 =〈(81,1:/1),...,(8」,1:/」),...(8111,1: /111)>,其中8』={(口£1,1:£1),...,(口(3, te)}表示一個(gè)網(wǎng)格,t、= ta表示用第一個(gè)到達(dá)網(wǎng)格幻的軌跡點(diǎn)的時(shí)間戳ta作為到達(dá)網(wǎng)格gj 的時(shí)間戳,-,。,...,(如山彡表示落在網(wǎng)格^內(nèi)的軌跡點(diǎn)^是網(wǎng)格軌跡的網(wǎng)格數(shù)目洞格 容量滿足gj 2MinPts; 對(duì)于目標(biāo)區(qū)域中一個(gè)軌跡點(diǎn)P (1 a t,1 n g),1 a t和1 n g分別是該軌跡點(diǎn)的經(jīng)煒度值,該軌 跡點(diǎn)對(duì)應(yīng)的網(wǎng)格編號(hào)(t,s)由如下計(jì)算得到:其中,latmax和lngmax分別是目標(biāo)區(qū)域經(jīng)煒度坐標(biāo)軸上的最大值;latmin和lngmin分別是 目標(biāo)區(qū)域經(jīng)煒度坐標(biāo)軸上的最小值;nlat和mng分別是經(jīng)煒度坐標(biāo)軸上的網(wǎng)格數(shù)。3. 根據(jù)權(quán)利要求2所述的基于混合網(wǎng)格分層聚類的集群通信終端軌跡實(shí)時(shí)異常檢測(cè)方 法,其特征在于,所述步驟2中,任意兩條基于網(wǎng)格的軌跡P和Q之間的無向Hausdroff距離如 下:其中任意兩個(gè)網(wǎng)格P和q之間的距離d(p,q)是由haversine公式?jīng)Q定,如下: d = 2Rarcsin(h)ΦΡ、(J)q和λρ、λη分別是p和q兩個(gè) GPS軌跡點(diǎn)的煒度和經(jīng)度,R = 6371 km是地球的近似半徑。4. 根據(jù)權(quán)利要求3所述的基于混合網(wǎng)格分層聚類的集群通信終端軌跡實(shí)時(shí)異常檢測(cè)方 法,其特征在于,所述步驟3中,分層聚類的過程具體包括: 初始,將每條軌跡分配在不同的簇中,然后根據(jù)最大距離連接度量準(zhǔn)則,逐步將相似軌 跡合并到同一個(gè)簇中; 簇的合并過程反復(fù)進(jìn)行,直到所有軌跡最終合并形成一個(gè)大簇; 其中,使用聚類樹狀圖的樹形結(jié)構(gòu)實(shí)現(xiàn)對(duì)層次聚類過程的可視化,實(shí)現(xiàn)最優(yōu)軌跡分類 距離閾值的確定;并且將異常軌跡定義為與絕大多數(shù)軌跡遠(yuǎn)離的小部分軌跡,因此將遠(yuǎn)離 絕大多數(shù)軌跡簇的軌跡簇中的軌跡判定為異常軌跡,不同的軌跡集根據(jù)聚類樹狀圖確定分 類距離閾值。5. 根據(jù)權(quán)利要求4所述的基于混合網(wǎng)格分層聚類的集群通信終端軌跡實(shí)時(shí)異常檢測(cè)方 法,其特征在于,所述步驟4的異常檢測(cè)方法評(píng)估反饋的實(shí)現(xiàn)具體包括: 利用上述步驟1~3的方法,對(duì)已經(jīng)有軌跡分類標(biāo)識(shí)的軌跡集的進(jìn)行異常軌跡檢測(cè),得 到算法計(jì)算出來的異常分類結(jié)果,與真實(shí)分類情況進(jìn)行對(duì)比,并運(yùn)用機(jī)器學(xué)習(xí)中常用的評(píng) 價(jià)標(biāo)準(zhǔn)混淆矩陣、精確度、召回率以及F分?jǐn)?shù),評(píng)估步驟1、3中模型參數(shù)是否合理,并作出反 饋,優(yōu)化異常軌跡算法的正確性和魯棒性。6. -種基于混合網(wǎng)格分層聚類的集群通信終端軌跡實(shí)時(shí)異常軌跡檢測(cè)系統(tǒng),其特征在 于,該系統(tǒng)包括:服務(wù)調(diào)度中心、集群通信網(wǎng)絡(luò)和移動(dòng)定位終端;其中: 移動(dòng)定位終端與服務(wù)調(diào)度中心之間經(jīng)過集群通信網(wǎng)絡(luò)進(jìn)行通信; 服務(wù)調(diào)度中心包括: 軌跡文件數(shù)據(jù)庫服務(wù)器,用于存儲(chǔ)所有移動(dòng)定位終端上傳的位置信息; 異常軌跡檢測(cè)程序服務(wù)器,用于移動(dòng)定位終端的異常軌跡檢測(cè),優(yōu)化集群通信的系統(tǒng) 調(diào)度;以及 可視化Web服務(wù)器,用于動(dòng)態(tài)展示終端的歷史軌跡,并將異常軌跡檢測(cè)程序服務(wù)器計(jì)算 得到的終端異常軌跡顯示在地圖上; 軌跡分析程序服務(wù)器包括: 網(wǎng)格軌跡構(gòu)建模塊,用于將整個(gè)目標(biāo)區(qū)域劃分為若干個(gè)小網(wǎng)格區(qū)域,并將終端移動(dòng)軌 跡映射為網(wǎng)格序列,其中,給定一條GPS軌跡數(shù)據(jù)T =〈(pi,ti),· · ·,(pi,ti),…(pn,tn)>,其 中?1是經(jīng)煒度坐標(biāo)值(latulnglti是時(shí)間戳,η是軌跡點(diǎn)的數(shù)目,一個(gè)網(wǎng)格分割結(jié)構(gòu)和網(wǎng) 格容量閾值MinPts,一個(gè)基于網(wǎng)格的軌跡定義為G =〈(gi,i/ 1),· · ·,(gj,i/ j),· · ·(gn^i/m) >,其中g(shù)j= {(Pa,ta),…,(pe,te)}表示一個(gè)網(wǎng)格,1/ j = ta表示用第一個(gè)到達(dá)網(wǎng)格gj的軌跡 點(diǎn)的時(shí)間戳ta作為到達(dá)網(wǎng)格的時(shí)間戳,(Pa,t a),. . .,(Pe,te)表示落在網(wǎng)格內(nèi)的軌跡點(diǎn), m是網(wǎng)格軌跡的網(wǎng)格數(shù)目,網(wǎng)格容量滿足gj 2 MinPts; 對(duì)于目標(biāo)區(qū)域中一個(gè)軌跡點(diǎn)P (1 a t,1 n g),1 a t和1 n g分別是該軌跡點(diǎn)的經(jīng)煒度值,該軌 跡點(diǎn)對(duì)應(yīng)的網(wǎng)格編號(hào)(t,s)由如下計(jì)算得到:其中,latmax和lngmax分別是目標(biāo)區(qū)域經(jīng)煒度坐標(biāo)軸上的最大值;latmin和lngmin分別是 目標(biāo)區(qū)域經(jīng)煒度坐標(biāo)軸上的最小值;nlat和mng分別是經(jīng)煒度坐標(biāo)軸上的網(wǎng)格數(shù); Hausdroff距離矩陣計(jì)算模塊,用于利用Hausdroff距離公式計(jì)算基于網(wǎng)格的軌跡集中 所有軌跡之間的距離,生成軌跡集的距離矩陣M,其中任意兩條基于網(wǎng)格的軌跡P和Q之間的 無向Hausdroff距離如下:其中任意兩個(gè)網(wǎng)格P和q之間的距離d(p,q)是haversine公式,如下: d = 2Rarcsin(h)φ ρ、φ q和分別是p和q兩 個(gè)GPS軌跡點(diǎn)的煒度和經(jīng)度,R = 6371 km是地球的近似半徑; 網(wǎng)格軌跡凝聚分層聚類模塊,用于分層聚類,即在軌跡集的Hausdroff距離矩陣的基礎(chǔ) 上應(yīng)用自下而上的凝聚分層聚類算法,實(shí)現(xiàn)大規(guī)模軌跡的正常與異常軌跡的分類,其具體 配置成按照下述方式進(jìn)行聚類:初始,將每條軌跡分配在不同的簇中,然后根據(jù)最大距離連 接度量準(zhǔn)則,逐步將相似軌跡合并到同一個(gè)簇中;簇的合并過程反復(fù)進(jìn)行,直到所有軌跡最 終合并形成一個(gè)大簇;其中,使用聚類樹狀圖的樹形結(jié)構(gòu)實(shí)現(xiàn)對(duì)層次聚類過程的可視化,實(shí) 現(xiàn)最優(yōu)軌跡分類距離閾值的確定;并且將異常軌跡定義為與絕大多數(shù)軌跡遠(yuǎn)離的小部分軌 跡,因此將遠(yuǎn)離絕大多數(shù)軌跡簇的軌跡簇中的軌跡判定為異常軌跡,不同的軌跡集根據(jù)聚 類樹狀圖確定分類距離閾值; 異常檢測(cè)評(píng)估反饋模塊,用于利用上述網(wǎng)格軌跡構(gòu)建模塊、Hausdroff距離矩陣計(jì)算模 塊以及網(wǎng)格軌跡凝聚分層聚類模塊,對(duì)已經(jīng)有軌跡分類標(biāo)識(shí)的軌跡集的進(jìn)行異常軌跡檢 測(cè),得到異常分類結(jié)果,并與真實(shí)分類情況進(jìn)行對(duì)比,評(píng)估網(wǎng)格軌跡構(gòu)建模塊、網(wǎng)格軌跡凝 聚分層聚類模塊中模型參數(shù)是否合理,并作出反饋。
【文檔編號(hào)】G06K9/62GK105825242SQ201610299087
【公開日】2016年8月3日
【申請(qǐng)日】2016年5月6日
【發(fā)明人】王健, 丁峰, 張李明, 趙康僆, 張乃通
【申請(qǐng)人】南京大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1