一種從空間采樣點(diǎn)數(shù)據(jù)集中檢測奇異樣點(diǎn)的方法
【專利摘要】本發(fā)明公開一種從空間采樣點(diǎn)數(shù)據(jù)集中檢測奇異樣點(diǎn)的方法,該方法包括:S1.獲取空間采樣點(diǎn)數(shù)據(jù)集文件;S2.建立采樣點(diǎn)數(shù)據(jù)集相對(duì)應(yīng)的泰森多邊形數(shù)據(jù)集,并建立采樣點(diǎn)與其相應(yīng)的泰森多邊形的對(duì)應(yīng)關(guān)系表;S3.根據(jù)所述對(duì)應(yīng)關(guān)系表,查找每個(gè)采樣點(diǎn)的所有鄰域采樣點(diǎn);S4.計(jì)算每個(gè)采樣點(diǎn)與其所有鄰域采樣點(diǎn)的局部自相關(guān)指數(shù);S5.根據(jù)局部自相關(guān)指數(shù),判斷采樣點(diǎn)是否為局部奇異樣點(diǎn)。
【專利說明】一種從空間采樣點(diǎn)數(shù)據(jù)集中檢測奇異樣點(diǎn)的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)【技術(shù)領(lǐng)域】,具體涉及一種從空間采樣點(diǎn)數(shù)據(jù)集中檢測奇異樣點(diǎn)的方法。
【背景技術(shù)】
[0002]在資源環(huán)境和經(jīng)濟(jì)社會(huì)調(diào)查監(jiān)測研究中,空間采樣實(shí)現(xiàn)高密度、全面的空間變異性特征和區(qū)域總體統(tǒng)計(jì)特征的獲取,由于實(shí)驗(yàn)或輸入錯(cuò)誤等可能會(huì)使樣點(diǎn)數(shù)據(jù)集中存在與其他樣點(diǎn)存在顯著不一致的樣點(diǎn),即屬性特征值與其他周圍相鄰樣點(diǎn)有明顯不同的樣點(diǎn),這就是奇異樣點(diǎn)。奇異樣點(diǎn)具有局部不穩(wěn)定性,即使有時(shí)對(duì)于總體數(shù)據(jù)集來說差異并不顯著,但與相鄰近的其他樣點(diǎn)相比卻具有極端值。奇異樣點(diǎn)的存在會(huì)影響樣點(diǎn)數(shù)據(jù)集的質(zhì)量,常導(dǎo)致估測分析結(jié)果與真實(shí)值產(chǎn)生很大偏差,并掩蓋變量真實(shí)的空間結(jié)構(gòu)。因此探測出奇異樣點(diǎn)并加以分析處理是利用空間采樣數(shù)據(jù)進(jìn)行估測分析的前提。
[0003]現(xiàn)有的檢測空間奇異樣點(diǎn)方法為閾值法與空間約束法,其中閾值法將屬性特征值超出閾值范圍的樣點(diǎn)判定為奇異樣點(diǎn),空間約束法通過預(yù)先設(shè)置K-鄰域參數(shù)和最小點(diǎn)數(shù)兩個(gè)參數(shù)來確定鄰域,并計(jì)算對(duì)象鄰域的平均k-距離、可達(dá)距離或可達(dá)密度與對(duì)象自身的k-距離、可達(dá)距離和可達(dá)密度之比來表示局部奇異度,并將奇異度超出給定閾值范圍的樣點(diǎn)判定為奇異樣點(diǎn)。
[0004]現(xiàn)有的檢測空間奇異樣點(diǎn)方法存在的問題是:
[0005]1、閾值法雖然能識(shí)別出全局的奇異樣點(diǎn),但是往往遺漏局部奇異樣點(diǎn);并且閾值的選擇對(duì)檢測結(jié)果影響很大,經(jīng)常導(dǎo)致奇異樣點(diǎn)遺漏或正常樣點(diǎn)被剔除。
[0006]2、空間約束法需要預(yù)先設(shè)置參數(shù),導(dǎo)致算法復(fù)雜度高,且檢測結(jié)果對(duì)參數(shù)的選擇非常敏感,用戶對(duì)相關(guān)領(lǐng)域先驗(yàn)知識(shí)的把握程度決定了參數(shù)輸入的準(zhǔn)確性,檢測結(jié)果不確定性大。
【發(fā)明內(nèi)容】
[0007]本發(fā)明所要解決的技術(shù)問題現(xiàn)有技術(shù)需要人為輸入?yún)?shù),算法時(shí)間復(fù)雜度高,且參數(shù)受用戶經(jīng)驗(yàn)影響大,檢測結(jié)果不確定性也大。
[0008]為此目的,本發(fā)明提出一種從空間采樣點(diǎn)數(shù)據(jù)集中檢測奇異樣點(diǎn)的方法,該方法包括:
[0009]S1.獲取空間采樣點(diǎn)數(shù)據(jù)集文件;
[0010]S2.建立采樣點(diǎn)數(shù)據(jù)集相對(duì)應(yīng)的泰森多邊形數(shù)據(jù)集,并建立采樣點(diǎn)與其相應(yīng)的泰森多邊形的對(duì)應(yīng)關(guān)系表;
[0011]S3.根據(jù)所述對(duì)應(yīng)關(guān)系表,查找每個(gè)采樣點(diǎn)的所有鄰域采樣點(diǎn);
[0012]S4.計(jì)算每個(gè)采樣點(diǎn)與其所有鄰域采樣點(diǎn)的局部自相關(guān)指數(shù);
[0013]S5.根據(jù)局部自相關(guān)指數(shù),判斷采樣點(diǎn)是否為局部奇異樣點(diǎn)。
[0014]其中,在步驟SI中,所述文件包含采樣點(diǎn)的經(jīng)度坐標(biāo)、緯度坐標(biāo)和屬性變量的實(shí)際觀測值,所述文件為txt文本文件或可擴(kuò)展標(biāo)記語言XML文件。
[0015]其中,在步驟SI和步驟S2之間,該方法進(jìn)一步包括:
[0016]Sll.根據(jù)采樣點(diǎn)的經(jīng)度和緯度坐標(biāo),將所述文件轉(zhuǎn)換為工業(yè)標(biāo)準(zhǔn)的Shape文件并將經(jīng)度和緯度坐標(biāo)的投影轉(zhuǎn)換為高斯克呂格投影。
[0017]其中,所述步驟S2包括:根據(jù)采樣點(diǎn)的高斯克呂格投影,建立采樣點(diǎn)數(shù)據(jù)集相對(duì)應(yīng)的泰森多邊形數(shù)據(jù)集,并建立采樣點(diǎn)與其相應(yīng)的泰森多邊形的對(duì)應(yīng)關(guān)系表。
[0018]其中,所述步驟S3包括:
[0019]S31.選擇采樣點(diǎn)數(shù)據(jù)集中的任意一個(gè)采樣點(diǎn)為實(shí)驗(yàn)采樣點(diǎn),記錄所有與所述實(shí)驗(yàn)采樣點(diǎn)的泰森多邊形共邊的泰森多邊形;
[0020]S32.根據(jù)所述對(duì)應(yīng)關(guān)系表,查找所述共邊的泰森多邊形對(duì)應(yīng)的采樣點(diǎn),得到所述實(shí)驗(yàn)采樣點(diǎn)的鄰域采樣點(diǎn);
[0021]S33.重復(fù)執(zhí)行步驟S31、S32,直至遍歷所有的采樣點(diǎn)。
[0022]較佳的,該方法進(jìn)一步包括:
[0023]S6.選取任意一個(gè)局部奇異樣點(diǎn)為待測采樣點(diǎn),將采樣點(diǎn)數(shù)據(jù)集中除所述待測采樣點(diǎn)之外的所有采樣點(diǎn)作為所述待測采樣點(diǎn)的鄰域采樣點(diǎn),計(jì)算所述待測采樣點(diǎn)與其鄰域采樣點(diǎn)的全局自相關(guān)指數(shù);
[0024]S7.根據(jù)全局自相關(guān)指數(shù),判斷所述待測采樣點(diǎn)是否為全局奇異樣點(diǎn);
[0025]S8.重復(fù)執(zhí)行步驟S6、S7,直至遍歷所有的局部奇異樣點(diǎn)。
[0026]相比于現(xiàn)有技術(shù),本發(fā)明提供的方法的有益效果是:通過利用局部自相關(guān)指數(shù)測度樣點(diǎn)與鄰域樣點(diǎn)的奇異程度,避免奇異樣點(diǎn)檢測中的人為參數(shù)輸入,降低用戶經(jīng)驗(yàn)對(duì)檢測結(jié)果的影響,算法時(shí)間復(fù)雜度降低,保證了空間奇異樣點(diǎn)的正確無誤檢測,既能夠檢測出局部奇異樣點(diǎn),又能檢測出全局奇異樣點(diǎn)。
【專利附圖】
【附圖說明】
[0027]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0028]圖1示出了一種從空間采樣點(diǎn)數(shù)據(jù)集中檢測奇異樣點(diǎn)的方法的流程圖。
【具體實(shí)施方式】
[0029]為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0030]一種從空間采樣點(diǎn)數(shù)據(jù)集中檢測奇異樣點(diǎn)的方法,如圖1所示,該方法包括:
[0031]S1.獲取空間采樣點(diǎn)數(shù)據(jù)集文件;
[0032]S2.建立采樣點(diǎn)數(shù)據(jù)集相對(duì)應(yīng)的泰森多邊形數(shù)據(jù)集,并建立采樣點(diǎn)與其相應(yīng)的泰森多邊形的對(duì)應(yīng)關(guān)系表;[0033]S3.根據(jù)所述對(duì)應(yīng)關(guān)系表,查找每個(gè)采樣點(diǎn)的所有鄰域采樣點(diǎn);
[0034]S4.計(jì)算每個(gè)采樣點(diǎn)與其所有鄰域采樣點(diǎn)的局部自相關(guān)指數(shù);
[0035]S5.根據(jù)局部自相關(guān)指數(shù),判斷采樣點(diǎn)是否為局部奇異樣點(diǎn)。
[0036]其中,在步驟SI中,所述文件包含采樣點(diǎn)的經(jīng)度坐標(biāo)、緯度坐標(biāo)和屬性變量的實(shí)際觀測值,所述文件為txt文本文件或可擴(kuò)展標(biāo)記語言XML文件。
[0037]其中,在步驟SI和步驟S2之間,該方法進(jìn)一步包括:
[0038]Sll.根據(jù)采樣點(diǎn)的經(jīng)度和緯度坐標(biāo),將所述文件轉(zhuǎn)換為工業(yè)標(biāo)準(zhǔn)的Shape文件并將經(jīng)度和緯度坐標(biāo)的投影轉(zhuǎn)換為高斯克呂格投影。
[0039]其中,所述步驟S2包括:根據(jù)采樣點(diǎn)的高斯克呂格投影,建立采樣點(diǎn)數(shù)據(jù)集相對(duì)應(yīng)的泰森多邊形數(shù)據(jù)集,并建立采樣點(diǎn)與其相應(yīng)的泰森多邊形的對(duì)應(yīng)關(guān)系表。
[0040]其中,所述步驟S3包括:
[0041]S31.選擇采樣點(diǎn)數(shù)據(jù)集中的任意一個(gè)采樣點(diǎn)為實(shí)驗(yàn)采樣點(diǎn),記錄所有與所述實(shí)驗(yàn)采樣點(diǎn)的泰森多邊形共邊的泰森多邊形;
[0042]S32.根據(jù)所述對(duì)應(yīng)關(guān)系表,查找所述共邊的泰森多邊形對(duì)應(yīng)的采樣點(diǎn),得到所述實(shí)驗(yàn)采樣點(diǎn)的鄰域采樣 點(diǎn);
[0043]S33.重復(fù)執(zhí)行步驟S31、S32,直至遍歷所有的采樣點(diǎn)。
[0044]較佳的,該方法進(jìn)一步包括:
[0045]S6.選取任意一個(gè)局部奇異樣點(diǎn)為待測采樣點(diǎn),將采樣點(diǎn)數(shù)據(jù)集中除所述待測采樣點(diǎn)之外的所有采樣點(diǎn)作為所述待測采樣點(diǎn)的鄰域采樣點(diǎn),計(jì)算所述待測采樣點(diǎn)與其鄰域采樣點(diǎn)的全局自相關(guān)指數(shù);
[0046]S7.根據(jù)全局自相關(guān)指數(shù),判斷所述待測采樣點(diǎn)是否為全局奇異樣點(diǎn);
[0047]S8.重復(fù)執(zhí)行步驟S6、S7,直至遍歷所有的局部奇異樣點(diǎn)。
[0048]相比于現(xiàn)有技術(shù),本發(fā)明提供的方法的有益效果是:通過利用局部自相關(guān)指數(shù)測度樣點(diǎn)與鄰域樣點(diǎn)的奇異程度,避免奇異樣點(diǎn)檢測中的人為參數(shù)輸入,提高了檢測奇異樣點(diǎn)的準(zhǔn)確性。
[0049]本發(fā)明實(shí)施例中,從采樣點(diǎn)數(shù)據(jù)集中的任意選取出第i個(gè)采樣點(diǎn)(i = l),查找其泰森多邊形共邊的多邊形有m個(gè),反向查找相應(yīng)的采樣點(diǎn)作為所述第i個(gè)采樣點(diǎn)的m個(gè)鄰域樣點(diǎn);
[0050]計(jì)算第i個(gè)樣點(diǎn)與其鄰域樣點(diǎn)間的局部自相關(guān)指數(shù)Mit5 Mi計(jì)算方法如下:
m
[0051 ]=1^Σ Wij (C — )(其中 j 古 i )
y=i
[0052]其中,Vi為樣點(diǎn)i的屬性變量的實(shí)際觀測值;V為樣點(diǎn)i的所有鄰域采樣點(diǎn)的樣點(diǎn)屬性變量值的均值;Vj為所述第i個(gè)樣點(diǎn)的領(lǐng)域樣點(diǎn)j的屬性變量值,j Φ i ^ij為樣點(diǎn)i與j之間的反距離權(quán)重,Wij的計(jì)算過程如下:
[0053]計(jì)算樣點(diǎn)i與j之間的距離Dist (i, j),所述Dist (i, j)的計(jì)算公式為:
[0054]DhiXu./) = ^/(/ν-Λ):+(/, -.!.,Y (其中 j 關(guān) i);
[0055]計(jì)算樣點(diǎn)i與j之間的權(quán)重Wij計(jì)算公式為:
【權(quán)利要求】
1.一種從空間采樣點(diǎn)數(shù)據(jù)集中檢測奇異樣點(diǎn)的方法,其特征在于,該方法包括: S1.獲取空間采樣點(diǎn)數(shù)據(jù)集文件; S2.建立采樣點(diǎn)數(shù)據(jù)集相對(duì)應(yīng)的泰森多邊形數(shù)據(jù)集,并建立采樣點(diǎn)與其相應(yīng)的泰森多邊形的對(duì)應(yīng)關(guān)系表; S3.根據(jù)所述對(duì)應(yīng)關(guān)系表,查找每個(gè)采樣點(diǎn)的所有鄰域采樣點(diǎn); S4.計(jì)算每個(gè)采樣點(diǎn)與其所有鄰域采樣點(diǎn)的局部自相關(guān)指數(shù); S5.根據(jù)局部自相關(guān)指數(shù),判斷采樣點(diǎn)是否為局部奇異樣點(diǎn)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在步驟SI中,所述文件包含采樣點(diǎn)的經(jīng)度坐標(biāo)、緯度坐標(biāo)和屬性變量的實(shí)際觀測值,所述文件為txt文本文件或可擴(kuò)展標(biāo)記語言XML文件。
3.根據(jù)權(quán)利要求2所述的方法,其特征還在于,在步驟SI和步驟S2之間,該方法進(jìn)一步包括: Sll.根據(jù)采樣點(diǎn)的經(jīng)度和緯度坐標(biāo),將所述文件轉(zhuǎn)換為工業(yè)標(biāo)準(zhǔn)的Shape文件并將經(jīng)度和緯度坐標(biāo)的投影轉(zhuǎn)換為高斯克呂格投影。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述步驟S2包括:根據(jù)采樣點(diǎn)的高斯克呂格投影,建立采樣點(diǎn)數(shù)據(jù)集相對(duì)應(yīng)的泰森多邊形數(shù)據(jù)集,并建立采樣點(diǎn)與其相應(yīng)的泰森多邊形的對(duì)應(yīng)關(guān)系表。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述步驟S3包括: S31.選擇采樣點(diǎn)數(shù)據(jù)集中的任意一個(gè)采樣點(diǎn)為實(shí)驗(yàn)采樣點(diǎn),記錄所有與所述實(shí)驗(yàn)采樣點(diǎn)的泰森多邊形共邊的泰森多邊形; S32.根據(jù)所述對(duì)應(yīng)關(guān)系表,查找所述共邊的泰森多邊形對(duì)應(yīng)的采樣點(diǎn),得到所述實(shí)驗(yàn)采樣點(diǎn)的鄰域采樣點(diǎn); S33.重復(fù)執(zhí)行步驟S31、S32,直至遍歷所有的采樣點(diǎn)。
6.根據(jù)權(quán)利要求1所述的方法,其特征還在于,該方法進(jìn)一步包括:S6.選取任意一個(gè)局部奇異樣點(diǎn)為待測采樣點(diǎn),將采樣點(diǎn)數(shù)據(jù)集中除所述待測采樣點(diǎn)之外的所有采樣點(diǎn)作為所述待測采樣點(diǎn)的鄰域采樣點(diǎn),計(jì)算所述待測采樣點(diǎn)與其鄰域采樣點(diǎn)的全局自相關(guān)指數(shù); S7.根據(jù)全局自相關(guān)指數(shù),判斷所述待測采樣點(diǎn)是否為全局奇異樣點(diǎn); S8.重復(fù)執(zhí)行步驟S6、S7,直至遍歷所有的局部奇異樣點(diǎn)。
【文檔編號(hào)】G06F19/00GK103823977SQ201410065213
【公開日】2014年5月28日 申請(qǐng)日期:2014年2月25日 優(yōu)先權(quán)日:2014年2月25日
【發(fā)明者】潘瑜春, 王妍, 高秉博, 李淑華, 郜允兵, 郝星耀, 劉玉, 唐秀美, 任艷敏 申請(qǐng)人:北京農(nóng)業(yè)信息技術(shù)研究中心