專利名稱:高效能空間抽樣調(diào)查三明治模型方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種空間高效抽樣調(diào)査方法,生態(tài)環(huán)境監(jiān)測(cè)、資源調(diào)査、農(nóng)業(yè)估產(chǎn)、林業(yè)調(diào)査、 健康調(diào)查、遙感監(jiān)測(cè)等。
技術(shù)背景空間抽樣具有實(shí)際意義,好的抽樣方案可在保持或提高精度同時(shí),減少采集與測(cè)量數(shù)據(jù)的 花費(fèi),如美國(guó)自70年代采用MSS對(duì)世界小麥估產(chǎn),精度達(dá)到90%;近年采用氣象衛(wèi)星圖像進(jìn) 行農(nóng)作物估產(chǎn),全國(guó)范圍估產(chǎn)開支僅幾千美元(用陸地衛(wèi)星稍貴),帶來的經(jīng)濟(jì)效益可達(dá)上億 美元。我國(guó)農(nóng)業(yè)部采用類似方法通過抽樣調(diào)查結(jié)合衛(wèi)星遙感調(diào)査,也證明了其顯著的經(jīng)濟(jì)效益。傳統(tǒng)的抽樣技術(shù)可以分為簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣、整群抽樣和階段抽樣。簡(jiǎn) 單隨機(jī)抽樣是隨機(jī)在抽樣區(qū)域中選擇樣本,這種抽樣技術(shù)對(duì)于效率較低,如果抽樣區(qū)域目標(biāo)具 有空間上的相關(guān)性,通過隨機(jī)抽樣得到的樣本對(duì)總體估計(jì)會(huì)產(chǎn)生偏差。系統(tǒng)抽樣在抽樣區(qū)域中 按照一定規(guī)則均勻的布置樣本,如果布樣密度足夠能夠很好的估計(jì)總體,但是要達(dá)到較高的布 樣密度,需要較多的樣本成本較高。分層抽樣是對(duì)抽樣區(qū)域有一定了解情況下提高抽樣效率的 一種技術(shù),通過根據(jù)層內(nèi)變異小,層間差異大的分層原則,能夠通過較少的點(diǎn)得到較高的抽樣 精度。在每個(gè)層內(nèi)布置樣本也同樣面臨與簡(jiǎn)單隨機(jī)抽樣和系統(tǒng)抽樣的問題。整群抽樣和多階段 抽樣都是解決抽樣目標(biāo)較大而提出的解決方案。整群抽樣是整群的抽取樣本而不是單個(gè)抽取樣本,適用于群之間的差異不大情況。多階段抽樣是對(duì)抽樣目標(biāo)在不同的層次上劃分,從粗粒度 到細(xì)粒度的劃分,逐步得到樣本。在選擇群或者在多階段抽樣中,每個(gè)階段抽樣樣本的選取也 面臨這簡(jiǎn)單隨機(jī)抽樣或者系統(tǒng)抽樣等面臨的問題。國(guó)內(nèi)外的很多應(yīng)用中,大部分基本上還是采 用基于經(jīng)典統(tǒng)計(jì)學(xué)的傳統(tǒng)抽樣方法,空間相關(guān)性及空間異質(zhì)性沒有融合到算法中,導(dǎo)致不可忽 視的偏差及精度下降,間接地影響到抽樣的效率及結(jié)果準(zhǔn)確性??臻g抽樣受地學(xué)規(guī)律及區(qū)域因素的影響,如抽樣分層涉及到復(fù)雜的時(shí)空因子、最優(yōu)樣本的 設(shè)計(jì)需要分析空間變異性、動(dòng)態(tài)抽樣涉及到的時(shí)空復(fù)雜性、在空間抽樣中誤差的普遍性(如數(shù) 據(jù)、測(cè)量方法、模型誤差)等;這些問題都是采用單純的統(tǒng)計(jì)抽樣不能很好處理的,需要在實(shí) 踐中結(jié)合地學(xué)規(guī)律謹(jǐn)慎研究并找出合適的處理方法。在考慮了空間相關(guān)性的條件下,抽樣目標(biāo) 區(qū)域的分層與調(diào)査結(jié)果匯報(bào)單元往往不一致,而如果根據(jù)匯報(bào)單元進(jìn)行抽樣,則會(huì)造成抽樣成 本的大幅上升,當(dāng)報(bào)告單元眾多時(shí),如我國(guó)以2700多個(gè)縣為報(bào)告單元,即使利用高效的抽樣調(diào)查的辦法,調(diào)查費(fèi)用仍是很高的。 發(fā)明內(nèi)容本發(fā)明的技術(shù)解決問題是提供一種高效能空間抽樣調(diào)査三明治模型方法,該方法克服了 按照?qǐng)?bào)告單元布置樣本導(dǎo)致的效率過低和單一根據(jù)知識(shí)分層布置樣點(diǎn)無法在報(bào)告單元表達(dá)的難 題,提高了監(jiān)測(cè)抽樣效率和預(yù)見性,同時(shí)以知識(shí)分層為樣本布設(shè)范圍,抽樣結(jié)果綜合到報(bào)告單 元,避免使得樣本量隨報(bào)告單元數(shù)目增加而呈線性增加,使調(diào)查費(fèi)用降低,滿足了調(diào)查結(jié)果以 行政區(qū)的方式表達(dá)。本發(fā)明的技術(shù)解決方案為 一種高效能空間抽樣調(diào)查三明治模型方法,首先對(duì)抽樣域進(jìn)行 離散化,構(gòu)造一個(gè)抽樣框;然后根據(jù)層內(nèi)方差小層間方差大的原則對(duì)抽樣框分層,構(gòu)成不同的 次級(jí)抽樣框,所有次級(jí)抽樣框構(gòu)成的總體稱為知識(shí)層,樣本布置在這樣的次級(jí)抽樣框中;計(jì)算 每個(gè)層內(nèi)樣本調(diào)査值,得到層的均值和方差;將知識(shí)層得到的方差和均值,按照誤差和均值傳 遞方法,算到不同的報(bào)告層上,其具體步驟如下(1) 根據(jù)抽樣目標(biāo)的復(fù)雜程度和抽樣基本對(duì)象的大小,設(shè)定抽樣分辨 率;通過抽樣分辨率將連續(xù)的空間離散化,形成格網(wǎng)單元,即抽樣框;(2) 則對(duì)所述的抽樣框進(jìn)行分層,構(gòu)成不同的次級(jí)抽樣框,所有次級(jí)抽樣框構(gòu)成的總體稱 為知識(shí)層;樣本按照隨機(jī)方法布置在這樣的次級(jí)抽樣框中;(3) 計(jì)算抽樣框中各個(gè)層的均值和方差;(4) 根據(jù)每個(gè)報(bào)告單元所包含的不同分層對(duì)報(bào)告單元貢獻(xiàn)的權(quán)重,計(jì)算每個(gè)報(bào)告單元的均 值和方差,從而完成從知識(shí)層到報(bào)告層的信息傳遞。本發(fā)明的原理是首先,格網(wǎng)化抽樣域得到布滿整個(gè)抽樣域的單元格網(wǎng),作為計(jì)算分層單 元對(duì)報(bào)告單元貢獻(xiàn)權(quán)重的基本度量尺度;其次,通過計(jì)算或者利用先驗(yàn)知識(shí)引入知識(shí)分層,使得調(diào)査目標(biāo)在每個(gè)層內(nèi)方差變異小,層與層之間的方差變異大,使得在層內(nèi)通過簡(jiǎn)單隨機(jī)的方 法抽樣就能夠使得層內(nèi)的均值和方差有較好的估計(jì);然后計(jì)算計(jì)算各個(gè)報(bào)告單元所包含的分層 單元面積比重作為分層單元占報(bào)告單元的權(quán)重;再次計(jì)算每層的均值和空間方差,空間方差是 考慮了樣本空間相關(guān)性的一種方差,其計(jì)算公式如下<formula>formula see original document page 5</formula>其中<formula>formula see original document page 5</formula><formula>formula see original document page 6</formula>上式中(72是考慮了空間相關(guān)性以后得到的空間方差,CT, 是層內(nèi)的算術(shù)方差,五[^fl-fl'"度 量了層內(nèi)的空間相關(guān)性。y。表示樣本值,?表示均值。hi表示第h層內(nèi)的地i個(gè)樣本點(diǎn)的值。^表示第h層的樣點(diǎn)的均值,其計(jì)算公式如下■n="^rl^A, (4)在完成層內(nèi)的均值和方差計(jì)算以后,可以根據(jù)下面的公式計(jì)算每個(gè)報(bào)告單元的均值和方差R,/W (5)F = J>AxWi (6)公式(5)中f^表示h層的占報(bào)告單元的權(quán)重,iV力表示在報(bào)告單元中,第h層所包含的抽樣 單元的個(gè)數(shù),W表示報(bào)告單元包含的抽樣單元個(gè)數(shù)。公式(6)是計(jì)算某個(gè)報(bào)告單元的均值的方法, ^表示知識(shí)層中計(jì)算得到第h層均值。v60是報(bào)告單元的方差,^表示知識(shí)層中第h層被報(bào)告 單元包含的抽樣數(shù),W,的意義跟第(5)式的意思一樣,《表示第h知識(shí)層的有(l)式計(jì)算得到的空間方差。在求得知識(shí)層的均值和空間方差以后對(duì)每個(gè)報(bào)告單元根據(jù)其包含的知識(shí)層按照公式 (5)、 (6)、 (7)計(jì)算報(bào)告單元的均值和方差。 本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點(diǎn)在于(1) 在一般調(diào)查抽樣中,最后的調(diào)査結(jié)果需要按照行政單元報(bào)告,因此一般采用在每個(gè)行 政單元內(nèi)放樣,如果行政單元較多,則樣本非常多,效率不高。本發(fā)明采用知識(shí)分層抽樣,能 夠極大的提高抽樣效率,尤其是地理對(duì)象往往具有空間相關(guān)性,則最后的調(diào)査結(jié)果,無法匯報(bào) 到行政單元上去,因?yàn)橐粋€(gè)行政單元往往可能包含多個(gè)不同的層類型。(2) 以知識(shí)分層為樣本布設(shè)范圍,抽樣結(jié)果綜合到報(bào)告單元,避免使得樣本量隨報(bào)告單元 數(shù)目增加而呈線性增加,使調(diào)査費(fèi)用大大降低,同時(shí)滿足調(diào)查結(jié)果以行政區(qū)的方式表達(dá)。(3) 本發(fā)明在樣本布設(shè)采用分層模型后,利用誤差和均值傳遞方法,最后結(jié)果根據(jù)行政單 元匯報(bào),成功的實(shí)現(xiàn)了抽樣調(diào)査中效率和實(shí)用性的結(jié)合,同時(shí)對(duì)于地學(xué)對(duì)象調(diào)查,通過分層的 方式考慮了大尺度上的空間變異性,通過空間方差的計(jì)算又考慮了小區(qū)域內(nèi)空間相關(guān)性,由此 利用先驗(yàn)知識(shí)提高抽樣效率即在同樣的樣本下可以獲得更好的抽樣精度,在同樣精度要求下, 需要較少的樣本,并保持了精度的先驗(yàn)性和報(bào)告單元的目的性。
圖1為本發(fā)明高效能空間抽樣調(diào)查三明治模型方法的流程圖。
具體實(shí)施方式
如圖1所示,以耕地調(diào)查為例,本發(fā)明的具體實(shí)施方法如下1. 設(shè)定基本抽樣單元格的大小,也就是離散化連續(xù)的抽樣空間,形成大小一致的抽樣單元, 每個(gè)抽樣單元被認(rèn)為是均一的個(gè)體,所有抽樣單元構(gòu)成了抽樣總體。根據(jù)抽樣的目標(biāo),通過抽 樣單元格大小的設(shè)置,可以控制抽樣粒度大小,當(dāng)單元格越大,抽樣的樣本量越小,但是具體 調(diào)査的點(diǎn)的位置隨機(jī)性大。抽樣單元格越小,樣本量越大,相對(duì)抽樣樣點(diǎn)在單元格內(nèi)選擇范圍 較小,得到結(jié)果對(duì)單元格代表性更高。例如,對(duì)國(guó)內(nèi)的耕地面積的抽樣調(diào)查中,通過TM影像 可以得到大概的全國(guó)各個(gè)省的耕地面積,但是細(xì)小地物無法區(qū)分,因此通過航空攝影相片識(shí)別細(xì)小地物的比例,從而求得實(shí)際耕地面積。因?yàn)?,采用基本的抽樣單元?O米x30米的航空攝 影照片估計(jì)細(xì)小地物的面積比例,然后乘以TM影像得到總的耕地面積,得到精確的全國(guó)各個(gè) 省的耕地面積。2. 對(duì)抽樣域分層,根據(jù)抽樣分層原則層內(nèi)方差小,層間方差大。對(duì)目 標(biāo)抽樣域進(jìn)行分層,在分層的時(shí)候,主要考慮目標(biāo)的自然特征,不需要考慮最后結(jié)果報(bào)告的報(bào)告單元的范圍限制。例如在耕地面積調(diào)查中,將細(xì)小底物類型比較一致的或者是非耕地面 積不能被TM影像識(shí)別但是所占比例類似的抽樣區(qū)域分為一類,而不需要根據(jù)各個(gè)省的范圍對(duì) 每個(gè)省都進(jìn)行分層,并且分層的邊界也不需要考慮各個(gè)省的實(shí)際邊界范圍。3. 在各個(gè)層內(nèi),按照隨機(jī)方法布置樣本。在全國(guó)耕地面積調(diào)査中,根據(jù) 步驟2得到的不同的層,在每個(gè)層內(nèi),按照抽樣調(diào)査的精度要求,在每個(gè)層內(nèi)分別隨機(jī)布設(shè)樣本,層與層之間樣本布設(shè)互不干擾。在每個(gè)層內(nèi),每個(gè)樣本被抽到的概率為1/N, N為層內(nèi) 所有樣本單元的個(gè)數(shù)。層內(nèi)布設(shè)的樣本量大小可以按照下式計(jì)算<formula>formula see original document page 7</formula>其中C7是總體方差,F(xiàn)是用戶希望這次調(diào)査方差,n是樣本量。4. 計(jì)算各個(gè)層內(nèi)的均值和方差,每個(gè)層內(nèi)的均值和方差,根據(jù)隨機(jī)抽樣理論可以通過下式 得到<formula>formula see original document page 7</formula>yhi:在A層內(nèi)調(diào)查單元/的調(diào)查值A(chǔ): &層均值 "A: /2層樣本個(gè)數(shù)A層均值算術(shù)方差 然后根據(jù)空間相關(guān)性理論,計(jì)算空間方差CT2 =丄{1_£|>(0 — 0')]}0",2,l;i;[凡-F〗[凡,—O"2:是考慮了空間相關(guān)性以后得到的空間方差,£[K _"')]:度量了層內(nèi)的空間相關(guān)性,少。表示層內(nèi)樣本值, P:表示層內(nèi)均值。5.計(jì)算每個(gè)報(bào)告單元所包含的層的權(quán)重,根據(jù)三明治抽樣理論,每個(gè)報(bào) 告單元內(nèi)包含的各個(gè)層所占報(bào)告單元的權(quán)重為『、第A層在報(bào)告單元中的權(quán)重,W、第A層被報(bào)告單元中包含的基本抽樣單元的個(gè)數(shù), W:報(bào)告單元總的基本抽樣單元的個(gè)數(shù)。 然后計(jì)算報(bào)告單元的均值和方差7:報(bào)告單元的均值h :表示知識(shí)層(第2步中根據(jù)目標(biāo)屬性得到的分層)中計(jì)算得到第h層均值W':知識(shí)層/所占報(bào)告單元的權(quán)重 <》報(bào)告單元的方差知識(shí)層中第&層被報(bào)告單元包含的抽中的樣本數(shù)A、第^層被報(bào)告單元中包含的基本抽樣單元的個(gè)數(shù)W:知識(shí)層^的空間方差W:報(bào)告單元包括的總的樣本單元個(gè)數(shù)6.計(jì)算各個(gè)報(bào)告單元的均值和方差,對(duì)每一個(gè)報(bào)告單元,根據(jù)步驟5進(jìn)行計(jì)算得到各個(gè)單 元的均值和方差。對(duì)于全國(guó)耕地面積調(diào)查,如果以省為單元匯報(bào)各個(gè)省的耕地面積,則在全國(guó) 每個(gè)省份都按照步驟5計(jì)算均值和方差。
權(quán)利要求
1、高效能空間抽樣調(diào)查三明治模型方法,其特征在于包括以下步驟(1)根據(jù)抽樣目標(biāo)的復(fù)雜程度和抽樣基本對(duì)象的大小,設(shè)定抽樣分辨率;通過抽樣分辨率將連續(xù)的空間離散化,形成格網(wǎng)單元,即抽樣框;(2)則對(duì)所述的抽樣框進(jìn)行分層,構(gòu)成不同的次級(jí)抽樣框,所有次級(jí)抽樣框構(gòu)成的總體稱為知識(shí)層;樣本按照隨機(jī)方法布置在這樣的次級(jí)抽樣框中;(3)計(jì)算抽樣框中各個(gè)層的均值和方差;(4)根據(jù)每個(gè)報(bào)告單元所包含的不同分層對(duì)報(bào)告單元貢獻(xiàn)的權(quán)重,計(jì)算每個(gè)報(bào)告單元的均值和方差,從而完成從知識(shí)層到報(bào)告層的信息傳遞。
2、 根據(jù)權(quán)利要求1所述的高效能空間抽樣調(diào)査三明治模型建模方法,其特征在于所述的 步驟(2)中根據(jù)層內(nèi)方差小層間方差大的原則對(duì)所述的抽樣框進(jìn)行分層。
3、 根據(jù)權(quán)利要求l所述的高效能空間抽樣調(diào)査三明治模型建模方法,其特征在于所述的 步驟(3)中按照如下方式計(jì)算均值和方差-<formula>formula see original document page 2</formula>在A層內(nèi)調(diào)查單元/的調(diào)查值 A層均值 力層樣本個(gè)數(shù) A層均值算術(shù)方差然后根據(jù)空間相關(guān)性理論,計(jì)算空間方差<formula>formula see original document page 2</formula>(T2 :是考慮了空間相關(guān)性以后得到的空間方差,五[r(a-ci')]:度量了層內(nèi)的空間相關(guān)性,凡表示層內(nèi)樣本值, 7:表示層內(nèi)均值。
4、根據(jù)權(quán)利要求l所述的高效能空間抽樣調(diào)査三明治模型建模方法,其特征在于所述的 步驟(4)中按照如下方式計(jì)算各個(gè)層的權(quán)重、報(bào)告單元的均值和方差第A層在報(bào)告單元中的權(quán)重,第/2層被報(bào)告單元中包含的基本抽樣單元的個(gè)數(shù),W:報(bào)告單元總的基本抽樣單元的個(gè)數(shù)。 然后計(jì)算報(bào)告單元的均值和方差<formula>formula see original document page 3</formula>打A F:報(bào)告單元的均值^ :表示知識(shí)層中計(jì)算得到第h層均值W':知識(shí)層i所占報(bào)告單元的權(quán)重報(bào)告單元的方差 WA:知識(shí)層中第/ 層被報(bào)告單元包含的抽中的樣本數(shù)^、第^層被報(bào)告單元中包含的基本抽樣單元的個(gè)數(shù)知識(shí)層^的空間方差 W:報(bào)告單元包括的總的樣本單元個(gè)數(shù)。
全文摘要
高效能空間抽樣調(diào)查三明治模型方法,基于抽樣域的自然屬性分層布置樣本,根據(jù)分層原理和方差傳遞原理,結(jié)果根據(jù)報(bào)告單元表達(dá),不受自然分層的限制,具體實(shí)現(xiàn)為首先對(duì)抽樣域進(jìn)行離散化,構(gòu)造一個(gè)抽樣框;然后根據(jù)層內(nèi)方差小層間方差大的原則對(duì)抽樣框分層,構(gòu)成不同的次級(jí)抽樣框,所有次級(jí)抽樣框構(gòu)成的總體稱為知識(shí)層,樣本布置在這樣的次級(jí)抽樣框中;計(jì)算每個(gè)層內(nèi)樣本調(diào)查值,得到層的均值和方差;根據(jù)知識(shí)分層對(duì)報(bào)告單元的貢獻(xiàn),將知識(shí)層得到的方差和均值,按照誤差和均值傳遞方法,算到不同的報(bào)告層上。本發(fā)明克服了按照?qǐng)?bào)告單元布置樣本導(dǎo)致的效率過低和單一根據(jù)知識(shí)分層布置樣點(diǎn)無法在報(bào)道單元表達(dá)的難題??捎糜诖笠?guī)模的自然資源,環(huán)境監(jiān)測(cè),經(jīng)濟(jì)人口調(diào)查等多個(gè)領(lǐng)域。
文檔編號(hào)G06F19/00GK101271495SQ20081010428
公開日2008年9月24日 申請(qǐng)日期2008年4月17日 優(yōu)先權(quán)日2008年4月17日
發(fā)明者劉紀(jì)遠(yuǎn), 姜成晟, 莊大方, 李連發(fā), 王勁峰, 詠 葛 申請(qǐng)人:中國(guó)科學(xué)院地理科學(xué)與資源研究所