基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法
【專利摘要】基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法,屬于光譜數(shù)據(jù)分類【技術(shù)領(lǐng)域】。本發(fā)明為了解決現(xiàn)有高光譜數(shù)據(jù)的分類方法從光譜維的角度對(duì)數(shù)據(jù)進(jìn)行分類,數(shù)據(jù)分類精度低的問(wèn)題。它首先讀取高光譜遙感數(shù)據(jù),獲得高光譜遙感數(shù)據(jù)的光譜特征和空間特征;將光譜特征與空間特征整合為多特征集合;由多特征集合確定標(biāo)記樣本并選擇訓(xùn)練樣本和測(cè)試樣本;基于集成學(xué)習(xí)方法,設(shè)計(jì)特征差異的Adaboost集成分類框架,并使用訓(xùn)練樣本訓(xùn)練獲得F個(gè)弱分類器;使用F個(gè)弱分類器對(duì)測(cè)試樣本進(jìn)行分類。本發(fā)明用于高光譜遙感數(shù)據(jù)的分類。
【專利說(shuō)明】基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法,屬于光譜數(shù)據(jù)分類【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002]隨著遙感技術(shù)的發(fā)展和成像設(shè)備的日益改進(jìn),高光譜遙感成為了光學(xué)遙感中的一個(gè)新的階段。高光譜遙感能在電磁波譜的紫外、可見(jiàn)光、近紅外和中紅外區(qū)域獲取許多非常窄而且光譜連續(xù)的圖像數(shù)據(jù)。這使得人們通過(guò)遙感技術(shù)觀測(cè)和偵察地表地物的能力有了一個(gè)新的飛躍。在高光譜數(shù)據(jù)中,同時(shí)包含了地物的空間結(jié)構(gòu)以及光譜特性信息,這使得對(duì)地物的識(shí)別和分類能力都有了很大的提升。但是高光譜遙感的海量數(shù)據(jù)、高維度、小樣本以及存在噪聲和奇異值等特點(diǎn)為高光譜圖像地物分類在實(shí)際應(yīng)用中帶來(lái)了極大的困難。因此,對(duì)于高光譜數(shù)據(jù)分類方法的研究有著深刻而長(zhǎng)遠(yuǎn)的意義。
[0003]傳統(tǒng)的單一分類器對(duì)于高光譜數(shù)據(jù)的高維度以及噪聲和異常值較為敏感。此外,其分類算法大多是從光譜維的角度對(duì)高光譜數(shù)據(jù)進(jìn)行處理的,沒(méi)有結(jié)合圖像這個(gè)最直觀的空間信息。
【發(fā)明內(nèi)容】
[0004]本發(fā)明目的是為了解決現(xiàn)有高光譜數(shù)據(jù)的分類方法從光譜維的角度對(duì)數(shù)據(jù)進(jìn)行分類,數(shù)據(jù)分類精度低的問(wèn)題,提供了一種基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法。
[0005]本發(fā)明所述基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法,它包括以下步驟:
[0006]步驟一:讀取高光譜遙感數(shù)據(jù),采用主成分分析法計(jì)算獲得高光譜遙感數(shù)據(jù)的特征值和特征向量,進(jìn)而獲得高光譜遙感數(shù)據(jù)的光譜特征;再運(yùn)用灰度共生矩陣由特征向量提取獲得高光譜遙感數(shù)據(jù)的空間特征;
[0007]步驟二:將光譜特征與空間特征整合為多特征集合;
[0008]步驟三:由多特征集合確定標(biāo)記樣本并選擇訓(xùn)練樣本和測(cè)試樣本;
[0009]步驟四:基于集成學(xué)習(xí)方法,設(shè)計(jì)特征差異的Adaboost集成分類框架,并使用訓(xùn)練樣本訓(xùn)練獲得F個(gè)弱分類器;
[0010]步驟五:使用F個(gè)弱分類器對(duì)測(cè)試樣本進(jìn)行分類。
[0011]高光譜遙感數(shù)據(jù)的光譜特征的獲得方法為:
[0012]首先計(jì)算出高光譜遙感數(shù)據(jù)的協(xié)方差矩陣,根據(jù)協(xié)方差矩陣采用主成分分析法求出所有數(shù)據(jù)的特征值和特征向量,并按照特征值從大到小的順序,排列相應(yīng)的特征向量,并使用特征向量作為加權(quán)系數(shù)計(jì)算獲得B個(gè)主成分分量,B為正整數(shù);選取排列在前的N個(gè)主成分分量作為高光譜遙感數(shù)據(jù)的光譜特征,N為B/2取整后的數(shù)值;
[0013]高光譜遙感數(shù)據(jù)的空間特征的獲得方法為:將N個(gè)主成分分量中每一個(gè)主成分分量作為一幅二維灰度圖像;對(duì)每幅二維灰度圖像進(jìn)行處理獲得空間特征的具體方法為:
[0014]選定一幅二維灰度圖像b的wX w的區(qū)域窗口,設(shè)定該二維灰度圖像的灰度值級(jí)數(shù)為K,在所述區(qū)域窗口內(nèi)任取兩個(gè)特定灰度值(gp,gq), P = 1,2,3……,K,q = 1,2,3……,K;再取連線角度為Θ,相距距離為d的兩點(diǎn),使該兩點(diǎn)遍歷整個(gè)區(qū)域窗口,計(jì)算該兩點(diǎn)遍歷過(guò)程中,對(duì)應(yīng)出現(xiàn)特定灰度值(gp,gq)的頻率,再將該頻率歸一化為出現(xiàn)的概率P(gp,g,),所有(gP,gq)的組合對(duì)應(yīng)獲得的概率P(gp,gq)形成KXK方陣,該KXK方陣作為二維灰度圖像b的灰度共生矩陣;以度量m作為灰度共生矩陣紋理的描述,獲得函數(shù)faa((b,w,d, 0,m),將wXw的區(qū)域窗口在整幅二維灰度圖像上以每一個(gè)像素點(diǎn)為中心滑動(dòng),得到由函數(shù)fGLci(b,w, d, 0,m)的值構(gòu)成的二維圖像,該二維圖像作為高光譜遙感數(shù)據(jù)的空間特征。
[0015]步驟二中多特征集合的獲得方法為:
[0016]在I到N中隨機(jī)的選擇D個(gè)數(shù)字編號(hào),D〈N,在光譜特征與空間特征中按照D個(gè)數(shù)字編號(hào)抽取對(duì)應(yīng)的一維光譜特征和二維空間特征數(shù)據(jù),形成一個(gè)三維矩陣表示的多特征集合;重復(fù)此過(guò)程F-1次,獲得F個(gè)多特征集合。
[0017]所述D的取值范圍為20-30。
[0018]選擇訓(xùn)練樣本和測(cè)試樣本的具體方法為:
[0019]將高光譜遙感數(shù)據(jù)中各像素點(diǎn)空間位置對(duì)應(yīng)的真實(shí)地物標(biāo)記圖表達(dá)為二維矩陣,該二維矩陣作為監(jiān)督數(shù)據(jù),監(jiān)督數(shù)據(jù)以整數(shù)值的形式標(biāo)記真實(shí)地物標(biāo)記圖中相應(yīng)像素點(diǎn)的地物類別,使具有同一地物類別的像素點(diǎn)具有相同的標(biāo)記整數(shù)值,所有標(biāo)記整數(shù)值形成標(biāo)記樣本;
[0020]讀入多特征集合&江=1,2,一,F(xiàn))以及監(jiān)督數(shù)據(jù),確定真實(shí)地物標(biāo)記圖中地物類別數(shù)目C以及有效的特征數(shù)目2D ;
[0021]在監(jiān)督數(shù)據(jù)中,查找所有標(biāo)記樣本的空間位置坐標(biāo),按照空間位置坐標(biāo)在高光譜遙感數(shù)據(jù)中從上向下,并且從左向右的順序,抽取每一個(gè)多特征集合Sf (f = 1,2, - ,F)中數(shù)據(jù)的多特征向量,將所有抽取的多特征向量排列成行向量,形成二維矩陣,該二維矩陣的行數(shù)是高光譜數(shù)據(jù)標(biāo)記樣本的個(gè)數(shù),列數(shù)是每個(gè)像素的特征數(shù)目2D,將二維矩陣中奇數(shù)行作為訓(xùn)練樣本的多特征向量,偶數(shù)行作為測(cè)試樣本的多特征向量;
[0022]對(duì)標(biāo)記樣本的地物類別標(biāo)號(hào),在監(jiān)督數(shù)據(jù)中從上向下,并且從左向右抽取數(shù)值,排列形成列向量,該列向量中元素的個(gè)數(shù)為標(biāo)記樣本的個(gè)數(shù),每一個(gè)元素的數(shù)值為一個(gè)標(biāo)記樣本的類別標(biāo)號(hào),第奇數(shù)個(gè)元素作為訓(xùn)練樣本的類別標(biāo)號(hào);第偶數(shù)個(gè)元素作為測(cè)試樣本的類別標(biāo)號(hào)。
[0023]獲得F個(gè)弱分類器的具體方法為:
[0024]選擇支持向量機(jī)作為Adaboost集成框架的弱分類器f(f = 1,2,…,F),首先為每個(gè)訓(xùn)練樣本賦予相同的權(quán)值;然后通過(guò)弱分類器I在多特征集合I上對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練和測(cè)試,對(duì)于其中被錯(cuò)分的樣本提高其權(quán)重,對(duì)正確判決的樣本降低其權(quán)重;最后根據(jù)權(quán)重調(diào)整后的訓(xùn)練樣本集在多特征集合2上訓(xùn)練下一輪弱分類器2,此過(guò)程反復(fù)迭代F次得到側(cè)重于不同訓(xùn)練樣本的F個(gè)弱分類器。
[0025]對(duì)測(cè)試樣本進(jìn)行分類的具體方法為:
[0026]使用F個(gè)弱分類器對(duì)測(cè)試樣本分類,對(duì)每個(gè)測(cè)試樣本的空間位置坐標(biāo)獲得F個(gè)分類結(jié)果,對(duì)每個(gè)測(cè)試樣本的分類結(jié)果由F個(gè)弱分類器進(jìn)行類別投票,得票最多的類別作為對(duì)應(yīng)測(cè)試樣本的最終分類,從而完成了高光譜數(shù)據(jù)的分類。
[0027]本發(fā)明的優(yōu)點(diǎn):本發(fā)明針對(duì)高光譜數(shù)據(jù)的高維度和空譜信息合二為一的數(shù)據(jù)特性,提出了基于集成學(xué)習(xí)的高光譜數(shù)據(jù)的分類方法,有效地減少了樣本數(shù)目少以及噪聲和奇異值對(duì)高光譜數(shù)據(jù)分類精度的影響,該方法能夠獲得較高的分類精度,更好的服務(wù)于后續(xù)的圖像處理應(yīng)用。它針對(duì)高光譜數(shù)據(jù)的內(nèi)在特性,對(duì)高光譜數(shù)據(jù)進(jìn)行光譜維和空間維的特征提取,建立了一種擁有理論根據(jù)和實(shí)際應(yīng)用價(jià)值的數(shù)據(jù)分類算法。
[0028]空間信息作為圖像分類的重要依據(jù)將有效的提升數(shù)據(jù)的分類效果。本發(fā)明充分利用了高光譜圖像的空譜信息,利用集成學(xué)習(xí)的方法,對(duì)高光譜數(shù)據(jù)的進(jìn)行分類,數(shù)據(jù)分類精度高。
【專利附圖】
【附圖說(shuō)明】
[0029]圖1是本發(fā)明所述基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法的流程框圖。
【具體實(shí)施方式】
[0030]【具體實(shí)施方式】一:下面結(jié)合圖1說(shuō)明本實(shí)施方式,本實(shí)施方式所述基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法,它包括以下步驟:
[0031]步驟一:讀取高光譜遙感數(shù)據(jù),采用主成分分析法計(jì)算獲得高光譜遙感數(shù)據(jù)的特征值和特征向量,進(jìn)而獲得高光譜遙感數(shù)據(jù)的光譜特征;再運(yùn)用灰度共生矩陣由特征向量提取獲得高光譜遙感數(shù)據(jù)的空間特征;
[0032]步驟二:將光譜特征與空間特征整合為多特征集合; [0033]步驟三:由多特征集合確定標(biāo)記樣本并選擇訓(xùn)練樣本和測(cè)試樣本;
[0034]步驟四:基于集成學(xué)習(xí)方法,設(shè)計(jì)特征差異的Adaboost集成分類框架,并使用訓(xùn)練樣本訓(xùn)練獲得F個(gè)弱分類器;
[0035]步驟五:使用F個(gè)弱分類器對(duì)測(cè)試樣本進(jìn)行分類。
[0036]本實(shí)施方式中,高光譜遙感數(shù)據(jù)的特征提取是在原始數(shù)據(jù)的基礎(chǔ)上進(jìn)行的。
[0037]【具體實(shí)施方式】二:本實(shí)施方式對(duì)實(shí)施方式一作進(jìn)一步說(shuō)明,本實(shí)施方式所述高光譜遙感數(shù)據(jù)的光譜特征的獲得方法為:
[0038]首先計(jì)算出高光譜遙感數(shù)據(jù)的協(xié)方差矩陣,根據(jù)協(xié)方差矩陣采用主成分分析法求出所有數(shù)據(jù)的特征值和特征向量,并按照特征值從大到小的順序,排列相應(yīng)的特征向量,并使用特征向量作為加權(quán)系數(shù)計(jì)算獲得B個(gè)主成分分量,B為正整數(shù);選取排列在前的N個(gè)主成分分量作為高光譜遙感數(shù)據(jù)的光譜特征,N為B/2取整后的數(shù)值;
[0039]高光譜遙感數(shù)據(jù)的空間特征的獲得方法為:將N個(gè)主成分分量中每一個(gè)主成分分量作為一幅二維灰度圖像;對(duì)每幅二維灰度圖像進(jìn)行處理獲得空間特征的具體方法為:
[0040]選定一幅二維灰度圖像b的wX w的區(qū)域窗口,設(shè)定該二維灰度圖像的灰度值級(jí)數(shù)為K,在所述區(qū)域窗口內(nèi)任取兩個(gè)特定灰度值(gp,gq), P = 1,2,3……,K,q = 1,2,3……,K;再取連線角度為Θ,相距距離為d的兩點(diǎn),使該兩點(diǎn)遍歷整個(gè)區(qū)域窗口,計(jì)算該兩點(diǎn)遍歷過(guò)程中,對(duì)應(yīng)出現(xiàn)特定灰度值(gp,gq)的頻率,再將該頻率歸一化為出現(xiàn)的概率P(gp,g,),所有(gP,gq)的組合對(duì)應(yīng)獲得的概率P(gp,gq)形成KXK方陣,該KXK方陣作為二維灰度圖像b的灰度共生矩陣;以度量m作為灰度共生矩陣紋理的描述,獲得函數(shù)faa((b,w,d, 0,m),將wXw的區(qū)域窗口在整幅二維灰度圖像上以每一個(gè)像素點(diǎn)為中心滑動(dòng),得到由函數(shù)fGLci(b,w, d, 0,m)的值構(gòu)成的二維圖像,該二維圖像作為高光譜遙感數(shù)據(jù)的空間特征。[0041]本實(shí)施方式中對(duì)于光譜維上的特征提取方式選擇主成分分析法,其原理是通過(guò)較少的分量來(lái)反映原始數(shù)據(jù)中的大部分特性,將原始數(shù)據(jù)中相關(guān)性較高的分量轉(zhuǎn)換為彼此間不相關(guān)的新分量,新分量稱之為主成分。排列越前的主成分分量包含越多的信息。
[0042]對(duì)于空間信息的提取是在光譜特征向量的基礎(chǔ)上完成的。每一個(gè)得到的主成分分量可以作為一幅二維灰度圖像,分別計(jì)算N個(gè)二維圖像的灰度共生矩陣,作為數(shù)據(jù)的空間特征?;叶裙采仃嚲褪且环N通過(guò)計(jì)算圖像空間相關(guān)性來(lái)描述紋理的方法。相關(guān)出現(xiàn)概率是每個(gè)灰度值對(duì)出現(xiàn)的次數(shù)除以所有可能的灰度級(jí)對(duì)出現(xiàn)的次數(shù)。所述區(qū)域窗口所有灰度級(jí)對(duì)出現(xiàn)概率的矩陣就是灰度共生矩陣,可以通過(guò)對(duì)每個(gè)矩陣的計(jì)算來(lái)建立一個(gè)度量m作為紋理的描述。常用的度量方式有對(duì)比度、逆差陣、熵及自相關(guān)等。使用灰度共生矩陣來(lái)描述圖像紋理的生成方法可以描述為函數(shù)facM(b,w,d,0,m)。依次計(jì)算N個(gè)主成分分量的灰度共生矩陣,N個(gè)個(gè)二維圖像作為空間特征。
[0043]對(duì)于兩個(gè)特定灰度值(gp,gq),其組合共有KXK種。角度Θ通常分為四個(gè)方向冰平為O度、豎直為90度、右對(duì)角線為45度、左對(duì)角線為135度。例如兩點(diǎn)(X,y)和(x+1, y),其角度Θ為0,距離d為1,計(jì)算將該兩點(diǎn)遍歷整個(gè)區(qū)域窗口過(guò)程中同時(shí)出現(xiàn)&和&的頻率,不同的(gp,gq)組合獲得的頻率值將形成一個(gè)KXK的方陣,用(gl,g2)出現(xiàn)的總次數(shù)將頻率值方陣歸一化為出現(xiàn)的概率P (gl,g2),獲得灰度共生矩陣。
[0044]【具體實(shí)施方式】三:本實(shí)施方式對(duì)實(shí)施方式二作進(jìn)一步說(shuō)明,本實(shí)施方式所述步驟二中多特征集合的獲得方法為:
[0045]在I到N中隨機(jī)的選擇D個(gè)數(shù)字編號(hào),D〈N,在光譜特征與空間特征中按照D個(gè)數(shù)字編號(hào)抽取對(duì)應(yīng)的一維光譜特征和二維空間特征數(shù)據(jù),形成一個(gè)三維矩陣表示的多特征集合;重復(fù)此過(guò)程F-1次,獲得F個(gè)多特征集合。
[0046]將光譜特征與空間特征整合為多特征集合。如圖1中所示,為便于后續(xù)的集成分類,需要形成F個(gè)多特征集合。多特征集合包含有光譜特征和空間特征。D個(gè)數(shù)字編號(hào)表示為 W1, d2,…,dD}。
[0047]【具體實(shí)施方式】四:本實(shí)施方式對(duì)實(shí)施方式三作進(jìn)一步說(shuō)明,本實(shí)施方式所述D的取值范圍為20-30。
[0048]實(shí)驗(yàn)表明,當(dāng)D約為20-30左右時(shí),分類所取得的效果較好。
[0049]【具體實(shí)施方式】五:本實(shí)施方式對(duì)實(shí)施方式四作進(jìn)一步說(shuō)明,本實(shí)施方式所述選擇訓(xùn)練樣本和測(cè)試樣本的具體方法為:
[0050]將高光譜遙感數(shù)據(jù)中各像素點(diǎn)空間位置對(duì)應(yīng)的真實(shí)地物標(biāo)記圖表達(dá)為二維矩陣,該二維矩陣作為監(jiān)督數(shù)據(jù),監(jiān)督數(shù)據(jù)以整數(shù)值的形式標(biāo)記真實(shí)地物標(biāo)記圖中相應(yīng)像素點(diǎn)的地物類別,使具有同一地物類別的像素點(diǎn)具有相同的標(biāo)記整數(shù)值,所有標(biāo)記整數(shù)值形成標(biāo)記樣本;
[0051]讀入多特征集合&江=1,2,一,F(xiàn))以及監(jiān)督數(shù)據(jù),確定真實(shí)地物標(biāo)記圖中地物類別數(shù)目C以及有效的特征數(shù)目2D ;
[0052]在監(jiān)督數(shù)據(jù)中,查找所有標(biāo)記樣本的空間位置坐標(biāo),按照空間位置坐標(biāo)在高光譜遙感數(shù)據(jù)中從上向下,并且從左向右的順序,抽取每一個(gè)多特征集合Sf (f = 1,2, - ,F)中數(shù)據(jù)的多特征向量,將所有抽取的多特征向量排列成行向量,形成二維矩陣,該二維矩陣的行數(shù)是高光譜數(shù)據(jù)標(biāo)記樣本的個(gè)數(shù),列數(shù)是每個(gè)像素的特征數(shù)目2D,將二維矩陣中奇數(shù)行作為訓(xùn)練樣本的多特征向量,偶數(shù)行作為測(cè)試樣本的多特征向量;
[0053]對(duì)標(biāo)記樣本的地物類別標(biāo)號(hào),在監(jiān)督數(shù)據(jù)中從上向下,并且從左向右抽取數(shù)值,排列形成列向量,該列向量中元素的個(gè)數(shù)為標(biāo)記樣本的個(gè)數(shù),每一個(gè)元素的數(shù)值為一個(gè)標(biāo)記樣本的類別標(biāo)號(hào),第奇數(shù)個(gè)元素作為訓(xùn)練樣本的類別標(biāo)號(hào);第偶數(shù)個(gè)元素作為測(cè)試樣本的類別標(biāo)號(hào)。
[0054]本實(shí)施方式中,對(duì)于特征提取后的高光譜數(shù)據(jù)的任意一個(gè)多特征集合Sf(f =1,2,…,F(xiàn)),是以三維矩陣的形式存儲(chǔ)。監(jiān)督數(shù)據(jù)中,同一類別的像素點(diǎn)擁有相同的數(shù)值。根據(jù)監(jiān)督數(shù)據(jù)得到的標(biāo)記樣本,用來(lái)訓(xùn)練和測(cè)試分類方法。
[0055]高光譜數(shù)據(jù)中同一空間位置的不同光譜位置形成的向量稱為像素向量。同樣,對(duì)于多特征集合Sf中同一空間位置的不同特征形成的向量稱為多特征向量。在監(jiān)督數(shù)據(jù)中找到圖像中所有標(biāo)記樣本的空間位置坐標(biāo)Ui, yi),按照位置坐標(biāo)在高光譜數(shù)據(jù)中從上向下,從左向右抽取多特征集合Sf的多特征向量。所有抽取的多特征向量形成的二維矩陣中每一行為一個(gè)標(biāo)記樣本的多特征向量,其訓(xùn)練樣本與測(cè)試樣本數(shù)目之比為1:1。標(biāo)記樣本的像素向量與類別標(biāo)號(hào)具有對(duì)應(yīng)的關(guān)系。
[0056]對(duì)于F個(gè)多特征集合,重復(fù)上述過(guò)程,多特征集合Sf中的訓(xùn)練樣本trainfi和測(cè)試樣本testfj,將具有與其他多特征集合相同空間位置坐標(biāo)(Xi,yi)和(Xj,yj),但不同多特征向量。
[0057]【具體實(shí)施方式】六:本實(shí)施方式對(duì)實(shí)施方式五作進(jìn)一步說(shuō)明,本實(shí)施方式所述獲得F個(gè)弱分類器的具體方法 為:
[0058]選擇支持向量機(jī)作為Adaboost集成框架的弱分類器f(f = 1,2,…,F),首先為每個(gè)訓(xùn)練樣本賦予相同的權(quán)值;然后通過(guò)弱分類器I在多特征集合I上對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練和測(cè)試,對(duì)于其中被錯(cuò)分的樣本提高其權(quán)重,對(duì)正確判決的樣本降低其權(quán)重;最后根據(jù)權(quán)重調(diào)整后的訓(xùn)練樣本集在多特征集合2上訓(xùn)練下一輪弱分類器2,此過(guò)程反復(fù)迭代F次得到側(cè)重于不同訓(xùn)練樣本的F個(gè)弱分類器。
[0059]使用集成學(xué)習(xí)的方法對(duì)特征特取后的高光譜數(shù)據(jù)進(jìn)行分類,包括設(shè)計(jì)并使用訓(xùn)練樣本訓(xùn)練特征差異的Adaboost集成框架以及對(duì)測(cè)試樣本進(jìn)行分類。依據(jù)Adaboost的集成方法,弱分類器在F個(gè)多特征集合上進(jìn)行迭代,也就是分類器f(f = 1,2,一,F(xiàn))在多特征集合Sf上訓(xùn)練。
[0060]【具體實(shí)施方式】七:本實(shí)施方式對(duì)實(shí)施方式六作進(jìn)一步說(shuō)明,本實(shí)施方式所述對(duì)測(cè)試樣本進(jìn)行分類的具體方法為:
[0061]使用F個(gè)弱分類器對(duì)測(cè)試樣本分類,對(duì)每個(gè)測(cè)試樣本的空間位置坐標(biāo)獲得F個(gè)分類結(jié)果,對(duì)每個(gè)測(cè)試樣本的分類結(jié)果由F個(gè)弱分類器進(jìn)行類別投票,得票最多的類別作為對(duì)應(yīng)測(cè)試樣本的最終分類,從而完成了高光譜數(shù)據(jù)的分類。
[0062]本實(shí)施方式中,使用Adaboost集成框架的F個(gè)弱分類器對(duì)測(cè)試樣本分類,對(duì)于每一個(gè)空間位置坐標(biāo)(Xi,yi)將有F個(gè)分類結(jié)果,最終的類別由多數(shù)投票的方式確定。多數(shù)投票法的基本思想:集成框架中的多個(gè)弱分類器都進(jìn)行分類預(yù)測(cè)并給出各自的分類結(jié)果,然后根據(jù)分類結(jié)果用投票的原則進(jìn)行投票表決,采用少數(shù)服從多數(shù)。對(duì)于每一個(gè)測(cè)試樣本,讓F個(gè)弱分類器進(jìn)行類別投票,得票數(shù)最多的那個(gè)類別作為對(duì)應(yīng)樣本的最終分類。從而完成了高光譜數(shù)據(jù)的分類工作。根據(jù)得到的分類類別與測(cè)試樣本的類別標(biāo)號(hào)對(duì)比,計(jì)算整體分類精度可用來(lái)定量的評(píng)價(jià)分類方法。
【權(quán)利要求】
1.一種基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法,其特征在于,它包括以下步驟: 步驟一:讀取高光譜遙感數(shù)據(jù),采用主成分分析法計(jì)算獲得高光譜遙感數(shù)據(jù)的特征值和特征向量,進(jìn)而獲得高光譜遙感數(shù)據(jù)的光譜特征;再運(yùn)用灰度共生矩陣由特征向量提取獲得高光譜遙感數(shù)據(jù)的空間特征; 步驟二:將光譜特征與空間特征整合為多特征集合; 步驟三:由多特征集合確定標(biāo)記樣本并選擇訓(xùn)練樣本和測(cè)試樣本; 步驟四:基于集成學(xué)習(xí)方法,設(shè)計(jì)特征差異的Adaboost集成分類框架,并使用訓(xùn)練樣本訓(xùn)練獲得F個(gè)弱分類器; 步驟五:使用F個(gè)弱分類器對(duì)測(cè)試樣本進(jìn)行分類。
2.根據(jù)權(quán)利要求1所述的基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法,其特征在于,高光譜遙感數(shù)據(jù)的光譜特征的獲得方法為: 首先計(jì)算出高光譜遙感數(shù)據(jù)的協(xié)方差矩陣,根據(jù)協(xié)方差矩陣采用主成分分析法求出所有數(shù)據(jù)的特征值和特征向量,并按照特征值從大到小的順序,排列相應(yīng)的特征向量,并使用特征向量作為加權(quán)系數(shù)計(jì)算獲得B個(gè)主成分分量,B為正整數(shù);選取排列在前的N個(gè)主成分分量作為高光譜遙感數(shù)據(jù)的光譜特征,N為B/2取整后的數(shù)值; 高光譜遙感數(shù)據(jù)的空間特征的獲得方法為:將N個(gè)主成分分量中每一個(gè)主成分分量作為一幅二維灰度圖像;對(duì)每幅二維灰度圖像進(jìn)行處理獲得空間特征的具體方法為: 選定一幅二維灰度圖像b的wX w的區(qū)域窗口,設(shè)定該二維灰度圖像的灰度值級(jí)數(shù)為K,在所述區(qū)域窗口內(nèi)任取兩個(gè)特定灰度值(gp,gq), P = 1,2,3……,K,q = 1,2,3……,K ;再取連線角度為Θ,相距距離為d的兩點(diǎn),使該兩點(diǎn)遍歷整個(gè)區(qū)域窗口,計(jì)算該兩點(diǎn)遍歷過(guò)程中,對(duì)應(yīng)出現(xiàn)特定灰度值(gp,gq)的頻率,再將該頻率歸一化為出現(xiàn)的概率P (gp,gq),所有(gp, gq)的組合對(duì)應(yīng)獲得的概率P(gp,gq)形成KXK方陣,該KXK方陣作為二維灰度圖像b的灰度共生矩陣;以度量m作為灰度共生矩陣紋理的描述,獲得函數(shù)faa((b,w,d, 0,m),將wXw的區(qū)域窗口在整幅二維灰度圖像上以每一個(gè)像素點(diǎn)為中心滑動(dòng),得到由函數(shù)fGLci(b,w, d, 0,m)的值構(gòu)成的二維圖像,該二維圖像作為高光譜遙感數(shù)據(jù)的空間特征。
3.根據(jù)權(quán)利要求2所述的基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法,其特征在于,步驟二中多特征集合的獲得方法為: 在I到N中隨機(jī)的選擇D個(gè)數(shù)字編號(hào),D〈N,在光譜特征與空間特征中按照D個(gè)數(shù)字編號(hào)抽取對(duì)應(yīng)的一維光譜特征和二維空間特征數(shù)據(jù),形成一個(gè)三維矩陣表示的多特征集合;重復(fù)此過(guò)程F-1次,獲得F個(gè)多特征集合。
4.根據(jù)權(quán)利要求3所述的基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法,其特征在于,所述D的取值范圍為20-30。
5.根據(jù)權(quán)利要求4所述的基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法,其特征在于, 選擇訓(xùn)練樣本和測(cè)試樣本的具體方法為: 將高光譜遙感數(shù)據(jù)中各像素點(diǎn)空間位置對(duì)應(yīng)的真實(shí)地物標(biāo)記圖表達(dá)為二維矩陣,該二維矩陣作為監(jiān)督數(shù)據(jù),監(jiān)督數(shù)據(jù)以整數(shù)值的形式標(biāo)記真實(shí)地物標(biāo)記圖中相應(yīng)像素點(diǎn)的地物類別,使具有同一地物類別的像素點(diǎn)具有相同的標(biāo)記整數(shù)值,所有標(biāo)記整數(shù)值形成標(biāo)記樣本; 讀入多特征集合&江=1,2,一,F(xiàn))以及監(jiān)督數(shù)據(jù),確定真實(shí)地物標(biāo)記圖中地物類別數(shù)目C以及有效的特征數(shù)目2D ; 在監(jiān)督數(shù)據(jù)中,查找所有標(biāo)記樣本的空間位置坐標(biāo),按照空間位置坐標(biāo)在高光譜遙感數(shù)據(jù)中從上向下,并且從左向右的順序,抽取每一個(gè)多特征集合Sf (f= 1,2,-,F)中數(shù)據(jù)的多特征向量,將所有抽取的多特征向量排列成行向量,形成二維矩陣,該二維矩陣的行數(shù)是高光譜數(shù)據(jù)標(biāo)記樣本的個(gè)數(shù),列數(shù)是每個(gè)像素的特征數(shù)目2D,將二維矩陣中奇數(shù)行作為訓(xùn)練樣本的多特征向量,偶數(shù)行作為測(cè)試樣本的多特征向量; 對(duì)標(biāo)記樣本的地物類別標(biāo)號(hào),在監(jiān)督數(shù)據(jù)中從上向下,并且從左向右抽取數(shù)值,排列形成列向量,該列向量中元素的個(gè)數(shù)為標(biāo)記樣本的個(gè)數(shù),每一個(gè)元素的數(shù)值為一個(gè)標(biāo)記樣本的類別標(biāo)號(hào),第奇數(shù)個(gè)元素作為訓(xùn)練樣本的類別標(biāo)號(hào);第偶數(shù)個(gè)元素作為測(cè)試樣本的類別標(biāo)號(hào)。
6.根據(jù)權(quán)利要求5所述的基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法,其特征在于,獲得F個(gè)弱分類器的具體方法為: 選擇支持向量機(jī)作為Adaboost集成框架的弱分類器f(f = 1,2,---,F),首先為每個(gè)訓(xùn)練樣本賦予相同的權(quán)值;然后通過(guò)弱分類器I在多特征集合I上對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練和測(cè)試,對(duì)于其中被錯(cuò)分的樣本提高其權(quán)重,對(duì)正確判決的樣本降低其權(quán)重;最后根據(jù)權(quán)重調(diào)整后的訓(xùn)練樣本集在多特征集合2上訓(xùn)練下一輪弱分類器2,此過(guò)程反復(fù)迭代F次得到側(cè)重于不同訓(xùn)練樣本的F個(gè)弱分類器。
7.根據(jù)權(quán)利要求6所述的基于集成學(xué)習(xí)的高光譜遙感數(shù)據(jù)分類方法,其特征在于,對(duì)測(cè)試樣本進(jìn)行分類的具體方法為: 使用F個(gè)弱分類器對(duì)測(cè)試樣本分類,對(duì)每個(gè)測(cè)試樣本的空間位置坐標(biāo)獲得F個(gè)分類結(jié)果,對(duì)每個(gè)測(cè)試樣本的分類結(jié)果由F個(gè)弱分類器進(jìn)行類別投票,得票最多的類別作為對(duì)應(yīng)測(cè)試樣本的最終分類,從而完成了高光譜數(shù)據(jù)的分類。
【文檔編號(hào)】G06K9/66GK104021396SQ201410283594
【公開(kāi)日】2014年9月3日 申請(qǐng)日期:2014年6月23日 優(yōu)先權(quán)日:2014年6月23日
【發(fā)明者】陳雨時(shí), 趙興, 王強(qiáng), 劉思宇 申請(qǐng)人:哈爾濱工業(yè)大學(xué)