本發(fā)明屬于雷達(dá)技術(shù)領(lǐng)域,涉及一種雷達(dá)目標(biāo)識別方法,具體涉及一種無限最大間隔線性判別投影模型的雷達(dá)的目標(biāo)識別方法,可用于對雷達(dá)高分辨距離像進(jìn)行檢測識別。
背景技術(shù):
雷達(dá)目標(biāo)識別是雷達(dá)采用的一種技術(shù)手段,用來辨認(rèn)其搜索體積內(nèi)已被發(fā)現(xiàn)的目標(biāo),其原理就是利用目標(biāo)的雷達(dá)回波信號,實(shí)現(xiàn)對目標(biāo)類型的判定。寬帶雷達(dá)通常工作在光學(xué)區(qū),此時雷達(dá)目標(biāo)可以看作是由大量強(qiáng)度不同的散射點(diǎn)構(gòu)成,高分辨距離像hrrp是用寬帶雷達(dá)信號獲取目標(biāo)體上各散射點(diǎn)回波信號的矢量和。它反映了目標(biāo)體上散射點(diǎn)沿雷達(dá)視線的分布情況,包含了目標(biāo)重要的結(jié)構(gòu)信息,比如目標(biāo)尺寸、散射點(diǎn)結(jié)構(gòu)等。因此在二十世紀(jì)末,一些學(xué)者提出了利用hrrp完成雷達(dá)目標(biāo)自動識別的技術(shù),見[s.p.jacobs.automatictargetrecognitionusinghigh-resolutionradarrangeprofiles.phddissertation,washingtonuniv.,st.louis,mo,1999].進(jìn)入二十一世紀(jì)后,這一技術(shù)在雷達(dá)領(lǐng)域引起了人們的廣泛關(guān)注。
在高頻區(qū)時,散射中心模型描述了目標(biāo)電磁散射特性。根據(jù)該模型,當(dāng)目標(biāo)姿態(tài)有較大變化時,會發(fā)生散射中心距離單元走動mtrc,即部分散射中心會從一個距離單元移動到另一個距離單元,引起目標(biāo)hrrp的劇烈變化;而姿態(tài)發(fā)生較小的變化時,即不出現(xiàn)mtrc。如上所述,hrrp敏感于目標(biāo)姿態(tài),且同一目標(biāo)的hrrp具有多模分布特性,這往往使數(shù)據(jù)在hrrp空間中的分布具有非線性可分性,這影響了常用目標(biāo)識別方法的效果與應(yīng)用。hrrp自動識別方法分為三類:基于模板匹配的方法、基于壓縮感知的方法和基于分類器模型的方法?;谀0迤ヅ涞姆椒ㄊ菑囊褬?biāo)記的訓(xùn)練圖像構(gòu)建一系列參考圖像即模板,將測試圖像與模板分別進(jìn)行匹配,歸到與之最相近的模板所在類別中,由于存儲的模板數(shù)量和維數(shù)一般較大,這種方法復(fù)雜度較高;基于壓縮感知的方法構(gòu)建過完備庫,計(jì)算測試樣本在訓(xùn)練樣本上的稀疏表示,進(jìn)行圖像重構(gòu)并按重構(gòu)誤差最小準(zhǔn)則進(jìn)行分類識別,但該方法的識別率很大程度上會由于hrrp中噪聲或遮擋物的影響而下降;基于分類器模型的方法首先對目標(biāo)區(qū)域切片進(jìn)行特征提取得到訓(xùn)練樣本集和測試樣本集,通過帶有標(biāo)號的訓(xùn)練樣本構(gòu)建分類器模型并進(jìn)行參數(shù)計(jì)算,然后將無標(biāo)號的測試樣本輸入到分類器模型中計(jì)算類別標(biāo)號,完成目標(biāo)識別,基于分類器模型的目標(biāo)識別方法有較好的魯棒性和較高的識別率。
在現(xiàn)有的機(jī)器學(xué)習(xí)理論中,主成分分析(pca)、獨(dú)立成分分析(ica)因子分析(fa)等都是無監(jiān)督的特征提取方法,用這些技術(shù)提取的特征不一定適合后端的分類任務(wù);為了充分利用類別信息,大量監(jiān)督類的特征提取方法提了出來,具有代表性的方法有線性判別分析(lda),lda使樣本經(jīng)過投影后的類間距離最大化,同時最小化類內(nèi)距離,可以有效的提高數(shù)據(jù)的可分性。但是,lda高度依賴數(shù)據(jù)的分布,這就限制了lda的應(yīng)用,針對這一問題,大量學(xué)者提出了不同的解決辦法,其中比較有代表性的有子類判別分析(sda)方法,該方法將原始數(shù)據(jù)劃分為若干子類,對類內(nèi)、類間協(xié)方差矩陣進(jìn)行修正,提升了lda方法的適用范圍,雖然這類方法在一些數(shù)據(jù)集上獲得了良好的效果,但是這類方法均是兩階段特征提取方法,沒有和后端的分類任務(wù)緊密結(jié)合在一起,可能會導(dǎo)致分類性能的損失,為了避免這種損失[b.chen,h.zhang,x.zhanget.al.,max-margindiscriminantprojectionviadataaugmentation[j].ieeetransactionsonknowledgeanddataengineering.2015,27(7):1964-1976]文章提出了mmldp模型,該模型聯(lián)合bayesiansvm,將投影特征作為隱變量svm分類器的輸入,在bayesian模型的框架下,對投影空間和svm分類器進(jìn)行聯(lián)合學(xué)習(xí),有效避免了分階段學(xué)習(xí)帶來的性能損失,提高了目標(biāo)的識別率。
上述方法中,無論是分階段學(xué)習(xí)還是聯(lián)合學(xué)習(xí),它們都存在一個共同的問題:這類方法均屬于全局類特征提取方法,即期望通過一個全局投影矩陣,使樣本在投影空間實(shí)現(xiàn)可分。然而這類方法對于非線性可分的數(shù)據(jù),尤其是對多模分布結(jié)構(gòu)的數(shù)據(jù),由于其忽略了數(shù)據(jù)內(nèi)部隱含的結(jié)構(gòu)信息,全局投影方法可能會帶來分類性能的損失,導(dǎo)致識別率低。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)存在的不足,提出了一種基于無限最大間隔線性判別投影模型的雷達(dá)的目標(biāo)識別方法,用于解決現(xiàn)有雷達(dá)目標(biāo)識別方法中存在的識別率低的技術(shù)問題。
本發(fā)明的技術(shù)思路是:針對多模分布的數(shù)據(jù),將混合專家模型的思想引入到mmldp模型中提出了一種無限最大邊界線性判別投影模型(infinitemax-marginlineardiscriminantprojection,immldp)。具體的說,immldp通過dp(dirichletprocess)混合模型將數(shù)據(jù)集劃分成‘無限’個子集,在每個子集上學(xué)習(xí)一個局部的mmldp分類器,組合各個局部分類器實(shí)現(xiàn)全局的非線性投影和分類。另外,immldp將數(shù)據(jù)集的劃分、投影子空間的學(xué)習(xí)和分類器的學(xué)習(xí)統(tǒng)一在bayesian模型的框架下,通過分類誤差來指導(dǎo)數(shù)據(jù)集的劃分和投影子空間的學(xué)習(xí),較好保證了各個局部區(qū)域的線性可分性。
根據(jù)上述技術(shù)思路,實(shí)現(xiàn)本發(fā)明目的采取的技術(shù)方案包括如下步驟:
(1)獲取功率譜特征訓(xùn)練樣本集x和其對應(yīng)的類別標(biāo)號集y:
(1a)雷達(dá)接收n個c類目標(biāo)的高分辨距離像,得到n個高分辨距離像;
(1b)提取n個高分辨距離像中每個高分辨距離像的功率譜特征,得到功率譜特征訓(xùn)練樣本集x={x1,x2,…,xn,…,xn},并將功率譜特征訓(xùn)練樣本集x對應(yīng)的類別標(biāo)號通過類別標(biāo)號集y表示:y={y1,y2,…,yn,…,yn},n表示訓(xùn)練樣本的總個數(shù),xn表示第n個樣本,yn表示第n類樣本的類別標(biāo)號yn∈{1,2,…,c};
(2)構(gòu)建無限最大間隔線性判別投影模型:將狄利克雷過程dp混合模型、投影模型和隱變量svm分類器統(tǒng)一在bayesian模型框架下,得到無限最大間隔線性判別投影模型;
(3)定義無限最大間隔線性判別投影模型聯(lián)合偽后驗(yàn)分布,其表達(dá)式為:
其中,ωc表示第c類分類器參數(shù),分布服從n(0,βc-1i),分類器超參數(shù)βc~ga(a0,b0),c∈{1,2,…,d},d表示初始總聚類個數(shù);ac=[ac1,ac2,…,ack,…,ack]表示第c類樣本的投影矩陣,c∈{1,2,…,d},ack表示ac的第k列
(4)設(shè)定無限最大間隔線性判別投影模型聯(lián)合偽后驗(yàn)分布的表達(dá)式中各個參數(shù)的初始值:
設(shè)定第c類分類器參數(shù)ωc的初始值為一個服從n(0,1)分布的k+1維的隨機(jī)矩陣,第c類分類器參數(shù)ωc協(xié)方差精度β的初始值為服從ga(103,1)分布的隨機(jī)向量,第c類樣本投影矩陣ac的初始值為訓(xùn)練樣本集x的協(xié)方差矩陣前k個大的特征值對應(yīng)的特征向量,特征樣本集z的初始值為一個服從n(0,1)分布的k×n維的隨機(jī)矩陣,第c類分布參數(shù){μc,σc}的初始值為一個服從normal-wishart分布nw({μc,σc}|μ0,w0,ν0,β0)的隨機(jī)矩陣,其中μ0=0,w0=10-5i,ν0=k+1,β0=10-3,狄利克雷過程dp混合模型的參數(shù)υ的初始分布為beta(1,1)設(shè)聚集參數(shù)α的初始值為一個服從ga(1,10-10)分布的隨機(jī)數(shù);
(5)表示無限最大間隔線性判別投影模型聯(lián)合偽后驗(yàn)分布表達(dá)式
(6)對步驟(5)表示出的各個參數(shù)的條件后驗(yàn)分布進(jìn)行采樣:按照gibbs采樣方法,對步驟(5)表示出的無限最大間隔線性判別投影模型聯(lián)合偽后驗(yàn)分布表達(dá)式
(7)獲取功率譜特征測試樣本集
(7a)雷達(dá)接收
(7b)提取
(8)獲取雷達(dá)目標(biāo)的識別率:
(8a)采用聚類指示變量hn對測試樣本集
(8b)通過保存的第c類分類器參數(shù)ωc的采樣結(jié)果,對測試特征樣本集
(8c)將測試類別標(biāo)號集
本發(fā)明與現(xiàn)有技術(shù)相比,具有以下優(yōu)點(diǎn):
1)本發(fā)明通過dp過程將hrrp雷達(dá)高分辨距離像數(shù)據(jù)集劃分為‘無限’個子集,在每個子集里面學(xué)習(xí)一個mmldp模型,由于聚類和分類是聯(lián)合學(xué)習(xí)的,因而可以有效的挖掘數(shù)據(jù)中隱藏的線性結(jié)構(gòu)。與現(xiàn)有雷達(dá)的目標(biāo)識別技術(shù)相比,提高了雷達(dá)目標(biāo)的識別率,尤其目標(biāo)具有多模分布特性的情況下,效果更加明顯。
2)本發(fā)明將數(shù)據(jù)集的劃分、投影子空間和svm分類器的學(xué)習(xí)統(tǒng)一在bayesian的框架下,進(jìn)行聯(lián)合學(xué)習(xí),避免了兩階段分類方法帶來的分類性能損失。同時在每個子集上分別學(xué)習(xí)簡單的投影模型和分類器,與現(xiàn)有技術(shù)在整個數(shù)據(jù)集上單獨(dú)訓(xùn)練一個投影模型和分類器相比,降低了模型的復(fù)雜度。
附圖說明
圖1為本發(fā)明的實(shí)現(xiàn)流程圖;
表示整個實(shí)驗(yàn)的流程。
圖2為實(shí)測數(shù)據(jù)實(shí)驗(yàn)中聚類后驗(yàn)數(shù)量結(jié)果。
具體實(shí)施方式(對技術(shù)方案進(jìn)行解釋和說明)
以下結(jié)合附圖和具體實(shí)施例,對本發(fā)明進(jìn)行詳細(xì)說明:
參照圖1,基于無限最大間隔線性判別投影模型的雷達(dá)目標(biāo)識別方法,包括以下步驟:
步驟(1)獲取功率譜特征訓(xùn)練樣本集x和其對應(yīng)的類別標(biāo)號集y:
(1a)雷達(dá)接收600個3類目標(biāo)的高分辨距離像,得到600個高分辨距離像。
(1b)提取600個高分辨距離像中每個高分辨距離像的功率譜特征,得到功率譜特征訓(xùn)練樣本集x={x1,x2,…,xn,…,xn},并將功率譜特征訓(xùn)練樣本集x對應(yīng)的類別標(biāo)號通過類別標(biāo)號集y表示:y={y1,y2,…,yn,…,yn},xn表示第n個樣本,yn表示第n類樣本的類別標(biāo)號yn∈{1,2,3}。
步驟(2)構(gòu)建無限最大間隔線性判別投影模型,實(shí)現(xiàn)步驟為:
(2a)表示基于stick-breaking構(gòu)造的狄利克雷過程dp混合模型:
υc|α~beta(1,α),θc|g0~g0,c=1,2,…,∞
hn|π(υ)~mult(π(υ)),xn|hn=c;θc~p(x|θc),n=1,...,n
其中,υc為截棍比例參數(shù),
(2b)表示每個聚類中的投影模型:
基于mmldp模型的投影模型可以表示為:zn~n(aτxn,i),
則每個聚類中的投影模型可以表示為:
zn|hn=c,ac~n(acτxn,ip),ac=[ac1,ac2,…,ack,…,ack]
其中,當(dāng)聚類指示變量hn等于c的時候,zn就服從均值為acτxn,協(xié)方差矩陣為ip的正態(tài)分布,p表示單位矩陣i的維度。
(2c)表示每個聚類中隱變量svm分類器的模型:
設(shè)定第c個隱變量svm分類器的參數(shù)服從先驗(yàn)分布為
其中,λ=[λ1,λ2,…,λc,…,λc]表示隱變量svm分類器中的隱變量,λc表示第c個隱變量svm分類器中的隱變量。
(2d)將狄利克雷過程dp混合模型、投影模型和隱變量svm分類器統(tǒng)一在bayesian模型框架下,得到無限最大間隔線性判別投影模型,其層次化結(jié)構(gòu)式為:
hn|π(υ)~disc(π(υ))
xn|hn=c,{μc,σc}~p(xn|{μc,σc}),n=1,...,n.
yn,{λn}c|{zn,hn=c},ωc~φ(yn,λn|ωc,zn),c=1,...,∞
{μc,σc}~nw(μ0,w0,ν0,β0)
其中,根據(jù)上式的層次化表達(dá)式,得到第n個樣本xn的似然分布函數(shù):
步驟(3)定義無限最大間隔線性判別投影模型聯(lián)合偽后驗(yàn)分布,其具體表現(xiàn)形式為:
步驟(4)設(shè)定無限最大間隔線性判別投影模型聯(lián)合偽后驗(yàn)分布的表達(dá)式中各個參數(shù)的初始值:
設(shè)定第c類分類器參數(shù)ωc的初始值為一個服從n(0,1)分布的k+1維的隨機(jī)矩陣,第c類分類器參數(shù)ωc協(xié)方差精度β的初始值為服從ga(103,1)分布的隨機(jī)向量,第c類樣本投影矩陣ac的初始值為訓(xùn)練樣本集x的協(xié)方差矩陣前k個大的特征值對應(yīng)的特征向量,特征樣本集z的初始值為一個服從n(0,1)分布的k×n維的隨機(jī)矩陣,第c類分布參數(shù){μc,σc}的初始值為一個服從normal-wishart分布nw({μc,σc}|μ0,w0,ν0,β0)的隨機(jī)矩陣,其中μ0=0,w0=10-5i,ν0=k+1,β0=10-3,狄利克雷過程dp混合模型的參數(shù)υ的初始分布為beta(1,1)設(shè)聚集參數(shù)α的初始值為一個服從ga(1,10-10)分布的隨機(jī)數(shù)。
步驟(5)表示無限最大間隔線性判別投影模型聯(lián)合偽后驗(yàn)分布表達(dá)式
(5a)表示第c類分類器參數(shù)ωc的條件后驗(yàn)分布,其表現(xiàn)形式為:
其中:
βc為第c類分類器的超參數(shù)。
(5b)表示第c類樣本投影矩陣ac的第k列ac,k條件后驗(yàn)分布,其表現(xiàn)形式
為:
其中:
xn指的是第c類樣本,κc,k表示ac,k先驗(yàn)分布里面的參數(shù),κck~ga(c0,d0)。
(5c)表示特征樣本集z的第n個樣本的第k行zk,n的條件后驗(yàn)分布,其表現(xiàn)形式為:
其中:
其中
(5d)表示第c類樣本的分布參數(shù){μc,σc}的條件后驗(yàn)分布,其表現(xiàn)形式為:
其中:
υ'c=υ0+nc
βc'=β0+nc
nc表示第c類樣本的數(shù)量,
(5e)表示聚類指示變量的條件后驗(yàn)分布,其表現(xiàn)形式為:
p(h|-)=disc(h;π)
且πc服從約束為
(5f)表示υ的條件后驗(yàn)分布,其表現(xiàn)形式為:
p(υc|-)∝p(h|υ)beta(υc;1,α)~beta(υc;ρa(bǔ),ρb)
其中ρa(bǔ)=1+nc,
(5g)表示隱變量svm分類器的隱變量λn的條件后驗(yàn)分布,其表現(xiàn)形式為:
其中ig(.)表示逆高斯分布。
(5h)表示βc的條件后驗(yàn)分布,其表現(xiàn)形式為:
其中
(5i)表示κc,k的條件后驗(yàn)分布,其表現(xiàn)形式為:
其中
(5j)表示α的條件后驗(yàn)分布,其表現(xiàn)形式為:
其中e'0=e0+d-1,
(6)對步驟(5)表示出的各個參數(shù)的條件后驗(yàn)分布進(jìn)行采樣:按照gibbs采樣方法,對步驟(5)表示出的無限最大間隔線性判別投影模型聯(lián)合偽后驗(yàn)分布表達(dá)式
步驟(7)獲取功率譜特征測試樣本集
(7a)雷達(dá)接收2400個3類目標(biāo)的高分辨距離像,得到2400個高分辨距離像。
(7b)提取2400個高分辨距離像中每個高分辨距離像的功率譜特征,得到功率譜特征測試樣本集
(8)獲取雷達(dá)目標(biāo)的識別率:
(8a)采用聚類指示變量hn對測試樣本集
p(hn|-)=disc(hn;π)且
步驟(8b)通過保存的第c類分類器參數(shù)ωc的采樣結(jié)果,對測試特征樣本集
ρ=[ρ1,ρ2,...,ρc,...,ρd]
其中,
(8c)將測試類別標(biāo)號集
以下結(jié)合仿真實(shí)驗(yàn)和實(shí)測數(shù)據(jù)實(shí)驗(yàn),對本發(fā)明的技術(shù)效果作詳細(xì)說明:
1.仿真實(shí)驗(yàn)
(1)實(shí)驗(yàn)條件
本實(shí)驗(yàn)采用的數(shù)據(jù)集為從ucimachinelearningrepository中benchmark數(shù)據(jù)集,從中選取了heart、splice、twonorm三個比較復(fù)雜的數(shù)據(jù)集。
(2)實(shí)驗(yàn)內(nèi)容及結(jié)果分析
本實(shí)驗(yàn)采用原始數(shù)據(jù)作為模型的輸入,采用lda+svm、mmldp、k-mean+mmldp和immldp四個方法對數(shù)據(jù)集進(jìn)行分類、識別,本實(shí)驗(yàn)每類方法重復(fù)10次,每次方法隨機(jī)抽取50%作為訓(xùn)練樣本,剩余的做測試樣本。在不同的隱空間維度下取10次的平均識別性能作為最終的識別率,將各個方法在不同隱空間維度下最優(yōu)識別率列于表1。
表1,不同方法在不同數(shù)據(jù)上的識別率
從表1中我們可以看到immldp在不同數(shù)據(jù)集上的分類性能都優(yōu)于其他方法。immldp模型與mmldp模型識別率相比表明,將數(shù)據(jù)先聚類,在每個聚類內(nèi)學(xué)習(xí)一個投影模型要優(yōu)于全局投影模型方法。immldp模型與km+mmldp模型識別率相比表明,immldp將聚類、分類器和投影進(jìn)行聯(lián)合學(xué)習(xí)的,揭示了數(shù)據(jù)的隱含結(jié)構(gòu),因而獲得識別性能的顯著提升。
2實(shí)測數(shù)據(jù)實(shí)驗(yàn)
(1)實(shí)驗(yàn)條件
本發(fā)明采用c波段雷達(dá)對三類飛機(jī)目標(biāo)的實(shí)測hrrp數(shù)據(jù)進(jìn)行處理。采用模2范數(shù)歸一的方法消除hrrp的幅度敏感性,并提取其功率譜特征消除其平移敏感性,即我們得到的樣本數(shù)據(jù)集為hrrp的功率譜特征,實(shí)驗(yàn)中,我們采取的截棍上限設(shè)置為10。
(2)實(shí)驗(yàn)內(nèi)容及結(jié)果分析
選取600個功率譜特征作為訓(xùn)練樣本,2400個功率譜特征作為測試樣本,在3維隱空間的維度下,得到識別結(jié)果如表2所示。
表2,immldp在雷達(dá)高分辨距離像上聚類和性能分析
immldp獲得的聚類后驗(yàn)數(shù)量如圖2所示,可以看出有效聚類數(shù)量為三類,從表2中我們可以看出每個聚類內(nèi)部都獲得了較好的分類精度,這得益于我們將聚類子空間和分類器進(jìn)行聯(lián)合學(xué)習(xí),保證了每個聚類內(nèi)良好的分類性能,從而實(shí)現(xiàn)全局分類性能的提升,提高了對雷達(dá)目標(biāo)的識別率。