地形詞典大小為800。
[0化9] GMM詞典建立
[0060] 在訓練集Xtrain= [XI,X2, ..X,,.. , XT'] i、i"r 建立M個高斯混合模型(Gaussian Mixture Model,GMM)p(x|0):
[0061] P(x = 心。。'Sj巧㈱ 巧二-I
[0062] 其中X為特征空間的向量集合,在本發(fā)明中指Xtrain。
[0063] GMM模型同時描述了特征的歸屬情況與聚集程度,其中M表示碼本大小,0 = (311,iii, Zl, . .?,?, Sm. .,3lM,iiM,Sm)表示模型參數(shù),包括先驗概率JTmER+,均值iimERW,對角協(xié)方 差矩陣 XmERSDXSD。
[0064] 本發(fā)明實施例使用期望最大化化邱ec化tion Maximization,EM)算法學習運些模 型參數(shù)。EM算法對初值敏感,使用K-means算法進行初始化。最后W建立的M個高斯混合模型 作為視覺地形碼本詞典。通過多次實驗,本發(fā)明實施例選定GMM視覺地形詞典大小為8,本發(fā) 明實施例對此不做限制。
[0065] (5)稀疏編碼求解
[0066] 利用K-means碼本詞典,采用稀疏編碼對SIFT特征進行編碼表達,提取視覺地形特 征空間的0階信息。選擇激活碼本詞典B=化,b,...,bs〇<;]E i WX胃中的一小部分基向量,使 用它們的線性組合來重構特征空間X=的,:化.,XW] 6i WXW,相應的系數(shù)矩陣D=[屯, d:...山.,d.v]€ i胃XW為編碼結果。稀疏編碼方法表示為:
[0067]
(4)
[0068] 其中包括最小二乘項M X廣Bdi M 2與正則項iKdi),A為平衡因子。最小二乘項用于 確保盡量小的重構誤差,而正則項劃定激活向量的選擇空間(保證激活的基向量均具有代 表性和鑒別力)。本發(fā)明實施例選擇liX(Locality-constrained Linear Coding)稀疏編碼 方法,其正則項定義為:
[0069]
(5)
[0 卿
[0071] 其中O為矩陣元素對應相乘符號;Ei為區(qū)域性調節(jié)因子(locality adaptor) ;s.t 表征后面的1了山=1,^為4((11)的限制條件,1了(1康示(1沖的元素求和。
[0072] 其中ei=[dist(xi,bi), . .dist(xi,bm). . ,dist(Xi,bM)]T表征各基向量與被編碼特 征的相似性;dist(xi,bi)為特征Xi與視覺單詞bm之間的歐式距離。O為調節(jié)因子。本發(fā)明實 施例采用(5)運樣的正則項,是因為運樣可W生成解析解,省去了大量的優(yōu)化過程,降低了 計算復雜度。其解析解為:
[0073] di=(Ci+Miag 巧))\1 (7)
[0074] di = di/lTdi (8)
[00對其中,d功中間變量,diag(E)為矩陣E的對角矩陣。
[0076] 其中Ci=(BT-1xiT)(bT-1xiT)t代表特征數(shù)據(jù)的協(xié)方差矩陣。稀疏編碼求解得到D €:i SWXW,為矩陣形式,無法輸入支持向量機中完成分類操作,直接級聯(lián)則會產(chǎn)生冗長的特 征向量(百萬級維數(shù)),為了得到緊湊的圖像中層描述符F,采用池化操作。首先選取每個基 向量m中前n個系數(shù)(從大到小排列)構成?mn,經(jīng)過實驗結果分析,本發(fā)明實施例選擇參數(shù)n =5,池化操作表達式為:
[0077]
㈱
[0078] 再對池化結果F進行L2正則化處理,得到稀疏編碼結果Fie i胃。
[0079] (6)特征差異化編碼
[0080] 利用GMM碼本詞典,采用差異化編碼方法對SIFT特征進行編碼表達,提取視覺地形 特征空間的1階與2階信息。對輸入圖片的特征空間整體建立高斯混合模型,與碼本詞典中 的高斯混合模型相比較,編碼結果為它們之間的均值(1階)和方差(2階)差異:
[00川 (10)
[0082] (11)
[OOW]其中,K為地形圖像上的特征點數(shù);Xp為p-th SIFT特征;C為特征與模型間的均 值差異;為特征與模型間的方差差異。
[0084] 其中,{Wm,iV〇m}m分別表示GMM視覺字典中各視覺單詞的混合權重,均值與對角協(xié) 方差;Qp(Hi)為柔性分配權重,表征著p-th SIFT特征相對m-th混合高斯模型的權重值。特征 差異化編碼求解得到D =蝸",皆誓,,…,或",皆,]e i SW6,采用級聯(lián)方法最小化信息 轉化損失,得到圖像中層描述符F,采用L2正則化,得到特征差異化編碼結果F巧i UW。
[0085] (7)GIST 特征提取
[0086] GIST特征是基于Gabor小波提取的,Gabor小波可W很好的模擬人的視覺神經(jīng)細 胞,在視覺的諸多領域都有著重要應用。本發(fā)明實施例提取GIST特征用于補充視覺地形特 征的全局信息。具體過程為:在圖像的R、G、B =種顏色通道上建立圖像金字塔,層數(shù)為3,每 一層為不同分辨率的圖像。應用不同方向的Gabor濾波器對每層圖像進行濾波,之后將濾波 后的圖像按4X4的網(wǎng)格劃分,統(tǒng)計在每一塊內不同方向上的濾波響應,級聯(lián)后采用L2正則 化,得到全局GIST特征。本發(fā)明實施例在R、G、B =個通道上,使用3個尺度,各尺度對應方向 為8、8、4,最后形成的GIST特征Fsei 96°。
[0087] (8)視覺特征融合與支持向量機分類
[0088] 本發(fā)明實施例使用多核學習方法融合多重編碼結果與GIST特征,使最后的表達能 夠包含互補的不同特征信息(全局信息與局部0階、1階和2階信息)。
[0089] 首先對Fi、F2、F3分別構建其各自的核函數(shù)Km(X),采用多核學習方法形成最終的核 表達:
[0090]
(1巧
[0091] 其中y(X)為融合后的核函數(shù);Km(X)為待融合的3類不同表達的核函數(shù);am, bm,0m為 各核函數(shù)的調節(jié)參數(shù),通過在訓練集上優(yōu)化驗證得到;
[0092] 本發(fā)明實施例選擇支持向量機(SVM)作為最后的分類器,具體實現(xiàn)采用LIBSVM,同 時測試各種核方法,相比于線性核,非線性核方法(RBF核、相交核和卡方核),效果略有提 升,但是效率與可伸展性較差。綜合考慮,本發(fā)明實施例最終使用線性核,懲罰參數(shù)C采用十 折交叉驗證獲得。
[0093] 實施例3
[0094] 下面結合具體的實驗對實施例1和2中的方案進行可行性驗證,詳見下文描述:
[00巧]參見圖3,2012年,加利福尼亞大學圣塔芭芭拉分?;痭iversity of hlifornia-San1:a Barbara,UCSB)機器人研究所的Fi I ichkin與By I采用SIFT特征,結合詞袋方法,生成 緊湊的圖像中層描述符,輸入支持向量機(SVM)中進行分類識別,相比之前的方法獲得較大 提升,成為目前地形識別領域的標準方法,其研究成果也實地應用于美軍軍用機器人一小 狗化ittleDog)上,成為其重要功能載荷。本發(fā)明實施例將此方法作為基線方法,最后給出 效果對比。
[0096] 本發(fā)明實施例提取了 SIFT與GIST特征,采用了 PCA-怖itening特征預處理手段,進 行了稀疏編碼與差異化編碼,使用多核學習方法完成特征融合,全面描述視覺地形圖像的 特征空間,利用線性支持向量機得到分類結果。將本方法與基線方法對比,測試數(shù)據(jù)集為 DSl,每類地形選取90張圖片作為訓練集,100張圖片作為測試集,測試效果如圖4(a)、圖4 (b)所示,基線方法的準確率為75%,本方法的準確率為91%,準確率提高了 16%。
[0097] 綜上所述,通過上述實驗,驗證了本方法的可行性,滿足了實際應用的需要。
[0098] 本領域技術人員可W理解附圖只是一個優(yōu)選實施例的示意圖,上述本發(fā)明實施例 序號僅僅為了描述,不代表實施例的優(yōu)劣。
[0099] W上所述僅為本發(fā)明的較佳實施例,并不用W限制本發(fā)明,凡在本發(fā)明的精神和 原則之內,所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。
【主權項】
1. 一種基于多重編碼與特征融合的視覺地形分類方法,其特征在于,所述視覺地形分 類方法包括以下步驟: 使用PCA-Whitening對SIFT特征進行特征預處理,降低特征空間的相關性; 根據(jù)特征預處理后的結果,分別建立K-means字典與GMM字典; 對K-means字典通過使用稀疏編碼來描述視覺地形圖像的0階局部特征;對GMM字典通 過采用差異化編碼,描述視覺地形圖像的1階與2階局部特征; 使用GIST特征提取地形圖像的視覺全局信息; 通過多核學習方法融合視覺地形圖像的〇階、1階、2階局部特征和GIST全局特征,獲取 緊湊的視覺地形特征; 將視覺地形特征輸入線性支持向量機中,得到視覺地形分類結果。2. 根據(jù)權利要求1所述的一種基于多重編碼與特征融合的視覺地形分類方法,其特征 在于,所述視覺地形分類方法還包括: 建立視覺地形數(shù)據(jù)集作為評價測試對象,對視覺地形圖像進行關鍵點檢測,對圖像中 的局部信息關鍵點使用SIFT特征進行描述,提取局部底層視覺信息。
【專利摘要】本發(fā)明公開了一種基于多重編碼與特征融合的視覺地形分類方法,首先提取SIFT特征描述圖像局部信息,使用PCA?Whitening進行特征預處理,降低特征空間的相關性,進而建立K?means字典與GMM字典,通過稀疏編碼與差異化編碼方法實現(xiàn)視覺地形特征的再描述,并使用GIST特征補充視覺地形全局信息,最后,使用多核學習方法進行特征融合,形成緊湊的視覺地形特征表達,輸入線性支持向量機(SVM)中,得到視覺地形分類結果。本發(fā)明利用多重編碼與多特征融合方法全面描述了視覺地形的局部多階信息與全局特征,并通過與基線方法的對比,驗證了方法的有效性。
【IPC分類】G06K9/62
【公開號】CN105718955
【申請?zhí)枴緾N201610047921
【發(fā)明人】吳航, 劉保真, 孫景工, 蘇衛(wèi)華, 張文昌, 苑英海, 安慰寧, 秦曉麗
【申請人】中國人民解放軍軍事醫(yī)學科學院衛(wèi)生裝備研究所
【公開日】2016年6月29日
【申請日】2016年1月25日