基于增量線性判別分析的多類標場景分類方法

文檔序號：8488140閱讀：508來源：國知局

基于增量線性判別分析的多類標場景分類方法
【技術領域】
[0001] 本發(fā)明屬于圖像處理技術領域，特別涉及一種多類標圖像場景分類方法，可用于快速準確地處理特征豐富且類別數(shù)較多的復雜場景檢測。
【背景技術】
[0002] 近年來，隨著電腦和其他數(shù)據(jù)采集設備容量的增加，數(shù)據(jù)的規(guī)模變得越來越大。由于高維度和數(shù)據(jù)的擴充涌現(xiàn)出了大量的數(shù)據(jù)。人們普遍預期可以通過降低數(shù)據(jù)維數(shù)來減少時間和資源消耗。降維可以在很大程度上減少數(shù)據(jù)量，通過將數(shù)據(jù)從高維維特征空間映射到低維特征空間為后面的處理提供了便利。投影保持了在高維空間中盡可能多的信息。一個廣泛使用的監(jiān)督降維方法是線性判別分析。當數(shù)據(jù)投影到低維空間，線性判別分析通過同時最小化類內距離和最大化類間距離從不同類別中尋求數(shù)據(jù)最好的分離。在許多應用中線性判別分析表現(xiàn)良好。由于線性判別分析良好的屬性和流數(shù)據(jù)挖掘的需求，增量線性判別分析吸引了越來越多的興趣。在數(shù)據(jù)流進的情況下，用需要的流入數(shù)據(jù)更新線性判別分析的解，因為它避免了線性判別分析的解決方案中耗時的批模式再計算。在過去的幾年里，各種增量線性判別分析算法被開發(fā)出來。他們中的大多數(shù)提供近似解并面臨著很高的計算成本。
[0003] C.Chatterjee等人在1997年使用神經(jīng)網(wǎng)絡研宄增量線性判別分析，但經(jīng)常面臨收斂緩慢的問題，違背了增量學習的重要性。S.Pang等人在2009年提出了線性判別分析的增量版本，它提供了一種方法來更新類內和類間的散布矩陣，但是卻沒有給出更新后續(xù)特征分析的耗時步驟。J.Ye等人在2005年出的IDR/QR算法將線性判別分析應用于一個類間距最大的投影子空間。但是該算法的不足是在第一次投影中丟失了大量的信息。T.-K. Kim等人在2007年提出一種增量線性判別分析算法，該算法將足夠的生成集的概念用來更新類間和類內的散射矩陣，其中在每一步中都要移除保存和更新矩陣的特征向量和次要成分，在判別成份的計算中，散射矩陣投影到一個完成了本征分解的低維空間。H.Zhao等人在2008年提出增量線性判別分析算法，GSVD-ILDA，該算法的核心步驟是更新集中數(shù)據(jù)矩陣的特征向量。在更新過程中，次要的成份被刪除，從而降低計算成本。但是T.-K.Kim等人提出的增量線性判別分析算法和H.Zhao等人提出的GSVD-ILDA算法遇到了一個同樣的問題，即很難確定效率與性能的權衡等級。如果刪除太多的次要成份，性能會惡化，否則效率會很低。此外，性能對于參數(shù)設置很敏感，不易調節(jié)參數(shù)，導致分類結果不穩(wěn)定。

【發(fā)明內容】

[0004] 本發(fā)明的目的在于針對上述已有技術的不足，提出一種基于增量線性判別分析的多類標場景分類方法，以縮短分類時間，提高分類精度。
[0005] 實現(xiàn)本發(fā)明目的的技術方案是：在新的樣本到來，通過增量算法更新線性判別分析的最小二乘解，將高維數(shù)據(jù)投影到低維空間，得到低維特征；使用多類標K最近鄰分類器對降維后的特征樣本進行分類。其實現(xiàn)步驟包括如下：
[0006] (1)提取圖像庫中每一個樣本的特征得到特征集{七丨二，其中毛表示第i個樣本的特征，i= 1，…，N,N表示特征集中樣本個數(shù)；
[0007] (2)將上述圖庫中樣本的地物標簽矩陣表示為Y，當?shù)趇個樣本屬于第j個類別時，則地物標簽矩陣Y中的元素y(i，j) = 1，否則，y(i，j) = -1，并規(guī)定上述特征集中任意一個樣本至少屬于一個類別，其中j= 1，…，M，M表示類別數(shù)；
[0008] (3)使用步驟⑴所述的特征集和步驟⑵所述的地物標簽矩陣構成樣本集
【主權項】
1. 一種用于基于增量線性判別分析的多類標場景分類方法，包括如下步驟： (1) 提取圖像庫中每一個樣本的特征得到特征集化匕，其中4表示第i個樣本的特征，i= 1，…，N,N表示特征集中樣本個數(shù)； (2) 將上述圖庫中樣本的地物標簽矩陣表示為Y，當?shù)趇個樣本屬于第j個類別時，則地物標簽矩陣Y中的元素y(i，j) = 1，否則，y(i，j) = -1，并規(guī)定上述特征集中任意一個樣本至少屬于一個類別，其中j= 1，…，D，D表示類別數(shù)； (3) 使用步驟⑴所述的特征集和步驟⑵所述的地物標簽矩陣構成樣本集 {xk，yf^，其中，xk是第k個樣本特征，用一個行向量表示，yf是與xk相對應的第j個類別的地物標簽，N是樣本個數(shù)； (4) 采用增量線性判別分析的方法對上述樣本集{xk，進行降維，得到低維樣本集{ik，yAL; (5) 從上述低維樣本集{lk，7丨\，中隨機選取訓練樣本集江，yfUP測試樣本集 {4,tyf}^，其中，4是第k個訓練特征樣本，用一個行向量表示，y!"是與【相對應的第j個類別的地物標簽，n是訓練樣本個數(shù)，&是第k個測試特征樣本，用一個行向量表示，ty^是與tlk相對應的第j個類別的地物標簽，tn是測試樣本個數(shù)； (6) 將上述訓練樣本集和測試樣本集輸入到基于單示例多標簽的K最近鄰分類器中進行分類，得到測試樣本的輸出向量Tk; (7) 根據(jù)測試樣本的輸出向量Tk判斷測試樣本的標簽向量：當測試樣本的輸出向量Tk中每一個值都小于0時，則第k個測試樣本的標簽向量為：
當測試樣本的輸出向量Tk中至少有一個值大于0時，則第k個測試樣本的標簽向量為：
其中j= 1，2~6表示類別數(shù)，k= 1，2…tn表示測試樣本數(shù)； (8) 根據(jù)步驟（7)的判別結果得到測試樣本的標簽向量tyk，再由標簽向量tyk構成測試樣本的標簽矩陣，即得到測試樣本的分類結果。
2. 根據(jù)權利要求1所述的方法，其中所述步驟4中采用增量線性判別分析的方法對樣本集{xk，y〗1}:進行降維，得到低維樣本集隊，巧\~，按如下步驟進行： 4a)取樣本集丨Xk，$>丨【中前50%作為初始樣本集{&，，后50%作為新增樣本 2 集 4b)用初始樣本集中的特征集丨構成特征矩陣X; 4c)分別求取特征矩陣X的類間離散矩陣Sh和離散矩陣St:
其中XeRrfxn是以列為樣本的特征矩陣，m是特征矩陣的均值向量，m。是樣本屬于第c類的均值向量，n是樣本個數(shù)，n。是屬于第c類的樣本個數(shù)，1T是單位行向量，T表示矩陣轉置，C是總類別數(shù)； 4d)根據(jù)離散矩陣St的奇異性，計算得到變換矩陣W: 當離散矩陣St是非奇異的矩陣時，變換矩陣W是對離散矩陣的逆矩陣&1與類間離散矩陣Sb的乘積進行特征值分解得到的非零特征值所對應的特征向量；當離散矩陣St是奇異矩陣時，變換矩陣W是對離散矩陣的逆矩陣乂+與類間離散矩陣Sb 的乘積進行特征值分解得到的非零特征值所對應的特征向量； 4e)初始化特征矩陣X和它的偽逆矩陣X+、均值向量m、標簽矩陣Y、新增樣本？和它的標簽向量y; 4f)利用新增樣本的標簽向量y對標簽矩陣Y更新，得到新的標簽矩陣h4g)通過上述新增樣本x'對上述均值向量m更新，得到新的均值向量rh， m = m +」一(x'-m); 77+1 4h)根據(jù)特征維數(shù)與樣本個數(shù)的大小關系，對變換矩陣w更新得到新的變換矩陣r; 4i)對原始樣本特征X進行投影，得到低維特征矩陣：z 義，從而得到低維樣本集 {ik，，其中{U匕是低維特征矩陣L的集合形式。
3.根據(jù)權利要求2所述的方法，其中所述步驟4f)中利用新增樣本的標簽向量y對標簽矩陣Y更新，按如下步驟進行： 4fl)設新增樣本x'屬于第p類，np=np+l，np表示屬于類別p的樣本個數(shù)； 4f2)定義上述新增樣本的標簽向量y中的第j個類別的標簽yu)為：
4f3)將新增樣本的標簽向量7以一個新增行的形式添加到標簽矩陣Y的最后一行中； 4f4)根據(jù)下式更新得到新的標簽矩陣f: CN 104809475 A 不乂利旻豕書 3/4頁
其中迭代系數(shù)操作符表示如果P小于等于Y的列數(shù)，則Y的第p列乘以ap，否則，給Y添加一列零元素。
4.根據(jù)權利要求2所述的方法，其中所述步驟4h)中根據(jù)特征維數(shù)與樣本個數(shù)的大小關系，更新得到新的變換矩陣#，按如下兩種情況進行： 4hl)當數(shù)據(jù)維數(shù)大于樣本個數(shù)時，其更新步驟如下： 4hll)按照如下公式對上述特征矩陣的偽逆矩陣X+更新，得到新的偽逆矩陣f+，
J 其中h表示空間參數(shù)，
1表示單位列向量； 4hl2)通過新的標簽矩陣f、新的均值向量rh和新的偽逆矩陣f+，計算得到新的變換矩陣
其中x'表示新增樣本，n表示樣本個數(shù)，m表示目前的均值向量，X表示目前的特征矩陣，1T表示單位行向量，W表示目前的變換矩陣，操作符表示如果p小于等于Y的列數(shù)，貝1JY的第p列乘以ap，否則，給Y添加一列零元素； 4h2)當數(shù)據(jù)維數(shù)小于等于樣本個數(shù)時，其更新步驟如下： 4h21)通過下式利用特征矩陣X計算散射矩陣?。? <i> =XXT； 4h22)通過散射矩陣巾的秩判斷信號參數(shù)t的取值：
其中d表示特征矩陣X的行數(shù)，rank〇表示求矩陣的秩； 4h23)通過信號參數(shù)t的取值，對散射矩陣的偽逆矩陣巾+更新，得到新的散射矩陣的偽逆矩陣多+:
其中U表示中心參數(shù)，m= s表示核參數(shù)，s=巾+u，0表示偏置系數(shù)，0 V? +l =l+uT <})+u； 4h24)通過新的標簽矩陣f、新的均值向量A:和新的散射矩陣<i>+對變換矩陣W進行更新，得到新的變換矩陣#:
【專利摘要】本發(fā)明公開了一種基于增量線性判別分析的多類標場景分類方法，主要解決現(xiàn)有技術中圖像降維和多標記分類的問題。其實現(xiàn)步驟為：首先，將多類標分解成多個單類標；其次使用初始樣本計算初始線性判別分析的變換矩陣，使用新增樣本增量更新線性判別分析的變換矩陣，并將高維數(shù)據(jù)投影到低維空間；再從降維后的樣本集中隨機選取訓練樣本和測試樣本，使用單示例多標記的K最近鄰分類器對降維后的特征樣本分類，并得到測試樣本輸出值；最后，預測出測試樣本的標簽，得到分類結果。本發(fā)明具有分類精度更高，分類時間更短的優(yōu)點，可用于快速準確地處理海量高維度并且類別較多的多類標數(shù)據(jù)分類問題。
【IPC分類】G06K9-62
【公開號】CN104809475
【申請?zhí)枴緾N201510227553
【發(fā)明人】焦李成, 馬文萍, 張曼, 屈嶸, 楊淑媛, 侯彪, 王爽, 馬晶晶, 劉紅英
【申請人】西安電子科技大學
【公開日】2015年7月29日
【申請日】2015年5月6日

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：焦李成;馬文萍;張曼;屈嶸;楊淑媛;侯彪;王爽;馬晶晶;劉紅英;
技術所有人：西安電子科技大學;
我是此專利的發(fā)明人

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

增量線性系統(tǒng)相關技術

線性判別分析相關技術

lda線性判別分析相關技術

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于增量線性判別分析的多類標場景分類方法