一種面向服務(wù)機(jī)器人的室內(nèi)場(chǎng)景圖像分類方法

文檔序號(hào)：8488134閱讀：649來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種面向服務(wù)機(jī)器人的室內(nèi)場(chǎng)景圖像分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明實(shí)施涉及圖像處理技術(shù)，尤其涉及一種面向服務(wù)機(jī)器人的室內(nèi)場(chǎng)景圖像分類方法。
【背景技術(shù)】
[0002] 隨著計(jì)算機(jī)和機(jī)器人學(xué)的發(fā)展，現(xiàn)代機(jī)器人已經(jīng)不僅僅在工業(yè)制造方面，而且期待能在農(nóng)業(yè)、林業(yè)、軍事、醫(yī)療、文娛、家用、科學(xué)研宄等許多方面得到廣泛的應(yīng)用。對(duì)于家庭服務(wù)、患者看護(hù)、辦公事務(wù)等高級(jí)工作而言，越來越多種類的移動(dòng)服務(wù)機(jī)器人被開發(fā)和投入使用。隨著研宄的深入，人們對(duì)移動(dòng)服務(wù)機(jī)器人在運(yùn)動(dòng)過程中能根據(jù)周圍環(huán)境的變化而自助采取相應(yīng)措施的能力也越來越強(qiáng)。移動(dòng)服務(wù)機(jī)器人要達(dá)到自主導(dǎo)航、智能行進(jìn)的目的，必須實(shí)時(shí)準(zhǔn)確地獲知周圍信息，感知所處環(huán)境，即如何對(duì)場(chǎng)景圖像正確分類。對(duì)服務(wù)機(jī)器人而言，要實(shí)現(xiàn)其對(duì)室內(nèi)場(chǎng)景圖像的分類，要解決四個(gè)基本問題：
[0003] 1.用哪種圖像特征來有效的描述圖像，這涉及到特征提取問題；
[0004] 2.用哪種圖像分割的方式，對(duì)圖像的字塊或像素進(jìn)行有效的識(shí)別，這個(gè)涉及到不同信息的融合問題；
[0005] 3.用哪種機(jī)器學(xué)習(xí)方法來有效地構(gòu)建識(shí)別模型，涉及到分類器設(shè)計(jì)和選取問題； [0006] 4.場(chǎng)景的同義性問題，即不同場(chǎng)景圖像之間存在相似性，相同場(chǎng)景的不同圖片之間存在一定的差異性。
[0007] 現(xiàn)階段的場(chǎng)景分類問題，有兩個(gè)關(guān)鍵的組成部分：1)場(chǎng)景的描述與表示；2)利用場(chǎng)景表示來學(xué)習(xí)語義類別模型。比較流行的方法有視覺詞袋模型（BoW)和基于空間金字塔匹配（SPM)法。BoW模型把一幅圖像看作是由一組視覺詞匯（VisualWord)組成的文檔，其首先提取圖像的興趣點(diǎn)，然后來構(gòu)建視覺詞典（Codebook)，接著利用視覺詞典對(duì)圖像的低級(jí)特征（如興趣點(diǎn)）進(jìn)行向量量化，進(jìn)而統(tǒng)計(jì)整幅圖像的視覺詞匯的直方圖分布信息，最后通常采用SVM分類器完成場(chǎng)景分類任務(wù)。
[0008] 盡管BoW方法在場(chǎng)景分類中取得了較好的效果，但它忽略了局部的圖像塊的位置信息，是一種無序的特征表示。而SPM方法對(duì)一幅圖像在不同尺度上采用不同精細(xì)程度的劃分，然后將各個(gè)尺度上所得到的統(tǒng)計(jì)直方圖和串聯(lián)起來表示圖像場(chǎng)景特征。這種改進(jìn)考慮了圖像關(guān)鍵點(diǎn)的位置信息，從而使得場(chǎng)景圖像分類的精度取得了較大的提升。但此方法也存在一個(gè)缺陷，其在視覺詞典生成中采用了K-Means聚類的方法，由于K-Means是一種硬聚類（HardClustering)策略，并且在向量量化中每個(gè)描述子只屬于一個(gè)聚類中心，故帶來了較大的量化誤差，進(jìn)而導(dǎo)致比較嚴(yán)重的信息損失。
[0009] 本發(fā)明針對(duì)上面的問題1，問題3和問題4,提出一種面向服務(wù)機(jī)器人的場(chǎng)景圖像分類方法，利用基于MSD約束下的SAE來進(jìn)行特征提取，并用到均值池化的降維方法，結(jié)合遺傳粒子群算法來優(yōu)化SVM進(jìn)行分類。能夠有效解決BoW方法和SPM方法出現(xiàn)的問題，同時(shí)考慮到場(chǎng)景圖像之間的同義性問題，大大提高室內(nèi)場(chǎng)景圖像分類的準(zhǔn)確率，從而使服務(wù) 機(jī)器人在場(chǎng)景理解方面具有更大的優(yōu)勢(shì)。

【發(fā)明內(nèi)容】

[0010] 為達(dá)到解決上述問題的目的，本發(fā)明提供一種面向服務(wù)機(jī)器人的室內(nèi)場(chǎng)景圖像分類方法，尤其是基于最大可分性（MSD)約束下的稀疏自編碼（SAE)場(chǎng)景圖像分類的方法。
[0011] 本發(fā)明適用于多種室內(nèi)場(chǎng)景圖像的分類問題。具體步驟為：對(duì)場(chǎng)景圖像進(jìn)行白化等預(yù)處理，得到像素值在[0，1]之間的圖像塊。將預(yù)處理過的圖像數(shù)據(jù)輸入到基于MSD約束的SAE網(wǎng)絡(luò)中，訓(xùn)練得到該模型的參數(shù)。然后將源圖像輸入到訓(xùn)練好的SAE中，結(jié)合卷積的思想對(duì)源圖像進(jìn)行特征提取，最終學(xué)習(xí)得到原始圖像的抽象特征向量。為了便于分類，對(duì) 此向量進(jìn)行均值池化處理，得到原始輸入的較低維數(shù)的特征向量。將經(jīng)過降維處理的特征向量輸入到"一對(duì)一"的SVM分類器中，并采用GA-PSO算法優(yōu)化其參數(shù)。當(dāng)采集到新的圖像樣本時(shí)，重復(fù)上面預(yù)處理、特征提取、卷積和均值池化步驟，并用已經(jīng)訓(xùn)練好的SVM對(duì)其進(jìn)行分類。這種方法能夠取得較高的分類準(zhǔn)確率。
[0012] 本發(fā)明的面向服務(wù)機(jī)器人室內(nèi)場(chǎng)景圖像分類方法的大致流程如圖2所示：
[0013] 步驟1 :圖像預(yù)處理。本發(fā)明訓(xùn)練所采用的樣本圖像來自包含90種室內(nèi)場(chǎng)景的先驗(yàn)圖像庫(kù)，隨機(jī)選擇每個(gè)場(chǎng)景類別的100幅圖像，并進(jìn)行預(yù)處理操作；即對(duì)圖像進(jìn)行去除噪聲處理，提取圖像邊緣。選擇合適的算子，使后續(xù)處理建立在較為準(zhǔn)確的基礎(chǔ)之上。
[0014] 步驟2 :訓(xùn)練基于MSD約束的SAE模型。將預(yù)處理過后的場(chǎng)景圖像數(shù)據(jù)輸入到該 SAE模型中，訓(xùn)練的得到模型的參數(shù)；
[0015] 步驟3 :然后將原圖像輸入到訓(xùn)練好的SAE中，結(jié)合卷積的思想，經(jīng)過逐層特征提取，得到原始輸入的高維完備特征；
[0016] 步驟4 :對(duì)特征向量進(jìn)行均值池化處理。由于步驟3中提取到的特征維數(shù)較高，不利于后面的分類，因此采用特征卷積和均值池化的方法對(duì)其進(jìn)行降維處理，得到原始輸入圖像的較低維數(shù)的特征向量；
[0017] 步驟5 :確定SVM模型的參數(shù)。利用基于遺傳免疫的粒子群算法優(yōu)化并確定SVM分類器的參數(shù)：核函數(shù)參數(shù)r、懲罰參數(shù)c;
[0018] 具體流程為：
[0019] 步驟5. 1本發(fā)明選擇RBF作為SVM的核函數(shù)，SVM需要優(yōu)化核函數(shù)參數(shù)r、懲罰參數(shù)c〇
[0020] 步驟5. 2初始化學(xué)習(xí)因子、慣性權(quán)重以及最大迭代次數(shù)。
[0021] 步驟5. 3計(jì)算個(gè)體的適應(yīng)度值。計(jì)算每個(gè)個(gè)體的適應(yīng)度的值，同時(shí)分別用一個(gè)變量把每個(gè)個(gè)體的當(dāng)前二進(jìn)制編碼保留下來。從第二次迭代開始，如果產(chǎn)生的新個(gè)體的適應(yīng) 度比前一次保留的個(gè)體的適應(yīng)度值小，則把新個(gè)體存儲(chǔ)在變量中并替換前一代的個(gè)體。這樣就保證了每個(gè)個(gè)體的歷史最優(yōu)解被保留下來。并且把每一代的最優(yōu)解也用單獨(dú)的變量保留下來，為步驟5. 5做準(zhǔn)備。
[0022] 步驟5

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：尹宏鵬;柴毅;李藝;焦旭國(guó);
技術(shù)所有人：重慶大學(xué);
我是此專利的發(fā)明人

上一篇：一種基于svm的車輛逆行檢測(cè)裝置和檢測(cè)方法
上一篇：一種基于不定核的多視圖分類方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像場(chǎng)景分類相關(guān)技術(shù)

圖像分類的應(yīng)用場(chǎng)景相關(guān)技術(shù)

場(chǎng)景圖像分類技術(shù)綜述相關(guān)技術(shù)

遙感圖像場(chǎng)景分類相關(guān)技術(shù)

面向?qū)ο髨D像分類相關(guān)技術(shù)

面向?qū)ο蟮膱D像分類相關(guān)技術(shù)

機(jī)器人應(yīng)用場(chǎng)景相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種面向服務(wù)機(jī)器人的室內(nèi)場(chǎng)景圖像分類方法