亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種面向服務(wù)機(jī)器人的室內(nèi)場(chǎng)景圖像分類方法

文檔序號(hào):8488134閱讀:649來源:國(guó)知局
一種面向服務(wù)機(jī)器人的室內(nèi)場(chǎng)景圖像分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明實(shí)施涉及圖像處理技術(shù),尤其涉及一種面向服務(wù)機(jī)器人的室內(nèi)場(chǎng)景圖像分 類方法。
【背景技術(shù)】
[0002] 隨著計(jì)算機(jī)和機(jī)器人學(xué)的發(fā)展,現(xiàn)代機(jī)器人已經(jīng)不僅僅在工業(yè)制造方面,而且期 待能在農(nóng)業(yè)、林業(yè)、軍事、醫(yī)療、文娛、家用、科學(xué)研宄等許多方面得到廣泛的應(yīng)用。對(duì)于家庭 服務(wù)、患者看護(hù)、辦公事務(wù)等高級(jí)工作而言,越來越多種類的移動(dòng)服務(wù)機(jī)器人被開發(fā)和投入 使用。隨著研宄的深入,人們對(duì)移動(dòng)服務(wù)機(jī)器人在運(yùn)動(dòng)過程中能根據(jù)周圍環(huán)境的變化而自 助采取相應(yīng)措施的能力也越來越強(qiáng)。移動(dòng)服務(wù)機(jī)器人要達(dá)到自主導(dǎo)航、智能行進(jìn)的目的,必 須實(shí)時(shí)準(zhǔn)確地獲知周圍信息,感知所處環(huán)境,即如何對(duì)場(chǎng)景圖像正確分類。對(duì)服務(wù)機(jī)器人而 言,要實(shí)現(xiàn)其對(duì)室內(nèi)場(chǎng)景圖像的分類,要解決四個(gè)基本問題:
[0003] 1.用哪種圖像特征來有效的描述圖像,這涉及到特征提取問題;
[0004] 2.用哪種圖像分割的方式,對(duì)圖像的字塊或像素進(jìn)行有效的識(shí)別,這個(gè)涉及到不 同信息的融合問題;
[0005] 3.用哪種機(jī)器學(xué)習(xí)方法來有效地構(gòu)建識(shí)別模型,涉及到分類器設(shè)計(jì)和選取問題; [0006] 4.場(chǎng)景的同義性問題,即不同場(chǎng)景圖像之間存在相似性,相同場(chǎng)景的不同圖片之 間存在一定的差異性。
[0007] 現(xiàn)階段的場(chǎng)景分類問題,有兩個(gè)關(guān)鍵的組成部分:1)場(chǎng)景的描述與表示;2)利用 場(chǎng)景表示來學(xué)習(xí)語義類別模型。比較流行的方法有視覺詞袋模型(BoW)和基于空間金字塔 匹配(SPM)法。BoW模型把一幅圖像看作是由一組視覺詞匯(VisualWord)組成的文檔,其 首先提取圖像的興趣點(diǎn),然后來構(gòu)建視覺詞典(Codebook),接著利用視覺詞典對(duì)圖像的低 級(jí)特征(如興趣點(diǎn))進(jìn)行向量量化,進(jìn)而統(tǒng)計(jì)整幅圖像的視覺詞匯的直方圖分布信息,最后 通常采用SVM分類器完成場(chǎng)景分類任務(wù)。
[0008] 盡管BoW方法在場(chǎng)景分類中取得了較好的效果,但它忽略了局部的圖像塊的位置 信息,是一種無序的特征表示。而SPM方法對(duì)一幅圖像在不同尺度上采用不同精細(xì)程度的 劃分,然后將各個(gè)尺度上所得到的統(tǒng)計(jì)直方圖和串聯(lián)起來表示圖像場(chǎng)景特征。這種改進(jìn)考 慮了圖像關(guān)鍵點(diǎn)的位置信息,從而使得場(chǎng)景圖像分類的精度取得了較大的提升。但此方法 也存在一個(gè)缺陷,其在視覺詞典生成中采用了K-Means聚類的方法,由于K-Means是一種硬 聚類(HardClustering)策略,并且在向量量化中每個(gè)描述子只屬于一個(gè)聚類中心,故帶來 了較大的量化誤差,進(jìn)而導(dǎo)致比較嚴(yán)重的信息損失。
[0009] 本發(fā)明針對(duì)上面的問題1,問題3和問題4,提出一種面向服務(wù)機(jī)器人的場(chǎng)景圖像 分類方法,利用基于MSD約束下的SAE來進(jìn)行特征提取,并用到均值池化的降維方法,結(jié)合 遺傳粒子群算法來優(yōu)化SVM進(jìn)行分類。能夠有效解決BoW方法和SPM方法出現(xiàn)的問題,同 時(shí)考慮到場(chǎng)景圖像之間的同義性問題,大大提高室內(nèi)場(chǎng)景圖像分類的準(zhǔn)確率,從而使服務(wù) 機(jī)器人在場(chǎng)景理解方面具有更大的優(yōu)勢(shì)。

【發(fā)明內(nèi)容】

[0010] 為達(dá)到解決上述問題的目的,本發(fā)明提供一種面向服務(wù)機(jī)器人的室內(nèi)場(chǎng)景圖像分 類方法,尤其是基于最大可分性(MSD)約束下的稀疏自編碼(SAE)場(chǎng)景圖像分類的方法。
[0011] 本發(fā)明適用于多種室內(nèi)場(chǎng)景圖像的分類問題。具體步驟為:對(duì)場(chǎng)景圖像進(jìn)行白化 等預(yù)處理,得到像素值在[0,1]之間的圖像塊。將預(yù)處理過的圖像數(shù)據(jù)輸入到基于MSD約 束的SAE網(wǎng)絡(luò)中,訓(xùn)練得到該模型的參數(shù)。然后將源圖像輸入到訓(xùn)練好的SAE中,結(jié)合卷積 的思想對(duì)源圖像進(jìn)行特征提取,最終學(xué)習(xí)得到原始圖像的抽象特征向量。為了便于分類,對(duì) 此向量進(jìn)行均值池化處理,得到原始輸入的較低維數(shù)的特征向量。將經(jīng)過降維處理的特征 向量輸入到"一對(duì)一"的SVM分類器中,并采用GA-PSO算法優(yōu)化其參數(shù)。當(dāng)采集到新的圖 像樣本時(shí),重復(fù)上面預(yù)處理、特征提取、卷積和均值池化步驟,并用已經(jīng)訓(xùn)練好的SVM對(duì)其 進(jìn)行分類。這種方法能夠取得較高的分類準(zhǔn)確率。
[0012] 本發(fā)明的面向服務(wù)機(jī)器人室內(nèi)場(chǎng)景圖像分類方法的大致流程如圖2所示:
[0013] 步驟1 :圖像預(yù)處理。本發(fā)明訓(xùn)練所采用的樣本圖像來自包含90種室內(nèi)場(chǎng)景的先 驗(yàn)圖像庫(kù),隨機(jī)選擇每個(gè)場(chǎng)景類別的100幅圖像,并進(jìn)行預(yù)處理操作;即對(duì)圖像進(jìn)行去除噪 聲處理,提取圖像邊緣。選擇合適的算子,使后續(xù)處理建立在較為準(zhǔn)確的基礎(chǔ)之上。
[0014] 步驟2 :訓(xùn)練基于MSD約束的SAE模型。將預(yù)處理過后的場(chǎng)景圖像數(shù)據(jù)輸入到該 SAE模型中,訓(xùn)練的得到模型的參數(shù);
[0015] 步驟3 :然后將原圖像輸入到訓(xùn)練好的SAE中,結(jié)合卷積的思想,經(jīng)過逐層特征提 取,得到原始輸入的高維完備特征;
[0016] 步驟4 :對(duì)特征向量進(jìn)行均值池化處理。由于步驟3中提取到的特征維數(shù)較高,不 利于后面的分類,因此采用特征卷積和均值池化的方法對(duì)其進(jìn)行降維處理,得到原始輸入 圖像的較低維數(shù)的特征向量;
[0017] 步驟5 :確定SVM模型的參數(shù)。利用基于遺傳免疫的粒子群算法優(yōu)化并確定SVM分 類器的參數(shù):核函數(shù)參數(shù)r、懲罰參數(shù)c;
[0018] 具體流程為:
[0019] 步驟5. 1本發(fā)明選擇RBF作為SVM的核函數(shù),SVM需要優(yōu)化核函數(shù)參數(shù)r、懲罰參 數(shù)c〇
[0020] 步驟5. 2初始化學(xué)習(xí)因子、慣性權(quán)重以及最大迭代次數(shù)。
[0021] 步驟5. 3計(jì)算個(gè)體的適應(yīng)度值。計(jì)算每個(gè)個(gè)體的適應(yīng)度的值,同時(shí)分別用一個(gè)變 量把每個(gè)個(gè)體的當(dāng)前二進(jìn)制編碼保留下來。從第二次迭代開始,如果產(chǎn)生的新個(gè)體的適應(yīng) 度比前一次保留的個(gè)體的適應(yīng)度值小,則把新個(gè)體存儲(chǔ)在變量中并替換前一代的個(gè)體。這 樣就保證了每個(gè)個(gè)體的歷史最優(yōu)解被保留下來。并且把每一代的最優(yōu)解也用單獨(dú)的變量保 留下來,為步驟5. 5做準(zhǔn)備。
[0022] 步驟5
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1