一種基于語(yǔ)義特征提取與匹配的物體識(shí)別方法
【專利摘要】本發(fā)明提供了一種基于語(yǔ)義特征提取與匹配的物體識(shí)別方法,屬于信息檢索領(lǐng)域。本發(fā)明包括語(yǔ)義特征提取和語(yǔ)義特征匹配兩部分,語(yǔ)義特征提取部分首先提取一類物體訓(xùn)練圖片的SIFT特征點(diǎn),通過(guò)k-均值聚類對(duì)SIFT特征點(diǎn)進(jìn)行空間聚類,然后利用基于核函數(shù)的決策機(jī)制,決策出每個(gè)空間類別內(nèi)的若干有效點(diǎn),最后利用支持向量機(jī)分類器訓(xùn)練每個(gè)空間類別內(nèi)的有效點(diǎn),每個(gè)空間類別訓(xùn)練出一個(gè)具有語(yǔ)義特征的視覺(jué)單詞,便最終提取出可描述一類物體語(yǔ)義特征的視覺(jué)詞匯表;語(yǔ)義特征匹配部分首先提取一幅待測(cè)物體圖片的SIFT特征點(diǎn),作為待測(cè)物體的語(yǔ)義描述,然后利用支持向量機(jī)分類器,將待測(cè)物體的語(yǔ)義描述與多類物體的視覺(jué)詞匯表匹配分類,最后統(tǒng)計(jì)待測(cè)物體的視覺(jué)詞匯表直方圖,確定待測(cè)物體類別。
【專利說(shuō)明】一種基于語(yǔ)義特征提取與匹配的物體識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于信息檢索領(lǐng)域,具體涉及一種基于語(yǔ)義特征提取與匹配的物體識(shí)別方法。
【背景技術(shù)】
[0002]物體識(shí)別的本質(zhì)就是建立一個(gè)能夠識(shí)別出圖像中感興趣物體類別的計(jì)算系統(tǒng),在現(xiàn)實(shí)生活中有著廣泛的應(yīng)用需求,具有相當(dāng)高的應(yīng)用價(jià)值和研究意義。近年來(lái),隨著模式分類技術(shù)的不斷成熟以及人工智能的持續(xù)發(fā)展,基于語(yǔ)義特征提取的物體識(shí)別技術(shù)逐漸被廣大學(xué)者所青睞。物體的語(yǔ)義特征就是通過(guò)提取一類物體的局部特征,然后按照一定的處理準(zhǔn)則將局部特征轉(zhuǎn)化為描述一類物體的語(yǔ)義信息,形成一類物體的語(yǔ)義特征模型,實(shí)現(xiàn)可行有效的物體分類識(shí)別效果。
[0003]在目前的物體識(shí)別領(lǐng)域,Bag of Words算法是最具有代表性的物體識(shí)別算法之一。算法認(rèn)為一幅圖像由若干個(gè)具有語(yǔ)義信息的視覺(jué)單詞組成。提取圖片中的若干局部特征并將其轉(zhuǎn)化為視覺(jué)單詞,根據(jù)視覺(jué)單詞與視覺(jué)詞匯表的關(guān)系生成一幅圖片的視覺(jué)單詞直方圖,視覺(jué)單詞直方圖表述一幅圖片的特征,可以有效的實(shí)現(xiàn)物體的識(shí)別分類。
[0004]Bag of Words算法中視覺(jué)詞匯表是將局部描述符進(jìn)行k_均值聚類之后的聚類中心表示的。將一類物體所有圖片的特征點(diǎn)聚類,聚類的個(gè)數(shù)就是視覺(jué)單詞詞匯表的詞匯量,詞匯表的視覺(jué)單詞就是每類的聚類中心。但是,僅僅利用聚類中心單個(gè)特征點(diǎn)作為一類特征點(diǎn)的描述,沒(méi)有充分利用局部特征,也沒(méi)有充分利用經(jīng)過(guò)聚類之后產(chǎn)生的語(yǔ)義信息。單個(gè)聚類中心喪失了大量語(yǔ)義信息,不適合作為一個(gè)有效的視覺(jué)單詞。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于解決上述現(xiàn)有技術(shù)中存在的難題,提供了一種基于核函數(shù)決策的語(yǔ)義特征提取方法,在語(yǔ)義特征提取階段,通過(guò)核函數(shù)決策,選取每個(gè)空間類別內(nèi)的若干有效點(diǎn)作為視覺(jué)單詞,提取出類別穩(wěn)定且信息豐富語(yǔ)義特征信息。
[0006]本發(fā)明是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的:
一種在物體識(shí)別過(guò)程中對(duì)物體語(yǔ)義特征提取與匹配的方法,其特征在于,所述方法包
括:
(I)語(yǔ)義特征提取部分:首先選取一類物體的若干圖片作為訓(xùn)練庫(kù),提取所有圖片的SIFT特征點(diǎn);通過(guò)k-均值聚類算法對(duì)所有SIFT特征點(diǎn)進(jìn)行空間聚類,然后利用基于核函數(shù)的決策機(jī)制,決策出每個(gè)空間類別內(nèi)的若干有效點(diǎn);利用支持向量機(jī)分類器訓(xùn)練每個(gè)空間類別內(nèi)的有效點(diǎn),每個(gè)空間類別訓(xùn)練出一個(gè)具有語(yǔ)義特征的視覺(jué)單詞,便最終提取出可描述一類物體語(yǔ)義特征的視覺(jué)詞匯表;選取多類物體的訓(xùn)練圖片,提取每類物體的視覺(jué)詞匯表,形成多類物體的視覺(jué)詞匯表。
[0007](2)語(yǔ)義特征匹配部分:首先提取一幅待測(cè)物體圖片的SIFT特征點(diǎn),作為待測(cè)物體的語(yǔ)義描述;利用支持向量機(jī)分類器,將待測(cè)物體的語(yǔ)義描述與多類物體的視覺(jué)詞匯表匹配分類;統(tǒng)計(jì)待測(cè)物體的視覺(jué)詞匯表直方圖,確定待測(cè)物體類別。
[0008]其中,所述語(yǔ)義特征提取部分包括以下步驟:
(1)選取一類物體的F幅訓(xùn)練圖片,提取每幅圖片的SIFT特征點(diǎn);
(2)將該類物體的所有的特征點(diǎn)X聚類為個(gè)空間類別,提取各空間類別的聚類中心
(3)按照基于核函數(shù)的決策機(jī)制,對(duì)尤類中的每個(gè)特征點(diǎn)進(jìn)行決策,得到每個(gè)特征點(diǎn)的決策值/(64 ;
(4)設(shè)置支持向量機(jī)類別訓(xùn)練數(shù)據(jù)標(biāo)識(shí)。選取單個(gè)空間類別內(nèi)的若干有效特征點(diǎn)為本類別訓(xùn)練點(diǎn);選取所有其它空間類別的若干有效點(diǎn)作為其它類別的特征訓(xùn)練點(diǎn);
(5)針對(duì)于(4)標(biāo)識(shí)的訓(xùn)練數(shù)據(jù),利用SVM分類器學(xué)習(xí)訓(xùn)練,訓(xùn)練得到一類物體的^個(gè)視覺(jué)單詞,即該類物體的視覺(jué)詞匯表;
(6)選取多類物體的訓(xùn)練圖片,提取每個(gè)類別的視覺(jué)詞匯表,形成多類物體的視覺(jué)詞匯表。
[0009]所述步驟(3)的計(jì)算公式如下:
【權(quán)利要求】
1.一種基于語(yǔ)義特征提取與匹配的物體識(shí)別方法,其特征在于,所述方法包括: (1)語(yǔ)義特征提取部分:首先選取一類物體的若干圖片作為訓(xùn)練庫(kù),提取所有圖片的SIFT特征點(diǎn);通過(guò)k-均值聚類算法對(duì)所有SIFT特征點(diǎn)進(jìn)行空間聚類,然后利用基于核函數(shù)的決策機(jī)制,決策出每個(gè)空間類別內(nèi)的若干有效點(diǎn);利用支持向量機(jī)分類器訓(xùn)練每個(gè)空間類別內(nèi)的有效點(diǎn),每個(gè)空間類別訓(xùn)練出一個(gè)具有語(yǔ)義特征的視覺(jué)單詞,最終提取出可描述一類物體語(yǔ)義特征的視覺(jué)詞匯表;選取多類物體的訓(xùn)練圖片,提取每類物體的視覺(jué)詞匯表,形成多類物體的視覺(jué)詞匯表; (2)語(yǔ)義特征匹配部分:首先提取一幅待測(cè)物體圖片的SIFT特征點(diǎn),作為待測(cè)物體的語(yǔ)義描述;利用支持向量機(jī)分類器,將待測(cè)物體的語(yǔ)義描述與多類物體的視覺(jué)詞匯表匹配分類;統(tǒng)計(jì)待測(cè)物體的視覺(jué)詞匯表直方圖,確定待測(cè)物體類別。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述語(yǔ)義特征提取部分包括以下:(1)選取一類物體的幅訓(xùn)練圖片,提取每幅圖片的SIFT特征點(diǎn); (2)將該類物體的所有的特征點(diǎn)Z聚類為K個(gè)空間類別,提取各空間類別的聚類中心 (3)按照基于核函數(shù)的決策機(jī)制,對(duì)類中的每個(gè)特征點(diǎn)進(jìn)行決策,得到每個(gè)特征點(diǎn)的決策值/(^ ; (4)設(shè)置支持向量機(jī)類別訓(xùn)練數(shù)據(jù)標(biāo)識(shí)Y,選取單個(gè)空間類別內(nèi)的若干有效特征點(diǎn)為本類別訓(xùn)練點(diǎn);選取所 有其它空間類別的若干有效點(diǎn)作為其它類別的特征訓(xùn)練點(diǎn); (5)針對(duì)于(4)標(biāo)識(shí)的訓(xùn)練數(shù)據(jù),利用SVM分類器學(xué)習(xí)訓(xùn)練,訓(xùn)練得到一類物體的^個(gè)視覺(jué)單詞,即該類物體的視覺(jué)詞匯表; (6)選取多類物體的訓(xùn)練圖片,提取每個(gè)類別的視覺(jué)詞匯表,形成多類物體的視覺(jué)詞匯表。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述語(yǔ)義特征匹配部分包括以下步驟: (1)針對(duì)于待識(shí)別物體圖片,對(duì)其進(jìn)行SIFT變換,檢測(cè)局部特征點(diǎn),提取該圖片的《個(gè)SIFT描述符Z ; (2)將局部描述符與多類物體視覺(jué)詞匯表匹配,統(tǒng)計(jì)每個(gè)描述符所對(duì)應(yīng)的視覺(jué)單詞vZ所在的物體類別; (3)統(tǒng)計(jì)《個(gè)測(cè)試描述符與每個(gè)物體類別的視覺(jué)詞匯表的匹配個(gè)數(shù),形成未知物體的視覺(jué)單詞直方圖,確定待測(cè)物體的類別。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟(3)的計(jì)算公式如下:f(rO = ^j:KJD(x,n))
? Cf其中,D(XtFi)表示待測(cè)點(diǎn);?與聚類中心η的歐氏距離。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟(4)中類別標(biāo)識(shí)為乃={+1-1},在訓(xùn)練一個(gè)視覺(jué)單詞的過(guò)程中,設(shè)訓(xùn)練樣本=1,2,...,《,則訓(xùn)練樣本類別標(biāo)識(shí)的確定方法為:
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述步驟(2)的計(jì)算公式如下:
【文檔編號(hào)】G06F17/30GK104008095SQ201210556032
【公開(kāi)日】2014年8月27日 申請(qǐng)日期:2013年2月25日 優(yōu)先權(quán)日:2013年2月25日
【發(fā)明者】艾浩軍, 艾雄軍, 艾曉敏 申請(qǐng)人:武漢三際物聯(lián)網(wǎng)絡(luò)科技有限公司