數(shù)量巨大。從而采用K均值聚類(lèi)算法對(duì)所有訓(xùn)練圖像中提取出的全部SURF-色度特征向量進(jìn)行聚類(lèi),以得到特征向量詞典。所述“K均值聚類(lèi)算法”為K-means聚類(lèi)算法,其采用的歐式距離度量方法,即計(jì)算每個(gè)對(duì)象到各個(gè)聚類(lèi)中心的距離,離哪個(gè)聚類(lèi)中心的距離最短則屬于哪一類(lèi)。進(jìn)一步,通過(guò)K均值聚類(lèi)生成特征向量詞典為數(shù)字圖像處理領(lǐng)域的公知技術(shù),這里不再贅述。
[0026]S3、對(duì)待聚類(lèi)的每幅圖像提取用于生成B0W特征向量的SURF-色度特征向量,并結(jié)合所述SURF-色度特征向量詞典生成表征所述待聚類(lèi)的每幅圖像的B0W特征向量。
[0027]具體地,對(duì)于需要進(jìn)行聚類(lèi)的每幅圖像,提取圖像中所有SURF-色度特征向量,并結(jié)合特征向量詞典生成用以表征該幅圖像的BoW(Bag of Words詞袋)特征向量,這樣就將需要進(jìn)行聚類(lèi)的所有圖像都轉(zhuǎn)化成了與其對(duì)應(yīng)的B0W特征向量。值得的注意的,對(duì)于需要聚類(lèi)的每幅圖像提取圖像中所有SURF-色度特征向量的方法與提取訓(xùn)練圖像中所有SURF-色度特征向量的方法相同,其不可以采用不同的方法,這樣采用利用由SURF-色度特征向量生成的特征向量詞典生成以表征該幅圖像的B0W特征向量。其中,B0W(Bag Of Words)算法也稱(chēng)為詞袋算法,起源于基于語(yǔ)義的文本檢索算法,是一種有效地基于語(yǔ)義特征提取與描述的物體識(shí)別算法。B0W模型通過(guò)對(duì)圖像進(jìn)行特征提取和描述,得到大量特征進(jìn)行處理,從而得到用來(lái)表示圖像的單詞,并在此基礎(chǔ)上構(gòu)建視覺(jué)詞典,然后對(duì)待聚類(lèi)圖像采用相同的處理方法并生成B0W特征,將結(jié)果代入到訓(xùn)練的聚類(lèi)器中進(jìn)行聚類(lèi)。對(duì)于基于特征向量詞典生成圖像的B0W特征向量為數(shù)字圖像處理領(lǐng)域公知技術(shù),這里不再贅述。
[0028]S4、對(duì)所有待聚類(lèi)圖像的B0W特征向量采用基于SNN相似度的DBSCAN聚類(lèi)算法進(jìn)行聚類(lèi),并根據(jù)所述聚類(lèi)對(duì)圖像進(jìn)行相應(yīng)的聚類(lèi)。
[0029]具體地,對(duì)所有待聚類(lèi)圖像的B0W特征向量采用基于SNN相似度的DBSCAN聚類(lèi)算法進(jìn)行聚類(lèi),以將所有待聚類(lèi)圖像的B0W特征向量劃分為不同的簇,屬于同一個(gè)簇中的B0W特征向量對(duì)應(yīng)的圖像也相應(yīng)地劃分為同一個(gè)類(lèi)別的圖。其采用DBSCAN聚類(lèi)算法對(duì)B0W特征向量進(jìn)行聚類(lèi)處理,針對(duì)分布不規(guī)則和含有大量噪音的數(shù)據(jù)進(jìn)行處理,使得生成的密度簇參考點(diǎn)具有較高的精度。在實(shí)際應(yīng)用中,所述SNN相似度基于余弦相似度來(lái)計(jì)算。需要注意的是,使用DBSCAN聚類(lèi)后,有一部分圖像會(huì)被拋棄,即這部分圖像不屬于已經(jīng)劃分好的任一類(lèi)另IJ,這部分圖像可以留待人工處理。在這里,SNN相似度為計(jì)算中使用的基本鄰近性的度量,DBSCAN (Density Based Spatial Clustering of Applicat1ns with Noise)聚類(lèi)算法為基于密度的聚類(lèi)方法,其中心思想為:若一個(gè)點(diǎn)簇可由其中的任何核心對(duì)象唯一確定,對(duì)于某一點(diǎn)簇中的對(duì)象,給定半徑的鄰域內(nèi)數(shù)據(jù)對(duì)象個(gè)數(shù)必須大于給定值。對(duì)于SNN相似度計(jì)算、DBSCAN聚類(lèi)算法和余弦相似度皆為數(shù)字圖像處理領(lǐng)域公知技術(shù),這里不再贅述。
[0030]本發(fā)明所提供一種基于局部色度特征的圖像聚類(lèi)方法,對(duì)每幅訓(xùn)練圖像提取SURF-色度特征向量,對(duì)整個(gè)訓(xùn)練圖像集合的SURF-色度特征進(jìn)行K均值聚類(lèi)以得到特征向量詞典;對(duì)待聚類(lèi)的所有圖像提取SURF-色度特征向量,根據(jù)所述特征向量詞典生成相應(yīng)的B0W特征向量;對(duì)所有待聚類(lèi)圖像的B0W特征向量執(zhí)行基于SNN相似度的DBSCAN聚類(lèi),根據(jù)所述聚類(lèi)對(duì)相應(yīng)的圖像進(jìn)行類(lèi)別劃分。本方法結(jié)合了圖像的局部灰度梯度和局部色度特征,可以簡(jiǎn)單、有效地實(shí)現(xiàn)圖像的聚類(lèi)。同時(shí)對(duì)圖像的特性有更好的描述能力,更能表現(xiàn)類(lèi)內(nèi)樣本的相似性和類(lèi)間樣本的相異性,可以得到更好的聚類(lèi)結(jié)果。
[0031]本發(fā)明還提供了一種基于局部色度特征的圖像聚類(lèi)系統(tǒng),請(qǐng)參照?qǐng)D2,所述系統(tǒng)包括:
提取模塊100,用于采用SURF特征提取算法提取每幅圖像的SURF-色度特征向量,具體如上所述;
聚類(lèi)模塊200,用于對(duì)整個(gè)訓(xùn)練圖像集合的SURF-色度特征采用K均值聚類(lèi)算法聚類(lèi)得到特征向量詞典,具體如上所述;
生成模塊300,用于將待聚類(lèi)的每幅圖像的SURF-色度特征向量結(jié)合所述SURF-色度特征向量詞典生成表征所述待聚類(lèi)的每幅圖像的B0W特征向量,具體如上所述;
劃分模塊400,用于對(duì)所有待聚類(lèi)圖像的B0W特征向量采用基于SNN相似度的DBSCAN聚類(lèi)算法進(jìn)行聚類(lèi),并根據(jù)所述聚類(lèi)對(duì)圖像進(jìn)行相應(yīng)的聚類(lèi)。
[0032]所述的基于局部色度特征的圖像聚類(lèi)系統(tǒng),其中,所述提取模塊100包括:
SURF特征向量提取子模塊,用于對(duì)每幅圖像提取SURF特征點(diǎn),根據(jù)所述SURF特征點(diǎn)獲取其對(duì)應(yīng)的SURF特征向量;
SURF-色度特征向量提取子模塊,用于提取所述SURF特征向量對(duì)應(yīng)的色度特征向量,根據(jù)所述SURF特征向量以及與其對(duì)應(yīng)的色度特征向量得到SURF-色度特征向量。
[0033]所述的基于局部色度特征的圖像聚類(lèi)系統(tǒng),其中,所述SURF-色度特征向量提取子模塊還用于將提取所述SURF特征向量的圖像區(qū)域劃分為若干子區(qū)域,分別提取所述若干子區(qū)域的平均色度分量,所述平均色度分量構(gòu)成色度特征向量。
[0034]所述的基于局部色度特征的圖像聚類(lèi)系統(tǒng),其中,所述SURF-色度特征向量提取子模塊還用于將所述SURF特征向量以及與其對(duì)應(yīng)的色度特征向量拼接并歸一化。
[0035]上述基于局部色度特征的圖像聚類(lèi)系統(tǒng)的各個(gè)單元模塊都已經(jīng)在上述方法中進(jìn)行了詳細(xì)介紹,這里就不再贅述了。
[0036]可以理解的是,對(duì)本領(lǐng)域普通技術(shù)人員來(lái)說(shuō),可以根據(jù)本發(fā)明的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,而所有這些改變或替換都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。
【主權(quán)項(xiàng)】
1.一種基于局部色度特征的圖像聚類(lèi)方法,其特征在于,其包括: A、對(duì)每幅訓(xùn)練圖像采用SURF特征提取算法提取SURF特征,根據(jù)所述SURF特征獲取其對(duì)應(yīng)的SURF-色度特征向量; B、對(duì)整個(gè)訓(xùn)練圖像集合的SURF-色度特征向量采用K均值聚類(lèi)算法聚類(lèi)得到SURF-色度特征向量詞典; C、對(duì)待聚類(lèi)的每幅圖像提取用于生成BOW特征向量的SURF-色度特征向量,并結(jié)合所述SURF-色度特征向量詞典生成表征所述待聚類(lèi)的每幅圖像的BOW特征向量; D、對(duì)所有待聚類(lèi)圖像的BOW特征向量采用基于SNN相似度的DBSCAN聚類(lèi)算法進(jìn)行聚類(lèi),并根據(jù)所述聚類(lèi)對(duì)圖像進(jìn)行相應(yīng)的聚類(lèi)。2.根據(jù)權(quán)利要求1所述的基于局部色度特征的圖像聚類(lèi)方法,其特征在于,所述步驟A具體包括: A1、對(duì)每幅訓(xùn)練圖像提取SURF特征點(diǎn),根據(jù)所述SURF特征點(diǎn)獲取其對(duì)應(yīng)的SURF特征向量; A2、提取所述SURF特征向量對(duì)應(yīng)的色度特征向量,根據(jù)所述SURF特征向量以及與其對(duì)應(yīng)的色度特征向量得到SURF-色度特征向量。3.根據(jù)權(quán)利要求2所述的基于局部色度特征的圖像聚類(lèi)方法,其特征在于,所述步驟A2中所述的提取所述SURF特征向量對(duì)應(yīng)的色度特征向量具體過(guò)程為:將提取所述SURF特征向量的圖像區(qū)域劃分為若干子區(qū)域,分別提取所述若干子區(qū)域的平均色度分量,所述平均色度分量構(gòu)成色度特征向量。4.根據(jù)權(quán)利要求2所述的基于局部色度特征的圖像聚類(lèi)方法,其特征在于,所述步驟A2中所述的根據(jù)SURF特征向量以及與其對(duì)應(yīng)的色度特征向量得到SURF-色度特征向量具體過(guò)程為:將所述SURF特征向量及與其對(duì)應(yīng)的色度特征向量進(jìn)行拼接并歸一化得到SURF-色度特征向量。5.根據(jù)權(quán)利要求1-4任一所述的基于局部色度特征的圖像聚類(lèi)方法,其特征在于,所述步驟B中所述的對(duì)待聚類(lèi)的每幅圖像提取SURF-色度特征向量采用的提取方法與步驟A中提取訓(xùn)練圖像SURF-色度特征向量的方法相同。6.根據(jù)權(quán)利要求1所述的基于局部色度特征的圖像聚類(lèi)方法,其特征在于,所述步驟C中基于SNN相似度的DBSCAN聚類(lèi)算法中SNN相似度的計(jì)算基于余弦相似度。7.一種基于局部色度特征的圖像聚類(lèi)系統(tǒng),其特征在于,其包括: 提取模塊,用于采用SURF特征提取算法提取每幅圖像的SURF-色度特征向量; 聚類(lèi)模塊,用于對(duì)整個(gè)訓(xùn)練圖像集合的SURF-色度特征采用K均值聚類(lèi)算法聚類(lèi)得到特征向量詞典; 生成模塊,用于將待聚類(lèi)的每幅圖像的SURF-色度特征向量結(jié)合所述SURF-色度特征向量詞典生成表征所述待聚類(lèi)的每幅圖像的BOW特征向量; 劃分模塊,用于對(duì)所有待聚類(lèi)圖像的BOW特征向量采用基于SNN相似度的DBSCAN聚類(lèi)算法進(jìn)行聚類(lèi),并根據(jù)所述聚類(lèi)對(duì)圖像進(jìn)行相應(yīng)的聚類(lèi)。8.根據(jù)權(quán)利要求7所述的基于局部色度特征的圖像聚類(lèi)系統(tǒng),其特征在于,所述提取模塊包括: SURF特征向量提取子模塊,用于對(duì)每幅圖像提取SURF特征點(diǎn),根據(jù)所述SURF特征點(diǎn)獲取其對(duì)應(yīng)的SURF特征向量; SURF-色度特征向量提取子模塊,用于提取所述SURF特征向量對(duì)應(yīng)的色度特征向量,根據(jù)所述SURF特征向量以及與其對(duì)應(yīng)的色度特征向量得到SURF-色度特征向量。9.根據(jù)權(quán)利要求8所述的基于局部色度特征的圖像聚類(lèi)系統(tǒng),其特征在于,所述SURF-色度特征向量提取子模塊還用于將提取所述SURF特征向量的圖像區(qū)域劃分為若干子區(qū)域,分別提取所述若干子區(qū)域的平均色度分量,所述平均色度分量構(gòu)成色度特征向量。10.根據(jù)權(quán)利要求9所述的基于局部色度特征的圖像聚類(lèi)系統(tǒng),其特征在于,所述SURF-色度特征向量提取子模塊還用于將所述SURF特征向量以及與其對(duì)應(yīng)的色度特征向量拼接并歸一化。
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于局部色度特征的圖像聚類(lèi)方法及系統(tǒng),對(duì)每幅訓(xùn)練圖像提取SURF-色度特征向量,對(duì)整個(gè)訓(xùn)練圖像集合的SURF-色度特征進(jìn)行K均值聚類(lèi)以得到特征向量詞典;對(duì)待聚類(lèi)的所有圖像提取SURF-色度特征向量,根據(jù)所述特征向量詞典生成相應(yīng)的BOW特征向量;對(duì)所有待聚類(lèi)圖像的BOW特征向量執(zhí)行基于SNN相似度的DBSCAN聚類(lèi),根據(jù)所述聚類(lèi)對(duì)圖像進(jìn)行相應(yīng)的類(lèi)別劃分。本發(fā)明提出的方法充分利用圖像局部灰度梯度和色度的特征,對(duì)圖像的特性有更好的表征能力,改善了聚類(lèi)的效果。此外,在對(duì)圖像進(jìn)行聚類(lèi)時(shí),使用基于SNN相似性的DBSCAN聚類(lèi)方法,可以處理不同大小、形狀和密度的簇,改善圖像的聚類(lèi)效果。
【IPC分類(lèi)】G06K9/62, G06K9/46
【公開(kāi)號(hào)】CN105488509
【申請(qǐng)?zhí)枴緾N201510801871
【發(fā)明人】陳永灑
【申請(qǐng)人】Tcl集團(tuán)股份有限公司
【公開(kāi)日】2016年4月13日
【申請(qǐng)日】2015年11月19日