一種自動的圖片訓(xùn)練樣本提取方法及系統(tǒng)的制作方法

文檔序號：9432678閱讀：983來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種自動的圖片訓(xùn)練樣本提取方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理領(lǐng)域，具體設(shè)及一種自動的圖片訓(xùn)練樣本提取方法及系統(tǒng)。
【背景技術(shù)】
[0002] 傳統(tǒng)的手工勞動的方式在標(biāo)簽圖像方面對于大型數(shù)據(jù)集，百萬的圖像集合加上圖片，需要一個團(tuán)隊的人，花費(fèi)幾周時間手動標(biāo)簽運(yùn)些圖像中的每一個。
[0003] 在機(jī)器學(xué)習(xí)領(lǐng)域，人們普遍認(rèn)為提高模型預(yù)測精度的最有效的方法是提供更多準(zhǔn)確的，W及標(biāo)簽好的樣品來進(jìn)行模型訓(xùn)練。例如，一個用更多精確樣品訓(xùn)練出來的模型通常比具有較少樣品訓(xùn)練出來的模型更精確。該理論同樣的也適用于計算機(jī)視覺，更具體地說，適用于作為機(jī)器學(xué)習(xí)分支的自動圖像標(biāo)注。自動圖像標(biāo)注是用已經(jīng)訓(xùn)練的模型，自動檢測圖形的目標(biāo)或場景的方法。
[0004] 一般來講，用來做圖像識別模型訓(xùn)練樣本是由人標(biāo)記；例如，含有狗的圖像被貼上"狗"標(biāo)簽。然而，盡管標(biāo)記圖像的任務(wù)并不具有挑戰(zhàn)性，但是卻需要大量人力并且費(fèi)時。基于圖像認(rèn)知的深度學(xué)習(xí)的最近發(fā)展，需要數(shù)W百萬計的照片培訓(xùn)具有可接受的精度自動標(biāo)注系統(tǒng)。人工標(biāo)記如此大量圖像需要的時間和成本通常被描述為實(shí)現(xiàn)最先進(jìn)的自動圖像標(biāo)注系統(tǒng)的瓶頸。
[0005] 電腦感知圖像與人類不同。對于電腦，一個圖像只是1和0的集合。為了從圖像中提取有用的信息，我們需要告訴計算機(jī)如何W-種有意義的、可重復(fù)的方式識別圖像并從圖像中提取內(nèi)容。運(yùn)個重要的過程被稱為圖像特征提取。我們的方法是使用特定的預(yù) 先確定的"規(guī)則"作為數(shù)字特征向量來表示圖像。特征提取傳統(tǒng)"規(guī)則"是顏色、邊緣和梯度。然而，深度學(xué)習(xí)的最新發(fā)展，如卷積神經(jīng)網(wǎng)絡(luò)（CNN)，與傳統(tǒng)方法相比，深度學(xué)習(xí)功能更強(qiáng)大、更具描述性。
[0006] 為了解決大量圖像集合"維數(shù)的巧咒"（化rseofDimensionality),我們借鑒了近似近鄰捜索領(lǐng)域方面的觀點(diǎn)。據(jù)證實(shí)，在很多案例中，近似近鄰方法在精確度方面跟蠻力方法基本一樣，但在速度上是蠻力方法的多倍。有鑒于此，利用局部敏感哈希算法（Locally SensitiveHashForest)能夠減少高維圖像數(shù)據(jù)維數(shù)。

【發(fā)明內(nèi)容】

[0007] 為了解決上述問題，本發(fā)明一種自動的圖片訓(xùn)練樣本提取方法及系統(tǒng)。本發(fā)明針對在大量的無標(biāo)記的圖像用來找到訓(xùn)練的圖像，本發(fā)明提出的方法能夠自動檢索任何圖像集合中所需標(biāo)記的圖像，且檢索速度快、成本效益高。
[0008] 為達(dá)到上述目的，本發(fā)明采用的技術(shù)方案是：一種自動的圖片訓(xùn)練樣本提取方法，包括W下幾個步驟： (1) 解析圖像集合中所有圖像內(nèi)容，得到圖像集合的所有圖像特征； (2) 儲存所述圖像特征，建立圖像知識庫； (3) 解析由客戶端給出的目標(biāo)圖像的內(nèi)容，得到目標(biāo)圖像特征； (4) 根據(jù)所述目標(biāo)圖像特征，在圖像知識庫中尋找相似圖像； (5) 返回相似圖像至用戶數(shù)據(jù)庫。
[0009] 其中，基于圖像視覺特征利用深度學(xué)習(xí)方法提取圖像特征。深度學(xué)習(xí)方法提取圖像特征W實(shí)現(xiàn)所提取圖像特征的可靠性和準(zhǔn)確度。
[0010] 進(jìn)一步的是，所述深度學(xué)習(xí)方法提取圖像特征，具體為，對于圖像集合中的每一個圖像，提取1000個特征，并且每個特征代表一個圖像的特定方面。其中，無論圖像的大小或內(nèi)容，一個固定大小1000個數(shù)字永遠(yuǎn)用來表示圖像，W減少運(yùn)算量，提高運(yùn)算速率。
[0011] 進(jìn)一步的是，所述1000個特征的范圍為0到1。
[0012] 進(jìn)一步的是，所述步驟（2)中圖像特征的存儲，是通過局部敏感哈希算法，將同類型的圖像放入圖像知識庫中同一個儲存單元，運(yùn)意味運(yùn)只有屬于同一儲存單元的圖像才會被檢查，W取代集合中的所有項(xiàng)目，W便快速訪問和比較，提高查詢效率，利用局部敏感哈希算法來減少高維圖像數(shù)據(jù)維數(shù)，建立占用空間小的特征知識庫。
[0013] 進(jìn)一步的是，使用局部敏感哈希算法，存儲每個圖像1000個數(shù)字特征向量。
[0014] 進(jìn)一步的是，所述步驟（3 )具體為，根據(jù)視覺特征，解析所提供的目標(biāo)圖像內(nèi)容，使用深度學(xué)習(xí)方法提取圖像特征，同圖像集合中圖像特征提取方法相同。
[0015] 進(jìn)一步的是，所述步驟（4)具體為，利用余弦相似度算法尋找出相似圖像，余弦相似度的值越大意味著兩個圖像越視覺相似，為0時，表示運(yùn)兩個圖像完全不相關(guān)。
[0016] 另一方面，本發(fā)明還提供了一種自動的圖片訓(xùn)練樣本提取的系統(tǒng)，包括：圖像集合解析模塊：解析圖像集合所有圖像內(nèi)容，得到圖像集合的所有圖像特征；圖像知識庫：用來存儲所述的圖像集合的圖像特征，建立圖像知識庫；目標(biāo)圖像解析模塊：用于接收客戶端給出的目標(biāo)圖像，并解析目標(biāo)圖像，得到目標(biāo)圖像特征；圖像查詢模塊：根據(jù)目標(biāo)圖像特征，在圖像知識庫中尋找相似圖像；圖像輸出模塊：將相似圖像返回客戶端；其中，圖像集合解析模塊輸入端口連接外部客戶端，圖像集合解析模塊輸出端口連接圖像知識庫輸入端口；目標(biāo)圖像解析模塊輸入端口連接外部客戶端；目標(biāo)圖像解析模塊輸出端口連接至圖像查詢模塊輸入端口；圖像查詢模塊輸入端口還連接有圖像知識庫的輸出端口，圖像查詢模塊輸出端口與圖像輸出模塊輸入端口相連接，圖像輸出模塊輸出端口與外部客戶端相連。
[0017] 采用本技術(shù)方案的有益效果：本發(fā)明所提出的一種自動的圖片訓(xùn)練樣本提取方法及系統(tǒng)，能夠自動檢索任何圖像集合中所需標(biāo)記的圖像；在處理大量圖像時，工作效率更高，運(yùn)為確定訓(xùn)練圖像提供了一個快速、高效的方式，W識別任何圖像類別的訓(xùn)練圖像，本方法基于已經(jīng)提供的圖像的視覺相似性，只要幾分鐘就可W將圖像依次排列；基于與提供的圖像視覺特征，本發(fā)明的方法可W快速找到觀察者不容易觀察到的圖像，并且運(yùn)些圖像并不必然屬于同一類別，但視覺上非常相似，靈活性較高。
【附圖說明】
[0018] 圖1為本發(fā)明的方法流程圖；圖2為本發(fā)明的實(shí)施例中單個圖像特征提取的示意圖；圖3為本發(fā)明的實(shí)施例中多個圖像特征提取的示意圖；圖4為本發(fā)明的實(shí)施例中LSHF方法的示意圖；圖5為本發(fā)明的實(shí)施例中相似圖片特征提取的示意圖圖；圖6為本發(fā)明所述方法借助的系統(tǒng)結(jié)構(gòu)簡圖。
【具體實(shí)施方式】
[0019] 為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面結(jié)合附圖對本發(fā)明作進(jìn)一步闡述。
[0020] 參見圖1所示，一種自動的圖片訓(xùn)練樣本提取方法，包括W下幾個步驟： (1)解析圖像集合中所有圖像內(nèi)容，得到圖像集合的所有圖像特征。
[0021] 具體為，對于圖像集合中的每個圖像，基于圖像視覺特征，解析運(yùn)些圖像，提取圖像特征。
[0022] 實(shí)施例中，如圖2所示，使用特定的預(yù)先確定的"規(guī)則"作為數(shù)字特征向量來表示圖像，數(shù)學(xué)上可W表示為： r= {>"K,，Kj，…，K。} 上述公式中，w表示圖像，Vi表示描述圖像的特征。
[

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張一文;
技術(shù)所有人：成都品果科技有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

提取筆錄格式樣本相關(guān)技術(shù)

bp神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本相關(guān)技術(shù)

訓(xùn)練樣本和測試樣本相關(guān)技術(shù)

人臉識別訓(xùn)練樣本相關(guān)技術(shù)

訓(xùn)練樣本相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種自動的圖片訓(xùn)練樣本提取方法及系統(tǒng)的制作方法