一種基于機(jī)器視覺的負(fù)樣本采集方法與流程

文檔序號：11621023閱讀：1391來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及圖像處理技術(shù)領(lǐng)域，尤其涉及一種基于機(jī)器視覺的負(fù)樣本采集方法。

背景技術(shù)：

目前，在用機(jī)器學(xué)習(xí)算法進(jìn)行目標(biāo)分類時，需要用到大量圖像樣本來訓(xùn)練分類器，如深度學(xué)習(xí)算法對圖像樣本的需求量一般以萬張為單位。圖像樣本大多數(shù)都是通過攝像頭采集的，如：車載攝像頭或行車記錄儀等。為了獲得更優(yōu)的算法魯棒性，機(jī)器學(xué)習(xí)算法對負(fù)樣本的需求量則更大，如：在訓(xùn)練cascade分類器時，默認(rèn)情況下，正負(fù)樣本量之比在1:3到1:5之間。

相對于正樣本來說，負(fù)樣本是非常難以采集的，尤其特定應(yīng)用場景的負(fù)樣本。如果用理想的背景圖像作為負(fù)樣本，則更難辦到，因為或多或少存在著待檢測目標(biāo)的干擾。

在一張視頻圖像中，目標(biāo)前景在其中所占的比例通常非常小，而非目標(biāo)區(qū)域則占據(jù)著非常大的圖像區(qū)域。并且，在用車載攝像頭進(jìn)行樣本采集時，目標(biāo)前景在連續(xù)幾幀、十幾幀甚至幾十幀的情況下，狀態(tài)改變非常小，而非目標(biāo)區(qū)域相對于目標(biāo)前景而言，則變化要快很多。所以，將圖片中的非目標(biāo)區(qū)域裁剪出來作為負(fù)樣本，則既可滿足負(fù)樣本的復(fù)雜性、多樣性和與應(yīng)用場景一致性要求，也容易實現(xiàn)，同時可提高視頻樣本的使用率。

現(xiàn)在，對負(fù)樣本的收集，主要是通過樣本公開庫、人工裁剪和基于深度學(xué)習(xí)等方式。

網(wǎng)絡(luò)上提供的免費樣本公開庫一般提供的樣本量是非常有限的，而且有的公開庫直接提供未標(biāo)注和未裁剪的原始視頻，根本無法滿足分類器訓(xùn)練的需求。

人工裁剪一般都是通過眾包的方式或科研企事業(yè)單位自己通過攝像頭進(jìn)行日復(fù)一日的采集，然后通過人工標(biāo)注和裁剪來獲取訓(xùn)練樣本。人工進(jìn)行樣本收集的工作量非常大，效率非常低，很耗時。由于人完全參與，導(dǎo)致最終的負(fù)樣本很隨意，什么場景的都有，很可能給機(jī)器學(xué)習(xí)系統(tǒng)引入人為誤差。

基于深度學(xué)習(xí)進(jìn)行樣本裁剪，主要是先基于深度學(xué)習(xí)網(wǎng)絡(luò)對樣本進(jìn)行自動化裁剪，然后基于裁剪結(jié)果進(jìn)行人工篩選。雖然一定程度上減少了人的參與，但是一方面，這種方式主要是用于正樣本采集；另一方面，眾所周知，深度學(xué)習(xí)對硬件的要求非常高，且計算量非常大，對硬件的計算能力和存儲能力等有一定的要求，從而會增加前期成本的投入。

技術(shù)實現(xiàn)要素：

本發(fā)明提供一種基于機(jī)器視覺的負(fù)樣本采集方法，旨在解決現(xiàn)有技術(shù)中的缺陷，實現(xiàn)在保證負(fù)樣本與應(yīng)用場景一致，數(shù)量上滿足分類器訓(xùn)練需求的情況下，降低人工成本。

為達(dá)到上述目的，本發(fā)明所采取的技術(shù)方案為：

本發(fā)明提供一種基于機(jī)器視覺的負(fù)樣本采集方法，包括：

訓(xùn)練分類器的步驟：利用樣本公開庫中的樣本訓(xùn)練分類器；

讀取視頻幀圖像的步驟：每間隔預(yù)設(shè)幀f讀取一次視頻幀圖像；

設(shè)置roi的步驟：在視頻幀圖像中設(shè)置合適的roi；

獲取目標(biāo)矩形框位置的步驟：用所述訓(xùn)練后的分類器對所述視頻幀圖像進(jìn)行目標(biāo)檢測，并用目標(biāo)矩形框進(jìn)行標(biāo)識，同時記錄所述目標(biāo)矩形框位置ri；

獲取裁剪矩形框位置的步驟：在該視頻幀圖像上，利用預(yù)設(shè)大小的滑行窗口獲取候選負(fù)樣本圖像塊的裁剪矩形框位置rect；

計算重疊面積的步驟：將所述裁剪矩形框位置rect依次與所述目標(biāo)矩形框位置ri兩兩之間進(jìn)行重疊檢測，并計算重疊面積slap；

計算重疊面積比的步驟；

選擇裁剪矩形框的步驟：將所述重疊面積比sr與預(yù)設(shè)閾值st進(jìn)行比較，若所述重疊面積比sr大于所述預(yù)設(shè)閾值st，則舍棄該裁剪矩形框；否則保留裁剪矩形框，并返回計算重疊面積的步驟；

裁剪負(fù)樣本的步驟：根據(jù)所述裁剪矩形框位置，在該幀圖片上進(jìn)行裁剪，作為負(fù)樣本。

進(jìn)一步地，所述基于機(jī)器視覺的負(fù)樣本采集方法，還包括：

篩選負(fù)樣本的步驟：當(dāng)全部視頻序列處理完畢后，對最后裁剪得到的負(fù)樣本進(jìn)行人工篩選，剔除掉不合格的負(fù)樣本。

具體地，所述預(yù)設(shè)幀f為15～20幀。

具體地，所述滑行窗口的像素為130*130。

具體地，所述閾值范圍st＝0.3～0.5。

具體地，所述閾值范圍st＝0.4。

具體地，所述計算重疊面積slap包括如下步驟：

獲取兩矩形的左上角行坐標(biāo)y1、y2，以及列坐標(biāo)x1、x2，兩矩形的寬w1、w2以及兩矩形的高h(yuǎn)1、h2；

確定最小的起始列start_col和最大的終止列end_col、最小的起始行start_row和最大的終止行end_row；

判斷兩矩形在行列方向上是否發(fā)生重疊，是則進(jìn)入下一步；

計算其重疊面積slap。

具體地，所述判斷兩矩形在行列方向上是否發(fā)生重疊包括：

若w＝w1+w2-(end_col-start_col)>0則表示兩矩形在列方向發(fā)生了重疊，否則表示沒有發(fā)生重疊；

若h＝h1+h2-(end_row-start_row)>0則表示兩矩形在行方向發(fā)生了重疊，否則表示沒有發(fā)生重疊。

具體地，所述重疊面積slap＝h*w。

本發(fā)明的有益效果在于：本發(fā)明通過傳統(tǒng)機(jī)器學(xué)習(xí)算法，利用網(wǎng)絡(luò)上樣本公開庫提供的樣本就可實現(xiàn)負(fù)樣本的自動裁剪，節(jié)約了硬件、人力和時間等前期成本。而且，對于一幀視頻圖像裁剪多個樣本(包括正負(fù)樣本)，有利于提高視頻樣本的利用率，從而降低了單位成本；再者，裁剪到的負(fù)樣本與正樣本來自同一應(yīng)用場景，有利于提高分類器的泛化能力。

附圖說明

圖1是本發(fā)明的基于機(jī)器視覺的負(fù)樣本采集方法的流程示意圖。

具體實施方式

下面結(jié)合附圖具體闡明本發(fā)明的實施方式，附圖僅供參考和說明使用，不構(gòu)成對本發(fā)明專利保護(hù)范圍的限制。

請參看圖1，本發(fā)明的實施例提供一種基于機(jī)器視覺的負(fù)樣本采集方法，包括：

第1步、訓(xùn)練分類器的步驟：利用樣本公開庫中的樣本訓(xùn)練分類器。

例如，在車輛檢測中，可用kitti、inriacardataset、mitcardataset、uiucimagedatabaseforcardetection、imagenet等樣本公開庫中的樣本訓(xùn)練hog+svm或haar+cascade等檢測系統(tǒng)。

第2步、讀取視頻幀圖像的步驟：每間隔預(yù)設(shè)幀f讀取一次視頻幀圖像。

例如，所述預(yù)設(shè)幀f為15～20幀。

由于實際情況下，在一組視頻序列中，由于攝像頭幀率與目標(biāo)移動速度之間存在差異，導(dǎo)致非目標(biāo)區(qū)域可能在連續(xù)十幾幀或幾十幀中狀態(tài)的改變非常小，所以為了避免重復(fù)裁剪同一區(qū)域，加快自動化裁剪速度，減少后面人工篩選的工作量，可以每隔若干幀讀取一次視頻幀圖像。

第3步、設(shè)置roi的步驟：在視頻幀圖像中設(shè)置合適的roi。

roi是regionofinterest的縮寫，意為“感興趣區(qū)域”。在機(jī)器視覺、圖像處理中，rio是從被處理的圖像中以方框、圓、橢圓、不規(guī)則多邊形等方式勾勒出需要處理的區(qū)域。

所述roi是通過下采樣(對圖像進(jìn)行縮小)或人為設(shè)定的方式來進(jìn)行。例如：對于存在畸變的圖像，則取中間區(qū)域部分作為roi。

第4步、獲取目標(biāo)矩形框位置的步驟：用第1步中訓(xùn)練后的分類器對所述視頻幀圖像進(jìn)行目標(biāo)檢測，并用目標(biāo)矩形框進(jìn)行標(biāo)識，同時記錄所述目標(biāo)矩形框位置ri。

在本步驟中，所述目標(biāo)可能不止一個。

第5步、獲取裁剪矩形框位置的步驟：在該視頻幀圖像上，利用預(yù)設(shè)大小的滑行窗口獲取候選負(fù)樣本圖像塊的裁剪矩形框位置rect。

例如，所述滑行窗口的像素為130*130。

第6步、計算重疊面積的步驟：將所述裁剪矩形框位置rect依次與第4步中的目標(biāo)矩形框位置ri兩兩之間進(jìn)行重疊檢測，并計算重疊面積slap。

在本實施例中，所述計算重疊面積slap包括如下步驟：

首先，假設(shè)兩個矩形為rect_1(x1,y1,w1,h1)、rect_2(x2,y2,w2,h2)，其中，x1、x2分別對應(yīng)兩矩形左上角坐標(biāo)的列，y1、y2分別對應(yīng)兩矩形左上角坐標(biāo)的行，w1、w2分別對應(yīng)兩矩形的寬，h1、h2則分別對應(yīng)兩矩形的高。

第601步、獲取兩矩形的左上角行坐標(biāo)y1、y2，以及列坐標(biāo)x1、x2，兩矩形的寬w1、w2以及兩矩形的高h(yuǎn)1、h2。

第602步、確定最小的起始列start_col和最大的終止列end_col、最小的起始行start_row和最大的終止行end_row。

具體地，start_col＝min(x1,x2)，end_col＝max(x1+w1,x2+w2)；

start_row＝min(y1,y2)，end_row＝max(y1+h1,y2+h2)。

其中，min(x,y)表示取兩者中的較小者，max(x,y)表示取兩者中的較大者。

第603步、判斷兩矩形在行列方向上是否發(fā)生重疊，是則進(jìn)入下一步。

在本實施例中，所述判斷兩矩形在行列方向上是否發(fā)生重疊包括：

若w＝w1+w2-(end_col-start_col)>0則表示兩矩形在列方向發(fā)生了重疊，否則表示沒有發(fā)生重疊；

若h＝h1+h2-(end_row-start_row)>0則表示兩矩形在行方向發(fā)生了重疊，否則表示沒有發(fā)生重疊。

第604步、計算其重疊面積slap。

在本實施例中，所述重疊面積slap＝h*w。

第7步、計算重疊面積比的步驟。

具體地，所述重疊面積比sr＝slap/{min[area(rect),area(ri)]}，其中，min[area(rect),area(ri)]表示area(rect)與area(ri)中的較小者。

第8步、選擇裁剪矩形框的步驟：將所述重疊面積比sr與預(yù)設(shè)閾值st進(jìn)行比較，若所述重疊面積比sr大于所述預(yù)設(shè)閾值st，則舍棄該裁剪矩形框；否則保留裁剪矩形框，并返回第6步。

具體地，所述閾值范圍st＝0.3～0.5，在本例中，st＝0.4。

第9步、裁剪負(fù)樣本的步驟：根據(jù)第8步中得到的裁剪矩形框位置，在該幀圖片上進(jìn)行裁剪，作為負(fù)樣本。

第10步、篩選負(fù)樣本的步驟：當(dāng)全部視頻序列處理完畢后，對最后裁剪得到的負(fù)樣本進(jìn)行人工篩選，剔除掉不合格的負(fù)樣本。

由于第1步中訓(xùn)練出的分類器存在一定的檢測誤差，會導(dǎo)致裁剪出來的少量負(fù)樣本圖像中存在檢測目標(biāo)的情況，這些負(fù)樣本是不合格的，需要剔除掉。

以上所揭露的僅為本發(fā)明的較佳實施例，不能以此來限定本發(fā)明的權(quán)利保護(hù)范圍，因此依本發(fā)明申請專利范圍所作的等同變化，仍屬本發(fā)明所涵蓋的范圍。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：杜仙童
技術(shù)所有人：惠州華陽通用電子有限公司
我是此專利的發(fā)明人

上一篇：核電廠數(shù)字平臺的制造方法與工藝
上一篇：多量子比特器件及包括其的量子計算機(jī)的制造方法與工藝

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

dna樣本采集卡相關(guān)技術(shù)

親子鑒定樣本采集相關(guān)技術(shù)

機(jī)器視覺光源選擇方法相關(guān)技術(shù)

機(jī)器視覺檢測設(shè)備相關(guān)技術(shù)

機(jī)器視覺照明相關(guān)技術(shù)

機(jī)器視覺產(chǎn)品相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于機(jī)器視覺的負(fù)樣本采集方法與流程