本發(fā)明涉及一種檢測(cè)方法及系統(tǒng),尤其涉及一種城市場(chǎng)景垃圾檢測(cè)方法及系統(tǒng)。
背景技術(shù):
城市中無(wú)序丟棄的垃圾嚴(yán)重影響市容市貌、污染生活環(huán)境,給城市和居民帶來(lái)極大的影響。
為清理城市中無(wú)序丟棄的垃圾、維護(hù)城市衛(wèi)生和形象,需要對(duì)城市場(chǎng)景中的垃圾進(jìn)行檢測(cè)定位,然后根據(jù)定位來(lái)進(jìn)行清理。目前的城市場(chǎng)景垃圾檢測(cè)方法主要是派專人進(jìn)行巡查并進(jìn)行拍照登記,巡查的過(guò)程中需要人工定位無(wú)序丟棄的垃圾,操作手持相機(jī)進(jìn)行拍照,巡查過(guò)后進(jìn)行整理歸檔來(lái)記錄垃圾分布情況與對(duì)應(yīng)的相應(yīng)責(zé)任人。這種方法需要專人乘坐交通工具進(jìn)行拍照登記,受交通、天氣、人員休假與工作時(shí)間等方面的影響很大,不能做到全天候的城市無(wú)序丟棄垃圾狀況監(jiān)測(cè)和檢測(cè),并且人工拍照、整理還存在成本高、耗時(shí)長(zhǎng)等問(wèn)題,這就大大的不利于城市中無(wú)序丟棄垃圾的檢測(cè)和清理,不能保障城市衛(wèi)生和形象。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,有必要針對(duì)上述城市場(chǎng)景中的垃圾檢測(cè)和監(jiān)測(cè)不能全天候進(jìn)行、且成本高耗時(shí)長(zhǎng)的問(wèn)題,提供一種城市場(chǎng)景垃圾檢測(cè)方法及系統(tǒng)。
本發(fā)明提供的一種城市場(chǎng)景垃圾檢測(cè)方法,包括如下步驟:
S10:選定VOC數(shù)據(jù)集作為垃圾檢測(cè)的基礎(chǔ)數(shù)據(jù)集,收集城市影像并挑選出含有無(wú)序丟棄垃圾的城市影像作為候選集,按照VOC數(shù)據(jù)集定義的格式對(duì)候選集中城市影像含有無(wú)序丟棄垃圾的區(qū)域進(jìn)行標(biāo)注,將標(biāo)注后的城市影像與VOC數(shù)據(jù)集中已有數(shù)據(jù)進(jìn)行融合;
S20:在融合后的VOC數(shù)據(jù)集基礎(chǔ)上,搭建垃圾檢測(cè)的深度學(xué)習(xí)平臺(tái),在搭建的深度學(xué)習(xí)平臺(tái)上,獲取深度學(xué)習(xí)平臺(tái)提供的進(jìn)行垃圾檢測(cè)的預(yù)訓(xùn)練模型并對(duì)預(yù)訓(xùn)練模型進(jìn)行適應(yīng)性先驗(yàn)參數(shù)設(shè)置;
S30:采用預(yù)訓(xùn)練模型對(duì)新獲取城市影像進(jìn)行垃圾檢測(cè),檢測(cè)新獲取城市影像是否存在垃圾及垃圾存在區(qū)域,給出檢測(cè)結(jié)果。
在其中的一個(gè)實(shí)施方式中,所述步驟S10具體為:收集城市影像,挑選出含有無(wú)序丟棄垃圾的城市影像作為候選集,按照VOC數(shù)據(jù)集定義的格式,采用矩形選擇框?qū)蜻x集中城市影像含有無(wú)序丟棄垃圾的區(qū)域進(jìn)行標(biāo)注,標(biāo)注完成后,將標(biāo)注后的城市影像隨機(jī)的劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,并分別將新獲取的訓(xùn)練集、驗(yàn)證集和測(cè)試集同VOC數(shù)據(jù)集中已有的訓(xùn)練集、驗(yàn)證集和測(cè)試集進(jìn)行融合。
在其中的一個(gè)實(shí)施方式中,所述步驟S20具體為:
選擇Caffe深度學(xué)習(xí)框架進(jìn)行深度學(xué)習(xí)平臺(tái)的實(shí)現(xiàn),使用Model Zoo中的ZF模型作為垃圾檢測(cè)任務(wù)的預(yù)訓(xùn)練模型。
在其中的一個(gè)實(shí)施方式中,所述步驟S20具體為:使用網(wǎng)格搜索的方法在融合后的VOC數(shù)據(jù)集上驗(yàn)證不同先驗(yàn)參數(shù)對(duì)城市影像的檢測(cè)精度。
在其中的一個(gè)實(shí)施方式中,所述步驟S30具體包括:
對(duì)新獲取的城市影像進(jìn)行預(yù)處理,具體包括對(duì)新獲取城市影像進(jìn)行裁剪、縮放,和/或進(jìn)行均值提取處理;
將預(yù)處理之后的城市影像輸入深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),得到對(duì)城市影像中候選區(qū)域的分類和位置的回歸以得出檢測(cè)結(jié)果。
本發(fā)明提供的一種城市場(chǎng)景垃圾檢測(cè)系統(tǒng),包括:
數(shù)據(jù)融合模塊,選定VOC數(shù)據(jù)集作為垃圾檢測(cè)的基礎(chǔ)數(shù)據(jù)集,收集城市影像并挑選出含有無(wú)序丟棄垃圾的城市影像作為候選集,按照VOC數(shù)據(jù)集定義的格式對(duì)候選集中城市影像含有無(wú)序丟棄垃圾的區(qū)域進(jìn)行標(biāo)注,將標(biāo)注后的城市影像與VOC數(shù)據(jù)集中已有數(shù)據(jù)進(jìn)行融合;
深度學(xué)習(xí)平臺(tái)搭建模塊,在融合后的VOC數(shù)據(jù)集基礎(chǔ)上,搭建垃圾檢測(cè)的深度學(xué)習(xí)平臺(tái),在搭建的深度學(xué)習(xí)平臺(tái)上,獲取深度學(xué)習(xí)平臺(tái)提供的進(jìn)行垃圾檢測(cè)的預(yù)訓(xùn)練模型并對(duì)預(yù)訓(xùn)練模型進(jìn)行適應(yīng)性先驗(yàn)參數(shù)設(shè)置;
城市影像垃圾檢測(cè)模塊,采用預(yù)訓(xùn)練模型對(duì)新獲取城市影像進(jìn)行垃圾檢測(cè),檢測(cè)新獲取城市影像是否存在垃圾及垃圾存在區(qū)域,給出檢測(cè)結(jié)果。
在其中的一個(gè)實(shí)施方式中,所述數(shù)據(jù)融合模塊收集城市影像,挑選出含有無(wú)序丟棄垃圾的城市影像作為候選集,按照VOC數(shù)據(jù)集定義的格式,采用矩形選擇框?qū)蜻x集中城市影像含有無(wú)序丟棄垃圾的區(qū)域進(jìn)行標(biāo)注,標(biāo)注完成后,將標(biāo)注后的城市影像隨機(jī)的劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,并分別將新獲取的訓(xùn)練集、驗(yàn)證集和測(cè)試集同VOC數(shù)據(jù)集中已有的訓(xùn)練集、驗(yàn)證集和測(cè)試集進(jìn)行融合。
在其中的一個(gè)實(shí)施方式中,所述深度學(xué)習(xí)平臺(tái)搭建模塊選擇Caffe深度學(xué)習(xí)框架進(jìn)行深度學(xué)習(xí)平臺(tái)的實(shí)現(xiàn),使用Model Zoo中的ZF模型作為垃圾檢測(cè)任務(wù)的預(yù)訓(xùn)練模型。
在其中的一個(gè)實(shí)施方式中,所述深度學(xué)習(xí)平臺(tái)搭建模塊使用網(wǎng)格搜索的方法在融合后的VOC數(shù)據(jù)集上驗(yàn)證不同先驗(yàn)參數(shù)對(duì)城市影像的檢測(cè)精度。
在其中的一個(gè)實(shí)施方式中,所述城市影像垃圾檢測(cè)模塊對(duì)新獲取的城市影像進(jìn)行預(yù)處理,具體包括對(duì)新獲取城市影像進(jìn)行裁剪、縮放,和/或進(jìn)行均值提取處理;將預(yù)處理之后的城市影像輸入深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),得到對(duì)城市影像中候選區(qū)域的分類和位置的回歸以得出檢測(cè)結(jié)果。本發(fā)明城市場(chǎng)景垃圾檢測(cè)方法及系統(tǒng),選定視覺(jué)物體分類VOC數(shù)據(jù)集作為垃圾檢測(cè)的基礎(chǔ)數(shù)據(jù)集,獲取城市影像標(biāo)注出垃圾區(qū)域后與VOC數(shù)據(jù)集進(jìn)行融合擴(kuò)充和豐富VOC數(shù)據(jù)集,然后基于深度學(xué)習(xí)技術(shù)搭建深度學(xué)習(xí)平臺(tái),在深度學(xué)習(xí)平臺(tái)上選擇預(yù)訓(xùn)練模型,在對(duì)預(yù)訓(xùn)練模型進(jìn)行先驗(yàn)參數(shù)設(shè)置后通過(guò)深度學(xué)習(xí)平臺(tái)和預(yù)訓(xùn)練模型來(lái)對(duì)新獲取城市影像進(jìn)行垃圾檢測(cè),自動(dòng)給出檢測(cè)結(jié)果,不需要專人乘坐交通工具進(jìn)行拍照登記及人工垃圾區(qū)域的檢測(cè),能夠做到全天候的城市無(wú)序丟棄垃圾狀況監(jiān)測(cè)和檢測(cè),成本低、耗時(shí)短,這就大大的便利城市中無(wú)序丟棄垃圾的檢測(cè)和清理,保障城市衛(wèi)生和形象。
附圖說(shuō)明
圖1是一個(gè)實(shí)施例中的城市場(chǎng)景垃圾檢測(cè)方法的流程圖;
圖2是一個(gè)實(shí)施例中的城市場(chǎng)景垃圾檢測(cè)系統(tǒng)的結(jié)構(gòu)圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
圖1是一個(gè)實(shí)施例中城市場(chǎng)景垃圾檢測(cè)方法的流程圖,如圖1所示,該方法包括如下步驟:
S10:選定VOC(visual object classes,視覺(jué)物體分類)數(shù)據(jù)集作為垃圾檢測(cè)的基礎(chǔ)數(shù)據(jù)集,收集城市影像并挑選出含有無(wú)序丟棄垃圾的城市影像作為候選集,按照VOC數(shù)據(jù)集定義的格式對(duì)候選集中城市影像含有無(wú)序丟棄垃圾的區(qū)域進(jìn)行標(biāo)注,將標(biāo)注后的城市影像與VOC數(shù)據(jù)集中已有數(shù)據(jù)進(jìn)行融合。
VOC(visual object classes,視覺(jué)物體分類)數(shù)據(jù)集是權(quán)威的場(chǎng)景檢測(cè)數(shù)據(jù)集,包括有大量訓(xùn)練驗(yàn)證圖片和測(cè)試圖片,具有很多類已標(biāo)注對(duì)象,包括行人、自行車、公共汽車、小轎車、摩托車等城市場(chǎng)景內(nèi)的常見(jiàn)對(duì)象,通過(guò)VOC數(shù)據(jù)集中已經(jīng)標(biāo)注對(duì)象能夠?qū)Τ鞘杏跋裰械膶?duì)象進(jìn)行檢測(cè)識(shí)別。故在該實(shí)施例中,選定VOC(visual object classes,視覺(jué)物體分類)數(shù)據(jù)集作為垃圾檢測(cè)的基礎(chǔ)數(shù)據(jù)集,利用VOC數(shù)據(jù)集中的數(shù)據(jù)和標(biāo)注對(duì)象來(lái)進(jìn)行城市場(chǎng)景中無(wú)序丟棄垃圾的檢測(cè)。
由于VOC數(shù)據(jù)集中的數(shù)據(jù)有限,可能存在訓(xùn)練數(shù)據(jù)不足的問(wèn)題,該實(shí)施例中獲取城市影像來(lái)對(duì)VOC數(shù)據(jù)集進(jìn)行擴(kuò)充。具體的,收集城市影像,城市影像包括街景車拍攝的城市影像、由互聯(lián)網(wǎng)爬取的城市影像等。然后從中挑選出含有無(wú)序丟棄垃圾的城市影像作為候選集,按照VOC數(shù)據(jù)集定義的格式,采用矩形選擇框?qū)蜻x集中城市影像含有無(wú)序丟棄垃圾的區(qū)域進(jìn)行標(biāo)注(標(biāo)注過(guò)程中盡可能的在少標(biāo)入背景的條件下將感興趣對(duì)象標(biāo)入完整)。在標(biāo)注完之后,將標(biāo)注后的城市影像隨機(jī)的劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,并分別將新獲取的訓(xùn)練集、驗(yàn)證集和測(cè)試集同VOC數(shù)據(jù)集中已有的訓(xùn)練集、驗(yàn)證集和測(cè)試集進(jìn)行融合。
更進(jìn)一步的,選定VOC2007數(shù)據(jù)集作為垃圾檢測(cè)的基礎(chǔ)數(shù)據(jù)集。VOC2007數(shù)據(jù)集包括5011張訓(xùn)練驗(yàn)證圖片和4952張測(cè)試圖片,共有20類已標(biāo)注對(duì)象,適合作為基礎(chǔ)數(shù)據(jù)集。
S20:在融合后的VOC數(shù)據(jù)集基礎(chǔ)上,搭建垃圾檢測(cè)的深度學(xué)習(xí)平臺(tái),在搭建的深度學(xué)習(xí)平臺(tái)上,獲取深度學(xué)習(xí)平臺(tái)提供的進(jìn)行垃圾檢測(cè)的預(yù)訓(xùn)練模型并對(duì)預(yù)訓(xùn)練模型進(jìn)行適應(yīng)性先驗(yàn)參數(shù)設(shè)置。
在將獲取的城市影像與VOC數(shù)據(jù)集融合之后,在融合數(shù)據(jù)的基礎(chǔ)上,本發(fā)明方法基于深度學(xué)習(xí)算法來(lái)對(duì)城市場(chǎng)景中無(wú)序丟棄垃圾進(jìn)行檢測(cè),搭建垃圾檢測(cè)的深度學(xué)習(xí)平臺(tái),將深度學(xué)習(xí)應(yīng)用到城市場(chǎng)景垃圾檢測(cè)之中,擴(kuò)大深度學(xué)習(xí)的應(yīng)用。搭建垃圾檢測(cè)的深度學(xué)習(xí)平臺(tái)后,深度學(xué)習(xí)平臺(tái)具有多種預(yù)訓(xùn)練模型,則由多種預(yù)訓(xùn)練模型中選擇獲取適合進(jìn)行垃圾檢測(cè)的預(yù)訓(xùn)練模型。為使得所獲取的預(yù)訓(xùn)練模型能夠很好的適應(yīng)當(dāng)前地區(qū)的垃圾檢測(cè),還需要對(duì)預(yù)訓(xùn)練模型進(jìn)行適應(yīng)性先驗(yàn)參數(shù)設(shè)置。
為提高檢測(cè)精度,在具體的方式中,該步驟中選擇Caffe深度學(xué)習(xí)框架進(jìn)行深度學(xué)習(xí)平臺(tái)的實(shí)現(xiàn)。Caffe深度學(xué)習(xí)框架文檔完善、社區(qū)活躍并有豐富的模型庫(kù),適合進(jìn)行平臺(tái)搭建。同時(shí),平臺(tái)硬件配置采用GPU(浮點(diǎn)運(yùn)算能力更強(qiáng))作為運(yùn)算核心。進(jìn)一步的,使用Nividia Geforce GTX 980作為GPU,使用Interl Core i7與16G內(nèi)存作為主要的硬件配置。
在選擇Caffe深度學(xué)習(xí)框架進(jìn)行深度學(xué)習(xí)平臺(tái)的實(shí)現(xiàn)后,Caffe深度學(xué)習(xí)框架完善的社區(qū)生態(tài)提供了豐富的經(jīng)過(guò)良好預(yù)訓(xùn)練的模型,該實(shí)施例中,使用Model Zoo中的ZF模型作為垃圾檢測(cè)任務(wù)的預(yù)訓(xùn)練模型。
由于不同的應(yīng)用場(chǎng)景需要對(duì)預(yù)訓(xùn)練模型的先驗(yàn)參數(shù)進(jìn)行不同的調(diào)整,針對(duì)垃圾檢測(cè)應(yīng)用場(chǎng)景,該實(shí)施例中,使用網(wǎng)格搜索的方法在融合后的VOC數(shù)據(jù)集上驗(yàn)證不同先驗(yàn)參數(shù)對(duì)城市影像的檢測(cè)精度。經(jīng)過(guò)反復(fù)驗(yàn)證,該實(shí)施例最終選擇0.001作為初始學(xué)習(xí)率,0.0005作為權(quán)值衰減量,0.9作為沖量,并從每張城市影像中挑選出128個(gè)候選區(qū)域作為mini-batch(子集),進(jìn)行損失的反向傳播從而更新預(yù)訓(xùn)練模型權(quán)值。
S30:采用預(yù)訓(xùn)練模型對(duì)新獲取城市影像進(jìn)行垃圾檢測(cè),檢測(cè)新獲取城市影像是否存在垃圾及垃圾存在區(qū)域,給出檢測(cè)結(jié)果。
在搭建了深度學(xué)習(xí)平臺(tái)并且選擇獲取了預(yù)訓(xùn)練模型后,則采用獲取的預(yù)訓(xùn)練模型來(lái)對(duì)城市場(chǎng)景中無(wú)序丟棄的垃圾進(jìn)行檢測(cè)。具體的,新獲取城市場(chǎng)景的城市影像,然后采用預(yù)訓(xùn)練模型對(duì)新獲取城市影像進(jìn)行垃圾檢測(cè)。通過(guò)預(yù)訓(xùn)練模型的檢測(cè),判斷出城市影像是否存在垃圾及垃圾存在區(qū)域,給出檢測(cè)結(jié)果,從而通過(guò)深度學(xué)習(xí)及預(yù)訓(xùn)練模型實(shí)現(xiàn)城市場(chǎng)景中無(wú)序丟棄垃圾的檢測(cè)。
在進(jìn)一步的方式中,為使得城市影像滿足預(yù)訓(xùn)練模型的要求,對(duì)于新獲取的城市影像進(jìn)行預(yù)處理,對(duì)新獲取城市影像進(jìn)行裁剪或縮放,使新獲取城市影像符合預(yù)訓(xùn)練模型的要求。
同時(shí),由于城市影像的像素范圍是固定的,故還要對(duì)新獲取城市影像進(jìn)行均值提取處理。具體的,統(tǒng)計(jì)融合后VOC數(shù)據(jù)集的訓(xùn)練集中紅、綠、藍(lán)三個(gè)波段的像素值,得到三個(gè)波段像素的均值,將新獲取城市影像的三個(gè)波段減去對(duì)應(yīng)均值。在經(jīng)過(guò)預(yù)處理之后,將經(jīng)過(guò)預(yù)處理之后的城市影像輸入深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),得到對(duì)城市影像中候選區(qū)域的分類和位置的回歸以得出檢測(cè)結(jié)果。根據(jù)不同的應(yīng)用場(chǎng)景,選擇不同的置信度對(duì)候選結(jié)果進(jìn)行篩選,找出最有可能是無(wú)序丟棄垃圾的區(qū)域,實(shí)現(xiàn)對(duì)城市影像中無(wú)序丟棄垃圾的檢測(cè)。
該城市場(chǎng)景垃圾檢測(cè)方法,選定視覺(jué)物體分類VOC數(shù)據(jù)集作為垃圾檢測(cè)的基礎(chǔ)數(shù)據(jù)集,獲取城市影像標(biāo)注出垃圾區(qū)域后與VOC數(shù)據(jù)集進(jìn)行融合擴(kuò)充和豐富VOC數(shù)據(jù)集,然后基于深度學(xué)習(xí)技術(shù)搭建深度學(xué)習(xí)平臺(tái),在深度學(xué)習(xí)平臺(tái)上選擇預(yù)訓(xùn)練模型,在對(duì)預(yù)訓(xùn)練模型進(jìn)行先驗(yàn)參數(shù)設(shè)置后通過(guò)深度學(xué)習(xí)平臺(tái)和預(yù)訓(xùn)練模型來(lái)對(duì)新獲取城市影像進(jìn)行垃圾檢測(cè),自動(dòng)給出檢測(cè)結(jié)果,不需要專人乘坐交通工具進(jìn)行拍照登記及人工垃圾區(qū)域的檢測(cè),能夠做到全天候的城市無(wú)序丟棄垃圾狀況監(jiān)測(cè)和檢測(cè),成本低、耗時(shí)短,這就大大的便利城市中無(wú)序丟棄垃圾的檢測(cè)和清理,保障城市衛(wèi)生和形象。
同時(shí),本發(fā)明還提供一種城市場(chǎng)景垃圾檢測(cè)系統(tǒng),如圖2所示,該城市場(chǎng)景垃圾檢測(cè)系統(tǒng)包括:
數(shù)據(jù)融合模塊100,選定VOC(visual object classes,視覺(jué)物體分類)數(shù)據(jù)集作為垃圾檢測(cè)的基礎(chǔ)數(shù)據(jù)集,收集城市影像并挑選出含有無(wú)序丟棄垃圾的城市影像作為候選集,按照VOC數(shù)據(jù)集定義的格式對(duì)候選集中城市影像含有無(wú)序丟棄垃圾的區(qū)域進(jìn)行標(biāo)注,將標(biāo)注后的城市影像與VOC數(shù)據(jù)集中已有數(shù)據(jù)進(jìn)行融合。
VOC(visual object classes,視覺(jué)物體分類)數(shù)據(jù)集是權(quán)威的場(chǎng)景檢測(cè)數(shù)據(jù)集,包括有大量訓(xùn)練驗(yàn)證圖片和測(cè)試圖片,具有很多類已標(biāo)注對(duì)象,包括行人、自行車、公共汽車、小轎車、摩托車等城市場(chǎng)景內(nèi)的常見(jiàn)對(duì)象,通過(guò)VOC數(shù)據(jù)集中已經(jīng)標(biāo)注對(duì)象能夠?qū)Τ鞘杏跋裰械膶?duì)象進(jìn)行檢測(cè)識(shí)別。故在該實(shí)施例中,數(shù)據(jù)融合模塊100選定VOC(visual object classes,視覺(jué)物體分類)數(shù)據(jù)集作為垃圾檢測(cè)的基礎(chǔ)數(shù)據(jù)集,利用VOC數(shù)據(jù)集中的數(shù)據(jù)和標(biāo)注對(duì)象來(lái)進(jìn)行城市場(chǎng)景中無(wú)序丟棄垃圾的檢測(cè)。
由于VOC數(shù)據(jù)集中的數(shù)據(jù)有限,可能存在訓(xùn)練數(shù)據(jù)不足的問(wèn)題,該實(shí)施例中數(shù)據(jù)融合模塊100獲取城市影像來(lái)對(duì)VOC數(shù)據(jù)集進(jìn)行擴(kuò)充。具體的,數(shù)據(jù)融合模塊100收集城市影像,城市影像包括街景車拍攝的城市影像、由互聯(lián)網(wǎng)爬取的城市影像等;然后從中挑選出含有無(wú)序丟棄垃圾的城市影像作為候選集,按照VOC數(shù)據(jù)集定義的格式,采用矩形選擇框?qū)蜻x集中城市影像含有無(wú)序丟棄垃圾的區(qū)域進(jìn)行標(biāo)注(標(biāo)注過(guò)程中盡可能的在少標(biāo)入背景的條件下將感興趣對(duì)象標(biāo)入完整);在標(biāo)注完之后,將標(biāo)注后的城市影像隨機(jī)的劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,并分別將新獲取的數(shù)據(jù)的訓(xùn)練集、驗(yàn)證集和測(cè)試集同VOC數(shù)據(jù)集中的已有的訓(xùn)練集、驗(yàn)證集和測(cè)試集進(jìn)行融合。
更進(jìn)一步的,數(shù)據(jù)融合模塊100選定VOC2007數(shù)據(jù)集作為垃圾檢測(cè)的基礎(chǔ)數(shù)據(jù)集。VOC2007數(shù)據(jù)集包括5011張訓(xùn)練驗(yàn)證圖片和4952張測(cè)試圖片,共有20類已標(biāo)注對(duì)象,適合作為基礎(chǔ)數(shù)據(jù)集。
深度學(xué)習(xí)平臺(tái)搭建模塊200,在融合后的VOC數(shù)據(jù)集基礎(chǔ)上,搭建垃圾檢測(cè)的深度學(xué)習(xí)平臺(tái),在搭建的深度學(xué)習(xí)平臺(tái)上,獲取深度學(xué)習(xí)平臺(tái)提供的進(jìn)行垃圾檢測(cè)的預(yù)訓(xùn)練模型并對(duì)預(yù)訓(xùn)練模型進(jìn)行適應(yīng)性先驗(yàn)參數(shù)設(shè)置。
在將獲取的城市影像與VOC數(shù)據(jù)集融合之后,在融合數(shù)據(jù)的基礎(chǔ)上,本發(fā)明系統(tǒng)基于深度學(xué)習(xí)算法來(lái)對(duì)城市場(chǎng)景中無(wú)序丟棄垃圾進(jìn)行檢測(cè),深度學(xué)習(xí)平臺(tái)搭建模塊200搭建垃圾檢測(cè)的深度學(xué)習(xí)平臺(tái),將深度學(xué)習(xí)應(yīng)用到城市場(chǎng)景垃圾檢測(cè)之中,擴(kuò)大深度學(xué)習(xí)的應(yīng)用。搭建垃圾檢測(cè)的深度學(xué)習(xí)平臺(tái)后,深度學(xué)習(xí)平臺(tái)具有多種預(yù)訓(xùn)練模型,深度學(xué)習(xí)平臺(tái)搭建模塊200則由多種預(yù)訓(xùn)練模型中選擇獲取適合進(jìn)行垃圾檢測(cè)的預(yù)訓(xùn)練模型。為使得所獲取的預(yù)訓(xùn)練模型能夠很好的適應(yīng)當(dāng)前地區(qū)的垃圾檢測(cè),還需要對(duì)預(yù)訓(xùn)練模型進(jìn)行適應(yīng)性先驗(yàn)參數(shù)設(shè)置。
為提高檢測(cè)精度,深度學(xué)習(xí)平臺(tái)搭建模塊200選擇Caffe深度學(xué)習(xí)框架進(jìn)行深度學(xué)習(xí)平臺(tái)的實(shí)現(xiàn)。Caffe深度學(xué)習(xí)框架文檔完善、社區(qū)活躍并有豐富的模型庫(kù),適合進(jìn)行平臺(tái)搭建。同時(shí),深度學(xué)習(xí)平臺(tái)硬件配置采用GPU(浮點(diǎn)運(yùn)算能力更強(qiáng))作為運(yùn)算核心。進(jìn)一步的,使用Nividia Geforce GTX 980作為GPU,使用Interl Core i7與16G內(nèi)存作為主要的硬件配置。
在選擇Caffe深度學(xué)習(xí)框架進(jìn)行深度學(xué)習(xí)平臺(tái)的實(shí)現(xiàn)后,Caffe深度學(xué)習(xí)框架完善的社區(qū)生態(tài)提供了豐富的經(jīng)過(guò)良好預(yù)訓(xùn)練的模型,該實(shí)施例中,深度學(xué)習(xí)平臺(tái)搭建模塊200使用Model Zoo中的ZF模型作為垃圾檢測(cè)任務(wù)的預(yù)訓(xùn)練模型。
由于不同的應(yīng)用場(chǎng)景需要對(duì)預(yù)訓(xùn)練模型的先驗(yàn)參數(shù)進(jìn)行不同的調(diào)整,針對(duì)垃圾檢測(cè)應(yīng)用場(chǎng)景,該實(shí)施例中,深度學(xué)習(xí)平臺(tái)搭建模塊200使用網(wǎng)格搜索的方法在融合后的VOC數(shù)據(jù)集上驗(yàn)證不同先驗(yàn)參數(shù)對(duì)城市影像的檢測(cè)精度。經(jīng)過(guò)反復(fù)驗(yàn)證,該實(shí)施例最終選擇0.001作為初始學(xué)習(xí)率,0.0005作為權(quán)值衰減量,0.9作為沖量,并從每張城市影像中挑選出128個(gè)候選區(qū)域作為mini-batch(子集),進(jìn)行損失的反向傳播從而更新預(yù)訓(xùn)練模型權(quán)值。
城市影像垃圾檢測(cè)模塊300,采用預(yù)訓(xùn)練模型對(duì)新獲取城市影像進(jìn)行垃圾檢測(cè),檢測(cè)新獲取城市影像是否存在垃圾及垃圾存在區(qū)域,給出檢測(cè)結(jié)果。
在搭建了深度學(xué)習(xí)平臺(tái)并且選擇獲取了預(yù)訓(xùn)練模型后,城市影像垃圾檢測(cè)模塊300采用獲取的預(yù)訓(xùn)練模型來(lái)對(duì)城市場(chǎng)景中無(wú)序丟棄的垃圾進(jìn)行檢測(cè)。具體的,新獲取城市場(chǎng)景的城市影像,然后采用預(yù)訓(xùn)練模型對(duì)新獲取城市影像進(jìn)行垃圾檢測(cè)。通過(guò)預(yù)訓(xùn)練模型的檢測(cè),判斷出城市影像是否存在垃圾及垃圾存在區(qū)域,給出檢測(cè)結(jié)果,從而通過(guò)深度學(xué)習(xí)及預(yù)訓(xùn)練模型實(shí)現(xiàn)城市場(chǎng)景中無(wú)序丟棄垃圾的檢測(cè)。
在進(jìn)一步的方式中,為使得城市影像滿足預(yù)訓(xùn)練模型的要求,城市影像垃圾檢測(cè)模塊300對(duì)于新獲取的城市影像進(jìn)行預(yù)處理,對(duì)新獲取城市影像進(jìn)行裁剪或縮放,使新獲取城市影像符合預(yù)訓(xùn)練模型的要求。
同時(shí),由于城市影像的像素范圍是固定的,故城市影像垃圾檢測(cè)模塊300還要對(duì)新獲取城市影像進(jìn)行均值提取預(yù)處理。具體的,城市影像垃圾檢測(cè)模塊300統(tǒng)計(jì)融合后VOC數(shù)據(jù)集的訓(xùn)練集中紅、綠、藍(lán)三個(gè)波段的像素值,得到三個(gè)波段像素的均值,將新獲取城市影像的三個(gè)波段減去對(duì)應(yīng)均值。在經(jīng)過(guò)預(yù)處理之后,將經(jīng)過(guò)預(yù)處理之后的城市影像輸入深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),得到對(duì)城市影像中候選區(qū)域的分類和位置的回歸以得出檢測(cè)結(jié)果。根據(jù)不同的應(yīng)用場(chǎng)景,選擇不同的置信度對(duì)候選結(jié)果進(jìn)行篩選,找出最有可能是無(wú)序丟棄垃圾的區(qū)域,實(shí)現(xiàn)對(duì)城市影像中無(wú)序丟棄垃圾的檢測(cè)。
該城市場(chǎng)景垃圾檢測(cè)系統(tǒng),選定視覺(jué)物體分類VOC數(shù)據(jù)集作為垃圾檢測(cè)的基礎(chǔ)數(shù)據(jù)集,獲取城市影像標(biāo)注出垃圾區(qū)域后與VOC數(shù)據(jù)集進(jìn)行融合擴(kuò)充和豐富VOC數(shù)據(jù)集,然后基于深度學(xué)習(xí)技術(shù)搭建深度學(xué)習(xí)平臺(tái),在深度學(xué)習(xí)平臺(tái)上選擇預(yù)訓(xùn)練模型,在對(duì)預(yù)訓(xùn)練模型進(jìn)行先驗(yàn)參數(shù)設(shè)置后通過(guò)深度學(xué)習(xí)平臺(tái)和預(yù)訓(xùn)練模型來(lái)對(duì)新獲取城市影像進(jìn)行垃圾檢測(cè),自動(dòng)給出檢測(cè)結(jié)果,不需要專人乘坐交通工具進(jìn)行拍照登記及人工垃圾區(qū)域的檢測(cè),能夠做到全天候的城市無(wú)序丟棄垃圾狀況監(jiān)測(cè)和檢測(cè),成本低、耗時(shí)短,這就大大的便利城市中無(wú)序丟棄垃圾的檢測(cè)和清理,保障城市衛(wèi)生和形象。
本發(fā)明城市場(chǎng)景垃圾檢測(cè)方法及系統(tǒng),選定視覺(jué)物體分類VOC數(shù)據(jù)集作為垃圾檢測(cè)的基礎(chǔ)數(shù)據(jù)集,獲取城市影像標(biāo)注出垃圾區(qū)域后與VOC數(shù)據(jù)集進(jìn)行融合擴(kuò)充和豐富VOC數(shù)據(jù)集,然后基于深度學(xué)習(xí)技術(shù)搭建深度學(xué)習(xí)平臺(tái),在深度學(xué)習(xí)平臺(tái)上選擇預(yù)訓(xùn)練模型,在對(duì)預(yù)訓(xùn)練模型進(jìn)行先驗(yàn)參數(shù)設(shè)置后通過(guò)深度學(xué)習(xí)平臺(tái)和預(yù)訓(xùn)練模型來(lái)對(duì)新獲取城市影像進(jìn)行垃圾檢測(cè),自動(dòng)給出檢測(cè)結(jié)果,不需要專人乘坐交通工具進(jìn)行拍照登記及人工垃圾區(qū)域的檢測(cè),能夠做到全天候的城市無(wú)序丟棄垃圾狀況監(jiān)測(cè)和檢測(cè),成本低、耗時(shí)短,這就大大的便利城市中無(wú)序丟棄垃圾的檢測(cè)和清理,保障城市衛(wèi)生和形象。
以上僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。