本發(fā)明涉機器學習領域,特別涉及一種基于卷積神經(jīng)的農(nóng)作物害蟲圖像識別方法。
背景技術:
傳統(tǒng)的病蟲害診斷采用人工觀測的方式,這一方式存在主觀性、局限性、模糊性等不足。隨著計算機圖像處理以及人工智能技術的發(fā)展,人們開始利用計算機代替人來進行農(nóng)作物的病蟲害診斷,提出了在計算機上實現(xiàn)病蟲害的識別。
目前有基于傳統(tǒng)的圖像識別技術對病蟲害圖像進行識別,該技術采用灰度變換、中值濾波、閥值分割、輪廓檢測、病斑提取作為與處理數(shù)據(jù),從預處理數(shù)據(jù)顯式提取紋理特征、顏色特征和形狀特征。傳統(tǒng)的圖像識別方法是基于圖像的“點特征”或“線特征”進行的。對于一般圖像的識別匹配效果較好,但是當光照條件較復雜、拍照角度變化大時,魯棒性不好?;诰矸e神經(jīng)的圖像識別方法克服了傳統(tǒng)算法中對光照條件改變和拍照角度改變適應性不強的問題。
而且,上述傳統(tǒng)的圖像識別方法只提取圖像的部分具有代表性的特征,比如sift和surf,具有一定的局限性,某些過程還需要人工選取;人工神經(jīng)網(wǎng)絡容易過擬合,參數(shù)很難調(diào)整,訓練比較慢,并且在層數(shù)較少時效果并不比其他方法更優(yōu)。
20世紀60年代,hubel和wiesel在研究貓腦皮層中用于局部敏感和方向選擇的神經(jīng)元時發(fā)現(xiàn)其獨特的網(wǎng)絡結(jié)構(gòu)可以有效地降低反饋神經(jīng)網(wǎng)絡的復雜性,繼而提出了卷積神經(jīng)網(wǎng)(convolutionalneuralnetworks-簡稱cnn)。現(xiàn)在,cnn已經(jīng)成為眾多科學領域的研究熱點之一,特別是在模式分類領域,由于該網(wǎng)絡避免了對圖像的復雜前期預處理,可以直接輸入原始圖像,因而得到了更為廣泛的應用。
技術實現(xiàn)要素:
為解決現(xiàn)有技術中的缺點和不足,本發(fā)明提出一種基于卷積神經(jīng)的農(nóng)作物害蟲圖像識別方法,將卷積神經(jīng)與農(nóng)作物害蟲圖像識別相結(jié)合,采用逐層初始化的訓練方式,充分發(fā)揮深度學習自我學習的優(yōu)勢可以有效解決特征提取困難、訓練難度大、參數(shù)很難調(diào)整的問題。
本發(fā)明的技術方案時這樣實現(xiàn)的:
一種基于卷積神經(jīng)的農(nóng)作物害蟲圖像的方法,包括:農(nóng)作物害蟲圖像數(shù)據(jù)庫、圖像預處理、卷積神經(jīng)網(wǎng)絡和模型;農(nóng)作物害蟲圖像數(shù)據(jù)庫的圖像經(jīng)過預處理輸入到卷積神經(jīng)網(wǎng)絡,經(jīng)過帶標簽圖像訓練后得到逐層計算后能夠提取具有代表性的特征的模型,將要分類的圖像經(jīng)過預處理輸入到訓練好模型的卷積神經(jīng)網(wǎng)絡得到該圖像屬于各種類型的概率。
可選地,所述輸入層,隱藏層和輸出層,包括以下步驟:
步驟a,輸入層輸入經(jīng)過預處理的三通道圖像像素值。
步驟b,隱含層包括:卷積層、池化層、dropout層和全連接層,隱藏層首先使用前向傳播,再食用反向傳播進行訓練;
步驟c,輸出層即進行分類的層,分類器softmax接收全連接層輸入,輸出該圖像所屬各類別的概率。
可選地,隱藏層使用前向傳播的步驟,具體包括:
步驟a,從樣本集中取一個樣本x,yp,將x輸入網(wǎng)絡;
步驟b,計算相應的實際輸出op。
在此階段,信息從輸入層經(jīng)過逐級的變換,傳送到輸出層。這個過程也是網(wǎng)絡在完成訓練后正常運行時執(zhí)行的過程。在此過程中,網(wǎng)絡執(zhí)行的計算是(實際上就是輸入與每層的權值矩陣相點乘,得到最后的輸出結(jié)果):
op=fn(…(f2(f1(x*w1+b1)w2+b2)…)wn+bn)。
可選地,隱藏層使用反向傳播,具體過程為:
步驟a,計算實際輸出op與相應的理想輸出yp的差;
步驟b,按極小化誤差的方法反向傳播調(diào)整權矩陣。
算法如下的:
卷積層的輸出=sigmoid(sum(卷積值)+偏移量)。
本發(fā)明的有益效果是:
1、充分發(fā)揮深度學習的自我學習優(yōu)勢,經(jīng)過前向傳播和反向傳播訓練得到能提取具有代表性特征的模型,當輸入一副圖像時,能夠快速準確的提取特征,進行逐層抽象知道形成某一事物的概念,并用分類器進行分類;
2、利用深度學習網(wǎng)絡的結(jié)構(gòu)特征,采取逐層初始化的訓練機制,大大降低訓練難度;
3、由于深度學習網(wǎng)絡將圖像分割后提取每一部分的特征,然后再將特征進行組合,而非直接比較整幅圖,從任何角度拍攝獲取的圖像,得到的局部特征都幾乎相同,這就解決了拍攝角度的問題;而且可以識別位移、縮放及其他形式扭曲不變性的二維圖形,這就解決了拍攝角度限制的問題。
4、卷積神經(jīng)與農(nóng)民關注的農(nóng)作害蟲防治結(jié)合,更方便農(nóng)民治理害蟲,易于被認可和傳播,提高研究價值。
附圖說明
圖1是本發(fā)明所述卷積神經(jīng)網(wǎng)絡結(jié)構(gòu)示意圖;
圖2是本發(fā)明所述卷積示意圖;
圖3是本發(fā)明所述dropout層示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實例僅僅是本發(fā)明一部分實例,而不是全部的實例。基于本發(fā)明中的實例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲的的所有其他實例,都屬于本發(fā)明保護的范圍。
如圖1-3所示,本發(fā)明的基于卷積神經(jīng)的農(nóng)作物害蟲圖像識別方法,包括:農(nóng)作物害蟲圖像數(shù)據(jù)庫、圖像預處理、卷積神經(jīng)網(wǎng)絡和模型;農(nóng)作物害蟲圖像數(shù)據(jù)庫的圖像經(jīng)過預處理輸入到卷積神經(jīng)網(wǎng)絡,經(jīng)過帶標簽圖像訓練后得到逐層計算后能夠提取具有代表性的特征的模型,將要分類的圖像經(jīng)過預處理輸入到訓練好模型的卷積神經(jīng)網(wǎng)絡得到該圖像屬于各種類型的概率,即分類結(jié)果。
其中,深度學習網(wǎng)絡分為:輸入層、隱藏層和輸出層,包括以下步驟:
步驟a,輸入層輸入經(jīng)過預處理的三通道圖像像素值。
步驟b,隱藏層設置為7層,首先使用前向傳播,再使用反向傳播修改模型參數(shù)來進行訓練。
步驟c,輸出層進行分類的層,分類器softmax接收全連接層輸入,輸出該圖像所屬各類別的概率。
隱藏層使用前向傳播的步驟,具體包括:
步驟a,從樣本集中取一個樣本x,yp,將x輸入網(wǎng)絡;
步驟b,計算相應的實際輸出op。
在此階段,信息從輸入層經(jīng)過逐級的變換,傳送到輸出層。這個過程也是網(wǎng)絡在完成訓練后正常運行時執(zhí)行的過程。在此過程中,網(wǎng)絡執(zhí)行的計算是(實際上就是輸入與每層的權值矩陣相點乘,得到最后的輸出結(jié)果):
op=fn(…(f2(f1(x*w1+b1)w2+b2)…)wn+bn)
隱藏層使用反向傳播,具體過程為:
步驟a,計算前向傳播輸出op與相應的理想輸出yp的差;
步驟b,按極小化誤差的方法反向傳播調(diào)整權矩陣。
其中,上述步驟b中,調(diào)整權矩陣過程為:通過梯度下降法修改權值w和偏移值b使前向傳播輸出值op收斂。
算法如下的:
卷積層的輸出=sigmoid(sum(卷積值)+偏移量);
圖2為本發(fā)明中部分卷積神經(jīng)網(wǎng)絡的解析圖,由圖2可以看出,輸入層為顯層,輸入經(jīng)過預處理的圖像像素值。
本發(fā)明充分發(fā)揮深度學習的自我學習優(yōu)勢,經(jīng)過前向傳播和反向傳播訓練得到能提取具有代表性特征的模型,當輸入一副圖像時,能夠快速準確的提取特征,進行逐層抽象知道形成某一事物的概念,并用分類器進行分類;而且可以識別位移、縮放及其他形式扭曲不變性的二維圖形,這就解決了拍攝角度限制的問題。
而且,由于深度學習網(wǎng)絡將圖像分割后提取每一部分的特征,然后再將特征進行組合,而非直接比較整幅圖像,從任何角度拍攝獲取的圖像,得到的局部特征都幾乎相同,這就解決了拍攝角度限制的問題。
并且,農(nóng)作物害蟲圖像的識別更關注農(nóng)作物的產(chǎn)量和質(zhì)量,利于普遍推廣,將兩者結(jié)合具有很高的研究價值與應用前景。
以上所述僅為本發(fā)明的較佳實例而已,并不用以限制本發(fā)明,凡在本發(fā)明精神和原則之內(nèi),所作出的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。