本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,尤其涉及一種應(yīng)用于國土資源視頻監(jiān)控系統(tǒng)中對特定違章建筑的識別預(yù)警方法。
技術(shù)背景
作為現(xiàn)有成熟網(wǎng)絡(luò)視頻監(jiān)控技術(shù)的一種行業(yè)應(yīng)用,國土資源的視頻監(jiān)控體系一般也包含了前端視頻信息采集,視頻編碼網(wǎng)絡(luò)傳輸,信息中心的操控管理與數(shù)據(jù)處理,其體系如附圖1所示。在實(shí)際的項(xiàng)目建設(shè)中,隨著監(jiān)控點(diǎn)的數(shù)量迅速增多,對于人工值守盯看將面臨海量的視頻或抓拍圖像信息,監(jiān)管人員面臨數(shù)量眾多的監(jiān)控圖像難免會疏忽遺漏重要的信息,視覺疲勞也會使得監(jiān)管效果不如人意。
基于圖像分析與處理的智能監(jiān)控是未來視頻監(jiān)控的發(fā)展方向,可以早發(fā)現(xiàn)、早預(yù)警,同時(shí)可實(shí)現(xiàn)大范圍監(jiān)控的無人值守。對于國土資源的視頻監(jiān)控系統(tǒng)而言,視頻監(jiān)控及圖像抓拍系統(tǒng)的主要功能之一就是要對監(jiān)控范圍內(nèi)出現(xiàn)的一些違法行為或違章建筑進(jìn)行及時(shí)的發(fā)現(xiàn)及預(yù)警,便于工作人員及時(shí)作出相應(yīng)的處理。反應(yīng)到系統(tǒng)中的核心技術(shù)問題就是要對特定監(jiān)控點(diǎn)抓拍到的圖像進(jìn)行特定物體的識別?;趫D像處理的物體識別基本上都使用了機(jī)器學(xué)習(xí)方法。為了改善這些方法的性能,通常需要收集更大的數(shù)據(jù)集,并構(gòu)建強(qiáng)有力的模型以及防止過擬合。但是現(xiàn)實(shí)環(huán)境中的同一類物體通常也會表現(xiàn)出復(fù)雜的形態(tài),因此要達(dá)到好的識別效果就必須使用龐大而準(zhǔn)確的訓(xùn)練集。
卷積神經(jīng)網(wǎng)絡(luò)cnn是深度學(xué)習(xí)中經(jīng)典而常用的模型之一,r-cnn(regionswithconvolutionalneuralnetworkfeatures)是基于深度學(xué)習(xí)的物體檢測領(lǐng)域中一種經(jīng)典算法,alexnet網(wǎng)絡(luò)模型是2012年以來最成功的卷積神經(jīng)網(wǎng)絡(luò)模型之一,其在公開的pascol_voc數(shù)據(jù)集上取得了優(yōu)異的檢測效果。alexnet中包含一些既新鮮而又不同尋常的特征,它們提高了網(wǎng)絡(luò)的性能,并減少了網(wǎng)絡(luò)的訓(xùn)練時(shí)間。alexnet網(wǎng)絡(luò)包含五個(gè)卷積層和三個(gè)全連接層(見附圖2)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是針對現(xiàn)有視頻監(jiān)控系統(tǒng)在國土資源監(jiān)測中的應(yīng)用,提供一種基于快速r-cnn物體識別的方法,用于國土資源視頻監(jiān)控系統(tǒng)中早期發(fā)現(xiàn)特定的違章建筑,從而達(dá)到及時(shí)預(yù)警的效果。
本發(fā)明所采用的技術(shù)方案是:一種國土資源視頻監(jiān)控系統(tǒng)中基于特定違章建筑識別預(yù)警方法,其特征在于,包括以下步驟:
步驟1:基于國土資源監(jiān)控視頻,對每一張視頻圖像,劃分需要預(yù)警的區(qū)域并記錄區(qū)域左上角的坐標(biāo)(m,n)和右下角的坐標(biāo)(x,y),將劃分需要預(yù)警的區(qū)域作為檢測樣本;
步驟2:構(gòu)建包括若干建筑物圖片的訓(xùn)練集,利用訓(xùn)練集基于alexnet卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練關(guān)于建筑的cnn模型,并使用cnn模型的對于訓(xùn)練集的輸出訓(xùn)練softmax分類器;
步驟3:對檢測樣本進(jìn)行去霧化處理;
步驟4:使用selectivesearch算法在檢測樣本中提取若干個(gè)候選區(qū)域,將每個(gè)候選區(qū)域歸一化到m×m×l,其中m的取值范圍為100-250,l為r/g/b三通道;然后在步驟2中訓(xùn)練好的cnn模型中正向傳播,提取最后一層的特征向量;
步驟5:使用步驟2中訓(xùn)練好的softmax分類器對步驟4中提取的特征向量進(jìn)行打分,得到步驟4中提取的候選區(qū)域?qū)τ诮ㄖ姆謹(jǐn)?shù)s,若該分?jǐn)?shù)s大于閾值t的話,則標(biāo)記該候選區(qū)域?yàn)榻ㄖ铮?/p>
步驟6:對標(biāo)記出的候選區(qū)域使用非極大值抑制nms法去除交叉多余的框,若一段連續(xù)時(shí)間該候選區(qū)域未標(biāo)記出建筑而當(dāng)前圖片檢測出建筑,則判定該建筑為違章建筑并預(yù)警。
相對于現(xiàn)有技術(shù),本發(fā)明的技術(shù)效果是:
1.相比于傳統(tǒng)的網(wǎng)絡(luò)視頻監(jiān)控,本發(fā)明可以有效的降低網(wǎng)絡(luò)流量所帶來的費(fèi)用。同時(shí)本發(fā)明實(shí)現(xiàn)了自動化、智能化的違章建筑預(yù)警,可實(shí)現(xiàn)大范圍監(jiān)控的無人值守;
2.本發(fā)明對回傳的圖片做了去霧化的處理,可以有效的增加識別的準(zhǔn)確率。
附圖說明
圖1為本發(fā)明實(shí)施例的應(yīng)用系統(tǒng)架構(gòu)模型;
圖2為本發(fā)明實(shí)施例中alexnet網(wǎng)絡(luò)架構(gòu)模型;
圖3為本發(fā)明的流程圖。
具體實(shí)施方式
為了便于本領(lǐng)域普通技術(shù)人員理解和實(shí)施本發(fā)明,下面結(jié)合附圖及實(shí)施例對本發(fā)明作進(jìn)一步的詳細(xì)描述,應(yīng)當(dāng)理解,此處所描述的實(shí)施示例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
本發(fā)明為針對國土視頻監(jiān)測系統(tǒng),采用特定的圖像采集策略獲取相應(yīng)的圖片集以后,再基于快速r-cnn訓(xùn)練出違章建筑模型,對各個(gè)監(jiān)控點(diǎn)做建筑識別,若連續(xù)一段時(shí)間該地區(qū)無建筑而當(dāng)前照片識別出建筑,則判定該建筑為違章建筑。
一種基于快速r-cnn物體識別的國土資源監(jiān)控預(yù)警方法,通過在前端對監(jiān)控云臺進(jìn)行設(shè)定,每天在固定的角度,以固定的攝像參數(shù)在預(yù)設(shè)的特定時(shí)間點(diǎn)進(jìn)行圖片抓拍回傳。在連續(xù)采集定點(diǎn)抓拍圖片之后,系統(tǒng)將針對此圖片序列進(jìn)行基于以下算法的物體識別,在所有圖片序列中找出可能有違章建筑的圖片進(jìn)行標(biāo)記,作為系統(tǒng)輸出,形成預(yù)警依據(jù),同時(shí)將標(biāo)記處的違章建筑加入訓(xùn)練集。
輸入:在某個(gè)待識別的固定預(yù)置位,在預(yù)定時(shí)間點(diǎn)(如6:00、14:00、22:00)依次抓拍圖片回傳(也可錄制一段視頻,然后對視頻流按一定的間隔頻率,如每隔5幀截取一幀,進(jìn)行截取,并對各個(gè)前端監(jiān)控點(diǎn)的來源分配唯一的id號作為分組依據(jù),同時(shí)加蓋時(shí)間戳以區(qū)分同一id下不同時(shí)間節(jié)點(diǎn)的視頻幀組),輸入回傳的圖片。
輸出:在訓(xùn)練好的cnn網(wǎng)絡(luò)上識別圖片中的違章建筑,并標(biāo)記出來作為算法的輸出。
請見圖3,本發(fā)明提供的一種國土資源視頻監(jiān)控系統(tǒng)中基于特定違章建筑識別預(yù)警方法,包括以下步驟:
步驟1:基于國土資源監(jiān)控視頻,對每一張視頻圖像,劃分需要預(yù)警的區(qū)域并記錄區(qū)域左上角的坐標(biāo)(m,n)和右下角的坐標(biāo)(x,y),將劃分需要預(yù)警的區(qū)域作為檢測樣本;
步驟2:構(gòu)建包括1000-2000張建筑物的訓(xùn)練集,利用訓(xùn)練集基于alexnet卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練關(guān)于建筑的cnn模型,并使用cnn模型的對于訓(xùn)練集的輸出訓(xùn)練softmax分類器;
具體實(shí)現(xiàn)包括以下子步驟:
步驟2.1:cnn網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)階段:使用alexnet網(wǎng)絡(luò)架構(gòu),alexnet網(wǎng)絡(luò)架構(gòu)見附圖2。
步驟2.2:cnn網(wǎng)絡(luò)有監(jiān)督預(yù)訓(xùn)練階段:直接用imagenet數(shù)據(jù)庫訓(xùn)練好的的alexnet網(wǎng)絡(luò)初始化參數(shù),然后在下一步fine-tuing階段進(jìn)行有監(jiān)督的參數(shù)微調(diào)。
步驟2.3:fine-tuning階段;
選取1000-2000張圖片作為訓(xùn)練集,標(biāo)記出圖片中違章建筑的左上方和右下方坐標(biāo),將alexnet卷積神經(jīng)網(wǎng)絡(luò)的最后一層替換成違章建筑輸出元和1個(gè)背景,使用selectivesearch算法在步驟1中劃分的檢測樣本中提取若干個(gè)候選區(qū)域,若提取出的候選區(qū)域與標(biāo)記的坐標(biāo)重疊度大于閾值t,則標(biāo)記為正樣本,否則為負(fù)樣本;
步驟2.4:對1000-2000張圖片選取出的預(yù)選框分組(batch-size),輸入至alexnt卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)中,網(wǎng)絡(luò)優(yōu)化求解時(shí)采用隨機(jī)梯度下降法,學(xué)習(xí)率大小為0.001。
其中,batch-size的取值為120,其中正樣本為90個(gè),負(fù)樣本為30個(gè)。
步驟3:對檢測樣本進(jìn)行去霧化處理;
所需檢測的圖片均為戶外拍攝,故易受霧霾天氣影響?;诎低ǖ赖娜レF算法公式如下:
其中j(x)為去霧后的圖片,i(x)為原圖,a為全球大氣光成分,t(x)為透射率,t0為閾值,當(dāng)t(x)小于t0時(shí)防止j(x)過大而使得圖像向白場過渡;
ω(x)表示以像素x為中心的一個(gè)窗口,ω為模擬因子來模擬正常天氣情況,其所計(jì)算的均為r/g/b三通道。參數(shù)ω的取值為0.90,參數(shù)t0的取值為0.15。
全球大氣光成分a的求取過程是,首先從暗通道圖中按照亮度的大小取前0.2%的像素;然后在這0.2%的像素在原始有霧視頻圖像i(x)對應(yīng)位置中尋找具有最高亮度的點(diǎn)的值,作為a值。
步驟4:使用selectivesearch算法在檢測樣本中提取若干個(gè)候選區(qū)域,將每個(gè)候選區(qū)域歸一化到m×m×l;然后在步驟2中訓(xùn)練好的cnn模型中正向傳播,提取最后一層的特征向量。其中m的取值范圍約為100-250,不同的尺寸需要相應(yīng)的修改alexnet網(wǎng)絡(luò)中相應(yīng)的參數(shù),l為r/g/b三通道。
步驟5:使用步驟2中訓(xùn)練好的softmax分類器對步驟4中提取的特征向量進(jìn)行打分,得到步驟4中提取的候選區(qū)域?qū)τ诮ㄖ姆謹(jǐn)?shù)s,若該分?jǐn)?shù)s大于某個(gè)閾值t的話,則標(biāo)記該候選區(qū)域?yàn)榻ㄖ铮?/p>
步驟6:對步驟5中標(biāo)記的候選區(qū)域使用非極大值抑制(nms)法去除交叉多余的框。若一段連續(xù)時(shí)間步驟1中劃分的監(jiān)控區(qū)域中未標(biāo)記出建筑而當(dāng)前圖片檢測出建筑,則判定該建筑為違章建筑并預(yù)警并提交人工審核。若為違章建筑,則加入違章建筑訓(xùn)練集。
對得到的某站點(diǎn)的所有圖片數(shù)組分別進(jìn)行特征識別處理,并返回識別結(jié)果作為預(yù)警依據(jù);識別的算法流程如圖3所示。
本發(fā)明設(shè)計(jì)的方法適合于大規(guī)模部署的監(jiān)控系統(tǒng)應(yīng)用場景。大規(guī)模監(jiān)控的效果僅靠人眼觀察視頻來判斷,不僅效率低下,而且收效甚微。本發(fā)明所設(shè)計(jì)的方法通過對傳回的圖片序列進(jìn)行智能化比對分析,針對國土監(jiān)測的業(yè)務(wù)需求,通過智能識別算法將回傳圖片中的疑似違章建筑進(jìn)行標(biāo)注,實(shí)現(xiàn)早期預(yù)警,將管理人員中海量的圖片信息中解放出來,大大提升了系統(tǒng)的運(yùn)營效能。
應(yīng)當(dāng)理解的是,本說明書未詳細(xì)闡述的部分均屬于現(xiàn)有技術(shù)。
應(yīng)當(dāng)理解的是,上述針對較佳實(shí)施例的描述較為詳細(xì),并不能因此而認(rèn)為是對本發(fā)明專利保護(hù)范圍的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的啟示下,在不脫離本發(fā)明權(quán)利要求所保護(hù)的范圍情況下,還可以做出替換或變形,均落入本發(fā)明的保護(hù)范圍之內(nèi),本發(fā)明的請求保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。