基于分水嶺算法的視頻對象提取方法

文檔序號：6340603閱讀：989來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：基于分水嶺算法的視頻對象提取方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種視頻對象提取和視頻信號處理方法，具體講是一種基于分水嶺算法的視頻對象提取方法。屬于計算機(jī)視覺研究領(lǐng)域。
背景技術(shù)：
視頻對象提取技術(shù)是計算機(jī)視覺和模式識別的重要研究對象之一，不僅具有很高的理論價值，而且在許多實際問題中，如基于內(nèi)容的視頻監(jiān)控、運動檢測等方面都得到了廣泛的應(yīng)用。同時，視頻對象提取也是一項比較復(fù)雜的技術(shù)，牽涉到幾何學(xué)、數(shù)學(xué)形態(tài)學(xué)、計算技術(shù)等許多領(lǐng)域，研究至今已經(jīng)提出了很多算法，這些算法一般從視頻對象的某些關(guān)鍵屬性出發(fā)，建立相應(yīng)的數(shù)學(xué)模型，使模型以視頻對象的這些屬性為唯一解或者局部最優(yōu)解。然后就利用數(shù)值計算或計算機(jī)模擬的方法對模型進(jìn)行求解，從而完成對視頻對象的提取。
分水嶺(watershed segmentation)算法是一種基于塊的靜態(tài)圖象分割算法，也是一種常用的視頻對象提取算法。在水線分割算法中，通過得到聚水盆就可以劃分出相應(yīng)的不同的圖象區(qū)域，這種思想時比較直觀的。經(jīng)文獻(xiàn)檢索發(fā)現(xiàn)，圖象的水線分割有兩類方法，第一類方法(S H Collins.Terrain parameters directly from a digitalterrain model.Canadian Surveyor，加拿大測量29(5)507-518，1975)是從每個象素出發(fā)獲得到達(dá)拓?fù)淝婢植孔畹蛥^(qū)域的下降路線，一個聚水盆就是由所有匯到同一個局部最低區(qū)域的下降路線組成，這種方法計算量非常大，而且精度不高。第二類方法(L Vincent and P Soille.Watershed in digital spacesAn efficient algorithm basedon immersion simulations.IEEE Transactions on Pattern Analysis and MachineIntelligence，IEEE模式識別與機(jī)器視覺雜志13(6)583-598，1991)與第一類方法正好相反，是從聚水盆的盆底出發(fā)，采用模擬注水的方法(盆底看作是連通的)當(dāng)相鄰的聚水盆中的水溢出時相遇點連成線就形成了分水嶺，該算法效率高，精度好，是比較普遍使用的一種分水嶺算法。但是傳統(tǒng)的分水嶺算法最大的缺點就是過分割現(xiàn)象，即有時會出現(xiàn)大量的分割圖象塊，這主要是噪聲和圖象內(nèi)容本身比較復(fù)雜造成的，也是分水嶺算法本身無法克服的。

發(fā)明內(nèi)容
本發(fā)明目的在于克服現(xiàn)有視頻內(nèi)容監(jiān)控技術(shù)的缺陷，提供一種高效，準(zhǔn)確的基于分水嶺算法的視頻對象提取方法。使其解決視頻對象提取計算量大，準(zhǔn)確性不高的問題，從而使視頻監(jiān)控的效率和實用性大大提高，為進(jìn)一步進(jìn)行的視頻對象跟蹤，監(jiān)控視頻對象狀態(tài)提供可靠的依據(jù)。
本發(fā)明是通過以下技術(shù)方案實現(xiàn)的，本發(fā)明首先獲得視頻輸入的初始幀，然后根據(jù)用戶事先生成的監(jiān)控區(qū)域配置文件確定需要提取的視頻對象所在的局部矩形區(qū)域，接著在已經(jīng)確定的各矩形區(qū)域中分別進(jìn)行預(yù)處理(濾波去噪)、分水嶺分割以及顏色分析和區(qū)域聚類處理，最后存儲提取的視頻對象。
以下對本發(fā)明作進(jìn)一步的說明，方法包括如下步驟(1)視頻幀讀取以RGB的格式讀入圖象數(shù)據(jù)，然后分別轉(zhuǎn)換為YUV12和HSI格式的數(shù)據(jù)保存；(2)預(yù)處理采用Roberts算子計算原圖象的梯度圖象，然后用中值濾波的方法對梯度圖象去噪聲，減少由于噪聲引起的過分割；中值濾波器窗口大小的選擇應(yīng)兼顧濾波效果和運算速度。
(3)圖象分割采用分水嶺算法對圖象進(jìn)行塊分割。具體說以圖象的灰度作為第三維建立三維拓?fù)鋱D，用Vincent和Soille提出的模擬注水的方法提取拓?fù)鋱D表面的分水嶺，自然形成不同的區(qū)域，完成圖象的塊分割；(4)顏色分析和區(qū)域聚合對每一對相鄰塊，首先計算它們的顏色相似度。一般來說，彩色數(shù)字圖象的顏色空間取RGB空間，但是就子色彩空間的區(qū)分度來說，其它顏色空間，如HSV，HSI和CIE更加便于分析和計算。在本發(fā)明中選取HSI作為顏色空間，H表示色調(diào)，S表示飽和度，I表示亮度。圖象中的每一個塊的灰度均值可以計算出來，塊合并的閾值由人的視覺特征一JND(Just Noticeable Difference)來確定設(shè)在某一個子色彩空間中相鄰兩個塊各自的灰度均值分別為I1和I2，如果|I1-I2|＜min(JDN(I1)，JND(I2))。則將這兩個塊合并成一個塊。
(5)弱邊界的處理經(jīng)過顏色聚類處理后，再消除弱邊界，即對每一條相鄰塊之間的邊界，檢驗邊界上的梯度大于某一設(shè)定閾值的象素的比例，若該比例超過50％則認(rèn)為是強(qiáng)邊界予以保留，反之則認(rèn)為是弱邊界，相應(yīng)的鄰塊進(jìn)行合并；(6)視頻對象保存以象素鏈表的數(shù)據(jù)結(jié)構(gòu)實現(xiàn)視頻對象的存儲。
由于視頻監(jiān)控的實時性要求，本發(fā)明采用了局部對象提取技術(shù)，即由用戶首先采用配置文件的方式向程序提供需要監(jiān)控的物體所在的矩形區(qū)域，程序就在該局部范圍內(nèi)進(jìn)行對象提取。與從整幀范圍進(jìn)行全局對象提取相比，這種局部對象提取方法不僅準(zhǔn)確性高而且計算量顯著下降，分割、聚類的速度完全可以達(dá)到實時監(jiān)控的要求。
本發(fā)明的針對傳統(tǒng)的分水嶺算法易產(chǎn)生過分割的缺陷，采用基于顏色信息的象素塊聚合的方法，結(jié)合弱邊界檢測和消除技術(shù)，很好的解決了過分割的問題，進(jìn)一步提高了視頻對象提取的準(zhǔn)確性。提取出來的視頻對象以像素鏈表的數(shù)據(jù)結(jié)構(gòu)存儲，非常便于數(shù)據(jù)的分析和使用。在象素塊聚類的過程中需要用到的閾值將根據(jù)人類視覺特性來確定，可以在程序執(zhí)行過程中由計算機(jī)計算得到，不需要用戶事先取定，因此使本技術(shù)的智能化水平進(jìn)一步提高。
本發(fā)明具有實質(zhì)性特點和顯著進(jìn)步，本發(fā)明采用基于顏色信息的塊聚類算法，能夠較好的減輕過分割現(xiàn)象，比較準(zhǔn)確地提取出視頻對象，該方法在基于內(nèi)容的視頻監(jiān)控領(lǐng)域尚數(shù)首創(chuàng)，可以解決視頻對象提取計算量大，準(zhǔn)確性不高的問題，從而使視頻監(jiān)控的效率和實用性大大提高。本發(fā)明被用于對場景中的指定監(jiān)控物體進(jìn)行提取，實驗表明，算法的實時性強(qiáng)，經(jīng)過聚類處理后得到的象素塊與被監(jiān)控物體基本一致，為進(jìn)一步進(jìn)行視頻對象的跟蹤奠定了很好的基礎(chǔ)。
具體實施例方式
下面結(jié)合本發(fā)明在“設(shè)備實時視頻監(jiān)控”實驗中的應(yīng)用，具體闡述其實施方式。在該實施例中，用戶首先采用配置文件的方式向程序提供以上三個監(jiān)控的物體所在的矩形區(qū)域，程序就在該局部范圍內(nèi)進(jìn)行對象提取，具體步驟如下(1)視頻幀讀取。輸入的視頻幀的格式是320*240的RGB圖象，根據(jù)相應(yīng)變換矩陣的分別將RGB格式轉(zhuǎn)換為YUV12和HSI格式的數(shù)據(jù)保存；(2)預(yù)處理。對視頻幀的亮度灰度圖，采用Roberts算子計算梯度圖象，然后用中值濾波的方法對得到的梯度圖象去噪聲，中值濾波器采用5*5正方型濾波窗口，能夠有效滿足濾波效果和實時性要求。
(3)圖象分割。對濾波后的梯度圖象用模擬注水的方法進(jìn)行塊分割，分割結(jié)果表明的確存在過分割現(xiàn)象，三個監(jiān)控對象本身都被分成了許多小塊，為了使被監(jiān)控對象盡量以一個塊或少數(shù)幾個相鄰塊的形式出現(xiàn)，必須進(jìn)行聚合處理；(4)顏色分析和區(qū)域聚合。利用步驟1中得到的HSI格式的圖象數(shù)據(jù)進(jìn)行顏色分析和塊聚類；
(5)弱邊界的處理。在步驟(4)的同時結(jié)合弱邊界消除技術(shù)進(jìn)一步減少圖象塊的個數(shù)，使分割結(jié)果更加精確；(6)視頻對象保存，以象素鏈表的數(shù)據(jù)結(jié)構(gòu)實現(xiàn)三個視頻監(jiān)控對象的存儲。
實際監(jiān)控效果表明，采用以上方法能夠精確地提取出指定對象的輪廓，而且效率很高，可以滿足實時監(jiān)控的要求。提取出的對象用于跟蹤，當(dāng)對象狀態(tài)發(fā)生一定變化后程序會及時報警，當(dāng)對象狀態(tài)恢復(fù)后程序也會發(fā)出相應(yīng)的提示信息，這反映出對象提取的效果是顯著的。
權(quán)利要求
1.一種基于分水嶺算法的視頻對象提取方法，其特征在于，首先獲得視頻輸入的初始幀，然后根據(jù)用戶事先生成的監(jiān)控區(qū)域配置文件確定需要提取的視頻對象所在的局部矩形區(qū)域，接著在已經(jīng)確定的各矩形區(qū)域中分別進(jìn)行預(yù)處理、分水嶺分割以及顏色分析和區(qū)域聚類處理，最后存儲提取的視頻對象。
2.根據(jù)權(quán)利要求1所述的基于分水嶺算法的視頻對象提取方法，其特征是，對本發(fā)明的方法限定如下(1)視頻幀讀取，(2)預(yù)處理，(3)圖象分割，(4)顏色分析和區(qū)域聚合，(5)弱邊界的處理，(6)視頻對象保存。
3.根據(jù)權(quán)利要求2所述的基于分水嶺算法的視頻對象提取方法，其特征是，對本發(fā)明的方法進(jìn)一步限定如下(1)視頻幀讀取以RGB的格式讀入圖象數(shù)據(jù)，然后分別轉(zhuǎn)換為YUV12和HSI格式的數(shù)據(jù)保存；(2)預(yù)處理采用Roberts算子計算原圖象的梯度圖象，然后用中值濾波的方法對梯度圖象去噪聲，減少由于噪聲引起的過分割，中值濾波器窗口大小的選擇兼顧濾波效果和運算速度；(3)圖象分割采用分水嶺算法對圖象進(jìn)行塊分割，即以圖象的灰度作為第三維建立三維拓?fù)鋱D，用Vincent和Soille提出的模擬注水的方法提取拓?fù)鋱D表面的分水嶺，自然形成各區(qū)域，完成圖象的塊分割；(4)顏色分析和區(qū)域聚合設(shè)一幅灰度圖象經(jīng)過分水嶺算法處理后被分為k個區(qū)域，得到塊鄰接關(guān)系圖；(5)弱邊界的處理經(jīng)過顏色聚類處理后，再消除弱邊界，即對每一條相鄰塊之間的邊界，檢驗邊界上的梯度大于某一設(shè)定閾值的象素的比例，若該比例超過50％則認(rèn)為是強(qiáng)邊界予以保留，反之則認(rèn)為是弱邊界，相應(yīng)的鄰塊進(jìn)行合并；(6)視頻對象保存以象素鏈表的數(shù)據(jù)結(jié)構(gòu)實現(xiàn)視頻對象的存儲。
4.根據(jù)權(quán)利要求3所述的基于分水嶺算法的視頻對象提取方法，其特征是，步驟(4)具體實現(xiàn)如下首先計算相鄰塊的顏色相似度，選取HSI作為顏色空間，H表示色調(diào)，S表示飽和度，I表示亮度，圖象中的每一個塊的灰度均值計算出來，塊合并的閾值由人的視覺特征一JND來確定設(shè)在某一個子色彩空間中相鄰兩個塊各自的灰度均值分別為I1和I2，如果|I1-I2|＜min(JDN(I1)，JND(I2))，則將這兩個塊合并成一個塊。
全文摘要
一種基于分水嶺算法的視頻對象提取方法，屬于計算機(jī)視覺研究領(lǐng)域。本發(fā)明首先獲得視頻輸入的初始幀，然后根據(jù)用戶事先生成的監(jiān)控區(qū)域配置文件確定需要提取的視頻對象所在的局部矩形區(qū)域，接著在已經(jīng)確定的各矩形區(qū)域中分別進(jìn)行預(yù)處理、分水嶺分割以及顏色分析和區(qū)域聚類處理，最后存儲提取的視頻對象。本發(fā)明方法在基于內(nèi)容的視頻監(jiān)控領(lǐng)域尚數(shù)首創(chuàng)，可以解決視頻對象提取計算量大，準(zhǔn)確性不高的問題，從而使視頻監(jiān)控的效率和實用性大大提高。本發(fā)明被用于對場景中的指定監(jiān)控物體進(jìn)行提取，實驗表明，算法的實時性強(qiáng)，經(jīng)過聚類處理后得到的象素塊與被監(jiān)控物體基本一致，為進(jìn)一步進(jìn)行視頻對象的跟蹤奠定了很好的基礎(chǔ)。
文檔編號G06K9/34GK1529284SQ0315140
公開日2004年9月15日申請日期2003年9月29日優(yōu)先權(quán)日2003年9月29日
發(fā)明者楊樹堂, 李建華, 須澤中, 郭禮華, 袁曉彤申請人:上海交通大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：楊樹堂、李建華、須澤中、郭禮華、袁曉彤
技術(shù)所有人：上海交通大學(xué)
我是此專利的發(fā)明人

上一篇：帶前綴的電子郵件地址的制作方法
上一篇：計算機(jī)漢字雙元碼輸入法的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

分水嶺算法相關(guān)技術(shù)

matlab分水嶺分割算法相關(guān)技術(shù)

分水嶺分割算法相關(guān)技術(shù)

opencv分水嶺分割算法相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于分水嶺算法的視頻對象提取方法