專利名稱:一種面向視頻監(jiān)控的基于塊的背景建模方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機(jī)視覺系統(tǒng)的背景建模領(lǐng)域,特別是涉及一種面向視頻監(jiān)控的基于塊的背景建模方法。
背景技術(shù):
從視頻中萃取出運(yùn)動物體是很多計算機(jī)視覺系統(tǒng)中首要的一步。實現(xiàn)自動化萃取的一個普遍的方法是減背景(background subtraction),該方法通過一個背景模型來比較每個新幀中運(yùn)動的像素,然后將這些像素分為不同的類型,即前景,背景。
最簡單的背景模型是將每個像素的亮度值看作一個簡單的高斯分布,然而,這種單一模式的模型無法對動態(tài)背景建模,如隨風(fēng)揮舞的樹枝,亮度變化和陰影消除。
Stauffer和Grimson使用混合的高斯模型來表示動態(tài)的背景,并使用參數(shù)估計技術(shù)來更新了該模型。
在處理快速變化的像素時,為了克服由于參數(shù)估計錯誤帶來的錯誤背景的問題,Elgammal,Harwood等人使用了一種非參數(shù)化的模型,該模型使用了一個核心的評估器,通過當(dāng)前像素最近的觀測值來確定該像素所屬的類別。
近年來,很多研究者提出了基于區(qū)域或幀的模型,這些模型將像素看作相互關(guān)聯(lián)的隨機(jī)變量,通過鄰域關(guān)系來估算概率。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種面向視頻監(jiān)控的基于塊的背景建模方法。
本發(fā)明采用的技術(shù)方案是 1)數(shù)據(jù)聲明及描述 (1)將寬度為W像素、高度為H像素的幀組成的視頻分割為正方形的塊x,y為幀內(nèi)行、列坐標(biāo),m,n為幀內(nèi)塊的行、列坐標(biāo),S為塊的寬度,S由視頻幀的尺寸決定,以有效的利用空間上的一致性信息; (2)對每一個塊,定義一個顏色聚類數(shù)組cm,n,該數(shù)組包含L個顏色類別 Cm,n={c1,c2,...,cL},m,n為塊的行、列坐標(biāo); (3)對于每個像素Px,y,定義一個權(quán)值索引數(shù)組,每個數(shù)組由N個索引組成 Ix,y={i1,i2,...,iN},x,y為像素的行、列坐標(biāo); 2)模型處理過程 該模型的更新機(jī)制如下當(dāng)一個新的具有不同顏色分類的像素出現(xiàn)時, 步驟1從相應(yīng)塊的顏色聚類數(shù)組中查找像素顏色,如果命中,更新該顏色聚類,否則,創(chuàng)建一個新的顏色聚類; 步驟2從當(dāng)前像素的權(quán)值索引數(shù)組中查找像素顏色,如果命中,更新該索引,否則,創(chuàng)建一個新索引; 步驟3通過權(quán)重確定當(dāng)前像素類別。
本發(fā)明具有的有益效果是 同基于像素的模型相比,本發(fā)明是基于塊的模型,以4×4或8×8的塊為單位整體的處理像素。擁有相似顏色的不同像素被表示為同一個聚類。通常,由于鄰近像素之間的一致性,在一個獨(dú)立塊中聚類的平均個數(shù)是有限的。隨著獲取的樣本數(shù)增加,這種聚類的正確性也隨之增大(與小樣本容量相比)。由于動態(tài)背景中絕大部分像素的運(yùn)動只局限于小的區(qū)域,該模型也能更快的學(xué)習(xí)動態(tài)背景。結(jié)果表明,本發(fā)明基于塊的背景模型有效的達(dá)到了降低內(nèi)存消耗而不犧牲速度的目標(biāo)。在動態(tài)背景的的場景下,該模型檢測前景的速度甚至比經(jīng)典的背景模型MOG更快、更有效并且降低了誤報率。
附圖為模型更新過程圖。
具體實施例方式 1)數(shù)據(jù)聲明及描述 (1)將寬度為W像素、高度為H像素的幀組成的視頻{Pxy|x∈〔1.W〕.y∈〔1.H〕}分割為正方形的塊x,y為幀內(nèi)行、列坐標(biāo),m,n為幀內(nèi)塊的行、列坐標(biāo),S為塊的寬度,S由視頻幀的尺寸決定,以有效的利用空間上的一致性信息; (2)對每一個塊,定義一個顏色聚類數(shù)組cm,n,該數(shù)組包含L個顏色類別 Cm,n={c1,c2,...,cL},m,n為塊的行、列坐標(biāo); (3)對于每個像素Px,y,定義一個權(quán)值索引數(shù)組,每個數(shù)組由N個索引組成Ix,y={i1,i2,...,iN},x,y為像素的行、列坐標(biāo); 2)模型處理過程 該模型的更新機(jī)制如附圖所示當(dāng)一個新的具有不同顏色分類的像素出現(xiàn)時; 步驟1從相應(yīng)塊的顏色聚類數(shù)組中查找像素顏色,如果命中,更新該顏色聚類,否則,創(chuàng)建一個新的顏色聚類; 步驟2從當(dāng)前像素的權(quán)值索引數(shù)組中查找像素顏色,如果命中,更新該索引,否則,創(chuàng)建一個新索引; 步驟3通過權(quán)重確定當(dāng)前像素類別。
所述步驟1的具體過程如下 (1)出現(xiàn)新的像素pt=〔yt,ut,vt〕,pt∈Bm,n,其中yt,ut,vt分別為像素的亮度分量,色度分量,色度分量,t是時間下標(biāo); (2)對于Cm,n里的每一個顏色類別(y,u,v,f,p),其中,y為亮度分量Y的平均值,u為色差分量U的平均值,v為色度分量V的平均值,f為樣本頻率,p為該類別創(chuàng)建的時間;如果找到某個顏色聚類別滿足((ut,vt),(u,v))≤ε1并且yt∈y×δ(1,ε2),其中ε1為閥值,取值5~15,ε2也是閥值,取值5/255~15/255, 則更新內(nèi)容 f=f+1 (3)如果符合條件的類不存在,創(chuàng)建新聚類 (y,u,v)=(yt,ut,vt) f=1 p=t 所述步驟2的具體過程如下 (1)根據(jù)步驟一得到的該像素顏色在顏色聚類數(shù)組中的索引查找該像素的權(quán)值索引數(shù)組; (2)若命中,則根據(jù)參數(shù)α調(diào)整權(quán)重ww=〔1-α〕×w+α×M,其中,w為該像素在所在類中的權(quán)重,當(dāng)被計算的像素值屬于該顏色聚類時,M值為1,否則,其值為0;α為學(xué)習(xí)參數(shù),取值0.3~0.7; 所述步驟3的具體過程如下 (1)不同顏色的權(quán)重每幀都會調(diào)整,出現(xiàn)較少的顏色權(quán)重會迅速的降低,大多數(shù)頻繁出現(xiàn)的顏色權(quán)重變得很大,這些顏色的權(quán)重在所有顏色權(quán)重中占支配比例,該比例記為β,β取值為0.6~0.9; (2)對于一個權(quán)重索引為w的像素,如果權(quán)重大于w的聚類的權(quán)重之和占總權(quán)重的比例超過β,則該像素被認(rèn)為是背景;否則,是前景。
本發(fā)明同混合高斯模型(MOG)測試結(jié)果如下 使用標(biāo)準(zhǔn)的MPEG-4測試序列“Hall”和一個在真實道路監(jiān)控場景中抓取的視頻對算法做了測試。表1比較二者內(nèi)存使用,表2比較二者的處理速度。
表1.發(fā)明模型同混合高斯模型(MOG)的內(nèi)存使用比較
表2.發(fā)明模型同混合高斯模型(MOG)的速度比較
結(jié)果表明,本發(fā)明基于塊的背景模型有效的達(dá)到了降低內(nèi)存消耗而不犧牲速度的目標(biāo)。在動態(tài)背景的的場景下,該模型檢測前景的速度甚至比經(jīng)典的背景模型MOG更快、更有效并且降低了誤報率。
權(quán)利要求
1.一種面向視頻監(jiān)控的基于塊的背景建模方法,其特征在于
1)數(shù)據(jù)聲明及描述
(1)將寬度為W像素、高度為H像素的幀組成的視頻
分割為正方形的塊
x,y為幀內(nèi)行、列坐標(biāo),m,n為幀內(nèi)塊的行、列坐標(biāo),S為塊的寬度,S由視頻幀的尺寸決定,以有效的利用空間上的一致性信息;
(2)對每一個塊,定義一個顏色聚類數(shù)組cm,n,該數(shù)組包含L個顏色類別
Cm,n={c1,c2,...,cL},m,n為塊的行、列坐標(biāo);
(3)對于每個像素px,y,定義一個權(quán)值索引數(shù)組,每個數(shù)組由N個索引組成Ix,y={i1,i2,...,iN},x,y為像素的行、列坐標(biāo);
2)模型處理過程
該模型的更新機(jī)制如下當(dāng)一個新的具有不同顏色分類的像素出現(xiàn)時,
步驟1從相應(yīng)塊的顏色聚類數(shù)組中查找像素顏色,如果命中,更新該顏色聚類,否則,創(chuàng)建一個新的顏色聚類;
步驟2從當(dāng)前像素的權(quán)值索引數(shù)組中查找像素顏色,如果命中,更新該索引,否則,創(chuàng)建一個新索引;
步驟3通過權(quán)重確定當(dāng)前像素類別。
2.根據(jù)權(quán)利要求1所述的一種面向視頻監(jiān)控的基于塊的背景建模方法,其特征在于所述步驟1的具體過程如下
(1)出現(xiàn)新的像素pt=(yt,ut,vt),pt∈Bm,n,其中yt,ut,vt分別為像素的亮度分量,色度分量,色度分量,t是時間下標(biāo);
(2)對于Cm,n里的每一個顏色類別(y,u,v,f,p),其中,y為亮度分量Y的平均值,u為色差分量U的平均值,v為色度分量V的平均值,f為樣本頻率,p為該類別創(chuàng)建的時間;如果找到某個顏色聚類別滿足((ut,vt),(u,v))≤ε1并且yt∈y×δ(1,ε2),其中ε1為閥值,取值5~15,ε2也是閥值,取值5/255~15/255,則更新內(nèi)容
f=f+1
(3)如果符合條件的類不存在,創(chuàng)建新聚類
(y,u,v)=(yt,ut,vt)
f=1
p=t。
3.根據(jù)權(quán)利要求1所述的一種面向視頻監(jiān)控的基于塊的背景建模方法,其特征在于所述步驟2的具體過程如下
(1)根據(jù)步驟一得到的該像素顏色在顏色聚類數(shù)組中的索引查找該像素的權(quán)值索引數(shù)組;
(2)若命中,則根據(jù)參數(shù)α調(diào)整權(quán)重ww=(1-α)×w+α×M,其中,w為該像素在所在類中的權(quán)重,當(dāng)被計算的像素值屬于該顏色聚類時,M值為1,否則,其值為0;α為學(xué)習(xí)參數(shù),取值0.3~0.7。
4.根據(jù)權(quán)利要求1所述的一種面向視頻監(jiān)控的基于塊的背景建模方法,其特征在于所述步驟3的具體過程如下
(1)不同顏色的權(quán)重每幀都會調(diào)整,出現(xiàn)較少的顏色權(quán)重會迅速的降低,大多數(shù)頻繁出現(xiàn)的顏色權(quán)重變得很大,這些顏色的權(quán)重在所有顏色權(quán)重中占支配比例,該比例記為β,β取值為0.6~0.9;
(2)對于一個權(quán)重索引為w的像素,如果權(quán)重大于w的聚類的權(quán)重之和占總權(quán)重的比例超過β,則該像素被認(rèn)為是背景;否則,是前景。
全文摘要
本發(fā)明公開了一種面向視頻監(jiān)控的基于塊的背景建模方法。對于背景建模,過去很多方法由于沒有利用像素值在空間上的一致性,計算時需要耗費(fèi)大量內(nèi)存。針對這個問題,本發(fā)明提出了一種新穎的基于塊的背景建模方法,步驟1從相應(yīng)塊的顏色聚類數(shù)組中查找像素顏色,如果命中,更新該顏色聚類,否則,創(chuàng)建一個新的顏色聚類;步驟2從當(dāng)前像素的權(quán)值索引數(shù)組中查找像素顏色,如果命中,更新該索引,否則,創(chuàng)建一個新索引;步驟3通過權(quán)重確定當(dāng)前像素類別。同傳統(tǒng)的模型相比,該模型極大的減少了對一個像素建模需要的字節(jié)數(shù),從而在保證計算速度的同時有效的降低了內(nèi)存消耗。
文檔編號G06T7/20GK101533515SQ20091009763
公開日2009年9月16日 申請日期2009年4月13日 優(yōu)先權(quán)日2009年4月13日
發(fā)明者純 陳, 鄧小宇, 卜佳俊, 智 楊, 呂承飛 申請人:浙江大學(xué)