基于前景和背景先驗(yàn)的多模態(tài)區(qū)域一致性的顯著性對(duì)象檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)視覺技術(shù),尤其是一種圖像處理和顯著性對(duì)象檢測(cè)方法。
【背景技術(shù)】
[0002] 視覺顯著性指的是在環(huán)境中異于鄰近區(qū)域的子區(qū)域并且能夠快速吸引觀察者的 注意力。視覺顯著性的最重要的應(yīng)用之一是從復(fù)雜場(chǎng)景中快速搜索顯著性對(duì)象。許多機(jī)器 人系統(tǒng)也用視覺顯著性來進(jìn)行對(duì)象識(shí)別和檢測(cè)。
[0003] 通過視覺顯著性進(jìn)行對(duì)象檢測(cè),由于人類總是把對(duì)象看作一個(gè)整體,希望包含對(duì) 象的子區(qū)域具有相同或相似的顯著性值,然而,大部分已經(jīng)存在的方法使用基于像素的方 法去計(jì)算顯著性,得到的顯著性值從像素到像素變化。此外,已經(jīng)存在的大部分方法只是 基于二維圖像,其中顯著性對(duì)象和背景之間相同的顏色或紋理造成顯著性提取的正確率降 低。
【發(fā)明內(nèi)容】
[0004] 為了克服已有視覺顯著性對(duì)象檢測(cè)方式的正確率較低不足,本發(fā)明提供一種有效 提升正確率的基于前景和背景先驗(yàn)的多模態(tài)區(qū)域一致性的顯著性對(duì)象檢測(cè)方法。
[0005] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
[0006] 一種基于前景和背景先驗(yàn)的多模態(tài)區(qū)域一致性的顯著性對(duì)象檢測(cè)方法,所述檢測(cè) 方法包括如下步驟:
[0007] 1)獲得場(chǎng)景的顏色圖像和深度圖像,同時(shí)生成點(diǎn)云;
[0008] 2)采用顏色圖和深度圖將場(chǎng)景分割
[0009] 計(jì)算顏色空間和深度空間像素間的差異值D(Ci,C2)的過程如下: 「00101 D(CrC2)= argmin v.)
[0011] 其中,vjp V j是組件,C挪C 2各自的節(jié)點(diǎn),E表示鄰域系統(tǒng),w(v i, Vj)表示邊權(quán)函 數(shù);
[0012] Wivi ,Vj) ^ A\lcPj -/^ |2 + (1 -1)|/;; - ζ |2
[0013] 其中,參數(shù)λ控制顏色和深度通道的權(quán)值,I (Pi),1(h)分別表示兩個(gè)像素的強(qiáng) 度;
[0014] 采用自適應(yīng)方法確定權(quán)值λ :
[0015] λ = I. 〇-min ( α,β *ndp/ncl)
[0016] 其中ndp和nd是深度圖和顏色圖的過分割數(shù)目,參數(shù)β是用于調(diào)整顏色圖和深度 圖之間對(duì)過分割貢獻(xiàn)的比例,參數(shù)α是用于保證顏色圖的最小貢獻(xiàn)量,參數(shù)α為〇~1之 間的小數(shù);
[0017] 3)采用基于對(duì)象區(qū)域檢測(cè)方法,對(duì)圖像的所有區(qū)域進(jìn)行檢測(cè)得到焦點(diǎn)區(qū)域,在顏 色圖像中將焦點(diǎn)區(qū)域作為前景先驗(yàn);
[0018] 采用不同大小的高斯核對(duì)圖像進(jìn)行卷積操作,得到卷積圖像,計(jì)算每幅卷積圖像 中所有像素水平方向和垂直方向上的梯度,然后得到每幅卷積圖像中的像素分布直方圖;
[0019] 通過一個(gè)k*k的核以及梯度的對(duì)數(shù)似然函數(shù)來得到:
【主權(quán)項(xiàng)】
1. 一種基于前景和背景先驗(yàn)的多模態(tài)區(qū)域一致性的顯著性對(duì)象檢測(cè)方法,其特征在 于:所述檢測(cè)方法包括如下步驟: 1) 獲得場(chǎng)景的顏色圖像和深度圖像,同時(shí)生成點(diǎn)云; 2) 采用顏色圖和深度圖將場(chǎng)景分割 計(jì)算顏色空間和深度空間像素間的差異值D(C11C2)的過程如下:
其中,Vi和V j是組件,C JP C2各自的節(jié)點(diǎn),E表示鄰域系統(tǒng),W(V i, Vj)表示邊權(quán)函數(shù);
其中,參數(shù)λ控制顏色和深度通道的權(quán)值,I(Pi),ι(Ρρ分別表示兩個(gè)像素的強(qiáng)度; 采用自適應(yīng)方法確定權(quán)值λ : λ = I. 〇-min( α,β ^ntipAicl) 其中ndp和Iicd是深度圖和顏色圖的過分割數(shù)目,參數(shù)β是用于調(diào)整顏色圖和深度圖之 間對(duì)過分割貢獻(xiàn)的比例,參數(shù)α是用于保證顏色圖的最小貢獻(xiàn)量,參數(shù)α為O~1之間的 小數(shù); 3) 采用基于對(duì)象區(qū)域檢測(cè)方法,對(duì)圖像的所有區(qū)域進(jìn)行檢測(cè)得到焦點(diǎn)區(qū)域,在顏色圖 像中將焦點(diǎn)區(qū)域作為前景先驗(yàn); 采用不同大小的高斯核對(duì)圖像進(jìn)行卷積操作,得到卷積圖像,計(jì)算每幅卷積圖像中所 有像素水平方向和垂直方向上的梯度,然后得到每幅卷積圖像中的像素分布直方圖; 通過一個(gè)k*k的核以及梯度的對(duì)數(shù)似然函數(shù)來得到:
其中乂和W表示水平和垂直梯度的分布,從卷積圖中計(jì)算得到,N(X)是像素 X的鄰 域窗口;通過找到所有核大小的IkOO的最大值,找到一個(gè)核,用k*(x)表示,看作是用于解 釋圖的最好的一批窗口;核的大小能反映窗口的清晰度;對(duì)于每個(gè)像素,存在一個(gè)對(duì)應(yīng)的 k*(x),并且它能用于表示清晰或者模糊的區(qū)域,通過定義一個(gè)二值圖:
將U映射到水平和垂直軸上后,統(tǒng)計(jì)二值圖中從水平到垂直方向的白色像素的個(gè)數(shù), 從而獲得兩組坐標(biāo),作為焦點(diǎn)區(qū)域,得到焦點(diǎn)區(qū)域后,計(jì)算帶有前景先驗(yàn)的顯著性Sf (rk),定 義如下:
其中,dist()表示過分割rk的中心到焦點(diǎn)區(qū)域的中心的距離,并且maXpAsAt/),,)表 示焦點(diǎn)區(qū)域內(nèi)所有過分割之間的最大距離; 4) 檢測(cè)出點(diǎn)云的平面區(qū)域作為背景先驗(yàn) 從顏色圖像和對(duì)應(yīng)深度圖像中得到點(diǎn)云數(shù)據(jù),在點(diǎn)云數(shù)據(jù)中檢測(cè)出平面結(jié)構(gòu),然后 計(jì)算連接場(chǎng)景邊界的邊界長度,計(jì)算出平面分割的背景連通度,并且得到過分割的背景權(quán) 重; 用下面的定義作為平面分割的背景連通度:
其中,Bg(Pi)是平面分割Pi的連通度,Len(Pi)是邊界的長度,它跟場(chǎng)景邊界相鄰,并且 Pi I是分割平面Pi的面積; 基于背景連通度,定義一個(gè)過分割rk的背景權(quán)值:
其中,Bw(rk)是過分割rk的背景權(quán)值,P是所有檢測(cè)到平面p 集合; Bw(rk)值的范圍是從O到1,根據(jù)背景權(quán)值,定義背景先驗(yàn)的顯著性SB(rk): Sb (rk) = I-Bw (rk) 5)計(jì)算得到全局區(qū)域?qū)Ρ榷?全局區(qū)域?qū)Ρ榷萐e (rk),定義如下:
其中Dr(rk,ri)和比(1^1^)表示區(qū)域r# ri之間各自顏色和空間距離,〇確定空間權(quán) 值的長度,W(A)表示區(qū)域&的權(quán)值,計(jì)算出來作為區(qū)域r 的像素個(gè)數(shù); 顯著性圖通過下面的公式得到: S (rk) = Sf (rk) X Sb (rk) X Sg (rk) 其中,Sf(rk)表示前景先驗(yàn)顯著性值,Sb(rk)表示背景先驗(yàn)顯著性值,S e(rk)表示全局 區(qū)域?qū)Ρ榷?,S(rk)表示最終得到的顯著性圖。
【專利摘要】一種基于前景和背景先驗(yàn)的多模態(tài)區(qū)域一致性的顯著性對(duì)象檢測(cè)方法,包括如下步驟:1)獲得場(chǎng)景的顏色圖像和深度圖像,同時(shí)生成點(diǎn)云;2)采用顏色圖和深度圖將場(chǎng)景分割;3)采用基于對(duì)象區(qū)域檢測(cè)方法,對(duì)圖像的所有區(qū)域進(jìn)行檢測(cè)得到焦點(diǎn)區(qū)域,在顏色圖像中將焦點(diǎn)區(qū)域作為前景先驗(yàn);4)檢測(cè)出點(diǎn)云的平面區(qū)域作為背景先驗(yàn),從顏色圖像和對(duì)應(yīng)深度圖像中得到點(diǎn)云數(shù)據(jù),在點(diǎn)云數(shù)據(jù)中檢測(cè)出平面結(jié)構(gòu),然后計(jì)算連接場(chǎng)景邊界的邊界長度,計(jì)算出平面分割的背景連通度,并且得到過分割的背景權(quán)重;5)計(jì)算得到全局區(qū)域?qū)Ρ榷萐G(rk),顯著性圖通過下面的公式得到:S(rk)=SF(rk)×SB(rk)×SG(rk)。本發(fā)明有效提升正確率。
【IPC分類】G06T7-00
【公開號(hào)】CN104680523
【申請(qǐng)?zhí)枴緾N201510072313
【發(fā)明人】張劍華, 王其超, 謝榛, 趙妍珠, 陳勝勇, 張建偉
【申請(qǐng)人】浙江工業(yè)大學(xué)
【公開日】2015年6月3日
【申請(qǐng)日】2015年2月11日