基于數(shù)字圖像處理的行人服飾顏色識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種顏色識(shí)別方法,屬于圖像處理技術(shù)領(lǐng)域,具體涉及的是一種基于 數(shù)字圖像處理的行人服飾顏色識(shí)別方法。
【背景技術(shù)】
[0002] 安全是電力、油氣田等特殊領(lǐng)域永恒的主題。近年來(lái),油氣田、電力等行業(yè)的各種 安全事故時(shí)有發(fā)生,如何加強(qiáng)油氣田、電力企業(yè)的安全生產(chǎn)能力和提高其管理水平已經(jīng)成 為相關(guān)人員必須面對(duì)的首要問(wèn)題。
[0003]油氣田、電力等領(lǐng)域的安全隱患之一就是工作人員在指定工作區(qū)域不嚴(yán)格執(zhí)行著 裝要求,不按規(guī)定穿特制的安全服。與此同時(shí),隨著國(guó)家對(duì)安全生產(chǎn)作業(yè)越來(lái)越重視,油氣 田、電力等行業(yè)出現(xiàn)越來(lái)越多的視頻監(jiān)控系統(tǒng)。但現(xiàn)有的監(jiān)控系統(tǒng),大多停留在視頻錄像、 存儲(chǔ)、查詢檢索等階段,因而對(duì)行人服飾顏色的判別有著較大的誤差,難以準(zhǔn)確識(shí)別出行人 在油氣田、電力等指定工作區(qū)域中的著裝是否符合要求,從而導(dǎo)致相應(yīng)的安全隱患一直存 在。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在于提供一種基于數(shù)字圖像處理的行人服飾顏色識(shí)別方法,主要解 決現(xiàn)有技術(shù)由于對(duì)行人服飾顏色識(shí)別誤差較大而存在安全隱患的問(wèn)題。
[0005] 為了實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下:
[0006] 基于數(shù)字圖像處理的行人服飾顏色識(shí)別方法,包括以下步驟:
[0007] (1)采用HOG特征描述算子結(jié)合SVM分類器的行人檢測(cè)方法采集行人圖像;
[0008] (2)采用Sobel算子檢測(cè)行人邊緣輪廓形狀,得到待搜索圖像;
[0009] (3)根據(jù)行人常見(jiàn)的姿態(tài)制作行人輪廓形狀模板T,并將行人輪廓形狀模板與待 搜索圖像中相應(yīng)的區(qū)域進(jìn)行匹配,得到行人的上半身和下半身圖像;
[0010] (4)采用種子填充方法分別對(duì)行人上半身和下半身區(qū)域的服飾顏色進(jìn)行連通區(qū)域 標(biāo)記;
[0011] (5)對(duì)得到的顏色連通區(qū)域進(jìn)行顏色特征提??;
[0012] (6)根據(jù)提取的顏色特征,利用SVM分類器進(jìn)行顏色分類判別,得到行人服飾顏 色,并輸出最終結(jié)果。
[0013] 進(jìn)一步地,所述步驟(3)中,行人輪廓形狀模板與待搜索圖像匹配的具體過(guò)程如 下:
[0014] (a)將行人輪廓形狀模板T在待搜索圖像上從左到右、從上到下依次平移滑動(dòng),得 到代表模板覆蓋待搜索圖像區(qū)域的子圖S1Y其中,i、j表示子圖的左上角在待搜索圖像中 的坐標(biāo);
[0015] (b)利用下列公式比較行人輪廓形狀模板與各個(gè)子圖的匹配程度:
[0017] (c)選取D(i,j)的最小值,得到的位置(i,j)即為行人在圖像中所在的位置,而行 人的寬、高則分別等于行人輪廓形狀模板T的寬、高。
[0018] 具體地說(shuō),所述步驟(5)包括以下步驟:
[0019] (5a)將步驟⑷中標(biāo)記的每個(gè)顏色連通區(qū)域均從RGB顏色空間分別變換到HSV顏 色空間、YCbCr顏色空間和Lab顏色空間;
[0020] (5b)分別提取HSV顏色空間、YCbCr顏色空間和Lab顏色空間各自的均值、方差、 能量和對(duì)比度,然后將之串聯(lián),得到顏色特征向量;
[0021] (5c)重復(fù)步驟(5a)、(5b),將若干行人訓(xùn)練樣本的顏色特征向量輸入到SVM分類 器中進(jìn)行訓(xùn)練學(xué)習(xí),得到SVM分類器模型;后續(xù)提取得到的顏色特征向量,只需將其送入至 SVM分類器中即可實(shí)現(xiàn)分類判別。
[0022] 與現(xiàn)有技術(shù)相比,本發(fā)明具有以下顯著效果:
[0023] (1)本發(fā)明將現(xiàn)有的幾種算法進(jìn)行結(jié)合,利用行人檢測(cè)、上下半身形狀分割、顏色 連通區(qū)域標(biāo)記的方法,并設(shè)計(jì)和整合了模板匹配、顏色特征提取和分類判別的方式,從而可 以有效地識(shí)別出行人服飾顏色,其識(shí)別精度相當(dāng)高,識(shí)別的顏色基本不存在多少誤差,如此 一來(lái),即可很好地方便管理者對(duì)危險(xiǎn)區(qū)域著裝方面的管理,為規(guī)范著裝的執(zhí)行帶來(lái)了更大 的保障,有效地消除了這方面的安全隱患。
[0024] (2)本發(fā)明設(shè)計(jì)合理,流程清晰、明了,非常適合在電力、油氣田等特殊領(lǐng)域方面進(jìn) 行推廣應(yīng)用。
【附圖說(shuō)明】
[0025] 圖1為本發(fā)明的流程示意圖。
[0026] 圖2為本發(fā)明-實(shí)施例的行人輪廓形狀模板示意圖。
【具體實(shí)施方式】
[0027] 下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明,本發(fā)明的實(shí)施方式包括但不限于 下列實(shí)施例。
[0028] 實(shí)施例
[0029] 如圖1所示,本發(fā)明提供了一種適用于油氣田、變電站等特殊場(chǎng)合工人安全服著 裝檢測(cè)識(shí)別的方法,其主要由行人檢測(cè)、行人上半身和下半身形狀分割、上半身和下半身服 飾顏色連通區(qū)域標(biāo)記、顏色特征提取、顏色分類判別和結(jié)果輸出幾大步驟組成。
[0030] 一、行人檢測(cè)
[0031] 本發(fā)明采用HOG特征描述算子結(jié)合SVM分類器的行人檢測(cè)方法采集行人圖像。 HOG(HistogramofOrientationGradient)特征是一種對(duì)圖像局部重疊區(qū)域的密集型描 述符,它通過(guò)計(jì)算局部區(qū)域的梯度方向直方圖來(lái)構(gòu)成特征。能夠很好地描述人體的邊緣,同 時(shí)對(duì)光照變化和小量的偏移不敏感。HOG特征結(jié)合SVM分類器已經(jīng)被廣泛應(yīng)用于圖像識(shí)別 中,尤其在行人檢測(cè)中獲得了極大的成功。
[0032] HOG特征的計(jì)算需要用到梯度的概念,圖像中像素點(diǎn)(x,y)的梯度為:
[0033]Gx(x,y) =H(x+1,y)_H(x_l,y)
[0034]Gy(x,y) =H(x,y+l)_H(x,y-1)
[0035] 上面式子當(dāng)中的Gx(x,y),Gy(x,y),H(x,y)分別表示像素點(diǎn)(x,y)水平方向的梯 度、垂直方向的梯度以及像素值。像素點(diǎn)(x,y)處的梯度幅值和梯度方向分別是:
[0038]HOG特征提取的過(guò)程:把圖像分割為若干個(gè)像素的單元(cell),把梯度方向平均 劃分為9個(gè)區(qū)間(bin),在每個(gè)單元里面對(duì)所有像素的梯度方向在各個(gè)方向區(qū)間進(jìn)行直方 圖統(tǒng)計(jì),得到一個(gè)9維的特征向量,每相鄰的4個(gè)單元構(gòu)成一個(gè)塊(block),把一個(gè)塊內(nèi)的特 征向量聯(lián)起來(lái)得到36維的特征向量,用塊對(duì)樣本圖像進(jìn)行掃描,掃描步長(zhǎng)為一個(gè)單元。最 后將所有塊的特征串聯(lián)起來(lái),就得到了人體的特征。例如,對(duì)于64*128的圖像而言,每2*2 的單元(16*16的像素)構(gòu)成一個(gè)塊,每個(gè)塊內(nèi)有4*9 = 36個(gè)特征,以8個(gè)像素為步長(zhǎng),那 么,水平方向?qū)⒂?個(gè)掃描窗口,垂直方向?qū)⒂?5個(gè)掃描窗口。也就是說(shuō),64*128的圖片, 總共有36*7*15 = 3780個(gè)特征。
[0039]SVM是一種常見(jiàn)的分類器,它是從線性可分情況下的最優(yōu)分類面提出的。所謂最優(yōu) 分類,就是要求分類線(或者分類面)不但能夠?qū)深悷o(wú)錯(cuò)誤的分開(kāi),而且兩類之間的分類 間隔最大。前者是保證經(jīng)驗(yàn)風(fēng)險(xiǎn)最小,而使分類間隔最大實(shí)際上就是使得推廣性中的置信 范圍最小。推廣到高維空間,最優(yōu)分類線就成為最優(yōu)分類面。
[0040] 二、行人上半身和下半身形狀分割
[0041] 通過(guò)上一步的檢測(cè)和圖像采集,已經(jīng)得到了監(jiān)控視頻畫面中行人的圖像。然而, 通常而言,行人并非在圖像的正中位置,例如,行人的上半身可能呈現(xiàn)正面姿態(tài),也可能呈 現(xiàn)身體傾斜,偏頭等姿態(tài)。而行人的下半身姿態(tài)更為復(fù)雜,例如,雙腿可能并立,也可能分 開(kāi)呈現(xiàn)各種不同角度。如果直接將行人圖像的上半部分當(dāng)作行人的上半身,將行人圖像的 下半部分當(dāng)作行人的下半身,以此來(lái)做行人服飾顏色的識(shí)別判定,必然會(huì)造成很大的誤差。 因此,有必要對(duì)行人的上半身、下半身形狀進(jìn)行準(zhǔn)確分割,方便后續(xù)準(zhǔn)確的服飾顏色識(shí)別判 斷。
[0042] 本發(fā)明通過(guò)行人邊緣輪廓形狀檢測(cè)和模板匹配的方式,對(duì)行人上半身和下半身形 狀進(jìn)行分割,并得到相應(yīng)的上半身和下半身圖像。
[0043] 行人邊緣輪廓形狀檢測(cè)
[0044] 邊緣是圖像最基本的特征,常用的邊緣輪廓檢測(cè)方法有:Robert算子、Sobel算 子、Prewitt算子、Canny算子等。本發(fā)明使用Sobel算子進(jìn)行邊緣輪廓檢測(cè)。其計(jì)算步驟 如下:
[0045] 對(duì)原圖像進(jìn)行高斯濾波,這里的高斯核如下所示:
[0047] 利用卷積模板計(jì)算梯度的幅值和方向
[0056]sx=(a2+2a3+a4) - (a〇+2a7+a6)
[0057] Sy={a - {a&+2a^+a^)
[0058] 梯度方向可以表示為:
[0059] 0 (x,y) =Sy/Sx
[0060] 根據(jù)不同場(chǎng)景的具體需求,設(shè)置閾值,并進(jìn)行分割,得到邊緣輪廓和圖像。
[0061] 模板匹配
[0062] 本發(fā)明根據(jù)行人常見(jiàn)的姿態(tài)制作了不同的行人輪廓形狀模板T,如圖2所示。根據(jù) 制作的行人輪廓形狀模板,將其與待搜索圖像中相應(yīng)的區(qū)域進(jìn)行匹配,即在待搜索圖像中 尋找具有相同尺寸、