一種手勢(shì)自動(dòng)識(shí)別方法
【專利摘要】本發(fā)明提出了一種手勢(shì)自動(dòng)識(shí)別方法,所述方法將獲得的手勢(shì)視頻數(shù)據(jù)中的每幀源圖像轉(zhuǎn)換到Y(jié)CbCr顏色空間;運(yùn)用膚色橢圓模型進(jìn)行皮膚檢測(cè);使用連通域分析、邊緣檢測(cè)和輪廓提取完成手勢(shì)分割;通過(guò)手勢(shì)分析來(lái)進(jìn)行特征向量提取,選取圖像歸一化轉(zhuǎn)動(dòng)慣量、不變矩特征等統(tǒng)計(jì)特征參數(shù),手勢(shì)的外圍矩形、方向、周長(zhǎng)、面積、比例值等形狀特征參數(shù),和手指的個(gè)數(shù)、是否包含拇指等結(jié)構(gòu)特征參數(shù)作為分析識(shí)別手勢(shì)的參數(shù);采用基于改進(jìn)歐氏距離的模板匹配法進(jìn)行手勢(shì)識(shí)別。該方法可有效識(shí)別不同手勢(shì),使得以高效、直接、自然的手勢(shì)為主要方式的人機(jī)交互更加接近人與人之間的交流。
【專利說(shuō)明】一種手勢(shì)自動(dòng)識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于人機(jī)交互和計(jì)算機(jī)視覺(jué)領(lǐng)域,具體指的是一種手勢(shì)自動(dòng)識(shí)別方法。
【背景技術(shù)】
[0002]手勢(shì)識(shí)別技術(shù)是一種高效、直接、自然的人機(jī)交互方式,但是由于技術(shù)水平的限制,以及手的高自由度所引起的手勢(shì)復(fù)雜、變化多樣、移動(dòng)高速等特性,使得手勢(shì)識(shí)別成為極具挑戰(zhàn)性的研究課題之一。
【發(fā)明內(nèi)容】
[0003]本發(fā)明所要解決的技術(shù)問(wèn)題是為了克服現(xiàn)有技術(shù)的不足,提出一種手勢(shì)自動(dòng)識(shí)別方法。所述方法顯著提高對(duì)攝像頭獲取的手勢(shì)圖像的識(shí)別準(zhǔn)確率和識(shí)別速度。
[0004]為了解決上述技術(shù)問(wèn)題,本發(fā)明所采用的技術(shù)方案是:
[0005]一種手勢(shì)自動(dòng)識(shí)別方法,包括如下步驟:
[0006]步驟A,采集手勢(shì)視頻數(shù)據(jù);
[0007]步驟B,對(duì)步驟A得到的視頻數(shù)據(jù)中的每幀源圖像進(jìn)行中值濾波;
[0008]步驟C,將步驟B得到的中值濾波圖像映射到Y(jié)CbCr顏色空間;
[0009]步驟D,對(duì)步驟C得到的YCbCr顏色空間中的圖像像素點(diǎn),使用膚色橢圓模型進(jìn)行皮膚檢測(cè),得到二值圖像;
[0010]步驟E,找出步驟D得到的二值圖像中的面積最大連通域,并對(duì)其進(jìn)行邊緣檢測(cè)和輪廓提取來(lái)分割手勢(shì),得到手勢(shì)邊緣圖像和輪廓矩陣;
[0011]步驟F,基于步驟D得到的二值圖像和步驟E得到的邊緣圖像和輪廓矩陣,提取手勢(shì)特征向量;
[0012]步驟G,根據(jù)步驟F得到的特征向量,采用基于改進(jìn)歐氏距離的模板匹配法進(jìn)行手勢(shì)的特征匹配和識(shí)別。
[0013]步驟D中,所述皮膚檢測(cè),其具體過(guò)程如下:
[0014]步驟D-1,將步驟C得到的YCbCr顏色空間中的圖像像素點(diǎn)向CbCr平面進(jìn)行投影,得到次平面;
[0015]步驟D-2,對(duì)步驟D-1得到的次平面上的圖像像素點(diǎn)做K-L變換;
[0016]步驟D-3,對(duì)步驟D-2得到的K-L變換后的圖像像素點(diǎn)用橢圓模型進(jìn)行分類,得到
二值圖像。
[0017]步驟E中,所述連通域是指二值圖像中,像素點(diǎn)同值連片區(qū)域,該同值連片區(qū)域中,沒(méi)有不同值的像素點(diǎn)。
[0018]步驟F中,所述提取手勢(shì)特征向量,其具體過(guò)程如下:
[0019]步驟F-1,對(duì)步驟D得到的二值圖像和步驟E得到的手勢(shì)邊緣圖像和輪廓矩陣進(jìn)行定量描述,提取手勢(shì)的統(tǒng)計(jì)特征參數(shù),所述統(tǒng)計(jì)特征參數(shù)包括圖像歸一化轉(zhuǎn)動(dòng)慣量和不變矩特征;[0020]步驟F-2,對(duì)步驟D得到的二值圖像和步驟E得到的手勢(shì)邊緣圖像和輪廓矩陣進(jìn)行定量描述,提取手勢(shì)的形狀特征參數(shù),所述形狀特征參數(shù)包括外圍矩形、方向、周長(zhǎng)、面積、比例值;
[0021]步驟F-3,對(duì)步驟D得到的二值圖像和步驟E得到的手勢(shì)邊緣圖像和輪廓矩陣進(jìn)行定量描述,提取手指的個(gè)數(shù),并判定是否包含拇指。
[0022]本發(fā)明的有益效果是:本發(fā)明提出了一種手勢(shì)自動(dòng)識(shí)別方法,所述方法將獲得的手勢(shì)視頻數(shù)據(jù)中的每幀源圖像轉(zhuǎn)換到Y(jié)CbCr顏色空間;運(yùn)用膚色橢圓模型進(jìn)行皮膚檢測(cè);使用連通域分析、邊緣檢測(cè)和輪廓提取完成手勢(shì)分割;通過(guò)手勢(shì)分析來(lái)進(jìn)行特征向量提取,選取圖像歸一化轉(zhuǎn)動(dòng)慣量、不變矩特征等統(tǒng)計(jì)特征參數(shù),手勢(shì)的外圍矩形、方向、周長(zhǎng)、面積、比例值等形狀特征參數(shù),和手指的個(gè)數(shù)、是否包含拇指等結(jié)構(gòu)特征參數(shù)作為分析識(shí)別手勢(shì)的參數(shù);采用基于改進(jìn)歐氏距離的模板匹配法進(jìn)行手勢(shì)識(shí)別。該方法可有效識(shí)別不同手勢(shì),使得以高效、直接、自然的手勢(shì)為主要方式的人機(jī)交互更加接近人與人之間的交流。
【專利附圖】
【附圖說(shuō)明】
[0023]圖1是本發(fā)明的手勢(shì)自動(dòng)識(shí)別方法的流程圖。
[0024]圖2是手勢(shì)區(qū)域的外圍矩形。
[0025]圖3是判斷手勢(shì)的方向。
[0026]圖4是掃描手勢(shì)圖像中手指的個(gè)數(shù)。
[0027]圖5是手外圍矩形的中心A與手勢(shì)二值圖像的重心B。
【具體實(shí)施方式】
[0028]下面結(jié)合附圖,對(duì)本發(fā)明提出的手勢(shì)識(shí)別方法進(jìn)行詳細(xì)說(shuō)明:
[0029]如圖1所示,本發(fā)明的手勢(shì)自動(dòng)識(shí)別方法,其步驟如下
[0030]步驟101,采集手勢(shì)視頻數(shù)據(jù);
[0031]步驟102,對(duì)步驟101得到的視頻數(shù)據(jù)中的每幀源圖像進(jìn)行預(yù)處理;
[0032]步驟103,對(duì)步驟102得到的預(yù)處理后的圖像由RGB顏色空間轉(zhuǎn)換到Y(jié)CbCr顏色空間;
[0033]步驟104,對(duì)步驟103得到的YCbCr顏色空間中的圖像像素點(diǎn),使用膚色橢圓模型進(jìn)行皮膚檢測(cè),得到二值圖像;
[0034]步驟105,對(duì)步驟104得到的二值圖像中的最大連通域進(jìn)行邊緣檢測(cè)和輪廓提取來(lái)分割手勢(shì),得到邊緣圖像和輪廓矩陣;
[0035]步驟106,基于步驟104得到的二值圖像和步驟105得到的邊緣圖像和輪廓矩陣,提取手勢(shì)特征向量;
[0036]步驟107,根據(jù)步驟106提取的手勢(shì)特征向量判斷手勢(shì)的類別。
[0037]下面結(jié)合圖1-5詳細(xì)說(shuō)明本發(fā)明的手勢(shì)自動(dòng)識(shí)別方法。
[0038]1.顏色空間轉(zhuǎn)換
[0039]本發(fā)明在顏色空間轉(zhuǎn)換步驟使用YCbCr顏色空間。因?yàn)閅CbCr具有二維獨(dú)立分布性質(zhì),能夠較好的限制膚色分布區(qū)域。通過(guò)對(duì)膚色像素點(diǎn)在YCbCr空間中做投影,可以將膚色像素點(diǎn)聚類成橢圓形分布。[0040]YCbCr是DVD、攝像機(jī)、數(shù)字電視等消費(fèi)類視頻產(chǎn)品中常用的色彩編碼方案。YCbCr有時(shí)也稱為YCC。YCbCr在模擬分量視頻中也常被稱為YPbPr。YCbCr不是一種絕對(duì)色彩空間,是YUV壓縮和偏移的版本。YCbCr中的Y是指亮度分量,Cb指藍(lán)色色度分量,而Cr指的是紅色色度分量。YCbCr色彩模型被廣泛應(yīng)用在電視的色彩顯示領(lǐng)域,具有將空間中的色度與亮度分離的特點(diǎn)。人的肉眼對(duì)視頻的Y分量更敏感,因此在通過(guò)對(duì)色度分量進(jìn)行子采樣來(lái)減少色度分量后,肉眼將察覺(jué)不到圖像質(zhì)量的變化。
[0041]YCbCr是設(shè)備無(wú)關(guān)的,與RGB之間具有簡(jiǎn)單的線性變換關(guān)系。
【權(quán)利要求】
1.一種手勢(shì)自動(dòng)識(shí)別方法,其特征在于,包括如下步驟: 步驟A,采集手勢(shì)視頻數(shù)據(jù); 步驟B,對(duì)步驟A得到的視頻數(shù)據(jù)中的每幀源圖像進(jìn)行中值濾波; 步驟C,將步驟B得到的中值濾波圖像映射到Y(jié)CbCr顏色空間; 步驟D,對(duì)步驟C得到的YCbCr顏色空間中的圖像像素點(diǎn),使用膚色橢圓模型進(jìn)行皮膚檢測(cè),得到二值圖像; 步驟E,找出步驟D得到的二值圖像中的面積最大連通域,并對(duì)其進(jìn)行邊緣檢測(cè)和輪廓提取來(lái)分割手勢(shì),得到手勢(shì)邊緣圖像和輪廓矩陣; 步驟F,基于步驟D得到的二值圖像和步驟E得到的邊緣圖像和輪廓矩陣,提取手勢(shì)特征向量; 步驟G,根據(jù)步驟F得到的特征向量,采用基于改進(jìn)歐氏距離的模板匹配法進(jìn)行手勢(shì)的特征匹配和識(shí)別。
2.根據(jù)權(quán)利要求1所述的一種手勢(shì)自動(dòng)識(shí)別方法,其特征在于,步驟D中,所述皮膚檢測(cè),其具體過(guò)程如下: 步驟D-1,將步驟C得到的YCbCr顏色空間中的圖像像素點(diǎn)向CbCr平面進(jìn)行投影,得到次平面; 步驟D-2,對(duì)步驟D-1得到的次平面上的圖像像素點(diǎn)做K-L變換; 步驟D-3,對(duì)步驟D-2得到的K-L變換后的圖像像素點(diǎn)用橢圓模型進(jìn)行分類,得到二值圖像。
3.根據(jù)權(quán)利要求1所述的一種手勢(shì)自動(dòng)識(shí)別方法,其特征在于,步驟E中,所述連通域是指二值圖像中,像素點(diǎn)同值連片區(qū)域,該同值連片區(qū)域中,沒(méi)有不同值的像素點(diǎn)。
4.根據(jù)權(quán)利要求1所述的一種手勢(shì)自動(dòng)識(shí)別方法,其特征在于,步驟F中,所述提取手勢(shì)特征向量,其具體過(guò)程如下: 步驟F-1,對(duì)步驟D得到的二值圖像和步驟E得到的手勢(shì)邊緣圖像和輪廓矩陣進(jìn)行定量描述,提取手勢(shì)的統(tǒng)計(jì)特征參數(shù),所述統(tǒng)計(jì)特征參數(shù)包括圖像歸一化轉(zhuǎn)動(dòng)慣量和不變矩特征; 步驟F-2,對(duì)步驟D得到的二值圖像和步驟E得到的手勢(shì)邊緣圖像和輪廓矩陣進(jìn)行定量描述,提取手勢(shì)的形狀特征參數(shù),所述形狀特征參數(shù)包括外圍矩形、方向、周長(zhǎng)、面積、比例值; 步驟F-3,對(duì)步驟D得到的二值圖像和步驟E得到的手勢(shì)邊緣圖像和輪廓矩陣進(jìn)行定量描述,提取手指的個(gè)數(shù),并判定是否包含拇指。
【文檔編號(hào)】G06K9/00GK103679145SQ201310654467
【公開(kāi)日】2014年3月26日 申請(qǐng)日期:2013年12月6日 優(yōu)先權(quán)日:2013年12月6日
【發(fā)明者】王敏 申請(qǐng)人:河海大學(xué)