專利名稱:一種基于人手手勢的交互命令識別方法及系統(tǒng)的制作方法
技術領域:
本發(fā)明屬于電視機技術領域,尤其涉及一種基于人手手勢的交互命令識別方法及系統(tǒng)。
背景技術:
目前,各種消費電子產品的功能越來越強大,交互命令也越來越多,越來越復雜。對于用戶來說,也增加了交互的復雜性。因此,更加自然的人機交互技術成為消費電子產品交互的重要方式之一。在各種自然的人機交互方式中,手勢操作是一種非常方便快捷的方式。然而,現(xiàn)有技術中對人手手勢進行識別的三維手勢識別技術識別速度慢、識別率低,導致用戶的手勢操作的響應時間過長,降低了用戶體驗。
發(fā)明內容
本發(fā)明實施例的目的在于提供一種三維手勢識別方法及系統(tǒng),旨在解決由于現(xiàn)有技術無法提供一種有效的手勢識別方法,導致手勢的識別速度慢、識別率低的問題。本發(fā)明實施例是這樣實現(xiàn)的,一種基于人手手勢的交互命令識別方法,所述方法包括下述步驟步驟A、對預設的第一攝像頭和第二攝像頭分別進行標定,以獲取所述第一攝像頭和第二攝像頭的投影矩陣;步驟B、分別從所述第一攝像頭和第二攝像頭對應的圖像緩存區(qū)根據(jù)圖像拍攝時間的先后順序獲取一張圖像,組成一個圖像對,所述圖像對中的兩張圖像拍攝時間最接近;步驟C、在所述圖像對中檢測匹配的人手圖像,當在所述圖像對中檢測到匹配的人手圖像時,根據(jù)所述第一攝像頭和第二攝像頭的投影矩陣,獲取所述匹配的人手圖像對應的人手三維坐標并存儲到預設的坐標存儲區(qū),檢測所述坐標存儲區(qū)存儲的人手三維坐標形成的人手運動軌跡是否包含預設的人手運動軌跡,是則獲取該人手運動軌跡對應的交互命令,否則,跳轉至步驟B。本發(fā)明實施例的另一目的在于提供一種基于人手手勢的交互命令識別系統(tǒng),其特征在于,所述系統(tǒng)包括攝像頭標定單元,用于對預設的第一攝像頭和第二攝像頭分別進行標定,以獲取所述第一攝像頭和第二攝像頭的投影矩陣;圖像對獲取單元,用于分別從所述第一攝像頭和第二攝像頭對應的圖像緩存區(qū)根據(jù)圖像拍攝時間的先后順序獲取一張圖像,組成一個圖像對,所述圖像對中的兩張圖像拍攝時間最接近;以及交互命令識別單元,用于在所述圖像對中檢測匹配的人手圖像,當在所述圖像對中檢測到匹配的人手圖像時,根據(jù)所述第一攝像頭和第二攝像頭的投影矩陣,獲取所述匹配的人手圖像對應的人手三維坐標并存儲到預設的坐標存儲區(qū),檢測所述坐標存儲區(qū)存儲的人手三維坐標形成的人手運動軌跡是否包含預設的人手運動軌跡,是則獲取該人手運動軌跡對應的交互命令,否則,跳轉至觸發(fā)圖像對獲取單元,以分別從所述第一攝像頭和第二攝像頭對應的圖像緩存區(qū)根據(jù)圖像拍攝時間的先后順序獲取下一張圖像,組成一個圖像對。本發(fā)明實施例分別從預設的第一攝像頭和第二攝像頭對應的圖像緩存區(qū)根據(jù)圖像拍攝時間的先后順序獲取一張圖像,組成一個圖像對,當在圖像對中檢測到匹配的人手圖像時,根據(jù)第一攝像頭和第二攝像頭的投影矩陣,獲取匹配的人手圖像對應的人手三維坐標并存儲到預設的坐標存儲區(qū),當檢測到坐標存儲區(qū)存儲的人手三維坐標形成的人手運動軌跡包含預設的人手運動軌跡,獲取該人手運動軌跡對應的交互命令,從而實現(xiàn)了基于人手手勢的交互命令的識別,提高了人手手勢的識別速度以及識別率。
圖I是本發(fā)明基于人手手勢的交互命令識別方法的較佳實施例的實現(xiàn)流程圖; 圖2是本發(fā)明基于人手手勢的交互命令識別系統(tǒng)的較佳實施例的結構圖;以及圖3是圖2所示交互命令識別單元的結構圖。
具體實施例方式為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結合附圖及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。以下結合具體實施例對本發(fā)明的具體實現(xiàn)進行詳細描述實施例一:圖I示出了本發(fā)明基于人手手勢的交互命令識別方法的較佳實施例的實現(xiàn)流程,詳述如下在步驟SlOl中,對預設的第一攝像頭和第二攝像頭分別進行標定,以獲取第一攝像頭和第二攝像頭的投影矩陣。在本發(fā)明實施例中,在交互終端上預先設置兩個攝像頭,記為第一攝像頭、第二攝像頭,對第一攝像頭和第二攝像頭分別進行標定,以獲取第一攝像頭和第二攝像頭的投影矩陣。其中,交互終端可以是電視機等顯示裝置。攝像頭標定是指通過實驗和計算獲取到攝像頭成像的幾何模型,即獲取到真實世界中的物點(X,1,Z)與其圖像平面中的像點(U,V)的幾何映射關系。在具體實施過程中,對第一攝像頭和第二攝像頭進行標定時,可以采用傳統(tǒng)標定方法、自標定方法以及基于主動視覺的標定方法。物點的三維坐標(x,y,z)通
Γ V
U
過一個投影矩陣M映射成圖像平面像點的二維坐標(u,v),存在如下關系叉V =MYZ ,
I
L1-
其中Z。是一個比例因子,M為投影矩陣。對預設的第一攝像頭和第二攝像頭分別進行標定后,就可以獲取第一攝像頭和第二攝像頭的投影矩陣W、M2。在步驟S102中,分別從第一攝像頭和第二攝像頭對應的圖像緩存區(qū)根據(jù)圖像拍攝時間的先后順序獲取一張圖像,組成一個圖像對,該圖像對中的兩張圖像拍攝時間最接近。在本發(fā)明實施例中,第一攝像頭和第二攝像頭同步連續(xù)地拍攝圖像,拍攝的圖像被分別存儲到各自對應的圖像緩存區(qū)中。因此,兩個攝像頭拍攝的圖像是一一對應的,在同一時間點兩個攝像頭拍攝的兩張圖像為用戶輸入的同一個手勢在該時間點的位置圖像。由于機械誤差或其它原因,同步拍攝的兩張圖像在拍攝時間上可能存在一定的差異,但該圖像對中的兩張圖像拍攝時間是最接近的。在具體實施過程中,可以采用兩個隊列分別來緩存兩個攝像頭拍攝的圖像,進而可采用先進先出的方式分別從兩個隊列的相同位置獲取一張圖像,以組成一個圖像對,從而減少圖像對的獲取時間。當然也可以采用其它方式,在此不用限制本發(fā)明。在步驟S103中,在圖像對中檢測匹配的人手圖像,當在圖像對中檢測到匹配的人手圖像時,根據(jù)第一攝像頭和第二攝像頭的投影矩陣,獲取匹配的人手圖像對應的人手三維坐標并存儲到預設的坐標存儲區(qū)。在本發(fā)明實施例中,在圖像對中通過相應的圖像處理方式檢測匹配的人手圖像,即在第一攝像頭和第二攝像頭在同一時間點拍攝的兩張圖像中,識別出同一只手。在本發(fā)明實施的一實施例中,可以采用下述方式在圖像對中檢測匹配的人手圖像I)將從第一攝像頭的圖像緩存區(qū)獲取的一張圖像設置為第一圖像,將從第二攝像頭的圖像緩存區(qū)獲取的一張與第一圖像拍攝時間最接近的圖像設置為第二圖像。2)通過預設的運動檢測算法分別獲取第一圖像和第二圖像中人手的候選區(qū)域,在候選區(qū)域檢測人手圖像。在本發(fā)明實施例中,可以采用背景減法、幀差法等算法來分別獲取第一圖像和第二圖像中人手的候選區(qū)域,以提高圖像的處理速度。為了適應復雜背景和快速變化的背景,優(yōu)選地,采用三幀差法檢測人手。例如,設其中一幅圖像的序列表示為=Ii(UV),其中(UV)表示圖像中像素點的位置坐標,i表示本幅圖像(或者稱為i時間點的圖像)。選取圖像序列中連續(xù)的三幅圖像Ip1 (Uv)、Ii (Uv)、Ii+1 (Uv),分別計算相鄰兩幅圖像的插值圖像(Ii,
「0029]
權利要求
1.一種基于人手手勢的交互命令識別方法,其特征在于,所述方法包括下述步驟 步驟A、對預設的第一攝像頭和第二攝像頭分別進行標定,以獲取所述第一攝像頭和第二攝像頭的投影矩陣; 步驟B、分別從所述第一攝像頭和第二攝像頭對應的圖像緩存區(qū)根據(jù)圖像拍攝時間的先后順序獲取一張圖像,組成一個圖像對,所述圖像對中的兩張圖像拍攝時間最接近; 步驟C、在所述圖像對中檢測匹配的人手圖像,當在所述圖像對中檢測到匹配的人手圖像時,根據(jù)所述第一攝像頭和第二攝像頭的投影矩陣,獲取所述匹配的人手圖像對應的人手三維坐標并存儲到預設的坐標存儲區(qū),檢測所述坐標存儲區(qū)存儲的人手三維坐標形成的人手運動軌跡是否包含預設的人手運動軌跡,是則獲取該人手運動軌跡對應的交互命令,否則,跳轉至步驟B。
2.如權利要求I所述的方法,其特征在于,根據(jù)所述第一攝像頭和第二攝像頭的投影矩陣,獲取所述匹配的人手圖像對應的人手三維坐標的步驟包括 在所述檢測到的匹配的人手圖像中選擇表征人手的預設位置的匹配點,計算所述預設位置的匹配點對應的人手三維坐標。
3.如權利要求I或2所述的方法,其特征在于,所述在所述圖像對中檢測匹配的人手圖像的步驟包括 將從所述第一攝像頭的圖像緩存區(qū)獲取的一張圖像設置為第一圖像,將從所述第二攝像頭的圖像緩存區(qū)獲取的一張與所述第一圖像拍攝時間最接近的圖像設置為第二圖像; 通過預設的運動檢測算法分別獲取所述第一圖像和第二圖像中人手的候選區(qū)域,在所述候選區(qū)域檢測人手圖像; 根據(jù)所述第一攝像頭和第二攝像頭的投影矩陣,對在所述第一圖像中人手的候選區(qū)域檢測到的人手圖像以及在所述第二圖像中人手的候選區(qū)域檢測到的人手圖像進行匹配,獲取所述第一圖像與所述第二圖像匹配的人手圖像。
4.如權利要求3所述的方法,其特征在于,所述通過預設的運動檢測算法分別獲取所述第一圖像和第二圖像中人手的候選區(qū)域的步驟包括 對在分別獲取的上一張圖像組成一個圖像對中檢測到的匹配的人手圖像進行圖像跟蹤,將跟蹤得到的圖像區(qū)域設置為所述第一圖像和第二圖像中人手的候選區(qū)域。
5.如權利要求3所述的方法,其特征在于,所述預設的運動檢測算法為三幀差法。
6.一種基于人手手勢的交互命令識別系統(tǒng),其特征在于,所述系統(tǒng)包括 攝像頭標定單元,用于對預設的第一攝像頭和第二攝像頭分別進行標定,以獲取所述第一攝像頭和第二攝像頭的投影矩陣; 圖像對獲取單元,用于分別從所述第一攝像頭和第二攝像頭對應的圖像緩存區(qū)根據(jù)圖像拍攝時間的先后順序獲取一張圖像,組成一個圖像對,所述圖像對中的兩張圖像拍攝時間最接近;以及 交互命令識別單元,用于在所述圖像對中檢測匹配的人手圖像,當在所述圖像對中檢測到匹配的人手圖像時,根據(jù)所述第一攝像頭和第二攝像頭的投影矩陣,獲取所述匹配的人手圖像對應的人手三維坐標并存儲到預設的坐標存儲區(qū),檢測所述坐標存儲區(qū)存儲的人手三維坐標形成的人手運動軌跡是否包含預設的人手運動軌跡,是則獲取該人手運動軌跡對應的交互命令,否則,跳轉至觸發(fā)圖像對獲取單元,以分別從所述第一攝像頭和第二攝像頭對應的圖像緩存區(qū)根據(jù)圖像拍攝時間的先后順序獲取下一張圖像,組成一個圖像對。
7.如權利要求6所述的系統(tǒng),其特征在于,所述交互命令識別單元包括 三維坐標計算單元,用于在所述檢測到的匹配的人手圖像中選擇表征人手的預設位置的匹配點,計算所述預設位置的匹配點對應的人手三維坐標。
8.如權利要求6或7所述的系統(tǒng),其特征在于,所述交互命令識別單元包括 圖像設置單元,用于將從所述第一攝像頭的圖像緩存區(qū)獲取的一張圖像設置為第一圖像,將從所述第二攝像頭的圖像緩存區(qū)獲取的一張與所述第一圖像拍攝時間最接近的圖像設置為第二圖像; 圖像檢測單元,用于通過預設的運動檢測算法分別獲取所述第一圖像和第二圖像中人手的候選區(qū)域,在所述候選區(qū)域檢測人手圖像;以及 圖像獲取單元,用于根據(jù)所述第一攝像頭和第二攝像頭的投影矩陣,對在所述第一圖像中人手的候選區(qū)域檢測到的人手圖像以及在所述第二圖像中人手的候選區(qū)域檢測到的人手圖像進行匹配,獲取所述第一圖像與所述第二圖像匹配的人手圖像。
9.如權利要求8所述的系統(tǒng),其特征在于,所述圖像檢測單元包括 候選區(qū)域設置單元,用于對在分別獲取的上一張圖像組成一個圖像對中檢測到的匹配的人手圖像進行圖像跟蹤,將跟蹤得到的圖像區(qū)域設置為所述第一圖像和第二圖像中人手的候選區(qū)域。
10.如權利要求8所述的系統(tǒng),其特征在于,所述預設的運動檢測算法為三幀差法。
全文摘要
本發(fā)明適用電視機技術領域,提供了一種基于人手手勢的交互命令識別方法及系統(tǒng),包括步驟A、對預設的第一攝像頭和第二攝像頭分別進行標定,以獲取投影矩陣;步驟B、分別從第一攝像頭和第二攝像頭對應的圖像緩存區(qū)獲取一張圖像,組成一個圖像對;步驟C、當在圖像對中檢測到匹配的人手圖像時,獲取匹配的人手圖像對應的人手三維坐標并存儲到預設的坐標存儲區(qū),檢測坐標存儲區(qū)存儲的人手三維坐標形成的人手運動軌跡是否包含預設的人手運動軌跡,是則獲取該人手運動軌跡對應的交互命令,否則,跳轉至步驟B。
文檔編號H04N21/422GK102799271SQ20121023182
公開日2012年11月28日 申請日期2012年7月2日 優(yōu)先權日2012年7月2日
發(fā)明者李相濤, 費華靚, 邵詩強, 付東 申請人:Tcl集團股份有限公司