亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

自動捕捉目標物的系統(tǒng)和方法

文檔序號:9453428閱讀:446來源:國知局
自動捕捉目標物的系統(tǒng)和方法
【技術領域】
[0001]本發(fā)明涉及計算機識別技術,特別是涉及一種自動捕捉目標物的系統(tǒng)和方法。
【背景技術】
[0002]人工智能(Artificial Intelligence)是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統(tǒng)的一門新的技術科學。人工智能是計算機科學的一個分支,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。隨著計算機科學的發(fā)展,越來越多的智能產(chǎn)品開始問世。
[0003]然而,現(xiàn)有的智能產(chǎn)品還局限于對簡單的圖像、語音進行識別,當需要對多個目標物中的某一個或對一個目標物中的某一個部位進行識別時,識別的準確率會大大地降低,也影響了智能產(chǎn)品與用戶的交互性能。比如,在人機交互時,人問智能產(chǎn)品“這是什么? ”、“看這里”,智能產(chǎn)品不理解“這”、“這里”是什么意思,即不能準備捕捉“這”所指代的目標物。

【發(fā)明內容】

[0004]基于此,有必要提供一種可以提高識別準確度和交互性能的自動捕捉目標物的系統(tǒng)和方法。
[0005]—種自動捕捉目標物的系統(tǒng),包括:
[0006]圖像采集模塊,用于采集包含有用戶手勢和目標物的圖像;
[0007]手勢識別模塊,用于識別用戶手勢并輸出手勢識別結果,所述手勢識別結果為手拿物體的手勢或手指向物體的手勢;
[0008]圖像識別模塊,用于根據(jù)所述手勢識別結果確定目標物的位置、識別目標物,并輸出圖像識別結果;
[0009]交互模塊,用于根據(jù)所述圖像識別結果與用戶進行交互。
[0010]在其中一個實施例中,所述圖像識別模塊包括:
[0011]目標物捕捉單元,用于根據(jù)所述手勢識別結果確定目標物的位置;
[0012]圖像處理單元,用于提取目標物的圖像特征;
[0013]圖像識別單元,用于將目標物的圖像特征與預存的模版特征進行比較以獲取目標物信息;
[0014]結果輸出單元,用于輸出所述目標物信息作為圖像識別結果。
[0015]在其中一個實施例中,所述目標物為單獨個體或為單獨個體中的一個部分。
[0016]在其中一個實施例中,還包括:
[0017]語音采集模塊,用于采集用戶語音;
[0018]語音識別模塊,用于識別用戶的語音并輸出語音識別結果;
[0019]所述交互模塊還用于根據(jù)所述圖像識別結果和所述語音識別結果與用戶進行交互。
[0020]在其中一個實施例中,所述交互模塊包括顯示單元和/或語音播放單元;其中,
[0021]所述顯示單元用于顯示所述圖像識別結果;
[0022]所述語音播放單元用于播放所述圖像識別結果。
[0023]—種自動捕捉目標物的方法,包括:
[0024]采集包含有用戶手勢和目標物的圖像;
[0025]識別用戶手勢并輸出手勢識別結果,所述手勢識別結果為手拿物體的手勢或手指向物體的手勢;
[0026]根據(jù)所述手勢識別結果確定目標物的位置、識別目標物,并輸出圖像識別結果;
[0027]根據(jù)所述圖像識別結果與用戶進行交互。
[0028]在其中一個實施例中,所述根據(jù)所述手勢識別結果確定目標物的位置、識別目標物,并輸出圖像識別結果的步驟,包括:
[0029]根據(jù)所述手勢識別結果確定目標物的位置;
[0030]提取目標物的圖像特征;
[0031 ] 將目標物的圖像特征與預存的模版特征進行比較以獲取目標物信息;
[0032]輸出所述目標物信息作為圖像識別結果。
[0033]在其中一個實施例中,所述目標物為單獨個體或為單獨個體中的一個部分。
[0034]在其中一個實施例中,還包括:
[0035]采集用戶語音;
[0036]識別用戶的語音并輸出語音識別結果;
[0037]所述根據(jù)所述圖像識別結果與用戶進行交互的步驟具體為:
[0038]根據(jù)所述圖像識別結果和所述語音識別結果與用戶進行交互。
[0039]在其中一個實施例中,所述根據(jù)所述圖像識別結果與用戶進行交互的步驟包括顯示所述圖像識別結果的步驟和/或包括播放所述圖像識別結果的步驟。
[0040]上述自動捕捉目標物的系統(tǒng)和方法,通過圖像采集模塊采集包含有用戶手勢和目標物的圖像,手勢識別模塊識別用戶手勢并輸出手勢識別結果,圖像識別模塊根據(jù)所述手勢識別結果確定目標物的位置、識別目標物,并輸出圖像識別結果,交互模塊根據(jù)所述圖像識別結果與用戶進行交互,這樣即使需要對多個目標物中的一個或對一個目標物中的某一個部位進行識別,也可以根據(jù)用戶的手勢準確地捕捉到目標物,然后再對目標物進行識別并與用戶進行交互,提高了識別的準確率和交互性能。
【附圖說明】
[0041 ]圖1為一實施例中自動捕捉目標物的系統(tǒng)的模塊圖;
[0042]圖2為用戶手勢的示意圖之一;
[0043]圖3為用戶手勢的示意圖之二;
[0044]圖4為用戶手勢的示意圖之三;
[0045]圖5為另一實施例中自動捕捉目標物的系統(tǒng)模塊圖;
[0046]圖6為一實施例中自動捕捉目標物的方法的流程圖;
[0047]圖7為另一實施例中自動捕捉目標物的方法的流程圖。
【具體實施方式】
[0048]為了便于理解本發(fā)明,下面將參照相關附圖對本發(fā)明進行更全面的描述。附圖中給出了本發(fā)明的較佳的實施例。但是,本發(fā)明可以以許多不同的形式來實現(xiàn),并不限于本文所描述的實施例。相反地,提供這些實施例的目的是使對本發(fā)明的公開內容的理解更加透徹全面。
[0049]除非另有定義,本文所使用的所有的技術和科學術語與屬于本發(fā)明的技術領域的技術人員通常理解的含義相同。本文所使用的術語只是為了描述具體的實施例的目的,不是旨在于限制本發(fā)明。本文所使用的術語“和/或”包括一個或多個相關的所列項目的任意的和所有的組合。
[0050]請參照圖1,為一實施例中自動捕捉目標物的系統(tǒng)的模塊圖。
[0051]該自動捕捉目標物的系統(tǒng)可應用于機器人、電視機等任意智能產(chǎn)品中,包括圖像采集模塊110、手勢識別模塊120、圖像識別模塊130以及交互模塊140。其中,圖像采集模塊110用于采集包含有用戶手勢和目標物的圖像。手勢識別模塊120用于識別用戶手勢并輸出手勢識別結果,所述手勢識別結果為手拿物體的手勢或手指向物體的手勢。圖像識別模塊130用于根據(jù)所述手勢識別結果確定目標物的位置、識別目標物,并輸出圖像識別結果。交互模塊140用于根據(jù)所述圖像識別結果與用戶進行交互。
[0052]圖像采集模塊110為攝像頭,用于采集包含有用戶手勢和目標物的圖像信息。在一個實施例中,用戶的手勢可以是如圖2所示的五指呈收攏狀,也可以是圖3所示的手指呈指向狀。目標物為單獨個體或為單獨個體中的一個部分。這里的單獨個體可以是任何物體(如蘋果、杯子、書本等),也可以是人,那么單獨個體的一部分就是指杯子的杯蓋、書本的封面、人的某個器官或部位等。
[0053]比如,用戶需要識別一個蘋果,那么只需要手握蘋果或手指著蘋果出現(xiàn)在攝像頭可視的范圍內即可,這時圖像采集模塊110便會采集到包含有用戶手勢和蘋果的圖像信息。
[0054]手勢識別模塊120用于識別用戶手勢并輸出手勢識別結果,所述手勢識別結果為手拿物體的手勢或手指物體的手勢。具體地,用戶需要識別放置在不同位置的物體時,就會做出不同的手勢。當用戶在圖像采集模塊110的可視范圍內做出相應手勢時,手勢識別模塊120會輸出一個手勢識別結果??梢岳斫?,手勢識別結果還可以為其他手勢,如雙手抱物體等,這里不作嚴格限制。
[0055]在一個實施例中,如果用戶做出如圖2所示的手勢,手勢識別模塊120將該手勢與預設手勢模版進行對比,輸出手勢識別結果為手拿物體的手勢;如果用戶做出如圖3所示的手勢,手勢識別模塊120將該手勢與預設手勢模版進行對比,輸出手勢識別結果為手指向物體的手勢。
[0056]進一步地,用戶還可以設置圖3所示的手勢為指向目標物的一個部分,設置圖4所示的手勢為指向目標物的整體。
[0057]其中,預設手勢模版可以自定義設置。
[0058]圖像識別模塊130用于根據(jù)所述手勢識別結果確定目標物的位置、識別目標物,并輸出圖像識別結果。手勢識別結果無論是手拿物體的手勢還是手指向物體的手勢,圖像識別模塊130都能根據(jù)手勢識別結果確定目標物的位置。
[0059]在一個實施例中,圖像識別模塊130包括目標物捕捉單元、圖像處理單元、圖像識別單元以及結果輸出單元。其中,所述目標物捕捉單元用于根據(jù)所述手勢識別結果確定目標物的位置,所述圖像處理單元用于提取目標物的圖像特征,所述圖像識別單元用于將目標物的圖像特征與預存的模版特征進行比較以獲取目標物信息,所述結果輸出單元用于輸出所述目標物信息作為圖像識別結果。
[0060]比如,用戶手拿一個蘋果,手勢識別結果為手拿物體的手勢,那么所述目標物捕捉單元便會確定用戶手中的蘋果即是目標物,所述圖像處理單元便會提取蘋果的圖像特征(如顏色特征及紋理特征等),然后所述圖像識別單元用于將目標物的圖像特征與預存的模版特征進行比較,預存的模版特征可能包括各種水果的模版特征、各種學習用品的模版特征等等,經(jīng)過比較就可以識別該目標物為蘋果,從而獲取到目標物信息并輸出。
[0061]比如,用戶手指著嘴巴,手勢識別結果為手指物體的手勢,那么所述目標物捕捉單元便會確定用戶手指向的嘴巴即是目標物,所述圖像處理單元便會將目標物的圖像特征與預存的模版特征進行比較,經(jīng)過比較就可以識別該目標物為人的嘴巴,從而獲取到目標物信息并輸出。
[0062]在一個實施例中,目標物信息包括目標物
當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1