檢測裝置以及檢測方法
【專利說明】檢測裝置以及檢測方法
[0001]本申請主張以在2014年9月9日申請的日本專利申請?zhí)卦?014-183717為基礎(chǔ)的優(yōu)先權(quán),并將該基礎(chǔ)申請的全部內(nèi)容援引于本申請。
技術(shù)領(lǐng)域
[0002]本發(fā)明涉及檢測裝置以及檢測方法。
【背景技術(shù)】
[0003]以往已知一種被稱為智能(intelligent) AF的技術(shù),其是AF(AutoFocus,自動聚焦)技術(shù)的一種,通過解析攝像圖像來推斷操作者希望拍攝的被攝體(關(guān)注被攝體),并使焦點(focus)自動對準(zhǔn)到該推斷出的關(guān)注被攝體。根據(jù)智能AF,能夠通過簡易的操作來拍攝關(guān)注被攝體。
[0004]但是,在智能AF中,在操作者希望拍攝的被攝體(關(guān)注被攝體)與被推斷為關(guān)注被攝體的被攝體不一致的情況下,操作者需要進行使焦點變更到正確的關(guān)注被攝體的操作。
[0005]此外,在智能AF中,在使焦點對準(zhǔn)到攝像圖像所包含的多個被攝體中的任意一個來進行拍攝之后,即使想要使焦點對準(zhǔn)到其他被攝體來進行拍攝,也難以變更焦點。
[0006]此外,在智能AF中,在使用自拍器(self timer)進行拍攝時,在自拍器起動后難以變更焦點。
[0007]為了解決這樣的課題,例如,JP特開2011-35771號公報中公開的攝像裝置構(gòu)成為,輸出分別表示從圖像中識別出的多個被攝體的聲音,操作者能夠基于該聲音輸出來選擇關(guān)注被攝體。
[0008]但是,在上述專利文獻1的攝像裝置中,存在輸出表示從圖像中識別出的被攝體的聲音需要花費時間、在識別出相互類似的多個被攝體的情況下難以任選其一這樣的課題。因此,需要簡單并且確切地從攝像圖像中檢測操作者希望拍攝的被攝體。此外,不局限于從攝像圖像中檢測拍攝對象的被攝體,即使對于一般的圖像而言,也需要簡單并且確切地從圖像中檢測所希望的檢測對象。
【發(fā)明內(nèi)容】
[0009]本發(fā)明鑒于上述的課題而作,其目的在于,使得能夠簡單并且確切地從圖像中檢測所希望的檢測對象。
[0010]本發(fā)明的一個方式是一種從圖像中對檢測對象進行檢測的檢測裝置,具備:輸入部,其輸入指定所述檢測對象的語句;判別部,其根據(jù)通過所述輸入部而輸入的語句,來判別所述檢測對象的指定所涉及的屬性;選擇部,其根據(jù)由所述判別部判別出的屬性,來選擇所述檢測對象的檢測方法;和檢測部,其通過由所述選擇部選擇的檢測方法,從所述圖像中對所述檢測對象進行檢測。
[0011]本發(fā)明的另一方式是一種從圖像中對檢測對象進行檢測的檢測裝置,具備:變換部,其將通過輸入聲音的聲音輸入部而輸入的聲音變換為語句;提取部,其從由所述變換部變換得到的語句中提取名稱以外的特征;和檢測部,其從所述圖像中對具有與由所述提取部提取出的特征類似的特征的所述檢測對象進行檢測。
[0012]本發(fā)明的又一方式是一種是從圖像中對檢測對象進行檢測的檢測方法,包括:輸入處理,輸入對所述檢測對象進行指定的語句;判別處理,根據(jù)通過所述輸入處理而輸入的語句,來判別所述檢測對象的指定所涉及的屬性;選擇處理,根據(jù)通過所述判別處理而判別出的屬性,來選擇所述檢測對象的檢測方法;和檢測處理,利用通過所述選擇處理而選擇的檢測方法,從所述圖像中對所述檢測對象進行檢測。
[0013]根據(jù)下面的【具體實施方式】以及對應(yīng)的附圖,本發(fā)明的上述以及其他目的和新穎的特征會變得更加清楚。但應(yīng)清楚認(rèn)識到,附圖僅僅用于例示,并不旨在定義本發(fā)明的限制。
【附圖說明】
[0014]若結(jié)合以下附圖來考慮以下的詳細(xì)記述,則能夠得到本申請的更深一層的理解。
[0015]圖1是例示實施方式所涉及的檢測裝置的硬件結(jié)構(gòu)的框圖。
[0016]圖2是例示實施方式所涉及的檢測裝置的功能結(jié)構(gòu)的框圖。
[0017]圖3A是用于說明詞語“甜瓜”的屬性判別信息的圖。圖3B是用于說明詞語“紅色”的屬性判別信息的圖。圖3C是用于說明詞語卜''y”的屬性判別信息的圖。
[0018]圖4A是例示特征信息表的結(jié)構(gòu)的圖。圖4B是例示檢測優(yōu)先度表的結(jié)構(gòu)的圖。
[0019]圖5是用于說明實施方式所涉及的檢測裝置所執(zhí)行的攝像處理的流程圖。
[0020]圖6是用于說明實施方式所涉及的檢測裝置所執(zhí)行的對象(object)檢測處理的流程圖。
[0021]圖7是用于說明實施方式所涉及的檢測裝置所執(zhí)行的名稱檢測處理的流程圖。
[0022]圖8是表示目標(biāo)(target)圖像的一個例子的圖。
[0023]圖9是表不目標(biāo)圖像的其他例子的圖。
[0024]圖10是表不目標(biāo)圖像的其他例子的圖。
[0025]圖11是表示目標(biāo)圖像的其他例子的圖。
[0026]圖12是表示目標(biāo)圖像的其他例子的圖。
【具體實施方式】
[0027]以下,參照附圖來詳細(xì)地說明本發(fā)明的實施方式所涉及的檢測裝置以及檢測方法。另外,對圖中相同或者同等的部分賦予相同的符號。
[0028]本實施方式所涉及的檢測裝置構(gòu)成為如圖1所示。檢測裝置1具備攝像部10、處理部20和接口 30。
[0029]攝像部10通過按照后述的操作部32所受理的基于操作者的操作來拍攝被攝體,從而生成拍攝了被攝體的攝像圖像(實時取景圖像、取景圖像)。
[0030]攝像部10包含光學(xué)透鏡11和圖像傳感器12。
[0031]光學(xué)透鏡11具備使從被攝體射出的光進行會聚的透鏡、和用于調(diào)整焦點、曝光、白平衡等拍攝設(shè)定參數(shù)的外圍電路。
[0032]圖像傳感器12例如具備CO) (ChargeCoupledDevice,電荷親合元件)、CMOS (ComplementaryMetalOxideSemiconductor,互補型金屬氧化物半導(dǎo)體)等。圖像傳感器12獲取通過光學(xué)透鏡11使光會聚而成像的被攝體的光學(xué)像,并將獲取到的光學(xué)像的電壓信息通過模擬/數(shù)字變換器(未圖示)來變換為數(shù)字圖像數(shù)據(jù)。然后,將所得到的數(shù)字圖像數(shù)據(jù)輸出到圖像輸出部24。
[0033]處理部20對攝像部10所生成的攝像圖像實施后述的檢測處理。此外,處理部20通過執(zhí)行各種程序,實現(xiàn)檢測裝置1的各種功能。
[0034]處理部20包含CPU (CentralProcessingUnit,中央處理器)21、暫時存儲部22、主存儲部23和圖像輸出部24。
[0035]CPU21通過執(zhí)行存儲于主存儲部23的控制程序?qū)z測裝置1整體進行控制。此夕卜,CPU21通過執(zhí)行存儲于主存儲部23的、包含輪廓檢測程序、詞素解析程序在內(nèi)的各種程序,來實現(xiàn)檢測裝置1的各種功能。
[0036]暫時存儲部22例如具備RAM(RandomAccessMemory,隨機存取存儲器)等。暫時存儲部22作為CPU21的工作存儲器而發(fā)揮作用,暫時存儲包含通過攝像部10而生成的實時取景圖像在內(nèi)的各種圖像數(shù)據(jù)、從聲音處理部34提供的聲音數(shù)據(jù)以及程序等。
[0037]主存儲部23具備非易失性存儲器(例如閃存、硬盤),固定地存儲包含檢測裝置1整體的控制所需要的控制程序、詞素解析程序在內(nèi)的各種程序以及包含對照圖像數(shù)據(jù)在內(nèi)的各種固定數(shù)據(jù)等。主存儲部23將所存儲的程序、數(shù)據(jù)提供給CPU21、圖像輸出部24。
[0038]圖像輸出部24通過對攝像部10拍攝到的圖像數(shù)據(jù)實施規(guī)定處理(例如,使分辨率降低的處理)來生成實時取景圖像。圖像輸出部24將基于攝像部10的攝像圖像提供給暫時存儲部22進行存儲,并且將生成的實時取景圖像提供給后述的顯示部31進行顯示。
[0039]此外,圖像輸出部24讀出存儲于暫時存儲部21、主存儲部23的圖像數(shù)據(jù),生成與該圖像數(shù)據(jù)相對應(yīng)的RGB (R (Red,紅色),G(Green,綠色),B(Blue,藍色))信號,并輸出到后述的顯示部31。
[0040]接口 30受理來自外部的操作輸入、圖像以及聲音數(shù)據(jù)輸入,并且向外部輸出聲音數(shù)據(jù)、圖像數(shù)據(jù)。
[0041]接口 30包含顯示部31、操作部32、聲音輸入部33、聲音處理部34、聲音輸出部35和外部接口 36。
[0042]顯示部31例如具備IXD(LiquidCrystalDisplay,液晶顯示器)、CRT (CathodeRayTube,電子射線管)、有機 EL (ElectroLuminescence,電致發(fā)光)顯不器等,基于從圖像輸出部24提供的圖像數(shù)據(jù),顯示包含實時取景圖像在內(nèi)的各種圖像。
[0043]操作部32受理基于操作者的操作輸入。操作部32具備鍵盤,并且具備包含快門按鈕、取消按鈕、用于選擇檢測裝置1的動作模式的模式選擇按鈕等在內(nèi)的各種操作按鈕。操作部32將所受理的操作輸入提供給攝像部10、CPU21等。
[0044]另外,顯示部31和操作部32也可以通過彼此重疊配置的所謂的觸摸面板來構(gòu)成。
[0045]聲音輸入部33具備麥克風(fēng),從外部受理包含操作者的聲音的模擬聲音信號的輸入。所輸入的模擬聲音信號被送出到聲音處理部34。
[0046]聲音處理部34將從聲音輸入部33提供的模擬聲音信號變換為數(shù)字聲音信號,并提供給暫時存儲部22。此外,聲音處理部34讀出存儲于暫時存儲部22、主存儲部23的數(shù)字聲音信號,變換為模擬聲音信號而輸出到聲音輸出部35。
[0047]聲音輸出部35具備揚聲器、頭戴式耳機等,將從聲音處理部34提供的模擬聲音信號輸出到外部。
[0048]外部接口 36是用于與檢測裝置1的外部的設(shè)備交換數(shù)據(jù)的接口。外部接口 36例如將攝像圖像變換為USB (UniversalSerialBus,通用串行總線)標(biāo)準(zhǔn)的數(shù)據(jù),并經(jīng)由USB線纜與外部的設(shè)備之間收發(fā)數(shù)據(jù)。
[0049]檢測裝置1在功能上構(gòu)成為如圖2所示。檢測裝置1具備識別部101、距離測定部102、輸入部103、提取部104、判別部105、選擇部106、特征信息存儲部107、檢測部108、執(zhí)tx部109和拍攝部110。
[0050]另外,檢測裝置1雖然與通常的照相機同樣地具有眨眼檢測功能、人物檢測功能等,但在下面,以本實施方式中特征性的、從攝像圖像中對通過操作者聲音輸入的語句而指定的檢測對象進行檢測的功能為中心來進行說明。
[0051]識別部101將攝像部10所生成的攝像圖像作為目標(biāo)圖像,對目標(biāo)圖像實施對象?顏色?臉部識別處理,來識別目標(biāo)圖像所包含的對象物0B。所謂目標(biāo)圖像,是指成為檢測裝置1所執(zhí)行的檢測處理的對象的圖像。
[0052]例如,如后述的圖8?圖12所示的目標(biāo)圖像TGa?TGe(以下統(tǒng)稱為目標(biāo)圖像TG)那樣,目標(biāo)圖像是包含攝像部10拍攝到的各種