圖像捕獲中的特征檢測(cè)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明大體來(lái)說(shuō)涉及圖像捕獲,且特定來(lái)說(shuō)(但非排他地)涉及檢測(cè)圖像中的特征。
【背景技術(shù)】
[0002]圖像傳感器已變得普遍存在。其廣泛用于數(shù)碼靜物攝像機(jī)、蜂窩式電話、安全攝像機(jī)以及醫(yī)學(xué)、汽車(chē)及其它應(yīng)用中。用于制造圖像傳感器的技術(shù)繼續(xù)快速地進(jìn)展。
[0003]關(guān)于圖像傳感器有用的一個(gè)特征為特征檢測(cè)。舉例來(lái)說(shuō),包含圖像傳感器的一些裝置能夠響應(yīng)于檢測(cè)到圖像中的給定特征而捕獲圖像。舉例來(lái)說(shuō),可響應(yīng)于檢測(cè)到圖像框中的人正在微笑而捕獲圖像。照慣例,需要顯著存儲(chǔ)空間的來(lái)自訓(xùn)練圖像的特征的分類(lèi)器已經(jīng)加載到存儲(chǔ)器中以用于與圖像傳感器當(dāng)前正成像的當(dāng)前圖像進(jìn)行比較。為適應(yīng)特征(例如嘴及牙齒)所包含的大小、形狀及陰影的多樣化,可需要來(lái)自訓(xùn)練圖像的特征的大數(shù)目個(gè)分類(lèi)器以充分地識(shí)別微笑,舉例來(lái)說(shuō)。而且,額外訓(xùn)練圖像對(duì)于識(shí)別額外特征(例如用于眨眼檢測(cè)的眼睛)為必要的。因此,特征檢測(cè)耗費(fèi)顯著存儲(chǔ)器資源。
[0004]除存儲(chǔ)器資源之外,常規(guī)特征檢測(cè)還需要顯著處理資源以將當(dāng)前圖像與來(lái)自訓(xùn)練圖像的特征的分類(lèi)器的多樣化進(jìn)行比較。此可造成捕獲所要圖像的時(shí)間延遲且耗盡電池資源。因此,將減少存儲(chǔ)器、處理及/或電力消耗的特征檢測(cè)裝置及/或方法將為合意的。
【發(fā)明內(nèi)容】
[0005]本申請(qǐng)案涉及圖像捕獲中的特征檢測(cè)。根據(jù)本發(fā)明的一個(gè)方面,所述特征檢測(cè)方法包含識(shí)別初步圖像中的特征的近似位置。計(jì)算所述近似位置內(nèi)的圖像像素強(qiáng)度的梯度相位映射。通過(guò)將投影函數(shù)應(yīng)用于所述梯度相位映射來(lái)確定投影結(jié)果。分析所述投影結(jié)果以確定所述特征的狀態(tài)。
【附圖說(shuō)明】
[0006]參考以下各圖描述本發(fā)明的非限制性及非窮盡性實(shí)施例,其中除非另有規(guī)定,否則貫穿各個(gè)視圖的相似參考編號(hào)指代相似部件。
[0007]圖1圖解說(shuō)明根據(jù)本發(fā)明的實(shí)施例的展示面部表情辨識(shí)的實(shí)例性過(guò)程的流程圖。
[0008]圖2展示根據(jù)本發(fā)明的實(shí)施例的包含兩個(gè)人的場(chǎng)景的初步圖像。
[0009]圖3圖解說(shuō)明根據(jù)本發(fā)明的實(shí)施例使用實(shí)例性特征圖像產(chǎn)生梯度相位映射。
[0010]圖4圖解說(shuō)明可根據(jù)本發(fā)明的實(shí)施例利用的實(shí)例性投影函數(shù)方程式及熵方程式。
[0011]圖5圖解說(shuō)明根據(jù)本發(fā)明的實(shí)施例的實(shí)例性特征圖像的梯度相位映射。
【具體實(shí)施方式】
[0012]本文中描述用于檢測(cè)圖像中的特征的狀態(tài)以用于面部辨識(shí)的系統(tǒng)及方法的實(shí)施例。在以下說(shuō)明中,陳述眾多特定細(xì)節(jié)以提供對(duì)實(shí)施例的透徹理解。然而,所屬領(lǐng)域的技術(shù)人員將認(rèn)識(shí)到,本文中所描述的技術(shù)可在不具有具體細(xì)節(jié)中的一或多者的情況下實(shí)踐或者可借助其它方法、組件、材料等來(lái)實(shí)踐。在其它例子中,未詳細(xì)展示或描述眾所周知的結(jié)構(gòu)、材料或操作以避免使某些方面模糊。
[0013]本說(shuō)明書(shū)通篇所提及的“一個(gè)實(shí)施例”或“實(shí)施例”意指結(jié)合實(shí)施例描述的特定特征、結(jié)構(gòu)或特性包含于本發(fā)明的至少一個(gè)實(shí)施例中。因此,在本說(shuō)明書(shū)通篇中的各處出現(xiàn)的短語(yǔ)“在一個(gè)實(shí)施例中”或“在實(shí)施例中”未必全部指代同一實(shí)施例。此外,特定特征、結(jié)構(gòu)或特性可以任一適合方式組合于一或多個(gè)實(shí)施例中。
[0014]在本說(shuō)明書(shū)通篇中,使用數(shù)個(gè)技術(shù)術(shù)語(yǔ)。這些術(shù)語(yǔ)應(yīng)呈現(xiàn)其在其來(lái)自的技術(shù)中的普通意義,除非本文中特別定義或者其使用的上下文將另有明確建議。
[0015]圖1圖解說(shuō)明根據(jù)本發(fā)明的實(shí)施例的展示面部表情辨識(shí)的實(shí)例性過(guò)程100的流程圖。過(guò)程塊中的一些或全部過(guò)程塊在過(guò)程100中出現(xiàn)的次序不應(yīng)被視為限制性。而是,受益于本發(fā)明的所屬領(lǐng)域的技術(shù)人員將理解,可以未圖解說(shuō)明的多種次序或甚至并行地執(zhí)行過(guò)程塊中的一些過(guò)程塊。
[0016]過(guò)程100可通過(guò)具有數(shù)字圖像傳感器的攝像機(jī)內(nèi)的處理電路來(lái)執(zhí)行或可在集成到圖像傳感器中的處理電路上執(zhí)行。處理電路可包含處理器、現(xiàn)場(chǎng)可編程門(mén)陣列(“FPGA”)、數(shù)字信號(hào)處理器(“DSP”)或其它者。處理電路可包含用以存儲(chǔ)設(shè)置、圖像及從圖像傳感器接收的圖像數(shù)據(jù)的存儲(chǔ)器。在借助圖像傳感器利用過(guò)程100的上下文中,圖像傳感器可在捕獲永久數(shù)字圖像以無(wú)限期地保存之前不斷捕獲初步數(shù)字圖像以用于評(píng)估。在一個(gè)實(shí)施例中,當(dāng)圖像傳感器正捕獲初步數(shù)字圖像時(shí),針對(duì)某些特征(例如眼睛、鼻子、嘴、皺紋)評(píng)估那些初始數(shù)字圖像。
[0017]在過(guò)程塊105中,識(shí)別圖像中的特征的近似位置。圖2展示根據(jù)本發(fā)明的實(shí)施例的包含兩個(gè)人的場(chǎng)景的初步圖像210。如果選擇攝像機(jī)或圖像傳感器的眨眼檢測(cè)模式,那么待識(shí)別的特征可為眼睛。如果選擇攝像機(jī)或圖像傳感器的微笑檢測(cè)模式,那么待識(shí)別的特征可為嘴??赏ㄟ^(guò)耦合到攝像機(jī)的處理電路的用戶接口(例如撥盤(pán)或觸摸屏)選擇攝像機(jī)的模式。為識(shí)別初步圖像210中的特征,可使用各種識(shí)別過(guò)程。舉例來(lái)說(shuō),可通過(guò)形狀、大小、熵分析、投影函數(shù)或通過(guò)采用學(xué)習(xí)圖像的學(xué)習(xí)算法來(lái)識(shí)別特征。
[0018]作為實(shí)例,可利用上眼瞼與下眼瞼之間的距離比或上嘴唇與下嘴唇之間的距離來(lái)確定眼睛或嘴的近似位置。還可利用匹配例如嘴或眼睛的形狀的形狀的形狀算法來(lái)確定眼睛或嘴的近似位置。同樣,距離比可與形狀算法組合以識(shí)別特征的近似位置。
[0019]用以識(shí)別特征的近似位置的熵分析包含將初始熵分析應(yīng)用于圖像的像素強(qiáng)度。在一個(gè)實(shí)施例中,識(shí)別特征的近似位置包含將投影函數(shù)應(yīng)用于圖像的像素強(qiáng)度。
[0020]學(xué)習(xí)算法使用訓(xùn)練圖像來(lái)確定特征的近似位置。學(xué)習(xí)圖像含有嘴、眼睛及可用以更好地捕獲永久圖像的其它特征。在學(xué)習(xí)算法中,可將學(xué)習(xí)圖像與初步圖像的區(qū)域進(jìn)行比較以識(shí)別類(lèi)似特征。舉例來(lái)說(shuō),包含將眼睛的學(xué)習(xí)圖像與初步圖像210進(jìn)行比較的圖像處理可識(shí)別初步圖像210中的眼睛。在識(shí)別初步圖像210中的眼睛之后,可識(shí)別眼睛的近似位置且可裁剪初步圖像210以產(chǎn)生特征圖像225A。類(lèi)似地,包含將嘴的學(xué)習(xí)圖像與初步圖像210進(jìn)行比較的圖像處理可識(shí)別初步圖像210中的嘴。在識(shí)別初步圖像210中的嘴之后,可識(shí)別嘴的近似位置且可裁剪初步圖像210以產(chǎn)生特征圖像225B。
[0021]返回到圖1,在過(guò)程塊110中計(jì)算近似位置內(nèi)的圖像像素強(qiáng)度的梯度相位映射??赏ㄟ^(guò)耦合到捕獲初步圖像210的圖像傳感器的處理電路進(jìn)行所述計(jì)算。當(dāng)特征圖像225A或225B表示近似位置時(shí),在特征圖像225上計(jì)算圖像像素強(qiáng)度的梯度相位映射。出于本發(fā)明的目的,將計(jì)算梯度相位映射定義為給每一像素指派根據(jù)周?chē)?相鄰像素表示最急劇像素強(qiáng)度改變的方向的梯度。梯度描述為角度(度數(shù))。因此,將給緊挨著黑色像素(具有最小強(qiáng)度值)的白色像素(具有最大強(qiáng)度值)指派從白色像素指向黑色像素的向量的角度。
[0022]圖3圖解說(shuō)明根據(jù)本發(fā)明的實(shí)施例使用實(shí)例性特征圖像325產(chǎn)生梯度相位映射350。為產(chǎn)生梯度相位映射350,使用方程式901計(jì)算特征圖像325中的每一像素的梯度相位角(Φ),其中Φ為在點(diǎn)(x,y)處的梯度的方向。
[0023]一旦在圖1中的過(guò)程塊115中產(chǎn)生了梯度相位映射,即在過(guò)程塊115中將投影函數(shù)應(yīng)用于梯度相位映射(例如梯度相位映射350)以確定投影結(jié)果??墒褂孟惹疤峒暗奶幚黼娐穼⑼队昂瘮?shù)應(yīng)用于梯度相位映射。在一個(gè)實(shí)施例中,將積分投影函數(shù)(“IPF”)應(yīng)用于梯度相位映射350以確定梯度相位映射中的像素的平均相位。在另一實(shí)施例中,將方差投影函數(shù)(“VPF”)應(yīng)用于梯度相位映射350以確定梯度相位映射中的像素與像素的平均相位之間的偏差。
[0024]圖4圖解說(shuō)明可根據(jù)本發(fā)明的實(shí)施例利用的實(shí)例性投影函數(shù)方程式及熵方程式。為得出投影結(jié)果,當(dāng)IPF部署為投影函數(shù)時(shí)將方程式903及905應(yīng)用于梯度相位映射350,然而當(dāng)VPF部署為投影函數(shù)時(shí)將方程式907及909應(yīng)用于梯度相位映射350。注意,部署VPF作為投影函數(shù)涉及首先應(yīng)用方程式903及905,因?yàn)槟切┓匠淌降慕Y(jié)果在方程式907及909 中。
[0025]在圖1的過(guò)程塊120中,分析投影結(jié)果以確定特征的狀態(tài)。應(yīng)用投影函數(shù)的投影結(jié)果為可經(jīng)進(jìn)一步分析以確定特征的狀態(tài)的統(tǒng)計(jì)結(jié)果。舉例來(lái)說(shuō),給定投影結(jié)果可指示嘴正在微笑或眼睛為睜開(kāi)的。為進(jìn)一步圖解說(shuō)明,圖5圖解說(shuō)明根據(jù)本發(fā)明的實(shí)施例的實(shí)例性特征圖像的梯度相位映射。更具體來(lái)說(shuō),圖5展示梯度相位映射551A展示睜眼,梯度相位映射551B展示閉眼,梯度相