用于最大穩(wěn)定極值區(qū)域處理的興趣區(qū)域的參數(shù)選擇及粗略定位的制作方法【專利摘要】基于現(xiàn)實(shí)世界的圖像中的像素強(qiáng)度來計(jì)算屬性,且所述屬性用以識(shí)別用于處理所述圖像的至少一個(gè)輸入以識(shí)別至少第一最大穩(wěn)定極值區(qū)域MSER。所述至少一個(gè)輸入為(A)用于MSER處理的參數(shù)或(B)待經(jīng)受MSER處理的所述圖像的一部分中的一者。所述屬性可為像素強(qiáng)度的方差,或根據(jù)像素強(qiáng)度的直方圖來計(jì)算。所述屬性可與查找表一起使用以識(shí)別用于MSER處理的參數(shù)。所述屬性可為所述圖像的經(jīng)子取樣版本的第二MSER的筆劃寬度。所述屬性可用于檢查所述圖像的一部分是否滿足預(yù)定測(cè)試,且如果是,那么在經(jīng)受MSER處理的區(qū)域中包含所述部分。【專利說明】用于最大穩(wěn)定極值區(qū)域處理的興趣區(qū)域的參數(shù)選擇及粗略定位[0001]優(yōu)先權(quán)串請(qǐng)的交叉引用[0002]本申請(qǐng)案主張來自2012年7月19日申請(qǐng)的且題為“用于最大穩(wěn)定極值區(qū)域處理的興趣區(qū)域的參數(shù)選擇及粗略定位(ParameterSelect1nandCoarseLocalizat1nofInterestReg1nsforMSERProcessing)”的第61/673,700號(hào)美國臨時(shí)申請(qǐng)案的優(yōu)先權(quán),所述臨時(shí)申請(qǐng)案已轉(zhuǎn)讓給本案受讓人,且以全文引用的方式并入本文中。[0003]本申請(qǐng)案主張來自2012年7月23日申請(qǐng)的且題為“通過跳躍比較區(qū)域中的像素來識(shí)別圖像中的最大穩(wěn)定極值區(qū)域(MSER)(IdentifyingAMaximallyStableExtremalReg1n(MSER)InAnImageBySkippingComparisonOfPixelsInTheReg1n),,的第61/674,846號(hào)美國臨時(shí)申請(qǐng)案的優(yōu)先權(quán),所述臨時(shí)申請(qǐng)案已轉(zhuǎn)讓給本案受讓人,且以全文引用的方式并入本文中。[0004]本申請(qǐng)案主張來自2013年3月12日申請(qǐng)的且題為“用于最大穩(wěn)定極值區(qū)域處理的興趣區(qū)域的參數(shù)選擇及粗略定位(ParameterSelect1nandCoarseLocalizat1nofInterestReg1nsforMSERProcessing)”的第13/796,729號(hào)美國申請(qǐng)案的優(yōu)先權(quán),所述申請(qǐng)案已轉(zhuǎn)讓給本案受讓人,且以全文引用的方式并入本文中。[0005]以引用的方式并入的美國申請(qǐng)案的交叉引用[0006]本申請(qǐng)案涉及2013年3月12日申請(qǐng)的題為“通過跳躍比較區(qū)域中的像素來識(shí)別圖像中的最大穩(wěn)定極值區(qū)域(MSER)(IdentifyingAMaximallyStableExtremalReg1n(MSER)InAnImageBySkippingComparisonOfPixelsInTheReg1n),,的第13/797,433號(hào)美國申請(qǐng)案,所述申請(qǐng)案已轉(zhuǎn)讓給本案受讓人,且以全文引用的方式并入本文中?!?br>技術(shù)領(lǐng)域:
】[0007]本專利申請(qǐng)案涉及處理來自手持式裝置的相機(jī)的圖像以識(shí)別其中的符號(hào)的設(shè)備及方法。【
背景技術(shù):
】[0008]例如蜂窩電話108(圖1A)的手持式裝置包含用于由人110用其手來使用以捕捉現(xiàn)實(shí)世界場(chǎng)景100的圖像(例如圖像107)的數(shù)碼相機(jī),所述圖像經(jīng)展示顯示在圖1中的蜂窩電話108的屏幕106上。圖像107還稱為手持式相機(jī)所捕捉圖像,或自然圖像或現(xiàn)實(shí)世界圖像,從而使其與由光學(xué)掃描器根據(jù)印刷在紙上的文檔而形成的圖像(例如,由光復(fù)印機(jī)的平面掃描器所掃描)進(jìn)行區(qū)分。[0009]手持式相機(jī)所捕捉圖像107(圖1A)中的文字的辨識(shí)可基于具有在一或多個(gè)性質(zhì)(例如強(qiáng)度及/或色彩)方面與周圍像素顯著不同的邊界的區(qū)域(也稱為“二進(jìn)制大對(duì)象”)。一些現(xiàn)有技術(shù)方法首先識(shí)別圖像中局部最小值或最大值(也稱為“極值”)的特性(例如強(qiáng)度)的像素(根據(jù)圖1B中的動(dòng)作112),接著識(shí)別在所述特性的值的預(yù)定范圍內(nèi)的定位在所識(shí)別極值像素周圍的像素,以便識(shí)別現(xiàn)有技術(shù)中已知為最大穩(wěn)定極值區(qū)域或MSER的區(qū)域(根據(jù)圖1B中的動(dòng)作113)。[0010]MSER為特性值單調(diào)變換的幾何連續(xù)的區(qū)域(且一者可通過穿越相鄰者而從一個(gè)像素到達(dá)任一其它像素),且不變以仿射變換(保持直線及所述直線上的多點(diǎn)之間的距離比率的變換)。MSER的邊界可在現(xiàn)有技術(shù)中用作連接分量(參見圖1B中的動(dòng)作114),以識(shí)別候選者用于辨識(shí)為文字。連接分量可經(jīng)受一或多個(gè)幾何測(cè)試,以識(shí)別此類區(qū)域中的矩形部分103(圖1A),所述區(qū)域接著被切片或分段為許多塊,其中每一塊為待辨識(shí)為文字的字符的候選者??墒褂霉鈱W(xué)字符辨識(shí)(OCR)方法來辨識(shí)此類候選塊。[0011]一個(gè)此類方法描述于(例如)陳(Chen)等人的題為“具有邊緣增強(qiáng)最大穩(wěn)定極值區(qū)域的自然圖像中的穩(wěn)固文字檢測(cè)(RobustTextDetect1nInNaturalImagesWithEdge-EnhancedMaximallyStableExtremalReg1ns)論文中,所述論文被認(rèn)為公開于2011年9月的IEEE圖像處理國際會(huì)議(ICIP)中,所述論文以全文引用的方式并入本文中作為先前技術(shù)。MSER被認(rèn)為由馬特斯(Matas)等人首次描述于(例如)題為“來自最大穩(wěn)定極值區(qū)域的穩(wěn)固寬基線立體聲(RobustWideBaselineStereofromMaximallyStableExtremalReg1ns)”的論文中(機(jī)器視覺會(huì)議會(huì)刊,2002年,第384-393頁),所述論文以全文引用的方式并入本文中。已知馬特斯等人描述的方法由于用來識(shí)別圖像中的MSER的時(shí)間而為計(jì)算昂貴的。用以識(shí)別圖像中的MSER的時(shí)間可通過使用尼斯特爾(Nister)等人描述的方法而得以減少,所述方法名為“線性時(shí)間最大穩(wěn)定機(jī)制區(qū)域(LinearTimeMaximallyStableExtremalReg1ns)”(ECCV、2008年、第II部分、LNCS5303、第183-196頁),由施普林格出版社柏林海德堡出版,且同樣以全文引用的方式并入本文中。[0012]本發(fā)明人注意到,由陳等人或由馬特斯等人或由尼斯特爾等人描述的類型的現(xiàn)有技術(shù)方法識(shí)別圖像107(圖1A)中的數(shù)百個(gè)MSER及有時(shí)識(shí)別數(shù)千個(gè)MSER,所述MSER包含自然特征的細(xì)節(jié),例如樹的葉子或植物的葉子、灌木及矮樹叢。舉例來說,可通過使用上文關(guān)于自然圖像107描述的類型的方法而從一個(gè)版本的圖像(也稱為MSER+圖像)產(chǎn)生大量MSERo而且,可在反轉(zhuǎn)圖像107中的像素的強(qiáng)度值以獲得大量額外MSER之后通過使用剛剛描述的方法而類似地產(chǎn)生另一圖像(也稱為MSER-圖像)。[0013]現(xiàn)有技術(shù)的OCR方法來源于文檔處理的領(lǐng)域,其中所述文檔圖像含有彼此平行定向的一連串文字行(例如,一頁上20行文字)。此類OCR方法從每一塊中的二進(jìn)制值提取向量(稱作“特征向量”),且接著將此向量與提前產(chǎn)生的參考向量的庫比較(基于待辨識(shí)字母表的字母的訓(xùn)練圖像)。接著,由庫中的最緊密匹配所述塊的向量的參考向量來表示字母表的字母經(jīng)識(shí)別為經(jīng)辨識(shí)以斷定0CR(“文檔”0CR)。[0014]本發(fā)明人認(rèn)為用以檢測(cè)用于OCR中的連接分量的上述類型的MSER處理需要現(xiàn)今的手持式裝置(例如智能手機(jī))中正常不可用的存儲(chǔ)器及處理功率。因此,似乎存在加速下文描述的類型的MSER處理的方法及設(shè)備的需要?!?br/>發(fā)明內(nèi)容】[0015]在若干實(shí)施例中,現(xiàn)實(shí)世界中的場(chǎng)景的圖像中的像素的強(qiáng)度用以依據(jù)每一強(qiáng)度等級(jí)的像素的數(shù)目來計(jì)算強(qiáng)度的直方圖的屬性。因此,直方圖屬性可用于從所述圖像自動(dòng)選擇一或多個(gè)區(qū)域(在稱為粗略定位的過程中),在所述區(qū)域上將執(zhí)行處理以識(shí)別待經(jīng)受OCR的最大穩(wěn)定極值區(qū)域(MSER)。此類屬性的實(shí)例為直方圖中的雙峰性(更確切地說,存在彼此不同的兩個(gè)峰值),其檢測(cè)產(chǎn)生用于MSER處理的區(qū)域的選擇。[0016]另一此類直方圖屬性可用于自動(dòng)選擇用于MSER處理的一或多個(gè)參數(shù),例如參數(shù)Δ及最大變化。此類直方圖屬性的第一實(shí)例(“支持”)為直方圖的像素的對(duì)應(yīng)計(jì)數(shù)超過閾值的組格的數(shù)目。在一些實(shí)施例中,剛剛描述的支持屬性(1)與MSER參數(shù)△成反比變化,及(2)與MSER參數(shù)最大變化成正比變化。第二實(shí)例屬性為像素強(qiáng)度的直方圖中的方差,其同樣⑴與MSER參數(shù)Λ成反比變化及⑵與MSER參數(shù)最大變化成正比變化。第三實(shí)例屬性為像素強(qiáng)度的直方圖中的平均值以上的面積,其與:(1)MSER參數(shù)△成正比變化及(2)與MSER參數(shù)最大變化成反比變化。[0017]一些實(shí)施例使用如上所述的直方圖屬性兩者,具體來說通過使用一或多個(gè)屬性以選擇用于MSER處理的區(qū)域,并且還使用一或多個(gè)屬性以選擇MSER參數(shù)△及最大變化。然而,其它實(shí)施例僅單個(gè)使用此類直方圖屬性,如接著所描述。某些實(shí)施例使用上述類型的屬性以選擇用于MSER處理的區(qū)域,及使用任何方法來選擇參數(shù)△及最大變化。在其他實(shí)施例中,通過任何方法來選擇用于MSER處理的區(qū)域,接著使用上述類型的屬性以選擇MSER參數(shù)Δ及最大變化。[0018]因此,應(yīng)理解所描述實(shí)施例的若干其它方面將根據(jù)本文描述而變得為所屬領(lǐng)域的技術(shù)人員顯而易見,其中以說明方式展示及描述各種方面。圖式和實(shí)施方式被視為本質(zhì)上是說明性的而非限制性的?!緦@綀D】【附圖說明】[0019]圖1A說明用戶使用現(xiàn)有技術(shù)的裝備有相機(jī)的移動(dòng)裝置來捕捉現(xiàn)實(shí)世界中的告示牌的圖像。[0020]圖1B用高級(jí)流程圖來說明由現(xiàn)有技術(shù)的計(jì)算機(jī)使用來自動(dòng)作111(如圖1A中所說明)中操作的相機(jī)的圖像來進(jìn)行的動(dòng)作112-114。[0021]圖2A-2D用流程圖說明由特定描述的實(shí)施例中的移動(dòng)裝置401中的一或多個(gè)處理器404執(zhí)行的操作。[0022]圖3A及3B說明在圖2A的動(dòng)作211A的一些實(shí)施例中在剪切閾值下區(qū)域302之前及之后的圖像的一部分的兩個(gè)直方圖。[0023]圖4用另一圖像的一部分的直方圖來說明在圖2B的動(dòng)作211B的一些實(shí)施例中計(jì)算的平均值以上的面積402。[0024]在替代實(shí)施例中,圖5A及5B說明圖像的剪切以識(shí)別根據(jù)圖2C的動(dòng)作212的圖像部分。[0025]圖5C及?說明在一些實(shí)施例使用的筆劃寬度的計(jì)算。[0026]圖6用高級(jí)框圖說明所描述實(shí)施例中的一些中的手持式裝置的各種組件。[0027]圖7用流程圖說明由一些所描述實(shí)施例中的移動(dòng)裝置401中的一或多個(gè)處理器404執(zhí)行的操作。【具體實(shí)施方式】[0028]在所描述實(shí)施例的若干方面中,在由執(zhí)行(例如)來自移動(dòng)裝置401的相機(jī)405的第一指令的一或多個(gè)處理器404(圖6)執(zhí)行的動(dòng)作201(圖2)中接收現(xiàn)實(shí)世界(例如參見圖1)的場(chǎng)景的圖像(也稱為“手持式相機(jī)所捕捉圖像”)。接著,在動(dòng)作211A中,一或多個(gè)處理器404通過使用所接收?qǐng)D像來基于像素強(qiáng)度計(jì)算屬性而執(zhí)行第二指令,例如圖像或其中一部分中的像素強(qiáng)度的直方圖的雙峰性(例如,在圖像再分為許多塊的情況下,根據(jù)動(dòng)作202)。接著,根據(jù)動(dòng)作212A,一或多個(gè)處理器404執(zhí)行第三指令來識(shí)別MSER處理的輸入,例如使用直方圖屬性來確定所述圖像部分(或塊)是否滿足待選擇用于MSER處理的圖像部分(或塊)的測(cè)試。具體來說,在一些實(shí)施例中,當(dāng)直方圖中峰值的數(shù)目為至少兩個(gè)時(shí),所述圖像部分(或塊)經(jīng)標(biāo)記為在一或多個(gè)存儲(chǔ)器214中選定。[0029]接著,在動(dòng)作215中,一或多個(gè)處理器404執(zhí)行第四指令以(例如)使用已在動(dòng)作212A中選擇的至少一個(gè)部分(或塊)來執(zhí)行MSER處理。通過第四指令的執(zhí)行而進(jìn)行的MSER處理可使用存儲(chǔ)器329中的查找表以獲得除了通過第三指令的執(zhí)行而識(shí)別的輸入以外的一或多個(gè)輸入?yún)?shù)。第四指令中使用的查找表可供應(yīng)用于參數(shù)△及最大變化的值的一或多個(gè)特定組合,參數(shù)Δ及最大變化為MSER方法的輸入(也稱為MSER輸入?yún)?shù))。此類查找表可提前填充,具有用于△及最大變化的特定值,例如通過實(shí)驗(yàn)確定以產(chǎn)生適于辨識(shí)自然圖像(例如圖像501)中的文字的輪廓,例如用于△的值8及用于最大變化的值0.07。取決于所述實(shí)施例,所述查找表可使用例如基于像素強(qiáng)度計(jì)算的(本文所述的類型的)任何屬性作為索引來查找。[0030]在一些實(shí)施例中,通過執(zhí)行第四指令而執(zhí)行的動(dòng)作215中的MSER處理包含比較圖像501中的一對(duì)像素的強(qiáng)度差與預(yù)定限值,接著執(zhí)行第五指令以響應(yīng)于發(fā)現(xiàn)所述限值被超過而將所述對(duì)像素中的像素的一對(duì)坐標(biāo)添加到存儲(chǔ)器329(圖6)中的列表中。具體來說,在第五指令的某些實(shí)施例中,在位置集合(其可經(jīng)實(shí)施為列表)中識(shí)別像素,繼而在包含圖像501中的強(qiáng)度的局部極值(例如局部最大值或局部最小值)的區(qū)域%中識(shí)別像素。[0031]此類區(qū)域%可通過在動(dòng)作215(圖2A)中執(zhí)行第五指令而經(jīng)識(shí)別為相對(duì)于范圍1-Δ到i+△(取決于實(shí)施例,包含上述強(qiáng)度i)中的一或多個(gè)強(qiáng)度而最大穩(wěn)定,每一強(qiáng)度i經(jīng)用作閾值(其中Δ為MSER方法的參數(shù)輸入)以用于與包含在區(qū)域%中的多個(gè)像素的強(qiáng)度進(jìn)行比較以識(shí)別相應(yīng)區(qū)域Q“及Q?+Δ。在一些實(shí)施例中,區(qū)域Qi中的許多像素相對(duì)于范圍1-Δ到i+Δ內(nèi)的強(qiáng)度i的改變而保持在預(yù)定(例如用戶指定)范圍內(nèi),其中局部最小值在強(qiáng)度i下發(fā)生的比率[Qg-Qi+J/Qi中。因此,在某些實(shí)施例中,剛剛描述的位置集合指示(或識(shí)別)構(gòu)成MSER(即最大穩(wěn)定極值區(qū)域)的區(qū)域Qi。[0032]可在動(dòng)作215中通過使用馬特斯等人在題為“來自最大穩(wěn)定極值區(qū)域的穩(wěn)固寬基線立體聲(RobustWideBaselineStereofromMaximallyStableExtremalReg1ns)”的論文中描述的類型的方法來進(jìn)行識(shí)別,所述論文在上文以引用的方式并入?;蛘?,可使用其它方法來在動(dòng)作215中執(zhí)行連接分量分析及區(qū)域的識(shí)別,例如在發(fā)布在Kangweon-Kyungki數(shù)學(xué)雜志(14(2006)、第1期、第47-55頁)中的HyunkyungShin及JoongSangShin的題為“弗洛伊德沃肖爾標(biāo)記技術(shù)的應(yīng)用:二進(jìn)值圖像中連接像素分量的識(shí)別(Applicat1nofFloyd-ffarshallLabellingTechnique:1dentificat1nofConnectedPixelComponentsInBinaryImage)”的論文中描述的類型的方法,所述論文以引用的全文方式并入本文中,或者例如描述于Jung-MePark、CarlG.Looney及Hu1-ChuanChen的題為“使用分治技術(shù)的快速連接分量標(biāo)記算法(FastConnectedComponentLabelingAlgorithmUsingADivideandConquerTechnique)”的論文中的方法,所述論文被認(rèn)為發(fā)布在矩陣(Matrix)(2000)、第4卷、第1期、出版商:愛思維爾有限公司(ElsevierLtd),第4-7頁,所述論文也以引用的全文方式并入本文中。[0033]因此,取決于實(shí)施例,在動(dòng)作215中通過所描述實(shí)施例中的移動(dòng)裝置401識(shí)別圖像501的區(qū)域的特定方式可為不同的。如上所述,在若干實(shí)施例中,通過動(dòng)作215將通過使用上述類型的MSER方法識(shí)別的圖像501的每一區(qū)域按像素列表的形式表示在存儲(chǔ)器329中,其中每一像素兩個(gè)坐標(biāo),即(圖像的)二維空間中的X坐標(biāo)及1坐標(biāo)。通過動(dòng)作215將像素列表存儲(chǔ)在一或多個(gè)存儲(chǔ)器中,作為為最大穩(wěn)定極值區(qū)域(MSER)的區(qū)域%的表示。[0034]在一些實(shí)施例中,通過一或多個(gè)MSER處理器352(圖6)執(zhí)行動(dòng)作215??捎么隧?xiàng)技術(shù)中已知的任何方式來實(shí)施MSER處理器352。舉例來說,此類MSER處理器可使用若干閾值中的每一者來識(shí)別對(duì)應(yīng)連接分量,接著計(jì)算每一閾值i下的連接分量的面積A(i),及分析此函數(shù)A(i)的穩(wěn)定性,識(shí)別所述函數(shù)A(i)在閾值i的多個(gè)值上未顯著改變的值所在的閾值(且因此其連接分量)。[0035]在動(dòng)作217中,一或多個(gè)處理器檢查整個(gè)圖像的多個(gè)部分是否已被處理(經(jīng)評(píng)估用于MSER處理),且如果否,那么返回到動(dòng)作212A(上述)。如果整個(gè)圖像已被處理,那么通過一或多個(gè)處理器404執(zhí)行動(dòng)作218以分析MSER來(例如)通過與符號(hào)的庫進(jìn)行比較而識(shí)別圖像中的一或多個(gè)符號(hào)。舉例來說,在若干所描述實(shí)施例中使用此類MSER的二進(jìn)制化版本作為輸入到光學(xué)字符辨識(shí)(OCR)的連接分量。接著,無論在動(dòng)作218中發(fā)現(xiàn)哪一或多個(gè)符號(hào)最接近匹配均在一或多個(gè)存儲(chǔ)器中標(biāo)記為在圖像中識(shí)別,接著返回到動(dòng)作201。具體來說,在一些實(shí)施例中,通過OCR識(shí)別被發(fā)現(xiàn)最接近OCR的輸入的預(yù)定數(shù)目(例如3)個(gè)符號(hào)作為彼此的替代,而OCR的其它實(shí)施例識(shí)別被發(fā)現(xiàn)最接近OCR輸入的單個(gè)符號(hào)。[0036]在一些實(shí)施例中,在動(dòng)作212B(圖2B)中使用在動(dòng)作211B中計(jì)算的直方圖屬性以查找查找表1023(圖6),所述查找表提供用于MSER處理中的一或多個(gè)輸入?yún)?shù)213,例如Λ及最大變化中的任一者或兩者。其后,一或多個(gè)圖像部分在動(dòng)作215中使用輸入?yún)?shù)213而經(jīng)受MSER處理。取決于實(shí)施例,上述動(dòng)作211Β及212Β(圖2Β)可在MSER輸入產(chǎn)生器351(圖6)中執(zhí)行,所述MSER輸入產(chǎn)生器可用任何硬件與軟件的組合(包含多個(gè)指令)來實(shí)施。[0037]圖3Β中展示在動(dòng)作211Β(上述)中計(jì)算的直方圖屬性的一個(gè)說明,如像素強(qiáng)度的直方圖301中的閾值302(圖3Α)處的支持309(其可為數(shù)目Ν,例如Ν=256)。直方圖301沿著y軸展示每一可能亮度等級(jí)下的圖像像素的數(shù)目的一連串計(jì)數(shù),所述計(jì)數(shù)通過亮度等級(jí)來分類,例如沿著X軸從0到255。直方圖301中的峰值303指示在特定亮度等級(jí)下(在其處出現(xiàn)峰值303)存在大量像素。因此,在某些實(shí)施例中,所述屬性是基于直方圖中具有在閾值以上的像素的對(duì)應(yīng)計(jì)數(shù)的多個(gè)組格。在一些實(shí)施例中,在硬件(例如在執(zhí)行前端處理的集成電路(1C)芯片中)中計(jì)算直方圖301,以產(chǎn)生若干統(tǒng)計(jì),例如像素強(qiáng)度的平均值及直方圖的面積。在某些實(shí)施例中,所述屬性為在直方圖的組格中的像素計(jì)數(shù)的平均值以上的直方圖的面積。[0038]以預(yù)定方式來識(shí)別閾值302,例如設(shè)定成固定百分比(或分?jǐn)?shù)),例如直方圖301的N個(gè)組格中的最大計(jì)數(shù)或峰值303的10%。舉例來說,如果最大計(jì)數(shù)或峰值303為80,那么閾值302具有值8且因此將支持309確定為直方圖301的組格(來自N個(gè)組格中)的數(shù)目S,所述組格具有超過(閾值302的)值8的像素的對(duì)應(yīng)計(jì)數(shù)。處理器404的一些實(shí)施例通過使用閾值302而執(zhí)行第七指令來裁剪直方圖以便確定支持309。[0039]如前述段落中描述的呈組格的數(shù)目S形式的支持309為可在動(dòng)作212B(上述)中與查找表1023(圖6)—起通過執(zhí)行第六指令而使用以獲得用于△及最大變化的值的屬性,所述值構(gòu)成輸入到MSER處理的呈輸入?yún)?shù)213形式的輸入(A)(也稱為MSER輸入?yún)?shù))。因此,一些實(shí)施例使用兩個(gè)MSER輸入?yún)?shù),及查找表1023(圖6)在查找支持作為輸入時(shí)供應(yīng)兩個(gè)值(在此類實(shí)施例中其可為唯一輸入,但其它實(shí)施例可使用額外屬性作為查找表1023的額外輸入)。MSER處理的其它實(shí)施例可在執(zhí)行第六指令時(shí)使用僅一個(gè)MSER輸入?yún)?shù),例如在查找表1023針對(duì)此單個(gè)MSER輸入?yún)?shù)僅得到一個(gè)值的情況下僅使用Δ。[0040]上述一些實(shí)施例執(zhí)行圖2A的方法,而其它實(shí)施例執(zhí)行圖2B的方法,而再其它實(shí)施例執(zhí)行圖2C的方法。請(qǐng)注意取決于實(shí)施例,這些方法中的一或多者可彼此組合。因此,在圖2D中說明這些方法,其中動(dòng)作212說明動(dòng)作212A、212B及212C中的任一者的性能。因此,動(dòng)作212執(zhí)行一些實(shí)施例的第六指令以使用直方圖屬性來識(shí)別待用于處理圖像的至少一個(gè)輸入,識(shí)別至少一個(gè)MSER,其中所述至少一個(gè)輸入為(A)用于所述處理中的參數(shù)或(B)待經(jīng)受所述處理的圖像的一部分中的一者、或(A)與(B)兩者。然而,某些實(shí)施例執(zhí)行圖2A及2B的方法的組合,具體地說通過執(zhí)行動(dòng)作212A及動(dòng)作212B中的每一者,如圖7中所說明(下文描述)。[0041]圖3B中的支持309為三個(gè)分量309A、309B及309C的總和,所述分量繼而形成直方圖311的三個(gè)面積311A、311B及311C的支持(繼而通過對(duì)直方圖301進(jìn)行閾值處理而獲得)。在一些實(shí)施例中,面積311C的高度310C(圖3B)除以面積311C的支持(或?qū)挾?309C以獲得一比率(其為逆縱橫比),所述比率與預(yù)定閾值一起用以辨識(shí)峰值的存在。舉例來說,當(dāng)剛剛描述的直方圖的面積的高度寬度比率大于預(yù)定倍數(shù)(例如2)時(shí)一或多個(gè)處理器404確定峰值存在于直方圖中。[0042]可在一些實(shí)施例的預(yù)定測(cè)試中使用支持309,以確定是否應(yīng)選擇對(duì)應(yīng)圖像部分(從其提取直方圖301)用于MSER處理,根據(jù)在圖2A中的動(dòng)作212A。舉例來說,此類實(shí)施例可檢查動(dòng)作211B(圖2B)所確定的支持309是否大于固定閾值,例如S>30,且如果成立,那么將(在一或多個(gè)存儲(chǔ)器214中)所述圖像部分標(biāo)記為經(jīng)選擇用于MSER處理。剛剛描述的圖像部分接著在動(dòng)作215(上述)中經(jīng)受MSER處理,例如在通過處理器404執(zhí)行第八指令時(shí)單獨(dú)本身或與可包含在矩形區(qū)域中的一或多個(gè)其它此類部分組合地進(jìn)行。[0043]在圖4的直方圖301中展示在動(dòng)作211中計(jì)算且用于動(dòng)作212B(圖2B)中的此類屬性的另一說明,如平均值以上的面積。具體來說,首先計(jì)算在直方圖301的N個(gè)組格中的每一者中的計(jì)數(shù)的數(shù)目的平均值402(圖4),且接著確定平均值402以上的面積403。圖4中用陰影展示面積403。取決于實(shí)施例,剛剛描述的平均值以上的面積可經(jīng)歸一化,(例如)通過使其除以直方圖301的總面積以獲得用于動(dòng)作212B中的屬性,從而執(zhí)行查找表1023的查找以獲得用于△及最大變化的值。[0044]在動(dòng)作211B(圖2B)的一些實(shí)施例中計(jì)算的另一此類屬性為像素強(qiáng)度的方差。具體來說,首先計(jì)算所有像素的強(qiáng)度的平均值,且接著將所述平均值從每一像素的強(qiáng)度減去,及將所述差進(jìn)行平方且與其它像素的對(duì)應(yīng)結(jié)果求和,及在動(dòng)作212B中將總和的平方根用作屬性。[0045]上文參看圖2A描述的類型的若干實(shí)施例在動(dòng)作212A中執(zhí)行粗略定位以選擇待經(jīng)受如圖5A中的實(shí)例展示的MSER處理的一或多個(gè)圖像部分。具體來說,使用網(wǎng)格502對(duì)圖像501進(jìn)行分段,且針對(duì)通過使用網(wǎng)格而產(chǎn)生的每一片段來計(jì)算直方圖(如上文所描述)。接著,每一片段的強(qiáng)度直方圖用以確定上述屬性中的一或多者,所述屬性接著與一或多個(gè)預(yù)定測(cè)試(例如與閾值進(jìn)行比較)一起使用以確定是否選擇所述分段用于MSER處理。在圖5A中所示的實(shí)例中,已識(shí)別右上拐角中的八個(gè)分段(例如在圖5A中一起標(biāo)記為分段503)通過此類測(cè)試。因此,此類實(shí)施例從圖像501裁剪出配合在可保持所有八個(gè)分段的最小矩形內(nèi)的一部分504,且正是此圖像部分接著經(jīng)受MSER處理。MSER處理的結(jié)果經(jīng)最終分析以辨識(shí)符號(hào)(根據(jù)在圖2A中的動(dòng)作218),從而產(chǎn)生字母505(圖5A)。[0046]某些實(shí)施例在動(dòng)作212中執(zhí)行粗略定位以產(chǎn)生呈待經(jīng)受如圖5B中所示的MSER處理的一或多個(gè)圖像部分的形式的輸入(B)。具體來說,在動(dòng)作211C(圖2C)中使圖像501經(jīng)子取樣(或降低取樣)以獲得尺寸比圖像501小的經(jīng)子取樣圖像512。在一些實(shí)施例中,以鑒于本描述將容易顯而易見的任何方式,處理器404用軟件配置以對(duì)圖像子取樣以獲得經(jīng)子取樣版本。舉例來說,如果子取樣因數(shù)為2,那么經(jīng)子取樣圖像512為圖像501的大小的1/4。接著,經(jīng)子取樣圖像512在動(dòng)作212C(圖2C)中本身經(jīng)受MSER處理以識(shí)別其中的MSER區(qū)域(也稱為“經(jīng)子取樣MSER區(qū)域”)。接著,在動(dòng)作212C中,每一經(jīng)子取樣MSER區(qū)域經(jīng)受一或多個(gè)預(yù)定測(cè)試。舉例來說,可計(jì)算每一經(jīng)子取樣MSER區(qū)域的筆劃寬度(如圖5C中所示),且使其與閾值(最小筆劃寬度,在所述最小筆劃寬度以上將所述區(qū)域處理為OCR的候選者)進(jìn)行比較。以此方式,在動(dòng)作212C(圖2C)中識(shí)別通過所述測(cè)試的一或多個(gè)經(jīng)子取樣MSER區(qū)域513(例如待以普通方式選擇用于MSER處理)。此后接著從圖像501裁剪最小矩形(也稱為“限界框”)所界定的矩形部分514(其配合通過測(cè)試的經(jīng)子取樣MSER區(qū)域513),且接著將圖像501的此矩形部分514在一或多個(gè)存儲(chǔ)器214(圖2C)中標(biāo)記為MSER處理的輸入。[0047]圖5C說明筆劃寬度的確定(例如用于測(cè)試中以選擇用于MSER處理的分段),所述確定通過以下操作:通過選擇經(jīng)子取樣MSER區(qū)域520內(nèi)的固定數(shù)目個(gè)點(diǎn)(例如3個(gè)點(diǎn)),及計(jì)算經(jīng)子取樣MSER區(qū)域520在預(yù)定數(shù)目個(gè)方向(例如4個(gè)方向)中的每一者中的尺寸,接著選擇所計(jì)算的最小尺寸(例如在4個(gè)方向中)作為筆劃寬度。在一些實(shí)施例中由圖的方法來說明筆劃寬度的特定方式。具體來說,在一些說明性實(shí)施例中,處理器404執(zhí)行動(dòng)作531-534(圖以如下計(jì)算筆劃寬度。在動(dòng)作531中,移動(dòng)裝置401選擇經(jīng)子取樣MSER區(qū)域520(圖5A)內(nèi)部的N個(gè)點(diǎn),例如點(diǎn)521。接著,在動(dòng)作532中,移動(dòng)裝置401計(jì)算在所述N個(gè)點(diǎn)中的每一者的筆劃的寬度。舉例來說,在點(diǎn)521,處理器404計(jì)算四個(gè)射線521A、521B、521C及521D的長(zhǎng)度,且接著使用射線521B(其由于最短而經(jīng)選擇)的長(zhǎng)度作為在點(diǎn)521的筆劃的寬度。接著,在動(dòng)作533中,移動(dòng)裝置401計(jì)算用于所述經(jīng)子取樣MSER區(qū)域520的N個(gè)此類筆劃寬度的平均值。最終,在動(dòng)作534中,移動(dòng)裝置401計(jì)算N個(gè)筆劃寬度的標(biāo)準(zhǔn)偏差及/或方差(與平均值相比)。接著移動(dòng)裝置401檢查方差是否小于預(yù)定閾值,且如果是,那么選擇所述區(qū)域且在一或多個(gè)存儲(chǔ)器214(圖2C)中標(biāo)記為MSER處理的輸入,如上所述。[0048]執(zhí)行圖2中展示的方法的一些實(shí)施例的移動(dòng)裝置401為移動(dòng)裝置(例如智能電話),其包含上述類型的相機(jī)405(圖6)以產(chǎn)生現(xiàn)實(shí)世界場(chǎng)景的圖像,所述圖像接著經(jīng)處理以識(shí)別其中的任何預(yù)定符號(hào)。移動(dòng)裝置401可進(jìn)一步包含提供關(guān)于移動(dòng)裝置401的移動(dòng)的信息的傳感器406,例如加速計(jì)、陀螺儀、指南針、或其類似者。移動(dòng)裝置401可使用加速計(jì)及指南針及/或其它傳感器來以普通方式來感測(cè)傾斜及/或轉(zhuǎn)向,以輔助處理器404確定在移動(dòng)裝置401中捕捉的圖像中的預(yù)定符號(hào)的定向及位置。代替或除了傳感器406以外,移動(dòng)裝置401可使用來自相機(jī)405的圖像來輔助處理器404確定移動(dòng)裝置401相對(duì)于成像的預(yù)定符號(hào)的定向及位置。而且,移動(dòng)裝置401可另外包含以普通方式使用的圖形引擎1004及圖像處理器1005。移動(dòng)裝置401可任選地包含MSER輸入產(chǎn)生器351及MSER處理器352(例如由執(zhí)行存儲(chǔ)器329中的軟件的一或多個(gè)處理器404實(shí)施),以識(shí)別作為OCR軟件1014(在由處理器404執(zhí)行時(shí))的輸入而接收的塊中的預(yù)定符號(hào)的存在。[0049]除了存儲(chǔ)器329以外,移動(dòng)裝置401可包含一或多個(gè)其它類型的存儲(chǔ)器,例如快閃存儲(chǔ)器(或SD卡)1008及/或硬盤及/或光盤(也稱為“輔助存儲(chǔ)器”),以存儲(chǔ)用于載入到存儲(chǔ)器329(也稱為“主存儲(chǔ)器”)中的及/或用于由處理器404使用的數(shù)據(jù)及/或軟件。移動(dòng)裝置401可進(jìn)一步包含在收發(fā)器1010及/或任何其它通信接口1009中的無線發(fā)射器及接收器。應(yīng)理解移動(dòng)裝置401可為任何便攜式電子裝置,例如蜂窩式或其它無線通信裝置、個(gè)人通信系統(tǒng)(PCS)裝置、個(gè)人導(dǎo)航裝置(PND)、個(gè)人信息管理器(PM)、個(gè)人數(shù)字助理(PDA)、膝上型計(jì)算機(jī)、相機(jī)、智能電話、平板計(jì)算機(jī)(例如購自蘋果公司的iPad)或能夠產(chǎn)生擴(kuò)增實(shí)境(AR)環(huán)境的其它合適的移動(dòng)平臺(tái)。[0050]上述類型的移動(dòng)裝置401可包含其它位置確定方法,例如使用“計(jì)算機(jī)視覺”技術(shù)的對(duì)象辨識(shí)。移動(dòng)裝置401還可包含用于響應(yīng)于移動(dòng)裝置401上的用戶輸入(例如通過使用收發(fā)器1010中的發(fā)射器)而遠(yuǎn)程控制現(xiàn)實(shí)世界物品(其可為玩具)的裝置,所述發(fā)射器可為經(jīng)啟用以經(jīng)由一或多個(gè)類型的無線通信網(wǎng)絡(luò)(例如因特網(wǎng)、WiF1、蜂窩式無線網(wǎng)絡(luò)或其它網(wǎng)路)來發(fā)射一或多個(gè)信號(hào)的IR或RF發(fā)射器或無線發(fā)射器。移動(dòng)裝置401可進(jìn)一步在用戶接口中包含麥克風(fēng)及揚(yáng)聲器(未標(biāo)記)。當(dāng)然,移動(dòng)裝置401可包含與本發(fā)明無關(guān)的其它元件,例如可用以存儲(chǔ)供處理器404使用的固件的只讀存儲(chǔ)器1007。[0051]而且,取決于實(shí)施例,移動(dòng)裝置401可使用移動(dòng)裝置401中的本地檢測(cè)器來執(zhí)行無參考跟蹤及/或基于參考的跟蹤,以檢測(cè)圖像中的預(yù)定符號(hào),在執(zhí)行OCR軟件1014的實(shí)施方案中識(shí)別(例如)圖像中的文字的字符。用于由OCR軟件1014使用的塊的上述識(shí)別可執(zhí)行在軟件(由一或多個(gè)處理器或處理器核心執(zhí)行)中或在硬件中或在固件中,或在其任何組合中。[0052]在移動(dòng)裝置401的一些實(shí)施例中,上述MSER輸入產(chǎn)生器351及MSER處理器352包含在OCR軟件1014中,所述OCR軟件由執(zhí)行移動(dòng)裝置401的存儲(chǔ)器329中的軟件320的處理器404實(shí)施,但在其它實(shí)施例中MSER輸入產(chǎn)生器351及MSER處理器352中的任何一或多者實(shí)施在移動(dòng)裝置401中的硬件電路及/或固件及/或軟件的任何組合中。因此,取決于實(shí)施例,OCR軟件的本文所述類型的各種功能可實(shí)施在軟件(由一或多個(gè)處理器或處理器核心執(zhí)行)中或在專用硬件電路中或在固件中,或在其任何組合中。[0053]雖然一或多個(gè)處理器404的一些實(shí)施例在執(zhí)行任一動(dòng)作212A(圖2A)或動(dòng)作212B(圖2B)之后執(zhí)行MSER處理,但其它實(shí)施例執(zhí)行動(dòng)作212A及212B兩者,如圖7中所說明。具體來說,在上述動(dòng)作201(參見圖2A或2B)之后,在動(dòng)作711(圖7)中用處理器404將輸入圖像劃分成多個(gè)矩形部分(所述矩形部分可或可不彼此重疊),接著在動(dòng)作712中選擇所述矩形部分中的一者。隨后,在動(dòng)作713中,類似于上述動(dòng)作212A,用處理器404計(jì)算選擇矩形部分中的像素強(qiáng)度的直方圖的屬性。接著,使用閾值的查找表1022(圖6)(也稱為“第一表”),由處理器404使用此屬性(也稱為“第一屬性”)以確定(在動(dòng)作714中)是否將對(duì)選定矩形部分執(zhí)行MSER方法,且若干否,那么控制返回到動(dòng)作712。如上所述,處理器404可計(jì)算直方圖的面積的高度寬度比率,及檢查所述比率是否大于例如2,且如果是,那么執(zhí)行MSER方法。[0054]如果動(dòng)作714中的決策為將執(zhí)行MSER方法,那么由處理器404執(zhí)行動(dòng)作715。在動(dòng)作715中,由處理器404計(jì)算選定矩形部分中的像素強(qiáng)度的直方圖的另一屬性。接著,在類似于上述動(dòng)作212B的動(dòng)作中,閾值的另一查找表1023(也稱為“第二表”)與此屬性(也稱為“第二屬性”)一起由處理器404使用以識(shí)別(在動(dòng)作715中)輸入到MSER方法的一或多個(gè)參數(shù)(例如△及最大變化)。其后,在動(dòng)作716中,例如如上文參考動(dòng)作215所描述來執(zhí)行MSER方法。隨后,在動(dòng)作717中,一或多個(gè)處理器404檢查所有矩形部分是否已被處理,且如果否,那么返回到動(dòng)作712以選擇另一矩形部分用于處理。當(dāng)所有矩形部分已被處理時(shí),一或多個(gè)處理器404從動(dòng)作717進(jìn)行到動(dòng)作718以分析MSER區(qū)域,從而識(shí)別圖像中的一或多個(gè)符號(hào),其后將圖像中所識(shí)別的符號(hào)存儲(chǔ)在一或多個(gè)存儲(chǔ)器中。[0055]因此,取決于實(shí)施例,MSER輸入產(chǎn)生器351及MSER處理器352中的任何一或多者可(但未必需要)包含一或多個(gè)微處理器、嵌入式處理器、控制器、專用集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)及其類似物。術(shù)語處理器意圖描述由系統(tǒng)而非特定硬件所實(shí)施的功能。此外,如本文中所使用,術(shù)語“存儲(chǔ)器”指代任何類型的計(jì)算機(jī)存儲(chǔ)媒體,其包含與移動(dòng)平臺(tái)相關(guān)聯(lián)的長(zhǎng)期、短期或其他存儲(chǔ)器,且并不限于任何特定類型的存儲(chǔ)器或特定數(shù)目個(gè)存儲(chǔ)器,或特定類型的其上存儲(chǔ)有存儲(chǔ)器的媒體。[0056]因此,可取決于應(yīng)用通過各種裝置來實(shí)施本文中所描述的方法。舉例來說,這些方法可實(shí)施在固件1013(圖6)或軟件320、或硬件1012或其任何組合中。對(duì)于硬件實(shí)施方案,處理單元可實(shí)施于一或多個(gè)專用集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)、數(shù)字信號(hào)處理裝置(DSH))、可編程邏輯裝置(PLD)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、處理器、控制器、微控制器、微處理器、電子裝置、經(jīng)設(shè)計(jì)以執(zhí)行本文所描述的功能的其它電子單元,或其組合內(nèi)。對(duì)于固件及/或軟件實(shí)施方案,可用執(zhí)行本文中所描述的功能的模塊(例如,程序、功能等等)來實(shí)施方法。[0057]有形地體現(xiàn)軟件指令(也稱為“計(jì)算機(jī)指令”)的任何非暫時(shí)性機(jī)器可讀媒體可用于實(shí)施本文所述的方法。舉例來說,軟件320(圖6)可包含存儲(chǔ)在存儲(chǔ)器329中且由處理器404執(zhí)行的程序代碼,以實(shí)施(例如)MSER輸入產(chǎn)生器351或MSER處理器352或兩者或每一者的部分。取決于實(shí)施例,存儲(chǔ)器329可實(shí)施在處理器404內(nèi)或外部。如果實(shí)施在固件及/或軟件中,那么MSER輸入產(chǎn)生器351及/或MSER處理器352的邏輯可作為一或多個(gè)指令或代碼存儲(chǔ)在非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體上。實(shí)例包含用數(shù)據(jù)結(jié)構(gòu)(例如查找表1022及/或查找表1023)編碼的一或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體以及用經(jīng)配置以實(shí)施MSER輸入產(chǎn)生器351及/或MSER處理器352的邏輯計(jì)算機(jī)程序編碼的一或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體。[0058]非暫時(shí)性計(jì)算機(jī)可讀媒體包含物理計(jì)算機(jī)存儲(chǔ)媒體。非暫時(shí)存儲(chǔ)媒體可為可由計(jì)算機(jī)存取的任何可用的非暫時(shí)性媒體。借助于實(shí)例而非限制,此類非暫時(shí)性計(jì)算機(jī)可讀媒體可包括RAM、ROM、快閃存儲(chǔ)器、EEPROM、CD-ROM或其它光盤存儲(chǔ)裝置、磁盤存儲(chǔ)裝置或其它磁性存儲(chǔ)裝置,或可用以存儲(chǔ)呈指令或數(shù)據(jù)結(jié)構(gòu)形式的程序代碼且可由計(jì)算機(jī)訪問的任何其它非暫時(shí)性媒體;如本文中所使用的磁盤及光盤包含壓縮光盤(CD)、激光光盤、光學(xué)光盤、數(shù)字多功能光盤(DVD)、軟盤及藍(lán)光光盤,其中磁盤通常以磁性方式再現(xiàn)數(shù)據(jù),而光盤用激光以光學(xué)方式再現(xiàn)數(shù)據(jù)。以上各項(xiàng)的組合也應(yīng)包含在非暫時(shí)計(jì)算機(jī)可讀媒體的范圍內(nèi)。[0059]盡管出于指導(dǎo)性目的而結(jié)合特定實(shí)施例來說明特定實(shí)例,但所描述實(shí)施例不限于此。因此,雖然一些實(shí)施例的圖2A-2C及6中展示的物品401為移動(dòng)裝置,但在其它實(shí)施例中項(xiàng)目401通過使用不同的外觀尺寸來實(shí)施,例如在特定其它實(shí)施例中,物品401為移動(dòng)平臺(tái)(例如平板計(jì)算機(jī),例如購自蘋果公司的iPad),而在其它實(shí)施例中物品401為任何電子裝置或系統(tǒng)。此類電子裝置或系統(tǒng)的說明性實(shí)施例可包含無線地互相通信的多個(gè)物理部分,例如為靜止計(jì)算機(jī)的部分的處理器及存儲(chǔ)器,例如膝上型計(jì)算機(jī)、桌上型計(jì)算機(jī)或經(jīng)由一或多個(gè)無線鏈路通信的服務(wù)器計(jì)算機(jī)1015,其中傳感器及用戶輸入電路密封在足夠小以保持在手中的外殼中。[0060]取決于在手持式相機(jī)所捕捉圖像中辨識(shí)的特定符號(hào),用戶可取決于實(shí)施例而接收不同類型的反饋。在一些實(shí)施例中,額外觸覺反饋(例如通過移動(dòng)裝置401的振動(dòng))通過觸發(fā)觸覺反饋電路1018(圖6)而提供,從而當(dāng)在圖像中辨識(shí)文字時(shí)提供反饋給用戶。代替剛剛描述的觸覺反饋,在其它實(shí)施例中,可經(jīng)由移動(dòng)裝置401中的揚(yáng)聲器來提供音頻反饋。[0061]因此,在一些實(shí)施例中,一或多個(gè)處理器404用設(shè)備中的軟件320編程以操作為:用于接收現(xiàn)實(shí)世界的場(chǎng)景的圖像的裝置、用于計(jì)算圖像中的基于像素強(qiáng)度的屬性的裝置、用于使用所述屬性來識(shí)別待用于處理所述圖像的至少一個(gè)輸入以識(shí)別其中的至少一個(gè)最大穩(wěn)定極值區(qū)域的裝置、用于執(zhí)行所述處理以基于所述至少一個(gè)輸入來識(shí)別所述至少一個(gè)最大穩(wěn)定極值區(qū)域的裝置,以及用于存儲(chǔ)在一或多個(gè)存儲(chǔ)器中的裝置,所述至少一個(gè)最大穩(wěn)定極值區(qū)域由所述處理來識(shí)別。在剛剛描述的實(shí)施例中的一些中,一或多個(gè)處理器404用軟件320編程以操作為用于對(duì)圖像子取樣以獲得經(jīng)子取樣版本的裝置、用于識(shí)別經(jīng)子取樣版本中的額外最大穩(wěn)定極值區(qū)域(也稱為“第二最大穩(wěn)定極值區(qū)域”)的裝置,以及用于使用額外最大穩(wěn)定極值區(qū)域的筆劃寬度來識(shí)別待經(jīng)受所述處理的所述部分的裝置。[0062]在不脫離所描述實(shí)施例的范圍的情況下可作出各種調(diào)適及修改。因此,不應(yīng)將所附權(quán)利要求書的精神及范圍限于前述描述。應(yīng)理解所描述實(shí)施例的若干其它方面將根據(jù)本文描述而變得為所屬領(lǐng)域的技術(shù)人員顯而易見,其中以說明方式展示及描述各種方面。圖式以及實(shí)施方式將被認(rèn)為在本質(zhì)上是說明性的。所描述實(shí)施例的大量修改及調(diào)適將由隨附權(quán)利要求書包含?!緳?quán)利要求】1.一種用以識(shí)別圖像中的區(qū)域的方法,所述方法包括:接收現(xiàn)實(shí)世界的場(chǎng)景的圖像;一或多個(gè)處理器基于所述圖像中的像素強(qiáng)度來計(jì)算屬性;所述一或多個(gè)處理器使用所述屬性來識(shí)別待用于處理所述圖像的至少一個(gè)輸入以識(shí)別其中的至少一個(gè)最大穩(wěn)定極值區(qū)域,其中所述至少一個(gè)輸入為(A)用于所述處理中的參數(shù)或(B)待經(jīng)受所述處理的所述圖像的一部分中的一者、或(A)與(B)兩者;所述一或多個(gè)處理器執(zhí)行所述處理來基于所述至少一個(gè)輸入識(shí)別所述至少一個(gè)最大穩(wěn)定極值區(qū)域;其中所述處理至少包括比較所述圖像中的一對(duì)像素的強(qiáng)度差與預(yù)定限值,響應(yīng)于發(fā)現(xiàn)超過所述預(yù)定限值而將所述對(duì)像素中的像素的一對(duì)坐標(biāo)添加到列表,及重復(fù)所述比較及所述添加;及所述一或多個(gè)處理器在一或多個(gè)存儲(chǔ)器中存儲(chǔ)所述列表作為所述處理識(shí)別的所述至少一個(gè)最大穩(wěn)定極值區(qū)域的表示。2.根據(jù)權(quán)利要求1所述的方法,其中:依據(jù)所述像素強(qiáng)度中的每一強(qiáng)度的像素?cái)?shù)目而根據(jù)所述像素強(qiáng)度的直方圖來計(jì)算所述屬性。3.根據(jù)權(quán)利要求2所述的方法,其中:所述屬性是基于所述直方圖中的具有閾值以上的像素的對(duì)應(yīng)計(jì)數(shù)的多個(gè)組格。4.根據(jù)權(quán)利要求3所述的方法,其中:所述閾值為所述直方圖中的所述多個(gè)組格中的最大計(jì)數(shù)的分?jǐn)?shù)。5.根據(jù)權(quán)利要求3所述的方法,其中:所述屬性為在所述直方圖的所述多個(gè)組格中的像素計(jì)數(shù)的平均值以上的所述直方圖的面積。6.根據(jù)權(quán)利要求1所述的方法,其中:所述屬性為所述像素強(qiáng)度的方差。7.根據(jù)權(quán)利要求1所述的方法,其中:所述屬性與查找表一起用來識(shí)別所述參數(shù)。8.根據(jù)權(quán)利要求1所述的方法,其中:所述屬性用于檢查所述部分是否滿足預(yù)定測(cè)試。9.根據(jù)權(quán)利要求8所述的方法,其中當(dāng)發(fā)現(xiàn)所述部分滿足所述預(yù)定測(cè)試時(shí):所述一或多個(gè)處理器從所述圖像裁剪包括所述部分的矩形區(qū)域;及所述一或多個(gè)處理器處理所述矩形區(qū)域以識(shí)別所述至少一個(gè)最大穩(wěn)定極值區(qū)域。10.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個(gè)最大穩(wěn)定極值區(qū)域?yàn)橄挛牡牡谝蛔畲蠓€(wěn)定極值區(qū)域,所述方法進(jìn)一步包括:對(duì)所述圖像子取樣以獲得經(jīng)子取樣版本;處理所述經(jīng)子取樣版本以識(shí)別所述經(jīng)子取樣版本中的第二最大穩(wěn)定極值區(qū)域;及使用所述第二最大穩(wěn)定極值區(qū)域的筆劃寬度來識(shí)別待經(jīng)受所述處理的所述部分。11.一種用以執(zhí)行執(zhí)行圖像中的區(qū)域的移動(dòng)裝置,所述移動(dòng)裝置包括:一或多個(gè)存儲(chǔ)器,其包括現(xiàn)實(shí)世界的場(chǎng)景的圖像的多個(gè)部分;一或多個(gè)處理器,其經(jīng)配置以:基于所述圖像中的像素強(qiáng)度計(jì)算屬性;使用所述屬性來識(shí)別待用于處理所述圖像的至少一個(gè)輸入以識(shí)別其中的至少一個(gè)最大穩(wěn)定極值區(qū)域,其中所述至少一個(gè)輸入為(A)用于所述處理中的參數(shù)或(B)待經(jīng)受所述處理的所述圖像的一部分中的一者、或(A)與(B)兩者;執(zhí)行所述處理以基于所述至少一個(gè)輸入識(shí)別所述至少一個(gè)最大穩(wěn)定極值區(qū)域;其中所述處理至少包括比較所述圖像中的一對(duì)像素的強(qiáng)度差與預(yù)定限值,響應(yīng)于發(fā)現(xiàn)超過所述預(yù)定限值而將所述對(duì)像素中的像素的一對(duì)坐標(biāo)添加到列表,及重復(fù)所述比較及所述添加;及在所述一或多個(gè)存儲(chǔ)器存儲(chǔ)所述列表作為由所述處理識(shí)別的所述至少一個(gè)最大穩(wěn)定極值區(qū)域的表示。12.根據(jù)權(quán)利要求11所述的移動(dòng)裝置,其中:依據(jù)所述像素強(qiáng)度中的每一強(qiáng)度的像素?cái)?shù)目而根據(jù)所述像素強(qiáng)度的直方圖來計(jì)算所述屬性。13.根據(jù)權(quán)利要求12所述的移動(dòng)裝置,其中:所述屬性是基于所述直方圖中的具有閾值以上的像素的對(duì)應(yīng)計(jì)數(shù)的多個(gè)組格。14.根據(jù)權(quán)利要求13所述的移動(dòng)裝置,其中:所述閾值為所述直方圖中的所述多個(gè)組格中的最大計(jì)數(shù)的分?jǐn)?shù)。15.根據(jù)權(quán)利要求13所述的移動(dòng)裝置,其中:所述屬性為在所述直方圖的所述多個(gè)組格中的像素計(jì)數(shù)的平均值以上的所述直方圖的面積。16.根據(jù)權(quán)利要求11所述的移動(dòng)裝置,其中:所述屬性為所述像素強(qiáng)度的方差。17.根據(jù)權(quán)利要求11所述的移動(dòng)裝置,其中:所述一或多個(gè)處理器經(jīng)進(jìn)一步配置以使用所述屬性與查找表以識(shí)別所述參數(shù)。18.根據(jù)權(quán)利要求11所述的移動(dòng)裝置,其中:所述一或多個(gè)處理器經(jīng)進(jìn)一步配置以使用所述屬性來檢查所述部分是否滿足預(yù)定測(cè)試。19.根據(jù)權(quán)利要求18所述的移動(dòng)裝置,其中所述一或多個(gè)處理器經(jīng)進(jìn)一步配置以響應(yīng)于發(fā)現(xiàn)所述部分滿足所述預(yù)定測(cè)試而進(jìn)行以下操作:從所述圖像裁剪包括所述部分的矩形區(qū)域;及處理所述矩形區(qū)域以識(shí)別所述至少一個(gè)最大穩(wěn)定極值區(qū)域。20.根據(jù)權(quán)利要求18所述的移動(dòng)裝置,其中所述至少一個(gè)最大穩(wěn)定極值區(qū)域?yàn)橄挛牡牡谝蛔畲蠓€(wěn)定極值區(qū)域,及所述一或多個(gè)處理器經(jīng)進(jìn)一步配置以:對(duì)所述圖像子取樣以獲得經(jīng)子取樣版本;識(shí)別所述經(jīng)子取樣版本中的第二最大穩(wěn)定極值區(qū)域;及使用所述第二最大穩(wěn)定極值區(qū)域的筆劃寬度來識(shí)別待經(jīng)受所述處理的所述部分。21.—或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀媒體,其包括多個(gè)指令以使一或多個(gè)處理器執(zhí)行方法,所述多個(gè)指令包括:第一指令,其用以接收現(xiàn)實(shí)世界的場(chǎng)景的圖像;第二指令,其用以基于所述圖像中的像素強(qiáng)度來計(jì)算屬性;第三指令,其用以使用所述屬性來識(shí)別待用于處理所述圖像的至少一個(gè)輸入以識(shí)別其中的至少一個(gè)最大穩(wěn)定極值區(qū)域,其中所述至少一個(gè)輸入為(A)用于所述處理中的參數(shù)或(B)待經(jīng)受所述處理的所述圖像的一部分中的一者、或(A)與(B)兩者;第四指令,其用以執(zhí)行所述處理來基于所述至少一個(gè)輸入識(shí)別所述至少一個(gè)最大穩(wěn)定極值區(qū)域;其中所述處理至少包括比較所述圖像中的一對(duì)像素的強(qiáng)度差與預(yù)定限值,響應(yīng)于發(fā)現(xiàn)超過所述預(yù)定限值而將所述對(duì)像素中的像素的一對(duì)坐標(biāo)添加到列表,及重復(fù)所述比較及所述添加;及第五指令,其用以在一或多個(gè)存儲(chǔ)器中存儲(chǔ)所述列表作為所述處理識(shí)別的所述至少一個(gè)最大穩(wěn)定極值區(qū)域的表示。22.根據(jù)權(quán)利要求21所述的一或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀媒體,其中:依據(jù)所述像素強(qiáng)度中的每一強(qiáng)度的像素?cái)?shù)目而根據(jù)所述像素強(qiáng)度的直方圖來計(jì)算所述屬性。23.根據(jù)權(quán)利要求22所述的一或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀媒體,其中:所述屬性是基于所述直方圖中的具有閾值以上的像素的對(duì)應(yīng)計(jì)數(shù)的多個(gè)組格。24.根據(jù)權(quán)利要求23所述的一或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀媒體,其中:所述閾值為所述直方圖中的所述多個(gè)組格中的最大計(jì)數(shù)的分?jǐn)?shù)。25.根據(jù)權(quán)利要求23所述的一或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀媒體,其中:所述屬性為在所述直方圖的所述多個(gè)組格中的像素計(jì)數(shù)的平均值以上的所述直方圖的面積。26.根據(jù)權(quán)利要求21所述的一或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀媒體,其中:所述屬性為所述像素強(qiáng)度的方差。27.根據(jù)權(quán)利要求21所述的一或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀媒體,其進(jìn)一步包括:第六指令,其用以使用所述屬性與查找表以識(shí)別所述參數(shù)。28.根據(jù)權(quán)利要求21所述的一或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀媒體,其進(jìn)一步包括:第六指令,其用以使用所述屬性來檢查所述部分是否滿足預(yù)定測(cè)試。29.根據(jù)權(quán)利要求28所述的一或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀媒體,其進(jìn)一步包括:第七指令,其用以從所述圖像裁剪包括所述部分的矩形區(qū)域;及第八指令,其用以處理所述矩形區(qū)域以識(shí)別所述至少一個(gè)最大穩(wěn)定極值區(qū)域。30.根據(jù)權(quán)利要求21所述的一或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀媒體,其中所述至少一個(gè)最大穩(wěn)定極值區(qū)域?yàn)橄挛牡牡谝蛔畲蠓€(wěn)定極值區(qū)域,所述一或多個(gè)非暫時(shí)性計(jì)算機(jī)可讀媒體進(jìn)一步包括:第六指令,其用以對(duì)所述圖像子取樣以獲得經(jīng)子取樣版本;第七指令,其用以處理所述經(jīng)子取樣版本以識(shí)別所述經(jīng)子取樣版本中的第二最大穩(wěn)定極值區(qū)域;及第八指令,其用以使用所述第二最大穩(wěn)定極值區(qū)域的筆劃寬度以識(shí)別待經(jīng)受所述處理的所述部分。31.一種用以識(shí)別圖像中的區(qū)域的設(shè)備,所述設(shè)備包括:用于接收現(xiàn)實(shí)世界的場(chǎng)景的圖像的裝置;用于基于所述圖像中的像素強(qiáng)度計(jì)算屬性的裝置;用于使用所述屬性來識(shí)別待用于處理所述圖像的至少一個(gè)輸入以識(shí)別其中的至少一個(gè)最大穩(wěn)定極值區(qū)域的裝置,其中所述至少一個(gè)輸入為(A)用于所述處理中的參數(shù)或(B)待經(jīng)受所述處理的所述圖像的一部分中的一者、或(A)與(B)兩者;用于執(zhí)行所述處理來基于所述至少一個(gè)輸入來識(shí)別所述至少一個(gè)最大穩(wěn)定極值區(qū)域的裝置;其中所述處理至少包括比較所述圖像中的一對(duì)像素的強(qiáng)度差與預(yù)定限值,響應(yīng)于發(fā)現(xiàn)超過所述預(yù)定限值而將所述對(duì)像素中的像素的一對(duì)坐標(biāo)添加到列表,及重復(fù)所述比較及所述添加;及用于在一或多個(gè)存儲(chǔ)器中存儲(chǔ)所述列表作為由所述處理識(shí)別的所述至少一個(gè)最大穩(wěn)定極值區(qū)域的表示的裝置。32.根據(jù)權(quán)利要求31所述的設(shè)備,其中:依據(jù)所述像素強(qiáng)度中的每一強(qiáng)度的像素?cái)?shù)目而根據(jù)所述像素強(qiáng)度的直方圖來計(jì)算所述屬性。33.根據(jù)權(quán)利要求31所述的設(shè)備,其中:所述屬性與查找表一起用來識(shí)別所述參數(shù)。34.根據(jù)權(quán)利要求31所述的設(shè)備,其進(jìn)一步包括:用于對(duì)所述圖像子取樣以獲得經(jīng)子取樣版本的裝置;用于識(shí)別所述經(jīng)子取樣版本中的額外最大穩(wěn)定極值區(qū)域的裝置;及用于使用所述額外最大穩(wěn)定極值區(qū)域的筆劃寬度以識(shí)別待經(jīng)受所述處理的所述部分的裝置?!疚臋n編號(hào)】G06K9/46GK104428792SQ201380037023【公開日】2015年3月18日申請(qǐng)日期:2013年7月6日優(yōu)先權(quán)日:2012年7月19日【發(fā)明者】帕溫·庫瑪·拜哈提,基肖爾·K·巴曼,達(dá)納恩杰伊·阿肖克·戈?duì)?森蒂爾庫馬爾·孫達(dá)拉姆申請(qǐng)人:高通股份有限公司