專利名稱:確定級聯(lián)分類器的檢測確定性的制作方法
確定級聯(lián)分類器的檢測確定性背景級聯(lián)分 類器可用于實現(xiàn)圖像中的稀有對象檢測。這種級聯(lián)分類器包括已被訓練成檢測給定圖像是否是一種類型的稀有對象(諸如,臉部)的一部分或是否包含該稀有對象的多個檢測級。級聯(lián)分類器包括多個檢測級,其中每個檢測級判定是接受圖像并將其傳播到后續(xù)級、還是拒絕圖像并將其標記為陰性。如果圖像到達最后一個檢測級并被接受,則圖像被標記為陽性。附圖簡述參考以下附圖可更好地理解本發(fā)明的許多方面。附圖中的組件不一定是按比例的,相反重點放在清楚地示出本公開的原理上。此外,在附圖中,相同的附圖標記指示若干視圖中的對應部分。
圖1是提供根據(jù)本公開的一個實施例的級聯(lián)分類器的一個示例圖示的示意性框圖。圖2是提供實現(xiàn)根據(jù)本公開的各個實施例的級聯(lián)分類器應用程序和級聯(lián)分類器訓練應用程序的計算機系統(tǒng)的一個示例圖示的示意性框圖。圖3-5是提供根據(jù)本公開的各個實施例的圖2的級聯(lián)分類器應用程序所執(zhí)行的各種功能的三個示例的流程圖。圖6-5是提供根據(jù)本公開的各個實施例的圖2的級聯(lián)分類器訓練應用程序所執(zhí)行的各種功能的一個示例的流程圖。詳細描述本文中的公開涉及確定級聯(lián)分類器的檢測確定性(certainty)。級聯(lián)分類器可被訓練成用于檢測圖像中各種各樣的稀有對象中的一個或多個。稀有對象是通常在圖像集合或包括較大圖像的圖像塊集合中偶爾遇到的對象。稀有對象的一些示例包括,但不限于,臉部、眼睛和臉部的其他部分、人、汽車、違禁品、腫瘤和其他醫(yī)療圖像對象、以及其他對象。圖像的一些示例包括,但不限于,數(shù)字照片、來自數(shù)字視頻流的幀、掃描圖像、以及其他類型的圖像及其部分。級聯(lián)分類器被訓練成用訓練圖像集合進行稀有對象檢測,該訓練圖像集合是已知與一種類型的稀有對象相關聯(lián)或不相關聯(lián)的樣本圖像集合。級聯(lián)檢測器的每個檢測級基于可配置參數(shù)對給定圖像執(zhí)行分析,以確定圖像是否包含稀有對象、描繪其一部分、表示該稀有對象、或以其他方式與其相關聯(lián)。檢測級可采用例如線性判別(discriminant)分析、支持向量機、和/或在執(zhí)行分類中所使用的任何其他方法。每一級的輸出為級響應,該級響應可以是單個值或值的數(shù)組。判定函數(shù)應用于級響應以獲得級判定,即,是接受圖像作為陽性匹配還是拒絕圖像作為陰性匹配。判定函數(shù)的非限制性示例為閾值。由此,判定函數(shù)和/ 或每一級的響應可基于該級的判定對于訓練圖像集合是否正確來配置。通常在訓練接收機操作人員特性(ROC)曲線(即,真陽性的具體比率對假陽性的具體比率)上的單個點期間優(yōu)化稀有對象檢測所使用的級聯(lián)分類器。該點表示級聯(lián)分類器將錯過的對象(即,假陰性)最小化的能力和錯誤的檢測(即,假陽性)之間的折衷。然而,經(jīng)訓練的級聯(lián)分類器對于預先假定不同折衷點的任務可能不是準確的。作為非限制性示例,實現(xiàn)選擇性地銳化和平滑圖像中的皮膚的應用程序可受益于檢測盡可能多的臉的級聯(lián)分類器。由于眼睛可發(fā)現(xiàn)難以檢測在未包含臉部的區(qū)域中的平滑或銳化,因此這種應用程序?qū)訇栃钥赡苁窍喈敺€(wěn)健的。相反,作為非限制性示例,由于假陽性將導致無法接受的膚色曲線的偏移因此實現(xiàn)膚色修正的應用程序可能需要盡可能少的假陽性,然而錯過臉部(即,假陰性)只是保持圖像不改變。相當多的系統(tǒng)資源可能對于操作級聯(lián)分類器是必需的,因此在不同折衷點多次運行級聯(lián)分類器的可能性可能是無法接受的。本公開的實施例包括經(jīng)修改的級聯(lián)分類器,該經(jīng)修改的級聯(lián)分類器可被運行一次以針對與尋找到的稀有對象相關聯(lián)的高比例的圖像產(chǎn)生概率值??纱嬖卺槍θ我鈹?shù)量的假陽性所產(chǎn)生的概率值,但是實施例可被配置成使得真陽性的概率值明顯高于假陽性的概率值。在這些實施例中,結(jié)果可受制于針對與不同應用程序相關聯(lián)的不同折衷要求所配置的閾值。參考圖1,示出了根據(jù)本公開的一個實施例的級聯(lián)分類器100。級聯(lián)分類器100實現(xiàn)對圖像的稀有對象檢測,并且通過確定圖像與稀有對象相關聯(lián)的概率值來確定檢測確定性。級聯(lián)分類器100包括第一序列101的一個或多個檢測級102和第二序列103的兩個或兩個以上檢測級104。在一些實施例中,第一序列101的一個或多個檢測級102和第二序列 103的兩個或 兩個以上檢測級104可被共同視為組合序列106的檢測級102、104。在各個實施例中,級聯(lián)分類器100表示對包括組合序列106的檢測級102、104的經(jīng)訓練級聯(lián)分類器的重新配置或修改。第一序列101的一個或多個檢測級102包括多個檢測級102。圖1示出第一序列 101的一個或多個檢測級102中的四個檢測級102a-102d。在其他實施例中,第一序列101 的一個或多個檢測級102可包括一些其他數(shù)量的檢測級102,諸如例如,二十個檢測級102。同樣,第二序列103的兩個或兩個以上檢測級104包括多個檢測級104。圖1示出第一序列的一個或多個檢測級103中的三個檢測級104a-104c。在其他實施例中,第一序列的一個或多個檢測級103可包括一些其他數(shù)量的檢測級104,諸如例如,十個檢測級104。 在一些實施例中,第二序列103的兩個或兩個以上檢測級104可被視為級聯(lián)分類器100的后處理級109。第一序列101的一個或多個檢測級102與普通級聯(lián)分類器的檢測級類似地操作。 提供圖像塊112作為檢測級102a的輸入。圖像塊112可表示圖像或較大圖像的一部分。在一個實施例中,圖像塊112是圖像的十九像素乘以十九像素的部分。檢測級102a根據(jù)一種或多種類型的圖像特征確定圖像塊112是否與稀有對象相關聯(lián)。作為非限制性示例,檢測級102a可檢查圖像塊122的強度的差異和/或粉紅色調(diào)的變化來確定圖像塊112是否與臉部相關聯(lián)。如果圖像塊112被確定為與稀有對象不相關聯(lián),則檢測級102a被配置成拒絕圖像塊112。在一些實施例中,檢測級102a可將圖像塊112標記或標注為陰性。否則,如果圖像塊112被確定為與稀有對象相關聯(lián)或可能與其相關聯(lián),則檢測級102a隨后將圖像塊112傳播到下一檢測級102(檢測級102b)。在一些實施例中,可在處理圖像塊112之后記錄每個檢測級102的級響應。在最后一個檢測級102d,如果圖像塊112被確定為與稀有對象相關聯(lián)或可能與其相關聯(lián),則圖像塊112被傳播到第二序列103的兩個或兩個以上檢測級104的第一檢測級104。由于普通檢測級操作被配置成在最后一個檢測級102d停止,因此最后一個檢測級 102d可被稱為截斷檢測級。 第二序列103的兩個或兩個以上檢測級104與普通級聯(lián)分類器的檢測級不同地操作。每個檢測級104可被配置成將每個圖像塊112傳播到下一檢測級104,而不是在其被確定為與稀有對象不相關聯(lián)并被拒絕時結(jié)束對圖像塊112的處理??捎涗浽摯_定(檢測級判定)的結(jié)果,即圖像塊112被檢測級104確定為是陽性還是陰性。因此,如果圖像塊112被確定為與稀有對象不相關聯(lián),則代替完全(outright)拒絕圖像塊112,可記錄對圖像塊112 的拒絕。另外,可記錄每個檢測級104的檢測級響應。在級聯(lián)分類器的正常操作中,在最后的檢測級之后未被拒絕的圖像塊112可被標記或標注為陽性匹配。在最后一個檢測級102d之后停止實際拒絕的情況下,當激活后處理操作時,級聯(lián)分類器100與正常操作的級聯(lián)分類器不同地操作。后處理級109確定圖像塊 112與稀有對象相關聯(lián)的概率值。作為非限制性示例,該概率值可至少部分地基于所記錄的部分或全部檢測級102和/或104的級判定和級響應以及可能的其他參數(shù)。在各個實施例中,后處理級109可在第二序列103的檢測級104所記錄的拒絕的數(shù)量滿足閾值時完全拒絕圖像塊112。在這些情況下,后處理級109可將圖像塊112的概率值設置為零。后處理級109可使用一個或多個經(jīng)驗分布來計算圖像塊112的概率值。經(jīng)驗分布可與來自訓練圖像集合115的多個圖像塊112相關聯(lián),訓練圖像集合115已知與稀有對象相關聯(lián)或與其不相關聯(lián)、并且出于經(jīng)驗分布的目的在最后一個檢測級102d之后未被拒絕。 經(jīng)驗分布可例如對以下建模來自第二序列103的兩個或兩個以上檢測級104的對于未被拒絕的訓練圖像115的檢測級響應之和、和/或第二序列103的兩個或兩個以上檢測級104 所記錄的對于未被拒絕的訓練圖像115的拒絕的數(shù)量。在一個實施例中,經(jīng)驗分布還可基于與被傳播到第二序列103的兩個或兩個以上檢測級104的訓練圖像115相關聯(lián)的第一序列101的一個或多個檢測級102所記錄的級響應。經(jīng)驗分布可采用高斯分布、二項分布、和 /或其他分布。在一個實施例中,檢測級響應之和可通過高斯分布來建模,而所記錄的拒絕的數(shù)量可通過二項分布來建模。在一些實施例中,后處理級109可采用更一般的統(tǒng)計模型,諸如例如線性判別分析、邏輯回歸、支持向量機(SVM)等來確定概率值,而非硬分類。在這些實施例中,例如可從檢測級104中的圖像特征池、或現(xiàn)有級聯(lián)分類器100的全部檢測級102、104中的圖像特征池中提取用于后處理級109的圖像特征。在一個實施例中,第二序列103的兩個或兩個以上檢測級104中的每個檢測級104被配置成從統(tǒng)計模型產(chǎn)生圖像塊112與稀有對象相關聯(lián)的單獨概率值。接下來參考圖2,示出了根據(jù)各個實施例的計算機系統(tǒng)200的一個實施例的示例。 計算機系統(tǒng)200可包括具有處理器203的處理器電路和存儲器206,這兩者都耦合到本地接口 209。本地接口 209可包括例如數(shù)據(jù)總線,以及伴隨的控制/地址總線。包括例如級聯(lián)分類器應用程序212和級聯(lián)分類器訓練應用程序215的各個組件可存儲在存儲器206中,并且可被處理器203執(zhí)行。另外,其他應用程序可存儲在存儲器206中,并且可被處理器203 執(zhí)行,諸如例如,操作系統(tǒng)。
級聯(lián)分類器應用程序212實現(xiàn)級聯(lián)分類器100 (圖1)。級聯(lián)分類器應用程序212 還可實現(xiàn)包括組合序列106的檢測級102、104的未經(jīng)修改的級聯(lián)分類器100 (圖1),該級聯(lián)分類器100包括第一序列101的一個或多個檢測級102 (圖1)和第二序列103的兩個或兩個以上檢測級104(圖1)。在這種未經(jīng)修改的級聯(lián)分類器100中,第二序列103的兩個或兩個以上檢測級104與第一序列101的一個或多個檢測級102類似地工作,該級聯(lián)分類器 100在正常操作中繼續(xù)。級聯(lián)分類器應用程序212可配置成在級聯(lián)分類器100的未經(jīng)修改的操作和經(jīng)修改操作之間的切換。在未經(jīng)修改的操作中,級聯(lián)分類器應用程序212的輸出包括二元確定,即給定圖像塊112 (圖1)與給定稀有對象相關聯(lián)還是與其不相關聯(lián)。相反,在具有為第二序列103 激活的后處理操作的經(jīng)修改的操作中,級聯(lián)分類器應用程序212的輸出可包括給定圖像塊 112與給定稀有對象相關聯(lián)的概率值。概率確定使具有不同折衷要求的應 用程序能夠使用相同的結(jié)果。級聯(lián)分類器訓練應用程序215可用于訓練級聯(lián)分類器應用程序212的級聯(lián)分類器 100來檢測給定稀有對象、或重新訓練級聯(lián)分類器100以供經(jīng)修改的操作。在一些實施例中,級聯(lián)分類器訓練應用程序215可被實現(xiàn)為級聯(lián)分類器應用程序212的一部分。為了最初訓練級聯(lián)分類器100來檢測稀有對象,級聯(lián)分類器訓練應用程序215使用訓練圖像集合 115(圖1)來訓練每個檢測級102、104(圖1)。訓練圖像集合115包括已知與稀有對象相關聯(lián)的圖像集合和已知與稀有對象不相關聯(lián)的圖像集合。作為非限制性示例,如果檢測級 102、104被訓練成檢測臉部,則訓練圖像集合115將包括已知包括臉部的大量圖像和已知不包括臉部的大量圖像。因此,級聯(lián)分類器訓練應用程序215可基于檢測級102、104如何對訓練圖像集合115作出響應來配置控制檢測級102、104的響應的參數(shù)。級聯(lián)分類器訓練應用程序215可實現(xiàn)重新訓練程序,從而通過配置用于后處理操作的后處理級109 (圖1)來修改級聯(lián)分類器100的操作。重新訓練包括將組合序列106的檢測級102、104分成第一序列101的一個或多個檢測級102和第二序列103的兩個或兩個以上檢測級104。為了執(zhí)行該劃分,可確定截斷檢測級(例如,最后一個檢測級102d(圖 1))。確定截斷檢測級是重要的,因為如果其在組合序列106的檢測級102、104中太早設置, 則級聯(lián)分類器100可能是低效率的,并且第二序列103的兩個或兩個以上檢測級104可在太多圖像塊112上運行。如果截斷檢測級在組合序列106的檢測級102、104中太晚設置, 則可能拒絕太多的真陽性,并且可能在經(jīng)修改的級聯(lián)分類器100和普通的、未經(jīng)修改的級聯(lián)分類器100之間幾乎不存在差異。在一個實施例中,截斷檢測級可被設置為其中已知與稀有對象不相關聯(lián)的圖像集合中未被拒絕的圖像的數(shù)量基本上等于已知與稀有對象相關聯(lián)的圖像集合的基數(shù)的檢測級102。這例如可通過確定訓練圖像集合115中的每一個是否被級聯(lián)分類器100的組合序列106的檢測級102、104中的每個檢測級102、104拒絕來實現(xiàn)。在這種情況下,分類問題不再是稀有事件檢測,并且更像常規(guī)的兩類分類。另外,一旦確定截斷檢測級,級聯(lián)分類器訓練應用程序215就可確定訓練圖像集合115針對第二序列103的兩個或兩個以上檢測級104中的檢測級104的經(jīng)驗分布。這些經(jīng)驗分布可對例如以下建模所有的檢測級104的級響應之和、可能已經(jīng)拒絕給定圖像塊 112的檢測級104的數(shù)量、以及其他樣本統(tǒng)計數(shù)據(jù)。
在一些實施例中,級聯(lián)分類器訓練應用程序215的重新訓練過程可只要求經(jīng)訓練的級聯(lián)兩次通過合理尺寸的訓練圖像集合115,這可比對未經(jīng)修改的級聯(lián)分類器100的單個檢測級102、104的訓練要求少很多。作為非限制性示例,對于包括與稀有對象相關聯(lián)的圖像和與稀有對象不相關聯(lián)的圖像的諸訓練圖像集合115的每一個,合理尺寸的訓練圖像集合115可包括4,000至10,000個訓練圖像115。相反,對未經(jīng)修改的級聯(lián)分類器100的單個檢測級102、104的訓練要求可能約為與該檢測級102、104相關聯(lián)的特征的數(shù)量,其范圍可以是例如稍后的檢測級102、104中的100至500個特征。 級聯(lián)分類器應用程序212和級聯(lián)分類器訓練應用程序215被描述為存儲在存儲器 206中并且可由處理器203執(zhí)行。在這個方面,術(shù)語“可執(zhí)行”是指以最終可由處理器203 運行的形式的程序文件??蓤?zhí)行程序的示例可以是例如經(jīng)編譯程序,該經(jīng)編譯程序可被轉(zhuǎn)換成可被加載到存儲器206的隨機存取部分中且由處理器203運行的格式的機器代碼、或可以諸如能夠被加載到存儲器206的隨機存取部分且由處理器203運行的目標代碼之類的適當格式表達的源代碼等。可執(zhí)行程序可存儲在存儲器206的任何部分或組件中,該存儲器206包括例如隨機存取存儲器(RAM)、只讀存儲器(ROM)、硬盤驅(qū)動器、固態(tài)驅(qū)動器、USB閃存驅(qū)動器、存儲卡、諸如壓縮盤(CD)或數(shù)字多功能盤(DVD)之類的光盤、軟盤、磁帶、或其他存儲器組件。此處,存儲器206被定義為易失性和非易失性存儲器、以及數(shù)據(jù)存儲組件。易失性組件是在斷電之后不保存數(shù)據(jù)值的組件。非易失性組件是在斷電之后保存數(shù)據(jù)的組件。由此,存儲器206可包括例如隨機存取存儲器(RAM)、只讀存儲器(ROM)、硬盤驅(qū)動器、固態(tài)驅(qū)動器、USB閃存驅(qū)動器、經(jīng)由存儲卡讀卡器訪問的存儲卡、經(jīng)由相關聯(lián)的軟盤驅(qū)動器訪問的軟盤、經(jīng)由光盤驅(qū)動器訪問的光盤、經(jīng)由適當磁帶驅(qū)動器訪問的磁帶、和/或其他存儲器組件、或這些存儲器組件中的任何兩個或兩個以上的組合。另外,RAM可包括例如靜態(tài)隨機存取存儲器(SRAM)、動態(tài)隨機存取存儲器(DRAM)、或磁性隨機存取存儲器(MRAM)以及其他這樣的設備。ROM可包括例如可編程只讀存儲器(PR0M)、可擦除可編程只讀存儲器(EPROM)、 電可擦除可編程只讀存儲器(EEPROM)、或其他類似的存儲器設備。另外,處理器203可表示多個處理器,并且存儲器206可表示并行操作的多個存儲器。在這種情況下,本地接口 209可以是便于在多個處理器203中的任何兩個之間、在任何處理器203和存儲器206中的任何一個之間、或在存儲器206中的任何兩個之間等通信的適當網(wǎng)絡。由此,計算機系統(tǒng)200可包括多個物理計算機系統(tǒng)。接下來參考圖3,示出了提供根據(jù)本公開的各個實施例的級聯(lián)分類器應用程序 212(圖2)的一部分的操作的一個示例的流程圖。替換地,圖3的流程圖可被視為示出在計算機系統(tǒng)200 (圖2)中實現(xiàn)的執(zhí)行檢測級102 (圖1)的功能的示例方法的步驟。從框303開始,具體檢測級102中的級聯(lián)分類器應用程序212確定圖像塊112 (圖 1)的級響應。這可包括例如檢查圖像塊112的強度、色平衡和其他特性。接下來,在框306 中,級聯(lián)分類器應用程序212確定圖像塊112是否與稀有對象相關聯(lián)。該確定可通過將級響應與當檢測級102被訓練成用于檢測稀有對象時所計算的存儲參數(shù)進行比較來執(zhí)行。如果在框306中級聯(lián)分類器應用程序212確定圖像塊112與稀有對象不相關聯(lián), 則在框309中級聯(lián)分類器應用程序212拒絕與稀有對象不相關聯(lián)的圖像塊112。當已經(jīng)拒絕圖像塊112時,級聯(lián)分類器應用程序212結(jié)束。相反,如果在框306中級聯(lián)分類器應用程序212確定圖像塊112與稀有對象相關聯(lián),則在框312中級聯(lián)分類器應用程序212將圖像塊112傳播到下一檢測級112。替換地,在框312中,如果檢測級102是第一序列101的一個或多個檢測級102中的最后一個,則級聯(lián)分類器應用程序212將圖像塊112傳播到下一檢測級104。級聯(lián)分類器應用程序212隨后結(jié)束對檢測級102的圖像塊112的處理?,F(xiàn)在轉(zhuǎn)向圖4,示出了提供根據(jù)本公開的各個實施例的級聯(lián)分類器應用程序 212 (圖2)的一部分的操作的一個示例的流程圖。替換地,圖4的流程圖可被視為示出在計算機系統(tǒng)200 (圖2)中實現(xiàn)的執(zhí)行在后處理操作中所配置的檢測級104 (圖1)的功能的示例方法的步驟。從框4 03開始,具體檢測級104中的級聯(lián)分類器應用程序212確定圖像塊112 (圖 1)的級響應。這可包括例如檢查圖像塊112的強度、色平衡和其他特性。接下來,在框406 中,級聯(lián)分類器應用程序212確定圖像塊112是否與稀有對象相關聯(lián)。該確定可通過將判定函數(shù)應用于級響應來執(zhí)行,例如通過將級響應與當檢測級104被訓練成用于檢測稀有對象時所計算的存儲參數(shù)進行比較。如果在框406中級聯(lián)分類器應用程序212確定圖像塊112與稀有對象不相關聯(lián), 則在框409中級聯(lián)分類器應用程序212記錄對與稀有對象不相關聯(lián)的圖像塊112的拒絕。 級聯(lián)分類器應用程序212接下來移動到框412。相反,如果在框406中級聯(lián)分類器應用程序 212確定圖像塊112與稀有對象相關聯(lián),則級聯(lián)分類器應用程序212同樣移動到框412。在框412中,級聯(lián)分類器應用程序212將圖像塊112傳播到下一檢測級104,并且可記錄級響應。替換地,如果檢測級104是第二序列103的兩個或兩個以上檢測級104中的最后一個, 則級聯(lián)分類器應用程序212確定圖像塊112與稀有對象相關聯(lián)的概率值。級聯(lián)分類器應用程序212隨后結(jié)束對檢測級104的圖像塊112的處理?,F(xiàn)在轉(zhuǎn)向圖5,示出了提供根據(jù)本公開的各個實施例的級聯(lián)分類器應用程序 212 (圖2)的一部分的操作的一個示例的流程圖。替換地,圖5的流程圖可被視為示出在計算機系統(tǒng)200 (圖2)中實現(xiàn)的執(zhí)行級聯(lián)分類器100 (圖1)的功能的示例方法的步驟。從框503開始,級聯(lián)分類器應用程序212在第一序列101的一個或多個檢測級 102 (圖1)中確定圖像塊112 (圖1)是否與稀有對象相關聯(lián)。該確定可涉及對第一序列101 的一個或多個檢測級102中的一個或多個檢測級102(圖1)重復應用圖3的流程圖中所示出的功能。在框504中,級聯(lián)分類器應用程序212配置第二序列103的兩個或兩個以上檢測級104用于后處理操作,第二序列103的兩個或兩個以上檢測級104可配置成用于正常或后處理操作。接下來,在框506中,響應于在第一序列101的一個或多個檢測級102的最后一個檢測級102中未拒絕圖像塊112,級聯(lián)分類器應用程序212在第二序列103的兩個或兩個以上檢測級104中確定圖像塊112是否與稀有對象相關聯(lián)。該確定可涉及對第二序列103 的兩個或兩個以上檢測級104中的每個檢測級104(圖1)重復應用圖4的流程圖中所示出的功能。在框509中,級聯(lián)分類器應用程序212至少部分地基于與第二序列103的兩個或兩個以上檢測級104相關聯(lián)的級響應和級判定來確定圖像塊112與稀有對象相關聯(lián)的概率值。概率值還可至少部分地基于來自檢測級102、104中的任何一個的特征響應、級響應、和 /或級判定。級聯(lián)分類器應用程序212隨后結(jié)束。參考圖6,示出了提供根據(jù)本公開的各個實施例的級聯(lián)分類器訓練應用程序215(圖2)的一部分的操作的一個示例的流程圖。替換地,圖6的流程圖可被視為示出在計算機系統(tǒng)200 (圖2)中實現(xiàn)的執(zhí)行級聯(lián)分類器訓練應用程序215的功能的示例方法的步驟。在一些實施例中,級聯(lián)分類器訓練應用程序215的功能可被實現(xiàn)為級聯(lián)分類器應用程序212 (圖2)的一部分。從框603開始,級聯(lián)分類器訓練應用程序215確定訓練圖像集合115 (圖1)中的每一個是否被級聯(lián)分類器100的組合序列106的檢測級102、104(圖1)的每一個拒絕。訓練圖像集合115包括已知與稀有對象相關聯(lián)的訓練圖像集合115和已知與稀有對象不相關聯(lián)的訓練圖像集合115。接下來,在框606,級聯(lián)分類器訓練應用程序215確定組合序列106 的檢測級102、104的截斷檢測級102(圖1)。在一個實施例中,從已知與稀有對象不相關聯(lián)的訓練圖像集合115中在截斷檢測級102處未被拒絕的訓練圖像的數(shù)量基 本上等于已知與稀有對象相關聯(lián)的訓練圖像集合115的基數(shù)。在框609,一旦確定截斷檢測級102,級聯(lián)分類器訓練應用程序215就可將組合序列106的檢測級102、104分成第一序列101的一個或多個檢測級102 (圖1)和第二序列103的兩個或兩個以上檢測級104 (圖1)。第一序列 101的一個或多個檢測級102中的最后一個檢測級102是截斷檢測級102。級聯(lián)分類器訓練應用程序215隨后結(jié)束??稍诶缑嫦?qū)ο蟮脑O計中或在一些其他編程體系結(jié)構(gòu)中實現(xiàn)如圖3-6的示例流程圖所示的級聯(lián)分類器應用程序212和級聯(lián)分類器訓練應用程序215的功能。假設在面向?qū)ο蟮脑O計中實現(xiàn)該功能,則每個框表示可在封裝在一個或多個對象中的一種或多種方法中實現(xiàn)的功能??墒褂么罅烤幊陶Z言(諸如例如,C、C++、C#、Visual Basic、VBScript、 Java、JavaScript、Perl、Ruby、Python、Flash、或其他編程語言)中的任何一個或其組合來實現(xiàn)級聯(lián)分類器應用程序212和級聯(lián)分類器訓練應用程序215。參考圖2-6,雖然級聯(lián)分類器應用程序212和級聯(lián)分類器訓練應用程序215被描述為以如上通用硬件所執(zhí)行的軟件或代碼實施,但是作為替換方案,相同的級聯(lián)分類器應用程序212和級聯(lián)分類器訓練應用程序215還可以專用硬件或者軟件/通用硬件和專用硬件的組合來實施。如果以專用硬件實施,則相同的級聯(lián)分類器應用程序212和級聯(lián)分類器訓練應用程序215還可被實現(xiàn)為采用大量技術(shù)中的任何一個或其組合的電路或狀態(tài)機。這些技術(shù)可包括,但不限于,具有用于在應用一個或多個數(shù)據(jù)信號之后實現(xiàn)各種邏輯功能的邏輯門的分立邏輯電路、具有適當?shù)倪壿嬮T的專用集成電路、或其他組件等。這些技術(shù)一般是本領域技術(shù)人員所公知的,并且因此在本文中不再贅述。圖3-6的流程圖示出實現(xiàn)級聯(lián)分類器應用程序212和級聯(lián)分類器訓練應用程序 215的功能和操作。如果以軟件實施,則每個框可表示包括實現(xiàn)特定邏輯功能的程序指令的代碼的模塊、片斷、或部分。程序指令可以包括以編程語言所編寫的人類可讀的語句的源代碼、或包括可由合適的執(zhí)行系統(tǒng)(諸如計算機系統(tǒng)200或其他系統(tǒng)中的處理器203)識別的數(shù)值指令的機器代碼的形式實施。可從源代碼等轉(zhuǎn)換機器代碼。如果以硬件實施,則每個框可表示實現(xiàn)特定邏輯功能的電路或大量互聯(lián)電路。雖然圖3-6的流程圖示出執(zhí)行的具體次序,但是應當理解,執(zhí)行的次序可與示出的次序不同。例如,執(zhí)行兩個或兩個以上框的次序相對于所示的次序可以是混雜的。同樣, 圖3-6中連續(xù)示出的兩個或兩個以上框可同時執(zhí)行、或部分地同時執(zhí)行。另外,出于增強的實用性、統(tǒng)計、性能測量、或提供故障檢測輔助等目的,任意數(shù)量的計數(shù)器、狀態(tài)變量、警告信號、或消息可被添加到本文所描述的邏輯流程。應當理解,所有這些變體在本公開的范圍內(nèi)。 同樣,在級聯(lián)分類器應用程序212和級聯(lián)分類器訓練應用程序215包括軟件或代碼時,其可以供指令執(zhí)行系統(tǒng)(諸如例如,計算機系統(tǒng)200或其他系統(tǒng)中的處理器203)使用或結(jié)合其使用的任何計算機可讀介質(zhì)實施。在此意義上,邏輯可包括例如語句,這些語句包括可從計算機可讀介質(zhì)取出且由指令執(zhí)行系統(tǒng)執(zhí)行的指令和說明。在本公開的上下文中,“計算機可讀介質(zhì)”可以是可包含、存儲、或維持供指令執(zhí)行系統(tǒng)使用或結(jié)合其使用的級聯(lián)分類器應用程序212和級聯(lián)分類器訓練應用程序215的任何介質(zhì)。計算機可讀介質(zhì)可包括諸如例如電、磁、光、電磁、紅外、或半導體介質(zhì)的許多物理介質(zhì)中的任何一個。合適的計算機可讀介質(zhì)的更具體示例可能包括,但不限于,磁帶、磁性軟盤、磁性硬盤驅(qū)動器、存儲卡、固態(tài)驅(qū)動器、USB閃存驅(qū)動器、或光盤。同樣,計算機可讀介質(zhì)可以是包括例如靜態(tài)隨機存取存儲器(SRAM)和動態(tài)隨機存取存儲器(DRAM)、或磁性隨機存取存儲器(MRAM)的隨機存取存儲器(RAM)。此外,計算機可讀介質(zhì)可以是只讀存儲器(ROM)、可編程只讀存儲器 (PROM)、可擦除可編程只讀存儲器(EPROM)、電可擦除可編程只讀存儲器(EEPROM)、或其他類型的存儲設備
權(quán)利要求
1.一種用于確定級聯(lián)分類器(100)的檢測確定性的系統(tǒng),所述系統(tǒng)包括至少一個計算機系統(tǒng)O00);以及可在所述至少一個計算機系統(tǒng)O00)中執(zhí)行的級聯(lián)分類器應用程序012),所述級聯(lián)分類器應用程序(21 包括被配置成確定圖像(11 是否與稀有對象相關聯(lián)的第一序列(101)的一個或多個檢測級(102),每個檢測級(10 在正常操作中被配置成在確定所述圖像(11 與所述稀有對象不相關聯(lián)時拒絕所述圖像(112)、并且在未拒絕所述圖像(11 時將所述圖像(11 傳播到下一檢測級(102)被配置成響應于在所述第一序列(101)的最后一個檢測級(102d)中未拒絕所述圖像 (112)、確定所述圖像(11 是否與所述稀有對象相關聯(lián)的第二序列(10 的兩個或兩個以上檢測級(104),每個檢測級(104)在后處理操作中被配置成將所述圖像(11 傳播到下一檢測級(104)、并且在確定所述圖像(11 與所述稀有對象不相關聯(lián)時記錄拒絕,每個檢測級(104)能夠在正?;蚝筇幚聿僮髦信渲茫灰约爸辽俨糠值鼗谂c所述第二序列(10 相關聯(lián)的級響應和級判定來確定所述圖像 (112)與所述稀有對象相關聯(lián)的概率值的邏輯。
2.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述級聯(lián)分類器應用程序(212)還包括至少部分地基于所述第二序列(10 所記錄的拒絕的數(shù)量和閾值來拒絕所述圖像(11 的邏輯,其中當已經(jīng)拒絕所述圖像(11 時所述概率值被確定為零。
3.如權(quán)利要求1所述的系統(tǒng),其特征在于,確定的所述邏輯還包括至少部分地基于與在所述第一序列(101)的最后一個檢測級(102d)未被拒絕的且已知與所述稀有對象相關聯(lián)或不相關聯(lián)的多個圖像(11 相關聯(lián)的至少一個經(jīng)驗分布來確定所述圖像(11 與所述稀有對象相關聯(lián)的概率值的邏輯。
4.如權(quán)利要求3所述的系統(tǒng),其特征在于,所述級聯(lián)分類器應用程序還包括產(chǎn)生所述至少一個經(jīng)驗分布以對來自所述第二序列(10 的對于所述圖像的檢測級響應之和與第二序列(10 所記錄的對于所述圖像的拒絕的數(shù)量建模的邏輯。
5.如權(quán)利要求1所述的系統(tǒng),還包括可在所述至少一個計算機系統(tǒng)O00)中執(zhí)行的級聯(lián)分類器訓練應用程序015),所述級聯(lián)分類器訓練應用程序(21 包括將所述級聯(lián)分類器的組合序列(106)的檢測級(102、104)分成所述第一序列(101)和第二序列(103)的邏輯;以及配置所述第二序列(10 的每個檢測級(104)用于后處理操作的邏輯。
6.如權(quán)利要求5所述的系統(tǒng),其特征在于,所述級聯(lián)分類器訓練應用程序(215)還包括確定訓練圖像集合(115)中的每一個是否被所述組合序列(106)的檢測級(102、104) 中的每一個拒絕的邏輯,所述訓練圖像集合(11 包括已知與所述稀有對象相關聯(lián)的圖像集合和已知與所述稀有對象不相關聯(lián)的圖像集合;以及確定所述組合序列(106)的截斷檢測級(102d)的邏輯,從已知與所述稀有對象不相關聯(lián)的所述圖像集合中在所述截斷檢測級(102d)處未被拒絕的圖像的數(shù)量基本上等于已知與所述稀有對象相關聯(lián)的圖像集合的基數(shù);其中,將所述組合序列(106)分成所述第一序列(101)和第二序列(10 的所述邏輯將所述組合序列(106)劃分成使得所述第一序列(101)的最后一個檢測級(102d)包括所述截斷檢測級(102d)。
7.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述第二序列(103)中的每個檢測級(104) 被配置成從統(tǒng)計模型產(chǎn)生所述圖像(112)與所述稀有對象相關聯(lián)的概率值。
8.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述第二序列(103)中的每個檢測級(104) 被配置成記錄與所述圖像(112)相關聯(lián)的檢測級響應。
9.如權(quán)利要求1所述的系統(tǒng),還包括級聯(lián)分類器訓練應用程序(215),所述級聯(lián)分類器訓練應用程序(215)包括使用訓練圖像集合(115)來訓練所述第一序列(101)和第二序列 (103)中的檢測級(102、104)中的每一個的邏輯,所述訓練圖像集合(115)包括已知與所述稀有對象相關聯(lián)的圖像集合和已知與所述稀有對象不相關聯(lián)的圖像集合。
10.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述圖像(112)包括較大圖像的一部分。
11.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述稀有對象包括臉部。
12.一種用于在至少一個計算機系統(tǒng)(200)中確定級聯(lián)分類器(100)的檢測確定性的方法,所述方法包括以下步驟在第一序列(101)的一個或多個檢測級(102)中確定圖像(112)是否與稀有對象相關聯(lián),所述第一序列(101)中的每個檢測級(102)在所述圖像(112)被所述檢測級(102)確定為與所述稀有對象不相關聯(lián)時拒絕所述圖像(112)、并且在未拒絕所述圖像(112)時將所述圖像(112)傳播到所述第一序列(101)中的下一檢測級(102);配置第二序列(103)的兩個或兩個以上檢測級(104)用于后處理操作,所述第二序列 (103)的檢測級(104)可配置成用于正常或后處理操作;響應于在所述第一序列(101)的最后一個檢測級(102d)中未拒絕所述圖像(112), 在所述第二序列(103)中確定所述圖像(112)是否與所述稀有對象相關聯(lián),所述第二序列 (103)中的每個檢測級(104)將所述圖像(112)傳播到所述第二序列(103)中的下一檢測級(104)、并且在所述圖像(112)被所述檢測級(104)確定為與所述稀有對象不相關聯(lián)時記錄拒絕;以及至少部分地基于與所述第二序列(103)相關聯(lián)的級響應和級判定來確定所述圖像 (112)與所述稀有對象相關聯(lián)的概率值。
13.如權(quán)利要求12所述的方法,還包括以下步驟至少部分地基于所述第二序列(103) 所記錄的拒絕的數(shù)量和閾值來拒絕所述圖像(112),其中當已經(jīng)拒絕所述圖像(112)時所述概率值被確定為零。
14.如權(quán)利要求12所述的方法,其特征在于,確定概率值的步驟還包括以下步驟至少部分地基于與在所述第一序列的最后一個檢測級未被拒絕的且已知與所述稀有對象相關聯(lián)或不相關聯(lián)的多個圖像(115)相關聯(lián)的至少一個經(jīng)驗分布來確定所述圖像(112)與所述稀有對象相關聯(lián)的概率值。
15.如權(quán)利要求12所述的方法,還包括以下步驟確定訓練圖像集合(115)中的每一個是否被所述級聯(lián)分類器(100)的組合序列(106) 的檢測級(102、104)中的每一個拒絕,所述訓練圖像集合(115)包括已知與所述稀有對象相關聯(lián)的圖像集合和已知與所述稀有對象不相關聯(lián)的圖像集合;以及確定所述組合序列(106)的截斷檢測級(102d),從已知與所述稀有對象不相關聯(lián)的所述圖像集合中在所述截斷檢測級(102d)處未被拒絕的圖像的數(shù)量基本上等于已知與所述稀有對象相關聯(lián)的圖像集合的基數(shù);其中,所述組合序列(106)被分成所述第一序列(101)和第二序列(103),從而所述第一序列(101)的最后一個檢測級(102d)包括所述截斷檢測級(102d)
全文摘要
公開了用于確定級聯(lián)分類器(100)的檢測確定性的實施例。第一序列(101)的檢測級(102)確定圖像(112)是否與稀有對象相關聯(lián)。級(102)中的每一級在圖像(112)與稀有對象不相關聯(lián)時拒絕圖像(112),并且在未拒絕圖像(112)時將圖像(112)傳播到下一級(102)。第二序列(103)的檢測級(104)被配置成用于后處理操作。如果在第一序列(101)的最后一級(102d)中未拒絕圖像(112),則第二序列(103)確定圖像(112)是否與稀有對象相關聯(lián)。級(104)中的每一級將圖像傳播到下一級(104),從而在圖像(112)與稀有對象不相關聯(lián)時記錄拒絕。確定圖像(112)與稀有對象相關聯(lián)的概率。
文檔編號G06T7/00GK102449661SQ200980159720
公開日2012年5月9日 申請日期2009年6月1日 優(yōu)先權(quán)日2009年6月1日
發(fā)明者D·格雷格 申請人:惠普發(fā)展公司,有限責任合伙企業(yè)