專利名稱:生成用于人臉檢測的訓(xùn)練集的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及人臉檢測,更具體地講,涉及一種通過凈化和縮減來生成壓縮訓(xùn)練集的用于人臉檢測的訓(xùn)練集的方法,所述壓縮訓(xùn)練集具有相似的樣本分布。
背景技術(shù):
人臉檢測是臉部追蹤(tracking)、建模和識別所必需的。多視角人臉檢測對于數(shù)碼相機自動聚焦、自動曝光和自動白平衡非常重要。此技術(shù)也可以用于對象檢測、機器學(xué)習(xí)、模式識別等。
多視角(multi-view)人臉檢測技術(shù)基于機器學(xué)習(xí)的策略。為了達到高檢測率,需要大的訓(xùn)練集來訓(xùn)練準確的人臉檢測器。但是,對于這種訓(xùn)練集的訓(xùn)練過程對一個CPU來說可花費幾個月的時間。
訓(xùn)練基于boosting算法的多視圖人臉檢測器是非常耗時的工作。例如,對于單個普通的PC來說,可能需要幾個月或者數(shù)年的時間。沒有功能強大的計算機,這樣的計算將會是災(zāi)難性的。當前,幾乎所有的研究者采用并行和快速的計算系統(tǒng)。
因此,需要一種生成壓縮和有效的訓(xùn)練集以減少訓(xùn)練時間而不降低系統(tǒng)性能的方法。
發(fā)明內(nèi)容
本發(fā)明的示例性實施例克服上述的不足和上面沒有描述的不足。此外,不要求本發(fā)明克服上述的不足,而且本發(fā)明的示例性實施例可以不克服上述的任何不足。
根據(jù)本發(fā)明的一方面,提供一種生成用于人臉檢測的訓(xùn)練集的方法,包括通過將包括在輸入的基礎(chǔ)訓(xùn)練集中的所有樣本圖像轉(zhuǎn)換為灰度級并且縮放到標準大小來對所述圖像進行規(guī)一化;將規(guī)一化的基礎(chǔ)訓(xùn)練集聚類到預(yù)定數(shù)目的具有近似大小的子訓(xùn)練集,包括在每個所述子訓(xùn)練集的樣本彼此相似;并且對從所述聚類的標準獲得的每個子訓(xùn)練集執(zhí)行以下步驟以形成壓縮的訓(xùn)練集通過從所述子訓(xùn)練集去除預(yù)定比例的外圍樣本來對所述子訓(xùn)練集凈化,通過選擇代表樣本分布的樣本并將選擇的樣本添加到縮減的子訓(xùn)練集來縮減子訓(xùn)練集的大小。
優(yōu)選為,聚類規(guī)一化的基礎(chǔ)訓(xùn)練集的步驟包括a)將當前子訓(xùn)練集的數(shù)目設(shè)置為1,并且將當前子訓(xùn)練集設(shè)置為所述基礎(chǔ)訓(xùn)練集;b)從當前子訓(xùn)練集選擇訓(xùn)練集大小最大的子訓(xùn)練集;c)使用聚類算法將選擇的子訓(xùn)練集劃分為2個子訓(xùn)練集;d)重復(fù)步驟b)和步驟c),直到當前子訓(xùn)練集的數(shù)目達到所述預(yù)定數(shù)目。
優(yōu)選為,所述對子訓(xùn)練集凈化的步驟包括使用概率模型為子訓(xùn)練集建模;和從所述子訓(xùn)練集去除具有低概率的預(yù)定比例的樣本。
所述概率模型可以是高斯混合模型、高斯模型和相似性模型之一。
優(yōu)選為,所述縮減子訓(xùn)練集的步驟包括e)在凈化的子訓(xùn)練集內(nèi),挑選距離高斯中心最近的樣本作為種子樣本;f)從凈化的子訓(xùn)練集去除種子樣本,并且將所述種子樣本添加到縮減的子訓(xùn)練集;g)將縮減的子訓(xùn)練集的大小設(shè)置為種子樣本的數(shù)目;h)在凈化的子訓(xùn)練集中選擇距離當前的縮減子訓(xùn)練集最遠的樣本;i)從凈化的子訓(xùn)練集去除選擇的樣本,并且將其添加到縮減的子訓(xùn)練集;和j)重復(fù)步驟h)和i),直到縮減的子訓(xùn)練集的大小達到預(yù)定數(shù)目。
根據(jù)本發(fā)明的另一方面,提供一種使用附加臉部樣本來改進人臉檢測器的方法,包括使用附加臉部樣本構(gòu)建附加訓(xùn)練集;通過將附加訓(xùn)練集中的所有樣本圖像轉(zhuǎn)換為灰度級并且縮放到標準大小來對所述樣本規(guī)一化;將規(guī)一化的附加訓(xùn)練集聚類到預(yù)定數(shù)目的具有近似大小的子訓(xùn)練集,包括在每個所述子訓(xùn)練集的樣本彼此相似;對從所述聚類的標準獲得的每個子訓(xùn)練集執(zhí)行以下步驟以形成壓縮的訓(xùn)練集通過從所述子訓(xùn)練集去除預(yù)定比例的外圍樣本來對所述子訓(xùn)練集凈化,通過選擇代表樣本分布的樣本并將選擇的樣本添加到縮減的子訓(xùn)練集來縮減子訓(xùn)練集的大小;將由前述步驟獲得的子訓(xùn)練集合并到優(yōu)化的附加訓(xùn)練集;基于所述優(yōu)化的附加訓(xùn)練集修改人臉檢測器的參數(shù);和使用修改的參數(shù)基于優(yōu)化的附加訓(xùn)練集執(zhí)行人臉檢測。
優(yōu)選為,聚類規(guī)一化的附加訓(xùn)練集的步驟包括a)將當前子訓(xùn)練集的數(shù)目設(shè)置為1,并且將當前子訓(xùn)練集設(shè)置為所述附加訓(xùn)練集;b)從當前子訓(xùn)練集選擇訓(xùn)練集大小最大的子訓(xùn)練集;c)使用聚類算法將選擇的子訓(xùn)練集劃分為2個子訓(xùn)練集;d)重復(fù)步驟b)和步驟c),直到當前子訓(xùn)練集的數(shù)目達到所述預(yù)定數(shù)目。
優(yōu)選為,所述對子訓(xùn)練集凈化的步驟包括使用概率模型為子訓(xùn)練集建模;和從所述子訓(xùn)練集去除具有低概率的預(yù)定比例的樣本。
所述概率模型可以是高斯混合模型、高斯模型和相似性模型之一。
優(yōu)選為,所述縮減子訓(xùn)練集的步驟包括e)在凈化的子訓(xùn)練集內(nèi),挑選距離高斯中心最近的樣本作為種子樣本;f)從凈化的子訓(xùn)練集去除種子樣本,并且將所述種子樣本添加到縮減的子訓(xùn)練集;g)將縮減的子訓(xùn)練集的大小設(shè)置為種子樣本的數(shù)目;h)在凈化的子訓(xùn)練集中選擇距離當前的縮減子訓(xùn)練集最遠的樣本;i)從凈化的子訓(xùn)練集去除選擇的樣本,并且將其添加到縮減的子訓(xùn)練集;和j)重復(fù)步驟h)和i),直到縮減的子訓(xùn)練集的大小達到預(yù)定數(shù)目。
通過下面結(jié)合附圖對本發(fā)明的示例性實施例進行的描述,本發(fā)明的上述和其他目的和特點將會變得更加清楚,其中 圖1是示出根據(jù)本發(fā)明示例性實施例的在訓(xùn)練人臉檢測器的過程中訓(xùn)練集處理模塊的作用的示意圖; 圖2是示出根據(jù)本發(fā)明示例性實施例的生成用于人臉檢測的訓(xùn)練集的過程的示意圖; 圖3示出根據(jù)本發(fā)明示例性實施例的使用位移(shifting)方法生成的用于訓(xùn)練人臉檢測器的樣本; 圖4示出根據(jù)本發(fā)明示例性實施例的使用翻轉(zhuǎn)(flipping)方法生成的用于訓(xùn)練人臉檢測器的樣本; 圖5示出根據(jù)本發(fā)明示例性實施例的使用旋轉(zhuǎn)(rotating)方法生成的用于訓(xùn)練人臉檢測器的樣本; 圖6示出根據(jù)本發(fā)明示例性實施例的對圖像執(zhí)行規(guī)一化(normalization)之前和之后的比較; 圖7是示出根據(jù)本發(fā)明示例性實施例的子訓(xùn)練集分類的過程的示意圖; 圖8示出用于訓(xùn)練人臉檢測器的壞樣本的示例; 圖9示出根據(jù)本發(fā)明示例性實施例的在執(zhí)行圖7的過程之后所得的部分子訓(xùn)練集;和 圖10是示出根據(jù)本發(fā)明示例性實施例的具有補充訓(xùn)練集處理模塊的改進的人臉檢測器的示意圖。
具體實施例方式 以下,參照附圖來詳細說明本發(fā)明的特定示例性實施例。
根據(jù)本發(fā)明示例性實施例的生成用于人臉檢測的訓(xùn)練集的方法在如圖1示出的人臉檢測器中,可以以軟件組件(即訓(xùn)練集處理模塊)實現(xiàn)。
圖1是示出根據(jù)本發(fā)明示例性實施例的在訓(xùn)練人臉檢測器的過程中訓(xùn)練集處理模塊110的作用的示意圖。這里,訓(xùn)練集處理模塊110以基礎(chǔ)訓(xùn)練集110bs作為輸入。根據(jù)本發(fā)明的另一示例性實施例,訓(xùn)練集處理模塊110以臉部樣本為輸入,并且基于所述輸入的臉部樣本來構(gòu)建基礎(chǔ)訓(xùn)練集。
訓(xùn)練集處理模塊110對包括在基礎(chǔ)訓(xùn)練集110bs中的樣本圖像執(zhí)行圖像規(guī)一化,并且通過去除外圍樣本并隨后選擇代表樣本分布的樣本來生成壓縮(compact)訓(xùn)練集。訓(xùn)練模塊120對壓縮訓(xùn)練集110cs執(zhí)行訓(xùn)練以生成人臉檢測器130。
圖2是示出根據(jù)本發(fā)明示例性實施例的生成用于人臉檢測的訓(xùn)練集的過程的示意圖。
參照圖2,在操作210,基礎(chǔ)訓(xùn)練集210s首先被構(gòu)建。對于臉部區(qū)域的圖像,通過位移(shifting)、翻轉(zhuǎn)(flipping)和旋轉(zhuǎn)(rotating)所述圖像可生成許多訓(xùn)練樣本。當圖像沿著x和y坐標被位移時,如圖3所示,原始臉部區(qū)域可以生成4個更多的訓(xùn)練樣本。使用翻轉(zhuǎn)方法,如圖3所示的包括所述原始臉部區(qū)域的5個臉部區(qū)域可以生成5個更多的訓(xùn)練樣本,如圖4所示。當所述原始臉部圖像以8個不同的角度被旋轉(zhuǎn)時,又將生成8個訓(xùn)練樣本。圖5示出通過分別以-37.5°、-30°、-22.5°、-7.5°、7.5°、22.5°、30.5°和37.5°旋轉(zhuǎn)原始圖像生成的8個樣本圖像。
因此,單個臉部區(qū)域可生成許多訓(xùn)練樣本。對于基于boost的多視角(multi-view)人臉檢測器,需要大量的臉部樣本來訓(xùn)練魯棒的人臉檢測器。使用上述的位移、翻轉(zhuǎn)和旋轉(zhuǎn)方法,可以獲得龐大的基礎(chǔ)訓(xùn)練集。由于一些訓(xùn)練樣本非常相似,所以在訓(xùn)練過程中并不需要所有的樣本。根據(jù)本發(fā)明的另一實施例,構(gòu)建好的基礎(chǔ)訓(xùn)練集被輸入,而省略在操作210中的操作。
然后,對包括在所述基礎(chǔ)訓(xùn)練集中的樣本圖像執(zhí)行圖像規(guī)一化(操作220)。這里,將RGB彩色圖像轉(zhuǎn)換為灰度級并且縮放到標準大小,然后使用直方圖均衡化(histograme qualization)進行照度(illumination)規(guī)一化。
在操作230至塊250,根據(jù)本發(fā)明的生成用于人臉檢測的訓(xùn)練集的方法通過去除外圍樣本并且縮減訓(xùn)練集的大小來生成壓縮訓(xùn)練集,其中,通過挑選具有與其先前樣本分布相似的分布的代表性的樣本來縮減訓(xùn)練集的大小。
在操作230,將具有規(guī)一化的臉部樣本的基礎(chǔ)訓(xùn)練集聚類(clustering)到預(yù)定數(shù)目的子訓(xùn)練集130s,從而每個子訓(xùn)練集具有與其他子訓(xùn)練集相似的大小,并且在每個子訓(xùn)練集中的臉部樣本彼此相似。
現(xiàn)在參照圖7詳細地描述在操作230中子訓(xùn)練集分類的操作。參照圖7,首先確定將被劃分成的子訓(xùn)練集的數(shù)目N(步驟710)。然后,將當前子訓(xùn)練集的數(shù)目T設(shè)置為1,有一個子訓(xùn)練集(即所述規(guī)一化的基礎(chǔ)訓(xùn)練集)(步驟720)。執(zhí)行以下步驟,直到T達到N(通過步驟730檢查)選擇具有最大的訓(xùn)練集大小的子訓(xùn)練集s(步驟740);使用k-means算法將選擇的子訓(xùn)練集s劃分成2個子訓(xùn)練集,s1和s2(步驟750);將T增加1(操作760)。根據(jù)本發(fā)明的其他實施例,在步驟740,使用其他的聚類算法代替k-means算法來取得類似的結(jié)果,如距離相似度方法(distance and similarity measure)、分等級方法(hierarchical method)和矢量量化方法(vector quantization method)。
圖9示出根據(jù)本發(fā)明示例性實施例的在執(zhí)行圖7的過程之后所得的部分子訓(xùn)練集。這里,1100個圖像被聚類到5類中,一些結(jié)果被示出。每行的圖像屬于同一類,每類中的臉部彼此更為相似。
以下回到圖2,對從操作230所得的每個子訓(xùn)練集執(zhí)行塊240(子訓(xùn)練集凈化)和塊250(子訓(xùn)練集縮減)中的操作。
塊240是子訓(xùn)練集凈化步驟,其中,“壞樣本”從子訓(xùn)練集被去除。所謂的“壞樣本”是被錯誤地標注(labeled)或者質(zhì)量差的臉部圖像。圖8示出一些壞樣本的例子。
在ada-boosting方法中,人臉樣本是正(positive)樣本,并且即使很小數(shù)目的壞的正樣本也會使人臉檢測器參數(shù)發(fā)生較大的偏差。首先,在訓(xùn)練過程中,根據(jù)只有小比例的正樣本將被錯誤地被排除,并且少量的壞樣本也會影響該比例的原則確定強分類器閾值。其次,對于弱分類器,箱劃分(bindivision)可能受到遠離平均值的外圍樣本的影響。最后,如果所述壞樣本保留在訓(xùn)練集中,則他們在隨后的子訓(xùn)練集縮減步驟(塊250)中將不能被排除,并且他們的比例會上升。因此,去除壞樣本產(chǎn)生有效的訓(xùn)練集。
雖然人臉特征分布復(fù)雜,但是單個子訓(xùn)練集簡單。根據(jù)本發(fā)明的實施例,用GMM(高斯混合模型)來對子訓(xùn)練集建模(操作241) G(x)=∑wi×gi(θi,σi,x) 其中,gi是在預(yù)定數(shù)目的高斯函數(shù)中的第i個高斯函數(shù),wi是gi的權(quán)重,θi是平均矢量,σi方差矩陣,并且x是輸入的臉部樣本。
根據(jù)本發(fā)明的其他實施例,可以使用其他的概率模型來代替GMM,如高斯模型、相似度模型等。使用概率模型,具有很低概率的樣本(即具有小G(x)值的樣本)被視為壞樣本。在操作242,將具有低概率的一小部分的樣本(視為外圍臉部樣本)從所述子訓(xùn)練集去除。
經(jīng)凈化的子訓(xùn)練集隨后經(jīng)過塊250中的子訓(xùn)練集縮減的操作。對于具有大小N0的凈化的子訓(xùn)練集P,目的是獲得具有大小N1的縮減的子訓(xùn)練集R,其中N1是預(yù)定值,
并且他們的分布保持相似。
如下解釋所述過程 在操作252,計算該凈化的子訓(xùn)練集的平均值(mean)和差值(variance)。
在操作254,使用計算的平均值和差值對樣本進行規(guī)一化 規(guī)一化樣本=(樣本-平均值)/差值 對子訓(xùn)練集中的所有樣本執(zhí)行此處理。此規(guī)一化實際上將不同的權(quán)重賦予臉部圖像中的不同像素。穩(wěn)定的區(qū)域(如眼部區(qū)域)具有小的差值(大的權(quán)重),而不穩(wěn)定區(qū)域(如圖像角落區(qū)域)具有大的差值(小的權(quán)重)。因此,穩(wěn)定區(qū)域具有大的權(quán)重,而不穩(wěn)定區(qū)域具有小的權(quán)重。
在操作255,對從操作254獲得的規(guī)一化的樣本再一次執(zhí)行GMM建模。
在操作256,將種子樣本添加到縮減的子訓(xùn)練集。這里,距離GMM高斯中心最近的臉部圖像被視為種子樣本。每個高斯中心有一個種子樣本。首先,將種子樣本添加到縮減的子訓(xùn)練集,并且將其從原凈化的子訓(xùn)練集去除。然后,將縮減子訓(xùn)練集的當前大小N’設(shè)置為當前已獲得的種子的數(shù)目。
在操作256,在設(shè)置種子樣本之后,將被視為代表樣本分布的其他規(guī)一化的樣本逐個地添加到縮減子訓(xùn)練集(操作258)。所述操作包括以下步驟 a)找到凈化的子訓(xùn)練集中距離當前的縮減子訓(xùn)練集最遠的規(guī)一化的臉部樣本X; b)將樣本X從原凈化的子訓(xùn)練集去除; c)將樣本X添加到縮減的子訓(xùn)練集,并且設(shè)置N’=N’+1 d)如果N’<N1,則返回步驟a) 這里,在步驟a),計算樣本和縮減的子訓(xùn)練集之間的距離如下首先,計算所述樣本和縮減的子訓(xùn)練集中所有人臉樣本之間的歐式距離。然后,選擇計算的具有最小值的歐式距離作為所述樣本和縮減的子訓(xùn)練集之間的距離。也就是說, d(x,R)=min[d(x,x′),x′∈R] 其中,R是所有計算出的歐式距離的集合。
在本發(fā)明的其他實施例中,使用如Mahalanobis距離、卡方距離的算法來計算樣本和縮減的子訓(xùn)練集之間的距離。
在本發(fā)明的其他實施例中,在子訓(xùn)練集的縮減處理中,不對樣本圖像進行規(guī)一化處理。在這種情況下,可以省略在操作252、254和255中的操作。
當對每個子訓(xùn)練集執(zhí)行塊240和塊250中的操作之后,就獲得具有縮減的大小的有效的訓(xùn)練集。
也可使用根據(jù)本發(fā)明的生成用于人臉檢測的訓(xùn)練集的方法來提供改進的人臉檢測器。圖10是示出根據(jù)本發(fā)明示例性實施例的具有補充訓(xùn)練集處理模塊的改進的人臉檢測器的示意圖?,F(xiàn)實中,人臉檢測其是不完美的。總會有遺漏的臉。一般手工挑選這些遺漏的臉。參照圖10,補充訓(xùn)練集處理器1010基于遺漏的臉1010bs構(gòu)建基礎(chǔ)附加訓(xùn)練集,優(yōu)選為,使用上述的位移、翻轉(zhuǎn)和旋轉(zhuǎn)方法來生成更多的臉部樣本。補充訓(xùn)練集處理器1010隨后對包括在基礎(chǔ)附加訓(xùn)練集中的樣本圖像執(zhí)行圖像規(guī)一化,并且通過執(zhí)行圖2中在塊230到塊250中的操作來產(chǎn)生附加訓(xùn)練集1010cs,使得人臉檢測器能夠檢測上述附加訓(xùn)練集中的部分臉。例如,可以將人臉檢測器的排除閾值降低,從而人臉檢測器接受在其他情況下可被排除的一些臉。這樣獲得的人臉檢測器是改進的人臉檢測器1040。
如上所述,通過去除外圍樣本并且通過選擇代表性的樣本,改進本發(fā)明的生成用于人臉檢測的訓(xùn)練集的方法提供具有縮減的大小和相似的樣本分布的壓縮和有效的訓(xùn)練集,而不降低人臉檢測性能。
雖然已經(jīng)示出和描述了本發(fā)明的一些示例性實施例,但是本領(lǐng)域的技術(shù)人員可以理解,在不脫離本發(fā)明的范圍和精神的情況下,可以對這些實施例進行改變,本發(fā)明的范圍由權(quán)利要求和其等同物限定。
權(quán)利要求
1、一種生成用于人臉檢測的訓(xùn)練集的方法,包括
通過將包括在輸入的基礎(chǔ)訓(xùn)練集中的所有樣本圖像轉(zhuǎn)換為灰度級并且縮放到標準大小來對所述圖像進行規(guī)一化;
將規(guī)一化的基礎(chǔ)訓(xùn)練集聚類到預(yù)定數(shù)目的具有近似大小的子訓(xùn)練集,包括在每個所述子訓(xùn)練集的樣本彼此相似;并且
對從所述聚類的標準獲得的每個子訓(xùn)練集執(zhí)行以下步驟以形成壓縮的訓(xùn)練集
通過從所述子訓(xùn)練集去除預(yù)定比例的外圍樣本來對所述子訓(xùn)練集凈化,
通過選擇代表樣本分布的樣本并將選擇的樣本添加到縮減的子訓(xùn)練集來縮減子訓(xùn)練集的大小。
2、如權(quán)利要求1所述的方法,其中,聚類規(guī)一化的基礎(chǔ)訓(xùn)練集的步驟包括
a)將當前子訓(xùn)練集的數(shù)目設(shè)置為1,并且將當前子訓(xùn)練集設(shè)置為所述基礎(chǔ)訓(xùn)練集;
b)從當前子訓(xùn)練集選擇訓(xùn)練集大小最大的子訓(xùn)練集;
c)使用聚類算法將選擇的子訓(xùn)練集劃分為2個子訓(xùn)練集;
d)重復(fù)步驟b)和步驟c),直到當前子訓(xùn)練集的數(shù)目達到所述預(yù)定數(shù)目。
3、如權(quán)利要求2所述的方法,其中,所述對子訓(xùn)練集凈化的步驟包括
使用概率模型為子訓(xùn)練集建模;和
從所述子訓(xùn)練集去除具有低概率的預(yù)定比例的樣本。
4、如權(quán)利要求3所述的方法,其中,所述概率模型是高斯混合模型、高斯模型和相似性模型之一。
5、如權(quán)利要求4所述的方法,其中,所述縮減子訓(xùn)練集的步驟包括
e)在凈化的子訓(xùn)練集內(nèi),挑選距離高斯中心最近的樣本作為種子樣本;
f)從凈化的子訓(xùn)練集去除種子樣本,并且將所述種子樣本添加到縮減的子訓(xùn)練集;
g)將縮減的子訓(xùn)練集的大小設(shè)置為種子樣本的數(shù)目;
h)在凈化的子訓(xùn)練集中選擇距離當前的縮減子訓(xùn)練集最遠的樣本;
i)從凈化的子訓(xùn)練集去除選擇的樣本,并且將其添加到縮減的子訓(xùn)練集;和
j)重復(fù)步驟h)和i),直到縮減的子訓(xùn)練集的大小達到預(yù)定數(shù)目。
6、如權(quán)利要求2所述的方法,其中,所述聚類算法是k-means算法、距離相似度方法、分等級方法和矢量量化方法之一。
7、如權(quán)利要求5所述的方法,其中,通過首先計算樣本和縮減的子訓(xùn)練集中的所有臉部樣本之間的歐式距離,然后選擇具有最小距離的值的歐式距離值來計算所述距離。
8、如權(quán)利要求5所述的方法,其中,所述縮減子訓(xùn)練集的步驟還包括
k)計算所述凈化的子訓(xùn)練集的平均值和差值;
l)使用計算出的平均值和差值和以下公式對所有的樣本進行規(guī)一化
規(guī)一化樣本=(樣本-平均值)/差值
和
m)對所有規(guī)一化的樣本執(zhí)行高斯混合模型,
其中,對具有規(guī)一化樣本的凈化的子訓(xùn)練集執(zhí)行步驟e)至j)。
9、如權(quán)利要求1所述的方法,其中,通過使用以下方法中的至少一種或者其結(jié)合來生成更多臉部樣本,并且將生成的更多樣本添加到基礎(chǔ)訓(xùn)練集來構(gòu)建輸入的基礎(chǔ)訓(xùn)練集沿著x和y左邊將臉部樣本位移、翻轉(zhuǎn)臉部樣本和以各種角度旋轉(zhuǎn)臉部樣本。
10、一種使用附加臉部樣本來改進人臉檢測器的方法,包括
使用附加臉部樣本構(gòu)建附加訓(xùn)練集;
通過將附加訓(xùn)練集中的所有樣本圖像轉(zhuǎn)換為灰度級并且縮放到標準大小來對所述樣本規(guī)一化;
將規(guī)一化的附加訓(xùn)練集聚類到預(yù)定數(shù)目的具有近似大小的子訓(xùn)練集,包括在每個所述子訓(xùn)練集的樣本彼此相似;
對從所述聚類的標準獲得的每個子訓(xùn)練集執(zhí)行以下步驟以形成壓縮的訓(xùn)練集通過從所述子訓(xùn)練集去除預(yù)定比例的外圍樣本來對所述子訓(xùn)練集凈化,通過選擇代表樣本分布的樣本并將選擇的樣本添加到縮減的子訓(xùn)練集來縮減子訓(xùn)練集的大?。?br>
將由前述步驟獲得的子訓(xùn)練集合并到優(yōu)化的附加訓(xùn)練集;
基于所述優(yōu)化的附加訓(xùn)練集修改人臉檢測器的參數(shù);和
使用修改的參數(shù)基于優(yōu)化的附加訓(xùn)練集執(zhí)行人臉檢測。
11、如權(quán)利要求10所述的方法,其中,聚類規(guī)一化的附加訓(xùn)練集的步驟包括
a)將當前子訓(xùn)練集的數(shù)目設(shè)置為1,并且將當前子訓(xùn)練集設(shè)置為所述附加訓(xùn)練集;
b)從當前子訓(xùn)練集選擇訓(xùn)練集大小最大的子訓(xùn)練集;
c)使用聚類算法將選擇的子訓(xùn)練集劃分為2個子訓(xùn)練集;
d)重復(fù)步驟b)和步驟c),直到當前子訓(xùn)練集的數(shù)目達到所述預(yù)定數(shù)目。
12、如權(quán)利要求11所述的方法,其中,所述對子訓(xùn)練集凈化的步驟包括
使用概率模型為子訓(xùn)練集建模;和
從所述子訓(xùn)練集去除具有低概率的預(yù)定比例的樣本。
13、如權(quán)利要求12所述的方法,其中,所述概率模型是高斯混合模型、高斯模型和相似性模型之一。
14、如權(quán)利要求13所述的方法,其中,所述縮減子訓(xùn)練集的步驟包括
e)在凈化的子訓(xùn)練集內(nèi),挑選距離高斯中心最近的樣本作為種子樣本;
f)從凈化的子訓(xùn)練集去除種子樣本,并且將所述種子樣本添加到縮減的子訓(xùn)練集;
g)將縮減的子訓(xùn)練集的大小設(shè)置為種子樣本的數(shù)目;
h)在凈化的子訓(xùn)練集中選擇距離當前的縮減子訓(xùn)練集最遠的樣本;
i)從凈化的子訓(xùn)練集去除選擇的樣本,并且將其添加到縮減的子訓(xùn)練集;和
j)重復(fù)步驟h)和i),直到縮減的子訓(xùn)練集的大小達到預(yù)定數(shù)目。
15、如權(quán)利要求11所述的方法,其中,所述聚類算法是k-means算法、距離相似度方法、分等級方法和矢量量化方法之一。
16、如權(quán)利要求13所述的方法,其中,通過首先計算樣本和縮減的子訓(xùn)練集中的所有臉部樣本之間的歐式距離,然后選擇具有最小距離的值的歐式距離值來計算所述距離。
17、如權(quán)利要求13所述的方法,其中,所述縮減子訓(xùn)練集的步驟還包括
k)計算所述凈化的子訓(xùn)練集的平均值和差值;
l)使用計算出的平均值和差值和以下公式對所有的樣本進行規(guī)一化
規(guī)一化樣本=(樣本-平均值)/差值
和
m)利用高斯混合模型對所有歸一化的樣本進行建模,計算高斯混合模型的參數(shù)。
其中,對具有規(guī)一化樣本的凈化的子訓(xùn)練集執(zhí)行步驟e)至j)。
18、如權(quán)利要求10所述的方法,其中,構(gòu)建附加訓(xùn)練集的步驟包括通過使用以下方法中的至少一種或者其結(jié)合來生成更多臉部樣本,并且將生成的更多樣本添加到附加訓(xùn)練集來構(gòu)建輸入的附加訓(xùn)練集沿著x和y軸將臉部樣本位移、翻轉(zhuǎn)臉部樣本和以各種角度旋轉(zhuǎn)臉部樣本。
19、一種人臉檢測設(shè)備,包括
訓(xùn)練集處理模塊,用于將包括在輸入的訓(xùn)練集中的樣本規(guī)一化,并且通過去除外圍樣本并且選擇代表規(guī)一化的訓(xùn)練集的樣本分布的樣本來生成壓縮的訓(xùn)練集;
訓(xùn)練模塊,用于通過所述壓縮的訓(xùn)練集,訓(xùn)練人臉檢測器參數(shù);和人臉檢測模塊,用于基于訓(xùn)練模塊的訓(xùn)練來檢測人臉區(qū)域。
全文摘要
提供一種生成用于人臉檢測的訓(xùn)練集的方法,包括通過將包括在輸入的基礎(chǔ)訓(xùn)練集中的所有樣本圖像轉(zhuǎn)換為灰度級并且縮放到標準大小來對所述圖像進行規(guī)一化;將規(guī)一化的基礎(chǔ)訓(xùn)練集聚類到預(yù)定數(shù)目的具有近似大小的子訓(xùn)練集,包括在每個所述子訓(xùn)練集的樣本彼此相似;并且對從所述聚類的標準獲得的每個子訓(xùn)練集執(zhí)行以下步驟以形成壓縮的訓(xùn)練集通過從所述子訓(xùn)練集去除預(yù)定比例的外圍樣本來對所述子訓(xùn)練集凈化,通過選擇代表樣本分布的樣本并將選擇的樣本添加到縮減的子訓(xùn)練集來縮減子訓(xùn)練集的大小。
文檔編號G06K9/62GK101408943SQ20071016382
公開日2009年4月15日 申請日期2007年10月9日 優(yōu)先權(quán)日2007年10月9日
發(fā)明者任海兵, 李宗河, 金培亭, 李性德 申請人:三星電子株式會社, 北京三星通信技術(shù)研究有限公司