亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

用于面部表示的系統(tǒng)和方法

文檔序號(hào):10517869閱讀:642來(lái)源:國(guó)知局
用于面部表示的系統(tǒng)和方法
【專利摘要】系統(tǒng)、方法、以及非暫時(shí)性計(jì)算機(jī)可讀介質(zhì)可通過(guò)采用深度神經(jīng)網(wǎng)絡(luò)(DNN)對(duì)準(zhǔn)面部圖像、分類面部圖像、以及驗(yàn)證面部圖像??蓮?D面部圖像生成3D對(duì)準(zhǔn)的面部圖像。可基于3D對(duì)準(zhǔn)的面部圖像至DNN的提供對(duì)2D面部圖像的標(biāo)識(shí)進(jìn)行分類。2D面部圖像的標(biāo)識(shí)可包括特征向量。
【專利說(shuō)明】
用于面部表示的系統(tǒng)和方法
技術(shù)領(lǐng)域
[0001] 本技術(shù)涉及面部識(shí)別的領(lǐng)域。更具體地,本技術(shù)提供使用深度學(xué)習(xí)表示面部圖像 的技術(shù)。
【背景技術(shù)】
[0002] 面部識(shí)別系統(tǒng)是從圖像或者視頻中自動(dòng)識(shí)別或驗(yàn)證人的計(jì)算機(jī)應(yīng)用。無(wú)約束圖像 中的面貌識(shí)別在算法感知革命中的最前沿。面貌識(shí)別技術(shù)的社交和文化含義及優(yōu)點(diǎn)是廣泛 的。然而,在機(jī)器與人類視覺(jué)系統(tǒng)之間的這個(gè)領(lǐng)域中當(dāng)前的性能空白阻止了這些優(yōu)點(diǎn)的實(shí) 現(xiàn)。
[0003] 當(dāng)識(shí)別在持續(xù)受控(約束)環(huán)境中拍攝的靜止圖像中的正面面部時(shí),二十年來(lái)面部 識(shí)別錯(cuò)誤率降低三個(gè)數(shù)量級(jí)。應(yīng)用包括邊界控制和智能生物識(shí)別。然而,這些系統(tǒng)會(huì)對(duì)各種 因素敏感,諸如,照明、表情、遮擋、以及年齡。當(dāng)嘗試識(shí)別無(wú)約束設(shè)置中的人時(shí),這些系統(tǒng)的 性能基本上會(huì)劣化。

【發(fā)明內(nèi)容】

[0004] 本公開(kāi)的各種實(shí)施方式可以包括系統(tǒng)、方法、以及非暫時(shí)性計(jì)算機(jī)可讀介質(zhì),其被 配置為通過(guò)采用深度神經(jīng)網(wǎng)絡(luò)對(duì)準(zhǔn)面部圖像、分類面部圖像、以及驗(yàn)證面部圖像。在一些實(shí) 施方式中,可以從2D面部圖像生成3D對(duì)準(zhǔn)的面部圖像??苫?D對(duì)準(zhǔn)的面部圖像至深度神 經(jīng)網(wǎng)絡(luò)(DNN)的提供對(duì)2D面部圖像的標(biāo)識(shí)進(jìn)行分類。2D面部圖像的標(biāo)識(shí)可包括特征向量。
[0005] 在一個(gè)實(shí)施方式中,可以檢測(cè)2D面部圖像的一組基準(zhǔn)點(diǎn)。2D面部圖像可以用于使 2D面部圖像扭曲成3D形狀以生成3D對(duì)齊的面部圖像。
[0006] 在一個(gè)實(shí)施方式中,一組錨點(diǎn)可以被放置到3D形狀上。每個(gè)錨點(diǎn)可以對(duì)應(yīng)于2D面 部圖像的一組基準(zhǔn)點(diǎn)中的基準(zhǔn)點(diǎn)??梢詫?D面部圖像的該一組基準(zhǔn)點(diǎn)中的每個(gè)基準(zhǔn)點(diǎn)的位 置背投(back-project)至3D形狀。可以將2D面部圖像的該一組基準(zhǔn)點(diǎn)中的每個(gè)基準(zhǔn)點(diǎn)的位 置投影至3D形狀的正視圖??梢曰谠撘唤M基準(zhǔn)點(diǎn)和該組錨點(diǎn)將該2D面部圖像變換成3D對(duì) 準(zhǔn)的面部圖像。
[0007] 在一個(gè)實(shí)施方式中,2D面部圖像的該組基準(zhǔn)點(diǎn)限定一組三角形。對(duì)該組三角形中 的每個(gè)三角形執(zhí)行仿射變換以將2D面部圖像變換成3D對(duì)準(zhǔn)的面部圖像。
[0008] 在一個(gè)實(shí)施方式中,可以通過(guò)檢測(cè)圖像的第二組基準(zhǔn)點(diǎn)識(shí)別圖像的面部部分???以通過(guò)基于第二組基準(zhǔn)點(diǎn)變換圖像的面部部分生成2D面部圖像。
[0009] 在一個(gè)實(shí)施方式中,可以確定一組錨定位置。圖像的面部部分可以基于該組錨定 位置扭曲成所生成的2D面部圖像。
[0010] 在一個(gè)實(shí)施方式中,DNN包括一組層,該組層包括卷積池層、一組局部連接的層、以 及一組完全連接的層。
[0011]在一個(gè)實(shí)施方式中,卷積池層包括第一卷積層、最大池層、以及第二卷積層。卷積 池層被配置為提取3D對(duì)準(zhǔn)的面部圖像的一組特征。
[0012] 在一個(gè)實(shí)施方式中,該組局部連接的層中的每個(gè)局部連接的層被配置為提取3D對(duì) 準(zhǔn)的面部圖像的一組特征。
[0013] 在一個(gè)實(shí)施方式中,該組完全連接的層中的每個(gè)局部完全連接的層被配置為確定 3D對(duì)準(zhǔn)的面部圖像的一組特征之間的相關(guān)性。
[0014] 在一個(gè)實(shí)施方式中,該組完全連接的層中的完全連接的層的輸出是特征向量。 [0015]在一個(gè)實(shí)施方式中,DNN被配置為基于特征向量對(duì)2D面部圖像進(jìn)行分類。特征向量 包括3D對(duì)準(zhǔn)的面部圖像的一組特征。一組特征中的每個(gè)特征標(biāo)準(zhǔn)化為預(yù)定范圍。
[0016] 在一個(gè)實(shí)施方式中,DNN被配置為針對(duì)3D對(duì)準(zhǔn)的面部圖像的每一個(gè)像素限定一組 濾波器。
[0017] 在一個(gè)實(shí)施方式中,DNN被訓(xùn)練以用數(shù)據(jù)集限定該組濾波器。
[0018] 在一個(gè)實(shí)施方式中,可以通過(guò)查詢圖像存儲(chǔ)中的2D面部圖像的標(biāo)識(shí)識(shí)別2D面部圖 像的個(gè)體。圖像存儲(chǔ)包括一組面部圖像并且該組面部圖像的每個(gè)面部圖像對(duì)應(yīng)于個(gè)體。
[0019] 在一個(gè)實(shí)施方式中,對(duì)第二2D面部圖像的第二標(biāo)識(shí)進(jìn)行分類??梢詫?biāo)識(shí)與第二 標(biāo)識(shí)相比以確定標(biāo)識(shí)和第二標(biāo)識(shí)是否對(duì)應(yīng)于個(gè)體。
[0020] 在一個(gè)實(shí)施方式中,可以確定標(biāo)識(shí)與第二標(biāo)識(shí)之間的加權(quán)-X2距離以將標(biāo)識(shí)與第 二標(biāo)識(shí)進(jìn)行比較。
[0021] 在一個(gè)實(shí)施方式中,標(biāo)識(shí)包括第一組特征并且第二標(biāo)識(shí)包括第二組特征。可以確 定第一組特征與第二組特征之間的一組特征差異??梢酝ㄟ^(guò)使用完全連接的層將該組特征 差異映射至預(yù)定值以將標(biāo)識(shí)與第二標(biāo)識(shí)進(jìn)行比較。
[0022] 在本發(fā)明的又一實(shí)施方式中,一個(gè)或多個(gè)計(jì)算機(jī)可讀非暫時(shí)性存儲(chǔ)介質(zhì),其體現(xiàn) 為軟件,當(dāng)軟件被執(zhí)行時(shí)可操作為執(zhí)行根據(jù)本發(fā)明或者上述任一個(gè)實(shí)施方式的方法。
[0023]在根據(jù)本發(fā)明的另一實(shí)施方式中,系統(tǒng)包括:一個(gè)或多個(gè)處理器;以及至少一個(gè)存 儲(chǔ)器,耦接至處理器并且包括處理器可執(zhí)行的指令,當(dāng)執(zhí)行指令時(shí)處理器能操作為執(zhí)行根 據(jù)本發(fā)明或者上述實(shí)施方式中任一實(shí)施方式的方法。
[0024] 在根據(jù)本發(fā)明的另一實(shí)施方式中,計(jì)算機(jī)程序產(chǎn)品優(yōu)選地包括計(jì)算機(jī)可讀非暫時(shí) 性存儲(chǔ)介質(zhì),當(dāng)在數(shù)據(jù)處理系統(tǒng)執(zhí)行時(shí)能操作為執(zhí)行根據(jù)本發(fā)明或者上述任一個(gè)實(shí)施方式 的方法。
[0025] 從以下詳細(xì)說(shuō)明和從附圖中本發(fā)明的許多其他特征和實(shí)施方式將清晰可見(jiàn)。
[0026] 尤其在所附權(quán)利要求中公開(kāi)了根據(jù)本發(fā)明的實(shí)施方式,涉及一種方法、儲(chǔ)存介質(zhì)、 系統(tǒng)以及計(jì)算機(jī)程序產(chǎn)品,其中,還可以在另一個(gè)權(quán)利要求范疇(例如,系統(tǒng))內(nèi)要求在一個(gè) 權(quán)利要求范疇(例如,系統(tǒng))內(nèi)提及的任何特征。僅出于形式原因選擇在所附權(quán)利要求中的 從屬或者回頭引用。然而,也可以要求保護(hù)任何從有意的返回引用至任意前述權(quán)利要求中 得到的任何主題(具體地,多個(gè)從屬性),使得公開(kāi)了其權(quán)利要求和特征的任意組合并且可 以不顧所附權(quán)利要求中選擇的從屬性而要求保護(hù)。要求保護(hù)的主題不僅包括如在所附權(quán)利 要求中陳述的特征的組合而且還包括權(quán)利要求中特征的任何其他組合,其中,在權(quán)利要求 中提到的每個(gè)特征可以與任何其他特征或者權(quán)利要求或權(quán)利要求中的其他特征的組合結(jié) 合。此外,可以在分開(kāi)的權(quán)利要求和/或與此處描述或描繪的任何實(shí)施方式或特征或者與所 附權(quán)利要求的任何特征的任意結(jié)合中要求保護(hù)在此處描述和描繪的任何實(shí)施方式和特征。
【附圖說(shuō)明】
[0027] 圖1示出了根據(jù)本公開(kāi)的實(shí)施方式的包括示例性面部表示模塊的示例性系統(tǒng),示 例性面部表示模塊被配置為通過(guò)采用深度神經(jīng)網(wǎng)絡(luò)對(duì)準(zhǔn)面部圖像、對(duì)面部圖像進(jìn)行分類、 和/或驗(yàn)證面部圖像。
[0028] 圖2示出了根據(jù)本公開(kāi)的實(shí)施方式的示例性面部對(duì)準(zhǔn)模塊。
[0029] 圖3A示出了根據(jù)本公開(kāi)的實(shí)施方式包括具有基準(zhǔn)點(diǎn)的所檢測(cè)到的面部部分的示 例性2D圖像。
[0030] 圖3B示出了根據(jù)本公開(kāi)的實(shí)施方式在圖3A中示出的基于示例性2D圖像生成的示 例性2D面部圖像。
[0031] 圖3C示出了根據(jù)本公開(kāi)的實(shí)施方式具有所檢測(cè)到的基準(zhǔn)點(diǎn)以及由基準(zhǔn)點(diǎn)定義的 相應(yīng)的三角形的示例性2D面部圖像。
[0032]圖3D示出了根據(jù)本公開(kāi)的實(shí)施方式轉(zhuǎn)換成在圖3B中示出的2D面部圖像的圖像平 面的示例性3D形狀。
[0033]圖3E示出了根據(jù)本公開(kāi)的實(shí)施方式的有關(guān)裝配的3D-2D照相機(jī)的三角形可視性。 [0034]圖3F示出了根據(jù)本公開(kāi)的實(shí)施方式放置在對(duì)應(yīng)于在圖3C中示出的基準(zhǔn)點(diǎn)的3D形 狀上的錨點(diǎn)。
[0035]圖3G示出了根據(jù)本公開(kāi)的實(shí)施方式的示例性3D對(duì)準(zhǔn)面部圖像。
[0036]圖3H示出了根據(jù)本公開(kāi)的實(shí)施方式在圖3G中示出的基于3D面部圖像生成的面部 的示例性視圖。
[0037]圖4示出了根據(jù)本公開(kāi)的實(shí)施方式的示例性面部分類模塊。
[0038]圖5示出了根據(jù)本公開(kāi)的實(shí)施方式的示例性DNN的示例性架構(gòu)。
[0039] 圖6示出了根據(jù)本公開(kāi)的實(shí)施方式的生成2D面部圖像的面部表示的示例性方法。
[0040] 圖7示出了根據(jù)本公開(kāi)的實(shí)施方式的生成2D面部圖像的面部表示的示例性方法。
[0041] 圖8A示出了與LFW數(shù)據(jù)集的其他方法相比一些實(shí)施方式的接收器作業(yè)特性 ("ROC")曲線。
[0042]圖8B示出了與YTF數(shù)據(jù)集的其他方法相比一些實(shí)施方式的接收器作業(yè)特性 ("ROC")曲線。
[0043]圖9示出了根據(jù)本公開(kāi)的實(shí)施方式在各種情形中可被利用的示例性系統(tǒng)的網(wǎng)絡(luò) 圖。
[0044]圖10示出了根據(jù)本公開(kāi)的實(shí)施方式可在各種情形中利用的計(jì)算機(jī)系統(tǒng)的實(shí)例。 [0045]附圖描述了本公開(kāi)技術(shù)的各種實(shí)施方式,僅僅用于說(shuō)明的目的,其中,附圖使用相 似的參考數(shù)字,來(lái)表示相似的元件。本領(lǐng)域的技術(shù)人員從以下討論中容易認(rèn)識(shí)到,在不背離 在本文中描述公開(kāi)技術(shù)的原理的情況下,可以使用在圖中說(shuō)明的結(jié)構(gòu)和方法的替換的實(shí)施 方式。
【具體實(shí)施方式】
[0046] 近些年,已通過(guò)搜索引擎爬取(crawl) 了大量照片,并且上傳至社交網(wǎng)絡(luò)。這些照 片可以包括各種無(wú)約束材料,諸如,物體、面部、以及場(chǎng)景。對(duì)于計(jì)算機(jī)視覺(jué)社區(qū)最感興趣的 是在處理其未解決的問(wèn)題的中能夠平衡這樣巨大量的數(shù)據(jù)。然而,在計(jì)算機(jī)視覺(jué)中使用的 很多傳統(tǒng)機(jī)器學(xué)習(xí)工具的普遍能力(諸如,支持向量機(jī)、主分量分析以及線性判別分析)趨 向飽和而不是隨著大量訓(xùn)練集而更顯著地成長(zhǎng)。
[0047]現(xiàn)代面部識(shí)別可包括幾個(gè)階段,諸如,檢測(cè)、對(duì)準(zhǔn)、表示、以及分類。在檢測(cè)階段期 間可以從圖像中檢測(cè)到一個(gè)或多個(gè)面部,并且在對(duì)準(zhǔn)階段所檢測(cè)的面部對(duì)準(zhǔn)。隨后,在表示 階段表示圖像中的每個(gè)面部。在分類階段可對(duì)圖像中的每個(gè)面部進(jìn)行分類。傳統(tǒng)的面部驗(yàn) 證方法使用用戶定義并選擇的手動(dòng)精制特征。甚至在戶外("LFW")貢獻(xiàn)中最早標(biāo)記面部中, 可以并入手動(dòng)精制特征以改善性能。這些系統(tǒng)可以采用數(shù)以萬(wàn)計(jì)的圖像描述符。
[0048] 面部對(duì)準(zhǔn)確定諸如眼睛、鼻子、嘴巴、以及下巴的語(yǔ)義面部標(biāo)志的位置。因此,面部 對(duì)準(zhǔn)可能是面部識(shí)別系統(tǒng)的關(guān)鍵部分。包括對(duì)準(zhǔn)的面部的數(shù)據(jù)集(例如,LFW-a)的面部數(shù)據(jù) 庫(kù)可以通過(guò)提供標(biāo)準(zhǔn)化輸入改善面部識(shí)別系統(tǒng)的性能。對(duì)LFW結(jié)果頁(yè)面的一些貢獻(xiàn)使用2D 對(duì)準(zhǔn)版本的數(shù)據(jù)集(例如,LFW-a)并且具有改善的結(jié)果。其他貢獻(xiàn)可能采用更定制的解決方 案。例如,使用推斷似合理的"標(biāo)識(shí)保持(identity preserving)"對(duì)準(zhǔn)的具有相似姿勢(shì)和表 情的人(個(gè)體,i nd i v i du 1 a 1)的數(shù)據(jù)集。然而,在無(wú)約束情況下對(duì)準(zhǔn)面部可能是挑戰(zhàn)性的。由 于面部的非平面化,需要對(duì)很難與將面部形態(tài)排除在外的人的身份斷開(kāi)聯(lián)系的很多因素 (例如,姿勢(shì)和非剛性的表情)作出說(shuō)明。
[0049] 圖1示出了根據(jù)本公開(kāi)的實(shí)施方式的包括示例性面部表示模塊102的示例性系統(tǒng) 100,示例性面部表示模塊被配置為通過(guò)采用深度神經(jīng)網(wǎng)絡(luò)對(duì)準(zhǔn)面部圖像、對(duì)面部圖像進(jìn)行 分類、和/或驗(yàn)證面部圖像。如圖1中所示,示例性面部表示模塊102可包括面部對(duì)準(zhǔn)模塊 104、面部分類模塊106、以及面部驗(yàn)證模塊108。
[0050] 示例性系統(tǒng)100可以包括至少一個(gè)圖像存儲(chǔ)110。在圖1的實(shí)例中,至少一個(gè)圖像存 儲(chǔ)110可被配置為存儲(chǔ)圖像或諸如視頻的其他數(shù)字媒體。圖像可以包括識(shí)別或未識(shí)別的面 部圖像。識(shí)別的面部圖像可以關(guān)聯(lián)到人,而未識(shí)別的面部圖像沒(méi)有關(guān)聯(lián)到任何人。例如,可 以用人的ID(例如,姓名、用戶名等)標(biāo)記識(shí)別的面部圖像。圖像可以是2D或者3D的。在各種 實(shí)施方式中,原始圖象可以用作底層表示。圖像存儲(chǔ)110可以存儲(chǔ)數(shù)據(jù)集,數(shù)據(jù)集可以用于 訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)("DNN")以學(xué)習(xí)面部表示并對(duì)其進(jìn)行分類。各種實(shí)施方式可以提供運(yùn)用 面部的非常大的標(biāo)記數(shù)據(jù)集以便獲得很好地通用于其他數(shù)據(jù)集的面部表示的深度神經(jīng)網(wǎng) 絡(luò)架構(gòu)和學(xué)習(xí)方法。DNN可能涉及例如使用幾個(gè)本地連接的層且沒(méi)有重值分擔(dān)的多于1.2億 參數(shù)。例如,數(shù)據(jù)集可包括屬于多于4000個(gè)身份的四百萬(wàn)面部圖像,其中,每個(gè)身份具有平 均通過(guò)一千個(gè)樣本的人。
[0051] 在一些實(shí)施方式中,面部對(duì)準(zhǔn)模塊104可被配置為包括基于基準(zhǔn)點(diǎn)對(duì)面部進(jìn)行分 析3D模擬。面部對(duì)準(zhǔn)模塊104可以進(jìn)一步被配置為基于分析的3D模擬使所檢測(cè)的面部裁剪 部分扭曲從而創(chuàng)建3D對(duì)準(zhǔn)的面部圖像。由于3D對(duì)準(zhǔn)的面部圖像中每個(gè)面部區(qū)域的位置固定 在像素級(jí)處,從原始圖像中的像素的RGB值中可以已知并且檢測(cè)面部外貌。
[0052] 在一些實(shí)施方式中,面部分類模塊106可被配置為對(duì)圖像的身份進(jìn)行分類。面部分 類模塊106可被配置為直接地基于圖像的像素的RGB值對(duì)圖像的身份(例如,面部表示)進(jìn)行 分類。圖像的身份可以非常緊湊并且甚至稀疏。在另一實(shí)施方式中,可以基于像素的RGB值、 梯度領(lǐng)域、深度圖、或者圖像的深度信息、或者它的任意組合生成圖像的身份。
[0053]在一些實(shí)施方式中,面部驗(yàn)證模塊108可被配置為驗(yàn)證兩個(gè)圖像是否具有相同的 標(biāo)識(shí)。換言之,驗(yàn)證兩個(gè)圖像是否屬于同一級(jí)。面部驗(yàn)證模塊108可被配置為基于通過(guò)面部 分類模塊106分類的標(biāo)識(shí)(例如,圖像的面部表示)確定兩個(gè)圖像之間的相似性。圖像可通過(guò) 特征向量來(lái)表示。在一些實(shí)施方式中,可以通過(guò)計(jì)算兩個(gè)圖像的兩個(gè)標(biāo)準(zhǔn)化特征向量之間 的內(nèi)積確定兩個(gè)圖像的相似性。在一些實(shí)施方式中,可以通過(guò)監(jiān)督度量(諸如,X 2相似性或 暹羅(Siamese)網(wǎng)絡(luò))確定兩個(gè)圖像的相似性。
[0054]兩個(gè)圖像之間的加權(quán)相似性-X2可以表示為¥(心,5) = Σι ¥1(負(fù)(1)42(1))2/(& (i)+f2(i)),其中,fdPf2分別是圖像的向量表示。可使用線性SVM獲悉權(quán)重參數(shù),應(yīng)用于元 件的向量(&(1)吖2(1)) 2/(負(fù)(1)+&(1))。
[0055] 暹羅網(wǎng)絡(luò)為兩個(gè)圖像提供高度非線性度量??梢源_定針對(duì)兩個(gè)圖像識(shí)別的特征之 間的絕對(duì)差別并且用于直接預(yù)測(cè)兩個(gè)輸入圖像是否屬于同一人。兩個(gè)圖像的特征之間的誘 導(dǎo)距離可以表示為:(1(&3 2)=21&141(1)吖2(1)|,其中, &1是暹羅網(wǎng)絡(luò)的可訓(xùn)練參數(shù)???以通過(guò)用邏輯函數(shù):l/(l+eXp(-d))對(duì)0與1之間的距離進(jìn)行標(biāo)準(zhǔn)化,以及通過(guò)使用叉熵?fù)p失 和反向傳播來(lái)訓(xùn)練暹羅網(wǎng)絡(luò)的參數(shù)( ai以及下層之間的聯(lián)合參數(shù))。在各種實(shí)施方式中,為 了防止面部驗(yàn)證任務(wù)過(guò)度擬合,僅為暹羅網(wǎng)絡(luò)的兩個(gè)最頂層進(jìn)行訓(xùn)練。
[0056] 圖2示出了根據(jù)本公開(kāi)的實(shí)施方式的面部對(duì)準(zhǔn)模塊202,如圖1中所示(例如,面部 對(duì)準(zhǔn)模塊104)。示例性面部對(duì)準(zhǔn)模塊202可以使面部圖像對(duì)準(zhǔn)??梢詮闹辽僖粋€(gè)數(shù)據(jù)存儲(chǔ) 208(例如,圖1中的圖像存儲(chǔ)110)獲得待對(duì)準(zhǔn)的圖像。對(duì)準(zhǔn)的面部圖像可以存儲(chǔ)在數(shù)據(jù)存儲(chǔ) 208中。結(jié)合圖3A至圖3H論述圖2。
[0057]圖3A至圖3H示出了根據(jù)本公開(kāi)的實(shí)施方式的對(duì)準(zhǔn)過(guò)程的不同時(shí)間期間的示例性 圖像數(shù)據(jù)。圖3A示出了包括具有基準(zhǔn)點(diǎn)的所檢測(cè)到的面部部分310的示例性2D圖像301。圖 3B示出了基于在圖3A中示出的示例性2D圖像301產(chǎn)生的示例性面部圖像302。圖3C示出了具 有所檢測(cè)到的基準(zhǔn)點(diǎn)以及通過(guò)基準(zhǔn)點(diǎn)定義的相應(yīng)的三角形的示例性面部圖像303。圖3D示 出了轉(zhuǎn)換成圖3B中示出的2D面部圖像302的圖像平面的示例性3D形狀304。圖3E示出了相對(duì) 于裝配的3D-2D照相機(jī)的三角形可視性。圖3F示出了放置在對(duì)應(yīng)于在圖3C中示出的基準(zhǔn)點(diǎn) 的3D形狀306上的錨點(diǎn)。圖3G示出了示例性3D對(duì)準(zhǔn)的面部圖像307。圖3H示出了基于在圖3G 中示出的3D面部圖像307生成的面部308的示例性視圖。
[0058]面部對(duì)準(zhǔn)模塊202可包括基準(zhǔn)點(diǎn)檢測(cè)模塊204和圖像變換模塊206。面部對(duì)準(zhǔn)模塊 可被配置為使2D圖像210與3D對(duì)準(zhǔn)的面部圖像212對(duì)準(zhǔn)。3D對(duì)準(zhǔn)的面部圖像212可以在無(wú)約 束情況下對(duì)準(zhǔn)使得可以將很難與將面部形態(tài)排除在外的人的身份斷開(kāi)聯(lián)系的很多因素考 慮在內(nèi)。例如,考慮由于面部的非平面化和非剛性表情的姿勢(shì)。
[0059]基準(zhǔn)點(diǎn)檢測(cè)模塊204對(duì)2D面部圖像中的基準(zhǔn)點(diǎn)進(jìn)行定位。2D面部圖像可以是無(wú)約 束圖像。在各種實(shí)施方式中,可以通過(guò)支持向量機(jī)(SVR)提取基準(zhǔn)點(diǎn)。可以訓(xùn)練SVR以從2D面 部圖像的圖像描述符中預(yù)測(cè)點(diǎn)配置。在各種實(shí)施方式中,圖像描述符基于局部二進(jìn)制模式 ("LBP")直方圖。在另一實(shí)施方式中,在圖像描述符中可以考慮其他特征。在一些實(shí)施方式 中,可以應(yīng)用多次迭代使得基準(zhǔn)點(diǎn)檢測(cè)模塊204可以使其輸出精確化。即,基準(zhǔn)點(diǎn)檢測(cè)模塊 204可被配置為檢測(cè)基準(zhǔn)點(diǎn)的起始位置,該基準(zhǔn)點(diǎn)可以通過(guò)多次迭代精確化到基準(zhǔn)點(diǎn)的最 終位置??梢允褂?D變換圖像的誘發(fā)相似矩陣T變換2D面部圖像?;鶞?zhǔn)點(diǎn)檢測(cè)模塊204可以 分析新的特征空間上的2D變換圖像,其可以用于精確化2D面部圖像的基準(zhǔn)點(diǎn)的位置。
[0060]基準(zhǔn)點(diǎn)檢測(cè)模塊204可被配置為檢測(cè)2D面部圖像的一組基準(zhǔn)點(diǎn)。參照?qǐng)D3C,示出了 具有一組基準(zhǔn)點(diǎn)中的示例性2D面部圖像303。從圖3中示出的2D面部圖像302中檢測(cè)該組基 準(zhǔn)點(diǎn)x2d,這是圖3A中示出的2D圖像301的2D對(duì)準(zhǔn)的裁剪圖像。可以通過(guò)使用訓(xùn)練的SVR檢測(cè) 該組基準(zhǔn)點(diǎn)x 2d。在所示出的實(shí)例中,在2D面部圖像303上對(duì)所選擇的基準(zhǔn)點(diǎn)的數(shù)字(例如, 67)進(jìn)行定位。該組基準(zhǔn)點(diǎn)X2d可以定義一組相應(yīng)的三角形(例如,Delaunay三角測(cè)量),其可 以添加到在2D面部圖像303中示出的圖像的輪廓。因此,可以避免裁剪和銳邊。
[0061]再參照?qǐng)D2,圖像變換模塊206可被配置為通過(guò)使用基準(zhǔn)點(diǎn)檢測(cè)模塊204檢測(cè)到的 這組基準(zhǔn)點(diǎn)使2D面部圖像扭曲成3D形狀生成3D對(duì)準(zhǔn)的面部圖像212。參照?qǐng)D3G,示出了示例 性3D對(duì)準(zhǔn)的面部圖像307,其基于圖3B中示出的2D面部圖像302產(chǎn)生的。可以使用在圖3C中 示出的該組基準(zhǔn)點(diǎn)扭曲2D面部圖像302以生成圖3G中示出的3D對(duì)準(zhǔn)的面部圖像307。當(dāng)將2D 面部圖像扭曲成3D形狀或模型時(shí),2D面部圖像中的每個(gè)基準(zhǔn)點(diǎn)的位置通過(guò)恢復(fù)的投影矩陣 P投射返回至3D形狀或模型,并且隨后投射至3D形狀或模型的主視圖。在各種實(shí)施方式中, 使用分段仿射變形,由從在2D面部圖像上檢測(cè)到的該組基準(zhǔn)點(diǎn)中得出的三角形引導(dǎo)(例如, Delaunay三角測(cè)量)。
[0062]參照?qǐng)D3D,示出了轉(zhuǎn)換成2D面部圖像302的圖像平面的示例性3D形狀或模型304。 通用3D形狀或模型可以用作對(duì)準(zhǔn)包含面外旋轉(zhuǎn)的面部圖像302的參考。在各種實(shí)施方式中, 通用3D形狀模型是USF Human-ID數(shù)據(jù)庫(kù)的3D掃描的平均值??梢蕴幚?D掃描的平均值并且 表示為對(duì)準(zhǔn)頂點(diǎn)vi = (xi,y i,z i) ni = 1。
[0063] 一組錨點(diǎn)X3d可以放在3D形狀上。每個(gè)錨點(diǎn)對(duì)應(yīng)于在2D面部圖像上檢測(cè)到的基準(zhǔn) 點(diǎn)。在2D面部圖像上檢測(cè)的基準(zhǔn)點(diǎn)與在3D對(duì)準(zhǔn)的面部圖像上的錨點(diǎn)之間可以實(shí)現(xiàn)完全匹 配。例如,圖3F示出了 3D形狀或模型可以誘發(fā)的錨點(diǎn)。圖3F中示出的每個(gè)錨點(diǎn)對(duì)應(yīng)于圖3C中 示出的基準(zhǔn)點(diǎn)?;鶞?zhǔn)點(diǎn)和錨點(diǎn)可以用于將圖3B中示出的2D面部圖像的分段仿射變形引導(dǎo)至 圖3G中示出的3D對(duì)準(zhǔn)的面部圖像。
[0064] 可以配準(zhǔn)3D仿射照相機(jī)P并且用于將圖3B中示出的2D面部圖像302的正面面部平 面投射返回至圖3D中示出的3D形狀304的圖像平面。因此,參考3D形狀304轉(zhuǎn)換成2D面部圖 像302的圖像平面。換言之,2D面部圖像302基于參考3D形狀304變換成3D對(duì)準(zhǔn)的面部圖像。 使用具有已知協(xié)方差的最小平方來(lái)求解3D至2D照相機(jī)P,對(duì)于A,其中,X 3d是通過(guò) 參考基準(zhǔn)點(diǎn)位置[XTM,1,$ 給出的(2x8)-矩陣堆疊,且d表示四個(gè)零的行向量。 尺寸2x 4的仿射照相機(jī)P可以通過(guò)八個(gè)未知的P的向量表不。在一些實(shí)施方式中,使用協(xié)方 差矩陣Σ的(67*2)x(67*2)。這是因?yàn)樗鶛z測(cè)到的面部輪廓上的點(diǎn)可能更有噪聲的,由于相 對(duì)于相機(jī)角度所估計(jì)的它們的位置可能會(huì)受到深度的影響。
[0065]圖3E示出了有關(guān)裝配的仿射3D至2D照相機(jī)的三角形可視性。3D形狀或模型上的三 角形的可視性可能取決于定義三角形的相應(yīng)的錨點(diǎn)距仿射3D至2D照相機(jī)的距離。根據(jù)基準(zhǔn) 點(diǎn)距照相機(jī)的距離,與三角形332進(jìn)行比較,三角形334不易看見(jiàn),三角形332與三角形330進(jìn) 行比較不易看見(jiàn)。
[0066]再參照?qǐng)D2,在各種實(shí)施方式中,面部對(duì)準(zhǔn)模塊202可被配置為從2D圖像210生成2D 面部圖像。參照?qǐng)D3A,在2D圖像301中檢測(cè)面部部分310。可以通過(guò)檢測(cè)一組基準(zhǔn)點(diǎn)312、314、 316、318、320、以及322識(shí)別20圖像301的面部部分310?;鶞?zhǔn)點(diǎn)312、314可以在眼睛的中心進(jìn) 行對(duì)中,基準(zhǔn)點(diǎn)316可以在鼻尖上進(jìn)行對(duì)中,以及基準(zhǔn)點(diǎn)318、322、和320可以分別在嘴部的 頂端和中間點(diǎn)進(jìn)行對(duì)中。在面部部分中檢測(cè)到的基準(zhǔn)點(diǎn)可以用于確定一組錨定位置。所識(shí) 別的面部部分可以基于該組錨定位置扭曲以生成2D面部圖像。例如,如所示出的,基準(zhǔn)點(diǎn) 312、314、316、318、320、以及322可以用于對(duì)面部部分310大約按比例繪制、旋轉(zhuǎn)和平移到三 個(gè)錨定位置??梢酝ㄟ^(guò)求1^3: = 的解來(lái)確定三個(gè)錨定位置以生成如在圖3B中示 出的新的扭曲圖像,其中,對(duì)于點(diǎn)j = l. .n,x\nch〇r: = si[Ri I ti]*xjSmjrce。圖3B示出了2D面部 圖像3022D面部圖像302可以是基于2D圖像301通過(guò)聚集變換產(chǎn)生的對(duì)準(zhǔn)的面部裁剪部分。 在不存在顯著的變化之前,可以執(zhí)行多次迭代以確定錨定位置從而基于所檢測(cè)到的面部部 分310生成2D面部圖像302??梢院铣勺罱K的2D相似變換T 2d: . .*Tk2d。
[0067]圖4示出了根據(jù)本公開(kāi)的實(shí)施方式的示例性面部分類模塊402,如圖1中所示(例 如,面部分類模塊106)。示例性面部分類模塊402可以對(duì)圖像412的標(biāo)識(shí)進(jìn)行分類??梢詮闹?少一個(gè)數(shù)據(jù)存儲(chǔ)410(例如,圖1中的圖像存儲(chǔ)110)中獲得待分類的圖像。分類圖像可以存儲(chǔ) 在數(shù)據(jù)存儲(chǔ)410中。與圖5結(jié)合論述圖4。
[0068]面部分類模塊402可包括濾波器生成模塊404、特征向量生成模塊406、以及表示分 類模塊408。面部分類模塊402可被配置為從DNN中得出圖像的標(biāo)識(shí)(例如,面部表示)。濾波 器生成模塊404可被配置為通過(guò)用數(shù)據(jù)集訓(xùn)練DNN生成一組濾波器。在各種實(shí)施方式中,數(shù) 據(jù)集可以包括大型照片集??梢宰R(shí)別照片中的一部分(例如,標(biāo)記或者用ID標(biāo)記)。每個(gè)濾波 器可被配置為提取圖像的特征(例如,面部特征)。特征向量生成模塊406可被配置為生成圖 像的特征向量。特征向量包括圖像的各種特征并可以用于表示圖像??梢曰跒V波器生成 模塊404提供的該組濾波器產(chǎn)生圖像的特征向量。表示分類模塊408可以基于圖像的特征向 量對(duì)圖像進(jìn)行分類。
[0069] 在各種實(shí)施方式中,DNN可包括一組層,該組層包括卷積池層、局部連接的層、以及 完全連接的層。卷積池層可被配置為提取圖像的一組特征。局部連接的層可被配置為提取 圖像的另一組特征。完全連接的層可被配置為確定圖像的特征之間的相關(guān)性。在一些實(shí)施 方式中,DNN的總體結(jié)構(gòu)包括卷積池層,后面是一組局部連接的層,再后面是完全連接的層。 DNN可包括至少所選擇的數(shù)量(例如,12千萬(wàn))的參數(shù)(例如,連接權(quán))。在各種實(shí)施方式中, DNN被配置為接收作為輸入3D對(duì)準(zhǔn)的面部圖像,諸如,在圖3G中示出的3D對(duì)準(zhǔn)的面部圖像 307〇
[0070] 在各種實(shí)施方式中,DNN使用ReLU激活函數(shù):max(0,x)??梢栽诰矸e層、局部連接的 層、或者完全連接的層之后應(yīng)用該軟閾值化非線性。因此,可以產(chǎn)生高度非線性和稀疏的特 征。因此,由面部分類模塊402產(chǎn)生的特征可能是非常稀疏的。在一些實(shí)施方式中,最高層中 的75%的特征分量正好為零。在另一實(shí)施方式中,可以應(yīng)用在訓(xùn)練期間將隨機(jī)特征分量設(shè) 置為〇的規(guī)則化方法(例如,壓差(dropout))。在一些實(shí)施方式中,規(guī)則化方法僅應(yīng)用于第一 完全連接的層。ReLU激活的使用使得面部分類模塊402不會(huì)對(duì)圖像強(qiáng)度的縮放比例不變。在 DNN中沒(méi)有偏差的情況下,可以實(shí)現(xiàn)完美或者接近完美的等方差。
[0071] 在一些實(shí)施方式中,面部分類模塊402可被配置為使特征標(biāo)準(zhǔn)化為在0與1之間。面 部分類模塊402可以進(jìn)一步被配置為執(zhí)行L 2標(biāo)準(zhǔn)化。因此,可以改善后續(xù)學(xué)習(xí)。特征向量的 每個(gè)分量可以除以遍布訓(xùn)練集中最大的值。在一些實(shí)施方式中,為了避免被小的數(shù)字相除, 在預(yù)定值(例如,0.05)處對(duì)標(biāo)準(zhǔn)化因子設(shè)上限。如果最大數(shù)低于預(yù)定值(例如,0.05),特征 被標(biāo)準(zhǔn)化。這樣的標(biāo)準(zhǔn)化可以確保面部分類模塊402對(duì)于照明變化是魯棒的。
[0072]在各種實(shí)施方式中,輸入3D對(duì)準(zhǔn)的面部圖像可以提供至DNN的卷積池層。卷積池層 可包括第一卷積層(Cl)、最大池層(M2)、以及第二卷積層(C3)。每個(gè)卷積層可被配置為包括 一組濾波器,每個(gè)濾波器被配置為產(chǎn)生特征圖。最大池層可使DNN對(duì)小配準(zhǔn)誤差更魯棒。然 而,若干級(jí)別的池將會(huì)使網(wǎng)絡(luò)丟失有關(guān)詳細(xì)面部結(jié)構(gòu)和微小紋理的準(zhǔn)確位置的信息。因此, 在各種實(shí)施方式中,最大池僅應(yīng)用于第一卷積層。即,最大池層后面只有第一卷積層。卷積 池層被配置為提取圖像的低層特征(例如,簡(jiǎn)單的邊線和紋理)。卷積池層自適應(yīng)預(yù)處理輸 入圖像并且將輸入圖像擴(kuò)展成一組簡(jiǎn)單的局部特征。
[0073]圖5示出了根據(jù)本公開(kāi)的實(shí)施方式的示例性DNN的示例性架構(gòu)500。提供3D對(duì)準(zhǔn)的 面部圖像524(包括RGB復(fù)本524a-c)作為到DNN 500的輸入。在所示出的實(shí)例中,DNN 500可 以基于像素的RGB值對(duì)3D對(duì)準(zhǔn)的面部圖像514的標(biāo)識(shí)進(jìn)行分類??梢酝ㄟ^(guò)卷積池層502和該 組局部連接的層510提取圖像524的局部面部特征。圖像524的局部面部特征之間的相關(guān)性 可以由該組完全連接的層518來(lái)確定。在所示出的實(shí)例中,完全連接的層F7 520的輸出可以 用作圖像524的特征向量。
[0074] 如示出的,示例性卷積池層502包括卷積層C1 504、最大池層M2506、以及卷積層C3 508。卷積層可被配置為具有一組濾波器(例如,32個(gè)濾波器)。在一個(gè)實(shí)施方式中,所選擇的 數(shù)量的濾波器中的每一個(gè)濾波器可以是大小11x11x3。通過(guò)卷積層C1產(chǎn)生的特征圖集可以 提供至最大池層M2。對(duì)于每個(gè)通道,最大池層M2可被配置為采用最大的跨3x3空間鄰域,跨 距為2。第二卷積層C3可以應(yīng)用于最大池層M2的輸出。卷積層C3可被配置為具有一組濾波器 (例如,16個(gè)濾波器)。在一個(gè)實(shí)施方式中,所選擇的數(shù)量的濾波器中的每一個(gè)濾波器可以是 大小 9x9x16。
[0075] 通過(guò)卷積池層生成的圖像的特征(例如,局部面部特征)可以提供至一組局部連接 的層。這組局部連接的層沒(méi)有重值分擔(dān)并且局部連接的層的每一個(gè)輸出可能受到非常大的 輸入的補(bǔ)丁 (patch)的影響。因此,使用局部連接的層可能不會(huì)影響特征提取的計(jì)算負(fù)擔(dān), 但是可能影響經(jīng)受訓(xùn)練的參數(shù)的數(shù)目。每一個(gè)局部連接的層可被配置為從輸入圖像中提取 一組特征。對(duì)于圖像的相同位置,不同的特征可以由局部連接的層和卷積層來(lái)提取。即,通 過(guò)DNN的局部連接的層獲悉特征圖中每個(gè)位置中的一組濾波器,并且這組濾波器不同于通 過(guò)卷積層獲悉的那組濾波器。局部連接的層不會(huì)保持卷積的空間平穩(wěn)性假設(shè),因?yàn)樗鶎?duì)準(zhǔn) 的圖像的不同的區(qū)域可具有不同的局部統(tǒng)計(jì)量。例如,眼睛和眉毛之間的區(qū)域表現(xiàn)出非常 不同的外觀并且與鼻子和嘴之間的區(qū)域進(jìn)行比較具有更高的辨別能力。
[0076] 仍參照?qǐng)D5,如示出的,一組示例性的局部連接的層510包括第一局部連接的層L4 512、第二局部連接的層L5 514、以及第三局部連接的層L6 516。在所示出的示例性DNN 500 的輸入圖像的特征圖中的每個(gè)位置處,局部連接的層L4 512、L5 514、或者L6 516可以應(yīng)用 與卷積層C1 504或C3 508應(yīng)用的組不同組的濾波器。局部連接的層L4 512、L5 514、或L6 516的每個(gè)輸出單元可能受非常大的輸入補(bǔ)丁的影響。例如,如所示出的,局部連接的層L6 516的輸出可能受輸入圖像524的74x74x3補(bǔ)丁的影響。由于輸入圖像524對(duì)準(zhǔn),這樣大的補(bǔ) 丁之間幾乎不存在統(tǒng)計(jì)共享。
[0077] 通過(guò)卷積池層生成的圖像的局部面部特征和一組局部連接的層可以提供至一組 完全連接的層。完全連接的層被配置為確定卷積池層生成的圖像的局部面部特征與該組局 部連接的層之間的相關(guān)性。即,該組完全連接的層被配置為確定在面部圖像的遠(yuǎn)距離部分 中提取的局部面部特征(例如,眼睛的位置和形狀、嘴部的位置和形狀)之間的相關(guān)性。完全 連接的層的每個(gè)輸出可以連接至完全連接的層的所有的輸入。
[0078]參照?qǐng)D4,在一些實(shí)施方式中,特征向量生成模塊406被配置為將完全連接的層的 輸出用作圖像410的特征向量。表示分類模塊408可被配置為基于特征向量將圖像分類為第 一等。在一些實(shí)施方式中,DNN的輸出(例如,最后一個(gè)完全連接的層的輸出)可以提供至K-way softmax,其中K是分類的數(shù)目。K-way softmax可被配置為產(chǎn)生在分類標(biāo)記上的分布。 分配給第i類的概率是softmax函數(shù)的輸出:pi = exp(〇i)/2 j exp(〇j),其中〇i表示給定輸入 上的網(wǎng)絡(luò)的第i輸出。表示分類模塊408可被配置為確定2D面部圖像所屬的個(gè)體??梢阅軌?2D面部圖像的標(biāo)識(shí)(例如,面部表示、特征向量)來(lái)查詢圖像存儲(chǔ)410。
[0079]在各種實(shí)施方式中,當(dāng)訓(xùn)練DNN時(shí),最大化正確類別(例如,面部ID)的可能性??梢?最小化每個(gè)訓(xùn)練樣本的交叉熵?fù)p失以便最大化正確的類別的可能性。給定的輸入的交叉熵 損失是L = _log pk,其中k是給定的輸入的真標(biāo)記的指數(shù)。可以通過(guò)相對(duì)于參數(shù)計(jì)算L的梯 度并且使用隨機(jī)梯度下降(SGD)更新參數(shù)使在參數(shù)上損失可以最小化。在一些實(shí)施方式中, 可以通過(guò)誤差的標(biāo)準(zhǔn)逆?zhèn)鞑?lái)確定梯度。
[0080] 可以通過(guò)平衡輸入圖像對(duì)準(zhǔn)的事實(shí)定制DNN 500的架構(gòu)。示例性DNN 500可被配置 為獲悉對(duì)應(yīng)于各種面部特征的不同的濾波器,以檢測(cè)各種面部特征,和/或生成圖像的特征 向量(如以上更詳細(xì)地描述)。如在圖5中示出的,示例性DNN 500是包括卷積池層502、一組 局部連接的層510、以及一組完全連接的層518的九層的DNN。卷積池層502可包括卷積層C1 504、最大池層M2 506、以及卷積層C3 508。該組局部連接的層510可包括局部連接的層1^4-L6 512、514、以及516,并且該組完全連接的層518可包括完全連接的層F7-F8 520和522。完 全連接的層F7 520或F8 522的每個(gè)輸出單元可以連接至所有的輸入。
[0081] 圖6示出了根據(jù)本公開(kāi)的實(shí)施方式的生成2D面部圖像的面部表示的示例性方法。 應(yīng)當(dāng)理解,除非另有說(shuō)明,在各種實(shí)施方式的范圍內(nèi),存在以相似或可替換的順序執(zhí)行的、 或者并行地執(zhí)行的額外、較少、或者替代的步驟。在方框602,基于2D面部圖像生成3D對(duì)準(zhǔn)的 面部圖像。可以通過(guò)基于3D模型應(yīng)用2D面部圖像的仿射變換來(lái)創(chuàng)建3D對(duì)準(zhǔn)的面部圖像。3D 模型可以是顯式3D面部模型。在方框604,可以通過(guò)將3D對(duì)準(zhǔn)的面部圖像提供至DNN對(duì)2D面 部圖像的標(biāo)識(shí)進(jìn)行分類。可以通過(guò)使用對(duì)應(yīng)于2D面部圖像的3D對(duì)準(zhǔn)的面部圖像生成2D面部 圖像的面部表示(例如,特征向量)。在一些實(shí)施方式中,DNN可包括九層。例如,DNN可能涉及 例如使用多個(gè)局部連接的層且沒(méi)有重值分擔(dān)的多于1.2億參數(shù)。以上參照?qǐng)D1至圖5提供更 詳細(xì)的討論和實(shí)例。
[0082] 圖7示出了根據(jù)本公開(kāi)的實(shí)施方式的生成2D面部圖像的面部表示的示例性方法。 應(yīng)當(dāng)理解,除非另有說(shuō)明,在各種實(shí)施方式的范圍內(nèi),存在以相似或可替換的順序執(zhí)行的、 或者并行地執(zhí)行的額外、較少、或者替代的步驟。在方框702,通過(guò)檢測(cè)2D圖像上的一組基準(zhǔn) 點(diǎn)識(shí)別2D圖像中的面部部分??梢酝ㄟ^(guò)訓(xùn)練以從圖像描述符中預(yù)測(cè)點(diǎn)配置的SVR來(lái)檢測(cè)基 準(zhǔn)點(diǎn)。在方框704,可以通過(guò)基于在方框702檢測(cè)的基準(zhǔn)點(diǎn)變換2D圖像的面部部分生成2D面 部圖像。2D面部圖像可以是2D圖像的對(duì)準(zhǔn)裁剪并且可以通過(guò)聚合變換來(lái)生成。當(dāng)最終合成 2D相似變換時(shí),基準(zhǔn)點(diǎn)可以用于縮放、旋轉(zhuǎn)、以及平移2D圖像的面部部分并且對(duì)新的圖像扭 曲的圖像進(jìn)行迭代直至不存在顯著的變化。
[0083]在方框706,在2D面部圖像中可以檢測(cè)到不同一組基準(zhǔn)點(diǎn)??梢酝ㄟ^(guò)使用與在方框 702使用的SVR不同的SVR定位基準(zhǔn)點(diǎn)的位置。在方框708,通可以過(guò)使用在方框706檢測(cè)的基 準(zhǔn)點(diǎn)生成3D對(duì)準(zhǔn)的面部圖像使2D面部圖像扭曲成3D形狀。3D形狀可以是通用3D模型??梢?配準(zhǔn)3D仿射照相機(jī)并且用于將2D面部圖像的正面面部平面背投至3D形狀的圖像平面,從而 生成3D對(duì)準(zhǔn)的面部圖像。在方框710,可以通過(guò)將3D對(duì)準(zhǔn)的面部圖像提供至深度神經(jīng)網(wǎng)絡(luò) ("DNN")對(duì)2D面部圖像的標(biāo)識(shí)進(jìn)行分類。以上參照?qǐng)D1至圖5提供更詳細(xì)的討論和實(shí)例。 [0084]在各種實(shí)施方式中,DNN被配置為從稱為社交面部分類("SFC")數(shù)據(jù)集的大型照片 集中獲悉面部表示。表示可以應(yīng)用于LFW數(shù)據(jù)庫(kù)以及YouTube?面部("YTF")數(shù)據(jù)集。LFW數(shù) 據(jù)庫(kù)實(shí)際上可以用作在無(wú)約束的環(huán)境中進(jìn)行面部驗(yàn)證的基準(zhǔn)數(shù)據(jù)集。YTF數(shù)據(jù)集可以相似 地建模至LFW但集中在視頻剪輯上。通過(guò)人標(biāo)記SFC的面部標(biāo)識(shí)通常并入大約3%的誤差。與 通常由專業(yè)攝影師而不是智能手機(jī)拍攝的LFW和YTF中的名人的網(wǎng)絡(luò)圖像相比,社交面部照 片在圖像質(zhì)量、照明、以及面部表情上甚至具有更大的變化。
[0085]如所使用的SFC數(shù)據(jù)集包括4030個(gè)人中440萬(wàn)個(gè)標(biāo)記的面部。每個(gè)個(gè)體可具有800 至1200個(gè)面部的圖像??梢圆豢紤]每個(gè)標(biāo)識(shí)的最新的5%的面部圖像。如所使用的LFW數(shù)據(jù) 集由5749個(gè)名人的13323張網(wǎng)絡(luò)照片組成,用10次分割將5749個(gè)名人分成6000個(gè)面部配對(duì)。 通過(guò)使用在訓(xùn)練中只有'相同的'和'不同的'標(biāo)記可用的受限制的協(xié)議或者在訓(xùn)練中也可 使用訓(xùn)練主題標(biāo)識(shí)的無(wú)限制的協(xié)議的平均識(shí)別準(zhǔn)確度來(lái)測(cè)量性能。此外,'無(wú)監(jiān)督的'協(xié)議 可以測(cè)量LFW的性能,且不用對(duì)該數(shù)據(jù)集進(jìn)行任何訓(xùn)練。
[0086] 如所使用的YTF數(shù)據(jù)集收集1595個(gè)對(duì)象的3425Y〇uTube?視頻,YTF數(shù)據(jù)集可以是 LFW中的名人的子集。這些視頻可分成5000個(gè)視頻對(duì)和10個(gè)分割并且用于評(píng)估視頻級(jí)的面 部驗(yàn)證。
[0087] 可以通過(guò)具有動(dòng)量(設(shè)置為0.9)的隨機(jī)梯度下降(SGD)實(shí)現(xiàn)在前饋網(wǎng)上的標(biāo)準(zhǔn)逆 傳播來(lái)在SFC上訓(xùn)練DNN。最小批量大小是128,并且確保所有的學(xué)習(xí)層相等的學(xué)習(xí)率為 〇. 〇 1。學(xué)習(xí)率可以手動(dòng)降低至〇. 〇〇〇〇 1的最終速率。每次,一旦驗(yàn)證誤差停止減少,學(xué)習(xí)率可 以減少一個(gè)數(shù)量級(jí)。每層的權(quán)重可以用〇 = 0.01從零均值高斯分布初始化并且偏置設(shè)置為 0.5。可以對(duì)整個(gè)數(shù)據(jù)網(wǎng)絡(luò)大致進(jìn)行15次清掃(新時(shí)期)來(lái)訓(xùn)練網(wǎng)絡(luò)。
[0088] 表1示出了相對(duì)于訓(xùn)練數(shù)據(jù)集大小和網(wǎng)絡(luò)深度對(duì)SFC的實(shí)施方式的分類錯(cuò)誤。通過(guò) 使用SFC中的個(gè)體的子集改變訓(xùn)練和測(cè)試數(shù)據(jù)集大小。大小1.5K、3K、以及4K個(gè)體的子集用 于分別包含1 · 5Μ、3 · 3Μ、以及 4 · 4Μ 的SFC。訓(xùn)練 DNN(例如,De 印 Face-1 · 5M、DeepFace-3 · 3Μ、以 及DeepFaCe-4.4M)。如示出的,大型面部數(shù)據(jù)集和深度架構(gòu)減小誤差率。當(dāng)對(duì)3K個(gè)人進(jìn)行分 類時(shí),分類誤差僅從1.5K個(gè)人的7.0 %適度增長(zhǎng)至7.2%,這指示網(wǎng)絡(luò)的容量可很好地容納 3M訓(xùn)練圖像的規(guī)模。對(duì)于具有4.4M圖像的4K個(gè)人,誤差率上升至8.7%,從而示出了網(wǎng)絡(luò)按 比例調(diào)節(jié)適于更多的個(gè)體。
[0090]表 1
[0091] 通過(guò)從圖5中示出的架構(gòu)中移去一層或多層改變網(wǎng)絡(luò)的深度。例如,在DNN DeepFace-子集1中移去卷積層(例如,C3),在DNN DeepFace-子集2中移去一組局部連接的 層(例如,L4和L5),并且在DNN De印Face-子集3中移去卷積層(例如,C3)和多個(gè)局部連接的 層(例如,L4和L5)。用4.4M面部訓(xùn)練DNN。在幾個(gè)時(shí)期之后分類錯(cuò)誤停止減少并且保持在高 于深度網(wǎng)絡(luò)De印Face-4 ·4Μ的水平的水平處。
[0092]圖8Α和表2示出了與LFW數(shù)據(jù)集的其他方法相比一些實(shí)施方式的接收器作業(yè)特性 ("尺0(:")曲線和驗(yàn)證準(zhǔn)確性。曲線802、804、806、808、810、812、和814分別對(duì)應(yīng)于人類驗(yàn)證, 使用全體驗(yàn)證的實(shí)施方式(例如,DeepFace-全體),包括從SFC數(shù)據(jù)集上的3D對(duì)準(zhǔn)的面部中 的原始的RGB像素中獲悉的DNN的實(shí)施方式(例如,Deepface-單體),TL聯(lián)合Bayesian、高維 1^卩、1'〇111對(duì)?6七6、以及合并聯(lián)合1^5^81311。〇66口€306-全體合并通過(guò)將不同類型的輸入饋送 至包含3D對(duì)準(zhǔn)的RGB輸入的DNN而訓(xùn)練的多個(gè)網(wǎng)絡(luò)的距離、灰度水平的圖像加上圖像梯度量 級(jí)和方向、以及2D對(duì)準(zhǔn)的RGB圖像。使用非線性SVM(且C = 1)和功率CDF-內(nèi)核的簡(jiǎn)單總和合 足巨 1? : Kc〇mbined : - Ksingle+Kgradient+Kalign2d,中1^(叉,}〇: - _| |x_y| 丨2〇
[0095] 表 2
[0096] 接下來(lái)是無(wú)監(jiān)督的協(xié)議以直接比較一對(duì)標(biāo)準(zhǔn)化特征的內(nèi)積。對(duì)于SVM訓(xùn)練,受限制 的協(xié)議每次分割使用5400對(duì)標(biāo)記。不受限制的協(xié)議為操作者提供有關(guān)訓(xùn)練集中的標(biāo)識(shí)的資 料,因此使得產(chǎn)生了更多要被增加給訓(xùn)練集的訓(xùn)練對(duì)。如在圖8A和表2中示出的,本文中描 述的實(shí)施方式提出其他方法以及在面部驗(yàn)證上接近人的工作效率的途徑。
[0097]圖8B和表3示出了與YTF數(shù)據(jù)集的其他方法相比一些實(shí)施方式的接收器作業(yè)特性 ("如〇曲線和驗(yàn)證準(zhǔn)確性。曲線852、854、856、858、860、862分別對(duì)應(yīng)于包括從3?(:數(shù)據(jù)集 (例如,Deepface-單體)上3D對(duì)準(zhǔn)的面部中的原始RGB像素獲悉的DNN、VS0F+0SS、STFRD+ PMML、APEM+FUSION、MBGS(平均值)LBP、以及MBGS(平均值)FPLBP的實(shí)施方式。
[0099] 表 4
[0100] YouTube?視頻幀的圖像質(zhì)量通常劣于網(wǎng)絡(luò)照片的圖像質(zhì)量,主要是由于運(yùn)動(dòng)模 糊或者視矩。對(duì)于每對(duì)訓(xùn)練視頻,通過(guò)從每個(gè)視頻中采用一個(gè)創(chuàng)建五十(50)對(duì)幀并且根據(jù) 視頻訓(xùn)練對(duì)將這些標(biāo)記為相同的或不相同的。獲悉加權(quán)x2模型。給出測(cè)試對(duì),通過(guò)從每個(gè)視 頻取一個(gè)樣本對(duì)一百個(gè)(100)隨機(jī)對(duì)的幀進(jìn)行采樣,并且使用已獲悉加權(quán)相似度的平均值。
[0101] 如示出的,本文描述的實(shí)施方式提供91.4%的準(zhǔn)確性,這使先前最好的方法的誤 差減少50%以上。在校正YTF數(shù)據(jù)集中的視頻對(duì)的100錯(cuò)誤的標(biāo)記之后,準(zhǔn)確性可以提高至 92.5%〇
[0102] 社交網(wǎng)絡(luò)系統(tǒng)-示例性實(shí)施方式
[0103] 圖9示出了根據(jù)本公開(kāi)實(shí)施方式在各種實(shí)施方式中可用于提高視頻編碼的示例性 系統(tǒng)900的網(wǎng)絡(luò)圖。系統(tǒng)900包括一個(gè)或多個(gè)用戶設(shè)備910、一個(gè)或多個(gè)外部系統(tǒng)920、社交網(wǎng) 絡(luò)系統(tǒng)930以及網(wǎng)絡(luò)950。在實(shí)施方式中,結(jié)合上面描述的實(shí)施方式討論的社交網(wǎng)絡(luò)服務(wù)、運(yùn) 營(yíng)商、和/或系統(tǒng)可以實(shí)現(xiàn)為社交網(wǎng)絡(luò)系統(tǒng)930。為了說(shuō)明的目的,由圖9顯示的系統(tǒng)900的實(shí) 施方式包括單個(gè)外部系統(tǒng)920和單個(gè)用戶設(shè)備910。然而,在其他實(shí)施方式中,系統(tǒng)900可以 包括更多的用戶設(shè)備910和/或更多的外部系統(tǒng)920。在某些實(shí)施方式中,社交網(wǎng)絡(luò)系統(tǒng)930 由社交網(wǎng)絡(luò)運(yùn)營(yíng)商操作,而外部系統(tǒng)920與社交網(wǎng)絡(luò)系統(tǒng)930分開(kāi),這是因?yàn)檫@些系統(tǒng)可以 由不同的實(shí)體操作。然而,在各種實(shí)施方式中,社交網(wǎng)絡(luò)系統(tǒng)930和外部系統(tǒng)920結(jié)合操作, 以將社交網(wǎng)絡(luò)服務(wù)提供給社交網(wǎng)絡(luò)系統(tǒng)930的用戶(或成員)。在這個(gè)意義上,社交網(wǎng)絡(luò)系統(tǒng) 930提供平臺(tái)或骨干,其他系統(tǒng)(例如,外部系統(tǒng)920)可以使用該平臺(tái)或骨干來(lái)通過(guò)互聯(lián)網(wǎng) 將社交網(wǎng)絡(luò)服務(wù)和功能提供給用戶。
[0104] 用戶設(shè)備910包括一個(gè)或多個(gè)計(jì)算設(shè)備,其可以從用戶接收輸入并且通過(guò)網(wǎng)絡(luò)950 發(fā)送和接收數(shù)據(jù)。在一個(gè)實(shí)施方式中,用戶設(shè)備910是傳統(tǒng)的計(jì)算機(jī)系統(tǒng),例如,執(zhí)行 Microsoft Windows兼容操作系統(tǒng)(0S)、Apple OS X和/或Linux分布。在另一個(gè)實(shí)施方式 中,用戶設(shè)備910可以是具有計(jì)算機(jī)功能的設(shè)備,例如,智能電話、平板電腦、個(gè)人數(shù)字助理 (roA)、移動(dòng)電話等。用戶設(shè)備910被配置為通過(guò)網(wǎng)絡(luò)950進(jìn)行通信。用戶設(shè)備910可以執(zhí)行應(yīng) 用,例如,允許用戶設(shè)備910的用戶與社交網(wǎng)絡(luò)系統(tǒng)930交互的瀏覽器應(yīng)用。在另一個(gè)實(shí)施方 式中,用戶設(shè)備910通過(guò)由用戶設(shè)備910的本地操作系統(tǒng)(例如,i0S和ANDROID)提供的應(yīng)用 編程接口(API)與社交網(wǎng)絡(luò)系統(tǒng)930交互。用戶設(shè)備910被配置為使用有線和/或無(wú)線通信系 統(tǒng)通過(guò)可以包括局域網(wǎng)和/或廣域網(wǎng)的任何組合的網(wǎng)絡(luò)950與外部系統(tǒng)920和社交網(wǎng)絡(luò)系統(tǒng) 930通信。
[0105]在一個(gè)實(shí)施方式中,網(wǎng)絡(luò)950使用標(biāo)準(zhǔn)的通信技術(shù)和協(xié)議。因此,網(wǎng)絡(luò)950可以包括 使用諸如以太網(wǎng)、702.11、全球微波接入互操作性(1丨嫩乂)、36、46丄0嫩、631、1^、數(shù)字用戶 線路(DSL)等技術(shù)的鏈路。類似地,網(wǎng)絡(luò)950上使用的網(wǎng)絡(luò)協(xié)議可包括多協(xié)議標(biāo)簽交換 (MPLS)、傳遞控制協(xié)議/互聯(lián)網(wǎng)協(xié)議(TCP/IP)、用戶數(shù)據(jù)報(bào)協(xié)議(UDP)、超文本傳遞協(xié)議 (HTTP)、簡(jiǎn)易郵件傳遞協(xié)議(SMTP)和文件傳遞協(xié)議(FTP)等等??梢允褂冒ǔ谋緲?biāo)記語(yǔ) 言(HTML)和可擴(kuò)展標(biāo)記語(yǔ)言(XML)的技術(shù)和/或格式表示通過(guò)網(wǎng)絡(luò)950交換的數(shù)據(jù)。此外,可 以使用諸如安全套接層(SSL)、傳遞層安全(TLS)以及互聯(lián)網(wǎng)協(xié)議安全(IPsec)等傳統(tǒng)的加 密技術(shù)來(lái)將所有或一些鏈路加密。
[0106] 在一個(gè)實(shí)施方式中,通過(guò)使用瀏覽器應(yīng)用912,處理從外部系統(tǒng)920中以及從社交 網(wǎng)絡(luò)系統(tǒng)930中接收的標(biāo)記語(yǔ)言文檔914,用戶設(shè)備910可以顯示外部系統(tǒng)920和/或社交網(wǎng) 絡(luò)系統(tǒng)930的內(nèi)容。標(biāo)記語(yǔ)言文檔914識(shí)別內(nèi)容和一個(gè)或多個(gè)描述該內(nèi)容的格式或呈現(xiàn)的指 令。通過(guò)執(zhí)行包含在標(biāo)記語(yǔ)言文檔914內(nèi)的指令,瀏覽器應(yīng)用912使用由標(biāo)記語(yǔ)言文檔914描 述的格式或呈現(xiàn)來(lái)顯示識(shí)別的內(nèi)容。例如,標(biāo)記語(yǔ)言文檔914包括指令,用于產(chǎn)生和顯示具 有多個(gè)幀的網(wǎng)頁(yè),這些幀包括從外部系統(tǒng)920和社交網(wǎng)絡(luò)系統(tǒng)930中檢索的文本和/或圖像 數(shù)據(jù)。在各種實(shí)施方式中,標(biāo)記語(yǔ)言文檔914包括數(shù)據(jù)文件,其包括可擴(kuò)展標(biāo)記語(yǔ)言(XML)數(shù) 據(jù)、可擴(kuò)展超文本標(biāo)記語(yǔ)言(XHTML)數(shù)據(jù)或其他標(biāo)記語(yǔ)言數(shù)據(jù)。此外,標(biāo)記語(yǔ)言文檔914可以 包括JavaScript對(duì)象表示法(JS0N)數(shù)據(jù)、具有填充的JSON(JSONP)以及JavaScript數(shù)據(jù),以 便于在外部系統(tǒng)920與用戶設(shè)備910之間的數(shù)據(jù)交換。在用戶設(shè)備910上的瀏覽器應(yīng)用912可 以使用JavaScript編譯器來(lái)將標(biāo)記語(yǔ)言文檔914解碼。
[0107] 標(biāo)記語(yǔ)言文檔914還可以包括或者連接至應(yīng)用或應(yīng)用框架,例如,F(xiàn)LASH?或 Unity?應(yīng)用程序、SilverLight?應(yīng)用程序框架等。
[0108] 在一個(gè)實(shí)施方式中,用戶設(shè)備910還包括一個(gè)或多個(gè)cookie 916,其包括數(shù)據(jù),表 示用戶設(shè)備910的用戶是否登錄到社交網(wǎng)絡(luò)系統(tǒng)930,該小程序能夠修改從社交網(wǎng)絡(luò)系統(tǒng) 930傳送給用戶設(shè)備910的數(shù)據(jù)。
[0109] 外部系統(tǒng)920包括一個(gè)或多個(gè)網(wǎng)絡(luò)服務(wù)器,其包括使用網(wǎng)絡(luò)950傳送給用戶設(shè)備 910的一個(gè)或多個(gè)網(wǎng)頁(yè)922a、922b。外部系統(tǒng)920與社交網(wǎng)絡(luò)系統(tǒng)930分開(kāi)。例如,外部系統(tǒng) 920與第一域相關(guān)聯(lián),而社交網(wǎng)絡(luò)系統(tǒng)930與單獨(dú)的社交網(wǎng)絡(luò)域相關(guān)聯(lián)。包含在外部系統(tǒng)920 內(nèi)的網(wǎng)頁(yè)922a、922b包括標(biāo)記語(yǔ)言文檔914,其識(shí)別內(nèi)容并且包括規(guī)定所識(shí)別的內(nèi)容的格式 或呈現(xiàn)的指令。
[0110] 社交網(wǎng)絡(luò)系統(tǒng)930包括用于社交網(wǎng)絡(luò)的一個(gè)或多個(gè)計(jì)算設(shè)備,社交網(wǎng)絡(luò)包括多個(gè) 用戶并且為社交網(wǎng)絡(luò)的用戶提供與社交網(wǎng)絡(luò)的其他用戶通信并交互的能力。在某些情況 下,社交網(wǎng)絡(luò)可以由圖譜表示,即,包括邊線和節(jié)點(diǎn)的數(shù)據(jù)結(jié)構(gòu)。其他數(shù)據(jù)結(jié)構(gòu)還可以用于 表示社交網(wǎng)絡(luò),包括但不限于數(shù)據(jù)庫(kù)、對(duì)象、類別、meta元素、文件或任何其他數(shù)據(jù)結(jié)構(gòu)。社 交網(wǎng)絡(luò)系統(tǒng)930可以由操作員執(zhí)行、管理或控制。社交網(wǎng)絡(luò)系統(tǒng)930的操作員可以是人類、自 動(dòng)化應(yīng)用或用于管理內(nèi)容、調(diào)節(jié)政策以及在社交網(wǎng)絡(luò)系統(tǒng)930內(nèi)收集使用度量的一系列應(yīng) 用??梢允褂萌魏晤愋偷牟僮鲉T。
[0111] 用戶可以加入社交網(wǎng)絡(luò)系統(tǒng)930然后添加與他們希望連接的任意數(shù)量的社交網(wǎng)絡(luò) 系統(tǒng)930的其他用戶的連接。如此處使用的,術(shù)語(yǔ)"好友"指社交網(wǎng)絡(luò)系統(tǒng)930中用戶經(jīng)由社 交網(wǎng)絡(luò)系統(tǒng)930與其形成連接、關(guān)聯(lián)、或者關(guān)系的任何其他用戶。例如,在實(shí)施方式中,如果 社交網(wǎng)絡(luò)系統(tǒng)930中的用戶表示為社交圖譜中的節(jié)點(diǎn),那么術(shù)語(yǔ)"好友"可以指兩個(gè)用戶節(jié) 點(diǎn)之間形成和直接連接兩個(gè)用戶節(jié)點(diǎn)的邊線。
[0112] 用戶可明確添加連接或者基于用戶的共同特征(例如,是同一所教育機(jī)構(gòu)的校友 的用戶)由社交網(wǎng)絡(luò)系統(tǒng)930可自動(dòng)創(chuàng)建連接。例如,第一用戶特別選擇特定的其他用戶作 為好友。社交網(wǎng)絡(luò)系統(tǒng)930中的連接通常是雙向的,但不必如此,因此,術(shù)語(yǔ)"用戶"和"好友" 取決于參照系。社交網(wǎng)絡(luò)系統(tǒng)930的用戶之間的連接通常是雙邊的("雙向的"),或者"相互 的",但連接同樣可以是單邊的,或者"單向的"。例如,如果Bob和Joe是社交網(wǎng)絡(luò)系統(tǒng)930的 兩個(gè)用戶并且連接至彼此,那么Bob和Joe是彼此的連接。如果,另一方面,Bob希望連接至 Joe以觀看由Joe傳送至社交網(wǎng)絡(luò)系統(tǒng)930的數(shù)據(jù),但是Joe不希望形成相互連接,所以可以 建立單邊連接。用戶之間的連接可以是直接連接;然而,社交網(wǎng)絡(luò)系統(tǒng)930的一些實(shí)施方式 允許通過(guò)一個(gè)或多個(gè)連接等級(jí)或分離程度的間接的連接。
[0113] 除了建立和保存用戶之間的連接并且允許用戶之間進(jìn)行交互之外,社交網(wǎng)絡(luò)系統(tǒng) 930向用戶提供作用于社交網(wǎng)絡(luò)系統(tǒng)930支持的各類項(xiàng)目的能力。這些項(xiàng)目可以包括社交網(wǎng) 絡(luò)系統(tǒng)930的用戶所屬的組群或網(wǎng)絡(luò)(即,人們的社交網(wǎng)絡(luò)、實(shí)體、以及概念)、用戶可能感興 趣的事件或者日歷條目、用戶可以經(jīng)由社交網(wǎng)絡(luò)系統(tǒng)930使用的基于計(jì)算機(jī)的應(yīng)用、允許用 戶經(jīng)由由或提供社交網(wǎng)絡(luò)系統(tǒng)930提供的服務(wù)購(gòu)買或者出售項(xiàng)目的交易、以及用戶可以對(duì) 社交網(wǎng)絡(luò)系統(tǒng)930執(zhí)行打開(kāi)或者關(guān)閉的與廣告的交互。這些僅是用戶可作用于社交網(wǎng)絡(luò)系 統(tǒng)930的項(xiàng)目的幾個(gè)實(shí)例,并且許多其他實(shí)例也是可能的。用戶可以與能夠在社交網(wǎng)絡(luò)系統(tǒng) 930內(nèi)或者在外部系統(tǒng)920內(nèi)表示的、與社交網(wǎng)絡(luò)系統(tǒng)930分開(kāi)的或者通過(guò)網(wǎng)絡(luò)950與社交網(wǎng) 絡(luò)系統(tǒng)930耦接的任何事物交互。
[0114] 社交網(wǎng)絡(luò)系統(tǒng)930還能夠鏈接各種實(shí)體。例如,社交網(wǎng)絡(luò)系統(tǒng)930能夠允許用戶通 過(guò)API、網(wǎng)絡(luò)服務(wù)或其他通信信道彼此以及與外部系統(tǒng)920或其他實(shí)體交互。社交網(wǎng)絡(luò)系統(tǒng) 930生成和維護(hù)"社交圖譜",包括由多個(gè)邊線互連的多個(gè)節(jié)點(diǎn)。在社交圖譜內(nèi)的每個(gè)節(jié)點(diǎn)可 以表示可以作用于另一個(gè)節(jié)點(diǎn)和/或可以由另一個(gè)節(jié)點(diǎn)作用的實(shí)體。社交圖譜可以包括各 種類型的節(jié)點(diǎn)。節(jié)點(diǎn)的類型的實(shí)例包括用戶、非個(gè)人實(shí)體、內(nèi)容項(xiàng)目、網(wǎng)頁(yè)、組群、活動(dòng)、消 息、概念、以及可以由社交網(wǎng)絡(luò)系統(tǒng)930中的對(duì)象表示的任何其他事情。在社交圖譜中的兩 個(gè)節(jié)點(diǎn)之間的邊線可以表示在這兩個(gè)節(jié)點(diǎn)之間的特定類型的連接或關(guān)聯(lián)性,這可以因節(jié)點(diǎn) 關(guān)系或者因由一個(gè)節(jié)點(diǎn)在另一個(gè)節(jié)點(diǎn)上進(jìn)行的活動(dòng)而產(chǎn)生。在某些情況下,在節(jié)點(diǎn)之間的 邊線可以加權(quán)。邊線的權(quán)重可以表示與邊線相關(guān)聯(lián)的屬性,例如,在節(jié)點(diǎn)之間的聯(lián)系或關(guān)聯(lián) 性的強(qiáng)度。不同類型邊線可以具有不同的權(quán)重。例如,可以給在一個(gè)用戶"點(diǎn)贊"另一個(gè)用戶 時(shí)創(chuàng)建的邊線提供一個(gè)權(quán)重,同時(shí)可以給在用戶與另一個(gè)用戶交好友時(shí)創(chuàng)建的邊線提供一 個(gè)不同的權(quán)重。
[0115] 舉例來(lái)說(shuō),當(dāng)?shù)谝挥脩魧⒌诙脩糇R(shí)別為好友時(shí),社交圖譜中生成將表示第一用 戶的節(jié)點(diǎn)與表示第二用戶的第二節(jié)點(diǎn)連接的邊線。由于各種節(jié)點(diǎn)彼此相關(guān)或交互,所以社 交網(wǎng)絡(luò)系統(tǒng)930修改連接各種節(jié)點(diǎn)的邊線以反映關(guān)系和互動(dòng)。
[0116] 社交網(wǎng)絡(luò)系統(tǒng)930還包括增強(qiáng)用戶與社交網(wǎng)絡(luò)系統(tǒng)930之間交互的用戶生成內(nèi)容。 用戶生成的內(nèi)容可以包括用戶可以增加、上傳、發(fā)送或"發(fā)布"到社交網(wǎng)絡(luò)系統(tǒng)930中的任何 事物。例如,用戶將帖子從用戶設(shè)備910傳送至社交網(wǎng)絡(luò)系統(tǒng)930。帖子可以包括數(shù)據(jù)(例如, 狀態(tài)更新或其他文本數(shù)據(jù))、位置信息、圖像(例如,照片)、視頻、鏈接、音樂(lè)或其他相似的數(shù) 據(jù)和/或媒體。第三方也可以將內(nèi)容添加至社交網(wǎng)絡(luò)系統(tǒng)930。內(nèi)容"項(xiàng)目"表示為在社交網(wǎng) 絡(luò)系統(tǒng)930中的對(duì)象。以這種方法,鼓勵(lì)社交網(wǎng)絡(luò)系統(tǒng)930的用戶通過(guò)各種通信信道發(fā)布文 本和各種類型的介質(zhì)的內(nèi)容項(xiàng)目,來(lái)彼此通信。這種通信增加了用戶彼此的交互,并且增加 了用戶與社交網(wǎng)絡(luò)系統(tǒng)930交互的頻率。
[0117] 網(wǎng)絡(luò)系統(tǒng)930包括網(wǎng)絡(luò)服務(wù)器932、API請(qǐng)求服務(wù)器934、用戶簡(jiǎn)檔存儲(chǔ)器936、連接 存儲(chǔ)器938、動(dòng)作記錄器940,、活動(dòng)日志942、以及授權(quán)服務(wù)器944。在本發(fā)明的實(shí)施方式中, 社交網(wǎng)絡(luò)系統(tǒng)930可以包括用于各種應(yīng)用的額外的、更少的、或不同的部件。未顯示其他部 件,例如,網(wǎng)絡(luò)接口、安全機(jī)構(gòu)、負(fù)載平衡器、故障切換服務(wù)器、管理和網(wǎng)絡(luò)操作控制臺(tái)等,以 便不掩蓋系統(tǒng)的細(xì)節(jié)。
[0118] 用戶簡(jiǎn)檔存儲(chǔ)器936維護(hù)關(guān)于用戶賬號(hào)的信息,包括傳記、人口或其他類型的描述 信息,例如,用戶聲明的或者社交網(wǎng)絡(luò)系統(tǒng)930推斷的工作經(jīng)歷、教育背景、愛(ài)好或偏好、位 置等。將該信息儲(chǔ)存在用戶簡(jiǎn)檔存儲(chǔ)器936內(nèi),以便唯一地識(shí)別每個(gè)用戶。社交網(wǎng)絡(luò)系統(tǒng)930 還在連接存儲(chǔ)器938中儲(chǔ)存描述在不同的用戶之間的一個(gè)或多個(gè)連接的數(shù)據(jù)。連接信息可 以表示具有相似的或共同的工作經(jīng)歷、組成員、愛(ài)好或?qū)W歷的用戶。此外,社交網(wǎng)絡(luò)系統(tǒng)930 包括在不同的用戶之間的用戶定義連接,允許用戶規(guī)定他們與其他用戶的關(guān)系。例如,用戶 定義連接允許用戶生成平行于用戶的現(xiàn)實(shí)生活關(guān)系的與諸如好友、同事、伙伴等其他用戶 的關(guān)系。用戶可從預(yù)定的連接類型中選擇,或者根據(jù)需要定義他們自己的連接類型。與社交 網(wǎng)絡(luò)系統(tǒng)930中諸如非個(gè)人實(shí)體、儲(chǔ)存區(qū)(bucket)、集群中心(cluster centers)、圖像、興 趣、頁(yè)面、外部系統(tǒng)、概念等的其他節(jié)點(diǎn)的連接也可存儲(chǔ)在連接存儲(chǔ)器938中。
[0119]社交網(wǎng)絡(luò)系統(tǒng)930維護(hù)關(guān)于用戶可以與之交互的對(duì)象的數(shù)據(jù)。為了維持該數(shù)據(jù),用 戶簡(jiǎn)檔存儲(chǔ)器936和連接存儲(chǔ)器938存儲(chǔ)通過(guò)社交網(wǎng)絡(luò)系統(tǒng)930維持的對(duì)應(yīng)類型對(duì)象的實(shí) 例。每個(gè)對(duì)象類型具有信息字段,其適合于儲(chǔ)存適合對(duì)象的類型的信息。例如,用戶簡(jiǎn)檔儲(chǔ) 存器936包括具有適合于描述用戶的賬號(hào)和與用戶的賬號(hào)相關(guān)的信息的字段的數(shù)據(jù)結(jié)構(gòu)。 在創(chuàng)建特定類型的新對(duì)象時(shí),社交網(wǎng)絡(luò)系統(tǒng)930初始化對(duì)應(yīng)的類型的新數(shù)據(jù)結(jié)構(gòu),將唯一對(duì) 象標(biāo)識(shí)符分配給該數(shù)據(jù)結(jié)構(gòu),并且根據(jù)需要,開(kāi)始將數(shù)據(jù)添加至對(duì)象。這種情況可能發(fā)生 在,例如,用戶變成社交網(wǎng)絡(luò)系統(tǒng)930的用戶時(shí),社交網(wǎng)絡(luò)系統(tǒng)930在用戶簡(jiǎn)檔存儲(chǔ)器936中 生成用戶簡(jiǎn)檔的新情況時(shí)、將唯一標(biāo)識(shí)符分配給用戶賬號(hào)時(shí)、以及開(kāi)始使用用戶提供的信 息來(lái)填充用戶賬號(hào)的字段時(shí)。
[0120]連接存儲(chǔ)器938包括適合于描述用戶到其他用戶的連接、到外部系統(tǒng)920的連接、 或者到其他實(shí)體的連接的數(shù)據(jù)結(jié)構(gòu)。連接存儲(chǔ)器938還可以使連接類型與用戶的連接相關(guān) 聯(lián),用戶的連接可以與用戶的隱私設(shè)置一起用于控制對(duì)關(guān)于用戶的信息的訪問(wèn)權(quán)。在本發(fā) 明的實(shí)施方式中,用戶簡(jiǎn)檔存儲(chǔ)器936和連接存儲(chǔ)器938可以實(shí)現(xiàn)為聯(lián)合數(shù)據(jù)庫(kù)。
[0121]存儲(chǔ)在連接存儲(chǔ)器938、用戶簡(jiǎn)檔存儲(chǔ)器936、以及活動(dòng)日志942中的數(shù)據(jù)能夠使社 交網(wǎng)絡(luò)系統(tǒng)930生成這樣一種社交圖譜,即,使用節(jié)點(diǎn)來(lái)確定各種對(duì)象并且使用連接節(jié)點(diǎn)的 邊線確定不同對(duì)象之間的關(guān)系。例如,如果在社交網(wǎng)絡(luò)系統(tǒng)930中第一用戶與第二用戶創(chuàng)建 連接,則來(lái)自用戶簡(jiǎn)檔存儲(chǔ)器936中的第一用戶和第二用戶的用戶賬號(hào)可用作社交圖譜中 的節(jié)點(diǎn)。連接存儲(chǔ)器938儲(chǔ)存的第一用戶與第二用戶之間的連接是在與第一用戶和第二用 戶相關(guān)聯(lián)的節(jié)點(diǎn)之間的邊線。繼續(xù)這個(gè)實(shí)例,然后,第二用戶然后可以在社交網(wǎng)絡(luò)系統(tǒng)930 內(nèi)給第一用戶發(fā)送消息。發(fā)送消息(可被存儲(chǔ))的動(dòng)作是社交圖譜中表示第一用戶與第二用 戶的兩個(gè)節(jié)點(diǎn)之間的另一邊線。此外,可以在社交圖內(nèi)識(shí)別和包含消息本身,作為連接至表 示第一用戶和第二用戶的節(jié)點(diǎn)的另一個(gè)節(jié)點(diǎn)。
[0122]在另一實(shí)例中,第一用戶可在由社交網(wǎng)絡(luò)系統(tǒng)930維護(hù)的圖像中(或者,可替換地, 在由社交網(wǎng)絡(luò)系統(tǒng)930外部的另一系統(tǒng)維護(hù)的圖像中)給第二用戶加標(biāo)簽。圖像本身可表示 為社交網(wǎng)絡(luò)系統(tǒng)930中的節(jié)點(diǎn)。該加標(biāo)簽動(dòng)作可在第一用戶與第二用戶之間創(chuàng)建邊線并且 在各個(gè)用戶與圖像之間創(chuàng)建邊線,該圖像也是社交圖譜中的節(jié)點(diǎn)。在又一實(shí)例中,如果用戶 確認(rèn)參加某事件,則用戶和該事件是從用戶簡(jiǎn)檔存儲(chǔ)器936中獲得的節(jié)點(diǎn),其中,對(duì)該事件 的參加是可從活動(dòng)日志942中檢索到的節(jié)點(diǎn)之間的邊線。通過(guò)生成并維護(hù)社交圖譜,社交網(wǎng) 絡(luò)系統(tǒng)930包括描述多種不同類型的對(duì)象以及這些對(duì)象之間的交互和連接的數(shù)據(jù),從而提 供社交相關(guān)信息的豐富來(lái)源。
[0123] 網(wǎng)絡(luò)服務(wù)器932經(jīng)由網(wǎng)絡(luò)950將社交網(wǎng)絡(luò)系統(tǒng)930鏈接至一個(gè)或者多個(gè)用戶設(shè)備 910和/或一個(gè)或者多個(gè)外部系統(tǒng)920。網(wǎng)絡(luò)服務(wù)器932為網(wǎng)頁(yè)以及其他網(wǎng)頁(yè)相關(guān)的內(nèi)容(例 如,Java、JavaScript、Flash、XML等)服務(wù)。網(wǎng)絡(luò)服務(wù)器932可包括用于接收和路由社交網(wǎng)絡(luò) 系統(tǒng)930與一個(gè)或者多個(gè)用戶設(shè)備910之間的消息的郵件服務(wù)器或者其他消息功能。這些消 息可以是即時(shí)消息、隊(duì)列消息(例如,電子郵件)、文本和SMS消息或任何其他合適的消息格 式。
[0124] API請(qǐng)求服務(wù)器934允許一個(gè)或者多個(gè)外部系統(tǒng)920和用戶設(shè)備910通過(guò)調(diào)用一個(gè) 或者多個(gè)API功能來(lái)訪問(wèn)來(lái)自社交網(wǎng)絡(luò)系統(tǒng)930中的信息。API請(qǐng)求服務(wù)器934還可以允許外 部系統(tǒng)920通過(guò)調(diào)用API來(lái)將信息發(fā)送至社交網(wǎng)絡(luò)系統(tǒng)930。在一個(gè)實(shí)施方式中,外部系統(tǒng) 920通過(guò)網(wǎng)絡(luò)950將API請(qǐng)求發(fā)送至社交網(wǎng)絡(luò)系統(tǒng)930,并且API請(qǐng)求服務(wù)器934接收API請(qǐng)求。 API請(qǐng)求服務(wù)器934通過(guò)調(diào)用與API請(qǐng)求相關(guān)聯(lián)的API處理請(qǐng)求以產(chǎn)生合適的響應(yīng),API請(qǐng)求 服務(wù)器934經(jīng)由網(wǎng)絡(luò)950將該合適的響應(yīng)傳送至外部系統(tǒng)920。例如,響應(yīng)于API請(qǐng)求,API請(qǐng) 求服務(wù)器934收集與用戶相關(guān)聯(lián)的數(shù)據(jù)(例如,登錄外部系統(tǒng)920內(nèi)的用戶連接),并且將收 集的數(shù)據(jù)傳送給外部系統(tǒng)920。在另一實(shí)施方式中,用戶設(shè)備910以與外部系統(tǒng)920相同的方 式通過(guò)API與社交網(wǎng)絡(luò)系統(tǒng)930進(jìn)行通信。
[0125] 動(dòng)作記錄器940能夠從網(wǎng)絡(luò)服務(wù)器932接收有關(guān)社交網(wǎng)絡(luò)系統(tǒng)930上和/或社交網(wǎng) 絡(luò)系統(tǒng)930外的用戶動(dòng)作的通信。動(dòng)作記錄器940利用有關(guān)有關(guān)用戶動(dòng)作的信息填充活動(dòng)日 志942,從而能夠使社交網(wǎng)絡(luò)系統(tǒng)930發(fā)現(xiàn)其用戶在社交網(wǎng)絡(luò)系統(tǒng)930中和在社交網(wǎng)絡(luò)系統(tǒng) 930之外所采取的各種動(dòng)作。特定用戶對(duì)社交網(wǎng)絡(luò)系統(tǒng)930中另一節(jié)點(diǎn)采取的任何動(dòng)作可以 通過(guò)在活動(dòng)日志942中或者相似數(shù)據(jù)庫(kù)中或者其他數(shù)據(jù)存儲(chǔ)庫(kù)中維護(hù)的信息而與每個(gè)用戶 的賬號(hào)相關(guān)聯(lián)。所識(shí)別并且儲(chǔ)存的用戶在社交網(wǎng)絡(luò)系統(tǒng)930內(nèi)采取的行動(dòng)的實(shí)例可以包括 例如增加與另一個(gè)用戶的連接,將消息發(fā)送給另一個(gè)用戶,從另一個(gè)用戶讀取消息,查看與 另一個(gè)用戶相關(guān)聯(lián)的內(nèi)容,參加另一個(gè)用戶發(fā)布的事件,發(fā)布圖像,嘗試發(fā)布圖像,或者與 另一個(gè)用戶或另一個(gè)對(duì)象交互的其他動(dòng)作。當(dāng)用戶在社交網(wǎng)絡(luò)系統(tǒng)930內(nèi)采取動(dòng)作時(shí),該動(dòng) 作被記錄在活動(dòng)日志942中。在一個(gè)實(shí)施方式中,社交網(wǎng)絡(luò)系統(tǒng)930將活動(dòng)日志942維護(hù)為條 目的數(shù)據(jù)庫(kù)。當(dāng)在社交網(wǎng)絡(luò)系統(tǒng)930內(nèi)采取動(dòng)作時(shí),將有關(guān)該動(dòng)作的條目添加至活動(dòng)日志 942。活動(dòng)日志942可以被稱為動(dòng)作日志。
[0126] 此外,用戶動(dòng)作可與社交網(wǎng)絡(luò)系統(tǒng)930之外的實(shí)體(諸如獨(dú)立于社交網(wǎng)絡(luò)系統(tǒng)930 的外部系統(tǒng)920)內(nèi)發(fā)生的概念和動(dòng)作相關(guān)聯(lián)。例如,活動(dòng)記錄器940可以從網(wǎng)絡(luò)服務(wù)器932 接收描述用戶與外部系統(tǒng)920的交互的數(shù)據(jù)。在該實(shí)例中,外部系統(tǒng)920根據(jù)社交圖譜中的 結(jié)構(gòu)化的動(dòng)作和對(duì)象報(bào)告用戶的交互。
[0127] 用戶與外部系統(tǒng)920交互的動(dòng)作的其他實(shí)例包括用戶表示對(duì)外部系統(tǒng)920或另一 實(shí)體感興趣,用戶將在外部系統(tǒng)920內(nèi)討論外部系統(tǒng)920或者網(wǎng)頁(yè)922a的評(píng)論發(fā)布至社交網(wǎng) 絡(luò)系統(tǒng)930,用戶將統(tǒng)一資源定位符(URL)或者與外部系統(tǒng)920相關(guān)聯(lián)的其他標(biāo)識(shí)符發(fā)布至 社交網(wǎng)絡(luò)系統(tǒng)930,用戶參加與外部系統(tǒng)920相關(guān)聯(lián)的事件,或者提供與外部系統(tǒng)920有關(guān)的 用戶進(jìn)行的任何其他動(dòng)作。因此,活動(dòng)日志942可包括描述社交網(wǎng)絡(luò)系統(tǒng)930的用戶與獨(dú)立 于社交網(wǎng)絡(luò)系統(tǒng)930的外部系統(tǒng)920之間的交互的動(dòng)作。
[0128] 授權(quán)服務(wù)器944強(qiáng)制執(zhí)行社交網(wǎng)絡(luò)系統(tǒng)930中用戶的一個(gè)或多個(gè)隱私設(shè)置。用戶的 隱私設(shè)置確定可以分享與用戶相關(guān)聯(lián)的特定信息的方式。隱私設(shè)置包括與用戶相關(guān)聯(lián)的特 定信息的規(guī)范以及可以分享信息的一個(gè)或多個(gè)實(shí)體的規(guī)范??膳c其分享信息的實(shí)體的實(shí)例 可包括其他用戶、應(yīng)用、外部系統(tǒng)920、或者可潛在訪問(wèn)該信息的任何實(shí)體。用戶可以分享的 信息包括用戶賬號(hào)信息(例如,簡(jiǎn)檔照片、與用戶相關(guān)聯(lián)的電話號(hào)碼、用戶的連接)、用戶采 取的動(dòng)作(例如,添加連接、改變用戶簡(jiǎn)檔信息)等。
[0129] 可以通過(guò)不同的粒度等級(jí)提供隱私設(shè)置規(guī)范。例如,隱私設(shè)置可以確定與其他用 戶共享的特定信息;隱私設(shè)置可以確定工作電話號(hào)碼或者相關(guān)信息的特定集合,諸如,包括 簡(jiǎn)檔照片、主頁(yè)電話號(hào)碼、以及狀態(tài)的個(gè)人信息。替換地,隱私設(shè)置可以適用于與用戶相關(guān) 聯(lián)的所有信息。還可以通過(guò)各種粒度等級(jí)規(guī)定可以訪問(wèn)特定信息的這組實(shí)體的規(guī)范??梢?分享信息的各種組的實(shí)體可以包括(例如)用戶的所有好友、好友的所有好友、所有應(yīng)用或 者所有外部系統(tǒng)920。一個(gè)實(shí)施方式允許這組實(shí)體的規(guī)范包括實(shí)體的枚舉。例如,用戶可提 供允許訪問(wèn)特定信息的外部系統(tǒng)920的列表。另一個(gè)實(shí)施方式允許規(guī)范包括一組實(shí)體以及 不允許訪問(wèn)信息的異常。例如,用戶可允許所有外部系統(tǒng)920訪問(wèn)用戶的工作信息,但是規(guī) 定不允許訪問(wèn)該工作信息的外部系統(tǒng)920的列表。某些實(shí)施方式將不被允許訪問(wèn)某些信息 的例外的列表稱為"黑名單"。阻止屬于由用戶規(guī)定的黑名單的外部系統(tǒng)920訪問(wèn)在隱私設(shè) 置中規(guī)定的信息。能夠具有信息的規(guī)范的粒度以及分享信息的實(shí)體的規(guī)范的粒度的各種組 合。例如,所有的個(gè)人信息可以與好友分享,而所有工作信息可以與好友的好友分享。
[0130] 授權(quán)服務(wù)器944包括邏輯以確定用戶的好友、外部系統(tǒng)920、和/或其他應(yīng)用和實(shí)體 是否能夠訪問(wèn)與用戶相關(guān)聯(lián)的某些信息。外部系統(tǒng)920需要授權(quán)服務(wù)器944的授權(quán)以訪問(wèn)用 戶的更多私人的和敏感的信息,諸如用戶的工作電話號(hào)碼。授權(quán)服務(wù)器944基于用戶的隱私 設(shè)置來(lái)確定是否允許另一用戶、外部系統(tǒng)920、應(yīng)用、或另一實(shí)體訪問(wèn)與該用戶相關(guān)聯(lián)的信 息,包括有關(guān)用戶采取的動(dòng)作的信息。
[0131] 社交網(wǎng)絡(luò)系統(tǒng)930可包括面部表示模塊946。在一些實(shí)施方式中,面部表示傳遞模 塊946可實(shí)現(xiàn)為圖1的面部表示模塊102。根據(jù)本公開(kāi)的實(shí)施方式,面部表示傳遞模塊946可 被配置為通過(guò)采用深度神經(jīng)網(wǎng)絡(luò)對(duì)準(zhǔn)面部圖像、對(duì)面部圖像進(jìn)行分類、和/或驗(yàn)證面部圖 像。
[0132] 硬件實(shí)現(xiàn)方式
[0133] 前述處理和特征可以由很多機(jī)器和計(jì)算機(jī)系統(tǒng)架構(gòu)并且在很多網(wǎng)絡(luò)和計(jì)算環(huán)境 中實(shí)現(xiàn)。圖10示出了根據(jù)本發(fā)明的實(shí)施方式的可用于實(shí)現(xiàn)在本文中描述的一個(gè)或多個(gè)實(shí)施 方式的計(jì)算機(jī)系統(tǒng)1000的實(shí)例。計(jì)算機(jī)系統(tǒng)1000包括使得計(jì)算機(jī)系統(tǒng)1000執(zhí)行本文中討論 的過(guò)程和特征的一系列指令。計(jì)算機(jī)系統(tǒng)1000可以連接(例如,聯(lián)網(wǎng))至其他機(jī)器。在網(wǎng)絡(luò)部 署中,計(jì)算機(jī)系統(tǒng)1000可運(yùn)行在服務(wù)器-客戶端網(wǎng)絡(luò)環(huán)境中的服務(wù)器機(jī)器或客戶端機(jī)器的 能力范圍內(nèi),或作為對(duì)等機(jī)器運(yùn)行在對(duì)等(或分布式)網(wǎng)絡(luò)環(huán)境中。在本發(fā)明的實(shí)施方式中, 計(jì)算機(jī)系統(tǒng)1000可以是社交網(wǎng)絡(luò)系統(tǒng)1030、用戶設(shè)備910、以及外部系統(tǒng)1020、或者它的部 件。在本發(fā)明的實(shí)施方式中,計(jì)算機(jī)系統(tǒng)1000可以是在構(gòu)成所有或一部分社交網(wǎng)絡(luò)系統(tǒng) 1030的多個(gè)服務(wù)器中的一個(gè)服務(wù)器。
[0134] 計(jì)算機(jī)系統(tǒng)1000包括處理器1002、緩存1004以及一個(gè)或多個(gè)可執(zhí)行的模塊和驅(qū)動(dòng) 器,其儲(chǔ)存在計(jì)算機(jī)可讀介質(zhì)上,針對(duì)在本文中描述的過(guò)程和特征。此外,計(jì)算機(jī)系統(tǒng)1000 包括高性能輸入/輸出(I/O)總線1006和標(biāo)準(zhǔn)I/O總線1008。主橋1010使處理器1002與高性 能I/O總線1006耦接,而I/O總線橋1012使這兩個(gè)總線1006和1008彼此耦接。系統(tǒng)存儲(chǔ)器 1014和一個(gè)或多個(gè)網(wǎng)絡(luò)接口 1016耦接至高性能I/O總線1006。計(jì)算機(jī)系統(tǒng)1000可進(jìn)一步包 括視頻存儲(chǔ)器和耦接至視頻存儲(chǔ)器(未示出)的顯示設(shè)備。大容量存儲(chǔ)器1018和I/O端口 1020耦接到標(biāo)準(zhǔn)I/O總線1008。計(jì)算機(jī)系統(tǒng)1000可以可選地包括鍵盤和點(diǎn)控設(shè)備、顯示設(shè) 備、或耦接至標(biāo)準(zhǔn)I/O總線1008的其他輸入/輸出設(shè)備(未顯示)。這些部件共同旨在表示廣 泛類別的計(jì)算機(jī)硬件系統(tǒng),包括但不限于基于由位于加利福尼亞圣克拉拉的Intel公司制 造的x86兼容的處理器以及由位于加利福尼亞Sunnyvale的Advanced Micro Devices (AMD) 公司制造的x86兼容的處理器以及任何其他合適的處理器的計(jì)算機(jī)系統(tǒng)。
[0135] 操作系統(tǒng)管理和控制計(jì)算機(jī)系統(tǒng)1000的操作,包括至軟件應(yīng)用的數(shù)據(jù)的輸入和來(lái) 自軟件應(yīng)用的數(shù)據(jù)的輸出(未示出)。操作系統(tǒng)提供在系統(tǒng)上執(zhí)行的軟件應(yīng)用與系統(tǒng)的硬件 組件之間提供接口??梢允褂萌我夂线m的操作系統(tǒng),諸如,可從加利福利亞的Cupertino的 蘋果計(jì)算機(jī)公司獲得的LIN U X操作系統(tǒng)、蘋果麥金塔計(jì)算機(jī)操作系統(tǒng)、U NIX操作系統(tǒng)、 MicT〇soft?Windows?操作系統(tǒng)、BSD操作系統(tǒng)等。能夠具有其他實(shí)現(xiàn)方式。
[0136] 下面將更為詳細(xì)地描述計(jì)算機(jī)系統(tǒng)1000的元件。具體地,網(wǎng)絡(luò)接口 1016提供計(jì)算 機(jī)系統(tǒng)1000和任何大范圍網(wǎng)絡(luò)之間的通信,如以太網(wǎng)(例如,IEEE 802.3)網(wǎng)絡(luò)、底板 (backplane)等。大容量存儲(chǔ)器1018提供執(zhí)行以上確定的各個(gè)計(jì)算系統(tǒng)實(shí)現(xiàn)的上述過(guò)程和 特征的數(shù)據(jù)和編程指令的永久存儲(chǔ)器,而系統(tǒng)存儲(chǔ)器1014(例如,DRAM)提供當(dāng)由處理器 1002執(zhí)行時(shí)的數(shù)據(jù)和編程指令的臨時(shí)存儲(chǔ)器。I/O端口 1020可以是提供可以耦接至計(jì)算機(jī) 系統(tǒng)1000的另外的外圍設(shè)備之間的通信的一個(gè)或多個(gè)串行和/或并行通信端口。
[0137] 計(jì)算機(jī)系統(tǒng)1000可以包括各種系統(tǒng)架構(gòu),并且可以重新布置計(jì)算機(jī)系統(tǒng)1000的各 種部件。例如,緩存1004可以與處理器1002-起在芯片上。可替換地,緩存1004和處理器 1002可以包裝在一起作為"處理器模塊",處理器1002稱為"處理器核心"。此外,本發(fā)明的某 些實(shí)施方式不需要也不包括所有以上部件。例如,耦接至標(biāo)準(zhǔn)I/O總線1008的外圍設(shè)備可耦 接至高性能I/O總線1006。此外,在一些實(shí)施方式中,可以僅存在單個(gè)總線,計(jì)算機(jī)系統(tǒng)1000 的部件耦接至單個(gè)總線。而且,計(jì)算機(jī)系統(tǒng)1000可包括諸如額外處理器、存儲(chǔ)設(shè)備、或存儲(chǔ) 器的額外部件。
[0138] 通常,本文中描述的過(guò)程和特征可以實(shí)現(xiàn)為操作系統(tǒng)或具體應(yīng)用程序的部分、部 件、程序、對(duì)象、模塊、或稱為"程序"的一系列指令。例如,一個(gè)或多個(gè)程序可以用于執(zhí)行在 本文中描述的特定處理。通常,程序包括計(jì)算機(jī)系統(tǒng)1000中的各個(gè)存儲(chǔ)器和存儲(chǔ)設(shè)備中的 一個(gè)或者多個(gè)指令,該一個(gè)或者多個(gè)指令在由一個(gè)或者多個(gè)處理器讀取或者執(zhí)行時(shí),使得 計(jì)算機(jī)系統(tǒng)1000進(jìn)行操作以執(zhí)行此處所描述的過(guò)程和特征。在本文中描述的處理和特征可 以在軟件、固件、硬件(例如,專用集成電路)或其任何組合中實(shí)現(xiàn)。
[0139] 在一種實(shí)施方式中,此處所描述的過(guò)程和特征被計(jì)算機(jī)系統(tǒng)1000實(shí)現(xiàn)為獨(dú)自或者 共同地在分布式計(jì)算環(huán)境中運(yùn)行的一系列可執(zhí)行模塊。前述模塊可以由硬件、儲(chǔ)存在計(jì)算 機(jī)可讀介質(zhì)(或機(jī)器可讀介質(zhì))上的可執(zhí)行模塊或這兩者的組合來(lái)實(shí)現(xiàn)。例如,模塊可以包 括由在硬件系統(tǒng)內(nèi)的處理器(例如,處理器1002)執(zhí)行的多個(gè)或一系列指令。最初,該系列指 令可被存儲(chǔ)在存儲(chǔ)設(shè)備上,諸如,大容量存儲(chǔ)器1018。然而,這系列指令可以儲(chǔ)存在任何合 適的計(jì)算機(jī)可讀儲(chǔ)存介質(zhì)上。而且,這系列指令不需要儲(chǔ)存在本地,可以通過(guò)網(wǎng)絡(luò)接口 1016 從遠(yuǎn)程儲(chǔ)存設(shè)備(例如,在網(wǎng)絡(luò)上的服務(wù)器)中接收。指令從諸如大容量存儲(chǔ)器1018等存儲(chǔ) 設(shè)備被復(fù)制到系統(tǒng)存儲(chǔ)器1014中然后被處理器1002訪問(wèn)和執(zhí)行。在各種實(shí)現(xiàn)方式中,一個(gè) 或多個(gè)模塊可以由在一個(gè)或多個(gè)位置中的一個(gè)處理器或多個(gè)處理器執(zhí)行,例如,在平行處 理環(huán)境中的多個(gè)服務(wù)器。
[0140] 計(jì)算機(jī)可讀介質(zhì)的實(shí)例包括但不限于可記錄類型的介質(zhì),諸如,易失性和非易失 性存儲(chǔ)器設(shè)備;固體存儲(chǔ)器;軟盤和其他活動(dòng)磁盤;硬盤驅(qū)動(dòng)器;磁性介質(zhì);光盤(例如,光盤 只讀存儲(chǔ)器(CD R0M)、數(shù)字多用途磁盤(DVD));其他類似的非暫時(shí)性(或暫時(shí)性)、有形的 (或者非有形的)存儲(chǔ)介質(zhì);或者任何類型的的介質(zhì),這些介質(zhì)適合于存儲(chǔ)、編碼或承載使計(jì) 算機(jī)系統(tǒng)1000執(zhí)行本文中公開(kāi)的任何一個(gè)或多個(gè)處理和特征的一系列指令。
[0141] 為了解釋的目的,陳述了多個(gè)具體細(xì)節(jié),以便提供說(shuō)明書的徹底理解。然而,對(duì)于 本領(lǐng)域的技術(shù)人員,顯然可以實(shí)踐本公開(kāi)的實(shí)施方式,無(wú)需這些具體細(xì)節(jié)。在某些情況下, 通過(guò)方框圖的形式顯示模塊、結(jié)構(gòu)、處理、特征以及裝置,以免說(shuō)明書晦澀難懂。在其他情況 下,功能方框圖和流程圖顯示為表示數(shù)據(jù)和邏輯流程。可以通過(guò)除了在本文中明確描述和 描繪的方式以外的方式不同地組合、分開(kāi)、去除、重新排列以及更換方框圖和流程圖的部件 (例如,模塊、方框、結(jié)構(gòu)、裝置、特征等)。
[0142] 在該說(shuō)明書中參考"一個(gè)實(shí)施方式"、"實(shí)施方式"、"其他實(shí)施方式"、"一系列實(shí)施 方式"、"一些實(shí)施方式"、"各種實(shí)施方式"等意味著與實(shí)施方式有關(guān)地描述的特定特征、設(shè) 計(jì)、結(jié)構(gòu)、或特性包括在本公開(kāi)的至少一個(gè)實(shí)施方式中。在說(shuō)明書中不同的地方出現(xiàn)的例如 短語(yǔ)"在一個(gè)實(shí)施方式中"或"在實(shí)施方式中"未必都指同一個(gè)實(shí)施方式,也不是指與其他實(shí) 施方式互相排除的分離的或可替代的實(shí)施方式。而且,無(wú)論是否明確引用"實(shí)施方式"等,都 描述了各種特征,這些特征可以不同地組合并且包含在一些實(shí)施方式中,但是還可以在其 他實(shí)施方式中不同地省略。相似地,描述的各個(gè)特征可以是一些實(shí)施方式而不是其他實(shí)施 方式的偏好或要求。
[0143] 本文中所使用的語(yǔ)言主要出于可讀性和指導(dǎo)的目的而選擇,并且選擇其不是為了 劃定或限制發(fā)明主題。因此,其目的在于,本發(fā)明的范圍不受到這個(gè)詳細(xì)描述的限制,而是 受到根據(jù)其在應(yīng)用程序上發(fā)行的任何權(quán)利要求的限制。因此,本發(fā)明的實(shí)施方式的公開(kāi)旨 在說(shuō)明而非限制在以下權(quán)利要求中陳述的本發(fā)明的范圍。
【主權(quán)項(xiàng)】
1. 一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括: a. 由計(jì)算系統(tǒng)從2D面部圖像生成3D對(duì)準(zhǔn)的面部圖像;以及 b. 由所述計(jì)算系統(tǒng)基于所述3D對(duì)準(zhǔn)的面部圖像至深度神經(jīng)網(wǎng)絡(luò)(DNN)的提供對(duì)所述2D 面部圖像的標(biāo)識(shí)進(jìn)行分類,所述2D面部圖像的所述標(biāo)識(shí)包括特征向量。2. 根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,從所述2D面部圖像生成所述3D對(duì)準(zhǔn) 的面部圖像包括: a. 檢測(cè)所述2D面部圖像的一組基準(zhǔn)點(diǎn);以及 b. 使用所述組基準(zhǔn)點(diǎn)將所述2D面部圖像扭曲成3D形狀。3. 根據(jù)權(quán)利要求2所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,將所述2D面部圖像扭曲成所述3D形 狀包括: a. 將一組錨點(diǎn)放置在所述3D形狀上,每個(gè)錨點(diǎn)對(duì)應(yīng)于所述2D面部圖像的所述組基準(zhǔn)點(diǎn) 中的基準(zhǔn)點(diǎn); b. 將所述2D面部圖像的所述組基準(zhǔn)點(diǎn)中的每個(gè)基準(zhǔn)點(diǎn)的位置背投至所述3D形狀; c .將所述2D面部圖像的所述組基準(zhǔn)點(diǎn)中的每個(gè)基準(zhǔn)點(diǎn)的位置投影至所述3D形狀的正 視圖;以及 d.基于所述組基準(zhǔn)點(diǎn)和所述組錨點(diǎn)將所述2D面部圖像變換成所述3D對(duì)準(zhǔn)的面部圖像。4. 根據(jù)權(quán)利要求3所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述2D面部圖像的所述組基準(zhǔn)點(diǎn)限 定一組三角形,并且將所述2D面部圖像變換成所述3D對(duì)準(zhǔn)的面部圖像包括執(zhí)行所述組三角 形中的每個(gè)三角形的仿射變換。5. 根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括: a. 通過(guò)檢測(cè)圖像的第二組基準(zhǔn)點(diǎn)識(shí)別所述圖像的面部部分; b. 通過(guò)基于所述第二組基準(zhǔn)點(diǎn)變換所述圖像的所述面部部分生成所述2D面部圖像; 優(yōu)選地,其中,生成所述2D面部圖像包括確定一組錨定位置,并且基于所述組錨定位置 扭曲所述圖像的所述面部部分。6. 根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述DNN包括一組層, 所述組層包括卷積池層、一組局部連接的層、以及一組完全連接的層。7. 根據(jù)權(quán)利要求6所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述卷積池層包括第一卷積層、最 大池層、以及第二卷積層,并且所述卷積池層被配置為提取所述3D對(duì)準(zhǔn)的面部圖像的一組 特征;和/或 其中,所述組局部連接的層中的每個(gè)局部連接的層被配置為提取所述3D對(duì)準(zhǔn)的面部圖 像的一組特征;和/或 其中,所述組完全連接的層中的每個(gè)完全連接的層被配置為確定所述3D對(duì)準(zhǔn)的面部圖 像的一組特征之間的相關(guān)性;和/或 其中,所述組完全連接的層中的完全連接的層的輸出是特征向量;和/或 其中,所述DNN被配置為基于所述特征向量對(duì)所述2D面部圖像進(jìn)行分類,所述特征向量 包括所述3D對(duì)準(zhǔn)的面部圖像的一組特征,該組特征中的每個(gè)特征標(biāo)準(zhǔn)化至預(yù)定范圍。8. 根據(jù)權(quán)利要求1至7中任一項(xiàng)所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述DNN被配置為針對(duì) 所述3D對(duì)準(zhǔn)的面部圖像的每一個(gè)像素限定一組濾波器。9. 根據(jù)權(quán)利要求8所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括訓(xùn)練所述DNN以用數(shù)據(jù)集限定 該組濾波器。10. 根據(jù)權(quán)利要求1至9中任一項(xiàng)所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括通過(guò)查詢圖像 存儲(chǔ)中的所述2D面部圖像的所述標(biāo)識(shí),識(shí)別所述2D面部圖像的個(gè)體,所述圖像存儲(chǔ)包括一 組面部圖像,所述組面部圖像中的每個(gè)面部圖像對(duì)應(yīng)于個(gè)體。11. 根據(jù)權(quán)利要求1至10中任一項(xiàng)所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括: a. 對(duì)第二2D面部圖像的第二標(biāo)識(shí)進(jìn)行分類;以及 b. 將所述標(biāo)識(shí)與所述第二標(biāo)識(shí)進(jìn)行比較以確定所述標(biāo)識(shí)和所述第二標(biāo)識(shí)是否對(duì)應(yīng)于 個(gè)體。12. 根據(jù)權(quán)利要求11所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,將所述標(biāo)識(shí)與所述第二標(biāo)識(shí)進(jìn)行 比較包括確定所述標(biāo)識(shí)與所述第二標(biāo)識(shí)之間的加權(quán)-X 2距離。13. 根據(jù)權(quán)利要求11或12所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述標(biāo)識(shí)包括第一組特征并 且所述第二標(biāo)識(shí)包括第二組特征,并且將所述標(biāo)識(shí)與所述第二標(biāo)識(shí)進(jìn)行比較包括: a. 確定所述第一組特征與所述第二組特征之間的一組特征差異;以及 b. 通過(guò)使用完全連接的層將所述組特征差異映射至預(yù)定值。14. 一種系統(tǒng),包括: 至少一個(gè)處理器;以及 存儲(chǔ)器,存儲(chǔ)指令,當(dāng)所述指令被所述至少一個(gè)處理器執(zhí)行時(shí),使所述系統(tǒng)執(zhí)行根據(jù)權(quán) 利要求1至13中任一項(xiàng)所述的方法,優(yōu)選地: a. 從2D面部圖像生成3D對(duì)準(zhǔn)的面部圖像;以及 b. 基于所述3D對(duì)準(zhǔn)的面部圖像至深度神經(jīng)網(wǎng)絡(luò)(DNN)的提供對(duì)所述2D面部圖像的標(biāo)識(shí) 進(jìn)行分類,所述2D面部圖像的所述標(biāo)識(shí)包括特征向量。15. -種包含指令的非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述指令被計(jì)算系統(tǒng)的至少一 個(gè)處理器執(zhí)行時(shí),使所述系統(tǒng)執(zhí)行根據(jù)權(quán)利要求1至13中任一項(xiàng)所述的方法,優(yōu)選地: a. 從2D面部圖像生成3D對(duì)準(zhǔn)的面部圖像;以及 b. 基于所述3D對(duì)準(zhǔn)的面部圖像至深度神經(jīng)網(wǎng)絡(luò)(DNN)的提供對(duì)所述2D面部圖像的標(biāo)識(shí) 進(jìn)行分類,所述2D面部圖像的所述標(biāo)識(shí)包括特征向量。16. -種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括: 通過(guò)計(jì)算系統(tǒng)從2D面部圖像生成3D對(duì)準(zhǔn)的面部圖像;以及通過(guò)所述計(jì)算系統(tǒng)基于所述 3D對(duì)準(zhǔn)的面部圖像至深度神經(jīng)網(wǎng)絡(luò)(DNN)的提供對(duì)所述2D面部圖像的標(biāo)識(shí)進(jìn)行分類,所述 2D面部圖像的所述標(biāo)識(shí)包括特征向量。17. 根據(jù)權(quán)利要求16所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,從所述2D面部圖像生成所述3D對(duì) 準(zhǔn)的面部圖像包括: 檢測(cè)所述2D面部圖像的一組基準(zhǔn)點(diǎn);以及 使用所述組基準(zhǔn)點(diǎn)將所述2D面部圖像扭曲成3D形狀。18. 根據(jù)權(quán)利要求17所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,將所述2D面部圖像扭曲成所述3D 形狀包括: 將一組錨點(diǎn)放置在所述3D形狀上,每個(gè)錨點(diǎn)對(duì)應(yīng)于所述2D面部圖像的所述組基準(zhǔn)點(diǎn)中 的基準(zhǔn)點(diǎn); 將所述2D面部圖像的所述組基準(zhǔn)點(diǎn)中的每個(gè)基準(zhǔn)點(diǎn)的位置背投至所述3D形狀; 將所述2D面部圖像的所述組基準(zhǔn)點(diǎn)中的每個(gè)基準(zhǔn)點(diǎn)的位置投影至所述3D形狀的正視 圖;以及 基于所述組基準(zhǔn)點(diǎn)和所述組錨點(diǎn)將所述2D面部圖像變換成所述3D對(duì)準(zhǔn)的面部圖像。19. 根據(jù)權(quán)利要求18所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述2D面部圖像的所述組基準(zhǔn)點(diǎn) 限定一組三角形,并且將所述2D面部圖像變換成所述3D對(duì)準(zhǔn)的面部圖像包括執(zhí)行所述組三 角形中的每個(gè)三角形的仿射變換。20. 根據(jù)權(quán)利要求16所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括: 通過(guò)檢測(cè)圖像的第二組基準(zhǔn)點(diǎn)識(shí)別所述圖像的面部部分; 通過(guò)基于所述第二組基準(zhǔn)點(diǎn)變換所述圖像的所述面部部分生成所述2D面部圖像。21. 根據(jù)權(quán)利要求20所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,生成所述2D面部圖像包括確定一 組錨定位置,并且基于所述組錨定位置扭曲所述圖像的所述面部部分。22. 根據(jù)權(quán)利要求16所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述DNN包括一組層,所述組層包 括卷積池層、一組局部連接的層、以及一組完全連接的層。23. 根據(jù)權(quán)利要求22所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述卷積池層包括第一卷積層、 最大池層、以及第二卷積層,并且所述卷積池層被配置為提取所述3D對(duì)準(zhǔn)的面部圖像的一 組特征。24. 根據(jù)權(quán)利要求22所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述組局部連接的層中的每個(gè)局 部連接的層被配置為提取所述3D對(duì)準(zhǔn)的面部圖像的一組特征。25. 根據(jù)權(quán)利要求22所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述組完全連接的層中的每個(gè)完 全連接的層被配置為確定所述3D對(duì)準(zhǔn)的面部圖像的一組特征之間的相關(guān)性。26. 根據(jù)權(quán)利要求22所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述組完全連接的層中的完全連 接的層的輸出是特征向量。27. 根據(jù)權(quán)利要求22所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述DNN被配置為基于所述特征 向量對(duì)所述2D面部圖像進(jìn)行分類,所述特征向量包括所述3D對(duì)準(zhǔn)的面部圖像的一組特征, 所述組特征中的每個(gè)特征標(biāo)準(zhǔn)化至預(yù)定范圍。28. 根據(jù)權(quán)利要求16所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述DNN被配置為針對(duì)所述3D對(duì) 準(zhǔn)的面部圖像的每一個(gè)像素限定一組濾波器。29. 根據(jù)權(quán)利要求28所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括訓(xùn)練所述DNN以用數(shù)據(jù)集限 定該組濾波器。30. 根據(jù)權(quán)利要求16所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括通過(guò)查詢圖像存儲(chǔ)中的所 述2D面部圖像的所述標(biāo)識(shí),識(shí)別所述2D面部圖像的個(gè)體,所述圖像存儲(chǔ)包括一組面部圖像, 所述組面部圖像中的每個(gè)面部圖像對(duì)應(yīng)于個(gè)體。31. 根據(jù)權(quán)利要求16所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括: 對(duì)第二2D面部圖像的第二標(biāo)識(shí)進(jìn)行分類;以及 將所述標(biāo)識(shí)與所述第二標(biāo)識(shí)進(jìn)行比較以確定所述標(biāo)識(shí)和所述第二標(biāo)識(shí)是否對(duì)應(yīng)于個(gè) 體。32. 根據(jù)權(quán)利要求31所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,將所述標(biāo)識(shí)與所述第二標(biāo)識(shí)進(jìn)行 比較包括確定所述標(biāo)識(shí)與所述第二標(biāo)識(shí)之間的加權(quán)距離-X 2。33. 根據(jù)權(quán)利要求31所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述標(biāo)識(shí)包括第一組特征并且所 述第二標(biāo)識(shí)包括第二組特征,并且將所述標(biāo)識(shí)與所述第二標(biāo)識(shí)進(jìn)行比較包括: 確定所述第一組特征與所述第二組特征之間的一組特征差異;以及 通過(guò)使用完全連接的層將所述組特征差異映射至預(yù)定值。34. 一種系統(tǒng),包括: 至少一個(gè)處理器;以及 存儲(chǔ)器,存儲(chǔ)指令,當(dāng)所述指令被所述至少一個(gè)處理器執(zhí)行時(shí),使得所述系統(tǒng)執(zhí)行: 從2D面部圖像生成3D對(duì)準(zhǔn)的面部圖像;以及 基于所述3D對(duì)準(zhǔn)的面部圖像至深度神經(jīng)網(wǎng)絡(luò)(DNN)的提供對(duì)所述2D面部圖像的標(biāo)識(shí)進(jìn) 行分類,所述2D面部圖像的所述標(biāo)識(shí)包括特征向量。35. -種包括指令的非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述指令在被計(jì)算系統(tǒng)的至少一 個(gè)處理器執(zhí)行時(shí),使得所述計(jì)算系統(tǒng)進(jìn)行: 從2D面部圖像生成3D對(duì)準(zhǔn)的面部圖像;以及 基于所述3D對(duì)準(zhǔn)的面部圖像至深度神經(jīng)網(wǎng)絡(luò)(DNN)的提供對(duì)所述2D面部圖像的標(biāo)識(shí)進(jìn) 行分類,所述2D面部圖像的所述標(biāo)識(shí)包括特征向量。
【文檔編號(hào)】G06T15/00GK105874474SQ201480072136
【公開(kāi)日】2016年8月17日
【申請(qǐng)日】2014年11月3日
【發(fā)明人】亞尼瓦·泰曼, 楊明, 馬克奧雷利奧·蘭扎托
【申請(qǐng)人】臉譜公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1