亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

識別對象的方法和設(shè)備以及訓(xùn)練識別器的方法和設(shè)備的制造方法_3

文檔序號:9866122閱讀:來源:國知局
點。 包括在第一卷積濾波層中的每個節(jié)點可接收從輸入圖像的8X8大小的區(qū)域過濾的值。修正 線性單元(ReLU)可被用作包括在第一卷積濾波層中的每個節(jié)點的激活模型。ReLU可針對低 于"0"的輸入輸出"0",并針對超過或等于"0"的輸入輸出線性比例值。
[0059] 在第一池化層中,可通過池化從64個濾波圖像提取代表值。例如,在第一池化層 中,當(dāng)針對每個濾波圖像將3 X 3大小的窗口滑動兩格時,該窗口內(nèi)的最大值可被提取。作為 池化的結(jié)果,可產(chǎn)生與濾波圖像相應(yīng)的64個池化圖像。第一池化層可包括包括在64個池化 圖像中的節(jié)點。包括在第一池化層中的每個節(jié)點可接收從相應(yīng)的濾波圖像的3X3大小的區(qū) 域池化的值。如上所述,可從第一卷積濾波層和第一池化層提取輸入圖像的最基本特征。
[0060] 在第二卷積濾波層中,卷積濾波可通過使用4X4大小的128個濾波器來執(zhí)行。運 128個濾波器中的每個可對預(yù)定的或者期望的邊緣進行濾波。當(dāng)與第一卷積濾波層的濾波 器相比時,第二卷積濾波層的濾波器可對相對復(fù)雜的邊緣進行濾波。作為卷積濾波的結(jié)果, 可從池化圖像產(chǎn)生128個濾波圖像。第二卷積濾波層可包括包括在所述128個濾波圖像中的 節(jié)點。包括在第二卷積濾波層中的每個節(jié)點可接收從相應(yīng)的池化圖像的4 X 4大小的區(qū)域過 濾的值。
[0061] 在第二池化層中,可通過池化從128個濾波圖像中提取代表值。例如,在第二池化 層中,當(dāng)針對每個濾波圖像按兩列滑動3 X 3大小的窗口時,該窗口中的最大值可被提取。作 為池化的結(jié)果,可產(chǎn)生與濾波圖像相應(yīng)的128個池化圖像。第二池化層可包括包括在128個 池化圖像中的節(jié)點。包括在第二池化層中的每個節(jié)點可接收從相應(yīng)的濾波圖像的3X3大小 的區(qū)域池化的值。如上所述,可從第二卷積濾波層和第二池化層提取輸入圖像的中復(fù)雜度 特征。
[0062] 在第Ξ卷積濾波層中,卷積濾波可通過使用3X3大小的196個濾波器來執(zhí)行。運 196個濾波器中的每個可對預(yù)定的或者期望的邊緣進行濾波。當(dāng)與第二卷積濾波層的濾波 器相比時,第Ξ卷積濾波層的濾波器可對相對復(fù)雜的邊緣進行濾波。作為卷積濾波的結(jié)果, 可從池化圖像產(chǎn)生196個濾波圖像。第Ξ卷積濾波層可包括包括在運196個濾波圖像中的節(jié) 點。包括在第Ξ卷積濾波層中的每個節(jié)點可接收從相應(yīng)的池化圖像的3 X 3大小的區(qū)域過濾 的值。
[0063] 在第Ξ池化層中,可通過池化從196個濾波圖像中提取代表值。例如,在第Ξ池化 層中,當(dāng)針對每個濾波圖像將3 X 3大小的窗口滑動兩格時,該窗口內(nèi)的平均值可被提取。作 為池化的結(jié)果,可產(chǎn)生與濾波圖像相應(yīng)的196個池化圖像。第Ξ池化層可包括包括在196個 池化圖像中的節(jié)點。包括在第Ξ池化層中的每個節(jié)點可接收從相應(yīng)的濾波圖像的3X3大小 的區(qū)域池化的值。如上所述,可從第Ξ卷積濾波層和第Ξ池化層提取輸入圖像的復(fù)雜特征。
[0064] 在卷積層510中,相鄰層之間的節(jié)點可部分連接,它們之間可共享連接權(quán)重。相反 地,在全連接層520中,相鄰層之間的節(jié)點可全部連接,并各自地設(shè)置連接權(quán)重。全連接層 520可對應(yīng)于識別器的元素特征輸出模塊,元素特征輸出模塊被配置為基于識別器的濾波 模塊的輸出來輸出與多個元素相應(yīng)的特征值。
[0065] 全連接層520可包括多個層,并且每個層可包括2048個節(jié)點。此外,一種模型正則 化算法"退出"(化opout)可被應(yīng)用于全連接層520。退出可表示用于從當(dāng)前訓(xùn)練期隨機放棄 預(yù)定的或者期望的比例的節(jié)點(例如,50%節(jié)點)的算法。
[0066] 損失層530可計算與多個元素相應(yīng)的損失。損失層530可對應(yīng)于識別器的線性分類 模塊,線性分類模塊被配置為基于識別器的元素特征輸出模塊的輸出識別多個元素。損失 層530可包括與多個元素相應(yīng)的多個線性分類器。損失層530可使用線性分類器從全連接層 520的輸出預(yù)測多個元素,并通過將預(yù)測的元素與實際元素進行比較來計算損失。
[0067] 可通過使用反向傳播將損失反向傳播至全連接層520和卷積層510?;诒环聪騻?播的損失,卷積層510和全連接層520內(nèi)的連接權(quán)重可被更新。參考圖5描述的層的配置、節(jié) 點的數(shù)量、濾波器的尺寸、激活模型W及相關(guān)算法僅作為用于更好地理解的示例被提供。根 據(jù)數(shù)據(jù)的類型和實現(xiàn)的目的可w對其做出各種修改。
[006引圖6示出根據(jù)至少一些示例實施例的多通道訓(xùn)練。參照圖6,訓(xùn)練器120可從臉部圖 像產(chǎn)生特征圖像。臉部圖像可W是從訓(xùn)練圖像提取的臉部區(qū)域的圖像。特征圖像可W是表 現(xiàn)臉部圖像的單個特征的圖像,例如,與顏色相關(guān)聯(lián)的紅、綠藍(RGB)圖像、與皮膚概率相關(guān) 聯(lián)的皮膚圖像、與輪廓相關(guān)聯(lián)的邊緣圖像。訓(xùn)練器120可通過從臉部圖像去除噪聲(例如,影 響顏色的光照成分)來產(chǎn)生RBG圖像。訓(xùn)練器120可通過計算包括在臉部圖像中的像素對應(yīng) 于皮膚的概率來產(chǎn)生皮膚圖像。訓(xùn)練器120可使用已知算法產(chǎn)生皮膚圖像。例如,訓(xùn)練器120 可使用用于產(chǎn)生皮膚圖像的確定性方法。確定性方法可通過使用針對來自輸入圖像的每個 通道的每個像素值的預(yù)定皮膚顏色范圍提取像素來檢測皮膚顏色。作為另一示例,訓(xùn)練器 120可使用用于產(chǎn)生皮膚圖像的概率方法。概率方法可基于皮膚排他概率產(chǎn)生概率皮膚模 型。概率皮膚模型被在線訓(xùn)練W分離出臉部的成分并從分離出的成分提取形狀上下文?;?于點之間的角度提取特征,W形成形狀上下文。根據(jù)至少一些示例實施例,當(dāng)使用概率皮膚 模型時訓(xùn)練器120的提取特征的特征提取能力即使在旋轉(zhuǎn)、縮放和變換的情況下仍然很強。
[0069] 訓(xùn)練器120可通過計算臉部圖像中的方向梯度大小產(chǎn)生邊緣圖像。
[0070] 根據(jù)至少一些示例實施例,除RGB圖像之外,或取代RGB圖像,訓(xùn)練器120可產(chǎn)生包 括例如YUV、YCb化和服V的其它類型的顏色通道圖像。
[0071] 訓(xùn)練器120可訓(xùn)練識別器130從特征圖像識別ID和屬性。訓(xùn)練器120可使用多個特 征圖像訓(xùn)練識別器130。所述多個特征圖像的類型可W是不同的,并且表現(xiàn)不同的特征。因 此,圖6的訓(xùn)練器120的操作可被稱為多通道訓(xùn)練。此外,訓(xùn)練器120可訓(xùn)練識別器130同時識 別多個元素。因此,圖6的訓(xùn)練器120的操作也可對應(yīng)于多任務(wù)訓(xùn)練。
[0072] 圖7示出根據(jù)至少一些示例實施例的多通道訓(xùn)練的原理。參照圖7,訓(xùn)練器120可從 臉部圖像710產(chǎn)生多個特征圖像720。訓(xùn)練器120可從多個特征圖像720提取每個圖像的特征 730。訓(xùn)練器120可將每個圖像的特征730輸入至到目前為止訓(xùn)練的識別器740中。
[0073] 識別器740可基于輸入值預(yù)測多個元素。識別器740可包括DC順。DC順可使用卷積 層、全連接層和損失層預(yù)測多個元素。訓(xùn)練器120可知道在臉部圖像710中標(biāo)記的實際元素。 因此,訓(xùn)練器120可計算通過識別器740預(yù)測的元素和實際元素之間的損失750。
[0074] 訓(xùn)練器120可使用反向傳播更新識別器740 W減少損失750。例如,當(dāng)損失750沿反 方向傳播時,訓(xùn)練器120可更新DCNN中的節(jié)點之間的連接權(quán)重W減少損失750。如上所述,訓(xùn) 練器120可基于與多個元素相應(yīng)的損失750訓(xùn)練識別器740。更新后的識別器760可用于下一 訓(xùn)練期,并且W上描述的多通道訓(xùn)練操作可被迭代地執(zhí)行,直至損失750少于預(yù)定的或者期 望的闊值。
[0075] 圖8示出根據(jù)至少一些示例實施例的用于多通道訓(xùn)練的DC順。參照圖8,根據(jù)至少 一些示例實施例的DO^N可學(xué)習(xí)多個通道作為單個統(tǒng)一架構(gòu)。例如,每個通道的特征圖像可 在卷積層810中被獨立學(xué)習(xí),并且可在全連接層820中被共同地連接和學(xué)習(xí)。通過前述,針對 具有不同特征的通道的卷積濾波器可在卷積層810中被分開學(xué)習(xí),并且分開學(xué)習(xí)的特征可 在全連接層820中被共同地連接和學(xué)習(xí),其中,在全連接層820中,流形特征空間(manifold fea1:ure space)被充分地展開(unfold)。
[0076] 圖8的結(jié)構(gòu)僅被提供作為示例。根據(jù)DO^N的結(jié)構(gòu)和識別的目標(biāo),多個通道彼此連接 的時間點可W改變,而不是被限制。
[0077]例如,參照圖9,多個通道可在多個單個DC順中被分別學(xué)習(xí),并且可由等式1執(zhí)行后 期融合。
[007引[等式1]
[0079]
[0080] 在等式1中,Μ表示DC順的數(shù)量,K表示與每個DC順的類的數(shù)量相應(yīng)的輸出節(jié)點的數(shù) 量,X表示輸入數(shù)據(jù),χΤ表示輸入數(shù)據(jù)X被轉(zhuǎn)置的數(shù)據(jù),y表示輸出數(shù)據(jù)。P(y = k|x)表示當(dāng)將 輸入數(shù)據(jù)X輸入時輸出數(shù)據(jù)y等于k的概率。此外,m表示單個DC順的索引,k表示相應(yīng)DC順的 類,wk表示到目前為止訓(xùn)練的DO^N的第k個類的權(quán)重。
[0081] 圖10示出根據(jù)至少一些示例實施例的多部件訓(xùn)練。參照圖10,訓(xùn)練器120可從臉部 圖像提取多個部件圖像。臉部圖像可W是從訓(xùn)練圖像提取的臉部區(qū)域的圖像。部件圖像可 W是表現(xiàn)臉部圖像中的單個組成元素的圖像,并可包括例如眼部圖像、鼻部圖像和嘴部圖 像。
[0082] 訓(xùn)練器120可訓(xùn)練識別器130識別臉部ID、臉部屬性、和來自臉部圖像的每個部件 圖像的屬性、W及部件圖像。臉部ID可W是用來標(biāo)識用戶的信息。臉部屬性可與每個部件圖 像的屬性不同。例如,臉部屬性可包括性別、年齡、種族、吸引力和面部表情。眼睛屬性可包 括眼睛形狀、眉毛形狀和眼睛顏色。鼻子屬性可包括鼻子形狀,下己/下頌屬性可包括下己/ 下頌形狀,嘴部屬性可包括嘴部形狀。頭發(fā)屬性可包括發(fā)色和發(fā)型。
[0083] 臉部屬性和每個部件圖像的屬性可在訓(xùn)練圖像中被一同標(biāo)記。
[0084] 訓(xùn)練器120可使用多個部件圖像訓(xùn)練識別器130。所述多個部件圖像可W是不同 的,表示不同的部件。因此,圖10的訓(xùn)練器120的操作可被稱為多部件訓(xùn)練。此外,訓(xùn)練器120 可訓(xùn)練識別器130同時識別多個元素。因此,圖10的訓(xùn)練器120的操作也可對應(yīng)于多任務(wù)訓(xùn) 練。多部件訓(xùn)練對應(yīng)于使用部件圖像的通道增強,并因此也可被廣義地看作是多通道訓(xùn)練。
[0085] 圖11示出根據(jù)至少一些示例實施例的用于多部件訓(xùn)練的DCNN。參照圖11,多個部 件可通過多個單個DC順分別學(xué)習(xí)。通過等式1可對多個部件的輸出執(zhí)行后期融合。當(dāng)在每個 單獨的DO^N中產(chǎn)生180維度的特征時,與其組合相應(yīng)的1440維度的特征可用于識別。
[0086] 圖12示出根據(jù)至少一些示例實施例的多部件訓(xùn)練和多通道訓(xùn)練的結(jié)合。參照圖 12,訓(xùn)練器120可從臉部圖像提取多個部件圖像。訓(xùn)練器120可從每個部件圖像W及臉部圖 像產(chǎn)生特征圖像。訓(xùn)練器120可訓(xùn)練識別器130從由每個部件圖像W及臉部圖像產(chǎn)生的特征 圖像識別臉部ID、臉部屬性和每個部件圖像的屬性。訓(xùn)練器120可通過使用多個部件訓(xùn)練識 別器來提供僅使用部件(例如,眼睛或鼻子)識別臉部ID的技術(shù)。
[0087] 在一個示例中,訓(xùn)練器120可通過隨機地控制包括在DO^N的每層中的節(jié)點的激活 模型在更多樣的環(huán)境中訓(xùn)練識別器130。節(jié)點的激活模型可W指基于輸入到該節(jié)點的值確 定從該節(jié)點輸出的值的模型。訓(xùn)練器120可使用隨機分段線性(PWL)激活模型來隨機控制 DO^N中的節(jié)點的激活模型。圖13示出根據(jù)至少一些示例實施例的PWL激活模型和一般確定 性PWL激活模型之間的比較。
[008引參照圖13,一般確定性PWL激活模型1310可由等式2表達。在確定性PWL激活模型 1310中,X軸表示輸入值,y軸表示輸出值。針對X軸的區(qū)分區(qū)域的輸出值可使用不同的線性 函數(shù)表達。
[0089] [等式 2]
[0090] hi(x)=maxj 印,k拓j
[0091] 其中,Zu = xTw...u+bij
[0092] 在等式帥,hi(x)表示在第退域的輸出函數(shù),k表示單個DC順的索引,W...1J和bij是 分段線性函數(shù)Z
當(dāng)前第3頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1