本發(fā)明涉及圖像處理,尤其涉及一種目標(biāo)檢測(cè)系統(tǒng)和方法。
背景技術(shù):
基于人工神經(jīng)網(wǎng)絡(luò),尤其是卷積神經(jīng)網(wǎng)絡(luò)(cnn,convolutionalneuralnetwork)的方法在很多應(yīng)用中都取得了極大的成功。在計(jì)算機(jī)視覺(jué)領(lǐng)域,特別是針對(duì)圖像分類和識(shí)別問(wèn)題,卷積神經(jīng)網(wǎng)絡(luò)(cnn)的引入使得圖像分類的精度大幅提高。
雖然cnn在一般的物體檢測(cè)中展現(xiàn)了強(qiáng)大的性能,但是對(duì)于例如行人檢測(cè)的特定目標(biāo)的檢測(cè)結(jié)果卻不甚理想。這主要由于深層卷積的神經(jīng)網(wǎng)絡(luò)最終輸入分類器的特征圖通常對(duì)于小物體而言分辨率較低,以及行人檢測(cè)通常是由背景帶來(lái)混淆(不同于一般物體檢測(cè)由于多種分類帶來(lái)的混淆),因此使用現(xiàn)有的cnn技術(shù)進(jìn)行行人檢測(cè)面臨著天然的缺陷。
另一方面,當(dāng)前效果較好的行人檢測(cè)器一般采用結(jié)合了傳統(tǒng)的手工設(shè)計(jì)特征和深度卷積特征的混合方法。由于特征需要手工設(shè)計(jì)并且需要深度卷積,因此現(xiàn)有的行人檢測(cè)方案也是耗費(fèi)人工并且計(jì)算效率不高。
鑒于例如行人檢測(cè)的特定目標(biāo)檢測(cè)應(yīng)用在諸如自動(dòng)駕駛和安防等領(lǐng)域內(nèi)的巨大應(yīng)用潛力,存在著對(duì)使用cnn實(shí)現(xiàn)的高精度且快速的目標(biāo)檢測(cè)系統(tǒng)的需要。
技術(shù)實(shí)現(xiàn)要素:
為了解決上述cnn針對(duì)特定目標(biāo)檢測(cè)結(jié)果不佳的問(wèn)題,本發(fā)明提出了一種卷積神經(jīng)網(wǎng)絡(luò)(cnn)結(jié)合隨機(jī)森林的目標(biāo)檢測(cè)方案,卷積神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林可以通過(guò)配合提高針對(duì)特定目標(biāo)的檢測(cè)任務(wù)的準(zhǔn)確率和召回率。可以將cnn對(duì)輸入圖像的處理結(jié)果作為特征輸入隨機(jī)森林,隨機(jī)森林進(jìn)一步處理上述特征,以單個(gè)固定形狀區(qū)域?yàn)閱挝唬A(yù)測(cè)此區(qū)域包含特定目標(biāo)的概率。
根據(jù)本發(fā)明的一個(gè)方面,提出了一種目標(biāo)檢測(cè)系統(tǒng),包括:特征計(jì)算模塊,采用人工神經(jīng)網(wǎng)絡(luò)計(jì)算輸入圖像的非線性特征,所述非線性特征包括至少一個(gè)一維向量,所述一維向量由針對(duì)所述輸入圖像的特定區(qū)域的多個(gè)通道特征組成;概率計(jì)算模塊,采用決策樹(shù)森林根據(jù)所述非線性特征計(jì)算所述特定區(qū)域包含目標(biāo)的概率,其中,所述決策樹(shù)森林直接使用到達(dá)決策樹(shù)葉節(jié)點(diǎn)的所述一維向量中的至少一個(gè)通道特征來(lái)獲取所述特定區(qū)域包含目標(biāo)的概率。
根據(jù)本發(fā)明的另一個(gè)方面,還提出了用于上述目標(biāo)檢測(cè)系統(tǒng)執(zhí)行的目標(biāo)檢測(cè)方法。
根據(jù)本發(fā)明的又一個(gè)方面,決策樹(shù)森林和人工神經(jīng)網(wǎng)絡(luò)的至少一部分可由數(shù)字電路實(shí)現(xiàn)。決策樹(shù)森林里的每一棵決策樹(shù)都是左右子樹(shù)深度相同或相近的決策樹(shù)。
附圖說(shuō)明
通過(guò)結(jié)合附圖對(duì)本公開(kāi)示例性實(shí)施方式進(jìn)行更詳細(xì)的描述,本公開(kāi)的上述以及其它目的、特征和優(yōu)勢(shì)將變得更加明顯,其中,在本公開(kāi)示例性實(shí)施方式中,相同的參考標(biāo)號(hào)通常代表相同部件。
圖1示出了神經(jīng)網(wǎng)絡(luò)中神經(jīng)元刺激累積的示意圖。
圖2示出了典型的cnn的示意圖。
圖3示出了典型的決策樹(shù)的示意圖。
圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)檢測(cè)系統(tǒng)的圖示。
圖5示出了概率計(jì)算模塊的一個(gè)實(shí)現(xiàn)例。
圖6示出了可用于實(shí)現(xiàn)本發(fā)明的目標(biāo)檢測(cè)系統(tǒng)的soc的一個(gè)例子。
圖7示出了本發(fā)明一個(gè)決策樹(shù)森林的例子。
圖8示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)檢測(cè)方法的圖示。
圖9示出了概率計(jì)算步驟的一個(gè)實(shí)現(xiàn)例。
具體實(shí)施方式
下面將參照附圖更詳細(xì)地描述本公開(kāi)的優(yōu)選實(shí)施方式。雖然附圖中顯示了本公開(kāi)的優(yōu)選實(shí)施方式,然而應(yīng)該理解,可以以各種形式實(shí)現(xiàn)本公開(kāi)而不應(yīng)被這里闡述的實(shí)施方式所限制。相反,提供這些實(shí)施方式是為了使本公開(kāi)更加透徹和完整,并且能夠?qū)⒈竟_(kāi)的范圍完整地傳達(dá)給本領(lǐng)域的技術(shù)人員。
本申請(qǐng)中,將主要以行人檢測(cè)為例來(lái)說(shuō)明本發(fā)明對(duì)特定目標(biāo)檢測(cè)的改進(jìn)。本申請(qǐng)的方案適用于各種人工神經(jīng)網(wǎng)絡(luò),包括深度神經(jīng)網(wǎng)絡(luò)(dnn)、循環(huán)神經(jīng)網(wǎng)絡(luò)(rnn)與卷積神經(jīng)網(wǎng)絡(luò)(cnn),其中尤其以非全連接且同層權(quán)重共享的cnn得到更為廣泛的應(yīng)用。
卷積神經(jīng)網(wǎng)絡(luò)的基本概念
人工神經(jīng)網(wǎng)絡(luò)是一種基于仿生設(shè)計(jì)的數(shù)學(xué)模型,其是由大量的簡(jiǎn)單處理單元(稱為神經(jīng)元)廣泛地互相連接而形成的復(fù)雜網(wǎng)絡(luò)系統(tǒng),近年來(lái)被廣泛應(yīng)用于圖像識(shí)別和語(yǔ)音識(shí)別等任務(wù)。
如圖1所示,神經(jīng)元積累的刺激是由其他神經(jīng)元傳遞過(guò)來(lái)的刺激量和對(duì)應(yīng)的權(quán)重之和,xj表示這種積累,yi表示某個(gè)神經(jīng)元傳遞過(guò)來(lái)的刺激量,wi表示鏈接某個(gè)神經(jīng)元刺激的權(quán)重,得到公式:
xj=(y1*w1)+(y2*w2)+...+(yi*wi)+...+(yn*wn)
而當(dāng)xj完成積累后,完成積累的神經(jīng)元本身對(duì)周圍的一些神經(jīng)元傳播刺激,將其表示為yj得到如下所示:
yj=f(xj)
神經(jīng)元根據(jù)積累后xj的結(jié)果進(jìn)行處理后,對(duì)外傳遞刺激yj。用f函數(shù)映射來(lái)表示這種處理,并可將它稱之為激活函數(shù)。
卷積神經(jīng)網(wǎng)絡(luò)(cnn)是一種特殊的深層的神經(jīng)網(wǎng)絡(luò)模型。它的神經(jīng)元間的連接是非全連接的,并且同一層中某些神經(jīng)元之間的連接的權(quán)重是共享的(即相同的)。它的非全連接和權(quán)值共享的網(wǎng)絡(luò)結(jié)構(gòu)使之更類似于生物神經(jīng)網(wǎng)絡(luò),降低了網(wǎng)絡(luò)模型的復(fù)雜度,減少了權(quán)值的數(shù)量。
如圖2所示,典型的cnn由一系列有序運(yùn)行的層組成。
cnn模型的參數(shù)被稱為“權(quán)重”。cnn的第一層讀取輸入圖像,并輸出一系列的特征圖(map)。下面的層讀取由上一層產(chǎn)生的特征圖,并輸出新的特征圖。最后一個(gè)分類器(classifier)輸出該輸入圖像可能屬于的每一類別的概率。conv層(卷積層)和fc層(全連接層)是cnn中兩種基本層類型。conv層后通常還接有池化層(poolinglayers)。
卷積層以一系列特征圖作為輸入,并以卷積內(nèi)核卷積獲得輸出特征圖。池化層通常與conv層相連,用于輸出每個(gè)特征圖中的每個(gè)分區(qū)的最大值或平均值,由此通過(guò)亞采樣降低計(jì)算量,同時(shí)保持某種程度的位移、尺度和形變不變性。一個(gè)cnn中可以包括卷積層和池化層之間的多個(gè)交替,由此逐步降低空間分辨率并增加特征映射的數(shù)量。隨后可以連接至至少一個(gè)全連接層,通過(guò)應(yīng)用于輸入特征向量上的線性變換,得到包括多個(gè)特征值的一維向量輸出。
在對(duì)任何任務(wù)使用cnn之前,應(yīng)該首先訓(xùn)練cnn數(shù)據(jù)集。在訓(xùn)練過(guò)程中,輸入訓(xùn)練數(shù)據(jù),使用bp算法(誤差反向傳播算法)根據(jù)得到的誤差函數(shù)反向調(diào)整cnn各層的權(quán)重,由此訓(xùn)練得到各層的權(quán)重參數(shù)。
雖然cnn在一般性的物體檢測(cè)中展現(xiàn)了強(qiáng)大的性能,但是對(duì)于某些特定目標(biāo)的檢測(cè)(例如,行人檢測(cè))卻不太成功。通過(guò)研究cnn在行人檢測(cè)中存在的問(wèn)題,發(fā)現(xiàn)其在單獨(dú)的行人檢測(cè)器中表現(xiàn)良好,但是隨后的分類器卻降低了該結(jié)果。這通常是由于如下兩點(diǎn)事實(shí):第一,對(duì)于一般性的物體檢測(cè),通常需要進(jìn)行的是多種分類的訓(xùn)練而行人檢測(cè)中,則是復(fù)雜的背景容易與行人混淆。第二,通常用于輸入cnn分類器的卷積特征圖對(duì)于小物體而言分辨率太低。因此,在本發(fā)明中,可以考慮使卷積深度較淺且分辨率更高的特征圖,并且使用更為靈活的隨機(jī)森林代替神經(jīng)網(wǎng)絡(luò)中最后的分類器,由此提升對(duì)特定目標(biāo)檢測(cè)的準(zhǔn)確率。
隨機(jī)森林的基本概念
隨機(jī)森林由許多的決策樹(shù)組成,因?yàn)檫@些決策樹(shù)的形成采用了隨機(jī)的方法,因此也叫做隨機(jī)決策樹(shù),隨機(jī)森林也可稱為決策樹(shù)森林。隨機(jī)森林中的樹(shù)之間是沒(méi)有關(guān)聯(lián)的。當(dāng)測(cè)試數(shù)據(jù)進(jìn)入隨機(jī)森林時(shí),其實(shí)就是讓每一顆決策樹(shù)進(jìn)行分類,最后取所有決策樹(shù)中分類結(jié)果最多的那類為最終的結(jié)果。因此隨機(jī)森林是一個(gè)包含多個(gè)決策樹(shù)的分類器,并且其輸出的類別是由個(gè)別樹(shù)輸出的類別的眾數(shù)而定。
決策樹(shù)是一種樹(shù)形結(jié)構(gòu),其中每個(gè)內(nèi)部節(jié)點(diǎn)表示一個(gè)屬性上的測(cè)試,每個(gè)分支代表一個(gè)測(cè)試輸出,每個(gè)葉節(jié)點(diǎn)代表一種類別。決策樹(shù)中每個(gè)非葉節(jié)點(diǎn)可以左右生長(zhǎng),并且根據(jù)具體實(shí)現(xiàn),各枝生長(zhǎng)的深度往往不同。圖3示出了一個(gè)決策樹(shù)的例子。如圖中箭頭所示,輸入的數(shù)據(jù)(input)根據(jù)每個(gè)途徑節(jié)點(diǎn)的屬性測(cè)試,最終被分類到一個(gè)具體的葉節(jié)點(diǎn)上。
在本發(fā)明的技術(shù)方案中,隨機(jī)森林可以執(zhí)行有效的誤判背景挖掘(例如,將易于混淆的背景與行人相區(qū)別)以及樣本的重新賦權(quán),由此結(jié)合從cnn輸出的卷積深度較淺且分辨率更高的特征圖,能夠得到相比于單獨(dú)cnn的改善的檢測(cè)結(jié)果,以及相比于現(xiàn)有混合方法的更快的計(jì)算速度。
結(jié)合cnn和隨機(jī)森林的目標(biāo)檢測(cè)方案
圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)檢測(cè)系統(tǒng)。該目標(biāo)檢測(cè)系統(tǒng)400包括特征計(jì)算模塊410和概率計(jì)算模塊420。
特征計(jì)算模塊410采用人工神經(jīng)網(wǎng)絡(luò)計(jì)算輸入圖像的非線性特征。由人工神經(jīng)網(wǎng)絡(luò),優(yōu)選為cnn輸出的非線性特征包括至少一個(gè)一維向量,所述一維向量由針對(duì)所述輸入圖像的特定區(qū)域的多個(gè)通道特征組成。
在一個(gè)實(shí)施例中,特征計(jì)算模塊410采用的神經(jīng)網(wǎng)絡(luò)可以使用更淺但分辨率更高的層來(lái)池化特征,并且可以使用hole算法來(lái)增加特征圖的尺寸。例如,特征計(jì)算模塊410可以輸出與輸入圖像內(nèi)疑似行人的區(qū)域個(gè)數(shù)相同個(gè)數(shù)的一維向量。每個(gè)一維向量都描述了針對(duì)一個(gè)特定區(qū)域(例如7x7區(qū)域)的多個(gè)特征,例如256個(gè)特征。
隨后,概率計(jì)算模塊420可以采用決策樹(shù)森林根據(jù)所述非線性特征計(jì)算所述特定區(qū)域包含目標(biāo)的概率。不同于現(xiàn)有技術(shù)中決策樹(shù)根據(jù)落在具體葉上進(jìn)行01編碼然后預(yù)測(cè),在本發(fā)明的檢測(cè)方案中,決策樹(shù)森林直接使用到達(dá)決策樹(shù)葉節(jié)點(diǎn)的一維向量中的至少一個(gè)通道特征來(lái)獲取所述特定區(qū)域包含目標(biāo)的概率。
圖5示出了概率計(jì)算模塊的一個(gè)具體實(shí)現(xiàn)。概率計(jì)算模塊520可以包括非葉節(jié)點(diǎn)計(jì)算模塊521、葉節(jié)點(diǎn)計(jì)算模塊522和森林匯總模塊523。
非葉節(jié)點(diǎn)計(jì)算模塊521可以根據(jù)當(dāng)前的決策樹(shù)非葉節(jié)點(diǎn)設(shè)置,讀取對(duì)應(yīng)的通道特征和節(jié)點(diǎn)閾值,根據(jù)通道特征和節(jié)點(diǎn)閾值的比較結(jié)果選擇要進(jìn)行計(jì)算的下一級(jí)節(jié)點(diǎn)。
在實(shí)際運(yùn)算中,非葉節(jié)點(diǎn)計(jì)算模塊521首先針對(duì)決策樹(shù)的首層節(jié)點(diǎn),讀取存儲(chǔ)的由在前訓(xùn)練得到的要讀入通道特征的位置索引以及特征閾值,隨后從cnn輸出的非線性特征中讀取與該位置索引相對(duì)應(yīng)的通道特征值并與特征閾值相比較,根據(jù)比較結(jié)果選擇要進(jìn)行計(jì)算的是左下還是右下的節(jié)點(diǎn)。非葉節(jié)點(diǎn)計(jì)算模塊521可以對(duì)各層的非葉節(jié)點(diǎn)執(zhí)行類似的操作,直到抵達(dá)葉節(jié)點(diǎn)為止。
葉節(jié)點(diǎn)計(jì)算模塊522可以根據(jù)葉節(jié)點(diǎn)參數(shù)和落入所述葉節(jié)點(diǎn)中的通道特征,計(jì)算該葉節(jié)點(diǎn)所在決策樹(shù)針對(duì)所述特定區(qū)域的樹(shù)輸出。森林匯總模塊523則根據(jù)獲取的每一個(gè)樹(shù)輸出計(jì)算所述特定區(qū)域包含目標(biāo)的概率。
在一個(gè)實(shí)施例中,葉節(jié)點(diǎn)參數(shù)包括回歸系數(shù)和偏置量。葉節(jié)點(diǎn)計(jì)算模塊522計(jì)算的樹(shù)輸出可以是回歸值。森林匯總模塊523則可以根據(jù)獲取的每一個(gè)回歸值累加得到特定區(qū)域包含目標(biāo)的概率,例如,是行人還是背景的概率。
在實(shí)際使用中,上述目標(biāo)檢測(cè)系統(tǒng)的部分功能可由數(shù)字電路實(shí)現(xiàn)。特征計(jì)算模塊410和概率計(jì)算模塊420的至少一部分由數(shù)字電路實(shí)現(xiàn),在一個(gè)實(shí)施例中,本發(fā)明的目標(biāo)檢測(cè)系統(tǒng)可以在包括通用處理器、存儲(chǔ)器和數(shù)字電路的片上系統(tǒng)(soc)實(shí)現(xiàn)。圖6示出了可用于實(shí)現(xiàn)本發(fā)明的目標(biāo)檢測(cè)系統(tǒng)的soc的一個(gè)例子。
在一個(gè)實(shí)施例中,可由soc上的數(shù)字電路部分(例如,fpga)來(lái)實(shí)現(xiàn)本系統(tǒng)所需的卷積神經(jīng)網(wǎng)絡(luò)和決策樹(shù)森林。由于cnn和決策樹(shù)森林進(jìn)行的是并行計(jì)算,因此,通過(guò)邏輯硬件,尤其是fpga來(lái)實(shí)現(xiàn)目標(biāo)檢測(cè)功能具有天然的計(jì)算優(yōu)勢(shì),并且相比于軟件執(zhí)行,能夠?qū)崿F(xiàn)更低的功耗。
在一個(gè)實(shí)施例中,可以將通過(guò)在前訓(xùn)練得到的有關(guān)cnn和決策樹(shù)森林的全部參數(shù)都存儲(chǔ)在片上系統(tǒng)的存儲(chǔ)器(例如,主存儲(chǔ)器)中,在隨后進(jìn)行目標(biāo)檢測(cè)時(shí),首先從主存儲(chǔ)器中讀取cnn各層的參數(shù)來(lái)對(duì)輸入圖像執(zhí)行神經(jīng)網(wǎng)絡(luò)計(jì)算,由此得到非線性特征。隨后,將大量連續(xù)特征(例如,針對(duì)特定區(qū)域的所有通道的特征)連同計(jì)算中需要使用的決策樹(shù)的參數(shù)(包括節(jié)點(diǎn)參數(shù)和回歸參數(shù))一次性地從主存儲(chǔ)器讀入邏輯硬件的緩存模塊。這樣可以減少計(jì)算下一個(gè)區(qū)域時(shí)的讀取數(shù)據(jù)造成的延時(shí),并且增加每次讀取主存的利用率,由此提升整體的計(jì)算效率。另外,可以對(duì)在邏輯硬件上實(shí)現(xiàn)的cnn和決策樹(shù)森林進(jìn)行定點(diǎn)化操作,從而進(jìn)一步提升系統(tǒng)的計(jì)算效率。
在一個(gè)實(shí)施例中,決策樹(shù)森林里的每一棵決策樹(shù)可以都是左右子樹(shù)深度相同或相近的決策樹(shù)。優(yōu)選地,森林里的決策樹(shù)可以具有相同的深度。如圖7所示,可以是具有深度為3且左右子樹(shù)對(duì)稱分布的決策樹(shù)森林。本發(fā)明的決策樹(shù)森林也可以根據(jù)例如精度需求以及硬件和緩存資源的情況來(lái)選擇不同的深度。
在一個(gè)實(shí)施例中,決策樹(shù)森林可以多個(gè)層。層數(shù)越多,隨機(jī)森林進(jìn)行自舉訓(xùn)練的次數(shù)也就越多。例如,可以布置分成5層且每層1000棵樹(shù)的隨機(jī)森林。每一層決策樹(shù)的數(shù)量可以不同,層間的決策樹(shù)深度也可以不同,但是優(yōu)選在同一層內(nèi)的每棵決策樹(shù)都是具有相同深度的左右對(duì)稱的決策樹(shù)。這樣就可以確保每棵樹(shù)以相同的速度進(jìn)行判斷和轉(zhuǎn)移,因此可以確保每個(gè)決策樹(shù)以相同的步調(diào)得出分類結(jié)果,可以使得本發(fā)明的檢測(cè)系統(tǒng)能夠直接使用到達(dá)決策樹(shù)葉節(jié)點(diǎn)的多個(gè)通道特征來(lái)計(jì)算得到特定區(qū)域包含目標(biāo)的概率。例如,可以直接根據(jù)通道特征所到達(dá)的葉節(jié)點(diǎn)參數(shù)計(jì)算此決策樹(shù)對(duì)此通道特征的回歸值,并對(duì)所有決策樹(shù)得到的回歸值進(jìn)行累加,由此得到該特定區(qū)域?qū)儆谛腥嘶蚴潜尘暗母怕省?/p>
通過(guò)減少?zèng)Q策樹(shù)的級(jí)數(shù),增加決策樹(shù)的平衡性,即使任意節(jié)點(diǎn)的左右子樹(shù)的深度接近,可以增加參數(shù)的存儲(chǔ)利用率,并且減小尋址模塊數(shù)字電路的復(fù)雜性。在實(shí)際使用中,可以根據(jù)精度需求以及硬件和緩存資源的情況選擇要使用的層數(shù)。在決策樹(shù)數(shù)量過(guò)多時(shí),可以每次讀入部分決策樹(shù)的參數(shù)并進(jìn)行計(jì)算,以保證此階段使用的所有參數(shù)可以存儲(chǔ)在片上緩存中。
在一個(gè)實(shí)施例中,從cnn輸出的非線性特征可以包括針對(duì)多個(gè)特定區(qū)域的多個(gè)一維向量。并且所述系統(tǒng)可以針對(duì)不同的特定區(qū)域選取相同或不同的決策樹(shù)執(zhí)行該特定區(qū)域包含目標(biāo)的概率的計(jì)算。
如圖8所示,本發(fā)明的目標(biāo)檢測(cè)系統(tǒng)還可以實(shí)現(xiàn)相應(yīng)的目標(biāo)檢測(cè)方法。在步驟810,采用人工神經(jīng)網(wǎng)絡(luò)計(jì)算輸入圖像的非線性特征。該非線性特征包括至少一個(gè)一維向量,所述一維向量由針對(duì)所述輸入圖像的特定區(qū)域的多個(gè)通道特征組成。在步驟820,采用決策樹(shù)森林根據(jù)所述非線性特征計(jì)算所述特定區(qū)域包含目標(biāo)的概率。決策樹(shù)森林可以直接使用到達(dá)決策樹(shù)葉節(jié)點(diǎn)的所述一維向量中的至少一個(gè)通道特征來(lái)獲取所述特定區(qū)域包含目標(biāo)的概率。在一個(gè)實(shí)施例中,可以讀取針對(duì)特定區(qū)域的所有通道的特征,并讀取所有或部分決策樹(shù)參數(shù),包括節(jié)點(diǎn)參數(shù)和回歸參數(shù)。
在一個(gè)實(shí)施例中,步驟820可以包括進(jìn)一步包括子步驟。圖9示出了概率計(jì)算步驟的一個(gè)具體實(shí)現(xiàn)例。在步驟921,非葉節(jié)點(diǎn)計(jì)算步驟,根據(jù)當(dāng)前的決策樹(shù)非葉節(jié)點(diǎn)設(shè)置,讀取對(duì)應(yīng)的通道特征和節(jié)點(diǎn)閾值,根據(jù)通道特征和節(jié)點(diǎn)閾值的比較結(jié)果選擇要進(jìn)行計(jì)算的下一級(jí)節(jié)點(diǎn)。在步驟922,根據(jù)葉節(jié)點(diǎn)參數(shù)和落入所述葉節(jié)點(diǎn)中的通道特征,計(jì)算該葉節(jié)點(diǎn)所在決策樹(shù)針對(duì)所述特定區(qū)域的樹(shù)輸出。在步驟923,根據(jù)獲取的每一個(gè)樹(shù)輸出計(jì)算所述特定區(qū)域包含目標(biāo)的概率。葉節(jié)點(diǎn)參數(shù)可以包括回歸系數(shù)和偏置量,并且樹(shù)輸出可以是回歸值。因此在步驟923中,可以根據(jù)獲取的每一個(gè)回歸值累加得到所述特定區(qū)域包含目標(biāo)的概率。
上文中已經(jīng)參考附圖詳細(xì)描述了根據(jù)本發(fā)明的目標(biāo)檢測(cè)系統(tǒng)、方法及其硬件實(shí)現(xiàn)。
本發(fā)明提出的卷積神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林的聯(lián)合結(jié)構(gòu),可以利用神經(jīng)網(wǎng)絡(luò)提取更具有判別性的特征,提高行人和背景兩種區(qū)域之間的差異性,同時(shí)使用隨機(jī)森林在神經(jīng)網(wǎng)絡(luò)特征的基礎(chǔ)做最終計(jì)算,比單純使用神經(jīng)網(wǎng)絡(luò)做檢測(cè),可以使用更高分辨率的特征,使檢測(cè)到的物體位置更準(zhǔn)確,并且對(duì)相對(duì)小的目標(biāo)更敏感。由此解決了單純的神經(jīng)網(wǎng)絡(luò)端到端行人檢測(cè)的分辨率低,位置不準(zhǔn)的問(wèn)題。通過(guò)使用邏輯硬件實(shí)現(xiàn)上述卷積神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林,可以在多個(gè)維度上并發(fā)計(jì)算卷積神經(jīng)網(wǎng)絡(luò),并且可以同時(shí)進(jìn)行多個(gè)決策樹(shù)的計(jì)算,這降低了每幀圖像分析的整體延時(shí),并且解決了單純的cpu和gpu實(shí)現(xiàn)中運(yùn)算性能不足,對(duì)隨機(jī)訪問(wèn)主存支持較差的缺點(diǎn)。另外,本發(fā)明通過(guò)利用片上緩存存儲(chǔ)大量特征和參數(shù),大大減少訪問(wèn)主存的次數(shù),提高計(jì)算速度。通過(guò)針對(duì)卷積神經(jīng)網(wǎng)絡(luò)和神經(jīng)網(wǎng)絡(luò)的特點(diǎn),本發(fā)明可以采用專用的硬件加速高度并行地實(shí)現(xiàn)卷積、池化、非線性函數(shù)、比較、回歸、累加等基本函數(shù)的計(jì)算,而計(jì)算中所需使用數(shù)據(jù)、參數(shù)和中間結(jié)果可被緩存在片上,避免訪問(wèn)主存成為程序速度的瓶頸。
以上已經(jīng)描述了本發(fā)明的各實(shí)施例,上述說(shuō)明是示例性的,并非窮盡性的,并且也不限于所披露的各實(shí)施例。在不偏離所說(shuō)明的各實(shí)施例的范圍和精神的情況下,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō)許多修改和變更都是顯而易見(jiàn)的。本文中所用術(shù)語(yǔ)的選擇,旨在最好地解釋各實(shí)施例的原理、實(shí)際應(yīng)用或?qū)κ袌?chǎng)中的技術(shù)的改進(jìn),或者使本技術(shù)領(lǐng)域的其它普通技術(shù)人員能理解本文披露的各實(shí)施例。