模擬生物界的尋優(yōu)過程,其中PSO模擬群鳥覓食的過程,GA模擬生物種 群的進(jìn)化過程。PSO來源于1994年正式提出的復(fù)雜適應(yīng)系統(tǒng)(Complex Adaptive System, CAS),定義系統(tǒng)中可W自由活動的主體存在相互作用的行為,及環(huán)境與主體、主體與主體之 間相互影響的行為,和隨機(jī)因素影響的行為,運(yùn)些行為共同影響主體尋優(yōu)過程中的屬性,更 新包括速度和位置等在內(nèi)的信息,使得整體朝趨于最優(yōu)方向。GA利用生物進(jìn)化論中"物競天 擇,適者生存"的思想,模擬生物個(gè)體的遺傳與變異過程,通過基因交叉(crossover)、基因 突變(mutation)等因素使得適應(yīng)度較低的個(gè)體逐步被淘汰,多代自然選擇的結(jié)果也是趨于 最優(yōu)方向。
[0137] 使用LIBSVM對SIFT特征、冊G特征、SURF特征、OCD特征分別進(jìn)行SVM參數(shù)C和丫訓(xùn)練 優(yōu)化,并使用grid-search、PS0和GA分別對5-fold交叉驗(yàn)證數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。四種特征SVM 參數(shù)優(yōu)化結(jié)果如表4及圖12-14所示,其中g(shù)rid-search懲罰參數(shù)C和RBF核參數(shù)丫迭代范圍 均為,尋優(yōu)步長均為,準(zhǔn)確率離散化精度為4. SdPSO和GA均迭代200次。
[013 引
[0139] 表4四種典型特征的SVM參數(shù)優(yōu)化結(jié)果對比
[0140] 對比四種特征的優(yōu)化過程,可W發(fā)現(xiàn)OCD特征在PSO和GA的最佳適應(yīng)度比其他S種 特征的數(shù)值要提高數(shù)個(gè)百分點(diǎn),同時(shí)平均適應(yīng)度也隨之提高。整體上,OCD特征的優(yōu)化適應(yīng) 度波動較為明顯,PSO迭代曲線趨勢基本水平,GA迭代曲線在150次左右迭代時(shí)出現(xiàn)下降趨 勢。
[0141] 相比于grid-search純粹枚舉W獲取最佳SVM懲罰參數(shù)C和RBF核參數(shù)丫,PSO和GA 算法將SVM參數(shù)優(yōu)化問題模擬為演化計(jì)算(eVOIut ionary computation)問題。從圖13和圖 14的結(jié)果分析,GA的性能優(yōu)于PS0,在迭代20次左右已經(jīng)基本完成尋優(yōu)過程,相應(yīng)的適應(yīng)度 (fitness)也位于87%上下,與最佳適應(yīng)度飽和值94%左右相差不大。PSO在迭代次數(shù)增加 的過程中出現(xiàn)了較為頻繁的適應(yīng)度波動,整體適應(yīng)度趨勢緩慢下降,數(shù)值基本位于65%附 近。Grid-search由于不設(shè)及任何較為復(fù)雜的算法,執(zhí)行較為簡潔,從二維和S維角度觀察 也基本和PS0、GA獲得類似的性能,運(yùn)也映證了LIBSVM的設(shè)計(jì)者們建議使用grid-search尋 找最優(yōu)C和丫初衷的正確性一一用盡可能簡單的方法解決問題。
[0142] 4)行人檢測實(shí)驗(yàn)
[0143] 實(shí)驗(yàn)中分別使用SIFT、H0G、SURF和OCD特征對正負(fù)樣本進(jìn)行特征提取。實(shí)驗(yàn)中每個(gè) 樣本被平均劃分為8X8圖像塊,步長為8,SIFT梯度方向量化通道數(shù)取8,H0G梯度直方圖方 向量化通道數(shù)為9,最終形成的SIFT特征49 X 128維,HOG特征64 X 36維,SURF特征64 X 64維。 最終形成的OCD特征與隨機(jī)采樣窗口數(shù)量samp IeNum有關(guān),為samp IeNum X 64維。
[0144] 實(shí)驗(yàn)使用SIFT、H0G、SURF和OCD特征及RBF核和W公式(11)為理論基礎(chǔ)的直方圖交 叉核化IK)作為SVM的核函數(shù),分別在使用金字塔結(jié)構(gòu)和不使用金字塔結(jié)構(gòu)的情況下對表2 所示的數(shù)據(jù)集進(jìn)行行人檢測實(shí)驗(yàn),其中HOG特征借助Piotii ComputerViSion MATLAB Toolbox實(shí)現(xiàn),SURF特征借助MAl^AB自帶的SURFPoints類實(shí)現(xiàn)。分別使用RBF SVM(RBF kernel+SVM+BOW)、HIK SVM巧istogram Intersection kernel+SVM+BOW)、PRBF SVM (Pyramid RBF+SVM+BOW)和PHIK SVM(Pyramid Histogram Intersection kernel+SVM+ BOW)表示,其結(jié)果如表5所示,相應(yīng)的檢測時(shí)間如表6所示。運(yùn)里使用的SIFT特征49 X 128維, HOG 特征64 X 36維,SURF 特征64 X 64維,OCD 特征600 X 64維。 「014"
[0149] 表6行人檢測時(shí)間對比(單位:秒)
[0150] 與表3顯示的結(jié)果類似,當(dāng)選擇合適的OCD參數(shù)時(shí),特征分類性能SIFT〉0CD〉H0G〉 SURF。同時(shí)可W明顯看出,除OCD特征,添加金字塔結(jié)構(gòu)的尺度描述會在一定程度上提升特 征的分類性能。SVM核函數(shù)中,整體上RB巧kHIK體現(xiàn)了更好的分類效果,詳細(xì)數(shù)據(jù)可W參考 表7。
[0151] 從圖4中OCD特征的設(shè)計(jì)過程可W發(fā)現(xiàn),圖像有效塊的判斷過程主要是對OCD特征 進(jìn)行統(tǒng)計(jì)分析。由于OCD特征本身是基于行人輪廓的描述,在金字塔構(gòu)造時(shí)的降采樣過程 中,二值化后的邊緣圖很容易發(fā)生0和1的瞬間變化,而運(yùn)種極端的量化過程與SIFT等其他 特征的連續(xù)變化相比,已經(jīng)不符合連續(xù)降采樣的適用條件,表3顯示OCD特征與PRBF SVM和 PHIK SVM結(jié)合得到的檢測率較低也驗(yàn)證了運(yùn)一分析。
[0152]
[01
[0154] 表7不同核函數(shù)的SVM分類器性能比較
[0155] 從表6可W發(fā)現(xiàn),特征提取在不同的分類實(shí)驗(yàn)中始終占有較大的時(shí)間開銷。SIFT特 征的計(jì)算過程確實(shí)較為繁瑣,但相比于MATLAB自帶的SURF化ints類沒有在金字塔多尺度上 進(jìn)行相應(yīng)優(yōu)化,SURF特征的快速計(jì)算效果并沒有很好的體現(xiàn)出來。Piolni Computer Vision MA化AB Toolbox中對于HOG特征的計(jì)算使用了C語言和MA化AB混編模式完成,相比于純 MTLAB編寫的其他特征,其計(jì)算速度明顯加快,但在相似性度量和金字塔特征構(gòu)造的部分, 時(shí)間開銷較大。對于OCD特征,其主要的特征描述在于OCD距離的計(jì)算,故特征提取的部分時(shí) 間開銷并不是太大,反而是距離計(jì)算消耗了過多的時(shí)間。此處根據(jù)公式(8)計(jì)算方向 化amf er距離,也無法利用MATLAB向量化的思想進(jìn)行代碼優(yōu)化,相比于有bsxfun函數(shù)助力的 歐式距離計(jì)算,出現(xiàn)較大的OCD距離時(shí)間開銷也不足為奇了。
[0156] 5)參數(shù)討論
[0157] i:隨機(jī)采樣窗口數(shù)量
[015引表8說明了隨機(jī)采樣窗口數(shù)量sampleNum對OCD特征的影響??蒞發(fā)現(xiàn),在一定的范 圍內(nèi),采樣窗口數(shù)量越多,整體分類性能越高,并且HIK比RBF核函數(shù)體現(xiàn)了更好的分類性 能。超過該范圍后,采樣窗口數(shù)量增加會導(dǎo)致整體分類性能的降低。圖15給出了 OCD統(tǒng)計(jì)分 布的直觀效果。容易知道,S amp 1 eNum本質(zhì)上修改了 OCD特征的統(tǒng)計(jì)分布情況,可W認(rèn)為,較 高分類正確率對應(yīng)的sampleNum值即為圖像塊OCD特征的有效值,運(yùn)一部分的特征有效表達(dá) 了圖像本身的內(nèi)容。
[0159]
[0160] 表8隨機(jī)采樣窗口數(shù)量對OCD-BOW檢巧巧法的影響
[0161] ii: OCD融合闊值
[0162] 公式(8)的理論說明和圖6的實(shí)驗(yàn)結(jié)果都說明了M乍為方向特異性參數(shù),在基本 化amfer距離定義和其方向定義線性合成的過程中,直接影響了OCD特征的具體數(shù)值,也進(jìn) 一步影響了其統(tǒng)計(jì)分布情況。由于OCD特征直接利用OCD距離進(jìn)行相似性度量,M直對于OCD 值本身的修改將對最終的分類精度造成直接影響,如表9所示。圖16顯示了相應(yīng)的OCD統(tǒng)計(jì) 分布圖。
[0163]
[0164]
[01化]表9 OCD融合闊值對OCD-BOW檢巧巧法的影響。
【主權(quán)項(xiàng)】
1. 一種基于方向倒角距離特征的行人檢測方法,其特征在于:包括如下步驟: 步驟(1):輸入待檢測圖像,對待檢測圖像進(jìn)行預(yù)處理得到待檢測邊緣圖像; 步驟(2):提取方向倒角距離特征,所述方向倒角距離特征為 ?λ(χ) = (?-λ) · dcham,T(x)+A · dorient(x) (8) 其中,λ為方向特異性參數(shù),表征基本倒角距離定義和其方向定義的權(quán)重; 步驟(3):以方向倒角距離作為距離度量比較經(jīng)步驟(1)處理的待檢測邊緣圖像輪廓與 模板圖像輪廓的相似性判斷待檢測邊緣圖像是否為行人圖像;模板圖像為已判斷為是行人 輪廓的圖像。2. 根據(jù)權(quán)利要求1所述的行人檢測方法,其特征在于:對所述步驟(1)得到的所述待檢 測邊緣圖像進(jìn)行圖像塊有效性判斷,過程如下: 步驟(11):獲取步驟(1)處理后待檢測邊緣圖像的圖像塊序列; 步驟(12):選取其中某一圖像塊,判斷選取的圖像塊是否有效;若無效,則重復(fù)本步驟 重新選取另一圖像塊;若有效,則跳轉(zhuǎn)到步驟(13);其中,所述圖像塊的有效性根據(jù)圖像塊 間的方向倒角距離大小判斷; 步驟(13):得到有效圖像塊序列;確定所有圖像塊的有效性是否已經(jīng)判斷完畢;若未判 斷完畢,則返回步驟(12);若已經(jīng)判斷完畢,則得到有效圖像塊序列。
【專利摘要】本發(fā)明提供了一種基于方向倒角距離特征的行人檢測方法,包括如下步驟:步驟(1):輸入待檢測圖像,對待檢測圖像進(jìn)行預(yù)處理得到待檢測邊緣圖像;步驟(2):提取方向倒角距離特征;步驟(3):以方向倒角距離作為距離度量比較經(jīng)步驟(1)處理的待檢測邊緣圖像輪廓與模板圖像輪廓的相似性判斷待檢測邊緣圖像是否為行人圖像;模板圖像為已判斷為是行人輪廓的圖像。本發(fā)明將原始倒角距離特征進(jìn)行擴(kuò)展,加入輪廓方向特征,并進(jìn)一步對特征進(jìn)行碼本和多尺度描述,形成具有尺度不變性的強(qiáng)方向倒角距離特征,提高了方向倒角距離特征對噪聲的抗干擾能力,充分提升了行人檢測系統(tǒng)的正確率。
【IPC分類】G06T7/00, G06K9/62
【公開號】CN105719285
【申請?zhí)枴緾N201610032031
【發(fā)明人】陳單啇, 夏思宇
【申請人】東南大學(xué)
【公開日】2016年6月29日
【申請日】2016年1月19日