街景圖像中的文字標(biāo)牌檢測(cè)與定位方法

文檔序號(hào)：8282700閱讀：511來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

街景圖像中的文字標(biāo)牌檢測(cè)與定位方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理技術(shù)領(lǐng)域，涉及街景圖像中的文字標(biāo)牌檢測(cè)與定位方法。
【背景技術(shù)】
[0002] 文字標(biāo)牌檢測(cè)與定位是自然場(chǎng)景中文字識(shí)別的一個(gè)重要部分，屬于模式識(shí)別領(lǐng) 域。文字識(shí)別可以廣泛應(yīng)用在汽車(chē)的自動(dòng)駕駛、機(jī)器人導(dǎo)航以及盲人輔助定位等諸多方面，所以文字標(biāo)牌檢測(cè)為自然場(chǎng)景中進(jìn)一步的文字識(shí)別提供了很好的基礎(chǔ)，具有一定的實(shí)用性。
[0003] 由于文字標(biāo)牌所包含的文字在大小、形狀、字體、顏色和排列的多樣性，以及復(fù)雜背景、光照變換、幾何失真和模糊的影響，使得準(zhǔn)確的文字檢測(cè)、定位和識(shí)別就變得很困難。文字檢測(cè)和定位的準(zhǔn)確性會(huì)直接影響文字的識(shí)別率，所以，很多算法都致力于文字標(biāo)牌的檢測(cè)和定位。目前對(duì)于文字標(biāo)牌的檢測(cè)率并不理想，并且大多數(shù)研究只針對(duì)于交通標(biāo)牌的檢測(cè)與識(shí)別，對(duì)于其它文字標(biāo)牌檢測(cè)與識(shí)別的研究很少。
[0004] 在目前可見(jiàn)的研究文獻(xiàn)中，大多采用分類(lèi)器進(jìn)行交通標(biāo)牌的檢測(cè)和識(shí)別，最好的方法是采用詞袋模型（BoW)。但傳統(tǒng)的詞袋模型的一個(gè)致命缺陷是它將圖像視為局部特征的無(wú)序集合，即對(duì)局部特征之間的空間關(guān)系完全不予考慮，從而限制了特征的描述能力，降低了圖像分類(lèi)的準(zhǔn)確性。BoW模型的中的字典學(xué)習(xí)方法K-Means也存在以下缺陷：需要事先依據(jù)經(jīng)驗(yàn)指定聚類(lèi)的類(lèi)別數(shù)。若類(lèi)別數(shù)過(guò)小，會(huì)對(duì)數(shù)據(jù)造成欠分割，降低字典的區(qū)分能力；若類(lèi)別數(shù)過(guò)大，會(huì)造成樣本空間過(guò)分割，也會(huì)增加后續(xù)分類(lèi)的復(fù)雜度。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明的目的是提供一種街景圖像中的文字標(biāo)牌檢測(cè)與定位方法，解決了現(xiàn)有技術(shù)中存在的對(duì)文字標(biāo)牌特征描述不全面、聚類(lèi)方法不能自適應(yīng)地決定聚類(lèi)中心個(gè)數(shù)造成的文字標(biāo)牌檢測(cè)率低的技術(shù)問(wèn)題。
[0006] 本發(fā)明所采用的技術(shù)方案為：街景圖像中的文字標(biāo)牌檢測(cè)與定位方法，包括文字標(biāo)牌分類(lèi)器的訓(xùn)練過(guò)程和文字標(biāo)牌的檢測(cè)與定位過(guò)程。
[0007] 本發(fā)明的特點(diǎn)還在于，
[0008] 文字標(biāo)牌分類(lèi)器的訓(xùn)練過(guò)程，包括以下步驟：
[0009] 步驟1 :采集一定數(shù)量的街景圖像，作為字典學(xué)習(xí)的樣本圖像集;
[0010] 步驟2 :將獲取的街景圖像輸入計(jì)算機(jī)，提取街景圖像的SIFT特征，得到SIFT特征集FeajwV7I ;
[0011] 步驟3 :用SGONG聚類(lèi)方法對(duì)SIFT特征集&,進(jìn)行學(xué)習(xí)，得到聚類(lèi)中心，即字典D = [D1, D2,......，DJ，其中C為字典中的詞匯的個(gè)數(shù)，即聚類(lèi)的類(lèi)別個(gè)數(shù)；
[0012] 步驟4 :在街景圖像樣本圖像集/_〃·《/〃.ΓΛ中隨機(jī)選取部分文字標(biāo)牌圖像作為正樣本圖像集，選取部分除文字標(biāo)牌以外的場(chǎng)景圖像作為負(fù)樣本圖像集，合并正、負(fù)樣本圖集，得到SVM訓(xùn)練圖像集，其圖像的張數(shù)為
【主權(quán)項(xiàng)】
1. 街景圖像中的文字標(biāo)牌檢測(cè)與定位方法，其特征在于，其包括文字標(biāo)牌分類(lèi)器的訓(xùn) 練過(guò)程和文字標(biāo)牌的檢測(cè)與定位過(guò)程。
2. 根據(jù)權(quán)利要求1所述的街景圖像中的文字標(biāo)牌檢測(cè)與定位方法，其特征在于，文字標(biāo)牌分類(lèi)器的訓(xùn)練過(guò)程，包括W下步驟：步驟1;采集一定數(shù)量的街景圖像，作為字典學(xué)習(xí)的樣本圖像集/_wu'n.r\; 步驟2 ;將獲取的街景圖像輸入計(jì)算機(jī)，提取街景圖像的SIFT特征，得到SIFT特征集 Fea train\ ? 步驟3 ;用SGONG聚類(lèi)方法對(duì)SIFT特征集,進(jìn)行學(xué)習(xí)，得到聚類(lèi)中也，即字典D =巧。〇2,......，DJ，其中C為字典中的詞匯的個(gè)數(shù)，即聚類(lèi)的類(lèi)別個(gè)數(shù)；步驟4 ;在街景圖像樣本圖像集/ _ 中隨機(jī)選取部分文字標(biāo)牌圖像作為正樣本圖像集，選取部分除文字標(biāo)牌W外的場(chǎng)景圖像作為負(fù)樣本圖像集，合并正、負(fù)樣本圖集，得到SVM訓(xùn)練圖像集，其圖像的張數(shù)為
a是比例因子；步驟5 ;提取圖像集J_sw!"|W|中圖像/_sv咪心1的顏色直方圖向量巧LCo//f，其組成的集合化s_Col即為圖像的顏色特征集化a_Col，其中，!' = 1，2...，AC：；'；步驟6 ;提取圖像集中圖像ixw'的SIFT直方圖向量版_湖口戸，其組成的集合化sJ5ha即為圖像的形狀特征集化aJ5ha，其中，= 1，2...，AC ; 步驟7:將顏色直方圖向量/?^_曰〇/產(chǎn)與SIFT直方圖向量如合并為的顏色和形狀直方圖向量版_湖旅〇//，其集合構(gòu)成向量集化s_ 化aCol，即為圖像的形狀和顏色描述特征集化a_^aCol，具體描述為下式：
步驟8 ;生成灰度文字標(biāo)牌的分類(lèi)器S_Classifer和彩色文字標(biāo)牌的分類(lèi)器SC_ Classifer，具體過(guò)程如下：采用SVM分類(lèi)器學(xué)習(xí)圖像的形狀特征集化aJ5ha，生成灰度文字標(biāo)牌的分類(lèi)器S_ Classifer-即灰度文字標(biāo)牌的分類(lèi)器，該分類(lèi)器的線性分類(lèi)函數(shù)是fi (X) = WiTx+bi，其中 Wi，bi為學(xué)習(xí)得到的參數(shù)；采用SVM分類(lèi)器學(xué)習(xí)圖像的形狀和有顏色描述特征集化aJ^haCol，生成彩色文字標(biāo) 牌的分類(lèi)器SC_Classifer-即彩色文字標(biāo)牌分類(lèi)器，該分類(lèi)器的線性分類(lèi)函數(shù)是f2 (X)= WaTx+ba，其中*2, bg為學(xué)習(xí)得到的參數(shù)。
3. 根據(jù)權(quán)利要求2所述的街景圖像中的文字標(biāo)牌檢測(cè)與定位方法，其特征在于，文字
標(biāo)牌的檢測(cè)和定位過(guò)程包括w下步驟：步驟1 ;選取一定數(shù)目的街景圖像作為測(cè)試圖像集I_test，圖像的張數(shù)為iV;：；'; 步驟2 ;滑動(dòng)窗檢測(cè)，具體過(guò)程如下：用M2*N2大小的窗在每個(gè)測(cè)試圖像上進(jìn)行滑動(dòng)檢測(cè)，若滑動(dòng)窗所在的圖像區(qū)域?yàn)榛叶?圖像，則采用文字標(biāo)牌分類(lèi)器的訓(xùn)練過(guò)程中獲取SIFT直方圖向量的方法獲取圖像區(qū)域的 SIFT直方圖向量，用S_Classifier判斷是否為文字標(biāo)牌，若滑動(dòng)窗所在的圖像區(qū)域?yàn)椴噬?圖像，則采用文字標(biāo)牌分類(lèi)器的訓(xùn)練過(guò)程中獲取顏色和形狀直方圖向量的方法得到該圖像區(qū)域的顏色和形狀直方圖向量，用SC_Classifier判斷是否為文字標(biāo)牌；步驟3 ;文字標(biāo)牌的定位，具體過(guò)程如下：將所有檢測(cè)到的文字標(biāo)牌圖像區(qū)域用矩形框標(biāo)記出來(lái)，合并相交的矩形框，合并后的矩形框區(qū)域即檢測(cè)到的文字標(biāo)牌區(qū)域。
4.根據(jù)權(quán)利要求2所述的街景圖像中的文字標(biāo)牌檢測(cè)與定位方法，其特征在于，步驟 3中用SGONG聚類(lèi)方法對(duì)SIFT特征集進(jìn)行學(xué)習(xí)，得到聚類(lèi)中也，即字典D = 扣1，〇2,......，DJ的方法如下： 3. 1，首先初始化SGONG字典學(xué)習(xí)過(guò)程的相關(guān)參數(shù)： (1)神經(jīng)元權(quán)重系數(shù)為 Wi= [Wi，。，. . . Wi，k-1]T，i = 0, 1，. . .，C-1，C 為每一步輸出的神經(jīng)元個(gè)數(shù)，開(kāi)始訓(xùn)練前c的初始值為2, k為神經(jīng)元維數(shù)，該里是SIFT特征維數(shù)，為128 ; 似為每一個(gè)神經(jīng)元i定義兩個(gè)累計(jì)誤差巧和馬，其中巧"表示神經(jīng)元i的全部量化誤差，巧為移除神經(jīng)元i產(chǎn)生的增量誤差； (3) N康示被劃分到神經(jīng)元i的輸入向量個(gè)數(shù)，N 表示連續(xù)有多少個(gè)特征矢量被劃分到該神經(jīng)元，該神經(jīng)元就訓(xùn)練完畢，該變量也為時(shí)間周期變量;max-Nodes代表輸出的神經(jīng) 元最大個(gè)數(shù)，Max^。代表最大的橫向連接數(shù)，max-epoch代表迭代次數(shù)； 3. 2,開(kāi)始訓(xùn)練：在SIFT特征集八,中隨機(jī)選取兩個(gè)向量作為初始的神經(jīng)元wni和wri2,開(kāi)始迭代訓(xùn)練SG0NG神經(jīng)網(wǎng)絡(luò)，迭代算法的具體步驟為： (1) 將累積誤差巧哺巧2>值設(shè)置為0 ; (2) 從_/ra/n'L隨機(jī)選取一個(gè)向量，作為輸入向量Xj; (3) 對(duì)于輸入的矢量Xj.，從神經(jīng)元中選擇最佳匹配和次匹配

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：趙凡;楊垚;孫力;李妮;
技術(shù)所有人：西安理工大學(xué);
我是此專(zhuān)利的發(fā)明人

上一篇：一種用近紅外高光譜圖像識(shí)別霉變花生的方法
上一篇：人體手指靜脈識(shí)別裝置的制造方法

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像采集區(qū)域標(biāo)牌相關(guān)技術(shù)

慧眼圖像文字識(shí)別軟件相關(guān)技術(shù)

慧眼圖像文字識(shí)別相關(guān)技術(shù)

圖像識(shí)別文字相關(guān)技術(shù)

圖像文字識(shí)別技術(shù)相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

街景圖像中的文字標(biāo)牌檢測(cè)與定位方法