亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種圖像數(shù)字字符識(shí)別方法

文檔序號(hào):9579647閱讀:694來(lái)源:國(guó)知局
一種圖像數(shù)字字符識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種圖像數(shù)字字符識(shí)別方法,屬于圖像處理技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002]字符識(shí)別技術(shù)綜合了數(shù)字圖像處理和模式識(shí)別技術(shù),是一個(gè)重要的研究方向,有巨大的經(jīng)濟(jì)價(jià)值和現(xiàn)實(shí)意義,可以提高管理部門(mén)工作效率,節(jié)省大量的人力和資金。早在二十年代,德國(guó)科學(xué)家Taushek提出光學(xué)字符識(shí)別OCR概念;五十年代,開(kāi)始對(duì)印刷體字符識(shí)別的研究;八十年代后期,字符快速識(shí)別成為可能;九十年代初,大量的OCR方面的論文和系統(tǒng)出現(xiàn);今天字符識(shí)別技術(shù)隨著計(jì)算機(jī)技術(shù)和人工智能研究的發(fā)展而逐步趨向成熟并取得了廣泛應(yīng)用。
[0003]目前,常用的識(shí)別算法有模板匹配,特征匹配,神經(jīng)網(wǎng)絡(luò)和子空間法。
[0004]模板匹配法是將提取出的字符圖像縮放到模板一致的大小,與每個(gè)模板一一匹配,計(jì)算重疊度。其優(yōu)點(diǎn)是算法簡(jiǎn)單,計(jì)算量較小。但是缺點(diǎn)明顯,即識(shí)別的正確率不高,且容易混淆字符。
[0005]神經(jīng)網(wǎng)絡(luò)法是一種模擬生物神經(jīng)網(wǎng)絡(luò)的算法,能處理一些環(huán)境信息復(fù)雜、推理規(guī)則不明確的問(wèn)題,在字符識(shí)別上也取得了重要應(yīng)用。算法的優(yōu)點(diǎn)是抗干擾能力強(qiáng),識(shí)別正確率高。但其缺點(diǎn)也存在,即事先需要對(duì)算法進(jìn)行大量的推理訓(xùn)練,在沒(méi)有合理的訓(xùn)練下算法的效率優(yōu)勢(shì)并不明顯。同時(shí),算法也較為復(fù)雜,計(jì)算量也較大。
[0006]特征匹配中的SIFT (尺度不變特征變換)算法是一種提取局部特征的算法,可在圖像的尺度空間中尋找位置、尺度、旋轉(zhuǎn)等特征不變的特征點(diǎn)。正是由于它可檢測(cè)這種具有位置、尺度、旋轉(zhuǎn)不變特性的特征點(diǎn),無(wú)需對(duì)算法進(jìn)行訓(xùn)練,使得該算法一致被沿用至今。它的缺點(diǎn)在于計(jì)算速度慢,不適合運(yùn)算能力較弱的平臺(tái)如智能手機(jī)等使用,同時(shí)檢測(cè)出的特征點(diǎn)的維數(shù)較高,當(dāng)特征點(diǎn)數(shù)量較多時(shí),占用內(nèi)存空間會(huì)非常大。
[0007]通常,圖像的維度較高,字符在這樣的高維上分布是稀疏的,即使得基于統(tǒng)計(jì)分析的方法會(huì)遇到小樣本問(wèn)題,計(jì)算量也隨之增加。子空間法是一種能夠根據(jù)一定的性能目標(biāo)來(lái)尋找線性或非線性的空間變換,將原始數(shù)據(jù)壓縮到一個(gè)低維的子空間中,使在該子空間中數(shù)據(jù)分布更為緊湊,使得數(shù)據(jù)描述能力更強(qiáng),算法的運(yùn)算量也大大降低。

【發(fā)明內(nèi)容】

[0008]針對(duì)上述技術(shù)問(wèn)題,本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種圖像數(shù)字字符識(shí)別方法,優(yōu)化了圖像識(shí)別算法,使得針對(duì)數(shù)字字符的識(shí)別準(zhǔn)確度得到了有效的提高,并且加快了識(shí)別速度,保證了圖像識(shí)別的工作效率。
[0009]本發(fā)明為了解決上述技術(shù)問(wèn)題采用以下技術(shù)方案:本發(fā)明設(shè)計(jì)了一種圖像數(shù)字字符識(shí)別方法,包括如下步驟:
[0010]步驟001.獲取含有數(shù)字字符的樣本圖像,并進(jìn)入步驟002 ;
[0011]步驟002.針對(duì)樣本圖像進(jìn)行灰度化處理,獲得樣本灰度圖像,并進(jìn)入步驟003 ;
[0012]步驟003.采用多尺度Retinex算法針對(duì)樣本灰度圖像進(jìn)行光照預(yù)處理操作,獲得光照預(yù)處理樣本圖像,并進(jìn)入步驟004 ;
[0013]步驟004.針對(duì)光照預(yù)處理樣本圖像進(jìn)行二值化處理,獲得二值化樣本圖像,并進(jìn)入步驟005 ;
[0014]步驟005.分別針對(duì)二值化樣本圖像中各個(gè)數(shù)字字符的角度進(jìn)行矯正,使得各個(gè)數(shù)字字符位于預(yù)設(shè)角度位置,進(jìn)而獲得矯正樣本圖像,并進(jìn)入步驟006 ;
[0015]步驟006.針對(duì)矯正樣本圖像,分別獲取其中各個(gè)數(shù)字字符所在的數(shù)字字符區(qū)域圖像,并進(jìn)入步驟007;
[0016]步驟007.采用預(yù)先針對(duì)0-9各個(gè)數(shù)字字符分別訓(xùn)練好的各個(gè)分類(lèi)器,針對(duì)各個(gè)數(shù)字字符區(qū)域圖像中的數(shù)字字符進(jìn)行識(shí)別,分別獲取各個(gè)數(shù)字字符區(qū)域圖像中的各個(gè)數(shù)字字符;并根據(jù)各個(gè)數(shù)字字符區(qū)域圖像所在樣本圖像中的位置,針對(duì)所獲各個(gè)數(shù)字字符進(jìn)行組合,獲得對(duì)應(yīng)樣本圖像的數(shù)字字符。
[0017]作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述步驟003具體包括:采用多尺度Retinex算法,根據(jù)如下公式,基于圖像像素點(diǎn),針對(duì)樣本灰度圖像進(jìn)行光照預(yù)處理操作;
[0018]f(x,y) = l(x,y) Xr(x,y)
[0019]針對(duì)樣本灰度圖像中的各個(gè)像素點(diǎn),通過(guò)不同角度的高斯核卷積圖像算法獲得樣本灰度圖像中各個(gè)像素點(diǎn)的反射分量r(x,y),并針對(duì)樣本灰度圖像中各個(gè)像素點(diǎn)的反射分量r(x,y),通過(guò)加權(quán)算法獲得光照預(yù)處理樣本圖像;其中,f(x,y)表示樣本灰度圖像中各個(gè)像素點(diǎn)的實(shí)際灰度值分量,l(x,y)表示樣本灰度圖像中各個(gè)像素點(diǎn)的光照分量。
[0020]作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟004中,針對(duì)光照預(yù)處理樣本圖像中的各個(gè)像素點(diǎn)進(jìn)行二值化處理,獲得二值化樣本圖像。
[0021]作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述步驟005具體包括:分別針對(duì)二值化樣本圖像中的各個(gè)數(shù)字字符,獲得數(shù)字字符上下兩邊的斜率,并獲得上下兩邊斜率的平均值,作為該數(shù)字字符的斜率,然后根據(jù)該數(shù)字字符的斜率,針對(duì)該數(shù)字字符進(jìn)行矯正旋轉(zhuǎn),進(jìn)而獲得矯正樣本圖像。
[0022]作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟005中,分別針對(duì)二值化樣本圖像中的各個(gè)數(shù)字字符,采用擬合直線法分別擬合數(shù)字字符上下兩邊的像素,用以獲得該數(shù)字字符上下兩邊的斜率。
[0023]作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟005中,分別針對(duì)二值化樣本圖像中的各個(gè)數(shù)字字符,根據(jù)數(shù)字字符的斜率,采用雙線性差值旋轉(zhuǎn)方法,針對(duì)該數(shù)字字符進(jìn)行矯正旋轉(zhuǎn)。
[0024]作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述步驟007中,所述預(yù)先針對(duì)0-9各個(gè)數(shù)字字符分別訓(xùn)練好的各個(gè)分類(lèi)器分別通過(guò)如下步驟獲得:
[0025]步驟a.針對(duì)分別包含指定數(shù)字的預(yù)設(shè)數(shù)量的樣本圖像,提取各幅圖像的特征矩陣,進(jìn)而獲得該數(shù)字所對(duì)應(yīng)的樣本特征矩陣,并進(jìn)入步驟b ;
[0026]步驟b.將該數(shù)字所對(duì)應(yīng)的樣本特征矩陣按預(yù)設(shè)規(guī)則分為訓(xùn)練樣本和測(cè)試樣本,并送入預(yù)設(shè)分類(lèi)器中進(jìn)行訓(xùn)練,獲得針對(duì)該數(shù)字訓(xùn)練好的分類(lèi)器。
[0027]作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟a中,針對(duì)分別包含指定數(shù)字的預(yù)設(shè)數(shù)量的樣本圖像,采用二維PCA算法提取各幅圖像的特征矩陣。
[0028]作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟b中,采用九一分法,將該數(shù)字所對(duì)應(yīng)的樣本特征矩陣按預(yù)設(shè)規(guī)則分為九份訓(xùn)練樣本和一份測(cè)試樣本。
[0029]作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟b中,所述預(yù)設(shè)分類(lèi)器為決策樹(shù)加Adaboost算法所實(shí)現(xiàn)的強(qiáng)分類(lèi)器。
[0030]本發(fā)明所述一種圖像數(shù)字字符識(shí)別方法采用以上技術(shù)方案與現(xiàn)有技術(shù)相比,具有以下技術(shù)效果:本發(fā)明設(shè)計(jì)的圖像數(shù)字字符識(shí)別方法,優(yōu)化了算法結(jié)構(gòu),將光照和傾斜的影響放在圖像預(yù)處理階段,保證在字符識(shí)別前獲得較好的二值化字符圖像;隨后,采用二維PCA算法提取圖像中的主要特征,降低圖像的維度和運(yùn)算復(fù)雜度;而由決策樹(shù)和Adaboost算法相結(jié)合,優(yōu)化了分類(lèi)算法,既保證了識(shí)別的效率又降低了出現(xiàn)過(guò)擬合的風(fēng)險(xiǎn);最后使用九一分法驗(yàn)證分類(lèi)模型的泛化能力,確保了分類(lèi)器的穩(wěn)定性;通過(guò)對(duì)以上的算法優(yōu)化,使得數(shù)字字符識(shí)別的準(zhǔn)確率和速度均有了明顯提高。
【附圖說(shuō)明】
[0031]圖1是本發(fā)明設(shè)計(jì)圖像數(shù)字字符識(shí)別方法的流程示意圖。
【具體實(shí)施方式】
[0032]下面結(jié)合說(shuō)明書(shū)附圖針對(duì)本發(fā)明的【具體實(shí)施方式】作進(jìn)一步詳細(xì)的說(shuō)明。
[0033]如圖1所示,本發(fā)明設(shè)計(jì)的一種圖像數(shù)字字符識(shí)別方法在實(shí)際應(yīng)用過(guò)程當(dāng)中,諸如應(yīng)用在Android系統(tǒng)的移動(dòng)終端上,具體包括如下步驟:
[0034]步驟001.Android 系統(tǒng)提供了 Camera,SurfaceView 和 ImageView 組件,結(jié)構(gòu)為三者疊加而成,其中,Camera負(fù)責(zé)預(yù)覽圖像,拍照和截取指定區(qū)域圖像,處于最底層;SurfaceView負(fù)責(zé)加載預(yù)覽圖像和初始化相機(jī)參數(shù),處于中間層!ImageView負(fù)責(zé)繪制取景框,處于最上層。通過(guò)Android系統(tǒng)所提供的Camera,SurfaceView和ImageView組件獲取含有數(shù)字字符的樣本圖像,并進(jìn)入步驟002。
[0035]步驟002.針對(duì)樣本圖像進(jìn)行灰度化處理,獲得樣本灰度圖像,并進(jìn)入步驟003。
[0036]步驟003.在算法實(shí)現(xiàn)中,光照對(duì)于圖片拍攝的影響主要來(lái)自于不同光照環(huán)境下,如烈日、陰天、夜晚等,造成所拍攝圖像存在區(qū)域光照不均勻的情況,光照不均勻會(huì)導(dǎo)致所拍攝圖像在進(jìn)行二值化處理操作時(shí)可能抹去圖像內(nèi)重要的字符信息,因此有必要在二值化處理前進(jìn)行光照預(yù)處理操作,則在這里,設(shè)計(jì)采用多尺度Retinex算法(MSR)針對(duì)樣本灰度圖像進(jìn)行光照預(yù)處理操作,獲得光照預(yù)處理樣本圖像,這里具體包括:采用多尺度Retinex算法(MSR),根據(jù)如下公式,基于圖像像素點(diǎn),針對(duì)樣本灰度圖像進(jìn)行光照預(yù)處理操作;
[0037]f(x,y) = l(x,y) Xr(x,y)
[0038]針對(duì)樣本灰度圖像中的各個(gè)像素
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1