一種面向復(fù)雜背景的光學(xué)字符識(shí)別方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種面向復(fù)雜背景的光學(xué)字符識(shí)別方法及裝置,采用先將原圖與邊緣檢測(cè)后的圖像疊加,然后對(duì)處理后的圖像進(jìn)行取反和高斯濾波,在此基礎(chǔ)上,根據(jù)處理后的圖像計(jì)算積分圖,并利用積分圖加速定位過程,能夠在有效地抑制背景噪聲和突出字符信息的基礎(chǔ)上,實(shí)現(xiàn)字符的準(zhǔn)確快速定位和識(shí)別。本發(fā)明的方法包括:采集圖像信息,得到采集圖像;根據(jù)字符特性從所述采集圖像中獲取目標(biāo)字符區(qū)域,作為目標(biāo)對(duì)象;采用微分法提取所述目標(biāo)對(duì)象內(nèi)的字符邊緣信息,得到提取圖像;將所述目標(biāo)對(duì)象和所述提取圖像疊加,得到恢復(fù)圖像;對(duì)所述恢復(fù)圖像進(jìn)行取反和高斯濾波處理,得到處理圖像;在所述處理圖像內(nèi)搜索目標(biāo)字符位置;對(duì)所述目標(biāo)字符位置進(jìn)行識(shí)別。
【專利說明】一種面向復(fù)雜背景的光學(xué)字符識(shí)別方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明實(shí)施例涉及字符定位和識(shí)別領(lǐng)域,具體涉及一種面向復(fù)雜背景的光學(xué)字符識(shí)別方法及裝置。
【背景技術(shù)】
[0002]實(shí)際生產(chǎn)和生活中,字符定位與識(shí)別有著非常多的應(yīng)用,如車牌號(hào)碼的識(shí)別、紙幣冠字號(hào)碼的識(shí)別、身份證中身份證號(hào)碼的識(shí)別,以及各種產(chǎn)品包裝上印刷號(hào)碼的檢測(cè)等等。由于這些字符具有重要意義或商業(yè)價(jià)值,因此在生產(chǎn)和生活中自動(dòng)識(shí)別它們變的越來越重要。
[0003]但受制于攝像設(shè)備、光照條件,以及拍攝場景等因素的限制,所拍攝的圖像常常出現(xiàn)背景復(fù)雜、目標(biāo)區(qū)域不明顯等情況,難以進(jìn)行有效的圖像分割。
[0004]字符定位是識(shí)別的關(guān)鍵前提,其定位精度直接影響到識(shí)別正確率?,F(xiàn)有各種方法中,大部分采用的是將圖像轉(zhuǎn)化成二值圖像后再進(jìn)行目標(biāo)的定位。這類方法的不足之處在于定位精度依賴于閾值分割的效果。如果圖像場景復(fù)雜,或者對(duì)比度低,或者光照不均勻,就會(huì)發(fā)生因二值化效果差而導(dǎo)致的目標(biāo)定位錯(cuò)誤。圖1是一張鈔票上的光學(xué)字符區(qū)域圖像,由于流通時(shí)間長導(dǎo)致票據(jù)殘舊,嚴(yán)重影響圖像成像質(zhì)量,導(dǎo)致字符背景非常復(fù)雜,把字符從圖像中提取出來存在困難。將圖像轉(zhuǎn)化成二值圖像后,不能有效提取字符,轉(zhuǎn)化后的效果如圖1.1所示。
[0005]將圖像轉(zhuǎn)化成二值圖像后可以對(duì)字符進(jìn)行定位,傳統(tǒng)的方法是利用二值圖像在水平方向和豎直方向的投影信息來達(dá)到定位的目的。該方法的局限在于算法依賴于二值化過程,當(dāng)目標(biāo)背景復(fù)雜或拍攝效果不佳時(shí),二值化后常發(fā)生字符斷裂或粘連現(xiàn)象。在這種情況下,投影信息變得不準(zhǔn)確,從而影響到定位效果。對(duì)圖1.1應(yīng)用投影法,將會(huì)得到如圖1.2所示的結(jié)果,圖中曲線Cl及C2分別是該圖在水平方向和豎直方向上的投影曲線,可見投影法并不能有效地確定字符的邊界。
【發(fā)明內(nèi)容】
[0006]本發(fā)明實(shí)施例提供了一種面向復(fù)雜背景的光學(xué)字符識(shí)別方法及裝置,采用先將原圖與邊緣檢測(cè)后的圖像疊加,然后對(duì)處理后的圖像進(jìn)行取反和高斯濾波,在此基礎(chǔ)上,再對(duì)處理后的圖像計(jì)算積分圖的方式,能夠在有效地抑制背景噪聲和突出字符信息的基礎(chǔ)上,實(shí)現(xiàn)字符的準(zhǔn)確快速定位和識(shí)別。
[0007]本發(fā)明實(shí)施例提供的面向復(fù)雜背景的光學(xué)字符識(shí)別方法,包括:
[0008]采集圖像信息,得到采集圖像;
[0009]根據(jù)字符特性從所述采集圖像中獲取目標(biāo)字符區(qū)域,作為目標(biāo)對(duì)象;
[0010]采用微分法提取所述目標(biāo)對(duì)象內(nèi)的字符邊緣信息,得到提取圖像;
[0011]將所述目標(biāo)對(duì)象和所述提取圖像疊加,得到恢復(fù)圖像;
[0012]對(duì)所述恢復(fù)圖像進(jìn)行取反和高斯濾波處理,得到處理圖像;[0013]在所述處理圖像內(nèi)搜索目標(biāo)字符位置;
[0014]對(duì)所述目標(biāo)字符位置進(jìn)行識(shí)別。
[0015]可選地,
[0016]所述步驟采集圖像信息包括:
[0017]利用圖像傳感器采集圖像信息。
[0018]可選地,
[0019]所述圖像傳感器包括:
[0020]全幅面接觸式圖像傳感器。
[0021]可選地,
[0022]所述步驟采用微分法提取所述目標(biāo)對(duì)象內(nèi)的字符邊緣信息包括:
[0023]采用Prewitt (普瑞維特)算子邊緣檢測(cè)法提取所述目標(biāo)對(duì)象內(nèi)的字符邊緣信息。
[0024]可選地,
[0025]所述步驟在所述處理圖像內(nèi)搜索目標(biāo)字符位置包括:
[0026]根據(jù)所述字符特性和所述處理圖像確定搜索框;
[0027]按預(yù)設(shè)規(guī)則將所述搜索框在所述處理圖像上連續(xù)滑動(dòng),并計(jì)算搜索框內(nèi)的像素灰度值之和,所述像素灰度值之和最大時(shí)所述搜索框所處的位置確定為目標(biāo)字符位置。
[0028]可選地,
[0029]所述步驟在所述處理圖像內(nèi)搜索目標(biāo)字符位置包括:
[0030]根據(jù)所述字符特性和所述處理圖像確定搜索框;
[0031]將所述處理圖像轉(zhuǎn)換成積分圖像;
[0032]按預(yù)設(shè)規(guī)則將所述搜索框在所述積分圖像上連續(xù)滑動(dòng),并計(jì)算搜索框內(nèi)的像素灰度值之和,所述像素灰度值之和最大時(shí)所述搜索框所處的位置確定為目標(biāo)字符位置;
[0033]所述積分圖像上某一點(diǎn)的值為從所述處理圖像的左上角到這個(gè)點(diǎn)所構(gòu)成的矩形區(qū)域內(nèi)所有像素灰度值之和。
[0034]本發(fā)明實(shí)施例提供的面向復(fù)雜背景的光學(xué)字符識(shí)別裝置,包括:
[0035]采集模塊,用于采集圖像信息,得到采集圖像;
[0036]獲取模塊,用于根據(jù)字符特性從所述采集圖像中獲取目標(biāo)字符區(qū)域,作為目標(biāo)對(duì)象;
[0037]提取模塊,用于采用微分法提取所述目標(biāo)對(duì)象內(nèi)的字符邊緣信息,得到提取圖像;
[0038]疊加模塊,用于將所述目標(biāo)對(duì)象和所述提取圖像疊加,得到恢復(fù)圖像;
[0039]處理模塊,用于對(duì)所述恢復(fù)圖像進(jìn)行取反和高斯濾波處理,得到處理圖像;
[0040]搜索模塊,用于在所述處理圖像內(nèi)搜索目標(biāo)字符位置;
[0041 ]識(shí)別模塊,用于對(duì)所述目標(biāo)字符位置進(jìn)行識(shí)別。
[0042]可選地,
[0043]所述搜索模塊包括:
[0044]第一確定子模塊,用于根據(jù)所述字符特性和所述處理圖像確定搜索框;
[0045]第一處理子模塊,用于按預(yù)設(shè)規(guī)則將所述搜索框在所述處理圖像上連續(xù)滑動(dòng),并計(jì)算搜索框內(nèi)的像素灰度值之和,所述像素灰度值之和最大時(shí)所述搜索框所處的位置確定為目標(biāo)字符位置。
[0046]可選地,
[0047]所述搜索模塊包括:
[0048]第二確定子單元,用于根據(jù)所述字符特性和所述處理圖像確定搜索框;
[0049]轉(zhuǎn)換子單元,用于將所述處理圖像轉(zhuǎn)換成積分圖像;
[0050]第二處理子模塊,用于按預(yù)設(shè)規(guī)則將所述搜索框在所述積分圖像上連續(xù)滑動(dòng),并計(jì)算搜索框內(nèi)的像素灰度值之和,所述像素灰度值之和最大時(shí)所述搜索框所處的位置確定為目標(biāo)字符位置。
[0051]本發(fā)明實(shí)施例中,首先采集圖像信息,得到采集圖像;接著根據(jù)字符特性從所述采集圖像中獲取目標(biāo)字符區(qū)域,作為目標(biāo)對(duì)象;然后采用微分法提取所述目標(biāo)對(duì)象內(nèi)的字符邊緣信息,得到提取圖像;接著將所述目標(biāo)對(duì)象和所述提取圖像疊加,得到恢復(fù)圖像;然后對(duì)所述恢復(fù)圖像進(jìn)行取反和高斯濾波處理,得到處理圖像;接著在所述處理圖像內(nèi)搜索目標(biāo)字符位置;最后對(duì)所述目標(biāo)字符位置進(jìn)行識(shí)別。由于本發(fā)明面向復(fù)雜背景的光學(xué)字符識(shí)別方法及裝置,采用先將原圖與邊緣檢測(cè)后的圖像疊加,然后對(duì)處理后的圖像進(jìn)行取反和高斯濾波,在此基礎(chǔ)上,根據(jù)處理后的圖像計(jì)算積分圖,并利用積分圖加速定位過程,能夠在有效地抑制背景噪聲和突出字符信息的基礎(chǔ)上,實(shí)現(xiàn)字符的準(zhǔn)確快速定位和識(shí)別。
【專利附圖】
【附圖說明】
[0052]圖1為現(xiàn)有技術(shù)中殘舊鈔票上的光學(xué)字符區(qū)域圖像示意圖;
[0053]圖1.1為現(xiàn)有技術(shù)中對(duì)殘舊鈔票直接應(yīng)用二值化的效果圖;
[0054]圖1.2為現(xiàn)有技術(shù)中對(duì)殘舊鈔票應(yīng)用二值圖像法定位的效果圖;
[0055]圖2為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第一實(shí)施例流程圖;
[0056]圖3為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第二實(shí)施例流程圖;
[0057]圖3.1為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第二實(shí)施例中采集圖像G的不意圖;
[0058]圖3.2為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第二實(shí)施例中目標(biāo)對(duì)象G1的不意圖;
[0059]圖3.3為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第二實(shí)施例中Prewitt算子方向模板的示意圖;
[0060]圖3.4為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第二實(shí)施例中像素灰度值之和的對(duì)比示意圖;
[0061]圖3.5為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第二實(shí)施例中積分圖像法計(jì)算像素灰度值之和的示意圖;
[0062]圖3.6為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第二實(shí)施例中20元紙幣的原始圖像不意圖;
[0063]圖3.7為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第二實(shí)施例中20元紙幣的目標(biāo)對(duì)象示意圖;
[0064]圖3.8為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第二實(shí)施例中20元紙幣的提取圖像示意圖;[0065]圖3.9為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第二實(shí)施例中20元紙幣的恢復(fù)圖像示意圖;
[0066]圖3.10為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第二實(shí)施例中20元紙幣的處理圖像示意圖;
[0067]圖3.11為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第二實(shí)施例中20元紙幣的積分圖像示意圖;
[0068]圖3.12為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第二實(shí)施例中20元紙幣的目標(biāo)字符位置示意圖;
[0069]圖4為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別裝置實(shí)施例第一結(jié)構(gòu)示意圖;
[0070]圖5為本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別裝置實(shí)施例第二結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0071]本發(fā)明實(shí)施例提供了一種面向復(fù)雜背景的光學(xué)字符識(shí)別方法及裝置,采用先將原圖與邊緣檢測(cè)后的圖像疊加,然后對(duì)處理后的圖像進(jìn)行取反和高斯濾波,在此基礎(chǔ)上,根據(jù)處理后的圖像計(jì)算積分圖,并利用積分圖加速定位過程,能夠在有效地抑制背景噪聲和突出字符信息的基礎(chǔ)上,實(shí)現(xiàn)字符的準(zhǔn)確快速定位和識(shí)別。
[0072]Prewitt (普瑞維特)算子是一種一階微分算子的邊緣檢測(cè),利用像素點(diǎn)上下、左右鄰點(diǎn)的灰度差,在邊緣處達(dá)到極值來檢測(cè)邊緣,能夠去掉部分偽邊緣,對(duì)噪聲具有平滑作用。其原理是在圖像空間利用兩個(gè)方向模板與圖像進(jìn)行鄰域卷積來完成的,這兩個(gè)方向模板一個(gè)用來檢測(cè)水平邊緣,一個(gè)用來檢測(cè)垂直邊緣。
[0073]積分圖像:對(duì)于一幅灰度的圖像,積分圖像中的任意一點(diǎn)(x,y)的值是指從圖像的左上角到這個(gè)點(diǎn)的所構(gòu)成的矩形區(qū)域內(nèi)所有的點(diǎn)的灰度值之和。
[0074]需要說明的是,本發(fā)明實(shí)施例的方法及裝置可以用于各種圖像字符的定位和識(shí)另O,例如車牌號(hào)碼的識(shí)別、紙幣冠字號(hào)碼的識(shí)別、身份證中身份證號(hào)碼的識(shí)別,以及各種產(chǎn)品包裝上印刷號(hào)碼的檢測(cè)等等。下面以紙幣冠字號(hào)碼的識(shí)別為例對(duì)本發(fā)明實(shí)施例的方法及裝置進(jìn)行說明,雖然僅以紙幣冠字號(hào)碼的識(shí)別為例進(jìn)行說明,但是不應(yīng)將此作為本發(fā)明方法及裝置的限定。
[0075]請(qǐng)參閱圖2,本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法的第一實(shí)施例包括:
[0076]201、采集圖像信息,得到采集圖像;
[0077]在對(duì)圖像中的字符進(jìn)行定位和識(shí)別之前,需要先采集待識(shí)別物品,例如身份證、車牌號(hào)碼等的圖像信息,采集完畢后可以得到采集圖像。
[0078]202、根據(jù)字符特性從采集圖像中獲取目標(biāo)字符區(qū)域,作為目標(biāo)對(duì)象;
[0079]目標(biāo)字符區(qū)域僅占整幅采集圖像的一部分,得到采集圖像之后,可以根據(jù)字符特性從采集圖像中獲取目標(biāo)字符區(qū)域,作為目標(biāo)對(duì)象。后續(xù)的定位分析以目標(biāo)對(duì)象為主,可以大幅度降低數(shù)據(jù)處理時(shí)間。
[0080]203、采用微分法提取目標(biāo)對(duì)象內(nèi)的字符邊緣信息,得到提取圖像;[0081]得到目標(biāo)對(duì)象之后,可以采用微分法提取目標(biāo)對(duì)象內(nèi)的字符邊緣信息,得到提取圖像。
[0082]204、將目標(biāo)對(duì)象和提取圖像疊加,得到恢復(fù)圖像;
[0083]得到提取圖像之后,可以將目標(biāo)對(duì)象和提取圖像疊加,進(jìn)而得到恢復(fù)圖像。
[0084]205、對(duì)恢復(fù)圖像進(jìn)行取反和高斯濾波處理,得到處理圖像;
[0085]得到恢復(fù)圖像之后,可以對(duì)恢復(fù)圖像進(jìn)行取反和高斯濾波處理,進(jìn)而得到處理圖像。
[0086]206、在處理圖像內(nèi)搜索目標(biāo)字符位置;
[0087]得到處理圖像之后,可以在處理圖像內(nèi)搜索目標(biāo)字符位置,從而確定目標(biāo)字符位置,以便后續(xù)對(duì)目標(biāo)字符的識(shí)別。
[0088]207、對(duì)目標(biāo)字符位置進(jìn)行識(shí)別。
[0089]確定目標(biāo)字符位置,可以對(duì)目標(biāo)字符位置內(nèi)的字符進(jìn)行識(shí)別,從而得到識(shí)別字符。
[0090]本發(fā)明實(shí)施例中,首先采集圖像信息,得到采集圖像;接著根據(jù)字符特性從采集圖像中獲取目標(biāo)字符區(qū)域,作為目標(biāo)對(duì)象;然后采用微分法提取目標(biāo)對(duì)象內(nèi)的字符邊緣信息,得到提取圖像;接著將目標(biāo)對(duì)象和提取圖像疊加,得到恢復(fù)圖像;然后對(duì)恢復(fù)圖像進(jìn)行取反和高斯濾波處理,得到處理圖像;接著在處理圖像內(nèi)搜索目標(biāo)字符位置;最后對(duì)目標(biāo)字符位置進(jìn)行識(shí)別。由于本發(fā)明面向復(fù)雜背景的光學(xué)字符識(shí)別方法,采用先將原圖與邊緣檢測(cè)后的圖像疊加,然后對(duì)處理后的圖像進(jìn)行取反和高斯濾波,在此基礎(chǔ)上,根據(jù)處理后的圖像計(jì)算積分圖,并利用積分圖加速定位過程,能夠在有效地抑制背景噪聲和突出字符信息的基礎(chǔ)上,實(shí)現(xiàn)字符的準(zhǔn)確快速定位和識(shí)別。
[0091]上面簡單介紹了本發(fā)明面向復(fù)雜背景的光學(xué)字符識(shí)別方法的第一實(shí)施例,下面對(duì)本發(fā)明面向復(fù)雜背景的光學(xué)字符識(shí)別方法的第二實(shí)施例進(jìn)行詳細(xì)的描述,請(qǐng)參閱圖3,本發(fā)明實(shí)施例中面向復(fù)雜背景的光學(xué)字符識(shí)別方法第二實(shí)施例包括:
[0092]301、采集圖像信息,得到采集圖像;
[0093]在對(duì)圖像中的字符進(jìn)行定位和識(shí)別之前,需要先采集待識(shí)別物品,例如身份證、車牌號(hào)碼等的圖像信息,采集完畢后可以得到采集圖像G。
[0094]請(qǐng)參閱圖3.1,上述采集圖像G可以通過圖像采集設(shè)備采集圖像信息得到,也可以通過圖像傳感器采集圖像信息得到,當(dāng)為圖像傳感器時(shí),可以為全幅面接觸式圖像傳感器。利用全幅面接觸式圖像傳感器采集圖像,能夠更加全面地采集圖像信息,從而保證圖像的內(nèi)容有效性。
[0095]302、根據(jù)字符特性從采集圖像中獲取目標(biāo)字符區(qū)域,作為目標(biāo)對(duì)象;
[0096]目標(biāo)字符區(qū)域僅占整幅采集圖像的一部分,得到采集圖像G之后,可以根據(jù)字符特性從采集圖像G中獲取目標(biāo)字符區(qū)域,作為目標(biāo)對(duì)象Gp后續(xù)的定位分析以目標(biāo)對(duì)象G1為主,可以大幅度降低數(shù)據(jù)處理時(shí)間。具體的目標(biāo)對(duì)象請(qǐng)參閱圖3.2。
[0097]303、采用微分法提取目標(biāo)對(duì)象的字符邊緣信息,得到提取圖像;
[0098]得到目標(biāo)對(duì)象之后,可以采用微分法提取目標(biāo)對(duì)象內(nèi)的字符邊緣信息,得到提取圖像,具體的,可以采用Prewitt (普瑞維特)算子邊緣檢測(cè)法提取目標(biāo)對(duì)象內(nèi)的字符邊緣信息。
[0099]微分算子的優(yōu)點(diǎn)是檢測(cè)邊緣的同時(shí)能抑制噪聲的影響。一階微分算子利用像素點(diǎn)上下、左右鄰點(diǎn)的灰度差來檢查邊緣,其原理是在圖像空間利用兩個(gè)方向模板與圖像進(jìn)行鄰域卷積來完成的,請(qǐng)參閱圖3.3,兩個(gè)方向模板中的一個(gè)檢測(cè)水平邊緣,一個(gè)檢測(cè)垂直邊緣。
[0100]對(duì)數(shù)字圖像f (X,y),微分算子定義為:
[0101]P(i,j) = max[G(i), G(j)]或 P(i, j) = G(i)+G(j)
[0102]其中G(i)與G(j)分別由(2-1)至(2-6)式定義。
[0103]G(i) = A1-B1(2-1)
[0104]A1 = f (1-1, j-l)+f (1-1, j)+f (1-1, j+1)(2-2)
[0105]B1 = f (i+1, j-l)+f (i+1, j)+f (i+1, j+1)(2-3)
[0106]G (j) = A2-B2(2-4)
[0107]A2 = f (1-1, j+l)+f (i, j+1)+f (i+1, j+1)(2-5)
[0108]B2 = f (1-1, j-l)+f (i, j-l)+f (i+1, j-1)(2-6)
[0109]目標(biāo)對(duì)象G1經(jīng)過微分算子處理后得到提取圖像G2, G2可以突顯邊緣信息。
[0110]304、將目標(biāo)對(duì)象和提取圖像疊加,得到恢復(fù)圖像;
[0111]得到提取圖像G2之后,可以將目標(biāo)對(duì)象G1和提取圖像G2疊加,進(jìn)而得到恢復(fù)圖像G3。
[0112]步驟503的過程中,雖然增強(qiáng)字符邊緣信息,但是相比于原圖,也丟失了一部分灰度信息。對(duì)61和G2進(jìn)行疊加運(yùn)算,可以恢復(fù)原圖的部分灰度信息的同時(shí)顯著地增強(qiáng)圖像效果,疊加運(yùn)算定義為:
[0113]G3 = max (O, min (255, G^G2))
[0114]305、對(duì)恢復(fù)圖像進(jìn)行取反和高斯濾波處理,得到處理圖像;
[0115]得到恢復(fù)圖像G3之后,可以對(duì)恢復(fù)圖像進(jìn)行取反和高斯濾波處理,進(jìn)而得到處理圖像G4。
[0116]上述對(duì)恢復(fù)圖像G3進(jìn)行取反的具體過程可以包括:G' = |255_G|,亦即取反圖像為|255-G3|,再對(duì)上述的取反圖像進(jìn)行高斯濾波Φ(6'),最后可以得到處理圖像G4。上述的取反和高斯濾波處理不但能夠凸顯字符的視覺效果,而且可以減少誤差傳遞帶來的噪聲,進(jìn)而使得圖像平滑。
[0117]306、在處理圖像內(nèi)搜索并確定目標(biāo)字符位置;
[0118]得到處理圖像G4之后,可以在處理圖像內(nèi)搜索目標(biāo)字符位置,從而確定目標(biāo)字符位置,以便后續(xù)對(duì)目標(biāo)字符的識(shí)別。
[0119]上述在處理圖像內(nèi)搜索目標(biāo)字符位置的具體過程可以為:根據(jù)字符特性和處理圖像確定搜索框;按預(yù)設(shè)規(guī)則將搜索框在處理圖像上連續(xù)滑動(dòng),并計(jì)算搜索框內(nèi)的像素灰度值之和,像素灰度值之和最大時(shí)搜索框所處的位置確定為目標(biāo)字符位置。具體的:
[0120](I)由于目標(biāo)字符位置總是最亮的,從數(shù)學(xué)表述上來看即是該區(qū)域所有像素灰度值之和相對(duì)周圍同等大小區(qū)域的灰度之和是最大的,請(qǐng)參閱圖3.4,即:
[0121]S1 > S2, S1 > S3,......;
[0122](2)目標(biāo)字符位置外接矩形的大小以及面積是相對(duì)固定,即:
[0123]S1 = Q,其中Q為常量;
[0124]因此可以先根據(jù)字符特性和處理圖像確定搜索框,然后按預(yù)設(shè)規(guī)則將搜索框在處理圖像上連續(xù)滑動(dòng),并計(jì)算搜索框內(nèi)的像素灰度值之和,像素灰度值之和最大時(shí)搜索框所處的位置確定為目標(biāo)字符位置。上述過程的耗時(shí)由下式?jīng)Q定,
[0125]TaNXS
[0126]其中N為搜索次數(shù),S正比于窗口的面積。
[0127]上述在處理圖像內(nèi)搜索目標(biāo)字符位置的具體過程也可以為:根據(jù)字符特性和處理圖像確定搜索框;將處理圖像轉(zhuǎn)換成積分圖像;按預(yù)設(shè)規(guī)則將搜索框在積分圖像上連續(xù)滑動(dòng),并計(jì)算搜索框內(nèi)的像素灰度值之和,像素灰度值之和最大時(shí)搜索框所處的位置確定為目標(biāo)字符位置。具體的:
[0128]對(duì)于一幅灰度圖像,積分圖像中的任一點(diǎn)(x,y)的值是從圖像的左上角到這個(gè)點(diǎn)所構(gòu)成的矩形區(qū)域內(nèi)所有像素點(diǎn)的灰度值之和,亦即:
【權(quán)利要求】
1.一種面向復(fù)雜背景的光學(xué)字符識(shí)別方法,其特征在于,包括: 采集圖像信息,得到采集圖像; 根據(jù)字符特性從所述采集圖像中獲取目標(biāo)字符區(qū)域,作為目標(biāo)對(duì)象; 采用微分法提取所述目標(biāo)對(duì)象內(nèi)的字符邊緣信息,得到提取圖像; 將所述目標(biāo)對(duì)象和所述提取圖像疊加,得到恢復(fù)圖像; 對(duì)所述恢復(fù)圖像進(jìn)行取反和高斯濾波處理,得到處理圖像; 在所述處理圖像內(nèi)搜索目標(biāo)字符位置; 對(duì)所述目標(biāo)字符進(jìn)行識(shí)別。
2.根據(jù)權(quán)利要求1所述的面向復(fù)雜背景的光學(xué)字符識(shí)別方法,其特征在于,所述步驟采集圖像信息包括: 利用圖像傳感器采集圖像信息。
3.根據(jù)權(quán)利要求2所述的面向復(fù)雜背景的光學(xué)字符識(shí)別方法,其特征在于,所述圖像傳感器包括: 全幅面接觸式圖像傳感器。
4.根據(jù)權(quán)利要求1所述的面向復(fù)雜背景的光學(xué)字符識(shí)別方法,其特征在于,所述步驟采用微分法提取所述目標(biāo)對(duì)象內(nèi)的字符邊緣信息包括: 采用Prewitt (普瑞維特)算子邊緣檢測(cè)法提取所述目標(biāo)對(duì)象內(nèi)的字符邊緣信息。
5.根據(jù)權(quán)利要求1所述的面向復(fù)雜背景的光學(xué)字符識(shí)別方法,其特征在于,所述步驟在所述處理圖像內(nèi)搜索目標(biāo)字符位置包括: 根據(jù)所述字符特性和所述處理圖像確定搜索框; 按預(yù)設(shè)規(guī)則將所述搜索框在所述處理圖像上連續(xù)滑動(dòng),并計(jì)算搜索框內(nèi)的像素灰度值之和,所述像素灰度值之和最大時(shí)所述搜索框所處的位置確定為目標(biāo)字符位置。
6.根據(jù)權(quán)利要求1所述的面向復(fù)雜背景的光學(xué)字符識(shí)別方法,其特征在于,所述步驟在所述處理圖像內(nèi)搜索目標(biāo)字符位置包括: 根據(jù)所述字符特性和所述處理圖像確定搜索框; 將所述處理圖像轉(zhuǎn)換成積分圖像; 按預(yù)設(shè)規(guī)則將所述搜索框在所述積分圖像上連續(xù)滑動(dòng),并計(jì)算搜索框內(nèi)的像素灰度值之和,所述像素灰度值之和最大時(shí)所述搜索框所處的位置確定為目標(biāo)字符位置; 所述積分圖像上某一點(diǎn)的值為從所述處理圖像的左上角到這個(gè)點(diǎn)所構(gòu)成的矩形區(qū)域內(nèi)所有像素灰度值之和。
7.一種面向復(fù)雜背景的光學(xué)字符識(shí)別裝置,其特征在于,包括: 采集模塊,用于采集圖像信息,得到采集圖像; 獲取模塊,用于根據(jù)字符特性從所述采集圖像中獲取目標(biāo)字符區(qū)域,作為目標(biāo)對(duì)象; 提取模塊,用于采用微分法提取所述目標(biāo)對(duì)象內(nèi)的字符邊緣信息,得到提取圖像; 疊加模塊,用于將所述目標(biāo)對(duì)象和所述提取圖像疊加,得到恢復(fù)圖像; 處理模塊,用于對(duì)所述恢復(fù)圖像進(jìn)行取反和高斯濾波處理,得到處理圖像; 搜索模塊,用于在所述處理圖像內(nèi)搜索目標(biāo)字符位置; 識(shí)別模塊,用于對(duì)所述目標(biāo)字符位置進(jìn)行識(shí)別。
8.根據(jù)權(quán)利要求7所述的面向復(fù)雜背景的光學(xué)字符識(shí)別裝置,其特征在于,所述搜索模塊包括: 第一確定子模塊,用于根據(jù)所述字符特性和所述處理圖像確定搜索框; 第一處理子模塊,用于按預(yù)設(shè)規(guī)則將所述搜索框在所述處理圖像上連續(xù)滑動(dòng),并計(jì)算搜索框內(nèi)的像素灰度值之和,所述像素灰度值之和最大時(shí)所述搜索框所處的位置確定為目標(biāo)字符位置。
9.根據(jù)權(quán)利要求7所述的面向復(fù)雜背景的光學(xué)字符識(shí)別裝置,其特征在于,所述搜索模塊包括: 第二確定子單元,用于根據(jù)所述字符特性和所述處理圖像確定搜索框; 轉(zhuǎn)換子單元,用于將所述處理圖像轉(zhuǎn)換成積分圖像; 第二處理子模塊,用于按預(yù)設(shè)規(guī)則將所述搜索框在所述積分圖像上連續(xù)滑動(dòng),并計(jì)算搜索框內(nèi)的像素灰度 值之和,所述像素灰度值之和最大時(shí)所述搜索框所處的位置確定為目標(biāo)字符位置。
【文檔編號(hào)】G06K9/20GK103544491SQ201310553984
【公開日】2014年1月29日 申請(qǐng)日期:2013年11月8日 優(yōu)先權(quán)日:2013年11月8日
【發(fā)明者】梁添才, 陳良旭, 趙邢瑜 申請(qǐng)人:廣州廣電運(yùn)通金融電子股份有限公司