用于冠字號識別的字符污染去除方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于數(shù)字圖像處理領(lǐng)域,尤其涉及一種用于冠字號識別的字符污染去除方 法。
【背景技術(shù)】
[0002] 紙幣作為流通幣,在人們的日常生活中起著舉足輕重的作用。在流通過程中,可能 會出現(xiàn)不同程度的污染,如紙幣自身的紅色油墨污染,鉛筆的涂寫,紙幣使用時間久了開始 破舊,紙幣圖像采集過程中光照不均以及無法避免的噪聲等各種原因給冠字號識別帶來一 定的困難。
[0003] 紙幣冠字號識別要求識別結(jié)果準確,為了能有效地對紙幣冠字號進行識別,在冠 字號分割的過程中,需要利用計算機視覺技術(shù)和圖像處理技術(shù)對污染的紙幣冠字號區(qū)域進 行處理,有效去除污染,得到可以識別的冠字號。
[0004]目前國內(nèi)外紙幣冠字號識別的方法很多,主要是針對七成新以上的紙幣,沒有對 冠字號污染的紙幣作處理的操作。有的對冠字號污染的紙幣處理,但只通過二值操作以及 中值濾波去噪等簡單的方法,不能有效的去除污染。目前針對污染過的冠字號紙幣還沒有 一種行之有效的方法,導(dǎo)致舊的污染紙幣冠字號識別率不高,影響程序的可靠性。
【發(fā)明內(nèi)容】
[0005] 針對現(xiàn)有技術(shù)的不足,本發(fā)明提供一種用于冠字號識別的字符污染去除方法,能 夠有效的去除冠字號的污染,提高冠字號的識別率。
[0006] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案如下,用于冠字號識別的字符污染去除 方法,包括以下步驟:
[0007] a)在冠字號所在區(qū)域的圖像I上確定11條分界線,使得相鄰的兩條分界線間有且 僅有單個冠字號的圖像;
[0008] b)初步確定相鄰分界線之間的區(qū)域中單個冠字號圖像的外接矩形框;
[0009] c)對單個冠字號的高度和寬度分別進行異常處理,從而最終確定10個冠字號的 外接矩形框。
[0010] 進一步的,所述在冠字號所在區(qū)域的圖像I上確定11條分界線,使得相鄰的兩條 分界線間有且僅有單個冠字號的圖像具體包括模板構(gòu)建過程與實際計算過程,其中模板構(gòu) 建過程包括如下步驟:
[0011] al)取一張紙幣,使用自適應(yīng)閾值方法,計算無污染圖像I的二值圖,其中白色為 前景,黑色為背景;
[0012] a2)計算二值圖的垂直投影,此垂直投影為一向量,記為pv= [Pl,p2,…pw],其中W 為圖像I的寬度;
[0013] a3)人工判斷圖像I中第一個冠字號的最左端離圖像左端的像素距離,記為s,另 外,當圖像的分辨率確定后,冠字號的總像素寬度是確定的,記為1,則抽取向量pv中第S個 到第 s+1-l 個元素,記為 pv' = [ps,ps+1,*"ps+11];
[0014] a4)重復(fù)步驟al) _a3),獲得\個p v',并將np個p v'求平均,則獲得一個模板m ;
[0015] a5)在9個間隔處將數(shù)值最低的位置進行標記,再加上頭尾兩處,一共可找到11條 分界線,將其橫坐標記為:b = [b。,h,…b1Q],其中bQ= 0, b 1Q= 1 ;
[0016] a6)每次取不同的紙幣,重復(fù)步驟al)-a5)nni次,獲得個不同的模板,記作 (岬,2,…,)和與之對應(yīng)的不同的分界線,記作汍62;
[0017] 實際計算過程包括如下步驟:
[0018] a7)取一張紙幣,使用自適應(yīng)閾值方法,計算無污染圖像I的二值圖,其中白色為 前景,黑色為背景;
[0019] a8)計算二值圖的垂直投影,此垂直投影為一向量,記為pv= [Pl,p2,…pw],其中W 為圖像I的寬度;
[0020] a9)分別計算pv與模板的相關(guān)系數(shù),并記錄其結(jié)果為 (^2,"、<^>其中,(;1,1 = 1,一,11|11為一個長度為評-1+1的向量;
[0021] alO)分別尋找(C2,…,q)中的最大值,記為并找到這些最大 值中的最大值,記其對應(yīng)的下標號為i,則應(yīng)選取的模板為1?,分界線為b1;
[0022] all)查找Cf"在^中的位置,并將其位置記為j,則可知第一條分界線離圖像左端 的距離為j,因此,圖像中真正的分界線為匕+j,從而確定了這11條分界線的位置。
[0023] 進一步的,所述步驟b)初步確定相鄰分界線之間的區(qū)域中單個冠字號圖像的外 接矩形框,具體包括:
[0024] bl)將11條分界線所隔的10個區(qū)域編號為…名:,每個區(qū)域中都有且僅 有一個冠字號圖像的外接矩形框,設(shè)之為?5·.·^,對于任意<,/= 1,…,10,都有四個表 征其在圖像中位置的屬性,即(1,r,u,b),分別表示該矩形的左、右、上、下邊到圖像I左、 右、上、下端的距離,初始時將其設(shè)為-1 ;
[0025] b2)對于任意民,將其左邊所在的區(qū)域記為礞,其右邊所在的區(qū)域記為<,若 = <,則跳轉(zhuǎn)至b4),否則跳轉(zhuǎn)至b3);
[0026] b3)將&在分界線b i,…A i處分裂,分裂為r-1+l個區(qū)域/?;,···,_/?廣+1,對于分裂 而成的任意矩形框,分別執(zhí)行步驟b4)的操作;
[0027] b4)若 < 對應(yīng)的 < 的(1,r,u,b)都為-1,則將i?f的(1,r,u,b)設(shè)為民的 (1丄1!,13),若<的(l,r,u,b)不為-1,則新的先的(l,r,u,b)值被分別設(shè)為原來的政和 民中的(l,r,u,b)的較小值;
[0028] b5)最后,查看中的每一個外接矩形的四個屬性,看其是否都非-1,若 都非-1,則10個冠字號的外界矩形框/廣/匕…/C成功建立,否則說明圖像I并非冠字號圖 像,不予處理。
[0029] 進一步的,步驟c)所述對單個字符寬度的異常處理采用第一寬度異常處理方法 或第二寬度異常處理方法,對單個字符的高度的異常處理采用第一高度異常處理方法或第 二高度異常處理方法。
[0030] 進一步的,所述第一高度異常處理方法具體包括如下步驟:
[0031] dl)確定切割范圍:若第1至第4個字符中的某個字符超過其右側(cè)字符的高度,則 說明該字符存在污染,第1個字符可根據(jù)右側(cè)字符來限定切割范圍,第2至4個字符可根 據(jù)其左側(cè)與右側(cè)字符的高度來限定切割范圍,同樣的,若第7至第10個字符中的某個字符 超過其左側(cè)字符的高度,則說明該字符存在污染,第10個字符可根據(jù)左側(cè)字符來限定切割 范圍,第7至9個字符可根據(jù)其左側(cè)與右側(cè)字符的高度來限定切割范圍,對于中間的兩個字 符,取第四個與第七個字符之和加上5后再除以2取整后的值作為上限,上限減去2作為下 限;
[0032] d2)在切割范圍的行數(shù)內(nèi),計算各行的代價函數(shù):
[0033] Breakcost = (out_value-in_value)X (cur_row-least_row+2)/out_num
[0034] 其中,out_value為當前行的暗色點(局部閾值)平均灰度,in_value為當前行內(nèi) 側(cè)相鄰行的暗色點(局部閾值)平均灰度,cur_row為當前去除的行數(shù),least_row為估計 得到的至少需要去除的行數(shù),〇ut_num為當前行暗色點(局部閾值)的個數(shù);
[0035] d3)比較所有得到的代價值,從最大的代價值所對應(yīng)的行數(shù)開始切割字符。
[0036] 進一步的,所述第二高度異常處理方法具體包括如下步驟:
[0037] el)當紙幣的橫向分辨率和縱向分辨率都確定后,對于十個單獨的字符圖像,設(shè)定 其期望高度h。,…h(huán)9;
[0038] e2)對于任意第i個字符圖像,設(shè)投票數(shù)vote_y = 0 ;
[0039] e3)計算異常字符的垂直中心與10個字符的平均垂直中心,若異常字符的垂直中 心較平均中心小,則 vote_y: = vote_y+l,否則 vote_y: = vote_y_l ;
[0040] e4)計算異常字符的垂直中心矩,若字符的垂直中心小于中心矩,則vote_y:= vote_y_l,否則 vote_y: = vote_y+l ;
[0041] e5)計算最上面一行和最下面一行的黑點的平均灰度,若最下面一行的黑點平均 灰度小于最上面的,則 v〇te_y: = vote_y_l,否則 vote_y: = vote_y+l ;
當前第1頁
1 
2 
3 
4