一種基于對(duì)比度增強(qiáng)法的降質(zhì)文檔圖像二值化方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及基于對(duì)比度增強(qiáng)法的降質(zhì)文檔圖像二值化方法。屬于圖像處理技術(shù)領(lǐng) 域,涉及對(duì)降質(zhì)文檔圖像的二值化方法,可用于OCR系統(tǒng)對(duì)降質(zhì)文檔圖像字符識(shí)別的預(yù)處 理,具體是一種基于對(duì)比度增強(qiáng)法的降質(zhì)文檔圖像二值化方法。
【背景技術(shù)】
[0002] OCR技術(shù)(Optical Character Recognition,光學(xué)字符識(shí)別)是將紙質(zhì)文字信息 錄入到計(jì)算機(jī)中最高效的方法。而OCR系統(tǒng)的識(shí)別效率則取決于文檔圖像的質(zhì)量。對(duì)于降 質(zhì)文檔圖像的識(shí)別,目前的OCR技術(shù)存在的不足主要表現(xiàn)為二值化后的文檔圖像丟失了大 量的有效信息,無(wú)法得到連續(xù)、完整的筆畫結(jié)構(gòu),嚴(yán)重影響后續(xù)的識(shí)別結(jié)果。雖然大量學(xué)者 已經(jīng)對(duì)文檔圖像二值化研究多年,但對(duì)于從降質(zhì)文檔圖像(如圖像中存在陰影、非均勻光 照、墨跡透背、模糊等)中提取出清晰字符仍是圖像處理領(lǐng)域的一個(gè)難點(diǎn)。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明是要解決現(xiàn)有方法無(wú)法從降質(zhì)文檔圖像中提取出清晰字符的問(wèn)題,而提供 了一種基于對(duì)比度增強(qiáng)法的降質(zhì)文檔圖像二值化方法。
[0004] -種基于對(duì)比度增強(qiáng)法的降質(zhì)文檔圖像二值化方法,按以下步驟實(shí)現(xiàn):
[0005] 步驟1 :讀取降質(zhì)文檔圖像,對(duì)降質(zhì)文檔圖像進(jìn)行灰度變換,輸出灰度級(jí)為256的 灰度圖像;
[0006] 步驟2 :利用四叉樹(shù)原理,根據(jù)灰度對(duì)比度信息,區(qū)分強(qiáng)灰度對(duì)比度區(qū)域與弱灰度 對(duì)比度區(qū)域;
[0007] 步驟3 :對(duì)于強(qiáng)灰度對(duì)比度區(qū)域,采用弱灰度對(duì)比度增強(qiáng)法調(diào)整區(qū)域像素點(diǎn)灰度 值;對(duì)于弱灰度對(duì)比度區(qū)域,采用強(qiáng)灰度對(duì)比度增強(qiáng)法調(diào)整區(qū)域像素點(diǎn)灰度值;
[0008] 步驟4 :根據(jù)強(qiáng)灰度對(duì)比度區(qū)域與弱灰度對(duì)比度區(qū)域像素點(diǎn)灰度值出現(xiàn)的頻率確 定局部閾值;
[0009] 步驟5 :令強(qiáng)灰度對(duì)比度區(qū)域與弱灰度對(duì)比度區(qū)域像素點(diǎn)灰度值大于局部閾值的 像素點(diǎn)的灰度值為255 ;令強(qiáng)灰度對(duì)比度區(qū)域與弱灰度對(duì)比度區(qū)域像素點(diǎn)灰度值小于局部 閾值的像素點(diǎn)的灰度值為〇,輸出二值圖像。
[0010] 發(fā)明效果:
[0011] 因此本發(fā)明提出一種新的二值化算法,針對(duì)不同的降質(zhì)原因,在不同的區(qū)域選擇 恰當(dāng)?shù)膮^(qū)域?qū)Ρ榷仍鰪?qiáng)法,從而達(dá)到理想的分割效果。
[0012] 應(yīng)用本實(shí)施方式算法處理的二值圖像,具有最高的F-measure值(高于次高OTSU 算法4% )、最高的PSNR值(高于次高Sauvola算法5% )及較低的NRM值。說(shuō)明本實(shí)施方 式算法可以最好的還原目標(biāo)像素點(diǎn),同時(shí)說(shuō)明應(yīng)用本實(shí)施方式算法輸出的二值圖像最接近 實(shí)際未降質(zhì)文檔的二值圖像,且本實(shí)施方式算法的誤分割率較小。說(shuō)明應(yīng)用本實(shí)施方式算 法處理的降質(zhì)文檔圖像具有最優(yōu)的分割質(zhì)量。
【附圖說(shuō)明】
[0013] 圖1為本發(fā)明流程圖;
[0014] 圖2(a)是第一次區(qū)域劃分原理示意圖;
[0015] 圖2(b)是第二次區(qū)域劃分原理示意圖;其中,所述□背景區(qū)域;隱灰度對(duì)比度顯 著區(qū)域;腿灰度對(duì)比度較顯著區(qū)域;
[0016] 圖3 (a)為待測(cè)試圖像;
[0017] 圖3 (b)為用OTSU方法的二值化圖像;
[0018] 圖3 (c)為用Niblack方法的二值化圖像;
[0019] 圖3 (d)為用Sauvola方法的二值化圖像;
[0020] 圖3 (e)為用Singh方法的二值化圖像;
[0021] 圖3(f)為用本發(fā)明方法的二值化圖像;
[0022] 圖4(a)為待測(cè)試圖像;
[0023] 圖4 (b)為用OTSU方法的二值化圖像;
[0024] 圖4 (c)為用Niblack方法的二值化圖像;
[0025] 圖4 (d)為用Sauvola方法的二值化圖像;
[0026] 圖4 (e)為用Singh方法的二值化圖像;
[0027] 圖4(f)為用本發(fā)明方法的二值化圖像;
[0028] 圖5 (a)為待測(cè)試圖像;
[0029] 圖5 (b)為用OTSU方法的二值化圖像;
[0030] 圖5 (c)為用Niblack方法的二值化圖像;
[0031] 圖5 (d)為用Sauvola方法的二值化圖像;
[0032] 圖5 (e)為用Singh方法的二值化圖像;
[0033] 圖5 (f)為用本發(fā)明方法的二值化圖像;
[0034] 圖6 (a)為待測(cè)試圖像;
[0035] 圖6 (b)為用OTSU方法的二值化圖像;
[0036] 圖6 (c)為用Niblack方法的二值化圖像;
[0037] 圖6 (d)為用Sauvola方法的二值化圖像;
[0038] 圖6 (e)為用Singh方法的二值化圖像;
[0039] 圖6 (f)為用本發(fā)明方法的二值化圖像。
【具體實(shí)施方式】
【具體實(shí)施方式】 [0040] 一:本實(shí)施方式的一種基于對(duì)比度增強(qiáng)法的降質(zhì)文檔圖像二值化方 法,按以下步驟實(shí)現(xiàn):
[0041] 步驟1 :讀取降質(zhì)文檔圖像,對(duì)降質(zhì)文檔圖像進(jìn)行灰度變換,輸出灰度級(jí)為256的 灰度圖像;
[0042] 步驟2 :利用四叉樹(shù)原理,根據(jù)灰度對(duì)比度信息,區(qū)分強(qiáng)灰度對(duì)比度區(qū)域與弱灰度 對(duì)比度區(qū)域;
[0043] 步驟3 :對(duì)于強(qiáng)灰度對(duì)比度區(qū)域,采用弱灰度對(duì)比度增強(qiáng)法調(diào)整區(qū)域像素點(diǎn)灰度 值;對(duì)于弱灰度對(duì)比度區(qū)域,采用強(qiáng)灰度對(duì)比度增強(qiáng)法調(diào)整區(qū)域像素點(diǎn)灰度值;
[0044] 步驟4 :根據(jù)強(qiáng)灰度對(duì)比度區(qū)域與弱灰度對(duì)比度區(qū)域像素點(diǎn)灰度值出現(xiàn)的頻率確 定局部閾值;
[0045] 步驟5 :令強(qiáng)灰度對(duì)比度區(qū)域與弱灰度對(duì)比度區(qū)域像素點(diǎn)灰度值大于局部閾值的 像素點(diǎn)的灰度值為255 ;令強(qiáng)灰度對(duì)比度區(qū)域與弱灰度對(duì)比度區(qū)域像素點(diǎn)灰度值小于局部 閾值的像素點(diǎn)的灰度值為〇,輸出二值圖像。
【具體實(shí)施方式】 [0046] 二:本實(shí)施方式與一不同的是:所述步驟2具體為:
[0047] (2a)計(jì)算降質(zhì)文檔圖像像素點(diǎn)坐標(biāo)為(X,y)處灰度值為f(x, y)的灰度對(duì)比度 D (X, y),其計(jì)算公式為:
[0048] D(x,y) = max [Dh (x, y), Dv (x, y) ] (I)
[0049] Dh(x, y) = | f (x, y)-f (χ-l, y) (2)
[0050] Dv(x, y) = I f (x, y)-f (x, y-1) (3)
[0051] 其中,Dh(x, y)和Dv(x, y)分別是像素點(diǎn)f(x, y)水平方向和豎直方向的灰度對(duì)比 度,f (x-1,y)是f (X,y)水平方向左側(cè)像素點(diǎn)的灰度值,f (X,y-ι)是f (X,y)豎直方向下側(cè) 像素點(diǎn)的灰度值;
[0052] (2b)利用四叉樹(shù)原理,根據(jù)灰度對(duì)比度對(duì)降質(zhì)文檔圖像進(jìn)行區(qū)域劃分:
[0053] 第一次四分后,若任一區(qū)域內(nèi)的最大灰度對(duì)比度小于等于a倍整體區(qū)域的最大灰 度對(duì)比度,即公式4,說(shuō)明該區(qū)域的灰度變化不顯著,則認(rèn)為該區(qū)域均為背景區(qū)域,直接輸出 該區(qū)域,對(duì)剩余區(qū)域繼續(xù)進(jìn)行細(xì)分;
[0054] Dftliax (X,y)彡 a · Dentiremax (χ, y) (4)
[0055] 其中,所述DD_(x,y)為第一次四分后任一區(qū)域內(nèi)的最大灰度對(duì)比度, Daitiraiiax(Xj)為整體區(qū)域的最大灰度對(duì)比度;
[0056] (2c)第二次四分后,若任一第二次四分后形成的DD區(qū)域內(nèi)的最大灰度對(duì)比度小 于等于a倍的第一次四分后任一區(qū)域內(nèi)的最大灰度對(duì)比度,即公式5,說(shuō)明該區(qū)域的灰度變 化不顯著,則認(rèn)為該區(qū)域均為背景區(qū)域,直接輸出該區(qū)域;
[0057] 若任一第二次四分后形成的AC區(qū)域內(nèi)的最大灰度對(duì)比度大于等于b倍的第一次 四分后形成的A區(qū)域內(nèi)的最大灰度對(duì)比度,即公式6,說(shuō)明該區(qū)域?yàn)榛叶茸兓浅o@著區(qū) 域,則對(duì)該區(qū)域進(jìn)行弱灰度對(duì)比度增強(qiáng)法處理;
[0058] 若任一第二次四分后形成的BA區(qū)域內(nèi)的最大灰度對(duì)比度介于a和b倍的第一次 四分后形成的B區(qū)域內(nèi)的最大灰度對(duì)比度之間即公式7,說(shuō)明該區(qū)域?yàn)榛叶茸兓^顯著區(qū) 域,則對(duì)該區(qū)域進(jìn)行強(qiáng)灰度對(duì)比度增強(qiáng)法處理;
[0062] 其中,所述Ddd_ (X,y)第二次四分后形成的DD區(qū)域內(nèi)的最大灰度對(duì)比度, DACnax(x,y)第二次四分后形成的AC區(qū)域內(nèi)的最大灰度對(duì)比度,DBAmax(x,y)第二次四分后形 成的BA區(qū)域內(nèi)的最大灰度對(duì)比度,D amx (χ, y)第一次四分后形成的A區(qū)域內(nèi)的最大灰度對(duì) 比度,DB_(x,y)第一次四分后形成的B區(qū)域內(nèi)的最大灰度對(duì)比度。
[0063] 實(shí)驗(yàn)證明a e [0, 0· 4],b e [0· 7, 1]。且對(duì)圖像進(jìn)行兩次四分來(lái)確定區(qū)域的灰度 變化屬性是最佳四分次數(shù),過(guò)多的四分會(huì)導(dǎo)致計(jì)算量過(guò)大,且容易將噪聲點(diǎn)誤分成目標(biāo),不 能很好的將噪點(diǎn)處理掉。過(guò)少的四分雖然會(huì)減小計(jì)算量,但同時(shí)也將丟失過(guò)多的細(xì)節(jié),達(dá)不 到理想的分割效果。
[0064] 其它步驟及參數(shù)與【具體實(shí)施方式】一相同。
【具體實(shí)施方式】 [0065] 三:本實(shí)施方式與一或二不同的是:所述步驟3具體 為:
[0066] (3a)對(duì)于灰度變化非常顯著區(qū)域,采用弱灰度對(duì)比度增強(qiáng)法,將區(qū)域內(nèi)各像素點(diǎn) 灰度值調(diào)整為