專利名稱:一種文字圖像濃淡調(diào)整的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及文字圖像處理領(lǐng)域,具體涉及一種文字圖像濃淡調(diào)整的方法。
背景技術(shù):
在文字圖像處理時(shí),由于掃描條件的不同,掃描出的文檔圖像灰度分布也不同。對(duì)于實(shí)際的版面數(shù)字化生產(chǎn)中,不同的OCR (Optical Character Recognition,光學(xué)字符識(shí)別)引擎對(duì)于不同“濃淡”程度的文字圖像準(zhǔn)確率也不同。有些對(duì)于“淡”一些的文字識(shí)別率較高,有些對(duì)于“濃” 一些的文字識(shí)別率較高。當(dāng)灰度圖作為輸出保存時(shí),則需要將文字調(diào)整到人眼閱讀舒適的程度。在圖像處理領(lǐng)域已有很多的圖像灰度調(diào)整技術(shù),如直方圖均衡等。但是這些通用的灰度調(diào)整技術(shù)并非專門針對(duì)文字掃描圖像所設(shè)計(jì)的,也無法給出“濃淡”度量。而在生產(chǎn)中還在使用工人利用圖像處理軟件手工調(diào)整的方式,如灰階、拉曲線等方式。由于每一頁都需要調(diào)整,對(duì)于大規(guī)模的圖書加工,效率低、成本高,無法滿足要求。此外由于對(duì)于“濃淡”的判斷主觀性很強(qiáng),不同人的認(rèn)知可能不同,因此,需要利用圖像處理技術(shù)設(shè)計(jì)一種自動(dòng)調(diào)整的方法,。在現(xiàn)有技術(shù)中,申請(qǐng)?zhí)枮镃N201010568385.3、名稱為“一種調(diào)整版面濃淡的方法與系統(tǒng)”的專利申請(qǐng)公開了一種調(diào)整版面濃淡的方法與系統(tǒng)。此篇專利中的調(diào)整方法利用的是二值圖中的黑白像素比例,但是無法得到灰度圖,其本質(zhì)是調(diào)整二值圖中文字比劃的粗細(xì)?,F(xiàn)有技術(shù)存在的問題是僅僅利用二值圖黑白像素?cái)?shù)量比例,只能輸出二值圖,反應(yīng)了筆畫的粗細(xì),但無法反映文字灰度的深淺。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明的目的在于提供一種文字圖像濃淡調(diào)整的方法,通過該方法實(shí)現(xiàn)對(duì)文字圖像的自動(dòng)處理方法,不僅能夠反映筆畫的粗細(xì),還能夠反映筆畫灰度的深淺,同時(shí)保持文字邊界處的灰階變化。為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下:一種文字圖像濃淡調(diào)整的方法,包括以下步驟:(I)獲得文字圖像的灰度直方圖以及文字圖像的初始黑場值和初始白場值,并對(duì)文字圖像進(jìn)行二值化處理得到文字圖像的二值圖像;(2)將二值圖像進(jìn)行連通域標(biāo)記,并計(jì)算每個(gè)連通域的最小外接矩形和細(xì)化骨架區(qū)域;(3)分別計(jì)算每個(gè)連通域的最小外接矩形區(qū)域內(nèi)所有像素點(diǎn)的黑度和值,和每個(gè)連通域的細(xì)化骨架區(qū)域內(nèi)所有像素點(diǎn)的黑度和值,并計(jì)算每個(gè)連通域的最小外接矩形內(nèi)所有像素點(diǎn)的黑度和值與該連通域的細(xì)化骨架區(qū)域內(nèi)所有像素點(diǎn)的黑度和值的比值,記為黑度和值比;其中,黑度和值為所有像素點(diǎn)的黑度值之和,黑度值Dark(x,y) = l_f(x,y),f(x,y)表示像素點(diǎn)坐標(biāo)為(x,y)的像素值歸一化后的像素值;
(4)計(jì)算文字圖像的濃淡值dense,濃淡值是指所有連通域的黑度和值比的和與連通域的個(gè)數(shù)的比值;(5)查看濃淡值dense與設(shè)定濃淡值的誤差絕對(duì)值是否小于設(shè)定值,若是則結(jié)束對(duì)文字圖像的調(diào)整;若否則調(diào)整文字圖像的黑場值或/和白場值并返回步驟(2);所述設(shè)定濃淡值是用戶根據(jù)實(shí)際文字圖像調(diào)整需要而設(shè)定的文字圖像的目標(biāo)濃淡值。進(jìn)一步,如上所述的一種文字圖像濃淡調(diào)整的方法,步驟(5)中,若調(diào)整文字圖像的黑場值或/和白場值后,若重新計(jì)算濃淡值dense的次數(shù)達(dá)到設(shè)定的計(jì)算次數(shù)的邊界條件,則結(jié)束對(duì)文字圖像的調(diào)整。進(jìn)一步,如上所述的一種文字圖像濃淡調(diào)整的方法,步驟(5)中,所述設(shè)定值的范圍為 0.001 0.01。進(jìn)一步,如上所述的一種文字圖像濃淡調(diào)整的方法,所述設(shè)定值的優(yōu)選值為
0.001。進(jìn)一步,如上所述的一種文字圖像濃淡調(diào)整的方法,在對(duì)文字圖像的濃淡進(jìn)行調(diào)整前,將文字圖像的像素值歸一化到
。進(jìn)一步,如上所述的一種文字圖像濃淡調(diào)整的方法,步驟(2)中,計(jì)算每個(gè)連通域的最小外接矩形后,還包括對(duì)所述連通域進(jìn)行合并,合并的具體方式如下:確定文字語言種類,若是中文為主,則合并連通域最小外接矩形處于相交、包含位置關(guān)系的連通域;若是英文為主,則合并連通域最小外接矩形之間間隙小于設(shè)定值的相鄰連通域。
`
進(jìn)一步,如上所述的一種文字圖像濃淡調(diào)整的方法,步驟(2)中,對(duì)連通域進(jìn)行合并后,還包括對(duì)連通域的篩選,篩選的具體方式如下:確定文字語言種類,若是中文為主,則篩選M個(gè)合并后最小外接矩形為正方形的合并連通域;若是英文為主,則篩選N個(gè)合并后滿足設(shè)定的字符長度的合并連通域,其中,10 ^ M ^ 40,10 ^ N ^ 40。再進(jìn)一步,如上所述的一種文字圖像濃淡調(diào)整的方法,所述設(shè)定的字符長度為4 12個(gè)字符長度。更進(jìn)一步,如上所述的一種文字圖像濃淡調(diào)整的方法,步驟(I)中,若文字圖像的灰度直方圖集中在中部,根據(jù)設(shè)定的分布概率對(duì)灰度直方圖兩端進(jìn)行裁切。本發(fā)明的效果在于:本發(fā)明所述的方法,給出了一種圖像濃淡值的計(jì)算方法,通過該濃淡值能夠客觀的描述圖像“濃淡”,通過該方法,不僅能夠體現(xiàn)文字圖像中文字筆畫的粗細(xì),還能體現(xiàn)筆畫灰度的深淺,通過計(jì)算的圖像濃淡值與用戶設(shè)定濃淡值的對(duì)比,確定圖像最終的濃淡值,達(dá)到用戶所需的文字圖像的濃淡要求,得到不同視覺效果的灰度圖。
圖1為本發(fā)明一種文字圖像濃淡調(diào)整方法的流程圖;圖2為實(shí)施方式中濃淡值調(diào)整的具體流程圖;圖3為實(shí)施例中調(diào)整前的文字圖像的原始圖像;圖4為實(shí)施例中對(duì)原始圖像進(jìn)行二值化處理后的圖像;圖5為實(shí)施例中對(duì)二值圖像進(jìn)行初始連通域標(biāo)記后的圖像;
圖6為實(shí)施例中對(duì)初始連通域進(jìn)行連通域合并后的圖像;圖7為實(shí)施例中對(duì)合并后的連通域進(jìn)行細(xì)化后的細(xì)化骨架區(qū)域圖像;圖8為實(shí)施例中對(duì)合并后的連通域進(jìn)行篩選的結(jié)果圖;圖9為實(shí)施例中設(shè)定濃淡值為0.8時(shí)調(diào)整結(jié)果;圖10為實(shí)施例中設(shè)定濃淡值為0.4的調(diào)整結(jié)果。
具體實(shí)施例方式為了便于對(duì)發(fā)明更好的理解,首先對(duì)本發(fā)明所涉及到的相關(guān)知識(shí)進(jìn)行簡單的介紹:RGB色彩模式是工業(yè)界的一種顏色標(biāo)準(zhǔn),使用RGB模型為圖像中每一個(gè)像素的RGB分量分配一個(gè)O 255范圍內(nèi)的強(qiáng)度值。每種RGB成分都可使用從O到255的值。當(dāng)所有成分的值均為255時(shí),結(jié)果是純白色,當(dāng)該值為O時(shí),結(jié)果是純黑色。黑場與白場最早是印刷行業(yè)的概念,黑場通常指圖像中最暗的一部分像素,白場指圖像中最亮的一部分像素。在圖像處理時(shí),通過調(diào)整黑場值或白場值,使圖像中的其它色階在O到255之間重新分布,增強(qiáng)圖像的整體對(duì)比度。例如,將黑場值設(shè)置為5,將白場值設(shè)置為243,則圖像中等于或低于5的所有像素都會(huì)映射到色階0,等于或高于242的所有像素都會(huì)映射到色階255,這種映射將會(huì)影響每個(gè)通道中最亮和最暗的像素,其它通道中的相應(yīng)形式會(huì)按比例調(diào)整以避免改變色彩平衡。字符圖像的二值圖寬度反映了筆畫的粗細(xì),而在灰度圖中骨架線的位置是筆畫最黑的位置。通過調(diào)整黑場值和/或白場值進(jìn)行灰度拉伸,黑色/白色必將從筆畫的最中心開始向外擴(kuò)張,最終整個(gè)字符變?yōu)槿?全白。根據(jù)不同的黑場值、白場值對(duì)應(yīng)不同的灰度圖,得到不同的視覺效果。下面結(jié)合說明書附圖與具體實(shí)施方式
對(duì)本發(fā)明做進(jìn)一步的詳細(xì)說明。圖1示出了本發(fā)明一種文字圖像濃淡調(diào)整方法的流程圖,由圖中可以看出該方法主要包括以下5個(gè)步驟:步驟Sll:獲得文字圖像的灰度直方圖和二值圖像;獲得文字圖像的灰度直方圖以及文字圖像的黑場值,并對(duì)文字圖像進(jìn)行二值化處理得到文字圖像的二值圖像?;叶戎狈綀D用于表示圖象中具有每種灰度級(jí)的像素的個(gè)數(shù),反映圖象中每種灰度出現(xiàn)的頻率。獲得文字圖像的直方圖后,得到文字圖像的最初黑場值。在對(duì)文字圖像進(jìn)行調(diào)整前,將文字圖像的像素值歸一化到
,使圖像像素的處理轉(zhuǎn)化成一種無量綱的處理,簡化圖像的處理過程。如果得到的文字圖像的灰度直方圖主要集中在中部,可以按照設(shè)定的分布概率對(duì)灰度直方圖兩端進(jìn)行裁切,即把兩端像素較少的歸為O或255,使得灰度直方圖更窄,更不能體現(xiàn)濃淡變化。裁切時(shí)切割線以是一端像素占總體像素一定比例的位置,比如1%。步驟S12:確定文字圖像的連通域,并計(jì)算連通域的最小外接矩形區(qū)域和細(xì)化骨架區(qū)域;將二值圖像進(jìn)行連通域標(biāo)記,并計(jì)算每個(gè)連通域的最小外接矩形和細(xì)化骨架區(qū)域。得到每個(gè)連通域的最小外接矩形后,對(duì)連通域進(jìn)行合并與篩選,具體方式如下:首先確定文字語言種類,若是中文為主,則合并連通域最小外接矩形處于相交、包含位置關(guān)系的連通域,篩選M個(gè)合并后最小外接矩形為正方形的合并連通域;若是英文為主,則合并連通域最小外接矩形之間間隙小于設(shè)定值的相鄰連通域,并篩選N個(gè)合并后滿足設(shè)定的字符長度的合并連通域,其中,10 SMS 40,10 < NS 40。設(shè)定的字符長度由用戶根據(jù)需要進(jìn)行設(shè)定,一般為4 12個(gè)字符長度。步驟S13:計(jì)算連通域的最小外接矩形區(qū)域和細(xì)化骨架區(qū)域的黑度和值;分別計(jì)算每個(gè)連通域的最小外接矩形區(qū)域內(nèi)所有像素點(diǎn)的黑度和值,和每個(gè)連通域的細(xì)化骨架區(qū)域內(nèi)所有像素點(diǎn)的黑度和值,并計(jì)算每個(gè)連通域的最小外接矩形內(nèi)所有像素點(diǎn)的黑度和值與該連通域的細(xì)化骨架區(qū)域內(nèi)所有像素點(diǎn)的黑度和值的比值,記為黑度和值比;其中,黑度和值為所有像素點(diǎn)的黑度值之和,黑度值Dark(x,y) = 1-f (x, y), f (x, y)表示像素點(diǎn)坐標(biāo)為(x,y)的像素值歸一化后的像素值。步驟S14:得到文字圖像的濃淡值dense ;計(jì)算文字圖像的濃淡值,即所有連通域的黑度和值比的和與連通域的個(gè)數(shù)的比值,計(jì)算公式如下:
權(quán)利要求
1.一種文字圖像濃淡調(diào)整的方法,包括以下步驟: (1)獲得文字圖像的灰度直方圖以及文字圖像的初始黑場值和初始白場值,并對(duì)文字圖像進(jìn)行二值化處理得到文字圖像的二值圖像; (2)將二值圖像進(jìn)行連通域標(biāo)記,并計(jì)算每個(gè)連通域的最小外接矩形和細(xì)化骨架區(qū)域; (3)分別計(jì)算每個(gè)連通域的最小外接矩形區(qū)域內(nèi)所有像素點(diǎn)的黑度和值,和每個(gè)連通域的細(xì)化骨架區(qū)域內(nèi)所有像素點(diǎn)的黑度和值,并計(jì)算每個(gè)連通域的最小外接矩形內(nèi)所有像素點(diǎn)的黑度和值與該連通域的細(xì)化骨架區(qū)域內(nèi)所有像素點(diǎn)的黑度和值的比值,記為黑度和值比;其中,黑度和值為所有像素點(diǎn)的黑度值之和,黑度值Dark(x,y) = 1-f (x, y), f (x, y)表示像素點(diǎn)坐標(biāo)為(x,y)的像素值歸一化后的像素值; (4)計(jì)算文字圖像的濃淡值dense,濃淡值是指所有連通域的黑度和值比的和與連通域的個(gè)數(shù)的比值; (5)查看濃淡值dense與設(shè)定濃淡值的誤差絕對(duì)值是否小于設(shè)定值,若是則結(jié)束對(duì)文字圖像的調(diào)整;若否則調(diào)整文字圖像的黑場值或/和白場值并返回步驟(2);所述設(shè)定濃淡值是用戶根據(jù)實(shí)際文字圖像調(diào)整需要而設(shè)定的文字圖像的目標(biāo)濃淡值。
2.如權(quán)利要求1所述的一種文字圖像濃淡調(diào)整方法,其特征在于:步驟(5)中,若調(diào)整文字圖像的黑場值或/和白場值后,若重新計(jì)算濃淡值dense的次數(shù)達(dá)到設(shè)定的計(jì)算次數(shù)的邊界條件,則結(jié)束對(duì)文字圖像的調(diào)整。
3.如權(quán)利要求1或2所述的一種文字圖像濃淡調(diào)整方法,其特征在于:步驟(5)中,所述設(shè)定值的范圍為0.0Ol 0.01。
4.如權(quán)利要求3所述的一種文字圖像濃淡調(diào)整方法,其特征在于:所述設(shè)定值的優(yōu)選值為0.001。
5.如權(quán)利要求1或2所述的一種文字圖像濃淡調(diào)整的方法,其特征在于:在對(duì)文字圖像的濃淡進(jìn)行調(diào)整前,將文字圖像的像素值歸一化到
。
6.如權(quán)利要求1或2所述的一種文字圖像濃淡調(diào)整方法,其特征在于:步驟(2)中,計(jì)算每個(gè)連通域的最小外接矩形后,還包括對(duì)所述連通域進(jìn)行合并,合并的具體方式如下: 確定文字語言種類,若是中文為主,則合并連通域最小外接矩形處于相交、包含位置關(guān)系的連通域;若是英文為主,則合并連通域最小外接矩形之間間隙小于設(shè)定值的相鄰連通域。
7.如權(quán)利要求6所述的一種文字圖像濃淡調(diào)整方法,其特征在于:步驟(2)中,對(duì)連通域進(jìn)行合并后,還包括對(duì)連通域的篩選,篩選的具體方式如下: 確定文字語言種類,若是中文為主,則篩選M個(gè)合并后最小外接矩形為正方形的合并連通域;若是英文為主,則篩選N個(gè)合并后滿足設(shè)定的字符長度的合并連通域,其中,10 ^ M ^ 40,10 ^ N ^ 40。
8.如權(quán)利要求7所述的一種文字圖像濃淡調(diào)整方法,其特征在于:所述設(shè)定的字符長度為4 12個(gè)字符長度。
9.如權(quán)利要求1所述的一種文字圖像濃淡調(diào)整的方法,其特征在于:步驟(I)中,若文字圖像的灰度直方圖集中在中部,根據(jù)設(shè)定的分布概率對(duì)灰度直方圖兩端進(jìn)行裁切。
全文摘要
本發(fā)明公開了一種文字圖像濃淡調(diào)整的方法,涉及文字圖像處理領(lǐng)域。該方法通過對(duì)二值圖像進(jìn)行連通域的標(biāo)記,根據(jù)連通域的最小外接矩形區(qū)域和細(xì)化骨架區(qū)域內(nèi)的像素值進(jìn)行相應(yīng)的計(jì)算,給出了圖像“濃淡”的度量濃淡值dense。該方法首先計(jì)算文字圖像的濃淡值dense,并將該計(jì)算所得濃淡值dense與用戶的設(shè)定濃淡值相比較,通過對(duì)文字圖像的黑場值和/或白場值進(jìn)行調(diào)整,最終使計(jì)算所得濃淡值dense達(dá)到用戶所設(shè)定的濃淡要求,完成對(duì)文字圖像濃淡的調(diào)整。通過該方法對(duì)文字圖像進(jìn)行調(diào)整,不僅能夠體現(xiàn)字符的筆畫粗細(xì),還能夠體現(xiàn)筆畫粗細(xì)的深淺,得到不同視覺效果的灰度圖,為圖像的自動(dòng)處理提供參考標(biāo)準(zhǔn),有利于提高效率降低成本。
文檔編號(hào)G06T11/00GK103106673SQ20111036181
公開日2013年5月15日 申請(qǐng)日期2011年11月15日 優(yōu)先權(quán)日2011年11月15日
發(fā)明者胡希馳, 李平立, 史培培 申請(qǐng)人:北京大學(xué), 方正國際軟件(北京)有限公司