亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于局部對比度和筆畫寬度估計的低質(zhì)量文檔圖像二值化方法

文檔序號:9616625閱讀:697來源:國知局
基于局部對比度和筆畫寬度估計的低質(zhì)量文檔圖像二值化方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于局部對比度和筆畫寬度估計的低質(zhì)量文檔圖像二值化方法, 屬于圖像處理技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 文檔分析與識別(DAR)技術(shù)已廣泛應(yīng)用于印刷體字符及公式識別、手寫文字識 另IJ、文檔圖像分割、視頻字幕提取、文本信息檢索等領(lǐng)域,主要包括圖像采集、預(yù)處理、二值 化、版面分析、OCR識別、建立索引等過程。圖像二值化是其中一個關(guān)鍵處理步驟,它直接影 響DAR系統(tǒng)的性能。然而,受圖像對比度、墨跡浸潤、頁面污漬或光照不均勻等因素的影響, 使得針對此類低質(zhì)量文檔圖像的二值化具有極大的挑戰(zhàn)。
[0003]目前,學(xué)術(shù)界提出了許多文檔圖像二值化算法,可大致分為全局閾值法和局部閾 值法。全局閾值法采用單一的閾值將文檔圖像分為字符(前景)與背景兩大類,如Otsu算 法利用圖像的灰度直方圖選擇一個最優(yōu)閾值,使得經(jīng)閾值分割后的前景與背景像素的類間 方差最大。Otsu算法對于前景和背景差別較大,即直方圖具有顯著雙峰特征的圖像具有較 好的分割效果,但在處理低質(zhì)量文檔圖像時,會丟失部分甚至全部字符筆畫細節(jié)。
[0004] 局部閾值法(也稱為自適應(yīng)閾值法)則通過滑動窗口與文檔圖像卷積,從而實現(xiàn) 在圖像不同部分設(shè)定不同閾值,如利用像素鄰域內(nèi)的灰度均值和標準差來構(gòu)建閾值分割曲 面,其性能有賴于滑動窗口的尺寸及字符筆畫的粗細。針對不同質(zhì)量的文檔圖像需動態(tài)調(diào) 整窗口尺寸,以獲得最佳的閾值處理結(jié)果,當圖像對比度較低時,會產(chǎn)生大量噪聲點或?qū)⒈?景像素誤判為前景像素。
[0005]CN103761520公開了一種基于筆劃寬度的文檔圖像無參二值化方法,屬于圖像處 理技術(shù)領(lǐng)域。該方法首先對輸入的文檔圖像進行去噪預(yù)處理,并通過圖像的灰度范圍內(nèi)的 各個灰度等級得到一系列的二值化結(jié)果,然后通過給定的筆劃寬度生成該筆劃寬度下的最 優(yōu)二值化結(jié)果,最后通過厚筆劃像素在目標像素中所占的比重變化確定最佳的筆劃寬度 和最終的二值化結(jié)果。
[0006]CN104751422公開了一種影印文檔圖像增強及二值化方法,包括以下幾個步驟: 對輸入的彩色圖像進行灰度化處理,得到灰度圖像;采用Sobel水平和垂直算子獲取每個 像素點對應(yīng)的局部圖像塊的邊緣梯度;進行加權(quán)融合改進LC局部增強,獲得每個像素點的 加權(quán)融合局部對照值;基于每個像素點的加權(quán)融合局部對照值作為對應(yīng)像素點的像素值, 獲得輸入圖像的增強圖像。
[0007]CN104751422A公開了一種影印文檔圖像增強及二值化方法,包括以下幾個步驟: 對輸入的彩色圖像進行灰度化處理,得到灰度圖像;采用Sobel水平和垂直算子獲取每個 像素點對應(yīng)的局部圖像塊的邊緣梯度;進行加權(quán)融合改進LC局部增強,獲得每個像素點的 加權(quán)融合局部對照值;基于每個像素點的加權(quán)融合局部對照值作為對應(yīng)像素點的像素值, 獲得輸入圖像的增強圖像。

【發(fā)明內(nèi)容】

[0008] 本發(fā)明的目的是針對上述現(xiàn)狀,旨在提供一種基于局部對比度和筆畫寬度估計的 低質(zhì)量文檔圖像二值化方法,具體步驟如下:
[0009] 1)獲取掃描文檔圖像;
[0010] 2)彩色圖像灰度化;
[0011] 采用最小均值法對彩色文檔圖像u(x,y)進行灰度化處理,計算公式為:
[0012]
[0013] 式中,ujx,y)分別為R、G、B彩色分量圖像,ugMy(x,y)為變換后的灰度圖像;
[0014] 3)圖像局部對比度檢測;
[0015] 定義圖像的局部對比度為:
[0016]
[0017]式中,Imax(X,y)、Imin(X,y)和I_n(X,y)分別表示圖像在其坐標(X,y)處的3X3鄰 域內(nèi)亮度的最大值、最小值和平均值;
[0018] 4)0tsu全局最優(yōu)閾值化;
[0019] 記t e [0, L-1]為前景與背景像素的分割閾值,?1表示其歸一化直方圖,
[0020] 前景像素占圖像比例為?,,(〇 =?Λ,前景像素平均灰度值為_=?挺〗訪; :?=;ο
[0021] 背景像素占圖像比例為_) =XA= 1-?的,背景像素平均灰度值為A(n=f : I=r+l·
[0022] 圖像總體平均灰度值為外於,則確定全局最優(yōu)閾值的準則是使經(jīng)閾值處理后 feU. 的前景與背景像素的類間方差=n(n[/W)-以2H^(0U(0-/Y]2最大;
[0023] 5)字符筆畫寬度估計;
[0024] 采用Canny算子對步驟4)所得二值圖像進行邊緣檢測,分別統(tǒng)計所有字符前景像 素個數(shù)nfg和字符邊緣像素個數(shù)計算輪廓比例$ = &,并由此估計字符筆畫寬度;
[0025]6)圖像局部二值化;
[0026] 將鄰域窗尺寸大小設(shè)為字符筆畫寬度的2-5倍,采用滑動鄰域法對圖像進行局部 二值化處理,計算公式為:
[0027]
[0028] 式中,I(X,y)為(X,y)處的像素灰度值,μs(x,y)和〇s(x,y)分別表示以(X,y) 為中心的w X w鄰域內(nèi)所有已標記為前景像素的灰度平均值和標準偏差,常數(shù)k取值范圍為 0~1 〇
[0029] 本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點在于:
[0030] 1、采用最小均值法對彩色圖像進行灰度化,所得灰度圖像與彩色像素值無關(guān);
[0031] 2、采用局部對比度定義,不僅能夠補償圖像亮度變化產(chǎn)生的影響,還綜合考慮了 圖像鄰域內(nèi)所有像素對圖像局部對比度的歸一化貢獻;
[0032] 3、采用輪廓比例法,對文檔圖像分辨率變化具有較好的魯棒性;
[0033] 4、能較好地保留字符筆畫細節(jié),并在有效分割字符前景的同時,較好地抑制墨跡 浸潤、頁面污漬、紋理背景及光照不均勻等現(xiàn)象。
[0034] 本發(fā)明公開了一種基于局部對比度和筆畫寬度估計的低質(zhì)量文檔圖像二值化方 法,屬于圖像處理技術(shù)領(lǐng)域。該方法首先對輸入的彩色文檔圖像進行灰度化處理,然后基 于圖像的局部對比度實現(xiàn)前景字符像素檢測,再采用〇tsu算法對其進行全局最優(yōu)閾值化 處理,最后通過估計字符筆畫寬度來確定鄰域窗的大小,從而實現(xiàn)字符前景與頁面背景的 精細分割。實驗結(jié)果表明,本發(fā)明中所給出的二值化算法能夠較好地保留字符筆畫細節(jié), 在有效分割字符前景的同時,還能夠較好地抑制墨跡浸潤、頁面污漬、紋理背景不均勻等現(xiàn) 象。
【附圖說明】
[0035] 圖1為本發(fā)明流程圖,
[0036] 圖2為光照及色彩不均勻的掃描文檔圖像樣本圖,
[0037] 圖3為經(jīng)本發(fā)明彩色圖像灰度化處理的效果圖,
[0038] 圖4為局部對比度圖像,
[0039] 圖5為采用Otsu算法進行全局最優(yōu)閾值化處理得到的字符前景圖,
[0040]圖6為基于字符筆畫寬度的文檔圖像局部精細二值化輸出圖像,
[0041] 圖7為具有墨跡浸潤的掃描文檔圖,
[0042] 圖8為圖7的經(jīng)本發(fā)明二值化輸出的文檔圖,
[0043] 圖9為具有紋理背景的掃描文檔圖,
[0044] 圖10為圖9的經(jīng)本發(fā)明二值化輸出的文檔圖,
[0045] 圖11為具有頁面污漬的掃描文檔圖,
[0046] 圖12為圖11的經(jīng)本發(fā)明二值化輸出的文檔圖。
【具體實施方式】
[0047] 本發(fā)明的流程圖見圖1,步驟為獲取掃描文檔圖像,彩色圖像灰度化,圖像局部對 比度檢測,Otsu全局最優(yōu)閾值化,字符筆畫寬度估計,圖像局部二值化。具體如下:
[0048] 1)獲取掃描文檔圖像;
[0049] 2)彩色圖像灰度化;采用的最小均值法對彩色圖像進行灰度化,所得灰度圖像具 有彩色無關(guān)性。
[0050] 目前主要采用分量加權(quán)平均、平均值、最大值等方法對彩色圖像進行灰度化,
[0051] 加權(quán)平均法:ugray(x,y) =0· 2989XuR(x,y)+0. 5870XuG(x,y)+0. 1140XuB(x,y)
[0052] 平均值法:= j) + "s(x,y)]
[0053] 最大值法:ugray (x,y) =max(uR (x,y),uG (x,y),uB (x,y))
[0054] 這些方法更多是基于人眼視覺特性的建模。
當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1