亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種文本圖像校正的方法及裝置的制造方法

文檔序號:9645975閱讀:479來源:國知局
一種文本圖像校正的方法及裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及圖像技術領域,特別涉及一種文本圖像校正的方法及裝置。
【背景技術】
[0002]目前,人們對移動端閱讀的需求越來越高,雖然文字掃描等文本圖像化技術已有極大提升,但是所得到的文本圖像依然很難滿足人們的閱讀需要。其中一個很重要的問題就是所得到的文本圖像是傾斜的。因此,將得到的傾斜文本圖像進行校正,就成為了文本分析預處理的重要環(huán)節(jié)。
[0003]現(xiàn)有技術中,文本圖像校正的主要思想是檢測文本圖像傾斜角,檢測方法主要包括基于Hough變換的方法、基于Fourier變換的方法和基于交叉相關性的方法等。這些方法都計算量較大,算法復雜。

【發(fā)明內(nèi)容】

[0004]本發(fā)明實施例的目的在于提供一種文本圖像校正的方法及裝置,以實現(xiàn)對傾斜的文本圖像進行快速校正,減少計算量。
[0005]為了達到上述目的,本發(fā)明實施例公開了一種文本圖像校正的方法,所述方法包括:
[0006]A.獲得白底黑字的待校正文本圖像;
[0007]B.對所述待校正文本圖像進行預處理,獲得二值化的黑底白字的第一文本圖像;
[0008]C.對所述第一文本圖像按預設規(guī)則沿順時針方向和逆時針方向進行多次旋轉,每旋轉一次對旋轉后的第一文本圖像的像素值進行計算,獲得每次旋轉后第一文本圖像的像素空白行數(shù)目;將像素空白行數(shù)目最大的旋轉角度確定為校正旋轉角;
[0009]D.將所述待校正文本圖像旋轉所述校正旋轉角,獲得校正后的文本圖像。
[0010]較佳的,所述步驟C,包括:
[0011]C1.將所述第一文本圖像沿順時針方向旋轉第一角度low,獲得第二文本圖像;將所述第一文本圖像沿逆時針方向旋轉第二角度high,獲得第三文本圖像;所述low和high的初始值是預設值;
[0012]C2.分別對所述第二文本圖像和第三文本圖像的像素值進行計算,獲得所述第二文本圖像的像素空白行數(shù)目numlow,和第三文本圖像的像素空白行數(shù)目numhigh;
[0013]C3.將所述第二文本圖像的像素空白行數(shù)目numlow,與第三文本圖像的像素空白行數(shù)目numhigh進行比較;若所述numlow小于所述numhigh,則將所述第一角度low更新為(low+high)/2 ;若所述numlow不小于所述numhigh,則將所述第二角度high更新為(low+high)/2 ;
[0014]C4.判斷所述第一角度low與第二角度high的差的絕對值是否小于預設的第一閾值,如果是,則所述的(low+high)/2為像素空白行數(shù)目最大的旋轉角度,將所述的(low+high)/2確定為所述第一文本圖像的校正旋轉角,執(zhí)行步驟D ;如果否,則返回所述步驟CL.
[0015]較佳的,所述對所述待校正文本圖像進行預處理,獲得二值化的黑底白字的第一文本圖像,包括:
[0016]對所述待校正文本圖像進行二值化圖像處理后,進行黑底白字的反色處理,獲得黑底白字的第一文本圖像。
[0017]較佳的,所述對所述待校正文本圖像進行二值化圖像處理,包括:
[0018]對白底黑字的待校正文本圖像進行灰度化處理,得到一維灰度矩陣圖像;
[0019]采用大津算法計算第二閾值;所述第二閾值為使得黑色字體和白色背景兩類之間的方差最大的閾值;
[0020]用所述第二閾值對所述一維灰度矩陣圖像進行二值化處理,得到二值化圖像。
[0021]較佳的,在對所述待校正文本圖像進行二值化圖像處理后,進行黑底白字的反色處理前,還包括:
[0022]采用中值濾波算法對得到的二值化圖像進行濾波,得到平滑的二值化圖像;
[0023]所述進行黑底白字的反色處理,為:對平滑的二值化圖像進行反色處理,獲得黑底白字的第一文本圖像。
[0024]較佳的,所述第一角度low和第二角度high的初始值,為:預設的一個正值和一個負值;且絕對值在10度?45度之間。
[0025]較佳的,所述分別對所述第二文本圖像和第三文本圖像的像素值進行計算,獲得所述第二文本圖像的像素空白行數(shù)目numlow,和第三文本圖像的像素空白行數(shù)目numhigh,包括:
[0026]對所述第二文本圖像和第三文本圖像分別以像素為單位進行掃描,獲得各個像素的像素值;
[0027]將所述像素值逐行進行求和,分別獲得所述第二文本圖像和第三文本圖像每行的像素值的和值;
[0028]統(tǒng)計所述像素值的和值為零的像素行的行數(shù),分別得到所述第二文本圖像和第三文本圖像的像素空白行數(shù)目numlow和numhigh。
[0029]為了達到上述目的,本發(fā)明實施例公開了一種文本圖像校正的裝置,所述裝置包括:
[0030]文本圖像獲得模塊,用于獲得白底黑字的待校正文本圖像;
[0031]文本圖像預處理模塊,用于對所述待校正文本圖像進行預處理,獲得二值化的黑底白字的第一文本圖像;
[0032]校正旋轉角確定模塊,用于對所述第一文本圖像按預設規(guī)則沿順時針方向和逆時針方向進行多次旋轉,每旋轉一次對旋轉后的第一文本圖像的像素值進行計算,獲得每次旋轉后第一文本圖像的像素空白行數(shù)目;將像素空白行數(shù)目最大的旋轉角度確定為校正旋轉角;
[0033]文本圖像校正模塊,用于將所述待校正文本圖像旋轉所述校正旋轉角,獲得校正后的文本圖像。
[0034]較佳的,所述校正旋轉角確定模塊,包括:旋轉子模塊、計算子模塊、比較子模塊和判斷子模塊;
[0035]所述旋轉子模塊,用于將所述第一文本圖像沿順時針方向旋轉第一角度low,獲得第二文本圖像;將所述第一文本圖像沿逆時針方向旋轉第二角度high,獲得第三文本圖像;所述low和high的初始值是預設值;
[0036]所述計算子模塊,用于分別對所述第二文本圖像和第三文本圖像的像素值進行計算,獲得所述第二文本圖像的像素空白行數(shù)目numlow,和第三文本圖像的像素空白行數(shù)目numhigh ;
[0037]所述比較子模塊,用于將所述第二文本圖像的像素空白行數(shù)目numlow,與第三文本圖像的像素空白行數(shù)目numhigh進行比較;若所述numlow小于所述numhigh,則將所述第一角度low更新為(low+high)/2 ;若所述numlow不小于所述numhigh,則將所述第二角度 high 更新為(low+high)/2 ;
[0038]所述判斷子模塊,用于判斷所述第一角度low與第二角度high的差的絕對值是否小于預設閾值,如果是,則所述的(low+high)/2為像素空白行數(shù)目最大的旋轉角度,將所述的(low+high)/2確定為所述第一文本圖像的校正旋轉角,觸發(fā)所述文本圖像校正模塊進行文本圖像校正;如果否,則觸發(fā)所述旋轉子模塊,進入下一個循環(huán)。
[0039]較佳的,所述文本圖像預處理模塊包括:二值化子模塊和反色子模塊;
[0040]所述二值化子模塊,用于對所述待校正文本圖像進行二值化圖像處理;
[0041]所述反色子模塊,用于對所述待校正文本圖像進行二值化圖像處理后,進行黑底白字的反色處理,獲得黑底白字的第一文本圖像。
[0042]較佳的,所述二值化子模塊包括:灰度處理子模塊、第二閾值計算子模塊和二值化處理子模塊;
[0043]灰度處理子模塊,用于對白底黑字的待校正文本圖像進行灰度化處理,得到一維灰度矩陣圖像;
[0044]第二閾值計算子模塊,用于采用大津算法計算第二閾值;所述第二閾值為使得黑色字體和白色背景兩類之間的方差最大的閾值;
[0045]二值化處理子模塊,用于用所述第二閾值對所述一維灰度矩陣圖像進行二值化處理,得到二值化圖像。
[0046]較佳的,所述文本圖像預處理模塊,還包括:平滑子模塊;
[0047]所述平滑子模塊,用于在對所述待校正文本圖像進行二值化圖像處理后,進行黑底白字的反色處理前,采用中值濾波算法對得到的二值化圖像進行濾波,得到平滑的二值化圖像;
[0048]所述反色子模塊,具體用于:對平滑的二值化圖像進行黑底白字的反色處理,獲得黑底白字的第一文本圖像。
[0049]較佳的,所述第一角度low和第二角度high的初始值,為:預設的一個正值和一個負值;且絕對值在10度?45度之間。
[0050]較佳的,所述計算子模塊包括:掃描子模塊、求和子模塊和統(tǒng)計子模塊;
[0051]所述掃描子模塊,用于對所述第二文本圖像和第三文本圖像分別以像素為單位進行掃描,獲得各個像素的像素值;
[0052]所述求和子模塊,用于將所述像素值逐行進行求和,分別獲得所述第二文本圖像和第三文本圖像每行的像素值的和值;
[0053]所述統(tǒng)計子模塊,用于統(tǒng)計所述像素值的和值為零的像素行的行數(shù),分別得到所述第二文本圖像和第三文本圖像的像素空白行數(shù)目numlow和numhigh。
[0054]由上述技術方案可見,本發(fā)明實施例首先對待校正文本圖像進行預處理,獲得二值化的黑底白字的第一文本圖像,然后對所述第一文本圖像按預設規(guī)則沿順時針方向和逆時針方向進行多次旋轉,每旋轉一次對旋轉后的第一文本圖像的像素值進行計算,獲得每次旋轉后第
當前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1