一種定位彎曲書面基準線的方法
【專利說明】
所屬技術領域
[0001]本發(fā)明屬于數(shù)字圖像處理技術領域,涉及一種彎曲書面基準線確定方法。
【背景技術】
[0002]隨著現(xiàn)代科技的不斷進步和發(fā)展,電子產(chǎn)品的大量普及,越來越多的人們選擇在電子平臺進行閱讀和學習。但是大量的文檔只有紙質版,這就需要將大量的紙質文檔進行電子化。由于數(shù)碼相機的便攜性、方便性,越來越多的人采用數(shù)碼相機對文檔進行圖像采集。一些文檔由于厚度較大,不能完全的展平,因此采集的圖像,大多會出現(xiàn)類似于柱面中間凸、兩邊凹的現(xiàn)象,后期處理需要根據(jù)彎曲書面圖像的基準線來計算書面各部分的曲率和深度信息,然后基于這些信息并利用曲面坐標系和平面坐標系之間的關系將彎曲書面展開成平面圖像,這就需要提取書面的基準線;一些文檔電子化只需要采集文檔的文本部分,去除不包含信息的空白部分和不感興趣的圖像部分,這也需要利用圖像的基準線信息。基準線提取的精度、速度,決定著下一步工作進行的好壞。
【發(fā)明內容】
[0003]本發(fā)明的目的是提供一種精度高速度快彎曲書面基準線定位方法,技術方案如下:
[0004]一種定位彎曲書面基準線方法,包括下列步驟:
[0005]I)采集彎曲書面的曲面圖像;
[0006]2)對曲面圖像進行灰度變換,并進行二值化;
[0007]3)根據(jù)圖像的像素大小和經(jīng)驗值,刪除二值圖像中面積小于一個標點符號面積的對象,去除噪聲的影響,得到經(jīng)過預處理后的二值圖像;
[0008]4)設定一個矩形,其長度根據(jù)兩個字體中心之間的水平距離確定,寬度根據(jù)字體高度的1/2確定,利用此矩形對二值圖像進行形態(tài)學的開閉運算,將每行文本連成同一連通區(qū)域;
[0009]5)根據(jù)文本行的高度預設一個高度閾值,根據(jù)文本行的長度預設一個長度閾值;
[0010]6)計算出每個連通區(qū)域的高度值和寬度值,將高度值大于此高度閾值的連通區(qū)域去除;將長度值短于長度閾值的連通區(qū)域去除,然后刪除面積小于一個字體面積的對象,最終得到各個文本行連通區(qū)域。
[0011]7)分別求6)中得到的各個文本行連通區(qū)域的上邊界和下邊界,然后求出每組上邊界和下邊界對應橫坐標的中值,經(jīng)過采用三階函數(shù)進行曲線擬合,得到彎曲書面的各個文本行的基準線。
[0012]本發(fā)明采用矩形結構對圖像進行形態(tài)學的開閉運算,求出的文本行連通區(qū)域上下邊界能夠跟文本行的上下邊界緊密貼合,使其連通區(qū)域不受字體內部比重的影響,求出的中線具有更高的精度。本方法只采用幾種形態(tài)學的開閉運算和三階曲線擬合運算,運算簡單,具有更高的速度。
【附圖說明】
[0013]圖1初始圖像。
[0014]圖2形態(tài)學開閉運算后的模糊圖像。
[0015]圖3只含有文本行部分的模糊圖像。
[0016]圖4中線定位結果的局部放大圖像(文本行中白色線條表示中線)。
[0017]圖5基準線定位結果(文本行中黑色線條表示基準線)。
[0018]圖6基準線定位結果的局部放大圖像(文本行中黑色線條表示基準線)。
[0019]圖7文檔曲面圖像基準線定位的流程圖。
【具體實施方式】
[0020]下面結合附圖和實施例對本發(fā)明進行說明。
[0021]本發(fā)明提供的定位方法,將彎曲書面上每個字體的邊界框都看作平行四邊形,上邊框和下邊框是平行的,不論書面發(fā)生放大、縮小或者彎曲,上下邊框的中線都可以看作是文本行的中線,因此采用文本行中線來定位基準線。
[0022]包括下列步驟:
[0023]I)采集彎曲書面的曲面圖像,如圖1所示。
[0024]2)對曲面圖像進行灰度變換,并進行二值化。然后根據(jù)圖像的像素大小和經(jīng)驗值,刪除二值圖像中面積小于一個標點符號面積的對象,去除噪聲的影響,得到經(jīng)過預處理后的二值圖像。
[0025]3)設定一個矩形,其長度根據(jù)兩個字體中心之間的水平距離確定,寬度根據(jù)字體高度的1/2確定,利用此矩形對圖像進行形態(tài)學的開閉運算,將每行文本連成同一連通區(qū)域,如圖2所示。
[0026]4)根據(jù)文本行的高度預設一個高度閾值,大小約為文本行高度的三倍;根據(jù)文本行的長度預設一個長度閾值,大小約為文本行最大長度的3/4 ;
[0027]5)計算出每個連通區(qū)域的高度值和寬度值,將高度值大于高度閾值的連通區(qū)域去除,消除書面中高度較高的插圖的影響;將長度值短于長度閾值的連通區(qū)域去除,消除書面中長度較短的文本行的影響;然后刪除面積小于一個字體面積的對象,最終得到剩下的文本行連通區(qū)域。如圖3所示。
[0028]6)分別求5)中得到的各個文本行連通區(qū)域的上邊界和下邊界,然后求出每組上邊界和下邊界對應橫坐標的中值,如圖4所示。對中值采用三階函數(shù)進行曲線擬合,得到彎曲書面的各個文本行的基準線及其對應的方程基準線方程fn(X) = anx3+bnx2+cnx+dn,X e (0,len),n e (1,N),N為基準線數(shù)量,Ien曲面圖像的寬度,fn(x)表示基準線的縱坐標值,X表示基準線的橫坐標值,an,bn,cn, dj常數(shù),下標η表示不同的基準線?;鶞示€如圖5和6所示。
[0029]本發(fā)明提出的基于文本行中線定位基準線的方法,算法不僅定位精度高,而且計算量小,速度快。通過限制連通區(qū)域的高度值和寬度值來提取文本行區(qū)域,只保留高度小于3倍文本行高度值的連通區(qū)域和寬度值大于書面寬度1/10的連通區(qū)域,實驗結果如圖3所示,具有較好的提取結果。
[0030]本發(fā)明中線的定位只需要求出每個文本行連通區(qū)域的上下邊界,再求出上下邊界的中線即可,計算量小,同時利于硬件實現(xiàn),具有實際應用的價值。
【主權項】
1.一種定位彎曲書面基準線方法,包括下列步驟: 1)采集彎曲書面的曲面圖像; 2)對曲面圖像進行灰度變換,并進行二值化; 3)根據(jù)圖像的像素大小和經(jīng)驗值,刪除二值圖像中面積小于一個標點符號面積的對象,去除噪聲的影響,得到經(jīng)過預處理后的二值圖像; 4)設定一個矩形,其長度根據(jù)兩個字體中心之間的水平距離確定,寬度根據(jù)字體高度的1/2確定,利用此矩形對二值圖像進行形態(tài)學的開閉運算,將每行文本連成同一連通區(qū)域; 5)根據(jù)文本行的高度預設一個高度閾值,根據(jù)文本行的長度預設一個長度閾值; 6)計算出每個連通區(qū)域的高度值和寬度值,將高度值大于此高度閾值的連通區(qū)域去除;將長度值短于長度閾值的連通區(qū)域去除,然后刪除面積小于一個字體面積的對象,最終得到各個文本行連通區(qū)域。 7)分別求6)中得到的各個文本行連通區(qū)域的上邊界和下邊界,然后求出每組上邊界和下邊界對應橫坐標的中值,經(jīng)過采用三階函數(shù)進行曲線擬合,得到彎曲書面的各個文本行的基準線。
【專利摘要】本發(fā)明涉及一種定位彎曲書面基準線方法,包括:對曲面圖像進行灰度變換,并進行二值化;去除噪聲的影響,得到經(jīng)過預處理后的二值圖像;設定一個矩形對二值圖像進行形態(tài)學的開閉運算,將每行文本連成同一連通區(qū)域;根據(jù)文本行的高度預設一個高度閾值,根據(jù)文本行的長度預設一個長度閾值;計算出每個連通區(qū)域的高度值和寬度值,將高度值大于此高度閾值的連通區(qū)域去除;將長度值短于長度閾值的連通區(qū)域去除,然后刪除面積小于一個字體面積的對象,最終得到各個文本行連通區(qū)域;經(jīng)過采用三階函數(shù)進行曲線擬合,得到彎曲書面的各個文本行的基準線。本發(fā)明具有精度高速度快的優(yōu)點。
【IPC分類】G06T7-00, G06T5-00
【公開號】CN104835119
【申請?zhí)枴緾N201510198135
【發(fā)明人】肖夏, 田健飛
【申請人】天津大學
【公開日】2015年8月12日
【申請日】2015年4月23日