亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種掃描版文檔重排版的方法

文檔序號:6434919閱讀:238來源:國知局
專利名稱:一種掃描版文檔重排版的方法
技術(shù)領(lǐng)域
本發(fā)明涉及電子閱讀技術(shù)領(lǐng)域,尤其涉及一種掃描版文檔重排版的方法。
背景技術(shù)
在科學(xué)技術(shù)日新月異的今天,尤其是伴隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,人們的閱讀習(xí)慣不再只局限于傳統(tǒng)的紙質(zhì)出版物閱讀,電子閱讀已經(jīng)非常普及并且比重正在逐漸加大。由于電子閱讀設(shè)備(電子書、手機等)的便攜性,人們可以在生活中的碎片時間里進行電子閱讀,比如乘坐公交車、地鐵時,甚至在排隊買票的幾分鐘時間里也可以進行電子閱讀。電子閱讀素材的來源多種多樣,有些來自電子出版物,有些來自紙質(zhì)出版物的掃描版本。但是由于電子閱讀設(shè)備的便攜性,必然造成閱讀屏幕的尺寸受限。在當前各種電子閱讀設(shè)備的閱讀體驗中,對于掃描版文檔的閱讀非常不方便,如果將書頁大小尺寸的掃描·圖片全部顯示在小尺寸屏幕中會覺得字太小,如果采用將掃描圖片局部放大的方式閱讀,由于一屏不能顯示完整的一行,閱讀一行文字就會產(chǎn)生放大區(qū)域的切換,閱讀一篇文章將會產(chǎn)生頻繁的翻頁。

發(fā)明內(nèi)容
本發(fā)明的目的在于提出一種掃描版文檔重排版的方法,能夠?qū)呙璋嫖臋n根據(jù)電子閱讀設(shè)備的顯示器的尺寸進行重排版,方便用戶閱讀,提高用戶使用電子閱讀設(shè)備的感受度。為達此目的,本發(fā)明采用以下技術(shù)方案
一種掃描版文檔重排版的方法,包括以下步驟
A、將掃描版文檔生成圖像,對生成的圖像進行采樣獲得待處理的彩色圖像;
B、將采樣獲得的彩色圖像轉(zhuǎn)化為二值 C、對二值圖進行游程平滑;
D、對游程平滑處理后的二值圖求取連通域,把同值的且連通的一塊區(qū)域的外接矩形的位置記錄下來,作為初始塊位置信息;
E、將初始塊進行水平合并,得出文字的行信息和圖片位置;
F、將水平合并后的塊進行垂直合并,得出文字段落位置;
G、根據(jù)文字段落位置和圖片位置,對段落進行文字切分,首先在段落區(qū)域位置內(nèi)進行水平投影,確定每行文字的位置,然后在一行的區(qū)域位置內(nèi)進行垂直投影,確定每個文字的位置;
H、確定各段文字的閱讀順序;
I、根據(jù)文字段落位置、圖片位置和文字段落中文字的位置,將文字和圖片按照預(yù)先指定的全圖寬度和高度排版成新的圖像。還包括以下步驟
J、將排版后的新圖像放大或縮小至電子閱讀設(shè)備需要顯示的尺寸。
步驟A中,對生成的圖像進行采樣,采樣值采用矩陣形式來表示,矩陣中的每一元素fjk取值如下
fJk = f(X0+j*dX,Y0+k*dY),
其中,j為O到Mx - I的整數(shù),k為O到My - I的整數(shù),X0和Ytl為初始坐標,dX和dY為步長,Mx和My分別為矩陣fjk的列數(shù)和行數(shù),即在X、Y方向的采樣點數(shù)。步驟B進一步包括以下步驟
BI、將采樣獲得的彩色圖像轉(zhuǎn)化為灰度 B2、采用全局自適應(yīng)閾值方法將灰度圖轉(zhuǎn)換為二值圖。步驟BI中,將采樣獲得的彩色圖像轉(zhuǎn)化為灰度圖采用以下公式
Y=O. 299*R+0. 587*G+0. 114*B,其中R、G和B分別為彩色圖像的紅色、綠色和藍色分量, Y為灰度值。步驟B2中,如果灰度圖是白底黑字,則二值圖中文字部分所在像素取值為0,其余部分取值為I。步驟B2中,還包括對二值圖進行矯正,進一步包括以下步驟
采用側(cè)面投影的方法確定圖像的傾斜角度,
即采用f (X,y)表示白底黑字的二值圖,圖像外區(qū)域f (X,y) = 1,二值圖Mx列、My行,當前的投影方向與X軸成θ角,
Sk= Σ jf (Xj, Yk+X產(chǎn)tan θ ),為一行的投影值,
若Sk等于Mx則取Sk=l,表示該行投影上無黑點,
若Sk小于Mx則取Sk=0,表示該行投影上有黑點,
T0= Σ kSk,表示Θ角對應(yīng)的全圖投影值,
在限定范圍內(nèi)以預(yù)定步長變換Θ值,T0值最大的角度就是圖像的傾斜角度;
根據(jù)計算出的傾斜角度,采用二次線性插值將灰度圖進行旋轉(zhuǎn),然后重復(fù)步驟B2得到矯正后的二值圖。步驟C中,對二值圖進行游程平滑是根據(jù)二值圖中的數(shù)據(jù)O和數(shù)據(jù)I的個數(shù)來處理的,預(yù)定一個平滑值C,當二值圖中連續(xù)的I的個數(shù)小于等于C時,這一串I將被O所取代。步驟E中,依據(jù)初始塊的尺寸和初始塊與初始塊之間的水平間距將初始塊進行水平合并,高度大于預(yù)設(shè)值的初始塊不參加水平合并,被認定為圖片,高度小于預(yù)設(shè)值且水平間距小于預(yù)設(shè)值的初始塊水平合并為一個塊。步驟F中,依據(jù)水平合并后的塊的尺寸和水平合并后的塊與水平合并后的塊之間的垂直間距將水平合并后的塊進行垂直合并,被認定為圖片的初始塊不參加垂直合并,高度差小于預(yù)設(shè)值且垂直間距小于預(yù)設(shè)值的水平合并后的塊垂直合并為一個塊。采用了本發(fā)明的技術(shù)方案,對電子閱讀設(shè)備中掃描版文檔進行重排版,將掃描版文檔根據(jù)顯示器的尺寸進行重排版,在文字大小方便閱讀的前提下將完整的一行顯示在當前屏幕中,減少翻頁的頻率,從而提高用戶使用電子閱讀設(shè)備的感受度。


圖I是本發(fā)明具體實施方式
中掃描版文檔重排版的流程圖。
具體實施例方式下面結(jié)合附圖并通過具體實施方式
來進一步說明本發(fā)明的技術(shù)方案。圖I是本發(fā)明具體實施方式
中掃描版文檔重排版的流程圖。如圖I所示,該掃描版文檔重排版的流程適用于電子閱讀設(shè)備,包括以下步驟
步驟101、將掃描版文檔生成圖像,對生成的圖像進行采樣獲得待處理的彩色圖像。采樣值采用矩陣Ak形式來表示,矩陣中的每一元素Ak取值如下 fJk = f(X0+j*dX,Y0+k*dY),
其中,j為O到Mx - I的整數(shù),k為O到My - I的整數(shù),X0和Ytl為初始坐標,dX和dY為步長,Mx和My分別為矩陣f#的列數(shù)和行數(shù),即在X、Y方向的采樣點數(shù)。如果按照原圖尺寸進行處理,則取Xq=Yq=O, dX=dY=l,如果出于處理速度考慮,需要減小待處理彩色圖像的尺 寸,則適當增大dX和dY的值。步驟102、將采樣獲得的彩色圖像轉(zhuǎn)化為灰度圖,采用以下公式
Y=O. 299*R+0. 587*G+0. 114*B,其中R、G和B分別為彩色圖像的紅色、綠色和藍色分量,Y為灰度值。步驟103、采用全局自適應(yīng)閾值方法將灰度圖轉(zhuǎn)換為二值圖。如果灰度圖是白底黑字,則二值圖中文字部分所在像素取值為0,其余部分取值為I。如果圖像本身有傾斜,還需要對二值圖進行矯正,進一步包括以下步驟
首先采用側(cè)面投影的方法確定圖像的傾斜角度,投影即把二維平面上的圖像信息映射為一維方向上疊加數(shù)據(jù),其值的大小表示這個方向上圖像白點數(shù)目的總和,它表示的是圖像的一個全局特征。采用f (x,y)表示白底黑字的二值圖,圖像外區(qū)域f (x,y) = 1,二值圖Mx列、My行,當前的投影方向與X軸成Θ角,
Sk= Σ jf (Xj, Yk+X產(chǎn)tan θ ),為一行的投影值,
若Sk等于Mx則取Sk=l,表示該行投影上無黑點,
若Sk小于Mx則取Sk=0,表示該行投影上有黑點,
T0= Σ kSk,表示Θ角對應(yīng)的全圖投影值,
在限定范圍內(nèi)以預(yù)定步長變換Θ值,T0值最大的角度就是圖像的傾斜角度;
根據(jù)計算出的傾斜角度,采用二次線性插值將灰度圖進行旋轉(zhuǎn),然后重復(fù)將灰度圖轉(zhuǎn)換為二值圖,得到矯正后的二值圖。步驟104、確定圖像中的文字和圖片的位置,為重排版做好準備。首先對二值圖進行游程平滑,是根據(jù)二值圖中的數(shù)據(jù)O和數(shù)據(jù)I的個數(shù)來處理的,預(yù)定一個平滑值C,當二值圖中連續(xù)的I的個數(shù)小于等于C時,這一串I將被O所取代。例如C = 4時的平滑結(jié)果,
原數(shù)值:11111100011110011000111110010011111 平滑后11111100000000000000111110000011111。步驟105、對游程平滑處理后的二值圖求取值為O的連通域,把同值為O的且連通的一塊區(qū)域的外接矩形的位置記錄下來,作為初始塊位置信息。步驟106、將初始塊進行水平合并,得出文字的行信息和圖片位置。依據(jù)初始塊的尺寸和初始塊與初始塊之間的水平間距將初始塊進行水平合并,高度大于預(yù)設(shè)值的較大初始塊不參加水平合并,被認定為圖片,高度較小、小于預(yù)設(shè)值且水平間距小于預(yù)設(shè)值的初始塊水平合并為一個塊。步驟107、將水平合并后的塊進行垂直合并,得出文字段落位置。依據(jù)水平合并后的塊的尺寸和水平合并后的塊與水平合并后的塊之間的垂直間距將水平合并后的塊進行垂直合并,被認定為圖片的初始塊不參加垂直合并,高度相近、高度差小于預(yù)設(shè)值且垂直間距小于預(yù)設(shè)值的水平合并后的塊垂直合并為一個塊。步驟108、根據(jù)文字段落位置和圖片位置,對段落進行文字切分,首先在段落區(qū)域位置內(nèi)進行水平投影,確定每行文字的位置,然后在一行的區(qū)域位置內(nèi)進行垂直投影,確定每個文字的位置,同時要對過小的塊進行合并,過大的塊進行分裂。步驟109、確定各段文字的閱讀順序,根據(jù)先驗知識確定各段文字的閱讀順序,即從左至右,從上至下的閱讀順序。步驟110、根據(jù)文字段落位置、圖片位置和文字段落中文字的位置,將文字和圖片 按照預(yù)先指定的全圖寬度和高度排版成新的圖像,如果排不全則分多頁顯示。步驟111、將排版后的新圖像放大或縮小至電子閱讀設(shè)備需要顯示的尺寸。以上所述,僅為本發(fā)明較佳的具體實施方式
,但本發(fā)明的保護范圍并不局限于此,任何熟悉該技術(shù)的人在本發(fā)明所揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)該以權(quán)利要求的保護范圍為準。
權(quán)利要求
1. 一種掃描版文檔重排版的方法,其特征在于,包括以下步驟 A、將掃描版文檔生成圖像,對生成的圖像進行采樣獲得待處理的彩色圖像; B、將采樣獲得的彩色圖像轉(zhuǎn)化為二值圖; C、對二值圖進行游程平滑; D、對游程平滑處理后的二值圖求取連通域,把同值的且連通的一塊區(qū)域的外接矩形的位置記錄下來,作為初始塊位置信息; E、將初始塊進行水平合并,得出文字的行信息和圖片位置; F、將水平合并后的塊進行垂直合并,得出文字段落位置; G、根據(jù)文字段落位置和圖片位置,對段落進行文字切分,首先在段落區(qū)域位置內(nèi)進行水平投影,確定每行文字的位置,然后在一行的區(qū)域位置內(nèi)進行垂直投影,確定每個文字的位置; H、確定各段文字的閱讀順序; 1、根據(jù)文字段落位置、圖片位置和文字段落中文字的位置,將文字和圖片按照預(yù)先指定的全圖寬度和高度排版成新的圖像。
2.根據(jù)權(quán)利要求I所述的一種掃描版文檔重排版的方法,其特征在于,還包括以下步驟 J、將排版后的新圖像放大或縮小至電子閱讀設(shè)備需要顯示的尺寸。
3.根據(jù)權(quán)利要求I所述的一種掃描版文檔重排版的方法,其特征在于,步驟A中,對生成的圖像進行采樣,采樣值采用矩陣f#形式來表示,矩陣中的每一元素取值如下fJk = f(X0+j*dX,Y0+k*dY), 其中,j為O到Mx - I的整數(shù),k為O到My - I的整數(shù),X0和Ytl為初始坐標,dX和dY為步長,Mx和My分別為矩陣fjk的列數(shù)和行數(shù),即在X、Y方向的采樣點數(shù)。
4.根據(jù)權(quán)利要求I所述的一種掃描版文檔重排版的方法,其特征在于,步驟B進一步包括以下步驟 BI、將采樣獲得的彩色圖像轉(zhuǎn)化為灰度圖; B2、采用全局自適應(yīng)閾值方法將灰度圖轉(zhuǎn)換為二值圖。
5.根據(jù)權(quán)利要求4所述的一種掃描版文檔重排版的方法,其特征在于,步驟BI中,將采樣獲得的彩色圖像轉(zhuǎn)化為灰度圖采用以下公式 Y=O. 299*R+0. 587*G+0. 114*B,其中R、G和B分別為彩色圖像的紅色、綠色和藍色分量,Y為灰度值。
6.根據(jù)權(quán)利要求4所述的一種掃描版文檔重排版的方法,其特征在于,步驟B2中,如果灰度圖是白底黑字,則二值圖中文字部分所在像素取值為0,其余部分取值為I。
7.根據(jù)權(quán)利要求4或者6所述的一種掃描版文檔重排版的方法,其特征在于,步驟B2中,還包括對二值圖進行矯正,進一步包括以下步驟 采用側(cè)面投影的方法確定圖像的傾斜角度, 即采用f (X,y)表示白底黑字的二值圖,圖像外區(qū)域f (X,y) = 1,二值圖Mx列、My行,當前的投影方向與X軸成θ角, Sk= Σ jf (Xj, Yk+X產(chǎn)tan θ ),為一行的投影值, 若Sk等于Mx則取Sk=l,表示該行投影上無黑點,若Sk小于Mx則取Sk=O,表示該行投影上有黑點, T0= Σ kSk,表示Θ角對應(yīng)的全圖投影值, 在限定范圍內(nèi)以預(yù)定步長變換Θ值,T0值最大的角度就是圖像的傾斜角度; 根據(jù)計算出的傾斜角度,采用二次線性插值將灰度圖進行旋轉(zhuǎn),然后重復(fù)步驟B2得到矯正后的二值圖。
8.根據(jù)權(quán)利要求I或者6所述的一種掃描版文檔重排版的方法,其特征在于,步驟C中,對二值圖進行游程平滑是根據(jù)二值圖中的數(shù)據(jù)O和數(shù)據(jù)I的個數(shù)來處理的,預(yù)定一個平滑值C,當二值圖中連續(xù)的I的個數(shù)小于等于C時,這一串I將被O所取代。
9.根據(jù)權(quán)利要求I或者6所述的一種掃描版文檔重排版的方法,其特征在于,步驟E中,依據(jù)初始塊的尺寸和初始塊與初始塊之間的水平間距將初始塊進行水平合并,高度大于預(yù)設(shè)值的初始塊不參加水平合并,被認定為圖片,高度小于預(yù)設(shè)值且水平間距小于預(yù)設(shè)值的初始塊水平合并為一個塊。
10.根據(jù)權(quán)利要求9所述的一種掃描版文檔重排版的方法,其特征在于,步驟F中,依據(jù)水平合并后的塊的尺寸和水平合并后的塊與水平合并后的塊之間的垂直間距將水平合并后的塊進行垂直合并,被認定為圖片的初始塊不參加垂直合并,高度差小于預(yù)設(shè)值且垂直間距小于預(yù)設(shè)值的水平合并后的塊垂直合并為一個塊。
全文摘要
本發(fā)明公開了一種掃描版文檔重排版的方法,將掃描版文檔生成圖像,進行采樣獲得待處理的彩色圖像,轉(zhuǎn)化為二值圖,對二值圖進行游程平滑、求取連通域,將初始塊進行水平合并,得出文字的行信息和圖片位置,再進行垂直合并,得出文字段落位置,根據(jù)文字段落位置和圖片位置,對段落進行文字切分,確定各段文字的閱讀順序后,根據(jù)文字段落位置、圖片位置和文字段落中文字的位置,將文字和圖片按照預(yù)先指定的全圖寬度和高度排版成新的圖像。采用了本發(fā)明的技術(shù)方案,能夠?qū)呙璋嫖臋n根據(jù)電子閱讀設(shè)備的顯示器的尺寸進行重排版,方便用戶閱讀,提高用戶使用電子閱讀設(shè)備的感受度。
文檔編號G06T11/60GK102890826SQ20111030226
公開日2013年1月23日 申請日期2011年10月9日 優(yōu)先權(quán)日2011年8月12日
發(fā)明者安宇, 王川 申請人:北京多看科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1