自適應字符切分及提取方法

文檔序號：6512453閱讀：342來源：國知局

自適應字符切分及提取方法
【專利摘要】自適應字符切分及提取方法，首先，將讀入的圖像進行傾斜矯正；然后，從中定位出表格左上角的坐標(x0,y0)，并以此設置矩形框裁剪出圖像；最后，進行單個字符的切分及提取。本發(fā)明結(jié)合多種二值化圖像的效果，采用基于垂直方向投影和輪廓特征組合下的兩種策略多次自適應切分及提取，提高了從圖像中定位出來的字符串的切分率，并保證了提取出的待識別數(shù)字正確率在98%～100%。
【專利說明】自適應字符切分及提取方法
【技術領域】
[0001]本發(fā)明屬于計算機數(shù)字圖像處理【技術領域】，涉及一種綜合使用多知識決策的自適應字符切分及提取方法。
【背景技術】
[0002]圖像二值化是圖像處理中最常見的處理方法，是進行圖像分析、特征提取和模式識別之前必要的圖像預處理過程。盡管到目前為止，二值化閾值的選取方法數(shù)以百計，但仍沒有一個通用的方法對各種各樣的圖像都能達到最理像的效果。
[0003]OTSU算法，也稱大津法，是全局自適應二值化算法的經(jīng)典算法之一，由大津于1979年提出，它是建立在一幅圖像的灰度直方圖基礎上，依據(jù)類間距離極大準則來確定區(qū)域分割閾值。適用于目標與背景的比例適當和信噪比高的情況，分割效果較好。
[0004]簡單統(tǒng)計法是Kittlter等人提出的一種基于簡單圖像像素灰度梯度值與圖像灰度統(tǒng)計相結(jié)合的閾值選取方法。閾值可以一次計算得到，從而避免了多次迭代分析圖像灰度直方圖的麻煩，同時也導致了目標與背景的過度區(qū)域做不到非常精確的分割，但針對字符而言可以較好的分割出筆畫所在的主要區(qū)域，輪廓的體現(xiàn)較為分明。
[0005]隨著單個字符識別技術趨于成熟，復雜背景下字符串的切分已經(jīng)成為制約數(shù)字識別精度的關鍵。單個字符中內(nèi)部的間斷、字符間的粘連以及圖像背景噪聲不同程度的污染等，都是造成字符串不能精確切分的主要因素。目前，現(xiàn)已提出的切分方法:基于圖的連通性切分，基于SCP(Significant Contour Point)的數(shù)字切分,垂直方向像素投影，基于 BFA(Background and Foreground Analysis)的數(shù)字切分，上下輪廓(Upper/LowerContour)特征，滴水算法(Drop-Falling)，LDP (Limited Dynamic Programming)算法等，其大多是應用在曲線切分上，一般情況下都需要人工干預選取切分線的起始點，相比之下，機打印刷類的字體是垂直的，起始點的確定就意味著切分線的建立，因此，這類字體下的切分難點就在于如何自動選取起始點?，F(xiàn)有單一的字符切分算法切分字符的正確率較低，阻礙了字符識別率的提高。

【發(fā)明內(nèi)容】

[0006]本發(fā)明的目的在于提供一種自適應字符切分及提取方法，解決現(xiàn)有技術存在的識別數(shù)字正確率低的問題。
[0007]本發(fā)明的技術方案是，自適應字符切分及提取方法，首先，將讀入的圖像進行傾斜矯正；然后，從中定位出表格左上角的坐標(Y0)，并以此設置矩形框裁剪出圖像；最后，進行單個字符的切分及提取。
[0008]本發(fā)明的特點還在于:
[0009]單個字符的切分及提取方法包括兩種，第一種為:首先，用簡單統(tǒng)計法將灰度位圖二值化，并對二值位圖進行邊緣噪聲清理和消除孤立點，然后，追蹤上下輪廓特征，分析空白間隔切除不需要的部分，對保留下來的部分搜索極值點，進而取特征點處切分。[0010]具體步驟如下:
[0011]步驟1:讀入原始圖像，裁剪并歸一化左上角位圖；
[0012]步驟2:用最大類間方差算法二值化該灰度圖，進行霍夫變換，定位出表格左上角坐標(X。，y。)及傾斜角度angle ；
[0013]步驟3:若angle不為0°,旋轉(zhuǎn)angle角度；
[0014]步驟4:以(XtlJtl)為矩形左下角，裁剪出目標所在區(qū)域位圖記為image。；
[0015]步驟5:用簡單統(tǒng)計法二值化Imagetl記為I1,再消除孤立噪聲點，并進行邊緣清理；
[0016]步驟6:在I1中用掃描像素的方法定位字符的上下輪廓特征，得到其間隔的離散值 span (I, I1-X),有
[0017]span (I, i) = U (I, i) -D (I, i)
[0018]其中，Ii_x為I1的寬，i初始化為O,上限為I1-X-1,移動步長為1，U(l, Ι^χ)、D(I1I^x)分別記錄上下輪廓的縱坐標點；自左向右分析span(l，i)空白間隔處縮小目標所在區(qū)域范圍，基于灰度位圖1magetl再次切割記為Iimage1 ；
[0019]步驟7:搜索span(l，i)極值點，依據(jù)字符粘連處平均高度d從中選取切分點，基于Image1裁剪出字符碎片，用最大類間方差算法二值化；
[0020]步驟8:對字符碎片做輪廓臨界點裁剪，二次切分自適應提取有效字符片位圖。
[0021]單個字符的切分及提取的第二種方法是:用最大類間方差算法二值化后直接進行垂直方向投影，在無像素累積點處切分，生成日期碎片。
[0022]具體步驟如下:
[0023]步驟1:讀入原始圖像，裁剪并歸一化左上角位圖；
[0024]步驟2:用最大類間方差算法二值化該灰度圖，進行霍夫變換，定位出表格左上角坐標(X。，y。)及傾斜角度angle ；
[0025]步驟3:若angle不為0°,旋轉(zhuǎn)angle角度；
[0026]步驟4:以(XtlJtl)為矩形左下角，裁剪出目標所在區(qū)域位圖記為image。；
[0027]步驟5:最大類間方差法二值化image(l，再消除孤立噪聲點，并進行邊緣清理；
[0028]步驟6:垂直投影空白處切分字符串，生成字符碎片；
[0029]步驟7:對字符碎片做輪廓臨界點裁剪，二次切分自適應提取有效字符片位圖。
[0030]本發(fā)明具有如下有益效果:本發(fā)明結(jié)合多種二值化圖像的效果，采用基于垂直方向投影和輪廓特征組合下的兩種策略多次自適應切分及提取，提高了從圖像中定位出來的字符串的切分率，并保證了提取出的待識別數(shù)字正確率在98%~100%。
【專利附圖】

【附圖說明】
[0031]圖1是本發(fā)明自適應字符切分及提取方法流程圖；
[0032]圖2是本發(fā)明自適應字符切分及提取方法定位日期的操作流程圖；
[0033]圖3是本發(fā)明自適應字符切分及提取方法實施例1字符切分流程圖；
[0034]圖4是本發(fā)明自適應字符切分及提取方法實施例2字符切分流程圖；
[0035]圖5是本發(fā)明自適應字符切分及提取方法字符提取流程圖；
[0036]圖6為本發(fā)明自適應字符切分及提取方法實施例3的發(fā)票源圖；[0037]圖7為本發(fā)明自適應字符切分及提取方法實施例3的左上角位圖；
[0038]圖8為本發(fā)明自適應字符切分及提取方法實施例3定位的開票日期頭位圖；
[0039]圖9為本發(fā)明自適應字符切分及提取方法實施例3定位日期位圖；
[0040]圖10為本發(fā)明自適應字符切分及提取方法實施例3字符碎片位圖；
[0041]圖11為本發(fā)明自適應字符切分及提取方法實施例3字符碎片放大位圖；
[0042]圖12為本發(fā)明自適應字符切分及提取方法實施例3提取數(shù)字片位圖。
【具體實施方式】
[0043]下面結(jié)合【具體實施方式】和附圖對本發(fā)明作進一步詳細的說明。
[0044]實施例1，自適應字符切分與提取方法，流程參見圖1，具體實施步驟包括:
[0045]步驟1，讀入原始圖像，裁剪出左上角位圖，從而大大減少后續(xù)操作數(shù)據(jù)量，并按固定比例大小進行縮放，類似全局歸一化的效果，記錄此時高度tv寬度W。。
[0046]步驟2，用最大類間方差算法二值化該灰度圖，進行霍夫變換檢測表格線和傾斜角度，定位出表格左上角及角度的矯正。具體操作如下:以位圖左下角為坐標原點，將二值圖像素值為O的直角坐標系下的坐標點(x，y)轉(zhuǎn)換為極角坐標下的(r，Θ)并累加個數(shù)存儲于hough矩陣，方程式為:
[0047]r = X X cos Θ +y X sin Θ
[0048]其中，re (O, (h02+w02)1/2), Θ e (0°, 180°), (r, Θ ) e hough。
[0049]從r = h0-a處開始降序搜索hough矩陣中同Cr, Θ )數(shù)量值,搜索到的第個大于預設的門限值b時設:
[0050]up—dis = r
[0051]angle = θ
[0052]其中，up—dis為表格最上直線距原點的距離，angle為表格傾斜角度，a、b為常量。
[0053]同理，從r = a處升序搜索hough矩陣中同(r, Θ )數(shù)量值，搜索到的第個大于預設的門限值c時設:
[0054]left_dis = r
[0055]其中，left_dis為表格最左邊直線距原點的距離，c為常量。
[0056]若θ Φ 0，判斷應旋轉(zhuǎn)角度angle及表格左上角坐標(X(l，％)，設置如下:
[0057]
【權利要求】
1.自適應字符切分及提取方法，其特征在于，首先，將讀入的圖像進行傾斜矯正；然后，從中定位出表格左上角的坐標(Xtl,K)，并以此設置矩形框裁剪出圖像；最后，進行單個字符的切分及提取。
2.如權利要求1所述的自適應字符切分及提取方法，其特征在于，單個字符的切分及提取方法為:首先，用簡單統(tǒng)計法將灰度位圖二值化，并對二值位圖進行邊緣噪聲清理和消除孤立點，然后，追蹤上下輪廓特征，分析空白間隔切除不需要的部分，對保留下來的部分搜索極值點，進而取特征點處切分。
3.如權利要求2所述的自適應字符切分及提取方法，其特征在于，具體步驟如下: 步驟1:讀入原始圖像，裁剪并歸一化左上角位圖；步驟2:用最大類間方差算法二值化該灰度圖，進行霍夫變換，定位出表格左上角坐標(x0, y。)及傾斜角度angle ；步驟3:若angle不為O0,旋轉(zhuǎn)angle角度；步驟4:以(X(l，y0)為矩形左下角，裁剪出目標所在區(qū)域位圖記為image。；步驟5:用簡單統(tǒng)計法二值化Imagetl記為I1，再消除孤立噪聲點，并進行邊緣清理；步驟6:在I1中用掃描像素的方法定位字符的上下輪廓特征，得到其間隔的離散值span (I, I^x),有
span (I, i) = U (I, i) -D (I, i) 其中，為I1的寬，i初始化為O，上限為Ij-l，移動步長為x)分別記錄上下輪廓的縱坐標點；自左向右分析span(l，i)空白間隔處縮小目標所在區(qū)域范圍，基于灰度位圖1maget l再次切割記為Iimage1 ；步驟7:搜索span(l，i)極值點，依據(jù)字符粘連處平均高度d從中選取切分點，基于Image1裁剪出字符碎片，用最大類間方差算法二值化；步驟8:對字符碎片做輪廓臨界點裁剪，二次切分自適應提取有效字符片位圖。
4.如權利要求1所述的自適應字符切分及提取方法，其特征在于，單個字符的切分及提取方法為，用最大類間方差算法二值化后直接進行垂直方向投影，在無像素累積點處切分，生成日期碎片。
5.如權利要求4所述的自適應字符切分及提取方法，其特征在于，具體步驟如下: 步驟1:讀入原始圖像，裁剪并歸一化左上角位圖；步驟2:用最大類間方差算法二值化該灰度圖，進行霍夫變換，定位出表格左上角坐標(x0, y。)及傾斜角度angle ；步驟3:若angle不為O0,旋轉(zhuǎn)angle角度；步驟4:以(X(l，y0)為矩形左下角，裁剪出目標所在區(qū)域位圖記為image。；步驟5:最大類間方差法二值化Imagetl，再消除孤立噪聲點，并進行邊緣清理；步驟6:垂直投影空白處切分字符串，生成字符碎片；步驟7:對字符碎片做輪廓臨界點裁剪，二次切分自適應提取有效字符片位圖。
【文檔編號】G06K9/34GK103488986SQ201310431987
【公開日】2014年1月1日申請日期:2013年9月18日優(yōu)先權日:2013年9月18日
【發(fā)明者】金海燕, 王琰琰, 黑新宏, 王彬, 王磊, 高勇, 王曉帆申請人:西安理工大學

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：金海燕;王琰琰;黑新宏;王彬;王磊;高勇;王曉帆
技術所有人：西安理工大學
我是此專利的發(fā)明人

上一篇：飯卡自主管理系統(tǒng)的制作方法
上一篇：計算機系統(tǒng)及其操作方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

js切分字符串相關技術

java切分字符串相關技術

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

自適應字符切分及提取方法