亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

用于圖像文字識(shí)別的字符切分方法與流程

文檔序號(hào):12468633閱讀:2041來源:國(guó)知局
用于圖像文字識(shí)別的字符切分方法與流程

本發(fā)明圖像識(shí)別領(lǐng)域,特別涉及用于圖像文字識(shí)別的字符切分方法。



背景技術(shù):

隨著社會(huì)的發(fā)展和科技的進(jìn)步,人類創(chuàng)造的知識(shí)正以指數(shù)級(jí)的數(shù)量增加,在電子書籍出現(xiàn)之前,大部分的知識(shí)是以圖書的方式進(jìn)行傳承,中華上下五千年,產(chǎn)生了大量?jī)?yōu)秀書籍,這些書籍在歷史的長(zhǎng)河中,或多或少都遭到了不同程度的損壞,因此對(duì)這些書籍進(jìn)行數(shù)字化存儲(chǔ)迫在眉睫;在圖書管理領(lǐng)域,書籍內(nèi)容的快速搜索對(duì)于快速定位書籍很有幫助,而由于書籍?dāng)?shù)量太多,加上早期印刷的圖書沒有作者的電子文稿,因此紙質(zhì)書籍的電子化很有必要。

光學(xué)字符識(shí)別軟件就是處理這種紙質(zhì)圖書到電子文檔轉(zhuǎn)化的利器,其主要利用大量的字符樣本,經(jīng)過復(fù)雜網(wǎng)絡(luò)的學(xué)習(xí),生成相應(yīng)的模型文件,從而達(dá)到識(shí)別圖片中字符的目的。

光學(xué)字符識(shí)別軟件主要功能是識(shí)別拍攝、掃描圖片中的字符,現(xiàn)有技術(shù)中在進(jìn)行圖像中文字的識(shí)別時(shí),首先需要將圖像中的字符串切分開,形成包含單個(gè)文字的小圖片,然后使用一定的方法對(duì)切分后的文字進(jìn)行識(shí)別。而進(jìn)行文字切分最常用的方法為投影法,即是將圖像文字二值化處理后,通過垂直投影法找到兩個(gè)文字之間的分界線,根據(jù)分界線將文字切分開來。然而當(dāng)圖像中的文字之間具有粘連,且圖像中包含左右結(jié)構(gòu)的漢字時(shí),簡(jiǎn)單的投影方法就很難實(shí)現(xiàn)較好的切分效果;正是因?yàn)檫@個(gè)原因使得切分一直是OCR識(shí)別的難點(diǎn),切分的質(zhì)量將直接影響到文字的識(shí)別效果。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的在于克服現(xiàn)有技術(shù)中所存在的上述不足,提供用于圖像文字識(shí)別的字符切分方法,使用投影法確定初始切分位置進(jìn)行切分,對(duì)經(jīng)過切分后的子圖片進(jìn)行判斷和再次切分和合并,切分點(diǎn)的確定在字符圖片列投影幅值的基礎(chǔ)上引入修正值,使得切分點(diǎn)的判斷更加合理準(zhǔn)確,本發(fā)明方法對(duì)粘連的漢字具有很好的切分效果。

為了實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明提供了以下技術(shù)方案:用于圖像文字識(shí)別的字符切分方法,包含以下實(shí)現(xiàn)過程:使用投影法找出文字字符圖片的初始切分位置,根據(jù)初始切分位置將待識(shí)別圖像片切分成初始子圖片序列;

對(duì)于切分后寬度L>M*行高h(yuǎn)的子圖片進(jìn)行再次切分,切分位置根據(jù)以下公式進(jìn)行確定:

f(x)=g(x)t(x)

式中f(x)為幅值,x為列投影點(diǎn)在行方向上的坐標(biāo),h為當(dāng)前字符的行高,g(x)為修正值,t(x)為行投影值,當(dāng)幅值最小時(shí),即為兩個(gè)字符之間的切割點(diǎn)。

具體的:本用于圖像文字識(shí)別的字符切分方法包含以下實(shí)現(xiàn)步驟:

(1)使用投影法待識(shí)別圖像文字進(jìn)行切分,切分成子圖片序列;將其中的數(shù)字、字母和標(biāo)點(diǎn)符號(hào)標(biāo)記出來;

(2)對(duì)未標(biāo)記的子圖片進(jìn)行判斷:是否滿足L≤M*h,L為子圖片字符投影的寬度,M為系數(shù),h為行高;

對(duì)于不滿足條件的子圖片進(jìn)行切分,切分位置根據(jù)以下公式進(jìn)行確定:

f(x)=g(x)t(x)

重復(fù)執(zhí)行步驟(2),直到序列中未標(biāo)記的子圖片均滿足條件:L≤M*h;

(3)對(duì)于序列中數(shù)字、字母和標(biāo)點(diǎn)字圖片以外的相鄰兩子圖片的總寬度進(jìn)行判斷:是否滿足L≤M*h;

如果滿足,依序?qū)M足條件的相鄰子圖片進(jìn)行合并;

重復(fù)執(zhí)行步驟(3)直到除數(shù)字、字母和標(biāo)點(diǎn)以外的相鄰子圖片總寬度均不滿足L≤M*h;

(4)對(duì)序列中未標(biāo)記的子圖片進(jìn)行判斷:如果序列中存在三個(gè)相鄰的子圖片,且三個(gè)子圖片滿足:第一子圖片和第三子圖片的寬度L≤0.5h,且中間子圖片的寬度L≥h,則將中間子圖片根據(jù)公式:

f(x)=g(x)t(x)

所確定的切分點(diǎn)進(jìn)行切分;根據(jù)確定的切分點(diǎn),將中間子圖片切分成第一中間子圖片和第二中間子圖片;

將第一子圖片和第一中間子圖片合并;

將第二中間子圖片和第三子圖片合并。

進(jìn)一步的,0.95≤M≤1.3。

作為一種優(yōu)選:M=1.2。

作為一種優(yōu)選,

所述步驟(1)中使用以下規(guī)則來判斷所切分出的子圖片是否屬于數(shù)字、字母和標(biāo)點(diǎn)

A:子圖片滿足:L≤0.4h;

B:子圖片的像素高寬比大于1.2。

與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果:本發(fā)明提供用于圖像文字識(shí)別的字符切分方法,使用投影法確定初始切分位置進(jìn)行切分,對(duì)經(jīng)過切分后的子圖片進(jìn)行判斷和再次切分和合并,本發(fā)明使用相應(yīng)的規(guī)則條件,逐級(jí)的來判斷切分后的子圖片的切分質(zhì)量,并對(duì)切分后的子圖片進(jìn)行相應(yīng)的處理,層層篩選和處理的方式,保證子圖片的切分質(zhì)量;為最終的識(shí)別率,進(jìn)一步準(zhǔn)備了條件。

此外相比于傳統(tǒng)的切分方法,本發(fā)明方法在幅值的基礎(chǔ)上引入了修正值,將切分位置與字符邊緣的距離作為了確定切分點(diǎn)的考慮因素,因此具有更高的準(zhǔn)確性,而且當(dāng)遇到特殊結(jié)構(gòu)字符時(shí)出現(xiàn)多個(gè)極值點(diǎn)時(shí),通過本發(fā)明方法公式可以快速的找出最優(yōu)化的切分點(diǎn),增加了切分的準(zhǔn)確性,提高了切分的效率;對(duì)粘連字符的切分效果更好。

附圖說明:

圖1為本發(fā)明方法實(shí)現(xiàn)過程示意圖。

圖2為本發(fā)明方法實(shí)現(xiàn)步驟示意圖。

圖3為待識(shí)別圖像樣例圖。

圖4為粘連文字圖像樣例圖。

圖5為修正值g(x)的分布示意圖。

圖6為圖5中字符的幅值分布示意圖。

具體實(shí)施方式

下面結(jié)合試驗(yàn)例及具體實(shí)施方式對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述。但不應(yīng)將此理解為本發(fā)明上述主題的范圍僅限于以下的實(shí)施例,凡基于本發(fā)明內(nèi)容所實(shí)現(xiàn)的技術(shù)均屬于本發(fā)明的范圍。

本發(fā)明方法提供用于圖像文字識(shí)別的字符切分方法,使用投影法找出文字字符圖片的初始切分位置,根據(jù)初始切分位置將待識(shí)別圖像片切分成初始子圖片序列;

對(duì)于切分后寬度L>M*行高h(yuǎn)的子圖片進(jìn)行再次切分,切分位置根據(jù)以下公式進(jìn)行確定:

f(x)=g(x)t(x)

式中f(x)為幅值,x為列投影點(diǎn)在行方向上的坐標(biāo),h為當(dāng)前字符的行高,g(x)為修正值,t(x)為行投影值,當(dāng)幅值最小時(shí),即為兩個(gè)字符之間的切割點(diǎn)。

具體的:本用于圖像文字識(shí)別的字符切分方法包含如1和圖2所示的以下實(shí)現(xiàn)步驟:

(1)使用投影法待識(shí)別圖像文字進(jìn)行切分,切分成子圖片序列;將其中的數(shù)字、字母和標(biāo)點(diǎn)符號(hào)標(biāo)記出來;

(2)對(duì)未標(biāo)記的子圖片進(jìn)行判斷:是否滿足L≤M*h,L為子圖片字符投影的寬度,M為系數(shù),h為行高;

對(duì)于不滿足條件的子圖片進(jìn)行切分,切分位置根據(jù)以下公式進(jìn)行確定:

f(x)=g(x)t(x)

式中f(x)為幅值,x為列投影點(diǎn)在行方向上的坐標(biāo),h為當(dāng)前字符的行高,g(x)為修正值,t(x)為行投影值,兩者共同決定投影點(diǎn)的幅值,當(dāng)幅值最小時(shí),即為兩個(gè)字符之間的切割點(diǎn);經(jīng)過g(x)的修正所找到最小幅值點(diǎn)作為切分點(diǎn),相比于簡(jiǎn)單的最小行投影值,本中所尋找的切分點(diǎn),引入了切分點(diǎn)位置與字符邊緣距離的考量因素,因此具有更高的準(zhǔn)確性,而且當(dāng)遇到特殊結(jié)構(gòu)字符時(shí)出現(xiàn) 多個(gè)較小值,或者極值點(diǎn)時(shí),通過本公式可以快速的找出最優(yōu)化的切分點(diǎn),增加了切分的準(zhǔn)確性,提高了切分的效率。

重復(fù)執(zhí)行步驟(2),直到序列中未標(biāo)記的子圖片均滿足條件:L≤M*h;經(jīng)過循環(huán)執(zhí)行本步驟,將序列中明顯過大的字圖片進(jìn)行細(xì)切分,直到全部滿足單個(gè)字符的條件,相當(dāng)于對(duì)所以子圖片進(jìn)行了層層篩濾,并不滿足條件的子圖片進(jìn)行了層層切分,這樣,將字符間相互粘連的字符圖片切分開來。

(3)對(duì)于序列中數(shù)字、字母和標(biāo)點(diǎn)字圖片以外的相鄰兩子圖片的總寬度進(jìn)行判斷:是否滿足L≤M*h;

如果滿足,依序?qū)M足條件的相鄰子圖片進(jìn)行合并;

重復(fù)執(zhí)行步驟(3)直到除數(shù)字、字母和標(biāo)點(diǎn)以外的相鄰子圖片總寬度均不滿足L≤M*h;

漢字字符中包含大量的左右結(jié)構(gòu)的字符,使用投影法進(jìn)行切分時(shí),由于左右結(jié)構(gòu)的字體的部首之間是相互分離的,很大的可能會(huì)將左右的部首切分開,在進(jìn)行識(shí)別時(shí),需要將這些分離的部首進(jìn)行重新的合并,使用本步驟實(shí)現(xiàn)分離字符的合并直到?jīng)]有可合并的字符時(shí)結(jié)束;

(4)對(duì)序列中未標(biāo)記的子圖片進(jìn)行判斷:如果序列中存在三個(gè)相鄰的子圖片,且三個(gè)子圖片滿足:第一子圖片和第三子圖片的寬度L≤0.5h,且中間子圖片的寬度L≥h,則將中間子圖片根據(jù)公式:

f(x)=g(x)t(x)

所確定的切分點(diǎn)進(jìn)行切分;根據(jù)確定的切分點(diǎn),將中間子圖片切分成第一中間子圖片和第二中間子圖片;

將第一子圖片和第一中間子圖片合并;

將第二中間子圖片和第三子圖片合并。

在某些情況下:連續(xù)的兩個(gè)左右結(jié)構(gòu)的字符圖片,中間具有粘連,那么在利用投影法進(jìn)行切分時(shí),可能將前后字符中間的部首切開,但是對(duì)于兩個(gè)字符之間粘連的部首識(shí)別不了,而當(dāng)成一個(gè)字符切分出來的情況;本發(fā)明方法對(duì)于這種情況有較好的處理效果,對(duì)于粘連的中間部分通過上述公式尋找到最佳的切分點(diǎn),并將切分后的前后字符的部首進(jìn)行重新的整合,達(dá)到了較好的切分效果。

進(jìn)一步的,0.95≤M≤1.3。

作為一種優(yōu)選:M=1.2。

作為一種優(yōu)選,

所述步驟(1)中使用以下規(guī)則來判斷所切分出的子圖片是否屬于數(shù)字、字母和標(biāo)點(diǎn):

A:子圖片滿足:L≤0.4h;

B:子圖片的像素高寬比大于1.2。

實(shí)施例1

如圖所示3,對(duì)圖像中的文字進(jìn)行識(shí)別時(shí),將圖像文字進(jìn)行二值化處理后,經(jīng)過行投影,將圖像中的文字行切分出來,對(duì)每一行文字圖像進(jìn)行列投影,找出初始切分點(diǎn),根據(jù)初始切分對(duì)文字圖片進(jìn)行初步的切分,形成子圖片,切分成的子圖片中的數(shù)字、字母和標(biāo)點(diǎn)子圖片標(biāo)記出來。

在此基礎(chǔ)上,對(duì)數(shù)字、字母和標(biāo)點(diǎn)以外的文字字符子圖片進(jìn)行判斷和處理,(切分后的子圖片可能將相互粘連的字符切分到一起(粘連切分后字符如圖4 所示)),判斷過程如下:序列中未標(biāo)記的子圖片寬度是否滿足L≤1.2h?對(duì)于不滿足上述條件的子圖片進(jìn)行切分:使用以下公式來進(jìn)行切分點(diǎn)的判斷:

f(x)=g(x)t(x)

如圖4所示的子圖片,經(jīng)過投影后像素的幅值分布為圖5所示,可以發(fā)現(xiàn)當(dāng)x點(diǎn)與行高h(yuǎn)相距為0時(shí),其修正值g(x)(分布如圖6所示)最小,為0.5,當(dāng)x與h相距越大,修正越大,由于本文假設(shè)字符的寬度與行高相當(dāng),因此可以理解為字符投影點(diǎn)越靠近該字符所處的寬度處時(shí),其修正值越小,這樣可以避免幅值出現(xiàn)多個(gè)極值點(diǎn)。本子圖片中字符的幅值在x=19和20處出現(xiàn)極小值,該子圖片字符的行高為19,經(jīng)g(x)的修正,可以得出f(19)=0.5000,f(20)=0.5025;x=19時(shí)f(x)的值最小,x=19確定為切分點(diǎn),并根據(jù)該切分點(diǎn),將子圖片字符切分出來。

在上述處理的基礎(chǔ)上,對(duì)于序列中切分滿足總寬度L≤M*h相鄰子圖片進(jìn)行合并,直到?jīng)]有滿足合并條件的子圖片為止。

對(duì)于序列中的子圖片進(jìn)行再次判斷,將滿足三個(gè)子圖片滿足:第一子圖片和第三子圖片的寬度L≤0.5h,且中間子圖片的寬度L≥h,使用步驟(4)中的公式進(jìn)行再次切分;將切分后的前后字符兩兩合并;直到?jīng)]有滿足條件的子圖片為止;完成了所有子圖片的切分。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1