亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

漢字識(shí)別方法和裝置的制作方法

文檔序號(hào):6427929閱讀:183來(lái)源:國(guó)知局

專利名稱::漢字識(shí)別方法和裝置的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及漢字識(shí)別技術(shù),特別涉及ー種漢字識(shí)別方法和裝置。
背景技術(shù)
:隨著光學(xué)文字識(shí)別(OCR:0pticalCharacterRecognition)正確率的提高,其應(yīng)用也越來(lái)越廣泛,如大量應(yīng)用于自動(dòng)化辦公中。圖I是現(xiàn)有技術(shù)中光學(xué)識(shí)別引擎的結(jié)構(gòu)示意圖;圖2是利用光學(xué)識(shí)別引擎的切分模塊101對(duì)文本圖像進(jìn)行切分后的圖像單元的示意圖;圖3是對(duì)切分后的圖像單元進(jìn)行選擇的示意圖;圖4是左右結(jié)構(gòu)的標(biāo)準(zhǔn)漢字的示意圖。如圖I所示,該光學(xué)識(shí)別引擎主要包括切分模塊101和識(shí)別模塊102;其中,切分模塊101用于將包含多個(gè)文字的文本圖像(TextImage)切分為圖像單元(Segments),如圖2所示,利用該文本圖像為“信息外圍設(shè)備”201,切分模塊101對(duì)文本圖像201切分后獲得多個(gè)圖像単元202,如圖2所示用豎線分開(kāi)的各個(gè)圖像単元202;識(shí)別模塊102用于將切分模塊101對(duì)文本圖像201切分后獲得的圖像單元202進(jìn)行識(shí)別,以獲得可編輯文字(EditableText),如圖2所示,獲得可編輯的文字203。如圖2所示,在切分模塊101對(duì)文本圖像進(jìn)行切分時(shí),會(huì)出現(xiàn)切分錯(cuò)誤。例如,有些單個(gè)字符的文字圖像可能被切分為多個(gè)圖像單元,如單個(gè)字符“信”被切分為“イ”和“言”;單個(gè)字符“外”,被切分為“夕”和“卜”,這樣最終導(dǎo)致識(shí)別錯(cuò)誤。由于ー個(gè)標(biāo)準(zhǔn)漢字的圖像單元的識(shí)別相似度比一個(gè)非標(biāo)準(zhǔn)漢字的識(shí)別相似度高,因此,目前對(duì)于切分錯(cuò)誤的問(wèn)題,如對(duì)于ー個(gè)單個(gè)字符被切分為多個(gè)圖像單元的錯(cuò)誤,可結(jié)合識(shí)別技術(shù)對(duì)切分錯(cuò)誤的圖像單元進(jìn)行修正,即通過(guò)識(shí)別相似度的高低來(lái)選擇識(shí)別相似度高的圖像單元,從而可以避免切分錯(cuò)誤。例如,在切分模塊101對(duì)文本圖像201進(jìn)行切分獲得圖像單元202后,為了避免上述的切分錯(cuò)誤,可將相鄰的兩個(gè)圖像單元進(jìn)行合并,例如,如圖3所示,將圖像単元“イ”、“言”進(jìn)行合并,然后對(duì)“イ、言”和合并后的圖像單元“信”進(jìn)行識(shí)別,比較識(shí)別相似度,由于“信”是標(biāo)準(zhǔn)漢字的圖像單元,“イ、言”識(shí)別后為“イ、育”不是標(biāo)準(zhǔn)漢字的圖像單元,因此,對(duì)圖像単元“信”的識(shí)別相似度高于對(duì)圖像単元“イ、言”的識(shí)別相似度,這樣,選擇合并后的識(shí)別相似度高的圖像單元“信”來(lái)修正切分錯(cuò)誤的圖像單元“イ、育”,即最終選擇“信”的圖像單元來(lái)代替“イ”和”育”。由上述可知,通過(guò)選擇相似度高的圖像單元,可以得到正確的切分単元,圖3所示的是ー個(gè)結(jié)合識(shí)別進(jìn)行切分選擇的例子。但是在實(shí)現(xiàn)本發(fā)明的過(guò)程中發(fā)明人發(fā)現(xiàn)上述技術(shù)的缺陷在于如圖4所示,對(duì)于左右結(jié)構(gòu)的標(biāo)準(zhǔn)漢字,如“外”,且該左右結(jié)構(gòu)的標(biāo)準(zhǔn)漢字的左部分和右部分均為標(biāo)準(zhǔn)漢字,即“夕”和“卜”,光學(xué)識(shí)別引擎(OCR)會(huì)將該左右結(jié)構(gòu)的漢字切分為兩個(gè)圖像單元,即使利用上述切分錯(cuò)誤修正方法也無(wú)法解決上述切分錯(cuò)誤的問(wèn)題,從而最終導(dǎo)致識(shí)別錯(cuò)誤。
發(fā)明內(nèi)容本發(fā)明實(shí)施例的目的在于提供ー種漢字識(shí)別方法和裝置,通過(guò)利用對(duì)文本圖像進(jìn)行識(shí)別后獲得的識(shí)別信息中的識(shí)別編碼信息和圖像單元位置信息檢測(cè)錯(cuò)誤切分的圖像單元并對(duì)錯(cuò)誤切分的圖像單元進(jìn)行修正,從而可提高識(shí)別精度,解決現(xiàn)有技術(shù)中存在的問(wèn)題。根據(jù)本發(fā)明實(shí)施例的ー個(gè)方面提供了ー種漢字識(shí)別裝置,該裝置包括第一識(shí)別單元,該第一識(shí)別單元用于對(duì)文本圖像進(jìn)行切分和識(shí)別,以獲得識(shí)別信息;其中,該識(shí)別信息包括對(duì)該文本圖像進(jìn)行切分后獲得的多個(gè)圖像単元在該文本圖像中的位置信息、以及對(duì)該圖像単元進(jìn)行識(shí)別所獲得的識(shí)別編碼信息;錯(cuò)誤檢測(cè)單元,該錯(cuò)誤檢測(cè)單元用于利用該第一識(shí)別單元獲得該識(shí)別編碼信息和位置信息檢測(cè)錯(cuò)誤切分的圖像單元;錯(cuò)誤修正単元,該錯(cuò)誤修正単元用于對(duì)該錯(cuò)誤檢測(cè)單元檢測(cè)出的該錯(cuò)誤切分的圖像單元進(jìn)行修正;第二識(shí)別單元,該第二識(shí)別單元用于對(duì)該錯(cuò)誤修正単元修正后的該圖像單元進(jìn)行識(shí)別,以獲得相應(yīng)的識(shí)別編碼信息。根據(jù)本發(fā)明實(shí)施例的另ー個(gè)方面提供了ー種漢字識(shí)別方法,該方法包括第一識(shí)別步驟,對(duì)文本圖像進(jìn)行切分和識(shí)別,以獲得識(shí)別信息;其中,該識(shí)別信息包括對(duì)該文本圖像進(jìn)行切分后獲得的多個(gè)圖像単元在該文本圖像中的位置信息、以及對(duì)該圖像單元進(jìn)行識(shí)別獲得的識(shí)別編碼信息;錯(cuò)誤檢測(cè)步驟,利用該識(shí)別信息中的該識(shí)別編碼信息和位置信息檢測(cè)錯(cuò)誤切分的圖像單元;錯(cuò)誤修正步驟,對(duì)檢測(cè)出的該錯(cuò)誤切分的圖像單元進(jìn)行修正;第二識(shí)別步驟,對(duì)修正后的該圖像單元進(jìn)行識(shí)別,以獲得相應(yīng)的識(shí)別編碼信息。本發(fā)明實(shí)施例的有益效果在干通過(guò)對(duì)文本圖像進(jìn)行切分和識(shí)別以獲得識(shí)別信息,利用該識(shí)別信息中的識(shí)別編碼信息和圖像單元位置信息查找錯(cuò)誤切分的圖像單元,合并相鄰的錯(cuò)誤切分的圖像單元,并將合并的圖像単元替換該切分錯(cuò)誤的圖像單元,從而可提聞識(shí)別精度,解決現(xiàn)有技術(shù)中存在的問(wèn)題。參照后文的說(shuō)明和附圖,詳細(xì)公開(kāi)了本發(fā)明的特定實(shí)施方式,指明了本發(fā)明的原理可以被采用的方式。應(yīng)該理解,本發(fā)明的實(shí)施方式在范圍上并不因而受到限制。在所附權(quán)利要求的精神和條款的范圍內(nèi),本發(fā)明的實(shí)施方式包括許多改變、修改和等同。針對(duì)ー種實(shí)施方式描述和/或示出的特征可以以相同或類似的方式在一個(gè)或更多個(gè)其它實(shí)施方式中使用,與其它實(shí)施方式中的特征相組合,或替代其它實(shí)施方式中的特征。應(yīng)該強(qiáng)調(diào),術(shù)語(yǔ)“包括/包含”在本文使用時(shí)指特征、整件、步驟或組件的存在,但并不排除一個(gè)或更多個(gè)其它特征、整件、步驟或組件的存在或附加。圖I是現(xiàn)有技術(shù)中光學(xué)識(shí)別引擎的結(jié)構(gòu)示意圖;圖2是利用光學(xué)識(shí)別引擎的切分模塊101對(duì)文本圖像進(jìn)行切分后的圖像單元的示意圖3是對(duì)切分后的圖像單元進(jìn)行選擇的示意圖;圖4是左右結(jié)構(gòu)的標(biāo)準(zhǔn)漢字的示意圖;圖5是三個(gè)定寬漢字的示意圖;圖6是本發(fā)明實(shí)施例I的漢字識(shí)別裝置構(gòu)成示意圖;圖7是圖6中的錯(cuò)誤檢測(cè)單元的構(gòu)成示意圖;圖8是圖7中字寬計(jì)算單元的構(gòu)成示意圖;圖9是本發(fā)明實(shí)施例I中各個(gè)圖像單元的位置信息示意圖;圖10是圖7中檢測(cè)單元的構(gòu)成示意圖;圖11是圖6中錯(cuò)誤修正單元的構(gòu)成示意圖;圖12是本發(fā)明實(shí)施例2的漢字識(shí)別方法流程圖;圖13是本發(fā)明實(shí)施例3的漢字識(shí)別方法的應(yīng)用實(shí)例流程圖;圖14是對(duì)文本圖像分別利用現(xiàn)有的OCR技術(shù)和本發(fā)明實(shí)施例的識(shí)別方法進(jìn)行識(shí)別的識(shí)別結(jié)果示意圖。具體實(shí)施例方式下面結(jié)合附圖對(duì)本發(fā)明的各種實(shí)施方式進(jìn)行說(shuō)明。這些實(shí)施方式只是示例性的,不是對(duì)本發(fā)明的限制。為了使本領(lǐng)域的技術(shù)人員能夠容易地理解本發(fā)明的原理和實(shí)施方式,本發(fā)明的實(shí)施方式以下述的漢字識(shí)別裝置為例進(jìn)行說(shuō)明。在實(shí)現(xiàn)本發(fā)明的過(guò)程中發(fā)明人發(fā)現(xiàn),目前漢字排版一般采用固定寬度的漢字字形,如圖5所示,展示了三個(gè)定寬漢字的例子,這樣排版結(jié)果整齊清晰易于閱讀。因此,對(duì)于采用固定寬度漢字字形排版的漢字圖像,可以認(rèn)為該圖像中的漢字圖像単元都具有相同的寬度。若利用寬度信息檢測(cè)錯(cuò)誤切分的圖像單元可提高識(shí)別精度,并且該方法簡(jiǎn)單容易實(shí)現(xiàn),并解決現(xiàn)有技術(shù)中存在的上述問(wèn)題,圖6是本發(fā)明實(shí)施例I的漢字識(shí)別裝置的構(gòu)成示意圖。如圖6所示,該裝置包括第一識(shí)別單元601、錯(cuò)誤檢測(cè)單元602、錯(cuò)誤修正単元603和第二識(shí)別單元604;其中,第一識(shí)別單元601,用于對(duì)文本圖像進(jìn)行切分和識(shí)別,以獲得識(shí)別信息;其中,該識(shí)別信息包括對(duì)文本圖像進(jìn)行切分后獲得的多個(gè)圖像単元(Segments)在文本圖像中的位置信息、以及對(duì)圖像單元進(jìn)行識(shí)別所獲得的識(shí)別編碼信息;錯(cuò)誤檢測(cè)單元602,用于利用第一識(shí)別單601獲得該識(shí)別編碼信息和位置信息檢測(cè)錯(cuò)誤切分的圖像單元;錯(cuò)誤修正単元603,用于對(duì)錯(cuò)誤檢測(cè)単元602檢測(cè)出的錯(cuò)誤切分的圖像單元進(jìn)行修正;第二識(shí)別單元604,用于對(duì)錯(cuò)誤修正単元603修正后的圖像單元進(jìn)行識(shí)別,以獲得相應(yīng)的識(shí)別編碼信息。在本實(shí)施例中,第一識(shí)別單元601對(duì)文本圖像進(jìn)行切分后獲得的多個(gè)圖像單元可采用矩形表示,該圖像単元在文本圖像中的位置信息可以是各個(gè)圖像単元在ー維方向上的坐標(biāo)信息;但不限于上述表示方式,還可采用其他形式來(lái)表示,對(duì)于其他形式表示的位置信息比如輪廓表示的単元,可通過(guò)投影輪廓的坐標(biāo)信息得到一維坐標(biāo)信息,其中輪廓是指圖像単元的外邊界;并且第一識(shí)別單元601對(duì)圖像単元進(jìn)行識(shí)別所獲得的識(shí)別編碼信息是標(biāo)準(zhǔn)漢字的數(shù)字表示,例如可采用漢字國(guó)際擴(kuò)展碼GBK或者采用統(tǒng)ー碼UNICODE表示,每個(gè)識(shí)別編碼信息對(duì)應(yīng)ー個(gè)漢字。在第一識(shí)別單元601對(duì)文本圖像進(jìn)行切分和識(shí)別后,可能會(huì)由于錯(cuò)誤切分而導(dǎo)致最終的錯(cuò)誤識(shí)別,如圖2所示,對(duì)于“信”被切分為“イ”和“言”;對(duì)于“外”,被切分為“夕”和“卜”,并且切分后的圖像單元分別對(duì)應(yīng)兩個(gè)標(biāo)準(zhǔn)漢字。雖然可采用
背景技術(shù)
中的方法結(jié)合識(shí)別技術(shù)對(duì)錯(cuò)誤切分的圖像單元進(jìn)行檢測(cè)并修正,但是對(duì)于左右結(jié)構(gòu)的漢字且切分后左部分和右部分均為標(biāo)準(zhǔn)漢字的情況,無(wú)法采用上述方法解決,但通過(guò)本發(fā)明實(shí)施例I的裝置,錯(cuò)誤檢測(cè)單元602可利用多個(gè)圖像単元在文本圖像中的位置信息獲得的平均字寬(ACW)和識(shí)別編碼信息來(lái)檢測(cè)錯(cuò)誤切分的圖像單元;并且錯(cuò)誤修正単元603可對(duì)檢測(cè)出的相鄰的兩個(gè)錯(cuò)誤切分的圖像單元進(jìn)行合并,并且將合并后的圖像單元替換相鄰的兩個(gè)錯(cuò)誤切分的圖像單元,從而提高識(shí)別精度,解決現(xiàn)有技術(shù)中存在的上述問(wèn)題。在錯(cuò)誤修正單元603對(duì)相鄰的兩個(gè)錯(cuò)誤切分的圖像單元進(jìn)行修正后,第二識(shí)別單元604可對(duì)修正后的圖像單元重新進(jìn)行識(shí)別,從而獲得該修正后的圖像單元對(duì)應(yīng)的識(shí)別編碼信息,這樣,將第一識(shí)別單元601獲得的識(shí)別編碼信息與第二識(shí)別單元602修正后的識(shí)別編碼信息相結(jié)合,最終可獲得對(duì)該文本圖像進(jìn)行識(shí)別的識(shí)別編碼信息。在本實(shí)施例中,該裝置還可包括文字輸出單元(未示出),用于將第一識(shí)別單元601和第二識(shí)別單元602獲得的該識(shí)別編碼信息對(duì)應(yīng)的標(biāo)準(zhǔn)漢字輸出。在上述實(shí)施例中,第一識(shí)別單元601和第二識(shí)別單元604可采用OCR引擎實(shí)現(xiàn),具體的切分和識(shí)別方式與現(xiàn)有技術(shù)類似,此處不再贅述。在上述實(shí)施例中,各個(gè)單元可使用邏輯部件構(gòu)成,該邏輯部件例如為現(xiàn)場(chǎng)可編程邏輯部件、微處理器、計(jì)算機(jī)中使用的處理器等。由上述實(shí)施例可知,通過(guò)對(duì)文本圖像進(jìn)行切分和識(shí)別以獲得識(shí)別信息,利用該識(shí)別信息中的識(shí)別編碼信息和圖像單元位置信息查找錯(cuò)誤切分的圖像單元,合并相鄰的錯(cuò)誤切分的圖像單元,并將合并的圖像単元替換該切分錯(cuò)誤的圖像單元,從而可提高識(shí)別精度,解決現(xiàn)有技術(shù)中存在的問(wèn)題。在上述實(shí)施例中,錯(cuò)誤檢測(cè)單元602可利用多個(gè)圖像単元在文本圖像中的位置信息獲得的平均字寬(ACW)和識(shí)別編碼信息來(lái)檢測(cè)錯(cuò)誤切分的圖像單元。圖7是圖6所示的錯(cuò)誤檢測(cè)單元的構(gòu)成示意圖。如圖7所示,錯(cuò)誤檢測(cè)單元602可具體包括字寬計(jì)算単元701和檢測(cè)單元702;其中,字寬計(jì)算単元701,用于利用第一識(shí)別單元601獲得的位置信息確定平均字寬(ACff);檢測(cè)單元702,用于利用第一識(shí)別單元601獲得的識(shí)別編碼信息和平均字寬對(duì)多個(gè)圖像單元逐一進(jìn)行檢測(cè),以找到半字寬(HWS)的圖像單元,該半字寬的圖像単元為檢測(cè)出的錯(cuò)誤切分的圖像單元。通過(guò)識(shí)別編碼信息和利用位置信息獲得的平均字寬可檢測(cè)出錯(cuò)誤切分的圖像單元,檢測(cè)方法簡(jiǎn)單,解決了現(xiàn)有技術(shù)中無(wú)法檢測(cè)左右結(jié)構(gòu)的標(biāo)準(zhǔn)漢字且左部分和右部分均為標(biāo)準(zhǔn)漢字的切分錯(cuò)誤的問(wèn)題。圖8是圖7中字寬計(jì)算單元701的構(gòu)成示意圖。如圖7所示,字寬計(jì)算單元701包括寬度計(jì)算單元801、排序單元802和字寬確定単元803;其中,寬度計(jì)算單元801,用于利用第一識(shí)別單元701獲得的位置信息計(jì)算出每個(gè)圖像単元的寬度;排序單元802,用于將所有圖像單元的寬度置于ー個(gè)數(shù)組并進(jìn)行排序;字寬確定單元803用于將數(shù)組中的中位數(shù)作為平均字寬。在上述實(shí)施例中,若圖像單元采用矩形表示,則各個(gè)圖像單元在文本圖像中的位置信息可以通過(guò)各個(gè)圖像単元在ー維方向上的坐標(biāo)信息表示,這樣通過(guò)每個(gè)圖像單元所在的矩形的邊長(zhǎng)的兩個(gè)端點(diǎn)在ー維方向上的坐標(biāo)值來(lái)計(jì)算每個(gè)圖像単元的寬度。圖9是本發(fā)明實(shí)施例I中各個(gè)圖像單元的位置信息示意圖(單位為cm)。如圖9所示,例如第一個(gè)圖像単元“イ”所在矩形的邊長(zhǎng)的兩個(gè)端點(diǎn)的坐標(biāo)值分別為(0,0.5),第ニ個(gè)圖像単元“言”所在矩形的邊長(zhǎng)的兩個(gè)端點(diǎn)的坐標(biāo)值分別為(0.5,I.5),第三個(gè)圖像單元“息”所在矩形的邊長(zhǎng)的兩個(gè)端點(diǎn)的坐標(biāo)值分別為(I.5,3.0),依次類推。這樣,寬度計(jì)算單元801可根據(jù)上述坐標(biāo)值分別計(jì)算出各個(gè)圖像単元的寬度,如第一個(gè)圖像単元的寬度為0.5,第二個(gè)圖像単元的寬度為I.0,第三個(gè)圖像単元的寬度為I.5,依次類推,可計(jì)算出所有圖像單元的寬度。排序單元802將所有圖像單元的寬度置于ー個(gè)數(shù)組并進(jìn)行排序,其中,可按照寬度從小到大或者從大到小的順序進(jìn)行排序。字寬確定単元803可將數(shù)組中的中位數(shù)作為平均字寬,若寬度個(gè)數(shù)為奇數(shù)個(gè),可取中間的值作為中位數(shù),若寬度個(gè)數(shù)為偶數(shù)個(gè),可取中間的兩個(gè)值其中之作為中位數(shù),并將該中位數(shù)作為平均字寬(ACW)。圖10是圖7中檢測(cè)單元的構(gòu)成示意圖。如圖10所示,在檢測(cè)單元702利用識(shí)別編碼信息和平均字寬對(duì)ー個(gè)圖像單元進(jìn)行檢測(cè)時(shí),檢測(cè)単元702包括第一判斷単元1001、第ニ判斷単元1002和第一確定單元1003;其中,第一判斷単元1001,用于判斷檢測(cè)的圖像單元對(duì)應(yīng)的第一個(gè)候選識(shí)別編碼是否為標(biāo)準(zhǔn)漢字編碼,其中,該第一候選編碼為識(shí)別編碼信息中的第一個(gè)編碼信息,其對(duì)應(yīng)的標(biāo)準(zhǔn)漢字為識(shí)別出的與實(shí)際的漢字最接近;第二判斷單元1002,用于在第一判斷単元1001的判斷結(jié)果為是時(shí),判斷圖像單元的寬度是否小于平均字寬與預(yù)定參數(shù)的乘積,其中,預(yù)定參數(shù)為小于I且大于0的數(shù)值,其中,該預(yù)定參數(shù)可選擇0-1之間的任意數(shù)值,例如,可選擇2/3等;第一確定單元1003,用于在第二判斷単元1002的判斷結(jié)果為是時(shí),確定檢測(cè)的圖像單元為半字寬的圖像単元(HWS),將該半字寬的圖像單元作為檢測(cè)出的錯(cuò)誤切分的圖像單元。這樣,通過(guò)上述檢測(cè)單元可對(duì)所有的圖像單元進(jìn)行檢測(cè),最終獲得所有的錯(cuò)誤切分的圖像單元。圖11是圖6中錯(cuò)誤修正單元的構(gòu)成示意圖。如圖10所示,錯(cuò)誤修正單元603包括合并單兀1101和替換單兀1002;其中,合并單元1101,用于將檢測(cè)單元檢測(cè)出的相鄰的兩個(gè)半字寬的圖像單元進(jìn)行合井;替換單元1102,用于將合并單元1101合并后的圖像單元替換該相鄰的兩個(gè)半字寬的圖像單元。通過(guò)上述方法,可將錯(cuò)誤切分的圖像單元進(jìn)行修正,尤其是對(duì)于左右結(jié)構(gòu)的漢字且左右部分均為標(biāo)準(zhǔn)漢字的錯(cuò)誤切分進(jìn)行修正,最終提高識(shí)別精度。在上述實(shí)施例中,各個(gè)單元可使用邏輯部件構(gòu)成,該邏輯部件例如為現(xiàn)場(chǎng)可編程邏輯部件、微處理器、計(jì)算機(jī)中使用的處理器等。由上述實(shí)施例可知,通過(guò)對(duì)文本圖像進(jìn)行切分和識(shí)別以獲得識(shí)別信息,利用該識(shí)別信息中的識(shí)別編碼信息和圖像單元位置信息查找錯(cuò)誤切分的圖像單元,合并相鄰的錯(cuò)誤切分的圖像單元,并將合并的圖像単元替換該切分錯(cuò)誤的圖像單元,從而可提高識(shí)別精度,解決現(xiàn)有技術(shù)中存在的問(wèn)題。圖12是本發(fā)明實(shí)施例2的漢字識(shí)別方法流程圖。如圖12所示,該方法包括步驟1201,第一識(shí)別步驟,對(duì)文本圖像進(jìn)行切分和識(shí)別,以獲得識(shí)別信息;其中,該識(shí)別信息包括對(duì)該文本圖像進(jìn)行切分后獲得的多個(gè)圖像単元在該文本圖像中的位置信息、以及對(duì)該圖像單元進(jìn)行識(shí)別獲得的識(shí)別編碼信息;步驟1202,錯(cuò)誤檢測(cè)步驟,利用該識(shí)別信息中的該識(shí)別編碼信息和位置信息檢測(cè)錯(cuò)誤切分的圖像單元;步驟1203,錯(cuò)誤修正步驟,對(duì)檢測(cè)出的該錯(cuò)誤切分的圖像單元進(jìn)行修正;步驟1204,第二識(shí)別步驟,對(duì)修正后的該圖像單元進(jìn)行識(shí)別,以獲得相應(yīng)的識(shí)別編石馬ィ目息。·由上述實(shí)施例可知,通過(guò)對(duì)文本圖像進(jìn)行切分和識(shí)別以獲得識(shí)別信息,利用該識(shí)別信息中的識(shí)別編碼信息和圖像單元位置信息查找錯(cuò)誤切分的圖像單元,合并相鄰的錯(cuò)誤切分的圖像單元,并將合并的圖像単元替換該切分錯(cuò)誤的圖像單元,從而可提高識(shí)別精度,解決現(xiàn)有技術(shù)中存在的問(wèn)題。在本實(shí)施例中,在步驟1202中,可利用多個(gè)圖像單元在文本圖像中的位置信息獲得的平均字寬(ACW)和識(shí)別編碼信息來(lái)檢測(cè)錯(cuò)誤切分的圖像單元,可采用如下方式檢測(cè)錯(cuò)誤切分的圖像單元利用該位置信息確定平均字寬;利用該識(shí)別編碼信息和該平均字寬對(duì)該多個(gè)圖像単元逐一進(jìn)行檢測(cè),以找到半字寬的圖像単元,其中該半字寬的圖像単元為檢測(cè)出的錯(cuò)誤切分的圖像單元。其中,具體的利用該位置信息確定平均字寬的方法如實(shí)施例I中所述,可包括利用該位置信息計(jì)算出每個(gè)圖像単元的寬度;將所有圖像單元的寬度置于ー個(gè)數(shù)組并進(jìn)行排序;將該數(shù)組中的中位數(shù)作為平均字寬。此外,在利用識(shí)別編碼信息和平均字寬對(duì)多個(gè)圖像単元中的一個(gè)圖像単元進(jìn)行檢測(cè)時(shí),可具體采用如下方式判斷檢測(cè)的該圖像単元對(duì)應(yīng)的第一個(gè)候選識(shí)別編碼是否為標(biāo)準(zhǔn)漢字編碼;若判斷結(jié)果為是,則進(jìn)一歩判斷該圖像単元的寬度是否小于該平均字寬與預(yù)定參數(shù)的乘積,其中,該預(yù)定參數(shù)為小于I且大于O的數(shù)值;若判斷結(jié)果為是,則確定檢測(cè)的該圖像單元為半字寬的圖像單元,此處,將半字寬的圖像単元作為錯(cuò)誤切分的圖像單元。在本實(shí)施例中,在步驟1203中,可采用如下方式對(duì)相鄰的半字寬的圖像單元進(jìn)行修正將檢測(cè)出的相鄰的兩個(gè)半字寬的圖像單元進(jìn)行合并;將合并后的圖像單元替換該相鄰的兩個(gè)半字寬的圖像単元。以下結(jié)合具體的實(shí)例對(duì)本發(fā)明的漢字識(shí)別方法進(jìn)行說(shuō)明。圖13是本發(fā)明實(shí)施例3的漢字識(shí)別方法的應(yīng)用實(shí)例流程圖,圖14是對(duì)文本圖像分別利用現(xiàn)有的OCR技術(shù)和本發(fā)明實(shí)施例的識(shí)別方法進(jìn)行識(shí)別的識(shí)別結(jié)果示意圖。如圖13所示,該方法可包括步驟步驟1301,對(duì)文本圖像進(jìn)行切分和識(shí)別,以獲得識(shí)別信息;其中,該識(shí)別信息包括對(duì)該文本圖像進(jìn)行切分后獲得的多個(gè)圖像単元在該文本圖像中的位置信息、以及對(duì)該圖像單元進(jìn)行識(shí)別獲得的識(shí)別編碼信息;其中,該識(shí)別編碼信息和位置信息如實(shí)施例I中所述,此處不再贅述。步驟1302,利用步驟1301中獲得的位置信息確定平均字寬;其中,具體包括利用該位置信息計(jì)算出每個(gè)圖像単元的寬度;將所有圖像單元的寬度置于ー個(gè)數(shù)組并進(jìn)行排序;將該數(shù)組中的中位數(shù)作為平均字寬。步驟1303,利用該識(shí)別編碼信息和該平均字寬對(duì)該多個(gè)圖像単元逐一進(jìn)行檢測(cè),以找到半字寬的圖像単元,其中該半字寬的圖像単元為檢測(cè)出的錯(cuò)誤切分的圖像單元;其中,在對(duì)多個(gè)圖像單元中的一個(gè)圖像單元進(jìn)行檢測(cè)時(shí),可采用如下方式判斷檢測(cè)的該圖像單元對(duì)應(yīng)的第一個(gè)候選識(shí)別編碼是否為標(biāo)準(zhǔn)漢字編碼;若判斷結(jié)果為是,則進(jìn)一歩判斷該圖像単元的寬度是否小于該平均字寬與預(yù)定參數(shù)的乘積,其中,該預(yù)定參數(shù)為小于I且大于O的數(shù)值;若判斷結(jié)果為是,則確定檢測(cè)的該圖像單元為半字寬的圖像単元,此處,將半字寬的圖像単元作為錯(cuò)誤切分的圖像單元。步驟1304,將檢測(cè)出的相鄰的兩個(gè)半字寬的圖像單元進(jìn)行合井。步驟1305,將合并后的圖像單元替換該相鄰的兩個(gè)半字寬的圖像単元。步驟1306,對(duì)修正后的該圖像單元進(jìn)行識(shí)別,以獲得相應(yīng)的識(shí)別編碼信息。步驟1307,輸出修正后的所有識(shí)別編碼信息對(duì)應(yīng)的漢字;其中所有識(shí)別編碼信息可包括步驟1301中被修正的圖像單元以外的圖像單元對(duì)應(yīng)的識(shí)別編碼信息、以及修正后的圖像單元對(duì)應(yīng)的識(shí)別編碼信息。如圖14所示,在使用現(xiàn)有的OCR識(shí)別技術(shù)進(jìn)行識(shí)別時(shí),其識(shí)別結(jié)果見(jiàn)1401,其中,對(duì)于“外”被識(shí)別為“外”和“卜”;“信”被識(shí)別為“イ”和“育”,導(dǎo)致識(shí)別精度較低。如圖14所示,通過(guò)使用本發(fā)明實(shí)施例的上述識(shí)別方法,可對(duì)上述文本圖像進(jìn)行精確的識(shí)別,減少識(shí)別錯(cuò)誤的發(fā)生,見(jiàn)1402。由上述實(shí)施例可知,通過(guò)對(duì)文本圖像進(jìn)行切分和識(shí)別以獲得識(shí)別信息,利用該識(shí)別信息中的識(shí)別編碼信息和圖像單元位置信息查找錯(cuò)誤切分的圖像單元,合并相鄰的錯(cuò)誤切分的圖像單元,并將合并的圖像単元替換該切分錯(cuò)誤的圖像單元,從而可提高識(shí)別精度,解決現(xiàn)有技術(shù)中存在的問(wèn)題。由上述實(shí)施例可知,通過(guò)對(duì)文本圖像進(jìn)行切分和識(shí)別以獲得識(shí)別信息,利用該識(shí)別信息中的識(shí)別編碼信息和圖像單元位置信息查找錯(cuò)誤切分的圖像單元,合并相鄰的錯(cuò)誤切分的圖像單元,并將合并的圖像単元替換該切分錯(cuò)誤的圖像單元,從而可提高識(shí)別精度,解決現(xiàn)有技術(shù)中存在的問(wèn)題。本發(fā)明以上的裝置和方法可以由硬件實(shí)現(xiàn),也可以由硬件結(jié)合軟件實(shí)現(xiàn)。本發(fā)明涉及這樣的計(jì)算機(jī)可讀程序,當(dāng)該程序被邏輯部件所執(zhí)行吋,能夠使該邏輯部件實(shí)現(xiàn)上文所述的裝置或構(gòu)成部件,或使該邏輯部件實(shí)現(xiàn)上文所述的各種方法或步驟。該邏輯部件例如為現(xiàn)場(chǎng)可編程邏輯部件、微處理器、計(jì)算機(jī)中使用的處理器等。本發(fā)明還涉及用于存儲(chǔ)以上程序的存儲(chǔ)介質(zhì),如硬盤、磁盤、光盤、DVD、flash存儲(chǔ)器等。以上結(jié)合具體的實(shí)施方式對(duì)本發(fā)明進(jìn)行了描述,但本領(lǐng)域技術(shù)人員應(yīng)該清楚,這些描述都是示例性的,并不是對(duì)本發(fā)明保護(hù)范圍的限制。本領(lǐng)域技術(shù)人員可以根據(jù)本發(fā)明的精神和原理對(duì)本發(fā)明做出各種變型和修改,這些變型和修改也在本發(fā)明的范圍內(nèi)。權(quán)利要求1.ー種漢字識(shí)別裝置,所述裝置包括第一識(shí)別單元,所述第一識(shí)別單元用于對(duì)文本圖像進(jìn)行切分和識(shí)別,以獲得識(shí)別信息;其中,所述識(shí)別信息包括對(duì)所述文本圖像進(jìn)行切分后獲得的多個(gè)圖像単元在所述文本圖像中的位置信息、以及對(duì)所述圖像単元進(jìn)行識(shí)別所獲得的識(shí)別編碼信息;錯(cuò)誤檢測(cè)單元,所述錯(cuò)誤檢測(cè)單元用于利用所述第一識(shí)別單元獲得所述識(shí)別編碼信息和位置信息檢測(cè)錯(cuò)誤切分的圖像單元;錯(cuò)誤修正単元,所述錯(cuò)誤修正単元用于對(duì)所述錯(cuò)誤檢測(cè)單元檢測(cè)出的所述錯(cuò)誤切分的圖像單元進(jìn)行修正;第二識(shí)別單元,所述第二識(shí)別單元用于對(duì)所述錯(cuò)誤修正単元修正后的所述圖像單元進(jìn)行識(shí)別,以獲得相應(yīng)的識(shí)別編碼信息。2.根據(jù)權(quán)利要求I所述的裝置,其中,所述錯(cuò)誤檢測(cè)單元包括字寬計(jì)算単元,所述字寬計(jì)算單元用于利用所述第一識(shí)別單元獲得的位置信息確定平均字寬;檢測(cè)單元,所述檢測(cè)単元用于利用所述第一識(shí)別單元獲得的所述識(shí)別編碼信息和所述平均字寬對(duì)所述多個(gè)圖像單元逐一進(jìn)行檢測(cè),以找到半字寬的圖像単元,所述半字寬的圖像単元為檢測(cè)出的錯(cuò)誤切分的圖像單元。3.根據(jù)權(quán)利要求2所述的裝置,其中,所述字寬計(jì)算單元包括寬度計(jì)算單元,所述寬度計(jì)算單元用于利用所述第一識(shí)別單元獲得的位置信息計(jì)算出每個(gè)圖像単元的寬度;排序單元,所述排序単元用于將所有圖像單元的寬度置于ー個(gè)數(shù)組并進(jìn)行排序;字寬確定単元,所述字寬確定單元用于將所述數(shù)組中的中位數(shù)作為平均字寬。4.根據(jù)權(quán)利要求2所述的裝置,其中,所述檢測(cè)単元利用所述識(shí)別編碼信息和平均字寬對(duì)ー個(gè)圖像單元進(jìn)行檢測(cè)時(shí),包括第一判斷単元,所述第一判斷単元用于判斷檢測(cè)的所述圖像単元對(duì)應(yīng)的第一個(gè)候選識(shí)別編碼是否為標(biāo)準(zhǔn)漢字編碼;第二判斷単元,所述第二判斷単元用于在所述第一判斷単元的判斷結(jié)果為是時(shí),判斷所述圖像単元的寬度是否小于所述平均字寬與預(yù)定參數(shù)的乘積,其中,所述預(yù)定參數(shù)為小于I且大于O的數(shù)值;第一確定單元,所述第一確定單元用于在所述第二判斷単元的判斷結(jié)果為是時(shí),確定檢測(cè)的所述圖像單元為半字寬的圖像単元。5.根據(jù)權(quán)利要求2所述的裝置,其中,所述錯(cuò)誤修正単元包括合并單元,所述合并単元用于將所述檢測(cè)単元檢測(cè)出的相鄰的兩個(gè)半字寬的圖像単元進(jìn)行合并;替換單元,所述替換単元用于將所述合并単元合并后的圖像單元替換所述相鄰的兩個(gè)半字寬的圖像単元。6.ー種漢字識(shí)別方法,所述方法包括第一識(shí)別步驟,對(duì)文本圖像進(jìn)行切分和識(shí)別,以獲得識(shí)別信息;其中,所述識(shí)別信息包括對(duì)所述文本圖像進(jìn)行切分后獲得的多個(gè)圖像単元在所述文本圖像中的位置信息、以及對(duì)所述圖像單元進(jìn)行識(shí)別獲得的識(shí)別編碼信息;錯(cuò)誤檢測(cè)步驟,利用所述識(shí)別信息中的所述識(shí)別編碼信息和位置信息檢測(cè)錯(cuò)誤切分的圖像單元;錯(cuò)誤修正步驟,對(duì)檢測(cè)出的所述錯(cuò)誤切分的圖像單元進(jìn)行修正;第二識(shí)別步驟,對(duì)修正后的所述圖像單元進(jìn)行識(shí)別,以獲得相應(yīng)的識(shí)別編碼信息。7.根據(jù)權(quán)利要求6所述的方法,其中,所述錯(cuò)誤檢測(cè)步驟包括利用所述位置信息確定平均字寬;利用所述識(shí)別編碼信息和所述平均字寬對(duì)所述多個(gè)圖像單元逐一進(jìn)行檢測(cè),以找到半字寬的圖像単元,其中所述半字寬的圖像単元為檢測(cè)出的錯(cuò)誤切分的圖像單元。8.根據(jù)權(quán)利要求7所述的方法,其中,所述利用識(shí)別編碼信息和平均字寬對(duì)ー個(gè)圖像單元進(jìn)行檢測(cè)時(shí),包括判斷檢測(cè)的所述圖像単元對(duì)應(yīng)的第一個(gè)候選識(shí)別編碼是否為標(biāo)準(zhǔn)漢字編碼;若判斷結(jié)果為是,則進(jìn)一歩判斷所述圖像単元的寬度是否小于所述平均字寬與預(yù)定參數(shù)的乘積,其中,所述預(yù)定參數(shù)為小于I且大于O的數(shù)值;若判斷結(jié)果為是,則確定檢測(cè)的所述圖像單元為半字寬的圖像単元。9.根據(jù)權(quán)利要求7所述的方法,其中,所述利用位置信息獲得平均字寬,包括利用所述位置信息計(jì)算出每個(gè)圖像単元的寬度;將所有圖像單元的寬度置于ー個(gè)數(shù)組并進(jìn)行排序;將所述數(shù)組中的中位數(shù)作為平均字寬。10.根據(jù)權(quán)利要求7所述的方法,其中,所述錯(cuò)誤修正步驟包括將檢測(cè)出的相鄰的兩個(gè)半字寬的圖像單元進(jìn)行合并;將合并后的圖像單元替換所述相鄰的兩個(gè)半字寬的圖像單元。全文摘要本發(fā)明提供一種漢字識(shí)別裝置和方法,該裝置包括第一識(shí)別單元用于對(duì)文本圖像進(jìn)行切分和識(shí)別,以獲得識(shí)別信息;錯(cuò)誤檢測(cè)單元,用于利用該第一識(shí)別單元獲得識(shí)別信息中圖像單元的位置信息和識(shí)別編碼信息檢測(cè)錯(cuò)誤切分的圖像單元;錯(cuò)誤修正單元,用于對(duì)該錯(cuò)誤檢測(cè)單元檢測(cè)出的該錯(cuò)誤切分的圖像單元進(jìn)行修正;第二識(shí)別單元,用于對(duì)該錯(cuò)誤修正單元修正后的該圖像單元進(jìn)行識(shí)別,以獲得相應(yīng)的識(shí)別編碼信息。通過(guò)本發(fā)明實(shí)施例,利用對(duì)文本圖像進(jìn)行識(shí)別后獲得的識(shí)別信息中的識(shí)別編碼信息和圖像單元位置信息檢測(cè)錯(cuò)誤切分的圖像單元并對(duì)錯(cuò)誤切分的圖像單元進(jìn)行修正,從而可提高識(shí)別精度,解決現(xiàn)有技術(shù)中存在的問(wèn)題。文檔編號(hào)G06K9/20GK102867178SQ20111018713公開(kāi)日2013年1月9日申請(qǐng)日期2011年7月5日優(yōu)先權(quán)日2011年7月5日發(fā)明者徐文權(quán),河源,孫俊,于浩,直井聰申請(qǐng)人:富士通株式會(huì)社
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1