專(zhuān)利名稱(chēng):一種計(jì)算機(jī)數(shù)字識(shí)別系統(tǒng)的圖象聚類(lèi)快速校對(duì)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)數(shù)字識(shí)別系統(tǒng)后處理中的快速校對(duì)方法。
目前,各類(lèi)計(jì)算機(jī)管理系統(tǒng)中的各種數(shù)字報(bào)表的錄入普遍采用操作員人工鍵入的方式,費(fèi)時(shí)費(fèi)力且誤碼率很高。而計(jì)算機(jī)數(shù)字識(shí)別技術(shù)使得數(shù)字報(bào)表的全自動(dòng)錄入成為可能。但由于報(bào)表本身的書(shū)寫(xiě)質(zhì)量,污損等因素及識(shí)別技術(shù)的局限,使得數(shù)字識(shí)別不可能達(dá)到百分之百的正確(通常手寫(xiě)數(shù)字正確識(shí)別率可達(dá)95%左右),識(shí)別后的人工校對(duì)工作成為必需。對(duì)于拒識(shí)數(shù)字,可采用計(jì)算機(jī)提示原始圖形,人工敲入正確數(shù)字的方法很方便地進(jìn)行改正。但對(duì)于少量的計(jì)算機(jī)誤識(shí)的數(shù)字要靠人工一個(gè)字一個(gè)字地對(duì)照原稿進(jìn)行校對(duì),在成百上千個(gè)雜亂無(wú)章的數(shù)字中找出幾個(gè)誤識(shí)的數(shù)字,其困難程度可想而知。即使如此校對(duì)以后,仍無(wú)法確信所有識(shí)別數(shù)字已百分之百正確。因而也就限制了數(shù)字識(shí)別技術(shù)在各領(lǐng)域中的廣泛應(yīng)用。
本發(fā)明的目的是提供一種全新的快速校對(duì)方法,使得誤識(shí)字的改正達(dá)到輕而易舉,進(jìn)而保證所有識(shí)別結(jié)果的完全正確。
本發(fā)明提供了一種計(jì)算機(jī)數(shù)字識(shí)別系統(tǒng)的圖象聚類(lèi)快速校對(duì)方法,首先對(duì)整頁(yè)的數(shù)據(jù)報(bào)表進(jìn)行電子掃描,經(jīng)數(shù)字切分軟件將其切割成一幅幅單獨(dú)的數(shù)字圖形,進(jìn)而形成待識(shí)字符圖形的文件,包括含有圖像信息的數(shù)據(jù)文件和其對(duì)應(yīng)的索引文件,索引文件含有該字符所在的行號(hào)、位號(hào)、高度、寬度、在數(shù)據(jù)文件中的起始地址及識(shí)別結(jié)果的信息,其特征在于在上述過(guò)程進(jìn)行完畢后----根據(jù)識(shí)別結(jié)果將所對(duì)應(yīng)圖象聚類(lèi);----將聚類(lèi)后同類(lèi)圖象顯示于屏幕上;----從屏幕上同類(lèi)圖象中找出明顯識(shí)別錯(cuò)誤的不屬該類(lèi)的圖象并改正。
計(jì)算機(jī)的數(shù)字識(shí)別是近幾年的發(fā)展熱點(diǎn),為使其能得到廣泛應(yīng)用,人們?cè)谧非笳_識(shí)別率方面作了大量的工作,有些識(shí)別系統(tǒng)的正確識(shí)別率甚至能達(dá)到百分之九十九,但是由于對(duì)另百分之一的誤識(shí)字符的束手無(wú)策,而始終不能使數(shù)字識(shí)別系統(tǒng)進(jìn)入實(shí)質(zhì)性的應(yīng)用,應(yīng)該看到這種對(duì)正確識(shí)別率的追求是偏面的,也是有限的。而本發(fā)明則采取了完全相反的思路,在保證系統(tǒng)具有較高正確識(shí)別率的前提下,采用圖象聚類(lèi)的技術(shù)手段,對(duì)少數(shù)的個(gè)別的誤識(shí)字符進(jìn)行校對(duì),以保證識(shí)別結(jié)果百分之百的正確。本發(fā)明的關(guān)鍵在于利用了數(shù)字識(shí)別中的識(shí)別結(jié)果與原始圖形的對(duì)應(yīng)關(guān)系,將同一識(shí)別結(jié)果所對(duì)應(yīng)的所有圖象聚類(lèi),并全屏幕放大顯示,從而使操作者極容易在眾多的相同中找出個(gè)別的誤識(shí)字符,做到輕松較對(duì),校對(duì)操作可以采用觸摸屏或鼠標(biāo)及鍵盤(pán)等操作方式。本發(fā)明適用于類(lèi)型較少且無(wú)規(guī)之字符,特別是阿拉伯?dāng)?shù)字0-9的校對(duì)。
下面結(jié)合附圖通過(guò)實(shí)施例詳述本發(fā)明。
附
圖1為系統(tǒng)組成的結(jié)構(gòu)方框圖附圖2為圖象聚類(lèi)快速校對(duì)軟件流程圖附圖3為觸摸屏操作時(shí)的模塊流程圖附圖4為鍵盤(pán)操作時(shí)的模塊流程圖附圖5為鼠標(biāo)操作時(shí)的模塊流程圖附圖6為操作過(guò)程中的屏幕顯示示意圖實(shí)施例系統(tǒng)組成的結(jié)構(gòu)見(jiàn)附圖1數(shù)字識(shí)別過(guò)程,首先是對(duì)一幀整頁(yè)的數(shù)據(jù)報(bào)表進(jìn)行電子掃描,然后經(jīng)專(zhuān)門(mén)的數(shù)字切分軟件將其切割成一幅幅單獨(dú)的數(shù)字圖形,進(jìn)而形成待識(shí)數(shù)字圖形的文件,包括一個(gè)數(shù)據(jù)文件(dig.DAT)和一個(gè)索引文件(dig.IDX)其索引文件格式如下
dig.IDX(定長(zhǎng))數(shù)據(jù)文件格式如下
dig.DAT(不定長(zhǎng))每個(gè)數(shù)字的索引共占20個(gè)字節(jié),其主要內(nèi)容包括該數(shù)字所在的行號(hào)、位號(hào),該數(shù)字的高度,寬度。該數(shù)字在dig.DAT中的起始地址等有關(guān)信息,其中第6字節(jié),為該數(shù)字圖形的識(shí)別結(jié)果,其值是由數(shù)字識(shí)別軟件識(shí)別后填入的一個(gè)識(shí)別結(jié)果(可能正確,也可能錯(cuò)誤)識(shí)別結(jié)束后進(jìn)入快速交互式校對(duì)模塊;圖3繪出了利用觸屏操作單元(1)進(jìn)行校對(duì)的模塊流程系統(tǒng)首先將圖象顯示初始化成640×480的VGA圖形方式,并同時(shí)將觸屏初始化成單點(diǎn)進(jìn)入方式,將屏幕化分為圖形區(qū)(1-420行)及數(shù)字區(qū)(420-480行),在圖形區(qū)中準(zhǔn)備顯示圖形文件,在數(shù)字區(qū)中繪出0-9及一個(gè)回車(chē)框菜單。
這時(shí)程序開(kāi)始訪(fǎng)問(wèn)dig.IDX索引文件(索引文件的第6字節(jié)中存放著該索引所對(duì)應(yīng)的圖形文件的識(shí)別結(jié)果)將其識(shí)別結(jié)果為″0″的所有索引號(hào)記下,并將各自索引所對(duì)應(yīng)的圖形文件讀出,以圖形方式依次顯示于屏幕中的圖形區(qū),同時(shí)記下各圖形在屏幕中的X,Y坐標(biāo)。此時(shí)程序等待操作者的觸屏輸入。
此時(shí)屏幕上的圖形大部分為“0”,極少數(shù)類(lèi)似于“0”的數(shù)字,由于識(shí)別系統(tǒng)誤將其識(shí)別為“0”,也進(jìn)入了″0″畫(huà)面之中,操作者在眾多的″0″當(dāng)中很容易查覺(jué)非″0″數(shù)字,這時(shí)操作者只要用手指明該錯(cuò)誤字,程序便自動(dòng)將該坐標(biāo)所對(duì)應(yīng)的索引序號(hào)記下,待操作者再指明屏幕下方的一個(gè)正確數(shù)字時(shí),程序便將這一正確結(jié)果記入其對(duì)應(yīng)索引的第6字節(jié),完成了校正的過(guò)程。
當(dāng)操作者確認(rèn)此屏已正確無(wú)誤,便指明回車(chē)框,程序便自動(dòng)進(jìn)入下一屏畫(huà)面,如索引文件中還有為“0”的圖象,則再生成一幅“0”畫(huà)面繼續(xù)修改,否則程序便從索引文件頭開(kāi)始,生成“1”畫(huà)面,以下修改過(guò)程同“0”畫(huà)面完全相同。這樣一直進(jìn)行到“9”畫(huà)面,所有數(shù)字全部校改完畢。
該過(guò)程結(jié)束以后,索引文件中的第6字節(jié)全部為正確結(jié)果,達(dá)到了識(shí)別報(bào)表錄入的100%正確率。
因?yàn)閿?shù)字識(shí)別是將一幅數(shù)字圖形經(jīng)識(shí)別軟件處理給出一個(gè)識(shí)別結(jié)果的過(guò)程,即每一識(shí)別結(jié)果分別對(duì)應(yīng)一幅數(shù)字圖形。以校正數(shù)字1為例,在整個(gè)數(shù)字識(shí)別結(jié)束后分別將其識(shí)別結(jié)果為“1”的所有原始圖形顯示在屏幕上(一屏可顯示百余個(gè),每個(gè)數(shù)字圖形足夠大十分醒目,屏幕不夠,可采用換頁(yè)辦法)如果其中有幾個(gè)原始圖象并不是“1”的圖形,而是“2”或“3”等,操作者可非常容易地將其找出。見(jiàn)圖5,識(shí)別系統(tǒng)誤將一個(gè)圖形“7”識(shí)別為“1”,這個(gè)“7”的圖形便顯示于眾多“1”的圖形之中,操作者非常容易辯別,用手指一下這個(gè)圖形,再指一下數(shù)字菜單中的“7”此時(shí)計(jì)算機(jī)發(fā)“7”的聲音,修改即告完成。
利用鼠標(biāo)操作單元(2)進(jìn)行校正的模塊流程示于圖3,利用鍵盤(pán)操作單元(3)進(jìn)行較正的模塊流程示于圖4,由于其工作過(guò)程與觸屏操作類(lèi)同,只是操作者在指明錯(cuò)誤圖象時(shí)所用的手段不同。利用鼠標(biāo)是靠鼠標(biāo)在X,Y方向的移動(dòng)給出當(dāng)前圖象所對(duì)應(yīng)的座標(biāo),計(jì)算機(jī)判明其所對(duì)應(yīng)的索引,然后再根據(jù)鼠標(biāo)指明的正確字符加以改正。利用鍵盤(pán)操作是通過(guò)鍵入的↑↓鍵來(lái)改變當(dāng)前圖象的X,Y座標(biāo),并用數(shù)字鍵(0-9)鍵入正確的結(jié)果,其它流程完全一樣,故不再重述。
本發(fā)明也可用于英文字母的識(shí)別系統(tǒng)中,由于英文識(shí)別的字符集較多(26個(gè)大小寫(xiě)字母,數(shù)字標(biāo)點(diǎn)等)屏幕下方的菜單區(qū)可取消,采用鍵入的方式,同樣要比順序校對(duì)的效率大大地提高,而且其可靠性非常之高。
權(quán)利要求
1.一種計(jì)算機(jī)數(shù)字識(shí)別系統(tǒng)的圖象聚類(lèi)快速校對(duì)方法,首先對(duì)整頁(yè)的數(shù)據(jù)報(bào)表進(jìn)行電子掃描,經(jīng)數(shù)字切分軟件將其切割成一幅幅單獨(dú)的數(shù)字圖形,進(jìn)而形成待識(shí)字符圖形的文件,包括含有圖像信息的數(shù)據(jù)文件和其對(duì)應(yīng)的索引文件,索引文件含有該字符所在的行號(hào)、位號(hào)、高度、寬度、在數(shù)據(jù)文件中的起始地址及識(shí)別結(jié)果的信息,其特征在于上述過(guò)程進(jìn)行完畢后----根據(jù)識(shí)別結(jié)果將所對(duì)應(yīng)圖象聚類(lèi);----將聚類(lèi)后同類(lèi)圖象顯示于屏幕上;----從屏幕上同類(lèi)圖象中找出明顯識(shí)別錯(cuò)誤的不屬該類(lèi)的圖象并改正。
2.按權(quán)利要求1所述數(shù)字識(shí)別系統(tǒng)的圖象聚類(lèi)快速校對(duì)方法,其特征在于待校對(duì)字符為阿拉伯?dāng)?shù)字0-9。
全文摘要
一種計(jì)算機(jī)數(shù)字識(shí)別系統(tǒng)的圖象聚類(lèi)快速校對(duì)方法,適用于各種計(jì)算機(jī)的數(shù)字或字符識(shí)別系統(tǒng),其特征在于數(shù)字識(shí)別進(jìn)行完畢后,根據(jù)識(shí)別結(jié)果將所對(duì)應(yīng)圖象聚類(lèi);將聚類(lèi)后同類(lèi)圖象顯示于屏幕上;從屏幕上同類(lèi)圖象中找出明顯識(shí)別錯(cuò)誤的不屬該類(lèi)的圖象并改正。本發(fā)明使得誤識(shí)字的改正達(dá)到輕而易舉,進(jìn)而保證所有識(shí)別結(jié)果的完全正確。
文檔編號(hào)G06F17/20GK1148218SQ9611532
公開(kāi)日1997年4月23日 申請(qǐng)日期1996年5月22日 優(yōu)先權(quán)日1995年9月21日
發(fā)明者談大龍, 李偉, 楊力 申請(qǐng)人:中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所