本實(shí)用新型屬于試卷信息采集技術(shù)領(lǐng)域,尤其涉及基于機(jī)器視覺的試卷信息采集系統(tǒng)。
背景技術(shù):
當(dāng)前的考試除了像高考類的大型考試會(huì)將整張?jiān)嚲頀呙璧诫娔X上,并在電腦上閱卷后直接將分?jǐn)?shù)錄入電腦外,大部分的試卷仍然是通過老師手工閱卷并將分?jǐn)?shù)寫在試卷上,之后再進(jìn)行人工統(tǒng)分登分和成績(jī)分析。此項(xiàng)工作雖不復(fù)雜,但是需要大量精力和足夠的細(xì)心,尤其是試卷特別多的時(shí)候,手工統(tǒng)分登分的弊端就愈發(fā)顯著,不僅占據(jù)了老師的精力和時(shí)間,而且統(tǒng)計(jì)的準(zhǔn)確率也會(huì)隨之下降,從而引發(fā)后續(xù)難題。
同樣的,現(xiàn)有技術(shù)中的答題卡解決了選項(xiàng)題的審批問題,原理是利用對(duì)碳很敏感的紅外線,對(duì)答題卡上2B鉛筆涂跡的位置進(jìn)行坐標(biāo),使得閱讀機(jī)識(shí)別出學(xué)號(hào)和答案的正確與否。但如果把該技術(shù)應(yīng)用到普通試卷來進(jìn)行統(tǒng)分登分的話,不僅需要對(duì)試卷進(jìn)行區(qū)域修改,并要求學(xué)生用2B鉛筆準(zhǔn)確填涂學(xué)號(hào),而且老師打總分時(shí)也要用鉛筆填涂,這樣僅僅在閱卷過程中就會(huì)浪費(fèi)很多的時(shí)間,同時(shí)老師還要時(shí)時(shí)刻刻檢查是否涂錯(cuò),且在考試頻繁的時(shí)期更顯不便,甚至?xí)斐烧w工作效率的下降。
隨著機(jī)器視覺技術(shù)的發(fā)展,使用光學(xué)器件進(jìn)行非接觸感知,自動(dòng)獲取和解釋一個(gè)真實(shí)場(chǎng)景的圖像,以獲取信息和(或)控制機(jī)器或過程,即通過機(jī)器視覺產(chǎn)品將攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào);圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。機(jī)器視覺可以理解為給機(jī)器駕加裝上視覺裝置,使機(jī)器具備視覺功能,在某些領(lǐng)域代替人眼來做測(cè)量和判斷,使其能認(rèn)識(shí)和看懂觀察到的東西,能確定它所見范圍內(nèi)的目標(biāo)的位置。機(jī)器視覺不僅是人眼的延伸,也具有人腦的部分功能,目的是提高機(jī)器的自動(dòng)化和智能化程度。因此利用機(jī)器視覺技術(shù)來實(shí)現(xiàn)現(xiàn)在工業(yè)和生活的自動(dòng)化已成為越來越多的人關(guān)注的焦點(diǎn)。
技術(shù)實(shí)現(xiàn)要素:
本實(shí)用新型的目的是提供一種基于機(jī)器視覺的試卷信息采集系統(tǒng),本實(shí)用新型結(jié)構(gòu)簡(jiǎn)單,使用方便,可以快速有效地采集試卷信息并傳送至PC機(jī)上進(jìn)行數(shù)據(jù)解析,大大降低了試卷審批以及分?jǐn)?shù)統(tǒng)計(jì)的勞動(dòng)強(qiáng)度和出錯(cuò)頻率,提高工作效率。
為解決上述技術(shù)問題,本實(shí)用新型采用的技術(shù)方案如下:
基于機(jī)器視覺的試卷信息采集系統(tǒng),所述系統(tǒng)包括信息采集裝置和信息分析裝置,所述信息采集裝置包括底座、立柱和攝像機(jī)構(gòu),立柱垂直固設(shè)在底座一側(cè),攝像機(jī)構(gòu)通過卡夾與立柱滑動(dòng)配合;信息分析裝置包括與信息采集裝置信號(hào)連接的PC機(jī)。
優(yōu)選的,所述攝像機(jī)構(gòu)包括工業(yè)相機(jī),工業(yè)相機(jī)的輸入端和輸出端通過數(shù)據(jù)采集卡與PC機(jī)信號(hào)連接。
優(yōu)選的,所述攝像機(jī)構(gòu)還包括與工業(yè)相機(jī)連接的固定板和水平調(diào)節(jié)器,水平調(diào)節(jié)器包括固設(shè)在基板上的兩塊擋板,兩塊擋板之間設(shè)有上、下兩根滑桿,固定板上、下端分別與兩根滑桿配合;基板通過卡夾與立柱連接。
優(yōu)選的,所述水平調(diào)節(jié)器還包括位于兩根滑桿之間且順次貫穿兩擋板和固定板的絲桿,絲桿與固定板螺紋配合且絲桿一端固定有扭輪。
優(yōu)選的,所述攝像機(jī)構(gòu)還包括底部周向設(shè)有數(shù)個(gè)LED燈的補(bǔ)光圈,補(bǔ)光圈通過吊板與固定板底部連接,且補(bǔ)光圈與工業(yè)相機(jī)的鏡頭同軸設(shè)置。
優(yōu)選的,所述固定板底部設(shè)有紅外線發(fā)射器,底座上對(duì)應(yīng)設(shè)有紅外線接收器,紅外線接收器通過數(shù)據(jù)采集卡與PC機(jī)信號(hào)連接。
優(yōu)選的,所述卡夾的兩夾片端部通過調(diào)距螺栓連接。
本實(shí)用新型在使用時(shí),將需要審批的試卷放置在底座上,由于試卷遮擋紅外線發(fā)射器發(fā)射的紅外線,使得紅外線接收器無法接收,紅外線接收器將該信號(hào)通過數(shù)據(jù)采集卡的A/D轉(zhuǎn)換后傳遞至PC機(jī),PC機(jī)在接收到紅外阻斷信號(hào)后自動(dòng)控制工業(yè)相機(jī)對(duì)試卷進(jìn)行拍攝照片,照片數(shù)據(jù)通過數(shù)據(jù)采集卡傳遞至PC機(jī)并存儲(chǔ)圖像。然后PC機(jī)從拍攝存儲(chǔ)的圖像中提取出含有學(xué)號(hào)和總分的區(qū)域,再對(duì)提取出的圖像進(jìn)行圖像灰度化、二值化處理、圖像閉運(yùn)算、數(shù)字分割、傾斜調(diào)整、提取骨架以及歸一化等預(yù)處理,最后通過設(shè)定的算法對(duì)數(shù)字進(jìn)行識(shí)別并進(jìn)行存儲(chǔ)。最終由成績(jī)分析單元對(duì)識(shí)別出的學(xué)號(hào)、成績(jī)進(jìn)行系統(tǒng)分析并得出結(jié)果。
圖像信息分析步驟具體如下:從拍攝的圖像中提取出含有學(xué)號(hào)和總分的區(qū)域,由于放置試卷時(shí)位置不固定,因此首先利用模版匹配工具來對(duì)試卷進(jìn)行自動(dòng)拍攝包含目標(biāo)的大塊區(qū)域,又由于試卷上學(xué)號(hào)和分?jǐn)?shù)的位置相對(duì)于攝取出的大塊區(qū)域一般固定,而且還有下劃線定位,所以通過相對(duì)坐標(biāo)位置判斷和直線位置定位識(shí)別就能將含有分?jǐn)?shù)和學(xué)號(hào)的小塊區(qū)域截取出來。然后對(duì)圖像進(jìn)行下述預(yù)處理:圖像灰度化、二值化處理、圖像閉運(yùn)算、數(shù)字分割、傾斜調(diào)整、提取骨架以及歸一化。
其中,圖像灰度化即將工業(yè)相機(jī)拍攝的彩色圖像變成灰度圖像,以減少圖像原始數(shù)據(jù)量便于后續(xù)計(jì)算。由于對(duì)拍攝環(huán)境已經(jīng)調(diào)試到最好狀態(tài),并經(jīng)實(shí)驗(yàn)驗(yàn)證無需對(duì)圖像進(jìn)行增強(qiáng)、濾波,可直接將灰度圖像進(jìn)行二值化處理,即呈現(xiàn)出非黑即白效果。二值化處理的方法是先利用最大類間方差法來獲得最佳閾值,之后再使用閾值變換法把灰度圖像轉(zhuǎn)換成二值圖像。
最大類間方差閾值算法:
設(shè)T為分割閾值,μ為圖像均值,則圖像可分為兩個(gè)區(qū),目標(biāo)區(qū)(O區(qū))與背景區(qū)(B區(qū))。P(i)為第i級(jí)灰度的概率。
對(duì)應(yīng)以T為閾值的類間方差為:
有對(duì)應(yīng)以T為閾值的類間方差使σ2最大的T值即為最佳閾值。
圖像進(jìn)行閉運(yùn)算(先膨脹后腐蝕的過程,膨脹的公式:含義:集合B先作關(guān)于原點(diǎn)的映射,然后平移x,形成新的集合,該集合與集合X相交不為空集時(shí)的結(jié)構(gòu)元素參考點(diǎn)的集合;腐蝕的公式:含義:B平移x后仍在集合X內(nèi)部的參考點(diǎn)集合)時(shí),其中使用圓盤形結(jié)構(gòu)元素進(jìn)行運(yùn)算,目的使圖像中數(shù)字部分細(xì)小的空洞被填充;連接鄰近物體,例如數(shù)字:0、4、6、8、9,則會(huì)把其孔洞邊界斷開部分連接成一個(gè)完整孔洞,用于特征識(shí)別;平滑其邊界用來數(shù)字分割和特征識(shí)別。
數(shù)字切割即沿著數(shù)字的上下左右邊緣將數(shù)字剪切出來,為了使數(shù)字識(shí)別更簡(jiǎn)便。本發(fā)明采用掃描的方法,找出每個(gè)數(shù)字的上下左右切點(diǎn),然后根據(jù)上下切點(diǎn)的行數(shù)和左右切點(diǎn)的列數(shù)來決定所要剪切的數(shù)字的起始和終止的行數(shù)與列數(shù),就可以將數(shù)字切割出來。
下面為一圖片的矩陣實(shí)例:
由于圖像已二值化處理,數(shù)字部分灰度值不為0,本切割方法即尋找矩陣中灰度值不為0的整個(gè)區(qū)域邊界的坐標(biāo),找出上下左右的切點(diǎn),之后進(jìn)行數(shù)字切割。
對(duì)數(shù)字進(jìn)行傾斜調(diào)整:先計(jì)算二值圖像的高寬比來估計(jì)圖像的傾斜角度,高寬比越小,則傾斜角度越大,反之,傾斜角度越小。通過觀察,當(dāng)高寬比達(dá)到最大時(shí),數(shù)字最接近豎直。之后通過仿射變換進(jìn)行旋轉(zhuǎn)。
仿射旋轉(zhuǎn)變換:目標(biāo)圖形以(x,y)為軸心(取圖片中心)順時(shí)針旋轉(zhuǎn)θ弧度,變換矩陣為:
接下來進(jìn)行提取骨架,直接細(xì)化處理,但會(huì)出現(xiàn)毛刺。為除去毛刺,本發(fā)明采用毛刺閾值刪除法。需要先找出骨架中的分叉點(diǎn),求分叉點(diǎn)的方法:
細(xì)化后得到二值圖像f(x,y)中,如果其中的像素i,滿足f(xi,yi)=255,則在像素i的8鄰域模板內(nèi)統(tǒng)計(jì)其f(xi+Δx,yi+Δy)=255的個(gè)數(shù)并記入Counti中,其中xi,yi={-1 0 1}。重復(fù)此操作,直至所有像素操作完畢。Counti>3即為分支點(diǎn);如果Counti=1,即為端點(diǎn)。
通過人工設(shè)置一個(gè)T閾值長(zhǎng)度,將小于T長(zhǎng)度的毛刺自動(dòng)刪除,即可除去毛刺。最后歸一化,將每個(gè)數(shù)字放在規(guī)定大小的圖片空間中,用來統(tǒng)一字符的大小及格式。
所述數(shù)字識(shí)別過程中,采用的方法為數(shù)字的特征提取,通過每個(gè)數(shù)字的特征不同,分別進(jìn)行識(shí)別。
數(shù)字“1”:提取數(shù)字1離心率最大的特征,經(jīng)理論驗(yàn)證和大量實(shí)驗(yàn)驗(yàn)證,數(shù)字1的離心率e最大并且離心率e均在0.99~1.00之間,其他數(shù)字離心率e均在0.99以下。
數(shù)字“7”:采用與數(shù)字1相同的方法。不同的地方在于截取數(shù)字7的下半部分求離心率。
數(shù)字“0、6、8、9”:提取孔洞特征,它們的共同點(diǎn)就是全都有孔洞,根據(jù)有無孔洞將其篩選出來,再根據(jù)孔洞數(shù)量將數(shù)字8(兩個(gè)孔洞)篩選出來。其余三個(gè)數(shù)字(一個(gè)孔洞)根據(jù)孔洞位置進(jìn)行區(qū)分。因?yàn)槊總€(gè)數(shù)字均沿著數(shù)字的上下左右邊緣將數(shù)字剪切出來的,所以數(shù)字0的孔洞上下邊界均緊貼圖片邊界,在圖片上下邊界均有灰度值為255的像素點(diǎn);數(shù)字6的孔洞只有下邊界緊貼圖片邊界,圖片下邊界有灰度值為255的像素點(diǎn);數(shù)字9的孔洞只有上邊界緊貼圖片邊界,圖片上邊界有灰度值為255的像素點(diǎn)。
計(jì)算孔洞數(shù)量和位置通過下述圖片的矩陣實(shí)例說明:
通過上述方法,求得A中有兩個(gè)孔洞(數(shù)字1包圍的一個(gè)、數(shù)字2包圍的一個(gè))。同時(shí)可以求得孔洞的位置坐標(biāo)。
數(shù)字“4”:由于是手寫數(shù)字,每個(gè)人筆跡有所差異,所以數(shù)字4會(huì)有三種明顯不同的情況:第一種是數(shù)字4沒有閉合部分(無孔洞),提取四交叉點(diǎn)特征,只有數(shù)字4存在四交叉點(diǎn),由于是手寫,所有會(huì)有規(guī)則和不規(guī)則四交叉點(diǎn)兩種情況,經(jīng)過對(duì)大量規(guī)則和不規(guī)則四交叉點(diǎn)樣本的像素組合進(jìn)行研究,發(fā)現(xiàn)四交叉點(diǎn)都是由放置位置各不相同的“T”字型和“L”字型組合而成。建立“十”字型模板和“T、L”字型的四方向(上下左右)模板,通過模板匹配的方法,只要匹配一個(gè)“十”字型模板或者“T、L”字型的四方向(上下左右)模板任意兩個(gè)組合,就可以確定四交叉點(diǎn)的存在;第二種是左上方部分閉合,第三種是右上方部分閉合,均會(huì)形成一個(gè)孔洞,如按識(shí)別上述0、6、8、9四個(gè)數(shù)字的方法來識(shí)別數(shù)字4,便會(huì)導(dǎo)致與數(shù)字9混淆,需要再進(jìn)一步區(qū)分。本發(fā)明區(qū)分的方法是對(duì)除去孔洞的部分進(jìn)行離心率計(jì)算,手寫的數(shù)字9除去孔洞后只剩一條直線,而數(shù)字4除去孔洞后無論如何都不能是一條直線,即利用識(shí)別數(shù)字1的方法來區(qū)分?jǐn)?shù)字4和9。
數(shù)字“2、3、5”:提取端點(diǎn)特征,通過端點(diǎn)位置來區(qū)分這四個(gè)數(shù)。在進(jìn)行除毛刺的過程已經(jīng)求得端點(diǎn)(Counti=1),只需記錄下端點(diǎn)位置坐標(biāo)。存在一個(gè)端點(diǎn)位置在右上時(shí),則為數(shù)字5;存在一個(gè)端點(diǎn)位置在右下時(shí),則為數(shù)字2;端點(diǎn)均在左側(cè)時(shí),則為數(shù)字3。
以上數(shù)字識(shí)別有先后順序:先用孔洞識(shí)別出數(shù)字0、6、8、9,之后再識(shí)別數(shù)字1、7,然后識(shí)別數(shù)字4,最后識(shí)別數(shù)字2、3、5。
所述的存儲(chǔ)結(jié)果并分析成績(jī)過程,即將識(shí)別出來的學(xué)號(hào)和分?jǐn)?shù)存儲(chǔ)在EXCEL表格中,軟件自動(dòng)按學(xué)號(hào)大小排序,將名字與之對(duì)應(yīng),對(duì)分?jǐn)?shù)進(jìn)行系統(tǒng)的分析。
本實(shí)用新型與現(xiàn)有技術(shù)相比,具有如下優(yōu)點(diǎn):結(jié)構(gòu)簡(jiǎn)單,使用方便,可以快速有效地采集試卷信息并傳送至PC機(jī)上進(jìn)行數(shù)據(jù)解析,大大降低了試卷審批以及分?jǐn)?shù)統(tǒng)計(jì)的勞動(dòng)強(qiáng)度和出錯(cuò)頻率,提高工作效率。
附圖說明
圖1為具體實(shí)施方式中基于機(jī)器視覺的試卷信息采集系統(tǒng)的結(jié)構(gòu)示意圖;
圖2為圖1所示信息采集系統(tǒng)的俯視示意圖;
圖3為圖1所示信息采集系統(tǒng)的側(cè)視示意圖。
具體實(shí)施方式
為了使本實(shí)用新型的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本實(shí)用新型進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本實(shí)用新型,并不用于限定本實(shí)用新型。
如圖1-3所示,基于機(jī)器視覺的試卷信息采集系統(tǒng),所述系統(tǒng)包括信息采集裝置和信息分析裝置,所述信息采集裝置包括底座1,底座1上設(shè)有紅外線接收器10,立柱12垂直固設(shè)在底座1一側(cè),基板14通過卡夾13與立柱12滑動(dòng)配合且卡夾13的兩夾片端部通過調(diào)距螺栓131連接;基板14上固設(shè)有水平調(diào)節(jié)器,水平調(diào)節(jié)器包括固設(shè)在基板14上的兩塊擋板15,兩塊擋板15之間設(shè)有上、下兩根滑桿151,固定板17上、下端分別與兩根滑桿151配合,絲桿153位于兩根滑桿151之間且順次貫穿兩擋板15和固定板17,絲桿153與固定板17螺紋配合且絲桿153一端固定有扭輪152;固定板17上固設(shè)有工業(yè)相機(jī)18,固定板17底部設(shè)有紅外線發(fā)射器101,且固定板17底部通過吊板161與補(bǔ)光圈16連接,補(bǔ)光圈16與工業(yè)相機(jī)18的鏡頭同軸設(shè)置且底部周向設(shè)有數(shù)個(gè)LED燈;信息分析裝置包括通過數(shù)據(jù)采集卡19分別與紅外線接收器10和工業(yè)相機(jī)18的輸入端和輸出端信號(hào)連接的PC機(jī)191。
本實(shí)用新型在使用時(shí),將需要審批的試卷放置在底座上,由于試卷遮擋紅外線發(fā)射器發(fā)射的紅外線,使得紅外線接收器無法接收,紅外線接收器將該信號(hào)通過數(shù)據(jù)采集卡的A/D轉(zhuǎn)換后傳遞至PC機(jī),PC機(jī)在接收到紅外阻斷信號(hào)后自動(dòng)控制工業(yè)相機(jī)對(duì)試卷進(jìn)行拍攝圖像,圖像數(shù)據(jù)通過數(shù)據(jù)采集卡傳遞至PC機(jī),存儲(chǔ)圖像。然后PC機(jī)從拍攝存儲(chǔ)的圖像中提取出含有學(xué)號(hào)和總分的區(qū)域,再對(duì)提取出的圖像進(jìn)行圖像灰度化、二值化處理、圖像閉運(yùn)算、數(shù)字分割、傾斜調(diào)整、提取骨架以及歸一化等預(yù)處理,最后通過設(shè)定的算法對(duì)數(shù)字進(jìn)行識(shí)別并進(jìn)行存儲(chǔ)。最終由成績(jī)分析單元對(duì)識(shí)別出的學(xué)號(hào)、成績(jī)進(jìn)行系統(tǒng)分析并得出結(jié)果。
圖像信息分析步驟具體如下:從拍攝的圖像中提取出含有學(xué)號(hào)和總分的區(qū)域,由于放置試卷時(shí)位置不固定,因此首先利用模版匹配工具來對(duì)試卷進(jìn)行自動(dòng)拍攝包含目標(biāo)的大塊區(qū)域,又由于試卷上學(xué)號(hào)和分?jǐn)?shù)的位置相對(duì)于攝取出的大塊區(qū)域一般固定,而且還有下劃線定位,所以通過相對(duì)坐標(biāo)位置判斷和直線位置定位識(shí)別就能將含有分?jǐn)?shù)和學(xué)號(hào)的小塊區(qū)域截取出來。然后對(duì)圖像進(jìn)行下述預(yù)處理:圖像灰度化、二值化處理、圖像閉運(yùn)算、數(shù)字分割、傾斜調(diào)整、提取骨架以及歸一化。
其中,圖像灰度化即將工業(yè)相機(jī)拍攝的彩色圖像變成灰度圖像,以減少圖像原始數(shù)據(jù)量便于后續(xù)計(jì)算。由于對(duì)拍攝環(huán)境已經(jīng)調(diào)試到最好狀態(tài),并經(jīng)實(shí)驗(yàn)驗(yàn)證無需對(duì)圖像進(jìn)行增強(qiáng)、濾波,可直接將灰度圖像進(jìn)行二值化處理,即呈現(xiàn)出非黑即白效果。二值化處理的方法是先利用最大類間方差法來獲得最佳閾值,之后再使用閾值變換法把灰度圖像轉(zhuǎn)換成二值圖像。
最大類間方差閾值算法:
設(shè)T為分割閾值,μ為圖像均值,則圖像可分為兩個(gè)區(qū),目標(biāo)區(qū)(O區(qū))與背景區(qū)(B區(qū))。P(i)為第i級(jí)灰度的概率。
對(duì)應(yīng)以T為閾值的類間方差為:
有對(duì)應(yīng)以T為閾值的類間方差使σ2最大的T值即為最佳閾值。
圖像進(jìn)行閉運(yùn)算(先膨脹后腐蝕的過程,膨脹的公式:含義:集合B先作關(guān)于原點(diǎn)的映射,然后平移x,形成新的集合,該集合與集合X相交不為空集時(shí)的結(jié)構(gòu)元素參考點(diǎn)的集合;腐蝕的公式:含義:B平移x后仍在集合X內(nèi)部的參考點(diǎn)集合)時(shí),其中使用圓盤形結(jié)構(gòu)元素進(jìn)行運(yùn)算,目的使圖像中數(shù)字部分細(xì)小的空洞被填充;連接鄰近物體,例如數(shù)字:0、4、6、8、9,則會(huì)把其孔洞邊界斷開部分連接成一個(gè)完整孔洞,用于特征識(shí)別;平滑其邊界用來數(shù)字分割和特征識(shí)別。
數(shù)字切割即沿著數(shù)字的上下左右邊緣將數(shù)字剪切出來,為了使數(shù)字識(shí)別更簡(jiǎn)便。本發(fā)明采用掃描的方法,找出每個(gè)數(shù)字的上下左右切點(diǎn),然后根據(jù)上下切點(diǎn)的行數(shù)和左右切點(diǎn)的列數(shù)來決定所要剪切的數(shù)字的起始和終止的行數(shù)與列數(shù),就可以將數(shù)字切割出來。
下面為一圖片的矩陣實(shí)例:
由于圖像已二值化處理,數(shù)字部分灰度值不為0,本切割方法即尋找矩陣中灰度值不為0的整個(gè)區(qū)域邊界的坐標(biāo),找出上下左右的切點(diǎn),之后進(jìn)行數(shù)字切割。
對(duì)數(shù)字進(jìn)行傾斜調(diào)整:先計(jì)算二值圖像的高寬比來估計(jì)圖像的傾斜角度,高寬比越小,則傾斜角度越大,反之,傾斜角度越小。通過觀察,當(dāng)高寬比達(dá)到最大時(shí),數(shù)字最接近豎直。之后通過仿射變換進(jìn)行旋轉(zhuǎn)。
仿射旋轉(zhuǎn)變換:目標(biāo)圖形以(x,y)為軸心(取圖片中心)順時(shí)針旋轉(zhuǎn)θ弧度,變換矩陣為:
接下來進(jìn)行提取骨架,直接細(xì)化處理,但會(huì)出現(xiàn)毛刺。為除去毛刺,本發(fā)明采用毛刺閾值刪除法。需要先找出骨架中的分叉點(diǎn),求分叉點(diǎn)的方法:
細(xì)化后得到二值圖像f(x,y)中,如果其中的像素i,滿足f(xi,yi)=255,則在像素i的8鄰域模板內(nèi)統(tǒng)計(jì)其f(xi+Δx,yi+Δy)=255的個(gè)數(shù)并記入Counti中,其中xi,yi={-1 0 1}。重復(fù)此操作,直至所有像素操作完畢。Counti>3即為分支點(diǎn);如果Counti=1,即為端點(diǎn)。
通過人工設(shè)置一個(gè)T閾值長(zhǎng)度,將小于T長(zhǎng)度的毛刺自動(dòng)刪除,即可除去毛刺。最后歸一化,將每個(gè)數(shù)字放在規(guī)定大小的圖片空間中,用來統(tǒng)一字符的大小及格式。
所述數(shù)字識(shí)別過程中,采用的方法為數(shù)字的特征提取,通過每個(gè)數(shù)字的特征不同,分別進(jìn)行識(shí)別。
數(shù)字“1”:提取數(shù)字1離心率最大的特征,經(jīng)理論驗(yàn)證和大量實(shí)驗(yàn)驗(yàn)證,數(shù)字1的離心率e最大并且離心率e均在0.99~1.00之間,其他數(shù)字離心率e均在0.99以下。
數(shù)字“7”:采用與數(shù)字1相同的方法。不同的地方在于截取數(shù)字7的下半部分求離心率。
數(shù)字“0、6、8、9”:提取孔洞特征,它們的共同點(diǎn)就是全都有孔洞,根據(jù)有無孔洞將其篩選出來,再根據(jù)孔洞數(shù)量將數(shù)字8(兩個(gè)孔洞)篩選出來。其余三個(gè)數(shù)字(一個(gè)孔洞)根據(jù)孔洞位置進(jìn)行區(qū)分。因?yàn)槊總€(gè)數(shù)字均沿著數(shù)字的上下左右邊緣將數(shù)字剪切出來的,所以數(shù)字0的孔洞上下邊界均緊貼圖片邊界,在圖片上下邊界均有灰度值為255的像素點(diǎn);數(shù)字6的孔洞只有下邊界緊貼圖片邊界,圖片下邊界有灰度值為255的像素點(diǎn);數(shù)字9的孔洞只有上邊界緊貼圖片邊界,圖片上邊界有灰度值為255的像素點(diǎn)。
計(jì)算孔洞數(shù)量和位置通過下述圖片的矩陣實(shí)例說明:
通過上述方法,求得A中有兩個(gè)孔洞(數(shù)字1包圍的一個(gè)、數(shù)字2包圍的一個(gè))。同時(shí)可以求得孔洞的位置坐標(biāo)。
數(shù)字“4”:由于是手寫數(shù)字,每個(gè)人筆跡有所差異,所以數(shù)字4會(huì)有三種明顯不同的情況:第一種是數(shù)字4沒有閉合部分(無孔洞),提取四交叉點(diǎn)特征,只有數(shù)字4存在四交叉點(diǎn),由于是手寫,所有會(huì)有規(guī)則和不規(guī)則四交叉點(diǎn)兩種情況,經(jīng)過對(duì)大量規(guī)則和不規(guī)則四交叉點(diǎn)樣本的像素組合進(jìn)行研究,發(fā)現(xiàn)四交叉點(diǎn)都是由放置位置各不相同的“T”字型和“L”字型組合而成。建立“十”字型模板和“T、L”字型的四方向(上下左右)模板,通過模板匹配的方法,只要匹配一個(gè)“十”字型模板或者“T、L”字型的四方向(上下左右)模板任意兩個(gè)組合,就可以確定四交叉點(diǎn)的存在;第二種是左上方部分閉合,第三種是右上方部分閉合,均會(huì)形成一個(gè)孔洞,如按識(shí)別上述0、6、8、9四個(gè)數(shù)字的方法來識(shí)別數(shù)字4,便會(huì)導(dǎo)致與數(shù)字9混淆,需要再進(jìn)一步區(qū)分。本發(fā)明區(qū)分的方法是對(duì)除去孔洞的部分進(jìn)行離心率計(jì)算,手寫的數(shù)字9除去孔洞后只剩一條直線,而數(shù)字4除去孔洞后無論如何都不能是一條直線,即利用識(shí)別數(shù)字1的方法來區(qū)分?jǐn)?shù)字4和9。
數(shù)字“2、3、5”:提取端點(diǎn)特征,通過端點(diǎn)位置來區(qū)分這四個(gè)數(shù)。在進(jìn)行除毛刺的過程已經(jīng)求得端點(diǎn)(Counti=1),只需記錄下端點(diǎn)位置坐標(biāo)。存在一個(gè)端點(diǎn)位置在右上時(shí),則為數(shù)字5;存在一個(gè)端點(diǎn)位置在右下時(shí),則為數(shù)字2;端點(diǎn)均在左側(cè)時(shí),則為數(shù)字3。
以上數(shù)字識(shí)別有先后順序:先用孔洞識(shí)別出數(shù)字0、6、8、9,之后再識(shí)別數(shù)字1、7,然后識(shí)別數(shù)字4,最后識(shí)別數(shù)字2、3、5。
所述的存儲(chǔ)結(jié)果并分析成績(jī)過程,即將識(shí)別出來的學(xué)號(hào)和分?jǐn)?shù)存儲(chǔ)在EXCEL表格中,軟件自動(dòng)按學(xué)號(hào)大小排序,將名字與之對(duì)應(yīng),對(duì)分?jǐn)?shù)進(jìn)行系統(tǒng)的分析。