基于二值圖像連通域統(tǒng)計的答題卡自動評分方法

文檔序號：6515132閱讀：893來源：國知局

基于二值圖像連通域統(tǒng)計的答題卡自動評分方法
【專利摘要】本發(fā)明提供基于二值圖像連通域統(tǒng)計的答題卡自動評分方法，用戶掃描一個答題卡，檢測出定位點后，對作答區(qū)域進行二值化，然后采用基于二值圖像連通域統(tǒng)計的答題卡自動評分方法對圖像中各選擇題的答案進行識別并評分，然后輸出各題目的答案以及成績。本發(fā)明以填涂點相對于標記點的位置來定位填涂點，對于答題卡掃描時的傾斜、移位、輕微褶皺不敏感；采用自適應閾值的方法判斷填涂與否，對于不同填涂的深淺均可有效檢測，兼容單選、多選題，能有效區(qū)分擦除不凈及多選的情況。用戶不必再因為掃描時的輕微異常而重新掃描答題卡，大大減少了重復勞動。
【專利說明】基于二值圖像連通域統(tǒng)計的答題卡自動評分方法【技術領域】[0001]本發(fā)明一般涉及計算機模式識別與圖像處理領域，具體涉及基于二值圖像連通域統(tǒng)計的答題卡自動評分方法。【背景技術】[0002]隨著信息技術的發(fā)展，計算機處理的數據量越來越大，在很多領域里，亟需解決海量數據的采集、識別和錄入的問題。目前，在高考、成人高考、全國大學英語等級考試等大型考試已經使用OMR (光學標記閱讀機)解決該問題。雖然OMR技術解決了一些答題卡數據錄入的問題，但是由于其自身技術是基于光電識別技術的，存在許多目前難以解決的問題:(1)設備專用:光電識別機只能在審閱客觀題中使用，主觀題仍需使用掃描儀掃描，價格昂貴；(2)答題卡格式固定:受限于光電頭安裝位置和排列密度相對固定，對于不同格式的答題卡調整難度很大，甚至無法滿足要求；(3)答題卡制造成本高:0MR答題卡必須為含鉛銅版紙進行彩色印刷且對答題卡裁切精度有嚴格要求，經濟成本、環(huán)境成本高，對于大多數中小學無力承擔該費用；(4)糾錯流程復雜:0MR技術中，若在識別的過程中發(fā)生異常，必須停機，人工分揀出出錯答題卡，逐張人工重新填涂，才能重新開機識別，大大影響閱卷效率。(5)圖像不能保存待查:不能保存識別過的答題卡圖像，判題透明性差，若要查對必須人工從紙質答題卡中重新分揀出來。[0003]利用圖像處理技術對經過掃描的答題卡的數據進行識別和錄入是一項新技術。它除了可以克服上述OMR技術存在的缺陷外，還具有設備、紙張成本低，識別率及速度可隨計算機軟、硬件發(fā)展不斷優(yōu)化、提升，改卷結果可直接顯示在掃描圖像上，判卷透明性高，校對方便等特點。該技術將在計算機閱卷、電子政務、社會調查數據采集、生產和流通領域的過程管理及其它領域中顯示出其良好的應用前景。
【發(fā)明內容】
[0004]本發(fā)明針對答題卡識別技術的不足，提供了基于二值圖像連通域統(tǒng)計的答題卡自動評分方法。本發(fā)明的目的在于使用計算機圖像處理技術解決高準確率的答題卡自動識別問題，克服現有的OMR技術的缺陷，提供一個成本低、使用簡單的、可靠的答題卡識別方案，具體技術方案如下。[0005]基于二值圖像連通域統(tǒng)計的答題卡自動評分方法，包括以下步驟:[0006](a)從本地磁盤讀入一個掃描得到的答題卡圖像文件；[0007](b)對答題卡圖像進行傾斜檢測及校正；[0008](C)對步驟(b)中校正后的圖像進行校準點檢測及定位；[0009](d)根據步驟(C)中得到的校準點位置以及答題卡描述文件，計算每一個填涂點在本張圖像中的絕對位置；[0010](e)根據步驟(d)得到的每個填涂點進行識別，判斷其是否填涂。[0011]上述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法中，步驟(b)包括以下步驟:[0012](b-1)將掃描得到的圖像轉化為灰度圖像；[0013](b-2)讀取答題卡描述文件中校準點的類型以及掃描圖像的分辨率，生成矩形的結構元素并使用它對掃描圖像進行灰度級形態(tài)學閉操作；[0014](b-3)對步驟(b-2)得到的圖像進行二值化，二值化閾值為100，即灰度值大于100 的像素點設為I，否則設為O;[0015](b-4)計算二值圖像中各個連通域的位置并判斷數量是否與答題卡描述文件中的校準點數量一致，如不一致則利用該類型校準點的寬高比以及面積去除干擾塊；[0016](b-5)分別計算圖像上方、下方校準點構成直線的斜率，若上下斜率差值過大，則認為發(fā)生褶皺并提示，否則取兩者均值作為傾斜度數，對圖像進行傾斜校正。[0017]上述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法中，步驟(C)包括以下步驟:[0018](c-1)讀取答題卡描述文件中關于水平方向校準點與豎直方向校準點的區(qū)域描述，并根據相對于校準點的位置裁剪出整個水平方向以及豎直方向區(qū)域；[0019](c-2)分別讀取答題卡描述文件中水平方向、豎直方向校準點的類型以及掃描圖像的分辨率，生成相對應的矩形結構元素并分別對水平校準點區(qū)域、豎直校準點區(qū)域進行灰度級形態(tài)學閉操作；[0020](c-3)對圖像進行二值化操作，判斷二值圖像中連通域數量是否與答題卡描述文件中的校準點數量一致，如不一致則利用該類型校準點的寬高比以及面積去除干擾連通域。[0021]上述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法中，步驟(d)使用步驟(C) 得到的各個連通域的最小外接矩形，計算校準點邊界，并根據答題卡描述文件，計算出各題中各個選項的在本圖像中的絕對位置。[0022]上述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法中，計算邊界時加入了邊界緩沖區(qū)，其上、下、左、右邊界計算方法為:top=y_hXedge_rate, buttom=y+hX (l+edge_ rate), left=x~wX edge_rate, right=x+wX (l+edge_rate)，其中 x、y、w、h、edge_rate 分別表示連通域最小外接矩形的左上角橫、縱坐標，矩形的寬、高以及邊緣緩沖率，邊緣緩沖率設為0.3。[0023]上述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法中，步驟(d)包括以下步驟:[0024](e-1)根據步驟(d)得到的填涂點位置，將同一題的所有填涂點區(qū)域提取出來。[0025](e-2)對每一題區(qū)域計算自適應閾值并進行二值化[0026](e-3)根據步驟(C)中得到的校準點的大小計算填涂面積閾值:[0027]threshold=s X 0.15。[0028](e-4)對每個填涂點區(qū)域，若二值圖像值為I的區(qū)域大于填涂面積閾值，則認為填涂，否則認為沒有填涂。[0029]上述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法中，步驟(e-2)中使用最大類間方差法計算自適應二值化閾值，類間方差法計算方法如下U1)2,其中g 為類間方差，ω。CO1分別為灰度值小于、大于閾值T的像素點占整幅圖像的比例，μ O, U1分別為灰度值小于、大于閾值T的像素點的平均灰度；最大類間方差法閾值計算方法為分別計算T從O到255對應的類間方差法g的大小，取g最大的時候對應的T即為所求。[0030]上述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法中，步驟(e-2)中，把自適應閾值計算結果用于區(qū)分未作答與掃描儀噪聲，對于自適應二值化閾值大于230的情況，認為該題未作答。[0031]本發(fā)明采用常用的掃描儀作為輸入設備；識別答題卡中的校準點是識別答題卡的關鍵操作，本發(fā)明通過灰度級形態(tài)學閉操作的方式去除非校準點外的其他因素的影響；通過答題卡中的校準點的位置，對掃描圖像進行精確的傾斜校正，并計算出各題選項在這張答題卡中的絕對位置；通過一定的數據格式將答題卡各題的選項的上、下、左、右邊界記錄下來，達到快速提取各題選項區(qū)域的目的；將同一道題的區(qū)域提取出來，計算出自適應二值化閾值并對該區(qū)域二值化，然后根據連通域面積對該題每個選項逐一識別是否填涂，最后輸出結果。[0032]與現有技術相比，本發(fā)明具有如下優(yōu)點和技術效果:[0033]相對于OMR (光學標記閱讀機)技術本發(fā)明克服了設備專用、答題卡格式固定、答題卡制造成本高、糾錯流程復雜、圖像不能保存待查等缺點，并具有識別率及速度可隨計算機軟、硬件發(fā)展不斷優(yōu)化、提升，改卷結果可直接顯示在掃描圖像上，判卷透明性高，校對方便等特點。相對于其他基于圖像處理的技術，本發(fā)明具有對答題卡掃描時的傾斜、移位、輕微褶皺不敏感的優(yōu)點，用戶不必再因為掃描時的輕微異常而重新掃描答題卡，大大減少了重復勞動。本發(fā)明采用自適應閾值的方法判斷填涂與否，對于不同的填涂深淺均可有效檢測，兼容單選、多選題，并能有效區(qū)分擦除不凈、未作答及多選的情況；對掃描設備的寬容度高，能適應不同分辨率的掃描以及不同掃描儀帶來的噪聲。用戶不用再擔心因為掃描儀更換、掃描分辨率改變而更換新的識別技術。【專利附圖】

【附圖說明】[0034]圖1為實施方式中基于二值圖像連通域統(tǒng)計的答題卡自動評分方法的流程圖。【具體實施方式】[0035]以下結合附圖對本發(fā)明的實施方式作進一步說明，但本發(fā)明的實施不限于此。[0036]如圖1，基于二值圖像連通域統(tǒng)計的答題卡自動評分方法的主要流程包括以下步驟:[0037](a)從本地磁盤讀入一個掃描得到的答題卡圖像文件；[0038](b)對答題卡圖像進行傾斜檢測及精確校正。[0039](C)對步驟(b)中校正后的圖像進行校準點檢測及定位；[0040](d)根據步驟(C)中得到的校準點位置以及答題卡描述文件，計算每一個填涂點在本張圖像中的絕對位置；[0041](e)根據步驟(d)得到的每個填涂點進行識別，判斷其是否填涂。[0042]步驟(a)允許用戶通過文件選擇窗口從本地硬盤選擇多個圖像文件或一個文件夾作為答題卡圖像數據源，圖像文件要求是jpg格式文件。[0043]步驟(b)灰度級形態(tài)學閉操作去除與校準點無關的因素的影響，灰度級形態(tài)學閉操作是圖像處理的常用操作，其主要原理是:將圖像先進行灰度級腐蝕操作再進行灰度級膨脹操作?；叶燃壐g操作將結構元素中心對應的圖像像素點的灰度值設為結構元素覆蓋的圖像區(qū)域中所有像素中最小的灰度值，而灰度級膨脹操作將結構元素中心對應的圖像像素點的灰度值設為結構元素覆蓋的圖像區(qū)域中所有像素中最大的灰度值。[0044]步驟(b)包括以下步驟:[0045](b-Ι)將掃描得到的圖像轉化為灰度圖像；[0046](b-2)讀取答題卡描述文件中校準點的類型以及掃描圖像的分辨率，生成矩形的結構素并使用它對掃描圖像進行灰度級形態(tài)學閉操作；[0047](b-3)對步驟(b-2)得到的圖像進行二值化；[0048](b-4)計算二值圖像中各個連通域的位置并判斷數量是否與答題卡描述文件中的校準點數量一致，如不一致則利用該類型校準點的寬高比以及面積去除干擾塊；[0049](b-5)分別計算圖像上方、下方校準點構成直線的斜率，若上下斜率差值過大，則認為發(fā)生褶皺并提示，否則取兩者均值作為傾斜度數，對圖像進行傾斜校正；[0050]步驟(c)灰度級形態(tài)學閉操作去除與校準點無關的因素的影響，其原理與步驟(b)中的一致。[0051]步驟(C)包括以下步驟:[0052](c-Ι)讀取答題卡描述文件中關于水平方向校準點與豎直方向校準點的區(qū)域描述，并根據相對于校準點的位置裁剪出整個水平方向以及豎直方向區(qū)域；[0053](c-2)分別讀取答題卡描述文件中水平方向、豎直方向校準點的類型以及掃描圖像的分辨率，生成相對應的矩形結構元素并分別對水平校準點區(qū)域、豎直校準點區(qū)域進行灰度級形態(tài)學閉操作；[0054](c-3)對圖像進行二值化操作，判斷二值圖像中連通域數量是否與答題卡描述文件中的校準點數量一致，如不一致則利用該類型校準點的寬高比以及面積去除干擾連通域；[0055]步驟(d)將步驟(C)所識別到的校準點用特定數據格式將校準點的邊界存儲下來。特定數據格式具體如表1所示。這里是通過記錄校準點在答題卡圖像數據中的位置，用以快速定位答題卡中各道題目的選項對應的位置。[0056]表1保存校準點邊界的數據格式[0057]
【權利要求】
1.基于二值圖像連通域統(tǒng)計的答題卡自動評分方法，其特征在于，包括以下步驟:(a)從本地磁盤讀入一個掃描得到的答題卡圖像文件；(b)對答題卡圖像進行傾斜檢測及校正；(C)對步驟(b)中校正后的圖像中的校準點進行檢測及定位；(d)根據步驟(C)中得到的校準點位置以及答題卡描述文件，計算每一個填涂點在本張圖像中的絕對位置；(e)根據步驟(d)得到的每個填涂點進行識別，判斷其是否填涂。
2.根據權利要求1所述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法，其特征在于，步驟(b)包括以下步驟:(b-Ι)將掃描得到的圖像轉化為灰度圖像；(b-2)讀取答題卡描述文件中校準點的類型以及掃描圖像的分辨率，生成矩形的結構元素并使用該結構元素對掃描圖像進行灰度級形態(tài)學閉操作；(b-3)對步驟(b-2)最后得到的圖像進行二值化，二值化閾值為100，即灰度值大于100 的像素點設為I，否則設為O;(b-4)計算二值圖像中各個連通域的位置并判斷數量是否與答題卡描述文件中的校準點數量一致，如不一致則利用該類型校準點的寬高比以及面積去除干擾塊；(b-5)分別計算圖像上方、下方校準點構成直線的斜率，若該兩個斜率的差值大于0.2，則認為發(fā)生褶皺并提示，否則取兩者均值作為傾斜度數，對圖像進行傾斜校正。
3.根據權利要求1所述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法，其特征在于步驟(C)中，包括以下步驟:(c-1)讀取答題卡描述文件中關于水平方向校準點與豎直方向校準點的區(qū)域描述，并根據相對于校準點的位置裁剪出整個水平方向以及豎直方向的校準點組區(qū)域；(c-2)分別讀取答題卡描述文件中水平方向、豎直方向校準點的類型以及掃描圖像的分辨率，生成相對應的矩形結構元素并分別對水平校準點區(qū)域、豎直校準點區(qū)域進行灰度級形態(tài)學閉操作；(c-3)對圖像進行二值化操作，其中，二值化閾值為100，并判斷二值圖像中連通域數量是否與答題卡描述文件中的校準點數量一致，如不一致則利用該類型校準點的寬高比以及面積去除干擾連通域。
4.根據權利要求3所述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法，其特征在于:步驟⑷中，使用步驟(C)最后得到的各個連通域的最小外接矩形，計算校準點邊界，并根據答題卡描述文件，計算出各題中各個選項的在本圖像中的絕對位置。
5.根據權利要求4所述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法，其特征在于:計算校準點邊界時考慮到填涂偏差，加入了邊界緩沖區(qū)，其上top、下buttom、左 left、右 right 邊界計算方法為:top=y_hX edge—rate，buttom=y+hX (1+edge—rate)， left=x_wXedge—rate，right=x+wX (1+edge—rate)，其中 x、y、w、h、edge—rate 分別表不連通域最小外接矩形的左上角橫、縱坐標，矩形的寬、高以及邊緣緩沖率，邊緣緩沖率設為0.3。
6.根據權利要求1所述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法，其特征在于步驟⑷中包括以下步驟:(e-1)根據步驟(d)得到的填涂點位置，將同一題的所有填涂點區(qū)域提取出來；(e-2)對每一題區(qū)域計算自適應閾值并進行二值化；(e-3)根據步驟(C)中得到的校準點的大小s計算填涂面積閾值threshold: threshold=sX0.15 ；(e-4)對每個填涂點區(qū)域，若二值圖像值為I的區(qū)域大于填涂面積閾值，則認為填涂，否則認為沒有填涂。
7.根據權利要求6所述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法，其特征在于:使用最大類間方差法計算自適應二值化閾值，類間方差法計算方法如下: g= ω0ω j ( μ 0- μ J2,其中g為類間方差，ω0> Q1分別為灰度值小于、大于閾值T的像素點占整幅圖像的比例，μ ο、μ i分別為灰度值小于、大于閾值T的像素點的平均灰度；最大類間方差法閾值計算方法為分別計算T從O到255對應的類間方差法g的大小，取g最大的時候對應的T即為所求。
8.根據權利要求7所述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法，其特征在于:考慮到掃描儀產生的噪聲，對于自適應二值化閾值大于230的情況，認為該題未作答，有效區(qū)分未作答與掃描儀噪聲。
【文檔編號】G06K9/32GK103559490SQ201310473334
【公開日】2014年2月5日申請日期:2013年10月11日優(yōu)先權日:2013年10月11日
【發(fā)明者】黃翰, 梁椅輝申請人:華南理工大學

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯系技術所有人。
技術研發(fā)人員：黃翰;梁椅輝
技術所有人：華南理工大學
我是此專利的發(fā)明人

上一篇：一種基于磁定位技術的空中鼠標及方法
上一篇：即時通信客戶端盜號木馬程序的識別方法及裝置制造方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網絡及物聯網
4、王老師：1.計算機網絡安全 2.計算機仿真技術
5、王老師：1.網絡安全；物聯網安全、大數據安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯系我們加入專家?guī)臁?/a>

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于二值圖像連通域統(tǒng)計的答題卡自動評分方法