基于ocr的人工評(píng)判試卷處理裝置及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于模式識(shí)別與人工智能技術(shù)領(lǐng)域,特別是涉及一種基于OCR的人工評(píng)判試卷自動(dòng)采集裝置與數(shù)據(jù)統(tǒng)計(jì)處理方法。
【背景技術(shù)】
[0002]基于OCR的人工評(píng)判試卷自動(dòng)采集與數(shù)據(jù)統(tǒng)計(jì)處理技術(shù)是指通過(guò)計(jì)算機(jī)等設(shè)備,利用OCR技術(shù)(光學(xué)字符識(shí)別)將人工評(píng)判試卷中的試卷信息、答題者個(gè)人信息、試卷評(píng)判結(jié)果等字符符號(hào)自動(dòng)提取和識(shí)別出來(lái),并進(jìn)行評(píng)判結(jié)果的統(tǒng)計(jì)分析,構(gòu)建評(píng)判試卷的數(shù)據(jù)庫(kù)系統(tǒng)。它是實(shí)現(xiàn)人工評(píng)判試卷的自動(dòng)化處理與有效管理的關(guān)鍵技術(shù)之一。試卷考試和作業(yè)練習(xí)是學(xué)生學(xué)習(xí)過(guò)程中的重要環(huán)節(jié),通過(guò)教師的評(píng)判與批閱,可以發(fā)現(xiàn)學(xué)生對(duì)學(xué)習(xí)知識(shí)點(diǎn)的掌握情況,并及時(shí)采取相應(yīng)措施改進(jìn)學(xué)習(xí)效果。目前的人工評(píng)判試卷與作業(yè)練習(xí)的處理方式還主要采取人工統(tǒng)計(jì)計(jì)分的方式,評(píng)判后的紙質(zhì)試卷與作業(yè)練習(xí)需要占據(jù)較大的存放空間,長(zhǎng)期積累的紙質(zhì)試卷與作業(yè)達(dá)到一定年限以后通過(guò)丟棄的方式處理。這種處理方式具有明顯的不足,不利于進(jìn)行有效的教學(xué)管理,歸納起來(lái),主要表現(xiàn)為以下幾個(gè)方面:
[0003]1、統(tǒng)計(jì)計(jì)分過(guò)程費(fèi)時(shí)費(fèi)力,統(tǒng)計(jì)結(jié)果容易出錯(cuò)。采用人工統(tǒng)計(jì)方式,大量的試卷與作業(yè)練習(xí),特別是多個(gè)科目每日的作業(yè)練習(xí),計(jì)分過(guò)程需要耗費(fèi)大量的人力,不利于提高教學(xué)管理的效率。另外,人工統(tǒng)計(jì)很容易出現(xiàn)錯(cuò)誤。
[0004]2、難以進(jìn)行有效數(shù)據(jù)存儲(chǔ)與管理。評(píng)判后的紙質(zhì)試卷與作業(yè)練習(xí)以紙質(zhì)方式由學(xué)生或教師分散保存,長(zhǎng)期大量的試卷與作業(yè)不利于管理,通常會(huì)被丟棄。教學(xué)過(guò)程中,通常希望查閱以往的試卷或作業(yè),目前的處理方式很難滿足這方面的需求,查找的效率也很低。
[0005]3、無(wú)法實(shí)現(xiàn)有效的數(shù)據(jù)統(tǒng)計(jì)與分析。大量的試卷和作業(yè)數(shù)據(jù)可以為改善教與學(xué)的效果提供有效的數(shù)據(jù)支持。例如,可以通過(guò)對(duì)某個(gè)學(xué)生以往答題和作業(yè)情況的分析,針對(duì)不足提供個(gè)性化的教學(xué)。學(xué)生可以很容易找到自己的不足之處,教師也可以針對(duì)學(xué)生不足,單獨(dú)進(jìn)行輔導(dǎo)。教師也可以通過(guò)對(duì)全班或某個(gè)群體的以往數(shù)據(jù)縱向(不同時(shí)間段間)與橫向(不同個(gè)體間)的分析,開(kāi)展有針對(duì)性的教學(xué)。但是,目前的處理方法很難滿足這方面的需求。
[0006]現(xiàn)有技術(shù)中,還存在采用計(jì)算機(jī)自動(dòng)進(jìn)行閱卷的形式,主要包括以下幾種:
[0007]1、采用掃描試卷,教師在電腦前評(píng)閱打分。這種方式主要針對(duì)大型考試,它改變了教師的紙質(zhì)評(píng)閱習(xí)慣。教師必須在電腦上才可以評(píng)閱,操作不夠靈活、自然。而且,目前這類系統(tǒng)也沒(méi)有相應(yīng)的試題數(shù)據(jù)庫(kù)支撐,缺乏數(shù)據(jù)的統(tǒng)計(jì)與分析的功能。
[0008]2、采用專用答題卡的形式。這種方式要求答卷人通過(guò)填涂來(lái)完成答卷,僅適用于選擇、填空等少數(shù)題型。制作答題卡需要額外開(kāi)銷,且填涂答題方式使用也不夠自然。
[0009]針對(duì)以上不足之處,以及教學(xué)單位進(jìn)一步提高教與學(xué)的效率的需求,目前還不存在能夠較好地滿足人工評(píng)判試卷及作業(yè)的自動(dòng)計(jì)分,以及數(shù)據(jù)統(tǒng)計(jì)與分析方面需求的計(jì)算機(jī)自動(dòng)處理系統(tǒng)與裝置。
【發(fā)明內(nèi)容】
[0010]本發(fā)明的目的在于克服上述處理方式的不足,提供一種高效、成本低廉的人工評(píng)判試卷自動(dòng)采集與數(shù)據(jù)統(tǒng)計(jì)處理解決方案。其特點(diǎn)是采用高速掃描儀,能夠高速地定位和識(shí)別試卷及作業(yè)中相關(guān)信息及評(píng)分結(jié)果,并可以完成試卷及作業(yè)圖像的壓縮保存和檢索。它可以實(shí)現(xiàn)人工評(píng)判試卷及作業(yè)的自動(dòng)圖像采集、手寫評(píng)分的自動(dòng)識(shí)別與統(tǒng)計(jì)、歷史數(shù)據(jù)分析、快速試卷及得分?jǐn)?shù)據(jù)查詢等,可以滿足人工評(píng)判試卷及作業(yè)的計(jì)算機(jī)自動(dòng)化處理的需要。
[0011]本發(fā)明的技術(shù)方案為:
[0012]基于OCR的人工評(píng)判試卷處理裝置,其特征在于,包括:試題導(dǎo)入模塊、高速圖像采集裝置、圖形處理與識(shí)別模塊、圖像數(shù)據(jù)庫(kù)、試卷圖像及評(píng)分?jǐn)?shù)據(jù)庫(kù)的檢索模塊、歷史數(shù)據(jù)分析模塊;其中圖形處理與識(shí)別模塊,包括試卷?xiàng)l碼識(shí)別模塊、試卷版面分析與定位模塊、OCR識(shí)別模塊、校正模塊、試卷圖像的快速壓縮保存模塊;
[0013]試題導(dǎo)入模塊,用于將試卷及作業(yè)中的試題,以及試卷分類信息導(dǎo)入到圖像數(shù)據(jù)庫(kù)中進(jìn)行保存;
[0014]高速圖像采集裝置,用于采集已作答的試卷及作業(yè)圖像,并將采集到的圖像數(shù)據(jù)信息通過(guò)試卷圖像的快速壓縮保存模塊處理后送至圖像數(shù)據(jù)庫(kù)中;
[0015]試卷?xiàng)l碼識(shí)別模塊,用于識(shí)別試卷中的條碼信息,并將識(shí)別的條碼信息送至試卷圖像的快速壓縮保存模塊處理;試卷版面分析與定位模塊,用于對(duì)試卷及作業(yè)圖像中的信息進(jìn)行定位與分割,分割得到手寫字符圖像區(qū)域,并將手寫字符圖像區(qū)域送至OCR識(shí)別模塊做進(jìn)一步處理;0CR識(shí)別模塊,對(duì)手寫字符圖像區(qū)域進(jìn)行高精度識(shí)別,并將識(shí)別結(jié)果數(shù)據(jù)送至試卷圖像的快速壓縮保存模塊處理;校正模塊,將OCR識(shí)別模塊中得到的識(shí)別結(jié)果數(shù)據(jù)及可信度信息與需要識(shí)別處理的試卷及作業(yè)的所有學(xué)生信息進(jìn)行校對(duì)、校正,并將處理的數(shù)據(jù)送至試卷圖像的快速壓縮保存模塊處理;試卷圖像的快速壓縮保存模塊,用于將高速圖像采集裝置采集的圖像進(jìn)行快速壓縮保存到圖像數(shù)據(jù)庫(kù)中,并將試卷?xiàng)l碼識(shí)別模塊識(shí)別的條碼信息,OCR識(shí)別模塊、校正模塊處理的數(shù)據(jù)信息進(jìn)行關(guān)聯(lián),保存到圖像數(shù)據(jù)庫(kù)中;
[0016]試卷圖像及評(píng)分?jǐn)?shù)據(jù)庫(kù)的檢索模塊,用于實(shí)現(xiàn)圖像數(shù)據(jù)庫(kù)中的關(guān)聯(lián)數(shù)據(jù)檢索,檢索內(nèi)容包括姓名、班級(jí)、學(xué)號(hào)、科目及數(shù)據(jù)時(shí)間段,并對(duì)相應(yīng)數(shù)據(jù)依據(jù)得分結(jié)果給出統(tǒng)計(jì)結(jié)果;
[0017]歷史數(shù)據(jù)分析模塊,用于實(shí)現(xiàn)以往試卷及作業(yè)的得分情況的縱向(不同時(shí)間段間)與橫向(不同個(gè)體間)的統(tǒng)計(jì)數(shù)據(jù)分析。
[0018]基于OCR的人工評(píng)判試卷方法,其特征在于:包括如下步驟:
[0019]1)試卷及作業(yè)的導(dǎo)入,將試卷及作業(yè)中試題,以及試卷分類信息導(dǎo)入到圖像數(shù)據(jù)庫(kù)中;
[0020]2)掃描并采集試卷及作業(yè)的圖像數(shù)據(jù)信息,并將采集到的圖像數(shù)據(jù)信息通過(guò)試卷圖像的快速壓縮保存模塊處理后送至圖像數(shù)據(jù)庫(kù)中;
[0021]3)通過(guò)試卷?xiàng)l碼識(shí)別模塊獲取試卷?xiàng)l碼信息;
[0022]4)通過(guò)試卷版面分析與定位模塊對(duì)試卷及作業(yè)圖像中的信息進(jìn)行定位與分割,分割出待識(shí)別的字符圖像區(qū)域,并將手寫字符圖像區(qū)域送至OCR識(shí)別模塊,進(jìn)行手寫字符的高精度識(shí)別;
[0023]5)0CR識(shí)別模塊對(duì)手寫字符圖形區(qū)域塊進(jìn)行高精度識(shí)別,并將識(shí)別結(jié)果數(shù)據(jù)、識(shí)別可信度信息送至校正模塊進(jìn)行校正;
[0024]6)校正模塊讀入需要識(shí)別處理的試卷及作業(yè)的所有學(xué)生信息,并將讀入數(shù)據(jù)與OCR識(shí)別模塊識(shí)別的數(shù)據(jù)進(jìn)行比較,并將處理的數(shù)據(jù)送至試卷圖像的快速壓縮保存模塊處理;
[0025]7)建立試卷?xiàng)l碼信息,校正模塊校正后獲取的學(xué)生個(gè)人信息、以及評(píng)分結(jié)果分別與試卷及作業(yè)圖像建立有效的關(guān)聯(lián),并與圖像數(shù)據(jù)一起,壓縮保存到圖像數(shù)據(jù)庫(kù)中。
[0026]本發(fā)明與已有的技術(shù)相比,具有如下優(yōu)點(diǎn):
[0027]1、高速數(shù)據(jù)采集與存儲(chǔ),本裝置采用高速掃描儀進(jìn)行人工評(píng)判試卷及作業(yè)的圖像采集,能夠?qū)崿F(xiàn)快速地圖像數(shù)據(jù)采集與壓縮存儲(chǔ)。
[0028]2、評(píng)分結(jié)果的快速、準(zhǔn)確自動(dòng)識(shí)別與統(tǒng)計(jì),本系統(tǒng)采用OCR技術(shù)對(duì)試卷及作業(yè)中的相關(guān)信息,包括分類信息(包括科目、章節(jié)等)、答卷人信息、手寫評(píng)分結(jié)果等進(jìn)行自動(dòng)快速、高準(zhǔn)確度的識(shí)別,并進(jìn)行計(jì)分統(tǒng)計(jì)。
[0029]3、快速試卷得分?jǐn)?shù)據(jù)查詢與統(tǒng)計(jì),系統(tǒng)通過(guò)將試卷中的試題信息與評(píng)分信息進(jìn)行有效的數(shù)據(jù)關(guān)聯(lián),并構(gòu)建試卷及評(píng)分?jǐn)?shù)據(jù)庫(kù),可以實(shí)現(xiàn)以往試卷及作業(yè)得分情況的快速查詢,以及數(shù)據(jù)統(tǒng)計(jì)。系統(tǒng)可以為個(gè)性化的教學(xué)提供數(shù)據(jù)支持。
[0030]4、歷史數(shù)據(jù)分析,系統(tǒng)的試卷分析模塊提供以往試卷及作業(yè)的得分情況的縱向(不同時(shí)間段間)與橫向(不同個(gè)體間)的統(tǒng)計(jì)數(shù)據(jù)分析。通過(guò)數(shù)據(jù)統(tǒng)計(jì)分析,為教師開(kāi)展有效的教學(xué)管理提供決策依據(jù)。
[0031]另外,評(píng)判后的試卷及作業(yè)在放入高速掃描儀時(shí),無(wú)需按順序放置,甚至可以倒置而不會(huì)影響識(shí)別與統(tǒng)計(jì)結(jié)果,避免了繁瑣的試卷整理工作。
【附圖說(shuō)明】
[0032]圖1是基于OCR的人工評(píng)判試卷處理裝置的結(jié)構(gòu)框圖。
[0033]圖2為基于OCR的評(píng)判試卷方法的流程框圖。
【具體實(shí)施方式】
[0034]為了使本發(fā)明實(shí)現(xiàn)的技術(shù)手段、創(chuàng)作特征、達(dá)成目的與功效易于明白了解,下面結(jié)合圖示與具體實(shí)施例,進(jìn)一步闡述本發(fā)明。
[0035]如圖1所示,基于OCR的人工評(píng)判試卷處理裝置,包括試題導(dǎo)入模塊1、高速圖像采集裝置2、圖形處理與識(shí)別模塊、圖像數(shù)據(jù)庫(kù)7、試卷圖像及評(píng)分?jǐn)?shù)據(jù)庫(kù)的檢索模塊8、歷史數(shù)據(jù)分析模塊9。圖形處理與識(shí)別模塊包括試卷?xiàng)l碼識(shí)別模塊3、試卷版面分析與定位模塊4、OCR識(shí)別模塊5、校正模塊6、試卷圖像的快速壓縮保存模塊7。
[0036]試題導(dǎo)入模塊,負(fù)責(zé)將試卷及作業(yè)中試題,以及試卷分類信息(包括科目、章節(jié)等)等導(dǎo)入到圖像數(shù)據(jù)庫(kù)中進(jìn)行保存。
[0037]高速圖像采集裝置,通過(guò)對(duì)高速掃描儀進(jìn)行控制,并將采集的試卷及作業(yè)圖像傳輸?shù)礁咝阅茈娔X,并通過(guò)試卷圖像的快速壓縮保存模塊處理后送至圖像數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ)。
[0038]試卷?xiàng)l碼識(shí)別模塊,用于識(shí)別試卷中的條碼信息,并將識(shí)別的條碼信息送至試卷圖像的快速壓縮保存模塊處理;
[0039]試卷版面分析與定位模塊,用于對(duì)試卷及作業(yè)圖像中的信息進(jìn)行定位與分割,分割得到手寫字符圖像區(qū)域,并將手寫字符圖像區(qū)域送至OCR識(shí)別模塊做進(jìn)一步處理;
[0040]OCR識(shí)別模塊,對(duì)手寫字符圖像區(qū)域進(jìn)行高精度識(shí)別,并將識(shí)別結(jié)