專利名稱:一種書寫漢字規(guī)范性評判的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及書寫漢字規(guī)范性評判的技術(shù)領(lǐng)域,尤其涉及一種書寫漢字規(guī)范性評判的方法和裝置。
背景技術(shù):
在漢字應(yīng)用水平測試和漢字應(yīng)用教學(xué)等領(lǐng)域,如何有效的評判書寫漢字(測試人員手寫的漢字)的規(guī)范性是一個(gè)比較新穎的課題。目前所采用的方法主要是由人(教師) 來評判,這種方法一方面帶有很大的主觀性,同樣的書寫漢字不同的人可能給出差別較大的評判;另一方面,這一枯燥重復(fù)性的工作容易使人疲勞,同樣的漢字由同樣的人在不同的時(shí)間段進(jìn)行評判,都有可能給出不同的評判結(jié)果。公開號為CN101630362A、名稱為“一種基于置信度的漢字書寫質(zhì)量評價(jià)方法”的中國專利文獻(xiàn),公開了一種基于置信度的漢字書寫質(zhì)量評價(jià)方法,該方法采用修正二次判決函數(shù)計(jì)算候選字的距離,然后根據(jù)候選字的距離大小計(jì)算置信度并進(jìn)行漢字書寫質(zhì)量的評價(jià),由于該方案的評價(jià)標(biāo)準(zhǔn)依賴于訓(xùn)練樣本(即書寫漢字)的選取,如果訓(xùn)練樣本書寫工整,則對書寫工整的漢字具有較好的評價(jià),反之,評價(jià)較差;現(xiàn)有技術(shù)的基于訓(xùn)練樣本的書寫漢字評判方法效果不好。
發(fā)明內(nèi)容
本發(fā)明提供一種有效的、客觀的書寫漢字規(guī)范性評判的方法和裝置,其利用投影特征向量的距離之和與筆畫交接的面積之和對書寫漢字進(jìn)行規(guī)范性評判,具有良好的評判效果。一種書寫漢字規(guī)范性評判的方法,包括以下步驟A獲取書寫漢字的筆畫,設(shè)共有η筆筆畫;采用道格拉斯-普克算法對每筆筆畫進(jìn)行矢量數(shù)據(jù)壓縮,得到每筆筆畫的軌跡關(guān)鍵點(diǎn) ’設(shè)第i筆筆畫共有P個(gè)軌跡關(guān)鍵點(diǎn),將第i 筆筆畫的第t個(gè)軌跡關(guān)鍵點(diǎn)表示為S,相鄰的兩個(gè)軌跡關(guān)鍵點(diǎn)構(gòu)成一個(gè)筆畫段,第i筆筆畫共有P-I個(gè)筆畫段,將第i筆筆畫的第d個(gè)筆畫段表示為Vd,其中,i = 1,2,...,n,t = 1, 2,...,p,d = 1,2,...,p—l ;B獲取投影特征向量的距離之和Dist_total,包括以下步驟獲取書寫漢字的第i筆筆畫的投影特征向量(PjctXPi, PjctXNi, PjctYPi, PjctYNi)
權(quán)利要求
1. 一種書寫漢字規(guī)范性評判的方法,其特征在于,包括A獲取書寫漢字的筆畫,設(shè)共有η筆筆畫;采用道格拉斯-普克算法對每筆筆畫進(jìn)行矢量數(shù)據(jù)壓縮,得到每筆筆畫的軌跡關(guān)鍵點(diǎn);設(shè)第i筆筆畫共有P個(gè)軌跡關(guān)鍵點(diǎn),將第i筆筆畫的第t個(gè)軌跡關(guān)鍵點(diǎn)表示為s,相鄰的兩個(gè)軌跡關(guān)鍵點(diǎn)構(gòu)成一個(gè)筆畫段,第i筆筆畫共有P-I個(gè)筆畫段,將第i筆筆畫的第d個(gè)筆畫段表示為vd,其中,i = 1,2,...,n,t = 1, 2,...,p,d = 1,2,...,p—l ;B獲取投影特征向量的距離之和Dist_total,包括獲取書寫漢字的第i筆筆畫的投影特征向量
2.根據(jù)權(quán)利要求1所述的一種書寫漢字規(guī)范性評判的方法,其特征在于,在步驟A之后,進(jìn)一步包括Al 獲取模板漢字的筆畫數(shù)量;如果書寫漢字的筆畫數(shù)量與模板漢字的筆畫數(shù)量不相等, 判斷出該書寫漢字為不規(guī)范的書寫漢字。
3.根據(jù)權(quán)利要求2所述的一種書寫漢字規(guī)范性評判的方法,其特征在于,在步驟Al之后,進(jìn)一步包括A2 A21 設(shè) i = 1 ;A22獲取書寫漢字的第i筆筆畫的筆畫段Vd與模板漢字的第i筆筆畫的筆畫段U。的交點(diǎn)數(shù)量m,判斷交點(diǎn)數(shù)量m是否不大于預(yù)置閥值,如果是,繼續(xù)步驟A23,否則,判斷出該書寫漢字為不規(guī)范的書寫漢字;A23判斷書寫漢字的第i筆筆畫的兩個(gè)不相鄰的筆畫段^是否有交點(diǎn),如果是,判斷出該書寫漢字為不規(guī)范的書寫漢字,否則,繼續(xù)步驟A24 ;A24判斷步驟A22獲取的交點(diǎn)數(shù)量m是否小于2個(gè),如果是,繼續(xù)步驟A25,否則,判斷筆畫段Vd是否按筆畫段11。的先后順序與筆畫段11。相交,如果是,繼續(xù)步驟A25,否則,判斷出該書寫漢字為不規(guī)范的書寫漢字;A25判斷i是否等于n,如果是,步驟A2結(jié)束,否則,i = i+Ι,返回步驟A22。
4.根據(jù)權(quán)利要求3所述的一種書寫漢字規(guī)范性評判的方法,其特征在于,所述預(yù)置閥值為3、4或5。
5.根據(jù)權(quán)利要求1至4任意一項(xiàng)所述的一種書寫漢字規(guī)范性評判的方法,其特征在于, 所述機(jī)器學(xué)習(xí)方法為貝葉斯分類器方法、支持向量機(jī)方法、直接閾值法或AdaBoost方法。
6. 一種書寫漢字規(guī)范性評判的裝置,其特征在于,包括書寫漢字軌跡識別裝置,用于獲取書寫漢字的筆畫,設(shè)共有η筆筆畫;采用道格拉斯-普克算法對每筆筆畫進(jìn)行矢量數(shù)據(jù)壓縮,得到每筆筆畫的軌跡關(guān)鍵點(diǎn);設(shè)第i筆筆畫共有P個(gè)軌跡關(guān)鍵點(diǎn),將第i筆筆畫的第t個(gè)軌跡關(guān)鍵點(diǎn)表示為\,相鄰的兩個(gè)軌跡關(guān)鍵點(diǎn)構(gòu)成一個(gè)筆畫段,第i筆筆畫共有P-I個(gè)筆畫段,將第i筆筆畫的第d個(gè)筆畫段表示為vd,其中,i = l,2,...,n,t = l,2,...,p,d = 1,2,...,p-1 ;筆畫投影特征相似性獲取裝置,用于獲取投影特征向量的距離之和Dist_total,包括以下步驟獲取書寫漢字的第i筆筆畫的投影特征向量(PjctXPi, PjctXNi, PjctYPi, PjctYNi)
7.根據(jù)權(quán)利要求6所述的一種書寫漢字規(guī)范性評判的裝置,其特征在于進(jìn)一步包括筆畫數(shù)量比較裝置,用于獲取模板漢字的筆畫數(shù)量,如果書寫漢字的筆畫數(shù)量與模板漢字的筆畫數(shù)量不相等,判斷出該書寫漢字為不規(guī)范的書寫漢字。
8.根據(jù)權(quán)利要求7所述的一種書寫漢字規(guī)范性評判的裝置,其特征在于進(jìn)一步包括筆畫規(guī)范性判斷裝置,用于判斷每筆筆畫的規(guī)范性,判斷步驟包括A21 設(shè) i = 1 ;A22獲取書寫漢字的第i筆筆畫的筆畫段Vd與模板漢字的第i筆筆畫的筆畫段U。的交點(diǎn)數(shù)量m,判斷交點(diǎn)數(shù)量m是否不大于預(yù)置閥值,如果是,繼續(xù)步驟A23,否則,判斷出該書寫漢字為不規(guī)范的書寫漢字;A23判斷書寫漢字的第i筆筆畫的兩個(gè)不相鄰的筆畫段^是否有交點(diǎn),如果是,判斷出該書寫漢字為不規(guī)范的書寫漢字,否則,繼續(xù)步驟A24 ;A24判斷步驟A22獲取的交點(diǎn)數(shù)量m是否小于2個(gè),如果是,繼續(xù)步驟A25,否則,判斷筆畫段Vd是否按筆畫段11。的先后順序與筆畫段11。相交,如果是,繼續(xù)步驟A25,否則,判斷出該書寫漢字為不規(guī)范的書寫漢字;A25判斷i是否等于n,如果是,步驟A2結(jié)束,否則,i = i+Ι,返回步驟A22。
9.根據(jù)權(quán)利要求8所述的一種書寫漢字規(guī)范性評判的裝置,其特征在于,所述預(yù)置閥值為3、4或5。
10.根據(jù)權(quán)利要求6至9任意一項(xiàng)所述的一種書寫漢字規(guī)范性評判的裝置,其特征在于,所述機(jī)器學(xué)習(xí)方法為貝葉斯分類器方法、支持向量機(jī)方法、直接閾值法或AdaBoost方法。
全文摘要
本發(fā)明公開了一種書寫漢字規(guī)范性評判的方法和裝置;書寫漢字規(guī)范性評判的方法包括獲取書寫漢字的筆畫,用道格拉斯-普克算法對每筆筆畫進(jìn)行矢量數(shù)據(jù)壓縮,得到每筆筆畫的軌跡關(guān)鍵點(diǎn),獲取投影特征向量的距離之和,獲取筆畫交接的面積之和,根據(jù)機(jī)器學(xué)習(xí)方法,利用投影特征向量的距離之和與筆畫交接的面積之和,對書寫漢字進(jìn)行規(guī)范性評判;本技術(shù)方案可以有效、客觀對書寫漢字進(jìn)行規(guī)范性評判,具有良好的評判效果。
文檔編號G06T7/00GK102339392SQ20101023107
公開日2012年2月1日 申請日期2010年7月20日 優(yōu)先權(quán)日2010年7月20日
發(fā)明者朱軍民, 祝豪, 鄧超 申請人:廣東開心信息技術(shù)有限公司