專利名稱:一種書寫漢字規(guī)范性評判的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種書寫漢字規(guī)范性評判的方法和裝置。
背景技術(shù):
在漢字應(yīng)用水平測試和漢字應(yīng)用教學(xué)等領(lǐng)域,如何有效的評判書寫漢字的規(guī)范性 是一個比較新穎的課題。目前所采用的方法主要是由人(教師)來評價,這種方法一方面帶 有很大的主觀性,同樣的書寫漢字不同的人可能給出差別較大的評判;另一方面,這一枯燥 重復(fù)性的工作容易使人疲勞,同樣的漢字由同樣的人在不同的時間段進(jìn)行評判,都有可能 給出不同的評判結(jié)果。中國發(fā)明專利“一種手寫漢字布局評價方法”(公開號CN101465074A)公開了一種 漢字布局的評價方法,該方法通過采用筆畫布局、部件布局以及整體字形布局來對手寫漢 字進(jìn)行綜合評價。然而,由于該專利采用了筆畫和部件的重心來對筆畫布局和部件布局進(jìn) 行評價,顯然,以筆畫或者部件重心為中心旋轉(zhuǎn)任意角度,都不會改變筆畫或部件的長度和 大小,因此,按該專利的方法,旋轉(zhuǎn)任意角度后對筆畫和部件的評價將沒有影響,而漢字筆 畫本身是具有方向性的,這顯然是不符合漢字書寫常識的,因此,僅僅以重心為指標(biāo)來對漢 字筆畫和部件來進(jìn)行評價這是有所欠缺的,需要增加其它約束條件,來對書寫漢字進(jìn)行更 有效的評價。中國發(fā)明專利“一種基于自信度的漢字書寫質(zhì)量評價方法”(公開號為 CN101630362A)提出了一種基于置信度的漢字書寫質(zhì)量評價方法,該專利采用修正二次判 決函數(shù)計算候選字的距離,然后根據(jù)候選字的距離大小計算置信度并進(jìn)行漢字書寫質(zhì)量的 評價,由于該專利的評價標(biāo)準(zhǔn)依賴于訓(xùn)練樣本(即書寫漢字)的選取,如果訓(xùn)練樣本書寫工 整,則對書寫工整的漢字具有較好的評價;顯然,即使對于書寫工整的漢字也有好壞之分, 這種方法是不能夠?qū)@類情況進(jìn)行評價的。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足而提供一種可以克服人工評價漢字的主 觀性以及疲勞性帶來的不利影響,能對書寫漢字的規(guī)范性進(jìn)行評判的書寫漢字規(guī)范性評判 的方法和裝置。本發(fā)明的目的通過以下技術(shù)措施實現(xiàn)一種書寫漢字規(guī)范性評判的方法,包括 Al 采集并記錄書寫漢字筆畫軌跡,采集得到書寫漢字軌跡記為
P0(xo-yo), ρι(χι->'ι),…,Pi(Wi) ,BreakMark,hO^+iJi+i),· · ·,,EndMark ; A2 將書寫漢字軌跡映射到與模板漢字相同大小的尺度坐標(biāo)系中; A3 采用道格拉斯-普克算法提取書寫漢字的軌跡關(guān)鍵點,設(shè)書寫漢字有JV筆筆畫,第
f/筆筆畫的軌跡關(guān)鍵點用Α&ι,Χ Λ ^,)^,……,、(iSJiJ表示ρ力關(guān)鍵點數(shù)目;
8A4:根據(jù)獲取的關(guān)鍵點,獲取所有筆畫的特征向量,第W筆筆畫的軌跡關(guān)鍵 點AC^jli^Xa,九》,……,kp{xp,yp),總共有ρ個關(guān)鍵點,取軌跡關(guān)鍵點
I-,1=1,2,..... J-1和關(guān)鍵盧的后一個關(guān)鍵點= ,則有向線段ξξ的方向設(shè)
定為關(guān)鍵點的方向,記作沒,有向線段ξξ的長度記為關(guān)鍵點t的長度,記作廠;
權(quán)利要求
一種書寫漢字規(guī)范性評判的方法,其特征在于,包括A1采集并記錄書寫漢字筆畫軌跡,采集得到書寫漢字軌跡記為,,…,,,,...,,;A2將書寫漢字軌跡映射到與模板漢字相同大小的尺度坐標(biāo)系中;A3采用道格拉斯 普克算法提取書寫漢字的軌跡關(guān)鍵點,設(shè)書寫漢字有N筆的筆畫,第筆筆畫的軌跡關(guān)鍵點用表示,為關(guān)鍵點數(shù)目;A4根據(jù)獲取的關(guān)鍵點,獲取所有筆畫的特征向量,第筆筆畫的軌跡關(guān)鍵點,總共有個關(guān)鍵點,取軌跡關(guān)鍵點和關(guān)鍵點的后一個關(guān)鍵點,則有向線段的方向設(shè)定為關(guān)鍵點的方向,記作,有向線段的長度記為關(guān)鍵點的長度,記作;和計算方法為對于第筆筆畫有關(guān)鍵點,可以得到一個維特征向量,記作,每一維特征向量包含4個特征值,最后一個關(guān)鍵點;對每一筆重復(fù)以上操作,得到書寫漢字所有筆畫的特征向量;獲取所述書寫漢字對應(yīng)的模板漢字的第筆筆畫的特征向量為,該筆畫包含個關(guān)鍵點;A5筆畫特征匹配,對書寫漢字的每一筆筆畫與模板漢字的對應(yīng)筆畫進(jìn)行動態(tài)規(guī)劃匹配;對于書寫漢字的第筆筆畫,通過上步求得其特征向量為,對應(yīng)模板漢字第筆筆畫的特征向量為,設(shè)和動態(tài)規(guī)劃匹配的誤差矩陣為,大小,動態(tài)規(guī)劃的狀態(tài)轉(zhuǎn)移函數(shù)為其中定義為中的第維與中的維向量的誤差其中是加權(quán)系數(shù);對做標(biāo)量量化,最終第筆筆畫的匹配度為,對書寫漢字的所有筆畫都做動態(tài)規(guī)劃匹配,可以得到所有筆畫的匹配度,為書寫筆畫數(shù)目,所有筆畫的匹配度平均值記為;A6根據(jù)步驟A5中所獲得的書寫漢字與標(biāo)準(zhǔn)漢字的所有筆畫的匹配度和匹配度平均值,采用決策樹的方法對書寫漢字的規(guī)范性做綜合評價。2010105378757100001dest_path_image001.jpg,946038dest_path_image002.jpg,2010105378757100001dest_path_image003.jpg,782275dest_path_image004.jpg,2010105378757100001dest_path_image005.jpg,273562dest_path_image006.jpg,2010105378757100001dest_path_image007.jpg,537053dest_path_image008.jpg,2010105378757100001dest_path_image009.jpg,743650dest_path_image010.jpg,321262dest_path_image008.jpg,103273dest_path_image009.jpg,475349dest_path_image010.jpg,2010105378757100001dest_path_image011.jpg,172171dest_path_image012.jpg,2010105378757100001dest_path_image013.jpg,350212dest_path_image014.jpg,750844dest_path_image012.jpg,2010105378757100001dest_path_image015.jpg,356138dest_path_image014.jpg,976475dest_path_image012.jpg,131775dest_path_image016.jpg,888378dest_path_image015.jpg,867836dest_path_image016.jpg,2010105378757100001dest_path_image017.jpg,270742dest_path_image008.jpg,790585dest_path_image010.jpg,667274dest_path_image010.jpg,53518dest_path_image018.jpg,2010105378757100001dest_path_image019.jpg,382868dest_path_image020.jpg,706402dest_path_image008.jpg,2010105378757100001dest_path_image021.jpg,998450dest_path_image022.jpg,54131dest_path_image008.jpg,2010105378757100001dest_path_image023.jpg,434559dest_path_image008.jpg,233887dest_path_image024.jpg,819590dest_path_image023.jpg,311751dest_path_image024.jpg,2010105378757100001dest_path_image025.jpg,238862dest_path_image026.jpg,2010105378757100001dest_path_image027.jpg,140084dest_path_image028.jpg,845872dest_path_image023.jpg,2010105378757100001dest_path_image029.jpg,305672dest_path_image024.jpg,595446dest_path_image030.jpg,2010105378757100001dest_path_image031.jpg,798894dest_path_image032.jpg,2010105378757100001dest_path_image033.jpg,922970dest_path_image034.jpg,756934dest_path_image008.jpg,2010105378757100001dest_path_image035.jpg,832206dest_path_image036.jpg,2010105378757100001dest_path_image037.jpg,361318dest_path_image038.jpg,776119dest_path_image036.jpg,780984dest_path_image038.jpg
2.根據(jù)權(quán)利要求1所述的一種書寫漢字規(guī)范性評判的方法,其特征在于,步驟Α6中決 策樹的方法具體是Α61 遍歷R =[巧,如果苧大于指定閾值,則記為該筆不符合規(guī)范,統(tǒng)計所有不符合規(guī)范的筆畫數(shù)目,如果大于閾值^vffibn,則判斷出該書寫漢字不符合規(guī) 范,否則進(jìn)入A62 ;A62 如果大于指定閾值判斷出該書寫漢字不符合規(guī)范,否則判斷出該書 寫漢字符合規(guī)范。
3.根據(jù)權(quán)利要求2所述的一種書寫漢字規(guī)范性評判的方法,其特征在于,A2步驟之前 還進(jìn)一步包括,步驟All筆畫數(shù)目判別根據(jù)步驟Al采集的書寫漢字軌跡獲得書寫漢字的 筆畫數(shù),獲取該書寫漢字對應(yīng)的模板漢字的筆畫數(shù),將該書寫漢字筆畫數(shù)與模板漢字進(jìn)行 對比,如果二者的筆畫數(shù)目不相等,判斷出該書寫漢字不符合規(guī)范。
4.根據(jù)權(quán)利要求3所述的一種書寫漢字規(guī)范性評判的方法,其特征在于,步驟A2中將 書寫漢字軌跡映射到與模板漢字相同大小的尺度坐標(biāo)系中具體方法是采用中心對齊線性歸一化方法,根據(jù)書寫漢字軌跡點可以得到書寫漢字的軌跡的橫坐標(biāo)取值范圍
5. 一種書寫漢字規(guī)范性評判的裝置,其特征在于,包括采集并記錄書寫漢字筆畫軌跡裝置,用于采集并記錄書寫漢字筆畫軌跡,采集得到 書寫漢字軌跡記為P0(^y0), PM^i),…,Pi(^yi)
6.根據(jù)權(quán)利要求5所述的一種書寫漢字規(guī)范性評判的裝置,其特征在于,決策樹綜合 評價裝置中決策樹的方法具體為Α61 遍歷:R =[瑪,R2,... 如果乓大于指定閾值J^tewfe,則記為該筆不符合規(guī)范,統(tǒng)計所有不符合規(guī)范的筆畫數(shù)目,如果大于閾值,則判斷出該書寫漢字不符合規(guī) 范,否則進(jìn)入Α62 ;Α62 如果大于指定閾值判斷出該書寫漢字不符合規(guī)范,否則判斷出該書 寫漢字符合規(guī)范。
7.根據(jù)權(quán)利要求6所述的一種書寫漢字規(guī)范性評判的裝置,其特征在于,還進(jìn)一步包 括筆畫數(shù)目判別裝置,根據(jù)采集并記錄書寫漢字筆畫軌跡裝置采集的書寫漢字軌跡獲得書 寫漢字的筆畫數(shù),獲取該書寫漢字對應(yīng)的模板漢字的筆畫數(shù),將該書寫漢字筆畫數(shù)與模板 漢字進(jìn)行對比,如果二者的筆畫數(shù)目不相等,判斷出該書寫漢字不符合規(guī)范。
8.根據(jù)權(quán)利要求7所述的一種書寫漢字規(guī)范性評判的裝置,其特征在于,書寫軌跡歸 一化裝置中,將書寫漢字軌跡映射到與模板漢字相同大小的尺度坐標(biāo)系中具體方法是采 用中心對齊線性歸一化方法,根據(jù)書寫漢字軌跡點可以得到書寫漢字的軌跡的橫坐標(biāo)取值范圍[Imi^U ,縱坐標(biāo)的取值范圍KaiZm5J ,設(shè)手寫漢字的軌跡的寬度和高度分別為呎 和場,則設(shè)中心對齊線性歸一化后的寬度和高度分別為 Τ2和H2,歸一化后的坐標(biāo)為(允沁)J Xi = β(Xi - Xmkl) + Xbjas其中α是縮放比例a = ininf—.^-)^ ff/xU^Jbiai中心對齊偏移量
全文摘要
本發(fā)明涉及計算機數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種書寫漢字規(guī)范性評判的方法,其包括6部分,分別是采集并記錄書寫漢字筆畫軌跡;將書寫漢字軌跡映射到與模板漢字相同大小的尺度坐標(biāo)系中;采用道格拉斯-普克算法提取書寫軌跡關(guān)鍵點;根據(jù)獲取的關(guān)鍵點,獲取所有筆畫的特征向量;筆畫特征匹配,對于書寫漢字的每一筆筆畫與漢字標(biāo)準(zhǔn)模板特征庫中的對應(yīng)漢字的對應(yīng)筆畫進(jìn)行動態(tài)規(guī)劃匹配;采用決策樹的方法對書寫漢字的規(guī)范性做綜合評價;本發(fā)明可以克服人工評價漢字的主觀性以及疲勞性帶來的不利影響,能對書寫漢字的規(guī)范性進(jìn)行評判。
文檔編號G06K9/62GK101976354SQ20101053787
公開日2011年2月16日 申請日期2010年11月10日 優(yōu)先權(quán)日2010年11月10日
發(fā)明者朱軍民, 鄧超 申請人:廣東開心信息技術(shù)有限公司