亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種獲得字符匹配模版的方法及系統(tǒng)的制作方法

文檔序號:6470542閱讀:149來源:國知局

專利名稱::一種獲得字符匹配模版的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及手寫字符識別領(lǐng)域,尤其涉及一種獲得字符匹配模版方法及系統(tǒng)。
背景技術(shù)
:目前手寫輸入的識別技術(shù)被應(yīng)用到各種通信終端及信息處理終端;這種類型的終端產(chǎn)品通常具有一個用于書寫的觸摸手寫熒光屏,用戶能在上面用筆或手指寫字,然后經(jīng)過終端的識別處理,生成相應(yīng)的字符顯示在終端上,并進(jìn)行后續(xù)的相關(guān)操作,手寫輸入的識別技術(shù)提高了輸入的速度和靈活性,因此被普遍地應(yīng)用?,F(xiàn)在的手寫輸入的識別過程大多分為信號采集、預(yù)處理、特征提取、特征匹配等步驟,即將手寫輸入的字符的特征矢量與預(yù)先存儲的匹配模版的特征矢量進(jìn)行比較?,F(xiàn)有技術(shù)中預(yù)存儲的匹配模版獲得過程,因計(jì)算量大、處理時間長,而且獲得的匹配模版精度不高,影響手寫字符識別的準(zhǔn)確性。
發(fā)明內(nèi)容基于現(xiàn)有技術(shù)的不足,本發(fā)明實(shí)施例要解決的技術(shù)問題在于提供一種獲得字符匹配模版方法及系統(tǒng),使獲得的匹配模版的識另精度更準(zhǔn)確。本發(fā)明的目的通過以下技術(shù)方案實(shí)現(xiàn)一種獲得字符匹配模版的方法,其包括以下步驟A、采集字符類的手寫字符樣本;B、計(jì)算各個字符類的手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列;C、將手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列進(jìn)行變換,以調(diào)整手寫字符樣本的大小和形狀以及重心的坐標(biāo)值,得到該手寫字符樣本的規(guī)整坐標(biāo)序列;D、根據(jù)所述的規(guī)整坐標(biāo)序列,進(jìn)行特征提取得到該手寫字符樣本的多維特征矢量;E、從字符類的樣本的多維特征矢量中選取部分特征值,計(jì)算各個字符類的樣本中心,得到由各個字符類的樣本中心構(gòu)成的粗分類模版;F、根據(jù)Fisher準(zhǔn)則計(jì)算特征變換矩陣,利用該變換矩陣對字符類的樣本的多維特征矢量進(jìn)行特征變換,重新計(jì)算各個字符類的樣本中心,然后對特征變換矩陣和字符類的樣本中心進(jìn)行迭代調(diào)整,得到由各個字符類的樣本中心構(gòu)成的細(xì)分類模版。本發(fā)明還提供一種獲得字符匹配模版的系統(tǒng),其包括信號采集模塊,用于釆集字符類的手寫字符樣本并計(jì)算各個手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列;歸一化模塊,用于將所述信號采集模塊采集到的手寫字符樣本軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個離散坐標(biāo)序列,以調(diào)整手寫字符樣本的大小和形狀以及重心的坐標(biāo)值,得到該手寫字符樣本的規(guī)整坐標(biāo)序列;特征提取模塊,用于根據(jù)所述歸一化模塊得到的規(guī)整坐標(biāo)序列,進(jìn)行特征提取得到該手寫字符的多維特征矢量;粗分類模版計(jì)算模塊,用于從所述特征提取模塊得出的字符類的樣本的多維特征矢量中,選取部分特征值,計(jì)算各個字符類的樣本中心,得到由各個字符類的樣本中心構(gòu)成的粗分類模版;細(xì)分類模版計(jì)算模塊,用于根據(jù)Fisher準(zhǔn)則計(jì)算特征變換矩陣,利用該變換矩陣對字符類的樣本的多維特征矢量進(jìn)行特征變換,重新計(jì)算各個字符類的樣本中心,然后對特征變換矩陣和字符類的樣本中心進(jìn)行迭代調(diào)整,得到由各個字符類的樣本中心構(gòu)成的細(xì)分類模版;存儲模塊,用于存儲所述粗分類模版和細(xì)分類模版,以及細(xì)分類模版計(jì)算模塊中根據(jù)Fisher準(zhǔn)則計(jì)算和迭代調(diào)整后得到的特征變換矩陣。與現(xiàn)有技術(shù)相比較,本發(fā)明通過對手寫字符樣本進(jìn)行預(yù)處理,使得預(yù)處理后的手寫字符樣本的大小和形狀更自然也更規(guī)范,特征提取的速度快、精度高,根據(jù)Fisher準(zhǔn)則獲得的粗分類模版和粗分類模版使得手寫字符識別的準(zhǔn)確度更高。本發(fā)明一種獲得字符匹配模版的方法的一種優(yōu)選實(shí)施方式是,所述步驟C具體包括以下步驟將所有軌跡點(diǎn)的橫坐標(biāo)值和縱坐標(biāo)值變換到介于0到100之間;分別計(jì)算所有軌跡點(diǎn)橫坐標(biāo)和縱坐標(biāo)的重心坐標(biāo)值;將所有軌跡點(diǎn)坐標(biāo)值和重心坐標(biāo)值除以100,使所有軌跡點(diǎn)坐標(biāo)值和重心坐標(biāo)值變?yōu)?到l之間,利用使重心坐標(biāo)值的纟黃坐標(biāo)和縱坐標(biāo)變?yōu)?.5的一個平滑連續(xù)函數(shù),將采集到的手寫字符樣本軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個離散坐標(biāo)序列;再將所有軌跡點(diǎn)坐標(biāo)值乘以64,得到手寫字符樣本的規(guī)整坐標(biāo)序列。本發(fā)明一種獲得字符匹配模版的方法的另一種優(yōu)選實(shí)施方式是,所述步驟D具體包括以下步驟根據(jù)所述規(guī)整坐標(biāo)序列,將所有相鄰軌跡點(diǎn)形成的矢量線段分解到8個標(biāo)準(zhǔn)方向,每個標(biāo)準(zhǔn)方向上得到各矢量線段的長度值;對所述得到的各矢量線段的長度值進(jìn)行處理,分別計(jì)算大尺度特征值和小尺度特征值,從而得到由大尺度特征值和小尺度特征值構(gòu)成的多維特征矢量。本發(fā)明一種獲得字符匹配模版的方法的另一種優(yōu)選實(shí)施方式是,所述步驟E具體包括以下步艱A:根據(jù)Fisher準(zhǔn)則,從每一個字符類的樣本的多維特征矢量中,選取使得Fisher比最大的若干個特征值;根據(jù)由選取特征值構(gòu)成的樣本的特征矢量,計(jì)算該字符類的樣本中心的特征矢量,得到由各個字符類的樣本中心構(gòu)成的粗分類模版。本發(fā)明一種獲得字符匹配模版的方法的另一種優(yōu)選實(shí)施方式是,所述步驟F具體包括以下步驟利用根據(jù)Fisher準(zhǔn)則得到的特征變換矩陣,將所有字符類的樣本的多維特征矢量進(jìn)行特征變換,降低其多維特征矢量的維數(shù);重新計(jì)算特征變換后的所有字符類的樣本中心;對所述特征變換矩陣及所有字符類的樣本中心進(jìn)行迭代調(diào)整,重新計(jì)算得到特征變換矩陣和由各個字符類的樣本中心構(gòu)成的細(xì)分類模版。圖1是本發(fā)明實(shí)施例一種獲得字符匹配模版的方法的流程圖。圖2是本發(fā)明實(shí)施例一種獲得字符匹配模版的系統(tǒng)的結(jié)構(gòu)示意圖。圖3a是圖1中步驟S02中字符大小形狀調(diào)整前的示意圖。圖3b是圖1中步驟S02中字符大小形狀調(diào)整后的示意圖。圖4是圖1中步驟S02將調(diào)整后的字符放進(jìn)一個網(wǎng)格的示意圖。圖5是圖1中步驟S03中所述的8個標(biāo)準(zhǔn)方向圖。圖6是圖1中步驟S03中所述的將一個矢量線段分解到2個標(biāo)準(zhǔn)方向的示意圖。具體實(shí)施例方式為使本發(fā)明更加容易理解,結(jié)合附圖對本發(fā)明作進(jìn)一步闡述,但附圖中的實(shí)施例不構(gòu)成對本發(fā)明的任何限制。本發(fā)明是用于手機(jī)手寫字符輸入識別領(lǐng)域的一種獲得字符匹配模版的方法及系統(tǒng),手寫字符輸入識別是通過將輸入的手寫字符與預(yù)先存儲在手機(jī)當(dāng)中的匹配模版進(jìn)行比較,從匹配模版中選擇最接近的字符以供用戶選擇來實(shí)現(xiàn)的;而本發(fā)明就是為了獲得高精度的字符匹配模版進(jìn)而存儲在手機(jī)存儲器中,為手寫字符輸入識別技術(shù)提供可靠的基礎(chǔ)。圖1示出了本發(fā)明實(shí)施例一種獲得字符匹配模版的方法的流程圖,該方法包括以下步驟步驟SOl,采集全體字符類的手寫字符樣本;步驟S02,計(jì)算各個字符類的手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列;具體地用筆在觸摸屏上書寫,下筆時把筆尖的位置(x,y)坐標(biāo)序列記錄下來;一個輸入字符的完整書寫軌跡用一個(x,y)序列表示((xl,yl),(x2,y2),…,(xn,yn"。步驟S03,將手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個離散坐標(biāo)序列,以調(diào)整手寫字符樣本的大小和形狀以及重心的坐標(biāo)值,得到該手寫字符樣本的規(guī)整坐標(biāo)序列;這個步驟利用一個平滑連續(xù)函數(shù),對字符軌跡進(jìn)行歸一化有兩個目的大小標(biāo)準(zhǔn)化和形狀校正。如圖3a-3b所示,圖3a中的字符經(jīng)過歸一化后變成了圖3b中的形狀,不僅邊界變成了規(guī)定的大小(所有字符經(jīng)歸一化后邊界變成相同大小),而且形狀也發(fā)生了變化,變得更規(guī)范,,人而更容易識別。歸一化是通過兩個座標(biāo)變換函數(shù)?=^和^=,實(shí)現(xiàn),把字符軌跡中每一點(diǎn)的座標(biāo)(x,y)用(x,,y,)代替后,就得到歸一化的字符軌跡。參數(shù)a和b的估計(jì)方法如下首先,找出座標(biāo)序列中x和y的最小值,把所有點(diǎn)的x和y坐標(biāo)分別減去x和y的最小值,從而使x和y的最小值都變成0。然后,所有的x和y值乘以100/u,其中u是所有點(diǎn)x和y的最大值,從而使x和y{直介于0到100之間。第二步,求筆劃軌跡在水平方向和垂直方向上的投影。把字符筆劃軌跡》文進(jìn)一個100x100的網(wǎng)格,如圖4所示(示意圖中為10x10的網(wǎng)格)。把每一縱列格子中的筆劃長度相加,就得到水平方向的投影fx(i),i=l,2,...,100。同樣,4巴每一行格子中的筆劃長度相加,就得到垂直方向的投影fy(i),i=l,2,...,100.由fx(i)計(jì)算水平方向的重心5>fx(i)同樣,由fy(i)計(jì)算垂直方向的重心yc。第三步,把所有點(diǎn)的坐標(biāo)及(xc,yc)除以100,變?yōu)?到l之間。log0.5a="_函數(shù)1'=,和/=/分別把xc和yc變?yōu)閛.5,即^=0'5,!。gx。,同樣b_log0.5"=0'5,bgy。。經(jīng)過變換,使字符軌跡的重心移到(0.5,0.5)而邊界保持不變。第四步,把(x,,y,)乘以一個給定的倍數(shù),從而使字符的外框變?yōu)橐?guī)定的大小。這個倍數(shù)我們定為64。最后,歸一化字符軌跡中所有點(diǎn)的坐標(biāo)介于0到64之間。步驟S04,根據(jù)所述的規(guī)整坐標(biāo)序列,進(jìn)行特征提取得到該手寫字符樣本的多維特征矢量;其基本思想是如圖5所示,把筆劃線段(每相鄰兩點(diǎn)之間連成一條矢量線段)分解到Dl至D8的8個標(biāo)準(zhǔn)方向,記錄64x64網(wǎng)格中每個格子中各個方向的線段長度值,然后計(jì)算兩個尺度的方向特征值。第一步,把筆劃線段分解到8個標(biāo)準(zhǔn)方向。坐標(biāo)點(diǎn)序列中每相鄰兩點(diǎn)之間連成一條線段,是一個有方向的矢量f,。該矢量f,的方向介于兩個標(biāo)準(zhǔn)方向D2與D3之間,把矢量f;分解成兩個標(biāo)準(zhǔn)方向D2與D3上的分量(如圖6所示),每個標(biāo)準(zhǔn)方向上的分量長度計(jì)入所在格子中該方向的線段長度值。這樣,在8個方向的每個方向上得到64x64個線段長度值。第二步,計(jì)算大尺度特征值。把每個方向上的64x64網(wǎng)格均勻分成4x4個方格,計(jì)算每個方格中各個方向上線段長度值的和,得到8x4x4=128個特征值。第三步,計(jì)算小尺度特征值。把每個方向上的64x64網(wǎng)格均勻分成8x8個方格,計(jì)算每個方格中各個方向上線段長度值的和,得到8x8x8=512個特征值。大尺度特征值和小尺度特征值的總個It為128+512=640。步驟S05,從全體字符類的樣本的多維特征矢量中選取部分特征值,計(jì)算各個字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的粗分類模版;具體地,根據(jù)Fisher準(zhǔn)則,從每一個字符類的樣本的多維特征矢量中,選取使得Fisher比最大的若干個特征值,計(jì)算各個字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的粗分類模版。該步驟的目的是獲得粗分類模版,為了提高手寫字符識別的計(jì)算速度,在輸入手寫字符與粗分類模版進(jìn)行匹配時,要選擇一部分特征計(jì)算匹配距離,特征選擇和模版設(shè)計(jì)是在一個訓(xùn)練樣本集合上進(jìn)行的。訓(xùn)練樣本集包含每個字符類別的手寫樣本,每個樣本經(jīng)特征提取用640個特征值(640維的特征矢量x-[x?!?,X64。]7)表示。設(shè)有C個類別的總共N個樣本,其中類別i有Ni個樣本。選擇特征的準(zhǔn)則是Fisher準(zhǔn)則(模式識別教材上有詳細(xì)說明)Fisher準(zhǔn)則函數(shù)的基本思想是,構(gòu)造評價函數(shù),使得當(dāng)評價函數(shù)最優(yōu)時,被分類的類別之間的距離盡可能大,同時各類內(nèi)部樣本間距離盡可能小。將第i類的第j個樣本表示為特征矢量x'J(由部分候選特征組成),則各個類別的樣本中心(均值)為1w'W'臺\i=l,...,C(2)/=丄|;總的中心為^tr。類內(nèi)協(xié)方差矩陣和類間協(xié)方差矩陣分別計(jì)算為Nwn(3)特征選擇的目標(biāo)是在選擇部分特征的基礎(chǔ)上,矩陣s—w、的跡t"《Sb)(Fisher比)達(dá)到最大值。這里的^候選特征在特征選擇過程中是變化的。尋找Fisher比最大的特征組合是一個組合優(yōu)化問題,可用順序前向搜索法近似求解先計(jì)算每一個特征的Fisher比,選擇Fisher比最大的特征。然后把余下特征中的每一個依次與已選特征組成特征矢量計(jì)算Fisher比,選擇Fisher比最大的特征加入已選特征。如此反復(fù),直到已選特4正達(dá)到規(guī)定的數(shù)目(定為IOO以下)為止。特征選擇的具體過程如下首先以640個特征中的每一個依次作為候選,計(jì)算Fisher比,以Fisher比最大的一個特征作為選出來的第一個特征。然后^巴剩下的639個特征中的每一個依次與第一次選出來的特征一起(此時候選特征有兩個)評價,選出Fisher比最大的含有2個特征值的組合。然后4巴剩下的638個特征中的每一個依次與前面選出來的含有2個特征值的組合一起(此時候選特征有3個)評價,選出Fisher比最大的含有3個特征值的組合。如此反復(fù),直到選出來的特征數(shù)達(dá)到指定的數(shù)目為止。特征選擇完成后,特征集也就固定了。經(jīng)過特征選擇后,各個類別的粗分類模版是一類樣本的中心(均值),用公式(2)計(jì)算。步驟S06,根據(jù)Fisher準(zhǔn)則計(jì)算特征變換矩陣,利用該變換矩陣對全體字符類的樣本的多維特征矢量進(jìn)行特征變換,重新計(jì)算各個字符類的樣本中心,然后對特征變換矩陣和全體字符類的樣本中心進(jìn)行迭代調(diào)整,得到由全體字符類的樣本中心構(gòu)成的細(xì)分類模版。為了得到更高的識別精度,細(xì)分類特征采取特征變換,而不是特征選擇,即把原來D=640維的特征矢量經(jīng)線性變換得到低維(d〈D)矢量,特征變換后的特征矢量維數(shù)一般定為100到150之間。利用公式j(luò)^Wx進(jìn)行特征變換,其中w為dxD的變換矩陣。求解變換矩陣使Fisher比tr[(W、WT)"W、WT]最大,其結(jié)果,W的每一行是矩陣"、對應(yīng)本征值最大的d個本征向量(這是標(biāo)準(zhǔn)的數(shù)學(xué)方法,不必贅述)。經(jīng)過降維后,各個類別的模版是一類樣本的中心(公式(2))。像上面這樣得到的特征變換矩陣和類別模版還不能得到很高的識別精度。為此,對變換矩陣和類別模版進(jìn)行迭代調(diào)整,使在訓(xùn)練樣本集合上的分類錯誤(每個樣本分到距離'最近的類別)逐步減少。首先,將所有訓(xùn)練樣本的權(quán)重設(shè)為1,用Fisher準(zhǔn)則得到的變換矩陣和類別中心模版對所有的訓(xùn)練樣本分類,每個錯分的樣本權(quán)重加1。設(shè)樣本<(i類的第j個樣本)的權(quán)重表示為v"按下式重新計(jì)算類中心、類內(nèi)和類間協(xié)方差矩陣2>;i:說1fv々,—〃。)(//一/)tn,"y=5>;,、'=1,其中H(8)在此基礎(chǔ)上通過使W(WSWWT)"WTSbWT]最大化重新計(jì)算變換矩陣和特征變換后的類中心,重新對訓(xùn)練樣本分類,錯分的樣本權(quán)重加1;如此反復(fù),直到訓(xùn)練樣本的分類錯誤不再進(jìn)一步減少為止。獲得粗分類模版和細(xì)分類模版以及特征變換矩陣之后,將其都存儲在手機(jī)的存儲器中,接下來說說手寫字符識別的流程手機(jī)手寫屏幕接收手寫字符輸入的信號并采集手寫字符軌跡點(diǎn)的離散坐標(biāo)序列;按照上述步驟的歸一化預(yù)處理得到該手寫字符的規(guī)整坐標(biāo)序列;然后進(jìn)行特征提取得到該手寫字符的多維特征矢量;根據(jù)Fisher準(zhǔn)則,從手寫輸入字符的多維特征矢量中選取使得Fisher比最大的若干個特征值,選擇的特征值與粗分類模版中矢量選擇的特征值相同,將所述手寫輸入字符的由選取特征值構(gòu)成的特征矢量分別與存儲器中的粗分類模版的特征矢量進(jìn)行匹配計(jì)算,從預(yù)存儲字符類中選取相似度最大的若干個候選字符類,這樣就達(dá)到了粗分類的目的;模板匹配的距離計(jì)算如下設(shè)手寫輸入字符的多維特征矢量表示為矢量x=[xt,…,x,']T,粗分類模板中一個類別的樣本中心表示為特征矢量yz",…,A]t,則通過如下公式計(jì)算匹配距離"(x,y)=£lx,-xI,、'='(9)然后利用存儲器中存儲的特征變換矩陣,對所述手寫輸入字符的多維特征矢量進(jìn)行特征變換,將特征變換后的手寫輸入字符與從細(xì)分類模版中選取的候選字符類的樣本中心進(jìn)行匹配,從中確定最相似的字符類,以供用戶選擇。該步驟的目的是進(jìn)行細(xì)分類,對一個輸入字符,在粗分類中找出M個候選類別后,細(xì)分類采用比粗分類更多的特征,重新計(jì)算輸入字符到M個候選類別模板的距離,取距離最近的類別作為最終識別結(jié)果。細(xì)分類給出匹配距離最小的多個(一般為10個)類別作為最終候選。這些候選類別可以直接顯示出來供用戶選擇,或利用語言規(guī)則根據(jù)上下文自動選擇。粗分類是把輸入字符(待識別字符)的特征矢量與模版數(shù)據(jù)庫中存儲的各個字符類別的模版進(jìn)行比較(匹配),找出距離最小(也就是相似度最大)的M(比如M=100)個類別作為候選,在步驟S06的細(xì)分類中再找出距離最小的候選類別作為最終識別結(jié)果。粗分類和細(xì)分類所比較的模版不同(特征也不一樣)粗分類模版簡單(特征少),計(jì)算速度快,細(xì)分類模版復(fù)雜(特征較多),計(jì)算速度較慢。粗分類的目的是快速找出M個候選類別后,細(xì)分類中不必計(jì)算所有類別的距離(只計(jì)算M個候選類別的距離),從而提高總體識別速度。圖2示出了本發(fā)明實(shí)施例一種獲得字符匹配模版的系統(tǒng)的結(jié)構(gòu)示意圖,該系統(tǒng)包括信號采集模塊1,用于采集全體字符類的手寫字符樣本并計(jì)算各個手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列;歸一化模塊2,用于將所述信號采集模塊1采集到的手寫字符樣本軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個離散坐標(biāo)序列,以調(diào)整手寫字符樣本的大小和形狀以及重心的坐標(biāo)值,得到該手寫字符樣本的規(guī)整坐標(biāo)序列;特征提取模塊3,用于根據(jù)所述歸一化模塊2得到的規(guī)整坐標(biāo)序列,進(jìn)行特征提取得到該手寫字符的多維特征矢量;粗分類模版計(jì)算模塊4,用于從所述特征提取模塊3得出的全體字符類的樣本的多維特征矢量中,選取部分特征值,計(jì)算各個字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的粗分類模版;細(xì)分類模版計(jì)算模塊5,用于根據(jù)Fisher準(zhǔn)則計(jì)算特征變換矩陣,利用該變換矩陣對全體字符類的樣本的多維特征矢量進(jìn)行特征變換,重新計(jì)算各個字符類的樣本中心,然后對特征變換矩陣和全體字符類的樣本中心進(jìn)行迭代調(diào)整,得到由全體字符類的樣本中心構(gòu)成的細(xì)分類模版;存儲模塊6,用于存儲所述粗分類模版和細(xì)分類模版,以及細(xì)分類模版計(jì)算模塊中根據(jù)Fisher準(zhǔn)則計(jì)算和迭代調(diào)整后得到的特征變換矩陣。與現(xiàn)有方法相比,在歸一化、特征提取、粗分類、細(xì)分類中的技術(shù)有一些不同歸一化坐標(biāo)變換函數(shù)f:^和^^,是新提出的,這樣做的好處是坐標(biāo)變換的函數(shù)為平滑連續(xù)函數(shù),從而使變換后的字符形狀更為自然,同時保證字符軌跡的重心變換到外框的中心(0.5)。以前也有把字符重心映射到外框中心的做法,但是用的是分段線性函數(shù),變換后的字符形狀不自然,也影響后面的識別。特征提取筆劃軌跡線段直接分解到8個方向。現(xiàn)有的方法是先把軌跡變?yōu)橐环鶊D像,對圖像中的像素進(jìn)行方向分解,這樣做的計(jì)算量更大,而且生成的圖像會有失真。本發(fā)明避免了生成圖像所增加的計(jì)算量,而且得到的方向特征更準(zhǔn)確。粗分類現(xiàn)有方法一般是人工選取一部分特征(如直接使用大尺度特征)或者采用特征變換。而本發(fā)明用Fisher準(zhǔn)則選擇的特征比人工選擇特征有更好的識別精度,與特征變換相比減少了計(jì)算量(因?yàn)闆]有線性變換)。細(xì)分類特征變換矩陣和類別中心模版的迭代調(diào)整能明顯提高識別精度?,F(xiàn)有的方法是直接采用Fisher準(zhǔn)則得到的變換矩陣,然后在變換特征上采用學(xué)習(xí)矢量量化(LearningVectorQuantization,LVQ)算法調(diào)整類別中心模版。本發(fā)明通過同時調(diào)整變換矩陣與類別中心模版,能得到更高的識別精度。本發(fā)明可適用于中文、英文、數(shù)字、符號的識別;下面舉例說明采用本發(fā)明獲得的匹配模版進(jìn)行手寫字符識別的詳細(xì)過程一、輸入字符軌跡《二、歸一化后的軌跡咬三、粗分類選出的10個候選類別及其匹配距離(在60個選擇侍征上計(jì)算距離)<table>tableseeoriginaldocumentpage17</column></row><table>五、最后的識別結(jié)果為"唉"。以上所述是本發(fā)明的優(yōu)選實(shí)施方式而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,應(yīng)當(dāng)指出,對于本
技術(shù)領(lǐng)域
的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和變動,這些改進(jìn)和變動也視為本發(fā)明的保護(hù)范圍。權(quán)利要求1、一種獲得字符匹配模版的方法,其包括以下步驟A、采集字符類的手寫字符樣本;B、計(jì)算各個字符類的手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列;C、將手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列進(jìn)行變換,以調(diào)整手寫字符樣本的大小和形狀以及重心的坐標(biāo)值,得到該手寫字符樣本的規(guī)整坐標(biāo)序列;D、根據(jù)所述的規(guī)整坐標(biāo)序列,進(jìn)行特征提取得到該手寫字符樣本的多維特征矢量;E、從字符類的樣本的多維特征矢量中選取部分特征值,計(jì)算各個字符類的樣本中心,得到由各個字符類的樣本中心構(gòu)成的粗分類模版;F、根據(jù)Fisher準(zhǔn)則計(jì)算特征變換矩陣,利用該變換矩陣對全體字符類的樣本的多維特征矢量進(jìn)行特征變換,重新計(jì)算各個字符類的樣本中心,然后對特征變換矩陣和全體字符類的樣本中心進(jìn)行迭代調(diào)整,得到由各個字符類的樣本中心構(gòu)成的細(xì)分類模版。2、根據(jù)權(quán)利要求i所述的一種獲得字符匹配模版的方法,其特征在于,所述步驟C具體包括以下步驟將手寫字符樣本的所有軌跡點(diǎn)的橫坐標(biāo)值和縱坐標(biāo)值變換到介于0到100之間;分別計(jì)算所有軌跡點(diǎn)橫坐標(biāo)和縱坐標(biāo)的重心坐標(biāo)值;將所有軌跡點(diǎn)坐標(biāo)值和重心坐標(biāo)值除以ioo,使所有軌跡點(diǎn)坐標(biāo)值和重心坐標(biāo)值變?yōu)閛到i之間,利用〗吏重心坐標(biāo)值的4黃坐標(biāo)和縱坐標(biāo)變?yōu)?.5的一個平滑連續(xù)函數(shù),將釆集到的手寫字符樣本軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個離散坐標(biāo)序列;再將所有軌跡點(diǎn)坐標(biāo)值乘以64,得到手寫字符樣本的規(guī)整坐標(biāo)序列。3、根據(jù)權(quán)利要求1或2所述的一種獲得字符匹配模版的方法,其特征在于,所述步驟D具體包括以下步驟根據(jù)所述規(guī)整坐標(biāo)序列,將所有相鄰軌跡點(diǎn)形成的矢量線段分解到8個標(biāo)準(zhǔn)方向,每個標(biāo)準(zhǔn)方向上得到各矢量線段的長度值;對所述得到的各矢量線段的長度值進(jìn)行處理,分別計(jì)算大尺度特征值和小尺度特征值,從而得到由大尺度特征值和小尺度特征值構(gòu)成的多維特征矢量。4、根據(jù)權(quán)利要求1所述的一種獲得字符匹配模版的方法,其特征在于,所述步驟E具體包括以下步驟根據(jù)Fisher準(zhǔn)則,從每一個字符類的樣本的多維特征矢量中,選取使得Fisher比最大的若干個特征值;根據(jù)由選取特征值構(gòu)成的樣本的特征矢量,計(jì)算該字符類的樣本中心的特征矢量,得到由各個字符類的樣本中心構(gòu)成的粗分類模版。5、根據(jù)權(quán)利要求1或4所述的一種獲得字符匹配模版的方法,其特征在于,所述步驟F具體包括以下步驟利用根據(jù)Fisher準(zhǔn)則得到的特征變換矩陣,將所有字符類的樣本的多維特征矢量進(jìn)行特征變換,降低其多維特征矢量的維數(shù);重新計(jì)算特征變換后的所有字符類的樣本中心;對所述特征變換矩陣及所有字符類的樣本中心進(jìn)行迭代調(diào)整,重新計(jì)算得到特征變換矩陣和由各個字符類的樣本中心構(gòu)成的細(xì)分類模版。6、一種獲得字符匹配模版的系統(tǒng),其特征在于,包括信號采集模塊,用于采集各個字符類的手寫字符樣本并計(jì)算各個手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列;歸一化模塊,用于將所述信號采集模塊采集到的手寫字符樣本軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個離散坐標(biāo)序列,以調(diào)整手寫字符樣本的大小和形狀以及重心的坐標(biāo)值,得到該手寫字符樣本的規(guī)整坐標(biāo)序列;特征提取模塊,用于根據(jù)所述歸一化模塊得到的規(guī)整坐標(biāo)序列,進(jìn)行特征提取得到該手寫字符的多維特征矢量;粗分類模版計(jì)算模塊,用于從所述特征提取模塊得出的字符類的樣本的多維特征矢量中,選取部分特征值,計(jì)算各個字符類的樣本中心,得到由各個字符類的樣本中心構(gòu)成的粗分類模版;細(xì)分類模版計(jì)算模塊,用于根據(jù)Fisher準(zhǔn)則計(jì)算特征變換矩陣,利用該變換矩陣對字符類的樣本的多維特征矢量進(jìn)行特征變換,重新計(jì)算各個字符類的樣本中心,然后對特征變換矩陣和全體字符類的樣本中心進(jìn)行迭代調(diào)整,得到由各個字符類的樣本中心構(gòu)成的細(xì)分類模版;存儲模塊,用于存儲所述粗分類模版和細(xì)分類模版,以及細(xì)分類模版計(jì)算模塊中根據(jù)Fisher準(zhǔn)則計(jì)算和迭代調(diào)整后得到的特征變換矩陣。全文摘要本發(fā)明公開了一種獲得字符匹配模版的方法,其包括以下步驟A.采集字符類的手寫字符樣本;B.計(jì)算離散坐標(biāo)序列;C.調(diào)整手寫字符樣本的大小和形狀以及重心的坐標(biāo)值,得到該手寫字符樣本的規(guī)整坐標(biāo)序列;D.進(jìn)行特征提取得到該手寫字符樣本的多維特征矢量;E.從字符類的樣本的多維特征矢量中選取部分特征值,計(jì)算各個字符類的樣本中心,得到粗分類模版;F.根據(jù)Fisher準(zhǔn)則計(jì)算特征變換矩陣,對字符類的樣本的多維特征矢量進(jìn)行特征變換,重新計(jì)算各個字符類的樣本中心,然后進(jìn)行迭代調(diào)整,得到細(xì)分類模版。本發(fā)明還公開了一種獲得字符匹配模版的系統(tǒng)。本發(fā)明獲得的粗分類模版和粗分類模版使得手寫字符識別的準(zhǔn)確度更高。文檔編號G06K9/00GK101436249SQ20081021995公開日2009年5月20日申請日期2008年12月15日優(yōu)先權(quán)日2008年12月15日發(fā)明者劉志玭,吳政維,李景平,王志愛,王紅輝,胡安進(jìn),蔡沐宇,譚春桃,方郭,陸華興,陳炳輝,高精鍊,黃新春申請人:廣東國筆科技股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1