專利名稱:利用背景像素的手寫識(shí)別方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及手寫識(shí)別過程。本發(fā)明具體但不局限地應(yīng)用于劃寫于掌上電子設(shè)備的手寫識(shí)別中。
背景技術(shù):
近幾十年來,計(jì)算機(jī)印刷文字識(shí)別成為困擾技術(shù)的難題。只是在最近,很多光學(xué)字符識(shí)別(OCR)技術(shù)才改進(jìn)地能夠以高的準(zhǔn)確率處理掃描的文本文檔。然而這樣的OCR技術(shù)通常只能處理生成等高且清晰字符的系統(tǒng)(諸如打印機(jī))的印刷文本。計(jì)算機(jī)手寫字符識(shí)別仍然是一項(xiàng)非常困難的技術(shù)挑戰(zhàn)。
現(xiàn)有的識(shí)別手寫字符的方法通常包括高分辨率的模板,除了手寫字符兩個(gè)物理維度之外還捕捉與書寫動(dòng)作相關(guān)的時(shí)間維度。通常利用在筆、輸入筆或手指接觸到手寫板時(shí)記錄文字筆劃的電子手寫板來創(chuàng)建這樣的模板。其它技術(shù)包括在書寫字符時(shí)記錄筆尖移動(dòng)的電子筆的應(yīng)用。對(duì)應(yīng)于輸入手寫字符的方向特征向量隨后利用多種的模式識(shí)別技術(shù)與模型字符模板進(jìn)行比較。模型字符模板包括每個(gè)字符多次輸入采樣的方向特征向量的統(tǒng)計(jì)平均值。
當(dāng)在電子手寫板上書寫時(shí),書寫人希望能夠看到他或她所寫的筆跡,例如在圖形用戶界面上利用電子“墨水”,使得書寫人可以控制文本的可辨認(rèn)性。然而,一些掌上電子設(shè)備,例如移動(dòng)電話和個(gè)人數(shù)字助理(PDA)包括小觸摸板,其中,用戶必須一個(gè)疊一個(gè)地書寫文字,不接收任何反饋,例如圖形用戶界面所顯示的是否已經(jīng)處理輸入的反饋。這樣字符是在“盲”狀態(tài)下書寫的??梢韵胂?,書寫在這樣的觸摸板上的字符,特別是考慮到更復(fù)雜的、例如很多中文和日文字符的表意字符,容易出現(xiàn)顯著的字符形狀變形。寫在這樣觸摸板上的字符的正確電子識(shí)別是尤其困難的。
因此需要一種改進(jìn)的手寫識(shí)別方法和系統(tǒng),其可以克服顯著的字符形狀變形,例如由觸摸板上盲寫所引入的變形,并識(shí)別想要書寫的字符。
發(fā)明內(nèi)容
依照一個(gè)方面,本發(fā)明是改進(jìn)的手寫識(shí)別方法。它包括接收劃寫在電子設(shè)備用戶界面上的手寫輸入字符表示,輸入字符由用戶界面上與背景像素相鄰的前景像素所定義。隨后從前景像素中獲得前景方向特征向量,并且從背景像素中獲得背景凹度特征向量。通過前景方向特征向量和背景凹度特征向量與模型字符模板的比較來確定匹配候選字符。
優(yōu)選地,本發(fā)明進(jìn)一步包括對(duì)手寫輸入字符執(zhí)行平滑、去噪以及大小歸一化處理的預(yù)處理。
優(yōu)選地,確定匹配候選字符的步驟進(jìn)一步包括通過比較前景方向特征向量和模型字符模板提供候選字符第一短列表和對(duì)應(yīng)第一向量距離(d1),通過比較背景凹度特征向量和模型字符模板提供候選字符第二短列表和對(duì)應(yīng)第二向量距離(d2),和根據(jù)如下方程合并第一向量距離(d1)和第二向量距離(d2)的步驟dcomb=W1*d1+W2*d2其中dcomb是加權(quán)向量距離,W1和W2是經(jīng)驗(yàn)權(quán)重系數(shù),并且W1+W2=1,其中前景方向特征向量和背景凹度特征向量利用加權(quán)向量距離dcomb與模型字符模板進(jìn)行比較。
優(yōu)選地,所述方法也包括從背景像素提取背景凹度特征向量之前減小手寫輸入字符表示的大小的步驟。
優(yōu)選地,從背景像素提取背景凹度特征向量的所述步驟包括從每一背景像素出發(fā)在四個(gè)方向搜索前景像素。
優(yōu)選地,所述模型字符模板包括來自大量輸入采樣的方向特征向量的統(tǒng)計(jì)平均值。
優(yōu)選地,所述方法進(jìn)一步包括用于消除重復(fù)像素和歸一化像素密度不一致的輸入字符再采樣。
優(yōu)選地,在迭代學(xué)習(xí)過程中基于電子設(shè)備獨(dú)立用戶的手寫個(gè)性確定經(jīng)驗(yàn)權(quán)重系數(shù)W1和W2。
根據(jù)另外一方面,本發(fā)明是一種用于手寫識(shí)別的系統(tǒng),包括微處理器、有效連接于微處理器的只讀存儲(chǔ)器(ROM)、有效連接于微處理器的可編程存儲(chǔ)器和有效連接于微處理器的輸入板。所述微處理器有效執(zhí)行存儲(chǔ)在ROM中的代碼來接收劃寫在輸入板上的手寫輸入字符的表示,輸入字符由相鄰于背景像素的前景像素所定義,從前景像素中提取前景方向特征向量,從背景像素中提取背景凹度特征向量,并且通過前景方向特征向量和背景凹度特征向量與模型字符模板的比較來確定匹配候選字符。
在本說明書以及權(quán)利要求書中,術(shù)語“包括(comprises、including、comprising)”以及類似術(shù)語的含義是指非排他性的包括,因此包括一系列組件的方法或裝置,其不僅包括那些已單獨(dú)列出的組件,還可能很好地包括那些沒有列出的其它組件。
為了使本發(fā)明易于理解并付諸實(shí)施,現(xiàn)在將結(jié)合附圖來參考引用優(yōu)選實(shí)施例,其中相似的引用數(shù)字指代類似的組件,在附圖中
圖1為根據(jù)本發(fā)明實(shí)施例,展示劃寫在電子設(shè)備上的小寫羅馬字母“e”形式的手寫輸入字符表示的示意圖;圖2為根據(jù)本發(fā)明實(shí)施例,展示手寫識(shí)別方法的廣義流程圖;圖3為根據(jù)本發(fā)明實(shí)施例,展示劃寫在電子設(shè)備像素書寫板上的輸入字符的另一個(gè)示意圖,其進(jìn)一步描述了用于形成字符的筆劃方向;圖4為根據(jù)本發(fā)明實(shí)施例,展示用于定義方向特征向量的八個(gè)筆劃方向的示意圖;圖5為根據(jù)本發(fā)明實(shí)施例,展示輸入字符小寫羅馬字母“e”的邊緣矩形和背景像素的另一示意圖;圖6為根據(jù)本發(fā)明實(shí)施例,展示用于搜索前景像素的四個(gè)福里曼(Freeman)方向的示意圖;圖7為根據(jù)本發(fā)明實(shí)施例,描述背景凹度特征向量的表;圖8和9為根據(jù)本發(fā)明實(shí)施例,展示手寫識(shí)別方法更詳細(xì)描述的廣義流程圖。
圖10為根據(jù)本發(fā)明實(shí)施例,展示本領(lǐng)域現(xiàn)有的移動(dòng)電話的示意圖,其包括可以在其上面劃寫手寫字符表示的輸入板。
具體實(shí)施例方式
參照?qǐng)D1,為根據(jù)本發(fā)明實(shí)施例,展示劃寫在電子設(shè)備之上的手寫輸入字符100的表示的示意圖。小寫羅馬字母“e”形式的字符100包括離散的前景像素105和背景像素110。前景像素105通常是例如黑色的一種顏色的并且形成輸入字符100的線段和形狀。背景像素110通常是強(qiáng)烈對(duì)比的一種顏色,例如白色。像素105、110的大小根據(jù)電子設(shè)備圖像分辨率的設(shè)置而不同,其中分辨率越高,像素105、110越小。
參照?qǐng)D2,根據(jù)本發(fā)明實(shí)施例,展示了手寫識(shí)別方法的廣義流程圖。所述方法200確定與劃寫在電子設(shè)備上的手寫輸入字符100表示最匹配的至少一個(gè)匹配標(biāo)準(zhǔn)候選字符。所述方法200開始于用戶在設(shè)備上用例如輸入筆或手指劃寫字符100時(shí)接收手寫輸入字符100表示的步驟205。接著,在步驟210從前景像素105中獲取前景方向特征向量,這將在下邊進(jìn)一步詳細(xì)描述。在步驟215從背景像素110中獲取背景凹度特征向量?;谇熬跋袼?05的搜索,背景凹度特征向量包括了關(guān)于由前景像素105組成字符筆劃形狀的信息,這里搜索從單獨(dú)的背景像素110開始。該步驟也會(huì)在下邊進(jìn)行詳細(xì)描述。最后,在步驟220,方法200通過前景方向特征向量和背景凹度特征向量與模型字符模板的比較來確定匹配候選字符。建立模型字符模板的方法在上面已經(jīng)進(jìn)行了簡單描述并且在本技術(shù)領(lǐng)域是公知的。
所述方法200可以合并到掌上電子設(shè)備當(dāng)中,例如個(gè)人數(shù)字助理(PDA)和移動(dòng)電話,來提供改進(jìn)的手寫識(shí)別性能。由于用于創(chuàng)建前景方向特征向量的數(shù)據(jù)和用于創(chuàng)建背景凹度特征向量的數(shù)據(jù)之間不直接相關(guān),方法200包括了可以提高準(zhǔn)確率的冗余。冗余能夠利用一種類型向量的準(zhǔn)確性補(bǔ)償另一種類型向量的錯(cuò)誤,無論是前景方向特征向量還是背景凹度特征向量?,F(xiàn)在對(duì)方法200的進(jìn)一步細(xì)節(jié)進(jìn)行描述。
參照?qǐng)D3,根據(jù)本發(fā)明實(shí)施例,展示了劃寫在電子設(shè)備像素面板上的小寫羅馬字母“e”的輸入字符100的另一個(gè)示意圖,其進(jìn)一步描述了用于形成輸入字符100的筆劃方向305。字母“e”是在方法200的步驟205提供字符100的一個(gè)例子,在這里電子設(shè)備接收手寫輸入字符100的表示。利用筆劃方向305,在步驟210,方法200從輸入字符100中根據(jù)本領(lǐng)域內(nèi)所公知的方法提取方向特征向量。例如,首先把輸入字符100的前景像素105對(duì)齊到N×N的網(wǎng)格,并且歸一化,使得輸入字符100的大小與用于創(chuàng)建模型字符方向特征向量的模型字符的大小相等。每個(gè)N×N網(wǎng)格的元素隨后分割成更細(xì)致的網(wǎng)格并隨后進(jìn)行分析獲得前景方向特征向量。前景方向特征向量的一個(gè)例子是8維方向特征向量。8維前景方向特征向量的每一維對(duì)應(yīng)到用來創(chuàng)建輸入字符100的筆劃方向305。參照?qǐng)D4,展示八筆劃方向305可以通過以45度增量分割圓周而產(chǎn)生。本領(lǐng)域技術(shù)人員將明白,根據(jù)本發(fā)明,對(duì)于前景方向特征向量,可以應(yīng)用更多或更少的維數(shù)。含有從手寫筆劃而來的前景像素105的每個(gè)網(wǎng)格元素隨后根據(jù)元素內(nèi)最接近真實(shí)筆劃的方向指定為八方向305之一。網(wǎng)格元素的方向維數(shù)隨后累加在一起形成方向特征向量。
一個(gè)8維方向特征向量可以定義為V={v1,v2,v3,v4,v5,v6,v7,v8},其中vi的值是網(wǎng)格中第i方向維的計(jì)數(shù),其中{1≤i≤8}。隨后平均N×N網(wǎng)格的每個(gè)元素中所有的8維方向特征向量。最后為整個(gè)輸入字符得到8×N×N維的方向特征向量。
隨后,在方法200的步驟215,從背景像素110中提取背景凹度特征向量。步驟215進(jìn)一步參照?qǐng)D5-7進(jìn)行解釋。參考圖5再次展示了劃寫在像素輸入板上的小寫羅馬字母“e”形式的輸入字符100的示意圖。歸一化步驟通過定義輸入字符周圍的邊緣矩形505來確定包圍輸入字符100的區(qū)域,如下將會(huì)詳細(xì)描述。邊緣矩形505中的背景像素110,例如顯示在圖5中的像素110“q”和“p”,隨后分析如下。
前景像素105的搜索開始于每個(gè)背景像素110并且從每個(gè)背景像素110向四個(gè)方向延伸,直到達(dá)到邊緣矩形505或達(dá)到前景像素105。稱為福里曼(Freeman)方向的四方向搜索可以分別標(biāo)為0、1、2和3,如圖6所示。前景像素105所在的福里曼方向編號(hào)隨后給出了背景像素110位于由前景像素105定義的閉合邊緣內(nèi)的大致范圍。這樣的近似稱為凹度度量,并且凹度的位置和范圍可以充分地應(yīng)用于字符識(shí)別。也就是說,輸入字符100凹度特征的度量可以與模型字符模板的凹度特征的度量進(jìn)行比較來確定是否存在匹配。
根據(jù)本發(fā)明,背景凹度特征向量定義了輸入字符100的凹度度量。參照?qǐng)D7,描述了圖5中所示輸入字符100的背景凹度特征向量的表。表中最下邊一行710為表中的每列設(shè)定唯一的數(shù)字,其中每列表示定義從背景像素110的搜索結(jié)果的唯一可能排列。最頂一行715包括從每個(gè)背景像素110的搜索期間到達(dá)前景像素105的方向的個(gè)數(shù)。第三行720隨后確定不能夠到達(dá)任何前景像素105的方向。最后,第二行725是對(duì)于每個(gè)滿足第一行715定義和第三行720定義的背景像素110的計(jì)數(shù)器。
例如,圖5中從標(biāo)為“q”的背景像素110向四個(gè)方向延伸的搜索在兩個(gè)方向,方向1和2上到達(dá)前景像素105。這樣搜索在另外兩個(gè)方向3和0上沒有到達(dá)前景像素。這樣行710中的排列3定義了像素“q”并且行725中相關(guān)聯(lián)的計(jì)數(shù)器加一。類似地,圖5中標(biāo)為“p”的背景像素110在三個(gè)方向,方向0、2和3上到達(dá)前景像素105。這樣搜索沒有到達(dá)前景像素105的剩下方向1。因此行710中的排列5定義了像素“p”,并且它在725行的相關(guān)計(jì)數(shù)器加1。
進(jìn)行從背景像素110的搜索之前,輸入字符100圖像在邊界矩形505內(nèi)部的分辨率優(yōu)選地降低。這樣分辨率的降低減少了邊界矩形505內(nèi)背景像素110的數(shù)量并且從而加快了搜索的過程。由于背景像素110的數(shù)量通常比前景像素105的數(shù)量大很多,縮減圖像分辨率不會(huì)顯著地降低背景凹度特征向量的質(zhì)量。
方法200的步驟215中提取背景凹度特征向量之后,背景凹度特征向量依照本領(lǐng)域所公知的模板匹配處理與模型字符模板進(jìn)行比較。
現(xiàn)在參照?qǐng)D8,根據(jù)本發(fā)明的實(shí)施例,展示了手寫識(shí)別方法200第一部分更多細(xì)節(jié)描述的廣義流程圖。在步驟205接收手寫輸入字符100之后,方法200繼續(xù)到步驟805,在這里對(duì)字符100重新采樣來消除重復(fù)像素并且歸一化像素密度中的任何不規(guī)則。例如,這樣的不規(guī)則可以在一個(gè)時(shí)間間隔內(nèi)書寫速度較快,得到較少的前景像素105;在另一時(shí)間間隔內(nèi)減慢,得到較多的前景像素105時(shí)出現(xiàn)。本領(lǐng)域所公知的再采樣技術(shù),例如強(qiáng)制最小化兩個(gè)數(shù)據(jù)點(diǎn)之間歐幾里得距離的等距離再采樣技術(shù),使得前景像素105均勻地分布。這樣的均勻分布可以提高本發(fā)明的字符識(shí)別正確率。
隨后,在步驟810,把附加的預(yù)處理技術(shù)應(yīng)用到接收的輸入字符100。包括平滑、去噪和大小歸一化過程。這樣的預(yù)處理也增加了輸入字符100的一致性,這帶來了更好的字符識(shí)別結(jié)果。
方法200隨后繼續(xù)到步驟815,在這里輸入字符對(duì)齊到N×N的網(wǎng)格。在步驟820,定義并且提取一個(gè)8維的方向特征向量。隨后,在步驟825,減小輸入字符100的圖像分辨率,從而降低背景像素110的數(shù)量,為提取背景凹度特征向量做準(zhǔn)備。如上所述,在步驟830,為提取背景凹度特征向量,從每個(gè)背景像素110進(jìn)行搜索。
參照?qǐng)D9,展示了圖8中方法200后繼的廣義流程圖。在步驟935,前景方向特征向量與模型字符模板進(jìn)行比較。這個(gè)步驟稱為前景特征分類。隨后在步驟940提供候選字符的第一短列表,包括前景方向特征向量和模型候選字符模板之間的第一向量距離(d1)。向量之間距離可以基于,例如,歐幾里得距離或街區(qū)距離(city-block distance)。隨后對(duì)背景凹度特征向量完成類似的過程。在步驟945背景凹度特征向量與模型字符模板進(jìn)行比較。這個(gè)步驟叫做背景特征分類。隨后在步驟950提供候選字符的第二短列表,包括背景凹度特征向量和模型候選字符模板之間的第二向量距離(d2)。
在步驟955,第一向量距離(d1)和第二向量距離(d2)根據(jù)以下公式合并dcomb=W1*d1+W2*d2如下所述,這里dcomb是用于確定手寫識(shí)別系統(tǒng)最后所用匹配候選字符的加權(quán)向量距離。W1和W2是基于同背景特征分類比較時(shí)前景特征分類的相對(duì)表現(xiàn),使用經(jīng)驗(yàn)數(shù)據(jù)所確定的權(quán)重系數(shù)。通常W1+W2=1。兩個(gè)分類步驟的相對(duì)表現(xiàn)取決于例如輸入字符100的字母表(例如,羅馬字、中文、日文等等)以及個(gè)人的書寫風(fēng)格的不同。這樣本發(fā)明的特定實(shí)施例可以自動(dòng)地確定權(quán)重系數(shù)W1和W2,作為本發(fā)明方法調(diào)整個(gè)人用戶書寫習(xí)慣的迭代學(xué)習(xí)過程的一部分。
最后,在步驟960,方法200在提供匹配候選字符后完成。依照特定的手寫識(shí)別系統(tǒng)的需要,在步驟960提供單個(gè)候選字符或一些候選字符的列表。
參照?qǐng)D10,展示可以用于實(shí)現(xiàn)上述本發(fā)明方法的移動(dòng)電話151的示意圖。電話151包括無線射頻通信單元152,連接于處理器153并與之通信。顯示屏155、鍵盤156和輸入板169形式的輸入接口同樣在連接于處理器153并與之通信。本領(lǐng)域技術(shù)人員將意識(shí)到,輸入板169可以集成到電話151另外的部分,例如顯示屏155。用戶隨后可以通過在顯示屏155上劃寫字符來輸入手寫文本。
處理器153包括帶有用于存儲(chǔ)數(shù)據(jù)的相關(guān)編碼只讀存儲(chǔ)器(ROM)的編碼/解碼器161,存儲(chǔ)的數(shù)據(jù)用于編解碼通過移動(dòng)電話151傳輸或接收的聲音或其它信號(hào)。處理器153還包括通過公用數(shù)據(jù)和地址總線167連接到編/解碼器161以及相關(guān)字符只讀存儲(chǔ)器(ROM)164的微處理器163,隨機(jī)存取存儲(chǔ)器(RAM)154,靜態(tài)可編程存儲(chǔ)器166,和可移除的SIM模塊168。所述靜態(tài)可編程存儲(chǔ)器166和SIM模塊168可以存儲(chǔ)模型字符特征向量和通過使用輸入板169輸入的輸入字符表示。
射頻通信單元152是合并的帶有公用天線157的接收器和傳輸器。通信單元152擁有通過射頻放大器159連接到天線157的收發(fā)器158。收發(fā)器158同樣連接到用于連接通信單元152和處理器153的復(fù)合調(diào)制/解調(diào)器160。
微處理器163擁有用于連接到例如鍵盤156、屏幕155和輸入板169的端口。如上所述,字符只讀存儲(chǔ)器164存儲(chǔ)用于對(duì)使用例如筆、輸入筆或手指寫在輸入面板169上的手寫字符表示進(jìn)行手寫識(shí)別的編碼。
電話151的用戶從而可以在輸入板169上書寫一個(gè)或多個(gè)字符,并且電話151將把字符保存在隨機(jī)存取存儲(chǔ)器(RAM)154、靜態(tài)可編程存儲(chǔ)器166和/或可移除SIM模塊168當(dāng)中。隨后電話151的用戶可以發(fā)布一個(gè)命令,例如利用鍵盤156,請(qǐng)求通過使用輸入板169輸入的手寫字符得到識(shí)別。
識(shí)別手寫字符的命令可以由微處理器163處理。利用存在代碼ROM當(dāng)中的編碼,微處理器163將隨后執(zhí)行如上所述的本發(fā)明方法200,來為每一個(gè)輸入字符通過模型字符模板與前景方向特征向量和背景凹度特征向量的比較而確定至少一個(gè)匹配的候選字符。按照特定系統(tǒng)的要求,微處理器163隨后可以執(zhí)行進(jìn)一步的基于識(shí)別輸入字符的命令。這樣進(jìn)一步的命令可以包括,例如,傳輸包括所識(shí)別輸入字符的文本信息或輸入包括所識(shí)別輸入字符的地址簿信息。
因此,本發(fā)明是一種用于識(shí)別劃寫在電子設(shè)備用戶接口上的手寫字符的改進(jìn)方法和系統(tǒng)。由于用于創(chuàng)建前景方向特征向量的數(shù)據(jù)和用于創(chuàng)建背景凹度特征向量的數(shù)據(jù)之間不直接相關(guān),方法200包括獨(dú)立并且冗余的、使得準(zhǔn)確率提高的度量。獨(dú)立的度量可以使得通過一種類型的特征向量的準(zhǔn)確性使另一種類型的特征向量的錯(cuò)誤得到補(bǔ)償,無論是在前景方向特征向量中還是在背景凹度特征向量中。通過分析與輸入字符100相關(guān)聯(lián)的前景方向特征向量和背景凹度特征向量,本發(fā)明增加了輸入字符100識(shí)別正確的可能性。
上面的詳細(xì)說明只是為了提供優(yōu)選的示范實(shí)施例,而并不想限制本發(fā)明的范圍、適用性或結(jié)構(gòu)。對(duì)優(yōu)選示范實(shí)施例的詳細(xì)說明是為了向本領(lǐng)域技術(shù)人員提供一個(gè)使其能夠?qū)崿F(xiàn)本發(fā)明的優(yōu)選實(shí)施例的說明。應(yīng)該可以理解,在不背離所附權(quán)利要求中所闡述的本發(fā)明的精神和范圍的前提下,可以對(duì)組件及步驟的功能和結(jié)構(gòu)做出多種不同的改變。
權(quán)利要求
1.一種手寫識(shí)別的方法,包括如下步驟接收劃寫在電子設(shè)備用戶接口上的手寫輸入字符表示,所述輸入字符由用戶接口上與背景像素相鄰的前景像素所定義;從前景像素提取前景方向特征向量;從背景像素提取背景凹度特征向量;和通過前景方向特征向量和背景凹度特征向量與模型字符模板的比較來確定匹配候選字符。
2.如權(quán)利要求1所述的方法,進(jìn)一步包括通過采用平滑、去噪和大小歸一化處理進(jìn)行手寫輸入字符預(yù)處理的步驟。
3.如權(quán)利要求1所述的方法,其中,所述的確定匹配候選字符的步驟進(jìn)一步包括如下步驟通過比較前景方向特征向量和模型字符模板提供候選字符第一短列表和對(duì)應(yīng)第一向量距離(d1);通過比較背景凹度特征向量和模型字符模板提供候選字符第二短列表和對(duì)應(yīng)第二向量距離(d2);和按照下面公式合并第一向量距離(d1)和第二向量距離(d2)dcomb=W1*d1+W2*d2其中dcomb是加權(quán)向量距離,W1和W2是經(jīng)驗(yàn)權(quán)重系數(shù),并且W1+W2=1;其中,前景方向特征向量和背景凹度特征向量利用權(quán)重向量距離dcomb與模型字符模板進(jìn)行比較。
4.如權(quán)利要求1所述的方法,進(jìn)一步包括在從背景像素提取背景凹度特征向量之前縮小手寫輸入字符表示的大小的步驟。
5.如權(quán)利要求1所述的方法,其中,所述的從背景像素提取背景凹度特征向量的步驟包括從每個(gè)背景像素出發(fā)向四個(gè)方向搜索前景像素。
6.如權(quán)利要求1所述的方法,其中,所述模型字符模板包括來自大量輸入采樣的方向特征向量的統(tǒng)計(jì)平均值。
7.如權(quán)利要求1所述的方法,進(jìn)一步包括步驟對(duì)輸入字符進(jìn)行再采樣來消除重復(fù)像素并歸一化像素密度中的不規(guī)則。
8.如權(quán)利要求3所述的方法,其中,所述經(jīng)驗(yàn)權(quán)重系數(shù)W1和W2是在基于電子設(shè)備個(gè)人用戶的書寫習(xí)慣的迭代學(xué)習(xí)過程中確定的。
9.一種用于手寫識(shí)別的系統(tǒng),包括微處理器;有效連接于所述微處理器的只讀存儲(chǔ)器(ROM);有效連接于所述微處理器的可編程存儲(chǔ)器;和有效連接于所述微處理器的輸入板;所述微處理器有效地執(zhí)行存儲(chǔ)在ROM中的代碼來接收劃寫在輸入板上的手寫輸入字符表示,所述輸入字符由背景像素附近的前景像素確定,從前景像素中提取前景方向特征向量,從背景像素中提取背景凹度特征向量,通過前景方向特征向量和背景凹度特征向量與模型字符模板的比較來確定匹配候選字符。
10.如權(quán)利要求9所述的方法,其中,所述微處理器進(jìn)一步有效地對(duì)手寫輸入字符通過執(zhí)行平滑、去噪和大小歸一化處理來進(jìn)行預(yù)處理。
11.如權(quán)利要求9所述的方法,其中,在所述微處理器確定匹配候選字符時(shí),其進(jìn)一步通過比較前景方向特征向量和模型字符模板提供候選字符第一短列表和對(duì)應(yīng)的第一向量距離(d1),通過比較背景凹度特征向量和模型字符模板提供候選字符第二短列表和對(duì)應(yīng)的第二向量距離(d2),根據(jù)如下公式合并第一向量距離(d1)和第二向量距離(d2)dcomb=W1*d1+W2*d2,其中dcomb是加權(quán)向量距離,W1和W2是經(jīng)驗(yàn)權(quán)重系數(shù),并且W1+W2=1,其中前景方向特征向量和背景凹度特征向量利用權(quán)重向量距離dcomb與模型字符模板進(jìn)行比較。
12.如權(quán)利要求9所述的系統(tǒng),其中,在從背景像素提取背景凹度特征向量之前,所述微處理器進(jìn)一步縮小手寫輸入字符表示的大小。
13.如權(quán)利要求9所述的系統(tǒng),其中,當(dāng)所述微處理器從背景像素中提取背景凹度特征向量時(shí),其進(jìn)一步從每個(gè)背景像素出發(fā)向四個(gè)方向?qū)η熬跋袼剡M(jìn)行搜索。
14.如權(quán)利要求9所述的系統(tǒng),其中,所述模型字符模板包括來自大量輸入采樣的方向特征向量的統(tǒng)計(jì)平均值。
15.如權(quán)利要求9所述的系統(tǒng),其中,所述微處理器對(duì)輸入字符進(jìn)行再采樣來消除重復(fù)像素并歸一化像素密度中的不規(guī)則。
16.如權(quán)利要求11所述的系統(tǒng),其中,所述經(jīng)驗(yàn)權(quán)重系數(shù)W1和W2是在基于電子設(shè)備個(gè)人用戶的書寫習(xí)慣的迭代學(xué)習(xí)過程中確定的。
全文摘要
一種利用背景像素的手寫識(shí)別方法和系統(tǒng),其利用輸入字符(100)獨(dú)立且冗余的特征度量得到準(zhǔn)確率的提高。系統(tǒng)包括微處理器(163),有效連接于微處理器(163)的只讀存儲(chǔ)器(ROM)(154),有效連接于微處理器(163)的可編程存儲(chǔ)器(166),和有效連接于微處理器(163)的輸入面板(169)。所述微處理器(163)有效執(zhí)行存儲(chǔ)在ROM(154)中的編碼來接收(步驟205)劃寫在輸入面板(169)上的手寫輸入字符(100)的表示,輸入字符(100)由與背景像素(110)相鄰的前景像素(105)定義,從前景像素(105)提取(步驟210)前景方向特征向量,從背景像素(110)提取(步驟215)背景凹度特征向量,并且通過對(duì)前景方向特征向量和背景凹度特征向量與模型字符模板的比較來確定(步驟220)匹配的候選字符。
文檔編號(hào)G06K9/72GK1725228SQ20041005443
公開日2006年1月25日 申請(qǐng)日期2004年7月22日 優(yōu)先權(quán)日2004年7月22日
發(fā)明者郭豐俊, 葛勇, 鎮(zhèn)立新 申請(qǐng)人:摩托羅拉公司