專利名稱:分解手寫(xiě)體輸入的方法
技術(shù)領(lǐng)域:
本發(fā)明部分地涉及到一較早遞交的申請(qǐng),“手寫(xiě)體輸入的識(shí)別方法”(序號(hào)no.08/,May 10,1994),這里引用作為參考。
本發(fā)明總的說(shuō)是關(guān)于手寫(xiě)體識(shí)別,較具體點(diǎn)說(shuō)是關(guān)于手寫(xiě)體輸入的獨(dú)立的連續(xù)線段的選擇輸入和編輯。
人類手寫(xiě)體的機(jī)器識(shí)別是一個(gè)非常困難的問(wèn)題,而且隨著當(dāng)今筆式輸入的計(jì)算裝置的蓬勃發(fā)展,已成為需要解決的一重要問(wèn)題。人類手寫(xiě)體的機(jī)器識(shí)別具有各種不同的現(xiàn)實(shí)應(yīng)用。
人類手寫(xiě)體機(jī)器識(shí)別的流行應(yīng)用的一個(gè)舉例是個(gè)人數(shù)字助理,例如Newton產(chǎn)品及其他類型的筆輸入計(jì)算裝置。一般這種形式的產(chǎn)品都帶有一用戶可在其上面進(jìn)行手寫(xiě)輸入的觸感屏幕。這些裝置的功能即是將手寫(xiě)的輸入,例如字母數(shù)字輸入,加以數(shù)字化,然后進(jìn)行為辯認(rèn)手寫(xiě)體的信息內(nèi)容而對(duì)輸入的處理。
根據(jù)一現(xiàn)有的手寫(xiě)體識(shí)別技術(shù),人們順序?qū)γ恳蛔帜笖?shù)字本身作出最佳確認(rèn),最后作為識(shí)別過(guò)程的結(jié)果取得一字符串。這種方法具有很多缺點(diǎn)。一種障礙就在于難以辯別候選輸入(在這種情況下為欲予識(shí)別的字母數(shù)字字符)的空間邊界。在這些邊界定位不準(zhǔn)確時(shí),就不可能正確識(shí)別字符,因?yàn)檫@將成為要不是缺少部段,要不是就會(huì)混合進(jìn)相鄰字符的不相干部分。
人類手寫(xiě)體機(jī)器識(shí)別的一個(gè)主要問(wèn)題是識(shí)別一個(gè)輸入的結(jié)束和下一輸入的開(kāi)始的能力。例如,一個(gè)重要問(wèn)題在于判定一手寫(xiě)的輸入線段、單詞、或字母數(shù)字輸入的結(jié)尾,以區(qū)別于隨后的手寫(xiě)的輸入線段、單詞、或字母輸入的起始。手寫(xiě)輸入識(shí)別不佳將導(dǎo)致手寫(xiě)輸入的信息內(nèi)容的惡劣的、錯(cuò)誤的解釋。這一問(wèn)題因用戶或輸入裝置的不良的輸入習(xí)慣,例如不好的文體或手寫(xiě)習(xí)慣,而更為嚴(yán)重。手寫(xiě)輸入的機(jī)器識(shí)別有可能不正確地將手寫(xiě)輸入的一個(gè)或多個(gè)線段合并成一個(gè)線段,而將它們象一單個(gè)獨(dú)立的線段那樣來(lái)識(shí)別它們。換句話說(shuō),一個(gè)用戶可能感到有必要在這些線段已被象一單個(gè)獨(dú)立的手寫(xiě)輸入線段輸入之后將其分解成一個(gè)或多個(gè)手寫(xiě)輸入線段。
因而,需要有一種手寫(xiě)體識(shí)別技術(shù),使用戶或輸入裝置能輸入一選擇輸入編輯指令,該指令讓用戶或輸入裝置能分開(kāi)一或多個(gè)連續(xù)線段以形成用于和顯示的一或多個(gè)獨(dú)立的相接觸的線段,并以此得到該手寫(xiě)輸入的信息內(nèi)容的較正確的解釋。
對(duì)附圖的粗略說(shuō)明。
圖1表明按照本發(fā)明一優(yōu)選實(shí)施例的操作的流程圖;圖2表明按照本發(fā)明一優(yōu)選實(shí)施例的說(shuō)明性顯示的圖形;圖3表明按照本發(fā)明一優(yōu)選實(shí)施例的說(shuō)明性顯示的圖形;圖4表明按照本發(fā)明一優(yōu)選實(shí)施例的說(shuō)明性顯示的圖形;圖5表明按照本發(fā)明一優(yōu)選實(shí)施例的說(shuō)明性顯示的圖形;圖6表明按照本發(fā)明一優(yōu)選實(shí)施例的說(shuō)明性顯示的圖形;和圖7表明按照本發(fā)明一優(yōu)選實(shí)施例的說(shuō)明性顯示的圖形。
總的說(shuō),本發(fā)明所揭示的是為用戶提供選擇編輯手寫(xiě)輸入的靈活性,使用戶可選定將一或多個(gè)連續(xù)的線段,或多組墨跡,分開(kāi)以形成一或多個(gè)獨(dú)立的相接觸的線段。然后被分開(kāi)的獨(dú)立線段被用作為個(gè)別獨(dú)立的接觸的線段來(lái)顯示,并被作為個(gè)別的獨(dú)立線段由用于接收手寫(xiě)輸入的裝置,例如Personal Digital Assistant(個(gè)人數(shù)字助理,PDA),所采用的手寫(xiě)輸入機(jī)器識(shí)別方法加以分析。然后向用戶顯示作為結(jié)果的個(gè)別的獨(dú)立線段的識(shí)別。
在本發(fā)明的一優(yōu)選實(shí)施例中,手寫(xiě)輸入為字母數(shù)字,書(shū)寫(xiě)軸線為水平,并且書(shū)寫(xiě)方向由左向右。按照此優(yōu)選實(shí)施例,手寫(xiě)輸入和作為結(jié)果的識(shí)別被同時(shí)加以顯示并互相緊密鄰近。這種緊密接近使用戶在糾正處理和識(shí)別手寫(xiě)輸入中的誤差時(shí)對(duì)照它們的原始手寫(xiě)輸入。
一般,由用戶提取手寫(xiě)字符輸入是以獨(dú)立的接續(xù)線段形式進(jìn)行的。一獨(dú)立的接續(xù)線段由一或多個(gè)筆劃組成,這里一筆劃是指在筆與一輸入裝置(例如一數(shù)字化板或紙)相接觸期間留下的標(biāo)記。一筆劃顯現(xiàn)為一系列由輸入裝置以大致規(guī)律的間隔采樣得的點(diǎn)。每一點(diǎn)至少由一X坐標(biāo)和一Y坐標(biāo)描述。筆劃可采用一數(shù)字化板作電子俘獲,或者在另一實(shí)施例中通過(guò)圖象中的行檢測(cè)過(guò)程由一被掃描或摹寫(xiě)的圖象推演得到。這樣的電子式俘獲輸入的方法均是本技術(shù)領(lǐng)域內(nèi)已知的。
在本發(fā)明中,一或多個(gè)獨(dú)立的接續(xù)線段是有待識(shí)別的手寫(xiě)輸入單位??捎呻娮臃@的手寫(xiě)輸入包括(但并不僅限于)下列這些手寫(xiě)輸入;電子輸入;通過(guò)壓力俘獲的輸入,例如壓印輸入;由電子方法接收到的輸入,例如通過(guò)傳真,尋呼機(jī),等。為對(duì)本發(fā)明進(jìn)行說(shuō)明,手寫(xiě)輸入一般是沿書(shū)寫(xiě)軸的,其方向可稱為書(shū)寫(xiě)方向。此書(shū)寫(xiě)軸為一直線,手寫(xiě)輸入沿此直線加入。書(shū)寫(xiě)方向是隨后加入手寫(xiě)輸入部分的方向。例如,在英語(yǔ)中手寫(xiě)輸入通常是順著一水平書(shū)寫(xiě)軸加入的,每一隨后的字母數(shù)字輸入以自左向右的書(shū)寫(xiě)方向水平地跟隨在前一輸入的后面。按照本發(fā)明的原理亦可能實(shí)現(xiàn)其他各種不同的書(shū)寫(xiě)軸和書(shū)寫(xiě)方向的替換。
在一優(yōu)選實(shí)施例中,書(shū)寫(xiě)軸為水平的,手寫(xiě)輸入形成一系列單詞。在這一優(yōu)選實(shí)施例中,連續(xù)的獨(dú)立線段水平地自左向右輸入。在另一優(yōu)選實(shí)施例中,書(shū)寫(xiě)軸為水平的,而手寫(xiě)輸入形成一系列分開(kāi)的字符,它們可能是字母數(shù)字字符,如在漢語(yǔ)中的表意字符,或其他形式的書(shū)寫(xiě)通訊字符或符號(hào)。在這一替換實(shí)施例中,其輸出表明獨(dú)立的接續(xù)線段是否屬于分開(kāi)的字符。在另一優(yōu)選實(shí)施例中,書(shū)寫(xiě)軸為垂直的,手寫(xiě)輸入形成一系列分開(kāi)的字符,這些字符可以是字母數(shù)字字符,表意字符,或其他手寫(xiě)輸入。在這一優(yōu)選實(shí)施例中,書(shū)寫(xiě)軸是垂直的,其輸出表明獨(dú)立的接續(xù)線段是否屬于分開(kāi)的字符,在另一優(yōu)選實(shí)施例中,書(shū)寫(xiě)軸是垂直的,手寫(xiě)輸入形成一系列分開(kāi)的單詞,字母數(shù)字輸入,或其他的手寫(xiě)輸入,例如一垂直的單詞或數(shù)字表。在這一實(shí)施例中,書(shū)寫(xiě)軸是垂直的而其輸出表明獨(dú)立的接續(xù)線段是否屬于分開(kāi)的手寫(xiě)輸入,如分開(kāi)的單詞。
如上面揭示的和進(jìn)一步討論的,本發(fā)明通過(guò)揭示數(shù)個(gè)優(yōu)選實(shí)施例來(lái)證明,書(shū)寫(xiě)軸可以取任何角度,并且手寫(xiě)輸入可被更普遍地解釋為對(duì)應(yīng)于含有一或多個(gè)獨(dú)立的接續(xù)線段的獨(dú)立元素(包括但不限于字符和單詞)。將這里所描述的方法應(yīng)用于任一個(gè)不同的優(yōu)選實(shí)施例,僅需改變所用的坐標(biāo)系統(tǒng),而且這種改變可以按照所介紹的技術(shù)來(lái)實(shí)現(xiàn)。
現(xiàn)在參見(jiàn)附圖,一個(gè)人數(shù)字助理(PDA)總體用標(biāo)號(hào)100來(lái)表示。所述的PDA 100構(gòu)成一通用的表示,可以由例如一NewTon或其他筆輸入計(jì)算裝置來(lái)實(shí)現(xiàn)。這種裝置通常包括一機(jī)殼和一觸模屏幕,在此屏幕上可利用一恰當(dāng)?shù)氖殖止P尖或其他輸入設(shè)備手寫(xiě)輸入例如單詞。這樣的PDA和筆輸入計(jì)算裝置一般包含有一個(gè)或多個(gè)微處理器或其他數(shù)字處理裝置。這些裝置包括可按照這里提出的技術(shù)內(nèi)容方便地編程的計(jì)算平臺(tái)。應(yīng)當(dāng)理解,雖然這種個(gè)人數(shù)字助理和筆輸入計(jì)算裝置包括適用于實(shí)現(xiàn)申請(qǐng)人發(fā)明思想的簡(jiǎn)易平臺(tái),而為實(shí)現(xiàn)這里提出的內(nèi)容也可以在許多其他的操作環(huán)境下進(jìn)行。這類環(huán)境的某些例子包括有帶有數(shù)字化屏幕、或連接到一數(shù)字輸入表面、或能接收摹寫(xiě)的或掃描圖象輸入的計(jì)算機(jī),數(shù)字或交互式電視,調(diào)制解調(diào)器,尋呼機(jī),或其他具有俘獲手寫(xiě)輸入并處理它的能力的系統(tǒng)。
現(xiàn)在參見(jiàn)圖1,說(shuō)明本發(fā)明的一優(yōu)選實(shí)施方法。本發(fā)明可用于一或多個(gè)連續(xù)的線段的手寫(xiě)輸入。本發(fā)明的優(yōu)選實(shí)施例能適用于在一連續(xù)線段中具有二個(gè)或更多筆劃的手寫(xiě)輸入。采用字母數(shù)字輸入的三個(gè)連續(xù)的線段S1、S2和S3僅只是為了說(shuō)明的目的。為說(shuō)明而將S1、S2和S3分別表示為Sn,Sn+1和Sn+2。在圖1至圖7中描述的優(yōu)選方法中,由一輸入裝置,例如一個(gè)人數(shù)字助理100或其他能俘獲手寫(xiě)輸入的裝置,接收由一或多個(gè)連續(xù)的線段構(gòu)成的手寫(xiě)輸入。此手寫(xiě)輸入由在此輸入裝置上執(zhí)行的手寫(xiě)體識(shí)別方法進(jìn)行分析,以得到識(shí)別(115),在這一實(shí)施例中為代表該對(duì)應(yīng)手寫(xiě)書(shū)入的字母數(shù)字。按照這一優(yōu)選實(shí)施例,對(duì)此連續(xù)線段S1、S2和S3的識(shí)別被顯示給用戶(120)。最好,此S1、S2和S3的識(shí)別被顯示在緊靠著原始手寫(xiě)輸入S1、S2和S3的數(shù)字化顯示的鄰近。一旦顯示該識(shí)別(120),用戶可選擇輸入或編輯(125)所顯示的S1、S2和S3的識(shí)別(120)。如果用戶或輸入裝置不進(jìn)入一選擇輸入,就對(duì)手寫(xiě)輸入的一或多個(gè)連續(xù)的線段S1、S2和S3顯示其識(shí)別(結(jié)果)(130)。但如果選擇輸入為一分解命令,或指令,就按每一線段中的筆劃來(lái)分析連續(xù)的線段S1、S2和S3,并依據(jù)該筆劃分析是否指出在此相接續(xù)的線段S1、S2和S3之間存在有間隙而將它們分成一或多個(gè)獨(dú)立的線段。最好,在接收到分解指令后按照各線段S1、S2、和S3的筆劃T對(duì)連續(xù)的線段S1、S2和S3進(jìn)行語(yǔ)法分析(見(jiàn)圖2~7)。最好按時(shí)間順序列舉這些筆劃,亦即按用戶輸入它們的順序,或輸入裝置接收它們的順序。這一順序不一定是它們沿著書(shū)寫(xiě)軸出現(xiàn)的順序。例如,如果書(shū)寫(xiě)軸為從左到右,一被首先寫(xiě)入的筆劃Tn有可能出現(xiàn)在一筆劃Tn+1之后。例如,草體字母“i”的向上的筆劃可以是筆劃Tn,而“i”的“點(diǎn)”的筆劃則是Tn+1,它可能在一書(shū)寫(xiě)軸上出現(xiàn)在筆劃Tn之前。
在本發(fā)明的優(yōu)選實(shí)施例中,一旦連續(xù)線段S1、S2和S3經(jīng)語(yǔ)法分析成為它們各自的筆劃后,就產(chǎn)生一連續(xù)線段S1、S2和S3各筆劃與所有其他筆劃之間存在的最小間隙的映象(135)并將其記錄下來(lái)。對(duì)于每一筆劃在此映象上都記錄有一個(gè)值。這一所記錄的值是對(duì)于該筆劃與線段S1、S2和S3的每一其他筆劃相比較所看到的該最小間隙的最大值。如圖1中所示(140),值Z被加以記錄,因?yàn)樗撬吹綄?duì)應(yīng)于連續(xù)線段S1、S2和S3的一特定筆劃Tn與所有其它筆劃Tn+/-1…之間存在的最小間隙的值中的最大的值。值Z的圖示說(shuō)明如圖2~7所示。如果第一筆劃Z值均小于零,就可斷定該連續(xù)的線段S1、S2和S3為一單一的連續(xù)線段,而將其向用戶或輸入裝置顯示,如步驟130。但如果對(duì)任一筆劃T,Z的值大于零,就將一或多個(gè)連續(xù)線段S1、S2和S3在具有最大值Z的筆劃號(hào)Tx分開(kāi)(150),這里Tx被定義為分解筆劃號(hào)。如果發(fā)現(xiàn)一分解筆劃號(hào),至少產(chǎn)生一獨(dú)立線段Sx(155),這里Sx包含由筆劃T=0至此分解筆劃號(hào)Tx的獨(dú)立的連續(xù)線段。至少產(chǎn)生一第二獨(dú)立線段Sy(160),這里Sy包含由分解筆劃號(hào)加一,Tx+1,至該連續(xù)的線段S1、S2和S3的最后一筆劃Tend的獨(dú)立的連續(xù)線段。根據(jù)本發(fā)明的優(yōu)選實(shí)施例,獨(dú)立的連續(xù)線段Sx和Sy各自均由輸入裝置上執(zhí)行的手寫(xiě)體識(shí)別方法加以分析和識(shí)別為分開(kāi)的各自不同的手寫(xiě)輸入(165)。本發(fā)明的技術(shù)思想可應(yīng)用于多種不同的手寫(xiě)體識(shí)別方法。對(duì)Sx和Sy兩者的識(shí)別均被顯示給用戶或輸入裝置(170)。最好Sx和Sy的識(shí)別被顯示得緊密鄰近于原始手寫(xiě)輸入的連續(xù)線段S1、S2和S3的數(shù)字表示,或者按照獨(dú)立線段Sx和Sy劃分的手寫(xiě)輸入的數(shù)字表示。在當(dāng)Sx和Sy的識(shí)別被顯示時(shí)(170),用戶或輸入裝置可能重復(fù)一選擇輸入分解指令,和在可能時(shí)選擇分解獨(dú)立的線段Sx和Sy。按照本發(fā)明的優(yōu)選方法,用戶可繼續(xù)利用一或多個(gè)選擇輸入指令直到用戶不再選取一分解指令或不再剩有獨(dú)立的連續(xù)線段要分解。
現(xiàn)在參看圖2~7,表明本發(fā)明優(yōu)選實(shí)施例的圖形表示。圖2~4表明一其上面接收到由連續(xù)線段S1、S2和S3構(gòu)成的手寫(xiě)輸入的輸入裝置100。此連續(xù)的線段被識(shí)別為一單個(gè)的連續(xù)線段Sa,并照樣顯示給用戶或輸入裝置。按照本發(fā)明一優(yōu)選實(shí)施例,用戶或輸入裝置請(qǐng)求一選擇輸入。此選擇輸A125為一分解指令,如圖3中所示。圖4表明在連續(xù)線段S1、S2和S3被按照基本上與圖1所描述的方法相同的優(yōu)選方法進(jìn)行語(yǔ)法分析成筆劃和處理之后的獨(dú)立的連續(xù)線段Sx和Sy的識(shí)別和顯示。本發(fā)明的優(yōu)點(diǎn)是在于使用戶或輸入裝置能或者重復(fù)地或者同時(shí)地聯(lián)合分解無(wú)限量的連續(xù)的線段Sn,Sn+/-1,Sn+/-2等,來(lái)形成分開(kāi)的各個(gè)別獨(dú)立線段Sx,Sy等。這就給用戶或輸入裝置提供多種編輯能力。
圖5~7描述與圖1中所述的方法步驟121至188基本相同的一優(yōu)選方法。在這一優(yōu)選實(shí)施例中,連續(xù)線段S1、S2和S3被作語(yǔ)法分析成為筆劃To至Tend。生成了連續(xù)線段S1、S2和S3的各個(gè)筆劃與所有其他筆劃之間的最小間隙的映象。在此映象中記錄每一筆劃的最大值Z(125),這里Z等于由一筆劃與所有其他筆劃之間的最小間隙的值的表所得到的各筆劃的最大值。如果所產(chǎn)生的映象表明Z小于或等于零,就認(rèn)為該連續(xù)線段為一單個(gè)的獨(dú)立手寫(xiě)輸入。這如圖5中所示,連續(xù)線段S1被認(rèn)為是一單個(gè)的獨(dú)立手寫(xiě)輸入,在此例中為一不應(yīng)分開(kāi)的單個(gè)單詞。
但如圖6~7中所示,如果Z的值對(duì)任一筆劃T均大于零,就將此一或多個(gè)連續(xù)線段S1、S2和S3在具有最大值Z的筆劃號(hào)Tx處分割開(kāi)(150),這里Tx被定義為分解筆劃號(hào)。如果發(fā)現(xiàn)一分解筆劃號(hào),就至少產(chǎn)生一獨(dú)立線段Sx(155),這里Sx表示從筆劃T=0到該分解筆劃號(hào)Tx的獨(dú)立的連續(xù)線段。至少產(chǎn)生一第二獨(dú)立線段Sy(160),這里Sy包含從分解筆劃號(hào)加一,Tx+1,到該連續(xù)線段S1、S2和S3的最后筆劃Tend的連續(xù)線段。按照本發(fā)明的優(yōu)選實(shí)施例,獨(dú)立的連續(xù)線段Sx和Sy各自由輸入裝置上所執(zhí)行的手寫(xiě)體識(shí)別方法進(jìn)行分析,和被識(shí)別為分開(kāi)的各自不同的手寫(xiě)輸入(165)。Sx和Sy兩者的識(shí)別均被顯示給用戶或輸入裝置(170)。
對(duì)本技術(shù)領(lǐng)域的熟悉人士將是很顯然的,即所揭示的發(fā)明可以很多方式加以變型,并可設(shè)想除上面特別提出和敘述的優(yōu)選形式外有許多實(shí)施例。因此,所列的權(quán)利要求將用來(lái)概括在本發(fā)明的實(shí)質(zhì)內(nèi)容和范疇之內(nèi)的所有對(duì)發(fā)明的變型及其等同物。
權(quán)利要求
1.一種便于識(shí)別手寫(xiě)體輸入的方法,包括步驟接收包括相應(yīng)于原始手寫(xiě)體輸入的連續(xù)線段的一系列數(shù)據(jù)點(diǎn)的電子數(shù)據(jù);和相應(yīng)于原始手寫(xiě)體輸入的所識(shí)別的字符;顯示所識(shí)別的單詞;接收用戶的選擇輸入;接收包括一分解指令的用戶輸入;在接收到該分解指令后,對(duì)一系列數(shù)據(jù)點(diǎn)進(jìn)行語(yǔ)法分析,使其成為一系列筆劃;為每筆劃的每一最小間隙值相對(duì)于每一其他筆劃產(chǎn)生一最大值映象;在產(chǎn)生的一值大于零時(shí),在分解筆劃號(hào)Tx處分解一個(gè)或多個(gè)連續(xù)的線段,其中所述分解筆劃號(hào)具有所有筆劃中的最大值;產(chǎn)生至少一個(gè)包括從筆劃To至分解筆劃號(hào)Tx的獨(dú)立的連續(xù)線段Sx;產(chǎn)生至少一個(gè)包括從分解筆劃號(hào)加1 Tx+1至最后一筆劃Tend的獨(dú)立的連續(xù)線Sy;接收相應(yīng)于獨(dú)立連續(xù)線段Sx和Sy的所識(shí)別單詞;和顯示相應(yīng)于獨(dú)立連續(xù)段Sx和Sy的所識(shí)別的單詞。
全文摘要
本發(fā)明為用戶提供對(duì)編輯手寫(xiě)輸入的選項(xiàng),使用戶可選擇地對(duì)一或多個(gè)連續(xù)的線段或一組墨跡進(jìn)行分解,以形成一或多個(gè)獨(dú)立的連續(xù)線段。然后將被分解的獨(dú)立線段當(dāng)作為個(gè)別的獨(dú)立的線段,由一用來(lái)接收手寫(xiě)輸入的裝置所運(yùn)行的手寫(xiě)輸入的機(jī)器識(shí)別方法作為個(gè)別的獨(dú)立線段進(jìn)行分析。
文檔編號(hào)G06K9/62GK1138909SQ95191223
公開(kāi)日1996年12月25日 申請(qǐng)日期1995年11月14日 優(yōu)先權(quán)日1994年11月14日
發(fā)明者肯內(nèi)斯·古茲克, 約翰·L·C·西伯德 申請(qǐng)人:摩托羅拉公司