亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種面向連續(xù)書寫漢字的、支持交互的漢字輸入系統(tǒng)及方法與流程

文檔序號:11198769閱讀:396來源:國知局
一種面向連續(xù)書寫漢字的、支持交互的漢字輸入系統(tǒng)及方法與流程

本發(fā)明涉及一種漢字的輸入系統(tǒng)及方法。



背景技術(shù):

信息輸入用戶在以重疊或者連寫方式連續(xù)書寫多個漢字時,不同于用戶進行單個漢字字符書寫,書寫時會出現(xiàn)“連筆”、“誤筆”、“筆順錯誤”等等這些不利于輸入法系統(tǒng)識別字符的情況。

“連筆”,通常指前筆畫最末坐標(biāo)與后一筆畫首坐標(biāo)相連,此處定義為用戶書寫時將本應(yīng)該書寫為獨立的兩筆或者兩筆以上的筆畫以相連的一筆的方式書寫的情況?!罢`筆”指本應(yīng)該書寫為這一筆畫的卻書寫為了另一種筆畫?!肮P順錯誤”指書寫漢字時未按照統(tǒng)一規(guī)定的漢字的筆順規(guī)則進行書寫。

由于上述情況的存在,可能導(dǎo)致輸入法輸入識別模型提供的候選字符串中的部分字符并不是用戶所想要的字符。因此,我們希望輸入法能夠通過局部的優(yōu)化算法優(yōu)化軌跡或者筆畫的組合,或者通過用戶的交互干擾進行優(yōu)化選擇,以獲得想要的候選字符。尤其當(dāng)用戶以重疊或者連寫方式連續(xù)書寫很多數(shù)目的漢字時,如果在提交候選字之后利用光標(biāo)選擇并更改多處字符,過程尤為繁瑣。如果只是通過用戶簡單的交互干預(yù)或者輸入法系統(tǒng)的自動優(yōu)化搜索,輸入法就能夠提供想要的候選字符,那么將有效節(jié)省用戶輸入的時間,并提升用戶的輸入體驗。

目前的一些漢字手寫輸入系統(tǒng)在與用戶進行交互時,存在明顯的局限。當(dāng)用戶在書寫漢字時,系統(tǒng)通過漢字識別模型對輸入的漢字進行打分,然后呈現(xiàn)打分最高的漢字或者打分較高的幾個漢字供用戶進行選擇,期望通過這種用戶交互排除錯誤的漢字。但是目前所有的漢字手寫輸入系統(tǒng)或者輸入方法均是以孤立漢字為單位的輸入,這種輸入方式針對于用戶的“連筆”輸入經(jīng)常會出現(xiàn)錯誤,所以目前的手寫輸入系統(tǒng)及方法大多數(shù)都是只適用于于單個漢字的手寫輸入系統(tǒng)或方法。目前也有少數(shù)面向連續(xù)書寫漢字的輸入系統(tǒng)及方法,但是這種針對于連續(xù)書寫的方法一旦出現(xiàn)一個漢字的輸入識別錯誤經(jīng)常會影響到其他輸入漢字的識別?,F(xiàn)有技術(shù)的缺點主要有以下幾點:

第一,在輸入軌跡層面,無法對于書寫筆畫進行干預(yù),無法優(yōu)化輸入的軌跡或者筆畫的組合,以獲得更準(zhǔn)確的候選字符。

第二,在識別層面,對于以重疊書寫的方式連續(xù)書寫多個漢字時會出現(xiàn)的“連筆”、“誤筆”、“筆順錯誤”等不利于輸入法系統(tǒng)識別字符的情況未提供有效的糾正錯誤的方式。

第三,單純的清除錯誤字這一干預(yù)方式較為單一,而且如果書寫的字符數(shù)目長且需要修改的錯處比較多,就會使得用戶的書寫量顯著增加,使得用戶書寫的總用時顯著增加。



技術(shù)實現(xiàn)要素:

本發(fā)明為了解決現(xiàn)有技術(shù)存在的以下問題:

第一,在輸入軌跡層面,無法對于書寫筆畫進行干預(yù),無法優(yōu)化輸入的軌跡或者筆畫的組合,以獲得更準(zhǔn)確的候選字符。

第二,在識別層面,對于以重疊書寫的方式連續(xù)書寫多個漢字時會出現(xiàn)的“連筆”、“誤筆”、“筆順錯誤”等不利于輸入法系統(tǒng)識別字符的情況未提供有效的糾正錯誤的方式。

第三,單純的清除錯誤字這一干預(yù)方式較為單一,而且如果書寫的字符數(shù)目長且需要修改的錯處比較多,就會使得用戶的書寫量顯著增加,使得用戶書寫的總用時顯著增加。

進而提出了一種面向連續(xù)書寫漢字的、支持交互的漢字輸入系統(tǒng)及方法。

一種面向連續(xù)書寫漢字的、支持交互的漢字輸入系統(tǒng),包括:

輸入模塊,用于接收用戶輸入的筆畫軌跡;

采集模塊,用于采集輸入模塊接收用戶輸入的筆畫軌跡,或者采集交互優(yōu)化模塊發(fā)送的錯誤筆畫對應(yīng)替換筆畫的筆畫軌跡;并按照采集密度采集筆畫軌跡上的點,同時記錄點的坐標(biāo);

識別模塊,根據(jù)輸入筆畫軌跡對應(yīng)采集得到的點的集合識別出對應(yīng)的筆畫及筆畫順序,或者根據(jù)替換筆畫的筆畫軌跡對應(yīng)采集得的點的集合識別出對應(yīng)的筆畫,并將其替換錯誤筆畫;并對筆畫及筆畫順序能夠構(gòu)成的候選字及候選字串進行打分,記錄打分信息最高的候選字、候選字串(即候選的連續(xù)書寫的多個漢字),以及所有候選字的筆畫和筆畫順序;

顯示模塊,用于顯示打分信息最高的候選字、連續(xù)字構(gòu)成的字串;

交互優(yōu)化模塊,用于監(jiān)聽錯誤候選字確認(rèn)的信息,并將備選錯誤筆畫按照筆畫的順序進行顯示;同時監(jiān)聽用戶對備選錯誤筆畫中錯誤筆畫的確認(rèn)信息,以及對錯誤筆畫的反饋動作并對反饋動作進行處理;所述的錯誤筆畫的反饋動作包括錯誤筆畫的替換、刪除、合并反饋動作及添加筆畫的反饋動作;

所述的備選錯誤筆畫為錯誤候選字所對應(yīng)的筆畫,或者錯誤候選字及前若干個候選字所對應(yīng)的筆畫,或者錯誤候選字及其后若干個候選字所對應(yīng)的筆畫,或者錯誤候選字及其前若干個候選字、后若干個候選字所對應(yīng)的筆畫。

優(yōu)選地,所述的采集模塊包括:

軌跡采集子模塊,用于采集用戶輸入的筆畫軌跡;

點采集子模塊,按照采點密度對筆畫軌跡進行采點同時記錄點的坐標(biāo)。

優(yōu)選地,所述的交互優(yōu)化模塊包括:

錯誤字確定子模塊,用于對錯誤候選字進行確認(rèn),并將備選錯誤筆畫按照筆畫的順序進行顯示;

動作監(jiān)聽子模塊,用于監(jiān)聽用戶對備選錯誤筆畫中錯誤筆畫的確認(rèn)信息,以及對錯誤筆畫的反饋動作,錯誤筆畫的反饋動作包括錯誤筆畫的替換、刪除、合并反饋動作及添加筆畫的反饋動作;

優(yōu)化執(zhí)行子模塊,用于對用戶的反饋動作進行處理:

如果用戶的反饋動作為修改和添加,則接收用戶替換筆畫或添加筆畫的筆畫軌跡,并發(fā)送給采集模塊;后續(xù)在采集完畢后將采集結(jié)果發(fā)送給識別模塊進行識別;

如果用戶的反饋動作為刪除和合并,則將刪除筆畫或合并筆畫的筆畫軌跡信息發(fā)送給識別模塊。

優(yōu)選地,所述輸入模塊能夠接收用戶設(shè)備輸入的筆畫軌跡(如鼠標(biāo)移動輸入)和/或用戶的觸控輸入(如觸摸或手指滑動)。

一種面向連續(xù)書寫漢字的、支持交互的漢字輸入方法,包括:

s101:輸入模塊接收用戶輸入的筆畫軌跡;

s102:采集模塊采集用戶輸入的筆畫軌跡,按照采點密度對筆畫軌跡進行采點同時記錄點的坐標(biāo);

s103:識別模塊根據(jù)輸入筆畫軌跡所對應(yīng)采集得的點的集合,識別出對應(yīng)的筆畫及筆畫順序;并對筆畫及筆畫順序能夠構(gòu)成的候選字及候選字串進行打分,記錄打分信息最高的候選字、候選字串(即候選的連續(xù)書寫的多個漢字),以及所有候選字的筆畫和筆畫順序;

s104:顯示模塊顯示打分信息最高的候選字、連續(xù)字構(gòu)成的字串;

s105:用戶根據(jù)顯示模塊顯示的候選字或連續(xù)字構(gòu)成的字串進行交互;

如果用戶直接確認(rèn),則默認(rèn)候選字或連續(xù)字構(gòu)成的字串正確;

如果用戶對顯示候選字中的錯誤候選字進行確認(rèn),則啟動交互優(yōu)化模塊;例如如果用戶認(rèn)為候選字不是目標(biāo)字,就對其中的錯誤候選字進行點擊操作;

s106:錯誤字確定子模塊對錯誤候選字進行確認(rèn),并將備選錯誤筆畫按照筆畫的順序進行顯示;例如錯誤字確定子模塊接收到了針對點擊操作,然后確認(rèn)出錯誤候選字對應(yīng)的存儲信息中的起始位置和結(jié)束位置以及對應(yīng)的存儲信息;

所述的備選錯誤筆畫為錯誤候選字所對應(yīng)的筆畫,或者錯誤候選字及前若干個候選字所對應(yīng)的筆畫,或者錯誤候選字及其后若干個候選字所對應(yīng)的筆畫,或者錯誤候選字及其前若干個候選字、后若干個候選字所對應(yīng)的筆畫;顯示備選錯誤筆畫與錯誤候選字位置有關(guān),例如錯誤候選字為輸入的第一個字,則選擇顯示錯誤候選字所對應(yīng)的筆畫或者錯誤候選字及其后若干個候選字所對應(yīng)的筆畫;如果錯誤候選字為連續(xù)輸入的最后一個字,則顯示錯誤候選字所對應(yīng)的筆畫或者錯誤候選字及其前若干個候選字所對應(yīng)的筆畫;如果錯誤候選字為連續(xù)輸入的中間字,則顯示錯誤候選字所對應(yīng)的筆畫或者錯誤候選字及其前若干個候選字、后若干個候選字所對應(yīng)的筆畫。顯示錯誤候選字及其前若干個候選字和/或后若干個候選字所對應(yīng)的筆畫與筆畫出現(xiàn)錯誤的概率可能相關(guān),也可以根據(jù)精度及屏幕大小進行選擇,例如手機等便攜終端則對應(yīng)顯示較少的備選錯誤筆畫,如果是針對于pc機則可以適當(dāng)?shù)倪x擇增加顯示的備選錯誤筆畫。

錯誤字確定子模塊顯示按照筆畫順序排列的備選錯誤筆畫中,可能某個筆畫書寫錯誤,或者多了某個筆畫,或者少了某個筆畫,或者應(yīng)該是一筆的筆畫顯示為多筆筆畫;動作監(jiān)聽子模塊監(jiān)聽用戶對備選錯誤筆畫中錯誤筆畫的確認(rèn)信息,以及對錯誤筆畫的反饋動作,錯誤筆畫的反饋動作包括錯誤筆畫的替換、刪除、合并反饋動作及添加筆畫的反饋動作;

如果用戶的反饋動作為修改和添加,優(yōu)化執(zhí)行子模塊接收用戶替換筆畫或添加筆畫的筆畫軌跡,并發(fā)送給采集模塊,后續(xù)在采集完畢后將采集結(jié)果發(fā)送給識別模塊進行識別;如果用戶的反饋動作為刪除和合并,則將刪除筆畫或合并筆畫的筆畫軌跡信息發(fā)送給識別模塊。

優(yōu)選地,步驟s103中識別模塊是根據(jù)點的坐標(biāo)識別出筆畫軌跡的筆畫及筆畫順序;然后根據(jù)現(xiàn)有的漢字識別模型對筆畫及筆畫順序能夠構(gòu)成的候選字及候選字串進行打分,記錄打分信息最高的候選字、候選字串,以及所有候選字的筆畫和筆畫順序;

優(yōu)選地,步驟s106所述的如果用戶的反饋動作為修改和添加,優(yōu)化執(zhí)行子模塊接收用戶替換筆畫或添加筆畫的筆畫軌跡,并發(fā)送給采集模塊之后的處理過程包括以下步驟:

s1071:采集模塊采集交互優(yōu)化模塊發(fā)送的錯誤筆畫對應(yīng)替換筆畫或者添加筆畫的筆畫軌跡,按照采點密度對筆畫軌跡進行采點同時記錄點的坐標(biāo);

s1072:識別模塊識別出筆畫軌跡所對應(yīng)替換筆畫或添加筆畫;并將替換筆畫替換對應(yīng)的錯誤筆畫,或者將添加筆畫添加到用戶鎖定的添加位置,重新構(gòu)成的候選字及候選字串,并重新對構(gòu)成的候選字及候選字串進行打分,記錄打分信息最高的候選字、候選字串,以及所有候選字的筆畫和筆畫順序。

優(yōu)選地,步驟s106所述的如果用戶的反饋動作為刪除和合并,則刪除筆畫或合并筆畫的筆畫軌跡發(fā)送給識別模塊之后的處理過程包括以下步驟:

s1081:識別模塊將刪除筆畫的信息刪除,或者將合并筆畫合并為一筆筆畫,重新構(gòu)成的候選字及候選字串,并重新對構(gòu)成的候選字及候選字串進行打分,記錄打分信息最高的候選字、候選字串,以及所有候選字的筆畫和筆畫順序。

優(yōu)選地,步驟s102的具體過程如下:

軌跡采集子模塊采集用戶輸入的筆畫軌跡;

點采集子模塊按照采點密度對筆畫軌跡進行采點同時記錄點的坐標(biāo)。

本發(fā)明具有以下有益效果:

第一,在輸入軌跡層面,對書寫筆畫進行干預(yù),對于用戶多寫了的一筆或幾筆的情況,可以進行筆畫刪除;對于用戶少寫了的一筆或幾筆的,可以執(zhí)行筆畫插入。從而優(yōu)化了輸入筆畫以獲得更準(zhǔn)確的候選字符。

第二,在識別層面,對于以重疊書寫的方式連續(xù)書寫多個漢字時會出現(xiàn)的“連筆”、“誤筆”、“筆順錯誤”等不利于輸入法系統(tǒng)識別字符的情況,提供有效的糾錯方式。對于本應(yīng)該是兩個筆畫的誤識別為一筆的,可以拆為兩筆之后進行重新的局部識別;對于本應(yīng)該歸屬于前一或者后一字符的一個或者幾個筆畫,可以進行筆畫分組的重新分配,之后再進行重新的局部識別。

第三,在交互優(yōu)化層面,基于對筆畫的組合局部的重新分配后的識別,實現(xiàn)對候選字符串的優(yōu)化;這種局部的搜索能有效減少用戶的書寫量,實現(xiàn)更高效的糾錯,最終提高用戶輸入效率。在有效提高某個漢字的糾錯效率的同時也避免了錯誤筆畫導(dǎo)致一個漢字識別錯誤而影響到其他漢字筆畫導(dǎo)致的其他漢字識別錯誤,能夠進一步提高修改效率,提高用戶輸入效率。針對連續(xù)書寫時存在一個錯誤字的修改情況,相比現(xiàn)有的逐個漢字的糾正,本發(fā)明的系統(tǒng)及方法能夠?qū)⑤斎胄侍岣?0%以上;尤其是針對連續(xù)書寫出現(xiàn)的多個錯誤字的修改情況,本發(fā)明的輸入效率更高。

附圖說明

圖1為具體實施方式一所述系統(tǒng)的結(jié)構(gòu)示意圖;

圖2為具體實施方式五監(jiān)聽用戶對一個錯誤字中錯誤筆畫的確認(rèn)信息及對錯誤筆畫的反饋動作的示意圖;

圖3為具體實施方式五監(jiān)聽用戶對兩個錯誤字中錯誤筆畫的確認(rèn)信息及對錯誤筆畫的反饋動作的示意圖。

具體實施方式

具體實施方式一:結(jié)合圖1說明本實施方式,

一種面向連續(xù)書寫漢字的、支持交互的漢字輸入系統(tǒng),包括:

輸入模塊u20,用于接收用戶輸入的筆畫軌跡;

采集模塊u21,用于采集輸入模塊u20接收用戶輸入的筆畫軌跡,或者采集交互優(yōu)化模塊u24發(fā)送的錯誤筆畫對應(yīng)替換筆畫的筆畫軌跡;并按照采集密度采集筆畫軌跡上的點,同時記錄點的坐標(biāo);

識別模塊u22,根據(jù)輸入筆畫軌跡對應(yīng)采集得到的點的集合識別出對應(yīng)的筆畫及筆畫順序,或者根據(jù)替換筆畫的筆畫軌跡對應(yīng)采集得的點的集合識別出對應(yīng)的筆畫,并將其替換錯誤筆畫;并對筆畫及筆畫順序能夠構(gòu)成的候選字及候選字串進行打分,記錄打分信息最高的候選字、候選字串(即候選的連續(xù)書寫的多個漢字),以及所有候選字的筆畫和筆畫順序;

顯示模塊u23,用于顯示打分信息最高的候選字、連續(xù)字構(gòu)成的字串;

交互優(yōu)化模塊u24,用于監(jiān)聽錯誤候選字確認(rèn)的信息,并將備選錯誤筆畫按照筆畫的順序進行顯示;同時監(jiān)聽用戶對備選錯誤筆畫中錯誤筆畫的確認(rèn)信息,以及對錯誤筆畫的反饋動作并對反饋動作進行處理;所述的錯誤筆畫的反饋動作包括錯誤筆畫的替換、刪除、合并反饋動作及添加筆畫的反饋動作;

所述的備選錯誤筆畫為錯誤候選字所對應(yīng)的筆畫,或者錯誤候選字及前若干個候選字所對應(yīng)的筆畫,或者錯誤候選字及其后若干個候選字所對應(yīng)的筆畫,或者錯誤候選字及其前若干個候選字、后若干個候選字所對應(yīng)的筆畫。

具體實施方式二:結(jié)合圖1說明本實施方式,

本實施方式所述的采集模塊u21包括:

軌跡采集子模塊u211,用于采集用戶輸入的筆畫軌跡;

點采集子模塊u212,按照采點密度對筆畫軌跡進行采點同時記錄點的坐標(biāo)。

其他模塊和結(jié)構(gòu)與具體實施方式一相同。

具體實施方式三:結(jié)合圖1說明本實施方式,

本實施方式所述的交互優(yōu)化模塊u24包括:

錯誤字確定子模塊u241,用于對錯誤候選字進行確認(rèn),并將備選錯誤筆畫按照筆畫的順序進行顯示;

動作監(jiān)聽子模塊u242,用于監(jiān)聽用戶對備選錯誤筆畫中錯誤筆畫的確認(rèn)信息,以及對錯誤筆畫的反饋動作,錯誤筆畫的反饋動作包括錯誤筆畫的替換、刪除、合并反饋動作及添加筆畫的反饋動作;

優(yōu)化執(zhí)行子模塊u243,用于對用戶的反饋動作進行處理:

如果用戶的反饋動作為修改和添加,則接收用戶替換筆畫或添加筆畫的筆畫軌跡,并發(fā)送給采集模塊u21;后續(xù)在采集完畢后將采集結(jié)果發(fā)送給識別模塊u22進行識別;

如果用戶的反饋動作為刪除和合并,則將刪除筆畫或合并筆畫的筆畫軌跡信息發(fā)送給識別模塊u22。

其他模塊和結(jié)構(gòu)與具體實施方式一或二相同。

具體實施方式四:

本實施方式所述輸入模塊u20能夠接收用戶設(shè)備輸入的筆畫軌跡(如鼠標(biāo)移動輸入)和/或用戶的觸控輸入(如觸摸或手指滑動)。

其他模塊和結(jié)構(gòu)與具體實施方式一至三之一相同。

具體實施方式五:

為了能夠準(zhǔn)確和清晰地描述本發(fā)明所述的方法,首先對部分技術(shù)概念進行進一步的文法定義,定義如下:

軌跡:t

筆畫:s

點:p為三元組,形如(x,y,i)。其中x表示橫坐標(biāo);y表示縱坐標(biāo);x,y為常數(shù);i為結(jié)束標(biāo)識,標(biāo)識該點是否為一個筆畫的結(jié)束,i=-1表示為一個筆畫的結(jié)束,i≠-1表示不為一個筆畫的結(jié)束。

數(shù)據(jù)結(jié)構(gòu):g=({(x,y,i)},{t,s,p},p,t)

生成式q={t→s∣ts,s→p∣sp,p→(x,y,i)}

一種面向連續(xù)書寫漢字的、支持交互的漢字輸入方法,包括:

s101:輸入模塊u20接收用戶輸入的筆畫軌跡;

在步驟s101中,終端系統(tǒng)通過人機界面或輸入設(shè)備接收用戶書寫的一串有序的筆畫軌跡,并將其存儲方便后續(xù)的調(diào)用。用戶在書寫的時候系統(tǒng)在接收這些軌跡的同時會把它們繪畫到屏幕上。比如windows平臺下可以利用mfc直接實現(xiàn)筆畫軌跡的繪畫及收集,android平臺下可以通過畫布實現(xiàn)同樣的功能。

s102:采集模塊u21采集用戶輸入的筆畫軌跡,按照采點密度對筆畫軌跡進行采點同時記錄點的坐標(biāo);

在步驟s102中,筆畫軌跡收集完畢,后臺調(diào)用程序方法按照指定采樣頻率或密度采集筆畫上的點坐標(biāo),采集筆畫軌跡上的點是指按照一定采集密度從筆畫上取點,具體采集密度不指定,設(shè)定閥值即可;所述點包括橫、縱坐標(biāo)值及結(jié)束標(biāo)識三類信息;原則上屏幕坐標(biāo)建立方式不指定,處理時按照需要做相應(yīng)轉(zhuǎn)換即可。

s103:識別模塊u22根據(jù)輸入筆畫軌跡所對應(yīng)采集得的點的集合,識別出對應(yīng)的筆畫及筆畫順序;并對筆畫及筆畫順序能夠構(gòu)成的候選字及候選字串進行打分,記錄打分信息最高的候選字、候選字串(即候選的連續(xù)書寫的多個漢字),以及所有候選字的筆畫和筆畫順序;

在步驟s103中,終端系統(tǒng)通過人機界面并通過事先定好的方法或者接口獲取識別結(jié)果并通過顯示模塊顯示給用戶。比如windows平臺下,可以在用戶界面指定位置繪制前20個可能的候選字符構(gòu)成的候選字串,同時可能也需要繪制所有被認(rèn)為是單一筆畫的原始筆畫軌跡或者按照筆畫分組按組繪制指定個數(shù)的筆畫軌跡。在android平臺下可以通過獲取系統(tǒng)輸入法的服務(wù)提交指定個數(shù)候選字到候選框里。對于需要繪制的所有被認(rèn)為是單一筆畫的原始筆畫軌跡或者需要按照筆畫分組繪制的指定個數(shù)的筆畫軌跡,可以通過畫布繪制,有利于后續(xù)監(jiān)聽動作的執(zhí)行及動作執(zhí)行位置的獲取。譬如繪制的每一張圖片大小都是40x40的圖片,所有圖片在同一行繪制,原點(0,0)為屏幕左上角,則易知對于任何在區(qū)域(40,0)到(80,40)內(nèi)的操作均屬于對第二張圖像的操作,由此可對應(yīng)獲得操作對象。

s104:顯示模塊u23顯示打分信息最高的候選字、連續(xù)字構(gòu)成的字串;

s105:用戶根據(jù)顯示模塊u23顯示的候選字或連續(xù)字構(gòu)成的字串進行交互;

如果用戶直接確認(rèn),則默認(rèn)候選字或連續(xù)字構(gòu)成的字串正確;

如果用戶對顯示候選字中的錯誤候選字進行確認(rèn),則啟動交互優(yōu)化模塊u24;例如如果用戶認(rèn)為候選字不是目標(biāo)字,就對其中的錯誤候選字進行點擊操作;

s105中,所述干預(yù)指用戶的操作,不同平臺有不同操作方式,不指定。對于pc端來說,可以是“左鍵單擊”、“左鍵雙擊”、“右鍵點擊”、“拖拽”的動作,可拓展;對于智能手機或者平板電腦或者其他有觸摸屏的終端設(shè)備來說,可以是“按下”、“放開”、“單擊”、“雙擊”、“長按”、“拖動”、“縮放”等操作,可以拓展。

例如,“左鍵單擊”用來確定待優(yōu)化軌跡起始位置,“左鍵雙擊”用來確定待優(yōu)化軌跡結(jié)束位置。“右鍵點擊”或“長按”用來以切分開的筆畫為單位展開指定書寫的字符?!巴献А边x定的目標(biāo)到不同區(qū)域執(zhí)行修改、刪除操作,如圖2所示;操作方式可以拓展。在動作完成時,調(diào)用識別模塊。

s106:錯誤字確定子模塊u241對錯誤候選字進行確認(rèn),并將備選錯誤筆畫按照筆畫的順序進行顯示;例如錯誤字確定子模塊u241接收到了針對點擊操作,然后確認(rèn)出錯誤候選字對應(yīng)的存儲信息中的起始位置和結(jié)束位置以及對應(yīng)的存儲信息;

所述的備選錯誤筆畫為錯誤候選字所對應(yīng)的筆畫,或者錯誤候選字及前若干個候選字所對應(yīng)的筆畫,或者錯誤候選字及其后若干個候選字所對應(yīng)的筆畫,或者錯誤候選字及其前若干個候選字、后若干個候選字所對應(yīng)的筆畫;顯示備選錯誤筆畫與錯誤候選字位置有關(guān),例如錯誤候選字為輸入的第一個字,則選擇顯示錯誤候選字所對應(yīng)的筆畫或者錯誤候選字及其后若干個候選字所對應(yīng)的筆畫;如果錯誤候選字為連續(xù)輸入的最后一個字,則顯示錯誤候選字所對應(yīng)的筆畫或者錯誤候選字及其前若干個候選字所對應(yīng)的筆畫;如果錯誤候選字為連續(xù)輸入的中間字,則顯示錯誤候選字所對應(yīng)的筆畫或者錯誤候選字及其前若干個候選字、后若干個候選字所對應(yīng)的筆畫。顯示錯誤候選字及其前若干個候選字和/或后若干個候選字所對應(yīng)的筆畫與筆畫出現(xiàn)錯誤的概率可能相關(guān),也可以根據(jù)精度及屏幕大小進行選擇,例如手機等便攜終端則對應(yīng)顯示較少的備選錯誤筆畫,如果是針對于pc機則可以適當(dāng)?shù)倪x擇增加顯示的備選錯誤筆畫。

錯誤字確定子模塊u241顯示按照筆畫順序排列的備選錯誤筆畫中,可能某個筆畫書寫錯誤,或者多了某個筆畫,或者少了某個筆畫,或者應(yīng)該是一筆的筆畫顯示為多筆筆畫;

例如對于本方法所定義的筆畫分組的修改,首先通過“右鍵點擊”或者“長按”展開指定的書寫的字,獲取對于片段分組信息。通過單擊指定待修改筆畫分組的起始位置筆畫分組片段[k],通過雙擊指定待修改筆畫分組的結(jié)束位置筆畫分組片段[k+j],提交以后合并為一個片段元素,之后對前后各一個漢字字符的所有片段合并,在此范圍內(nèi)進行局部的重新搜索識別。

動作監(jiān)聽子模塊u242監(jiān)聽用戶對備選錯誤筆畫中錯誤筆畫的確認(rèn)信息,以及對錯誤筆畫的反饋動作,錯誤筆畫的反饋動作包括錯誤筆畫的替換、刪除、合并反饋動作及添加筆畫的反饋動作;

如果用戶的反饋動作為修改和添加,優(yōu)化執(zhí)行子模塊u243接收用戶替換筆畫或添加筆畫的筆畫軌跡,并發(fā)送給采集模塊u21,后續(xù)在采集完畢后將采集結(jié)果發(fā)送給識別模塊u22進行識別;如果用戶的反饋動作為刪除和合并,則將刪除筆畫或合并筆畫的筆畫軌跡信息發(fā)送給識別模塊u22。

對于監(jiān)聽用戶動作的過程,對于windows平臺來說較為普遍的方式是監(jiān)聽鼠標(biāo)的點擊拖拽動作。比如進入交互優(yōu)化模塊后,用戶本次書寫的所有筆畫軌跡中被識別模塊認(rèn)為最有可能是一個漢字構(gòu)成筆畫的軌跡依序排開,并通過連續(xù)的下劃線標(biāo)記從m號到n號(m<n)被識別模塊認(rèn)為最有可能是一個字的筆畫,用戶可以拖拽某位置的筆畫對象到替換修改區(qū)域,之后在替換書寫區(qū)域?qū)P畫進行重新書寫,最后雙擊“修改”區(qū)域提交識別模塊從而獲取新的識別結(jié)果候選字。比如對于想寫“尤”字寫成了“犬”字,則需要將第三筆的“豎彎鉤”修改為“捺”。如圖2所示,首先需要將第三筆的“豎彎鉤”筆畫對象拖拽到替換修改區(qū)域放開,然后在舊筆畫對照下書寫新筆畫,最后雙擊“修改”區(qū)域提交識別模塊從而獲取新的識別結(jié)果候選字。此修改過程,后臺對于數(shù)據(jù)結(jié)構(gòu)的操作包括:書寫新筆畫時采點并加入new_points數(shù)組中,在new_strokes數(shù)組中加入對于新書寫筆畫的索引,在modify數(shù)組中對應(yīng)被修改的stroke元素位置更新在new_strokes數(shù)組中開始位置的索引。此外可以拖拽某位置的筆畫對象到刪除區(qū)域再放開以執(zhí)行刪除操作。

基礎(chǔ)數(shù)據(jù)結(jié)構(gòu),設(shè)計如下:

a.points數(shù)組:點(x,y,i)的序列,當(dāng)一筆畫結(jié)束時加入點(x,y,-1)。

b.strokes數(shù)組:筆畫數(shù)組,記錄(x,y,-1)在points數(shù)組中的索引,即每一個筆畫最后一筆的索引。

c.modify數(shù)組:數(shù)組元素與strokes數(shù)組一一對應(yīng),初始值為-1。若相應(yīng)的stroke元素被刪除,則標(biāo)記修改為-2。若要在原筆畫序列中增加筆畫,則對應(yīng)數(shù)值應(yīng)該為一個自然數(shù)start,為插入的stroke元素在new_strokes數(shù)組中開始位置的索引。

d.new_strokes數(shù)組:從索引start開始到索引值為-1結(jié)束,為增加的筆畫。

e.new_points數(shù)組:新增的points數(shù)組,用來存儲新增的點,當(dāng)一筆畫結(jié)束時加入點(x,y,-1)。

f.片段數(shù)組:筆畫的分組,識別器識別模型分類的多個概率較高的可能是漢字字符構(gòu)成的筆畫的分組,數(shù)個分組組合拼湊得出一個漢字。

對于筆畫分組(片段)的干預(yù),則需要先單擊確定該分組起始位置的筆畫對象和雙擊結(jié)束位置的筆畫對象來確定新分組的起始和結(jié)束位置。比如書寫漢字字串“abcd一人efg”(每個大寫英語符號代表一個漢字),其中本來書寫的字符中應(yīng)該含有“一人”兩個字,結(jié)果錯誤識別為了“大”字,則需要對原來的筆畫分組(片段)進行修改,并進行局部的片段重新識別。如圖3所示,首先在第二個筆畫對象“撇”上單擊以確定分組起始位置,然后在第三個筆畫對象“捺”上雙擊確認(rèn)分組結(jié)束位置,之后提交更改。此更改會將代表“大”的筆畫分組(si-1,si,si+1)修改為代表“一人”的兩個筆畫分組(si-1)和(si,si+1)。此修改過程,在識別模塊中,要對于由[修改起始位置處“一”字的前一個字符“d”的片段構(gòu)成集合]+[“一人”兩個字符修改所得的新的片段構(gòu)成集合]+[修改結(jié)束位置處“人”字的后一個字符“e”的片段構(gòu)成集合]組成的片段進行重新的搜索來獲取局部的新的候選字符。對于字符d和e兩側(cè)片段之前的搜索結(jié)果不做修改和干預(yù)。

對于android平臺來說,通過觸摸屏手指的操作可以達到和鼠標(biāo)相同的效果。

本發(fā)明所述的系統(tǒng)及方法具有以下效果:

第一,在輸入軌跡層面,對書寫筆畫進行干預(yù),對于用戶多寫了的一筆或幾筆的情況,可以進行筆畫刪除;對于用戶少寫了的一筆或幾筆的,可以執(zhí)行筆畫插入。從而優(yōu)化了輸入筆畫以獲得更準(zhǔn)確的候選字符。

第二,在識別層面,對于以重疊書寫的方式連續(xù)書寫多個漢字時會出現(xiàn)的“連筆”、“誤筆”、“筆順錯誤”等不利于輸入法系統(tǒng)識別字符的情況,提供有效的糾錯方式。對于本應(yīng)該是兩個筆畫的誤識別為一筆的,可以拆為兩筆之后進行重新的局部識別;對于本應(yīng)該歸屬于前一或者后一字符的一個或者幾個筆畫,可以進行筆畫分組的重新分配,之后再進行重新的局部識別。

第三,在算法層面,基于對筆畫的組合局部的重新分配后的搜索,實現(xiàn)對候選字符串的優(yōu)化這種局部的搜索能有效減少用戶的書寫量,實現(xiàn)更高效的糾錯,最終提高用戶輸入效率。針對連續(xù)書寫時存在一個錯誤字的修改情況,的系統(tǒng)及方法能夠?qū)⑻岣?0%以上;尤其是針對連續(xù)書寫出現(xiàn)的多個錯誤字的修改情況,本發(fā)明的更高。

第四,輸入模塊u20能夠接收用戶設(shè)備輸入的筆畫軌跡和/或用戶的觸控輸入,提供了一種更簡單簡單、更加人性化、交互性更為良好的干預(yù)方式。

具體實施方式六:

本實施方式所述步驟s103中識別模塊u22是根據(jù)點的坐標(biāo)識別出筆畫軌跡的筆畫及筆畫順序;然后根據(jù)現(xiàn)有的或者自建的漢字識別模型對筆畫及筆畫順序能夠構(gòu)成的候選字及候選字串進行打分,記錄打分信息最高的候選字、候選字串,以及所有候選字的筆畫和筆畫順序。

其他模塊和結(jié)構(gòu)與具體實施方式五相同。

具體實施方式七:

本實施方式步驟s106所述的如果用戶的反饋動作為修改和添加,優(yōu)化執(zhí)行子模塊u242接收用戶替換筆畫或添加筆畫的筆畫軌跡,并發(fā)送給采集模塊u21之后的處理過程包括以下步驟:

s1071:采集模塊u21采集交互優(yōu)化模塊u24發(fā)送的錯誤筆畫對應(yīng)替換筆畫或者添加筆畫的筆畫軌跡,按照采點密度對筆畫軌跡進行采點同時記錄點的坐標(biāo);

s1072:識別模塊u22識別出筆畫軌跡所對應(yīng)替換筆畫或添加筆畫;并將替換筆畫替換對應(yīng)的錯誤筆畫,或者將添加筆畫添加到用戶鎖定的添加位置,重新構(gòu)成的候選字及候選字串,并重新對構(gòu)成的候選字及候選字串進行打分,記錄打分信息最高的候選字、候選字串,以及所有候選字的筆畫和筆畫順序。

其他模塊和結(jié)構(gòu)與具體實施方式五或六相同。

具體實施方式八:

本實施方式步驟s106所述的如果用戶的反饋動作為刪除和合并,則刪除筆畫或合并筆畫的筆畫軌跡發(fā)送給識別模塊u22之后的處理過程包括以下步驟:

s1081:識別模塊u22將刪除筆畫的信息刪除,或者將合并筆畫合并為一筆筆畫,重新構(gòu)成的候選字及候選字串,并重新對構(gòu)成的候選字及候選字串進行打分,記錄打分信息最高的候選字、候選字串,以及所有候選字的筆畫和筆畫順序。

其他模塊和結(jié)構(gòu)與具體實施方式五至七之一相同。

具體實施方式九:

本實施方式步驟s102的具體過程如下:

軌跡采集子模塊u211采集用戶輸入的筆畫軌跡;

點采集子模塊u212按照采點密度對筆畫軌跡進行采點同時記錄點的坐標(biāo)。

其他模塊和結(jié)構(gòu)與具體實施方式五至八之一相同。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1