亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

漢字編碼輸入法的制作方法

文檔序號(hào):6426328閱讀:149來(lái)源:國(guó)知局
專利名稱:漢字編碼輸入法的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及中文信息處理技術(shù)領(lǐng)域,具體而言,涉及ー種漢字編碼輸入法。
背景技術(shù)
目前的漢字編碼大致可以分為四級(jí)模式第一級(jí)是整字模式;第二級(jí)是符合國(guó)家標(biāo)準(zhǔn)的規(guī)范部件模式;第三級(jí)是介于規(guī)范部件與筆畫之間的非規(guī)范部件拆分模式;第四級(jí)是筆畫模式。其中整字模式無(wú)需對(duì)漢字進(jìn)行任何拆分,拼音輸入法和區(qū)位碼就是該模式的典型代表。當(dāng)前拼音輸入法是最為流行的漢字輸入法。其優(yōu)點(diǎn)是會(huì)拼音就會(huì)輸入,是最為自然 的中文輸入法。其弱點(diǎn)是無(wú)法輸入不會(huì)讀音的漢字,由于編碼空間過(guò)小,導(dǎo)致重碼過(guò)多。更為嚴(yán)重的是長(zhǎng)期使用拼音輸入,會(huì)削弱對(duì)漢字字形的記憶,降低漢字的書寫水平,甚至導(dǎo)致漢字遺忘癥。規(guī)范部件輸入法的問題在于需要記憶大量的部件,2009年7月I日開始試行的《現(xiàn)代常用字部件及部件名稱規(guī)范》GF0014-2009規(guī)定了 514個(gè)部件。早在此前發(fā)布的GF3001-1997信息處理用GB13000. I字符集漢字部件規(guī)范規(guī)定了 560個(gè)部件。數(shù)百個(gè)部件如何合理分布在標(biāo)準(zhǔn)鍵盤上,一直是沒有解決的難題。介于規(guī)范部件與筆畫之間的第三級(jí)模式,由于較少考慮漢字自身規(guī)律,不受國(guó)家標(biāo)準(zhǔn)約束,或出于個(gè)人偏愛,或囿于一己之見,各種以己之長(zhǎng)比人之短的方案層出不窮。這正是導(dǎo)致漢字形碼和音形碼“萬(wàn)碼奔騰”低水平重復(fù)的重要原因。筆畫模式的優(yōu)點(diǎn)是易學(xué)好記,會(huì)寫就會(huì)輸入;缺點(diǎn)是筆畫多的輸入慢,筆畫少的重碼多,不會(huì)寫就不會(huì)輸入。由此可見,中國(guó)計(jì)算機(jī)用戶最缺的還是真正符合漢字規(guī)律,易學(xué)好用的漢字輸入方法。不僅如此,國(guó)內(nèi)外漢字教學(xué)也需要能夠真正有助于識(shí)字、寫字、查字和打字的漢字輸入編碼。漢字編碼的作用不僅僅在于輸入漢字。小學(xué)階段語(yǔ)文課最重要的教學(xué)任務(wù)是識(shí)字,好的漢字編碼輸入法在識(shí)字上應(yīng)該能夠起到其他手段起不到的作用,可以有效幫助學(xué)生學(xué)習(xí)和記憶漢字,明顯提高識(shí)字的時(shí)效,有利于學(xué)生對(duì)漢字的理解和熱愛,讓漢字規(guī)范的推廣工作落到實(shí)處。這些正是當(dāng)代漢字教學(xué)對(duì)漢字編碼輸入法提出的要求,如果漢字編碼本身就是ー種規(guī)范的識(shí)字法,并且有助于解決漢字難學(xué)的大問題,那就再好不過(guò)了!

發(fā)明內(nèi)容
本發(fā)明提供一種漢字編碼輸入法,用以在漢字輸入時(shí)幫助人們學(xué)習(xí)記憶漢字。為達(dá)到上述目的,本發(fā)明提供了一種漢字編碼輸入法,其包括以下步驟按照漢字拆分程序?qū)h字結(jié)構(gòu)進(jìn)行拆分,將漢字分為獨(dú)體字、左右相等或左中右相等、左少右多、左多右少、上下相等或上中下相等、上少下多、上多下少、兩面包圍、三面包圍以及四面包圍和特殊結(jié)構(gòu),井分別用ー數(shù)字鍵作為其代碼;將漢字的筆畫分為橫、豎、撇、點(diǎn)、折,并分別用一數(shù)字鍵作為其代碼;根據(jù)所要輸入漢字的特點(diǎn),將其漢字結(jié)構(gòu)的代碼作為編碼的第I位,將漢字的部件數(shù)量或筆畫數(shù)作為編碼的第2位,并將該漢字各個(gè)部件的筆畫的代碼作為編碼的第3 6位;通過(guò)鍵盤或軟鍵盤上的數(shù)字鍵將編碼輸入。較佳的,當(dāng)漢字為獨(dú)體字時(shí),將該獨(dú)體字的筆畫數(shù)作為其編碼的第2位。較佳的,橫的代碼為1,豎的代碼為2,撇的代碼為3,點(diǎn)的代碼為4,折的代碼為5,與其他筆畫交叉的橫的代碼為6,豎鉤的代碼為7,與其他筆畫交叉的撇的代碼為8,與其他筆畫交叉的折的代碼為9。較佳的,當(dāng)漢字為獨(dú)體字,超過(guò)4畫的獨(dú)體字取其前4畫進(jìn)行編碼。較佳的,當(dāng)漢字包括2個(gè)部件時(shí),分別取其2個(gè)部件的前2筆進(jìn)行編碼;當(dāng)漢字包括3個(gè)部件吋,分別取前2個(gè)部件的第I筆和第3個(gè)部件的前2筆進(jìn)行編碼;當(dāng)漢字包括4個(gè)及以上部件時(shí),分別取前4個(gè)部件的第I筆進(jìn)行編碼;其中,若需要取前2筆的部件只有 I個(gè)筆畫吋,則編碼時(shí)將該筆畫重復(fù)2次。較佳的,用數(shù)字“O”用作編碼提前結(jié)束的標(biāo)志符。較佳的,在編碼中,用該漢字的拼音首字母作為該漢字編碼的最后一位,其中該拼音首字母可以出現(xiàn)在該漢字編碼的任何位置上。上述實(shí)施例中,根據(jù)漢字的漢字結(jié)構(gòu)、部件和筆畫進(jìn)行漢字的輸入,不僅可以作為高效靈活的漢字輸入方法,廣泛用于計(jì)算機(jī)和各類采用數(shù)字小鍵盤的信息終端設(shè)備;還可以用來(lái)幫助人們學(xué)習(xí)記憶漢字,對(duì)漢字教學(xué)中的識(shí)字、習(xí)字和查字均有較大的輔助作用。


為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖I為根據(jù)本發(fā)明ー實(shí)施例的漢字輸入法流程圖;圖2為根據(jù)本發(fā)明ー實(shí)施例的漢字編碼輸入界面屏幕截圖;圖3為根據(jù)本發(fā)明ー實(shí)施例的數(shù)字純形碼單字輸入“漢”屏幕截圖;圖4為根據(jù)本發(fā)明ー實(shí)施例的數(shù)字純形碼單字輸入“字”屏幕截圖;圖5為根據(jù)本發(fā)明ー實(shí)施例的數(shù)字純形碼單字輸入“編”屏幕截圖;圖6為根據(jù)本發(fā)明ー實(shí)施例的數(shù)字純形碼單字輸入“碼”屏幕截圖;圖7為根據(jù)本發(fā)明ー實(shí)施例的數(shù)字純形碼詞語(yǔ)輸入“漢字編碼”屏幕截圖;圖8為根據(jù)本發(fā)明ー實(shí)施例的形音碼詞語(yǔ)輸入“漢字編碼”屏幕截圖;圖9為根據(jù)本發(fā)明ー實(shí)施例的純音碼詞語(yǔ)輸入“漢字編碼”屏幕截圖;圖10為根據(jù)本發(fā)明ー實(shí)施例的三碼混合詞語(yǔ)輸入“漢字編碼”屏幕截圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整的描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有付出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明涉及ー種符合國(guó)家標(biāo)準(zhǔn)規(guī)范,面向漢字教學(xué),具有數(shù)字純形、形音結(jié)合與字母純音三種格式無(wú)切換混用功能的漢字編碼輸入法。該方法以數(shù)字表形為主,輔之以拼音首字母,故稱之為“數(shù)形輔音”輸入法。漢字編碼輸入法是中文信息進(jìn)入計(jì)算機(jī)和移動(dòng)信息終端設(shè)備的最重要的入ロ。同時(shí)也是漢字教學(xué)的重要手段和工具,并且還是解決漢字排序檢索問題的技術(shù)途徑。本發(fā)明在完全遵守國(guó)家語(yǔ)言文字有關(guān)標(biāo)準(zhǔn)和規(guī)范的基礎(chǔ)上,從漢字結(jié)構(gòu)與構(gòu)形要素之間的數(shù)量關(guān)系入手,提取出“構(gòu)形數(shù)量”這一新的編碼元素,并且用O 9十個(gè)數(shù)字直接表達(dá)這種編碼元素,輔之以漢語(yǔ)拼音首字母,形成了遵循國(guó)家標(biāo)準(zhǔn)規(guī)范,面向漢字教學(xué),具有數(shù)字純形、形音結(jié)合和字母純音三種格式無(wú)切換混用功能的漢字編碼輸入法。圖I為根據(jù)本發(fā)明ー實(shí)施例的漢字編碼輸入法流程圖。如圖I所示,該漢字輸入 法包括以下步驟S102,按照漢字拆分程序?qū)h字結(jié)構(gòu)進(jìn)行拆分,將漢字分為獨(dú)體字、左右相等或左中右相等、左少右多、左多右少、上下相等或上中下相等、上少下多、上多下少、兩面包圍、三面包圍以及四面包圍和特殊結(jié)構(gòu),井分別用ー數(shù)字鍵作為其代碼;將漢字的筆畫分為橫、豎、撇、點(diǎn)、折,并分別用一數(shù)字鍵作為其代碼;S104,根據(jù)所要輸入漢字的特點(diǎn),將其漢字結(jié)構(gòu)的代碼作為編碼的第I位,將漢字的部件數(shù)量或筆畫數(shù)作為編碼的第2位,并將該漢字各個(gè)部件的筆畫的代碼作為編碼的第3 6位;S106,通過(guò)鍵盤或軟鍵盤上的數(shù)字鍵將編碼輸入。本實(shí)施例中,根據(jù)漢字的漢字結(jié)構(gòu)、部件和筆畫進(jìn)行漢字的輸入,不僅可以作為高效靈活的漢字輸入方法,廣泛用于計(jì)算機(jī)和各類采用數(shù)字小鍵盤的信息終端設(shè)備;還可以用來(lái)幫助人們學(xué)習(xí)記憶漢字,對(duì)漢字教學(xué)中的識(shí)字、習(xí)字和查字均有較大的輔助作用。根據(jù)部件在整字中的位置關(guān)系對(duì)漢字進(jìn)行分類,完全符合《現(xiàn)代常用字部件及部件名稱規(guī)范GF0014-2009》的要求。在信息交換用漢字編碼字符集-基本集GB2312的6763個(gè)漢字中,左右結(jié)構(gòu)的漢字多達(dá)4272個(gè),超過(guò)了 63%。本著有效利用編碼空間,盡量均衡編碼分布的設(shè)計(jì)原則,將左右結(jié)構(gòu)細(xì)分為三個(gè)子類左(中)右相等、左少右多、左多右少。上下結(jié)構(gòu)的漢字的數(shù)量也相當(dāng)多。GB2312的6763個(gè)漢字中,上下結(jié)構(gòu)的漢字共有1560個(gè),占到23%。故也將其分為三類上(中)下相等、上少下多、上多下少。無(wú)論是左右結(jié)構(gòu)還是上下結(jié)構(gòu),所謂相等與多少,對(duì)于兩部件字來(lái)說(shuō),指的是兩個(gè)部件筆畫之間的數(shù)量關(guān)系;對(duì)于三個(gè)或三個(gè)以上部件的漢字來(lái)說(shuō),則是指部件之間的數(shù)量關(guān)系。關(guān)于漢字部件的拆分方法,以及如何確定左右或上下兩個(gè)部分中部件的多與少。本發(fā)明主要依據(jù)《漢字部件規(guī)范》研制組在“關(guān)于制訂《漢字部件規(guī)范》的若干問題”(簡(jiǎn)稱部件規(guī)范)中相關(guān)規(guī)定。部件規(guī)范將漢字的拆分程序定義為“漢字拆分為部件的次序。對(duì)層次結(jié)構(gòu)的漢字遞次進(jìn)行有理?yè)?jù)拆分,稱層次拆分;對(duì)平面結(jié)構(gòu)的漢字進(jìn)行一次性的有理?yè)?jù)拆分或無(wú)理?yè)?jù)拆分,稱平面拆分。”
本發(fā)明根據(jù)部件拆分程序中的首層拆分來(lái)確定左右結(jié)構(gòu)和上下結(jié)構(gòu)漢字中部件分布究竟是哪邊少哪邊多。例如,“做”由“イ、十、ロ、夂”四個(gè)部件組成。其首層拆分結(jié)果是“イ”和“故”,所以是“左少右多”結(jié)構(gòu)?!靶隆庇伞傲ⅰ⒛?、斤”三個(gè)部件組成,其首層拆分結(jié)果是“親”和“斤”,故為“左多右少”結(jié)構(gòu)。“花”由“*、イ、匕”三個(gè)部件組成,其首層拆分結(jié)果是和“化”,所以是“上少下多”結(jié)構(gòu)?!跋搿庇伞澳?、目、心”三個(gè)部件組成,其首層拆分結(jié)果是“相”和“心”,故為“上多下少”結(jié)構(gòu)。由此可見,本發(fā)明不僅包含了部件數(shù)量信息,而且還反映了部件拆分的規(guī)范過(guò)程。除了左右和上下結(jié)構(gòu),其他結(jié)構(gòu)的漢字?jǐn)?shù)量相對(duì)來(lái)說(shuō)比較少。因此用8代表所有兩面包圍結(jié)構(gòu)的漢字,包括上左包圍、上右包圍和左下包圍ニ種;用9代表所有ニ面包圍的漢字,其中包括左上右包圍、上左下包圍和左下右包圍ニ種。用O代表四面包圍和其他特殊結(jié)構(gòu)的漢字。 漢字編碼的關(guān)鍵在于如何分解數(shù)量龐大的漢字集合。本發(fā)明的第I位編碼是對(duì)編碼漢字集的第一次分解,其分解的效果(均勻度)對(duì)重碼率和重碼字相似度的影響非常大,上述方法比較均勻地分解了高度聚集在左右結(jié)構(gòu)和上下結(jié)構(gòu)區(qū)域的大量漢字。部件數(shù)量與位置關(guān)系屬于漢字的宏觀屬性,顯而易見,較少有ニ義性。本發(fā)明利用這些元素來(lái)描述漢字,巧妙規(guī)避了部件數(shù)量過(guò)多,拆分不規(guī)范、部件名稱不定等一系列難題。從圖I的實(shí)施例中可以看出,〈漢字?jǐn)?shù)字純形編碼 >:= < 結(jié)構(gòu)碼X數(shù)量碼〉{く筆畫碼>}。其中,〈結(jié)構(gòu)碼=〈獨(dú)體字>|〈合體字〉,例如可以將令獨(dú)體字的代碼為1,即〈獨(dú)體字:=I ;<合體字 >::=〈左右結(jié)構(gòu)>I<上下結(jié)構(gòu)>I<兩面包圍>I<三面包圍>|<四面包圍和特殊結(jié)構(gòu) >,〈左右結(jié)構(gòu) >::=〈左(中)右相等>1〈左少右多>1〈左多右少 >,令〈左(中)右相等〉=2,〈左少右多>::=3,〈左多右少:=4 ;<上下結(jié)構(gòu)>::=〈上(中)下相等>|〈上少下多>|〈上多下少〉,〈上(中)下相等〉=5,〈上少下多〉=6,〈上多下少:=7, <兩面包圍>::=8,〈三面包圍>::=9,〈四面包圍和特殊結(jié)構(gòu)>::=0。在上述實(shí)施例中,數(shù)量碼為漢字的部件數(shù)目,當(dāng)漢字為獨(dú)體字時(shí),可以將該獨(dú)體字的筆畫數(shù)作為其編碼的第2位。即〈數(shù)量碼 >::=〈筆畫數(shù)>|〈部件數(shù)〉,〈筆畫數(shù)〉=1|2|3|4|5|6|7|8|9(數(shù)字9表示筆畫等于或超過(guò)9畫),〈部件數(shù)〉=1|2|3|4|5|6|7|8|9(數(shù)字9表示部件數(shù)等于或超過(guò)9個(gè))。其中,本發(fā)明實(shí)施例中的部件是指《漢字部首表G0011-2009》中的部首和《現(xiàn)代常用字部件及部件名稱規(guī)范GF0014-2009》中的基礎(chǔ)部件。《漢字部首表》采用的部首定義是“可以成批構(gòu)字的一部分部件”(GB/T12200);《現(xiàn)代常用字部件及部件名稱規(guī)范》遵循的部件定義是“由筆畫組成的具有組配漢字功能的構(gòu)字單位”(GB/T 12200)。大部分規(guī)范部首即是規(guī)范基礎(chǔ)部件?!稘h字部首表》201個(gè)主部首中,只有22個(gè)不屬于《現(xiàn)代常用字部件及部件名稱規(guī)范》中的基礎(chǔ)部件。本發(fā)明將屬于部首的基礎(chǔ)部件稱為“部首部件”,將不是部首的基礎(chǔ)部件稱為“非部首部件”,將不屬于基礎(chǔ)部件的部首稱為“非部件部首”。只有按照部首和部件規(guī)范的要求拆分漢字,才能得到正確的部件數(shù)。這樣設(shè)計(jì)是為了把漢字結(jié)構(gòu)知識(shí)融入到編碼中去,以便通過(guò)編碼輸入鞏固對(duì)漢字形體結(jié)構(gòu)的記憶,避免因?yàn)槭褂糜?jì)算機(jī)而淡忘了漢字的字形。盡管這樣做會(huì)提高編碼的學(xué)習(xí)難度,但這正是面向漢字教學(xué)的需要,因?yàn)椴考菨h字形體中承上啟下的關(guān)鍵組配単位,若想正確理解和記憶漢字字形,掌握字形與字義的關(guān)系,就必須知道漢字是由哪幾個(gè)部件組配而成的。對(duì)于合體字來(lái)說(shuō),至少包含兩個(gè)部件,因此數(shù)量碼不可能為I。本發(fā)明中,數(shù)量碼I并不表示合體字的部件數(shù)量,而是將合體字視為ー個(gè)整體,不做拆分。也即像獨(dú)體字那樣輸入漢字的前四筆。這樣設(shè)計(jì)為的是,當(dāng)不知道如何拆分,或無(wú)法確認(rèn)某個(gè)漢字的部件數(shù)量時(shí)也能輸入該漢字。例如,筆畫編碼遵循國(guó)家標(biāo)準(zhǔn),橫的代碼為1,豎的代碼為2,撇的代碼為3,點(diǎn)的代碼為4,折的代碼為5 ;為了分化使用頻度較高的“橫豎撇折”這四種筆畫,并在筆畫編碼層面體現(xiàn)筆畫的交叉關(guān)系,與其他筆畫交叉的橫的代碼為6,豎鉤(與豎相區(qū)別)的代碼為7,與其他筆畫交叉的撇的代碼為8,與其他筆畫交叉的折的代碼為9。即〈筆畫碼 >::=〈橫> I〈豎 > I〈撇 > I〈點(diǎn) > I〈折〉,〈橫〉:=11 6,〈豎 >::=2 I 7,〈撇 >::=3 I 8,〈點(diǎn)〉:=4,〈折〉=5 I 9。例如,當(dāng)漢字為獨(dú)體字,筆畫碼的長(zhǎng)度因筆畫數(shù)而定,超過(guò)4畫獨(dú)體字取其前4畫 進(jìn)行編碼。例如,當(dāng)漢字包括2個(gè)部件時(shí),分別取其2個(gè)部件的前2筆進(jìn)行編碼;當(dāng)漢字包括3個(gè)部件吋,分別取前2個(gè)部件的第I筆和第3個(gè)部件的前2筆進(jìn)行編碼;當(dāng)漢字包括4個(gè)及以上部件吋,分別取前4個(gè)部件的第I筆進(jìn)行編碼;其中,若需要取前2筆的部件只有I個(gè)筆畫吋,則編碼時(shí)將該筆畫重復(fù)2次。例如,除了第一位用來(lái)表示四面包圍結(jié)構(gòu)之外,編碼時(shí)數(shù)字“O”還可用作編碼提前結(jié)束的標(biāo)志符。本發(fā)明不但可以單字逐個(gè)輸入漢字,也可以用來(lái)輸入詞語(yǔ)。本發(fā)明不設(shè)置任何簡(jiǎn)碼,在輸入詞語(yǔ)時(shí),可以用“O”來(lái)提前結(jié)束當(dāng)前輸入漢字的編碼,并進(jìn)入下一個(gè)漢字的輸入。這樣做的好處是無(wú)需固定碼長(zhǎng),隨時(shí)根據(jù)以往的經(jīng)驗(yàn)和輸入的內(nèi)容,任意調(diào)節(jié)編碼的長(zhǎng)短(不包含結(jié)束符最短可以只有一位),既可無(wú)拘無(wú)束,又能高效輸入。為了更好地適合漢字教學(xué),本發(fā)明的輸入法除了以上說(shuō)明的數(shù)字純形碼(以下簡(jiǎn)稱純形碼)之外,還利用拼音首字母,對(duì)其進(jìn)行了擴(kuò)展,從而形成“形音結(jié)合”和“字母純音”另外兩種方式(以下分別簡(jiǎn)稱為“形音碼”和“純音碼”)。例如,在編碼中,用該漢字的拼音首字母作為該漢字編碼的最后一位,該拼音首字母可以出現(xiàn)在該漢字編碼的任何位置上。本實(shí)施例的形音碼是在純形碼的基礎(chǔ)上,加上漢字拼音第一個(gè)字母所構(gòu)成,屬于以形為主,形音結(jié)合的一種漢字編碼輸入法。當(dāng)小學(xué)生學(xué)會(huì)了漢語(yǔ)拼音之后,可以用形音碼來(lái)輸入漢字,這樣不僅可以鞏固所學(xué)拼音,還能進(jìn)一歩降低重碼鍵選率,提高輸入效率。本發(fā)明的形音碼中,拼音首字母位于編碼的最后,但不固定其位置。拼音首字母有兩個(gè)作用。其一是用來(lái)分解重碼,其ニ是用作編碼結(jié)束標(biāo)志。第一個(gè)作用顯而易見,而第二個(gè)作用則是本發(fā)明的一大特點(diǎn)。就碼長(zhǎng)而言,漢字?jǐn)?shù)字編碼可以分為固定碼長(zhǎng)和非固定碼長(zhǎng)兩種。等長(zhǎng)編碼的優(yōu)點(diǎn)是無(wú)需結(jié)束符,缺點(diǎn)是存在大量只是為了湊齊長(zhǎng)度的空碼。而非等長(zhǎng)編碼雖然編碼效率高,但是兩個(gè)漢字編碼之間需要分隔符,或者需要規(guī)定特定情況下(例如詞語(yǔ)輸入)的碼長(zhǎng)。而本發(fā)明的形音碼只有最后一位是拼音字母,其余都是數(shù)字,所以這個(gè)拼音字母,既是有效碼元,又起到了結(jié)束符的作用,而且可以在編碼的第I至第6位的任何位置上鍵入該拼音首字母,作為編碼提前結(jié)束的最后ー個(gè)碼元。當(dāng)拼音首字母出現(xiàn)在第一碼位上時(shí),就是本發(fā)明的純音碼。純音碼只有一位,主要用來(lái)快速輸入較長(zhǎng)的詞語(yǔ)。本發(fā)明的形音碼只用一位拼音首字母,就實(shí)現(xiàn)了徹底的碼長(zhǎng)自由,在I至7的任何ー個(gè)碼位,都允許鍵入拼音首字母。本發(fā)明用的純形碼,需要用額外的“ O”來(lái)提前結(jié)束編碼,而形音碼則實(shí)現(xiàn)了碼長(zhǎng)自由度與編碼高效率的完美統(tǒng)一。本發(fā)明的漢字?jǐn)?shù)形輔音規(guī)范編碼輸入法不僅可以做到“見字識(shí)碼”,對(duì)于相當(dāng)一部分漢字來(lái)說(shuō),還能做到“見碼識(shí)字”。以下為根據(jù)本發(fā)明ー優(yōu)選實(shí)施例其實(shí)施軟件是一個(gè)WPF (Windows Presentation Foundation)程序,可以運(yùn)行在Windows XP以及更高版本的操作系統(tǒng)環(huán)境下。其主要功能是將用戶通過(guò)標(biāo)準(zhǔn)鍵盤輸入的漢 字編碼轉(zhuǎn)換成漢字或詞語(yǔ)。下面結(jié)合實(shí)施軟件和附圖,對(duì)本發(fā)明作進(jìn)ー步說(shuō)明。圖2是該實(shí)施軟件界面,左邊是編碼輸入框,右邊是候選字詞選擇框。在選擇框上方顯示選擇結(jié)果,以及與候選字詞相關(guān)的統(tǒng)計(jì)參數(shù)。圖3至圖6是用純形碼分別輸入單字“漢字編碼”四個(gè)字,其中“漢”和“碼”只需輸入5位編碼,即可唯一確定?!熬帲?,的編碼與其他字相重,但是首選字,故無(wú)需鍵選。圖7是用純形碼輸入詞語(yǔ)“漢字編碼”的過(guò)程。第一個(gè)漢字用了 5位編碼(42449)輸入。當(dāng)詞語(yǔ)的第一個(gè)輸入后,其余的宇大都無(wú)需全碼輸入。本實(shí)施例中,只用了兩位編碼
(52)即可輸入“字”。而“編”和“碼”只分別用了一位編碼,就完成了整個(gè)詞語(yǔ)的輸入。由此可見,使用本發(fā)明的方法,即使只用十個(gè)數(shù)字,也能有效縮短碼長(zhǎng),高速輸入中文。圖8顯示了用形音碼輸入詞語(yǔ)“漢字編碼”的過(guò)程。詞語(yǔ)輸入時(shí),形音碼可以進(jìn)ー步縮短碼長(zhǎng)。本實(shí)施例中四個(gè)字的平均碼長(zhǎng)只有I. 75。圖9記錄了純音碼輸入詞語(yǔ)“漢字編碼”的過(guò)程。純音碼主要用來(lái)輸入字?jǐn)?shù)較多的詞語(yǔ)(三字以上)。從本實(shí)施例可以看出,純音碼顯然不適合輸入單字和雙字詞,但是輸入像“漢字編碼”這樣的多次詞是非常高效的。本實(shí)施例的平均碼長(zhǎng)為I。圖10體現(xiàn)了本發(fā)明“三種方式無(wú)切換混用”的特點(diǎn)。使用者可以根據(jù)漢字學(xué)習(xí)進(jìn)度,或者對(duì)具體漢字字形和讀音的認(rèn)知程度,以及漢字輸入方面的經(jīng)驗(yàn)積累,選擇最適合自己的方式,從而避免單ー輸入方式的局限。本發(fā)明不僅提供了適合漢字教學(xué)不同階段使用的不同編碼方式,同時(shí)還實(shí)現(xiàn)了相互之間的無(wú)切換混用。從只用十個(gè)數(shù)字輸入漢字或詞語(yǔ)(純形),到用數(shù)字和拼音首字母輸入漢字或詞語(yǔ)(形音結(jié)合),再到只用拼音首字母輸入詞語(yǔ)(純音)。均可以隨字隨詞自由選擇。例如,輸入詞語(yǔ)“漢字編碼”,可以有如表I所示的不同方法(但非全部)表I
權(quán)利要求
1.一種漢字編碼輸入法,其特征在于,包括以下步驟 按照漢字拆分程序?qū)h字結(jié)構(gòu)進(jìn)行拆分,將漢字分為獨(dú)體字、左右相等或左中右相等、左少右多、左多右少、上下相等或上中下相等、上少下多、上多下少、兩面包圍、三面包圍以及四面包圍和特殊結(jié)構(gòu),并分別用一數(shù)字鍵作為其代碼;將漢字的筆畫分為橫、豎、撇、點(diǎn)、折,并分別用一數(shù)字鍵作為其代碼; 根據(jù)所要輸入漢字的特點(diǎn),將其漢字結(jié)構(gòu)的代碼作為編碼的第I位,將漢字的部件數(shù)量或筆畫數(shù)作為所述編碼的第2位,并將該漢字各個(gè)部件的筆畫的代碼作為所述編碼的第3 6位; 通過(guò)鍵盤或軟鍵盤上的數(shù)字鍵將所述編碼輸入。
2.根據(jù)權(quán)利要求I所述的漢字輸入法,其特征在于,當(dāng)漢字為獨(dú)體字時(shí),將該獨(dú)體字的筆畫數(shù)作為其編碼的第2位。
3.根據(jù)權(quán)利要求I所述的漢字輸入法,其特征在于,橫的代碼為1,豎的代碼為2,撇的代碼為3,點(diǎn)的代碼為4,折的代碼為5,與其他筆畫交叉的橫的代碼為6,豎鉤的代碼為7,與其他筆畫交叉的撇的代碼為8,與其他筆畫交叉的折的代碼為9。
4.根據(jù)權(quán)利要求I所述的漢字輸入法,其特征在于,當(dāng)漢字為獨(dú)體字,超過(guò)4畫的獨(dú)體字取其前4畫進(jìn)行編碼。
5.根據(jù)權(quán)利要求I所述的漢字輸入法,其特征在于 當(dāng)漢字包括2個(gè)部件時(shí),分別取其2個(gè)部件的前2筆進(jìn)行編碼; 當(dāng)漢字包括3個(gè)部件時(shí),分別取前2個(gè)部件的第I筆和第3個(gè)部件的前2筆進(jìn)行編碼; 當(dāng)漢字包括4個(gè)及以上部件時(shí),分別取前4個(gè)部件的第I筆進(jìn)行編碼; 其中,若需要取前2筆的部件只有I個(gè)筆畫時(shí),則編碼時(shí)將該筆畫重復(fù)2次。
6.根據(jù)權(quán)利要求I所述的漢字輸入法,其特征在于,用數(shù)字“O”用作編碼提前結(jié)束的標(biāo)志符。
7.根據(jù)權(quán)利要求I所述的漢字輸入法,其特征在于,在所述編碼中,用該漢字的拼音首字母作為該漢字編碼的最后一位,其中該拼音首字母可出現(xiàn)在該漢字編碼的任何位置上。
全文摘要
本發(fā)明公開了一種漢字編碼輸入法,其包括按照漢字拆分程序?qū)h字結(jié)構(gòu)進(jìn)行拆分,將漢字分為獨(dú)體字、左右相等或左中右相等、左少右多、左多右少、上下相等或上中下相等、上少下多、上多下少、兩面包圍、三面包圍以及四面包圍和特殊結(jié)構(gòu),并分別用一數(shù)字鍵作為其代碼;將漢字的筆畫分為橫、豎、撇、點(diǎn)、折,并分別用一數(shù)字鍵作為其代碼;根據(jù)所要輸入漢字的特點(diǎn),將其漢字結(jié)構(gòu)的代碼作為編碼的第1位,將漢字的部件數(shù)量或筆畫數(shù)作為編碼的第2位,并將該漢字各個(gè)部件的筆畫的代碼作為編碼的第3~6位;通過(guò)鍵盤或軟鍵盤上的數(shù)字鍵將編碼輸入。
文檔編號(hào)G06F3/023GK102830809SQ20111016042
公開日2012年12月19日 申請(qǐng)日期2011年6月15日 優(yōu)先權(quán)日2011年6月15日
發(fā)明者董為群 申請(qǐng)人:高靜敏, 董為群
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1