漢字編碼輸入法的制作方法

文檔序號(hào)：6426328閱讀：149來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：漢字編碼輸入法的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及中文信息處理技術(shù)領(lǐng)域，具體而言，涉及ー種漢字編碼輸入法。
背景技術(shù)：
目前的漢字編碼大致可以分為四級(jí)模式第一級(jí)是整字模式；第二級(jí)是符合國(guó)家標(biāo)準(zhǔn)的規(guī)范部件模式；第三級(jí)是介于規(guī)范部件與筆畫之間的非規(guī)范部件拆分模式；第四級(jí)是筆畫模式。其中整字模式無(wú)需對(duì)漢字進(jìn)行任何拆分，拼音輸入法和區(qū)位碼就是該模式的典型代表。當(dāng)前拼音輸入法是最為流行的漢字輸入法。其優(yōu)點(diǎn)是會(huì)拼音就會(huì)輸入，是最為自然的中文輸入法。其弱點(diǎn)是無(wú)法輸入不會(huì)讀音的漢字，由于編碼空間過(guò)小，導(dǎo)致重碼過(guò)多。更為嚴(yán)重的是長(zhǎng)期使用拼音輸入，會(huì)削弱對(duì)漢字字形的記憶，降低漢字的書寫水平，甚至導(dǎo)致漢字遺忘癥。規(guī)范部件輸入法的問題在于需要記憶大量的部件，2009年7月I日開始試行的《現(xiàn)代常用字部件及部件名稱規(guī)范》GF0014-2009規(guī)定了 514個(gè)部件。早在此前發(fā)布的GF3001-1997信息處理用GB13000. I字符集漢字部件規(guī)范規(guī)定了 560個(gè)部件。數(shù)百個(gè)部件如何合理分布在標(biāo)準(zhǔn)鍵盤上，一直是沒有解決的難題。介于規(guī)范部件與筆畫之間的第三級(jí)模式，由于較少考慮漢字自身規(guī)律，不受國(guó)家標(biāo)準(zhǔn)約束，或出于個(gè)人偏愛，或囿于一己之見，各種以己之長(zhǎng)比人之短的方案層出不窮。這正是導(dǎo)致漢字形碼和音形碼“萬(wàn)碼奔騰”低水平重復(fù)的重要原因。筆畫模式的優(yōu)點(diǎn)是易學(xué)好記，會(huì)寫就會(huì)輸入；缺點(diǎn)是筆畫多的輸入慢，筆畫少的重碼多，不會(huì)寫就不會(huì)輸入。由此可見，中國(guó)計(jì)算機(jī)用戶最缺的還是真正符合漢字規(guī)律，易學(xué)好用的漢字輸入方法。不僅如此，國(guó)內(nèi)外漢字教學(xué)也需要能夠真正有助于識(shí)字、寫字、查字和打字的漢字輸入編碼。漢字編碼的作用不僅僅在于輸入漢字。小學(xué)階段語(yǔ)文課最重要的教學(xué)任務(wù)是識(shí)字，好的漢字編碼輸入法在識(shí)字上應(yīng)該能夠起到其他手段起不到的作用，可以有效幫助學(xué)生學(xué)習(xí)和記憶漢字，明顯提高識(shí)字的時(shí)效，有利于學(xué)生對(duì)漢字的理解和熱愛，讓漢字規(guī)范的推廣工作落到實(shí)處。這些正是當(dāng)代漢字教學(xué)對(duì)漢字編碼輸入法提出的要求，如果漢字編碼本身就是ー種規(guī)范的識(shí)字法，并且有助于解決漢字難學(xué)的大問題，那就再好不過(guò)了！

發(fā)明內(nèi)容
本發(fā)明提供一種漢字編碼輸入法，用以在漢字輸入時(shí)幫助人們學(xué)習(xí)記憶漢字。為達(dá)到上述目的，本發(fā)明提供了一種漢字編碼輸入法，其包括以下步驟按照漢字拆分程序?qū)h字結(jié)構(gòu)進(jìn)行拆分，將漢字分為獨(dú)體字、左右相等或左中右相等、左少右多、左多右少、上下相等或上中下相等、上少下多、上多下少、兩面包圍、三面包圍以及四面包圍和特殊結(jié)構(gòu)，井分別用ー數(shù)字鍵作為其代碼；將漢字的筆畫分為橫、豎、撇、點(diǎn)、折，并分別用一數(shù)字鍵作為其代碼；根據(jù)所要輸入漢字的特點(diǎn)，將其漢字結(jié)構(gòu)的代碼作為編碼的第I位，將漢字的部件數(shù)量或筆畫數(shù)作為編碼的第2位，并將該漢字各個(gè)部件的筆畫的代碼作為編碼的第3 6位；通過(guò)鍵盤或軟鍵盤上的數(shù)字鍵將編碼輸入。較佳的，當(dāng)漢字為獨(dú)體字時(shí)，將該獨(dú)體字的筆畫數(shù)作為其編碼的第2位。較佳的，橫的代碼為1，豎的代碼為2，撇的代碼為3，點(diǎn)的代碼為4，折的代碼為5，與其他筆畫交叉的橫的代碼為6，豎鉤的代碼為7，與其他筆畫交叉的撇的代碼為8，與其他筆畫交叉的折的代碼為9。較佳的，當(dāng)漢字為獨(dú)體字，超過(guò)4畫的獨(dú)體字取其前4畫進(jìn)行編碼。較佳的，當(dāng)漢字包括2個(gè)部件時(shí)，分別取其2個(gè)部件的前2筆進(jìn)行編碼；當(dāng)漢字包括3個(gè)部件吋，分別取前2個(gè)部件的第I筆和第3個(gè)部件的前2筆進(jìn)行編碼；當(dāng)漢字包括4個(gè)及以上部件時(shí)，分別取前4個(gè)部件的第I筆進(jìn)行編碼；其中，若需要取前2筆的部件只有 I個(gè)筆畫吋，則編碼時(shí)將該筆畫重復(fù)2次。較佳的，用數(shù)字“O”用作編碼提前結(jié)束的標(biāo)志符。較佳的，在編碼中，用該漢字的拼音首字母作為該漢字編碼的最后一位，其中該拼音首字母可以出現(xiàn)在該漢字編碼的任何位置上。上述實(shí)施例中，根據(jù)漢字的漢字結(jié)構(gòu)、部件和筆畫進(jìn)行漢字的輸入，不僅可以作為高效靈活的漢字輸入方法，廣泛用于計(jì)算機(jī)和各類采用數(shù)字小鍵盤的信息終端設(shè)備；還可以用來(lái)幫助人們學(xué)習(xí)記憶漢字，對(duì)漢字教學(xué)中的識(shí)字、習(xí)字和查字均有較大的輔助作用。

為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例，對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講，在不付出創(chuàng)造性勞動(dòng)的前提下，還可以根據(jù)這些附圖獲得其他的附圖。圖I為根據(jù)本發(fā)明ー實(shí)施例的漢字輸入法流程圖；圖2為根據(jù)本發(fā)明ー實(shí)施例的漢字編碼輸入界面屏幕截圖；圖3為根據(jù)本發(fā)明ー實(shí)施例的數(shù)字純形碼單字輸入“漢”屏幕截圖；圖4為根據(jù)本發(fā)明ー實(shí)施例的數(shù)字純形碼單字輸入“字”屏幕截圖；圖5為根據(jù)本發(fā)明ー實(shí)施例的數(shù)字純形碼單字輸入“編”屏幕截圖；圖6為根據(jù)本發(fā)明ー實(shí)施例的數(shù)字純形碼單字輸入“碼”屏幕截圖；圖7為根據(jù)本發(fā)明ー實(shí)施例的數(shù)字純形碼詞語(yǔ)輸入“漢字編碼”屏幕截圖；圖8為根據(jù)本發(fā)明ー實(shí)施例的形音碼詞語(yǔ)輸入“漢字編碼”屏幕截圖；圖9為根據(jù)本發(fā)明ー實(shí)施例的純音碼詞語(yǔ)輸入“漢字編碼”屏幕截圖；圖10為根據(jù)本發(fā)明ー實(shí)施例的三碼混合詞語(yǔ)輸入“漢字編碼”屏幕截圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整的描述，顯然，所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例?；诒景l(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒有付出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。本發(fā)明涉及ー種符合國(guó)家標(biāo)準(zhǔn)規(guī)范，面向漢字教學(xué)，具有數(shù)字純形、形音結(jié)合與字母純音三種格式無(wú)切換混用功能的漢字編碼輸入法。該方法以數(shù)字表形為主，輔之以拼音首字母，故稱之為“數(shù)形輔音”輸入法。漢字編碼輸入法是中文信息進(jìn)入計(jì)算機(jī)和移動(dòng)信息終端設(shè)備的最重要的入ロ。同時(shí)也是漢字教學(xué)的重要手段和工具，并且還是解決漢字排序檢索問題的技術(shù)途徑。本發(fā)明在完全遵守國(guó)家語(yǔ)言文字有關(guān)標(biāo)準(zhǔn)和規(guī)范的基礎(chǔ)上，從漢字結(jié)構(gòu)與構(gòu)形要素之間的數(shù)量關(guān)系入手，提取出“構(gòu)形數(shù)量”這一新的編碼元素，并且用O 9十個(gè)數(shù)字直接表達(dá)這種編碼元素，輔之以漢語(yǔ)拼音首字母，形成了遵循國(guó)家標(biāo)準(zhǔn)規(guī)范，面向漢字教學(xué)，具有數(shù)字純形、形音結(jié)合和字母純音三種格式無(wú)切換混用功能的漢字編碼輸入法。圖I為根據(jù)本發(fā)明ー實(shí)施例的漢字編碼輸入法流程圖。如圖I所示，該漢字輸入法包括以下步驟S102,按照漢字拆分程序?qū)h字結(jié)構(gòu)進(jìn)行拆分，將漢字分為獨(dú)體字、左右相等或左中右相等、左少右多、左多右少、上下相等或上中下相等、上少下多、上多下少、兩面包圍、三面包圍以及四面包圍和特殊結(jié)構(gòu)，井分別用ー數(shù)字鍵作為其代碼；將漢字的筆畫分為橫、豎、撇、點(diǎn)、折，并分別用一數(shù)字鍵作為其代碼；S104，根據(jù)所要輸入漢字的特點(diǎn)，將其漢字結(jié)構(gòu)的代碼作為編碼的第I位，將漢字的部件數(shù)量或筆畫數(shù)作為編碼的第2位，并將該漢字各個(gè)部件的筆畫的代碼作為編碼的第3 6位；S106，通過(guò)鍵盤或軟鍵盤上的數(shù)字鍵將編碼輸入。本實(shí)施例中，根據(jù)漢字的漢字結(jié)構(gòu)、部件和筆畫進(jìn)行漢字的輸入，不僅可以作為高效靈活的漢字輸入方法，廣泛用于計(jì)算機(jī)和各類采用數(shù)字小鍵盤的信息終端設(shè)備；還可以用來(lái)幫助人們學(xué)習(xí)記憶漢字，對(duì)漢字教學(xué)中的識(shí)字、習(xí)字和查字均有較大的輔助作用。根據(jù)部件在整字中的位置關(guān)系對(duì)漢字進(jìn)行分類，完全符合《現(xiàn)代常用字部件及部件名稱規(guī)范GF0014-2009》的要求。在信息交換用漢字編碼字符集-基本集GB2312的6763個(gè)漢字中，左右結(jié)構(gòu)的漢字多達(dá)4272個(gè)，超過(guò)了 63%。本著有效利用編碼空間，盡量均衡編碼分布的設(shè)計(jì)原則，將左右結(jié)構(gòu)細(xì)分為三個(gè)子類左(中)右相等、左少右多、左多右少。上下結(jié)構(gòu)的漢字的數(shù)量也相當(dāng)多。GB2312的6763個(gè)漢字中，上下結(jié)構(gòu)的漢字共有1560個(gè)，占到23%。故也將其分為三類上(中)下相等、上少下多、上多下少。無(wú)論是左右結(jié)構(gòu)還是上下結(jié)構(gòu)，所謂相等與多少，對(duì)于兩部件字來(lái)說(shuō)，指的是兩個(gè)部件筆畫之間的數(shù)量關(guān)系；對(duì)于三個(gè)或三個(gè)以上部件的漢字來(lái)說(shuō)，則是指部件之間的數(shù)量關(guān)系。關(guān)于漢字部件的拆分方法，以及如何確定左右或上下兩個(gè)部分中部件的多與少。本發(fā)明主要依據(jù)《漢字部件規(guī)范》研制組在“關(guān)于制訂《漢字部件規(guī)范》的若干問題”(簡(jiǎn)稱部件規(guī)范)中相關(guān)規(guī)定。部件規(guī)范將漢字的拆分程序定義為“漢字拆分為部件的次序。對(duì)層次結(jié)構(gòu)的漢字遞次進(jìn)行有理?yè)?jù)拆分，稱層次拆分；對(duì)平面結(jié)構(gòu)的漢字進(jìn)行一次性的有理?yè)?jù)拆分或無(wú)理?yè)?jù)拆分，稱平面拆分。”
本發(fā)明根據(jù)部件拆分程序中的首層拆分來(lái)確定左右結(jié)構(gòu)和上下結(jié)構(gòu)漢字中部件分布究竟是哪邊少哪邊多。例如，“做”由“イ、十、ロ、夂”四個(gè)部件組成。其首層拆分結(jié)果是“イ”和“故”，所以是“左少右多”結(jié)構(gòu)?！靶隆庇伞傲ⅰ⒛?、斤”三個(gè)部件組成，其首層拆分結(jié)果是“親”和“斤”，故為“左多右少”結(jié)構(gòu)。“花”由“*、イ、匕”三個(gè)部件組成，其首層拆分結(jié)果是和“化”，所以是“上少下多”結(jié)構(gòu)?！跋搿庇伞澳?、目、心”三個(gè)部件組成，其首層拆分結(jié)果是“相”和“心”，故為“上多下少”結(jié)構(gòu)。由此可見，本發(fā)明不僅包含了部件數(shù)量信息，而且還反映了部件拆分的規(guī)范過(guò)程。除了左右和上下結(jié)構(gòu)，其他結(jié)構(gòu)的漢字?jǐn)?shù)量相對(duì)來(lái)說(shuō)比較少。因此用8代表所有兩面包圍結(jié)構(gòu)的漢字，包括上左包圍、上右包圍和左下包圍ニ種；用9代表所有ニ面包圍的漢字，其中包括左上右包圍、上左下包圍和左下右包圍ニ種。用O代表四面包圍和其他特殊結(jié)構(gòu)的漢字。漢字編碼的關(guān)鍵在于如何分解數(shù)量龐大的漢字集合。本發(fā)明的第I位編碼是對(duì)編碼漢字集的第一次分解，其分解的效果(均勻度)對(duì)重碼率和重碼字相似度的影響非常大，上述方法比較均勻地分解了高度聚集在左右結(jié)構(gòu)和上下結(jié)構(gòu)區(qū)域的大量漢字。部件數(shù)量與位置關(guān)系屬于漢字的宏觀屬性，顯而易見，較少有ニ義性。本發(fā)明利用這些元素來(lái)描述漢字，巧妙規(guī)避了部件數(shù)量過(guò)多，拆分不規(guī)范、部件名稱不定等一系列難題。從圖I的實(shí)施例中可以看出，〈漢字?jǐn)?shù)字純形編碼 >:= < 結(jié)構(gòu)碼X數(shù)量碼〉{く筆畫碼>}。其中，〈結(jié)構(gòu)碼=〈獨(dú)體字>|〈合體字〉，例如可以將令獨(dú)體字的代碼為1，即〈獨(dú)體字:=I ；<合體字 >::=〈左右結(jié)構(gòu)>I<上下結(jié)構(gòu)>I<兩面包圍>I<三面包圍>|<四面包圍和特殊結(jié)構(gòu) >，〈左右結(jié)構(gòu) >::=〈左(中)右相等>1〈左少右多>1〈左多右少 >,令〈左(中)右相等〉=2，〈左少右多>::=3，〈左多右少:=4 ；<上下結(jié)構(gòu)>::=〈上(中)下相等>|〈上少下多>|〈上多下少〉，〈上(中)下相等〉=5，〈上少下多〉=6,〈上多下少:=7, <兩面包圍>::=8,〈三面包圍>::=9,〈四面包圍和特殊結(jié)構(gòu)>::=0。在上述實(shí)施例中，數(shù)量碼為漢字的部件數(shù)目，當(dāng)漢字為獨(dú)體字時(shí)，可以將該獨(dú)體字的筆畫數(shù)作為其編碼的第2位。即〈數(shù)量碼 >::=〈筆畫數(shù)>|〈部件數(shù)〉，〈筆畫數(shù)〉=1|2|3|4|5|6|7|8|9(數(shù)字9表示筆畫等于或超過(guò)9畫)，〈部件數(shù)〉=1|2|3|4|5|6|7|8|9(數(shù)字9表示部件數(shù)等于或超過(guò)9個(gè))。其中，本發(fā)明實(shí)施例中的部件是指《漢字部首表G0011-2009》中的部首和《現(xiàn)代常用字部件及部件名稱規(guī)范GF0014-2009》中的基礎(chǔ)部件。《漢字部首表》采用的部首定義是“可以成批構(gòu)字的一部分部件”(GB/T12200);《現(xiàn)代常用字部件及部件名稱規(guī)范》遵循的部件定義是“由筆畫組成的具有組配漢字功能的構(gòu)字單位”(GB/T 12200)。大部分規(guī)范部首即是規(guī)范基礎(chǔ)部件?！稘h字部首表》201個(gè)主部首中，只有22個(gè)不屬于《現(xiàn)代常用字部件及部件名稱規(guī)范》中的基礎(chǔ)部件。本發(fā)明將屬于部首的基礎(chǔ)部件稱為“部首部件”，將不是部首的基礎(chǔ)部件稱為“非部首部件”，將不屬于基礎(chǔ)部件的部首稱為“非部件部首”。只有按照部首和部件規(guī)范的要求拆分漢字，才能得到正確的部件數(shù)。這樣設(shè)計(jì)是為了把漢字結(jié)構(gòu)知識(shí)融入到編碼中去，以便通過(guò)編碼輸入鞏固對(duì)漢字形體結(jié)構(gòu)的記憶，避免因?yàn)槭褂糜?jì)算機(jī)而淡忘了漢字的字形。盡管這樣做會(huì)提高編碼的學(xué)習(xí)難度，但這正是面向漢字教學(xué)的需要，因?yàn)椴考菨h字形體中承上啟下的關(guān)鍵組配単位，若想正確理解和記憶漢字字形，掌握字形與字義的關(guān)系，就必須知道漢字是由哪幾個(gè)部件組配而成的。對(duì)于合體字來(lái)說(shuō)，至少包含兩個(gè)部件，因此數(shù)量碼不可能為I。本發(fā)明中，數(shù)量碼I并不表示合體字的部件數(shù)量，而是將合體字視為ー個(gè)整體，不做拆分。也即像獨(dú)體字那樣輸入漢字的前四筆。這樣設(shè)計(jì)為的是，當(dāng)不知道如何拆分，或無(wú)法確認(rèn)某個(gè)漢字的部件數(shù)量時(shí)也能輸入該漢字。例如，筆畫編碼遵循國(guó)家標(biāo)準(zhǔn)，橫的代碼為1，豎的代碼為2，撇的代碼為3，點(diǎn)的代碼為4，折的代碼為5 ;為了分化使用頻度較高的“橫豎撇折”這四種筆畫，并在筆畫編碼層面體現(xiàn)筆畫的交叉關(guān)系，與其他筆畫交叉的橫的代碼為6，豎鉤(與豎相區(qū)別)的代碼為7，與其他筆畫交叉的撇的代碼為8，與其他筆畫交叉的折的代碼為9。即〈筆畫碼 >::=〈橫> I〈豎 > I〈撇 > I〈點(diǎn) > I〈折〉，〈橫〉:=11 6,〈豎 >::=2 I 7,〈撇 >::=3 I 8,〈點(diǎn)〉:=4，〈折〉=5 I 9。例如，當(dāng)漢字為獨(dú)體字，筆畫碼的長(zhǎng)度因筆畫數(shù)而定，超過(guò)4畫獨(dú)體字取其前4畫進(jìn)行編碼。例如，當(dāng)漢字包括2個(gè)部件時(shí)，分別取其2個(gè)部件的前2筆進(jìn)行編碼；當(dāng)漢字包括3個(gè)部件吋，分別取前2個(gè)部件的第I筆和第3個(gè)部件的前2筆進(jìn)行編碼；當(dāng)漢字包括4個(gè)及以上部件吋，分別取前4個(gè)部件的第I筆進(jìn)行編碼；其中，若需要取前2筆的部件只有I個(gè)筆畫吋，則編碼時(shí)將該筆畫重復(fù)2次。例如，除了第一位用來(lái)表示四面包圍結(jié)構(gòu)之外，編碼時(shí)數(shù)字“O”還可用作編碼提前結(jié)束的標(biāo)志符。本發(fā)明不但可以單字逐個(gè)輸入漢字，也可以用來(lái)輸入詞語(yǔ)。本發(fā)明不設(shè)置任何簡(jiǎn)碼，在輸入詞語(yǔ)時(shí)，可以用“O”來(lái)提前結(jié)束當(dāng)前輸入漢字的編碼，并進(jìn)入下一個(gè)漢字的輸入。這樣做的好處是無(wú)需固定碼長(zhǎng)，隨時(shí)根據(jù)以往的經(jīng)驗(yàn)和輸入的內(nèi)容，任意調(diào)節(jié)編碼的長(zhǎng)短(不包含結(jié)束符最短可以只有一位)，既可無(wú)拘無(wú)束，又能高效輸入。為了更好地適合漢字教學(xué)，本發(fā)明的輸入法除了以上說(shuō)明的數(shù)字純形碼(以下簡(jiǎn)稱純形碼)之外，還利用拼音首字母，對(duì)其進(jìn)行了擴(kuò)展，從而形成“形音結(jié)合”和“字母純音”另外兩種方式(以下分別簡(jiǎn)稱為“形音碼”和“純音碼”)。例如，在編碼中，用該漢字的拼音首字母作為該漢字編碼的最后一位，該拼音首字母可以出現(xiàn)在該漢字編碼的任何位置上。本實(shí)施例的形音碼是在純形碼的基礎(chǔ)上，加上漢字拼音第一個(gè)字母所構(gòu)成，屬于以形為主，形音結(jié)合的一種漢字編碼輸入法。當(dāng)小學(xué)生學(xué)會(huì)了漢語(yǔ)拼音之后，可以用形音碼來(lái)輸入漢字，這樣不僅可以鞏固所學(xué)拼音，還能進(jìn)一歩降低重碼鍵選率，提高輸入效率。本發(fā)明的形音碼中，拼音首字母位于編碼的最后，但不固定其位置。拼音首字母有兩個(gè)作用。其一是用來(lái)分解重碼，其ニ是用作編碼結(jié)束標(biāo)志。第一個(gè)作用顯而易見，而第二個(gè)作用則是本發(fā)明的一大特點(diǎn)。就碼長(zhǎng)而言，漢字?jǐn)?shù)字編碼可以分為固定碼長(zhǎng)和非固定碼長(zhǎng)兩種。等長(zhǎng)編碼的優(yōu)點(diǎn)是無(wú)需結(jié)束符，缺點(diǎn)是存在大量只是為了湊齊長(zhǎng)度的空碼。而非等長(zhǎng)編碼雖然編碼效率高，但是兩個(gè)漢字編碼之間需要分隔符，或者需要規(guī)定特定情況下(例如詞語(yǔ)輸入)的碼長(zhǎng)。而本發(fā)明的形音碼只有最后一位是拼音字母，其余都是數(shù)字，所以這個(gè)拼音字母，既是有效碼元，又起到了結(jié)束符的作用，而且可以在編碼的第I至第6位的任何位置上鍵入該拼音首字母，作為編碼提前結(jié)束的最后ー個(gè)碼元。當(dāng)拼音首字母出現(xiàn)在第一碼位上時(shí)，就是本發(fā)明的純音碼。純音碼只有一位，主要用來(lái)快速輸入較長(zhǎng)的詞語(yǔ)。本發(fā)明的形音碼只用一位拼音首字母，就實(shí)現(xiàn)了徹底的碼長(zhǎng)自由，在I至7的任何ー個(gè)碼位，都允許鍵入拼音首字母。本發(fā)明用的純形碼，需要用額外的“ O”來(lái)提前結(jié)束編碼，而形音碼則實(shí)現(xiàn)了碼長(zhǎng)自由度與編碼高效率的完美統(tǒng)一。本發(fā)明的漢字?jǐn)?shù)形輔音規(guī)范編碼輸入法不僅可以做到“見字識(shí)碼”，對(duì)于相當(dāng)一部分漢字來(lái)說(shuō)，還能做到“見碼識(shí)字”。以下為根據(jù)本發(fā)明ー優(yōu)選實(shí)施例其實(shí)施軟件是一個(gè)WPF (Windows Presentation Foundation)程序，可以運(yùn)行在Windows XP以及更高版本的操作系統(tǒng)環(huán)境下。其主要功能是將用戶通過(guò)標(biāo)準(zhǔn)鍵盤輸入的漢字編碼轉(zhuǎn)換成漢字或詞語(yǔ)。下面結(jié)合實(shí)施軟件和附圖，對(duì)本發(fā)明作進(jìn)ー步說(shuō)明。圖2是該實(shí)施軟件界面，左邊是編碼輸入框，右邊是候選字詞選擇框。在選擇框上方顯示選擇結(jié)果，以及與候選字詞相關(guān)的統(tǒng)計(jì)參數(shù)。圖3至圖6是用純形碼分別輸入單字“漢字編碼”四個(gè)字，其中“漢”和“碼”只需輸入5位編碼，即可唯一確定?！熬帲?，的編碼與其他字相重，但是首選字，故無(wú)需鍵選。圖7是用純形碼輸入詞語(yǔ)“漢字編碼”的過(guò)程。第一個(gè)漢字用了 5位編碼(42449)輸入。當(dāng)詞語(yǔ)的第一個(gè)輸入后，其余的宇大都無(wú)需全碼輸入。本實(shí)施例中，只用了兩位編碼
(52)即可輸入“字”。而“編”和“碼”只分別用了一位編碼，就完成了整個(gè)詞語(yǔ)的輸入。由此可見，使用本發(fā)明的方法，即使只用十個(gè)數(shù)字，也能有效縮短碼長(zhǎng)，高速輸入中文。圖8顯示了用形音碼輸入詞語(yǔ)“漢字編碼”的過(guò)程。詞語(yǔ)輸入時(shí)，形音碼可以進(jìn)ー步縮短碼長(zhǎng)。本實(shí)施例中四個(gè)字的平均碼長(zhǎng)只有I. 75。圖9記錄了純音碼輸入詞語(yǔ)“漢字編碼”的過(guò)程。純音碼主要用來(lái)輸入字?jǐn)?shù)較多的詞語(yǔ)(三字以上)。從本實(shí)施例可以看出，純音碼顯然不適合輸入單字和雙字詞，但是輸入像“漢字編碼”這樣的多次詞是非常高效的。本實(shí)施例的平均碼長(zhǎng)為I。圖10體現(xiàn)了本發(fā)明“三種方式無(wú)切換混用”的特點(diǎn)。使用者可以根據(jù)漢字學(xué)習(xí)進(jìn)度，或者對(duì)具體漢字字形和讀音的認(rèn)知程度，以及漢字輸入方面的經(jīng)驗(yàn)積累，選擇最適合自己的方式，從而避免單ー輸入方式的局限。本發(fā)明不僅提供了適合漢字教學(xué)不同階段使用的不同編碼方式，同時(shí)還實(shí)現(xiàn)了相互之間的無(wú)切換混用。從只用十個(gè)數(shù)字輸入漢字或詞語(yǔ)(純形)，到用數(shù)字和拼音首字母輸入漢字或詞語(yǔ)(形音結(jié)合)，再到只用拼音首字母輸入詞語(yǔ)(純音)。均可以隨字隨詞自由選擇。例如，輸入詞語(yǔ)“漢字編碼”，可以有如表I所示的不同方法(但非全部)表I
權(quán)利要求
1.一種漢字編碼輸入法，其特征在于，包括以下步驟按照漢字拆分程序?qū)h字結(jié)構(gòu)進(jìn)行拆分，將漢字分為獨(dú)體字、左右相等或左中右相等、左少右多、左多右少、上下相等或上中下相等、上少下多、上多下少、兩面包圍、三面包圍以及四面包圍和特殊結(jié)構(gòu)，并分別用一數(shù)字鍵作為其代碼；將漢字的筆畫分為橫、豎、撇、點(diǎn)、折，并分別用一數(shù)字鍵作為其代碼；根據(jù)所要輸入漢字的特點(diǎn)，將其漢字結(jié)構(gòu)的代碼作為編碼的第I位，將漢字的部件數(shù)量或筆畫數(shù)作為所述編碼的第2位，并將該漢字各個(gè)部件的筆畫的代碼作為所述編碼的第3 6位；通過(guò)鍵盤或軟鍵盤上的數(shù)字鍵將所述編碼輸入。
2.根據(jù)權(quán)利要求I所述的漢字輸入法，其特征在于，當(dāng)漢字為獨(dú)體字時(shí)，將該獨(dú)體字的筆畫數(shù)作為其編碼的第2位。
3.根據(jù)權(quán)利要求I所述的漢字輸入法，其特征在于，橫的代碼為1，豎的代碼為2，撇的代碼為3，點(diǎn)的代碼為4，折的代碼為5，與其他筆畫交叉的橫的代碼為6，豎鉤的代碼為7，與其他筆畫交叉的撇的代碼為8，與其他筆畫交叉的折的代碼為9。
4.根據(jù)權(quán)利要求I所述的漢字輸入法，其特征在于，當(dāng)漢字為獨(dú)體字，超過(guò)4畫的獨(dú)體字取其前4畫進(jìn)行編碼。
5.根據(jù)權(quán)利要求I所述的漢字輸入法，其特征在于當(dāng)漢字包括2個(gè)部件時(shí)，分別取其2個(gè)部件的前2筆進(jìn)行編碼；當(dāng)漢字包括3個(gè)部件時(shí)，分別取前2個(gè)部件的第I筆和第3個(gè)部件的前2筆進(jìn)行編碼；當(dāng)漢字包括4個(gè)及以上部件時(shí)，分別取前4個(gè)部件的第I筆進(jìn)行編碼；其中，若需要取前2筆的部件只有I個(gè)筆畫時(shí)，則編碼時(shí)將該筆畫重復(fù)2次。
6.根據(jù)權(quán)利要求I所述的漢字輸入法，其特征在于，用數(shù)字“O”用作編碼提前結(jié)束的標(biāo)志符。
7.根據(jù)權(quán)利要求I所述的漢字輸入法，其特征在于，在所述編碼中，用該漢字的拼音首字母作為該漢字編碼的最后一位，其中該拼音首字母可出現(xiàn)在該漢字編碼的任何位置上。
全文摘要
本發(fā)明公開了一種漢字編碼輸入法，其包括按照漢字拆分程序?qū)h字結(jié)構(gòu)進(jìn)行拆分，將漢字分為獨(dú)體字、左右相等或左中右相等、左少右多、左多右少、上下相等或上中下相等、上少下多、上多下少、兩面包圍、三面包圍以及四面包圍和特殊結(jié)構(gòu)，并分別用一數(shù)字鍵作為其代碼；將漢字的筆畫分為橫、豎、撇、點(diǎn)、折，并分別用一數(shù)字鍵作為其代碼；根據(jù)所要輸入漢字的特點(diǎn)，將其漢字結(jié)構(gòu)的代碼作為編碼的第1位，將漢字的部件數(shù)量或筆畫數(shù)作為編碼的第2位，并將該漢字各個(gè)部件的筆畫的代碼作為編碼的第3～6位；通過(guò)鍵盤或軟鍵盤上的數(shù)字鍵將編碼輸入。
文檔編號(hào)G06F3/023GK102830809SQ20111016042
公開日2012年12月19日申請(qǐng)日期2011年6月15日優(yōu)先權(quán)日2011年6月15日
發(fā)明者董為群申請(qǐng)人:高靜敏, 董為群

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：董為群
技術(shù)所有人：高靜敏;董為群
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

漢字編碼相關(guān)技術(shù)

漢字編碼查詢相關(guān)技術(shù)

中文手寫輸入法相關(guān)技術(shù)

可愛字體輸入法相關(guān)技術(shù)

漢字編碼查詢系統(tǒng)相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

漢字編碼輸入法的制作方法