專利名稱:一種漢字編碼方案的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及漢字編碼方法,特別是漢字輸入方法。
當(dāng)前漢字輸入方法采用軟字庫加編碼已成為發(fā)展趨勢,不少漢字編碼方案應(yīng)運(yùn)而生,如目前公認(rèn)較為優(yōu)秀的編碼方案就有五筆字型、表形碼、首尾音形、雙筆音形等編碼方法。優(yōu)秀的漢字輸入方法要求易學(xué)且輸入速度快,五筆字型采用四編碼方案,大大減少重碼率,提高了輸入速度,但要記的字根多,拆字組碼困難,對非專業(yè)打字員不易接受;表形碼則將漢字字母數(shù)字化,比較直觀,但也同樣遇到拆分的問題,不易拆準(zhǔn);首尾輸入法只考慮首尾字根,簡化了組碼方法,而且加上第3個拼音識別碼后重碼率也比拼音法低得多,但同樣要牢記52個字根,學(xué)者亦覺困難。
雙筆輸入方法則采用第一碼(漢字的頭兩筆)加第二碼(對于多結(jié)構(gòu)字為第二大部的頭兩筆,對于連體字為第三筆)的編碼方式,只需記住組成漢字的五種基本筆形(一丨 丿丶)以及它們的任意兩個組合所在的鍵位,就能輸入漢字,省去記字根的麻煩,它的不足之處在于這第二大部的頭兩筆有時也不易確定,同樣要記住30個(其中有5個單筆)鍵位也不容易。
本發(fā)明的目的是尋找一種易學(xué)易記且輸入速度快的漢字輸入方法,特別適用于非專業(yè)打字員使用。
本發(fā)明改進(jìn)了雙筆輸入方案采用首碼(漢字的首兩筆)+尾碼(漢字的末兩筆)+拼音碼識別的方法。
下面詳細(xì)描述本發(fā)明的實(shí)現(xiàn)方法
一、定義鍵盤定義鍵盤方法一將組成漢字的基本筆形歸納為五個基本類型(一、丨、丿、丶、),它們的任意兩個組合成一個部件,一共組合出25個部件,這些部件在普通鍵盤上按一、丨、丿、丶、分成五個區(qū),各個區(qū)又按一、丨、丿、丶、分成五個位,所在區(qū)位的位置對應(yīng)一個鍵,將該鍵的字母作為漢字的編碼字母。
定義鍵盤方法二將組成漢字的基本筆形歸納為五個基本類型(一、丨、丿、丶、),將它們?nèi)我庥?、2、3、4、5來表示,這5個數(shù)字的任意兩個組合成一個部件,一共可組合出25個部件,這些部件在普通鍵盤上按1、2、3、4、5分成五個區(qū),各個區(qū)又按1、2、3、4、5分成五個位,所在區(qū)位的位置對應(yīng)一個鍵,將該鍵的字母作為漢字的編碼字母。
定義鍵盤方法三將組成漢字的基本筆形歸納為五個基本類型(一、丨、丿、丶、),用鍵盤上的1、2、3、4、5來表示它們,這樣就可將漢字的若干個筆劃用這些數(shù)字表示出來,即漢字的數(shù)字編碼。
按定義鍵盤方法一和方法二定義的鍵盤舉例見圖一、圖二、圖三、圖四。
二、漢字編碼方法一個漢字取左上角的二筆和右下角的二筆,左上角的二筆的組合(組合規(guī)則后述)在鍵盤上找到對應(yīng)的區(qū)位,該區(qū)位所在的鍵的字母,我們稱之為該漢字的首碼,同樣地,右下的二筆所對應(yīng)的字母我們稱之為該漢字的尾碼,首碼和尾碼的組合就是該漢字的首尾碼;首尾碼可再加上該漢字的漢語拼音的第一個字母構(gòu)成該漢字的形聲碼;將漢字左上角的二筆和右下角的二筆直接用數(shù)字表示并按一定的規(guī)則排列組成該漢字的數(shù)字碼,數(shù)字碼可再加上該漢字的漢語拼音的第一個字母構(gòu)成該漢字的混合碼。
對于帶聲母ch、Sh、Zh的漢字,上述所說的漢語拼音的第一個字母也可以分別是I、U、A,這樣更有利于減少重碼率。
可以直接定義若干個字母作為字根碼,它們分別代表一些漢字部首,如艸、扌、囗、日、小、木、大、钅、寸、土、阝、卩等,進(jìn)行漢字編碼時用字根碼代替首碼或尾碼。字根碼是調(diào)整重碼率的手段之一,字根碼多些,重碼率會低些,但使用者要的東西也多些,因此,本發(fā)明建議所定義的字根碼不多于10個。
對于詞組,則將第一個漢字的首尾碼或數(shù)字碼加上第二字或末字的拼音第一個字母構(gòu)成詞組碼,用詞組碼可對雙字詞組或多字詞組進(jìn)行編碼。
三、取碼組碼規(guī)則對于上述所說的首碼、尾碼或數(shù)字碼,其取碼組碼規(guī)則如下1、組碼時,按起筆位置,從左至右,從上至下;交叉筆形左先于上;同起點(diǎn)筆形,丿 丨先取。
2、全包圍形的部,如果被包圍部分有2筆或多于2筆,則包圍部分不取作尾碼,如果被包部分只有1筆,則將此筆與包圍部分的末筆組成尾碼,如果只有包圍部分,則從包圍部分取尾碼;3、與首筆或末筆相交的筆劃優(yōu)先被組碼;4、取尾碼時,首碼已取過的筆劃允許重取;5、取碼時, 作“一” 作“丶”、“”則代表 乙 等。
組合筆形所對應(yīng)的常見部件及其作首、尾碼的字例如表一。
實(shí)施例1按一、丨、 丿、丶、順序,用定義鍵盤方法一或定義鍵盤方法二定義的鍵盤如
圖1,字根碼艸-H、木-L、口-S,編碼舉例見表二。
實(shí)施例2按一、丨、 丿、丶、順序,用定義鍵盤方法一或定義鍵盤方法二定義的鍵盤如圖2,字根碼艸-G、木-S、口—L,編碼舉例見表三。
實(shí)施例3按一、丨、丿、、丶順序,用定義鍵盤方法一或定義鍵盤方法二定義的鍵盤如圖3,字根碼艸-H、木-M、口-K,編碼舉例見表四。
實(shí)施例4按丨、一、、丿、丶順序,用定義鍵盤方法一或定義鍵盤方法二定義的鍵盤如圖4,字根碼艸-G、木-M、口-S,編碼舉例見表五。
用本發(fā)明設(shè)計的漢字輸入方法,除特別定義的個別字根外,大多數(shù)的漢字以筆劃進(jìn)行直接組碼,取碼組碼方法簡單明了,通過合理的布局鍵位,一看字形便知編碼位置,不會寫不會讀漢字也會編碼。不會拼音者采用首尾雙碼法,懂拼音者采用形聲三碼法或詞組碼法,可大大提高輸入速度。數(shù)字碼或混合碼法則是適合于中年人使用的更簡單的方法,所以,本發(fā)明適合于不同層次的人使用。
權(quán)利要求
1.一種漢字編碼方案,將構(gòu)成漢字的五種基本筆形(一、丨、丿、丶、)的任意兩種組合出25個部件,這25個部件在普通鍵盤上分成一、丨、丿、丶、五個區(qū),每個區(qū)又按一、丨、丿、丶、分為五個位,區(qū)位所在的鍵作為漢字的碼,其特征在于一個漢字取左上角的兩筆和右下角的兩筆,左上角的兩筆對應(yīng)的區(qū)位鍵是該漢字的首碼,右下角的兩筆對應(yīng)的區(qū)位鍵是該漢字的尾碼,首碼和尾碼就組成了該漢字的首尾碼;首尾碼可再加上該漢字拼音的第一個字母組成形聲碼;
2.一種漢字編碼方案,將構(gòu)成漢字的五種基本筆形(一、丨、丿、丶、)任意用1、2、3、4、5來表示,這5個數(shù)字的任意兩個可組合出25個組合,這25個組合在普通鍵盤上分成1、2、3、4、5五個區(qū),每個區(qū)又按1、2、3、4、5分為五個位,區(qū)位所在的鍵作為漢字的碼,其特征在于一個漢字取左上角的兩筆和右下角的兩筆,左上角的兩筆對應(yīng)的數(shù)字所在的區(qū)位鍵是該漢字的首碼,右下角的兩筆對應(yīng)的數(shù)字所在的區(qū)位鍵是該漢字的尾碼,首碼和尾碼就組成了該漢字的首尾碼;首尾碼可再加上該漢字拼音的第一個字母組成形聲碼;
3.根據(jù)權(quán)利要求1或2所述的一種漢字編碼方案,其特征在于首尾碼加上第二字或末字拼音的第一個字母組成詞組碼;
4.一種漢字編碼方案,將構(gòu)成漢字的五種基本筆形(一、丨、丿、丶、)任意用1、2、3、4、5來表示,其特征在于一個漢字取左上角的兩筆和右下角的兩筆,4個筆劃對應(yīng)的數(shù)字順序排列就是該漢字的數(shù)字碼,數(shù)字碼可再加上該漢字拼音的第一個字母構(gòu)成混合碼;
5.根據(jù)權(quán)利要求4所述的一種漢字編碼方案,其特征在于數(shù)字碼加上第二字或末字拼音的第一個字母組成詞組碼;
6.根據(jù)權(quán)利要求1或2所述的一種漢字編碼方案,其特征在于可將漢字的若干個部首(如艸、寸、扌、囗、日、木、大、土、阝卩、钅等)直接用字母定義為字根碼,可以多部一碼,用字根碼代替漢字的酋碼或尾碼,字根碼不多于10個。
全文摘要
一種漢字編碼方法,取漢字左上角的兩筆為首碼,取漢字右下角的兩筆為尾碼,首碼和尾碼組成漢字的首尾碼,首尾碼加該漢字拼音第一個字母組成形聲碼,首尾碼加第二字或末字的拼音第一個字母組成詞組碼。本發(fā)明以筆劃進(jìn)行直接組碼,取碼組碼方法簡單,字根少。不會寫、不會讀漢字也會編碼,可采用首尾雙碼法,也可采用形聲三碼法或詞組碼法,適合于不同層次的人員使用,且一經(jīng)掌握,不用也不容易忘記。
文檔編號G06F3/023GK1116337SQ9411802
公開日1996年2月7日 申請日期1994年11月22日 優(yōu)先權(quán)日1994年11月22日
發(fā)明者鄭秀清 申請人:鄭秀清