專利名稱:漢字筆畫編碼方法
技術(shù)領(lǐng)域:
本發(fā)明屬計算機漢字文字處理技術(shù)的輸入技術(shù),是一種對漢字的計算機輸入編碼方法,也可用于字典、辭典等的編排。
目前用于計算機漢字輸入的漢字編碼方法很多,大致可分為拼音碼、音形結(jié)合碼、字型碼、和流水碼四種。
這種編碼方法存在如下不足。
拼音碼即用漢語拼音進行編碼,其缺點是重碼率高,且普通話說不好的人無法使用;
音形結(jié)合碼,即根據(jù)漢字的讀音和字形進行編碼,該方法不僅象拼音碼一樣不懂普通話的人使用不便,而且記憶量大,記憶力差的老年人等使用起來很不方便;
字形碼是根據(jù)篩選出來的一套字元和一套編碼規(guī)則進行編碼,基本上是一種漢字輸入專業(yè)人員使用的漢字編碼方法,普通的計算機操作者使用起來記憶量很大很不方便;
流水碼即電報碼或區(qū)位碼等,純專業(yè)性編碼,普通操作人員幾乎無法使用。
本發(fā)明的目的即是要克服現(xiàn)有技術(shù)的不足,研制一種新的漢字編碼方法,其代碼量少一最好僅用10個數(shù)字,重碼率低-最好不超過10個漢字,簡單易學,特別是能適合記憶力相對差一些的計算機操作者。
本發(fā)明將漢字的筆畫分成單筆畫和復筆畫兩種,用1、2、3、4、5作單筆畫的代碼,而用6、7、8、9、0作篩選出來的18個復筆畫的代碼。對漢字的編碼規(guī)則是,依書寫順序提取第一、二、三、四筆畫進行編碼,在提取筆畫時,復筆畫優(yōu)先于單筆畫,可分為左右兩邊或左中右三邊的漢字,取左邊首筆畫為第一個編碼,其余三碼則從右邊或中右邊提取。
本發(fā)明的內(nèi)容詳述如下(一).將漢字的筆畫分為單筆畫和復筆畫,各筆畫的代碼如下,代碼代碼名稱筆畫單筆畫1豎丨2 橫一
3 點 、
4 撇捺丿
5 折鉤乛亅
復筆畫6六亠讠7十十艸8八八人亻入9 特定雨扌門
疒宀0口口囗(二).將各個筆畫分配在其代碼所在的通用計算機鍵盤數(shù)字鍵上;
(三).對漢字的編碼規(guī)則如下,(1).按漢字書寫筆畫順序提取第一、二、三、四筆畫,由這四個筆畫各自的代碼順次組成該漢字的編碼;
(2).提取筆畫時,復筆畫優(yōu)先于單筆畫;
(3).可分為左右兩邊、或左中右三邊的漢字,左邊按第一筆畫提取第一個代碼,其余三個代碼從右邊或中右邊提取;
(4).一個漢字僅有一至三筆畫時,相應的漢字編碼即由這些筆畫的代碼順次組成,也可以在其后面用’0’補足四個代碼。
為了便于記憶,本發(fā)明的發(fā)明人編了一個35字的口訣用于記憶筆畫編碼1豎2橫3點挑,4撇5折六字頭,7變作十8是八,9有特定0象口,雨打門前癡客笑。
最后一句是解釋’9’所代表的特定復筆畫;又編了一個三言五字詩用于記憶編碼規(guī)則筆順定先后,復筆不拆單,左一中右三。
這三句話即是上面編碼規(guī)則中的(1)、(2)、(3)三條規(guī)則。
下面舉幾個例子來說明本發(fā)明的編碼方法。
例1.’下’拆成橫、豎、點,編碼213,或2130;
例2.’斤’拆成撇、撇、橫、豎,編碼為4421;
例3.’爭’拆成撇、彎鉤、彎鉤、橫,編碼為4552;
例4.’王’拆成橫、十、橫、編碼272或2720;
例5.’紅’拆成彎鉤、橫、豎、橫,編碼為5212;
例6.’徹’拆成撇、橫、彎鉤、彎鉤,編碼為4255;
在上面的例子中,例4的’十’是復筆畫不能拆單,例5和例6的漢字可分成左右和左中右,因而第一個代碼取左邊的首筆畫,其余三筆取自右邊或中右邊。
本發(fā)明與現(xiàn)有技術(shù)相比,具有下列三個顯著優(yōu)點1.代碼量少,只用了10個數(shù)字,僅使用了單筆畫和篩選出來的18個復筆畫;
2.重碼率低,對國標GB2312-80漢字集的編碼,重碼率在5字以下的占60%,重碼最多的也不超過10個漢字;
3.簡單易學,10個編碼用35字口訣記憶,且形象生動,即使學齡兒童或記憶力相對差一些的老年人也能很快學會。
權(quán)利要求
1.漢字筆畫編碼方法,其特征在于(一).將漢字的筆畫分為單筆畫和復筆畫,各筆畫的代碼如下,代碼 代碼名稱 筆畫單筆畫 1 豎 丨2 橫 一/3 點 丶
4 撇捺 丿ㄟ5 折鉤
復筆畫 6 六亠讠7 十十卄8 八八人亻入9 特定 雨扌門
疒宀0 口 口囗(二).將各個筆畫分配在其代碼所在的通用計算機鍵盤數(shù)字鍵上;(三).對漢字的編碼規(guī)則如下,(1).按漢字書寫筆畫順序提取第一、二、三、四筆畫,由這四個筆畫各自的代碼順次組成該漢字的編碼;(2).提取筆畫時,復筆畫優(yōu)先于單筆畫;(3).可分為左右兩邊、或左中右三邊的漢字,左邊按第一筆畫提取第一個代碼,其余三個代碼從右邊或中右邊提取。
2.按權(quán)利要求1所述的漢字筆畫編碼方法,其特征在于一個漢字僅有一至三筆畫時,相應的漢字編碼即由這些筆畫的代碼順次組成,也可以在其后面用’0’補足四個代碼。
全文摘要
本發(fā)明將漢字的筆畫分成單筆畫和復筆畫兩種,用1、2、3、4、5作單筆畫的代碼,而用6、7、8、9、0作篩選出來的18個復筆畫的代碼。對漢字的編碼規(guī)則是,依書寫順序提取第一、二、三、四筆畫進行編碼,在提取筆畫時,復筆畫優(yōu)先于單筆畫,可分為左右兩邊或左中右三邊的漢字,取左邊首筆畫為第一個代碼,其余三碼則從右邊或中右邊提取。本發(fā)明代碼量少僅有10個,許多字都是一字一碼,重碼率極低,最多也不超過10個,而且簡單易記。
文檔編號G06F3/023GK1074297SQ9211017
公開日1993年7月14日 申請日期1992年9月3日 優(yōu)先權(quán)日1992年9月3日
發(fā)明者徐立潮, 徐應麟, 徐應祥 申請人:徐立潮, 徐應麟, 徐應祥