亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

計(jì)算機(jī)漢字輸入規(guī)則碼的制作方法

文檔序號(hào):6605982閱讀:461來(lái)源:國(guó)知局
專利名稱:計(jì)算機(jī)漢字輸入規(guī)則碼的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種計(jì)算機(jī)漢字輸入規(guī)則碼
在科學(xué)技術(shù)飛速發(fā)展,信息量不斷膨脹的今天,計(jì)算機(jī)漢字輸入依舊面臨難題,非鍵盤輸入雖然異軍突起,但在高速、準(zhǔn)確及經(jīng)濟(jì)性上還是不能滿足廣大用戶的需求,更不用說(shuō)在大字符集和繁體字上使用。實(shí)際上效率較差的拼音輸入法仍是絕大多數(shù)人的首選輸入法,許多人苦于沒有好的輸入法才不得不使用它。一個(gè)易學(xué)、高效且部件規(guī)范的輸入法仍然是社會(huì)發(fā)展的迫切需求。為此,筆者在95年發(fā)明的歸演碼的基礎(chǔ)上發(fā)明了規(guī)則碼,旨在集拼音輸入地易學(xué)和形碼的高效之大成,突破規(guī)范性和易學(xué)性的關(guān)卡,打破形碼必然難學(xué)的神話?,F(xiàn)在,規(guī)則碼終于在保持高效易學(xué)的前提下使部件的選取完全符合1998年5月1日實(shí)施的“信息處理用GB13000.1字符集漢字部件規(guī)范”。規(guī)則碼不但高效、易學(xué)且實(shí)用性強(qiáng),其從規(guī)則的制定到部件的選取均從實(shí)際出發(fā),為使用方便而設(shè)。很顯然,由于規(guī)則碼滿足的是GB13000.1大字符集的規(guī)范,所以它能夠做到簡(jiǎn)繁共體,一套規(guī)則即適用于簡(jiǎn)化字又適用于繁體字。一、規(guī)則碼的概念體系1.筆劃
規(guī)則碼采用“點(diǎn)”、“橫”、“豎”、“撇”、“捺”、“挑”、“勾”、“折”8種筆畫。其中“勾”包括“豎挑”、“橫勾”、“彎勾”、“彎折勾”一切勾,“折”包括“橫折”、“豎折”、“左折”、“右折”、“彎折”所有折。2.“字形”與“部件”
“字形”,即所有的漢字結(jié)構(gòu)形狀,而“部件”指規(guī)則碼中不可拆分的字形。規(guī)則碼的部件以560個(gè)規(guī)范部件為基準(zhǔn),兼顧通用字典的偏旁部首(189分部)。3.“有聲”、“無(wú)聲”及“聲碼”、“聲元”和“補(bǔ)碼”
規(guī)則碼將部件分為“有聲”、“無(wú)聲”兩部分,對(duì)有聲部件取其“聲碼”(漢語(yǔ)拼音的首字母或首聲母),對(duì)無(wú)聲部件取其首筆,解決了“學(xué)習(xí)難”的問(wèn)題,免除了學(xué)習(xí)者對(duì)大量漢字部件的死記硬背。
有聲部件即有聲可發(fā)的部件,顯然成字部件皆是有聲,如“十、二、三、土、骨、月”。不成字部件有通用名稱者也是有聲的,如“艸、扌、冫、灬、氵”,注意這些都是常見常用的偏旁部首。筆畫自然也是有聲部件。
“聲元”指的是兩筆畫以上的有聲部件,此概念主要用以區(qū)分筆畫。
“無(wú)聲部件”即讀不出聲的部件,如“マ、丂、ㄐ、ヰ、”
“補(bǔ)碼”即對(duì)不足四個(gè)部件的漢字編碼時(shí)追加的補(bǔ)充碼,有聲部件的補(bǔ)碼為該部件的首筆畫,而無(wú)聲部件的補(bǔ)碼為其末筆畫。
值得一提的是“ch、sh、zh”三個(gè)聲母在規(guī)則碼中與無(wú)法成為漢語(yǔ)拼音首字母的“i、u、v”按英文字母的順序一一對(duì)應(yīng),即“i”表示“ch”,“u”表示“sh”,“v”表示“zh”。二、“拆”與“不拆”
這是規(guī)范化的關(guān)鍵,規(guī)則碼有6條拆分規(guī)則1.相交不拆(上下穿過(guò)同交)
上下穿過(guò)是“相交”概念的延伸,如“乘、半”等字,雖然部件之間沒有實(shí)際接觸,但也視為相交。2“三筆以內(nèi)”不拆
該規(guī)則有兩個(gè)含意一是三筆以內(nèi)的字皆是部件,不再拆分,如“飛、三、乇”二是連續(xù)書寫的而又分離的三筆畫、兩筆畫不拆。3常用的成字偏旁部首不拆(以通用字典的189部為據(jù))4“封連”不拆
“封連”指的是部件之間相連且形成閉合回路,如“開、亞、卣”就是因?yàn)椤胺膺B”不拆而成為部5.多部件“組合”無(wú)聲不拆
此規(guī)則一是指成字字形只能拆成有聲部件,二是指不成字字形必須含有聲元才可拆。而“組合”是指相連和左右對(duì)稱兩種情況。6.離散、包圍可拆
要注意包圍結(jié)構(gòu)在規(guī)則碼中是可拆的,并且有包不算連,即在似包似連的時(shí)候一律視為包圍可拆,這樣可避免許多麻煩,例如“者、進(jìn)、考”。三、取碼規(guī)則1.單部件字,取該字的聲碼及首、末筆,共三碼
特例,單筆畫字取聲碼及筆畫,共兩碼。如乙“yg”、一“yh”,注意,“乙”和“一”只有獨(dú)自成字時(shí)才取其聲碼,其他時(shí)候當(dāng)做筆畫分別取“g”和“h”2.兩部件字,兩個(gè)部件碼加兩個(gè)補(bǔ)碼,共四碼
因?yàn)橐?guī)則碼將部件分為有聲和無(wú)聲,所以部件碼有可能取聲碼也有可能取部件的首筆,對(duì)于有聲部件,在取完部件碼后再取其首筆,對(duì)于無(wú)聲部件取完首筆取末筆。3.三部件字,三個(gè)部件碼加首部件或末部件的補(bǔ)碼,共四碼
規(guī)則碼最多取四碼,對(duì)于單左結(jié)構(gòu)(即左邊是單獨(dú)一部分)取首部件的首筆或末筆,否則取末部件的首筆或末筆。例如“汰、瞧、鵬、博、結(jié)”是單左結(jié)構(gòu),而“述、病、霖、斷、焚”不是單左結(jié)構(gòu)。4.多部件字,前三末一5少取先小
“少取”即少取部件,也就是說(shuō)可拆可不拆的不拆,但判斷的依據(jù)是有聲部件。如“卡”字視為“上卜”時(shí)可拆,而視為“
下”不可拆,但由于
是無(wú)聲部件,不能成為判據(jù),仍視為可拆;“天”字視為“一大相連”時(shí)可拆,而視為“二人相交”不可拆,同時(shí)成立但依據(jù)少取的規(guī)則不拆,視為單部件字?!跋刃 奔丛诓考?shù)相同時(shí)按先小后大的原則選取,如“蘭”字可視為“
二”,亦可視為“丷三”,按先小后大的原則取“丷三”。四、“a”與“o”的特殊作用
在拼音輸入法中鍵位的使用很不合理,只取部分部件的聲碼,情況有所改善,但“a”“o”兩個(gè)鍵還是用的少,為此規(guī)則碼對(duì)“a”“o”進(jìn)行了特殊處理?!癮”鍵另加兩大功能一是歸納擴(kuò)展,可用符號(hào)表達(dá)式
表示,“*”表示任意字形,即所有與“冖”有接觸的字形均用“a”表示,如“愛”字頭,學(xué)字頭,“孛”字頭,“旁”字頭,“璺”字頭,“囊”字頭,當(dāng)然“冖”也是;“a”鍵的另一功能是表示單部件字的“無(wú)聲”聲碼,如“卣”字,作為單部件字絕大多數(shù)人也不認(rèn)識(shí),好在可以借助于“a”鍵。
“o”鍵也另有兩大功能一是表示左右對(duì)稱重迭,如
;二是表示多音單部件字,如“重、單、長(zhǎng)、樂(lè)”。五、專用版
規(guī)則碼為了提高編碼效率,降低重碼率,在沒有增加額外的學(xué)習(xí)負(fù)擔(dān)的前提下推出了專用版,專用碼就是在上述規(guī)則碼的基礎(chǔ)上提出特征碼的概念,用特征碼取代前述有關(guān)部件的首筆畫。
所謂特征碼實(shí)際是對(duì)有聲部件的再次開發(fā)利用,由于在常用字中兩部件、三部件字居多(約80%),對(duì)這么大比重的單部件、雙部件及三部件字過(guò)分依賴8個(gè)筆畫去區(qū)分必然產(chǎn)生重碼較多的現(xiàn)象,因此為使規(guī)則碼能適應(yīng)一部分追求速度的用戶需求,特為一些要求高速輸入的用戶設(shè)計(jì)了特征碼,就是在不可拆分部件中取其中一個(gè)較大的有聲部分(無(wú)法取者仍取首筆畫)
就專用版而言,在GB2312字符集中重碼率為7%,在3755一級(jí)字中重碼率為4%,在GB13000.1大字符集中重碼率約為15%,使得規(guī)則碼在易學(xué)、規(guī)范及高效諸方面均達(dá)到一個(gè)新的水平。
規(guī)則碼及其專用版已在WINDOWS和UCDOS上實(shí)現(xiàn)。
權(quán)利要求
1.用聲碼及首筆畫表示部件的計(jì)算機(jī)漢字輸入規(guī)則碼,其中字形、部件、筆畫、有聲部件、無(wú)聲部件、聲碼、聲元、補(bǔ)碼、及特征碼組成基本概念體系。
2.按照權(quán)利要求1所述的規(guī)則碼將漢字結(jié)構(gòu)劃分為離散、包圍、相交、封連、組合及單左結(jié)構(gòu)。
3.按照權(quán)利要求1所述的規(guī)則碼拆分規(guī)則三筆不拆、封連不拆、成字偏旁部首不拆、多部件組合無(wú)聲不拆、似包似連可拆。
4.按照權(quán)利要求1所述的規(guī)則碼取碼規(guī)則單部件字取聲碼與首末筆、兩部件字兩聲碼加兩補(bǔ)碼、三部件字取三聲碼一補(bǔ)碼、少取先小。
5.按照權(quán)利要求1所述的規(guī)則碼對(duì)“a”與“o”兩鍵的特殊處理。
全文摘要
本發(fā)明是一個(gè)集拼音輸入的易學(xué)與形碼的高效率于一身的規(guī)范化漢字輸入編碼,基本部件不須記憶,且完全符合1998.5.1實(shí)施的GB13000.1的部件規(guī)范。規(guī)則碼用簡(jiǎn)單的聲碼或首筆畫表示部件,以26個(gè)英文字母編碼,簡(jiǎn)便易學(xué),經(jīng)濟(jì)實(shí)用。規(guī)則碼又分通用、專用兩種,二者采用相同的部件體系,但專用碼注重消除重碼,適合于高速錄入。規(guī)則碼不但易學(xué)、實(shí)用、規(guī)范、高效,而且簡(jiǎn)繁共體,尤其適合大字符集,其在大字符集中重碼率約為15%。
文檔編號(hào)G06F3/023GK1233008SQ9910614
公開日1999年10月27日 申請(qǐng)日期1999年4月28日 優(yōu)先權(quán)日1999年4月28日
發(fā)明者徐躍進(jìn) 申請(qǐng)人:徐躍進(jìn)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1