專利名稱:分組選字式漢字輸入方案的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電子計(jì)算機(jī)漢字輸入方案,特別是涉及一種按漢字形聲字聲旁分組選字并用筆劃法作補(bǔ)充的漢字輸入方案。
目前國(guó)內(nèi)外小鍵盤(pán)漢字編碼輸入方案已達(dá)九百種,一般可分為以音為主、以形為主和音形結(jié)合三大類(lèi)。已有方案除以形為主外,一般都要求熟悉漢語(yǔ)拼音,正確讀音,少數(shù)也有對(duì)拼音進(jìn)行簡(jiǎn)化,但簡(jiǎn)化的幅度都不太大,效果也不十分明顯,使用這類(lèi)方案如果拼讀不準(zhǔn)就會(huì)找不到字,對(duì)于不太熟悉拼音的人來(lái)說(shuō),或者在遇到非常用字、生僻字等時(shí),輸入就會(huì)發(fā)生困難,影響輸入速度。以形為主的方案要求使用者按照一定順序讀取字的基本筆劃,或把漢字分解為若干基本部件按一定方式進(jìn)行拼裝,如王永民等提出的五筆劃漢字編碼輸入方案(見(jiàn)《電腦知識(shí)手冊(cè)》,海洋出版社1984年版),在張壽萱、徐建毅、張建生所著的《中文信息的計(jì)算機(jī)處理》(宇航出版社,1984年版)一書(shū)中,也敘述了幾種已有的編碼方案,如“見(jiàn)字識(shí)碼”、“三角編碼”等,并對(duì)普遍性問(wèn)題進(jìn)行了討論,這類(lèi)方案往往部件劃分不一,拆字方法各異,不利于普及推廣,而且在編排時(shí)漢字分組常常很不均衡,即某些組內(nèi)字?jǐn)?shù)較少,另一些組內(nèi)字?jǐn)?shù)較多,這樣如果不能完全實(shí)現(xiàn)盲打,根據(jù)屏幕提示進(jìn)行選擇時(shí)就需要在很長(zhǎng)一串字內(nèi)選出所需的字,另外這類(lèi)方案沒(méi)有利用讀音信息來(lái)選字。
本發(fā)明的目的之一在于提出一種用于漢字輸入的簡(jiǎn)化拼音;
本發(fā)明的另一個(gè)目的在于使?jié)h字字形和字音建立起直接的聯(lián)系;
本發(fā)明的進(jìn)一步目的在于提出一種分組選字式漢字輸入方案。
本發(fā)明的目的通過(guò)如下方式實(shí)現(xiàn)
第一,拼音簡(jiǎn)化,包括,1.把聲母、韻母分別歸類(lèi)合并,各自分成若干聲母組和韻母組,同一組內(nèi)的聲母或韻母被視為相同的,不加區(qū)別,看作是一個(gè)合聲母或合韻母;
2.適當(dāng)?shù)胤纸M,使讀音容易混淆的聲母或韻母盡可能歸入同一組,同時(shí),使每一個(gè)由合聲母和合韻母相拼所得出的合音節(jié)內(nèi)的漢字字?jǐn)?shù)盡可能均勻,所含的漢字總信息量(指使用頻率)盡可能均衡;
3.用這些比《漢語(yǔ)拼音方案》里的聲、韻母總數(shù)大大減少的合聲母和合韻母拼出所有漢字,反之,所有漢字的簡(jiǎn)化讀音也都用這些合聲母、合韻母相拼得出的合音節(jié)來(lái)表示。
第二,形聲引導(dǎo),即,把每一合音節(jié)內(nèi)的字,按不同的形聲字聲旁分為各個(gè)形聲組,每個(gè)非形聲字單獨(dú)作為一個(gè)形聲組處理。
第三,高頻先定,即,把每一聲母組、韻母組和形聲組內(nèi)的漢字,按使用頻率從高到低依次排列,并把其中使用頻率最高的字定為該組的代表字。
第四,分組選字,包括,1.按聲母分組選字,即,按照所需的漢字的讀音,選中其所在聲母組的代表字;
2.按韻母分組造字,即,按照所需的漢字的讀音,選中其所在韻母組的代表字;
3.按形聲字聲旁分組選字,即,按照所需的漢字的聲旁,選中其所在形聲組的代表字;
4.最后,在依次排列的形聲字中,選中所需的字。
第五,筆劃補(bǔ)充,即,用某種按字形筆劃輸入漢字的方案作為補(bǔ)充,輸入非常用字。
由上所述以及下面將要對(duì)實(shí)施例進(jìn)行的敘述中可知,本發(fā)明具有以下幾個(gè)優(yōu)點(diǎn)一、簡(jiǎn)化后的拼音十分簡(jiǎn)單,容易掌握,各個(gè)合聲母、合韻母之間的區(qū)別更為明顯,不易混淆,這樣,輸入漢字時(shí)對(duì)讀音要求不高,不太懂拼音的人經(jīng)稍加指點(diǎn)后也可立即學(xué)會(huì)操作,讀不出字音還能用聲旁去猜讀。
二、增強(qiáng)了形聲字聲旁的表音功能,使字音和字形建立起直接的聯(lián)系,眾所周知,現(xiàn)代漢字中百分之八十以上是形聲字,聲旁是其表音符號(hào),但是,由于歷吏的原因,現(xiàn)代漢字中聲旁有效表音率只有三分之一左右,而在本發(fā)明中,大幅度地簡(jiǎn)化拼音可以使聲旁的有效表音率增加近一倍,在更多的情形下,可以按照聲旁讀音。
三、各級(jí)選字分組均勻,即拼音簡(jiǎn)化后合聲母、合韻母相拼所得出的合音節(jié)內(nèi)所容納的字?jǐn)?shù)較為平均,如果拼音未被簡(jiǎn)化,則按上述方法將有410個(gè)音節(jié),各音節(jié)所容納的字?jǐn)?shù)相差很大,而在本方案中,由于合理地進(jìn)行了拼音簡(jiǎn)化和音節(jié)合并,使得各個(gè)合音節(jié)之間的字?jǐn)?shù)相差不大,按聲旁分組有了可能,在GB2312-80的一、二級(jí)漢字范圍內(nèi),可以做到平均每組4.4字,最多一組23字,最少一組1字。
四、擊鍵次數(shù)少,輸入速度快,由實(shí)施例中將可看到,兩鍵即可輸入的漢字約200個(gè)左右,但是使用量卻占全部漢字總使用量的將近一半,三鍵輸入的可達(dá)2700個(gè)字,四鍵輸入的除了幾千個(gè)漢字外,還有成千個(gè)詞組,五鍵以后則呈下降趨勢(shì),平均每字輸入的擊鍵次數(shù)只有三鍵左右。
五、有了筆劃補(bǔ)充,讀不出音的字輸入也很方便,另外,對(duì)能部分猜讀的生僻字,在實(shí)施例中還可以用拼音和筆劃配合輸入,并能利用部分高頻漢字聲旁的引導(dǎo),快速輸入和它們同聲旁的生僻字。
圖1是本發(fā)明的實(shí)施例的鍵盤(pán)示意圖。
下面給出本發(fā)明的一個(gè)具體實(shí)施例。
在本例中,《漢語(yǔ)拼音方案》中的聲母和韻母被簡(jiǎn)化成八個(gè)合聲母和八個(gè)合韻母,共用十六個(gè)鍵表示,表1中列出了鍵號(hào)和對(duì)應(yīng)的合聲母、合韻母。
表1鍵號(hào)合聲母或合韻母10(零)2b,p,f3m,d,t4n,l,r5g,k,h(+ji)6j,q(-ji,+xi)7x,sh,s(-xi)8zh,ch,z,c11a(ia,ua),ao(iao)12o(yo,uo),ou(iou),e13i,er14 u,ü,m*15ai(uai),ei(uei),ie(üe)16an(ian,nan,üan)17 en(uen,ün,in),eng(ueng,ing),n**,ng**18ang(iang,uang),ong(iong)在表1中,“零聲母”指單用韻母的音節(jié),即這一合聲母中不含任何聲母。“+”號(hào)和“-”號(hào)分別表示增加或去掉某一音節(jié),例如,音節(jié)“ji”原來(lái)與“j,q”在同一組,但調(diào)整后與“g,k,h”在同一組,因此用(+ji)表示加上這一音節(jié),同時(shí)在“j,q”組內(nèi)用(-ji)表示去掉這一音節(jié),對(duì)音節(jié)“xi”來(lái)說(shuō)也是類(lèi)似的?!癿*”表示特殊音節(jié)“嘸”,同樣,“n**,ng**”表示“嗯”。
在本例中,八個(gè)聲母鍵同時(shí)兼作定字鍵,用于隨時(shí)認(rèn)可所輸入的識(shí)字并聯(lián)想下一字,八個(gè)韻母鍵同時(shí)兼作帶字鍵,用于帶出同聲旁字或詞組。
鍵盤(pán)的排列如圖1所示,第一些是八個(gè)聲母鍵,以下幾排依次是八個(gè)韻母鍵、五個(gè)筆劃鍵和五個(gè)功能鍵。
五個(gè)筆劃是橫、豎、撇、點(diǎn)、鉤,分別命名為H、S、P、D、G,放在第三排,另外設(shè)立正向、反向查找鍵,又稱為“>”(大于)、“<”(小于)鍵,聯(lián)想鍵“L”,重復(fù)輸入鍵“C”和修改鍵“X”等,當(dāng)然還應(yīng)再設(shè)若干標(biāo)點(diǎn)符號(hào)鍵,空格、排版、放大、縮小等功能鍵,由于和編碼無(wú)關(guān),本文不加討論。
在本例的拼音部分,開(kāi)始輸入時(shí),每擊一次聲母或韻母鍵屏幕下方顯示區(qū)將出現(xiàn)八個(gè)待選內(nèi)容,而筆劃部分,每擊一下筆劃鍵,將顯示十六個(gè)待選字,(因?yàn)楣P劃部分不排詞組,位置較寬,可以充分利用全部選擇鍵)。
在本例中八個(gè)合聲母先將全部漢字分成比較均勻的八個(gè)大區(qū),八個(gè)合韻母又將每一大區(qū)的漢字分成比較均勻的八個(gè)小區(qū),這樣聲韻相拼可得64個(gè)音節(jié),這些合音節(jié)分別包含原410個(gè)小音節(jié)中的1個(gè)到12個(gè)小音節(jié),我們認(rèn)為每一個(gè)合音節(jié)內(nèi)的所有漢字都是“同音字”,在這些“同音節(jié)”內(nèi),再按聲旁分成若干組,不能分組的非形聲字單獨(dú)成組(這種做法實(shí)際上把所有漢字都當(dāng)成了“形聲字”)。在編碼前先按每個(gè)漢字的使用量、構(gòu)詞能力和它在GB2312-80中的級(jí)別計(jì)算出一個(gè)使用系數(shù),將系數(shù)總和大的組排在前面,每組中再挑出系數(shù)最大的一個(gè)代表字作為分組選字的代表,一組中只有一字的只計(jì)算單字的系數(shù),將它和別組的總系數(shù)比較、排除,如果和某組聲旁相同的形聲字還有一些沒(méi)有落在這個(gè)合音節(jié)內(nèi),則將這些“出格”的字按一定次序排在這組字后面,然后和若干詞組一起混合進(jìn)行編碼,盡量填滿每一次所能利用的八個(gè)待選位置。
開(kāi)始輸入時(shí),先猜讀所需編輯漢字的聲母,并按下對(duì)應(yīng)聲母鍵(零聲母的音節(jié)也可以直接操作韻母鍵,省去一次擊鍵),這時(shí)八個(gè)待選位置將顯示該大區(qū)八個(gè)“合音節(jié)的代表字”(先按韻母鍵將顯示零聲母區(qū)該韻母對(duì)應(yīng)合音節(jié)的第一批形聲代表字),如其中正好有所需內(nèi)容,按對(duì)應(yīng)的定字鍵(聲母鍵),可立即將該字調(diào)入編輯部分(兩鍵輸入),并在屏幕下方顯示一組聯(lián)想字供輸入下一字時(shí)參考,必須注意選用聯(lián)想字時(shí)一定要同時(shí)按下聯(lián)想鍵和相應(yīng)位置的定字鍵,以區(qū)別于重新輸入另一字時(shí)的操作,如果聯(lián)不上,再猜讀下一字的聲母,盡管接著輸入下一字。
如果沒(méi)有所需內(nèi)容,按猜讀的韻母擊相應(yīng)鍵(附圖中第二排),這時(shí),八個(gè)待選位置將出現(xiàn)該聲韻相拼所得合音節(jié)的第一批形聲代表字,并在顯示區(qū)末尾顯示該合音節(jié)內(nèi)尚有幾組形聲字等待調(diào)用。
如此時(shí)已有所需內(nèi)容,按對(duì)應(yīng)定字鍵輸入該字并可聯(lián)想下一個(gè)字,如需要的字僅和某一代表字同聲旁,則按相應(yīng)帶字鍵(此時(shí)由韻母鍵兼任),就可以帶出第一批同聲旁字或少量詞組供選用,同時(shí)在顯示區(qū)末尾顯示尚有多少內(nèi)容等待調(diào)用,如果已經(jīng)沒(méi)有內(nèi)容了則顯示數(shù)字“0”或不顯示任何數(shù)字。
如果按下聲、韻兩鍵進(jìn)入某一合音節(jié)后,首批八個(gè)“形聲代表字”中沒(méi)有和所需字同聲旁的字則按正向查找鍵(“>”)繼續(xù)查找,直至找到為止,當(dāng)某組形聲字不止八字時(shí),后面的字也用該鍵調(diào)出,“>”鍵只有在顯示行末尾有數(shù)字顯示時(shí)才能用,否則機(jī)器不予響應(yīng),反向查找鍵(“<鍵”)是為了防止操作者疏漏而設(shè)的。
如果輸入中按錯(cuò)了鍵,按修改鍵“X”,可清除前一鍵內(nèi)容,重新輸入。
如果需要重復(fù)輸入剛才輸入的內(nèi)容,象“天天”,“高興高興”,第二個(gè)“天”字或“高興”一詞,在輸入完前一字或詞組后只要打一下重復(fù)輸入鍵“C”就可以了。
對(duì)某些生僻字如果僅能猜讀聲母,應(yīng)先按聲母鍵再按筆劃鍵查找,有些生僻漢字聲母和韻母都能猜讀,但它本身不是形聲字或它所在的形聲字組都是非常用字,用上述“純拼音”查找方法也往往比較費(fèi)時(shí),這時(shí)也可在擊打聲、韻鍵后從首筆起逐次按筆劃鍵每次調(diào)出一批同類(lèi)字,找不到再輸入下一筆劃,當(dāng)這一級(jí)別的字余下不足16字時(shí),顯示行末尾會(huì)用數(shù)字作提示,此時(shí)最好先用“>”鍵再選擇,對(duì)生僻字一般先用拼音鍵再用筆劃鍵輸入速度較快。
如果完全無(wú)法猜讀或用以上辦法找不到,直接使用筆劃鍵一般要按鍵五次(起筆四筆,收尾一筆)才能找到字。這個(gè)方法是王永民同志發(fā)明的五筆輸入法的初級(jí)形式,這種方法的缺點(diǎn)是經(jīng)過(guò)五次擊鍵后,盡管已把所有漢字分成3125個(gè)小區(qū)域,仍有一些區(qū)域漢字較多,在GB2312-80一、二級(jí)漢字范圍內(nèi),最多一個(gè)區(qū)域仍有60個(gè)字,但由于這些字中多數(shù)可以用上述“拼音”方法很快找到,不必去用五次擊鍵才能見(jiàn)字的五筆輸入法,為此,本發(fā)明對(duì)用五筆區(qū)分后仍超過(guò)16字的小區(qū)域,不采用高頻先見(jiàn)排列法,而將無(wú)法猜讀的生僻字排在前,其余字排在后,以彌補(bǔ)本發(fā)明拼音部分的不足。
最后,在純筆劃的前四次操作中,本方案中還安排每擊一鍵都先調(diào)16個(gè)同組較高頻字供選用。當(dāng)某一級(jí)余下的字不足16字時(shí),在顯示區(qū)末尾提示數(shù)字,提醒操作者可用“>”鍵調(diào)出全部剩余字,快速輸入。如果操作者一開(kāi)始就輸入五次擊鍵,會(huì)失去一些本來(lái)可以利用的機(jī)會(huì)(操作者能利用這些機(jī)會(huì)用較少擊鍵次數(shù)輸入很多漢字),另外,五筆劃以下的漢字也應(yīng)該在前幾次操作中查找,因?yàn)闊o(wú)須操作五次,最后在筆劃部分同樣安排了聯(lián)想內(nèi)容。
在本例中,拼音部分兩鍵輸入的字有64個(gè)合音節(jié)代表字,零聲母區(qū)64個(gè)形聲代表字(先擊韻母鍵),另外,五個(gè)筆劃鍵第一次操作又可各調(diào)出16個(gè)字共80個(gè)字兩鍵輸入,以上208個(gè)字,可以占全部漢字總使用量的將近一半,三鍵輸入的可達(dá)2704字(其中拼音部分1024字,并包括零聲母區(qū)部分詞組;拼音、筆劃配合1280字;雙筆劃400字),四鍵輸入的除了幾千個(gè)漢字外,還有成千個(gè)詞組,五鍵輸入的漢字?jǐn)?shù)呈下降趨勢(shì),六、七鍵以上輸入的漢字?jǐn)?shù)明顯減少,碰到的機(jī)會(huì)更少……,平均每字輸入的擊鍵次數(shù)只有三鍵左右,加上聯(lián)想功能,還能再減少一些。
顯然,以上設(shè)計(jì)思想的實(shí)現(xiàn)用計(jì)算機(jī)程序是很容易辦到的。
本發(fā)明可以用24個(gè)字概括,就是“拼音簡(jiǎn)化,形聲引導(dǎo),高頻先定,分組選字,筆劃補(bǔ)充,聯(lián)詞聯(lián)想”。
④文件名頁(yè)行補(bǔ)正前補(bǔ)正后說(shuō)明書(shū)13九百種,幾百種,420(ian,nan,üan)(ian,uan,üan)54識(shí)字漢字6第一些第一排21“同音節(jié)”“同音字”權(quán)利要求書(shū)120(ian,nan,üan)(ian,uan,üan)
權(quán)利要求
1.一種分組選字式漢字輸入方案,使用一組輸入鍵和功能鍵,其特征在于包括下列步驟拼音簡(jiǎn)化,形聲引導(dǎo),高頻先定,分組選字,筆劃補(bǔ)充。
2.如權(quán)利要求1所述的漢字輸入方案,其進(jìn)一步特征在于把漢語(yǔ)拼音簡(jiǎn)化為下列八個(gè)合聲母(a)0(零),(b)b、p、f,(c)m、d、t,(d)n、l、r,(e)g、k、h(+ji),(f)j、q(-ji、+xi),(g)x、sh、s(-xi),(h)zh、zh、z、c;以及下列八個(gè)合韻母(a)a(ia、ua)、ao(iao),(b)o(yo、uo)、ou(iou)、e,(c)i、er,(d)u、ü、m*,(e)ai(uai)、ei(uei)、ie(üe),(f)an(ian、nan、üan),(g)en(uen、ün、in)、eng(ueng、ing)、n**、ng**,(h)ang(iang,uang)、ong(iong)。
3.如權(quán)利要求2所述的漢字輸入方案,其進(jìn)一步特征在于所述的輸入鍵包括與八個(gè)合聲母相對(duì)應(yīng)的八個(gè)聲母鍵,以及與八個(gè)合韻母相對(duì)應(yīng)的八個(gè)韻母鍵。
4.如權(quán)利要求3所述的漢字輸入方案,其進(jìn)一步特征在于所述的八個(gè)聲母鍵兼作用于隨時(shí)認(rèn)可所輸入的漢字并聯(lián)想下一字的定字鍵,所述的八個(gè)韻母鍵兼作用于帶出同聲旁字或詞組的帶字鍵。
5.如權(quán)利要求1至4所述的漢字輸入方案,其進(jìn)一步特征在于所述的輸入鍵進(jìn)一步包括五個(gè)用于筆劃補(bǔ)充的筆劃鍵。
6.如權(quán)利要求5所述的漢字輸入方案,其進(jìn)一步特征在于在筆劃補(bǔ)充步驟中對(duì)完全無(wú)法猜讀字音的非常用字采用五筆劃輸入法作為輸入的一種補(bǔ)充手段,同時(shí),采用五筆劃輸入法輸入的非常用字按使用頻率從低到高先后排列,低頻字優(yōu)先于高頻字輸入。
全文摘要
一種分組選字式漢字輸入方案,對(duì)漢語(yǔ)拼音進(jìn)行了簡(jiǎn)化,按形聲字聲旁引導(dǎo)分組選字,每組設(shè)立代表字,可隨時(shí)選中所需的字,并具有聯(lián)詞聯(lián)想功能,以提示下一字的輸入,在輸入非常用字時(shí)采用筆劃法作為補(bǔ)充。
本方案具有簡(jiǎn)單易學(xué)、擊鍵次數(shù)少、輸入速度快、準(zhǔn)確率高等優(yōu)點(diǎn)。
文檔編號(hào)G06F3/023GK1031767SQ8710614
公開(kāi)日1989年3月15日 申請(qǐng)日期1987年9月2日 優(yōu)先權(quán)日1987年9月2日
發(fā)明者周明 申請(qǐng)人:國(guó)營(yíng)紹興市電器廠