專利名稱:漢字?jǐn)?shù)音圖位碼的制作方法
一種電腦漢字輸入方案。由鍵名的數(shù)字串或字母串組成。公知的五筆劃數(shù)字碼,按漢字筆序取前五筆編碼。由于筆序存在差異,勢必會產(chǎn)生較多的誤碼。對于偏傍部首較復(fù)雜的漢字,前五筆劃反應(yīng)不出“取聲、定形、辨義”較重要的字根部分,故重碼多。介折誤碼、重碼、不僅占用較大的庫存,而且選字慢,影響電腦漢字的輸入速度。
本發(fā)明的目的在于減少漢字碼的碼長,減少誤碼、重碼所占庫存,減少尋碼及選字的時間,提高輸入速度。
本發(fā)明采用按數(shù)音對漢字進行同聲歸類編碼,下面用注音符號說明漢字與數(shù)字同聲歸類和編碼的方法。
讀音為“1、X”的漢字與數(shù)字“1、5”的讀音同,讀音為“尸(厶)、<、兒”的漢字與“4、7、2”的讀音同,同聲歸類,它們分別編碼為“4、7、2”;讀音的輔音為“ㄌ、勹”的漢字編碼為“6、8”;輔音為“ㄋ、攵”的發(fā)音與“ㄌ、勹”相近,其漢字編碼也為“6、8”;輔音為“ 、冂、匚”的與數(shù)碼在音樂簡譜中“1、3、4”發(fā)音的輔音的相同,同聲歸類編碼為“1、3、4”;輔音“ㄐ”與“ㄑ”同為舌面音,同歸于“7”;數(shù)碼“9”與拼音字母“g”(注音字母為“ㄍ”)形近,故輔音“ㄍ”及同為舌面后音的“ㄎ”,編碼為“9”;輔音“ㄊ”與“ ”同為舌尖中音,編碼相同為“1”;發(fā)音“廠”的拼音字母“h”倒寫與數(shù)碼“4”相似,故將“廠”編碼為“4”;輔音“日”與元音“凵”的漢字編碼為“5”;輔音“T”的漢字編入“3”中;除“I、X、凵”外的元音編入“8”中,以均衡各碼的使用頻率;卷舌音與發(fā)音相近的非卷舌音混同,這一類漢字較多,分別編碼于“2、0”中。當(dāng)然發(fā)音與數(shù)音完全相同的漢字更應(yīng)分別歸于各數(shù)碼中,分別將它們列于音素編碼表(圖1)的下面。各注音字母旁邊用相似的拼音字母標(biāo)注,便于音素的辨識。這樣編成的漢字按音素與數(shù)音進行同聲歸類的音素編碼表見圖1。
同一數(shù)碼的同聲元漢字較多,其發(fā)音為輔音與元音拼成的復(fù)合音,為進一步區(qū)分不同復(fù)合音的同聲漢字,本發(fā)明將十個常用的復(fù)合音漢字,特別是與常用的偏旁部首相關(guān)的簡單漢字,也可稱為字元的漢字排成兩排,每排五字,成一“五字文”。為了便于記憶,本發(fā)明將每一數(shù)碼中的十個字元編成句尾押韻的兩句五字文,利用個別字的“諧音”,還可使其具有一定的寓意。如“0”碼中的五字文為“竹乍爪蟲食”“竹渣爪蟲食”——→尺廠才車十 此廠才車十可以理介為“竹渣為”“爪蟲”之食,這個(飼養(yǎng))廠才有十車這樣的飼料”。
每碼的兩句五字文為一組,十個數(shù)碼的字元組共十組,組成一幅一百字元圖(圖3)。每兩句五字文為一組,也可稱為一個自然段,十組也稱十段。這樣一百個主字元構(gòu)成的字元五字文,也稱十段五字文。
各組五字文在一百字元圖中占有相同的“領(lǐng)地”,本發(fā)明將這十塊編號各異的“領(lǐng)地”,按照英文標(biāo)準(zhǔn)鍵盤右側(cè)的數(shù)字付盤的鍵位排列形式(圖2)進行安排,便形成了圖3所示的十字元組呈數(shù)字付盤圖形排列的一百字元圖(圖3)。
本發(fā)明用五行學(xué)說中的“金、木、水、火、土”來說明各字元在五字文中的字位,每組字元二句五字文可以用金、木、水、火、土編成一個“五行圖位表”。圖5給出第7組字元的五行圖位表。由于每排只有五個字位,各字元的字位及圖位是可以一目了然的,每組十字元的二句五字文記住之后,它們構(gòu)成的五行圖表便可與它們的組號一起出現(xiàn)在腦海的屏幕上,各字元所在的圖位也就一清二楚,可以“按圖索驥”從中選取字元,而不用查“門牌”,這種“鳥返巢”式思維是一種超越編碼的圖形記憶法。為了左手選入的方便,將左手手指也進行五行對位,即小(指)、無(名指)、中(指)、食(指),姆(指)分別與“金、木、水、火、土”對位(見圖7,圖4);將左手選字用的鍵也與五行圖表的十字元對位,本發(fā)明選用“A、S、D、F、G與Z、X、C、Y、B”十字母鍵,與字元組各字元對位編排(見圖4)。左手選入時只要用與所選字元五行圖位相同的手指去擊與字元相同圖位的選入鍵即可。譬如欲輸入“其”字,右手擊數(shù)字付盤的“7”鍵后,左手擊與“其”在“7”字元組中的圖位相對應(yīng)的“F”鍵,“其”字即被選入,為了說明字元在字元組,即在五行圖表中的圖位的方便,本發(fā)明將字元組第一排的字元用符號“∧、∠、\、/”來表示其五行字位,用在上述符號上加點來表示第二排字元的五行字位,它們分別對位表示在十個選入鍵的五行鍵位4上?!捌洹弊值臄?shù)音圖位碼可用符號表示成“7”,根據(jù)對位符號,左手擊“/”(一排“火位”)位的“F”鍵,即被選入,這便是本發(fā)明所說的對位選入法。
表示五行圖位的符號是“金、木、水、火、土”的“拆筆”和“加點拆筆”,如“∧”是“金”字取“頂”,“一”符為“土”字取“底”,“∠”符為“木”字兩撇連寫,“\”為“水”之未筆,“/”為“火”之長撇。十字圖位符又可組合成一個五行總符 ,也稱為金字塔五行全符。
組成漢字可以按書寫的順序取“首”、“尾”兩字元進行編碼。
其取元原則如下1、取整原則所取字元必需是一個完整的漢字,或十組五行圖表中收入的字元組成的編旁、部首。
如銥——钅+衣;馳——馬+也2、取大原則特別是“尾”字元即漢字字根部分應(yīng)盡量將范圍取大。其中“兩小一大”的三單元漢字,其“兩小”單元應(yīng)取作一個大字元。如儲——亻+諸;簍——竹+婁;鴛——夗+鳥。
3、取一原則漢字有幾個相同的小字無與其它字元組成時,其相同部分只取一個。如相同字元處于漢字的“首”、“尾”兩部分時,該字元應(yīng)取為“尾”字元。
4、取根原則,如所取字元為幾個“子字元”組成時,應(yīng)取與底線有接觸筆劃的“子”字元進行編碼。如榷——木+佳;5、包容原則應(yīng)取包容面多的有根字元優(yōu)先編碼。如啟——尸+攵;摑——扌+口運用取元五原則,可將所有組合漢字按“首、尾”取元法編為2位數(shù)音碼。
如“拙”—— 電腦輸入時,右手擊數(shù)字付盤的“4”鍵,左手擊“∧”位的“A”鍵,右手擊“2”鍵,左手擊“\”位的“D”鍵,屏幕提示欄便給出包含有“拙”字在內(nèi)的同碼漢字。
本發(fā)明的同碼漢字也按五行圖表編排出現(xiàn)在提示欄,即對位圖形提示。極個別的情況下,有多于十個的同碼漢字,多余部分列于提示欄右面的詞語欄中,并按后面的“詞語輸入法”選用。
譬如上述“拙”字位于同碼字提示欄中的“/”位,左手再擊對應(yīng)的“y”選入鍵,“拙”字印被選入。
為了均衡各五行圖表各圖位的使用頻率,本發(fā)明在各主元的右下角多附有一付字元。
本發(fā)明將常用字與字元進行“同音歸類”編入各字元的圖位中,并列于同音字元所在的圖位的上方,并按五字文的形式安排,付字元也編入其中,字?jǐn)?shù)夠十個的編成二句句尾押韻的五字文,為便于記憶,本發(fā)明將其編排得多有一定的文義。五字文也按五行圖表法進行定位。如第七字元組“\”位的“竟 ”字圖位中列有十個同音常用字,它們構(gòu)成的五行圖位表可見圖6,個別常用字的五行圖表中為使文句有一定便于記憶的“文義”,也會插入個別的僅僅同聲的常同字,或同形字。如第0組字元五行圖的 位的“廠長”字圖位中的常用字五行圖文為“暢唱常場長”
產(chǎn)仗陳丈芷其中“\”位的“陳”字便是“廠”字的同聲(輔音)字,而不是“同音”字。增加個“陳”字,便使上段五字文含有“歌頌常場長,產(chǎn)(糧)靠陳伯才得以保存”的文義。
常用字在按字元的數(shù)音圖位輸入后,提示欄便會顯示出同音的常用字五行圖表,即常用字對位提示。根據(jù)欲選常用字所在的五行圖位,左手再對位擊一選入鍵即可。如輸入“牢”字 右手擊“6”鍵,左手對位擊“一”位的“G”鍵,顯示欄出現(xiàn)下面的常用字五行圖表“牢佬那能勞”粦婁臨鹵賃“牢”字在“∧”位,左手再對位擊“∧”位的選入鍵“A”,“牢”字即被選入。
常用字的五行圖表中含有付字元及某些常用的較復(fù)雜的同聲偏旁、部首。這些列入常用字的常用偏旁只和主字元一樣輸入構(gòu)字,并使購字的字元包含有更大的范圍,以增加字碼或字符更多的“定形——辨義”功能。
這樣常用字容入一百個字元表中構(gòu)成了漢字?jǐn)?shù)音圖位碼總表(見圖8)。其中用圖文處理的常用字可多達七百多。由于主字元的選入比常用字還少一擊,故主字元字也可作常用字使用,稱為特高頻字,加上一百個特高頻字,本表常用字的選用量高達八百多個。
本發(fā)明對漢語詞語按“詞化字”原則處理,即不論是幾字詞,均把該詞語當(dāng)一個“復(fù)雜的漢字”,即“詞化字”處理。其編碼可按組合漢字的“首、尾”取元五原則進行。例如“研究員”=“砜”——石+貝,編碼0 在電腦輸入0 碼后,提示欄同碼字五行圖表的右側(cè)同時給出同碼的“詞化字”的五行圖表,即“詞化字”的對位提示。譬如“詞化字”“硯”位子五行圖表的“/”位,左手只要在對應(yīng)的“y”碼上打一連擊即可。即“詞化字”提示欄的選用與同碼常用字的選用相同,只是對位擊鍵采用連擊即可將“詞化字”所代表的詞語全部選入文中。
因此,可知詞語的選用是十分簡單的,不論是幾字詞語都和一個組合漢字的選用相似。本發(fā)明在五行“詞化字”對位提示欄中可以容入相當(dāng)多的詞語。利用詞語輸入可以使?jié)h字輸入速度加快。例如詞語“寧在直中取,不向曲中求”數(shù)音碼為 電腦輸入時,平均右手每字1擊,左手選入鍵每字1.4擊。面采用“詞化字”詞語選入法,詞化字為 ,編碼為 4。譬如該字位于詞語提示欄五行圖表的“亠”位,則在右手擊“3”鍵,左手擊“S”鍵,右手擊“4”鍵,左手擊“G”鍵后,對位連擊“亠”位的“B”鍵即可將“寧在直中取,不向曲中求”一詞語納入文中。
該詞語的輸入共右手2擊,左手(2擊+1連擊)3擊,平均每字右手0.2擊,左手0.3擊,比使用常用字輸入還簡單得多。
如果“詞化字”正好是一個主字元,或表中的常用字,那么在輸入主字元后,提示欄右側(cè)也有詞語對位提示欄供選入。
漢字輸入時,本發(fā)明左手控十鍵,右手控十鍵,所用鍵位少,都在手掌之下,可由手指專擊各鍵,無需手掌移動,無需尋鍵,故可使輸入速度加快。
采用數(shù)音碼及同聲歸類,同音歸位的圖文壓縮處理可以編輯八百多個常用字,這給漢字輸入代來很大方便,在文件處理時常用字使用率可高達70%,從上述詞語“寧在直中取,不向曲中求”的編碼中可以看到,十個字全部都是常用字。由于常用字的輸入為一碼二選(入)鍵,特高頻字(主字元)為一碼一選(入)鍵,要比組合漢字二碼三選鍵,不論是碼長還是擊鍵次數(shù)都少得多。本發(fā)明處理漢字文件,基本上可達到每字平均約1.2擊數(shù)碼鍵,1.8擊選(入)鍵的輸入,這也為加快輸入速度提供了方便條件。
由于本發(fā)明對漢字采用圖位處理,五字文處理,使得一百字元圖表很易記憶,常用字采用同音歸位法,圖表提示法,使常用字的五字文無需特別記憶。特別是初學(xué)者,只要知道數(shù)音編碼原則(見圖1)即可參照一百字元圖(圖3)進行編碼輸入,逐步熟記一百字元圖和數(shù)音圖位碼總圖(圖B)中的常用字五字文后,基本可實現(xiàn)盲打,加上上述加快漢字輸入的各種優(yōu)點,本發(fā)明的漢字輸入超過每分鐘三百字的速度是比較容易的。
八百多常用字經(jīng)過圖文處理,都能在數(shù)音圖位總表中找到自己的位置,反過來只要根據(jù)其圖位就能找到一個具有特定“字形”、“讀音”、“字義”的漢字,這是目前其它所有漢碼都沒有那么多常用漢字的“定義功能”,這種“1——1”對應(yīng)的與傳統(tǒng)漢字“取吉、定形、辯義”功能相同的含八百多常用字的漢字編碼或符號,是本發(fā)明采用符號系統(tǒng)圖文壓縮技術(shù)應(yīng)用于漢字編碼的結(jié)果??梢钥偡Q為“數(shù)音圖位漢碼”,或簡稱“數(shù)音碼”。
在組合構(gòu)字時,由于本發(fā)明采用了取讀音較為確定的字元的聲元與數(shù)音同聲歸類的編碼方法,從而大量減少了“誤讀”,“方言、”“異音”等造成的誤碼。由于采用取大、取整、取根等構(gòu)字編碼原則,使“筆型”、“筆序”等差異造成的誤碼大量減小,從而大量減少了為“介誤”而增的“重碼”,從而可以減少軟,硬件“檢誤”所需庫存規(guī)模,降低軟、硬件的成本,也為漢字輸入減少了“檢誤”所需的時間,漢字輸入速度可以因之加快。
利用“圖形記憶”,“對位輸入”法,也可處理數(shù)字符號系統(tǒng)。本發(fā)明所編制的圖3(一百字元五行圖位表)及圖8(漢字?jǐn)?shù)音圖位總表)各組字元的位置即是按照數(shù)字付盤的鍵位次序進行編排的,每組字元塊都對應(yīng)數(shù)字付盤中的一個鍵位相同的鍵。這樣,不用為每組字元編碼,不用去看數(shù)字付盤的鍵名(數(shù)字),只要按字元組的組位對位擊數(shù)字付盤的鍵即可,也可用圖位符號代替數(shù)字來表示字元組與數(shù)字付盤對應(yīng)鍵的所在圖位。如果把數(shù)字付盤的“1、2、3、4、5、6、7、8、9”鍵均用一方框圖圍住(見圖2),那么可將“5”鍵當(dāng)作這個方框圖的圖心,圖心位用符號“I”表示;圖心位的上、下、左、右四方位為“T、 ,對應(yīng)原數(shù)字付盤的“8、2、4、6”四鍵,用符號 分別表示其“左上、右上、左下、右下”四角位,對應(yīng)原數(shù)字付盤的“7、9、1、2”四鍵,“O”鍵位子方框圖外,可稱為“圖外位”或“外心位”,用符號“V”表示。同樣與數(shù)字付盤鍵位作相似排列的一百字元數(shù)音圖位表(圖3)也作相同的圖形處理,“O”組字元為“外心位”,用 表示,其它九組字元分別用“T 表示圖心位 的四方位,用符號 表示四角位。這樣在輸入字元時,只要接字元所在的字元組的圖位,右手對位擊與該字元組同一圖位的鍵即可。假如詞語“寧在直中取,不向曲中求”可以用“圖位全符”,也稱“無碼符”表示成 這種表示漢字的全圖位符,除了有上述數(shù)音圖位碼與八百多常用字的1—1對應(yīng)的功能外,還具有與傳統(tǒng)漢字的功能“趨同性”,即有較確定的“聲、形、義”,具有與傳統(tǒng)漢字及數(shù)字或其它常用的字母的形態(tài)“取異性”,它還具有書寫簡單、占位小的優(yōu)良,并與傳統(tǒng)的漢字即有筆形相容性,又有明顯的結(jié)構(gòu)區(qū)分,是一種很好的漢字注音符號或代用符,可用來簡化漢字,或作常用詞語的縮寫。如“因為”—— “我們”—— 國家安全局—— 愚蠢—— 驕傲——驕 此外,本發(fā)明還可廣泛用于漢字檢索、通訊、速記、盲文、啞語、廣告文字,經(jīng)過頻率和音色處理可用于“人際”、“人機”之間的“音樂語言”,也可用作“機讀”文字。
圖1音素編碼表(圖中8欄“——”表示補充有除I、X、凵外的元音素)圖2數(shù)字付盤鍵位3一百字元4選入鍵五行圖位表圖5第7組字元五行圖位表圖6第7字元組“\”位常用字五行圖位表圖7左手指五行對位8漢字?jǐn)?shù)音圖位碼總圖
權(quán)利要求
1.一種電腦漢字輸入方案。由鍵名數(shù)字串或符號串組成。公知的五筆劃數(shù)字碼,按筆序的前五筆編碼。本發(fā)明的特征在于按數(shù)音對漢字進行同聲歸類編成的數(shù)碼;對漢字組和鍵組進行相同的圖形處理,采用對位輸入的數(shù)音圖位碼。
2.根據(jù)權(quán)利要求1,特征在于采用按數(shù)音同聲歸類;同碼字元按五行圖表方式編排的一百字元圖文結(jié)構(gòu)。
3.根據(jù)權(quán)利要求1,特征在于采用常用字、提示字、同碼字與所用鍵組存在對應(yīng)關(guān)系的五行圖表編位方案和圖位符號。
4.根據(jù)權(quán)利要求1,特征在于采用按與字元同音歸位,并按五行圖表編排的常用字輸入方案。
5.根據(jù)權(quán)利要求1,特征在于采用按“首、尾”字元進行編碼的電腦漢字輸入方案。
6.根據(jù)權(quán)利要求1,特征在于采用漢字取元五原則的漢字編碼方案。
7.根據(jù)權(quán)利要求1,特征在于采用“詞化字”的詞語編碼輸入方案。
8.根據(jù)權(quán)利要求1,特征在于采用與所用鍵組排列成相似圖形,進行對位處理的文字、符號、圖塊系列。
9.根據(jù)權(quán)利要求1,特征在于采用字元組塊排列成與所用鍵組的鍵有對應(yīng)關(guān)系的圖位安排與圖位符號。
10.根據(jù)權(quán)利要求1,特征在于采用數(shù)音圖位碼作為進行文字處理,文字檢索,進行圖意表達、文化傳播的漢字代用符及其在相關(guān)領(lǐng)域的應(yīng)用。
全文摘要
電腦漢碼。為輸入更快捷。本發(fā)明采用數(shù)音歸類的同碼字元及有關(guān)文件均按所用鍵組圖形進行編位的便于記憶、便于盲打、不用手部移動、不用尋碼位、可以對位輸入的漢碼輸入方案。特別是對位提示的八百多常用字及“詞化字”詞語的處理方法,使?jié)h字文件輸入大大加快。這種與八百常用字“1-1”對應(yīng)的漢碼,不僅使“誤碼、重碼”減至最少,可節(jié)省軟、硬件的貯存、降低成本,而且這種有確定“字義、字音、字形”的漢字常用字代碼或符號可以在很多領(lǐng)域獲得運用。
文檔編號G06F3/023GK1133990SQ95119069
公開日1996年10月23日 申請日期1995年12月13日 優(yōu)先權(quán)日1995年12月13日
發(fā)明者王普義 申請人:王普義