專利名稱:文字式音形漢字輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種以字音為主、字形為輔用鍵盤(pán)字母對(duì)漢語(yǔ)字詞進(jìn)行編碼輸入的文字式音形漢字編碼輸入方法。
眾所周知,漢字的鍵盤(pán)輸入要比任何一種拼音文字更為困難。盡管?chē)?guó)內(nèi)外已有數(shù)百種漢字編碼鍵盤(pán)輸入方法,但還沒(méi)有一種既具有易學(xué)性和快速性,又具有正音性和文字性的中文字詞編碼鍵盤(pán)輸入方法。如周志農(nóng)先生的“自然碼”(北京經(jīng)濟(jì)學(xué)院出版社《中國(guó)微機(jī)辦公自動(dòng)化軟件大全》),它雖然較好地解決了快速性和易學(xué)性的統(tǒng)一問(wèn)題,但由于它不能表示聲調(diào),所采用的拼音沒(méi)有突破傳統(tǒng)的雙拼模式,形碼部分也沒(méi)有沖破傳統(tǒng)的字根模式,因而仍存在記憶負(fù)擔(dān)重,輸入速度不理想和語(yǔ)音表達(dá)不全面的缺陷。唐懋寬先生的“聲數(shù)碼”(北京經(jīng)濟(jì)學(xué)院出版社《中國(guó)微機(jī)辦公自動(dòng)化軟件大全》)用j、x、v、h表示陰、陽(yáng)、上、去四聲,與表示聲母和韻母的字母有沖突,且聲調(diào)鍵不能兼具選擇同碼的功能,因此它不具備文字性且輸入速度不理想。
本發(fā)明的目的是提供一種既具有易學(xué)性和快速性,又具有正音性和文字性的文字式音形漢字輸入方法。
本發(fā)明的目的是采用字母鍵盤(pán)結(jié)合編碼規(guī)則和輸入方法來(lái)實(shí)現(xiàn)的。其具體編碼規(guī)則和輸入方法是用u、v、w分別代表聲母的zh、ch、sh,其它聲母與鍵盤(pán)字母相同;用與表示聲母相同的21個(gè)字母結(jié)合字母y表示韻母;用a、e、i、o表示陰、陽(yáng)、上、去四聲和選擇同碼;聲韻相拼,遇零聲母音則加y,否則不加y,便得到“音”;用“二分成形法”拆字為兩個(gè)部件,合并兩部件“音”的首字母得字的“形”;單字的編碼為字“音”加字“形”;雙字詞的編碼為第一字“音”加第二字“音”;叁字詞的編碼為第一、二字“音”首字母加第三字“音”;肆字及肆字以上詞的編碼為第一、二、三、末字“音”首字母的組合。
下面結(jié)合表和實(shí)施例對(duì)本發(fā)明進(jìn)一步說(shuō)明。
表1是本發(fā)明聲母、韻母和聲調(diào)與鍵盤(pán)字母的對(duì)應(yīng)關(guān)系表;表2是本發(fā)明的鍵位;表3是本發(fā)明的非成字部件表;在表1中,用u、v、w分別代表聲母的zh、ch、sh三個(gè)復(fù)聲母,其它聲母與鍵盤(pán)字母相同;把韻母按互補(bǔ)原則歸并為2類,并用與表示聲母相同的21個(gè)字母結(jié)合字母y來(lái)表示,后面加y的為+y韻母,首面加y的為y+韻母;聲韻相拼時(shí),對(duì)于非零聲母音則不加y,對(duì)于零聲母音則加y。因此,任何字的“音”都由上述22個(gè)字母中的兩個(gè)拼成。節(jié)約的a、e、i、o四個(gè)字母,正好用來(lái)表示陰(-)、陽(yáng)( )、上( )、去( )四個(gè)聲調(diào),也可兼做選擇鍵。
在表2中,鍵上的大寫(xiě)字母表示鍵名;鍵上的三排小寫(xiě)字母表示為該鍵分配的聲母和韻母;Y鍵上的+y和y+表示在拼寫(xiě)零聲母音時(shí)與+y同排的韻母應(yīng)在后面加y,與y+同排的韻母應(yīng)在前面加y;A,E,I,O鍵上分配的是陰(-)、陽(yáng)( )、上( )、去( )四聲;由于漢語(yǔ)的聲調(diào)具有區(qū)別意義的作用,因此漢語(yǔ)拼音文字必須標(biāo)調(diào),而且標(biāo)調(diào)必須用職能化的字母。若用其它方法標(biāo)調(diào),就會(huì)使其不象一種文字。本發(fā)明能做到這一點(diǎn),故形如文字,稱它為“文字式音形漢字輸入方法”。
例如媽、麻、馬、罵四個(gè)字,從圈1或圖2可知,聲母為m,韻母為去掉y的b,其“音”都拼為mb,而其“帶調(diào)音”則分別拼為mba、mbe、mbi、mbo。又如師、實(shí)、使、視四個(gè)字,其“音”都拼為wm,面其“帶調(diào)音”則分別拼為wma、wme、wmi、wmo。
本發(fā)明對(duì)字形編碼采用“二分式成形法”進(jìn)行拆字,所拆部件構(gòu)成字的,其“音”為該字的“音”,所拆部件為非成字的,其“音”按“非成字部件表”中規(guī)定的音。
“二分式成形法”是將字拆分為前后兩個(gè)部分,盡量使它們是較優(yōu)先的部件;若某部分不是部件,則對(duì)該部分繼續(xù)拆分并提取較優(yōu)先的部件,合并所得兩個(gè)部件“音”的首字母便得該字的“形”。
詳細(xì)地講,“二分式成形法”由以下三個(gè)步驟組成1.二分拆字,即將漢字拆分為前后兩個(gè)部分,拆分的結(jié)果有下面4種情況(1)前后兩部分都是部件;(2)前部分是部件,后部分不是部件;(3)后部分是部件,前部分不是部件;(4)前后兩個(gè)部分都不是部件。
2.提取部件,即對(duì)非部件部分繼續(xù)拆分并提取優(yōu)先級(jí)別高的部件代表該部分本身。在此過(guò)程后,前后兩部分都成了部件,分別叫前部件和后部件。
3.合并音首,即“形”=前部件“音”的首字母+后部件“音”的首字母。
部分的前后是按先上后下、先左后右、先外后內(nèi)、先橫后豎的原則確定的。
部件分為三級(jí),一級(jí)部件是用作構(gòu)字的成字,其“音”就是該成字的音;二級(jí)部件是在“非成字部件表”(表3)中的非筆劃部件,其“音”在表中規(guī)定;三級(jí)部件是在“非成字部件表”(表3)中的筆劃部件,其“音”也在表中規(guī)定。
部件的優(yōu)先級(jí)別是這樣規(guī)定的一級(jí)部件級(jí)別最高,二級(jí)部件次之,三級(jí)部件再次之;同級(jí)別的部件則筆畫(huà)多的優(yōu)先,筆畫(huà)也相同的則按先上后下、先左后右、后外后內(nèi)、先橫后豎的原則確定優(yōu)先級(jí)別。
本發(fā)明單字和詞組的完全編碼都是等長(zhǎng)的四元碼,即每個(gè)完全編碼都由四個(gè)碼元組成。單字的編碼就是字“音”加字“形”。在詞組的完全編碼中,雙字詞的編碼為第一字“音”加第二字“音”,叁字詞的編碼為第一、二字“音”首字母加第三字“音”,肆字及以上(含肆字)詞的編碼為第一、二、三、末字“音”首字母的組合。但在實(shí)際輸入過(guò)程中,字詞所用的輸入碼是不等長(zhǎng)的。本發(fā)明按照高頻優(yōu)先的原則,為使用頻率越高的字詞分配碼長(zhǎng)越短的輸入碼。輸入碼分為一級(jí)碼、二級(jí)碼、三級(jí)碼和四級(jí)碼,分別取相應(yīng)完全編碼的前一、二、三、四個(gè)碼元構(gòu)成。四級(jí)碼的第四碼元要用大寫(xiě)字母輸入。
如“人”字的完全編碼為rgpn,但其輸入碼為r;“算”字的完全編碼為szum,但其輸入碼為sz;“計(jì)”字的完全編碼為jmxw,但其輸入碼為jmx;而“腴”字的完全編碼為yuyy,其輸入碼是yuyY?!坝?jì)算”的編碼為jmsz;“計(jì)算機(jī)”的編碼為jsjm;“社會(huì)主義”的編碼為whum;“中國(guó)共產(chǎn)黨”的編碼為uggd。
本發(fā)明用a、e、i、o選擇同碼字詞,并且可同時(shí)表達(dá)字的聲調(diào)。
例如“媽”、“麻”、“馬”、“罵”四個(gè)字輸入碼都是mb,用a、e、i、o鍵選取,且與所選字的聲調(diào)相吻合,即表陰平的a選陰平字“媽”,表陽(yáng)平的e選陽(yáng)平字“麻”,上聲的i選上聲字“馬”,去聲的o選去聲字“罵”。
本發(fā)明采用了多種自動(dòng)選擇技術(shù)來(lái)加快輸入速度。本發(fā)明將自動(dòng)選擇技術(shù)分為“續(xù)碼自選”、“續(xù)符自選”和“三元自選”三種。“續(xù)碼自選”技術(shù)就是在輸完完全編碼后,若繼續(xù)輸入碼元鍵,則自動(dòng)選擇第一同碼字詞?!袄m(xù)符自選”技術(shù)就是在已經(jīng)輸入1~4個(gè)碼元時(shí),若輸入非碼元、非選擇鍵的圖形字符鍵,將自動(dòng)選擇第一同碼字詞?!叭赃x”技術(shù)就是,對(duì)于完全編碼為四元的編碼輸入法,在輸入三個(gè)碼元后,若再以小寫(xiě)輸入碼元鍵將自動(dòng)選擇第一同碼字詞,且所輸入的碼元被作為下一輸入碼的第一碼元。若要輸入第四碼元?jiǎng)t須用大寫(xiě)字母。由于常用字詞都盡量分配有較短的輸入碼,因此在實(shí)際輸入過(guò)程中需要輸入第四碼元的字詞是很少的?!袄m(xù)碼自選”是幾乎所有的漢字編碼輸入法都已采用的技術(shù)。“續(xù)符自選”和“三元自選”則是本發(fā)明的技術(shù)創(chuàng)新。
例如在輸完jmx三個(gè)字母后,第一同碼字為“計(jì)”,若再輸入小寫(xiě)字母,“計(jì)”字將被選中,輸入的小寫(xiě)字母將被作為下一輸入碼的第一碼元,不象現(xiàn)有輸入法那樣需用空格鍵選取。若要輸入“悸”字(其輸入碼為jmxJ),則在輸完jmx三個(gè)字母后,要用大寫(xiě)字母輸入第四碼元(即J)。若輸完jmx三個(gè)字母后,再接著輸入句號(hào)(即“?!碧?hào))時(shí),“計(jì)”字也將被自動(dòng)選擇,不再需要空格鍵。
本發(fā)明由于“三元自選”技術(shù)的采用,使得三級(jí)輸入碼變成了一種很特別的碼位。本發(fā)明的三級(jí)碼碼位有22×22×22=10648個(gè),也即本發(fā)明有10648個(gè)特征碼位。盡管中文字詞數(shù)有數(shù)十上百萬(wàn)個(gè),但對(duì)于每一個(gè)特定的輸入環(huán)境,其所用的字詞一般都在數(shù)千個(gè)左右。這就是特征碼位技術(shù)賴以成立的基礎(chǔ)。特征碼位技術(shù)是這樣實(shí)現(xiàn)的編碼輸入系統(tǒng)提供特征碼位的初始值(初始值為通用的常見(jiàn)字詞),用戶輸入的每一個(gè)大于三個(gè)碼元的字調(diào)將對(duì)其所包含的特征碼位重新賦值,從而使特征碼位上的字詞隨用戶的輸入環(huán)境而發(fā)生適應(yīng)性的動(dòng)態(tài)變化。變化后的特征碼字詞還可存盤(pán)后供用戶在類似的輸入環(huán)境中重復(fù)使用。
例如在輸入中醫(yī)文獻(xiàn)時(shí)經(jīng)常用到“悸”字, 在第一次輸入該字時(shí)需用四個(gè)碼元jmxJ,在下次輸入該字時(shí),就只需用前三個(gè)碼元了,即這時(shí)輸入碼jmx上的字變成了“悸”,而不是原來(lái)的“計(jì)”。此時(shí),“計(jì)”字的輸入碼則變成了jmxW。
與現(xiàn)有技術(shù)相比,本發(fā)明具有下述優(yōu)點(diǎn)①采用文字式拼音,聲調(diào)用字母表示,具有很強(qiáng)的正音性和文字性;其拼式簡(jiǎn)潔,信息容量大,漢語(yǔ)語(yǔ)音表達(dá)全面,規(guī)則簡(jiǎn)單。②本發(fā)明的“二分式成形法”從絕大部分現(xiàn)代漢字都是形聲字這一客觀事實(shí)出發(fā),直觀自然地拆分字形,符合人們分析漢字的習(xí)慣,具有較強(qiáng)的單一性。③用A、E、I、O鍵選擇同碼且兼表字的聲調(diào),使選擇同碼具有了有理性,便于學(xué)習(xí)和記憶,同時(shí)由于選擇鍵為字母鍵,因而比用數(shù)字鍵易于盲打。④本發(fā)明通過(guò)“三元自選”和“特征碼位”技術(shù)的結(jié)合使用起到了“四元編碼,三鍵輸入”的效果,一般字詞的輸入均只需三鍵,極大地提高了輸入速度。采用“續(xù)符自選”技術(shù)使得常用符號(hào)的輸入兼具了選擇的功能,進(jìn)一步加快了輸入速度。
權(quán)利要求
1.一種文字式音形漢字輸入方法,包括編碼方法及字母鍵盤(pán),其特征是①用u、v、w分別代表聲母的zh、ch、sh,其它聲母與鍵盤(pán)字母相同;②用與表示聲母相同的21個(gè)字母結(jié)合字母y表示韻母;③用a、e、i、o表示陰、陽(yáng)、上、去四聲和選擇同碼;④聲韻相拼,遇零聲母音則加y,否則不加y,便得到“音”;⑤用“二分成形法”拆字為兩個(gè)部件,合并兩部件“音”的首字母得字的“形”;⑥單字的編碼為字“音”加字“形”;⑦雙字詞的編碼為第一字“音”加第二字“音”;⑧叁字詞的編碼為第一、二字“音”首字母加第三字“音”;⑨肆字及肆字以上詞的編碼為第一、二、三、末字“音”首字母的組合。
2.根據(jù)權(quán)利要求1所述的文字式音形漢字輸入方法,其特征在于聲母、韻母、聲調(diào)與鍵盤(pán)字母的對(duì)應(yīng)關(guān)系如下 (接上表)
3.根據(jù)權(quán)利要求所述的文字式音形漢字輸入方法,其特征在于“二分式成形法”所拆部件構(gòu)成字的,其“音”即為該字的音;所拆部件為非成字的,其“音”按如下“非成字部件表”規(guī)定的音非成字部件表
4.根據(jù)權(quán)利要求1所述的文字式音形漢字輸入方法,其特征在于字詞的輸入碼分為一級(jí)碼、二級(jí)碼、三級(jí)碼和四級(jí)碼,分別取相應(yīng)完全編碼的前一、二、三、四個(gè)碼元構(gòu)成。
5.根據(jù)權(quán)利要求4所述的文字式音形漢字輸入方法,其特征在于輸入三個(gè)碼元后,若再以小寫(xiě)字母輸入碼元鍵則將自動(dòng)選擇第一位的同碼字詞。
6.根據(jù)權(quán)利要求4所述的文字式音形漢字輸入方法,其特征在于四級(jí)碼的第四碼元要用大寫(xiě)字母輸入。
7.根據(jù)權(quán)利要求4所述的文字式音形漢字輸入方法,其特征在于在已經(jīng)輸入(1-4個(gè))碼元時(shí),若輸入非碼元、非選擇鍵的圖形字符鍵,將自動(dòng)選擇第一同碼字詞。
全文摘要
本發(fā)明是一種文字式音形漢字輸入方法,其特征是用u、v、w代表聲母zh、ch、sh,其它聲母與鍵盤(pán)字母相同;用與聲母相同的21個(gè)字母結(jié)合字母y表示韻母,聲韻相拼便得“音”;用a、e、i、o表示聲調(diào)和選擇同碼;將字拆為兩個(gè)部件,合并其“音”的首字母得字“形”。字的編碼為字“音”加字“形”,詞組的編碼由字碼派生而來(lái)。本發(fā)明特有的“三元自選”、“特征碼位”和“續(xù)符自選”技術(shù)可加速輸入。它不僅具有易學(xué)性和快速性,還同時(shí)具有正音性和文字性。
文檔編號(hào)G06F3/023GK1148196SQ95111380
公開(kāi)日1997年4月23日 申請(qǐng)日期1995年5月26日 優(yōu)先權(quán)日1995年5月26日
發(fā)明者戴石靈 申請(qǐng)人:戴石靈