專利名稱:全拼雙拼規(guī)范碼漢字輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種利用拼音向計算機輸入漢字的方法,特別涉及一種語音音節(jié)全拼/雙拼向計算機輸入漢字的方法。
國家教委“全國中小學(xué)計算機教育研究中心”于1994制訂的《中小學(xué)計算機課程指導(dǎo)綱要》中明確要求將漢字信息處理及漢字輸入方法列入我國中小學(xué)計算機課程并作為教學(xué)內(nèi)容之一。漢字編碼規(guī)范的根本出路,就是要和中小學(xué)基礎(chǔ)教育,特別是語文教學(xué)緊密地結(jié)合起來。拼音碼的優(yōu)勢在于已有國家公布的《漢語拼音方案》標(biāo)準(zhǔn),憲法規(guī)定要推廣全國通用的普通話,拼音碼又能跟國民教育基本同步,跟人們的思維過程同步,但難在不認識的字有待處理,方言土語影響普及,因此急需研制出一種既克服了上述問題而又規(guī)范的拼音碼漢字輸入方法。十余年來國內(nèi)已出現(xiàn)了數(shù)百種漢字編碼方案,而其中拼音碼的輸入方法較少,且其中存在著聲韻母鍵住安排的規(guī)律性欠缺,以及拼音流的譯碼有時不夠準(zhǔn)確的不足之處,例如《智能ABC》就存在著聲母zh安排在a 鍵上,ch安排在e鍵上,規(guī)律性不強的問題。諸如可能將“母親生我前一分鐘還在灶上煮飯”譯成“母親升我錢億份鐘還再早上主犯”需要進行人工干預(yù),才能做到準(zhǔn)確的問題。
本發(fā)明的目的是提供一種聲母、韻母鍵位配置規(guī)范合理,能使全拼和雙拼融為一體,不用切換就可向計算機輸入漢字的高效全拼雙拼規(guī)范碼漢字輸入方法。
本輸入方法的技術(shù)方案是一種利用漢語拼音的全拼雙拼規(guī)范碼計算機漢字輸入方法,其特征在于(1)單字母聲母與各字母鍵一致,而聲母zh、ch、sh用字母i、u、v表示,單韻母u用字母v表示,復(fù)韻母和鼻韻母用單字母表示,開口呼韻母配置在鍵盤中排,齊齒呼韻母配置在鍵盤下排,合口呼和撮口呼韻母配置在鍵盤上排,拼音互補的韻母用同一字母表示,以達到全拼與雙拼輸入不必切換;(2)聲調(diào)一聲、二聲、三聲、四聲和輕聲,分別用字母鍵f、x、v、h和q表示,筆畫橫、豎、撇、點和折,分別用字母鍵h、s、p、d和z表示;(3)各韻母與字母鍵的映射關(guān)系設(shè)定為a...a b...ianc...iu d...eie...e f...ao g...ou ng h...ani...i zh j...en k...ang l...engm...ingn...in o...o uop...ong iongq...uai ie r...uan üans...ai t...un ünu...u ch v...üshw...ui üe x...iaoy...uang iang z...ia ua(4)單字輸入步驟為按拼音的全拼或雙拼根據(jù)上述的聲母或韻母與字母鍵的映射關(guān)系依次輸入單字的聲母和韻母;再根據(jù)屏幕提示,通過數(shù)字鍵0-9,選擇輸入對應(yīng)的字;(5)詞語輸入步驟為a.兩字詞語取兩字的聲母韻母依次輸入;b.三字詞語取三字的聲母依次輸入,再補0輸入;c.四字詞語取四字的聲母依次輸入;d.五字以上詞語取前三字及最后一字的聲母依次輸入。
由于采取了上述的輸入方法,本發(fā)明方法的優(yōu)點在于將全拼雙拼輸入融為一體,不用切換;雙拼鍵位的安排,引進了頻率原則和語音原則,規(guī)律性強,和中小學(xué)的拼音教學(xué)取得一致;以及單字處理分層次型和平面型,方便實用。增加了兩千多個高頻詞語,縮短了碼長,加快了輸入速度。
圖1是聲母、韻母與國際通用小鍵盤字母鍵的映射關(guān)系圖。
下面將結(jié)合附圖,對本發(fā)明的漢字輸入方法作詳細說明。
漢語語音結(jié)構(gòu)有三個層次底層是音素,中層是聲韻,表層是音節(jié)?!稘h語拼音方案》采用的是每個音節(jié)包含1--6個字母的音素制?,F(xiàn)代漢語中,聲母有21個,韻母有39個,加起來是60個。拉丁字母只有26個。在《漢語拼音方案》中,除聲母zh、ch、sh用雙字母表示外,絕大多數(shù)聲母都用一個字母表示;相反,除草韻母用一個字母表示外,絕大多數(shù)韻母都用2-4個字母表示。
關(guān)于《漢語拼音方案》的鍵盤化問題,由于《漢語拼音方案》是拉丁化的音素制方案,和國際通用小鍵盤上的拉丁字母基本上是一一對應(yīng)的,因此只有兩個問題需要作特殊處理。
國際通用鍵盤上沒有ü,現(xiàn)規(guī)定用字母v表示。理由是v在《漢語拼音方案》中是閑置不用的;v和ü形狀近似,易為人們所接受。
聲調(diào)是漢語語音系統(tǒng)的重要組成部分,有表義作用,不是可有可無的。在國際通用小鍵盤上,編碼一般只用26個拉丁字母鍵,不用10個數(shù)字鍵,因此需要采用字母標(biāo)調(diào)法?,F(xiàn)規(guī)定一、二、三、四聲和輕聲分別用字母f x v h q表示。主要理由是①f中間的一橫和一聲的調(diào)號形狀相同,x的第一筆和二聲的調(diào)號形狀相同(只是書寫順序相反),v和三聲的調(diào)號形狀相同,h的末筆和四聲的調(diào)號形狀近似(方向一致),q是取輕聲的“輕”字的聲母;f x v h在鍵盤上構(gòu)成一個平行四邊形,分布在中排和下排,既有利于鍵位布局,也有利于記憶。
聲韻雙拼體制是和“音素制”(漢語拼音方案)相對而言的。雙拼鍵位是以《漢語拼音方案》為基礎(chǔ),用兩個字母表示聲韻相拼,實行首位表聲、末位表韻的“位讀法”。例如雄”,音素制寫成“xiong”,需用五個字母;雙拼制寫成“xp”,只用兩個字母,用“P”代表“iong”。全拼和雙拼,就內(nèi)容而言,二者的信息量是等值的;就形式而言,后者以前者為基礎(chǔ),是前者信息量的外部壓縮形式。
由于雙拼制要求“一個音節(jié)只能用又必須用兩個字母表示”,因此出現(xiàn)了三種情況①多于——多于兩個字母的要壓縮,在全部音節(jié)中占大多數(shù),例如“昂”ang--->a+ng--->ag(將ng壓縮成g);②少于——少于兩個字母的要補足,辦法是將該字母重復(fù)一次,在全部音節(jié)中占極少數(shù),例如“俄”e--->ee;③等于——等于兩個字母的不增不減,在全部音節(jié)中占少數(shù),例如“大”da->da。
下面的聲母和韻母與字母鍵的映射關(guān)系圖1及聲韻轉(zhuǎn)換對應(yīng)表一和表二,從兩個不同的角度進行排列,使用起來是等效的,可以并用,也可以單獨用。
現(xiàn)在本照圖1說明本發(fā)明方法中雙拼鍵位技術(shù)方案如下①絕大多數(shù)聲母及單韻母和《漢語拼音方案》規(guī)定的字母相同;②聲母zh、ch、sh分別壓縮成一個字母,用i、u、v表示;③單韻母u用v表示;④復(fù)韻母和鼻韻母,一律用單字母表示,例如ao用f表示,ian用b表示;⑤根據(jù)語音互補原則,有的同一個字母要表示兩個韻母,例如p表示ong和iong;⑥合口呼韻母和撮口呼韻母存在互補關(guān)系,合并表示,例如r既表示uan,也表示üan;⑦一聲、二聲、三聲、四聲和輕聲,分別用字母f x v h q表示;⑧筆畫橫、豎、撇、點、折,分別用字母h s p d z表示。
第一,一般聲母和雙字母聲母的處理聲母按發(fā)音部位分為七組①雙唇音b、p、m②唇齒音f③舌尖前音z、c、s,④舌尖中音d、t、n、l,⑤舌尖后音zh、ch、sh、r⑥舌面音j、q、x⑦舌根音g、k、h。一般聲母按照國際通用小鍵盤的鍵位安排,不作變動。例如“g”依舊安排在“G”鍵上。
雙字母聲母zh、ch、sh分別用i、u、v表示。①表示雙字母聲母的鍵位,只有i、u、v三個字母,沒有選擇余地;②記憶方法是i像樹枝形,含zh音;u像水池形,含ch音;v像打時鉤,表示“是”,含sh音。
第二,零聲母的處理聲母是音節(jié)的第一個要素,每一個字都有它的聲母,但有些音節(jié)不以輔音為聲母,卻以元音開頭,習(xí)慣上,把這一類聲母叫“零聲母”,零聲母約占5%。在雙拼方案中,①以a o e打頭的零聲母,基本上用原形,只有ang壓縮成ag;②以y w打頭的首字母保持不變。
第三,單韻母、復(fù)韻母和鼻韻母的處理韻母按結(jié)構(gòu)分成單韻母、復(fù)韻母和鼻韻母,一共39個。拼音方案本身合并了四個其中“i”既代表舌面前音,又代表兩個舌尖音,即zi、ci、si后面的“i”和zhi、chi、shi、ri后面的“i”;“u”既代表舌面后音,上面加上兩點后又代表舌面前音;“e”既代表舌面后音,上面加“^”后又代表舌面前音,后面加“i”、“r”時又代表央元音。
①單韻母基本上按照國際通用小鍵盤的鍵位安排,a、o、e、i、u的位置不作變動;但ü用v表示。
②復(fù)韻母基本上安排在鍵盤中線的左側(cè),鼻韻母基本上安排在鍵盤中線的右側(cè),如中排中線右側(cè)是鼻韻母an、en、ang、eng,而左側(cè)是復(fù)韻母ai、ei、ao、ou。
③復(fù)韻母和鼻韻母的壓縮技術(shù)按照聲韻拼合規(guī)律,復(fù)韻母和鼻韻母可以歸并為八組上排七組,下排一組 ④韻母“四呼”的鍵面排列由于上排單韻母i(16.5)、u(6.9)、e(10.2)頻度較高,故而將頻度較低的合口呼、撮口呼安排在上排,開口呼安排在中排,齊齒呼安排在下排。
第四,聲調(diào)的處理聲調(diào)用字母鍵f、x、v、h、q表示陰平、陽平、上聲、去聲、輕聲。
表一是按字母順序檢索表——每個字母的右方為其代表的韻母或聲母表 一a----a n----inb----ian o----ouoc----iu(iou) p----ong iongd----eiq----uai iee----e r----uan ǖanf----aos----aig----ou ngt----ǖn un(uen)h----anu----uchi----i zhv----ǖchj----enw----ǖe ui(uei)k----ang x----iaol----eng y----uang iangm----ing z----ia ua
表二是按韻母順序反查表——括號內(nèi)是代表韻母的字母表二
本發(fā)明的漢字拼音編碼輸入方法,使全拼雙拼不用切換,二者并存并用,處在一個系統(tǒng)之中。處理漢字的內(nèi)容完全相同。配上雙拼鍵帽,再加上雙拼鍵入用全拼顯示,形式上完全與全拼一樣。
為什么全拼雙拼能夠融為一體呢?關(guān)鍵在于全拼方案音節(jié)中,第二個字母(除雙字母聲母外)卻是元音,與雙拼方案音節(jié)中第二個字母的元音完全重合;雙拼方案音節(jié)中,表示韻母的有21個輔音,與全拼方案的第二個字母(均為元音)就完全區(qū)別開來了。
就全拼雙拼的音節(jié)模式來說,音節(jié)由聲母和韻母構(gòu)成,約占全部音節(jié)的95%。下面分解式中的“+”號,表示聲韻相加。
ba---->b+a---->ba ju---->j+u---->julai--->l+ai--->ls guang->g+uang-->gyshuai->sh+uai-->vqn ü--->n+ü--->nvtuan-->t+uan-->tr zuo--->z+uo--->zo從音值講,ju(舉)中的韻母是ü而不是u。按照《漢語拼音方案》規(guī)定,j、q、x和ü相拼,ü上兩點省略,而nü(女)上的兩點不能省略。因此ju中的ü仍寫作u,而nü中的ü要轉(zhuǎn)換成v。請記住v只用于和n、l相拼。
另外,音節(jié)由零聲母構(gòu)成,約占全部音節(jié)的5%。下面分解式中的“+”號,只表示首字母和后面的字母相加。
yi--->y+i--->yi wai---->w+ai---->wsyuan->y+uan->yr ang---->a+ng---->agou--->o+u--->ou e------>e--------->ee所謂零聲母,指的是一個音節(jié)中沒有輔音聲母而本身能自成音節(jié)的韻母。例如an在han(漢)中是韻母,又可以自成音節(jié)an(安)。在《漢語拼音方案》中,像an,不管是作韻母還是作零聲母,都寫作an,字母形式不變;而像ian,只能作韻母用,例如jian(間),作零聲母時,要寫作yan(煙)。在雙拼鍵盤中,作韻母和作零聲母是兩套字母形式。例如an,作韻母時轉(zhuǎn)換成h(bh辦);作零聲母時,仍寫作an(安)。又如ian,作韻母時轉(zhuǎn)換成b(jb間);作零聲母時轉(zhuǎn)換成ian--->yan--->yh(煙)。
本發(fā)明的漢字拼音編碼輸入方法中,采取層次型和平面型結(jié)構(gòu)排序,進行單字輸入。
層次型(各個層次既可獨用,也可兼用)分為二元聲+韻三元聲+韻+調(diào)四元聲+韻+調(diào)+畫示例全拼shi 1事2實3市4式5試6視7世8史9石0示雙拼vi 1事2實3市4式5試6視7世8史9石0示說明層次型的屏幕顯示,每一提示行顯示10個,按降頻排序;平面型(每個平面既可獨用,也可兼用)指的是聲+韻+調(diào)說明平面型的屏幕顯示,擊一鍵和二鍵時,每一提示行顯示1個,只作為高頻字對待,并在聲韻調(diào)三鍵時重復(fù)出現(xiàn)。只有聲韻調(diào)(三鍵)處在一個平面時,才顯示10個,按降頻排序。
本方法的層次型中單字處理采取的技術(shù)措施包括①四碼能夠解決全部同音字問題。聲級字只聲母一碼,聲韻字兩碼,聲韻調(diào)三碼,聲韻調(diào)畫四碼,再加數(shù)字選擇鍵,一共四碼五鍵即可全部解決問題。
②容納國標(biāo)基本集漢字有足夠的容量。容量足以超過任何一個同音字組數(shù),理論上講可以分流250個字以上的同音字,而《基本集》中最多的一組同音字才103個。
③同級字只需一屏顯示,不翻頁。同級字指的就是一屏10個字,如果翻屏就已是下一級字。同級字所用信息相同,比如,一屏10個字所用聲韻信息相同。例如zhi 1.直2.值 3.指 4.至5.支 6.制 7.治 8.知 9.志 0.質(zhì),這10個字是同級字,同級字之間只有數(shù)字選擇鍵不同。
④不等長、非全息。不等長指的是輸入碼長不等,如“是”“生”“視”“勢”“弒”,這五個漢字分別為不同的級次字,碼長從1至4碼不等,并不是每一個漢字都需要聲韻調(diào)畫的全息輸入,很多高頻常用漢字,如“生、視”只取其聲或聲韻即可輸入。
⑤高頻先見。高頻先見的兩個含義是不同級次間相互比較,其頻度遞減,級次越高,頻度越高,反之,越低;同級字之間相互比較,頻度呈現(xiàn)由左向右遞降趨勢,即標(biāo)號越小頻度越高,反之,越低。
⑥區(qū)分詞字和詞素字。在同一級中,將詞字安排在第一個或前幾個,如“義”的頻度高于“已、易”,但“義”不單用,為詞素字,故放在“已、易”之后;在上下級中,將詞字安排在上級,詞素字安排在下級。如“民”是詞素字不單用,可組詞為“民族 民主人民公民 國民”,在國標(biāo)一級漢字降頻定序中“民”是第46位,在聲母M里處第2位,應(yīng)在聲級,鑒于它是詞素字,單用機會少,故放在聲韻級。
⑦同旁字歸并,便于掃描。這種措施在安排頻率低的同級字中,特別有用。一組同音字擁有相同偏旁,如“螟、瞑、瞑、溟、冥”,讀音ming,共同都有“冥”,將這些同聲旁的同音字依次排列在同一級中,便于掃描,迅速發(fā)現(xiàn)所找漢字,也便于定位記憶,另如“忠、鐘、腫、仲、哀、盅”等。
⑧熟字、生字按音統(tǒng)一排序,以熟帶生。二級字中有許多是生字,念不準(zhǔn)讀音,把它們和人們熟知的字排在一起,用熟識的字的讀音念生字的讀音。例如yihd 1.詣2.裔3.弈4.奕5.熠6.翊7.懌8.悒9.癔0.瘞。通過認讀“詣”“奕”這些熟知的字,就可以認識“懌”“瘞”這些生字。
任何事物都是分層次展開的,這是共性,是普遍規(guī)律,漢字的頻率分布也不例外,主要體現(xiàn)在漢字頻率分布的不均衡性上。一個漢字是否被選入,次數(shù)多少,都受書面交際過程中字所書寫的詞的應(yīng)用頻率所制約,有的運用率很高,有的奇低,表現(xiàn)出了文字在使用當(dāng)中的不均衡性。
漢字頻率分布的不均衡性反映到級次定位法中,就是編碼的不等長性。遵循漢字的不同使用頻率,施以不同的碼長,使用頻率高,碼長就短,反之,則長。如“以”降頻排第28位,只需鍵入聲母“y”,碼長為1,“屹”降頻排第3324位,必須鍵入聲韻調(diào)畫“yihs”,碼長為4。充分利用聲韻調(diào)信息,這和國民教育背景是一致的。不等長的級次定位法有兩個顯著的特點首先,級次間相互關(guān)聯(lián),相互依存,在上一級出現(xiàn)過的字,下一級一般不出現(xiàn),上下級的漢字間是不等長的。其次,級次間是遞加的關(guān)系,一個漢字在聲級里找不到,不必退回,加韻這一級信息,成為聲韻級,以此類推。
“息”指信息,全息和非全息各有各的用途。漢字輸入與英文不同,英文輸入必須是全息的,將組成英文單詞的所有字母信息一一輸入,絲毫不差。漢字教學(xué)是全息的,要一筆一畫、一聲一調(diào)地學(xué)習(xí),而漢字輸入則可以是非全息的,以非全息的形式輸入全息的內(nèi)容,不管是音碼還是形碼,歷來都是如此。例如輸入詞語時,一般都只取每個字的首碼信息,而輸入的卻是整個詞語,故而非全息主要指的是信息的壓縮技術(shù)。這是中英文輸入的最大不同,也是輸入速度超過英文的主要原因。通過層次型顯示和平面型顯示本發(fā)明的輸入方法具有快速輸入能力。
在詞語輸入中,一般卻是不用聲調(diào)的,筆畫更是使用不上。本發(fā)明的輸入方法中詞語按“非全息”的方法輸入。雙字詞語聲韻聲韻示例相信 偉大全拼xiangxin weida雙拼xyxn wdda三字詞語聲聲聲o示例對不起為什么全拼dbqowshmo雙拼dbqowvmo四字詞語聲聲聲聲示例全心全意這就是說全拼 qxqyzhjshsh雙拼 qxqyijvv五字以上前三末一示例中華人民共和國全拼 zhhrg雙拼 ihrg
權(quán)利要求
1.一種利用漢語拼音的全拼雙拼規(guī)范碼計算機漢字輸入方法,其特征在于(1)單字母聲母與各字母鍵一致,而聲母zh、ch、sh用字母i、u、v表示,單韻母ü用字母v表示,復(fù)韻母和鼻韻母用單字母表示,開口呼韻母配置在鍵盤中排,齊齒呼韻母配置在鍵盤下排,合口呼和撮口呼韻母配置在鍵盤上排,拼音互補的韻母用同一字母表示,以達到全拼與雙拼輸入不必切換;(2)聲調(diào)一聲、二聲、三聲、四聲和輕聲,分別用字母鍵f、x、v、h和q表示,筆畫橫、豎、撇、點和折,分別用字母鍵h、s、p、d和z表示;(3)各韻母與字母鍵的映射關(guān)系設(shè)定為a...ab...ian c...iu d...eie...ef...aog...ou ngh...ani...i zh j...enk...ang l...engm...ing n...ino...o uo p...ong iongq...uai ie r...uan u an s...ai t...un unu...u ch v...üsh w...ui üex...iaoy...uang iang z...ia ua(4)單字輸入步驟為按拼音的全拼或雙拼根據(jù)上述的聲母或韻母與字母鍵的映射關(guān)系依次輸入單字的聲母和韻母;再根據(jù)屏幕提示,通過數(shù)字鍵0-9,選擇輸入對應(yīng)的字;(5)詞語輸入步驟為a.雙字詞語取兩字的聲母韻母依次輸入;b.三字詞語取三字的聲母依次輸入再補0輸入;c.四字詞語取四字的聲母依次輸入;d.五字以上詞語取前三字及最后一字的聲母依次輸入。
2.根據(jù)權(quán)利要求1的漢字輸入方法,其特征在于,上述的單字輸入步驟還包括根據(jù)上述的聲調(diào)和字母鍵的映射關(guān)系,施行所述字的聲調(diào)輸入,以及根據(jù)層次型的屏幕顯示,每一提示行10個,按降頻排序,通過數(shù)字鍵,選擇所需要的字輸入。
3.根據(jù)權(quán)利要求1或2的漢字輸入方法,其特征在于,上述的單字輸入步驟進一步包括根據(jù)上述的筆畫與字母鍵的映射關(guān)系,施行所述字的筆畫輸入。
4.根據(jù)權(quán)利要求1的漢字輸入方法,其特征在于,上述的單字輸入步驟還包括平面型屏幕顯示,擊一鍵和二鍵時,每一提示行顯示一個字,只有聲韻調(diào)相繼輸入處在一個平面,才顯示10個字,且按降頻排序,通過數(shù)字鍵,選擇輸入。
全文摘要
本發(fā)明提供一種全拼雙拼規(guī)范碼計算機漢字輸入方法,它具有各韻母、聲母和筆畫與國際通用小鍵盤各字母鍵的映射關(guān)系,執(zhí)行層次型或平面型輸入。本方法實現(xiàn)了全拼和雙拼融合不必切換;雙拼鍵位的安排,引進頻率原則和語音原則,規(guī)律性強,和中小學(xué)的拼音教學(xué)取得一致,以及單字輸入分層次和平面型,方便實用。并加入了高頻詞語的簡碼,縮短了碼長。
文檔編號G06F3/023GK1150272SQ9511941
公開日1997年5月21日 申請日期1995年12月25日 優(yōu)先權(quán)日1995年12月25日
發(fā)明者華紹和, 肖金卯, 陶沙, 程女范, 蔣順炳 申請人:中國中文信息學(xué)會