專利名稱:計算機拼音漢字輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種計算機漢字輸入方法,更確切地說是涉及一種計算機拼音漢字輸入方法。
解決計算機漢字輸入的關(guān)鍵技術(shù)是編碼,現(xiàn)有的漢字編碼大致可分為音碼,形碼及音形碼。形碼根據(jù)漢字字型編碼,與讀音無關(guān),其拆分、組字規(guī)律等繁雜抽象,必須經(jīng)過培訓方可使用,不僅中國人使用有因難,外國人使用難度更大。
音碼或音形碼主要根據(jù)漢字讀音編碼,由表音部分和定字部分組成,其表音部分又可分為音位制和音韻制兩種,前者拼法合理又合乎公理,但拼式太長,音節(jié)最大長度由6個字母組成;后者如雙拼、三拼制,雖然拼式簡短、所用字母少、擊鍵次數(shù)少,但拼法又不合公理,識碼的直觀性差,輸入速度慢。其定字部分主要包括由(聲母+韻母+字型)的字型式和由(聲母+韻母+聲調(diào)+偏旁部首)的聲調(diào)、偏旁部首式兩種類型,其最大的弊端是仍不能擺脫方塊字型的糾纏,規(guī)則繁多、規(guī)律性小、難記難用。因此如果一種音碼或音形碼不能解決表音部份拼音簡短、合理、合乎公理,定字部分簡單、規(guī)律性強、易記易用等,就不可能形成一種一致公認的理想編碼方案。
本發(fā)明的目的是設(shè)計一種計算機拼音漢字輸入方法,較好地解決音碼、音形碼表音部分、定字部分所存在的兩大技術(shù)難點,而提供一種編碼簡短,拼式精悍、字意清晰準確、定字效果好、消除重碼的拼音漢字輸入方法。
本發(fā)明的計算機拼音漢字輸入方法,取漢語拼音的聲母字母、韻母字母及定字字母,并對應分配到西文鍵盤的各字母鍵位上,按漢字讀音擊鍵輸入其拼音音節(jié)的聲母字母,韻母字母和定字字母輸入漢字,其特征在于所述的定字字母是表示漢字聲調(diào)及詞性的意母,包括大意母和小意母;所述的大意母包括由名稱、動詞、形容詞、動名詞、形屬詞再分別結(jié)合陰平、陽平、上聲、去聲構(gòu)成的五大主詞意母,b d w j zp t k q cm y h x sf l z c s和由代詞、付詞、助形詞、介詞再分別結(jié)合陰平、陽平、上聲、去聲構(gòu)成的四大前助詞意母,b-d-w-j-p-t-k-q-m-y-h-x-f-l-z-c-所述的小意母是除r以外的聲母;各意母分配在西文鍵盤相應的字母、符號鍵位上;輸入五大主詞漢字時按漢字發(fā)音音節(jié)的聲母+韻母+大意母的順序輸入;輸入四大前助詞漢字時按漢字發(fā)音音節(jié)的聲母+大意母+韻母的順序輸入;輸入同音、同聲調(diào)又同詞性的五大主詞漢字時按漢字發(fā)音音節(jié)的聲母+韻母+大意母+小意母的順序輸入;輸入同音、同聲調(diào)又同詞性的四大前助詞漢字時按漢字發(fā)音音節(jié)的聲母+大意母+韻母+小意母的順序輸入;輸入數(shù)詞漢字時按漢字發(fā)音音節(jié)的聲母+韻母+大意母r的順序輸入;輸入序詞漢字時按漢字發(fā)音音節(jié)的聲母+大意母r+韻母的順序輸入,輸入擬聲詞漢字、呼詞漢字和聲尾詞漢字時按漢字發(fā)音音節(jié)的聲母+韻母+重復最后一個韻母字母的順序輸入;輸入連詞漢字時按漢字發(fā)音音節(jié)的聲母+韻母的順序輸入;輸入緊跟數(shù)詞的量尾詞或緊跟名詞的復數(shù)尾詞、性尾詞、介尾詞或緊跟形容詞的屬尾詞、修飾尾詞或緊跟動詞的時尾詞、態(tài)尾詞、補尾詞或緊跟擬聲詞的聲尾詞時,在前詞的聲母+韻母+意母后緊接后詞的聲母+韻母輸入。
所述的聲母包括b p m f d t n lg k h j q xz c s r z c s分別以同型字母鍵位擊鍵輸入,z c s分別是z c s的卷音,同擊相應字母鍵及-符號鍵輸入;當聲母b p m f d t n l g k h自成音節(jié)時用相應聲母+韻母e的順序輸入;當聲母j qx z c s r z c s自成音節(jié)時用相應聲母+韻母i的順序輸入;連詞漢字由聲母自成音節(jié)的用聲母直接輸入。
所述的韻母包括iuva ia uaouoe ieveai uaiei uiao ioou iuan ian uan vanen in un vnag iag uageg ing uegog iog用ag代替輸入韻母ang,用eg代替輸入韻母eng,用og代替輸入韻母ong,用ia代替輸入韻母iao,用iag代替輸入韻母iang,用iog代替輸入韻母iong,用uag代替輸入韻母uang,用ueg代替輸入韻母ueng,用un代替輸入韻母uen,用iu代替輸入韻母iou,用ui代替輸入韻母uei,用v代替輸入韻母ü;漢字后連寫有“兒”字作為該漢字的韻尾使用時,用卷音符號“-”加該漢字音節(jié)的最后一個韻母字母輸入“兒”字;韻母i、ia、ie、io、iu、ian、in、iag、ing、iog在與聲母j、q、x相拼時,凡復韻母省略i。
輸入的是由兩個漢字組成的詞組且有同音詞組時,連取兩字的聲母、韻母、意母輸入;輸入的是由兩個字組成的詞組且無同音詞組時,連取一字的聲母、韻母、意母和另一字的聲母、韻母輸入;輸入與原漢字本義無關(guān)聯(lián)或關(guān)聯(lián)極小的詞組時,連取詞組各字的聲母+韻母輸入;輸入與外來語諧音的詞組時,連取詞組各字的聲母+韻母輸入;輸入外國人名、地名時,連取人名、地名各字的聲母+韻母輸入,且第一字母用大寫鍵位輸入;輸入中國人名時,以各字的聲母+韻母分別輸入,各字的第一字母用大寫鍵位輸入;輸入專用詞組時,連取詞組各字的縮寫字母輸入。
下面結(jié)合編碼及輸入實例進一步說明本發(fā)明的輸入方法
圖1是詞匯分類示意圖;本發(fā)明用于編碼的碼元共有Aa Bb Cc Dd Ee Ff Gg Hh Ii Jj Kk Ll Mm Nn Oo Pp QqRr Ss Tt Uu Vv Ww Xx Yy Zz共26個字母和,′--共3個符號,各分別分配在西文鍵盤且與之同型的鍵位上。其中′為隔音符號,在音節(jié)界限發(fā)生混淆時,用該符號隔開;-為卷音符號,書寫時標在字母正上方,如標在聲母Z(資)、C(次)、S(思)上方z、c、s時,分別讀作zh(知)、ch(尺)、sh(詩),卷音符號標在漢字音節(jié)的最后一個韻母上方時,使該音節(jié)兒化韻,如Huā表示輸入的是“花兒”,gē表示輸入的是“歌兒”-為聯(lián)結(jié)符號標在字母之間,由于本發(fā)明以連寫方式輸入多音詞組,因此只有對哪些結(jié)合較松的多音詞組才在中間以符號-聯(lián)結(jié)。
本發(fā)明的聲母共有21個,基本同新華字典聲母表中所列的聲母,只是用zcs代替zh chsh。
本發(fā)明使用的韻母只有35個,基本同新華字典韻母表中所列的韻母,只是如前述,對其中的11個韻母作了省略和將改為V。
本發(fā)明在輸入“玻、坡、摸、佛、得、特、訥、勒、哥、科、喝”十一個由聲母自成音節(jié)的漢字時,用韻母e配合輸入,如be、pe、me……ge、ke、he。在輸入“基、欺、希、知、尺、詩、日、資、次、思”十個由聲母自成音節(jié)的漢字時,用韻母i配合輸入,如ji、qi、xi……zi、ci、si,在輸入連詞漢字時,R由聲母自成音節(jié)的字均不帶韻母,如用h輸入“和”,用j輸入“及”,漢字“兒”一般用er輸入,但在與另一字連用成為該字的韻尾時,則可使用卷音符號,如前述的“花兒”(Huā)、“歌兒”(gē)。韻母
(耶)單用時用oe輸入,而不用ie輸入。i行韻母在與聲母j、q、x相拼時,復韻母均省略i輸入,如je(結(jié))、jo(交)、ju(就)、jan(尖)、jn(巾)、jag(姜)、jng(精)、jog(扃)。
本發(fā)明用意母定字,分為表征漢字聲調(diào)及詞性的大意母和用于同音、同音調(diào)又同詞性的漢字中以區(qū)分定字的小意母,意母雖是字母但不發(fā)音,夾寫在拼式中幫助確定聲調(diào)和字意。
結(jié)合參見圖1,本發(fā)明以詞匯在語言中的地位、功能、特點分類,可分為主詞和助詞兩大類,其中助詞又可分為前助詞和后助詞(也稱尾詞)兩大類。主詞包括數(shù)詞、名詞、動詞、動名詞、形容詞、形屬詞、擬聲詞和連詞共8類詞,前助詞用在主詞前,用于修飾、限制、說明主詞,包括序詞、助名詞、助動詞、助形詞、呼詞共5類,后助詞用在主詞后,幫助說明主詞,包括量尾(量詞)、名詞尾、動詞尾、形容詞尾和聲尾共5類。
本發(fā)明定義的8大類主詞中的數(shù)詞是表數(shù)目的詞,如壹、貳、百、千、萬等;名詞是表名稱的詞,包括表某人、某地、某物特有名稱的專用名詞和表一般名稱如人、山、家等的普通名詞;動詞是表動作、動性或功能的詞,包括表動作(內(nèi)動詞和外動詞)如“笑”、“打”的普通動詞和表動性或功能如“可能”、“是”、“非”等的同動詞;形容詞是表性質(zhì)或特點如“大”“快”等的詞,有的主詞很難區(qū)分是名詞、動詞還是形容詞,即具有多詞性,一般按其主要詞性分類,對于主次也不明顯的詞則可歸入動名詞或形屬詞類;動名詞是兼有動詞和名詞性的詞,如“帶”,“帶子”是名詞,“帶著”是動詞,如“鏟”,“鏟子”是名詞,“鏟了”是動詞;形屬詞是兼有形容詞性的動、名詞,如“園”,“園兒”是名詞,“園了”是動詞,“園的”是形容詞,又如“粉”,“粉兒”是名詞,“粉了”是動詞,“粉的”是形容詞;連詞是表關(guān)聯(lián)的詞,包括表征并列、遞進、選擇、承接轉(zhuǎn)折、頂接關(guān)系的等立連詞和表征直附、推拓、因果、假設(shè)關(guān)系的主從連詞;擬聲詞是表聲音的詞,如“咚”、“叭”、“嘩啦啦”等。
本發(fā)明定義5大類前助詞中的序詞,是用在數(shù)詞前表征次序的詞,如“第”,也有單獨使用的序詞,如“甲、乙、子、丑”等;助名詞包括用在名詞前,用于修飾、限制名詞或起代替名詞作用的代詞,如“你、誰、這”等,和用在名詞或代詞前、表征時間、方位、方法等的前置詞(介詞),如“當、在、從、向、依、被”等;助動詞又稱付詞,用在動詞前,起修飾動作、動態(tài)、性質(zhì)、特點的作用;助形詞用在形容詞前,起說明程度的作用,其比較級有“較、稍、略”等,其最高級有“很、最、甚”等,呼詞用在句首表示語氣、情緒等,如“呸、嘿、啊”等。
本發(fā)明定義5大類后助詞中的量尾,連結(jié)在數(shù)詞后,是表征數(shù)量單位的詞,如“個、屆、次”等;名詞尾連結(jié)在名詞或代詞后,包括表征復數(shù)的復數(shù)尾(如同志們)、表征名詞性的性尾(如演員、刷子)和表征方位的介尾(如炕上、空中);動詞尾連結(jié)在動詞后,包括表征動作是否完成的時尾(如看著、看了,分別表示進行時和完成時)、表征動態(tài)或性質(zhì)的態(tài)尾(如看來、走去、買點、做些)和連結(jié)動作補充部分的補尾(如說得好、寫得真實);形容詞尾連結(jié)在形容詞后,包括表征形容詞性的屬尾(如大的、紅的、山里的)和修飾說明動作的修飾尾(如更好地、飛快地);聲尾用在句尾,表征語氣情緒,如“吧、啊、嗎”等。
本發(fā)明劃分的二十四類詞及其關(guān)系列于圖1的分類圖中,圖中所示表示各類詞之間是有一定關(guān)系的,有些類別之間沒有一成不變的界限和差異,各類詞既互相區(qū)別又互相包涵,盡管也有許多線條來作分界,表示它們的固定性和絕對性,但也只是一種相對的差異,因此各類詞的區(qū)分不應該是死的、凝固的、絕對的、而應該是活的、可變動的、相對的。
本發(fā)明在輸入主詞漢字時,用大意母加小意母的順序連寫在該字音節(jié)的韻母后輸入;在輸入前助詞漢字時,大意母寫在該字音節(jié)的韻母前,小意母寫在該字音節(jié)的韻母后;尾詞本身沒有單獨的意母,只需將其聲、韻母連寫在主詞后。
本發(fā)明的五大主詞意母構(gòu)成列于表一中,四大前助詞意母構(gòu)成列于表二中表一
如輸入同音同調(diào)的名詞“師”sib(大意母b)、動詞“失”sid(大意母d)、形容詞“濕”siw(大意母w)、動名詞“施”sij(大意母j)和形屬詞“詩”siz(大意母z)。如輸入前助詞“適”sli、“似”sfi、“甚”szen和“被”bfei等。
本發(fā)明在輸入數(shù)詞、序詞時,其大意母不表聲調(diào)只表詞性,即數(shù)詞的大意母是r并連寫在韻母后,如“壹”r、“貳”err等;序詞的大意母也是r,但連寫在韻母前,如“第”dri。
本發(fā)明在輸入擬聲詞、呼詞、聲尾時,其大意母也是不表聲調(diào)只表詞性的,并且它們沒有小意母,只需將音節(jié)最后一個韻母重寫一次,如“咚”dogg、“叭”baa。
本發(fā)明規(guī)定連詞沒有單獨的意母,如“和”h,“或”huo。
本發(fā)明對各類詞所用的小意母沒有嚴格的規(guī)定,它們在表聲調(diào)和詞性方面已極大的模糊了,只是在那些仍有同音、同聲調(diào)、同詞性的字中,為避免再發(fā)生混淆,便在除r外的二十個聲母中選擇一個固定加之即可,如“市”sif、“室”sifb、“式”sifp、“士”sifm、“世”sifn(同音同調(diào)si且均為名詞sif),如“試”sil、“視”silb、“拭”silp、“弒”silm、“逝”sill(同音同調(diào)si且均為動詞sil)。
本發(fā)明在輸入兩個字以上的詞組時一般應連寫,但只保留一個大意母,若發(fā)生同音混淆時再選一個主詞保留大意母以示區(qū)別,如“式”為sifp,而“式子”為sifzi,又如“逝”為sill,“世”為sifm,若無同音混淆時“逝世”為silsi,但它與“試試”發(fā)生混淆,故應寫作silsif。
如本發(fā)明在輸入現(xiàn)代漢語中大量涌現(xiàn)的與原漢字本義關(guān)聯(lián)極小或根本沒有聯(lián)系的詞組時,只用聲、韻相拼即可,沒有單獨的意母構(gòu)成,如“干部”ganbu、“東西”dogxi、“但凡”danfan、“馬虎”mahu等;又如本發(fā)明在輸入諧音外來詞組時,也只用聲、韻相拼,沒有單獨的意母,如“坦克”tanke、“拜拜”baibai、“阿托品”atuopin;在輸入外國人名、地名及國內(nèi)不易發(fā)生混淆的地名時,也只用聲韻相拼,沒有單獨的意母構(gòu)成,但第一個字母需大寫,如“華盛頓”Huasegden、“大連”Dalian、“廣州”Guagzou、“武漢”Uhan;對中國人以諧音為主所取的名字,也只用聲、韻相拼,沒有單獨的意母,但不連寫且第一字母大寫,如“李然”liRan、“李約翰”Li Vehan,而“王艷”、“王燕”、“王雁”等則應為Wag Ianz、Wag Ianf、Wag Ianfb。
對固定的專用名詞則可用縮寫形式輸入,如“中華人民共和國”為ZRGG,“中國共產(chǎn)黨”為ZGD。
綜上所述,本發(fā)明對當前已取得公認一致的詞組,可采取“以合為主”的連寫原則,對尚未有一致結(jié)論的詞匯,應采取“以分為主”的原則分寫之,可以保持與原漢字嚴格一致的對應關(guān)系。
本發(fā)明的輸入方法在實施時還可確定一個查閱鍵和四個聲調(diào)鍵,供漢語說得不準或知字音不知聲調(diào)的人使用,敲擊查閱鍵及聲調(diào)鍵,可在屏幕顯示中通過人機對話的方式確定所要輸入的字詞。在輸入帶有小意母的冷僻字、古文字時往往記不清其小意母,也可通過敲擊查閱鍵選擇確定。
本發(fā)明編碼方法中的表音部分采用音位制與聲韻制相結(jié)合,充分利用了漢字字音的特有規(guī)律,不僅所需用的字母數(shù)量少、拼式簡短(音節(jié)最大長度為4個字母),且拼法合理又合公例,較好地解決了編碼的直觀性和快捷性;表意部分采用聲母—韻母—意母方式,其中意母是根據(jù)漢字的聲調(diào)、詞性確定的,這種采用標聲調(diào)、標詞性的編碼方法,可完全解決定字問題;本發(fā)明的詞匯分類是根據(jù)詞匯在語言中的地位、功能及特點來分類的,既注重區(qū)分又兼顧聯(lián)系,因此理論上有完備合理性,實用上有清晰、方便性,其編碼可直接體現(xiàn)出漢字的發(fā)音、聲調(diào)、詞性及在語言中的地位及功能,易于理解掌握和便于使用。
本發(fā)明的方法有利于我國在較短的時間內(nèi)大規(guī)模普及應用電子計算機,有利于我國語言的規(guī)范化,推廣普通話;有利于在目前方塊漢字比較落后、笨拙的情況下,早日形成我國計算機專用文字;以本發(fā)明所形成的編碼,字音清晰、聲調(diào)明顯、詞性可辯、拼式簡短、沒有重碼、可徹底分清五萬多漢字,因此在計算機應用中,是完全可以用這種拼式來記載、交流語言的。
權(quán)利要求
1.一種計算機拼音漢字輸入方法,取漢語拼音的聲母字母、韻母字母及定字字母,并對應分配到西文鍵盤的各字母鍵位上,按漢字讀音擊鍵輸入其拼音音節(jié)的聲母字母,韻母字母和定字字母輸入漢字,其特征在于所述的定字字母是表示漢字聲調(diào)及詞性的意母,包括大意母和小意母;所述的大意母包括由名稱、動詞、形容詞、動名詞、形屬詞再分別結(jié)合陰平、陽平、上聲、去聲構(gòu)成的五大主詞意母,b d w j zp t k q cm y h x sf l z c s和由代詞、付詞、助形詞、介詞再分別結(jié)合陰平、陽平、上聲、去聲構(gòu)成的四大前助詞意母,b-d-w-j-p-t-k-q-m-y-h-x-f-l-z-c-所述的小意母是除r以外的聲母;各意母分配在西文鍵盤相應的字母、符號鍵位上;輸入五大主詞漢字時按漢字發(fā)音音節(jié)的聲母+韻母+大意母的順序輸入;輸入四大前助詞漢字時按漢字發(fā)音音節(jié)的聲母+大意母+韻母的順序輸入;輸入同音、同聲調(diào)又同詞性的五大主詞漢字時按漢字發(fā)音音節(jié)的聲母+韻母+大意母+小意母的順序輸入;輸入同音、同聲調(diào)又同詞性的四大前助詞漢字時按漢字發(fā)音音節(jié)的聲母+大意母+韻母+小意母的順序輸入;輸入數(shù)詞漢字時按漢字發(fā)音音節(jié)的聲母+韻母+大意母r的順序輸入;輸入序詞漢字時按漢字發(fā)音音節(jié)的聲母+大意母r+韻母的順序輸入,輸入擬聲詞漢字、呼詞漢字和聲尾詞漢字時按漢字發(fā)音音節(jié)的聲母+韻母+重復最后一個韻母字母的順序輸入;輸入連詞漢字時按漢字發(fā)音音節(jié)的聲母+韻母的順序輸入;輸入緊跟數(shù)詞的量尾詞或緊跟名詞的復數(shù)尾詞、性尾詞、介尾詞或緊跟形容詞的屬尾詞、修飾尾詞或緊跟動詞的時尾詞、態(tài)尾詞、補尾詞或緊跟擬聲詞的聲尾詞時,在前詞的聲母+韻母+意母后緊接后詞的聲母+韻母輸入。
2.根據(jù)權(quán)利要求1所述的計算機拼音漢字輸入方法,其特征在于所述的聲母包括b p m f d t n lg k h j q xz c s r z c s分別以同型字母鍵位擊鍵輸入,z c s分別是z c s的卷音,同擊相應字母鍵及-符號鍵輸入;當聲母b p m f d t n l g k h自成音節(jié)時用相應聲母+韻母e的順序輸入;當聲母j qx z c s r z c s自成音節(jié)時用相應聲母+韻母i的順序輸入;連詞漢字由聲母自成音節(jié)的用聲母直接輸入。
3.根據(jù)權(quán)利要求1所述的計算機拼音漢字輸入方法,其特征在于所述的韻母包括iuva ia uaouoe ieveai uaiei uiao ioou iuan ian uan vanen in un vnag iag uageg ing uegog iog用ag代替輸入韻母ang,用eg代替輸入韻母eng,用og代替輸入韻母ong,用ia代替輸入韻母iao,用iag代替輸入韻母iang,用iog代替輸入韻母iong,用uag代替輸入韻母uang,用ueg代替輸入韻母ueng,用un代替輸入韻母uen,用iu代替輸入韻母iou,用ui代替輸入韻母uei,用v代替輸入韻母ü;漢字后連寫有“兒”字作為該漢字的韻尾使用時,用卷音符號“-”加該漢字音節(jié)的最后一個韻母字母輸入“兒”字;韻母i、ia、ie、io、iu、ian、in、iag、ing、iog在與聲母j、q、x相拼時,凡復韻母省略i。
4.根據(jù)權(quán)利要求1所述的計算機拼音漢字輸入方法,其特征在于輸入的是由兩個漢字組成的詞組且有同音詞組時,連取兩字的聲母、韻母、意母輸入;輸入的是由兩個字組成的詞組且無同音詞組時,連取一字的聲母、韻母、意母和另一字的聲母、韻母輸入;輸入與原漢字本義無關(guān)聯(lián)或關(guān)聯(lián)極小的詞組時,連取詞組各字的聲母+韻母輸入;輸入與外來語諧音的詞組時,連取詞組各字的聲母+韻母輸入;輸入外國人名、地名時,連取人名、地名各字的聲母+韻母輸入,且第一字母用大寫鍵位輸入;輸入中國人名時,以各字的聲母+韻母分別輸入,各字的第一字母用大寫鍵位輸入;輸入專用詞組時,連取詞組各字的縮寫字母輸入。
全文摘要
本發(fā)明涉及一種計算機拼音漢字輸入方法,以漢字的聲母、韻母及用于定字的意母輸入漢字,意母字母表征漢字聲調(diào)及詞性。本發(fā)明按詞匯在語言中的地位、特點及功能分類成八種主詞、五種用于主詞前的前助詞和五種用于主詞后的后助詞。其中五大主詞及四大前助詞分別結(jié)合四種聲調(diào)形成36個大意母,還有用于區(qū)分同音、同調(diào)、同詞性漢字的20個小意母,聲母、韻母、意母使用西文鍵盤上26個字母鍵及3個符號鍵。字母少、拼式短、規(guī)則簡。
文檔編號G06F3/023GK1158449SQ9612055
公開日1997年9月3日 申請日期1996年12月12日 優(yōu)先權(quán)日1996年12月12日
發(fā)明者畢臻 申請人:畢臻