世界文字信息數(shù)字化運(yùn)算編碼輸入方法及其信息處理系統(tǒng)的制作方法
【專利摘要】世界文字信息數(shù)字化運(yùn)算編碼處理系統(tǒng),屬于世界文字信息數(shù)字化編碼處理技術(shù),它徹底解決了世界文字信息編碼處理的簡易性和高效率的矛盾。其主要特征是:使用0-9十個數(shù)字,運(yùn)算編碼世界文字?jǐn)?shù)字標(biāo)點(diǎn)符號,將這些數(shù)字編碼作為世界文字文獻(xiàn)檢索索引數(shù)碼及計算機(jī)世界文字輸入碼,建立了一整套世界文字信息數(shù)字化運(yùn)算編碼及輸入計算機(jī)、世界文字編碼排序檢索、世界文字計算機(jī)語言和操作系統(tǒng)及蕊片指令設(shè)計方法系統(tǒng),廣泛用于計算機(jī)系統(tǒng)、通訊系統(tǒng)及世界文字編碼排序檢索系統(tǒng)。
【專利說明】世界文字信息數(shù)字化運(yùn)算編碼輸入方法及其信息處理系統(tǒng)
[0001]本案是2001年5月8日提交的中國專利申請01809017.6的分案申請。
【技術(shù)領(lǐng)域】
[0002]本發(fā)明涉及世界文字信息數(shù)字化編碼輸入方法及相關(guān)的信息處理系統(tǒng),具體地說涉及采用數(shù)字對世界文字進(jìn)行編碼的輸入方法以及相關(guān)的信息處理系統(tǒng)。
【背景技術(shù)】
[0003]世界文字信息數(shù)字化編碼處理技術(shù)的現(xiàn)狀:
[0004]世界文字信息數(shù)字化編碼處理技術(shù)是全世界范圍內(nèi)的歷史性重大課題,世界各國都在進(jìn)行這項(xiàng)課題的研究,并提出了上千種方案,這些已有方案各有優(yōu)點(diǎn),也存在著不能統(tǒng)一標(biāo)準(zhǔn),易學(xué)難用、易用難學(xué)及違反漢字構(gòu)形原理的缺點(diǎn)。
[0005]發(fā)明目的
[0006]本發(fā)明的目的是:統(tǒng)一使用0-9十個數(shù)字對世界文字信息進(jìn)行數(shù)字化運(yùn)算編碼處理,解決世界文字信息編碼處理的簡易性和高效率的矛盾。
【發(fā)明內(nèi)容】
[0007]為了實(shí)現(xiàn)本發(fā)明的這一目的,根據(jù)本發(fā)明的第一方面提供了世界文字的編碼輸入方法,其用于對世界文字編碼并輸入計算機(jī)裝置中,所述計算機(jī)裝置包含數(shù)字鍵盤,所述方法包括:對于世界文字中的每一種文字,將組成該種文字或能確定該種文字的若干基本組成部件,分配到數(shù)字鍵盤的相應(yīng)數(shù)字鍵上,每一基本組成部件的編碼由區(qū)碼和位碼唯一確定,區(qū)碼為部件所在鍵的數(shù)字,位碼為基本部件在所屬數(shù)字鍵中的位置編號;選擇待輸入文字的種類;對于待輸入種類文字的每一字,將其分解為所述若干部件的一個組合;用該組合中的每個部件相對應(yīng)的區(qū)碼和位碼按順序排列作為對該文字的編碼;以及輸入該字的編碼。
[0008]在根據(jù)本發(fā)明的第一方面中,所述世界文字分為表意文字和表音文字;對于表音文字來說,所述部件是該表音文字的字母;對于表意文字來說,所述基本部件可以分別包括構(gòu)成所述表意文字字形的基本筆劃,構(gòu)成表意文字讀音的拼音字母,構(gòu)成表意文字音形的基本筆劃和拼音字母。
[0009]所述表音文字包括英文、法文、德文、意大利文、西班牙文、俄文、希臘文、阿拉伯文字、日文、朝韓文,所述表意文字包括中文;對于中文來說,所述基本部件可以分別包括構(gòu)成漢字字形的基本筆劃,構(gòu)成漢字漢語讀音的拼音字母或聲母、韻母,構(gòu)成漢字音形的漢字基本筆劃和拼音字母或聲母、韻母;對于日語,所述基本部件可以分別包括日文中的漢字字形的基本筆劃,構(gòu)成日文文字的假名、以及構(gòu)成日文漢字的日語讀音的假名;對于朝韓語,所述基本部件分別包括構(gòu)成韓文中的漢字字形的基本筆劃,構(gòu)成韓文文字的朝韓語字母,以及漢字的朝韓語讀音的朝韓語字母。
[0010]優(yōu)選的是,按漢字字形對漢字編碼時所述基本部件是漢字的基本筆劃,其編碼僅由其區(qū)碼確定,并且按如下方法確定基本筆劃及其區(qū)碼:把漢字的筆劃歸類為橫、豎、撇、點(diǎn)、折五種基本筆劃,相應(yīng)定義其代碼為1、2、3、4、5,以此形成一劃編碼;橫、豎、撇、點(diǎn)、折兩兩組合,每個組合各自的筆劃代碼數(shù)字相加,并進(jìn)行滿十減十運(yùn)算,以此形成二劃組合編碼;橫、豎、撇、點(diǎn)、折任意三劃組合,各自的組合筆劃代碼數(shù)字相加,進(jìn)行滿十減十運(yùn)算,以此形成三劃組合編碼;橫、豎、撇、點(diǎn)、折多于三劃的組合,各自的組合筆劃代碼數(shù)字相加,進(jìn)行滿十減十運(yùn)算,以此形成多于三劃組合編碼。
[0011]優(yōu)選的是,按漢字漢語拼音字母編碼漢字時,所述基本部件包括構(gòu)成漢字漢語讀音的拼音字母和該漢字的聲調(diào),漢字的編碼由構(gòu)成該漢字漢語讀音的拼音字母的區(qū)碼和聲調(diào)碼依次組成,其中所述聲調(diào)碼由0-9十個數(shù)字中任選的4個不同數(shù)字對漢語聲調(diào)作的編碼構(gòu)成。
[0012]優(yōu)選的是,按漢字漢語讀音對漢字編碼時所述基本部件是構(gòu)成漢字的漢語讀音字母的聲母、韻母,并且由構(gòu)成漢字漢語讀音的聲母、韻母的區(qū)碼和位碼依次組成漢字的編碼。
[0013]優(yōu)選的是,按漢字形音對漢字編碼時所述基本部件為構(gòu)成漢字漢語讀音的聲母、韻母與漢字的基本筆劃;其中聲母、韻母和基本筆劃的區(qū)位碼分別確定,聲母、韻母的區(qū)位碼可以采用和基本筆劃的區(qū)位碼相同的數(shù)字,而漢字的基本筆劃及其編碼按權(quán)利要求4所述的方法確定。
[0014]優(yōu)選的是 ,對于日語,所述基本部件可以包括構(gòu)成日文文字的假名、以及構(gòu)成日文中漢字的日語讀音的假名,并且對構(gòu)成日文文字的假名、組成漢字日語讀音的假名編碼,由假名的編碼依次組成日文文字的編碼。
[0015]優(yōu)選的是,對于朝韓語,所述基本部件包括構(gòu)成韓文文字的朝韓語字母,以及韓文中漢字詞的朝韓語讀音的朝韓語字母。朝韓語字母按順序分區(qū)排列,并由區(qū)碼構(gòu)成字母的編碼。
[0016]優(yōu)選的是,對于朝韓語而言所述基本部件是朝韓語字母,按如下方式確定朝韓語字母的區(qū)位碼:
[0017]使用0-9十個數(shù)字,把朝韓語字母的筆劃歸類為橫、豎、撇、點(diǎn)、折五種基本筆劃,相應(yīng)定義其代碼為1、2、3、4、5,把字母的筆劃代碼數(shù)相加,滿十減十運(yùn)算后,朝韓語字母的編碼分別為:d、z
[0018]編碼為O ; —、已的編碼為I ; 1、方編碼為2 ;J-、」、丄、T、的編碼為3;》、^的編碼為4 ;JL、TT、7、U的編碼為5 ;匕、《編碼為6 ?’人、£的編碼為7 ;口、9的編碼為8 ; ^、玄編碼為9。
[0019]優(yōu)選的是,對于表音文字,可以由其字母的區(qū)碼依次構(gòu)成字母的編碼。
[0020]優(yōu)選的是,對于表音文字,可以由其字母的區(qū)碼和位碼依次構(gòu)成字母的編碼。
[0021]根據(jù)本發(fā)明的第二方面提供一種世界文字計算機(jī)語言編寫方法,所述方法包括步驟:使用世界文字、標(biāo)點(diǎn)、符號、數(shù)字作編寫字符,按計算機(jī)語言類型、格式、內(nèi)容、用途編寫計算機(jī)語言;采用依據(jù)本發(fā)明第一方面所述編碼方法的編碼輸入方法及其處理裝置,編碼并輸入世界文字符。
[0022]根據(jù)本發(fā)明的第三方面提供一種機(jī)器語言的編寫方法,所述方法包括步驟:使用世界文字、數(shù)字、標(biāo)點(diǎn)、符號說明計算機(jī)機(jī)器語言所要完成的任務(wù);使用任意四位十進(jìn)制數(shù)表示說明機(jī)器語言所要完成任務(wù)的世界文字、數(shù)字、標(biāo)點(diǎn)、符號,或依據(jù)采用本發(fā)明第一方面編碼方法使用四位十進(jìn)制數(shù),對表明機(jī)器語言完成任務(wù)的世界文字、數(shù)字、標(biāo)點(diǎn)、符號進(jìn)行編碼,不足四位的編碼在編碼前面使用O加夠四位數(shù),使用四位十進(jìn)制數(shù)的編碼表示說明機(jī)器語言所要完成任務(wù)的世界文字、數(shù)字、標(biāo)點(diǎn)、符號;使用四位二進(jìn)制數(shù)表示一個十進(jìn)制數(shù),共使用十六位二進(jìn)制數(shù)表示四位十進(jìn)數(shù)。
[0023]根據(jù)本發(fā)明的第四方面提供一種匯編語言的編寫方法,所述方法包括步驟:使用世界文字、數(shù)字、標(biāo)點(diǎn)、符號說明計算機(jī)匯編語言所要完成的任務(wù);使用任意四位十進(jìn)制數(shù)表示說明匯編語言所要完成任務(wù)的世界文字、數(shù)字、標(biāo)點(diǎn)、符號,或依據(jù)采用本發(fā)明第一方面的編碼方法使用四位十進(jìn)制數(shù),對表明匯編語言所要完成任務(wù)的世界文字、數(shù)字、標(biāo)點(diǎn)、符號進(jìn)行編碼,不足四位的編碼在編碼前面使用O加夠四位數(shù),使用四位十制數(shù)的編碼表示說明匯編語言所要完成任務(wù)的世界文字、數(shù)字、標(biāo)點(diǎn)、符號。
[0024]根據(jù)本發(fā)明的第五方面提供一種世界文字計算機(jī)蕊片指令設(shè)計方法,其包括步驟:使用漢字、字母、標(biāo)點(diǎn)、符號、數(shù)字作為指令設(shè)計符號,表明計算機(jī)蕊片指令所要完成的任務(wù);采用依據(jù)采用本發(fā)明第一方面的編碼方法使用四位十進(jìn)制數(shù)編碼表示一個世界文字字符;以及使用十六位二進(jìn)數(shù)O和I表示計算機(jī)蕊片所要完成的任務(wù)。
[0025]根據(jù)本發(fā)明的第六方面提供一種采用依據(jù)本發(fā)明第一方面所述指令設(shè)計方法的世界文字計算機(jī)蕊片指令。
[0026]根據(jù)本發(fā)明的第七方面提供一種世界文字計算機(jī)程序語言,所述程序語言包括由世界文字構(gòu)成的常量、變量,運(yùn)算表達(dá)式,程序流程控制,其中世界文字采用本發(fā)明第一方面所述的編碼方法輸入。
[0027]根據(jù)本發(fā)明的第八方面提供一種世界文字計算機(jī)操作系統(tǒng)設(shè)計方法,所述方法包括步驟:使用圖形、世界文字、字母、假名、標(biāo)點(diǎn)、符號、數(shù)字作操作符,按計算機(jī)操作系統(tǒng)的類型、用途、任務(wù)、設(shè)計計算機(jī)操作系統(tǒng);使用世界文字命名文件,并使用此世界文字文件名訪問用世界文字標(biāo)明的文件所在磁盤中的存放地址;采用本發(fā)明第一方面的編碼輸入方法分或不分國別編碼輸入世界文字字符。
[0028]根據(jù)本發(fā)明的第九方面提供世界文字計算機(jī)操作系統(tǒng),包括使用圖形、世界文字、字母、假名、標(biāo)點(diǎn)、符號、數(shù)字構(gòu)成的操作符;世界文字命名的文件,使用此世界文字文件名訪問用世界文字標(biāo)明的文件所在磁盤中的存放地址;使用圖形,世界文字、數(shù)字按窗口畫面的形式顯示在顯示屏上的操作命令,用于提供選擇操作;采用本發(fā)明第一方面所述編碼方法的編碼輸入處理裝置,用于編碼輸入世界文字操作符進(jìn)行操作。
[0029]有益效果
[0030]世界文字信息數(shù)字化運(yùn)算編碼處理系統(tǒng)方案與現(xiàn)有技術(shù)相比,具有以下優(yōu)點(diǎn):
[0031]1.統(tǒng)一使用0-9十個數(shù)字對世界文字信息進(jìn)行數(shù)字化運(yùn)算編碼處理,徹底解決世界文字信息編碼處理的簡易性和高效率的矛盾。
[0032]2.建立了一整套世界文字信息數(shù)字化運(yùn)算編碼及輸入計算機(jī)、世界文字編碼排序檢索、世界文字計算機(jī)語言和操作系統(tǒng)及蕊片指令設(shè)計方法系統(tǒng)。
[0033]3.開創(chuàng)了 一種通用于計算機(jī)世界文字編碼輸入方法、世界文字編碼排序檢索方法的世界文字信息數(shù)字化運(yùn)算編碼方法?!緦@綀D】
【附圖說明】
[0034]通過以下結(jié)合附圖對實(shí)施例的具體描述,本發(fā)明的優(yōu)點(diǎn)將會更加明顯,其中:
[0035]圖1是本發(fā)明所采用的五類基本筆劃的名稱、編碼、筆形和運(yùn)筆走向;
[0036]圖2是五類基本筆劃的15個二筆劃組合結(jié)果及其編碼;
[0037]圖3是漢語拼音字母1-8區(qū)的分布;
[0038]圖4是漢語拼音字母1-0區(qū)的分布;
[0039]圖5是漢語拼音聲母、韻母0-9區(qū)的分布;
[0040]圖6是漢語注音字母1-9區(qū)的分布;
[0041]圖7是日文假名1-8區(qū)的分布;
[0042]圖8是日文假名2-9區(qū)的分布;
[0043]圖9是日文假名1-9區(qū)的分布;
[0044]圖10是日文假名1-0區(qū)的分布;
[0045]圖11是朝韓文字母1-8區(qū)的分布;
[0046]圖12是朝韓文字母1-0區(qū)的分布;
[0047]圖13是朝韓文元音、輔音字母1-0區(qū)的分布;圖14是朝韓文字母及其運(yùn)算編碼;
[0048]圖15是英文字母1-8區(qū)的分布;
[0049]圖16是英文字母1-0區(qū)的分布;
[0050]圖17是西班牙文字母1-8區(qū)的分布;
[0051]圖18是西班牙文字母1-0區(qū)的分布;
[0052]圖19是德文字母1-8區(qū)的分布;
[0053]圖20是德文字母1-0區(qū)的分布;
[0054]圖21是俄文字母1-8區(qū)的分布;
[0055]圖22是俄文字母1-0區(qū)的分布;
[0056]圖23是法文字母1-8區(qū)的分布;
[0057]圖24是法文字母1-0區(qū)的分布;
[0058]圖25是希臘文字母1-8區(qū)的分布;
[0059]圖26是希臘文字母1-0區(qū)的分布;
[0060]圖27是阿拉伯文字母1-8區(qū)的分布;
[0061]圖28是阿拉伯文字母1-0區(qū)的分布;
[0062]圖29是標(biāo)點(diǎn)、符號的名稱及其編碼;
[0063]圖30是電子出版類檢索系統(tǒng)的排序;以及
[0064]圖31是顯示屏的設(shè)置。
[0065]圖32是數(shù)字鍵盤的簡要設(shè)置。
[0066]實(shí)施本發(fā)明的最佳方式
[0067]本發(fā)明的世界文字信息數(shù)字化編碼輸入方法及其信息處理系統(tǒng)方案包括下列各項(xiàng):世界文字信息數(shù)字化運(yùn)算編碼輸入方法及其處理裝置;世界文字編碼排序檢索方法及其檢索系統(tǒng);世界文字計算機(jī)語言編寫方法及其執(zhí)行方式;世界文字計算機(jī)芯片指令設(shè)計方法;世界文字計算機(jī)芯片指令;世界文字計算機(jī)程序語言;世界文字計算機(jī)操作系統(tǒng)設(shè)計方法及操作方式;世界文字計算機(jī)操作系統(tǒng)及操作方法。[0068]世界文字信息數(shù)字化運(yùn)算編碼輸入方法及其處理裝置
[0069]下文描述世界文字信息數(shù)字化運(yùn)算編碼輸入方法及其處理裝置。
[0070]世界文字信息數(shù)字化運(yùn)算編碼輸入方法及其處理裝置包括:世界文字信息數(shù)字化運(yùn)算編碼輸入方法,世界文字信息數(shù)字化運(yùn)算編碼輸入處理裝置。
[0071]一.世界文字信息數(shù)字化運(yùn)算編碼輸入方法
[0072]世界文字信息數(shù)字化運(yùn)算編碼輸入方法包括:世界文字信息數(shù)字化運(yùn)算編碼方法,世界文字信息數(shù)字化輸入方法。
[0073]㈠.世界文字信息數(shù)字化運(yùn)算編碼方法
[0074]世界文字信息數(shù)字化運(yùn)算編碼方法為:按照世界文字的字形(即文字的圖像信息)、讀音(即文字的聲音信息),使用0-9十個數(shù)字,采用加法、減法、分區(qū)按位運(yùn)算編碼的方法,編碼組成世界文字字形、讀音的筆劃、字母,由組合筆劃的編碼、字母的編碼或者字母組成世界文字的編碼,根據(jù)世界文字的分類,把世界文字分類為漢字(即表意文字)、表音文字、數(shù)字、標(biāo)點(diǎn)、符號進(jìn)行數(shù)字化運(yùn)算編碼。
[0075]1.漢字的數(shù)字化運(yùn)算編碼方法
[0076]漢字的數(shù)字化運(yùn)算編碼方法為:按照漢字的字形、讀音,使用0-9十個數(shù)字,采用加法、減法、分區(qū)按位運(yùn)算的編碼方法,編碼組成漢字字形、讀音的筆劃、字母,由組合筆劃的編碼、字母或者字母的編碼組成漢字的編碼。
[0077](I)按照漢字的字形,數(shù)字化運(yùn)算編碼漢字的方法
[0078]按照漢字的字形,數(shù)字化運(yùn)算編碼漢字的方法為:按照漢字的字形,根據(jù)漢字的部首劃分,把漢字劃分為部首和除部首以外組合成漢字的剩余部件(簡稱余件,以下相同)兩個部份,使用0-9十個數(shù)字,采用加法、減法分別運(yùn)算編碼組合成部首和余件的筆劃,由組合筆劃的代碼數(shù)字相加,滿十減十運(yùn)算后,組合成部首和余件的編碼,依照漢字的書寫筆順,按先取多筆劃組合編碼,后取少筆劃組合編碼的取碼順序,先取“多于三劃組合”的編碼,后取“三劃組合”的編碼,再取“二劃組合”的編碼,最后取“一劃”的編碼,部首取碼不超兩碼,余件取碼不超三碼,把部首和余件的編碼,組合成該漢字的編碼,每個漢字最多取四碼,最少取一碼,按照漢字的單字和詞組劃分,把漢字分為單字和詞組進(jìn)行編碼。
[0079]①采用加法、減法運(yùn)算“一劃”、“二劃組合”、“三劃組合”、“多于三劃組合”的編碼分別為:
[0080]A:“一劃”的編碼:
[0081]把漢字的筆劃歸類為橫(_)、豎(I)、撇())、點(diǎn)(、)、折(乙)五種基本筆劃,相應(yīng)定義其代碼為1、2、3、4、5,以此形成“一劃”的編碼。(如圖1所示)
[0082]B: “二劃組合”的編碼:
[0083]橫、豎、撇、點(diǎn)、折兩兩組合有十五種結(jié)果:橫橫組合、橫豎組合、橫撇組合、橫點(diǎn)組合、橫折組合;豎豎組合、豎撇組合、豎點(diǎn)組合、豎折組合;撇撇組合、撇點(diǎn)組合、撇折組合;點(diǎn)點(diǎn)組合、點(diǎn)折組合;折折組合;每個組合各自的筆劃代碼數(shù)字相加,滿十減十運(yùn)算后其相應(yīng)的編碼分別為:2、3、4、5、6 ;4、5、6、7 ;6、7、8 ;8、9 ;0 ;以此形成“二劃組合”的編碼。(如圖2所示)
[0084]C:“三劃組合”的編碼:
[0085]橫、豎、撇、點(diǎn)、折任意三劃組合:寸、弋Y各自的組合筆劃代碼數(shù)字相加,滿十減十運(yùn)算后其編碼為Od、門、己、弓、子、鄉(xiāng)、馬,各自的組合筆劃代碼數(shù)字相加,滿十減十運(yùn)算后其編碼為1:夕、夂、4、小,各自的組合筆劃代碼數(shù)相加,滿十減十運(yùn)算后其編碼為2 ;?、”、1_,各自的組合筆劃代碼數(shù)字相加,滿十減十運(yùn)算后其編碼為3 ;工、土、申、么,各自的組合筆劃代碼數(shù)字相加,滿十減十運(yùn)算后其編碼4 ;*、〈〈〈,各自的組合筆劃代碼數(shù)字相加,滿十減十運(yùn)算后其編碼為5;升的組合筆劃代碼字?jǐn)?shù)相加,其編碼為6 4、彳、3,各自的組合筆劃代碼數(shù)字相加,其編碼為7 ;大、口 4、廣,各自的組合筆劃代碼數(shù)字相加,其編碼為8;尤、小、巾、山4、個、'>、尸、女,各自的組合筆劃代碼數(shù)字相加,其編碼為9;以此形成“三劃組合”的編碼。
[0086]D 多于三劃組合”的編碼
[0087]橫、豎、撇、點(diǎn)、折多于三劃的組合:木、月、韋、火、水、日,各自的組合筆劃代碼數(shù)字相加,滿十減十運(yùn)算后其相應(yīng)的編碼分別為0、0、2、4、7、9 ;以此形成“多于三筆劃組合”的編碼。
[0088]②依據(jù)上述的“一劃”、“二劃組合”、“三劃組合”、“多于三劃組合”的編碼,漢字單字、詞組的編碼方法分別為:
[0089]A:單字的編碼方法
[0090]單字的編碼方法依照漢字的獨(dú)體字與合體字的分類進(jìn)行編碼。
[0091]a.獨(dú)體字的編碼方法
[0092]獨(dú)體字的編碼方法按超過和不超過四碼的漢字進(jìn)行編碼。
[0093]1:不超四碼(包括四碼)獨(dú)體字的編碼方法為:取完獨(dú)體字的筆劃組合編碼,依次組成該字的編碼。
[0094]例:“中”字,其中“口”編碼為8,“ I ”編碼為2,則“中”,的編碼為82。
[0095]I1:超過四碼獨(dú)體根字的編碼方法為:取獨(dú)體字的前三碼和尾碼,依次組成該字的編碼。
[0096]例如:“粵”字,其中”編碼為3,“門”編碼為7,“”編碼為7,“木”編碼為0,“一”
編碼為1,“”編碼為6,取其前三碼和尾碼,則“粵”的編碼為3776。
[0097]b.合體字的編碼方法
[0098]合體字的編碼方法按超過和不超過四碼的合體字分部首和余件進(jìn)行編碼。
[0099]1:不超四碼合體字的編碼方法為:
[0100]1.部首取一碼,余件取一至三碼,依次組成該字的編碼。
[0101]例外”字,部首為“夕”,編碼為2,余件“卜”編碼為6,則“外”字編碼為26。
[0102]i1.部首取兩碼,余件取一至兩碼,依次組成該字編碼。
[0103]例.“碼,,字,部首“石”編碼為48,余件“馬”編碼為1,則“碼”的編碼為481。
[0104]I1:超過四碼合體字的編碼方法為:
[0105]1.部首取一碼,余件取前兩碼和尾碼,依次組成該字的編碼。
[0106]例:“編”字,部首“鄉(xiāng)”編碼為1,余件“扁”編碼為9475,則“編”字的編碼為1945。
[0107]i1.部首取首碼和尾碼,余件取首碼和尾碼,依次組成該字的編碼。
[0108]例:“數(shù)”字,部首“夂.”編碼為47,余件“婁”編碼為709,則“數(shù)”字的編碼為7947。
[0109]B:詞組的編碼方法
[0110]詞組的編碼方法依照詞組的字?jǐn)?shù),分二字詞、三字詞、多于三字以上的多字詞進(jìn)行編碼。
[0111]a.二字詞的編碼方法為:每字各取首碼和尾碼,依次組成該詞組的編碼。
[0112]例:“信息”,“信”字的編碼為5528,“息”字的編碼為3288,則“信息”的編碼為各字取首碼和尾碼為5838。
[0113]b.三字詞的編碼方法為:前二字各取首碼,后一字取首碼和尾碼,依次組成該詞組的編碼。
[0114]例:“數(shù)字化”,“數(shù)”字編碼為7947,“字”編碼為21,“化”字編碼為58,則“數(shù)字化”的編碼為7258。
[0115]c.多字詞的編碼方法為:前三字和尾字各取前一碼,共四碼,依次組成該詞組的編碼。
[0116]例:“中華人民共和國”,“中”編碼為82,“華”的編碼為583,“人”的編碼為7,“國”的編碼為8234,則“中華人民共和國”的編碼為8578。
[0117](2).按照漢字的讀音,數(shù)字化運(yùn)算編碼漢字的方法
[0118]按照漢字的讀音,編碼漢字的方法為:按照漢字的讀音,使用0-9十個數(shù)字,采用分區(qū)按位運(yùn)算編碼方法,編碼構(gòu)成漢字讀音的字母,把字母分布在用0-9十個數(shù)字編號的十個區(qū),排列在每個區(qū)里用0-9十個數(shù)字編號的位上,由字母的區(qū)號或者區(qū)位號作為該字母的編碼,再由字母或者字母的編碼組成該字的編碼,根據(jù)漢字在不同國家的讀音,把漢字分為按漢字漢語讀音、按漢字日語讀音、按漢字朝韓語讀音進(jìn)行編碼。
[0119]①漢字漢語讀音數(shù)字化運(yùn)算編碼漢字的方法
[0120]漢字漢語讀音數(shù)字化運(yùn)算編碼漢字的方法為:按照漢字的漢語讀音,使用0-9十個數(shù)字,采用分區(qū)按位運(yùn)算字母的編碼方法,編碼構(gòu)成漢字漢語讀音的字母、聲調(diào),把字母分布在用0-9十個數(shù)字編號的十個區(qū),排列在每個區(qū)里用0-9十個數(shù)字編號的位上,由字母的區(qū)號或者區(qū)位號作為該字母的編碼;聲調(diào)的編碼由它的序數(shù)作為編碼,陰平(一)編碼為1,陽平(/)編碼為2,上聲(V)編碼為3,去聲(\ )編碼為4;再由字母和聲調(diào)或者字母的編碼和聲調(diào)的編碼組成該字的編碼,按照構(gòu)成漢字漢語讀音的字母類型,分按拼音字母、按聲母和韻母進(jìn)行數(shù)字化運(yùn)算編碼漢字。
[0121]A:按漢語拼音字母數(shù)字化運(yùn)算編碼漢字的方法
[0122]按漢語拼音字母數(shù)字化運(yùn)算編碼漢字的方法為:按照漢字的漢語讀音,使用0-9十個數(shù)字,采用分區(qū)按位運(yùn)算編碼拼音字母的方法,編碼構(gòu)成漢字漢語讀音的拼音字母、聲調(diào),把字母分布在用0-9十個數(shù)字編號的十個區(qū),排列在每個區(qū)里用0-9十個數(shù)字編號的位上,由字母的區(qū)號或區(qū)位號作為該字母的編碼,再由字母、聲調(diào)或者字母的編碼和聲調(diào)的編碼組成該字的編碼。
[0123]a.采用分區(qū)按位運(yùn)算編碼拼音字母的方法
[0124]采用分區(qū)按位運(yùn)算編碼拼音字母的方法包括:分八區(qū)按位運(yùn)算編碼拼音字母的方法,分十區(qū)按位運(yùn)算編碼拼音字母的方法。
[0125]1:分八區(qū)按位運(yùn)算編碼拼音字母的方法
[0126]分八區(qū)按位運(yùn)算編碼拼音字母的方法:使用0-9十個數(shù)字中任意的八個數(shù)字,編號劃分八個或十個區(qū),每個數(shù)字編號劃分一個區(qū),每個區(qū)編號劃分。1-3三個位或者1-4四個位,把二十六個漢語拼音字母,按字母順序分布在八個區(qū)的二十六個位上,由字母的區(qū)號或區(qū)位號作為該字母的編碼。其中:
[0127]分卜8區(qū)按位運(yùn)算編碼的字母分別為:(如圖3所示)
[0128]I 區(qū)的 1-4 位相應(yīng)為:a、b、C、d ‘
[0129]2區(qū)的1-3位相應(yīng)為:e、f、g
[0130]3區(qū)的1-4位相應(yīng)為:h、1、j、k
[0131]4區(qū)的1-3位相應(yīng)為1、m、η
[0132]5區(qū)的1-3位相應(yīng)為O、p、q
[0133]6區(qū)的1-3位相應(yīng)為:r、S、t
[0134]7區(qū)的1-3位相應(yīng)為:u、v、w [0135]8區(qū)的1-3位相應(yīng)為:x、y、z
[0136]I1:分十區(qū)按位運(yùn)算編碼拼音字母的方法
[0137]分十區(qū)按位運(yùn)算編碼拼音字母的方法為:使用0-9十個數(shù)字,編號劃分十個區(qū),每個數(shù)字編號劃分一個區(qū),每個區(qū)編號劃分1-2 二個位或者1-3三個位,把二十六個漢語拼音字母,按字母順序分布在十個區(qū)的二十六個位上,由字母的區(qū)號或區(qū)位號作為該字母的編碼。其中:
[0138]分1-0區(qū)按位運(yùn)算編碼拼音的字母分別為:(如圖4所示)
[0139]。I區(qū)的1-2位相應(yīng)為:a、b.[0140]2區(qū)的1-2位相應(yīng)為:c、d
[0141]3區(qū)的1-3位相應(yīng)為:e、f、g
[0142]4區(qū)的1-2位相應(yīng)為:h、i
[0143]5區(qū)的1-2位相應(yīng)為:j、k
[0144]6區(qū)的1-3位相應(yīng)為:l、m、n
[0145]7區(qū)的1-3位相應(yīng)為:o、p、q
[0146]8區(qū)的1-3位相應(yīng)為:r、S、t
[0147]9區(qū)的1-3位相應(yīng)為:u、v、w
[0148]O區(qū)的1-3位相應(yīng)為:x、y、z
[0149]例如:在分1-8區(qū)按位運(yùn)算編碼的字母方法中,“中”的漢語讀音為“zhong”,其拼音字母的區(qū)號編碼依次為:z為8,h為3,0為5,11為44為2,則“zhong”的編碼為83542,由zhong作為“中”字的編碼;或者由“zhong”的編碼83542組成“中”字的編碼;加聲調(diào)編碼時,聲調(diào)陰平(_)的編碼為1,則“zhdng”的編碼為835421,由zh6ng作為“中”字的編碼;或者由“zhdng”的編碼835421組成“中”字的編碼。
[0150]B:按漢語聲母、韻母數(shù)字化運(yùn)算編碼漢字的方法
[0151]按漢語聲母、韻母數(shù)字化運(yùn)算編碼漢字的方法為:依照漢字的漢語讀音,使用0-9十個數(shù)字,采用分區(qū)按位運(yùn)算編碼聲母、韻母的方法,編碼構(gòu)成漢字漢語讀音的聲母、韻母、聲調(diào),把字母分布在用0-9十個數(shù)字編號的十個區(qū),排列在每個區(qū)里用0-9十個數(shù)字編號的位上,由聲母、韻母的區(qū)號或者區(qū)位號作為該聲母、韻母的編碼;聲調(diào)的編碼由它的序數(shù)作為編碼,陰平㈠編碼為1,陽平(/ )編碼為2,上聲(V)編碼為3,去聲(\ )編碼為4;再由字母和聲調(diào)或者字母的編碼和聲調(diào)的編碼組成該字的編碼,按照漢字的單字和詞組劃分,把漢字分為單字和詞組進(jìn)行編碼。[0152]a.采用分區(qū)按位運(yùn)算編碼聲母、韻母的方法
[0153]按漢語聲母、韻母數(shù)字化運(yùn)算編碼漢字的方法包括:分九區(qū)按位運(yùn)算編碼聲母、韻母的方法,分十區(qū)按位運(yùn)算編碼聲母、韻母的方法。
[0154]1:分九區(qū)按位運(yùn)算編碼聲母、韻母的方法
[0155]分九區(qū)按位運(yùn)算編碼聲母、韻母的方法為:使用0-9十個數(shù)字中任意的九個數(shù)字,編號劃分的九個區(qū),每個數(shù)字編號劃分一個區(qū),每個區(qū)編號劃分1-4四個位,把不多于四十個的聲母、韻母,按聲母、韻母順序分布在十個區(qū)的四十個位上,由聲母、韻母的區(qū)號或者區(qū)位號作為該聲母、韻母的編碼。其中:
[0156]分1-9區(qū)按位運(yùn)算編碼的漢語注音聲母、韻母分別為:(如圖6所示)
[0157]I區(qū)的1-4位相應(yīng)為:勹、夕、丫、萬
[0158]2區(qū)的1-4位相應(yīng)為:門、C、亡、
[0159]3區(qū)的1_4位相應(yīng)為:為、太、乂、U
[0160]4區(qū)的1-4位相應(yīng)為:3、為、舊、\
[0161]5區(qū)的1-4位相應(yīng)為:《、萬、幺、又
[0162]6區(qū)的1-4位相應(yīng)為:廠、q、J|、h
[0163]7區(qū)的1-4位相應(yīng)為,L、T、-蟲、尤
[0164]8區(qū)的1-4位相應(yīng)為J、尸、0、L
[0165]9區(qū)的1-4位相應(yīng)為:P、虧、厶、寸
[0166]I1:分十區(qū)按位運(yùn)算編碼聲母、韻母的方法
[0167]分十區(qū)按位運(yùn)算編碼聲母、韻母的方法為:使用0-9十個數(shù)字,編號劃分十個區(qū),每個數(shù)字編號劃分一個區(qū),每個區(qū)編號劃分1-4四個位,把不多于四十個的聲母、韻母,按聲母、韻母順序分布在十個區(qū)的四十個位上,由聲母、韻母的區(qū)號或者區(qū)位號作為該聲母、韻母的編碼。其中:
[0168]分1-0區(qū)按位運(yùn)算編碼的漢語拼音聲母、韻母分別為:(如圖5所示)
[0169]I區(qū)的1-4位相應(yīng)為:b、p、a、ο
[0170]2區(qū)的1-4位相應(yīng)為:m、f、e、I
[0171]3區(qū)的1-4位相應(yīng)為:d、t、U、u
[0172]4 區(qū)的 1-4 位相應(yīng)為:n、l、a1、ei
[0173]5 區(qū)的 1-4 位相應(yīng)為:g、k、ao、ou
[0174]6 區(qū)的 1-4 位相應(yīng)為:h、j、an、en
[0175]7 區(qū)的 1-4 位相應(yīng)為:q、x、ang、eng
[0176]8 區(qū)的 1-4 位相應(yīng)為:zh、ch、ong、ie
[0177]9 區(qū)的 1-4 位相應(yīng)為:sh、r、in、un
[0178]0 區(qū)的 1_4 位相應(yīng)為:z、c、s、ing
[0179]c.依據(jù)上述的聲母、韻母、聲調(diào)的編碼,單字、詞組的編碼方法分別為:
[0180]1:單字的編碼方法
[0181]依照漢字的漢語讀音,編碼構(gòu)成漢字漢語讀音的聲母、韻母、聲調(diào),由聲母、韻母的區(qū)號或者區(qū)位號作為該聲母、韻母的編碼,再由聲母、韻母、聲調(diào)或者聲母、韻母、聲調(diào)的編碼組成該字的編碼。
[0182]例I 漢”字的漢語拼音讀音為“han”,在分1_0十區(qū)按位運(yùn)算編碼的漢語拼音聲母、韻母中,聲母“h”的區(qū)號編碼為6,區(qū)位號編碼為61,韻母“an”的區(qū)號編碼為6,區(qū)位號編碼為63,則“han”的編碼為66或者61 (h)、63 (an),再由han作為“漢”字的編碼;加聲調(diào)編碼時,聲調(diào)陰平(\ )的編碼為4,則“hto”的編碼為664或者61(h)、63(an)、4,再由haan作為“漢”字的編碼?;蛘哂陕暷浮癶”的區(qū)位號編碼61,韻母“an”的區(qū)位號編碼63,聲調(diào)的陰平(\ )的編碼4,組成“漢”字的編碼,則“漢”字的編碼為61634。
[0183]例2 漢”字的漢語注音讀音為“廠弓”,在分1-9區(qū)按位運(yùn)算編碼的漢語注音聲母、韻母中,聲母“廠”的區(qū)號編碼為6,韻母“ψ,的區(qū)號編碼為6,則“廠巧”的編碼為66,再由廠號作為“漢”字的編碼;加聲調(diào)編碼時,聲調(diào)陰平(\ )的編碼為4,則“廠弓”的編碼為664,再由廠號作為“漢”字的編碼。或者由聲母“廠”的區(qū)位號編碼61,韻母“號”的區(qū)位號編碼63,聲調(diào)的陰平(\ )的編碼4組成“漢”字的編碼,則“漢”字的編碼為61634。
[0184]I1:詞組的編碼方法
[0185]詞組的編碼方法依照詞組的字?jǐn)?shù),分二字詞、三字詞、多于三字以上的多字詞進(jìn)行編碼。
[0186]1.二字詞的編碼方法
[0187]二字詞的編碼方法為:由每個漢字的聲母、韻母區(qū)號編碼,依次組成該兩字詞的編碼。
[0188]例如:“信息”的漢語拼音讀音為“xin xi”,“信”的聲母“X”區(qū)號編碼為7,韻母“in”區(qū)號編碼為9 ;“息”的聲母“X”區(qū)號編碼為7,韻母“i”區(qū)號編碼為2,則“信息”的編碼為7971。
[0189]i1.三字詞的編碼方法
[0190]三字詞的編碼方法為:由前兩個字的聲母區(qū)號編碼、最后一個字的聲母和韻母的區(qū)號編碼,依次組成該三字詞的編碼。
[0191]例如:“數(shù)字化”的拼音為“shu zi hua”,“數(shù)”字的聲母sh區(qū)號編碼為9,“字”的聲母z區(qū)號編碼為0,“化”的聲母h區(qū)號編碼為6,韻母U、a的區(qū)號編碼為3、1,則“數(shù)字化”的編碼為90631。
[0192]ii1.多字詞的編碼方法
[0193]多字詞的編碼方法為:由前三個字的聲母區(qū)號編碼、最后一個字的聲母區(qū)號編碼,依次組成該多字詞的編碼。
[0194]例如:“中華人民共和國”中的“中”的讀音為“zhong”,聲母zh的區(qū)號編碼為8 ;“華”的拼音為“hua”,聲母h的區(qū)號編碼為6 ;“人”的拼音讀音為“ren”,聲母r的區(qū)號編碼為9 國”的拼音讀音為“guo”,聲母g的區(qū)號編碼為5,則“中華人民共和國”的編碼為8695。
[0195]應(yīng)當(dāng)注意,此處的字母分區(qū)表以及其后的各分區(qū)表只是本發(fā)明的優(yōu)選排列。除此以外,其它類型的排列分區(qū),只要其能滿足由區(qū)號和位號唯一地確定一個字母,都是可行的。
[0196]②漢字日語讀音數(shù)字化運(yùn)算編碼漢字的方法
[0197]漢字日語讀音數(shù)字化運(yùn)算編碼漢字的方法為:依照漢字的日語讀音,使用0-9十個數(shù)字,采用分區(qū)按位運(yùn)算編碼日文假名的方法,編碼構(gòu)成漢字日語讀音的假名,把假名分布在用0-9十個數(shù)字編號的十個區(qū),排列在每個區(qū)里用0-9十個數(shù)字編號的位上,由假名的區(qū)號或者區(qū)位號作為該假名的編碼,再由假名或者假名的編碼組成漢字的編碼,按照組成漢字日語讀音的日文假名個數(shù),把日語讀音的漢字分為:不多于三個假名構(gòu)成讀音的漢字、多于三個假名構(gòu)成讀音的漢字進(jìn)行編碼。
[0198]A:采用分區(qū)按位運(yùn)算編碼日文假名的方法
[0199]采用分區(qū)按位運(yùn)算編碼日文假名的方法包括:分八區(qū)按位運(yùn)算編碼日文假名的方法,分十區(qū)按位運(yùn)算編碼日文假名的方法。
[0200]a.分八區(qū)按位運(yùn)算編碼日文假名的方法
[0201]分八區(qū)按位運(yùn)算 編碼日文假名的方法為:使用0-9十個數(shù)字中的任意八個數(shù)字,編號劃分八個區(qū),每個數(shù)字編號劃分一個區(qū),每個區(qū)編號劃分0-9十個位,把八十個日文假名分布在八個區(qū)的八十個位上,由假名的區(qū)號或者區(qū)位號作為該假名的編碼。其中:
[0202]分1-8按位運(yùn)算編碼的日文假名分別為:(如圖7所示)
【權(quán)利要求】
1.世界文字的編碼輸入方法,其用于對世界文字編碼并輸入計算機(jī)裝置中,所述計算機(jī)裝置包含數(shù)字鍵盤,所述方法包括: 對于世界文字中的每一種文字,將組成該種文字或能確定該種文字的若干基本部件,分配到數(shù)字鍵盤的相應(yīng)數(shù)字鍵上,每一基本部件的編碼由區(qū)碼和位碼唯一確定,區(qū)碼為部件所在鍵的數(shù)字,位碼為基本部件在所屬數(shù)字鍵中的位置編號; 選擇待輸入文字的種類; 對于待輸入種類文字的每一字,將其分解為所述若干部件的一個組合; 用該組合中的每個部件相對應(yīng)的區(qū)碼和位碼按順序排列作為對該文字的編碼;以及 輸入該字的編碼。
2.根據(jù)權(quán)利要求1所述的編碼輸入方法,其中 所述世界文字分為表意文字和表音文字;對于表音文字來說,所述部件是該表音文字的字母;對于表意文字來說,所述基本部件可以分別包括構(gòu)成所述表意文字字形的基本筆劃,構(gòu)成表意文字讀音的拼音字母,構(gòu)成表意文字音形的基本筆劃和拼音字母。
3.根據(jù)權(quán)利要求2所述的編碼輸入方法,其中 所述表音文字包括英、法、德、意大利、西班牙、俄、希臘、阿拉伯文字、日語、朝韓語,所述表意文字包括中文;對于中文來說,所述基本部件可以分別包括構(gòu)成漢字字形的基本筆劃,構(gòu)成漢字漢語讀音的拼音字母或聲母、韻母,構(gòu)成漢字音形的漢字基本筆劃和拼音字母或聲母、韻母;對于日語,所述基本部件可以分別包括日文中的漢字字形的基本筆劃,構(gòu)成日文文字的假名、以及構(gòu)成日文漢字的日語讀音的假名;對于朝韓語,所述基本部件分別包括構(gòu)成韓文中的漢字字形的基本筆劃,構(gòu)成韓文文字的朝韓語字母,以及漢字的朝韓語讀音的朝韓語字母。
4.根據(jù)權(quán)利要求3所述的編碼輸入方法,其中按漢字字形對漢字編碼時所述基本部件是漢字的基本筆劃,其編碼僅由其區(qū)碼確定,并且按如下方法確定基本筆劃及其區(qū)碼: ①把漢字的筆劃歸類為橫、豎、撇、點(diǎn)、折五種基本筆劃,相應(yīng)定義其代碼為1、2、3、4、5,以此形成一劃編碼; ②橫、豎、撇、點(diǎn)、折兩兩組合,每個組合各自的筆劃代碼數(shù)字相加,并進(jìn)行滿十減十運(yùn)算,以此形成二劃組合編碼; ③橫、豎、撇、點(diǎn)、折任意三劃組合,各自的組合筆劃代碼數(shù)字相加,進(jìn)行滿十減十運(yùn)算,以此形成三劃組合編碼; ④橫、豎、撇、點(diǎn)、折多于三劃的組合,各自的組合筆劃代碼數(shù)字相加,進(jìn)行滿十減十運(yùn)算,以此形成多于三劃組合編碼。
5.根據(jù)權(quán)利要求4所述的編碼輸入方法,其中所說的基本部件及其區(qū)碼為: 一劃編碼包括橫、豎、撇、點(diǎn)、折,相應(yīng)的代碼為1、2、3、4、5 ; 二劃組合編碼包括橫橫組合、橫豎組合、橫撇組合、橫點(diǎn)組合、橫折組合;豎豎組合、豎撇組合、豎點(diǎn)組合、豎折組合;撇撇組合、撇點(diǎn)組合、撇折組合;點(diǎn)點(diǎn)組合、點(diǎn)折組合;折折組合;其相應(yīng)的編碼分別為:2、3、4、5、6 ;4、5、6、7 ;6、7、8 ;8、9 ;0 ; 三劃組合編碼包括:寸、弋、,,其編碼為OJ、門、己、弓、子、鄉(xiāng)、馬,其編碼為I ;夕、欠、a、小,其編碼為2 ; t、乙,其編碼為3 ;工、土、.、幺,其編碼4 ;廿、〈〈〈,其編碼為5 ;升,其編碼為6 ;子^、3,其編碼為7 ;大、□、牙、廣,其編碼為8 ;尤、小、巾、山、多、個、'人尸、女,其編碼為9 ; ④橫、豎、撇、點(diǎn)、折多于三劃的組合:木、月、韋、火、水、日,其相應(yīng)的編碼分別為0、0、.2、4、7 λ 9 ο
6.根據(jù)權(quán)利要求4所述的編碼輸入方法,其中 依據(jù)所定義的基本筆劃,筆劃組合,及其區(qū)碼,按如下步驟對漢字編碼: 根據(jù)漢字的部首劃分,把漢字劃分為部首和除部首以外組成漢字的余件,用0-9十個數(shù)字分別編碼漢字的部首和余件,依照漢字的書寫筆順,按優(yōu)先取多于三劃組合編碼,后取三劃組合編碼,再取二劃組合編碼,最后取一劃編碼的取碼順序,部首取碼不超兩碼,余件取碼不超三碼,把部首和余件的編碼組合成該漢字的編碼,每個漢字最多取四碼,最少取一碼。
7.根據(jù)權(quán)利要求6所述的編碼輸入方法,其中對漢字編碼的步驟包括: 確定單個漢字是獨(dú)體字還是合體字; 對于獨(dú)體字,按整字編碼; 對于合體字,則分部首和余件進(jìn)行編碼。
8.根據(jù)權(quán)利要求7所述的編碼輸入方法,其中對獨(dú)體字編碼的步驟包括: 確定獨(dú)體字是否超過四碼; 對超過四碼獨(dú)體漢字,取獨(dú)體字的前三碼和尾碼,依次組成該字的編碼; 對不超過四碼的獨(dú)體字,取完獨(dú)體字的全部編碼,依次組成該字的編碼。
9.根據(jù)權(quán)利要求7所述的編碼輸入方法,其中對合體字分部首和余件進(jìn)行編碼的步驟包括: 確定合體字是否超過四碼的合體字; 對于不超過四碼合體字,部首取一碼,余件取一至三碼,依次組成該字的編碼; 對于超過四碼合體字,部首取一碼,余件取前兩碼和尾碼,依次組成該字的編碼。
10.根據(jù)權(quán)利要求7所述的編碼輸入方法,其中對合體字分部首和余件進(jìn)行編碼的步驟包括: 確定合體字是否超過四碼的合體字; 對于不超過四碼合體字,部首取兩碼,余件取一至兩碼,依次組成該字碼。 對于超過四碼合體字,部首取首碼和尾碼,余件取首碼和尾碼,依次組成該字的編碼。
【文檔編號】G06F17/22GK104007834SQ201310530242
【公開日】2014年8月27日 申請日期:2001年5月8日 優(yōu)先權(quán)日:2000年5月3日
【發(fā)明者】蘇榮斌, 梁河 申請人:蘇榮斌