亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種新型字典及與之匹配的查字打字同碼方案的制作方法

文檔序號(hào):2612132閱讀:456來源:國(guó)知局
專利名稱:一種新型字典及與之匹配的查字打字同碼方案的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種新型字典(包括紙質(zhì)字典和電子字典)及與之匹配的查 字打字同碼方案,屬字典編撰技術(shù)。二、 背景技術(shù)目前字典編撰方面存在如下缺陷1、字典內(nèi)容上單一,基本上全是字詞 的釋義,雖有附錄,也不過是諸如"元素周期表"、"漢語拼音方案"、"中國(guó) 歷代紀(jì)元表"、"常用標(biāo)點(diǎn)符號(hào)用法簡(jiǎn)表"、"計(jì)量單位表" 一類的內(nèi)容,字典 的內(nèi)容不能反映漢字系統(tǒng)的概貌,大量的關(guān)于語言文字的基礎(chǔ)知識(shí)在字典中 査不到,需要在其他工具書中查找,也不便于利用字典自學(xué)漢字。2、査字速 度慢。筆者在査字時(shí)深感目前通用的各種查字法既有優(yōu)點(diǎn)又有缺點(diǎn)。如,音 序查字法的優(yōu)點(diǎn)是查認(rèn)識(shí)的字可直接翻頁,查字速度比部首查字法快;缺點(diǎn) 是不知聲調(diào)的字難査,不認(rèn)識(shí)的字沒法查,把多音字分列兩處不方便查閱。 部首査字法的優(yōu)點(diǎn)是能査不認(rèn)識(shí)的字,缺點(diǎn)是速度慢且有時(shí)數(shù)不準(zhǔn)筆畫。3、 紙質(zhì)字典成稿付印或電子字典完稿后,內(nèi)容就無法更改,不能滿足使用者的 特殊需求。另外,從目前對(duì)電腦及手機(jī)輸入漢漢字錄入研究的角度看,使用電腦及 手機(jī)過程中,輸入漢字和電子字典査字未融合在一起,筆者認(rèn)為,紙質(zhì)字典、 電子字典、電腦及手機(jī)打字三者本來相通,完全可以用同一種編碼方案,讓 打字程序既具有輸入漢字功能又具有查字學(xué)字功能,瀏覽網(wǎng)頁和打字時(shí)遇到 生字新詞,用打字程序就可查字,不必再另啟用查字程序。三、 發(fā)明內(nèi)容基于上述認(rèn)識(shí),以及為了改進(jìn)已有技術(shù)存在的缺陷,本發(fā)明提供了一種 新型字典(包括紙質(zhì)字典和電子字典)及與之匹配的査字打字同碼方案,設(shè) 計(jì)一種部首音形結(jié)合碼査字打字法,其基本思路是(1) 將漢字査字法與電腦及手機(jī)漢字輸入用同一種編碼方案,會(huì)査字就 會(huì)打字,會(huì)打字就會(huì)査字,消除目前各種純音碼漢字輸入方案不適合不懂普 通話的人使用和不能錄入不認(rèn)識(shí)字的缺點(diǎn);(2) 將漢字輸入法由單一的打字功能變?yōu)榧饶艽蜃钟挚蓪W(xué)字的雙重功 能,打字的同時(shí)可以學(xué)字。(3) 字典內(nèi)容可根據(jù)使用者的特殊需求進(jìn)行增刪。(4) 用紙質(zhì)字典查字,認(rèn)識(shí)的字和不認(rèn)識(shí)的字都可直接翻頁查字,提高 査字速度。具體技術(shù)方案表述如下 1、 一種新型字典,特點(diǎn)是(1) 增收GB2312-80字符集中前15區(qū)的部分常用符號(hào)(包括標(biāo)點(diǎn)符號(hào));(2) 按照査字打字同碼方案中的編碼規(guī)則對(duì)字、符號(hào)進(jìn)行編碼;(3) 字典所收字在檢字表和正文的排序以上述(2)編碼規(guī)則中的部首 讀音首字母的音序?yàn)樾?;?duì)字?jǐn)?shù)不超過10個(gè)的二級(jí)重碼字組中的重碼字按使用頻率排序,高頻字(4) 對(duì)字?jǐn)?shù)超過10個(gè)的二級(jí)重碼字組中的重碼字先按其所屬的三級(jí)重 碼字組順序排序,對(duì)三級(jí)重碼字組再按按使用頻率排序,高頻字在前;(5) 紙質(zhì)字典的翻口處設(shè)計(jì)一級(jí)重碼字組標(biāo)記及頁眉處設(shè)標(biāo)記;(6) 紙質(zhì)字典設(shè)篇章頁,把檢字表按各一級(jí)重碼字組分列在各個(gè)篇章頁 上,檢字表中一個(gè)字典正文頁碼對(duì)應(yīng)該正文頁碼所包括的所有漢字;(7) 紙質(zhì)字典各相鄰一級(jí)重碼字組頁幅寬度不同;(8) 設(shè)置各種分類字表;(9) 設(shè)置一個(gè)作為整個(gè)漢字系統(tǒng)的獨(dú)立的子系統(tǒng)多字詞語庫(kù),其中收錄 三字以上的詞語、成語,歇后語、格言、名言警句,同時(shí)字典正文不再收入 三字以上詞語條目。(10) 字典內(nèi)容可根據(jù)使用者的特殊需求進(jìn)行增刪。2、 為了增加重碼字組的數(shù)量、減少各重碼字組的字?jǐn)?shù),紙質(zhì)字典設(shè)有區(qū) 別碼(1)在第一碼相同的幾個(gè)部首中按部首筆畫設(shè)部首字形區(qū)別碼,按首筆及次筆編區(qū)別碼,其編碼及排序規(guī)則是(1.1) 把部首的第一、二筆筆畫劃分為"一、I 、 j 、、、""五種筆 畫,且分別以1、 2、 3、 4、 5為代碼編碼,只有一筆的第二碼為"0"。再按 其編碼數(shù)字大小排序,數(shù)字小的在前;(1.2) 第一二筆均相同的加一個(gè)第三碼,或根據(jù)部首字筆畫數(shù)排序,筆 畫數(shù)小的在前,或根據(jù)第三筆筆畫"一、I 、 j 、、、""排序,第三碼按 部首排序依次編碼為6、 7、 8、 9、 0;在檢字表和正文中,把第一碼相同的字按部首分組,各組字的排列順序 按部首區(qū)別碼數(shù)字大小排序。(2 )在同部首且第二碼相同的重碼字中設(shè)第二碼字形區(qū)別碼第二碼是部首字的一類不加區(qū)別碼;第二碼是筆畫碼的一類,加區(qū)別碼 為"/";在檢字表和正文中第二碼不加第二碼區(qū)別碼的字在前,第二碼加區(qū)別碼 的字在后。3、 在上述的一種新型字典中,還可設(shè)立個(gè)性化的分類字表,紙質(zhì)字典的 附錄部分采用活頁式裝訂。4、 在上述的一種新型字典中,還可附設(shè)同音字(不計(jì)聲調(diào))檢字法,于 按使用頻率排序(高頻字在前)的同音字檢字表中,在每一個(gè)同音字的后面 加上該字在字典正文的頁碼。5、 一種與上述新型字典匹配的査字打字同碼方案,特點(diǎn)是編碼規(guī)則如下(1)按成字部首讀音首字母及非成字部首首筆畫編碼(1.1)部首設(shè)置(合計(jì)207個(gè))及部首代碼第1組計(jì)21個(gè)(部首代碼a):山鄉(xiāng)一僅用于第一碼(計(jì)2個(gè));(部首代 碼b):髟比卜貝白鼻八匕廣(計(jì)9個(gè));(部首代碼c):寸廠蟲辰車臣赤齒長(zhǎng) 4 (計(jì)10個(gè))(另有"廿"-僅限于第二碼用)。第2組(計(jì)25個(gè)),(部首代碼d)成字部首豆大歹斗刀(計(jì)5個(gè)),不成字部首、7 "曾"的上面兩點(diǎn)"、、一iL才、卑(計(jì)8個(gè))另有"工;a"僅限于第二碼;(部首代碼e)竹(包括竹字頭)一僅用于第一碼(限于 筆順在前)(計(jì)1個(gè));(部首代碼f)成字部首非缶父風(fēng)方(計(jì)5個(gè)), 不成字部首"3|S卩i_〈〈〈(計(jì)6個(gè))。其中"點(diǎn)"包含"捺","折"包含除"豎鉤"以外的單筆劃"折"筆;第3組(計(jì)26個(gè)),(部首代碼g):干工甘革鬲鼓戈骨鬼瓜谷高廣弓艮(計(jì) 15個(gè));(部首代碼h)成字部首黃黑禾火戶(計(jì)5個(gè)),不成字部首 一升匚(計(jì)3個(gè));(部首代碼i) ^言(i ) 一僅用于第一碼(計(jì)3個(gè))。苴中"橫"包含"提".;4組(計(jì)10個(gè)),(部首代碼j):巾見臼斤金(,)幾包括風(fēng)字框角己(計(jì)8個(gè));(部首代碼k): 口 (計(jì)l個(gè))(部首代碼O):十一僅用于第一 碼(計(jì)l個(gè))。第5組(計(jì)28個(gè)),(部首代碼l)成字部首耒老龍鹵里立鹿隸力(計(jì)9個(gè));不成字部首I產(chǎn)lj門口 "肖"字上一半(計(jì)6個(gè));(部首代碼M):11麥13面256目257皿31毛41麻42門43米54矛556馬557母558糸(計(jì) 12個(gè))(另有"木"-僅用于第二碼);(部首代碼u)木一僅用于第一碼(計(jì) l個(gè))。其中"豎"包含"豎鉤";第6組(計(jì)18個(gè))(部首代碼n):鳥牛女(計(jì)3個(gè))(部首代碼p):成 字部首爿皮片支疋(計(jì)5個(gè)),不成字部首j夂多"番"的上一半,勺"危" 的上一半,3夂1:、(計(jì)9個(gè));(部首代碼)V人(4 ) 一僅用于第一碼(計(jì) l個(gè))。第7組(計(jì)12個(gè))(部首代碼q):青其犬氣欠(計(jì)5個(gè))另外一些常用 符號(hào)(包括標(biāo)點(diǎn)符號(hào))的首碼代碼亦為"q";;(部首代碼r): 二耳而兒日["曰" 并入"日"]肉(計(jì)6個(gè))[另有"人G )"-僅用于第二碼](部首代碼",") (計(jì)l個(gè))。第8組(計(jì)23個(gè))(部首代碼)S:示十士石豕四手生矢舌身鼠食殳氏色 首尸巳厶(計(jì)20個(gè)),(另有"纟矛?水山"-僅用于第二碼);(部首代碼)t: 土田(計(jì)2個(gè));(部首代碼"。")凈(計(jì)l個(gè))一僅用于第一碼。第9組(計(jì)16個(gè))(部首代碼)W: 6王無韋尤瓦文毋(計(jì)7個(gè));(部首 代碼X):西小香血夕辛穴心(計(jì)8個(gè)),(另有"十"-僅用于第二碼));(部 首代碼"/"): *_僅用于第一碼((計(jì)l個(gè))。第0組(計(jì)28個(gè))(部首代碼)y:雨尤頁犬牙業(yè)用衣音羊(包括"差" 的上半,"羔"的上半)聿又羽幺(計(jì)14個(gè)),[另有"月魚言(i ")-僅用 于第二碼);(部首代碼)z:支走至止足(包括足字旁)自隹爪(包括w)舟 豸子(計(jì)11個(gè)),(另有"竹字頭"-限于第二碼);(部首代碼";)"酉月 魚一僅用于第一碼(計(jì)3個(gè))。(其中",""。""/"";" 4個(gè)標(biāo)點(diǎn)符號(hào)和a、 e 、 u、 i、 o、 v 6個(gè)字母一 鍵位兩用, 一是作10個(gè)特殊部首字首碼,二是作高頻字的尾碼。 (1.2) l個(gè)常用符號(hào)(包括標(biāo)點(diǎn)符號(hào))首碼"q";(2) 每字最多三碼,第一、二碼,成字部首取讀音首字母碼,不成字構(gòu) 件取首筆筆畫碼,第三碼均取筆畫碼;第三碼或?yàn)轱@性碼或?yàn)殡[性碼,為顯 性碼時(shí),主要用于手機(jī)及其他數(shù)字鍵盤的漢字錄入;為隱性碼時(shí),用于査字 和電腦的漢字錄入;(3) 編碼時(shí)首先把漢字分為獨(dú)體字和合體字兩類,再按下列規(guī)則編碼(3.1) 獨(dú)體字取碼規(guī)則(3.1.1) 成字部首獨(dú)體字 第一碼為成字部首讀音首字母,第二碼仍為成字部首讀音首字母;第三碼成字部首首筆筆畫,第三碼按其首筆畫"一""I"" j ""、" 分別對(duì)應(yīng)編碼為"1""2""3""4"" 5")。(3.1.2) 非成字部首獨(dú)體字第一碼首筆筆畫,第二碼次筆筆畫,第三碼為第三筆筆畫,第三碼按其 首筆畫"一""I" "j" "、" 分別對(duì)應(yīng)編碼為"6" "7" "8""9"" 0"。(3.2) 合體字編碼規(guī)則(3.2.1)兩半中均為成字部首或兩筆以上非成字部首各自獨(dú)占一半的 一第一碼為獨(dú)占一半的前半成字部首讀音首字母或兩筆以上非成字部首首 筆畫;一第二碼為獨(dú)占一半的后半成字部首讀音首字母或兩筆以上非成字部首首 筆畫;第三碼根據(jù)第二碼取碼。第二碼是成字部首的,取成字部首首筆筆畫, 按其成字部首的首筆筆畫"一""I ""〗""、""""分別對(duì)應(yīng)編 碼為"1""2""3""4"" 5";第二碼是兩筆以上非成字部首首筆畫 的,筆畫取該半次筆筆畫,按其筆畫"一""I ""〗""、"分 別對(duì)應(yīng)編碼為"6""7""8""9"或"0"。(3. 2. 2)兩半中有一個(gè)成字部首或兩筆以上非成字部首獨(dú)占一半的第一碼為獨(dú)占一半的前半(或后半)成字部首讀音首字母(或兩筆以上 非成字部首首筆畫),第二碼(a)另一半只有一筆的,取該筆筆畫碼,(b)另一半中有成字 部首構(gòu)件位于該半前一部分或后一部分的,取成字部首讀音首字母碼,否則 則取該半首筆碼(注意成字部首構(gòu)件位于該半中間的,亦取該半首筆碼)。第三碼根據(jù)第二碼取碼,第二碼是成字部首的,取其第二碼成字部首的首筆筆畫,按其成字部首的首筆筆畫"一""I" " j ""、"分別對(duì)應(yīng)編碼為"6" "7" "8" "9" " 0"。第二碼是取筆畫碼的,取 余下部分首筆筆畫,按其筆畫"一""I " " j " " 、 " 分別對(duì)應(yīng) 編碼為"6""7" "8""9"" 0"。(3.2.3) 兩半都不是成字部首或兩筆以上非成字部首的各自獨(dú)占一半 的,按筆順取第一二碼;第一碼取前半的首筆畫,第二碼取后半的首筆畫, 第三碼取后半的次筆筆畫(后半只有一筆的,第三碼與第二碼同),按其筆畫"一""i " " j ""、"分別對(duì)應(yīng)編碼為"6" "7" "8" "9""0"。(3.2.4) 特殊部首字所屬字的編碼規(guī)則特殊部首字所屬字的定義按編碼規(guī)則其首碼其為特殊部首的, 特殊部首字所屬字的編碼規(guī)則首碼為特殊部首碼;第二碼據(jù)去掉部首 后余下字形依一般字編碼規(guī)則取碼;第三碼取碼規(guī)則l.第二碼是成字部首的,取其第二碼成字部首的首筆 筆畫。按其成字部首的首筆筆畫"一""I "" J ""、""""分別 對(duì)應(yīng)編碼為"1""2" "3""4""5"。
2.第二碼是取筆畫碼的,取 余下部分首筆筆畫。按其筆畫"一""I ""j ""、"編碼為 "1" "2""3" "4" " 5"; 3.后半只有一筆的,按其第二碼筆畫"一" "I" ")" "、" 分別對(duì)應(yīng)編碼為"r, "2""3" "4" "5"。(3. 3)高頻字編碼(包括",。/;"四個(gè)標(biāo)點(diǎn)符號(hào))規(guī)則 分別將30個(gè)一級(jí)重碼字組中使用頻率最高的前11個(gè)高頻字的尾碼分別編為空格鍵、a、 e、 u、 i、 o、 v, 。 /;為了有規(guī)律的記憶或?qū)ふ腋鱾€(gè)高頻字所對(duì)應(yīng)的鍵位,特規(guī)定每個(gè)一級(jí)重碼字組中使用頻率最高的最高的3個(gè)字分別對(duì)應(yīng)空格、a和";"鍵,其他字按第一碼的首筆畫"一 I j 、""的順序排列,第一碼首筆畫相同的按使用頻率高低的順序排列。特別規(guī)定"鄉(xiāng)山竹言(包括"i ")工^十木人(包括'M ")水(包括 ")矛^月魚酉"15個(gè)部首各自所屬的8個(gè)高頻字按去掉部首后剩余部分的首筆畫"一 I j 、""的順序排列,其中屬成字部首的高頻字,即去掉部首無剩余筆畫的,排在有剩余筆畫高頻字的前面;",。A " 4個(gè)最常用標(biāo)點(diǎn)的編碼分別為",,"、"。。""〃"";;";(3.4)多字詞語編碼規(guī)則三字以上常用詞語按一字一碼編碼,只取詞語每個(gè)字的首碼。6、 上述的査字打字同碼方案中,在(3.1.2)非成字部首獨(dú)體字編碼規(guī) 則中,非成字部首編碼規(guī)則為非成字部首的第一、二、三碼同為首筆畫, 第三碼按其首筆畫編碼為"一""I"" j ""、"分別對(duì)應(yīng) 編碼為"1""2" "3""4"" 5")。7、 上述的查字打字同碼方案中,在(3.2)合體字編碼規(guī)則中,特殊編碼規(guī)則規(guī)定如下(1) 上中下結(jié)構(gòu)的字按不同分法可分為兩個(gè)不同成字部首的,成字部首 就大不就小;(2) 上下或上中下結(jié)構(gòu)的字僅從字形上看,既有相接處又有相離處的, 一般從相離處劃分為兩部分,若無相離處,則可從相接處分為兩部分;(3) 上中下結(jié)構(gòu)的字其首碼只能從上下取碼,不能從中間取首碼,取第 一碼后,余下部分從形體上看仍為上中下結(jié)構(gòu)的,第二碼亦只能從上部或下 部取碼;若其首碼取的是上部(或下部)的一個(gè)獨(dú)占一半的成字部首或兩筆以上 不成字部首,第二碼仍同其他合體字一樣按筆順優(yōu)先余下部分的上部或下部 取成字部首碼,余下部分無成字部首的取余下部分的首筆筆畫碼;若其上部和下部均無獨(dú)占一半的成字部首或兩筆以上不成字部首,第一、 二、三碼則分別取第一、二、三筆畫;(4) 兩半都無成字部首、也無明顯界限的上下結(jié)構(gòu)的字,按獨(dú)體字編碼;(5) 左中右結(jié)構(gòu)的字其首碼只能從左右取碼,左右均為成字部首或兩筆 以上非成字部首的按筆順從左部取首碼碼,尾碼根據(jù)余下部分仍按一般規(guī)則 取碼;(6) 難以確定編碼的字可有兩種編碼的容錯(cuò)碼。 8.査字方法本發(fā)明所創(chuàng)設(shè)的"部首音形結(jié)合碼査字打字同碼方案"要査一個(gè)不認(rèn)識(shí) 字的理論上的步驟有如下3個(gè)1.為要查的字a確定兩個(gè)部首并根據(jù)這兩個(gè) 部首的讀音首字母為字a確定一個(gè)由漢語拼音字母或標(biāo)點(diǎn)組成的兩碼編碼; 2.根據(jù)這個(gè)編碼在檢字表中査到字a在字典正文的頁碼;3.從字a在字典正 文的頁碼找到字a并閱讀其釋義。實(shí)際查字過程中, 一般情況下應(yīng)該省略其中的第二個(gè)步驟。按字a的編 碼根據(jù)字典翻口處及字典正文頁眉處的標(biāo)記直接翻到字a所在的頁碼或字a 所在頁碼附近再翻頁找到字a并閱讀其釋義。這就如同用現(xiàn)在的字典要查知 道讀音的字a,按字a的讀音可直接翻到字a所在的頁碼或字a所在頁碼附近 再翻頁找到字a并閱讀其釋義。且一般來說比現(xiàn)在要查認(rèn)識(shí)的字a還要快捷。 因?yàn)橛矛F(xiàn)在的字典要査認(rèn)識(shí)的字,對(duì)大多數(shù)人來說,是把"知道讀音"定義 為"知道聲母和韻母",并不包括聲調(diào)。而且對(duì)全部所謂"知道讀音的字" 中的大部分字的聲調(diào)他們也不能確定,只能確定一小部分字的聲調(diào)。由于不 知道字的聲調(diào),對(duì)同音字多的音節(jié),往往要翻多頁才能找到要查的字,有時(shí) 甚至可能要把該音節(jié)的同音字從頭找到尾才能找到。而用本發(fā)明方案查不認(rèn) 識(shí)的字,雖然也有同碼字,但同碼字?jǐn)?shù)量少,且按使字頻排序,很容易找到。本發(fā)明的査字打字同碼方案的編碼規(guī)則簡(jiǎn)單易學(xué),把34個(gè)不成字部首歸 并為5種基本筆畫,把173個(gè)成字部首按讀音首字母歸并為20種讀音首字母, 部首本身的歸類及與字的讀音音序的對(duì)應(yīng)關(guān)系都極有規(guī)律,在很短時(shí)間內(nèi)就 可記牢,遇到不認(rèn)識(shí)的字也會(huì)編碼。另外,在字典的翻口處設(shè)計(jì)一級(jí)重碼字 組標(biāo)記、頁眉處設(shè)標(biāo)記、設(shè)立篇章頁、各相鄰一級(jí)重碼字組頁幅寬度加以區(qū)別等,通過以上幾項(xiàng)改進(jìn)措施減少了査字步驟,借以實(shí)現(xiàn)査閱字典所收字無 論認(rèn)識(shí)與否都可直接翻頁快速查字,且極便于己會(huì)用傳統(tǒng)的部首查字法査字 的人改用筆者的査字法。而且利用本方案可以把查字與打字用同一種編碼方 式,由于要學(xué)打字的人在學(xué)打字以前就已熟練掌握編碼,可以使其在初學(xué)打 字時(shí),比新學(xué)任何一種編碼都能節(jié)省很多的熟練掌握編碼的時(shí)間。四具體實(shí)施方式
下面結(jié)合實(shí)施例對(duì)本發(fā)明做具體的解釋說明。(一) 一種新型字典,在內(nèi)容及編撰上進(jìn)行如下創(chuàng)新 內(nèi)容上加以增擴(kuò)-1、增收gb2312-80字符集中前15區(qū)的一些常用符號(hào)(包括標(biāo)點(diǎn)符號(hào));2 、以附錄的形式增加漢字學(xué)習(xí)方法和各種具體識(shí)字方法介紹 總原則是"全方位多形式識(shí)字",具體識(shí)字形式很多,如集中識(shí)字、分 散識(shí)字、拆字識(shí)字……;3、可增加如下各種分類字詞表(1) 會(huì)意字集錄;(會(huì)意字的認(rèn)定:從流俗字源學(xué)的角度認(rèn)定,只要能 自圓其說,利于漢字識(shí)記即可,不必非要從科學(xué)字源學(xué)的角度去認(rèn)定。如"孫" 字,從字形上可以分析為"比兒子小一輩的是孫子",既可認(rèn)定為會(huì)意字,而 不必考慮當(dāng)初是否是按"比兒子小一輩的是孫子"的字理造該字。(2) 形聲字集錄(形聲字形旁表意的標(biāo)準(zhǔn)是形旁與字的主要義和常用義 相關(guān), 一般不考慮與主要義和常用義己不搭邊的造字之初的本義;形聲字聲 旁表音的標(biāo)準(zhǔn)是聲母韻母均相同、不考慮聲調(diào)。把一些形旁表意、聲旁表音 又表意的形聲字另劃歸為形聲兼會(huì)意字);(3) 可讀半邊字集錄;(4) 記號(hào)字集錄;(5) 半記號(hào)字集錄(即傳統(tǒng)上劃歸為"形聲字"但實(shí)際上只有形旁表意、 聲旁己不表音的一部分字);(6) 易誤讀字集錄;(7) 易寫錯(cuò)筆順字集錄;(8) 易寫錯(cuò)字形字集錄;(9) 形聲兼會(huì)意字集錄(把一些形旁表意、聲旁表音又表意的形聲字劃 歸于此);(10) 形近字集錄;(11) 多音字集錄;(12) 常用同義詞、反義詞集錄;(13) 自用生僻字,錄;(14) XX年度流行詞語;(以上各種分類字表不求全,但除了 "自用生僻字集錄"和"XX年度 流行詞語"夕卜,不可空項(xiàng),可隨時(shí)增加);以上14類字詞表的內(nèi)部排序原則上以部首音序?yàn)樾颉?、 可以設(shè)置部分非成字部首的釋義,這樣有助于從造字法的角度識(shí)記其他漢字;5、 增設(shè)一個(gè)作為整個(gè)漢字系統(tǒng)的獨(dú)立的子系統(tǒng)多字詞語庫(kù),其中收錄三 字以上的詞語、成語,歇后語、格言、名言警句(多字詞語庫(kù)亦不求全)。同 時(shí)字典正文不再收入三字以上詞語條目。多字詞語庫(kù)所收三字以上詞語的排序一律以部首音序?yàn)樾颉?利用以上增擴(kuò)的內(nèi)容,不但可以進(jìn)一步增強(qiáng)字典的識(shí)字和鞏固識(shí)字功能,讓使用者系統(tǒng)了解整個(gè)漢字系統(tǒng),更重要的是有助于弘揚(yáng)中華傳統(tǒng)文化的精華。6、 使用者可根據(jù)自己的的特殊需求對(duì)字典內(nèi)容尤其是及時(shí)對(duì)其中的各種 分類字表和多字詞語庫(kù)進(jìn)行增刪。(二)査閱方法上和外觀設(shè)計(jì)上作如下改進(jìn)1、 字典所收字在檢字表和正文的排序與匹配的查字打字同碼方案中的部 首讀音首字母的音序相同,(1) 對(duì)字?jǐn)?shù)不超過10個(gè)的二級(jí)重碼字組中的重碼字按使用頻率排序(高 頻字在前)(2) 對(duì)字?jǐn)?shù)超過10個(gè)的二級(jí)重碼字組中的重碼字先按其所屬的三級(jí)重 碼字組順序排序,對(duì)三級(jí)重碼字組再按按使用頻率排序(高頻字在前)。2、 在紙質(zhì)字典的翻口處設(shè)計(jì)一級(jí)重碼字組標(biāo)記及每頁的頁眉處設(shè)二級(jí)重 碼字組標(biāo)記;3、 設(shè)篇章頁(即中扉頁)且把檢字表按各一級(jí)重碼字組分列在篇章頁, 檢字表中不是一個(gè)漢字對(duì)應(yīng)一個(gè)字典正文頁碼,而是一個(gè)字典正文頁碼對(duì)應(yīng) 該正文頁碼所包括的一個(gè)或多個(gè)漢字;4、 各相鄰一級(jí)重碼字組頁幅寬度稍有區(qū)別(相差1.5-2.5毫米即可)。 通過以上幾項(xiàng)改進(jìn)措施減少查字步驟,借以實(shí)現(xiàn)查閱紙質(zhì)字典所收字無論認(rèn)識(shí)與否都可直接翻頁快速查字;且極便于已會(huì)用傳統(tǒng)的部首查字法査字 的人改用筆者的査字法。5、 紙質(zhì)字典持有者還可建立個(gè)性化的分類字表,能及時(shí)在附錄的分類字 表中增加內(nèi)容,紙質(zhì)字典附錄部分可采用活頁式裝訂。6、 考慮到現(xiàn)實(shí)中,小學(xué)中高年級(jí)學(xué)生因言語學(xué)習(xí)與文字學(xué)習(xí)不同步,有 一部分詞語會(huì)說不會(huì)寫,往往需要在同音字中選擇所要用的字。針對(duì)這一需 要,在字典中可附設(shè)一個(gè)按使用頻率排序的同音字(不計(jì)聲調(diào))表,并在每 一個(gè)同音字的后面加上該字在字典正文的頁碼。同音字表的作用有二 一是 反映漢字體系的同音字狀況,二是作為一種輔助的同音字查字法的檢字表。在筆者看來,同音字查字法利用同音字檢字表査字的速度對(duì)于不能準(zhǔn)確 掌握大部分漢字聲調(diào)的人來說,據(jù)經(jīng)驗(yàn)估計(jì)比目前在同音字按聲調(diào)排序的字 典直接翻頁査字應(yīng)該基本相同。(三)本發(fā)明設(shè)有與之匹配的査字打字同碼方案,其具體編碼規(guī)則如下:編碼范圍-以GB2312-80字符集的6763字為準(zhǔn)(或字典以6763字為準(zhǔn),單字詞庫(kù) 以一級(jí)常用字3755字為準(zhǔn))。另外把標(biāo)點(diǎn)符號(hào)亦納入漢字系統(tǒng),將其作為高頻 字來編碼。把區(qū)位碼01-15區(qū)(即《GB2312字符集》中01-15區(qū)) 一些較常 使用的其他符號(hào)如"(-)(1) ^tld^du logs『『『』』』"也納入漢字系統(tǒng),將其 作為一般字來編碼。編碼規(guī)則l.部首設(shè)置以原中國(guó)文字改革委員會(huì)和國(guó)家出版局1983年頒布的的《漢字統(tǒng)一部首 表(草案)》所推薦使用的201部首為基礎(chǔ),適當(dāng)刪去幾個(gè)按漢字書寫筆順在 后且所數(shù)字很少的幾個(gè)不成字部首(部首成字與否以屬于一般中小型字典所 收有讀音的字在為準(zhǔn),下同),如,取消或歸并了"倉(cāng)"字下半、中""U""出" 字上半,另外又把幾個(gè)部首的變形也算作獨(dú)立部首,如,把小和"肖"字上 一半分為兩個(gè)部首。共設(shè)部首207個(gè)(從長(zhǎng)遠(yuǎn)考慮還可增加"古甫出交婁莫 單同尚千肖屯占章者五旦丁僉全去宛壬乍各夫",當(dāng)然這需要經(jīng)過論證)。其 中部首設(shè)置(合計(jì)207個(gè))及部首代碼第1組21個(gè)(部首代碼a):山纟一僅用于第一碼(計(jì)2個(gè));(部首代碼 b):髟比卜貝白鼻八匕廣(計(jì)9個(gè));(部首代碼c):寸廠蟲辰車臣赤齒長(zhǎng)^ (計(jì)IO個(gè))(另有"廿"-僅限于第二碼用)。第2組(計(jì)25個(gè)),(部首代碼d)成字部首豆大歹斗刀(計(jì)5個(gè)),不成字部首W "曾"的上面兩點(diǎn)"、、^ (計(jì)8個(gè))另有"二;僅限于第二碼;(部首代碼e)竹(包括竹字頭)一僅用于第一碼(限于 筆順在前)(計(jì)1個(gè));(部首代碼f)成字部首非缶父風(fēng)方(計(jì)5個(gè)), 不成字部首"3P P i_〈〈〈(計(jì)6個(gè))。其中"點(diǎn)"包含"捺","折"包含除"豎鉤"以外的單筆劃"折"筆; 第3組(計(jì)26個(gè)),(部首代碼g):干工甘革鬲鼓戈骨鬼瓜谷高廣弓艮(計(jì)15個(gè));(部首代碼h)成字部首黃黑禾火戶(計(jì)5個(gè)), 不成字部首 一升匚(計(jì)3個(gè));(部首代碼i) "言(i )—僅用于第一碼(計(jì)3個(gè))。其中"橫"包含"提";第4組(計(jì)10個(gè)),(部首代碼j):巾見臼斤金(,)幾包括風(fēng)字框角己(計(jì)8個(gè));(部首代碼k): 口 (計(jì)l個(gè))(部首代碼O): t —僅用于第一 碼(計(jì)l個(gè))。第5組(計(jì)28個(gè)),(部首代碼l)成字部首耒老龍鹵里立鹿隸力(計(jì) 9個(gè));不成字部首I產(chǎn)lj門口 "肖"字上一半(計(jì)6個(gè));(部首代碼M):11麥13面256目257皿31毛41麻42門43米54矛556馬557母558糸(計(jì) 12個(gè))(另有"木"-僅用于第二碼);(部首代碼u)木一僅用于第一碼(計(jì) l個(gè))。其中"豎"包含"豎鉤";第6組(計(jì)18個(gè))(部首代碼n):鳥牛女(計(jì)3個(gè))(部首代碼p):成字部首爿皮片支疋(計(jì)5個(gè)),不成字部首j夂鄉(xiāng)"番"的上一半,勺"危" 的上一半,3夂t、(計(jì)9個(gè));(部首代碼)V人(4 ) 一僅用于第一碼(計(jì) l個(gè))。第7組(計(jì)12個(gè))(部首代碼q):青其犬氣欠(計(jì)5個(gè))另外一些常用 符號(hào)(包括標(biāo)點(diǎn)符號(hào))的首碼代碼亦為"q";;(部首代碼r): 二耳而兒日["曰" 并入"日"]肉(計(jì)6個(gè))[另有"人G )"-僅用于第二碼](部首代碼",")- (計(jì)l個(gè))。第8組(計(jì)23個(gè))(部首代碼)S:示十士石豕四手生矢舌身鼠食殳氏色 首尸巳厶(計(jì)20個(gè)),(另有"纟凈?水山"-僅用于第二碼);(部首代碼)t: 土田(計(jì)2個(gè));(部首代碼"。")t (計(jì)l個(gè)) 一僅用于第一碼。第9組(計(jì)16個(gè))(部首代碼)w: 6王無韋尤瓦文毋(計(jì)7個(gè));(部首 代碼X):西小香血夕辛穴心(計(jì)8個(gè)),(另有"十"-僅用于第二碼));(部 首代碼"/"):廿一僅用于第一碼((計(jì)l個(gè))。第0組(計(jì)28個(gè))(部首代碼)y:雨尤頁弋牙業(yè)用衣音羊(包括"差" 的上半,"羔"的上半)聿又羽幺(計(jì)14個(gè)),[另有"月魚言(i ")-僅用于第二碼);(部首代碼)Z:支走至止足(包括足字旁)自隹爪(包括w)舟 豸子(計(jì)11個(gè)),(另有"竹字頭"-限于第二碼);(部首代碼";)"酉月 魚一僅用于第一碼(計(jì)3個(gè))。其中",""。""/"";" 4個(gè)標(biāo)點(diǎn)符號(hào)和a、 e 、 u、 i、 o、 v 6個(gè)字母一 碼兩用, 一是作10個(gè)特殊部首所屬字首碼,二是作高頻字的尾碼;另外設(shè)一個(gè)",。/;"以外的標(biāo)點(diǎn)和區(qū)位碼中一些較常使用的其他符號(hào)首 碼鍵位q。把數(shù)學(xué)、物理、化學(xué)等學(xué)科的常用符號(hào)的第一、二碼分別編為"qs"、 "qw"、……"qh"。2、編碼規(guī)則(1) 按成字部首讀音首字母及非成字部首首筆畫編碼(非成字部首亦規(guī) 定一個(gè)讀音,重碼字按其使用頻率排序,高頻字在前)。(2) 每字最多三碼,第一二碼,成字部首取讀音首字母碼,不成字構(gòu)件 取首筆筆畫碼,第三碼均取筆畫碼;第三碼或?yàn)轱@性碼或?yàn)殡[性碼,為顯性 碼時(shí),主要用于手機(jī)及其他數(shù)字鍵盤的漢字錄入;為隱性碼時(shí),用于査字和 電腦的漢字錄入;(3) 編碼時(shí)首先把漢字分為獨(dú)體字和合體字兩類,再按各自規(guī)則編碼。 先簡(jiǎn)述一下獨(dú)體字和合體字的認(rèn)定獨(dú)體字認(rèn)定標(biāo)準(zhǔn)現(xiàn)代漢語詞典所用的成字部首都認(rèn)定為獨(dú)體字,不論 其能否再拆分出其它獨(dú)體字與否。對(duì)那些凡分不清上下、左右、內(nèi)外、包圍 半包圍結(jié)構(gòu)的稱為獨(dú)體字,如"事串專"等一類有一筆與其他筆畫相交的字 均算獨(dú)體字,再如"朱失"等一類單筆劃與獨(dú)體字所構(gòu)成的字仍為獨(dú)體字。另 規(guī)定1、"乘爽" 一類的字亦算獨(dú)體字;2、首筆是單筆畫且與其余部分相離 的上下或上中下結(jié)構(gòu)的如"麗畫"等字亦算是獨(dú)體字。合體字認(rèn)定標(biāo)準(zhǔn)凡漢字內(nèi)部有明顯界線可以分為二或三個(gè)構(gòu)字偏旁(前 半不能是單筆劃)并根據(jù)各部分間相互位置可稱之為左右結(jié)構(gòu)、上下結(jié)構(gòu)、外內(nèi)結(jié)構(gòu)、包圍及半包圍結(jié)構(gòu)、上中下結(jié)構(gòu)的謂之合體字。(3.1)單字編碼規(guī)則(3.1.1) 獨(dú)體字取碼規(guī)則(3. 1. 1. 1)成字部首字(所屬字多的特殊部首"4 *凈纟,十i "竹字頭"r w"亦算成字部首)。第一碼成字部首讀音首字母;第二碼仍為成字部首讀音首字母;第三碼 成字部首首筆筆畫。第三碼按其首筆筆畫"一""I" " j ""、"""" 分別對(duì)應(yīng)編碼為"l" "2"或"3" "4" " 5")。如,"車"的編碼為"ccl", "馬"的編碼為"mm5"。(3. 1. 1. 2)非成字部首獨(dú)體字取碼規(guī)則 第一碼首筆筆畫;第二碼次筆筆畫;第三碼為第三筆筆畫(只有一筆的 字,第二、三碼與第一碼相同。只有兩筆的字第三碼與第二碼相同)。第三碼 按其首筆畫"一""1 " " j ""、""""分別對(duì)應(yīng)編碼為"6" "7" "8" "9" " 0")。如,"于"的編碼為"hh7","由"的編碼為"lf6"。 個(gè)別屬單筆畫與成字部首構(gòu)成的上下結(jié)構(gòu)的獨(dú)體字(包括單筆畫與成字 部首相接,如,"丘百"屬相接;不包括單筆畫與成字部首相交,如,"本" 屬相交),不按獨(dú)體字編碼規(guī)則取碼,按合體字規(guī)則編碼。不考慮其筆順,成 字部首為第一碼,單筆畫為第二碼。如"百千丘甚"第一碼分別為"白十斤 其",第二碼分別為"一 j 一,",其他類推。"本"屬相交,仍按獨(dú)體字規(guī)則 取碼(這樣規(guī)定,主要是為了第三碼與第二碼同,編碼可更快捷)。(3.1.1.3)非成字部首編碼規(guī)則("gb2312字符集"中有非成字部首) 非成字部首的第一、二、三碼同為首筆畫,第三碼按其首筆畫編碼為"一" (或"I"或"j "或"、"或""")編碼為"1"(或"2"或"3" 或"4"或"5")。這樣編碼與錄入會(huì)更快捷。例如,"匚"的編碼為"hhl" "U"的編碼為"LL2"、"3 "的編碼為"pp3"、 "^"的編碼為"dd4"、 "3" 的編碼為"ff5" "[S "的編碼為"ff5"(3.1.2) 合體字編碼規(guī)則(3. 1. 2. 1)兩半中均為成字部首或兩筆以上非成字部首各自獨(dú)占一半的一第一碼獨(dú)占一半的前半成字部首讀音首字母或兩筆以上非成字部首首 筆畫;一第二碼獨(dú)占一半的后半成字部首讀音首字母或兩筆以上非成字部首首 筆畫;^三碼根據(jù)第二碼取碼。第二碼是成字部首的,取成字部首首筆筆畫, 按其成字部首的首筆筆畫"一""I ""〗""、""""分別對(duì)應(yīng)編 碼為"1" "2" "3" "4" " 5")。第二碼是兩筆以上非成字部首首筆 畫的,取該半次筆筆畫,按其筆畫"一""I " " j ""、""""分 別對(duì)應(yīng)編碼為"6" "7" "8" "9" " 0"。如,"碼"的編碼為"sm5"; "獨(dú)"的編碼為"pc2";"鄧"的編碼為"yf7";"祁"的編碼為"df7"。 (3. 1. 2. 2)兩半中有一個(gè)成字部首或兩筆以上非成字部首獨(dú)占一半的(包括個(gè)別成字部首或兩筆以上非成字部首與單筆畫構(gòu)成的字,如"軋?jiān)?禮"等字)第一碼獨(dú)占一半的前半(或后半)成字部首讀音首字母(或兩筆以上 非成字部首首筆畫);第二碼(a)另一半只有一筆的,取該筆筆畫碼,(b)另一半中有成字 部首構(gòu)件位于該半前一部分或后一部分的,取成字部首讀音首字母碼,否則 則取該半首筆碼(注意成字部首構(gòu)件位于該半中間的,亦取該半首筆碼)。第三碼根據(jù)第二碼取碼(1)第二碼是成字部首的,取其第二碼成字部 首的首筆筆畫。按其成字部首的首筆筆畫"一""I "" j ""、""""分別對(duì)應(yīng)編碼為"6""7" "8""9"" 0"。 (2)第二碼是取筆畫碼的,取余下部分首筆筆畫。按其筆畫"一""I" " j""、""""分別對(duì)應(yīng)編碼為"6" "7" "8" "9" " 0"。如,"部"的編碼為"fl9";"規(guī)"的編碼為"jh6";"軋"的編碼為"cf0";(這樣確定上述兩類合體字的第一、二碼主要是為了與目前通用的査字 法中字的部首歸類基本一致,也為了使各一級(jí)重碼字組的字?jǐn)?shù)盡量不相差懸 殊)這樣確定上述兩類合體字第三碼的優(yōu)越之處在于 一是第二碼是成字部 首的字在確定第二碼的同時(shí)就確定了第三碼(這類字占絕大多數(shù),據(jù)粗略統(tǒng)計(jì)這類字約有4500字,約占6763字的66%。),幾乎不用再費(fèi)心去確定第三碼。二是使第三碼雖只有一種編碼手段,但同一種編碼符號(hào)用兩種標(biāo)記,5種編碼符號(hào)共有10種標(biāo)記。這樣有一些二級(jí)重碼字組可以分成10個(gè)三級(jí)重碼字組,可以減少三級(jí)重碼字組的平均字?jǐn)?shù),從而在查字打字時(shí)可以提高首碼準(zhǔn)確率,用紙質(zhì)字典査字則可更快捷。(3.1.2.3)兩半都不是成字部首或兩筆以上非成字部首的各自獨(dú)占一半的,按筆順取第一二碼;第一碼取前半的首筆畫,第二碼取后半的首筆畫,第三碼取后半的次筆筆畫(后半只有一筆的,第三碼與第二碼同),按其筆 畫"一""i " " j ""、"分別對(duì)應(yīng)編碼為"6" "7" "8""9"" 0")。(這類字這樣編碼而不考慮各半中有無成字部首,編碼可更 快捷。這類字不多,基本不影響二級(jí)重碼字組字的分布)如,"能"的編碼 為"fp0";"成"的編碼為"hf0,,; 左中右、上中下結(jié)構(gòu)的字另有規(guī)定; (3.1.2.4)特殊部首所屬字編碼規(guī)則 為了使各重碼字組的字?jǐn)?shù)盡可能少,并使各一級(jí)重碼字組的字?jǐn)?shù)盡可能 平均;選定一些所屬字較多的部首作為特殊部首,把其從同音部首中分離出 來。特殊部首字所屬字的定義按編碼規(guī)則其首碼其為特殊部首的, 特殊部首字所屬字的確定按編碼規(guī)則其首碼為特殊部首的才算,第二碼為特殊部首的不算。如設(shè)"人"為特殊部首。"合"為特殊部首"人"所屬字,"隊(duì)"不為特殊部首"人"所屬字。特殊部首字所屬字的編碼規(guī)則首碼為特殊部首碼;第二碼據(jù)去掉部首 后余下字形依一般字編碼規(guī)則取碼;第三碼取碼規(guī)則l.第二碼是成字部首 的,取其第二碼成字部首的首筆筆畫;按其成字部首的首筆筆畫"一""I ""J""、"","分別對(duì)應(yīng)編碼為"1""2" "3""4" "5"; 2.第二碼是取筆畫碼的,取余下部分首筆筆畫;按其筆畫"一""I ""J ""、""i"分別對(duì)應(yīng)編碼為"2" "3""4"" 5"; 3.后半只有一筆的,按其第二碼筆畫"一""I"" j ""、"分別對(duì)應(yīng) 編碼為"1""2" "3""4"" 5"; (3.1.2.5)特殊規(guī)定(3.1.2.5.1) 部首字的變形一般不將其視為成字部首,如,"忝"的部首為單筆畫橫,不為"心",但如下成字部首的變形亦算成字足(如"路"的右半)、w (如"采"的上半)、羊[如"蓋"的上半"差"的上半](3.1.2.5.2) 成字部首字一律不再拆分,如,"麻鼻示" 一類字不再拆分。(3.1.2.5.3) 上下、上中下結(jié)構(gòu)的字編碼規(guī)則特殊規(guī)定-上下、上中下結(jié)構(gòu)的字編碼規(guī)則在編碼的過程中,體會(huì)到按本法規(guī)則 査字的難點(diǎn)在于,部分上中下結(jié)構(gòu)字第一二碼有時(shí)難以確定,個(gè)別上下結(jié)構(gòu) 字的第二碼有時(shí)也難以確定?,F(xiàn)根據(jù)試編碼實(shí)踐,對(duì)上下、上中下結(jié)構(gòu)的字編碼在遵循一般合體字編碼規(guī)則的前提下,再作如下特殊規(guī)定 ,(a) 上中下結(jié)構(gòu)不同分法可分為兩個(gè)不同成字部首的就大不就小,如, "章"取"音"不取"立";"三)取"二"不取"一";(b) "衷褻" 一類字的部首為"丄"不為"衣";(c) 上下或上中下結(jié)構(gòu)的字僅從字形上看,既有相接處又有相離處,一 般從相離處劃分為兩部分如"共"前半不取按后半取"八"編碼。"盍" 按后半取"皿"編碼。若無相離處,則可從相接處分為兩部分。如"去"分 為"土"和"厶"兩部分,"云虧"第一碼均取"二",第二碼分別取"厶"和i下面的特殊情況下可從相接處分為兩半即在從相離處分為兩半,兩半均沒有成字部首或兩筆以上非成字部首, 而從相接處分為兩半,下部有成字部首的特殊情況下,可從下部有成字部首 的相接處分為兩半。如"黨堂常" 一類僅從字形上看可分成四部分的字按規(guī) 則應(yīng)從相離處分為兩半,但分成兩半后,兩半都不是獨(dú)占一半的成字部首或 兩筆以上非成字部首,但其最下部為成字部首,故變通處理,第一碼從下部 取成字部首碼,第二碼按規(guī)則從余下部分的上部或下部?jī)?yōu)先取成字部首碼, 若上部與下部均無成字部首,則取余下部分的首筆筆畫。"黨堂常"的首碼 分別取"兒土巾",其第二碼均取"口";(d) 上中下結(jié)構(gòu)的字其首碼只能從上下取碼,不能從中間取首碼。取第 一碼后,余下部分從形體上看仍為上中下結(jié)構(gòu)的,第二碼亦只能從上部或下 部取碼。如,"拿"第一碼取"人"后,余下部分從形體上看仍為上中下結(jié)構(gòu),按規(guī)則第二碼只能從余下部分的上部或下部取碼,不能從中部取碼,故只能 取"手"不能取"口"。若其首碼取的是上部(或下部)的一個(gè)獨(dú)占一半的成字部首或兩筆以上 不成字部首,第二碼仍同其他合體字一樣按筆順優(yōu)先從余下部分的上部或下 部取成字部首碼,余下部分無成字部首的取余下部分的首筆筆畫碼。若其上部和下部均無獨(dú)占一半的成字部首或兩筆以上不成字部首,第一、 二、三碼則分別取第一、二、三筆畫(如,"復(fù)囊亙" 一類字第一、二、三碼 分別取第一、二、三筆筆畫。(這樣編碼不用考慮從何處把要編碼的字分為兩半(左中右結(jié)構(gòu)的字如 何分成兩半一目了然),編碼可更快捷)(e)部分兩半都無成字部首、也無明顯界限(即上下相接)上下結(jié)構(gòu)的 字,按獨(dú)體字編碼。如,"予表亡喪"第一、二、三碼分別取其第一二三筆筆 畫。(這樣編碼不用考慮從何處把要編碼的字分為兩半(左右結(jié)構(gòu)的字自然分 成兩半))(3.1.2.5.4)左中右結(jié)構(gòu)的字其首碼只能從左右取碼,左右均為成字部 首或兩筆以上非成字部首的按筆順從左部取首碼碼。如"做樹嬲" 一類字其 首碼分別取'M木I ","嬲"的首碼不取"女"。尾碼根據(jù)余下部分仍按一般 規(guī)則取碼。(3. 1. 2. 5. 5)個(gè)別難以確定編碼的字可有兩種編碼這類似于"五筆輸入 法"的容錯(cuò)碼。難以確定編碼的字有如下兩種情況(a) 易混筆順字,如"萬"等字也可按兩種筆順編碼。(b) 個(gè)別分成兩半時(shí)可以有不同分法的的字(以上中下結(jié)構(gòu)的字為多) 可按兩種分法編碼。如"丞"可編碼為"fh"也可編碼為"fl"。如"棼"可編碼為"hp"也 可編碼為"db"。如"毅"的第二碼可取部首"立"也可取部首"豕";"彥" 的第一碼取"i", " 、 j "(中間的一 、一"。(3.1.2.5.6)成字部首"二兒耳"以"r"為代碼,"日"、"曰"因其在 合體字中難以區(qū)分其編碼均為"r"。上述取碼例字"詞垢司后" 一類字第二碼取"口",理由是無論怎么分,除了 "口"之 外,再?zèng)]有兩筆以上部首。"銅洞"等字的第二碼取"門"不取"口",因"門" 是兩筆以上部首。"燮"第二碼取"火";"叟"第二碼取"j ";"爵奚疊"第二碼分別取 "四幺"";"式區(qū)"第一碼分別取"匚戈";"毅"的第二碼可取部首"立"也可取部首"豕";"死"第一碼取"歹";"哀衷褒" 一類字第一碼取"、"不取"衣";"坐" 一類字第一碼取"人",第二碼取"土"。"成咸戌" 一類字算合體字,"戊"部分為前半,余下部分為后半,第一 碼均取"一"(即"戊"的首筆),第二碼分別取""口一";"裁截" 一類字亦算合體字,"衣隹"為前半,余下部分為后半,第一碼分別取"衣隹",第 二碼均取"一";(3. 2)高頻字編碼(包括",。/;"四個(gè)標(biāo)點(diǎn)符號(hào))規(guī)則 分別將30個(gè)一級(jí)重碼字組中使用頻率最高的前11個(gè)高頻字的尾碼分別編為空格鍵、a、 e、 u、 i、 o、 v, 。 /;為了有規(guī)律的記憶或?qū)ふ腋鱾€(gè)高頻字所對(duì)應(yīng)的鍵位,特規(guī)定每個(gè)一級(jí)重 碼字組中使用頻率最高的最高的3個(gè)字分別對(duì)應(yīng)空格、a和";"鍵,其他字 按第一碼的首筆畫"一 I j 、""的順序排列,第一碼首筆畫相同的按使用 頻率高低的順序排列。特別規(guī)定"鄉(xiāng)山竹言(包括"i ") 1—十木人(包括'M ")水(包括 " ")矛"^月魚酉"15個(gè)部首各自所屬的8個(gè)高頻字按去掉部首后剩余部分 的首筆畫"一 I〗、i"的順序排列,其中屬成字部首的高頻字,即去掉部 首無剩余筆畫的,排在有剩余筆畫高頻字的前面;",。A " 4個(gè)最常用標(biāo)點(diǎn)的編碼分別為",,"、"。。""〃"";;";(3.3)多字詞語編碼規(guī)則三字以上常用詞語按一字一碼編碼,只取詞語每個(gè)字的首碼。(4)為了增加重碼字組的數(shù)量、減少各重碼字組的字?jǐn)?shù),紙質(zhì)字典設(shè)有區(qū)別碼(4.1) 在第一碼相同的幾個(gè)部首中按部首筆畫設(shè)部首字形區(qū)別碼,按首筆及次筆編區(qū)別碼,其編碼及排序規(guī)則是(4. 1. 1)把部首的第一、二筆筆畫劃分為"一、I 、〗、、、""五種筆畫,且分別以1、 2、 3、 4、 5為代碼編碼,只有一筆的第二碼為"0"。再 按其編碼數(shù)字大小排序,數(shù)字小的在前;(4.1.2)第一二筆均相同的加一個(gè)第三碼,或根據(jù)部首字筆畫數(shù)排序, 筆畫數(shù)小的在前,或根據(jù)第三筆筆畫"一、I 、 j 、、、,"排序,第三碼 按部首排序依次編碼為6、 7、 8、 9、 0;如,把首碼為b的各同讀音首字母分別編碼排序如下髟12;比15;卜24;貝25 ;白326;鼻327;八34;廣 41;在檢字表和正文中,把第一碼相同的字按部首分組,各組字的排列順序 按部首區(qū)別碼數(shù)字大小排序。(4.2) 在二級(jí)重碼字組設(shè)第二碼字形區(qū)別碼在電子字典第二碼以"h、 1、 p、 d、 f"為代碼的二級(jí)重碼字組中,第二碼是成字部首字的字與第二碼是筆畫的字按使用頻率混排在一起,為了把這 兩類字分別歸類排序,紙質(zhì)字典在第二碼"h、 1、 p、 d、 f"為代碼的二級(jí)重 碼字組中設(shè)第二碼字形區(qū)別碼。第二碼是部首字的一類不加區(qū)別碼;第二碼是筆畫碼的一類(成字部首字除外),加區(qū)別碼為"〃,。如,把第一二碼是"bh" 二級(jí)重碼字組的字,分為兩類, 一類是第二碼是部首字的,其代碼仍為"bh"; —類是第二碼是筆畫碼的,其代碼為"bh/"。同一個(gè)二級(jí)重碼字組的字在檢字表和正文中第二碼不加第二碼區(qū)別碼的 字在前,第二碼加區(qū)別碼的字在后。在字典中設(shè)區(qū)別碼,其實(shí)質(zhì)是把一個(gè)重碼字組分成了幾個(gè)重碼字組,可 以起到減少重碼字組字?jǐn)?shù)的作用,又從而可使査閱字典更方便快捷。 (四)査字方法本發(fā)明所創(chuàng)設(shè)的"部首音形結(jié)合碼查字打字同碼方案"要查一個(gè)不認(rèn)識(shí)字的理論上的步驟有如下3個(gè)1.為要査的字a確定兩個(gè)部首并根據(jù)這兩個(gè) 部首的讀音首字母為字a確定一個(gè)由漢語拼音字母或標(biāo)點(diǎn)組成的兩碼編碼; 2.根據(jù)這個(gè)編碼在檢字表中査到字a在字典正文的頁碼;3.從字a在字典正 文的頁碼找到字a并閱讀其釋義。實(shí)際査字過程中, 一般情況下應(yīng)該省略其中的第二個(gè)步驟。按字a的編 碼根據(jù)字典翻口處及字典正文頁眉處的標(biāo)記直接翻到字a所在的頁碼或字a 所在頁碼附近再翻頁找到字a并閱讀其釋義。這就如同用現(xiàn)在的字典要查知 道讀音的字a,按字a的讀音可直接翻到字a所在的頁碼或字a所在頁碼附近 再翻頁找到字a并閱讀其釋義。且一般來說比現(xiàn)在要査認(rèn)識(shí)的字a還要快捷。 因?yàn)橛矛F(xiàn)在的字典要查認(rèn)識(shí)的字,對(duì)大多數(shù)人來說,是把"知道讀音"定義 為"知道聲母和韻母",并不包括聲調(diào)。而且對(duì)全部所謂"知道讀音的字" 中的大部分字的聲調(diào)他們也不能確定,只能確定一小部分字的聲調(diào)。由于不 知道字的聲調(diào),對(duì)同音字多的音節(jié),往往要翻多頁才能找到要査的字,有時(shí) 甚至可能要把該音節(jié)的同音字從頭找到尾才能找到。而用本發(fā)明方案査不認(rèn) 識(shí)的字,雖然也有同碼字,但同碼字?jǐn)?shù)量少,且按使字頻排序,很容易找到??梢允÷云渲械牡诙€(gè)步驟的理由在于,即使按第二個(gè)步驟在檢字表查 到字a在字典正文的頁碼c, 一下直接翻到字a的頁碼c的幾率也很少,多數(shù) 情況下是第一次只能翻到c頁的附近,要經(jīng)過至少兩次的翻頁才能翻到c頁。 也就是說用與不用第二個(gè)步驟,第三個(gè)步驟所用時(shí)間基本相等,即使稍慢一 點(diǎn),也不會(huì)比加上第二個(gè)步驟^f用的時(shí)間還長(zhǎng)。既然所用時(shí)間總和不長(zhǎng),就 完全應(yīng)該省略第二個(gè)步驟?,F(xiàn)在通用的運(yùn)用部首査字法的字典,其檢字表中都有"難檢字表",而其 中的難檢字幾乎全屬于獨(dú)體字和無成字部首或兩筆以上非成字部首獨(dú)占一半 的合體字。若按本方案査字,則難檢字極少,加之本方案對(duì)難以確定編碼的 字可用兩種編碼査字,因而取消了 "難檢字表"。本發(fā)明與已有技術(shù)相比具有如下突出特點(diǎn)和顯著進(jìn)步 1、在字典中用附錄的形式,從不同角度編撰各種分類字表,增加漢字學(xué) 習(xí)方法和各種具體識(shí)字方法介紹,還增設(shè)一個(gè)作為整個(gè)漢字系統(tǒng)的獨(dú)立的子 系統(tǒng)多字詞語庫(kù),其中收錄三字以上的詞語、成語,歇后語、格言、名言警 句。利用以上增擴(kuò)的內(nèi)容,不但可以進(jìn)一步增強(qiáng)字典的識(shí)字和鞏固識(shí)字功能, 讓使用者系統(tǒng)了解整個(gè)漢字系統(tǒng),更重要的是有助于弘揚(yáng)中華傳統(tǒng)文化的精 華。2、 查字打字同碼,會(huì)查字就會(huì)打字,因凡識(shí)字之人都要會(huì)查字典,可以省去人們學(xué)習(xí)并熟練掌握某種漢字輸入法編碼的過程(對(duì)能熟練運(yùn)用漢語拼 音拼寫漢字的人來說,全拼法也可省略這一過程,不過,全拼法是一種好學(xué) 不好用的輸入法)。3、 把輸入法和電子詞典合二為一,使輸入法由單一的打字功能變?yōu)榧饶?打字又可學(xué)字的雙重功能,更適合人們隨時(shí)隨地查字學(xué)字。本項(xiàng)改進(jìn)用于手 機(jī),由于手機(jī)具有便攜性,等于手機(jī)持有者隨身攜帶了一本字典。比用于電 腦更佳。4、 字典內(nèi)容尤其是其中的各種分類字表和多字詞語庫(kù)可進(jìn)行增刪,能滿 足使用者的特殊需求5、 査字法方面的創(chuàng)新繼承了傳統(tǒng)的部首査字和音序查字的優(yōu)點(diǎn),克服 了其各自的缺點(diǎn),把通用的部首査字法進(jìn)行如下改進(jìn)(1) 所收部首與一般字典的部首基本相同,本發(fā)明方案把34個(gè)非成字 部首歸并為5種基本筆畫;把173個(gè)成字部首按讀音首字母歸并為20種讀音 首字母,部首本身的歸類及與鍵盤鍵位的對(duì)應(yīng)關(guān)系都極有規(guī)律,把部首目錄 的排序由以筆畫為序改為以部首讀音首字母為序,使記憶全部部首及部首代 碼及其容易。在很短時(shí)間內(nèi)就可記牢。本查字法簡(jiǎn)便易學(xué),不但初學(xué)査字典的人可以很快學(xué)會(huì),而且因其所選 取的部首與目前通用的查字法相同,已會(huì)用部首查字法查字者學(xué)習(xí)本查字法 會(huì)更快。(2) 在字典正文中把所收單字的排序由以整字讀音為序改為以部首讀音 首字母為序。(3) 查字步驟比通用的部首查字法減省。 通用的部首査字法在紙質(zhì)字典中要査一個(gè)不認(rèn)識(shí)字的一般步驟有如下5個(gè)l.為要査的字(假定為a)確定一個(gè)部首(假定為b); 2.在部首目錄中查 到部首b所屬字在檢字表的起始頁碼;3.根據(jù)該部首所屬字在檢字表的起始 頁碼找到部首b所屬字;4.在檢字表中根據(jù)字a除去部首的筆畫數(shù)和起筆筆 畫査到字a在字典正文的頁碼;5.從字a在字典正文的頁碼找到字a并閱讀 其釋義。本發(fā)明所創(chuàng)設(shè)的"部首音形結(jié)合碼査字打字同碼方案"要查一個(gè)不認(rèn)識(shí) 字的理論上的步驟有如下3個(gè)1.為要査的字a確定兩個(gè)部首并根據(jù)這兩個(gè) 部首的讀音首字母為字a確定一個(gè)由漢語拼音字母或標(biāo)點(diǎn)組成的兩碼編碼; 2.根據(jù)這個(gè)編碼在檢字表中查到字a在字典正文的頁碼;3.從字a在字典正 文的頁碼找到字a并閱讀其釋義。實(shí)際査字過程中, 一般情況下應(yīng)該省略其中的第二個(gè)步驟。按字a的編 碼根據(jù)字典翻口處及字典正文頁眉處的標(biāo)記直接翻到字a所在的頁碼或字a 所在頁碼附近再翻頁找到字a并閱讀其釋義。這就如同用現(xiàn)在的字典要查知 道讀音的字a,按字a的讀音可直接翻到字a所在的頁碼或字a所在頁碼附近 再翻頁找到字a并閱讀其釋義。且一般來說比現(xiàn)在要査認(rèn)識(shí)的字a還要快捷。 因?yàn)橛矛F(xiàn)在的字典要査認(rèn)識(shí)的字,對(duì)大多數(shù)人來說,是把"知道讀音"定為"知道聲母和韻母",并不包括聲調(diào)。而且對(duì)全部所謂"知道讀音的字" 中的大部分字的聲調(diào)他們也不能確定,只能確定一小部分字的聲調(diào)。由于不 知道字的聲調(diào),對(duì)同音字多的音節(jié),往往要翻多頁才能找到要查的字,有時(shí) 甚至可能要把該音節(jié)的同音字從頭找到尾才能找到。而用本發(fā)明方案査不認(rèn) 識(shí)的字,雖然也有同碼字,但同碼字?jǐn)?shù)量少,且按使字頻排序,很容易找到。 可以省略其中的第二個(gè)步驟的理由在于,即使按第二個(gè)步驟在檢字表查到字a在字典正文的頁碼c, 一下直接翻到字a的頁碼c的幾率也很少,多數(shù) 情況下是第一次只能翻到c頁的附近,要經(jīng)過至少兩次的翻頁才能翻到c頁。 也就是說用與不用第二個(gè)步驟,第三個(gè)步驟所用時(shí)間基本相等,即使稍慢一 點(diǎn),也不會(huì)比加上第二個(gè)步驟所用的時(shí)間還長(zhǎng)。既然所用時(shí)間總和不長(zhǎng),就 完全應(yīng)該省略第二個(gè)步驟?,F(xiàn)在通用的運(yùn)用部首査字法的字典,其檢字表中都有"難檢字表",而其 中的難檢字幾乎全屬于獨(dú)體字和無成字部首或兩筆以上非成字部首獨(dú)占一半 的合體字。若按本方案查字,則難檢字極少,加之本方案對(duì)難以確定編碼的 字可用兩種編碼查字,因而取消了 "難檢字表"。依據(jù)本査字法查字,無論要的字認(rèn)識(shí)與否都可直接翻頁査字,査生字要 比用了 1000多年直至現(xiàn)在還通用的"部首查字法"和"筆畫査字法"快許多。6.編碼規(guī)則符合人們識(shí)記稱說漢字字形的習(xí)慣 人們?cè)谧R(shí)記稱說漢字字形時(shí),通常采取如下模式獨(dú)體字(包括非成字部首)l無字根的直接分成幾個(gè)筆畫;2有字根的,先分解成字根與筆畫,再把構(gòu)件分別分解成幾個(gè)筆畫。合體字1先把漢字合體字分為兩半,把部首分作一半,把其余筆形分作另一半(如人們稱謂姓氏常說"古月胡、弓長(zhǎng)張、言午許、雙人徐"。2再把各半分別分為一個(gè)或幾個(gè)成字部首字(或構(gòu)件)-這里的構(gòu)件特指非成字部首 獨(dú)體字和兩筆以上非部首筆形,如"申夫"非成字部首獨(dú)體字、"釜"字的 后半的筆形、"敖"字左半的筆形、"復(fù)"字第一二筆的筆形等都稱之為構(gòu)件。該概念的外延大于通常所說的字根。下同-取該半的次筆筆畫)3最后把構(gòu)件分解為筆畫。上述模式與本方案的編碼順序和編碼特點(diǎn)相比,我們有充分的理由說本 方案的編碼規(guī)則與人們識(shí)記稱說漢字的習(xí)慣正相吻合。
權(quán)利要求
1. 一種新型字典,為電子字典或紙質(zhì)字典,其特征是(1)增收GB2312-80字符集中前15區(qū)的部分常用符號(hào),包括標(biāo)點(diǎn)符號(hào);(2)按照查字打字同碼方案中的編碼規(guī)則對(duì)字、符號(hào)進(jìn)行編碼;(3)字典所收字在檢字表和正文的排序以上述(2)編碼規(guī)則中的部首讀音首字母的音序?yàn)樾?;?duì)字?jǐn)?shù)不超過10個(gè)的二級(jí)重碼字組中的重碼字按使用頻率排序,高頻字在前;(4)對(duì)字?jǐn)?shù)超過10個(gè)的二級(jí)重碼字組中的重碼字先按其所屬的三級(jí)重碼字組順序排序,對(duì)三級(jí)重碼字組再按其使用頻率排序,高頻字在前;(5)紙質(zhì)字典的翻口處設(shè)計(jì)一級(jí)重碼字組標(biāo)記及字典正文每一頁的頁眉處標(biāo)明該頁所收字的編碼;(6)紙質(zhì)字典設(shè)篇章頁,把檢字表按各一級(jí)重碼字組分列在各個(gè)篇章頁上,檢字表中一個(gè)字典正文頁碼對(duì)應(yīng)該正文頁碼所包括的所有漢字;(7)紙質(zhì)字典各相鄰一級(jí)重碼字組頁幅寬度不同;(8)設(shè)置各種分類字表;(9)介紹漢字學(xué)習(xí)方法和具體的識(shí)字方法;(9)設(shè)置一個(gè)作為整個(gè)漢字系統(tǒng)的獨(dú)立的子系統(tǒng)多字詞語庫(kù),其中收錄三字以上的詞語、成語,歇后語、格言、名言警句,同時(shí)字典正文不再收入三字以上詞語條目;(10)字典內(nèi)容尤其是附錄中的內(nèi)容可根據(jù)使用者的特殊需求進(jìn)行增刪。
2、 根據(jù)權(quán)利要求1所述的一種新型字典,其特征是紙質(zhì)字典設(shè)有區(qū)別碼(1)在第一碼相同的幾個(gè)部首中按部首筆畫設(shè)部首字形區(qū)別碼,按首筆 及次筆編區(qū)別碼,其編碼及排序規(guī)則是(1. 1)把部首的第一、二筆筆畫劃分為"一、I 、 j 、、、""五種筆 畫,且分別以1、 2、 3、 4、 5為代碼編碼,只有一筆的第二碼為"0"。再按 其編碼數(shù)字大小排序,數(shù)字小的在前;(1.2)第一二筆均相同的加一個(gè)第三碼,或根據(jù)部首字筆畫數(shù)排序,筆畫數(shù)小的在前,或根據(jù)第三筆筆畫"一、I 、〗、、、""排序,第三碼按 部首排序依次編碼為6、 7、 8、 9、 0;在檢字表和正文中,把第一碼相同的字按部首分組,各組字的排列順序 按部首區(qū)別碼數(shù)字大小排序;(2 )在同部首且第二碼相同的重碼字中設(shè)第二碼字形區(qū)別碼第二碼是部首字的一類不加區(qū)別碼;第二碼是筆畫碼的一類,加區(qū)別碼<formula>formula see original document page 3</formula>在檢字表和正文中,第二碼不加第二碼區(qū)別碼的字在前,第二碼加區(qū)別 碼的字在后。
3、 根據(jù)權(quán)利要求l所述的一種新型字典,其特征是設(shè)立個(gè)性化的分類 字表,紙質(zhì)字典附錄部分可采用活頁式裝訂。
4、 根據(jù)權(quán)利要求1所述的一種新型字典,其特征是附設(shè)同音字檢字法, 于同音字檢字表中,在每一個(gè)同音字的后面加上該字在字典正文的頁碼,同 音字的排序按使用頻率排序,高頻字在前;同音字定義為聲母韻母相同,不計(jì)聲調(diào)。
5、 權(quán)利要求1-4中任一權(quán)利要求所述一種新型字典的査字打字同碼方案, 其特征是編碼規(guī)則如下(1)按成字部首讀音首字母及非成字部首首筆畫編碼 部首設(shè)置及部首代碼 第1組計(jì)21個(gè)部首代碼.a:山鄉(xiāng)一僅用于第一碼,計(jì)2個(gè);部首代碼b:髟比卜貝白鼻 八匕廣,計(jì)9個(gè);部首代碼c:寸廠蟲辰車臣赤齒長(zhǎng)《,計(jì)10個(gè),另有""^" -僅限于第二碼用;第2組計(jì)25個(gè)部首代碼d:成字部首豆大歹斗刀,計(jì)5個(gè),不成字部首、7 "曾" 的上面兩點(diǎn)"、、^ 1_才、豐,計(jì)8個(gè),另有"工;a"僅限于第二碼;部 首代碼e:竹,包括竹字頭,一僅用于第一碼,限于筆順在前,計(jì)l個(gè);部首 代碼f:成字部首非缶父風(fēng)方,計(jì)5個(gè),不成字部首,曰P卩乙〈〈〈, 計(jì)6個(gè);其中"點(diǎn)""包含"捺","折"包含除"豎鉤"以外的單筆劃"折" 筆;第3組計(jì)26個(gè).部首代碼g:干工甘革鬲鼓戈骨鬼瓜谷高廣弓艮,計(jì)15個(gè);部首代碼h: 成字部首黃黑禾火戶,計(jì)5個(gè),不成字部首 一升匚,計(jì)3個(gè);部首代碼i:二; ^言i —僅用于第一碼,計(jì)3個(gè); 其中"橫"包含"提"; 第4組計(jì)10個(gè)部首代碼j:巾見臼斤金,幾,包括風(fēng)字框,角己,計(jì)8個(gè);部首代碼k: 口,計(jì)l個(gè);部首代碼O:十一僅用于第一碼,計(jì)l個(gè);第5組計(jì)28個(gè)部首代碼l成字部首耒老龍鹵里立鹿隸力,計(jì)9個(gè);不成字部首I 產(chǎn)!j門口"肖"字上一半,計(jì)6個(gè),;部首代碼M:麥面目皿毛麻門米矛馬母糸, 計(jì)12個(gè),另有"木"-僅用于第二碼;部首代碼U木一僅用于第一碼,計(jì)1個(gè);其中"豎"包含"豎鉤";第6組,計(jì)18個(gè),部首代碼n:鳥牛女,計(jì)3個(gè),部首代碼p:成字部首爿皮片支疋,計(jì)5個(gè),不成字部首j夂鄉(xiāng)"番"的上一半,勺"危" 的上一半,3夂t、,計(jì)9個(gè);部首代碼V人^f 一僅用于第一碼,計(jì)l個(gè);第7組,計(jì)12個(gè),部首代碼q:青其犬氣欠,計(jì)5個(gè),另外一些常用符 號(hào),包括標(biāo)點(diǎn)符號(hào)的首碼代碼亦為"q";部首代碼r: 二耳而兒日,"曰"并 入"日",肉,計(jì)6個(gè),另有"人4 "-僅用于第二碼,部首代碼","?, 計(jì)l個(gè);第8組,計(jì)23個(gè),部首代碼S:示十士石豕四手生矢舌身鼠食殳氏色首 尸巳厶,計(jì)20個(gè),另有"纟凈?水山"-僅用于第二碼;部首代碼t: 土田, 計(jì)2個(gè);部首代碼"。"凈,計(jì)1個(gè)一僅用于第一碼;第9組,計(jì)16個(gè),部首代碼W: 6王無韋尤瓦文毋,計(jì)7個(gè);部首代碼 X:西小香血夕辛穴心,計(jì)8個(gè),另有"十"-僅用于第二碼;部首代碼"〃,: ^一僅用于第一碼,計(jì)l個(gè);第0組,計(jì)28個(gè),部首代碼y:雨尤頁弋牙業(yè)用衣音羊,包括"差"的 上半,"羔"的上半聿又羽幺,計(jì)14個(gè),另有"月魚言,"l "-僅用于第二碼; 部首代碼Z:支走至止足,包括足字旁,自隹爪,包括^,舟秀子,計(jì)11 個(gè),另有"竹字頭"-限于第二碼;部首代碼";"酉月魚一僅用于第一碼, 計(jì)3個(gè);其中",""。""/"";" 4個(gè)標(biāo)點(diǎn)符號(hào)和a、 e 、 u、 i、 o、 v 6個(gè)字母一 碼兩用, 一是作10個(gè)特殊部首所屬字首碼,二是作高頻字的尾碼; 另設(shè)1個(gè)常用符號(hào)(包括標(biāo)點(diǎn)符號(hào))首碼"q";(2) 每字最多三碼,第一二碼,成字部首取讀音首字母碼,不成字構(gòu)件 取首筆筆畫碼,第三碼均取筆畫碼;第三碼或?yàn)轱@性碼或?yàn)殡[性碼,為顯性 碼時(shí),主要用于手機(jī)及其他數(shù)字鍵盤的漢字錄入;為隱性碼時(shí),用于査字和 電腦的漢字錄入;(3) 編碼時(shí)首先把漢字分為獨(dú)體字和合體字兩類,再按下列規(guī)則編碼 (3.1)獨(dú)體字編碼規(guī)則(3.1.1) 成字部首獨(dú)體字 第一碼為成字部首讀音首字母,第二碼仍為成字部首讀音首字母;第三碼成字部首首筆筆畫,第三碼按其首筆畫"一""I""j ""、" 分別對(duì)應(yīng)編碼為"1""2" "3""4"" 5";(3.1.2) 非成字部首獨(dú)體字第一碼首筆筆畫,第二碼次筆筆畫,第三碼為第三筆筆畫,第三碼按其 筆畫"一""I " " J ""、""""分別對(duì)應(yīng)編碼為"6""7" "8"(3.2)合體字編碼規(guī)則(3.2.1)兩半中均為成字部首或兩筆以上非成字部首各自獨(dú)占一半的-第一碼為獨(dú)占一半的前半成字部首讀音首字母或兩筆以上非成字部首首筆畫;第二碼為獨(dú)占一半的后半成字部首讀音首字母或兩筆以上非成字部首 首筆畫;第三碼根據(jù)第二碼取碼,第二碼是成字部首的,取成字部首首筆筆 畫,按其成字部首的首筆筆畫"一""I " " j ""、"分別對(duì)應(yīng) 編碼為"1" "2" "3" "4" " 5";第二碼是兩筆以上非成字部首首 筆畫的,筆畫取該半次筆筆畫,按其筆畫"一""I " " j ""、" 分別對(duì)應(yīng)編碼為"6""7" "8""9"" 0";(3. 2. 2)兩半中有一個(gè)成字部首或兩筆以上非成字部首獨(dú)占一半的 第一碼為獨(dú)占一半的前半或后半成字部首讀音首字母,或兩筆以上非成 字部首首筆畫;第二碼(a)另一半只有一筆的,取該筆筆畫碼,(b)另一半中有成字 部首構(gòu)件位于該半前一部分或后一部分的,取成字部首讀音首字母碼,否則 則取該半首筆碼注意成字部首構(gòu)件位于該半中間的,亦取該半首筆碼;第三碼根據(jù)第二碼取碼,第二碼是成字部首的,取其第二碼成字部首的 首筆筆畫,按其成字部首的首筆筆畫"一""I " "J ""、"分 別對(duì)應(yīng)編碼為"6" "7" "8" "9" " 0";第二碼是取筆畫碼的,取 余下部分首筆筆畫,按其筆畫"一""I"" j ""、"編碼為"6" y " W g ,, W g ,, "G ,,.(3.2.3) 兩半都不是成字部首或兩筆以上非成字部首各自獨(dú)占一半的, 按筆順取第一二碼;第一碼取前半的首筆畫,第二碼取后半的首筆畫,第三 碼取后半的次筆筆畫,后半只有一筆的,第三碼與第二碼同,按其筆畫"一""I""""、" 一"分別對(duì)應(yīng)編碼為"6" "7""8" "9" " 0";(3.2.4) 特殊部首字所屬字的編碼規(guī)則-特殊部首字所屬字的定義按編碼規(guī)則其首碼其為特殊部首的,特殊部首字所屬字的編碼規(guī)則首碼為特殊部首碼;第二碼據(jù)去掉部首后余下字形依一般字編碼規(guī)則取碼;第三碼取碼規(guī)則l.第二碼是成字部首的,取其第二碼成字部首的首筆筆畫;按其成字部首的首筆筆畫"一""I ""〗""、""""分別對(duì)應(yīng)編碼為"1""2" "3""4""5"; 2.第二碼是取筆畫碼的,取余下部分首筆筆畫;按其筆畫"一""1""〗""、""""分別對(duì)應(yīng)編碼為"1" "2" "3" "4" " 5"; 3.后半只有一筆的,按其第二碼筆 畫"一""i "")""、""""分別對(duì)應(yīng)編碼為"r,"2" "3"(3. 3)高頻字包括",。/;"四個(gè)標(biāo)點(diǎn),編碼規(guī)則第一碼相同字的集合組成一個(gè)一級(jí)重碼字組,分別將30個(gè)一級(jí)重碼字組 中使用頻率最高的前l(fā)l個(gè)高頻字的尾碼分別編為空格鍵、a、 e、 u、 i、 o、 v、",, ",, 《《,,, ",,, 為了有規(guī)律的記憶或?qū)ふ腋鱾€(gè)高頻字所對(duì)應(yīng)的鍵位,特規(guī)定每個(gè)一級(jí)重 碼字組中使用頻率最高的3個(gè)字分別對(duì)應(yīng)空格、"a"和";"鍵,其他字按第 一碼的首筆畫"一 I〗、""的順序排列,第一碼首筆畫相同的按使用頻率 高低的順序排列;特別規(guī)定"鄉(xiāng)山竹言(包括"i ")工"個(gè)木人(包括'M ")水(包括 "")t ^月魚酉"15個(gè)部首各自所屬的8個(gè)高頻字按去掉部首后剩余部分 的首筆畫"一 I j 、""的順序排列,其中屬成字部首的高頻字,即去掉部 首無剩余筆畫的,排在有剩余筆畫高頻字的前面;",。A " 4個(gè)最常用標(biāo)點(diǎn)的編碼分別為",,"、"。。""〃"";;"; (3.4)多字詞語編碼 三字以上常用詞語按一字一碼編碼,只取詞語每個(gè)字的首碼。
6、 根據(jù)權(quán)利要求5所述的查字打字同碼方案,其特征是,在上述(3. 1. 2) 非成字部首獨(dú)體字編碼規(guī)則中,非成字部首編碼規(guī)則為非成字部首的第一、 二、三碼同為首筆畫,第三碼按其首筆畫編碼為"一""I"" j ""、"分別對(duì)應(yīng)編碼為"1""2" "3""4"" 5"。
7、 根據(jù)權(quán)利要求5所述的查字打字同碼方案,其特征是,在上述(3.2) 合體字編碼規(guī)則中,特殊編碼規(guī)則規(guī)定如下(1) 上中下結(jié)構(gòu)的字按不同分法可分為兩個(gè)不同成字部首的,成字部首 就大不就??;(2) 上下或上中下結(jié)構(gòu)的字僅從字形上看,既有相接處又有相離處的, 一般從相離處劃分為兩部分,若無相離處,則可從相接處分為兩部分;(3) 上中下結(jié)構(gòu)的字其首碼只能從上下取碼,不能從中間取首碼,取第 一碼后,余下部分從形體上看仍為上中下結(jié)構(gòu)的,第二碼亦只能從上部或下 部取碼;若其首碼取的是上部或下部的一個(gè)獨(dú)占一半的成字部首或兩筆以上不成 字部首,第二碼仍同其他合體字一樣按筆順優(yōu)先從余下部分的上部或下部取 成字部首碼,余下部分無成字部首的取余下部分的首筆筆畫碼;若其上部和下部均無獨(dú)占一半的成字部首或兩筆以上不成字部首,第一、 二、三碼則分別取第一、二、三筆畫;(4) 兩半都無成字部首、也無明顯界限的上下結(jié)構(gòu)的字,按獨(dú)體字編碼;(5) 左中右結(jié)構(gòu)的字其首碼只能從左右取碼,左右均為成字部首或兩筆 以上非成字部首的按筆順從左部取首碼碼,尾碼根據(jù)余下部分仍按一般規(guī)則 取碼;(6)難以確定編碼的字可有兩種編碼的容錯(cuò)碼。
8、 根據(jù)權(quán)利要求5所述的查字打字同碼方案,其特征是,查一個(gè)字的步驟如下(1) 為要查的字a確定兩個(gè)部首并根據(jù)這兩個(gè)部首的讀音首字母為字a 確定一個(gè)由漢語拼音字母或標(biāo)點(diǎn)組成的兩碼編碼;(2) 根據(jù)這個(gè)編碼在檢字表中査到字a在字典正文的頁碼;(3) 從字a在字典正文的頁碼找到字a并閱讀其釋義。
9、 根據(jù)權(quán)利要求8所述的查字打字同碼方案,其特征是,査一個(gè)字的步 驟如下省略其中的第二個(gè)步驟,直接按字a的編碼根據(jù)字典翻口處及字典 正文頁眉處的標(biāo)記直接翻到字a所在的頁碼或字a所在頁碼附近再翻頁找到 字a并閱讀其釋義。
全文摘要
本發(fā)明涉及一種新型紙質(zhì)字典及電子字典,及與之匹配的查字打字同碼方案,屬字典編撰技術(shù)。本發(fā)明依據(jù)字典查字通用部首,把34個(gè)不成字部首歸并為5種基本筆畫,把173個(gè)成字部首按讀音首字母歸并為20種讀音首字母。設(shè)置個(gè)性化字詞庫(kù),采取紙質(zhì)字典設(shè)置翻口處標(biāo)記等有助于快速查字的措施。本發(fā)明優(yōu)點(diǎn)(1)將漢字查字法與電腦及手機(jī)漢字輸入用同一種編碼方案,消除各種漢字錄入純音碼方案不適合不懂普通話的人使用和不能錄入不認(rèn)識(shí)字的缺點(diǎn);(2)將漢字輸入法由單一的打字功能變?yōu)榧饶艽蜃钟挚刹樽帧W(xué)字的雙重功能,打字的同時(shí)可以學(xué)字;(3)字典內(nèi)容可根據(jù)使用者的特殊需求進(jìn)行增刪;(4)用紙質(zhì)字典查字,認(rèn)識(shí)的字和不認(rèn)識(shí)的字都可直接翻頁查字,提高查字速度。
文檔編號(hào)B42D1/00GK101224680SQ20081001376
公開日2008年7月23日 申請(qǐng)日期2008年1月11日 優(yōu)先權(quán)日2008年1月11日
發(fā)明者徐洪常 申請(qǐng)人:徐洪常
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1