亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

九筆特征漢字編碼的制作方法

文檔序號:6600532閱讀:526來源:國知局
專利名稱:九筆特征漢字編碼的制作方法
技術(shù)領(lǐng)域
本發(fā)明屬于漢字編碼(下簡稱九筆特征碼),以下第一、二兩點較系統(tǒng)地評述了目前漢字編碼的技術(shù)狀況和本發(fā)明的目的,第三、四、五、六點是本發(fā)明的要點和實現(xiàn)方法,第七點列舉了本發(fā)明的優(yōu)越性。
一、目前漢字編碼所存在的問題及發(fā)明九筆特征碼的目的漢字編碼指的是對每個漢字按一定的規(guī)則用若干個數(shù)字、字母等進行表示。例如電報碼就是利用四位十進制數(shù)表示的,新華字典是按拼音字符編排的,屬于拼音編碼。
隨著“中文電腦化”的日益普及,社會對漢字編碼提出了更高更新的要求,漢字編碼不只是用于查字,更主要的是用于在計算機鍵盤上對漢字進行輸入,這就要求漢字編碼必須是一種記憶量少、規(guī)律性強、操作簡便、好學易記的漢字的另一種表示型式。
近十多年來,人們孜孜以求,然而提出的五百余種編碼方案,雖經(jīng)多次優(yōu)選,仍然和人們理想中的編碼方案相差一段較大的距離。例如拼音碼重碼多,輸入速度慢,不適于全漢字。
自然雙拼碼記憶量大,思維不順暢(用f、h、u等字母分別代替en、ang、sh等字母串,是一種思維扭曲,記憶十分別扭,有害正常思維,容易產(chǎn)生疲勞、煩燥),不適于全漢字。
五筆字型漢字拆分不規(guī)范,記憶量太大,末筆字型識別碼造成的不定記憶(例如同樣是末筆的一點,要視左右、上下、混和三種字型而分別安排在Y、U、I三個鍵上)延長了思維時間,造成了思維不順暢,極難形成快速的反射記憶。
表型碼損害了數(shù)字鍵利益,增大了手動距離,象形特征利用得不生動,很多并不合乎人們的口味與習慣,基本構(gòu)字單位大小相差懸殊,無規(guī)律。
表音碼利用漢字和漢字部件的讀音的首字母作為編碼要素,較好地克服了部分記憶難的問題,但對一些無音部件勉強定音,感覺不太自然,對漢字的拆分尺度把握得不好(例如鼠、鼻、鹿等字,使用頻率較低,作為基本單位不拆分,顯然是不合適的),不適于全漢字。
以上所列的幾種編碼,目前具有一定的代表性,他們的缺點都是顯而易見的。那么人們理想中的編碼,應(yīng)該是怎樣的呢?以下列出七點,供參考。
(1)編碼符號最好用標準英文鍵盤上的26個英文字母。
(2)能對全漢字(含繁、簡體)進行編碼。
(3)不依賴漢字的讀音,適合任何人群。
(4)漢字拆分規(guī)范、直觀、簡明。
(5)記憶量小、學習難度低、操作方便。
(6)感覺自然,無別扭記憶。
(7)編碼長度短,分布均勻,重碼少。
以上七點,正是本發(fā)明一九筆特征碼全部能解決的問題,也是本發(fā)明的目的。
九筆特征碼稱得上是一種真正易學好用、便于推廣的漢字編碼無論是專職打字員還是作家、記者、編輯、教師和學生,學習九筆特征碼,都會感到輕松愉快、毫不費力??梢灶A(yù)見,九筆特征碼將會加快計算機在我國的應(yīng)用普及。
二、九筆特征碼的研究過程眾所周知,漢字形體構(gòu)造甚為復(fù)雜,有單部件的,有多部件的,有拼合而成的,有嵌插而成的,有的字只有1筆,有的字多達30多筆,要把這么復(fù)雜的文字用3-4個字母表示,并要達到人們企盼已久的要求,其難度之大,是可想而知的。因此,本人在研究漢字編碼時,首先并不急于實施某一具體構(gòu)思,而是著眼于從總體上進行研究,把握正確的研究方向。毋庸置疑,漢字的發(fā)展,是隨著社會的發(fā)展而一步一步發(fā)展的,那些與人們生存斗爭密不可分最初形成的“第一批”文字一像形文字,隨著歲月的流逝,不斷地構(gòu)成新的文字,形成復(fù)雜的像形。這個發(fā)展過程,連同像形文字本身,就說明了早期的人們在觀察和記載事物時,得益于像形化表示的簡單、明了。雖說這是最初的思維形式,然而卻是最受歡迎、最直觀、最易于記憶的表達方式。今天高度發(fā)達的電腦時代,能否再利用這種像形表達方式對漢字進行編碼呢?利用像形表達方式對漢字進行編碼已有過償試,如表形碼(中國專利,專利號8510556.7)、全仿形鍵盤形符漢字編碼方法(中國專利,專利號88108632.0)、電腦漢字象形編碼法及其鍵盤(中國專利,申請?zhí)?2100557,公告號1067753)、英文/東方文字根象形輸入法(中國專利,申請?zhí)?3103790,公告號1077548)、一種簡易漢字編碼方案及其鍵盤(中國專利,申請?zhí)?4102450,公告號1092536)。但它們并不十分受歡迎,為什么?回顧一下漢字的演變過程,可以說漢字是經(jīng)歷了真正的像形到大致像形到規(guī)范的書寫之形,人們觀察文字時也已從原來的視物像形對比觀察逐漸轉(zhuǎn)移到文字本身的構(gòu)形(方向、筆順、形狀)觀察,漢字再也不是“畫”出來的“像形文字”,而是“寫”出來的“規(guī)范文字”,這些規(guī)范文字,是由許多規(guī)范的固定結(jié)構(gòu)組合而成的,這些固定結(jié)構(gòu)一般都比較簡單、緊湊,許多結(jié)構(gòu)的方向性和順序性對視覺產(chǎn)生較大的影響。這說明單純利用視物像形對比方式對漢字進行編碼是不夠的,必須綜合考慮構(gòu)成漢字的固定結(jié)構(gòu)的方向、筆順、和形狀即綜合特征對漢字進行編碼才合符人們的習慣再看一看編碼符號,26個英文字母,任意取3個,有17576種組合型式,任意取4個,有456976種組合型式。漢字雖然不是26種基本結(jié)構(gòu)組成的,但近似地把特征相似的結(jié)構(gòu)歸為一類,共分為26種類型,則是可以做到的。而26個英文字母本身,都有其各自的特征,這些特征,又是由簡單的1-3筆構(gòu)成的,這就為其特征覆蓋面提供了保證,也就是說,漢字基本結(jié)構(gòu)的26種類型,與26個英文字母形成相關(guān)的對應(yīng)關(guān)系是可能的。
因此,關(guān)鍵的問題是,漢字的基本結(jié)構(gòu),能否按特征相似關(guān)系歸類呢?分析漢字基本結(jié)構(gòu)的構(gòu)字規(guī)律,發(fā)現(xiàn)相似的結(jié)構(gòu)出現(xiàn)在漢字的不同位置,反過來,正因為出現(xiàn)在不同位置,受構(gòu)型的影響,才不會完全相同,正因為特征相似不相同,才會有不同的搭配,這樣,特征相似的結(jié)構(gòu),用一個字母表示,這個字母就被充分利用了(稱為字梁搭配的互補利用原則)。也就是說,漢字的基本結(jié)構(gòu),按特征相似關(guān)系歸類,是理想的歸類方法。實際研究過程中,九筆特征碼在這方面做得相當成功。這是九筆特征碼好于其他各種編碼的第一個關(guān)鍵。
以上從理論上探討了漢字特征化編碼的可能性,那么,前面提到,有的漢字由1筆組成,有的漢字多達30多筆,按基本結(jié)構(gòu)來分,有由1-2個基本結(jié)構(gòu)組成的,有由多達7-8個基本結(jié)構(gòu)組成的。由1-2個基本結(jié)構(gòu)組成的漢字,用1-2個英文字母表示,因字多,位置少,必然出現(xiàn)重碼。對此,許多編碼方案因此而廢棄了一些基本結(jié)構(gòu),或采用了其他一些不直觀的處理方法,結(jié)果造成了整個漢字拆分的不直觀。
九筆特征碼遵重人們的直觀習慣,進一步利用組成這些漢字的特征相似結(jié)構(gòu)的細微差異,引入分類碼與識別碼兩個概念,有效地解決了這個問題,避免了拆分的不直觀,保證了基本結(jié)構(gòu)的完美、規(guī)范。這是九筆特征碼好于其他各種漢字編碼的第二個關(guān)鍵。
以上探討了漢字編碼的研究方向,但在實際研究過程中發(fā)現(xiàn),各種特征相似的結(jié)構(gòu)的分布是很不均勻的,且“特征”本身,也存在著一定的過度性,因此,本人在研究過程中,并不拘泥于局部特征,不先定框框,而是著眼于全局,對各類結(jié)構(gòu)的分布情況進行統(tǒng)計和分析,依據(jù)協(xié)調(diào)互補的原理進行組合,然后再統(tǒng)計、再分析、再拆分、再組合,反反復(fù)復(fù),最后根據(jù)全局的需要,確定對應(yīng)的特征相關(guān)字母。這是九筆特征碼取得成功的第三個關(guān)鍵。
總之,九筆特征碼取得成功的關(guān)鍵在于正確的研究方向和循序漸進的研究過程。
另外,之所以稱為“九筆”,是因為按特征分類,漢字的筆畫,剛好分為九種類型,并可用相關(guān)的英文字母表示,具體如下
三、九筆特征碼基本概念九筆特征碼編碼方案(下簡稱九筆特征碼)把漢字比作房子,正如房子是由磚、梁、瓦構(gòu)成的一樣,漢字也是由一些固定結(jié)構(gòu)的“磚、梁、瓦”構(gòu)造而成的,九筆特征碼將構(gòu)成漢字的“磚、梁、瓦”統(tǒng)稱為漢字的“字梁”。(注意“字梁”是九筆特征碼的概念,與漢字部件、偏旁部首不能完全類同)由于字梁數(shù)目較多,形狀各異,為了用26個英文字母表示特征不同的字梁,九筆特征碼將字梁按一定的構(gòu)形特征和直觀效果即方向、形狀、筆順以及字梁搭配的互補利用原則,將其分為26類,分別與相關(guān)的26個英文字母相對應(yīng),這些相對應(yīng)的字母,就稱為該字梁的分類碼,可見,分類碼相同的字梁具有相同或相似的直觀特征。為了表示分類碼相同的不同字梁,九筆特征碼將每個字梁的讀音(指拼音)或特征讀音的首字母(無特征讀音的用1或其他相關(guān)字母表示)稱為該字梁的識別碼,這樣,每個字梁都可以用26個英文字母表示了。例如字梁“人、大、天”的分類碼都是“A”,而識別碼分別是“R、D、T”,即它們可分別表示為“AR、AD、AT”。
引入分類碼和識別碼是九筆特征碼編碼方案取得成功的重要因素,也是九筆特征碼研究者開拓性思維的一個標志,此為其他編碼方案所不及。繼續(xù)閱讀下文,您會感到研究者用心之良苦,考慮問題之周密、細致、全面,實屬罕見。而作為研究者本人,早已把研究質(zhì)量與規(guī)范漢字的拆分、減輕廣大用戶的學習負擔聯(lián)系起來了。 (來完,見下頁)
四、(一)九筆特征漢字編碼字梁表(續(xù))
(二)幫您閱讀字梁表1. 26類特征及其對應(yīng)的分類碼的簡要說明“A”類以“人”字對稱為引導特征。對稱之形在人們的審美觀念中處于重要地位,將對稱之形收集到一起,順其自然,合乎人們的習慣。26個英文字母,不乏對稱之形,但“A”與“人”最相像,記憶十分自然。
“B”類以“阝”和“尸”為引導特征。 可看著小寫的“b”、“尸”可看成未完成的“B”。
“C”類以“月”和“耳”為引導特征,因月亮和耳朵在人們的記憶中常常是個半圓,這樣就與“C”聯(lián)系起來了。
“D”類以“點橫”開頭為其特征,而“點”讀音(ding)以“D”開頭,另外還可以把“D”看成一個大點,這樣,“D”與“點”就聯(lián)系起來了。
“E”類以“山”和“十”為引導特征?!吧健碧卣餍詮?,與“E”相似,且不受方向影響;“十”是醫(yī)院的標志,與英文字母“E”同音,有助于記憶。
“F”類以“橫下一撇”為引導特征,與“F”有一定的相似之處。
“G”類以“橫下口”和“口中豎”為特征,英文字母“G”“中”有“橫“有“豎”,可以起一定的暗示記憶作用。
“H”類以各種型式的“豎型”結(jié)構(gòu)為其特征,與“H”有直觀聯(lián)系“I”類以“兩橫一豎”為特征,與“I”有直觀聯(lián)系。
“J”類以“豎鉤”為其特征,與“J”有同向協(xié)調(diào)的直觀聯(lián)系。
“K”類以“”和“曰”為特征, 可看成“K”的傾斜型,“曰”可通過“笪”字與“K”聯(lián)系。
“L”類該類字梁的“豎提、豎彎鉤”均較顯眼,與“L”同向協(xié)調(diào),“已”、“巳”與手寫體 相似。
“M”類以“宀”和“皿”為引導特征,該類字梁都給人扁平的感覺,在日常生活中,扁平的東西常用以蓋物遮灰,正好“M”具有這種意味。
“N”類以“艸”和“幾”為引導特征,將“艸”中的一橫順時針傾斜,則變成“N”,“幾”與“n”相似。
“O”類以“口”為引導特征,與“O”相似。
“P”類該類字梁的“橫折”與“P”上的“半圓”同向相似,兩類結(jié)構(gòu)彼此較為協(xié)調(diào)。
“Q”類以“撇上橫”和“口中十”為其特征,“甲”與“Q”有相似之處,其它的可通過“鉀、鈿、鈾、每”與“Q”聯(lián)系。
“R”類以“木”和“戈”為引導特征,該類字梁的方向性容易讓人想到“R”中的最后一捺。
“S”類該類字梁以“撇”起筆為特征,可將“S”看成“撇”的變型。
“T”類以“亻”和“七”為引導特征,“亻”可看成“T”上的一橫向左傾斜,“七”與“t”相似。
“U”類以“匚”、“門”、“王”為引導特征,“匚”、“門”與“U”相似不受方向影響,“王”可通過“閏、匡”與“U”聯(lián)系。
“V”類“兩點”的延伸即可形成“V”字母,“疒、豕、水”上都有“V”的標志。
“W”類三點水旁的水的英文Water以“W”開頭,“也、心、兇、”都有類似于“W”的向上合抱之形。
“X”類以“女”和“又”為引導特征,它們的交叉或延伸線交叉特征最容易讓人想起“X”的交叉之型。
“Y”類以“禾、米、小”為引導特征,可以把“Y”中的一豎向上延伸,然后與該類字梁進行比較。
“Z”類以“纟、厶、之”為引導特征,它們與“Z”有協(xié)調(diào)的同向相似。
以上不可能面面俱到,望讀者在閱讀時仔細比較和分析,充分發(fā)揮自已的想像能力。
2.識別碼確定的簡要說明(1)有音字梁,利用該字梁拼音的首字母作為識別碼。例如人 ren (R) 大da(D)弋yi(Y)于yu(U)豕 shi (S) 厶si(S)豸zhi(Z) 雨yu(U)注意“yu”的“y”不發(fā)音(2)個別有音字梁,利用其特征作為識別碼,避免重碼。例如工gong(I)幾ji(N)干gan(G) 九jiu(J)(3)部首字梁,以部首特征音作為識別碼。例如刂立刀旁(D) 冖平寶蓋(P)虎字頭(H) 攵反文旁(F)(4)變型字梁,利用演化原字音作為識別碼。例如爿pan(P)巳si(S)己ji(J)丬 (P) (S) (J)
(5)特征字梁,利用特征字音作為識別碼。例如 北(B) 亥(H) 皮(P)看(K) 鳥(N) 曹(C)(6)利用特征形狀作為識別碼。例如 (L)(L)(E)匚(C)(7)無音無專一特征字的字梁,用“I”作為識別碼。例如 (I) 春 chun 泰 tai 奉 fan 秦 qin (I) 先 xian 告 gao不用相關(guān)字音作為識別碼,是為了避免不自然的感覺,并可減少記憶。四碼字“I”類字梁較少重疊出現(xiàn)在字首和字尾,“I”以右手中指擊鍵,結(jié)束時感覺自然、平穩(wěn),易于過度,這是選擇“I”的理由。
(8)有些偏旁如“扌”、“亻”,組字較多,識別能力較差,它們拒絕識別,用 表示,個別字梁,也用 表示,目的是避免重碼。例如 刁(PGTT) 司(PGII)總之,識別碼的確定,最大限度地考慮到了避免混淆、減少記憶、減少重碼等多方面。
3.字梁取舍的簡要說明九筆特征碼字梁的取舍是十分講究的,因限于篇幅,以下只舉幾個例子,加以說明。
(1)規(guī)律性強、結(jié)構(gòu)緊湊的部件,一般具有較好的直觀性,并有助于記憶,宜全部收為字梁。例如
“戔、戈、弋、 這九個字梁都屬于“R”類,它們的構(gòu)型,容易讓人想起“R”的捺筆。雖然它們中有些構(gòu)字頻率較低,但如不收入,記憶量反而會增加,有時記多比記少更容易。同樣的情況還有“U”類的“凵、、冂、匚、 ”、“E”類的“山、巾、 、彐、 ”、“Q”類的“甲、田、由、申、 母、毋”等等。26類字梁,幾乎都有這種類似的情況。這正是九筆特征碼記憶量小的關(guān)鍵之一。
(2)結(jié)構(gòu)緊湊、具有較好的直觀性,構(gòu)字頻率雖不高,但再拆分就不直觀的,也收為字梁。例如“S”類的“豸、身”、“Y”類的“不、 ”、“H”類的“片, ”等。
(3)具有兩種特征,不便于歸類,但常因出現(xiàn)在字首,構(gòu)字頻率較高,只好收為字梁。例如“A”類的“貝”、“L”類的“”、“M”類的“穴”等。
(4)構(gòu)字頻率不高,但可縮短碼長,減少重碼,且便于分類的,亦收為字梁。例如“E”類的“右”、“T”類的 等。
總之,字梁表中的每一個字梁,都是經(jīng)過反復(fù)考究后確定下來的。決不多收一個字梁,也決不漏收一個字梁是字梁取舍的總原則。
4.九筆特征碼字梁搭配的簡要說明前面提過,從26個字母中任意取3個字母,有17576種組合型式,如何高效地利用這些位置,是需要費一番腦筋的。九筆特征碼字梁的搭配,采用了協(xié)調(diào)、互補的原則,較好地解決了這個問題。
例如“、 爫”與“曰、日、 ”的搭配,前者幾乎全部出現(xiàn)在字首,后者即多半出現(xiàn)在字中、字尾,前者構(gòu)成的字,高頻字較少,后者構(gòu)成的字,高頻字較多,前者構(gòu)成的字,筆畫較多,即四碼字多,后者構(gòu)成的字,筆畫較少即相對來說三碼字較多,一前一后,一多一少,一高頻一低頻,數(shù)量上合起來恰到好處,無重碼形成之憂,這樣,將“K”這個字母充分地用活了(這就是字梁搭配的互補利用原則)。
再例如“M”類字梁的上中下搭配,扁平形狀的協(xié)調(diào);“P”類字梁的上中下搭配,方向的協(xié)調(diào);“N”類字梁的上下搭配,豎形結(jié)構(gòu)的協(xié)調(diào);“U”類字梁數(shù)量上的搭配,“無方向”的協(xié)調(diào)等等。
又如“扌、氵、艸”是出現(xiàn)在字首頻率較高的三個偏旁,與它們搭配的,幾乎是不出現(xiàn)在字首的字梁;“一”與“蟲”的搭配,由于兩者形狀不同,出現(xiàn)的位置就不一樣,搭配起來,正好互相彌補不足,使字母得到充分利用。
五、九筆特征碼的漢字拆分九筆特征碼的漢字拆分,是在遵重人們的直觀習慣的基礎(chǔ)上,進行研究整理出來的,它把拆漢字比作拆房子,從上至下、從左至右、從外至內(nèi)按書寫順序拆分?,F(xiàn)將拆分規(guī)律總結(jié)如下總原則書寫原則、直觀原則、最小原則。
“書寫原則”就是總體上必須按書寫順序拆分。
“直觀原則”就是在拆分時要注意直觀、自然。
“最小原則”就是每個漢字拆出的字梁的個數(shù)必須最小。
1.拆分規(guī)則為了保證總原則的實施,以下列出拆分規(guī)則
(1)“相似相隨”原理相似相隨原理指的是同一方向彼此協(xié)調(diào)的結(jié)構(gòu)(筆畫)不宜拆散;邊緣連接的結(jié)構(gòu)(如“彐、ユ、曰”等)不宜拆散;雙雙相似的結(jié)構(gòu)不宜拆散;重心平衡結(jié)構(gòu)不宜拆散。例如匆勹 丶 (對,符合同向協(xié)調(diào))勹丿乂 (錯)丑ユ十 (對,符合邊緣連接)土 (錯)史口乂 (對,符合重心平衡) (錯)更一曰乂 (對,符合重心平衡)一  (錯)耕三 井 (對,符合雙雙相似)豐八井 (錯)州 川 (對,符合雙雙相似) (錯)(2)“交不攀連、連不攀散”原理交不攀連指的是相交結(jié)構(gòu)的筆畫不得拆散參與相連或離散筆畫組成字梁,連不攀散指的是相連結(jié)構(gòu)的筆畫不得拆散參與離散筆畫組成字梁。例如矢大 (對,符合交不攀連) 人 (錯)失丿夫 (對,符合交不攀連)大(錯)腦 亠兇 (對,符合交不攀連)月 凵(錯)及丿廴 (對,符合交不攀連)乃(錯)著丷 目 (對,符合連不攀散) 目(錯)南 十冂丷干 (對,符合連不攀散)十 冂十(錯)余人(對,符合連不攀散) (錯)“注”這里的相交,指的是順序性筆畫,不包括隔筆相交,除非合乎最小原則。例如載十 戈車(錯,違反了順序拆分原則) (錯)式弋 (對,符合最小原則)
(3)“順序優(yōu)先”原理順序優(yōu)先指的是依據(jù)書寫順序,先出現(xiàn)的筆畫優(yōu)先組合成字梁。例如矢大 (對,符合順序優(yōu)先)丿天 (錯)合 口 (對,符合順序優(yōu)先) (錯)說明以上三條原理,都是在總原則的指導下總結(jié)出來的,在實際拆分過程中發(fā)生沖突時,應(yīng)該是(3)服從(2),(2)服從(1),各項均不得捏造失去平衡、美觀的字梁。例如武二止 (對)一 (錯,失去平衡)2.拆分舉例(1)常規(guī)拆分(按書寫順序拆分)數(shù)米女攵良、彐 拆扌斤丶(2)非常規(guī)拆分(按書寫順序拆分不能滿足最小原則時,可按非常規(guī)拆分)①對稱拆分恒忄二 亞 ②嵌入拆分夾夫丷 屯七凵歌于口口 人 重 日③插入拆分妻十彐女說明按常規(guī)拆分能滿足最小原則時,則不按非常規(guī)拆分。例如束 囊 丨冖口口 六、九筆特征碼輸入方法1.單字梁字先輸入分類碼,再重疊輸入識別碼,然后補加空格鍵。例如“人”的輸入碼為ARR“心”的輸入碼為WXX
2.雙字梁字先依次輸入分類碼,再重疊輸入首字梁的識別碼,如首字梁屬于 ,即應(yīng)輸入尾字梁的識別碼,首尾字梁都是 ,即以“00”結(jié)束。例如“這”的輸入碼為DZWW“仆”的輸入碼為THBB“香”的輸入碼為YKOO“圭”的輸入碼為IIOO3.多字梁字依次輸入第一、二、三和末位字梁的分類碼即可。
“輕”拆分 工 輸入碼EXI“嘩”拆分口亻 十 輸入碼OTTE“藏”拆分艸廠 輸入碼NFLR“嗅”拆分口丿目丶輸入碼OSCD4.詞組輸入雙字詞組,每字取前二碼;三字詞組,前二字各取一碼,后一字取二碼;多字詞組,取前三位和末位字各一碼。例如“人民”ARLR“形勢”GNJN“解放軍”PIME“膾炙人口”CPAO“中華人民共和國”GTAO5.標點符號及特殊字符的輸入九筆特征碼打算利用26個英文字母鍵加 鍵,產(chǎn)生18278(17576+676+26)個位置,用于輸入標點符號和特殊字符。例如?問(W)號 輸入碼為W “前(Q)雙(S)引號 輸入碼為QS 另外,日語的平假名、片假名也可采用此輸入法。
6.學習鍵的設(shè)置九筆特征碼把?鍵作為學習用鍵。例如“健”的編碼是TEIX,個別地方不清楚時,可以輸入T?IX或??IX或T??X進行檢索。
7.特殊漢字的編碼九筆特征碼把無論用什么方式拆分都不直觀的字進行了特殊處理。例如“凸”可看成 拆分成丨一 編碼為HGTT“凹”可看成拆分成凵 凵 編碼為UUAA8.繁體字與簡體字編碼方法一樣,但應(yīng)注意偏旁對應(yīng)與字梁對應(yīng)。
偏旁對應(yīng)讠—言 饣—飠 钅—金 衤—示 糸—纟字梁對應(yīng)門—門 馬—馬 貝—貝 之—辶 魚—魚車—車 呂— 食 彐 AER 讀讠 大LIVA饍飠丷 丷口LVUO 讀言士罒貝LIMA9.重碼字的處理九筆特征碼碼長短是其優(yōu)點之一,正因為碼長短,出現(xiàn)少量重碼(占3.5%)是難免的,我們不能因為這3.5%的重碼而為其他每個字再加上一識別碼,因此只對重碼字再設(shè)置補充碼。
該讠 人 LDA LDAH(補)(方法補加第一個識別碼)以 丶人 LDA LDAL(補)(方法補加第一個識別碼)嘉士口力口 IOVOIOVP(補)(方法用相區(qū)別的分類碼喜士口口 IOVO 替換末位碼)跪ク廠LPFL LPFZ(補充碼)(方法用相區(qū)別的識詭讠ク廠LPFL別碼替換末位碼)另外,對二級漢字的重碼不設(shè)置補充碼。
10.簡碼的設(shè)置九筆特征碼簡碼的設(shè)置,遵循如下原則(1)一級簡碼(一碼加空格鍵)主要由“的、和”等高頻連接字組成(2)二級簡碼優(yōu)先考慮1000個高頻字,但同樣的情況雙字梁字優(yōu)于四字梁字,四字梁字優(yōu)于三字梁字,重碼字優(yōu)于非重碼字,單用字優(yōu)于詞組字。
另外,對二級漢字不設(shè)置簡碼。
七、九筆特征碼的優(yōu)越性前面提過,九筆特征碼能滿足人們企盼已久的對漢字編碼的七點要求,這是其他漢字編碼方案所望塵莫及的。在這里,我再重復(fù)地提出來,并適當加以說明。
(1)九筆特征碼編碼符號用的是標準英文鍵盤上的26個英文字母。
(2)九筆特征碼能對全漢字(含繁、簡體)進行編碼。
(3)九筆特征碼沒有依賴漢字的讀音,適合任何人群。
(4)與各種拆分型漢字編碼相比,九筆特征碼的拆分是最規(guī)范、最直觀、最簡明的。
九筆特征碼的拆分規(guī)則,是在總結(jié)人們的直觀習慣的基礎(chǔ)上建立的具體細則,它使任何漢字的拆分都“有法可依、有法必依”,不像有的編碼,用“兼顧直觀”這種模糊不定的“規(guī)則”指導拆分,得不出唯一答案,只好設(shè)置容錯碼。
九筆特征碼對漢字拆分直觀、簡明、規(guī)范的另一個原因是字梁本身規(guī)范、緊湊、平衡、美觀,并與字梁分類代碼保持協(xié)調(diào)一致,不像有的編碼,一個字母所代表的結(jié)構(gòu),忽左忽右、忽上忽下、忽大忽小,橫七豎八,亂七八糟。
請比較養(yǎng)丷 UDYJ(五筆)年 十 RHFK(五筆)養(yǎng) VAH (九筆)年 丿QUH(九筆)平一丨 G UHK(五筆)面 冂 三 DMJD(五筆)平干丷 IVGG(九筆)面 FOH(九筆)(5)在各種漢字編碼中,除了漢語拼音編碼外,九筆特征碼的記憶量是最小的,也是最易于學習、操作最方便的。
九筆特征碼字梁數(shù)目雖然不少,但每一類字梁最多是由兩類特征組成,且這兩類也有一定的協(xié)調(diào)性,都與分類碼有或多或少的聯(lián)系?;蛘哒f,九筆特征碼把非常復(fù)雜的大范圍選擇記憶變成了生動的提示記憶。請比較如下記憶量五筆由(M)田(L)甲(L)申(JH)母(XYYI)毋(XFE)九筆由(Q)田(Q)甲(Q)申(Q)母(Q)毋(Q)表形由(Y)田(Q)甲(T)申(F)母(Q)毋(Q)表形碼雖然是利用漢字部件的像形原理,但因沒有遵重人們的直觀習慣,生拼硬湊的成分太多,所以沒有起到應(yīng)有的減少記憶的效果。
九筆特征碼只有字梁、分類碼、識別碼三個概念,一張有規(guī)律的字梁表,幾句非常生動的拆分規(guī)則和最直觀的輸入方法,沒有附加規(guī)則,不需進行字型判斷,比較一下,學習是不是最容易,操作是不是最方便。
(6)九筆特征碼能促使思維有序化九筆特征碼的字母與字梁,總是順其方向,順其自然,如同漢字是由字母組成的一樣。用九筆特征碼輸入漢字時,感覺、記憶均十分自然,九筆特征碼越熟練,思維就越有條理,反應(yīng)就越敏捷,不像有的編碼,給人的思維是“亂”的,特別是別扭記憶和不定記憶,有損害思維的作用。
(7)與各種編碼相比,九筆特征碼的分布是最均勻的,因此其碼長最短,重碼最少,詞組容量最大。
除漢語拼音編碼外,各種編碼的全碼長都是4碼,九筆特征碼也不例外。因此,這里要比較的,實際上是思維長度,即空格鍵的一碼,不屬于思維范疇。九筆特征碼的單字梁字、雙字梁字的識別碼是重疊輸入的,因而只能算一個思維長度(碼)。
為了比較各種編碼的碼符分布均勻情況,這里再引入一個區(qū)間的概念。
表三種漢字編碼碼符分布均勻情況的比較
<p>一般編碼方案都用的是26個英文字母,按四碼計算,它可提供676(26×26)個“區(qū)間”,每個區(qū)間又有676(26×26)個位置,一級漢字共3755個,如果每個區(qū)間容納5.5個漢字,那就比較理想。因此,比較區(qū)間落入的字的個數(shù),即可判斷該編碼的碼符分布均勻情況。分布得越均勻,那么重碼就會越少,簡碼就可以設(shè)置得越多,詞組容量就越大。以下以一級漢字3755(除去多音字剩3705)個為研究對象列表比較如上表上表可以看出,九筆特征碼在將近縮短一個碼長的情況下,仍能保持與其他漢字編碼相近數(shù)目的重碼,可見九筆特征碼的碼符分布均勻情況遠遠超過其他漢字編碼。
權(quán)利要求
1.九筆特征漢字編碼(下簡稱九筆特征碼)與現(xiàn)有的五筆字型等多種漢字編碼一樣,都是將漢字拆分成若干個“塊”(五筆字型稱為“字根”,九筆特征碼稱為“字梁”),然后按一定的方法將這些“塊”進行分類,一般分為26類,并分別用26個英文字母表示(一般編碼方案沒有將其定名,九筆特征碼將其定為分類碼)。對于“塊”數(shù)較多的漢字,這些英文字母(分類碼)就足夠組成編碼,對于“塊”數(shù)較少的漢字,不同的編碼方案采用了不同的處理方法。九筆特征碼的特點在于另將每一個“塊”的讀音(指拼音)的首字母(無讀音的用其他相關(guān)字母)定為識別碼(具體內(nèi)容見下頁字梁表),對于單、雙字梁字,識別碼是組成編碼的后半部分。
2.權(quán)利要求1所述的編碼方法中,漢字拆分成“塊”的方法(規(guī)則),不同的編碼方案具有不同的構(gòu)思,它們一般僅限于常規(guī)拆分,九筆特征碼的特點在于在拆分的三原則(書寫原則、直觀原則、最小原則)的指導下總結(jié)出的三原理(相似相隨原理、交不攀連、連不攀散原理、順序優(yōu)先原理)和常規(guī)拆分以外的非常規(guī)拆分(對稱拆分、嵌入拆分、插入拆分)使?jié)h字(含繁、簡體)的拆分趨于規(guī)范、直觀、簡明、具有唯一性。
3.權(quán)利要求1所述的編碼方法中,漢字拆分成“塊”的數(shù)目較多,它們的歸類,不同的編碼方案采用了不同的方法,九筆特征碼的特點在于,將字梁按其方向、形狀、筆順的綜合特征以及字梁搭配的互補利用原則歸為26類,分別用相關(guān)的26個英文字母表示,稱為分類碼(具體內(nèi)容見下頁字梁表)。 (未完,見下頁)四、(一)九筆特征漢字編碼字梁表(續(xù))
4.權(quán)利要求1所述的編碼方法中,識別碼還可改為用整個漢字的讀音的首字母。
5.根據(jù)權(quán)利要求1所述的編碼方法,權(quán)利要求2所述的拆分方法,權(quán)利要求3所述的分類碼,權(quán)利要求1所述的識別碼,可以①編制字典、詞典或其它書刊目錄,用于查字(含繁、簡體)。②利用現(xiàn)有的電腦技術(shù)制成漢字(含繁、簡體)輸入軟件,用于在計算機鍵盤上對漢字進行輸入和文字處理。
全文摘要
本發(fā)明屬于漢字編碼,它將漢字拆分成若干個“塊”(即“字梁”),并用分類碼與識別碼分別表示每一個字梁,這樣,分類碼(為主)和識別碼(為輔)就構(gòu)成了漢字的編碼。由于分類碼是根據(jù)字梁的方向、形狀、筆順以及字梁的互補組合綜合考慮確定的易于記憶的相關(guān)字母,識別碼即為字梁的讀音的首字母(或相關(guān)字母),使得本發(fā)明有效地解決了漢字編碼“減少記憶與縮短碼長”之間的矛盾,提示該編碼可用于(1)編制字典、詞曲或其他書刊目錄,用于查字。(2)制成漢字輸入軟件,用于漢字輸入。
文檔編號G06F3/023GK1134561SQ9510416
公開日1996年10月30日 申請日期1995年4月28日 優(yōu)先權(quán)日1995年4月28日
發(fā)明者孫基壽 申請人:孫基壽
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1