一種模塊化筆畫編碼漢字對應識別的方法
【專利摘要】一種模塊化筆畫編碼漢字對應識別的方法,屬于漢字筆畫編碼領域,其特征在于以模塊化方式壓縮漢字字形二維性,進行編碼排列,從而解決筆畫編碼是漢字其存在重碼、不可讀性的缺點;補充完善現(xiàn)有輸入法缺少一種符合我們漢字書寫習慣的,簡單準確的筆畫形式輸入法的情況;改變現(xiàn)在漢語字典存在查詢漢字步驟繁雜和不合理性,且拼音排版使多音字分開編排的不適用性。
【專利說明】
一種模塊化筆畫編碼漢字對應識別的方法
技術領域:
[0001] 本發(fā)明涉及一種用模塊化的筆畫編碼漢字的方法,尤其涉及用模塊化的筆畫直接 查詢和輸出漢字的方法。
【背景技術】:
[0002] 漢字的字體是字義和字音的最終載體,筆畫是漢字字形的最小組成單位,而漢字 的基礎筆畫樣式是有限的,這使得筆畫在計算機編碼中可以用單字節(jié)表示。
[0003] 過去,漢字用筆畫編碼存在著兩大方面的問題:一、相比于現(xiàn)在用Unicode字符集 UCS-2標準2個字節(jié)編碼漢字的方式,因為漢字筆畫數(shù)平均遠多于2劃,所以表示一個漢字的 編碼字節(jié)遠多于2個字節(jié),對計算機硬件要求高的缺點;二、漢字的字形是一個方塊的二維 圖形,直接用筆畫編碼無法解決重碼問題,并且筆畫編碼后的一條字符串無法辨識成二維 的字形?;谝陨蟽牲c,筆畫編碼在漢字編碼中一直沒有起色。
[0004] 現(xiàn)在隨著計算機電子產(chǎn)業(yè)與信息傳輸技術的迅猛發(fā)展,在我國網(wǎng)絡光纖布設已達 到光纖到戶的覆蓋率,在無線傳輸方面,4G網(wǎng)絡正在緊鑼密鼓的普及中,傳輸速度可達 100Mbps,相當于12.5Mb/s。在計算機處理核心上,超級計算機的計算速度達到每秒千萬億 次,計算機總線上最新使用PCI-E 3.0單信道帶寬已達lGb/s。所以在計算機上使用筆畫編 碼的漢字所需的性能已經(jīng)富裕很多了。
[0005] 我們使用的最多的三種輸入法:拼音輸入法、五筆輸入法、筆畫輸入法。拼音輸入 法由于其是我們一直使用的拼音習慣得于普遍使用,但因為其沒有打字縱深往往我們打完 拼音還是沒有我們要的字,再翻頁查看很費時間;五筆輸入法,重碼少,輸入速度快,但是字 根難記,還要非常熟悉字根在鍵盤上的布局,除了專業(yè)的打字員以外,很少有人認真學習五 筆輸入法;筆畫輸入法簡單易學,是初次學習打字的最易輸入法,但其由于筆畫少,導致重 碼較多,難字偏字難打,多字連打能力差,只適用于手機這些小輸入設備上。
[0006] 在我們每一個國人學習漢字時,常遇到不認識的字需要去查字典,但因為字典是 拼音排版的,而不認識的字怎么找音來查呢!這使得拼音的排版方式等于零作用,再進一步 我們只能使用筆畫查詢方法,找了部首,再數(shù)部首筆畫,再找到該部首所在的頁,然而我們 還得數(shù)這個字的筆畫數(shù),最后在一群小字中找到該字所在頁碼數(shù),終于翻到查看了該字的 信息,但看到最后一行寫了一個拼音再加個頁碼,還是多音字!在這過程中我們體驗到漢語 字典查詢的步驟繁雜和不合理性。
[0007] 以上所述現(xiàn)有技術的缺點:筆畫編碼是漢字單字節(jié)編碼的關鍵,但其存在重碼、不 可讀性;現(xiàn)有輸入法缺少一種符合我們漢字書寫習慣的,簡單準確的筆畫形式輸入法;漢語 字典存在查詢漢字步驟繁雜和不合理性,且拼音排版使多音字分開編排的不適用性。
【發(fā)明內容】
:
[0008] 本發(fā)明所要解決的問題在于提供一種根據(jù)漢字字形組成結構,易記憶好學習的, 符合漢字標準書寫習慣的漢字筆畫分揀編碼方法,創(chuàng)造新的漢字筆畫編碼方法在計算機漢 字編碼、輸入法和漢字字典中運用。
[0009] 為達到上述目的,本發(fā)明提供一種模塊化筆畫編碼漢字的方法,將漢字的方塊形 字形按照不同的分割方式分成13種模塊類型,再按照各模塊類型中各小模塊內字形用筆畫 編碼,由漢字是從左到右、從上到下的書寫順序將各小模塊排列,加上開始的模塊類型碼和 各小模塊段碼的段點,組成一個漢字完整的筆畫編碼,所述漢字模塊化筆畫編碼步驟如下:
[0010] (1)將漢字方塊字形按照不同的分割方式,把漢字字形歸納分類為13種標準的模 塊類型,模塊類型如下:
[0011] a、"一"型模塊類,代表簡單字體,字形為一塊不可分割的漢字模塊類型,所含漢字 一般為多模塊類型的組成基礎。
[0012] b、"二"型模塊類,代表漢字字形由上下兩塊模塊組成,上下模塊中字形不可再分, 只可從中間分割的漢字模塊類型。
[0013] c、"三"型模塊類,代表漢字字形由上中下三模塊組成,按書寫筆畫順序為由上而 下,一塊一塊,三塊以上也歸納為此類型,不作增加。
[0014] d、"豎二"型模塊類,代表漢字字形由左右兩個模塊組成,各小模塊中字形不可再 分割的模塊類型。
[0015] e、"豎三"型模塊類,代表漢字字形由左中右三模塊組成,按書寫筆畫順序為從左 到右的模塊類型。
[0016] f、"右二"型模塊類,代表漢字字形主體分為左右兩部分,而右邊可再分為上下兩 部分,不可再分為兩部以上的模塊類型。
[0017] g、"左二"型模塊類,代表漢字字形主題分為左右兩部分,而左邊可先分為上下兩 部分,不可再分為兩部以上的模塊類型,其與"右二"型相反。
[0018] h、"右三"型模塊類,代表漢字字形主體分為左右兩部分,而右邊可再分為上中下 三部分,按書寫順序從左到右,再從上到下,可分三部以上也歸入該模塊類型。
[0019] i、"左三"型模塊類,代表漢字字形主體分為左右兩部分,而左邊可先分為上中下 三部分,按書寫順序從上到下,再從左到右,可分三部以上也歸入該模塊類型,其實與"右 三"相反。
[0020] j、"上二"型模塊類,代表漢字字形主體分為上下兩部分,而上部分可先分為左右 兩小部分,按書寫順序是從左到右,再從上到下,上部不可再分兩塊以上的模塊類型。
[0021] k、"下二"型模塊類,代表漢字字形主體分為上下兩部分,而下部分可分為左右兩 小部分,按書寫順序是從上到下,再從左到右,下部不可再分為兩塊以上的模塊類型,與"上 二"型相反。
[0022] 1、"上三"型模塊類,代表漢字字形主體分為上下兩部分,而上部可先分為左中右 三小部分,按書寫順序是從左到右,再從上到下的模塊類型。
[0023] m、"下三"型模塊類,代表漢字字形主體分為上下兩部分,而下部可分為左中右兩 小部分,按書寫順序是從上到下,再從左到右的模塊類型,與"上三"型相反。
[0024]總共組成13個模塊類型,模塊類型間可以互相組合形成別的類型,從而由這13個 模塊類型映射所有的字形,13模塊類型數(shù)量不多,規(guī)律明顯,容易記憶,將模塊類表現(xiàn)為二 維圖形,如圖1所示。
[0025]由于漢字是中華五千年文化的結晶,其字形多種多樣,并不按照固定的模式創(chuàng)造 演變的,所以本模塊化筆畫編碼漢字方法總結了6條分割字形為模塊類型的規(guī)則:
[0026] 1、能分就分:根據(jù)漢字筆畫不重疊穿插的部分,先將漢字字形分割成各小塊,再對 比上面13種模塊類型,找到最合適的那個。
[0027] 2、能分先分:存在一些字體,主體上下或左右部,按照第一原則都是可以分割的, 就先分能分的,按照筆畫書寫順序。
[0028] 3、當字體比較復雜,由多種模塊類型組成時,將模塊數(shù)多的保留,少的壓縮成以模 塊,再與上面模塊類對比。
[0029] 4、只有一筆不與字形相交時,不予分割,除橫豎筆畫部,盡可能的讓前面單部筆畫 多。
[0030] 5、主體是左右或者上下部分割時,第一部是部首偏旁時不予分割,但部首原字滿 足其它分割條件的可以予以分割。
[0031] 6、所有分割都按照字體標準書寫順序,對字形進行模塊化分割,當看似左右或上 下分,但其起始筆畫與結束筆畫完成在相同一部時,不予分割。
[0032] (2)完成模塊化分割字形后,第二步就是按筆畫順序用筆畫編碼各小模塊,作為各 運用的方法:筆畫編碼表如下:
[0034] 為了表示各筆畫在編碼段中的位置,本發(fā)明在這里添加"段點"碼,此用于二維編 碼段分段使用,符號暫時用","的形狀替代,這樣一個完整的模塊化筆畫編碼為"模塊類型 碼+筆畫編碼段(、、、,、、、,、、、)",這樣一個漢字的編碼組成中第一個字節(jié)碼擁有其二維圖 形的信息,后面的編碼擁有其筆畫的信息,從而最大可能的減少了漢字筆畫編碼的相同筆 畫不同字形的重碼問題,且具有了對編碼一定的反向可讀性。
[0035] 根據(jù)不同運用情況選擇不同筆畫編碼組合:
[0036] 1、第一個運用方面是計算機編碼,其要求沒有重碼,建立漢字與編碼一一對應的 關系,雖然模塊化筆畫編碼已經(jīng)將重碼減少到最小可能了,但是因為模塊化也只是將大塊 變小塊,小塊也是存在它的二維圖形性的,由此本發(fā)明針對此因素增加了 "形變碼",符號暫 時由的形狀替代,只要在相同筆畫不同字形的其中一個的編碼后加一個形變碼加以區(qū) 分,這樣就徹底的消除了模塊化筆畫編碼的重碼問題。因為模塊化筆畫編碼的漢字其是由 多個單字節(jié)編碼組成,所以其沒有現(xiàn)在雙字節(jié)編碼的漢字的亂碼問題。
[0037] 模塊化筆畫編碼漢字的最大優(yōu)勢是可更新性,在一個字還沒有被錄入到電腦編碼 中時,我們完全可以先將其編碼按照模塊化編碼漢字的方法全部打出來,數(shù)據(jù)按此形式儲 存,等該字體被錄入到電腦系統(tǒng)中后,其是按照相同的模塊化編碼的方法錄入進來,所以該 存在的編碼段從此刻開始就會完全的顯示出來了。
[0038] 2、第二在漢語字典上跟據(jù)基礎的模塊化筆畫編碼將每個字進行編碼,先把各種模 塊類進行歸類,相同模塊類的排版在一起(如圖2所示),然后使用上表中的第一列和第三列 對應關系(用0~9的十個阿拉伯數(shù)字表示十種類型筆畫),將每個模塊化筆畫編碼段的第一 段和第二段前三個編碼用表格第一列的數(shù)字表示(一型模塊類只轉換一段),形成兩個三位 數(shù),最后同模塊類中漢字先按第一模塊的三位數(shù)字從小到大排版,當?shù)谝荒K三位數(shù)相同 時,相同的字再按第二模塊的三位數(shù)從小到大排版(如圖3所示),形成由模塊化筆畫編碼漢 字方法的新式字典。
[0039] 3、第三在輸入法上,因為輸入法不需要唯一的編碼性,所以本發(fā)明歸納出十種類 型的筆畫與字典的歸納類型是相輔相成的,將"一、二、三、豎二、豎三、右二、左二、右三、左 三、上二、下二、上三、下三"13種模型類、"一(橫)、1(豎)、J(撇)人(捺)、、(點)、爹(鉤變)、丄 (豎變)、>(撇變)、1(橫豎變)、7(橫折變)"十種筆畫類和",(段點)"總計24個鍵位融入到 現(xiàn)有鍵盤。
[0040] 其中 "三、二、一、豎二、豎三"對映鍵盤上"QWERT"五個鍵位,"上二、下二、右三、左 三"對映鍵盤上"ZXCV"四個鍵,"上三、下三"對映"YB"鍵位,"右二、左二"對映"NM"鍵位, (撇變)、)(撇)、、(點)、一(橫)、^ (橫豎變)、7 (橫折變)"對映"ASDFGH"六個鍵位," (豎變)、 丨(豎)、事(鉤變)八(捺)"對映"UI幾"四個鍵位,",(段點)"對映"K"鍵位,預留"0P"鍵位放"〈 > "小于大于號,方便編程人員使用,完全應用到英文26字母鍵。
[0041 ]模塊化筆畫編碼的輸入法,按照字典的查詢法相同的步驟,先打模塊類型碼,確認 漢字所屬類型,再敲三筆漢字相關筆畫的筆畫類鍵(一型只能繼續(xù)輸筆畫縮小查詢范圍), 再敲"段點"鍵,然后輸入三筆,若還沒有得到需要的漢字,可以繼續(xù)敲筆畫或者換第三小模 塊筆畫查詢,通過查詢該模塊類中都滿足條件的漢字,從而輸出漢字。
【附圖說明】:
[0042]圖1是漢字模塊化圖;
[0043]圖2是模塊化漢字字典側面圖;
[0044]圖3是模塊化漢字字典漢字解析索引布局圖;
【具體實施方式】
[0045]下面結合具體實施例對本發(fā)明進一步詳細說明。
[0046] -種模塊化筆畫編碼漢字的方法,將漢字的方塊形字形按照不同的分割方式分成 13種模塊類型,再按照各模塊類型中各小模塊內字形用筆畫編碼,由漢字是從左到右、從上 到下的書寫順序將各小模塊排列,加上開始的模塊類型碼和各小模塊段碼的段點,組成一 個漢字完整的筆畫編碼,所述漢字模塊化筆畫編碼步驟如下:
[0047] (1)將漢字方塊字形按照不同的分割方式,把漢字字形歸納分類為13種標準的模 塊類型,模塊類型如下:
[0048] a、"一"型模塊類,代表簡單字體,字形為一塊不可分割的漢字模塊類型,所含漢字 一般為多模塊類型的組成基礎。
[0049] 如這些字:一、乙、十、丁、廠、七、人、入、九等字體,結構簡單不能分割字形的。
[0050] b、"二"型模塊類,代表漢字字形由上下兩塊模塊組成,上下模塊中字形不可再分, 只可從中間分割的漢字模塊類型。
[0051] 如"雷",可以分割為上下兩個模塊,分別由"雨"和"田"的筆畫構成,相同類型的有 胃、舅、需等。
[0052] c、"三"型模塊類,代表漢字字形由上中下三模塊組成,按書寫筆畫順序為由上而 下,一塊一塊,三塊以上也歸納為此類型,不作增加。
[0053]如"岸",可以分割為上中下三模塊,由筆畫"山"、"廠"和"干"組成,而"喜"字,最多 可以由上而下分為四部,但因為限定了模塊類數(shù)不作增加,所以仍然屬于"三"型。
[0054] d、"豎二"型模塊類,代表漢字字形由左右兩個模塊組成,各小模塊中字形不可再 分割的模塊類型。
[0055] 如"的",可以分為左右兩模塊,由筆畫"白"和"勺"組成,相同類型的還有比、葉、鉤 等。
[0056] e、"豎三"型模塊類,代表漢字字形由左中右三模塊組成,按書寫筆畫順序為從左 到右的模塊類型。
[0057]如"斑",可分為左中右三模塊,各模塊筆畫由"王"、"文"和"王"組成,相同類型的 有班、搬、辯等
[0058] f、"右二"型模塊類,代表漢字字形主體分為左右兩部分,而右邊可再分為上下兩 部分,不可再分為兩部以上的模塊類型。
[0059] 如"貓",主體分左右兩部分,右邊分上下兩部分,筆畫由左到右,在從上而下。
[0060] g、"左二"型模塊類,代表漢字字形主題分為左右兩部分,而左邊可先分為上下兩 部分,不可再分為兩部以上的模塊類型,其與"右二"型相反。
[0061 ]如"敏",主體分左右兩部分,左邊可先分為上下兩部,筆畫順序從上到下,再從左 到右。
[0062] h、"右三"型模塊類,代表漢字字形主體分為左右兩部分,而右邊可再分為上中下 三部分,按書寫順序從左到右,再從上到下,可分三部以上也歸入該模塊類型。
[0063] 如"掠",主體分左右兩部,右部可分為上中下三部,筆畫書寫順序從左到右,再從 上到下。
[0064] i、"左三"型模塊類,代表漢字字形主體分為左右兩部分,而左邊可先分為上中下 三部分,按書寫順序從上到下,再從左到右,可分三部以上也歸入該模塊類型,其實與"右 三"相反。
[0065]如"朝",主體分左右兩部,左部可先分為上中下三部,筆畫書寫順序從上到下,再 從左到右,為"十"、"日"、"十"、"月"。
[0066] j、"上二"型模塊類,代表漢字字形主體分為上下兩部分,而上部分可先分為左右 兩小部分,按書寫順序是從左到右,再從上到下,上部不可再分兩塊以上的模塊類型。
[0067] 如"叢",筆畫由兩個"人"與"一"組成,上邊兩部,下一部,書寫順序是從左到右,再 從上到下。
[0068] k、"下二"型模塊類,代表漢字字形主體分為上下兩部分,而下部分可分為左右兩 小部分,按書寫順序是從上到下,再從左到右,下部不可再分為兩塊以上的模塊類型,與"上 二"型相反。
[0069]如"眾",筆畫由三個"人"組成,書寫順序是從上到下,再從左到右。
[0070] 1、"上三"型模塊類,代表漢字字形主體分為上下兩部分,而上部可先分為左中右 三小部分,按書寫順序是從左到右,再從上到下的模塊類型。
[0071] 如"樊",上部可分三模塊,下部一塊,按書寫順序是從左到右,再從上到下。
[0072] m、"下三"型模塊類,代表漢字字形主體分為上下兩部分,而下部可分為左中右兩 小部分,按書寫順序是從上到下,再從左到右的模塊類型,與"上三"型相反。
[0073]如"雁",主體分為上下兩部,下部可再分為左中右三部,筆畫書寫順序是從上到 下,再從左到右。
[0074]總共組成13個模塊類型,模塊類型間可以互相組合形成別的類型,從而由這13個 模塊類型映射所有的字形,13模塊類型數(shù)量不多,規(guī)律明顯,容易記憶,將模塊類表現(xiàn)為二 維圖形,如圖1所示。
[0075] 由于漢字是中華五千年文化的結晶,其字形多種多樣,并不按照固定的模式創(chuàng)造 演變的,所以本模塊化筆畫編碼漢字方法總結了6條分割字形為模塊類型的規(guī)則:
[0076] 1、能分就分:根據(jù)漢字筆畫不重疊穿插的部分,先將漢字字形分割成各小塊,再對 比上面13種模塊類型,找到最合適的那個。
[0077] 2、能分先分:存在一些字體,主體上下或左右部,按照第一原則都是可以分割的, 就先分能分的,按照筆畫書寫順序。
[0078] 3、當字體比較復雜,由多種模塊類型組成時,將模塊數(shù)多的保留,少的壓縮成以模 塊,再與上面模塊類對比。
[0079] 4、只有一筆不與字形相交時,不予分割,除橫豎筆畫部,盡可能的讓前面單部筆畫 多。
[0080] 5、主體是左右或者上下部分割時,第一部是部首偏旁時不予分割,但部首原字滿 足其它分割條件的可以予以分割。
[0081] 6、所有分割都按照字體標準書寫順序,對字形進行模塊化分割,當看似左右或上 下分,但其起始筆畫與結束筆畫完成在相同一部時,不予分割。
[0082] 根據(jù)上面6條進行漢字模塊化分揀實例:"能"字按照第一規(guī)則其左右兩部都可以 上下分割,但因為有第二條所以其分揀為"左二"模塊類字;"良"根據(jù)第四條不分為"、"和 "艮",而"疆",右部三小部筆畫,"一"與"田"一起放一部,最后一部剩"一";"贏"字,按一規(guī) 則上部可分上下,下部可分左中右,由"二"型和"豎三"型堆疊形成,比較復雜難區(qū)分,但再 按第三條規(guī)則,按單方向多模塊的保留,壓縮模塊少的,所以"贏"字被分揀為"下三"型,相 同的油"攀"分為"上三"型;偏旁部首是我們漢字的重要組成部分,按第五條規(guī)則,模塊化不 分第一偏旁部首的,如"筆",竹子頭不予分割,而"竹"本字分為"豎二"型;如"可",不能分為 "丁"和"口",其不符合漢字書寫順序,按規(guī)則六,其被分為"一"型。
[0083] (2)完成模塊化分割字形后,第二步就是按筆畫順序用筆畫編碼各小模塊,作為各 運用的方法:筆畫編碼表如下:
[0086]為了表示各筆畫在編碼段中的位置,本發(fā)明在這里添加"段點"碼,此用于二維編 碼段分段使用,符號暫時用","的形狀替代,這樣一個完整的模塊化筆畫編碼為"模塊類型 碼+筆畫編碼段(、、、,、、、,、、、)",這樣一個漢字的編碼組成中第一個字節(jié)碼擁有其二維圖 形的信息,后面的編碼擁有其筆畫的信息,從而最大可能的減少了漢字筆畫編碼的相同筆 畫不同字形的重碼問題,且具有了對編碼一定的反向可讀性。
[0087] 根據(jù)不同運用情況選擇不同筆畫編碼組合:
[0088] 1、第一個運用方面是計算機編碼,其要求沒有重碼,建立漢字與編碼一一對應的 關系,雖然模塊化筆畫編碼已經(jīng)將重碼減少到最小可能了,但是因為模塊化也只是將大塊 變小塊,小塊也是存在它的二維圖形性的,由此本發(fā)明針對此因素增加了 "形變碼",符號暫 時由的形狀替代,只要在相同筆畫不同字形的其中一個的編碼后加一個形變碼加以區(qū) 分,這樣就徹底的消除了模塊化筆畫編碼的重碼問題。因為模塊化筆畫編碼的漢字其是由 多個單字節(jié)編碼組成,所以其沒有現(xiàn)在雙字節(jié)編碼的漢字的亂碼問題。
[0089] 模塊化筆畫編碼漢字的最大優(yōu)勢是可更新性,在一個字還沒有被錄入到電腦編碼 中時,我們完全可以先將其編碼按照模塊化編碼漢字的方法全部打出來,數(shù)據(jù)按此形式儲 存,等該字體被錄入到電腦系統(tǒng)中后,其是按照相同的模塊化編碼的方法錄入進來,所以該 存在的編碼段從此刻開始就會完全的顯示出來了。
[0090]如"工、土、士"三字,它們都是屬于相同的"一"型模塊類,筆畫順序都是橫豎橫,這 是模塊化筆畫的最小組成單位了,還是有重碼問題,所以只能增加形變碼加以區(qū)分。 _ ] "工,,編碼為:"一,,型碼+ "一丨一";
[0092] "土,,編碼為:"一,,型碼+"一丨一*,,;
[0093] "士,,編碼為:"一,,型碼+"一丨一**,,;
[0094] "胃"與"胄"的編碼區(qū)別:
[0095] "胃,,編碼為:"二,,型碼+ "丨1 一丨一,門一一";
[0096] "胄"編碼為:"二"型碼+"丨]一丨一,n-一*";
[0097] 2、第二在漢語字典上跟據(jù)基礎的模塊化筆畫編碼將每個字進行編碼,先把各種模 塊類進行歸類,相同模塊類的排版在一起(如圖2所示),然后使用上表中的第一列和第三列 對應關系(用0~9的十個阿拉伯數(shù)字表示十種類型筆畫),將每個模塊化筆畫編碼段的第一 段和第二段前三個編碼用表格第一列的數(shù)字表示(一型模塊類只轉換一段),形成兩個三位 數(shù),最后同模塊類中漢字先按第一模塊的三位數(shù)字從小到大排版,當?shù)谝荒K三位數(shù)相同 時,相同的字再按第二模塊的三位數(shù)從小到大排版(如圖3所示),都相同即按筆畫少的字排 前面,形成由模塊化筆畫編碼漢字方法的新式字典。
[0098] 對"給"進行查詢,過程為:首先對其進行分揀,找出其屬于的模塊類型,從左到右, 從上到下,按照筆畫其歸屬于"右二"型,然后對其第一和第二模塊前三筆畫編號,對照上表 第一和第三列得到為"772"和"230",現(xiàn)在開始翻字典,首先翻到"右二"型模塊類區(qū)域,再按 照第一模塊的"772"找查詢編碼區(qū),按數(shù)字大小從小到大往后翻,直到找到該數(shù)值或相鄰數(shù) 值得區(qū)域,若在此區(qū)域范圍很大,相同字很多,可以重復此步驟查詢第二模塊編號"230"的, 找到該字區(qū)域,從筆畫數(shù)少的查起,很快就能得到需要的字了。相比于現(xiàn)有字典的查找方 式,本發(fā)明提供的更加簡潔直觀,并且本例中"給"是多音字,本方法查到的是按筆畫排序 的,多音會整合在一個字下。
[0099] 3、第三在輸入法上,因為輸入法不需要唯一的編碼性,所以本發(fā)明歸納出十種類 型的筆畫與字典的歸納類型是相輔相成的,將"一、二、三、豎二、豎三、右二、左二、右三、左 三、上二、下二、上三、下三"13種模型類、"一(橫)、丨(豎)、j (撇)人(掠)、、(點)J(鉤變)、Jl (豎變)、>(撇變)、1(橫豎變)、7(橫折變)"十種筆畫類和",(段點)"總計24個鍵位融入到 現(xiàn)有鍵盤。
[0100] 其中 "三、二、一、豎二、豎三"對映鍵盤上"QWERT"五個鍵位,"上二、下二、右三、左 三"對映鍵盤上"ZXCV"四個鍵,"上三、下三"對映"YB"鍵位,"右二、左二"對映"NM"鍵位, (撇變)、)(撇)、、(點)、一(橫)、1 (橫豎變)、7 (橫折變)"對映"ASDFGH"六個鍵位," JU豎 變)、丨(豎)、事(鉤變)八(捺)"對映"UI幾"四個鍵位,",(段點)"對映"K"鍵位,預留"0P"鍵位 放"〈>"小于大于號,方便編程人員使用,完全應用到英文26字母鍵。
[0101] 模塊化筆畫編碼的輸入法,按照字典的查詢法相同的步驟,先打模塊類型碼,確認 漢字所屬類型,再敲三筆漢字相關筆畫的筆畫類鍵(一型只能繼續(xù)輸筆畫縮小查詢范圍), 再敲"段點"鍵,然后輸入三筆,若還沒有得到需要的漢字,可以繼續(xù)敲筆畫或者換第三小模 塊筆畫查詢,通過查詢該模塊類中都滿足條件的漢字,從而輸出漢字。
[0102] 相比于字典的查詢,輸入法就更加便捷快速了,相同"給",輸入法只要敲打"右 二"、">(撇變)"、4 (撇變)"、"J (撇)"、",(段點)"、"J(撇)"、M捺)"、"一(橫)"八個鍵,等 于敲"NAASKSLF"八個鍵,在打字過程中計算機不斷的查詢縮小范圍,直到打字欄顯示該字, 并成功輸出,上述打完還沒有出現(xiàn),可以打其第三模塊筆畫,最終找到該字。
[0103]相比于現(xiàn)有的拼音輸入法,模塊化筆畫輸入法擁有更有打字縱深,不需要翻查詢 頁,直到打到該字為止,其遇到不會讀的字,也不會如拼音輸入法一樣無能為力;相比于五 筆輸入法,模塊化筆畫輸入法,更加好記,易學易懂;相比于筆畫輸入法,模塊化筆畫輸入法 支持更多的漢字,可連續(xù)拼打。最有特色的是其有模塊化筆畫編碼漢字體系由上而下的支 持。
【主權項】
1. 一種基于筆畫編碼的模塊化筆畫編碼漢字對應識別的方法,將漢字的方塊形字形按 照不同的分割方式分成13種模塊類型,再按照各模塊類型中各小模塊內字形用筆畫編碼, 由漢字是從左到右、從上到下的書寫順序將各小模塊排列,加上開始的模塊類型碼和各小 模塊段碼的段點,組成一個漢字完整的筆畫編碼,所述漢字模塊化筆畫編碼步驟如下: (1) 按照字形分割將漢字類型分為:"一"型,"二"型,"三'型,"豎二"型,"豎三'型,"右 二"型,。左二"型,。右三'型,。左三'型,。上二"型,。下二"型,。上三'型和"下三'型13種模塊 類型; (2) 跟據(jù)不同的編碼集,應用于計算機編碼、字典分類排序和筆畫輸入法編碼,組成查 詢和輸出的漢字編碼。2. 根據(jù)權利1所述的模塊化筆畫編碼漢字對應識別的方法,其特征在于:所述漢字按照 書寫順序對各模塊進行筆畫編碼,各應用方向的筆畫編碼對應如下表:3. 根據(jù)權利要求1所述模塊化筆畫編碼漢字對應識別的方法,其特征在于:所述計算機 編碼,建立漢字與編碼一一對應的關系,對相同模塊類相同筆畫的重碼字,添加"形變碼 (*)"加 W區(qū)分,由13種模塊類型碼、28種基礎筆畫碼、形變碼和段點碼按漢字筆畫書寫順序 進行組合,形成完整的漢字計算機編碼。4. 根據(jù)權利要求1所述模塊化筆畫編碼漢字對應識別的方法,其特征在于:所述漢字字 典排序,建立由模塊化類型分煉,由第一和第二小模塊前=筆筆畫,對應筆畫編碼表得到其 兩組=位數(shù)值,按其數(shù)值由小到大排序的模式。5. 根據(jù)權利要求1所述模塊化筆畫編碼漢字對應識別的方法,其特征在于:所述筆畫輸 入法,將"一、二、S、豎二、豎S、右二、左二、右S、左S、上二、下二、上S、下13種模型 類、"一(橫)、|(豎)、j(撇)八(掠)、、(點)、* (鉤變)a (豎變)、>(撇變)、1(橫豎變)、7 (橫折變r十種筆畫類和",(段點r總計24個鍵位融入到現(xiàn)有鍵盤: 其中"=、二、一、豎二、豎三'對映鍵盤上"QWERr五個鍵位,"上二、下二、右=、左三'對 映鍵盤上"zxcr四個鍵,"上S、下S "對映"YB"鍵位,"右二、左二"對映"NM"鍵位/'^ (撇 變)、j (撇)、、(點)、一(橫)、1 (橫豎變)、7 (橫折變r對映"ASDF郵'六個鍵位/'丄(豎變)、I (豎)、李(鉤變)、、(掠)"對映"UIJL"四個鍵位,",(段點)"對映"K"鍵位,預留"0P"鍵位放"< 〉"小于大于號,完全應用到英文26字母鍵; 其打字方式為先打模塊類型鍵,再打筆畫鍵,跳模塊按"段點"鍵,要打下一模塊,再按 "段點"鍵,最多打完該模塊類模塊數(shù),查詢輸出漢字。
【文檔編號】G06F3/023GK105912139SQ201610216758
【公開日】2016年8月31日
【申請日】2016年4月6日
【發(fā)明人】金云中
【申請人】金云中