亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基礎(chǔ)地理信息數(shù)據(jù)中生僻字庫實(shí)現(xiàn)方法

文檔序號(hào):9432665閱讀:628來源:國知局
一種基礎(chǔ)地理信息數(shù)據(jù)中生僻字庫實(shí)現(xiàn)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于測繪與地理信息行業(yè)數(shù)據(jù)生產(chǎn)領(lǐng)域,具體涉及一種基礎(chǔ)地理信息數(shù)據(jù)中生僻字庫實(shí)現(xiàn)方法。
【背景技術(shù)】
[0002]目前在我國基礎(chǔ)地理信息的數(shù)字化生產(chǎn)中,由于全國各地在文化、民族、語言、習(xí)俗、發(fā)音等方面存在著巨大差異,造就了為數(shù)眾多的涉及山川、河流、村莊等地名的生僻字。這些冷僻、不常用、不常見的生僻字,無法通過常規(guī)的字符輸入方式錄入為數(shù)字內(nèi)容,當(dāng)前主要通過拼音替代、數(shù)字編碼等方式記錄,存在著不能直觀對(duì)應(yīng)、編碼無法統(tǒng)一等不足,難以滿足信息準(zhǔn)確表達(dá)和地理信息數(shù)據(jù)快速制圖的需求,主要表現(xiàn)在:
[0003]1、字庫內(nèi)容不全,部分生僻字沒有收錄。由于生僻字?jǐn)?shù)量眾多,識(shí)別困難,且有部分字只有發(fā)音而無明確的字形構(gòu)造。部分相關(guān)的公司、企事業(yè)單位對(duì)此進(jìn)行過收集和整理,也形成了適用于特定范圍內(nèi)的生僻字庫,但相對(duì)于基礎(chǔ)地理信息數(shù)據(jù)中的生僻字實(shí)際使用情況來說,仍然存在著收集不足、字符重復(fù)甚至收錄錯(cuò)誤的情況,不能全面推廣應(yīng)用。
[0004]2、無法直觀顯示字符內(nèi)容,造成識(shí)圖和制圖困難?;A(chǔ)地理信息數(shù)據(jù)中,除了圖形表達(dá)的位置和相互關(guān)系,屬性記錄是極為重要的信息,尤其是地名、路名、河流名等屬性,能夠直觀準(zhǔn)確的表達(dá)地物的主題信息。在當(dāng)前技術(shù)水平下,對(duì)于無法錄入的生僻字,只能通過漢語拼音的方式進(jìn)行替代,或者用A112、B325等編碼替代生僻字,直接造成了讀圖困難和理解中斷,無法準(zhǔn)確明晰的傳達(dá)地理信息。同樣的,制圖系統(tǒng)由于缺乏統(tǒng)一規(guī)范的生僻字庫,在字形、字大等制圖效果上也無法實(shí)現(xiàn)整體的協(xié)調(diào)統(tǒng)一,嚴(yán)重影響了地理信息數(shù)據(jù)的應(yīng)用。
[0005]3、不同單位生產(chǎn)的數(shù)據(jù)中的生僻字不能協(xié)調(diào)統(tǒng)一。由于缺少統(tǒng)一的生僻字庫和造字錄入程序,造成各生產(chǎn)單位生產(chǎn)的數(shù)據(jù)中的生僻字編碼方式,無法實(shí)現(xiàn)全國范圍內(nèi)的統(tǒng)一,嚴(yán)重阻礙的數(shù)據(jù)的共享和應(yīng)用。主要表現(xiàn)在:1)生僻字編碼不統(tǒng)一。由于缺乏協(xié)調(diào)規(guī)范,同一生僻字在不同的地區(qū)、不同生產(chǎn)單位生產(chǎn)的數(shù)據(jù)中的編碼不一致,導(dǎo)致數(shù)據(jù)混亂和冗余。2)生僻字重復(fù)編碼。由于筆畫順序、發(fā)音、手寫偏差等因素,導(dǎo)致同一個(gè)生僻字對(duì)應(yīng)著多個(gè)編碼,造成編碼的重復(fù)。3)部分非生僻字表示為生僻字。部分筆畫較為繁瑣、不常見的字,可以在常用字庫中找到,由于數(shù)據(jù)錄入員的認(rèn)知差異而編碼為生僻字。

【發(fā)明內(nèi)容】

[0006]為了解決現(xiàn)有技術(shù)存在的上述問題,本發(fā)明提供了一種基礎(chǔ)地理信息數(shù)據(jù)中生僻字庫實(shí)現(xiàn)方法。適用于國家基礎(chǔ)地理信息數(shù)據(jù)中與地名相關(guān)的冷僻、不常見漢字(簡稱生僻字)的采集和錄入,主要涉及生僻字的造字、檢索、錄入、字庫標(biāo)準(zhǔn)化等方面。
[0007]本發(fā)明所采用的技術(shù)方案為:
[0008]—種基礎(chǔ)地理信息數(shù)據(jù)中生僻字庫實(shí)現(xiàn)方法,其改進(jìn)之處在于:所述方法包括
[0009](I)收集覆蓋全國生僻字;
[0010](2)采用一體式集成編碼;
[0011](3)生僻字字符采用矢量化設(shè)計(jì)和構(gòu)建;
[0012](4)進(jìn)行字符錄入。
[0013]優(yōu)選的,所述步驟(I)包括通過偏旁分類、筆畫檢索和拼音標(biāo)注的方式收集覆蓋全國的1:25萬和1:5萬基礎(chǔ)地理信息數(shù)據(jù)中的所有生僻字,將生僻字存入字體庫中。
[0014]優(yōu)選的,所述步驟(2)包括在字體庫中的基礎(chǔ)上,按照增量累加的模式,統(tǒng)一為所有生僻字定義新的編碼,形成生僻字字庫。
[0015]優(yōu)選的,所述步驟(3)包括生僻字字庫中的漢字采用矢量化方式構(gòu)建,字符的組成部分均包含了字形邊界上的關(guān)鍵點(diǎn)和連線的導(dǎo)數(shù)信息,字體的渲染引擎通過讀取這些數(shù)學(xué)矢量,進(jìn)行數(shù)學(xué)運(yùn)算來進(jìn)行渲染。
[0016]優(yōu)選的,將字體庫中生僻字可根據(jù)顯示或制圖的要求自由選擇字體,其包括宋體、仿宋體、黑體、中等線體、細(xì)等線體、正常體、扁體、長體、左斜、聳肩或其它多種字體。
[0017]優(yōu)選的,所述步驟(4)包括進(jìn)行字庫中生僻字錄入,采用生僻字庫專用錄入系統(tǒng),所述系統(tǒng)包括筆畫檢索錄入和筆數(shù)檢索錄入的方式,直接檢索到生僻字并輸入;
[0018]進(jìn)行字庫中生普通字符錄入,采用常規(guī)錄入即可。
[0019]進(jìn)一步的,所述筆畫檢索錄入按照書寫順序采用筆畫4+1方式,即生僻字的前四筆畫和末一筆畫取碼檢索依據(jù),不足五筆的加O ;所述筆數(shù)檢索根據(jù)生僻字的筆畫總數(shù),人工查找對(duì)應(yīng)的字符。
[0020]優(yōu)選的,對(duì)于生僻字字庫中沒有收錄的字,則進(jìn)行全面檢索排查,確認(rèn)為新生僻字的,采用步驟(3)進(jìn)行矢量化方式構(gòu)建字符,并收錄至生僻字字庫中。
[0021]本發(fā)明的有益效果為:
[0022]本發(fā)明字體庫具有生僻字收錄全面、矢量化字符設(shè)計(jì)、錄入系統(tǒng)方便快捷等特點(diǎn),可以有效提高我國各行業(yè)部門的地理信息數(shù)據(jù)生僻字查找和錄入效率,對(duì)于提高地理信息數(shù)據(jù)生產(chǎn)效率、規(guī)范全國地名庫、完善地理數(shù)據(jù)一體化制圖等具有重大的積極作用。
[0023]對(duì)于發(fā)音基本難以確認(rèn)的生僻字來說,筆畫檢索是方法最快、效率最高的檢索方法。本發(fā)明針對(duì)生僻字的字形特點(diǎn),對(duì)筆畫檢索的速度、準(zhǔn)確度進(jìn)行了極大優(yōu)化,可以快速高效的檢索錄入所需的生僻字。
【附圖說明】
[0024]圖1是本發(fā)明提供的一種基礎(chǔ)地理信息數(shù)據(jù)中生僻字庫實(shí)現(xiàn)方法示意圖。
【具體實(shí)施方式】
[0025]如圖1所示,本發(fā)明提供了一種基礎(chǔ)地理信息數(shù)據(jù)中生僻字庫實(shí)現(xiàn)方法,可實(shí)現(xiàn)生僻字的快速、準(zhǔn)確檢索與錄入,具體流程如下:
[0026]I)收集覆蓋全國生僻字
[0027]首先安裝包括字體庫安裝和檢索錄入系統(tǒng)安裝。字體庫安裝:對(duì)于windows操作系統(tǒng),將字體文件復(fù)制到Windows安裝目錄下的Fonts文件夾即可完成安裝;對(duì)于其他操作系統(tǒng),可參看相關(guān)的操作手冊進(jìn)行字體庫安裝。檢索錄入系統(tǒng)安裝:安裝相應(yīng)的檢索錄入軟件、配置系統(tǒng)、設(shè)置初始狀態(tài)等;
[0028]統(tǒng)一收集覆蓋全國的1:25萬、1
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1