亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種漢字壓縮編碼方法

文檔序號(hào):6610591閱讀:570來(lái)源:國(guó)知局

專利名稱::一種漢字壓縮編碼方法
技術(shù)領(lǐng)域
:本發(fā)明涉及編碼方法,更具體地說(shuō),涉及一種漢字壓縮編碼方法。
背景技術(shù)
:目前,手機(jī)短信在進(jìn)行編碼時(shí)是采用國(guó)際通用的USC2標(biāo)準(zhǔn)方式進(jìn)行,每個(gè)漢字占用兩個(gè)字節(jié)。而每條短信正文的有效載荷為140個(gè)字節(jié),所以對(duì)于普通短信,每條最多容納70個(gè)漢字,如果超過(guò)了70個(gè)漢字,則就必須拆分成多條短信進(jìn)行發(fā)送。
發(fā)明內(nèi)容本發(fā)明要解決的技術(shù)問(wèn)題在于,針對(duì)現(xiàn)有技術(shù)的上述缺陷,提供一種漢字壓縮編碼方法。本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是構(gòu)造一種一種漢字壓縮編碼方法,包括以下步驟a、分級(jí)漢字庫(kù);b、在壓縮一段漢字時(shí),搜索經(jīng)分級(jí)的漢字庫(kù),確定所述漢字的級(jí)別;c、根據(jù)所述漢字的級(jí)別,壓縮所述漢字。在本發(fā)明所述的漢字壓縮編碼方法,其特征在于,在所述步驟a中,將所述漢字庫(kù)分為一級(jí)漢字庫(kù)、二級(jí)漢字庫(kù)、三級(jí)漢字庫(kù)、四級(jí)漢字庫(kù)、五級(jí)漢字庫(kù)、六級(jí)漢字庫(kù)。優(yōu)選的,所述一級(jí)漢字庫(kù)包括256個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用8位編碼。優(yōu)選的,所述二級(jí)漢字庫(kù)包括512個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用9位編碼。優(yōu)選的,所述三級(jí)漢字庫(kù)包括1024個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用10位編碼。優(yōu)選的,所述四級(jí)漢字庫(kù)包括2048個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用ll位編碼。優(yōu)選的,所述五級(jí)漢字庫(kù)包括4096個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用12位編碼。優(yōu)選的,所述六級(jí)漢字庫(kù)包括8192個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用13位編碼。進(jìn)一步地,在本發(fā)明所述的漢字壓縮編碼方法中,在步驟C中,還包括對(duì)經(jīng)壓縮的所述一段文字,設(shè)置級(jí)別標(biāo)志。實(shí)施本發(fā)明的漢字壓縮編碼方法,具有以下有益效果適用于手機(jī)短信等小段漢字信息傳送的應(yīng)用中。例如,如果在手機(jī)短信發(fā)送和接收中采用本發(fā)明的方法,則最大可以在一條普通短信中傳輸原來(lái)的兩倍的漢字,也就是說(shuō)140個(gè)漢字,遠(yuǎn)遠(yuǎn)超過(guò)了原來(lái)一條短信傳輸70個(gè)漢字的容量。如果所需壓縮的這段漢字都屬于一級(jí)漢字庫(kù)的話,和采用國(guó)際通用的USC2標(biāo)準(zhǔn)方式相比,本發(fā)明只需其一半的存儲(chǔ)空間。即使是所需壓縮的這段漢字都屬于六級(jí)字庫(kù),和采用國(guó)際通用的USC2標(biāo)準(zhǔn)方式相比,本發(fā)明只需其81%的存儲(chǔ)空間。下面將結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明,附圖中圖1是本發(fā)明漢字壓縮編碼方法流程圖。具體實(shí)施例方式如圖1所示,在本發(fā)明的漢字壓縮編碼方法中,按照漢字使用頻率,采用分級(jí)漢字庫(kù)的方式,將漢字庫(kù)分為一級(jí)漢字庫(kù)(包含了最常用的256個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用8位編碼)、二級(jí)漢字庫(kù)(包含了最常用的512個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用9位編碼)、三級(jí)漢字庫(kù)(包含了最常用的1024個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用10位編碼)、四級(jí)漢字庫(kù)(包含了最常用的2048個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用11位編碼)、五級(jí)漢字庫(kù)(包含了最常用的4096個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用12位編碼)、六級(jí)漢字庫(kù)(包含了最常用的8192個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用13位編碼)。在壓縮一段漢字時(shí),從一級(jí)漢字庫(kù)依次開始搜索(搜索順序是一級(jí)漢字庫(kù)、二級(jí)漢字庫(kù)、三級(jí)漢字庫(kù)、四級(jí)漢字庫(kù)、五級(jí)漢字庫(kù)、六級(jí)漢字庫(kù)),判斷該段漢字中的所有文字是否全部屬于某一級(jí)漢字庫(kù),如果是的話,采用該級(jí)漢字庫(kù)的編碼進(jìn)行壓縮。這樣的話,如果所需壓縮的這段漢字都屬于一級(jí)漢字庫(kù)的話,和采用國(guó)際通用的USC2標(biāo)準(zhǔn)方式相比,本發(fā)明只需其一半的存儲(chǔ)空間。即使是所需壓縮的這段漢字都屬于六級(jí)字庫(kù),和采用國(guó)際通用的USC2標(biāo)準(zhǔn)方式相比,本發(fā)明只需其81%的存儲(chǔ)空間。這樣的話,對(duì)于短信等應(yīng)用方式,本發(fā)明的壓縮方法可以在很多情況下為手機(jī)用戶節(jié)省不少費(fèi)用。為了適應(yīng)發(fā)展,漢字的使用頻率可能會(huì)有變化,那么我們將每段壓縮后的文字第1個(gè)字節(jié)高4位(這樣的話就能支持到16個(gè)版本的字庫(kù))定義為字庫(kù)版本。第1個(gè)字節(jié)低4位保留。為了讓解碼方知道壓縮時(shí)采用的是哪一級(jí)字庫(kù),我們將每段壓縮后的文字第2個(gè)字節(jié)高4位定義為字庫(kù)序號(hào)(我們目前的字庫(kù)只有六級(jí),所以四個(gè)位是足夠表示了,如果六級(jí)字庫(kù)不夠用,可以考慮將字庫(kù)增加到七級(jí)〉。第2個(gè)字節(jié)低4位保留。在解壓縮時(shí),我們首先讀取第一個(gè)字節(jié)的高4位,判斷出壓縮方是采用了哪個(gè)版本的字庫(kù)。接著讀取第2個(gè)字節(jié)的高4位,我們就可以知道壓縮方是采用了哪一級(jí)的字庫(kù)。知道了上面兩個(gè)信息,我們就可以索引到具體版本的具體一級(jí)的字庫(kù),然后通過(guò)該版本該級(jí)別的字庫(kù)編碼表檢索出所有漢字。在一優(yōu)選實(shí)施例中,一級(jí)漢字庫(kù)定義如下:<table>tableseeoriginaldocumentpage5</column></row><table><table>tableseeoriginaldocumentpage6</column></row><table>權(quán)利要求1、一種漢字壓縮編碼方法,其特征在于,包括以下步驟a、分級(jí)漢字庫(kù);b、在壓縮一段漢字時(shí),搜索經(jīng)分級(jí)的漢字庫(kù),確定所述漢字的級(jí)別;c、根據(jù)所述漢字的級(jí)別,壓縮所述漢字。2、根據(jù)權(quán)利要求1所述的漢字壓縮編碼方法,其特征在于,在所述步驟a中,將所述漢字庫(kù)分為一級(jí)漢字庫(kù)、二級(jí)漢字庫(kù)、三級(jí)漢字庫(kù)、四級(jí)漢字庫(kù)、五級(jí)漢字庫(kù)、六級(jí)漢字庫(kù)。3、根據(jù)權(quán)利要求2所述的漢字壓縮編碼方法,其特征在于,所述一級(jí)漢字庫(kù)包括256個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用8位編碼。4、根據(jù)權(quán)利要求2所述的漢字壓縮編碼方法,其特征在于,所述二級(jí)漢字庫(kù)包括512個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用9位編碼。5、根據(jù)權(quán)利要求2所述的漢字壓縮編碼方法,其特征在于,所述三級(jí)漢字庫(kù)包括1024個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用IO位編碼。6、根據(jù)權(quán)利要求2所述的漢字壓縮編碼方法,其特征在于,所述四級(jí)漢字庫(kù)包括2048個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用ll位編碼。7、根據(jù)權(quán)利要求2所述的漢字壓縮編碼方法,其特征在于,所述五級(jí)漢字庫(kù)包括4096個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用12位編碼。8、根據(jù)權(quán)利要求2所述的漢字壓縮編碼方法,其特征在于,所述六級(jí)漢字庫(kù)包括8192個(gè)漢字和標(biāo)點(diǎn)符號(hào),每個(gè)漢字和標(biāo)點(diǎn)符號(hào)采用13位編碼。9、根據(jù)權(quán)利要求18任一所述的漢字壓縮編碼方法,其特征在于,在步驟c中,還包括對(duì)經(jīng)壓縮的所述一段文字,設(shè)置級(jí)別標(biāo)志。全文摘要本發(fā)明涉及一種漢字壓縮編碼方法,包括以下步驟a.分級(jí)漢字庫(kù);b.在壓縮一段漢字時(shí),搜索經(jīng)分級(jí)的漢字庫(kù),確定所述漢字的級(jí)別;c.根據(jù)所述漢字的級(jí)別,壓縮所述漢字。通過(guò)本發(fā)明的壓縮編碼方法,可以將一段漢字最大壓縮至原來(lái)所需的存儲(chǔ)空間大約1/2的大小。適用于手機(jī)短信等小段漢字信息傳送的應(yīng)用中。例如,如果在手機(jī)短信發(fā)送和接收中采用本發(fā)明的方法,則最大可以在一條普通短信中傳輸原來(lái)的兩倍的漢字,也就是說(shuō)140個(gè)漢字,遠(yuǎn)遠(yuǎn)超過(guò)了原來(lái)一條短信傳輸70個(gè)漢字的容量。文檔編號(hào)G06F17/28GK101419588SQ20071012416公開日2009年4月29日申請(qǐng)日期2007年10月26日優(yōu)先權(quán)日2007年10月26日發(fā)明者斌何申請(qǐng)人:康佳集團(tuán)股份有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1