專利名稱:一種基于wap的傳輸壓縮數據的方法
技術領域:
本發(fā)明涉及無線通信領域。是關于數據的編碼優(yōu)化及壓縮方法以及怎樣利用無線應用協議(WAP)傳輸壓縮數據的方法。
WAP(無線應用協議)是在數字移動電話、因特網或其他個人數字助理機(PDA)、計算機應用之間進行通訊的開放全球標準。它是由一系列協議組成,用來標準化無線通信設備,可用于Intemet訪問,包括收發(fā)電子郵件,訪問WAP網站上的頁面等等。WAP將移動網絡和Intemet以及公司的局域網緊密地聯系起來,提供一種與網絡類型、運行商和終端設備都獨立的移動增值業(yè)務。通過這種技術,無論你在何地、何時只要你需要信息,你就可以打開你的WAP手機,享受無窮無盡的網上信息或者網上資源。如綜合新聞、天氣預報、股市動態(tài)、商業(yè)報道、當前匯率等。電子商務、網上銀行也將逐一實現。你還可以隨時隨地獲得體育比賽結果、娛樂圈趣聞以及幽默故事,為生活增添情趣,也可以利用網上預定功能,把生活安排的有條不紊。
WAP的產生與發(fā)展使人們可以用WAP手機瀏覽互聯網,但是由于設備與信道帶寬的限制影響了人們單位時間內瀏覽的信息量。為了在有限的帶寬內傳輸更多的信息,只能對信息進行壓縮,但目前在WAP規(guī)范中,僅僅對文件頭和文件尾部有限的標記進行了壓縮編碼,而普通傳輸的用戶數據未進行壓縮。
WAP手機及其他設備瀏覽互聯網需要網關做中介,因為WAP手機使用WAP協議棧,而互聯網使用TCP/IP協議棧,這就需要中間機構網關進行轉化。WAP網關本身自帶了標記壓縮編碼功能,而本發(fā)明則是通過網關對用戶請求的互聯網信息進行壓縮編碼并傳輸利用。如附
圖1所示現有的編碼是將互聯網傳到網關的使用WML語言(使用無線應用協議編寫網頁的語言,相當于互聯網中的HTML語言)編寫的DECK進行二進制編碼,并對WML語言中標記部分(類似于HTML中的標簽)進行壓縮,然后用無線信道傳給WAP終端,WAP終端自動識別二進制的WML的DECK并在瀏覽器上顯示出來,每個DECK不可超過1.4K(指從互聯網傳過來的),這種限制目前尚未突破。
本發(fā)明的目的是對在WAP傳輸的數據采用壓縮編碼并在無線互聯網中傳輸壓縮數據。這種技術可以在有限的帶寬內傳輸更多的信息量,節(jié)省連接時間,并由此節(jié)省機時費用。由于WAP手機大量瀏覽的都是文本信息,所以可以在限定DECK的情況下對文本信息進行大比率壓縮,提高了本發(fā)明的應用價值。如下圖所示,在網關對DECK進行編碼之前,對DECK中的文本信息進行壓縮。眾所周知,文本的壓縮率可達到百分之三十,也就是說三百K的文件可壓至一百K。
下面對本發(fā)明進行詳細講解。
1、編碼算法及過程編碼算法可以使用成熟的霍夫曼編碼壓縮或其他編碼方法?;舴蚵幋a壓縮基本原理是頻繁使用的數據用較短的代碼代替,很少使用的數據用較長的代碼代替,每個數據的代碼各不相同。這些代碼都是二進制碼,且碼的長度是可變的。如有一個原始數據序列,ABACCDAA則編碼為A(0),B(10),C(110),D111),壓縮后為010011011011100。產生霍夫曼編碼需要對原始數據掃描兩遍,第一遍掃描要精確地統(tǒng)計出原始數據中的每個值出現的頻率,第二遍是建立霍夫曼樹并進行編碼,由于需要建立二叉樹并遍歷二叉樹生成編碼,因此數據壓縮和還原速度都較慢,但簡單有效。漢字中常用字只有八干,也即13位二進制數,使用16位編碼是有很大冗余的。按GB2312規(guī)范,根據其給出的使用頻度對漢字進行霍夫曼編碼壓縮,其壓縮率約為54%。具體到WAP手機由于傳輸的頁面大多數頁面都有其針對性,例如,股票查詢站點主要使用其專用術語,日常生活用語涉及較少,若將股票專用術語及最常用字約一千字按使用頻度進行霍夫曼編碼壓縮,壓縮率更高達78%。這就是說,在1.4K DECK中,大約可以傳送10K信息(考慮標簽和系統(tǒng)開銷,則總壓縮率降低)其代價是WAP手機端計算帶來的時間延遲,但是這一時延相對于信道時延是很小的。
2、壓縮數據傳輸流程附圖2中的DECK是WML文件單位,也是實際信道中傳輸的單位。從純壓縮的角度考慮,DECK越大,系統(tǒng)開銷相對越小,總壓縮率越高;但由于網關必須對壓縮后仍大于1.4K的DECK進行拆分,不但引起了時延,而且反而增大了系統(tǒng)開銷,降低了壓縮率。因此建議未編碼DECK小于5K。約兩千五百個漢字。實際編碼前先要對文件進行掃描,記錄其標記順序。對不同WML標記中的文本要對其給以不同的標己進行表示,即用不同的記號代替不同標記中的文本。而不同標記中的文本壓縮之后也要給以相應的記號,以便在WAP手機端恢復。這樣,文本壓縮后的DECK與原來不同的只是文本的格式,仍可進入網關進行編碼。
WAP手機端相互聯網發(fā)出請求,然后互聯網端將DECK送出同時對數據進行鑒別如果DECK小于1.4K,則不需要任何處理即可進入網關;如果DECK大于1.4K,則取出文本信息進行再編碼壓縮,形成從組DECK;從組DECK被要求再次鑒別如果其小于1.4K,則進入網關;如果仍然大于1.4K,則進行拆分。拆分過程分兩步,先找出1.4K分位點,然后在分位點加入DECK頭。
3、解壓編過程數據進入網關經相關處理后,即可向WAP手機端傳輸。而在WAP手機端,只需對SIM卡進行編程即可完成解壓縮。其程序主要完成兩個功能,一是識別文本壓縮標記,二是使用霍夫曼算法對文本解壓縮。這兩個功能所要求的硬件很低,使用SIM卡內自有CPU和RAM即可。
本發(fā)明的效果對用戶需要傳送的各種數據進行編碼、壓縮、傳輸,在當前有限的帶寬內傳輸更多的信息,是對目前WAP壓縮數據的傳輸技術的重大發(fā)展。
實施例1針對WAP股票專業(yè)站點采用本壓縮和傳輸方法的具體步驟如下在WAP手機端相互聯網發(fā)出請求時,互聯網端將DECK(WML文件單位)送出同時對數據進行鑒別如果DECK小于1.4K,則不需要任何處理即可進入網關。如果DECK大于I.4K,則取出文本信息進行再編碼壓縮,編碼壓縮按照GB2312規(guī)范,根據其給出的使用頻度對漢字進行霍夫曼編碼壓縮,股票專用術語及最常用字約一千字按使用頻度進行霍夫曼編碼壓縮,壓縮率可達到78%。編碼之后形成從組DECK。從組DECK被要求再次鑒別如果其小于1.4K,則進入網關;如果仍然大于1.4K,則進行拆分。拆分過程分兩步,先找出1.4K分位點,然后在分位點加入DECK頭。數據進入網關經相關處理后,即可向WAP手機端傳輸。而在WAP手機端,只需對SIM卡進行編程即可完成解壓縮。
通過采用本壓縮和傳輸方法,WAP股票專業(yè)站點的頁面?zhèn)鬏斔俾视善骄?6秒縮短為平均8秒。
采用本壓縮和傳輸方法,酒店預訂站點的頁面?zhèn)鬏斔俾视善骄?4秒縮短為平均7秒。
采用本壓縮和傳輸方法,綜合門戶站點的頁面?zhèn)鬏斔俾视善骄?8秒縮短為平均12秒。
權利要求
1.本發(fā)明是基于無線應用協議(WAP)進行壓縮數據的傳輸技術。其特征在于可以在無線互聯網有限的帶寬內傳輸更多的信息量,節(jié)省連接時間,具體壓縮比率根據不同數據格式有一定差異。
2.按照權利要求1所述的壓縮數據傳輸技術中所包含的數據壓縮方法,其特征在于頻繁使用的數據用較短的代碼代替,很少使用的數據用較長的代碼代替,每個數據的代碼各不相同。這些代碼都是二進制碼,且碼的長度是可變的。產生霍夫曼編碼需要對原始數據掃描兩遍,第一遍掃描要精確地統(tǒng)計出原始數據中的每個值出現的頻率,第二遍是建立霍夫曼樹并進行編碼。
3.按照權利要求1所述的壓縮數據傳輸技術中的從組DECK,其特征在于對不同WML標記中的文本要對其給以不同的標記進行表示,即用不同的記號代替不同標記中的文本。而不同標記中的文本壓縮之后也要給以相應的記號,以便在WAP手機端恢復。
4.按照權利要求1所述的壓縮數據傳輸技術中所包含的壓縮數據傳輸流程,其特征在于WAP手機端相互聯網發(fā)出請求,然后互聯網端將DECK送出同時對數據進行鑒別如果DECK小于1.4K,則不需要任何處理即可進入網關;如果DECK大于1.4K,則取出文本信息進行再編碼壓縮,形成從組DECK;從組DECK被要求再次鑒別如果其小于1.4K,則進入網關如果仍然大于1.4K,從組DECK將被拆分。
5.按照權利要求1所述的壓縮數據傳輸技術中WAP手機端的SIM卡芯片,其特征在于識別文本壓縮標記,并使用霍夫曼算法對文本解壓縮。
全文摘要
WAP是在無線互聯網領域進行通訊的全球開放標準。目前在WAP規(guī)范中,普通傳輸的數據均未進行壓縮。信道帶寬限制了信息量的傳輸。本發(fā)明根據漢字的使用頻度對之進行霍夫曼編碼壓縮,由此縮短數據傳輸時間和增加傳輸量。壓縮數據在傳輸過程中首先進行鑒別,如果DECK大于1.4K,則取出文本信息進行再編碼壓縮,形成從組DECK;從組DECK被要求再次鑒別,如果仍然大于1.4K,則進行拆分。所有小于1.4K的DECK進入網關傳輸并在WAP手機端對SIM卡進行編程解壓縮。
文檔編號H04B1/66GK1332527SQ0010789
公開日2002年1月23日 申請日期2000年7月10日 優(yōu)先權日2000年7月10日
發(fā)明者劉明, 鞠清敏, 邢小剛 申請人:劉明, 鞠清敏, 邢小剛