處理位符號的方法和設(shè)備、計算機(jī)可讀媒介、計算機(jī)程序單元的制作方法

文檔序號：7760058閱讀：255來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：處理位符號的方法和設(shè)備、計算機(jī)可讀媒介、計算機(jī)程序單元的制作方法
背景技術(shù)：
在視頻、圖像和音頻處理中，嵌入式編碼已經(jīng)引起了許多注意。這是因?yàn)榍度胧骄幋a允許編碼器在任何點(diǎn)終止編碼過程，以滿足預(yù)定的目標(biāo)比特速率。另外，譯碼器可以在任何點(diǎn)截短比特流，并且仍能夠獲得被譯碼的視頻、圖像或音頻的相對優(yōu)良的質(zhì)量。換言之，理想的嵌入式編碼系統(tǒng)能夠提供速率失真的最佳截短比特流，使得所述系統(tǒng)成為用于構(gòu)建具有精細(xì)可伸縮性(FGS，F(xiàn)ine Granularity Scalability)的系統(tǒng)的理想的編碼工具。
由于位平面編碼(BPC，bit-plane coding)簡單，連續(xù)位平面編碼是實(shí)現(xiàn)嵌入式編碼系統(tǒng)的常用方法。在BPC中，來自數(shù)據(jù)源的輸入數(shù)據(jù)向量在位平面中被說明，并且然后從代表輸入數(shù)據(jù)向量的最高有效位(MSB)的最高有效位平面開始，到代表輸入數(shù)據(jù)向量最低有效位(LSB)的最低有效位平面，對所述位平面進(jìn)行連續(xù)地編碼。除了所述編碼的結(jié)構(gòu)簡單以外，從輸入數(shù)據(jù)向量的MSB到LSB的所述編碼序列滿足如[1]中公開的嵌入式編碼過程的原理，其中應(yīng)該首先對最影響視頻/圖像/音頻數(shù)據(jù)質(zhì)量的比特進(jìn)行編碼。
通常，實(shí)現(xiàn)給出速率失真曲線的最佳值的位平面編碼是很復(fù)雜的，并且需要較高的計算資源。這是因?yàn)閷τ谕ǔ５臄?shù)據(jù)源，在位平面之間以及數(shù)據(jù)采樣之間存在統(tǒng)計相關(guān)性。為了捕獲所述相關(guān)性，熵編碼器必須使用具有大量條目的頻率表，這不僅增加了所述熵編碼器的復(fù)雜度，而且可能導(dǎo)致最終退化編碼性能的大量的建模開銷[2]。因此，大多位平面編碼的實(shí)際實(shí)現(xiàn)通常采用折衷的方法以減小計算復(fù)雜度，但是不幸的是，這導(dǎo)致了性能退化。
因此，希望具有給出速率失真曲線的最佳值的位平面編碼過程，其具有較低的計算復(fù)雜度，并且還不會導(dǎo)致性能上的嚴(yán)重退化。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種具有較低計算復(fù)雜度的嵌入式編碼方案，但是該方案具有與上述任何系統(tǒng)可以比擬的性能。
通過獨(dú)立的權(quán)利要求的特性可以達(dá)到所述目的。其它特性由附屬權(quán)利要求產(chǎn)生。
本發(fā)明涉及一種用于處理由數(shù)據(jù)源產(chǎn)生的位符號的方法，所述數(shù)據(jù)源特別是視頻、靜止圖像或音頻源，所述方法包括下列步驟使用所述數(shù)據(jù)源產(chǎn)生的位符號來構(gòu)建多個位平面，每個位平面包括多個位平面符號。掃描每個位平面的位平面符號以產(chǎn)生位平面符號的二進(jìn)制流，并且利用統(tǒng)計模型對所述位平面符號的二進(jìn)制流進(jìn)行編碼，其中所述統(tǒng)計模型是基于表征數(shù)據(jù)源的拉普拉斯概率分布函數(shù)的統(tǒng)計特性的。
首先以形成多個位平面的方式，來安排由包括多個輸入數(shù)據(jù)向量的數(shù)據(jù)源所產(chǎn)生的位符號。每個位平面包括對應(yīng)于所述數(shù)據(jù)源的每個位符號的多個位平面符號。
所述數(shù)據(jù)源可以涉及任何類型的數(shù)據(jù)信號，所述數(shù)據(jù)信號可以由捕獲設(shè)備所捕獲以進(jìn)行進(jìn)一步處理。具體地，本說明書中的數(shù)據(jù)源涉及視頻、圖像或音頻源，其可以分別由錄像機(jī)、照相機(jī)和麥克風(fēng)來捕獲以進(jìn)行進(jìn)一步處理。
開始于位平面，對所有位平面符號進(jìn)行掃描以按照一定的方式來選擇位平面符號，從而產(chǎn)生所述位平面符號的二進(jìn)制流，所述位平面優(yōu)選地包括輸入數(shù)據(jù)向量的MSB。然后利用統(tǒng)計模型對由掃描過程所產(chǎn)生的位平面符號的二進(jìn)制流進(jìn)行編碼?；谒鰯?shù)據(jù)源的拉普拉斯概率分布函數(shù)(pdf)的統(tǒng)計特性而產(chǎn)生統(tǒng)計模型，所述數(shù)據(jù)源特別是視頻/圖像/音頻源。
利用基于拉普拉斯pdf的統(tǒng)計特性的統(tǒng)計模型來對位平面符號的二進(jìn)制流進(jìn)行編碼的優(yōu)勢在于，基于所述類型的統(tǒng)計模型的編碼過程的計算復(fù)雜度非常低。當(dāng)所述統(tǒng)計模型是基于一般的pdf的統(tǒng)計特性時，需要在編碼器中維持特別大的概率表，這對于具有有限的計算資源和存儲容量的應(yīng)用而言是不合適的。為了克服所述問題，根據(jù)現(xiàn)有技術(shù)狀態(tài)的多數(shù)BPC方案僅對位平面符號的有限子集進(jìn)行熵編碼，所述位平面符號具有非常偏斜的分布，這導(dǎo)致了編碼效率的嚴(yán)重?fù)p失。
通過利用根據(jù)本發(fā)明的所述數(shù)據(jù)源的拉普拉斯pdf的統(tǒng)計特性，消除了對所述大概率表的需求，這大大降低了計算復(fù)雜度，并且還沒有任何質(zhì)量上的嚴(yán)重?fù)p失。
根據(jù)本發(fā)明的編碼方法使用熵編碼過程，所述過程是一種基于統(tǒng)計模型的數(shù)據(jù)壓縮形式。優(yōu)選地，運(yùn)算編碼器被用作熵編碼器來對通過掃描過程所產(chǎn)生的位平面符號的二進(jìn)制流進(jìn)行編碼。
由于熵編碼提供了良好的壓縮率，因此熵編碼過程的運(yùn)算編碼是優(yōu)選的。
拉普拉斯pdf可以利用下面的函數(shù)來定義f(x)=e-|x|2σ22σ2]]>其中σ是所述拉普拉斯pdf的標(biāo)準(zhǔn)偏差或分布參數(shù)。
根據(jù)本發(fā)明的實(shí)施例，使用上面的拉普拉斯pdf等式來確定給每個位平面符號的概率分配。所確定的概率分配隨后被用于確定對位平面符號的二進(jìn)制流進(jìn)行編碼的統(tǒng)計模型。
具體地，給每個所述位平面符號的概率分配由下式來確定Pj=1-[1+e-2/2σ2]-1,j=M-1,M-2...]]>其中，Pj是給所述位平面符號的概率分配，并且j表示所述位平面。
從所述拉普拉斯pdf獲得上面的概率分配等式，并且所述概率分配等式被用于確定每個位平面符號的概率。特別是運(yùn)算編碼器的編碼器隨后使用所述數(shù)據(jù)源的概率或統(tǒng)計信息用來對位平面符號的二進(jìn)制流進(jìn)行編碼。
由于所述拉普拉斯pdf的統(tǒng)計特性，大大減小了確定每個位平面的概率分布的復(fù)雜度。
在另一個實(shí)施例中，其中所述標(biāo)準(zhǔn)偏差σ不是已知的，基于先前被編碼的位平面符號的信息，來確定給每個位平面符號的概率分配。
當(dāng)所述數(shù)據(jù)源的統(tǒng)計特性的信息未知時，或當(dāng)所述數(shù)據(jù)源是非平穩(wěn)的，所述自適應(yīng)過程在實(shí)際應(yīng)用中是非常有用的。在所述情況下，基于從先前被編碼的位平面符號所獲得的信息來確定所述數(shù)據(jù)源的統(tǒng)計特性。
具體地，在所述實(shí)施例中，給每個位平面符號的概率分配由下式給出Pj=NaNPjNa+(1-NaN)PjML]]>其中Pj是給所述位平面符號的概率分配，Na是直到先前的位平面結(jié)束為止，被編碼的位平面符號的數(shù)目。
N是直到當(dāng)前位平面符號為止，被編碼的位平面符號的數(shù)目。
PjNa是在觀察了Na個位平面符號之后的Pj的估計，PjML是針對當(dāng)前位平面的Pj的最大似然估計，并且被定義為PjML=Σj=1N-Nabi,jN-Na]]>其中bi，j是所述位平面符號。
優(yōu)選地，來自先前被編碼的位平面的Pj的估計，PjNa，可以利用下式通過從先前的位平面更新來估計PjNa=Pj+1Na1-Pj+1Na+Pj+1Na]]>其中Pj+1Na是來自先前位平面的Pj的估計。
在本發(fā)明的另一個實(shí)施例中，用于處理由數(shù)據(jù)源產(chǎn)生的位符號的方法還包括以下步驟從將被編碼的輸入數(shù)據(jù)向量中確定最佳位平面(稱為惰性平面(lazy plane))，基于每個位平面與惰性平面的關(guān)系來確定給每個位平面的概率分配，其中給所述位平面的概率分配被用于對位平面符號的二進(jìn)制流進(jìn)行編碼的統(tǒng)計模型。
在所述實(shí)施例中，由于給每個位平面的概率分配由與所述惰性平面的關(guān)系來明確地確定，因此進(jìn)一步降低了所述編碼過程的計算復(fù)雜度。
首先，所述惰性平面從多個位平面中被選出。所述惰性平面由整數(shù)L表示，L滿足下面的不等式φ2-L+1≤θ＜φ2-L其中φ被定義為并且θ被定義為θ=Δe-2σ2]]>上述決策規(guī)則實(shí)際上將分布參數(shù)σ的支持分割為分離的區(qū)域，并且指定對應(yīng)于每個分割區(qū)域的惰性平面，以使所述惰性平面滿足上面的不等式。
在根據(jù)本發(fā)明確定所述惰性平面之后，確定給每個位平面的概率分配。所述給每個位平面的概率分配是基于該位平面與最佳位平面的關(guān)系的，如下式所給出的QjL=11+22j-L,j&GreaterEqual;L12,j<L]]>其中QJL是給第j個位平面的概率分配。
可選地，當(dāng)已知長度和所述數(shù)據(jù)源的輸入數(shù)據(jù)向量的絕對值和時，所述惰性平面可以利用下面的等式來確定L＝min{L∈Z|2L+1N≥A}其中N是輸入數(shù)據(jù)向量的長度，并且A是輸入數(shù)據(jù)向量的絕對值和。
所述最佳位平面的確定可以通過稍微修改[3]中所公開的算法來實(shí)現(xiàn)，以擴(kuò)展序列(order)L的范圍到負(fù)整數(shù)。
在另一個可選實(shí)施例中，利用下面的等式來確定基于每個位平面與所述惰性平面的關(guān)系的給每個位平面的概率分配QjL=122j-L,j&GreaterEqual;L12,j<L]]>在所述實(shí)施例中，可以利用[4]中所公開的偏斜編碼器來實(shí)現(xiàn)編碼器。
如上所述，上述兩個可選的實(shí)施例具有進(jìn)一步減少對位平面符號的二進(jìn)制流進(jìn)行編碼的計算復(fù)雜度的優(yōu)勢。
另外，提供了用于處理被編碼的位平面符號的二進(jìn)制流以產(chǎn)生代表所述數(shù)據(jù)源的輸出數(shù)據(jù)的方法，該方法包括這樣的步驟對被編碼的位平面符號的二進(jìn)制流進(jìn)行譯碼，以產(chǎn)生另一個位平面符號的二進(jìn)制流，以使可以重構(gòu)包括所述位平面符號的多個位平面。通過另一個統(tǒng)計模型所分配的概率，重構(gòu)所述多個位平面，并且因此可以重構(gòu)代表所述輸入數(shù)據(jù)源向量的輸出數(shù)據(jù)。所述統(tǒng)計模型是基于表征所述位平面符號的拉普拉斯概率分布函數(shù)的。
所述位平面符號的二進(jìn)制流的譯碼過程中產(chǎn)生的統(tǒng)計模型與被用于編碼過程的統(tǒng)計模型相同。換言之，被用于在編碼過程中形成所述統(tǒng)計模型的概率分配，Pj或QjL，在譯碼過程中被重新產(chǎn)生。
因此利用與在編碼過程中所利用的統(tǒng)計模型相同的統(tǒng)計模型來重構(gòu)所述多個位平面，這導(dǎo)致所述被重構(gòu)的輸出數(shù)據(jù)與原始數(shù)據(jù)源直到所述位平面完全相同，其中譯碼器終止被編碼的位平面符號的二進(jìn)制流。
另外，通過由所述統(tǒng)計模型所分配的概率，產(chǎn)生了源向量的最佳均方誤差(MSE)重構(gòu)。具體地，使用所述概率分配Pj來形成編碼過程中的統(tǒng)計模型，并且利用下式來重構(gòu)所述數(shù)據(jù)源x^i=(2si-1)(Σj=M-1Tbi,j2j+Σj=T-1-∞Pj2j)]]>其中xi是被重構(gòu)的數(shù)據(jù)源，以及si是的標(biāo)記符號，
T是被編碼的位平面符號的二進(jìn)制流被終止的位平面。
同樣地，當(dāng)概率分配QjL被用于形成編碼過程中的統(tǒng)計模型時，利用下式來重構(gòu)所述數(shù)據(jù)源x^i=(2si-1)(Σj=M-1Tbi,j2j+Σj=T-1-∞QjL2j)]]>如同可以從以上所看出的，第二求和被用于增強(qiáng)重新產(chǎn)生的數(shù)據(jù)源的質(zhì)量，該第二求和一旦達(dá)到預(yù)期質(zhì)量就可以被停止。
本發(fā)明的所述實(shí)施例不僅應(yīng)用于方法，而且也應(yīng)用于設(shè)備、計算機(jī)可讀媒介和計算機(jī)程序。

圖1示出了視頻/圖像/音頻編碼系統(tǒng)的一般結(jié)構(gòu)；圖2示出了位平面編碼系統(tǒng)的一般結(jié)構(gòu)；圖3示出了根據(jù)本發(fā)明實(shí)施例的位平面編碼的被修改的結(jié)構(gòu)。
具體實(shí)施例方式
圖1示出了視頻/圖像/音頻編碼系統(tǒng)100的一般結(jié)構(gòu)。特別是視頻、圖像或音頻源的數(shù)據(jù)源由捕獲設(shè)備101來接收。所述捕獲設(shè)備101可以是錄像機(jī)、照相機(jī)或麥克風(fēng)以捕獲不同類型的數(shù)據(jù)源。被捕獲的數(shù)據(jù)首先被模數(shù)(A/D)轉(zhuǎn)換器102轉(zhuǎn)換為數(shù)字信號以進(jìn)行進(jìn)一步處理。
位平面編碼系統(tǒng)103(后面將對其進(jìn)行詳細(xì)描述)接收所述A/D轉(zhuǎn)換器中產(chǎn)生的數(shù)據(jù)源的位符號，所述位平面編碼系統(tǒng)包括編碼器單元104和譯碼器單元105。所述編碼單元104對所述位符號進(jìn)行編碼，并且在信道上將所述被編碼的符號發(fā)送給所述譯碼單元105。
所述譯碼單元105對被編碼的符號進(jìn)行譯碼，并且將所述被譯碼的符號發(fā)送給輸出設(shè)備107來顯示，所述輸出設(shè)備例如是數(shù)字電視或數(shù)字照相機(jī)。如果所述輸出設(shè)備107是模擬設(shè)備(例如音頻揚(yáng)聲器)，在輸出所述被譯碼的符號到所述輸出設(shè)備107之前，可以使用數(shù)模(D/A)轉(zhuǎn)換器106來將該被譯碼的符號轉(zhuǎn)換為模擬信號。
圖2示出了位平面編碼系統(tǒng)103的一般結(jié)構(gòu)，該位平面編碼系統(tǒng)包括編碼單元104和譯碼單元105。所述編碼單元104還包括位平面構(gòu)建和掃描單元110、第一統(tǒng)計模型單元111和熵編碼器112。所述譯碼單元105還包括熵譯碼器122、第二統(tǒng)計模型單元121和位平面重構(gòu)單元120。
在所述編碼過程的開始，所述位平面構(gòu)建和掃描單元110接收所述位符號130。所述位符號130包括多個輸入數(shù)據(jù)向量，該輸入數(shù)據(jù)向量可以被表示為K維輸入數(shù)據(jù)向量x＝{x1，x2，...，xk}(1)其中從一些字母的獨(dú)立和相同分布(i.i.d.)的隨機(jī)源中提取xi。
xi也可以被如下表示為二進(jìn)制形式xi=(2si-1)Σi=M-1-∞bi,j.2j,i=1,...,k---(2)]]>其中si是標(biāo)記符號，可以表示為si&cong;1,xi&GreaterEqual;00,xi<0------(3)]]>并且bi，j是幅度符號，其中bi，j∈{0，1}。xi的二進(jìn)制表示也可以被規(guī)范化為整數(shù)M滿足下面的不等式2M-1≤max{|xi|}＜2M，i＝1，...，k (4)當(dāng)所述位平面構(gòu)建和掃描單元110接收了所述位符號130的每個輸入數(shù)據(jù)向量時，所述輸入數(shù)據(jù)向量被分解為其標(biāo)記符號si和幅度符號bi，j。安排所述輸入數(shù)據(jù)向量的標(biāo)記和幅度符號以形成多個位平面，其中每個位平面包括來自每個輸入數(shù)據(jù)向量的標(biāo)記符號si或幅度符號bi，j。通常，將對應(yīng)于所述輸入數(shù)據(jù)向量的最有效位(MSB，most significant bit)的幅度符號bi，j安排在第一位平面中，并且將第二MSB的幅度符號bi，j安排在第二位平面中等等。也將所述輸入數(shù)據(jù)向量的標(biāo)記符號si安排在另一個單獨(dú)的位平面中。所述位平面的所有標(biāo)記和幅度符號都稱作位平面符號。
一旦構(gòu)建了所述位平面，對所有包括于位平面中的位平面符號進(jìn)行掃描，該掃描開始于包括所述輸入數(shù)據(jù)向量的MSB的位平面。所述掃描過程是為了選擇所述位平面符號以形成位平面符號131的二進(jìn)制流。可以以下列步驟來概述一種可能的掃描過程1.從包括輸入數(shù)據(jù)向量的MSB的位平面j＝M-1開始掃描，2.選擇幅度符號bi，j，該符號的所有前面位平面的對應(yīng)幅度符號為“0”bi，M-1＝bi，M-2＝...＝bi，j+1＝0。
3.當(dāng)所述幅度符號bi，j為“1”時，也選擇所述標(biāo)記符號si。步驟2)和3)也稱為顯著步驟(significance pass)。
4.選擇沒有在所述顯著步驟中被選擇的幅度符號bi，j。該步驟被稱為精細(xì)步驟(refinement pass)。
5.進(jìn)行到下一個位平面j-1。
迭代進(jìn)行上述步驟直到一定的終止標(biāo)準(zhǔn)，例如達(dá)到預(yù)定的比特速率或預(yù)定的速率失真限制時終止所述步驟。
一旦上述掃描過程產(chǎn)生了位平面符號131的二進(jìn)制流，還在熵編碼器112中對所述流進(jìn)行編碼或壓縮。所述數(shù)據(jù)源130的位平面符號的統(tǒng)計特性132被用在統(tǒng)計模型111中以提供概率分配133，該概率分配被用于在所述熵編碼器112中對位平面符號131的二進(jìn)制流進(jìn)行編碼。
在信道上發(fā)送來自所述熵編碼器112的被編碼的數(shù)據(jù)134，隨后由所述熵譯碼器122來接收和譯碼所述數(shù)據(jù)。所述信道可以是因特網(wǎng)、廣域網(wǎng)(WAN)或無線通信網(wǎng)。
所述熵譯碼器122接收被編碼的數(shù)據(jù)134并將其譯碼為位平面符號135的二進(jìn)制流。理論上，所述熵譯碼器122產(chǎn)生的位平面符號135的二進(jìn)制流與位平面符號131的二進(jìn)制流相同。
所述統(tǒng)計模型121使用位平面137的統(tǒng)計以產(chǎn)生與133相同的概率分配136，以使所述位平面符號可以被正確地譯碼。所述位平面重構(gòu)單元120因而使用所述位平面符號135來重構(gòu)位平面，以產(chǎn)生代表所述數(shù)據(jù)源的位符號130的輸出數(shù)據(jù)138。
在希望最佳MSE重構(gòu)的情況下，120也使用所述概率分配136來重新產(chǎn)生輸出數(shù)據(jù)138。
應(yīng)該指出，為了獲得具有通用概率分布函數(shù)的數(shù)據(jù)源的位平面符號131的二進(jìn)制流的最佳壓縮，-log2Pr(si，bi，M-1，...)給出了用于編碼位平面符號的熵編碼器112所需的比特數(shù)目，其中所述概率Pr(si，bi，M-1，...)可以表達(dá)為Pr(si，bi，M-1，...，bi，M-j)＝Pr(si)Pr(bi，M-1|si)...Pr(bi，M-j|si，bi，M-1，...，bi，M-j+1)(5)其中，Pr(bi，M-j|si，bi，M-1，...，bi，M-j+1)表示在前面被編碼的位平面上的bi，M-j的條件概率。
實(shí)際上，實(shí)現(xiàn)用于對數(shù)據(jù)源的所有位平面符號進(jìn)行編碼的熵編碼器通常將需要具有大量條目的頻率/概率表。對于以高比特速率編碼而言，在所述頻率表中將被維護(hù)的條目數(shù)量是非常巨大的，并且因此不實(shí)用，尤其是在具有有限的計算和存儲能力的系統(tǒng)中。另外，自適應(yīng)地設(shè)置具有未知分布的數(shù)據(jù)源可能引入大量的建模開銷[2]。因此，在多數(shù)實(shí)際系統(tǒng)中采用了簡單的技術(shù)，其中由所述熵編碼器僅對具有非常偏斜分布的位平面符號(在所述顯著步驟中被掃描的那些符號)進(jìn)行編碼，如[5]和[6]中所述。
根據(jù)本發(fā)明，對于位平面編碼，所述熵編碼器112使用多數(shù)數(shù)據(jù)源中內(nèi)在的拉普拉斯概率分布函數(shù)的特性來對所述數(shù)據(jù)源進(jìn)行編碼，所述數(shù)據(jù)源特別是視頻、圖像和音頻源。
具體地，所述統(tǒng)計模型111使用所述數(shù)據(jù)源的拉普拉斯pdf的統(tǒng)計特性，以產(chǎn)生用于對所述位平面符號132的二進(jìn)制流進(jìn)行編碼的概率分配133。所述數(shù)據(jù)源的拉普拉斯pdf可以用下面等式表達(dá)f(x)=e-|x|2σ22σ2------(6)]]>其中，σ是標(biāo)準(zhǔn)偏差，或拉普拉斯pdf的分布參數(shù)。
從(6)中可以容易地驗(yàn)證拉普拉斯源的位平面符號具有下面的獨(dú)立特性Pj＝Pr(bi，j＝1)＝Pr(bi，j＝1|si，bi，M-1，...，bi，j+1)(7)Pr(bi，j＝0)＝Pr(bi，j＝0|si，bi，M-1，...，bi，j+1)＝1-Pj(8)
Pr(si＝1)＝Pr(si＝0)＝0.5 (9)其中，針對所述熵編碼器而言對于每個位平面j的概率分配由(7)-(9)式給出。
通過(6)，可以計算PjPj=1-(1+e-2/2σ2)-1,j=M-1,M-2...---(10)]]>當(dāng)已知拉普拉斯pdf的分布參數(shù)σ(或標(biāo)準(zhǔn)偏差)時，使用等式(10)可以直接確定Pj。
當(dāng)確定了Pj后，使用等式(7)到(9)可以確定每個位平面符號的概率，并且熵編碼器112使用所述數(shù)據(jù)源的統(tǒng)計信息，來對所述位平面符號131的二進(jìn)制流進(jìn)行編碼。
可以從上面看到，通過使用所述數(shù)據(jù)源的拉普拉斯pdf的統(tǒng)計特性，不需要根據(jù)現(xiàn)有技術(shù)的大量頻率表的維護(hù)，并且因此大大簡化了由所述熵編碼器112對所述二進(jìn)制流131所進(jìn)行的編碼過程。
在本發(fā)明的另一個實(shí)施例中，使用由等式(10)確定的每個位平面符號的概率分配Pj來重新生成二進(jìn)制位平面符號135，所述符號由所述位平面重構(gòu)單元120接收，以產(chǎn)生代表所述數(shù)據(jù)源130的位符號的輸出數(shù)據(jù)138。
具體地，如果需要最佳的MSE重構(gòu)，一旦熵譯碼器122譯碼了被編碼的數(shù)據(jù)134的位平面T，根據(jù)本發(fā)明的輸出數(shù)據(jù)138的最佳重新產(chǎn)生由下面等式給出x^i=(2si-1)(Σj=M-1Tbi,j2j+Σj=T-1-∞Pj2j)-----(11)]]>第一求和是所述位平面符號的重構(gòu)，并且第二求和是拉普拉斯pdf上對應(yīng)位平面符號的內(nèi)插(interpolation)。
當(dāng)滿足了預(yù)定的標(biāo)準(zhǔn)時，可以終止所述第二求和，例如當(dāng)獲得了預(yù)期數(shù)據(jù)源的質(zhì)量。
在本發(fā)明的可選實(shí)施例中，基于對先前位平面符號編碼所獲的信息，自適應(yīng)地確定所述位平面符號的概率分配Pj。當(dāng)如同在大多實(shí)際情況中，所述拉普拉斯pdf的分布參數(shù)σ是未知時，所述自適應(yīng)位平面編碼(ABPC，adaptive bit-plane coding)過程是有用的。
當(dāng)給定k個不同符號的流時，從Lidston的成功定律(Lidston’s Law ofSuccess)開始，如果在過去n個情況中第i個符號發(fā)生了ni次，使用下面等式來估計第i個符號發(fā)生的概率估計Pr(i|{ni}，n)＝(ni+λ)/(n+kλ)(12)其中λ是正參數(shù)。通過如下重寫等式(12)，可以看出等式(12)是最大似然估計ni/n和在先平均(uniform prior)1/k的內(nèi)插。
Pr(i|{ni}，n)＝μ(ni/n)+(1-μ)(1/k) (13)其中替換了μ＝n/(n+kλ) (14)在本發(fā)明的實(shí)施例中應(yīng)用等式(13)給出Pj=NaNPjNa+(1-NaN)PjML---(15)]]>其中Na是直到先前位平面結(jié)束為止，被編碼的位平面符號的數(shù)目，N是在當(dāng)前位平面符號中，被編碼的位平面符號的數(shù)目，PjNa是觀察了Na個位平面符號之后的Pj的估計，PjML是針對當(dāng)前位平面的Pj的最大似然估計，以及μ給出了所述兩個概率估計之間的內(nèi)插，μ由下式給出μ＝1-(Na/N) (16)由于針對在第j個位平面的N個符號bi，j的Pj的最大似然估計如下給出PjN=Σj=1Nbi,jN------(17)]]>因此，可以定義PjML為PjML=Σj=1N-Nabi,jN-Na---(18)]]>
優(yōu)選地，通過等式(10)，利用下面等式可以從先前位平面Pj+1Na來更新PjNaPjNa=Pj+1Na1-Pj+1Na+Pj+1Na---(19)]]>所述實(shí)施例目前涉及找出給數(shù)據(jù)源的每個位平面符號的概率分配。
在本發(fā)明的另一個實(shí)施例中，采用了“兩個步驟(two-pass)”的方法，其中對于將被所述熵編碼器使用來對所述位平面符號的二進(jìn)制流進(jìn)行編碼的每個位平面的概率分配，是通過統(tǒng)計將被編碼的數(shù)據(jù)向量來確定的。
在所述實(shí)施例中，從多個離散的位平面中選出稱為惰性平面的最佳位平面。所述編碼單元104將所選的惰性平面上的信息發(fā)送給所述譯碼單元105，從而可以正確地譯碼被編碼的數(shù)據(jù)134。
圖3示出了根據(jù)本發(fā)明的所述實(shí)施例的、修改過的位平面編碼系統(tǒng)的一般結(jié)構(gòu)。
所述統(tǒng)計模型單元121接收包含于被編碼的數(shù)據(jù)134中的所選惰性平面上的信息。所述統(tǒng)計模型單元121產(chǎn)生將被所述熵譯碼器122接收的概率分配136，以使可以正確地譯碼所述被編碼的數(shù)據(jù)134的位平面符號。然后所述位平面重構(gòu)單元120接收所述被譯碼的位平面符號135，以重構(gòu)位平面來產(chǎn)生代表數(shù)據(jù)源的位符號130的輸出數(shù)據(jù)138。
考慮碼族(code family)由下式給出C＝{GL|L∈Z} (21)其中GL表示數(shù)據(jù)源的位平面符號，并且L是表示惰性平面的整數(shù)。
根據(jù)本發(fā)明的所述實(shí)施例的概率分配由下式給出QjL=11+22j-L,j&GreaterEqual;L12,j<L-----(22)]]>其中QjL是給第j個位平面的概率分配，所述位平面遵循如針對i≥L的位平面的等式(19)所定義的概率更新規(guī)則，并且進(jìn)入針對i＜L的位平面的“惰性模式”(由于可以通過將所述輸入符號直接輸出給被編碼的二進(jìn)制流而獲得針對1/2的概率分配的編碼)。所述碼族C可以被稱作位平面戈龍碼(BPGC，Bit-Plane Golomb Code)。
通過找出最能滿足下面不等式的L的整數(shù)值，可以獲得所述惰性平面L。
φ2-L+1≤θ＜φ2-L(23)其中L是代表最佳位平面的整數(shù)，φ被定義為并且θ被定義為θ=Δe-2σ2-----(24)]]>當(dāng)已知例如長度和輸入數(shù)據(jù)向量的絕對值和的充足的統(tǒng)計時，可以進(jìn)一步簡化(23)的判決規(guī)則為L＝min{|L∈Z|2L+1N≥A} (25)其中N是所述輸入數(shù)據(jù)向量的長度，并且A是所述輸入數(shù)據(jù)向量的絕對值和。
可以利用[3]中描述的算法來實(shí)現(xiàn)如所述實(shí)施例中描述的選擇過程。當(dāng)[3]中算法被用于確定L的值時，僅可以確定L的正整數(shù)范圍。為了擴(kuò)展序列L的范圍到負(fù)整數(shù)，要對[3]中描述的算法進(jìn)行修改。
具體地，[3]的修改算法為if(N＜＝A)for(L＝1；(N＜＜(L+1))＜A；L++)elsefor(L＝-1；(N＞＞(-L))＜＝A；L--))當(dāng)確定了惰性平面L之后，可以確定將被所述熵編碼器使用來對所述位平面符號的二進(jìn)制流進(jìn)行編碼的位平面的概率分配。
在本發(fā)明的另一個可選實(shí)施例中，基于每個位平面與所述最佳位平面的關(guān)系，利用下面的等式來確定給所述每個位平面的概率分配QjL=122j-L,j&GreaterEqual;L12,j<L------(26)]]>其中L是代表如可以由(23)來確定的最佳位平面的整數(shù)。
在所述實(shí)施例中，由(26)所給出的概率分配因此能夠使用如[4]中所描述的偏斜編碼器(skew coder)，來作為以極低的復(fù)雜度實(shí)現(xiàn)的熵編碼器而不是一般算法編碼器。[4]的偏斜編碼器能夠?qū)㈧鼐幋a過程簡化為較小數(shù)目的比特偏移，和限制對應(yīng)于最小可能符號(LPS，least probablesymbol)的二次方的概率區(qū)間寬度的附加操作。另外，在對一連串連續(xù)最大可能符號(MPS，most probable symbol)的編碼中，[4]的偏斜編碼器保持了實(shí)現(xiàn)加速技術(shù)[6]的唯一簡化，對所述一連串連續(xù)最大可能符號進(jìn)行編碼在對具有較高概率偏斜的位平面的編碼中是典型的。
應(yīng)當(dāng)指出，在所有所描述的本發(fā)明的實(shí)施例中，除了產(chǎn)生BPSC的實(shí)施例以外，應(yīng)當(dāng)優(yōu)選地使用運(yùn)算編碼器作為熵編碼器。
在上面提到的本發(fā)明的兩個實(shí)施例的另一個實(shí)施例中，等式(22)或(26)中確定的給每個位平面符號的概率分配QjL被用來由所述位平面重構(gòu)單元120產(chǎn)生輸出數(shù)據(jù)，所述輸出數(shù)據(jù)代表了數(shù)據(jù)源的位符號130。具體地，一旦所述熵譯碼器122譯碼了被發(fā)送數(shù)據(jù)134的位平面T，根據(jù)本發(fā)明的所述輸出數(shù)據(jù)138的最佳重新產(chǎn)生由下面等式給出x^i=(2si-1)(Σj=M-1Tbi,j2j+Σj=T-1-∞QjL2j)----(27)]]>類似等式(11)，第一求和是所述位平面符號的重構(gòu)，并且第二求和是拉普拉斯pdf上對應(yīng)所述輸出數(shù)據(jù)138的位平面符號的內(nèi)插。
當(dāng)滿足了預(yù)定標(biāo)準(zhǔn)時，可以終止所述第二求和，例如當(dāng)達(dá)到了所述數(shù)據(jù)源的預(yù)期質(zhì)量。
本發(fā)明所描述的實(shí)施例不僅應(yīng)用于方法，而且也應(yīng)用于設(shè)備、計算機(jī)可讀媒介和計算機(jī)程序。
雖然已經(jīng)描述了本發(fā)明的實(shí)施例，但是所述實(shí)施例僅是對本發(fā)明原理的說明。在不脫離本發(fā)明的精神并且不脫離附加權(quán)利要求的范圍的前提下，可以設(shè)計其它實(shí)施例和配置。
本說明書中引用了下列文獻(xiàn)[1]J.li and S.Lie，“An embedded still image coder withrate-distortion optimization”，IEEE Trans.on Image Processing，Vol.9，pp.1158-1170，Jul.2000. J.Rissanen，Stochastic Complexity in Statistical Inquiry，London，U.K.；World scientific，1989. M.J.Weinberger et al，“The LOCO-I lossless image compressionalgorithmprinciples and standardization into JPEG-LS”，IEEE Trans.Image Processing，Vol.9，pp 1309-1324，Aug.2000. G.G.Langdon and J.Rissanen，“A simple general binary sourcecode”，IEEE Trans.Information Theory，Vol.28，pp.800-803，1982. D.Taubman and A.Zakhor，“Multirate 3-D subband coding ofvideo”，IEEE Trans.Image Processing，Vol.3，pp.572-588，Sept.1994. E.Ordentlich et al，“A low-complexity modeling approach forembedded coding of wavelet coefficients”，HP Labs Tech.Reports，HPL-97-150，1997.
權(quán)利要求
1.一種處理由數(shù)據(jù)源產(chǎn)生的位符號的方法，所述數(shù)據(jù)源特別是視頻、靜止圖像或音頻源，所述方法包括下列步驟-利用所述數(shù)據(jù)源產(chǎn)生的位符號來構(gòu)建多個位平面，每個位平面包括多個位平面符號；-掃描所述每個位平面的位平面符號，以產(chǎn)生位平面符號的二進(jìn)制流；-利用統(tǒng)計模型對所述位平面符號的二進(jìn)制流進(jìn)行編碼，其中，所述統(tǒng)計模型是基于表征所述數(shù)據(jù)源的拉普拉斯概率分布函數(shù)的統(tǒng)計特性的。
2.根據(jù)權(quán)利要求1的方法，其中，由熵編碼器來對所述位平面符號的二進(jìn)制流進(jìn)行編碼。
3.根據(jù)權(quán)利要求2的方法，其中，運(yùn)算編碼器被用作所述熵編碼器。
4.根據(jù)權(quán)利要求1到3的任何一個的方法，其中所述拉普拉斯概率分布函數(shù)由下式定義f(x)=e-|x|2σ22σ2]]>其中，σ是拉普拉斯概率分布函數(shù)的標(biāo)準(zhǔn)偏差。
5.根據(jù)權(quán)利要求4的方法，其中，基于所述拉普拉斯概率分布函數(shù)確定給每個位平面符號的概率分配，并且所述概率分配被用于確定對所述位平面符號的二進(jìn)制流進(jìn)行編碼的統(tǒng)計模型。
6.根據(jù)權(quán)利要求5的方法，其中，給所述位平面符號的概率分配由下式確定Pj=1-(1+e-2j2σ2)-1,j=M-1,M-2...]]>其中Pj是給所述位平面符號的概率分配，并且j是所述位平面。
7.根據(jù)權(quán)利要求4的方法，其中，基于先前被編碼的位平面符號來確定給每個位平面符號的概率分配。
8.根據(jù)權(quán)利要求7的方法，其中，給所述位平面符號的概率分配由下式確定Pj=NaNPjNa+(1-NaN)PjML]]>其中Pj是給當(dāng)前位平面符號的概率分配，j是所述位平面，Na是直到所述先前位平面結(jié)束為止，被編碼的位平面符號的數(shù)目，N是直到當(dāng)前位平面符號為止，被編碼的位平面符號的數(shù)目，PjNa是觀察了Na個位平面符號之后的Pj的估計，PjML是針對當(dāng)前位平面的Pj的最大似然估計，并且被定義為PjML=Σj=1N-Nabi,jN-Na]]>其中，bi，j是所述位平面符號。
9.根據(jù)權(quán)利要求8的方法，其中，在觀察了Na個位平面符號之后的Pj的估計，PjNa，可以由下式更新PjNa=Pj+1Na1-Pj+1Na+Pj+1Na]]>其中，Pj+1Na是來自所述先前位平面的Pj的估計。
10.根據(jù)權(quán)利要求4的方法，還包括下列步驟-從所述多個被構(gòu)建的位平面來確定最佳位平面；-基于每個位平面與所述最佳位平面的關(guān)系，確定給所述每個位平面的概率分配；-其中，給所述位平面的概率分配被用于對所述位平面符號的二進(jìn)制流進(jìn)行編碼的統(tǒng)計模型。
11.根據(jù)權(quán)利要求10的方法，其中，通過確定最滿足下式的整數(shù)，來確定所述最佳位平面φ2-L+1≤θ＜φ2-L其中L是代表所述最佳位平面的整數(shù)，φ被定義為 θ由下式定義θ=Δe-2σ2]]>
12.根據(jù)權(quán)利要求11的方法，其中，所述位平面的概率分配由下式確定QjL=11+22j-L,j&GreaterEqual;L12,j<L]]>其中QjL是給第j個位平面的概率分配。
13.根據(jù)權(quán)利要求11的方法，其中，所述位平面的概率分配由下式確定QjL=122j-L,j&GreaterEqual;L12,j<L]]>其中QjL是給第j個位平面的概率分配。
14.根據(jù)權(quán)利要求6或8的方法，還包括下列步驟-利用另一個統(tǒng)計模型對所述被編碼的位平面符號的二進(jìn)制流進(jìn)行譯碼，以產(chǎn)生另一個位平面符號的二進(jìn)制流，-利用另一個位平面符號的二進(jìn)制流來重構(gòu)包括所述位平面符號的多個位平面，其中，所述另一個統(tǒng)計模型是基于拉普拉斯概率分布函數(shù)的統(tǒng)計特性的，該拉普拉斯概率分布函數(shù)表征了所述被重構(gòu)的位平面的位平面符號。
15.根據(jù)權(quán)利要求14的方法，其中，通過下式從所述位平面重構(gòu)所述數(shù)據(jù)源x^i=(2si-1)(Σj=M-1Tbi,j2j+Σj=T-1-∞Pj2j)]]>其中xi是所述被重構(gòu)的數(shù)據(jù)源，xi是i的標(biāo)記符號，bi，j是所述位平面符號，以及T是所述被編碼的位平面符號的二進(jìn)制流被終止的位平面。
16.根據(jù)權(quán)利要求12或13的方法，還包括下列步驟-利用另一個統(tǒng)計模型對所述被編碼的位平面符號的二進(jìn)制流進(jìn)行譯碼，以產(chǎn)生另一個位平面符號的二進(jìn)制流，-利用另一個位平面符號的二進(jìn)制流來重構(gòu)包括所述位平面符號的多個位平面，其中，另一個統(tǒng)計模型是基于拉普拉斯概率分布函數(shù)的統(tǒng)計特性的，該拉普拉斯概率分布函數(shù)表征了所述被重構(gòu)的位平面的位平面符號。
17.根據(jù)權(quán)利要求16的方法，其中，通過下式從所述位平面重構(gòu)所述數(shù)據(jù)源x^i=(2si-1)(Σj=M-1Tbi,j2j+Σj=T-1-∞QjL2j)]]>其中xi是所述被重構(gòu)的數(shù)據(jù)源，si是i的標(biāo)記符號，bi，j是所述位平面符號，以及T是所述被編碼的位平面符號的二進(jìn)制流被終止的位平面。
18.一種用于處理由數(shù)據(jù)源產(chǎn)生的位符號的設(shè)備，所述數(shù)據(jù)源特別是視頻、靜止圖像或音頻源，所述設(shè)備包括-位平面構(gòu)建單元，其用于從所述數(shù)據(jù)源構(gòu)建多個位平面，每個位平面包括多個位平面符號，并且掃描所述每個位平面的位平面符號，以產(chǎn)生位平面符號的二進(jìn)制流，-統(tǒng)計模型單元，其用于基于表征所述數(shù)據(jù)源的拉普拉斯概率分布函數(shù)的統(tǒng)計特性來提供統(tǒng)計信息，-編碼單元，其用于基于由所述統(tǒng)計模型單元提供的統(tǒng)計信息，對所述位平面符號的二進(jìn)制流進(jìn)行編碼。
19.一種具有被記錄在其上的程序的計算機(jī)可讀媒介，其中，所述程序可以使計算機(jī)執(zhí)行處理數(shù)據(jù)源的位符號的過程，所述過程包括下列步驟-利用所述數(shù)據(jù)源產(chǎn)生的位符號來構(gòu)建多個位平面，每個位平面包括多個位平面符號；-掃描每個位平面的位平面符號，以產(chǎn)生所述位平面符號的二進(jìn)制流；-利用統(tǒng)計模型來對所述位平面符號的二進(jìn)制流進(jìn)行編碼，其中，所述統(tǒng)計模型是基于表征所述數(shù)據(jù)源的拉普拉斯概率分布函數(shù)的統(tǒng)計特性的。
20.一種計算機(jī)程序單元，其可以使計算機(jī)執(zhí)行處理由數(shù)據(jù)源產(chǎn)生的位符號的過程，所述過程包括下列步驟-利用由所述數(shù)據(jù)源產(chǎn)生的位符號來構(gòu)建多個位平面，每個位平面包括多個位平面符號；-掃描所述每個位平面的位平面符號，以產(chǎn)生所述位平面符號的二進(jìn)制流；-利用統(tǒng)計模型來對所述位平面符號的二進(jìn)制流進(jìn)行編碼，其中，所述統(tǒng)計模型是基于表征所述數(shù)據(jù)源的拉普拉斯概率分布函數(shù)的統(tǒng)計特性的，其中，所述數(shù)據(jù)源具有拉普拉斯概率分布函數(shù)的形式。
全文摘要
一種處理由數(shù)據(jù)源產(chǎn)生的位符號的方法，所述數(shù)據(jù)源特別是視頻、靜止圖像或音頻源，所述方法包括下列步驟從所述數(shù)據(jù)源構(gòu)建多個位平面，每個位平面包括多個位平面符號；掃描所述每個位平面的位平面符號，以產(chǎn)生位平面符號的二進(jìn)制流；以及利用統(tǒng)計模型對所述位平面符號的二進(jìn)制流進(jìn)行編碼，其中，所述統(tǒng)計模型是基于表征所述數(shù)據(jù)源的拉普拉斯概率分布函數(shù)的統(tǒng)計特性的。
文檔編號H04N7/26GK1695306SQ02829942
公開日2005年11月9日申請日期2002年10月24日優(yōu)先權(quán)日2002年10月24日
發(fā)明者俞容山, 王逸平, 林曉申請人:新加坡科技研究局

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：俞容山;王逸平;林曉
技術(shù)所有人：新加坡科技研究局
我是此專利的發(fā)明人

上一篇：在umts系統(tǒng)中的報頭檢測和數(shù)據(jù)速率控制的制作方法
上一篇：便攜設(shè)備的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

符號文字生成器相關(guān)技術(shù)

符號生成器相關(guān)技術(shù)

特殊符號生成器相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

處理位符號的方法和設(shè)備、計算機(jī)可讀媒介、計算機(jī)程序單元的制作方法

處理位符號的方法和設(shè)備、計算機(jī)可讀媒介、計算機(jī)程序單元的制作方法