亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

處理位符號的方法和設(shè)備、計算機(jī)可讀媒介、計算機(jī)程序單元的制作方法

文檔序號:7760058閱讀:255來源:國知局
專利名稱:處理位符號的方法和設(shè)備、計算機(jī)可讀媒介、計算機(jī)程序單元的制作方法
背景技術(shù)
在視頻、圖像和音頻處理中,嵌入式編碼已經(jīng)引起了許多注意。這是因?yàn)榍度胧骄幋a允許編碼器在任何點(diǎn)終止編碼過程,以滿足預(yù)定的目標(biāo)比特速率。另外,譯碼器可以在任何點(diǎn)截短比特流,并且仍能夠獲得被譯碼的視頻、圖像或音頻的相對優(yōu)良的質(zhì)量。換言之,理想的嵌入式編碼系統(tǒng)能夠提供速率失真的最佳截短比特流,使得所述系統(tǒng)成為用于構(gòu)建具有精細(xì)可伸縮性(FGS,F(xiàn)ine Granularity Scalability)的系統(tǒng)的理想的編碼工具。
由于位平面編碼(BPC,bit-plane coding)簡單,連續(xù)位平面編碼是實(shí)現(xiàn)嵌入式編碼系統(tǒng)的常用方法。在BPC中,來自數(shù)據(jù)源的輸入數(shù)據(jù)向量在位平面中被說明,并且然后從代表輸入數(shù)據(jù)向量的最高有效位(MSB)的最高有效位平面開始,到代表輸入數(shù)據(jù)向量最低有效位(LSB)的最低有效位平面,對所述位平面進(jìn)行連續(xù)地編碼。除了所述編碼的結(jié)構(gòu)簡單以外,從輸入數(shù)據(jù)向量的MSB到LSB的所述編碼序列滿足如[1]中公開的嵌入式編碼過程的原理,其中應(yīng)該首先對最影響視頻/圖像/音頻數(shù)據(jù)質(zhì)量的比特進(jìn)行編碼。
通常,實(shí)現(xiàn)給出速率失真曲線的最佳值的位平面編碼是很復(fù)雜的,并且需要較高的計算資源。這是因?yàn)閷τ谕ǔ5臄?shù)據(jù)源,在位平面之間以及數(shù)據(jù)采樣之間存在統(tǒng)計相關(guān)性。為了捕獲所述相關(guān)性,熵編碼器必須使用具有大量條目的頻率表,這不僅增加了所述熵編碼器的復(fù)雜度,而且可能導(dǎo)致最終退化編碼性能的大量的建模開銷[2]。因此,大多位平面編碼的實(shí)際實(shí)現(xiàn)通常采用折衷的方法以減小計算復(fù)雜度,但是不幸的是,這導(dǎo)致了性能退化。
因此,希望具有給出速率失真曲線的最佳值的位平面編碼過程,其具有較低的計算復(fù)雜度,并且還不會導(dǎo)致性能上的嚴(yán)重退化。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種具有較低計算復(fù)雜度的嵌入式編碼方案,但是該方案具有與上述任何系統(tǒng)可以比擬的性能。
通過獨(dú)立的權(quán)利要求的特性可以達(dá)到所述目的。其它特性由附屬權(quán)利要求產(chǎn)生。
本發(fā)明涉及一種用于處理由數(shù)據(jù)源產(chǎn)生的位符號的方法,所述數(shù)據(jù)源特別是視頻、靜止圖像或音頻源,所述方法包括下列步驟使用所述數(shù)據(jù)源產(chǎn)生的位符號來構(gòu)建多個位平面,每個位平面包括多個位平面符號。掃描每個位平面的位平面符號以產(chǎn)生位平面符號的二進(jìn)制流,并且利用統(tǒng)計模型對所述位平面符號的二進(jìn)制流進(jìn)行編碼,其中所述統(tǒng)計模型是基于表征數(shù)據(jù)源的拉普拉斯概率分布函數(shù)的統(tǒng)計特性的。
首先以形成多個位平面的方式,來安排由包括多個輸入數(shù)據(jù)向量的數(shù)據(jù)源所產(chǎn)生的位符號。每個位平面包括對應(yīng)于所述數(shù)據(jù)源的每個位符號的多個位平面符號。
所述數(shù)據(jù)源可以涉及任何類型的數(shù)據(jù)信號,所述數(shù)據(jù)信號可以由捕獲設(shè)備所捕獲以進(jìn)行進(jìn)一步處理。具體地,本說明書中的數(shù)據(jù)源涉及視頻、圖像或音頻源,其可以分別由錄像機(jī)、照相機(jī)和麥克風(fēng)來捕獲以進(jìn)行進(jìn)一步處理。
開始于位平面,對所有位平面符號進(jìn)行掃描以按照一定的方式來選擇位平面符號,從而產(chǎn)生所述位平面符號的二進(jìn)制流,所述位平面優(yōu)選地包括輸入數(shù)據(jù)向量的MSB。然后利用統(tǒng)計模型對由掃描過程所產(chǎn)生的位平面符號的二進(jìn)制流進(jìn)行編碼?;谒鰯?shù)據(jù)源的拉普拉斯概率分布函數(shù)(pdf)的統(tǒng)計特性而產(chǎn)生統(tǒng)計模型,所述數(shù)據(jù)源特別是視頻/圖像/音頻源。
利用基于拉普拉斯pdf的統(tǒng)計特性的統(tǒng)計模型來對位平面符號的二進(jìn)制流進(jìn)行編碼的優(yōu)勢在于,基于所述類型的統(tǒng)計模型的編碼過程的計算復(fù)雜度非常低。當(dāng)所述統(tǒng)計模型是基于一般的pdf的統(tǒng)計特性時,需要在編碼器中維持特別大的概率表,這對于具有有限的計算資源和存儲容量的應(yīng)用而言是不合適的。為了克服所述問題,根據(jù)現(xiàn)有技術(shù)狀態(tài)的多數(shù)BPC方案僅對位平面符號的有限子集進(jìn)行熵編碼,所述位平面符號具有非常偏斜的分布,這導(dǎo)致了編碼效率的嚴(yán)重?fù)p失。
通過利用根據(jù)本發(fā)明的所述數(shù)據(jù)源的拉普拉斯pdf的統(tǒng)計特性,消除了對所述大概率表的需求,這大大降低了計算復(fù)雜度,并且還沒有任何質(zhì)量上的嚴(yán)重?fù)p失。
根據(jù)本發(fā)明的編碼方法使用熵編碼過程,所述過程是一種基于統(tǒng)計模型的數(shù)據(jù)壓縮形式。優(yōu)選地,運(yùn)算編碼器被用作熵編碼器來對通過掃描過程所產(chǎn)生的位平面符號的二進(jìn)制流進(jìn)行編碼。
由于熵編碼提供了良好的壓縮率,因此熵編碼過程的運(yùn)算編碼是優(yōu)選的。
拉普拉斯pdf可以利用下面的函數(shù)來定義f(x)=e-|x|2σ22σ2]]>其中σ是所述拉普拉斯pdf的標(biāo)準(zhǔn)偏差或分布參數(shù)。
根據(jù)本發(fā)明的實(shí)施例,使用上面的拉普拉斯pdf等式來確定給每個位平面符號的概率分配。所確定的概率分配隨后被用于確定對位平面符號的二進(jìn)制流進(jìn)行編碼的統(tǒng)計模型。
具體地,給每個所述位平面符號的概率分配由下式來確定Pj=1-[1+e-2/2σ2]-1,j=M-1,M-2...]]>其中,Pj是給所述位平面符號的概率分配,并且j表示所述位平面。
從所述拉普拉斯pdf獲得上面的概率分配等式,并且所述概率分配等式被用于確定每個位平面符號的概率。特別是運(yùn)算編碼器的編碼器隨后使用所述數(shù)據(jù)源的概率或統(tǒng)計信息用來對位平面符號的二進(jìn)制流進(jìn)行編碼。
由于所述拉普拉斯pdf的統(tǒng)計特性,大大減小了確定每個位平面的概率分布的復(fù)雜度。
在另一個實(shí)施例中,其中所述標(biāo)準(zhǔn)偏差σ不是已知的,基于先前被編碼的位平面符號的信息,來確定給每個位平面符號的概率分配。
當(dāng)所述數(shù)據(jù)源的統(tǒng)計特性的信息未知時,或當(dāng)所述數(shù)據(jù)源是非平穩(wěn)的,所述自適應(yīng)過程在實(shí)際應(yīng)用中是非常有用的。在所述情況下,基于從先前被編碼的位平面符號所獲得的信息來確定所述數(shù)據(jù)源的統(tǒng)計特性。
具體地,在所述實(shí)施例中,給每個位平面符號的概率分配由下式給出Pj=NaNPjNa+(1-NaN)PjML]]>其中Pj是給所述位平面符號的概率分配,Na是直到先前的位平面結(jié)束為止,被編碼的位平面符號的數(shù)目。
N是直到當(dāng)前位平面符號為止,被編碼的位平面符號的數(shù)目。
PjNa是在觀察了Na個位平面符號之后的Pj的估計,PjML是針對當(dāng)前位平面的Pj的最大似然估計,并且被定義為PjML=Σj=1N-Nabi,jN-Na]]>其中bi,j是所述位平面符號。
優(yōu)選地,來自先前被編碼的位平面的Pj的估計,PjNa,可以利用下式通過從先前的位平面更新來估計PjNa=Pj+1Na1-Pj+1Na+Pj+1Na]]>其中Pj+1Na是來自先前位平面的Pj的估計。
在本發(fā)明的另一個實(shí)施例中,用于處理由數(shù)據(jù)源產(chǎn)生的位符號的方法還包括以下步驟從將被編碼的輸入數(shù)據(jù)向量中確定最佳位平面(稱為惰性平面(lazy plane)),基于每個位平面與惰性平面的關(guān)系來確定給每個位平面的概率分配,其中給所述位平面的概率分配被用于對位平面符號的二進(jìn)制流進(jìn)行編碼的統(tǒng)計模型。
在所述實(shí)施例中,由于給每個位平面的概率分配由與所述惰性平面的關(guān)系來明確地確定,因此進(jìn)一步降低了所述編碼過程的計算復(fù)雜度。
首先,所述惰性平面從多個位平面中被選出。所述惰性平面由整數(shù)L表示,L滿足下面的不等式φ2-L+1≤θ<φ2-L其中φ被定義為 并且θ被定義為θ=Δe-2σ2]]>上述決策規(guī)則實(shí)際上將分布參數(shù)σ的支持分割為分離的區(qū)域,并且指定對應(yīng)于每個分割區(qū)域的惰性平面,以使所述惰性平面滿足上面的不等式。
在根據(jù)本發(fā)明確定所述惰性平面之后,確定給每個位平面的概率分配。所述給每個位平面的概率分配是基于該位平面與最佳位平面的關(guān)系的,如下式所給出的QjL=11+22j-L,j≥L12,j<L]]>其中QJL是給第j個位平面的概率分配。
可選地,當(dāng)已知長度和所述數(shù)據(jù)源的輸入數(shù)據(jù)向量的絕對值和時,所述惰性平面可以利用下面的等式來確定L=min{L∈Z|2L+1N≥A}其中N是輸入數(shù)據(jù)向量的長度,并且A是輸入數(shù)據(jù)向量的絕對值和。
所述最佳位平面的確定可以通過稍微修改[3]中所公開的算法來實(shí)現(xiàn),以擴(kuò)展序列(order)L的范圍到負(fù)整數(shù)。
在另一個可選實(shí)施例中,利用下面的等式來確定基于每個位平面與所述惰性平面的關(guān)系的給每個位平面的概率分配QjL=122j-L,j≥L12,j<L]]>在所述實(shí)施例中,可以利用[4]中所公開的偏斜編碼器來實(shí)現(xiàn)編碼器。
如上所述,上述兩個可選的實(shí)施例具有進(jìn)一步減少對位平面符號的二進(jìn)制流進(jìn)行編碼的計算復(fù)雜度的優(yōu)勢。
另外,提供了用于處理被編碼的位平面符號的二進(jìn)制流以產(chǎn)生代表所述數(shù)據(jù)源的輸出數(shù)據(jù)的方法,該方法包括這樣的步驟對被編碼的位平面符號的二進(jìn)制流進(jìn)行譯碼,以產(chǎn)生另一個位平面符號的二進(jìn)制流,以使可以重構(gòu)包括所述位平面符號的多個位平面。通過另一個統(tǒng)計模型所分配的概率,重構(gòu)所述多個位平面,并且因此可以重構(gòu)代表所述輸入數(shù)據(jù)源向量的輸出數(shù)據(jù)。所述統(tǒng)計模型是基于表征所述位平面符號的拉普拉斯概率分布函數(shù)的。
所述位平面符號的二進(jìn)制流的譯碼過程中產(chǎn)生的統(tǒng)計模型與被用于編碼過程的統(tǒng)計模型相同。換言之,被用于在編碼過程中形成所述統(tǒng)計模型的概率分配,Pj或QjL,在譯碼過程中被重新產(chǎn)生。
因此利用與在編碼過程中所利用的統(tǒng)計模型相同的統(tǒng)計模型來重構(gòu)所述多個位平面,這導(dǎo)致所述被重構(gòu)的輸出數(shù)據(jù)與原始數(shù)據(jù)源直到所述位平面完全相同,其中譯碼器終止被編碼的位平面符號的二進(jìn)制流。
另外,通過由所述統(tǒng)計模型所分配的概率,產(chǎn)生了源向量的最佳均方誤差(MSE)重構(gòu)。具體地,使用所述概率分配Pj來形成編碼過程中的統(tǒng)計模型,并且利用下式來重構(gòu)所述數(shù)據(jù)源x^i=(2si-1)(Σj=M-1Tbi,j2j+Σj=T-1-∞Pj2j)]]>其中xi是被重構(gòu)的數(shù)據(jù)源,以及si是 的標(biāo)記符號,
T是被編碼的位平面符號的二進(jìn)制流被終止的位平面。
同樣地,當(dāng)概率分配QjL被用于形成編碼過程中的統(tǒng)計模型時,利用下式來重構(gòu)所述數(shù)據(jù)源x^i=(2si-1)(Σj=M-1Tbi,j2j+Σj=T-1-∞QjL2j)]]>如同可以從以上所看出的,第二求和 被用于增強(qiáng)重新產(chǎn)生的數(shù)據(jù)源的質(zhì)量,該第二求和一旦達(dá)到預(yù)期質(zhì)量就可以被停止。
本發(fā)明的所述實(shí)施例不僅應(yīng)用于方法,而且也應(yīng)用于設(shè)備、計算機(jī)可讀媒介和計算機(jī)程序。


圖1示出了視頻/圖像/音頻編碼系統(tǒng)的一般結(jié)構(gòu);圖2示出了位平面編碼系統(tǒng)的一般結(jié)構(gòu);圖3示出了根據(jù)本發(fā)明實(shí)施例的位平面編碼的被修改的結(jié)構(gòu)。
具體實(shí)施例方式
圖1示出了視頻/圖像/音頻編碼系統(tǒng)100的一般結(jié)構(gòu)。特別是視頻、圖像或音頻源的數(shù)據(jù)源由捕獲設(shè)備101來接收。所述捕獲設(shè)備101可以是錄像機(jī)、照相機(jī)或麥克風(fēng)以捕獲不同類型的數(shù)據(jù)源。被捕獲的數(shù)據(jù)首先被模數(shù)(A/D)轉(zhuǎn)換器102轉(zhuǎn)換為數(shù)字信號以進(jìn)行進(jìn)一步處理。
位平面編碼系統(tǒng)103(后面將對其進(jìn)行詳細(xì)描述)接收所述A/D轉(zhuǎn)換器中產(chǎn)生的數(shù)據(jù)源的位符號,所述位平面編碼系統(tǒng)包括編碼器單元104和譯碼器單元105。所述編碼單元104對所述位符號進(jìn)行編碼,并且在信道上將所述被編碼的符號發(fā)送給所述譯碼單元105。
所述譯碼單元105對被編碼的符號進(jìn)行譯碼,并且將所述被譯碼的符號發(fā)送給輸出設(shè)備107來顯示,所述輸出設(shè)備例如是數(shù)字電視或數(shù)字照相機(jī)。如果所述輸出設(shè)備107是模擬設(shè)備(例如音頻揚(yáng)聲器),在輸出所述被譯碼的符號到所述輸出設(shè)備107之前,可以使用數(shù)模(D/A)轉(zhuǎn)換器106來將該被譯碼的符號轉(zhuǎn)換為模擬信號。
圖2示出了位平面編碼系統(tǒng)103的一般結(jié)構(gòu),該位平面編碼系統(tǒng)包括編碼單元104和譯碼單元105。所述編碼單元104還包括位平面構(gòu)建和掃描單元110、第一統(tǒng)計模型單元111和熵編碼器112。所述譯碼單元105還包括熵譯碼器122、第二統(tǒng)計模型單元121和位平面重構(gòu)單元120。
在所述編碼過程的開始,所述位平面構(gòu)建和掃描單元110接收所述位符號130。所述位符號130包括多個輸入數(shù)據(jù)向量,該輸入數(shù)據(jù)向量可以被表示為K維輸入數(shù)據(jù)向量x={x1,x2,...,xk}(1)其中從一些字母 的獨(dú)立和相同分布(i.i.d.)的隨機(jī)源中提取xi。
xi也可以被如下表示為二進(jìn)制形式xi=(2si-1)Σi=M-1-∞bi,j.2j,i=1,...,k---(2)]]>其中si是標(biāo)記符號,可以表示為si≅1,xi≥00,xi<0------(3)]]>并且bi,j是幅度符號,其中bi,j∈{0,1}。xi的二進(jìn)制表示也可以被規(guī)范化為整數(shù)M滿足下面的不等式2M-1≤max{|xi|}<2M,i=1,...,k (4)當(dāng)所述位平面構(gòu)建和掃描單元110接收了所述位符號130的每個輸入數(shù)據(jù)向量時,所述輸入數(shù)據(jù)向量被分解為其標(biāo)記符號si和幅度符號bi,j。安排所述輸入數(shù)據(jù)向量的標(biāo)記和幅度符號以形成多個位平面,其中每個位平面包括來自每個輸入數(shù)據(jù)向量的標(biāo)記符號si或幅度符號bi,j。通常,將對應(yīng)于所述輸入數(shù)據(jù)向量的最有效位(MSB,most significant bit)的幅度符號bi,j安排在第一位平面中,并且將第二MSB的幅度符號bi,j安排在第二位平面中等等。也將所述輸入數(shù)據(jù)向量的標(biāo)記符號si安排在另一個單獨(dú)的位平面中。所述位平面的所有標(biāo)記和幅度符號都稱作位平面符號。
一旦構(gòu)建了所述位平面,對所有包括于位平面中的位平面符號進(jìn)行掃描,該掃描開始于包括所述輸入數(shù)據(jù)向量的MSB的位平面。所述掃描過程是為了選擇所述位平面符號以形成位平面符號131的二進(jìn)制流。可以以下列步驟來概述一種可能的掃描過程1.從包括輸入數(shù)據(jù)向量的MSB的位平面j=M-1開始掃描,2.選擇幅度符號bi,j,該符號的所有前面位平面的對應(yīng)幅度符號為“0”bi,M-1=bi,M-2=...=bi,j+1=0。
3.當(dāng)所述幅度符號bi,j為“1”時,也選擇所述標(biāo)記符號si。步驟2)和3)也稱為顯著步驟(significance pass)。
4.選擇沒有在所述顯著步驟中被選擇的幅度符號bi,j。該步驟被稱為精細(xì)步驟(refinement pass)。
5.進(jìn)行到下一個位平面j-1。
迭代進(jìn)行上述步驟直到一定的終止標(biāo)準(zhǔn),例如達(dá)到預(yù)定的比特速率或預(yù)定的速率失真限制時終止所述步驟。
一旦上述掃描過程產(chǎn)生了位平面符號131的二進(jìn)制流,還在熵編碼器112中對所述流進(jìn)行編碼或壓縮。所述數(shù)據(jù)源130的位平面符號的統(tǒng)計特性132被用在統(tǒng)計模型111中以提供概率分配133,該概率分配被用于在所述熵編碼器112中對位平面符號131的二進(jìn)制流進(jìn)行編碼。
在信道上發(fā)送來自所述熵編碼器112的被編碼的數(shù)據(jù)134,隨后由所述熵譯碼器122來接收和譯碼所述數(shù)據(jù)。所述信道可以是因特網(wǎng)、廣域網(wǎng)(WAN)或無線通信網(wǎng)。
所述熵譯碼器122接收被編碼的數(shù)據(jù)134并將其譯碼為位平面符號135的二進(jìn)制流。理論上,所述熵譯碼器122產(chǎn)生的位平面符號135的二進(jìn)制流與位平面符號131的二進(jìn)制流相同。
所述統(tǒng)計模型121使用位平面137的統(tǒng)計以產(chǎn)生與133相同的概率分配136,以使所述位平面符號可以被正確地譯碼。所述位平面重構(gòu)單元120因而使用所述位平面符號135來重構(gòu)位平面,以產(chǎn)生代表所述數(shù)據(jù)源的位符號130的輸出數(shù)據(jù)138。
在希望最佳MSE重構(gòu)的情況下,120也使用所述概率分配136來重新產(chǎn)生輸出數(shù)據(jù)138。
應(yīng)該指出,為了獲得具有通用概率分布函數(shù)的數(shù)據(jù)源的位平面符號131的二進(jìn)制流的最佳壓縮,-log2Pr(si,bi,M-1,...)給出了用于編碼位平面符號的熵編碼器112所需的比特數(shù)目,其中所述概率Pr(si,bi,M-1,...)可以表達(dá)為Pr(si,bi,M-1,...,bi,M-j)=Pr(si)Pr(bi,M-1|si)...Pr(bi,M-j|si,bi,M-1,...,bi,M-j+1)(5)其中,Pr(bi,M-j|si,bi,M-1,...,bi,M-j+1)表示在前面被編碼的位平面上的bi,M-j的條件概率。
實(shí)際上,實(shí)現(xiàn)用于對數(shù)據(jù)源的所有位平面符號進(jìn)行編碼的熵編碼器通常將需要具有大量條目的頻率/概率表。對于以高比特速率編碼而言,在所述頻率表中將被維護(hù)的條目數(shù)量是非常巨大的,并且因此不實(shí)用,尤其是在具有有限的計算和存儲能力的系統(tǒng)中。另外,自適應(yīng)地設(shè)置具有未知分布的數(shù)據(jù)源可能引入大量的建模開銷[2]。因此,在多數(shù)實(shí)際系統(tǒng)中采用了簡單的技術(shù),其中由所述熵編碼器僅對具有非常偏斜分布的位平面符號(在所述顯著步驟中被掃描的那些符號)進(jìn)行編碼,如[5]和[6]中所述。
根據(jù)本發(fā)明,對于位平面編碼,所述熵編碼器112使用多數(shù)數(shù)據(jù)源中內(nèi)在的拉普拉斯概率分布函數(shù)的特性來對所述數(shù)據(jù)源進(jìn)行編碼,所述數(shù)據(jù)源特別是視頻、圖像和音頻源。
具體地,所述統(tǒng)計模型111使用所述數(shù)據(jù)源的拉普拉斯pdf的統(tǒng)計特性,以產(chǎn)生用于對所述位平面符號132的二進(jìn)制流進(jìn)行編碼的概率分配133。所述數(shù)據(jù)源的拉普拉斯pdf可以用下面等式表達(dá)f(x)=e-|x|2σ22σ2------(6)]]>其中,σ是標(biāo)準(zhǔn)偏差,或拉普拉斯pdf的分布參數(shù)。
從(6)中可以容易地驗(yàn)證拉普拉斯源的位平面符號具有下面的獨(dú)立特性Pj=Pr(bi,j=1)=Pr(bi,j=1|si,bi,M-1,...,bi,j+1)(7)Pr(bi,j=0)=Pr(bi,j=0|si,bi,M-1,...,bi,j+1)=1-Pj(8)
Pr(si=1)=Pr(si=0)=0.5 (9)其中,針對所述熵編碼器而言對于每個位平面j的概率分配由(7)-(9)式給出。
通過(6),可以計算PjPj=1-(1+e-2/2σ2)-1,j=M-1,M-2...---(10)]]>當(dāng)已知拉普拉斯pdf的分布參數(shù)σ(或標(biāo)準(zhǔn)偏差)時,使用等式(10)可以直接確定Pj。
當(dāng)確定了Pj后,使用等式(7)到(9)可以確定每個位平面符號的概率,并且熵編碼器112使用所述數(shù)據(jù)源的統(tǒng)計信息,來對所述位平面符號131的二進(jìn)制流進(jìn)行編碼。
可以從上面看到,通過使用所述數(shù)據(jù)源的拉普拉斯pdf的統(tǒng)計特性,不需要根據(jù)現(xiàn)有技術(shù)的大量頻率表的維護(hù),并且因此大大簡化了由所述熵編碼器112對所述二進(jìn)制流131所進(jìn)行的編碼過程。
在本發(fā)明的另一個實(shí)施例中,使用由等式(10)確定的每個位平面符號的概率分配Pj來重新生成二進(jìn)制位平面符號135,所述符號由所述位平面重構(gòu)單元120接收,以產(chǎn)生代表所述數(shù)據(jù)源130的位符號的輸出數(shù)據(jù)138。
具體地,如果需要最佳的MSE重構(gòu),一旦熵譯碼器122譯碼了被編碼的數(shù)據(jù)134的位平面T,根據(jù)本發(fā)明的輸出數(shù)據(jù)138的最佳重新產(chǎn)生由下面等式給出x^i=(2si-1)(Σj=M-1Tbi,j2j+Σj=T-1-∞Pj2j)-----(11)]]>第一求和 是所述位平面符號的重構(gòu),并且第二求和 是拉普拉斯pdf上對應(yīng)位平面符號的內(nèi)插(interpolation)。
當(dāng)滿足了預(yù)定的標(biāo)準(zhǔn)時,可以終止所述第二求和,例如當(dāng)獲得了預(yù)期數(shù)據(jù)源的質(zhì)量。
在本發(fā)明的可選實(shí)施例中,基于對先前位平面符號編碼所獲的信息,自適應(yīng)地確定所述位平面符號的概率分配Pj。當(dāng)如同在大多實(shí)際情況中,所述拉普拉斯pdf的分布參數(shù)σ是未知時,所述自適應(yīng)位平面編碼(ABPC,adaptive bit-plane coding)過程是有用的。
當(dāng)給定k個不同符號的流時,從Lidston的成功定律(Lidston’s Law ofSuccess)開始,如果在過去n個情況中第i個符號發(fā)生了ni次,使用下面等式來估計第i個符號發(fā)生的概率估計Pr(i|{ni},n)=(ni+λ)/(n+kλ)(12)其中λ是正參數(shù)。通過如下重寫等式(12),可以看出等式(12)是最大似然估計ni/n和在先平均(uniform prior)1/k的內(nèi)插。
Pr(i|{ni},n)=μ(ni/n)+(1-μ)(1/k) (13)其中替換了μ=n/(n+kλ) (14)在本發(fā)明的實(shí)施例中應(yīng)用等式(13)給出Pj=NaNPjNa+(1-NaN)PjML---(15)]]>其中Na是直到先前位平面結(jié)束為止,被編碼的位平面符號的數(shù)目,N是在當(dāng)前位平面符號中,被編碼的位平面符號的數(shù)目,PjNa是觀察了Na個位平面符號之后的Pj的估計,PjML是針對當(dāng)前位平面的Pj的最大似然估計,以及μ給出了所述兩個概率估計之間的內(nèi)插,μ由下式給出μ=1-(Na/N) (16)由于針對在第j個位平面的N個符號bi,j的Pj的最大似然估計如下給出PjN=Σj=1Nbi,jN------(17)]]>因此,可以定義PjML為PjML=Σj=1N-Nabi,jN-Na---(18)]]>
優(yōu)選地,通過等式(10),利用下面等式可以從先前位平面Pj+1Na來更新PjNaPjNa=Pj+1Na1-Pj+1Na+Pj+1Na---(19)]]>所述實(shí)施例目前涉及找出給數(shù)據(jù)源的每個位平面符號的概率分配。
在本發(fā)明的另一個實(shí)施例中,采用了“兩個步驟(two-pass)”的方法,其中對于將被所述熵編碼器使用來對所述位平面符號的二進(jìn)制流進(jìn)行編碼的每個位平面的概率分配,是通過統(tǒng)計將被編碼的數(shù)據(jù)向量來確定的。
在所述實(shí)施例中,從多個離散的位平面中選出稱為惰性平面的最佳位平面。所述編碼單元104將所選的惰性平面上的信息發(fā)送給所述譯碼單元105,從而可以正確地譯碼被編碼的數(shù)據(jù)134。
圖3示出了根據(jù)本發(fā)明的所述實(shí)施例的、修改過的位平面編碼系統(tǒng)的一般結(jié)構(gòu)。
所述統(tǒng)計模型單元121接收包含于被編碼的數(shù)據(jù)134中的所選惰性平面上的信息。所述統(tǒng)計模型單元121產(chǎn)生將被所述熵譯碼器122接收的概率分配136,以使可以正確地譯碼所述被編碼的數(shù)據(jù)134的位平面符號。然后所述位平面重構(gòu)單元120接收所述被譯碼的位平面符號135,以重構(gòu)位平面來產(chǎn)生代表數(shù)據(jù)源的位符號130的輸出數(shù)據(jù)138。
考慮碼族(code family)由下式給出C={GL|L∈Z} (21)其中GL表示數(shù)據(jù)源的位平面符號,并且L是表示惰性平面的整數(shù)。
根據(jù)本發(fā)明的所述實(shí)施例的概率分配由下式給出QjL=11+22j-L,j≥L12,j<L-----(22)]]>其中QjL是給第j個位平面的概率分配,所述位平面遵循如針對i≥L的位平面的等式(19)所定義的概率更新規(guī)則,并且進(jìn)入針對i<L的位平面的“惰性模式”(由于可以通過將所述輸入符號直接輸出給被編碼的二進(jìn)制流而獲得針對1/2的概率分配的編碼)。所述碼族C可以被稱作位平面戈龍碼(BPGC,Bit-Plane Golomb Code)。
通過找出最能滿足下面不等式的L的整數(shù)值,可以獲得所述惰性平面L。
φ2-L+1≤θ<φ2-L(23)其中L是代表最佳位平面的整數(shù),φ被定義為 并且θ被定義為θ=Δe-2σ2-----(24)]]>當(dāng)已知例如長度和輸入數(shù)據(jù)向量的絕對值和的充足的統(tǒng)計時,可以進(jìn)一步簡化(23)的判決規(guī)則為L=min{|L∈Z|2L+1N≥A} (25)其中N是所述輸入數(shù)據(jù)向量的長度,并且A是所述輸入數(shù)據(jù)向量的絕對值和。
可以利用[3]中描述的算法來實(shí)現(xiàn)如所述實(shí)施例中描述的選擇過程。當(dāng)[3]中算法被用于確定L的值時,僅可以確定L的正整數(shù)范圍。為了擴(kuò)展序列L的范圍到負(fù)整數(shù),要對[3]中描述的算法進(jìn)行修改。
具體地,[3]的修改算法為if(N<=A)for(L=1;(N<<(L+1))<A;L++)elsefor(L=-1;(N>>(-L))<=A;L--))當(dāng)確定了惰性平面L之后,可以確定將被所述熵編碼器使用來對所述位平面符號的二進(jìn)制流進(jìn)行編碼的位平面的概率分配。
在本發(fā)明的另一個可選實(shí)施例中,基于每個位平面與所述最佳位平面的關(guān)系,利用下面的等式來確定給所述每個位平面的概率分配QjL=122j-L,j≥L12,j<L------(26)]]>其中L是代表如可以由(23)來確定的最佳位平面的整數(shù)。
在所述實(shí)施例中,由(26)所給出的概率分配因此能夠使用如[4]中所描述的偏斜編碼器(skew coder),來作為以極低的復(fù)雜度實(shí)現(xiàn)的熵編碼器而不是一般算法編碼器。[4]的偏斜編碼器能夠?qū)㈧鼐幋a過程簡化為較小數(shù)目的比特偏移,和限制對應(yīng)于最小可能符號(LPS,least probablesymbol)的二次方的概率區(qū)間寬度的附加操作。另外,在對一連串連續(xù)最大可能符號(MPS,most probable symbol)的編碼中,[4]的偏斜編碼器保持了實(shí)現(xiàn)加速技術(shù)[6]的唯一簡化,對所述一連串連續(xù)最大可能符號進(jìn)行編碼在對具有較高概率偏斜的位平面的編碼中是典型的。
應(yīng)當(dāng)指出,在所有所描述的本發(fā)明的實(shí)施例中,除了產(chǎn)生BPSC的實(shí)施例以外,應(yīng)當(dāng)優(yōu)選地使用運(yùn)算編碼器作為熵編碼器。
在上面提到的本發(fā)明的兩個實(shí)施例的另一個實(shí)施例中,等式(22)或(26)中確定的給每個位平面符號的概率分配QjL被用來由所述位平面重構(gòu)單元120產(chǎn)生輸出數(shù)據(jù),所述輸出數(shù)據(jù)代表了數(shù)據(jù)源的位符號130。具體地,一旦所述熵譯碼器122譯碼了被發(fā)送數(shù)據(jù)134的位平面T,根據(jù)本發(fā)明的所述輸出數(shù)據(jù)138的最佳重新產(chǎn)生由下面等式給出x^i=(2si-1)(Σj=M-1Tbi,j2j+Σj=T-1-∞QjL2j)----(27)]]>類似等式(11),第一求和 是所述位平面符號的重構(gòu),并且第二求和 是拉普拉斯pdf上對應(yīng)所述輸出數(shù)據(jù)138的位平面符號的內(nèi)插。
當(dāng)滿足了預(yù)定標(biāo)準(zhǔn)時,可以終止所述第二求和,例如當(dāng)達(dá)到了所述數(shù)據(jù)源的預(yù)期質(zhì)量。
本發(fā)明所描述的實(shí)施例不僅應(yīng)用于方法,而且也應(yīng)用于設(shè)備、計算機(jī)可讀媒介和計算機(jī)程序。
雖然已經(jīng)描述了本發(fā)明的實(shí)施例,但是所述實(shí)施例僅是對本發(fā)明原理的說明。在不脫離本發(fā)明的精神并且不脫離附加權(quán)利要求的范圍的前提下,可以設(shè)計其它實(shí)施例和配置。
本說明書中引用了下列文獻(xiàn)[1]J.li and S.Lie,“An embedded still image coder withrate-distortion optimization”,IEEE Trans.on Image Processing,Vol.9,pp.1158-1170,Jul.2000. J.Rissanen,Stochastic Complexity in Statistical Inquiry,London,U.K.;World scientific,1989. M.J.Weinberger et al,“The LOCO-I lossless image compressionalgorithmprinciples and standardization into JPEG-LS”,IEEE Trans.Image Processing,Vol.9,pp 1309-1324,Aug.2000. G.G.Langdon and J.Rissanen,“A simple general binary sourcecode”,IEEE Trans.Information Theory,Vol.28,pp.800-803,1982. D.Taubman and A.Zakhor,“Multirate 3-D subband coding ofvideo”,IEEE Trans.Image Processing,Vol.3,pp.572-588,Sept.1994. E.Ordentlich et al,“A low-complexity modeling approach forembedded coding of wavelet coefficients”,HP Labs Tech.Reports,HPL-97-150,1997.
權(quán)利要求
1.一種處理由數(shù)據(jù)源產(chǎn)生的位符號的方法,所述數(shù)據(jù)源特別是視頻、靜止圖像或音頻源,所述方法包括下列步驟-利用所述數(shù)據(jù)源產(chǎn)生的位符號來構(gòu)建多個位平面,每個位平面包括多個位平面符號;-掃描所述每個位平面的位平面符號,以產(chǎn)生位平面符號的二進(jìn)制流;-利用統(tǒng)計模型對所述位平面符號的二進(jìn)制流進(jìn)行編碼,其中,所述統(tǒng)計模型是基于表征所述數(shù)據(jù)源的拉普拉斯概率分布函數(shù)的統(tǒng)計特性的。
2.根據(jù)權(quán)利要求1的方法,其中,由熵編碼器來對所述位平面符號的二進(jìn)制流進(jìn)行編碼。
3.根據(jù)權(quán)利要求2的方法,其中,運(yùn)算編碼器被用作所述熵編碼器。
4.根據(jù)權(quán)利要求1到3的任何一個的方法,其中所述拉普拉斯概率分布函數(shù)由下式定義f(x)=e-|x|2σ22σ2]]>其中,σ是拉普拉斯概率分布函數(shù)的標(biāo)準(zhǔn)偏差。
5.根據(jù)權(quán)利要求4的方法,其中,基于所述拉普拉斯概率分布函數(shù)確定給每個位平面符號的概率分配,并且所述概率分配被用于確定對所述位平面符號的二進(jìn)制流進(jìn)行編碼的統(tǒng)計模型。
6.根據(jù)權(quán)利要求5的方法,其中,給所述位平面符號的概率分配由下式確定Pj=1-(1+e-2j2σ2)-1,j=M-1,M-2...]]>其中Pj是給所述位平面符號的概率分配,并且j是所述位平面。
7.根據(jù)權(quán)利要求4的方法,其中,基于先前被編碼的位平面符號來確定給每個位平面符號的概率分配。
8.根據(jù)權(quán)利要求7的方法,其中,給所述位平面符號的概率分配由下式確定Pj=NaNPjNa+(1-NaN)PjML]]>其中Pj是給當(dāng)前位平面符號的概率分配,j是所述位平面,Na是直到所述先前位平面結(jié)束為止,被編碼的位平面符號的數(shù)目,N是直到當(dāng)前位平面符號為止,被編碼的位平面符號的數(shù)目,PjNa是觀察了Na個位平面符號之后的Pj的估計,PjML是針對當(dāng)前位平面的Pj的最大似然估計,并且被定義為PjML=Σj=1N-Nabi,jN-Na]]>其中,bi,j是所述位平面符號。
9.根據(jù)權(quán)利要求8的方法,其中,在觀察了Na個位平面符號之后的Pj的估計,PjNa,可以由下式更新PjNa=Pj+1Na1-Pj+1Na+Pj+1Na]]>其中,Pj+1Na是來自所述先前位平面的Pj的估計。
10.根據(jù)權(quán)利要求4的方法,還包括下列步驟-從所述多個被構(gòu)建的位平面來確定最佳位平面;-基于每個位平面與所述最佳位平面的關(guān)系,確定給所述每個位平面的概率分配;-其中,給所述位平面的概率分配被用于對所述位平面符號的二進(jìn)制流進(jìn)行編碼的統(tǒng)計模型。
11.根據(jù)權(quán)利要求10的方法,其中,通過確定最滿足下式的整數(shù),來確定所述最佳位平面φ2-L+1≤θ<φ2-L其中L是代表所述最佳位平面的整數(shù),φ被定義為 θ由下式定義θ=Δe-2σ2]]>
12.根據(jù)權(quán)利要求11的方法,其中,所述位平面的概率分配由下式確定QjL=11+22j-L,j≥L12,j<L]]>其中QjL是給第j個位平面的概率分配。
13.根據(jù)權(quán)利要求11的方法,其中,所述位平面的概率分配由下式確定QjL=122j-L,j≥L12,j<L]]>其中QjL是給第j個位平面的概率分配。
14.根據(jù)權(quán)利要求6或8的方法,還包括下列步驟-利用另一個統(tǒng)計模型對所述被編碼的位平面符號的二進(jìn)制流進(jìn)行譯碼,以產(chǎn)生另一個位平面符號的二進(jìn)制流,-利用另一個位平面符號的二進(jìn)制流來重構(gòu)包括所述位平面符號的多個位平面,其中,所述另一個統(tǒng)計模型是基于拉普拉斯概率分布函數(shù)的統(tǒng)計特性的,該拉普拉斯概率分布函數(shù)表征了所述被重構(gòu)的位平面的位平面符號。
15.根據(jù)權(quán)利要求14的方法,其中,通過下式從所述位平面重構(gòu)所述數(shù)據(jù)源x^i=(2si-1)(Σj=M-1Tbi,j2j+Σj=T-1-∞Pj2j)]]>其中xi是所述被重構(gòu)的數(shù)據(jù)源,xi是i的標(biāo)記符號,bi,j是所述位平面符號,以及T是所述被編碼的位平面符號的二進(jìn)制流被終止的位平面。
16.根據(jù)權(quán)利要求12或13的方法,還包括下列步驟-利用另一個統(tǒng)計模型對所述被編碼的位平面符號的二進(jìn)制流進(jìn)行譯碼,以產(chǎn)生另一個位平面符號的二進(jìn)制流,-利用另一個位平面符號的二進(jìn)制流來重構(gòu)包括所述位平面符號的多個位平面,其中,另一個統(tǒng)計模型是基于拉普拉斯概率分布函數(shù)的統(tǒng)計特性的,該拉普拉斯概率分布函數(shù)表征了所述被重構(gòu)的位平面的位平面符號。
17.根據(jù)權(quán)利要求16的方法,其中,通過下式從所述位平面重構(gòu)所述數(shù)據(jù)源x^i=(2si-1)(Σj=M-1Tbi,j2j+Σj=T-1-∞QjL2j)]]>其中xi是所述被重構(gòu)的數(shù)據(jù)源,si是i的標(biāo)記符號,bi,j是所述位平面符號,以及T是所述被編碼的位平面符號的二進(jìn)制流被終止的位平面。
18.一種用于處理由數(shù)據(jù)源產(chǎn)生的位符號的設(shè)備,所述數(shù)據(jù)源特別是視頻、靜止圖像或音頻源,所述設(shè)備包括-位平面構(gòu)建單元,其用于從所述數(shù)據(jù)源構(gòu)建多個位平面,每個位平面包括多個位平面符號,并且掃描所述每個位平面的位平面符號,以產(chǎn)生位平面符號的二進(jìn)制流,-統(tǒng)計模型單元,其用于基于表征所述數(shù)據(jù)源的拉普拉斯概率分布函數(shù)的統(tǒng)計特性來提供統(tǒng)計信息,-編碼單元,其用于基于由所述統(tǒng)計模型單元提供的統(tǒng)計信息,對所述位平面符號的二進(jìn)制流進(jìn)行編碼。
19.一種具有被記錄在其上的程序的計算機(jī)可讀媒介,其中,所述程序可以使計算機(jī)執(zhí)行處理數(shù)據(jù)源的位符號的過程,所述過程包括下列步驟-利用所述數(shù)據(jù)源產(chǎn)生的位符號來構(gòu)建多個位平面,每個位平面包括多個位平面符號;-掃描每個位平面的位平面符號,以產(chǎn)生所述位平面符號的二進(jìn)制流;-利用統(tǒng)計模型來對所述位平面符號的二進(jìn)制流進(jìn)行編碼,其中,所述統(tǒng)計模型是基于表征所述數(shù)據(jù)源的拉普拉斯概率分布函數(shù)的統(tǒng)計特性的。
20.一種計算機(jī)程序單元,其可以使計算機(jī)執(zhí)行處理由數(shù)據(jù)源產(chǎn)生的位符號的過程,所述過程包括下列步驟-利用由所述數(shù)據(jù)源產(chǎn)生的位符號來構(gòu)建多個位平面,每個位平面包括多個位平面符號;-掃描所述每個位平面的位平面符號,以產(chǎn)生所述位平面符號的二進(jìn)制流;-利用統(tǒng)計模型來對所述位平面符號的二進(jìn)制流進(jìn)行編碼,其中,所述統(tǒng)計模型是基于表征所述數(shù)據(jù)源的拉普拉斯概率分布函數(shù)的統(tǒng)計特性的,其中,所述數(shù)據(jù)源具有拉普拉斯概率分布函數(shù)的形式。
全文摘要
一種處理由數(shù)據(jù)源產(chǎn)生的位符號的方法,所述數(shù)據(jù)源特別是視頻、靜止圖像或音頻源,所述方法包括下列步驟從所述數(shù)據(jù)源構(gòu)建多個位平面,每個位平面包括多個位平面符號;掃描所述每個位平面的位平面符號,以產(chǎn)生位平面符號的二進(jìn)制流;以及利用統(tǒng)計模型對所述位平面符號的二進(jìn)制流進(jìn)行編碼,其中,所述統(tǒng)計模型是基于表征所述數(shù)據(jù)源的拉普拉斯概率分布函數(shù)的統(tǒng)計特性的。
文檔編號H04N7/26GK1695306SQ02829942
公開日2005年11月9日 申請日期2002年10月24日 優(yōu)先權(quán)日2002年10月24日
發(fā)明者俞容山, 王逸平, 林曉 申請人:新加坡科技研究局
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1