專利名稱:算術(shù)編碼或算術(shù)解碼的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多媒體數(shù)據(jù)的算術(shù)編碼和解碼。
背景技術(shù):
算術(shù)編碼是一種數(shù)據(jù)無損壓縮的方法。算術(shù)編碼基于概率密度函數(shù)(PDF)。為了達(dá)到壓縮效果,編碼所基于的概率密度函數(shù)必須與數(shù)據(jù)實(shí)際遵循的實(shí)際概率密度函數(shù)相同或至少相似一越接近越好。如果算術(shù)編碼基于適當(dāng)概率密度函數(shù),則可以實(shí)現(xiàn)導(dǎo)致至少幾乎最佳代碼的顯著壓縮。因此,在編碼和解碼系數(shù)序列的音頻、語音或視頻編碼中,算術(shù)編碼是一種頻繁使用技術(shù),其中這些系數(shù)是用二進(jìn)制表示的視頻像素或音頻或語音信號樣本值的量化時頻變換。為了進(jìn)一步提高壓縮,算術(shù)編碼可以基于一組概率密度函數(shù),其中用于編碼當(dāng)前系數(shù)的概率密度函數(shù)取決于所述當(dāng)前系數(shù)的背景。也就是說,取決于出現(xiàn)具有相同量化值的系數(shù)的背景,可以將不同概率密度函數(shù)用于編碼所述相同量化值。系數(shù)的背景通過包含在與各自系數(shù)相鄰的一個或多個相鄰系數(shù)的鄰域,例如,序列中相鄰地在要編碼或要解碼的各自系數(shù)前面的一個或多個已編碼或已解碼系數(shù)的子序列中的系數(shù)的量化值來定義。鄰域可能出現(xiàn)的每種不同可能定義每一種被映射成概率密度函數(shù)的不同可能背景。事實(shí)上,只有當(dāng)鄰域足夠大時所述壓縮提高才變得明顯。隨之而來的是不同可能背景的數(shù)量的組合激增以及相應(yīng)數(shù)量巨大的可能概率密度函數(shù)或相應(yīng)復(fù)雜映射。在如下文獻(xiàn)中可以找到基于背景算術(shù)編碼方案的一個例子IS0/IECJTC1/SC29/ WG11N10215, October 2008,Busan, Korea,提出統(tǒng)一語音和音頻編碼(USAC)的參考模型。 按照該建議,將已經(jīng)編碼的4元組G-tuples)考慮為背景。在如下文獻(xiàn)中可以找到基于USAC相關(guān)背景算術(shù)編碼的另一個例子IS0/IEC JTC1/SC29/WG11N10847, July 2009, London, UK。為了降低高階條件熵編碼中的復(fù)雜性,美國專利5,298, 896提出了限定碼元 (symbol)的非均勻量化。
發(fā)明內(nèi)容
與要處理的數(shù)量巨大背景相對應(yīng),存在需要存儲,檢索和處理的數(shù)量巨大概率密度函數(shù)或從背景到概率密度函數(shù)的至少相應(yīng)復(fù)雜映射。這提高了編碼/解碼延遲和存儲容量要求的至少一種。因此,在技術(shù)上需要一種允許在降低編碼/解碼延遲和存儲容量要求的至少一種的同時,幾乎一樣好地實(shí)現(xiàn)壓縮的可替代解決方案。為了解決這種需要,本發(fā)明提出了包含權(quán)利要求1的特征的編碼方法、包含權(quán)利要求2的特征的解碼方法、包含權(quán)利要求13的特征的算術(shù)編碼設(shè)備、包含權(quán)利要求14的特征的算術(shù)解碼設(shè)備、和按照權(quán)利要求15所述的存儲介質(zhì)。在從屬權(quán)利要求中規(guī)定了進(jìn)一步提出實(shí)施例的特征。
算術(shù)編碼或解碼的所述方法將前譜系數(shù)分別用于當(dāng)前譜系數(shù)的算術(shù)編碼或解碼, 其中所述前譜系數(shù)是已經(jīng)分別編碼或解碼的。所述前譜系數(shù)和所述當(dāng)前譜系數(shù)兩者都被包含在視頻、音頻或語音信號樣本值的量化時頻變換所得的一個或多個量化譜中。所述方法進(jìn)一步包含處理前譜系數(shù),將處理后前譜系數(shù)用于確定作為至少兩個不同背景類別之一的背景類別,將所確定背景類別和從至少兩個不同背景類別到至少兩個不同概率密度函數(shù)的映射用于確定概率密度函數(shù),以及根據(jù)所確定概率密度函數(shù)算術(shù)分別編碼或解碼當(dāng)前譜系數(shù)。該方法的一個特征是處理前譜系數(shù)包含非均勻地量化前譜系數(shù)的絕對值。將背景類別替代背景用于確定概率密度函數(shù)便于將得出不同但非常相似概率密度函數(shù)的兩個或更多個不同背景分組成映射到單個概率密度函數(shù)的單個背景類別。該分組是通過將前譜系數(shù)的非均勻量化絕對值用于確定背景類別實(shí)現(xiàn)的。例如,存在處理前譜系數(shù)包含確定前譜系數(shù)的量化絕對值之和以便用在確定背景類別中的實(shí)施例。類似地,存在算術(shù)編碼設(shè)備的相應(yīng)實(shí)施例,以及算術(shù)解碼設(shè)備的相應(yīng)實(shí)施例,其中的處理部件適用于確定前譜系數(shù)的量化絕對值之和以便用于確定背景類別。在設(shè)備的進(jìn)一步實(shí)施例中,所述處理部件適用于使處理前譜系數(shù)進(jìn)一步包含按照第一量化方案量化前譜系數(shù)的絕對值的第一量化、確定按照第一量化方案量化的前譜系數(shù)的絕對值的方差的方差確定、將所確定方差用于選擇至少兩種不同非線性第二量化方案之一、和按照所選擇非線性第二量化方案進(jìn)一步量化按照第一量化方案量化的前譜系數(shù)的絕對值的第二量化。所述方法的進(jìn)一步實(shí)施例包含相應(yīng)步驟。所述方差確定可以包含確定按照第一量化方案量化的前譜系數(shù)的絕對值之和,并將所確定和值與至少一個閾值相比較。在進(jìn)一步實(shí)施例中,每種設(shè)備的所述處理部件可以適用于使處理導(dǎo)致第一后果或至少一個不同第二后果。然后,確定背景類別進(jìn)一步包含確定對其處理導(dǎo)致第一后果的那些前譜系數(shù)的數(shù)量,并將所確定數(shù)量用于確定背景類別。每種設(shè)備可以包含接收模式切換信號和復(fù)位信號的至少一種的部件,其中所述設(shè)備適用于將所接收信號的至少一種用于控制背景類別的確定。所述至少兩個不同概率密度函數(shù)可以通過將代表性數(shù)據(jù)集用于確定至少兩個不同概率密度函數(shù)事先確定,所述映射可以使用查找表或散列表實(shí)現(xiàn)。
本發(fā)明的示范性實(shí)施例例示在附圖中,并在如下描述中得到更詳細(xì)說明。這些示范性實(shí)施例只是為了闡明本發(fā)明,而不是限制定義在權(quán)利要求書中的本發(fā)明范圍和精神而說明的。在附圖中圖1示范性地描繪了本發(fā)明編碼器的一個實(shí)施例;圖2示范性地描繪了本發(fā)明解碼器的一個實(shí)施例;圖3示范性地描繪了確定背景類別的背景分類器的第一實(shí)施例;圖4示范性地描繪了確定背景類別的背景分類器的第二實(shí)施例;圖fe示范性地描繪了要在頻域模式下編碼或解碼的當(dāng)前譜區(qū)(bin)之前的前譜區(qū)的第一鄰域;圖恥示范性地描繪了要在加權(quán)線性預(yù)測變換模式下編碼或解碼的當(dāng)前譜區(qū)之前的前譜區(qū)的第二鄰域;圖6a示范性地描繪了要在頻域模式下編碼或解碼的當(dāng)前最低頻譜區(qū)之前的前譜區(qū)的第三鄰域;圖6b示范性地描繪了要在頻域模式下編碼或解碼的當(dāng)前次最低頻譜區(qū)之前的前譜區(qū)的第四鄰域;圖7a示范性地描繪了要在加權(quán)線性預(yù)測變換模式下編碼或解碼的當(dāng)前最低頻譜區(qū)之前的前譜區(qū)的第五鄰域;圖7b示范性地描繪了要在加權(quán)線性預(yù)測變換模式下編碼或解碼的當(dāng)前次最低頻譜區(qū)之前的前譜區(qū)的第六鄰域;圖7c示范性地描繪了要在加權(quán)線性預(yù)測變換模式下編碼或解碼的當(dāng)前第三最低頻譜區(qū)之前的前譜區(qū)的第七鄰域;圖7d示范性地描繪了要在加權(quán)線性預(yù)測變換模式下編碼或解碼的當(dāng)前第四最低頻譜區(qū)之前的前譜區(qū)的第八鄰域;圖8示范性地描繪了要編碼或解碼的不同譜區(qū)的鄰域,所述不同譜區(qū)包含在要在頻域模式下開始編碼/解碼或出現(xiàn)復(fù)位信號之后編碼或解碼的第一頻譜中;以及圖9示范性地描繪了要在加權(quán)線性預(yù)測變換模式下編碼或解碼的不同譜區(qū)的進(jìn)一步鄰域,所述不同譜區(qū)被包含在要在在加權(quán)線性預(yù)測變換模式下開始編碼/解碼或出現(xiàn)復(fù)位信號之后編碼或解碼的第二頻譜中。
具體實(shí)施例方式本發(fā)明可以在包含相應(yīng)適配的處理設(shè)備的任何電子設(shè)備上實(shí)現(xiàn)。例如,算術(shù)解碼的設(shè)備可以在電視機(jī)、移動電話、個人計算機(jī)、mp3播放器、導(dǎo)航系統(tǒng)或汽車音響系統(tǒng)中實(shí)現(xiàn)。算術(shù)編碼的設(shè)備可以在移動電話、個人計算機(jī)、有源汽車導(dǎo)航系統(tǒng)、數(shù)字照相機(jī)、數(shù)字?jǐn)z像機(jī)或錄音機(jī)等中實(shí)現(xiàn)。下文描述的示范性實(shí)施例涉及量化多媒體樣本的時頻變換所得的量化譜區(qū)的編碼或解碼。本發(fā)明基于將已經(jīng)發(fā)射量化譜區(qū),例如,序列中當(dāng)前量化譜區(qū)BIN之前的前量化譜區(qū)用于確定用于分別算術(shù)編碼和解碼當(dāng)前量化譜區(qū)BIN的概率密度函數(shù)的方式。算術(shù)編碼或算術(shù)解碼的方法和設(shè)備的所述示范性實(shí)施例分別包含用于非均勻量化的步驟或部件。所有步驟或部件一起提供最高編碼效率,但每個步驟或部件已單獨(dú)實(shí)現(xiàn)本發(fā)明的構(gòu)思,并提供與編碼/解碼延遲和/或存儲要求有關(guān)的好處。因此,詳細(xì)的描述應(yīng)該理解為描述只實(shí)現(xiàn)所述的步驟或部件之一的示范性實(shí)施例,以及描述實(shí)現(xiàn)所述的步驟或部件的兩個或更多個步驟或部件的組合的示范性實(shí)施例。可以但無需包括在本方法的示范性實(shí)施例中的第一步驟是決定應(yīng)該使用哪種一般變換模式的切換步驟。例如,在USAC無噪編碼方案中,一般變換模式可以是頻域(FD)模式或加權(quán)線性預(yù)測變換(wLPT)模式。每種一般模式可以將已編碼或解碼譜區(qū)的不同鄰域, 即,不同的選擇用于確定PDF。此后,可以在模塊背景生成COCL下確定當(dāng)前譜區(qū)BIN的背景。根據(jù)確定的背景, 通過分類背景確定背景類別,其中在分類之前,最好但未必通過背景的譜區(qū)的非均勻量化NUQl處理背景。分類可以包含估計背景的方差VES并將方差與至少一個閾值相比較?;蛘撸苯訌谋尘爸写_定方差估計值。然后將方差估計值用于控制最好但未必非線性的進(jìn)一步量化NUQ2。在示范性地描繪在圖1中的編碼過程中,確定適當(dāng)概率密度函數(shù)(PDF)來編碼當(dāng)前量化譜區(qū)BIN。為此,只能使用在解碼器方也已知的信息。也就是說,只能使用前編碼或解碼量化譜區(qū)。這是在背景分類器塊COCL中完成的。在那里,所選前譜區(qū)定義用于確定實(shí)際背景類別的鄰域NBH。背景類別可以通過背景類別號表示。背景類別號用于經(jīng)由映射 MAP,例如,經(jīng)由查找表或散列表從PDF存儲器MEMl中檢索相應(yīng)PDF。背景類別的確定可能取決于允許視所選模式而定使用不同鄰域的一般模式開關(guān)GMS。如上所述,對于USAC,可能存在兩種一般模式(FD模式和wLPT模式)。如果一般模式開關(guān)GMS是在編碼器方實(shí)現(xiàn)的, 則模式改變信號或當(dāng)前一般信號必須被包含在位流中,以便解碼器也知道它。例如,在ISO/ IEC JTC1/S(^9/WG11N10847,2009年7月,英國倫敦,提出的統(tǒng)一語音和音頻編碼(USAC)的參考模型中,存在為發(fā)送一般模式而提出的表格4. kore mode和表格4. 5core modeO/1。在確定了適合算術(shù)編碼器AEC編碼當(dāng)前量化譜區(qū)BIN的PDF之后,將當(dāng)前量化譜區(qū)BIN饋入鄰域存儲器MEM2中,即,當(dāng)前譜區(qū)BIN變成前譜區(qū)。包含在鄰域存儲器MEM2中的前譜區(qū)可以被塊COCL用于編碼下一個譜區(qū)BIN。在存儲當(dāng)前譜區(qū)BIN期間,之前或之后, 通過算術(shù)編碼器AEC算術(shù)編碼所述當(dāng)前譜區(qū)BIN。將算術(shù)編碼器AEC的輸出存儲在位緩沖器BUF中或直接寫入位流中??梢越?jīng)由,例如,電纜或衛(wèi)星發(fā)送或廣播位流或緩沖器BUF的內(nèi)容?;蛘?,可以將算術(shù)編碼譜區(qū)寫在像DVD、硬盤、藍(lán)光盤等那樣的存儲媒體上。PDF存儲器MEMl和鄰域存儲器MEM2可以在單個物理存儲器中實(shí)現(xiàn)。復(fù)位開關(guān)RS可以便于不用知道前譜地在可以開始編碼和解碼的專用幀上不時重新開始編碼或解碼,專用幀被稱為解碼入口點(diǎn)。如果復(fù)位開關(guān)RS是在編碼器方實(shí)現(xiàn)的, 則復(fù)位信號必須被包含在位流中,以便解碼器也知道它。例如,在IS0/IEC JTC1/SC29/ WGimi0847,2009年7月,英國倫敦,提出的統(tǒng)一語音和音頻編碼(USAC)的參考模型中,在 WD 表格 4. 10 和表格 4. 14 中存在 arith reset flag。在圖2中示范性地描繪基于相應(yīng)鄰域的解碼方案。它包含與編碼方案相似的塊。 要用于算術(shù)解碼的PDF的確定與編碼方案相同,以保證在編碼器和解碼器兩者中,確定的 PDF相同。算術(shù)解碼從位緩沖器BUF中或直接從位流中獲取位,并使用確定的PDF解碼當(dāng)前量化譜區(qū)BIN。之后,解碼的量化譜區(qū)饋入背景類別號確定塊COCL的鄰域存儲器MEM2中, 并可以用于解碼下一個譜區(qū)。圖3更詳細(xì)地示范性描繪了確定背景類別的背景分類器COCL的第一實(shí)施例。在將當(dāng)前量化譜區(qū)BIN存儲在譜存儲器MEM2中之前,可以在塊NUQl中對其進(jìn)行非均勻量化。這具有兩方面好處其一,使通常是16位帶碼元整數(shù)值的量化譜區(qū)的存儲更有效,其二,減少了每個量化譜區(qū)具有的值的數(shù)量。這使得在塊CLASS中的背景類別確定過程中極大地減少了可能背景類別。更進(jìn)一步,由于在背景類別確定中,可能舍棄了量化譜區(qū)的碼元,所以可以在非均勻量化塊NUQl中包括絕對值計算。在表1中,示出了如塊NUQl可以進(jìn)行的示范性非均勻量化。在本例中,在非均勻量化之后,每個譜區(qū)可能有三個不同值。 但是,一般說來,非均勻量化的唯一約束是減少一個譜區(qū)可能采用的值的數(shù)量。
權(quán)利要求
1.一種使用前譜系數(shù)算術(shù)解碼當(dāng)前譜系數(shù)的方法,所述前譜系數(shù)是已經(jīng)解碼的,并且所述前譜系數(shù)和當(dāng)前譜系數(shù)兩者都被包含在視頻、音頻或語音信號樣本值的量化時頻變換所得的一個或多個量化譜中,所述方法包含-處理前譜系數(shù);-將處理后前譜系數(shù)用于確定作為至少兩個不同背景類別之一的背景類別;-將所確定背景類別和從至少兩個不同背景類別到至少兩個不同概率密度函數(shù)的映射用于確定概率密度函數(shù);以及-根據(jù)所確定概率密度函數(shù)算術(shù)解碼當(dāng)前譜系數(shù),其中-處理前譜系數(shù)包含非均勻地量化前譜系數(shù)的絕對值以便在背景類別的確定中使用。
2.一種使用前譜系數(shù)算術(shù)編碼當(dāng)前譜系數(shù)的方法,所述前譜系數(shù)是已經(jīng)編碼的,并且所述前譜系數(shù)和當(dāng)前譜系數(shù)兩者都被包含在視頻、音頻或語音信號樣本值的量化時頻變換所得的一個或多個量化譜中,所述方法包含-處理前譜系數(shù);-將處理后前譜系數(shù)用于確定作為至少兩個不同背景類別之一的背景類別;-將所確定背景類別和從至少兩個不同背景類別到至少兩個不同概率密度函數(shù)的映射用于確定概率密度函數(shù);以及-根據(jù)所確定概率密度函數(shù)算術(shù)編碼當(dāng)前譜系數(shù),其中-處理前譜系數(shù)包含非均勻地量化前譜系數(shù)的絕對值以便在背景類別的確定中使用。
3.如權(quán)利要求1或2所述的方法,其中將前譜系數(shù)的量化絕對值之和用于背景類別的確定。
4.如權(quán)利要求1或2所述的方法,其中處理前譜系數(shù)包含按照第一量化方案量化前譜系數(shù)的絕對值的第一量化步驟,確定按照第一量化方案量化的前譜系數(shù)的絕對值的方差的步驟,將所確定方差用于選擇至少兩種不同非線性第二量化方案之一的步驟,以及按照所選擇非線性第二量化方案進(jìn)一步量化按照第一量化方案量化的前譜系數(shù)的絕對值的第二量化步驟。
5.如權(quán)利要求4所述的方法,其中確定按照第一量化方案量化的前譜系數(shù)的絕對值的方差的步驟包含確定按照第一量化方案量化的前譜系數(shù)的絕對值之和,并將所確定和值與至少一個閾值相比較。
6.如前面權(quán)利要求之一所述的方法,其中所述處理導(dǎo)致第一后果或至少一個不同第二后果,以及確定背景類別進(jìn)一步包含-確定被非均勻量化成第一后果的前譜系數(shù)的數(shù)量;以及-將所確定數(shù)量用于確定背景類別。
7.如權(quán)利要求6所述的方法,其中前譜系數(shù)之一優(yōu)選于其余前譜系數(shù),所述方法進(jìn)一步包含將前譜系數(shù)當(dāng)中的優(yōu)選前譜系數(shù)的非均勻量化用于確定背景類別。
8.如權(quán)利要求7所述的方法,其中前譜系數(shù)當(dāng)中的所述優(yōu)選前譜系數(shù)被包含在前譜中,并且所述當(dāng)前譜系數(shù)被包含在不同當(dāng)前譜中,所述優(yōu)選前譜系數(shù)和所述當(dāng)前譜系數(shù)以相同頻率被包含在各自譜中。
9.如權(quán)利要求8所述的方法,其中所述不同當(dāng)前譜進(jìn)一步包含其余前譜系數(shù)在低于所述相同頻率的頻率上的至少一個。
10.如前面權(quán)利要求之一所述的方法,所述方法進(jìn)一步包含 -接收模式切換信號和復(fù)位信號的至少一種;以及-將至少一種所接收信號用于控制確定背景類別的步驟。
11.如前面權(quán)利要求之一所述的方法,所述方法進(jìn)一步包含 -將代表性數(shù)據(jù)集用于確定至少兩個不同概率密度函數(shù)。
12.如前面權(quán)利要求之一所述的方法,其中所述映射是使用查找表或散列表實(shí)現(xiàn)的。
13.一種使用前譜系數(shù)算術(shù)編碼當(dāng)前譜系數(shù)的設(shè)備,所述前譜系數(shù)是已經(jīng)編碼的,并且所述前譜系數(shù)和當(dāng)前譜系數(shù)兩者都被包含在視頻、音頻或語音信號樣本值的量化時頻變換所得的一個或多個量化譜中,所述設(shè)備包含-處理前譜系數(shù)的處理部件;-確定作為至少兩個不同背景類別之一的背景類別的第一部件,所述第一部件適用于將處理后前譜系數(shù)用于確定背景類別;-確定概率密度函數(shù)的第二部件,所述第二部件適用于將所確定背景類別和從至少兩個不同背景類別到至少兩個不同概率密度函數(shù)的映射用于確定概率密度函數(shù);以及 -根據(jù)所確定概率密度函數(shù)算術(shù)編碼當(dāng)前譜系數(shù)的算術(shù)編碼器,其中 -所述處理部件適用于非均勻地量化前譜系數(shù)的絕對值以便在背景類別的確定中使用。
14.一種使用前譜系數(shù)算術(shù)解碼當(dāng)前譜系數(shù)的設(shè)備,所述前譜系數(shù)是已經(jīng)解碼的,并且所述前譜系數(shù)和當(dāng)前譜系數(shù)兩者都被包含在視頻、音頻或語音信號樣本值的量化時頻變換所得的一個或多個量化譜中,所述設(shè)備包含-處理前譜系數(shù)的處理部件;-確定作為至少兩個不同背景類別之一的背景類別的第一部件,所述第一部件適用于將處理后前譜系數(shù)用于確定背景類別;-確定概率密度函數(shù)的第二部件,所述第二部件適用于將所確定背景類別和從至少兩個不同背景類別到至少兩個不同概率密度函數(shù)的映射用于確定概率密度函數(shù);以及 -根據(jù)所確定概率密度函數(shù)算術(shù)解碼當(dāng)前譜系數(shù)的算術(shù)解碼器,其中 -所述處理部件適用于非均勻地量化前譜系數(shù)的絕對值以便在背景類別的確定中使用。
15.一種攜帶按照權(quán)利要求2-12之一的方法算術(shù)編碼的算術(shù)編碼譜系數(shù)的存儲介質(zhì)。
全文摘要
本發(fā)明提出了使用前譜系數(shù)算術(shù)編碼當(dāng)前譜系數(shù)的方法和設(shè)備。所述前譜系數(shù)是已經(jīng)編碼的,并且所述前譜系數(shù)和前譜系數(shù)當(dāng)前譜系數(shù)兩者都被包含在視頻、音頻或語音信號樣本值的量化時頻變換所得的一個或多個量化譜中。所述方法包含處理前譜系數(shù);將處理后前譜系數(shù)用于確定作為至少兩個不同背景類別之一的背景類別;將所確定背景類別和從至少兩個不同背景類別到至少兩個不同概率密度函數(shù)的映射用于確定概率密度函數(shù);以及根據(jù)所確定概率密度函數(shù)算術(shù)編碼當(dāng)前譜系數(shù),其中處理前譜系數(shù)包含非均勻地量化前譜系數(shù)的絕對值以便在背景類別的確定中使用。
文檔編號H03M7/40GK102577133SQ201080045319
公開日2012年7月11日 申請日期2010年10月1日 優(yōu)先權(quán)日2009年10月9日
發(fā)明者O.維波爾特 申請人:湯姆森特許公司