編碼器、解碼器及其運(yùn)行方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及編碼器,對(duì)數(shù)據(jù)(Dl)進(jìn)行編碼W生成相應(yīng)的編碼數(shù)據(jù)化2)。本發(fā)明還 設(shè)及解碼器,對(duì)編碼數(shù)據(jù)化2)進(jìn)行解碼,W生成相應(yīng)的解碼數(shù)據(jù)(D3)。此外,本發(fā)明還設(shè)及 對(duì)數(shù)據(jù)(Dl)進(jìn)行編碼W生成相應(yīng)的編碼數(shù)據(jù)化2)的方法。本發(fā)明還設(shè)及對(duì)編碼數(shù)據(jù)化2)進(jìn) 行解碼W生成相應(yīng)的解碼數(shù)據(jù)(D3)的方法。本發(fā)明還設(shè)及由上述的編碼器和解碼器組合形 成的編解碼器。進(jìn)一步,本發(fā)明還設(shè)及記錄在非暫時(shí)機(jī)器可讀存儲(chǔ)介質(zhì)上的軟件產(chǎn)品,其 中,軟件產(chǎn)品在計(jì)算硬件上執(zhí)行,實(shí)現(xiàn)上述方法中的一個(gè)或多個(gè)。上述的數(shù)據(jù)設(shè)及視頻,W 及圖像、音頻、文件,但不限于運(yùn)些。
【背景技術(shù)】
[0002] 目前,存在多種對(duì)數(shù)據(jù)進(jìn)行編碼的編碼方法和相應(yīng)的解碼方法。可是,運(yùn)些已知的 方法中沒有一種是所有的不同類型的圖像、視頻、音頻、圖形、統(tǒng)一碼化nicode)、或者二進(jìn) 制數(shù)據(jù)或者數(shù)據(jù)區(qū)域(data area)。當(dāng)前已知的編碼方法如表1所示。
[0003] 表1:當(dāng)前已知的編碼方法
[000引典型的圖像和視頻編碼方法如表2所示。它們用于壓縮自然圖像內(nèi)容時(shí),還比較有 效,但是,用于壓縮其它類型的數(shù)據(jù),如桌面圖像、動(dòng)畫、圖形或是包括多個(gè)不同的數(shù)值但又 在一定程度上結(jié)構(gòu)化了的自然內(nèi)容時(shí),就不是很有效。
[0006] 表2:當(dāng)前已知的其它數(shù)據(jù)編碼方法
[0007]
[000引其它編碼方法如GIF、PNG,參見表3,也能夠有效處理一些特定類型的編碼任務(wù),但 是,如果對(duì)應(yīng)于要被編碼的給定圖像的數(shù)據(jù)包括許多不同類型的內(nèi)容或者是大量的彼此類 似的內(nèi)容,或者,某些數(shù)據(jù)在對(duì)編碼數(shù)據(jù)進(jìn)行解碼的后續(xù)重構(gòu)過程中易于產(chǎn)生錯(cuò)誤,運(yùn)時(shí), 運(yùn)些方法就不是很合適。比如,給定的圖像包括自然對(duì)象,即,在空間上具有細(xì)微詳細(xì)信息 的對(duì)象,作為編碼方法的GIF會(huì)在編碼過程中生成有問題的不自然效果,并可能產(chǎn)生大的誤 差。此外,作為編碼方法的PNG使用大量的數(shù)據(jù)比特對(duì)于"類噪聲"的特性進(jìn)行編碼,因而導(dǎo) 致較差的數(shù)據(jù)壓縮表現(xiàn)。基于變換的個(gè)別方法,如DCT和小波方法,不適于給定圖像中的結(jié) 構(gòu)化內(nèi)容,參見表1。
[0009]表3:當(dāng)前已知的其它數(shù)據(jù)編碼方法
[0011] 當(dāng)前已知的行程長度編碼(RLE)能夠有效地編碼多個(gè)相鄰的類似的數(shù)據(jù)值,然而, RLE也表現(xiàn)出一些限制與問題,運(yùn)主要是設(shè)及該方法自身W及優(yōu)化,例如,在處理周期性數(shù) 據(jù)值時(shí)。當(dāng)化E把水平線編碼成2D塊時(shí),用于化E中的信息的發(fā)送機(jī)制所使用的值多于通常 所期望的水平。此外,垂直的或其它線方向甚至更難W使用基于RLE的方法進(jìn)行編碼。
[0012] 按照當(dāng)前已知的H. 264方法對(duì)數(shù)據(jù)進(jìn)行編碼時(shí),采用塊內(nèi)預(yù)測,它采用外插技術(shù), 通過發(fā)送一個(gè)相關(guān)的選定的預(yù)測方向,使用數(shù)據(jù)塊的外部值,盡管沒有針對(duì)一個(gè)給定塊的 其它的外插相關(guān)的值被發(fā)送。結(jié)果是,H. 264方法不能通過使用一個(gè)或多個(gè)比特的驗(yàn)證對(duì)上 述的選定進(jìn)行驗(yàn)證。此外,它沒有提供一種特性,來發(fā)送與值相關(guān)的額外的外插方法,如差 值或梯度值,它們可W用來改善外插效果。在H.264方法中,只有預(yù)測誤差被支持,但與外插 計(jì)算或它們的實(shí)現(xiàn)無關(guān)。
[0013] 可W看出,上述的方法不能很好地適用于所有類型的基于塊的數(shù)據(jù)的編碼任務(wù)。 上述方法中沒有一種最優(yōu)地適用于所有類型的圖像、視頻、音頻、圖形、統(tǒng)一碼、或二進(jìn)制數(shù) 據(jù)或者數(shù)據(jù)區(qū)域。因此,需要新的方法來對(duì)編碼方法的選擇進(jìn)行補(bǔ)充,從而使得所有類型的 數(shù)據(jù)可W被有效地壓縮。
[0014] 在公布的PCT專利申請(qǐng)W0201200047(名稱為 "Method and apparatus for geometri-based intra prediction",申請(qǐng)人是('Thomson Licensing")中,描述了一種方 法和裝置,用于基于幾何的內(nèi)預(yù)測,它描述了一種內(nèi)塊編碼方案,具有基于幾何的內(nèi)預(yù)測, W提高內(nèi)預(yù)測的精度有內(nèi)預(yù)測的效率。一個(gè)預(yù)測方向的產(chǎn)生是基于鄰近的周邊像素的幾何 結(jié)構(gòu)。該方法和裝置是基于一個(gè)給定塊邊界的周邊像素,它們被用于確定一個(gè)本地幾何模 式,產(chǎn)生針對(duì)當(dāng)前塊的一個(gè)內(nèi)預(yù)測模型。類似的操作也在解碼器執(zhí)行,產(chǎn)生一個(gè)預(yù)測模型。
[0015] 在公布的美國專利申請(qǐng)US20110293002(名稱為 "Method and apparatus for transform selection in video encoding and decoding",申請(qǐng)人是('Thomson Licensing",發(fā)明人是化el Sole)中,描述了用于在視頻編碼中的變換選擇的方法和裝置, 它采用一個(gè)變換集,即,一個(gè)或多個(gè)變換,用于對(duì)圖像或視頻進(jìn)行編碼,為每個(gè)塊選擇最佳 的變換。針對(duì)一系列的統(tǒng)計(jì)數(shù)據(jù)或者圖像/視頻模式,所述的變換集可W被優(yōu)化或者設(shè)計(jì)。 該方法和裝置還設(shè)及如何選擇最佳的變換W及對(duì)所選定的變換進(jìn)行合適的指示,從而使得 視頻解碼器能夠有效地恢復(fù)所選的信息。
[0016] 在公布的美國專利申請(qǐng)US20070182728(名稱為 "Image display system, image display method , image display program,recording medium, data processing apparatus,and image display apparatus",發(fā)明人是Toshiki Fujimori)中,描述了一種 圖像顯示系統(tǒng),它包括數(shù)據(jù)處理裝置,圖像顯示裝置,和通訊單元,用于處理圖像數(shù)據(jù)。數(shù)據(jù) 處理裝置對(duì)圖像數(shù)據(jù)的不同類型的內(nèi)容數(shù)據(jù)進(jìn)行編碼。內(nèi)容數(shù)據(jù)的編碼是基于內(nèi)容數(shù)據(jù)的 類型。之后,編碼的內(nèi)容數(shù)據(jù)被通訊單元發(fā)送給圖像顯示裝置。圖像顯示裝置對(duì)圖像數(shù)據(jù)的 內(nèi)容數(shù)據(jù)進(jìn)行解碼并顯示圖像。
[0017] 在授權(quán)的美國專利US8149910(名稱為"Image encoding/lmage decoding method and image encoding/image decoding apparatus",發(fā)明人是Takeshi Chujoh^RAkiyuki Tanizawa)中,描述了一種圖像編碼方法和裝置,它把輸入圖像分成多個(gè)像素塊信號(hào),對(duì)它 們進(jìn)行編碼。然后,為外插或內(nèi)插預(yù)測像素進(jìn)行內(nèi)預(yù)測,采用參考像素,在多個(gè)預(yù)測模型中, 根據(jù)預(yù)測像素與參考像素之間的距離而改變參考像素的數(shù)量,每個(gè)模型代表一個(gè)對(duì)應(yīng)的預(yù) 測方向。由此,通過外插或內(nèi)插預(yù)測像素生成一個(gè)預(yù)測圖像信號(hào),并從像素塊信號(hào)和預(yù)測圖 像信號(hào)計(jì)算預(yù)測誤差信號(hào)。運(yùn)樣,使用預(yù)測誤差信號(hào),在多個(gè)預(yù)測模型中選擇一個(gè)預(yù)測模 型,基于選擇的預(yù)測模型,使用預(yù)測誤差信號(hào)進(jìn)行賭編碼。
[001 引 在授權(quán)的美國專利US6317515(名稱為"Method and apparatus for encoding and decoding a data stream using inferential techniques",申請(qǐng)人是('Avid Technology,Inc.",發(fā)明人是 Jeffrey D. Kurtze ,Joseph H. Rice ,Robert Gonsalves, 化ia-Sheng化ou)中,描述了編碼解碼方法和裝置,它為了壓縮的目的對(duì)輸入數(shù)據(jù)流進(jìn)行 編碼,對(duì)壓縮的數(shù)據(jù)流進(jìn)行解碼W使用它。在編碼過程中,它確定數(shù)據(jù)流的趨勢,把關(guān)于趨 勢的信息存儲(chǔ)在一個(gè)編碼塊中。解碼器推斷與編碼塊相關(guān)的成份的類型,它依據(jù)的是,數(shù)據(jù) 中的成份的原始順序,在編碼塊與一些被每個(gè)在先的編碼塊所編碼的對(duì)應(yīng)成份所所組成的 序列中編碼塊的順序。一旦成份的類型被確定,通過把編碼趨勢信息轉(zhuǎn)換成成份值,解碼器 對(duì)數(shù)據(jù)流進(jìn)行重構(gòu)。
[0019] 在下文的描述中將在使用的縮寫與縮略詞如表4所示。
[0020] 表4:縮寫與縮略詞
【發(fā)明內(nèi)容】
[0023] 本發(fā)明的目的之一是,提供一種改進(jìn)的方法,對(duì)數(shù)據(jù)進(jìn)行編碼,W生成相應(yīng)的編碼 數(shù)據(jù),其中,當(dāng)在要被編碼的數(shù)據(jù)中具有寬的內(nèi)容范圍時(shí),改進(jìn)的方法更靈活。
[0024] 本發(fā)明的目的還在于,提供一種改進(jìn)的方法,對(duì)編碼數(shù)據(jù)進(jìn)行編碼,其中,當(dāng)在已 編碼數(shù)據(jù)中具有寬的內(nèi)容范圍時(shí),改進(jìn)的方法更靈活。
[0025] 本發(fā)明的目的還在于,提供一種改進(jìn)的編碼器,對(duì)數(shù)據(jù)進(jìn)行編碼,W生成相應(yīng)的編 碼數(shù)據(jù)。
[0026] 本發(fā)明的目的還在于,提供一種改進(jìn)的解碼器,對(duì)編碼數(shù)據(jù)進(jìn)行解碼,W生成相應(yīng) 的解碼數(shù)據(jù)。
[0027] 根據(jù)本發(fā)明的第一方面,提供一種對(duì)數(shù)據(jù)進(jìn)行編碼的方法,如權(quán)利要求1所述:一 種方法,用于對(duì)數(shù)據(jù)(Dl)進(jìn)行編碼W生成相應(yīng)的編碼數(shù)據(jù)化2),所述方法包括:
[0028] (a)分析要被編碼的數(shù)據(jù)(Dl),確定要被編碼的數(shù)據(jù)(Dl)中的一個(gè)或多個(gè)結(jié)構(gòu)特 征;
[0029] (b)把要被編碼的數(shù)據(jù)(Dl)作為取決于一個(gè)或多個(gè)結(jié)構(gòu)特征的一個(gè)或多個(gè)部分進(jìn) 行編碼,選擇有效地對(duì)一個(gè)或多個(gè)部分進(jìn)行編碼的一個(gè)或多個(gè)方法,其中,一個(gè)或多個(gè)方法 包括至少一個(gè)外插值編碼方法.
[0030] (C)通過把生成自一個(gè)或多個(gè)部分的數(shù)據(jù)進(jìn)行組合,生成編碼數(shù)據(jù)化2),其中,編 碼數(shù)據(jù)化2)包括指示被采用來根據(jù)相關(guān)參數(shù)對(duì)一個(gè)或多個(gè)部分進(jìn)行編碼的方