專(zhuān)利名稱(chēng):數(shù)字視頻編碼用可變精度圖像間定時(shí)規(guī)定的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多媒體壓縮系統(tǒng)的領(lǐng)域。具體來(lái)說(shuō),本發(fā)明公開(kāi)了一種用于規(guī)定可變精度圖像間(inter-picture)定吋的方法和系統(tǒng)。
技術(shù)背景基于數(shù)字的電子媒體格式最終在尖端在很大程度上取代模擬電子 媒體格式。數(shù)字壓縮磁盤(pán)(CD)很早以前就取代了模擬乙烯唱片。模 擬盒式磁帶越來(lái)越稀少。第二和第三代數(shù)字音頻系統(tǒng),例如MD盤(pán)和 MP3 (MPEG音頻第三層)正在從壓縮磁盤(pán)的第一代數(shù)字音頻格式中 分享市場(chǎng)份額。視頻媒體轉(zhuǎn)向數(shù)字存儲(chǔ)和傳輸格式的速度比音頻媒體慢。很大程 度上是由于大量的數(shù)字信息需要以數(shù)字形式精確地表達(dá)視頻。需要精 確地表達(dá)視頻的大量數(shù)字信息需要非常高容量的數(shù)字存儲(chǔ)系統(tǒng)和高帶 寬的傳輸系統(tǒng)。然而,視頻正在迅速地向數(shù)字存儲(chǔ)和傳輸格式轉(zhuǎn)變。更快的計(jì)算 機(jī)處理器、高密度存儲(chǔ)系統(tǒng),和新型有效的壓縮和編碼算法最終使數(shù) 字視頻適合于消費(fèi)者物價(jià)點(diǎn)。DVD (數(shù)字多功能光盤(pán)),即一種數(shù)字視 頻系統(tǒng),在幾年間已成為最為暢銷(xiāo)的消費(fèi)者電子產(chǎn)品之一。DVD以其 高視頻質(zhì)量、非常高的音頻質(zhì)量、方便性和額外特征已經(jīng)迅速取代了 盒式錄像機(jī)(VCR)成為預(yù)錄制視頻回放系統(tǒng)的選擇。老式的模擬NTSC (國(guó)家電視標(biāo)準(zhǔn)委員會(huì))視頻傳輸系統(tǒng)正在被數(shù)字ATSC (先進(jìn)電視標(biāo) 準(zhǔn)委員會(huì))視頻傳輸系統(tǒng)所取代。計(jì)算機(jī)系統(tǒng)已經(jīng)使用許多年各種不同的數(shù)字編碼格式。計(jì)算機(jī)系 統(tǒng)使用的最好的數(shù)字視頻壓縮和編碼系統(tǒng)是眾所周知的縮寫(xiě)為MPEG 的活動(dòng)圖像專(zhuān)家組(Motion Pictures Expert Croup)所支持的數(shù)字視頻 格式。MPEG的最著名并被最廣泛應(yīng)用的三種數(shù)字媒體格式被簡(jiǎn)稱(chēng)為 MPEG-1, MPEG-2和MPEG-4。視頻CD (VCD)和早期的消費(fèi)者級(jí)數(shù)字視頻編輯系統(tǒng)使用早期的MPEG-l.數(shù)字視頻編碼格式。數(shù)字多功能光盤(pán)(DVD)和Dish Network牌直播衛(wèi)星(DBS)電視廣播系統(tǒng)使 用更高質(zhì)量的MPEG-2數(shù)字視頻壓縮和編碼系統(tǒng)。MPEG-4編碼系統(tǒng) 迅速地被最新的基于計(jì)算機(jī)的數(shù)字視頻編碼器改進(jìn)并與數(shù)字視頻播放 器相關(guān)聯(lián)。MPEG-2和MPEG-4標(biāo)準(zhǔn)壓縮一系列視頻幀或視頻場(chǎng)并且隨后將 壓縮的幀或場(chǎng)編碼為數(shù)字比特流。當(dāng)對(duì)視頻幀或場(chǎng)用MPEG-2和 MPEG-4系統(tǒng)進(jìn)行編碼時(shí),視頻幀或場(chǎng)將被分成宏塊的矩形網(wǎng)格。每個(gè) 宏塊被獨(dú)立地壓縮或編碼。當(dāng)壓縮視頻幀或場(chǎng)時(shí),該MPEG-4標(biāo)準(zhǔn)可以將幀或場(chǎng)壓縮成三種 壓縮的幀或場(chǎng)的一種幀內(nèi)編碼幀(I-幀),單向預(yù)測(cè)幀(P幀),或雙 向預(yù)測(cè)幀(B幀)。幀內(nèi)編碼幀在不參照其它視頻幀的情況下完全獨(dú)立 地將獨(dú)立視頻幀編碼。P幀參照單一先前顯示的視頻幀限定一個(gè)視頻 幀。B幀參照當(dāng)前幀之前顯示的視頻幀和在當(dāng)前幀后顯示的視頻幀限 定一個(gè)視頻幀。由于對(duì)冗余視頻信息的有效利用,P幀和B幀通常提 供最好的壓縮。發(fā)明內(nèi)容用于數(shù)字視頻編碼的可變精度圖像間定吋規(guī)定的方法和裝置被公 開(kāi)。具體來(lái)說(shuō),本發(fā)明公開(kāi)了一種使臨近的視頻圖像的相對(duì)吋間以相 當(dāng)有效的方式進(jìn)行編碼的系統(tǒng)。在一個(gè)實(shí)施方式中,確定當(dāng)前視頻圖 像和臨近視頻圖像之間的顯示時(shí)間差。該顯示時(shí)間差隨后被編碼為視 頻圖像的數(shù)字表示。在一個(gè)優(yōu)選實(shí)施方式中,臨近的視頻圖像是最新 傳輸?shù)拇鎯?chǔ)圖像。為有效地進(jìn)行編碼,顯示時(shí)間差可以用可變長(zhǎng)度的編碼系統(tǒng)或算 術(shù)編碼進(jìn)行編碼。在一個(gè)可選擇實(shí)施方式中,顯示時(shí)間差被編碼為2 的冪來(lái)減少傳輸?shù)谋忍氐臄?shù)目。從附圖和以下的詳細(xì)說(shuō)明中可以使本發(fā)明的其它目的、特征和優(yōu) 點(diǎn)顯而易見(jiàn)。
本領(lǐng)域的技術(shù)人員參照以下的詳細(xì)說(shuō)明將很容易地理解本發(fā)明的 目的,特性和優(yōu)點(diǎn)。圖1表示一種可能的數(shù)字視頻編碼系統(tǒng)的高級(jí)框圖。圖2表示一系列圖像應(yīng)該播放的順序排列的視頻圖像,其中連接 不同圖像的箭頭代表用運(yùn)動(dòng)補(bǔ)償創(chuàng)建的圖像間相關(guān)性。 -圖3表示以圖像的優(yōu)選傳輸順序排列的圖2中的視頻圖像,其中 連接不同圖像的箭頭表示用運(yùn)動(dòng)補(bǔ)償創(chuàng)建的圖像間相關(guān)性。圖4表示一系列視頻圖像,其中視頻圖像間互相參照的距離被選 為2的冪。
具體實(shí)施方式
一種多媒體壓縮和編碼系統(tǒng)中用于制定變化精度的圖像間定時(shí)的 方法和系統(tǒng)被公開(kāi)。在以下的描述中,為了說(shuō)明的目的,所闡述的特 定術(shù)語(yǔ)為本發(fā)明提供全面理解。然而,對(duì)于本領(lǐng)域的技術(shù)人員,實(shí)施本發(fā)明并不需要這些具體細(xì)節(jié)。例如,本發(fā)明是參照MPEG-4多媒體 壓縮和編碼系統(tǒng)來(lái)進(jìn)行說(shuō)明的。然而,相同的技術(shù)可以容易地應(yīng)用在 其它類(lèi)型的壓縮和編碼系統(tǒng)中。多媒體壓縮和編碼綜述圖1表示技術(shù)領(lǐng)域中所熟知的典型的數(shù)字視頻編碼器100的高級(jí) 框圖。該數(shù)字視頻編碼器]00接收在框圖的左側(cè)的視頻幀105的輸入 視頻流。每個(gè)視頻幀被離散余弦變換(DCT)單元110所處理。該幀 可以獨(dú)立地(幀內(nèi))處理或者參照運(yùn)動(dòng)補(bǔ)償單元(幀間)接收來(lái)自其 它幀的信息來(lái)處理。然后, 一個(gè)量化器(Q)單元120將來(lái)自離散余弦 變換單元110的信息量化。最后,量化的視頻幀用熵編碼器(H)單元 180編碼來(lái)生成編碼的比特流。該熵編碼器(H)單元180可以用可變 長(zhǎng)度編碼(VLC)系統(tǒng)。由于幀間編碼的視頻幀是參照其它臨近視頻幀來(lái)限定的,所以數(shù) 字視頻編碼器]00需要?jiǎng)?chuàng)建一個(gè)將出現(xiàn)在數(shù)字視頻解碼器中的每個(gè)幀 怎樣解碼的復(fù)本,這樣幀間就可以被編碼。因此,數(shù)字視頻編碼器IOO 的下部實(shí)際為一個(gè)數(shù)字視頻解碼器系統(tǒng)。具體來(lái)說(shuō), 一個(gè)反量化(Q—"單元130將視頻幀信息的量化倒置,并且反離散余弦變換(DCT—1)單 元140將視頻幀信息的離散余弦變換進(jìn)行倒置。在所有DCT系數(shù)從 iDCT中重建時(shí),該運(yùn)動(dòng)補(bǔ)償單元將使用信息以及運(yùn)動(dòng)矢量來(lái)重建隨后 將被用作下一幀運(yùn)動(dòng)評(píng)估的參考幀的編碼幀。該解碼幀可隨后用于對(duì)相對(duì)于解碼視頻幀中的信息限定的幀間(P 幀或B幀)進(jìn)行編碼。具體來(lái)說(shuō), 一種運(yùn)動(dòng)補(bǔ)償(MC)單元50和運(yùn) 動(dòng)評(píng)估(ME)單元160被用來(lái)確定運(yùn)動(dòng)矢量并產(chǎn)生用于編碼幀間的不 同數(shù)值。一個(gè)速率控制器l卯接收來(lái)自數(shù)字視頻編碼器100的不同分量的 信息并使用該信息為每個(gè)視頻幀分配比特預(yù)算。該速率控制器190應(yīng) 按照以下方式分配比特預(yù)算,使其產(chǎn)生最高質(zhì)量的遵循一系列指定的 限制的數(shù)字視頻比特流。具體來(lái)說(shuō),該速率控制器190在沒(méi)有溢出緩 沖(通過(guò)發(fā)射比能夠存儲(chǔ)的更多的信息來(lái)超過(guò)解碼器中可訪(fǎng)問(wèn)的存儲(chǔ) 量)或下溢緩沖(發(fā)送視頻幀不夠快因此使解碼器缺少進(jìn)行顯示的視 頻幀)的情況下產(chǎn)生最高質(zhì)量的壓縮視頻流。多媒體壓縮與編碼綜述在一些視頻信號(hào)中,連續(xù)視頻圖像(幀或場(chǎng))之間的時(shí)間可以不 恒定。(注意本文將用術(shù)語(yǔ)視頻圖像來(lái)一般地指視頻幀或視頻場(chǎng))。 例如, 一些視頻圖像可能由于傳輸帶寬的限制而丟掉。此外,該視頻 定時(shí)還可能由于攝像機(jī)的不規(guī)則或特殊效果,如慢動(dòng)作或快動(dòng)作等而 改變。在一些視頻流中,原始視頻源可以通過(guò)設(shè)計(jì)簡(jiǎn)單地具有非一致 圖像間吋間。例如,由于沒(méi)有通過(guò)例如視頻攝像系統(tǒng)等統(tǒng)一的視頻捕 捉系統(tǒng)來(lái)創(chuàng)建非任意視頻定時(shí),所以如計(jì)算機(jī)圖像動(dòng)畫(huà)等合成視頻可 具有非一致的定時(shí)。靈活的數(shù)字視頻編碼系統(tǒng)應(yīng)能夠處理非一致的定 時(shí)。許多數(shù)字視頻編碼系統(tǒng)將視頻圖像分成宏塊的矩形網(wǎng)格。視頻圖 像中的每個(gè)個(gè)體宏塊被獨(dú)立地壓縮和編碼。在某些實(shí)施方式中,使用 熟知的"像素區(qū)塊"的宏塊中的子塊。這樣的像素塊可以具有其本身 的可內(nèi)插的運(yùn)動(dòng)矢量。即使本發(fā)明的說(shuō)明被等同地應(yīng)用在宏塊和像素 區(qū)塊中,本文將涉及宏塊。某些視頻編碼標(biāo)準(zhǔn),如,ISO MPEG標(biāo)準(zhǔn)或ITU H.264標(biāo)準(zhǔn),使用不同類(lèi)型的預(yù)測(cè)宏塊來(lái)將視頻圖像編碼。在預(yù)期中,宏塊可以為以下 三種類(lèi)型中的一種。1. I宏塊——一個(gè)內(nèi)(I)宏塊在其編碼中不使用來(lái)自任何其它視 頻圖像的信息(完全自定義的);2. P宏塊——一種單向預(yù)測(cè)(P)宏塊是指來(lái)自一在前視頻圖像 的圖像信息;或3. B宏塊——一種雙向預(yù)測(cè)(B)宏塊使用一在前圖像和一在后 視頻圖像的信息。如果視頻圖像中所有的宏塊為內(nèi)宏塊,則視頻圖像為幀內(nèi)編碼幀。 如果一個(gè)視頻圖像僅包括單向預(yù)測(cè)宏塊或內(nèi)宏塊,則視頻圖像被已知 為P幀。如果視頻圖像包括任何雙向預(yù)測(cè)宏塊,那么視頻圖像已知為B 幀。為簡(jiǎn)單起見(jiàn),本文將考慮所給圖像中的所有宏塊為同一類(lèi)型的情 況。將編碼的視頻圖像的一個(gè)樣本順序可以表示為1,B2B3B4P5B6B7B8B9P,oBuP,2B,31,4…其中字母(1, P或B)代表如果視頻圖像為I幀,P幀,或B幀,且數(shù)字代表以視頻圖像的順序的視頻圖像的攝像順序。該攝像的順序 為攝像機(jī)記錄視頻圖像的順序,因此也是視頻圖像應(yīng)該被顯示的順序 (顯示順序)。視頻圖像的在前樣本系列在圖2中圖解表示。參考圖2,箭頭表示來(lái)自存儲(chǔ)圖像的宏塊(在此種情況下I幀或p幀)被用在其它圖像的 運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)中。在圖2的情況中,在幀內(nèi)視頻圖像I,的編譯中沒(méi)有來(lái)自其它圖像的信息。視頻圖像P5是在其編碼過(guò)程中使用來(lái)自在前視頻圖像I,的視 頻信息的P幀,因此從視頻圖像I,到視頻圖像P5繪制了一個(gè)箭頭。視 頻圖像B2、視頻圖像B3、視頻像B4在其編譯過(guò)程中都使用來(lái)自視頻圖像I,和視頻圖像p5的信息,因此從視頻圖像L和視頻圖像p5到視頻圖像B2、視頻圖像B3和視頻圖像B4繪制了箭頭。如上所述該圖像間吋間通?;ゲ幌嗤S捎贐圖像使用來(lái)自在后圖像(隨后將被顯示的圖像)的信息時(shí),傳輸順序通常與顯示順序不同。具體來(lái)說(shuō),構(gòu)建其它圖像所需的視頻 圖像應(yīng)首先被傳輸。對(duì)于以上順序,傳輸順序應(yīng)為 1,P5B2B3B4PiqB6B7BsB9P,2B,山4B,3…圖3圖解說(shuō)明了圖2中的視頻圖像的上述傳輸順序。再次地,圖 中的箭頭指示來(lái)自存儲(chǔ)的圖像的宏塊(此種情況下為I或P)被用在其 它視頻圖像的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)中。參照?qǐng)D3,該系統(tǒng)首先傳輸并不依賴(lài)于任何其它幀的I幀I,。隨后, 該系統(tǒng)傳輸依賴(lài)于視頻圖像I,的P幀視頻圖像P5。隨后,即使視頻圖 像B2將在視頻圖像P5前被顯示,系統(tǒng)仍將在視頻圖像P5后傳輸B幀 視頻圖像B2。其原因是,當(dāng)應(yīng)對(duì)B2進(jìn)行解碼時(shí),解碼器將己經(jīng)接收并 存儲(chǔ)了將視頻圖像B2進(jìn)行解碼所必須的視頻圖像I,和P5中的信息。類(lèi)似地,視頻圖像I卜P5已準(zhǔn)備好來(lái)將隨后的視頻圖像B3和視頻圖像B4進(jìn)行解碼。該接收器/解碼器記錄用于正確顯示的視頻圖像順序。在本 操作中,I和P圖像通常指存儲(chǔ)的圖像。P幀圖像的編碼過(guò)程典型地使用運(yùn)動(dòng)補(bǔ)償,其中在圖像中為每個(gè)宏 塊來(lái)計(jì)算運(yùn)動(dòng)矢量。使用計(jì)算出的運(yùn)動(dòng)矢量,預(yù)測(cè)宏塊(P宏塊)可以 通過(guò)轉(zhuǎn)變上述在前圖像中的像素來(lái)進(jìn)行。在P幀圖像中的實(shí)際宏塊和 預(yù)測(cè)宏塊之間的差別隨后被編碼以進(jìn)行傳輸。每個(gè)運(yùn)動(dòng)矢量也可以通過(guò)預(yù)測(cè)編碼來(lái)傳輸。例如, 一個(gè)運(yùn)動(dòng)矢量 預(yù)測(cè)可以用臨近的運(yùn)動(dòng)矢量形成。在此種情況下,在實(shí)際運(yùn)動(dòng)矢量和 運(yùn)動(dòng)矢量預(yù)測(cè)之間的差別被編碼以進(jìn)行傳輸。每個(gè)B宏塊使用兩個(gè)運(yùn)動(dòng)矢量第一運(yùn)動(dòng)矢量是指上述在前視頻 圖像,第二運(yùn)動(dòng)矢量是指在后視頻圖像。從這兩個(gè)運(yùn)動(dòng)矢量中,計(jì)算 兩個(gè)預(yù)測(cè)宏塊。此兩個(gè)預(yù)測(cè)宏塊隨后用某一函數(shù)結(jié)合在一起來(lái)形成最 終的預(yù)測(cè)宏塊。如上所述,在B幀圖像中的實(shí)際宏塊和最終預(yù)測(cè)宏塊 之間的差別隨后被編碼以進(jìn)行傳輸。由于具有P宏塊,B宏塊的每個(gè)運(yùn)動(dòng)矢量(MV)可以通過(guò)預(yù)測(cè)編 碼來(lái)傳輸。具體來(lái)說(shuō), 一個(gè)預(yù)測(cè)運(yùn)動(dòng)矢量用臨近的運(yùn)動(dòng)矢量來(lái)形成。 隨后,在實(shí)際運(yùn)動(dòng)矢量和預(yù)測(cè)的之間的差別被編碼以進(jìn)行傳輸。然而,由于B宏塊,存在著從最近的存儲(chǔ)圖像宏塊中內(nèi)插運(yùn)動(dòng)矢 量的機(jī)會(huì)。在數(shù)字視頻編碼和數(shù)字視頻解碼中都進(jìn)行這樣的內(nèi)插。該運(yùn)動(dòng)矢量在從攝影機(jī)緩慢掃過(guò)靜態(tài)背景的視頻順序的視頻圖像 中工作得非常好。實(shí)際上,這樣的運(yùn)動(dòng)矢量?jī)?nèi)插足夠好以致可以單獨(dú) 使用。具體來(lái)說(shuō),這意味著對(duì)于這些使用內(nèi)插的編碼的B宏塊運(yùn)動(dòng)矢 量無(wú)需計(jì)算或傳輸任何差別信息。為進(jìn)一步說(shuō)明,在上述情況中,我們將圖像i和j之間的圖像間顯示時(shí)間表示為Di,i,即,如果圖像的顯示時(shí)間分別為T(mén)i和Tj,貝lj Di,「Ti-Tj隨后為 Di,「Di'j+Dj,k Di, k=-Dk, i 注意Di,j在某些情況下可以取負(fù)值。因此,如果MV5,,為參考I,的P5宏塊的運(yùn)動(dòng)矢量,則對(duì)于B2、 B3 和B4中對(duì)應(yīng)的宏塊,參考I,和P5的運(yùn)動(dòng)矢量應(yīng)分別地插入 MV2. ,二MV5,,承D2,,/D5j MV5, 2=MV5J*D5,2/D5J MV3, 「MV5, ,D3,'/D5,,MLV4,產(chǎn)MV5,JD4',/D5j MV5,4=MV5, ^Ds,4/D5,, 注意,由于顯示吋間的比率被用于運(yùn)動(dòng)矢量預(yù)測(cè),所以不需要絕 對(duì)顯示吋間。因此,相對(duì)顯示時(shí)間可以用做Di,i顯示時(shí)間值。本情況作為H.264標(biāo)準(zhǔn)中的實(shí)例被概括。在概括中, 一個(gè)P或B 圖像可以使用任何先前傳輸?shù)膱D像用于運(yùn)動(dòng)矢量預(yù)測(cè)。因此,在上述情況下,圖像B3可以在其預(yù)測(cè)中使用圖像Ii和圖像B2。此外,運(yùn)動(dòng)圖像不僅可被內(nèi)插還可被外推。因此,在此種情況下我們將得到 MV3,產(chǎn)MV2,'承D3, "D2,'此種運(yùn)動(dòng)矢量外推(或內(nèi)插)也可以應(yīng)用在預(yù)測(cè)過(guò)程中來(lái)用于運(yùn) 動(dòng)矢量的預(yù)測(cè)編碼過(guò)程。在任何情況下,在非一致圖像間時(shí)間的問(wèn)題是將Di,j的相對(duì)顯示時(shí) 間傳輸?shù)浇邮掌魃?,這也是本發(fā)明的主題。在本發(fā)明的一個(gè)實(shí)施方式 中,在第一圖像之后對(duì)于每個(gè)圖像,我們將傳輸當(dāng)前圖像和最新傳輸?shù)拇鎯?chǔ)圖像之間的顯示時(shí)間差。為了錯(cuò)誤恢復(fù),在圖像中應(yīng)將傳輸重復(fù)幾次,例如,在MPEG或H.264標(biāo)準(zhǔn)的所謂切片頭部(sliceheader) 中。如果所有的切片頭部丟失,那么推測(cè)起來(lái),用于解碼信息的依賴(lài) 于丟失圖像的其它圖像也不能被解碼。因此,在上述情況中,我們應(yīng)傳輸以下i D2, sD3, 5D4,5D10,5D6,10D7, ioDs, 10D9, ioD|2.10 Du, 12D14, 12D13,14--' 為了運(yùn)動(dòng)矢量的評(píng)估,用于Du的精度需要可以在各圖像間改變。例如,如果在兩個(gè)P幀圖像P5和P7之間的中途只有一個(gè)單一 B幀圖像B6,則發(fā)送D7,5=2和D6,7=-l就足夠了。其中Di, j顯示時(shí)間值為相對(duì)時(shí)間值。如果,作為替換,視頻圖像B6僅在視頻圖像P5和視頻圖像P7之間距離的1/4處,則將發(fā)送的適當(dāng) 的Di,j顯示時(shí)間值為D7,5="CI D6,產(chǎn)-l注意在以上兩個(gè)例子中,在視頻圖像B6和視頻圖像P7之間的顯示時(shí)間是作為顯示吋間"單位"來(lái)使用,并且在視頻圖像P5和視頻圖像 P;之間的顯示時(shí)間差為4個(gè)顯示時(shí)間"單位"??傊绻龜?shù)為2的冪則運(yùn)動(dòng)矢量評(píng)估的復(fù)雜性較小。如果如 圖4中所圖解的,兩個(gè)存儲(chǔ)圖像之間的Di,i (圖像問(wèn)吋間)被選為2的 冪,則在我們的實(shí)施方式中很容易完成。可選擇地,該評(píng)估過(guò)程可以 被定義為將所有除數(shù)取截取或近似為2的冪。當(dāng)圖像間的時(shí)間為2的冪時(shí),如果只有(2的)整數(shù)次冪被傳輸, 而不是圖像間時(shí)間的全數(shù)值被傳輸,數(shù)據(jù)比特的數(shù)目能夠被減少。圖4 中圖解說(shuō)明了圖像間的距離被選為2的冪的情況。在此種情況下,在 視頻圖像P,和視頻圖像P3之間的D3J顯示時(shí)間值2傳輸為1 (因?yàn)?2'=2),并且在視頻圖像P7和視頻圖像P3之間的07,3顯示時(shí)間值4可 以傳輸為2 (由于22=4)。在某些情況下,可以不使用運(yùn)動(dòng)矢量?jī)?nèi)插。然而,仍然需要將視 頻圖像的顯示順序傳輸?shù)浇邮掌?播放器系統(tǒng)中,這樣接收器/播放器將 按照適當(dāng)?shù)捻樞蝻@示視頻圖像。在此種情況下,不考慮實(shí)際顯示的時(shí) 間,用于Di,的簡(jiǎn)單有符號(hào)整數(shù)就足夠。在某些應(yīng)用中可以只需要符號(hào)。圖像間時(shí)間Di,i可以簡(jiǎn)單地作為簡(jiǎn)單有符號(hào)整數(shù)值傳輸。然而,可 以使用許多方法來(lái)將Di,i數(shù)值編碼來(lái)完成額外壓縮。例如, 一個(gè)可變長(zhǎng) 度編碼數(shù)量之前的符號(hào)位相對(duì)容易實(shí)施和提供編碼效率。可以使用的一個(gè)此種可變長(zhǎng)度編碼系統(tǒng)是所熟知的UVLC (通用 可變長(zhǎng)度編碼)。該UVLC可變長(zhǎng)度編碼系統(tǒng)由編碼詞給出1 = 12= 010 3 = 011 4= 00100 5= 00101 6= 00〗10 7= 00111 8 = 0001000...用于將圖像間時(shí)間編碼的另一種方法可以用算術(shù)編碼方法。典型 地,算術(shù)編碼使用條件可能性來(lái)實(shí)現(xiàn)數(shù)據(jù)比特的非常高的壓縮。因此,本發(fā)明介紹了一種將圖像間顯示時(shí)間進(jìn)行編碼和傳輸?shù)暮?jiǎn) 單但有效的方法。圖像間的顯示時(shí)間的編碼過(guò)程可以通過(guò)使用可變長(zhǎng) 度編碼或算術(shù)編碼而變得非常有效。此外,所需的精度可以選為符合 視頻解碼器的需要,而不再更多。上述內(nèi)容說(shuō)明了一種用于在多媒體壓縮和編碼系統(tǒng)中指定各種精 度的圖像間時(shí)間的系統(tǒng)。應(yīng)該理解的是本領(lǐng)域的普通技術(shù)人員可以在 不背離本發(fā)明范圍的情況下對(duì)本發(fā)明元件的材料和排列進(jìn)行改變和改 進(jìn)。
權(quán)利要求
1.一種方法,包括接收第一視頻圖像、第二視頻圖像和所述第二視頻圖像的順序值,所述順序值表示在視頻圖像的序列中所述第二視頻圖像相對(duì)于所述第一視頻圖像的位置;以及通過(guò)使用所述順序值來(lái)對(duì)所述第二視頻圖像進(jìn)行解碼。
2. 如權(quán)利要求1所述的方法,其中所述順序值表示時(shí)間值。
3. 如權(quán)利要求1所述的方法,其中所述順序值不表示時(shí)間值。
4. 如權(quán)利要求1所述的方法,其中所述視頻圖像的序列是用于顯 示視頻圖像的序列。
5. 如權(quán)利要求1所述的方法,其中對(duì)所述第二視頻圖像進(jìn)行解碼 包括使用所述順序值來(lái)基于另一視頻圖像的運(yùn)動(dòng)矢量計(jì)算用于所述第 二視頻圖像的運(yùn)動(dòng)矢量。
6. 如權(quán)利要求5所述的方法,其中所述另一圖像是第三視頻圖像。
7. 如權(quán)利要求5所述的方法,其中計(jì)算所述運(yùn)動(dòng)矢量包括基于所 述另 一視頻圖像的所述運(yùn)動(dòng)矢量來(lái)執(zhí)行內(nèi)插操作。
8. 如權(quán)利要求5所述的方法,其中計(jì)算所述運(yùn)動(dòng)矢量包括基于所 述另一視頻圖像的所述運(yùn)動(dòng)矢量來(lái)執(zhí)行外推操作。
9. 如權(quán)利要求1所述的方法,其中所述順序值是壓縮的順序值。
10. 如權(quán)利要求9所述的方法,其中所述順序值是通過(guò)使用可變長(zhǎng) 度編碼來(lái)壓縮的。
11. 如權(quán)利要求9所述的方法,其中所述順序值是通過(guò)使用算術(shù)編 碼來(lái)壓縮的。
12. 如權(quán)利要求1所述的方法,其中所述順序值被存儲(chǔ)在與所述第 二視頻圖像相關(guān)的切片頭部中。
13. 如權(quán)利要求1所述的方法,其中所述順序值表示所述第二視頻 圖像和所述第一視頻圖像之間的順序差值。
14. 如權(quán)利要求1所述的方法,其中所述順序值在所述第二視頻圖像中被存儲(chǔ)了多于一次。
15. 如權(quán)利要求l所述的方法,還包括接收順序值的序列,其中所 述順序值的序列是非一致的。
16. —種方法,包括接收第一視頻圖像、第二視頻圖像和所述第二視頻圖像的順序值, 所述順序值表示在視頻圖像的序列中所述第二視頻圖像相對(duì)于所述第一視頻圖像的位置;以及通過(guò)使用所述順序值來(lái)顯示所述第二視頻圖像。
17. 如權(quán)利要求16所述的方法,其中所述順序值用于基于另一視 頻圖像的運(yùn)動(dòng)矢量來(lái)計(jì)算用于所述第二視頻圖像的運(yùn)動(dòng)矢量。
18. —種方法,包括 接收第一視頻圖像;接收使所述第一視頻圖像與第二視頻圖像相關(guān)的順序值;以及 通過(guò)使用所述順序值來(lái)計(jì)算用于所述第一視頻圖像的第一運(yùn)動(dòng)矢里。
19. 如權(quán)利要求18所述的方法,其中計(jì)算所述第一運(yùn)動(dòng)矢量包括 使用所述順序值來(lái)對(duì)第二運(yùn)動(dòng)矢量執(zhí)行內(nèi)插操作以計(jì)算所述第一運(yùn)動(dòng)矢量。
20. 如權(quán)利要求18所述的方法,其中所述第二視頻圖像用于在所 述第一視頻圖像的解碼之前進(jìn)行解碼。
21. 如權(quán)利要求18所述的方法,其中所述順序值被存儲(chǔ)在與所述第一視頻圖像相關(guān)的切片頭部中。
22. 如權(quán)利要求18所述的方法,其中所述順序值在所述第一視頻 圖像中被存儲(chǔ)了多于一次。
23. 如權(quán)利要求18所述的方法,其中所述順序值包括時(shí)間值。
24. 如權(quán)利要求18所述的方法,其中計(jì)算所述第一運(yùn)動(dòng)矢量包括 確定所述第一視頻圖像的順序值和第二視頻圖像的順序值之間的第一順序差值;確定第三視頻圖像的順序值和所述第二視頻圖像的所述順序值之 間的第二順序差值;以及通過(guò)將用于所述第三視頻圖像的運(yùn)動(dòng)矢量與由所述第一順序差值 和所述第二順序差值定義的值相乘來(lái)計(jì)算用于所述第一視頻圖像的所 述第一運(yùn)動(dòng)矢量。
25. —種解碼方法,用于包括第一視頻圖像、第二視頻圖像和第三 視頻圖像的比特流,所述方法包括計(jì)算特定值,該特定值基于(i)所述第三視頻圖像的順序值和所述第一視頻圖像的順序值之間的第一順序差值,禾n (ii)所述第二視頻圖像的順序值和所述第一視頻圖像的所述順序值之間的第二順序差值;基于所述特定值和用于所述第三視頻圖像的運(yùn)動(dòng)矢量來(lái)計(jì)算用于 所述第二視頻圖像的特定運(yùn)動(dòng)矢量;以及通過(guò)使用計(jì)算的運(yùn)動(dòng)矢量來(lái)對(duì)至少一個(gè)視頻圖像進(jìn)行解碼。
26. 如權(quán)利要求25所述的方法,其中特定視頻圖像的順序值用于 指定該特定視頻圖像在視頻圖像的序列中的位置。
27. 如權(quán)利要求26所述的方法,其中所述序列是用于顯示視頻圖 像的序列。
28. 如權(quán)利要求25所述的方法,其中特定視頻圖像的順序值表示 該特定視頻圖像相對(duì)于另一視頻圖像的位置關(guān)系。
29. 如權(quán)利要求25所述的方法,其中所述特定值與所述第二順序 差值成比例。
30. 如權(quán)利要求25所述的方法,其中所述特定值與所述第一順序 差值成反比。
31. 如權(quán)利要求25所述的方法,其中所述第二視頻圖像的所述順 序值來(lái)源于存儲(chǔ)在與所述第二視頻圖像相關(guān)的切片頭部中的值。
32. 如權(quán)利要求25所述的方法,其中通過(guò)使用計(jì)算的運(yùn)動(dòng)矢量來(lái) 對(duì)所述第二視頻圖像進(jìn)行解碼。
33. 如權(quán)利要求32所述的方法,其中所述第一和第三視頻圖像在 所述第二視頻圖像之前被解碼。
34. —種方法,用于包括第一視頻圖像、第二視頻圖像和第三視頻 圖像的流,所述方法包括計(jì)算基于第一順序差值和第二順序差值的特定值,其中(i) 所述第一順序差值表示所述第三視頻圖像的順序值和所 述第一視頻圖像的順序值之間的差值;并且(ii) 所述第二順序差值表示所述第二視頻圖像的順序值和所 述第一視頻圖像的所述順序值之間的差值,其中特定視頻圖像的順序 值表示該特定視頻圖像在視頻圖像的序列中的位置;基于所述特定值和用于所述第三視頻圖像的運(yùn)動(dòng)矢量來(lái)計(jì)算用于 所述第二視頻圖像的運(yùn)動(dòng)矢量;以及基于用于所述第三視頻圖像的所述運(yùn)動(dòng)矢量來(lái)計(jì)算用于所述第二 視頻圖像的另一運(yùn)動(dòng)矢量。
35. 如權(quán)利要求34所述的方法,其中所述特定視頻圖像的所述順 序值指定所述特定視頻圖像在視頻圖像的序列中的顯示順序。
36. —種設(shè)備,包括用于執(zhí)行如權(quán)利要求1-35中的任一項(xiàng)所述 的方法的裝置。
全文摘要
本發(fā)明公開(kāi)了一種數(shù)字視頻編碼中用于可變精度圖像間定時(shí)規(guī)定的方法和裝置。具體來(lái)說(shuō),本發(fā)明提供一種允許臨近視頻圖像的相對(duì)時(shí)間可以按各種有效的方式進(jìn)行編碼的系統(tǒng)。在一個(gè)實(shí)施方式中,確定了當(dāng)前視頻圖像(105)和臨近視頻圖像中的顯示時(shí)間差。顯示時(shí)間差隨后被編碼(180)為視頻圖像的數(shù)字表達(dá)。在一個(gè)優(yōu)選實(shí)施方式中,該臨近視頻圖像為最新傳輸?shù)拇鎯?chǔ)圖像。為有效進(jìn)行編碼,顯示時(shí)間差可以用可變長(zhǎng)度編碼系統(tǒng)或算術(shù)編碼進(jìn)行編碼。在一個(gè)可選擇實(shí)施方式中,該顯示時(shí)間差被作為2的冪來(lái)進(jìn)行編碼以減少傳輸比特的數(shù)目。
文檔編號(hào)H04N7/36GK101262605SQ20081008223
公開(kāi)日2008年9月10日 申請(qǐng)日期2003年7月11日 優(yōu)先權(quán)日2002年7月15日
發(fā)明者A·普里, A·杜米特拉斯, B·G·哈斯克爾, D·W·辛格 申請(qǐng)人:蘋(píng)果電腦有限公司