基于視頻內(nèi)容特征的參數(shù)自適應(yīng)多維碼率控制方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及視頻解碼領(lǐng)域,具體而言,涉及視頻編碼技術(shù)領(lǐng)域的碼率控制方法,特 別是基于視頻內(nèi)容特征的參數(shù)自適應(yīng)多維碼率控制方法,可以應(yīng)用于在多元集成異構(gòu)網(wǎng) 絡(luò)、帶寬大范圍動態(tài)變化場合的網(wǎng)絡(luò)視頻編碼器多維碼率控制方法。
【背景技術(shù)】
[0002] 隨著多媒體通信及網(wǎng)絡(luò)技術(shù)的發(fā)展,人們對視頻的應(yīng)用需求越來越廣泛,視頻信 息正對人們的生活方式和社會發(fā)展起著越來越重要的作用;視頻編碼壓縮技術(shù)是視頻存 儲、傳輸、播放等環(huán)節(jié)的前提,是數(shù)字電視、視頻監(jiān)控、網(wǎng)絡(luò)視頻等應(yīng)用的核心技術(shù);碼率控 制技術(shù)是視頻壓縮和傳輸中的最重要的環(huán)節(jié)之一,碼率控制的目的是在一定的實際信道帶 寬下,盡可能地提高視頻編碼重構(gòu)圖像的主客觀質(zhì)量,并負責(zé)使視頻編碼器產(chǎn)生的碼率和 實際信道帶寬相匹配,因此其在編碼器中的作用十分重要。
[0003]現(xiàn)有碼率控制方法都是基于量化參數(shù)的調(diào)整來平衡碼流,且現(xiàn)有的方法一般只能 提供一種質(zhì)量等級的視頻輸出,這種做法對于帶寬波動大的應(yīng)用靈活度不夠,無法在帶寬 實時低碼率情況下使得綜合視頻質(zhì)量最優(yōu);多維碼率控制就是在這種背景下被提出的,多 維碼率控制將調(diào)節(jié)碼率的基本手段有機結(jié)合,將傳統(tǒng)的碼率轉(zhuǎn)換(改變量化步長)、空間解 析度(視頻空間尺寸)、時間解析度(幀率)等碼率調(diào)節(jié)手段結(jié)合起來協(xié)同完成視頻碼流的 自適應(yīng)調(diào)節(jié);由于多維碼率控制各維數(shù)大小確定是依賴于一段時間碼率多少,在實際應(yīng)用 中并不需要事先分成若干等級,可以有效的解決SVC計算復(fù)雜度和冗余高的問題。
[0004] 但目前來說,多維碼率控制技術(shù)還處于起步階段,還有更多具拓展性的研究有待 進行,其關(guān)鍵技術(shù)的研究對于視頻產(chǎn)業(yè)的發(fā)展具有重要的現(xiàn)實意義;目前多維碼率控制方 法存在如下問題:(1)目前主流方法,比如Q-R-TQ等在計算視頻內(nèi)容信息時是基于整個視 頻信息或按固定周期,而在實際應(yīng)用中視頻的內(nèi)容是時變的,對于隨時間變化劇烈的序列 得到的模型系數(shù)其準確性不高,不利于實時傳輸;(2)初始幀率的選取在多維碼率控制中 起著重要的作用;如果選取的初始幀率過大,僅編碼初始幀后實際耗用的比特數(shù)就會超出 預(yù)分配的目標比特數(shù),從而留給后續(xù)編碼幀的比特數(shù)就會很少,使得重建視頻圖像質(zhì)量下 降;反之,選取過小的初始參數(shù),不僅使圖像質(zhì)量下降,而且會造成帶寬資源的浪費;在不 影響視覺的情況下延遲少量幾幀來接近實時通信,然而目前幾乎沒有相關(guān)方法從實時傳輸 的角度去關(guān)注初始幀率的選擇。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于提供基于視頻內(nèi)容特征的參數(shù)自適應(yīng)多維碼率控制方法,以解 決上述問題。
[0006]模型參數(shù)的更新周期根據(jù)視頻時空復(fù)雜度而做出相應(yīng)的調(diào)整,在提取時空復(fù)雜度 時在以滑動窗口為基本單元;該發(fā)明本發(fā)明所提出的視頻內(nèi)容特征的參數(shù)自適應(yīng)多維碼率 控制方法具有較高的準確性,如圖3、4、5、6所示,優(yōu)于國際上同類相關(guān)方法,可有效提高主 觀質(zhì)量和客觀質(zhì)量,尤其對于時空復(fù)雜度較高視頻序列;此外,相比于國際上同類相關(guān)方 法,本發(fā)明也能稍微減少計算復(fù)雜度。
[0007] 該方法主要包括兩個部分的工作:第一,為保證初始參數(shù)對于不同的視頻序列都 能表現(xiàn)出良好的性能;根據(jù)初始帶寬和初始視頻內(nèi)容特征,動態(tài)計算最優(yōu)的初始編碼幀率, 計算得到的初始幀率值更加符合序列的真實特性;第二,針對不同的視頻序列具有不同的 時間和空間相關(guān)性,相同的視頻序列不同段有著不同的時空復(fù)雜度,基于視頻內(nèi)容動態(tài)更 新多維碼率控制模型參數(shù)更新周期,采用時空自適應(yīng)的復(fù)雜度預(yù)測模型去獲取模型參數(shù)更 新周期;在這個過程中,以滑動窗口為基本單位,提取視頻內(nèi)容特征,預(yù)測下一更新周期復(fù) 雜度,結(jié)合當(dāng)前更新周期碼率控制的準確性,獲取下一更新周期長度,進而確定下一更新周 期的模型參數(shù)和量化參數(shù)和編碼幀率。
[0008] 本發(fā)明實施例提供了 一種基于視頻內(nèi)容特征的參數(shù)自適應(yīng)多維碼率控制方法,包 括如下步驟:
[0009] 步驟(1)、輸入視頻序列,獲取初始帶寬,判斷是否是初始幀;
[0010] 步驟(2)、如果是初始幀,根據(jù)初始帶寬和初始兩幀的視頻內(nèi)容特征計算初始編碼 幀率,進而根據(jù)初始幀率獲取初始編碼量化參數(shù);
[0011] 步驟(3)、如果是非初始幀,對當(dāng)前更新周期內(nèi)的視頻幀編碼,同時以更新周期作 為單元,并提取相關(guān)視頻內(nèi)容信息,計算多維碼率控制模型參數(shù);以滑動窗口作單元,在時 間域和空間域提取視頻的內(nèi)容信息,并結(jié)合當(dāng)前更新周期碼率控制的準確性,計算下一更 新周期的長度;
[0012] 步驟(4)、在獲取到多維碼率控制模型參數(shù)后,根據(jù)模型參數(shù)求取最優(yōu)參數(shù),本發(fā) 明選用相關(guān)模型去計算下一更新周期的幀率f?和初始量化參數(shù)q。
[0013] 在一些實施例中,優(yōu)選為,所述步驟(2)中,具體包括如下步驟:
[0014] 步驟(21)、根據(jù)給定碼率和視頻分辨率計算初步的初始幀率;
[0015] 步驟(22)、根據(jù)前兩幀的視頻內(nèi)容信息對獲取到的初步的初始幀率進行調(diào)整,獲 取最優(yōu)的初始幀率;
[0016] 步驟(23)、根據(jù)最優(yōu)的初始幀率,獲取初始的量化參數(shù)。
[0017] 在一些實施例中,優(yōu)選為,所述步驟(22)中,具體包括如下步驟:
[0018] 步驟(221)、提取第一幀熵作為初始空域復(fù)雜度;
[0019] 步驟(222)、提取第一幀和第二幀幀差作為初始時域復(fù)雜度,同時將初始時域復(fù)雜 度和初始空域復(fù)雜度歸一化處理;
[0020] 步驟(223)、根據(jù)第一幀熵和第一幀和第二幀幀差對獲取到的初步的初始幀率進 行調(diào)整。
[0021] 在一些實施例中,優(yōu)選為,所述步驟(3)中,具體包括如下步驟:
[0022] 步驟(31)、以更新周期為基本單元,提取相鄰幀的幀差FD,運動矢量幅度的MVM平 均值運動矢量幅度與運動矢量角度u的比值n(UMvM,UmA),通過預(yù)測模型P= HF求取模型參數(shù),其中P= [a,b,c,d,Rmax]為各模型參數(shù),F(xiàn)為提取出來視頻內(nèi)容,H為預(yù) 測矩陣,固定值;
[0023] 步驟(32)、以滑動窗口為基本單元,獲取時空自適應(yīng)的復(fù)雜度預(yù)測模型,滑動窗口 由當(dāng)前更新周期最后連續(xù)幾幀組成,每個更新周期結(jié)束后滑動窗口往后移,所述的滑動窗 口內(nèi)視頻序列按照時間域和空間域分為為兩種不同尺度的集合空間;
[0024] 步驟(33)、在獲取到時空自適應(yīng)的復(fù)雜度預(yù)測模型后,求取下一更新周期的長度, 同時下一更新周期的長度根據(jù)當(dāng)前更新周期內(nèi)碼率控制準確性自適應(yīng)地調(diào)整,以增加預(yù)測 模型的適應(yīng)性。
[0025] 在一些實施例中,優(yōu)選為,所述步驟(32)中,具體包括如下步驟:
[0026] 步驟(321)、按照空間域,則對輸入滑動窗口內(nèi)的圖像序列求取每一幀的熵,包括 下一更新周期的第一幀,獲取到加權(quán)熵模型;
[0027]步驟(322)、按照時間域,則對輸入滑動窗口內(nèi)的圖像序列中的圖像相鄰幀求取幀 差,獲取到加權(quán)幀差,用加權(quán)幀差作為時域復(fù)雜度的描述,用加權(quán)熵模型預(yù)測的空域復(fù)雜度 的描述,由加權(quán)幀差和加權(quán)熵模型得到時空自適應(yīng)的復(fù)雜度預(yù)測模型。
[0028] 在一些實施例中,優(yōu)選為,所述步驟⑷中,根據(jù)步驟(3)所得的模型參數(shù),用 Q-R-TQ模型去獲取下一更新周期的幀率f?和初始量化參數(shù)q。
[0029] 本發(fā)明實施例提供的基于視頻內(nèi)容特征的參數(shù)自適應(yīng)多維碼率控制方法,與現(xiàn)有 技術(shù)相比,一方面,現(xiàn)有技術(shù)中初始編碼幀率的獲取均采用經(jīng)驗值,本發(fā)明根據(jù)給定的給定 初始碼率、視頻分辨率和初始兩幀的時空復(fù)雜度獲取初始幀率,進而獲取初始的量化參數(shù), 確保為保證初始參數(shù)對于不同的視頻序列都能表現(xiàn)出良好的性能。另一方面,現(xiàn)有技術(shù)的 模型參數(shù)更新周期采取固定值或在編碼過程中保持不變,本發(fā)明根據(jù)視頻內(nèi)容在編碼過程 中動態(tài)更新模型參數(shù)的更新周期,從當(dāng)前更新周期出發(fā),以滑動窗口為單元提取視頻內(nèi)容 特征,根據(jù)時空復(fù)雜度模型預(yù)測出下一時