專利名稱:基于dsp平臺利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻處理技術(shù)領(lǐng)域,特別涉及DSP平臺視頻編碼技術(shù)領(lǐng)域,具體是指一種基于DSP平臺利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法。
背景技術(shù):
H. 264圖像編碼標準是ITU — T的視頻編碼專家組(VCEG)和ISO的活動圖像專家組(MPEG)共同制定的新一代國際編碼標準。它具有眾多優(yōu)點,如統(tǒng)一的VLC符號編碼,高精度、多模式的位移估計,基于4X4塊的整數(shù)變換,以及分層的編碼語法等等。這些使H. 264具有很高的編碼效率,可適應高圖像質(zhì)量和低速率應用的要求。H. 264在編碼效率方面的成功是以增加復雜度為代價的,復雜的運算成為了制約其發(fā)展的因素。如何簡化H. 264的計算是當今視頻編碼的熱點問題。
現(xiàn)有技術(shù)中,提出了不少對H. 264的運動估計算法進行優(yōu)化,改進算法中的不足,以達到減少運算目的的方法。在視頻壓縮編碼領(lǐng)域,為了減少計算復雜度并保證圖像質(zhì)量,通常采用簡化全搜索算法運動估計的方法,因為其占用整個編碼器大約80%的計算量。為了減少搜索次數(shù),本領(lǐng)域技術(shù)人員提出了多種快速搜索方法,主要有對數(shù)搜索法(LOGS)、三步搜索法(TSS)、新三步搜索法(NTss)、新六邊形搜索法(HEXBS)、預測搜索法等。除了矩形窗搜索模式外,還出現(xiàn)了菱形模式、六邊形模式、十字形模式以及這些模式相結(jié)合的混合模式等。而4T搜索算法是一種新的搜索算法,它能很好地捕捉劇烈的運動或變換的邊緣部分,但是,對于平緩區(qū),卻不可避免的帶來了圖像信噪比的下降。在各種算法中,菱形搜索算法(DS)的綜合性比較優(yōu)越。它采用兩種搜索模板9搜索點的大模板(LDSP)和5搜索點的小模板(SDSP)。搜索時先設(shè)定固定的閾值,再用LDSP計算。當最小宏塊誤差點出現(xiàn)在中心點處時,將LDSP換為SDSP進行計算。這時5點中的最小宏塊誤差點若在中心處,此點即為最優(yōu)匹配點。否則,將最小宏塊誤差點作為新的中心點用LDSP重復搜索。實際應用中絕大部分視頻圖像存在中心偏移性,即運動矢量高度集中在零矢量及其附近。對運動矢量為零的宏塊稱為靜止塊,其它的塊稱為運動塊。在視頻圖像中有超過80%的塊可看作靜止塊,這種情況下如果同等對待搜索區(qū)域的各部分,勢必造成較大的搜索冗余,影響搜索速度。針對這些不足,可對塊的類型加以分類,分離出靜止塊和小運動塊,采用小模板(SDSP)進行搜索;而剩余的少許大運動。改進后的DS算法流程圖塊則采用4T搜索方式。分類后,先對原搜索方法閾值相對固定的情況進行改進,通過設(shè)置不同的閾值來處理不同的情況,并結(jié)合起點預測和組合模板搜索策略,實現(xiàn)一種快速運動估計算法。但該方法利用預設(shè)的固定閾值,無法根據(jù)視頻圖像情況進行閾值調(diào)整,仍然存在搜索量大,搜索速度慢的問題。
發(fā)明內(nèi)容
本發(fā)明的目的是克服了上述現(xiàn)有技術(shù)中的缺點,提供一種利用圖像分析預測和閾值控制的運動估計算法,在不降低圖像質(zhì)量且不增加碼率的基礎(chǔ)上,提高搜索速度,適應視頻圖像在網(wǎng)絡(luò)傳輸中的應用,且實現(xiàn)方法簡便,應用成本低廉,應用范圍廣泛的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法。為了實現(xiàn)上述的目的,本發(fā)明的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法中DSP系統(tǒng)平臺包括編碼系統(tǒng)和存儲系統(tǒng),所述的方法包括以下步驟(I)所述的編碼系統(tǒng)從所述的存儲系統(tǒng)讀取當前幀和多個參考幀;(2)所述的編碼系統(tǒng)對所述的當前幀和參考幀進行幀宏塊匹配,當匹配的幀宏塊達到閾值時,停止匹配,確定最大匹配幀;(3)所述的編碼系統(tǒng)獲取當前幀與所述的最大匹配幀之間的殘差;(4)所述的編碼系統(tǒng)對所述的殘差進行編碼;(5)所述的編碼系統(tǒng)輸出經(jīng)編碼的殘差、最大匹配幀和解碼信息; (6)所述的編碼系統(tǒng)利用所述的經(jīng)編碼的殘差、最大匹配幀和解碼信息重構(gòu)當前幀;(7)所述的編碼系統(tǒng)將重構(gòu)的當前幀存入所述的存儲系統(tǒng)作為下一幀編碼的參考幀之一,并返回步驟(I)。該基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法中,所述的閾值為預設(shè)的最大匹配幀宏塊數(shù)或自適應的最大匹配幀宏塊數(shù)。所述的自適應的最大匹配幀宏塊數(shù)為所述的編碼系統(tǒng)對幀宏塊匹配進行分析,并利用周邊相鄰塊對當前塊的運動矢量進行預測獲得的自適應數(shù)值。該基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法中,所述的編碼系統(tǒng)對所述的當前幀和參考幀進行幀宏塊匹配,具體為所述的編碼系統(tǒng)采用平均絕對差誤差匹配準則、均方誤差誤差匹配準則、歸一化互相關(guān)函數(shù)誤差匹配準則和絕對誤差和函數(shù)誤差匹配準則中的一種對所述的當前幀和參考幀進行幀宏塊匹配。該基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法中,所述的存儲系統(tǒng)包括編碼系統(tǒng)內(nèi)部存儲模塊和編碼系統(tǒng)外部存儲模塊,所述的編碼系統(tǒng)內(nèi)部存儲模塊連接所述的編碼系統(tǒng)外部存儲模塊,所述的當前幀和各個參考幀均存儲于所述的編碼系統(tǒng)外部存儲模塊。該基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法中,所述的編碼系統(tǒng)內(nèi)部存儲模塊包括相互連接的內(nèi)存單元和緩存單元,所述的內(nèi)存單元還連接所述的編碼系統(tǒng)外部存儲模塊。該基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法中,所述的內(nèi)存單元包括第一編碼宏塊緩沖區(qū)、第二編碼宏塊緩沖區(qū)、第一參考窗緩沖區(qū)和第二參考緩沖區(qū),所述的步驟(I)具體包括以下步驟(11)所述的編碼系統(tǒng)從所述的編碼系統(tǒng)外部存儲模塊將當前幀中的一個宏塊與對應的參考窗數(shù)據(jù)分別讀取至所述的第一編碼宏塊緩沖區(qū)和第一參考窗緩沖區(qū),所述的參考窗數(shù)據(jù)為參考幀中檢索區(qū)域內(nèi)的數(shù)據(jù);(12)所述的編碼系統(tǒng)對步驟(11)中讀取的宏塊進行編碼,并將當前幀中的下一個宏塊與對應的參考窗數(shù)據(jù)分別讀取至所述的第二編碼宏塊緩沖區(qū)和第二參考窗緩沖區(qū);(13)所述的編碼系統(tǒng)對步驟(12)中讀取的宏塊進行編碼;(14)所述的編碼系統(tǒng)循環(huán)執(zhí)行所述的步驟(11)至步驟(13)直至當前幀編碼結(jié)束。
該基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法中,所述的編碼系統(tǒng)包括快速型直接內(nèi)存讀取控制器,所述的編碼系統(tǒng)通過所述的快速型直接內(nèi)存讀取控制器將所述的當前幀中的宏塊和參考窗數(shù)據(jù)讀取至所述的內(nèi)存單元。該基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法中,所述的編碼系統(tǒng)包括增強型直接內(nèi)存讀取控制器,所述的編碼系統(tǒng)的緩存單元通過所述的增強型直接內(nèi)存讀取控制器連接所述的內(nèi)存單元。采用了該發(fā)明的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法,編碼系統(tǒng)對當前幀和參考幀進行幀宏塊匹配,當匹配的幀宏塊達到閾值時,停止匹配,以確定最大匹配幀,且所述閾值可以為自適應的最大匹配幀宏塊數(shù),從而實現(xiàn)一種利用圖像分析預測和閾值控制的運動估計算法,在不降低圖像質(zhì)量且不增加碼率的基礎(chǔ)上,提高搜索速度。同時,配合優(yōu)化的存儲系統(tǒng),提高了當前幀和參考幀的讀取速度,從而有效地降低了整個視頻編碼過程所需的時間,能夠極好地適應視頻圖像在網(wǎng)絡(luò)傳輸中的應用,且本發(fā)明的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法的實現(xiàn)過程簡便,應用成 本低廉,應用范圍也較為廣泛。
圖I為本發(fā)明基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法的步驟流程圖。圖2為本發(fā)明的本發(fā)明的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法所采用的運動估計和運動補償?shù)脑韴D。圖3為本發(fā)明的本發(fā)明的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法所采用的塊匹配算法的原理圖。圖4為本發(fā)明的本發(fā)明的本發(fā)明的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法中所采用的DM642嵌入式系統(tǒng)的存儲器系統(tǒng)的結(jié)構(gòu)示意圖。
具體實施例方式為了能夠更清楚地理解本發(fā)明的技術(shù)頁面,特舉以下實施例詳細說明。請參閱圖I所示,為本發(fā)明基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法的步驟流程圖。在一種實施方式中,所述的DSP系統(tǒng)平臺包括編碼系統(tǒng)和存儲系統(tǒng),所述的方法該基于DSP系統(tǒng)平臺利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法包括以下步驟(I)所述的編碼系統(tǒng)從所述的存儲系統(tǒng)讀取當前幀和多個參考幀;(2)所述的編碼系統(tǒng)對所述的當前幀和參考幀進行幀宏塊匹配,當匹配的幀宏塊達到閾值時,停止匹配,確定最大匹配幀,所述的閾值可以為預設(shè)的最大匹配幀宏塊數(shù),也可以為自適應的最大匹配幀宏塊數(shù)以進一步縮短匹配的時間,該自適應的最大匹配幀宏塊數(shù)為所述的編碼系統(tǒng)對幀宏塊匹配進行分析,并利用周邊相鄰塊對當前塊的運動矢量進行預測獲得的自適應數(shù)值;(3)所述的編碼系統(tǒng)獲取當前幀與所述的最大匹配幀之間的殘差;(4)所述的編碼系統(tǒng)對所述的殘差進行編碼;
(5)所述的編碼系統(tǒng)輸出經(jīng)編碼的殘差、最大匹配幀和解碼信息;(6)所述的編碼系統(tǒng)利用所述的經(jīng)編碼的殘差、最大匹配幀和解碼信息重構(gòu)當前幀;(7)所述的編碼系統(tǒng)將重構(gòu)的當前幀存入所述的存儲系統(tǒng)作為下一幀編碼的參考幀之一,并返回步驟(I)。在一種較優(yōu)選的實施方式中,步驟(2)中所述的編碼系統(tǒng)對所述的當前幀和參考幀進行幀宏塊匹配,具體為所述的編碼系統(tǒng)采用平均絕對差誤差匹配準則、均方誤差誤差匹配準則、歸一化互相關(guān)函數(shù)誤差匹配準則和絕對誤差和函數(shù)誤差匹配準則中的一種對所述的當前幀和參考幀進行幀宏塊匹配。在一種進一步優(yōu)選的實施方式中,所述的存儲系統(tǒng)包括編碼系統(tǒng)內(nèi)部存儲模塊和編碼系統(tǒng)外部存儲模塊,所述的編碼系統(tǒng)內(nèi)部存儲模塊連接所述的編碼系統(tǒng)外部存儲模塊,所述的當前幀和各個參考幀均存儲于所述的編碼系統(tǒng)外部存儲模塊。所述的編碼系統(tǒng)內(nèi)部存儲模塊進一步地包括相互連接的內(nèi)存單元和緩存單元,所述的內(nèi)存單元還連接所述的編碼系統(tǒng)外部存儲模塊。該編碼系統(tǒng)還包括快速型直接內(nèi)存讀取(QDMA)控制器和增強型直接內(nèi)存讀取(EDMA)控制器。所述的編碼系統(tǒng)通過所述的快速型直接內(nèi)存讀取控制器將所述的當前幀中的宏塊和參考窗數(shù)據(jù)讀取至所述的內(nèi)存單元。所述的編碼系統(tǒng)的緩存單元通過所述的增強型直接內(nèi)存讀取控制器連接所述的內(nèi)存單元。在一種更優(yōu)選的實施方式中,所述的內(nèi)存單元包括第一編碼宏塊緩沖區(qū)、第二編碼宏塊緩沖區(qū)、第一參考窗緩沖區(qū)和第二參考緩沖區(qū),所述的步驟(I)具體包括以下步驟(11)所述的編碼系統(tǒng)從所述的編碼系統(tǒng)外部存儲模塊將當前幀中的一個宏塊與對應的參考窗數(shù)據(jù)分別讀取至所述的第一編碼宏塊緩沖區(qū)和第一參考窗緩沖區(qū),所述的參考窗數(shù)據(jù)為參考幀中檢索區(qū)域內(nèi)的數(shù)據(jù);(12)所述的編碼系統(tǒng)對步驟(11)中讀取的宏塊進行編碼,并將當前幀中的下一個宏塊與對應的參考窗數(shù)據(jù)分別讀取至所述的第二編碼宏塊緩沖區(qū)和第二參考窗緩沖區(qū);(13)所述的編碼系統(tǒng)對步驟(12)中讀取的宏塊進行編碼;(14)所述的編碼系統(tǒng)循環(huán)執(zhí)行所述的步驟(11)至步驟(13)直至當前幀編碼結(jié)束。在實際應用中,本發(fā)明的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法針對H. 264標準的多模式運動估計和運動補償算法編碼模式復雜、計算量大的不足,通過對H. 264參考模型JM中運動估計算法的分析,對算法進行了優(yōu)化,利用DM642嵌入式系統(tǒng)的硬件特點,在存儲器系統(tǒng)上實現(xiàn)其優(yōu)化。該方法主要包括以下幾個方面(a)根據(jù)運動估計算法,提出了基于圖像分析預測和閾值控制的運動估計算法。其主要流程是通過對圖像的塊匹配分析,利用周邊相鄰塊對當前塊的運動矢量進行預測,并設(shè)定自適應閾值。當匹配達到或超過閾值時,停止搜索。這樣會大大節(jié)約搜索時間,減少搜索計算量。與以往的搜索方法相比較,該方法在搜索窗32時,平均每塊搜索點數(shù)為3 4,比全搜索算法的速度提高了 1000多倍。與新j步法和菱形搜索法等一些經(jīng)典的搜索方法相比較,其優(yōu)勢也是很明顯的。通過對3組視頻序列的分析處理,新算法在保持視頻質(zhì)量的 前提下,明顯地提高了編碼速度,PSNR (峰值信噪比)損失小于0. 05dB,碼率增大I. 4% .這對于運動估計算法基本可以忽略不計。
(b)存儲器級優(yōu)化的實現(xiàn),通過直接調(diào)用DAT相關(guān)函數(shù)DAT_open、DAT_eopyd等和使用較底層的EDMA相關(guān)函數(shù),直接對EDMA的相關(guān)模塊進行配置和操作,可優(yōu)化存儲器,提高編碼速度。對于a 264編碼器,待處理數(shù)據(jù)包括當前圖像和若干參考圖像,把這些數(shù)據(jù)都放人片內(nèi)RAM處理很難達到處理的實時性。(c)算法中將這些數(shù)據(jù)都放在片外,編碼時把部分數(shù)據(jù)用EDMA搬到片內(nèi),在片內(nèi)RAM開設(shè)4個緩沖區(qū)src_bufA (第一編碼宏塊緩沖區(qū)),src_bufB (第二編碼宏塊緩沖區(qū)),ref_bufA (第一參考窗緩沖區(qū)),和ref_bufB (第二參考緩沖區(qū)),用于存放編碼宏塊和參考窗數(shù)據(jù)(參考幀中搜索區(qū)域內(nèi)的數(shù)據(jù))。在編碼第I個宏塊之前把編碼宏塊和參考窗數(shù)據(jù)分別用QDMA從片外RAM搬到緩沖區(qū)src_bufA和ref_bufA中。編碼src_bufA中的數(shù)據(jù)時,啟動QDMA,把下一宏塊數(shù)據(jù)和參考窗數(shù)據(jù)從片外RAM分別搬到緩沖區(qū)src_bufB和ref_bufB中。編碼src_bufB中的數(shù)據(jù)時,啟動QDMA,把下一宏塊數(shù)據(jù)和參考窗數(shù)據(jù)從片外RAM分別搬到緩沖區(qū)src_bufA和ref_bufA中.如此循環(huán)直到一巾貞圖像編碼結(jié)束。采用本發(fā)明的優(yōu)化的視頻編碼方法,與參考模型JM的運行估計算法相比,有效地降低了整個編碼器的運行時間,在恢復質(zhì)量(用峰值信噪比表征)平均下降0. 05dB、碼速率增加不超過1.4%的前提下,編碼速率提高35 % 45 %,表明了該算法在編碼速度方面有明顯的提聞。具體而言,如圖2中的運動估計模塊是根據(jù)一定的匹配原則,從一個或多個參考幀中,尋找與當前幀最大匹配的幀。運動補償則是通過當前幀與參考幀作差而得到的殘差,對殘差經(jīng)過編碼和變換并攜帶一些解碼器所需要的信息輸出到解碼器。殘差經(jīng)過解碼,與參考幀相加后又重構(gòu)原圖像。重構(gòu)的幀被存儲下來作為后面預測所需要的參考幀。目前,幾乎所有的運動補償算法都是利用塊匹配算法,使當前塊與匹配塊的SAD最小。在運動估計過程中,根據(jù)一定的匹配準則來得到當前編碼塊的最佳匹配塊。常用的誤差匹配準則函數(shù)有平均絕對差(MAD)、均方誤差(MSE)、歸一化互相關(guān)函數(shù)(NCCF)和絕對誤差和函數(shù)(SAD)。塊匹配準則就是把圖像劃分為許多子塊,認為子塊內(nèi)所有像素的位移量是相同的.對于某一時間t,圖像幀k中的某一子塊如果在另一時間t 一 A的幀k-1中可以找到若干與其相似的子塊,則稱其中最為相似的子塊為塊匹配,并認為該塊匹配是幀中相對應子塊位移的結(jié)果,位移矢量中兩幀中相應子塊的坐標決定,其算法原理如圖3所示。為提高編碼的準確度和減少計算量,H. 264標準采用塊匹配大小可變的運動補償方法來達到這個目的。該方法在移動一致的區(qū)域使用大尺度的匹配塊,在運動邊緣區(qū)域使用小尺度的匹配塊,其特有的靈活性使得編碼效率明顯改善。如圖4所示,DM642嵌入式系統(tǒng)具有三層次的存儲器系統(tǒng)。DM642EVM的存儲系統(tǒng)由片內(nèi)存儲(編碼系統(tǒng)內(nèi)存儲模塊)和片外存儲(編碼系統(tǒng)外存儲模塊)兩部分組成。其中,片內(nèi)內(nèi)存采用二級緩存結(jié)構(gòu)第I級包括相互獨立的LlP(16kbit)和LlD(16kbit),只能作為高速緩存使用;第2級L2(256kbit)是一個統(tǒng)一的程序/數(shù)據(jù)空間,可以整體作為SRAM映射到存儲空間,也可以將Cache和SRAM混合使用。第3級是片外外存,一般由SDRAM構(gòu)成.L1、L2和片外SDRAM構(gòu)成了整個存儲系統(tǒng)的層次結(jié)構(gòu)。DM642還提供了 64個獨立通道的EDMA(enhanced direct memory access,增強型直接內(nèi)存讀取)控制器負責片內(nèi)L2存儲器與片外外存及其他外設(shè)之間的數(shù)據(jù)傳輸。
根據(jù)運動估計算法,本發(fā)明提出了基于圖像分析預測和閾值控制的運動估計算法。其主要流程是通過對圖像的塊匹配分析,利用周邊相鄰塊對當前塊的運動矢量進行預測,并設(shè)定自適應閾值。當匹配達到或超過閾值時,停止搜索。這樣會大大節(jié)約搜索時間,減少搜索計算量。與以往的搜索方法相比較,該方法在搜索窗32時,平均每塊搜索點數(shù)為3 4,比全搜索算法的速度提高了 1000多倍。與新j步法和菱形搜索法等一些經(jīng)典的搜索方法相比較,其優(yōu)勢也是很明顯的。通過對3組視頻序列的分析處理,新算法在保持視頻質(zhì)量的前提下,明顯地提高了編碼速度,PSNR損失小于0. 05dB,碼率增大I. 4% .這對于運動估計算法基本可以忽略不計。在存儲器級優(yōu)化中,通過直接調(diào)用DAT相關(guān)函數(shù)DAT_open、DAT_copyd等和使用較底層的EDMA相關(guān)函數(shù),直接對EDMA的相關(guān)模塊進行配置和操作,可優(yōu)化存儲器,提高編碼速度.對于札264編碼器,待處理數(shù)據(jù)包括當前圖像和若干參考圖像.把這些數(shù)據(jù)都放人片內(nèi)RAM處理很難達到處理的實時性,本文算法中將這些數(shù)據(jù)都放在片外,編碼時把部分數(shù)據(jù)用EDMA搬到片內(nèi),具體方法如下 (I)在片內(nèi) RAM 開設(shè) 4 個緩沖區(qū)src_bufA、src_bufB、ref_bufA、ref_bufB,用于存放編碼宏塊和參考窗數(shù)據(jù)(參考幀中搜索區(qū)域內(nèi)的數(shù)據(jù))。(2)在編碼第I個宏塊之前把編碼宏塊和參考窗數(shù)據(jù)分別用QDMA從片外RAM搬到緩沖區(qū) src_bufA 和 ref_bufA 中。(3)編碼src_bufA中的數(shù)據(jù)時,啟動QDMA,把下一宏塊數(shù)據(jù)和參考窗數(shù)據(jù)從片外RAM分別搬到緩沖區(qū)src_bufB和ref_bufB中。(4)編碼src_bufB中的數(shù)據(jù)時,啟動QDMA,把下一宏塊數(shù)據(jù)和參考窗數(shù)據(jù)從片外RAM分別搬到緩沖區(qū)src_bufA和ref_bufA中。(5)如此循環(huán)直到一幀圖像編碼結(jié)束。采用了該發(fā)明的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法,編碼系統(tǒng)對當前幀和參考幀進行幀宏塊匹配,當匹配的幀宏塊達到閾值時,停止匹配,以確定最大匹配幀,且所述閾值可以為自適應的最大匹配幀宏塊數(shù),從而實現(xiàn)一種利用圖像分析預測和閾值控制的運動估計算法,在不降低圖像質(zhì)量且不增加碼率的基礎(chǔ)上,提高搜索速度。同時,配合優(yōu)化的存儲系統(tǒng),提高了當前幀和參考幀的讀取速度,從而有效地降低了整個視頻編碼過程所需的時間,能夠極好地適應視頻圖像在網(wǎng)絡(luò)傳輸中的應用,且本發(fā)明的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法的實現(xiàn)過程簡便,應用成本低廉,應用范圍也較為廣泛。在此說明書中,本發(fā)明已參照其特定的實施例作了描述。但是,很顯然仍可以作出各種修改和變換而不背離本發(fā)明的精神和范圍。因此,說明書和附圖應被認為是說明性的而非限制性的。
權(quán)利要求
1.一種基于DSP系統(tǒng)平臺利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法,所述的DSP系統(tǒng)平臺包括編碼系統(tǒng)和存儲系統(tǒng),其特征在于,所述的方法包括以下步驟 (1)所述的編碼系統(tǒng)從所述的存儲系統(tǒng)讀取當前幀和多個參考幀; (2)所述的編碼系統(tǒng)對所述的當前幀和參考幀進行幀宏塊匹配,當匹配的幀宏塊達到閾值時,停止匹配,確定最大匹配幀; (3)所述的編碼系統(tǒng)獲取當前幀與所述的最大匹配幀之間的殘差; (4)所述的編碼系統(tǒng)對所述的殘差進行編碼; (5)所述的編碼系統(tǒng)輸出經(jīng)編碼的殘差、最大匹配幀和解碼信息; (6)所述的編碼系統(tǒng)利用所述的經(jīng)編碼的殘差、最大匹配幀和解碼信息重構(gòu)當前幀; (7)所述的編碼系統(tǒng)將重構(gòu)的當前幀存入所述的存儲系統(tǒng)作為下一幀編碼的參考幀之一,并返回步驟(I)。
2.根據(jù)權(quán)利要求I所述的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法,其特征在于,所述的閾值為預設(shè)的最大匹配幀宏塊數(shù)或自適應的最大匹配幀宏塊數(shù)。
3.根據(jù)權(quán)利要求2所述的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法,其特征在于,所述的自適應的最大匹配幀宏塊數(shù)為所述的編碼系統(tǒng)對幀宏塊匹配進行分析,并利用周邊相鄰塊對當前塊的運動矢量進行預測獲得的自適應數(shù)值。
4.根據(jù)權(quán)利要求I所述的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法,其特征在于,所述的編碼系統(tǒng)對所述的當前幀和參考幀進行幀宏塊匹配,具體為 所述的編碼系統(tǒng)采用平均絕對差誤差匹配準則、均方誤差誤差匹配準則、歸一化互相關(guān)函數(shù)誤差匹配準則和絕對誤差和函數(shù)誤差匹配準則中的一種對所述的當前幀和參考幀進行幀宏塊匹配。
5.根據(jù)權(quán)利要求I至4中任一項所述的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法,其特征在于,所述的存儲系統(tǒng)包括編碼系統(tǒng)內(nèi)部存儲模塊和編碼系統(tǒng)外部存儲模塊,所述的編碼系統(tǒng)內(nèi)部存儲模塊連接所述的編碼系統(tǒng)外部存儲模塊,所述的當前幀和各個參考幀均存儲于所述的編碼系統(tǒng)外部存儲模塊。
6.根據(jù)權(quán)利要求5所述的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法,其特征在于,所述的編碼系統(tǒng)內(nèi)部存儲模塊包括相互連接的內(nèi)存單元和緩存單元,所述的內(nèi)存單元還連接所述的編碼系統(tǒng)外部存儲模塊。
7.根據(jù)權(quán)利要求6所述的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法,其特征在于,所述的內(nèi)存單元包括第一編碼宏塊緩沖區(qū)、第二編碼宏塊緩沖區(qū)、第一參考窗緩沖區(qū)和第二參考緩沖區(qū),所述的步驟(I)具體包括以下步驟 (11)所述的編碼系統(tǒng)從所述的編碼系統(tǒng)外部存儲模塊將當前幀中的一個宏塊與對應的參考窗數(shù)據(jù)分別讀取至所述的第一編碼宏塊緩沖區(qū)和第一參考窗緩沖區(qū),所述的參考窗數(shù)據(jù)為參考幀中檢索區(qū)域內(nèi)的數(shù)據(jù); (12)所述的編碼系統(tǒng)對步驟(11)中讀取的宏塊進行編碼,并將當前幀中的下一個宏塊與對應的參考窗數(shù)據(jù)分別讀取至所述的第二編碼宏塊緩沖區(qū)和第二參考窗緩沖區(qū); (13)所述的編碼系統(tǒng)對步驟(12)中讀取的宏塊進行編碼; (14)所述的編碼系統(tǒng)循環(huán)執(zhí)行所述的步驟(11)至步驟(13)直至當前幀編碼結(jié)束。
8.根據(jù)權(quán)利要求7所述的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法,其特征在于,所述的編碼系統(tǒng)包括快速型直接內(nèi)存讀取控制器,所述的編碼系統(tǒng)通過所述的快速型直接內(nèi)存讀取控制器將所述的當前幀中的宏塊和參考窗數(shù)據(jù)讀取至所述的內(nèi)存單元。
9.根據(jù)權(quán)利要求6所述的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法,其特征在于,所述的編碼系統(tǒng)包括增強型直接內(nèi)存讀取控制器,所述的編碼系統(tǒng)的緩存單元通過所述的增強型直接內(nèi)存讀取控制器連接所述的內(nèi)存單元。
全文摘要
本發(fā)明涉及一種基于DSP平臺利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法,該方法中,編碼系統(tǒng)對當前幀和參考幀進行幀宏塊匹配,當匹配的幀宏塊達到閾值時,停止匹配,以確定最大匹配幀,且所述閾值可以為自適應的最大匹配幀宏塊數(shù),從而實現(xiàn)一種利用圖像分析預測和閾值控制的運動估計算法,在不降低圖像質(zhì)量且不增加碼率的基礎(chǔ)上,提高搜索速度。同時,配合優(yōu)化的存儲系統(tǒng),提高了當前幀和參考幀的讀取速度,從而有效地降低了整個視頻編碼過程所需的時間,能夠極好地適應視頻圖像在網(wǎng)絡(luò)傳輸中的應用,且本發(fā)明的基于DSP平臺系統(tǒng)利用運動估計算法實現(xiàn)優(yōu)化視頻編碼的方法的實現(xiàn)過程簡便,應用成本低廉,應用范圍也較為廣泛。
文檔編號H04N7/26GK102710940SQ201210181580
公開日2012年10月3日 申請日期2012年6月4日 優(yōu)先權(quán)日2012年6月4日
發(fā)明者李萬才, 梅林 , 湯志偉, 沈冬青 申請人:公安部第三研究所