一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法

文檔序號：7894938閱讀：138來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法
技術(shù)領(lǐng)域：
本發(fā)明涉及數(shù)字視頻編解碼技術(shù)領(lǐng)域，ー種基于宏塊分類的快速高效編轉(zhuǎn)碼方法。
背景技術(shù)：
視頻編轉(zhuǎn)碼技術(shù)是數(shù)字視頻處理的關(guān)鍵技術(shù)，針對未壓縮或已壓縮視頻文件，通過高性能、快速的編轉(zhuǎn)碼算法，可以將較大的視頻文件壓縮為占用空間更小的ニ進(jìn)制文件。視頻編轉(zhuǎn)碼技術(shù)在實(shí)際中都有著廣泛的應(yīng)用。例如視頻會議，視頻錄制，數(shù)字視頻在復(fù)雜帶寬下傳輸，各種終端設(shè)備上自適應(yīng)播放視頻以及不同視頻格式之間相互轉(zhuǎn)換等。眾多實(shí)際應(yīng)用更加凸顯了視頻編轉(zhuǎn)碼技術(shù)的重要性，同時視頻的應(yīng)用要求編轉(zhuǎn)碼技術(shù)的快速、實(shí)時、多路超實(shí)時編轉(zhuǎn)碼。因而，快速高效的視頻編轉(zhuǎn)碼技術(shù)成為越來越急需的實(shí)用技木。一般的視頻編轉(zhuǎn)碼算法通過快速模式?jīng)Q策、快速運(yùn)動搜索算法對未壓縮視頻文件進(jìn)行快速編碼，或者通過利用現(xiàn)有已壓縮的視頻文件中編碼信息，來大幅減少再次轉(zhuǎn)壓縮的復(fù)雜度。當(dāng)前主流的快速編轉(zhuǎn)碼技術(shù)包含幀間、幀內(nèi)的快速模式?jīng)Q策，運(yùn)動搜索簡化等。然而視頻背景內(nèi)容中包含有利于提高編轉(zhuǎn)碼效率的信息，一般的編轉(zhuǎn)碼算法沒有充分的利用視頻背景內(nèi)容信息。最近發(fā)展的視頻編轉(zhuǎn)碼技術(shù)證明，基于視頻內(nèi)容的背景建模編轉(zhuǎn)碼技術(shù)，相比不利用視頻背景信息的一般的編轉(zhuǎn)碼算法，可以實(shí)現(xiàn)較大的性能増益。針對視頻背景特性，基于解碼重建圖像進(jìn)行訓(xùn)練得到背景圖像用于預(yù)測編碼(黃鐵軍，張賢國，梁路宏，黃倩，高文.一種基于背景建模的靜態(tài)攝像機(jī)視頻壓縮方法與系統(tǒng).專利申請?zhí)?01010034117. 3)，該方法可以獲得較高的性能提升，相比一般的編轉(zhuǎn)碼方式可以節(jié)省一半以上的碼率。雖然基于視頻內(nèi)容的背景建模編轉(zhuǎn)碼技術(shù)可以獲得較高的性能提升，但是編轉(zhuǎn)碼的復(fù)雜度并沒有降低，而且視頻的背景信息也未被用于降低編轉(zhuǎn)碼復(fù)雜度。所以將視頻的背景內(nèi)容應(yīng)用于提升編轉(zhuǎn)碼速度成為研究的熱點(diǎn)。

發(fā)明內(nèi)容
本發(fā)明解決的技術(shù)問題在于如何縮減編碼或轉(zhuǎn)碼復(fù)雜度，并且保持顯著的壓縮效率。為了解決以上問題，本發(fā)明提出了ー種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，該方法利用視頻圖像塊不同的特征信息，將圖像內(nèi)所有圖像塊進(jìn)行分類，對不同類別的圖像塊使用不同的優(yōu)化加速策略。本發(fā)明提出的快速高效編轉(zhuǎn)碼方法，其主要步驟包括a)視頻信息獲取步驟如果輸入為原始數(shù)據(jù)，則直接進(jìn)行數(shù)字化采樣得到原始數(shù)據(jù)；如果輸入為已壓縮視頻，則應(yīng)首先對壓縮視頻解碼獲取視頻信息，包括每個圖像塊的解碼結(jié)果和編碼工具使用情況信息；b)背景圖像獲取步驟編碼時利用解碼圖像、輸入原始圖像或者重建圖像進(jìn)行訓(xùn)練，得到背景圖像，或由外部輸入已有的背景圖像；c)背景圖像選擇性的編入位流步驟根據(jù)背景圖像的獲取方法來選擇是否將背景圖像編入位流；d)編轉(zhuǎn)碼優(yōu)化步驟對圖像塊進(jìn)行分類，并將分類信息用于編碼或轉(zhuǎn)碼優(yōu)化中，解碼得到的工具使用情況信息會被重用于再編碼過程。進(jìn)ー步，作為ー種優(yōu)選方案，在視頻信息獲取步驟中，如果輸入為已壓縮視頻，提取的編碼工具使用情況信息包括參考幀索引號、尺寸模式，變換方法，預(yù)測方式，量化參數(shù)，環(huán)路濾波方式，熵編碼方法，位寬度信息，位寬度擴(kuò)展情況，深度信息和運(yùn)動向量信息。進(jìn)ー步，作為ー種優(yōu)選方案，背景圖像獲取步驟中所使用的背景圖像獲取方法包含a)如果輸入為未壓縮視頻，則利用輸入原始圖像進(jìn)行背景建模，或 b)如果輸入為已壓縮視頻，則利用解碼圖像進(jìn)行背景建模，或c)利用重建圖像進(jìn)行背景建模，或d)由外部直接輸入已有的背景圖像。進(jìn)ー步，作為ー種優(yōu)選方案，背景圖像選擇性的編入位流步驟中，使用了輸入原始圖像、解碼圖像訓(xùn)練或者外部輸入得到的背景圖像需要被編入位流，僅由重建圖像訓(xùn)練得到的背景圖像不會編入位流。進(jìn)ー步，作為ー種優(yōu)選方案，所述編轉(zhuǎn)碼優(yōu)化步驟包括以下步驟a)類別劃分步驟利用背景圖像，將當(dāng)前圖像內(nèi)的所有圖像塊進(jìn)行分類，劃分為不同特性的圖像塊類別，b)基于分類的編轉(zhuǎn)碼優(yōu)化步驟將分類信息應(yīng)用于編碼或轉(zhuǎn)碼優(yōu)化中，對不同類別的圖像塊或區(qū)域采用不同的編碼或轉(zhuǎn)碼優(yōu)化過程。進(jìn)一歩，作為ー種優(yōu)選方案，編轉(zhuǎn)碼優(yōu)化步驟中在對圖像塊進(jìn)行分類時，采用至少一種如下的分類策略a)按照圖像塊的前背景屬性進(jìn)行劃分，劃分成前景、背景或者前背景邊緣塊，或b)按照圖像塊的運(yùn)動屬性進(jìn)行劃分，劃分成大幅運(yùn)動圖像塊，靜止圖像塊或小幅運(yùn)動圖像塊，或c)按照圖像塊的內(nèi)容進(jìn)行劃分劃分為若干類別的感興趣塊和若干類別的非感興趣塊，相同類別的感興趣塊組成一種類別的感興趣區(qū)域，相同類別的非感興趣塊組成一種類別的非感興趣區(qū)域。進(jìn)ー步，作為ー種優(yōu)選方案，編轉(zhuǎn)碼優(yōu)化步驟所包含的類別劃分步驟中，在按照前背景屬性進(jìn)行劃分時，通過當(dāng)前圖像和背景圖像進(jìn)行殘差計(jì)算，通過殘差與閾值的判別將當(dāng)前圖像內(nèi)所有圖像塊分類為背景圖像塊、前景圖像塊和前景邊緣圖像塊。進(jìn)ー步，作為ー種優(yōu)選方案，編轉(zhuǎn)碼優(yōu)化步驟所包含的類別劃分步驟中，在按照運(yùn)動屬性進(jìn)行劃分時，使用當(dāng)前圖像在背景圖像或已編碼的圖像中進(jìn)行全局運(yùn)動搜索，通過對運(yùn)動信息的判別將當(dāng)前圖像內(nèi)所有圖像塊分類為大幅運(yùn)動圖像塊，靜止圖像塊或小幅運(yùn)動圖像塊。進(jìn)ー步，作為ー種優(yōu)選方案，編轉(zhuǎn)碼優(yōu)化步驟所包含的類別劃分步驟中的按照前背景屬性進(jìn)行劃分時，殘差判別的方法包含
a)使用整個圖像塊的殘差矩陣進(jìn)行判別，計(jì)算整個圖像塊的殘差矩陣與閾值進(jìn)行判斷當(dāng)前圖像塊的類別，或b)將整個圖像塊的殘差矩陣劃分為多個小子塊，先進(jìn)行小子塊與閾值的判斷，然后再利用判別為前景的小子塊個數(shù)，進(jìn)ー步將當(dāng)前圖像塊進(jìn)行分類，或

c)對殘差矩陣進(jìn)行變換計(jì)算，將殘差映射到變換域，由殘差變換矩陣與閾值的判別結(jié)果決定當(dāng)前圖像塊的類別。進(jìn)ー步，作為ー種優(yōu)選方案，編轉(zhuǎn)碼優(yōu)化步驟所包含的類別劃分步驟中的圖像區(qū)域的分類結(jié)果被編入碼流。分類結(jié)果包括如下至少ー種背景、前景屬性；感興趣區(qū)域、非感興趣區(qū)域?qū)傩?；運(yùn)動特性屬性。進(jìn)一歩，作為ー種優(yōu)選方案，編轉(zhuǎn)碼優(yōu)化步驟所包含的基于分類的編轉(zhuǎn)碼優(yōu)化步驟至少包含ー種以下方法a)參考幀的選??；b)運(yùn)動搜索范圍的自適應(yīng)縮減；c)候選模式的優(yōu)化；d)量化參數(shù)的調(diào)整；e)編碼方式的選擇。進(jìn)一歩，作為ー種優(yōu)選方案，編轉(zhuǎn)碼優(yōu)化步驟所包含的基于分類的編轉(zhuǎn)碼優(yōu)化步驟中的參考幀的選取至少包含ー種以下方法a)對于背景圖像塊或非感興趣區(qū)域，使用較少的參考幀，b)對于包含前景的圖像塊或感興趣區(qū)域，使用靈活的參考幀選取方式。此外在轉(zhuǎn)碼應(yīng)用中，解碼獲取的參考幀索引信息所對應(yīng)的參考幀也被選取。進(jìn)一歩，作為ー種優(yōu)選方案，編轉(zhuǎn)碼優(yōu)化步驟所包含的基于分類的編轉(zhuǎn)碼優(yōu)化步驟中的運(yùn)動搜索范圍的自適應(yīng)縮減方法至少包含ー種以下方法a)在編碼應(yīng)用中，背景圖像塊或非感興趣區(qū)域，運(yùn)動搜索限制在小范圍內(nèi)；包含前景的圖像塊或感興趣區(qū)域捜索范圍有條件選擇性的縮減或強(qiáng)制性的限制在某ー范圍內(nèi)；b)在轉(zhuǎn)碼應(yīng)用中，背景圖像塊或非感興趣區(qū)域的運(yùn)動搜索限制在小范圍內(nèi)；而包含前景的圖像塊或感興趣區(qū)域，運(yùn)動搜索時對于每個解碼圖像塊內(nèi)的每個子塊模式，計(jì)算其運(yùn)動向量和當(dāng)前編碼預(yù)測向量之間在橫軸和縱軸的最大差值，井根據(jù)得到的最大差值自適應(yīng)的縮減當(dāng)前模式的運(yùn)動搜索范圍。進(jìn)一歩，作為ー種優(yōu)選方案，編轉(zhuǎn)碼優(yōu)化步驟所包含的基于分類的編轉(zhuǎn)碼優(yōu)化步驟中的候選模式的優(yōu)化步驟至少包含ー種如下方法a)對背景圖像塊、靜態(tài)圖像塊或非感興趣區(qū)域，候選模式只包含整個圖像塊尺寸和較大尺寸的塊模式，其它小尺寸的塊模式不使用；b)對前景圖像塊、大幅運(yùn)動圖像塊或感興趣區(qū)域，在編碼應(yīng)用中，有條件選擇性的選擇或強(qiáng)制性的選擇候選模式；在轉(zhuǎn)碼應(yīng)用中候選模式只包含，模式尺寸大于或等于解碼時獲取的最小的塊模式，小于最小尺寸的塊模式將被排除在候選模式之外；c)對前景邊緣圖像塊、小幅運(yùn)動圖像塊或一般感興趣區(qū)域，在編碼應(yīng)用中，有條件選擇性的選擇或強(qiáng)制性的選擇候選模式；在轉(zhuǎn)碼應(yīng)用中候選模式包含，模式尺寸大于或等于解碼時獲取的最小的塊模式，并且要根據(jù)解碼的模式添加其它的候選模式。進(jìn)一歩，作為ー種優(yōu)選方案，編碼碼優(yōu)化步驟所包含的基于分類的編轉(zhuǎn)碼優(yōu)化步驟中的量化參數(shù)調(diào)整方法至少包含ー種如下方法a)對背景圖像塊、靜態(tài)圖像塊或非感興趣區(qū)域，使用較大量化參數(shù)，b)對前景圖像塊、大幅運(yùn)動圖像塊或感興趣區(qū)域，在編碼應(yīng)用中，有條件選擇性的選擇或強(qiáng)制性的選擇量化參數(shù)；在轉(zhuǎn)碼應(yīng)用中根據(jù)解碼的量化參數(shù)自適應(yīng)的調(diào)整量化參數(shù)，
c)對前景邊緣圖像塊、小幅運(yùn)動圖像塊或一般感興趣區(qū)域，在編碼應(yīng)用中，有條件選擇性的選擇或強(qiáng)制性的選擇量化參數(shù)；在轉(zhuǎn)碼應(yīng)用中根據(jù)解碼的量化參數(shù)自適應(yīng)的調(diào)整
量化參數(shù)。進(jìn)一歩，作為ー種優(yōu)選方案，編轉(zhuǎn)碼優(yōu)化步驟所包含的基于分類的編轉(zhuǎn)碼優(yōu)化步驟中的編碼方法的選擇過程中至少包含ー種如下方法a)對背景圖像塊、靜態(tài)圖像塊或非感興趣區(qū)域，選擇使用基于長期背景幀的背景預(yù)測編碼方法以及近期參考圖像進(jìn)行幀間預(yù)測編碼，b)對前景圖像塊、大幅運(yùn)動圖像塊或感興趣區(qū)域，使用近期參考圖像進(jìn)行幀間預(yù)測編碼，c)對前景邊緣圖像塊、小幅運(yùn)動圖像塊或一般感興趣區(qū)域，使用近期參考圖像進(jìn)行幀間預(yù)測編碼和基于背景幀的可選差分預(yù)測編碼方法。進(jìn)一歩，作為ー種優(yōu)選方案，對編碼或轉(zhuǎn)碼所生成位流在解碼端的解碼過程中包括以下步驟a)解碼輸入圖像解碼位流直接得到與背景無關(guān)的解碼圖像；b)選擇性的獲取分類信息如果解碼過程與快速轉(zhuǎn)碼信息相關(guān)，則需要獲取與編轉(zhuǎn)碼端相對應(yīng)的用于快速高效轉(zhuǎn)碼的信息；否則，不需要解碼這些信息；c)獲取背景圖像解碼端獲取背景圖像；d)生成所有解碼圖像根據(jù)已經(jīng)獲得的解碼圖像和背景圖像以及快速高效轉(zhuǎn)碼信息生成所有解碼圖像。進(jìn)ー步，作為ー種優(yōu)選方案，對編轉(zhuǎn)碼所生成位流在解碼端的解碼過程中，在解碼端背景圖像獲取的方式至少包含ー種以下方法a)從編轉(zhuǎn)碼后的位流中直接解碼背景圖像的位流獲得，或b)在解碼端解碼過程中，由所有解碼圖像或一部分解碼圖像進(jìn)行訓(xùn)練得到，或c)由已經(jīng)生成好的背景圖像作為外部數(shù)據(jù)直接輸入解碼器。進(jìn)ー步，作為ー種優(yōu)選方案，對編轉(zhuǎn)碼所生成位流在解碼端的解碼過程中，在解碼端解碼已編入碼流的用于快速高效轉(zhuǎn)碼的信息，包括圖像塊的前背景屬性信息、運(yùn)動屬性信息或者感興趣區(qū)域?qū)傩孕畔?。進(jìn)ー步，作為ー種優(yōu)選方案，對編轉(zhuǎn)碼所生成位流在解碼端的解碼過程中，在解碼端獲取的分類信息包含ー種以下方法a)按照圖像塊的前背景屬性劃分的前景、背景或者前背景邊緣塊分類信息，或b)按照圖像塊的運(yùn)動屬性劃分的大幅運(yùn)動圖像塊，靜止圖像塊或小幅運(yùn)動圖像塊分類信息，或
c)按照圖像塊的內(nèi)容劃分的若干類別的感興趣塊和若干類別的非感興趣塊分類信息。進(jìn)ー步，作為ー種優(yōu)選方案，對編轉(zhuǎn)碼所生成位流在解碼端的解碼過程中，在解碼端獲取分類信息的方式包括a)解碼位流中的標(biāo)志位得到分類信息；b)由重建圖像或者圖像塊的編碼信息在解碼端計(jì)算分類信息。相對現(xiàn)有技術(shù)而言，本發(fā)明具有以下有益效果第一，視頻序列中的背景內(nèi)容信息被應(yīng)用在編碼或轉(zhuǎn)碼加速過程中。第二，通過利用背景圖像或設(shè)置不同感興趣程度的圖像區(qū)域，將圖像區(qū)域進(jìn)行分類，對不同類別的圖像塊給予不同的編轉(zhuǎn)碼過程，可以最大程度的削減編轉(zhuǎn)碼復(fù)雜度。第三，背景預(yù)測技術(shù)帶來的編轉(zhuǎn)碼高性能得以保持。

當(dāng)結(jié)合附圖考慮時，通過參照下面的詳細(xì)描述，能夠更完整更好地理解本發(fā)明以及容易得知其中許多伴隨的優(yōu)點(diǎn)，但此處所說明的附圖用來提供對本發(fā)明的進(jìn)ー步理解，構(gòu)成本發(fā)明的一部分，本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明，并不構(gòu)成對本發(fā)明的不當(dāng)限定，其中圖I是本發(fā)明提出的編碼或轉(zhuǎn)碼應(yīng)用算法框架圖；圖2是本發(fā)明提出的編轉(zhuǎn)碼方法的實(shí)施步驟流程圖；圖3是本發(fā)明提出的編轉(zhuǎn)碼優(yōu)化步驟實(shí)施流程圖；圖4是本發(fā)明提出的分類編轉(zhuǎn)碼優(yōu)化實(shí)施步驟流程圖；圖5是本發(fā)明提出的參考幀精簡算法框架圖；圖6是本發(fā)明提出的自適應(yīng)縮減運(yùn)動搜索范圍算法框架圖；圖7是本發(fā)明提出的候選模式優(yōu)化算法框架圖；圖8是本發(fā)明提出的量化參數(shù)調(diào)整的算法框架圖。
具體實(shí)施例方式以下參照圖1-8對本發(fā)明的實(shí)施例進(jìn)行說明。為使上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂，下面結(jié)合附圖和具體實(shí)施方式
對本發(fā)明作進(jìn)ー步詳細(xì)的說明。本發(fā)明提出了ー種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，算法框架如圖I所示，它通過背景建模技術(shù)或者外部輸入獲取背景圖像，并利用背景圖像，將當(dāng)前圖像塊劃分為不同運(yùn)動特性的圖像塊類別；或者根據(jù)感興趣的不同程度，將當(dāng)前圖像劃分為不同類別的圖像區(qū)域。對不同類別的圖像或圖像區(qū)域使用不同的編轉(zhuǎn)碼優(yōu)化加速過程，以此實(shí)現(xiàn)在保持高性能的基礎(chǔ)上，最大程度削減復(fù)雜度。參照圖2，圖2是本發(fā)明提出的ー種基于宏塊分類的快速高效編轉(zhuǎn)碼方法實(shí)施步驟流程圖，如圖所示編轉(zhuǎn)碼步驟包括視頻信息獲取步驟SI :如果是未壓縮視頻，接受輸入原始圖像；如果是已壓縮視頻，則接受解碼提取得到的每個塊信息和編碼工具信息，傳輸給編轉(zhuǎn)碼優(yōu)化步驟S4。如果是已壓縮視頻，視頻信息獲取步驟SI對當(dāng)前解碼圖像中所有塊的解碼信息進(jìn)行提取，取得每個塊范圍內(nèi)用到的所有參考幀信息、每個子塊的運(yùn)動向量信息和解碼的最小尺寸的塊模式。背景圖像獲取步驟S2 :從輸入視頻源文件或者解碼過程得到當(dāng)前圖像的數(shù)據(jù)，并將訓(xùn)練生成的背景圖像傳輸給背景圖像選擇性的編入位流步驟S3和編轉(zhuǎn)碼優(yōu)化步驟S4。背景圖像獲取步驟S2，如果是未壓縮視頻，使用輸入圖像；如果是已壓縮視頻則使用解碼過程中解碼圖像；也可以使用重建圖像進(jìn)行背景建模，背景圖像可以周期性的更新，以此保持最新的背景信息。背景圖像獲取的方法可以包含但不限于(I)如果是未壓縮視頻利用輸入圖像進(jìn)行背景建模，可以使用一部分最近的輸入圖像進(jìn)行建模，也可以使用全部的輸、入圖像進(jìn)行建模，建模的算法可以是均值法、中值法和混合高斯模型。(2)如果是已壓縮視頻利用輸入位流的解碼圖像進(jìn)行背景建模，可以使用一部分最近的解碼圖像進(jìn)行建摸，也可以使用全部的解碼圖像進(jìn)行建模，建模的算法可以是均值法、中值法和混合高斯模型。
(3)利用重建圖像進(jìn)行背景建模，可以使用一部分重建圖像或者全部重建圖像進(jìn)行背景建模，建模的算法可以是均值法、中值法和混合高斯模型算法。(4)周期性的從外部輸入已有的背景圖像。背景圖像選擇性的編入位流步驟S3 :接受背景圖像獲取步驟S2傳輸?shù)谋尘皥D像。獲取的背景圖像會根據(jù)獲取的方式選擇性的編入位流由輸入圖像、解碼圖像訓(xùn)練或者外部輸入時可以將背景圖像編入位流，由重建圖像訓(xùn)練得到背景圖像時可以不編入位流。如圖3所示，編轉(zhuǎn)碼優(yōu)化步驟S4 :接受背景圖像獲取步驟S2傳輸?shù)谋尘皥D像，此外如果是已壓縮視頻還接受由視頻信息獲取步驟SI傳輸?shù)囊曨l信息。編轉(zhuǎn)碼優(yōu)化步驟S4主要通過兩個步驟來實(shí)現(xiàn)類別劃分步驟S41和基于分類的編轉(zhuǎn)碼優(yōu)化步驟S42。類別劃分步驟S41，接受當(dāng)前圖像和背景圖像的數(shù)據(jù)，向基于分類的編轉(zhuǎn)碼優(yōu)化步驟S42傳輸圖像塊或區(qū)域的分類信息。類別劃分步驟S41可以劃分圖像塊的方法包含但不限于(1)根據(jù)圖像的前背景屬性來劃分當(dāng)前圖像內(nèi)的所有圖像塊。(2)依據(jù)圖像的運(yùn)動屬性來劃分當(dāng)前圖像內(nèi)的所有圖像塊。(3)根據(jù)視頻內(nèi)容將所有圖像塊劃分為不同感興趣區(qū)域的圖像塊類別。類別劃分步驟S41依據(jù)前背景屬性將當(dāng)前圖像中的所有圖像塊進(jìn)行分類時，通過判別將圖像塊劃分為背景圖像塊、前景圖像塊和前景邊緣圖像塊。圖像塊劃分的方法可以包含但不限于(I)通過當(dāng)前圖像與背景圖像對應(yīng)位置圖像塊的殘差值和閾值進(jìn)行判斷的方式，直接計(jì)算殘差的絕對值、方差和均方差與閾值進(jìn)行判定，依據(jù)整個圖像塊殘差矩陣的計(jì)算結(jié)果來判斷當(dāng)前圖像塊的類別。(2)當(dāng)前圖像與背景圖像對應(yīng)位置圖像塊的殘差矩陣劃分為多個小子塊，并對子塊進(jìn)行判斷，以子塊的判別結(jié)果來最終決策當(dāng)前圖像塊類別的方式。對子塊的判別方法可以是計(jì)算殘差的絕對值、方差和均方差與閾值進(jìn)行判斷。(3)當(dāng)前圖像與背景圖像對應(yīng)位置圖像塊的殘差矩陣在變換域進(jìn)行判斷的方式，將殘差通過變換映射到變換域，在變換域利用變換后殘差矩陣的特征，或者變換后殘差矩陣內(nèi)4X4的零塊的個數(shù)進(jìn)行當(dāng)前圖像塊的類別判定。最終當(dāng)前圖像的所有圖像塊被劃分為多個類別，包含但不限于背景圖像塊、前景圖像塊和前景邊緣圖像塊。經(jīng)類別劃分步驟S41后，圖像塊的分類信息、屬性可以被編入碼流。如圖4所示，基于分類的編轉(zhuǎn)碼優(yōu)化步驟S42接受類別劃分步驟S41傳輸?shù)膱D像塊或區(qū)域分類信息，此外如果是已壓縮視頻還接受由視頻信息獲取步驟Si傳輸?shù)慕獯a信息?；诜诸惖木庌D(zhuǎn)碼優(yōu)化步驟S42對不同類別的圖像塊或區(qū)域，使用不同程度的編碼或轉(zhuǎn)碼優(yōu)化過程，以此在編碼或轉(zhuǎn)碼性能損失微弱的情況下，最大程度的減少編碼或轉(zhuǎn)碼復(fù)雜度?；诜诸惖木庌D(zhuǎn)碼優(yōu)化過程包含但不限于(I)參考幀選取步驟S421，(2)運(yùn)動搜索范圍自適應(yīng)縮減步驟S422，(3)候選模式優(yōu)化步驟S423，(4)量化參數(shù)的調(diào)整步驟S424和
(5)編碼方式的選擇S425。參考幀選取步驟S421 (算法框架如圖5所示)接受類別劃分步驟S41傳輸?shù)膱D像塊或區(qū)域分類信息，此外如果是已壓縮視頻還接受由視頻信息獲取步驟SI傳輸?shù)膮⒖紟饕栃畔?，并最終輸出優(yōu)化選取的參考幀。參考幀選取步驟S421中背景圖像塊或區(qū)域只使用最近的ー幀參考幀和背景圖像作為參考幀，而包含前景的圖像塊或區(qū)域采用靈活的參考幀精筒。如果是未壓縮視頻，可以強(qiáng)制性的選取最近的兩幀參考幀和背景圖像將被作為參考幀，其它幀可以有條件選擇性的補(bǔ)充。如果是已壓縮視頻對前景和前景邊緣圖像塊或區(qū)域，最近的兩幀參考幀和背景圖像將被作為參考幀，同時解碼得到的參考幀索引對應(yīng)的參考幀也是候選的參考幀。最終對不同類別的圖像塊或區(qū)域選取不同的參考幀(如表I所示)，可以保證性能損失微弱的條件下，減少運(yùn)動搜索時的復(fù)雜度。表I不同圖像塊或區(qū)域類別精簡后的候選參考幀
背景圖像塊或區(qū)前景圖像塊或
類別信息前景逵緣圈像塊或E域
域區(qū)域
最近的ー幀參考最近的兩幀參考幢、背景幀和在轉(zhuǎn)碼應(yīng)用中
候選參考幀
禎、背景幀解碼得到的參考《索引對應(yīng)的參考賴運(yùn)動搜索范圍自適應(yīng)縮減步驟S422(算法框架如圖6所示)接受類別劃分步驟S41傳輸?shù)膱D像塊或區(qū)域分類信息，此外如果是已壓縮視頻還接受由視頻信息獲取步驟Si傳輸?shù)倪\(yùn)動向量信息，并最終輸出自適應(yīng)縮減后的運(yùn)動搜索范圍。運(yùn)動搜索范圍自適應(yīng)縮減步驟S422中不同運(yùn)動特性類別的圖像塊或區(qū)域?qū)⑹褂貌煌姆椒ㄟM(jìn)行自適應(yīng)縮減，縮減的方法包含但不限于(I)對于基本維持不動的背景圖像塊或區(qū)域，其運(yùn)動搜索范圍可以限制在較小的范圍內(nèi)。(2)如果是未壓縮視頻，前景邊緣和前景圖像塊或區(qū)域，其運(yùn)動搜索范圍可以各自強(qiáng)制性的設(shè)置限制范圍，也可以有條件的選擇限制范圍。(3)如果是已壓縮視頻，前景邊緣和前景圖像塊或區(qū)域其范圍可以根據(jù)解碼運(yùn)動向量(MVde。)的大小，自適應(yīng)的縮減搜索范圍。對于一個解碼的宏塊，得到的ー個或多個MVde。，和當(dāng)前模式編碼時的預(yù)測運(yùn)動向量(PMV)分別計(jì)算差值(PMVD)大小，如公式I所示PMVDi (X，Y) = (PMVi ⑴-MVdec ⑴，PMVi ⑴-MVdec ⑴)公式 I然后計(jì)算所有PMVD在橫和縱軸方向的最大距離PMVDmax (X)和PMVDniax⑴，如公式2和3所示PMVDmax (X) =MAX (PMVD0 (X)，PMVD1 (X),)公式 2PMVDmax (Y) =MAX (PMVD0 (Y)，PMVD1 (Y)，· · · ·)公式 3得到的最大距離PMVDmax (X)和PMVDmax(Y)各自再加上一個浮動的距離dl和d2作為最終縮減后的運(yùn)動搜索范圍，浮動的距離為整數(shù)值。前景邊緣圖像塊或區(qū)域浮動距離為dl,前景圖像塊或區(qū)域浮動距離為dl+d2, dl和d2的值均設(shè)置為2。上述的轉(zhuǎn)碼應(yīng)用中最大距離加浮動距離的計(jì)算過程如下所示
權(quán)利要求
1.一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征在于，利用視頻圖像塊不同的特征信息，將圖像內(nèi)所有圖像塊進(jìn)行分類，對不同類別的圖像塊使用不同的優(yōu)化加速策略。
2.如權(quán)利要求I所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征在于，進(jìn)一步包括以下步驟視頻信息獲取步驟如果輸入為原始數(shù)據(jù)，則直接進(jìn)行數(shù)字化采樣得到原始數(shù)據(jù)；如果輸入為已壓縮視頻，則首先對壓縮視頻解碼獲取視頻信息，包括每個圖像塊的解碼結(jié)果和編碼工具使用情況信息；背景圖像獲取步驟編碼時利用解碼圖像、輸入原始圖像或者重建圖像進(jìn)行訓(xùn)練，得到背景圖像，或由外部輸入已有的背景圖像；背景圖像選擇性的編入位流步驟根據(jù)背景圖像的獲取方法來選擇是否將背景圖像編入位流；編轉(zhuǎn)碼優(yōu)化步驟對圖像塊進(jìn)行分類，并將分類信息用于編碼或轉(zhuǎn)碼優(yōu)化中，解碼得到的工具使用情況信息會被重用于再編碼過程。
3.如權(quán)利要求2所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述視頻信息獲取步驟中，如果輸入為已壓縮視頻，提取的編碼工具使用情況信息包括參考幀索引號和/或尺寸模式和/或變換方法和/或預(yù)測方式和/或量化參數(shù)和/或環(huán)路濾波方式和/或熵編碼方法和/或位寬度信息和/或位寬度擴(kuò)展情況和/或深度信息和/或運(yùn)動向量信息。
4.如權(quán)利要求2所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述背景圖像獲取步驟中所使用的背景圖像獲取方法包含如果輸入為未壓縮視頻，則利用輸入原始圖像進(jìn)行背景建模，或如果輸入為已壓縮視頻，則利用解碼圖像進(jìn)行背景建模，或利用重建圖像進(jìn)行背景建模，或由外部直接輸入已有的背景圖像。
5.如權(quán)利要求2所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述背景圖像選擇性的編入位流步驟中，使用了輸入原始圖像、解碼圖像訓(xùn)練或者外部輸入得到的背景圖像需要被編入位流，僅由重建圖像訓(xùn)練得到的背景圖像不會編入位流。
6.如權(quán)利要求2所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述編轉(zhuǎn)碼優(yōu)化步驟包括以下步驟類別劃分步驟利用背景圖像，將當(dāng)前圖像內(nèi)的所有圖像塊進(jìn)行分類，劃分為不同特性的圖像塊類別；基于分類的編轉(zhuǎn)碼優(yōu)化步驟將分類信息應(yīng)用于編碼或轉(zhuǎn)碼優(yōu)化中，對不同類別的圖像塊或區(qū)域采用不同的編碼或轉(zhuǎn)碼優(yōu)化過程。
7.如權(quán)利要求6所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述編轉(zhuǎn)碼優(yōu)化步驟中在對圖像塊進(jìn)行分類時，采用至少一種如下的分類策略按照圖像塊的前背景屬性進(jìn)行劃分，劃分成前景、背景或者前背景邊緣塊，或按照圖像塊的運(yùn)動屬性進(jìn)行劃分，劃分成大幅運(yùn)動圖像塊，靜止圖像塊或小幅運(yùn)動圖像塊，或按照圖像塊的內(nèi)容進(jìn)行劃分劃分為若干類別的感興趣塊和若干類別的非感興趣塊，相同類別的感興趣塊組成一種類別的感興趣區(qū)域，相同類別的非感興趣塊組成一種類別的非感興趣區(qū)域。
8.如權(quán)利要求7所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述編轉(zhuǎn)碼優(yōu)化步驟所包含的類別劃分步驟中，在按照前背景屬性進(jìn)行劃分時，通過當(dāng)前圖像和背景圖像進(jìn)行殘差計(jì)算，通過殘差與閾值的判別將當(dāng)前圖像內(nèi)所有圖像塊分類為背景圖像塊、前景圖像塊和前景邊緣圖像塊。
9.如權(quán)利要求7所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述編轉(zhuǎn)碼優(yōu)化步驟所包含的類別劃分步驟中，在按照運(yùn)動屬性進(jìn)行劃分時，使用當(dāng)前圖像在背景圖像或已編碼的圖像中進(jìn)行全局運(yùn)動搜索，通過對運(yùn)動信息的判別將當(dāng)前圖像內(nèi)所有圖像塊分類為大幅運(yùn)動圖像塊，靜止圖像塊或小幅運(yùn)動圖像塊。
10.如權(quán)利要求8所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述編轉(zhuǎn)碼優(yōu)化步驟所包含的類別劃分步驟中的按照前背景屬性進(jìn)行劃分時，殘差判別的方法包含使用整個圖像塊的殘差矩陣進(jìn)行判別，計(jì)算整個圖像塊的殘差矩陣與閾值進(jìn)行判斷當(dāng)前圖像塊的類別，或將整個圖像塊的殘差矩陣劃分為多個小子塊，先進(jìn)行小子塊與閾值的判斷，然后再利用判別為前景的小子塊個數(shù)，進(jìn)一步將當(dāng)前圖像塊進(jìn)行分類，或對殘差矩陣進(jìn)行變換計(jì)算，將殘差映射到變換域，由殘差變換矩陣與閾值的判別結(jié)果決定當(dāng)前圖像塊的類別。
11.如權(quán)利要求6所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述編轉(zhuǎn)碼優(yōu)化步驟所包含的類別劃分步驟中的圖像區(qū)域的分類結(jié)果被編入碼流，；分類結(jié)果包括如下至少一種背景、前景屬性；感興趣區(qū)域、非感興趣區(qū)域?qū)傩?；運(yùn)動特性屬性。
12.如權(quán)利要求6所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述編轉(zhuǎn)碼優(yōu)化步驟所包含的基于分類的編轉(zhuǎn)碼優(yōu)化步驟至少包含一種以下方法 a)參考幀的選?。? b)運(yùn)動搜索范圍的自適應(yīng)縮減； c)候選模式的優(yōu)化； d)量化參數(shù)的調(diào)整； e)編碼方式的選擇。
13.如權(quán)利要求12所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述編轉(zhuǎn)碼優(yōu)化步驟所包含的基于分類的編轉(zhuǎn)碼優(yōu)化步驟中的參考幀的選取至少包含一種以下方法對于背景圖像塊或非感興趣區(qū)域，使用較少的參考幀，對于包含前景的圖像塊或感興趣區(qū)域，使用靈活的參考幀選取方式。此外在轉(zhuǎn)碼應(yīng)用中，解碼獲取的參考幀索引信息所對應(yīng)的參考幀也被選取。
14.如權(quán)利要求12所述一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述編轉(zhuǎn)碼優(yōu)化步驟所包含的基于分類的編轉(zhuǎn)碼優(yōu)化步驟中的運(yùn)動搜索范圍的自適應(yīng)縮減方法至少包含一種以下方法在編碼應(yīng)用中，背景圖像塊或非感興趣區(qū)域，運(yùn)動搜索限制在小范圍內(nèi)；包含前景的圖像塊或感興趣區(qū)域搜索范圍有條件選擇性的縮減或強(qiáng)制性的限制在某一范圍內(nèi)；在轉(zhuǎn)碼應(yīng)用中，背景圖像塊或非感興趣區(qū)域的運(yùn)動搜索限制在小范圍內(nèi)；而包含前景的圖像塊或感興趣區(qū)域，運(yùn)動搜索時對于每個解碼圖像塊內(nèi)的每個子塊模式，計(jì)算其運(yùn)動向量和當(dāng)前編碼預(yù)測向量之間在橫軸和縱軸的最大差值，并根據(jù)得到的最大差值自適應(yīng)的縮減當(dāng)前模式的運(yùn)動搜索范圍。
15.如權(quán)利要求12所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述編轉(zhuǎn)碼優(yōu)化步驟所包含的基于分類的編轉(zhuǎn)碼優(yōu)化步驟中的候選模式的優(yōu)化步驟至少包含一種如下方法對背景圖像塊、靜態(tài)圖像塊或非感興趣區(qū)域，候選模式只包含整個圖像塊尺寸和較大尺寸的塊模式，其它小尺寸的塊模式不使用；對前景圖像塊、大幅運(yùn)動圖像塊或感興趣區(qū)域，在編碼應(yīng)用中，有條件選擇性的選擇或強(qiáng)制性的選擇候選模式；在轉(zhuǎn)碼應(yīng)用中候選模式只包含，模式尺寸大于或等于解碼時獲取的最小的塊模式，小于最小尺寸的塊模式將被排除在候選模式之外；對前景邊緣圖像塊、小幅運(yùn)動圖像塊或一般感興趣區(qū)域，在編碼應(yīng)用中，有條件選擇性的選擇或強(qiáng)制性的選擇候選模式；在轉(zhuǎn)碼應(yīng)用中候選模式包含，模式尺寸大于或等于解碼時獲取的最小的塊模式，并且要根據(jù)解碼的模式添加其它的候選模式。
16.如權(quán)利要求12所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述編碼碼優(yōu)化步驟所包含的基于分類的編轉(zhuǎn)碼優(yōu)化步驟中的量化參數(shù)調(diào)整方法至少包含一種如下方法對背景圖像塊、靜態(tài)圖像塊或非感興趣區(qū)域，使用較大量化參數(shù)；對前景圖像塊、大幅運(yùn)動圖像塊或感興趣區(qū)域，在編碼應(yīng)用中，有條件選擇性的選擇或強(qiáng)制性的選擇量化參數(shù)；在轉(zhuǎn)碼應(yīng)用中根據(jù)解碼的量化參數(shù)自適應(yīng)的調(diào)整量化參數(shù)；對前景邊緣圖像塊、小幅運(yùn)動圖像塊或一般感興趣區(qū)域，在編碼應(yīng)用中，有條件選擇性的選擇或強(qiáng)制性的選擇量化參數(shù)；在轉(zhuǎn)碼應(yīng)用中根據(jù)解碼的量化參數(shù)自適應(yīng)的調(diào)整量化參數(shù)。
17.如權(quán)利要求12所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述編轉(zhuǎn)碼優(yōu)化步驟所包含的基于分類的編轉(zhuǎn)碼優(yōu)化步驟中的編碼方法的選擇過程中至少包含一種如下方法對背景圖像塊、靜態(tài)圖像塊或非感興趣區(qū)域，選擇使用基于長期背景幀的背景預(yù)測編碼方法以及近期參考圖像進(jìn)行幀間預(yù)測編碼；對前景圖像塊、大幅運(yùn)動圖像塊或感興趣區(qū)域，使用近期參考圖像進(jìn)行幀間預(yù)測編碼；對前景邊緣圖像塊、小幅運(yùn)動圖像塊或一般感興趣區(qū)域，使用近期參考圖像進(jìn)行幀間預(yù)測編碼和基于背景幀的可選差分預(yù)測編碼方法。
18.如權(quán)利要求2所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述對編碼或轉(zhuǎn)碼所生成位流在解碼端的解碼過程中包括以下步驟解碼輸入圖像解碼位流直接得到與背景無關(guān)的解碼圖像；選擇性的獲取分類信息如果解碼過程與快速轉(zhuǎn)碼信息相關(guān)，則需要獲取與編轉(zhuǎn)碼端相對應(yīng)的用于快速高效轉(zhuǎn)碼的信息；否則，不需要解碼這些信息；獲取背景圖像解碼端獲取背景圖像；生成所有解碼圖像根據(jù)已經(jīng)獲得的解碼圖像和背景圖像以及快速高效轉(zhuǎn)碼信息生成所有解碼圖像。
19.如權(quán)利要求18所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于對編轉(zhuǎn)碼所生成位流在解碼端的解碼過程中，在解碼端背景圖像獲取的方式至少包含一種以下方法從編轉(zhuǎn)碼后的位流中直接解碼背景圖像的位流獲得，或在解碼端解碼過程中，由所有解碼圖像或一部分解碼圖像進(jìn)行訓(xùn)練得到，或由已經(jīng)生成好的背景圖像作為外部數(shù)據(jù)直接輸入解碼器。
20.如權(quán)利要求18所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述對編轉(zhuǎn)碼所生成位流在解碼端的解碼過程中，在解碼端解碼已編入碼流的用于快速高效轉(zhuǎn)碼的信息，包括圖像塊的前背景屬性信息、運(yùn)動屬性信息或者感興趣區(qū)域?qū)傩孕畔ⅰ?br> 21.如權(quán)利要求18所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述對編轉(zhuǎn)碼所生成位流在解碼端的解碼過程中，在解碼端獲取的分類信息包含一種以下方法按照圖像塊的前背景屬性劃分的前景、背景或者前背景邊緣塊分類信息，或按照圖像塊的運(yùn)動屬性劃分的大幅運(yùn)動圖像塊，靜止圖像塊或小幅運(yùn)動圖像塊分類信息，或按照圖像塊的內(nèi)容劃分的若干類別的感興趣塊和若干類別的非感興趣塊分類信息。
22.如權(quán)利要求18所述的一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法，其特征還在于，所述對編轉(zhuǎn)碼所生成位流在解碼端的解碼過程中，在解碼端獲取分類信息的方式包括解碼位流中的標(biāo)志位得到分類信息；由重建圖像或者圖像塊的編碼信息在解碼端計(jì)算分類信息。
全文摘要
本發(fā)明公開了一種基于宏塊分類的編轉(zhuǎn)碼方法，它基于背景建模技術(shù)，將當(dāng)前圖像內(nèi)具有不同特性的圖像塊進(jìn)行劃分，形成不同類別的圖像塊，隨后對不同類別的圖像塊采用不同的編碼或轉(zhuǎn)碼過程。在編碼應(yīng)用中，可以有條件選擇性的或者強(qiáng)制性的對不同類別的圖像塊進(jìn)行編碼優(yōu)化；在轉(zhuǎn)碼應(yīng)用中，利用解碼得到的信息，完成參考幀選擇，運(yùn)動搜索過程中的搜索范圍自適應(yīng)縮減、候選模式的優(yōu)化精簡、量化參數(shù)調(diào)整和編碼模式選擇算法。與傳統(tǒng)編碼或轉(zhuǎn)碼方法相比，這種方法可以極大幅度的縮減編碼或轉(zhuǎn)碼復(fù)雜度，并且保持顯著的壓縮效率。
文檔編號H04N7/32GK102665077SQ20121013578
公開日2012年9月12日申請日期2012年5月3日優(yōu)先權(quán)日2012年5月3日
發(fā)明者張賢國, 田永鴻, 耿銘超, 高文, 黃鐵軍申請人:北京大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：黃鐵軍;耿銘超;張賢國;田永鴻;高文
技術(shù)所有人：北京大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計(jì) 2.汽車檢測系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于宏塊分類的快速高效編轉(zhuǎn)碼方法