視頻圖像編碼、解碼方法及裝置與流程

文檔序號：12554358閱讀：443來源：國知局

本申請涉及視頻技術(shù)領(lǐng)域，尤其涉及一種視頻圖像編碼、解碼方法及裝置。

背景技術(shù)：

視頻壓制是將原始錄制的高清晰視頻，在不損傷分辨率的情況下，盡量減小視頻文件的大小。

現(xiàn)有技術(shù)中的視頻壓制是通過格式工廠等視頻壓制工具進行壓制，壓制的過程包括：將獲取到的RGBA圖像直接轉(zhuǎn)碼為YUV420數(shù)據(jù)，對YUV420進行視頻編碼并依據(jù)相應(yīng)的格式進行數(shù)據(jù)封裝，形成視頻文件。對壓制后的視頻播放過程包括：讀取視頻文件中的一幀一幀的數(shù)據(jù)，將一幀一幀的數(shù)據(jù)輸入視頻解碼器進行解碼，將解碼后的數(shù)據(jù)進行轉(zhuǎn)碼操作，完成最終的視頻圖像顯示。

現(xiàn)有技術(shù)對視頻圖像的轉(zhuǎn)碼、壓縮和視頻解碼、轉(zhuǎn)碼的處理過程中，非常耗費性能。

技術(shù)實現(xiàn)要素：

本發(fā)明實施例提供了一種視頻圖像編碼、解碼方法及裝置，能夠提升視頻圖像處理過程中的性能。

第一方面，本發(fā)明實施例提供了一種視頻圖像編碼方法，該方法包括：

獲取視頻源文件中的多幀視頻幀圖像，針對多幀視頻幀圖像中的目標視頻幀圖像，確定目標視頻幀圖像的裁剪圖像，裁剪圖像包括目標視頻幀圖像中的有效像素，目標視頻幀圖像為多幀視頻幀圖像中的任意一幀視頻幀圖像；對裁剪圖像進行輪廓掃描生成裁剪圖像的輪廓數(shù)據(jù)，根據(jù)輪廓數(shù)據(jù)對裁剪圖像進行轉(zhuǎn)碼得到轉(zhuǎn)碼后的圖像；對轉(zhuǎn)碼后的圖像進行壓縮得到目標視頻幀圖像對應(yīng)的壓縮圖像。

第二方面，本發(fā)明實施例提供了一種視頻圖像解碼方法，該方法包括：

對視頻文件進行解碼得到解碼后的圖像；獲取輪廓數(shù)據(jù)，根據(jù)輪廓數(shù)據(jù)對解碼后的圖像進行轉(zhuǎn)碼得到裁剪圖像；獲取裁剪圖像的空間位置數(shù)據(jù)，根據(jù)空間位置數(shù)據(jù)和裁剪圖像生成視頻圖像，空間位置數(shù)據(jù)指示裁剪圖像在視頻圖像中的空間位置。

第三方面，本發(fā)明實施例提供了一種視頻圖像編碼裝置，該裝置包括：

獲取單元，用于獲取視頻源文件中的多幀視頻幀圖像；

圖像裁剪單元，用于針對多幀視頻幀圖像中的目標視頻幀圖像，確定目標視頻幀圖像的裁剪圖像，裁剪圖像包括目標視頻幀圖像中的有效像素，目標視頻幀圖像為多幀視頻幀圖像中的任意一幀視頻幀圖像；

輪廓數(shù)據(jù)生成單元，用于對裁剪圖像進行輪廓掃描生成裁剪圖像的輪廓數(shù)據(jù)；

圖像轉(zhuǎn)碼單元，用于根據(jù)輪廓數(shù)據(jù)對裁剪圖像進行轉(zhuǎn)碼得到轉(zhuǎn)碼后的圖像；

圖像壓縮單元，用于對轉(zhuǎn)碼后的圖像進行壓縮得到目標視頻幀圖像對應(yīng)的壓縮圖像。

第四方面，本發(fā)明實施例還提供了一種視頻圖像解碼裝置，該裝置包括：

解碼單元，用于對視頻文件進行解碼得到解碼后的圖像；

轉(zhuǎn)碼單元，用于獲取輪廓數(shù)據(jù)，根據(jù)輪廓數(shù)據(jù)對解碼后的圖像進行轉(zhuǎn)碼得到裁剪圖像；

視頻圖像生成單元，用于獲取裁剪圖像的空間位置數(shù)據(jù)，根據(jù)空間位置數(shù)據(jù)和裁剪圖像生成視頻圖像，空間位置數(shù)據(jù)指示裁剪圖像在視頻圖像中的空間位置。

從以上技術(shù)方案可以看出，本發(fā)明實施例具有以下優(yōu)點：

本發(fā)明實施例在視頻壓制過程中，獲取視頻源文件中的多幀視頻幀圖像，針對多幀視頻幀圖像中的任意一幀視頻幀圖像的處理方式為：確定該視頻幀圖像的裁剪圖像，裁剪圖像包括該視頻幀圖像中的有效像素，然后對裁剪圖像進行輪廓掃描生成裁剪圖像的輪廓數(shù)據(jù)，根據(jù)輪廓數(shù)據(jù)對裁剪圖像進行轉(zhuǎn)碼得到轉(zhuǎn)碼后的圖像，對轉(zhuǎn)碼后的圖像進行壓縮得到該視頻幀圖像對應(yīng)的壓縮圖像。本發(fā)明實施例在對視頻圖像處理中，不是對視頻圖像的整幅圖像進行處理，而是先裁剪出視頻圖像中包括有效像素的裁剪圖像，再進行輪廓掃描，獲取輪廓數(shù)據(jù)，根據(jù)輪廓數(shù)據(jù)進行轉(zhuǎn)碼，對轉(zhuǎn)碼后的圖像進行壓縮，因此本發(fā)明實施例只對視頻圖像中的有效像素進行轉(zhuǎn)碼和壓縮，能夠減少視頻圖像處理過程中的像素量，從而能夠提升視頻圖像處理的性能。

附圖說明

圖1為本發(fā)明實施例中的一種視頻圖像編碼方法的流程圖；

圖2為本發(fā)明實施例中的從視頻圖像中確定裁剪圖像的示意圖；

圖3為本發(fā)明實施例中從裁剪圖像中確定輪廓數(shù)據(jù)的過程示意圖；

圖4為本發(fā)明實施例中確定裁剪圖像的空間位置數(shù)據(jù)的過程示意圖；

圖5為本發(fā)明實施例中的視頻信息文件組成示意圖；

圖6為本發(fā)明實施例中的一種視頻圖像解碼方法流程圖；

圖7為本發(fā)明實施例中的對視頻信息文件進行處理的示意圖；

圖8為本發(fā)明實施例中的待壓制的視頻源文件中的其中兩幀視頻圖像的示意圖；

圖9為本發(fā)明實施例中圖8中的兩幀圖像裁剪后的得到的裁剪圖像示意圖；

圖10為本發(fā)明實施例中對計算圖像中的輪廓數(shù)據(jù)的方法示意圖；

圖11為本發(fā)明實施例中按照空間位置數(shù)據(jù)還原裁剪圖像后得到視頻圖像的示意圖；

圖12為本發(fā)明實施例中的視頻圖像編碼裝置的功能模塊結(jié)構(gòu)示意圖；

圖13為本發(fā)明實施例中的視頻圖像解碼裝置的功能模塊結(jié)構(gòu)示意圖；

圖14為本發(fā)明實施例中的終端設(shè)備的硬件結(jié)構(gòu)示意圖。

具體實施方式

以下結(jié)合附圖對本發(fā)明實施例進行進一步詳細說明。

視頻壓制是將原始視頻文件進行轉(zhuǎn)碼、壓縮后，在不影響效果的條件下，減小視頻文件的大小，在播放過程中，對壓制后的視頻文件進行解壓、轉(zhuǎn)碼播放。

現(xiàn)有的技術(shù)的視頻壓制方法，沒有能夠有效的去除冗余，會使得在視頻壓制的轉(zhuǎn)碼、壓碼以及播放中解碼、轉(zhuǎn)碼、圖像顯示的各個處理過程都是全圖處理，非常耗費性能。本發(fā)明實施例中，在視頻壓制時，只對視頻圖像中的有效像素進行處理，能夠極大的減少壓制以及播放中的冗余信息，減少處理過程中的性能消耗。

下面結(jié)合圖1對本發(fā)明實施例中的視頻圖像處理方法進行詳細介紹。

101、獲取視頻源文件中的多幀視頻幀圖像；

視頻源文件由一幀一幀的圖像組成，在視頻壓制時，獲取待處理的視頻源文件，一幀一幀地讀取視頻源文件中的視頻圖像，逐幀對視頻圖像進行處理。

102、針對多幀視頻幀圖像中的目標視頻幀圖像，確定目標視頻幀圖像的裁剪圖像；

目標視頻幀圖像為視頻圖像中的任意一幀視頻圖像，對目標視頻幀圖像執(zhí)行步驟102至步驟104進行處理，可以理解為對視頻圖像中每一幀圖像都執(zhí)行步驟102到步驟104的處理過程。

人眼對Alpha通道值過小的像素不敏感，Alpha通道值過小的像素透明度高，屬于無效像素。本發(fā)明實施例中將像素的Alpha通道值小于或等于預設(shè)的通道閾值的像素定義為無效像素，將Alpha通道值大于該預設(shè)的通道閾值的像素定義為有效像素。可選的，預設(shè)的通道值可以為30，即Alpha通道值小于30的像素為無效像素。

在掃描視頻圖像時，掃描確定目標視頻幀圖像的有效像素，獲取包含這些有效像素的矩形圖，該矩形圖為目標視頻幀圖像的裁剪圖像。

如圖2所示，視頻圖像的大小為512*480，裁剪圖像的大小為386*230，裁剪圖像中包括了視頻圖像中的有效像素。

103、對裁剪圖像進行輪廓掃描生成裁剪圖像的輪廓數(shù)據(jù)，根據(jù)輪廓數(shù)據(jù)對裁剪圖像進行轉(zhuǎn)碼得到轉(zhuǎn)碼后的圖像；

獲取的目標視頻幀圖像的裁剪圖像中包含了目標視頻幀圖像的有效像素，因為是矩形圖，因此裁剪圖像中可能還包括了一部分無效像素。

因此，對裁剪圖像進行輪廓掃描，獲取該裁剪圖像中的有效像素的輪廓數(shù)據(jù)，輪廓數(shù)據(jù)為裁剪圖像中的有效像素的最邊緣的像素點的集合。根據(jù)輪廓數(shù)據(jù)對裁剪圖像進行轉(zhuǎn)碼得到轉(zhuǎn)碼后的圖像。

可選的，對所述裁剪圖像進行輪廓掃描生成該裁剪圖像的輪廓數(shù)據(jù)具體可以是：逐行掃描所述裁剪圖像，記錄每行的有效像素在所述裁剪圖像中的開始位置點和結(jié)束位置點，所述裁剪圖像的每行的有效像素在所述裁剪圖像中的開始位置點和結(jié)束位置點為所述裁剪圖像的輪廓數(shù)據(jù)。

圖3所示為計算出裁剪圖像的其中一行的有效像素的開始位置點為距離裁剪圖像的左邊界40個像素，結(jié)束位置點為距離裁剪圖像的右邊界30個像素。

可選的，根據(jù)輪廓數(shù)據(jù)對裁剪圖像進行轉(zhuǎn)碼實際是：對所述輪廓數(shù)據(jù)對應(yīng)的輪廓以內(nèi)的像素進行轉(zhuǎn)碼，對輪廓數(shù)據(jù)對應(yīng)的輪廓以外的像素置零，從而相當于只需要對裁剪圖像中的有效像素進行轉(zhuǎn)碼。

104、對轉(zhuǎn)碼后的圖像進行壓縮得到目標視頻幀圖像對應(yīng)的壓縮圖像。

根據(jù)輪廓數(shù)據(jù)對裁剪圖像進行轉(zhuǎn)碼得到轉(zhuǎn)碼后的圖像后，對轉(zhuǎn)碼后的圖像進行壓縮得到壓縮圖像，壓縮的方法可以采用無損壓縮方法，也可以采用有損壓縮，或者采用有損壓縮結(jié)合無損壓縮的方法進行壓縮。

在對視頻圖像中每一幀圖像都執(zhí)行步驟102到步驟104的處理過程，將獲得的視頻圖像中的每一幀圖像對應(yīng)的壓縮圖像存儲為視頻文件。

本發(fā)明實施例在對視頻圖像處理中，不是對視頻圖像的整幅圖像進行處理，而是先裁剪出視頻圖像中包括有效像素的裁剪圖像，再進行輪廓掃描，獲取輪廓數(shù)據(jù)，根據(jù)輪廓數(shù)據(jù)進行轉(zhuǎn)碼，對轉(zhuǎn)碼后的圖像進行壓縮，因此本發(fā)明實施例只對視頻圖像中的有效像素進行轉(zhuǎn)碼和壓縮，能夠減少視頻圖像處理過程中的像素量，從而能夠提升視頻圖像處理的性能。

可選的，確定目標視頻幀圖像的裁剪圖像的具體方式為：對進行壓制的視頻圖像序列進行掃描，根據(jù)各視頻幀圖像的有效像素點確定裁剪矩形，裁剪矩形用于指示視頻圖像的裁剪大小，即在確定各視頻圖像的裁剪圖像時，按照裁剪矩形的大小確定各視頻圖像的裁剪圖像，裁剪圖像與裁剪矩形等長等寬，每一幀視頻圖像的裁剪圖像應(yīng)能包括該視頻幀圖像中的有效像素。

根據(jù)各視頻幀圖像的有效像素點確定裁剪矩形的具體過程可以為：

獲取多幀視頻幀圖像中的每一幀視頻幀圖像，確定每一幀視頻幀圖像的有效矩形，每一幀視頻幀圖像的有效矩形為包含該視頻幀圖像的有效像素點的最小矩形區(qū)域；然后，從各視頻幀圖像對應(yīng)的有效矩形中確定裁剪矩形，裁剪矩形的寬度值為各視頻幀圖像的有效矩形的寬度值中的最大寬度值，裁剪矩形的長度值為各視頻幀圖像的有效矩形中的長度值中的最大的長度值；即將所有幀中的有效矩形的最大長和最大寬，定位成裁剪矩形的長和寬。

另外，為了能夠在視頻文件播放過程中能夠還原視頻文件，在視頻圖像處理過程中，確定目標視頻幀圖像的裁剪圖像后，還需要確定裁剪圖像在目標視頻幀圖像中的空間位置得到所述裁剪圖像的空間位置數(shù)據(jù)。

可選的，確定裁剪圖像在目標視頻幀圖像中的空間位置數(shù)據(jù)具體的方式為：計算裁剪圖像在目標視頻幀圖像中的偏移向量，偏移向量具體是以視頻圖像的左下角為坐標原點，計算裁剪圖像的矩形的左下角相對于坐標原點的坐標值。此偏移向量即為所述裁剪圖像在所述目標視頻幀圖像中的空間位置數(shù)據(jù)。

如圖4所示，在圖2的基礎(chǔ)上，裁剪圖像相對于視頻圖像的偏移向量為(50，60)。

在得到裁剪圖像的空間位置數(shù)據(jù)后，將各視頻圖像對應(yīng)的裁剪圖像的空間位置數(shù)據(jù)存儲為空間位置文件。

另外，為了能夠在視頻文件播放過程中能夠還原視頻文件，還需要將各視頻幀圖像對應(yīng)的裁剪圖像的輪廓數(shù)據(jù)存儲為輪廓數(shù)據(jù)文件。

如圖5所示，經(jīng)過圖1所示的視頻圖像編碼后形成的視頻信息文件包括視頻文件、空間位置文件以及輪廓數(shù)據(jù)文件。

下面結(jié)合圖6介紹本發(fā)明實施例中，對經(jīng)過圖1所示的視頻編碼方法生成的視頻信息文件進行視頻圖像解碼的方法進行詳細介紹。

601、對視頻文件進行解碼得到解碼后的圖像；

在播放視頻時，先獲取視頻文件信息，如圖7所示，視頻文件信息中包括視頻文件、空間位置文件以及輪廓數(shù)據(jù)文件，根據(jù)視頻文件信息對圖像進行解碼、轉(zhuǎn)碼，最終獲得視頻圖像的顯示。

從視頻文件信息中獲取視頻文件，對視頻文件進行解碼得到解碼后的各圖像。

602、獲取輪廓數(shù)據(jù)，根據(jù)輪廓數(shù)據(jù)對解碼后的圖像進行轉(zhuǎn)碼得到裁剪圖像；

從視頻文件信息中獲取輪廓數(shù)據(jù)文件，從輪廓數(shù)據(jù)文件中獲取各圖像的對應(yīng)的輪廓數(shù)據(jù)。

可選的，輪廓數(shù)據(jù)包括每行的有效像素的開始位置點和結(jié)束位置點。根據(jù)輪廓數(shù)據(jù)對所述解碼后的圖像進行轉(zhuǎn)碼得到裁剪圖像具體為：針對解碼后的圖像中的每行的像素，對從該行對應(yīng)的開始位置點到結(jié)束位置點中間的像素進行轉(zhuǎn)碼得到裁剪圖像。

603、獲取裁剪圖像的空間位置數(shù)據(jù)，根據(jù)空間位置數(shù)據(jù)和裁剪圖像生成視頻圖像。

從視頻文件信息中獲取空間位置文件，從空間位置文件中獲取各裁剪圖像對應(yīng)的空間位置數(shù)據(jù)，各裁剪圖像的空間位置數(shù)據(jù)指示裁剪圖像在視頻圖像中的空間位置。

然后，根據(jù)空間位置數(shù)據(jù)將裁剪圖像還原成視頻圖像。例如：視頻圖像的大小為512*480，該裁剪圖像對應(yīng)的空間位置數(shù)據(jù)為(50，60)，需將其還原成512*480大小的視頻圖像，且裁剪圖像的左下角坐標距離視頻圖像左下角的坐標的向量為(50，60)。

本發(fā)明實施例中，在通過圖1所示的視頻編碼方法將視頻圖像處理后，能夠?qū)⒁曨l文件進行解碼得到解碼后的圖像，獲取輪廓數(shù)據(jù)，根據(jù)輪廓數(shù)據(jù)對所述解碼后的圖像進行轉(zhuǎn)碼得到裁剪圖像，再獲取所述裁剪圖像的空間位置數(shù)據(jù)，根據(jù)所述空間位置數(shù)據(jù)和所述裁剪圖像生成視頻圖像。本發(fā)明實施例的視頻文件中只包含有效像素的信息，而不是全圖信息，在視頻播放過程中，是根據(jù)視頻文件、輪廓數(shù)據(jù)件以及空間位置數(shù)據(jù)進行相應(yīng)的解碼、轉(zhuǎn)碼得到最終顯示的視頻圖像，并不需要對全圖信息進行解碼、轉(zhuǎn)碼，從而能夠減少播放過程中的冗余信息，減少視頻圖像的處理過程中的耗時。

下面結(jié)合具體的應(yīng)用場景對本發(fā)明實施中的方法進行介紹。

輸入待壓制的視頻源文件，視頻源文件的幀圖像格式為RGBA，根據(jù)輸入圖像RGBA中的Alpha通道信息進行空間位置掃描得到裁剪圖像，以及空間位置文件，對于裁剪后的圖像進行輪廓掃描生成輪廓文件。具體的過程為：

對待壓制的視頻源文件中的幀圖像序列進行掃描，獲取每一幀視頻圖像的有效像素的有效矩形的長和寬，從所有幀的有效矩形中選擇出最大長和最大寬，定位成裁剪矩形的長和寬，對每一幀進行裁剪時，按照裁剪矩形的大小進行裁剪。

例如，待壓制的視頻源文件中的一共有3920幀視頻圖像，圖8展示的為輸入圖像序列中的第1024幀以及2275幀視頻圖像，展示的圖像大小為512*480。

對視頻源文件中的3920幀視頻圖像進行掃描，確定每一幀圖像的有效像素的有效矩形區(qū)域，從這些有效像素的有效矩形區(qū)域中確定最大的長為352px，最大的寬為420px，則最終確定的裁剪圖像的矩形大小為352*420。

按照352*420的矩形大小分別裁剪第1024幀圖像以及2275幀視頻圖像，得到的裁剪圖像如圖9所示。從圖9可以看出，通過Alpha的裁剪，圖像明顯減少了，但是圖像中的有效像素卻完整的保留了。

與此同時，為了便于在播放視頻時，能夠恢復視頻圖像，在對圖像處理時，還需要保存裁剪圖像的相應(yīng)的空間位置數(shù)據(jù)，空間位置數(shù)據(jù)是裁剪后相對于裁剪前的偏移向量。如圖9所示的兩幀圖像分別保留了兩個向量(10，50)、(160，50)，保存在空間位置文件中。

若在圖像處理過程中，沒有獲取到Alpha通道等標明無效像素的信息，則可以進行默認的全幅圖像處理。

每幅視頻圖像經(jīng)過裁剪后得到的裁剪圖像還是存在有很大的冗余，接下來，對裁剪圖像進行逐行掃描，記錄每行有效像素開始點以及結(jié)束點。

如圖10所示，Start以及End分別標明了這一行像素的有效開始點以及結(jié)束點。所有行的開始點以及結(jié)束點標明了這幅圖像的有效輪廓，然后將每行像素的開始點及結(jié)束點存儲在輪廓數(shù)據(jù)文件中。如果一行像素中的開始點及結(jié)束點都等于裁剪圖像的長度值，則說明該行中沒有有效像素。

如果在掃描裁剪圖像的過程中，沒有類似獲取到Alpha通道等標明無效像素的信息，則可以默認每一個像素點都是有效像素點，對裁剪圖像的全幅圖像進行處理。

在獲取到輪廓數(shù)據(jù)后，根據(jù)輪廓數(shù)據(jù)進行有針對的轉(zhuǎn)碼，不必進行全屏轉(zhuǎn)碼，只對輪廓內(nèi)的有效像素進行轉(zhuǎn)碼。根據(jù)輪廓數(shù)據(jù)對裁剪圖像進行轉(zhuǎn)碼生成編碼需要的YUV文件，再將得到的YUV文件輸入到編碼器中進行壓縮形成最終的視頻文件。

在視頻的播放過程中先對視頻文件進行解壓操作得到Y(jié)UV圖像。

再依據(jù)輪廓數(shù)據(jù)文件中的輪廓的有效像素的標示進行相應(yīng)YUV圖像轉(zhuǎn)碼得到裁剪圖像，每一行均會根據(jù)輪廓數(shù)據(jù)文件中標示的起始以及結(jié)束點進行轉(zhuǎn)碼，能夠極大的提升轉(zhuǎn)碼效率。

之后，獲取空間位置數(shù)據(jù)，根據(jù)空間位置數(shù)據(jù)對轉(zhuǎn)碼后的裁剪圖像進行最終顯示。具體是：在獲取到裁剪圖像后，會根據(jù)每一幀的空間位置數(shù)據(jù)進行顯示還原，如圖11所示，該裁剪圖像對應(yīng)的空間位置數(shù)據(jù)為向量(10，50)，按照(10，50)進行位置還原后得到最終顯示的視頻圖像，需要說明的是，圖11中的里面的裁剪圖像的矩形框線是用來說明裁剪圖像的邊界，并不會顯示在視頻圖像中。

從圖11可以看出，圖像通過本發(fā)明實施例中的視頻圖像編碼方法處理后，在視頻圖像解碼播放的時候又能完整的恢復回來，顯示效果和現(xiàn)有技術(shù)中的全幅圖像處理一樣，但是采用本發(fā)明實施例中的方法，能夠降低圖像處理中的像素量提升處理效率。

如圖圖8至圖11中的圖像，圖像紋理刷新從512*480降為了352*420，紋理刷新降低了30％，提升了刷新速度。

通過本發(fā)明實施例中的技術(shù)方案，在視頻壓制中的轉(zhuǎn)碼、壓碼以及視頻播放中的解碼、轉(zhuǎn)碼操作處理都因為處理像素量的減少，性能得到極大的提升。處理像素量的減少是因為由于輪廓數(shù)據(jù)文件以及空間位置文件，指明了一幅圖像的有效像素，只對圖像中的有效像素進行處理。

本發(fā)明實施例中的方案，在移動客戶端平臺：安卓(Android)平臺以及IOS平臺，以及嵌入式平臺(Arm平臺以及X86平臺上)上性能提升非常明顯。在Android中，如圖8至圖11中的示例圖像每一幀圖像從512*480的長寬處理降為了352*420長寬的處理，使得編碼、解碼以及顯示刷新像素量減少了30％，而壓制以及視頻播放中的轉(zhuǎn)碼像素處理量減少了75％，處理速度提升了3倍。

以上是對本發(fā)明實施例中的方法進行的介紹，下面從功能模塊的角度對本發(fā)明實施例中的視頻圖像編碼裝置以及視頻圖像解碼裝置進行介紹。

本發(fā)明實施例提供的視頻圖像編碼裝置的功能模塊結(jié)構(gòu)如圖12所示，該裝置具體實現(xiàn)對應(yīng)于上述圖1至圖11所提供的視頻圖像編碼方法的功能。所述功能可以通過硬件實現(xiàn)，也可以通過硬件執(zhí)行相應(yīng)的軟件程序?qū)崿F(xiàn)。硬件和軟件包括一個或多個與上述功能相對應(yīng)的單元模塊，所述單元模塊可以是軟件和/或硬件。

具體的，該視頻圖像編碼裝置包括：

獲取單元1201，用于獲取視頻源文件中的多幀視頻幀圖像；

圖像裁剪單元1202，用于針對多幀視頻幀圖像中的目標視頻幀圖像，確定目標視頻幀圖像的裁剪圖像，裁剪圖像包括目標視頻幀圖像中的有效像素，目標視頻幀圖像為多幀視頻幀圖像中的任意一幀視頻幀圖像；

輪廓數(shù)據(jù)生成單元1203，用于對裁剪圖像進行輪廓掃描生成裁剪圖像的輪廓數(shù)據(jù)；

圖像轉(zhuǎn)碼單元1204，用于根據(jù)輪廓數(shù)據(jù)對裁剪圖像進行轉(zhuǎn)碼得到轉(zhuǎn)碼后的圖像；

圖像壓縮單元1205，用于對轉(zhuǎn)碼后的圖像進行壓縮得到目標視頻幀圖像對應(yīng)的壓縮圖像。

在一些具體的實施例中，該裝置還包括：

空間位置確定單元1206，用于確定裁剪圖像在目標視頻幀圖像中的空間位置得到裁剪圖像的空間位置數(shù)據(jù)；

存儲單元1207，用于保存壓縮圖像、裁剪圖像的輪廓數(shù)據(jù)和裁剪圖像的空間位置數(shù)據(jù)。

在一些具體的實施例中，圖像裁剪單元1202，具體用于根據(jù)多幀視頻幀圖像中各視頻幀圖像的有效像素點確定裁剪矩形，根據(jù)裁剪矩形確定目標視頻幀圖像的裁剪圖像，裁剪圖像與裁剪矩形等長等寬。

在一些具體的實施例中，圖像裁剪單元1202，具體用于針對多幀視頻幀圖像中的每一幀視頻幀圖像，獲取該視頻幀圖像的有效矩形，有效矩形包括該視頻幀圖像的有效像素點的最小矩形區(qū)域，從多幀視頻幀圖像的各視頻幀圖像的有效矩形中確定裁剪矩形，裁剪矩形的寬度值為各視頻幀圖像的有效矩形的寬度值中的最大寬度值，裁剪矩形的長度值為各視頻幀圖像的有效矩形中的長度值中的最大的長度值；根據(jù)裁剪矩形確定目標視頻幀圖像的裁剪圖像，裁剪圖像與裁剪矩形等長等寬。

在一些具體的實施例中，空間位置確定單元1206，具體用于計算裁剪圖像在目標視頻幀圖像中的偏移向量，偏移向量為裁剪圖像在目標視頻幀圖像中的空間位置數(shù)據(jù)。

在一些具體的實施例中，輪廓數(shù)據(jù)生成單元1203，具體用于逐行掃描裁剪圖像，記錄每行的有效像素在裁剪圖像中的開始位置點和結(jié)束位置點，裁剪圖像的每行的有效像素在裁剪圖像中的開始位置點和結(jié)束位置點為裁剪圖像的輪廓數(shù)據(jù)。

在一些具體的實施例中，圖像轉(zhuǎn)碼單元1204，具體用于對輪廓數(shù)據(jù)對應(yīng)的輪廓以內(nèi)的像素進行轉(zhuǎn)碼得到轉(zhuǎn)碼后的圖像。

本發(fā)明實施例提供的視頻圖像解碼裝置的功能模塊結(jié)構(gòu)如圖13所示，該裝置具體實現(xiàn)對應(yīng)于上述圖1至圖11所提供的視頻圖像解碼方法的功能。所述功能可以通過硬件實現(xiàn)，也可以通過硬件執(zhí)行相應(yīng)的軟件程序?qū)崿F(xiàn)。硬件和軟件包括一個或多個與上述功能相對應(yīng)的單元模塊，所述單元模塊可以是軟件和/或硬件。

具體的，該視頻圖像解碼裝置包括：

解碼單元1301，用于對視頻文件進行解碼得到解碼后的圖像；

轉(zhuǎn)碼單元1302，用于獲取輪廓數(shù)據(jù)，根據(jù)輪廓數(shù)據(jù)對解碼后的圖像進行轉(zhuǎn)碼得到裁剪圖像；

視頻圖像生成單元1303，用于獲取裁剪圖像的空間位置數(shù)據(jù)，根據(jù)空間位置數(shù)據(jù)和裁剪圖像生成視頻圖像，空間位置數(shù)據(jù)指示裁剪圖像在視頻圖像中的空間位置。

在一些具體的實施例中，輪廓數(shù)據(jù)包括每行的有效像素的開始位置點和結(jié)束位置點；

轉(zhuǎn)碼單元1302，具體用于針對解碼后的圖像中的每行的像素，對從該行對應(yīng)的開始位置點到結(jié)束位置點中間的像素進行轉(zhuǎn)碼，得到裁剪圖像。

本發(fā)明實施例中的視頻圖像編碼裝置及視頻圖像解碼裝置可以以一個終端設(shè)備(例如：計算機)的形式存在。該發(fā)明的終端設(shè)備，包括臺式計算機、手持設(shè)備、車載設(shè)備、可穿戴設(shè)備，以及各種形式的用戶設(shè)備。手持設(shè)備可以為包括手機、平板電腦、PDA(Personal Digital Assistant，個人數(shù)字助理)、等任意終端設(shè)備。

圖14是本發(fā)明實施例提供的一種終端設(shè)備的結(jié)構(gòu)示意圖，該終端設(shè)備14可因配置或性能不同而產(chǎn)生比較大的差異，可以包括處理器(central processing units，CPU)1410和存儲器1450。其中，存儲器1450上存儲有一個或一個以上存儲應(yīng)用程序、數(shù)據(jù)和操作系統(tǒng)，存儲在存儲器1450的程序可以包括一個或一個以上模塊，每個模塊包括一系列指令操作。具體的，存儲器1450中存儲了游戲應(yīng)用程序。

處理器1410與存儲器1450通信，處理器1410調(diào)用存儲在所述存儲器1450中的視頻圖像編碼方法和視頻圖像解碼方法，以實現(xiàn)上述圖1至圖11所描述的方案。

此外，本發(fā)明還提供一種計算機存儲介質(zhì)，該介質(zhì)存儲有應(yīng)用程序，該程序執(zhí)行時包括上述視頻圖像編碼方法和視頻圖像解碼方法(圖1到圖11所示的實施例)中的部分或者全部步驟。

所屬領(lǐng)域的技術(shù)人員可以清楚地了解到，為描述的方便和簡潔，上述描述的系統(tǒng)，裝置和單元的具體工作過程，可以參考前述方法實施例中的對應(yīng)過程，在此不再贅述。

在本申請所提供的幾個實施例中，應(yīng)該理解到，所揭露的系統(tǒng)，裝置和方法，可以通過其它的方式實現(xiàn)。例如，以上所描述的裝置實施例僅僅是示意性的，例如，所述單元的劃分，僅僅為一種邏輯功能劃分，實際實現(xiàn)時可以有另外的劃分方式，例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng)，或一些特征可以忽略，或不執(zhí)行。另一點，所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口，裝置或單元的間接耦合或通信連接，可以是電性，機械或其它的形式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位于一個地方，或者也可以分布到多個網(wǎng)絡(luò)單元上?？梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。

另外，在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中，也可以是各個單元單獨物理存在，也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn)，也可以采用軟件功能單元的形式實現(xiàn)。

所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時，可以存儲在一個計算機可讀取存儲介質(zhì)中?；谶@樣的理解，本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來，該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中，包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機，服務(wù)器，或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括：U盤、移動硬盤、只讀存儲器(ROM，Read-Only Memory)、隨機存取存儲器(RAM，Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

以上所述，以上實施例僅用以說明本發(fā)明的技術(shù)方案，而非對其限制；盡管參照前述實施例對本發(fā)明進行了詳細的說明，本領(lǐng)域的普通技術(shù)人員應(yīng)當理解：其依然可以對前述各實施例所記載的技術(shù)方案進行修改，或者對其中部分技術(shù)特征進行等同替換；而這些修改或者替換，并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和范圍。

完整全部詳細技術(shù)資料下載

當前第1頁1 2 3

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：楊帆;荊彥青;魏學峰;曹文升;耿天平;
技術(shù)所有人：騰訊科技（深圳）有限公司;
我是此專利的發(fā)明人

上一篇：一種提高產(chǎn)仔的母豬飼料的制作方法與工藝
上一篇：折疊宿舍梯的制作方法與工藝

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

圖像編解碼相關(guān)技術(shù)

圖像編解碼基礎(chǔ)知識相關(guān)技術(shù)

圖像收發(fā)裝置相關(guān)技術(shù)

互聯(lián)網(wǎng)音頻編解碼裝置相關(guān)技術(shù)

asn1編解碼實現(xiàn)方法相關(guān)技術(shù)

鋼軌搬運裝置海關(guān)編碼相關(guān)技術(shù)

液壓沖洗裝置海關(guān)編碼相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

視頻圖像編碼、解碼方法及裝置與流程

視頻圖像編碼、解碼方法及裝置與流程