用于視頻處理的方法、裝置和介質(zhì)與流程

文檔序號(hào)：42041739發(fā)布日期：2025-05-30 17:41閱讀：15來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>電子通信裝置的制造及其應(yīng)用技術(shù)

本公開(kāi)的實(shí)施例一般涉及視頻處理技術(shù)，更具體地涉及用于圖像/視頻編解碼的基于神經(jīng)網(wǎng)絡(luò)環(huán)路濾波的率失真優(yōu)化。

背景技術(shù)：

1、如今，數(shù)字視頻能力正被應(yīng)用于人們生活的各個(gè)方面。針對(duì)視頻編碼/解碼，已經(jīng)提出了多種類(lèi)型的視頻壓縮技術(shù)，諸如mpeg-2、mpeg-4、itu-th.263、itu-th.264/mpeg-4第10部分高級(jí)視頻編解碼(avc)、itu-th.265高效視頻編解碼(hevc)標(biāo)準(zhǔn)、多功能視頻編解碼(vvc)標(biāo)準(zhǔn)。然而，總體上期望進(jìn)一步提高視頻編解碼技術(shù)的編解碼效率。

技術(shù)實(shí)現(xiàn)思路

1、本公開(kāi)的實(shí)施例提供一種用于視頻處理的解決方案。

2、在第一方面，提出了一種用于視頻處理的方法。該方法包括：針對(duì)視頻的視頻單元與視頻單元的比特流之間的轉(zhuǎn)換，確定在視頻單元的過(guò)程期間是否應(yīng)用用于神經(jīng)網(wǎng)絡(luò)(nn)濾波的至少一個(gè)nn模型；基于該確定，通過(guò)將過(guò)程應(yīng)用于視頻單元來(lái)處理視頻單元；以及基于經(jīng)處理的視頻單元執(zhí)行轉(zhuǎn)換。以此方式，在rdo過(guò)程期間考慮由于nn濾波器引起的減少失真的影響，從而改善編解碼性能。

3、在第二方面，提出了一種用于視頻處理的裝置。該裝置包括處理器和其上具有指令的非暫態(tài)存儲(chǔ)器。該指令在由處理器執(zhí)行時(shí)使處理器執(zhí)行根據(jù)本公開(kāi)的第一方面的方法。

4、在第三方面，提出了一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。該非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)指令，該指令使處理器執(zhí)行根據(jù)本公開(kāi)的第一方面的方法。

5、在第四方面，提出了另一種非暫態(tài)計(jì)算機(jī)可讀記錄介質(zhì)。該非暫態(tài)計(jì)算機(jī)可讀記錄介質(zhì)存儲(chǔ)視頻的由用于視頻處理的裝置執(zhí)行的方法生成的比特流。該方法包括：確定在視頻的視頻單元的過(guò)程期間是否應(yīng)用用于神經(jīng)網(wǎng)絡(luò)(nn)濾波的至少一個(gè)nn模型；基于該確定，通過(guò)將過(guò)程應(yīng)用于視頻單元來(lái)處理視頻單元；以及基于經(jīng)處理的視頻單元生成比特流。

6、在第五方面，提出了一種用于存儲(chǔ)視頻的比特流的方法。該方法包括：確定在視頻的視頻單元的過(guò)程期間是否應(yīng)用用于神經(jīng)網(wǎng)絡(luò)(nn)濾波的至少一個(gè)nn模型；基于該確定，通過(guò)將過(guò)程應(yīng)用于視頻單元來(lái)處理視頻單元；基于經(jīng)處理的視頻單元生成比特流；以及將比特流存儲(chǔ)在非暫態(tài)計(jì)算機(jī)可讀記錄介質(zhì)中。

7、提供本
技術(shù)實(shí)現(xiàn)要素：
以引入簡(jiǎn)化形式的概念的選擇，這將在以下具體實(shí)施方式中進(jìn)一步描述。本發(fā)明內(nèi)容不旨在標(biāo)識(shí)所要求保護(hù)的主題的關(guān)鍵特征或基本特征，也不旨在用于限制所要求保護(hù)的主題的范圍。

技術(shù)特征：

1.一種視頻處理的方法，包括：

2.根據(jù)權(quán)利要求1所述的方法，其中所述至少一個(gè)nn模型被包括在編碼器中。

3.根據(jù)權(quán)利要求1所述的方法，其中所述過(guò)程包括率失真優(yōu)化(rdo)過(guò)程，并且所述至少一個(gè)nn模型被用于所述視頻單元的所述rdo過(guò)程中。

4.根據(jù)權(quán)利要求1所述的方法，其中所述至少一個(gè)nn模型未被包括在兼容解碼器中。

5.根據(jù)權(quán)利要求1所述的方法，其中所述至少一個(gè)nn模型比被用于兼容解碼器中的nn濾波的另一nn濾波器模型更簡(jiǎn)單。

6.根據(jù)權(quán)利要求1所述的方法，其中所述至少一個(gè)nn模型與編碼器中的另一濾波器模型組合。

7.根據(jù)權(quán)利要求6所述的方法，其中所述至少一個(gè)nn模型不同于nn濾波器。

8.根據(jù)權(quán)利要求6所述的方法，其中所述至少一個(gè)nn模型在所述另一濾波器模型之前被應(yīng)用，或者

9.根據(jù)權(quán)利要求6所述的方法，其中所述另一濾波器模型包括以下至少一項(xiàng)：

10.根據(jù)權(quán)利要求6所述的方法，其中所述至少一個(gè)nn模型或所述另一濾波器模型中的至少一項(xiàng)根據(jù)預(yù)定義順序或自適應(yīng)順序被應(yīng)用。

11.根據(jù)權(quán)利要求10所述的方法，其中所述預(yù)定義順序包括依次應(yīng)用去方塊濾波器、cnn濾波器模型、sao濾波器和alf濾波器。

12.根據(jù)權(quán)利要求6所述的方法，其中應(yīng)用所述至少一個(gè)nn模型或所述另一濾波器模型中的至少一項(xiàng)的順序取決于以下至少一項(xiàng)：

13.根據(jù)權(quán)利要求6所述的方法，其中是否利用所述至少一個(gè)nn模型或所述另一濾波器模型中的至少一項(xiàng)取決于以下至少一項(xiàng)：

14.根據(jù)權(quán)利要求6所述的方法，其中利用所述至少一個(gè)nn模型或所述另一濾波器模型中的至少一項(xiàng)的方法取決于以下至少一項(xiàng)：

15.根據(jù)權(quán)利要求1所述的方法，其中所述過(guò)程包括模式?jīng)Q策過(guò)程，并且所述模式?jīng)Q策過(guò)程取決于所述至少一個(gè)nn濾波器模型。

16.根據(jù)權(quán)利要求15所述的方法，其中所述模式?jīng)Q策過(guò)程是根據(jù)歸因于所述至少一個(gè)nn模型的經(jīng)濾波的重建信息的。

17.根據(jù)權(quán)利要求15所述的方法，其中所述至少一個(gè)nn模型在確定所述視頻單元的最佳幀內(nèi)預(yù)測(cè)模式時(shí)被使用。

18.根據(jù)權(quán)利要求15所述的方法，其中所述至少一個(gè)nn模型在確定所述視頻單元的最佳編解碼幀內(nèi)方法時(shí)被使用。

19.根據(jù)權(quán)利要求15所述的方法，其中所述至少一個(gè)nn模型與幀間模式選擇的rdo一起被使用。

20.根據(jù)權(quán)利要求15所述的方法，其中所述至少一個(gè)nn模型在確定所述視頻單元的最佳編解碼幀間方法時(shí)被使用。

21.根據(jù)權(quán)利要求15所述的方法，其中所述至少一個(gè)nn模型與分割模式選擇的rdo一起被使用。

22.根據(jù)權(quán)利要求15所述的方法，其中所述至少一個(gè)nn模型與變換核選擇的rdo一起被使用。

23.根據(jù)權(quán)利要求15所述的方法，其中所述至少一個(gè)nn模型在確定包括所述視頻單元的幀內(nèi)和幀間方法的最佳編解碼方法時(shí)被使用。

24.根據(jù)權(quán)利要求15所述的方法，其中無(wú)論何時(shí)失真被計(jì)算，所述至少一個(gè)nn模型都被使用。

25.根據(jù)權(quán)利要求15所述的方法，其中每當(dāng)失真被計(jì)算時(shí)，所述至少一個(gè)nn模型被使用。

26.根據(jù)權(quán)利要求15所述的方法，其中當(dāng)失真是利用矩陣被計(jì)算時(shí)，所述至少一個(gè)nn模型不被使用。

27.根據(jù)權(quán)利要求1所述的方法，其中所述過(guò)程包括模式?jīng)Q策過(guò)程，并且在所述模式?jīng)Q策過(guò)程中計(jì)算的失真或成本被調(diào)整，使得nn濾波過(guò)程的影響被考慮。

28.根據(jù)權(quán)利要求27所述的方法，其中所述失真或成本根據(jù)矩陣被計(jì)算。

29.根據(jù)權(quán)利要求27所述的方法，其中所述過(guò)程包括nn濾波過(guò)程，并且所述方法還包括：

30.根據(jù)權(quán)利要求27所述的方法，還包括：

31.根據(jù)權(quán)利要求27所述的方法，其中所述過(guò)程包括rdo過(guò)程，并且

32.根據(jù)權(quán)利要求27所述的方法，還包括：

33.根據(jù)權(quán)利要求32所述的方法，其中經(jīng)濾波的重建樣點(diǎn)由所述至少一個(gè)nn模型進(jìn)行濾波。

34.根據(jù)權(quán)利要求32所述的方法，其中經(jīng)濾波的重建樣點(diǎn)由所述另一濾波器模型進(jìn)行濾波。

35.根據(jù)權(quán)利要求32所述的方法，其中經(jīng)濾波的重建樣點(diǎn)由所述至少一個(gè)nn模型或所述另一濾波器模型中的至少一項(xiàng)進(jìn)行濾波。

36.根據(jù)權(quán)利要求32所述的方法，其中所述失真的函數(shù)被調(diào)用，并且所述函數(shù)的輸出被設(shè)置為與在所述rdo過(guò)程期間要被檢查的當(dāng)前模式相關(guān)聯(lián)的真實(shí)失真。

37.根據(jù)權(quán)利要求27所述的方法，還包括：

38.根據(jù)權(quán)利要求27所述的方法，其中所述過(guò)程包括rdo過(guò)程，并且

39.根據(jù)權(quán)利要求27所述的方法，其中所述失真首先在未經(jīng)濾波的重建與原始樣點(diǎn)之間被計(jì)算，然后被按因子進(jìn)行縮放。

40.根據(jù)權(quán)利要求39所述的方法，其中所述因子是0到1.0之間的常數(shù)，或者

41.根據(jù)權(quán)利要求1所述的方法，其中所述過(guò)程包括rdo過(guò)程，并且

42.根據(jù)權(quán)利要求41所述的方法，其中所述第一濾波過(guò)程中的第一濾波器模型與所述第二濾波過(guò)程中的第二濾波器模型不同。

43.根據(jù)權(quán)利要求41所述的方法，其中所述第一濾波過(guò)程中的濾波器模型的數(shù)目與所述第二濾波過(guò)程中的濾波器模型的數(shù)目不同。

44.根據(jù)權(quán)利要求41所述的方法，其中所述第一濾波過(guò)程的第一網(wǎng)絡(luò)結(jié)構(gòu)與所述第二濾波過(guò)程的第二網(wǎng)絡(luò)結(jié)構(gòu)不同。

45.根據(jù)權(quán)利要求41所述的方法，其中在所述rdo過(guò)程期間的所述第一濾波過(guò)程僅被應(yīng)用于所述視頻單元的子區(qū)域。

46.根據(jù)權(quán)利要求45所述的方法，其中所述第一濾波過(guò)程僅被應(yīng)用于所述視頻單元的邊界樣點(diǎn)。

47.根據(jù)權(quán)利要求45所述的方法，其中所述第一濾波過(guò)程僅被應(yīng)用于所述視頻單元的內(nèi)部樣點(diǎn)。

48.根據(jù)權(quán)利要求41所述的方法，其中在所述rdo過(guò)程期間的所述第一濾波過(guò)程僅被應(yīng)用于所述視頻單元的經(jīng)下采樣版本。

49.根據(jù)權(quán)利要求1所述的方法，其中所述過(guò)程包括rdo過(guò)程，并且

50.根據(jù)權(quán)利要求49所述的方法，其中所述殘差塊的數(shù)目與所述解碼器的相同。

51.根據(jù)權(quán)利要求1所述的方法，其中在rdo過(guò)程中使用的所述至少一個(gè)nn模型是在解碼器處使用的nn模型的簡(jiǎn)化版本。

52.根據(jù)權(quán)利要求51所述的方法，其中所述至少一個(gè)nn模型的第一深度與在所述解碼器處使用的所述nn模型的第二深度不同。

53.根據(jù)權(quán)利要求52所述的方法，其中所述第一深度比所述第二深度更淺。

54.根據(jù)權(quán)利要求51所述的方法，其中所述至少一個(gè)nn模型的第一特征圖與在所述解碼器處使用的所述nn模型的第二特征圖不同。

55.根據(jù)權(quán)利要求54所述的方法，其中所述rdo過(guò)程中的所述至少一個(gè)nn模型具有比在所述解碼器處使用的所述nn模型更少的特征圖。

56.根據(jù)權(quán)利要求51所述的方法，其中所述至少一個(gè)nn模型的殘差塊的數(shù)目與所述解碼器處的所述nn模型的殘差塊的數(shù)目不同。

57.根據(jù)權(quán)利要求56所述的方法，其中所述至少一個(gè)nn模型的殘差塊的數(shù)目小于所述解碼器處的所述nn模型的殘差塊的數(shù)目。

58.根據(jù)權(quán)利要求56所述的方法，其中所述至少一個(gè)nn模型的殘差塊的所述數(shù)目是以下之一：1、2、3、4、5、6。

59.根據(jù)權(quán)利要求51所述的方法，其中所述至少一個(gè)nn模型的卷積核與所述解碼器處的所述nn模型的卷積核不同。

60.根據(jù)權(quán)利要求1所述的方法，其中所述過(guò)程包括rdo過(guò)程，并且

61.根據(jù)權(quán)利要求60所述的方法，其中是否和/或如何在所述rdo過(guò)程中使用所述至少一個(gè)nn模型取決于以下至少一項(xiàng)：

62.根據(jù)權(quán)利要求1至61中任一項(xiàng)所述的方法，其中所述轉(zhuǎn)換包括將所述視頻單元編碼到所述比特流中。

63.根據(jù)權(quán)利要求1至61中任一項(xiàng)所述的方法，其中所述轉(zhuǎn)換包括從所述比特流解碼所述視頻單元。

64.一種用于視頻處理的裝置，包括處理器和其上具有指令的非暫態(tài)存儲(chǔ)器，其中所述指令在由所述處理器執(zhí)行時(shí)使所述處理器執(zhí)行根據(jù)權(quán)利要求1至63中任一項(xiàng)所述的方法。

65.一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，存儲(chǔ)有指令，所述指令使處理器執(zhí)行根據(jù)權(quán)利要求1至63中任一項(xiàng)所述的方法。

66.一種非暫態(tài)計(jì)算機(jī)可讀記錄介質(zhì)，存儲(chǔ)視頻的由用于視頻處理的裝置執(zhí)行的方法生成的比特流，其中所述方法包括：

67.一種用于存儲(chǔ)視頻的比特流的方法，包括：

技術(shù)總結(jié)
本公開(kāi)的實(shí)施例提供一種用于視頻處理的解決方案。提出了一種用于視頻處理的方法。該方法包括：針對(duì)視頻的視頻單元與視頻單元的比特流之間的轉(zhuǎn)換，確定在視頻單元的過(guò)程期間是否應(yīng)用用于神經(jīng)網(wǎng)絡(luò)(NN)濾波的至少一個(gè)NN模型；基于該確定，通過(guò)將過(guò)程應(yīng)用于視頻單元來(lái)處理視頻單元；以及基于經(jīng)處理的視頻單元執(zhí)行轉(zhuǎn)換。

技術(shù)研發(fā)人員：李俊儒,張凱,張莉
受保護(hù)的技術(shù)使用者：抖音視界有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/29

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李俊儒,張凱,張莉
技術(shù)所有人：抖音視界有限公司
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢(xún)。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

用于視頻處理的方法、裝置和介質(zhì)與流程

用于視頻處理的方法、裝置和介質(zhì)與流程