亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

用于視頻處理的方法、裝置和介質(zhì)與流程

文檔序號(hào):42041739發(fā)布日期:2025-05-30 17:41閱讀:15來(lái)源:國(guó)知局

本公開(kāi)的實(shí)施例一般涉及視頻處理技術(shù),更具體地涉及用于圖像/視頻編解碼的基于神經(jīng)網(wǎng)絡(luò)環(huán)路濾波的率失真優(yōu)化。


背景技術(shù):

1、如今,數(shù)字視頻能力正被應(yīng)用于人們生活的各個(gè)方面。針對(duì)視頻編碼/解碼,已經(jīng)提出了多種類(lèi)型的視頻壓縮技術(shù),諸如mpeg-2、mpeg-4、itu-th.263、itu-th.264/mpeg-4第10部分高級(jí)視頻編解碼(avc)、itu-th.265高效視頻編解碼(hevc)標(biāo)準(zhǔn)、多功能視頻編解碼(vvc)標(biāo)準(zhǔn)。然而,總體上期望進(jìn)一步提高視頻編解碼技術(shù)的編解碼效率。


技術(shù)實(shí)現(xiàn)思路

1、本公開(kāi)的實(shí)施例提供一種用于視頻處理的解決方案。

2、在第一方面,提出了一種用于視頻處理的方法。該方法包括:針對(duì)視頻的視頻單元與視頻單元的比特流之間的轉(zhuǎn)換,確定在視頻單元的過(guò)程期間是否應(yīng)用用于神經(jīng)網(wǎng)絡(luò)(nn)濾波的至少一個(gè)nn模型;基于該確定,通過(guò)將過(guò)程應(yīng)用于視頻單元來(lái)處理視頻單元;以及基于經(jīng)處理的視頻單元執(zhí)行轉(zhuǎn)換。以此方式,在rdo過(guò)程期間考慮由于nn濾波器引起的減少失真的影響,從而改善編解碼性能。

3、在第二方面,提出了一種用于視頻處理的裝置。該裝置包括處理器和其上具有指令的非暫態(tài)存儲(chǔ)器。該指令在由處理器執(zhí)行時(shí)使處理器執(zhí)行根據(jù)本公開(kāi)的第一方面的方法。

4、在第三方面,提出了一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。該非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)指令,該指令使處理器執(zhí)行根據(jù)本公開(kāi)的第一方面的方法。

5、在第四方面,提出了另一種非暫態(tài)計(jì)算機(jī)可讀記錄介質(zhì)。該非暫態(tài)計(jì)算機(jī)可讀記錄介質(zhì)存儲(chǔ)視頻的由用于視頻處理的裝置執(zhí)行的方法生成的比特流。該方法包括:確定在視頻的視頻單元的過(guò)程期間是否應(yīng)用用于神經(jīng)網(wǎng)絡(luò)(nn)濾波的至少一個(gè)nn模型;基于該確定,通過(guò)將過(guò)程應(yīng)用于視頻單元來(lái)處理視頻單元;以及基于經(jīng)處理的視頻單元生成比特流。

6、在第五方面,提出了一種用于存儲(chǔ)視頻的比特流的方法。該方法包括:確定在視頻的視頻單元的過(guò)程期間是否應(yīng)用用于神經(jīng)網(wǎng)絡(luò)(nn)濾波的至少一個(gè)nn模型;基于該確定,通過(guò)將過(guò)程應(yīng)用于視頻單元來(lái)處理視頻單元;基于經(jīng)處理的視頻單元生成比特流;以及將比特流存儲(chǔ)在非暫態(tài)計(jì)算機(jī)可讀記錄介質(zhì)中。

7、提供本
技術(shù)實(shí)現(xiàn)要素:
以引入簡(jiǎn)化形式的概念的選擇,這將在以下具體實(shí)施方式中進(jìn)一步描述。本發(fā)明內(nèi)容不旨在標(biāo)識(shí)所要求保護(hù)的主題的關(guān)鍵特征或基本特征,也不旨在用于限制所要求保護(hù)的主題的范圍。



技術(shù)特征:

1.一種視頻處理的方法,包括:

2.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個(gè)nn模型被包括在編碼器中。

3.根據(jù)權(quán)利要求1所述的方法,其中所述過(guò)程包括率失真優(yōu)化(rdo)過(guò)程,并且所述至少一個(gè)nn模型被用于所述視頻單元的所述rdo過(guò)程中。

4.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個(gè)nn模型未被包括在兼容解碼器中。

5.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個(gè)nn模型比被用于兼容解碼器中的nn濾波的另一nn濾波器模型更簡(jiǎn)單。

6.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個(gè)nn模型與編碼器中的另一濾波器模型組合。

7.根據(jù)權(quán)利要求6所述的方法,其中所述至少一個(gè)nn模型不同于nn濾波器。

8.根據(jù)權(quán)利要求6所述的方法,其中所述至少一個(gè)nn模型在所述另一濾波器模型之前被應(yīng)用,或者

9.根據(jù)權(quán)利要求6所述的方法,其中所述另一濾波器模型包括以下至少一項(xiàng):

10.根據(jù)權(quán)利要求6所述的方法,其中所述至少一個(gè)nn模型或所述另一濾波器模型中的至少一項(xiàng)根據(jù)預(yù)定義順序或自適應(yīng)順序被應(yīng)用。

11.根據(jù)權(quán)利要求10所述的方法,其中所述預(yù)定義順序包括依次應(yīng)用去方塊濾波器、cnn濾波器模型、sao濾波器和alf濾波器。

12.根據(jù)權(quán)利要求6所述的方法,其中應(yīng)用所述至少一個(gè)nn模型或所述另一濾波器模型中的至少一項(xiàng)的順序取決于以下至少一項(xiàng):

13.根據(jù)權(quán)利要求6所述的方法,其中是否利用所述至少一個(gè)nn模型或所述另一濾波器模型中的至少一項(xiàng)取決于以下至少一項(xiàng):

14.根據(jù)權(quán)利要求6所述的方法,其中利用所述至少一個(gè)nn模型或所述另一濾波器模型中的至少一項(xiàng)的方法取決于以下至少一項(xiàng):

15.根據(jù)權(quán)利要求1所述的方法,其中所述過(guò)程包括模式?jīng)Q策過(guò)程,并且所述模式?jīng)Q策過(guò)程取決于所述至少一個(gè)nn濾波器模型。

16.根據(jù)權(quán)利要求15所述的方法,其中所述模式?jīng)Q策過(guò)程是根據(jù)歸因于所述至少一個(gè)nn模型的經(jīng)濾波的重建信息的。

17.根據(jù)權(quán)利要求15所述的方法,其中所述至少一個(gè)nn模型在確定所述視頻單元的最佳幀內(nèi)預(yù)測(cè)模式時(shí)被使用。

18.根據(jù)權(quán)利要求15所述的方法,其中所述至少一個(gè)nn模型在確定所述視頻單元的最佳編解碼幀內(nèi)方法時(shí)被使用。

19.根據(jù)權(quán)利要求15所述的方法,其中所述至少一個(gè)nn模型與幀間模式選擇的rdo一起被使用。

20.根據(jù)權(quán)利要求15所述的方法,其中所述至少一個(gè)nn模型在確定所述視頻單元的最佳編解碼幀間方法時(shí)被使用。

21.根據(jù)權(quán)利要求15所述的方法,其中所述至少一個(gè)nn模型與分割模式選擇的rdo一起被使用。

22.根據(jù)權(quán)利要求15所述的方法,其中所述至少一個(gè)nn模型與變換核選擇的rdo一起被使用。

23.根據(jù)權(quán)利要求15所述的方法,其中所述至少一個(gè)nn模型在確定包括所述視頻單元的幀內(nèi)和幀間方法的最佳編解碼方法時(shí)被使用。

24.根據(jù)權(quán)利要求15所述的方法,其中無(wú)論何時(shí)失真被計(jì)算,所述至少一個(gè)nn模型都被使用。

25.根據(jù)權(quán)利要求15所述的方法,其中每當(dāng)失真被計(jì)算時(shí),所述至少一個(gè)nn模型被使用。

26.根據(jù)權(quán)利要求15所述的方法,其中當(dāng)失真是利用矩陣被計(jì)算時(shí),所述至少一個(gè)nn模型不被使用。

27.根據(jù)權(quán)利要求1所述的方法,其中所述過(guò)程包括模式?jīng)Q策過(guò)程,并且在所述模式?jīng)Q策過(guò)程中計(jì)算的失真或成本被調(diào)整,使得nn濾波過(guò)程的影響被考慮。

28.根據(jù)權(quán)利要求27所述的方法,其中所述失真或成本根據(jù)矩陣被計(jì)算。

29.根據(jù)權(quán)利要求27所述的方法,其中所述過(guò)程包括nn濾波過(guò)程,并且所述方法還包括:

30.根據(jù)權(quán)利要求27所述的方法,還包括:

31.根據(jù)權(quán)利要求27所述的方法,其中所述過(guò)程包括rdo過(guò)程,并且

32.根據(jù)權(quán)利要求27所述的方法,還包括:

33.根據(jù)權(quán)利要求32所述的方法,其中經(jīng)濾波的重建樣點(diǎn)由所述至少一個(gè)nn模型進(jìn)行濾波。

34.根據(jù)權(quán)利要求32所述的方法,其中經(jīng)濾波的重建樣點(diǎn)由所述另一濾波器模型進(jìn)行濾波。

35.根據(jù)權(quán)利要求32所述的方法,其中經(jīng)濾波的重建樣點(diǎn)由所述至少一個(gè)nn模型或所述另一濾波器模型中的至少一項(xiàng)進(jìn)行濾波。

36.根據(jù)權(quán)利要求32所述的方法,其中所述失真的函數(shù)被調(diào)用,并且所述函數(shù)的輸出被設(shè)置為與在所述rdo過(guò)程期間要被檢查的當(dāng)前模式相關(guān)聯(lián)的真實(shí)失真。

37.根據(jù)權(quán)利要求27所述的方法,還包括:

38.根據(jù)權(quán)利要求27所述的方法,其中所述過(guò)程包括rdo過(guò)程,并且

39.根據(jù)權(quán)利要求27所述的方法,其中所述失真首先在未經(jīng)濾波的重建與原始樣點(diǎn)之間被計(jì)算,然后被按因子進(jìn)行縮放。

40.根據(jù)權(quán)利要求39所述的方法,其中所述因子是0到1.0之間的常數(shù),或者

41.根據(jù)權(quán)利要求1所述的方法,其中所述過(guò)程包括rdo過(guò)程,并且

42.根據(jù)權(quán)利要求41所述的方法,其中所述第一濾波過(guò)程中的第一濾波器模型與所述第二濾波過(guò)程中的第二濾波器模型不同。

43.根據(jù)權(quán)利要求41所述的方法,其中所述第一濾波過(guò)程中的濾波器模型的數(shù)目與所述第二濾波過(guò)程中的濾波器模型的數(shù)目不同。

44.根據(jù)權(quán)利要求41所述的方法,其中所述第一濾波過(guò)程的第一網(wǎng)絡(luò)結(jié)構(gòu)與所述第二濾波過(guò)程的第二網(wǎng)絡(luò)結(jié)構(gòu)不同。

45.根據(jù)權(quán)利要求41所述的方法,其中在所述rdo過(guò)程期間的所述第一濾波過(guò)程僅被應(yīng)用于所述視頻單元的子區(qū)域。

46.根據(jù)權(quán)利要求45所述的方法,其中所述第一濾波過(guò)程僅被應(yīng)用于所述視頻單元的邊界樣點(diǎn)。

47.根據(jù)權(quán)利要求45所述的方法,其中所述第一濾波過(guò)程僅被應(yīng)用于所述視頻單元的內(nèi)部樣點(diǎn)。

48.根據(jù)權(quán)利要求41所述的方法,其中在所述rdo過(guò)程期間的所述第一濾波過(guò)程僅被應(yīng)用于所述視頻單元的經(jīng)下采樣版本。

49.根據(jù)權(quán)利要求1所述的方法,其中所述過(guò)程包括rdo過(guò)程,并且

50.根據(jù)權(quán)利要求49所述的方法,其中所述殘差塊的數(shù)目與所述解碼器的相同。

51.根據(jù)權(quán)利要求1所述的方法,其中在rdo過(guò)程中使用的所述至少一個(gè)nn模型是在解碼器處使用的nn模型的簡(jiǎn)化版本。

52.根據(jù)權(quán)利要求51所述的方法,其中所述至少一個(gè)nn模型的第一深度與在所述解碼器處使用的所述nn模型的第二深度不同。

53.根據(jù)權(quán)利要求52所述的方法,其中所述第一深度比所述第二深度更淺。

54.根據(jù)權(quán)利要求51所述的方法,其中所述至少一個(gè)nn模型的第一特征圖與在所述解碼器處使用的所述nn模型的第二特征圖不同。

55.根據(jù)權(quán)利要求54所述的方法,其中所述rdo過(guò)程中的所述至少一個(gè)nn模型具有比在所述解碼器處使用的所述nn模型更少的特征圖。

56.根據(jù)權(quán)利要求51所述的方法,其中所述至少一個(gè)nn模型的殘差塊的數(shù)目與所述解碼器處的所述nn模型的殘差塊的數(shù)目不同。

57.根據(jù)權(quán)利要求56所述的方法,其中所述至少一個(gè)nn模型的殘差塊的數(shù)目小于所述解碼器處的所述nn模型的殘差塊的數(shù)目。

58.根據(jù)權(quán)利要求56所述的方法,其中所述至少一個(gè)nn模型的殘差塊的所述數(shù)目是以下之一:1、2、3、4、5、6。

59.根據(jù)權(quán)利要求51所述的方法,其中所述至少一個(gè)nn模型的卷積核與所述解碼器處的所述nn模型的卷積核不同。

60.根據(jù)權(quán)利要求1所述的方法,其中所述過(guò)程包括rdo過(guò)程,并且

61.根據(jù)權(quán)利要求60所述的方法,其中是否和/或如何在所述rdo過(guò)程中使用所述至少一個(gè)nn模型取決于以下至少一項(xiàng):

62.根據(jù)權(quán)利要求1至61中任一項(xiàng)所述的方法,其中所述轉(zhuǎn)換包括將所述視頻單元編碼到所述比特流中。

63.根據(jù)權(quán)利要求1至61中任一項(xiàng)所述的方法,其中所述轉(zhuǎn)換包括從所述比特流解碼所述視頻單元。

64.一種用于視頻處理的裝置,包括處理器和其上具有指令的非暫態(tài)存儲(chǔ)器,其中所述指令在由所述處理器執(zhí)行時(shí)使所述處理器執(zhí)行根據(jù)權(quán)利要求1至63中任一項(xiàng)所述的方法。

65.一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有指令,所述指令使處理器執(zhí)行根據(jù)權(quán)利要求1至63中任一項(xiàng)所述的方法。

66.一種非暫態(tài)計(jì)算機(jī)可讀記錄介質(zhì),存儲(chǔ)視頻的由用于視頻處理的裝置執(zhí)行的方法生成的比特流,其中所述方法包括:

67.一種用于存儲(chǔ)視頻的比特流的方法,包括:


技術(shù)總結(jié)
本公開(kāi)的實(shí)施例提供一種用于視頻處理的解決方案。提出了一種用于視頻處理的方法。該方法包括:針對(duì)視頻的視頻單元與視頻單元的比特流之間的轉(zhuǎn)換,確定在視頻單元的過(guò)程期間是否應(yīng)用用于神經(jīng)網(wǎng)絡(luò)(NN)濾波的至少一個(gè)NN模型;基于該確定,通過(guò)將過(guò)程應(yīng)用于視頻單元來(lái)處理視頻單元;以及基于經(jīng)處理的視頻單元執(zhí)行轉(zhuǎn)換。

技術(shù)研發(fā)人員:李俊儒,張凱,張莉
受保護(hù)的技術(shù)使用者:抖音視界有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/29
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1