本技術涉及音頻編解碼技術,尤其涉及一種場景音頻信號的解碼方法和裝置。
背景技術:
1、三維音頻技術是通過計算機、信號處理等方式對真實世界中聲音事件和三維聲場信息進行獲取、處理,傳輸和渲染回放的音頻技術。三維音頻使聲音具有強烈的空間感、包圍感及沉浸感,給人以“聲臨其境”的非凡聽覺體驗。其中,高階立體混響(higher?orderambisonics,hoa)技術具有在錄制、編碼與回放階段與揚聲器布局無關的性質(zhì)以及hoa格式數(shù)據(jù)的可旋轉(zhuǎn)回放特性,在進行三維音頻回放時具有更高的靈活性,因而也得到了更為廣泛的關注和研究。
2、為了實現(xiàn)更好的音頻聽覺效果,hoa技術需要大量的數(shù)據(jù)記錄更詳細的聲音場景的信息。雖然這種基于場景的三維音頻信號采樣和存儲更加利于音頻信號空間信息的保存和傳輸,但對于n階hoa信號來說,其對應的通道數(shù)為(n+1)2,隨著hoa階數(shù)的增加,將會產(chǎn)生更多的數(shù)據(jù),大量的數(shù)據(jù)可能造成傳輸和存儲的困難,因此需要對hoa信號進行編解碼。
3、相關技術可以通過對部分通道進行編解碼以節(jié)省碼流,提高編解碼效率,但是沒有考慮到暫態(tài)信號的處理,導致重建音頻信號的質(zhì)量下降,影響用戶的聽覺體驗。
技術實現(xiàn)思路
1、本技術提供一種場景音頻信號的解碼方法和裝置,以實現(xiàn)對場景音頻信號中的暫態(tài)信號的處理,提升重建場景音頻信號的質(zhì)量和用戶的聽覺體驗。
2、第一方面,本技術提供一種場景音頻信號的解碼方法,包括:獲取第一通道的重建信號,所述第一通道是重建場景音頻信號包含的c個通道中采用直接解碼處理的通道,c為正整數(shù);獲取第二通道的第一信號和暫態(tài)標識,所述第二通道是所述c個通道中沒有采用直接解碼處理的通道;當所述第二通道的暫態(tài)標識表示所述第二通道存在暫態(tài)信號時,獲取所述第一通道的重建信號和所述第一信號之間的互相關值;根據(jù)所述互相關值獲取所述第二通道的重建信號。
3、本技術實施例,解碼端基于第一通道的重建信號和第二通道的第一信號之間的互相關值,對存在暫態(tài)信號的通道的重建信號實現(xiàn)暫態(tài)恢復,從而可以實現(xiàn)對場景音頻信號中的暫態(tài)信號的處理,提升重建場景音頻信號的質(zhì)量和用戶的聽覺體驗。
4、第一通道是重建場景音頻信號包含的c個通道中采用直接解碼處理的通道,c為正整數(shù)。
5、第二通道是上述c個通道中沒有采用直接解碼處理的通道。直接解碼處理可以是解碼對信號本身進行編碼所得到的編碼數(shù)據(jù)的一種解碼方式。
6、解碼端可以通過解碼碼流以得到重建場景音頻信號。重建場景音頻信號包括c個通道的音頻信號,c為正整數(shù)。解碼端可以采用至少兩種解碼方法對碼流進行解碼,以得到前述c個通道的重建信號,采用至少兩種解碼方法包括直接解碼處理。
7、解碼端解碼碼流后得到的第一重建信號包括全部采用直接解碼處理的通道的音頻信號,上述第一通道的重建信號可以是第一重建信號中的任意一個通道的音頻信號,例如,當速率為768kbps時,1-9號通道中任意一個通道的音頻信號。
8、本技術實施例中,第一通道可以是重建場景音頻信號的c個通道中的w通道(即編號為1的通道)。
9、第二通道可以是c個通道中沒有采用直接解碼處理的通道,亦即,第二通道可以是c個通道中采用空間解碼處理或解相關處理的通道。例如,當速率為256kbps時,采用空間解碼處理的通道6-8和11-15中的一個,采用解相關處理的通道5、9-10和16中的一個。當速率為384kbps時,采用空間解碼處理的通道6-8和11-15中的一個,采用解相關處理的通道5、9-10和16中的一個。當速率為512kbps時,采用空間解碼處理的通道7-9和11-15中的一個,采用解相關處理的通道10或16。當速率為768kbps時,采用空間解碼處理的通道11-15中的一個或者采用解相關處理的通道10或16。
10、本技術實施例中,第二通道可以是采用解相關處理的通道。
11、可選的,互相關值ic可以采用如下方法計算:
12、
13、其中,b是自帶序號,取值0-12,re{}取實部,k表示自帶b上的第k個頻點,x1和x2分別表示重建信號和w通道的頻譜系數(shù),*表示共軛。
14、可選的,當互相關值大于預設閾值時,解碼端將第一通道的重建信號作為第二通道的重建信號;當互相關值小于或等于預設閾值時,解碼端根據(jù)第一通道的重建信號采用分頻帶的方法獲取第二頻帶的重建信號。
15、預設閾值例如可以是0.875(本技術實施例對此不做具體限定)。解碼端將第一通道的重建信號和第一信號之間的互相關值與前述預設閾值進行比較:
16、當互相關值大于預設閾值時,解碼端可以采用全頻帶的拷貝方法,即,解碼端可以在通道的整個頻帶上做信號的拷貝,將第一通道的重建信號完全拷貝給第二通道的重建信號;
17、當互相關值小于或等于預設閾值時,解碼端可以采用分頻帶的拷貝方法,例如,解碼端可以在部分子頻帶上將對應的第一通道的重建信號拷貝給第二通道的重建信號,而在另一部分子頻帶上保留第一信號作為第二通道的重建信號。應理解,解碼端還可以采用多種方法對通道的信號進行頻帶劃分,本技術實施例對此不做具體限定。
18、可選的,當互相關值小于或等于預設閾值時,解碼端將第一通道的重建信號作為第二通道的重建信號;當互相關值大于預設閾值時,解碼端根據(jù)第一通道的重建信號采用分頻帶的方法獲取第二頻帶的重建信號。
19、與上一種情況相反,解碼端也可以在互相關值小于或等于預設閾值時,采用全頻帶的拷貝方法,而在互相關值大于預設閾值時,采用分頻帶的拷貝方法。
20、需要說明的是,解碼端還可以采用其他的方式實現(xiàn)分頻帶的拷貝方法,本技術實施例對此不做具體限定。
21、第二方面,本技術提供一種場景音頻信號的解碼裝置,包括:獲取模塊,用于獲取第一通道的重建信號,所述第一通道是重建場景音頻信號包含的c個通道中采用直接解碼處理的通道,c為正整數(shù);獲取第二通道的第一信號和暫態(tài)標識,所述第二通道是所述c個通道中沒有采用直接解碼處理的通道;當所述第二通道的暫態(tài)標識表示所述第二通道存在暫態(tài)信號時,獲取所述第一通道的重建信號和所述第一信號之間的互相關值;暫態(tài)恢復模塊,用于根據(jù)所述互相關值獲取所述第二通道的重建信號。
22、在一種可能的實現(xiàn)方式中,所述獲取模塊,具體用于當所述互相關值大于預設閾值時,將所述第一通道的重建信號作為所述第二通道的重建信號;或者,當所述互相關值小于或等于所述預設閾值時,根據(jù)所述第一通道的重建信號采用分頻帶的方法獲取所述第二頻帶的重建信號。
23、在一種可能的實現(xiàn)方式中,所述獲取模塊,具體用于當所述互相關值小于或等于預設閾值時,將所述第一通道的重建信號作為所述第二通道的重建信號;當所述互相關值大于所述預設閾值時,根據(jù)所述第一通道的重建信號采用分頻帶的方法獲取所述第二頻帶的重建信號。
24、在一種可能的實現(xiàn)方式中,所述第一通道是所述c個通道中的w通道。
25、在一種可能的實現(xiàn)方式中,所述第二通道是采用解相關處理的通道。
26、第三方面,本技術提供一種電子設備,包括:一個或多個處理器;存儲器,用于存儲一個或多個程序;當所述一個或多個程序被所述一個或多個處理器執(zhí)行,使得所述一個或多個處理器實現(xiàn)如上述第一方面中任一項所述的方法。
27、第四方面,本技術提供一種芯片,包括一個或多個接口電路和一個或多個處理器;所述接口電路用于從電子設備的存儲器接收信號,并向所述處理器發(fā)送所述信號,所述信號包括存儲器中存儲的計算機指令;當所述處理器執(zhí)行所述計算機指令時,使得所述電子設備執(zhí)行上述第一方面中任一項所述的方法。
28、第五方面,本技術提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機程序,當所述計算機程序運行在計算機或處理器上時,使得所述計算機或所述處理器執(zhí)行如上述第一方面中任一項所述的方法。
29、第六方面,本技術提供一種計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包括計算機程序代碼,當所述計算機程序代碼在計算機上運行時,使得計算機執(zhí)行上述第一方面中任一項所述的方法。
30、第七方面,本技術提供一種存儲碼流的裝置,所述裝置包括:接收器和至少一個存儲介質(zhì),所述接收器用于接收碼流;所述至少一個存儲介質(zhì)用于存儲所述碼流。
31、第八方面,本技術提供一種傳輸碼流的裝置,所述裝置包括:發(fā)送器和至少一個存儲介質(zhì),所述至少一個存儲介質(zhì)用于存儲碼流;所述發(fā)送器用于從所述存儲介質(zhì)中獲取所述碼流并將所述碼流通過傳輸介質(zhì)發(fā)送給端側(cè)設備。
32、第九方面,本技術提供一種分發(fā)碼流的系統(tǒng),所述系統(tǒng)包括:至少一個存儲介質(zhì),用于存儲至少一個碼流,流媒體設備,用于從所述至少一個存儲介質(zhì)中獲取所述碼流,并將所述碼流發(fā)送給端側(cè)設備,其中,所述流媒體設備包括內(nèi)容服務器或內(nèi)容分發(fā)服務器。