音頻信號編碼器的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請涉及多信道或立體聲音頻信號編碼器,且特別地但非排他地涉及在便攜式 設(shè)備中使用的多信道或立體聲音頻信號編碼器。
【背景技術(shù)】
[0002] 像語音或音樂這樣的音頻信號例如被編碼以實現(xiàn)音頻信號的有效傳輸或存儲。
[0003] 音頻編碼器和解碼器(也稱為編解碼器)用于表示基于音頻的信號,例如音樂和環(huán) 境聲(其在語音編碼方面能夠被稱為背景噪聲)。這些類型的編碼器典型地不適用語音模式 用于編碼過程,而是他們使用用于表示所有類型的音頻信號(包括語音)的過程。語音編碼 器和解碼器(編解碼器)能被認為是被優(yōu)化用于語音信號并能夠操作在固定或可變比特率 的音頻編解碼器。
[0004] 音頻編解碼器還能夠被配置成以變化的比特率操作。在較低比特率,這樣的音頻 編解碼器可以被優(yōu)化以在等同于純語音編解碼器的編碼率來處理語音信號。在較高比特 率,該音頻編解碼器可以以較高質(zhì)量和性能來編碼包括音樂、背景噪聲和語音的任意信號。 可變速率音頻編解碼器還能夠?qū)嵤┣度胧娇煽s放編碼結(jié)構(gòu)和比特流,其中另外的比特(特 定量的比特通常稱為層)改進在較低比特率的編碼,且其中較高比特率的比特流可以被截 短以得到較低比特率編碼的比特流。這樣的音頻編解碼器可以使用純粹為語音信號設(shè)計的 編解碼器作為核心層或最低比特率編碼。
[0005] 音頻編解碼器被設(shè)計用于保持高(感覺上的)質(zhì)量同時改進壓縮比。因此不是波形 匹配編碼,而是常用的是使用各種參數(shù)機制來降低比特率。對于多信道音頻,例如立體聲信 號,常用的是對單信道表示使用較大量可用比特率并利用使用相對少的比特的參數(shù)方法來 編碼立體聲或多信道信號。
【發(fā)明內(nèi)容】
[0006] 根據(jù)第一方面提供了一種方法,該方法包括:針對至少一個音頻信號的幀確定幀 音頻信號多信道參數(shù)的集合;基于與幀音頻信號多信道參數(shù)的該集合的子集相關(guān)聯(lián)的誤差 值選擇幀音頻信號多信道參數(shù)的該集合的該子集;以及基于幀音頻信號多信道參數(shù)的集合 的選擇的子集生成已編碼的幀音頻信號多信道參數(shù)。
[0007] 該方法還包括確定至少一個音頻信號的該幀的編碼比特率;并且其中基于與幀音 頻信號多信道參數(shù)的該集合的該子集相關(guān)聯(lián)的誤差值選擇幀音頻信號多信道參數(shù)的該集 合的該子集可以包括進一步基于該至少一個音頻信號的該幀的編碼比特率選擇幀音頻信 號多信道參數(shù)的該集合的該子集。
[0008] 針對至少一個音頻信號的幀確定幀音頻信號多信道參數(shù)的集合可以包括確定該 至少一個音頻信號的至少兩個信道之間的差集合,其中該差集合可以包括兩個或更多差 值,其中每個差值可以與定義該幀的資源的子部分相關(guān)聯(lián)。
[0009] 確定至少一個音頻信號的至少兩個信道之間的差集合可以包括確定以下至少一 者:至少一個耳間時間差;以及至少一個耳間強度(level)差。
[0010] 定義該幀的資源的子部分可以包括以下至少一者:子帶頻率;以及時間段。
[0011] 基于與幀音頻信號多信道參數(shù)的集合的子集相關(guān)聯(lián)的誤差值針對該幀選擇幀音 頻信號多信道參數(shù)的集合的子集可以包括:確定至少一個之前幀選擇的子集;確定要被選 擇的元素數(shù)量;生成至少兩個候選子集;從候選子集和至少一個之前幀選擇的子集的組合 生成重構(gòu)集合;基于重構(gòu)集合和幀音頻信號多信道參數(shù)的集合生成誤差值;以及選擇所述 至少兩個候選子集中具有最小絕對誤差值的一個候選子集。
[0012] 該方法還可以包括:針對該選擇的子集生成表示該選擇的子集的至少一個參數(shù); 以及生成表示該選擇的子集的已編碼的至少一個參數(shù)。
[0013] 針對選擇的子集生成表示該選擇的子集的至少一個參數(shù)可以包括以下至少一者: 生成表示選擇的子集中的第一選擇的元素的第一參數(shù);生成表示該子集中的連續(xù)元素的選 擇分配的分配參數(shù);以及生成表示選擇的子集中的元素數(shù)量的長度參數(shù)。
[0014] 基于幀音頻信號多信道參數(shù)的集合的選擇的子集生成已編碼幀音頻信號多信道 參數(shù)可以包括使用向量或標量量化碼本生成至少一個幀音頻信號多信道參數(shù)群組的碼本 索引。
[0015] 使用向量或標量量化碼本生成至少一個幀音頻信號多信道參數(shù)的群組的碼本索 引可以包括:生成依據(jù)至少一個幀音頻信號多信道參數(shù)的映射實例的頻率分配的與至少一 個幀音頻信號多信道參數(shù)的相關(guān)聯(lián)的索引的編碼映射;以及依據(jù)該相關(guān)聯(lián)索引對該編碼映 射進行編碼。
[0016] 依據(jù)相關(guān)聯(lián)索引對該編碼映射進行編碼可以包括將Golomb-Rice(哥倫布-賴斯) 編碼應(yīng)用到依據(jù)該相關(guān)聯(lián)索引的編碼映射。
[0017] 這里描述的方法還可以包括:接收至少兩個音頻信號信道;從該至少兩個音頻信 號信道且至少一個幀音頻信號多信道參數(shù)確定更少量信道音頻信號;生成包括該更少量信 道的已編碼的音頻信號;以及將該已編碼的音頻信號和已編碼的至少一個幀音頻信號多信 道參數(shù)進行組合。
[0018] 根據(jù)第二方面,提供了一種方法,該方法包括:在一時段內(nèi)接收包括至少一個幀縮 混(downmix)音頻信號的已編碼的音頻信號和包括幀音頻信號多信道參數(shù)的集合的子集的 至少一個多信道音頻信號參數(shù);恢復在幀音頻信號多信道參數(shù)的子集中沒有出現(xiàn)的音頻信 號多信道參數(shù)的集合的任意元素;以及從至少一個幀縮混音頻信號以及幀音頻信號多信道 參數(shù)的集合的子集與在幀音頻信號多信道參數(shù)的子集中沒有出現(xiàn)的音頻信號多信道參數(shù) 的集合的被恢復的元素的組合針對該幀生成至少兩個信道音頻信號。
[0019] 該幀音頻信號多信道參數(shù)的集合可以包括至少一個音頻信號的至少兩個信道之 間的差的集合,該差的集合可以包括兩個或更多差值,其中每個差值可以與定義該幀的資 源的子部分相關(guān)聯(lián)。
[0020] 至少一個音頻信號的至少兩個信道之間的差的集合可以包括以下至少一者:至少 一個耳間時間差;以及至少一個耳間強度差。
[0021] 定義該幀的資源的子部分可以包括以下至少一者:子帶頻率;和時間段。
[0022] 已編碼的音頻信號還可以包括定義幀音頻信號多信道參數(shù)的集合的子集的至少 一個參數(shù);其中恢復在幀音頻信號多信道參數(shù)的子集中沒有出現(xiàn)的音頻信號多信道參數(shù)的 集合中的任意元素可以包括對定義幀音頻信號多信道參數(shù)的集合的子集的至少一個參數(shù) 進行解碼以確定要被恢復的子集元素。
[0023] 根據(jù)第三方面,提供了一種設(shè)備,該設(shè)備包括:用于針對至少一個音頻信號的幀確 定幀音頻信號多信道參數(shù)的裝置;用于基于與幀音頻信號多信道參數(shù)的該集合的子集相關(guān) 聯(lián)的誤差值針對該幀選擇幀音頻信號多信道參數(shù)的集合的該子集的裝置;以及用于基于幀 音頻信號多信道參數(shù)的該集合的該選擇的子集生成已編碼幀音頻信號多信道參數(shù)的裝置。
[0024] 該設(shè)備還可以包括用于確定至少一個音頻信號的幀的編碼比特率的裝置,且其中 用于基于與幀音頻信號多信道參數(shù)的集合的子集相關(guān)聯(lián)的誤差針對幀選擇幀音頻信號多 信道參數(shù)的集合的該子集的裝置可以包括用于進一步基于該至少一個音頻信號的幀的編 碼比特率選擇幀音頻信號多信道參數(shù)的集合的該子集的裝置。
[0025] 用于針對至少一個音頻信號的幀確定幀音頻信號多信道參數(shù)的集合的裝置可以 包括用于確定至少一個音頻信號的至少兩個信道之間的差的集合的裝置,其中該差的集合 可以包括兩個或更多個差值,其中每個差值可以與定義該幀的資源的子部分相關(guān)聯(lián)。
[0026] 用于確定至少一個音頻信號的至少兩個信道之間的差的集合的裝置可以包括以 下至少一者:用于確定至少一個耳間時間差的裝置;和用于確定至少一個耳間強度差的裝 置。
[0027] 定義該幀的資源的子部分可以包括以下至少一者:子帶頻率;和時間段。
[0028] 用于基于與幀音頻信號多信道參數(shù)的集合的子集相關(guān)聯(lián)的誤差針對該幀選擇幀 音頻信號多信道參數(shù)的集合的該子集的裝置可以包括:用于確定至少一個之前幀選擇的子 集的裝置;用于確定要被選擇的元素數(shù)量的裝置;用于生成至少兩個候選子集的裝置;用于 從候選子集和至少一個之前幀選擇的子集的組合生成重構(gòu)集合的裝置;用于基于該重構(gòu)集 合和幀音頻信號多信道參數(shù)的集合生成誤差值的裝置;以及用于選擇所述至少兩個候選子 集中具有最小絕對誤差值的一個候選子集的裝置。
[0029] 該設(shè)備還可以包括:用于針對所選擇子集生成表示該所選子集的至少一個參數(shù)的 裝置;以及用于生成表示該所選子集的已編碼的至少一個參數(shù)的裝置。
[0030] 用于針對所選子集生成表示該所選子集的至少一個參數(shù)的裝置可以包括以下至 少一者:用于生成表示所選子集中的第一被選擇的元素的第一參數(shù)的裝置;用于表示該子 集中連續(xù)元素的選擇分配的分配參數(shù)的裝置;以及用于生成表示所選子集中的元素數(shù)量的 長度參數(shù)的裝置。
[0031] 用于基于幀音頻信號多信道參數(shù)的集合的所選子集生成已編碼幀音頻信號多信 道參數(shù)的裝置可以包括用于使用向量或標量量化碼本生成至少一個幀音頻信號多信道參 數(shù)的群組的碼本索引的裝置。
[0032] 用于使用向量或標量量化碼本生成至少一個幀音頻信號多信道參數(shù)的群組的碼 本索引的裝置可以包括:用于生成依據(jù)至少一個幀音頻信號多信道參數(shù)的映射實例的頻率 分配的與至少一個幀音頻信號多信道參數(shù)的相關(guān)聯(lián)的索引的第一編碼映射的裝置;以及用 于依據(jù)該相關(guān)聯(lián)對索引的該第一編碼映射進行編碼的裝置。
[0033] 用于依據(jù)該相關(guān)聯(lián)索引對編碼映射進行編碼的裝置可以包括用于將Golomb-Rice 編碼應(yīng)用于依據(jù)該相關(guān)聯(lián)的索引的編碼映射的裝置。
[0034] 該設(shè)備還可以包括:用于接收至少兩個音頻信號信道的裝置;用于從該至少兩個 音頻信號信道和至少一個幀音頻信號多信道參數(shù)確定更少量信道音頻信號的裝置;用于生 成包括該更少量信道的已編碼的音頻信號的裝置;以及用于將該已編碼的音頻信號和該已 編碼的至少一個幀音頻信號多信道參數(shù)進行組合的裝置。
[0035] 根據(jù)第四方面,提供了一種設(shè)備,該設(shè)備包括:用于在一時段內(nèi)接收包括至少一個 幀縮混音頻信號的已編碼的音頻信號和包括幀音頻信號多信道參數(shù)的集合的子集的至少 一個多信道音頻信號參數(shù)的裝置;用于恢復在幀音頻信號多信道參數(shù)的子集中沒有出現(xiàn)的 音頻信號多信道參數(shù)集合的任意元素的裝置;以及用于從該至少一個幀縮混音頻信號以及 幀音頻信號多信道參數(shù)的集合的子集與在幀音頻信號多信道參數(shù)的子集中沒有出現(xiàn)的音 頻信號多信道參數(shù)的集合的恢復的元素的組合針對該幀生成至少兩個信道音頻信號的裝 置。
[0036] 幀音頻信號多信道參數(shù)的集合可以包括至少一個音頻信號的至少兩個信道之間 的差的集合,其中該差的集合可以包括兩個或更多個差值,其中每個差值可以與定義該幀 的資源的子部分相關(guān)聯(lián)。
[0037] 至少一個音頻信號的至少兩個信道之間的差的集合可以包括以下至少一者:至少 一個耳間時間差;和至少一個耳間強度差。
[0038] 定義該幀的資源的子部分可以包括以下至少一者:子帶頻率;和時間段。
[0039] 已編碼的音頻信號還可以包括定義幀音頻信號多信道參數(shù)的集合的子集的至少 一個參數(shù);其中用于恢復在幀音頻信號多信道參數(shù)的子集中沒有出現(xiàn)的音頻信號多信道參 數(shù)的集合中的任意元素的裝置可以包括對定義幀音頻信號多信道參數(shù)的集合的子集的至 少一個參數(shù)進行解碼以確定要被恢復的子集元素。
[0040] 根據(jù)第五方面提供了一種設(shè)備,該設(shè)備包括至少一個處理器和包括用于一個或多 個程序的計算機程序代碼的至少一個存儲器,該至少一個存儲器和計算機程序代碼被配置 成使用該至少一個處理器使得該設(shè)備至少:針對至少一個音頻信號的幀確定幀音頻信號多 信道參數(shù)的集合;基于與幀音頻信號多信道參數(shù)的該集合的子集相關(guān)聯(lián)的誤差值選擇幀音 頻信號多信道參數(shù)的該集合的該子集;以及基于選擇的幀音頻信號多信道參數(shù)的該集合的 該子集生成已編碼的幀音頻信號多信道參數(shù)。
[0041] 該設(shè)備還被使得確定至少一個音頻信號的該幀的編碼比特率;并且其中基于與幀 音頻信號多信道參數(shù)的該集合的該子集相關(guān)聯(lián)的誤差值選擇幀音頻信號多信道參數(shù)的該 集合的該子集可以包括還基于該至少一個音頻信號的該幀的該編碼比特率選擇幀音頻信 號多信道參數(shù)的該集合的該子集。
[0042] 針對至少一個音頻信號的幀確定幀音頻信號多信道參數(shù)的集合可以使得該設(shè)備 確定該至少一個音頻信號的至少兩個信道之間的差的集合,其中該差的集合可以包括兩個 或更多差值,其中每個差值可以與定義該幀的資源的子部分相關(guān)聯(lián)。
[0043] 確定至少一個音頻信號的至少兩個信道之間的差集合可以使得該設(shè)備確定以下 至少一者:至少一個耳間時間差;以及至少一個耳間強度差。
[0044] 定義該幀的資源的子部分可以包括以下至少一者:子帶頻率;以及時間段。
[0045] 基于與幀音頻信號多信道參數(shù)的集合的子集相關(guān)聯(lián)的誤差值針對該幀選擇幀音 頻信號多信道參數(shù)的集合的子集可以使得該設(shè)備:確定至少一個之前幀選擇的子集;確定 要被選擇的元素數(shù)量;生成至少兩個候選子集;從候選子集和至少一個之前幀選擇的子集 的組合生成重構(gòu)集合;基于重構(gòu)集合和幀音頻信號多信道參數(shù)的集合生成誤差值;以及選 擇所述至少兩個候選子集中具有最小絕對誤差值的一個候選子集。
[0046] 該設(shè)備還可以被使得:針對該選擇的子集生成表示該選擇的子集的至少一個參 數(shù);以及生成表示該選擇的子集的已編碼的至少一個參數(shù)。
[0047] 針對選擇的子集生成表示該選擇的子集的至少一個參數(shù)可以使得該設(shè)備執(zhí)行以 下至少一者:生成表示選擇的子集中的第一選擇的元素的第一參數(shù);生成表示該子集中的 連續(xù)元素的選擇分配的分配參數(shù);以及生成表示選擇的子集中的元素數(shù)量的長度參數(shù)。
[0048] 基于幀音頻信號多信道參數(shù)的集合的選擇的子集生成已編碼幀音頻信號多信道 參數(shù)可以使得該設(shè)備使用向量或標量量化碼本生成至少一個幀音頻信號多信道參數(shù)群組 的碼本索引。