編碼器系統(tǒng)、解碼器系統(tǒng)、編碼方法和解碼方法

文檔序號：9472491閱讀：771來源：國知局

編碼器系統(tǒng)、解碼器系統(tǒng)、編碼方法和解碼方法
【專利說明】
[0001] 本發(fā)明申請為申請日為2010年3月5日并于2011年9月15日進入中國國家階段的發(fā)明名稱為"基于自適應地可選擇的左/右或中央/側(cè)邊立體聲編碼和參數(shù)立體聲編碼的組合的高級立體聲編碼"的第201080012247. 5號發(fā)明專利申請的分案申請。
技術領域
[0002] 本申請設及音頻編碼，具體地，設及組合基于參數(shù)和波形的編碼技術的立體聲音頻編碼。
【背景技術】
[0003] 立體聲信號的左（L)和右佩聲道的聯(lián)合編碼與L和R的獨立編碼相比，使得能夠更高效的編碼。用于聯(lián)合立體聲編碼的常見方法是中央/側(cè)邊（M/巧編碼。在此，通過相加L和R信號來形成中央（M)信號，例如，M信號可W具有形式
[0004]
[0005] 同樣，通過相減兩個聲道L和R而形成側(cè)邊（巧信號，例如，S信號可W具有形式
[0006]
[0007] 在M/S編碼的情況下，對M和S信號而不是L和R信號進行編碼。
[000引在MPEG(移動圖像專家組）AAC(高級音頻編碼）標準（參見標準文件IS0/IEC13818-7)中，可WW時間變化和頻率變化的方式來選擇L/R立體聲編碼和M/S立體聲編碼。因此，立體聲編碼器可W對于立體聲信號的一些頻帶應用L/R編碼，而M/S編碼用于對立體聲信號（頻率變化的）的其他頻帶進行編碼。而且，編碼器可W在時間上在L/R和M/S編碼之間切換（時間變化的）。在MPEGAAC中，在頻域中，更具體地在MDCT(改進型的離散余弦變換）域中執(zhí)行立體聲編碼。運允許W頻率和時間變化的方式來自適應地選擇L/R或 M/S編碼。在L/R和M/S立體聲編碼之間的選定可W基于評估側(cè)邊信號：當側(cè)邊信號的能量較低時，M/S立體聲編碼更高效，從而應當被使用?；蛘撸瑢τ谠趦煞N立體聲編碼方案之間的選定，可W試驗兩種編碼方案，并且選擇可W基于產(chǎn)生的量化工作（effort)、即所觀察的感知賭。
[0009] 一種對于聯(lián)合立體聲編碼的替代方法是參數(shù)立體聲（P巧編碼。在此，在使用諸如AAC編碼器的傳統(tǒng)音頻編碼器對縮混信號編碼后，立體聲信號作為單聲道縮混信號傳送。縮混信號是L和R聲道的疊加。單聲道縮混信號與附加的時間變化和頻率變化的PS 參數(shù)組合傳送，該PS參數(shù)例如是聲道間（即，在L和R之間）強度差IID和聲道間交叉相關（ICC)。在解碼器中，基于解碼的縮混信號和參數(shù)立體聲參數(shù)，重建近似于原始立體聲信號的感知立體聲圖像的立體聲信號。為了重建，通過去相關器來生成縮混信號的去相關版本。通過適當?shù)娜V波器來實現(xiàn)運樣的去相關器。在下文中描述了PS編碼和解碼： "Low Complexity Parametric Stereo Coding in MPEG-4",比Purnhagen, Proc. Of the 7th Int. Conference on Digital Audio Effects (DAFx ' 04), Naples, Italy, October 5-8, 2004, pagesl63-168。該文檔的公開通過引用合并于此。
[0010] 環(huán)繞MPEG標準（參見文件IS0/IEC23003-1)利用PS編碼的概念。在環(huán)繞MPEG 解碼器中，基于較少的輸入聲道和控制參數(shù)來創(chuàng)建多個輸出聲道。通過級聯(lián)參數(shù)立體聲模塊來構(gòu)造環(huán)繞MPEG解碼器和編碼器，該模塊在環(huán)繞MPEG中被稱為用于解碼器的0TT模塊 (一對二模塊）和用于編碼器的R-0TT模塊（逆一對二模塊）。0TT模塊通過伴隨PS參數(shù) 的單個輸入聲道（縮混信號）來確定兩個輸出聲道。0TT模塊對應于PS解碼器，R-0TT模塊對應于PS編碼器?？蒞通過使用在解碼器側(cè)具有單個0TT模塊和在編碼器側(cè)具有單個 R-0TT模塊的環(huán)繞MPEG來實現(xiàn)參數(shù)立體聲；運也被稱為"環(huán)繞MPEG2-1-2"模式。比特流語法可W不同，但是基礎理論和信號處理是相同的。因此，W下對于PS的所有引用還包括"環(huán) 繞MPEG2-1-2 "或基于環(huán)繞MPEG的參數(shù)立體聲。
[0011] 在PS編碼器（例如，在環(huán)繞MPEGPS編碼器中），除了縮混信號之外，可W確定和發(fā)送殘余信號（RE巧。運樣的殘余信號指示與通過其縮混和PS參數(shù)來表示原始聲道相關聯(lián) 的誤差。在解碼器中，可W使用殘余信號代替縮混信號的去相關版本。運允許更好地重建原始聲道L和R的波形。例如，在環(huán)繞MPEG標準（參見文件IS0/IEC23003-1)中和在下文中描述了附加的殘余信號的使用："MPEGSurround-TheIS0/MPEGStandardforEfficient andCompatibleMulti-ChannelAudioCoding,J.Herreetal. ,AudioEngineering ConventionPaper7084,122ndConvention,May5-8, 2007。兩個文檔的公開、特別是其中對于殘余信號的評論通過引用合并于此。
[0012] 使用殘余的PS編碼對于聯(lián)合立體聲編碼而言是比M/S編碼更一般的方法：當將 L/R信號變換為M/S信號時，M/S編碼執(zhí)行信號旋轉(zhuǎn)。此外，當將L/R信號變換為縮混和殘余信號時，使用殘余的PS編碼執(zhí)行信號旋轉(zhuǎn)。然而，在后一種情況下，信號旋轉(zhuǎn)是可變的，并且依賴于PS參數(shù)。由于使用殘余的PS編碼的更一般的方法，使用殘余的PS編碼允許對像拼接的單聲道信號那樣的某些類型的信號進行比M/S編碼更高效的編碼。因此，所提出的編碼器允許將參數(shù)立體聲編碼技術與基于波形的立體聲編碼技術高效地組合。
[0013] 經(jīng)常地，諸如MPEGAAC感知立體聲編碼器的感知立體聲編碼器可W在L/R立體聲編碼和M/S立體聲編碼之間選定，其中，在后一種情況下，基于立體聲信號生成中央/側(cè)邊信號。運樣的選擇可W是頻率變化的，即，對于一些頻帶，可W使用L/R立體聲編碼，而對于其他頻帶，可W使用M/S立體聲編碼。
[0014] 在L和R聲道實質(zhì)上是獨立信號的情況下，運樣的感知立體聲編碼器通常不使用 M/S立體聲編碼，因為在該情況下，與L/R立體聲編碼相比，運樣的編碼方案不提供任何編碼增益。編碼器將退回普通的L/R立體聲編碼，實質(zhì)上獨立地處理L和R。
[0015] 在相同的情況下，PS編碼器系統(tǒng)創(chuàng)建包含L和R聲道的縮混信號，運防止了L和 R聲道的獨立處理。對于使用殘余信號的PS編碼，運可W帶來與立體聲編碼相比而言較為低效的編碼，在立體聲編碼中，L/R立體聲編碼或M/S立體聲編碼是自適應地可選擇的。
[0016] 因此，存在下述情況，其中，PS編碼器勝過在L/R立體聲編碼和M/S立體聲編碼之間自適應選擇的感知立體聲編碼器，而在其他情況下，后一種編碼器勝過PS編碼器。

【發(fā)明內(nèi)容】

[0017] 本申請描述了基于將使用殘余的PS編碼與自適應L/R或M/S感知立體聲編碼（例如，在MDCT域中的AAC感知聯(lián)合立體聲編碼）組合的思想的一種音頻編碼器系統(tǒng)和一種編碼方法。運允許組合自適應L/R或M/S立體聲編碼（例如，在MPEGAAC中使用）的優(yōu)點和使用殘余信號的PS編碼（例如，在環(huán)繞MPEG中使用）的優(yōu)點。而且，本申請描述了對應的音頻解碼器系統(tǒng)和解碼方法。
[0018] 本申請的第一方面設及一種編碼器系統(tǒng)，用于將立體聲信號編碼為比特流信號。根據(jù)所述編碼器系統(tǒng)的一個實施例，所述編碼器系統(tǒng)包括縮混級，用于基于所述立體聲信號來生成縮混信號和殘余信號。所述殘余信號可W覆蓋所使用的音頻頻率范圍的全部或僅一部分。另外，所述編碼器系統(tǒng)包括參數(shù)確定級，用于確定PS參數(shù)，諸如聲道間強度差和聲道間交叉相關。優(yōu)選地，所述PS參數(shù)是頻率變化的。運樣的縮混級和參數(shù)確定級通常是PS 編碼器的一部分。
[0019] 另外，所述編碼器系統(tǒng)包括在所述縮混級的下游的感知編碼裝置，其中，能夠選擇兩個編碼方案：
[0020] -基于所述縮混信號和所述殘余信號的和W及基于所述縮混信號和所述殘余信號的差的編碼，或者
[0021] -基于所述縮混信號和基于所述殘余信號的編碼。
[0022] 應當注意，在編碼基于所述縮混信號和所述殘余信號的情況下，可W對所述縮混信號和所述殘余信號編碼，或可W對與其成比例的信號編碼。在編碼基于和與差的情況下，則可W對所述和與差編碼，或可W對與其成比例的信號編碼。
[0023] 所述選擇可W是頻率變化的（和時間變化的），即，對于第一頻帶，可W選擇編碼基于和信號與差信號，而對于第二頻帶，可W選擇編碼基于所述縮混信號和基于所述殘余信號。
[0024] 運樣的編碼器系統(tǒng)具有允許在L/R立體聲編碼和使用殘余的PS編碼之間切換 (優(yōu)選地W頻率變化的方式）的優(yōu)點：如果所述感知編碼裝置選擇（對于特定頻帶或?qū)τ?整個使用的頻率范圍）基于縮混和殘余信號的編碼，則所述編碼系統(tǒng)表現(xiàn)為像使用利用殘余的標準PS編碼的系統(tǒng)那樣。然而，如果所述感知編碼裝置選擇（對于特定頻帶或?qū)τ谡?個所使用的頻率范圍）基于所述縮混信號和所述殘余信號的和信號W及基于所述縮混信號和所述殘余信號的差信號，則在特定的情況下，所述和與差操作實質(zhì)上補償了在前的縮混操作（除了可能不同的增益因子），W使得整個系統(tǒng)可W實際上執(zhí)行整個立體聲信號或針對其頻帶的L/R編碼。例如，當所述立體聲信號的L和R聲道是獨立的并且具有相同的電平時，運樣的情況出現(xiàn)，如下詳細所述。
[00巧]優(yōu)選地，所述編碼方案的適用是時間和頻率相關的。因此，優(yōu)選地，通過L/R編碼方案來對所述立體聲信號的一些頻帶編碼，而通過使用殘余的PS編碼方案來對所述立體聲信號的其他頻帶編碼。
[0026] 應當注意，在如上所述的編碼基于縮混信號并且基于殘余信號的情況下，可W通過對于縮混信號和殘余信號的兩個相逆（除了可能不同的增益因子）的串行操作來形成輸入到核屯、編碼器的實際信號。例如，縮混信號和殘余信號被饋送到M/S至L/R變換級，然后該變換級的輸出被饋送到L/R至M/S變換級。產(chǎn)生的信號（然后用于編碼）對應于縮混信號和殘余信號（除了可能不同的增益因子之外）。
[0027] 下面的實施例利用運種思想。根據(jù)所述編碼器系統(tǒng)的一個實施例，所述編碼器系統(tǒng)包括如上所述的縮混級和參數(shù)確定級。而且，所述編碼器系統(tǒng)包括變換級（例如，作為如上所述的編碼裝置的一部分）。變換級通過執(zhí)行縮混信號和殘余信號的變換來生成偽L/R 立體聲信號。變換級優(yōu)選地執(zhí)行和與差變換，其中，對所述縮混信號和所述殘余信號求和W 生成所述偽立體聲信號的一個聲道（可能所述和也乘W因子），并且彼此相減W生成所述偽立體聲信號的另一個聲道（可能所述差也乘W因子）。優(yōu)選地，所述偽立體聲信號的第一聲道（例如，偽左聲道）與所述縮混和殘余信號的和成比例，而第二聲道（例如，偽右聲道）與所述縮混和殘余信號的差成比例。因此，來自所述PS編碼器的縮混信號DMX和殘余信號RES可W根據(jù)下式轉(zhuǎn)換為偽立體聲信號Lp、化：
[0028] Lp=g〇)MX+RE巧
[0029] Rp=g〇)MX-RE巧
[0030] 在上式中，增益歸一化因子g具有例如值勞。
[0031] 所述偽立體聲信號優(yōu)選地由感知立體聲編碼器（例如，作為所述編碼裝置的一部分）處理。對于編碼，能夠選擇L/R立體聲編碼或M/S立體聲編碼。自適應L/R和M/S感知立體聲編碼器可W是基于AAC的編碼器。優(yōu)選地，在L/R立體聲編碼和M/S立體聲編碼之間的選擇是頻率變化的；因此，如上所述，所述選擇可W對于不同頻帶變化。而且，在L/R 編碼和M/S編碼之間的選擇優(yōu)選地是時間變化的。優(yōu)選地由所述感知立體聲編碼器進行在 L/R編碼和M/S編碼之間的選定。
[0032] 具有M/S編碼的選項的運樣的感知編碼器可W基于所述偽立體聲L/R信號來內(nèi)部計算（偽）M和S信號（在時域或在所選擇的頻帶中）。運樣的偽M和S信號對應于縮混和殘余信號（除了可能不同的增益因子）。因此，如果所述感知立體聲編碼器選擇M/S編碼，則它實際上對所述縮混和殘余信號（它們對應于所述偽M和S信號）編碼，就像在使用利用殘余的標準PS編碼的系統(tǒng)中進行的那樣。
[0033] 而且，在特殊情況下，所述變換級實質(zhì)上補償在前的縮混操作（除了可能不同的增益因子之外），W使得整個編碼器系統(tǒng)可W實際上執(zhí)行整個立體聲信號的L/R編碼或?qū)?于其頻帶的L/R編碼（如果在感知編碼器中選擇L/R編碼）。運是例如在所述立體聲信號的L和R聲道是獨立的并且具有相同電平時的情形，如下將詳細所述。因此，如果對于給定頻帶所述立體聲信號的左和右聲道實質(zhì)上是獨立的并且具有實質(zhì)上相同的電平，則對于該頻帶，所述偽立體聲信號實質(zhì)上與所述立體聲信號對應或成比例。
[0034] 因此，所述編碼器系統(tǒng)實際上允許在L/R立體聲編碼和使用殘余的PS編碼之間切換，W便能夠適應于給定立體聲輸入信號的屬性。優(yōu)選地，所述編碼方案的適用是時間和頻率相關的。因此，優(yōu)選地，通過L/R編碼方案來對所述立體聲信號的一些頻帶編碼，而通過使用殘余的PS編碼方案來對立體聲信號的其他頻帶編碼。應當注意，M/S編碼實質(zhì)上是使用殘余的PS編碼的特殊情況（因為，L/R至M/S變換是PS縮混操作的特殊情況），因此，編碼器系統(tǒng)也可W執(zhí)行整體的M/S編碼。
[0035] 具有在所述PS編碼器下游和所述L/R或M/S感知立體聲編碼器上游的變換級的所述實施例具有可W使用傳統(tǒng)PS編碼器和傳統(tǒng)感知編碼器的優(yōu)點。盡管如此，由于此處的特殊使用，可W適用所述PS編碼器或所述感知編碼器。
[0036] 新的概念通過使能PS編碼和聯(lián)合立體聲編碼的高效組合改善了立體聲編碼的性能。
[0037] 根據(jù)一個替選實施例，如上所述的編碼裝置包括變換級，用于對于一個或更多個頻帶（例如，對于整個使用的頻率范圍或僅對于一個頻率范圍）基于所述縮混信號和所述殘余信號來執(zhí)行和與差變換?？蒞在頻域或時域中執(zhí)行所述變換。所述變換級生成針對所述一個或更多個頻帶的偽左/右立體聲信號。所述偽立體聲信號的一個聲道對應于所述和，并且另一個聲道對應于所述差。
[003引因此，在編碼基于所述和與差信號的情況下，所述變換級的輸出可W用于編碼，而在編碼基于所述縮混信號和所述殘余信號的情況下，在所述編碼級的上游的信號可W用于編碼。因此，該實施例不對所述縮混信號和殘余信號使用兩個串行的和與差變換，產(chǎn)生所述縮混信號和殘余信號（除了可能不同的增益因子之外）。
[0039] 當基于所述縮混信號和殘余信號來選擇編碼時，選擇立體聲信號的參數(shù)立體聲編碼。當基于所述和與差來選擇編碼時（即，基于偽立體聲信號的編碼），選擇立體聲信號的 L/R編碼。
[0040] 所述變換級可W是作為具有在L/R和M/S立體聲編碼之間的自適應選擇的感知編碼器的一部分的L/R至M/S變換級（與傳統(tǒng)的L/R至M/S變換級相比，可能增益因子不同）。應當注意，在L/R和M/S立體聲編碼之間的選定應當反相。因此，當所述選定裝置選定M/S感知解碼時，選擇基于縮混信號和殘余信號的編碼（即，編碼信號不通過變換級），而當所述選定裝置選定L/R感知解碼時，選擇基于由所述變換級生成的所述偽立體聲信號的編碼（即，編碼信號通過變換級）。
[0041] 根據(jù)如上所述的實施例的任何一個所述的編碼器系統(tǒng)可W包括附加的SBR(頻段復制）編碼器。SBR是HFR(高頻重建）的一種形式。SBR編碼器確定用于在解碼器中音頻信號的較高頻范圍的重建的側(cè)邊信息。感知編碼器僅對較低頻率范圍編碼，由此減小比特率。優(yōu)選地，所述SBR編碼器連接到所述PS編碼器的上游。因此，所述SBR編碼器可W在立體聲域中，并且生成用于立體聲信號的SBR參數(shù)。將結(jié)合附圖對此進行詳細討論。
[0042] 優(yōu)選地，所述PS編碼器（即，縮混級和參數(shù)確定級）在過采樣頻域中運行（如下所述的PS解碼器也同樣優(yōu)選地在過采樣頻域中運行）。對于時間至頻率變換，例如，可W在 PS編碼器上游使用具有QMF(正交鏡像濾波器）和奈奎斯特濾波器的復值混合濾波器組，如在環(huán)繞MPEG標準中所述（參見文件IS0/IEC23003-1)。運允許時間和頻率自適應信號處理，而無可聽的失真?zhèn)蜗?。另一方面，?yōu)選地，在臨界采樣MDCT域（例如，如在AAC中所述）中執(zhí)行自適應L/R或M/S編碼，W便保證高效的量化信號表示。

完整全部詳細技術資料下載

當前第1頁1 2 3 4 5 6