編碼器系統(tǒng)、解碼器系統(tǒng)、編碼方法和解碼方法
【專利說明】
[0001] 本發(fā)明申請為申請日為2010年3月5日并于2011年9月15日進入中國國家階 段的發(fā)明名稱為"基于自適應地可選擇的左/右或中央/側(cè)邊立體聲編碼和參數(shù)立體聲編 碼的組合的高級立體聲編碼"的第201080012247. 5號發(fā)明專利申請的分案申請。
技術領域
[0002] 本申請設及音頻編碼,具體地,設及組合基于參數(shù)和波形的編碼技術的立體聲音 頻編碼。
【背景技術】
[0003] 立體聲信號的左(L)和右佩聲道的聯(lián)合編碼與L和R的獨立編碼相比,使得能 夠更高效的編碼。用于聯(lián)合立體聲編碼的常見方法是中央/側(cè)邊(M/巧編碼。在此,通過 相加L和R信號來形成中央(M)信號,例如,M信號可W具有形式
[0004]
[0005] 同樣,通過相減兩個聲道L和R而形成側(cè)邊(巧信號,例如,S信號可W具有形式
[0006]
[0007] 在M/S編碼的情況下,對M和S信號而不是L和R信號進行編碼。
[000引在MPEG(移動圖像專家組)AAC(高級音頻編碼)標準(參見標準文件IS0/IEC13818-7)中,可WW時間變化和頻率變化的方式來選擇L/R立體聲編碼和M/S立體聲編碼。 因此,立體聲編碼器可W對于立體聲信號的一些頻帶應用L/R編碼,而M/S編碼用于對立體 聲信號(頻率變化的)的其他頻帶進行編碼。而且,編碼器可W在時間上在L/R和M/S編 碼之間切換(時間變化的)。在MPEGAAC中,在頻域中,更具體地在MDCT(改進型的離散 余弦變換)域中執(zhí)行立體聲編碼。運允許W頻率和時間變化的方式來自適應地選擇L/R或 M/S編碼。在L/R和M/S立體聲編碼之間的選定可W基于評估側(cè)邊信號:當側(cè)邊信號的能 量較低時,M/S立體聲編碼更高效,從而應當被使用?;蛘撸瑢τ谠趦煞N立體聲編碼方案之 間的選定,可W試驗兩種編碼方案,并且選擇可W基于產(chǎn)生的量化工作(effort)、即所觀察 的感知賭。
[0009] 一種對于聯(lián)合立體聲編碼的替代方法是參數(shù)立體聲(P巧編碼。在此,在使用諸 如AAC編碼器的傳統(tǒng)音頻編碼器對縮混信號編碼后,立體聲信號作為單聲道縮混信號傳 送。縮混信號是L和R聲道的疊加。單聲道縮混信號與附加的時間變化和頻率變化的PS 參數(shù)組合傳送,該PS參數(shù)例如是聲道間(即,在L和R之間)強度差IID和聲道間交叉相 關(ICC)。在解碼器中,基于解碼的縮混信號和參數(shù)立體聲參數(shù),重建近似于原始立體聲 信號的感知立體聲圖像的立體聲信號。為了重建,通過去相關器來生成縮混信號的去相關 版本。通過適當?shù)娜V波器來實現(xiàn)運樣的去相關器。在下文中描述了PS編碼和解碼: "Low Complexity Parametric Stereo Coding in MPEG-4",比Purnhagen, Proc. Of the 7th Int. Conference on Digital Audio Effects (DAFx ' 04), Naples, Italy, October 5-8, 2004, pagesl63-168。該文檔的公開通過引用合并于此。
[0010] 環(huán)繞MPEG標準(參見文件IS0/IEC23003-1)利用PS編碼的概念。在環(huán)繞MPEG 解碼器中,基于較少的輸入聲道和控制參數(shù)來創(chuàng)建多個輸出聲道。通過級聯(lián)參數(shù)立體聲模 塊來構(gòu)造環(huán)繞MPEG解碼器和編碼器,該模塊在環(huán)繞MPEG中被稱為用于解碼器的0TT模塊 (一對二模塊)和用于編碼器的R-0TT模塊(逆一對二模塊)。0TT模塊通過伴隨PS參數(shù) 的單個輸入聲道(縮混信號)來確定兩個輸出聲道。0TT模塊對應于PS解碼器,R-0TT模 塊對應于PS編碼器??蒞通過使用在解碼器側(cè)具有單個0TT模塊和在編碼器側(cè)具有單個 R-0TT模塊的環(huán)繞MPEG來實現(xiàn)參數(shù)立體聲;運也被稱為"環(huán)繞MPEG2-1-2"模式。比特流語 法可W不同,但是基礎理論和信號處理是相同的。因此,W下對于PS的所有引用還包括"環(huán) 繞MPEG2-1-2 "或基于環(huán)繞MPEG的參數(shù)立體聲。
[0011] 在PS編碼器(例如,在環(huán)繞MPEGPS編碼器中),除了縮混信號之外,可W確定和 發(fā)送殘余信號(RE巧。運樣的殘余信號指示與通過其縮混和PS參數(shù)來表示原始聲道相關聯(lián) 的誤差。在解碼器中,可W使用殘余信號代替縮混信號的去相關版本。運允許更好地重建原 始聲道L和R的波形。例如,在環(huán)繞MPEG標準(參見文件IS0/IEC23003-1)中和在下文中 描述了附加的殘余信號的使用:"MPEGSurround-TheIS0/MPEGStandardforEfficient andCompatibleMulti-ChannelAudioCoding,J.Herreetal. ,AudioEngineering ConventionPaper7084,122ndConvention,May5-8, 2007。兩個文檔的公開、特別是其中 對于殘余信號的評論通過引用合并于此。
[0012] 使用殘余的PS編碼對于聯(lián)合立體聲編碼而言是比M/S編碼更一般的方法:當將 L/R信號變換為M/S信號時,M/S編碼執(zhí)行信號旋轉(zhuǎn)。此外,當將L/R信號變換為縮混和殘 余信號時,使用殘余的PS編碼執(zhí)行信號旋轉(zhuǎn)。然而,在后一種情況下,信號旋轉(zhuǎn)是可變的, 并且依賴于PS參數(shù)。由于使用殘余的PS編碼的更一般的方法,使用殘余的PS編碼允許對 像拼接的單聲道信號那樣的某些類型的信號進行比M/S編碼更高效的編碼。因此,所提出 的編碼器允許將參數(shù)立體聲編碼技術與基于波形的立體聲編碼技術高效地組合。
[0013] 經(jīng)常地,諸如MPEGAAC感知立體聲編碼器的感知立體聲編碼器可W在L/R立體聲 編碼和M/S立體聲編碼之間選定,其中,在后一種情況下,基于立體聲信號生成中央/側(cè)邊 信號。運樣的選擇可W是頻率變化的,即,對于一些頻帶,可W使用L/R立體聲編碼,而對于 其他頻帶,可W使用M/S立體聲編碼。
[0014] 在L和R聲道實質(zhì)上是獨立信號的情況下,運樣的感知立體聲編碼器通常不使用 M/S立體聲編碼,因為在該情況下,與L/R立體聲編碼相比,運樣的編碼方案不提供任何編 碼增益。編碼器將退回普通的L/R立體聲編碼,實質(zhì)上獨立地處理L和R。
[0015] 在相同的情況下,PS編碼器系統(tǒng)創(chuàng)建包含L和R聲道的縮混信號,運防止了L和 R聲道的獨立處理。對于使用殘余信號的PS編碼,運可W帶來與立體聲編碼相比而言較為 低效的編碼,在立體聲編碼中,L/R立體聲編碼或M/S立體聲編碼是自適應地可選擇的。
[0016] 因此,存在下述情況,其中,PS編碼器勝過在L/R立體聲編碼和M/S立體聲編碼之 間自適應選擇的感知立體聲編碼器,而在其他情況下,后一種編碼器勝過PS編碼器。
【發(fā)明內(nèi)容】
[0017] 本申請描述了基于將使用殘余的PS編碼與自適應L/R或M/S感知立體聲編碼(例 如,在MDCT域中的AAC感知聯(lián)合立體聲編碼)組合的思想的一種音頻編碼器系統(tǒng)和一種編 碼方法。運允許組合自適應L/R或M/S立體聲編碼(例如,在MPEGAAC中使用)的優(yōu)點和 使用殘余信號的PS編碼(例如,在環(huán)繞MPEG中使用)的優(yōu)點。而且,本申請描述了對應的 音頻解碼器系統(tǒng)和解碼方法。
[0018] 本申請的第一方面設及一種編碼器系統(tǒng),用于將立體聲信號編碼為比特流信號。 根據(jù)所述編碼器系統(tǒng)的一個實施例,所述編碼器系統(tǒng)包括縮混級,用于基于所述立體聲信 號來生成縮混信號和殘余信號。所述殘余信號可W覆蓋所使用的音頻頻率范圍的全部或僅 一部分。另外,所述編碼器系統(tǒng)包括參數(shù)確定級,用于確定PS參數(shù),諸如聲道間強度差和聲 道間交叉相關。優(yōu)選地,所述PS參數(shù)是頻率變化的。運樣的縮混級和參數(shù)確定級通常是PS 編碼器的一部分。
[0019] 另外,所述編碼器系統(tǒng)包括在所述縮混級的下游的感知編碼裝置,其中,能夠選擇 兩個編碼方案:
[0020] -基于所述縮混信號和所述殘余信號的和W及基于所述縮混信號和所述殘余信號 的差的編碼,或者
[0021] -基于所述縮混信號和基于所述殘余信號的編碼。
[0022] 應當注意,在編碼基于所述縮混信號和所述殘余信號的情況下,可W對所述縮混 信號和所述殘余信號編碼,或可W對與其成比例的信號編碼。在編碼基于和與差的情況下, 則可W對所述和與差編碼,或可W對與其成比例的信號編碼。
[0023] 所述選擇可W是頻率變化的(和時間變化的),即,對于第一頻帶,可W選擇編碼 基于和信號與差信號,而對于第二頻帶,可W選擇編碼基于所述縮混信號和基于所述殘余 信號。
[0024] 運樣的編碼器系統(tǒng)具有允許在L/R立體聲編碼和使用殘余的PS編碼之間切換 (優(yōu)選地W頻率變化的方式)的優(yōu)點:如果所述感知編碼裝置選擇(對于特定頻帶或?qū)τ?整個使用的頻率范圍)基于縮混和殘余信號的編碼,則所述編碼系統(tǒng)表現(xiàn)為像使用利用殘 余的標準PS編碼的系統(tǒng)那樣。然而,如果所述感知編碼裝置選擇(對于特定頻帶或?qū)τ谡?個所使用的頻率范圍)基于所述縮混信號和所述殘余信號的和信號W及基于所述縮混信 號和所述殘余信號的差信號,則在特定的情況下,所述和與差操作實質(zhì)上補償了在前的縮 混操作(除了可能不同的增益因子),W使得整個系統(tǒng)可W實際上執(zhí)行整個立體聲信號或 針對其頻帶的L/R編碼。例如,當所述立體聲信號的L和R聲道是獨立的并且具有相同的 電平時,運樣的情況出現(xiàn),如下詳細所述。
[00巧]優(yōu)選地,所述編碼方案的適用是時間和頻率相關的。因此,優(yōu)選地,通過L/R編碼 方案來對所述立體聲信號的一些頻帶編碼,而通過使用殘余的PS編碼方案來對所述立體 聲信號的其他頻帶編碼。
[0026] 應當注意,在如上所述的編碼基于縮混信號并且基于殘余信號的情況下,可W通 過對于縮混信號和殘余信號的兩個相逆(除了可能不同的增益因子)的串行操作來形成輸 入到核屯、編碼器的實際信號。例如,縮混信號和殘余信號被饋送到M/S至L/R變換級,然后 該變換級的輸出被饋送到L/R至M/S變換級。產(chǎn)生的信號(然后用于編碼)對應于縮混信 號和殘余信號(除了可能不同的增益因子之外)。
[0027] 下面的實施例利用運種思想。根據(jù)所述編碼器系統(tǒng)的一個實施例,所述編碼器系 統(tǒng)包括如上所述的縮混級和參數(shù)確定級。而且,所述編碼器系統(tǒng)包括變換級(例如,作為如 上所述的編碼裝置的一部分)。變換級通過執(zhí)行縮混信號和殘余信號的變換來生成偽L/R 立體聲信號。變換級優(yōu)選地執(zhí)行和與差變換,其中,對所述縮混信號和所述殘余信號求和W 生成所述偽立體聲信號的一個聲道(可能所述和也乘W因子),并且彼此相減W生成所述 偽立體聲信號的另一個聲道(可能所述差也乘W因子)。優(yōu)選地,所述偽立體聲信號的第 一聲道(例如,偽左聲道)與所述縮混和殘余信號的和成比例,而第二聲道(例如,偽右聲 道)與所述縮混和殘余信號的差成比例。因此,來自所述PS編碼器的縮混信號DMX和殘余 信號RES可W根據(jù)下式轉(zhuǎn)換為偽立體聲信號Lp、化:
[0028] Lp=g〇)MX+RE巧
[0029] Rp=g〇)MX-RE巧
[0030] 在上式中,增益歸一化因子g具有例如值勞。
[0031] 所述偽立體聲信號優(yōu)選地由感知立體聲編碼器(例如,作為所述編碼裝置的一部 分)處理。對于編碼,能夠選擇L/R立體聲編碼或M/S立體聲編碼。自適應L/R和M/S感 知立體聲編碼器可W是基于AAC的編碼器。優(yōu)選地,在L/R立體聲編碼和M/S立體聲編碼 之間的選擇是頻率變化的;因此,如上所述,所述選擇可W對于不同頻帶變化。而且,在L/R 編碼和M/S編碼之間的選擇優(yōu)選地是時間變化的。優(yōu)選地由所述感知立體聲編碼器進行在 L/R編碼和M/S編碼之間的選定。
[0032] 具有M/S編碼的選項的運樣的感知編碼器可W基于所述偽立體聲L/R信號來內(nèi)部 計算(偽)M和S信號(在時域或在所選擇的頻帶中)。運樣的偽M和S信號對應于縮混和 殘余信號(除了可能不同的增益因子)。因此,如果所述感知立體聲編碼器選擇M/S編碼, 則它實際上對所述縮混和殘余信號(它們對應于所述偽M和S信號)編碼,就像在使用利 用殘余的標準PS編碼的系統(tǒng)中進行的那樣。
[0033] 而且,在特殊情況下,所述變換級實質(zhì)上補償在前的縮混操作(除了可能不同的 增益因子之外),W使得整個編碼器系統(tǒng)可W實際上執(zhí)行整個立體聲信號的L/R編碼或?qū)?于其頻帶的L/R編碼(如果在感知編碼器中選擇L/R編碼)。運是例如在所述立體聲信號 的L和R聲道是獨立的并且具有相同電平時的情形,如下將詳細所述。因此,如果對于給定 頻帶所述立體聲信號的左和右聲道實質(zhì)上是獨立的并且具有實質(zhì)上相同的電平,則對于該 頻帶,所述偽立體聲信號實質(zhì)上與所述立體聲信號對應或成比例。
[0034] 因此,所述編碼器系統(tǒng)實際上允許在L/R立體聲編碼和使用殘余的PS編碼之間切 換,W便能夠適應于給定立體聲輸入信號的屬性。優(yōu)選地,所述編碼方案的適用是時間和頻 率相關的。因此,優(yōu)選地,通過L/R編碼方案來對所述立體聲信號的一些頻帶編碼,而通過 使用殘余的PS編碼方案來對立體聲信號的其他頻帶編碼。應當注意,M/S編碼實質(zhì)上是使 用殘余的PS編碼的特殊情況(因為,L/R至M/S變換是PS縮混操作的特殊情況),因此,編 碼器系統(tǒng)也可W執(zhí)行整體的M/S編碼。
[0035] 具有在所述PS編碼器下游和所述L/R或M/S感知立體聲編碼器上游的變換級的 所述實施例具有可W使用傳統(tǒng)PS編碼器和傳統(tǒng)感知編碼器的優(yōu)點。盡管如此,由于此處的 特殊使用,可W適用所述PS編碼器或所述感知編碼器。
[0036] 新的概念通過使能PS編碼和聯(lián)合立體聲編碼的高效組合改善了立體聲編碼的性 能。
[0037] 根據(jù)一個替選實施例,如上所述的編碼裝置包括變換級,用于對于一個或更多個 頻帶(例如,對于整個使用的頻率范圍或僅對于一個頻率范圍)基于所述縮混信號和所述 殘余信號來執(zhí)行和與差變換??蒞在頻域或時域中執(zhí)行所述變換。所述變換級生成針對所 述一個或更多個頻帶的偽左/右立體聲信號。所述偽立體聲信號的一個聲道對應于所述 和,并且另一個聲道對應于所述差。
[003引因此,在編碼基于所述和與差信號的情況下,所述變換級的輸出可W用于編碼,而 在編碼基于所述縮混信號和所述殘余信號的情況下,在所述編碼級的上游的信號可W用于 編碼。因此,該實施例不對所述縮混信號和殘余信號使用兩個串行的和與差變換,產(chǎn)生所述 縮混信號和殘余信號(除了可能不同的增益因子之外)。
[0039] 當基于所述縮混信號和殘余信號來選擇編碼時,選擇立體聲信號的參數(shù)立體聲編 碼。當基于所述和與差來選擇編碼時(即,基于偽立體聲信號的編碼),選擇立體聲信號的 L/R編碼。
[0040] 所述變換級可W是作為具有在L/R和M/S立體聲編碼之間的自適應選擇的感知 編碼器的一部分的L/R至M/S變換級(與傳統(tǒng)的L/R至M/S變換級相比,可能增益因子不 同)。應當注意,在L/R和M/S立體聲編碼之間的選定應當反相。因此,當所述選定裝置選 定M/S感知解碼時,選擇基于縮混信號和殘余信號的編碼(即,編碼信號不通過變換級),而 當所述選定裝置選定L/R感知解碼時,選擇基于由所述變換級生成的所述偽立體聲信號的 編碼(即,編碼信號通過變換級)。
[0041] 根據(jù)如上所述的實施例的任何一個所述的編碼器系統(tǒng)可W包括附加的SBR(頻段 復制)編碼器。SBR是HFR(高頻重建)的一種形式。SBR編碼器確定用于在解碼器中音頻 信號的較高頻范圍的重建的側(cè)邊信息。感知編碼器僅對較低頻率范圍編碼,由此減小比特 率。優(yōu)選地,所述SBR編碼器連接到所述PS編碼器的上游。因此,所述SBR編碼器可W在 立體聲域中,并且生成用于立體聲信號的SBR參數(shù)。將結(jié)合附圖對此進行詳細討論。
[0042] 優(yōu)選地,所述PS編碼器(即,縮混級和參數(shù)確定級)在過采樣頻域中運行(如下 所述的PS解碼器也同樣優(yōu)選地在過采樣頻域中運行)。對于時間至頻率變換,例如,可W在 PS編碼器上游使用具有QMF(正交鏡像濾波器)和奈奎斯特濾波器的復值混合濾波器組, 如在環(huán)繞MPEG標準中所述(參見文件IS0/IEC23003-1)。運允許時間和頻率自適應信號 處理,而無可聽的失真?zhèn)蜗?。另一方面,?yōu)選地,在臨界采樣MDCT域(例如,如在AAC中所 述)中執(zhí)行自適應L/R或M/S編碼,W便保證高效的量化信號表示。