gin)和SPX結(jié)束 帶(或SPX結(jié)束頻率)203(稱為spxend)的標記示出了頻率(WSPX子帶0至16的形式)。 通常,SPX開始頻率202對應于截止頻率103。SPX結(jié)束頻率203可W對應于原始音頻信號 的帶寬104或?qū)诒纫纛l帶寬104低的頻率(如圖2a、圖化、圖2c和圖2d所示)。在編 碼之后,編碼的/解碼的音頻信號的帶寬通常對應于SPX結(jié)束頻率203。在一種實施方式 中,SPX起始頻率201對應于頻率區(qū)間No. 25,而SPX結(jié)束頻率203對應于頻率區(qū)間No. 229。 在SPX編碼處理的S個不同的階段示出了音頻信號的子帶;原始音頻信號的譜200(例如, MDCT譜)(圖2a頂部和圖化)W及在音頻信號的低頻分量的編碼/解碼之后的音頻信號 的譜210 (圖2a中間和圖2c)。音頻信號的低頻分量的編碼/解碼可W包括例如低頻分量 的矩陣化和去矩陣和/或禪合和去禪合。此外,示出了基帶101的子帶到高頻帶102的譜 轉(zhuǎn)換之后的譜220(圖2a底部和圖2d)。在圖2a的"原始"線(即,頻率子帶0至16)中示 出了音頻信號的原始部分的譜200 ;在圖2a的"去矩陣/去禪合低帶"線(即,示出的示例 中的頻率子帶2至6)中示出了通過禪合/矩陣化修改的信號的部分的譜210 ;并且在圖2a 的"轉(zhuǎn)換的高帶"(目P,示出的示例中的頻率子帶7至14)中示出了由譜轉(zhuǎn)換修改的信號的 部分的譜220。將被基于SPX的編碼器的處理修改的子帶206示為濃陰影,而將保持未被基 于SPX的編碼器修改的子帶205示為淡陰影。
[006引子帶下面的和/或SPX子帶組下面的大括號231、232、233指示針對哪些子帶或 針對哪些子帶組計算音調(diào)值(音調(diào)測量)。此外,其指示音調(diào)值或音調(diào)測量用于哪種目的。 SPX起始帶(spxstart)201與SPX結(jié)束帶(spxend)203之間的原始輸入信號的分頻帶音調(diào) 值231 (即,子帶或子帶組的音調(diào)值)通常用于指導編碼器決定是否需要發(fā)送新的SPX坐標 ("重發(fā)策略")。SPX坐標通常W每個SPX帶的增益因子的形式攜帶關(guān)于原始音頻信號的 譜包絡的信息。SPX重發(fā)策略可W指示是否必須針對音頻信號的新樣本塊發(fā)送新的SPX坐 標或是否可W重新使用(緊鄰在)先前的樣本塊的SPX坐標。另外,如圖2a和圖化所示, 高于spxbegin 202的SPX帶的分頻帶音調(diào)值231可W用作大方差衰減(LVA)計算的輸入。 大方差衰減是可W用于根據(jù)譜轉(zhuǎn)換來衰減潛在誤差的編碼器工具。在基帶中不具有相應分 量的擴展帶的強譜分量(反之亦然)可W被視為擴展誤差。LVA機制可W用于衰減該種擴 展誤差。通過圖化中的大括號可W看到,可W針對各個子帶(例如,子帶0、1、2等)和/ 或子帶組(例如,包括子帶11和12的組)計算音調(diào)值231。
[0064] 如上面所指出的,信號音調(diào)在用于確定被應用于高頻帶102中的重建的子帶的噪 聲混合量方面起重要的作用。如圖2c中所描繪的,對于解碼的(例如,去矩陣或去禪合的) 低帶和原始高帶分別計算音調(diào)值232。在該背景下,解碼(例如,去矩陣或去禪合)表示W(wǎng) 與在解碼器中進行方式相同的方式經(jīng)歷編碼器的先前應用的編碼步驟(例如,矩陣化和禪 合步驟)。換句話說,已經(jīng)在編碼器中模擬了該樣的解碼器機制。從而,包括譜210的子帶 0至6的低帶是解碼器將重建的譜的模擬。圖2c還示出了(僅)在該種情況下針對兩個較 大帶計算音調(diào),與每個SPX子帶(橫跨12個變換系數(shù)(TC)中的多個)或每個SPX子帶組 計算的原始信號的音調(diào)相反。如圖2c中的大括號所指示的,針對基帶101(例如,包括子帶 0至6)中的子帶組W及高頻帶1〇2(例如,包括子帶7至14)中的子帶組計算音調(diào)值232。 [00化]除了上述內(nèi)容之外,大方差衰減(LVA)計算通常需要關(guān)于轉(zhuǎn)換的變換系數(shù)(TC)計 算的另一音調(diào)輸入。針對與圖2a中的譜區(qū)域相同的譜區(qū)域,但不關(guān)于不同的數(shù)據(jù)測量音 調(diào),即,關(guān)于轉(zhuǎn)換的低帶子帶但不關(guān)于原始子帶測量音調(diào)。在圖2d中所示的譜220中對其 進行了描繪??蒞看到,基于轉(zhuǎn)換的子帶針對高頻帶102內(nèi)的子帶和/或子帶組確定音調(diào) 值 233。
[0066] 總的來說,可W看到,典型的基于SPX的編碼器在編碼/解碼處理過程中確定關(guān)于 原始音頻信號和/或從原始音頻信號得到的信號的各個子帶205、206和/或子帶組的音調(diào) 值231、232、233。具體地,可^針對原始音頻信號的子帶和/或子帶組、音頻信號的編碼的 /解碼的低頻分量的子帶和/或子帶組和/或音頻信號的近似的高頻分量的子帶和/或子 帶組確定音調(diào)值231、232、233。如上所概述的,音調(diào)值231、232、233的確定通常構(gòu)成基于 SPX的編碼器的總的計算工作量的很大部分。在下文中,描述了使得能夠顯著降低與音調(diào)值 231、232、233的確定有關(guān)的計算工作量從而降低基于SPX的編碼器的計算復雜度的方法和 系統(tǒng)。
[0067] 可W通過對子帶205、206的角速度《 (t)沿時間t的演化進行分析來確定子帶 205、206的音調(diào)值。角速度《(t)可W是角度或相位養(yǎng)隨時間的變化。因此,可W將角加 速度確定為角速度《 (t)隨時間的變化,即角速度《 (t)的一次微分或相位費的二次微分。 如果角速度《 (t)沿時間恒定,則子帶205、206是調(diào)性的,而如果角速度《 (t)沿時間變 化,則子帶205、206較無調(diào)性。因此,角速度《 (t)的變化速率(即,角加速度)為音調(diào)的 指示符。例如,子帶q或子帶組q的音調(diào)值T。231、232、233可W被確定為:
[0068]
【主權(quán)項】
1. 一種用于針對音頻信號的第一頻率子帶(205)確定第一分頻帶音調(diào)值(311,312)的 方法;其中所述第一分頻帶音調(diào)值(311,312)用于基于所述音頻信號的低頻分量來近似所 述音頻信號的高頻分量;所述方法包括: 基于所述音頻信號的樣本塊來確定相應一組頻率區(qū)間中的一組變換系數(shù); 使用所述一組變換系數(shù)分別針對所述一組頻率區(qū)間來確定一組區(qū)間音調(diào)值(341);以 及 組合針對位于所述第一頻率子帶內(nèi)的所述一組頻率區(qū)間的兩個或更多個鄰近頻率區(qū) 間的所述一組區(qū)間音調(diào)值(341)中的兩個或更多個相應的區(qū)間音調(diào)值的第一子集,從而產(chǎn) 生所述第一頻率子帶的所述第一分頻帶音調(diào)值(311,312)。
2. 根據(jù)權(quán)利要求1所述的方法,還包括: 通過組合針對位于第二頻率子帶內(nèi)的所述一組頻率區(qū)間的兩個或更多個鄰近頻率區(qū) 間的所述一組區(qū)間音調(diào)值(341)中的兩個或更多個相應的區(qū)間音調(diào)值的第二子集,來確定 所述第二頻率子帶的第二分頻帶音調(diào)值(321,322);其中所述第一頻率子帶和所述第二頻 率子帶包括至少一個共同的頻率區(qū)間,并且其中所述第一子集和所述第二子集包括相應的 至少一個共同的區(qū)間音調(diào)值(341)。
3. 根據(jù)權(quán)利要求1所述的方法,其中, 基于所述音頻信號的所述低頻分量來近似所述音頻信號的所述高頻分量包括:將一個 或更多個頻率區(qū)間的一個或更多個低頻變換系數(shù)從與所述低頻分量對應的低頻帶(101) 復制到與所述高頻分量對應的高頻帶(102); 所述第一頻率子帶位于所述低頻帶(101)內(nèi); 第二頻率子帶位于所述高頻帶(102)內(nèi); 所述方法還包括:通過組合針對被復制到所述第二頻率子帶的所述頻率區(qū)間中的兩個 或更多個頻率區(qū)間的所述一組區(qū)間音調(diào)值(341)中的兩個或更多個相應的音調(diào)值的第二 子集,來確定所述第二頻率子帶中的第二分頻帶音調(diào)值(233); 所述第二頻率子帶包括從位于所述第一頻率子帶內(nèi)的頻率區(qū)間復制的至少一個頻率 區(qū)間;并且 所述第一子集和所述第二子集包括相應的至少一個共同的區(qū)間音調(diào)值(341)。
4. 根據(jù)前述權(quán)利要求中任一項所述的方法,其中, 所述方法還包括:基于所述音頻信號的相應的塊序列來確定變換系數(shù)集合序列; 對于特定頻率區(qū)間,所述變換系數(shù)集合序列包括特定變換系數(shù)序列; 確定所述特定頻率區(qū)間的所述區(qū)間音調(diào)值(341)包括: 基于所述特定變換系數(shù)序列來確定相位序列;以及 基于所述相位序列來確定相位加速度;并且 所述特定頻率區(qū)間的所述區(qū)間音調(diào)值(341)是所述相位加速度的函數(shù)。
5. 根據(jù)前述權(quán)利要求中任一項所述的方法,其中,組合所述一組區(qū)間音調(diào)值(341)中 的兩個或更多個區(qū)間音調(diào)值的第一子集包括: 對所述兩個或更多個區(qū)間音調(diào)值(341)進行平均;或者 對所述兩個或更多個區(qū)間音調(diào)值(341)進行求和。
6. 根據(jù)前述權(quán)利要求中任一項所述的方法,其中,頻率區(qū)間的區(qū)間音調(diào)值(341)是僅 基于同一頻率區(qū)間的變換系數(shù)確定的。
7. 根據(jù)前述權(quán)利要求中任一項所述的方法,其中, 所述第一分頻帶音調(diào)值(311,312)被用于使用稱為SPX的譜擴展方案基于所述音頻信 號的低頻分量來近似所述音頻信號的高頻分量;并且 所述第一分頻帶音調(diào)值(311,312)被用于確定SPX坐標重發(fā)策略、噪聲混合因子和/ 或大方差衰減。
8. -種用于確定噪聲混合因子的方法;其中所述噪聲混合因子被用于基于音頻信號 的低頻分量來近似所述音頻信號的高頻分量;其中所述高頻分量包括高頻帶(102)中的一 個或更多個高頻子帶信號;其中所述低頻分量包括低頻帶(101)中的一個或更多個低頻 子帶信號;其中近似所述高頻分量包括:將一個或更多個低頻子帶信號復制到所述高頻帶 (102),從而產(chǎn)生一個或更多個近似的高頻子帶信號;所述方法包括: 基于所述一個或更多個高頻子帶信號確定目標分頻帶音調(diào)值(322); 基于所述一個或更多個近似的高頻子帶信號確定源分頻帶音調(diào)值(323);以及 基于所述目標分頻帶音調(diào)值(322)和所述源分頻帶音調(diào)值(323)確定所述噪聲混合因 子。
9. 根據(jù)權(quán)利要求8所述的方法,其中,所述方法包括:基于所述目標分頻帶音調(diào)值 (322)與所述源分頻帶音調(diào)值(323)的方差確定所述噪聲混合因子。
10. 根據(jù)權(quán)利要求8至9中任一項所述的方法,其中,所述方法包括將所述噪聲混合因 子b確定為: b - Tcopy · (l~var {Tcopy, ThighI) +Thigh · (var {Tcopy, ThighI),
是所述源音