用于音頻信號解碼或編碼的時域電平調(diào)整的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及音頻信號編碼、解碼以及處理,并且尤其涉及調(diào)整信號的電平,以頻時 轉(zhuǎn)換(或時頻轉(zhuǎn)換)至相應(yīng)的頻率至?xí)r間轉(zhuǎn)換器(或時間至頻率轉(zhuǎn)換器)的動態(tài)范圍。本 發(fā)明的一些實施方式涉及調(diào)整信號的電平,以頻時間轉(zhuǎn)換(或時頻轉(zhuǎn)換)至以固定點或整 數(shù)運算實施的相應(yīng)轉(zhuǎn)換器的動態(tài)范圍。本發(fā)明的進(jìn)一步實施方式涉及使用時域電平調(diào)整結(jié) 合邊信息的對頻譜解碼音頻信號的削波防止。
【背景技術(shù)】
[0002] 音頻信號處理變得越來越重要。由于現(xiàn)代感知音頻編解碼器需要通過越來越低的 位速率傳送令人滿意的音頻質(zhì)量,所以出現(xiàn)挑戰(zhàn)。
[0003] 在當(dāng)前音頻內(nèi)容產(chǎn)生和傳輸鏈中,例如,在內(nèi)容創(chuàng)建側(cè)通過專業(yè)AAC(高級音頻編 碼)編碼器將數(shù)字可用主內(nèi)容(PCM流(脈沖編碼調(diào)制流))編碼。然后,所產(chǎn)生的AAC比 特流可用于(例如)通過在線數(shù)字媒體商店購買。在很少的情況下,一些解碼的PCM樣本 被"削波",這意味著兩個或更多個連續(xù)的樣本達(dá)到可由輸出波形的均勻量化的固定點表示 (例如,根據(jù)PCM調(diào)制的)的潛在位分辨率(例如,16位)表示的最大電平。這會造成可聽 假象(audible artifact)(點擊或短失真)。雖然通常在編碼器側(cè)努力防止在解碼器側(cè)發(fā) 生削波,然而,由于各種原因(例如,不同的解碼器實現(xiàn)方式、舍入誤差、傳輸誤差等),仍會 在解碼器側(cè)發(fā)生削波。假設(shè)在編碼器的輸入處的音頻信號低于削波的閾值,在現(xiàn)代感知音 頻編編碼器內(nèi)發(fā)生削波的原因很多。首先,音頻編碼器為可用于輸入波形的頻率分解中的 傳輸?shù)男盘柺┘恿炕?,以降低傳輸?shù)據(jù)速率。在頻域中的量化誤差造成信號幅度和相位相 對原始波形具有小的偏差。如果幅度或相位誤差建設(shè)性地增加,則在時域中產(chǎn)生的幅度可 暫時高于原始波形。其次,參數(shù)化編碼方法(例如,頻帶復(fù)制SBR)通過比較粗糙的方式將 信號功率參數(shù)化。通常省略相位信息。因此,僅在接收器側(cè)的信號被再生具有正確的功率, 但是沒有波形保存。幅度接近全尺度的信號易于削波。
[0004] 現(xiàn)代音頻編碼系統(tǒng)提供了傳送響度級參數(shù)(gl)的可能性,這給解碼器提供了調(diào) 整響度的可能性,以通過統(tǒng)一的電平重放。通常,如果通過足夠高的電平將音頻信號解碼并 且所傳輸?shù)臍w一化增益暗示響度級更大,那么這可能造成削波。此外,控制音頻內(nèi)容(尤其 是音樂)中的常見做法將音頻信號提高為最大可能值,在由音頻編解碼器粗糙地量化時, 產(chǎn)生音頻信號的削波。
[0005] 為了防止音頻信號的削波,所謂的限制器已知為用于限制音頻電平的合適工具。 如果引入的音頻信號超過某個閾值,則限制器被激活,并且通過音頻信號在輸出處不超過 規(guī)定的電平的方式衰減音頻信號。遺憾的是,在限制器之前,需要足夠的凈空(headroom) (在動態(tài)范圍和/或位分辨率方面)。
[0006] 通常,在頻域中實現(xiàn)任何響度歸一化以及所謂的"動態(tài)范圍控制"(DRC)。即使濾 波器組重疊造成歸一化增益在幀之間變化,這也允許響度歸一化的平滑混合。
[0007] 進(jìn)一步地,由于較差量化或參數(shù)描述,如果在削波閾值附近的電平處控制原始音 頻,則何編碼的音頻信號可能進(jìn)入削波內(nèi)。
[0008] 通常,根據(jù)固定點算法,在高度有效的數(shù)字信號處理裝置中,可取地使計算復(fù)雜 性、內(nèi)存使用以及功耗盡可能較小。為此,還可取地使音頻樣本的字長盡可能較小。為了考 慮由響度歸一化造成的削波的任何潛在凈空,通常是音頻編碼器或解碼器的一部分的濾波 器組必須設(shè)計有更高的字長。
[0009] 可取地允許信號限制,而不喪失數(shù)據(jù)精確度和/或不需要將更高的字長用于解碼 器濾波器組或編碼器濾波器組??商鎿Q地或者此外,如果可為信號的連續(xù)時間部分或"幀" 逐個幀地連續(xù)確定要被頻時轉(zhuǎn)換(反之亦然)的信號的相關(guān)動態(tài)范圍,以便可以通過當(dāng)前 相關(guān)動態(tài)范圍適配由轉(zhuǎn)換器(頻域至?xí)r域轉(zhuǎn)換器或時域至頻域轉(zhuǎn)換器)提供的動態(tài)范圍的 方式,調(diào)整信號的電平,那么這可取。還期望的是,使為了頻時轉(zhuǎn)換或時頻轉(zhuǎn)換的目的進(jìn)行 的這種電平位移對于解碼器或編碼器的其他元件基本為"透明的"。由根據(jù)權(quán)利要求1所述 的音頻信號解碼器、根據(jù)權(quán)利要求14所述的音頻信號編碼器以及根據(jù)權(quán)利要求15所述的 用于將編碼音頻信號表示進(jìn)行解碼的方法,解決這些期望和/或可能的進(jìn)一步期望中的至 少一個。
【發(fā)明內(nèi)容】
[0010] 提供了一種用于基于編碼音頻信號表示提供解碼音頻信號表示的音頻信號解碼 器。音頻信號解碼器包括解碼器預(yù)處理級(Stage)(其被配置為從編碼音頻信號表示獲得 多個頻帶信號)。所述音頻信號解碼器進(jìn)一步包括削波估計器,削波估計器被配置為關(guān)于音 頻信號表示、多個頻率信號和/或邊信息是否暗示電位削波來分析編碼音頻信號表示、多 個頻率信號以及關(guān)于編碼音頻信號表示的頻帶信號的增益的邊信息中的至少一個,,以便 確定用于編碼音頻信號表示的當(dāng)前電平位移因子。在邊信息暗示電位削波時,當(dāng)前電平位 移因子使所述多個頻帶信號的信息朝著最低有效位移動,以便在至少一個最高有效位處獲 得凈空。音頻信號解碼器還包括電平位移器,電平位移器被配置為根據(jù)電平位移因子移動 頻帶信號的電平,以獲得電平位移的頻帶信號。此外,音頻信號解碼器包括被配置為將電平 位移的頻帶信號轉(zhuǎn)換成時域表示的頻域至?xí)r域轉(zhuǎn)換器。音頻信號解碼器進(jìn)一步包括電平位 移補償器,電平位移補償器被配置為作用在所述時域表示上,以至少部分補償由電平位移 器施加至電平位移的頻帶信號的電平位移并且獲得充分補償?shù)臅r域表示。
[0011] 本發(fā)明的進(jìn)一步實施方式提供了一種被配置為基于輸入音頻信號的時域表示提 供編碼的音頻信號表示的音頻信號編碼器。音頻信號編碼器包括削波估計器,削波估計器 被配置為關(guān)于是否暗示電平削波分析輸入音頻信號的時域表示,以便確定用于輸入信號表 示的當(dāng)前電平位移因子。當(dāng)暗示電位削波時,當(dāng)前電平位移因子使輸入音頻信號的時域表 示朝著最低有效位移動,以便在至少一個最高有效位處獲得凈空。音頻信號編碼器進(jìn)一步 包括電平位移器,電平位移器被配置為根據(jù)電平位移因子移動輸入音頻信號的時域表示的 電平,以獲得電平位移的時域表示。此外,音頻信號編碼器包括被配置為將電平位移的時域 表示轉(zhuǎn)換成多個頻帶信號的時域至頻域轉(zhuǎn)換器。音頻信號編碼器還包括電平位移補償器, 電平位移補償器被配置為作用在多個頻帶信號上,以至少部分補償由電平位移器施加至電 平位移的時域表示的電平位移并且獲得多個充分補償?shù)念l帶信號。
[0012] 本發(fā)明的進(jìn)一步實施方式提供了一種用于將編碼音頻信號表示解碼以便獲得解 碼音頻信號表示的方法。該方法包括預(yù)處理編碼音頻信號表示,以獲得多個頻帶信號。該 方法進(jìn)一步包括關(guān)于是否暗示電位削波,來分析編碼音頻信號表示、頻帶信號以及關(guān)于頻 帶信號的增益的邊信息中的至少一個,以便確定用于編碼音頻信號表示的當(dāng)前電平位移因 子。當(dāng)暗示電位削波時,當(dāng)前電平位移因子使輸入音頻信號的時域表示朝著最低有效位移 動,以便獲得在至少一個最高有效位處的凈空。此外,該方法包括根據(jù)電平位移因子移動所 述頻帶信號的電平,以獲得電平位移的頻帶信號。該方法還包括執(zhí)行頻帶信號到時域表示 的頻域至?xí)r域轉(zhuǎn)換。該方法進(jìn)一步包括作用在所述時域表示上,以至少部分補償施加到電 平位移的頻帶信號的電平位移并且獲得充分補償?shù)臅r域表示。
[0013] 此外,提供了一種當(dāng)在在計算機或信號處理器上執(zhí)行時實施上述方法的計算機程 序。
[0014] 進(jìn)一步實施方式提供了一種用于基于編碼音頻信號表示提供解碼音頻信號表示 的音頻信號解碼器。音頻信號解碼器包括解碼器預(yù)處理級,解碼器預(yù)處理級被配置為從編 碼的音頻信號表示中獲得多個頻帶信號。音頻信號解碼器進(jìn)一步包括削波估計器,被配置 為分析編碼音頻信號表示、多個頻率信號以及關(guān)于編碼音頻信號表示的頻帶信號的增益的 邊信息中的至少一個,以便確定用于編碼音頻信號表示的當(dāng)前電平位移因子。音頻信號解 碼器還包括電平位移器,電平位移器被配置為根據(jù)電平位移因子移動頻帶信號的電平,以 獲得電平位移的頻帶信號。此外,音頻信號解碼器包括被配置為將電平位移的頻帶信號轉(zhuǎn) 換成時域表示的頻域至?xí)r域轉(zhuǎn)換器。音頻信號解碼器進(jìn)一步包括電平位移補償器,電平位 移補償器被配置為作用在時域表示上,以至少部分補償由電平位移器施加到電平位移的頻 帶信號的電平位移并且獲得充分補償?shù)臅r域表示。
[0015] 本發(fā)明的進(jìn)一步實施方式提供了一種被配置為基于輸入音頻信號的時域表示提 供編碼音頻信號表示的音頻信號編碼器。音頻信號編碼器包括削波估計器,削波估計器被 配置為分析輸入音頻信號的時域表示,以便確定用于輸入信號表示的當(dāng)前電平位移因子。 音頻信號編碼器進(jìn)一步包括電平位移器,電平位移器被配置為根據(jù)電平位移因子移動輸入 音頻信號的時域表示的電平,以獲得電平位移的時域表示。此外,音頻信號編碼器包括被配 置為將電平位移的時域表示轉(zhuǎn)換成多個頻帶信號的時域至頻域轉(zhuǎn)換器。音頻信號編碼器還 包括電平位移補償器,電平位移補償器被配置為作用在多個頻帶信號上,以至少部分補償 由電平位移器施加到電平位移的時域表示的電平位移并且獲得多個充分補償?shù)念l帶信號。
[0016] 本發(fā)明的進(jìn)一步實施方式提供了一種用于將編碼音頻信號表示解碼以便獲得解 碼音頻信號表示的方法。該方法包括預(yù)處理編碼音頻信號表示,以獲得多個頻帶信號。該 方法進(jìn)一步包括分析編碼音頻信號表示、頻帶信號以及關(guān)于頻帶信號的增益的邊信息中的 至少一個,以便確定編碼音頻信號表示的當(dāng)前電平位移因子。此外,該方法包括根據(jù)電平位 移因子移動頻帶信號的電平,以獲得電平位移的頻帶信號。該方法還包括執(zhí)行頻帶信號到 時域表示的頻域至?xí)r域轉(zhuǎn)換。該方法進(jìn)一步包括作用在時域表示上,以至少部分補償施加 到電平位移的頻帶信號的電平位移并且獲得充分補償?shù)臅r域表示。
[0017] 至少一些實施方式基于以下洞察:在不喪失相關(guān)信息的情況下,可以在時間間隔 期間,將頻域表示的多個頻帶信號移動某個電平位移因子,其中,音頻信號的總體響度級較 高。確切地說,無論如何,相關(guān)信息移動到可能包含噪聲的位。通過這種方式,即使頻帶信 號的動態(tài)范圍可以比由頻域至?xí)r域轉(zhuǎn)換器的有限字長支持的動態(tài)范圍更大,也可以使用具 有有限字長的頻域至?xí)r域轉(zhuǎn)換器。換言之,本發(fā)明的至少一些實施方式利用以下事實:最低 有效位通常不攜帶任何相關(guān)信息,而音頻信號較響亮,即,相關(guān)信息更可能包含在最高有效 位內(nèi)。施加到電平位移的頻帶信號的電平位移還可具有降低在時域表示內(nèi)發(fā)生削波的可能 性的優(yōu)點,其中,所述削波由多個頻帶信號的一個或多個頻帶信號的建設(shè)性疊加造成。
[0018] 這些洞察和發(fā)現(xiàn)還通過相似的方式適用于音頻信號編碼器和用于編碼原始音頻 信號以便獲得編碼音頻信號表示的方法。
【附圖說明】
[0019] 在下文中,參照示圖,更詳細(xì)地描述本發(fā)明的實施方式,其中:
[0020] 圖1示出了根據(jù)現(xiàn)有技術(shù)水平的編碼器;
[0021] 圖2描繪了根據(jù)現(xiàn)有技術(shù)水平的解碼器;
[0022] 圖3示出了根據(jù)現(xiàn)有技術(shù)水平的另一個編碼器;
[0023] 圖4描繪了根據(jù)現(xiàn)有技術(shù)水平的進(jìn)一步解碼器;
[0024] 圖5示出了根據(jù)至少一個實施方式的音頻信號解碼器的示意性框圖;
[0025] 圖6示出了根據(jù)至少一個進(jìn)一步實施方式的音頻信號解碼器的示意性框圖;
[0026] 圖7示出了說明根據(jù)實施方式的所提出的音頻信號解碼器以及所提出的用于將 編碼音頻信號表示進(jìn)行解碼的方法的概念的示意性框圖;
[0027] 圖8是電平位移以獲得凈空的示意性視覺化;
[0028] 圖9示出了根據(jù)至少一些實施方式的可以是音頻信號解碼器或編碼器的部件的 可能過渡形狀調(diào)整器的示意性框圖;
[0029] 圖10描繪了包括預(yù)測濾波調(diào)整器的進(jìn)一步實施方式的估計單元;
[0030] 圖11示出了用于生成反向數(shù)據(jù)流(back data stream)的設(shè)備;
[0031] 圖12示出了根據(jù)現(xiàn)有技術(shù)水平的編碼器;
[0032] 圖13描繪了根據(jù)現(xiàn)有技術(shù)水平