<rp id="qjkvj"></rp>

<li id="qjkvj"></li>

用于音頻信號(hào)解碼或編碼的時(shí)域電平調(diào)整的制作方法_2

文檔序號(hào)：9457757閱讀：來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>用于音頻信號(hào)解碼或編碼的時(shí)域電平調(diào)整的制作方法

的解碼器；
[0033] 圖14示出了根據(jù)現(xiàn)有技術(shù)水平的另一個(gè)編碼器；
[0034] 圖15示出了根據(jù)至少一個(gè)實(shí)施方式的音頻信號(hào)解碼器的示意性框圖；以及
[0035] 圖16示出了根據(jù)至少一個(gè)實(shí)施方式的用于將編碼音頻信號(hào)表示進(jìn)行解碼的方法的示意性流程圖。
【具體實(shí)施方式】
[0036] 音頻處理通過(guò)多種方式發(fā)展，并且如何將音頻數(shù)據(jù)信號(hào)有效地編碼和解碼成為很多研究的課題。例如，由MPEG AAC (MPEG =運(yùn)動(dòng)圖像專(zhuān)家組；AAC =高級(jí)音頻編碼）提供了有效編碼。下面更詳細(xì)地解釋MPEG AAC的一些方面，作為音頻編碼和解碼的介紹。由于所描述的概念也可以適用于其他音頻編碼和解碼方案，所以MPEG AAC的描述要理解為僅僅是一個(gè)實(shí)例。
[0037] 根據(jù)MPEG AAC，使用縮放因子（scale-factor，尺度因子）、量化和碼本（尤其是霍夫曼碼本），將音頻信號(hào)的頻譜值進(jìn)行編碼。
[0038] 在進(jìn)行霍夫曼編碼之前，編碼器將要編碼的多個(gè)頻譜系數(shù)分成不同的部分（從上游兀件（例如，濾波器組、心理聲學(xué)模型、以及關(guān)于量化閾值和量化分辨率的由心理聲學(xué)模型控制的量化器）獲得頻譜系數(shù)）。對(duì)于頻譜系數(shù)的每個(gè)部分，編碼器選擇霍夫曼碼本進(jìn) 行霍夫曼編碼。MPEG AAC提供了 11個(gè)不同的頻譜霍夫曼碼本，用于將頻譜數(shù)據(jù)編碼，編碼器從這些碼本中選擇最適合于將該部分的頻譜系數(shù)編碼的碼本。編碼器給解碼器提供碼本標(biāo)識(shí)符，碼本標(biāo)識(shí)符識(shí)別用于該部分的頻譜系數(shù)的霍夫曼編碼的碼本作為邊信息（side information)〇
[0039] 在解碼器側(cè)，解碼器分析所接收的邊信息，以確定多個(gè)頻譜霍夫曼碼本中的哪個(gè) 用于編碼某個(gè)部分的頻譜值?；陉P(guān)于用于將解碼器要解碼的部分的頻譜系數(shù)編碼的霍夫曼碼本的邊信息，解碼器進(jìn)行霍夫曼解碼。
[0040] 在霍夫曼解碼之后，在解碼器處獲得多個(gè)量化的頻譜值。然后，解碼器進(jìn)行逆量化 (inverse quantization)，以轉(zhuǎn)化可由編碼器進(jìn)行的非均勾量化。由此，在解碼器處獲得逆量化頻譜值。
[0041] 然而，逆量化頻譜值可能依然未被縮放。所獲得的未縮放頻譜值分成縮放因子帶，每個(gè)縮放因子帶具有一個(gè)共同的縮放因子。用于每個(gè)縮放因子帶的縮放因子可用于解碼器作為由編碼器提供的邊信息。使用該信息，解碼器使縮放因子帶的未縮放頻譜值乘以其縮放因子。由此，獲得縮放頻譜值（scaled spectral value)。
[0042] 現(xiàn)在，參照?qǐng)D1-圖4,說(shuō)明根據(jù)現(xiàn)有技術(shù)水平的頻譜值的編碼和解碼。
[0043] 圖1示出了根據(jù)現(xiàn)有技術(shù)水平的編碼器。編碼器包括T/F (時(shí)頻）濾波器組10,用于將應(yīng)被編碼的音頻信號(hào)AS從時(shí)域轉(zhuǎn)變成頻域，以獲得頻域音頻信號(hào)。將頻域音頻信號(hào)饋入縮放因子單元20,以確定縮放因子。縮放因子單元20被適配為將頻域音頻信號(hào)的頻譜系數(shù)劃分在稱(chēng)為縮放因子帶（共享一個(gè)縮放因子的）的幾組頻譜系數(shù)中?？s放因子表示用于改變?cè)诟鱾€(gè)縮放因子帶內(nèi)的所有頻譜系數(shù)的幅度的增益值。而且，縮放因子單元20被適配為生成和輸出頻域音頻信號(hào)的未縮放的頻譜系數(shù)。
[0044] 而且，在圖1中的編碼器包括量化器，其用于量化頻域音頻信號(hào)的未縮放的頻譜系數(shù)。量化器30可以是非均勻量化器。
[0045] 在量化之后，將音頻信號(hào)的量化的未縮放頻譜饋入霍夫曼編碼器40內(nèi)，以被霍夫曼編碼?；舴蚵幋a用于音頻信號(hào)的量化的頻譜的冗余縮減。多個(gè)未縮放的量化的頻譜系數(shù)分成幾個(gè)部分。雖然在MPEG AAC中，提供了 11個(gè)可能的碼本，但是一個(gè)部分的所有頻譜系數(shù)由相同的霍夫曼碼本編碼。
[0046] 編碼器選擇特別適合于將該部分的頻譜系數(shù)編碼的11個(gè)可能的霍夫曼碼本中的一個(gè)。由此，為特定部分選擇編碼器的霍夫曼碼本，取決于特定部分的頻譜值。然后，可以將霍夫曼編碼的頻譜系數(shù)以及邊信息發(fā)送給解碼器，該邊信息包括（例如）關(guān)于用于將頻譜系數(shù)的部分編碼的霍夫曼碼本、用于特定縮放因子帶的縮放因子等的信息。
[0047] 兩個(gè)或四個(gè)頻譜系數(shù)由用于將該部分的頻譜系數(shù)進(jìn)行霍夫曼編碼的霍夫曼碼本的碼字編碼。編碼器將表示編碼的頻譜系數(shù)的碼字以及包括一部分的長(zhǎng)度的邊信息和關(guān)于用于將該部分的頻譜系數(shù)編碼的霍夫曼碼本的信息傳輸給解碼器。
[0048] 在MPEG AAC中，提供了用于將音頻信號(hào)的頻譜數(shù)據(jù)編碼的11個(gè)頻譜霍夫曼碼本。不同的頻譜霍夫曼碼本可由其碼本索引（在1與11之間的值）識(shí)別?；舴蚵a本的尺寸表示由所考慮的霍夫曼碼本的碼字編碼頻譜系數(shù)的數(shù)量。在MPEG AAC中，霍夫曼碼本的尺寸是2或4,表示碼字將音頻信號(hào)的2個(gè)或4個(gè)頻譜值編碼。
[0049] 然而，不同的霍夫曼碼本在其他性能方面也不同。例如，由霍夫曼碼本可編碼的頻譜系數(shù)的最大絕對(duì)值在碼本之間不同，并且例如，可以是1、2、4、7、12或更大。而且，所考慮的霍夫曼碼本可被適配為將符號(hào)值編碼或不編碼。
[0050] 利用霍夫曼編碼，頻譜系數(shù)由不同長(zhǎng)度的碼字編碼。MPEG AAC提供具有最大絕對(duì) 值1的2個(gè)不同的霍夫曼碼本、具有最大絕對(duì)值2的2個(gè)不同的霍夫曼碼本、具有最大絕對(duì) 值4的2個(gè)不同的霍夫曼碼本、具有最大絕對(duì)值7的2個(gè)不同的霍夫曼碼本、以及具有最大絕對(duì)值12的2個(gè)不同的霍夫曼碼本，其中，每個(gè)霍夫曼碼本表示不同的概率分布函數(shù)。霍夫曼編碼器將始終選擇最適合于將頻譜系數(shù)編碼的霍夫曼碼本。
[0051] 圖2示出了根據(jù)現(xiàn)有技術(shù)水平的解碼器?；舴蚵幋a的頻譜值由霍夫曼解碼器50 接收?；舴蚵獯a器50還接收作為邊信息的關(guān)于用于將頻譜值的每個(gè)部分的頻譜值編碼的霍夫曼碼本的信息。然后，霍夫曼解碼器50執(zhí)行霍夫曼解碼，以獲得未縮放的量化頻譜值。將未縮放的量化的頻譜值饋入逆量化器60內(nèi)。逆量化器執(zhí)行逆量化，以獲得逆量化的未縮放的頻譜值，將這些頻譜值饋入定標(biāo)器（scaler) 70內(nèi)。定標(biāo)器70還接收作為邊信息的每個(gè)縮放因子帶的縮放因子?；谒邮盏目s放因子，定標(biāo)器70縮放未縮放的逆量化頻譜值，以獲得縮放的逆量化頻譜值。然后，F(xiàn)/T濾波器組80將頻域音頻信號(hào)的縮放的逆量化頻譜值從頻移轉(zhuǎn)變到時(shí)域，以獲得時(shí)域音頻信號(hào)的樣本值。
[0052] 圖3示出了根據(jù)現(xiàn)有技術(shù)水平的編碼器，該編碼器與圖1的編碼器的不同之處在于，圖3的編碼器進(jìn)一步包括編碼器側(cè)TNS單元（TNS =時(shí)域噪聲整形）?？刹捎脮r(shí)域噪聲整形以通過(guò)相對(duì)于音頻信號(hào)的部分頻譜數(shù)據(jù)執(zhí)行濾波處理來(lái)控制量化噪聲的時(shí)域形狀。編碼器側(cè)TNS單元15相對(duì)于要編碼的頻域音頻信號(hào)的頻譜系數(shù)執(zhí)行線性預(yù)測(cè)編碼（LPC)計(jì)算。尤其地，也稱(chēng)為PARC0R系數(shù)的反射系數(shù)源自LPC計(jì)算。如果也由LPC計(jì)算獲得的預(yù)測(cè)增益未超過(guò)特定閾值，則不使用時(shí)域噪聲整形。然而，如果預(yù)測(cè)增益大于閾值，則采用時(shí)域噪聲整形。編碼器側(cè)TNS單元去除小于特定閾值的所有反射系數(shù)（reflection coefficient)。剩余的反射系數(shù)轉(zhuǎn)換成線性預(yù)測(cè)系數(shù)，并且用作在編碼器內(nèi)的噪聲整形濾波器系數(shù)。然后，編碼器側(cè)TNS單元對(duì)采用TNS的那些頻譜系數(shù)執(zhí)行濾波操作，以獲得音頻信號(hào)的經(jīng)處理的頻譜系數(shù)。將指示TNS信息的邊信息（例如，反射系數(shù)（PARC0R系數(shù)））發(fā)送給解碼器。
[0053] 圖4示出了根據(jù)現(xiàn)有技術(shù)水平的解碼器，該解碼器與在圖2中示出的解碼器的不同之處在于，圖4的解碼器進(jìn)一步包括解碼器側(cè)TNS單元75。解碼器側(cè)TNS單元接收音頻信號(hào)的逆量化的縮放頻譜，并且還接收TNS信息，例如，指示反射系數(shù)（PARC0R系數(shù)）的信息。解碼器側(cè)TNS單元75處理音頻信號(hào)的逆量化頻譜，以獲得音頻信號(hào)的經(jīng)處理的逆量化頻譜。
[0054] 圖5示出了根據(jù)本發(fā)明的至少一個(gè)實(shí)施方式的音頻信號(hào)解碼器100的示意性框圖。音頻信號(hào)解碼器被配置為接收編碼音頻信號(hào)表示。通常，編碼音頻信號(hào)表示伴有邊信息。可例如以由感知（perceptual)音頻編碼器產(chǎn)生的數(shù)據(jù)流的形式提供編碼的音頻信號(hào) 表示以及邊信息。音頻信號(hào)解碼器100進(jìn)一步被配置為提供解碼音頻信號(hào)表示，該表示可與在圖5中標(biāo)記為"充分補(bǔ)償?shù)臅r(shí)域表示"或者使用后續(xù)處理從其獲得的信號(hào)相同。
[0055] 音頻信號(hào)解碼器100包括解碼器預(yù)處理級(jí)110,其被配置為從編碼音頻信號(hào)表示中獲得多個(gè)頻帶信號(hào)。例如，在編碼音頻信號(hào)表示和邊信息包含在比特流內(nèi)的情況下，解碼器預(yù)處理級(jí)110可包括比特流解包器。根據(jù)編碼音頻信號(hào)表示目前攜帶相關(guān)信息（高分辨率）或不相關(guān)信息（低分辨率或根本沒(méi)有數(shù)據(jù)）的頻率范圍，一些音頻編碼標(biāo)準(zhǔn)可將時(shí)變分辨率以及不同的分辨率用于多個(gè)頻帶信號(hào)。這意味著在這個(gè)時(shí)間間隔內(nèi)，與暫時(shí)不攜帶或者僅僅攜帶很少信息的頻帶信號(hào)不同，通常使用比較高的分辨率（即，使用較大數(shù)量的位）來(lái)編碼其中編碼音頻信號(hào)表示目前具有大量相關(guān)信息的頻帶。對(duì)于某些頻帶信號(hào)，比特流甚至可以暫時(shí)根本不包含數(shù)據(jù)或比特，這是因?yàn)樵谙鄳?yīng)的時(shí)間間隔內(nèi)，這些頻帶信號(hào) 不包含任何相關(guān)信息。提供給解碼器預(yù)處理級(jí)110的比特流通常包含指示多個(gè)頻帶信號(hào)中的哪些頻帶信號(hào)包含用于目前考慮的時(shí)間間隔或"幀"的數(shù)據(jù)以及相應(yīng)的比特分辨率的信息（例如，作為邊信息的一部分）。
[0056] 音頻信號(hào)解碼器100進(jìn)一步包括削波估計(jì)器120,其被配置為分析關(guān)于編碼音頻信號(hào)表示的頻帶信號(hào)的增益的邊信息，以便確定用于編碼音頻信號(hào)表示的當(dāng)前電平位移因子。一些感知音頻編碼標(biāo)準(zhǔn)將單獨(dú)的縮放因子用于多個(gè)頻帶信號(hào)中的不同頻帶信號(hào)。單獨(dú) 縮放因子指示每個(gè)頻帶信號(hào)相對(duì)于其他頻帶信號(hào)的當(dāng)前幅度范圍。對(duì)于本發(fā)明的某些實(shí)施方式，這些縮放因子的分析允許大概評(píng)估在多個(gè)頻帶信號(hào)從頻域轉(zhuǎn)換成時(shí)域之后在相應(yīng)的時(shí)域表示內(nèi)可出現(xiàn)的最大幅度。然后，使用該信息，以便確定在沒(méi)有本發(fā)明提出的任何合適的處理的情況下，在考慮的時(shí)間間隔或"幀"的時(shí)域表示內(nèi)是否可能發(fā)生削波。削波估計(jì)器 120被配置為確定電平位移因子，該電平位移因子將多個(gè)頻帶信號(hào)中的所有頻帶信號(hào)相對(duì) 于電平（例如，關(guān)于信號(hào)幅度或信號(hào)功率）移動(dòng)相同的量。可以通過(guò)單獨(dú)的方式，確定每個(gè) 時(shí)間間隔（幀）的電平位移因子，即，電平位移因子是時(shí)間變化的。通常，削波估計(jì)器120 將嘗試以在時(shí)域表示內(nèi)非常不可能發(fā)生削波但是同時(shí)保持頻帶信號(hào)的合理的動(dòng)態(tài)范圍的方式，通過(guò)對(duì)于所有頻帶信號(hào)為共同的位移因子調(diào)整多個(gè)頻帶信號(hào)的電平。作為實(shí)例，考慮其中縮放因子的數(shù)值（number)比較高的編碼音頻信號(hào)表示的幀?，F(xiàn)在，削波估計(jì)器120可考慮最壞情況，即，在多個(gè)頻帶信號(hào)內(nèi)的可能信號(hào)峰值以建設(shè)性方式重疊或累加，在時(shí)域表示內(nèi)產(chǎn)生大幅度?，F(xiàn)在，電平位移因子可被確定為使在時(shí)域表示內(nèi)的這個(gè)假定峰值在期望的動(dòng)態(tài)范圍內(nèi)的數(shù)值，可能另外考慮邊緣。至少根據(jù)一些實(shí)施方式，削波估計(jì)器120在考慮的時(shí)間間隔或幀內(nèi)不需要編碼音頻信號(hào)表示本身來(lái)評(píng)估在時(shí)域表示內(nèi)發(fā)生削波的概率。原因在于，至少一個(gè)感知音頻編碼標(biāo)準(zhǔn)根據(jù)在特定頻帶信號(hào)和考慮的時(shí)間間隔內(nèi)要編碼的最大幅度，選擇多個(gè)頻帶信號(hào)中的頻帶信號(hào)的縮放因子。換言之，考慮編碼方案的性能，在考慮的時(shí)間間隔或幀內(nèi)，非?？赡馨l(fā)生一次可由為即將到來(lái)的頻帶信號(hào)選擇的位分辨率表示的最高值。使用這個(gè)假設(shè)，削波估計(jì)器120可集中評(píng)估關(guān)于頻帶信號(hào)的增益的邊信息（例如，所述縮放因子以及可能進(jìn)一步的參數(shù)），以便確定用于編碼音頻信號(hào)表示的當(dāng)前電平位移因子以及考慮的時(shí)間間隔（幀）。
[0057] 音頻信號(hào)解碼器100進(jìn)一步包括電平位移器130,其被配置為根據(jù)所述電平位移因子移動(dòng)頻帶信號(hào)的電平，以獲得電平位移的頻帶信號(hào)。
[0058] 音頻信號(hào)解碼器100進(jìn)一步包括頻域至?xí)r域轉(zhuǎn)換器140,其被配置為將所述電平位移的頻帶信號(hào)轉(zhuǎn)換成時(shí)域表示。僅舉幾例，頻域至?xí)r域轉(zhuǎn)換器140可以是逆濾波器組、逆改良離散余弦變換（逆MDCT)、逆正交鏡像濾波器（逆QMF)。對(duì)于某些音頻編碼標(biāo)準(zhǔn)，頻域至?xí)r域轉(zhuǎn)換器140可被配置為支持連續(xù)幀（其中，例如，在50%的持續(xù)時(shí)間，兩個(gè)幀重疊）的窗口化。...

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁(yè)1 2 3 4 5 6

相關(guān)技術(shù)