編碼/解碼音頻信號的設備和方法

文檔序號：7619076閱讀：379來源：國知局

專利名稱：編碼/解碼音頻信號的設備和方法
技術領域：
本發(fā)明一般涉及一種編碼音頻信號的設備和方法以及一種解碼音頻信號的設備和方法。
背景技術：
圖1示出用于檢測聲音的人耳結構。
參考圖1，當人耳外輪廓上的耳朵基準點(ERP)被耳機、頭戴式耳機、電話聽筒等等蓋住之后，在ERP和人耳中部上的鼓膜基準點(DRP)之間形成一個密封的空間。因此，當人耳檢測到從音頻裝置輸出的音頻信號時，共振效應將聲壓在對應于該密封空間的共振頻率的頻域內(大約為1～10KHz頻帶)提高了15dB以上。由于該ERP-DRP共振效應，即使采用高質量的耳機、頭戴式耳機、電話聽筒，還是存在人耳聽到中頻帶被放大很多的音頻信號的問題。結果，音頻信號的聲音質量惡化。特別是，因為耳機、頭戴式耳機、電話聽筒等等的使用隨著便攜式音頻裝置和移動電話的廣泛使用而增加，所以該問題變得越來越重要。

發(fā)明內容
本一般發(fā)明構思提供一種解碼音頻信號的設備和方法，以補償在音頻解碼操作中的ERP-DRP共振效應。
本一般發(fā)明構思還提供一種具有執(zhí)行該音頻解碼方法的可執(zhí)行代碼的計算機可讀介質。
本一般發(fā)明構思還提供一種在音頻編碼操作中通過考慮ERP-DRP共振效應來以更高的壓縮率編碼音頻信號的設備和方法。
本一般發(fā)明構思還提供一種具有執(zhí)行該音頻編碼方法的可執(zhí)行代碼的計算機可讀介質。
本一般發(fā)明構思的其他方面將部分在下面的描述中提出，并且部分將根據該描述而清楚，或者可以通過對本一般發(fā)明構思的實踐而得知。
本一般發(fā)明構思的上述和/或其它方面是通過提供一種音頻解碼方法來實現(xiàn)的，該方法包括通過解碼輸入信號而產生音頻信號，以及將該音頻信號的原始波形變換為補償聲學共振效應的補償波形。
本一般發(fā)明構思的上述和/或其它方面還通過提供一種音頻解碼設備來實現(xiàn)，該設備包括通過解碼輸入信號產生音頻信號的解碼器，以及將解碼器產生的音頻信號的原始波形變換為補償聲學共振效應的補償波形的共振補償器。
本一般發(fā)明構思的上述和/或其它方面還通過提供一種具有執(zhí)行該音頻解碼方法的可執(zhí)行代碼的計算機可讀介質來實現(xiàn)。
本一般發(fā)明構思的上述和/或其它方面還通過提供一種音頻編碼方法來達到，該方法包括根據調整為說明聲學共振效應的掩蔽閾值曲線來計算音頻信號的多個子帶樣本中的每一個樣本的信掩比(SMRsignal-to-mask ratio)，根據所計算的信掩比將比特分配給每一子帶樣本，并在所分配的比特范圍內量化和編碼該子帶樣本。
本一般發(fā)明構思的上述和/或其它方面還通過提供一種音頻編碼設備來達到，該設備包括心理聲學模型單元，用于根據調整為說明聲學共振效應的掩蔽閾值曲線來計算音頻信號的多個子帶樣本中的每一個樣本的信掩比(SMR)；比特分配器，用于根據所計算的信掩比而將比特分配給每一子帶樣本；以及量化/編碼單元，用于在所分配的比特范圍內量化和編碼該子帶樣本。
本一般發(fā)明構思的上述和/或其它方面還通過提供一種具有執(zhí)行該音頻編碼方法的可執(zhí)行代碼的計算機可讀介質來達到。

通過下面結合附圖對實施例的描述，本一般發(fā)明構思的上述和/或其它方面和優(yōu)點將變得更為明顯和更容易理解，在附圖中
圖1示出用于檢測聲音的人耳結構；圖2是示出人耳基準點(ERP)和人耳的鼓膜基準點(DRP)之間的共振波形的圖；圖3是示出通過翻轉圖2的共振波形獲得的補償波形的圖；圖4是示出通過將圖3的補償波形施加到圖2的共振波形而獲得的結果的圖；圖5是示出根據本一般發(fā)明構思的實施例的音頻解碼設備的方框圖；圖6是示出根據本一般發(fā)明構思的實施例的解碼音頻信號的方法的流程圖；圖7示出由圖5的音頻解碼設備所再現(xiàn)的音頻信號與傳統(tǒng)音頻解碼設備所再現(xiàn)的音頻信號的比較；圖8示出用于考慮ERP和DRP之間的共振效應的掩蔽效果；圖9是示出根據本一般發(fā)明構思的實施例的音頻編碼設備的方框圖；和圖10是示出根據本一般發(fā)明構思的實施例的音頻編碼方法的流程圖。
具體實施例方式
現(xiàn)在詳細參考在附圖中示出了其示例的本一般發(fā)明構思的實施例，其中相同的附圖標記全部表示相同的元件。下面描述的實施例是為了在參考附圖的同時解釋本一般發(fā)明構思。
圖2是示出人耳基準點(ERP)和人耳的鼓膜基準點(DRP)之間的共振波形的圖。
參考圖2，測量由于ERP和DRP之間的密封空間而使聲壓在約1～10KHz頻帶內提高了15dB以上的共振波形。ERP-DRP共振波形可以通過將探針麥克風插入人或人體模型頭的耳朵內來測量。
圖3是示出通過翻轉圖2的共振波形獲得的補償波形的圖。
參考圖3，該補償波形是通過關于頻率軸翻轉圖2示出的共振波形而獲得的。
圖4是示出通過將圖3的補償波形施加到圖2的共振波形而獲得的結果的圖。
參考圖4，當耳機或頭戴式耳機的用戶聽到施加了圖3的補償波形的音頻信號時，該用戶實際上聽到的是具有原始波形的音頻信號。在整個詳細說明中，為了圖示的目的，假定音頻信號的原始波形是平坦波形。但是，應當理解音頻信號的原始波形可以具有其它各種形狀。
參考圖2、3和4，用于補償ERP-DRP共振效應的音頻解碼設備可以通過測量由ERP-DRP共振效應產生的共振波形、通過翻轉所測量的共振波形來計算補償波形、設計一個或多個諸如有限脈沖響應(FIR)濾波器和/或無限脈沖響應(IIR)濾波器的數字濾波器以將計算的補償波形施加到測量的共振波形上、以及在音頻解碼設備中實施所設計的數字濾波器來實現(xiàn)。
圖5是示出根據本一般發(fā)明構思的實施例的音頻解碼設備的方框圖。
參考圖5，該音頻解碼設備包括解碼器51、第一共振補償器52、第一數模轉換器(DAC)53、第一放大器54、第二共振補償器55、第二DAC 56、和第二放大器57。
解碼器51通過解碼輸入信號產生音頻信號。通常，該輸入信號可以是從MPEG音頻編碼設備傳輸的比特流。
第一共振補償器52將解碼器51產生的音頻信號的波形變換為補償ERP-DRP共振效應的第一波形。如圖3所示，用于補償ERP-DRP共振效應的補償波形可以通過翻轉圖2所示的ERP-DRP共振波形來獲得。
第一共振補償器52包括第一共振頻帶提取器521和第一波形變換器522。第一共振頻帶提取器521提取受到ERP-DRP共振效應影響的頻帶，以補償該ERP-DRP共振效應。也就是說，第一共振頻帶提取器521可以從音頻信號中提取大約1～10KHz的頻帶。第一波形變換器522將第一共振頻帶提取器521提取出的頻帶變換為補償波形，其(在音頻信號平坦時)可以具有與圖3所示的補償波形相同的形狀。如上所述，第一共振補償器52可以用一個或多個諸如FIR濾波器和IIR濾波器的數字濾波器來實現(xiàn)。
第一DAC 53將已經由第一共振補償器52變換為補償波形的數字音頻信號轉換為模擬音頻信號。如上所述，輸入第一DAC 53的音頻信號是通過對MEPG音頻編碼設備所傳輸的比特流進行解碼而獲得的數字音頻信號，并且可以為了再現(xiàn)而轉換為模擬音頻信號。
第一放大器54將第一DAC 53所轉換的模擬音頻信號輸出到揚聲器。該揚聲器可以是在人耳的ERP和DRP之間形成密封空間的音頻裝置的左揚聲器，該音頻裝置例如是耳機、頭戴式耳機、電話聽筒等等。
第二共振補償器55、第二DAC 56、和第二放大器57分別執(zhí)行與第一共振補償器52、第一DAC 53、和第一放大器54相同的功能。因此，將不提供對第二共振補償器55、第二DAC 56、和第二放大器57的描述。但是，第一共振補償器52、第一DAC 53、和第一放大器54可以處理輸出到左揚聲器的音頻信號，而第二共振補償器55、第二DAC 56、和第二放大器57可以處理輸出到右揚聲器的音頻信號。因此，解碼器51向第一共振補償器52提供將要輸出到左揚聲器的解碼數據，向第二共振補償器55提供將要輸出到右揚聲器的解碼數據。盡管圖5示出由兩個對應輸出裝置(例如揚聲器)處理和輸出兩個聲道(例如左聲道和右聲道)，但是應當理解本一般發(fā)明構思的實施例可以用于處理用于單聲道輸出裝置的音頻信號。例如，本一般發(fā)明構思的實施例可以用于處理用于電話聽筒的聲音。
圖6是示出根據本一般發(fā)明構思的實施例的解碼音頻信號的方法的流程圖。
參考圖6，該音頻解碼方法包括操作61到66。圖6所示的音頻解碼方法包括可以由圖5所示的音頻解碼設備執(zhí)行的一系列操作?；蛘撸瑘D6的方法可以由其它音頻裝置實施。
在操作61中，音頻信號通過解碼輸入信號而產生。
在操作62中，從音頻信號中提取出受到ERP-DRP共振效應影響的頻帶(即由于ERP-DRP共振效應而隨后被變換的)。
在操作63中，所提取的頻帶被變換為補償波形，其(在音頻信號平坦時)可能具有與圖3所示的補償波形相同的形狀?；蛘撸斠纛l信號不平坦時，補償波形可以具有不同的形狀。
也就是說，在操作62和63中，在操作61中產生的音頻信號的波形被變換為補償波形，其由于音頻信號中的ERP-DRP共振效應而隨后被變換。這里，由于ERP-DRP共振效應而隨后被變換的補償波形是通過翻轉ERP-DRP共振波形而獲得的。由此，在音頻信號中實際發(fā)生ERP-DRP共振效應之前，音頻信號就被補償了ERP-DRP共振效應。
在操作64，將具有在操作63中獲得的補償波形的數字音頻信號轉換為模擬音頻信號。如上所述，具有在操作63中獲得的補償波形的數字音頻信號可以是通過對MEPG音頻編碼設備所傳輸的比特流進行解碼而獲得的數字音頻信號，并且可以為了再現(xiàn)而被轉換為模擬音頻信號?；蛘?，該數字音頻信號可以從諸如聲音文件、致密盤(CD)、或數字視頻盤(DVD)的計算機可讀介質中獲得。
在操作65和66中，對操作64中獲得的已經補償了ERP-DRP共振效應的模擬音頻信號進行放大并輸出到揚聲器。然后當通過揚聲器輸出模擬音頻信號時，發(fā)生ERP-DRP共振效應。因此，具有原始波形的原始音頻信號被再現(xiàn)并可以由人耳檢測到，因為ERP-DRP共振效應將補償波形變換為原始音頻信號的原始波形。
圖7示出由圖5的音頻解碼設備再現(xiàn)的音頻信號與傳統(tǒng)音頻解碼設備再現(xiàn)的音頻信號的比較。用戶可以例如采用耳機、頭戴式耳機、或電話聽筒來檢測再現(xiàn)的音頻信號。也可以采用其它可以在人耳的ERP和DRP之間創(chuàng)建密封空間的音頻裝置。
參考圖7，當用戶采用傳統(tǒng)的音頻解碼設備收聽到對應于具有平坦波形的輸入音頻信號71的輸出音頻信號時，由用戶實際檢測到的輸出音頻信號是具有被放大了大約15dB的中頻帶的波形的信號72。
但是，當用戶采用根據本一般發(fā)明構思的實施例的音頻解碼設備收聽到對應于具有平坦波形的輸入音頻信號73的輸出音頻信號時，從根據本一般發(fā)明構思的實施例的音頻解碼設備輸出的音頻信號是具有補償波形的信號74。因此，由用戶實際檢測到的輸出音頻信號是具有與輸入音頻信號73相同平坦波形的信號75。由此，輸入音頻信號73的原始波形可以通過采用補償波形對音頻信號的原始波形預補償ERP-DRP共振效應而獲得。
因此，當本一般發(fā)明構思的實施例應用于采用耳機、頭戴式耳機、電話聽筒等等的便攜式音頻裝置、移動電話、和個人數字助理(PDA)時，可以聽到具有極好的聲音質量而沒有放大的中頻帶的輸出音頻信號。
圖8示出在考慮ERP和DRP共振效應時出現(xiàn)的掩蔽效果。
大多數有損耗的音頻壓縮算法強調當原始音頻信號與壓縮音頻信號進行比較時人的主觀感覺不能將原始音頻信號與壓縮音頻信號區(qū)分開來的最大程度，而不是強調原始音頻信號和壓縮音頻信號之間的最小算術誤差。在詳細壓縮處理的方面，去除了不能被人耳聽到的聲音，并且僅分配比特來表示人能聽到的聲音。例如，由于人耳很少聽到非常高和非常低頻率的分量，所以非常高和非常低頻率的分量可以排除在壓縮處理之外。此外，基于人聽力的特性而被特定掩蔽頻率掩蔽的頻率分量可以按照低于正常的精度來編碼。心理聲學模型根據人耳和大腦之間的交互來使用該掩蔽效應。根據該心理聲學模型，由于掩蔽而使得人耳無法聽到的頻率分量的最大聲壓被稱為掩蔽閾值。一旦該頻率分量的聲壓超過該掩蔽閾值，就能在該特定掩蔽頻率上聽到該頻率分量。由于無法聽到聲壓小于掩蔽閾值的音頻信號，所以可以通過音頻編碼處理來去除這些音頻信號。
參考圖8，掩蔽閾值曲線的中間頻帶(即ERP-DRP共振頻帶)由于ERP-DRP共振效應而被放大了15dB以上。如果認為ERP-DRP共振頻帶是掩蔽頻帶，那么即使在正常狀態(tài)下能夠聽到該掩蔽頻帶的相鄰頻帶(即沒有ERP-共振效應)，但是還是不能聽到該掩蔽頻帶的相鄰頻帶，因為它們被掩蔽頻帶掩蔽了。因此，可以通過調整說明對用于壓縮聲音數據的心理聲學模型的ERP-DRP共振效應的掩蔽閾值曲線來最大化壓縮率。
圖9是示出根據本一般發(fā)明構思的實施例的音頻編碼設備的方框圖。
參考圖9，該音頻編碼設備包括濾波器組91、心理聲學模型單元92、比特分配器93、量化/編碼單元94、以及比特流格式器95。
濾波器組91將音頻信號劃分為多個子帶樣本。輸入到濾波器組91和心理聲學模型單元92的音頻信號是脈碼調制(PCM)音頻信號。
心理聲學模型單元92根據調整為說明ERP-DRP共振效應的掩蔽閾值曲線來計算音頻信號的每個子帶樣本的信掩比(SMR)。也就是說，心理聲學模型單元92考慮具有由于ERP-DRP共振效應而已經增加的掩蔽閾值的ERP-DRP共振頻帶，來計算音頻信號的每個子帶樣本的信掩比。由于ERP-DRP共振效應而對掩蔽閾值進行了調整，因此可以應用頻譜掩蔽理論和時間掩蔽理論。在此，所應用的掩蔽理論可以包括同時掩蔽、預掩蔽、和后掩蔽，這可以用于傳統(tǒng)的感覺編碼。
心理聲學模型單元92包括FFT(快速傅立葉變換)單元921、共振頻帶計算器922、和高/低頻帶計算器923。
FFT單元921通過對音頻信號進行快速傅立葉變換來計算頻譜波形。
共振頻帶計算器922計算由于ERP-DRP共振效應而隨后被變換的頻帶。共振頻帶計算器922還計算ERP-DRP共振頻帶的SMR。具體地說，共振頻帶計算器922通過從FFT單元921計算的頻譜波形中確定ERP-DRP共振頻帶的掩蔽閾值和子帶樣本的聲壓級，而計算ERP-DRP共振頻帶的SMR。然后，共振頻帶計算器922計算所確定的ERP-DRP共振頻帶的掩蔽閾值和子帶樣本的聲壓級之間的差值。因此，共振頻帶計算器922可以確定ERP-DRP共振頻帶對圍繞該ERP-DRP共振頻帶的子帶樣本提供的掩蔽效應。
高/低頻帶計算器923計算與不同于ERP-DRP共振頻帶的頻帶對應的高/低頻帶(即圍繞ERP-DRP共振頻帶的頻帶)的SMR。具體地說，高/低頻帶計算器923通過從FFT單元921計算的頻譜波形中確定高/低頻帶的掩蔽閾值和子帶樣本的聲壓級來計算高/低頻帶的SMR。然后，高/低頻帶計算器923計算所確定的掩蔽閾值和子帶樣本的聲壓級之間的差值。因此，高/低頻帶計算器923可以確定不是ERP-DRP共振頻帶的掩蔽頻帶對子帶樣本提供的掩蔽效應。
當根據ERP-DRP共振頻帶來實施心理聲學模型單元92時，共振頻帶計算器922和高/低頻帶計算器923可以實施為單一組合單元或兩個單獨的單元。
然后，比特分配器93根據心理聲學模型單元92計算的SMR，而將比特分配給由濾波器組91劃分的每個子帶樣本。
例如，關于ERP-DRP共振頻帶的掩蔽效應，當子帶樣本具有小于或等于ERP-DRP共振頻帶的對應掩蔽閾值的聲壓時(也就是小于或等于1的SNR)，不需要向該子帶樣本分配比特，因為該子帶樣本由于ERP-DRP共振效應而無法聽見。同樣，當子帶樣本具有超過ERP-DRP共振頻帶的對應掩蔽閾值的聲壓時(也就是大于1的SNR)，向該子帶樣本分配比特，因為不管ERP-DRP共振效應如何，該子帶樣本都是可聽見的。按照類似方式，可以根據由高/低頻帶計算器923確定的其它高/低掩蔽頻帶的掩蔽效應來將比特分配或不分配給子帶樣本。
量化/編碼單元94在所分配的比特范圍內量化和編碼這些子帶樣本。
比特流格式器95通過向量化和編碼后的子帶樣本添加比特分配信息和附加信息，而將量化和編碼后的子帶樣本格式化為比特流。一般地，比特流格式器95根據MPEG標準來格式化所述量化和編碼后的子帶樣本。
從比特流格式器95輸出的比特流被傳輸到音頻解碼設備。
圖10是示出根據本一般發(fā)明構思的實施例的編碼音頻信號的方法的流程圖。
參考圖10，該音頻編碼方法包括操作101到107。圖10所示的音頻編碼方法包括可以由圖9所示的音頻編碼設備執(zhí)行的一系列操作?；蛘?，圖10的方法可以由其它音頻裝置執(zhí)行。
在操作101，音頻信號被劃分為多個子帶。
在操作102，通過對音頻信號執(zhí)行快速傅立葉變換而計算頻譜波形。
在操作103，計算ERP-DRP共振頻帶的SMR。具體地說，通過從在操作102所計算的頻譜波形確定ERP-DRP共振頻帶的掩蔽閾值和子帶樣本的聲壓級，來計算ERP-DRP共振頻帶的SMR，并且計算所確定的ERP-DRP共振頻帶的掩蔽閾值和子帶樣本的聲壓級之間的差值。
在操作104，計算與不同于ERP-DRP共振頻帶的頻帶對應的高/低頻帶(即圍繞ERP-DRP共振頻帶的頻帶)的SMR。具體地說，通過從在操作102所計算的頻譜波形確定高/低頻帶的掩蔽閾值和子帶樣本的聲壓級，來計算高/低頻帶的SMR，并且計算所確定的高/低頻帶的掩蔽閾值和子帶樣本的聲壓級之間的差值。
也就是說，在操作103和104中，根據由于ERP-DRP共振效應而變換的掩蔽閾值來計算音頻信號的子帶樣本的SMR。
在操作105，根據在操作103和104中計算的SMR，而將比特分配給在操作101中劃分的每個子帶樣本。
在操作106，在操作105分配的比特范圍內，對子帶樣本進行量化和編碼。
在操作107，通過向量化和編碼后的子帶樣本添加比特分配信息和附加信息，而將操作106中量化和編碼的子帶樣本格式化為比特流。
本一般發(fā)明構思可以實施為在包括存儲介質的計算機可讀介質中的可執(zhí)行代碼，該存儲介質例如是磁存儲介質(ROM、RAM、軟盤、磁帶等等)、光可讀介質(CD-ROM、DVD等)、和載波(通過因特網傳輸)。
如上所述，根據本一般發(fā)明構思的實施例，用戶利用耳機、頭戴式耳機、電話聽筒等等，采用補償ERP-DRP共振效應(這是由人耳結構導致的聲學共振效應)的補償波形，可以聽到中頻帶沒有放大的具有極好聲音質量的音頻信號。特別是，可以補償ERP-DRP共振效應，這是隨著諸如便攜式DVD播放器、MP3播放器和移動電話的便攜式音頻裝置的廣泛使用而變得越來越重要的問題。
此外，根據用于以高于其他頻帶的壓縮率編碼不能被人聽到的高/低頻帶的心理聲學模型，通過考慮由于ERP-DRP共振效應而變換的掩蔽閾值，添加以高于其它頻帶的壓縮率來編碼被ERP-DRP共振頻帶掩蔽的頻帶的功能，可以大大改善壓縮率。
盡管已示出和描述了本一般發(fā)明構思的若干實施例，但是本領域的普通技術人員可以理解，在不脫離由所附權利要求及其等價物限定其范圍的本一般發(fā)明構思的原理和精神的情況下，可以對這些實施例做出修改。
權利要求
1.一種音頻解碼方法，包括通過解碼輸入信號而產生音頻信號；以及將該音頻信號的原始波形變換為補償聲學共振效應的補償波形。
2.根據權利要求1的音頻解碼方法，其中，所述音頻信號的原始波形的變換包括在聲學共振效應發(fā)生之前對該音頻信號的原始波形進行預補償。
3.根據權利要求1的音頻解碼方法，還包括輸出所述補償波形，使得該補償波形通過所述聲學共振效應而轉換為原始波形。
4.根據權利要求1的音頻解碼方法，其中所述聲學共振效應包括在人耳基準點(ERP)和鼓膜基準點(DRP)之間產生的ERP-DRP共振效應。
5.根據權利要求1的音頻解碼方法，其中所述音頻信號的原始波形的變換包括通過翻轉由于所述聲學共振效應而獲得的共振波形來獲得補償波形。
6.根據權利要求5的音頻解碼方法，其中所述共振波形是利用人體模型頭用實驗方法而獲得的。
7.根據權利要求1的音頻解碼方法，其中所述原始波形的變換包括從所述音頻信號中提取由于聲學共振效應而隨后被變換的頻帶；以及將所提取的頻帶變換為補償波形。
8.根據權利要求1的音頻解碼方法，其中所述音頻信號是數字音頻信號，并且該方法還包括將具有補償波形的數字音頻信號轉換為模擬音頻信號。
9.一種補償音頻信號中的聲學共振效應的方法，該方法包括確定由該聲學共振效應引起的共振波形；通過確定該共振波形的翻轉而計算補償波形；將該補償波形施加到音頻信號；以及輸出向其施加了補償波形的音頻信號。
10.根據權利要求9的方法，其中將該補償波形施加到音頻信號包括提取被聲學共振效應影響的頻帶；以及將提取出的頻帶變換為補償波形。
11.根據權利要求9的方法，其中施加所述補償波形包括將音頻信號的原始波形變換為該補償波形；并且輸出該音頻信號包括創(chuàng)建聲學共振效應，以便將該補償波形向回變換為原始波形。
12.根據權利要求9的方法，還包括從解碼器接收音頻信號，該音頻信號包括左聲道信號和右聲道信號。
13.根據權利要求12的方法，其中確定共振波形包括確定由用戶左耳內的聲學共振效應引起的第一共振波形，并確定由用戶右耳內的聲學共振效應引起的第二共振波形；計算該補償波形包括通過確定該第一共振波形的翻轉來計算第一補償波形，并通過確定該第二共振波形的翻轉來計算第二補償波形；以及將該補償波形施加到音頻信號包括將第一和第二補償波形分別施加到左聲道信號和右聲道信號。
14.一種音頻解碼設備，包括解碼器，用于通過解碼輸入信號而產生音頻信號；以及共振補償器，用于將解碼器產生的音頻信號的原始波形變換為補償聲學共振效應的補償波形。
15.根據權利要求14的音頻解碼設備，其中該共振補償器在聲學共振效應發(fā)生之前對該音頻信號的原始波形進行預補償。
16.根據權利要求14的音頻解碼設備，還包括揚聲器，用于輸出所述補償波形，使得該補償波形通過該聲學共振效應而轉換為原始波形。
17.根據權利要求16的音頻解碼設備，其中該揚聲器形成與人耳的密封空間，并輸出補償波形，使得該補償波形在該密封空間內共振。
18.根據權利要求16的音頻解碼設備，其中該揚聲器包括頭戴式耳機、耳機、和電話聽筒之一。
19.根據權利要求14的音頻解碼設備，其中所述聲學共振效應包括在人耳基準點(ERP)和鼓膜基準點(DRP)之間產生的ERP-DRP共振效應。
20.根據權利要求14的音頻解碼設備，其中該補償波形是通過翻轉由于所述聲學共振效應獲得的共振波形而獲得的。
21.根據權利要求14的音頻解碼設備，其中該共振補償器包括共振頻帶提取器，用于從所述音頻信號中提取由于聲學共振效應而隨后被變換的頻帶；以及波形變換器，用于將提取的頻帶變換為補償波形。
22.一種補償音頻信號中的聲學共振效應的設備，該設備包括解碼器，用于接收音頻信號并解碼所接收的音頻信號；至少一個波形變換器，用于將補償波形施加到該音頻信號；以及至少一個揚聲器單元，用于輸出向其施加了補償波形的音頻信號，其中該補償波形包括由聲學共振效應引起的共振波形的反轉。
23.一種在其上具有執(zhí)行音頻解碼方法的可執(zhí)行代碼的計算機可讀介質，該介質包括通過解碼輸入信號而產生音頻信號的第一可執(zhí)行代碼；以及將該音頻信號的原始波形變換為補償聲學共振效應的補償波形的第二可執(zhí)行代碼。
24.一種音頻編碼方法，包括根據調整為說明聲學共振效應的掩蔽閾值曲線來計算音頻信號的多個子帶樣本中的每一個樣本的信掩比(SMR)；根據所計算的信掩比而將比特分配給每個子帶樣本；以及在所分配的比特范圍內對這些子帶樣本進行量化和編碼。
25.根據權利要求24的音頻編碼方法，其中該聲學共振效應包括在人耳基準點(ERP)和鼓膜基準點(DRP)之間產生的ERP-DRP共振效應。
26.根據權利要求24的音頻編碼方法，其中計算音頻信號的多個子帶樣本中的每一個樣本的SMR包括根據具有由于ERP-DRP共振效應而增加的掩蔽閾值的ERP-DRP共振頻帶，來計算音頻信號的每個子帶樣本的信掩比。
27.根據權利要求24的音頻編碼方法，其中計算音頻信號的多個子帶樣本中的每一個樣本的SMR包括通過以下步驟來計算SMR確定由于聲學共振效應而隨后被變換的掩蔽閾值，從音頻信號的波形來確定子帶樣本的對應聲壓級，以及計算所確定的掩蔽閾值和所確定的對應聲壓級之間的差。
28.根據權利要求24的音頻編碼方法，其中計算音頻信號的多個子帶樣本中的每一個樣本的SMR包括計算與由于聲學共振效應而隨后被變換的頻帶對應的共振頻帶的SMR；以及計算與不是該共振頻帶的頻帶對應的高和低頻帶的SMR。
29.一種增加音頻編碼設備中的壓縮率的方法，該方法包括當再現(xiàn)具有多個子帶的音頻信號時，確定通過聲學共振效應放大的聲學共振頻帶；確定該音頻信號中的多個子帶中的任一個子帶是否被聲學共振頻帶掩蔽；以及用分配給沒有被聲學共振頻帶掩蔽的子帶的信號信息的第一比特量和分配給被聲學共振頻帶掩蔽的子帶的信號信息的第二比特量來編碼音頻信號。
30.根據權利要求29的方法，其中所述第一比特量大于第二比特量。
31.根據權利要求30的方法，其中確定所述聲學共振頻帶包括調整該聲學共振頻帶附近的預定掩蔽閾值曲線，以補償聲學共振效應。
32.根據權利要求31的方法，其中確定該音頻信號中的多個子帶中的任一個子帶是否被掩蔽包括將該多個子帶的每一個子帶的信號電平與來自經過調整的掩蔽閾值曲線的對應掩蔽閾值進行比較，以確定該多個子帶中的每一個子帶的信號信息在聲學共振效應的情況下是否能聽得見。
33.根據權利要求29的方法，其中所述聲學共振頻帶約為1至10KHz，并且所述聲學共振效應是由于在至少一個人耳中由至少一個揚聲器形成密封空間而引起的。
34.一種音頻編碼設備，包括心理聲學模型單元，用于根據調整為說明聲學共振效應的掩蔽閾值曲線來計算音頻信號的多個子帶樣本中的每一個樣本的信掩比；比特分配器，用于根據所計算的信掩比而將比特分配給每個子帶樣本；以及量化/編碼單元，用于在所分配的比特范圍內對這些子帶樣本進行量化和編碼。
35.根據權利要求34的音頻編碼設備，其中所述聲學共振效應包括在人耳基準點(ERP)和鼓膜基準點(DRP)之間產生的ERP-DRP共振效應。
36.根據權利要求34的音頻編碼設備，其中所述心理聲學模型單元根據具有由于ERP-DRP共振效應而增加的掩蔽閾值的ERP-DRP共振頻帶，來計算音頻信號的每個子帶樣本的信掩比。
37.根據權利要求36的音頻編碼設備，其中所述心理聲學模型單元包括共振頻帶計算器，用于計算與由于聲學共振效應而隨后被變換的頻帶對應的共振頻帶的SMR；以及高/低頻帶計算器，用于計算與不是該共振頻帶的頻帶對應的高和低頻帶的SMR。
38.一種增加音頻信號信息的壓縮率的編碼設備，包括共振頻帶計算器，用于當再現(xiàn)具有多個子帶的音頻信號時，確定通過聲學共振效應放大的聲學共振頻帶，并確定該音頻信號中的多個子帶中的任一個是否被聲學共振頻帶掩蔽；以及比特分配單元，用于給沒有被聲學共振頻帶掩蔽的子帶的信號信息分配比特、和不給被聲學共振頻帶掩蔽的子帶的信號信息分配比特。
39.根據權利要求38的編碼設備，其中所述共振頻帶計算器調整預定掩蔽閾值曲線以補償聲學共振效應。
40.根據權利要求39的編碼設備，其中所述共振頻帶計算器將該多個子帶中的每一個子帶的信號電平與來自經過調整的掩蔽閾值曲線的對應掩蔽閾值進行比較，以確定該多個子帶中的每一個子帶的信號信息在聲學共振效應的情況下是否能聽得見。
41.根據權利要求38的編碼設備，還包括量化/編碼單元，用于根據比特分配單元分配的比特來編碼所述多個子帶的信號信息。
42.根據權利要求38的編碼設備，其中所述共振頻帶約為1至10KHz，所述聲學共振效應是由于在至少一個人耳中由至少一個揚聲器形成密封空間而引起的。
43.根據權利要求38的編碼設備，還包括高/低頻帶計算器，用于確定音頻信號中多個子帶中的任一個是否被音頻信號的其它頻帶掩蔽，并將該確定提供給比特分配單元。
44.一種在其上具有執(zhí)行音頻編碼方法的可執(zhí)行代碼的計算機可讀介質。該介質包括第一可執(zhí)行代碼，根據調整為說明聲學共振效應的掩蔽閾值曲線，來計算音頻信號的多個子帶樣本中的每一個樣本的SMR；第二可執(zhí)行代碼，根據所計算的信掩比而將比特分配給每個子帶樣本；以及第三可執(zhí)行代碼，在所分配的比特范圍內對這些子帶樣本進行量化和編碼。
全文摘要
一種編碼音頻信號的設備和方法以及一種解碼音頻信號的設備和方法。該音頻解碼方法包括通過解碼輸入信號而產生音頻信號；以及將所產生的音頻信號的原始波形變換為補償音頻信號中的聲學共振效應的補償波形。因此，通過利用翻轉的補償波形來補償作為由于人耳的結構而產生的聲學共振效應的ERP－DRP共振效應，可以經由耳機、頭戴式耳機、或電話聽筒等等聽到中頻帶沒有放大的具有極好聲音質量的音頻信號。
文檔編號H04N5/76GK1707955SQ20051007557
公開日2005年12月14日申請日期2005年6月6日優(yōu)先權日2004年6月4日
發(fā)明者李俊弦, 張成哲申請人:三星電子株式會社

完整全部詳細技術資料下載