專利名稱:使用通道間及時間冗余減少的音頻信號編碼的制作方法
技術(shù)領(lǐng)域:
背景技術(shù):
音頻信息的有效壓縮減小用于存儲所述音頻信息的存儲器容量要求及信息傳輸需要的通信帶寬兩者。為實現(xiàn)此壓縮,各種音頻編碼方案(例如普遍存在的運動圖像專家組I(MPEG-I)音頻層3(MP3)格式及較新的高級音頻編碼(AAC)標準)使用至少一個心理聲學模型(PAM),其本質(zhì)上描述人類耳朵在接收及處理音頻信息時的限制。舉例來說,人類音頻系統(tǒng)展示在頻域(在頻域中特定頻率的音頻掩蔽低于某些音量級的附近頻率的音頻) 及時域(在時域中特定頻率的音頻音調(diào)在除去之后將相同的音調(diào)掩蔽一時間周期)兩者中的聽覺掩蔽原理。提供壓縮的音頻編碼方案通過除去被人類音頻系統(tǒng)掩蔽的原始音頻信息的這些部分而利用這些聽覺掩蔽原理。為確定應除去原始音頻信號的哪些部分,音頻編碼系統(tǒng)通常處理原始信號以產(chǎn)生掩蔽閾值,使得可在音頻保真度沒有明顯損失情況下消除低于此閾值的音頻信號。此處理計算量非常大,使音頻信號的實時編碼很困難。另外,執(zhí)行此些計算對消費電子裝置來說通常是費力且耗時的,許多消費電子裝置使用的是并非特定為此強大處理設(shè)計的定點數(shù)字信號處理器(DSP)。
發(fā)明內(nèi)容
參考附圖可更好地理解本發(fā)明的許多方面。因為重點是在于清楚闡明本發(fā)明的原理,所以圖中的組件未必是按比例描繪。而且,圖中相同的參考數(shù)字指定遍及若干視圖的對應部分。而且,雖然結(jié)合這些圖描述若干實施例,但本發(fā)明并不限于本文揭示的實施例。相反,意圖涵蓋所有替代、修改及等效物。圖1是根據(jù)本發(fā)明的實施例經(jīng)配置以編碼時域音頻信號的電子裝置的簡化框圖。圖2是根據(jù)本發(fā)明的實施例操作圖1的電子裝置以編碼時域音頻信號的方法的流程圖。圖3是根據(jù)本發(fā)明的另一實施例的電子裝置的框圖。圖4是根據(jù)本發(fā)明的實施例的音頻編碼系統(tǒng)的框圖。圖5是根據(jù)本發(fā)明的實施例占據(jù)頻帶的頻域信號的取樣塊的圖形描繪。圖6是根據(jù)本發(fā)明的實施例的頻域信號的兩個音頻通道的取樣塊的圖形表示。圖7是根據(jù)本發(fā)明的實施例列出許多比率及相關(guān)聯(lián)的增強值的比例因子增強表。
具體實施例方式附圖及下文描述描繪本發(fā)明的特定實施例以教示所屬領(lǐng)域的技術(shù)人員如何做出及使用本發(fā)明的最佳模式。為教示發(fā)明原理,已簡化或省略一些常規(guī)方面。所屬領(lǐng)域的技術(shù)人員將了解在本發(fā)明的范圍內(nèi)的這些實施例的變化。所屬領(lǐng)域的技術(shù)人員也將了解可以多種方式組合下文描述的特征以形成本發(fā)明的多種實施例。因此,本發(fā)明并不限于下文描述的特定實施例,而僅由權(quán)利要求書及其等效物限制本發(fā)明。圖1提供根據(jù)本發(fā)明的實施例的電子裝置100的簡化框圖,其經(jīng)配置以將時域音頻信號Iio編碼為經(jīng)編碼音頻信號120。在一種實施方案中,根據(jù)高級音頻編碼(AAC)標準執(zhí)行編碼,然而涉及將時域信號變換成經(jīng)編碼音頻信號的其它編碼方案可有利地利用下文討論的概念。另外,電子裝置100可為能夠執(zhí)行此編碼的任何裝置,包含(但不限于) 個人桌上型及膝上型計算機、音頻/視頻編碼系統(tǒng)、壓縮光盤(⑶)及數(shù)字視頻盤(DVD)播放器、電視機頂盒、音頻接收器、蜂窩式電話、個人數(shù)字助理(PDA)及音頻/視頻異地播放 (place-shifting)裝置,例如由Sling Media公司提供的Slingbox 的各種型號。圖2呈現(xiàn)操作圖1的電子裝置100來編碼時域音頻信號110以產(chǎn)生經(jīng)編碼音頻信號120的方法200的流程圖。在方法200中,電子裝置100接收時域音頻信號110(操作 202)。接著裝置100將時域音頻信號110變換成具有至少一個音頻通道的每一者的一序列取樣塊的頻域信號(操作204)。每一取樣塊包括用于多個頻率的每一者的系數(shù)。每一取樣塊的系數(shù)分組或組織成頻帶(操作206)。對于每一取樣塊的每一頻帶(操作208),電子裝置100確定或估計頻帶的比例因子(操作210),確定頻帶能量(操作212),且將取樣塊的頻帶能量與相鄰取樣塊的頻帶能量比較(操作214)。相鄰取樣塊的實例可包含相同音頻通道的緊接的前一塊,或用與原始取樣塊相同的時間周期識別的另一音頻通道的取樣塊。如果取樣塊的頻帶能量對相鄰取樣塊的頻帶能量的比小于預定值,那么裝置100增加取樣塊的頻帶的比例因子(操作216)。對于每一塊的每一頻帶,裝置100基于與所述頻帶相關(guān)聯(lián)的比例因子量化頻帶的系數(shù)(操作218)。裝置100基于量化的系數(shù)及比例因子產(chǎn)生經(jīng)編碼音頻信號120(操作220)。雖然將圖2的操作描繪為以特定次序執(zhí)行,但其它執(zhí)行次序(包含同時執(zhí)行兩個或多個操作)是可能的。舉例來說,可以“管線”執(zhí)行類型執(zhí)行圖2的操作,其中當時域音頻信號110進入管線時,在時域音頻信號110的不同部分或取樣塊上執(zhí)行每一操作。在另一實施例中,計算機可讀存儲媒體可在其上編碼有用于圖1的電子裝置100的至少一個處理器或其它控制電路實施方法200的指令。由于方法200的至少一些實施例,基于相同音頻通道中的連續(xù)頻率取樣塊間及不同通道的同時存在的塊間的頻帶中的音頻能量的差異,調(diào)整用于每一頻帶以量化所述頻帶的系數(shù)的比例因子。這些確定的計算強度通常比通常在大部分AAC實施方案中執(zhí)行的完全掩蔽閾值的計算小得多。因此,由任何類別的電子裝置(包含利用廉價數(shù)字信號處理組件的小型裝置)的實時音頻編碼是可能的??蓮南挛母敿氂懻摰谋景l(fā)明的各種實施方案中認識到其它優(yōu)點。圖3是根據(jù)本發(fā)明的另一實施例的電子裝置300的框圖。裝置300包含控制電路 302及數(shù)據(jù)存儲裝置304。在一些實施方案中,裝置300還可包含通信接口 306及用戶接口 308的一者或兩者。包含(但不限于)電源及裝置外殼的其它組件也可包含在電子裝置300 中,但這些組件不在圖3中明確展示也不在下文中討論,以簡化下文討論??刂齐娐?02經(jīng)配置以控制電子裝置300的各個方面以將時域音頻信號310編碼為經(jīng)編碼音頻信號320。在一個實施例中,控制電路302包含至少一個處理器,例如微處理器、微控制器或數(shù)字信號處理器(DSP),其經(jīng)配置以執(zhí)行指導處理器執(zhí)行下文更詳細討論的各種操作的指令。在另一個實例中,控制電路302可包含經(jīng)配置以執(zhí)行下文描述的任務(wù)或操作的一者或一者以上的一個或一個以上硬件組件,或并入有硬件及軟件處理元件的某種組合。數(shù)據(jù)存儲裝置304經(jīng)配置以存儲一些或所有待編碼的時域音頻信號310及所得經(jīng)編碼音頻信號320。數(shù)據(jù)存儲裝置304還可存儲中間數(shù)據(jù)、控制信息及編碼過程中涉及的類似物。數(shù)據(jù)存儲裝置304還可包含待由控制電路302的處理器執(zhí)行的指令以及有關(guān)于執(zhí)行指令的任何程序數(shù)據(jù)或控制信息。數(shù)據(jù)存儲裝置304可包含任何易失性存儲器組件(例如動態(tài)隨機存取存儲器(DRAM)及靜態(tài)隨機存取存儲器(SRAM))、非易失性存儲器裝置(例如可裝卸式及固定式兩種快閃存儲器、磁盤驅(qū)動器及光盤驅(qū)動器)及其組合。電子裝置300還可包含通信接口 306,其經(jīng)配置以接收時域音頻信號310及/或在通信鏈路上傳輸經(jīng)編碼音頻信號320。通信接口 306的實例可為廣域網(wǎng)絡(luò)(WAN)接口(例如數(shù)字用戶線(DSL)或因特網(wǎng)電纜接口)、局域網(wǎng)絡(luò)(LAN)(例如Wi-Fi或以太網(wǎng))或任何其它適于以有線、無線或光方式在通信鏈路或連接上通信的通信接口。在其它實例中,通信接口 306可經(jīng)配置以將作為音頻/視頻節(jié)目的部分的音頻信號310、320發(fā)送到輸出裝置(圖3中未展示),例如電視機、視頻監(jiān)視器或音頻/視頻接收器。舉例來說,可利用調(diào)制視頻電纜連接、復合或分量視頻RCA類型(美國無線電公司)連接及數(shù)字視頻接口(DVI)或高清晰度多媒體接口(HDMI)連接傳遞音頻/視頻節(jié)目的視頻部分??稍趩温暤阑蛄Ⅲw聲音頻RCA類型連接、T0SLINK連接或HDMI連接上傳輸節(jié)目的音頻部分??稍谄渌鼘嵤├惺褂闷渌纛l/視頻格式及有關(guān)的連接。另外,電子裝置300可包含用戶接口 308,其經(jīng)配置以從一個或一個以上用戶處接收由時域音頻信號310代表的聽覺信號311,例如利用音頻麥克風及有關(guān)電路(包含放大器、模/數(shù)轉(zhuǎn)換器(ADC)及類似物)來接收。同樣,用戶接口 308可包含放大器電路及一個或一個以上音頻揚聲器以向用戶呈現(xiàn)由經(jīng)編碼音頻信號320代表的聽覺信號321。依據(jù)所述實施方案,用戶接口 308還可包含允許用戶例如利用鍵盤、小鍵盤、觸控墊、鼠標、操縱桿或其它用戶輸入裝置來控制電子裝置300的裝置。同樣,用戶接口 308可提供視覺輸出裝置,例如監(jiān)視器或其它視覺顯示裝置,從而允許用戶從電子裝置300接收視覺信息。圖4提供由電子裝置300提供的用以將時域音頻信號310編碼為圖3的經(jīng)編碼音頻信號320的音頻編碼系統(tǒng)400的實例。圖3的控制電路302可利用硬件電路、執(zhí)行軟件或固件指令的處理器或其某種組合來實施音頻編碼系統(tǒng)400的每一部分。圖4的特定系統(tǒng)400代表AAC的特定實施方案,但在其它實施例中可利用其它音頻編碼方案。一般來說,AAC代表音頻編碼的模塊化方法,借此可在單獨硬件、軟件或固件模塊或“工具”中實施圖4的每一功能塊450-472以及未在圖中特別描繪的功能塊,因此允許將源于不同的開發(fā)源的模塊集成到單一編碼系統(tǒng)400中以執(zhí)行所期望的音頻編碼。因此, 使用不同數(shù)目及類型的模塊可導致形成任何數(shù)目個編碼器“設(shè)定檔”(profile),每一編碼器設(shè)定檔能夠解決與特定編碼環(huán)境相關(guān)聯(lián)的特定約束。這些約束可包含裝置300的計算能力、時域音頻信號310的復雜度及經(jīng)編碼音頻信號320的所期望的特性,例如輸出位速率及失真程度。AAC標準通常提供四個默認的設(shè)定檔,包含低復雜度(LC)設(shè)定檔、主(MAIN)設(shè)定檔、取樣率可縮放(SRQ設(shè)定檔及長期預測(LTP)設(shè)定檔。圖4的系統(tǒng)400在沒有強度/耦合模塊情況下主要對應于主設(shè)定檔,但其它設(shè)定檔可并入有下文討論的增強,包含下文更詳細描述的時間/通道間比例因子調(diào)整功能塊466。圖4利用實箭頭線描繪音頻數(shù)據(jù)的一般流程,而經(jīng)由虛箭頭線說明一些可能控制路徑。關(guān)于圖4中未特定展示的在模塊450-472間的控制信息的通過的其它可能性在其它布置中為可能的。在圖4中,接收時域音頻信號310作為系統(tǒng)400的輸入。一般來說,時域音頻信號310包含經(jīng)格式化為時變音頻信號的一系列數(shù)字取樣塊的音頻信息的一個或一個以上通道。在一些實施例中,時域音頻信號310起初可采取模擬音頻信號的形式,所述模擬音頻信號隨后在被轉(zhuǎn)發(fā)到由控制電路302實施的編碼系統(tǒng)400之前,例如利用用戶接口 308的 ADC以預定速率數(shù)字化。如圖4中所說明,音頻編碼系統(tǒng)400的模塊可包含增益控制塊452、濾波器組454、 時間噪聲整形(TNS)塊456、反向預測工具458及中間/側(cè)面立體聲塊460,其經(jīng)配置為接收時域音頻信號310作為輸入的處理管線的部分。這些功能塊452-460可對應于經(jīng)常在其它AAC實施方案中見到的相同功能塊。時域音頻信號310也被轉(zhuǎn)發(fā)到感知模型450,其可將控制信息提供到上文提到的功能塊452-460的任一者。在典型AAC系統(tǒng)中,在心理聲學模型(PAM)下,這個控制信息指示時域音頻信號310的哪些部分是多余的,因此允許丟棄時域音頻信號310中的音頻信息的這些部分,以有利于在經(jīng)編碼音頻信號320中實現(xiàn)的壓縮。為此目的,在典型AAC系統(tǒng)中,感知模型450根據(jù)時域音頻信號310的快速傅里葉變換(FFT)的輸出計算掩蔽閾值以指示可丟棄音頻信號310的哪些部分。然而,在圖4的實例中,感知模型450接收濾波器組454的輸出,所述輸出提供頻域信號474。在一個特定實例中,濾波器組4M是如AAC系統(tǒng)中通常提供的修改的離散余弦變換(MDCT)函數(shù)塊。由MDCT函數(shù)妨4產(chǎn)生的頻域信號474包含一系列取樣塊(例如圖5中繪圖表示的塊),每一塊包含許多用于待編碼音頻信息的每一通道的頻率502。另外,在頻域信號474 塊中由指示每一頻率502的幅值或強度的系數(shù)來表示所述頻率502。在圖5中,將每一頻率 502描繪為垂直向量,其高度代表與所述頻率502相關(guān)聯(lián)的系數(shù)值。另外,按照典型AAC方案中的做法,頻率502邏輯上組織成連續(xù)頻率群組或“頻帶”504A-504E。雖然圖4指示出每一頻帶504(即,頻帶504A-504E的每一者)利用相同范圍的頻率,且包含由濾波器組妨4產(chǎn)生的相同數(shù)目的離散頻率502,但在頻帶504間可使用變化的頻率502數(shù)目及頻率502范圍大小,在AAC系統(tǒng)中經(jīng)常是這樣的情況。形成頻帶504以允許利用由圖4的比例因子產(chǎn)生器464產(chǎn)生的比例因子而按比例調(diào)整或劃分頻率502的頻帶504的每一頻率502的系數(shù)。此按比例調(diào)整減小了代表經(jīng)編碼音頻信號320中的頻率502系數(shù)的數(shù)據(jù)量,因此壓縮所述數(shù)據(jù),從而產(chǎn)生經(jīng)編碼音頻信號 320的較低傳輸位速率。這個按比例調(diào)整還產(chǎn)生音頻信息的量化,其中頻率502系數(shù)被迫成為離散預定值,因此可能在解碼后給經(jīng)編碼音頻信號320帶來一定程度的失真。一般來說,越高比例因子造成越粗糙量化,導致較高音頻失真程度及較低經(jīng)編碼音頻信號320位速率。為滿足在先前AAC系統(tǒng)中的經(jīng)編碼音頻信號320的預定失真程度及位速率,感知模型450計算上文提到的掩蔽閾值以允許比例因子產(chǎn)生器464確定經(jīng)編碼音頻信號320的每一取樣塊的可接受的比例因子。本文也可使用掩蔽閾值的此產(chǎn)生以允許比例因子產(chǎn)生器464確定頻域信號474的每一取樣塊的每一頻帶的初始比例因子。然而,在其它實施方案中,感知模型450反而確定與每一頻帶504的頻率502相關(guān)聯(lián)的能量,且其接著可由比例因子產(chǎn)生器464使用以基于此能量計算每一頻帶504的期望的比例因子。在一個實例中,由在頻帶504中的頻率502的MDCT系數(shù)的“絕對總和”或絕對值的總和(有時稱為絕對光譜系數(shù)總和(SASC))計算在頻帶504中的頻率502的能量。一旦確定頻帶504的能量,可通過用頻帶504的能量的對數(shù)(例如以10為底的對數(shù))加上常數(shù)值且接著用此項乘以預定乘數(shù)來計算與每一取樣塊的頻帶504相關(guān)聯(lián)的比例因子,以產(chǎn)生頻帶504的至少一初始比例因子。根據(jù)先前已知心理聲學模型的音頻編碼中的實驗指示出接近1. 75的常數(shù)及乘數(shù)10產(chǎn)生的比例因子相當于由大量掩蔽閾值計算產(chǎn)生的比例因子。因此,對于此特定實例,產(chǎn)生用于比例因子的以下方程式。scale_factor = (Iog10 (Σ | band—coefTicients |)+1. 75) *10在其它配置中可使用除了 1. 75之外的其它常數(shù)值。為編碼時域音頻信號310,MDCT濾波器組妨4產(chǎn)生用于頻域信號474的一系列頻率取樣塊,其中每一塊與時域音頻信號310的特定時間周期相關(guān)聯(lián)。因此,可針對頻域信號474中產(chǎn)生的頻率取樣的每一通道的每個塊執(zhí)行上文提到的比例因子計算,因此潛在提供用于每一頻帶504的每一塊的不同比例因子。在給定有所包含的數(shù)據(jù)量的情況下,將上述計算用于每一比例因子相比于估計頻率取樣的相同塊的掩蔽閾值明顯減小確定比例因子所需的處理量。在其它實施方案中可利用其它方法,憑借這些方法,不論是否計算掩蔽閾值,均可在比例因子產(chǎn)生器464中估計初始比例因子。在圖6中用圖形說明包含兩個單獨音頻通道A及B(602A及602B)的頻域信號474 的實例。每一音頻通道602的音頻表示為頻率取樣的一序列塊601,其中每一塊601與原始時域音頻信號310的特定時間周期相關(guān)聯(lián)。在一些實施例中,與相同音頻通道的兩個連續(xù)取樣塊相關(guān)聯(lián)的時間周期可重疊。舉例來說,通過對濾波器組妨4使用MDCT,與每一塊相關(guān)聯(lián)的時間周期與下一塊的時間周期重疊50%。在本文討論的實施方案中,鑒于取樣塊601的“相鄰”者中存在的時間及/或通道間冗余,可進一步增加由比例因子產(chǎn)生器464提供的用于每一取樣塊601的每一頻帶504 的先前產(chǎn)生的或估計的比例因子。如圖6中展示,如果一個塊在順序上緊接在另一塊之后, 那么相同通道602的兩個塊606在時間意義上是相鄰的。如果通道間塊與相同時間周期相關(guān)聯(lián),那么其可為相鄰的,如由圖6中展示的相鄰通道間塊604的實例所展示。在任一情況下,如果相鄰塊中的能量相比于第一塊的能量足夠高,那么可丟棄取樣塊601的一對相鄰塊的一個塊中的一些音頻信息。使用圖6的相鄰時間塊606作為實例, 如果這對606的第k-Ι塊的頻帶504的能量比第k塊的相同頻帶504的能量大某一量或百分比,那么可增加來自比例因子產(chǎn)生器464的用于頻帶504的先前確定的比例因子,因此減小用于此塊601的頻帶504的量化級數(shù),且因此減小經(jīng)編碼音頻信號320中代表塊601需要的數(shù)據(jù)量。因為相關(guān)聯(lián)音頻在一定程度上被與先前塊601的頻帶504相關(guān)聯(lián)的較高能量掩蔽,所以用此方法增加比例因子引起極少失真或不加入明顯失真。同樣,如果兩個相鄰通道間塊604的一者的頻帶504的能量充分大于另一塊的對應頻帶504的能量,那么另一塊的頻帶504的比例因子在沒有明顯音頻保真度損失的情況下可增加某一百分比或量。在時間及通道間情況兩者下,可用此方法檢查頻域信號474的每一通道602的每一取樣塊601的每一頻帶504以確定是否可能增加比例因子。在圖4的系統(tǒng)400中,圖4的控制電路466在比例因子調(diào)整功能塊466中提供此功能性。在一種實施方案中,如上文描述,可通過將頻帶504的所有頻率系數(shù)的絕對值相加或計算頻帶504的SASC來計算每一取樣塊601的每一頻帶504的能量。在其它實例中可使用其它能量測量。在一種布置中,用比率比較兩個相鄰取樣塊601的能量值。舉例來說,為解決在相鄰時間塊606中的時間冗余,裝置300的控制電路302可計算相鄰時間塊606的后一塊 601 (例如,音頻通道602的第k塊)的頻帶504的能量對緊接的前一塊601 (例如,音頻通道602的第k-Ι塊)的頻帶504的能量的比率。接著可將此比率與預定值或百分比(例如 0.5或50%)比較。如果所述比率小于預定值,那么可增加與后一塊601的頻帶504相關(guān)聯(lián)的比例因子。所述增加可為遞增(例如增加一)、增加某一預定量(例如一、二或三)、增加百分比(例如10% )或增加某一其它量??蓪γ恳灰纛l通道602的每一取樣塊601的每一頻帶504執(zhí)行此過程。至于通道間冗余,裝置300的控制電路302可計算相鄰通道間塊604的一者(例如音頻通道A 602A的第k塊)的頻帶504的能量對相鄰通道間塊604的其它塊(即,音頻通道B 602B的第k塊)的相同頻帶504的能量的比率。至于時間冗余比較,接著可將此比率與某一預定值或百分比比較。如果比率小于預定值,那么第一塊601(即,音頻通道A 602A的第k塊)的頻帶504的比例因子可增加某一量,例如值或百分比。同樣,可將此比率的倒數(shù)(即第二塊601(即,音頻通道B 602B的第k塊)的相同頻帶504的能量比第一塊601(即,音頻通道A 602A的第k塊)的頻帶504的能量)與相同預定值或百分比比較。 如果此比率小于所述值或百分比,那么第二塊601(即,音頻通道B 602B的第k塊)中的頻帶504的比例因子可用與上文描述的方式類似的方式增加??蓪σ纛l通道602的每一者的每一取樣塊601的每一頻帶504執(zhí)行此過程。在某一環(huán)境中,提供兩個以上音頻通道602,例如在5. 1及7. 1立體聲系統(tǒng)中??稍谶@些系統(tǒng)中解決通道間冗余,使得可將每一取樣塊502的每一頻帶504在一個以上其它音頻通道602中與其相對物比較。在其它系統(tǒng)400中,特定音頻通道602可基于其在音頻方案中的作用一起予以配對。舉例來說,在5. 1立體聲音頻中,其包含前中心通道、兩個前側(cè)通道、兩個后側(cè)通道及副低音揚聲器通道,兩個前側(cè)通道的同時期塊601可彼此對比,同樣兩個后側(cè)通道的塊601也可彼此對比。在另一實例中,前通道(左、右及中心通道)的每一者的塊601可彼此對比以利用任何通道間冗余。在上文討論的實例的每一者中,將關(guān)于頻帶604的能量的比率與單一預定值或百分比比較。在另一實施方案中,控制電路302可將每一計算的比率與一個以上預定閾值比較。依據(jù)比率在比較值中的位置,可利用不同百分比或值調(diào)整相關(guān)聯(lián)的比例因子。為此目的,圖7提供比例因子增強表700的一個可能實例,所述增強表700含有若干不同比率比較值702,待與其比較的是上文描述的計算比率。在表700中,比率Rl大于比率R2,比率R2 大于比率R3,以此類推,持續(xù)到比率RN。與每一比率700相關(guān)聯(lián)的是增強值704,列為Fl、 F2、F3. · · FN,其中Fl大于F2,F(xiàn)2大于F3,以此類推。在操作中,如果計算的比率大于R1,那么不調(diào)整相關(guān)聯(lián)的比例因子。如果比率小于R1,但大于或等于R2,那么以增強值Fl增加比例因子。同樣,如果計算的比率小于R2,但至少與R3—樣大,那么應用增強值F2。以此方法持續(xù)下去,小于RN的比率使得比例因子以增強值FN調(diào)整或增加。在其它實施例中可使用其它使用多個預定比率值702及對應比例因子增強值704的方法。預定比較值(例如比率比較值702)及比例因子調(diào)整(例如表700的比例因子增強值704)兩者可取決于多種系統(tǒng)特定因素。因此,對于在不過分損害用于特定應用的可接受的失真程度的情況下的經(jīng)編碼音頻信號320的位速率減小方面的最佳結(jié)果,實驗上針對此特定系統(tǒng)400最佳確定各種比較值及調(diào)整因子。雖然比例因子調(diào)整功能塊466提供圖4的上述功能性,但其它實施方案可在系統(tǒng) 400的其它部分中并入所述功能性。舉例來說,感知模型450或比例因子產(chǎn)生器464可既從濾波器組妨4接收MDCT信息又從比例因子產(chǎn)生器464接收比例因子的初始估計值以執(zhí)行比率計算、值比較及之前討論的比例因子調(diào)整。在管線中的比例因子調(diào)整功能466之后的量化器468對每一頻帶504使用如由比例因子產(chǎn)生器466產(chǎn)生的(且可能再次經(jīng)速率/失真控制塊462調(diào)整,如下文描述)經(jīng)調(diào)整的比例因子,以劃分所述頻帶504中的各種頻率502的系數(shù)。通過劃分系數(shù),減小或壓縮系數(shù)的大小,因此降低經(jīng)編碼音頻信號320的整體位速率。此劃分使得所述系數(shù)被量化為一些定義數(shù)目個離散值的一者。量化之后,無噪聲編碼塊470根據(jù)無噪聲編碼方案編碼所得量化的系數(shù)。在一個實施例中,編碼方案可為在AAC中使用的無損霍夫曼(Huffman)編碼方案。如圖4中描繪的速率/失真控制塊462可重新調(diào)整在比例因子產(chǎn)生器466中產(chǎn)生的且在比例因子調(diào)整模塊466中調(diào)整的比例因子的一者或一者以上以滿足用于經(jīng)編碼音頻信號320的預定位速率及失真程度要求。舉例來說,速率/失真控制塊464可確定計算的比例因子可導致明顯高于將獲得的平均位速率的用于經(jīng)編碼音頻信號320的輸出位速率, 且因此相應增加所述比例因子。在編碼塊470中編碼比例因子及系數(shù)之后,將所得數(shù)據(jù)轉(zhuǎn)發(fā)到位流多路復用器 472,其輸出包含系數(shù)及比例因子的經(jīng)編碼音頻信號320。此數(shù)據(jù)可進一步與其它控制信息及元數(shù)據(jù)(例如文本數(shù)據(jù)(包含標題及關(guān)于經(jīng)編碼音頻信號320的相關(guān)聯(lián)信息)及關(guān)于正使用的特定編碼方案的信息)混合,使得接收音頻信號320的解碼器可準確解碼信號320。如本文描述的至少一些實施例提供一種音頻編碼方法,其中可在沒有明顯音頻保真度損失的情況下將由音頻信號的取樣塊的每一頻帶內(nèi)的音頻頻率展現(xiàn)的能量與相鄰塊的能量比較,以確定所述塊是否運載可更粗糙量化的音頻信息。相鄰取樣塊可為單一音頻通道的連續(xù)塊或同時出現(xiàn)在不同音頻通道中的塊。通過比較不同塊中的特定頻帶中的頻率的能量,相比于其中計算掩蔽閾值的典型AAC系統(tǒng),需要的計算能力極小。因此,與原本可能的情況相比,使用本文引用的方法及裝置可允許用更便宜的處理電路在更多種環(huán)境中執(zhí)行實時音頻編碼。雖然本文已討論本發(fā)明的若干實施例,但本發(fā)明的范圍所涵蓋的其它實施方案是可能的。舉例來說,雖然已在異地播放裝置背景下描述本文揭示的至少一個實施例,但其它數(shù)字處理裝置可得益于上文解釋的概念的應用,其它數(shù)字處理裝置例如是通用計算系統(tǒng)、 電視接收器或機頂盒(包含與衛(wèi)星、電纜及陸地電視信號傳輸相關(guān)聯(lián)者)、衛(wèi)星及陸地音頻接收器、游戲控制臺、DVR及CD及DVD播放器。此外,本文揭示的一個實施例的方面可結(jié)合替代實施例的方面以產(chǎn)生本發(fā)明的其它實施方案。因此,雖然已在特定實施例背景下描述本發(fā)明,但提供這些描述是為了說明而非限制。相應地,僅由所附權(quán)利要求書及其等效物限定本發(fā)明的適當范圍。
權(quán)利要求
1.一種編碼時域音頻信號的方法,所述方法包括在電子裝置處,接收包括至少一個音頻通道的所述時域音頻信號;將所述時域音頻信號變換成包括用于所述至少一個音頻通道的每一者的一序列取樣塊的頻域信號,其中每一取樣塊包括用于多個頻率的每一者的系數(shù);將每一取樣塊的系數(shù)分組成頻帶;對于每一取樣塊的每一頻帶,確定所述頻帶的比例因子;對于每一取樣塊的每一頻帶,確定所述頻帶的能量;對于每一取樣塊的每一頻帶,將所述取樣塊的所述頻帶的所述能量與相鄰取樣塊的頻帶的能量比較;對于每一取樣塊的每一頻帶,如果所述取樣塊的所述頻帶的所述能量對所述相鄰取樣塊的所述頻帶的所述能量的比率小于預定值,那么增加所述取樣塊的所述頻帶的所述比例因子;對于每一取樣塊的每一頻帶,基于所述頻帶的所述比例因子量化所述頻帶的所述系數(shù);及基于所述經(jīng)量化的系數(shù)及所述比例因子產(chǎn)生經(jīng)編碼音頻信號。
2.根據(jù)權(quán)利要求1所述的方法,其中產(chǎn)生所述經(jīng)編碼信號包括編碼所述經(jīng)量化的系數(shù),其中所述經(jīng)編碼音頻信號是基于所述經(jīng)編碼系數(shù)及所述比例因子。
3.根據(jù)權(quán)利要求1所述的方法,其中將所述時域音頻信號變換成所述頻域信號包括對所述時域音頻信號執(zhí)行修改的離散余弦變換函數(shù)。
4.根據(jù)權(quán)利要求1所述的方法,其中確定所述頻帶的所述能量包括計算所述取樣塊的所述頻帶的所述系數(shù)的每一者的絕對總和。
5.根據(jù)權(quán)利要求1所述的方法,其中第一取樣塊的相鄰取樣塊包括與所述第一取樣塊相同的音頻通道的在時間上緊接在所述第一取樣塊之前的取樣塊。
6.根據(jù)權(quán)利要求5所述的方法,其中所述相鄰取樣塊所代表的時間周期與所述第一取樣塊所代表的時間周期重疊。
7.根據(jù)權(quán)利要求1所述的方法,其中第一取樣塊的相鄰取樣塊包括由與所述第一取樣塊相關(guān)聯(lián)的相同時間周期識別的不同音頻通道的取樣塊。
8.根據(jù)權(quán)利要求7所述的方法,其進一步包括對于每一取樣塊的每一頻帶,將所述取樣塊的所述頻帶的所述能量與第二相鄰取樣塊的頻帶的能量比較;及對于每一取樣塊的每一頻帶,如果所述取樣塊的所述頻帶的所述能量對所述第二相鄰取樣塊的所述頻帶的所述能量的比率小于所述預定值,那么增加所述取樣塊的所述頻帶的所述比例因子;其中第一取樣塊的第二相鄰取樣塊包括由與所述第一取樣塊相關(guān)聯(lián)的相同時間周期識別的第二不同音頻通道的取樣塊。
9.根據(jù)權(quán)利要求1所述的方法,其進一步包括對于每一取樣塊的每一頻帶,如果所述取樣塊的所述頻帶的所述能量對所述相鄰取樣塊的所述頻帶的所述能量的所述比率小于第二預定值,那么增加所述取樣塊的所述頻帶的所述比例因子,其中所述第二預定值小于所述第一預定值,且其中與所述第二預定值有關(guān)的所述比例因子的增加大于與所述第一預定值有關(guān)的所述比例因子的增加。
10.一種調(diào)整頻域音頻信號的頻帶的比例因子以用于產(chǎn)生量化的輸出信號的方法,所述頻域信號包括用于至少一個音頻通道的每一者的一序列取樣塊,每一取樣塊包括用于所述頻帶內(nèi)的多個頻率的每一者的系數(shù),所述方法包括對于每一取樣塊,確定所述頻帶的能量;對于每一取樣塊,將所述取樣塊的所述頻帶的所述能量與相鄰取樣塊的頻帶的能量比較;及對于每一取樣塊,如果所述取樣塊的所述頻帶的所述能量對所述相鄰取樣塊的所述頻帶的所述能量的比率小于預定值,那么增加所述取樣塊的所述頻帶的所述比例因子; 其中所述頻率系數(shù)的量化是基于所述比例因子。
11.根據(jù)權(quán)利要求10所述的方法,其中 所述系數(shù)包括修改的離散余弦變換的系數(shù)。
12.根據(jù)權(quán)利要求10所述的方法,其中確定所述頻帶的所述能量包括 計算所述取樣塊的所述頻帶的所述系數(shù)的絕對總和。
13.根據(jù)權(quán)利要求10所述的方法,其中第一取樣塊的相鄰取樣塊包括與所述第一取樣塊相同的音頻通道的緊接的前一個取樣塊。
14.根據(jù)權(quán)利要求10所述的方法,其中第一取樣塊的相鄰取樣塊包括由與所述第一取樣塊相同的時間周期識別的不同音頻通道的取樣塊。
15.一種電子裝置,其包括數(shù)據(jù)存儲裝置,其經(jīng)配置以存儲時域音頻信號;及控制電路,其經(jīng)配置以從所述數(shù)據(jù)存儲裝置檢索所述時域音頻信號,其中所述時域音頻信號包括至少一個音頻通道;將所述時域音頻信號變換成包括用于至少一個音頻通道的每一者的一序列取樣塊的頻域信號,其中每一取樣塊包括用于多個頻率的每一者的系數(shù); 將每一取樣塊的系數(shù)組織成頻帶; 對于每一取樣塊的每一頻帶,估計所述頻帶的比例因子; 對于每一取樣塊的每一頻帶,確定所述頻帶的能量;對于每一取樣塊的每一頻帶,將所述取樣塊的所述頻帶的所述能量與相鄰取樣塊的頻帶的能量比較;對于每一取樣塊的每一頻帶,如果所述取樣塊的所述頻帶的所述能量對所述相鄰取樣塊的所述頻帶的所述能量的比率小于預定值,那么增加所述取樣塊的所述頻帶的所述比例因子;對于每一取樣塊的每一頻帶,基于所述頻帶的所述比例因子量化所述頻帶的所述系數(shù);及基于所述經(jīng)量化的系數(shù)及所述比例因子產(chǎn)生經(jīng)編碼音頻信號。
16.根據(jù)權(quán)利要求15所述的電子裝置,其中為確定所述頻帶的所述能量,所述控制電路經(jīng)配置以將所述取樣塊的所述頻帶的所述系數(shù)的每一者的絕對值相加。
17.根據(jù)權(quán)利要求15所述的電子裝置,其中第一取樣塊的相鄰取樣塊包括與所述第一取樣塊相同的音頻通道的緊接在所述第一取樣塊之前的取樣塊。
18.根據(jù)權(quán)利要求15所述的電子裝置,其中第一取樣塊的相鄰取樣塊包括代表與所述第一取樣塊相同的時間周期的不同音頻通道的取樣塊。
19.根據(jù)權(quán)利要求15所述的電子裝置,其中所述控制電路經(jīng)配置以對于每一取樣塊的每一頻帶,將所述取樣塊的所述頻帶的所述能量與第二相鄰取樣塊的頻帶的能量比較;及對于每一取樣塊的每一頻帶,如果所述取樣塊的所述頻帶的所述能量對所述第二相鄰取樣塊的所述頻帶的所述能量的比率小于所述預定值,那么增加所述取樣塊的所述頻帶的所述比例因子;其中第一取樣塊的第二相鄰取樣塊包括代表與所述第一取樣塊相同的時間周期的第二不同音頻通道的取樣塊。
20.根據(jù)權(quán)利要求15所述的電子裝置,其中所述控制電路經(jīng)配置以對于每一取樣塊的每一頻帶,如果所述取樣塊的所述頻帶的所述能量對所述相鄰取樣塊的所述頻帶的所述能量的所述比率小于第二預定值,那么增加所述取樣塊的所述頻帶的所述比例因子,其中所述第二預定值小于所述第一預定值,且其中與所述第二預定值有關(guān)的所述比例因子的增加大于與所述第一預定值有關(guān)的所述比例因子的增加。
全文摘要
本發(fā)明呈現(xiàn)一種編碼時域音頻信號的方法。一種裝置將所述時域信號變換成包含一取樣塊序列的頻域信號,其中每一塊包含用于多個頻率的每一者的系數(shù)。每一塊的系數(shù)被分組成頻帶。對于每一塊的每一頻帶,估計所述頻帶的比例因子,且將所述塊的頻帶能量與相鄰取樣塊的頻帶能量比較,其中在通道間意義及時間意義中的一者或兩者上,所述塊可彼此相鄰。如果第一塊的頻帶能量對相鄰塊的頻帶能量的比率小于某個值,那么增加所述第一塊的頻帶的比例因子?;谒玫谋壤蜃恿炕恳粔K的頻帶系數(shù)?;诮?jīng)量化的系數(shù)及所述比例因子產(chǎn)生經(jīng)編碼音頻信號。
文檔編號G10L19/02GK102483924SQ201080040149
公開日2012年5月30日 申請日期2010年9月7日 優(yōu)先權(quán)日2009年9月11日
發(fā)明者南都瑞·V·基肖爾 申請人:斯靈媒體有限公司