專利名稱:編碼器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及編碼,并且具體但非排他地,涉及語音或者音頻編碼。
背景技術(shù):
語音或音樂之類的音頻信號被編碼,例如以支持該音頻信號的有效傳輸或存儲。音頻編碼器和解碼器用來表示基于音頻的信號,諸如音樂和背景噪聲。這些類型的編碼器通常沒有將語音模型用于編碼過程,而是使用用于表示所有類型的音頻信號(包括語音)的過程。語音編碼器和解碼器(編解碼器)通常針對語音信號進(jìn)行優(yōu)化,并且可以按照固定比特率或者可變比特率進(jìn)行操作。音頻編解碼器還可以配置用于利用變化的比特率來操作。在較低比特率處,這種音頻編解碼器可以按照與純語音編解碼器等效的編碼速率對語音信號進(jìn)行操作。在較高比特率處,音頻編解碼器可以以較高的質(zhì)量和性能來對任何信號進(jìn)行編碼,包括音樂、背景噪
聲和語音。在某些音頻編解碼器中,輸入信號被劃分為有限數(shù)目的頻帶。每個頻帶信號可以被量化。根據(jù)心理聲學(xué)的理論可知,頻譜中的最高頻率在感官上沒有低頻重要。這在某些音頻編解碼器中反映為比特分配,其中為高頻信號分配的比特少于低頻信號。此外,在某些編解碼器中,使用音頻信號的低頻與高頻頻帶或者區(qū)域之間的相關(guān)來改進(jìn)編解碼器的編碼效率。由于頻譜的較高頻帶通常非常類似于較低頻帶,因此某些編解碼器可以僅對較低頻帶進(jìn)行編碼,并且將較高頻帶再現(xiàn)成經(jīng)過縮放的較低頻帶的副本。由此,通過僅使用少量的附加控制信息,可以實(shí)現(xiàn)可觀地節(jié)省編解碼器的總比特率。用于編碼高頻區(qū)域的一個此類編解碼器公知為高頻區(qū)域(HFR)編碼。高頻區(qū)域編碼的一種形式是頻帶復(fù)制(SBR),其已經(jīng)由Coding Technologies開發(fā)。在SBR中,諸如移動圖像專家組MPEG-4高級音頻編碼(AAC)或者M(jìn)PEG-I Layer III (MP!3)編碼器之類的已知音頻編碼器對低頻區(qū)域進(jìn)行編碼。使用經(jīng)過編碼的低頻區(qū)域來獨(dú)立地生成高頻區(qū)域。在SBR編碼中,通過將低頻區(qū)域調(diào)換到高頻來獲得高頻區(qū)域。調(diào)換是基于具有32個頻帶的正交鏡像濾波器(QMF),并且被執(zhí)行以從而預(yù)定義根據(jù)哪些頻帶樣本來構(gòu)造每個高頻頻帶樣本。這獨(dú)立于輸入信號的特性而完成?;诟郊有畔Ω哳l頻帶進(jìn)行修改。進(jìn)行濾波以使得經(jīng)過合成的高頻區(qū)域的特定特征與原始特征更為相似。向高頻區(qū)域添加諸如正弦波或者噪聲的附加分量,以增加與原始高頻區(qū)域的相似度。最后,調(diào)節(jié)包絡(luò)以符合原始高頻頻譜的包絡(luò)。
然而,高頻區(qū)域編碼沒有產(chǎn)生原始高頻區(qū)域的等同副本。特別地,在輸入信號為聲調(diào)(換言之,不具有類似于噪聲的頻譜)的情況下,已知的高頻區(qū)域編碼機(jī)制的執(zhí)行相對較弱。
發(fā)明內(nèi)容
本發(fā)明的出發(fā)點(diǎn)基于以下考慮,即目前提出的編解碼器缺少能夠?qū)π盘栠M(jìn)行有效編碼和精確近似的靈活性。本發(fā)明的實(shí)施方式旨在解決上述問題。按照本發(fā)明的第一方面,提供一種用于編碼音頻信號的編碼器,其中所述編碼器配置用于定義單頻分量的集合;從所述單頻分量的集合的第一子集中選擇至少一個單頻分量。該編碼器可以進(jìn)一步配置用于生成至少一個第一指示符以代表該至少一個選擇的單頻分量。該編碼器可以進(jìn)一步配置用于從所述單頻分量的集合的至少第二子集中選擇至少一個其他單頻分量。該編碼器可以進(jìn)一步配置用于生成至少一個第二指示符以代表該至少一個選擇的其他單頻分量。該編碼器可以進(jìn)一步配置用于將所述單頻分量的集合至少劃分為單頻分量的第一子集和第二子集。該編碼器可以進(jìn)一步配置用于根據(jù)所述集合內(nèi)的所述單頻分量的頻率,將所述單頻分量的集合至少劃分為所述單頻分量的第一子集和第二子集。該編碼器可以進(jìn)一步配置用于根據(jù)所述集合內(nèi)的所述單頻分量的感官重要性,將所述單頻分量的集合至少劃分為所述單頻分量的第一子集和第二子集。所述單頻分量優(yōu)選地是正弦波。按照本發(fā)明的第二方面,提供一種用于編碼音頻信號的方法,包括定義單頻分量的集合;從所述單頻分量的集合的第一子集中選擇至少一個單頻分量。該方法可以進(jìn)一步包括生成至少一個第一指示符,以代表該至少一個選擇的單頻分量。該方法可以進(jìn)一步包括從所述單頻分量的集合的至少第二子集中選擇至少一個其他單頻分量。該方法可以進(jìn)一步包括生成至少一個第二指示符以代表該至少一個選擇的其他
單頻分量。該方法可以進(jìn)一步包括將所述單頻分量的集合至少劃分為單頻分量的第一子集和第二子集。將所述單頻分量的集合至少劃分為所述單頻分量的第一子集和第二子集可以根據(jù)所述集合內(nèi)的所述單頻分量的頻率。將所述單頻分量的集合至少劃分為所述單頻分量的第一子集和第二子集可以進(jìn)一步根據(jù)所述集合中的所述單頻分量的感官重要性。 所述單頻分量可以是正弦波。
按照本發(fā)明的第三方面,提供一種用于解碼音頻信號的解碼器,其中所述解碼器配置用于接收至少一個指示符,其代表來自單頻分量的集合的第一子集的至少一個單頻分量;以及根據(jù)接收的所述指示符來插入所述單頻分量。該解碼器可以進(jìn)一步配置用于接收至少一個其他指示符,其代表來自所述單頻分量的集合的至少一個其他子集的至少一個其他單頻分量;以及根據(jù)接收的所述其他指示符來插入所述其他單頻分量。該解碼器可以進(jìn)一步配置用于接收符號指示符,其代表來自單頻分量的集合的第一子集的該至少一個單頻分量的符號。按照本發(fā)明的第四方面,提供一種用于解碼音頻信號的方法,包括接收至少一個指示符,其代表來自單頻分量的集合的第一子集的至少一個單頻分量;以及根據(jù)接收的所述指示符來插入所述單頻分量。該方法可以進(jìn)一步包括接收至少一個其他指示符,其代表來自所述單頻分量的集合的至少一個其他子集的至少一個其他單頻分量;以及根據(jù)接收的所述其他指示符來插入所述至少一個其他單頻分量。該方法可以進(jìn)一步包括接收符號指示符,其代表來自單頻分量的集合的第一子集的該至少一個單頻分量的符號。按照本發(fā)明的第五方面,提供一種裝置,包括如上所述的編碼器。按照本發(fā)明的第六方面,提供一種裝置,包括如上所述的解碼器。按照本發(fā)明的第七方面,提供一種電子設(shè)備,包括如上所述的編碼器。按照本發(fā)明的第八方面,提供一種電子設(shè)備,包括如上所述的解碼器。按照本發(fā)明的第九方面,提供一種計(jì)算機(jī)程序產(chǎn)品,配置用于執(zhí)行用于編碼音頻信號的方法,包括定義單頻分量的集合;從所述單頻分量的集合的第一子集中選擇至少一個單頻分量。按照本發(fā)明的第十方面,提供一種計(jì)算機(jī)程序產(chǎn)品,配置用于執(zhí)行用于解碼音頻信號的方法,包括接收至少一個指示符,其代表來自單頻分量的集合的第一子集的至少一個單頻分量;以及根據(jù)接收的所述指示符來插入所述至少一個單頻分量。按照本發(fā)明的第十一方面,提供一種用于編碼音頻信號的編碼器,包括用于定義單頻分量的集合的裝置;選擇裝置,用于從所述單頻分量的集合的第一子集中選擇至少一個單頻分量。按照本發(fā)明的第十二方面,提供一種用于解碼音頻信號的解碼器,包括接收裝置,用于接收至少一個指示符,其代表來自單頻分量的集合的第一子集的至少一個單頻分量;以及插入裝置,用于根據(jù)接收的所述指示符來插入所述單頻分量。按照本發(fā)明的第十三方面,提供一種用于編碼音頻信號的編碼器,其中所述編碼器配置用于選擇至少兩個單頻分量;生成指示符,所述指示符配置用于代表所述至少兩個單頻分量,并且配置為取決于這兩個單頻分量之間的頻率間隔。該編碼器可以進(jìn)一步配置用于選擇至少一個其他單頻分量;其中所述指示符優(yōu)選地進(jìn)一步配置用于代表所述至少一個其他單頻分量;并且其中所述指示符進(jìn)一步優(yōu)選地配置為取決于所述至少一個其他單頻分量與所述至少兩個單頻分量之一之間的頻率間隔。所述指示符優(yōu)選地進(jìn)一步配置為取決于所述至少兩個單頻分量之一的頻率。
該編碼器可以進(jìn)一步配置用于確定兩個單頻分量之間的頻率間隔。該編碼器可以進(jìn)一步配置用于在頻率間隔值列表中搜索兩個單頻分量之間的已確定頻率間隔;以及在所述列表中選擇與所述兩個單頻分量之間的所述已確定頻率間隔更接近匹配的一個頻率間隔值,其中所述指示符取決于所述頻率間隔值列表中選擇的一個頻率間隔值。該編碼器可以進(jìn)一步配置用于確定所述頻率間隔值列表中選擇的一個頻率間隔值與所述已確定頻率間隔值之間的差異;其中所述指示符優(yōu)選地進(jìn)一步取決于所述差異。該編碼器可以進(jìn)一步配置用于在另一差異值列表中搜索所述頻率間隔值列表中選擇的一個頻率間隔值與所述已確定頻率間隔值之間的已確定差異;在所述另一差異值列表中選擇與所述已確定差異更接近匹配的一個差異值,其中所述指示符優(yōu)選地取決于所述另一差異值列表中選擇的一個差異值。按照本發(fā)明的第十四方面,提供一種用于編碼音頻信號的方法,包括選擇至少兩個單頻分量;生成指示符,所述指示符配置用于代表所述至少兩個單頻分量,并且配置為取決于這兩個單頻分量之間的頻率間隔。該方法可以進(jìn)一步包括選擇至少一個其他單頻分量;其中所述指示符優(yōu)選地進(jìn)一步配置用于代表所述至少一個其他單頻分量;并且其中所述指示符進(jìn)一步優(yōu)選地配置為取決于所述至少一個其他單頻分量與所述至少兩個單頻分量之一之間的頻率間隔。所述指示符可以進(jìn)一步取決于所述至少兩個單頻分量之一的頻率。該方法可以進(jìn)一步包括確定兩個單頻分量之間的頻率間隔。該方法可以進(jìn)一步包括在頻率間隔值列表中搜索兩個單頻分量之間的已確定頻率間隔;以及在所述列表中選擇與所述兩個單頻分量之間的所述已確定頻率間隔更接近匹配的一個頻率間隔值,其中所述指示符取決于所述頻率間隔值列表中選擇的一個頻率間隔值。該方法可以進(jìn)一步包括確定所述頻率間隔值列表中選擇的一個頻率間隔值與所述已確定頻率間隔值之間的差異;其中所述指示符優(yōu)選地進(jìn)一步取決于所述差異。該方法可以進(jìn)一步包括在另一差異值列表中搜索所述頻率間隔值列表中選擇的一個頻率間隔值與所述已確定頻率間隔值之間的已確定差異;在所述另一差異值列表中選擇與所述已確定差異更接近匹配的一個差異值,其中所述指示符優(yōu)選地取決于所述另一差異值列表中選擇的一個差異值。按照本發(fā)明的第十五方面,提供一種用于解碼音頻信號的解碼器,其中所述解碼器配置用于接收代表至少兩個單頻分量的至少一個指示符,其中所述指示符代表兩個單頻分量之間的頻率間隔;以及根據(jù)接收的所述指示符來插入所述至少兩個單頻分量。所述至少一個指示符優(yōu)選地進(jìn)一步配置用于代表至少一個其他單頻分量,所述指示符優(yōu)選地進(jìn)一步配置為取決于所述至少一個其他單頻分量與所述至少兩個單頻分量之一之間的頻率間隔;并且所述解碼器優(yōu)選地進(jìn)一步配置用于根據(jù)所述指示符來插入所述至少一個其他單頻分量。按照本發(fā)明的第十六方面,提供一種用于解碼音頻信號的方法,包括接收代表至少兩個單頻分量的至少一個指示符,其中所述指示符代表兩個單頻分量之間的頻率間隔;以及根據(jù)接收的所述指示符來插入所述至少兩個單頻分量。
所述至少一個指示符優(yōu)選地進(jìn)一步配置用于代表至少一個其他單頻分量,所述指示符優(yōu)選地進(jìn)一步配置為取決于所述至少一個其他單頻分量與所述至少兩個單頻分量之一之間的頻率間隔;并且所述方法可以進(jìn)一步包括根據(jù)所述指示符來插入所述至少一個其他單頻分量。按照本發(fā)明的第十七方面,提供一種裝置,包括如上所述的編碼器。按照本發(fā)明的第十八方面,提供一種裝置,包括如上所述的解碼器。按照本發(fā)明的第十九方面,提供一種電子設(shè)備,包括如上所述的編碼器。按照本發(fā)明的第二十方面,提供一種電子設(shè)備,包括如上所述的解碼器。按照本發(fā)明的第二十一方面,提供一種計(jì)算機(jī)程序產(chǎn)品,配置用于執(zhí)行用于編碼音頻信號的方法,包括選擇至少兩個單頻分量;生成指示符,所述指示符配置用于代表所述至少兩個單頻分量,并且配置為取決于兩個單頻分量之間的頻率間隔。按照本發(fā)明的第二十二方面,提供一種計(jì)算機(jī)程序產(chǎn)品,配置用于執(zhí)行用于解碼音頻信號的方法,包括接收代表至少兩個單頻分量的至少一個指示符,其中所述指示符代表兩個單頻分量之間的頻率間隔;以及根據(jù)接收的所述指示符來插入所述至少兩個單頻分量。按照本發(fā)明的第二十三方面,提供一種用于編碼音頻信號的編碼器,包括選擇裝置,用于選擇至少兩個單頻分量;指示生成裝置,用于生成指示符,所述指示符配置用于代表所述至少兩個單頻分量,并且配置為取決于兩個單頻分量之間的頻率間隔。按照本發(fā)明的第二十四方面,提供一種用于解碼音頻信號的解碼器,包括接收裝置,用于接收代表至少兩個單頻分量的至少一個指示符,其中所述指示符代表兩個單頻分量之間的頻率間隔;以及插入裝置,用于根據(jù)接收的所述指示符來插入所述至少兩個單頻分量。
為了更好地理解本發(fā)明,現(xiàn)在將以示例的方式參考附圖,其中圖1示意性地示出了采用本發(fā)明實(shí)施方式的電子設(shè)備;圖2示意性地示出了采用本發(fā)明實(shí)施方式的音頻編解碼器系統(tǒng);圖3示意性地示出了圖2中所示的音頻編解碼器系統(tǒng)的編碼器部分;圖4示出了圖3中所示的編碼器的高頻區(qū)域編碼器部分的示意圖;圖5示意性地示出了音頻編解碼器系統(tǒng)的解碼器部分;圖6示出了說明按照本發(fā)明的、圖3和圖4中所示的音頻編碼器的實(shí)施方式的操作的流程圖;圖7示出了說明按照本發(fā)明的、圖5中所示的音頻解碼器的實(shí)施方式的操作的流程圖;圖8示出了按照本發(fā)明實(shí)施方式的音頻信號的頻譜表示、插入的正弦波位置以及正弦波位置的編碼的示例;以及圖9示出了按照本發(fā)明實(shí)施方式的音頻信號的頻譜表示以及插入的正弦波位置的其他示例。
具體實(shí)施例方式下面較為詳細(xì)地描述用于提供分層式或者可伸縮可變碼率音頻編解碼器的可行編解碼機(jī)制。在此方面,首先參考圖1,其示出了可以包含按照本發(fā)明實(shí)施方式的編解碼器的示例性電子設(shè)備10的示意框圖。電子設(shè)備10例如可以是無線通信系統(tǒng)的移動終端或者用戶設(shè)備。電子設(shè)備10包括麥克風(fēng)11,其經(jīng)由模數(shù)轉(zhuǎn)換器(ADC) 14鏈接至處理器21。處理器21進(jìn)一步經(jīng)由數(shù)模轉(zhuǎn)換器(DAC) 32鏈接至揚(yáng)聲器33。處理器21進(jìn)一步鏈接至收發(fā)機(jī)(TX/RX)13、用戶接口(UI)15以及存儲器22。處理器21可以配置用于執(zhí)行各種程序代碼。實(shí)現(xiàn)的程序代碼包括音頻編碼代碼,用于對音頻信號的低頻頻帶和音頻信號的高頻頻帶進(jìn)行編碼。實(shí)現(xiàn)的程序代碼23還包括音頻解碼代碼。實(shí)現(xiàn)的程序代碼23例如可以存儲在存儲器22中,以供處理器21在需要時隨時取回。存儲器22還可以提供部分M以用于存儲數(shù)據(jù),例如已經(jīng)按照本發(fā)明進(jìn)行編碼的數(shù)據(jù)。在本發(fā)明的實(shí)施方式中,編碼和解碼代碼可以實(shí)現(xiàn)在硬件或固件中。用戶接口 15使用戶能夠例如經(jīng)由小鍵盤來向電子設(shè)備10輸入命令,和/或例如經(jīng)由顯示器來從電子設(shè)備10獲得信息。收發(fā)機(jī)13允許例如經(jīng)由無線通信網(wǎng)絡(luò)來與其他電子設(shè)備進(jìn)行通信。將會再次理解,電子設(shè)備10的結(jié)構(gòu)可以按照多種方式來補(bǔ)充和變化。電子設(shè)備10的用戶可以使用麥克風(fēng)11來輸入語音,該語音將被傳輸至某些其他電子設(shè)備,或者將被存儲在存儲器22的數(shù)據(jù)部分M中。為此,用戶已經(jīng)經(jīng)由用戶接口 15激活了相應(yīng)的應(yīng)用。該應(yīng)用可以由處理器21來運(yùn)行,其致使處理器21執(zhí)行存儲器22中所存儲的編碼代碼。模數(shù)轉(zhuǎn)換器14將輸入模擬音頻信號轉(zhuǎn)換為數(shù)字音頻信號,并且向處理器21提供該數(shù)據(jù)音頻信號。處理器21繼而可以按照與參考圖2和圖3描述的相同方式來處理數(shù)字音頻信號。得到的比特流被提供給收發(fā)機(jī)13,以便向另一電子設(shè)備傳輸。備選地,編碼的數(shù)據(jù)可以存儲在存儲器22的數(shù)據(jù)部分M中,例如以供稍后傳輸或者稍后由同一電子設(shè)備10來呈現(xiàn)。電子設(shè)備10還可以經(jīng)由其收發(fā)機(jī)13從另一電子設(shè)備接收具有相應(yīng)編碼的數(shù)據(jù)的比特流。在這種情況下,處理器21可以執(zhí)行存儲器22中所存儲的解碼程序代碼。處理器21解碼接收的數(shù)據(jù),并且將解碼的數(shù)據(jù)提供給數(shù)模轉(zhuǎn)換器32。數(shù)模轉(zhuǎn)換器32將數(shù)字解碼的數(shù)據(jù)轉(zhuǎn)換為模擬音頻數(shù)據(jù),并且經(jīng)由揚(yáng)聲器33將其輸出。解碼程序代碼的執(zhí)行同樣可以由已由用戶經(jīng)由用戶接口 15調(diào)用的應(yīng)用來觸發(fā)。接收的已編碼數(shù)據(jù)也可以存儲在存儲器22的數(shù)據(jù)部分M中而不是經(jīng)由揚(yáng)聲器33立即呈現(xiàn),以便例如允許稍后呈現(xiàn)或者向又一電子設(shè)備轉(zhuǎn)發(fā)。將會理解,圖2到圖4中描述的示意性結(jié)構(gòu)以及圖7和圖8中的方法步驟只代表被示例性示出為在圖1中所示的電子設(shè)備中實(shí)現(xiàn)的完整音頻編解碼器的部分操作。圖2中示出了本發(fā)明的實(shí)施方式所采用的音頻編解碼器的一般性操作。如圖2中示意性示出的,一般性的音頻編碼/解碼系統(tǒng)包括編碼器和解碼器。示出了一個系統(tǒng)102,其具有編碼器104、存儲或者媒體信道106以及解碼器108。編碼器104對輸入音頻信號110進(jìn)行壓縮以產(chǎn)生比特流112,其被存儲或者通過媒體信道106進(jìn)行傳輸。比特流112可以在解碼器108內(nèi)接收。解碼器108解壓縮比特流112并且產(chǎn)生輸出音頻信號114。比特流112的比特率以及輸出音頻信號114關(guān)于輸入信號110的質(zhì)量是主要的特征,其定義了編碼系統(tǒng)102的性能。圖3示意性地示出了按照本發(fā)明一個實(shí)施方式的編碼器104。編碼器104包括輸入203,其被布置用于接收音頻信號。輸入203連接至低通濾波器230以及高通/帶通濾波器235。低通濾波器230還向低頻區(qū)域(LFR)編碼器(或者稱為核心編解碼器)231輸出信號。低頻區(qū)域編碼器231配置用于向高頻區(qū)域(HFR)編碼器232輸出信號。高通/帶通濾波器235連接至HFR編碼器232。LFR編碼器231和HFR編碼器232配置用于向比特流格式化器234(其在本發(fā)明的某些實(shí)施方式中也稱為比特流多路復(fù)用器)輸出信號。比特流格式化器234配置用于經(jīng)由輸出205對輸出比特流112進(jìn)行輸出。在本發(fā)明的某些實(shí)施方式中,高通/帶通濾波器235可以是可選的,并且音頻信號被直接傳遞至HFR編碼器232。這些組件的操作將結(jié)合示出編碼器104的操作的圖6的流程圖加以詳述。音頻信號由編碼器104接收。在本發(fā)明的第一實(shí)施方式中,音頻信號是數(shù)字采樣的信號。在本發(fā)明的其他實(shí)施方式中,音頻輸入可以是例如來自麥克風(fēng)6的模擬音頻信號,其被進(jìn)行模數(shù)(A/D)轉(zhuǎn)換。在本發(fā)明的又一些實(shí)施方式中,將音頻輸入從脈沖編碼調(diào)制數(shù)字信號轉(zhuǎn)換為幅度調(diào)制數(shù)字信號。音頻信號的接收在圖6中由步驟601示出。低通濾波器230和高通/帶通濾波器235接收音頻信號,并且定義對輸入信號110進(jìn)行濾波的截止頻率。接收的截止頻率之下的音頻信號頻率由低通濾波器230向低頻區(qū)域(LFR)編碼器231傳遞。接收的截止頻率之上的音頻信號頻率由高通濾波器235向高頻區(qū)域(HFR)編碼器232傳遞。在本發(fā)明的某些實(shí)施方式中,可選地對信號進(jìn)行下采樣,以便進(jìn)一步改進(jìn)低頻區(qū)域編碼器231的編碼效率。LFR編碼器231接收低頻(并且可選地經(jīng)過下采樣的)音頻信號,并且對該信號應(yīng)用適當(dāng)?shù)牡皖l編碼。在本發(fā)明的第一實(shí)施方式中,低頻編碼器231應(yīng)用量化和具有32個低頻子帶的霍夫曼(Huffman)編碼。使用分析濾波器組結(jié)構(gòu)將輸入信號110劃分為若干子帶??梢允褂眯睦砺晫W(xué)模型提供的信息對每個子帶進(jìn)行量化和編碼。量化設(shè)置以及編碼方案可以由所應(yīng)用的心理聲學(xué)模型來指示。將經(jīng)過量化、編碼的信息發(fā)送至比特流格式化器234,以用于創(chuàng)建比特流112。此外,LFR編碼器231使用修正的離散余弦變換(MDCT)對低頻內(nèi)容進(jìn)行轉(zhuǎn)換,以產(chǎn)生合成LFR信號的頻域?qū)崿F(xiàn)。這些頻域?qū)崿F(xiàn)被傳遞至HFR編碼器232。該低頻區(qū)域編碼在圖6中由步驟606示出。在本發(fā)明的其他實(shí)施方式中,可以采用其他低頻編解碼器,以便生成向比特流格式化器234輸出的核心編碼輸出。這些其他實(shí)施方式的低頻編解碼器的示例包括但不限于高級音頻編碼(AAC)、MPEG Layer 3 (MP3)、ITU-T嵌入式可變速率(EV-VBR)語音編碼基線編解碼器以及ITU-T G. 729. 1。在低頻區(qū)域編碼器231沒有有效地輸出作為編碼過程的一部分的頻域合成輸出的情況下,低頻區(qū)域(LFR)編碼器231可以進(jìn)一步包括低頻解碼器和頻域轉(zhuǎn)換器(圖3中未示出)以生成低頻信號的合成再現(xiàn)。并且在本發(fā)明的實(shí)施方式中,該低頻信號的合成再現(xiàn)繼而被轉(zhuǎn)換為頻域表示,并且在需要的情況下被分割為向HFR編碼器232發(fā)送的一系列低頻子帶。在本發(fā)明的實(shí)施方式中,這允許從很多可行編碼器/解碼器中選擇低頻區(qū)域編碼器231,由此本發(fā)明不限于產(chǎn)生頻域信號作為輸出的一部分的特定低頻或者核心編碼算法。高頻區(qū)域(HFR)編碼器232在圖4中更為詳細(xì)地示出。高頻區(qū)域編碼器232從高通/帶通濾波器235接收信號,這被輸入到修正的離散余弦變換(MDCT)/移位離散傅里葉變換(SDFT)處理器301。來自MDCT/SDFT變換器301的頻域輸出被傳遞至音調(diào)選擇控制器303、高頻區(qū)域(HFR)頻帶復(fù)制選擇處理器305、高頻區(qū)域頻帶復(fù)制縮放處理器307以及正弦波注入選擇/編碼處理器309。音調(diào)選擇控制器303配置用于控制或者配置HFR頻帶復(fù)制選擇處理器305、HFR頻帶復(fù)制縮放處理器307、正弦波注入選擇/編碼處理器309以及多路復(fù)用器311。此外,HFR頻帶復(fù)制選擇處理器305從LFR編碼器231接收頻域形式的合成低頻區(qū)域信號。HFR頻帶復(fù)制選擇處理器305輸出來自LFR編碼器的選定HFR頻帶(這將在后文描述),并且將該選擇傳遞至HFR頻帶復(fù)制縮放處理器307。HFR頻帶復(fù)制縮放處理器305向多路復(fù)用器311傳輸已編碼形式的選擇和縮放元素,以便插入在數(shù)據(jù)流112中。此外,HFR頻帶復(fù)制縮放處理器307還向正弦波注入選擇/編碼處理器309傳遞選擇和縮放的HFR區(qū)域的表示。正弦波注入選擇/編碼處理器309還向多路復(fù)用器311傳遞信號以便包括在輸出數(shù)據(jù)流112中?,F(xiàn)在將參考圖6和圖4詳細(xì)闡釋HFR編碼器是如何操作的。MDCT/SDFT處理器301將接收自HP/BP濾波器235的高頻區(qū)域音頻信號轉(zhuǎn)換為該信號的頻域表示。在本發(fā)明的某些實(shí)施方式中,MDCT/SDFT處理器還將高頻音頻信號劃分為較短的子頻帶。這些子頻帶可以為500-800HZ量級的寬度。在本發(fā)明的某些實(shí)施方式中,子頻帶具有不相等的頻帶寬度。在另一實(shí)施方式中,子頻帶的帶寬為750Hz。在本發(fā)明的其他實(shí)施方式中,相等或者不等的子頻帶帶寬取決于高頻區(qū)域的帶寬分配。在本發(fā)明的第一實(shí)施方式中,子頻帶帶寬是恒定的。換言之,幀之間不存在改變。在本發(fā)明的其他實(shí)施方式中,子頻帶帶寬不是恒定的,并且子頻帶可以具有隨時間改變的帶寬。在本發(fā)明的某些實(shí)施方式中,該可變子帶帶寬分配可以基于音頻信號的心理聲學(xué)建模來確定。而且,在本發(fā)明的各實(shí)施方式中,這些子帶可以是連續(xù)的(換言之,一個接一個,并且產(chǎn)生連續(xù)譜實(shí)現(xiàn))或者是部分重疊的。時域到頻域變換以及子帶組織步驟在圖6中由步驟607示出。音調(diào)選擇控制器303可以配置用于控制HFR頻帶復(fù)制選擇、縮放、正弦波注入選擇和編碼以及多路復(fù)用,以便可以執(zhí)行對高頻區(qū)域的更為有效的編碼。在音調(diào)選擇控制器303處接收來自MDCT/SDFT處理器301的移位離散傅里葉變換輸出。公式1示出了針對兩個N樣本而定義的移位離散傅里葉變換(SDFT)的一個示例
1(其可以認(rèn)為是用于本發(fā)明優(yōu)選實(shí)施方式的幀)
權(quán)利要求
1.一種用于對音頻信號的較低頻區(qū)域進(jìn)行編碼以及通過向較高頻區(qū)域添加單頻分量來對所述音頻信號的所述較高頻區(qū)域進(jìn)行編碼的編碼器,其中所述編碼器配置用于選擇至少兩個所述單頻分量;生成指示符,所述指示符配置用于代表所述至少兩個單頻分量,并且配置為取決于所述兩個單頻分量之間的頻率間隔。
2.如權(quán)利要求1所述的編碼器,進(jìn)一步配置用于選擇至少一個其他單頻分量;其中所述指示符進(jìn)一步配置用于代表所述至少一個其他單頻分量;并且其中所述指示符進(jìn)一步配置為取決于所述至少一個其他單頻分量與所述至少兩個單頻分量之一之間的頻率間隔。
3.如權(quán)利要求1或2所述的編碼器,其中所述指示符進(jìn)一步配置為取決于所述至少兩個單頻分量之一的頻率。
4.如權(quán)利要求1到3之任一所述的編碼器,進(jìn)一步配置用于確定所述兩個單頻分量之間的頻率間隔。
5.如權(quán)利要求4所述的編碼器,進(jìn)一步配置用于在頻率間隔值列表中搜索所述兩個單頻分量之間的已確定頻率間隔;以及在所述列表中選擇與所述兩個單頻分量之間的所述已確定頻率間隔更接近匹配的一個頻率間隔值,其中所述指示符取決于所述頻率間隔值列表中選擇的一個頻率間隔值。
6.如權(quán)利要求5所述的編碼器,進(jìn)一步配置用于確定所述頻率間隔值列表中所選擇的一個頻率間隔值與所述已確定頻率間隔值之間的差異;其中所述指示符進(jìn)一步取決于所述差異。
7.如權(quán)利要求6所述的編碼器,進(jìn)一步配置用于在另一差異值列表中搜索所述頻率間隔值列表中所選擇的一個頻率間隔值與所述已確定頻率間隔值之間的已確定差異;在所述另一差異值列表中選擇與所述已確定差異更接近匹配的一個差異值,其中所述指示符取決于所述另一差異值列表中選擇的一個差異值。
8.一種用于對音頻信號的較低頻區(qū)域進(jìn)行編碼以及通過向較高頻區(qū)域添加單頻分量來對所述音頻信號的所述較高頻區(qū)域進(jìn)行編碼的方法,包括選擇至少兩個單頻分量;生成指示符,所述指示符配置用于代表所述至少兩個單頻分量,并且配置為取決于兩個單頻分量之間的頻率間隔。
9.如權(quán)利要求8所述的方法,進(jìn)一步包括選擇至少一個其他單頻分量;其中所述指示符進(jìn)一步配置用于代表所述至少一個其他單頻分量;并且其中所述指示符進(jìn)一步配置為取決于所述至少一個其他單頻分量與所述至少兩個單頻分量之一之間的頻率間隔。
10.如權(quán)利要求8或9所述的方法,其中所述指示符進(jìn)一步取決于所述至少兩個單頻分量之一的頻率。
11.如權(quán)利要求8到10之任一所述的方法,進(jìn)一步包括確定兩個單頻分量之間的頻率間隔。
12.如權(quán)利要求11所述的方法,進(jìn)一步包括在頻率間隔值列表中搜索兩個單頻分量之間的已確定頻率間隔;以及在所述列表中選擇與所述兩個單頻分量之間的所述已確定頻率間隔更接近匹配的一個頻率間隔值,其中所述指示符取決于所述頻率間隔值列表中所選擇的一個頻率間隔值。
13.如權(quán)利要求12所述的方法,進(jìn)一步包括確定所述頻率間隔值列表中所選擇的一個頻率間隔值與所述已確定頻率間隔值之間的差異;其中所述指示符進(jìn)一步取決于所述差異。
14.如權(quán)利要求13所述的方法,進(jìn)一步包括在另一差異值列表中搜索所述頻率間隔值列表中選擇的一個頻率間隔值與所述已確定頻率間隔值之間的已確定差異;以及在所述另一差異值列表中選擇與所述已確定差異更接近匹配的一個差異值,其中所述指示符取決于所述另一差異值列表中所選擇的一個差異值。
15.一種用于解碼音頻信號的解碼器,所述音頻信號通過如下方式進(jìn)行編碼對所述音頻信號的較低頻區(qū)域進(jìn)行編碼以及通過向所述較高頻區(qū)域添加單頻分量來對所述音頻信號的較高頻區(qū)域進(jìn)行編碼,其中所述解碼器配置用于接收代表至少兩個所述單頻分量的至少一個指示符,其中所述指示符代表兩個單頻分量之間的頻率間隔;以及根據(jù)接收的所述指示符來插入所述至少兩個單頻分量。
16.如權(quán)利要求15所述的解碼器,其中所述至少一個指示符進(jìn)一步配置用于代表至少一個其他單頻分量,所述指示符進(jìn)一步配置為取決于所述至少一個其他單頻分量與所述至少兩個單頻分量之一之間的頻率間隔;并且所述解碼器進(jìn)一步配置用于根據(jù)所述指示符來插入所述至少一個其他單頻分量。
17.一種用于解碼音頻信號的方法,所述音頻信號通過如下方式進(jìn)行編碼對所述音頻信號的較低頻區(qū)域進(jìn)行編碼以及通過向所述較高頻區(qū)域添加單頻分量來對所述音頻信號的較高頻區(qū)域進(jìn)行編碼,包括接收代表至少兩個所述單頻分量的至少一個指示符,其中所述指示符代表兩個單頻分量之間的頻率間隔;以及根據(jù)接收的所述指示符來插入所述至少兩個單頻分量。
18.如權(quán)利要求17所述的用于解碼的方法,其中所述至少一個指示符進(jìn)一步配置用于代表至少一個其他單頻分量,所述指示符進(jìn)一步配置為取決于所述至少一個其他單頻分量與所述至少兩個單頻分量之一之間的頻率間隔;所述方法進(jìn)一步包括根據(jù)所述指示符來插入所述至少一個其他單頻分量。
19.一種裝置,包括如權(quán)利要求1到7所述的編碼器。
20.一種裝置,包括如權(quán)利要求15或16所述的解碼器。
21.一種電子設(shè)備,包括如權(quán)利要求1到7之任一權(quán)利要求所述的編碼器。
22.一種電子設(shè)備,包括如權(quán)利要求15或16所述的解碼器。
23.一種計(jì)算機(jī)程序產(chǎn)品,配置用于執(zhí)行用于通過對音頻信號的較低頻區(qū)域進(jìn)行編碼以及通過向較高頻區(qū)域添加單頻分量來對所述音頻信號的所述較高頻區(qū)域進(jìn)行編碼來編碼音頻信號的方法,包括選擇至少兩個單頻分量;生成指示符,所述指示符配置用于代表所述至少兩個單頻分量,并且配置為取決于兩個單頻分量之間的頻率間隔。
24.一種計(jì)算機(jī)程序產(chǎn)品,配置用于執(zhí)行用于解碼音頻信號的方法,所述音頻信號通過如下方式進(jìn)行編碼對所述音頻信號的較低頻區(qū)域進(jìn)行編碼以及通過向所述較高頻區(qū)域添加單頻分量來對所述音頻信號的較高頻區(qū)域進(jìn)行編碼,包括接收代表至少兩個單頻分量的至少一個指示符,其中所述指示符代表兩個單頻分量之間的頻率間隔;以及根據(jù)接收的所述指示符來插入所述至少兩個單頻分量。
25.一種用于對音頻信號的較低頻區(qū)域進(jìn)行編碼以及通過向較高頻區(qū)域添加單頻分量來對所述音頻信號的所述較高頻區(qū)域進(jìn)行編碼的編碼器,包括選擇裝置,用于選擇至少兩個所述單頻分量;指示生成裝置,用于生成指示符,所述指示符配置用于代表所述至少兩個單頻分量,并且配置為取決于兩個單頻分量之間的頻率間隔。
26.一種用于解碼音頻信號的解碼器,所述音頻信號通過如下方式進(jìn)行編碼對所述音頻信號的較低頻區(qū)域進(jìn)行編碼以及通過向所述較高頻區(qū)域添加單頻分量來對所述音頻信號的較高頻區(qū)域進(jìn)行編碼,包括接收裝置,用于接收代表至少兩個所述單頻分量的至少一個指示符,其中所述指示符代表兩個單頻分量之間的頻率間隔;以及插入裝置,用于根據(jù)接收的所述指示符來插入所述至少兩個單頻分量。
全文摘要
一種用于編碼音頻信號的編碼器,其中所述編碼器配置用于定義單頻分量的集合;從所述單頻分量的集合的第一子集中選擇至少一個單頻分量。
文檔編號G10L21/02GK102568489SQ201210012088
公開日2012年7月11日 申請日期2007年11月6日 優(yōu)先權(quán)日2007年11月6日
發(fā)明者A·拉莫, A·瓦西拉徹, L·拉克索南, M·塔米 申請人:諾基亞公司