亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

正弦模型參數(shù)的頻率差分編碼的制作方法

文檔序號:2819663閱讀:543來源:國知局
專利名稱:正弦模型參數(shù)的頻率差分編碼的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種正弦模型參數(shù)的頻率差分編碼。
近年來,基于模型的低比特率的音頻壓縮手段已經(jīng)獲得了更多的關(guān)注。典型地,這些參數(shù)方案將音頻波形分解為多個共存的信號部分,例如,一個正弦部分,一個類似于噪聲的部分,和/或一個暫態(tài)部分。接著,描述各信號部分的模型參數(shù)被量化,編碼,并傳送到解碼器,在解碼器中量化的信號部分被合成以及求和來形成一個重構(gòu)的信號。通常,音頻信號的正弦部分是由幅值、頻率,可能還有相位參數(shù)等所確定的正弦模型來表示的。對于大多數(shù)音頻信號,正弦信號部分比噪聲和暫態(tài)部分更重要,因此,分配了相對大量的總比特預(yù)算用于表示正弦模型參數(shù)。例如,T.S.Verma和T.H.Y.Meng在2000年的Proc.IEEE Inst.Conf.Acoust.,Speech SignalProcessing中第877-880頁的“A 6Kbps to 85Kbps scalable audiocoder”(6Kbps到85Kbps可升級音頻編碼器)中所描述的已知的可升級的音頻編碼器中,多余70%的可用比特率被用于表示正弦參數(shù)。
通常,為了減少正弦模型所需的比特率,使用時間差分(TD)編碼方案來利用正弦參數(shù)之間的幀間相關(guān)性。當(dāng)前信號幀中的正弦分量與先前幀中的量化分量是相關(guān)的(這樣在時間-頻率平面中形成“音調(diào)軌道”),并且將參數(shù)差值進(jìn)行量化和編碼。不能與過去的分量相聯(lián)系的當(dāng)前幀中的分量被認(rèn)為是新軌道的開始并且通常被直接編碼,而不使用差分編碼。雖然TD編碼對減小平穩(wěn)信號域的比特率是有效的,但在突發(fā)信號變化的域中卻是低效的,因?yàn)橄鄬^少的分量可以與音調(diào)軌道相關(guān),所以大量的分量被直接編碼。此外,為了在解碼器一端能夠從差分參數(shù)中重構(gòu)信號,TD編碼的關(guān)鍵取決于假設(shè)先前幀的參數(shù)已經(jīng)無損地到達(dá)。在某些傳輸信道,例如,互聯(lián)網(wǎng)一類的有損分組網(wǎng)絡(luò)中,該假設(shè)可能是無效的。因而,在某些情況下希望有TD編碼的替代方式。
一種上述的替代方式是頻率差分(FD)編碼,其中采用了正弦分量之間的幀間相關(guān)性。在FD編碼中,屬于相同信號幀的參數(shù)之間的差值被量化和編碼,這樣就消除了對先前幀中參數(shù)的依賴性。FD編碼在基于正弦的語音編碼中是眾所周知的,并且最近同樣被用于音頻編碼。典型地,一幀中的正弦分量以漸增的頻率次序被量化和編碼,首先,最低頻率的分量被直接編碼,接著較高頻率分量相對于離它最近的較低頻率一次一個地被量化和編碼。盡管這種方法很簡單,但它可能并不是最佳的。例如,在某些幀中放寬對最近相鄰的限制可能會更有效。
為了達(dá)到本發(fā)明的目的,發(fā)明人尋求獲得一種更通用的正弦模型參數(shù)的FD編碼方法。對于給定的相應(yīng)于每個量化級的參數(shù)量化器和碼-字長度(比特),所提出的方法找到了一幀中正弦分量的頻率差分和直接編碼之間的最佳組合方式。該方法允許參數(shù)差分包含任何分量對,也就是說,沒有必要是頻域相鄰,就此而言,它比現(xiàn)有的方案加更通用。此外,不像上述的簡單方案,如果能達(dá)到最高的效率,一些(在極端情況下,為所有的)分量可能被直接編碼。
根據(jù)音頻信號編碼的方法,本方法的特征在于對編碼幀中一個給定的正弦分量的參數(shù)或者相對于同一幀中的其它分量差分編碼,或者直接編碼,即不使用差分編碼。
從各種其它的方面,本發(fā)明提供的方法和裝置在下面的獨(dú)立權(quán)利要求中作了闡明。另外,本發(fā)明實(shí)施例更優(yōu)選的特征在下面的從屬權(quán)利要求中作了闡明。
現(xiàn)在將通過實(shí)例以及參考附圖的方式對本發(fā)明的實(shí)施例做詳細(xì)地描述,其中

圖1是一個有向圖D,用于表示在給定幀中正弦分量(K=5)的直接和頻率差分編碼的所有可能的組合;圖2表示了本發(fā)明一個實(shí)施例中有刻度幅值的量化器的輸出級的例子;圖3表示了例示在K=5時所允許的解樹;圖4表示了圖G(K=5),它將問題1(如以下定義的)的可能的解決方案表示為賦值,其中,為清楚起見,只顯示了幾個邊和權(quán)重;圖5表示了在圖G中相應(yīng)于圖3的樹的賦值;圖6a至圖6c表示了拓?fù)湎嗤筒煌慕鈽涞睦樱?br> 圖7是體現(xiàn)本發(fā)明的編碼信號中拓?fù)洳煌慕鈽涞臄?shù)目的圖,它是正弦分量K數(shù)目的函數(shù);以及圖8是體現(xiàn)本發(fā)明的用于傳輸音頻數(shù)據(jù)的系統(tǒng)的簡化框圖。
本發(fā)明的實(shí)施例可以在一個用于通過不可靠的通信鏈路(例如互聯(lián)網(wǎng))來傳輸音頻信號的系統(tǒng)中構(gòu)成。圖8中所概略示出的這種系統(tǒng),典型地包括一個音頻信號源10,以及傳輸裝置12,用于從音頻信號源10傳輸音頻信號。傳輸裝置12包括一個輸入單元20,用于從信號源10獲得音頻信號,一個編碼裝置22,用于對音頻信號編碼以獲得編碼的音頻信號,以及一個輸出單元24,通過把被編碼的信號應(yīng)用到網(wǎng)絡(luò)鏈路26上來傳輸或記錄被編碼的音頻信號。連接到網(wǎng)絡(luò)鏈路26的接收裝置30用來接收被編碼的音頻信號。接收裝置30包括一個用于接收被編碼的信號的輸入單元32;一個用于對被編碼的音頻信號進(jìn)行解碼以獲得已解碼的音頻信號的裝置34;以及一個用于輸出被解碼的音頻信號的輸出單元36,。然后輸出信號可以如適合的裝置40所要求而被再生,記錄或進(jìn)行其它的處理。
在編碼裝置22內(nèi),信號根據(jù)一編碼方法而被編碼,該編碼方法對給定的正弦分量參數(shù)或者相對于同一幀中的其它分量差分編碼或者直接編碼,即,不使用差分編碼。該方法必須確定在編碼過程的任何階段中是否利用差分編碼。
為了闡明必須由該方法解決以達(dá)到這種確定的問題,假設(shè)在一個信號幀中已經(jīng)對若干正弦分量s1,...,sK進(jìn)行估計的情況。每一個分量sK由幅值aK和頻率值ωK來描述。為了當(dāng)前的說明,沒有必要考慮相位值,因?yàn)檫@些可以從頻率參數(shù)中獲得或者直接被量化。但是仍然應(yīng)該注意到本發(fā)明實(shí)際上可以擴(kuò)展到相位值和/或其它的值,例如阻尼系數(shù)。
考慮以下給定分量的參數(shù)量化的可能1)直接量化(即,非差分),或者2)相對于較低頻率成分中的量化參數(shù)的差分量化。
直接和差分量化的所有可能組合的集合利用圖1所示的一個有向圖D來表示。
頂點(diǎn)s1,...,sK表示要被量化的正弦分量。這些頂點(diǎn)之間的邊表示差分編碼的可能性,例如s1和s4之間的邊表示與相對于s1而對s4的參數(shù)進(jìn)行量化(即,對于幅值參數(shù)4=1+Δ14)。頂點(diǎn)s0是一個虛擬的頂點(diǎn),將其引入是為了表示直接量化的可能性。例如,s0和s2之間的邊表示s2參數(shù)的直接量化。每一個邊被賦予一個權(quán)重wij,它對應(yīng)于選擇由該邊所表示的特定量化時在速率和失真方面的損失。基本任務(wù)是尋找一種直接和差分編碼的速率-失真的最佳組合。這對應(yīng)于在D中尋找具有最小的總損失的K邊的子集,如此一來,每一個頂點(diǎn)s1,...,sK正好具有一個被賦值的入邊(in edge)。
邊權(quán)重的計算將在下面做描述。原則上,每一個邊的權(quán)重具有以下形式wij=rij+λdij方程1其中rij和dij分別表示與該特定方程相聯(lián)系的速率(即比特的數(shù)目)和失真,λ是拉格朗日乘法系數(shù)。通常,如圖1所示,高-指數(shù)的分量sj相對于(已量化的)低-指數(shù)的分量而被量化,因此權(quán)重wij的確切值取決于低-指數(shù)分量si的特定的量化。換句話說,在si被量化之前wij的值是不能被計算出來的。為了消除這種依賴性,我們假定使用相似的量化器用于幅值參數(shù)的直接和差分量化,如圖2所示。
圖2中,列1列出了直接幅值量化器的輸出級,列2列出了差分幅值量化器的輸出級,列3列出在差分量化后可以達(dá)到的幅值電平的集合。
在這種假設(shè)下,通過直接和差分量化可以達(dá)到的量化器級是相同的,并且給定的分量將以相同的方式被量化,而與使用直接還是差分量化無關(guān)。反過來,這意味著對于直接和差分編碼的任意組合的總失真是恒定的,我們可以將λ=0代入方程1中。此外,由于wij=rij,現(xiàn)在D的所有權(quán)重值可以被提前計算出來,其中, 整數(shù)r(.)代表用于表示已量化的參數(shù)(.)所需的比特數(shù)。在這個例子中,r(.)的值是預(yù)計算的霍夫曼碼-字表的條目。
為了能清楚地理解該例子,有必要對正在討論的問題進(jìn)行系統(tǒng)的闡述。假定正在討論的信號幀包含要被編碼的K個正弦分量,我們將最佳FD編碼問題用做如下公式表示問題1對于給定的具有邊權(quán)重wI的圖D,尋找具有最小總權(quán)重的K個邊的集合,由此a)每個頂點(diǎn)s1,...,sK被分配給確切的一個入邊,以及b)每個頂點(diǎn)s1,...,sK被分配給最大的一個出邊。
由于能確保每K個正弦分量只被量化和編碼一次,所以限制條件a)是必要的。限制條件b)將一個特殊的簡單結(jié)構(gòu)實(shí)施在K邊方案樹上。這對于減少指導(dǎo)解碼器如何組合所傳輸?shù)?delta-)幅值和頻率時所需的附加信息是很重要的。圖3顯示了滿足限制條件a)和b)的可能方案樹的例子。注意,在例如現(xiàn)有技術(shù)建議中使用的“標(biāo)準(zhǔn)”FD編碼配置是圖3c所提供的框架結(jié)構(gòu)的特殊情況。
為解決上述問題,提供了兩種算法(指算法1和算法2)。算法1在數(shù)學(xué)上是最佳的,而算法2以較低的計算成本提供了一個近似的解決方案。
算法1為解決問題1,我們把它再表示為所謂的賦值問題,它是圖形理論中一個眾所周知的問題。利用有向圖D(圖1),我們構(gòu)建一個如圖4所示的圖G。G的頂點(diǎn)可以被分成兩個子集左邊的子集X,它包含頂點(diǎn)s1,...,sK-1以及K個s0,右邊的子集Y,它包含頂點(diǎn)s1,...,sK以及K-1個虛頂點(diǎn),表示成 多個邊將X和Y的頂點(diǎn)連接起來。連接到X中的頂點(diǎn)的邊對應(yīng)于有向圖D中的出邊,而連接到頂點(diǎn)s1,...,sK∈Y的邊對應(yīng)于D中的入邊。例如,D中從s2∈X到s4∈Y的邊對應(yīng)于有向圖D中的邊s2s4。這樣,圖G中的實(shí)線邊表示有向圖D的“差分編碼”的邊。此外,從頂點(diǎn){s0}∈X到s1,...,sK∈Y之間的虛線邊都對應(yīng)于分量s1,...,sK的直接編碼。將X的頂點(diǎn)與s1,...,sK∈Y的頂點(diǎn)連接起來的邊的權(quán)重與有向圖D相應(yīng)邊的權(quán)重是相同的。最后,K-1個虛頂點(diǎn) 用于表示解決解樹中的某些頂點(diǎn)可以是“葉子”,即,不具有任何出邊。例如,在圖3a中,頂點(diǎn)s2就是葉子。在圖G中,用從s2∈X到 中的一個頂點(diǎn)之間的邊來表示。所有連接到頂點(diǎn) 的邊的權(quán)重是0。
可以看出,滿足問題1的限制條件a)和b)的D中,K個邊的每一個集合都可以表示為G中X的頂點(diǎn)到Y(jié)的頂點(diǎn)的一個賦值,即G中2K-1個邊的子集,這樣每個頂點(diǎn)正好分配到一個邊。圖5a-c顯示了分別對應(yīng)于圖3a-c的樹的賦值的例子。因此,問題1可以被重新闡述成所謂的賦值問題,即我們所指的問題2。
問題2在圖G中尋找具有最小總權(quán)重的2K-1個邊的集合,這樣每個頂點(diǎn)正好分配到一個邊。
已經(jīng)存在了解決問題2的幾種算法,例如所謂的Hungarian方法,在H.W.Kuhn的“The Hungarian Method for the AssignmetProblem”,Naval Research Logistics Quarterly,283-97,1955中做過討論,它使用0((2K-1)3)算術(shù)運(yùn)算來解決該問題。一種可選的實(shí)現(xiàn)方式是R.Jonker和A.Volgenant在Computing,1987年第38卷325-340頁的“用于密集和稀疏線性賦值問題的最短增加路徑算法”(“A Shortest Augmenting Path Algorithm for Dense and SparseLinear Assignment Problems”)中所描述的算法。它的復(fù)雜度與Hungarian方法相似,但JonKer和Volgenants算法在實(shí)踐中速度更快。此外,他們的算法可以快速地解決稀疏問題,這對于本實(shí)施例的多幀連接算法很重要。
總而言之,算法1由以下步驟組成。首先,構(gòu)建有向圖D(結(jié)果得到G)。接著,決定具有最小權(quán)重(問題2)的G中的賦值。最后,從G的賦值中很容易地得到直接和差分編碼的最佳組合。
算法2是一種迭代的貪心算法,它對于增長的指數(shù)一次一個地處理圖D中的頂點(diǎn)s1,...,sK。在迭代K,從候選邊集合中選擇頂點(diǎn)sK的一個入邊。該供選擇的集合由sK的入邊和直接編碼邊s0sK組成,其中該sK的入邊的源自于不具有以前選擇的出邊的定點(diǎn)。從該集合便可以選擇具有最小權(quán)重的邊。根據(jù)所述步驟,可以得到能滿足問題1中限制條件a)和b)的K個邊的集合。通常,該貪心的方法并不是最佳的,即,可能存在另外的滿足條件a)和b)且具有更低總權(quán)重的K個邊的集合。算法2具有0(K2)的計算復(fù)雜度。
除上述的被編碼的正弦(delta-)參數(shù)外,采用本發(fā)明的編碼信號必須包括描述如何在解碼器端組合參數(shù)的附加信息。一種可能是在附加信息表中為每個可能的解樹分配一個符號。然而不同的解樹的數(shù)目是巨大的;例如,在具有K=25的正弦分量的幀中,可以看出,不同解樹的數(shù)目大約是1018,對應(yīng)于附加信息表中索引解樹的62比特。很明顯,這個數(shù)字對于多數(shù)應(yīng)用來說已經(jīng)過大。幸而附加信息表只需要表示拓?fù)浣Y(jié)構(gòu)不同的解樹,假定一特定的排序被應(yīng)用到該(delta-)參數(shù)序列中。為了明確拓?fù)浣Y(jié)構(gòu)不同的樹以及參數(shù)排序這一概念,可以參考圖6a到6c中解樹的例子,樹的下面列出了相應(yīng)的參數(shù)序列。圖6a和6b中的生成樹的拓?fù)浣Y(jié)構(gòu)是相同的,因?yàn)樗鼈兙扇吅投叺姆种ЫM成,由此在附加信息表中可以由相同的符號代表。相反地,圖6c中的樹由一個單獨(dú)的五邊分支組成,所以拓?fù)浣Y(jié)構(gòu)與其它的不同。已知拓?fù)錁浣Y(jié)構(gòu),并且假定該(delta-)參數(shù)以分支方式出現(xiàn)在具有最長分支的參數(shù)流中,解碼器可能正確地組合所接收到的參數(shù)。
因此,本發(fā)明的優(yōu)選實(shí)施例提供了一個附加信息表,它的符號對應(yīng)于拓?fù)浣Y(jié)構(gòu)不同的解樹。附加信息的上限值由這些樹的數(shù)目確定。下面是拓?fù)浣Y(jié)構(gòu)不同的樹的數(shù)目的表示。
如圖6a到6c中的例子所示,解樹的結(jié)構(gòu)可以通過規(guī)定樹中每個分支的長度來確定。假定以最長分支優(yōu)先進(jìn)行排序,拓?fù)浣Y(jié)構(gòu)不同的樹的集合由非增長正整數(shù)的不同序列確定,它的總數(shù)是K;在組合學(xué)上,這種序列是指正整數(shù)K的“整數(shù)劃分”。例如,如果K=5,則存在以下7種整數(shù)劃分{5}(圖1c),{4,1},{3,2}(圖1a和1b),{3,1,1},{2,2,1,},{2,1,1,1}和{1,1,1,1,1}。這樣當(dāng)K=5時,就有7種拓?fù)浣Y(jié)構(gòu)不同的解樹,附加信息表將由7個符號組成。用Pj(K)表示K的整數(shù)劃分的數(shù)目,它的第一個整數(shù)是j,下面的遞歸式直接反映出不同解樹的數(shù)目PP(K)=Σi=1KPi(K)]]>等式2其中 等式3圖8表示了作為正弦分量的數(shù)目K的函數(shù)的拓?fù)浣Y(jié)構(gòu)不同的樹的數(shù)目。這樣,當(dāng)K=25時,附加信息表的索引會需要11比特的最大值。注意到該圖表示附加信息的上限值;利用統(tǒng)計特性(例如熵編碼)可以進(jìn)一步減小附加信息率。
所述算法的性能可以由對音頻信號的模擬研究來證明。四個不同的音頻信號以速率44.1KHz、大約20秒持續(xù)時間采樣,利用連續(xù)幀間的50%重疊的漢寧窗,每個被劃分為1024個采樣的固定長度幀。
每個信號幀利用正弦模型來表示,該模型具有固定數(shù)目K=25時恒定幅值、恒定頻率的正弦分量,其參數(shù)是利用匹配追蹤算法提取的。幅值和頻率參數(shù)在對數(shù)域中分別利用20%和0.5%的相對量化器級被均勻量化。類似的相對量化級也用在直接和差分量化中,如圖2所示,經(jīng)量化的參數(shù)利用霍夫曼編碼進(jìn)行編碼。
進(jìn)行了試驗(yàn),其中使用算法1和2來確定如何在每一幀中組合直接和FD編碼。另外,還做了模擬,其中利用如圖3c所示K=5的“標(biāo)準(zhǔn)”FD編碼配置對幅值和頻率參數(shù)進(jìn)行量化。最后,為了確定FD編碼可能的增益,對參數(shù)直接量化,即,不使用差分編碼。每個試驗(yàn)根據(jù)各自的測算而使用了不同的霍夫曼編碼。
對于每個編碼過程,都(利用一階熵)估計了(delta-)幅值和頻率編碼所需的比特率RPars。而且,由于算法1和2要求將有關(guān)解樹結(jié)構(gòu)的信息發(fā)送到解碼器,所以對表示附加信息所需的比特率RS.I也進(jìn)行了估算。后面的表1示出了對于各種編碼策略和測試信號的估算的比特率。在此范圍內(nèi),比特率的對比才是有說服力的,因?yàn)樗械脑囼?yàn)都使用了相似的量化器,因此,測試信號在相同的失真級上進(jìn)行編碼。
下面表1的各列顯示了不同編碼方案和測試信號的比特率[Kbps]。這些列分別是RPars表示(delta-)幅值和頻率的比特率,RS.I附加信息(樹結(jié)構(gòu))所需的比特率,以及RTotal總比特率。增益是不同的FD編碼方法與直接編碼(非差分)相比的相對提高。
表1顯示了利用算法1來確定直接和FD編碼的組合,相對于直接編碼,它使比特率減小了18.8-27.0%。算法2使比特率減小了將近18.5-26.7%。算法2導(dǎo)致了略低的附加信息量,這是由于算法2更趨向于用較少但是更長的“分支”來產(chǎn)生解樹,因此減少了所觀測的不同解樹的數(shù)目。最后,F(xiàn)D編碼的“標(biāo)準(zhǔn)”方法能將比特率減少12.7-24.0%。
為此,提供了使用兩種算法的編碼方法,用來確定在給定幀中正弦分量的直接和FD編碼的比特率最佳組合。在對音頻信號的模擬試驗(yàn)中,所提出的算法相對于直接編碼使得比特率的減少達(dá)到了27%。此外,與典型的FD編碼方法相比,所提出的方法使得比特率的減少達(dá)到了7%。盡管本發(fā)明的考慮集中在了單獨(dú)的FD編碼技術(shù)上,但在進(jìn)一步的實(shí)施例中,概括描述了FD編碼與TD編碼相組合的方式。利用這種組合的TD/FD的編碼方案,有可能提供將這兩種編碼技術(shù)的優(yōu)勢組合起來的實(shí)施例。
應(yīng)該注意到,上述的實(shí)施例是用于說明本發(fā)明而不是限制本發(fā)明,熟練的技術(shù)人員在不脫離附加的權(quán)利要求的范圍情況下,將能夠設(shè)計出多種替換的實(shí)施例。在權(quán)利要求中,任何置于括號中的參考符號都不應(yīng)被解釋為對權(quán)利要求的限制?!鞍ā币辉~并不排除在權(quán)利要求中除了所列的之外還存在其它的元件或步驟。本發(fā)明可以由包括若干不同元件的硬件裝置來實(shí)施,也可以由適當(dāng)編程的計算機(jī)來實(shí)施。在列舉了若干裝置的設(shè)備權(quán)利要求中,這些裝置中的若干可以由同一硬件來實(shí)現(xiàn)。在相互不同的從屬權(quán)利要求中所記載的某些措施,并不表明不能用這些措施的組合來獲得更多的益處。
權(quán)利要求
1.一種編碼音頻信號的方法,其特征在于對編碼幀中的給定正弦分量的參數(shù)進(jìn)行編碼的步驟,所述編碼或者相對于同一幀中其它分量差分地進(jìn)行或者直接進(jìn)行,即不使用差分編碼。
2.根據(jù)權(quán)利要求1所述的方法,包括一個根據(jù)算法確定參數(shù)是被差分編碼還是直接編碼的步驟。
3.根據(jù)權(quán)利要求2所述的方法,其中該算法對參數(shù)是差分編碼還是直接編碼作出最佳的確定。
4.根據(jù)權(quán)利要求2或權(quán)利要求3所述的方法,其中該算法包括步驟a.構(gòu)造一個直接和差分量化分量的所有可能組合的集合的有向圖D,并且據(jù)此,構(gòu)造圖G;b.確定具有最小總權(quán)重的G中的賦值;以及c.從G的賦值中獲得直接和差分編碼的最佳組合。
5.根據(jù)權(quán)利要求2所述的方法,其中該算法對參數(shù)是差分編碼還是直接編碼作出近似的確定。
6.根據(jù)權(quán)利要求2或權(quán)利要求5所述的方法,其中該算法是一個迭代的貪心算法。
7.根據(jù)權(quán)利要求6所述的方法,其中該算法包括步驟a.構(gòu)造一個直接和差分量化分量所有可能組合的集合的有向圖D;b.每次一個地以增長指數(shù)處理有向圖D的頂點(diǎn)s1,...,sK;c.在迭代K,頂點(diǎn)sK的其中一個入邊從候選邊集合中選擇,該候選邊集合包括sK的入邊,其源自于沒有先前選擇的出邊的頂點(diǎn),以及直接編碼的邊s0sK;以及d.從該集合中選擇具有最小權(quán)重的邊。
8.根據(jù)任何前述的權(quán)利要求的方法,包括一個在具有2K-1個邊的集合的圖G中尋找具有最小總權(quán)重的最佳組合的步驟,以使每個頂點(diǎn)正好被分配一個邊。
9.根據(jù)權(quán)利要求8所述的方法,其中具有最小權(quán)重的邊的集合是由一個包括用于解決賦值問題的Hungarian方法的過程找到的。
10.根據(jù)權(quán)利要求8所述的方法,其中具有最小權(quán)重的邊的集合是由一個包括用于解決賦值問題的最短增加路徑算法的過程找到的。
11.根據(jù)任何前述權(quán)利要求的方法,進(jìn)一步包括產(chǎn)生用于指定一幀中的分量是被差分編碼還是直接編碼的附加信息的步驟。
12.一種編碼音頻信號編碼的設(shè)備,該設(shè)備包括用于對給定的正弦分量的參數(shù)進(jìn)行編碼的裝置,其特征在于在編碼幀中的參數(shù)或者相對于相同幀中的其它分量而被差分編碼或者被直接編碼,即不使用差分編碼。
13.根據(jù)權(quán)利要求12所述的編碼設(shè)備,其按照任何前述權(quán)利要求的方法操作。
14.一種對已編碼音頻信號進(jìn)行解碼的方法,該已編碼的音頻信號包括給定的正弦分量的參數(shù),其特征在于該編碼幀中的參數(shù)或者相對于相同幀中的其它分量而被差分編碼或者被直接編碼,即不使用差分編碼。
15.根據(jù)權(quán)利要求12所述的對已編碼音頻信號進(jìn)行解碼的方法,其中該信號是根據(jù)權(quán)利要求1至11的任意一個的方法進(jìn)行編碼的。
16.根據(jù)權(quán)利要求15所述的方法,其中已編碼信號中的附加信息被解釋用于確定一幀中的分量是被差分解碼還是直接解碼。
17.一種對已編碼音頻信號進(jìn)行解碼的設(shè)備,其中已編碼的音頻信號包括給定的正弦分量的參數(shù),該參數(shù)在編碼幀中已經(jīng)或者相對于相同幀中的其它分量而被差分編碼或者被直接編碼,即未使用差分編碼。
18.根據(jù)權(quán)利要求17所述的設(shè)備,其按照權(quán)利要求14至16的任意一個所述的方法進(jìn)行操作。
19.一種已編碼的音頻信號,包括給定的正弦分量的參數(shù),該參數(shù)在編碼幀中已經(jīng)或者相對于相同幀中其它分量而被差分編碼或者被直接編碼,即不使用差分編碼。
20.根據(jù)權(quán)利要求19所述的已編碼的音頻信號,它包括用于指定一幀中的分量是差分編碼還是直接編碼的附加信息。
21.一種存儲介質(zhì),權(quán)利要求19或權(quán)利要求20所要求的已編碼音頻信號被存儲在其上。
22.一種用于傳輸或記錄已編碼音頻信號的裝置,該裝置包括;a.一個輸入單元,用于獲得音頻信號,b.一個根據(jù)權(quán)利要求12或權(quán)利要求13所述的裝置,用于對音頻信號編碼以獲得被編碼的音頻信號,以及c.一個輸出單元,用于傳輸或記錄已編碼的音頻信號。
23.一種用于接收和/或再生已編碼音頻信號的裝置,該裝置包括a.一個輸入單元,用于接收已編碼的音頻信號,b.一個根據(jù)權(quán)利要求17或權(quán)利要求18所述的裝置,用于對已編碼的音頻信號進(jìn)行解碼以獲得被解碼的音頻信號,以及c.一個輸出單元,用于輸出已解碼的音頻信號。
全文摘要
本發(fā)明公開了編碼和解碼音頻信號的方法以及實(shí)施該方法的裝置。該編碼方法的特征在于步驟對編碼幀中給定的正弦分量參數(shù)或者相對于相同幀中的其它分量進(jìn)行差分編碼的或者直接編碼,即不使用差分編碼。該編碼是差分地進(jìn)行還是直接進(jìn)行取決于算法。第一類算法利用從圖形理論導(dǎo)出的方法能產(chǎn)生一個最佳的結(jié)果。另一個可選擇的算法具有較低的計算強(qiáng)度,能利用一種迭代的貪心搜索算法提供一個近似的結(jié)果。
文檔編號G10L19/00GK1571992SQ02820707
公開日2005年1月26日 申請日期2002年9月27日 優(yōu)先權(quán)日2001年10月19日
發(fā)明者J·詹森, R·休斯登斯 申請人:皇家飛利浦電子股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1