專利名稱:解碼音頻信號(hào)的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于對(duì)音頻信號(hào)進(jìn)行處理的裝置及方法。盡管本發(fā)明適用于廣泛的應(yīng)用,但其尤其適用于對(duì)經(jīng)由數(shù)字介質(zhì)、廣播信號(hào)等接收的音頻信號(hào)進(jìn)行處理。
背景技術(shù):
通常,在用于將包括多個(gè)對(duì)象的音頻信號(hào)下混合為單聲道或立體聲信號(hào)的處理中,從該對(duì)象中提取參數(shù)。在對(duì)下混合信號(hào)進(jìn)行解碼中使用這些參數(shù)。并且,用戶做出的選擇以及該參數(shù)可以控制每個(gè)對(duì)象的定位(panning)和增益。
發(fā)明內(nèi)容
技術(shù)問(wèn)題首先,用戶所做的選擇可以控制在下混合信號(hào)中包括的對(duì)象的定位和增益。然而, 在對(duì)象的定位和增益,具體而言對(duì)象的增益受到用戶控制的情況中,由于沒(méi)有用于增益控制的準(zhǔn)則或者未對(duì)增益控制做出限制,因此聲音質(zhì)量可能根據(jù)增益控制而失真。其次,在用戶調(diào)整對(duì)象的定位和增益的情況中,必須在用戶接口上檢查用于定位和增益控制的準(zhǔn)則或者對(duì)于定位和增益控制所做的限制。技術(shù)方案因此,本發(fā)明涉及一種用于處理音頻信號(hào)的裝置及其方法,其基本避免了由于相關(guān)技術(shù)的限制和缺點(diǎn)所帶來(lái)的一個(gè)或多個(gè)問(wèn)題。本發(fā)明的一個(gè)目的是提供一種用于處理音頻信號(hào)的裝置及其方法,通過(guò)該裝置和方法,可以基于用戶所做的選擇來(lái)控制對(duì)象的定位和增益。本發(fā)明的另一目的是提供一種對(duì)音頻信號(hào)進(jìn)行處理的裝置及其方法,通過(guò)該裝置和方法,可以在預(yù)定限制范圍內(nèi)基于用戶所做的選擇,控制對(duì)象的定位和增益。本發(fā)明的進(jìn)一步目的是提供一種用于處理音頻信號(hào)的裝置及其方法,通過(guò)該裝置和方法,如果可以基于用戶所做的選擇來(lái)控制對(duì)象的定位和增益,則可以在用戶界面上檢查用于定位和增益控制的準(zhǔn)則和/或?qū)τ诙ㄎ缓驮鲆婵刂扑龅南拗?。有益效果相?yīng)地,本發(fā)明提供以下效果和/或優(yōu)點(diǎn)。首先,本發(fā)明可以基于用戶所做的選擇來(lái)控制對(duì)象的增益和定位。其次,在對(duì)象的增益和定位受控的情況下,本發(fā)明可以用對(duì)定位和/或增益調(diào)整提供限制范圍的方式,防止根據(jù)定位和/或增益調(diào)整的聲音質(zhì)量的失真。第三,在對(duì)象的增益和定位受控的情況下,本發(fā)明可以用在用戶界面上顯示可以檢查用于定位和增益控制的準(zhǔn)則和/或?qū)Χㄎ缓驮鲆婵刂扑龅南拗频姆绞?,防止根?jù)定位和/或增益調(diào)整的聲音質(zhì)量的失真。第四,在對(duì)象的增益和定位受控的情況下,本發(fā)明用在用戶界面上顯示調(diào)整結(jié)果的方式,使得用戶可以檢查是否實(shí)際執(zhí)行了用戶特定對(duì)象(user-specific object)的定位和增益調(diào)整。
附圖被包括進(jìn)來(lái)以提供對(duì)本發(fā)明的進(jìn)一步理解,并且附圖被并入和組成本說(shuō)明書的一部分,附示說(shuō)明了本發(fā)明的實(shí)施例,并與描述一起解釋本發(fā)明的原理。在附圖中圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻信號(hào)處理裝置的示圖;圖2是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置的框圖;圖3是根據(jù)本發(fā)明實(shí)施例,包括在音頻信號(hào)處理裝置中的提取單元的配置的詳細(xì)框圖;圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例,包括圖形用戶界面的音頻信號(hào)處理裝置的配置的框圖;圖5是根據(jù)本發(fā)明一個(gè)實(shí)施例,使用圖形用戶界面來(lái)顯示電平指導(dǎo)信息(level guide information)的方法的示圖;圖6是根據(jù)本發(fā)明另一實(shí)施例,使用圖形用戶界面來(lái)顯示電平指導(dǎo)信息的方法的示圖;圖7是指示電平指導(dǎo)信息是否存在于比特流中以及指示電平指導(dǎo)信息在比特流中的位置的示圖;圖8是根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻信號(hào)處理方法的流程圖;圖9是根據(jù)本發(fā)明一個(gè)實(shí)施例,包括圖形用戶界面的音頻信號(hào)處理裝置的配置的框圖,該圖形用戶界面被配置為顯示對(duì)應(yīng)于電平指導(dǎo)信息的表示(!^presentation);圖10是根據(jù)本發(fā)明又一實(shí)施例,包括圖形用戶界面的音頻信號(hào)處理裝置的配置的框圖;圖11示出根據(jù)本發(fā)明一個(gè)實(shí)施例,顯示與修改后的混合信息相對(duì)應(yīng)的表示的方法;圖12是根據(jù)本發(fā)明另一實(shí)施例,顯示與修改后的混合信息相對(duì)應(yīng)的表示的方法的示圖;圖13是根據(jù)本發(fā)明再一實(shí)施例,包括圖形用戶界面的音頻信號(hào)處理裝置的配置的框圖;圖14是根據(jù)本發(fā)明又一實(shí)施例,包括圖形用戶界面的音頻信號(hào)處理裝置的配置的框圖;圖15是產(chǎn)品的示意框圖,其中實(shí)現(xiàn)了根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻信號(hào)處理裝置;以及圖16A和圖16B是根據(jù)本發(fā)明一個(gè)實(shí)施例,與音頻信號(hào)處理裝置一起提供的產(chǎn)品的關(guān)系的示圖。
具體實(shí)施例方式本發(fā)明的其他特征和優(yōu)點(diǎn)將在以下說(shuō)明中闡述,并且部分地將因該說(shuō)明而變得明顯,或可通過(guò)本發(fā)明的實(shí)踐而知悉。通過(guò)在所撰寫的說(shuō)明書及其權(quán)利要求以及附圖中具體指出的結(jié)構(gòu),將實(shí)現(xiàn)并獲得本發(fā)明的目的和其它優(yōu)點(diǎn)。為了實(shí)現(xiàn)這些和其他益處并根據(jù)本發(fā)明的目的,如所體現(xiàn)的和寬泛描述的,一種用于處理音頻信號(hào)的方法,包括以下步驟接收包括多個(gè)對(duì)象的下混合信號(hào)以及包括對(duì)象信息和下混合增益信息的比特流;獲取用于指示在比特流中是否存在電平指導(dǎo)信息的用于所有幀的電平指導(dǎo)標(biāo)記信息;基于電平指導(dǎo)標(biāo)記信息,從比特流獲取電平指導(dǎo)信息,電平指導(dǎo)信息表示應(yīng)用于多個(gè)對(duì)象中至少一個(gè)對(duì)象的對(duì)象電平的限制;接收混合信息;基于電平指導(dǎo)信息和下混合增益信息,通過(guò)修改混合信息來(lái)產(chǎn)生修改后的混合信息;并且基于修改后的混合信息和對(duì)象信息,產(chǎn)生下混合處理信息和多聲道信息中的至少一個(gè),其中使用用于多個(gè)對(duì)象中至少一個(gè)對(duì)象的對(duì)象電平,估計(jì)混合信息,并且當(dāng)產(chǎn)生下混合信號(hào)時(shí),確定對(duì)象信息和下混合增益信息。優(yōu)選地,從比特流的頭部獲取用于所有幀的電平指導(dǎo)標(biāo)記信息。優(yōu)選地,該方法進(jìn)一步包括獲取用于指示在比特流的幀數(shù)據(jù)中是否存在電平指導(dǎo)信息的用于每個(gè)幀的電平指導(dǎo)標(biāo)記信息,其中電平指導(dǎo)信息被從比特流的幀數(shù)據(jù)中獲取,并且被應(yīng)用于與幀數(shù)據(jù)相對(duì)應(yīng)的當(dāng)前幀。優(yōu)選地,電平指導(dǎo)信息對(duì)應(yīng)于固定比特長(zhǎng)度,并且該方法進(jìn)一步包括使用量化表,將用于所有幀的電平指導(dǎo)信息去量化(de-quantize)為電平指導(dǎo)參數(shù),基于電平指導(dǎo)參數(shù)和下混合增益信息,通過(guò)修改混合信息來(lái)產(chǎn)生修改后的混合信息。優(yōu)選地,該對(duì)象信息包括對(duì)象電平信息和對(duì)象相關(guān)性信息中的至少一個(gè),在不改變聲道數(shù)量的情況下,下混合處理信息將處理下混合信號(hào),多聲道信息包括聲道電平差異、 聲道間相關(guān)性和聲道預(yù)測(cè)系數(shù)中的至少一個(gè),使用用于至少一個(gè)對(duì)象的全部或一部分的進(jìn)一步對(duì)象定位,來(lái)估計(jì)混合信息,并且當(dāng)產(chǎn)生下混合信號(hào)時(shí),下混合增益信息是應(yīng)用于至少一個(gè)對(duì)象的增益值。優(yōu)選地,該方法進(jìn)一步包括使用下混合信號(hào)和下混合處理信息,產(chǎn)生處理后的下混合信號(hào),并且基于處理后的下混合信號(hào)和多聲道信息,產(chǎn)生多聲道信號(hào)。優(yōu)選地,電平指導(dǎo)信息包括應(yīng)用于多個(gè)對(duì)象的全部的公共限制。優(yōu)選地,電平指導(dǎo)信息包括應(yīng)用于多個(gè)對(duì)象中的每一個(gè)的個(gè)別限制。為了進(jìn)一步實(shí)現(xiàn)這些和其他益處并根據(jù)本發(fā)明的目的,一種用于處理音頻信號(hào)的裝置,包括接收單元,接收包括多個(gè)對(duì)象的下混合信號(hào)以及包括對(duì)象信息和下混合增益信息的比特流;提取單元,獲取用于指示在比特流中是否存在電平指導(dǎo)信息的用于所有幀的電平指導(dǎo)標(biāo)記信息,并且基于電平指導(dǎo)標(biāo)記信息,從比特流獲取電平指導(dǎo)信息,該電平指導(dǎo)信息表示應(yīng)用于多個(gè)對(duì)象中至少一個(gè)對(duì)象的對(duì)象電平的限制;呈現(xiàn)控制單元,接收混合信息,并且基于電平指導(dǎo)信息和下混合增益信息,通過(guò)修改混合信息來(lái)產(chǎn)生修改后的混合信息;以及信息產(chǎn)生單元,基于修改后的混合信息和對(duì)象信息,產(chǎn)生下混合處理信息和多聲道信息中的至少一個(gè),其中使用用于多個(gè)對(duì)象中至少一個(gè)對(duì)象的對(duì)象電平,來(lái)估計(jì)混合信息, 并且當(dāng)產(chǎn)生下混合信號(hào)時(shí),確定對(duì)象信息和下混合增益信息。優(yōu)選地,從比特流的頭部獲取用于所有幀的電平指導(dǎo)標(biāo)記信息。優(yōu)選地,提取單元進(jìn)一步包括獲取用于指示在比特流的幀數(shù)據(jù)中是否存在電平指導(dǎo)信息的用于每個(gè)幀的電平指導(dǎo)標(biāo)記信息;其中電平指導(dǎo)信息被從比特流的幀數(shù)據(jù)中獲取,并且被應(yīng)用于與幀數(shù)據(jù)相對(duì)應(yīng)的當(dāng)前幀。
優(yōu)選地,電平指導(dǎo)信息對(duì)應(yīng)于固定比特長(zhǎng)度,并且其中提取單元通過(guò)使用量化表, 將用于所有幀的電平指導(dǎo)信息去量化為電平指導(dǎo)參數(shù),其中基于電平指導(dǎo)參數(shù)和下混合增益信息,通過(guò)修改混合信息來(lái)產(chǎn)生修改后的混合信息。優(yōu)選地,該對(duì)象信息包括對(duì)象電平信息和對(duì)象相關(guān)性信息中的至少一個(gè),在不改變聲道數(shù)量的情況下,下混合處理信息將處理下混合信號(hào),多聲道信息包括聲道電平差異、 聲道間相關(guān)性和聲道預(yù)測(cè)系數(shù)中的至少一個(gè),使用用于至少一個(gè)對(duì)象的全部或一部分的進(jìn)一步對(duì)象定位,來(lái)估計(jì)混合信息,并且當(dāng)產(chǎn)生下混合信號(hào)時(shí),下混合增益信息是應(yīng)用于至少一個(gè)對(duì)象的增益值。優(yōu)選地,該裝置進(jìn)一步包括下混合處理單元,通過(guò)使用下混合信號(hào)和下混合處理信息,產(chǎn)生處理后的下混合信號(hào);以及多聲道解碼器,基于處理后的下混合信號(hào)和多聲道信息,產(chǎn)生多聲道信號(hào)。優(yōu)選地,電平指導(dǎo)信息包括應(yīng)用于多個(gè)對(duì)象的全部的公共限制。優(yōu)選地,電平指導(dǎo)信息包括應(yīng)用于多個(gè)對(duì)象中的每一個(gè)的個(gè)別限制。
具體實(shí)施例方式現(xiàn)在將具體參考本發(fā)明的優(yōu)選實(shí)施例,本發(fā)明的示例在附圖中予以說(shuō)明。首先,在本說(shuō)明和權(quán)利要求中使用的術(shù)語(yǔ)和詞語(yǔ)不被解釋為受限于一般的意義或者字典的意義,而是應(yīng)當(dāng)基于發(fā)明人能夠適當(dāng)定義術(shù)語(yǔ)的概念以便用最佳方式描述發(fā)明人的發(fā)明的原理,而被解釋為匹配于本發(fā)明的技術(shù)思想的意義和概念。在本公開中公開的實(shí)施例和在附圖中示出的配置僅是優(yōu)選實(shí)施例,并不代表本發(fā)明的所有技術(shù)思想。因此,應(yīng)當(dāng)理解,本發(fā)明涵蓋本發(fā)明的修改和變化,只要在提交本申請(qǐng)的時(shí)間點(diǎn),這些修改和變化處于所附權(quán)利要求以及其等效內(nèi)容的范圍之內(nèi)??梢曰谝韵聵?biāo)準(zhǔn)解釋在本發(fā)明中的以下術(shù)語(yǔ),并且可以根據(jù)以下目的來(lái)解釋未被解釋的其他術(shù)語(yǔ)。具體而言,在本公開中,本公開中的信息是一般包括值、參數(shù)、系數(shù)、元素等的術(shù)語(yǔ),并且有時(shí)可以對(duì)其意義做不同的解釋,本發(fā)明并不受限于此。圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻信號(hào)處理裝置的示圖。參照?qǐng)D1,根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻信號(hào)處理裝置100主要包括下混合單元 110和對(duì)象編碼器120。將多個(gè)對(duì)象輸入到下混合單元110來(lái)產(chǎn)生單聲道或立體聲下混合信號(hào)。另外,將多個(gè)對(duì)象輸入對(duì)象編碼器120,以產(chǎn)生指示對(duì)象的屬性的對(duì)象信息。對(duì)象信息包括指示對(duì)象的電平的對(duì)象電平信息和指示對(duì)象間相關(guān)性的對(duì)象相關(guān)性信息。在下混合信號(hào)是立體聲信號(hào)的情況下,對(duì)象信息包括指示增益間的差異的對(duì)象增益比率,該增益中的每一個(gè)指示在下混合信號(hào)的相應(yīng)聲道(channel)(例如,左聲道、右聲道等)中對(duì)象被包括的程度。而且,在產(chǎn)生下混合信號(hào)的情況下,對(duì)象編碼器120可以附加地產(chǎn)生對(duì)象增益信息DMG,該對(duì)象增益信息DMG指示施加到對(duì)象的增益。另外,對(duì)象編碼器120可以進(jìn)一步產(chǎn)生電平指導(dǎo)信息,以下具體參照?qǐng)D2進(jìn)行解釋。另外,對(duì)象編碼器120可以通過(guò)將對(duì)象信息、下混合增益信息、電平指導(dǎo)信息等復(fù)用在一起,產(chǎn)生比特流。同時(shí),復(fù)用器(在附圖中未示出)可以通過(guò)將下混合單元110產(chǎn)生的下混合信號(hào)以及對(duì)象編碼器120產(chǎn)生的參數(shù)(例如,對(duì)象信息等)復(fù)用在一起,產(chǎn)生一個(gè)比特流。
圖2是根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻信號(hào)處理裝置的框圖。參照?qǐng)D2,根據(jù)本發(fā)明的音頻處理裝置200包括接收單元210、提取單元220、呈現(xiàn)(rendering)控制單元230和對(duì)象解碼器M0,還可以進(jìn)一步包括多聲道解碼器270。對(duì)象解碼器240可以包括下混合處理器單元250和信息產(chǎn)生單元沈0。接收單元210從音頻信號(hào)處理裝置100接收包括至少一個(gè)對(duì)象的下混合信號(hào)DMX, 還接收包括對(duì)象信息的比特流。在這種情況下,比特流可以進(jìn)一步包括下混合增益信息和電平指導(dǎo)信息。在附圖中,示出的是分開地接收下混合信號(hào)和比特流。這樣是為了有助于理解本發(fā)明。如在以上描述中提及的,可以通過(guò)將下混合信號(hào)包括在與其復(fù)用在一起的一個(gè)比特流中來(lái)發(fā)送下混合信號(hào)。提取單元220從接收單元210所發(fā)送的比特流中提取下混合信息和電平指導(dǎo)信息。以下參照?qǐng)D4描述提取單元220的詳情。呈現(xiàn)控制單元230從用戶接口(附圖中未示出)接收混合信息MXI,還接收提取單元220所提取的下混合增益信息和電平指導(dǎo)信息。以下參照?qǐng)D4描述呈現(xiàn)控制單元230的詳情?;旌闲畔⑹腔趯?duì)象位置信息、對(duì)象增益信息、重放配置信息等而產(chǎn)生的信息。具體而言,對(duì)象位置信息是用戶輸入的信息,用來(lái)控制每個(gè)對(duì)象的位置或定位。并且,對(duì)象增益信息是用戶輸入的信息,用來(lái)控制每個(gè)對(duì)象的增益。并且,重放配置信息是包括揚(yáng)聲器數(shù)量、揚(yáng)聲器位置、環(huán)境信息(揚(yáng)聲器的虛擬位置)等的信息。重放配置信息由用戶輸入、被提前存儲(chǔ)、或者可以被從其他設(shè)備接收。在產(chǎn)生下混合信號(hào)的情況中,下混合增益信息指示施加到對(duì)象的增益。并且,電平指導(dǎo)信息是指示用于至少一個(gè)對(duì)象的再現(xiàn)電平的限制或?qū)ο箅娖降南拗频男畔?。在這種情況下,在對(duì)象電平被過(guò)度地增大或抑制的情況中,需要對(duì)象電平的限制以防止聲音質(zhì)量失真。對(duì)象電平的限制可以包括用于避免增大超過(guò)特定值的增大限制值,以及用于避免抑制超過(guò)特定值的抑制限制值。電平指導(dǎo)信息由音頻信號(hào)處理裝置200自身產(chǎn)生,或者可以由用戶提前定義。而本發(fā)明意圖描述由編碼器產(chǎn)生電平指導(dǎo)信息的情況?;陔娖街笇?dǎo)信息和下混合增益信息,呈現(xiàn)控制單元230通過(guò)修改混合信息來(lái)產(chǎn)生修改后的混合信息。以下將參照?qǐng)D11解釋這個(gè)過(guò)程的詳情。將修改后的混合信息輸入到信息產(chǎn)生單元260。同時(shí),參考圖2,例如由用戶輸入混合信息,本發(fā)明并不受限于此。替代性地,混合信息包括通過(guò)被包括在比特流中而被輸入給接收單元210的信息,或者可以包括從外部或單獨(dú)地輸入的信息。同時(shí),信息產(chǎn)生單元260可以基于修改后的混合信息,產(chǎn)生下混合處理信息和多聲道信息中的至少一個(gè)。具體而言,在解碼模式中(例如,輸出模式是單聲道、立體聲或 3D (雙耳)輸出),信息產(chǎn)生單元260產(chǎn)生下混合處理信息。在轉(zhuǎn)碼模式的情況中(例如, 輸出模式是多聲道模式),信息產(chǎn)生單元260可以進(jìn)一步產(chǎn)生多聲道信息。在這種情況下,下混合處理信息(DPI)是用于處理下混合的信息。在解碼模式的情況中,下混合處理信息(DPI)是用于通過(guò)調(diào)整對(duì)象的電平和/或定位,來(lái)產(chǎn)生最終輸出 (例如,時(shí)域中的PCM信號(hào))的信息。在轉(zhuǎn)碼模式的情況中,下混合處理信息(DPI)可以是用于在不改變聲道數(shù)量的情況下,對(duì)立體聲下混合信號(hào)調(diào)整對(duì)象定位的信息。在轉(zhuǎn)碼模式和單聲道下混合信號(hào)的情況中,不產(chǎn)生下混合處理信息(DPI),并且下混合信號(hào)DMX可以繞過(guò)下混合處理單元250。同時(shí),多聲道信息是用于對(duì)下混合信號(hào)或者處理后的下混合信號(hào)進(jìn)行上混合的信息。而且,多聲道信息可以包括聲道電平信息、聲道相關(guān)性信息和聲道預(yù)測(cè)系數(shù)。在由信息產(chǎn)生單元260產(chǎn)生下混合處理信息(DPI)的情況中,下混合處理單元250 可以使用下混合信號(hào)和下混合處理信息(DPI)來(lái)產(chǎn)生處理后的下混合信號(hào)。在前述解碼模式的情況中,處理后的下混合信號(hào)可以包括時(shí)域的PCM信號(hào)。在這種情況下,將處理后的下混合信號(hào)作為最終輸出信號(hào)傳送給諸如揚(yáng)聲器的輸出設(shè)備,而不是傳送給多聲道解碼器 270。將多聲道信息輸出到多聲道解碼器270。隨后,通過(guò)使用處理后的下混合信號(hào)(在轉(zhuǎn)碼模式和立體聲下混合的情況中)或者下混合信號(hào)DMX(在轉(zhuǎn)碼模式和單聲道下混合的情況中)以及多聲道信息(MI)來(lái)執(zhí)行上混合,多聲道解碼器270可以最終產(chǎn)生多聲道信號(hào)。圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例,包括在音頻信號(hào)處理裝置中的提取單元的配置的詳細(xì)框圖。參照?qǐng)D3,根據(jù)本發(fā)明實(shí)施例包括在音頻信號(hào)處理裝置中的提取單元200表示參照?qǐng)D2描述的提取單元220的具體配置。而且,提取單元200包括下混合增益信息提取單元222、對(duì)象信息提取單元224、電平指導(dǎo)標(biāo)記獲取單元226、電平指導(dǎo)信息獲取單元2 和呈現(xiàn)控制單元230。下混合增益信息提取單元222提取從參照?qǐng)D2描述的接收單元210接收到的比特流中所包括的下混合增益信息。在這種情況下,如在以上描述中提及的,下混合增益信息是用于指示施加到包括在下混合信號(hào)中的每個(gè)對(duì)象的增益的信息。對(duì)象信息提取單元2M從接收到的比特流中提取對(duì)象信息。在這種情況下,如在以上描述中提及的,對(duì)象信息可以包括對(duì)象電平信息、對(duì)象相關(guān)性信息等。電平指導(dǎo)標(biāo)記獲取單元2 從接收到的比特流中獲取電平指導(dǎo)標(biāo)記。具體而言, 電平指導(dǎo)標(biāo)記可以包括用于全部幀的電平指導(dǎo)標(biāo)記和用于每個(gè)幀的電平指導(dǎo)標(biāo)記。用于全部幀的電平指導(dǎo)標(biāo)記指示在比特流中是否包括電平指導(dǎo)信息??梢栽诒忍亓鞯念^部中包括該標(biāo)記。同時(shí),用于每個(gè)幀的電平指導(dǎo)標(biāo)記信息指示在比特流的幀數(shù)據(jù)中是否存在電平指導(dǎo)信息。而且,也可以在比特流的頭部中包括該標(biāo)記。根據(jù)電平指導(dǎo)標(biāo)記獲取單元2 所獲取的標(biāo)記,將比特流引入到電平指導(dǎo)信息獲取單元228。如果標(biāo)記指示在接收到的比特流中包括電平指導(dǎo)信息(例如,如果標(biāo)記的值被設(shè)置為1),則將比特流引入到電平指導(dǎo)信息獲取單元228。相反,如果標(biāo)記指示在接收到的比特流中不包括電平指導(dǎo)信息(例如,如果標(biāo)記的值被設(shè)置為0),則接收到的比特流繞過(guò)電平指導(dǎo)信息獲取單元228。在電平指導(dǎo)標(biāo)記指示在比特流中包括電平指導(dǎo)信息的情況中,電平指導(dǎo)信息獲取單元2 從比特流中獲取電平指導(dǎo)信息。在這種情況下,電平指導(dǎo)信息可以對(duì)應(yīng)于全部幀或僅對(duì)應(yīng)于特定幀,以下將參照?qǐng)D7對(duì)其詳情進(jìn)行解釋。呈現(xiàn)控制單元230從下混合增益信息獲取單元220獲取下混合增益信息,從用戶接口(附圖中未示出)獲取混合信息,并且從電平指導(dǎo)信息獲取單元2 獲取電平指導(dǎo)信息。基于電平指導(dǎo)信息,呈現(xiàn)控制單元230通過(guò)修改混合信息來(lái)產(chǎn)生修改后的混合信息。然后將修改后的混合信息傳送給參照?qǐng)D2描述的信息產(chǎn)生單元沈0。電平指導(dǎo)信息是指示用于至少一個(gè)對(duì)象的再現(xiàn)電平的限制的信息,并且可以例如包括用于對(duì)象的增益調(diào)整的范圍。在這種情況下,可以將該范圍設(shè)置為限制值,諸如上限、 下限等,本發(fā)明并不受限于此。限制值可以對(duì)應(yīng)于用于特定對(duì)象的絕對(duì)增益值。例如,在包括2個(gè)對(duì)象(對(duì)象A、 對(duì)象B)的對(duì)象信號(hào)中,將對(duì)象A(例如,語(yǔ)音對(duì)象)的增益調(diào)整范圍設(shè)置在6dB內(nèi),并且可以將對(duì)象B(例如,吉他對(duì)象)的增益調(diào)整值設(shè)置在12dB內(nèi)。以下將參照?qǐng)D8來(lái)對(duì)此做進(jìn)一步的詳細(xì)解釋。圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例,包括圖形用戶界面的音頻信號(hào)處理裝置的配置的框圖。參考圖4,除了先前參照?qǐng)D2描述的音頻信號(hào)處理裝置200以外,根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻信號(hào)處理裝置400可以進(jìn)一步包括圖形用戶界面480。圖4中的接收單元410、提取單元420、呈現(xiàn)控制單元430、對(duì)象解碼器440、下混合處理單元450、信息產(chǎn)生單元460和多聲道解碼器470分別與圖2所示的相同名稱組件的配置與功能相同,為了清楚起見,在以下描述中省略其詳情。圖形用戶界面480接收用于對(duì)至少一個(gè)對(duì)象的電平進(jìn)行調(diào)整的用戶輸入。然后將根據(jù)用戶輸入而估計(jì)的混合信息輸入到呈現(xiàn)控制單元430。如前所述,呈現(xiàn)控制單元430可以用基于電平指導(dǎo)信息來(lái)修改混合信息的方式, 產(chǎn)生修改后的混合信息。而且,圖形用戶界面480可以顯示對(duì)應(yīng)于修改后的混合信息的表
7J\ ο以下將參照?qǐng)D11具體描述經(jīng)由圖形用戶界面480的用戶輸入和修改后的混合信息顯示方法。圖5是根據(jù)本發(fā)明一個(gè)實(shí)施例,使用圖形用戶界面來(lái)顯示電平指導(dǎo)信息的方法的示圖。參照?qǐng)D5,圖形用戶界面顯示對(duì)應(yīng)于電平指導(dǎo)信息的表示,電平指導(dǎo)信息指示用于包括在下混合信號(hào)中的多個(gè)對(duì)象中的至少一個(gè)對(duì)象的呈現(xiàn)限制(rendering limitation)。 在這種情況下,該表示可以包括表示呈現(xiàn)限制的非推薦呈現(xiàn)區(qū)域和表示除呈現(xiàn)限制以外的呈現(xiàn)范圍的推薦呈現(xiàn)區(qū)域。另外,圖形用戶界面另外地顯示了用于接收用戶輸入的電平調(diào)節(jié)器(level fader),該用戶輸入用于控制多個(gè)對(duì)象中的至少一個(gè)的電平。在這種情況下,對(duì)應(yīng)于電平指導(dǎo)信息的表示可以與電平調(diào)節(jié)器相關(guān)聯(lián)地顯示。電平調(diào)節(jié)器沿著直線或曲線操作??梢栽谥本€或曲線上顯示非推薦呈現(xiàn)區(qū)域和推薦呈現(xiàn)區(qū)域中的每一個(gè)。而且,電平調(diào)節(jié)器可在推薦呈現(xiàn)區(qū)域內(nèi)操作。圖5示出電平調(diào)節(jié)器沿著直線操作,本發(fā)明不受限于此。推薦呈現(xiàn)區(qū)域的形狀(或形式)不同于非推薦呈現(xiàn)區(qū)域的形狀(或形式)。也就是說(shuō),形狀可以例如包括顏色、亮度、 紋理和圖案中的至少一種。參照?qǐng)D5,例如如果描述了低音對(duì)象,則推薦呈現(xiàn)區(qū)域510被表示為綠線,而非推薦呈現(xiàn)區(qū)域520可以被表示為紅線。本發(fā)明參照顏色區(qū)分了推薦呈現(xiàn)區(qū)域和非推薦呈現(xiàn)區(qū)域的形狀,本發(fā)明并不受限 于此。如前所述,本發(fā)明可以包括參照亮度、紋理、圖案等來(lái)實(shí)現(xiàn)視覺區(qū)分的所有情況。在調(diào)整對(duì)象的増益和定位,尤其是對(duì)象的増益的情況中,用戶可以基于對(duì)應(yīng)于電 平指導(dǎo)信息的表示,來(lái)查看用于增益調(diào)整的限制范圍。因此,可以防止聲音質(zhì)量根據(jù)定位調(diào) 整和/或増益調(diào)整而失真。圖6是根據(jù)本發(fā)明另一個(gè)實(shí)施例,使用圖形用戶界面來(lái)顯示電平指導(dǎo)信息的方法 的示圖。圖5所示的顯示方法僅提供了用于增益調(diào)整的限制范圍,但是沒(méi)有對(duì)未偏離范圍 的增益調(diào)整做出限制。因此,聲音質(zhì)量可能根據(jù)用戶做出的増益調(diào)整而失真。參照?qǐng)D6,為了防止以上問(wèn)題,顯示了電平調(diào)節(jié)器的上限和下限。并且,基于電平指 導(dǎo)信息,使得用戶不偏離用于增益調(diào)整的限制范圍。因此,可以防止聲音質(zhì)量根據(jù)用戶做出 的増益調(diào)整而失真??梢詫⒂脩糨斎胨烙?jì)的上述混合信息作為公式1所示的呈現(xiàn)矩陣而輸入。在公 式1所示的呈現(xiàn)矩陣中,每行指示輸入信號(hào)的每個(gè)聲道,每列指示在輸入信號(hào)中包括的每 個(gè)對(duì)象。因此,可以根據(jù)該矩陣確定從每個(gè)聲道輸出的每個(gè)對(duì)象的大小。具體而言,可以通過(guò)公式2估計(jì)在呈現(xiàn)矩陣中的N個(gè)對(duì)象中的第i個(gè)對(duì)象的輸出。數(shù)學(xué)式權(quán)利要求
1.一種用于處理音頻信號(hào)的方法,包括接收包括多個(gè)對(duì)象的下混合信號(hào)以及包括對(duì)象信息和下混合增益信息的比特流; 獲取用于指示在所述比特流中是否存在電平指導(dǎo)信息的用于所有幀的電平指導(dǎo)標(biāo)記 fn息;基于所述電平指導(dǎo)標(biāo)記信息,從所述比特流獲取所述電平指導(dǎo)信息,所述電平指導(dǎo)信息表示應(yīng)用于所述多個(gè)對(duì)象中至少一個(gè)對(duì)象的對(duì)象電平的限制; 接收混合信息;基于所述電平指導(dǎo)信息和所述下混合增益信息,通過(guò)修改所述混合信息來(lái)產(chǎn)生修改后的混合信息;以及基于修改后的混合信息和所述對(duì)象信息,產(chǎn)生下混合處理信息和多聲道信息中的至少一個(gè),其中使用用于所述多個(gè)對(duì)象中至少一個(gè)對(duì)象的對(duì)象電平估計(jì)所述混合信息, 并且其中當(dāng)產(chǎn)生所述下混合信號(hào)時(shí),確定所述對(duì)象信息和所述下混合增益信息。
2.如權(quán)利要求1所述的方法,其中從所述比特流的頭部獲取用于所有幀的電平指導(dǎo)標(biāo)記信息ο
3.如權(quán)利要求1所述的方法,進(jìn)一步包括獲取用于指示在所述比特流的幀數(shù)據(jù)中是否存在電平指導(dǎo)信息的用于每個(gè)幀的電平指導(dǎo)標(biāo)記信息;其中從所述比特流的幀數(shù)據(jù)獲取所述電平指導(dǎo)信息,并且將所述電平指導(dǎo)信息應(yīng)用于與所述幀數(shù)據(jù)相對(duì)應(yīng)的當(dāng)前幀。
4.如權(quán)利要求1所述的方法,其中所述電平指導(dǎo)信息對(duì)應(yīng)于固定比特長(zhǎng)度,并且所述方法進(jìn)一步包括使用量化表,將用于所有幀的電平指導(dǎo)信息去量化為電平指導(dǎo)參數(shù), 基于所述電平指導(dǎo)參數(shù)和所述下混合增益信息,通過(guò)修改所述混合信息來(lái)產(chǎn)生修改后的混合信息。
5.如權(quán)利要求1所述的方法,其中所述對(duì)象信息包括對(duì)象電平信息和對(duì)象相關(guān)性信息中的至少一個(gè), 在不改變聲道數(shù)量的情況下,所述下混合處理信息將處理所述下混合信號(hào), 所述多聲道信息包括聲道電平差異、聲道間相關(guān)性和聲道預(yù)測(cè)系數(shù)中的至少一個(gè), 使用用于所述至少一個(gè)對(duì)象的全部或一部分的進(jìn)一步對(duì)象定位,估計(jì)所述混合信息,以及當(dāng)產(chǎn)生所述下混合信號(hào)時(shí),所述下混合增益信息是應(yīng)用于至少一個(gè)對(duì)象的增益值。
6.如權(quán)利要求1所述的方法,進(jìn)一步包括使用所述下混合信號(hào)和所述下混合處理信息產(chǎn)生處理后的下混合信號(hào);以及, 基于所述處理后的下混合信號(hào)和所述多聲道信息產(chǎn)生多聲道信號(hào)。
7.如權(quán)利要求1所述的方法,其中所述電平指導(dǎo)信息包括應(yīng)用于所述多個(gè)對(duì)象的全部的公共限制。
8.如權(quán)利要求1所述的方法,其中所述電平指導(dǎo)信息包括應(yīng)用于所述多個(gè)對(duì)象中的每一個(gè)的個(gè)別限制。
9.一種用于處理音頻信號(hào)的裝置,包括接收單元,接收包括多個(gè)對(duì)象的下混合信號(hào)以及包括對(duì)象信息和下混合增益信息的比特流;提取單元,獲取用于指示在所述比特流中是否存在電平指導(dǎo)信息的用于所有幀的電平指導(dǎo)標(biāo)記信息,并且基于所述電平指導(dǎo)標(biāo)記信息,從所述比特流獲取電平指導(dǎo)信息,所述電平指導(dǎo)信息表示應(yīng)用于所述多個(gè)對(duì)象中至少一個(gè)對(duì)象的對(duì)象電平的限制;呈現(xiàn)控制單元,接收混合信息,并且基于所述電平指導(dǎo)信息和所述下混合增益信息,通過(guò)修改所述混合信息來(lái)產(chǎn)生修改后的混合信息;以及信息產(chǎn)生單元,基于所述修改后的混合信息和所述對(duì)象信息產(chǎn)生下混合處理信息和多聲道信息中的至少一個(gè),其中使用用于所述多個(gè)對(duì)象中至少一個(gè)對(duì)象的對(duì)象電平估計(jì)所述混合信息, 并且其中當(dāng)產(chǎn)生所述下混合信號(hào)時(shí),確定所述對(duì)象信息和所述下混合增益信息。
10.如權(quán)利要求9所述的裝置,其中從所述比特流的頭部獲取用于所有幀的電平指導(dǎo)標(biāo)記信息。
11.如權(quán)利要求9所述的裝置,其中所述提取單元進(jìn)一步獲取用于指示在所述比特流的幀數(shù)據(jù)中是否存在電平指導(dǎo)信息的用于每個(gè)幀的電平指導(dǎo)標(biāo)記信息,其中從所述比特流的幀數(shù)據(jù)獲取所述電平指導(dǎo)信息,并且將所述電平指導(dǎo)信息應(yīng)用于與所述幀數(shù)據(jù)相對(duì)應(yīng)的當(dāng)前幀。
12.如權(quán)利要求9所述的裝置,其中所述電平指導(dǎo)信息對(duì)應(yīng)于固定比特長(zhǎng)度,并且其中所述提取單元使用量化表將用于所有幀的電平指導(dǎo)信息去量化為電平指導(dǎo)參數(shù), 其中基于所述電平指導(dǎo)參數(shù)和所述下混合增益信息通過(guò)修改所述混合信息來(lái)產(chǎn)生修改后的混合信息。
13.如權(quán)利要求9所述的裝置,其中所述對(duì)象信息包括對(duì)象電平信息和對(duì)象相關(guān)性信息中的至少一個(gè), 在不改變聲道數(shù)量的情況下,所述下混合處理信息將處理所述下混合信號(hào), 所述多聲道信息包括聲道電平差異、聲道間相關(guān)性和聲道預(yù)測(cè)系數(shù)中的至少一個(gè), 使用用于所述至少一個(gè)對(duì)象的全部或一部分的進(jìn)一步對(duì)象定位估計(jì)所述混合信息,以及當(dāng)產(chǎn)生所述下混合信號(hào)時(shí),所述下混合增益信息是應(yīng)用于至少一個(gè)對(duì)象的增益值。
14.如權(quán)利要求9所述的裝置,進(jìn)一步包括下混合處理單元,通過(guò)使用所述下混合信號(hào)和所述下混合處理信息產(chǎn)生處理后的下混合信號(hào);以及,多聲道解碼器,基于所述處理后的下混合信號(hào)和所述多聲道信息產(chǎn)生多聲道信號(hào)。
15.如權(quán)利要求9所述的裝置,其中所述電平指導(dǎo)信息包括應(yīng)用于所述多個(gè)對(duì)象的全部的公共限制。
16.如權(quán)利要求9所述的裝置,其中所述電平指導(dǎo)信息包括應(yīng)用于所述多個(gè)對(duì)象中的每一個(gè)的個(gè)別限制。
全文摘要
本發(fā)明涉及用于處理音頻信號(hào)的裝置及方法。本發(fā)明包括接收包括多個(gè)對(duì)象的下混合信號(hào)以及包括對(duì)象信息和下混合增益信息的比特流;獲取用于指示在比特流中是否存在電平指導(dǎo)信息的用于所有幀的電平指導(dǎo)標(biāo)記信息;基于電平指導(dǎo)標(biāo)記信息,從比特流獲取電平指導(dǎo)信息,電平指導(dǎo)信息表示應(yīng)用于多個(gè)對(duì)象中至少一個(gè)對(duì)象的對(duì)象電平的限制;接收混合信息;基于電平指導(dǎo)信息和下混合增益信息,通過(guò)修改混合信息來(lái)產(chǎn)生修改后的混合信息;并且基于修改后的混合信息和所述對(duì)象信息,產(chǎn)生下混合處理信息和多聲道信息中的至少一個(gè),其中使用用于多個(gè)對(duì)象中至少一個(gè)對(duì)象的對(duì)象電平,估計(jì)混合信息,并且當(dāng)產(chǎn)生下混合信號(hào)時(shí),確定對(duì)象信息和下混合增益信息。因此,本發(fā)明可以用對(duì)定位和/或增益調(diào)整提供限制范圍的方式,防止根據(jù)定位和/或增益調(diào)整的聲音質(zhì)量的失真。
文檔編號(hào)G11B20/10GK102349108SQ201080011640
公開日2012年2月8日 申請(qǐng)日期2010年1月28日 優(yōu)先權(quán)日2009年1月28日
發(fā)明者吳賢午, 鄭亮源 申請(qǐng)人:Lg電子株式會(huì)社