專(zhuān)利名稱(chēng):用于混合壓縮數(shù)字位流的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本公開(kāi)總體上涉及數(shù)字壓縮,更具體地涉及用于混合壓縮數(shù)字位流的方法及裝置。
背景技術(shù):
在現(xiàn)代電視或無(wú)線電廣播站中,通常采用壓縮數(shù)字位流來(lái)承載用于發(fā)送的視頻和/或音頻數(shù)據(jù)。例如,在美國(guó)針對(duì)數(shù)字電視(DTV)廣播的先進(jìn)電視系統(tǒng)委員會(huì)(ATSC)標(biāo)準(zhǔn)采用運(yùn)動(dòng)圖像專(zhuān)家組(MPEG)標(biāo)準(zhǔn)(例如,MPEG-1、MPEG-2、MPEG-3、MPEG-4等)來(lái)承載視頻內(nèi)容,并采用數(shù)字音頻壓縮標(biāo)準(zhǔn)(例如,公知為Dolby Digital的AC-3)來(lái)承載音頻內(nèi)容(即,ATSC標(biāo)準(zhǔn)數(shù)字音頻壓縮(AC-3),A版,2001年8月)。AC-3壓縮標(biāo)準(zhǔn)基于感知型數(shù)字音頻編碼技術(shù),該技術(shù)在最小化可感知失真的同時(shí)減少再現(xiàn)原始音頻信號(hào)所需的數(shù)據(jù)量。具體來(lái)說(shuō),AC-3壓縮標(biāo)準(zhǔn)認(rèn)識(shí)到,人耳在特定譜頻率處無(wú)法覺(jué)察到小于這些譜頻率處的掩蔽能量的頻譜能量變化。掩蔽能量是音頻片段的一特性,其取決于該音頻片段的音調(diào)和類(lèi)噪聲特性??刹捎貌煌囊阎睦砺晫W(xué)模型來(lái)確定特定譜頻率處的掩蔽能量。此外,AC-3壓縮標(biāo)準(zhǔn)提供了用于數(shù)字電視(DTV)、高清晰度電視(HDTV)、數(shù)字多功能盤(pán)(DVD)、數(shù)字線纜以及衛(wèi)星傳輸?shù)氖沟媚軌驈V播特殊聲音效果(例如,環(huán)繞聲)的多聲道數(shù)字音頻格式(例如,5.1聲道格式)。
一些廣播情形要求要與主音頻服務(wù)(MAS)(其可與要廣播的主電視或無(wú)線電節(jié)目相對(duì)應(yīng))混合的輔助音頻服務(wù)(AAS),例如包含畫(huà)外音材料的音頻服務(wù)。AAS可源于實(shí)況音頻,或者可按照模擬、非壓縮數(shù)字格式或壓縮數(shù)字格式來(lái)存儲(chǔ)。將AAS與MAS混合通常包括衰減MAS并加入AAS,使得AAS可聽(tīng)得見(jiàn),同時(shí)MAS仍處于較低但可感知的水平。
在傳統(tǒng)的模擬廣播中,混合兩種音頻源(例如,AAS和MAS)是相對(duì)簡(jiǎn)單的任務(wù),涉及公知的衰減和放大電路。同樣,混合兩個(gè)非壓縮數(shù)字音頻流也是相對(duì)簡(jiǎn)單的任務(wù),這是因?yàn)榭刹捎霉木€性衰減和加法技術(shù)來(lái)混合非壓縮數(shù)字樣本。然而,當(dāng)任一個(gè)音頻源或兩個(gè)音頻源都提供壓縮數(shù)字音頻流時(shí)(如在全數(shù)字現(xiàn)代廣播設(shè)備的情況下)混合兩個(gè)音頻源要復(fù)雜得多。在一些已知的系統(tǒng)中,混合一個(gè)或更多個(gè)壓縮數(shù)字音頻流要求對(duì)要混合的所有流進(jìn)行解壓縮。然后采用非壓縮的數(shù)據(jù)流執(zhí)行混合,接著對(duì)所得的混合數(shù)據(jù)流進(jìn)行再壓縮。然而,這種要求對(duì)源數(shù)字流進(jìn)行解壓縮并對(duì)混合數(shù)據(jù)流進(jìn)行再壓縮的方法并非理想的,因?yàn)樵賶嚎s是昂貴的操作,其由于眾多的附加處理步驟而要求附加裝置、造成附加音頻延時(shí)、并且增加了潛在故障模式數(shù)。
圖1是用于圖2中的示例混合裝置的示例環(huán)境的框圖。
圖2是用在圖1中的示例環(huán)境下的用來(lái)混合壓縮數(shù)字位流的示例混合裝置的框圖。
圖3描述了要利用圖2中的示例混合裝置處理的示例單聲道壓縮數(shù)字音頻位流。
圖4是例示了實(shí)現(xiàn)圖2中的示例混合裝置的示例方式的框圖。
圖5描述了通過(guò)圖4中的示例混合裝置對(duì)圖3中的示例單聲道壓縮數(shù)字音頻位流執(zhí)行的示例操作序列。
圖6描述了可用來(lái)實(shí)現(xiàn)圖4中的示例混合裝置的示例量化查找表。
圖7描述了要由圖4中的示例混合裝置處理的示例多聲道壓縮數(shù)字音頻位流。
圖8描述了要通過(guò)圖4中的示例混合裝置對(duì)圖7中的示例壓縮數(shù)字音頻位流執(zhí)行的示例操作序列。
圖9是表示要用來(lái)實(shí)現(xiàn)圖4中的示例混合裝置的示例處理的流程圖。
圖10是表示用于圖9中的示例處理的第一示例修改處理的流程圖。
圖11是表示用于圖9中的示例處理并適于對(duì)圖3或圖7中的示例壓縮數(shù)字音頻位流進(jìn)行操作的第二示例修改處理的流程圖。
圖12描述了用在圖1中的示例環(huán)境下的另選示例混合裝置。
圖13是表示可用來(lái)實(shí)現(xiàn)圖12中的示例混合裝置的示例處理的流程圖。
圖14A至圖14B是表示對(duì)圖13中的示例處理的示例改進(jìn)的流程圖。
圖15是可用來(lái)實(shí)現(xiàn)圖2中的示例混合裝置的示例處理器系統(tǒng)的框圖。
具體實(shí)施例方式
總體上公開(kāi)了用來(lái)對(duì)壓縮數(shù)字位流進(jìn)行組合的方法及裝置。本文公開(kāi)的方法及裝置可用來(lái)在無(wú)需預(yù)先對(duì)壓縮數(shù)字位流進(jìn)行解壓縮的情況下對(duì)該壓縮數(shù)字位流進(jìn)行組合。因此,本文公開(kāi)的方法及裝置無(wú)需對(duì)壓縮數(shù)字位流進(jìn)行多輪解壓縮/壓縮,多輪解壓縮/壓縮例如對(duì)于電視廣播網(wǎng)絡(luò)分支機(jī)構(gòu)來(lái)說(shuō)通常是不可接受的,這是因?yàn)槎噍喗鈮嚎s/壓縮會(huì)嚴(yán)重劣化壓縮數(shù)字位流提供的媒體內(nèi)容的質(zhì)量。盡管這里給出的示例關(guān)注對(duì)各自承載音頻內(nèi)容的兩個(gè)數(shù)字位流的混合,但是所公開(kāi)的方法和裝置可更一般地應(yīng)用于按照任意適當(dāng)方式組合按照任意適當(dāng)格式承載任意類(lèi)型內(nèi)容的任意數(shù)量的數(shù)字?jǐn)?shù)據(jù)流。
例如,在廣播之前,本文公開(kāi)的方法和裝置可用來(lái)對(duì)與根據(jù)數(shù)字音頻壓縮標(biāo)準(zhǔn)(例如,AC-3壓縮標(biāo)準(zhǔn))格式化的壓縮主數(shù)字位流相關(guān)聯(lián)的改進(jìn)離散余弦變換(MDCT)系數(shù)集進(jìn)行解包。可修改經(jīng)解包的MDCT系數(shù)集的尾數(shù)來(lái)將輔助數(shù)字位流與主壓縮數(shù)字位流相混合??蓪?duì)所得經(jīng)修改的MDCT系數(shù)再打包以形成用來(lái)傳輸?shù)揭粋€(gè)或更多個(gè)媒體消費(fèi)點(diǎn)的壓縮混合數(shù)字位流。按照這種方式,可將輔助數(shù)字位流直接與壓縮版主數(shù)字位流相混合,而無(wú)需對(duì)壓縮主數(shù)字位流進(jìn)行解壓縮并隨后對(duì)混合數(shù)字位流進(jìn)行再壓縮。
參照?qǐng)D1,示例使用環(huán)境100例示了示例混合裝置110在包括廣播網(wǎng)絡(luò)供應(yīng)商120和服務(wù)于多個(gè)本地媒體消費(fèi)點(diǎn)140的本地服務(wù)供應(yīng)商130的廣播系統(tǒng)中的操作。廣播網(wǎng)絡(luò)供應(yīng)商120可以是能夠向一個(gè)或更多個(gè)本地服務(wù)供應(yīng)商130提供廣播內(nèi)容的任意類(lèi)型的廣播網(wǎng)絡(luò)供應(yīng)商。例如,廣播網(wǎng)絡(luò)供應(yīng)商120可對(duì)與電視節(jié)目、廣播節(jié)目、體育賽事、新聞廣播等相對(duì)應(yīng)的音頻、視頻和/或多媒體內(nèi)容進(jìn)行打包,以傳輸?shù)奖镜胤?wù)供應(yīng)商130用于隨后傳輸?shù)教囟ū镜胤?wù)供應(yīng)商130所服務(wù)的本地媒體消費(fèi)點(diǎn)140。在很多情形下,廣播網(wǎng)絡(luò)供應(yīng)商120生成的音頻、視頻和/或多媒體內(nèi)容是適于廣大聽(tīng)眾消費(fèi)的一般內(nèi)容。在這種情況下,本地服務(wù)供應(yīng)商130可剪輯廣播網(wǎng)絡(luò)供應(yīng)商120提供的一般內(nèi)容,以供與本地媒體消費(fèi)點(diǎn)140相關(guān)聯(lián)的特定本地聽(tīng)眾進(jìn)行消費(fèi)。
本地服務(wù)供應(yīng)商130例如可由任何服務(wù)供應(yīng)商來(lái)實(shí)現(xiàn),例如本地有線電視服務(wù)供應(yīng)商、本地射頻(RF)電視服務(wù)供應(yīng)商、本地?zé)o線電廣播供應(yīng)商等。本地服務(wù)供應(yīng)商130經(jīng)由接收器150從廣播網(wǎng)絡(luò)供應(yīng)商120接收廣播內(nèi)容。接收器150可由基于廣播網(wǎng)絡(luò)供應(yīng)商120與本地服務(wù)供應(yīng)商130之間的通信鏈路的任意適合類(lèi)型的接收器來(lái)實(shí)現(xiàn),例如衛(wèi)星接收器、高速數(shù)字網(wǎng)絡(luò)接收器等。另外,本地服務(wù)供應(yīng)商130可生成要與接收器150接收到的廣播內(nèi)容相混合的本地內(nèi)容160,例如用以剪輯廣播內(nèi)容以供與本地媒體消費(fèi)點(diǎn)140相關(guān)聯(lián)的特定本地聽(tīng)眾進(jìn)行消費(fèi)。將經(jīng)由接收器150接收到的廣播內(nèi)容和本地內(nèi)容160施加給混合裝置110,以生成混合廣播內(nèi)容用來(lái)經(jīng)由發(fā)送器170廣播到本地媒體消費(fèi)點(diǎn)140。發(fā)送器170可采用適于本地服務(wù)供應(yīng)商130的任意適合類(lèi)型的發(fā)送器來(lái)實(shí)現(xiàn),例如有線電視發(fā)送器、RF電視發(fā)送器、廣播無(wú)線電發(fā)送器等。
盡管示例使用環(huán)境100將混合裝置110示出為與本地服務(wù)供應(yīng)商130相結(jié)合地進(jìn)行操作以將來(lái)自廣播網(wǎng)絡(luò)供應(yīng)商120的內(nèi)容與本地內(nèi)容160相混合,但是也可以采用其他使用環(huán)境。例如,可由廣播網(wǎng)絡(luò)供應(yīng)商120使用混合裝置110來(lái)混合來(lái)自多個(gè)源的內(nèi)容,用以生成要提供給本地服務(wù)供應(yīng)商130的廣播內(nèi)容。另外或另選的是,可由本地服務(wù)供應(yīng)商130使用混合裝置110來(lái)混合來(lái)自多個(gè)源的內(nèi)容用以生成本地內(nèi)容160。更一般的是,混合裝置110可用在要將來(lái)自多個(gè)源的內(nèi)容相混合以生成所得混合內(nèi)容的任意情形下。
圖2示出了示例混合裝置200,該示例混合裝置200被配置為將非壓縮輔助數(shù)字位流210與壓縮主數(shù)字位流220相混合以生成所得壓縮混合數(shù)字位流230??墒褂檬纠旌涎b置200來(lái)例如在如下情況下實(shí)現(xiàn)圖1中的示例混合裝置110將本地內(nèi)容160格式化為非壓縮數(shù)字位流(例如,對(duì)應(yīng)于非壓縮輔助數(shù)字位流210),并將廣播網(wǎng)絡(luò)供應(yīng)商120提供的廣播內(nèi)容格式化為壓縮數(shù)字位流(例如,對(duì)應(yīng)于壓縮主數(shù)字位流220)。壓縮主數(shù)字位流220例如可根據(jù)諸如AC-3壓縮標(biāo)準(zhǔn)和/或MPEG-AAC壓縮標(biāo)準(zhǔn)(可采用其中任一種來(lái)利用來(lái)自各個(gè)塊的預(yù)定數(shù)量的數(shù)字化樣本對(duì)音頻信號(hào)塊進(jìn)行處理)的音頻壓縮標(biāo)準(zhǔn)來(lái)壓縮。如下所述,可以以例如48千赫茲(kHz)的采樣率來(lái)對(duì)壓縮數(shù)字位流220的源(未示出)進(jìn)行采樣以形成音頻塊。
通常,音頻壓縮技術(shù)(例如基于AC-3壓縮標(biāo)準(zhǔn)的音頻壓縮技術(shù))采用交疊音頻塊和MDCT算法來(lái)將音頻信號(hào)轉(zhuǎn)換為壓縮數(shù)字位流(例如,圖2中的壓縮主數(shù)字位流220)??筛鶕?jù)采樣的音頻信號(hào)的動(dòng)態(tài)特性來(lái)使用兩種不同的塊尺寸(即,短塊和長(zhǎng)塊)。例如,可采用AC-3短塊來(lái)最小化音頻信號(hào)的瞬態(tài)片段的預(yù)回聲,并可采用AC-3長(zhǎng)塊來(lái)實(shí)現(xiàn)音頻信號(hào)的非瞬態(tài)片段的高壓縮增益。根據(jù)AC-3壓縮標(biāo)準(zhǔn),AC-3長(zhǎng)塊對(duì)應(yīng)于512時(shí)域音頻樣本的塊,而AC-3短塊對(duì)應(yīng)于256時(shí)域音頻樣本。基于用在AC-3壓縮標(biāo)準(zhǔn)中的MDCT算法的交疊結(jié)構(gòu),在AC-3長(zhǎng)塊的情況下,通過(guò)將先前(舊)256時(shí)域樣本塊與當(dāng)前(新)256時(shí)域樣本塊連接起來(lái)而獲得512個(gè)時(shí)域樣本,以生成512時(shí)域樣本的音頻塊。然后采用MDCT算法來(lái)對(duì)AC-3長(zhǎng)塊進(jìn)行變換以生成256個(gè)變換系數(shù)。根據(jù)同一標(biāo)準(zhǔn),同樣從一對(duì)連續(xù)時(shí)域樣本音頻塊獲得AC-3短塊。然后采用MDCT算法來(lái)對(duì)AC-3短塊進(jìn)行變換以生成128個(gè)變換系數(shù)。然后對(duì)與兩個(gè)相鄰短塊相對(duì)應(yīng)的128個(gè)變換系數(shù)進(jìn)行交織以生成一組256個(gè)變換系數(shù)。由此,對(duì)AC-3長(zhǎng)塊或AC-3短塊的處理得到了相同數(shù)量的MDCT系數(shù)。作為另一示例,根據(jù)MPEG-AAC壓縮標(biāo)準(zhǔn),短塊包含128個(gè)樣本,而長(zhǎng)塊包含1024個(gè)樣本。
圖3例示了要由圖2中的示例混合裝置200處理為壓縮主數(shù)字位流220的示例單聲道壓縮數(shù)字位流的格式300。格式300基于包括多個(gè)256樣本時(shí)域音頻塊310(概括地示為A0、A1、A2、A3、A4和A5)的非壓縮數(shù)字位流。MDCT算法處理音頻塊310以生成MDCT系數(shù)集320(通過(guò)示例的方式將其示出為MA0、MA1、MA2、MA3、MA4和MA5(其中MA5未示出))。例如,MDCT算法可處理音頻塊A0和A1以生成MDCT系數(shù)集MA0。將音頻塊A0和A1連接起來(lái)生成512樣本音頻塊(例如,AC-3長(zhǎng)塊),采用MDCT算法對(duì)該512樣本音頻塊進(jìn)行MDCT變換以生成包含256個(gè)MDCT系數(shù)的MDCT系數(shù)集MA0。同樣,可對(duì)音頻塊A1和A2進(jìn)行處理以生成MDCT系數(shù)集MA1。由此,音頻塊A1是交疊音頻塊,因?yàn)槠溆脕?lái)生成MDCT系數(shù)集MA0和MA1兩者。按照類(lèi)似的方式,采用MDCT算法來(lái)對(duì)音頻塊A2和A3進(jìn)行變換以生成MDCT系數(shù)集MA2,對(duì)音頻塊A3和A4進(jìn)行變換以生成MDCT系數(shù)集MA3,對(duì)音頻塊A4和A5進(jìn)行變換以生成MDCT系數(shù)集MA4,等等。由此,音頻塊A2是用來(lái)生成MDCT系數(shù)集MA1和MA2的交疊音頻塊,音頻塊A3是用來(lái)生成MDCT系數(shù)集MA2和MA3的交疊音頻塊,音頻塊A4是用來(lái)生成MDCT系數(shù)集MA3和MA4的交疊音頻塊,等等。合起來(lái)說(shuō),將MDCT系數(shù)集320打包以形成圖2中的壓縮數(shù)字位流220。
圖4例示了圖2中的混合裝置200的示例實(shí)現(xiàn)。在圖4的示例中,混合裝置200包括獲取單元410、解包單元420、修改單元430以及再打包單元440。盡管下面根據(jù)AC-3壓縮標(biāo)準(zhǔn)描述了混合裝置200的操作,但是可將混合裝置200實(shí)現(xiàn)為例如根據(jù)另外的和/或其他壓縮標(biāo)準(zhǔn)(例如,MPEG-AAC壓縮標(biāo)準(zhǔn))進(jìn)行操作。將利用圖5的示例更詳細(xì)描述混合裝置200的操作。
獲取單元410被配置為獲取與壓縮數(shù)字位流220(示于圖2中)相關(guān)聯(lián)的一個(gè)或更多個(gè)幀510(示于圖5中),幀510的一部分通過(guò)示例的方式示出為圖5中的幀A和幀B。如前所述,壓縮數(shù)字位流220可以是根據(jù)AC-3標(biāo)準(zhǔn)壓縮的數(shù)字位流(下文中稱(chēng)作“AC-3數(shù)據(jù)流”220)。盡管AC-3數(shù)據(jù)流220可包括多個(gè)聲道,但是為了清晰起見(jiàn),以下的示例將AC-3數(shù)據(jù)流220描述為僅包括一個(gè)聲道。在AC-3數(shù)據(jù)流220中,各個(gè)幀510包括多個(gè)原始MDCT系數(shù)集520。根據(jù)AC-3壓縮標(biāo)準(zhǔn),例如,各個(gè)幀510包括六個(gè)原始MDCT系數(shù)集(即,六個(gè)“音頻塊”,其中各MDCT系數(shù)集對(duì)應(yīng)于一AC-3音頻塊)。例如,幀A包括原始MDCT系數(shù)集MA0、MA1、MA2、MA3、MA4和MA5,幀B包括原始MDCT系數(shù)集MB0、MB1、MB2、MB3、MB4和MB5。
獲取單元410還被配置為例如處理與各個(gè)幀510相關(guān)聯(lián)的頭信息,例如與AC-3數(shù)據(jù)流220相關(guān)聯(lián)的聲道數(shù)。盡管如上所述示例AC-3數(shù)據(jù)流220僅包括一個(gè)聲道,但是下面將關(guān)于圖7和圖8來(lái)描述具有多個(gè)聲道的示例壓縮數(shù)字位流。
返回到圖4和圖5,解包單元420被配置為對(duì)原始MDCT系數(shù)集520進(jìn)行解包來(lái)例如確定壓縮信息,例如原始?jí)嚎s處理的參數(shù)(即,音頻壓縮技術(shù)壓縮音頻信號(hào)或音頻數(shù)據(jù)以形成壓縮數(shù)字?jǐn)?shù)據(jù)流220的方式)。例如,解包單元420可確定采用多少位來(lái)表示原始MDCT系數(shù)集520內(nèi)的各個(gè)原始MDCT系數(shù)。另外,壓縮參數(shù)可包括限制AC-3數(shù)據(jù)流220可修改的程度以確保經(jīng)由AC-3數(shù)據(jù)流220傳送的媒體內(nèi)容質(zhì)量級(jí)足夠高的信息?;旌涎b置200隨后采用由解包單元420識(shí)別的壓縮信息來(lái)將非壓縮輔助數(shù)字位流210混合到AC-3數(shù)據(jù)流220中,從而確保按照與壓縮主數(shù)字位流220中提供的壓縮信息一致的方式來(lái)執(zhí)行混合操作。
如在AC-3壓縮標(biāo)準(zhǔn)中詳細(xì)描述的,采用尾數(shù)和指數(shù)來(lái)表示各個(gè)原始MDCT系數(shù)。AC-3壓縮標(biāo)準(zhǔn)采用能夠減少表示各個(gè)原始MDCT系數(shù)所用的位數(shù)的技術(shù)。心理聲學(xué)掩蔽是可被這些技術(shù)采用的一個(gè)因素。例如,在特定頻率k處存在音頻能量Ek(例如,聲調(diào))或者在特定頻率k附近的頻帶上的擴(kuò)展處存在音頻能量Ek(例如,類(lèi)噪聲特性)都產(chǎn)生掩蔽效應(yīng)。也就是說(shuō),如果在特定頻率k處或在頻率k附近的頻帶上的擴(kuò)展處的頻域能量的變化小于給定能量閾值ΔEk,則人耳不能感知該變化。因?yàn)槿硕倪@一特性,可以用與ΔEk有關(guān)的步長(zhǎng)來(lái)量化與頻率k相關(guān)聯(lián)的MDCT系數(shù)mk,而不會(huì)造成給音頻內(nèi)容帶來(lái)任何可感知的變化的風(fēng)險(xiǎn)。對(duì)于AC-3數(shù)據(jù)流220,用尾數(shù)Mk和指數(shù)Xk來(lái)表示各原始MDCT系數(shù)mk,使得mk=Mk.2-Xk,其中2-Xk表示系數(shù)mk的量化步長(zhǎng)。用來(lái)表示原始MDCT系數(shù)集520中的各原始MDCT系數(shù)的尾數(shù)Mk的位數(shù)可基于在AC-3壓縮標(biāo)準(zhǔn)中公布的已知量化查找表(例如,圖6中的示例量化查找表600)來(lái)確定。在圖6的示例中,量化查找表600提供了由四位數(shù)表示的MDCT系數(shù)的尾數(shù)碼或位模式以及對(duì)應(yīng)的尾數(shù)值。如下面詳細(xì)描述的,尾數(shù)Mk可修改為表示將非壓縮輔助數(shù)字位流210與AC-3數(shù)據(jù)流220相混合而得到的MDCT系數(shù)。
返回到圖4和圖5,修改單元430被配置為對(duì)各原始MDCT系數(shù)集520執(zhí)行逆變換以生成時(shí)域音頻塊530,通過(guò)示例的方式將時(shí)域音頻塊530示出為T(mén)A0’,…,TA3”,TA4’,TA4”,TA5’,TA5”,TB0’,TB0”,TB1’,TB1”,…,以及TB5’(TA0”到TA3’以及TB2’到TB4”未示出)。修改單元430執(zhí)行逆變換操作以生成與被連接起來(lái)以形成AC-3數(shù)據(jù)流220的原始MDCT系數(shù)集520的多個(gè)256樣本時(shí)域音頻塊相關(guān)聯(lián)的先前(舊)時(shí)域音頻塊集(其被表示為上撇號(hào)塊)集和當(dāng)前(新)時(shí)域音頻塊(其被表示為秒號(hào)塊)集。例如,修改單元430對(duì)原始MDCT系數(shù)集MA5執(zhí)行逆變換以生成時(shí)域塊TA4”和TA5’,對(duì)原始MDCT系數(shù)集MB0執(zhí)行逆變換以生成TA5”和TB0’,對(duì)原始MDCT系數(shù)集MB1執(zhí)行逆變換以生成TB0”和TB1’,等等。然后,修改單元430生成重構(gòu)的時(shí)域音頻塊540,其提供對(duì)被壓縮以形成AC-3數(shù)據(jù)流220的原始時(shí)域音頻塊的重構(gòu)。為了生成重構(gòu)的時(shí)域音頻塊540,修改單元430可例如基于已知的Princen-Bradley時(shí)域混疊消除(TDAC)技術(shù)(如在Princen等人的“Analysis/Synthesis Filter Bank Design Based on Time Domain AliasingCancellation”,Institute of Electrical and Electronics Engineers(IEEE)Transactions on Acoustics,Speech and Signal Processing,Vol.ASSP-35,No.5,pp.1153-1161(1986)(在此通過(guò)引用并入其全部?jī)?nèi)容)中描述的)來(lái)相加時(shí)域音頻塊530。例如,修改單元430可通過(guò)采用Princen-Bradley TDAC技術(shù)來(lái)將上撇號(hào)時(shí)域音頻塊TA5’和秒號(hào)時(shí)域音頻塊TA5”相加,來(lái)重構(gòu)圖3中的時(shí)域音頻塊A5(對(duì)應(yīng)于TA5R)。同樣,修改單元430可通過(guò)采用Princen-Bradley TDAC技術(shù)來(lái)將上撇號(hào)音頻塊TB0’和秒號(hào)音頻塊TB0”相加,來(lái)重構(gòu)時(shí)域音頻塊B0(對(duì)應(yīng)于TB0R)。按照這種方式,對(duì)用來(lái)形成AC-3數(shù)據(jù)流220的原始時(shí)域音頻塊進(jìn)行重構(gòu)以使得非壓縮輔助數(shù)字位流210能夠被直接混合到AC-3數(shù)據(jù)流220中。
修改單元430還被配置為將非壓縮輔助數(shù)字位流210混合到重構(gòu)的時(shí)域音頻塊540中以生成混合時(shí)域音頻塊550,通過(guò)示例的方式將混合時(shí)域音頻塊550示出為T(mén)A0X、…、TA4X、TA5X、TB0X、TB1X、…、以及TB5X(塊TA1X、TA2X、TA3X、TB2X、TB3X以及TB4X未示出)。修改單元430可通過(guò)將非壓縮輔助數(shù)字位流210中包括的時(shí)域音頻樣本與所連接的重構(gòu)時(shí)域音頻塊540中的對(duì)應(yīng)時(shí)域音頻樣本相加來(lái)實(shí)現(xiàn)混合處理,以生成混合時(shí)域音頻塊550。另外,修改單元430可被配置為在相加操作之前,衰減非壓縮輔助數(shù)字位流210和重構(gòu)時(shí)域音頻塊540中的任一個(gè)或兩者中的時(shí)域音頻樣本。例如,在AC-3數(shù)據(jù)流220對(duì)應(yīng)于MAS且非壓縮輔助數(shù)字位流210對(duì)應(yīng)于AAS的情況下,修改單元430可被配置為在相加操作之前將與MAS相對(duì)應(yīng)的重構(gòu)時(shí)域音頻塊540中的時(shí)域樣本衰減一衰減因數(shù)(例如,3dB到10dB)。這種衰減將使得AAS成為混合音頻信號(hào)中的主導(dǎo)音頻分量,但仍使得MAS按較低但可感知的級(jí)別被聽(tīng)到。
返回到圖4和圖5,基于混合時(shí)域音頻塊550,修改單元430生成中間混合MDCT系數(shù)集560,通過(guò)示例的方式將中間混合MDCT系數(shù)集560示出為MA0I、...、MA4I、MA5I、MB0I、...、以及MB5I(塊MA1I、MA2I、MA3I、MB1I、MB2I、MB3I以及MB4I未示出)。根據(jù)上述示例,修改單元430基于混合時(shí)域音頻塊TA5X和TB0X生成中間混合MDCT系數(shù)集MA5I。具體來(lái)說(shuō),修改單元430將混合時(shí)域音頻塊TA5X和TB0X連接起來(lái)以形成512樣本連接音頻塊,并將該512樣本連接音頻塊轉(zhuǎn)換為中間混合MDCT系數(shù)集MA5I,如下面將更詳細(xì)描述的,可采用該中間混合MDCT系數(shù)集MA5I來(lái)修改原始MDCT系數(shù)集MA5以生成輸出混合MDCT系數(shù)集MA5X。
原始MDCT系數(shù)集520與中間混合MDCT系數(shù)集560之差表示AC-3數(shù)據(jù)流220中與將非壓縮輔助數(shù)字位流210與AC-3數(shù)據(jù)流220相混合對(duì)應(yīng)的變化。因此,可以基于原始MDCT系數(shù)集520的格式并由此基于與原始MDCT系數(shù)集520相關(guān)聯(lián)的壓縮,生成輸出混合MDCT系數(shù)集570,通過(guò)示例的方式將輸出混合MDCT系數(shù)集570示出為MA0X、...、MA4X、MA5X、MB0X、...、以及MB5X(塊MA1X、MA2X、MA3X、MB1X、MB2X、MB3X以及MB4X未示出)。例如,關(guān)于圖6,修改單元430可采用與對(duì)應(yīng)的原始MDCT系數(shù)集MA5相關(guān)聯(lián)的指數(shù)以及基于對(duì)應(yīng)的中間混合MDCT系數(shù)集MA5I的尾數(shù),按照尾數(shù)及指數(shù)格式來(lái)表示混合MDCT系數(shù)集MA5X。此外,可采用與原始MDCT系數(shù)集520相對(duì)應(yīng)的量化查找表(即,圖6中的查找表600)來(lái)量化中間混合MDCT系數(shù)560的尾數(shù)值,以生成混合MDCT系數(shù)集570的MDCT系數(shù)的尾數(shù)值。本領(lǐng)域普通技術(shù)人員將認(rèn)識(shí)到,由于在非壓縮輔助數(shù)字位流210中的混合,故而得到的量化混合尾數(shù)值表示AC-3數(shù)據(jù)流220的變化或其增加。在該示例實(shí)施中,采用原始MDCT系數(shù)的指數(shù)來(lái)生成混合MDCT系數(shù)集570的對(duì)應(yīng)混合MDCT系數(shù)。改變指數(shù)可能需要重新計(jì)算基本壓縮信號(hào)表示,從而要求壓縮信號(hào)經(jīng)歷真正的解壓縮/壓縮輪回。為了避免解壓縮/壓縮輪回,如果僅對(duì)尾數(shù)的修改不足以完全表示混合的與原始的MDCT系數(shù)之差,則適當(dāng)?shù)貙⑹苡绊懙腗DCT尾數(shù)設(shè)置為最大或最小值。
轉(zhuǎn)向圖6,示例量化查找表600包括對(duì)-0.9333到+0.9333范圍內(nèi)的示例尾數(shù)Mk的十五級(jí)量化的尾數(shù)碼和尾數(shù)值。盡管示例量化查找表600提供了與用四位表示的MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)信息,但是AC-3壓縮標(biāo)準(zhǔn)提供了與每MDCT系數(shù)的其他適合位數(shù)相關(guān)聯(lián)的量化查找表。為了例示修改單元430可生成特定混合MDCT系數(shù)的一個(gè)示例方式,考慮原始MDCT系數(shù)集MA5中包含的尾數(shù)為Mk的原始MDCT系數(shù)mk。假設(shè)原始尾數(shù)值Mk為-0.2666(即,-4/15)。采用量化查找表600,將與原始MDCT系數(shù)集MA5中的原始MDCT系數(shù)mk相對(duì)應(yīng)的尾數(shù)碼確定為0101。接著,假設(shè)混合MDCT系數(shù)集MA5X包括尾數(shù)值為XMk的混合MDCT系數(shù)xmk。此外,假設(shè)對(duì)應(yīng)的中間混合MDCT系數(shù)集MA5I的中間尾數(shù)值為-0.4300,這處于尾數(shù)碼0011與0100之間。換言之,在該示例中將非壓縮輔助位流210與AC-3位流220相混合,得到原始尾數(shù)值-0.2666與混合尾數(shù)值-0.4300之間的差為-0.1667。
為了將非壓縮輔助位流210與AC-3數(shù)據(jù)流220相混合,修改單元430可將混合MDCT系數(shù)集MA5X表示為對(duì)原始MDCT系數(shù)集MA5中的原始MDCT系數(shù)的修改。繼續(xù)以上示例,因?yàn)榕c對(duì)應(yīng)的混合MDCT系數(shù)xmk相關(guān)聯(lián)的中間混合尾數(shù)處于尾數(shù)碼0011與0100之間(因?yàn)榕c混合MDCT系數(shù)xmk相對(duì)應(yīng)的中間尾數(shù)值為-0.4300),所以尾數(shù)碼0011或尾數(shù)碼0100可替代與MDCT系數(shù)mk相關(guān)聯(lián)的尾數(shù)碼0101來(lái)表示混合MDCT系數(shù)xmk。與尾數(shù)碼0011相對(duì)應(yīng)的尾數(shù)值為-0.5333(即,-8/15),與尾數(shù)碼0100相對(duì)應(yīng)的尾數(shù)值為-0.4(即,-6/15)。在該示例中,因?yàn)榕c尾數(shù)碼0100相對(duì)應(yīng)的尾數(shù)值-0.4最接近理想的中間混合尾數(shù)值-0.4300,所以修改單元430選擇尾數(shù)碼0100來(lái)表示混合MDCT系數(shù)xmk。結(jié)果,與混合MDCT系數(shù)xmk的混合尾數(shù)XMk相對(duì)應(yīng)的新的尾數(shù)位模式0100代替原始尾數(shù)位模式0101。同樣,可按照上述方式來(lái)修改原始MDCT系數(shù)集MA5中的各個(gè)原始MDCT系數(shù),以生成混合MDCT系數(shù)集MA5X中的對(duì)應(yīng)混合MDCI系數(shù)。此外,如果中間混合尾數(shù)值在尾數(shù)值的量化范圍之外(即,大于0.9333或小于-0.9333),適當(dāng)?shù)剡x擇正限1110或負(fù)限0000作為輸出混合尾數(shù)碼。另外,如上所討論的,盡管可如上所述地修改與原始MDCT系數(shù)集中的各原始MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)碼,但是在生成對(duì)應(yīng)的混合MDCT系數(shù)時(shí)仍保持與原始MDCT系數(shù)相關(guān)聯(lián)的指數(shù)不變。
返回到圖4和圖5,再打包單元440被配置為對(duì)與AC-3數(shù)據(jù)流220中的各個(gè)幀相關(guān)聯(lián)的混合MDCT系數(shù)集570進(jìn)行再打包以生成壓縮混合數(shù)字位流230。具體來(lái)說(shuō),再打包單元440識(shí)別各原始MDCT系數(shù)集520在AC-3數(shù)據(jù)流220的幀內(nèi)的位置,從而可基于修改所識(shí)別的原始MDCT系數(shù)集520來(lái)生成對(duì)應(yīng)的混合MDCT系數(shù)集570。為了重建混合版的幀A,例如,再打包單元440可識(shí)別原始MDCT系數(shù)集MA0到MA5的位置并對(duì)其進(jìn)行修改,以在對(duì)應(yīng)的識(shí)別位置處生成對(duì)應(yīng)的混合MDCT系數(shù)集MA0X到MA5X。采用本文描述的解包、修改以及再打包處理,AC-3數(shù)據(jù)流220在輔助數(shù)字位流210與其相混合的同時(shí)保持為壓縮數(shù)字位流。因此,混合裝置200無(wú)需另外的解壓縮/壓縮輪回(這可能劣化AC-3數(shù)據(jù)流220中的媒體內(nèi)容的質(zhì)量)而將輔助數(shù)字位流210與AC-3數(shù)據(jù)流220相混合。
為簡(jiǎn)便起見(jiàn),關(guān)于圖5描述了包括單個(gè)聲道的AC-3數(shù)據(jù)流220。然而,如下關(guān)于圖7和圖8所描述的,本文描述的方法和裝置可應(yīng)用于具有與多個(gè)聲道相關(guān)聯(lián)的音頻塊(例如,5.1聲道音頻(即,五個(gè)全帶寬聲道和一個(gè)低頻效果聲道))的壓縮數(shù)字?jǐn)?shù)據(jù)流。在圖7的示例中,非壓縮數(shù)字位流格式700可包括多個(gè)音頻塊集710。各個(gè)音頻塊集710可包括與多個(gè)聲道(例如,包括左前聲道、中央聲道、右前聲道、左后聲道、右后聲道以及低頻效果(LFT)聲道(例如,超重低音炮聲道))相關(guān)聯(lián)的音頻塊720和730。例如,音頻塊集AUD0包括與左前聲道相關(guān)聯(lián)的音頻塊A0L、與中央聲道相關(guān)聯(lián)的音頻塊A0C、與右前聲道相關(guān)聯(lián)的音頻塊A0R、與左后聲道相關(guān)聯(lián)的音頻塊A0RL、與右后聲道相關(guān)聯(lián)的音頻塊A0RR、以及與LFE聲道相關(guān)聯(lián)的音頻塊A0LFE。類(lèi)似地,音頻塊集AUD1包括與左前聲道相關(guān)聯(lián)的音頻塊A1L、與中央聲道相關(guān)聯(lián)的音頻塊A1C、與右前聲道相關(guān)聯(lián)的音頻塊A1R、與左后聲道相關(guān)聯(lián)的音頻塊A1RL、與右后聲道相關(guān)聯(lián)的音頻塊A1RR、以及與LFE聲道相關(guān)聯(lián)的音頻塊A1LFE。
可按照與上面關(guān)于圖3所述的方式類(lèi)似的方式來(lái)壓縮音頻塊集710中與特定聲道相關(guān)聯(lián)的各個(gè)音頻塊。例如,可對(duì)圖8中的與中央聲道相關(guān)聯(lián)的音頻塊810(其與圖7中的中央聲道相對(duì)應(yīng),且通過(guò)示例的方式示出為A0C、A1C、A2C、以及A3C、...、A5C(A4C未示出))進(jìn)行變換,以生成與壓縮中央聲道數(shù)字位流800相關(guān)聯(lián)的MDCT系數(shù)集820。如上所述,各個(gè)MDCT系數(shù)集820可從通過(guò)連接先前(舊)256樣本音頻塊和當(dāng)前(新)256樣本音頻塊而形成的512樣本音頻塊中得出。MDCT算法然后可處理時(shí)域音頻塊810(例如,A0C到A5C)以生成MDCT系數(shù)集(例如,M0C到M5C)。
在包括將AAS與和5.1聲道音頻相對(duì)應(yīng)的MAS相混合的應(yīng)用中,可以?xún)?yōu)選地將AAS數(shù)字位流與MAS 5.1聲道音頻位流的中央聲道相混合。在這種情況下,壓縮的中央聲道數(shù)字位流800對(duì)應(yīng)于圖2中的壓縮主數(shù)字位流220,并可采用圖4中的混合裝置200來(lái)將輔助數(shù)字位流210與壓縮中央聲道數(shù)字位流800相混合?;旌涎b置200可按照與以上關(guān)于圖5和圖6描述的處理類(lèi)似的方式來(lái)執(zhí)行混合操作。例如,基于壓縮中央聲道數(shù)字位流800的MDCT系數(shù)集820,獲取單元410如上所述地獲取多個(gè)幀(未示出)以及與各個(gè)幀相關(guān)聯(lián)的頭信息。頭信息包括與壓縮中央聲道數(shù)字位流800相關(guān)聯(lián)的壓縮信息。對(duì)于各個(gè)幀,解包單元420對(duì)原始MDCT系數(shù)集820進(jìn)行解包以確定與原始MDCT系數(shù)集820相關(guān)聯(lián)的壓縮信息。例如,解包單元420可識(shí)別原始?jí)嚎s處理表示各個(gè)原始MDCT系數(shù)集820中的各個(gè)原始MDCT系數(shù)的尾數(shù)所用的位數(shù)??刹捎眠@種壓縮信息來(lái)如以上關(guān)于圖5和圖6描述地將輔助數(shù)字位流210與壓縮中央聲道數(shù)字位流800相混合。修改單元430然后生成經(jīng)逆變換的時(shí)域音頻塊830,通過(guò)示例的方式將其示出為T(mén)A0C”、TA1C’、TA1C”、TA2C’、TA2C”以及TA3C’。時(shí)域音頻塊830包括先前(舊)時(shí)域音頻塊(其表示為上撇號(hào)塊)集和當(dāng)前(新)時(shí)域音頻塊(其表示為秒號(hào)塊)集。通過(guò)例如基于Princen-Bradley TDAC技術(shù)來(lái)將對(duì)應(yīng)上撇號(hào)塊和秒號(hào)塊相加,可對(duì)被壓縮以形成壓縮中央聲道數(shù)字位流800的原始時(shí)域音頻塊進(jìn)行重構(gòu)以形成重構(gòu)時(shí)域音頻塊840。例如,修改單元430可將時(shí)域音頻塊TA1C’和TA1C”相加來(lái)重構(gòu)時(shí)域音頻塊A1C(即,TA1CR)。同樣,修改單元430可將時(shí)域音頻塊TA2C’和TA2C”相加來(lái)重構(gòu)時(shí)域音頻塊A2C(即,TA2CR)。
為了將輔助數(shù)字位流210與壓縮中央聲道數(shù)字位流800相混合,修改單元430將輔助數(shù)字位流210與重構(gòu)時(shí)域音頻塊840相混合以生成混合時(shí)域音頻塊850。例如,修改單元430可將輔助數(shù)字位流210混合到重構(gòu)時(shí)域音頻塊TA1CR中以生成混合時(shí)域音頻塊TA1CX。
基于混合時(shí)域音頻塊850,修改單元430可生成混合MDCT系數(shù)集860。例如,修改單元430可將混合時(shí)域音頻塊TA1CX和TA2CX連接起來(lái)以生成與混合MDCT系數(shù)M1CX相對(duì)應(yīng)的中間混合MDCT系數(shù)集M1CI(未示出)。如以上關(guān)于圖5和圖6所討論的,修改單元430基于中間混合MDCT系數(shù)(未示出)修改原始MDCT系數(shù)集820來(lái)生成對(duì)應(yīng)的混合MDCT系數(shù)集860。例如,修改單元430可采用混合MDCT系數(shù)集M1CI的理想值來(lái)修改MDCT系數(shù)集M1C的原始尾數(shù)以生成混合MDCT系數(shù)集M1CX。再打包單元440然后可對(duì)混合MDCT系數(shù)集860再打包以生成對(duì)應(yīng)于將輔助數(shù)字位流210與壓縮中央聲道數(shù)字位流800相混合的壓縮混合數(shù)字位流230。
圖9到圖11示出了表示用于實(shí)現(xiàn)圖4中的示例混合裝置200的示例處理的流程圖。在這些示例中,流程圖所表示的處理可以由可機(jī)讀指令集來(lái)實(shí)現(xiàn),該可機(jī)讀指令集可包括由處理器(例如在下面關(guān)于圖15討論的示例計(jì)算機(jī)2000中示出的處理器2020)執(zhí)行的一個(gè)或更多個(gè)程序。一個(gè)或更多個(gè)處理可以用存儲(chǔ)在諸如CD-ROM、軟盤(pán)、硬盤(pán)驅(qū)動(dòng)器、DVD或與處理器2020相關(guān)聯(lián)的存儲(chǔ)器2030的有形介質(zhì)上的軟件來(lái)實(shí)現(xiàn),但是本領(lǐng)域普通技術(shù)人員將容易理解,所述一個(gè)或更多個(gè)程序以及/或者其部分另選地可由除處理器2020以外的裝置來(lái)執(zhí)行,并且/或者可以以廣為公知的方式用固件或?qū)S糜布?lái)實(shí)現(xiàn)。例如,混合裝置200、獲取單元410、解包單元420、修改單元430和/或再打包單元440中的任一個(gè)或全部可由軟件、硬件和/或固件的任意組合來(lái)實(shí)現(xiàn)。此外,盡管參照?qǐng)D9到圖11中例示的流程圖描述了示例處理,但是本領(lǐng)域普通技術(shù)人員將容易理解,可另選地采用實(shí)現(xiàn)本文描述的示例方法和裝置的很多其他方法。例如,參照?qǐng)D9到圖11中例示的流程圖,可改變塊的執(zhí)行順序,并且/或者可對(duì)所描述的塊的一部分進(jìn)行改變、刪除、組合和/或?qū)⑵浼?xì)分為多個(gè)塊。
圖9中示出了例示用以實(shí)現(xiàn)圖4中的示例混合裝置200的示例處理900的流程圖。在圖9的示例中,示例處理900開(kāi)始于塊905,在塊905處獲取裝置410獲取與圖2中的非壓縮輔助數(shù)字位流210(其對(duì)應(yīng)于AAS)相關(guān)聯(lián)的幀(以下在對(duì)圖9到圖11的描述中將其稱(chēng)為“非壓縮AAS幀”)。接著,控制進(jìn)行到塊910,在塊910處獲取單元410獲取與壓縮主數(shù)字位流220(其對(duì)應(yīng)于MAS)相關(guān)聯(lián)的幀(以下在對(duì)圖9到圖11的描述中將其稱(chēng)作“壓縮MAS幀”),例如圖5中的幀A。獲得的壓縮MAS幀可包括通過(guò)交疊并連接多個(gè)音頻塊而形成的多個(gè)原始MDCT系數(shù)集。根據(jù)AC-3壓縮標(biāo)準(zhǔn),例如,壓縮MAS幀可包括六個(gè)MDCT系數(shù)集(即,六個(gè)“音頻塊”,其中各MDCT系數(shù)集對(duì)應(yīng)于一AC-S音頻塊),例如圖5中的原始MDCT系數(shù)集520。在塊910處獲得壓縮MAS幀之后,控制進(jìn)行到塊920,在塊920處獲取單元410還識(shí)別與壓縮MAS幀相關(guān)聯(lián)的頭信息。例如,獲取單元410可確定與對(duì)應(yīng)于所獲得MAS幀的壓縮主數(shù)字位流220相關(guān)聯(lián)的聲道數(shù)。
然后控制進(jìn)行到塊930,在塊930處解包單元420對(duì)包括在獲得的壓縮MAS幀中的多個(gè)原始MDCT系數(shù)集520進(jìn)行解包,以確定與用來(lái)生成壓縮MAS幀的原始?jí)嚎s處理相關(guān)聯(lián)的壓縮信息。具體來(lái)說(shuō),解包單元420識(shí)別各原始MDCT系數(shù)集520中的各原始MDCT系數(shù)mk的尾數(shù)Mk和指數(shù)Xk。然后按照依照AC-3壓縮標(biāo)準(zhǔn)的方式將原始MDCT系數(shù)的指數(shù)集合起來(lái)。解包單元420還確定用來(lái)表示各原始MDCT系數(shù)的尾數(shù)的位數(shù),從而可采用AC-3壓縮標(biāo)準(zhǔn)規(guī)定的適合量化查找表來(lái)如以上關(guān)于圖6所述地修改多個(gè)原始MDCT系數(shù)集。然后控制進(jìn)行到塊940以實(shí)現(xiàn)修改處理,下面將關(guān)于圖10對(duì)其進(jìn)行更詳細(xì)的描述。
如在圖10中所例示的,修改處理940開(kāi)始于塊1010,在塊1010處修改單元430對(duì)原始MDCT系數(shù)集520執(zhí)行逆變換以生成諸如時(shí)域音頻塊530的經(jīng)逆變換的時(shí)域音頻塊。具體來(lái)說(shuō),修改單元430生成與用來(lái)生成對(duì)應(yīng)原始MDCT系數(shù)集的各256樣本原始時(shí)域音頻塊530相關(guān)聯(lián)的先前(舊)時(shí)域音頻塊(其例如表示為圖5中的上撇號(hào)塊)和當(dāng)前(新)時(shí)域音頻塊(其表示為圖5中的秒號(hào)塊)。如以上關(guān)于圖5所描述的,例如,修改單元430可從MDCT系數(shù)集MA5生成TA4”和TA5’、從MDCT系數(shù)集MB0生成TA5”和TB0’、并且從MDCT系數(shù)集MB1生成TB0”和TB1’。然后控制進(jìn)行到塊1020,在塊1020處修改單元430基于例如Princen-Bradley TDAC技術(shù)對(duì)相應(yīng)的舊塊和新塊進(jìn)行相加來(lái)重構(gòu)時(shí)域音頻塊,以生成重構(gòu)的時(shí)域音頻塊,例如圖5中的重構(gòu)時(shí)域音頻塊540。根據(jù)以上示例,可將舊塊TA5’和新塊TA5”相加來(lái)重構(gòu)時(shí)域音頻塊A5(即,經(jīng)重構(gòu)時(shí)域音頻塊TA5R),同時(shí)可將上撇號(hào)塊TB0’和秒號(hào)塊TB0”相加來(lái)重構(gòu)時(shí)域音頻塊B0(即,經(jīng)重構(gòu)時(shí)域音頻塊TB0R)。
為了將在圖9的塊905處獲得的非壓縮AAS幀與在塊910處獲得的壓縮MAS幀相混合,控制進(jìn)行到塊1040,在塊1040處修改單元430將非壓縮AAS幀與從壓縮MAS幀得到的重構(gòu)時(shí)域音頻塊相混合。例如,修改單元430可將來(lái)自非壓縮AAS幀的樣本加入到重構(gòu)時(shí)域音頻塊TA5R中,以生成圖5中的混合時(shí)域音頻塊TA5X。修改單元430還可在進(jìn)行相加處理以生成混合時(shí)域音頻塊550之前,衰減與壓縮MAS幀或非壓縮AAS幀相對(duì)應(yīng)的重構(gòu)時(shí)域音頻塊中的任一個(gè)或兩者。然后控制進(jìn)行到塊1050,在塊1050處基于混合時(shí)域音頻塊550,修改單元430生成中間混合MDCT系數(shù)集,例如圖5中的中間混合MDCT系數(shù)集560。如上所述,可采用兩個(gè)混合時(shí)域音頻塊550(其中每一個(gè)塊都包括256個(gè)樣本)來(lái)生成中間混合MDCT系數(shù)集560。例如,可連接混合時(shí)域音頻塊TA5X和TB0X,然后用其來(lái)生成中間混合MDCT系數(shù)集MA5I。
接著,控制進(jìn)行到塊1060,在塊1060處修改單元430基于修改與在圖9的塊910處獲得的壓縮MAS幀相對(duì)應(yīng)的原始MDCT系數(shù)集520來(lái)確定輸出混合MDCT系數(shù)集570。例如,基于在圖9的塊930處確定的并與和壓縮MAS幀相對(duì)應(yīng)的壓縮數(shù)字?jǐn)?shù)據(jù)流220相關(guān)聯(lián)的壓縮信息,修改單元430如以上關(guān)于圖4至圖6所描述地計(jì)算與混合MDCT系數(shù)集MA5X中的各混合MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)值。按照這種方式,修改單元430可修改原始MDCT系數(shù)集520,以確定表示對(duì)應(yīng)于非壓縮AAS幀的輔助數(shù)字位流210與對(duì)應(yīng)于壓縮MAS幀的壓縮主數(shù)字位流220的混合的混合MDCT系數(shù)集570。根據(jù)以上示例,修改單元430可基于中間混合MDCT系數(shù)集MA5I來(lái)修改原始MDCT系數(shù)集MA5以確定混合MDCT系數(shù)集MA5X的表示。例如,修改單元430可用中間混合MDCT系數(shù)集MA5I中的對(duì)應(yīng)中間混合MDCT系數(shù)的量化中間尾數(shù)來(lái)替代MDCT系數(shù)集MA5中的原始MDCT系數(shù)的尾數(shù),以生成混合MDCT系數(shù)集MA5X中的混合MDCT系數(shù)。另選的是,修改單元430可計(jì)算與原始MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)碼和與對(duì)應(yīng)的中間混合MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)碼之間的差,并基于該差修改原始MDCT系數(shù)以生成輸出混合MDCT系數(shù)集。在另一情況下,在修改原始MDCT系數(shù)集以生成混合MDCT系數(shù)集之后,修改處理940結(jié)束并返回控制到圖9中的塊950。
返回到圖9,在塊950處再打包單元440對(duì)混合MDCT系數(shù)集570進(jìn)行再打包以生成壓縮混合數(shù)字位流230。再打包單元440識(shí)別MDCT系數(shù)集在幀內(nèi)的位置,從而可在原始MDCT系數(shù)集的位置處代入混合MDCT系數(shù)集來(lái)重建該幀。然后控制進(jìn)行到塊955,在塊955處再打包單元440輸出所得再打包的幀以生成壓縮混合數(shù)字位流230。然后,在塊960處,如果混合裝置200確定需要處理壓縮主數(shù)字位流220的另外的幀,則控制返回到塊910。然而如果已處理了壓縮主數(shù)字位流220中的全部幀,則處理900結(jié)束。
如上所述,已知的混合技術(shù)通常將壓縮主數(shù)字位流解壓縮為非壓縮時(shí)域樣本、將輔助數(shù)字位流與非壓縮主數(shù)字位流相混合、并且將混合時(shí)域樣本再壓縮為壓縮混合數(shù)字位流。相對(duì)的是,在圖9的示例處理900中,壓縮主數(shù)字位流220在本文描述的示例解包、修改以及再打包處理期間保持為壓縮。因此,無(wú)需另外的解壓縮/壓縮輪回(這可能劣化壓縮混合數(shù)字位流230中的內(nèi)容的質(zhì)量),就可將輔助數(shù)字位流210混合到壓縮主數(shù)字位流220中。
為了進(jìn)一步例示圖9和圖10中的示例修改處理940,圖11描述了AC-3數(shù)據(jù)幀修改處理940的詳細(xì)流程圖,該AC-3數(shù)據(jù)幀修改處理940用來(lái)修改MAS壓縮數(shù)字位流220的AC-3數(shù)據(jù)幀以反映MAS數(shù)字位流220與AAS數(shù)字位流210的混合。示例AC-3數(shù)據(jù)幀修改處理940開(kāi)始于塊1110,混合裝置200的解包單元420讀取例如在圖9的塊930處確定的所獲AC-3幀的壓縮信息。接著,控制進(jìn)行到塊1120,在塊1120處修改單元430將MDCT系數(shù)集計(jì)數(shù)初始化為零。在正在處理AC-3幀的情況下,各AC-3幀包括具有壓縮域數(shù)據(jù)的六個(gè)MDCT系數(shù)集(例如,圖5中的MA0、MA1、MA2、MA3、MA4和MA5,在AC-3標(biāo)準(zhǔn)中它們還公知為“音頻塊”)。因此,在塊1130處,混合裝置200的修改單元430確定MDCT系數(shù)集計(jì)數(shù)是否等于六。
如果在塊1130處MDCT系數(shù)集計(jì)數(shù)還未等于六,從而表示至少一個(gè)以上的MDCT系數(shù)集需要進(jìn)行處理,則控制進(jìn)行到塊1140和1150,在塊1140和1150處修改單元430分別提取與對(duì)應(yīng)于MAS壓縮數(shù)字位流220的AC-3數(shù)據(jù)幀的原始MDCT系數(shù)相關(guān)聯(lián)的指數(shù)和尾數(shù)(例如,以上關(guān)于圖6描述的原始尾數(shù)Mk)。然后控制進(jìn)行到塊1154,在塊1154處修改單元430根據(jù)以上圖5和圖6的示例并基于所提取的尾數(shù)和指數(shù),來(lái)重構(gòu)與MAS壓縮數(shù)字位流220的AC-3數(shù)據(jù)幀相對(duì)應(yīng)的時(shí)域音頻塊。接著,在塊1158處,修改單元430將重構(gòu)MAS時(shí)域音頻塊與AAS數(shù)字位流210的對(duì)應(yīng)音頻塊相混合。修改單元430可在將對(duì)應(yīng)塊相加起來(lái)以執(zhí)行混合處理之前,衰減重構(gòu)MAS時(shí)域音頻塊或AAS時(shí)域音頻塊中的任一個(gè)或兩者。需要進(jìn)行衰減例如來(lái)得到MAS的音頻內(nèi)容與AAS的音頻內(nèi)容之間的理想音頻幅值關(guān)系。在典型的情形下,MAS可被衰減3到10dB的因數(shù),以使得AAS中包括的畫(huà)外音內(nèi)容可在MAS的音頻內(nèi)容外被聽(tīng)到。
接著,控制進(jìn)行到塊1160,在塊1160處修改單元430計(jì)算與在塊1158處生成的所得混合時(shí)域音頻塊相關(guān)聯(lián)的新(中間)混合尾數(shù)值。然后控制進(jìn)行到塊1170,在塊1170處修改單元430通過(guò)修改與和MAS壓縮數(shù)字位流220相對(duì)應(yīng)的AC-3數(shù)據(jù)幀的原始MDCT系數(shù)相關(guān)聯(lián)的原始尾數(shù)來(lái)生成最終的混合尾數(shù)。例如,可通過(guò)基于與MAS壓縮數(shù)字位流220的原始MDCT系數(shù)相關(guān)聯(lián)的壓縮信息對(duì)新混合尾數(shù)進(jìn)行量化來(lái)確定最終混合尾數(shù)(但是限于與原始尾數(shù)的位表示相關(guān)聯(lián)的范圍內(nèi))。然后控制進(jìn)行到塊1180,在塊1180處修改單元430將MDCT系數(shù)集計(jì)數(shù)遞增1,控制返回到塊1130。
盡管以上描述的圖11的示例處理包括六個(gè)MDCT系數(shù)集(例如,MDCT系數(shù)集計(jì)數(shù)的閾值為六),但是相反可采用使用更多或更少M(fèi)DCT系數(shù)集的處理。然而,在圖11的示例中,如果在塊1130處MDCT系數(shù)集計(jì)數(shù)等于六,則處理了全部MDCT系數(shù)集,使得完成了對(duì)當(dāng)前幀的混合處理。然后控制進(jìn)行到例如圖9的塊950以進(jìn)行后續(xù)的處理。
圖12描述了另選示例混合裝置1200,該示例混合裝置1200被配置為將壓縮輔助數(shù)字位流1210與壓縮主數(shù)字位流1220相混合以生成所得壓縮混合數(shù)字位流1230。例如在將本地內(nèi)容160格式化為壓縮數(shù)字位流(例如,對(duì)應(yīng)于壓縮輔助數(shù)字位流1210)并且將廣播網(wǎng)絡(luò)供應(yīng)商120提供的廣播內(nèi)容格式化為壓縮數(shù)字位流(例如,對(duì)應(yīng)于壓縮主數(shù)字位流1220)的情況下,可采用圖12中的示例混合裝置1200來(lái)實(shí)現(xiàn)圖1中的示例混合裝置110。與對(duì)圖2中的壓縮主數(shù)字位流220一樣,例如可根據(jù)諸如AC-3壓縮標(biāo)準(zhǔn)和/或MPEG-AAC壓縮標(biāo)準(zhǔn)(可采用其中的任一種來(lái)利用來(lái)自各塊的預(yù)定數(shù)量的數(shù)字化樣本對(duì)音頻信號(hào)塊進(jìn)行處理)的音頻壓縮標(biāo)準(zhǔn)來(lái)對(duì)壓縮主數(shù)字位流1220和壓縮輔助位流1210進(jìn)行壓縮。可以以例如48千赫茲(kHz)的采樣率來(lái)對(duì)壓縮數(shù)字位流1210和1220的源(未示出)進(jìn)行采樣以形成如以上關(guān)于圖3和圖7的示例描述的音頻塊。
圖13和圖14A至圖14B示出了表示用于實(shí)現(xiàn)圖12的示例混合裝置1200的示例處理的流程圖。在這些示例中,流程圖所表示的處理可以由可機(jī)讀指令集來(lái)實(shí)現(xiàn),該可機(jī)讀指令集可包括由處理器(例如在下面關(guān)于圖15討論的示例計(jì)算機(jī)2000中示出的處理器2020)執(zhí)行的一個(gè)或更多個(gè)程序。一個(gè)或更多個(gè)處理可以用存儲(chǔ)在諸如CD-ROM、軟盤(pán)、硬盤(pán)、DVD或與處理器2020相關(guān)聯(lián)的存儲(chǔ)器2030的有形介質(zhì)上的軟件來(lái)實(shí)現(xiàn),但是本領(lǐng)域普通技術(shù)人員將容易理解,所述一個(gè)或更多個(gè)程序以及/或者其一部分另選地可由除處理器2020以外的裝置來(lái)執(zhí)行,并且/或者可以以廣為人知的方式用固件或?qū)S糜布?lái)實(shí)現(xiàn)。例如,混合裝置1200的全部或部分可由軟件、硬件和/或固件的任意組合來(lái)實(shí)現(xiàn)。此外,盡管參照?qǐng)D13和圖14A至圖14B例示的流程圖描述了示例處理,但是本領(lǐng)域普通技術(shù)人員將容易理解,可另選地采用實(shí)現(xiàn)本文描述的示例方法和裝置的很多其他方法。例如,參照?qǐng)D13和圖14A至圖14B中例示的流程圖,可改變塊的執(zhí)行順序,并且/或者可對(duì)所描述的塊的一部分進(jìn)行改變、刪除、組合和/或?qū)⑵浼?xì)分為多個(gè)塊。
圖13中示出了例示用以實(shí)現(xiàn)圖12的示例混合裝置1200的示例處理1300的流程圖。如下面將更詳細(xì)地描述的,為了在根據(jù)圖13的示例的壓縮域中將與壓縮輔助數(shù)字位流1210相關(guān)聯(lián)的AAS源和與壓縮主數(shù)字位流1220相關(guān)聯(lián)的MAS源相組合,在AAS有效期間,將與AAS相關(guān)聯(lián)的壓縮音頻幀視為主要音頻源。然后對(duì)MAS音頻幀進(jìn)行解包以獲得其MDCT系數(shù)。在衰減(通常衰減10dB因數(shù))之后,采用從包括在對(duì)應(yīng)AAS幀中的壓縮信息獲得的步長(zhǎng)對(duì)MAS MDCT系數(shù)進(jìn)行重新量化。該量化得到AAS幀中的各MDCT系數(shù)的尾數(shù)變化值。實(shí)現(xiàn)對(duì)AAS幀中的AAS尾數(shù)的這些變化,得到將較低音量級(jí)處的MAS音頻信號(hào)與AAS音頻相混合。經(jīng)修改的AAS幀然后成為輸出壓縮數(shù)字位流1230。在AAS具有相對(duì)窄頻譜內(nèi)容的情況下,通過(guò)如圖14A至圖14B所示在壓縮之前將偽噪聲信號(hào)加入到AAS音頻信號(hào)中可容納MAS音頻信號(hào)的更寬頻譜內(nèi)容。偽噪聲的加入使得編碼處理(例如,其可通過(guò)AC-3編碼器來(lái)執(zhí)行)分配更多位來(lái)容納偽噪聲信號(hào)的更寬頻譜內(nèi)容,因而支持MAS音頻信號(hào)的頻譜內(nèi)容。
盡管下面對(duì)圖13的描述主要是針對(duì)AC-3壓縮位流的,但是圖13的示例以及本文描述的任何其他示例都可容易地應(yīng)用于諸如MPEG-AAC的其他壓縮技術(shù)。例如,圖13總體地例示了包含在如下步驟中的操作(1)對(duì)MAS壓縮位流進(jìn)行解包以生成各MAS“音頻塊”的MDCT系數(shù)(將其表示為AMAS);(2)對(duì)AAS壓縮位流進(jìn)行解包以生成各AAS“音頻塊”的MDCT系數(shù)(將其表示為BAAS);(3)將AMAS衰減一因數(shù)α以獲得MDCT系數(shù)αAMAS;(4)通過(guò)修改BAAS的尾數(shù)來(lái)將BAAS和αAMAS相組合;以及(5)對(duì)經(jīng)修改的幀進(jìn)行再打包并將其輸出。
轉(zhuǎn)向圖13,示例處理1300使得圖12中的示例混合裝置1200并行處理來(lái)自AAS的AC-3幀和來(lái)自MAS的AC-3幀,其中AAS對(duì)應(yīng)于壓縮輔助數(shù)字位流1210,而MAS對(duì)應(yīng)于壓縮主數(shù)字位流1220。在AAS的情況下,示例處理1300開(kāi)始于塊1304,在塊1304處混合裝置1200從壓縮輔助數(shù)字位流1210獲取壓縮AAS幀。然后,在塊1308處,混合裝置1200對(duì)包含在壓縮AAS幀中的AAS頭信息進(jìn)行解包,來(lái)例如確定壓縮AAS幀中存在的音頻聲道數(shù)。控制進(jìn)行到塊1312,在塊1312處混合裝置1200重置表示AAS幀中的AAS MDCT系數(shù)集的個(gè)數(shù)的計(jì)數(shù)器。接著,在塊1316處,混合裝置1200確定是否處理了幀中的所有MDCT系數(shù)集,這在AC-3編碼的情況下對(duì)應(yīng)于六個(gè)MDCT系數(shù)集。
如果在塊1316處混合裝置1200確定還沒(méi)有對(duì)所有的MDCT系數(shù)集進(jìn)行處理(例如,在AC-3編碼的情況下計(jì)數(shù)器不等于六),則控制進(jìn)行到塊1320和1324,在塊1320和1324處,針對(duì)各AAS MDCT系數(shù)集(或者,等同地,針對(duì)各AAS“音頻塊”),對(duì)相關(guān)聯(lián)的尾數(shù)和指數(shù)進(jìn)行解包,并根據(jù)對(duì)應(yīng)的經(jīng)解包的指數(shù)來(lái)確定系數(shù)量化步長(zhǎng)。可將各AAS MDCT系數(shù)的尾數(shù)的量化步長(zhǎng)例如存儲(chǔ)在存儲(chǔ)器(例如,圖15中的存儲(chǔ)器2030)內(nèi)的數(shù)據(jù)結(jié)構(gòu)中。該數(shù)據(jù)結(jié)構(gòu)還可包含幀中從AAS幀的開(kāi)始到特定尾數(shù)位置的實(shí)際位計(jì)數(shù)。另外或另選的是,可將關(guān)于AAS幀對(duì)應(yīng)于長(zhǎng)塊還是對(duì)應(yīng)于短塊的信息存儲(chǔ)在該數(shù)據(jù)結(jié)構(gòu)中。在完成了塊1320和1324處的處理之后,控制進(jìn)行到塊1328,在塊1328處混合裝置1200修改被處理的AAS幀中的各AAS尾數(shù),以反映AAS幀與對(duì)應(yīng)的MAS幀的混合。下面將更詳細(xì)地描述塊1328處執(zhí)行的處理。在完成了塊1328處的處理之后,控制接著進(jìn)行到塊1332,在塊1332處混合裝置1200遞增與AAS幀中的AAS MDCT系數(shù)集的個(gè)數(shù)相對(duì)應(yīng)的計(jì)數(shù)器。然后控制返回到塊1316。
在圖13的示例中與AAS并行地被處理的MAS的情況下,示例處理1300開(kāi)始于塊1354,在塊1354處混合裝置1200從壓縮主數(shù)字位流1220中獲取壓縮MAS幀。接著,在塊1358處,混合裝置1200對(duì)包括在壓縮MAS幀中的MAS頭信息進(jìn)行解包,以例如確定壓縮MAS幀中存在的音頻聲道的個(gè)數(shù)??刂七M(jìn)行到塊1362,在塊1362處混合裝置1200重置表示MAS幀中的MAS MDCT系數(shù)集的個(gè)數(shù)的計(jì)數(shù)器。接著,在塊1366處混合裝置1200確定是否處理了幀中的所有MDCT系數(shù)集,這在AC-3編碼的情況下對(duì)應(yīng)于六個(gè)MDCT系數(shù)集。
如果在塊1366處混合裝置1200確定還沒(méi)有對(duì)所有的MAS MDCT系數(shù)集進(jìn)行處理(例如,在AC-3編碼的情況下計(jì)數(shù)器不等于六),則控制進(jìn)行到塊1370,在塊1370處對(duì)MAS幀進(jìn)行解包以生成與各MASMDCT系數(shù)集(或者,等同地,各MAS“音頻塊”)相對(duì)應(yīng)的MAS MDCT系數(shù)集。然后控制進(jìn)行到塊1374,在塊1374處將MAS MDCT系數(shù)衰減一衰減因數(shù)(例如,3與10dB之間的因數(shù))。控制進(jìn)行到塊1378,在塊1378處通過(guò)將尾數(shù)值除以塊1320處確定的并且與AAS幀中的對(duì)應(yīng)頻率指數(shù)相關(guān)聯(lián)的適當(dāng)量化步長(zhǎng),以確定各衰減MAS MDCT系數(shù)的尾數(shù)。在塊1328處采用這些量化衰減MAS尾數(shù)來(lái)修改對(duì)應(yīng)的AAS尾數(shù),以反映MAS幀與AAS幀的混合。在完成了塊1378處的處理之后,控制接著進(jìn)行到塊1382,在塊1382處混合裝置1200遞增與MAS幀中的MAS MDCT系數(shù)集的個(gè)數(shù)相對(duì)應(yīng)的計(jì)數(shù)器。然后控制返回到塊1366。
然而如果在塊1316和1366處混合裝置1200分別確定處理了所獲得的AAS和MAS幀的所有AAS MDCT系數(shù)和MAS MDCT系數(shù),則控制隨后進(jìn)行到塊1390,在塊1390處混合裝置120對(duì)經(jīng)修改的AAS MDCT系數(shù)進(jìn)行再打包以形成混合AC-3音頻幀。然后控制進(jìn)行到塊1394,在塊1394處混合裝置1200輸出要包含在壓縮混合數(shù)字位流1230中的混合AC-3音頻幀。
為了更好地理解圖13中的示例處理1300執(zhí)行的處理,考慮如下示例操作,其中以4位來(lái)表示在塊1328處的AAS MDCT系數(shù),這得到在-1.0到1.0范圍內(nèi)的15級(jí)量化的尾數(shù)。出于該示例的目的假設(shè)AAS MDCT系數(shù)的原始尾數(shù)值為-4.0/15=-0.2666。然后,根據(jù)圖6中示出的示例AC-3量化查找表600,與原始AAS尾數(shù)相對(duì)應(yīng)的位模式為0101(十進(jìn)制數(shù)5)。接著,出于該示例的目的假設(shè)在塊1378處確定的經(jīng)衰減MAS尾數(shù)值等于-0.1634。該衰減的MAS尾數(shù)值造成對(duì)AAS尾數(shù)的相應(yīng)變化,使得在塊1328處確定中間(新)修改AAS尾數(shù)值等于-0.4300,其在量化查找表600中位于量化值-8/15=-0.5333與-6/15=-0.4之間。值-6/15最接近于中間修改AAS尾數(shù)值-0.4300,因此在塊1328處選擇位模式0100(十進(jìn)制數(shù)4)來(lái)替代用于表示原始AAS尾數(shù)的原始碼,以生成所得混合MDCT系數(shù)。
在以上示例中,如果在塊1328處確定的中間修改尾數(shù)值位于可選尾數(shù)值范圍以外(例如,在量化表600中的±14/15范圍之外),則適當(dāng)?shù)赜膳c可選尾數(shù)值的正限或負(fù)限相對(duì)應(yīng)的位模式來(lái)表示由塊1328輸出的尾數(shù)。另選的是,可以改變指數(shù)來(lái)得到更小的所需尾數(shù)值,但是這種指數(shù)變化是所不希望的,因?yàn)檫@將需要重復(fù)包括掩蔽計(jì)算在內(nèi)的整個(gè)編碼/壓縮算法。此外,由于將混合尾數(shù)值限于許可上限和下限范圍內(nèi)而造成的任何誤差都可能對(duì)MAS的音頻質(zhì)量造成可以忽略的影響。具體來(lái)說(shuō),在畫(huà)外音混合中,由于將MAS的音頻級(jí)衰減到相對(duì)較低的值,所以由于對(duì)尾數(shù)值改變的強(qiáng)制限制導(dǎo)致的誤差通常對(duì)音頻質(zhì)量具有相對(duì)可忽略的影響。
在一些情況下,AAS主要是頻譜范圍主要限于低頻段的語(yǔ)音信號(hào),由此可采用相對(duì)較少的位來(lái)表示更高頻率分量。在這種情況下,例如主要是音樂(lè)并且較高頻譜內(nèi)容豐富的MAS可能由于AAS采用的量化處理而導(dǎo)致較高頻譜能量的損失。圖14A至圖14B分別例示了改進(jìn)處理1400和1450,它們可用來(lái)通過(guò)在壓縮之前將已知的偽白噪聲與時(shí)域AAS信號(hào)相混合來(lái)人工地提高AAS音頻的頻譜保真度。由于所加入的偽白噪聲,AC-3編碼器將在可用來(lái)表示MAS音頻的較高頻譜內(nèi)容的較寬頻譜范圍上分配更多的尾數(shù)位,由此減少對(duì)音頻質(zhì)量的影響。在混合處理期間,可通過(guò)適當(dāng)?shù)臏p法處理來(lái)消除已知的偽白噪聲的影響。
轉(zhuǎn)向圖14A,處理1400對(duì)時(shí)域AAS信號(hào)進(jìn)行操作,并開(kāi)始于塊1404,在塊1404處,處理1400確定要加入到時(shí)域AAS信號(hào)中的偽噪聲時(shí)域樣本。偽噪聲樣本可通過(guò)處理1400基于任何已知的偽噪聲生成算法來(lái)生成,或者通過(guò)處理1400預(yù)先生成、存儲(chǔ)在存儲(chǔ)器(例如,圖15中的存儲(chǔ)器2030)中,并從該存儲(chǔ)器中讀取??缮蓳碛蓄l譜范圍比由處理1400處理的時(shí)域AAS信號(hào)更寬的頻譜特性的偽噪聲樣本。接著,在塊1408處,處理1400將偽噪聲時(shí)域樣本加入到AAS時(shí)域樣本中。最后,控制進(jìn)行到塊1412,在塊1412處,處理1400對(duì)由將偽噪聲時(shí)域樣本加入到原始AAS時(shí)域信號(hào)中而得到的時(shí)域信號(hào)進(jìn)行壓縮。在處理了全部AAS時(shí)域樣本后,處理1400結(jié)束。
轉(zhuǎn)向圖14B,將對(duì)圖13中的示例處理1300的改進(jìn)例示為要在處理1300的塊1374和1378之間執(zhí)行的塊1450。塊1450用來(lái)取消在圖14A的示例處理1400的塊1408處加入偽噪聲時(shí)域樣本的效果。在圖14B中,在塊1374處衰減了MAS MDCT系數(shù)之后,控制處理1300進(jìn)行到塊1450。在塊1450處,作為由處理1300的塊1378和1328執(zhí)行的混合處理的一部分,從經(jīng)衰減的MAS MDCT系數(shù)中減去偽噪聲樣本的影響以使得去除偽噪聲。本領(lǐng)域普通技術(shù)人員將理解,可通過(guò)很多方式從經(jīng)衰減的MASMDCT系數(shù)中減去偽噪聲樣本的影響。在一個(gè)示例中,可將已知的偽噪聲時(shí)域樣本存儲(chǔ)在圖12的混合裝置1200中,使得混合裝置可適當(dāng)?shù)貙?duì)經(jīng)時(shí)間對(duì)準(zhǔn)的偽噪聲樣本進(jìn)行MDCT變換,來(lái)生成要從經(jīng)衰減的MASMDCT系數(shù)中減去的偽噪聲MDCT系數(shù)。在另一示例中,混合裝置1220可存儲(chǔ)與偽噪聲樣本的平均頻譜特性相對(duì)應(yīng)的平均偽噪聲MDCT系數(shù)集,由此緩解對(duì)實(shí)時(shí)計(jì)算偽噪聲MDCT系數(shù)或?qū)崿F(xiàn)時(shí)間對(duì)準(zhǔn)以選擇用于MDCT變換的適當(dāng)偽噪聲樣本的需求。在任何情況下,在塊1450處從MAS MDCT系數(shù)中減去偽噪聲樣本的影響之后,控制進(jìn)行到塊1378及其之后的塊,以實(shí)現(xiàn)以上關(guān)于圖13描述的混合處理。
圖15是可用來(lái)實(shí)現(xiàn)本文所公開(kāi)的方法和裝置的示例處理器系統(tǒng)2000的框圖。處理器系統(tǒng)2000可以是臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)、筆記本計(jì)算機(jī)、個(gè)人數(shù)字助理(PDA)、服務(wù)器、因特網(wǎng)設(shè)備或任何其他類(lèi)型的計(jì)算設(shè)備。
圖15中例示的處理器系統(tǒng)2000包括芯片組2010,芯片組2010包括存儲(chǔ)器控制器2012和輸入/輸出(I/O)控制器2014。如廣為公知的,芯片組通常提供存儲(chǔ)器和I/O管理功能,以及可由處理器2020訪問(wèn)或使用的多個(gè)通用和/或?qū)S眉拇嫫?、定時(shí)器等。采用一個(gè)或更多個(gè)處理器來(lái)實(shí)現(xiàn)處理器2020。在另選情況下,可采用其他處理技術(shù)來(lái)實(shí)現(xiàn)處理器2020。處理器2020包括緩沖存儲(chǔ)器2022,該緩沖存儲(chǔ)器2022可采用一級(jí)統(tǒng)一緩沖存儲(chǔ)器(L1)、二級(jí)統(tǒng)一緩沖存儲(chǔ)器(L2)、三級(jí)統(tǒng)一緩沖存儲(chǔ)器(L3)、以及/或者任何其他適合存儲(chǔ)數(shù)據(jù)的結(jié)構(gòu)來(lái)實(shí)現(xiàn)。
常規(guī)上,存儲(chǔ)器控制器2012執(zhí)行如下功能使得處理器2020能夠經(jīng)由總線2040訪問(wèn)包括易失性存儲(chǔ)器2032和非易失性存儲(chǔ)器2034的主存儲(chǔ)器2030,并與之通信。易失性存儲(chǔ)器2032可通過(guò)同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(SDRAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)、RAMBUS動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(RDRAM)、和/或任何其他類(lèi)型的隨機(jī)存取存儲(chǔ)器設(shè)備來(lái)實(shí)現(xiàn)。非易失性存儲(chǔ)器2034可使用閃存、只讀存儲(chǔ)器(ROM)、電子可擦寫(xiě)可編程只讀存儲(chǔ)器(EEPROM)、和/或任何其他理想類(lèi)型的存儲(chǔ)器設(shè)備來(lái)實(shí)現(xiàn)。
處理器系統(tǒng)2000還包括連接到總線2040的接口電路2050。該接口電路2050可采用諸如以太網(wǎng)接口、通用串行總線(USB)、第三代輸入/輸出接口(3GIO)接口、和/或任何其他適合類(lèi)型接口的任何類(lèi)型的已知接口標(biāo)準(zhǔn)來(lái)實(shí)現(xiàn)。
一個(gè)或更多個(gè)輸入設(shè)備2060連接到接口電路2050。輸入設(shè)備2060允許用戶(hù)輸入數(shù)據(jù)和命令到處理器2020中。例如,輸入設(shè)備2060可由鍵盤(pán)、鼠標(biāo)、觸敏顯示器、跟蹤板、跟蹤球、isopoint、和/或語(yǔ)音識(shí)別系統(tǒng)來(lái)實(shí)現(xiàn)。
一個(gè)或更多個(gè)輸出設(shè)備2070也連接到接口電路2050。例如,輸出設(shè)備2070可由媒體呈現(xiàn)設(shè)備(例如,發(fā)光顯示器(LED)、液晶顯示器(LCD)、陰極射線管(CRT)顯示器、打印機(jī)和/或揚(yáng)聲器)來(lái)實(shí)現(xiàn)。接口電路2050由此通常除其他事物之外還包括圖形驅(qū)動(dòng)器卡。
處理器系統(tǒng)2000還包括一個(gè)或更多個(gè)大容量存儲(chǔ)設(shè)備2080來(lái)存儲(chǔ)軟件和數(shù)據(jù)。這種大容量存儲(chǔ)設(shè)備2080的示例包括軟盤(pán)和驅(qū)動(dòng)器、硬盤(pán)驅(qū)動(dòng)器、光盤(pán)和驅(qū)動(dòng)器、以及數(shù)字多功能盤(pán)(DVD)和驅(qū)動(dòng)器。
接口電路2050還包括諸如調(diào)制解調(diào)器或網(wǎng)絡(luò)接口卡的通信設(shè)備,以便于經(jīng)由網(wǎng)絡(luò)與外部計(jì)算機(jī)交換數(shù)據(jù)。處理器系統(tǒng)2000與網(wǎng)絡(luò)之間的通信鏈接可以是任意類(lèi)型的網(wǎng)絡(luò)連接,例如以太網(wǎng)連接、數(shù)字用戶(hù)線(DSL)、電話線、蜂窩式電話系統(tǒng)、同軸線纜等。
對(duì)輸入設(shè)備2060、輸出設(shè)備2070、大容量存儲(chǔ)設(shè)備2080和/或網(wǎng)絡(luò)的訪問(wèn)通常是由I/O控制器2014按照傳統(tǒng)方式控制的。具體來(lái)說(shuō),I/O控制器2014執(zhí)行以下功能,即,使得處理器2020能夠經(jīng)由總線2040和接口電路2050與輸入設(shè)備2060、輸出設(shè)備2070、大容量存儲(chǔ)設(shè)備2080和/或網(wǎng)絡(luò)進(jìn)行通信。
盡管在處理器系統(tǒng)2000內(nèi)將圖15中示出的組件描述為分立的塊,但也可將由這些塊中的一些執(zhí)行的功能集成在單個(gè)半導(dǎo)體電路內(nèi),或者可采用兩個(gè)或更多個(gè)分立的集成電路來(lái)實(shí)現(xiàn)。例如,盡管在芯片組2010內(nèi)將存儲(chǔ)器控制器2012和I/O控制器2014描述為分立的塊,但也可將存儲(chǔ)器控制器2012和I/O控制器2014集成在單個(gè)半導(dǎo)體電路內(nèi)。
本文公開(kāi)的方法和裝置尤其適用于按照AC-3標(biāo)準(zhǔn)執(zhí)行的數(shù)字位流。然而,本文公開(kāi)的方法和裝置可應(yīng)用于其他數(shù)字音頻編碼技術(shù)。
另外,盡管本公開(kāi)是針對(duì)示例電視和無(wú)線電廣播系統(tǒng)而做出的,但是應(yīng)當(dāng)理解,所公開(kāi)的系統(tǒng)可容易地應(yīng)用于很多其他媒體系統(tǒng)。因此,盡管本公開(kāi)描述了示例系統(tǒng)和處理,但是所公開(kāi)的示例也并非實(shí)現(xiàn)這種系統(tǒng)的唯一方式。
盡管本文描述了特定示例方法、裝置及制造品,但是本專(zhuān)利的覆蓋范圍并不限于此。相反,本專(zhuān)利覆蓋字面上或在等同原則下完全落入所附權(quán)利要求范圍內(nèi)的所有方法、裝置及制造品。例如,盡管本公開(kāi)描述了除了其他組件還包括在硬件上執(zhí)行的軟件的示例系統(tǒng),但是應(yīng)當(dāng)注意,這種系統(tǒng)僅僅是例示性的,且不應(yīng)被視為限制。具體來(lái)說(shuō),應(yīng)當(dāng)想到,所公開(kāi)的硬件和軟件組件中的任一個(gè)或全部可完全由專(zhuān)用硬件、完全由固件、完全由軟件、或者由硬件、固件和/或軟件的某種組合來(lái)實(shí)現(xiàn)。
本專(zhuān)利要求于2004年7月2提交的題為“壓縮位流的混合系統(tǒng)及方法”且序列號(hào)為60/585115的美國(guó)臨時(shí)申請(qǐng)和于2004年7月8日提交的題為“壓縮位流的混合系統(tǒng)及方法”且序列號(hào)為60/586354的美國(guó)臨時(shí)申請(qǐng)的優(yōu)先權(quán)。本申請(qǐng)還涉及于2004年6月14日提交的題為“嵌入水印的方法及裝置”的第PCT/US04/18953號(hào)國(guó)際專(zhuān)利申請(qǐng)。在此通過(guò)引用并入序列號(hào)為60/585115的美國(guó)臨時(shí)申請(qǐng)、序列號(hào)為60/586354的美國(guó)臨時(shí)申請(qǐng)和第PCT/US04/18953號(hào)國(guó)際專(zhuān)利申請(qǐng)的全部?jī)?nèi)容。
權(quán)利要求
1.一種用于將第一壓縮數(shù)字位流與第二數(shù)字位流相混合的方法,該方法包括以下步驟獲取與所述第一壓縮數(shù)字位流相關(guān)聯(lián)的幀;對(duì)所述幀進(jìn)行解包以獲得多個(gè)原始變換系數(shù)集;以及修改所述多個(gè)原始變換系數(shù)集以將所述第二數(shù)字位流與所述第一壓縮數(shù)字位流相混合。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述修改所述多個(gè)原始變換系數(shù)集的步驟包括確定與多個(gè)混合變換系數(shù)集之一的混合變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼;并且用與所述混合變換系數(shù)相關(guān)聯(lián)的所述第一尾數(shù)碼來(lái)代替與所述多個(gè)原始變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的第二尾數(shù)碼。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述確定與多個(gè)混合變換系數(shù)集之一的混合變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼的步驟包括確定與所述多個(gè)原始變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的量化步長(zhǎng);基于將和所述第一壓縮數(shù)字位流相關(guān)聯(lián)的元素與和所述第二數(shù)字位流相關(guān)聯(lián)的元素相組合,來(lái)生成所述混合變換系數(shù);基于所述量化步長(zhǎng)來(lái)對(duì)所述混合變換系數(shù)進(jìn)行量化以生成量化尾數(shù);并且基于所述量化尾數(shù)來(lái)確定與所述混合變換系數(shù)相關(guān)聯(lián)的所述第一尾數(shù)碼。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述量化步長(zhǎng)基于與所述對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的指數(shù)。
5.根據(jù)權(quán)利要求3所述的方法,其中,所述將和所述第一壓縮數(shù)字位流相關(guān)聯(lián)的元素與和所述第二數(shù)字位流相關(guān)聯(lián)的元素相組合的步驟包括將和所述第一壓縮數(shù)字位流相關(guān)聯(lián)的所述元素與和所述第二數(shù)字位流相關(guān)聯(lián)的所述元素相加。
6.根據(jù)權(quán)利要求5所述的方法,該方法進(jìn)一步包括以下步驟在將所述第一壓縮數(shù)字位流的所述元素和所述第二數(shù)字位流的所述元素相加之前,對(duì)所述第一壓縮數(shù)字位流的所述元素或所述第二數(shù)字位流的所述元素中的至少一個(gè)進(jìn)行衰減。
7.根據(jù)權(quán)利要求1所述的方法,其中,所述修改所述多個(gè)原始變換系數(shù)集的步驟包括基于所述多個(gè)原始變換系數(shù)集來(lái)生成多個(gè)時(shí)域音頻塊;基于所述多個(gè)時(shí)域音頻塊來(lái)生成多個(gè)重構(gòu)音頻塊;并且基于所述多個(gè)重構(gòu)音頻塊和所述第二數(shù)字位流來(lái)生成多個(gè)混合音頻塊。
8.根據(jù)權(quán)利要求7所述的方法,其中,所述基于所述多個(gè)時(shí)域音頻塊來(lái)生成多個(gè)重構(gòu)音頻塊的步驟包括基于第一時(shí)域音頻塊和第二時(shí)域音頻塊來(lái)生成重構(gòu)時(shí)域音頻塊。
9.根據(jù)權(quán)利要求8所述的方法,其中,所述基于第一時(shí)域音頻塊和第二時(shí)域音頻塊生成重構(gòu)時(shí)域音頻塊的步驟包括將所述第一時(shí)域音頻塊與所述第二時(shí)域音頻塊相加。
10.根據(jù)權(quán)利要求1所述的方法,其中,所述修改多個(gè)變換系數(shù)集的步驟包括基于多個(gè)混合變換系數(shù)集來(lái)修改所述多個(gè)原始變換系數(shù)集。
11.根據(jù)權(quán)利要求10所述的方法,該方法進(jìn)一步包括通過(guò)基于與所述第一壓縮數(shù)字位流相關(guān)聯(lián)的壓縮信息確定與所述多個(gè)混合變換系數(shù)集中的每一個(gè)的混合變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼,來(lái)生成多個(gè)混合系數(shù)集。
12.根據(jù)權(quán)利要求1所述的方法,其中,所述多個(gè)原始變換系數(shù)集中的每一個(gè)都包括一個(gè)或更多個(gè)改進(jìn)離散余弦變換系數(shù)。
13.根據(jù)權(quán)利要求1所述的方法,其中,所述第一壓縮數(shù)字位流是根據(jù)音頻壓縮標(biāo)準(zhǔn)進(jìn)行壓縮的。
14.根據(jù)權(quán)利要求1所述的方法,其中,所述獲取與所述第一壓縮數(shù)字位流相關(guān)聯(lián)的幀的步驟包括獲取與多個(gè)音頻聲道中的至少一個(gè)相關(guān)聯(lián)的音頻塊。
15.根據(jù)權(quán)利要求1所述的方法,其中,所述對(duì)所述幀進(jìn)行解包以獲得多個(gè)原始變換系數(shù)集的步驟包括確定與所述第一壓縮數(shù)字位流相關(guān)聯(lián)的壓縮信息。
16.根據(jù)權(quán)利要求1所述的方法,該方法進(jìn)一步包括基于多個(gè)混合變換系數(shù)集對(duì)所述幀進(jìn)行再打包。
17.根據(jù)權(quán)利要求1所述的方法,其中,所述第一壓縮數(shù)字位流對(duì)應(yīng)于主音頻服務(wù),所述第二數(shù)字位流對(duì)應(yīng)于輔助音頻服務(wù)。
18.根據(jù)權(quán)利要求1所述的方法,其中,所述第二數(shù)字位流是經(jīng)壓縮的。
19.根據(jù)權(quán)利要求18所述的方法,其中,在壓縮之前將偽噪聲信號(hào)加入到所述第二數(shù)字位流中。
20.根據(jù)權(quán)利要求19所述的方法,其中,所述修改所述多個(gè)原始變換系數(shù)集的步驟包括確定與多個(gè)偽噪聲變換系數(shù)集之一的偽噪聲變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼;并且基于所述第一尾數(shù)碼修改與所述多個(gè)原始變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的第二尾數(shù)碼。
21.根據(jù)權(quán)利要求20所述的方法,其中,所述多個(gè)偽噪聲變換系數(shù)集是基于所述偽噪聲信號(hào)的平均頻譜特性來(lái)確定的。
22.一種數(shù)據(jù)流混合裝置,該數(shù)據(jù)流混合裝置包括獲取單元,用于獲取與第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的幀;解包單元,用于對(duì)所述幀進(jìn)行解包以獲得多個(gè)原始變換系數(shù)集;以及修改單元,用于修改所述多個(gè)原始變換系數(shù)集以將第二數(shù)字?jǐn)?shù)據(jù)流與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相混合。
23.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述修改單元被配置為確定與多個(gè)混合變換系數(shù)集之一的混合變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼;并且用與所述混合變換系數(shù)相關(guān)聯(lián)的所述第一尾數(shù)碼來(lái)代替與所述多個(gè)變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的第二尾數(shù)碼。
24.根據(jù)權(quán)利要求23所述的數(shù)據(jù)流混合裝置,其中,所述修改單元被配置為確定與所述多個(gè)原始變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的量化步長(zhǎng);基于和所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的元素與和所述第二數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的元素的組合,來(lái)生成所述混合變換系數(shù);基于所述量化步長(zhǎng)來(lái)對(duì)所述混合變換系數(shù)進(jìn)行量化以生成量化尾數(shù);并且基于所述量化尾數(shù)來(lái)確定與所述混合變換系數(shù)相關(guān)聯(lián)的所述第一尾數(shù)碼。
25.根據(jù)權(quán)利要求24所述的數(shù)據(jù)流混合裝置,其中,所述量化步長(zhǎng)基于與所述對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的指數(shù)。
26.根據(jù)權(quán)利要求24所述的數(shù)據(jù)流混合裝置,其中,和所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的元素與和所述第二數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的元素的組合包括將和所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的所述元素與和所述第二數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的所述元素相加。
27.根據(jù)權(quán)利要求26所述的數(shù)據(jù)流混合裝置,其中,和所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的元素與和所述第二數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的元素的組合進(jìn)一步包括在將和所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的所述元素與和所述第二數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的所述元素相加之前,對(duì)和所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的所述元素或和所述第二數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的所述元素中的至少一個(gè)進(jìn)行衰減。
28.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述修改單元被配置為基于所述多個(gè)原始變換系數(shù)集來(lái)生成多個(gè)時(shí)域音頻塊;基于所述多個(gè)時(shí)域音頻塊來(lái)生成多個(gè)重構(gòu)音頻塊;并且基于所述多個(gè)重構(gòu)音頻塊和所述第二數(shù)字?jǐn)?shù)據(jù)流來(lái)生成多個(gè)混合音頻塊。
29.根據(jù)權(quán)利要求28所述的數(shù)據(jù)流混合裝置,其中,所述修改單元被配置為基于所述多個(gè)時(shí)域音頻塊中的第一時(shí)域音頻塊和第二時(shí)域音頻塊來(lái)生成所述多個(gè)重構(gòu)音頻塊中的一重構(gòu)時(shí)域音頻塊。
30.根據(jù)權(quán)利要求29所述的數(shù)據(jù)流混合裝置,其中,所述修改單元被配置為將所述第一時(shí)域音頻塊和所述第二時(shí)域音頻塊相加以生成重構(gòu)時(shí)域音頻塊。
31.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述修改單元被配置為基于多個(gè)混合變換系數(shù)集來(lái)修改所述多個(gè)原始變換系數(shù)集。
32.根據(jù)權(quán)利要求31所述的數(shù)據(jù)流混合裝置,其中,所述修改單元進(jìn)一步被配置為基于所述第二數(shù)字?jǐn)?shù)據(jù)流和與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的壓縮信息,來(lái)生成所述多個(gè)混合變換系數(shù)集。
33.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述多個(gè)原始變換系數(shù)集中的每一個(gè)都包括一個(gè)或更多個(gè)改進(jìn)離散余弦變換系數(shù)。
34.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流是根據(jù)音頻壓縮標(biāo)準(zhǔn)進(jìn)行壓縮的。
35.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述獲取單元被配置為獲取與多個(gè)音頻聲道相關(guān)聯(lián)的音頻塊。
36.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述解包單元被配置為獲得與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的壓縮信息。
37.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流與主音頻服務(wù)相關(guān)聯(lián),所述第二數(shù)字?jǐn)?shù)據(jù)流與輔助音頻服務(wù)相關(guān)聯(lián)。
38.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,該數(shù)據(jù)流混合裝置進(jìn)一步包括再打包單元,該再打包單元用于基于多個(gè)混合變換系數(shù)集對(duì)所述幀進(jìn)行再打包。
39.一種存儲(chǔ)有可機(jī)讀指令的制造品,所述可機(jī)讀指令在執(zhí)行時(shí)使得機(jī)器進(jìn)行以下操作獲取與第一壓縮數(shù)字位流相關(guān)聯(lián)的幀;對(duì)所述幀進(jìn)行解包以獲得多個(gè)原始變換系數(shù)集;以及修改所述多個(gè)原始變換系數(shù)集以將第二數(shù)字位流與所述第一壓縮數(shù)字位流相混合。
40.根據(jù)權(quán)利要求39所述的制造品,其中,所述指令在執(zhí)行時(shí)使得所述機(jī)器通過(guò)以下步驟來(lái)修改所述多個(gè)原始變換系數(shù)集確定與多個(gè)混合變換系數(shù)集之一的混合變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼;并且用與所述混合變換系數(shù)相關(guān)聯(lián)的所述第一尾數(shù)碼來(lái)代替與所述多個(gè)原始變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的第二尾數(shù)碼。
41.根據(jù)權(quán)利要求40所述的制造品,其中,所述指令在執(zhí)行時(shí)使得所述機(jī)器通過(guò)以下步驟來(lái)確定與所述多個(gè)混合變換系數(shù)集之一的混合變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼確定與所述多個(gè)原始變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的量化步長(zhǎng);基于將和所述第一壓縮數(shù)字位流相關(guān)聯(lián)的元素與和所述第二數(shù)字位流相關(guān)聯(lián)的元素相組合,來(lái)生成所述混合變換系數(shù);基于所述量化步長(zhǎng)來(lái)對(duì)所述混合變換系數(shù)進(jìn)行量化以生成量化尾數(shù);并且基于所述量化尾數(shù)來(lái)確定與所述混合變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼。
42.根據(jù)權(quán)利要求39所述的制造品,其中,所述指令在執(zhí)行時(shí)使得所述機(jī)器通過(guò)以下步驟來(lái)修改所述多個(gè)原始變換系數(shù)集基于所述多個(gè)原始變換系數(shù)集來(lái)生成多個(gè)時(shí)域音頻塊;基于所述多個(gè)時(shí)域音頻塊來(lái)生成多個(gè)重構(gòu)音頻塊;并且基于所述多個(gè)重構(gòu)音頻塊和所述第二數(shù)字位流來(lái)生成多個(gè)混合音頻塊。
43.根據(jù)權(quán)利要求39所述的制造品,其中,所述指令在執(zhí)行時(shí)進(jìn)一步使得所述機(jī)器執(zhí)行以下操作通過(guò)基于與所述第一壓縮數(shù)字位流相關(guān)聯(lián)的壓縮信息確定與多個(gè)混合系數(shù)集中的每一個(gè)的混合變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼,來(lái)生成所述多個(gè)混合系數(shù)集。
44.根據(jù)權(quán)利要求39所述的制造品,其中,所述指令在執(zhí)行時(shí)進(jìn)一步使得所述機(jī)器執(zhí)行以下操作通過(guò)獲取與多個(gè)音頻聲道中的至少一個(gè)相關(guān)聯(lián)的音頻塊,來(lái)獲取與所述第一壓縮數(shù)字位流相關(guān)聯(lián)的幀。
45.根據(jù)權(quán)利要求39所述的制造品,其中,所述指令使得所述機(jī)器執(zhí)行以下操作通過(guò)識(shí)別與所述第一壓縮數(shù)字位流相關(guān)聯(lián)的壓縮信息,對(duì)所述幀進(jìn)行解包以獲得所述多個(gè)原始變換系數(shù)集。
46.根據(jù)權(quán)利要求39所述的制造品,其中,所述指令在執(zhí)行時(shí)進(jìn)一步使得所述機(jī)器執(zhí)行以下操作基于多個(gè)混合變換系數(shù)集對(duì)所述幀進(jìn)行再打包。
47.根據(jù)權(quán)利要求39所述的制造品,其中,所述第一壓縮數(shù)字位流與主音頻服務(wù)相關(guān)聯(lián),所述第二數(shù)字位流與輔助音頻服務(wù)相關(guān)聯(lián)。
48.一種用于混合數(shù)字?jǐn)?shù)據(jù)流的系統(tǒng),該系統(tǒng)包括第一源,用于提供第一壓縮數(shù)字?jǐn)?shù)據(jù)流;第二源,用于提供第二數(shù)字?jǐn)?shù)據(jù)流;以及混合裝置,用于無(wú)需對(duì)所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流進(jìn)行解壓縮地將所述第二數(shù)字?jǐn)?shù)據(jù)流與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相混合。
49.根據(jù)權(quán)利要求48所述的系統(tǒng),其中,所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流包括多個(gè)變換系數(shù)。
50.根據(jù)權(quán)利要求49所述的系統(tǒng),其中,所述混合裝置被配置為基于所述第二數(shù)字?jǐn)?shù)據(jù)流修改所述多個(gè)變換系數(shù)。
51.根據(jù)權(quán)利要求50所述的系統(tǒng),其中,所述多個(gè)變換系數(shù)包括相應(yīng)的多個(gè)原始尾數(shù)和原始指數(shù),所述混合裝置被配置為僅修改所述多個(gè)原始尾數(shù)以修改所述多個(gè)變換系數(shù)。
52.根據(jù)權(quán)利要求51所述的系統(tǒng),其中,所述多個(gè)變換系數(shù)是多個(gè)原始變換系數(shù),所述混合裝置被配置為通過(guò)基于所述第二數(shù)字?jǐn)?shù)據(jù)流和與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的壓縮信息確定多個(gè)混合變換系數(shù),來(lái)修改所述多個(gè)原始變換系數(shù)。
53.根據(jù)權(quán)利要求52所述的系統(tǒng),其中,所述壓縮信息包括至少一個(gè)量化步長(zhǎng)。
54.根據(jù)權(quán)利要求52所述的系統(tǒng),其中,確定所述多個(gè)混合變換系數(shù)包括對(duì)與所述多個(gè)混合變換系數(shù)相關(guān)聯(lián)的多個(gè)混合尾數(shù)進(jìn)行量化。
55.根據(jù)權(quán)利要求54所述的系統(tǒng),其中,所述混合裝置被配置為基于所述多個(gè)量化混合尾數(shù)和所述壓縮信息來(lái)修改所述多個(gè)原始尾數(shù)。
56.根據(jù)權(quán)利要求48所述的系統(tǒng),其中,所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流是根據(jù)音頻壓縮標(biāo)準(zhǔn)來(lái)壓縮的。
57.根據(jù)權(quán)利要求48所述的系統(tǒng),其中,所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流與主音頻服務(wù)相關(guān)聯(lián),所述第二數(shù)字?jǐn)?shù)據(jù)流與輔助數(shù)據(jù)服務(wù)相關(guān)聯(lián)。
58.根據(jù)權(quán)利要求48所述的系統(tǒng),其中,所述第二數(shù)字?jǐn)?shù)據(jù)流是非壓縮的。
59.一種用于將第一壓縮數(shù)字?jǐn)?shù)據(jù)流與第二數(shù)字?jǐn)?shù)據(jù)流相組合的方法,該方法包括以下步驟獲取與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的幀;對(duì)所述幀進(jìn)行解包以獲得多個(gè)原始變換系數(shù)集;以及修改所述多個(gè)原始變換系數(shù)集以將所述第二數(shù)字?jǐn)?shù)據(jù)流與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相組合。
60.根據(jù)權(quán)利要求59所述的方法,其中,所述組合包括混合,并且其中,所述修改所述多個(gè)原始變換系數(shù)集以將所述第二數(shù)字?jǐn)?shù)據(jù)流與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相組合的步驟包括修改所述多個(gè)原始變換系數(shù)集以將所述第二數(shù)字?jǐn)?shù)據(jù)流與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相混合。
61.根據(jù)權(quán)利要求59所述的方法,其中,所述修改所述多個(gè)原始變換系數(shù)集的步驟包括確定與多個(gè)混合變換系數(shù)集之一的混合變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼;并且用與所述混合變換系數(shù)相關(guān)聯(lián)的所述第一尾數(shù)碼來(lái)代替與所述多個(gè)原始變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的第二尾數(shù)碼。
62.根據(jù)權(quán)利要求59所述的方法,其中,所述多個(gè)原始變換系數(shù)集中的每一個(gè)都包括一個(gè)或更多個(gè)改進(jìn)離散余弦變換系數(shù)。
全文摘要
本發(fā)明公開(kāi)了用于混合(200)壓縮數(shù)字位流(230)的方法、裝置及制造品。本文公開(kāi)的示例方法包括以下步驟獲取與第一壓縮數(shù)字位流(220)相關(guān)聯(lián)的幀;對(duì)該幀進(jìn)行解包以獲得多個(gè)原始變換系數(shù)集;以及修改所述多個(gè)原始變換系數(shù)集來(lái)將第二數(shù)字位流(210)與所述第一壓縮數(shù)字位流(220)相混合。
文檔編號(hào)G06K9/46GK1993700SQ200580026107
公開(kāi)日2007年7月4日 申請(qǐng)日期2005年6月29日 優(yōu)先權(quán)日2004年7月2日
發(fā)明者韋努戈帕爾·斯里尼瓦桑, 約翰·C·派弗 申請(qǐng)人:尼爾遜媒介研究股份有限公司