專利名稱:音響編碼裝置、音響解碼裝置、音響編碼解碼裝置及會(huì)議系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在多聲道音響編碼技術(shù)以及多聲道音響解碼技術(shù)中、實(shí)現(xiàn)更低延遲的 編碼處理以及解碼處理的裝置。作為該技術(shù)的應(yīng)用,本發(fā)明能夠適用于家庭影院系統(tǒng)、車載 音響系統(tǒng)、電子游戲系統(tǒng)、會(huì)議系統(tǒng)以及便攜電話等。
背景技術(shù):
在將多聲道音響信號(hào)編碼的方式中,存在杜比-數(shù)字方式以及MPEG(M0ving Pictures Experts Group,運(yùn)動(dòng)圖像專家組)-AAC (Advanced AudioCoding,高級(jí)音頻編碼) 方式等。這些編碼方式,基本上通過(guò)將多聲道音響信號(hào)中的各聲道的音響信號(hào)分別編碼,來(lái) 實(shí)現(xiàn)多聲道音響信號(hào)的傳送。這些編碼方式,被稱為離散多聲道編碼,并能夠與5. 1聲道配 合而在實(shí)用上將比特率為384kbps左右作為下限,來(lái)進(jìn)行編碼。另一方面,作為完全不同的方法,存在將多聲道音響信號(hào)編碼而進(jìn)行傳送的空間 音頻編碼技術(shù)(SAC =Spatial-CueAudio Coding)。作為SAC方式的一個(gè)例子,存在MPEG環(huán)繞 方式。如非專利文獻(xiàn)1所記載的那樣,MPEG環(huán)繞方式為如下方式將多聲道音響信號(hào)降混到 1或2聲道的音響信號(hào)中,并用MPEG-AAC方式(非專利文獻(xiàn)2)以及HE (High-Eff iciency, 高效)-AAC方式(非專利文獻(xiàn)3)等,將該1或2聲道的音響信號(hào)、即降混信號(hào)進(jìn)行編碼,由 此生成降混編碼串,同時(shí)將根據(jù)各聲道之間的信號(hào)生成的空間信息(SpatialCue)附加到 上述降混編碼串中。在空間信息(SpatialCue)中含有表示降混信號(hào)與原來(lái)輸入的各聲道信號(hào)的相關(guān) 值、功率比以及相位的差異等的關(guān)系的信息、即將降混信號(hào)分離為多聲道音響信號(hào)的聲道 分離信息。以其為基礎(chǔ),在音響解碼裝置中,將被編碼的降混信號(hào)進(jìn)行解碼,之后根據(jù)解碼 的降混信號(hào)和空間信息(SpatialCue)生成多聲道音響信號(hào)。如此,實(shí)現(xiàn)多聲道音響信號(hào)的 傳送。在MPEG環(huán)繞方式中使用的空間信息(SpatialCue)為非常小的信息量,因此對(duì)于1 或2聲道的降混編碼串能夠?qū)⑿畔⒘康脑龃笠种茷樽钚∠薅?。因此,在MPEG環(huán)繞方式中,能 夠以與1或2聲道的音響信號(hào)相同程度的信息量來(lái)編碼多聲道音響信號(hào),因此與MPEG-AAC 方式以及杜比_數(shù)字方式相比,能夠以較少的比特率來(lái)傳送多聲道音響信號(hào)。例如,作為低比特率且高音質(zhì)的編碼方式的一個(gè)有用的應(yīng)用例子,舉出臨場(chǎng)感通 信系統(tǒng)。一般在臨場(chǎng)感通信系統(tǒng)中,2個(gè)以上的地點(diǎn)由雙向通信相互連接。并且,各地點(diǎn)相 互收發(fā)編碼數(shù)據(jù),設(shè)置在各地點(diǎn)的音響編碼裝置以及音響解碼裝置,對(duì)收發(fā)的數(shù)據(jù)進(jìn)行編 碼以及解碼。圖7是現(xiàn)有例的多地點(diǎn)會(huì)議系統(tǒng)的構(gòu)成圖,表示在3個(gè)地點(diǎn)進(jìn)行會(huì)議時(shí)的音響信 號(hào)編碼處理以及音響信號(hào)解碼處理的一個(gè)例子。在圖7中,各地點(diǎn)(地點(diǎn)1 3)分別具有音響編碼裝置和音響解碼裝置,通過(guò)用 具有某特定寬度的通信路徑來(lái)交接音響信號(hào),由此實(shí)現(xiàn)音響信號(hào)的雙向通信。
S卩,地點(diǎn)1具備麥克風(fēng)101、多聲道編碼裝置102、與地點(diǎn)2對(duì)應(yīng)的多聲道解碼裝置 103、與地點(diǎn)3對(duì)應(yīng)的多聲道解碼裝置104、表現(xiàn)裝置105、揚(yáng)聲器106以及回波消除器107。 地點(diǎn)2具備與地點(diǎn)1對(duì)應(yīng)的多聲道解碼裝置110、與地點(diǎn)3對(duì)應(yīng)的多聲道解碼裝置111、表 現(xiàn)裝置112、揚(yáng)聲器113、回波消除器114、麥克風(fēng)108以及多聲道編碼裝置109。地點(diǎn)3具 備麥克風(fēng)115、多聲道編碼裝置116、與地點(diǎn)2對(duì)應(yīng)的多聲道解碼裝置117、與地點(diǎn)1對(duì)應(yīng)的 多聲道解碼裝置118、表現(xiàn)裝置119、揚(yáng)聲器120以及回波消除器121。在各地點(diǎn)的裝置中多具備用于對(duì)會(huì)議系統(tǒng)的通話中產(chǎn)生的回波進(jìn)行抑制的回波 消除器。并且,各地點(diǎn)的裝置在為能夠收發(fā)多聲道音響信號(hào)的裝置的情況下,有時(shí)為了 能夠使多聲道音響信號(hào)定位到各個(gè)方向上,而在各地點(diǎn)具備使用了頭部傳達(dá)函數(shù)(HRTF Head-Related Transfer Function)的表現(xiàn)裝置。
例如,在地點(diǎn)1,麥克風(fēng)101對(duì)音響信號(hào)進(jìn)行收音,多聲道編碼裝置102以規(guī)定的比 特率進(jìn)行編碼。結(jié)果,音響信號(hào)被變換為比特流bsl,并向地點(diǎn)2和地點(diǎn)3發(fā)送。發(fā)送的比 特流bsl,在與多聲道音響信號(hào)的解碼相對(duì)應(yīng)的多聲道解碼裝置110中,被解碼為多聲道音 響信號(hào)。表現(xiàn)裝置112對(duì)解碼的多聲道音響信號(hào)進(jìn)行表現(xiàn)。揚(yáng)聲器113對(duì)表現(xiàn)的多聲道音 響信號(hào)進(jìn)行再生。同樣,在地點(diǎn)3,多聲道解碼裝置118對(duì)編碼的多聲道音響信號(hào)進(jìn)行解碼,表現(xiàn)裝 置119對(duì)解碼后的多聲道音響信號(hào)進(jìn)行表現(xiàn),揚(yáng)聲器120對(duì)表現(xiàn)的多聲道音響信號(hào)進(jìn)行再 生。另外,對(duì)地點(diǎn)1為發(fā)送側(cè)、地點(diǎn)2以及地點(diǎn)3為接受側(cè)的情況進(jìn)行了說(shuō)明,但有時(shí) 地點(diǎn)2為發(fā)送側(cè)、地點(diǎn)1以及地點(diǎn)3為接受側(cè),有時(shí)地點(diǎn)3為發(fā)送側(cè)、地點(diǎn)1以及地點(diǎn)2為 接受側(cè)。這些處理一直被同時(shí)并行地重復(fù),由此建立了臨場(chǎng)感通信系統(tǒng)。臨場(chǎng)感通信系統(tǒng)的主要目的是實(shí)現(xiàn)充滿臨場(chǎng)感的會(huì)話。因此,在相互連接的哪2 個(gè)地點(diǎn)之間,都需要降低雙向通信中的不協(xié)調(diào)感。并且,另一方面,雙向通信中的通信費(fèi)用 也成為課題。為了實(shí)現(xiàn)不協(xié)調(diào)感較少的廉價(jià)的雙向通信,需要滿足幾個(gè)方面的要求。對(duì)于將音 響信號(hào)編碼的方式來(lái)說(shuō)需要滿足(1)音響編碼裝置以及音響解碼裝置的處理時(shí)間較少、 即編碼方式的算法延遲較??;(2)能夠以低比特率進(jìn)行傳送;(3)高音質(zhì)。在MPEG-AAC方式以及杜比-數(shù)字方式等方式中,當(dāng)比特率下降時(shí)產(chǎn)生極端的音質(zhì) 惡化,因此難以在維持傳遞臨場(chǎng)感的音質(zhì)的同時(shí)實(shí)現(xiàn)廉價(jià)的通信費(fèi)用。關(guān)于這一點(diǎn),以MPEG 環(huán)繞方式為首的SAC方式,能夠在維持音質(zhì)的同時(shí)減小傳送比特率,對(duì)于為了以廉價(jià)的通 信費(fèi)用實(shí)現(xiàn)臨場(chǎng)感通信系統(tǒng),是比較適合的編碼方式。尤其是,在SAC方式中也是音質(zhì)較好的MPEG環(huán)繞方式的主要思想,也是用較少信 息量的參數(shù)來(lái)表現(xiàn)輸入信號(hào)的空間信息(SpatialCue),并使用降混到1或2聲道而傳送的 降混信號(hào)和上述參數(shù),來(lái)合成多聲道音響信號(hào)。通過(guò)削減傳送的音響信號(hào)的聲道數(shù)量,SAC 方式能夠降低比特率,并滿足臨場(chǎng)感通信系統(tǒng)中重要的第二方面、即能夠以低比特率進(jìn)行 傳送。與MPEG-AAC方式以及杜比-數(shù)字方式等現(xiàn)有例中的多聲道編碼方式相比較,在SAC 方式中,在相同比特率下,尤其在5. 1聲道中192kbps等超低比特率下,能夠進(jìn)行更高音質(zhì) 的傳送。因此,對(duì)于臨場(chǎng)感通信系統(tǒng)來(lái)說(shuō),SAC方式成為有用的解決手段。
非專利文獻(xiàn)1 :IS0/IEC-23003-l非專利文獻(xiàn)2 :IS0/IEC-13818_3非專利文獻(xiàn)3 :IS0/IEC-14496-3 2005非專利文獻(xiàn)4 :IS0/IEC-14496-3 :2005/Amd 1 2007對(duì)于上述SAC方式,在適用于臨場(chǎng)感通信系統(tǒng)時(shí)實(shí)際上也存在較大課題。與 MPEG-AAC方式以及杜比-數(shù)字方式等現(xiàn)有例中的離散多聲道編碼方式相比較,SAC方式的 編碼延遲量非常大。例如,在MPEG-AAC方式中,對(duì)于編碼延遲量增大的課題,作為將其降低 的技術(shù)而對(duì)MPEG-AAC-LD (Low Delay,低延遲)方式進(jìn)行了標(biāo)準(zhǔn)化(非專利文獻(xiàn)4)。在通常的MPEG-AAC方式中,在采樣頻率為48kHz的情況下,在音響編碼裝置中存 在大約42msec的編碼處理的延遲,在音響解碼裝置中產(chǎn)生大約21msec的解碼處理的延 遲。另一方面,在MPEG-AAC-LD方式中,能夠以通常的MPEG-AAC方式的一半的編碼延遲量 進(jìn)行音響信號(hào)的處理。當(dāng)將該方式適用于臨場(chǎng)感通信系統(tǒng)中時(shí),由于編碼延遲少而能夠順 暢地進(jìn)行與通信對(duì)象的會(huì)話以及交流。但是,MPEG-AAC-LD方式雖然為低延遲,但也還是以 MPEG-AAC為基礎(chǔ)的多聲道編碼手法,與MPEG-AAC方式相同,不能夠?qū)崿F(xiàn)比特率的降低,不 能夠同時(shí)滿足低比特率、高音質(zhì)以及低延遲。S卩,在MPEG-AAC方式、MPEG-AAC-LD方式以及杜比-數(shù)字方式等現(xiàn)有例的離散多 聲道編碼方式中,難以實(shí)現(xiàn)全部滿足低比特率、高音質(zhì)以及低延遲的編碼。圖8對(duì)SAC方式的代表例的MPEG環(huán)繞方式的編碼延遲量進(jìn)行解析、圖示。MPEG環(huán) 繞方式的詳細(xì)情況記載在非專利文獻(xiàn)1中。如該圖所示,SAC編碼裝置(SAC encoder)具備t_f變換部201、SAC分析部202、 f-t變換部204、降混信號(hào)編碼部205以及重疊裝置207。SAC分析部202具備降混部203 以及空間信息計(jì)算部206。SAC解碼裝置(SAC decoder)具備解讀裝置208、降混信號(hào)解碼部209、t_f變換部 210、SAC合成部211以及f-t變換部212。根據(jù)圖8,在編碼側(cè),t-f變換部201將多聲道音響信號(hào)變換為頻域的信號(hào)。t-f 變換部201,有時(shí)通過(guò)離散傅里葉變換(FFT :Finite Fourier Transform)以及離散余弦 變換(MDCT :Modified Discrete Cosine Transform)等而變換為純粹的頻域,也有時(shí)使用 QMF(Quadrature Mirror Filter,正交鏡像濾波器)濾波器組而變換為合成頻域。變換為頻域的多聲道音響信號(hào),在SAC分析部202中與2個(gè)路徑連接。1個(gè)是與生 成1或2聲道的音響信號(hào)、即中間降混信號(hào)IDMX的降混部203連接的路徑。另一個(gè)是與提 取空間信息(SpatialCue)并進(jìn)行量化的空間信息計(jì)算部206連接的路徑。作為空間信息 (SpatialCue),一般生成所輸入的多聲道音響信號(hào)的各聲道之間的電平差、功率差、相關(guān)以 及相干性等而使用的情況較多。在空間信息計(jì)算部206進(jìn)行了提取空間信息(SpatialCue)并進(jìn)行量化的處理之 后,f-t變換部204將中間降混信號(hào)IDMX再次變換為時(shí)間域的信號(hào)。降混信號(hào)編碼部205將通過(guò)f-t變換部204得到的降混信號(hào)DMX編碼為希望的比特率。作為此時(shí)所使用的降混信號(hào)的編碼方式,是將1或2聲道的音響信號(hào)編碼的方 式,可以是 MP3 (MPEG Audio Layer-3,MPEG 音頻第 3 層)、MPEG-AAC, ATRAC (AdaptiveTRansformation Acoustic Coding,自適應(yīng)變換聲學(xué)編碼)方式、杜比-數(shù)字方式以及Windows(注冊(cè)商標(biāo))MediaAudio(WMA)方式那樣的不可逆壓縮方式,也可以是 MPEG4-ALS (AudioLossless,音步頁(yè)無(wú)損)、LPAC (Lossless Predictive Audio Compression, 無(wú)損預(yù)測(cè)音頻壓縮)以及LTAC (Lossless Transform Audio Compression,無(wú)損變換音頻 壓縮)等可逆壓縮方式。并且,也可以是iSAC (internet Speech AudioCodec,互聯(lián)網(wǎng)語(yǔ)音 音頻編碼解碼器)、iLBC (internet Low Bitrate Codec,互聯(lián)網(wǎng)低碼率編碼解碼器)以及 ACELP(Algebraic code excited linearprediction,代數(shù)碼激勵(lì)線性預(yù)測(cè))等在聲音域特 殊化的壓縮方式。重疊裝置207是具備將2個(gè)以上的輸入作為1個(gè)信號(hào)輸出的機(jī)構(gòu)的多路復(fù)用器。 重疊裝置207將編碼的降混信號(hào)DMX和空間信息(SpatialCue)多路復(fù)用而向音響解碼裝 置發(fā)送。在音響解碼裝置側(cè),接收由重疊裝置207生成的編碼比特流。解讀裝置208對(duì)接 收的比特流進(jìn)行多路復(fù)用。此處,解讀裝置208是根據(jù)1個(gè)輸入信號(hào)輸出多個(gè)信號(hào)的信號(hào) 分離器,是將1個(gè)輸入信號(hào)分離為多個(gè)信號(hào)的分離部。之后,降混信號(hào)解碼部209將比特流所含有的被編碼的降混信號(hào)解碼為1或2聲 道的音響信號(hào)。t-f變換部210將解碼的信號(hào)變換至頻域。SAC合成部211根據(jù)由解讀裝置208分離的空間信息(SpatialCue)和上述頻域的 解碼信號(hào),合成多聲道音響信號(hào)。f-t變換部212將由SAC合成部211合成的頻域的信號(hào)變換為時(shí)間域的信號(hào),結(jié)果 生成時(shí)間域的多聲道音響信號(hào)。如上所述,當(dāng)縱觀SAC的構(gòu)成時(shí),編碼方式的算法延遲量能夠分類為如下的3類。(I)SAC分析部202以及SAC合成部211(2)降混信號(hào)編碼部205以及降混信號(hào)解碼部209(3) t-f 變換部以及 f-t 變換部(201、204、210、212)圖9表示現(xiàn)有例中SAC技術(shù)的算法延遲量。以下為了方便,將各自的算法延遲量 如下地記載。設(shè)t-f變換部201以及t-f變換部210的延遲量為DO,SAC分析部202的延遲量 為Dl,f-t變換部204以及f-t變換部212的延遲量為D2,降混信號(hào)編碼部205的延遲量 為D3,降混信號(hào)解碼部209的延遲量為D4,并且,SAC合成部211的延遲量為D5。如圖9所示,音響編碼裝置和音響解碼裝置總的延遲量D為<formula>formula see original document page 9</formula>
關(guān)于SAC編碼方式的典型例的MPEG環(huán)繞方式,在音響編碼裝置以及音響解碼裝置 中產(chǎn)生2240樣本的算法延遲。當(dāng)包含降混信號(hào)在音響編碼裝置以及音響解碼裝置中產(chǎn)生 的算法延遲時(shí),整體的算法延遲變得龐大。采用MPEG-AAC方式作為降混編碼裝置以及降 混解碼裝置時(shí)的算法延遲也達(dá)到80msec。但是,一般為了在延遲量重要的臨場(chǎng)感通信系統(tǒng) 中意識(shí)不到延遲量地進(jìn)行通信,需要使音響編碼裝置以及音響解碼裝置的延遲量為40msec 以下。因此,在需要低比特率、高音質(zhì)以及低延遲的臨場(chǎng)感通信系統(tǒng)等用途中,在使用SAC編碼方式的情況下,存在延遲量大幅超出的本質(zhì)上的課題。
發(fā)明內(nèi)容
因此,本發(fā)明的目的為提供一種音響編碼裝置以及音響解碼裝置,能夠削減現(xiàn)有 例的多聲道音響信號(hào)的編碼裝置以及解碼裝置的算法延遲。
為了解決上述課題,本發(fā)明的音響編碼裝置是將輸入的多聲道音響信號(hào)編碼的音 響編碼裝置,具備降混信號(hào)生成部,通過(guò)將輸入的上述多聲道音響信號(hào)在時(shí)間域上進(jìn)行降 混,由此生成1或2聲道的音響信號(hào)、即第一降混信號(hào);降混信號(hào)編碼部,對(duì)由上述降混信號(hào) 生成部生成的第一降混信號(hào)進(jìn)行編碼;第一 t-f變換部,將輸入的上述多聲道音響信號(hào)變 換為頻域的多聲道音響信號(hào);以及空間信息計(jì)算部,通過(guò)對(duì)由上述第一 t-f變換部變換的 頻域的多聲道音響信號(hào)進(jìn)行分析,由此生成空間信息、即根據(jù)降混信號(hào)生成多聲道音響信 號(hào)的信息。由此,能夠不等待根據(jù)多聲道音響信號(hào)生成空間信息的處理結(jié)束,就能夠執(zhí)行相 同的將多聲道音響信號(hào)降混而編碼的處理。即,能夠并列地執(zhí)行這些處理。因此,能夠削減 音響編碼裝置中的算法延遲。并且,上述音響編碼裝置還可以進(jìn)一步具備第二 t-f變換部,將由上述降混信號(hào) 生成部生成的第一降混信號(hào)變換為頻域的第一降混信號(hào);降混部,通過(guò)將由上述第一 t-f 變換部變換的頻域的多聲道音響信號(hào)進(jìn)行降混,來(lái)生成頻域的第二降混信號(hào);以及降混補(bǔ) 償電路,通過(guò)對(duì)由上述第二 t-f變換部變換的頻域的第一降混信號(hào)與由上述降混部生成的 頻域的第二降混信號(hào)進(jìn)行比較,來(lái)計(jì)算對(duì)降混信號(hào)進(jìn)行調(diào)整的信息、即降混補(bǔ)償信息。由此,能夠生成用于對(duì)未等待生成空間信息的處理結(jié)束而生成的降混信號(hào)進(jìn)行調(diào) 整的降混補(bǔ)償信息。并且,音響解碼裝置通過(guò)使用所生成的降混補(bǔ)償信息,能夠生成更高音 質(zhì)的多聲道音響信號(hào)。并且,上述音響編碼裝置還可以進(jìn)一步具備將上述降混補(bǔ)償信息與上述空間信息 存儲(chǔ)于相同編碼串中的重疊裝置。由此,能夠確保與現(xiàn)有例的音響編碼裝置以及音響解碼裝置的互換性。并且,上述降混補(bǔ)償電路還可以計(jì)算信號(hào)的功率比作為上述降混補(bǔ)償信息。由此,從本發(fā)明的音響編碼裝置接收了降混信號(hào)和降混補(bǔ)償信息的音響解碼裝 置,能夠使用作為降混補(bǔ)償信息的功率比,來(lái)調(diào)整降混信號(hào)。并且,上述降混補(bǔ)償電路還可以計(jì)算信號(hào)的差分作為上述降混補(bǔ)償信息。由此,從本發(fā)明的音響編碼裝置接收了降混信號(hào)和降混補(bǔ)償信息的音響解碼裝 置,能夠使用作為降混補(bǔ)償信息的差分,來(lái)調(diào)整降混信號(hào)。并且,上述降混補(bǔ)償電路還可以計(jì)算預(yù)測(cè)濾波系數(shù)作為上述降混補(bǔ)償信息。由此,從本發(fā)明的音響編碼裝置接收了降混信號(hào)和降混補(bǔ)償信息的音響解碼裝 置,能夠使用作為降混補(bǔ)償信息的預(yù)測(cè)濾波系數(shù),來(lái)調(diào)整降混信號(hào)。并且,本發(fā)明的音響解碼裝置還可以是將接收的比特流解碼為多聲道音響信號(hào)的 音響解碼裝置,具備分離部,將接收的比特流分離為數(shù)據(jù)部和參數(shù)部,數(shù)據(jù)部包含被編碼 的降混信號(hào),參數(shù)部包含根據(jù)降混信號(hào)生成多聲道音響信號(hào)的信息即空間信息和調(diào)整降混 信號(hào)的信息即降混補(bǔ)償信息;降混調(diào)整電路,使用上述參數(shù)部所包含的降混補(bǔ)償信息,對(duì)從上述數(shù)據(jù)部得到的頻域的降混信號(hào)進(jìn)行調(diào)整;多聲道信號(hào)生成部,使用上述參數(shù)部所包 含的空間信息,根據(jù)由上述降混調(diào)整電路調(diào)整的頻域的降混信號(hào)生成頻域的多聲道音響信 號(hào);以及f-t變換部,將由上述多聲道信號(hào)生成部生成的頻域的多聲道音響信號(hào)變換為時(shí) 間域的多聲道音響信號(hào)。由此,根據(jù)從削減了算法延遲的上述音響編碼裝置接收的降混信號(hào),生成高音質(zhì) 的多聲道音響信號(hào)。并且,上述音響解碼裝置還可以具備降混中間解碼部,通過(guò)將上述數(shù)據(jù)部所包含的被編碼的降混信號(hào)進(jìn)行逆量化,由此生成頻域的降混信號(hào);以及域變換部,將由上述降混 中間解碼部生成的頻域的降混信號(hào)變換為在時(shí)間軸方向上也具有成分的頻域的降混信號(hào); 上述降混調(diào)整電路通過(guò)上述降混補(bǔ)償信息來(lái)對(duì)由上述域變換部變換的頻域的降混信號(hào)進(jìn) 行調(diào)整。由此,用于生成多聲道音響信號(hào)的前級(jí)的處理在頻域上進(jìn)行。因此能夠削減處理 的延遲。并且,上述降混調(diào)整電路,也可以取得信號(hào)的功率比作為上述降混補(bǔ)償信息,并將 上述降混信號(hào)與上述功率比相乘,由此調(diào)整上述降混信號(hào)。由此,音響解碼裝置接收的降混信號(hào),使用由音響編碼裝置計(jì)算的功率比,被調(diào)整 為適合于生成高音質(zhì)的多聲道音響信號(hào)的降混信號(hào)。并且,上述降混調(diào)整電路,也可以取得信號(hào)的差分作為上述降混補(bǔ)償信息,并將上 述降混信號(hào)與上述差分相加,由此調(diào)整上述降混信號(hào)。由此,音響解碼裝置接收的降混信號(hào),使用由音響編碼裝置計(jì)算的差分,被調(diào)整為 適合于生成高音質(zhì)的多聲道音響信號(hào)的降混信號(hào)。并且,上述降混調(diào)整電路,也可以取得預(yù)測(cè)濾波系數(shù)作為上述降混補(bǔ)償信息,并對(duì) 上述降混信號(hào)施以使用了上述預(yù)測(cè)濾波系數(shù)的預(yù)測(cè)濾波,由此調(diào)整上述降混信號(hào)。由此,音響解碼裝置接收的降混信號(hào),使用由音響編碼裝置計(jì)算的預(yù)測(cè)濾波系數(shù), 被調(diào)整為適合于生成高音質(zhì)的多聲道音響信號(hào)的降混信號(hào)。并且,本發(fā)明的音響編碼解碼裝置還可以具備將輸入的多聲道音響信號(hào)編碼的音 響編碼部和將接收的比特流解碼為多聲道音響信號(hào)的音響解碼部;上述音響編碼部具備 降混信號(hào)生成部,通過(guò)將輸入的上述多聲道音響信號(hào)在時(shí)間域上進(jìn)行降混,由此生成1或2 聲道的音響信號(hào)、即第一降混信號(hào);降混信號(hào)編碼部,對(duì)由上述降混信號(hào)生成部生成的第一 降混信號(hào)進(jìn)行編碼;第一 t-f變換部,將輸入的上述多聲道音響信號(hào)變換為頻域的多聲道 音響信號(hào);空間信息計(jì)算部,通過(guò)對(duì)由上述第一 t-f變換部變換的頻域的多聲道音響信號(hào) 進(jìn)行分析,由此生成空間信息、即根據(jù)降混信號(hào)生成多聲道音響信號(hào)的信息;第二 t-f變換 部,將由上述降混信號(hào)生成部生成的第一降混信號(hào)變換為頻域的第一降混信號(hào);降混部,通 過(guò)將由上述第一 t-f變換部變換的頻域的多聲道音響信號(hào)進(jìn)行降混,來(lái)生成頻域的第二降 混信號(hào);以及降混補(bǔ)償電路,通過(guò)對(duì)由上述第二 t-f變換部變換的頻域的第一降混信號(hào)與 由上述降混部生成的頻域的第二降混信號(hào)進(jìn)行比較,來(lái)計(jì)算對(duì)降混信號(hào)進(jìn)行調(diào)整的信息、 即降混補(bǔ)償信息;上述音響解碼部具備分離部,將接收的比特流分離為數(shù)據(jù)部和參數(shù)部, 數(shù)據(jù)部包含被編碼的降混信號(hào),參數(shù)部包含根據(jù)降混信號(hào)生成多聲道音響信號(hào)的信息即空 間信息和調(diào)整降混信號(hào)的信息即降混補(bǔ)償信息;降混調(diào)整電路,使用上述參數(shù)部所包含的降混補(bǔ)償信息,對(duì)從上述數(shù)據(jù)部得到的頻域的降混信號(hào)進(jìn)行調(diào)整;多聲道信號(hào)生成部,使用 上述參數(shù)部所包含的空間信息,根據(jù)由上述降混調(diào)整電路調(diào)整的頻域的降混信號(hào)生成頻域 的多聲道音響信號(hào);以及f-t變換部,將由上述多聲道信號(hào)生成部生成的頻域的多聲道音 響信號(hào)變換為時(shí)間域的多聲道音響信號(hào)。
由此,能夠作為滿足低延遲、低比特率以及高音質(zhì)的音響編碼解碼裝置得以利用。并且,本發(fā)明的會(huì)議系統(tǒng)還可以具備將輸入的多聲道音響信號(hào)編碼的音響編碼裝 置和將接收的比特流解碼為多聲道音響信號(hào)的音響解碼裝置;上述音響編碼裝置具備降 混信號(hào)生成部,通過(guò)將輸入的上述多聲道音響信號(hào)在時(shí)間域上進(jìn)行降混,由此生成1或2 聲道的音響信號(hào)、即第一降混信號(hào);降混信號(hào)編碼部,對(duì)由上述降混信號(hào)生成部生成的第一 降混信號(hào)進(jìn)行編碼;第一 t-f變換部,將輸入的上述多聲道音響信號(hào)變換為頻域的多聲道 音響信號(hào);空間信息計(jì)算部,通過(guò)對(duì)由上述第一 t-f變換部變換的頻域的多聲道音響信號(hào) 進(jìn)行分析,由此生成空間信息、即根據(jù)降混信號(hào)生成多聲道音響信號(hào)的信息;第二 t-f變換 部,將由上述降混信號(hào)生成部生成的第一降混信號(hào)變換為頻域的第一降混信號(hào);降混部,通 過(guò)將由上述第一 t-f變換部變換的頻域的多聲道音響信號(hào)進(jìn)行降混,來(lái)生成頻域的第二降 混信號(hào);以及降混補(bǔ)償電路,通過(guò)對(duì)由上述第二 t-f變換部變換的頻域的第一降混信號(hào)與 由上述降混部生成的頻域的第二降混信號(hào)進(jìn)行比較,來(lái)計(jì)算對(duì)降混信號(hào)進(jìn)行調(diào)整的信息、 即降混補(bǔ)償信息;上述音響解碼裝置具備分離部,將接收的比特流分離為數(shù)據(jù)部和參數(shù) 部,數(shù)據(jù)部包含被編碼的降混信號(hào),參數(shù)部包含根據(jù)降混信號(hào)生成多聲道音響信號(hào)的信息 即空間信息和調(diào)整降混信號(hào)的信息即降混補(bǔ)償信息;降混調(diào)整電路,使用上述參數(shù)部所包 含的降混補(bǔ)償信息,對(duì)從上述數(shù)據(jù)部得到的頻域的降混信號(hào)進(jìn)行調(diào)整;多聲道信號(hào)生成部, 使用上述參數(shù)部所包含的空間信息,根據(jù)由上述降混調(diào)整電路調(diào)整的頻域的降混信號(hào)生成 頻域的多聲道音響信號(hào);以及f-t變換部,將由上述多聲道信號(hào)生成部生成的頻域的多聲 道音響信號(hào)變換為時(shí)間域的多聲道音響信號(hào)。由此,能夠作為能夠進(jìn)行順暢的交流的會(huì)議系統(tǒng)得以利用。本發(fā)明的音響編碼方法還可以是將輸入的多聲道音響信號(hào)編碼的音響編碼方法, 具備降混信號(hào)生成步驟,通過(guò)將輸入的上述多聲道音響信號(hào)在時(shí)間域上進(jìn)行降混,由此生 成1或2聲道的音響信號(hào)、即第一降混信號(hào);降混信號(hào)編碼步驟,對(duì)由上述降混信號(hào)生成步 驟生成的第一降混信號(hào)進(jìn)行編碼;第一 t-f變換步驟,將輸入的上述多聲道音響信號(hào)變換 為頻域的多聲道音響信號(hào);以及空間信息計(jì)算步驟,通過(guò)對(duì)由上述第一 t-f變換步驟變換 的頻域的多聲道音響信號(hào)進(jìn)行分析,由此生成空間信息、即根據(jù)降混信號(hào)生成多聲道音響 信號(hào)的信息。由此,能夠削減音響信號(hào)的編碼處理中的算法延遲。本發(fā)明的音響解碼方法還可以是將接收的比特流解碼為多聲道音響信號(hào)的音響 解碼方法,具備分離步驟,將接收的比特流分離為數(shù)據(jù)部和參數(shù)部,數(shù)據(jù)部包含被編碼的 降混信號(hào),參數(shù)部包含根據(jù)降混信號(hào)生成多聲道音響信號(hào)的信息即空間信息和調(diào)整降混信 號(hào)的信息即降混補(bǔ)償信息;降混調(diào)整步驟,使用上述參數(shù)部所包含的降混補(bǔ)償信息,對(duì)從 上述數(shù)據(jù)部得到的頻域的降混信號(hào)進(jìn)行調(diào)整;多聲道信號(hào)生成步驟,使用上述參數(shù)部所包 含的空間信息,根據(jù)由上述降混調(diào)整步驟調(diào)整的頻域的降混信號(hào)生成頻域的多聲道音響信 號(hào);以及f-t變換步驟,將由上述多聲道信號(hào)生成步驟生成的頻域的多聲道音響信號(hào)變換為時(shí)間域的多聲道音響信號(hào)。由此,能夠生成高音質(zhì)的多聲道音響信號(hào)。并且,本發(fā)明的編碼程序還可以是用于將輸入的多聲道音響信號(hào)編碼的音響編碼裝置的程序,是使計(jì)算機(jī)執(zhí)行上述音響編碼方法所包含的步驟的程序。由此,能夠作為進(jìn)行低延遲的音響編碼處理的程序得以利用。并且,本發(fā)明的解碼程序還可以是用于將接收的比特流解碼為多聲道音響信號(hào)的 音響解碼裝置的程序,是使計(jì)算機(jī)執(zhí)行上述音響解碼方法所包含的步驟的程序。由此,能夠作為進(jìn)行生成高音質(zhì)的多聲道音響信號(hào)的處理的程序得以利用。如上所述,本發(fā)明不僅能夠作為音響編碼裝置以及音響解碼裝置實(shí)現(xiàn),也能夠 作為將音響編碼裝置以及音響解碼裝置所具備的特征手段作為步驟的音響編碼方法以 及音響解碼方法實(shí)現(xiàn)。并且,能夠作為使計(jì)算機(jī)執(zhí)行這些步驟的程序?qū)崿F(xiàn)。并且,也 能夠構(gòu)成為將音響編碼裝置以及音響解碼裝置所具備的特征手段一體化的LSKLarge scale Integration,大規(guī)模集成電路)等半導(dǎo)體集成電路。并且,這種程序當(dāng)然能夠經(jīng)由 CD-ROM(CompactDisc Read Only Memory, CD只讀存儲(chǔ)器)等記錄媒體以及互聯(lián)網(wǎng)等傳送 媒體來(lái)提供。發(fā)明的效果根據(jù)本發(fā)明的音響編碼裝置以及音響解碼裝置,能夠削減現(xiàn)有例中的多聲道音響 編碼裝置以及多聲道音響解碼裝置的算法延遲,能夠高效地兼顧處于折衷關(guān)系的比特率與 音質(zhì)的關(guān)系。S卩,能夠發(fā)揮的效果為與現(xiàn)有例的多聲道音響編碼技術(shù)相比能夠削減算法延遲, 并能夠?qū)崿F(xiàn)進(jìn)行實(shí)時(shí)通話的會(huì)議系統(tǒng)以及需要低延遲且高音質(zhì)的多聲道音響信號(hào)的傳送 的充滿臨場(chǎng)感的通信系統(tǒng)等的構(gòu)筑。因此,通過(guò)本發(fā)明,能夠進(jìn)行高音質(zhì)、低比特率且低延遲的收發(fā)。因此,在便攜電話 等移動(dòng)設(shè)備彼此的充滿臨場(chǎng)感的交流變得普及、AV設(shè)備以及會(huì)議系統(tǒng)中的真正的臨場(chǎng)感交 流變得普及的當(dāng)今,本發(fā)明的實(shí)用價(jià)值極高。當(dāng)然,用途并不限于此,對(duì)于需要延遲量小的 所有雙向交流當(dāng)然也是有效的發(fā)明。
圖1是表示本發(fā)明實(shí)施方式中的音響編碼裝置的構(gòu)成以及各部分的延遲量的圖。圖2是本發(fā)明實(shí)施方式中的比特流的構(gòu)造圖。圖3是本發(fā)明實(shí)施方式中的比特流的其他構(gòu)造圖。圖4是表示本發(fā)明實(shí)施方式中的音響解碼裝置的構(gòu)成以及各部分的延遲量的圖。圖5是本發(fā)明實(shí)施方式中的參數(shù)集的說(shuō)明圖。圖6是本發(fā)明實(shí)施方式中的混合域的說(shuō)明圖。圖7是現(xiàn)有例的多地點(diǎn)會(huì)議系統(tǒng)的構(gòu)成圖。圖8是現(xiàn)有例的音響編碼裝置以及音響解碼裝置的構(gòu)成圖。圖9是表示現(xiàn)有例的音響編碼裝置以及音響解碼裝置的延遲量的圖。符號(hào)說(shuō)明101、108、115 麥克風(fēng)
102、109、116多聲道編碼裝置103、104、110、111、117、118 多聲道解碼裝置105、112、119 表現(xiàn)裝置106、113、120 揚(yáng)聲器107、114、121 回波消除器201、210時(shí)間-頻域變換部(t-f變換部)202、402SAC 分析部203、408 降混部204,212,506頻域-時(shí)間變換部(f_t變換部)205、404降混信號(hào)編碼部206、409空間信息計(jì)算部207、407 重疊裝置208、501解讀裝置(分離部)209降混信號(hào)解碼部211、505SAC 合成部401第一時(shí)間-頻域變換部(第一 t-f變換部)403任意方式(Arbitrary)降混電路405第二時(shí)間-頻域變換部(第二 t-f變換部)406降混補(bǔ)償電路410降混信號(hào)生成部502降混信號(hào)中間解碼部503域變換部504降混調(diào)整電路507多聲道信號(hào)生成部
具體實(shí)施例方式以下,參照
本發(fā)明的實(shí)施方式。(實(shí)施方式1)首先,說(shuō)明本發(fā)明的實(shí)施方式1。圖1是本發(fā)明實(shí)施方式1的音響編碼裝置的構(gòu)成圖。并且,在圖1中,在各部分的下方表示延遲量。另外,這里的延遲量表示在蓄積了多個(gè)輸入信號(hào)之后輸出信號(hào)的情況下 的延遲量。在從輸入到輸出之間未蓄積多個(gè)輸入信號(hào)的情況下,能夠忽略該部分的延遲量, 因此在圖1中將延遲量表示為0。圖1所示的音響編碼裝置是將多聲道音響信號(hào)進(jìn)行編碼的音響編碼裝置,具備降 混信號(hào)生成部410、降混信號(hào)編碼部404、第一 t-f變換部401、SAC分析部402、第二 t-f 變換部405、降混補(bǔ)償電路406以及重疊裝置407。降混信號(hào)生成部410具備任意方式 (Arbitrary)降混電路403。SAC分析部402具備降混部408以及空間信息計(jì)算部409。任意方式降混電路403通過(guò)任意方式(Arbitrary),將輸入的多聲道音響信號(hào)降 混為1或者2聲道的音響信號(hào),而生成任意方式降混信號(hào)ADMX。
降混信號(hào)編碼部404,將由任意方式降混電路403生成的任意方式降混信號(hào)ADMX進(jìn)行編碼。第二 t-f變換部405,將由任意方式降混電路403生成的任意方式降混信號(hào)ADMX從時(shí)間域變換為頻域,而生成頻域的中間任意方式降混信號(hào)IADMX。第一 t-f變換部401,將輸入的多聲道音響信號(hào)從時(shí)間域變換為頻域。降混部408,對(duì)由第一 t-f變換部401變換的頻域的多聲道音響信號(hào)進(jìn)行分析,而生成頻域的中間降混信號(hào)IDMX??臻g信息計(jì)算部409,對(duì)由第一 t-f變換部401變換的頻域的多聲道音響信號(hào)進(jìn)行 分析,而生成空間信息(SpatialCue)。空間信息(SpatialCue)中包含聲道分離信息,該聲 道分離信息是表示被降混的信號(hào)與多聲道音響信號(hào)的相關(guān)值、頻率比以及相位的差異等的 關(guān)系的信息,將降混的信號(hào)分離為多聲道音響信號(hào)。降混補(bǔ)償電路406,對(duì)中間任意方式降混信號(hào)IADMX和中間降混信號(hào)IDMX進(jìn)行比 較,計(jì)算出降混補(bǔ)償信息(DMXCue)。重疊裝置407是具備將2個(gè)以上的輸入作為1個(gè)信號(hào)輸出的機(jī)構(gòu)的多路復(fù)用器的 例子。重疊裝置407將由降混信號(hào)編碼部404編碼的任意方式降混信號(hào)ADMX、由空間信息 計(jì)算部409計(jì)算的空間信息(SpatialCue)以及由降混補(bǔ)償電路406計(jì)算出的降混補(bǔ)償信 息(DMXCue)進(jìn)行多路復(fù)用,并作為比特流進(jìn)行輸出。如圖1所示,輸入的多聲道音響信號(hào)被輸入到2個(gè)模塊。1個(gè)是任意方式降混電路 403,另一個(gè)是第一 t-f變換部401。第一 t-f變換部401例如使用公式1,將輸入的多聲道 音響信號(hào)向頻域的信號(hào)進(jìn)行變換。[公式]<formula>formula see original document page 15</formula>式 1)公式1是離散余弦變換(MDCT)的例子。s(t)是輸入的時(shí)間域的多聲道音響信號(hào)。 S(f)是頻域的多聲道音響信號(hào)。t表示時(shí)間域。f表示頻域。N是幀數(shù)。另外,在本實(shí)施方式中,作為第一 t-f變換部401使用的計(jì)算公式的例子,將離散 余弦變換(MDCT)在公式1進(jìn)行表示,但是本發(fā)明并不限于此。有時(shí)通過(guò)離散快速傅里葉變 換(FFT:Fast Fourier Transform)以及離散余弦變換(MDCT)等變換為純粹的頻域,也有 時(shí)使用QMF濾波器組等而變換為在時(shí)間軸方向上也具有成分的頻域、即合成頻域。因此,第 一 t-f變換部401,將使用哪個(gè)變換域預(yù)先保持在編碼串中。例如,在使用QMF濾波器組的 合成頻域的情況下在編碼串中保持“01”,在使用離散余弦變換(MDCT)的頻域的情況下在 編碼串中保持“00”。SAC分析部402的降混部408,將變換為頻域的多聲道音響信號(hào)降混為中間降混信 號(hào)IDMX。中間降混信號(hào)IDMX是1或2聲道的音響信號(hào),是頻域的信號(hào)。[公式2]<formula>formula see original document page 16</formula>公式2是降混的計(jì)算處理的例子。公式2中的f表示頻域。SJf)、Se(f)、Sc(f)、 Sls(f)以及SKs(f)是各聲道的音響信號(hào)。Sidmx(f)是中間降混信號(hào)IDMX。CL、CK、Cc、CLs、CKs、 DL> DE, DC, Dls以及Dks是降混系數(shù)。此處,適用ITU規(guī)定的降混系數(shù)。通常的ITU規(guī)定的降混系數(shù)對(duì)于時(shí)間域的信號(hào) 進(jìn)行運(yùn)算,但在本實(shí)施方式中,將其用于頻域上的變換這一情況與通常的ITU建議的降混 方法不同。此處的降混系數(shù)有時(shí)也對(duì)應(yīng)于多聲道音響信號(hào)的特性而進(jìn)行變化。SAC分析部402的空間信息計(jì)算部409,在SAC分析部402的降混部408進(jìn)行降混 的同時(shí),計(jì)算空間信息(SpatialCue),并進(jìn)行量化??臻g信息(SpatialCue)在將降混信號(hào) 分離為多聲道音響信號(hào)時(shí)使用。[公式3]ILDnm = s^n2 (式 3)
‘s(f)m在公式3中,將聲道η與聲道m(xù)之間的功率比作為ILDn.m進(jìn)行計(jì)算。η以及m為, 1相當(dāng)于L聲道,以下2為R聲道、3為C聲道、4為L(zhǎng)s聲道、5為Rs聲道。并且,S(f)n以 及S (f)m是各聲道的音響信號(hào)。同樣,將聲道η與聲道m(xù)之間的相關(guān)系數(shù)作為ICCn.m如公式4那樣進(jìn)行計(jì)算。[公式4]ICCn, m = Corr (S (f) n,S (f) m)(式 4)η以及m為,1相當(dāng)于L聲道,以下2為R聲道、3為C聲道、4為L(zhǎng)s聲道、5為Rs聲 道。并且,S(f)n以及S(f)m是各聲道的音響信號(hào)。并且,運(yùn)算符Corr為公式5那樣的運(yùn)
笪弁。[公式5]
^(Xi - Xbl-y)
剛―佴“會(huì)「評(píng)(式5)公式5的Xi和yi表示由運(yùn)算符Corr運(yùn)算的χ和y所包含的各要素。χ拔和y拔 表示運(yùn)算的X和y所包含的要素的平均值。如此,SAC分析部402的空間信息計(jì)算部409,在計(jì)算出各聲道之間的ILD以及ICC 之后,進(jìn)行量化并根據(jù)需要使用Huffman (哈夫曼)編碼方法等廢棄冗余性,并生成空間信 ;^ (SpatialCue)。重疊裝置407,將由空間信息計(jì)算部409生成的空間信息(SpatialCue)重疊到如 圖2所示那樣的比特流中。
圖2是本發(fā)明實(shí)施方式中的比特流的構(gòu)造圖。重疊裝置407將編碼的任意方式降 混信號(hào)ADMX和空間信息(SpatialCue)重疊到比特流中。并且,空間信息(SpatialCue)包 含由空間信息計(jì)算部409計(jì)算出的信息SAC_Param和由降混補(bǔ)償電路406計(jì)算出的降混補(bǔ) 償信息(DMXCue)。通過(guò)使降混補(bǔ)償信息(DMXCue)包含于空間信息(SpatialCue),能夠維 持與現(xiàn)有例的音響解碼裝置的互換性。并且,圖2所示的LD_flag(L0WDelay (低延遲)標(biāo)志)是表示是否通過(guò)本發(fā)明的 音響編碼方法進(jìn)行了編碼的標(biāo)志。音響編碼裝置的重疊裝置407附加LD_flag,由此音響解 碼裝置能夠容易地判斷是否為附加了降混補(bǔ)償信息(DMXCue)的信號(hào)。并且,音響解碼裝置 也可以通過(guò)跳過(guò)所附加的降混補(bǔ)償信息(DMXCue),來(lái)進(jìn)行更低延遲的解碼的處理。另外,在本實(shí)施方式中,作為空間信息(SpatialCue),使用輸入的多聲道音響信號(hào)的各聲道之間的功率比和相關(guān)系數(shù),但本發(fā)明不限于此,也可以是輸入的多聲道音響信號(hào) 之間的相干性以及絕對(duì)值的差分。并且,作為SAC方式使用了 MPEG環(huán)繞方式的情況的詳細(xì)說(shuō)明記載于非專利文獻(xiàn)1。 非專利文獻(xiàn)1記載的ICC (Interaural Correlation Coeff icient,耳間相關(guān)系數(shù))相當(dāng)于 聲道之間的相關(guān)信息,ILD(Interaural LevelDifference,耳間電平差)相當(dāng)于各聲道之間 的功率比。圖2所示的ITD(Interaural Time Difference,耳間時(shí)間差)相當(dāng)于各聲道之 間的時(shí)間差信息。下面,對(duì)任意方式降混電路403的功能進(jìn)行說(shuō)明。任意方式降混電路403,以任意的方式對(duì)時(shí)間域的多聲道音響信號(hào)進(jìn)行降混,計(jì)算 時(shí)間域的1或2聲道的音響信號(hào)、即任意方式降混信號(hào)ADMX。作為降混的一個(gè)例子,存在按 照ITU-R建議BS. 775-1 (非專利文獻(xiàn)5)的降混。[公式6]<formula>formula see original document page 17</formula>
公式6是降混的計(jì)算處理的例子。公式6中的t表示時(shí)間域。S(tk、S(t)K、S(t) C、S (t)Ls以及S (t)Es是各聲道的音響信號(hào)。Sadmx (t)是任意方式降混信號(hào)ADMX。CL, Ce, Cc, CLsXEs,Dl,De,Dc,DLs以及Dks是降混系數(shù)。在本發(fā)明中,對(duì)每個(gè)音響編碼裝置設(shè)定降混系數(shù), 如圖3所示,重疊裝置407也可以將設(shè)定的降混系數(shù)作為比特流的一部分進(jìn)行發(fā)送。并且, 也可以預(yù)先準(zhǔn)備多個(gè)降混系數(shù)的集合,重疊裝置407將切換時(shí)的信息重疊到比特流中進(jìn)行 發(fā)送。圖3是本發(fā)明實(shí)施方式中的比特流的構(gòu)造圖,是與圖2所示的比特流不同的構(gòu)造 圖。圖3所示的比特流與圖2所示的比特流相同,重疊了被編碼的任意方式降混信號(hào)ADMX 和空間信息(SpatialCue)。并且,空間信息(SpatialCue)包含由空間信息計(jì)算部409計(jì)算 出的信息SAC Param和由降混補(bǔ)償電路406計(jì)算出的降混補(bǔ)償信息(DMXCue)。在圖3所示 的比特流中還包含降混系數(shù)的信息和表示降混系數(shù)的模式的信息DMX flag。
例如,準(zhǔn)備2種模式的降混系數(shù)。1個(gè)模式為ITU-R建議的系數(shù)、另一個(gè)為用戶定 義的系數(shù)。重疊裝置407將1比特的追加信息記載于比特流中,在ITU建議的情況下使該 比特為“0”并進(jìn)行發(fā)送。在用戶定義的情況下,使該比特為“1”并進(jìn)行發(fā)送,并且在1的情 況下,在其后保持用戶定義的系數(shù)。比特流中的保持方法為,例如在任意方式降混信號(hào)ADMX 為單聲道的情況下,保持降混系數(shù)的數(shù)量(原信號(hào)為5. 1聲道的情況下為“6”)。在其后以 固定比特長(zhǎng)度保持實(shí)際的降混系數(shù)。在原信號(hào)為5. 1聲道的情況下比特長(zhǎng)度為16比特的 情況下,降混系數(shù)在比特流上以合計(jì)96比特記載。在任意方式降混信號(hào)ADMX為立體聲的 情況下,保持降混系數(shù)的數(shù)量(原信號(hào)為5.1聲道的情況下為“12”)。在其后以固定比特 長(zhǎng)度保持實(shí)際的降混系數(shù)。另外,降混系數(shù)有時(shí)以固定比特長(zhǎng)度進(jìn)行保持,也可以以可變比特長(zhǎng)度進(jìn)行保持。在該情況下,將保持有降混系數(shù)的比特的長(zhǎng)度信息存儲(chǔ)在比特流中。通過(guò)保持降混系數(shù)的模式信息,音響解碼裝置僅通過(guò)讀取其模式信息,就能夠不 進(jìn)行讀出降混系數(shù)本身等多余的處理而進(jìn)行解碼。由于不進(jìn)行多余的處理,具有能夠進(jìn)行 更低消耗電力的解碼的好處。如此,任意方式降混電路403進(jìn)行降混。然后,降混信號(hào)編碼部404以規(guī)定的比特 率、規(guī)定的編碼形式對(duì)1或者2聲道的任意方式降混信號(hào)ADMX進(jìn)行編碼。并且,重疊裝置 407將編碼的信號(hào)重疊到比特流中,向音響解碼裝置發(fā)送。另一方面,第二 t-f變換部405,將任意方式降混信號(hào)ADMX變換為頻域,生成中間 任意方式降混信號(hào)IADMX。[公式7]<formula>formula see original document page 18</formula>
公式7是向頻域的變換所使用的離散余弦變換(MDCT)的例子。公式7中的t表 示時(shí)間域。f表示頻域。N表示幀數(shù)。S^^a)表示任意方式降混信號(hào)ADMX。SIADMX(f)表示 中間任意方式降混信號(hào)IADMX。第二 t-f變換部405中使用的變換可以是公式7所示的離散余弦變換(MDCT),也 可以是離散傅里葉變換(FFT)以及QMF濾波器組等。第二 t-f變換部405和第一 t-f變換部401,優(yōu)選為相同種類的變換,但是在判斷 為使用不同種類的變換(QMF和FFT的組合以及FFT和MDCT的組合等)能夠?qū)崿F(xiàn)更簡(jiǎn)便的 編碼以及解碼的情況下,也可以使用不同種類的變換。音響編碼裝置在比特流中保持判斷 t-f變換是相同還是不同的信息、以及在使用不同的變換時(shí)分別使用哪個(gè)變換的信息。音響 解碼裝置根據(jù)這些信息實(shí)現(xiàn)解碼處理。降混信號(hào)編碼部404,對(duì)任意方式降混信號(hào)ADMX進(jìn)行編碼。作為該編碼方式,使用 非專利文獻(xiàn)1所記載的MPEG-AAC方式。另外,該降混信號(hào)編碼部404中的編碼方式,不限 于MPEG-AAC方式,也可以是MP3方式等非可逆編碼方式,也可以是MPEG-ALS等可逆編碼方 式。降混信號(hào)編碼部404中的編碼方式,在為MPEG-AAC方式的情況下,其延遲量在音響編 碼裝置中成為2048樣本(音響解碼裝置中1024樣本)。另外,本發(fā)明的降混信號(hào)編碼部404的編碼方式,不對(duì)比特率進(jìn)行特別限制,更適 合MDCT以及FFT等使用了直接變換的編碼方式。
計(jì)算上述SIAMX(f)和SIDMX(f)的過(guò)程能夠并行地進(jìn)行運(yùn)算,因此并行地實(shí)施運(yùn)算。 于是,音響編碼裝置整體的延遲量,能夠從D0+D1+D2+D3消減為maX(D0+Dl,D3)。尤其是, 本發(fā)明的音響編碼裝置,通過(guò)將降混編碼處理與SAC分析并列地進(jìn)行處理,來(lái)削減整體的延遲量。在本發(fā)明的音響解碼裝置中,通過(guò)削減由SAC合成部生成多聲道音響信號(hào)之前的 t-f變換處理、以及對(duì)降混解碼處理進(jìn)行中間處理,由此能夠?qū)⒀舆t量從D4+D0+D5+D2削減 為 D5+D2。下面,說(shuō)明音響解碼裝置。圖4是本發(fā)明實(shí)施方式1的音響解碼裝置的例子。并且,在圖4中在各部分的下 方表示延遲量。另外,與圖1同樣,此處的延遲量表示在蓄積了多個(gè)輸入信號(hào)之后輸出信號(hào) 的情況下從輸入到輸出為止的延遲量。并且,與圖1同樣,在從輸入到輸出的期間沒(méi)有蓄積 多個(gè)輸入信號(hào)的情況下,能夠忽視該部分的延遲量,因此在圖4中將延遲量表示為0。圖4所示的音響解碼裝置是將接收的比特流解碼為多聲道音響信號(hào)的音響解碼
直ο并且,圖4所示的音響解碼裝置具備解讀裝置501,將接收的比特流分離為數(shù)據(jù) 部和參數(shù)部;降混信號(hào)中間解碼部502,對(duì)數(shù)據(jù)部的編碼串進(jìn)行逆量化處理,并計(jì)算出頻域 的信號(hào);域變換部503,根據(jù)需要將計(jì)算出的頻域的信號(hào)向其他頻域的信號(hào)進(jìn)行變換;降混 調(diào)整電路504,通過(guò)參數(shù)部所包含的降混補(bǔ)償信息(DMXCue)對(duì)被變換為頻域的信號(hào)進(jìn)行調(diào) 整;多聲道信號(hào)生成部507,根據(jù)由降混調(diào)整電路504調(diào)整的信號(hào)和參數(shù)部所包含的空間信 息(SpatialCue),生成多聲道音響信號(hào);以及f_t變換部506,將生成的多聲道音響信號(hào)向 時(shí)間域的信號(hào)進(jìn)行變換。并且,多聲道信號(hào)生成部507具備通過(guò)SAC方式生成多聲道音響信號(hào)的SAC合成 部 505。解讀裝置501是根據(jù)1個(gè)輸入信號(hào)輸出多個(gè)信號(hào)的多路分離器的例子,是將1個(gè) 輸入信號(hào)分離為多個(gè)信號(hào)的分離部的例子。解讀裝置501將由圖1所示的音響編碼裝置所 生成的比特流分離為降混編碼串和空間信息(SpatialCue)。在分離比特流時(shí),解讀裝置501使用比特流所包含的降混編碼串的長(zhǎng)度信息和空 間信息(SpatialCue)的編碼串的長(zhǎng)度信息,來(lái)分離比特流。降混信號(hào)中間解碼部502,通過(guò)對(duì)由解讀裝置501分離的降混編碼串進(jìn)行逆量 化,來(lái)生成頻域的信號(hào)。在該過(guò)程中由于不存在延遲電路,因此不發(fā)生延遲。作為降混 信號(hào)中間解碼部502的形態(tài),例如在MPEG-AAC方式中,通過(guò)進(jìn)行到非專利文獻(xiàn)1記載的 FigureO. 2-MPEG-2AAC DecoderBlock Diagram所記載的濾波器組之前的處理,來(lái)計(jì)算頻域 (MPEG-AAC方式的情況下為MDCT系數(shù))的系數(shù)。即,作為不進(jìn)行濾波器組的處理的解碼處 理這一點(diǎn),是與現(xiàn)有例中的音響解碼裝置的不同點(diǎn)。在通常的音響解碼裝置中,由于濾波器 組所內(nèi)含的延遲電路而產(chǎn)生延遲,但是在本發(fā)明的降混信號(hào)中間解碼部502中不需要使用 濾波器組,因此不產(chǎn)生延遲。域變換部503,根據(jù)需要將通過(guò)降混信號(hào)中間解碼部502的降混中間解碼處理而 得到的頻域的信號(hào),向調(diào)整降混信號(hào)的其他頻域進(jìn)行變換。具體地說(shuō),域變換部503,使用編碼串所包含的頻域的降混補(bǔ)償域信息,向進(jìn)行降混補(bǔ)償?shù)挠蜻M(jìn)行變換。上述降混補(bǔ)償域信息,是表示在哪個(gè)域中進(jìn)行降混補(bǔ)償?shù)男畔ⅰ@?如,音響編碼裝置,作為上述降混補(bǔ)償域信息,在QMF濾波器組進(jìn)行的情況下對(duì)“01 ”進(jìn)行編 碼,在MDCT域進(jìn)行的情況下對(duì)“00”進(jìn)行編碼,在FFT域進(jìn)行的情況下對(duì)“ 10”進(jìn)行編碼,域 變換部503通過(guò)取得該信息來(lái)進(jìn)行判斷。之后,降混調(diào)整電路504,使用由音響編碼裝置計(jì)算出的降混補(bǔ) 償域信息 (DMXCue),對(duì)由域變換部503變換的降混信號(hào)進(jìn)行調(diào)整。即,通過(guò)計(jì)算來(lái)生成中間降混信號(hào) IDMX的頻域系數(shù)的近似值。調(diào)整方法根據(jù)降混補(bǔ)償信息(DMXCue)的編碼方式而不同,對(duì)此 留待后述。SAC合成部505使用由降混調(diào)整電路504調(diào)整的中間降混信號(hào)IDMX、以及空間信 息(SpatialCue)所包含的ICC及ILD等,分離為頻域的多聲道音響信號(hào)。f-t變換部506向時(shí)間域的多聲道音響信號(hào)進(jìn)行變換并再生。f_t變換部506使 用 IMDCT(Inverse Modified Discrete Cosine Transform,修正型離散余弦反變換)那樣 的濾波器組。作為SAC合成部505中的SAC方式使用MPEG環(huán)繞方式的情況,在非專利文獻(xiàn)1中記載。在如此構(gòu)成的音響解碼裝置的情況下,產(chǎn)生延遲的是包含延遲電路的SAC合成部 505和f-t變換部506。各自的延遲量為D5和D2。通常的SAC解碼裝置在圖9中表示,但是如果將其與本發(fā)明的音響解碼裝置(圖 4)進(jìn)行比較,則可知構(gòu)成的不同。如圖9所示,在通常的SAC解碼裝置的情況下,在降混信 號(hào)解碼部209中內(nèi)含有f-t變換部,由其引起的延遲存在D4樣本。并且,SAC合成部211是 頻域的運(yùn)算,因此需要將降混信號(hào)解碼部209的輸出臨時(shí)變換為頻域的t-f變換部210,由 該部分引起的延遲量存在DO樣本。因此,作為音響解碼裝置整體,成為D4+D0+D5+D2樣本。另一方面,在本發(fā)明的圖4中,整體的延遲量是將SAC合成部505的延遲量D5樣 本與f-t變換部506的延遲量D2樣本相加,與圖9的現(xiàn)有例相比較,削減了 D4+D0樣本量 的延遲。下面說(shuō)明降混補(bǔ)償電路406以及降混調(diào)整電路504的動(dòng)作。首先,通過(guò)指出現(xiàn)有技術(shù)中的問(wèn)題點(diǎn),來(lái)說(shuō)明本實(shí)施方式的降混補(bǔ)償電路406的
眉、ο圖8是現(xiàn)有例的SAC編碼裝置的構(gòu)成圖。降混部203,將頻域的多聲道音響信號(hào)降混為頻域的1或2聲道的中間降混信號(hào) IDMX。作為降混的方法,存在ITU建議的方法等。f-t變換部204,將頻域的1或2聲道的 音響信號(hào)即中間降混信號(hào)IDMX,變換為時(shí)間域的1或2聲道的音響信號(hào)即降混信號(hào)DMX。降混信號(hào)編碼部205,例如通過(guò)MPEG-AAC方式對(duì)降混信號(hào)DMX進(jìn)行編碼。此時(shí),降 混信號(hào)編碼部205,進(jìn)行從時(shí)間域向頻域的直接變換。因此,在f-t變換部204以及降混信 號(hào)編碼部205的從時(shí)間域向頻域的變換中,產(chǎn)生巨大的延遲量。因此,著眼于由降混信號(hào)編碼部205生成的頻域的降混信號(hào)、以及由SAC分析部 202生成的中間降混信號(hào)IDMX是相同種類的信號(hào)這一情況,削減f-t變換部204。并且,作 為將時(shí)間域的多聲道音響信號(hào)降混為1或2聲道的音響信號(hào)的電路,配置了圖1所示的任 意方式降混電路403。并且,配置進(jìn)行與降混信號(hào)編碼部205內(nèi)含的從時(shí)間域向頻域的變換處理同樣的處理的第二 t-f變換部405。此處,通過(guò)圖8所示的f_t變換部204將頻域的中間降混信號(hào)IDMX變換為時(shí)間域 之后最初的降混信號(hào)DMX,與通過(guò)圖1所示的上述任意方式降混電路403和第二 t-f變換 部405得到的時(shí)間域的1或2聲道的音響信號(hào)、即中間任意方式降混信號(hào)IADMX之間具有
差異。由于該差異,音質(zhì)惡化。因此,在本實(shí)施方式中,作為補(bǔ)償該差異的電路而設(shè)置降混補(bǔ)償電路406。由此,防 止音質(zhì)惡化。并且,由此能夠削減f_t變換部204的從頻域向時(shí)間域的變換處理的延遲量。下面,說(shuō)明本實(shí)施方式中的降混補(bǔ)償電路406的形態(tài)。為了進(jìn)行說(shuō)明,設(shè)在各編碼 幀以及解碼幀中能夠計(jì)算出M個(gè)頻域系數(shù)。SAC分析部402,將頻域的多聲道音響信號(hào)向中間降混信號(hào)IDMX進(jìn)行降混。設(shè)與 此時(shí)的中間降混信號(hào)IDMX相對(duì)應(yīng)的頻域系數(shù)為χ(η) (η = 0、1、…、M_l)。另一方面,第二 t-f變換部405,將由任意方式降混電路403生成的任意方式降混 信號(hào)ADMX,變換為頻域的信號(hào)即中間任意方式降混信號(hào)IADMX。設(shè)與此時(shí)的中間任意方式 降混信號(hào)IADMX相對(duì)應(yīng)的頻域系數(shù)為y (η) (η = 0、1、…、M_l)。降混補(bǔ)償電路406根據(jù)這2個(gè)信號(hào)計(jì)算降混補(bǔ)償信息(DMXCue)。本實(shí)施方式中的 降混補(bǔ)償電路406中的運(yùn)算過(guò)程如下所述。在頻域?yàn)榧兇獾念l域的情況下,這些作為空間信息(SpatialCue)以及降混補(bǔ)償 信息(DMXCue)的Cue (線索)信息,具有比較粗略的頻率分辨率。以下將根據(jù)頻率分辨率 而匯集的頻域系數(shù)的組,稱為參數(shù)集。如圖5所示,各參數(shù)集在大多數(shù)情況下包含1個(gè)以 上的頻域系數(shù)。為了使空間信息(SpatialCue)的組合單純,在本發(fā)明中,以與空間信息 (SpatialCue)的表現(xiàn)相同的構(gòu)成來(lái)計(jì)算所有降混補(bǔ)償信息(DMXCue)。當(dāng)然,降混補(bǔ)償信息 (DMXCue)和空間信息(SpatialCue)也可以是不同的構(gòu)成。基于縮放比例(scaling)的降混補(bǔ)償信息(DMXCue)的情況,如公式8所示。[公式8]
Σ X2⑶
門WG PSiG1 = ,——其中 i=^,Λ,Ν-1(Κ8)
,Σ, w
ne Psi此處,Glev, i是表示中間降混信號(hào)IDMX與中間任意方式降混信號(hào)IADMX的功率比 的降混補(bǔ)償信息(DMXCue)。x(n)是中間降混信號(hào)IDMX的頻域系數(shù)。y(n)是中間任意方式 降混信號(hào)IADMX的頻域系數(shù)。Psi是各參數(shù)集,具體說(shuō)是集合{0、1、…、M-1}的子集。N是 將M個(gè)集合{0、1、…、M-1}分為子集時(shí)的子集的數(shù)量,是參數(shù)集的數(shù)量。S卩,如圖5所示,降混補(bǔ)償電路406,根據(jù)各M個(gè)的頻域系數(shù)的χ (η)以及y(n),計(jì) 算N個(gè)降混補(bǔ)償信息(DMXCue)即Glev, ”計(jì)算出的G1ct, i被量化,并根據(jù)需要通過(guò)Huffman編碼手法排除冗余性,并重疊到 比特流中。在音響解碼裝置中,接收比特流,通過(guò)公式9根據(jù)解碼的中間任意方式降混信號(hào) IADMX的頻域系數(shù)即y (η)、以及接收的降混補(bǔ)償信息(DMXCue)即G1^i,來(lái)計(jì)算中間降混信號(hào)IDMX的頻域系數(shù)的近似值。[公式9]二 ;. JGlev i 其中 η e pSi 且 i =0,1,Λ,N-1 (式 9)此處,公式9的左邊表示中間降混信號(hào)IDMX的頻域系數(shù)的近似值。Psi是各參數(shù) 集。N是參數(shù)集的數(shù)量。圖4所示的音響解碼裝置的降混調(diào)整電路504,進(jìn)行公式9所示的運(yùn)算。 由此,音 響解碼裝置根據(jù)降混補(bǔ)償信息(DMXCue)即Glevii、以及從比特流得到的中間任意方式降混 信號(hào)IADMX的頻域系數(shù)即y (η),計(jì)算中間降混信號(hào)IDMX的頻域系數(shù)的近似值(公式9的左 邊)。SAC合成部505,根據(jù)計(jì)算中間降混信號(hào)IDMX的頻域系數(shù)的近似值生成多聲道音響信 號(hào)。f_t變換部506,將頻域的多聲道音響信號(hào)變換為時(shí)間域的多聲道音響信號(hào)。本實(shí)施方式中的音響解碼裝置,通過(guò)使用每個(gè)參數(shù)集的降混補(bǔ)償信息(DMXCue) 即Glev,來(lái)實(shí)現(xiàn)高效率的解碼處理。另外,在音響解碼裝置中,如果讀取圖2所示的LD_flag,并表示是附加了 LD_flag 的降混補(bǔ)償信息(DMXCue),則也可以跳過(guò)附加的降混補(bǔ)償信息(DMXCue)。由此,有時(shí)音質(zhì) 會(huì)惡化,但能夠進(jìn)行更低延遲的解碼處理。如此構(gòu)成的音響編碼裝置以及音響解碼裝置,(1)使運(yùn)算處理的一部分并列,(2) 使一部分的濾波器組共用,(3)新設(shè)置對(duì)由于這些而產(chǎn)生的音質(zhì)惡化進(jìn)行補(bǔ)償?shù)碾娐?,將?于補(bǔ)償?shù)妮o助信息作為比特流進(jìn)行傳送。由此,與低比特流且高音質(zhì)但延遲量較大MPEG環(huán) 繞方式所代表的SAC方式相比,能夠使算法延遲量半減并且實(shí)現(xiàn)同等的音質(zhì)。(實(shí)施方式2)以下,參照
本發(fā)明實(shí)施方式2的降混補(bǔ)償電路以及降混調(diào)整電路。實(shí)施方式2的音響編碼裝置以及音響解碼裝置的基本構(gòu)成與圖1以及圖4所示的 實(shí)施方式1的音響編碼裝置以及音響解碼裝置的構(gòu)成相同,但在實(shí)施方式2中降混補(bǔ)償電 路406的動(dòng)作不同,因此對(duì)其進(jìn)行詳細(xì)說(shuō)明。以下,說(shuō)明本實(shí)施方式中的降混補(bǔ)償電路406的動(dòng)作。首先,通過(guò)指出現(xiàn)有技術(shù)中的問(wèn)題點(diǎn),由此說(shuō)明本實(shí)施方式中的降混補(bǔ)償電路406 的意義。圖8是現(xiàn)有例的SAC編碼裝置的構(gòu)成圖。降混部203,將頻域的多聲道音響信號(hào)降混為頻域的1或2聲道的中間降混信號(hào) IDMX。作為降混的方法,存在ITU建議的方法等。f_t變換部204,將頻域的1或2聲道的 音響信號(hào)即中間降混信號(hào)IDMX,變換為時(shí)間域的1或2聲道的音響信號(hào)即降混信號(hào)DMX。降混信號(hào)編碼部205,例如通過(guò)MPEG-AAC方式對(duì)降混信號(hào)DMX進(jìn)行編碼。此時(shí),降 混信號(hào)編碼部205,進(jìn)行從時(shí)間域向頻域的直接變換。因此,在f-t變換部204以及降混信 號(hào)編碼部205的從時(shí)間域向頻域的變換中,產(chǎn)生巨大的延遲量。因此,著眼于由降混信號(hào)編碼部205生成的頻域的降混信號(hào)、以及由SAC分析部 202生成的中間降混信號(hào)IDMX是相同種類的信號(hào)這一情況,削減f-t變換部204。并且,作 為將時(shí)間域的多聲道音響信號(hào)降混為1或2聲道的音響信號(hào)的電路,配置了圖1所示的任 意方式降混電路403。并且,配置進(jìn)行與降混信號(hào)編碼部205內(nèi)含的從時(shí)間域向頻域的變換處理同樣的處理的第二 t-f變換部405。此處,通過(guò)圖8所示的f_t變換部204將頻域的中間降混信號(hào)IDMX變換為時(shí)間域 之后最初的降混信號(hào)DMX,與通過(guò)圖1所示的上述任意方式降混電路403和第二 t-f變換 部405得到的時(shí)間域的1或2聲道的音響信號(hào)、即中間任意方式降混信號(hào)IADMX之間具有
差異。由于該差異,音質(zhì)惡化。因此,在本實(shí)施方式中,作為補(bǔ)償該差異的電路而設(shè)置降混補(bǔ)償電路406。由此,防 止音質(zhì)惡化。并且,由此能夠削減f_t變換部204的從頻域向時(shí)間域的變換處理的延遲量。下面,說(shuō)明本實(shí)施方式中的降混補(bǔ)償電路406的形態(tài)。為了進(jìn)行說(shuō)明,設(shè)在各編碼 幀以及解碼幀中能夠計(jì)算出M個(gè)頻域系數(shù)。SAC分析部402,將頻域的多聲道音響信號(hào)向中間降混信號(hào)IDMX進(jìn)行降混。設(shè)與 此時(shí)的中間降混信號(hào)IDMX相對(duì)應(yīng)的頻域系數(shù)為χ(η) (η = 0、1、…、M_l)。另一方面,第二 t-f變換部405,將由任意方式降混電路403生成的任意方式降混 信號(hào)ADMX,變換為頻域的信號(hào)即中間任意方式降混信號(hào)IADMX。設(shè)與此時(shí)的中間任意方式 降混信號(hào)IADMX相對(duì)應(yīng)的頻域系數(shù)為y (η) (η = 0、1、…、M_l)。降混補(bǔ)償電路406根據(jù)這2個(gè)信號(hào)計(jì)算降混補(bǔ)償信息(DMXCue)。本實(shí)施方式中的 降混補(bǔ)償電路406中的運(yùn)算過(guò)程如下所述。在頻域?yàn)榧兇獾念l域的情況下,這些作為空間信息(SpatialCue)以及降混補(bǔ)償 信息(DMXCue)的Cue信息,具有比較粗略的頻率分辨率。以下將根據(jù)頻率分辨率而匯集的 頻域系數(shù)的組,稱為參數(shù)集。如圖5所示,各參數(shù)集在大多數(shù)情況下包含1個(gè)以上的頻域系 數(shù)。為了使空間信息(SpatialCue)的組合單純,在本發(fā)明中,以與空間信息(SpatialCue) 的表現(xiàn)相同的構(gòu)成來(lái)計(jì)算所有降混補(bǔ)償信息(DMXCue)。當(dāng)然,降混補(bǔ)償信息(DMXCue)和空 間信息(SpatialCue)也可以是不同的構(gòu)成。在作為SAC方式而使用MPEG環(huán)繞方式的情況下,從時(shí)間域向頻域的變換使用QMF 濾波器組。如圖6所示,在使用QMF濾波器組進(jìn)行了變換的情況下,變換的結(jié)果為,成為在 時(shí)間軸方向上也具有充分的頻域即混合域。此時(shí),作為中間降混信號(hào)IDMX的頻域系數(shù)的 χ (η)、作為中間任意方式降混信號(hào)IADMX的頻域系數(shù)的y (η),被表示為將頻域系數(shù)進(jìn)行了 時(shí)分的表現(xiàn) x(m,hb)和 y(m,hb) (m = 0、1、…、M_l,hb = 0、1、…、HB-1)。并且,與參數(shù)帶(band)和參數(shù)集的合成參數(shù)(PS-PB)相對(duì)應(yīng)而計(jì)算出空間信息 (SpatialCue)。如圖6所示,各合成參數(shù)(PS-PB) —般包含多個(gè)時(shí)隙和混合帶。此時(shí),降混 補(bǔ)償電路406通過(guò)公式10來(lái)計(jì)算降混補(bǔ)償信息(DMXCue)。[公式10]
<formula>formula see original document page 23</formula>此處,Glev,i是表示中間降混信號(hào)IDMX和中間任意方式降混信號(hào)IADMX的功率比的 降混補(bǔ)償信息(DMXCue)。Psi是各參數(shù)集。Pbi是參數(shù)帶。N是合成參數(shù)(PS-PB)的數(shù)量。 x(m,hb)是中間降混信號(hào)IDMX的頻域系數(shù)。y(m,hb)是中間任意方式降混信號(hào)IADMX的頻 域系數(shù)。S卩,如圖6所示,降混補(bǔ)償電路406根據(jù)與M個(gè)時(shí)隙以及HB個(gè)混合帶相對(duì)應(yīng)的χ (m,hb)以及y(m,hb),計(jì)算與N個(gè)合成參數(shù)(PS-PB)相對(duì)應(yīng)的降混補(bǔ)償信息(DMXCue)即Glev, i °重疊裝置407,將所計(jì)算出的降混補(bǔ)償信息(DMXCue)重疊到比特流中進(jìn)行傳送。并且,圖4所示的音響解碼裝置的降混調(diào)整電路504,通過(guò)公式11計(jì)算中間降混信 號(hào)IDMX的頻域系數(shù)的近似值。[公式11]
無(wú)(/ ,/^)= ;;0 ,劬)-7^7其中111 e Psi, hb G Pbi 且 i = 0,1,Λ,N-1 (式 11)此處,公式11的左邊表示中間降混信號(hào)IDMX的頻域系數(shù)的近似值。Gleva是表示 中間降混信號(hào)IDMX和中間任意方式降混信號(hào)IADMX的功率比的降混補(bǔ)償信息(DMXCue)。 Psi是參數(shù)集。Pbi是參數(shù)帶。N是合成參數(shù)(PS-PB)的數(shù)量。圖4所示的音響解碼裝置的降混調(diào)整電路504,進(jìn)行公式11所示的運(yùn)算。由此, 音響解碼裝置根據(jù)降混補(bǔ)償信息(DMXCue)即G1ct、以及從比特流得到的中間任意方式降混 信號(hào)IADMX的頻域系數(shù)即y(m,hb),計(jì)算中間降混信號(hào)IDMX的頻域系數(shù)的近似值(公式11 的左邊)。SAC合成部505,根據(jù)計(jì)算中間降混信號(hào)IDMX的頻域系數(shù)的近似值生成多聲道音 響信號(hào)。f_t變換部506,將頻域的多聲道音響信號(hào)變換為時(shí)間域的多聲道音響信號(hào)。在本實(shí)施方式中,通過(guò)使用每個(gè)合成參數(shù)(PS-PB)的降混補(bǔ)償信息(DMXCue)即 Glev, ρ來(lái)實(shí)現(xiàn)高效率的解碼處理。如此構(gòu)成的音響編碼裝置以及音響解碼裝置,(1)使運(yùn)算處理的一部分并列,(2) 使一部分的濾波器組共用,(3)新設(shè)置對(duì)由于這些而產(chǎn)生的音質(zhì)惡化進(jìn)行補(bǔ)償?shù)碾娐?,將?于補(bǔ)償?shù)妮o助信息作為比特流進(jìn)行傳送。由此,與低比特流且高音質(zhì)但延遲量較大MPEG環(huán) 繞方式所代表的SAC方式相比,能夠使算法延遲量半減并且實(shí)現(xiàn)同等的音質(zhì)。(實(shí)施方式3)以下,參照
本發(fā)明實(shí)施方式3的降混補(bǔ)償電路以及降混調(diào)整電路。實(shí)施方式3的音響編碼裝置以及音響解碼裝置的基本構(gòu)成與圖1以及圖4所示的 實(shí)施方式1的音響編碼裝置以及音響解碼裝置的構(gòu)成相同,但在實(shí)施方式3中降混補(bǔ)償電 路406的動(dòng)作不同,因此對(duì)其進(jìn)行詳細(xì)說(shuō)明。以下,說(shuō)明本實(shí)施方式中的降混補(bǔ)償電路406的動(dòng)作。首先,通過(guò)指出現(xiàn)有技術(shù)中的問(wèn)題點(diǎn),由此說(shuō)明本實(shí)施方式中的降混補(bǔ)償電路406 的意義。圖8是現(xiàn)有例的SAC編碼裝置的構(gòu)成圖。降混部203,將頻域的多聲道音響信號(hào)降混為頻域的1或2聲道的中間降混信號(hào) IDMX。作為降混的方法,存在ITU建議的方法等。f_t變換部204,將頻域的1或2聲道的 音響信號(hào)即中間降混信號(hào)IDMX,變換為時(shí)間域的1或2聲道的音響信號(hào)即降混信號(hào)DMX。降混信號(hào)編碼部205,例如通過(guò)MPEG-AAC方式對(duì)降混信號(hào)DMX進(jìn)行編碼。此時(shí),降 混信號(hào)編碼部205,進(jìn)行從時(shí)間域向頻域的直接變換。因此,在f-t變換部204以及降混信 號(hào)編碼部205的從時(shí)間域向頻域的變換中,產(chǎn)生巨大的延遲量。因此,著眼于由降混信號(hào)編碼部205生成的頻域的降混信號(hào)、以及由SAC分析部 202生成的中間降混信號(hào)IDMX是相同種類的信號(hào)這一情況,削減f-t變換部204。并且,作 為將時(shí)間域的多聲道音響信號(hào)降混為1或2聲道的音響信號(hào)的電路,配置了圖1所示的任意方式降混電路403。并且,配置進(jìn)行與降混信號(hào)編碼部205內(nèi)含的從時(shí)間域向頻域的變換處理同樣的處理的第二 t-f變換部405。此處,通過(guò)圖8所示的f_t變換部204將頻域的中間降混信號(hào)IDMX變換為時(shí)間域 之后最初的降混信號(hào)DMX,與通過(guò)圖1所示的上述任意方式降混電路403和第二 t-f變換 部405得到的時(shí)間域的1或2聲道的音響信號(hào)、即中間任意方式降混信號(hào)IADMX之間具有
差異。由于該差異,音質(zhì)惡化。因此,在本實(shí)施方式中,作為補(bǔ)償該差異的電路而設(shè)置降混補(bǔ)償電路406。由此,防 止音質(zhì)惡化。并且,由此能夠削減f_t變換部204的從頻域向時(shí)間域的變換處理的延遲量。下面,說(shuō)明本實(shí)施方式中的降混補(bǔ)償電路406的形態(tài)。為了進(jìn)行說(shuō)明,設(shè)在各編碼 幀以及解碼幀中能夠計(jì)算出M個(gè)頻域系數(shù)。SAC分析部402,將頻域的多聲道音響信號(hào)向中間降混信號(hào)IDMX進(jìn)行降混。設(shè)與 此時(shí)的中間降混信號(hào)IDMX相對(duì)應(yīng)的頻域系數(shù)為χ(η) (η = 0、1、…、M_l)。另一方面,第二 t-f變換部405,將由任意方式降混電路403生成的任意方式降混 信號(hào)ADMX,變換為頻域的信號(hào)即中間任意方式降混信號(hào)IADMX。設(shè)與此時(shí)的中間任意方式 降混信號(hào)IADMX相對(duì)應(yīng)的頻域系數(shù)為y (η) (η = 0、1、…、M_l)。降混補(bǔ)償電路406根據(jù)這2個(gè)信號(hào)計(jì)算降混補(bǔ)償信息(DMXCue)。本實(shí)施方式中的 降混補(bǔ)償電路406中的運(yùn)算過(guò)程如下所述。在頻域?yàn)榧兇獾念l域的情況下,降混補(bǔ)償電路406通過(guò)公式12計(jì)算降混補(bǔ)償信息 (DMXCue)即G1ct,來(lái)作為中間降混信號(hào)IDMX與中間任意方式降混信號(hào)IADMX的差分。[公式12]<formula>formula see original document page 25</formula>(式 12)公式12中的Gres是表示中間降混信號(hào)IDMX和中間任意方式降混信號(hào)IADMX的差 分的降混補(bǔ)償信息(DMXCue)。χ(η)是中間降混信號(hào)IDMX的頻域系數(shù)。y(n)是中間任意方 式降混信號(hào)IADMX的頻域系數(shù)。M是在編碼幀以及解碼幀中被計(jì)算出頻域系數(shù)的數(shù)量。通過(guò)公式12計(jì)算的殘差信號(hào),根據(jù)需要進(jìn)行量化,并通過(guò)Huffman編碼來(lái)排除冗 余性,并重疊到比特流中發(fā)送給音響解碼裝置。另外,在公式12所記載的差分運(yùn)算中,由于未使用實(shí)施方式1所示的參數(shù)集,因此 計(jì)算結(jié)果的數(shù)量變多。因此,按照計(jì)算結(jié)果的殘差信號(hào)的編碼方式,有時(shí)比特率變高。因 此,在對(duì)降混補(bǔ)償信息(DMXCue)進(jìn)行編碼時(shí),例如使用將殘差信號(hào)作為純粹的數(shù)值串而適 用向量量化方法的情況等,將比特率的上升抑制為最小限度。在該情況下,在殘差信號(hào)的編 碼以及解碼時(shí),不是在蓄積了多個(gè)信號(hào)之后進(jìn)行輸出,因此當(dāng)然不會(huì)有算法延遲量。音響解碼裝置的降混調(diào)整電路504,根據(jù)作為殘差信號(hào)的G,es和作為中間任意方 式降混信號(hào)IADMX的頻域系數(shù)的y (η),通過(guò)公式13來(lái)計(jì)算中間降混信號(hào)IDMX的頻域系數(shù) 的近似值。[公式Π]<formula>formula see original document page 25</formula>(式 13)此處,公式13的左邊表示中間降混信號(hào)IDMX的頻域系數(shù)的近似值。M是在編碼幀 以及解碼幀中被計(jì)算出頻域系數(shù)的數(shù)量。圖4所示的音響解碼裝置的降混調(diào)整電路504,進(jìn)行公式13所示的運(yùn)算。由此,音響解碼裝置根據(jù)降混補(bǔ)償信息(DMXCue)即Gres、以及從比特流得到的中間任意方式降混信 號(hào)IADMX的頻域系數(shù)即y(n),計(jì)算中間降混信號(hào)IDMX的頻域系數(shù)的近似值(公式13的左 邊)。SAC合成部505,根據(jù)計(jì)算中間降混信號(hào)IDMX的頻域系數(shù)的近似值生成多聲道音響信 號(hào)。f_t變換部506,將頻域的多聲道音響信號(hào)變換為時(shí)間域的多聲道音響信號(hào)。在頻域是頻率與時(shí)間的混合域的情況下,降混補(bǔ)償電路406通過(guò)公式14計(jì)算降混 補(bǔ)償信息(DMXCue)。[公式14]Gres (m,hb) = (χ (m, hb) -y (m, hb))其中 m = 0,1, A,M-I ; hb = 0,1, Λ,HB-1 (式 14)公式14中的Gres是表示中間降混信號(hào)IDMX和中間任意方式降混信號(hào)IADMX的差 分的降混補(bǔ)償信息(DMXCue)。x(m, hb)是中間降混信號(hào)IDMX的頻域系數(shù)。y(m, hb)是中 間任意方式降混信號(hào)IADMX的頻域系數(shù)。M是在編碼幀以及解碼幀中被計(jì)算出頻域系數(shù)的 數(shù)量。HB是混合帶的數(shù)量。并且,圖4所示的音響解碼裝置的降混調(diào)整電路504通過(guò)公式15,計(jì)算中間降混信 號(hào)IDMX的頻域系數(shù)的近似值。[公式15]無(wú)(》1,;16)= >< 7,/^) + <^ 0,秘)其中111 = 0,1,A ,M-I ;hb = 0,1,Λ,HB-1 (式 15)此處,公式15的左邊表示中間降混信號(hào)IDMX的頻域系數(shù)的近似值。y (m,hb)是 中間任意方式降混信號(hào)IADMX的頻域系數(shù)。M是在編碼幀以及解碼幀中被計(jì)算出頻域系數(shù) 的數(shù)量。HB是混合帶的數(shù)量。圖4所示的音響解碼裝置的降混調(diào)整電路504,進(jìn)行公式15所示的運(yùn)算。由此, 音響解碼裝置根據(jù)降混補(bǔ)償信息(DMXCue)即、以及從比特流得到的中間任意方式降混 信號(hào)IADMX的頻域系數(shù)即y(m,hb),計(jì)算中間降混信號(hào)IDMX的頻域系數(shù)的近似值(公式15 的左邊)。SAC合成部505,根據(jù)計(jì)算中間降混信號(hào)IDMX的頻域系數(shù)的近似值生成多聲道音 響信號(hào)。f_t變換部506,將頻域的多聲道音響信號(hào)變換為時(shí)間域的多聲道音響信號(hào)。如此構(gòu)成的音響編碼裝置以及音響解碼裝置,(1)使運(yùn)算處理的一部分并列,(2) 使一部分的濾波器組共用,(3)新設(shè)置對(duì)由于這些而產(chǎn)生的音質(zhì)惡化進(jìn)行補(bǔ)償?shù)碾娐?,將?于補(bǔ)償?shù)妮o助信息作為比特流進(jìn)行傳送。由此,與低比特流且高音質(zhì)但延遲量較大MPEG環(huán) 繞方式所代表的SAC方式相比,能夠使算法延遲量半減并且實(shí)現(xiàn)同等的音質(zhì)。(實(shí)施方式4)以下,參照
本發(fā)明實(shí)施方式4的降混補(bǔ)償電路以及降混調(diào)整電路。實(shí)施方式4的音響編碼裝置以及音響解碼裝置的基本構(gòu)成與圖1以及圖4所示的 實(shí)施方式1的音響編碼裝置以及音響解碼裝置的構(gòu)成相同,但在實(shí)施方式4中降混補(bǔ)償電 路406以及降混調(diào)整電路504的動(dòng)作不同,因此對(duì)其進(jìn)行詳細(xì)說(shuō)明。以下,說(shuō)明本實(shí)施方式中的降混補(bǔ)償電路406的動(dòng)作。首先,通過(guò)指出現(xiàn)有技術(shù)中的問(wèn)題點(diǎn),由此說(shuō)明本實(shí)施方式中的降混補(bǔ)償電路406 的意義。圖8是現(xiàn)有例的SAC編碼裝置的構(gòu)成圖。降混部203,將頻域的多聲道音響信號(hào)降混為頻域的1或2聲道的中間降混信號(hào)IDMX。作為降混的方法,存在ITU建議的方法等。f_t變換部204,將頻域的1或2聲道的 音響信號(hào)即中間降混信號(hào)IDMX,變換為時(shí)間域的1或2聲道的音響信號(hào)即降混信號(hào)DMX。降混信號(hào)編碼部205,例如通過(guò)MPEG-AAC方式對(duì)降混信號(hào)DMX進(jìn)行編碼。此時(shí),降 混信號(hào)編碼部205,進(jìn)行從時(shí)間域向頻域的直接變換。因此,在f-t變換部204以及降混信 號(hào)編碼部205的從時(shí)間域向頻域的變換中,產(chǎn)生巨大的延遲量。因此,著眼于由降混信號(hào)編碼部205生成的頻域的降混信號(hào)、以及由SAC分析部 202生成的中間降混信號(hào)IDMX是相同種類的信號(hào)這一情況,削減f-t變換部204。并且,作 為將時(shí)間域的多聲道音響信號(hào)降混為1或2聲道的音響信號(hào)的電路,配置了圖1所示的任 意方式降混電路403。并且,配置進(jìn)行與降混信號(hào)編碼部205內(nèi)含的從時(shí)間域向頻域的變換 處理同樣的處理的第二 t-f變換部405。此處,通過(guò)圖8所示的f-t變換部204將頻域的中間降混信號(hào)IDMX變換為時(shí)間域 之后最初的降混信號(hào)DMX,與通過(guò)圖1所示的上述任意方式降混電路403和第二 t-f變換 部405得到的時(shí)間域的1或2聲道的音響信號(hào)、即中間任意方式降混信號(hào)IADMX之間具有
差異。由于該差異,音質(zhì)惡化。因此,在本實(shí)施方式中,作為補(bǔ)償該差異的電路而設(shè)置降混補(bǔ)償電路406。由此,防 止音質(zhì)惡化。并且,由此能夠削減f-t變換部204的從頻域向時(shí)間域的變換處理的延遲量。下面,說(shuō)明本實(shí)施方式中的降混補(bǔ)償電路406的形態(tài)。為了進(jìn)行說(shuō)明,設(shè)在各編碼 幀以及解碼幀中能夠計(jì)算出M個(gè)頻域系數(shù)。SAC分析部402,將頻域的多聲道音響信號(hào)向中間降混信號(hào)IDMX進(jìn)行降混。設(shè)與 此時(shí)的中間降混信號(hào)IDMX相對(duì)應(yīng)的頻域系數(shù)為χ(η) (η = 0、1、…、M_l)。另一方面,第二 t-f變換部405,將由任意方式降混電路403生成的任意方式降混 信號(hào)ADMX,變換為頻域的信號(hào)即中間任意方式降混信號(hào)IADMX。設(shè)與此時(shí)的中間任意方式 降混信號(hào)IADMX相對(duì)應(yīng)的頻域系數(shù)為y (η) (η = 0、1、…、M_l)。降混補(bǔ)償電路406根據(jù)這2個(gè)信號(hào)計(jì)算降混補(bǔ)償信息(DMXCue)。本實(shí)施方式中的 降混補(bǔ)償電路406中的運(yùn)算過(guò)程如下所述。首先,對(duì)頻域?yàn)榧兇獾念l域的情況進(jìn)行說(shuō)明。降混補(bǔ)償電路406,計(jì)算預(yù)測(cè)濾波系數(shù),作為上述降混補(bǔ)償信息(DMXCue)。作為 降混補(bǔ)償電路406所使用的預(yù)測(cè)濾波系數(shù)的生成方法,有Wiener (維納)的FIR(Finite Impulse Response,有限脈沖響應(yīng))濾波器中的基于最小自乘法(MMSE :Minimum Mean Square Error,最小均方誤差)的最佳預(yù)測(cè)濾波系數(shù)的生成方法。在設(shè)Wiener 濾波器的 FIR 系數(shù)為 Gpred, JOhGpred, Jl)、-,Gpredji(K-I)的情況下, 作為MSE(Mean Square Error,均方誤差)的值的ξ由公式16表示。[公式16]<formula>formula see original document page 27</formula>)其中 i = 0,l,Λ,Ν-1(式 16)
公式16中的x(n)是中間降混信號(hào)IDMX的頻域系數(shù)。y(n)是中間任意方式降混 信號(hào)IADMX的頻域系數(shù)。K是FIR系數(shù)。pSi是參數(shù)集。降混補(bǔ)償電路406,在求MSE的公式16中,如公式17所示,計(jì)算使對(duì)于Gpral, i (j)的各個(gè)要素的微分系數(shù)為O的Gpral,i(j),作為降混補(bǔ)償信息(DMXCue)。[公式17]<formula>formula see original document page 28</formula>式17中的是y(n)的自相關(guān)矩陣。Oyx是與中間任意方式降混信號(hào)IADMX相 對(duì)應(yīng)的y(n)和與中間降混信號(hào)IDMX相對(duì)應(yīng)的χ (η)的互相關(guān)矩陣。另外,η是參數(shù)集Psi 的要素。音響編碼裝置,將如此計(jì)算的Gpral, i(j)進(jìn)行量化而并入編碼串中進(jìn)行傳送。接收了編碼串的音響解碼裝置的降混調(diào)整電路504,根據(jù)接收的中間任意方式降 混信號(hào)IADMX的頻域系數(shù)即y(n)、以及預(yù)測(cè)系數(shù)Gpral,山_),如下地計(jì)算中間降混信號(hào)IDMX 的頻域系數(shù)的近似值。[公式I8]<formula>formula see original document page 28</formula>此處,公式18的左邊表示中間降混信號(hào)IDMX的頻域系數(shù)的近似值。圖4所示的音響解碼裝置的降混調(diào)整電路504,進(jìn)行公式18所示的運(yùn)算。由此,在 音響解碼裝置中,根據(jù)降混補(bǔ)償信息(DMXCue)即GpMd,t、以及從比特流解碼的中間任意方式 降混信號(hào)IADMX的頻域系數(shù)即y (η),計(jì)算中間降混信號(hào)IDMX的頻域系數(shù)的近似值(公式 18的左邊),SAC合成部505,根據(jù)中間降混信號(hào)IDMX的頻域系數(shù)的近似值生成多聲道音響 信號(hào)。f_t變換部506,將頻域的多聲道音響信號(hào)變換為時(shí)間域的多聲道音響信號(hào)。在頻域是頻域與時(shí)間域的混合域的情況下,降混補(bǔ)償電路406如下地計(jì)算降混補(bǔ) 償信息(DMXCue)。[公式19]<formula>formula see original document page 28</formula>
公式19中的GpredJj)是Wiener濾波器的FIR系數(shù),計(jì)算使對(duì)于各個(gè)要素的微分 系數(shù)成為0的Gpred, i (j),作為預(yù)測(cè)系數(shù)。
并且,式19中的是y(m,hb)的自相關(guān)矩陣。Oyx是與中間任意方式降混信號(hào) IADMX的頻域系數(shù)即y (m,hb)和與中間降混信號(hào)IDMX的頻域系數(shù)x(m,hb)的互相關(guān)矩陣。 另外,m是參數(shù)集pSi的要素,hb是參數(shù)帶Pbi的要素。作為最小自乘法中的評(píng)價(jià)函數(shù)而使用公式20。[公式2O]
<formula>formula see original document page 29</formula>公式20中的χ (m,hb)是中間降混信號(hào)IDMX的頻域系數(shù)。y (m,hb)是中間任意方 式降混信號(hào)IADMX的頻域系數(shù)。K是FIR系數(shù)。pSi是參數(shù)集。Pbi是參數(shù)帶。此時(shí),音響解碼裝置的降混調(diào)整電路504,根據(jù)接收的中間任意方式降混信號(hào) IADMX的頻域系數(shù)即y (η)、以及接收的預(yù)測(cè)系數(shù)Gpred,, (j),通過(guò)公式21計(jì)算中間降混信號(hào) IDMX的頻域系數(shù)的近似值。[公式21]
K-I^(/ ,/^-^^。^,+ (幻-火講,劬一幻其中 m e Psi,hb G Pbi 且 i = 0,1, Λ,Ν_1 (式
Jt=O
21)此處,公式21的左邊表示中間降混信號(hào)IDMX的頻域系數(shù)的近似值。圖4所示的音響解碼裝置的降混調(diào)整電路504,進(jìn)行公式21所示的運(yùn)算。由此,在 音響解碼裝置中,根據(jù)降混補(bǔ)償信息(DMXCue)即Gpral、以及從比特流中得到的中間任意方 式降混信號(hào)IADMX的頻域系數(shù)即y (η),計(jì)算中間降混信號(hào)IDMX的頻域系數(shù)的近似值(公式 21的左邊)。SAC合成部505,根據(jù)中間降混信號(hào)IDMX的頻域系數(shù)的近似值生成多聲道音 響信號(hào)。f_t變換部506,將頻域的多聲道音響信號(hào)變換為時(shí)間域的多聲道音響信號(hào)。如此構(gòu)成的音響編碼裝置以及音響解碼裝置,(1)使運(yùn)算處理的一部分并列,(2) 使一部分的濾波器組共用,(3)新設(shè)置對(duì)由于這些而產(chǎn)生的音質(zhì)惡化進(jìn)行補(bǔ)償?shù)碾娐罚瑢⒂?于補(bǔ)償?shù)妮o助信息作為比特流進(jìn)行傳送。由此,與低比特流且高音質(zhì)但延遲量較大MPEG環(huán) 繞方式所代表的SAC方式相比,能夠使算法延遲量半減并且實(shí)現(xiàn)同等的音質(zhì)。并且,根據(jù)本發(fā)明的音響編碼裝置以及音響解碼裝置,能夠削減現(xiàn)有例中的多聲 道音響編碼裝置以及多聲道音響解碼裝置的算法延遲,能夠高效地兼顧處于折衷關(guān)系的比 特率與音質(zhì)的關(guān)系。S卩,能夠發(fā)揮的效果為與現(xiàn)有例的多聲道音響編碼技術(shù)相比能夠削減算法延遲, 并能夠?qū)崿F(xiàn)進(jìn)行實(shí)時(shí)通話的會(huì)議系統(tǒng)以及需要低延遲、高音質(zhì)的多聲道音響信號(hào)的傳送的 充滿臨場(chǎng)感的通信系統(tǒng)等的構(gòu)筑。因此,通過(guò)本發(fā)明,能夠進(jìn)行高音質(zhì)、低比特率且低延遲的收發(fā)。因此,在便攜電話 等移動(dòng)設(shè)備彼此的充滿臨場(chǎng)感的交流變得普及、AV設(shè)備以及會(huì)議系統(tǒng)中的正式的臨場(chǎng)感交 流變得普及的當(dāng)今,本發(fā)明的實(shí)用價(jià)值極高。當(dāng)然,用途并不限于此,對(duì)于需要延遲量小的 全部雙向交流當(dāng)然也是有效的發(fā)明。以上,基于實(shí)施方式1 4說(shuō)明了本發(fā)明的音響編碼裝置以及音響解碼裝置,但本 發(fā)明不限于這些實(shí)施方式。對(duì)于這些實(shí)施方式實(shí)施本領(lǐng)域技術(shù)人員所想到的各種變形而 得到的方式、以及將這些實(shí)施方式的構(gòu)成要素任意地組合而實(shí)現(xiàn)的其他方式也包含于本發(fā)明。并且,本發(fā)明不僅能夠作為這種音響編碼裝置以及音響解碼裝置實(shí)現(xiàn),也可作為 將這種音響編碼裝置以及音響解碼裝置所具備的特征的構(gòu)件作為步驟的音響編碼方法以 及音響解碼方法實(shí)現(xiàn)。并且,能夠作為使計(jì)算機(jī)執(zhí)行這些步驟的程序?qū)崿F(xiàn)。并且,也能夠構(gòu) 成為將音響編碼裝置以及音響解碼裝置所具備的特征手段一體化的LSI等半導(dǎo)體集成電 路。并且,這種程序當(dāng)然能夠經(jīng)由⑶-ROM等記錄媒體以及互聯(lián)網(wǎng)等傳送媒體來(lái)提供。工業(yè)可利用性本發(fā)明能夠用于進(jìn)行使用多聲道音響編碼技術(shù)以及多聲道音響解碼技術(shù)的實(shí)時(shí) 通話的會(huì)議系統(tǒng)、以及需要低延遲且高音質(zhì)的多聲道音響信號(hào)的傳送的充滿臨場(chǎng)感的通信 系統(tǒng)中。當(dāng)然,本發(fā)明不限于此,對(duì)于需要較小延遲量的雙向交流整體能夠適用。例如,本 發(fā)明能夠適用于家庭影院系統(tǒng)、車載音響系統(tǒng)、電子游戲系統(tǒng)、會(huì)議系統(tǒng)以及便攜電話等。
權(quán)利要求
一種音響編碼裝置,對(duì)輸入的多聲道音響信號(hào)進(jìn)行編碼,具備降混信號(hào)生成部,在時(shí)間域上對(duì)輸入的上述多聲道音響信號(hào)進(jìn)行降混,由此生成作為1或2聲道的音響信號(hào)的第一降混信號(hào);降混信號(hào)編碼部,對(duì)由上述降混信號(hào)生成部生成的第一降混信號(hào)進(jìn)行編碼;第一t-f變換部,將輸入的上述多聲道音響信號(hào)變換為頻域的多聲道音響信號(hào);以及空間信息計(jì)算部,對(duì)由上述第一t-f變換部進(jìn)行了變換的頻域的多聲道音響信號(hào)進(jìn)行分析,由此生成作為根據(jù)降混信號(hào)生成多聲道音響信號(hào)的信息的空間信息。
2.如權(quán)利要求1所述的音響編碼裝置,其中, 上述音響編碼裝置還具備第二 t-f變換部,將由上述降混信號(hào)生成部生成的第一降混信號(hào)變換為頻域的第一降 混信號(hào);降混部,對(duì)由上述第一 t-f變換部進(jìn)行了變換的頻域的多聲道音響信號(hào)進(jìn)行降混,由 此生成頻域的第二降混信號(hào);以及降混補(bǔ)償電路,對(duì)由上述第二 t-f變換部進(jìn)行了變換的頻域的第一降混信號(hào)與由上述 降混部生成的頻域的第二降混信號(hào)進(jìn)行比較,由此計(jì)算作為對(duì)降混信號(hào)進(jìn)行調(diào)整的信息的 降混補(bǔ)償信息。
3.如權(quán)利要求2所述的音響編碼裝置,其中,上述音響編碼裝置還具備重疊裝置,該重疊裝置將上述降混補(bǔ)償信息和上述空間信息 存放至相同的編碼串。
4.如權(quán)利要求2所述的音響編碼裝置,其中,上述降混補(bǔ)償電路計(jì)算信號(hào)的功率比,作為上述降混補(bǔ)償信息。
5.如權(quán)利要求2所述的音響編碼裝置,其中,上述降混補(bǔ)償電路計(jì)算信號(hào)的差分,作為上述降混補(bǔ)償信息。
6.如權(quán)利要求2所述的音響編碼裝置,其中,上述降混補(bǔ)償電路計(jì)算預(yù)測(cè)濾波系數(shù),作為上述降混補(bǔ)償信息。
7.一種音響解碼裝置,將接收的比特流解碼為多聲道音響信號(hào),具備分離部,將接收的比特流分離為數(shù)據(jù)部和參數(shù)部,數(shù)據(jù)部包含被編碼的降混信號(hào),參數(shù) 部包含作為根據(jù)降混信號(hào)生成多聲道音響信號(hào)的信息的空間信息、以及作為對(duì)降混信號(hào)進(jìn) 行調(diào)整的信息的降混補(bǔ)償信息;降混調(diào)整電路,使用上述參數(shù)部所包含的降混補(bǔ)償信息,對(duì)從上述數(shù)據(jù)部得到的頻域 的降混信號(hào)進(jìn)行調(diào)整;多聲道信號(hào)生成部,使用上述參數(shù)部所包含的空間信息,根據(jù)由上述降混調(diào)整電路進(jìn) 行了調(diào)整的頻域的降混信號(hào),生成頻域的多聲道音響信號(hào);以及f_t變換部,將由上述多聲道信號(hào)生成部生成的頻域的多聲道音響信號(hào)變換為時(shí)間域 的多聲道音響信號(hào)。
8.如權(quán)利要求7所述的音響解碼裝置,其中, 上述音響解碼裝置還具備降混中間解碼部,對(duì)上述數(shù)據(jù)部所包含的被編碼的降混信號(hào)進(jìn)行逆量化,由此生成頻 域的降混信號(hào);以及域變換部,將由上述降混中間解碼部生成的頻域的降混信號(hào)變換為在時(shí)間軸方向也具 有成分的頻域的降混信號(hào);上述降混調(diào)整電路對(duì)由上述域變換部進(jìn)行了變換的頻域的降混信號(hào),根據(jù)上述降混補(bǔ) 償信息進(jìn)行調(diào)整。
9.如權(quán)利要求7所述的音響解碼裝置,其中,上述降混調(diào)整電路取得信號(hào)的功率比作為上述降混補(bǔ)償信息,并將上述降混信號(hào)與上 述功率比相乘,由此對(duì)上述降混信號(hào)進(jìn)行調(diào)整。
10.如權(quán)利要求7所述的音響解碼裝置,其中,上述降混調(diào)整電路取得信號(hào)的差分作為上述降混補(bǔ)償信息,并將上述降混信號(hào)與上述 差分相加,由此對(duì)上述降混信號(hào)進(jìn)行調(diào)整。
11.如權(quán)利要求7所述的音響解碼裝置,其中,上述降混調(diào)整電路取得預(yù)測(cè)濾波系數(shù)作為上述降混補(bǔ)償信息,并對(duì)上述降混信號(hào)施以 使用了上述預(yù)測(cè)濾波系數(shù)的預(yù)測(cè)濾波,由此對(duì)上述降混信號(hào)進(jìn)行調(diào)整。
12.—種音響編碼解碼裝置,具備對(duì)輸入的多聲道音響信號(hào)進(jìn)行編碼的音響編碼部、以 及將接收的比特流解碼為多聲道音響信號(hào)的音響解碼部,上述音響編碼部具備降混信號(hào)生成部,在時(shí)間域上對(duì)輸入的上述多聲道音響信號(hào)進(jìn)行降混,由此生成作為1 或2聲道的音響信號(hào)的第一降混信號(hào);降混信號(hào)編碼部,對(duì)由上述降混信號(hào)生成部生成的第一降混信號(hào)進(jìn)行編碼; 第一 t-f變換部,將輸入的上述多聲道音響信號(hào)變換為頻域的多聲道音響信號(hào); 空間信息計(jì)算部,對(duì)由上述第一 t-f變換部進(jìn)行了變換的頻域的多聲道音響信號(hào)進(jìn)行 分析,由此生成作為根據(jù)降混信號(hào)生成多聲道音響信號(hào)的信息的空間信息;第二 t-f變換部,將由上述降混信號(hào)生成部生成的第一降混信號(hào)變換為頻域的第一降 混信號(hào);降混部,對(duì)由上述第一 t-f變換部進(jìn)行了變換的頻域的多聲道音響信號(hào)進(jìn)行降混,由 此生成頻域的第二降混信號(hào);以及降混補(bǔ)償電路,對(duì)由上述第二 t-f變換部進(jìn)行了變換的頻域的第一降混信號(hào)與由上述 降混部生成的頻域的第二降混信號(hào)進(jìn)行比較,由此計(jì)算作為對(duì)降混信號(hào)進(jìn)行調(diào)整的信息的 降混補(bǔ)償信息;上述音響解碼部具備分離部,將接收的比特流分離為數(shù)據(jù)部和參數(shù)部,數(shù)據(jù)部包含被編碼的降混信號(hào),參數(shù) 部包含作為根據(jù)降混信號(hào)生成多聲道音響信號(hào)的信息的空間信息、以及作為對(duì)降混信號(hào)進(jìn) 行調(diào)整的信息的降混補(bǔ)償信息;降混調(diào)整電路,使用上述參數(shù)部所包含的降混補(bǔ)償信息,對(duì)從上述數(shù)據(jù)部得到的頻域 的降混信號(hào)進(jìn)行調(diào)整;多聲道信號(hào)生成部,使用上述參數(shù)部所包含的空間信息,根據(jù)由上述降混調(diào)整電路進(jìn) 行了調(diào)整的頻域的降混信號(hào),生成頻域的多聲道音響信號(hào);以及f_t變換部,將由上述多聲道信號(hào)生成部生成的頻域的多聲道音響信號(hào)變換為時(shí)間域 的多聲道音響信號(hào)。
13.一種會(huì)議系統(tǒng),具備對(duì)輸入的多聲道音響信號(hào)進(jìn)行編碼的音響編碼裝置、以及將接 收的比特流解碼為多聲道音響信號(hào)的音響解碼裝置,上述音響編碼裝置具備降混信號(hào)生成部,在時(shí)間域上對(duì)輸入的上述多聲道音響信號(hào)進(jìn)行降混,由此生成作為1 或2聲道的音響信號(hào)的第一降混信號(hào);降混信號(hào)編碼部,對(duì)由上述降混信號(hào)生成部生成的第一降混信號(hào)進(jìn)行編碼; 第一 t-f變換部,將輸入的上述多聲道音響信號(hào)變換為頻域的多聲道音響信號(hào); 空間信息計(jì)算部,對(duì)由上述第一 t-f變換部進(jìn)行了變換的頻域的多聲道音響信號(hào)進(jìn)行 分析,由此生成作為根據(jù)降混信號(hào)生成多聲道音響信號(hào)的信息的空間信息;第二 t-f變換部,將由上述降混信號(hào)生成部生成的第一降混信號(hào)變換為頻域的第一降 混信號(hào);降混部,對(duì)由上述第一 t-f變換部進(jìn)行了變換的頻域的多聲道音響信號(hào)進(jìn)行降混,由 此生成頻域的第二降混信號(hào);以及降混補(bǔ)償電路,對(duì)由上述第二 t-f變換部進(jìn)行了變換的頻域的第一降混信號(hào)與由上述 降混部生成的頻域的第二降混信號(hào)進(jìn)行比較,由此計(jì)算作為對(duì)降混信號(hào)進(jìn)行調(diào)整的信息的 降混補(bǔ)償信息;上述音響解碼裝置具備分離部,將接收的比特流分離為數(shù)據(jù)部和參數(shù)部,數(shù)據(jù)部包含被編碼的降混信號(hào),參數(shù) 部包含作為根據(jù)降混信號(hào)生成多聲道音響信號(hào)的信息的空間信息、以及作為對(duì)降混信號(hào)進(jìn) 行調(diào)整的信息的降混補(bǔ)償信息;降混調(diào)整電路,使用上述參數(shù)部所包含的降混補(bǔ)償信息,對(duì)從上述數(shù)據(jù)部得到的頻域 的降混信號(hào)進(jìn)行調(diào)整;多聲道信號(hào)生成部,使用上述參數(shù)部所包含的空間信息,根據(jù)由上述降混調(diào)整電路進(jìn) 行了調(diào)整的頻域的降混信號(hào),生成頻域的多聲道音響信號(hào);以及f_t變換部,將由上述多聲道信號(hào)生成部生成的頻域的多聲道音響信號(hào)變換為時(shí)間域 的多聲道音響信號(hào)。
14.一種音響編碼方法,對(duì)輸入的多聲道音響信號(hào)進(jìn)行編碼,具備降混信號(hào)生成步驟,在時(shí)間域上對(duì)輸入的上述多聲道音響信號(hào)進(jìn)行降混,由此生成作 為1或2聲道的音響信號(hào)的第一降混信號(hào);降混信號(hào)編碼步驟,對(duì)由上述降混信號(hào)生成步驟生成的第一降混信號(hào)進(jìn)行編碼; 第一 t-f變換步驟,將輸入的上述多聲道音響信號(hào)變換為頻域的多聲道音響信號(hào);以及空間信息計(jì)算步驟,對(duì)由上述第一 t-f變換步驟進(jìn)行了變換的頻域的多聲道音響信號(hào) 進(jìn)行分析,由此生成作為根據(jù)降混信號(hào)生成多聲道音響信號(hào)的信息的空間信息。
15.一種音響解碼方法,將接收的比特流解碼為多聲道音響信號(hào),具備分離步驟,將接收的比特流分離為數(shù)據(jù)部和參數(shù)部,數(shù)據(jù)部包含被編碼的降混信號(hào),參 數(shù)部包含作為根據(jù)降混信號(hào)生成多聲道音響信號(hào)的信息的空間信息、以及作為對(duì)降混信號(hào) 進(jìn)行調(diào)整的信息的降混補(bǔ)償信息;降混調(diào)整步驟,使用上述參數(shù)部所包含的降混補(bǔ)償信息,對(duì)從上述數(shù)據(jù)部得到的頻域的降混信號(hào)進(jìn)行調(diào)整;多聲道信號(hào)生成步驟,使用上述參數(shù)部所包含的空間信息,根據(jù)由上述降混調(diào)整步驟 進(jìn)行了調(diào)整的頻域的降混信號(hào),生成頻域的多聲道音響信號(hào);以及f-t變換步驟,將由上述多聲道信號(hào)生成步驟生成的頻域的多聲道音響信號(hào)變換為時(shí) 間域的多聲道音響信號(hào)。
16.一種程序,用于對(duì)輸入的多聲道音響信號(hào)進(jìn)行編碼的音響編碼裝置,使計(jì)算機(jī)執(zhí)行 權(quán)利要求14所述的音響編碼方法所包含的步驟。
17.一種程序,用于將接收的比特流解碼為多聲道音響信號(hào)的音響解碼裝置,使計(jì)算機(jī) 執(zhí)行權(quán)利要求15所述的音響解碼方法所包含的步驟。
全文摘要
削減多聲道音響編碼裝置以及多聲道音響解碼裝置的延遲。音響編碼裝置具備降混信號(hào)生成部(410),對(duì)輸入的多聲道音響信號(hào),在時(shí)間域上生成1或2聲道的音響信號(hào)即第一降混信號(hào);降混信號(hào)編碼部(404),對(duì)第一降混信號(hào)進(jìn)行編碼;第一t-f變換部(401),將輸入的多聲道音響信號(hào)變換為頻域的多聲道音響信號(hào);以及空間信息計(jì)算部(409),對(duì)頻域的多聲道音響信號(hào)進(jìn)行分析,由此生成根據(jù)降混信號(hào)生成多聲道音響信號(hào)的空間信息。
文檔編號(hào)G10L19/008GK101809656SQ20098010054
公開(kāi)日2010年8月18日 申請(qǐng)日期2009年7月28日 優(yōu)先權(quán)日2008年7月29日
發(fā)明者則松武志, 周歡, 張國(guó)成, 石川智一 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社