專利名稱:用于雙聲道提示碼編碼方案和類似方案的散射聲音整形的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及所述音頻信號(hào)的編碼和隨后的從編碼后的音頻數(shù)據(jù)合成聽覺場(chǎng)景。
背景技術(shù):
當(dāng)人聽到由特定音源產(chǎn)生的音頻信號(hào)(即,聲音)時(shí),所述音頻信號(hào)通常會(huì)在兩個(gè)不同的時(shí)間抵達(dá)人的左耳與右耳且具有兩個(gè)不同的音頻音量大小(例如,分貝),這些不 同的時(shí)間和音量大小是路徑中差異的函數(shù),通過所述路徑音頻信號(hào)分別傳播抵達(dá)左耳與右 耳,人的大腦解讀這些時(shí)間和音量大小的差異從而使人感覺到所接收的音頻信號(hào)是由位于 相對(duì)于所述人的特定位置(例如,方向與距離)的音源所產(chǎn)生。聽覺場(chǎng)景為一人同時(shí)聽到 的由位于相對(duì)于所述人的一個(gè)或多個(gè)不同位置的一個(gè)或多個(gè)不同音源所產(chǎn)生的音頻合成串音。通過大腦此處理的存在可被用來合成聽覺場(chǎng)景,其中來自一個(gè)或多個(gè)不同音源的 音頻信號(hào)可以目的性地修改以產(chǎn)生左邊與右邊音頻信號(hào),所述左邊和右邊音頻信號(hào)使聽者 感覺到不同音源相對(duì)于所述聽者位于不同的位置。圖1表示傳統(tǒng)的立體聲信號(hào)合成器100的高級(jí)框圖,其將單一音源信號(hào)(例如, 單聲道信號(hào))轉(zhuǎn)換成立體聲信號(hào)的左邊與右邊音頻信號(hào),其中立體聲信號(hào)被定義為在聽者 的鼓膜處所接收的兩個(gè)信號(hào)。除所述音源信號(hào)外,合成器100接收對(duì)應(yīng)于相對(duì)聽者的音源 的期望位置的一組空間提示信號(hào)。在典型的實(shí)施中,所述這組空間提示信號(hào)包括通道間電 平差(ICLD)值(其辨識(shí)分別在左耳與右耳所接收的左與右音頻信號(hào)間音頻音量大小的差 異),和音頻通道中時(shí)差異(ICTD)值(其辨識(shí)如分別在左耳與右耳所接收的左邊與右邊音 頻信號(hào)間抵達(dá)時(shí)間的差異)。此外或作為替換,一些合成技術(shù)包括用于從音源到耳膜的聲音 的方向依賴轉(zhuǎn)移函數(shù)的建模,也可引用頭部相關(guān)的轉(zhuǎn)移函數(shù)(HRTF),參見例如,J.Blauert, ThePsychophysics of Human Sound Localization, MIT Press,1983,胃弓|入以## 考。使用圖1的立體聲信號(hào)合成器100,由單一音源所產(chǎn)生的單聲道音頻信號(hào)可被 處理以便當(dāng)通過耳機(jī)收聽時(shí),所述音源通過使用適當(dāng)空間提示信號(hào)組(例如,ICLD、ICTD 和/或HRTF)來為每一個(gè)耳朵產(chǎn)生音頻信號(hào),參見例如,D. R.Begault,3-D Sound for VirtualReality and Multimedia, Academic Press, Cambridge, MA,1994。圖1的立體聲信號(hào)合成器100產(chǎn)生最簡(jiǎn)單型式的聽覺場(chǎng)景,它們相對(duì)于聽者具有 單一音源,包括相對(duì)于聽者的位于不同位置的兩個(gè)或多個(gè)音源的更復(fù)雜的聽覺場(chǎng)景可使用 聽覺場(chǎng)景合成器被產(chǎn)生,所述聽覺場(chǎng)景合成器通過使用多個(gè)立體聲信號(hào)合成器而本質(zhì)上被 實(shí)施,其中每個(gè)立體聲信號(hào)合成器產(chǎn)生對(duì)應(yīng)于不同音源的立體聲信號(hào),因?yàn)槊總€(gè)不同音源 相對(duì)于聽者具有不同的位置,不同空間提示信號(hào)組被用來對(duì)每個(gè)不同音源產(chǎn)生立體聲音頻 信號(hào)。
發(fā)明內(nèi)容
根據(jù)一個(gè)實(shí)施例,本發(fā)明涉及用于將具有輸入時(shí)序包絡(luò)的輸入音頻信號(hào)轉(zhuǎn)換成具 有輸出時(shí)序包絡(luò)的輸出音頻信號(hào)的方法和設(shè)備。所述輸入音頻信號(hào)的所述輸入時(shí)序包絡(luò)被 特性化。對(duì)所述輸入音頻信號(hào)進(jìn)行處理以產(chǎn)生處理后音頻信號(hào),其中所述處理將所述輸入 音頻信號(hào)去關(guān)聯(lián)?;谒鎏匦曰妮斎霑r(shí)序包絡(luò)對(duì)所屬處理后音頻信號(hào)進(jìn)行處理以產(chǎn)生 所述輸出音頻信號(hào),其中所述輸出時(shí)序包絡(luò)大體上與所述輸入時(shí)序包絡(luò)相匹配。依據(jù)本發(fā)明的另一實(shí)施例,本發(fā)明涉及對(duì)C個(gè)輸入音頻通道編碼以產(chǎn)生E個(gè)傳輸 音頻通道的方法和設(shè)備。為所述C個(gè)輸入通道中的兩個(gè)或多個(gè)而產(chǎn)生一個(gè)或多個(gè)提示碼。 對(duì)所述c個(gè)輸入通道進(jìn)行下混以產(chǎn)生所述E個(gè)傳輸通道,其中C > E≥ 1。所述C個(gè)輸入通道中的一個(gè)或多個(gè)和所述E個(gè)傳輸通道被分析,以產(chǎn)生一個(gè)在所述E個(gè)傳輸通道解碼期間 用來指示所述E個(gè)傳輸通道的解碼器是否執(zhí)行包絡(luò)整形的標(biāo)記。根據(jù)另外一個(gè)實(shí)施例,本發(fā)明涉及通過前面段落中提到的方法產(chǎn)生的編碼后音頻 比特流。根據(jù)另外一個(gè)實(shí)施例,本發(fā)明涉及包括E個(gè)傳輸通道、一個(gè)或多個(gè)提示碼和標(biāo)記 的編碼后音頻比特流。通過為所述C個(gè)輸入通道中的兩個(gè)或多個(gè)而產(chǎn)生一個(gè)或多個(gè)提示碼 從而產(chǎn)生一個(gè)或多個(gè)提示碼。通過對(duì)所述C個(gè)輸入通道進(jìn)行下混產(chǎn)生所述E個(gè)傳輸通道, 其中C>E> 1。通過對(duì)所述C個(gè)輸入通道中的一個(gè)或多個(gè)進(jìn)行分析產(chǎn)生所述標(biāo)記,其中在 所述E個(gè)傳輸通道解碼期間用來指示所述E個(gè)傳輸通道的解碼器是否執(zhí)行包絡(luò)整形。
本發(fā)明的其他的方面、特征和優(yōu)點(diǎn)從下面的詳細(xì)描述、所附的權(quán)利要求和附圖中 將會(huì)更明顯,其中相同的附圖標(biāo)記表示相似或相同的元件。圖1為傳統(tǒng)的立體聲信號(hào)合成器的高級(jí)框圖;圖2為一般雙聲道提示碼編碼(BCC)音頻處理系統(tǒng)的框圖;圖3為可被使用于圖2的下混器的框圖;圖4為可被使用于圖2的BCC合成器的框圖;圖5依據(jù)本發(fā)明的實(shí)施例,顯示圖2中所述BCC評(píng)估器的框圖;圖6表示用于五音頻通道的ICTD和ICLD數(shù)據(jù)的生成;圖7表示用于五音頻通道的ICC數(shù)據(jù)的生成;圖8表示圖4的所述BCC合成器的實(shí)施的框圖,其在單一傳輸總和信號(hào)s (n)加空 間提示信號(hào)下可被使用于BCC解碼器中以產(chǎn)生立體聲或多通道音頻信號(hào);圖9表示ICTD與ICLD作為頻率函數(shù)如何在基頻帶中被改變;圖10為根據(jù)本發(fā)明的一個(gè)實(shí)施例的表示BCC解碼器的至少一部分的框圖;圖11表示在圖4的BCC合成器的范圍內(nèi)的圖10的包絡(luò)整形方案的示范應(yīng)用;圖12表示圖4的BCC合成器的范圍內(nèi)的圖10的包絡(luò)整形方案的替換示范應(yīng)用, 其中包絡(luò)整形被應(yīng)用到時(shí)域中;圖13(a)和(b)表示圖12中的TPA和TP的可能的實(shí)施,其中只有當(dāng)頻率高于截 止頻率fTP時(shí)包絡(luò)整形才可以實(shí)施;圖14表示在2004年4月1日申請(qǐng)的美國(guó)申請(qǐng)?zhí)枮?0/815,591,代理人號(hào)為 BaUmgarte7-12的申請(qǐng)中描述的基于后期回響的ICC合成方案范圍內(nèi)的圖10中的包絡(luò)整形 方案的示范應(yīng)用;圖15表示根據(jù)可以替換成圖10所示方案的本發(fā)明的實(shí)施例的BCC解碼器的至少 一部分的框圖;圖16表示根據(jù)可以替換成圖10和圖15所示方案的本發(fā)明的實(shí)施例的BCC解碼 器的至少一部分的框圖;圖17表示在圖4中的BCC合成器的范圍內(nèi)的圖15的包絡(luò)整形方案的示范應(yīng)用;圖18 (a)-(c)表示圖17中的TPA、ITP禾口 TP的 能實(shí)施的框圖。
具體實(shí)施例方式在雙聲道提示碼編碼(BCC)中,編碼器對(duì)C個(gè)輸入音頻通道編碼以產(chǎn)生E個(gè)傳輸 音頻通道,其中C > E > 1。特別是C個(gè)輸入通道中的兩個(gè)或多個(gè)被提供于頻域中,且一個(gè) 或多個(gè)提示碼被產(chǎn)生用于頻域中兩個(gè)或多個(gè)輸入通道中一個(gè)或多個(gè)不同頻帶的每一個(gè)。此 外,所述C個(gè)輸入通道被下混以產(chǎn)生E個(gè)傳輸通道,在一些下混實(shí)施中,所述E個(gè)傳輸通道 中的至少一個(gè)基于所述C個(gè)輸入通道中的兩個(gè)或多個(gè),且至少所述E個(gè)傳輸通道中的一個(gè) 僅基于C個(gè)輸入通道中的單一通道。在一個(gè)實(shí)施例中,BCC碼器具有兩個(gè)或多個(gè)濾波器庫(kù)、一個(gè)代碼評(píng)估器與一個(gè)下混 器,所述兩個(gè)或多個(gè)濾波器庫(kù)將所述C個(gè)輸入通道中的兩個(gè)或多個(gè)從時(shí)域轉(zhuǎn)換到頻域,所 述代碼評(píng)估器產(chǎn)生一個(gè)或多個(gè)提示碼用于所述兩個(gè)或多個(gè)經(jīng)轉(zhuǎn)換輸入通道中一個(gè)或多個(gè) 不同頻帶的每一個(gè),下混器下混C輸入通道以產(chǎn)生E個(gè)傳輸通道,其中C > E彡1。在BCC解碼中,E個(gè)傳輸音頻通道被解碼以產(chǎn)生C回放音頻通道。特別對(duì)于一個(gè) 或多個(gè)頻帶中的每一個(gè),一個(gè)或多個(gè)E個(gè)傳輸通道在頻域中被上混以在頻域中產(chǎn)生C回放 通道中的兩個(gè)或多個(gè),其中C>E> 1。一個(gè)或多個(gè)提示碼被施加至頻域中所述兩個(gè)或多個(gè) 回放音頻通道中的所述一個(gè)或多個(gè)不同頻段的每一個(gè)以產(chǎn)生兩個(gè)或多個(gè)經(jīng)修改的通道,且 所述兩個(gè)或多個(gè)經(jīng)修改的音道從頻域被轉(zhuǎn)換成時(shí)域。在一些上混實(shí)施中,至少C回放通道 中的一個(gè)基于E個(gè)傳輸音頻通道中的至少一個(gè)和至少一個(gè)提示碼,且C回放通道中的至少 一個(gè)僅基于E個(gè)傳輸音頻通道中的單一一個(gè)且與任何提示碼無關(guān)。在一個(gè)實(shí)施例中,BCC解碼器具有上混器、合成器和一個(gè)或多個(gè)反向?yàn)V波器庫(kù),對(duì) 于一個(gè)或多個(gè)不同頻帶中的每一個(gè),所述上混器在頻域中上混E個(gè)傳輸通道中的一個(gè)或多 個(gè)以便在頻域中產(chǎn)生C個(gè)回放通道中的兩個(gè)或多個(gè),其中C > E > 1,所述合成器施加一個(gè) 或多個(gè)提示碼至頻域中所述兩個(gè)或多個(gè)回放通道中的所述一個(gè)或多個(gè)不同頻段的每一個(gè), 以便產(chǎn)生兩個(gè)或多個(gè)經(jīng)修改的通道,所述一個(gè)或多個(gè)反向?yàn)V波器庫(kù)將所述兩個(gè)或多個(gè)修改 的通道從頻域轉(zhuǎn)換成時(shí)域。根據(jù)特別實(shí)施,指定的回放通道可基于一個(gè)單一傳輸通道,而不是兩個(gè)或多個(gè)傳 輸通道的結(jié)合。例如,當(dāng)僅有一個(gè)傳輸通道,C個(gè)回放通道中的每一個(gè)基于所述傳輸通道。 在這些情況下,上混對(duì)應(yīng)所述相應(yīng)的傳輸通道的復(fù)制。如此,對(duì)僅有一個(gè)傳輸通道的應(yīng)用, 所述上混器可使用為每一個(gè)回放通道復(fù)制傳輸通道的復(fù)制器而被實(shí)施。BCC編碼器和/或解碼器可合并成一些系統(tǒng)或應(yīng)用,其包含,例如數(shù)字錄像機(jī)/放 影機(jī)、數(shù)字錄音機(jī)/放音機(jī)、計(jì)算機(jī)、衛(wèi)星發(fā)送器/接收器、有線發(fā)送器/接收器、陸地廣播 發(fā)送器/接收器、家用娛樂系統(tǒng)與電影劇院系統(tǒng)。(一般 BCC 處理)圖2為普通的雙聲道提示碼編碼(BCC)音頻處理系統(tǒng)200的框圖,其包括編碼器 202和解碼器204,編碼器202包含下混器206和BCC評(píng)估器208。下混器206將C個(gè)輸入音頻通道Xi (n)轉(zhuǎn)換成E個(gè)傳輸音頻通道(n),其中C > 1。在此說明書中,使用變量n表示的信號(hào)為時(shí)域信號(hào),同時(shí)使用變量k表示的信號(hào)為
頻域信號(hào)。根據(jù)特殊的實(shí)施,下混能在時(shí)域或頻域中實(shí)施。BCC評(píng)估器208從C個(gè)輸入音頻 通道產(chǎn)生BCC碼且傳輸這些BCC碼作為相對(duì)于E個(gè)傳輸音頻通道的頻帶內(nèi)或頻帶外輔助信 息。通常的BCC碼包含一個(gè)或多個(gè)通道間時(shí)差(ICTD)、通道間電平差(ICLD)和在輸入通道的某些對(duì)間被評(píng)估作為頻率與時(shí)間的函數(shù)的通道間關(guān)聯(lián)(ICC)數(shù)據(jù)。所述特別實(shí)施將在輸 入通道的特定對(duì)之間指示BCC碼被評(píng)估。ICC數(shù)據(jù)對(duì)應(yīng)立體聲信號(hào)的一致性,其與所述音源的感覺寬度有關(guān)。音源越寬,所 產(chǎn)生立體聲信號(hào)的左邊與右邊通道間的一致性越低。例如,對(duì)應(yīng)于傳過一個(gè)禮堂講臺(tái)的管 弦樂隊(duì)的立體聲信號(hào)的一致性通常低于對(duì)應(yīng)于單個(gè)小提琴獨(dú)奏的立體聲信號(hào)的一致性。通 常,一致性較低的音頻信號(hào)通常被感覺為在聽覺空間中更能被傳播。如此,ICC數(shù)據(jù)通常與 聽者環(huán)境的明顯音源寬度和程度有關(guān)。見例如,J.Blauert,The Psychophysics of Human SoundLocalization, MIT press,1983。根據(jù)特殊的應(yīng)用,所述E個(gè)傳輸音頻通道和對(duì)應(yīng)的BCC碼可直接被傳輸?shù)浇獯a器 204或儲(chǔ)存在合適類型的儲(chǔ)存裝置中用于解碼器后續(xù)存取。依據(jù)所述情況,術(shù)語“傳輸”可 弓I用為直接傳輸至解碼器或是用于對(duì)解碼器后續(xù)供應(yīng)的儲(chǔ)存。在任意種情況下,解碼器204 接收傳輸音頻通道和輔助信息并且執(zhí)行上混和使用BCC碼的BCC合成以將E個(gè)傳輸音頻通 道轉(zhuǎn)換成超過E(通常,但不必須,C)個(gè)回放音頻通道天(勸用于音頻回放。根據(jù)特殊的實(shí)施, 上混可在既能在時(shí)域中也能在頻域中被執(zhí)行。除圖2中所示的BCC處理外,普通的BCC音頻處理系統(tǒng)可包括有額外的編碼和 譯碼階段以進(jìn)一步分別在編碼器壓縮音頻信號(hào)然后在解碼器對(duì)所述音頻信號(hào)解壓縮。這 些編解碼器可基于傳統(tǒng)的音頻壓縮/解壓縮技術(shù),例如那些基于脈沖碼調(diào)制(PCM)、差分 PCM(DPCM)或適應(yīng)性 DPCM(ADPCM)。當(dāng)下混器206產(chǎn)生單一總和信號(hào)(即,E = 1)時(shí),BCC編碼能夠在比特率僅稍高于 所需要表示單聲道音頻的信號(hào)來表示多通道音頻信號(hào),這是因?yàn)樵谕ǖ缹?duì)間所述經(jīng)評(píng)估的 ICTD、ICLD和ICC數(shù)據(jù)含有較音頻波形少約兩個(gè)數(shù)量級(jí)大小的信息。不僅對(duì)BCC編碼的低位率,而且對(duì)其向后兼容性方面也是有利的。單一傳輸總和 信號(hào)對(duì)應(yīng)原先立體聲或多通道信號(hào)的單聲道下混。對(duì)于接收器,其不支持立體聲或多通道 音頻重現(xiàn),傾聽傳輸總和信號(hào)是在低外形單聲道再現(xiàn)設(shè)備上呈現(xiàn)所述音頻素材的正確方 法,BCC編碼可因此也被使用以提升涉及從單聲道音頻素材向多通道音頻的傳輸?shù)默F(xiàn)有服 務(wù)。例如,如果B C C輔助信息可被嵌入到現(xiàn)有傳輸通道中,現(xiàn)有單聲道音頻無線廣播系統(tǒng) 可被提升用于立體聲或多通道回放。類似的能力存在于當(dāng)下混多通道音頻至對(duì)應(yīng)立體聲的 兩個(gè)總和信號(hào)。BCC處理具某時(shí)間與頻率分辨率的音頻信號(hào),所用的所述頻率分辨率主要由人體 聽覺系統(tǒng)的頻率分辨率所引起,心理聲學(xué)建議空間感覺最有可能基于所述音頻輸入信號(hào)的 臨界頻帶表示。此頻率分辨率通過使用具有頻寬等于或與人體聽覺系統(tǒng)的臨界頻寬成正比 的基頻帶的可反向?yàn)V波器庫(kù)(例如,基于快速傅立葉轉(zhuǎn)換(FFT)或正交鏡像濾波器(QMF)) 被考慮。(一般下混)在優(yōu)選實(shí)施中,所述傳輸總和信號(hào)包含所述輸入音頻信號(hào)的全部信號(hào)成份。目標(biāo) 為每一個(gè)信號(hào)成份被完全保持。所述音頻輸入通道的簡(jiǎn)單總和導(dǎo)致信號(hào)成份的放大或衰 減。換句話說,在“簡(jiǎn)單”總和中信號(hào)成份的功率經(jīng)常是大于或小于每一個(gè)音頻通道的相應(yīng) 信號(hào)成份的功率總和??墒褂孟禄旒夹g(shù),該技術(shù)使所述總和信號(hào)均衡,以便使總和信號(hào)中的 信號(hào)成份的功率大約與在全部輸入通道中的相應(yīng)功率相同。
8一個(gè)矩陣組件進(jìn)行平方而得到,且/^.⑷
信號(hào)的功率值巧,a)將大于或小于使用 第(2)式所計(jì)算得值,由于當(dāng)信號(hào)成份分別是同相或不同相時(shí)信號(hào)放大或取消。為避免如 此,第(1)式的下混操作接著以乘法器310的校準(zhǔn)操作被施加到基頻帶中,校準(zhǔn)因子ei(k) (1彡i彡E)可由第(3)式得出如下 其中,巧,⑷為如以第⑵式計(jì)算的基頻帶功率,且作⑷為相應(yīng)經(jīng)下混基頻帶信號(hào) 夕,(幻的功率。除了提供可選擇的校準(zhǔn)或不用可選擇的校準(zhǔn),校準(zhǔn)/延遲區(qū)塊306可選擇地對(duì)信 號(hào)施加延遲。每一個(gè)反向?yàn)V波器庫(kù)308將頻域中的一組相應(yīng)的經(jīng)校準(zhǔn)的系數(shù)歹,(幻轉(zhuǎn)換成相應(yīng) 的數(shù)字、傳輸通道yi(n)的幀。雖然圖3顯示輸入通道的全部C被轉(zhuǎn)換成頻域用于后續(xù)下混,在一個(gè)替代實(shí)施中,圖3表示下混器300的框圖,其可依據(jù)BCC系統(tǒng)200的特殊實(shí)施被使用于圖2的 下混器206。下混器300具有濾波器庫(kù)(FB) 302用于每個(gè)輸入通道Xi(n)、下混區(qū)塊304、可 選擇校準(zhǔn)/延遲區(qū)塊306和反向FB (IFB) 308用于每個(gè)編碼通道(n)。每一個(gè)濾波器庫(kù)302將時(shí)域中相應(yīng)的數(shù)字輸入通道\(11)的每一幀(例如, 20msec)轉(zhuǎn)換成頻域中一組輸入系數(shù)萬(幻。下混區(qū)塊304將C相應(yīng)的輸入系數(shù)的每一個(gè)基頻 帶下混成E經(jīng)下混頻域系數(shù)的相應(yīng)基頻帶。方程式(1)表示輸入系數(shù)民(幻,&(幻,…,乓(幻) 的第k個(gè)基頻帶的下混以產(chǎn)生經(jīng)下混系數(shù)僅㈨,九㈨,...,尺㈨)的第k個(gè)基頻帶如下
(1)其中Dce為一個(gè)實(shí)值的C-by-E下混矩陣。選擇的校準(zhǔn)/延遲區(qū)塊306包括一組乘法器310,每一個(gè)乘法器以一校準(zhǔn)因子 ei(k)乘上相應(yīng)的經(jīng)下混系數(shù)j),(幻以產(chǎn)生相應(yīng)的比例系數(shù)5U幻,用于校準(zhǔn)操作的動(dòng)機(jī)為相 等于對(duì)每一個(gè)通道用于以任意加權(quán)因子下混所一般化的等化。如果輸入通道為獨(dú)立的,接 著每一個(gè)基頻帶的經(jīng)下混信號(hào)的功率巧,⑷以方程式(2)得到如下 其中;通過對(duì)C-by-E下混矩陣Dce中的每 為輸入通道i的基頻帶k的功率。如果基頻帶不是獨(dú)立的,接著所述經(jīng)下混C個(gè)輸入通道中的一個(gè)或多個(gè)(但少于C-1)可避開圖3中所顯示的所述操作的一些或全部 且可被傳輸作為未修改音頻通道的相等數(shù)量,根據(jù)所述特別實(shí)施,這些未修改的音頻通道 可或不可被圖2的BCC評(píng)估器208使用以產(chǎn)生傳輸BCC碼。在下混器300的實(shí)施中其產(chǎn)生單一總和信號(hào)y(n),E = 1,且每一個(gè)輸入通道c的 每一個(gè)基頻帶的信號(hào)元(幻被加入且接著以因子e(k)相乘,依據(jù)第(4)式如下 因子e(k)以第(5)式得到如下
( 其中;幻為在時(shí)間索引k時(shí)無⑷功率的短時(shí)間評(píng)估,且巧㈨為功率Hq元㈨的
短時(shí)間評(píng)估,所述相等的基頻帶被轉(zhuǎn)換回到產(chǎn)生被傳輸至所述BCC解碼器的總和信號(hào)的時(shí) 域。(一般 BCC 合成)圖4顯示BCC合成器400的框圖,其依據(jù)BCC系統(tǒng)200的某些實(shí)施可被使用于圖2 的解碼器204,BCC合成器400具有濾波器庫(kù)402用于每一個(gè)傳輸通道(n),上混區(qū)塊404, 延遲器406,乘法器408,相關(guān)區(qū)塊410和反向?yàn)V波器庫(kù)412用于每一個(gè)回放通道天(勸。每一個(gè)濾波器庫(kù)402將時(shí)域中相應(yīng)的數(shù)字、傳輸通道yi (n)的每一幀轉(zhuǎn)換成頻域 中一組輸入系數(shù)又(幻。上混區(qū)塊404將E相應(yīng)的傳輸通道系數(shù)的每一個(gè)基頻帶上混成C經(jīng) 上混頻域系數(shù)的一相應(yīng)的基頻帶,方程式(4)表示傳輸通道系數(shù)僅(幻,艿(幻,…,么(幻)的第 k個(gè)基頻帶的上混以產(chǎn)生上混系數(shù)伝㈨,5;㈨,…,?;⑷)的kth基頻帶如下
其中UEe為一個(gè)實(shí)值E-by-C上混矩陣,在頻域中執(zhí)行上混使上混能被獨(dú)立地施加 于每一個(gè)不同的基頻帶。每一個(gè)延遲器406施加基于用于ICTD數(shù)據(jù)的相應(yīng)的BCC碼的延遲值屯(k)以確 保所要的ICTD值出現(xiàn)于回放通道的某些對(duì)中。每一個(gè)乘法器408施加基于用于ICLD數(shù)據(jù) 的相應(yīng)的BCC碼的校準(zhǔn)因子ai(k)以確保所要的ICLD值出現(xiàn)于回放通道的某些對(duì)中,相關(guān) 區(qū)塊410執(zhí)行用于ICC數(shù)據(jù)的相應(yīng)的BCC碼的去關(guān)聯(lián)操作A以確保所要的ICC值出現(xiàn)于 回放通道的某些對(duì)中,相關(guān)區(qū)塊的操作的進(jìn)一步描述可見2002年5月24日申請(qǐng)的美國(guó)第 10/155,437 號(hào)專利申請(qǐng)如 Baumgarte 2-10。ICLD值的合成比ICLD和ICC值的合成容易一些,因?yàn)镮CLD合成僅涉及基頻帶fi 號(hào)的校準(zhǔn)。因?yàn)镮CLD提示信號(hào)為最通常使用的方向性提示信號(hào),ICLD值接近原始音頻
號(hào)的這些值是通常更重要的,如此,ICLD數(shù)據(jù)可被評(píng)估在全部通道對(duì)之間。對(duì)每一個(gè)基頻 帶的校準(zhǔn)因子ai(k), (1 ^ i ^ C)最好被選取使得每一個(gè)回放通道的基頻帶功率接近原始 輸入音頻通道的相應(yīng)的功率。一個(gè)目標(biāo)可施加相對(duì)少的信號(hào)修改用以合成ICTD和ICC值,這樣,所述BCC值可 不包含用于全部通道對(duì)的ICTD和ICC值,在所述情形中,BCC合成器400將僅在某些通道 對(duì)之間合成ICTD和ICC值。每一個(gè)反向?yàn)V波器庫(kù)412將一組頻域中的相應(yīng)的經(jīng)合成系數(shù)幻轉(zhuǎn)換成相應(yīng)的 數(shù)字的、回放通道戈…)的幀。雖然圖4顯示全部E個(gè)傳輸通道被轉(zhuǎn)換成頻域用于后續(xù)上混與BCC處理,在另外 實(shí)施中,所述E個(gè)傳輸通道中的一個(gè)或多個(gè)(但非全部)可避開圖4所示的處理的一些或 全部。例如,傳輸通道的一個(gè)或多個(gè)可以是未修改通道,其未接受任何上混。除了作為C個(gè) 回放通道中的一個(gè)或多個(gè)之外,這些未修改通道,輪流地,可以是但不必須被用作為參考通 道,其BCC處理被施加給合成其它回放通道中的一個(gè)或多個(gè)。在任情形中,這些未修改通道 可受到延遲以補(bǔ)償涉及上混的操作時(shí)間與/或用以產(chǎn)生其余回放通道的BCC操作。注意的是,雖然圖4顯示C個(gè)回放通道自E個(gè)傳輸通道被合成,其中,C也為原始 輸入通道的數(shù)目,BCC合成不限于回放通道的所述數(shù)目,通常,回放通道的數(shù)目可以是通道 的任何數(shù)目,包含數(shù)目大于或小于C和可能甚至當(dāng)回放通道的數(shù)目是等于或小于傳輸通道 數(shù)目的情形。(介于音頻通道之間的“感覺上相對(duì)差異”)假設(shè)單一總和信號(hào),BCC合成立體聲或多通道音頻信號(hào)使得ICTD、ICLD和ICC接 近原始音頻信號(hào)的相應(yīng)的提示信號(hào),以下,關(guān)于聽覺空間影像屬性的ICTD、ICLD和ICC的作 用將予討論。關(guān)于空間聽覺的知識(shí)包含有對(duì)于一個(gè)聽覺事件,ICTD和ICLD與感覺方向是相關(guān) 的。當(dāng)考慮到音源的立體聲空間脈沖響應(yīng)(BRIRs)時(shí),在聽覺事件的寬度和聽者包封和為 BRIRs的早期和后期部分評(píng)估的ICC數(shù)據(jù)之間具有關(guān)系。然而,在ICC和這些普通信號(hào)(和 不只是BRIRs)的性質(zhì)之間的關(guān)系不是直接的。立體聲和多通道音頻信號(hào)通常包含同步主動(dòng)源信號(hào)的復(fù)雜混合,所述主動(dòng)源信號(hào) 是從圍繞空間中錄音所產(chǎn)生的經(jīng)反射信號(hào)成份所迭加,或用于人工生成的空間印象的錄音 工程師所賦加,不同的音源信號(hào)與它們的反射占據(jù)時(shí)間-頻率平面中的不同區(qū)域。此由 ICTD、ICLD與ICC所反映,其作為時(shí)間與頻率的函數(shù)而改變。在此情形下,瞬時(shí)現(xiàn)象ICTD、 ICLD和ICC和音頻事件方向與空間印象間的關(guān)系是不明顯的。某些BCC實(shí)施例的策略是不 明顯地合成這些提示信號(hào),以便使它們接近原始音頻信號(hào)的相應(yīng)的提示信號(hào)。具有基頻帶頻寬等于兩倍相等的矩形頻寬(ERB)的濾波器庫(kù)被使用。非正式的傾 聽會(huì)顯示當(dāng)選取較高頻率分辨率時(shí)BCC的音頻質(zhì)量未顯著改善。較低頻率分辨率可為需求 的,因?yàn)樗鼘?dǎo)致較少ICTD、ICLD與ICC值需要被傳輸至解碼器,且因此以較低比特率傳輸。關(guān)于時(shí)間分辨率,ICTD、ICLD和ICC為通常在固定時(shí)間間距下被考慮,當(dāng)ICTD、 ICLD與ICC以約每4到16ms被考慮時(shí),可得到高性能。注意的是,除非所述提示信號(hào)在非 常短的時(shí)間間隔被考慮,先前效果未直接考慮,假設(shè)音頻刺激的典性領(lǐng)先-落后對(duì),假如所 述領(lǐng)先和落后位于時(shí)間間隔僅一組提示信號(hào)被合成,則所述領(lǐng)先的局部化優(yōu)勢(shì)未被考慮。雖然如此,BCC達(dá)到音頻質(zhì)量以平均MU SHRA分?jǐn)?shù)反映為平均約87 (即,“極佳”音頻質(zhì)量), 且對(duì)某些音頻信號(hào)高到接近于100。參考信號(hào)與經(jīng)合成信號(hào)間的所述經(jīng)常得到的感覺上小差異暗示關(guān)于寬度范圍的 聽覺空間影像屬性的提示信號(hào)為暗示性地在固定時(shí)間間隔被合成ICTD、ICLD和ICC所考 慮。以下,一些論點(diǎn)對(duì)于ICTD、ICLD和ICC可如何與聽覺空間影像屬性的范圍有關(guān)。(空間提示信號(hào)的評(píng)估)以下中,將描述ICTD、ICLD和ICC如何被評(píng)估,用于這些(經(jīng)量化的與編碼的)空 間提示信號(hào)的傳輸比特率可為剛好為幾個(gè)kb/s并因此,使用BCC,它可能在比特率接近對(duì) 單一音頻通道的要求下傳輸立體聲與多通道音頻信號(hào)。圖5顯示依據(jù)本發(fā)明,圖2的BCC評(píng)估器208的框圖,BCC評(píng)估器208包括濾波器 庫(kù)(FB) 502,其可與圖3的濾波器庫(kù)302相同,和評(píng)估區(qū)塊504其對(duì)由濾波器庫(kù)502所產(chǎn)生 的每一個(gè)不同頻率產(chǎn)生ICTD、ICLD與ICC空間提示信號(hào)。(用于立體聲信號(hào)的ICTD、ICLD和ICC的評(píng)估)以下量測(cè)為使用于ICTD、ICLD和ICC用以相應(yīng)的二(例如,立體聲)音頻通道的 基頻帶信號(hào)寫(幻與幻。ICTD [例子]rX2{k) = argmax{012(J,A)}(7)
d具有由以下第(8)式得到的經(jīng)標(biāo)準(zhǔn)化交叉相關(guān)函數(shù)的短時(shí)間評(píng)估。
Pa (d, k)Ol2(d,k)= ! 二、(8)其中= max{-d,0}d2 = max{d,0}且,(d,幻為名(k — dt)x2(k -為)平均數(shù)的短時(shí)間評(píng)估ICLD[dB]
fAL,2(^:) = 101og(
(9)
y^、 ,、 作ft,
(10)ICCcn{k) = m^i\<^n(d,k)\
d
(11)注意經(jīng)標(biāo)準(zhǔn)化交叉相關(guān)的絕對(duì)值被考慮且c12(k)具有
的范圍。(用于多通道音頻信號(hào)的ICTD、ICLD和ICC的評(píng)估)當(dāng)有超過兩個(gè)輸入通道,它通常足以在參考通道間限定ICTD和ICLD(例如,音頻 通道號(hào)碼1)與其它通道,如圖6中所說明用于C = 5個(gè)通道的情形,其中t lc(k)與AL12(k) 在參考通道1與通道c之間分別指示ICTD與ICLD。與ICTD和ICLD相反的,ICC通常具有較多自由度,所限定的ICC在所有可能的輸 入通道對(duì)之間具有不同的值,對(duì)C個(gè)通道而言,具有C(C-l)/2個(gè)可能的音頻通道對(duì),例如, 對(duì)5個(gè)通道會(huì)有如圖7 (a)中所例示的10個(gè)通道對(duì),然而,這些方式需要在每一時(shí)間索引對(duì)每一基頻帶評(píng)估且傳輸C(C_l)/2個(gè)ICC值,導(dǎo)致高計(jì)算復(fù)雜度與高比特率。或者,對(duì)每一基頻帶,實(shí)施ICTD與ICLD決定基頻帶中相應(yīng)的信號(hào)成份的音頻事件 的方向。每基頻帶的單一 ICC參數(shù)可接著被用于描述全部音頻通道間的整體一致性,良好 的結(jié)果可通過僅在每一時(shí)間索引的每一基頻帶中具有最多能量的兩個(gè)通道間評(píng)估和傳輸 ICC提示信號(hào)而得到。此例示于圖7(b)中,其中時(shí)間瞬間k-1與k的所述通道對(duì)(3,4)與 (1,2)分別為最強(qiáng)。啟發(fā)式規(guī)則可被用于在其它通道對(duì)間決定ICC。(空間提示信號(hào)的合成)圖8顯示圖4的BCC合成器400的實(shí)施框圖,其在給單一傳輸總和信號(hào)s (n)加空 間提示信號(hào)下,可被使用于BCC解碼器中以產(chǎn)生立體聲或多通道音頻信號(hào)。總和信號(hào)s(n) 被分解成基頻帶,其中?(幻指示這些基頻帶。為產(chǎn)生每一個(gè)輸出通道的相應(yīng)的基頻帶,延遲 d。校準(zhǔn)因子a。與濾波器h。被施加至總和信號(hào)的相應(yīng)的基頻帶,(為簡(jiǎn)化表示,時(shí)間索引k 在延遲、校準(zhǔn)因子和濾波器中被省略),ICTD通過加上延遲,ICTD通過校準(zhǔn)和ICC通過施加 去相關(guān)濾波器被合成,圖8中所示的處理被獨(dú)立地施加至每一基頻帶。(ICTD 合成)延遲dc從ICTDs T lc(k)被決定,依據(jù)如下第(12)式 用于參考通道的延遲屯被計(jì)算使得延遲d。的最大數(shù)量被最小化,越少基頻帶信號(hào) 被修改,越少的人為危害產(chǎn)生,假如基頻帶取樣率對(duì)ICTD合成未提供夠高的時(shí)間分辨率, 延遲可通過使用合適的全通濾波器更準(zhǔn)確地被加于其上。(ICLD 合成)為使輸出基頻帶信號(hào)在通道c和參考通道1具有所要的ICLDs A L12 (k),增益因子 a。應(yīng)所述滿足如下第(13)式 此外,輸出基頻帶最好被標(biāo)準(zhǔn)化使得全部輸出通道的功率與輸入總和信號(hào)的功率 相等。因?yàn)樵诿恳换l帶中的全部原始信號(hào)功率被保存在總和信號(hào)中,在絕對(duì)基頻帶功率 中的此標(biāo)準(zhǔn)化結(jié)果對(duì)每一個(gè)輸出通道接近原始編碼器音頻信號(hào)的相應(yīng)的功率,在這些限制 下,校準(zhǔn)因子a。由以下第(14)式得到。 (ICC 合成)在某些實(shí)施例中,ICC合成的目標(biāo)為在延遲后的基頻帶間降低相關(guān)且校準(zhǔn)已被施 加,而不會(huì)影響ICTD和ICLD。此可通過設(shè)計(jì)圖8中的濾波器h。而達(dá)到,使得ICTD和ICLD 如同一頻率函數(shù)有效地被改變,使得在每一基頻帶(音頻臨界頻帶)中平均變異為0。
圖9說明ICTD和ICLD如何在一基頻帶中作為頻率函數(shù)被改變,ICTD和ICLD變 異的振幅決定去相關(guān)的程度且作為ICC函數(shù)被控制,注意ICTD被平緩地改變(如圖9 (a)), 同時(shí)ICLD被任意改變(如圖9(b))??扇缤琁CTD平緩般地變化ICLD,但此將導(dǎo)致音頻信
號(hào)產(chǎn)生更多的聲染色。用于合成ICC的另一方法,特別適合于多通道ICC合成,被更詳細(xì)描述于 C.Faller,"Parametric multi-channel audio coding :Synthesis ofcoherence cues, "IEEE Trans, on Speech and Audio Proc.,2003,其啟示被并入于此以供參考,作為 時(shí)間和頻率的函數(shù),人為后期回響(latereverberation)的特定量被加于每一個(gè)輸出通道 用以獲得想要的ICC,另外,頻譜修改可被施加以使得產(chǎn)生信號(hào)的頻譜包絡(luò)接近原始音頻信 號(hào)的頻譜包絡(luò)。其它用于立體聲信號(hào)(或音頻通道對(duì))的相關(guān)與不相關(guān)的ICC合成技術(shù)已發(fā)表 于 E. Schuijers,W. Oomen,B. den Brinker,andj. Breebaart,‘‘Advances in parametric coding for high-quality audio, ”in Preprint 114th Conv. Aud. Eng. Soc.,Mar. 2003, and J.Engdegard, H. Purnhagen, J. Roden, and L. Liljeryd, "Synthetic ambience in parametric stereo coding,,,in Preprint 117th Cov. Aud. Eng. Soc.,May 2004,二者的啟 示并入于此以供參考。(C-to-E BCC)如先前描述,BCC可以超過傳輸通道被實(shí)施,BCC的變形已被描述,其代表C個(gè)音 頻通道并非為單一(傳輸)通道,但作為E個(gè)音頻通道,標(biāo)示為由C到E(C-to-E)BCC。對(duì) C-to-E BCC至少有兩個(gè)動(dòng)機(jī)具備傳輸通道的BCC提供向后(backwards)可兼容路徑用以升級(jí)現(xiàn)有的單聲道系 統(tǒng)用于立體聲或多通道音頻回放,所述經(jīng)升級(jí)的系統(tǒng)通過現(xiàn)有的單聲道架構(gòu)傳輸BCC下混 總和信號(hào),從C到E (C-to-E)的BCC可施加C個(gè)通道音頻的向后可兼容的編碼至E個(gè)通道。從C到E的BCC以傳輸通道數(shù)目的不同程度的減少引進(jìn)校準(zhǔn)??梢灶A(yù)期當(dāng)更多的 音頻通道被傳輸會(huì)有更佳的音頻質(zhì)量。對(duì)從C到E的BCC的信號(hào)處理細(xì)節(jié),諸如如何定義ICTD、ICLD和ICC提示信號(hào),被 描述于2004年1月20日的美國(guó)第10/762,100號(hào)專利申請(qǐng)中(Faller 13-1) 0(散射聲音整形)在某些實(shí)施中,BCC編碼包括用于ICTD、ICLD和ICC合成的算法。ICC提示信號(hào)可 以通過對(duì)在相應(yīng)的基頻帶中的信號(hào)分量進(jìn)行去關(guān)聯(lián)被合成。這可以通過ICLD的頻率相關(guān) 變化、ICTD和ICLD的頻率相關(guān)變化、全通濾波或者通過與回響算法相關(guān)的想法來完成。當(dāng)這些技術(shù)在音頻信號(hào)上使用時(shí),所述信號(hào)的時(shí)序包絡(luò)特征不被保存。特別地,當(dāng) 被應(yīng)用到瞬時(shí)現(xiàn)象上時(shí),瞬時(shí)信號(hào)能量可能被傳播了一段時(shí)期。這就導(dǎo)致了人為結(jié)果例如 “前回聲”或者“模糊的瞬時(shí)現(xiàn)象”。本發(fā)明的某些實(shí)施例的一般原理與觀測(cè)結(jié)果有關(guān),所述觀測(cè)結(jié)果為BCC解碼器合 成的聲音應(yīng)該不僅具有與原始聲音相似的空間特征,還應(yīng)該與所述原始聲音的時(shí)序包絡(luò)非 常近似,以便具有相似的感知特征。通常這是在通過包括動(dòng)態(tài)ICLD合成的類似BCC方案中 實(shí)現(xiàn)的,其對(duì)大約每個(gè)信號(hào)通道的時(shí)序包絡(luò)進(jìn)行時(shí)間變化校準(zhǔn)操作。對(duì)于瞬變信號(hào)(突發(fā)、 打擊樂器等),這種處理的瞬時(shí)清晰度可以,然而,不足以產(chǎn)生合成信號(hào),該合成信號(hào)足夠接
14近原始時(shí)序包絡(luò)。本節(jié)描述了許多具有十分精細(xì)的時(shí)間分辨率的方法來實(shí)現(xiàn)這個(gè)。另外,對(duì)于不能訪問所述原始信號(hào)的時(shí)序包絡(luò)的BCC解碼器,思路是將所述傳輸 “總和信號(hào)”的時(shí)序包絡(luò)作為近似值替換。這樣,就不需要將輔助信息從所述BCC編碼器到 所述BCC解碼器進(jìn)行傳輸以傳送這樣的包絡(luò)信息??傊?,本發(fā)明依賴下面的原則所述傳輸音頻通道(S卩“總和通道”)或者BCC合成可能基于的這些通道的線性組 合通過時(shí)序包絡(luò)提取器進(jìn)行分析用于其具有高時(shí)間分辨率的時(shí)序包絡(luò)(例如,比BCC區(qū)塊 的大小更顯著地精細(xì))。用于每個(gè)輸出通道的所述后續(xù)合成聲音被整形以便-即使是在ICC合成之后-其 能夠盡量地與通過所述提取器所決定的時(shí)序包絡(luò)相匹配。這會(huì)保證即使在瞬時(shí)信號(hào)的情況 下,所述合成的輸出聲音并沒有被ICC合成/信號(hào)去關(guān)聯(lián)處理顯著地降低品質(zhì)。圖10顯示的是根據(jù)本發(fā)明的一個(gè)實(shí)施例,表示BCC解碼器1000至少一部分的框 圖。在圖10中,區(qū)塊1002表示BCC合成處理,其包括,至少,ICC合成。BCC合成區(qū)塊1002 接收基通道1001并產(chǎn)生合成通道1003。在某些實(shí)施中,區(qū)塊1002表示圖4中的區(qū)塊406、 408和410的處理,其中基通道1001為上混區(qū)塊404產(chǎn)生的信號(hào),并且合成通道1003是關(guān) 聯(lián)區(qū)塊410產(chǎn)生的信號(hào)。圖10表示對(duì)一個(gè)基通道1001和它相應(yīng)的合成通道實(shí)施的處理。 相似的處理也被實(shí)施在每個(gè)其他的基通道和它相應(yīng)的合成通道上。 包絡(luò)提取器1004決定基通道1001,的細(xì)微時(shí)序包絡(luò)a,并且包絡(luò)提取器1006決定 合成通道1003’的細(xì)微時(shí)序包絡(luò)b。反包絡(luò)調(diào)節(jié)器1008使用來自包絡(luò)提取器1006的時(shí)序 包絡(luò)b以標(biāo)準(zhǔn)化合成通道1003’的所述包絡(luò)(即“平滑”所述時(shí)序細(xì)微結(jié)構(gòu))來產(chǎn)生具有標(biāo) 記(即統(tǒng)一的)時(shí)間包絡(luò)的平滑的信號(hào)1005’。根據(jù)特殊的實(shí)施,平滑化可以在上混前或上 混后實(shí)施。包絡(luò)調(diào)節(jié)器1010使用來自包絡(luò)提取器1004的時(shí)序包絡(luò)a以對(duì)平滑信號(hào)1005’ 上的原始信號(hào)包絡(luò)進(jìn)行再加強(qiáng)來產(chǎn)生具有與基通道1001的時(shí)序包絡(luò)大體上相等的時(shí)序包 絡(luò)的輸出信號(hào)1007,。根據(jù)所述實(shí)施,此時(shí)序包絡(luò)處理(在此也引用為“包絡(luò)整形”)可以應(yīng)用在整個(gè)合 成通道(如所示的那樣)或者只應(yīng)用在所述合成通道(如后面所描述的)的正交的部分 (例如,后期回響部分、去關(guān)聯(lián)部分)。此外,根據(jù)所述實(shí)施,包絡(luò)整形可以應(yīng)用在時(shí)域信號(hào) 或者以頻率依賴的方式應(yīng)用(例如,所述時(shí)序包絡(luò)分別以不同的頻率被評(píng)估和加強(qiáng))。反包 絡(luò)調(diào)節(jié)器1008和包絡(luò)調(diào)節(jié)器1010可以依不同的方式實(shí)施。在一種實(shí)施方式中,信號(hào)的包 絡(luò)通過信號(hào)的時(shí)域樣本(或者頻譜/基帶樣本)和時(shí)間變化的振幅改變函數(shù)(例如,用于 反包絡(luò)調(diào)節(jié)器1008的1/b和用于包絡(luò)調(diào)節(jié)器1010的a)的相乘來進(jìn)行操作??蛇x擇地,所 述信號(hào)的關(guān)于頻率的頻譜表示的卷積/濾波可以以在現(xiàn)有技術(shù)中為了對(duì)低速率音頻編碼 器的量化噪聲進(jìn)行整形為目的的方式被使用。相似地,信號(hào)的時(shí)序包絡(luò)可以通過分析信號(hào) 的時(shí)間結(jié)構(gòu)或者檢查關(guān)于頻率的信號(hào)頻譜的自動(dòng)關(guān)聯(lián)直接地被提取。圖11表現(xiàn)的是圖4中的BCC合成器400范圍內(nèi)的圖10的包絡(luò)整形方案的示范性 應(yīng)用。在本實(shí)施例中,有單一傳輸總和信號(hào)s(n),所述C個(gè)基信號(hào)通過復(fù)制那個(gè)總和來產(chǎn) 生,并且包絡(luò)整形被單獨(dú)地應(yīng)用到不同的基帶。在替換實(shí)施例中,延遲、校準(zhǔn)和其他處理的 順序可以不同。此外,在替換實(shí)施例中,包絡(luò)整形并不限定為獨(dú)立地處理每個(gè)基帶。對(duì)于基 于卷積/濾波的實(shí)施來說使用頻帶的協(xié)方差來得到關(guān)于所述信號(hào)時(shí)序細(xì)微結(jié)構(gòu)的信息是 特別準(zhǔn)確的。
在圖11(a)中時(shí)序處理分析器(TPA)1104與圖10中的包絡(luò)提取器1004相似,并 且每個(gè)時(shí)序處理器(TP) 1106與圖10中的包絡(luò)提取器1006、反包絡(luò)調(diào)節(jié)器1008和包絡(luò)調(diào)節(jié) 器1010的組合相似。圖11(b)為TPA1104的一個(gè)可能的基于時(shí)域的實(shí)施的框圖,其中所述基信號(hào)樣本 被平方(1110),然后被低通濾波(1112)以對(duì)所述基信號(hào)的時(shí)序包絡(luò)a進(jìn)行特性化。圖11(c)為TP1106的一個(gè)可能的基于時(shí)域的實(shí)施的框圖,其中所述合成信號(hào)樣本 被平方(1114),然后被低通濾波(1116)以對(duì)所述合成信號(hào)的時(shí)序包絡(luò)b進(jìn)行特性化。一個(gè) 校準(zhǔn)因子(例如,sqrt(a/b))被產(chǎn)生,然后被應(yīng)用到合成信號(hào)上以產(chǎn)生具有與所述原始基 通道的時(shí)序包絡(luò)大體上相等的時(shí)序包絡(luò)的輸出信號(hào)。在TPA1104和TP1106的替換實(shí)施中,通過使用量值操作而不是將所述信號(hào)樣本平 方而使所述時(shí)序包絡(luò)被特性化。在這樣的實(shí)施中,a/b的比率可以用作校準(zhǔn)因子而不用進(jìn) 行平方根的操作。雖然圖11(c)中的所述校準(zhǔn)操作對(duì)應(yīng)于TP處理的基于時(shí)域的實(shí)施,但是TP處理 (又TPA和反TP(ITP)處理)也能使用頻域信號(hào),如圖17 18(后面描述)中的實(shí)施例中 的,進(jìn)行實(shí)施。這樣,為了本說明書的目的,術(shù)語“校準(zhǔn)函數(shù)”應(yīng)該被理解為覆蓋時(shí)域或者頻 域操作,例如圖18(b)和(c)中的濾波操作。通常,TPA1104和TP1106優(yōu)選地被設(shè)計(jì)以便其不修改信號(hào)功率(S卩,能量)。根據(jù) 特殊實(shí)施,該信號(hào)功率可以是每個(gè)通道的短時(shí)間平均信號(hào)功率,例如,基于合成窗定義的時(shí) 間段里的每通道的總信號(hào)功率或者一些其他合適的功率量。這樣,ICLD合成(例如使用乘 法器408)的校準(zhǔn)能夠在包絡(luò)整形之前或之后應(yīng)用。注意到在圖11(a)中,每個(gè)通道有兩個(gè)輸出,其中TP處理只被應(yīng)用到他們其中的 一個(gè)。這反映出ICC合成方案,該方案混合兩個(gè)信號(hào)分量未修改的和正交的信號(hào),其中未 修改的和正交的信號(hào)的比率決定ICC。在圖11(a)所示的實(shí)施例中,TP只被應(yīng)用到正交的 信號(hào)分量上,其中總和節(jié)點(diǎn)1108將未修改信號(hào)分量和相應(yīng)的時(shí)序整形的正交的信號(hào)分量
重新組合。圖12表現(xiàn)了圖4中的BCC合成器400范圍內(nèi)的圖10中的包絡(luò)整形方案的替換 示范性實(shí)施,其中包絡(luò)整形被應(yīng)用到時(shí)域中。這樣的實(shí)施例可以被保證,當(dāng)頻譜表示,其中 ICTD、ICLD和ICC被執(zhí)行,的時(shí)間分辨率對(duì)于通過加強(qiáng)需要的時(shí)序包絡(luò)來有效阻止“前回 響”的時(shí)候。例如,這會(huì)是一種情況,當(dāng)BCC實(shí)施短時(shí)間傅立葉變換(STFT)的時(shí)候。如圖12(a)所示,TPA1204和每個(gè)TP1206在時(shí)域被實(shí)施,其中全基帶信號(hào)被校準(zhǔn) 以便其具有期望的時(shí)序包絡(luò)(例如,從傳輸總和信號(hào)評(píng)估的包絡(luò))。圖12(b)和(c)為與圖 1Kb)和(c)所示相似的TPA1204和TP1206的可能的實(shí)施。在此實(shí)施例中,TP處理被應(yīng)用到所述輸出信號(hào),而不僅是正交信號(hào)分量。在替換 實(shí)施例中,如果希望的話,基于時(shí)域的TP處理能夠被僅應(yīng)用到正交信號(hào)分量上,其中未修 改和正交的基頻帶將會(huì)被轉(zhuǎn)換到具有分開的反向?yàn)V波庫(kù)的時(shí)域。由于BCC輸出信號(hào)的全頻帶校準(zhǔn)可以導(dǎo)致人為現(xiàn)象,所以包絡(luò)整形可以只在指定 的頻率應(yīng)用,例如,頻率高于某個(gè)截止頻率fTP(例如,500Hz)。注意到用于分析(TPA)的頻 率范圍可以與用于合成(TP)的頻率范圍不同。圖13(a)和(b)為TPA1204和TP1206的可能的實(shí)施,其中包絡(luò)整形只在高于所述截止頻率fTP的頻率應(yīng)用。特別地,圖13(a)示出了高通濾波器1302的附加部分,其在時(shí)序 包絡(luò)特性化之前濾出低于fTP的頻率。圖13為具有在兩個(gè)基頻帶之間的fTP的截止頻率的 兩頻帶濾波庫(kù)1304,其中只有高頻部分被時(shí)序整形。兩頻帶反向?yàn)V波庫(kù)1306然后將低頻部 分與時(shí)序整形的高頻部分進(jìn)行重新組合以產(chǎn)生所述輸出信號(hào)。圖14表現(xiàn)的是所在2004年4月1日申請(qǐng)的代理人號(hào)是Baumgarte 7-12的美國(guó) 申請(qǐng)?zhí)枮?0/815,591號(hào)申請(qǐng)描述的基于后期回響ICC合成方案的范圍內(nèi)的圖10種的包絡(luò) 整形方案的示范性應(yīng)用。在此實(shí)施例中,TPA1404和每個(gè)TP1406在時(shí)域中應(yīng)用,如圖12或 圖13所示,但是其中每個(gè)TP1406被應(yīng)用到來自不同的后期回響(LR)區(qū)塊1402的輸出上。圖15所示的為根據(jù)本發(fā)明的實(shí)施例的表示BCC解碼器1500至少一個(gè)部分的框 圖,其可以與圖10所示的方案進(jìn)行替換。在圖15中,BCC合成區(qū)塊1502、包絡(luò)提取器1504 和包絡(luò)調(diào)節(jié)器1510與圖10中的BCC合成區(qū)塊1002、包絡(luò)提取器1004和包絡(luò)調(diào)節(jié)器1010 相似。在圖15中,然而,反包絡(luò)調(diào)節(jié)器1508在BCC合成之前被應(yīng)用,而不是BCC合成之后, 如圖10所示。這樣,反包絡(luò)調(diào)節(jié)器1508在BCC合成應(yīng)用之前對(duì)基通道進(jìn)行平滑處理。圖16所示為根據(jù)本發(fā)明的實(shí)施例的表示BCC解碼器1600至少一部分的框圖,其 可以與圖10和圖15所示的方案互換。在圖16中,包絡(luò)提取器1604和包絡(luò)調(diào)節(jié)器1610與 圖15中的包絡(luò)提取器1504和包絡(luò)調(diào)節(jié)器1510相似。在圖15中的實(shí)施例,然而,合成區(qū) 塊,1602表示與圖16所示的相似的基于后期回響的ICC合成。在這種情況下,包絡(luò)整形只 被應(yīng)用到不關(guān)聯(lián)的后期回響信號(hào),并且總和節(jié)點(diǎn)1612將時(shí)序整形的后期回響信號(hào)加到所 述原始基通道(其具有期望的時(shí)序包絡(luò))。要注意的是,在這種情況下,不需要使用反包絡(luò) 調(diào)節(jié)器,因?yàn)楹笃诨仨懶盘?hào)具有在區(qū)塊1602中的產(chǎn)生處理中生成的大約平的時(shí)序包絡(luò)。圖17為圖4中的BCC合成器400的范圍內(nèi)的圖15中的包絡(luò)整形方案的示范性應(yīng) 用。在圖17中,TPA1704、反TP(ITP) 1708和TP1710與圖15中的包絡(luò)提取器1504、反包絡(luò) 調(diào)節(jié)器1508和包絡(luò)調(diào)節(jié)器1510相似。在此基于頻率的實(shí)施例中,通過對(duì)沿著頻率軸的(例如,STFT)濾波庫(kù)402的頻率 碼使用卷積來進(jìn)行發(fā)散聲音的包絡(luò)整形。在此可參考美國(guó)專利5,781,888 (Herre)和美國(guó) 專利5,812,971 (Herre),其啟示在此飲用作為參考,其主題與這項(xiàng)技術(shù)相關(guān)。圖18 (a)表現(xiàn)的是圖17中的TPA1704的可能的實(shí)施地框圖。在此實(shí)施中,TPA1704 作為線性預(yù)測(cè)編碼(LPC)分析操作被實(shí)施,其決定最合適的預(yù)測(cè)系數(shù)用于一系列有關(guān)頻率 的頻譜系數(shù)。這種LPC分析技術(shù)是眾所周知的,例如,從語音編碼和很多用于LPC系數(shù)的有 效計(jì)算的算法可知,例如自動(dòng)關(guān)聯(lián)方法(涉及信號(hào)自動(dòng)關(guān)聯(lián)函數(shù)和后續(xù)levinson-Durbin 遞歸)。作為這個(gè)計(jì)算的結(jié)果,一套LPC系數(shù)在表示信號(hào)時(shí)序包絡(luò)的輸出是可用的。圖18(b)和(c)表示的是圖17的ITP1708和TP1710的可能實(shí)施的框圖。在這兩 個(gè)實(shí)施中,將要處理的信號(hào)的頻譜系數(shù)以頻率的順序(增加或減小)被處理,其在此通過旋 轉(zhuǎn)開關(guān)電路被符號(hào)化,通過預(yù)先濾波處理(在此處理之后再次回來)將這些系數(shù)轉(zhuǎn)化為一 系列用于處理的順序。在ITP1708的情況下,預(yù)先濾波計(jì)算預(yù)留量并以這種方式平滑所述 時(shí)序信號(hào)包絡(luò)。在TP1710的情況下,所述反濾波器從TPA1704重新引入LPC系數(shù)表示的所 述時(shí)序包絡(luò)。對(duì)于通過TPA1704的信號(hào)時(shí)序包絡(luò)的計(jì)算,重要的是消除濾波庫(kù)402的分析窗的 影響,如果使用這樣的窗。這可以通過以分析窗整形標(biāo)準(zhǔn)化結(jié)果包絡(luò)或使用分開的不使用分析窗的分析濾波庫(kù)來實(shí)現(xiàn)。圖17中的基于卷積/濾波技術(shù)也可以在圖16中的包絡(luò)整形方案的范圍內(nèi)應(yīng)用, 其中包絡(luò)提取器1604和包絡(luò)調(diào)節(jié)器1610分別基于圖18(a)的TPA和圖18(c)的TP。(另外可替換實(shí)施例)BCC解碼器能夠被設(shè)計(jì)用于選擇地開啟/關(guān)閉包絡(luò)整形。例如當(dāng)合成信號(hào)的時(shí)序 包絡(luò)充分地波動(dòng)時(shí),BCC解碼器能夠應(yīng)用傳統(tǒng)的BCC合成方案和開啟包絡(luò)整形,以便包絡(luò)整 形的好處大于任何包絡(luò)整形產(chǎn)生的人為影響。該開啟/關(guān)閉控制可以通過以下方式實(shí)現(xiàn)(1)瞬時(shí)現(xiàn)象檢測(cè)如果檢測(cè)到瞬時(shí)現(xiàn)象,那么TP處理被啟動(dòng)。瞬時(shí)現(xiàn)象檢測(cè)能 夠以展望的方式實(shí)施以在瞬時(shí)現(xiàn)象之前和之后立刻有效的即對(duì)瞬時(shí)現(xiàn)象整形也能對(duì)信號(hào) 整形。檢測(cè)瞬時(shí)現(xiàn)象可能的方式包括當(dāng)有指示瞬時(shí)現(xiàn)象發(fā)生的突然的功率上的增加出現(xiàn)時(shí),觀察傳輸BCC總和信號(hào)的 時(shí)序包絡(luò)以進(jìn)行檢測(cè);和檢查預(yù)先(LPC)濾波器的倍率。如果LPC預(yù)先倍率超出指定的閥值,則可設(shè)想信 號(hào)為瞬時(shí)現(xiàn)象或高波動(dòng)。LPC的分析關(guān)于頻譜自動(dòng)關(guān)聯(lián)被計(jì)算。(2)隨機(jī)檢測(cè)當(dāng)時(shí)序包絡(luò)隨機(jī)假波動(dòng)時(shí),存在一些情景。在這些情景中,沒有瞬 時(shí)現(xiàn)象被檢測(cè)到,但是TP處理可以仍然被實(shí)施(例如,相應(yīng)于這種情景的熱烈鼓掌的信 號(hào))。另外,在某些實(shí)施中,為了阻止可能的音調(diào)信號(hào)的人為影響,當(dāng)傳輸總和信號(hào)為高 時(shí),TP處理不被實(shí)施。此外,相似的方法可以在BCC編碼器中使用以在TP處理應(yīng)該被激活時(shí)進(jìn)行檢測(cè)。 因?yàn)榫幋a器可以訪問所有原始輸入信號(hào),其可以使用更精密的算法(例如,評(píng)估區(qū)塊208的 一部分)以便在TP處理應(yīng)該啟動(dòng)時(shí)進(jìn)行決定。這個(gè)決定的結(jié)果(當(dāng)TP應(yīng)該被激活時(shí),發(fā) 出信號(hào))能夠被傳輸?shù)紹CC解碼器(例如,圖2中的輔助信息的一部分)。雖然本發(fā)明已就BCC編碼方面被描述,其中具有單一總和信號(hào),本發(fā)明也可在具 有兩個(gè)或多個(gè)總和信號(hào)的BCC編碼方面被實(shí)施,在此情形下,用于每一個(gè)不同“基礎(chǔ)”的總 和信號(hào)的時(shí)序包絡(luò)可于施加BCC合成前被評(píng)估,且不同的BCC輸出通道可基于不同的時(shí)序 包絡(luò)被產(chǎn)生,根據(jù)總和信號(hào)被用以合成不同輸出通道,輸出通道從兩個(gè)或多個(gè)總和通道被 合成可基于有效的時(shí)序包絡(luò)被產(chǎn)生,所述時(shí)序包絡(luò)將所述構(gòu)成總和通道的相對(duì)效果列入考 慮(例如,通過加權(quán)平均)。雖然本發(fā)明已描述了涉及ICTD、ICLD和ICC碼的BCC碼的方面,本發(fā)明也可在僅 涉及這三種碼(例如,ICLD、ICC而非ICTD)類型中的一個(gè)或兩個(gè)的BCC碼方面實(shí)施和/或 額外碼類型中的一個(gè)或多個(gè),而且,BCC合成處理的順序與包絡(luò)整形可在不同實(shí)施中變化, 例如,當(dāng)包絡(luò)整形被施加至頻域信號(hào),如圖14與16,包絡(luò)整形可于ICTD合成(于那些使用 ICTD合成的實(shí)施例中)后但先于ICLD合成另外被實(shí)施,在其它實(shí)施例中,包絡(luò)整形于任何 其它BCC合成被施加前可被施加至上混信號(hào)。雖然本發(fā)明已在BCC編碼方案方面進(jìn)行了描述,本發(fā)明也可在其它音頻處理方面 實(shí)施,其中音頻信號(hào)被去相關(guān)或需要去相關(guān)信號(hào)的其它音頻處理。雖然本發(fā)明已在實(shí)施方面進(jìn)行了描述,其中編碼器在時(shí)域中接收輸入音頻信號(hào), 且在時(shí)域中產(chǎn)生傳輸音頻信號(hào),且解碼器在時(shí)域中接收傳輸音頻信號(hào),且在時(shí)域中產(chǎn)生回放音頻信號(hào),本發(fā)明不限于此,例如,在其它實(shí)施中,任意一個(gè)或多個(gè)輸入、傳輸和回放音頻 信號(hào)可被表示于頻域中。BCC編碼器和/或解碼器可與多種不同應(yīng)用或系統(tǒng)連接或被并入多種不同應(yīng)用或 系統(tǒng)中,包含用于電視或電子音樂發(fā)布、電影院、廣播、流向和/或接收的系統(tǒng),這些包含系 統(tǒng)用于編碼/解碼傳輸通過,例如,地面、衛(wèi)星、有線電視、因特網(wǎng)、網(wǎng)間網(wǎng)絡(luò)或物理媒介(例 如,磁盤、數(shù)字磁盤、半導(dǎo)體芯片、硬盤、記憶卡和相類物),BCC編碼器和/或解碼器也可被 使用于游戲與游戲系統(tǒng)中,包含,例如,想要與娛樂用的使用者互動(dòng)的交互式軟件產(chǎn)品和/ 或可被出版用于多項(xiàng)機(jī)器、平臺(tái)或媒介的教育,進(jìn)而BCC編碼器和/或解碼器可被并入于 PC軟件應(yīng)用,其是結(jié)合數(shù)字解碼(例如,播放機(jī)、解碼器)和結(jié)合數(shù)字編碼能力的軟件應(yīng)用 (例如,編碼器、錄音器、自動(dòng)點(diǎn)唱機(jī))。本發(fā)明可以以基于電路的制程被實(shí)現(xiàn),包含作為單一集成電路(如,ASIC或 FPGA)、多芯片模塊、單一卡片或多卡電路組的可能的實(shí)施,其對(duì)本領(lǐng)域技術(shù)人員電路組件 的各種功能也可如軟件程序的處理步驟被實(shí)施將是明顯的,這些軟件也可被使用于例如, 數(shù)字信號(hào)處理器、微控制器或一般計(jì)算機(jī)。本發(fā)明也可具體表現(xiàn)在方法和用以實(shí)施這些方法的設(shè)備中,本發(fā)明也可被具體實(shí) 施在包含在實(shí)體媒介的程序代碼中,如磁盤、CD-ROMs、硬盤或任何其它機(jī)器可讀取儲(chǔ)存媒 體,其中當(dāng)程序代碼被加載且通過機(jī)器如計(jì)算機(jī)執(zhí)行,所述機(jī)器變成用以實(shí)施本發(fā)明的設(shè) 備,本發(fā)明也可被具體表現(xiàn)于程序代碼,例如,是否儲(chǔ)存在儲(chǔ)存媒體、通過機(jī)器加載或執(zhí)行 或傳輸經(jīng)過一些傳輸媒體或載體,如以電線或有線、通過光纖或通過電磁輻射,其中,當(dāng)程 序代碼通過機(jī)器如計(jì)算機(jī)被加載和執(zhí)行,所述機(jī)器變成用以實(shí)施本發(fā)明的設(shè)備,當(dāng)在一般 處理器上實(shí)施時(shí),所述程序代碼區(qū)段結(jié)合所述處理器用以提供特殊裝置,其操作為類似于 特定邏輯電路。它將進(jìn)而了解到在細(xì)節(jié)、材料與已描述和說明以便解釋本發(fā)明的本質(zhì)的零件配置 上的各種變化,對(duì)本領(lǐng)域技術(shù)人員來說,可無需脫離本發(fā)明表示在以下的權(quán)利要求書而實(shí) 現(xiàn)。雖然以下方法權(quán)利要求書中的步驟,若有的話,可以特定順序和相應(yīng)的標(biāo)示被詳 述,除非所述權(quán)利要求書詳述另外暗指特定順序用以實(shí)施這些步驟的一些或全部,這些步 驟不必被限定為以所述特定順序被實(shí)施。
19
權(quán)利要求
一種用于對(duì)C個(gè)輸入音頻通道進(jìn)行編碼以產(chǎn)生E個(gè)傳輸音頻通道的方法,該方法包括為所述C個(gè)輸入通道中的兩個(gè)或多個(gè)產(chǎn)生一個(gè)或多個(gè)提示碼;將所述C個(gè)輸入通道下混以產(chǎn)生所述E個(gè)傳輸通道,其中C>E≥1;和對(duì)所述C個(gè)輸入通道中和所述E個(gè)傳輸通道中的一個(gè)或多個(gè)進(jìn)行分析以產(chǎn)生一個(gè)標(biāo)記,所述標(biāo)記在所述E個(gè)傳輸通道解碼期間用來指示所述E個(gè)傳輸通道的解碼器是否執(zhí)行包絡(luò)整形,所述分析步驟包括以用于展望方式在所述解碼器中對(duì)不僅瞬時(shí)現(xiàn)象,而且在所述瞬時(shí)現(xiàn)象前后的信號(hào)進(jìn)行整形的瞬時(shí)現(xiàn)象檢測(cè),當(dāng)檢測(cè)到瞬時(shí)現(xiàn)象時(shí)設(shè)置標(biāo)記,或包括用于檢測(cè)是否時(shí)序包絡(luò)是以假的隨機(jī)方式的波動(dòng)的隨機(jī)檢測(cè),當(dāng)時(shí)序包絡(luò)是以假的隨機(jī)方式的波動(dòng)時(shí),設(shè)置所述標(biāo)記,或包括用于當(dāng)E個(gè)傳輸通道是音調(diào)時(shí)不設(shè)置所述標(biāo)記的音調(diào)檢測(cè)。
2.如權(quán)利要求1所述的發(fā)明,其中所述包絡(luò)整形對(duì)由所述解碼器產(chǎn)生的解碼后通道的 時(shí)序包絡(luò)進(jìn)行調(diào)整以便大體上與相應(yīng)的傳輸通道的時(shí)序包絡(luò)大體上匹配。
3.一種用于對(duì)C個(gè)輸入音頻通道進(jìn)行編碼以產(chǎn)生E個(gè)傳輸音頻通道的設(shè)備,該設(shè)備包括用于為所述C個(gè)輸入通道中的兩個(gè)或多個(gè)產(chǎn)生一個(gè)或多個(gè)提示碼的裝置; 用于將所述C個(gè)輸入通道進(jìn)行下混以產(chǎn)生所述E個(gè)傳輸通道的裝置,其中C > E > 1 ;禾口用于對(duì)所述C個(gè)輸入通道中的一個(gè)或多個(gè)和所述E個(gè)傳輸通道中的一個(gè)或多個(gè)進(jìn)行 分析以產(chǎn)生一個(gè)標(biāo)記的裝置,所述標(biāo)記在所述E個(gè)傳輸通道解碼期間用來指示所述E個(gè)傳 輸通道的解碼器是否執(zhí)行包絡(luò)整形,所述用于分析的裝置包括以用于展望方式在所述解碼 器中對(duì)不僅瞬時(shí)現(xiàn)象,而且在所述瞬時(shí)現(xiàn)象前后的信號(hào)進(jìn)行整形的瞬時(shí)現(xiàn)象檢測(cè),當(dāng)檢測(cè) 到瞬時(shí)現(xiàn)象時(shí)設(shè)置標(biāo)記,或包括用于檢測(cè)是否時(shí)序包絡(luò)是以假的隨機(jī)方式的波動(dòng)的隨機(jī)檢 測(cè),當(dāng)時(shí)序包絡(luò)是以假的隨機(jī)方式的波動(dòng)時(shí),設(shè)置所述標(biāo)記,或包括用于當(dāng)E傳輸通道是音 調(diào)時(shí)不設(shè)置所述標(biāo)記的音調(diào)檢測(cè)。
4.如權(quán)利要求3所述的設(shè)備,其中用于產(chǎn)生的裝置包括代碼評(píng)估器;和 其中用于下混的裝置包括下混器。
5.如權(quán)利要求4所述的發(fā)明,其中所述設(shè)備為從數(shù)字放影機(jī)、數(shù)字音頻播放機(jī)、計(jì)算機(jī)、衛(wèi)星發(fā)送器、有線發(fā)送器、陸地廣 播發(fā)送器、家用娛樂系統(tǒng)與電影劇院系統(tǒng)組成的組的系統(tǒng);及 所述系統(tǒng)包括所述代碼評(píng)估器和所述下混器。
6.通過對(duì)C個(gè)輸入音頻通道進(jìn)行編碼以產(chǎn)生E個(gè)傳輸音頻通道而產(chǎn)生的編碼后的音頻 比特流,其中為所述C個(gè)輸入通道中的兩個(gè)或多個(gè)產(chǎn)生一個(gè)或多個(gè)提示碼; 對(duì)所述C個(gè)輸入通道進(jìn)行下混以產(chǎn)生E個(gè)傳輸通道,其中C > E > 1 ; 通過對(duì)所述C個(gè)輸入通道中和所述E個(gè)傳輸通道中的一個(gè)或多個(gè)進(jìn)行分析而產(chǎn)生的標(biāo) 記,其中所述標(biāo)記用來指示所述E個(gè)傳輸通道的解碼器是否執(zhí)行包絡(luò)整形;所述標(biāo)記通過 以用于展望方式在所述解碼器中對(duì)不僅瞬時(shí)現(xiàn)象,而且在所述瞬時(shí)現(xiàn)象前后的信號(hào)進(jìn)行整形的瞬時(shí)現(xiàn)象檢測(cè)進(jìn)行檢測(cè),當(dāng)檢測(cè)到瞬時(shí)現(xiàn)象時(shí)設(shè)置標(biāo)記,或包括用于檢測(cè)是否時(shí)序包 絡(luò)是以假的隨機(jī)方式的波動(dòng)的隨機(jī)檢測(cè),當(dāng)時(shí)序包絡(luò)是以假的隨機(jī)方式的波動(dòng)時(shí),設(shè)置所 述標(biāo)記,或包括用于當(dāng)E傳輸通道是音調(diào)時(shí)不設(shè)置所述標(biāo)記的音調(diào)檢測(cè),和所述E個(gè)傳輸通道、一個(gè)或多個(gè)提示碼和所述標(biāo)記被編 碼到所屬編碼后音頻比特流中。
全文摘要
將具有輸入時(shí)序包絡(luò)的輸入音頻信號(hào)轉(zhuǎn)換成具有輸出時(shí)序包絡(luò)的輸出音頻信號(hào)。所述輸入音頻信號(hào)的輸入時(shí)序包絡(luò)被特性化。所述輸入音頻信號(hào)被處理以產(chǎn)生處理后音頻信號(hào),其中所述的處理將所述輸入音頻信號(hào)進(jìn)行去關(guān)聯(lián)。所述處理后音頻信號(hào)基于特性化的輸入時(shí)序包絡(luò)被調(diào)整以產(chǎn)生所述輸出音頻信號(hào),其中所述輸出時(shí)序包絡(luò)大體上與所述輸入時(shí)序包絡(luò)相匹配。
文檔編號(hào)H04S3/02GK101853660SQ20101013845
公開日2010年10月6日 申請(qǐng)日期2005年9月12日 優(yōu)先權(quán)日2004年10月20日
發(fā)明者于爾根·赫勒, 克里斯托夫·法勒, 埃里克·阿拉曼奇, 薩沙·迪施 申請(qǐng)人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì);艾格瑞系統(tǒng)有限公司