亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

用于各種回放環(huán)境的動態(tài)范圍控制的制作方法_4

文檔序號:9794357閱讀:來源:國知局
,運些動作包括但不限于W下動作中的任一 個:(1)全局適用于所有增益簡檔、(2)-個或更多個而不是所有增益簡檔特有、一個或更多 個缺省DRC曲線特有、(3)-個或更多個非缺省DRC曲線特有;(4)相應(yīng)(例如,缺省、非缺省 等)增益簡檔特有;(5)與超出由媒體編碼格式、媒體標(biāo)準(zhǔn)、媒體專有規(guī)范等支持的參數(shù)化的 限制的算法、曲線、函數(shù)、動作、參數(shù)等中的一個或更多個相關(guān);(6)與還沒有在本領(lǐng)域中在 音頻解碼裝置中普遍實現(xiàn)的算法、曲線、函數(shù)、動作、參數(shù)等中的一個或更多個相關(guān);等等。
[0146] 在一些實施例中,音頻編碼器(150)可被配置為至少部分地基于由缺省DRC曲線 (例如,具有編碼音頻信號的簡檔相關(guān)元數(shù)據(jù)中的定義數(shù)據(jù)等)代表的缺省增益簡檔和與缺 省增益簡檔不同的非缺省增益簡檔確定用于音頻內(nèi)容(1512)的一組差分增益,并且,作為 編碼音頻信號中的簡檔相關(guān)元數(shù)據(jù)的一部分包含作為非缺省增益簡檔的代表(例如,與缺 省DRC曲線等相關(guān))的一組差分增益。關(guān)于缺省DRC曲線從編碼音頻信號中的簡檔相關(guān)元數(shù) 據(jù)提取的該組差分增益可被受體音頻解碼器使用,W在回放環(huán)境或情形中對關(guān)于缺省DRC 曲線由一組差分增益代表的特定增益簡檔有效且一致地執(zhí)行增益動作(或衰減動作)。運允 許受體音頻解碼器在不需要受體音頻解碼器實現(xiàn)可在音頻編碼器(150)中實現(xiàn)的一組增益 生成動作的情況下施加特定增益簡檔的增益或衰減,W生成增益或衰減。
[0147] 在一些實施例中,一組或更多組差分增益可通過音頻編碼器(150)包含于簡檔相 關(guān)元數(shù)據(jù)中??申P(guān)于一個或更多個缺省增益簡檔中的相應(yīng)缺省增益簡檔從一個或更多個非 缺省增益簡檔中的相應(yīng)非缺省增益簡檔導(dǎo)出一組或更多組差分增益中的每一個。例如,可 關(guān)于第一缺省增益簡檔從第一非缺省增益簡檔導(dǎo)出一組或更多組差分增益中的第一組差 分增益,而可關(guān)于第二缺省增益簡檔從第二非缺省增益簡檔導(dǎo)出差分增益組中的第二組差 分增益。
[0148] 在一些實施例中,第一組差分增益包含在基于第一非缺省增益簡檔生成的第一組 非差分非缺省增益與基于第一缺省增益簡檔生成的第一組非差分缺省增益之間確定的第 一增益差(或增益調(diào)整),而第二組差分增益包含在基于第二非缺省增益簡檔生成的第二組 非差分非缺省增益與基于第二缺省增益簡檔生成的第二組非差分缺省增益之間確定的第 二增益差。
[0149] 第一缺省增益簡檔和第二缺省增益簡檔可相同(例如,由與同一組增益生成動作 相同的缺省DRC曲線代表,等等)或者不同(例如,由不同的缺省DRC曲線代表,由具有不同的 組的增益生成動作的缺省DRC曲線代表,等等)。在各種實施例中、另外、任選地或者作為替 代方案,第一非缺省增益簡檔可W或者可W不與第二非缺省增益簡檔相同。
[0150] 由音頻編碼器(150)生成的簡檔相關(guān)元數(shù)據(jù)可承載一個或更多個特定的標(biāo)記、指 示、數(shù)據(jù)欄等,W指示一個或更多個相應(yīng)非缺省增益簡檔的一組或更多組差分增益的存在。 簡檔相關(guān)數(shù)據(jù)還可包含偏好標(biāo)記、指示、數(shù)據(jù)欄等,W指示哪個非缺省增益簡檔優(yōu)選用于在 特定回放環(huán)境或情形中呈現(xiàn)音頻內(nèi)容。
[0151] 在一些實施例中,運里描述的音頻解碼器(例如,100等)被配置為從編碼音頻信號 (102)解碼(例如,多信道等)音頻內(nèi)容、從用音頻內(nèi)容傳輸?shù)捻懚仍獢?shù)據(jù)提取對話響度水平 (例如,"dialnorm"等),等等。
[0152] 在一些實施例中,音頻解碼器(例如,100等)被配置為對諸如第一缺省簡檔、第二 缺省簡檔等的增益簡檔執(zhí)行至少一組增益生成動作。例如,音頻解碼器(100)可用對話響度 水平(例如,"dialnorm"等)解碼經(jīng)編碼的音頻信號(102);執(zhí)行一組增益生成動作W獲得由 可通過音頻解碼器(100)從編碼的音頻信號(102)提取定義數(shù)據(jù)的缺省DRC曲線代表的缺省 增益簡檔的一組非差分缺省增益(或衰減);在解碼的過程中施加缺省增益簡檔的一組非差 分缺省增益(例如,基準(zhǔn)響度水平與"dialnorm"之間的差值等),W將輸出的聲音的輸出對 話響度水平對準(zhǔn)/調(diào)整到基準(zhǔn)響度水平;等等。
[0153] 另外、任選地或者作為替代方案,在一些實施例中,音頻解碼器(100)被配置為從 編碼的音頻信號(102)提取關(guān)于諸如上述的缺省DRC曲線代表非缺省增益簡檔的至少一組 差分增益作為用音頻內(nèi)容傳輸?shù)脑獢?shù)據(jù)的一部分。在一些實施例中,簡檔相關(guān)元數(shù)據(jù)包含 一個或更多個不同組的差分增益一一個或更多個不同組的差分增益中的每一個代表關(guān)于 代表缺省增益簡檔的各缺省DRC曲線的非缺省增益簡檔。可通過在簡檔相關(guān)元數(shù)據(jù)中承載 的一個或更多個標(biāo)記、指示、數(shù)據(jù)欄指示在簡檔相關(guān)元數(shù)據(jù)中存在DRC曲線或一組差分增 益。
[0154] 響應(yīng)于確定存在一組或更多組差分增益,音頻解碼器(100)可在一個或更多個不 同組的差分增益中確定/選擇與特定非缺省增益簡檔對應(yīng)的一組差分增益。音頻解碼器 (100)可進一步被配置為識別缺省DRC曲線一例如,在簡檔相關(guān)元數(shù)據(jù)中的一個或更多個不 同缺省DRC曲線的定義數(shù)據(jù)中一關(guān)于該缺省DRC曲線,該組差分增益代表特定增益簡檔。
[0155] 在一些實施例中,音頻解碼器(100)被配置為執(zhí)行一組增益生成動作W獲得缺省 增益簡檔的一組非差分缺省增益(或衰減)。由音頻解碼器(100)執(zhí)行W基于缺省DRC曲線獲 得一組非差分缺省增益的一組增益生成動作可包含關(guān)于一個或更多個標(biāo)準(zhǔn)、專有規(guī)范等的 一個或更多個動作。在一些實施例中,音頻解碼器(100)被配置為基于從簡檔相關(guān)元數(shù)據(jù)提 取定義數(shù)據(jù)的一組差分增益生成特定非缺省增益簡檔的一組非差分非缺省增益,并且基于 缺省DRC曲線生成由一組增益生成動作生成的一組非差分缺省增益;在解碼中對非缺省增 益簡檔施加一組非差分非缺省增益(例如,基準(zhǔn)響度水平與"dialnorm"之間的差值等),W 將輸出的聲音的輸出對話響度水平對準(zhǔn)/調(diào)整到基準(zhǔn)響度水平;等等。
[0156] 在一些實施例中,音頻解碼器(100)能夠執(zhí)行一個或更多個增益簡檔的增益相關(guān) 動作。音頻解碼器(100)可被配置為基于一個或更多個因素確定和執(zhí)行特定增益簡檔的增 益相關(guān)動作。運些因素可包括但不僅限于W下方面中的一個或更多個:規(guī)定特定用戶選擇 增益簡檔的偏好的用戶輸入;規(guī)定系統(tǒng)選擇的增益簡檔的偏好的用戶輸入、由音頻解碼器 (100)使用的特定揚聲器或音頻信道配置的能力;音頻解碼器(100)的能力;特定增益簡檔 的簡檔相關(guān)元數(shù)據(jù)的可用性、增益簡檔的任何編碼器生成偏好標(biāo)記等。在一些實施例中,音 頻解碼器(100)可實現(xiàn)一個或更多個過程規(guī)則、可征求進一步的用戶輸入等,W在運些因素 相互沖突時確定或選擇特定增益簡檔。
[0157] 11.與增益有關(guān)的附加動作
[0158] 根據(jù)在運里描述的技術(shù),不是在物理域(或代表物理域的數(shù)字域)中,而是可在響 度(例如,感覺)域中執(zhí)行諸如動態(tài)均衡化、噪聲補償?shù)鹊钠渌幚怼?br>[0159] 在一些實施例中,來自諸如DRC、均衡化噪聲補償、修剪防止、增益平滑化等的各種 處理中的一些或全部的增益可在響度域中的相同增益中被組合,并且/或者可被并行施加。 在一些其它的實施例中,來自諸如DRC、均衡化噪聲補償、修剪防止、增益平滑化等的各種處 理中的一些或全部的增益可處于響度域中的單獨的增益中,并且/或者可至少部分地被串 行施加。在一些其它的實施例中,來自諸如DRC、均衡化噪聲補償、修剪防止、增益平滑化等 的各種處理中的一些或全部的增益可被依次施加。
[0160] 12.特定和廣帶(或?qū)拵?響度水平
[0161] -個或更多個音頻處理要素、單元、部件等,諸如傳送濾波器、聽覺濾波器組、合成 濾波器組、短時傅立葉變換等,可被編碼器或解碼器使用,W執(zhí)行在運里描述的音頻處理動 作。
[0162] 在一些實施例中,可W使用模型化人聽覺系統(tǒng)的外和中耳過濾的一個或更多個傳 送濾波器,W過濾進入的音頻信號(例如,編碼的音頻信號102、來自內(nèi)容提供方的音頻內(nèi)容 等)。在一些實施例中,可W使用聽覺濾波器組W模型化人聽覺系統(tǒng)的頻率選擇性和頻率展 度。來自運些濾波器中的一些或全部的激勵信號水平可通過向著更高的頻率的更短的頻率 依賴時間常數(shù)被確定/計算和平滑化,W模型化人聽覺系統(tǒng)中的能量的積分。隨后,可W使 用激勵信號與特定響度水平之間的非線性函數(shù)(例如,關(guān)系、曲線等),W獲得頻率依賴特定 響度水平的簡檔??赏ㄟ^在頻帶上積分特定響度獲得廣帶(或?qū)拵?響度水平。
[0163] 特定響度水平的直接(例如,對所有頻帶具有相同的權(quán)重等)加算/積分可對廣帶 信號很好地起作用。但是,運種方法可能低估窄帶信號的(例如,感覺等)響度水平。在一些 實施例中,不同頻率或者不同頻帶中的特定響度水平被賦予不同的權(quán)重。
[0164] 在一些實施例中,上述的聽覺濾波器組和/或傳送濾波器可被一個或更多個短時 傅立葉變換(STFT)替代??稍诳焖俑盗⑷~變換(FFT)域中施加對傳送濾波器和聽覺濾波器 組的響應(yīng)。在一些實施例中,例如,當(dāng)在從物理域(或在代表物理域的數(shù)字域中巧Ij響度域的 轉(zhuǎn)換中或者之前使用一個或更多個(例如,向前等)傳送濾波器時,使用一個或更多個逆?zhèn)?送濾波器。在一些實施例中,例如,當(dāng)作為聽覺濾波器組和/或傳送濾波器的替代使用STFT 時,不使用逆?zhèn)魉蜑V波器。在一些實施例中,省略聽覺濾波器組;作為替代,使用一個或更多 個正交鏡像濾波器(QMF)。在運些實施例中,可在不明顯影響運里描述的音頻處理動作的性 能的情況下省略人聽覺系統(tǒng)的模型中的基膜的擴展效果。
[0165] 根據(jù)運里描述的技術(shù),可在各種實施例中使用不同數(shù)量的頻帶(例如,20個頻帶、 40個感應(yīng)帶等)。另外、任選地或者作為替代方案,也可在各種實施例中使用不同的帶寬寬 度。
[0166] 13.用于信道的各單個子集的各單個增益
[0167] 在一些實施例中,當(dāng)特定揚聲器配置是多信道配置時,可通過在從物理域(或者在 代表物理域的數(shù)字域中)向響度域的轉(zhuǎn)換之前首先加算所有信道的激勵信號獲得總響度水 平。但是,向特定揚聲器配置中的所有信道施加相同的增益不能保持特定揚聲器配置的不 同信道(例如,關(guān)于不同信道之間的相對響度水平等)之間的空間平衡。
[0168] 在一些實施例中,為了保持空間平衡使得可最佳地或者正確地保持不同信道之間 的相對感覺響度水平,可對每個信道確定或計算各響度水平和基于各響度水平獲得的相應(yīng) 增益。在一些實施例中,基于各響度水平獲得的相應(yīng)的增益不等于相同的總增益;例如,相 應(yīng)增益中的一些或全部中的每一個可等于總增益加上(例如,信道特定)小校正。
[0169] 在一些實施例中,為了保持空間平衡,可對信道的每個子集確定或計算各響度水 平和基于各響度水平獲得的相應(yīng)增益。在一些實施例中,基于各響度水平獲得的相應(yīng)的增 益不等于相同的總增益;例如,相應(yīng)增益中的一些或全部中的每一個可等于總增益加上(例 如,信道特定)小校正。在一些實施例中,信道的子集可包含形成特定揚聲器配置中的所有 信道的適當(dāng)子集的兩個或更多個信道(例如,包含左前、右前和低頻效果化FE)的信道的子 集;包含左環(huán)繞和右環(huán)繞的信道的子集,等等)。信道的子集的音頻內(nèi)容可構(gòu)成在編碼音頻 信號(102)中承載的總混合的子混合??上蜃踊旌蟽?nèi)的信道施加相同的增益。
[0170] 在一些實施例中,為了從特定揚聲器配置生成實際的響度(例如,實際感覺等),可 W使用一個或更多個校準(zhǔn)參數(shù)W關(guān)聯(lián)數(shù)字域中的信號水平與由數(shù)字域代表的物理域中的 相應(yīng)物理(例如,關(guān)于地SPL的空間壓力等)水平。一個或更多個校準(zhǔn)參數(shù)可被賦予特定揚聲 器配置中的物理聲音設(shè)備特有的值。
[0171] 14.聽覺場景分析
[0172] 在一些實施例中,運里描述的編碼器可實現(xiàn)基于計算機的聽覺場景分析(ASA) W 檢測音頻內(nèi)容(例如,編碼成編碼音頻信號102等)中的聽覺事件邊界、生成一個或更多個 ASA參數(shù)、將一個或更多個ASA參數(shù)格式化為編碼音頻信號(例如,102等)的要傳輸?shù)较掠窝b 置(例如,解碼器100等)的部分。ASA參數(shù)可包含但不僅僅限于指示聽覺事件邊界的位置的 參數(shù)、聽覺事件確信度測量(后面進一步解釋)等中的任一個。
[0173] 在一些實施例中,聽覺事件邊界的(例如,時間上的)位置可在在編碼的音頻信號 (102)內(nèi)編碼的元數(shù)據(jù)中被指示。另外、任選地或者作為替代方案,聽覺事件邊界的(例如, 時間上的)位置可在檢測聽覺事件邊界的位置的音頻數(shù)據(jù)塊和/或帖中被指示(例如,用標(biāo) 記、數(shù)據(jù)欄等)。
[0174] 運里,聽覺事件邊界指的是前面的聽覺事件結(jié)束和/或后續(xù)的聽覺事件開始的點。 各聽覺事件在兩個連續(xù)的聽覺事件邊界之間出現(xiàn)。
[0175] 在一些實施例中,編碼器(150)被配置為通過兩個(例如,時間上)連續(xù)音頻數(shù)據(jù)帖 之間的特定響度頻譜中的差值檢測聽覺事件邊界。特定響度頻譜中的每一個可包含從連續(xù) 音頻數(shù)據(jù)帖的相應(yīng)音頻數(shù)據(jù)帖計算的不平滑化響度的頻譜。
[0176] 在一些實施例中,特定響度頻譜N[b,t]可被歸一化W獲得下式所示的歸一化特定 響度頻譜NN0RM[b,t]:
(1)
[0178] 運里,b表示頻帶,t表示時間或音頻數(shù)據(jù)帖指數(shù),maxb{N[b,t]}是跨著所有頻帶的 最大特定響度水平。
[0179] 如下式那樣,歸一化特定響度頻譜可相減并且被用于導(dǎo)出加算的絕對差D[t]。
[0180] D[t]= 2b|NN〇RM[b,t]-NN〇RM[b,t-:L] I (2)
[0181] 加算的絕對值被映射到具有0~I的值范圍的聽覺事件確信度測量A[t巧日下:
[0182]
巧)
[01 83]運里,Dmin和Dmax是最小和最大闊值(例如,用戶可配置、系統(tǒng)可配置、關(guān)于音頻內(nèi)容 中的D[t]的過去值分布設(shè)定,等等)。
[0184] 在一些實施例中,編碼器(150)被配置為檢測D[t](例如,在特定的t處等)高于Dmin 時的聽覺事件邊界(例如,特定t等)。
[0185] 在一些實施例中,運里描述的解碼器(例如,100等)從編碼的音頻信號(例如,102 等)提取ASA參數(shù),并且使用ASA參數(shù)W防止導(dǎo)致聽覺事件的感覺崎變的柔聲的無意的升壓 和/或大聲的無意切割。
[0186] 解碼器(100)可被配置為通過確保在聽覺事件內(nèi)增益更接近恒定并且通過將許多 的增益改變約束到聽覺事件邊界的附近來減少或防止聽覺事件的無意崎變。例如,解碼器 (100)可被配置為響應(yīng)聽覺事件邊界處的起音(例如,響度水平增加等)中的增益變化使用 相對小的時間常數(shù)(例如,與聽覺事件的最小持續(xù)期相當(dāng)或者比其短等)。因此,可相對迅速 地通過解碼器(100)實現(xiàn)起音中的增益變化。另一方面,解碼器(100)可被配置為響應(yīng)聽覺 事件中的釋放(例如,響度水平減小等)的增益變化相對于聽覺事件的持續(xù)期使用相對長的 時間常數(shù)。因此,可相對慢地通過解碼器(100)實現(xiàn)釋放的增益變化,使得應(yīng)當(dāng)表現(xiàn)恒定或 者逐漸衰減的聲音不可聽或者在感覺上受到干擾。聽覺事件邊界處的起音中的迅速響應(yīng)和 聽覺事件中的釋放的慢速響應(yīng)允許快速感覺到聽覺事件的到達,并且保持聽覺事件中的感 覺質(zhì)量和/或完整性一包含通過特定響度水平關(guān)系和/或特定時間關(guān)系鏈接的大聲和柔 聲一諸如鋼琴弦等。
[0187] 在一些實施例中,解碼器(100)使用由ASA參數(shù)指示的聽覺事件和聽覺事件邊界W 控制解碼器(100)處的特定揚聲器配置中的信道中的一個、兩個、一些或全部的增益變化。 [018引15.響度水平過渡
[0189] 例如,在兩個節(jié)目之間、在節(jié)目與大聲商業(yè)廣告之間等,可出現(xiàn)響度水平過渡。在 一些實施例中,解碼器(100)被配置為基于過去的音頻內(nèi)容(例如,從編碼音頻信號102接 收,過去4秒等)保持瞬時響度水平的直方圖。在從響度水平過渡之前到響度水平過渡之后 的時間間隔上,具有變高的概率的兩個區(qū)域可在直方圖中被記錄。區(qū)域中的一個W前面響 度水平周圍為中屯、,而區(qū)域中的另一個W新的響度水平周圍為中屯、。
[0190] 解碼器(100)可將平滑化的響度水平動態(tài)地確定為正在處理的音頻內(nèi)容,并且基 于平滑化的響度水平確定直方圖的相應(yīng)箱體(例如,包含與平滑化的響度水平相同的值的 瞬時響度水平的箱體等)。解碼器(100)進一步被配置為比較相應(yīng)箱體處的概率與闊值(例 如,6%、7%、7.5%等),運里,直方圖曲線的總區(qū)域(例如,所有箱體的和)代表100%的概 率。解碼器可被配置為通過確定相應(yīng)箱體處的概率低于闊值檢測響度水平過渡的出現(xiàn)。作 為響應(yīng),解碼器(100)被配置為選擇相對小的時間常數(shù)W相對快速地適于新的響度水平。因 此,可減少響度水平過渡內(nèi)的大聲(或柔聲)開始的時間持續(xù)期。
[0191] 在一些實施例中,解碼器(100)使用安靜/噪聲口,W防止低瞬時響度水平進入到 直方圖中并且變?yōu)橹狈綀D中的高概率箱體。另外、任選地或者作為替代方案,解碼器(100) 可被配置為使用ASA參數(shù)W檢測包含于直方圖中的聽覺事件。在一些實施例中,解碼器 (100)可從ASA參數(shù)確定時間平均聽覺事件確信度測量近幻的時間依賴值。在一些實施例 中,解碼器(100)從ASA參數(shù)確定(例如,瞬時等)聽覺事件確信度測量A[t]的時間依賴值,并 且從ASA參數(shù)等基于(例如,瞬時等)聽覺事件確信度測量A[t]的時間依賴值計算時間平均 聽覺事件確信度測量羽d的值。解碼器(100)可被配置為如果與響度水平同時的時間平均 聽覺事件確信度測量孔幻低于直方圖包含闊值(例如,〇.1、〇. 12等)貝閒騰響度水平進入直 方圖。
[0192] 在一些實施例中,對允許包含于直方圖中的(例如,瞬時等)響度水平(例如,相應(yīng)的 巧幻高于直方圖包含闊值等),響度水平被分配與與響度水平同時的(contemporanneous) 時間平均聽覺事件確信度測量巧幻的時間依賴值相同、與其成比例等的權(quán)重。作為結(jié)果,與 不接
當(dāng)前第4頁1 2 3 4 5 6 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1