壓縮音頻信號的以信號質(zhì)量為基礎(chǔ)的增強(qiáng)和補(bǔ)償?shù)闹谱鞣椒?

文檔序號：10540937閱讀：580來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

壓縮音頻信號的以信號質(zhì)量為基礎(chǔ)的增強(qiáng)和補(bǔ)償?shù)闹谱鞣椒?br>【專利摘要】采樣器模塊可將音頻信號分成一系列順序樣本。信號質(zhì)量檢測器模塊可識別所述音頻信號的在所述音頻信號開端跨越多個順序樣本的一致磚墻頻率，并且確定與所述磚墻頻率成比例的信號處置指示。信號增強(qiáng)器模塊可順序地接收并分析所述音頻信號的一個或多個樣本分量，以識別各自順序樣本的所述一個或多個樣本分量中的所述音頻信號的丟失部分，并且根據(jù)所述信號質(zhì)量指示生成用于具有對應(yīng)識別的丟失部分的各自順序樣本的所述一個或多個樣本分量中每一個的對應(yīng)信號處置。
【專利說明】壓縮音頻信號的以信號質(zhì)量為基礎(chǔ)的増強(qiáng)和補(bǔ)償
[0001]相關(guān)申請的交叉引用
[0002]本申請要求2014年I月7日提交的美國臨時申請序列號61/924，641的權(quán)益，所述申請的公開內(nèi)容以引用方式整體并入本文。
技術(shù)領(lǐng)域
[0003]本公開的方面涉及音頻信號處理，并且更具體地說，涉及信號增強(qiáng)和恢復(fù)。
【背景技術(shù)】
[0004]壓縮音頻信號是已經(jīng)歷由感知音頻編解碼器進(jìn)行的某種形式的數(shù)據(jù)壓縮的信號。感知音頻編解碼器通過丟棄音頻信號中被感知為可聽度較低或感知上不太重要的分量，來減少用于存儲、轉(zhuǎn)移或傳輸音頻信號的數(shù)據(jù)量。數(shù)據(jù)壓縮過程通常引入原始(未壓縮的)音頻信號與壓縮音頻信號之間的不希望的可聽差異。不同的感知音頻編解碼器可采用不同的策略來丟棄原始音頻信號的部分，但可聽差異的感知特性通常是類似的。

【發(fā)明內(nèi)容】

[0005]采樣器模塊可將音頻信號分成一系列順序樣本。信號質(zhì)量檢測器模塊可識別所述音頻信號的在所述音頻信號開端跨越多個順序樣本的一致磚墻頻率(consistent brickwall frequency)，并且確定與所述磚墻頻率成比例的信號處置指示。信號增強(qiáng)器模塊可順序地接收并分析所述音頻信號的一個或多個樣本分量，以識別各自順序樣本的所述一個或多個樣本分量中的所述音頻信號的丟失部分，并且根據(jù)所述信號質(zhì)量指示生成用于具有對應(yīng)識別的丟失部分的各自順序樣本的所述一個或多個樣本分量中每一個的對應(yīng)信號處置。
【附圖說明】
[0006]參閱以下附圖和描述可更好地理解所述系統(tǒng)。附圖中的部件不一定按比例繪制，而是強(qiáng)調(diào)示出本發(fā)明的原理。此外，在附圖中，相同參考數(shù)字在所有不同視圖中指示對應(yīng)的部分。
[0007]圖1為包括與感知音頻編碼器和解碼器結(jié)合使用的示例性信號增強(qiáng)器系統(tǒng)的方框圖。
[0008]圖2為包括整合到信號增強(qiáng)器系統(tǒng)中的感知音頻解碼器的實(shí)例的方框圖。
[0009]圖3為信號增強(qiáng)器系統(tǒng)的實(shí)例的方框圖。
[0010]圖4為對立體聲信號的中側(cè)部分操作的信號增強(qiáng)器系統(tǒng)的實(shí)例的方框圖。
[0011]圖5為對音頻信號的單獨(dú)空間片段操作的分離式信號增強(qiáng)器模塊的實(shí)例的方框圖。
[0012]圖6描繪在以塊為基礎(chǔ)的分解的表示的情況下的示例性脈沖響應(yīng)的分量。
[0013]圖7為圖3中所示的混響填充模塊的示例性方框圖。
[0014]圖8為在給定頻率下的樣本的輸入混響系列的樣本分量的示例性估計(jì)。
[0015]圖9a為信號質(zhì)量分析器、處置水平調(diào)整器和顯示模塊的示例性方框圖。
[0016]圖9b為自動重新調(diào)整每個流或每個音軌的處置增益的壓縮檢測和處置算法的過程的示例性方框圖。
[0017]圖10為具有帶寬增強(qiáng)信號處置的輸出信號的示例性顯示。
[0018]圖1la和圖1lb描繪示例性頻譜圖(頻域)以示出由信號增強(qiáng)器系統(tǒng)進(jìn)行的壓縮。
[0019]圖12a和圖12b描繪示例性頻譜圖以示出由信號增強(qiáng)器系統(tǒng)進(jìn)行的瞬時增強(qiáng)。
[0020]圖13為示例性計(jì)算系統(tǒng)。
【具體實(shí)施方式】
[0021]按照要求，本文公開了本發(fā)明的詳細(xì)實(shí)施方案;然而，應(yīng)當(dāng)理解的是，所公開的實(shí)施方案僅僅是可以各種和替代形式體現(xiàn)的本發(fā)明的示例。附圖不一定按比例繪制；一些特征可能被夸大或最小化以展示特定部件的細(xì)節(jié)。因此，本文中公開的特定結(jié)構(gòu)細(xì)節(jié)和功能細(xì)節(jié)不應(yīng)被解釋為是限制性的，而是僅僅作為用于教導(dǎo)本領(lǐng)域技術(shù)人員以不同方式使用本發(fā)明的代表性基礎(chǔ)。
[0022]壓縮音頻信號是含有音頻內(nèi)容的已經(jīng)歷如由感知音頻編解碼器進(jìn)行的某種形式的數(shù)據(jù)壓縮的信號。常見類型的感知音頻編解碼器包括MP3、AAC、杜比數(shù)字(DolbyDigital)和DTS。這些感知音頻編解碼器通過丟棄音頻信號的顯著部分來減少音頻信號的大小。感知音頻編解碼器可用來減少存儲音頻信號所需要的空間(存儲器)量，或減少傳輸或轉(zhuǎn)移音頻信號所需要的帶寬量。以90%或更多來壓縮音頻信號并不罕見。感知音頻編解碼器可使用人類聽覺系統(tǒng)如何感知聲音的模型。以此方式，感知音頻編解碼器可丟棄音頻信號中被視為聽不見或與收聽者感知聲音最不相關(guān)的那些部分。因此，感知音頻編解碼器能夠減少音頻信號的大小，同時對于剩余信號仍維持相對好的感知音頻質(zhì)量。一般來說，壓縮音頻信號的感知質(zhì)量可取決于壓縮信號的比特率。較低的比特率可指示原始音頻信號的較大部分被丟棄，并且因此，一般來說，壓縮音頻信號的感知質(zhì)量可能較差。
[0023]存在許多類型的感知音頻編解碼器，并且每種類型可在確定原始音頻信號的哪些部分將在壓縮過程中被丟棄中使用一組不同的準(zhǔn)則。感知音頻編解碼器可包括編碼過程和解碼過程。編碼器接收原始音頻信號，并且可確定信號的哪些部分將被丟棄。編碼器隨后可將剩余信號置于適合于壓縮存儲和/或傳輸?shù)母袷街?。解碼器可接收壓縮音頻信號、解碼所述壓縮音頻信號，并且隨后可將解碼后音頻信號轉(zhuǎn)換成適合于音頻回放的格式。在大多數(shù)感知音頻編解碼器中，可包括感知模型的使用的解碼過程可確定壓縮音頻信號的所得質(zhì)量。在這些情況下，解碼器可充當(dāng)將信號自壓縮格式(通常某種形式的頻域表示)轉(zhuǎn)換成適合于音頻回放的格式的格式轉(zhuǎn)換器。
[0024]信號增強(qiáng)器系統(tǒng)可修改已由感知音頻編解碼器處理的壓縮音頻信號，以使得已在壓縮過程中丟棄或更改的信號分量和特性被感知以便在處理后輸出信號中恢復(fù)。如本文所使用，術(shù)語音頻信號可指代表示音頻內(nèi)容的電信號，或可聽聲音，除非另有描述。
[0025]當(dāng)使用感知音頻編解碼器來壓縮音頻信號時，不可能檢索丟棄的信號分量。然而，信號增強(qiáng)器系統(tǒng)可分析壓縮音頻信號中的剩余信號分量，并且生成新信號分量以感知上替換丟棄的分量。
[0026]在一些情況下，壓縮音頻信號源的質(zhì)量可由音頻源明確地指定，或可基于音頻源推斷。在一個實(shí)例中，衛(wèi)星無線電內(nèi)容可已知以特定質(zhì)量和比率編碼。在另一個示例性中，如用于音頻源的當(dāng)前比特率和編解碼器信息的元數(shù)據(jù)可通過總線消息或通過正被解碼的音頻文件的標(biāo)頭信息來指定。在此類情況下，信號增強(qiáng)器可被配置來基于由音頻源指定的質(zhì)量來施加處置水平。在其他情況下，源質(zhì)量可為未知的或不容易預(yù)測的。此類音頻源的一些實(shí)例可包括如iPod的音樂播放器、USB驅(qū)動器、通過藍(lán)牙連接接收的音頻、通過輔助連接接收的音頻，或來自未知音樂流應(yīng)用的音頻流。在此類情況下，信號增強(qiáng)器可被配置來基于輸入音頻自身的內(nèi)容的特性來自動檢測適合于音頻源的處置水平。
[0027]自動檢測可被配置來基于輸入信號開端的測量質(zhì)量施加成比例量的處置。例如，如果檢測到磚墻斜坡(例如，高于12kHz的頻率的硬截止)，則音頻源可被認(rèn)為是壓縮的并且可施加處置。如果未檢測到磚墻斜坡，則音頻源可被認(rèn)為是未壓縮的，并且處置可被視為不必要的且未被施加。將要施加的特定量的處置可基于磚墻的頻率截止點(diǎn)。例如，較低截止頻率可指示需要較大量的處置的相對較多壓縮的音頻流，而較高截止頻率可指示需要較少量的處置的相對較少壓縮的音頻流。在一些情況下，如果截止頻率低于最小閾值，則信號增強(qiáng)器可確定音頻源質(zhì)量過低而不能被壓縮，并且可不施加處置。作為另一種可能性，如果截止頻率高于最大閾值，則信號增強(qiáng)器可確定音頻源具有充分的質(zhì)量而不需要處置。
[0028]如果音頻軌道缺乏充分的高頻率內(nèi)容，則信號增強(qiáng)器可確定沒有處置應(yīng)被施加，盡管音頻的低音頻質(zhì)量或低比特率。在一個實(shí)例中，鋼琴的音頻軌道可能缺乏高頻率內(nèi)容，以使得磚墻可能并不是可容易檢測的。或者，如果軌道在記錄水平中過低，則信號增強(qiáng)器也可確定將不施加處置。
[0029]當(dāng)初始化時，或當(dāng)檢測到間隙(例如，靜音或軌道變化)時，信號增強(qiáng)器可重置鎖存器并且將檢測的處置水平設(shè)定至無。當(dāng)音頻初始化或重新開始時，自動檢測機(jī)構(gòu)可尋找壓縮(例如，通過執(zhí)行磚墻截止頻率檢測)ο當(dāng)軌道被識別為壓縮的時，處置水平可被設(shè)定(即鎖存)，以使得處置水平可保持在窄范圍內(nèi)直到下一個軌道。此鎖存因此可防止脈動、可變聲音，或具有變化處置率的其他可聽偽像。
[0030]另外或替代地，在間隙的檢測之后，計(jì)時器可開始計(jì)數(shù)。如果在預(yù)定時間段或預(yù)定數(shù)目的樣本(例如，五秒)內(nèi)未檢測到壓縮，則信號增強(qiáng)器可選擇不施加處置直到檢測到下一個間隙。這可避免在軌道中間歸因于高頻率的突然出現(xiàn)和后續(xù)處置水平調(diào)整的意外頻譜變化。
[0031]圖1為包括信號增強(qiáng)器系統(tǒng)110的實(shí)例的方框圖。信號增強(qiáng)器系統(tǒng)110可能在頻域或時域中操作。信號增強(qiáng)器系統(tǒng)110可包括采樣器模塊112。采樣器模塊112可實(shí)時接收輸入信號(X)，并且將輸入信號(X)分成樣本。在頻域中的操作期間，采樣器模塊112可收集順序時域樣本，適合的加窗函數(shù)(如root-Hann窗)被施加，并且如使用FFT(快速傅里葉變換)將加窗樣本轉(zhuǎn)換成頻域中的順序頻格(bin)。在一個實(shí)例中，采樣器模塊112可利用1024-點(diǎn)FFT和44.1kHz采樣率。類似地，作為信號增強(qiáng)器系統(tǒng)110中的最后步驟，增強(qiáng)的頻域頻格可由采樣器模塊112使用逆FFT(快速傅立葉逆變換)來轉(zhuǎn)換成時域，并且施加適合的互補(bǔ)加窗(諸如root-Hann窗)，以產(chǎn)生增強(qiáng)時域樣本塊。預(yù)定量(如至少50% )的重疊可用以在將時域樣本轉(zhuǎn)換成頻域之前添加時域樣本和對時域樣本加窗。在信號增強(qiáng)器系統(tǒng)110的輸出線105上的輸出處，當(dāng)在從頻率到時域的轉(zhuǎn)換之后構(gòu)造增強(qiáng)時域樣本時，可使用類似的預(yù)定重疊(如至少50%)。替代地，信號增強(qiáng)器系統(tǒng)110可使用時域樣本的順序塊在時域中操作，并且可從采樣器模塊112消除轉(zhuǎn)換器。為簡化討論和附圖，省略采樣器模塊112以及時間-到-頻率和頻率-到-時間轉(zhuǎn)換的進(jìn)一步討論和圖解。從而，如本文所描述，順序樣本或樣本序列可能可互換地指代時域樣本的時序序列，或?qū)?yīng)于已由采樣器模塊112采樣的輸入信號(X)的時序接收的頻域頻格的時序序列。
[0032]在圖1中，信號增強(qiáng)器110被示出為與感知音頻編碼器101和感知音頻解碼器103結(jié)合使用。可在音頻信號輸入線100上向感知音頻編碼器101提供原始音頻信號(Z)。感知音頻編碼器101可丟棄音頻信號分量，以在壓縮比特流線102上產(chǎn)生壓縮音頻比特流(Q)。感知音頻解碼器103可解碼壓縮音頻比特流(Q)，以在輸入信號線104(在本文中有時被稱為輸入信號(X)104)上產(chǎn)生輸入信號(X)。輸入信號(X)可為呈適合于音頻回放格式的音頻信號。信號增強(qiáng)器系統(tǒng)110可操作來將輸入信號(X)分成樣本序列，以便增強(qiáng)輸入信號(X)來在輸出信號線105上產(chǎn)生輸出信號(Y)。側(cè)鏈數(shù)據(jù)可含有與輸入信號(X)的處理相關(guān)的信息，所述信息如以下各項(xiàng)的指示:所使用的音頻編解碼器的類型、編解碼器制造商、比特率、立體聲對比聯(lián)合立體聲編碼、采樣率、唯一輸入通道的數(shù)目、編碼塊大小、和歌曲/軌道識別符。在其他實(shí)例中，可包括與音頻信號(X)或編碼/解碼過程相關(guān)的任何其他信息作為側(cè)鏈數(shù)據(jù)的一部分。側(cè)鏈數(shù)據(jù)可在側(cè)鏈數(shù)據(jù)線106上從感知音頻解碼器103提供到信號增強(qiáng)器系統(tǒng)110。替代地或另外，也可包括側(cè)鏈數(shù)據(jù)作為輸入信號(X)的一部分。
[0033]圖2為與感知音頻編碼器和解碼器結(jié)合使用的信號增強(qiáng)器系統(tǒng)110的實(shí)例的方框圖。在這種情況下，感知音頻解碼器103可被合并作為信號增強(qiáng)器系統(tǒng)110的一部分。因此，信號增強(qiáng)器系統(tǒng)110可直接對在壓縮比特流線102上接收的壓縮音頻比特流(Q)操作。替代地，在其他實(shí)例中，信號增強(qiáng)器系統(tǒng)110可被包括在感知音頻解碼器103中。在這種配置中，信號增強(qiáng)器系統(tǒng)110可以利用壓縮音頻比特流(Q)102的細(xì)節(jié)。
[0034]圖3為信號增強(qiáng)器系統(tǒng)110的實(shí)例的方框圖。在圖3中，信號增強(qiáng)器系統(tǒng)110包括信號處置模塊300，所述信號處置模塊可在輸入信號線104上接收輸入信號(X)。信號處置模塊300可在對應(yīng)信號處置線310上產(chǎn)生一些單獨(dú)和唯一的信號處置(311、3了2、3了3、3了4、3丁5、ST6和ST7)。盡管示出七個信號處置，但是更少或更多數(shù)目(η)的信號處置在其他實(shí)例中是可能的。信號處置(STn)中每一個的相對能級可在于第一求和塊321處被加在一起以產(chǎn)生總信號處置(STT)323之前，通過處置增益(gl、g2、g3、g4、g5、g6和g7)315單獨(dú)調(diào)整。總信號處置(STT)323的級可在于第二求和塊322處被加到輸入信號(X)104之前，通過總處置增益(gT)320 調(diào)整。
[0035]信號處置模塊300可包括一個或多個處置模塊(301、302、303、304、305、306和307)，所述一個或多個處置模塊對輸入信號(X)的順序樣本的單獨(dú)樣本分量操作，以針對各自分量在逐樣本的基礎(chǔ)上順序地產(chǎn)生信號處置(310)。順序樣本的單獨(dú)樣本分量可涉及音頻信號的不同特性。替代地或另外，信號處置模塊300可包括附加的或更少的處置模塊300。所示的模塊可為獨(dú)立的，或可為以各種組合中的任一種形成來創(chuàng)建模塊的子模塊。
[0036]圖4為對輸入信號(X)的如由中側(cè)分量模塊400提取的中側(cè)分量操作的信號增強(qiáng)器系統(tǒng)110的實(shí)例。術(shù)語“中側(cè)”指代立體聲音頻信號中的音頻信息，在所述立體聲音頻信號中，左立體聲通道和右立體聲通道共用的音頻信息被認(rèn)為是音頻信息的“中”信號分量，并且音頻信息的“側(cè)”信號分量是在左立體聲通道與右立體聲通道之間相異的音頻信息。感知音頻編解碼器可對音頻信號的中側(cè)分量操作，以便改善感知音頻編解碼器的性能。在這種情況下，編碼器可丟棄更多的側(cè)信號分量同時保持更多的中信號分量。因而，在這種情況下，如果信號增強(qiáng)器系統(tǒng)110對立體聲輸入信號(X)的中側(cè)信號分量，而不是直接對立體聲信號的左通道和右通道直接操作，則可改善信號增強(qiáng)器系統(tǒng)110的操作的最優(yōu)化。
[0037]在圖4中，立體聲到中側(cè)模塊400可將立體聲輸入信號X轉(zhuǎn)換成中側(cè)信號配置Xms，所述中側(cè)信號配置繼而可被提供到信號增強(qiáng)器系統(tǒng)110以用于在中側(cè)信號線401上處理。信號增強(qiáng)器系統(tǒng)110可對中側(cè)信號Xms進(jìn)行操作以產(chǎn)生增強(qiáng)中側(cè)信號(Yms)。增強(qiáng)中側(cè)信號(Yms)可在增強(qiáng)中側(cè)信號線402上被供應(yīng)到中側(cè)到立體聲模塊403。中側(cè)到立體聲模塊403可將增強(qiáng)中側(cè)信號(Yms)轉(zhuǎn)換成在輸出線105上供應(yīng)的立體聲(左通道和右通道)輸出信號(Y)。
[0038]圖5為在空間片段流線501上對一組“η”個空間片段流(XSS1、XSS2、XSS3、…、XSSn)操作的一組“η”個信號增強(qiáng)器系統(tǒng)110的實(shí)例，所述空間片段流線可源自空間片段分解模塊500?？臻g片段分解模塊500可在輸入信號線104上接收立體聲或多通道音頻輸入信號(X)，并且產(chǎn)生一組空間片段流。空間片段流可含有空間濾波器組的輸出，所述空間濾波器組基于音頻信號源在感知的立體聲或多通道聲場內(nèi)的空間位置來分解輸入信號。一種用于將輸入信號分解成空間片段以產(chǎn)生空間片段流501的可能方法描述于標(biāo)題為“SYSTEM FORSPATIAL EXTRACT1N OF AUD1 SIGNALS”的美國專利申請?zhí)?2/897，709中，所述美國專利申請以引用方式整體并入本文。
[0039]在圖5中，“η”個信號增強(qiáng)器110中每一個在增強(qiáng)輸出流線502上產(chǎn)生增強(qiáng)輸出流(YSSl、YSS2、YSS3、‘"、YSSn)Z‘n”個輸出流在求和模塊503處組合以在輸出線105上產(chǎn)生輸出信號(Y)。當(dāng)對單獨(dú)空間片段流操作分離式信號增強(qiáng)器系統(tǒng)110時，可獲得系統(tǒng)的改善性能，因?yàn)槊總€信號增強(qiáng)器系統(tǒng)110可對音頻輸出信號104的較多隔離樣本分量操作，并且因而可更好地能夠?qū)С鲇糜诿總€空間片段流(XSSn)的合適信號處置(STl、ST2、ST3、ST4、ST5、ST6和ST7)?？舍槍Πㄔ诟髯钥臻g片段流(XSSn)中每一個的樣本中的不同樣本分量獨(dú)立地導(dǎo)出任何數(shù)目的不同信號處置(31'1、3了2、3了3、3了4、3了5、3了6和317)。
[0040]在圖3中，信號處置模塊300可包括一個或多個處置模塊(301、302、303、304、305、306和307)以針對音頻信號或從音頻信號產(chǎn)生的空間片段流的各自順序樣本的單獨(dú)樣本分量導(dǎo)出信號處置(31'1、5了2、5了3、5了4、5了5、5了6和5了7)。處置模塊(301、302、303、304、305、306和307)中每一個可針對與音頻信號或空間流相關(guān)的不同特性導(dǎo)出信號處置(ST1、ST2、ST3、ST4、ST5、ST6和ST7)。示例性音頻信號特性包括帶寬、諧波、瞬變、擴(kuò)張、混響、屏蔽和諧波相位對齊。在其他實(shí)例中，可針對與音頻信號相關(guān)的附加或較少特性導(dǎo)出信號處置。可針對音頻信號中對應(yīng)于各自處置模塊的特性的缺失部分導(dǎo)出信號處置。因此，信號處置可有效地供應(yīng)音頻信號的被識別為在樣本系列中的單獨(dú)樣本分量中缺失的各種不同特性的替換部分。因而，系列中的各自特性的丟失部分被識別的樣本分量中一些可施加信號處置，而序列中的各自特性的缺失部分未被識別的其他樣本分量可不施加信號處置。
[0041]關(guān)于帶寬特性為音頻信號的缺失部分，一些感知音頻編解碼器(包括以相對低的比特率操作的感知音頻編解碼器)在于所述感知音頻編解碼器可通過丟棄高于某個預(yù)定閾值的信號分量來限制壓縮信號的帶寬。例如，感知音頻編解碼器可將高于預(yù)定頻率(如高于12kHz)的所有頻率分量視為是感知上不太重要的并且因而丟棄所述頻率分量。帶寬擴(kuò)展模塊301可對輸入信號(X)操作以生成高于此預(yù)定截止頻率(Fx)的信號分量或信號處置(STl)。帶寬擴(kuò)展模塊301可分析輸入信號(X)以確定輸入信號的截止頻率(Fx)(如果存在)。截止頻率(Fx)的知識可用以引導(dǎo)信號處置流(STl)的生成，所述信號處置流具有高于預(yù)定截止頻率(Fx)的新信號分量，以補(bǔ)償音頻信號的對應(yīng)樣本分量中的此特性的缺乏。
[0042]替代地或另外，在側(cè)鏈信息106可得自感知音頻解碼器103的情況下，如圖1中所示，截止頻率(Fx)可被提供到帶寬擴(kuò)展模塊301。在感知音頻解碼器103和信號增強(qiáng)器系統(tǒng)110整合的其他情況下，如在圖2的實(shí)例中，截止頻率(Fx)可由感知音頻解碼器103直接提供到帶寬擴(kuò)展模塊301
[0043]關(guān)于諧波特性為音頻信號的缺失或丟失部分，一些感知音頻編解碼器(包括以相對低的比特率操作的感知音頻編解碼器)可在信號內(nèi)的給定時間點(diǎn)丟棄壓縮信號內(nèi)的某些“中間諧波”。例如，在某個時間點(diǎn)，感知音頻編解碼器可保持特定聲源的基本頻率分量以及若干低階諧波。感知音頻編解碼器也可保留信號的最高階諧波中的一些或全部，同時丟棄聲源的中間諧波中的一個或多個。帶內(nèi)諧波填充模塊302可分析輸入信號(X)104，以搜索感知音頻編解碼器已丟棄音頻信號的一個或多個中間諧波特性的事件。帶內(nèi)諧波填充模塊302可操作以響應(yīng)于在音頻信號的樣本分量中缺失的這個特性而生成具有用以施加于音頻信號的新中間諧波的信號處置流(ST2)。
[0044]關(guān)于瞬變特性為音頻信號的缺失部分，一些感知音頻編解碼器(包括以相對低的比特率操作的感知音頻編解碼器)可引起瞬變信號的“拖影”。這種類型的編碼偽像可被描述為“前回聲”，并且當(dāng)瞬變信號具有尖銳起音并且在瞬變事件的時間處相對于其他信號分量相對響亮?xí)r，所述類型的編碼偽像最容易被聽到。前回聲傾向于引起瞬變信號分量的感知鈍化。瞬變增強(qiáng)模塊303可試圖將此特性識別為在音頻信號的分量樣本中缺失，并且導(dǎo)出信號處置以恢復(fù)瞬變信號分量的感知尖銳起音。瞬變增強(qiáng)模塊303可分析輸入信號(X)，并且可識別瞬變事件和瞬變信號分量以識別缺失特性。瞬變增強(qiáng)模塊303可操作來生成信號處置流(ST3)，所述信號處置流含有新瞬變信號分量以用于施加于音頻信號，以便增強(qiáng)現(xiàn)有瞬變信號分量的初動(onset)的感知。
[0045]用于檢測音頻信號中的瞬變的示例性方法可包括以下活動。用于時域輸入信號樣本的當(dāng)前塊的FFT頻格的量級被計(jì)算并且存儲在歷史緩沖器中。在逐頻格基礎(chǔ)上將FFT頻格的當(dāng)前集合的量級與FFT頻格的過去集合的量級進(jìn)行比較，其中當(dāng)前集合和過去集合代表各自樣本系列中的一系列樣本分量。FFT頻格的過去集合的量級先前存儲在歷史緩沖器中，并且被檢索以用于這個比較。當(dāng)前FFT頻格的量級超過過去FFT頻格的量級預(yù)定閾值(如量級閾值)的頻格的數(shù)目被計(jì)數(shù)。如果計(jì)數(shù)超過確定的計(jì)數(shù)閾值，則確定時域樣本的當(dāng)前塊含有瞬變事件。預(yù)定值(如20dB)可適合于用于檢測瞬變的量級閾值。過去FFT頻格可取自當(dāng)前樣本塊之后的一個或兩個塊。也就是說，歷史緩沖器可代表樣本的樣本分量的順序處理中的一個或兩個處理塊的延遲。
[0046]關(guān)于擴(kuò)張?zhí)匦詾橐纛l信號的缺失或丟失部分，一些感知音頻編解碼器(包括以相對低的比特率操作的感知音頻編解碼器)可引起在音頻信號作為可聽聲音產(chǎn)生時由收聽者感知的立體聲聲場的感知收縮。也就是說，被感知為定位到原始未壓縮音頻信號中的極左或極右的聲音可在壓縮過程期間相對于其他聲音衰減。因此，所得音頻信號可被感知為更加“單聲道的”并且較少“立體聲的”。聲場增強(qiáng)模塊304可識別音頻信號的與一系列樣本分量中的這個特性相關(guān)的缺失或丟失部分，并且放大被感知為定位到輸入信號(X)中的極左或極右的信號分量作為生成的信號處置。例如，聲場增強(qiáng)模塊304可操作以提取極左或極右的信號分量，并且生成含有這些信號分量的放大版本的信號處置流(ST4)。一種用于提取極左或極右的信號分量的可能方法描述于標(biāo)題為“SYSTEM FOR SPATIAL EXTRACT1N OFAUD1 SIGNALS”的美國專利申請?zhí)?2/897，709中，所述美國專利申請以引用方式整體并入本文。
[0047]關(guān)于混響特性為音頻信號的缺失或丟失部分，一些感知音頻編解碼器(包括以相對低的比特率操作的感知音頻編解碼器)在于所述感知音頻編解碼器可引起音頻信號中的“周圍環(huán)境”或“混響”特性的感知減少?；祉懱匦缘倪@個減少可導(dǎo)致整體聲音的感知“鈍化”，以及歸因于音頻信號的丟失部分的聲音細(xì)節(jié)的感知損失。混響減少也可減少整體聲音場的感知大小和寬度?；祉懱畛淠K305可操作以將輸入信號(X)分解成干信號分量和混響信號分量。混響填充模塊305隨后可操作以識別對應(yīng)樣本分量中的音頻信號的缺失部分，增加樣本分量中的混響的感知級，并且生成信號處置流(ST5)，所述信號處置流可含有新混響信號分量，并且可含有放大混響信號分量以用于僅施加于音頻信號的部分被確定為缺失的樣本序列的那些樣本分量。
[0048]—種用于將輸入信號(X)分解成干信號分量和混響信號分量的可能方法描述于標(biāo)題為 “SYSTEM FOR SELECTIVELY EXTRACTING COMPONENTS OF AN AUD1 INPUT SIGNAL” 的美國專利號8，180,067和標(biāo)題為“SYSTEM FOR EXTRACTING AND CHANGING THEREVERBERANT CONTENT OF AN AUD1 INPUT SIGNAL” 的美國專利號8,036,767中，所述兩個美國專利以引用方式整體并入本文。
[0049]關(guān)于屏蔽信號特性為音頻信號的缺失或損失部分，一些感知音頻編解碼器(包括以相對低的比特率操作的感知音頻編解碼器)可引起信號中的清晰度和低級細(xì)節(jié)的感知減少。這可能由丟棄根據(jù)例如感知模型被認(rèn)為對于大多數(shù)收聽者來說聽不見的信號分量的感知音頻編解碼器引起。通常，如果存在可屏蔽第一信號分量的其他主信號分量，則感知模型將會將某些第一信號分量識別為聽不見的。也就是說，歸因于人類聽覺系統(tǒng)的屏蔽性能，主信號分量可(屏蔽)致使第一信號分量聽不見。然而，每個收聽者的屏蔽性能稍有不同，并且感知音頻編解碼器中的感知模型可能僅近似一個收聽者的屏蔽性能。因此，感知音頻編解碼器可能丟棄對于一些收聽者來說可聽見的某些信號分量。
[0050]屏蔽信號填充模塊306可操作以識別音頻信號的對應(yīng)樣本分量的缺失部分，并且放大低級信號分量以使得所述低級信號分量正好處于被屏蔽的閾值處。屏蔽信號填充模塊306可接收輸入信號(X)，并且應(yīng)用感知模型以確定用于每個頻率的“同時屏蔽閾值”。同時屏蔽閾值指示感知模型確定某個頻率下的信號分量被其他頻率下的信號分量屏蔽所處的級。例如，如果存在1000Hz下的充分響的信號分量，則I 10Hz下的信號分量可為聽不見的。在這個實(shí)例中，同時屏蔽閾值指示其他頻率(如1100Hz)下的信號分量將被1000Hz下的信號分量屏蔽所處的級。因此，如果1100Hz下的信號分量的級降低到同時屏蔽閾值以下，則感知模型確定這個信號分量將被屏蔽(聽不見的)。
[0051 ]繼續(xù)這個實(shí)例，如果屏蔽信號填充模塊306確定I 10Hz下的信號分量降低到同時屏蔽閾值以下，并且由此識別音頻信號的對應(yīng)樣本分量的丟失部分，則屏蔽信號填充模塊306可生成信號處置流(ST6)，所述信號處置流(ST6)可含有1100Hz下的信號分量的放大版本，以使得1100Hz下的信號分量達(dá)到同時屏蔽閾值。類似地，屏蔽信號填充模塊306可針對所有頻率下的信號分量執(zhí)行這個操作以識別對應(yīng)樣本分量的缺失部分，以使得所述屏蔽信號填充模塊可生成信號處置流(ST6)，所述信號處置流(ST6)含有各種頻率下的放大信號分量，所以所有頻率下的信號分量可達(dá)到同時屏蔽閾值。
[0052]用于確定同時屏蔽閾值的感知模型的實(shí)例描述于標(biāo)題為“SYSTEMFORSELECTIVELY EXTRACTING COMPONENTS OF AN AUD1 INPUT SIGNAL” 的美國專利號8，180，067和標(biāo)題為 “SYSTEM FOR EXTRACTING AND CHANGING THE REVERBERANT CONTENT OF ANAUD1 INPUT SIGNAL”的美國專利號8,036,767中，所述兩個美國專利以引用方式整體并入本文。通常，感知模型可在分量樣本隨時間推移的生成期間(如在一系列樣本的分量樣本的多個快照上)基于以時間為基礎(chǔ)的聽覺屏蔽估計(jì)和以頻率為基礎(chǔ)的聽覺屏蔽估計(jì)中的至少一個執(zhí)行平滑。
[0053]諧波豐富的信號的基本分量和諧波分量的相位可傾向于隨時間推移彼此追蹤。也就是說，諧波豐富的信號的基本分量和諧波分量可傾向于以某種方式對齊。關(guān)于諧波相位對齊特性為音頻信號的缺失或丟失部分，一些感知音頻編解碼器(包括以相對低的比特率操作的感知音頻編解碼器)可引起給定聲源的諧波相位丟失其關(guān)于相位的對齊。作為樣本分量的缺失部分的這個相位對齊損失可至少發(fā)生在信號的較高階諧波上。這個相位對齊損失可由收聽者以不同方式感知。相位對齊損失的一個常見結(jié)果是通常在較高頻率中可聽見的“嘩嘩”聲音。諧波相位對齊模塊307可操作以迫使諧波相關(guān)的信號分量隨時間推移而相位對齊。諧波相位對齊模塊307可分析輸入信號(X)，并且尋找音調(diào)信號分量(與瞬變或類似噪聲的信號分量相反)并確定所述音調(diào)分量是否是諧波相關(guān)的。另外，諧波相位對齊模塊307可確定任何諧波相關(guān)的音調(diào)分量隨時間推移是否是對齊的。在對應(yīng)樣本分量中的特性被識別為音頻信號的缺失部分，即諧波相關(guān)的音調(diào)分量的相位對齊的情況下，可調(diào)整未對齊的任何諧波的相位。諧波相位對齊模塊307可生成信號處置流(ST7)，所述信號處置流(ST7)可含有這些未對齊音調(diào)分量的相位對齊版本。替代地或另外，諧波相位對齊模塊307可提供音調(diào)分量的一些其他形式的對齊。
[0054]如果輸入信號(X)104是立體聲或多通道的，則所述輸入信號(X)104可在由信號增強(qiáng)器110處理之前被分解成空間片段501，如參考圖5所描述。一種用于將信號分解成空間片段的系統(tǒng)和方法描述于標(biāo)題為“SYSTEM FOR SPATIAL EXTRACT1N OF AUD1 SIGNALS”的美國專利申請?zhí)?2/897,709中，所述美國專利申請以引用方式整體并入本文。將輸入信號分解成空間片段可允許將各種處置(301、302、303、304、304、305、306和307)更精確地施加于含于空間片段(乂351、乂552、乂553、‘"、乂5511)501中每一個中的信號分量。例如，如果瞬變信號位于給定空間片段內(nèi)，則可在那個空間片段中僅施加瞬變增強(qiáng)處置303，而不影響其他空間片段中的非瞬變信號分量。
[0055]—旦適當(dāng)處置已施加于空間片段中每一個，來自空間片段中每一個的增強(qiáng)輸出流(YSSl、YSS2、YSS3、‘"、YSSn)502可在求和模塊503處組合以在輸出線105上產(chǎn)生復(fù)合輸出信號⑴。
[0056]隨著輸入信號(X)的內(nèi)容改變，施加于給定空間片段中的信號分量的各種處置可隨時間推移而變化。使用以上實(shí)例，在已經(jīng)在那個空間片段中檢測到瞬變信號分量的時間期間，瞬變增強(qiáng)處置303可僅施加于給定空間片段中的樣本分量中的一些。
[0057]如音樂或語音的音頻信號通常含有一些量的混響。此混響可歸因于記錄音頻信號的房間(例如，音樂廳)，或所述混響可被電子地添加?；祉懺幢环Q為混響系統(tǒng)?；祉懱匦杂苫祉懴到y(tǒng)的脈沖響應(yīng)確定?；祉懴到y(tǒng)的脈沖響應(yīng)可被分成一組塊。脈沖響應(yīng)估計(jì)器910對輸入信號操作，以產(chǎn)生脈沖響應(yīng)的頻域表示的感知相關(guān)估計(jì)。通常，脈沖響應(yīng)估計(jì)器可對輸入信號操作，以產(chǎn)生脈沖響應(yīng)的以塊為基礎(chǔ)的估計(jì)。脈沖響應(yīng)的以塊為基礎(chǔ)的估計(jì)由對應(yīng)于脈沖響應(yīng)的頻域估計(jì)的多個塊估計(jì)組成。
[0058]圖6是脈沖響應(yīng)的實(shí)例。第一垂直線表示直接聲音分量602，而剩余線表示反射。每根線的高度指示其振幅，并且其在時間軸(t)上的位置指示其到達(dá)聲音測量裝置(如麥克風(fēng))的時間。隨著時間的過去，反射數(shù)目增加到不再可能識別單獨(dú)反射的點(diǎn)。最終，反射演化成擴(kuò)散指數(shù)衰減系統(tǒng)。這通常被稱為脈沖響應(yīng)的混響尾部604。
[0059]所謂的早期反射606在直接聲音分量602之后不久到達(dá)，并且具有與混響尾部不同的感知效果。這些早期反射提供關(guān)于聲學(xué)空間大小和音頻信號源與麥克風(fēng)之間的距離的感知線索。早期反射606也是重要的，因?yàn)樗鲈缙诜瓷淇上蚵曇籼峁└纳频那逦群涂衫斫舛??；祉懳膊恳蔡峁╆P(guān)于聲學(xué)空間的感知線索。
[0060]脈沖響應(yīng)也可通過計(jì)算其傅里葉變換(或一些其他變換)在頻域中觀察，并且因此混響系統(tǒng)可完全在其頻域表示Η( ω )方面加以描述。變量ω指示頻率。脈沖響應(yīng)的傅里葉表示提供量級響應(yīng)和相位響應(yīng)。一般來說，量級響應(yīng)提供關(guān)于脈沖響應(yīng)中的不同頻率分量的相對級的信息，而相位響應(yīng)提供關(guān)于頻率分量的時間方面的信息。
[0061]混響填充模塊305可產(chǎn)生輸入信號中的混響能量的量級估計(jì)的頻域估計(jì)。從輸入信號中減去混響能量的這個量級估計(jì)，從而提供輸入信號的干音頻信號分量的量級估計(jì)?；祉戄斎胄盘柕南辔挥靡越圃几尚盘柕南辔?。如本文所使用，術(shù)語“干信號”、“干信號分量”、“干音頻信號分量”或“直接信號分量”指代幾乎不具有存在于音頻信號中的混響能量的音頻信號或音頻信號的一部分。因此，原始干信號可幾乎不具有混響能量，因?yàn)樗鲈几尚盘枎缀跬耆芍苯勇曇裘}沖602組成。如本文所使用，術(shù)語“混響能量”、“混響輸入信號”、“混響(reverberant)分量”、“混響(reverberant)信號分量”、“混響(reverberat1n)分量”、或“混響(reverberat1n)信號分量”指代音頻信號的早期反射和混響尾部。另外，關(guān)于音頻信號，如本文所使用，術(shù)語“分量” (“component”或“components”)指代一個或多個分量。
[0062]如果混響輸入信號的相位用以近似使用整個脈沖響應(yīng)作為整體的原始干信號的相位，則有可能嚴(yán)重的時域偽像在處理后信號中將是可聽見的。因此，混響填充模塊305可將整體脈沖響應(yīng)的估計(jì)分成塊608，并且可按以塊為基礎(chǔ)的方式執(zhí)行處理。塊608的預(yù)定長度可為足夠短的，使得人耳不感知?dú)w因于處理后輸出信號的相位中的誤差的任何時域偽像。
[0063]兩個因素組合來確定混響輸入信號在給定頻率下衰減的速率。第一因素是干(SP非混響的)聲源的衰減速率，并且第二因素是混響系統(tǒng)的衰減速率。盡管混響系統(tǒng)在給定頻率下的衰減速率隨時間推移為相對恒定的，但是干聲源的衰減速率連續(xù)變化。當(dāng)干聲源在給定頻率下停止時，對于輸入信號(X)為可能的最快衰減速率發(fā)生，并且信號衰減完全歸因于混響系統(tǒng)的衰減。在圖6的實(shí)例中，干聲源例如可在早期反射606的時間處停止?；祉懴到y(tǒng)在給定頻率下的衰減速率可直接由混響系統(tǒng)在該頻率下的脈沖響應(yīng)確定。因此，輸入信號(X)不應(yīng)以比由混響系統(tǒng)的脈沖響應(yīng)指定的速率更快的速率衰減。
[0064]圖7示出混響填充模塊305的更詳細(xì)視圖?；祉懱畛淠K305接收輸入信號(X)104，并且可提供信號處置310ST5作為輸出。脈沖響應(yīng)估計(jì)器710、混響漏失檢測器模塊711和混響漏失填充模塊712以及分解處理器模塊713可包括在混響填充模塊305中。在其他實(shí)例中，可描述更少或更大數(shù)目的模塊以實(shí)現(xiàn)所討論的功能性。
[0065]脈沖響應(yīng)估計(jì)器710可用以導(dǎo)出輸入信號(X)的混響系統(tǒng)的脈沖響應(yīng)的估計(jì)。一種用于估計(jì)輸入信號(X)的混響系統(tǒng)的脈沖響應(yīng)的可能方法描述于標(biāo)題為“SYSTEM FORSELECTIVELY EXTRACTING COMPONENTS OF AN AUD1 INPUT SIGNAL” 的美國專利號8，180，067和標(biāo)題為 “SYSTEM FOR EXTRACTING AND CHANGING THE REVERBERANT CONTENT OF ANAUD1 INPUT SIGNAL”的美國專利號8,036,767中，所述兩個美國專利以引用方式整體并入本文。
[0066]圖8為可由混響填充模塊305估計(jì)的音頻信號的混響分量的估計(jì)的實(shí)例。分解處理器模塊713可對輸入信號(X)操作以導(dǎo)出輸入混響分量802，所述輸入混響分量為輸入信號的先前討論的樣本分量中的一個。輸入混響分量802可由混響分量(混響)的估計(jì)或輸入信號的特性組成。一種用于導(dǎo)出輸入信號(X)的輸入混響分量802的可能方法描述于標(biāo)題為“SYSTEM FOR SELECTIVELY EXTRACTING COMPONENTS OF AN AUD1 INPUT SIGNAL”的美國專利號8，180,067和標(biāo)題為 “SYSTEM FOR EXTRACTING AND CHANGING THE REVERBERANTCONTENT OF AN AUD1 INPUT SIGNAL”的美國專利號8,036,767中，所述兩個美國專利以引用方式整體并入本文。預(yù)期衰減速率806可由分解處理器模塊713根據(jù)脈沖響應(yīng)針對每個順序樣本直接確定。在圖8中，輸入混響分量802在時間段(t)上被示出為給定頻率下的樣本分量的序列。可看出，輸入混響分量802在一些時間點(diǎn)處增長(增加)，并且在其他時間點(diǎn)處衰減。
[0067]參考圖7和圖8，混響漏失檢測器711可在不同時間點(diǎn)處將輸入混響分量802的衰減速率與預(yù)期衰減速率806進(jìn)行比較?；祉懧┦z測器711可在單獨(dú)樣本分量中將一個或多個混響漏失804識別為音頻信號的缺失或丟失部分，其中輸入混響分量802降低到預(yù)期衰減速率806以下?；祉懧┦畛淠K712可操作以產(chǎn)生混響填充處置，作為用于補(bǔ)償歸因于混響漏失804的丟失能量的信號處置。如圖8中所示，僅將信號處置施加于音頻信號的部分缺失的那些樣本分量。因此，當(dāng)樣本分量序列正被順序地處理時，信號處置可選擇性地僅施加于被識別為具有輸入信號的缺失或丟失部分的那些樣本分量。
[0068]圖9a為信號增強(qiáng)器模塊110的方框圖實(shí)例，所述信號增強(qiáng)器模塊與增強(qiáng)控制器模塊900聯(lián)接。增強(qiáng)控制器模塊900可包括處置級調(diào)整器模塊901、信號質(zhì)量分析器模塊902和顯示模塊906。在操作期間，信號處置模塊300可將處置要求指示符提供到信號質(zhì)量分析器902。處置要求指示符可提供來自各種處置模塊(301、302、303、304、305、306和307)的關(guān)于由于輸入信號(X)的識別缺失部分而所需要的信號處置量的相關(guān)信息。
[0069]作為可能的處置要求指示符的一個實(shí)例，帶寬擴(kuò)展模塊301(圖3)可提供輸入信號(X)的截止頻率(Fx)的估計(jì)。截止頻率可由于其在頻譜圖中的外觀而有時被稱為磚墻或磚墻頻率。磚墻可指示由壓縮引入的硬、急劇升降的截止頻率，通常在10-19kHz的區(qū)域中。在截止頻率點(diǎn)以上，在輸入信號(X)中大致上不存在信息。取決于所使用的壓縮類型，或所使用的壓縮差異，磚墻頻率可每個軌道變化，或甚至在一個軌道期間暫時消失。截止頻率的較低值可表明感知音頻編碼器器101更加激進(jìn)地作用于原始音頻信號(Z)100(圖1)，并且因此輸入信號(X)可缺失信號高頻部分的顯著部分，從而導(dǎo)致如果回放音頻信號，則由收聽者感知的較差質(zhì)量。替代地或另外，帶寬擴(kuò)展處置模塊301可提供信號的高于截止頻率的被感知音頻編碼器101丟棄的缺失能量與保持的信號能量的比率的估計(jì)。這個比率的較大值可表明原始音頻信號(Z)10的更顯著部分是缺失的(被丟棄)，并且因此如果回放音頻信號，則輸入信號(X)可具有由收聽者感知的較差質(zhì)量。
[0070]作為另一個實(shí)例，帶內(nèi)諧波填充模塊302(圖3)可提供中間(帶內(nèi))諧波已多頻繁地被丟棄和在音頻信號中缺失的指示。替代地或另外，帶內(nèi)諧波填充模塊302可提供丟棄諧波的能量估計(jì)。較大級的缺失(丟棄的)帶內(nèi)諧波能量可指示，如果回放音頻信號，則輸入信號(X)具有由收聽者感知的較差質(zhì)量。
[0071]作為另一個實(shí)例，混響填充模塊305可提供輸入信號(X)中的混響能量的測量，以及被感知音頻編碼器101丟棄的丟失混響能量的估計(jì)。較大級的缺失混響能量可指示，如果回放音頻信號，則輸入信號(X)具有由收聽者感知的較差質(zhì)量。
[0072]作為又一個實(shí)例，聲場擴(kuò)張模塊304(圖3)可提供被感知音頻編碼器101丟棄的缺失或丟失側(cè)(左減右)能量和中間(左加右)能量的量的估計(jì)。替代地或另外，聲場擴(kuò)張模塊304可提供極左或極右信號分量的能量相對于輸入信號(X)的總能量的測量。較低級的極左或極右信號能量可指示部分在輸入信號104中缺失，從而導(dǎo)致如果回放音頻信號，則由收聽者感知的較差質(zhì)量。
[0073]作為另一個實(shí)例，瞬變增強(qiáng)模塊303可通過指示瞬變在輸入信號(X)104中多頻繁地發(fā)生，來提供音頻信號的缺失部分的指示。作為另一個實(shí)例，屏蔽信號填充306模塊可檢查輸入信號(X)，并且提供降低到同時屏蔽閾值以下的信號分量被多頻繁地丟棄并且因此在音頻信號中缺失的指示。如果信號分量頻繁地缺失(丟棄的)，則這可指示如果回放音頻信號，則輸入信號(X)可具有由收聽者感知的較差質(zhì)量。
[0074]作為另一個實(shí)例，諧波相位對齊模塊307(圖3)可檢查輸入信號(X)，并且提供諧波相關(guān)信號分量多頻繁地未相位對齊的指示。替代地或另外，諧波相位對齊模塊307可提供未相位對齊的諧波分量的能量測量。未相位對齊的較高級的諧波分量可表明輸入信號(X)104的部分丟失，如果回放音頻信號，則所述輸入信號(X)104可具有由收聽者感知的較差質(zhì)量。
[0075]信號質(zhì)量分析器902可接收處置要求指示符，并且導(dǎo)出信號質(zhì)量指示符。替代地或另外，信號質(zhì)量分析器902可從元數(shù)據(jù)緩沖器905接收元數(shù)據(jù)。元數(shù)據(jù)可提供輸入信號(X)的感知質(zhì)量的直接指示。包括在元數(shù)據(jù)緩沖器905中的元數(shù)據(jù)可由感知音頻解碼器103、音頻信號、或一些其他源提供。替代地，元數(shù)據(jù)可被直接提供到信號質(zhì)量分析器902，并且可省略元數(shù)據(jù)緩沖器905。元數(shù)據(jù)可提供關(guān)于輸入信號的起源和特性的信息，包括但不限于截止頻率(Fx)、由感知音頻編碼器101使用的當(dāng)前處理塊的長度、輸入信號(X)的比特率和/或輸入?目號(X)的米樣率。
[0076]使用所接收的處置要求指示符和/或元數(shù)據(jù)中的一個或多個，信號質(zhì)量分析器902可導(dǎo)出輸入信號(X)的感知整體質(zhì)量的估計(jì)。替代地或另外，信號質(zhì)量分析器902可導(dǎo)出輸入信號的關(guān)于單獨(dú)信號處置的感知質(zhì)量的估計(jì)。
[0077]信號增強(qiáng)器模塊110施加于輸入信號(X)的信號處置310的相對能級可取決于輸入信號和/或輸入信號的樣本分量的相對質(zhì)量變化。例如，在輸入信號(X)的質(zhì)量相對良好的情況下，隨后可減少信號處置310的相對能級。類似地，在輸入信號(X)的質(zhì)量是相對差的情況下，隨后可相應(yīng)地增加信號處置310的相對能級。處置級調(diào)整器901可通過增加或減少處置增益(gl、g2、g3、g4、g5、g6和g7)315中的一個或多個來獨(dú)立地更改信號處置310的相對能級。替代地或另外，處置級調(diào)整器901可通過增加或減少總處置增益(gT)320來更改信號處置310的總相對能級。
[0078]處置級調(diào)整器901可從信號質(zhì)量分析器902接收一個或多個信號質(zhì)量指示符作為參數(shù)。處置級調(diào)整器901可使用可用的信號質(zhì)量指示符903中的一個或多個來獨(dú)立地確定用于單獨(dú)處置增益(81、82、83、84^5、86和87)315中每一個的適當(dāng)值，以及用于總處置增益(gT)320的適當(dāng)值。替代地或另外，信號質(zhì)量分析器1002可使用可提供輸入信號(X)的感知質(zhì)量的直接指示的元數(shù)據(jù)，來確定用于單獨(dú)處置增益(81、82、83^4、85、86和87)315中每一個的適當(dāng)值，以及用于總處置增益(gT)320的適當(dāng)值。以此方式，可自動調(diào)整各種信號處置310的級以匹配輸入信號(X)的要求。
[0079]在一些情況下，關(guān)于輸入信號(X)的元數(shù)據(jù)可以是不可用的。因此，信號質(zhì)量分析器902可利用自動重新調(diào)整每個流或每個軌道的處置級的壓縮檢測和處置算法。處置算法可包括間隙檢測器907、鎖存器908和自動計(jì)時器909。間隙檢測器907可被配置來識別軌道之間的無聲間隙，以及新軌道或音頻信號的初動。鎖存器908可被配置來在滿足某些條件時選擇性地鎖定單獨(dú)處置增益&1^2^3^4^5^6和87)315和總處置增益化1')320。當(dāng)軌道被識別為“壓縮的”時，各種信號處置310的級被設(shè)定(即鎖存)并保持在窄范圍內(nèi)直到下一個軌道。這防止抽運(yùn)或可變聲音。如果間隙檢測器907檢測到間隙(例如，靜音或軌道變化)，則信號質(zhì)量分析器902將重新設(shè)定鎖存器908，并且將各種信號處置310的級設(shè)定至無。當(dāng)音頻在輸入信號(X)內(nèi)重新開始時，壓縮檢測機(jī)構(gòu)將再次查找壓縮(磚墻)。
[0080]自動計(jì)時器909可被配置來在間隙檢測器907檢測到新流或軌道時重置，并且在音頻開始時倒計(jì)數(shù)預(yù)定量的時間，在所述預(yù)定量的時間期間可調(diào)整處置增益。因此，自動計(jì)時器909可被配置來避免音頻流或軌道中間的所施加處置的級的可聽見變化。在一些實(shí)例中，當(dāng)在預(yù)定量的時間(例如，5秒)內(nèi)未檢測到壓縮時，各種信號處置310的級可保持在無直到檢測到下一個間隙。這避免軌道中間歸因于高頻的突然出現(xiàn)的意外頻譜變化。
[0081]處置級調(diào)整器模塊901在確定單獨(dú)處置增益和總處置增益時也可以考慮其他參數(shù)。因而，例如，單獨(dú)處置增益中某些處置增益可由處置級調(diào)整器模塊901基于參數(shù)減少，并且單獨(dú)處置增益中某些其他處置增益可增加。此類參數(shù)可包括輸入信號的如所產(chǎn)生的音頻信號的種類的元數(shù)據(jù)，以使得例如對于搖滾樂種類，可增加瞬變處置級增益以強(qiáng)調(diào)鼓點(diǎn)，并且對于古典樂種類，可增加混響處置級增益以強(qiáng)調(diào)音樂廳效果。在另一個實(shí)例中，當(dāng)輸入信號是談話對音樂時，可調(diào)整處置增益。在其他實(shí)例中，可使用任何數(shù)目的處處置級增益和參數(shù)。由處處置級調(diào)整器模塊901進(jìn)行的增益調(diào)整也可以是以規(guī)則為基礎(chǔ)的，如當(dāng)存在高于預(yù)定閾值的混響特性的處置時，用于瞬變增強(qiáng)特性的增益可基于例如比率相應(yīng)地減少。用戶設(shè)置也可施加于處置級調(diào)整器模塊901，以實(shí)現(xiàn)在某些操作條件或模式下選擇性地施加的處置增益的量。
[0082]圖9b為自動重新調(diào)整每流或每軌道處置增益量的壓縮檢測和處置算法的過程950的示例性方框圖。過程950可例如由增強(qiáng)控制器模塊900的信號增強(qiáng)器模塊110的信號質(zhì)量分析器902執(zhí)行。過程950可用以允許信號質(zhì)量分析器902自動將單獨(dú)處置增益(gl、g2、g3、g4、g5、g6和g7 )315和總處置增益(gT) 320設(shè)定至對于輸入信號(X)的壓縮級來說適當(dāng)?shù)募?，即使沒有關(guān)于輸入信號(X)的質(zhì)量的元數(shù)據(jù)信息是可用的。在一個實(shí)例中，為執(zhí)行壓縮檢測，信號質(zhì)量分析器902可在512或1024-點(diǎn)FFT之后對頻率頻格操作。以下實(shí)例假定1024-點(diǎn)FFT和44.1kHz采樣率，但應(yīng)注意也可利用其他點(diǎn)級FFT和采樣率。
[0083]一般來說，過程950可對來自直接FFT輸入的任意頻格的廣泛集合采樣，以使得監(jiān)測信息為快速和最新的，并且可將這個信息與恒定間隙閾值進(jìn)行比較。如果平均能量小于預(yù)定閾值，則過程950可確定輸入信號(X)到靜音或軌道變化。否則，過程950進(jìn)行到從頻格能量下的奈奎斯特頻率向后找尋，以查看是否存在候選頻率下的能量的顯著上升。過程950可試圖準(zhǔn)確找到上升的頂部，并且將這個點(diǎn)使用于若干測量。高于這個點(diǎn)的被視為噪聲基底，并且低于這個點(diǎn)被視為信號基底。過程950可對候選截止頻率執(zhí)行若干檢查，以查看所述候選截止頻率是否看起來足夠像磚墻，是否不存在在所述候選截止頻率以上發(fā)生的顯著信息，并且所述候選截止頻率是否不僅僅是高頻中的隨機(jī)僥幸諧波或脈沖尖峰。如果候選截止頻率經(jīng)受得起所有測試，則所述候選截止頻率必須針對至少預(yù)定數(shù)目的連續(xù)幀(例如，在一個實(shí)例中20個連序幀)通過所有測試。在這一點(diǎn)處，輸入信號(X)的處置可開始漸升。處置可與截止頻率成比例，以使得較低截止意味著較多處置被施加于輸入信號(X)。處置級可持續(xù)直到軌道結(jié)束(或被靜音)。新的截止頻率可在各種條件下取代先前確定的截止頻率，如如果確定新的截止頻率大于預(yù)定百分比不同(例如，至少5%不同)并且具有較大磚墻高度。這些條件因此可防止不希望的偽像使處置級不斷變化。
[0084]更具體地說，在操作952處，信號質(zhì)量分析器902初始化壓縮檢測和處置算法。例如，信號質(zhì)量分析器902可重置鎖存器908，可將單獨(dú)處置增益315和總處置增益320設(shè)定至無增益，并且也可重置自動計(jì)時器909。信號質(zhì)量分析器902可進(jìn)一步等待有效音頻的幀?？衫缤ㄟ^查看輸入信號(X)的200Hz-4kHz區(qū)域中的一組任意頻格的瞬時值來執(zhí)行這個監(jiān)測。信號質(zhì)量分析器902可確認(rèn)這些頻格的平滑總和超過預(yù)定的恒定能級以確定新的軌道或流已經(jīng)開始。如果音頻已經(jīng)開始，則控制傳遞到操作954。
[0085]在操作954處，信號質(zhì)量分析器902使自動計(jì)時器909增值。在一個實(shí)例中，自動計(jì)時器909可在軌道或音頻開始時指定時間量，在所述時間量期間可執(zhí)行對處置增益315、320的自動調(diào)整。當(dāng)自動計(jì)時器909期滿時，可不執(zhí)行進(jìn)一步自動調(diào)整直到下一個檢測間隙。信號質(zhì)量分析器902可在操作954處針對檢測間隙之后的有效音頻的每個幀使自動計(jì)數(shù)器909增值(如果啟用)。
[0086]在操作956處，信號質(zhì)量分析器902檢測輸入信號(X)的候選截止頻率。在一個實(shí)例中，信號質(zhì)量分析器902從19kHz至8kHz向下掃描頻率頻格，以定位信號能量的顯著上升(例如，在IFFT頻率頻格空間中至少4倍(X)能量上升)。如果發(fā)現(xiàn)信號能量上升，則信號質(zhì)量分析器902可進(jìn)一步定位能量停止上升所在的頻格(例如，能量在每頻格大于10%的速率下停止上升的情況下)。能量停止上升所在的這個頻格可被稱為候選頻格X或截止頻率。
[0087]在操作958處，信號質(zhì)量分析器902確定高于截止頻率的輸入信號(X)的頻率是否確認(rèn)截止。在一個使用1024點(diǎn)FFT的實(shí)例中，信號質(zhì)量分析器902掃描始于高于頻格X截止頻率11個頻格直到19kHz的頻率頻格，以確定噪聲基底是否保持任何信息。如果噪聲基底保持信息，則那可指示截止并不是真正的壓縮引起的磚墻。作為一個更具體實(shí)例，如果噪聲基底在2個連序頻格內(nèi)上升多于5%，則頻格X截止頻率候選項(xiàng)失敗。如果候選項(xiàng)通過，則控制傳遞至操作968以繼續(xù)評估候選磚墻頻率。如果候選項(xiàng)失敗，則控制傳遞至操作960。
[0088]在操作960處，信號質(zhì)量分析器902將匹配候選截止頻率的幀數(shù)重設(shè)到無。在操作962處，信號質(zhì)量分析器902確定自動計(jì)時器909是否已經(jīng)期滿，并且可不執(zhí)行進(jìn)一步自動調(diào)整。如果自動計(jì)時器909尚未期滿，則控制傳遞至操作964以處理輸入信號(X)的下一幀。在操作964之后，控制傳遞至操作954以繼續(xù)處理音頻。如果自動計(jì)時器909已經(jīng)期滿，則控制傳遞至操作966以便等待識別下一個軌道或聲音的間隙?？深愃朴谝陨详P(guān)于操作952所描述的音頻檢測來執(zhí)行間隙檢測，以使得當(dāng)某些頻格不再超過預(yù)定恒定能級時，信號質(zhì)量分析器902可識別間隙。當(dāng)檢測到間隙時，控制從操作966傳遞至操作952，以重新開始自動處置級確定過程。
[0089]在操作968處，信號質(zhì)量分析器902確定低于截止頻率的輸入信號(X)的頻率是否確認(rèn)截止。在一個使用1024點(diǎn)FFT的實(shí)例中，信號質(zhì)量分析器902掃描始于頻格X-1向下到頻格X-100的頻率頻格，以定位具多于5倍的能量下降。如果發(fā)現(xiàn)此類能量下降被定位，則候選頻格X可能僅是窄諧波脈沖尖峰并且不是真實(shí)磚墻，并且候選項(xiàng)失敗。如果候選項(xiàng)在沒有檢測到低于候選頻率的能量下降的情況下通過，則控制傳遞至操作970。如果候選項(xiàng)失敗，則控制傳遞至操作960。
[0090]在操作970處，信號質(zhì)量分析器902確定輸入信號(X)含有有效音頻。這可被執(zhí)行例如以確保整體信號能量高于足以使磚墻檢測為有意義的預(yù)定閾值。在許多實(shí)例中，充分能量的檢測可類似于或等同于在操作952處執(zhí)行的確定，以識別輸入信號(X)中指示檢測間隙結(jié)束的音頻。如果輸入信號(X)通過有效性測試，則控制傳遞至操作972。否則，控制傳遞至操作960。
[0091]在操作972處，信號質(zhì)量分析器902確定候選磚墻的高度和陡度是否高于預(yù)定閾值。在一個實(shí)例中，信號質(zhì)量分析器902可通過確保候選磚墻具有下一個頻格的至少2.5倍(X)的能量來確認(rèn)陡度。信號質(zhì)量分析器902可通過確保當(dāng)前候選磚墻至少與先前確認(rèn)的相同音頻軌道的候選磚墻一樣高來確認(rèn)高度。如果候選項(xiàng)通過，則控制傳遞至操作974。如果候選項(xiàng)失敗，則控制傳遞至操作960。
[0092]在操作974處，信號質(zhì)量分析器902使匹配幀計(jì)數(shù)增值。匹配幀計(jì)數(shù)因此可指示已經(jīng)成功滿足頻格X處的當(dāng)前候選磚墻的所有準(zhǔn)則的幀的數(shù)目。
[0093]在操作976處，信號質(zhì)量分析器902確定匹配幀計(jì)數(shù)是否已到達(dá)預(yù)定閾值計(jì)數(shù)。在一個實(shí)例中，預(yù)定閾值計(jì)數(shù)可以是20個連序幀。如果匹配幀計(jì)數(shù)已到達(dá)預(yù)定閾值計(jì)數(shù)，則候選項(xiàng)可被認(rèn)為是正確的，并且控制可傳遞至操作978。否則，控制傳遞至操作962。
[0094]在操作978處，信號質(zhì)量分析器902確定鎖存器908是否已被設(shè)定。鎖存器908可能先前已經(jīng)被設(shè)定，例如通過先前候選磚墻的較早成功確定。如果鎖存器908未設(shè)定，則控制傳遞至操作980。如果鎖存器908已被設(shè)定，則控制傳遞至操作984。
[0095]在操作980處，信號質(zhì)量分析器902設(shè)定鎖存器908，并且在操作982處，信號質(zhì)量分析器902根據(jù)磚墻頻格X的頻率來設(shè)定處置增益315和總處置增益320。在一個實(shí)例中，處置級是基于磚墻頻率的百分比(即在較低截止頻率提供較高處置級的情況下)。處置增益315可被設(shè)定，以使得處置可能以等于這個百分比的強(qiáng)度與原始音頻流混合，并且用于組合輸出的總處置增益320可相對于處置級縮放;即較高處置值比較低處置值接收更大的縮放，并且未壓縮的音頻不縮放。因此，當(dāng)鎖存器908被設(shè)定時，處置增益315、320固定在根據(jù)磚墻頻率確定的級處。在操作982之后，控制傳遞至操作960以繼續(xù)用于音頻的磚墻檢測。
[0096]在操作984處，信號質(zhì)量分析器902確定候選磚墻是否具有相較于先前建立的音軌截止頻率的較大高度，或也確定候選磚墻是否在先前建立的截止頻率的預(yù)定閾值頻率內(nèi)。在一個實(shí)例中，只要自動計(jì)時器909尚未期滿，過程950就繼續(xù)，以使得如果在計(jì)時器909期滿之前檢測到更好的磚墻，則可替代地將該更好的磚墻用于處置增益315、320的鎖存。在一個實(shí)例中，可要求更好的磚墻具有高于先前截止頻率的磚墻高度，并且在頻率上是多于5%的不同以代替先前截止頻率。
[0097]顯不模塊906可提供輸入信號(X)、輸出信號(Y)的質(zhì)量，以及信號增強(qiáng)器模塊110的性能和/或操作的不同方面的視覺表示。如圖9中所示，顯示模塊906可接收并且顯示信號處置(31'1、3了2、3了3、3了4、3了5、3了6和3了7)310中的一個或多個。例如，顯示模塊906可顯示歸因于帶寬擴(kuò)展模塊301的信號處置ST1。在這種情況下，顯示模塊906可產(chǎn)生高于截止頻率(Fx)的新信號分量的頻譜表示的視覺顯示，所述新信號分量已由帶寬擴(kuò)展模塊301生成。替代地或另外，顯示模塊906可顯示包括所有施加的信號處置310的輸出信號(Y)的頻域或時域表示。替代地或另外，顯示模塊906可從信號質(zhì)量分析器902接收一個或多個信號質(zhì)量指示符。顯示模塊906可繼而產(chǎn)生輸入信號(X)的質(zhì)量的視覺表示。顯示模塊906也可以產(chǎn)生施加于輸入信號(X)的信號處置310的整體級的視覺表示。顯示模塊906也可產(chǎn)生輸出信號(Y)的質(zhì)量的視覺表示。因而，可為觀察顯示器的用戶提供輸入信號(X)的質(zhì)量的視覺指示，以及施加處置信號的程度或級。
[0098]圖10為輸出信號(Y)的指示帶寬增強(qiáng)的信號處置的示例性顯示。在圖10中，在約12kHz的截止頻率以上，輸入信號(X) 1002的一部分已在先前編碼期間被丟棄，如由在-120dB至-150dB范圍內(nèi)的輸入信號(X) 1002的部分所指示。帶寬擴(kuò)展模塊301可識別音頻信號的部分缺失或丟失，并且提供在相同頻率范圍上的信號處置1004。信號處置1004可施加于輸入信號(X)1002的未處置部分。因此，用戶可觀察顯示器，并且被提供不僅未處置的輸出信號將看起來像的質(zhì)量，而且還有由信號增強(qiáng)器系統(tǒng)110提供的處置的級和程度的指示。在其他實(shí)例中，可創(chuàng)建其他形式的顯示以指示施加的一種或多種處置中的任一種。
[0099]圖1la和圖1lb示出帶寬擴(kuò)展模塊301的操作的示例性結(jié)果。圖1la展示在音頻信號已被感知音頻編解碼器壓縮之前和之后的音頻信號的短塊的頻譜圖(頻域)。展示原始信號的曲線，其中可看出，顯著信號能量繼續(xù)直到奈奎斯特頻率。壓縮音頻信號曲線展示在信號已被感知音頻編解碼器壓縮之后的這個相同信號。在圖1la中，可看出，在一定截止頻率(Fx)以上，信號分量已被丟棄，并且剩下的僅是低級噪聲。
[0100]圖1lb示出在音頻信號已被帶寬擴(kuò)展模塊301處理之前和之后的壓縮音頻信號的短塊的實(shí)例的頻譜圖。在此，壓縮音頻信號被示出為具有高于丟棄的截止頻率(Fx)的信號分量。在音頻信號已被帶寬擴(kuò)展模塊301處理之后的相同壓縮音頻信號的曲線包括在圖1lb中?？煽闯觯焉筛哂诮刂诡l率(Fx)的新信號分量。這些新信號分量已基于低于截止頻率(Fx)的信號分量中的至少一些和/或使用低于截止頻率(Fx)的信號分量中的至少一些產(chǎn)生。
[0101]圖12a和圖12b示出瞬變增強(qiáng)模塊303的示例性操作。圖12a展示瞬變信號分量的時域圖。圖12a的上面板展示原始信號?？煽闯?，開始信號幾乎無聲，并且隨后是隨時間推移而衰減的尖銳瞬變信號。圖12a的下面板展示在瞬變信號分量已被感知音頻編解碼器壓縮之后的類似瞬變信號分量?？煽闯觯沧儾辉偈羌怃J限定的。此外，壓縮音頻信號現(xiàn)在具有在實(shí)際瞬變之前到達(dá)的能量。這是先前所描述的所謂“前回聲”的實(shí)例。
[0102]圖12b示出在瞬變信號分量已被瞬變增強(qiáng)模塊303處理之前和之后的示例性瞬變信號分量的時域圖。圖12b的上面板展示隨時間推移具有許多瞬變的壓縮音頻信號?？煽闯?，瞬變在信號中不是非常明顯。圖12b的下面板展示在瞬變信號已被瞬變增強(qiáng)模塊303處理之后的相同瞬變信號，其中單獨(dú)瞬變的初動現(xiàn)在是尖銳限定的和容易可見的。
[0103]圖13是示例性計(jì)算系統(tǒng)1300。計(jì)算機(jī)系統(tǒng)1300可包括一組指令，所述一組指令可被執(zhí)行來引起計(jì)算機(jī)系統(tǒng)1300執(zhí)行所描述的方法或以計(jì)算機(jī)為基礎(chǔ)的功能中的任何一種或多種。計(jì)算機(jī)系統(tǒng)1300可作為獨(dú)立裝置操作，可以是另一個裝置的一部分，或可如使用網(wǎng)絡(luò)連接到其他計(jì)算機(jī)系統(tǒng)或外圍裝置。
[0104]在聯(lián)網(wǎng)部署中，計(jì)算機(jī)系統(tǒng)1300可作為服務(wù)器或服務(wù)器-客戶端用戶網(wǎng)絡(luò)環(huán)境中的客戶端用戶計(jì)算機(jī)，作為對等(或分布式)網(wǎng)絡(luò)環(huán)境中的對等計(jì)算機(jī)系統(tǒng)，或以各種其他方式操作。計(jì)算機(jī)系統(tǒng)1300也可被實(shí)現(xiàn)為或并入到如例如車輛中的遠(yuǎn)程信息處理系統(tǒng)的各種裝置中。在其他實(shí)例中，可使用能夠執(zhí)行一組指令(順序或相反)的任何其他機(jī)器，所述指令指定將由該機(jī)器采取的動作。計(jì)算機(jī)系統(tǒng)1300可使用提供語音、音頻、視頻或數(shù)據(jù)通信的電子裝置來實(shí)現(xiàn)。盡管示出單個計(jì)算機(jī)系統(tǒng)1300，但是術(shù)語“系統(tǒng)”可包括單獨(dú)地或聯(lián)合地執(zhí)行一組或多組指令以執(zhí)行一個或多個計(jì)算機(jī)功能的系統(tǒng)或子系統(tǒng)的任何集合。
[0105]計(jì)算機(jī)系統(tǒng)1300可包括處理器1302，如中央處理單元(CPU)、圖形處理單元(GPU)、數(shù)字信號處理器(DSP)，或不同或相同處理器的一些組合。處理器1302可以是各種系統(tǒng)中的部件。例如，處理器1302可以是車輛中的頭部單元或放大器的一部分。處理器1302可以是一個或多個通用處理器、數(shù)字信號處理器、專用集成電路、現(xiàn)場可編程門陣列、數(shù)字電路、模擬電路、其組合，或用于分析和處理數(shù)據(jù)的其他現(xiàn)在已知或以后開發(fā)的裝置。處理器1302可實(shí)現(xiàn)軟件程序，如手動生成或編程的代碼。
[0106]處理器1302可操作和控制系統(tǒng)的至少一部分。術(shù)語“模塊”可被限定成包括一個或多個可執(zhí)行模塊。模塊可包括可由處理器(如處理器1302)執(zhí)行的軟件、硬件、固件或其一些結(jié)合。軟件模塊可包括存儲在存儲器(如存儲器1304)或另一個存儲裝置中的可由處理器1302或其他處理器執(zhí)行的指令。硬件模塊可包括可由處理器1302執(zhí)行、引導(dǎo)或控制以用于執(zhí)行的各種裝置、部件、電路、門、電路板等。
[0107]計(jì)算機(jī)系統(tǒng)1300可包括存儲器1304，如可通過總線1308通信的存儲器1304。存儲器1304可以是主存儲器、靜態(tài)存儲器或動態(tài)存儲器。存儲器1304可包括但不限于計(jì)算機(jī)可讀存儲介質(zhì)，如各種類型的易失性和非易失性存儲介質(zhì)，包括但不限于隨機(jī)存取存儲器、只讀存儲器、可編程只讀存儲器、電可編程只讀存儲器、電可擦除只讀存儲器、閃速存儲器、磁帶或磁盤、光學(xué)介質(zhì)等。在一個實(shí)例中，存儲器1304包括用于處理器1302的高速緩存或隨機(jī)存取存儲器。在替代性實(shí)例中，存儲器1304可與處理器1302分離，如處理器的高速緩存存儲器、系統(tǒng)存儲器或其他存儲器。存儲器1304可包括用于存儲數(shù)據(jù)的外部存儲裝置或數(shù)據(jù)庫。實(shí)例包括硬盤驅(qū)動器、光盤(“CD” )、數(shù)字視頻光盤(“DVD” )、存儲卡、記憶棒、軟盤、通用串行總線(“USB”)存儲裝置或可操作來存儲數(shù)據(jù)的任何其他裝置。
[0108]計(jì)算機(jī)系統(tǒng)1300可能或可能不進(jìn)一步包括顯示單元1310，如液晶顯示器(IXD)、有機(jī)發(fā)光二極管(0LED)、平板顯示器、固態(tài)顯示器、陰極射線管(CRT)、投影儀或用于輸出確定信息的其他現(xiàn)在已知或以后開發(fā)的顯示裝置。顯示器1310可充當(dāng)用于用戶控制處理器1302的功能的接口，或具體地充當(dāng)與存儲在存儲器1304中的軟件的接口。
[0109]計(jì)算機(jī)系統(tǒng)1300可包括被配置來允許用戶與計(jì)算機(jī)系統(tǒng)的任何部件交互的輸入裝置1312。輸入裝置1312可以是用于接收語音命令的麥克風(fēng)、小鍵盤、鍵盤或光標(biāo)控制裝置(如鼠標(biāo)或操縱桿)、觸摸屏顯示器、遠(yuǎn)程控制或可操作來與計(jì)算機(jī)系統(tǒng)1300交互的任何其他裝置。系統(tǒng)用戶可例如輸入系統(tǒng)和/或遠(yuǎn)程信息處理系統(tǒng)將考慮的準(zhǔn)則或條件。
[0110]計(jì)算機(jī)系統(tǒng)1300可包括計(jì)算機(jī)可讀介質(zhì)，所述計(jì)算機(jī)可讀介質(zhì)包括指令或響應(yīng)于傳播信號接收并執(zhí)行指令，以使得連接到網(wǎng)絡(luò)1326的裝置可通過網(wǎng)絡(luò)1326傳送語音、視頻、音頻、圖像或任何其他數(shù)據(jù)?？山?jīng)由通信端口或接口 1320或使用總線1308，通過網(wǎng)絡(luò)1326傳輸或接收指令。通信端口或接口 1320可為處理器1302的一部分，或可為分離部件。通信端口1320可在軟件中創(chuàng)建，或可為硬件中的物理連接。通信端口 1320可被配置來與網(wǎng)絡(luò)1326、夕卜部媒體、顯示器1310或計(jì)算機(jī)系統(tǒng)1300中的任何其他部件，或其組合連接。與網(wǎng)絡(luò)1326的連接可為物理連接，如有線以太網(wǎng)連接，或可無線地建立。與計(jì)算機(jī)系統(tǒng)功能1300的其他部件的附加連接可為物理連接，或可無線地建立。網(wǎng)絡(luò)1326可替代地直接連接到總線1308。
[0111]網(wǎng)絡(luò)1326可包括有線網(wǎng)絡(luò)、無線網(wǎng)絡(luò)、以太網(wǎng)AVB網(wǎng)絡(luò)或其組合。無線網(wǎng)絡(luò)可為蜂窩電話網(wǎng)絡(luò)、802.11、802.16、802.20、802.1Q或WiMax網(wǎng)絡(luò)。另外，網(wǎng)絡(luò)1326可為公共網(wǎng)絡(luò)(如互聯(lián)網(wǎng))、專用網(wǎng)絡(luò)(如內(nèi)聯(lián)網(wǎng))或其組合，并且可利用現(xiàn)在可用或以后開發(fā)的各種聯(lián)網(wǎng)協(xié)議，包括但不限于基于TCP/IP的聯(lián)網(wǎng)協(xié)議。系統(tǒng)的一個或多個部件可以由或通過網(wǎng)絡(luò)1326彼此通信。
[0112]雖然以上描述示例性實(shí)施方案，但是這些實(shí)施方案不意圖描述本發(fā)明的所有可能形式。實(shí)際上，在說明書中使用的措詞是描述而非限制的措詞，并且應(yīng)當(dāng)理解，可在不脫離本發(fā)明的精神和范圍的情況下做出各種改變。另外，各種實(shí)施方案的特征可加以組合來形成本發(fā)明的進(jìn)一步實(shí)施方案。
【主權(quán)項(xiàng)】
1.一種用于壓縮音頻信號的處置的系統(tǒng)，所述系統(tǒng)包括: 處理器；采樣器模塊，其由所述處理器執(zhí)行以將音頻信號分成一系列順序樣本；信號質(zhì)量檢測器模塊，其由所述處理器執(zhí)行以識別所述音頻信號的在所述音頻信號開端跨越多個所述順序樣本的一致磚墻頻率，并且確定與所述磚墻頻率成比例的信號處置指示；以及信號增強(qiáng)器模塊，其由所述處理器執(zhí)行以順序地接收并分析所述音頻信號的一個或多個樣本分量，以識別各自順序樣本的所述一個或多個樣本分量中的所述音頻信號的丟失部分，并且在根據(jù)所述信號質(zhì)量指示的級，將用于具有對應(yīng)識別的丟失部分的各自順序樣本的所述一個或多個樣本分量中每一個的對應(yīng)信號處置施加于所述音頻信號。2.如權(quán)利要求1所述的系統(tǒng)，其中所述系列順序樣本包括使用快速傅里葉變換確定的頻域中的順序頻格，并且其中所述信號質(zhì)量檢測器模塊還可執(zhí)行來通過將所述順序頻格中的一個識別為包括所述磚墻頻率的候選頻格，來識別所述一致磚墻頻率。3.如權(quán)利要求2所述的系統(tǒng)，其中識別所述一致磚墻頻率還包括以下各項(xiàng)中的一個或多個: 確認(rèn)低于所述磚墻頻率的頻譜能量存在；確認(rèn)高于預(yù)定閾值的所述磚墻頻率的高度，所述預(yù)定閾值超過下一個較高頻率順序頻格的磚墻頻率;以及確認(rèn)高于預(yù)定閾值的所述磚墻頻率的截止的陡度，所述預(yù)定閾值超過所述下一個較高頻率順序頻格的磚墻頻率。4.如權(quán)利要求1所述的系統(tǒng)，其中所述信號處置指示被設(shè)定成以下各項(xiàng)中的一個: (i)當(dāng)所述磚墻頻率不超過最小頻率閾值時，無信號處置； (ii)當(dāng)所述磚墻頻率超過最大頻率閾值時，無信號處置；以及 (iii)當(dāng)所述磚墻頻率在所述最小頻率閾值與所述最大頻率閾值之間時，信號處置級隨著所述磚墻頻率增加而減少。5.如權(quán)利要求1所述的系統(tǒng)，其中所述信號質(zhì)量檢測器模塊進(jìn)一步可執(zhí)行以: 設(shè)定所述信號處置指示，以在檢測到所述音頻信號的所述一致磚墻頻率之前不施加信號處置;并且鎖存所述信號處置指示，以在識別指示所述音頻信號的所述一致磚墻頻率的連序預(yù)定義數(shù)目的樣本時，將所述處置施加于所述音頻信號。6.如權(quán)利要求5所述的系統(tǒng)，其中所述連序預(yù)定義數(shù)目的樣本為二十個。7.如權(quán)利要求5所述的系統(tǒng)，其中所述連序預(yù)定義數(shù)目的樣本表示在所述音頻信號的近似十分之一秒到二分之一秒之間的時間段。8.如權(quán)利要求1所述的系統(tǒng)，其中所述信號質(zhì)量檢測器模塊進(jìn)一步可執(zhí)行以: 響應(yīng)于所述音頻信號的所述開端的檢測重置自動計(jì)時器；評估所述多個順序樣本以識別所述音頻信號的所述一致磚墻頻率，直到所述自動計(jì)時器期滿;并且一旦所述自動計(jì)時器期滿，中止所述多個順序樣本的評估。9.如權(quán)利要求1所述的系統(tǒng)，其中所述信號質(zhì)量檢測器模塊還可執(zhí)行來在識別低于用于預(yù)定時間段的預(yù)定閾值的音頻信號強(qiáng)度的時段時，重置所述質(zhì)量指示。10.如權(quán)利要求1所述的系統(tǒng)，其中以下各項(xiàng)中的一個或多個: 所述樣本分量是頻率分量，并且所述對應(yīng)信號處置是向具有高于截止頻率閾值的缺失頻率分量的樣本分量施加的頻率分量；所述樣本分量是瞬變分量，并且所述對應(yīng)信號處置是向具有缺失瞬變的樣本分量施加的瞬變分量，以增強(qiáng)所述音頻信號中存在的現(xiàn)有瞬變的初動；以及所述樣本分量是混響分量，并且所述對應(yīng)信號處置施加于具有缺失混響的樣本分量以減少所述音頻信號的衰減速率。11.如權(quán)利要求1所述的系統(tǒng)，其中所述對應(yīng)信號處置是包括帶寬擴(kuò)展處置、瞬變增強(qiáng)處置和混響填充處置的多個信號處置。12.如權(quán)利要求1所述的系統(tǒng)，其中所述信號增強(qiáng)器模塊包括多個信號增強(qiáng)器模塊，并且其中所述信號增強(qiáng)器模塊中每一個由所述處理器執(zhí)行，以獨(dú)立地對收聽者感知的音場的空間片段操作來添加至少一個信號處置，所述收聽者感知的音場在所述音頻信號的播放期間由收聽者感知。13.如權(quán)利要求1所述的系統(tǒng)，其中所述信號增強(qiáng)器模塊被配置來生成多個對應(yīng)信號處置，所述對應(yīng)信號處置被添加到所述音頻信號。14.一種計(jì)算機(jī)可讀存儲介質(zhì)，其存儲計(jì)算機(jī)可讀指令，所述計(jì)算機(jī)可讀指令可由處理器執(zhí)行來處置壓縮音頻信號，所述計(jì)算機(jī)可讀介質(zhì)包括: 指令，其由所述處理器執(zhí)行以創(chuàng)建音頻信號的順序樣本序列；指令，其由所述處理器執(zhí)行以識別所述音頻信號的在所述音頻信號開端跨越多個所述順序樣本的一致磚墻頻率，并且確定與所述磚墻頻率成比例的信號處置指示；指令，其由所述處理器執(zhí)行以順序地接收并分析所述音頻信號的一個或多個樣本分量，以識別各自順序樣本的所述一個或多個樣本分量中的所述音頻信號的丟失部分；以及指令，其由所述處理器執(zhí)行以在根據(jù)所述信號質(zhì)量指示的級，將用于具有對應(yīng)識別的丟失部分的各自順序樣本的所述一個或多個樣本分量中每一個的對應(yīng)信號處置施加于所述音頻信號。15.如權(quán)利要求14所述的計(jì)算機(jī)可讀存儲介質(zhì)，其中所述順序樣本序列包括使用快速傅里葉變換確定的頻域中的順序頻格，并且其中由所述處理器執(zhí)行的所述指令還包括用于通過將所述順序頻格中的一個識別為包括所述磚墻頻率的候選頻格來識別所述一致磚墻頻率的指令。16.如權(quán)利要求14所述的計(jì)算機(jī)可讀存儲介質(zhì)，其中由所述處理器執(zhí)行以識別所述一致磚墻頻率的所述指令還包括以下各項(xiàng)中的一個或多個: 指令，其由所述處理器執(zhí)行以確認(rèn)低于所述磚墻頻率的頻譜能量存在；指令，其由所述處理器執(zhí)行以確認(rèn)高于預(yù)定閾值的所述磚墻頻率的高度，所述預(yù)定閾值超過下一個較高頻率順序頻格的磚墻頻率;以及指令，其由所述處理器執(zhí)行以確認(rèn)高于預(yù)定閾值的所述磚墻頻率的截止的陡度，所述預(yù)定閾值超過所述下一個較高頻率順序頻格的磚墻頻率。17.如權(quán)利要求14所述的計(jì)算機(jī)可讀存儲介質(zhì)，其中所述信號處置指示被設(shè)定成以下各項(xiàng)中的一個: (i)當(dāng)所述磚墻頻率不超過最小頻率閾值時，無信號處置； (i i)當(dāng)所述磚墻頻率超過最大頻率閾值時，無信號處置；以及 (iii)當(dāng)所述磚墻頻率在所述最小頻率閾值與所述最大頻率閾值之間時，信號處置級隨著所述磚墻頻率增加而減少。18.如權(quán)利要求14所述的計(jì)算機(jī)可讀存儲介質(zhì)，其中由所述處理器執(zhí)行的所述指令還包括: 指令，其由所述處理器執(zhí)行以設(shè)定所述信號處置指示，以在檢測到所述音頻信號的所述一致磚墻頻率之前不施加信號處置;以及指令，其由所述處理器執(zhí)行以鎖存所述信號處置指示，以在識別指示所述音頻信號的所述一致磚墻頻率的連序預(yù)定義數(shù)目的樣本時，將所述處置施加于所述音頻信號。19.如權(quán)利要求18所述的計(jì)算機(jī)可讀存儲介質(zhì)，其中所述連序預(yù)定義數(shù)目的樣本是以下各項(xiàng)中的一個或多個:(i) 二十個連序樣本，和(ii)表示在所述音頻信號的近似十分之一秒到二分之一秒之間的時間段的多個連序樣本。20.如權(quán)利要求14所述的計(jì)算機(jī)可讀存儲介質(zhì)，其中由所述處理器執(zhí)行的所述指令還包括: 指令，其由所述處理器執(zhí)行以響應(yīng)于所述音頻信號的所述開端的檢測重置自動計(jì)時器；指令，其由所述處理器執(zhí)行以評估所述多個順序樣本以識別所述音頻信號的所述一致磚墻頻率，直到所述自動計(jì)時器期滿；以及指令，其由所述處理器執(zhí)行以在所述自動計(jì)時器期滿時，中止所述多個順序樣本的評估。21.如權(quán)利要求14所述的計(jì)算機(jī)可讀存儲介質(zhì)，其中由所述處理器執(zhí)行的所述指令還包括用于在識別低于用于預(yù)定時間段的預(yù)定閾值的音頻信號強(qiáng)度的時段時，重置所述質(zhì)量指示的指令。22.如權(quán)利要求14所述的計(jì)算機(jī)可讀存儲介質(zhì)，其中以下各項(xiàng)中的一個或多個: 所述樣本分量是頻率分量，并且所述對應(yīng)信號處置是向具有高于截止頻率閾值的缺失頻率分量的樣本分量施加的頻率分量；所述樣本分量是瞬變分量，并且所述對應(yīng)信號處置是向具有缺失瞬變的樣本分量施加于的瞬變分量，以增強(qiáng)所述音頻信號中存在的現(xiàn)有瞬變的初動；以及所述樣本分量是混響分量，并且所述對應(yīng)的信號處置施加于具有缺失混響的樣本分量以減少所述音頻信號的衰減速率。23.一種處置壓縮音頻信號的方法，所述方法包括: 使用處理器將音頻信號分離成順序樣本；使用所述處理器識別所述音頻信號的在所述音頻信號開端跨越多個所述順序樣本的一致磚墻頻率，并且確定與所述磚墻頻率成比例的信號處置指示；使用所述處理器順序地分析所述音頻信號的一個或多個樣本分量，以識別各自順序樣本的所述一個或多個樣本分量中的所述音頻信號的丟失部分；以及在根據(jù)所述信號質(zhì)量指示的級，使用所述處理器將用于具有對應(yīng)識別的丟失部分的各自順序樣本的所述一個或多個樣本分量中每一個的對應(yīng)信號處置施加于所述音頻信號。24.如權(quán)利要求23所述的方法，其中所述順序樣本包括使用快速傅里葉變換確定的頻域中的順序頻格，并且識別所述一致磚墻頻率包括將所述順序頻格中的一個識別為包括所述磚墻頻率的候選頻格。25.根據(jù)權(quán)利要求23所述的方法，其還包括以下各項(xiàng)中的一個或多個: 確認(rèn)低于所述磚墻頻率的頻譜能量存在；確認(rèn)高于預(yù)定閾值的所述磚墻頻率的高度，所述預(yù)定閾值超過下一個較高頻率順序頻格的磚墻頻率;以及確認(rèn)高于預(yù)定閾值的所述磚墻頻率的截止的陡度，所述預(yù)定閾值超過所述下一個較高頻率順序頻格的磚墻頻率。26.如權(quán)利要求23所述的方法，其中所述信號處置指示被設(shè)定至以下各項(xiàng)中的一個: (i)當(dāng)所述磚墻頻率不超過最小頻率閾值時，無信號處置； (ii)當(dāng)所述磚墻頻率超過最大頻率閾值時，無信號處置；以及 (iii)當(dāng)所述磚墻頻率在所述最小頻率閾值與所述最大頻率閾值之間時，信號處置級隨著所述磚墻頻率增加而減少。27.如權(quán)利要求23所述的方法，其還包括: 設(shè)定所述信號處置指示，以在檢測到所述音頻信號的所述一致磚墻頻率之前不施加信號處置；以及鎖存所述信號處置指示，以在識別指示所述音頻信號的所述一致磚墻頻率的連序預(yù)定義數(shù)目的樣本時，將所述處置施加于所述音頻信號。28.如權(quán)利要求27所述的方法，其中所述連序預(yù)定義數(shù)目的樣本是以下各項(xiàng)中的一個或多個:(i) 二十個連續(xù)樣本和(ii)表示在所述音頻信號的近似十分之一秒到二分之一秒之間的時間段的多個連序樣本。29.如權(quán)利要求23所述的方法，其還包括: 響應(yīng)于所述音頻信號的所述開端的檢測重置自動計(jì)時器；以及評估所述多個順序樣本以識別所述音頻信號的所述一致磚墻頻率，直到所述自動計(jì)時器期滿；以及一旦所述自動計(jì)時器期滿，中止所述多個順序樣本的評估。30.如權(quán)利要求23所述的方法，其還包括在識別低于用于預(yù)定時間段的預(yù)定閾值的音頻信號強(qiáng)度的時段時，重置所述質(zhì)量指示。31.如權(quán)利要求23所述的方法，其中以下各項(xiàng)中的一個或多個: 所述樣本分量是頻率分量，并且所述對應(yīng)信號處置是施加于具有高于截止頻率閾值的缺失頻率分量的樣本分量的頻率分量；所述樣本分量是瞬變分量，并且所述對應(yīng)信號處置是施加于具有缺失瞬變的樣本分量的瞬變分量，以增強(qiáng)所述音頻信號中存在的現(xiàn)有瞬變的初動；以及所述樣本分量是混響分量，并且所述對應(yīng)信號處置施加于具有缺失混響的樣本分量以減少所述音頻信號的衰減速率。
【文檔編號】G10L21/0232GK105900170SQ201580003948
【公開日】2016年8月24日
【申請日】2015年1月6日
【發(fā)明人】K.E.希伯, G.A.J.索洛德雷
【申請人】哈曼國際工業(yè)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：K.E.希伯;G.A.J.索洛德雷;
技術(shù)所有人：哈曼國際工業(yè)有限公司;
我是此專利的發(fā)明人

上一篇：依賴于情境的瞬態(tài)抑制的制作方法
上一篇：音頻內(nèi)容的空間誤差度量的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

音頻壓縮相關(guān)技術(shù)

音頻壓縮軟件相關(guān)技術(shù)

音頻壓縮算法相關(guān)技術(shù)

音頻文件壓縮相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

壓縮音頻信號的以信號質(zhì)量為基礎(chǔ)的增強(qiáng)和補(bǔ)償?shù)闹谱鞣椒?