亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

音頻信號處理裝置、音頻信號處理方法及音頻信號處理程序的制作方法

文檔序號:9635220閱讀:1094來源:國知局
音頻信號處理裝置、音頻信號處理方法及音頻信號處理程序的制作方法
【技術領域】
[0001] 本發(fā)明涉及對音頻信號進行處理的音頻信號處理裝置、音頻信號處理方法及音頻 信號處理程序。
【背景技術】
[0002] 在如IP(InternetProtocol)電話那樣將音頻信號進行編碼及分組化并在互聯(lián) 網(wǎng)中傳輸時,由于網(wǎng)絡擁擠等原因,有時分組丟失(以下將該現(xiàn)象稱為"分組丟失(packet loss) ")。在發(fā)生分組丟失時,由于必需的音頻碼丟失而不能進行音頻解碼,產(chǎn)生聲音中斷。 作為防止因分組丟失而產(chǎn)生的聲音中斷的技術有音頻分組丟失隱藏技術。音頻分組丟失 隱藏技術用于檢測分組丟失,并生成與丟失的分組對應的準音頻信號(以下稱為"隱藏信 號")。
[0003] 在作為音頻編碼方法采用更新編碼器/解碼器的內(nèi)部狀態(tài)的同時進行音頻編碼 的方法的情況下,將不能得到本來應該接收的編碼參數(shù),因而音頻分組丟失隱藏技術也利 用模擬地生成的參數(shù)進行解碼器的內(nèi)部狀態(tài)更新。
[0004] 作為更新編碼器/解碼器的內(nèi)部狀態(tài)進行音頻編碼的方法,廣泛采用CELP(Code ExcitedLinearPrediction)編碼。在CELP編碼中,假定自回歸模型,經(jīng)由全極型合成濾 波器a(i)對激勵信號e(n)進行濾波,由此將音頻信號合成。即,按照下式來合成音頻信號 s(η)。a(i)表示線性預測系數(shù)(LP(LinearPrediction)系數(shù)),作為次數(shù)采用P= 16等 值。
[0005] [數(shù)式 1]
[0006]
[0007] 在CELP編碼中,將對線性預測系數(shù)進行數(shù)學上的等效而表述的ISF(ImmittanCe SpectralFrequency,導抗譜頻率)參數(shù)、和過去的激勵信號作為內(nèi)部狀態(tài)。在產(chǎn)生了分組 丟失的情況下,模擬地生成這些參數(shù)和信號,因而與本來應該通過解碼得到的參數(shù)之間產(chǎn) 生偏差。由于參數(shù)的偏差而引起的合成聲音的不匹配,被視聽者認為是噪聲,大大破壞了主 觀上的品質(zhì)。
[0008] 下面,以音頻編碼方法采用CELP編碼的情況為例,對進行音頻分組丟失隱藏的音 頻解碼器的結構及動作進行說明。
[0009] 音頻解碼器的結構圖及動作如圖1、圖2所示。如圖1所示,音頻解碼器1具有分 組丟失檢測部11、音頻碼解碼部12、隱藏信號生成部13和內(nèi)部狀態(tài)緩存器14。
[0010] 分組丟失檢測部11在正常接收到音頻分組的情況下,向音頻碼解碼部12發(fā)送控 制信號、及音頻分組中包含的音頻碼(正常接收:在圖2的步驟S100為"是"的情況)。然 后,音頻碼解碼部12按照后面所述進行音頻碼的解碼及內(nèi)部狀態(tài)更新(圖2的步驟S200、 S400)。另一方面,在不能正常接收到音頻分組的情況下,分組丟失檢測部11向隱藏信號生 成部13發(fā)送控制信號(分組丟失:在圖2的步驟S100為"否"的情況)。然后,隱藏信號生 成部13按照后面所述進行隱藏信號的生成及內(nèi)部狀態(tài)更新(圖2的步驟S200、S400)。反 復圖2的步驟S100~S400的處理一直到通信結束為止(一直到在步驟S500判定為"是" 為止)。
[0011] 音頻碼至少包括被編碼后的數(shù)式2所示的ISF參數(shù),
[0012] [數(shù)式 2]
[0013]
[0014] 被編碼后的第一~第四子幀的基音滯后T]p、第一~第四子幀的被編碼后的自 適應碼本增益g]p、第一~第四子幀的被編碼后的固定碼本增益g]。、第一~第四子幀的被 編碼后的固定碼本向量σ](η)。也可以使用數(shù)學上的等效的表述即LSF(Linespectral frequency)參數(shù)來取代ISF參數(shù)。在下面的討論中進行使用了ISF參數(shù)的說明,但該討論 對使用LSF參數(shù)的情況也成立。
[0015] 在內(nèi)部狀態(tài)緩存器中包括數(shù)式3所示的過去的ISF參數(shù)
[0016][數(shù)式 3]
[0017]
[0018] 以及數(shù)式4所示的
[0019][數(shù)式 4]
[0020]
[0021] 的等效表述即ISP(ImmittanceSpectralPair)參數(shù)
[0022] [數(shù)式 5]
[0023]
[0024]ISF殘差參數(shù)
[0025][數(shù)式6]
[0026]
[0027] 過去的基音滯后Τ·]ρ、過去的自適應碼本增益、過去的固定碼本增益。、自適應 碼本u(n)。分別包含過去幾個子幀的量的參數(shù)取決于設計方針。在本說明書中,假定1幀 包括4個子幀,但也可以按照設計方針設為其它的值。
[0028]〈正常接收的情況〉
[0029] 圖3示出音頻碼解碼部12的功能結構例。如該圖3所示,音頻碼解碼部12具有 ISF解碼部120、穩(wěn)定性處理部121、LP系數(shù)計算部122、自適應碼本計算部123、固定碼本解 碼部124、增益解碼部125、激勵向量合成部126、主濾波器127、和合成濾波器128。但是,主 濾波器127不是必須的構成要素。另外,在圖3中,為了便于說明,在音頻碼解碼部12內(nèi)用 雙點劃線示出了內(nèi)部狀態(tài)緩存器14,但該內(nèi)部狀態(tài)緩存器14也可以不包含在音頻碼解碼 部12的內(nèi)部,而是圖1所示的內(nèi)部狀態(tài)緩存器14。對于以后的音頻碼解碼部的結構圖也一 樣。
[0030]LP系數(shù)計算部122的結構圖如圖4所示,根據(jù)被編碼后的ISF參數(shù)計算LP系數(shù)的 處理流程如圖5所示。如圖4所示,LP系數(shù)計算部122具有ISP-ISP變換部122A、ISP插 值部122B、和ISP-LPC變換部122C。
[0031] 首先,說明與根據(jù)被編碼后的ISF參數(shù)計算LP系數(shù)的處理(圖5)相關聯(lián)的功能 結構及動作。
[0032]ISF解碼部120對被編碼后的ISF參數(shù)進行解碼,求出數(shù)式7所示的ISF殘差參 數(shù),
[0033] [數(shù)式 7]
[0034]
[0035] 按照數(shù)式9計算數(shù)式8所示的ISF參數(shù)(圖5的步驟S1)。其中,!^&111表示事前 通過學習等求出的平均向量。
[0036][數(shù)式 8]
[0037]
[0038] [數(shù)式 9]
[0039]
[0040] 另外,在此對使用MA預測進行ISF參數(shù)的計算的示例進行了說明,但也可以是如 下所述使用AR預測進行ISF參數(shù)的計算的結構。在此,緊前面的幀的ISF參數(shù)表示為數(shù)式 10,將AR預測的加權系數(shù)設為Pl。
[0041][數(shù)式 10]
[0042]
[0043]
[0044]
[0045] 穩(wěn)定性處理部121進行基于數(shù)式12的處理,以使ISF參數(shù)的各要素之間隔開50Hz 以上的間隔,從而確保濾波器的穩(wěn)定性(圖5的步驟S2)。ISF參數(shù)是用線譜表述音頻頻 譜包絡的形狀的參數(shù),彼此的距離越近,頻譜的峰值就越大并產(chǎn)生共振。因此,需要確保穩(wěn) 定性的處理,使得在頻譜的峰值時的增益不會過大。其中,min_dist表示最小的ISF間隔, isf_min表示確保min_dist的間隔所需要的ISF的最小值。isf_min通過將相鄰的ISF的 值與min_dist的間隔相加而依次進行更新。另一方面,isf_max表示確保min_dist的間 隔所需要的ISF的最大值。isf_max通過從相鄰的ISF的值減去min_dist的間隔而依次進 行更新。
[0046][數(shù)式 12]
[0047]
[0048] LP系數(shù)計算部122內(nèi)的ISF-ISP變換部122A按照數(shù)式15將數(shù)式13所示的項變 換為數(shù)式14所示的ISP參數(shù)(圖5的步驟S3)。其中,C表示事前設定的常數(shù)。
[0049][數(shù)式13]
[0050]
[0051]
[0052]
[0053]
[0054]
[0055] ISP插值部122B根據(jù)內(nèi)部狀態(tài)緩存器14中包含的數(shù)式16所示的過去的ISP參數(shù) 和數(shù)式17所示的上述ISP參數(shù),按照數(shù)式18計算每個子幀的ISP參數(shù)(圖5的步驟S4)。 在進行插值時也可以使用其它系數(shù)。
[0056][數(shù)式16]
[0065] ISP-LPC變換部122C將每個子幀的ISP參數(shù)變換為數(shù)式19所示的LP系數(shù)(圖5 的步驟S5)。作為具體的變換步驟,能夠使用非專利文獻1記載的處理步驟。在此,將先行 信號(先読辦信號)中包含的子幀的數(shù)量設為4,但也可以按照設計方針變更子幀的數(shù)量。
[0066][數(shù)式19]
[0067]
[0068] 下面,說明音頻碼解碼部12的其它結構及動作。
[0069] 自適應碼本計算部123對被編碼后的基音滯后(pitchlag)進行解碼,計算第 一~第四子幀的基音滯后T]p。然后,自適應碼本計算部123使用自適應碼本u(n),按照數(shù) 式20對每個子幀計算自適應碼本向量。通過利用FIR濾波器Int(i)對自適應碼本u(n) 進行插值,計算出自適應碼本向量。在此,將自適應碼本的長度設為Nadapt。在插值中使用的 濾波器Int(i)是事前設定的長度21+1的FIR濾波器,L'表示子幀的采樣數(shù)。通過使用插 值濾波器Int(i),能夠以小數(shù)點以下的精度利用基音滯后。關于插值濾波器的詳細情況,能 夠使用非專利文獻1記載的方法。
[0070] 「救=rt州?
[0071]
[0072] 固定碼本解碼部124對被編碼后的固定碼本向量進行解碼,取得第一~第四子幀 的固定碼本向量(η)。
[0073] 增益解碼部125對被編碼后的自適應碼本增益及被編碼后的固定碼本增益進行 解碼,取得第一~第四子幀的自適應碼本增益及固定碼本增益。例如,能夠利用非專利文獻 1記載的如下的方法進行自適應碼本增益及固定碼本增益的解碼。根據(jù)利用非專利文獻1 記載的如下的方法,不必像AMR-WB的增益編碼那樣使用幀間預測,因而能夠提高抗分組丟 失性。
[0074] 例如,增益解碼部125按照以下的處理流程取得固定碼本增益。
[0075] 首先,增益解碼部125計算固定碼本向量的功率。在此,將子幀的長度設為Ns。
[0076][數(shù)式21]
[0077]
[0078] 然后,增益解碼部125對被向量量化后的增益參數(shù)進行解碼,得到數(shù)式22所示的 自適應碼本增益和數(shù)式23所示的量化固定碼本增益。根據(jù)量化固定碼本增益和上述固定 碼本向量的功率計算如下數(shù)式24所示的預測固定碼本增益。
[0079][數(shù)式22]
[0083][數(shù)式 24]
[0084]
[0085] 最后,增益解碼部125對數(shù)式25所示的預測系數(shù)進行解碼,并與預測增益相乘,由 此得到數(shù)式26所示的固定碼本增益。
[0086][數(shù)式 25]
[0087]
[0088]
[0089]
[0090] 激勵向量合成部126按照數(shù)式27所示將自適應碼本向量與自適應碼本增益相乘, 并且將固定碼本向量與固定碼本增益相乘,再求出乘積之和,由此取得激勵信號。
[0091][數(shù)式 27]
[0092]
[0093] 主濾波器127對激勵信號向量進行例如基音強調(diào)、噪聲強調(diào)、低頻強調(diào)這樣的后 處理?;魪娬{(diào)、噪聲強調(diào)、低頻強調(diào)能夠使用非專利文獻1記載的方法。
[0094] 合成濾波器128通過線性預測逆向濾波,將以激勵信號為驅動音源的解碼信號合 成。
[0095][數(shù)式 28]
[0096]
[0097] 另外,當在編碼器中進行了預加重(pre-emphasis)的情況下,進行去加重 (de-emphasis)〇
[0098][數(shù)式 29]
[0099]
[0100] 另一方面,當在編碼器中未進行預加重的情況下,不進行去加重。
[0101] 下面,說明有關內(nèi)部狀態(tài)更新的動作。
[0102] LP系數(shù)計算部122利用根據(jù)數(shù)式30計算的向量更新ISF參數(shù)的內(nèi)部狀態(tài),以便進 行分組丟失時的參數(shù)插值。
[0103][數(shù)式 30]
[0104]
[0105] 其中,ω/j)表示被存儲在緩存器中的第j幀前的ISF參數(shù)。ω^表示事前通過學 習等求出的講話區(qū)間的ISF參數(shù)。β表示常數(shù),例如能夠取值如0.75,但不限于此。ω,、 β例如也可以如非專利文獻1記載的ISF隱藏(3yシ一;レyy卜)那樣根據(jù)表示編碼對 象幀的性質(zhì)的索引而變化。
[0106] 另外,LP系數(shù)計算部122也按照下式更新ISF殘差參數(shù)的內(nèi)部狀態(tài)
當前第1頁1 2 3 4 5 6 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1