專利名稱:音頻分組接收器、音頻分組接收方法和程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻錯(cuò)誤隱藏,其中當(dāng)檢測到分組丟失時(shí),在音頻分 組接收器中生成用于被隱藏音頻的音頻數(shù)據(jù)。
背景技術(shù):
作為一種用于通信封包的音頻數(shù)據(jù)的分組通信,VoIP (IP電話) 已得到廣泛使用。在VoIP通信中,將編碼的音頻數(shù)據(jù)封包成RTP (實(shí) 時(shí)傳輸協(xié)議)分組(非專利文獻(xiàn)l)。
除了音頻,也已經(jīng)使用了包括視頻、文本、文件等的多媒體數(shù)據(jù) 流的分配服務(wù)及其交互通信服務(wù)。
然而,分組通信網(wǎng)絡(luò)可能具有分組丟失,即其中分組被丟失(或 者己經(jīng)消失)的事件。
這樣的事件不可避免地降低了諸如在接收音頻分組的音頻接收器 處的音頻這樣的媒體的可聽質(zhì)量。
因此,已經(jīng)提出了一些措施,用于減輕諸如在音頻分組接收器處 的由分組丟失所引起的音頻質(zhì)量的降低。
例如,專利文獻(xiàn)1公開了用于當(dāng)檢測到分組丟失時(shí),通過利用音 頻錯(cuò)誤隱藏處理來生成用于被隱藏音頻的音頻數(shù)據(jù),從而防止音頻質(zhì) 量降低的方法。在文獻(xiàn)1中,作為音頻錯(cuò)誤隱藏處理,就在丟失的音 頻分組之前或之后的分組被復(fù)制。作為在音頻分組發(fā)送器一側(cè)使用的音頻編碼方法的實(shí)例,用于生 成具有編碼效率的音頻編碼數(shù)據(jù)流的方法是已知的,其中該編碼效率 基于音頻存在的確定而改變。
作為在音頻分組發(fā)送器側(cè)使用的音頻編碼方法的另一個(gè)實(shí)例,用 于周期地或者每次關(guān)于環(huán)境背景噪聲(后面,將關(guān)于背景噪聲的信息 稱為噪聲)的信息更新時(shí),生成音頻編碼數(shù)據(jù)流的方法也是已知的。
作為在音頻分組發(fā)送器一側(cè)使用的音頻編碼方法的再一個(gè)實(shí)例, 在非專利文獻(xiàn)2中公開的基于音頻存在的確定,僅僅將當(dāng)音頻存在或 者當(dāng)噪聲發(fā)生時(shí)所生成的音頻編碼數(shù)據(jù)流封包、并且將該音頻分組發(fā) 送到分組通信網(wǎng)絡(luò)、并且當(dāng)沒有音頻出現(xiàn)時(shí)不發(fā)送該音頻分組的方法 是已知的。
然而,在專利文獻(xiàn)1中所公開的技術(shù)具有如下所述的問題。
第一個(gè)問題是,因?yàn)楦鶕?jù)音頻編碼方法,甚至根據(jù)在音頻分組發(fā) 送器側(cè)使用的傳送規(guī)范,并不一定以周期的方式發(fā)送時(shí)間軸連續(xù)的音 頻分組,所以,即使在檢測到分組丟失之前和之后,在音頻分組接收 器側(cè)復(fù)制音頻分組,該技術(shù)也不足以恢復(fù)降低的音頻質(zhì)量。
第二個(gè)問題是,不管在用于被隱藏音頻的音頻數(shù)據(jù)之后的音頻數(shù) 據(jù)的存在與否(即,在時(shí)間軸上的未來方向),基于預(yù)定的增益值或 預(yù)定的衰減因數(shù)而執(zhí)行音頻錯(cuò)誤隱藏處理。因此,過大或過小的衰減 將不足以減少可聽的音頻質(zhì)量的降低。日本未審查專利申請(qǐng)公開No.2005-157045 [非專禾'J文獻(xiàn)1] Schulzrinne, H., Casner, S., Frederick, R., Jacobson, V.m "RTP: A Transport Protocol for Real-Time Applications", RFC3550, 2003年7月,[平成19年(2007年)6月27日檢索]Internet<URL :http :〃www. ietf, or g/rfc/rfc3 5 5 0 .txt> Sjoberg, J., Westerlund, M., Lakaniemi, A" Xie, Q.,V.m "Real-Time Transport Protocol (RTP) Payload Format and FileStorage Format for the Adaptive Multi-Rate (AMR) and AdaptiveMulti-Rate Wideband (AMR-WB) Audio Codec", RFC3267, 2002年6月,[平成 19 年 (2007 年)6 月 27 日檢索]Internet<URL:http:〃www.ietf.org/rfc/rfc3267.txt>
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種音頻分組接收器、音頻分組接收方法以及用于其的程序,其能夠減輕在音頻錯(cuò)誤隱藏處理中的音頻質(zhì)量降低
的上述問題。
為了達(dá)到上述目的,根據(jù)本發(fā)明的音頻分組接收器是音頻分組接收器,當(dāng)檢測到分組丟失時(shí),該音頻分組接收器執(zhí)行
用于生成用于被隱藏音頻的音頻數(shù)據(jù)的音頻錯(cuò)誤隱藏處理,其特征在
于包括
緩沖單元,其從音頻分組中提取音頻編碼數(shù)據(jù),并且將所提取的音頻編碼數(shù)據(jù)存儲(chǔ)到緩沖器中,并且該緩沖單元還檢測分組丟失;
距離計(jì)算單元,其計(jì)算在所述緩沖器中檢測到分組丟失的位置和存儲(chǔ)下一個(gè)音頻編碼數(shù)據(jù)的位置之間的距離;
控制單元,其基于在所述距離計(jì)算單元計(jì)算得的距離,來確定用
于被隱藏音頻的音頻數(shù)據(jù)的增益值;以及
解碼單元,其基于通過所述控制單元確定的用于被隱藏音頻的音
頻數(shù)據(jù)的增益值,來執(zhí)行音頻錯(cuò)誤隱藏處理。
為了達(dá)到上述目的,根據(jù)本發(fā)明的音頻分組接收方法是由當(dāng)檢測到分組丟失時(shí),執(zhí)行用于生成用于被隱藏音頻的音頻數(shù)
據(jù)的音頻錯(cuò)誤隱藏處理的音頻分組接收器所執(zhí)行的音頻分組接收方
法,其特征在于包括通過從音頻分組提中取音頻編碼數(shù)據(jù)并且將所提取的音頻編碼數(shù)據(jù)存儲(chǔ)到緩沖單元中來檢測分組丟失,并且然后檢測分組丟失;
計(jì)算在所述緩沖器中檢測到分組丟失的位置和存儲(chǔ)下一個(gè)音頻編碼數(shù)據(jù)的位置之間的距離;
基于所述計(jì)算得的距離,確定用于被隱藏音頻的音頻數(shù)據(jù)的增益值;并且
基于所述確定的用于被隱藏音頻的音頻數(shù)據(jù)的增益值,執(zhí)行音頻錯(cuò)誤隱藏處理。
為了達(dá)到上述目的,根據(jù)本發(fā)明的程序的特征在于,使得當(dāng)檢測到分組丟失時(shí),執(zhí)行用于生成用于被隱藏音頻的音頻數(shù)據(jù)的音頻錯(cuò)誤隱藏處理的計(jì)算機(jī)執(zhí)行
通過從音頻分組中提取音頻編碼數(shù)據(jù)并且將所提取的音頻編碼數(shù)據(jù)存儲(chǔ)到緩沖單元中來檢測分組丟失,并且然后檢測分組丟失;
計(jì)算在所述緩沖器中檢測到分組丟失的位置和存儲(chǔ)下一個(gè)音頻編碼數(shù)據(jù)的位置之間的距離;
基于所述計(jì)算得的距離,確定用于被隱藏音頻的音頻數(shù)據(jù)的增益值;并且
基于所述確定的用于被隱藏音頻的音頻數(shù)據(jù)的增益值,執(zhí)行音頻錯(cuò)誤隱藏處理。
根據(jù)在所述緩沖器中檢測到分組丟失的位置和存儲(chǔ)下一個(gè)音頻編碼數(shù)據(jù)的位置之間的距離,本發(fā)明調(diào)節(jié)當(dāng)檢測到分組丟失時(shí)在音頻錯(cuò)誤隱藏處理中生成的用于被隱藏音頻的音頻數(shù)據(jù)的增益值。
具體地,由于本發(fā)明通過考慮到跟隨在用于被隱藏音頻的音頻數(shù)據(jù)之后的音頻數(shù)據(jù)的距離(即,在時(shí)間軸上的未來方向)來執(zhí)行音頻錯(cuò)誤隱藏處理,因此其能夠防止設(shè)置過大或過小的增益值。
從而,本發(fā)明具有減輕對(duì)人耳的音頻質(zhì)量的降低,而不被任何音頻分組發(fā)送器的發(fā)送操作所影響的優(yōu)點(diǎn)。
圖1是示出了根據(jù)本發(fā)明的第一示例性實(shí)施例的音頻分組接收器的結(jié)構(gòu)的方框圖2是用于圖示出本發(fā)明的第一示例性實(shí)施例的優(yōu)點(diǎn)的示意圖3是示出了根據(jù)本發(fā)明的第二示例性實(shí)施例的音頻分組接收器
的結(jié)構(gòu)的方框圖4是示出了根據(jù)本發(fā)明的第三示例性實(shí)施例的音頻分組接收器的結(jié)構(gòu)的方框圖。
具體實(shí)施例方式
將參考附圖在下面描述用于實(shí)施本發(fā)明的最佳模式。
(第一示例性實(shí)施例)如圖1所示,該示例性實(shí)施例的音頻分組接收器包括第一緩沖
單元101,用于從作為RTP包的音頻分組中提取音頻編碼數(shù)據(jù),并且將所提取的音頻編碼數(shù)據(jù)存儲(chǔ)到緩沖器中,并且還用于檢測分組丟失;距離計(jì)算單元102,用于計(jì)算在所述緩沖器中檢測到分組丟失的位置和存儲(chǔ)下一個(gè)音頻編碼數(shù)據(jù)的位置之間的距離;第一控制單元103,用于基于由距離計(jì)算單元102計(jì)算的距離,來確定在音頻錯(cuò)誤隱藏處理中生成的用于被隱藏音頻的音頻數(shù)據(jù)的增益值;以及解碼單元104,用于當(dāng)沒有檢測到分組丟失時(shí),將音頻編碼數(shù)據(jù)解碼,并且用于當(dāng)在第一緩沖單元101中檢測到分組丟失時(shí),基于用于由第一控制單元103所確定的被隱藏音頻的音頻數(shù)據(jù)的增益值,來執(zhí)行音頻錯(cuò)誤隱藏處理。這里,所述增益值指的是與最終生成的音頻數(shù)據(jù)的音量有關(guān)的參數(shù)。下文所用的衰減因數(shù)也是一種增益值。
在該示例性實(shí)施例中,每個(gè)上述部件具體地執(zhí)行下面的操作。假設(shè)通過音頻分組接收器和對(duì)應(yīng)的音頻分組發(fā)送器之間的交互,提前確定了用于音頻分組的音頻編碼方法。在本發(fā)明中,不特別地限制音頻分組接收器和音頻分組發(fā)送器之間的交互的方法,并且可以使用諸如
基于在非專利文獻(xiàn)3 (Handley, M., Schulzrinne, H., Schooler, E.,Rosenberg, J., "SIP: Session Initiation Protocol", RFC2543, March 1999,[平成 19 年 (2007 ) 年 6 月 27 日檢索]Internet<URL:http:〃www.ietf.org/rfc/rfc2543.txt>)中所公開的SIP (會(huì)話初始協(xié)議),或基于H.223的方法,或者其他獨(dú)特的方法。
當(dāng)?shù)谝痪彌_單元101接收音頻分組時(shí),它根據(jù)預(yù)定的音頻編碼方法,以音頻編碼數(shù)據(jù)為單元,分離音頻分組。第一緩沖單元101根據(jù)下面信息中的至少一條,將音頻編碼數(shù)據(jù)存儲(chǔ)到緩沖器中在音頻分組的RTP報(bào)頭中的RTP序列號(hào)、RTP時(shí)間戳值、標(biāo)記位以及RTP載荷時(shí)間值(在下文中,將它們總稱為RTP報(bào)頭信息)。
由于當(dāng)沒有檢測到噪聲時(shí),其中分組沒有被發(fā)送的音頻分組發(fā)送器的操作,RTP序列號(hào)或RTP時(shí)間戳值跳過,在分組通信網(wǎng)絡(luò)中分組丟失,或者由于分組通信網(wǎng)絡(luò)的波動(dòng)而序列變化。這里,假設(shè)在上述情況下,第一緩沖單元101具有根據(jù)在緩沖器頭部的位置處的音頻編碼數(shù)據(jù)的存在與否(是否接收到音頻編碼數(shù)據(jù))而檢測分組丟失的功能。
當(dāng)?shù)谝痪彌_單元101從第一控制單元103接收獲取分組丟失發(fā)生信息的指令時(shí),其將計(jì)算緩沖器頭部的位置和存儲(chǔ)的下一個(gè)音頻編碼數(shù)據(jù)的位置之間距離的指令輸出到距離計(jì)算單元102。第一緩沖單元IOI校驗(yàn)緩沖器頭部的位置。如果音頻編碼數(shù)據(jù)存在于頭位置處,則第一緩沖單元101判斷沒有發(fā)生分組丟失,并且將表示沒有檢測到分組丟失的分組丟失發(fā)生信息輸出到第一控制單元103。如果在頭位置處不存在音頻編碼數(shù)據(jù),那么第一緩沖單元101判斷發(fā)生分組丟失,并且將表示已經(jīng)檢測到分組丟失的分組丟失發(fā)生信息和能夠從距離計(jì)算單元102獲取的距離信息輸出到第一控制單元103。僅當(dāng)已檢測到分組丟失時(shí),第一緩沖單元101向距離計(jì)算單元102
輸出指令。
當(dāng)沒有檢測到分組丟失時(shí),第一緩沖單元101將在緩沖器頭部的 位置處的音頻編碼數(shù)據(jù)輸出到解碼單元104。當(dāng)已檢測到分組丟失時(shí), 其將指示己經(jīng)檢測到分組丟失的分組丟失檢測信息輸出到解碼單元 104。
當(dāng)距離計(jì)算單元102從第一緩沖單元101接收計(jì)算指令時(shí),其計(jì) 算緩沖器頭部的位置和存儲(chǔ)的下一個(gè)音頻編碼數(shù)據(jù)的位置之間的距 離,并且將表示計(jì)算結(jié)果的距離信息輸出到第一緩沖單元101。
這里,所述距離信息是指表示RTP時(shí)間戳值的差值或相當(dāng)于該差 值的值的信息。具體地,該距離信息是指表示在緩沖器頭部的位置處 的RTP時(shí)間戳值和存儲(chǔ)的下一個(gè)音頻編碼數(shù)據(jù)的RTP時(shí)間戳值之間的 差值的信息。
如果該存儲(chǔ)的下一個(gè)音頻編碼數(shù)據(jù)不存在,則所述距離信息可以 是表示沒有音頻編碼數(shù)據(jù)存在的值,例如,存儲(chǔ)在緩沖器中的范圍之 外的超大值。
在相對(duì)應(yīng)的音頻分組發(fā)送器執(zhí)行用于發(fā)送音頻分組的非間斷發(fā)送 操作而不管音頻是否存在的情況下,基于在緩沖器頭部的位置處的RTP 序列號(hào)和下一個(gè)存儲(chǔ)的音頻編碼數(shù)據(jù)的RTP序列號(hào)之間的差值,如果 能夠由RTP時(shí)間戳值的差值獲得相當(dāng)于所述距離信息的信息,那么 RTP序列號(hào)的差值可以用于距離信息。
第一控制單元103以預(yù)定的循環(huán)向緩沖單元101輸出獲取分組丟 失發(fā)生信息的指令。如果第一控制單元103從第一緩沖單元101獲取表示沒有檢測到
分組丟失的所述分組丟失發(fā)生信息,那么其輸出指令到解碼單元104 以解碼所述音頻編碼數(shù)據(jù)。如果第一控制單元103從第一緩沖單元101 獲取表示已經(jīng)檢測到分組丟失的所述分組丟失發(fā)生信息并且獲取所述 距離信息,那么其基于該距離信息來確定用于在音頻錯(cuò)誤隱藏處理中 所生成的被隱藏音頻的音頻數(shù)據(jù)的增益值,并且輸出表示確定的結(jié)果 的增益值信息和解碼指令到解碼單元104。
這里,假設(shè)增益值信息位于例如從O到1的范圍中。如果該值是1, 那么其表示音頻編碼數(shù)據(jù)將被解碼,使得增益值變成與音頻數(shù)據(jù)相對(duì) 應(yīng),該音頻數(shù)據(jù)是通過解碼單元104先前解碼所獲得的。如果該值是0, 那么其表示將用預(yù)定的增益值對(duì)音頻編碼數(shù)據(jù)解碼。如果該值是0和1
之間的平均值,那么其表示音頻編碼數(shù)據(jù)將被解碼,使得增益值變成 音頻數(shù)據(jù)乘以該平均值,該音頻數(shù)據(jù)是先前解碼所獲得的。
當(dāng)?shù)谝豢刂茊卧?03從第一緩沖單元101獲取表示己檢測到分組 丟失的分組丟失發(fā)生信息并且獲取距離信息時(shí),由于緩沖器頭部的位 置和下一個(gè)存儲(chǔ)的音頻編碼數(shù)據(jù)之間的距離較短,所以其將增益值設(shè) 為接近于l;且由于基于該距離信息的距離變長,其將增益值設(shè)為接近 于0。
上述增益值信息僅僅是個(gè)例子。例如,該增益值信息可以通過其 相對(duì)于預(yù)先設(shè)置到解碼單元104的增益值的變化率來表示(將在后面 描述)或者該增益值信息可以通過相當(dāng)于變化率的值來表示,而沒有 任何限制。
將存在于緩沖器頭部的位置處的音頻編碼數(shù)據(jù)或者就是分組丟失 檢測信息從第一緩沖單元101輸入到解碼單元104中。將解碼指令從 第一控制單元103輸入到解碼單元104。如果已經(jīng)檢測到分組丟失,那
12么增益值信息也被從第一控制單元103輸入到解碼單元104。
如果從第一緩沖單元101輸入音頻編碼數(shù)據(jù),那么解碼單元104 根據(jù)預(yù)定的音頻編碼方法來解碼音頻編碼數(shù)據(jù),并且輸出解碼的數(shù)據(jù)。 如果從第一緩沖單元101輸入分組丟失檢測信息,那么解碼單元104 通過基于從第一控制單元103輸入的增益值信息而執(zhí)行音頻錯(cuò)誤隱藏 處理,來生成用于被隱藏音頻的音頻數(shù)據(jù),并且輸出所生成的音頻數(shù) 據(jù)。
如上所述,在該示例性實(shí)施例中,根據(jù)在緩沖器中檢測到分組丟 失的位置和存儲(chǔ)下一個(gè)音頻編碼數(shù)據(jù)的位置之間的距離,調(diào)節(jié)在音頻 錯(cuò)誤隱藏處理中生成的用于被隱藏音頻的音頻數(shù)據(jù)的增益值。
具體地,由于該示例性實(shí)施例通過考慮到直到在用于被隱藏音頻 的音頻數(shù)據(jù)之后的音頻數(shù)據(jù)的距離(即,在時(shí)間軸上的未來方向)而 執(zhí)行音頻錯(cuò)誤隱藏處理,其能夠防止設(shè)置過大或過小的增益值。
從而,該示例性實(shí)施例具有減輕對(duì)人耳的音頻質(zhì)量的降低,而不 被任何音頻分組發(fā)送器的發(fā)送操作所影響的優(yōu)點(diǎn)。
現(xiàn)在,通過將本實(shí)施例與沒有考慮到在緩沖器中的狀態(tài)(在下文 中,稱作比較的對(duì)象)的情況作比較,參考圖2來進(jìn)一步詳細(xì)描述該 示例性實(shí)施例的優(yōu)點(diǎn)。這里,當(dāng)連續(xù)地執(zhí)行音頻錯(cuò)誤隱藏處理時(shí),用 于逐漸減小用于被隱藏音頻的音頻數(shù)據(jù)的增益值的方法被作為比較對(duì) 象的例子。
圖2的上部示出了音頻編碼數(shù)據(jù)是如何存儲(chǔ)到第一緩沖單元101 的緩沖器中的。在該實(shí)例中,假設(shè)根據(jù)在音頻分組的RTP報(bào)頭中的RTP 時(shí)間戳值,音頻編碼數(shù)據(jù)被排列并且存儲(chǔ)在緩沖器中。在該實(shí)例中, 橫坐標(biāo)表示時(shí)間戳值。在該實(shí)例中,假設(shè)存儲(chǔ)音頻編碼數(shù)據(jù)#2、 #3和#5的音頻分組在它們所經(jīng)過的通信網(wǎng)絡(luò)中丟失。這里,在每個(gè)時(shí)間點(diǎn) 處的緩沖器頭部的位置用符號(hào)" "標(biāo)記出。
圖2的下部,就在各音頻編碼數(shù)據(jù)之下,示出了通過傳統(tǒng)的實(shí)例
以及通過示例性實(shí)施例所獲得的音頻數(shù)據(jù)的各實(shí)例。圖2示出了用于
各音頻采樣值的一些波形,其各個(gè)振幅值用直線連接。為了附圖的簡
潔,僅僅第一Nth音頻編碼數(shù)據(jù)與波形伴隨對(duì)應(yīng),而其后的每種音頻數(shù) 據(jù)的情況只與表示解碼單元的框形(矩形)伴隨對(duì)應(yīng),而省略了波形。 而且,為了附圖和說明書的簡潔,假設(shè)將分別由接收和解碼音頻編碼 數(shù)據(jù)#1至#6得出相同的增益值(振幅)。
比較的對(duì)象使音頻編碼數(shù)據(jù)#1的增益值G(B1)以及替代音頻編碼 數(shù)據(jù)#2和#3的被隱藏音頻的音頻數(shù)據(jù)的增益值G(B2)和G(B3)衰減, 使得增益值是G(B1) > G(B2) > G(B3)。
相反地,該示例性實(shí)施例以下面的方式生成替代音頻編碼數(shù)據(jù)#2 的被隱藏音頻的音頻數(shù)據(jù)A2:第一,其計(jì)算在時(shí)間(第N+1個(gè)周期) 處緩沖器中頭部的位置和下一個(gè)音頻編碼數(shù)據(jù)#4所存儲(chǔ)的位置之間的 距離。這里,其判斷這些位置不是彼此遠(yuǎn)離,并且通過抑制增益值的 衰減來生成音頻數(shù)據(jù)A2。具體地,其生成音頻數(shù)據(jù)A2,使得增益值結(jié) 果是G(A2)〉G(B2)。
類似地,該示例性實(shí)施例以下面的方式生成替代音頻編碼數(shù)據(jù)弁3 的被隱藏音頻所用的音頻數(shù)據(jù)A3:第一,其計(jì)算在時(shí)間(第N+2個(gè)周 期)處緩沖器中頭部的位置和下一個(gè)音頻編碼數(shù)據(jù)#4所存儲(chǔ)的位置之 間的距離。這里,由于下一個(gè)音頻編碼數(shù)據(jù)#4就在緩沖器中頭部的位 置之后,該示例性實(shí)施例生成具有與音頻數(shù)據(jù)A3的增益值相同的增益 值的音頻數(shù)據(jù)A3。具體地,其生成音頻數(shù)據(jù)A3,使得增益值結(jié)果是 G(A3)>G(B3)。該實(shí)施例還以同樣的方式生成替代音頻編碼數(shù)據(jù)#5的 被隱藏音頻所用的音頻數(shù)據(jù)A5。如上所述,通過根據(jù)與下一個(gè)音頻數(shù)據(jù)A4的距離而確定用于被隱
藏音頻的音頻數(shù)據(jù)A2和A3的增益值G(A2)和G(A3),本實(shí)施例能夠 抑制音頻數(shù)據(jù)A2和A3的增益值G(A2)和G(A3)的過大衰減。
(第二示例性實(shí)施例) 如圖3所示,該示例性實(shí)施例的音頻分組接收器包括第二緩沖 單元201,用于從作為RTP分組的音頻分組中提取音頻編碼數(shù)據(jù),并 且將所提取的音頻編碼數(shù)據(jù)存儲(chǔ)到緩沖器中,并且還用于檢測分組丟 失;距離計(jì)算單元102,用于計(jì)算在所述緩沖器中檢測到分組丟失的位 置和存儲(chǔ)下一個(gè)音頻編碼數(shù)據(jù)的位置之間的距離;增益計(jì)算單元202, 用于計(jì)算在緩沖器中的下一個(gè)存儲(chǔ)的音頻編碼數(shù)據(jù)的增益值(音量); 第二控制單元203,用于基于由距離計(jì)算單元102所計(jì)算的距離以及由 增益計(jì)算單元202所計(jì)算的增益值,來確定在音頻錯(cuò)誤隱藏處理中生 成的用于被隱藏音頻的音頻數(shù)據(jù)的增益值;以及解碼單元104,用于當(dāng) 沒有檢測到分組丟失時(shí),解碼音頻編碼數(shù)據(jù),并且用于當(dāng)在第二緩沖 單元201中檢測到分組丟失時(shí),基于用于由第二控制單元203所確定 的被隱藏音頻的音頻數(shù)據(jù)的增益值來執(zhí)行音頻錯(cuò)誤隱藏處理。
在該示例性實(shí)施例中,每個(gè)上述部件具體地執(zhí)行下面的操作。將 主要描述與第一示例性實(shí)施例中不同的那些單元。
當(dāng)?shù)诙彌_單元201從第二控制單元203接收指令以獲取分組丟 失發(fā)生信息時(shí),在監(jiān)測到緩沖器頭部的位置以及在第一示例性實(shí)施例 中描述的距離信息和在第一實(shí)施例中描述的分組丟失發(fā)生信息之后, 其將下一個(gè)存儲(chǔ)的音頻編碼數(shù)據(jù)輸出到第二控制單元203。
增益計(jì)算單元202執(zhí)行如下(A)或(B)的處理。
(A)將從第二控制單元203輸入的音頻編碼數(shù)據(jù)解碼,并且生成音頻數(shù)據(jù)。然后,計(jì)算第一增益值,其是音頻數(shù)據(jù)的增益值,并且將 表示計(jì)算結(jié)果的第一增益值信息輸出到第二控制單元204。
(B)通過從由第二控制單元203輸入的音頻編碼數(shù)據(jù)中提取增益 值編碼信息,該增益值是音頻數(shù)據(jù)的增益值,并且解碼所提取的增益 值編碼信息,而獲取第一增益值。然后,將表示該第一增益值的第一 增益值信息輸出到第二控制單元203。
在(A)的情況中, 一些音頻編碼方法存儲(chǔ)過去的解碼信息。如果 使用這樣的方法,當(dāng)增益計(jì)算單元202將信息解碼時(shí),為了防止解碼 被音頻中斷所影響,重置過去的解碼信息必須每次都被重置。
而且,在(A)的情況中,不具體限制用于計(jì)算第一增益值的方法。
在(B)的情況中,假設(shè)在音頻分組發(fā)送器處,增益值編碼信息被 植入到音頻編碼數(shù)據(jù)中。
第二控制單元203以預(yù)定的循環(huán)向第二緩沖單元201輸出獲取分 組丟失發(fā)生信息的指令。
在第二控制單元203已經(jīng)從第二緩沖單元201獲得分組丟失發(fā)生 信息、距離信息和下一個(gè)存儲(chǔ)的音頻編碼數(shù)據(jù)之后,其將下一個(gè)存儲(chǔ) 的音頻編碼數(shù)據(jù)輸出到增益計(jì)算單元202,并且從增益計(jì)算單元202獲 取第一增益值信息。
當(dāng)?shù)诙刂茊卧?03從第二緩沖單元201獲得表示已經(jīng)檢測到分 組丟失的分組丟失發(fā)生信息并且獲得距離信息時(shí),其確定第二增益值, 該第二增益值是用于在音頻錯(cuò)誤隱藏處理中生成的被隱藏音頻的音頻 數(shù)據(jù)的增益值,并且輸出表示確定結(jié)果的第二增益值信息和解碼指令 到解碼單元104。這里,假設(shè)第二增益值位于例如從O到1的范圍中。如果該值是1, 那么這表示音頻編碼數(shù)據(jù)將被解碼,使得增益值變成與通過解碼單元 104在先前解碼所獲得的音頻數(shù)據(jù)相對(duì)應(yīng)。如果該值是O,那么這表示 將用預(yù)定的增益值對(duì)音頻編碼數(shù)據(jù)解碼。如果該值是0和1之間的平 均值,那么表示音頻編碼數(shù)據(jù)將被解碼,使得增益值變成音頻數(shù)據(jù)與 該平均值的乘積,該音頻數(shù)據(jù)在先前的解碼所獲得的。
當(dāng)?shù)诙刂茊卧?03從第二緩沖單元201獲取表示己檢測到分組 丟失的分組丟失發(fā)生信息以及距離信息時(shí),由于緩沖器頭部的位置和 存儲(chǔ)的下一個(gè)音頻編碼數(shù)據(jù)之間的距離較短,所以其將第二增益值設(shè) 為接近于l;而由于基于距離信息的距離較長,其將增益值設(shè)為接近于 0。
此外,根據(jù)第一增益值信息,如果在下一個(gè)存儲(chǔ)的音頻編碼數(shù)據(jù) 中普遍識(shí)別到音頻的存在,那么第二控制單元203將第二增益值設(shè)置 為非常接近于1;而如果在下一個(gè)存儲(chǔ)的音頻編碼數(shù)據(jù)中沒有識(shí)別到音 頻的存在,那么第二控制單元203將第二增益值保留為基于距離信息 而設(shè)置的值。
上述第二增益值信息僅僅是個(gè)例子。例如,增益值信息可以由其 相對(duì)于預(yù)先設(shè)置到解碼單元104的增益值的變化率來表示,或者增益 值信息可以通過相當(dāng)于變化率的值來表示,而沒有任何限制。距離信 息和第一增益值信息每個(gè)貢獻(xiàn)于第二增益值信息的多少?zèng)]有限制。
如上所述,由于該示例性實(shí)施例通過考慮到存儲(chǔ)在緩沖器中的下 一個(gè)音頻編碼數(shù)據(jù)的增益值以及在第一示例性實(shí)施例中所描述的距離 信息來調(diào)節(jié)在音頻錯(cuò)誤隱藏處理中的增益值,所以其具有能夠進(jìn)一步 減輕對(duì)人耳的音頻質(zhì)量的降低的優(yōu)點(diǎn)。(第三示例性實(shí)施例) 如圖4所示,該示例性實(shí)施例的音頻分組接收器包括第三緩沖 單元301,用于從作為RTP分組的音頻分組中提取音頻編碼數(shù)據(jù),并 且將所提取的音頻編碼數(shù)據(jù)存儲(chǔ)到緩沖器中,并且還用于檢測分組丟 失;距離計(jì)算單元102,用于計(jì)算在所述緩沖器中檢測到分組丟失的位 置和存儲(chǔ)下一個(gè)音頻編碼數(shù)據(jù)的位置之間的距離;音頻類型確定單元 302,用于確定在緩沖器中的下一個(gè)存儲(chǔ)的音頻編碼數(shù)據(jù)的音頻類型; 第三控制單元303,用于基于由距離計(jì)算單元102所計(jì)算的距離以及由 音頻類型確定單元302所確定的音頻類型,來確定在音頻錯(cuò)誤隱藏處 理中所生成的用于被隱藏音頻的音頻數(shù)據(jù)的增益值(音量);以及解 碼單元104,用于當(dāng)沒有檢測到分組丟失時(shí),解碼音頻編碼數(shù)據(jù),并且 用于當(dāng)在第三緩沖單元301中檢測到分組丟失時(shí),基于用于由第三控 制單元303所確定的被隱藏音頻的音頻數(shù)據(jù)的增益值,來執(zhí)行音頻錯(cuò) 誤隱藏處理。
在該示例性實(shí)施例中,每個(gè)上述部件具體地執(zhí)行下面的操作。將 主要描述與第一示例性實(shí)施例中不同的那些單元。
當(dāng)?shù)谌彌_單元301從第三控制單元303接收指令以獲取分組丟 失發(fā)生信息時(shí),在監(jiān)測到緩沖器頭部的位置以及在第一示例性實(shí)施例 中描述的距離信息和在第一實(shí)施例中描述的分組丟失發(fā)生信息之后, 其將下一個(gè)存儲(chǔ)的音頻編碼數(shù)據(jù)輸出到第三控制單元303。
音頻類型確定單元302執(zhí)行下面(C)或(D)的過程。
(C)從由第三控制單元303輸入的音頻編碼數(shù)據(jù)中的幀信息,獲 取關(guān)于音頻編碼數(shù)據(jù)的比特率信息。然后,基于該比特率信息,確定 音頻編碼數(shù)據(jù)是否對(duì)應(yīng)于有聲、靜音或噪聲,并且將表示確定結(jié)果的 音頻類型信息輸出到第三控制單元303。輸入的音頻編碼數(shù)據(jù)的數(shù)據(jù)長度, 確定音頻編碼數(shù)據(jù)是否對(duì)應(yīng)于有聲、靜音或噪聲,并且將表示確定結(jié) 果的音頻類型信息輸出到第三控制單元303。
在(A)的情況下,假設(shè)在音頻分組發(fā)送器處利用多個(gè)壓縮率編碼 音頻數(shù)據(jù),假設(shè)比特率信息是對(duì)應(yīng)于有聲或者靜音或者噪聲的信息, 并且假設(shè)在音頻分組處將比特率信息植入音頻編碼數(shù)據(jù)中。例如,在 諸如AMR,、 G.723.K G.729的音頻編碼方法中,與比特率比對(duì)應(yīng)的 信息被作為音頻編碼數(shù)據(jù)的一部分而發(fā)送。
在(B)的情況中,假設(shè)數(shù)據(jù)長度是對(duì)應(yīng)于有聲或者靜音或者噪聲 的信息。
第三控制單元303以預(yù)定的循環(huán)向第三緩沖單元301輸出獲取分 組丟失發(fā)生信息的指令。
在第三控制單元303已經(jīng)從第三緩沖單元301獲得分組丟失發(fā)生 信息、距離信息和下一個(gè)存儲(chǔ)的音頻編碼數(shù)據(jù)之后,其將下一個(gè)存儲(chǔ) 的音頻編碼數(shù)據(jù)輸出到音頻類型確定單元302,并且從音頻類型確定單 元302獲取音頻類型信息。
當(dāng)?shù)谌刂茊卧?03從第三緩沖單元301獲得表示已經(jīng)檢測到分 組丟失的分組丟失發(fā)生信息并且獲得距離信息時(shí),其基于該距離信息, 確定用于在音頻錯(cuò)誤隱藏處理中生成的被隱藏音頻的音頻數(shù)據(jù)的增益 值,并且將表示確定結(jié)果的增益值信息和解碼指令輸出到解碼單元 104。
這里,假設(shè)該增益值信息位于例如從0到1的范圍中。如果該值 是l,那么其表示音頻編碼數(shù)據(jù)將被解碼,使得增益值變成等同于通過 解碼單元104在先前解碼所獲得的音頻數(shù)據(jù)。如果該值是O,那么其表
19示將用預(yù)定的增益值對(duì)音頻編碼數(shù)據(jù)解碼。如果該值是0和1之間的 平均值,那么其表示音頻編碼數(shù)據(jù)將被解碼,使得增益值變成音頻數(shù) 據(jù)與該平均值的乘積,該音頻數(shù)據(jù)是在先前解碼所獲得的。
當(dāng)?shù)谌刂茊卧?03從第三緩沖單元301獲取表示已檢測到分組
丟失的分組丟失發(fā)生信息并且獲取距離信息時(shí),由于緩沖器頭部的位 置和下一個(gè)存儲(chǔ)的音頻編碼數(shù)據(jù)的位置之間的距離較短,所以其將增
益值設(shè)為接近于l;而由于基于距離信息的距離較長,其將增益值設(shè)為 接近于0。
此外,第三控制單元303基于音頻類型信息執(zhí)行下面從(E)到(G) 過程的任意一個(gè)。
(E) 如果音頻信息類型對(duì)應(yīng)于有聲,則將增益值設(shè)為非常接近于1。
(F) 如果音頻信息類型對(duì)應(yīng)于靜音,則保留根據(jù)距離信息所設(shè)置 的增益值。
(G) 如果音頻信息類型對(duì)應(yīng)于噪聲,則將增益值設(shè)為(E) 、 (F) 或在(E)和(F)之間的任意值。
上述增益值信息僅僅是個(gè)例子。例如,增益值信息可以通過其相 對(duì)于預(yù)先設(shè)置到解碼單元104的增益值的變化率來表示,或者增益值 信息可以由相當(dāng)于變化率的值來表示,而沒有任何限制。距離信息和 音頻類型信息貢獻(xiàn)于增益值信息的多少?zèng)]有限制。
如上所述,由于該示例性實(shí)施例通過考慮到存儲(chǔ)在緩沖器中的下 一個(gè)音頻編碼數(shù)據(jù)的增益值以及在第一示例性實(shí)施例中所描述的距離 信息來調(diào)節(jié)在音頻錯(cuò)誤隱藏處理中的增益值,所以其具有能夠進(jìn)一步減輕對(duì)人耳的音頻質(zhì)量的降低的優(yōu)點(diǎn)。
盡管已經(jīng)參考示例性實(shí)施例描述了本發(fā)明,但是其不限于這些。 可以在不脫離本發(fā)明的范圍的前提下對(duì)本發(fā)明的構(gòu)造和細(xì)節(jié)進(jìn)行各種 修改,并且能夠被本領(lǐng)域技術(shù)人員所理解。
例如,本發(fā)明的音頻分組接收器能夠作為接收單元而安裝于終端 設(shè)備、或者安裝于網(wǎng)關(guān)設(shè)備,在該接收單元處,網(wǎng)關(guān)設(shè)備位于終端設(shè) 備之間,用于轉(zhuǎn)換它們之間的音頻編碼方法。
除了通過如上所述的專用的硬件裝置來實(shí)現(xiàn),本發(fā)明的音頻分組 接收器可以是這樣一種裝置,其將用于實(shí)現(xiàn)音頻分組接收器的功能的 程序記錄在計(jì)算機(jī)可讀記錄介質(zhì)上,并且使得計(jì)算機(jī)讀取并且執(zhí)行記 錄在記錄介質(zhì)上的程序。計(jì)算機(jī)可讀記錄介質(zhì)包括諸如軟盤、磁性光
盤和CD-ROM這樣的記錄介質(zhì),以及諸如集成在計(jì)算機(jī)中的硬盤設(shè)備 這樣的存儲(chǔ)介質(zhì)。計(jì)算機(jī)可讀記錄介質(zhì)還包括這樣一種裝置,該裝置 在互聯(lián)網(wǎng)(傳輸介質(zhì)或載波)上傳輸程序的情況下,短時(shí)間動(dòng)態(tài)地保 存程序,并且在該情況下將程序以特定的周期保存在用作服務(wù)器的計(jì) 算機(jī)內(nèi)的易失性存儲(chǔ)器中。
本申請(qǐng)要求基于2007年7月9日提交的日本專利申請(qǐng) No.2007-179450的優(yōu)先權(quán),并且在此將整個(gè)已公開的專利申請(qǐng)結(jié)合到 本專利申請(qǐng)中作為參考。
權(quán)利要求
1.一種音頻分組接收器,當(dāng)檢測到分組丟失時(shí),該音頻分組接收器執(zhí)行用于生成用于被隱藏音頻的音頻數(shù)據(jù)的音頻錯(cuò)誤隱藏處理,其特征在于包括緩沖單元,其從音頻分組中提取音頻編碼數(shù)據(jù)并且將所述提取的音頻編碼數(shù)據(jù)存儲(chǔ)到緩沖器中,并且該緩沖單元還檢測所述分組丟失;距離計(jì)算單元,其計(jì)算在所述緩沖器中檢測到所述分組丟失的位置和存儲(chǔ)下一個(gè)音頻編碼數(shù)據(jù)的位置之間的距離;控制單元,其基于在所述距離計(jì)算單元所計(jì)算的距離,來確定用于所述隱藏的音頻的音頻數(shù)據(jù)的增益值;以及解碼單元,其基于通過所述控制單元所確定的所述用于被隱藏音頻的音頻數(shù)據(jù)的所述增益值來執(zhí)行所述音頻錯(cuò)誤隱藏處理。
2. 根據(jù)權(quán)利要求l所述的音頻分組接收器,還包括 增益計(jì)算單元,其計(jì)算所述下一個(gè)音頻編碼數(shù)據(jù)的增益值, 其中所述控制單元基于由所述距離計(jì)算單元計(jì)算的所述距離以及由所述增益計(jì)算單元計(jì)算的所述增益值,來確定所述用于被隱藏音頻 的音頻數(shù)據(jù)的所述增益值。
3. 根據(jù)權(quán)利要求1所述的音頻分組接收器,還包括 音頻類型確定單元,其基于所述下一個(gè)音頻編碼數(shù)據(jù)的比特率或數(shù)據(jù)長度,來確定所述下一個(gè)音頻編碼數(shù)據(jù)對(duì)應(yīng)于有聲、無聲或噪聲 中的哪一個(gè),其中所述控制單元基于由所述距離計(jì)算單元計(jì)算的距離和由所述 音頻類型確定單元所確定的音頻類型,來確定所述用于被隱藏音頻的 音頻數(shù)據(jù)的增益值。
4. 根據(jù)權(quán)利要求1至3中的任意一個(gè)的音頻分組接收器,其中 所述音頻分組是RTP分組,并且其中所述距離計(jì)算單元基于在所述音頻分組的RTP報(bào)頭中的RTP 時(shí)間戳值或RTP序列號(hào)來計(jì)算所述距離。
5. —種由音頻分組接收器執(zhí)行的音頻分組接收方法,當(dāng)檢測到分 組丟失時(shí),該音頻分組接收器執(zhí)行用于生成用于被隱藏音頻的音頻數(shù) 據(jù)的音頻錯(cuò)誤隱藏處理,其特征在于,所述音頻分組接收方法包括通過從音頻分組中提取音頻編碼數(shù)據(jù)并且將所提取的音頻編碼數(shù) 據(jù)存儲(chǔ)到緩沖器中,來檢測分組丟失,并且然后檢測所述分組丟失;計(jì)算在所述緩沖器中的檢測到所述分組丟失的位置和存儲(chǔ)下一個(gè)音頻編碼數(shù)據(jù)的位置之間的距離;基于所述計(jì)算的距離來確定用于所述隱藏的音頻的音頻數(shù)據(jù)的增 益值;并且基于用于所述隱藏的音頻的音頻數(shù)據(jù)的所述確定的增益值,來執(zhí) 行所述音頻錯(cuò)誤隱藏處理。
6. 根據(jù)權(quán)利要求5所述的音頻數(shù)據(jù)接收方法,還包括 計(jì)算所述下一個(gè)音頻編碼數(shù)據(jù)的增益值,其中所述確定增益值包括基于所述計(jì)算的距離和所述計(jì)算的增 益值,來確定用于所述隱藏的音頻的音頻數(shù)據(jù)的增益值。
7. 根據(jù)權(quán)利要求5所述的音頻數(shù)據(jù)接收方法,還包括 基于所述下一個(gè)音頻編碼數(shù)據(jù)的比特率或數(shù)據(jù)長度,來確定所述下一個(gè)音頻編碼數(shù)據(jù)對(duì)應(yīng)于有聲、無聲或噪聲中的哪一個(gè),其中所述確定增益值包括基于所述計(jì)算的距離和所述確定的音 頻類型,來確定用于所述隱藏的音頻的音頻數(shù)據(jù)的增益值。
8. 根據(jù)權(quán)利要求5至7中的任意一個(gè)所述的音頻數(shù)據(jù)接收方法,其中所述音頻分組是RTP分組,并且其中所述距離計(jì)算包括基于在所述音頻分組的RTP報(bào)頭中的RTP時(shí)間戳值或RTP序列號(hào)來計(jì)算所述距離。
9. 一種程序,該程序使得計(jì)算機(jī)來執(zhí)行以下操作,當(dāng)檢測到分 組丟失時(shí),該計(jì)算機(jī)執(zhí)行用于生成用于被隱藏音頻的音頻數(shù)據(jù)的音頻錯(cuò)誤隱藏處理通過從音頻分組中提取音頻編碼數(shù)據(jù)并且將所提取的音頻編碼數(shù)據(jù)存儲(chǔ)到緩沖單元中來檢測分組丟失,并且然后檢測所述分組丟失; 計(jì)算在所述緩沖器中的檢測到分組丟失的位置和存儲(chǔ)下一個(gè)音頻編碼數(shù)據(jù)的位置之間的距離;基于所述計(jì)算的距離,來確定用于所述隱藏的音頻的音頻數(shù)據(jù)的增益值;并且基于用于所述隱藏的音頻的音頻數(shù)據(jù)的所述確定的增益值,來執(zhí) 行所述音頻錯(cuò)誤隱藏處理。
10. 根據(jù)權(quán)利要求9所述的程序,進(jìn)一步使得所述計(jì)算機(jī)執(zhí)行 計(jì)算所述下一個(gè)音頻編碼數(shù)據(jù)的增益值,其中所述確定增益值包括基于所述計(jì)算的距離和所述計(jì)算的增 益值,來確定用于所述隱藏的音頻的音頻數(shù)據(jù)的增益值。
11. 根據(jù)權(quán)利要求9所述的程序,進(jìn)一步使得所述計(jì)算機(jī)執(zhí)行基于所述下一個(gè)音頻編碼數(shù)據(jù)的比特率或數(shù)據(jù)長度,來確定所述 下一個(gè)音頻編碼數(shù)據(jù)對(duì)應(yīng)于有聲、無聲或噪聲中的哪一個(gè),其中所述確定增益值包括基于所述計(jì)算的距離和所述確定的音 頻類型,來確定用于所述隱藏的音頻的音頻數(shù)據(jù)的增益值。
12. 根據(jù)權(quán)利要求9至11中的任意一個(gè)所述的程序,其中所述音頻分組是RTP分組,并且其中所述距離計(jì)算包括基于在所述音頻分組的RTP報(bào)頭中的 RTP時(shí)間戳值或RTP序列號(hào)來計(jì)算所述距離。
全文摘要
本發(fā)明涉及一種音頻錯(cuò)誤隱藏裝置,其應(yīng)用于當(dāng)檢測到分組丟失時(shí),執(zhí)行用于生成用于被隱藏音頻的音頻數(shù)據(jù)的音頻錯(cuò)誤隱藏處理的音頻分組接收器。根據(jù)本發(fā)明的音頻分組接收器包括第一緩沖單元(101),用于從作為RTP包的音頻分組提取音頻編碼數(shù)據(jù),并且將提取的音頻編碼數(shù)據(jù)存儲(chǔ)到緩沖器中,并且還用于檢測分組丟失;距離計(jì)算單元(102),用于計(jì)算在所述緩沖器中檢測到分組丟失的位置和存儲(chǔ)下一個(gè)音頻編碼數(shù)據(jù)的位置之間的距離;第一控制單元(103),用于基于通過距離計(jì)算單元(102)計(jì)算得的距離來確定生成于音頻錯(cuò)誤隱藏處理中的用于被隱藏音頻的音頻數(shù)據(jù)的增益值;以及解碼單元(104),用于基于通過第一控制單元(103)所確定的用于被隱藏音頻的音頻數(shù)據(jù)的增益值來執(zhí)行音頻錯(cuò)誤隱藏處理。
文檔編號(hào)H04L1/00GK101689370SQ200880020959
公開日2010年3月31日 申請(qǐng)日期2008年5月22日 優(yōu)先權(quán)日2007年7月9日
發(fā)明者中澤達(dá)也, 小澤一范 申請(qǐng)人:日本電氣株式會(huì)社