專利名稱:處理多聲道音頻信號的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號處理領(lǐng)域,特別涉及對多聲道音頻信號的處理領(lǐng)域。
背景技術(shù):
當(dāng)前,雙聲道或者多聲道的音頻資料大量存在。其中,具有兩個(gè)聲道的音頻資料,比如立體聲音樂,是當(dāng)前使用最廣泛的音頻格式。這包括傳統(tǒng)的CD唱片,以及包括MP3,AAC, OGG等壓縮過的音樂碼流。雙聲道或立體聲以其足夠的音頻質(zhì)量和空間表現(xiàn)力,依然占據(jù)著極聞的比例。然而,一些小型的移動設(shè)備,由于設(shè)備空間或者制造成本的限制,往往只配置一個(gè)揚(yáng)聲器。這些只配置一個(gè)揚(yáng)聲器的移動設(shè)備可以是移動電話、個(gè)人數(shù)字助理(PDA,PerSonalDigital Assistant)、移動互聯(lián)網(wǎng)設(shè)備(MID,Mobile Internet Devices)、平板電腦或者小型筆記本電腦。這些設(shè)備在播放具有2個(gè)或更多個(gè)通道的音頻時(shí),必然需要將兩通道或多通道的音頻混合到單通道的音頻,以便讓其唯一的揚(yáng)聲器輸出?,F(xiàn)有最常用的音頻 處理方法是只提取其中一個(gè)通道的音頻信號進(jìn)行播放,或者取兩個(gè)通道的音頻的平均值,以得到單通道音頻。申請人:對現(xiàn)有的音頻處理方法進(jìn)行了深入研究,發(fā)現(xiàn)只提取其中一個(gè)通道的音頻信號進(jìn)行播放的方法在兩個(gè)通道內(nèi)容差異較大時(shí)會丟失大量信息。而將兩個(gè)或多個(gè)通道簡單疊加然后取平均值的方法會在兩聲道具有相互反相特性時(shí),音量突降。
發(fā)明內(nèi)容
本發(fā)明的發(fā)明人發(fā)現(xiàn),現(xiàn)有的音頻處理方法在特定情況會產(chǎn)生信息大量丟失或者音量突降的缺陷。因此,針對該問題提出了一種新的技術(shù)方案。本發(fā)明的一個(gè)目的是提供一種處理多聲道音頻信號的方法,能夠確保將多聲道音頻信號混合為單聲道音頻信號后不再出現(xiàn)信息丟失嚴(yán)重或者音量突降的問題。根據(jù)本發(fā)明的第一方面,提供了一種處理多聲道音頻信號的方法,該方法包括:將多聲道音頻信號中至少兩個(gè)聲道的音頻信號劃分為多個(gè)幀;基于正在處理的當(dāng)前幀中至少兩個(gè)聲道的音頻信號,獲得使表示混音效果的混音狀態(tài)函數(shù)獲得最大值的當(dāng)前幀的目標(biāo)混合因子,該混音狀態(tài)函數(shù)是至少兩個(gè)聲道的音頻信號和目標(biāo)混合因子的函數(shù);基于當(dāng)前幀的目標(biāo)混合因子獲得混合權(quán)重系數(shù);使用混合權(quán)重系數(shù)將當(dāng)前幀中至少兩個(gè)聲道的音頻信號混合為單聲道音頻信號。優(yōu)選地,前述至少兩個(gè)聲道為兩個(gè)聲道,每一幀包括N個(gè)音頻采樣點(diǎn),N是大于I的自然數(shù),Xl[n]和x2[n]分別是該兩個(gè)聲道的音頻信號在當(dāng)前幀中的第n個(gè)采樣點(diǎn)的信號值,n = I, 2, , N。前述獲得當(dāng)前幀的目標(biāo)混合因子的步驟可包括:使用M個(gè)預(yù)設(shè)混合因子中的每一個(gè)分別計(jì)算混音狀態(tài)函數(shù) 的值:
權(quán)利要求
1.一種處理多聲道音頻信號的方法,其特征在于,該方法包括: 將所述多聲道音頻信號中至少兩個(gè)聲道的音頻信號劃分為多個(gè)幀; 基于正在處理的當(dāng)前幀中所述至少兩個(gè)聲道的音頻信號,獲得使表示混音效果的混音狀態(tài)函數(shù)獲得最大值的當(dāng)前幀的目標(biāo)混合因子,所述混音狀態(tài)函數(shù)是所述至少兩個(gè)聲道的音頻信號和所述目標(biāo)混合因子的函數(shù); 基于所述當(dāng)前幀的目標(biāo)混合因子獲得混合權(quán)重系數(shù); 使用所述混合權(quán)重系數(shù)將所述當(dāng)前幀中所述至少兩個(gè)聲道的音頻信號混合為單聲道音頻信號。
2.如權(quán)利要求1所述的方法,其特征在于, 所述至少兩個(gè)聲道為兩個(gè)聲道, 每一幀包括N個(gè)音頻采樣點(diǎn),N是大于I的自然數(shù),X1W和x2[n]分別是所述兩個(gè)聲道的音頻信號在當(dāng)前幀中的第n個(gè)采樣點(diǎn)的信號值,n = 1,2,...,N, 所述獲得當(dāng)前幀的目標(biāo)混合因子的步驟包括: 使用M個(gè)預(yù)設(shè)混合因子中的每一個(gè)分別計(jì)算所述混音狀態(tài)函數(shù)的值:
3.如權(quán)利要求2所述的方法,其特征在于,所述多個(gè)預(yù)設(shè)混合因子的取值范圍為[-1,I]。
4.如權(quán)利要求2所述的方法,其特征在于,k=1、2、3或者4。
5.如權(quán)利要求2所述的方法,其特征在于,所述每一幀的長度設(shè)定為使得該幀的持續(xù)時(shí)間在10毫秒至1000毫秒之間。
6.如權(quán)利要求1或2所述的方法,其特征在于, 所述至少兩個(gè)聲道為兩個(gè)聲道, 每一幀包括N個(gè)音頻采樣點(diǎn),N是大于I的自然數(shù), 所述基于所述目標(biāo)混合因子獲得混合權(quán)重系數(shù)的步驟包括: 取N個(gè)中間混合因子,所述N個(gè)中間混合因子a/,a/ , a/以單調(diào)遞增或單調(diào)遞減的方式,從前一幀的目標(biāo)混合因子ax(fN-l),漸變到當(dāng)前幀的目標(biāo)混合因子ax(fN),其中,a/ = Mff”,a/ = a x (fN); 使用所述N個(gè)中間混合因子a/,Ci2'....,a/分別獲得該幀中所述兩個(gè)聲道的每一個(gè)音頻采樣點(diǎn)的信號值的混合權(quán)重系數(shù)。
7.如權(quán)利要求6所述的方法,其特征在于, 使用下述公式計(jì)算所述中間混合因子:
8.如權(quán)利要求7所述的方法,其特征在于,在區(qū)間[O,I]中,所述緩變函數(shù)w[n]在中部的梯度大于等于兩端的梯度。
9.如權(quán)利要求8所述的方法,其特征在于,所述緩變函數(shù)包括三角函數(shù)、高次多項(xiàng)式函數(shù)、對數(shù)函數(shù)和指數(shù)函數(shù)。
10.如權(quán)利要求6所述的方法,其特征在于,采用如下函數(shù)將所述兩個(gè)聲道的音頻信號混合為單聲道音頻信號: y[n] =g{(l-| a'n )Xl[n] + a'n X2[n]},其中,混合增益g為任意的正實(shí)數(shù)。
11.一種處理多聲道音頻信號的系統(tǒng),其特征在于,該系統(tǒng)包括: 分幀單元,用于將所述多聲道音頻信號中至少兩個(gè)聲道的音頻信號劃分為多個(gè)幀; 目標(biāo)混合因子獲得單元,用于基于正在處理的當(dāng)前幀中所述至少兩個(gè)聲道的音頻信號,獲得使表示混音效果的混音狀態(tài)函數(shù)獲得最大值的當(dāng)前幀的目標(biāo)混合因子,所述混音狀態(tài)函數(shù)是所述至少兩個(gè)聲道的音頻信號和所述目標(biāo)混合因子的函數(shù); 混合權(quán)重系數(shù)獲得單元,用于基于所述當(dāng)前幀的目標(biāo)混合因子獲得混合權(quán)重系數(shù);音頻信號混合單元,用于使用所述混合權(quán)重系數(shù)將所述當(dāng)前幀中所述至少兩個(gè)聲道的音頻信號混合為單聲道音頻信號。
12.如權(quán)利要求11所述的系統(tǒng),其特征在于, 所述至少兩個(gè)聲道為兩個(gè)聲道, 每一幀包括N個(gè)音頻采樣點(diǎn),N是大于I的自然數(shù),X1W和x2[n]分別是所述兩個(gè)聲道的音頻信號在當(dāng)前幀中的第n個(gè)采樣點(diǎn)的信號值,n = 1,2,...,N, 所述目標(biāo)混合因子獲得單元包括: 混音狀態(tài)函數(shù)計(jì)算模塊,用于使用M個(gè)預(yù)設(shè)混合因子中的每一個(gè)分別計(jì)算所述混音狀態(tài)函數(shù)的值:
13.如權(quán)利要求12所述的系統(tǒng),其特征在于,所述多個(gè)預(yù)設(shè)混合因子的取值范圍為[-1,I]。
14.如權(quán)利要求11所述的系統(tǒng),其特征在于,k= 1、2、3或者4。
15.如權(quán)利要求11所述的系統(tǒng),其特征在于,所述每一幀的長度設(shè)定為使得該幀的持續(xù)時(shí)間在10毫秒至1000毫秒之間。
16.如權(quán)利要求11或12所述的系統(tǒng),其特征在于, 所述至少兩個(gè)聲道為兩個(gè)聲道, 每一幀包括N個(gè)音頻采樣點(diǎn),N是大于I的自然數(shù), 所述混合權(quán)重系數(shù)獲得單元包括: 中間混合因子生成模塊,用于生成N個(gè)中間混合因子,所述N個(gè)中間混合因子a/,Ci2',...,aN'以單調(diào)遞增或單調(diào)遞減的方式,從前一幀的目標(biāo)混合因子ax(fN_l),漸變到當(dāng)前巾貞的目標(biāo)混合因子ax(fN),其中,a/ = ax(fN-l),aZ = a x(fN); 混合權(quán)重系數(shù)獲得模塊,用于使用所述N個(gè)中間混合因子a /,a/,...,aN'分別獲得該幀中所述兩個(gè)聲道的每一個(gè)音頻采樣點(diǎn)的信號值的混合權(quán)重系數(shù)。
17.如權(quán)利要求16所述的系統(tǒng),其特征在于, 所述中間混合因子生成模塊使用下述公式計(jì)算所述中間混合因子: a/ = a x(fN-D + a dw[n] n = 1,2, Na d = ax(fN)-ax(fN-l) 其中W[n]為單調(diào)遞增的緩變函數(shù),且w[l] =0,w[N] = I。
18.如權(quán)利要求17所述的系統(tǒng),其特征在于, 在區(qū)間
中,所述緩變函數(shù)w[n]在中部的梯度大于等于兩端的梯度,所述緩變函數(shù)包括三角函數(shù)、高次多項(xiàng)式函數(shù)、對數(shù)函數(shù)和指數(shù)函數(shù)。
19.如權(quán)利要求11所述的 系統(tǒng),其特征在于,所述音頻信號混合單元采用如下函數(shù)將所述兩個(gè)聲道的音頻信號混合為單聲道音頻信號: y[n] =g{(l-| a/ )Xl[n] + a/ X2[n]},其中,混合增益g為任意的正實(shí)數(shù)。
全文摘要
本發(fā)明公開了一種處理多聲道音頻信號的方法和系統(tǒng)。該方法包括將多聲道音頻信號中至少兩個(gè)聲道的音頻信號劃分為多個(gè)幀;基于正在處理的當(dāng)前幀中至少兩個(gè)聲道的音頻信號,獲得當(dāng)前幀的目標(biāo)混合因子,該目標(biāo)混合因子使表示混音效果的混音狀態(tài)函數(shù)獲得最大值;基于當(dāng)前幀的目標(biāo)混合因子獲得混合權(quán)重系數(shù);使用混合權(quán)重系數(shù)將當(dāng)前幀中至少兩個(gè)聲道的音頻信號混合為單聲道音頻信號。采用本發(fā)明的方法將多聲道音頻信號混合為單聲道音頻信號,所獲得的單聲道音頻信號具有較好的混音效果,避免出現(xiàn)信息量丟失嚴(yán)重或者音量突降等現(xiàn)象。
文檔編號H04S5/00GK103188595SQ201110458048
公開日2013年7月3日 申請日期2011年12月31日 優(yōu)先權(quán)日2011年12月31日
發(fā)明者吳晟, 林福輝, 李曇, 張本好, 徐晶明 申請人:展訊通信(上海)有限公司