一種全景聲揚聲器體感實時交互系統(tǒng)及交互方法與流程

文檔序號：12698089閱讀：308來源：國知局

本申請涉及音頻處理技術(shù)領(lǐng)域，特別涉及一種全景聲揚聲器體感實時交互系統(tǒng)及交互方法。

背景技術(shù)：

隨著音頻處理技術(shù)的不斷發(fā)展，音頻的質(zhì)量也在不斷攀升。目前，人們對于音頻的需求已經(jīng)不僅僅在于要求更高的音質(zhì)，而是想要獲得沉浸式的音效體驗。

當前，人們可以在家中安裝家庭音響，從而構(gòu)成環(huán)繞的立體音效。然而，家庭音響的音頻揚聲器無法滿足人們對于音樂的全方位互動需求。當前，人們希望音頻揚聲器播放的音樂能夠隨著自己肢體的動作而實時發(fā)生改變。例如，人們希望能夠隨時改變整個聲場的環(huán)繞效果以及隨時調(diào)整各個音軌在回放聲場中的方位和運動軌跡。

然而，現(xiàn)有的音頻揚聲器無法滿足人們的這種需求。

技術(shù)實現(xiàn)要素：

本申請的目的在于提供一種全景聲揚聲器體感實時交互系統(tǒng)及交互方法，能夠通過用戶的肢體動作實時地對音頻揚聲器播放的音頻信號進行調(diào)整。

為實現(xiàn)上述目的，本申請一方面提供了一種全景聲揚聲器體感實時交互系統(tǒng)，所述系統(tǒng)包括全景聲場信號轉(zhuǎn)換單元、揚聲器陣列信號轉(zhuǎn)換單元以及體感設(shè)備，其中：所述全景聲場信號轉(zhuǎn)換單元，用于將至少一個聲源信號轉(zhuǎn)換為具備預設(shè)格式的全景聲場信號；其中，所述全景聲場信號為ambisonic格式信號，包括各個聲源信號的能量以及方位角和俯仰角信息；所述體感設(shè)備，用于向所述全景聲場信號轉(zhuǎn)換單元發(fā)送控制信號，以改變所述全景聲場信號中各個聲源信號的方位角和俯仰角；其中，所述控制信號通過所述體感設(shè)備中的至少一個感應(yīng)器生成；所述揚聲器陣列信號轉(zhuǎn)換單元，用于將改變了方位角和俯仰角的全景聲場信號轉(zhuǎn)換為揚聲器陣列信號，并通過按照預設(shè)布局進行配置的至少一個音箱播放所述揚聲器陣列信號；其中，所述揚聲器陣列信號中信號的數(shù)量與所述音箱的數(shù)量一致。

進一步地，所述全景聲場信號包括一階ambisonic格式信號和高階ambisonic格式信號；

對于一階ambisonic格式信號，共有四個聲道信號，其中包括用于表征全方向聲波的第一聲道信號以及用于分別表征三個垂直方向聲波的第二聲道信號、第三聲道信號以及第四聲道信號；相應(yīng)地，當所述聲源信號為音頻對象的信號時，所述第一聲道信號、第二聲道信號、第三聲道信號以及第四聲道信號分別按照下述公式確定：

其中，W表示所述第一聲道信號，X表示所述第二聲道信號，Y表示所述第三聲道信號，Z表示所述第四聲道信號，s_i表示第i個聲源信號，θ_i表示第i個聲源信號的方位角，φ_i表示第i個聲源信號的俯仰角，k表示所述聲源信號的總數(shù)。

進一步地，所述全景聲場信號轉(zhuǎn)換單元包括：判斷模塊，用于在所述聲源信號為聲場錄音信號時，判斷所述聲場錄音信號的類型；轉(zhuǎn)換模塊，用于當所述聲場錄音信號為ambisonic A格式的信號時，將所述ambisonic A格式的信號轉(zhuǎn)換為ambisonic B格式的信號；當所述聲場錄音信號為第一階的ambisonic格式的信號時，通過upmix的方式將所述第一階的ambisonic格式的信號轉(zhuǎn)換為第二階的ambisonic格式的信號；其中，所述第二階高于所述第一階；當所述聲源信號為對象音頻時，將所述對象音頻信號轉(zhuǎn)換為ambisonic格式信號。

進一步地，所述感應(yīng)器包括光學傳感器、慣性傳感器以及機械傳感器中的至少一種。

進一步地，所述揚聲器陣列信號轉(zhuǎn)換單元按照下述公式轉(zhuǎn)換得到所述揚聲器陣列信號：

其中，[L₁ L₂ … L_N]^T表示所述揚聲器陣列信號，G表示解碼矩陣，[W₁ X₁ Y₁ Z₁]^T表示一階ambisonic B格式的全景聲場信號，N表示所述音箱的數(shù)量。

進一步地，所述解碼矩陣由所述音箱的布局確定。

為實現(xiàn)上述目的，本申請另一方面還提供一種全景聲揚聲器體感實時交互方法，所述方法包括：其中，所述全景聲場信號為ambisonic格式信號，包括各個聲源信號的能量以及方位角和俯仰角信息；通過體感設(shè)備向所述全景聲場信號轉(zhuǎn)換單元發(fā)送控制信號，以改變所述全景聲場信號中各個聲源信號的方位角和俯仰角；其中，所述控制信號通過所述體感設(shè)備中的至少一個感應(yīng)器生成；利用揚聲器陣列信號轉(zhuǎn)換單元將改變了方位角和俯仰角的全景聲場信號轉(zhuǎn)換為揚聲器陣列信號，并通過按照預設(shè)布局進行配置的至少一個音箱播放所述揚聲器陣列信號；其中，所述揚聲器陣列信號中信號的數(shù)量與所述音箱的數(shù)量一致。

進一步地，所述全景聲場信號包括一階ambisonic格式信號和高階ambisonic格式信號；對于一階ambisonic格式信號，共有四個聲道信號，其中包括用于表征全方向聲波的第一聲道信號以及用于分別表征三個垂直方向聲波的第二聲道信號、第三聲道信號以及第四聲道信號；相應(yīng)地，當所述聲源信號為音頻對象的信號時，所述第一聲道信號、第二聲道信號、第三聲道信號以及第四聲道信號分別按照下述公式確定：

進一步地，利用全景聲場信號轉(zhuǎn)換單元將至少一個聲源信號轉(zhuǎn)換為具備預設(shè)格式的全景聲場信號包括：在所述聲源信號為聲場錄音信號時，判斷所述聲場錄音信號的類型；當所述聲場錄音信號為ambisonic A格式的信號時，將所述ambisonic A格式的信號轉(zhuǎn)換為ambisonic B格式的信號；當所述聲場錄音信號為第一階的ambisonic格式的信號時，通過upmix的方式將所述第一階的ambisonic格式的信號轉(zhuǎn)換為第二階的ambisonic格式的信號；其中，所述第二階高于所述第一階；當所述聲源信號為對象音頻時，將所述對象音頻信號轉(zhuǎn)換為ambisonic格式信號。

進一步地，所述揚聲器陣列信號按照下述公式確定：

其中，[L₁ L₂ … L_N]^T表示所述揚聲器陣列信號，G表示解碼矩陣，[W₁ X₁ Y₁ Z₁]^T表示一階ambisonic B格式的全景聲場信號，N表示所述音箱的數(shù)量。

由上可見，本申請可以將常規(guī)的聲源信號轉(zhuǎn)換為全景聲場信號，該全景聲場信號可以體現(xiàn)聲源信號的方位角和俯仰角。用戶通過體感設(shè)備，可以將自身的肢體動作轉(zhuǎn)換為控制信號，該控制信號可以改變?nèi)奥晥鲂盘栔械姆轿唤呛透┭鼋?，從而使得用戶的肢體動作能夠?qū)θ奥晥鲂盘栠M行調(diào)節(jié)，調(diào)節(jié)后的全景聲場信號可以通過按照預設(shè)布局進行配置的音箱進行播放。隨著控制信號對方位角和俯仰角的影響，可以改變各個音箱播放的信號分量的大小，從而使得各個信號分量在空間疊加的聲波矢量產(chǎn)生變化，從而達到通過肢體動作調(diào)節(jié)音效的效果。

附圖說明

圖1為本申請一個實施方式中實時交互系統(tǒng)的結(jié)構(gòu)示意圖；

圖2為本申請一個實施方式中實時交互方法的流程圖。

具體實施方式

為了使本技術(shù)領(lǐng)域的人員更好地理解本申請中的技術(shù)方案，下面將結(jié)合本申請實施方式中的附圖，對本申請實施方式中的技術(shù)方案進行清楚、完整地描述，顯然，所描述的實施方式僅僅是本申請一部分實施方式，而不是全部的實施方式?；诒旧暾堉械膶嵤┓绞?，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其它實施方式，都應(yīng)當屬于本申請保護的范圍。

請參閱圖1，本申請實施方式提供一種全景聲揚聲器體感實時交互系統(tǒng)，所述系統(tǒng)包括全景聲場信號轉(zhuǎn)換單元100、揚聲器陣列信號轉(zhuǎn)換單元200以及體感設(shè)備300。

其中，所述全景聲場信號轉(zhuǎn)換單元100，用于將至少一個聲源信號轉(zhuǎn)換為具備預設(shè)格式的全景聲場信號；其中，所述全景聲場信號為ambisonic格式信號，包括各個聲源信號的能量以及方位角和俯仰角信息。

所述體感設(shè)備300，用于向所述全景聲場信號轉(zhuǎn)換單元發(fā)送控制信號，以改變所述全景聲場信號中各個聲源信號的方位角和俯仰角；其中，所述控制信號通過所述體感設(shè)備中的至少一個感應(yīng)器生成。

所述揚聲器陣列信號轉(zhuǎn)換單元200，用于將改變了方位角和俯仰角的全景聲場信號轉(zhuǎn)換為揚聲器陣列信號，并通過按照預設(shè)布局進行配置的至少一個音箱播放所述揚聲器陣列信號；其中，所述揚聲器陣列信號中信號的數(shù)量與所述音箱的數(shù)量一致。

在本實施方式中，所述體感設(shè)備可以實現(xiàn)用戶肢體動作的捕捉，并將捕捉的動作轉(zhuǎn)換為能夠控制音效的控制信號。該控制信號可以通過低功率藍牙設(shè)備傳輸給所述全景聲場信號轉(zhuǎn)換單元。所述全景聲場信號轉(zhuǎn)換單元通過輸入的控制信號來改變音頻信號的方位、音色、節(jié)奏、音高等信息，并將輸出聲音通過按照預設(shè)布局進行排列的多只音箱回放出來，從而實現(xiàn)通過肢體動作控制聲音回放的功能。在實施過程中，佩戴體感設(shè)備的用戶只需通過簡單的動作，就能操作音樂的音量大小、開關(guān)、音色、節(jié)奏、音高和方位等多種音效功能。當然，體感設(shè)備也可以用來同步控制現(xiàn)場燈光系統(tǒng)等設(shè)備，配合音樂表演元素進行實時同步演出。在本實施方式中，所述體感設(shè)備可以具備加速計、陀螺儀與磁力計等一系列感應(yīng)器。所述體感設(shè)備甚至可以檢測手臂肌肉活動的細節(jié)數(shù)據(jù)(例如壓力)，從而可以在音頻信號播放過程中進行更加細節(jié)的調(diào)控。

在本實施方式中，所述全景聲場信號包括一階ambisonic格式信號和高階ambisonic格式信號；對于一階ambisonic格式信號，共有四個聲道信號，其中包括用于表征全方向聲波的第一聲道信號以及用于分別表征三個垂直方向聲波的第二聲道信號、第三聲道信號以及第四聲道信號；相應(yīng)地，當所述聲源信號為音頻對象的信號時，所述第一聲道信號、第二聲道信號、第三聲道信號以及第四聲道信號分別按照下述公式確定：

在本實施方式中，一階的ambisonic B格式的全景聲場信號可以表示為[W X Y Z]^T。

此外，還可以將音頻對象的信號轉(zhuǎn)換為更高階的ambisonic格式的信號。將音頻對象的信號轉(zhuǎn)換為一階、二階以及三階的ambisonic格式的信號可以參閱表1。

表1 0至3階的ambisonic格式的信號轉(zhuǎn)換

在本實施方式中，所述全景聲場信號轉(zhuǎn)換單元還可以包括：

判斷模塊，用于在所述聲源信號為聲場錄音信號時，判斷所述聲場錄音信號的類型；

轉(zhuǎn)換模塊，用于當所述聲場錄音信號為ambisonic A格式的信號時，將所述ambisonic A格式的信號轉(zhuǎn)換為ambisonic B格式的信號；當所述聲場錄音信號為第一階的ambisonic格式的信號時，通過upmix的方式將所述第一階的ambisonic格式的信號轉(zhuǎn)換為第二階的ambisonic格式的信號；其中，所述第二階高于所述第一階；當所述聲源信號為對象音頻時，將所述對象音頻信號轉(zhuǎn)換為ambisonic格式信號。

在本實施方式中，所述揚聲器陣列信號轉(zhuǎn)換單元可以按照下述公式轉(zhuǎn)換得到所述揚聲器陣列信號：

其中，[L₁ L₂ … L_N]^T表示所述揚聲器陣列信號，G表示解碼矩陣，[W₁ X₁ Y₁ Z₁]^T表示一階ambisonic B格式的全景聲場信號，N表示所述音箱的數(shù)量。

具體地，所述解碼矩陣可以通過求偽逆矩陣來得出。在本實施方式中，音箱的布局決定了上述的解碼矩陣。偽逆矩陣(pseudo-inverse)是常用的求解方法，可以使用比如Matlab函數(shù)G＝pinv(C)＝C^T(C*C^T)^-1來求解得到。其中C是重編碼矩陣，用來實現(xiàn)從揚聲器信號到ambisonic信號的映射。

在本實施方式中，體感設(shè)備通?；诠鈱W或慣性傳感器，基于慣性的運動感應(yīng)器套件，通常包括加速度計、陀螺儀和磁力計。在運動跟蹤和絕對方向方面每種感應(yīng)器都有自己固有的強項和弱點。因此常用做法是采用感應(yīng)器“融合”(sensor fusion)將來自各感應(yīng)器的信號組合在一起，產(chǎn)生一個更加精確的運動檢測結(jié)果。從而利用這個信息來控制聲源的位置和運動軌跡。也就是說，通過體感設(shè)備可以產(chǎn)生控制信號，該控制信號可以影響上述每個聲源在空間中的方位角和俯仰角，從而達到交互的目的。在本實施方式中，所述感應(yīng)器包括光學傳感器、慣性傳感器以及機械傳感器中的至少一種。本系統(tǒng)同時支持兩種方位變化(1)改變聲源在聽覺空間中的位置而聽者位置固定；(2)改變聽者的位置而固定聲源位置。

需要說明的是，Ambisonic A格式在這里是指聲場麥克風錄制的原始聲場信號格式，比較常見的是4路正四面體聲場麥克風，當然并不局限于此。Ambisonic B格式是指經(jīng)過轉(zhuǎn)換的通用的聲場格式。具體轉(zhuǎn)換矩陣根據(jù)聲場麥克風的類型而不同。此外，從低階到高階Ambisonic所需要的上混(upmixing)模塊通常需要對聲場進行主成分和環(huán)境成分的分析。

請參閱圖2，本申請還提供一種全景聲揚聲器體感實時交互方法，所述方法包括：

S1：利用全景聲場信號轉(zhuǎn)換單元將至少一個聲源信號轉(zhuǎn)換為具備預設(shè)格式的全景聲場信號；其中，所述全景聲場信號為ambisonic格式信號，包括各個聲源信號的能量以及方位角和俯仰角信息；

S2：通過體感設(shè)備向所述全景聲場信號轉(zhuǎn)換單元發(fā)送控制信號，以改變所述全景聲場信號中各個聲源信號的方位角和俯仰角；其中，所述控制信號通過所述體感設(shè)備中的至少一個感應(yīng)器生成；

S3：利用揚聲器陣列信號轉(zhuǎn)換單元將改變了方位角和俯仰角的全景聲場信號轉(zhuǎn)換為揚聲器陣列信號，并通過按照預設(shè)布局進行配置的至少一個音箱播放所述揚聲器陣列信號；其中，所述揚聲器陣列信號中信號的數(shù)量與所述音箱的數(shù)量一致。

在本實施方式中，利用全景聲場信號轉(zhuǎn)換單元將至少一個聲源信號轉(zhuǎn)換為具備預設(shè)格式的全景聲場信號包括：

在所述聲源信號為聲場錄音信號時，判斷所述聲場錄音信號的類型；

當所述聲場錄音信號為ambisonic A格式的信號時，將所述ambisonic A格式的信號轉(zhuǎn)換為ambisonic B格式的信號；

當所述聲場錄音信號為第一階的ambisonic格式的信號時，通過upmix的方式將所述第一階的ambisonic格式的信號轉(zhuǎn)換為第二階的ambisonic格式的信號；其中，所述第二階高于所述第一階；

當所述聲源信號為對象音頻時，將所述對象音頻信號轉(zhuǎn)換為ambisonic格式信號。

在本實施方式中，所述揚聲器陣列信號按照下述公式確定：

其中，[L₁ L₂ … L_N]^T表示所述揚聲器陣列信號，G表示解碼矩陣，[W₁ X₁ Y₁ Z₁]^T表示一階ambisonic B格式的全景聲場信號，N表示所述音箱的數(shù)量。

上面對本申請的各種實施方式的描述以描述的目的提供給本領(lǐng)域技術(shù)人員。其不旨在是窮舉的、或者不旨在將本發(fā)明限制于單個公開的實施方式。如上所述，本申請的各種替代和變化對于上述技術(shù)所屬領(lǐng)域技術(shù)人員而言將是顯而易見的。因此，雖然已經(jīng)具體討論了一些另選的實施方式，但是其它實施方式將是顯而易見的，或者本領(lǐng)域技術(shù)人員相對容易得出。本申請旨在包括在此已經(jīng)討論過的本發(fā)明的所有替代、修改、和變化，以及落在上述申請的精神和范圍內(nèi)的其它實施方式。

完整全部詳細技術(shù)資料下載

當前第1頁1 2 3

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉恩;孫學京;張旭;王賓
技術(shù)所有人：北京時代拓靈科技有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

體感交互相關(guān)技術(shù)

體感交互技術(shù)相關(guān)技術(shù)

體感交互設(shè)備相關(guān)技術(shù)

kinect體感交互相關(guān)技術(shù)

體感交互手勢捕捉相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種全景聲揚聲器體感實時交互系統(tǒng)及交互方法與流程