用于捕獲和回放源自多個(gè)聲音源的聲音的方法
【專利摘要】本發(fā)明公開了一種用于捕獲和回放源自多個(gè)源的聲音的方法。本發(fā)明還包括具有適于接收和回放這樣的聲音的音頻文件的計(jì)算機(jī)程序產(chǎn)品。基本上,將源自每個(gè)聲音源的聲音記錄在單獨(dú)的音軌上。為了保存聲音源的空間分布和移動(dòng),還記錄聲音源還相對(duì)于至少一個(gè)聆聽位置的當(dāng)前位置。此外,可以追蹤回放期間一個(gè)或更多個(gè)聆聽者的移動(dòng)并且可以將其用于呈現(xiàn)回放期間內(nèi)被調(diào)整為適合聆聽者的當(dāng)前位置的空間聲場(chǎng)。
【專利說明】用于捕獲和回放源自多個(gè)聲音源的聲音的方法
[0001]相關(guān)申請(qǐng)的交叉引用
[0002]本申請(qǐng)要求于2011年06月15日提交的美國(guó)專利臨時(shí)申請(qǐng)N0.61/497,182的優(yōu)先權(quán),其全部?jī)?nèi)容通過引用合并在本文中。
【技術(shù)領(lǐng)域】
[0003]本發(fā)明涉及用于捕獲源自多個(gè)聲音源的聲音的方法。此外,本發(fā)明涉及用于回放這樣的聲音的方法,以及包括適于接收這樣的聲音的音頻文件的計(jì)算機(jī)程序產(chǎn)品。
【背景技術(shù)】
[0004]所謂的環(huán)繞聲可以極大地提升觀眾的聆聽體驗(yàn)。特別是在電影院或視頻游戲環(huán)境下,觀眾經(jīng)常期望無法抗拒的視頻和音頻質(zhì)量。通過在回放期間向音頻音軌添加增加的空間分辨率,環(huán)繞聲明顯有助于滿足這樣的期望。
[0005]現(xiàn)有技術(shù)
[0006]環(huán)繞聲包括眾多的技術(shù),如利用經(jīng)由附加的、分立的揚(yáng)聲器重現(xiàn)的音頻聲道來提高音頻源的聲音再現(xiàn)質(zhì)量。環(huán)繞聲由以下聆聽位置或最佳聽音位置(sweet spot)來表征:在該位置處,音頻效果最佳并且將固定的或前向立體感的聲場(chǎng)呈現(xiàn)給處于該位置的聆聽者。與僅設(shè)置“幕前聲道(screen channel)”(中央聲道,左前聲道,右前聲道)相反,多聲道環(huán)繞聲應(yīng)用以固定數(shù)量的環(huán)繞聲道(例如,左環(huán)繞聲道,右環(huán)繞聲道,后環(huán)繞聲道)圍繞聆聽者。
[0007]與傳統(tǒng)的5.1布置相比,現(xiàn)有技術(shù)的7.1環(huán)繞揚(yáng)聲器配置引入兩個(gè)額外的后揚(yáng)聲器,從而總共具有4個(gè)環(huán)繞聲道和3個(gè)前置聲道。
[0008]以若干方法創(chuàng)建環(huán)繞聲。第一種且最簡(jiǎn)單的方法是使用環(huán)繞聲記錄麥克風(fēng)技術(shù),和/或針對(duì)使用圍繞聆聽者的揚(yáng)聲器來從不同方向播放音頻的音頻系統(tǒng)上的回放而混合環(huán)繞聲。第二種方法是利用心理聲學(xué)聲音定位方法對(duì)音頻進(jìn)行處理,以利用耳機(jī)或揚(yáng)聲器對(duì)模擬二維聲場(chǎng)。
[0009]在大多數(shù)情況下,環(huán)繞聲系統(tǒng)依賴于每個(gè)源聲道到它們自己的擴(kuò)音器的映射。矩陣系統(tǒng)恢復(fù)源聲道的數(shù)量與內(nèi)容并將它們應(yīng)用于其各自的擴(kuò)音器。針對(duì)分離的環(huán)繞聲,傳輸媒介允許源和目的地的(至少)相同數(shù)量的聲道。
[0010]傳輸?shù)男盘?hào)可以對(duì)(限定原始聲場(chǎng)的)信息較大程度或較小程度地進(jìn)行編碼;環(huán)繞聲信息被呈現(xiàn)(render)以通過解碼器進(jìn)行重放,生成對(duì)于重放可用的揚(yáng)聲器數(shù)量的擴(kuò)音器饋送的數(shù)量和配置。
[0011]如前所述,環(huán)繞聲通常適于音頻效果最佳的專用聆聽者位置(“最佳聽音位置”)處的傳送。聆聽者距這樣的最佳聽音位置越遠(yuǎn),所獲取的音頻感受就越不深刻。
[0012]也存在用于補(bǔ)償這樣的聆聽者移動(dòng)并且因而調(diào)整要再現(xiàn)的聲場(chǎng)的解決方案。這樣的解決方案通常包括位置追蹤傳感器??捎糜谝纛l增強(qiáng)應(yīng)用的已知商業(yè)產(chǎn)品包括微軟XBOX的Kinect或Trinnov Audio的音頻優(yōu)化器MC。Trinnov Audio開發(fā)了使用傅里葉貝塞爾分解(Fourier-Bessel decomposition)來表示聲場(chǎng)的數(shù)學(xué)模型。他們還開發(fā)了用于測(cè)量通過將多聲道信號(hào)饋入到回放系統(tǒng)并且將其保存在輻射矩陣中而生成的聲場(chǎng)的軟件/硬件工具。他們實(shí)施了如下解決方案:對(duì)多聲道信號(hào)進(jìn)行再映射,以便來自每個(gè)聲道的聲音呈現(xiàn)為來自該聲道的揚(yáng)聲器應(yīng)該處于的位置。這個(gè)解決方案還包括針對(duì)每個(gè)揚(yáng)聲器的時(shí)間校正和頻率校正。
[0013]下面的專利文獻(xiàn)還公開了用于追蹤聆聽者的位置并相應(yīng)地調(diào)整聲音再現(xiàn)的方法:US20070116306AU US7492915B2, CN101453598A, US20080130923A1 和 US20090304205A1。
【發(fā)明內(nèi)容】
[0014]本發(fā)明的目的是通過提供用于捕獲和回放源自多個(gè)聲音源的聲音的方法來進(jìn)一步改進(jìn)環(huán)繞聲感知,該方法包括例如經(jīng)由固定的擴(kuò)音器布置或經(jīng)由耳機(jī)聆聽取決于位置的回放。
[0015]特別地,所提出的發(fā)明旨在提供對(duì)于不同回放系統(tǒng)配置的改進(jìn)的適用性。
[0016]本發(fā)明的另一目的是提出新的音頻文件格式。
[0017]通過用于捕獲源自多個(gè)聲音源的聲音的方法來實(shí)現(xiàn)關(guān)于捕獲聲音的目的,該方法包括:
[0018]?針對(duì)每個(gè)要記錄的聲音源提供單獨(dú)的記錄音軌;
`[0019]?將源自每個(gè)聲音源的聲音記錄在與該聲音源相關(guān)聯(lián)的單獨(dú)的記錄音軌上;
[0020]?重復(fù)地確定每個(gè)聲音源相對(duì)于至少一個(gè)聆聽位置的當(dāng)前位置;
[0021]?存儲(chǔ)每個(gè)確定的當(dāng)前位置;以及
[0022]?將每個(gè)存儲(chǔ)的當(dāng)前位置與相應(yīng)的記錄聲音相關(guān)聯(lián)。
[0023]代替將聲音編碼在固定數(shù)量的聲道中,所建議的方法基于(例如,房間中)所存在的各個(gè)源來捕獲聲音。該方法將每個(gè)源的聲音連同一些元數(shù)據(jù)一起記錄在各個(gè)音軌上。例如,元數(shù)據(jù)可以包括聲音源相對(duì)于一個(gè)或更多個(gè)聆聽位置的球面坐標(biāo)以及關(guān)于當(dāng)前聽覺環(huán)境的信息(混響時(shí)間,早期側(cè)向反射等等)。
[0024]根據(jù)本發(fā)明所提出的方法提供了基于位置信息自動(dòng)地調(diào)節(jié)聲音使其適于至少一個(gè)聆聽者的位置,從而使得能夠增加關(guān)于揚(yáng)聲器選擇與放置的靈活性。此外,由于不再需要為電影院、Imax劇院、廣播、5.1DVD、7.1藍(lán)光光盤等發(fā)行單獨(dú)的混音,所以可以大幅減少錄音棚的開銷。錄音棚將僅創(chuàng)建一個(gè)各種回放情形共用的混音。該混音將被編碼并在目標(biāo)回放系統(tǒng)中解碼,以呈現(xiàn)實(shí)質(zhì)上與工程師或制作者在錄音棚中聽到的聲場(chǎng)相同的聲場(chǎng)。所建議的聲音呈現(xiàn)技術(shù)還將有助于混音更好地從一個(gè)回放系統(tǒng)轉(zhuǎn)換至另一回放系統(tǒng),從而為終端用戶提供更一致的輸出。例如無論是在商用電影院還是在家,(電影)聲音的感知對(duì)于聆聽者而言都是相同的。此外,不管聆聽者坐在房間的什么位置,聲音體驗(yàn)可以是相同的。
[0025]在傳統(tǒng)的電影院環(huán)境中,聲音系統(tǒng)通常基于所有聽眾的空間平均進(jìn)行校準(zhǔn)(例如,針對(duì)均衡化,時(shí)間和等級(jí)對(duì)準(zhǔn))。由于無法同時(shí)針對(duì)每個(gè)座位(即聆聽者位置)對(duì)系統(tǒng)進(jìn)行最佳校準(zhǔn),因此這將導(dǎo)致非最佳的體驗(yàn)。但是,所提出的方法可以自動(dòng)地適應(yīng)劇院的入座率。例如,如果傳感器追蹤到僅十個(gè)座位被占用,則目標(biāo)回放系統(tǒng)的解碼器可以切換到僅僅針對(duì)所占座位而優(yōu)化的(預(yù)設(shè)的)設(shè)置,從而帶來更好的性能。
[0026]隨著可用的媒體存儲(chǔ)器越來越便宜以及越來越大,使得能夠針對(duì)每個(gè)聲音源使用單獨(dú)的聲道而不是添加更多的揚(yáng)聲器聲道。
[0027]在另外的實(shí)施方式中,提供了至少一個(gè)另外的音軌,以記錄源自至少一個(gè)另外的聲音源的聲音,其中所述另外的聲音源關(guān)于其位置沒有指定。所述另外的聲道例如可以用于捕獲似乎來自每個(gè)地方的背景聲音(例如,在電影場(chǎng)景發(fā)生在法國(guó)南部的情況下的蟋蟀的聲音),以增強(qiáng)聲音體驗(yàn)。
[0028]如先前已經(jīng)指出的,將聲音記錄在各個(gè)記錄音軌上優(yōu)選地包括:對(duì)記錄的聲音進(jìn)行編碼;并且通過與所述編碼相關(guān)聯(lián)的元數(shù)據(jù)來表示每個(gè)確定的當(dāng)前位置。在這樣的實(shí)施方式中,通過基于可用容量選擇和/或開發(fā)使得聲音品質(zhì)最大化的適當(dāng)編碼器,從而適當(dāng)?shù)仡櫦翱捎么尜A或傳輸聲道容量。該實(shí)施方式中的元數(shù)據(jù)是所選擇的編碼處理的一部分或與所選擇的編碼處理相關(guān)聯(lián),并且包括每個(gè)聲音源的相對(duì)于至少一個(gè)聆聽位置的重復(fù)確定的當(dāng)前位置。
[0029]通過用于回放與多個(gè)聲音源相關(guān)聯(lián)的記錄的聲音的方法實(shí)現(xiàn)了關(guān)于聲音回放的目的,該方法包括:
[0030]?提供音頻文件,其中音頻文件包括:多個(gè)記錄音軌,每個(gè)記錄音軌記錄有源自所述聲音源之一的聲音;以及重復(fù)地存儲(chǔ)的與該聲音源相關(guān)聯(lián)的位置,所存儲(chǔ)的位置表示所述聲音源相對(duì)于至少一個(gè)聆聽位置的移動(dòng)曲線(profile);
[0031]?提供包括多個(gè)回放聲道的音頻回放系統(tǒng),其中所述回放系統(tǒng)包括計(jì)算單元,所述計(jì)算單元被編程為基于音頻文件中所包括的記錄的聲音和重復(fù)存儲(chǔ)的位置生成空間聲場(chǎng);以及
[0032]?在音頻回放系統(tǒng)上回放所述空間聲場(chǎng)。
[0033]在所述回放系統(tǒng)中,對(duì)音頻信號(hào)解碼,以呈現(xiàn)在記錄處理中捕獲的聲場(chǎng),該聲場(chǎng)包括重復(fù)存儲(chǔ)的(在聆聽房間中的)當(dāng)前位置。它與現(xiàn)有的基于傅里葉-貝塞爾的模型的不同之處在于:呈現(xiàn)來自移動(dòng)聲音源而不是固定聲道的聲場(chǎng)。以動(dòng)態(tài)地生成的、表示源信號(hào)與對(duì)應(yīng)于預(yù)期聲音環(huán)境(包括聆聽者的當(dāng)前位置)之間的傳遞函數(shù)的矩陣來代替參考輻射矩陣,其中,參考福射矩陣?yán)缬蒚rinnov Audio用來表不多聲道信號(hào)與對(duì)應(yīng)于相同聲音環(huán)境的聲場(chǎng)之間的傳遞函數(shù)(transfer function)。類似地,以動(dòng)態(tài)生成的、基于聆聽者的數(shù)量及其位置調(diào)節(jié)的矩陣來代替解碼矩陣,其中,解碼矩陣?yán)缬蒚rinnov Audio用來表示聲場(chǎng)與饋送給擴(kuò)音器的多聲道信號(hào)之間的傳遞函數(shù)。
[0034]由于僅受回放系統(tǒng)和環(huán)境的聲學(xué)特性限制,所提出的方法可以任意添加聲學(xué)增強(qiáng),例如回響尾音或合成的側(cè)向反射。后者將會(huì)提高側(cè)向聲能因子(Lateral EnergyFraction, LF)和雙耳互相關(guān)(Interaural Cross-correlation, IACC),已經(jīng)證明 LF 和 IACC與包圍感和聲音源寬廣度(ASW)密切相關(guān)。
[0035]優(yōu)選地, 與回放聲道的數(shù)量相適應(yīng)地生成空間聲場(chǎng)。在這樣的實(shí)施方式中,在回放期間針對(duì)回放系統(tǒng)的屬性對(duì)回放進(jìn)行優(yōu)化,而不是在混合階段已優(yōu)化回放。因此,不再需要準(zhǔn)備針對(duì)特定回放系統(tǒng)和其聲道設(shè)置而調(diào)節(jié)的多種不同的混音。
[0036]可以在回放期間通過適于追蹤至少一個(gè)聆聽者的當(dāng)前位置的傳感器來追蹤一個(gè)或更多個(gè)聆聽者的位置變化。這樣的傳感器可以包括紅外激光投影儀和用于在任何環(huán)境光線下捕獲3D視頻數(shù)據(jù)的單色互補(bǔ)金屬氧化物半導(dǎo)體(CMOS)傳感器。該傳感器還可以包括RGB攝像頭和紅外深度感測(cè)激光器。[0037]因此,空間聲場(chǎng)的生成優(yōu)選地包括:使重復(fù)存儲(chǔ)的位置適于至少一個(gè)聆聽者的所追蹤到的當(dāng)前位置,以補(bǔ)償各個(gè)聆聽者相對(duì)于至少一個(gè)聆聽位置的移動(dòng)。
[0038]有利地,這可以通過從先前存儲(chǔ)的校正信息矩陣中選擇校正信息來實(shí)現(xiàn),所選擇的校正信息與至少一個(gè)聆聽者的當(dāng)前所追蹤到的位置相關(guān)聯(lián)。
[0039]在這方面,先前存儲(chǔ)的校正信息矩陣可以包括:與聆聽者在回放環(huán)境中的多個(gè)可能的或者預(yù)期的位置有關(guān)的先前存儲(chǔ)的校正信息。在回放期間,于是可以使用至少一個(gè)聆聽者的當(dāng)前所追蹤到的位置來選擇適當(dāng)?shù)?預(yù)設(shè)的)校正信息。在這樣的實(shí)施方式中,無需計(jì)算要呈現(xiàn)的整個(gè)聲場(chǎng)。對(duì)至少一個(gè)聆聽者的變化位置的調(diào)節(jié)主要包括基于當(dāng)前追蹤到的位置信息選擇預(yù)設(shè)的校正信息。
[0040]Trinnov Audio已經(jīng)發(fā)表了一些非?;镜臄?shù)學(xué)工具來描述、操作和處理聲場(chǎng)。這樣的原理對(duì)于實(shí)施本發(fā)明也非常有用。
[0041]此外,本發(fā)明還包括以計(jì)算機(jī)程序產(chǎn)品實(shí)現(xiàn)的、建議的新的音頻文件格式,該音頻文件包括:
[0042]?多個(gè)記錄音軌,每個(gè)記錄音軌記錄有源自多個(gè)聲音源之一的聲音;以及
[0043]?重復(fù)存儲(chǔ)的與聲音源相關(guān)聯(lián)的位置,所存儲(chǔ)的位置表示聲音源相對(duì)于至少一個(gè)聆聽位置的移動(dòng)曲線。
[0044]這樣的音頻文件還可以包括至少一個(gè)另外的記錄音軌,所述至少一個(gè)另外的記錄音軌具有源自另外的聲音源的聲音,其中,所述另外的聲音源關(guān)于其位置沒有指定。優(yōu)選地,對(duì)記錄的聲音編碼,并 且重復(fù)存儲(chǔ)的位置是與編碼后的聲音相關(guān)聯(lián)的元數(shù)據(jù)。
【專利附圖】
【附圖說明】
[0045]下面將基于附圖所示的示例性實(shí)施方式來更加詳細(xì)地描述和解釋本發(fā)明。
[0046]附圖示出了:
[0047]圖1:用于描述和處理聲場(chǎng)的基本數(shù)學(xué)工具,如Trinnov audio所發(fā)表的現(xiàn)有技術(shù);
[0048]圖2:根據(jù)本發(fā)明的用于捕獲源自多個(gè)聲音源的聲音的方法;
[0049]圖3:根據(jù)本發(fā)明的包括音頻文件的計(jì)算機(jī)程序產(chǎn)品;以及
[0050]圖4:根據(jù)本發(fā)明的用于回放與多個(gè)聲音源相關(guān)聯(lián)的記錄聲音的方法。
【具體實(shí)施方式】
[0051]圖1示出了根據(jù)現(xiàn)有技術(shù)的用于描述、生成、處理聲場(chǎng)的基本數(shù)學(xué)公式與工具。Trinnov Audio在它們的網(wǎng)站www.trinnov.com上發(fā)表了這些公式以及許多更相關(guān)的描述。尤其是該網(wǎng)站的研究(Research)部分提供了對(duì)于應(yīng)用本發(fā)明有用的廣泛的背景信息。
[0052]圖2描述了關(guān)于捕獲源自多個(gè)聲音源的聲音的方法的原理概要。
[0053]步驟I包括提供記錄音軌1、3、5、…、η,其中,每個(gè)記錄音軌應(yīng)該捕獲源自多個(gè)聲音源之一的聲音。
[0054]在步驟II中,通過分配給多個(gè)聲音源的相應(yīng)麥克風(fēng)101、103、…、IOn來捕獲源自每個(gè)聲音源的聲音,使得源自一個(gè)聲音源的聲音被記錄在一個(gè)相應(yīng)的獨(dú)立音軌1、3、5、…、η上。在圖2中,麥克風(fēng)的使用僅是示例性的并且應(yīng)該表示針對(duì)包括像計(jì)算機(jī)游戲中的虛擬聲音源的任何聲音源來接收和/或創(chuàng)建聲音的任何方法。
[0055]步驟III優(yōu)選地與步驟II并行執(zhí)行,在步驟III中,重復(fù)地確定每個(gè)聲音源相對(duì)于(默認(rèn))聆聽位置的當(dāng)前位置201、202、…、20η,以獲得表示記錄處理期間聲音源的移動(dòng)的移動(dòng)曲線。例如,可以通過傳感器信息來檢測(cè)該移動(dòng)曲線,和/或可以通過規(guī)定移動(dòng)曲線(例如,在計(jì)算機(jī)游戲場(chǎng)景下)來生成該移動(dòng)曲線。默認(rèn)的聆聽位置例如可以包括相對(duì)于多揚(yáng)聲器環(huán)繞聲回放系統(tǒng)(“最佳聽音位置”)或頭戴式回放系統(tǒng)的理想且靜止的聆聽位置。
[0056]在步驟IV和步驟V中,將包括每個(gè)聲音源的重復(fù)存儲(chǔ)的位置201、203、…、20η的移動(dòng)曲線存儲(chǔ)在位置音軌上并且與相應(yīng)的記錄音軌1、3、…、η相關(guān)聯(lián),使得每個(gè)記錄音軌關(guān)于相同的聲音源具有對(duì)應(yīng)的所存儲(chǔ)的移動(dòng)曲線。
[0057]提供了另外的記錄音軌400、402,以捕獲不具有對(duì)應(yīng)的特定移動(dòng)曲線的聲音,如表征例如發(fā)生電影或游戲場(chǎng)景的環(huán)境的背景聲音。
[0058]在圖3中示意性地示出了根據(jù)本發(fā)明的包括音頻文件的計(jì)算機(jī)程序產(chǎn)品。計(jì)算機(jī)程序產(chǎn)品500包括音頻文件502。后者示出了記錄音軌504、506、508、…、5χχ,記錄音軌504、506、508、…、5χχ中的每一個(gè)都適于存儲(chǔ)源自多個(gè)聲音源之一的聲音。為了保護(hù)優(yōu)選移動(dòng)聲音源的空間分布,音頻文件502還將包括適于重復(fù)存儲(chǔ)所獲得的與聲音源相關(guān)聯(lián)的位置602、604、606、…的存儲(chǔ)區(qū)域,從而表不出聲音源的移動(dòng)曲線600。這樣的移動(dòng)曲線優(yōu)選地與早先概括的至少一個(gè)聆聽位置相關(guān)??梢蕴峁┝硗獾囊糗?00、702以存儲(chǔ)來自沒有具體的移動(dòng)曲線和/或位置的另外的聲音源的聲音。
[0059]圖4示意性地示出了根據(jù)本發(fā)明的用于回放源自多個(gè)聲音源的已記錄的聲音的方法。
[0060]在第一步驟I中,提供如圖3所描述的音頻文件502。音頻文件502在其每個(gè)記錄音軌上保持從多個(gè)聲音源之一捕獲的聲音。以移動(dòng)曲線來捕獲聲音源相對(duì)于至少一個(gè)聆聽位置的移動(dòng)并將其存儲(chǔ)在音頻文件中。
[0061]在步驟II中,提供包括多個(gè)回放聲道850的音頻回放系統(tǒng)800。通過使計(jì)算單元870基于記錄音軌和移動(dòng)曲線生成空間音頻場(chǎng)而使得回放系統(tǒng)800特別適于接收和回放音頻文件502。音頻場(chǎng)的生成據(jù)此適于回放聲道850的類型和數(shù)量。
[0062]此外,提供位置追蹤傳感器900以在回放期間重復(fù)地(例如準(zhǔn)連續(xù)地)追蹤至少一個(gè)聆聽者的當(dāng)前位置。然后,計(jì)算單元870使用聆聽者的該位置數(shù)據(jù)來使空間音頻場(chǎng)適于聆聽者的當(dāng)前位置,從而使得在步驟III中呈現(xiàn)聲場(chǎng)時(shí)不僅適當(dāng)?shù)乜紤]回放期間聲音源的運(yùn)動(dòng)而且適當(dāng)?shù)乜紤]回放期間聆聽者的運(yùn)動(dòng)。位置追蹤傳感器900還能夠并行地追蹤多個(gè)聆聽者的位置。因此,可以生成針對(duì)各個(gè)聆聽者調(diào)節(jié)的各個(gè)聲場(chǎng),并且優(yōu)選地通過音頻頭戴式耳機(jī)將各聲場(chǎng)傳送給相應(yīng)的聆聽者,或者在針對(duì)一組聆聽者調(diào)節(jié)一個(gè)單獨(dú)的音場(chǎng)的情況下,優(yōu)選地通過固定聲道擴(kuò)音器布置將各聲場(chǎng)傳送給相應(yīng)的聆聽者。
[0063]預(yù)先確定的聆聽者位置校正矩陣950保持空間聲場(chǎng)的各種預(yù)先設(shè)置,每個(gè)預(yù)先設(shè)置適于聆聽者在聆聽環(huán)境中的一個(gè)具體位置。使用當(dāng)前確定的至少一個(gè)聆聽者的位置,從位置校正矩陣950中選擇相應(yīng)的預(yù)設(shè)聲場(chǎng)并將該聲場(chǎng)呈現(xiàn)給聆聽者。
[0064]總之,所概括的本發(fā)明能夠?yàn)槁牨娞峁﹦?dòng)態(tài)環(huán)繞聲,該動(dòng)態(tài)環(huán)繞聲可以基于一個(gè)或更多個(gè)聆聽者的位置和運(yùn)動(dòng)而針對(duì)所述聆聽者進(jìn)行調(diào)節(jié)。本發(fā)明可以利用現(xiàn)有技術(shù)來創(chuàng)建更逼真并且更具交互性的環(huán)繞聲體驗(yàn)。例如,如果兩個(gè)玩家正在相同房間玩網(wǎng)球視頻游戲,當(dāng)玩家I擊球時(shí),球拍擊球的聲音對(duì)于玩家2將呈現(xiàn)為來自玩家I當(dāng)前所處位置(例如,他后面,向右方)。另一示例是,如果一個(gè)人正在聆聽兩聲道的音樂,則不管他或她決定坐在房間何處,利用適當(dāng)?shù)牧Ⅲw聲成像,他或她將聽到完整的聲段。
[0065]利用目前的開放資源API,實(shí)時(shí)的三維位置矩陣可以識(shí)別房間內(nèi)的聆聽者/玩家/用戶的位置。這樣的位置矩陣可以將三維空間描述為頂/底、左/右以及深度的每個(gè)連續(xù)體。重讀獲取位置信息的快照,短暫停頓,然后獲取隨后的快照。在對(duì)快照進(jìn)行比較之后,位置值差別最大的矩陣區(qū)域表示用戶在(聆聽/游戲)房間內(nèi)的最大運(yùn)動(dòng)及位置。然后,根據(jù)房間內(nèi)用戶的矩陣位置自動(dòng)地調(diào)整揚(yáng)聲器輸出。例如,這可以如下完成:創(chuàng)建與用戶在房間內(nèi)每個(gè)可能位置對(duì)應(yīng)的空間場(chǎng)的預(yù)設(shè)值并且當(dāng)聆聽者移動(dòng)時(shí)取消適當(dāng)?shù)念A(yù)先設(shè)置。
[0066]本領(lǐng)域的技術(shù)人員能夠容易地應(yīng)用上面概括的各種概念來獲得本發(fā)明另外的實(shí)施方式。
【權(quán)利要求】
1.一種用于捕獲源自多個(gè)聲音源的聲音的方法,包括: 針對(duì)每個(gè)要記錄的聲音源提供單獨(dú)的記錄音軌; 將源自每個(gè)聲音源的聲音記錄在與該聲音源相關(guān)聯(lián)的單獨(dú)的記錄音軌上; 重復(fù)地確定每個(gè)聲音源相對(duì)于至少一個(gè)聆聽位置的當(dāng)前位置; 存儲(chǔ)每個(gè)確定的當(dāng)前位置;以及 將每個(gè)存儲(chǔ)的當(dāng)前位置與相應(yīng)的記錄的聲音相關(guān)聯(lián)。
2.根據(jù)權(quán)利要求1所述的方法,其中,每個(gè)聲音源的所述當(dāng)前位置是相對(duì)于多個(gè)不同的聆聽位置而確定的。
3.根據(jù)權(quán)利要求1所述的方法,還包括:提供至少一個(gè)另外的記錄音軌,所述至少一個(gè)另外的記錄音軌用于記錄源自另外的聲音源的聲音,其中,所述另外的聲音源關(guān)于其位置沒有指定。
4.根據(jù)權(quán)利要求1所述的方法,其中, 將所述聲音記錄在所述單獨(dú)的記錄音軌上的步驟包括:對(duì)記錄的聲音進(jìn)行編碼,并且 通過與所述編碼相關(guān)聯(lián)的元數(shù)據(jù)來表示每個(gè)確定的當(dāng)前位置。
5.一種用于回放與多個(gè)聲音源相關(guān)聯(lián)的記錄的聲音的方法,所述方法包括: 提供音頻文件,其中,所述音頻文件包括: 多個(gè)記錄音軌,每個(gè)記錄音軌記錄有源自所述聲音源之一的聲音;以及重復(fù)存儲(chǔ)的與所述聲音源相關(guān)聯(lián)的位置,每個(gè)存儲(chǔ)的位置表示所述聲音源之一相對(duì)于至少一個(gè)聆聽位置的當(dāng)前位置; 提供包括多個(gè)回放聲道的音頻回放系統(tǒng),其中,所述回放系統(tǒng)包括計(jì)算單元,所述計(jì)算單元被編程為基于音頻文件中所包括的記錄的聲音和重復(fù)存儲(chǔ)的位置來生成空間聲場(chǎng);以及 在所述音頻回放系統(tǒng)上回放所述空間聲場(chǎng)。
6.根據(jù)權(quán)利要求5所述的方法,其中,與所述回放聲道的數(shù)量相適應(yīng)地生成所述空間聲場(chǎng)。
7.根據(jù)權(quán)利要求5所述的方法,還包括提供適于追蹤至少一個(gè)聆聽者的當(dāng)前位置的傳感器。
8.根據(jù)權(quán)利要求7所述的方法,其中,生成所述空間聲場(chǎng)包括:使所述重復(fù)存儲(chǔ)的位置適于所述至少一個(gè)聆聽者的所追蹤到的當(dāng)前位置,以補(bǔ)償相應(yīng)聆聽者相對(duì)于所述至少一個(gè)聆聽位置的移動(dòng)。
9.根據(jù)權(quán)利要求8所述的方法,其中,基于從先前存儲(chǔ)的校正信息矩陣中選擇校正信息,來使所述重復(fù)存儲(chǔ)的位置適于所述至少一個(gè)聆聽者的所追蹤到的位置,所選擇的校正信息與所述至少一個(gè)聆聽者的所追蹤到的位置相關(guān)聯(lián)。
10.根據(jù)權(quán)利要求9所述的方法,其中,所述先前存儲(chǔ)的校正信息矩陣包括與所述聆聽者的多個(gè)可能的位置有關(guān)的先前存儲(chǔ)的校正信息。
11.一種計(jì)算機(jī)程序產(chǎn)品,包括用于在音頻回放系統(tǒng)上回放的音頻文件,所述音頻文件包括: 多個(gè)記錄音軌,每個(gè)記錄音軌記錄有源自多個(gè)聲音源之一的聲音;以及 重復(fù)存儲(chǔ)的與所述聲音源相關(guān)聯(lián)的位置,所存儲(chǔ)的位置表示所述聲音源相對(duì)于至少一個(gè)聆聽位置的移動(dòng)曲線。
12.根據(jù)權(quán)利要求11所述的計(jì)算機(jī)程序產(chǎn)品,還包括至少一個(gè)另外的記錄音軌,所述至少一個(gè)另外的記錄音軌具有源自另外的聲音源的聲音,其中,所述另外的聲音源關(guān)于其位置沒有指定。
13.根據(jù)權(quán)利要求11所述的計(jì)算機(jī)程序產(chǎn)品,其中記錄的聲音被編碼。
14.根據(jù)權(quán)利要求13所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述重復(fù)存儲(chǔ)的位置是與編碼后的聲音相關(guān)聯(lián)的元數(shù) 據(jù)。
【文檔編號(hào)】H04S7/00GK103609143SQ201280028908
【公開日】2014年2月26日 申請(qǐng)日期:2012年6月4日 優(yōu)先權(quán)日:2011年6月15日
【發(fā)明者】雷米·奧德弗雷, 莫琳·杜波依斯, 阿貝·韋斯頓 申請(qǐng)人:杜比實(shí)驗(yàn)室特許公司