用于生成環(huán)繞立體聲聲場(chǎng)的方法及其裝置和程序產(chǎn)品的制作方法
【專利說(shuō)明】
[0001] 巧關(guān)申請(qǐng)香叉引用
[0002] 本申請(qǐng)要求2013年6月18日提交的中國(guó)專利申請(qǐng)?zhí)?01310246729. 2和2013年 6月26日提交的美國(guó)臨時(shí)專利申請(qǐng)?zhí)?1/839, 474的優(yōu)先權(quán),在此通過(guò)引用并入二者的全部 內(nèi)容。
技術(shù)領(lǐng)域
[0003] 本發(fā)明設(shè)及信號(hào)處理。更具體地,本發(fā)明的實(shí)施例設(shè)及生成環(huán)繞立體聲聲場(chǎng)。
【背景技術(shù)】
[0004] 傳統(tǒng)上,環(huán)繞立體聲聲場(chǎng)或是由專用的環(huán)繞立體聲聲場(chǎng)記錄設(shè)備裝置創(chuàng)建,或者 由專業(yè)的混音工程師或軟件應(yīng)用將聲源平推到不同的聲道而生成。運(yùn)兩種辦法對(duì)終端用戶 來(lái)說(shuō)都無(wú)法輕易實(shí)現(xiàn)。在過(guò)去的數(shù)十年中,諸如移動(dòng)電話、平板電腦、媒體播放器和游戲機(jī) 等越來(lái)越多的普適移動(dòng)設(shè)備已經(jīng)配備有音頻捕獲和/或處理功能。然而,多數(shù)移動(dòng)設(shè)備(移 動(dòng)電話、平板電腦、媒體播放器、游戲機(jī))僅被用于實(shí)現(xiàn)單聲道音頻捕獲。
[0005] 已經(jīng)提出了多種方法用于使用移動(dòng)設(shè)備來(lái)創(chuàng)建環(huán)繞立體聲聲場(chǎng)。然而,運(yùn)些方法 或者嚴(yán)格依賴接入點(diǎn),或者沒(méi)有將日常使用的非專業(yè)移動(dòng)設(shè)備的特性納入考慮。例如,在使 用異質(zhì)用戶設(shè)備的自組織(adhoc)網(wǎng)絡(luò)生成環(huán)繞立體聲聲場(chǎng)時(shí),不同移動(dòng)設(shè)備的記錄時(shí)間 可能是不同步的,并且移動(dòng)設(shè)備的位置和拓?fù)淇赡苁俏粗摹6?,音頻捕獲設(shè)備的增益及 頻率響應(yīng)可能不同。因此,目前,無(wú)法通過(guò)日常用戶所使用音頻捕獲設(shè)備而有效且高效地生 成環(huán)繞立體聲聲場(chǎng)。
[0006] 有鑒于此,在本領(lǐng)域中需要一種能夠W有效且高效的方式生成環(huán)繞立體聲聲場(chǎng)的 解決方案。
【發(fā)明內(nèi)容】
[0007] 為了解決上述和其他潛在問(wèn)題,本發(fā)明的實(shí)施例提出一種用于生成環(huán)繞立體聲聲 場(chǎng)的方法、裝置和計(jì)算機(jī)程序產(chǎn)品。
[0008] 在一個(gè)方面,本發(fā)明的實(shí)施例提供一種生成環(huán)繞立體聲聲場(chǎng)的方法。該方法包括: 接收由多個(gè)音頻捕獲設(shè)備捕獲的音頻信號(hào);估計(jì)多個(gè)音頻捕獲設(shè)備的拓?fù)?;W及至少部分 地基于估計(jì)的拓?fù)鋸慕邮盏囊纛l信號(hào)生成環(huán)繞立體聲聲場(chǎng)。該方面的實(shí)施例還包括相應(yīng)的 計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)程序產(chǎn)品包括有形地包含于機(jī)器可讀介質(zhì)上的用于執(zhí)行該方法 的計(jì)算機(jī)程序。
[0009] 在另一方面,本發(fā)明的實(shí)施例提供一種生成環(huán)繞立體聲聲場(chǎng)的裝置。該裝置包含: 接收單元,被配置為接收由多個(gè)音頻捕獲設(shè)備捕獲的音頻信號(hào);拓?fù)涔烙?jì)單元,被配置為估 計(jì)多個(gè)音頻捕獲設(shè)備的拓?fù)?;W及生成單元,被配置為至少部分地基于估計(jì)的拓?fù)渖森h(huán) 繞立體聲聲場(chǎng)。
[0010] 可W實(shí)現(xiàn)本發(fā)明的運(yùn)些實(shí)施例W實(shí)現(xiàn)W下一個(gè)或多個(gè)優(yōu)點(diǎn)。根據(jù)本發(fā)明的實(shí)施 例,環(huán)繞立體聲聲場(chǎng)可W通過(guò)使用終端用戶的音頻捕獲設(shè)備(諸如裝備在移動(dòng)電話上的麥 克風(fēng))的自組織網(wǎng)絡(luò)而生成。由此,可W不再需要昂貴且復(fù)雜的專業(yè)設(shè)備和/或人類專家。 此外,通過(guò)基于對(duì)音頻捕獲設(shè)備的拓?fù)涔烙?jì)而動(dòng)態(tài)地生成環(huán)繞立體聲聲場(chǎng),可W將環(huán)繞立 體聲聲場(chǎng)的品質(zhì)維持在較高水平。
[0011] 通過(guò)連同附圖閱讀下列【具體實(shí)施方式】,還將理解本發(fā)明的實(shí)施例的其他特征和優(yōu) 勢(shì),附圖W示例方式圖示了本發(fā)明的精神和原理。
【附圖說(shuō)明】
[0012] 本發(fā)明的一個(gè)或多個(gè)實(shí)施例的細(xì)節(jié)在下列附圖和描述中闡明。本發(fā)明的其他特 征、方面和優(yōu)勢(shì)將從描述、附圖和權(quán)利要求中變得明顯,其中:
[0013] 圖1示出了本發(fā)明的示例實(shí)施例可實(shí)現(xiàn)于其中的系統(tǒng)的框圖;
[0014] 圖2A-圖2C示出了根據(jù)本發(fā)明示例實(shí)施例的音頻捕獲設(shè)備的拓?fù)涞娜舾墒纠?不意圖;
[0015] 圖3示出了根據(jù)本發(fā)明示例實(shí)施例的用于生成環(huán)繞立體聲聲場(chǎng)的方法的流程圖;
[0016] 圖4A-圖4C分別不出了在使用一個(gè)不例映射矩陣時(shí)針對(duì)各種頻率的B-格式處理 中的W、X和Y聲道的極性圖(polarpattern)的示意圖;
[0017] 圖5A-圖5C分別示出了在使用另一示例映射矩陣時(shí)針對(duì)各種頻率的B-格式處理 中的W、X和Y聲道的極性圖的示意圖;
[0018] 圖6示出了根據(jù)本發(fā)明示例實(shí)施例的用于生成環(huán)繞立體聲聲場(chǎng)的裝置的框圖;
[0019] 圖7示出了用于實(shí)現(xiàn)本發(fā)明的示例實(shí)施例的用戶終端的框圖;化及
[0020] 圖8示出了用于實(shí)施本發(fā)明的示例實(shí)施例的系統(tǒng)的框圖。
[0021] 貫穿所有附圖,相同或相似的參考標(biāo)號(hào)指示相同或相似的元素。
【具體實(shí)施方式】
[0022] 總體上,本發(fā)明的實(shí)施例提供用于生成環(huán)繞立體聲聲場(chǎng)的方法、裝置和計(jì)算機(jī)程 序產(chǎn)品。根據(jù)本發(fā)明的實(shí)施例,環(huán)繞立體聲聲場(chǎng)可W通過(guò)使用音頻捕獲設(shè)備(諸如終端用 戶的移動(dòng)電話)的自組織網(wǎng)絡(luò)而被有效和準(zhǔn)確地生成。下面將詳細(xì)描述本發(fā)明的某些實(shí)施 例。
[0023] 首先參考圖1,其示出了本發(fā)明的實(shí)施例可實(shí)現(xiàn)于其中的系統(tǒng)100的框圖。在圖1 中,系統(tǒng)100包括多個(gè)音頻捕獲設(shè)備101W及服務(wù)器102。根據(jù)本發(fā)明的實(shí)施例,除了其他 功能之外,音頻捕獲設(shè)備101,能夠捕獲、記錄和/或處理音頻信號(hào)。音頻捕獲設(shè)備101的示 例可W包括但不限于移動(dòng)電話、個(gè)人數(shù)字助理(PDA)、膝上型計(jì)算機(jī)、平板式計(jì)算機(jī)、個(gè)人計(jì) 算機(jī)(PC)或任何配備有音頻捕獲功能的其他適當(dāng)?shù)挠脩艚K端。例如,可W購(gòu)得的移動(dòng)電話 通常都配備至少一個(gè)麥克風(fēng),因此可W充當(dāng)音頻捕獲設(shè)備101。
[0024] 根據(jù)本發(fā)明的實(shí)施例,音頻捕獲設(shè)備101可W被布置在一個(gè)或多個(gè)自組織網(wǎng)絡(luò)或 組103中,每個(gè)自組織網(wǎng)絡(luò)103可W包括一個(gè)或多個(gè)音頻捕獲設(shè)備。音頻捕獲設(shè)備可W按 照預(yù)定義的策略被分組,或者被動(dòng)態(tài)地分組,將在下文詳述。不同組可W位于相同或不同的 物理位置。在每個(gè)組內(nèi),音頻捕獲設(shè)備位于相同的物理位置并且可W彼此接近地放置。
[00巧]圖2A-圖2C示出了包括=個(gè)音頻捕獲設(shè)備的組的某些示例。在圖2A-圖2C中 示出的示例實(shí)施例中,音頻捕獲設(shè)備101可W是移動(dòng)電話、PDA或任何其他的便攜式用戶終 端,其配備了用于捕獲音頻信號(hào)的音頻捕獲元件201,諸如一個(gè)或多個(gè)麥克風(fēng)。特別地,在圖 2C中示出的示例實(shí)施例中,音頻捕獲設(shè)備101還配備有視頻捕獲元件202,諸如照相機(jī),W 使得音頻捕獲設(shè)備101可W被配置為在捕獲音頻信號(hào)的同時(shí)捕獲視頻和/或圖像。
[0026] 應(yīng)當(dāng)注意,一個(gè)組內(nèi)的音頻捕獲設(shè)備的數(shù)目不限于S個(gè)。相反,任何合適數(shù)目的音 頻捕獲設(shè)備都可W被安排進(jìn)組。此外,在一個(gè)組內(nèi),多個(gè)音頻捕獲設(shè)備可W被安排成任何期 望的拓?fù)?。在某些?shí)施例中,組內(nèi)的音頻捕獲設(shè)備可W借助于計(jì)算機(jī)網(wǎng)絡(luò)、藍(lán)牙、紅外線、電 信等彼此通信,運(yùn)里僅僅是幾個(gè)例子。
[0027] 繼續(xù)參考圖1,如圖所示,服務(wù)器102經(jīng)由網(wǎng)絡(luò)連接可通信地連接至音頻捕獲設(shè)備 101的組。音頻捕獲設(shè)備101和服務(wù)器102例如可W通過(guò)計(jì)算機(jī)網(wǎng)絡(luò),諸如局域網(wǎng)("LAN")、 廣域網(wǎng)("WAN")或因特網(wǎng)、通信網(wǎng)絡(luò)、近場(chǎng)通信連接或其任何組合而彼此通信。本發(fā)明的 范圍在此方面不受限制。
[0028] 在操作中,環(huán)繞立體聲聲場(chǎng)的生成可W由音頻捕獲設(shè)備101或者由服務(wù)器102發(fā) 起。特別地,在某些實(shí)施例中,音頻捕獲設(shè)備101可W登錄到服務(wù)器102并且請(qǐng)求服務(wù)器 102生成環(huán)繞立體聲聲場(chǎng)。然后,發(fā)送請(qǐng)求的音頻捕獲設(shè)備101將變成主設(shè)備,它向其他捕 獲設(shè)備發(fā)送邀請(qǐng),W邀請(qǐng)其他捕獲設(shè)備加入音頻捕獲會(huì)話。在此方面,可能存在主設(shè)備所屬 的預(yù)定的組。在運(yùn)些實(shí)施例中,該組內(nèi)的其他音頻捕獲設(shè)備接收來(lái)自主設(shè)備的邀請(qǐng)并且加 入音頻捕獲會(huì)話。備選地或附加地,另外一個(gè)或多個(gè)音頻捕獲設(shè)備可W被動(dòng)態(tài)地識(shí)別并且 與主設(shè)備分組在一起。例如,在GPS(全球定位服務(wù))之類的定位服務(wù)可用于音頻捕獲設(shè)備 101的情況下,可W自動(dòng)地邀請(qǐng)與主設(shè)備鄰近的一個(gè)或多個(gè)音頻捕獲設(shè)備加入音頻捕獲組。 在某些備選實(shí)施例中,對(duì)音頻捕獲設(shè)備的發(fā)現(xiàn)和分組也可W由服務(wù)器102執(zhí)行。
[0029] 在形成音頻捕獲設(shè)備的組之后,服務(wù)器102向該組內(nèi)的所有音頻捕獲設(shè)備發(fā)送捕 獲命令。備選地,捕獲命令可W由組內(nèi)的音頻捕獲設(shè)備101之一發(fā)送,例如由主設(shè)備發(fā)送。 在接收到捕獲命令之后,組內(nèi)的每個(gè)音頻捕獲設(shè)備將立即開(kāi)始捕獲并且記錄音頻信號(hào)。當(dāng) 任何捕獲設(shè)備停止捕獲時(shí),音頻捕獲會(huì)話將結(jié)束。在音頻捕獲期間,音頻信號(hào)可W被本地記 錄在音頻捕獲設(shè)備101上,并且在捕獲會(huì)話完成之后被發(fā)送至服務(wù)器102。備選地,所捕獲 的音頻信號(hào)可W實(shí)時(shí)地傳輸至服務(wù)器102。
[0030] 根據(jù)本發(fā)明的實(shí)施例,被一個(gè)組的音頻捕獲設(shè)備101捕獲的音頻信號(hào)被分配相同 的組標(biāo)識(shí)(ID),使得服務(wù)器102能夠識(shí)別傳入的音頻信號(hào)是否屬于相同的組。另外,除音頻 信號(hào)之外,可W向服務(wù)器102發(fā)送與音頻捕獲會(huì)話有關(guān)的任何信息,包括組內(nèi)的音頻捕獲 設(shè)備101的數(shù)目、一個(gè)或多個(gè)音頻捕獲設(shè)備101的參數(shù),等等。
[0031] 基于由多個(gè)捕獲設(shè)備101的組捕獲的音頻信號(hào),服務(wù)器102執(zhí)行一系列操作W處 理音頻信號(hào)從而生成環(huán)繞立體聲聲場(chǎng)。在此方面,圖3示出了用于根據(jù)多個(gè)捕獲設(shè)備101 所捕獲的音頻信號(hào)生成環(huán)繞立體聲聲場(chǎng)的方法的流程圖。
[0032] 如圖3所示,當(dāng)在步驟S301處接收到由一組音頻捕獲設(shè)備101捕獲的音頻信號(hào)之 后,在步驟S302處估計(jì)運(yùn)些音頻捕獲設(shè)備的拓?fù)?。估?jì)組內(nèi)的音頻捕獲設(shè)備101的位置 的拓?fù)鋵?duì)于隨后的空間處理而言是重要的,其對(duì)于重現(xiàn)聲場(chǎng)具有直接的影響。根據(jù)本發(fā)明 的實(shí)施例,音頻捕獲設(shè)備的拓?fù)淇蒞通過(guò)各