亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

環(huán)境聲處理的音頻信息的確定的制作方法_3

文檔序號:9925605閱讀:來源:國知局
其他裝置發(fā)送音頻信息的確定可以至少部分地基于由其它裝置接收語音呼叫的開始的指示。例如,該裝置可以接收請求以接收呼叫、以加入與呼叫相關(guān)聯(lián)的會話,和/或諸如此類。
[0094]在至少一個示例實施例中,該裝置使得通過音頻上行鏈路傳輸音頻信息。在至少一個示例實施例中,音頻信息的傳輸涉及通過介質(zhì)和/或協(xié)議來發(fā)送音頻信息,該介質(zhì)和/或協(xié)議允許其它裝置接收音頻信息(至少一部分)。該裝置可以使得通過傳送音頻信息,通過發(fā)送音頻信息給不同的裝置(其傳送音頻信息)和/或諸如此類來傳送音頻信息。
[0095]音頻信息可以是表示音頻的任何信息。例如,音頻信息可以涉及壓縮的音頻格式(諸如任何的運(yùn)動圖像專家組(MPEG)格式)和未壓縮的音頻格式(諸如任何的脈沖編碼調(diào)制(PCM)信息)和/或諸如此類。應(yīng)當(dāng)理解的是,有許多音頻格式可以由裝置來使用,以及許多其它音頻格式在將來將可以使用,以及此類音頻格式不以任何方式限制權(quán)利要求書。該裝置可以從一個或多個麥克風(fēng)接收音頻信息。應(yīng)當(dāng)理解的是,有許多類型的麥克風(fēng)可以由裝置使用,以及許多其它類型的麥克風(fēng)在將來將可以使用,以及此類類型的麥克風(fēng)不以任何方式限制權(quán)利要求書。該裝置可以包括麥克風(fēng),可以通過另一個裝置從麥克風(fēng)接收音頻信息,和/或諸如此類。
[0096]圖2A是根據(jù)至少一個示例實施例的說明裝置201的麥克風(fēng)202的示意圖。能夠看出,麥克風(fēng)202被放置在裝置202上,使得當(dāng)向裝置201說話時,麥克風(fēng)可以接收在用戶的嘴附近的音頻信息。該放置可以使得當(dāng)用戶以類似于圖3A的示例來把持裝置201時,麥克風(fēng)202接近于用戶的嘴。在至少一個示例實施例中,裝置201從麥克風(fēng)202來接收音頻信息。
[0097]語音活動檢測器(VAD)是在許多通信標(biāo)準(zhǔn)中的強(qiáng)制要求。在此類情況中,語音活動檢測器與合適的噪聲抑制算法結(jié)合使用以在沒有檢測到語音活動的期間降低環(huán)境噪聲。即使具有單個麥克風(fēng)的裝置可能能夠評價語音和/或環(huán)境聲。術(shù)語“環(huán)境聲”用于描述“背景噪聲”。在許多情況中,環(huán)境聲的估計在許多裝置中可能是期望的。估計環(huán)境聲的基本思想可以是在與語音活動的缺失相關(guān)聯(lián)的時間段期間分析輸入信號幀。例如,可以確定當(dāng)前幀是否含有語音和/或環(huán)境聲。在此類示例中,VAD的輸出可能是期望的。在至少一個示例實施例中,基于VAD信息,可以針對語音信號的質(zhì)量和可懂性來抑制環(huán)境聲。在具有多個麥克風(fēng)配置的一些裝置中,可能希望的是提供高級水平的噪聲抑制或噪聲方向性。例如,可能期望的是,上行鏈路音頻通過降低環(huán)境聲來強(qiáng)調(diào)語音。
[0098]在一些情況中,可能希望的是,處理關(guān)于環(huán)境聲的音頻信息。在至少一個示例實施例中,裝置處理音頻信息以確定環(huán)境聲處理的音頻信息。例如,可以確定音頻信息,使得環(huán)境聲被限制、使得環(huán)境聲補(bǔ)充其他音頻信息、使得環(huán)境聲被保留、和/或諸如此類。在至少一個示例實施例中,環(huán)境聲涉及不是由用戶說話引起的音頻信息。例如,用戶可以向裝置的麥克風(fēng)說話。由用戶語音所引起的聲音可以被認(rèn)為是非環(huán)境聲。在此類示例中,可以有由麥克風(fēng)接收的其它聲音,諸如背景聲、音樂、和/或諸如此類。在至少一個示例實施例中,該裝置接收音頻信息,該音頻信息包括語音和環(huán)境聲。該裝置可以至少部分地基于音頻信息來確定環(huán)境聲處理的音頻信息。例如,該裝置可以通過音頻信息的修改、組合與不同麥克風(fēng)相關(guān)聯(lián)的音頻信息、限制與不同的麥克風(fēng)相關(guān)聯(lián)的音頻信息、消除與不同的麥克風(fēng)相關(guān)聯(lián)的音頻信息、和/或諸如此類,來確定所處理的音頻信息。此類信息也可以依賴于用例(例如,該裝置是否被配置為當(dāng)進(jìn)行所謂的“手機(jī)呼叫”時,被放置在接近于用戶的嘴的地方,或者被配置為被放置在遠(yuǎn)離于用戶的嘴的地方以便進(jìn)行所謂的“免提電話呼叫”或“免提揚(yáng)聲器呼口H”)。在一些實施例中,由設(shè)備包括的麥克風(fēng)可以與一個或多個麥克風(fēng)(它們是其它裝置的一部分)協(xié)作,例如麥克風(fēng)形成外圍裝置(諸如耳機(jī)、免提電話、或車輛的音頻系統(tǒng))的一部分。
[0099]在至少一個示例實施例中,環(huán)境聲處理的音頻信息涉及環(huán)境聲限制的音頻信息。在至少一個示例實施例中,環(huán)境聲限制的音頻信息涉及音頻信息,該音頻信息指示降低的環(huán)境聲成分。例如,環(huán)境聲限制的音頻信息可以涉及環(huán)境聲處理的音頻信息,該環(huán)境聲處理的音頻信息指示已經(jīng)遭受到環(huán)境聲限制的音頻信息。例如,確定環(huán)境聲限制的音頻信息可以包括:一個或多個環(huán)境聲降低技術(shù)的使用。在另一個示例中,確定環(huán)境聲限制的音頻信息可以包括:一個或多個語音增強(qiáng)技術(shù)的使用。在至少一個示例實施例中,環(huán)境聲限制的音頻信息涉及音頻信息,在該音頻信息中,環(huán)境聲可以被限制以及非環(huán)境聲可以被保留。
[0100]在至少一個示例實施例中,環(huán)境聲處理的音頻信息涉及環(huán)境聲非限制的音頻信息。在至少一個示例實施例中,環(huán)境聲非限制的音頻信息涉及:指示包括環(huán)境聲成分的音頻信息。例如,環(huán)境聲非限制的音頻信息可以涉及:環(huán)境聲處理的音頻信息,其指示還沒有遭受到環(huán)境聲限制的音頻信息、已經(jīng)遭受到環(huán)境聲增強(qiáng)的音頻信息、和/或諸如此類。例如,確定環(huán)境聲非限制的音頻信息可以包括:一個或多個環(huán)境聲降低技術(shù)的排除。在另一個示例中,確定環(huán)境聲非限制的音頻信息可以包括:一個或多個語音增強(qiáng)技術(shù)的排除。
[0101]在至少一個示例實施例中,語音增強(qiáng)技術(shù)涉及與以偏愛包括語音聲音而不偏愛包括環(huán)境聲的方式來處理音頻信息相關(guān)聯(lián)的一個或多個操作。語音增強(qiáng)技術(shù)可以包括至少一個過濾技術(shù)、至少一個恢復(fù)技術(shù)、至少一個語音模型技術(shù)、和/或諸如此類。在至少一個示例實施例中,過濾技術(shù)涉及與指示環(huán)境聲的音頻信息的移除相關(guān)聯(lián)的技術(shù),諸如譜減法、維納濾波、信號子空間方法(SSA)濾波、和/或諸如此類。在至少一個示例實施例中,頻譜恢復(fù)涉及指示語音的音頻信息的增強(qiáng),諸如最小均方誤差短時間頻譜振幅估計(MMSE-STSA)恢復(fù),或任何類似的技術(shù)。在至少一個示例實施例中,語音模型技術(shù)涉及與指示語音的預(yù)定聲音相關(guān)聯(lián)的首頻?目息的識別。
[0102]在至少一個示例實施例中,音頻信息涉及與多個麥克風(fēng)相關(guān)聯(lián)的音頻信息。可以由裝置包括一個或多個麥克風(fēng)。一個或多個麥克風(fēng)可以與裝置(諸如分離的裝置,其向該裝置提供音頻信息)分離。
[0103]在至少一個示例實施例中,環(huán)境聲降低技術(shù)涉及方向性音頻信息的確定。例如,環(huán)境聲限制的音頻信息可以是方向性音頻信息。在至少一個示例實施例中,方向性音頻信息涉及音頻信息,該音頻信息涉及從指定方向接近該裝置的聲音波。該裝置可以至少部分地基于在與在裝置上的不同方位處的多個麥克風(fēng)相關(guān)聯(lián)的音頻信息之間的關(guān)聯(lián)來確定方向性音頻信息。例如,該裝置可以評估與多個麥克風(fēng)相關(guān)聯(lián)的音頻信息,以及至少部分地基于指示在該裝置上的多個麥克風(fēng)的方位的信息來關(guān)聯(lián)音頻信息,使得與來自其它方向的音頻相比,偏愛指示在自該裝置的指定方向處的音頻源的音頻信息。在至少一個示例實施例中,方向性音頻信息的確定涉及將全向音頻信息轉(zhuǎn)換為方向性音頻信息。在至少一個示例實施例中,方向性音頻信息涉及音頻信息,該音頻信息表示從各種方向(例如從多個聲音源)感知的音頻信息。例如,全向音頻信息可以涉及缺少方向性修改的音頻信息。
[0104]圖2Β是根據(jù)至少一個示例實施例的說明裝置的多個麥克風(fēng)的示意圖。在圖2Β的示例中,裝置221包括麥克風(fēng)222、223、和224。在圖2Β的示例中,麥克風(fēng)222、223和224正在接收來自聲音源231和232的音頻信息。能夠看出的是,聲音源232比聲音源231更接近麥克風(fēng)
222。在至少一個示例實施例中,裝置221接收來自麥克風(fēng)222、223和224的音頻信息,以及基于音頻信息來確定方向性音頻信息。例如,該裝置可以確定指示與音頻源231相對應(yīng)的方向的方向性音頻。在此類示例中,該裝置可以通過與與麥克風(fēng)222相關(guān)聯(lián)的音頻信息相關(guān)聯(lián)的時間對與與麥克風(fēng)223相關(guān)聯(lián)的音頻信息相關(guān)聯(lián)的時間、對與與麥克風(fēng)224相關(guān)聯(lián)的音頻信息相關(guān)聯(lián)的時間來識別與音頻源231相關(guān)聯(lián)的音頻信息。在此類示例中,方向性音頻信息可以指示與預(yù)定方向相關(guān)聯(lián)的聲音的提取、與和預(yù)定方向不相對應(yīng)的方向相關(guān)聯(lián)的聲音的限制、和/或諸如此類。
[0105]在至少一個示例實施例中,至少部分地基于單一的音頻源的推定來確定方向性音頻信息。例如,方向性音頻信息可以基于以下推定:希望被包含在方向性音頻信息中的聲音與單個方向相關(guān)聯(lián)。以這種方式,方向性音頻信息可以涉及與預(yù)定方向相關(guān)聯(lián)的聲音。在至少一個示例實施例中,預(yù)定方向涉及與向該裝置講話的用戶相關(guān)聯(lián)的方向。例如,可以以如下方式來配置該裝置:從該裝置到用戶的嘴的方向是可以預(yù)測的。在此類示例中,預(yù)定方向可以指示用戶的嘴的此類預(yù)測方向。
[0106]在一些情況中,可能希望的是,將麥克風(fēng)放置在裝置上使得麥克風(fēng)被指向遠(yuǎn)離于期望的語音源的方向。例如,如果用戶的嘴可能指向麥克風(fēng),則可能希望的是有一個或多個麥克風(fēng)指向不同的方向。在至少一個示例實施例中,指向用戶的嘴的預(yù)測方位的麥克風(fēng)涉及語音麥克風(fēng)。在至少一個示例實施例中,指向與語音麥克風(fēng)不同方向的麥克風(fēng)涉及環(huán)境麥克風(fēng)。以這種方式,語音麥克風(fēng)可以被如此放置使得與語音麥克風(fēng)相關(guān)聯(lián)的音頻信息可能具有比與環(huán)境麥克風(fēng)相關(guān)聯(lián)的音頻信息更大的語音成分。類似地,環(huán)境麥克風(fēng)可以被如此放置使得與環(huán)境麥克風(fēng)相關(guān)聯(lián)的音頻信息可能比與語音麥克風(fēng)相關(guān)聯(lián)的音頻信息具有更大的環(huán)境成分。
[0107]出于易于說明而提供了圖2B中的麥克風(fēng)222、223、224的布置。實際上,合適的裝置可以包括:不同數(shù)量的麥克風(fēng),和/或在不同位置中的麥克風(fēng)。例如,該裝置可以包括:位于朝向設(shè)備的正面的底部的第一麥克風(fēng)以便當(dāng)該裝置在使用中時第一麥克風(fēng)被放置在接近于用戶的嘴的地方,以及被放置在朝向設(shè)備的背面的頂部的第二麥克風(fēng)。在此類布置中,與與第二麥克風(fēng)相關(guān)聯(lián)的音頻信息相比,與第一麥克風(fēng)相關(guān)聯(lián)的音頻信息可以具有相對于環(huán)境音頻的更大的語音音頻的成分。
[0108]在一些情況中,確定環(huán)境聲限制的音頻信息可以涉及與與不同的一個或多個麥克風(fēng)(諸如一個或多個環(huán)境麥克風(fēng))相關(guān)聯(lián)的音頻信息相比,更偏愛與一個或多個麥克風(fēng)(諸如一個或多個語音麥克風(fēng))相關(guān)聯(lián)的音頻信息。例如,麥克風(fēng)可以與方向相關(guān)聯(lián),以及不同的麥克風(fēng)可以與不同的方向相關(guān)聯(lián)。例如,如果麥克風(fēng)是方向性的,則它們可以被如此放置使得麥克風(fēng)在不同的方向中最敏感,以及無論是方向性的還是全向的,麥克風(fēng)可以位于不同的位置中,從而在它們被放置在離潛在的聲音源的不同的距離處和/或在麥克風(fēng)和聲音源之間具有不同的障礙物的意義上,它們可以指向不同的方向。在此類示例中,該裝置可以通過排除與不同方向相關(guān)聯(lián)的音頻信息來確定環(huán)境聲限制的音頻信息。在一些示例中,該裝置可以降低音頻信息,該音頻信息指示與不同方向相關(guān)聯(lián)的音頻信息。例如,該裝置可以至少部分地基于與一個或多個麥克風(fēng)相關(guān)聯(lián)的音頻信息來消除音頻信息。在至少一個示例實施例中,此類消除涉及環(huán)境聲消除。在至少一個示例實施例中,該裝置可以通過禁用一個或多個環(huán)境聲麥克風(fēng)來確定環(huán)境聲限制的音頻信息。在至少一個示例實施例中,該裝置可以通過應(yīng)用于來自麥克風(fēng)中的一個或多個麥克風(fēng)的音頻信息的合適的環(huán)境聲抑制算法來確定環(huán)境聲限制的音頻信息。
[0109]在至少一個示例實施例中,環(huán)境聲限制的音頻信息的確定包括:環(huán)境聲消除。例如,音頻信息涉及與至少一個語音麥克風(fēng)相關(guān)聯(lián)的音頻信息和與至少一個環(huán)境麥克風(fēng)相關(guān)聯(lián)的音頻信息。在此類示例中,環(huán)境聲限制的音頻信息的確定包括:至少部分地基于與環(huán)境麥克風(fēng)相關(guān)聯(lián)的音頻信息來消除與語音麥克風(fēng)相關(guān)聯(lián)的音頻信息的至少一部分。例如,消除可以涉及反轉(zhuǎn)環(huán)境音頻信息(其至少一部分)以及將反轉(zhuǎn)的環(huán)境音頻信息與音頻信息組入口 O
[0110]在至少一個示例實施例中,環(huán)境聲非限制的音頻信息涉及音頻信息,該音頻信息包括或旨在包括:環(huán)境音頻信息。例如,環(huán)境聲非限制的音頻信息可以涉及全向的音頻信息。在至少一個示例實施例中,確定環(huán)境聲非限制的音頻信息包括:啟用一個或多個環(huán)境麥克風(fēng)。例如,環(huán)境聲非限制的音頻信息的確定可以包括:包含與語音麥克風(fēng)相關(guān)聯(lián)的音頻信息的至少一部分,以及與環(huán)境麥克風(fēng)相關(guān)聯(lián)的音頻信息(其至少一部分)。在其他示例中,確定環(huán)境聲非限制的音頻信息不包括:啟用一個或多個環(huán)境麥克風(fēng),而是替代地包括:包含與語音麥克風(fēng)相關(guān)聯(lián)的音頻信息(例如使用VAD,其被識別為與環(huán)境聲有關(guān))。
[0111]圖2C是根據(jù)至少一個示例實施例的說明裝置的多個麥克風(fēng)的示意圖。在圖2C的示例中,裝置251包括:多個麥克風(fēng)。能夠看出,麥克風(fēng)252和253在裝置251的同一面上的不同方位處,麥克風(fēng)255在裝置251的與麥克風(fēng)252和253的相對面上,以及麥克風(fēng)254在裝置251的側(cè)面上。在至少一個示例實施例中,麥克風(fēng)252可以是語音麥克風(fēng),以及麥克風(fēng)253-255中的一個或多個麥克風(fēng)可以是環(huán)境麥克風(fēng)。在一些示例中,當(dāng)該裝置在使用時,麥克風(fēng)252本身可以是用于朝向用戶的嘴的波束成型而布置的密集的麥克風(fēng)的陣列。
[0112]圖3A-3C是根據(jù)至少一個示例實施例的說明指示環(huán)境聲指令的輸入的示意圖。圖3A-3C的示例僅是指示環(huán)境聲指令的輸入的示例,并且不限制權(quán)力要求書的范圍。例如,用戶和裝置之間的相互關(guān)系可以變化,裝置的定向可以變化,用戶與裝置的接近性可以變化,和/或諸如此類。
[0113]在許多情況中,可能期望的是,音頻上行鏈路的音頻信息是環(huán)境聲限制
當(dāng)前第3頁1 2 3 4 5 6 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1