用于多個麥克風的自動化增益匹配的制作方法
【專利說明】用于多個麥克風的自動化増益匹配
[0001] 優(yōu)先權申明
[0002] 本申請主張2013年5月16日提交的美國臨時專利申請No. 61/824,222和2013 年12月23日提交的美國非臨時申請No. 14/139, 370的優(yōu)先權,以上申請的內(nèi)容通過引用 以其全文并入本文中。
技術領域
[0003] 本發(fā)明總體上涉及用于多個麥克風的自動化增益匹配。
【背景技術】
[0004] 技術的進步已經(jīng)產(chǎn)生了更小且功能更強大的運算裝置。例如,當前存在多種便攜 式個人運算裝置,包含無線運算裝置,例如便攜式無線電話、個人數(shù)字助理(PDA)和尋呼裝 置,這些裝置小巧、輕便且易于用戶攜帶。更具體來說,便攜式無線電話(例如,蜂窩電話和 因特網(wǎng)協(xié)議(IP)電話)可經(jīng)由無線網(wǎng)絡傳送話音和數(shù)據(jù)包。進一步,許多此些無線電話包 含并入其中的其它類型的裝置。例如,無線電話還可以包含數(shù)碼靜物相機、數(shù)碼攝像機、數(shù) 字記錄器和音頻文件播放器。而且,此些無線電話可處理可執(zhí)行指令,包含軟件應用,例如 可以用于訪問因特網(wǎng)的網(wǎng)絡瀏覽器應用。這樣,這些無線電話可以包含顯著的運算能力。
[0005] 無線電話中的音頻處理系統(tǒng)可以使用多麥克風系統(tǒng),所述多麥克風系統(tǒng)基于多信 道數(shù)字處理算法提高音頻質(zhì)量。例如,相比于單麥克風系統(tǒng),多麥克風系統(tǒng)可以提供增強的 噪聲抑制(例如,平穩(wěn)噪聲抑制及非平穩(wěn)噪聲抑制)且可允許所述音頻處理系統(tǒng)實現(xiàn)空間 有關的音頻特征,例如位置相關的噪聲。
[0006] 然而,當存在多麥克風系統(tǒng)的麥克風之間的增益(例如,靈敏度)失配,音頻處理 系統(tǒng)的性能可能會降低。用于校正此些增益失配的增益校準計算可能不準確且可能是處理 資源上的很大負擔。
【發(fā)明內(nèi)容】
[0007] 公開了用于相對于多個麥克風的自動化增益匹配的一種方法和一種設備。來自 多個麥克風的音頻信號可以在特定時間實例中進行數(shù)字取樣以生成數(shù)字數(shù)據(jù)幀。例如,來 自參照麥克風的音頻信號可在第一時間進行數(shù)字取樣以生成參照數(shù)據(jù)幀,且來自目標麥克 風的音頻信號也可以在第一時間進行數(shù)字取樣以生成目標數(shù)據(jù)幀。單源識別符(SSI)可以 確定一個源存在于參照數(shù)據(jù)幀中,且可以確定一個源存在于目標數(shù)據(jù)幀中。單信道信號檢 測器(SC-SD)可以確定一個源是否對應于兩種數(shù)據(jù)幀的語音或背景噪聲。如果一個源對應 于兩種數(shù)據(jù)幀的背景噪聲,則可以確定與參照數(shù)據(jù)幀的功率和目標數(shù)據(jù)幀的功率相關聯(lián)的 功率比。功率比可以添加到功率比的直方圖以確定用于調(diào)整目標麥克風的增益的增益校準 值。例如,增益校準值可以基于直方圖中具有最高計數(shù)的特定功率比。
[0008] 在特定實施例中,方法包含:在第一時間在處理器處從第一麥克風接收第一數(shù)據(jù) 幀。所述方法還包含在第一時間從第二麥克風接收第二數(shù)據(jù)幀。所述方法還包含:響應于 確定第一數(shù)據(jù)幀和第二數(shù)據(jù)幀為噪聲數(shù)據(jù)幀,基于第一數(shù)據(jù)幀和第二數(shù)據(jù)幀計算第一麥克 風與第二麥克風的功率比。
[0009] 在另一特定實施例中,設備包含處理器和可由處理器訪問的存儲器。存儲器存儲 指令,所述指令可由處理器執(zhí)行以使處理器在第一時間從第一麥克風接收第一數(shù)據(jù)幀。指 令還使處理器在第一時間從第二麥克風接收第二數(shù)據(jù)幀。指令還使處理器:響應于確定第 一數(shù)據(jù)幀和第二數(shù)據(jù)幀為噪聲數(shù)據(jù)幀,基于第一數(shù)據(jù)幀和第二數(shù)據(jù)幀計算第一麥克風與第 二麥克風的功率比。
[0010] 在另一特定實施例中,設備包含用于在第一時間從第一麥克風接收第一數(shù)據(jù)幀的 裝置。所述設備還包含用于在第一時間從第二麥克風接收第二數(shù)據(jù)幀的裝置。所述設備還 包含用于響應于確定第一數(shù)據(jù)幀和第二數(shù)據(jù)幀為噪聲數(shù)據(jù)幀,基于第一數(shù)據(jù)幀和第二數(shù)據(jù) 幀計算第一麥克風與第二麥克風的功率比的裝置。
[0011] 在另一特定實施例中,計算機可讀存儲媒體包含指令,所述指令在由處理器執(zhí)行 時,使處理器在第一時間從第一麥克風接收第一數(shù)據(jù)幀。指令還可以使處理器在第一時間 從第二麥克風接收第二數(shù)據(jù)幀。指令還可使處理器響應于確定第一數(shù)據(jù)幀和第二數(shù)據(jù)幀為 噪聲數(shù)據(jù)幀,基于第一數(shù)據(jù)幀和第二數(shù)據(jù)幀計算第一麥克風與第二麥克風的功率比。
[0012] 所公開的實施例中的至少一個所提供的一個具體優(yōu)點是生成麥克風增益失配的 快速和準確估計值的能力。所公開的實施例中的至少一個所提供的另一具體優(yōu)點是:相比 于最小統(tǒng)計算法,提高的麥克風增益失配計算的穩(wěn)定性,以及使麥克風增益失配的估計值 適應不同類型的背景噪聲或噪聲頻譜形狀的能力。經(jīng)審查整個申請,包含以下部分:附圖說 明、【具體實施方式】和權利要求書,本發(fā)明的其它方面、優(yōu)點和特征將變得顯而易見。
【附圖說明】
[0013] 圖1是可操作以確定目標麥克風的增益校準值的系統(tǒng)的一個具體的說明性實施 例的框圖;
[0014] 圖2是噪聲檢測器的一個具體的說明性實施例的框圖;
[0015] 圖3說明了來自具體的幀的人類語音的頻譜、循環(huán)移位版本的頻譜,以及自循環(huán) 相關函數(shù);
[0016] 圖4是噪聲檢測器的另一個具體的說明性實施例的框圖;
[0017] 圖5是可操作以確定數(shù)據(jù)幀是否為噪聲數(shù)據(jù)幀的系統(tǒng)的一個具體的說明性實施 例的框圖;
[0018] 圖6是功率比計算器的一個具體的說明性實施例的框圖;
[0019] 圖7是基于直方圖的估計器的一個具體的說明性實施例的框圖;
[0020] 圖8是基于直方圖的估計器的另一個具體的說明性實施例的框圖;
[0021] 圖9說明了功率值比的直方圖;
[0022] 圖10是確定目標麥克風的增益校準值的方法的一個具體實施例的流程圖;以及
[0023] 圖11是無線裝置的框圖,所述無線裝置包含可操作以確定目標麥克風的增益校 準值的組件。
【具體實施方式】
[0024] 參照圖1,示出了可操作以確定目標麥克風的增益校準值的系統(tǒng)100的特定說明 性實施例。系統(tǒng)100包含噪聲檢測器102、功率比計算器104,以及基于直方圖的估計器106。 噪聲檢測器102耦合到功率比計算器104,且功率比計算器104耦合到基于直方圖的估計器 106。在特定實施例中,噪聲檢測器102、功率比計算器104,以及基于直方圖的估計器106 可以包含在處理器中或者可以包含可由處理器執(zhí)行的指令。
[0025] 噪聲檢測器102和功率比計算器104經(jīng)配置以接收和處理多個數(shù)據(jù)幀。例如,可 將第一數(shù)據(jù)幀112、第二數(shù)據(jù)幀114,以及第N數(shù)據(jù)幀116提供給噪聲檢測器102和功率比 計算器104,其中N為大于1的任意整數(shù)。例如,如果N等于4,則將四個數(shù)據(jù)幀提供給噪聲 檢測器102和功率比計算器104。每個數(shù)據(jù)幀112到116可以對應于從來自對應的麥克風 的模擬音頻生成的數(shù)字化音頻樣本。來自對應的麥克風的模擬音頻可以同時(例如,第一 時間)取樣以生成數(shù)據(jù)幀112到116。例如,第一數(shù)據(jù)幀112可以對應于來自第一麥克風 (未示出)的第一模擬音頻的第一數(shù)字化音頻樣本,第二數(shù)據(jù)幀114可以對應于來自第二麥 克風(未示出)的第二模擬音頻的第二數(shù)字化音頻樣本,且第N數(shù)據(jù)幀116可對應于來自 第N麥克風(未示出)的第N模擬音頻的第N數(shù)字化音頻樣本。第一模擬音頻、第二模擬 音頻,以及第N模擬音頻可以在第一時間取樣以分別生成第一數(shù)據(jù)幀112、第二數(shù)據(jù)幀114, 以及第N數(shù)據(jù)幀。第一時間可對應于特定時間段。例如,在特定實施例中,第一時間可對應 于特定時鐘周期。在特定實施例中,第一麥克風可以是參照麥克風,且每個附加麥克風可以 是目標麥克風。
[0026] 每個數(shù)據(jù)幀112到116可以是語音數(shù)據(jù)幀、噪聲數(shù)據(jù)幀,或者多源數(shù)據(jù)幀(例如, 包含大量語音和大量噪聲的數(shù)據(jù)幀)。在特定實施例中,語音數(shù)據(jù)幀可以包含對應于語音的 大量數(shù)據(jù)和對應于背景噪聲的最少(或零)數(shù)據(jù)。噪聲數(shù)據(jù)幀可以包含對應于背景噪聲的 大量數(shù)據(jù)和對應于語音的最少(或零)數(shù)據(jù)。響應于接收到數(shù)據(jù)幀112到116,噪聲檢測器 102可以經(jīng)配置以確定是否每個數(shù)據(jù)幀112到116都為噪聲數(shù)據(jù)幀。例如,噪聲檢測器102 可確定每個數(shù)據(jù)幀112到116是單源數(shù)據(jù)幀(例如,對應于單一類型的音頻數(shù)據(jù))還是多 源數(shù)據(jù)幀。為了說明,單源數(shù)據(jù)幀可以是語音數(shù)據(jù)幀或者噪聲數(shù)據(jù)幀。多源數(shù)據(jù)幀可以是 包含大量噪聲和語音的數(shù)據(jù)幀。此些數(shù)據(jù)幀包含對應于兩種類型的音頻數(shù)據(jù)(例如,噪聲 類型和語音類型)的數(shù)據(jù)。作為一個說明性實例,噪聲檢測器102可以確定第一數(shù)據(jù)幀112 是語音數(shù)據(jù)幀、噪聲數(shù)據(jù)幀,還是多源數(shù)據(jù)幀。同樣,噪聲檢測器102可以確定第二數(shù)據(jù)幀 114和第N數(shù)據(jù)幀116中的每一者是語音數(shù)據(jù)幀、噪聲數(shù)據(jù)幀,還是多源數(shù)據(jù)幀。噪聲檢測 器102經(jīng)配置以響應于確定與特定取樣時間(或時間指數(shù))相關聯(lián)的任何一個數(shù)據(jù)幀112 到116是多源數(shù)據(jù)幀,刪除(或者停止用于增益匹配目的的處理)與特定取樣時間(或時 間指數(shù))相關聯(lián)的每個數(shù)據(jù)幀112到116。為了說明,如果第一數(shù)據(jù)幀112確定為包含對應 于噪聲和語音的數(shù)據(jù),則第一數(shù)據(jù)幀112、第二數(shù)據(jù)幀114,以及第N數(shù)據(jù)幀116都可以丟棄 (例如,可以停止用于增益匹配目的的數(shù)據(jù)幀112到116中的每一個的處理)。
[0027] 當每個數(shù)據(jù)幀112到116是單源數(shù)據(jù)幀(例如,對應于單一類型的音頻數(shù)據(jù))時, 噪聲檢測器102可以識別每個數(shù)據(jù)幀112到116是否為噪聲數(shù)據(jù)幀或語音數(shù)據(jù)幀。為了說 明,噪聲檢測器102可以確定第一數(shù)據(jù)幀112是否為語音數(shù)據(jù)幀,噪聲檢測器102可以確定 第二數(shù)據(jù)幀114是否為語音數(shù)據(jù)幀等。響應于確定每個數(shù)據(jù)幀112到116不是語音數(shù)據(jù)幀, 噪聲檢測器102可以生成激活信號122以實現(xiàn)(例如,激活)功率比計算器104。例如,確 定每個數(shù)據(jù)幀112到116不是語音數(shù)據(jù)幀可以指示每個數(shù)據(jù)幀112到116為噪聲數(shù)據(jù)幀。
[0028] 功率比計算器104經(jīng)配置以響應于從噪聲檢測器102接收到激活信號122,接收數(shù) 據(jù)幀112到116中的每一個以及計算第一麥克風(例如,參照麥克風)與每個目標麥克風 的功率比。例如,功率比計算器104可以基于第一數(shù)據(jù)幀112和第二數(shù)據(jù)幀114計算第一 麥克風與第二麥克風的第一功率比。另外,功率比計算器104可以基于第一數(shù)據(jù)幀112和 第N數(shù)據(jù)幀116來計算第一麥克風與第N麥克風的第(N-I)功率比。在特定實施例中,當 確定功率比時,功率比計算器102可以利用時域平均(例如,平滑)。功率比計算器104可 以生成指示第一功率比和第二功率比的強度信號132??梢詫姸刃盘?32提供給基于直 方圖的估計器106。在特定實施例中,第一功率比可以對應于特定麥克風的增益校準值。例 如,第一功率比(對應于第一麥克風與第二麥克風之間的功率比)可以對應于第二麥克風 的增益校準值142。
[0029] 基于直方圖的估計器106經(jīng)配置以從功率比計算器104接收強度信號132且維護 每個功率比的直方圖。在特定實施例中,使