專利名稱:錄音控制方法和錄音設備的制作方法
技術領域:
本 發(fā)明涉及信號技術,特別涉及一種錄音控制技術。
背景技術:
隨著數(shù)碼產(chǎn)品的普及,各種錄音設備的應用越來越廣,比如錄音筆或帶有錄音功能的其它數(shù)碼產(chǎn)品等,越來越多的被人們所使用。為節(jié)省存儲空間,帶有聲控錄音功能的錄音設備應運而生,目的在于通過監(jiān)測目標聲音是否存在以控制錄音,有目標聲音存在時開始錄音,沒有目標聲音時暫停錄音,這樣可以避免存儲空間的浪費,另外也可以使得錄音資料更緊湊,節(jié)約回放時間?,F(xiàn)有的聲控錄音的解決方法是,設定一個固定的閾值,然后逐幀檢測采集信號的能量,如果能量大于這個閾值,則啟動錄音,如果能量小于這個閾值,則暫停錄音。本申請發(fā)明人發(fā)現(xiàn),根據(jù)錄音距離的遠近,目標聲音的特性有所不同,而現(xiàn)有技術并沒有針對不同距離的目標聲音給出相應的聲控機制,從而造成聲音控制功能的可靠性較低。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種錄音控制方法和錄音設備,用以提高聲控錄音的可靠性。一方面,提供一種錄音設備的錄音控制方法,所述錄音設備上設置有至少兩個聲音采集單元,所述錄音設備具有近講模式和遠講錄音模式,所述近講模式為錄音距離在預設定錄音距離以內(nèi)的錄音模式;所述遠講模式為錄音距離在預設定錄音距離以外的錄音模式;在近講模式下,所述錄音設備的錄音控制方法包括獲得每一個聲音采集單元采集到的當前幀目標聲音數(shù)據(jù),并確定每一個當前幀目標聲音數(shù)據(jù)對應的目標聲音信號強度;當其中兩個聲音信號強度的比值大于為近講模式設定的第一判決閾值的第一設定條件滿足時,將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù),所述第一判決閾值根據(jù)錄音設備的錄音距離和各聲音采集單元之間的間距確定;及當?shù)谝辉O定條件不滿足時,判斷第一設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間是否到達設定的沉默時長當所述第一設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間到達設定沉默時長時,停止將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù);當?shù)谝辉O定條件從開始不滿足的起始幀至當前幀的持續(xù)時間未到達設定沉默時長時,繼續(xù)將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù);在遠講模式下,所述錄音設備的錄音控制方法包括根據(jù)各聲音采集單元采集到的各當前幀目標聲音數(shù)據(jù)確定當前幀信號的平均信噪比;當所述平均信噪比大于為遠講模式設定的第二判決閾值的第二設定條件滿足時,將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù),所述第二判決閾值大于I ;及當?shù)诙O定條件不滿足時,判斷第二設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間是否到達設定的沉默時長當所述第二設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間到達設定沉默時長時,停止將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù);當所述第二設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間未到達設定沉默時長時,繼續(xù)將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù)。另一方面,提供一種錄音設備,包括至少兩個聲音采集單元,所述錄音設備具有近講模式和遠講錄音模式,所述近講模式為錄音距離在預設定錄音距離以內(nèi)的錄音模式;所述遠講模式為錄音距離在預設定錄音距離以外的錄音模式;所述錄音設備還包括第一閾值存儲單元,用于存儲為近講模式設定的第一判決閾值,所述第一判決閾值根據(jù)錄音設備的錄音距離和各聲音采集單元之間的間距確定; 第二判決閾值存儲單元,用于存儲第二判決閾值,所述第二判決閾值大于I ;錄音數(shù)據(jù)存儲單元,用于存儲錄音數(shù)據(jù);及錄音控制單元,用于在所述錄音設備的近講模式下從所述第一閾值存儲單元獲得所述第一判決閾值,并在接收到每一個聲音采集單元采集到的當前幀目標聲音數(shù)據(jù),確定每一個當前幀目標聲音數(shù)據(jù)對應的目標聲音信號強度,以及當其中兩個聲音信號強度的比值大于第一判決閾值的第一設定條件滿足時,將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲到所述存儲單元;當?shù)谝辉O定條件不滿足時,判斷第一設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間是否到達設定的沉默時長當所述第一設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間到達設定沉默時長時,停止將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù);當?shù)谝辉O定條件從開始不滿足的起始幀至當前幀的持續(xù)時間未到達設定沉默時長時,繼續(xù)將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù);錄音控制單元,還用于在所述錄音設備的遠講模式下從所述第二判決閾值存儲單元獲得第二判決閾值,根據(jù)各當前幀目標聲音數(shù)據(jù)確定當前幀信號的平均信噪比,并當所述平均信噪比大于第二判決閾值的第二設定條件滿足時,將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù),當?shù)诙O定條件不滿足時,判斷第二設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間是否到達設定的沉默時長當所述第二設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間到達設定沉默時長時,停止將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù);當所述第二設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間未到達設定沉默時長時,繼續(xù)將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù)。本發(fā)明實施例提出的錄音控制方法,改進了目前的聲控錄音中僅僅采用能量閾值的方法,提供了兩種錄音模式,在近講模式下根據(jù)至少兩個聲音采集單元采集的目標聲音之間的聲強比作為是否錄音的判決依據(jù);在遠講模式下,根據(jù)至少兩個聲音采集單元采集的目標聲音之間的信噪比作為是否錄音的判決依據(jù)性,使得錄音控制技術有較好的判斷準確性。。
圖I為本發(fā)明實施例提供的近講模式聲強比判決閾值獲得方法示意圖;圖2為本發(fā)明實施例提供的信噪比估計方法流程示意圖;圖3為本發(fā)明實施例提供的近講模式錄音控制方法流程示意圖;圖4為本發(fā)明實施例提供的遠講模式錄音控制方法流程示意圖;圖5為本發(fā)明實施例提供的錄音設備結構示意圖。
具體實施例方式本發(fā)明實施例充分考慮到錄音距離對目標聲音特性造成的影響,根據(jù)錄音距離遠近提出兩種不同的錄音控制技術,下面結合附圖進行詳細說明。一、近講模式 近講模式也可稱為口述模式,即錄音距離比較近,聲音采集單元的靈敏度可以設置的較低,例如采訪或自述時進行的錄音。這時,聲波到達錄音裝置的聲音采集單元時為球面波,球面波的聲波強度與距離的平方成反比,一般情況下,錄音裝置具備兩個或兩個以上的聲音采集單元,如果不同聲音采集單元采集到的聲音的強度比值滿足球面波特性,則可以據(jù)此判定目標聲音存在,應該啟動錄音。而球面波的特性和聲源距離以及采集單元之間的間距相關,因此在設定聲強比判定閾值時,需要根據(jù)為近講模式設定的最大錄音距離或常規(guī)錄音距離,以及各個聲音采集單元之間的距離確定。如圖I所示,以錄音設備具備的兩個聲音采集單元為例,兩個聲音采集單元的間距為3cm,近講的常規(guī)錄音距離為10cm,錄音設備例如圖示的錄音筆,兩個聲音采集單元例如圖示的麥克風Micl和Mic2,則聲源距離Micl的距離rl = IOcm ;聲源距離Mic2的距離r2 = 13cm ;假設兩個聲音采集單元錄到的聲音強度為Pl和P2,則如公式I所示
Pl Tl*Tl化礦—吐的(I)考慮到如果聲源距離錄音筆的最遠距離大于10cm,則這個比值Pr會降低,反之會升高。進一步考慮到錄音筆的擺放方向并不能像圖I所示,和聲源處于一條直線上,如果擺放斜了,那么聲源到兩個聲音采集單元的距離差將小于3cm,則近講的有效距離就會縮短,因此,聲音強度的判決閾值小于I. 69,根據(jù)經(jīng)驗可以將判決閾值設定為I. 3,以判定是否存在近講目標聲音聲源,從而實現(xiàn)近講目標聲音檢測。為增加聲強檢測的準確性,本發(fā)明實施例還可以采用一階低通濾波對Pr做平滑處理,具體方法為Prn,= Prn-/ *alfa+Prn* (1-alfa)其中Prn為第n次采集的聲強值,Prlri’根據(jù)第n_l次采集的聲強值進行一階低通濾波后獲得的聲強均值,Pr/為根據(jù)第n次采集的聲強值進行一階低通濾波后獲得的聲強均值,alfa為0 I之間的加權系數(shù),可以為0. 9,0. 8或其它值,本發(fā)明實施例不加限定。本領域技術人員還可以采用其它濾波方法進行平滑處理,這里不再一一詳細說明?;谏鲜鲈?,當給定近講模式的常規(guī)錄音距離或最遠錄音距離,并且已知各錄音單元之間間距的情況下,可以確定聲強比閾值Threshold,當檢測到的任意兩個聲音采集單兀米集的同一巾貞聲音信號的聲強比Pr大于Threshold時,就可以判定為有近講目標聲音出現(xiàn),需要將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù),當上述條件從開始不滿足的起始幀至當前幀的持續(xù)時間到達設定沉默時長時,可以判為無目標聲音,停止將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù)。本領域技術人員根據(jù)經(jīng)驗值可以設定聲強比的判決閾值,也可以根據(jù)近講模式的常規(guī)錄音距離或最遠錄音距離,以及各錄音單元之間間距進行合理推算,下面給出兩種具體計算方法,設錄音設備包括多個聲音采集單元。第一種計算根據(jù)設定的最遠錄音距離確定,具體包括如下步驟確定各聲音采集單元兩兩組合后形成的I組聲音采集單元組;對其中每一組聲音采集單元,根據(jù)公式I確定=Zi = (R+df/R2,其中=Zi為第i組聲音采集單元對應的最小聲強比閾值,R為錄音設備的最遠錄音距離,屯為第i組聲音采集
單元中的兩個聲音采集單元之間的間距;確定所述第一判決閾值為大于等于Z1-Z1中最小值或小于等于其中最大值的任意值。上述方法中,利用公式I,可以根據(jù)最遠錄音距離計算出每一組聲音采集設備的最小聲強比,然后將聲強比判決閾值設定為大于等于Z1 Z1中最小值或小于等于其中最大值的任意值。較佳的,聲強比判決閾值設定為=Z1-Z1的平均值。本領域技術人員還可以根據(jù)Z1 Z1,通過試驗方法確定B'的具體取值,這里不再一一詳細說明。根據(jù)第一種計算方法,還可以進一步確定裝置的最遠錄音距離R為公式B'=(RM)VR2的大于零的解。第二種計算根據(jù)設定的常規(guī)錄音距離確定,具體包括如下步驟確定各聲音采集單元兩兩組合后形成的I組聲音采集單元組;對其中每一組聲音采集單元,根據(jù)公式I確定=Bi = (r+cQVr2,其中=Bi為第i組聲音采集單元對應的常規(guī)聲強比閾值,r為錄音設備的常規(guī)錄音距離,屯為第i組聲音采集單元中的兩個聲音采集單元之間的間距;確定B為所述B1 B1的平均值;確定所述第一判決閾值B'為大于I小于B的值。根據(jù)本發(fā)明實施例技術方案的原理,最遠錄音距離的判決閾值應該小于常規(guī)錄音距離的判決閾值,因此取B'為大于I小于B的值,當然,B也可以是B1 B1中的最大值或最小值,較佳的B'為1和B的平均值。本領域技術人員還可以根據(jù)B1-B1,通過試驗方法確定B'的具體取值,這里不再一一詳細說明。根據(jù)上述原理,在錄音設備中設定近講模式,當用戶選擇近講模式錄音時,根據(jù)設定的聲強比閾值判定是否錄音,由于聲強比閾值的設定充分考慮了近講聲源的球面波特性和錄音距離,從而提高了錄音控制的可靠性。根據(jù)上述原理,當近講模式的最遠錄音距離確定后,如果在近講模式的最遠錄音距離之外進行錄音,則本發(fā)明實施例稱之為遠講模式錄音。對于遠講模式下的目標聲音的檢測,本發(fā)明實施例也提出了相應的檢測方法,下面進行詳細說明。二、遠講模式
本發(fā)明實施例考慮到錄音設備遠離聲源時,聲波信號的到達各錄音采集設備時基本上成為平面波,各聲音采集單元采集的聲音信號強度與距離的相關性可以忽略,而聲音的信噪比特性可以用于判決聲音是否存在,因此本發(fā)明實施例提出一種在遠講模式下,利用信噪比來估計目標聲音存在概率的錄音控制技術。如圖2所示,為遠講目標聲音檢測原理示意圖,對于各聲音采集單元采集的多路信號取平均,利用信號平均值進行分析可以減少運算量。其中Avg模塊就是將兩路信號取平均的操作,獲得平均信號Sf,然后信號經(jīng)過分析窗平滑后,利用傅立葉變換FFT,將信號從時域變換到頻域,假定頻域信號用Y[k]表示,對Y[k]進行信噪比估計,首先要估計背景噪聲的方差。背景噪聲通常是不穩(wěn)定且時變的,這就要求噪聲估計算法能夠實時跟蹤背景噪聲的變化,首先假設信號的能量要大于噪聲的能量,這個假設在一般的應用場合都能滿足,于是噪聲估計的基本原理就是在目標聲音存在概率較 小的時候,通過不斷搜索最小能量,來估計噪聲方差,具體方法包括如下步驟I、首先得到Sf每條譜線的譜能量,并進行平滑處理;平滑處理包括用漢寧窗作區(qū)域平滑和用一階遞推平均處理方法進一步做時間上的平滑處理,其中,用漢寧窗作區(qū)域平滑為X b[k]\Y[k-i]f
k=-W其中b代表漢寧窗,漢寧窗的寬度為2W,W可以取I。用一階遞推平均處理方法進一步做時間上的平滑處理為.S[i] = a sS[i] + (l-a s) Sf [i]其中as 滿足 0 < as < I2、搜索平滑處理后的信號S[i]每條譜線的局部最小能量Smin[i];這個局部最小值的搜索可以用快降慢升的遞推簡化算法實現(xiàn),即如果S[i] > Smin [i],則 Smin [i] = Smin [i] *alfa+S [i] * (1-alfa)如果S[i] < = Smin [i],則 Smin [i] = Smin [i] *beta+S [i] * (1-beta)其中alfa和beta都是0 I之間的數(shù),為了體現(xiàn)快降慢升的特點,一般alfa >beta ;3、對每一條譜線,分別將Smin[i]作為噪聲方差,而S[i]為噪聲加目標聲音的方差。即目標聲首方差為Sv [i] = S [i] -Smin [i]則第i個譜線上的信噪比為SNR[i] = Sv [i] /Smin [i]所有譜線的SNR[i]的平均信噪比為SNR = Average (SNR[i]), i = 0-fftsize/2上述信噪比估計技術為本領域技術人員所熟知,本領域技術人員還可以采用其它的信噪比估計技術獲得多個信號的平均信噪比,本發(fā)明實施例中,當根據(jù)多個信號采集單元采集到的信號獲得的平均信噪比大于1,或者比I稍大的數(shù),例如I. I或I. 2時,或者信號質(zhì)量非常好,信噪比非常大,達到幾十或幾百時,可以判決遠講聲源的存在,開始錄音。在遠講模式下,根據(jù)不同的錄音質(zhì)量要求,可以將信噪比的判決閾值設定為大于I的數(shù),一般不超過I. 5即可。三、錄制備用數(shù)據(jù)本發(fā)明實施例還進一步考慮到啟動錄音之前有可能會錯過一些有用的聲音數(shù)據(jù),因此在錄音設備被啟動或者每一次暫停錄音后,后循環(huán)錄制一段備用數(shù)據(jù),備用數(shù)據(jù)為各聲音采集單元在當前幀之前的設定備用時長內(nèi)采集到的目標聲音數(shù)據(jù);以及每一次啟動錄音時,還將之前錄制的備用數(shù)據(jù)存儲為當前幀之間的錄音數(shù)據(jù)。為實現(xiàn)備用數(shù)據(jù)的錄制,本發(fā)明實施例提供一種具體實現(xiàn)方式首先,根據(jù)設定的備用時長,申請相應存儲量的回滾內(nèi)存,其中在回滾內(nèi)存中,每一個聲音采集單元采集的各幀聲音數(shù)據(jù),可以存儲為一個循環(huán)鏈表結構,該循環(huán)鏈表結構的每個節(jié)點可以用一個如下的結構體表不
Structure Node {
Short Datal [L];
Short Data2{L};
Int *NextNode;
}Node表示這個節(jié)點的結構體名稱,Datal [L]為Micl采集的某一幀信號,Data2為Mic2采集的某一幀信號。NextNode為指向下一幀信號,即下一個節(jié)點的指針。其中L為幀長。假設,信號的采樣率為8k,幀長L為128,貝U,如果希望回滾內(nèi)存中暫存0.5s的數(shù)據(jù),則大概需要暫存32幀。即可以設置循環(huán)鏈表中有32個節(jié)點,并定義為Nodel,Node2,. . .,Node32,然后初始化時將32個節(jié)點串聯(lián)起來,形成循環(huán)鏈表,即Nodel- > NextNode = Node2 ;Node2- > NextNode = Node3 ;…Node31- > NextNode = Node32 ;Node32- > NextNode = Nodel ;假設NodeCurrent為當前節(jié)點,則每來一巾貞信號,需要做將Micl 米集的信號賦給 NodeCurrent. Datal將Mic2 米集的信號賦給 NodeCurrent. Data2NodeCurrent = NodeCurrent- > NextNode通過這種方法,對于每一個信號采集單元,可以始終在回滾內(nèi)存中保留最新的
0.5s的數(shù)據(jù)。以備需要的時候使用。如果上一幀處于暫停錄音狀態(tài),而當前幀判決結果為有目標聲音,則啟動錄音,并連接回滾內(nèi)存模塊,將錄音起始點回滾到回滾內(nèi)存的數(shù)據(jù)起始位置。假設起始位置的節(jié)點位NodeHead,則可根據(jù)回滾內(nèi)存的當前節(jié)點NodeCurrent,通過NodeHead =NodeCurrent- > NextNode得到起始節(jié)點。然后將整個循環(huán)列表里的節(jié)點里的數(shù)據(jù)全部錄制下來。這樣就可以將目標聲音起始段的一部分本來要丟掉的數(shù)據(jù),通過回滾的方式找回來?;貪L的備用時間長度,可以通過設置節(jié)點個數(shù)來控制。基于上述原理,可以在錄音設備中設置近講和遠講兩種模式,根據(jù)用戶的選擇,采用對應的控制方法判斷是否啟動錄音,也可以在專用的近講錄音設備或者遠講錄音設備中采用其中對應的控制方法控制錄音。如圖3所示,本發(fā)明實施例提供的近講模式錄音控制方法包括如下步驟S300、錄音設備開機;
S301、錄制備用數(shù)據(jù)并保存在緩存中;S302、獲得每一個聲音采集單元采集到的當前幀目標聲音數(shù)據(jù),并確定每一個當前中貞目標聲音數(shù)據(jù)對應的目標聲音信號強度;S303、判定第一設定條件是否滿足;S304、當?shù)谝辉O定條件滿足時錄音;當其中兩個聲音信號強度的比值大于第一判決閾值的第一設定條件滿足時錄音,包括將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù),如果緩存中錄制有備用數(shù)據(jù),則還將備用數(shù)據(jù)存儲為錄音數(shù)據(jù),并停止步驟S301 ;S305、當?shù)谝辉O定條件不滿足時,判斷第一設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間是否到達設定沉默時長;當?shù)谝辉O定條件從開始不滿足的起始幀至當前幀的持續(xù)時間未到達設定沉默時長時,繼續(xù)步驟S304錄音,否則執(zhí)行步驟S306暫停錄音,包括停止將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù),并觸發(fā)步驟S301執(zhí)行,將數(shù)據(jù)錄制為備用數(shù)據(jù),保存在緩存中。第一設定條件即為近講模式判定條件,即兩個聲音信號強度的是否比值大于針對近講模式設定的聲強比判決閾值,具體確定方法如前,這里不再重復描述。設定沉默時長為無目標聲音狀態(tài)持續(xù)的最長時間,可以利用一個計數(shù)器進行檢測,只有當無目標聲音狀態(tài)持續(xù)一段時間后,才暫停錄音。這樣做的原因是,人說話一般都有目標聲音間歇期,因此,較短的目標聲音間歇期應該給與保留。因此,設定無目標聲音狀態(tài)的持續(xù)時間例如3s,3s后,如果仍然判定為無目標聲音,則暫停錄音。無目標聲音狀態(tài)計數(shù)器在每次判定為有啟動錄音都歸O。如圖4所示,本發(fā)明實施例提供的遠講模式錄音控制方法包括如下步驟S400、錄音設備開機;S401、錄制備用數(shù)據(jù)并保存在緩存中;S402、獲得每一個聲音采集單元采集到的當前幀目標聲音數(shù)據(jù),并根據(jù)各當前幀目標聲音數(shù)據(jù)確定當前幀信號的平均信噪比;S403、判定平均信噪比大于第二判決閾值的第二設定條件是否滿足;S404、當?shù)诙O定條件滿足時錄音;當其中兩個聲音信號強度的比值大于第二判決閾值的第二設定條件滿足時錄音,包括將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù),如果緩存中錄制有備用數(shù)據(jù),則還將備用數(shù)據(jù)存儲為錄音數(shù)據(jù),并停止步驟S401 ;
S405、當?shù)诙O定條件不滿足時,判斷第二設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間是否到達設定沉默時長;當?shù)诙O定條件從開始不滿足的起始幀至當前幀的持續(xù)時間未到達設定沉默時長時,繼續(xù)步驟S404錄音,否則執(zhí)行步驟S406暫停錄音,包括停止將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù),并觸發(fā)步驟S401執(zhí)行,將數(shù)據(jù)錄制為備用數(shù)據(jù),保存在緩存中。第二設定條件即為遠講模式判定條件,即當前幀信號的平均信噪比是否大于針對遠講模式設定的信噪比判決閾值,具體確定方法如前,這里不再重復描述。如果錄音設備同時設置了可選在近講模式和遠講模式,則根據(jù)用戶的選擇,在開機后先判定錄音模式,然后根據(jù)用戶選擇的錄音模式,進入圖3或圖4所示的控制流程。如圖5所示,本發(fā)明實施例還提供一種可以根據(jù)近講模式控制錄音的錄音設備,包括至少兩個聲音采集單元501(5011、5012. . . 501n),還包括 第一閾值存儲單元502,用于存儲第一判決閾值,第一判決閾值根據(jù)錄音設備的錄音距離和各聲音采集單元之間的間距確定;錄音數(shù)據(jù)存儲單元503,用于存儲錄音數(shù)據(jù);錄音控制單元504,用于從第一閾值存儲單元獲得第一判決閾值,并在接收到每一個聲音采集單元采集到的當前幀目標聲音數(shù)據(jù),確定每一個當前幀目標聲音數(shù)據(jù)對應的目標聲音信號強度,以及當其中兩個聲音信號強度的比值大于第一判決閾值的第一設定條件滿足時,將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲到存儲單元,當?shù)谝辉O定條件從開始不滿足的起始幀至當前幀的持續(xù)時間到達設定沉默時長時,停止將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù)。該錄音設備還可以根據(jù)設定的參數(shù)獲得第一判決閾值,則該錄音設備進一步還可以包括第一判決閾值確定單元505,用于確定第一判決閾值為大于等于Z1 Z1中最小值或小于等于其中最大值的任意值,并將確定的第一判決閾值存儲到第一閾值存儲單元中,其中Zi為任意兩個聲音采集單元組合后,第i組聲音采集單元對應的最小聲強比閾值,Zi=(RM)VR2, R為錄音設備的最遠錄音距離,d,為第i組聲音采集單元中的兩個聲音采集單元之間的間距;或者用于確定第一判決閾值B'為大于I小于B的值,B為B1 B1的平均值,Bi為任意兩個聲音采集單元組合后,第i組聲音采集單元對應的常規(guī)聲強比閾值,Bi=(r+cQVr2,!"為錄音設備的常規(guī)錄音距離。如果該錄音設備進一步還可以根據(jù)遠講模式控制錄音,則還包括第二判決閾值存儲單元506,用于存儲第二判決閾值,第二判決閾值大于I ;模式設置單元507,用于接收用戶的錄音模式設置指示信號,并輸出給錄音控制單元,錄音控制單元根據(jù)接收的錄音模式設置指示信號確認當前錄音模式為最遠錄音距離為R的第一模式時,在接收到每一個聲音采集單元采集到的當前幀目標聲音數(shù)據(jù)后繼續(xù)確認第一設定條件是否滿足;否則從第二判決閾值存儲單元獲得第二判決閾值,根據(jù)各當前幀目標聲音數(shù)據(jù)確定當前幀信號的平均信噪比,并當平均信噪比大于第二判決閾值的第二設定條件滿足時,將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù),當?shù)诙O定條件從開始不滿足的起始幀至當前幀的持續(xù)時間到達設定沉默時長時,停止將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù)。
如果該錄音設備還進一步可以錄制備用數(shù)據(jù),則還包括緩存單元508,用于緩存錄制的備用數(shù)據(jù),錄音控制單元在確定錄音設備被啟動或者暫停錄音后,還用于根據(jù)設定的備用時長,將各聲音采集單元在當前幀之前的設定備用時長內(nèi)采集到的目標聲音數(shù)據(jù)作為備用數(shù)據(jù)存儲到緩存單元中,并在啟動錄音時,將緩存單元中存儲的備用數(shù)據(jù)作為啟動前的錄音數(shù)據(jù)轉存到錄音數(shù)據(jù)存儲單元中。當然,如果是專用遠講模式錄音設備,則可以只包括至少兩個聲音采集單元501 (5011,5012. . . 501n)、錄音數(shù)據(jù)存儲單元503、第二判決閾值存儲單元506和錄音控制單元504,錄音控制單元504根據(jù)遠講模式錄音控制方法控制錄音。專用遠講模式錄音設備還進一步可以錄制備用數(shù)據(jù)時,貝1J可以進一步包括緩存單元508。本發(fā)明實施例提出的錄音控制方法,改進了目前的聲控錄音中僅僅采用能量閾值的方法,而是根據(jù)近講和遠講兩種類別,分別應用適合的目標聲音檢測算法。在近講方式下,采用兩個聲音采集單元之間的聲強比作為是否錄音的判決依據(jù);而在遠講方式下,采用信噪比估計目標聲音的存在概率,使得錄音控制技術在低信噪比下仍然有較好的判斷準確性。進一步還提出錄制一段時間備用數(shù)據(jù)的技術,確保不丟失目標聲音開始階段的數(shù)據(jù),進一步提高了錄音準確性。顯然,本領域的技術人員可以對本發(fā)明實施例進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及其等同技術的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
權利要求
1.一種錄音設備的錄音控制方法,所述錄音設備上設置有至少兩個聲音采集單元,其特征在于,所述錄音設備具有近講模式和遠講錄音模式,所述近講模式為錄音距離在預設定錄音距離以內(nèi)的錄音模式;所述遠講模式為錄音距離在預設定錄音距離以外的錄音模式; 在近講模式下,所述錄音設備的錄音控制方法包括 獲得每一個聲音采集單元采集到的當前幀目標聲音數(shù)據(jù),并確定每一個當前幀目標聲音數(shù)據(jù)對應的目標聲音信號強度; 當其中兩個聲音信號強度的比值大于為近講模式設定的第一判決閾值的第一設定條件滿足時,將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù),所述第一判決閾值根據(jù)錄音設備的錄音距離和各聲音采集單元之間的間距確定;及 當?shù)谝辉O定條件不滿足時,判斷第一設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間是否到達設定的沉默時長當所述第一設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間到達設定沉默時長時,停止將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù);當?shù)谝辉O定條件從開始不滿足的起始幀至當前幀的持續(xù)時間未到達設定沉默時長時,繼續(xù)將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù); 在遠講模式下,所述錄音設備的錄音控制方法包括 根據(jù)各聲音采集單元采集到的各當前幀目標聲音數(shù)據(jù)確定當前幀信號的平均信噪比; 當所述平均信噪比大于為遠講模式設定的第二判決閾值的第二設定條件滿足時,將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù),所述第二判決閾值大于I ;及當?shù)诙O定條件不滿足時,判斷第二設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間是否到達設定的沉默時長當所述第二設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間到達設定沉默時長時,停止將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù);當所述第二設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間未到達設定沉默時長時,繼續(xù)將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù)。
2.如權利要求I所述的錄音控制方法,其特征在于,所述近講模式設定有最遠錄音距離,根據(jù)所述錄音設備的錄音距離和各聲音采集單元之間的間距確定的具體方法包括 確定各聲音采集單元兩兩組合后形成的I組聲音采集單元組; 對其中每一組聲音采集單元,確定=Zi=(IHdi)VR2,其中=Zi為第i組聲音采集單元對應的最小聲強比閾值,R為錄音設備的最遠錄音距離,屯為第i組聲音采集單元中的兩個聲音采集單元之間的間距; 確定所述第一判決閾值為大于等于Z1 Zi中最小值或小于等于其中最大值的任意值。
3.如權利要求2所述的錄音控制方法,其特征在于,所述大于等于Z1 Zi中最小值或小于等于其中最大值的任意值為Zl Zi的平均值。
4.如權利要求I所述的錄音控制方法,其特征在于,根據(jù)所述錄音設備的錄音距離和各聲音采集單元之間的間距確定第一判決閾值的具體方法包括 確定各聲音采集單元兩兩組合后形成的I組聲音采集單元組; 對其中每一組聲音采集單元,確定=Bi=(^di)2A2,其中=Bi為第i組聲音采集單元對應的常規(guī)聲強比閾值,r為錄音設備的常規(guī)錄音距離,Cli為第i組聲音采集單元中的兩個聲音采集單元之間的間距; 確定B為所述B1 Bi的平均值; 確定所述第一判決閾值B丨為大于I小于B的值。
5.如權利要求4所述的錄音控制方法,其特征在于,所述大于I小于B的值為1和B的平均值。
6.如權利要求I所述的錄音控制方法,其特征在于 在確定錄音設備被啟動或者暫停錄音后,還包括啟動錄制備用數(shù)據(jù),所述備用數(shù)據(jù)為各聲音采集單元在當前幀之前的設定備用時長內(nèi)采集到的目標聲音數(shù)據(jù);以及 所述啟動錄音時,還將之前錄制的備用數(shù)據(jù)存儲為當前幀之間的錄音數(shù)據(jù)。
7.一種錄音設備,包括至少兩個聲音采集單元,其特征在于,所述錄音設備具有近講模式和遠講錄音模式,所述近講模式為錄音距離在預設定錄音距離以內(nèi)的錄音模式;所述遠講模式為錄音距離在預設定錄音距離以外的錄音模式;所述錄音設備還包括 第一閾值存儲單元,用于存儲為近講模式設定的第一判決閾值,所述第一判決閾值根據(jù)錄音設備的錄音距離和各聲音采集單元之間的間距確定; 第二判決閾值存儲單元,用于存儲第二判決閾值,所述第二判決閾值大于I ; 錄音數(shù)據(jù)存儲單元,用于存儲錄音數(shù)據(jù);及 錄音控制單元,用于在所述錄音設備的近講模式下從所述第一閾值存儲單元獲得所述第一判決閾值,并在接收到每一個聲音采集單元采集到的當前幀目標聲音數(shù)據(jù),確定每一個當前幀目標聲音數(shù)據(jù)對應的目標聲音信號強度,以及當其中兩個聲音信號強度的比值大于第一判決閾值的第一設定條件滿足時,將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲到所述存儲單元;當?shù)谝辉O定條件不滿足時,判斷第一設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間是否到達設定的沉默時長當所述第一設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間到達設定沉默時長時,停止將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù);當?shù)谝辉O定條件從開始不滿足的起始幀至當前幀的持續(xù)時間未到達設定沉默時長時,繼續(xù)將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù); 錄音控制單元,還用于在所述錄音設備的遠講模式下從所述第二判決閾值存儲單元獲得第二判決閾值,根據(jù)各當前幀目標聲音數(shù)據(jù)確定當前幀信號的平均信噪比,并當所述平均信噪比大于第二判決閾值的第二設定條件滿足時,將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù),當?shù)诙O定條件不滿足時,判斷第二設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間是否到達設定的沉默時長當所述第二設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間到達設定沉默時長時,停止將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù);當所述第二設定條件從開始不滿足的起始幀至當前幀的持續(xù)時間未到達設定沉默時長時,繼續(xù)將各聲音采集單元采集的當前幀目標聲音數(shù)據(jù)存儲為錄音數(shù)據(jù)。
8.如權利要求7所述的錄音設備,其特征在于,還包括 第一判決閾值確定單元,用于確定所述第一判決閾值為大于等于Z1 Zi中最小值或小于等于其中最大值的任意值,并將確定的第一判決閾值存儲到第一閾值存儲單元中,其中Zi為任意兩個聲音采集單元組合后,第i組聲音采集單元對應的最小聲強比閾值,Zi=(RH)VR2, R為錄音設備的最遠錄音距離,d,為第i組聲音采集單元中的兩個聲音采集單元之間的間距;或者 用于確定所述第一判決閾值B ’為大于I小于B的值,B為B1 Bi之間的任意值,Bi為任意兩個聲音采集單元組合后,第i組聲音采集單元對應的常規(guī)聲強比閾值,Bi=O^di)2/r2, r為錄音設備的常規(guī)錄音距離。
9.如權利要求7或8所述的錄音設備,其特征在于,還包括 緩存單元,用于緩存錄制的備用數(shù)據(jù),所述錄音控制單元在確定錄音設備被啟動或者暫停錄音后,還用于根據(jù)設定的備用時長,將各聲音采集單元在當前幀之前的設定備用時長內(nèi)采集到的目標聲音數(shù)據(jù)作為備用數(shù)據(jù)存儲到所述緩存單元中,并在啟動錄音時,將緩存單元中存儲的備用數(shù)據(jù)作為啟動前的錄音數(shù)據(jù)轉存到所述錄音數(shù)據(jù)存儲單元中。
全文摘要
一種錄音控制方法和錄音設備,用以提高聲控錄音的可靠性。錄音設備的錄音控制方法分為近講模式和遠講模式。在近講模式下根據(jù)至少兩個聲音采集單元采集的目標聲音之間的聲強比作為是否錄音的判決依據(jù);在遠講模式下,根據(jù)至少兩個聲音采集單元采集的目標聲音之間的信噪比作為是否錄音的判決依據(jù),使得錄音控制技術有較好的判斷準確性。
文檔編號G11B19/02GK102655009SQ20111035135
公開日2012年9月5日 申請日期2008年12月31日 優(yōu)先權日2008年12月31日
發(fā)明者馮宇紅, 張晨 申請人:無錫中星微電子有限公司