專利名稱:一種音頻重復(fù)插入的檢測方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種音頻信號篡改鑒定領(lǐng)域的方法,特別涉及一種wav音頻重復(fù)插入檢測方法。
背景技術(shù):
近年來隨著科學(xué)技術(shù)的進(jìn)步和信息技術(shù)的快速發(fā)展和廣泛應(yīng)用,特別是計(jì)算機(jī)技術(shù)、多媒體技術(shù)的不斷發(fā)展,計(jì)算機(jī)應(yīng)用領(lǐng)域得到了進(jìn)一步的擴(kuò)展。在音頻領(lǐng)域中,數(shù)字音頻技術(shù)迅速發(fā)展,出現(xiàn)了各種功能強(qiáng)大的音頻編輯軟件,使得人們能夠隨意重復(fù)插入各種音頻信息。音頻信息的完整性、可靠性越來越受到質(zhì)疑;一段音頻是元數(shù)據(jù),還是重復(fù)插入的;是新產(chǎn)生的,還是曾經(jīng)已經(jīng)失效的,這些問題都時刻困擾著用戶。尤其近年來隨著音頻開始應(yīng)用于法庭舉證、歷史文獻(xiàn)備份、部門機(jī)密文件等一些特殊場景,音頻文件內(nèi)容的真實(shí)性完整性就顯得更加重要。比如軍事行動命令,政治外交中講話時,毫無疑問,有些話語一旦被重復(fù),極有可能導(dǎo)致嚴(yán)重后果。所以作為數(shù)字音頻取證的重要內(nèi)容,如何能夠檢測出一個音頻文件中是否有重復(fù)音頻插入現(xiàn)象的存在,具有重要研究價(jià)值和現(xiàn)實(shí)意義。發(fā)明內(nèi)容
針對音頻取證技術(shù)所存在的上述問題,本發(fā)明提供一種音頻重復(fù)插入的檢測方法。
本發(fā)明解決技術(shù)問題所采用的技術(shù)手段為: 一種音頻重復(fù)插入的檢測方法,其中,包括如下步驟: 步驟a、將一總時長為Tf的音頻文件分為每段時長為T的小段,最后時長不足T的部分也作為一段,所述音頻文件包含的所述小段數(shù)為t個,t = T/7+1 ; 步驟b、與所述每個小段中以乂為采樣率設(shè)置漢個采樣點(diǎn),定義所述每個小段中的采樣點(diǎn)為 ,.,且!=U...,況; 步驟C、在另一段音頻文件中取[Jj + Γ]時間長度的一段,其中將該L/,J+T]時間長度的一段以所述步驟a中的方法分段,并以所述步驟b中的方法采樣,其所對應(yīng)的采樣點(diǎn)為4,且 = 1,2,…,況; 步驟 d、構(gòu)造函數(shù)/(m, J) = 22/2 ft2 + ), I < < i ; 步驟e、計(jì)算步驟c中構(gòu)造的所述函數(shù),得出所述函數(shù)的值;步驟f、定義門限值f,將所述函數(shù)的值與所述門限值d故比較,如則判定兩段音頻重復(fù)。
上述音頻重復(fù)插入的檢測方法,其中,所述步驟a中的音頻文件為WAV波形文件。
上述音頻重復(fù)插入的檢測方法,其中,所述步驟d中計(jì)算所述函數(shù)的方法具體包括如下步驟: 步驟dl、利用快速傅 里葉變換原理,計(jì)算Τ(λ) = FFIlhixm = 步驟d2、利用卷積原理,計(jì)算:= T(k)X(k);步驟d3、計(jì)算Λ.=h木七。
上述音頻重復(fù)插入的檢測方法,其中,所述WAV波形文件的采樣頻率為44.1KHz。
本發(fā)明的有益效果是: 1、本發(fā)明不需要額外的輔助設(shè)施,只需要輸入所要檢測的wav音頻文件即可,操作十分簡便。
2、本發(fā)明是利用卷積定理來計(jì)算相似度的,極大地縮短了程序運(yùn)行時間,提高運(yùn)行效率。
3、本發(fā)明定義了一個相似度的概念,使得兩個時間段之間的相似或者重復(fù)情況一目了然,概念也更加清楚。
4、本發(fā)明對于輸出結(jié)果的門限值,可以根據(jù)應(yīng)用的不同的要求而具體設(shè)置,這使得本發(fā)明應(yīng)用起來十分靈活。
5、本發(fā)明是根據(jù)一個音頻文件的固有采樣率為依據(jù)來計(jì)算各個時間段之間的相似度的,不容易因?yàn)橥饨绲囊恍└蓴_而對輸出結(jié)果造成影響,故輸出結(jié)果穩(wěn)定可靠。
圖1是本發(fā)明一種音頻重復(fù)插入的檢測方法的流程圖。
具體實(shí)施方式
下面結(jié)合附圖和具體實(shí)施例對本發(fā)明作進(jìn)一步說明,但不作為本發(fā)明的限定。
本實(shí)施例提供了一種wav音頻重復(fù)檢測的方法,只需輸入一個wav音頻文件便可迅速的得出結(jié)論。整個工作流程如圖1所示,本實(shí)施例包括如下步驟(其中前兩個步驟是做的準(zhǔn)備工作): 步驟a、首先選擇一個合適的常數(shù)T對音頻文件進(jìn)行沒有重疊的分割,通常情況下,在此以0.2秒作為一個分割單元進(jìn)行說明。之所以選擇0.2秒是因?yàn)橹貜?fù)音頻一般都會大于0.4秒,所以不必去檢測這0.2秒內(nèi)是否有重復(fù)音頻的插入,就可以保證沒有重復(fù)音頻遺漏情況的發(fā)生,同時也最大化的降低了計(jì)算量。須注意選擇0.2秒作為分割單元僅僅是為了可以更直觀的說明,而不是將本發(fā)明的實(shí)施方式限制于此,以下所舉出的具體數(shù)字均可作此理解。
不妨設(shè)給定的音頻材料的播放時間P =10秒,則我們可以把該音頻文件分成t =50個播放時間都為0.2秒的 小片段。
步驟b、采樣率是=44.1KHz,并且每個小片段中所包含的采樣點(diǎn)個數(shù)為0.2 X44.ΙΚΗζ,即F= 3020海個小片段中采樣點(diǎn)依次可以設(shè)為<3820。
步驟c,在另一段音頻文件中取Laj + Γ]時間長度的一段,其中O SjST-Γ,將該[J,J + T]時間長度的一段以所述步驟a中的方法分段,并以所述步驟b中的方法采樣,其所對應(yīng)的采樣點(diǎn)為%且s = 1,2,…,N。
步驟d,構(gòu)造兩個0.2秒的音頻文件之間的相似度函數(shù)/( ,/)/( J) =IYjJ2i + xij) 其中表示音頻文件上第^個了時間段,是表示L/,j + 'r]時間段上的起始時間。所以,函數(shù)分子 就代表這兩段音頻文件中所有對應(yīng)采樣點(diǎn)的積的和;同樣,分母上的Σ€,Σ 則代表了這兩段音頻文件中各個采樣點(diǎn)的平方的和。
根據(jù)定義,函數(shù)/() ,/)的值就是這兩個時間段上的相似度,代表了這兩個音頻文件波形的相似情況。不難得出,兩段音頻文件波形越相近的值也就越大;反之,JrCu)的值就越小。當(dāng)兩段音頻文件完全相同時,函數(shù)達(dá)到最大值1.步驟e、讀取音頻文件的音頻采樣數(shù)據(jù),并將相似度函數(shù)計(jì)算轉(zhuǎn)化為三個卷積的計(jì)算,并根據(jù)卷積定理計(jì)算各個卷積,進(jìn)而得到各個時間段之間的相似度。
具體計(jì)算過程如下:
權(quán)利要求
1.一種音頻重復(fù)插入的檢測方法,其特征在于,包括如下步驟: 步驟a、將一總時長為的音頻文件分為每段時長為T的小段,最后時長不足T的部分也作為一段,所述音頻文件包含的所述小段數(shù)為I:個; 步驟b、與所述每個小段中以/f為采樣率設(shè)置況個采樣點(diǎn),定義所述每個小段中的采樣點(diǎn)為巧,且pU...,況; 步驟C、在另一段音頻文件中取時間長度的一段,其中將該L/,J + Γ]時間長度的一段以所述步驟a中的方法分段,并以所述步驟b中的方法采樣,其所對應(yīng)的采樣點(diǎn)為%且2 = 1,2,-, N ; 步驟 d、構(gòu)造函數(shù)
2.如權(quán)利要求1所述音頻重復(fù)插入的檢測方法,其特征在于,所述步驟a中的音頻文件為WAV波形文件。
3.如權(quán)利要求1所述音頻重復(fù)插入的檢測方法,其特征在于,所述步驟d中計(jì)算所述函數(shù)的方法具體包括如下步驟: 步驟dl、利用快速傅里葉變換原理,計(jì)算
全文摘要
本發(fā)明公開了一種音頻重復(fù)插入的檢測方法,其中,包括如下步驟步驟a、將一總時長為的音頻文件分為每段時長為的小段,最后時長不足的部分也作為一段,所述音頻文件包含的所述小段數(shù)為個,=/+1;步驟b、與所述每個小段中以為采樣率設(shè)置個采樣點(diǎn),定義所述每個小段中的采樣點(diǎn)為,且;步驟c、在另一段音頻文件中取時間長度的一段,其中,將該時間長度的一段以所述步驟a中的方法分段,并以所述步驟b中的方法采樣,其所對應(yīng)的采樣點(diǎn)為,且。本發(fā)明的有益效果是操作十分簡便,運(yùn)行效率高,概念清楚,應(yīng)用靈活,不易受干擾,輸出穩(wěn)定。
文檔編號G10L25/48GK103137138SQ201110380169
公開日2013年6月5日 申請日期2011年11月25日 優(yōu)先權(quán)日2011年11月25日
發(fā)明者施少培, 黃征, 楊旭, 李巖, 卞新偉 申請人:司法部司法鑒定科學(xué)技術(shù)研究所