亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于感知濾波的音頻實時比對方法

文檔序號:8923602閱讀:441來源:國知局
一種基于感知濾波的音頻實時比對方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于數(shù)字音頻處理技術(shù)領(lǐng)域,涉及對兩音頻信號進行比較的方法,具體為 一種基于感知濾波的音頻實時比對方法,該方法可應用于廣播音頻的實時比對。
【背景技術(shù)】
[0002] 當前,音頻廣播已成為最為普及的大眾宣傳和娛樂媒體。廣播電臺的節(jié)目播出及 媒體資源管理等都涉及到音頻比對方面的需求,即對兩個音頻進行比較,判斷二者是否相 同或相似。例如在節(jié)目監(jiān)播中,需要對實際發(fā)射播出的音頻信號進行在線實時接收和查詢, 涉及到將接聽到的音頻流與欲播出的原音頻進行比對,從而判斷整個開環(huán)播出通路是否正 常;又如在廣告統(tǒng)計管理中,也需要對每日播出記錄與原廣告音頻進行比對查找,統(tǒng)計各廣 告實際播出的時間和次數(shù),從而判斷廣告播出是否存在漏播、多播或錯播等情況。
[0003] 音頻比對一般包括音頻提取特征和特征匹配兩個環(huán)節(jié)。特征提取是用代表原始信 號的結(jié)構(gòu)化數(shù)據(jù)來表達音頻信號。常用的音頻特征主要可以分為兩大類:聲學級特征和語 義級特征。聲學特征是音頻信號本身的特征(如時頻域特征),是其它類型音頻特征的基 礎。常用的聲學特征主要包括梅爾倒譜系數(shù)(MFCC)、基音頻率、短時能量、過零率、LPC等 等;語義級特征則是對音頻的概念級描述,它是在聲學級特征的基礎上,通過模型化處理, 抽取出來的更高級的感知特征,如音樂的旋律、音色和敘事感情等等。在提取特征之后,特 征匹配環(huán)節(jié)則是通過計算提取的兩音頻特征之間的距離來判斷兩音頻是否相同或相似。該 過程相對簡單,常用的特征距離有標準歐幾里德距離、曼哈頓距離、漢明距離等等。
[0004] 傳統(tǒng)的音頻比對方法針對普通音頻的比對,一般不太適用于廣播音頻,其原因主 要有如下兩個方面:一方面,在比對容錯性上,眾多音頻特征皆以準確描述音頻為目標,追 求高的內(nèi)容辨識度,故音頻的細微變化,均能反應在特征上。這樣,如果音頻受到噪聲干擾, 或經(jīng)過一些常規(guī)音效處理,如均衡(EQ)調(diào)節(jié),再將處理后的音頻與原音頻進行比較,傳統(tǒng) 比對方法往往判斷兩音頻不相似甚至完全不同,而噪聲干擾、音效處理等在廣播中是很常 見的。如在廣播監(jiān)測中,我們需要將播出原音頻與接聽到的音頻進行比對,而接聽到的音頻 并非如原音頻一般純凈,常常含有噪聲;又如為了達到更好的播出主觀收聽效果,在廣播發(fā) 射前,通常使用音頻均衡器來對播出音頻的頻譜進行調(diào)節(jié)。這些處理,使得被處理音頻相對 于原音頻發(fā)生了較大的變化。在這種情況下,傳統(tǒng)的比對方法往往不能適用,因為廣播音頻 比對需要判定播出的音頻內(nèi)容本身是否相同,而非聽覺效果上是否一致,即某音頻即使在 受到一定噪聲干擾、頻譜調(diào)節(jié)等處理后,算法仍應該判定該音頻與其原音頻是相似的(或 互為相似音頻)。雖然文獻中也出現(xiàn)了對音頻變化不敏感的比對方法,如基于Philips音頻 指紋的比對方法,但這些方法中,處理前后兩音頻間的距離與真正完全不同的兩音頻間的 距離相差不大,故判別上容易混淆,尤其是在強噪聲干擾或音頻處理的變化幅度較大時,會 出現(xiàn)判別錯誤;另一方面,在比對的計算效率上,現(xiàn)有方法的計算復雜度相對較高,比對所 需的時間相對較長,不利于實時處理。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明的目的在于針對【背景技術(shù)】存在的問題,采用新的音頻提取特征和特征匹配 方法,提供一種適合廣播音頻的比對方法。
[0006] 本發(fā)明的技術(shù)方案是:一種基于感知濾波的音頻實時比對方法,包括以下步驟:
[0007]S1.濾波器組設計:設定低頻段的頻率范圍為0~F1,采用n個帶寬相同的三角帶 通濾波器;中頻段的頻率范圍為F1~F2,采用一組m個帶寬依次遞增的三角帶通濾波器; f?,f?,t分別表示第i個濾波器的上截止頻率、中心頻率和下截止頻率,1彡i彡k,k= m+n,即k為0~F2頻率范圍內(nèi)濾波器的總個數(shù),
[0008] S11.低頻段設計:設處于低頻段的第i個濾波器的中心頻率為iXFl/n,相鄰濾波 器的截止頻率滿足以=f ?+1,以=f/+1,設置各濾波器中心頻率處的濾波系數(shù)為1 ;
[0009] S12.中頻段設計:設處于中頻段的第i個濾波器的上截止頻率為以,其中f\n+1 = F1,計算第i個三角帶通濾波器的中心頻率f/:
[0011] 其中
[0012] A= 12. 46X10_^/-9912, 78X10-4,B= 186. 78X10_3f/-1269. 25 ,
,計算第i個三角帶通濾波器的下截止頻率fhS
[0013]fh'=f^+12. 46X10_6fci+186. 78X10^/+57. 04 (2)
[0014] 對處于中頻段的第i+1個濾波器,使其上截止頻率等于第i個濾波器的中心頻率, 即f\i+1=f/,且按(1)和(2)式依次計算其中心頻率f;i+1和下截止頻率fhi+1;當上截止頻 率超過F2時終止,設置各濾波器中心頻率處的濾波系數(shù)為1;
[0015]S13.高頻段設計:對于高于F2頻段,濾波器系數(shù)設為全0;
[0016]S14.濾波系數(shù)調(diào)整:設Q代表第i個濾波器的濾波系數(shù)矢量,對各濾波器系數(shù)矢 量進行如下調(diào)整:
[0017] Ci= u i ? Cj, 1 ^ i ^ k (3)
[0018] 其中h為第i個濾波器的調(diào)整系數(shù),可通過下式計算:
[0020]S2.特征提?。簩Υ葘Φ膬蓚€音頻,分別進行如下操作:
[0021]S21.音頻數(shù)據(jù)分幀:將音頻數(shù)據(jù)按固定長度劃分為各音頻幀,相鄰幀間有重疊; 將每一幀數(shù)據(jù)排列成一列矢量,并將矢量中各元素除以列矢量中元素絕對值的最大值進 行歸一化,將歸一化處理后的幀數(shù)據(jù)保存在數(shù)據(jù)矩陣A中;設總的音頻幀數(shù)目為M,則A= [a^a2,a3,? ? ?,aM],其中A的每一列a」表不第j幀的數(shù)據(jù);
[0022] S22.讀取音頻幀:取一幀音頻aj設定初始值為0的幀計數(shù)器,每取一音頻幀,幀 計數(shù)器加1 ;
[0023]S23.計算音頻幀功率譜:對音頻幀的數(shù)據(jù)進行加窗處理,進行短時傅里葉變 換,得到音頻幀的頻譜;對頻譜幅度值求平方得到功率譜;
[0024]S24.計算音頻幀特征:用步驟S1設計出的濾波器組(k個濾波器)對上步得到的 功率信號進行濾波處理;對每個濾波器,將其濾波輸出的信號進行求和,得到該濾波器的輸 出能量;將k個濾波器的輸出能量數(shù)據(jù)排列成一列矢量,該矢量即為該幀信號的特征矢量, 記為
[0025]S25.若幀計數(shù)器的當前計數(shù)值小于M,則轉(zhuǎn)至步驟S22;
[0026]S26.生成音頻特征:將各音頻幀的特征矢量Vj排列成一矩陣V= [Vpv2,v3, . . .,vM],該矩陣即為當前音頻信號的特征矩陣;
[0027]S3?特征匹配:
[0028] 設待比對的兩個音頻信號的特征矩陣分別為V1和V2,將V1和V2的對應元素進行比 較,若兩個元素的值都大于設定的閾值Tp (10彡Tp< 100),則記兩個元素的距離為0 ;否則, 計算兩個元素的值差的平方,作為其距離;對所有對應元素對的距離進行平均,將該平均值 作為待比對的兩個音頻信號的距離,記為d;
[0029]S4.相似度判定:將待比對兩個音頻信號的距離d除以單位距離得到相對距離比, 若該距離比小于設定的閾值Td(0. 3 <Td< 0. 5),則判定兩個音頻信號相似,否則不相似。
[0030] 本發(fā)明的有益效果:本發(fā)明提供一種音頻實時比對方法,該方法具有較高的比對 容錯性,在音頻受到噪聲干擾,或進行了音效處理的等情況下均能實現(xiàn)正確的比對;同時, 該方法算法簡單、處理快速,能夠廣泛應用于廣播電臺的節(jié)目監(jiān)播、廣告監(jiān)測和管理等。
【附圖說明】:
[0031] 圖1為EQ處理均衡器設置圖,其中,(a)為流行風格均衡器設置、(b)為搖滾風格 均衡器設置、(c)為經(jīng)典風格均衡器設置。
[0032] 圖2為濾波器組頻率響應圖。
[0033] 圖3為特征提取過程流程圖。
[0034] 圖4為音頻比對流程圖。
【具體實施方式】
[0035] 仿真實驗共選擇了 16個音頻作為測試音頻。其中前6個音頻為未經(jīng)處理的原廣 播音頻,均為單聲道,48k采樣率,包含廣告、樂曲和歌曲各兩個,其具體信息如表1描述;后 10個音頻對歌曲1作均衡(EQ)、壓縮、加噪等處理得到的音頻,其音頻具體信息如表2描 述,EQ處理的均衡器設置如圖1所示。
[0036]表1原測試音頻信息

[0039]表2歌曲1處理后的各音頻信息
[0041] 本實施例以"歌曲1"及對其進行pop風格均衡處理后的"歌曲1-pop"這對音頻 為例,對其進行比對,具體步驟如下:
[0042] S1?濾波器設計:
[0043] S11.低頻段設計:設定低頻段的頻率范圍為0~1000Hz ;在低頻段采用8個帶寬 相同的三角帶通濾波器;設f?,f/,C分別表示第i個濾波器的上截止頻率,中心頻率和下 截止頻率,則處于低頻段第i個濾波器的中心頻率為iX 125,相鄰濾波器的截止頻率滿足 f/=f^+1,以=f/+1。設置各濾波器中心頻率處的濾波系數(shù)為1 ;低頻段各濾波器的上截 止頻率,中心頻率和下截止頻率如表1所示:
[0044] 表1低頻段濾波器組參數(shù)

[0047] S12.中頻段設計:設定中頻段的頻率范圍為1000~2000Hz;在中頻段采用一組6 個帶寬依次遞增的三角帶通濾波器;設處于中頻段的第i個三角帶通濾波器的上截止頻率 為,其中,f?= 1000Hz,計算第i個三角帶通濾波器的中心頻率fV:
[0049] 其中
[0050] A = 12. 46 X 10_^/-9912, 78 X 10-4, B = 186. 78 X 10_3f/-1269. 25 ,
,計算第i個三角帶通濾波器的下截止頻率fhS
[0051] fh'= f ^+12. 46 X 10^+186. 78 X 10^+57. 04 (2)
[0052] 對處于中頻段的第i+1個濾波器,使其上截止頻率等于第i個濾波器的中心頻率, 即f\i+1=f/,且按(1)和(2)式依次計算其中心頻率f;i+1和下截止頻率fhi+1;當上截止頻 率超過2000Hz時終止。設置各濾波器中心頻率處的濾波系數(shù)為1 ;中頻段各濾波器的上截 止頻率,中心頻率和下截止頻率如表2所示:
[0053] 表2中頻段濾波器組參數(shù)
[0055]
[0056]S13.高頻段設計:對于高于2000Hz頻段,濾波器系數(shù)設為全0;
[0057]S14.濾波系數(shù)調(diào)整:設Q代表第i個濾波器
當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1