一種基于模式識別Hi-Fi音質檢測方法
【技術領域】
[0001] 本發(fā)明涉及音頻信號處理和,具體涉及一種基于模式識別Hi-Fi音質檢測方法。
【背景技術】
[0002] Hi-Fi音頻指的是原版CD音頻,這類音頻由各大唱片公司等制作,采用專業(yè)的錄 音及混響設備,對原始聲音信息采樣量化,而且沒有經(jīng)過頻譜裁剪,所以保留了原始各個頻 段的信息。
[0003] 伴隨著網(wǎng)絡的快速普及以及帶寬的增加,人們對于音樂質量的要求也越來越高, 無損音樂資源的交流也從音樂發(fā)燒友間向普通大眾過渡。但如何鑒別這類資源的真?zhèn)?,?樂愛好者和音樂類公司都有著迫切的需要。通過人工檢測雖然有較高的準確率,但僅僅適 用于個人,對于音樂類公司千萬級數(shù)量的曲庫來說,無法簡單的通過人工檢測來過濾曲庫。
[0004] 采用計算機檢測的方法,目前應用的較多的是通過劃分頻率的方法。其步驟包括, 將時域音頻信息通過傅里葉變換轉換為頻域,對于大多數(shù)采樣率為44100的音頻來說,轉 換成頻域后所能表示的最大頻率為22050Hz。然后通過分析某個截止頻率以上頻率信息的 缺少情況來判別音頻的質量。例如,某些壓縮算法,為了減小音頻的體積,將原始音頻通過 該算法壓縮后,高頻信息是有缺失的。上述方法既是基于以上原理,通過劃分截止頻率的方 法來判別音頻質量,將高頻信息缺失到一定程度的音頻判定為假無損。
[0005] 上述方法能在一定程度上解決無損音頻質量檢測的問題,但有兩個較大的不足。
[0006] 本發(fā)明是基于貝葉斯網(wǎng)絡的分類方法,下面介紹貝葉斯網(wǎng)絡的相關技術背景。
[0007] 貝葉斯學派奠基性的工作是貝葉斯的論文"過于幾率性問題求解的評論"完成的。 著名數(shù)學家拉普拉斯利用貝葉斯的方法導出了重要的相繼律,從此,貝葉斯的方法和理論 逐漸被人理解和重視起來。二戰(zhàn)期間,瓦爾德提出了統(tǒng)計的決策理論,該理論中,貝葉斯占 有重要的地位。80年代以后,由于人工智能尤其是機器學習的發(fā)展和數(shù)據(jù)挖掘的興起,貝葉 斯理論得到了越來越寬廣的發(fā)展和應用。
[0008] 貝葉斯網(wǎng)絡,又稱置信網(wǎng)絡(beliefnetwork)或概率有向無環(huán)圖模型 (probabilisticdirectedacyclicgraphicalmodel),是貝葉斯方法與圖形理論的有機 結合。從 1988 年由Pearl【Probabilisticreasoninginintelligentsystems:networks ofplausibleinference】提出后,已經(jīng)成為近幾年來研究的熱點。Jensen將貝葉斯網(wǎng) 絡定義為一種可以表達一組隨機變量之間概率關系的概率模型圖【Nielsen.Bayesian networksanddecisiongraphs】。它通過有向無環(huán)圖(DAG)來表達一組隨機變量和其 條件依賴,是樸素貝葉斯方法的擴展,可以表達和分析多源信息,進而處理不確定性問題 [Complexsystemssimulationforriskassessmentinfloodincidentmanagement] [InfluencesofvariablesonshipcollisionprobabilityinaBayesianbelief networkmodel】,是目前不確定知識表達和推理領域最有效的理論模型之一。Cooper【A simpleconstrain-basedalgorithmforefficientlyminingobservationaldatabases forcausalrelationships】在1997年提出來一種簡單易行的因果關系挖掘算法,該算法 利用貝葉斯網(wǎng)絡結構的性質,對數(shù)據(jù)集進行搜索并找出滿足條件的因果關系。Silverstein 【Scalabletechniquesforminingcausalstructures】在 1998 年嘗試了大型事件數(shù)據(jù) 庫的挖掘。通常,貝葉斯網(wǎng)絡是個有向無環(huán)圖,圖中的節(jié)點代表可觀測量、潛在變量或者未 知變量等。圖中的邊代表了條件依賴,用條件概率進行表達關系強度,沒有邊相連的節(jié)點表 明它是獨立的。貝葉斯網(wǎng)絡用于表達和分析不確定性和概率性的事件,應用于有條件地依 賴多種控制因素的決策,可以從不完全、不精確或不確定的知識或信息中做出推理。其數(shù)學 定義如下:
[0009] 給定一個隨機變量集合X=(X1,X2,...,XJ,X1表示Xi的取值。表達式p(X1= X1,X2=x2,. . .,Xn=xn)表示一個聯(lián)合概率,也就是當X1,X2,. ?.,父"的值分別為X1,X2, . ? .,Xn 時的概率。其中,聯(lián)合概率的一般形式為:
[0011] 貝葉斯網(wǎng)絡的引用方面,主要有以下三類應用。
[0012] 一是通過貝葉斯網(wǎng)絡進行分類和回歸分析。
[0013] 貝葉斯網(wǎng)絡具有不完全數(shù)據(jù)處理、因果關系學習等能力,具有良好的預測能力。實 踐結果表明,貝葉斯網(wǎng)絡可以用于分析具有高維高噪性和非線性相關關系的參數(shù)變量分析 問題中,有助于提高這類數(shù)據(jù)的分析效率。文獻【基于類約束的貝葉斯網(wǎng)絡分類學習】中提 至IJ,貝葉斯網(wǎng)絡分類器與聯(lián)合分類器具有相同的分類能力,由于具有概率推斷能力,根據(jù)條 件獨立性能夠有效地降低維度,顯著提高學習效率。實現(xiàn)貝葉斯網(wǎng)絡分類器的核心是貝葉 斯網(wǎng)絡結構學習。
【發(fā)明內容】
[0014] 本發(fā)明的目的在于針對上述不足提供一種快速準確的判斷Hi-Fi無損音頻的方 法。
[0015] 本發(fā)明的技術方案如下:
[0016] -種基于模式識別Hi-Fi音質檢測方法,其特征在于包含如下步驟:
[0017] 1)選取采樣率為44100HZ的無損音頻和有損音頻,對無損音頻和有損音頻進行區(qū) 別標記,
[0018] 2)將標記后的音頻進行傅里葉變換,將時域信號轉換成頻域信號,
[0019]3)從頻率11050Hz到22050Hz每隔500Hz的頻率衰減均值作為一個頻率特征, 總共22個特征,依次從1到22對其編號,即i= 1,2, 3. ..,22 ;
[0020] 設無損音頻由R。表示,有損音頻由R1表示,考慮相鄰兩個特征間的關系,對于無 損音頻,特征間的關系可由(?IR。),(a21ai,R。),. . .,(a221a21,R。)表示,可以分別得到其條件 概率p(aiIR。),p(a21a1;R。),? ? ?,p(a221a21,R。),對應于有損音頻的特征Ca11R1),(a21a1;R1),? ..,(a221a21,R1),可分別得到其條件概率p(a:IR1),p(a21a:,R1),. ..,p(a221a21,R1),訓練貝葉 斯網(wǎng)絡分類器;
[0021] 4)對待測音頻進行傅里葉變換,將時域信號轉換成頻域信號,
[0022]5)按步驟3)的方法提取頻率特征并計算取頻率特征分別屬于無損音頻和有損音 頻的條件概率,進而得到分別屬于無損音頻和有損音頻的聯(lián)合概率,即可判別出待測音頻 屬于無損音頻或是有損音頻。
[0023] -般的,為保證本方法的精度,所述的步驟1)中無損音頻和有損音頻的數(shù)量均要 求大于100首,且所選取的樣品越多,本發(fā)明方法的精度越高。
[0024] 對于有損和無損,其在頻率上的特征差別主要體現(xiàn)在16000Hz以上的高頻部分, 無損音頻的高頻衰減較為自然和緩慢,有損音樂的高頻信息衰減的急速,所以可以通過高 頻部分的特征來判別無損音頻。
[0025] 對于整體能量就小的舒緩型音頻來說,其整體頻率衰減較大,不僅僅體現(xiàn)在高頻 部分,也包括中頻,所以本方法將特征擴展到11050Hz開始的高頻部分,這樣可以一定程度 上避免對無損舒緩型音頻的判別誤差。綜上所述,本方法選取了從11050Hz到22050Hz每隔 500Hz的頻率衰減均值作為一個特征,總共22個特征,編號分別從1到22。本發(fā)明提出的 算法對于真無損音頻具有很高的檢測成功率,同時保證對于假無損有比較低的誤判率。并 從與auCDtect的對比中可以看出,本發(fā)明提出的方法能達到業(yè)界較為先進的水品。
【附圖說明】
[0026] 圖1是貝葉斯網(wǎng)絡訓練分類流程圖
[0027] 圖2是普通無損音頻頻譜;
[0028] 圖3是舒緩無損首頻頻譜;
[0029] 圖4是有損音頻頻譜;
[0030] 圖5是音頻時域波形;
[0031] 圖6是標記了特征選取方法的頻率特征圖;
[0032] 圖7是基于貝葉斯網(wǎng)絡的特征和音頻質量的關系圖;
【具體實施方式】
[0033] 下面結合附圖進一步說明本發(fā)明。應當理解,以下實例僅用于說明本發(fā)明,而不能 作為本發(fā)明的限制,在不背離本發(fā)明精神和實質的前提下,進行的修改或替換,均屬于本發(fā) 明的范圍。
[0034] 如圖1所示,為本發(fā)明的流程圖,由于選取的音樂采樣率均為44100HZ,所以最大 頻率均為22050HZ。圖2為一首普通的Hi-Fi無損流行歌曲的頻譜,從圖中可以看出