音樂識別方法、音符識別模型建立方法、裝置及電子設(shè)備與流程

文檔序號：11232718閱讀：631來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及自動化領(lǐng)域，尤其涉及音樂識別方法、音符識別模型建立方法、裝置及電子設(shè)備。
背景技術(shù)：
：隨著科學(xué)技術(shù)的不斷發(fā)展，電子技術(shù)也得到了飛速的發(fā)展，電子產(chǎn)品的種類也越來越多，人們也享受到了科技發(fā)展帶來的各種便利?，F(xiàn)在人們可以通過各種類型的電子設(shè)備，享受隨著科技發(fā)展帶來的舒適生活。例如：現(xiàn)有技術(shù)中，可以通過電子設(shè)備內(nèi)置的app實現(xiàn)鋼琴陪練?，F(xiàn)有技術(shù)中鋼琴陪練主要采用以下方式(如圖1所示)：針對鋼琴搭配特殊的硬件設(shè)備，比如電鋼琴或者有midi輸出接口的電子琴，app通過接收該硬件設(shè)備的按鍵開關(guān)信息，來識別用戶的演奏是否正確。該陪練方式存在以下技術(shù)問題：①該方案的兼容性不強，僅僅能夠適用于該app所對應(yīng)的特定設(shè)備，如果換一臺鋼琴或者換個地點將無法陪練；②現(xiàn)有的電鋼琴或電子琴很難達(dá)到與真鋼琴相同的觸感和音色，與在真鋼琴上練習(xí)的效果是完全不同的，從而導(dǎo)致大部分家長無法接受讓孩子在電鋼琴上學(xué)習(xí)鋼琴。技術(shù)實現(xiàn)要素：本發(fā)明提供一種音樂識別方法、音符識別模型建立方法及裝置，以解決現(xiàn)有技術(shù)中在對音樂進(jìn)行識別時需要依賴于特定的硬件設(shè)備的技術(shù)問題。第一方面，本發(fā)明實施例提供一種音樂識別方法，包括：獲得音樂所對應(yīng)的第一音頻數(shù)據(jù)，所述第一音頻數(shù)據(jù)包含m個音符片段，m為正整數(shù)；基于所述m個音符片段和音符模型，對所述第一音頻數(shù)據(jù)進(jìn)行匹配識別，其中，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系。可選的，所述對所述第一音頻數(shù)據(jù)進(jìn)行匹配識別，包括：對所述第一音頻數(shù)據(jù)中的演奏錯誤進(jìn)行識別；和/或基于所述m個音符片段和音符模型獲得所述第一音頻數(shù)據(jù)的第一樂譜信息?？蛇x的，所述演奏錯誤包括：音符錯誤、節(jié)奏錯誤、音不準(zhǔn)中的至少一種演奏錯誤。可選的，所述對所述第一音頻數(shù)據(jù)中的演奏錯誤進(jìn)行識別，包括：獲取用于產(chǎn)生所述第一音頻數(shù)據(jù)的參考樂譜信息；確定出所述參考樂譜信息所包含的n個音符片段，n為正整數(shù)；基于所述音符模型，確定出所述m個音符片段與所述n個音符片段中音符不匹配的片段作為所述演奏錯誤所對應(yīng)的音符片段?？蛇x的，所述方法還包括：確定出所述n個音符片段中每個音符片段的演奏時長；在所述基于所述音符模型，確定出所述m個音符片段與所述n個音符片段中音符不匹配的片段作為所述演奏錯誤所對應(yīng)的音符片段之后，所述方法還包括：確定出所述m個音符片段與所述n個音符片段中音符匹配但演奏時長不匹配的片段作為所述演奏錯誤所對應(yīng)的音符片段。可選的，所述基于所述音符模型，確定出所述m個音符片段與所述n個音符片段中音符不匹配的片段作為所述演奏錯誤所對應(yīng)的音符片段，包括：從所述音符模型中查找獲得所述n個音符片段中各個音符片段的特征信息，進(jìn)而確定出參考樂譜信息所對應(yīng)的第一音符特征信息；提取獲得所述m個音符片段中各個音符片段的特征信息，進(jìn)而獲得第二音符特征信息；將所述第二音符特征信息與所述第一音符特征信息進(jìn)行匹配，確定出特征信息不匹配的音符片段作為所述演奏錯誤所對應(yīng)的音符片段?？蛇x的，所述基于所述音符模型，確定出所述m個音符片段與所述n個音符片段中音符不匹配的片段作為所述演奏錯誤所對應(yīng)的音符片段，包括：提取獲得所述m個音符片段中各個音符片段的特征信息，進(jìn)而獲得第二音符特征信息；通過所述音符模型對所述第二音符特征信息進(jìn)行識別，進(jìn)而獲得所述第一音頻數(shù)據(jù)所對應(yīng)的第一樂譜信息；將所述第一樂譜信息與所述參考樂譜信息進(jìn)行匹配，進(jìn)而確定出音符不相同的音符片段作為所述演奏錯誤所對應(yīng)的音符片段?？蛇x的，所述獲取用于產(chǎn)生所述第一音頻數(shù)據(jù)的參考樂譜信息，包括：響應(yīng)用戶的選擇操作，進(jìn)而獲取所述參考樂譜信息；或者對紙質(zhì)教程上的樂譜進(jìn)行掃描獲得樂譜圖像信息，對所述樂譜圖像信息進(jìn)行圖像識別進(jìn)而獲得所述參考樂譜信息；或者對與所述第一音頻數(shù)據(jù)存在關(guān)聯(lián)的第二音頻數(shù)據(jù)進(jìn)行聲學(xué)識別確定出所述參考樂譜信息?？蛇x的，所述獲得所述第一音頻數(shù)據(jù)的第一樂譜信息，包括：提取出第一音符片段的第一特征信息，所述第一音符片段為所述m個音符片段中的任一音符片段；從所述音符模型所包含的音符片段中確定出特征信息與所述第一特征信息的相似度值滿足預(yù)設(shè)相似度條件的音符片段；將所述相似度值滿足預(yù)設(shè)相似度條件的音符片段的音符作為所述第一音符片段的音符；基于所述第一音符片段的音符、或第一音符片段的音符與所述第一音符片段的演奏時長確定出所述第一樂譜信息。可選的，在所述基于所述第一音符片段的音符以及所述第一音符片段的時長確定出所述第一樂譜信息之后，所述方法還包括：搜索獲得與所述第一樂譜信息的相似度值大于預(yù)設(shè)相似度值的參考樂譜信息；將所述參考樂譜信息作為所述第一樂譜信息的推薦樂譜信息提供給用戶。可選的，所述音符模型中包含在特定音調(diào)下，至少一組音符片段與特征信息的對應(yīng)關(guān)系。第二方面，本發(fā)明實施例提供一種音符識別模型建立方法，包括：獲取每個音符片段對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)；提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息；基于音符片段與特征信息的對應(yīng)關(guān)系建立音符模型，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系?？蛇x的，所述音符片段包括：由單個按鍵所構(gòu)成的單個音符；和/或由多個按鍵組合所構(gòu)成的多個音符?？蛇x的，所述提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息，包括：提取每個音符片段的頻譜特征和/或頻率特征?？蛇x的，所述提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息，包括：將所述標(biāo)準(zhǔn)語音數(shù)據(jù)由時域數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù)；將所述頻域數(shù)據(jù)劃分為至少一個子數(shù)據(jù)；計算獲得所述至少一個子數(shù)據(jù)中每個子數(shù)據(jù)的能量，所述至少一個子數(shù)據(jù)中每個子數(shù)據(jù)的能量做為對應(yīng)音符片段的特征信息?？蛇x的，所述提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息，包括：將所述標(biāo)準(zhǔn)語音數(shù)據(jù)由時域數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù)；將所述頻域數(shù)據(jù)劃分為至少一個子數(shù)據(jù)；計算獲得所述至少一個子數(shù)據(jù)中每個子數(shù)據(jù)的能量；確定出預(yù)定能量對應(yīng)的子數(shù)據(jù)的頻率做為對應(yīng)音符片段的特征信息?？蛇x的，所述獲取每個音符對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)，包括：獲取在特定音調(diào)下，每個音符所對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)；所述基于音符片段與特征信息的對應(yīng)關(guān)系建立音符模型，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系，包括：基于所述特定音調(diào)下音符片段與特征信息的對應(yīng)關(guān)系，建立所述音符模型，所述音符模型包含在所述特定音調(diào)下，所述至少一組音符片段與特征信息的對應(yīng)關(guān)系。第三方面，本發(fā)明實施例提供一種音樂識別裝置，包括：獲得模塊，用于獲得音樂所對應(yīng)的第一音頻數(shù)據(jù)，所述第一音頻數(shù)據(jù)包含m個音符片段，m為正整數(shù)；識別模塊，用于基于所述m個音符片段和音符模型，對所述第一音頻數(shù)據(jù)進(jìn)行匹配識別，其中，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系。第四方面，本發(fā)明實施例提供一種音符識別模型建立裝置，包括：獲取模塊，用于獲取每個音符片段對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)；提取模塊，用于提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息；建立模塊，用于基于音符片段與特征信息的對應(yīng)關(guān)系建立音符模型，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系。第五方面，本發(fā)明實施例提供一種電子設(shè)備，包括有存儲器，以及一個或者一個以上的程序，其中一個或者一個以上程序存儲于存儲器中，且經(jīng)配置以由一個或者一個以上處理器執(zhí)行所述一個或者一個以上程序包含用于進(jìn)行以下操作的指令：獲得音樂所對應(yīng)的第一音頻數(shù)據(jù)，所述第一音頻數(shù)據(jù)包含m個音符片段，m為正整數(shù)；基于所述m個音符片段和音符模型，對所述第一音頻數(shù)據(jù)進(jìn)行匹配識別，其中，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系。第六方面，本發(fā)明實施例提供一種電子設(shè)備，包括有存儲器，以及一個或者一個以上的程序，其中一個或者一個以上程序存儲于存儲器中，且經(jīng)配置以由一個或者一個以上處理器執(zhí)行所述一個或者一個以上程序包含用于進(jìn)行以下操作的指令：獲取每個音符片段對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)；提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息；基于音符片段與特征信息的對應(yīng)關(guān)系建立音符模型，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系。本發(fā)明有益效果如下：由于在本發(fā)明實施例中，在獲得音樂所對應(yīng)的第一音頻數(shù)據(jù)中之后，可以基于第一音頻數(shù)據(jù)中所包含的m個音符片段和音符模型，對第一音頻數(shù)據(jù)進(jìn)行匹配識別其中，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系，也即是不需要硬件改進(jìn)，就可以實現(xiàn)對第一音頻數(shù)據(jù)中相關(guān)信息的識別，故而達(dá)到了提高對音樂識別的兼容性的技術(shù)效果，且能夠降低對音樂識別的成本；另外，由于不需要依賴于硬件改進(jìn)，故而針對任何方式輸出的第一音頻數(shù)據(jù)都能夠識別，而不需要依賴于電鋼琴或者電子琴，從而增加了該方案的應(yīng)用范圍。附圖說明圖1為現(xiàn)有技術(shù)中鋼琴陪練的示意圖；圖2為本發(fā)明實施例中音樂識別方法的流程圖；圖3為本發(fā)明實施例的音樂識別方法中獲得音符模型的流程圖；圖4為本發(fā)明實施例的音樂識別方法中對第一音頻數(shù)據(jù)中的演奏錯誤進(jìn)行識別的流程圖；圖5為本發(fā)明實施例的音樂識別方法中對第一音頻數(shù)據(jù)中的演奏錯誤進(jìn)行識別時確定音符不匹配的片段的第一種方式的流程圖；圖6為本發(fā)明實施例的音樂識別方法中對第一音頻數(shù)據(jù)中的演奏錯誤進(jìn)行識別時確定音符不匹配的片段的第二種方式的流程圖；圖7為本發(fā)明實施例的音樂識別方法中對第一音頻數(shù)據(jù)中的演奏錯誤進(jìn)行識別之后輸出識別結(jié)果的示意圖；圖8為本發(fā)明實施例的音樂識別方法中確定出第一樂譜信息的流程圖；圖9為本發(fā)明實施例中音符識別模型建立方法的流程圖；圖10為本發(fā)明實施例中音樂識別裝置的結(jié)構(gòu)圖；圖11為本發(fā)明實施例中音符識別模型建立裝置的結(jié)構(gòu)圖；圖12是根據(jù)一示例性實施例示出的電子設(shè)備的框圖。具體實施方式本發(fā)明提供一種音樂識別方法、音符識別模型建立方法及裝置，以解決現(xiàn)有技術(shù)中在對音樂進(jìn)行識別時需要依賴于特定的硬件設(shè)備的技術(shù)問題。本申請實施例中的技術(shù)方案為解決上述的技術(shù)問題，總體思路如下：在獲得音樂所對應(yīng)的第一音頻數(shù)據(jù)中之后，可以基于第一音頻數(shù)據(jù)中所包含的m個音符片段和音符模型，對第一音頻數(shù)據(jù)進(jìn)行匹配識別其中，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系，也即是不需要硬件改進(jìn)，就可以實現(xiàn)對第一音頻數(shù)據(jù)中相關(guān)信息的識別，故而達(dá)到了提高對音樂識別的兼容性的技術(shù)效果，且能夠降低對音樂識別的成本；另外，由于不需要依賴于硬件改進(jìn)，故而針對任何方式輸出的第一音頻數(shù)據(jù)都能夠識別，而不需要依賴于電鋼琴或者電子琴，從而增加了該方案的應(yīng)用范圍。為了更好的理解上述技術(shù)方案，下面通過附圖以及具體實施例對本發(fā)明技術(shù)方案做詳細(xì)的說明，應(yīng)當(dāng)理解本發(fā)明實施例以及實施例中的具體特征是對本發(fā)明技術(shù)方案的詳細(xì)的說明，而不是對本發(fā)明技術(shù)方案的限定，在不沖突的情況下，本發(fā)明實施例以及實施例中的技術(shù)特征可以相互組合。第一方面，本發(fā)明實施例提供一種音樂識別方法，請參考圖2，包括：步驟s201：獲得音樂所對應(yīng)的第一音頻數(shù)據(jù)，所述第一音頻數(shù)據(jù)包含m個音符片段，m為正整數(shù)；步驟s202：基于所述m個音符片段和音符模型，對所述第一音頻數(shù)據(jù)進(jìn)行匹配識別，其中，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系。步驟s201中，第一音頻數(shù)據(jù)例如為：用戶通過樂器演奏所獲得的音頻數(shù)據(jù)、用戶唱歌所獲得音頻數(shù)據(jù)、電子設(shè)備上自帶或者于網(wǎng)絡(luò)中下載的音頻數(shù)據(jù)等等，對于該音頻數(shù)據(jù)為何種音頻數(shù)據(jù)，本發(fā)明實施例不作限制。其中，音符片段包括一個或者多個音符，每個音符包含音階以及每個音階的音調(diào)高低，音階例如為：1、2、3、4、5、6、7，音階的音調(diào)高低例如為：低音、中音、高音等等。其中，一個音符片段中可以僅僅包含一個音符，例如：(中音)1、(中音)2等等，一個音符片段也可以包含多個音符，例如：(中音)1(中音)2、(中音)1(中音)2(低音)3等等。其中，如果產(chǎn)生第一音頻數(shù)據(jù)的樂器為按鍵類樂器(例如：鋼琴、電子琴等等)且音符片段為單個音符，則該單個音符可以由單個按鍵構(gòu)成的音符，也可以為由多個按鍵組合構(gòu)成的多個音符，例如：和弦音等。其中，可以通過對第一音頻數(shù)據(jù)進(jìn)行特征識別，識別出其中所包含的每個音符，然后將其按照音符劃分為多個部分，例如：如果第一音頻數(shù)據(jù)中包含10個音符，則可以將第一音頻數(shù)據(jù)劃分為10個部分，然后基于每個音符片段中所包含的音符數(shù)量，將這10個部分組合為m個音符片段，例如：如果每個音符片段中僅僅包含一個音符，則可以將這10個部分直接作為10個音符片段；如果每個音符片段中包含兩個音符，則可以將10個部分依次兩兩組合，獲得5個音符片段等等。其中，在采集獲得第一音頻數(shù)據(jù)之后，可以直接采用第一音頻數(shù)據(jù)進(jìn)行后續(xù)處理，也可以先從第一音頻數(shù)據(jù)中濾除靜音和無效語音。在執(zhí)行步驟s202之前，需要首先獲得音符模型，在具體實施過程中，請參考圖3，可以通過以下步驟獲得音符模型：步驟s301：獲取每個音符片段對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)；步驟s302：提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息；步驟s303：基于音符片段與特征信息的對應(yīng)關(guān)系建立音符模型，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系。步驟s301中，以該音符模型為鋼琴的音符模型、每個音符片段包含一個音符為例，鋼琴上通常包含88個按鍵，每個按鍵對應(yīng)一個音符，則可以針對每個按鍵分別進(jìn)行錄音獲得對應(yīng)按鍵的標(biāo)準(zhǔn)語音數(shù)據(jù)。步驟s302中，該特征數(shù)據(jù)可以包含多種特征信息，下面列舉其中的兩種進(jìn)行介紹，當(dāng)然，在具體實施過程中，不限于以下兩種情況，另外，在不沖突的情況下，以下兩種情況可以組合使用。第一種，所述特征數(shù)據(jù)包括頻譜特征，所述提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息，包括：將所述標(biāo)準(zhǔn)語音數(shù)據(jù)由時域數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù)；將所述頻域數(shù)據(jù)劃分為至少一個子數(shù)據(jù)；計算獲得所述至少一個子數(shù)據(jù)中每個子數(shù)據(jù)的能量，所述至少一個子數(shù)據(jù)中每個子數(shù)據(jù)的能量即為對應(yīng)音符片段的特征信息。舉例來說，可以根據(jù)實際需求將頻域數(shù)據(jù)劃分為不同數(shù)量的子數(shù)據(jù)，例如：5、10等等，本發(fā)明實施例不作限制。其中，假設(shè)將頻域數(shù)據(jù)劃分為5個子數(shù)據(jù)，針對其中某個標(biāo)準(zhǔn)語音數(shù)據(jù)(例如：高音1)的5個子數(shù)據(jù)的能量分別為：5、8、10、10、12，則可以確定出該標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息為(5，8，10，10，12)。其中，針對某個音符片段可以僅僅采集一次標(biāo)準(zhǔn)語音數(shù)據(jù)，也可以采集多次標(biāo)準(zhǔn)語音數(shù)據(jù)，如果采集多次標(biāo)準(zhǔn)語音數(shù)據(jù)的話，則可以獲取多組前面的特征信息，然后將這多組特征信息取平均值獲得最終用于確定音符模型中的特征信息。第二種，所述特征數(shù)據(jù)包括頻率特征，所述提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息，包括：將所述標(biāo)準(zhǔn)語音數(shù)據(jù)由時域數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù)；將所述頻域數(shù)據(jù)劃分為至少一個子數(shù)據(jù)；計算獲得所述至少一個子數(shù)據(jù)中每個子數(shù)據(jù)的能量；確定出預(yù)定能量對應(yīng)的子數(shù)據(jù)的頻率作為對應(yīng)音符片段的特征信息。舉例來說，可以首先計算出每部分子數(shù)據(jù)的能量，然后確定出能量最高的子數(shù)據(jù)所對應(yīng)的頻率作為對應(yīng)音符片段的頻率特征、也可以確定出能量居中的子數(shù)據(jù)所對應(yīng)的頻率作為對應(yīng)的音符的頻率特征等等，對于采用何種方式設(shè)定預(yù)定頻率，本發(fā)明實施例不作限制。在具體實施過程中，如果該音符模型為針對固定調(diào)樂器的音符模型，則針對某個音符片段直接獲取其對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)，然后建立該音符片段與特征信息之間的對應(yīng)關(guān)系即可；而如果該音符模型為針對變調(diào)樂器的音符模型，所述獲取每個音符對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)，包括：獲取在特定音調(diào)下，每個音符所對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)；所述基于音符片段與特征信息的對應(yīng)關(guān)系建立音符模型，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系，包括：基于所述特定音調(diào)下音符片段與特征信息的對應(yīng)關(guān)系，建立所述音符模型，所述音符模型包含在所述特定音調(diào)下，所述至少一組音符片段與特征信息的對應(yīng)關(guān)系。舉例來說，針對某一種樂器，如果其采用不同的調(diào)性(例如：c調(diào)、d調(diào)等等)即使是相同的音符，其特征信息也不相同，故而針對每個音調(diào)，都采集獲得每個音符片段所對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)，進(jìn)而最終所獲得的音符包含每個音調(diào)下，至少一組音符片段與特征信息的對應(yīng)關(guān)系，基于該方案能夠?qū)崿F(xiàn)對音樂更加準(zhǔn)確的識別。在具體實施過程中，音符模型可以為多種形式的模型，下面列舉其中的兩種進(jìn)行介紹，當(dāng)然，在具體實施過程中，不限于以下兩種情況。第一種，音符模型具體為音符模板，該音符模板中包含音符與特征信息之間的對應(yīng)關(guān)系，例如，如表1所示：表1音符特征信息高音1(5，8，10，10，12)中音7(5，13，12，9，12)中音6(12，6，18，10，6)中音5(9，8，10，10，7)…………當(dāng)然，在具體實施過程中，音符與特征信息還可以為其他對應(yīng)關(guān)系，本發(fā)明實施例不再詳細(xì)列舉，并且不作限制。第二種，音符模型具體為：基于統(tǒng)計的模型，例如：基于提取特征訓(xùn)練hmm(hiddenmarkovmodel、隱馬爾可夫模型)、決策樹模型等等。以hmm模型為例，可以首先獲取各個音符片段所對應(yīng)的特征信息，然后將每個音符片段的特征信息中輸入hmm模型進(jìn)行訓(xùn)練，獲得一組概率向量使得對應(yīng)音符片段所對應(yīng)的特征信息的概率趨向于最大化，即獲得用于對應(yīng)音符片段進(jìn)行識別的hmm模型，進(jìn)而存在多少個音符片段，則存在多少個hmm模型。該用于對音符識別的hmm模型中包含特征信息屬于某個音符片段的概率，例如：在獲得特征信息(5，8，10，10，12)之后，可以將其輸入各個音符片段所對應(yīng)的hmm模型中，獲得該特征信息在各個音符片段下的概率，然后確定出概率值最高的音符片段作為該特征信息所對應(yīng)的音符片段。步驟s202中，對第一音頻數(shù)據(jù)進(jìn)行匹配識別可以分為多種情況，下面列舉其中的兩種進(jìn)行介紹，當(dāng)然，在具體實施過程中，不限于以下兩種情況。對所述第一音頻數(shù)據(jù)進(jìn)行匹配識別的方式一：對所述第一音頻數(shù)據(jù)中的演奏錯誤進(jìn)行識別。其中，演奏錯誤又可以分為多種錯誤，下面列舉其中的三種進(jìn)行介紹，當(dāng)然，在具體實施過程中，不限于以下三種情況。第一種，所述演奏錯誤包括：音符錯誤。舉例來說，假設(shè)用戶基于參考樂譜信息產(chǎn)生第一音頻數(shù)據(jù)，其中參考樂譜信息中第二個音符片段為高音1，而第一音頻數(shù)據(jù)中的第二個音符片段為中音7，則可以確定出演奏過程中出現(xiàn)音符錯誤。其中，音符錯誤可能是將一個音符演奏成另一個音符，也可以是遺漏掉某個音符、或者多演奏了某個音符，本發(fā)明實施例不作限制。第二種，所述演奏錯誤包括：節(jié)奏錯誤。舉例來說，假設(shè)用戶基于參考樂譜信息產(chǎn)生第一音頻數(shù)據(jù)，其中參考樂譜信息中第二個音符片段為高音1，且為全音符，而第一音頻數(shù)據(jù)中的第二個音符片段為高音1，但是為半音符，則說明出現(xiàn)節(jié)奏錯誤。第三種，所述演奏錯誤包括：音不準(zhǔn)。舉例來說，針對某些吹奏類樂器，對氣息存在要求，如果氣息不穩(wěn)或者氣息不足，則及時吹奏過程中音符片段所對應(yīng)的指法沒錯，也會導(dǎo)致音不準(zhǔn)的情況。在具體實施過程中，所述對所述第一音頻數(shù)據(jù)中的演奏錯誤進(jìn)行識別，請參考圖4，包括：步驟s401：獲取用于產(chǎn)生所述第一音頻數(shù)據(jù)的參考樂譜信息；步驟s402：確定出所述參考樂譜信息所包含的n個音符片段，n為正整數(shù)；步驟s403：基于所述音符模型，確定出所述m個音符片段與所述n個音符片段中音符不匹配的片段做為所述演奏錯誤所對應(yīng)的音符片段。步驟s401中，參考樂譜信息例如為：簡譜、五線譜、減字譜等等，本發(fā)明實施例不作限制。在具體實施過程中，可以通過多種方式獲取參考樂譜信息，下面列舉其中的三種進(jìn)行介紹，當(dāng)然，在具體實施過程中不限于以下三種情況。確定參考樂譜信息的方式①：響應(yīng)用戶的選擇操作，進(jìn)而獲取所述參考樂譜信息。舉例來說，在用戶演奏音樂時，希望通過app對自己演奏的音樂中的演奏錯誤進(jìn)行識別，則可以首先打開對應(yīng)的app，然后從app選擇出自己演奏的音樂，用戶所選擇的音樂所對應(yīng)的樂譜即為參考樂譜信息。確定參考樂譜信息的方式②：對紙質(zhì)教程上的樂譜進(jìn)行掃描獲得樂譜圖像信息，對所述樂譜圖像信息進(jìn)行圖像識別進(jìn)而獲得所述參考樂譜信息。舉例來說，針對樂器演奏都會存在紙質(zhì)教程，紙質(zhì)教程上會包含很多樂譜信息，用戶如果希望哪首音樂，則可以通過攝像頭掃描獲得對應(yīng)音樂的樂譜圖像信息，然后通過電子設(shè)備進(jìn)行圖像識別就可以獲得參考樂譜信息。確定參考樂譜信息的方式③：對與所述第一音頻數(shù)據(jù)存在關(guān)聯(lián)的第二音頻數(shù)據(jù)進(jìn)行聲學(xué)識別確定出所述參考樂譜信息。舉例來說，第二音頻數(shù)據(jù)可以為與第一音頻數(shù)據(jù)不同的其他音頻數(shù)據(jù)，例如：用戶希望演奏音樂a，則可以首先演奏音樂a的片段(也即第二音頻數(shù)據(jù))，電子設(shè)備在錄入該第二音頻數(shù)據(jù)之后，通過對第二音頻數(shù)據(jù)進(jìn)行聲學(xué)識別，確定出與該第二音頻數(shù)據(jù)匹配的參考樂譜信息，用戶演奏三個音符時，通過該對音符進(jìn)行識別，假設(shè)識別出音符為：125，通過125在系統(tǒng)中進(jìn)行匹配，確定出以下的識別結(jié)果：用戶演奏五個音符時，通過對音符進(jìn)行識別，假設(shè)識別出音符為12531，通過12531在系統(tǒng)中進(jìn)行匹配，確定出以下的識別結(jié)果：其中，可以基于用戶的選擇操作從中確定出參考樂譜信息，也可以繼續(xù)檢測用戶所輸入的音符，直到只剩下一個識別結(jié)果，則該剩下的識別結(jié)果為參考樂譜信息。在基于第二音頻數(shù)據(jù)確定出參考樂譜信息之后，用戶重新演奏音樂a，則電子設(shè)備繼續(xù)采集用戶演奏的音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)。又或者，在基于第二音頻數(shù)據(jù)確定出參考樂譜信息之后，用戶繼續(xù)演奏音樂a，在這種情況下第二音頻數(shù)據(jù)可以為與第一音頻數(shù)據(jù)相同的音頻數(shù)據(jù)，例如：用戶直接演奏樂曲a，電子設(shè)備采集用戶演奏的第一音頻數(shù)據(jù)，通過該第一音頻數(shù)據(jù)確定出對應(yīng)參考樂譜信息，并對第一音頻數(shù)據(jù)中演奏錯誤進(jìn)行識別。步驟s402中，直接提取出參考樂譜信息中的各個音符，就可以獲得n個音符片段，其中在提取出參考樂譜信息中的各個音符時，可以一次性將參考樂譜信息中的所有音符都提取出，也可以依次提取參考樂譜信息中的部分音符，在提取出參考樂譜信息中的部分音符之后則可以實時識別第一音頻數(shù)據(jù)中的演奏錯誤。步驟s403中，可以通過多種方式確定出m個音符片段與n個音符片段中音符不匹配的片段，下面列舉其中的兩種進(jìn)行介紹，當(dāng)然，在具體實施過程中，不限于以下兩種情況。第一種，所述基于所述音符模型，確定出所述m個音符片段與所述n個音符片段中音符不匹配的片段作為所述演奏錯誤所對應(yīng)的音符片段，請參考圖5，包括：步驟s501：從所述音符模型中查找獲得所述n個音符片段中各個音符片段的特征信息，進(jìn)而確定出參考樂譜信息所對應(yīng)的第一音符特征信息；步驟s502：提取獲得所述m個音符片段中各個音符片段的特征信息，進(jìn)而獲得第二音符特征信息；步驟s503：將所述第二音符特征信息與所述第一音符特征信息進(jìn)行匹配，確定出特征信息不匹配的音符片段作為所述演奏錯誤所對應(yīng)的音符片段。步驟s502中，獲得m個音符片段中各個音符片段的特征信息的方式與建立音符模型時特征信息的方式類似，故而在此不再贅述。步驟s503中，基于音符模型的不同，將第二音符特征信息與第一音符特征信息匹配的方式也不同，下面列舉其中的兩種分別進(jìn)行介紹，當(dāng)然，在具體實施過程中，不限于以下兩種情況。①音符模型為音符模板，則可以計算第二音符特征信息中每個音符片段的特征信息與第一音符特征信息中對應(yīng)音符片段的特征信息的相似度參數(shù)，基于該相似度值來確定不匹配的音符片段。以第二音符特征信息中的第一個音符片段為例，則可以計算第二音符特征信息中的第一個音符片段的特征信息與第一音符特征信息中的對應(yīng)音符片段的特征信息(例如：第一音符特征信息中的第一個音符片段)的距離值(距離值越大，則相似度值越小)，然后判斷距離值是否小于預(yù)設(shè)距離閾值，如果小于預(yù)設(shè)距離閾值，則說明第二音符特征信息中的第一個音符片段和第一音符特征信息中的第一個音符片段匹配，否則，說明不匹配；也可以計算第二音符特征信息中的第一個音符片段的特征信息與第一音符特征信息中的對應(yīng)音符片段的特征信息的相似度值，然后判斷相似度值是否大于預(yù)設(shè)相似度閾值，如果大于預(yù)設(shè)相似度閾值，則說明第二音符特征信息中的第一個音符片段和第一音符特征信息中的第一個音符片段匹配，否則，說明不匹配。②音符模型為統(tǒng)計模型，則可以將第二音符特征信息中的每個特征信息輸入第一音符特征信息中的對應(yīng)音符特征信息的統(tǒng)計模型，獲得一個計算概率其中為提取特征，m為統(tǒng)計模型；然后判斷該計算概率是否大于預(yù)設(shè)概率值，如果大于預(yù)設(shè)概率值，則說明第二音符特征信息中的對應(yīng)音符片段與第一音符特征信息中的對應(yīng)音符片段匹配，否則，說明不匹配。第一種，所述基于所述音符模型，確定出所述m個音符片段與所述n個音符片段中音符不匹配的片段作為所述演奏錯誤所對應(yīng)的音符片段，請參考圖6，包括：步驟s601：提取獲得所述m個音符片段中各個音符片段的特征信息，進(jìn)而獲得第二音符特征信息；步驟s602：通過所述音符模型對所述第二音符特征信息進(jìn)行識別，進(jìn)而獲得所述第一音頻數(shù)據(jù)所對應(yīng)的第一樂譜信息；步驟s603：將所述第一樂譜信息與所述參考樂譜信息進(jìn)行匹配，進(jìn)而確定出音符不相同的音符片段作為所述演奏錯誤所對應(yīng)的音符片段。步驟s602中，基于音符模型不同，獲得第一樂譜信息的方式也不同，下面列舉其中的兩種進(jìn)行介紹，當(dāng)然，在具體實施過程中，不限于以下兩種情況。①音符模型為音符模板，在這種情況下，針對第二音符特征信息中某一音符片段所對應(yīng)的第一特征信息，可以將其與音符模型中所有音符片段的特征信息計算相似度參數(shù)(例如：相似度值、距離值等等)，然后確定出音符模板特征信息與第一特征信息的相似度值最高(或者距離值最低)的音符片段作為第一音符片段，其中，針對第二音符特征信息中的每個特征信息都可以采用該方式獲得其對應(yīng)的音符片段，進(jìn)而獲得第一樂譜信息。②音符模型為統(tǒng)計模型，在這種情況下，針對第二音符特征信息中某一音符片段所對應(yīng)的第一特征信息，可以將第一特征信息輸入所有音符片段所對應(yīng)的統(tǒng)計模型，然后確定出所獲得概率值最高的統(tǒng)計模型所對應(yīng)的音符片段作為第一特征信息所對應(yīng)的音符片段。步驟s603中，針對第一樂譜信息和參考樂譜信息直接比較相同位置的音符片段是否相同，如果不相同，則對應(yīng)的音符片段為演奏出現(xiàn)錯誤的音符片段。作為一種可選的實施例，所述方法還包括：確定出所述n個音符片段中每個音符片段的演奏時長；在所述基于所述音符模型，確定出所述m個音符片段與所述n個音符片段中音符不匹配的片段作為所述演奏錯誤所對應(yīng)的音符片段之后，所述方法還可以包括：確定出所述m個音符片段與所述n個音符片段中音符匹配但演奏時長不匹配的片段作為所述演奏錯誤所對應(yīng)的音符片段。舉例來說，假設(shè)第一音頻數(shù)據(jù)中第三個音符片段為中音3，其音符長度為全音符，而參考樂譜信息中第三個音符片段為中音3，其音符長度為半音符，則說明用所演奏的音符片段正確，但是演奏時長少了一半，在這種情況下，也可以將該音符作為演奏錯誤片段。當(dāng)然，演奏時長不匹配還可能是其他情況，本發(fā)明實施例不再詳細(xì)列舉，并且不作限制。在具體實施過程中，在識別出第一音頻數(shù)據(jù)中演奏錯誤的音符片段之后，還可以將第一音頻數(shù)據(jù)中演奏錯誤的地方提供給用戶，并對演奏錯誤的地方進(jìn)行統(tǒng)計后輸出，如圖7所示。其中，可以每識別到一個演奏錯誤的位置，就將其提供給用戶，也可以在一首音樂演奏結(jié)束之后，再將識別結(jié)果提供給用戶。對第一音頻數(shù)據(jù)進(jìn)行匹配識別的方式二：基于所述m個音符片段和音符模型獲得所述第一音頻數(shù)據(jù)的第一樂譜信息。在具體實施過程中，所述獲得所述第一音頻數(shù)據(jù)的第一樂譜信息，請參考圖8，包括：步驟s801：提取出第一音符片段的第一特征信息，所述第一音符片段為所述m個音符片段中的任一音符片段；步驟s802：從所述音符模型所包含的音符片段中確定出特征信息與所述第一特征信息的相似度值滿足預(yù)設(shè)相似度條件的音符片段；步驟s803：將所述相似度值滿足預(yù)設(shè)相似度條件的音符片段的音符作為所述第一音符片段的音符；步驟s804：基于所述第一音符片段的音符、或第一音符片段的音符與所述第一音符片段的演奏時長確定出所述第一樂譜信息。步驟s801中，具體如何提取第一音符片段的第一特征信息，由于前面已作介紹，故而在此不再贅述。步驟s802中，相似度值滿足預(yù)設(shè)相似度條件可以分為多種情況，例如：①與第一特征信息的相似度值最高(或者距離值最低)，其中，可以計算第一特征信息與音符模型中所有音符片段的特征信息的相似度值，然后獲取音符模型中特征信息與第一特征信息的相似度值最高的音符片段作為第一音符片段；或者計算第一特征信息與音符模型中所有音符片段的特征信息的距離值，然后獲取音符模型中特征信息與第一特征信息的距離值最低的音符片段作為第一音符片段。②與第一特征信息的相似度值大于預(yù)設(shè)相似度閾值，其中，可以計算第一特征信息中與音符模型中任一音符片段的特征信息的相似度值，然后判斷該相似度值是否大于預(yù)設(shè)相似度閾值，如果大于預(yù)設(shè)相似度閾值，則確定出對應(yīng)的音符片段作為第一音符片段；如果不大于預(yù)設(shè)相似度閾值，則獲取音符模型中下一個音符片段的特征信息繼續(xù)與第一特征信息計算相似度值，直到確定出第一字符片段為止，由于在該方案中，不需要計算出第一特征信息與音符模型中的所有音符片段的特征信息的相似度值，故而達(dá)到了降低電子設(shè)備處理負(fù)擔(dān)的技術(shù)效果。步驟s804中，由于基于步驟s803確定出所有特征信息所對應(yīng)的音符片段，故而將各個音符片段的音符按照出現(xiàn)時間依次排列，就可以獲得第一樂譜信息；而第一音符片段的演奏時長直接可以從第一音頻數(shù)據(jù)中獲取，從而也可以基于各個音符片段以及每個音符片段的演奏時長確定出第一樂譜信息，如果基于各個音符片段以及每個音符片段的演奏時長確定出第一樂譜信息的話，則能夠確定出更加精確的第一樂譜信息。作為一種可選的實施例，在確定出所述第一樂譜信息之后，所述方法還包括：搜索獲得與所述第一樂譜信息的相似度值大于預(yù)設(shè)相似度值的參考樂譜信息；將所述參考樂譜信息作為所述第一樂譜信息的推薦樂譜信息提供給用戶。舉例來說，可以預(yù)先搜集整理一些較為權(quán)威的樂譜加入樂譜數(shù)據(jù)庫，這些樂譜基本上不會有什么錯誤。其中，用戶所獲得第一樂譜信息可能為通過網(wǎng)絡(luò)搜索或者自己記譜所獲得樂譜信息，可能會出現(xiàn)一些錯誤，故而，在獲得第一樂譜信息之后，可以從樂譜數(shù)據(jù)庫中獲得與第一樂譜信息的相似度值大于預(yù)設(shè)相似度值的參考樂譜信息，并將其提供給用戶，以保證用戶所獲得的樂譜信息的準(zhǔn)確性。另外，在將參考樂譜信息提供給用戶之前，還可以先判斷參考樂譜信息與第一樂譜信息是否完全相同，如果完全相同的話，則不需要提供給用戶；在不完全相同時，才將參考樂譜信息提供給用戶。第二方面，基于同一發(fā)明構(gòu)思，本發(fā)明實施例提供一種音符識別模型建立方法，請參考圖9，包括：步驟s901：獲取每個音符片段對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)；步驟s902：提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息；步驟s903：基于音符片段與特征信息的對應(yīng)關(guān)系建立音符模型，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系。可選的，所述音符片段包括：由單個按鍵所構(gòu)成的單個音符；和/或由多個按鍵組合所構(gòu)成的多個音符。可選的，所述提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息，包括：提取每個音符片段的頻譜特征和/或頻率特征。可選的，所述提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息，包括：將所述標(biāo)準(zhǔn)語音數(shù)據(jù)由時域數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù)；將所述頻域數(shù)據(jù)劃分為至少一個子數(shù)據(jù)；計算獲得所述至少一個子數(shù)據(jù)中每個子數(shù)據(jù)的能量，所述至少一個子數(shù)據(jù)中每個子數(shù)據(jù)的能量做為對應(yīng)音符片段的特征信息。可選的，所述提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息，包括：將所述標(biāo)準(zhǔn)語音數(shù)據(jù)由時域數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù)；將所述頻域數(shù)據(jù)劃分為至少一個子數(shù)據(jù)；計算獲得所述至少一個子數(shù)據(jù)中每個子數(shù)據(jù)的能量；確定出預(yù)定能量對應(yīng)的子數(shù)據(jù)的頻率做為對應(yīng)音符片段的特征信息?？蛇x的，所述獲取每個音符對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)，包括：獲取在特定音調(diào)下，每個音符所對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)；所述基于音符片段與特征信息的對應(yīng)關(guān)系建立音符模型，所述音符模型中包含多組音符片段與特征信息的對應(yīng)關(guān)系，包括：基于所述特定音調(diào)下音符片段與特征信息的對應(yīng)關(guān)系，建立所述音符模型，所述音符模型包含在所述特定音調(diào)下，所述至少一組音符片段與特征信息的對應(yīng)關(guān)系。由于本發(fā)明實施例第二方面所介紹的音符識別模型建立方法與本發(fā)明實施例第一方面所介紹的音樂識別方法對應(yīng)，故而基于本發(fā)明實施例第一方面所介紹的音樂識別方法，本領(lǐng)域所屬技術(shù)人員能夠了解本發(fā)明實施例第二方面所介紹的音符識別模型建立方法的具體實施過程，故而在此不再贅述。第三方面，基于同一發(fā)明構(gòu)思，本發(fā)明實施例提供一種音樂識別裝置，請參考圖10，包括：獲得模塊10，用于獲得音樂所對應(yīng)的第一音頻數(shù)據(jù)，所述第一音頻數(shù)據(jù)包含m個音符片段，m為正整數(shù)；識別模塊11，用于基于所述m個音符片段和音符模型，對所述第一音頻數(shù)據(jù)進(jìn)行匹配識別，其中，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系?？蛇x的，所述識別模塊11，用于：對所述第一音頻數(shù)據(jù)中的演奏錯誤進(jìn)行識別；和/或基于所述m個音符片段和音符模型獲得所述第一音頻數(shù)據(jù)的第一樂譜信息?？蛇x的，所述演奏錯誤包括：音符錯誤、節(jié)奏錯誤、音不準(zhǔn)中的至少一種演奏錯誤。可選的，所述識別模塊11，包括：獲取單元，用于獲取用于產(chǎn)生所述第一音頻數(shù)據(jù)的參考樂譜信息；第一確定單元，用于確定出所述參考樂譜信息所包含的n個音符片段，n為正整數(shù)；第二確定單元，用于基于所述音符模型，確定出所述m個音符片段與所述n個音符片段中音符不匹配的片段作為所述演奏錯誤所對應(yīng)的音符片段?？蛇x的，所述裝置還包括：第一確定模塊，用于確定出所述n個音符片段中每個音符片段的演奏時長；第二確定模塊，用于確定出所述m個音符片段與所述n個音符片段中音符匹配但演奏時長不匹配的片段作為所述演奏錯誤所對應(yīng)的音符片段?？蛇x的，所述第二確定單元，包括：獲得子單元，用于從所述音符模型中查找獲得所述n個音符片段中各個音符片段的特征信息，進(jìn)而確定出參考樂譜信息所對應(yīng)的第一音符特征信息；第一提取子單元，用于提取獲得所述m個音符片段中各個音符片段的特征信息，進(jìn)而獲得第二音符特征信息；第一匹配子單元，用于將所述第二音符特征信息與所述第一音符特征信息進(jìn)行匹配，確定出特征信息不匹配的音符片段作為所述演奏錯誤所對應(yīng)的音符片段。可選的，所述第二確定單元，包括：第二提取子單元，用于提取獲得所述m個音符片段中各個音符片段的特征信息，進(jìn)而獲得第二音符特征信息；識別子單元，用于通過所述音符模型對所述第二音符特征信息進(jìn)行識別，進(jìn)而獲得所述第一音頻數(shù)據(jù)所對應(yīng)的第一樂譜信息；第二匹配子單元，用于將所述第一樂譜信息與所述參考樂譜信息進(jìn)行匹配，進(jìn)而確定出音符不相同的音符片段作為所述演奏錯誤所對應(yīng)的音符片段?？蛇x的，所述獲取單元，用于：響應(yīng)用戶的選擇操作，進(jìn)而獲取所述參考樂譜信息；或者對紙質(zhì)教程上的樂譜進(jìn)行掃描獲得樂譜圖像信息，對所述樂譜圖像信息進(jìn)行圖像識別進(jìn)而獲得所述參考樂譜信息；或者對與所述第一音頻數(shù)據(jù)存在關(guān)聯(lián)的第二音頻數(shù)據(jù)進(jìn)行聲學(xué)識別確定出所述參考樂譜信息。可選的，所述識別模塊11，包括：提取單元，用于提取出第一音符片段的第一特征信息，所述第一音符片段為所述m個音符片段中的任一音符片段；第三確定單元，用于從所述音符模型所包含的音符片段中確定出特征信息與所述第一特征信息的相似度值滿足預(yù)設(shè)相似度條件的音符片段；第四確定單元，用于將所述相似度值滿足預(yù)設(shè)相似度條件的音符片段的音符作為所述第一音符片段的音符；第五確定單元，用于基于所述第一音符片段的音符、或第一音符片段的音符與所述第一音符片段的演奏時長確定出所述第一樂譜信息?？蛇x的，所述裝置還包括：搜索模塊，用于搜索獲得與所述第一樂譜信息的相似度值大于預(yù)設(shè)相似度值的參考樂譜信息；第三確定模塊，用于將所述參考樂譜信息作為所述第一樂譜信息的推薦樂譜信息提供給用戶?？蛇x的，所述音符模型中包含在特定音調(diào)下，至少一組音符片段與特征信息的對應(yīng)關(guān)系。由于本發(fā)明實施例第三方面所介紹的音樂識別裝置為實施本發(fā)明實施例第一方面所介紹的音樂識別方法所采用的裝置，故而基于本發(fā)明實施例第一方面所介紹的音樂識別方法，本領(lǐng)域所屬技術(shù)人員能夠了解該裝置的具體結(jié)構(gòu)及變形，故而在此不再贅述，凡是實施本發(fā)明實施例第一方面所介紹的音樂識別方法所采用的裝置都屬于本發(fā)明所欲保護(hù)的范圍。第四方面，基于同一發(fā)明構(gòu)思，本發(fā)明實施例提供一種音符識別模型建立裝置，請參考圖11，包括：獲取模塊20，用于獲取每個音符片段對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)；提取模塊21，用于提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息；建立模塊22，用于基于音符片段與特征信息的對應(yīng)關(guān)系建立音符模型，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系?？蛇x的，所述音符片段包括：由單個按鍵所構(gòu)成的單個音符；和/或由多個按鍵組合所構(gòu)成的多個音符?？蛇x的，所述提取模塊21，用于：提取每個音符片段的頻譜特征和/或頻率特征?？蛇x的，所述提取模塊21，包括：第一轉(zhuǎn)換單元，用于將所述標(biāo)準(zhǔn)語音數(shù)據(jù)由時域數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù)；第一劃分單元，用于將所述頻域數(shù)據(jù)劃分為至少一個子數(shù)據(jù)；第一計算單元，用于計算獲得所述至少一個子數(shù)據(jù)中每個子數(shù)據(jù)的能量，所述至少一個子數(shù)據(jù)中每個子數(shù)據(jù)的能量做為對應(yīng)音符片段的特征信息。可選的，所述提取模塊21，包括：第二轉(zhuǎn)換單元，用于將所述標(biāo)準(zhǔn)語音數(shù)據(jù)由時域數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù)；第二劃分單元，用于將所述頻域數(shù)據(jù)劃分為至少一個子數(shù)據(jù)；第二計算單元，用于計算獲得所述至少一個子數(shù)據(jù)中每個子數(shù)據(jù)的能量；確定出預(yù)定能量對應(yīng)的子數(shù)據(jù)的頻率做為對應(yīng)音符片段的特征信息?？蛇x的，所述獲取模塊20，用于獲取在特定音調(diào)下，每個音符所對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)；所述建立模塊22，用于基于所述特定音調(diào)下音符片段與特征信息的對應(yīng)關(guān)系，建立所述音符模型，所述音符模型包含在所述特定音調(diào)下，所述多組音符片段與特征信息的對應(yīng)關(guān)系。由于本發(fā)明實施例第四方面所介紹的音符識別模型建立裝置為實施本發(fā)明實施例第二方面所介紹的音符識別模型建立方法所采用的裝置，故而基于本發(fā)明實施例第二方面所介紹的音符識別模型建立方法，本領(lǐng)域所屬技術(shù)人員能夠了解該裝置的具體結(jié)構(gòu)及變形，故而在此不再贅述，凡是實施本發(fā)明實施例第二方面所介紹的音符識別模型建立方法所采用的裝置都屬于本發(fā)明所欲保護(hù)的范圍。第五方面，基于同一發(fā)明構(gòu)思，本發(fā)明實施例提供一種電子設(shè)備，包括有存儲器，以及一個或者一個以上的程序，其中一個或者一個以上程序存儲于存儲器中，且經(jīng)配置以由一個或者一個以上處理器執(zhí)行所述一個或者一個以上程序包含用于進(jìn)行以下操作的指令：獲得音樂所對應(yīng)的第一音頻數(shù)據(jù)，所述第一音頻數(shù)據(jù)包含m個音符片段，m為正整數(shù)；基于所述m個音符片段和音符模型，對所述第一音頻數(shù)據(jù)進(jìn)行匹配識別，其中，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系。由于本發(fā)明實施例第五方面所介紹的電子設(shè)備為實施本發(fā)明實施例第一方面所介紹的音樂識別方法所采用的電子設(shè)備，故而基于本發(fā)明實施例第一方面所介紹的音樂識別方法，本領(lǐng)域所屬技術(shù)人員能夠了解該電子設(shè)備的具體結(jié)構(gòu)及變形，故而在此不再贅述，凡是實施本發(fā)明實施例第一方面所介紹的音樂識別方法所采用的電子設(shè)備都屬于本發(fā)明所欲保護(hù)的范圍。第六方面，基于同一發(fā)明構(gòu)思，本發(fā)明實施例提供一種電子設(shè)備，包括有存儲器，以及一個或者一個以上的程序，其中一個或者一個以上程序存儲于存儲器中，且經(jīng)配置以由一個或者一個以上處理器執(zhí)行所述一個或者一個以上程序包含用于進(jìn)行以下操作的指令：獲取每個音符片段對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)；提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息；基于音符片段與特征信息的對應(yīng)關(guān)系建立音符模型，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系。由于本發(fā)明實施例第六方面所介紹的電子設(shè)備為實施本發(fā)明實施例第二方面所介紹的音符識別模型建立方法所采用的電子設(shè)備，故而基于本發(fā)明實施例第二方面所介紹的音符識別模型建立方法，本領(lǐng)域所屬技術(shù)人員能夠了解該電子設(shè)備的具體結(jié)構(gòu)及變形，故而在此不再贅述，凡是實施本發(fā)明實施例第二方面所介紹的音符識別模型建立方法所采用的電子設(shè)備都屬于本發(fā)明所欲保護(hù)的范圍。圖12是根據(jù)一示例性實施例示出的一種音樂識別方法或者音符識別模型建立方法的電子設(shè)備800的框圖。例如，電子設(shè)備800可以是移動電話，計算機(jī)，數(shù)字廣播終端，消息收發(fā)設(shè)備，游戲控制臺，平板設(shè)備，醫(yī)療設(shè)備，健身設(shè)備，個人數(shù)字助理等。參照圖12，電子設(shè)備800可以包括以下一個或多個組件：處理組件802，存儲器804，電源組件806，多媒體組件808，音頻組件810，輸入/輸出(i/o)的接口812，傳感器組件814，以及通信組件816。處理組件802通?？刂齐娮釉O(shè)備800的整體操作，諸如與顯示，電話呼叫，數(shù)據(jù)通信，相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理元件802可以包括一個或多個處理器820來執(zhí)行指令，以完成上述的方法的全部或部分步驟。此外，處理組件802可以包括一個或多個模塊，便于處理組件802和其他組件之間的交互。例如，處理部件802可以包括多媒體模塊，以方便多媒體組件808和處理組件802之間的交互。存儲器804被配置為存儲各種類型的數(shù)據(jù)以支持在設(shè)備800的操作。這些數(shù)據(jù)的示例包括用于在電子設(shè)備800上操作的任何應(yīng)用程序或方法的指令，聯(lián)系人數(shù)據(jù)，電話簿數(shù)據(jù)，消息，圖片，視頻等。存儲器804可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實現(xiàn)，如靜態(tài)隨機(jī)存取存儲器(sram)，電可擦除可編程只讀存儲器(eeprom)，可擦除可編程只讀存儲器(eprom)，可編程只讀存儲器(prom)，只讀存儲器(rom)，磁存儲器，快閃存儲器，磁盤或光盤。電源組件806為電子設(shè)備800的各種組件提供電力。電力組件806可以包括電源管理系統(tǒng)，一個或多個電源，及其他與為電子設(shè)備800生成、管理和分配電力相關(guān)聯(lián)的組件。多媒體組件808包括在所述電子設(shè)備800和用戶之間的提供一個輸出接口的屏幕。在一些實施例中，屏幕可以包括液晶顯示器(lcd)和觸摸面板(tp)。如果屏幕包括觸摸面板，屏幕可以被實現(xiàn)為觸摸屏，以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動動作的邊界，而且還檢測與所述觸摸或滑動操作相關(guān)的持續(xù)時間和壓力。在一些實施例中，多媒體組件808包括一個前置攝像頭和/或后置攝像頭。當(dāng)電子設(shè)備800處于操作模式，如拍攝模式或視頻模式時，前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。音頻組件810被配置為輸出和/或輸入音頻信號。例如，音頻組件810包括一個麥克風(fēng)(mic)，當(dāng)電子設(shè)備800處于操作模式，如呼叫模式、記錄模式和語音識別模式時，麥克風(fēng)被配置為接收外部音頻信號。所接收的音頻信號可以被進(jìn)一步存儲在存儲器804或經(jīng)由通信組件816發(fā)送。在一些實施例中，音頻組件810還包括一個揚聲器，用于輸出音頻信號。i/o接口812為處理組件802和外圍接口模塊之間提供接口，上述外圍接口模塊可以是鍵盤，點擊輪，按鈕等。這些按鈕可包括但不限于：主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。傳感器組件814包括一個或多個傳感器，用于為電子設(shè)備800提供各個方面的狀態(tài)評估。例如，傳感器組件814可以檢測到設(shè)備800的打開/關(guān)閉狀態(tài)，組件的相對定位，例如所述組件為電子設(shè)備800的顯示器和小鍵盤，傳感器組件814還可以檢測電子設(shè)備800或電子設(shè)備800一個組件的位置改變，用戶與電子設(shè)備800接觸的存在或不存在，電子設(shè)備800方位或加速/減速和電子設(shè)備800的溫度變化。傳感器組件814可以包括接近傳感器，被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件814還可以包括光傳感器，如cmos或ccd圖像傳感器，用于在成像應(yīng)用中使用。在一些實施例中，該傳感器組件814還可以包括加速度傳感器，陀螺儀傳感器，磁傳感器，壓力傳感器或溫度傳感器。通信組件816被配置為便于電子設(shè)備800和其他設(shè)備之間有線或無線方式的通信。電子設(shè)備800可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò)，如wifi，2g或3g，或它們的組合。在一個示例性實施例中，通信部件816經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關(guān)信息。在一個示例性實施例中，所述通信部件816還包括近場通信(nfc)模塊，以促進(jìn)短程通信。例如，在nfc模塊可基于射頻識別(rfid)技術(shù)，紅外數(shù)據(jù)協(xié)會(irda)技術(shù)，超寬帶(uwb)技術(shù)，藍(lán)牙(bt)技術(shù)和其他技術(shù)來實現(xiàn)。在示例性實施例中，電子設(shè)備800可以被一個或多個應(yīng)用專用集成電路(asic)、數(shù)字信號處理器(dsp)、數(shù)字信號處理設(shè)備(dspd)、可編程邏輯器件(pld)、現(xiàn)場可編程門陣列(fpga)、控制器、微控制器、微處理器或其他電子元件實現(xiàn)，用于執(zhí)行上述方法。在示例性實施例中，還提供了一種包括指令的非臨時性計算機(jī)可讀存儲介質(zhì)，例如包括指令的存儲器804，上述指令可由電子設(shè)備800的處理器820執(zhí)行以完成上述方法。例如，所述非臨時性計算機(jī)可讀存儲介質(zhì)可以是rom、隨機(jī)存取存儲器(ram)、cd-rom、磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。一種非臨時性計算機(jī)可讀存儲介質(zhì)，當(dāng)所述存儲介質(zhì)中的指令由電子設(shè)備的處理器執(zhí)行時，使得電子設(shè)備能夠執(zhí)行一種音樂識別方法，所述方法包括：獲得音樂所對應(yīng)的第一音頻數(shù)據(jù)，所述第一音頻數(shù)據(jù)包含m個音符片段，m為正整數(shù)；基于所述m個音符片段和音符模型，對所述第一音頻數(shù)據(jù)進(jìn)行匹配識別，其中，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系。一種非臨時性計算機(jī)可讀存儲介質(zhì)，當(dāng)所述存儲介質(zhì)中的指令由電子設(shè)備的處理器執(zhí)行時，使得電子設(shè)備能夠執(zhí)行一種音符識別模型建立方法，所述方法包括：獲取每個音符片段對應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)；提取每個音符片段的標(biāo)準(zhǔn)語音數(shù)據(jù)的特征信息；基于音符片段與特征信息的對應(yīng)關(guān)系建立音符模型，所述音符模型中包含至少一組音符片段與特征信息的對應(yīng)關(guān)系。本發(fā)明實施例中的服務(wù)器可因配置或性能不同而產(chǎn)生比較大的差異，可以包括一個或一個以上中央處理器(centralprocessingunits，cpu)(例如，一個或一個以上處理器)和存儲器，一個或一個以上存儲應(yīng)用程序或數(shù)據(jù)的存儲介質(zhì)(例如一個或一個以上海量存儲設(shè)備)。其中，存儲器和存儲介質(zhì)可以是短暫存儲或持久存儲。存儲在存儲介質(zhì)的程序可以包括一個或一個以上模塊(圖示沒標(biāo)出)，每個模塊可以包括對服務(wù)器中的一系列指令操作。更進(jìn)一步地，中央處理器可以設(shè)置為與存儲介質(zhì)通信，在服務(wù)器上執(zhí)行存儲介質(zhì)中的一系列指令操作。服務(wù)器還可以包括一個或一個以上電源，一個或一個以上有線或無線網(wǎng)絡(luò)接口，一個或一個以上輸入輸出接口，一個或一個以上鍵盤，和/或，一個或一個以上操作系統(tǒng)，例如windowsservertm，macosxtm，unixtm,linuxtm，freebsdtm等等。本發(fā)明一個或多個實施例，至少具有以下有益效果：由于在本發(fā)明實施例中，在獲得音樂所對應(yīng)的第一音頻數(shù)據(jù)中之后，可以基于第一音頻數(shù)據(jù)中所包含的m個音符片段和音符模型，對第一音頻數(shù)據(jù)進(jìn)行匹配識別其中，所述音符模型中包含多組音符片段與特征信息的對應(yīng)關(guān)系，也即是不需要硬件改進(jìn)，就可以實現(xiàn)對第一音頻數(shù)據(jù)中相關(guān)信息的識別，故而達(dá)到了提高對音樂識別的兼容性的技術(shù)效果，且能夠降低對音樂識別的成本；另外，由于不需要依賴于硬件改進(jìn)，故而針對任何方式輸出的第一音頻數(shù)據(jù)都能夠識別，而不需要依賴于電鋼琴或者電子琴，從而增加了該方案的應(yīng)用范圍。本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白，本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機(jī)程序產(chǎn)品。因此，本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且，本發(fā)明可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學(xué)存儲器等)上實施的計算機(jī)程序產(chǎn)品的形式。本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合?？商峁┻@些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器，使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的設(shè)備。這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中，使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令設(shè)備的制造品，該指令設(shè)備實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上，使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實現(xiàn)的處理，從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。盡管已描述了本發(fā)明的優(yōu)選實施例，但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念，則可對這些實施例作出另外的變更和修改。所以，所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明范圍的所有變更和修改。當(dāng)前第1頁12

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李貝;陳偉;姚光超;唐文琦
技術(shù)所有人：北京搜狗科技發(fā)展有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

3d化工裝置模型相關(guān)技術(shù)

自動更換砂紙裝置模型相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

音樂識別方法、音符識別模型建立方法、裝置及電子設(shè)備與流程

音樂識別方法、音符識別模型建立方法、裝置及電子設(shè)備與流程