一種基于聲紋識別的點歌系統(tǒng)及其應(yīng)用方法

文檔序號：7759042閱讀：238來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：一種基于聲紋識別的點歌系統(tǒng)及其應(yīng)用方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種點歌系統(tǒng)，尤其是一種基于聲紋識別技術(shù)的點歌系統(tǒng)。本發(fā)明還涉及一種該點歌系統(tǒng)的應(yīng)用方法。
背景技術(shù)：
隨著人們對生活品質(zhì)的追求，人們的業(yè)余生活變得越來越豐富，唱歌是廣受歡迎的一種娛樂方式，人們常常會在家里或歌廳里點唱自己喜歡的或者目前流行的歌曲，但是，由于每個人在聲帶構(gòu)造、發(fā)聲方式等方面的不同，有些歌曲并不適合點歌者演唱，而目前的點歌系統(tǒng)只能提供普通的歌曲列表，不能根據(jù)用戶的聲音特征選擇適合該用戶演唱的歌曲，如果用戶點唱的歌曲不適合自己，演唱的效果就會比較差，不僅達(dá)不到娛樂的目的，還可能使自己和聽眾感到失望。

發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種基于聲紋識別的點歌系統(tǒng)，它可以提高用戶唱歌的體驗。為解決上述技術(shù)問題，本發(fā)明的基于聲紋識別的點歌系統(tǒng)，包括歌曲數(shù)據(jù)庫，存儲有歌曲及其對應(yīng)的歌曲聲紋模型，該歌曲聲紋模型通過提取歌曲的聲紋特征而建立；錄音模塊，用于錄制用戶的語音；語音信號處理模塊，與錄音模塊相連接，用于對錄音模塊錄制到的語音信號進(jìn)行預(yù)處理；聲紋特征提取模塊，與語音信號處理模塊相連接，用于分析語音信號，并從語音信號中提取出聲紋特征，建立聲紋模型；聲紋特征比對模塊，與聲紋特征提取模塊相連接，用于將聲紋特征提取模塊建立的用戶聲紋模型與歌曲數(shù)據(jù)庫中歌曲聲紋模型進(jìn)行相似性匹配，返回聲紋模型能夠與用戶聲紋模型相匹配的歌曲的列表。本發(fā)明要解決的另一技術(shù)問題是提供一種上述點歌系統(tǒng)的應(yīng)用方法。為解決上述技術(shù)問題，本發(fā)明點歌系統(tǒng)的應(yīng)用方法，包括下列步驟(1)提示用戶發(fā)出一段語音；(2)將用戶的語音錄制下來；(3)對錄到的語音信號進(jìn)行預(yù)處理；(4)分析步驟(3)中得到的語音信號，提取出該語音信號中包含的用戶的聲紋特征，并建立用戶聲紋模型；(5)將步驟中得到的用戶的聲紋模型與歌曲數(shù)據(jù)庫中歌曲的聲紋模型進(jìn)行相似性匹配，計算兩者的相似度，并根據(jù)相似度數(shù)值的分布范圍，選取適當(dāng)?shù)臄?shù)值作為門限值，以控制檢索出的聲紋模型能與用戶聲紋模型相匹配的歌曲的數(shù)量；
(6)將步驟(5)檢索出的歌曲的列表提供給用戶點唱。本發(fā)明的點歌系統(tǒng)及其應(yīng)用方法，能夠根據(jù)用戶的聲紋特征，檢索出適合該用戶演唱的歌曲，提供給用戶點唱，從而可以提高用戶的演唱效果，使用戶獲得良好的唱歌體驗。

下面結(jié)合附圖與具體實施方式
對本發(fā)明作進(jìn)一步詳細(xì)的說明圖1是本發(fā)明的點歌系統(tǒng)的模塊示意圖；圖2是本發(fā)明的點歌系統(tǒng)的應(yīng)用方法流程圖。
具體實施例方式為對本發(fā)明的技術(shù)內(nèi)容、特點與功效有更具體的了解，現(xiàn)結(jié)合圖示的實施方式，詳述如下聲紋，是用電聲學(xué)儀器顯示的攜帶言語信息的聲波頻譜。由于人的語言產(chǎn)生是人體語言中樞與發(fā)音器官之間一個復(fù)雜的生理物理過程，身體在講話時使用的器官——舌、牙齒、喉頭、肺、鼻腔，在尺寸和形態(tài)方面每個人的差異很大，因此，任何兩個人的聲紋圖譜都不會完全相同，從而利用聲紋圖譜的特征可以自動識別該聲紋所對應(yīng)的說話人。目前，聲紋識別技術(shù)已是一項非常成熟的技術(shù)，被廣泛應(yīng)用于刑事偵查等領(lǐng)域。而隨著聲紋識別技術(shù)的發(fā)展，聲紋識別的準(zhǔn)確性也越來越高，本發(fā)明就是借助于聲紋識別技術(shù)，使點歌系統(tǒng)更加智能化，能夠檢索出適合用戶演唱的歌曲，供用戶點唱。本發(fā)明的基于聲紋識別的點歌系統(tǒng)，首先要收集歌曲，分析每首歌曲的音頻信號，利用聲紋識別技術(shù)從音頻信號中提取出該歌曲的聲紋特征(實際是該歌曲演唱者的聲紋特征)，建立歌曲的聲紋模型，然后與歌曲一一對應(yīng)存儲在一個歌曲數(shù)據(jù)庫中。此外，如圖1 所示，本發(fā)明的點歌系統(tǒng)還包括有下列模塊錄音模塊1，用于錄制用戶的語音，該錄音模塊1可以是至少一個麥克風(fēng)；語音信號處理模塊2，與錄音模塊1相連接，用于對錄音模塊1錄制到的語音信號進(jìn)行預(yù)處理，例如進(jìn)行量化、預(yù)加重、加窗、濾波等處理；聲紋特征提取模塊3，與語音信號處理模塊2相連接，用于分析語音信號，并從語音信號中提取出聲紋特征，建立聲紋模型；聲紋特征比對模塊4，與聲紋特征提取模塊3相連接，用于將聲紋特征提取模塊3 建立的用戶聲紋模型與歌曲數(shù)據(jù)庫中的歌曲聲紋模型進(jìn)行相似性匹配，并返回聲紋模型能夠與用戶聲紋模型相匹配的歌曲的列表。當(dāng)用戶進(jìn)入上述點歌系統(tǒng)，準(zhǔn)備進(jìn)行點歌時，該點歌系統(tǒng)按照下列步驟實現(xiàn)其針對用戶選擇歌曲的功能(1)提示用戶發(fā)出一段語音，該語音可以是一段話或者一段歌曲；(2)當(dāng)用戶發(fā)出語音時，錄音模塊1將用戶的語音錄制下來；(3)語音信號處理模塊2對步驟(2)中錄到的語音信號進(jìn)行預(yù)處理，例如，進(jìn)行濾波，去除該聲音信號中的噪聲，或進(jìn)行量化、預(yù)加重、加窗等處理；(4)聲紋特征提取模塊3對經(jīng)過步驟( 處理的語音信號進(jìn)行分析，利用聲紋識別技術(shù)提取出該語音信號中所包含的用戶的聲紋特征，并建立用戶聲紋模型；(5)聲紋特征比對模塊4將步驟(4)中得到的用戶聲紋模型與歌曲數(shù)據(jù)庫中的歌曲聲紋模型進(jìn)行相似性匹配，即計算兩者的相似度，然后根據(jù)相似度數(shù)值的分布范圍，選取適當(dāng)?shù)南嗨贫葦?shù)值作為門限值(調(diào)節(jié)門限值可以控制檢索出的歌曲數(shù)量)，檢索出歌曲數(shù)據(jù)庫中與用戶聲紋模型相匹配的歌曲聲紋模型，并返回這些歌曲聲紋模型所對應(yīng)的歌曲的列表；(6)將搜索到的歌曲列表提供給用戶點唱。上述步驟(5)中的相似性匹配，可以采用矢量化模型、隨機(jī)模型或者神經(jīng)網(wǎng)絡(luò)模型。隱馬爾可夫模型(Hidden Markov Model, HMM)是一種基于轉(zhuǎn)移概率和傳輸概率的隨機(jī)模型，它把聲音看成由可觀察到的符號序列(即發(fā)聲系統(tǒng)狀態(tài)序列的輸出)組成的隨機(jī)過程，由于不需要時間規(guī)整，能夠節(jié)約判斷識別的計算時間和存儲量，因此已被廣泛用于語音識別領(lǐng)域。本發(fā)明的較佳實施例也選擇了隱馬爾可夫模型來進(jìn)行相似性匹配的計算，并通過調(diào)整最大概率(即門限值)控制檢索出的聲紋模型與用戶的聲紋模型相似的歌曲的數(shù)目，即當(dāng)檢索出的歌曲數(shù)目過多時，調(diào)高最大概率值，提高相似性要求，使檢索出的歌曲更適合用戶演唱；反之，當(dāng)檢索出的歌曲數(shù)目很少時，調(diào)低最大概率值，以降低相似性要求，檢索出更多的歌曲供用戶選擇。使用本發(fā)明的點歌系統(tǒng)后，用戶就可以選擇適合自己聲音條件的歌曲進(jìn)行演唱，不會再盲目點唱流行或者自己喜歡但并不適合自己演唱的歌曲了，如此，不僅能夠提高用戶演唱的效果，達(dá)到娛樂的目的，而且還能使演唱者得到聽眾的認(rèn)同，使用戶獲得良好的唱歌體驗。
權(quán)利要求
1.一種基于聲紋識別的點歌系統(tǒng)，其特征在于，包括歌曲數(shù)據(jù)庫，存儲有歌曲及其對應(yīng)的歌曲聲紋模型，該歌曲聲紋模型通過提取歌曲的聲紋特征而建立；錄音模塊，用于錄制用戶的語音；語音信號處理模塊，與錄音模塊相連接，用于對錄音模塊錄制到的語音信號進(jìn)行預(yù)處理；聲紋特征提取模塊，與語音信號處理模塊相連接，用于分析語音信號，并從語音信號中提取出聲紋特征，建立聲紋模型；聲紋特征比對模塊，與聲紋特征提取模塊相連接，用于將聲紋特征提取模塊建立的用戶聲紋模型與歌曲數(shù)據(jù)庫中歌曲聲紋模型進(jìn)行相似性匹配，返回聲紋模型能夠與用戶聲紋模型相匹配的歌曲的列表。
2.如權(quán)利要求1所述的點歌系統(tǒng)，其特征在于所述錄音模塊為至少一個麥克風(fēng)。
3.—種權(quán)利要求1所述的點歌系統(tǒng)的應(yīng)用方法，其特征在于，包括下列步驟(1)提示用戶發(fā)出一段語音；(2)將用戶的語音錄制下來；(3)對錄到的語音信號進(jìn)行預(yù)處理；(4)分析步驟(3)中得到的語音信號，提取出該語音信號中包含的用戶的聲紋特征，并建立用戶聲紋模型；(5)將步驟中得到的用戶的聲紋模型與歌曲數(shù)據(jù)庫中歌曲的聲紋模型進(jìn)行相似性匹配，計算兩者的相似度，并根據(jù)相似度數(shù)值的分布范圍，選取適當(dāng)?shù)臄?shù)值作為門限值，以控制檢索出的聲紋模型能與用戶的聲紋模型相匹配的歌曲的數(shù)量；(6)將步驟(5)檢索出的歌曲的列表提供給用戶點唱。
4.如權(quán)利要求3所述的點歌系統(tǒng)的應(yīng)用方法，其特征在于所述步驟(3)中，對語音信號的預(yù)處理包括濾波，去除語音信號中的噪聲。
5.如權(quán)利要求3所述的點歌方法，其特征在于所述步驟(5)中，采用矢量化模型、隨機(jī)模型或者神經(jīng)網(wǎng)絡(luò)模型進(jìn)行相似性匹配計算。
6.如權(quán)利要求5所述的點歌方法，其特征在于所述隨機(jī)模型為隱馬爾可夫模型。
全文摘要
本發(fā)明公開了一種基于聲紋識別的點歌系統(tǒng)，包括歌曲數(shù)據(jù)庫、錄音模塊、語音信號處理模塊、聲紋特征提取模塊以及聲紋特征比對模塊。本發(fā)明還公開了上述點歌系統(tǒng)的應(yīng)用方法，包括錄制用戶的語音；對錄到的語音信號進(jìn)行預(yù)處理；提取語音信號中包含的用戶的聲紋特征，建立用戶聲紋模型；將用戶的聲紋模型與數(shù)據(jù)庫中歌曲的聲紋模型進(jìn)行相似性匹配，返回匹配的歌曲列表。本發(fā)明的點歌系統(tǒng)及其應(yīng)用方法，可以提高用戶唱歌的體驗。用戶進(jìn)行點歌時，點歌系統(tǒng)會根據(jù)用戶的聲紋特征，自動檢索出適合該用戶演唱的歌曲，提供給用戶選擇，從而保證了用戶演唱的效果。
文檔編號H04L29/06GK102404278SQ20101027346
公開日2012年4月4日申請日期2010年9月8日優(yōu)先權(quán)日2010年9月8日
發(fā)明者袁斯華申請人:盛樂信息技術(shù)(上海)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：袁斯華
技術(shù)所有人：盛樂信息技術(shù)（上海）有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

聲紋識別相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于聲紋識別的點歌系統(tǒng)及其應(yīng)用方法