亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于聲紋識別的點歌系統(tǒng)及其應(yīng)用方法

文檔序號:7759042閱讀:238來源:國知局
專利名稱:一種基于聲紋識別的點歌系統(tǒng)及其應(yīng)用方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種點歌系統(tǒng),尤其是一種基于聲紋識別技術(shù)的點歌系統(tǒng)。本發(fā)明還涉及一種該點歌系統(tǒng)的應(yīng)用方法。
背景技術(shù)
隨著人們對生活品質(zhì)的追求,人們的業(yè)余生活變得越來越豐富,唱歌是廣受歡迎的一種娛樂方式,人們常常會在家里或歌廳里點唱自己喜歡的或者目前流行的歌曲,但是, 由于每個人在聲帶構(gòu)造、發(fā)聲方式等方面的不同,有些歌曲并不適合點歌者演唱,而目前的點歌系統(tǒng)只能提供普通的歌曲列表,不能根據(jù)用戶的聲音特征選擇適合該用戶演唱的歌曲,如果用戶點唱的歌曲不適合自己,演唱的效果就會比較差,不僅達(dá)不到娛樂的目的,還可能使自己和聽眾感到失望。

發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種基于聲紋識別的點歌系統(tǒng),它可以提高用戶唱歌的體驗。為解決上述技術(shù)問題,本發(fā)明的基于聲紋識別的點歌系統(tǒng),包括歌曲數(shù)據(jù)庫,存儲有歌曲及其對應(yīng)的歌曲聲紋模型,該歌曲聲紋模型通過提取歌曲的聲紋特征而建立;錄音模塊,用于錄制用戶的語音;語音信號處理模塊,與錄音模塊相連接,用于對錄音模塊錄制到的語音信號進(jìn)行預(yù)處理;聲紋特征提取模塊,與語音信號處理模塊相連接,用于分析語音信號,并從語音信號中提取出聲紋特征,建立聲紋模型;聲紋特征比對模塊,與聲紋特征提取模塊相連接,用于將聲紋特征提取模塊建立的用戶聲紋模型與歌曲數(shù)據(jù)庫中歌曲聲紋模型進(jìn)行相似性匹配,返回聲紋模型能夠與用戶聲紋模型相匹配的歌曲的列表。本發(fā)明要解決的另一技術(shù)問題是提供一種上述點歌系統(tǒng)的應(yīng)用方法。為解決上述技術(shù)問題,本發(fā)明點歌系統(tǒng)的應(yīng)用方法,包括下列步驟(1)提示用戶發(fā)出一段語音;(2)將用戶的語音錄制下來;(3)對錄到的語音信號進(jìn)行預(yù)處理;(4)分析步驟(3)中得到的語音信號,提取出該語音信號中包含的用戶的聲紋特征,并建立用戶聲紋模型;(5)將步驟中得到的用戶的聲紋模型與歌曲數(shù)據(jù)庫中歌曲的聲紋模型進(jìn)行相似性匹配,計算兩者的相似度,并根據(jù)相似度數(shù)值的分布范圍,選取適當(dāng)?shù)臄?shù)值作為門限值,以控制檢索出的聲紋模型能與用戶聲紋模型相匹配的歌曲的數(shù)量;
(6)將步驟(5)檢索出的歌曲的列表提供給用戶點唱。本發(fā)明的點歌系統(tǒng)及其應(yīng)用方法,能夠根據(jù)用戶的聲紋特征,檢索出適合該用戶演唱的歌曲,提供給用戶點唱,從而可以提高用戶的演唱效果,使用戶獲得良好的唱歌體驗。


下面結(jié)合附圖與具體實施方式
對本發(fā)明作進(jìn)一步詳細(xì)的說明圖1是本發(fā)明的點歌系統(tǒng)的模塊示意圖;圖2是本發(fā)明的點歌系統(tǒng)的應(yīng)用方法流程圖。
具體實施例方式為對本發(fā)明的技術(shù)內(nèi)容、特點與功效有更具體的了解,現(xiàn)結(jié)合圖示的實施方式,詳述如下聲紋,是用電聲學(xué)儀器顯示的攜帶言語信息的聲波頻譜。由于人的語言產(chǎn)生是人體語言中樞與發(fā)音器官之間一個復(fù)雜的生理物理過程,身體在講話時使用的器官——舌、 牙齒、喉頭、肺、鼻腔,在尺寸和形態(tài)方面每個人的差異很大,因此,任何兩個人的聲紋圖譜都不會完全相同,從而利用聲紋圖譜的特征可以自動識別該聲紋所對應(yīng)的說話人。目前,聲紋識別技術(shù)已是一項非常成熟的技術(shù),被廣泛應(yīng)用于刑事偵查等領(lǐng)域。而隨著聲紋識別技術(shù)的發(fā)展,聲紋識別的準(zhǔn)確性也越來越高,本發(fā)明就是借助于聲紋識別技術(shù),使點歌系統(tǒng)更加智能化,能夠檢索出適合用戶演唱的歌曲,供用戶點唱。本發(fā)明的基于聲紋識別的點歌系統(tǒng),首先要收集歌曲,分析每首歌曲的音頻信號, 利用聲紋識別技術(shù)從音頻信號中提取出該歌曲的聲紋特征(實際是該歌曲演唱者的聲紋特征),建立歌曲的聲紋模型,然后與歌曲一一對應(yīng)存儲在一個歌曲數(shù)據(jù)庫中。此外,如圖1 所示,本發(fā)明的點歌系統(tǒng)還包括有下列模塊錄音模塊1,用于錄制用戶的語音,該錄音模塊1可以是至少一個麥克風(fēng);語音信號處理模塊2,與錄音模塊1相連接,用于對錄音模塊1錄制到的語音信號進(jìn)行預(yù)處理,例如進(jìn)行量化、預(yù)加重、加窗、濾波等處理;聲紋特征提取模塊3,與語音信號處理模塊2相連接,用于分析語音信號,并從語音信號中提取出聲紋特征,建立聲紋模型;聲紋特征比對模塊4,與聲紋特征提取模塊3相連接,用于將聲紋特征提取模塊3 建立的用戶聲紋模型與歌曲數(shù)據(jù)庫中的歌曲聲紋模型進(jìn)行相似性匹配,并返回聲紋模型能夠與用戶聲紋模型相匹配的歌曲的列表。當(dāng)用戶進(jìn)入上述點歌系統(tǒng),準(zhǔn)備進(jìn)行點歌時,該點歌系統(tǒng)按照下列步驟實現(xiàn)其針對用戶選擇歌曲的功能(1)提示用戶發(fā)出一段語音,該語音可以是一段話或者一段歌曲;(2)當(dāng)用戶發(fā)出語音時,錄音模塊1將用戶的語音錄制下來;(3)語音信號處理模塊2對步驟(2)中錄到的語音信號進(jìn)行預(yù)處理,例如,進(jìn)行濾波,去除該聲音信號中的噪聲,或進(jìn)行量化、預(yù)加重、加窗等處理;(4)聲紋特征提取模塊3對經(jīng)過步驟( 處理的語音信號進(jìn)行分析,利用聲紋識別技術(shù)提取出該語音信號中所包含的用戶的聲紋特征,并建立用戶聲紋模型;(5)聲紋特征比對模塊4將步驟(4)中得到的用戶聲紋模型與歌曲數(shù)據(jù)庫中的歌曲聲紋模型進(jìn)行相似性匹配,即計算兩者的相似度,然后根據(jù)相似度數(shù)值的分布范圍,選取適當(dāng)?shù)南嗨贫葦?shù)值作為門限值(調(diào)節(jié)門限值可以控制檢索出的歌曲數(shù)量),檢索出歌曲數(shù)據(jù)庫中與用戶聲紋模型相匹配的歌曲聲紋模型,并返回這些歌曲聲紋模型所對應(yīng)的歌曲的列表;(6)將搜索到的歌曲列表提供給用戶點唱。上述步驟(5)中的相似性匹配,可以采用矢量化模型、隨機(jī)模型或者神經(jīng)網(wǎng)絡(luò)模型。隱馬爾可夫模型(Hidden Markov Model, HMM)是一種基于轉(zhuǎn)移概率和傳輸概率的隨機(jī)模型,它把聲音看成由可觀察到的符號序列(即發(fā)聲系統(tǒng)狀態(tài)序列的輸出)組成的隨機(jī)過程,由于不需要時間規(guī)整,能夠節(jié)約判斷識別的計算時間和存儲量,因此已被廣泛用于語音識別領(lǐng)域。本發(fā)明的較佳實施例也選擇了隱馬爾可夫模型來進(jìn)行相似性匹配的計算,并通過調(diào)整最大概率(即門限值)控制檢索出的聲紋模型與用戶的聲紋模型相似的歌曲的數(shù)目,即當(dāng)檢索出的歌曲數(shù)目過多時,調(diào)高最大概率值,提高相似性要求,使檢索出的歌曲更適合用戶演唱;反之,當(dāng)檢索出的歌曲數(shù)目很少時,調(diào)低最大概率值,以降低相似性要求,檢索出更多的歌曲供用戶選擇。使用本發(fā)明的點歌系統(tǒng)后,用戶就可以選擇適合自己聲音條件的歌曲進(jìn)行演唱, 不會再盲目點唱流行或者自己喜歡但并不適合自己演唱的歌曲了,如此,不僅能夠提高用戶演唱的效果,達(dá)到娛樂的目的,而且還能使演唱者得到聽眾的認(rèn)同,使用戶獲得良好的唱歌體驗。
權(quán)利要求
1.一種基于聲紋識別的點歌系統(tǒng),其特征在于,包括歌曲數(shù)據(jù)庫,存儲有歌曲及其對應(yīng)的歌曲聲紋模型,該歌曲聲紋模型通過提取歌曲的聲紋特征而建立;錄音模塊,用于錄制用戶的語音;語音信號處理模塊,與錄音模塊相連接,用于對錄音模塊錄制到的語音信號進(jìn)行預(yù)處理;聲紋特征提取模塊,與語音信號處理模塊相連接,用于分析語音信號,并從語音信號中提取出聲紋特征,建立聲紋模型;聲紋特征比對模塊,與聲紋特征提取模塊相連接,用于將聲紋特征提取模塊建立的用戶聲紋模型與歌曲數(shù)據(jù)庫中歌曲聲紋模型進(jìn)行相似性匹配,返回聲紋模型能夠與用戶聲紋模型相匹配的歌曲的列表。
2.如權(quán)利要求1所述的點歌系統(tǒng),其特征在于所述錄音模塊為至少一個麥克風(fēng)。
3.—種權(quán)利要求1所述的點歌系統(tǒng)的應(yīng)用方法,其特征在于,包括下列步驟(1)提示用戶發(fā)出一段語音;(2)將用戶的語音錄制下來;(3)對錄到的語音信號進(jìn)行預(yù)處理;(4)分析步驟(3)中得到的語音信號,提取出該語音信號中包含的用戶的聲紋特征,并建立用戶聲紋模型;(5)將步驟中得到的用戶的聲紋模型與歌曲數(shù)據(jù)庫中歌曲的聲紋模型進(jìn)行相似性匹配,計算兩者的相似度,并根據(jù)相似度數(shù)值的分布范圍,選取適當(dāng)?shù)臄?shù)值作為門限值,以控制檢索出的聲紋模型能與用戶的聲紋模型相匹配的歌曲的數(shù)量;(6)將步驟(5)檢索出的歌曲的列表提供給用戶點唱。
4.如權(quán)利要求3所述的點歌系統(tǒng)的應(yīng)用方法,其特征在于所述步驟(3)中,對語音信號的預(yù)處理包括濾波,去除語音信號中的噪聲。
5.如權(quán)利要求3所述的點歌方法,其特征在于所述步驟(5)中,采用矢量化模型、隨機(jī)模型或者神經(jīng)網(wǎng)絡(luò)模型進(jìn)行相似性匹配計算。
6.如權(quán)利要求5所述的點歌方法,其特征在于所述隨機(jī)模型為隱馬爾可夫模型。
全文摘要
本發(fā)明公開了一種基于聲紋識別的點歌系統(tǒng),包括歌曲數(shù)據(jù)庫、錄音模塊、語音信號處理模塊、聲紋特征提取模塊以及聲紋特征比對模塊。本發(fā)明還公開了上述點歌系統(tǒng)的應(yīng)用方法,包括錄制用戶的語音;對錄到的語音信號進(jìn)行預(yù)處理;提取語音信號中包含的用戶的聲紋特征,建立用戶聲紋模型;將用戶的聲紋模型與數(shù)據(jù)庫中歌曲的聲紋模型進(jìn)行相似性匹配,返回匹配的歌曲列表。本發(fā)明的點歌系統(tǒng)及其應(yīng)用方法,可以提高用戶唱歌的體驗。用戶進(jìn)行點歌時,點歌系統(tǒng)會根據(jù)用戶的聲紋特征,自動檢索出適合該用戶演唱的歌曲,提供給用戶選擇,從而保證了用戶演唱的效果。
文檔編號H04L29/06GK102404278SQ20101027346
公開日2012年4月4日 申請日期2010年9月8日 優(yōu)先權(quán)日2010年9月8日
發(fā)明者袁斯華 申請人:盛樂信息技術(shù)(上海)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1