專利名稱:評(píng)估演唱者的嗓音性能的方法和使用該方法的設(shè)備的制作方法
技術(shù)領(lǐng)域:
本總發(fā)明構(gòu)思涉及用于評(píng)估演唱者的嗓音性能的方法和執(zhí)行該方法的卡拉OK設(shè)備,并更具體地,涉及用于通過比較演唱者的總聲音能量和對(duì)應(yīng)于參考音高的能量來評(píng)估演唱者的嗓音性能的方法、以及執(zhí)行該方法的卡拉OK設(shè)備。
背景技術(shù):
已開發(fā)了用于評(píng)估演唱者的嗓音性能的各種卡拉OK設(shè)備。傳統(tǒng)卡拉OK設(shè)備中使用的方法是根據(jù)演唱者是否在特定時(shí)間處釋放適當(dāng)級(jí)別的聲音能量來鑒定(rate)演唱者的技能。該方法的有利之處在于,其可簡單實(shí)現(xiàn),但是具有不考慮音高(Pitch)的精度的問題。 為了解決以上問題,已使用了使用伴奏旋律的方法。使用伴奏旋律的方法根據(jù)演唱者的音高是否與伴奏旋律協(xié)調(diào)來鑒定演唱者的技能。然而,該方法需要大量計(jì)算,并具有不能精確提取八度音階(octave)錯(cuò)誤的問題。而且,該伴奏旋律可能不總是被看作與演唱者的旋律協(xié)調(diào)。 因此,存在對(duì)于更精確地評(píng)估演唱者的嗓音性能并也需要更少計(jì)算的方法的需求。
發(fā)明內(nèi)容
本總發(fā)明構(gòu)思的示例實(shí)施例提供了更精確地評(píng)估演唱者的嗓音性能的方法和執(zhí)行該方法的卡拉OK設(shè)備。 本總發(fā)明構(gòu)思的附加特征和用途將部分在接下來的描述中闡明,并部分將根據(jù)該描述而清楚,或可通過本總發(fā)明構(gòu)思的實(shí)踐而得知。 本總發(fā)明構(gòu)思的前述和/或其他特征和用途可通過提供一種用于使用卡拉OK設(shè)備評(píng)估演唱者的嗓音性能的方法來實(shí)現(xiàn),該方法包括提取演唱者的聲音能量,使用樂器數(shù)字接口 (MIDI)數(shù)據(jù)來提取參考音高,并比較該聲音能量和該參考音高的能量以及評(píng)估演唱者的嗓音性能。 所述提取參考音高的步驟可包括使用該MIDI數(shù)據(jù)中包括的音符(note)的頻率來提取參考音高。 所述提取參考音高的步驟可包括使用Goertzel算法來提取參考音高的能量。
可使用以下等式來提取參考音高的能量
PB = 2cos (2 3i f) s卜丄s卜2+Si—a—i+s卜2Si—2 其中Si = Xi+2C0S (2 f) Si—rSi—2, PB表示參考音高的能量,f表示音符的頻率,而Xi表示輸入樣本。 所述提取聲音能量的步驟可包括將演唱者的聲音變換為數(shù)字信號(hào),將該數(shù)字信號(hào)劃分為多個(gè)幀,并提取每一幀的聲音能量。
可使用以下等式來提取聲音能量 A=JX2 其中PA表示聲音能量,&表示輸入樣本,而N表示幀的尺寸。 本總發(fā)明構(gòu)思的前述和/或其他特征和用途還可通過提供一種卡拉OK設(shè)備來實(shí)現(xiàn),該卡拉OK設(shè)備包括聲音能量提取單元,用于提取演唱者的聲音能量;參考音高提取單元,用于使用MIDI數(shù)據(jù)來提取參考音高;和控制單元,用于使用該聲音能量和該參考音高的能量,來評(píng)估演唱者的嗓音性能。 該參考音高能量提取單元可使用該MIDI數(shù)據(jù)中包括的音符的頻率來提取參考音高。 該參考音高能量提取單元可通過應(yīng)用取決于參考音高構(gòu)成的Goertzel算法來使用以下等式 PB = 2cos (2 Ji f) s卜a—2+Si—a—'Si—2Si—2 其中Si = Xi+2C0S (2 f) Si—「Si—2, PB表示參考音高的能量,f表示音符的頻率,而Xi表示輸入樣本。 該卡拉OK設(shè)備還可包括變換單元,用于將演唱者的聲音變換為數(shù)字信號(hào),并且該
聲音能量提取單元可將該數(shù)字信號(hào)劃分為多個(gè)幀并提取每一幀的聲音能量。 該聲音能量提取單元可使用以下等式來提取聲音能量 尸,S《2 其中PA表示聲音能量,&表示輸入樣本,而N表示幀的尺寸。 本總發(fā)明構(gòu)思的前述和/或其他特征和用途還可通過提供一種記錄介質(zhì)來實(shí)現(xiàn),
該記錄介質(zhì)上記錄有程序,用于促使計(jì)算機(jī)執(zhí)行用于使用卡拉OK設(shè)備評(píng)估演唱者的嗓音
性能的方法,該方法包括提取演唱者的聲音能量,使用樂器數(shù)字接口 (MIDI)數(shù)據(jù)來提取
參考音高,并比較該聲音能量和該參考音高的能量以及評(píng)估演唱者的嗓音性能。 本總發(fā)明構(gòu)思的前述和/或其他特征和用途還可通過提供一種用于評(píng)估嗓音性
能的方法來實(shí)現(xiàn),該方法包括確定輸入到評(píng)估裝置的聲音的聲音能量,從記錄的信號(hào)確定
參考音高能量,并比較該聲音能量和參考音高能量以評(píng)估該嗓音性能。 可根據(jù)記錄的信號(hào)中的一個(gè)或多個(gè)音符的頻率,來估計(jì)該參考音高能量。 可在嗓音性能期間顯示該嗓音性能的評(píng)估結(jié)果。 本總發(fā)明構(gòu)思的前述和/或其他特征和用途還可通過提供一種用于評(píng)估嗓音性能的方法來實(shí)現(xiàn),該方法包括比較聲音的聲音能量和記錄的信號(hào)的參考音高能量,并根據(jù)該聲音能量和該參考音高能量之間的差別來確定該嗓音性能的精度。
可在嗓音性能期間比較該聲音能量和該參考音高能量。
可在嗓音性能期間顯示所確定的精度的結(jié)果。 本總發(fā)明構(gòu)思的前述和/或其他特征和用途還可通過提供一種用于評(píng)估嗓音性能的方法來實(shí)現(xiàn),該方法包括確定記錄的音符以及該記錄的音符之上和/或之下一個(gè)或多個(gè)八度音階的參考音高能量,并比較聲音和該參考音高能量,以確定該嗓音性能的精度。
通過結(jié)合附圖對(duì)于實(shí)施例的以下描述,本總發(fā)明構(gòu)思的這些和/或其他特征和優(yōu)點(diǎn)將變得清楚并更易于理解,其中 圖1是圖示了根據(jù)本總發(fā)明構(gòu)思的示范實(shí)施例的卡拉OK設(shè)備的框圖; 圖2是圖示了根據(jù)Goertzel算法的Goertzel濾波器的譜的圖; 圖3是圖示了根據(jù)本總發(fā)明構(gòu)思的示范實(shí)施例的評(píng)估演唱者的嗓音性能的方法
的流程圖; 圖4是圖示了根據(jù)本總發(fā)明構(gòu)思的另一示范實(shí)施例的卡拉OK設(shè)備的框圖;禾口
圖5是圖示了根據(jù)本總發(fā)明構(gòu)思的另一示范實(shí)施例的評(píng)估演唱者的嗓音性能的方法的流程圖。
具體實(shí)施例方式
現(xiàn)在將詳細(xì)參考在附圖中圖示了其示例的本總發(fā)明構(gòu)思的各種示范實(shí)施例,其中相同的附圖標(biāo)記始終表示相同的元件。下面描述這些實(shí)施例,以便通過參考圖來解釋本總發(fā)明構(gòu)思。 圖1是圖示了根據(jù)本總發(fā)明構(gòu)思的示范實(shí)施例的卡拉OK設(shè)備的框圖。根據(jù)本總發(fā)明構(gòu)思的示范實(shí)施例的卡拉OK設(shè)備通過比較聲音能量和對(duì)應(yīng)于參考音高的能量,來評(píng)估演唱者的嗓音性能。 如圖1中所示,根據(jù)本總發(fā)明構(gòu)思的示范實(shí)施例的卡拉OK設(shè)備IOO可包括聲音輸入單元110、變換單元120、能量提取單元130、比較單元140、控制單元150、文件裝載器單元160、和樂器數(shù)字接口 (MIDI)數(shù)據(jù)提取單元170。 聲音輸入單元110可例如通過麥克風(fēng)從外部源接收來自演唱者的聲音信號(hào)。該聲音輸入單元110可向變換單元120傳送輸入的聲音信號(hào)。 變換單元120可將聲音信號(hào)變換為數(shù)字信號(hào)。變換單元120可向能量提取單元130傳送該數(shù)字信號(hào)。 能量提取單元130可包括聲音能量提取器131和參考音高能量提取器135。聲音能量提取器131可提取演唱者的聲音的能量,而該參考音高能量提取器135可提取與參考音高對(duì)應(yīng)的能量,來評(píng)估演唱者的嗓音性能。 聲音能量提取器131可使用以下等式以幀為單位來提取演唱者的聲音能量
[等式1] ^-2]X,2 其中PA表示聲音能量,&表示輸入樣本,而N表示幀的尺寸。 其間,該參考音高能量提取器135可從MIDI文件生成用于評(píng)估演唱者的嗓音性能的參考音高,并可使用Goertzel算法來提取參考音高的能量。
Goertzel算法如下
PB = 2cos (2 3i f) s卜丄s卜2+s卜丄s卜i+s卜2Si—2 其中Si = Xi+2C0S (2 Ji f) Si—rSi—2, PB表示參考音高能量,f表示音符的頻率,而Xi 表示輸入樣本。 使用以上Goertzel算法,該參考音高能量提取器135可評(píng)估具有與頻率(f)對(duì)應(yīng)
的音高的能量??墒褂贸?Goertzel算法之外的不同方法,來評(píng)估具有特定音高的能量。
然而,Goertzel算法的優(yōu)點(diǎn)在于,其需要較少的計(jì)算來評(píng)估特定音高的能量。 可將參考頻率設(shè)置為等于當(dāng)前音符的頻率(f),并且小箱(bin)的頻率寬度取決
于輸入樣本(Xi)的數(shù)目。由于小箱的頻率寬度隨著音高增加而成幾何級(jí)數(shù)增加,所以當(dāng)輸
入樣本的數(shù)目增加時(shí),頻率寬度變窄。 將參考圖2來描述Goertze 1算法中的小箱之間的相關(guān)性。圖2圖示了根據(jù) Goertzle算法的Goertzel濾波器的譜,其中N表示當(dāng)前音符的數(shù)目。 如圖2中所示,存在3個(gè)小箱,其中N-12和N+12表示每一個(gè)八度音階存在12個(gè) 音符和12個(gè)半音符。WN、WN—『W,w表示小箱的寬度。 參考圖2,在前一八度音階和下一八度音階之間存在2倍的差別。這是因?yàn)橐舴?高,則頻率范圍越寬,并且頻率范圍呈幾何級(jí)數(shù)增加。因此,下一八度音階的寬度是前一八 度音階的寬度的兩倍。 給予這些小箱的權(quán)重值可以不是圖2中圖示的A,、A,—12、和AN+12的值。本總發(fā)明構(gòu) 思中的一個(gè)重要考慮因素是第一諧波的值。因此,第一諧波的小箱可理想地具有最大權(quán)重 值。另一小箱的權(quán)重值將因此隨著諧波數(shù)目的增加而減小。與應(yīng)用相同權(quán)重值的方法相比, 該方法可導(dǎo)致演唱者的嗓音性能的更精確的評(píng)估。 在圖2中,為了便于解釋,僅圖示了 3個(gè)描述的八度音階,但是八度音階的數(shù)目不 限于此。本總發(fā)明構(gòu)思也可應(yīng)用到其中呈現(xiàn)不同數(shù)量八度音階的情況。
Goertzel濾波器可覆蓋與當(dāng)前音符的八度音階相鄰的各八度音階,因?yàn)橹辽僖韵?原因 首先,演唱者可演唱比當(dāng)前音符高或低幾個(gè)八度音階的音符。這樣的演唱方法是 典型的,并涉及演唱者偏好的類型。所以,向按照這種方式演唱的演唱者給予處罰也許是不 合理的。 第二,當(dāng)演唱歌曲時(shí),演唱者可改變復(fù)頻率以及音符頻率的諧波分量。Goertzel濾 波器對(duì)于估計(jì)諧波分量是有用的。 返回參考圖1,比較單元140可比較聲音能量提取器131所提取的聲音能量和參考 音高能量提取器135所提取的參考音高能量,以計(jì)算其間的差別。實(shí)際上,該音符的部分可 大于一幀。因此,比較單元140比較從該音符中包括的所有幀中提取的聲音能量和參考音 高能量。 比較結(jié)果可存儲(chǔ)到內(nèi)部緩沖器(其可以是公知類型緩沖器,并因此沒有示出)中。 可這樣存儲(chǔ)比較結(jié)果,以提供關(guān)于演唱者的嗓音性能的臨時(shí)結(jié)果。S卩,演唱者可在演唱歌曲 時(shí)知道評(píng)估他/她的嗓音性能的臨時(shí)結(jié)果。 而且,在內(nèi)部緩沖器(未示出)中存儲(chǔ)的比較結(jié)果可用于計(jì)算最后得分。 文件裝載器單元160可從例如致密盤或半導(dǎo)體存儲(chǔ)器的各種源中的任何一個(gè)讀
出歌曲文件。文件裝載器單元160可將歌曲文件劃分為MIDI數(shù)據(jù)和伴奏數(shù)據(jù),并可將MIDI數(shù)據(jù)傳送到MIDI數(shù)據(jù)提取單元170。 文件裝載器單元160可將伴奏數(shù)據(jù)傳送到再現(xiàn)部件(其可以是公知類型再現(xiàn)部 件,并因此沒有示出),以再現(xiàn)有關(guān)該歌曲的伴奏。 MIDI數(shù)據(jù)提取單元170可在演唱者開始演唱歌曲的同時(shí)提取MIDI數(shù)據(jù)。MIDI數(shù)
據(jù)提取單元170可提取例如音符編號(hào)、音符開始時(shí)間、音符持續(xù)時(shí)間等的歌曲信息。 MIDI數(shù)據(jù)提取單元170可獲得當(dāng)前音符處的有關(guān)歌曲的歌詞的信息。有關(guān)歌曲的
歌詞的信息可包括有關(guān)歌詞中包括的一個(gè)或多個(gè)單詞中的元音的位置的信息。因?yàn)橐舾咭?br>
般出現(xiàn)在元音處而不發(fā)生在輔音處,所以分析其中演唱元音的時(shí)間來評(píng)估演唱者的嗓音性
能是有益的。 控制單元150控制卡拉OK設(shè)備100的操作。更具體地,控制單元150可控制歌曲 的開始點(diǎn),同步MIDI、歌詞和音頻流,并控制卡拉OK設(shè)備100的其他操作,諸如顯示歌曲的 歌詞、演唱者的得分等。 因此,可比傳統(tǒng)方法和裝置更精確地評(píng)估演唱者的嗓音性能。 圖3是圖示了根據(jù)本總發(fā)明構(gòu)思的示范實(shí)施例的評(píng)估演唱者的嗓音性能的方法 的流程圖。 變換單元120可在操作S310中將通過聲音輸入單元110輸入的聲音信號(hào)變換為 數(shù)字信號(hào)。 聲音能量提取器131可在操作S320中將數(shù)字信號(hào)劃分為多個(gè)幀,并在操作S330 中提取這些幀中的每一幀的聲音能量。 參考音高能量提取器135可在操作S340中從MIDI數(shù)據(jù)中提取當(dāng)前音符的頻率, 并可在操作S350中使用Goertzel算法來提取參考音高能量。 比較單元140可在操作S360中比較聲音能量和參考音高能量,并且控制單元150 可在操作S370中根據(jù)比較結(jié)果計(jì)算得分。 因此,可比傳統(tǒng)方法和裝置更精確地評(píng)估演唱者的嗓音性能。 圖4是圖示了根據(jù)本總發(fā)明構(gòu)思的另一示范實(shí)施例的卡拉OK設(shè)備的框圖。根據(jù)
該實(shí)施例的卡拉OK設(shè)備可包括聲音能量提取器410、參考音高能量提取器430、和控制單元
450。 聲音能量提取器410可提取演唱者的聲音能量,而參考音高能量提取器430可使 用MIDI數(shù)據(jù)提取參考音高,并從整個(gè)聲音信號(hào)中提取與該音高對(duì)應(yīng)的能量。
控制單元450可使用聲音能量和參考音高能量來評(píng)估演唱者的嗓音性能。
圖5是圖示了根據(jù)本總發(fā)明構(gòu)思的另一示范實(shí)施例的評(píng)估演唱者的嗓音性能的 方法的流程圖。為了評(píng)估演唱者的嗓音性能,在操作S510中提取演唱者的聲音能量。
在操作S520中,可使用MIDI數(shù)據(jù)提取參考音高。 在操作S530中,可通過比較聲音能量和參考音高,來評(píng)估演唱者的嗓音性能。
因此,可比傳統(tǒng)方法和設(shè)備更精確地、并使用比傳統(tǒng)方法和設(shè)備中需要的計(jì)算量 更少的計(jì)算量,來評(píng)估演唱者的嗓音性能。 本總發(fā)明構(gòu)思也可實(shí)施為計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)可讀代碼。計(jì)算機(jī)可讀介質(zhì) 可包括計(jì)算機(jī)可讀記錄介質(zhì)和計(jì)算機(jī)可讀傳輸介質(zhì)。計(jì)算機(jī)可讀記錄介質(zhì)是可存儲(chǔ)作為計(jì) 算機(jī)系統(tǒng)可在其后讀取的程序的數(shù)據(jù)的任何數(shù)據(jù)儲(chǔ)存裝置。計(jì)算機(jī)可讀記錄介質(zhì)的示例包括只讀存儲(chǔ)器(R0M)、隨機(jī)存取存儲(chǔ)器(RAM) 、 CD-ROM、 DVD、磁帶、軟盤、和光學(xué)數(shù)據(jù)儲(chǔ)存裝 置。計(jì)算機(jī)可讀記錄介質(zhì)也可在與網(wǎng)絡(luò)耦接的計(jì)算機(jī)系統(tǒng)上分發(fā),使得可按照分布方式存 儲(chǔ)和運(yùn)行計(jì)算機(jī)可讀代碼。計(jì)算機(jī)可讀傳輸介質(zhì)可通過載波或信號(hào)傳送(例如,通過因特 網(wǎng)的有線或無線數(shù)據(jù)傳輸)。而且,用于實(shí)現(xiàn)本總發(fā)明構(gòu)思的功能程序、代碼和代碼段可由 本總發(fā)明構(gòu)思所屬技術(shù)領(lǐng)域的程序員容易地進(jìn)行解釋。 盡管已圖示和描述了本總發(fā)明構(gòu)思的各種示例實(shí)施例,但是本領(lǐng)域技術(shù)人員將理 解的是,可對(duì)這些示例實(shí)施例進(jìn)行改變,而不脫離在所附權(quán)利要求及其等效中限定其范圍 的本總發(fā)明構(gòu)思的原理和精神。
權(quán)利要求
一種用于評(píng)估卡拉OK設(shè)備的演唱者的嗓音性能的方法,該方法包括以下步驟提取演唱者的聲音能量;使用樂器數(shù)字接口(MIDI)數(shù)據(jù)來提取參考音高;和比較該聲音能量和該參考音高的能量,并評(píng)估演唱者的嗓音性能。
2. 根據(jù)權(quán)利要求l的方法,其中所述提取參考音高的步驟包括使用該MIDI數(shù)據(jù)中包括 的音符的頻率來提取參考音高。
3. 根據(jù)權(quán)利要求2的方法,其中所述提取參考音高的步驟包括使用Goertzel算法來提 取參考音高的能量。
4. 根據(jù)權(quán)利要求3的方法,其中使用以下等式來提取參考音高的能量<formula>formula see original document page 2</formula>其中<formula>formula see original document page 2</formula> PB表示參考音高的能量,f表示音符的頻率,而Xi表 示輸入樣本。
5. 根據(jù)權(quán)利要求1到4中的任一個(gè)的方法,其中所述提取聲音能量的步驟包括 將演唱者的聲音變換為數(shù)字信號(hào);將該數(shù)字信號(hào)劃分為多個(gè)幀;禾口 提取每一幀的聲音能量。
6. 根據(jù)權(quán)利要求1到5中的任一個(gè)的方法,其中使用以下等式來提取聲音能量<formula>formula see original document page 2</formula>其中PA表示聲音能量,Xi表示輸入樣本,而n表示幀的尺寸。
7. —種卡拉OK設(shè)備,包括聲音能量提取單元,用于提取演唱者的聲音能量; 參考音高能量提取單元,用于使用MIDI數(shù)據(jù)提取參考音高;禾口 控制單元,用于使用該聲音能量和該參考音高的能量來評(píng)估演唱者的嗓音性能。
8. 根據(jù)權(quán)利要求7的卡拉OK設(shè)備,其中該參考音高能量提取單元使用該MIDI數(shù)據(jù)中 包括的音符的頻率來提取參考音高。
9. 根據(jù)權(quán)利要求8的卡拉OK設(shè)備,其中該參考音高能量提取單元使用Goertzel算法 來提取參考音高的能量。
10. 根據(jù)權(quán)利要求9的卡拉OK設(shè)備,其中使用以下等式來提取參考音高的能量 <formula>formula see original document page 2</formula>其中<formula>formula see original document page 2</formula> PB表示參考音高的能量,f表示音符的頻率,而Xi表 示輸入樣本。
11. 根據(jù)權(quán)利要求7到10中的任一個(gè)的卡拉OK設(shè)備,還包括變換單元,用于將演唱者 的聲音變換為數(shù)字信號(hào),其中該聲音能量提取單元將該數(shù)字信號(hào)劃分為多個(gè)幀,并提取每一幀的聲音能量。
12. 根據(jù)權(quán)利要求7到11中的任一個(gè)的卡拉OK設(shè)備,其中該聲音能量提取單元使用以 下等式來提取聲音能量<formula>formula see original document page 2</formula>其中PA表示聲音能量,&表示輸入樣本,而N表示幀的尺寸。
全文摘要
一種用于評(píng)估卡拉OK設(shè)備的演唱者的嗓音性能的方法,包括提取聲音能量,提取參考音高,以及比較該聲音能量和與該參考音高對(duì)應(yīng)的能量,并評(píng)估演唱者的嗓音性能。
文檔編號(hào)G10L25/93GK101740025SQ20091016736
公開日2010年6月16日 申請(qǐng)日期2009年8月21日 優(yōu)先權(quán)日2008年11月21日
發(fā)明者崔哲珉, 德米特里·戈洛夫金 申請(qǐng)人:三星電子株式會(huì)社