一種用于混合語音情感識別的語音特征篩選方法

文檔序號：8513351閱讀：431來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種用于混合語音情感識別的語音特征篩選方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及模式識別領(lǐng)域，具體涉及語音情感識別方法和特征選擇方法。
【背景技術(shù)】
[0002] 校園霸凌是一種常見的社會(huì)現(xiàn)象，多發(fā)生在中小學(xué)生群體中。校園霸凌有多種表現(xiàn)形式，如：身體暴力、言語欺凌、損壞財(cái)物、孤立等，其中言語欺凌最為頻發(fā)。言語欺凌中通常包含辱罵、悲傷等負(fù)面情感，因此可以用語音情感識別的方法檢測言語欺凌。
[0003] 目前語音情感識別領(lǐng)域的研宄大多基于單一對象的單一情感，而校園霸凌的語境通常由多人語音構(gòu)成，包含欺凌者和受害人的不同情感，因此適用于單一情感識別的分類算法和聲學(xué)特征并不適用于混合情感識別。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明是為了實(shí)現(xiàn)混合語音情感識別的語音特征篩選，從而提供一種用于混合語音情感識別的語音特征篩選方法。
[0005] 一種用于混合語音情感識別的語音特征篩選方法，它由以下步驟實(shí)現(xiàn)：
[0006] 步驟一、將混合語音數(shù)據(jù)按類別平均劃分為訓(xùn)練集和測試集，并分別提取各個(gè)語音樣本的聲學(xué)特征參數(shù)，記為M i，并放入備選特征集合s = IMJ，已選特征集合D為空集；i =1,2,…，N ;N為正整數(shù)；
[0007] 每次選取一個(gè)Mi作為分類算法的輸入，則計(jì)算其識別率R(M D，重復(fù)此過程N(yùn)次，分別得到N個(gè)聲學(xué)特征參數(shù)的識別率R(Mi);
[0008] 步驟二、在備選特征集合S中找出單一識別率最高的聲學(xué)特征參數(shù)MiJfM i從備選特征集合S移到已選特征集合D中；
[0009] 步驟三、用備選特征集合S中剩下的元素依次與已選特征集合D中元素配合，作為分類算法的輸入，計(jì)算其識別率，在備選特征集合S中找出使R(D+Mi)最大的M i;
[0010] 判斷是否有R(D+Mi)彡R(D)，如果判斷結(jié)果為是，則將聲學(xué)特征參數(shù)吣從備選特征集合S移至已選特征集合D中，并執(zhí)行步驟四；如果判斷結(jié)果為否，則執(zhí)行步驟五；
[0011] 步驟四、用備選特征集合S中剩下的元素重復(fù)執(zhí)行步驟三，直到 MaX(R(D+Mi))〈R(D)，MiE S，已選特征集合D中元素不再增加，此時(shí)已選特征集合為D = {Μ」} ;，j = 1，2,…，p ;p為正整數(shù)；執(zhí)行步驟七；
[0012] 步驟五、對已選特征集合D中的每個(gè)元素 Mj,計(jì)算R(D-Mj),找出使R(D-Mj)最大的M j;
[0013] 判斷是否有R (D - Mj)彡R(D)，如果判斷結(jié)果為是，則從已選特征集合D中去掉％，并執(zhí)行步驟六；如果判斷結(jié)果為否，則執(zhí)行步驟七；
[0014] 步驟六、用已選特征集合D中剩下的元素重復(fù)執(zhí)行步驟五，直到1^以1?(0-Mj)) <R (D)，Mj e D，已選特征集合D中元素不再減少，此時(shí)已選特征集合為D = {M』};
[0015] 步驟七、返回執(zhí)行步驟三，直至已選特征集合D中不再有元素增加或減少，將最終的已選特征集合D作為最佳特征組合，完成混合語音情感識別的語音特征篩選。
[0016] 本發(fā)明給出一種混合語音情感識別中的聲學(xué)特征篩選方法，本發(fā)明能夠從一系列聲學(xué)特征中找出一組最佳特征集合，使得分類方法的平均識別率達(dá)到最高。實(shí)現(xiàn)混合語音情感識別的高精度語音特征篩選。
【附圖說明】
[0017] 圖1是【具體實(shí)施方式】一的特征篩選過程中平均識別率的變化仿真示意圖；
【具體實(shí)施方式】
【具體實(shí)施方式】 [0018] 一、基于混合語音情感識別的聲學(xué)特征篩選方法，由以下步驟組成：
[0019] 步驟一、將混合語音數(shù)據(jù)按類別平均劃分為訓(xùn)練集和測試集，并分別提取各個(gè)語音樣本的聲學(xué)特征參數(shù)，記為Mi，i = 1，2,…，N，放入備選特征集合S = {Mi，i = 1，2,…，N}，而已選特征集合D為空集。每次選取一個(gè)Mi作為分類算法的輸入，計(jì)算其識別率R(M J，重復(fù)此過程N(yùn)次，分別得到N個(gè)聲學(xué)特征參數(shù)的識別率R(Mi)，i = 1，2,…，N ;
[0020] 步驟二、在S中找出單一識別率最高的聲學(xué)特征參數(shù)Mi,將％從備選特征集合S移到已選特征集合D中；
[0021] 步驟三、用S中剩下的元素依次與D中元素配合，作為分類算法的輸入，計(jì)算其識別率，在S中找出使R(D+Mi)最大的吣。若R(D+Mi)彡R(D)，則將M iWS移至D中，并繼續(xù) 步驟四，否則進(jìn)入步驟五；
[0022] 步驟四、用S中剩下的元素重復(fù)步驟③，直到Max(R(D+Mi))〈R(D)，MiE S，D中元素不再增加，此時(shí)已選特征集合為D= {M」，j = 1，2，···，ρ};
[0023] 步驟五、對D中的每個(gè)元素 Mj, j = 1，2, "·，ρ，計(jì)算R(D-Mj),找出使R(D-Mj)最大的Μ」。若有R(D - Mj)彡R(D)，則從D中去掉Mj (并且不會(huì)放回S中），并繼續(xù)步驟六，否則進(jìn)入步驟七；
[0024] 步驟六、用D中剩下的元素重復(fù)步驟⑤，直到Max (R(D-Mj) )〈R (D)，MjE D，D中元素不再減少，此時(shí)已選特征集合為D= {M」，j = 1，2, ···，(!};
[0025] 步驟七、重復(fù)步驟③至⑥，直到D中不再有元素增加或減少。至此得到最佳特征組合 D = {Μ』，j = 1，2, ...，n} 〇
[0026] 下面以GMM(Gaussian Mixture Model，高斯混合模型）分類算法作用于混合語音的 24 個(gè) MFCC(Mel Frequency Cepstral Coefficients，Mel 頻率倒譜系數(shù)）特征為例，說明上述特征篩選算法的有效性。言語欺凌實(shí)驗(yàn)由不同年齡的8個(gè)女生和7個(gè)男生表演，采集混合情感語音數(shù)據(jù)共80段，涉及語境包括：日常會(huì)話2類，分別以"快樂"和"中性"為主，混以其它情感；言語欺凌2類，分別以"辱罵"和"悲傷"為主，混以其它情感。圖1給出特征篩選過程中平均識別率的變化。
[0027] 圖1中，第1至4步是特征增加過程，平均識別率隨特征數(shù)目的增加而升高，第4 步的識別率與第3步相同，說明第4步中新增的特征可有可無，但在第4步中該特征與已有特征的配合最好，故暫留在已選特征集中，進(jìn)入下一輪篩選。第5步新增特征后，識別率開始下降，新增特征已是剩余備選特征中與已選特征配合最好的，故剩余特征已無可選，特征增加過程結(jié)束。第6步刪除第5步新增特征，恢復(fù)到第4步狀態(tài)，從第7步開始已選特征集進(jìn)入刪減過程，刪除已選集中配合最差的特征，識別率不變。第8步繼續(xù)刪除配合最差特征后，識別率下降，說明已選特征集中剩下的每個(gè)特征對分類都有貢獻(xiàn)，不應(yīng)刪除，特征刪減過程結(jié)束。第9步重新將第8步所刪特征加入，恢復(fù)到第7步狀態(tài)。第10步再次進(jìn)入特征增加過程，在剩余備選特征（不含已刪除特征）中選擇與已選特征配合最好的特征，但識別率下降，說明剩余備選特征中已無可用，增加過程結(jié)束。第11步將第10步新增特征刪除，之前的一輪刪減和增加過程中已選特征集沒有變化，至此特征篩選過程結(jié)束，平均識別率達(dá)到最高82. 5%。具體識別結(jié)果如表1。
[0028]表 1
【主權(quán)項(xiàng)】
1. 一種用于混合語音情感識別的語音特征篩選方法，其特征是：它由以下步驟實(shí)現(xiàn)：步驟一、將采集的混合語音樣本數(shù)據(jù)按類別平均劃分為訓(xùn)練集和測試集，并分別提取各個(gè)語音樣本數(shù)據(jù)的聲學(xué)特征參數(shù)，記為Mi,并放入備選特征集合S = {MJ，初始化已選特征集合D為空集；i = 1，2,. . .，N ;N為正整數(shù)；每次選取一個(gè)Mi,并計(jì)算其識別率R (Mi)，重復(fù)此過程N(yùn)次，分別得到N個(gè)聲學(xué)特征參數(shù) 的識別率R(Mi); 步驟二、在備選特征集合S中找出單一識別率最高的聲學(xué)特征參數(shù)Mi,將％從備選特征集合S移到已選特征集合D中；步驟三、用備選特征集合S中剩下的元素依次與已選特征集合D中元素配合，并分別計(jì) 算其識別率，在備選特征集合S中找出使R(D+Mi)最大的語音樣本的聲學(xué)特征參數(shù)Mi; 判斷是否有R(D+Mi)彡R(D)，如果判斷結(jié)果為是，則將該語音樣本的聲學(xué)特征參數(shù)Mi從備選特征集合S移至已選特征集合D中，并執(zhí)行步驟四；如果判斷結(jié)果為否，則執(zhí)行步驟五；步驟四、用備選特征集合S中剩下的元素重復(fù)執(zhí)行步驟三，直到MaxOUD+M^XRQ)， MiE S，則已選特征集合D中元素不再增加，此時(shí)已選特征集合為D = {Μ」} ;j = 1，2,. . .，p ; P為正整數(shù)；執(zhí)行步驟七；步驟五、對已選特征集合D中的每個(gè)元素 Mj,計(jì)算R(D - Mj)，找出使R(D - Mj)最大的 Mj; 判斷是否有R(D - Mj)多R(D)，如果判斷結(jié)果為是，則從已選特征集合D中去掉Mj，并執(zhí) 行步驟六；如果判斷結(jié)果為否，則執(zhí)行步驟七；步驟六、用已選特征集合D中剩下的元素重復(fù)執(zhí)行步驟五，直到Max (R(D - Mj)) <R(D)， MjE D，已選特征集合D中元素不再減少，此時(shí)已選特征集合為D = {M j ; 步驟七、返回執(zhí)行步驟三，直至已選特征集合D中不再有元素增加或減少，將最終的已選特征集合D作為最佳特征組合，完成混合語音情感識別的語音特征篩選。
2. 根據(jù)權(quán)利要求1所述的一種用于混合語音情感識別的語音特征篩選方法，其特征在于混合語音數(shù)據(jù)的類別分為：霸凌語音數(shù)據(jù)和日常語音數(shù)據(jù)。
【專利摘要】一種用于混合語音情感識別的語音特征篩選方法，涉及模式識別領(lǐng)域，具體涉及語音情感識別方法和特征選擇方法。它是為了實(shí)現(xiàn)混合語音情感識別的語音特征篩選。本發(fā)明給出一種混合語音情感識別中的聲學(xué)特征篩選方法，本發(fā)明能夠從一系列聲學(xué)特征中找出一組最佳特征集合，使得分類方法的平均識別率達(dá)到最高。實(shí)現(xiàn)混合語音情感識別的高精度語音特征篩選。本發(fā)明適用于混合語音情感識別的語音特征篩選。
【IPC分類】G10L25-63
【公開號】CN104835508
【申請?zhí)枴緾N201510152151
【發(fā)明人】葉亮, 李月, 吳少川, 石碩, 李卓明, 于婷, 任浩, 劉鑫
【申請人】哈爾濱工業(yè)大學(xué)
【公開日】2015年8月12日
【申請日】2015年4月1日

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：葉亮;李月;吳少川;石碩;李卓明;于婷;任浩;劉鑫;
技術(shù)所有人：哈爾濱工業(yè)大學(xué);
我是此專利的發(fā)明人

上一篇：磁盤裝置以及控制方法
上一篇：一種串并結(jié)合的多模式情感信息融合與識別方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

特征篩選相關(guān)技術(shù)

特征篩選方法相關(guān)技術(shù)

語音特征提取相關(guān)技術(shù)

語音信號特征提取相關(guān)技術(shù)

語音特征相關(guān)技術(shù)

matlab語音特征提取相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種用于混合語音情感識別的語音特征篩選方法