亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種用于混合語音情感識別的語音特征篩選方法

文檔序號:8513351閱讀:431來源:國知局
一種用于混合語音情感識別的語音特征篩選方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及模式識別領(lǐng)域,具體涉及語音情感識別方法和特征選擇方法。
【背景技術(shù)】
[0002] 校園霸凌是一種常見的社會(huì)現(xiàn)象,多發(fā)生在中小學(xué)生群體中。校園霸凌有多種表 現(xiàn)形式,如:身體暴力、言語欺凌、損壞財(cái)物、孤立等,其中言語欺凌最為頻發(fā)。言語欺凌中通 常包含辱罵、悲傷等負(fù)面情感,因此可以用語音情感識別的方法檢測言語欺凌。
[0003] 目前語音情感識別領(lǐng)域的研宄大多基于單一對象的單一情感,而校園霸凌的語境 通常由多人語音構(gòu)成,包含欺凌者和受害人的不同情感,因此適用于單一情感識別的分類 算法和聲學(xué)特征并不適用于混合情感識別。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明是為了實(shí)現(xiàn)混合語音情感識別的語音特征篩選,從而提供一種用于混合語 音情感識別的語音特征篩選方法。
[0005] 一種用于混合語音情感識別的語音特征篩選方法,它由以下步驟實(shí)現(xiàn):
[0006] 步驟一、將混合語音數(shù)據(jù)按類別平均劃分為訓(xùn)練集和測試集,并分別提取各個(gè)語 音樣本的聲學(xué)特征參數(shù),記為M i,并放入備選特征集合s = IMJ,已選特征集合D為空集;i =1,2,…,N ;N為正整數(shù);
[0007] 每次選取一個(gè)Mi作為分類算法的輸入,則計(jì)算其識別率R(M D,重復(fù)此過程N(yùn)次, 分別得到N個(gè)聲學(xué)特征參數(shù)的識別率R(Mi);
[0008] 步驟二、在備選特征集合S中找出單一識別率最高的聲學(xué)特征參數(shù)MiJfM i從備 選特征集合S移到已選特征集合D中;
[0009] 步驟三、用備選特征集合S中剩下的元素依次與已選特征集合D中元素配合,作為 分類算法的輸入,計(jì)算其識別率,在備選特征集合S中找出使R(D+Mi)最大的M i;
[0010] 判斷是否有R(D+Mi)彡R(D),如果判斷結(jié)果為是,則將聲學(xué)特征參數(shù)吣從備選特 征集合S移至已選特征集合D中,并執(zhí)行步驟四;如果判斷結(jié)果為否,則執(zhí)行步驟五;
[0011] 步驟四、用備選特征集合S中剩下的元素重復(fù)執(zhí)行步驟三,直到 MaX(R(D+Mi))〈R(D),MiE S,已選特征集合D中元素不再增加,此時(shí)已選特征集合為D = {Μ」} ;,j = 1,2,…,p ;p為正整數(shù);執(zhí)行步驟七;
[0012] 步驟五、對已選特征集合D中的每個(gè)元素 Mj,計(jì)算R(D-Mj),找出使R(D-Mj)最大 的M j;
[0013] 判斷是否有R (D - Mj)彡R(D),如果判斷結(jié)果為是,則從已選特征集合D中去掉%, 并執(zhí)行步驟六;如果判斷結(jié)果為否,則執(zhí)行步驟七;
[0014] 步驟六、用已選特征集合D中剩下的元素重復(fù)執(zhí)行步驟五,直到1^以1?(0-Mj)) <R (D),Mj e D,已選特征集合D中元素不再減少,此時(shí)已選特征集合為D = {M』};
[0015] 步驟七、返回執(zhí)行步驟三,直至已選特征集合D中不再有元素增加或減少,將最終 的已選特征集合D作為最佳特征組合,完成混合語音情感識別的語音特征篩選。
[0016] 本發(fā)明給出一種混合語音情感識別中的聲學(xué)特征篩選方法,本發(fā)明能夠從一系列 聲學(xué)特征中找出一組最佳特征集合,使得分類方法的平均識別率達(dá)到最高。實(shí)現(xiàn)混合語音 情感識別的高精度語音特征篩選。
【附圖說明】
[0017] 圖1是【具體實(shí)施方式】一的特征篩選過程中平均識別率的變化仿真示意圖;
【具體實(shí)施方式】
【具體實(shí)施方式】 [0018] 一、基于混合語音情感識別的聲學(xué)特征篩選方法,由以下步驟組 成:
[0019] 步驟一、將混合語音數(shù)據(jù)按類別平均劃分為訓(xùn)練集和測試集,并分別提取各個(gè)語 音樣本的聲學(xué)特征參數(shù),記為Mi,i = 1,2,…,N,放入備選特征集合S = {Mi,i = 1,2,…,N}, 而已選特征集合D為空集。每次選取一個(gè)Mi作為分類算法的輸入,計(jì)算其識別率R(M J,重 復(fù)此過程N(yùn)次,分別得到N個(gè)聲學(xué)特征參數(shù)的識別率R(Mi),i = 1,2,…,N ;
[0020] 步驟二、在S中找出單一識別率最高的聲學(xué)特征參數(shù)Mi,將%從備選特征集合S移 到已選特征集合D中;
[0021] 步驟三、用S中剩下的元素依次與D中元素配合,作為分類算法的輸入,計(jì)算其識 別率,在S中找出使R(D+Mi)最大的吣。若R(D+Mi)彡R(D),則將M iWS移至D中,并繼續(xù) 步驟四,否則進(jìn)入步驟五;
[0022] 步驟四、用S中剩下的元素重復(fù)步驟③,直到Max(R(D+Mi))〈R(D),MiE S,D中元 素不再增加,此時(shí)已選特征集合為D= {M」,j = 1,2,···,ρ};
[0023] 步驟五、對D中的每個(gè)元素 Mj, j = 1,2, "·,ρ,計(jì)算R(D-Mj),找出使R(D-Mj)最 大的Μ」。若有R(D - Mj)彡R(D),則從D中去掉Mj (并且不會(huì)放回S中),并繼續(xù)步驟六,否 則進(jìn)入步驟七;
[0024] 步驟六、用D中剩下的元素重復(fù)步驟⑤,直到Max (R(D-Mj) )〈R (D),MjE D,D中元 素不再減少,此時(shí)已選特征集合為D= {M」,j = 1,2, ···,(!};
[0025] 步驟七、重復(fù)步驟③至⑥,直到D中不再有元素增加或減少。至此得到最佳特征組 合 D = {Μ』,j = 1,2, ...,n} 〇
[0026] 下面以GMM(Gaussian Mixture Model,高斯混合模型)分類算法作用于混合語音 的 24 個(gè) MFCC(Mel Frequency Cepstral Coefficients,Mel 頻率倒譜系數(shù))特征為例,說 明上述特征篩選算法的有效性。言語欺凌實(shí)驗(yàn)由不同年齡的8個(gè)女生和7個(gè)男生表演,采 集混合情感語音數(shù)據(jù)共80段,涉及語境包括:日常會(huì)話2類,分別以"快樂"和"中性"為主, 混以其它情感;言語欺凌2類,分別以"辱罵"和"悲傷"為主,混以其它情感。圖1給出特 征篩選過程中平均識別率的變化。
[0027] 圖1中,第1至4步是特征增加過程,平均識別率隨特征數(shù)目的增加而升高,第4 步的識別率與第3步相同,說明第4步中新增的特征可有可無,但在第4步中該特征與已有 特征的配合最好,故暫留在已選特征集中,進(jìn)入下一輪篩選。第5步新增特征后,識別率開 始下降,新增特征已是剩余備選特征中與已選特征配合最好的,故剩余特征已無可選,特征 增加過程結(jié)束。第6步刪除第5步新增特征,恢復(fù)到第4步狀態(tài),從第7步開始已選特征集 進(jìn)入刪減過程,刪除已選集中配合最差的特征,識別率不變。第8步繼續(xù)刪除配合最差特征 后,識別率下降,說明已選特征集中剩下的每個(gè)特征對分類都有貢獻(xiàn),不應(yīng)刪除,特征刪減 過程結(jié)束。第9步重新將第8步所刪特征加入,恢復(fù)到第7步狀態(tài)。第10步再次進(jìn)入特征 增加過程,在剩余備選特征(不含已刪除特征)中選擇與已選特征配合最好的特征,但識別 率下降,說明剩余備選特征中已無可用,增加過程結(jié)束。第11步將第10步新增特征刪除, 之前的一輪刪減和增加過程中已選特征集沒有變化,至此特征篩選過程結(jié)束,平均識別率 達(dá)到最高82. 5%。具體識別結(jié)果如表1。
[0028]表 1
【主權(quán)項(xiàng)】
1. 一種用于混合語音情感識別的語音特征篩選方法,其特征是:它由以下步驟實(shí)現(xiàn): 步驟一、將采集的混合語音樣本數(shù)據(jù)按類別平均劃分為訓(xùn)練集和測試集,并分別提取 各個(gè)語音樣本數(shù)據(jù)的聲學(xué)特征參數(shù),記為Mi,并放入備選特征集合S = {MJ,初始化已選特 征集合D為空集;i = 1,2,. . .,N ;N為正整數(shù); 每次選取一個(gè)Mi,并計(jì)算其識別率R (Mi),重復(fù)此過程N(yùn)次,分別得到N個(gè)聲學(xué)特征參數(shù) 的識別率R(Mi); 步驟二、在備選特征集合S中找出單一識別率最高的聲學(xué)特征參數(shù)Mi,將%從備選特 征集合S移到已選特征集合D中; 步驟三、用備選特征集合S中剩下的元素依次與已選特征集合D中元素配合,并分別計(jì) 算其識別率,在備選特征集合S中找出使R(D+Mi)最大的語音樣本的聲學(xué)特征參數(shù)Mi; 判斷是否有R(D+Mi)彡R(D),如果判斷結(jié)果為是,則將該語音樣本的聲學(xué)特征參數(shù)Mi從備選特征集合S移至已選特征集合D中,并執(zhí)行步驟四;如果判斷結(jié)果為否,則執(zhí)行步驟 五; 步驟四、用備選特征集合S中剩下的元素重復(fù)執(zhí)行步驟三,直到MaxOUD+M^XRQ), MiE S,則已選特征集合D中元素不再增加,此時(shí)已選特征集合為D = {Μ」} ;j = 1,2,. . .,p ; P為正整數(shù);執(zhí)行步驟七; 步驟五、對已選特征集合D中的每個(gè)元素 Mj,計(jì)算R(D - Mj),找出使R(D - Mj)最大的 Mj; 判斷是否有R(D - Mj)多R(D),如果判斷結(jié)果為是,則從已選特征集合D中去掉Mj,并執(zhí) 行步驟六;如果判斷結(jié)果為否,則執(zhí)行步驟七; 步驟六、用已選特征集合D中剩下的元素重復(fù)執(zhí)行步驟五,直到Max (R(D - Mj)) <R(D), MjE D,已選特征集合D中元素不再減少,此時(shí)已選特征集合為D = {M j ; 步驟七、返回執(zhí)行步驟三,直至已選特征集合D中不再有元素增加或減少,將最終的已 選特征集合D作為最佳特征組合,完成混合語音情感識別的語音特征篩選。
2. 根據(jù)權(quán)利要求1所述的一種用于混合語音情感識別的語音特征篩選方法,其特征在 于混合語音數(shù)據(jù)的類別分為:霸凌語音數(shù)據(jù)和日常語音數(shù)據(jù)。
【專利摘要】一種用于混合語音情感識別的語音特征篩選方法,涉及模式識別領(lǐng)域,具體涉及語音情感識別方法和特征選擇方法。它是為了實(shí)現(xiàn)混合語音情感識別的語音特征篩選。本發(fā)明給出一種混合語音情感識別中的聲學(xué)特征篩選方法,本發(fā)明能夠從一系列聲學(xué)特征中找出一組最佳特征集合,使得分類方法的平均識別率達(dá)到最高。實(shí)現(xiàn)混合語音情感識別的高精度語音特征篩選。本發(fā)明適用于混合語音情感識別的語音特征篩選。
【IPC分類】G10L25-63
【公開號】CN104835508
【申請?zhí)枴緾N201510152151
【發(fā)明人】葉亮, 李月, 吳少川, 石碩, 李卓明, 于婷, 任浩, 劉鑫
【申請人】哈爾濱工業(yè)大學(xué)
【公開日】2015年8月12日
【申請日】2015年4月1日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1