亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

用于變換輸入信號的方法

文檔序號:8417611閱讀:350來源:國知局
用于變換輸入信號的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明總體上涉及信號處理,并且更具體地涉及使用動態(tài)模型將輸入信號變換為 輸出信號,其中所述信號是音頻(語音)信號。
【背景技術(shù)】
[0002] 用于對非平穩(wěn)信號中的動力學(xué)(dynamics)進(jìn)行建模的常用框架(framework)是 具有時間動力學(xué)的隱馬爾可夫模型(HMM,hidden Markov model)。HMM是用于語音識別的 事實(shí)(de facto)標(biāo)準(zhǔn)。離散時間HMM通過以與未觀測的隨機(jī)狀態(tài)變量{hn}的序列有關(guān)的 概率分布為條件來對N個觀測的(獲取的)隨機(jī)變量
[0003] def def
[0004] {χη} = X1:N= {x ^ X2, · · ·,xN}(即,信號樣本)的序列進(jìn)行建模。通常對HMM限定 兩個約束。
[0005] 首先,狀態(tài)變量具有一階馬爾可夫動力學(xué)。這意味著pOOhm) = P(IinIlv1),其 中PQinItv1)被稱為轉(zhuǎn)移(transition)概率。轉(zhuǎn)移概率通常被約束為時不變。
[0006] 其次,在給定相應(yīng)的狀態(tài)hn的情況下的每個樣本xn與所有其它隱狀態(tài) hn,(n'乒η)無關(guān),使得p(xn|h1:N) =p(xn|hn),其中p(xn|hn)被稱為觀測概率。在許多語 音應(yīng)用中,狀態(tài)匕是離散的,并且觀測結(jié)果X "是F維向量值的連續(xù)的聲學(xué)特征,
[0007]
【主權(quán)項(xiàng)】
1. 一種用于變換輸入信號的方法,所述方法包括以下步驟: 將所述輸入信號的模型的參數(shù)存儲到存儲器中; 接收所述輸入信號作為特征向量的序列; 使用特征向量的所述序列和所述參數(shù)來推斷隱變量的向量的序列,其中,對于每個特 征向量Xn,存在隱變量hi,n的至少一個向量h n,并且其中,每個隱變量非負(fù); 使用所述特征向量、隱變量的所述向量和所述參數(shù)來生成與所述輸入信號對應(yīng)的輸出 信號, 其中,每個特征向量Xn依賴于相同η的所述隱變量h 中的至少一個,并且所述隱變 T _ ^ J 量根據(jù)= 相關(guān),其中j和1是求和索引,所述參數(shù)包括非負(fù)權(quán)重 Cu1,并且ε l n是獨(dú)立的非負(fù)隨機(jī)變量,其中,所述步驟在處理器中執(zhí)行。
2. 根據(jù)權(quán)利要求1所述的方法,其中,c m= δ (i,l)ai j,其中ai j是非15負(fù)標(biāo)量,并 且其中S是克羅內(nèi)克符號,使得
3. 根據(jù)權(quán)利要求1所述的方法,其中,c m= δ (m(i,j),l)ai j,其中ai j是非負(fù)標(biāo)量, S是克羅內(nèi)克符號,并且m(i,j)是從i和j的每個組合到與1對應(yīng)的索引的一對一映射, 使獨(dú)
4. 根據(jù)權(quán)利要求1所述的方法,其中,所述隨機(jī)變量ε &是伽瑪分布的。
5. 根據(jù)權(quán)利要求1所述的方法,其中,在所述推斷期間使用的觀測模型至少部分基于 Vf,n =J]Cfhhi,n£Ln Λν)是非負(fù)標(biāo)量,并且是獨(dú)立的非負(fù)隨機(jī)變量, j cUJ I,η 是所述輸入信號在幀η和特征f處的非負(fù)特征,并且j和1是索引。
6. 根據(jù)權(quán)利要求5所述的方法,其中,〇 ,其中Wf,i是非負(fù)標(biāo)量,其中δ克 羅內(nèi)克符號,并且是伽瑪分布的隨機(jī)變量,使得所述觀測模型至少部分 基于
其中vf,n是所述輸入?目號在幀η處的非負(fù)特征,f是頻率,GammaC I a, b)是具有形狀參 數(shù)a和逆尺度參數(shù)b的伽瑪分布,α(ν)和β w是正標(biāo)量,并且Wti是非負(fù)標(biāo)量。
7. 根據(jù)權(quán)利要求5所述的方法,所述方法還包括以下步驟: 獲得所述特征向量Xtn作為所述輸入信號的復(fù)譜圖,其中xf,n是所述復(fù)譜圖的對于幀η 和頻率f的值,以及 確定非負(fù)特征Vf,n= I X f,n 12作為在幀η和頻率f下的功率,使得所述觀測模型至少部 分基于x/> = ,其中是單位虛數(shù),并且θ?η是表示對于所述 V J 幀η和所述頻率f的相位的隨機(jī)變量。
8. 根據(jù)權(quán)利要求6所述的方法,所述方法還包括以下步驟: 設(shè)置所述參數(shù)α(ν)= 1,并且其中Θ f n是均勻分布的隨機(jī)相位變量,使得 /(V,《丨~)=~(〇, Σν,Ανζ),其中Nc是復(fù)高斯分布。 i
9. 根據(jù)權(quán)利要求1所述的方法,其中,所述推斷使用最大后驗(yàn)估計(jì)。
10. 根據(jù)權(quán)利要求1所述的方法,其中,所述推斷使用變分貝葉斯方法。
11. 根據(jù)權(quán)利要求1所述的方法,其中,所述推斷是自適應(yīng)的,并且對所述輸入信號實(shí) 時執(zhí)行所述推斷。
12. 根據(jù)權(quán)利要求1所述的方法,其中,所述輸入信號從多個通道同時接收。
13. 根據(jù)權(quán)利要求1所述的方法,其中,在所述推斷期間使用的觀測模型至少部分基于
,和/(,是非負(fù)標(biāo)量,并且和是獨(dú)立的非負(fù)隨機(jī)變量,并且i、 和η是索引。
14. 根據(jù)權(quán)利要求1所述的方法,其中,所述隱變量h 被劃分成S個組,并且所述非負(fù) 隨機(jī)變量ε1:η各自與所述組中的一個關(guān)聯(lián),其中,當(dāng)hi^Phu、或者ε &在不同的 組中時,Cm= 0。
15. 根據(jù)權(quán)利要求1所述的方法,其中,所述模型是動態(tài)的,并且所述輸入信號是非平 穩(wěn)的。
16. 根據(jù)權(quán)利要求1所述的方法,所述方法還包括以下步驟: 在所述推斷期間實(shí)時適應(yīng)于所述輸入信號的增益。
17. 根據(jù)權(quán)利要求1所述的方法,其中,所述輸入信號是語音和噪聲的混合信號,并且 所述輸出信號是增強(qiáng)的語音信號。
18. 根據(jù)權(quán)利要求1所述的方法,其中,所述參數(shù)包括基函數(shù)W、轉(zhuǎn)移矩陣Α、激活矩陣 Η、固定形狀參數(shù)α、連續(xù)伽瑪分布參數(shù)的逆尺度參數(shù)β及其各種組合。
19. 根據(jù)權(quán)利要求18所述的方法,其中,更新H和β是可選的。
20. 根據(jù)權(quán)利要求18所述的方法,其中,更新β在由所述推斷使用的最大后驗(yàn)估計(jì)中 是可選的。
21. 根據(jù)權(quán)利要求1所述的方法,其中,所述輸入信號由單個傳感器從多個源同時接 收。
22.根據(jù)權(quán)利要求18所述的方法,其中,在變分貝葉斯方法中使用H的后驗(yàn)分布。
【專利摘要】形式為特征向量的序列的輸入信號通過首先將所述輸入信號的模型的參數(shù)存儲到存儲器中被變換為輸出信號。使用所述向量和所述參數(shù),推斷隱變量的向量的序列。對于每個特征向量xn,存在隱變量hi,n的至少一個向量hn,并且每個隱變量非負(fù)。使用所述特征向量、隱變量的所述向量和所述參數(shù)來生成所述輸出信號。每個特征向量xn依賴于相同n的所述隱變量hi,n中的至少一個。所述隱變量根據(jù)公式相關(guān),其中j和l是求和索引。所述參數(shù)包括非負(fù)權(quán)重ci,j,l,并且εl,n是獨(dú)立的非負(fù)隨機(jī)變量。
【IPC分類】G10L21-0232, G10L21-0216
【公開號】CN104737229
【申請?zhí)枴緾N201380054925
【發(fā)明人】J·R·赫爾歇, C·費(fèi)沃特, J·勒魯克斯
【申請人】三菱電機(jī)株式會社
【公開日】2015年6月24日
【申請日】2013年10月17日
【公告號】DE112013005085T5, US20140114650, WO2014065342A1
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1