基于正交正弦脈沖序列定位標(biāo)簽的語音時間規(guī)整方法
【專利摘要】本發(fā)明公開了一種基于正交正弦脈沖序列定位標(biāo)簽的語音時間規(guī)整方法,其特征是利用正弦脈沖序列之間的正交性,設(shè)計由一組正交正弦脈沖序列構(gòu)成的定位標(biāo)簽并插入原始語音信號之前,與原始語音信號一起組成測試信號,再將測試信號通過通信或語音傳輸系統(tǒng)后的輸出信號與定位標(biāo)簽進行互相關(guān)運算,根據(jù)互相關(guān)函數(shù)最大值位置估計系統(tǒng)時延,實現(xiàn)通信或語音傳輸系統(tǒng)輸入與輸出信號的時間規(guī)整。與傳統(tǒng)基于語音包絡(luò)互相關(guān)的時間規(guī)整方法相比,本發(fā)明方法簡單,時間規(guī)整精度高,在低信噪比條件下仍能獲得較高的時間規(guī)整精度,能更好地滿足可懂度客觀測量實際應(yīng)用需求。
【專利說明】基于正交正弦脈沖序列定位標(biāo)簽的語音時間規(guī)整方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及基于輸入-輸出的語音可懂度測量方法或語音質(zhì)量客觀評價方法,主要應(yīng)用于使通信或語音傳輸系統(tǒng)的輸出語音信號與輸入語音信號在時域?qū)R,即時間規(guī)難
iF.ο
【背景技術(shù)】
[0002]基于輸入-輸出的語音可懂度測量方法或語音質(zhì)量客觀評價方法以原始語音作參考,評估通信或語音傳輸系統(tǒng)輸出語音信號的失真程度,并以輸出語音信號的失真度作為語音可懂度或語音質(zhì)量預(yù)測依據(jù)。使用此類方法的前提是輸出語音信號與輸入語音信號在時域精確對齊,即時間規(guī)整。時間規(guī)整的本質(zhì)是估計并消除輸出語音信號與輸入語音信號之間的時間延遲,估計精度直接影響后續(xù)語音質(zhì)量或可懂度測量的精度。
[0003]通常情況下,語音信號處理以幀為基本分析單元,且?guī)L取值范圍為25ms?64ms,時間規(guī)整的誤差應(yīng)遠小于巾貞長,一般要求小于3ms。
[0004]目前,基于輸入-輸出的可懂度測量研究大多圍繞參數(shù)提取與失真距離測量算法。已有算法通?;谡Z音信號自身包絡(luò)進行時間規(guī)整,但語音包絡(luò)自相關(guān)函數(shù)的主瓣寬度寬、主副比低,導(dǎo)致此類方法在低信噪比條件下的時間規(guī)整精度較低。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于提供一種基于正交正弦脈沖序列定位標(biāo)簽的語音時間規(guī)整方法。利用正弦脈沖序列之間的正交性,設(shè)計由一組正交正弦脈沖序列構(gòu)成的定位標(biāo)簽,插入在測試語音之前,與原始語音信號一起組成測試信號,再將測試信號通過通信或語音傳輸系統(tǒng)后的輸出信號與定位標(biāo)簽進行互相關(guān)運算,根據(jù)互相關(guān)函數(shù)最大值位置估計系統(tǒng)時延,實現(xiàn)通信或語音傳輸系統(tǒng)輸入與輸出信號的時間規(guī)整。
[0006]本發(fā)明為解決技術(shù)問題采用如下技術(shù)方案:
[0007]本發(fā)明基于正交正弦脈沖序列定位標(biāo)簽的語音時間規(guī)整方法的特點是:利用正弦脈沖序列之間的正交性,設(shè)計由一組正交正弦脈沖序列構(gòu)成的定位標(biāo)簽并插入原始語音信號之前,與原始語音信號一起組成測試信號,再將測試信號通過通信或語音傳輸系統(tǒng)后的輸出信號與定位標(biāo)簽進行互相關(guān)運算,根據(jù)互相關(guān)函數(shù)最大值位置估計系統(tǒng)時延,實現(xiàn)通信或語音傳輸系統(tǒng)輸入與輸出信號的時間規(guī)整。
[0008]本發(fā)明基于正交正弦脈沖序列定位標(biāo)簽的語音時間規(guī)整方法的特點在于按如下過程進行:
[0009]針對通信或語音傳輸系統(tǒng)設(shè)計語音測試信號,所述語音測試信號x(t)是在原始語音信號s (t)起始位置之前插入一段時長為L的正交正弦脈沖序列定位標(biāo)簽I (t),用式(I)表示為:
[0010]X (t) =1 (t) +s (t~L) (I)
[0011]所述正交正弦脈沖序列定位標(biāo)簽I (t)按式(2)獲得:
【權(quán)利要求】
1.一種基于正交正弦脈沖序列定位標(biāo)簽的語音時間規(guī)整方法,其特征是:利用正弦脈沖序列之間的正交性,設(shè)計由一組正交正弦脈沖序列構(gòu)成的定位標(biāo)簽并插入原始語音信號之前,與原始語音信號一起組成測試信號,再將測試信號通過通信或語音傳輸系統(tǒng)后的輸出信號與定位標(biāo)簽進行互相關(guān)運算,根據(jù)互相關(guān)函數(shù)最大值位置估計系統(tǒng)時延,實現(xiàn)通信或語音傳輸系統(tǒng)輸入與輸出信號的時間規(guī)整。
2.根據(jù)權(quán)利要求1所述的基于正交正弦脈沖序列定位標(biāo)簽的語音時間規(guī)整方法,其特征是按如下過程進行: 針對通信或語音傳輸系統(tǒng)設(shè)計語音測試信號,所述語音測試信號x(t)是在原始語音信號s(t)起始位置之前插入一段時長為L的正交正弦脈沖序列定位標(biāo)簽I (t),用式(I)表示為:
X (t) =1 (t) +s (t-L) (I) 所述正交正弦脈沖序列定位標(biāo)簽I (t)按式(2)獲得:
【文檔編號】G10L25/60GK103474083SQ201310430339
【公開日】2013年12月25日 申請日期:2013年9月18日 優(yōu)先權(quán)日:2013年9月18日
【發(fā)明者】儲飛黃, 許士敏, 王江, 俞紅兵, 錢宇紅, 崔琛, 余劍, 孫戰(zhàn)先 申請人:中國人民解放軍電子工程學(xué)院, 儲飛黃