亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

修改語音信號的系統(tǒng)和方法

文檔序號:2822663閱讀:454來源:國知局
專利名稱:修改語音信號的系統(tǒng)和方法
背景技術(shù)
本發(fā)明涉及用于在通信網(wǎng)中發(fā)射語音信息的技術(shù),并且更特別涉及用于增強(qiáng)接收機(jī)處的窄帶語音信號的技術(shù)。
在語音信號的發(fā)射中,在網(wǎng)絡(luò)容量(即,被發(fā)射的呼叫次數(shù))和那些呼叫的話音信號的質(zhì)量之間有一種折衷方法。當(dāng)今正在使用中的大部分電話系統(tǒng)根據(jù)奈奎斯特定理以8kHz的一個抽樣速率來在大約300Hz和3.4kHz之間的窄頻帶中編碼并發(fā)射語音信號。由于人類語音包含大約50Hz和13kHz之間的頻率,所以以一個8kHz速率來抽樣人類語音并發(fā)射大約300Hz到3.4kHz的窄頻率范圍必定忽略語音信號中的信息。因此,電話系統(tǒng)必定衰落語音信號的質(zhì)量。
擴(kuò)展電話系統(tǒng)中發(fā)射的語音信號帶寬的各種方法已經(jīng)被開發(fā)。該方法能夠被分成兩類。第一類別包括這樣的系統(tǒng)這些系統(tǒng)通過整個電話系統(tǒng)發(fā)射的語音信號的帶寬以便容納由人類語音產(chǎn)生的一個更寬頻率范圍。這些系統(tǒng)在網(wǎng)絡(luò)各處強(qiáng)加了另外的帶寬要求,因此難以實(shí)現(xiàn)。
第二類別包括這樣的系統(tǒng)這些系統(tǒng)使用數(shù)學(xué)算法來操作被現(xiàn)有電話系統(tǒng)使用的窄帶語音信號。典型的示例包括壓縮發(fā)射機(jī)中的寬帶語音信號的算法,如此以便可以通過一個現(xiàn)有的窄帶連接來發(fā)射寬帶信號。寬帶信號然后必須在接收機(jī)處被解壓縮。這些方法可能實(shí)現(xiàn)起來太昂貴,-因?yàn)樾枰淖儸F(xiàn)有系統(tǒng)的結(jié)構(gòu)。
其他技術(shù)實(shí)現(xiàn)一種“電報(bào)密碼本”(codebook)方法。一個電報(bào)密碼本被用來從窄帶語音信號轉(zhuǎn)換為新的寬帶語音信號。常常從窄帶到寬帶的轉(zhuǎn)換是以兩種模型為基礎(chǔ)的一種用于窄帶語言分析而一種用于寬帶語音合成。電報(bào)密碼本關(guān)于語音數(shù)據(jù)被訓(xùn)練以便“學(xué)會”大多數(shù)話音(語音)的分集。當(dāng)使用電報(bào)密碼本時(shí),窄帶語音被形成模式并且表示對窄帶模型的一個最小間距的電報(bào)密碼本入口被查找。被選擇的模型被轉(zhuǎn)換成它的寬帶等價(jià)物,其被用于合成寬帶語音。與電報(bào)密碼本相關(guān)的一個缺點(diǎn)是它們需要重要的訓(xùn)練。
另一種方法通常被稱為頻譜疊加。頻譜疊合技術(shù)是以這樣一種原理為基礎(chǔ)的即,低頻帶中的內(nèi)容可以被疊加到較高頻帶中。一般來說,以一個更高的抽樣速率來對窄帶信號進(jìn)行再抽樣以便在高頻帶中引入混疊。較高頻帶然后用一個低通濾波器而被整形,并且產(chǎn)生寬帶信號。這些方法是簡單而有效的,但是它們常常引入使話音有金屬感的高頻失真。
因此,在本領(lǐng)域中需要用于發(fā)射窄帶語音信號的另外的系統(tǒng)和方法。另外,在本領(lǐng)域中需要用于處理接收機(jī)處的窄帶語音信號的系統(tǒng)和方法,以便模擬寬帶語音信號。
在一個方面中,本發(fā)明提供一種用于處理語音信號的方法。該方法包括如下步驟分析一個接收窄帶信號以便確定合成的高頻帶的內(nèi)容;使用接收的窄帶信號來再生語音信號的一個低頻帶;和把所述再生的低頻帶與確定的合成高頻帶進(jìn)行合并以便產(chǎn)生一個具有合成分量的寬帶語音信號。
按照本發(fā)明的另外一個方面,分析步驟還包括如下步驟對接收窄帶信號執(zhí)行一個頻譜分析以便確定與語音模型和殘留誤差信號相關(guān)的參數(shù);確定與殘留誤差信號相關(guān)的一個音調(diào);識別與接收窄帶信號相關(guān)的峰值;和根據(jù)確定的音調(diào)和識別的峰值中的至少一個把來自接收窄帶信號中的信息復(fù)制到一個高頻帶中以便提供合成高頻帶內(nèi)容。
按照本發(fā)明的另外一個方面,寬帶信號的一個預(yù)確定頻率范圍可以被選擇性地增大。寬帶信號也可以被轉(zhuǎn)換成一個模擬格式并被放大。
按照另一方面,本發(fā)明提供一個用于處理一個語音信號的系統(tǒng)。該系統(tǒng)包括裝置,用于分析一個接收窄帶信號以便確定合成高頻帶內(nèi)容;裝置,用于使用接收的窄帶信號來再生語音信號的一個低頻帶;和裝置,用于把所述再生的低頻帶與確定的合成高頻帶進(jìn)行合并以便產(chǎn)生一個具有合成分量的寬帶語音信號。
按照本發(fā)明的另外一個方面,用于分析一個接收窄帶信號以便確定合成高頻帶內(nèi)容的設(shè)備包括一個參量頻譜分析模塊,用于分析窄帶信號的共振峰結(jié)構(gòu)并且產(chǎn)生描述該窄頻帶語音信號的參數(shù)和一個誤差信號;一個音調(diào)判斷模塊,用于確定由窄帶信號表示的聲音段的音調(diào);和一個殘余擴(kuò)展器和復(fù)制模塊,用于處理從窄帶語音信號中得到的信息并產(chǎn)生一個合成高頻帶信號分量。
按照本發(fā)明的另外方面,殘余擴(kuò)展器和復(fù)制模塊包括一個快速傅里葉變換模塊,用于把來自參量頻譜分析模塊中的誤差信號轉(zhuǎn)換成為頻域;一個峰值檢波器,用于識別誤差信號的諧波頻率;和一個復(fù)制模塊,用于把由峰值檢波器識別的峰值復(fù)制到較高頻率范圍中。
在另一方面中,本發(fā)明提供一種用于在接收機(jī)處處理一個窄帶語音信號的系統(tǒng)。本系統(tǒng)包括一個上抽樣器,其接收窄帶語音信號并且增加抽樣頻率以便產(chǎn)生具有一個增加頻譜的一個輸出信號;一個參量頻譜分析模塊,其接收來自上抽樣器中的輸出信號并且分析該輸出信號以便產(chǎn)生與一個語音模型和一個殘留誤差信號相關(guān)的參數(shù);一個音調(diào)判斷模塊,其接收來自參量頻譜分析模塊中的殘留誤差信號并且產(chǎn)生表示該語音信號音調(diào)的一個音調(diào)信號和表示該語音信號是濁音語音或者是清音語音的一個指示信號;和一個殘余擴(kuò)展器和復(fù)制模塊,其接收并處理該殘留誤差信號和該音調(diào)信號以便產(chǎn)生一個合成高頻帶信號分量。
圖4是一個框圖,其說明了根據(jù)本發(fā)明用于把合成信息加到窄帶語音信號去的系統(tǒng)和方法的一個可仿效實(shí)施例;圖5說明了在圖4中描述的一個可仿效殘余擴(kuò)展器和復(fù)制電路的一個框圖;圖6是一個框圖,其說明了根據(jù)本發(fā)明用于把合成信息加到窄帶語音信號去的系統(tǒng)和方法的第二可仿效實(shí)施例;圖7說明了在圖6中描述的一個可仿效殘余擴(kuò)展器和復(fù)制電路的一個框圖;圖8是一個框圖,其說明了根據(jù)本發(fā)明用于把合成信息加到窄帶語音信號去的系統(tǒng)和方法的第三可仿效實(shí)施例;圖9是說明了根據(jù)本發(fā)明的一個可仿效殘余的修改量的一個框圖;

圖10是說明了表示濁音的一個語音抽樣的短時(shí)間自相關(guān)函數(shù)的一個曲線圖;圖11是說明了表示濁音的一個語音抽樣的平均幅度差值函數(shù)的一個曲線圖;圖12是說明了一個AR模型轉(zhuǎn)送函數(shù)可以被分開成兩種轉(zhuǎn)送函數(shù)的一個框圖;圖13是一個曲線圖,其說明了在把一個合成共振峰加到語音信號之前與后的語音信號的粗略結(jié)構(gòu);圖14是一個曲線圖,其說明了在把一個合成共振峰加到語音信號之前與后的語音信號的粗略結(jié)構(gòu);和圖15是一個曲線圖,其說明了有關(guān)于語音信號的不同參數(shù)的AR模型的頻率響應(yīng)曲線。
最佳實(shí)施方式本發(fā)明提供對可以在接收機(jī)處實(shí)現(xiàn)的語音信號處理的改善。按照本發(fā)明的一個方面,使用接收語音信號的較低頻率區(qū)域中的信息來合成較高頻率區(qū)域中的語音信號的頻率。本發(fā)明做出如下事實(shí)的有利使用即,語音信號具有可以被外插到較高頻率區(qū)域中的諧波含量。
本發(fā)明可以被使用于傳統(tǒng)的有線線路中(即,固定的)電話系統(tǒng)或者使用于無線(即,移動)電話系統(tǒng)中。因?yàn)榇蠖鄶?shù)的現(xiàn)有無線電話系統(tǒng)都是數(shù)字的,所以本發(fā)明可以在移動通信終端(例如,移動電話或其他通信設(shè)備)中被輕易地實(shí)現(xiàn)。圖1提供了根據(jù)本發(fā)明的各個方面通過作為接收機(jī)的通信終端所執(zhí)行功能的示意描寫。一個編碼語音信號被移動電話的天線110和接收機(jī)120所接收,被一個信道解碼器130和一個聲碼器140所解碼。來自聲碼器140中的數(shù)字信號是針對一個帶寬擴(kuò)展模塊150,它根據(jù)接收語音信號中的信息合成語音信號的丟失頻率(例如,較高頻率區(qū)域中的信息)。增強(qiáng)的信號可以被發(fā)射給一個D/A轉(zhuǎn)換器160,它把數(shù)字信號轉(zhuǎn)換為可以被導(dǎo)向到揚(yáng)聲器170去的一個模擬信號。由于語音信號已經(jīng)是數(shù)字的,所以在發(fā)射移動電話中已經(jīng)完成了抽樣。可是,應(yīng)該理解,本發(fā)明不局限于無線網(wǎng)絡(luò);它通??梢员皇褂糜谒械碾p向電話通信中。語音產(chǎn)生通過背景,語言由控制聲音系統(tǒng)的腦中的神經(jīng)信號(neuromuscular signals)所產(chǎn)生。由聲音系統(tǒng)產(chǎn)生的不同聲音被稱作音素(phonemes),它們被合并以便形成字和/或句子。每一種語言都有它自己的音素組,并且某些音素存在于一種以上的語言中。
語音聲音可以被區(qū)分為兩種主要的類別濁音和清音。濁音是在空氣的準(zhǔn)周期被聲門釋放時(shí)產(chǎn)生,聲門是聲帶之間的開口??諝獾倪@些猝發(fā)激發(fā)聲域,產(chǎn)生一個濁音(即,“car”中的一個短“a”)。相反,清音是在通過聲域中一個約束迫使的空氣穩(wěn)流時(shí)所產(chǎn)生。這種約束常常接近嘴部,使得空氣變得狂暴并且產(chǎn)生一個類似噪音的聲音(即,如“she”中的“sh”)。當(dāng)然,存在具有濁音和清音的特性的那些聲音。
有許多與語言模擬技術(shù)有關(guān)的各種特征。其中的這樣一個特征是共振峰頻率,它取決于聲域的形狀。聲域的激勵源也是一個有關(guān)的參數(shù)。
圖2說明了以16kHz抽樣頻率抽樣的濁音語音的頻譜。粗略結(jié)構(gòu)由虛線210來說明。三個第一共振峰由箭頭表示。
共振峰是聲域的諧振頻率。它們形成語音頻率頻譜的粗略結(jié)構(gòu)。共振峰取決于揚(yáng)聲器聲域的特性來變化,即,是否它是長(典型的為男性)或者短(典型的為女性)。當(dāng)聲域的形狀改變時(shí),諧振頻率也在頻率、帶寬和幅度方面改變。共振峰在音素期間連續(xù)地改變形狀,但是突變在從一個濁音到一個清音轉(zhuǎn)換時(shí)發(fā)生。具有最低諧振頻率的三個共振峰對于抽樣產(chǎn)生的話音很重要??墒牵硗獾墓舱穹?例如,第4和第5共振峰)增強(qiáng)了語音信號的質(zhì)量。由于在窄帶傳輸系統(tǒng)中實(shí)現(xiàn)的低抽樣速率(即,8kHz),所以較高頻率的共振峰從編碼語音信號中被省略,這導(dǎo)致一個較低的質(zhì)量語音信號。共振峰常常用Fk來表示,在此,k是共振峰的數(shù)目。
存在兩種類型的聲域激勵脈沖激勵和噪聲激勵。脈沖激勵和噪聲激勵可以同時(shí)發(fā)生從而產(chǎn)生一個混合激勵。
發(fā)源于聲門中的空氣猝發(fā)是脈沖激勵的基礎(chǔ)。聲門脈沖取決于說話的聲音和聲帶的壓力。聲門脈沖的頻率被稱為基頻,常常表示為Fo。在兩個連續(xù)猝發(fā)之間的周期是音調(diào)周期并且它的范圍從語音的大約1.25ms到20ms,它對應(yīng)于50Hz到800Hz之間的一個頻率范圍。音調(diào)只在聲帶振動時(shí)存在并且產(chǎn)生一個濁音(或混合激勵聲音)。
不同的聲音產(chǎn)生取決于聲域的形狀?;lFo是性別相關(guān)的,并且通常男性說話者比女性說話者較低??梢栽谧鳛楹芎玫念l譜結(jié)構(gòu)的頻域中觀察音調(diào)。在繪制是時(shí)間和頻率的一個函數(shù)的信號能量(通常由彩色亮度來表示)的一個頻譜圖中,音調(diào)可以作為水平細(xì)線被觀測,如圖3所述。這個結(jié)構(gòu)表示音調(diào)頻率以及發(fā)源于基頻的它的高階諧波。
當(dāng)清音產(chǎn)生時(shí),激勵源表示噪音。噪聲由經(jīng)過聲域中(常常是在口腔中)一個壓迫的空氣穩(wěn)流而產(chǎn)生。當(dāng)空氣流傳遞該壓迫時(shí),它變得狂暴,并且產(chǎn)生一個噪聲聲音。依靠產(chǎn)生的音素類型,壓迫位于不同的位置。由于幾乎相等空出的峰值的缺乏,細(xì)致的頻譜結(jié)構(gòu)與一個濁音不同。可仿效語音信號增強(qiáng)電路圖4說明了根據(jù)本發(fā)明用于把合成信息加到窄帶語音信號的一個系統(tǒng)和方法的一個可仿效實(shí)施例??梢园押铣尚畔⒓拥揭粋€窄帶語音信號以便擴(kuò)展再生的頻帶,從而提供改良的再生感覺語音質(zhì)量。參見圖4,由接收機(jī)(例如,一個移動電話)接收的一個輸入話音或語音信號405首先被上抽樣器410進(jìn)行上抽樣以便增加接收信號的抽樣頻率。在優(yōu)選實(shí)施例中,上抽樣器410可以把接收信號上抽樣一個因子二(2),但是應(yīng)該理解,也可以應(yīng)用其他上抽樣因子。
上抽樣信號被一個參量頻譜分析模塊420分析從而確定接收語音信號的共振峰結(jié)構(gòu)。由參量頻譜分析單元420執(zhí)行的特定類型的分析可以變化。在一個實(shí)施例中,一個自動回歸(AR)模型可用來估計(jì)模擬參數(shù),如下所述。可替代地,一個正弦曲線模型可以被使用在參量頻譜分析單元420中,例如,在作者為Deisher和Spanias、標(biāo)題為“Speech Enhancement Using State-based Estimation andSinusoidal Modeling”(使用基于狀態(tài)的估計(jì)和正弦曲線模擬的語音增強(qiáng))的文章中所述,其公開在此被參考結(jié)合。在任一情況中,參量頻譜分析單元420輸出描述接收語音信號的參數(shù),(即,與使用在其中的特定模型相關(guān)的值),以及一個誤差信號(e)424,它表示與參量頻譜分析單元420的接收語音信號的估計(jì)相關(guān)的預(yù)測誤差。
誤差信號(e)424被音調(diào)判斷單元430使用來估計(jì)接收語音信號的音調(diào)。音調(diào)判斷單元430例如能夠基于誤差信號中的瞬態(tài)之間的距離來確定音調(diào)。這些瞬態(tài)是當(dāng)產(chǎn)生濁音時(shí)由聲門產(chǎn)生的脈沖結(jié)果。音調(diào)判斷單元430還要確定接收信號的語音內(nèi)容是否表示一個濁音或者一個清音,并且產(chǎn)生一個表示它的信號。由音調(diào)判斷單元430作出的關(guān)于作為濁音或清音的接收信號特性的判定可以是一個雙擇判定或者一個表示濁音信號或一個清音信號的相對概率的軟判定。
音調(diào)信息和一個表示不論接收信號是一個濁音或一個清音的信號從音調(diào)判斷單元430被輸出到殘余擴(kuò)展器和復(fù)制單元440。如下關(guān)于圖5所述,殘余擴(kuò)展器和復(fù)制單元440從接收窄帶語音信號中提取信息,(例如,在0到4kHz范圍內(nèi))并且使用提取信息來移到一個較高頻率范圍,(例如,4kHz-8kHz)。結(jié)果然后被轉(zhuǎn)送給一個合成濾波器450,它把以從參量頻譜分析單元420輸出的參數(shù)為基礎(chǔ)的較低頻率范圍和以殘余擴(kuò)展器和復(fù)制單元440的輸出為基礎(chǔ)的較高頻率范圍進(jìn)行合成。合成濾波器450例如是用于AR模型的一個相反的濾波器??商娲?,合成濾波器450可以是以正弦曲線模型為基礎(chǔ)的。
還可以通過把合成濾波器450的輸出提供到一個線性時(shí)間不同的(LTV)濾波器460來放大感興趣頻率范圍的一部分。在一個可仿效實(shí)施例中,LTV濾波器460可以是一個無限脈沖響應(yīng)(IIR)濾波器。雖然可以使用其它類型的濾波器,但是具有不同極的IIR濾波器特別適合于模擬話音域。可以基于關(guān)于合成共振峰(或多個共振峰)應(yīng)該被布置在合成語音信號內(nèi)的判定來適合LTV濾波器460。通過確定單元470根據(jù)接收語音信號的音調(diào)以及從參量頻譜分析單元420輸出的參數(shù)根據(jù)這些值的線性或非線性的組合、或者基于儲存在查詢表中并根據(jù)得出的語音模型參數(shù)和確定音調(diào)被標(biāo)引的值來進(jìn)行此判斷。
圖5描述殘余擴(kuò)展器和復(fù)制單元440的一個可仿效實(shí)施例。其中,來自參量頻譜分析單元420中的殘留誤差信號(e)424被輸入給一個快速傅里葉變換(FFT)模塊510。FFT單元510把誤差信號轉(zhuǎn)換成為頻域用于由復(fù)制單元530操作。復(fù)制單元530,在峰值檢波器520的控制之下,從殘留誤差信號(e)424中選擇信息,其可用于駐留至少一部分的激勵信號。在一個實(shí)施例中,,峰值檢波器520可以識別窄帶語音信號的殘留誤差信號(e)中的峰值或諧波。峰值可以被復(fù)制模塊530復(fù)制到高頻帶。可替代地,峰值檢波器520能夠識別在窄帶語音信號中找到的峰值數(shù)目的一個子集,(例如,第一峰值),并且使用由音調(diào)判斷單元430識別的音調(diào)周期來計(jì)算由復(fù)制單元530復(fù)制的另外峰值的位置。由于在語音段表示一個清音時(shí)峰值檢測和復(fù)制被合成清音的高頻帶語音內(nèi)容替換,所以表示被抽樣窄帶信號是濁音或清音的那個信號還被提供給峰值檢波器520。
清音語音內(nèi)容由語音內(nèi)容單元540產(chǎn)生。合成清音高頻帶語音內(nèi)容能夠以許多不同的方式被創(chuàng)建。例如,一個線性回歸取決于語音參數(shù)并且音調(diào)可以被執(zhí)行來提供合成清音高頻帶語音內(nèi)容。作為一種替換,一個相關(guān)的存儲模塊可以包括一個查詢表,其提供與來自模型和確定音調(diào)中的語音參數(shù)相關(guān)的輸入值相應(yīng)的合成高頻帶清音語音內(nèi)容。來自殘留誤差信號中的復(fù)制峰值信息和合成清音高頻帶語音內(nèi)容被輸入到合并模塊560。合并單元560允許復(fù)制單元530和合成清音高頻帶語音內(nèi)容單元540的輸出在被FFT單元570轉(zhuǎn)換回時(shí)域之前被加權(quán)并一起被總計(jì)。加權(quán)值可以由增益控制單元550來調(diào)整。增益控制模塊550確定輸入頻譜的均勻性,并且使用此信息和來自音調(diào)判斷模塊430中的音調(diào)信息,調(diào)整與合并單元120相關(guān)的增益。作為加權(quán)算法的一部分,增益控制單元550還接收指示該語音段表示濁音或清音的那個信號。如上所述,這個信號可以是二進(jìn)制或者“軟”信息,其提供被處理的接收信號段是濁音或清音的可能性。
圖6說明了用于把一個合成語音共振峰加到接收信號的較高頻率范圍去的系統(tǒng)和方法的另外一個可仿效實(shí)施例。圖6中描述的實(shí)施例類似于圖4中描述的實(shí)施例,除了殘余擴(kuò)展器和復(fù)制模塊640提供僅僅基于來自接收信號窄帶部分中的信息的一個輸出之外。這個殘余擴(kuò)展器和復(fù)制模塊640的一個可仿效實(shí)施例如圖7所述,并且在下面被描述。如果音調(diào)判斷單元430確定感興趣的一個特定段表示一個清音,則它控制開關(guān)635來選擇直接用于輸入到合成濾波器450的殘留誤差(e)信號。相反,如果音調(diào)判斷模塊630確定存在一個語音信號,那么開關(guān)635被控制來連接到殘余擴(kuò)展器和復(fù)制單元440的輸出如此以便確定較高頻率內(nèi)容。一個放大濾波器660對合成濾波器450的輸出進(jìn)行操作以便增加期望抽樣頻率的一個預(yù)確定部分中的增益。例如,放大濾波器660可以被設(shè)計(jì)來增加從2kHz到8kHz頻帶的增益。通過模擬在此所述的各種合成語音共振峰的再生,濾波器極對例如可以被最佳化在半徑為0.85和角度為0.58π的鄰近區(qū)域中。
圖7提供使用在圖6的可仿效實(shí)施例中的一個殘余擴(kuò)展器和復(fù)制單元640的示例。在此,殘留誤差信號(e)再一次被FFT單元710轉(zhuǎn)變成頻域。峰值檢波器720識別與殘留誤差信號(e)的頻域形式相關(guān)的峰值,其然后被復(fù)制模塊730復(fù)制并被FFT模塊740轉(zhuǎn)換成為時(shí)域。正如在圖5的可仿效實(shí)施例中,峰值檢波器620可以獨(dú)立地檢測每一峰值或者峰值的一個子集,并且能夠基于確定的音調(diào)來計(jì)算殘余峰值。A對本領(lǐng)域技術(shù)人員來說很明顯,當(dāng)與圖5中的實(shí)施相比較時(shí),殘余擴(kuò)展器和復(fù)制模塊的這個特定實(shí)施多少被簡化,因?yàn)樗辉噲D把清音合成在較高頻帶語音內(nèi)容中。
圖8是根據(jù)本發(fā)明用于把一個合成語音共振峰加到一個較高頻率范圍的接收信號去的系統(tǒng)和方法的另一可仿效實(shí)施例的示意描寫。由x(n)表示的一個窄帶語音信號被導(dǎo)向到一個上抽樣器810以便獲得具有一個增加抽樣頻率(例如為16kHz)的一個新信號s(n)。應(yīng)當(dāng)指出,n是抽樣數(shù)。T被上抽樣的信號s(n)被導(dǎo)向到一個分段模塊820,該分段模塊820把包括信號s(n)的抽樣組集中到一個向量(vector)(或緩存器)中。
例如可以使用一個AR模型來估計(jì)共振峰結(jié)構(gòu)。例如可以使用一個線性預(yù)測算法來估計(jì)模型參數(shù)ak。線性預(yù)測模塊840接收上抽樣信號s(n)和由分段模塊820產(chǎn)生的抽樣向量作為輸入,并且計(jì)算預(yù)測器多項(xiàng)式ak,如下所述。A線性預(yù)測編碼(LPC)模塊830使用反向多項(xiàng)式來預(yù)知導(dǎo)致殘余信號e(n)的信號s(n),預(yù)測誤差。通過用殘余信號e(n)激勵A(yù)R模型來重建原始信號。
信號還要被擴(kuò)展到頻帶的上部。為了激勵該擴(kuò)展信號,殘余信號e(n)被殘余調(diào)節(jié)器模塊860擴(kuò)展,并被導(dǎo)向到一個合成器模塊870。另外,一個新的共振峰模塊850估計(jì)共振峰在較高頻率范圍中的位置,并且把這個信息轉(zhuǎn)發(fā)給合成器模塊870。合成器模塊870使用LPC參數(shù)、擴(kuò)展的殘余信號以及由新的共振峰模塊850提供的擴(kuò)展模型信息來產(chǎn)生從該系統(tǒng)中輸出的寬帶語音信號。
圖9說明了一種用于把殘余信號擴(kuò)展到較高頻率區(qū)域中的系統(tǒng),其可以符合在圖8中描述的殘余調(diào)節(jié)器模塊860。T殘余信號ei(n)被導(dǎo)向到音調(diào)估計(jì)模塊910,其例如基于誤差信號中的瞬態(tài)之間的距離來確定音調(diào)并且產(chǎn)生代表它的一個信號912。音調(diào)估計(jì)模塊910還要確定接收信號的語音內(nèi)容是否是一個濁音或者一個清音,并且產(chǎn)生表示它的一個信號。由音調(diào)估計(jì)模塊910關(guān)于作為濁音或清音的接收信號的特性而作出的判斷可以是一個雙擇判斷或者是表示一個相對概率(信號表示一個濁音或一個者清音)的一個軟判斷。殘余信號ei(n)還被引導(dǎo)到第一FFT模塊920來被轉(zhuǎn)變成頻域,以及被引導(dǎo)到一個開關(guān)950。第一FFT模塊920的輸出被導(dǎo)向到把信號修改為寬帶格式的一個調(diào)節(jié)器模塊930。T調(diào)節(jié)器模塊930的輸出被導(dǎo)向到一個反FFT(IFFT)模塊940,其輸出被導(dǎo)向到開關(guān)950。
如果音調(diào)估計(jì)模塊910確定感興趣的一個特定分段表示一個清音,那么它控制開關(guān)950來選擇直接用于輸入到合成器870去的殘留誤差(e)。相反,如果音調(diào)估計(jì)模塊910確定該分段表示一個濁音,那么開關(guān)950被控制來連接到調(diào)節(jié)器模塊930和IFFT模塊940的輸出,如此以致較高頻率內(nèi)容從而被確定。來自開關(guān)950中的輸出例如可以被引導(dǎo)到合成器870用于進(jìn)一步處理。
如圖8和圖9中所述的系統(tǒng)可用來實(shí)現(xiàn)駐留于高頻帶的兩個方法。在第一個方法中,調(diào)節(jié)器930通過把低頻帶殘余信號部分復(fù)制到高頻帶來在高頻帶中產(chǎn)生諧波峰值??梢酝ㄟ^在頻譜中找到超出平均頻譜的基波峰值和與頻率內(nèi)的電話頻帶相應(yīng)的上一峰值來對準(zhǔn)諧波峰值。在前后峰值之間的部分可以被復(fù)制到上一峰值的位置。這導(dǎo)致在高頻帶中同樣空出的峰值。雖然這種方法可能不會使峰值達(dá)到頻譜的末端(8kHz),但是該技術(shù)能夠被重復(fù)直到已經(jīng)達(dá)到頻譜的末端。
此過程的結(jié)果在圖13中被描述,它基本上反映了在高頻帶中同樣空出的峰值。因?yàn)樵?.6kHz附近地區(qū)中只有一個合成共振峰被附加,所以這里沒有能夠被在大約6kHz上的諧波激勵的共振峰模型。這種方法不在最終合成語音中產(chǎn)生任何人造品。取決于附加在AR模型計(jì)算中的噪聲數(shù)量,被擴(kuò)展的頻譜部分可能需要用隨增加頻率而衰減的一個函數(shù)來加權(quán)。
在第二種方法中,調(diào)節(jié)器模塊930使用音調(diào)周期來把新的諧波峰值定位在正確位置中。通過使用估計(jì)的音調(diào)周期,可計(jì)算諧波在較高頻帶中的位置,因?yàn)橹C波被認(rèn)為是多個基頻。此方法使其能夠產(chǎn)生與較高頻帶中的高次諧波相應(yīng)的峰值。
在全球移動通信系統(tǒng)(GSM)中,在移動電話和基站之間的傳輸是按照抽樣字塊的形式而被執(zhí)行的。在GSM中,字塊由相應(yīng)于20ms語音的160個抽樣組成。GSM中的字塊尺寸假定語音是一個準(zhǔn)穩(wěn)定的信號。本發(fā)明可以適合于符合GSM抽樣結(jié)構(gòu),因此使用相同的字塊尺寸。一個抽樣字塊被稱作一幀。在上抽樣之后,幀長度將成為320個抽樣并且用L表示。語音產(chǎn)生的AR模型模擬語音信號的一種方法是假定從已經(jīng)經(jīng)過一個濾波器的白噪聲源中已經(jīng)產(chǎn)生了信號。如果濾波器只由極組成,則該過程被稱作一個自動回歸過程。當(dāng)假定短時(shí)穩(wěn)態(tài)時(shí),此過程可能通過下列差分方程來描述。si(n)=Σk=1paiksi(n-k)+wi(n)------(1)]]>
在此,wi(n)是有單位方差的白噪聲,si(n)是該過程的輸出而p是模型排序。si(n-k)是該過程的舊輸出值而aik是相應(yīng)的濾波器系數(shù)。下標(biāo)i被用來指示該算法是以處理時(shí)間變化數(shù)據(jù)字決為基礎(chǔ)的,在此i是字塊編號。該模型假定在當(dāng)前字塊中期間信號是穩(wěn)定的。在z域中相應(yīng)的系統(tǒng)函數(shù)可以被表示為Hi(z)=11-Σk=1paikz-k=1Ai(Z)------(2)]]>在此Hi(z)是系統(tǒng)的轉(zhuǎn)送函數(shù)而Ai(z)被稱作預(yù)測值。該系統(tǒng)只由極組成并且不完全地模擬語音,但是已經(jīng)說明當(dāng)聲音設(shè)備近似作為一個較小損耗的管級聯(lián)時(shí),轉(zhuǎn)送函數(shù)將與AR模型匹配。AR模型的系統(tǒng)函數(shù)的倒數(shù),一個全零函數(shù)為1Hi(z)=1+Σk=1paikz-k=Ai(Z)------(3)]]>它被稱作預(yù)測濾波器。這是從[si(n),...,Si(n-p+1)的上一次p+1值而來的si(n+1)的一步預(yù)測。從信號si(n)中減去的稱為 的預(yù)測信號產(chǎn)生預(yù)測誤差ei(n),它有時(shí)被稱為殘余。即使這個近似未完成,它也提供有關(guān)語音信號的有價(jià)值的信息。在該模型中鼻腔和鼻孔已經(jīng)被省略。如果AR模型的階被選擇為十分高,那么AR模型將提供語音信號的一個有用近似。窄帶語音信號可以用一個八(8)階來模擬。
AR模型可用于在短期基礎(chǔ)上模擬語音信號,即,典型的10-30ms的持續(xù)時(shí)間段,在此,語音信號被認(rèn)為是穩(wěn)定的。AR模型估計(jì)一個具有近似語音信號si(n)的脈沖響應(yīng) 的全極濾波器。脈沖響應(yīng) 是系統(tǒng)函數(shù)H(z)的反z變換。在模型和語音信號之間的誤差,e(n)能因此被定義為ei(n)=si(n)-s^i(n)-s^i(n)-si(n)-Σk=1paik(i)si(n-k)-----(4)]]>
這里有好幾種方法用于尋找AR模型的系數(shù),aik。自相關(guān)方法產(chǎn)生系數(shù),其最小化ϵ(i)=Σn=0L+p-1|ei(n)|2-----(5)]]>在此L是數(shù)據(jù)長度??偤推鹗加诹愣Y(jié)束于L+p-1。這假定數(shù)據(jù)是L個可用數(shù)據(jù)之外的零并且通過把si(n)乘以一個矩形窗口而被完成。把導(dǎo)致解決一組線性方程的誤差函數(shù)最小化 在此,rsi(k)表示窗口數(shù)據(jù)(n)的自相關(guān)而aik是AR模型的系數(shù)。
方程式6可以按照好幾種不同的方法來解答,一種方法是Levinson-Durbin遞歸,它是以系數(shù)矩陣是Toeplitz的事實(shí)為基礎(chǔ)的。如果每個對角線中的元素有相同的數(shù)值的話,則一個矩陣是Toeplitz。此方法很快速并且既產(chǎn)生濾波器系數(shù)aik又產(chǎn)生反射系數(shù)。當(dāng)利用一個點(diǎn)陣結(jié)構(gòu)來實(shí)現(xiàn)AR模型時(shí),反射系數(shù)被使用。當(dāng)在定點(diǎn)環(huán)境(其經(jīng)常是移動電話中的情況)中實(shí)現(xiàn)一個濾波器時(shí),應(yīng)該考慮濾波器系數(shù)量化的不靈敏性。點(diǎn)陣結(jié)構(gòu)點(diǎn)陣結(jié)構(gòu)對這些影響是遲鈍的并且因此比直接形式實(shí)施更適合。用于找到反射系數(shù)的更有效方法是Schur的遞歸,它只產(chǎn)生反射系數(shù)。音調(diào)確定在音調(diào)周期可以被估計(jì)之前,語音段性質(zhì)必須被確定。在下面描述的預(yù)測器導(dǎo)致一個殘余信號。分析殘余語音信號能夠顯示該語音段表示一個濁音還是一個清音。如果語音段表示一個清音,那么殘余信號將類似噪聲。相反,如果殘余信號由一串脈沖組成,那么它可能表示一個濁音??梢砸栽S多方法來實(shí)行此分類,并且因?yàn)橐粽{(diào)周期也需要被確定,所以同時(shí)能夠估計(jì)兩者的一種方法是優(yōu)選的。這樣的一個方法是以如下被定義的殘余信號的短時(shí)間標(biāo)準(zhǔn)自動相關(guān)函數(shù)為基礎(chǔ)的Rie(l)=1Rie(0)Σn=0L-1-1ei(n)ei(n+l)-----(7)]]>在此,n是具有標(biāo)引i的幀中的抽樣數(shù),而1是偏移。當(dāng)Rie(1)的最大值在音調(diào)范圍之內(nèi)并且超出一個門限值時(shí),語音信號被分類為濁音。語音的音調(diào)范圍是50-800Hz,它對應(yīng)20-320抽樣范圍中的1。圖10示出了一個濁音幀的短時(shí)間自相關(guān)函數(shù)。一個峰值在偏移72周圍清楚可見。峰值在多倍基頻處也是可見的。
適合于分析殘余信號的另一算法是平均幅度差值函數(shù)(AMDF)。這種方法有一個相對低的計(jì)算復(fù)雜性。這種方法也使用殘余信號。AMDF的定義為AMDFi(l)=1LΣn=0L-1|ei(n)-ei(n-l)|------(8)]]>此函數(shù)在與音調(diào)周期相應(yīng)的偏移處具有一個本地最小值。當(dāng)本地最小值的數(shù)值低于一個可變門限時(shí),該幀被分類為濁音。此方法至少需要兩個音調(diào)周期的一個數(shù)據(jù)長度來估計(jì)音調(diào)周期。圖11示出了一個濁音幀的AMDF函數(shù)的曲線,可以看到好幾個本地最小值。音調(diào)周期大約是72個抽樣,這意味著當(dāng)抽樣頻率是16kHz時(shí)基頻是222Hz。增加一個合成共振峰增加合成諧振頻率的各種方法已經(jīng)被估計(jì)。所有這些方法用一個濾波器模擬合成共振峰。AR模型具有一個如下形式的轉(zhuǎn)送函數(shù)Hi(z)=11-Σk=1paikz-k------(9)]]>它可以再用形式被表示為Hi(z)=1(1-Σk=1p-2aik1z-k)-11+ai(p-1)1z-1+ai11z-2=Hi1(z)·Hi2(z)---(10)]]>在此aik表示兩個新的AR模型系數(shù)。正如圖12中所說明的,一個濾波器能夠被分成兩個濾波器。Hi1(z)表示從電流語音段中計(jì)算出的AR模型而Hi2(z)表示新的合成共振峰濾波器。
在一個方法中,合成共振峰(組)由一個復(fù)共扼極對(complexconjugate pole pair)來表示。轉(zhuǎn)送函數(shù)Hi2(z)然后可以被下列方程式定義Hi2(z)=b01-2vcos(ωs)+v2---(11)]]>在此,υ是半徑而ω5是極的角度。參數(shù)b0可用來設(shè)置濾波器放大系數(shù)的基本級。放大系數(shù)的基本級可以被設(shè)置為1以避免影響低頻信號。這可以通過把b0設(shè)置等于Hi2(z)分母中的系數(shù)總和來達(dá)到。合成共振峰能夠以半徑為0.85并且角度為0,58π來被設(shè)置。參數(shù)b0然后將是2.1453。如果此合成共振峰被加到窄帶語音信號上估計(jì)的AR模型,那么結(jié)果的轉(zhuǎn)送函數(shù)將不合有一個顯著的合成共振峰峰值。取而代之的是,AFA功能轉(zhuǎn)送函數(shù)將升高頻率在范圍2.0-3.4kHz中。合成共振峰不顯著的原因是由于AR模型中大的幅度電平差,通常為60-80dB。增強(qiáng)修改的信號以使共振峰達(dá)到一個精確的幅度電平減少了共振峰帶寬并且把低頻帶中的較高頻率放大了一些dB。這在圖13中被說明其中,虛線1310表示增加一個合成共振峰之前的粗略頻譜結(jié)構(gòu)。實(shí)線1320表示在增加一個合成共振峰之后的頻譜結(jié)構(gòu),它在大約4.6kHz處產(chǎn)生一個小峰值。
因此,使用一個復(fù)共扼極對的一個共振峰濾波器使得難以讓共振峰濾波器表現(xiàn)類似一個普通共振峰。如果在AR模型參數(shù)的估計(jì)之前高通帶濾波器白噪聲被加到話音信號上,那么AR模型將模擬噪聲和語音信號。如果AR模型的階保持不變(例如,階八),則某些共振峰可能被不充分估計(jì)。當(dāng)AR模型的階被增加以使它可以模擬較高頻帶中的噪聲而不妨礙低頻帶語音信號的模擬時(shí),獲得一個更好的AR模型。這將使合成共振峰出現(xiàn)更像一個普通共振峰。這在圖14中被說明其中,虛線1410表示增加一個合成共振峰之前的粗略頻譜結(jié)構(gòu)。實(shí)線1420表示在增加一個合成共振峰之后的頻譜結(jié)構(gòu),它在大約4.6kHz處產(chǎn)生一個小峰值。
圖15說明了在對語音信號增加噪聲與沒有對語音信號增加噪聲所計(jì)算出的AR模型之間的區(qū)別。參見圖15,實(shí)線1510表示確定為第十四階的窄帶語音信號的一個AR模型。虛線1520表示確定為第十四階并用高通濾波器噪聲補(bǔ)充的窄帶語音信號的一個AR模型。虛線1530表示確定為第八階的窄帶語音信號的一個AR模型。
解決這問題的另一方法是使用一種更復(fù)雜的共振峰濾波器。濾波器可以由好幾個復(fù)共扼極對和零來構(gòu)成。使用一個更復(fù)雜的合成共振峰濾波器增加了控制濾波器中極半徑以及實(shí)行有關(guān)濾波器的其他要求(比如獲得在低頻處的單位增益)的難度。
為了控制合成共振峰濾波器的極半徑,濾波器應(yīng)該保持簡單。在現(xiàn)有的較低頻率共振峰和新的合成共振峰的半徑之間的一個線性相關(guān)性可以根據(jù)如下來確定υ1α1+υ2α2+υ3α3+υ4α4=υω5(12)在此,υ1υ2υ3和υ4是來自窄帶語音信號中的AR模型中的共振峰半徑。參數(shù)αm,m=1,2,3,4是線性系數(shù)。參數(shù)υω5是寬帶語音信號的AR模型的合成的第五共振峰的半徑。如果好幾個AR模型被使用,那么方程式12可以可以表示成r11r12r13r14r21r22r23r24............rk1rk2rk3rk4α1α2α3α4=r15wr25w...rk5w-----(13)]]>在此,υ是共振峰半徑并且第一標(biāo)引表示AR模型編號,第二標(biāo)引表示共振峰編號而最右邊向量中的第三標(biāo)引w表示來自寬帶語音信號中被估計(jì)的共振峰,并且k是AR模型的編號。這些方程式的這個系統(tǒng)由多種因素確定并且可以借助于偽倒置計(jì)算出最小平方解決方案。所獲得的解決方案然后被用于計(jì)算新的合成共振峰的半徑為v^i5=ri1α1+ri2α2+ri3α3+ri4α4-----(14)]]>在此,υi5是新的合成共振峰半徑并且α參數(shù)是方程式系統(tǒng)13的解決方案。在上面參考特定實(shí)施例描述了本發(fā)明,并且對本領(lǐng)域技術(shù)人員來說很明顯,可按照除上述的優(yōu)選實(shí)施例之外的其他具體形式來把本發(fā)明具體表達(dá)。在上面描述的詳細(xì)實(shí)施例只是說明性的并且不應(yīng)該以任何方式被認(rèn)為是限定的。本發(fā)明的范圍由隨后的權(quán)利要求來確定,并且落在權(quán)利要求之內(nèi)的所有變化和等價(jià)物意指包含在其中。
權(quán)利要求
1.一種用于處理語音信號的方法,該方法包括如下步驟分析一個接收窄帶信號以便確定合成的高頻帶內(nèi)容;使用所述接收窄帶信號再生所述語音信號的一個低頻帶;和把所述再生的低頻帶與確定的合成的高頻帶進(jìn)行合并以便產(chǎn)生一個具有合成分量的寬帶語音信號。
2.如權(quán)利要求所述的方法,其中,所述接收窄帶信號提供在大約0-4kHz范圍內(nèi)的信息內(nèi)容并且所述合成的高頻帶內(nèi)容是在大約4-8kHz范圍內(nèi)。
3.如權(quán)利要求1所述的方法,其中,分析步驟還包括如下步驟對接收窄帶信號執(zhí)行一個頻譜分析以便確定與語音模型和殘留誤差信號相關(guān)的參數(shù);確定與殘留誤差信號相關(guān)的一個音調(diào);識別與接收窄帶信號相關(guān)的峰值;和根據(jù)確定的音調(diào)和識別的峰值中的至少一個把來自接收窄帶信號中的信息復(fù)制到一個高頻帶中以便提供合成的高頻帶內(nèi)容。
4.如權(quán)利要求3所述的方法,其中,執(zhí)行頻譜分析的步驟使用一個AR預(yù)測器。
5.如權(quán)利要求4所述的方法,其中,執(zhí)行頻譜分析的步驟使用一個正弦曲線模型。
6.如權(quán)利要求1所述的方法,還包括選擇性地放大所述寬帶信號的一個預(yù)確定頻率范圍的步驟。
7.如權(quán)利要求1所述的方法,還包括把所述寬帶信號轉(zhuǎn)換為一個模擬格式的步驟。
8.如權(quán)利要求7所述的方法還包括如下步驟對所述寬帶信號進(jìn)行放大。
9.一種用于處理語音信號的系統(tǒng),包括裝置,用于分析一個接收窄帶信號以便確定合成的高頻帶內(nèi)容;裝置,用于使用所述接收窄帶信號再生所述語音信號的一個低頻帶;和裝置,用于把所述再生的低頻帶與確定的合成的高頻帶進(jìn)行合并以便產(chǎn)生一個具有合成分量的寬帶語音信號。
10.如權(quán)利要求9所述的系統(tǒng),其中,用于分析一個接收窄帶信號以便確定合成的高頻帶內(nèi)容的裝置包括一個參量頻譜分析模塊,用于分析窄帶信號的共振峰結(jié)構(gòu)并且產(chǎn)生描述該窄頻帶語音信號的參數(shù)和一個誤差信號;一個音調(diào)判斷模塊,用于確定由窄帶信號表示的聲音段的音調(diào);和一個殘余擴(kuò)展器和復(fù)制模塊,用于處理從窄帶語音信號中得到的信息并產(chǎn)生一個合成的高頻帶信號分量。
11.如權(quán)利要求10所述的系統(tǒng),其中,所述殘余擴(kuò)展器和復(fù)制模塊包括一個快速傅里葉變換模塊,用于把來自參量頻譜分析模塊中的誤差信號轉(zhuǎn)換成為頻域;一個峰值檢波器,用于識別誤差信號的諧波頻率;和一個復(fù)制模塊,用于把由峰值檢波器識別的峰值復(fù)制到較高頻率范圍中。
12.如權(quán)利要求11所述的系統(tǒng),其中,所述殘余擴(kuò)展器和復(fù)制模塊還包括一個用于產(chǎn)生合成的清音語音內(nèi)容的模塊。
13.如權(quán)利要求12所述的系統(tǒng),其中,所述殘余擴(kuò)展器和復(fù)制模塊還包括一個合并器,用于把來自復(fù)制模塊中的一個輸出信號和來自用于產(chǎn)生合成的清音語音內(nèi)容的模塊中的一個輸出進(jìn)行合并。
14.如權(quán)利要求13所述的系統(tǒng),其中,所述殘余擴(kuò)展器和復(fù)制模塊還包括一個增益控制模塊,用于把合并器中的輸入信號加權(quán)。
15.如權(quán)利要求13所述的系統(tǒng),其中,所述殘余擴(kuò)展器和復(fù)制模塊還包括一個快速傅里葉變換模塊,用于把來自所述參量頻譜分析模塊中的誤差信號從頻域轉(zhuǎn)換成為時(shí)域。
16.如權(quán)利要求9所述的系統(tǒng),其中,使用接收窄帶信號來用于再生所述語音信號的一個低頻帶的裝置包括一個參量頻譜分析模塊,用于分析所述窄帶信號的共振峰結(jié)構(gòu)并且產(chǎn)生描述所述窄帶語音信號和一個誤差信號的參數(shù);和一個合成濾波器。
17.一種用于在接收機(jī)處處理一個窄帶語音信號的系統(tǒng),包括一個上抽樣器,其接收窄帶語音信號并且增加抽樣頻率以便產(chǎn)生具有一個增加頻譜的一個輸出信號;一個參量頻譜分析模塊,其接收來自上抽樣器中的輸出信號并且分析該輸出信號以便產(chǎn)生與一個語音模型和一個殘留誤差信號相關(guān)的參數(shù);一個音調(diào)判斷模塊,其接收來自參量頻譜分析模塊中的殘留誤差信號并且產(chǎn)生表示該語音信號音調(diào)的一個音調(diào)信號和表示該語音信號是濁音語音或者是清音語音的一個指示信號;和一個殘余擴(kuò)展器和復(fù)制模塊,其接收并處理該殘留誤差信號和該音調(diào)信號以便產(chǎn)生一個合成的高頻帶信號分量。
18.如權(quán)利要求17所述的系統(tǒng),還包括一個合成濾波器,其接收來自所述參量頻譜分析模塊中的參數(shù)以及從殘留誤差信號中得到的信息,并且產(chǎn)生與所述窄帶語音信號對應(yīng)的一個寬帶信號。
19.如權(quán)利要求17所述的系統(tǒng),其中,來自所述音調(diào)判斷模塊中的指示信號控制連接到所述合成濾波器一個輸入端的一個開關(guān),如此以致如果所述指示信號表示該語音信號表示濁音語音時(shí),那么合成濾波器的輸入被連接到殘余擴(kuò)展器和復(fù)制模塊的輸出,并且如果指示信號指示所述語音信號表示清音語音,那么合成濾波器的輸入被連接到從所述參量頻譜分析模塊中輸出殘留誤差信號。
全文摘要
一種用于語音信號增強(qiáng)的系統(tǒng)和方法在接收機(jī)處對一個窄帶語音信號進(jìn)行上抽樣以便產(chǎn)生一個寬帶語音信號。使用接收的窄帶語音信號來再生寬帶語音信號的較低頻率范圍。接收的窄帶語音信號被分析以便確定它的共振峰和音調(diào)信息。使用從接收的窄帶語音信號中得到的信息來合成寬帶語音信號的較高頻率范圍。
文檔編號G10L21/02GK1397064SQ01804286
公開日2003年2月12日 申請日期2001年1月17日 優(yōu)先權(quán)日2000年1月28日
發(fā)明者U·林格倫, H·古斯塔夫松, P·多伊特根, C·圖爾班 申請人:艾利森電話股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1