專利名稱:音頻速度變換的方法和系統(tǒng)的制作方法
背景背景信息在視頻和/或音頻再現(xiàn)系統(tǒng)中,如彩色電視系統(tǒng)(CTV),磁帶錄相機(jī)(VTRs),數(shù)字視頻/多功能盤(DVD)系統(tǒng),激光唱盤(CD)播放機(jī),助聽器,電視應(yīng)答機(jī)等,速度變換系統(tǒng)可用于進(jìn)行多種速度操作(例如,快速,慢速等)。傳統(tǒng)的音頻速度變換器一般是在一種音頻信號內(nèi)的無聲的時(shí)間間隔和聲音時(shí)間間隔之間進(jìn)行區(qū)分。刪除無聲間隔并壓縮聲音間隔使音頻速度增加。相反,擴(kuò)大無聲和聲音的間隔使音頻速度降低。許多傳統(tǒng)的音頻速度變換器按恒定的速率增加或降低音頻速度而同聲音的內(nèi)容無關(guān)。因此,這種類型的音頻速度變換器不可能充分利用音頻信號的無聲和冗余間隔。
對音頻信號進(jìn)行清除或重復(fù)時(shí)間間隔的處理因?yàn)槌3.a(chǎn)生不希望的“卡搭”聲而可能成為麻煩。此外,不應(yīng)當(dāng)改變音頻信號的間距或?qū)⑺兂善渌念l率,因?yàn)槿说穆犃@些變化趨向于相當(dāng)靈敏。已知的現(xiàn)有算法,如“指針間隔控制重疊和相加”(PICOLA)算法,討論了這些問題。這種算法是通過音頻信號乘以一種窗函數(shù)試圖平滑輸出信號并保持其初始間距。但是它產(chǎn)生合成波形,而這種合成波形并非初始音頻信號部分。而且,使用這種算法典型地要求采用趨于昂貴的快速數(shù)字信號處理器(DSP)。因此,希望提供一種音頻速度變換器,這種變換器避免使用昂貴的數(shù)字信號處理器(DSP),而是利用諸如小型可編程邏輯裝置(PLD)的更為成本有效的處理裝置。
概述根據(jù)本發(fā)明的一個(gè)方面,一種處理音頻信號的系統(tǒng)包括接收音頻信號并將該接收后的音頻信號分成一個(gè)或多個(gè)單個(gè)的單元周期的裝置以及通過重復(fù)和清除一個(gè)或多個(gè)該單個(gè)單元周期的一種操作實(shí)施音頻速度變換操作的裝置。
根據(jù)本發(fā)明的另一個(gè)方面,一種處理音頻信號的方法包括如下步驟接收音頻信號,將接收的音頻信號分成一個(gè)或多個(gè)單個(gè)的單元周期,通過重復(fù)和清除一個(gè)或多個(gè)單個(gè)單元周期的一種操作實(shí)施音頻速度變換操作。
附圖簡述附圖中
圖1是按照本發(fā)明原理構(gòu)造的一種音頻速度變換器;圖2是按照本發(fā)明原理的一種典型的輸入音頻信號的一個(gè)單個(gè)單元周期;圖3是展示根據(jù)本發(fā)明原理的一種典型的音頻信號的波形;圖4是展示根據(jù)本發(fā)明原理的一種典型的音頻信號的一種聲音間隔周期性的波形;圖5是展示根據(jù)本發(fā)明原理探測聲音間隔和間距期的一個(gè)實(shí)例的波形序列;圖6是展示根據(jù)本發(fā)明原理的音頻信號壓縮和擴(kuò)大實(shí)例的波形序列;此處列舉的例證顯示本發(fā)明的優(yōu)選實(shí)施方案,但這些例證并不以任何方式構(gòu)成對本發(fā)明范圍的限制。
優(yōu)選實(shí)施方案說明本申請公開了一種用于處理音頻信號的系統(tǒng)和方法,它相對于傳統(tǒng)技術(shù)具有優(yōu)越性。根據(jù)一種典型性系統(tǒng)和一種典型性方法,諸如數(shù)字語音信號的音頻信號被接收和分成一個(gè)或多個(gè)單個(gè)單元周期。通過重復(fù)或清除一個(gè)或多個(gè)單元周期可以進(jìn)行音頻速度變換。特別地,重復(fù)一個(gè)或多個(gè)單個(gè)單元周期降低音頻速度,而清除一個(gè)或多個(gè)單個(gè)的單元周期增加音頻速度。按照一種優(yōu)選實(shí)施方案,根據(jù)參考值所接收的音頻信號被分割成一個(gè)或多個(gè)單個(gè)的單元周期,使之單個(gè)單元周期在該接收音頻信號等于或大于該參考值的第一個(gè)樣本處開始,而在被接收音頻信號小于參考值的最后一個(gè)樣本處結(jié)束。
該方法還可以包括步驟用以判斷一個(gè)或多個(gè)單個(gè)單元周期的每一個(gè)是否對應(yīng)于一個(gè)無聲間隔。這種判斷可以定制成對一個(gè)或多個(gè)單個(gè)單元周期的每一個(gè)的平均功率值相關(guān)。按照一種優(yōu)選實(shí)施方案,一個(gè)或多個(gè)單個(gè)單元周期的每一個(gè)的平均功率值根據(jù)一個(gè)或多個(gè)單個(gè)單元周期的每一個(gè)的平均幅度加以確定。該方法也可以包括探測該接收信號中的一個(gè)或多個(gè)間距期,其中該一個(gè)或多個(gè)間距期的每一個(gè)包括一個(gè)或多個(gè)單個(gè)單元周期。這種探測可以同一個(gè)或多個(gè)單個(gè)單元周期的每一個(gè)的平均功率值有關(guān)。在此還提供一種用以完成上述方法的音頻速度變換系統(tǒng)。
現(xiàn)在參照附圖,具體而言參照圖1,展示一種根據(jù)本發(fā)明原理制造的音頻速度變換器10。圖1中,音頻速度變換器10包括接收輸入音頻信號的零交叉探測器11。該零交叉探測器11對輸入音頻信號采樣,然后將采樣到的值同零參考值進(jìn)行比較。大于或等于零參考值的采樣值對應(yīng)于正輸入信號,小于零參考值的采樣值對應(yīng)于負(fù)輸入信號。如以后將要討論的那樣,輸入信號被分割成一系列的單個(gè)單元周期波形。
絕對值計(jì)算器12接收來自零交叉探測器11的輸入音頻信號的采樣值,并計(jì)算每一采樣值的絕對值。平均功率值(P)發(fā)生器13接收由絕對值發(fā)生器12計(jì)算出來的絕對值,并根據(jù)該絕對值對輸入音頻信號的每個(gè)周期計(jì)算平均功率值。根據(jù)本發(fā)明的原理,重要的是計(jì)算單-單元周期波形的這種平均功率值(P),而不是象許多傳統(tǒng)的音頻速度變換器那樣計(jì)算包含固定數(shù)樣本的一個(gè)單幀的平均功率值。根據(jù)一種優(yōu)選實(shí)施方案,平均功率值(P)是依據(jù)平均幅度值加以計(jì)算。即是說,該平均功率值(P)等于該樣本值之和除以一個(gè)周期內(nèi)的樣本總數(shù)。按照這種方式對輸入音頻信號的每一周期計(jì)算平均功率值(P)。
無聲探測器14接收來自平均功率值(P)發(fā)生器13的平均功率值(P),然后進(jìn)行比較運(yùn)算以確定是否每個(gè)周期對應(yīng)于一個(gè)無聲間隔。尤其是,該無聲探測器14將每個(gè)平均功率值(P)同一參考閾值進(jìn)行比較。在對應(yīng)于無聲間隔的一個(gè)或多個(gè)周期被識別之后,在某些方式中可以采用無聲冗余度探測器15來計(jì)算該無聲間隔的持續(xù)時(shí)間,并且按照本發(fā)明的原理對該無聲間隔進(jìn)行擴(kuò)大或壓縮。有關(guān)間隔擴(kuò)大和壓縮的進(jìn)一步細(xì)節(jié)將在以后提供。作為選擇,在一個(gè)或多個(gè)不與無聲間隔相對應(yīng)的周期被識別之后,聲音探測器和間距期探測器16探測輸入音頻信號中的聲音間隔,然后進(jìn)一步探測不同間距期的起點(diǎn)。間距冗余度探測器17根據(jù)本發(fā)明的原理探測間距期中的冗余度。有關(guān)聲音間隔和間距期探測的進(jìn)一步細(xì)節(jié)將在下面討論。
控制電路18控制音頻速度變換器10的總的操作。例如,控制電路18使來自音頻變換器10的輸出儲存在內(nèi)部緩沖存儲器19內(nèi)或諸如硬盤,隨機(jī)存取存儲器(RAM),光盤或其他外部存儲器的外部存儲器裝置20內(nèi)??刂齐娐?8還能使來自音頻變換器10的輸出傳送到諸如揚(yáng)聲器或其他設(shè)備的外部設(shè)備21上,并能接收有關(guān)操作方式的輸入信號。如以后將要討論的那樣,圖1的這種音頻速度變換器10有著三種不同的操作方式快速方式,慢速方式,和待機(jī)方式。
有關(guān)按照本發(fā)明的原理制造的該音頻速度變換器10的操作的進(jìn)一步細(xì)節(jié)將在下面參照圖1至圖6加以提供。
如前面所示,在圖1中音頻速度變換器10的零交叉探測器11接收輸入的音頻信號。根據(jù)一種優(yōu)選的實(shí)施方案,該輸入的音頻信號是一種10比特(位)的數(shù)字信號。但是,可以設(shè)想,根據(jù)本發(fā)明的原理也可以接納其他比特長度的輸入信號。零交叉探測器11對輸入的音頻信號采樣,然后將采樣值同零參考值進(jìn)行比較。根據(jù)一種優(yōu)選實(shí)施方案,該零參考值為512。但是可以設(shè)想,根據(jù)本發(fā)明的原理也可以采用其他的零參考值。和前面提示的那樣,輸入音頻信號被分割成一系列單一單元周期波形。
現(xiàn)在參照圖2,展示一種典型性輸入音頻信號的單一周期30的原理圖。圖2中,點(diǎn)代表由圖1的零交叉探測器11采樣的點(diǎn),數(shù)(即1000,560,470,24)代表某種樣本的可能值(假定分辨率為10比特)。如前面提示的那樣,該零交叉探測器11使用優(yōu)選實(shí)施方案中的零參考值512,該值是最大值1024(假定分辨率為10比特)的一半。因此,大于或等于512的采樣值對應(yīng)于正輸入信號,而小于512的采樣值對應(yīng)于負(fù)輸入信號。通過將采樣值同零參考值比較,可以將輸入信號分成如圖2中所示之一的一系列單一單元周期波形。根據(jù)本發(fā)明的原理,該輸入音頻信號的單一單元周期是從正半波(值≥512)的第1樣本到負(fù)半波(值<512)的最后一樣本。這樣一種周期是音頻速度變換器10消除或重復(fù)的最小信號單元。如以后將要討論的那樣,圖1中的音頻速度變換器10僅僅刪除或重復(fù)該輸入音頻信號的完整單元周期。這種方法的優(yōu)點(diǎn)在于信號的刪除或插入總是發(fā)生在零交叉點(diǎn),因此避免了輸出音頻信號中的任何卡搭聲。用這種方式,本發(fā)明便于提供包括實(shí)際音頻信息的輸出音頻信號而沒有合成波形。在傳統(tǒng)的“指針間隔控制重疊和相加”(PICOLA)算法中,輸入音頻信號被乘以一窗函數(shù),因而產(chǎn)生了一種不屬于初始音頻信號的合成波形。
再參照圖1,絕對值計(jì)算器12接收來自零交叉探測器11的輸入音頻信號的采樣值,然后計(jì)算每一樣本的絕對值。平均功率值(P)計(jì)算器13接收由絕對值計(jì)算器12計(jì)算出來的絕對值,然后根據(jù)該絕對值對輸入音頻信號的每個(gè)周期計(jì)算平均功率值(P)。根據(jù)本發(fā)明的原理,重要的是計(jì)算單一周期波形的平均功率值(P),而不是象許多傳統(tǒng)的音頻速度變換器那樣計(jì)算包含固定數(shù)樣本的一個(gè)單幀的平均功率值。根據(jù)一種優(yōu)選實(shí)施方案,平均功率值(P)是依據(jù)平均幅度值加以計(jì)算的。即是說,該平均功率值(P)等于樣品值之和除以一個(gè)周期內(nèi)的樣本總數(shù)。按照這種方式,對輸入音頻信號的每個(gè)周期計(jì)算平均功率值(P)。
無聲探測器14接收來自平均功率值(P)發(fā)生器13的平均功率值(P),然后進(jìn)行比較運(yùn)算以確定是否每個(gè)周期對應(yīng)于一個(gè)無聲間隔。特別地,該無聲探測器14將每一平均功率值(P)同參考閾值PSIL進(jìn)行比較,該值可以根據(jù)設(shè)計(jì)選擇加以設(shè)定。如果P<PSIL,則對應(yīng)的周期被識別為無聲間隔,而當(dāng)P≥PSIL,則對應(yīng)的周期被識別為不是無聲間隔(即它包含有可辨認(rèn)的聲音)。在P<PSIL的情況下,無聲冗余度探測器15可以用于某種方式中以計(jì)算該無聲間隔的持續(xù)時(shí)間并且根據(jù)本發(fā)明的原理擴(kuò)大或壓縮該無聲間隔。有關(guān)該操作的進(jìn)一步細(xì)節(jié)將在下面提供。
參照圖3,示出一種典型音頻信號的波形40的原理圖。圖3的波形40可以使輸入音頻信號接近圖1的音頻速度變換器10。在圖3中,音頻信號波形40展示三種不同的間隔類型無聲間隔,準(zhǔn)聲音間隔,和聲音間隔。無聲間隔主要包括本底噪聲,是一種具有低而恒定平均功率的很低波幅。當(dāng)圖1的音頻速度變換器10處于快速方式時(shí),無聲冗余探測器15可以通過清除該無聲間隔部分將無聲間隔加以壓縮。例如,圖3中如果該無聲間隔長,則可以清除等于TSIL-TTH的間隔。圖3中的閾值時(shí)間TTH是一種在無聲間隔可以被壓縮之前必須經(jīng)過的延遲時(shí)間。用這種方法,由該音頻信號所代表的聲音(例如說話)可以更好地使聽話人明白。
此外,當(dāng)圖1的音頻速度變換器10為慢速方式時(shí),無聲冗余度探測器15可以將該無聲間隔擴(kuò)大一個(gè)等于TSIL-REF-TSIL的預(yù)定時(shí)間間隔。參數(shù)TSIL-REF-限制了無聲間隔的最大增大時(shí)間。而且,這一參數(shù)使一個(gè)初始長的間隔的擴(kuò)大小于一個(gè)初始較短的間隔的擴(kuò)大。用這種方法,說得快的詞可以更好地被聽話人明了。如果無聲間隔長到足以使TSIL- REF-TSIL的結(jié)果為負(fù)值,則不會產(chǎn)生擴(kuò)大,因?yàn)橥ǔR褯]有必要去擴(kuò)大業(yè)已很長的無聲間隔。
如圖3波形40所示,準(zhǔn)聲音間隔表現(xiàn)出比無聲間隔更大的幅度,并且典型地在性質(zhì)上有著不斷變化的隨機(jī)性。由于這些頻繁的變化,準(zhǔn)聲音間隔趨于表現(xiàn)出相對低的周期性(即冗余度)。聲音間隔有著三種間隔中最大的幅度,并且具有周期性結(jié)構(gòu)。由于這種周期性,聲音間隔表現(xiàn)出某種程度的周期性。準(zhǔn)聲音間隔和聲音間隔都可以代表語音信息。
參照圖4,它是展示一種典型性音頻信號的音頻間隔周期性原理圖。特別地,圖4的波形50展示從T1至T4的4種間距期。如圖4所示,間距期由音頻信號的聲音間隔中的周期性(即冗余度)所定義。聲音間隔中的這種冗余度可以用于增大音頻速度。例如,圖4中通過從波形50清除第2和第3間距期T2和T3可以增大音頻速度。相反,重復(fù)波形50中的第2和第3間距期T2和T3可以降低音頻速度。
再參照圖1,當(dāng)無聲探測器14確認(rèn)對一給定周期P≥PSIL,該周期被傳送給聲音探測器和間距期探測器16做進(jìn)一步處理。特別地,該聲音探測器和間距期探測器16探測如圖3波形40中所示的一種聲音間隔,并且進(jìn)而探測如圖4的波形50中所示的間距期的起點(diǎn)。有關(guān)這種操作的進(jìn)一步細(xì)節(jié)將在以下提供。
參照圖5,它示出了一系列波形,這些波形展示根據(jù)本發(fā)明的原理探測聲音間隔和間距期的實(shí)例。圖5中,波形60顯示一種有著間距期T1至T4的輸入音頻信號實(shí)例。每一間距期包括一個(gè)或多個(gè)周期。例如,圖5中間距期T1包括周期Cy2,Cy3和Cy4。間距期T2包括周期Cy5,Cy6和Cy7。間距期T3包括周期Cy8,Cy9和Cy10。間距期T4包括周期Cy11,Cy12和Cy13。包含在間距期T1至T4內(nèi)的周期數(shù)目分別用值N1至N4表示。波形61展示與不同周期相對應(yīng)的平均幅度值。特別地,周期Cy1至Cy13分別具有平均功率值P1至P13。注意,圖5中所有的平均功率值P1至P13都在圖中用點(diǎn)線表示的無聲閾值PSIL之上。
如波形60所示,周期Cy2,Cy5,Cy8和Cy11每個(gè)代表由圖1的聲音探測器和間距期探測器16所探測到的一給定間距期的起點(diǎn)。這種探測可以通過平均功率值啟動。即是說,對應(yīng)于周期Cy2,Cy5,Cy8和Cy11的平均功率值P2,P5,P8和P11高于其他周期的平均功率值。因此,功率(例如幅度)值對于探測間距期的起點(diǎn)是一種有用的判據(jù)。因?yàn)橄笳Z音信號的某些音頻信號由于它們的功率值隨時(shí)間變化而是動態(tài)的,則用于探測間距期的參考水平(即參考值)也應(yīng)該是隨時(shí)間變化的并且應(yīng)跟隨輸入音頻信號改變。因此,本發(fā)明使用這樣一種參考值來探測間距期,其中一個(gè)周期的參考值依賴于前一周期的平均功率值。根據(jù)一種優(yōu)選實(shí)施方案,一個(gè)給定周期的參考值被設(shè)定等于剛好前面一個(gè)周期的平均功率值乘以一個(gè)其值為1至2的常數(shù)。因此,假定對一個(gè)該常數(shù)等于1.5的實(shí)例,將功率值P2同1.5倍的P1功率值進(jìn)行比較。類似地,功率值P3同1.5倍的P2功率值進(jìn)行比較。用這種方法,用來探測間距期的參考值從一個(gè)周期到另一個(gè)周期的變化,并且準(zhǔn)確地跟隨諸如語音信號的音頻信號的動態(tài)變化。因此,根據(jù)本發(fā)明的原理,如果一個(gè)周期的平均幅度值大于或等于它的參考值,則該周期被識別為一間距期的起點(diǎn)并由聲音探測器和間距期探測器16發(fā)生一邏輯高信號用于輸出。聲音探測器和間距期探測器16的這種輸出信號用圖5中的波形62表示。該輸出信號的上升沿可以用來設(shè)定存儲器地址指針以指示一個(gè)間距期的開始。
被探測到的間距期可以用兩個(gè)參數(shù)表征它的持續(xù)時(shí)間T和它的周期總數(shù)N。通過對這些特征參數(shù)的比較可以判斷兩個(gè)鄰接間距波形的相似性。圖1中,間距期冗余探測器17計(jì)算兩個(gè)鄰接間距期(例如圖5中的T1和T2)之間的持續(xù)時(shí)間并且將其結(jié)果同參考值ΔTREF進(jìn)行比較。然后間距期冗余度探測器17計(jì)算兩鄰接間距期之間的周期數(shù)(如圖5中的N1和N2)之差并將結(jié)果同另一參考值ΔNREF進(jìn)行比較。根據(jù)一種優(yōu)選實(shí)施方案,如果兩種條件|T2-T1|≤ΔTREF和|N2-N1|≤ΔNREF都被滿足,則兩個(gè)相應(yīng)的間距期被認(rèn)為是相同的。在準(zhǔn)聲音間隔中,如圖3所示的那種,識別出2個(gè)相同的間距期的機(jī)會是相當(dāng)?shù)偷?。但是,在聲音間隔中,如圖3中所示的那種,識別出2個(gè)相同的間距期的機(jī)會比較高。當(dāng)圖1的音頻速度變換器10處于快速工作方式時(shí),2個(gè)相同的間距期的第2個(gè)被從音頻信號中清除。由此,信號的冗余度降低而音頻速度增加。相反,當(dāng)圖1的音頻速度變換器10處于低速工作方式時(shí),對音頻信號中的兩個(gè)相同的間距期的第2個(gè)加以重復(fù)。這樣做之后,信號的冗余度增加而音頻速度降低。
參照圖6,它顯示一系列波形,這些波形展示根據(jù)本發(fā)明原理的音頻信號的壓縮和擴(kuò)大的實(shí)例。圖6中,波形70展示沒有進(jìn)行信號壓縮或擴(kuò)大的情況。因此,分別具有持續(xù)時(shí)間T1至T4的所有4個(gè)間距期都包括在一種音頻信號之內(nèi)。波形71展示進(jìn)行信號壓縮的情況。特別地,只有具有持續(xù)時(shí)間T1和T3的間距期包括在音頻信號之內(nèi),因而降低了信號冗余度。當(dāng)圖1的音頻速度變換器10處于快速工作方式時(shí),可以導(dǎo)致波形71。波形72展示信號被擴(kuò)大的情況。特別地,具有持續(xù)時(shí)間T2的間距期在音頻信號中加以重復(fù),因此增大了信號冗余度。當(dāng)圖1的音頻速度變換器10處于慢速工作方式時(shí),可以導(dǎo)致波形72。當(dāng)音頻速度變換器10處于待機(jī)狀態(tài)時(shí)。輸入音頻信號只是通過音頻速度變換器10加以循環(huán)而無任何速度變化。當(dāng)音頻速度變換器10處于快速或慢速工作方式時(shí),被刪除或重復(fù)的周期數(shù)由控制電路18控制。因此,控制電路18可以計(jì)算任意給定時(shí)刻的音頻速度并且將結(jié)果提供給其它設(shè)備,諸如內(nèi)部緩沖存儲器19,外部存儲設(shè)備20和/或外部設(shè)備21。
對本發(fā)明的某些其他特性已經(jīng)進(jìn)行了辨別。例如,當(dāng)音頻速度變換器10處于快速工作方式時(shí),最好的結(jié)果是在速度等于2倍初始速度的最大值時(shí)獲得的。如果該速度更高,說話的聲音對聽話人就會變得不太明晰。不管怎樣,較高的聲音可以用在象磁帶錄像機(jī)(VTR)的快速進(jìn)帶功能這類應(yīng)用之中,因?yàn)榇颂幉灰髮σ纛l信息的完全了解。在這種場合下,也許有必要增大參考參數(shù)TTH,TSIL-REF,PSIL,ΔTREF和ΔNREF的值。當(dāng)音頻速度變換器10處于慢速工作方式時(shí),最佳結(jié)果是在速度不低于初始速度一半的情形下得到的。雖然本發(fā)明特別適合于處理語音信號,但本發(fā)明的原理也可以應(yīng)用于處理一般的音頻信號,包括象含除和/或語音數(shù)據(jù)以外數(shù)據(jù)的音樂音頻信號。
如上所述,相對傳統(tǒng)的音頻速度變換器本發(fā)明有著幾大優(yōu)點(diǎn)。下面是本發(fā)明的一些典型的特點(diǎn)—音頻信號的刪除或插入總是發(fā)生在零交叉點(diǎn),因此消除了卡搭聲。
—因?yàn)樵趧h除或插入點(diǎn)不要求相乘,所以能夠?qū)崿F(xiàn)簡單快速的信號處理。
—輸入語音信號被分成可變長度的周期/幀,其中每一周期/幀等于同輸入音頻信號頻率有關(guān)的可變信號樣本數(shù)。
—如果兩個(gè)鄰接的間距期被識別為相同,則只發(fā)生音頻信號部分的消除(即清除)或插入(即重復(fù))。
—只有無聲間隔部分被刪除。無聲間隔的擴(kuò)大同它的持續(xù)時(shí)間成反比。
—對信號的處理沒有時(shí)間或速度限制。因而產(chǎn)生優(yōu)質(zhì)音頻重現(xiàn)。傳統(tǒng)的音頻速度變換器常常根據(jù)緩沖存儲器的溢出和下溢刪除或重復(fù)音頻信號的一段。而且,它們常常有著必須滿足的時(shí)間和速度限制。這樣常常會導(dǎo)致音頻信號完整片段的丟失。
—所獲得的輸出信號,同存儲速度無關(guān),僅包括初始音頻信號部分。沒有合成產(chǎn)生的部分包括在內(nèi)。
—所獲得的音頻速度不是恒定的。速度變化率依賴于參數(shù)TTH,TSIL-REF,PSIL,ΔTREF,ΔNREF和輸入信號。在快速方式中,包含有更多無聲間隔和更多相同間隔的輸入信號將導(dǎo)致比具有相同持續(xù)時(shí)間但相反特性的輸入信號更快的輸出信號。在慢速方式中,音頻速度變換器按照短的無聲間隔比長的無聲間隔擴(kuò)大更多的方式進(jìn)行工作。
雖然用一種優(yōu)選設(shè)計(jì)對本發(fā)明做了說明,但是在本文內(nèi)容的構(gòu)思和范圍之內(nèi)可以對本發(fā)明進(jìn)行進(jìn)一步修改。因此,本專利申請旨在涵蓋使用本發(fā)明的一般原理適用本發(fā)明的任何變動和任何用途。而且本申請旨在涵蓋那些超出本發(fā)明內(nèi)容在本領(lǐng)域內(nèi)公知的或通常的實(shí)踐,而這種實(shí)踐與本發(fā)明的內(nèi)容有關(guān)并在本文所附權(quán)利要求的范圍之內(nèi)。
權(quán)利要求
1.一種用于處理音頻信號的系統(tǒng),包括用于接收所說的音頻信號并將該接收的音頻信號分成一個(gè)或多個(gè)單個(gè)單元周期(30)的裝置(11);和通過重復(fù)和清除一個(gè)或多個(gè)所說的單個(gè)單元周期(30)的一種操作能進(jìn)行音頻速度變換操作的裝置(18)。
2.權(quán)利要求1的系統(tǒng),其中所說的接收裝置(11)根據(jù)參考值將所說的接收音頻信號分成一個(gè)或多個(gè)單個(gè)單元周期(30),使得單個(gè)單元周期在所接收的音頻信號等于或大于該參考值的第一個(gè)樣本開始,而在所接收的音頻信號小于該參考值的最后一個(gè)樣本結(jié)束。
3.權(quán)利要求1的系統(tǒng),其中重復(fù)(72)一個(gè)或多個(gè)所說的單個(gè)單元周期(30)來降低音頻速度。
4.權(quán)利要求1的系統(tǒng),其中清除(71)一個(gè)或多個(gè)所說的單個(gè)單元周期(30)來增加音頻速度。
5.權(quán)利要求1的系統(tǒng),其中所說的接收的音頻信號是一種數(shù)字語音信號(11)。
6.權(quán)利要求1的系統(tǒng),進(jìn)一步包括裝置(13),該裝置用于對所說的一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)產(chǎn)生平均功率值。
7.權(quán)利要求6的系統(tǒng),進(jìn)一步包括裝置(14),該裝置用于依據(jù)對所說的一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)的平均功率值確定是否該一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)與一個(gè)無聲間隔相對應(yīng)。
8.權(quán)利要求6的系統(tǒng),其中所說的發(fā)生裝置(13)根據(jù)對所說的一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)的平均幅度值為該一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)生成所說的平均功率值。
9.權(quán)利要求1的系統(tǒng),進(jìn)一步包括裝置(16),該裝置用于探測所說的接收音頻信號中的一個(gè)或多個(gè)間距期,其中一個(gè)或多個(gè)間距期中的每一個(gè)包括一個(gè)或多個(gè)單個(gè)單元周期(30)。
10.權(quán)利要求9的系統(tǒng),進(jìn)一步包括裝置(13),該裝置用于為所說的一個(gè)或多個(gè)單個(gè)單元周期(30)生成平均功率值。
11.權(quán)利要求10的系統(tǒng),其中所說的探測裝置(16)根據(jù)對一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)的平均功率值探測接收音頻信號中的一個(gè)或多個(gè)間距期。
12.權(quán)利要求10的系統(tǒng),其中所說的發(fā)生裝置(13)根據(jù)對所說的一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)的平均幅度值為一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)生成平均功率值。
13.一種音頻速度變換系統(tǒng),包括信號探測器(11),用于接收音頻信號和將該接收的音頻信號分成一個(gè)或多個(gè)單個(gè)單元周期(30);和電路(18),用于通過重復(fù)和清除一個(gè)或多個(gè)所說的單個(gè)單元周期(30)的一種操作實(shí)現(xiàn)音頻速度變換。
14.權(quán)利要求13的音頻速度變換系統(tǒng),其中所說的信號探測器(11)根據(jù)參考值將所述被接收的音頻信號分成一個(gè)或多個(gè)單個(gè)單元周期(30),使得單個(gè)單元周期在所接收的音頻信號等于或大于該參考值的第一個(gè)樣本開始,而在所接收的音頻信號小于該參考值的最后一個(gè)樣本結(jié)束。
15.權(quán)利要求13的音頻速度變換系統(tǒng),其中重復(fù)(72)一個(gè)或多個(gè)所說的單個(gè)單元周期(30)來降低音頻速度。
16.權(quán)利要求13的音頻速度變換系統(tǒng),其中清除(71)一個(gè)或多個(gè)所說的單個(gè)單元周期(30)來提高音頻速度。
17.權(quán)利要求13的音頻速度變換系統(tǒng),其中所說的被接收的音頻信號是數(shù)字語音信號(11)。
18.權(quán)利要求13的音頻速度變換系統(tǒng),進(jìn)一步包括平均功率值發(fā)生器(13),該發(fā)生器用于對所說的一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)產(chǎn)生平均功率值。
19.權(quán)利要求18的音頻速度變換系統(tǒng),進(jìn)一步包括無聲探測器(14),該探測器用于根據(jù)一個(gè)或多個(gè)單個(gè)單元周期(30)的每一個(gè)的平均功率值判斷是否一個(gè)或多個(gè)單個(gè)單元周期(30)的每一個(gè)對應(yīng)于1無聲間隔。
20.權(quán)利要求18的音頻速度變換系統(tǒng)(10),其中所說的平均功率值發(fā)生器(13)根據(jù)一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)的平均幅度值為一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)產(chǎn)生所說的平均功率值。
21.權(quán)利要求13的音頻速度變換系統(tǒng),進(jìn)一步包括間距期探測器(16),該探測器用于探測所說的接收音頻信號中的一個(gè)或多個(gè)間距期,其中該一個(gè)或多個(gè)間距期中的每一個(gè)包括一個(gè)或多個(gè)所述單個(gè)單元周期(30)。
22.權(quán)利要求21的音頻速度變換系統(tǒng),進(jìn)一步包括平均功率值發(fā)生器(13),該發(fā)生器為一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)產(chǎn)生平均功率值。
23.權(quán)利要求22的音頻速度變換系統(tǒng)(10),其中所說的間距期探測器(16)根據(jù)一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)的平均功率值探測所接收的音頻信號中的一個(gè)或多個(gè)間距期。
24.權(quán)利要求22的音頻速度變換系統(tǒng),其中所說的平均功率值發(fā)生器(13)根據(jù)一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)的平均幅度值為該一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)產(chǎn)生平均功率值。
25.一種用于處理音頻信號的方法,包括步驟接收所說的音頻信號;將該接收的音頻信號分成一個(gè)或多個(gè)單個(gè)單元周期(30);和通過重復(fù)和清除一個(gè)或多個(gè)單個(gè)單元周期(30)的一種操作實(shí)現(xiàn)音頻速度變換(18)。
26.權(quán)利要求25的方法,其中所說的接收音頻信號根據(jù)參考值被分成一個(gè)或多個(gè)單個(gè)單元周期(30),使得單個(gè)單元周期在所接收的音頻信號等于或大于該參考值的第一個(gè)樣本開始,而在所接收的音頻信號小于該參考值的最后一個(gè)樣本結(jié)束。
27.權(quán)利要求25的方法,其中重復(fù)一個(gè)或多個(gè)所說的單個(gè)單元周期(30)來降低音頻速度。
28.權(quán)利要求25的方法,其中清除一個(gè)或多個(gè)所說的單個(gè)單元周期(30)來提高音頻速度。
29.權(quán)利要求25的方法,其中所說的接收音頻信號是數(shù)字語音信號。
30.權(quán)利要求25的方法,進(jìn)一步包括步驟,用以確定是否一個(gè)或多個(gè)單個(gè)單元周期(30)對應(yīng)于一個(gè)無聲間隔。
31.權(quán)利要求30的方法,其中用以判斷是否一個(gè)或多個(gè)單個(gè)單元周期(30)對應(yīng)一個(gè)無聲間隔的步驟是根據(jù)該一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)的平均功率值實(shí)施的。
32.權(quán)利要求31的方法,其中所說的一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)的平均功率值是根據(jù)該一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)的平均幅度值確定的。
33.權(quán)利要求25的方法,進(jìn)一步包括步驟,用以探測所說的接收音頻信號中的一個(gè)或多個(gè)間距期,其中該一個(gè)或多個(gè)間距期中的每一個(gè)包括一個(gè)或多個(gè)單個(gè)單元周期(30)。
34.權(quán)利要求33的方法,其中所說的在所接收音頻信號中探測一個(gè)或多個(gè)間距期的步驟是根據(jù)一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)的平均功率值實(shí)施的。
35.權(quán)利要求34的方法,其中所說的一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)的平均功率值是根據(jù)一個(gè)或多個(gè)單個(gè)單元周期(30)中的每一個(gè)的平均幅度值確定的。
全文摘要
本發(fā)明提供一種處理音頻信號的方法和系統(tǒng)。根據(jù)一種典型方法,諸如數(shù)字語音信號的音頻信號被接收并被分成一個(gè)或多個(gè)單個(gè)單元周期。通過重復(fù)或清除一個(gè)或多個(gè)單個(gè)單元周期可進(jìn)行音頻速度變換的操作。特別地,重復(fù)一個(gè)或多個(gè)單個(gè)單元周期來降低音頻速度,而清除一個(gè)或多個(gè)單個(gè)單元周期來提高音頻速度。
文檔編號G10L21/04GK1446349SQ01813920
公開日2003年10月1日 申請日期2001年6月29日 優(yōu)先權(quán)日2000年8月9日
發(fā)明者M·梅蓋德, M·因坎普 申請人:湯姆森許可公司