亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

在基于修正離散余弦變換的譯碼器與異質(zhì)譯碼器間轉(zhuǎn)換的編碼設(shè)備和解碼設(shè)備的制作方法

文檔序號(hào):2823252閱讀:152來(lái)源:國(guó)知局
專利名稱:在基于修正離散余弦變換的譯碼器與異質(zhì)譯碼器間轉(zhuǎn)換的編碼設(shè)備和解碼設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種設(shè)備與方法,其用于在把基于修正離散余弦變換(MDCT)的音頻譯碼器和不同的語(yǔ)音/音頻譯碼器相結(jié)合來(lái)編解碼音頻信號(hào)時(shí),減少在執(zhí)行不同類型譯碼器轉(zhuǎn)換時(shí)生成的扭曲(artifact)。
背景技術(shù)
當(dāng)根據(jù)輸入信號(hào)的特征而對(duì)語(yǔ)音和音頻相結(jié)合的輸入信號(hào)應(yīng)用不同的編碼/解碼方法時(shí),可改善性能和音質(zhì)。例如,對(duì)具有語(yǔ)音信號(hào)相似特征的信號(hào)應(yīng)用基于碼激勵(lì)線性預(yù)測(cè) CELP 的編碼器(Code Excited Linear Prediction-based encoder),而對(duì)與音頻信號(hào)相同的信號(hào)應(yīng)用基于變頻的編碼器(frequency conversion-based encoder),是有效率的。通過(guò)應(yīng)用上面所述的概念,可開(kāi)發(fā)統(tǒng)一語(yǔ)音和音頻編碼USAC(Unified Speech and Audio Coding)。該USAC可不斷地接收輸入信號(hào)并在特定時(shí)間分析輸入信號(hào)。然后, USAC可通過(guò)根據(jù)輸入信號(hào)的特征進(jìn)行切換來(lái)應(yīng)用不同類型的編碼設(shè)備,來(lái)編碼輸入信號(hào)。USAC中的信號(hào)切換(signal switching)過(guò)程中,會(huì)生成信號(hào)扭曲(signal artifact) 0由于USAC為每個(gè)區(qū)塊編碼輸入信號(hào),所以在應(yīng)用不同類型的編碼時(shí)會(huì)生成塊扭曲(blocking artifact) 0為了克服這種缺點(diǎn),USAC可在應(yīng)用不同編碼時(shí)對(duì)塊應(yīng)用窗口, 來(lái)執(zhí)行重疊相加操作。但是,這種情況下,可能會(huì)因?yàn)橹丿B而需要額外的比特流信息,且當(dāng)頻繁出現(xiàn)切換時(shí),用于消除塊扭曲的額外的比特流可能會(huì)增加。當(dāng)比特流增加,編碼效率會(huì)降低。特別是,USAC可采用基于修正離散余弦變換(MDCT)的編碼設(shè)備來(lái)編碼音頻特征信號(hào)。MDCT方式可將時(shí)域的輸入信號(hào)變換為頻域的輸入信號(hào),并在塊間執(zhí)行重疊相加操作。 MDCT方式具有即使執(zhí)行重疊相加操作,比特率也可能不會(huì)增加的優(yōu)點(diǎn),但存在可能會(huì)在時(shí)域中生成混疊的缺點(diǎn)。在這種情況下,基于MDCT方式,50 %重疊相加操作會(huì)被對(duì)相鄰塊執(zhí)行來(lái)還原輸入信號(hào)。也就是說(shuō),要被輸出的當(dāng)前塊可基于前一個(gè)塊的輸出結(jié)果被解碼。但是,當(dāng)前一個(gè)塊沒(méi)有使用MDCT方式的USAC被編碼時(shí),使用MDCT方式編碼的當(dāng)前塊,可能無(wú)法通過(guò)重疊相加操作解碼,因?yàn)榍耙粋€(gè)塊的MDCT信息可能無(wú)法使用。因此,在切換之后使用MDCT方式編碼當(dāng)前塊時(shí),USAC可能會(huì)額外要求前一個(gè)塊的MDCT信息。當(dāng)頻繁發(fā)生切換時(shí),用于解碼的額外的MDCT信息比例可增加至切換量。在這種情況下,比特率會(huì)由于額外的MDCT信息而增加,而編碼效率可能會(huì)明顯降低。因此,需要一種方法,來(lái)在切換過(guò)程中去除塊扭曲并盡可能減少額外的MDCT信息。

發(fā)明內(nèi)容
本發(fā)明的一個(gè)方面,提供了一種編碼方法及設(shè)備和解碼方法及設(shè)備,其可去除塊信號(hào)扭曲并盡可能減少切換時(shí)所需的MDCT信息。根據(jù)本發(fā)明的一個(gè)方面,提供了第一編碼單元,其根據(jù)不同于基于MDCT的譯碼方式(Modified Discrete Cosine Transform-based coding scheme)白勺異質(zhì)譯石馬方式(hetero coding scheme)來(lái)編碼輸入信號(hào)的語(yǔ)音特征信號(hào)(speech characteristic signal);和第二編碼單元,其根據(jù)基于MDCT的譯碼方式來(lái)編碼輸入信號(hào)的音頻特征信號(hào) (audio characteristic signal) 0當(dāng)所述輸入信號(hào)的當(dāng)前幀中存在在語(yǔ)音特征信號(hào)和音頻特征信號(hào)之間發(fā)生切換的折點(diǎn)(folding point)時(shí),所述第二編碼單元,可通過(guò)應(yīng)用不超過(guò)所述折點(diǎn)的分析窗口來(lái)執(zhí)行編碼。折點(diǎn)可以是當(dāng)MDCT和反MDCT(IMDCT =Inverse MDCT) 被執(zhí)行時(shí),混疊信號(hào)被折疊處的區(qū)域。當(dāng)執(zhí)行N點(diǎn)MDCT(N-point MDCT)時(shí),折點(diǎn)可位于Ν/4 和3Ν/4點(diǎn)處。折點(diǎn)可以是與MDCT相關(guān)的眾所周知的特征的任何一個(gè),用于折點(diǎn)的數(shù)學(xué)基礎(chǔ)(mathematical basis)在此將不做說(shuō)明。另外,MDCT和折點(diǎn)的概念的描述,將參照?qǐng)D5 詳細(xì)說(shuō)明。此外,為方便說(shuō)明,當(dāng)前一個(gè)幀信號(hào)是語(yǔ)音特征信號(hào)而當(dāng)前幀是音頻特征信號(hào)時(shí), 當(dāng)連接兩種不同類型特征的信號(hào)時(shí)使用的折點(diǎn),以下可稱為“發(fā)生切換處的折點(diǎn)”。同時(shí),當(dāng)后一個(gè)幀信號(hào)是語(yǔ)音特征信號(hào)而當(dāng)前幀信號(hào)是音頻特征信號(hào)時(shí),在連接兩個(gè)不同類型特征的信號(hào)時(shí)使用的折點(diǎn),以下可稱為“發(fā)生切換處的折點(diǎn)”。根據(jù)本發(fā)明的一個(gè)方面,提供了一種編碼設(shè)備,包括窗口處理單元,其對(duì)輸入信號(hào)的當(dāng)前幀應(yīng)用分析窗口 ;MDCT變換單元,其針對(duì)應(yīng)用了分析窗口的當(dāng)前幀執(zhí)行MDCT變換;和比特流生成單元,其編碼已進(jìn)行了 MDCT變換的當(dāng)前幀并生成輸入信號(hào)的比特流。當(dāng)所述輸入信號(hào)的當(dāng)前幀中存在在語(yǔ)音特征信號(hào)和音頻特征信號(hào)之間發(fā)生切換的折點(diǎn)時(shí),所述窗口處理單元應(yīng)用不超過(guò)折點(diǎn)的分析窗口。根據(jù)本發(fā)明的一個(gè)方面,提供了一種解碼設(shè)備,包括第一解碼單元,其根據(jù)不同于基于MDCT的譯碼方式的異質(zhì)譯碼方式來(lái)解碼被編碼的輸入信號(hào)的語(yǔ)音特征信號(hào);第二解碼單元,其根據(jù)基于MDCT的譯碼方式來(lái)解碼被編碼的輸入信號(hào)的音頻特征信號(hào);和塊補(bǔ)償單元,其針對(duì)第一解碼單元的結(jié)果和第二解碼單元的結(jié)果來(lái)執(zhí)行塊補(bǔ)償并還原輸入信號(hào)。當(dāng)所述輸入信號(hào)的當(dāng)前幀中存在在語(yǔ)音特征信號(hào)和音頻特征信號(hào)之間發(fā)生切換的折點(diǎn)時(shí),所述塊補(bǔ)償單元應(yīng)用不超過(guò)所述折點(diǎn)的合成窗口。根據(jù)本發(fā)明的一個(gè)方面,提供一種解碼設(shè)備,包括塊補(bǔ)償單元,當(dāng)輸入信號(hào)的當(dāng)前幀中存在在語(yǔ)音特征信號(hào)和音頻特征信號(hào)之間發(fā)生切換的折點(diǎn)時(shí),其對(duì)所述當(dāng)前幀和從語(yǔ)音特征信號(hào)中提取出的額外的信息分別應(yīng)用合成窗口,來(lái)還原輸入信號(hào)。技術(shù)效果根據(jù)本發(fā)明的一個(gè)方面,提供了一種編碼方法及設(shè)備和解碼方法及設(shè)備,其可減少根據(jù)輸入信號(hào)的特征在不同類型的譯碼器之間發(fā)生切換時(shí)所需的額外MDCT信息,并去除塊信號(hào)扭曲。此外,根據(jù)本發(fā)明的一個(gè)方面,提供了一種編碼方法及設(shè)備和解碼方法及設(shè)備,其可減少根據(jù)輸入信號(hào)的特征在不同類型的譯碼器之間發(fā)生切換時(shí)所需的額外MDCT信息, 并阻止比特率增加,改善編碼效率。


圖1是示出根據(jù)本發(fā)明的一實(shí)施例的編碼設(shè)備和解碼設(shè)備的框圖;圖2是示出根據(jù)本發(fā)明的一實(shí)施例的編碼設(shè)備的配置的框圖;圖3是示出根據(jù)本發(fā)明的一實(shí)施例的通過(guò)第二編碼單元來(lái)編碼輸入信號(hào)的操作的示圖;圖4是示出根據(jù)本發(fā)明的一實(shí)施例的通過(guò)窗口處理來(lái)編碼輸入信號(hào)的操作的示圖;圖5是示出根據(jù)本發(fā)明的一實(shí)施例的MDCT (Modified Discrete Cosine Transform,修正離散余弦變換)操作的示圖;圖6是示出根據(jù)本發(fā)明的一實(shí)施例的異質(zhì)譯碼操作C1、C2的示圖;圖7是示出根據(jù)本發(fā)明的一實(shí)施例的在Cl中生成比特流操作的示圖;圖8是示出根據(jù)本發(fā)明的一實(shí)施例的在Cl中通過(guò)窗口處理來(lái)編碼輸入信號(hào)的操作的示圖;圖9是示出根據(jù)本發(fā)明的一實(shí)施例的在C2中生成比特流操作的示圖;圖10是示出根據(jù)本發(fā)明的一實(shí)施例的在C2中通過(guò)窗口處理來(lái)編碼輸入信號(hào)的操作的示圖;圖11是示出根據(jù)本發(fā)明的一實(shí)施例的當(dāng)輸入信號(hào)被編碼時(shí)應(yīng)用的額外信息的示圖;圖12是示出根據(jù)本發(fā)明的一實(shí)施例的解碼設(shè)備的配置的框圖;圖13是示出根據(jù)本發(fā)明的一實(shí)施例的通過(guò)第二解碼單元來(lái)解碼比特流的操作的示圖;圖14是示出根據(jù)本發(fā)明的一實(shí)施例的通過(guò)重疊相加操作提取輸出信號(hào)的操作的示圖;圖15是示出根據(jù)本發(fā)明的一實(shí)施例的在Cl中生成輸出信號(hào)的操作的示圖;圖16是示出根據(jù)本發(fā)明的一實(shí)施例的在Cl中的塊補(bǔ)償操作的示圖;圖17是示出根據(jù)本發(fā)明的一實(shí)施例的在C2中生成輸出信號(hào)的操作的示圖;和圖18是示出根據(jù)本發(fā)明的一實(shí)施例的在C2中的塊補(bǔ)償操作的示圖。
具體實(shí)施例方式現(xiàn)在將參照附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行詳細(xì)描述,所述實(shí)施例的示例在附圖中被示出,其中相同的參照數(shù)字始終表示相同的元素。下面將參照數(shù)字描述實(shí)施例,以對(duì)本發(fā)明進(jìn)行說(shuō)明。圖1是示出根據(jù)本發(fā)明的一實(shí)施例的編碼設(shè)備101和解碼設(shè)備102的框圖。所述編碼設(shè)備101可通過(guò)為每個(gè)塊編碼輸入信號(hào)生成比特流。在這種情況下,編碼設(shè)備101可編碼語(yǔ)音特征信號(hào)和音頻特征信號(hào)。語(yǔ)音特征信號(hào)可具有與嗓音信號(hào)相似的特征,音頻特征信號(hào)可具有與音頻信號(hào)相似的特征。編碼結(jié)果,生成輸入信號(hào)的相關(guān)比特流,并被傳送到解碼設(shè)備102。解碼設(shè)備102可通過(guò)解碼比特流來(lái)生成輸出信號(hào),并由此還原被編碼的輸入信號(hào)。具體來(lái)說(shuō),編碼設(shè)備101可分析不斷輸入的信號(hào)的狀態(tài),并根據(jù)分析的結(jié)果進(jìn)行切換來(lái)應(yīng)用對(duì)應(yīng)輸入信號(hào)的特征的編碼方式。由此,編碼設(shè)備101可編碼應(yīng)用了異質(zhì)譯碼方式處的塊。例如,編碼設(shè)備101可根據(jù)碼激勵(lì)線性預(yù)測(cè)CELP(Code Excited Linear Prediction)方式編碼語(yǔ)音特征信號(hào)并根據(jù)修正離散余弦變換MDCT方式編碼音頻特征信號(hào)。相反,解碼設(shè)備102,可通過(guò)根據(jù)CELP方式來(lái)解碼根據(jù)CELP方式編碼的輸入信號(hào),并根據(jù)MDCT方式來(lái)解碼根據(jù)MDCT方式編碼的輸入信號(hào),來(lái)還原輸入信號(hào)。在這種情況下,當(dāng)輸入信號(hào)被從語(yǔ)音特征信號(hào)切換到音頻特征信號(hào)時(shí),編碼設(shè)備 101可通過(guò)從CELP方式切換到MDCT方式來(lái)進(jìn)行編碼。由于每個(gè)塊都進(jìn)行編碼,可能會(huì)生成塊扭曲。在這種情況下,解碼設(shè)備102可通過(guò)在塊間進(jìn)行重疊相加操作來(lái)去除塊扭曲。此外,當(dāng)輸入信號(hào)的當(dāng)前塊根據(jù)MDCT方式被編碼時(shí),還原輸入信號(hào)需要前一個(gè)塊的MDCT信息。但是,當(dāng)前一個(gè)塊是根據(jù)CELP方式被編碼時(shí),由于前一個(gè)塊的MDCT信息不存在,所以根據(jù)MDCT方式會(huì)無(wú)法還原當(dāng)前塊。因此,需要前一個(gè)塊的額外的MDCT信息。此外,所述編碼設(shè)備101可減少額外的MDCT信息從而可以防止比特率增加。圖2是示出根據(jù)本發(fā)明的一實(shí)施例的編碼設(shè)備的配置的框圖。參照?qǐng)D2,編碼設(shè)備101可包括塊延遲單元201、狀態(tài)分析單元202、信號(hào)切割單元 203、第一編碼單元204、和第二編碼單元205。塊延遲單元201可為每個(gè)塊延遲輸入信號(hào)。輸入信號(hào)可以為每個(gè)塊被處理用來(lái)編碼。塊延遲單元201可后退延遲(_)或向前延遲(+)輸入的當(dāng)前塊。狀態(tài)分析單元202可確定輸入信號(hào)的特征。例如,狀態(tài)分析單元202可決定輸入信號(hào)是語(yǔ)音特征信號(hào)還是音頻特征信號(hào)。在這種情況下,狀態(tài)分析單元202可輸出控制參數(shù)。該控制參數(shù)可用于確定哪些編碼方式用于編碼輸入信號(hào)的當(dāng)前塊。例如,狀態(tài)分析單元202可分析輸入信號(hào)的特征,并將信號(hào)周期對(duì)應(yīng)下列狀態(tài)的信號(hào)確定為語(yǔ)音特征信號(hào),即(1)呈現(xiàn)出清晰并穩(wěn)定諧波分量的穩(wěn)定諧波 SH(steady-harmonic)狀態(tài);( 在低頻率帶寬呈現(xiàn)出強(qiáng)大穩(wěn)定特征且呈現(xiàn)出較長(zhǎng)周期的諧波分量的低穩(wěn)定諧波LSH(low steady harmonic)狀態(tài);(3)穩(wěn)定噪聲SN(steady-noise) 狀態(tài)。狀態(tài)分析單元202可分析輸入信號(hào)的特征,并將信號(hào)周期對(duì)應(yīng)下列狀態(tài)的信號(hào)確定為音頻特征信號(hào),即(4)呈現(xiàn)出不同的音調(diào)分量被結(jié)合的復(fù)雜和聲結(jié)構(gòu)的復(fù)雜諧波 CH(complex-harmonic)狀態(tài);( 包括不穩(wěn)定噪聲分量的復(fù)雜噪聲狀態(tài)。在這里,所述信號(hào)周期可對(duì)應(yīng)輸入信號(hào)的塊單位。信號(hào)切割單元203可使塊單位的輸入信號(hào)成為子集。第一編碼單元204可在塊單位的輸入信號(hào)之中編碼語(yǔ)音特征信號(hào)。例如,第一編碼單元204可根據(jù)線性預(yù)測(cè)譯碼LPC (Linear Predictive Coding)編碼時(shí)域中的語(yǔ)音特征信號(hào)。在這種情況下,第一編碼單元204可根據(jù)基于CELP的譯碼方式來(lái)編碼所述語(yǔ)音特征信號(hào)。雖然圖3示出了單一第一編碼單元204,但也可以配置一個(gè)或多個(gè)第一編碼單元。第二編碼單元205可在塊單位的輸入信號(hào)之中編碼音頻特征信號(hào)。例如,第二編碼單元205可將音頻特征信號(hào)從時(shí)域變換到頻域以進(jìn)行編碼。這種情況下,第二編碼單元 205可根據(jù)基于MDCT方式的譯碼方式來(lái)編碼音頻特征信號(hào)。比特流中可生成第一解碼單元204的結(jié)果和第二編碼單元205的結(jié)果,且在每個(gè)編碼單元中生成的比特流可通過(guò)比特流多路復(fù)用器(MUX)被控制為單一比特流。也就是說(shuō),編碼設(shè)備101可通過(guò)根據(jù)狀態(tài)分析單元202的控制參數(shù)進(jìn)行切換,通過(guò)第一編碼單元204、第二編碼單元205中的任何一個(gè)來(lái)編碼輸入信號(hào)。同時(shí),第一編碼單元204可根據(jù)不同于基于MDCT的譯碼方式的異質(zhì)譯碼方式,來(lái)編碼輸入信號(hào)的語(yǔ)音特征信號(hào)。此外,第二編碼單元205可根據(jù)基于MDCT的譯碼方式,來(lái)編碼輸入信號(hào)的音頻特征信號(hào)。圖3是示出根據(jù)本發(fā)明的一實(shí)施例的通過(guò)第二編碼單元來(lái)編碼輸入信號(hào)的操作的示圖。參照?qǐng)D3,第二編碼單元205可包括窗口處理單元301、MDCT變換單元302、比特流生成單元303。在圖3中,X (b)可指輸入信號(hào)的基本塊單位。輸入信號(hào)將參照?qǐng)D4和圖6來(lái)詳細(xì)說(shuō)明。輸入信號(hào)可被輸入到窗口處理單元301,也可通過(guò)塊延遲單元201被輸入到窗口處理單元301。窗口處理單元301,可對(duì)輸入信號(hào)的當(dāng)前幀應(yīng)用分析窗口。具體來(lái)說(shuō),窗口處理單元301可對(duì)當(dāng)前塊X(b)和延遲的塊X(b-2)應(yīng)用分析窗口。當(dāng)前塊X(b)可通過(guò)塊延遲單元201被后退延遲到前一個(gè)塊X (b-2)。例如,當(dāng)當(dāng)前幀中存在在語(yǔ)音特征信號(hào)和音頻特征信號(hào)之間發(fā)生切換的折點(diǎn)時(shí), 窗口處理單元301,可對(duì)當(dāng)前幀應(yīng)用不超過(guò)折點(diǎn)的分析窗口。在這種情況下,窗口處理單元 301,可應(yīng)用所述分析窗口,所述分析窗口可基于所述折點(diǎn)被配置為具有值0并對(duì)應(yīng)第一子塊的窗口、對(duì)應(yīng)第二子塊中額外信息區(qū)域的窗口、具有值1并對(duì)應(yīng)第二子塊中其余區(qū)域的窗口。在這里,所述第一子塊可表示語(yǔ)音特征信號(hào),且所述第二子塊可表示音頻特征信號(hào)。由塊延遲單元201執(zhí)行的塊延遲的度,可根據(jù)輸入信號(hào)的塊單位有所不同。當(dāng)輸入信號(hào)通過(guò)窗口處理單元301時(shí),分析窗口可被應(yīng)用,且由此{(lán)X(b-2),x(b)} Wanalysis 可被提取。由此,MDCT變換單元302可針對(duì)應(yīng)用了分析窗口的當(dāng)前幀執(zhí)行MDCT。此外,比特流生成單元303可編碼當(dāng)前幀并生成輸入信號(hào)的比特流。圖4是示出根據(jù)本發(fā)明的一實(shí)施例的通過(guò)窗口處理來(lái)編碼輸入信號(hào)的操作的示圖。參照?qǐng)D4,窗口處理單元301,可對(duì)輸入信號(hào)應(yīng)用分析窗口。在這種情況下,分析窗口可以是矩形或正弦形式。分析窗口的形式可根據(jù)輸入信號(hào)有所不同。當(dāng)當(dāng)前塊X(b)被輸入,窗口處理單元301可對(duì)當(dāng)前塊X(b)和前一個(gè)塊X(b_2)應(yīng)用分析窗口。在這里,前一個(gè)塊X(bl)可被塊延遲單元102后退延遲。例如,塊X(b)可按照如下給出的公式1被設(shè)置為輸入信號(hào)的基本單位。在這種情況下,兩個(gè)塊可被設(shè)置為單一的幀并被編碼。[公式1]X(b) = [s(b-l),s(b)]T在這種情況下,s (b)可指被配置為單一塊的子塊,并可被定義為[公式2]s (b) = [s ((b-Ι) · Ν/4),s ((b_l) · Ν/4+1),· · ·,s ((b_l) · N/4+N/4-1) ]τs (η)輸入信號(hào)的一個(gè)采樣。在這里,N可指輸入信號(hào)的塊的大小。也就是說(shuō),輸入信號(hào)中可包括多個(gè)塊,且每個(gè)塊可包括兩個(gè)子塊。包含在單一塊中的子塊的數(shù)目可以根據(jù)系統(tǒng)配置和輸入信號(hào)有所不同。例如,可按如下給出的公式3定義分析窗口。此外,根據(jù)公式2和公式3,對(duì)輸入信號(hào)的當(dāng)前塊應(yīng)用分析窗口的結(jié)果,可以表示為公式4。[公式3]Wanalysis = [W1, w2, W3, w4]TWi = [Wi(O),... ,Wi(N^-I)]1[公式4]Wanalysis可指分析窗口,并有對(duì)稱特征。如圖4所示,分析窗口可被應(yīng)用到兩個(gè)塊。也就是說(shuō),分析窗口可被用于四個(gè)子塊。此外,窗口處理單元301可針對(duì)輸入信號(hào)的 N-point (N點(diǎn))執(zhí)行“點(diǎn)對(duì)點(diǎn)(point by point)”乘法。N-point可表示MDCT的大小。也就是說(shuō),窗口處理單元301,可將子塊乘以對(duì)應(yīng)分析窗口的子塊的區(qū)域。MDCT變換單元302可針對(duì)分析窗口被處理處的輸入信號(hào)執(zhí)行MDCT。圖5是示出根據(jù)本發(fā)明的一實(shí)施例的修正離散余弦變換MDCT (Modified Discrete Cosine Transform)操作的不圖。配置為塊單位的輸入信號(hào)和應(yīng)用于輸入信號(hào)的分析窗口如圖5所示。如上所述, 輸入信號(hào)可包括包括有多個(gè)塊的一個(gè)幀,一個(gè)塊可包含兩個(gè)子塊。編碼設(shè)備101,可對(duì)輸入信號(hào)應(yīng)用分析窗口 Wanalysis。輸入信號(hào)可被分為四個(gè)子塊X1(Z), X2(Z), X3(Z), X4(Z)包括在當(dāng)前幀中,且分析窗口可被分為W1(Z), W2(Z), Wf(Z)9W111 (Z)。此外,當(dāng)MDCT/量化/反MDCT(IMDCT)被基于劃分子塊的折點(diǎn)應(yīng)用于輸入信號(hào)時(shí),可發(fā)生原始區(qū)域(original area)和混疊區(qū)域(aliasing area)。解碼設(shè)備102,可對(duì)編碼的輸入信號(hào)應(yīng)用合成窗口,并通過(guò)重疊相加操作去除在 MDCT操作過(guò)程中生成的混疊(aliasing),并由此可提取出輸出信號(hào)。圖6是示出根據(jù)本發(fā)明的一實(shí)施例的異質(zhì)譯碼操作C1、C2的示圖。在圖6中,Cl (Change case 1)和C2 (Change case幻可指應(yīng)用了異質(zhì)譯碼方式的輸入信號(hào)的邊界?;贑l位于左側(cè)的子塊s(b-5)、s(b-4)、s(b-3)、s(b-2)可指語(yǔ)音特征信號(hào)?;?1位于右側(cè)的子塊8(13-1)、803)、803+1)、803+2)可指音頻特征信號(hào)。此外,基于C2位于左側(cè)的子塊s (b+m-1)、s (b+m)可指音頻特征信號(hào),基于C2位于右側(cè)的子塊 s (b+m+1)、s (b+m+2)可指語(yǔ)音特征信號(hào)。在圖2中,語(yǔ)音特征信號(hào)可通過(guò)第一編碼單元204被編碼,音頻特征信號(hào)可通過(guò)第二編碼單元205來(lái)編碼。由此在Cl和C2中會(huì)出現(xiàn)切換。在這種情況下,切換可發(fā)生在子塊之間的折點(diǎn)中。另外,輸入信號(hào)的特征可能會(huì)基于Cl和C2不同,由此不同的編碼方式被應(yīng)用,可發(fā)生塊扭曲。在這種情況下,編碼根據(jù)基于MDCT的譯碼方式執(zhí)行,解碼設(shè)備102可通過(guò)重疊相加操作使用前一個(gè)塊和當(dāng)前塊兩者來(lái)去除塊扭曲。但是,當(dāng)如Cl和C2的語(yǔ)音特征信號(hào)和音頻特征信號(hào)之間發(fā)生切換時(shí),會(huì)無(wú)法執(zhí)行基于MDCT的重疊相加操作。會(huì)需要額外的信息來(lái)用于基于MDCT的解碼。例如,Cl中可能會(huì)要求額外的信息、(b-l),C2中可能會(huì)要求額外的信息ShJb+m)。根據(jù)本發(fā)明的一實(shí)施例,可阻止于比特率的增加,改善譯碼效率并最大限度地減少額外信息S。Jb-l)和額外信息S1il (b+m)。當(dāng)語(yǔ)音特征信號(hào)和音頻特征信號(hào)之間發(fā)生切換時(shí),編碼設(shè)備101可編碼額外信息來(lái)還原音頻特征信號(hào)。在這種情況下,額外信息可由編碼語(yǔ)音特征信號(hào)的第一編碼單元204 編碼。具體來(lái)說(shuō),在Cl中,在語(yǔ)音特征信號(hào)s (b-2)中對(duì)應(yīng)額外信息3(^03-1)的區(qū)域可被編碼為額外信息。此外,在C2中,在語(yǔ)音特征信號(hào)s(b+m+l)中對(duì)應(yīng)額外信息Sli(b+m)的區(qū)域可被編碼為額外信息。發(fā)生Cl和C2時(shí)的一種編碼方法將參照?qǐng)D7至圖11進(jìn)行詳細(xì)說(shuō)明,且一種解碼方法將參照?qǐng)D15至圖18進(jìn)行詳細(xì)說(shuō)明。圖7是示出根據(jù)本發(fā)明的一實(shí)施例的在Cl中生成比特流操作的示圖。當(dāng)輸入信號(hào)的塊X(b)被輸入,狀態(tài)分析單元202會(huì)分析相應(yīng)塊的狀態(tài)。在這種情況下,當(dāng)塊X (b)為音頻特征信號(hào)且塊X (b-幻為語(yǔ)音特征信號(hào)時(shí),狀態(tài)分析單元202可意識(shí)到Cl在存在于塊X(b)和塊X(b-2)之間的折點(diǎn)中發(fā)生。因此,關(guān)于生成了 Cl的控制信息可被發(fā)送至塊延遲單元201、窗口處理單元301、第一編碼單元204。當(dāng)輸入信號(hào)的塊X(b)被輸入,塊X(b)和塊X(b+》可被輸入至窗口處理單元301。 塊X(b+2)可通過(guò)塊延遲單元201被向前延遲(+2)。因此,分析窗口可應(yīng)用到圖6的Cl中的塊X (b)和塊X (b+2)。在這里,塊X (b)可包括子塊s (b-Ι)和s (b),且塊X (b+2)可包括子塊s (b+Ι)和s (b+2)??赏ㄟ^(guò)MDCT變換單元302針對(duì)分析窗口被應(yīng)用了的塊X (b)和塊 X(b+2)執(zhí)行MDCT。執(zhí)行了 MDCT處的塊可通過(guò)比特率生成單元303編碼,由此可生成輸入信號(hào)的比特流的塊X (b)的比特流。此外,為針對(duì)塊X (b)生成用于重疊相加操作的額外信息Sti (b-Ι),塊延遲單元201 可通過(guò)后退延遲塊X (b)來(lái)提取塊x(b-l)。塊x(b-l)可包括子塊S (b-2)和S(b-1)。此外, 信號(hào)切割單元203可通過(guò)信號(hào)切割從塊X (b-Ι)中提取額外信息S。Jb-l)。例如,額外信息S。Jb-l)可由下列公式?jīng)Q定[公式δ]Sol (b-1) = [s ((b-2) · Ν/4),· · ·,s ((b-2) · N/4+oL-l) ]τ0 < oL ^ Ν/4在這種情況下,N可指MDCT的塊的大小。第一編碼單元204可編碼語(yǔ)音特征信號(hào)的額外信息所對(duì)應(yīng)的區(qū)域,來(lái)基于語(yǔ)音特征信號(hào)和音頻特征信號(hào)之間發(fā)生切換的折點(diǎn)在塊之間重疊。例如,第一編碼單元204,可編碼在是語(yǔ)音特征信號(hào)的子塊s (b-2)中對(duì)應(yīng)于額外信息區(qū)域(oL)的額外信息St^ (b-Ι)。也就是說(shuō),第一編碼單元204可通過(guò)編碼由信號(hào)切割單元203提取的額外信息(b-Ι)來(lái)生成額外信息Sti(b-Ι)的比特流。也就是說(shuō),當(dāng)Cl發(fā)生時(shí),第一編碼單元204可只生成額外信息(b-Ι)的比特流。當(dāng)Cl發(fā)生時(shí),額外信息StJb-I)可被用作用于去除塊扭曲的額外 fn息ο再比如,在編碼塊X(b-l)時(shí)可獲得額外信息Sti(b-1)的情況下,第一編碼單元204 可不編碼額外信息St^ (b-1)。圖8是示出根據(jù)本發(fā)明的一實(shí)施例的在Cl中通過(guò)窗口處理來(lái)編碼輸入信號(hào)的操作的示圖。
在圖8,折點(diǎn)可針對(duì)Cl位于零子塊和子塊s (b-Ι)之間,零子塊可以是語(yǔ)音特征信號(hào),子塊s(b-l)可以是音頻特征信號(hào),且折點(diǎn)可以是發(fā)生從語(yǔ)音特征信號(hào)到音頻特征信號(hào)的切換的折點(diǎn)。如圖8所示,當(dāng)塊X(b)被輸入時(shí),窗口處理單元301可對(duì)輸入的當(dāng)前幀應(yīng)用分析窗口。如圖8所示,當(dāng)輸入信號(hào)的當(dāng)前幀中存在語(yǔ)音特征信號(hào)和音頻特征信號(hào)之間發(fā)生切換的折點(diǎn)時(shí),窗口處理單元301可通過(guò)對(duì)當(dāng)前幀應(yīng)用不超過(guò)折點(diǎn)的分析窗口來(lái)執(zhí)行編碼。例如,窗口處理單元301,可應(yīng)用分析窗口。分析窗口可基于所述折點(diǎn)被配置為 具有值0并對(duì)應(yīng)第一子塊的窗口、對(duì)應(yīng)第二子塊中額外信息區(qū)域的窗口、具有值1并對(duì)應(yīng)第二子塊中其余區(qū)域的窗口。在這里,所述第一子塊可表示語(yǔ)音特征信號(hào),且所述第二子塊可表示音頻特征信號(hào)。在圖8中,折點(diǎn)可位于被配置為具有N/4大小的子塊的當(dāng)前幀的N/4 點(diǎn)處。在圖8中,分析窗口可包括對(duì)應(yīng)是語(yǔ)音特征信號(hào)的零子塊的窗口 wz,和包括對(duì)應(yīng)是音頻特征信號(hào)的s(b-l)子塊的額外信息區(qū)域(OL)的窗口及對(duì)應(yīng)是音頻特征信號(hào)的S (b-1) 子塊的其余區(qū)域(N/4-oL)的窗口的窗口 W2。在這種情況下,窗口處理單元301可以對(duì)是語(yǔ)音特征信號(hào)的零子塊以值0來(lái)替換所述分析窗口 wz。同時(shí),窗口處理單元301可根據(jù)公式6決定是音頻特征信號(hào)的子塊所對(duì)應(yīng)的分析s (b-Ι)的窗口W2。[公式6I
權(quán)利要求
1.一種編碼設(shè)備,包括第一編碼單元,其根據(jù)不同于基于MDCT的譯碼方式的異質(zhì)譯碼方式來(lái)編碼輸入信號(hào)的語(yǔ)音特征信號(hào);和第二編碼單元,其根據(jù)所述基于MDCT的譯碼方式來(lái)編碼所述輸入信號(hào)的音頻特征信號(hào),其中,當(dāng)所述輸入信號(hào)的當(dāng)前幀中存在在語(yǔ)音特征信號(hào)和音頻特征信號(hào)之間發(fā)生切換的折點(diǎn)時(shí),所述第二編碼單元通過(guò)應(yīng)用不超過(guò)所述折點(diǎn)的分析窗口來(lái)執(zhí)行編碼。
2.如權(quán)利要求1所述的編碼設(shè)備,其中,所述第二編碼單元應(yīng)用所述分析窗口,所述分析窗口基于所述折點(diǎn)被配置為具有值 0并對(duì)應(yīng)第一子塊的窗口、對(duì)應(yīng)第二子塊中額外信息區(qū)域的窗口、具有值1并對(duì)應(yīng)第二子塊中其余區(qū)域的窗口,在這里所述第一子塊表示語(yǔ)音特征信號(hào),且所述第二子塊表示音頻特征信號(hào)。
3.如權(quán)利要求1所述的編碼設(shè)備,其中,當(dāng)所述當(dāng)前幀被配置為具有N/4大小的子塊時(shí),所述折點(diǎn)被設(shè)置在N/4或3N/4點(diǎn)處。
4.如權(quán)利要求2所述的編碼設(shè)備,其中,所述第一編碼單元,為了基于所述折點(diǎn)在塊之間進(jìn)行重疊而編碼第一子塊中對(duì)應(yīng)額外信息區(qū)域的部分。
5.一種編碼設(shè)備,包括窗口處理單元,其對(duì)輸入信號(hào)的當(dāng)前幀應(yīng)用分析窗口 ;MDCT變換單元,其針對(duì)應(yīng)用了分析窗口的當(dāng)前幀執(zhí)行MDCT變換;和比特流生成單元,其編碼已進(jìn)行了 MDCT變換的當(dāng)前幀并生成所述輸入信號(hào)的比特流,其中,當(dāng)所述輸入信號(hào)的當(dāng)前幀中存在在語(yǔ)音特征信號(hào)和音頻特征信號(hào)之間發(fā)生切換的折點(diǎn)時(shí),所述窗口處理單元應(yīng)用不超過(guò)折點(diǎn)的分析窗口。
6.如權(quán)利要求5所述的編碼設(shè)備,其中,所述窗口處理單元應(yīng)用所述分析窗口,所述分析窗口基于所述折點(diǎn)被配置為具有值 0并對(duì)應(yīng)第一子塊的窗口、對(duì)應(yīng)第二子塊中額外信息區(qū)域的窗口、具有值1并對(duì)應(yīng)第二子塊中其余區(qū)域的窗口,在這里所述第一子塊表示語(yǔ)音特征信號(hào),且所述第二子塊表示音頻特征信號(hào)。
7.如權(quán)利要求5所述的編碼設(shè)備,其中,當(dāng)所述當(dāng)前幀被配置為具有N/4大小的子塊時(shí),所述折點(diǎn)被設(shè)置在N/4或3N/4點(diǎn)處。
8.如權(quán)利要求6所述的編碼設(shè)備,其中,所述第一子塊中的額外信息區(qū)域,為了基于所述折點(diǎn)在塊之間進(jìn)行重疊而根據(jù)不同于基于MDCT的譯碼方式的異質(zhì)譯碼方式被編碼。
9.一種解碼設(shè)備,包括第一解碼單元,其根據(jù)不同于基于MDCT的譯碼方式的異質(zhì)譯碼方式來(lái)解碼被編碼的輸入信號(hào)的語(yǔ)音特征信號(hào);第二解碼單元,其根據(jù)基于MDCT的譯碼方式來(lái)解碼被編碼的輸入信號(hào)的音頻特征信號(hào);和塊補(bǔ)償單元,其針對(duì)第一解碼單元的結(jié)果和第二解碼單元的結(jié)果來(lái)執(zhí)行塊補(bǔ)償并還原輸入信號(hào),其中,當(dāng)所述輸入信號(hào)的當(dāng)前幀中存在在語(yǔ)音特征信號(hào)和音頻特征信號(hào)之間發(fā)生切換的折點(diǎn)時(shí),所述塊補(bǔ)償單元應(yīng)用不超過(guò)所述折點(diǎn)的合成窗口。
10.如權(quán)利要求9所述的解碼設(shè)備,其中,所述塊補(bǔ)償單元,對(duì)額外信息應(yīng)用第一合成窗口,并對(duì)當(dāng)前幀應(yīng)用第二合成窗口來(lái)執(zhí)行重疊相加操作,所述額外信息通過(guò)第一解碼單元來(lái)提取,且所述當(dāng)前幀通過(guò)第二解碼單元來(lái)提取。
11.如權(quán)利要求10所述的解碼設(shè)備,其中,所述塊補(bǔ)償單元應(yīng)用第二合成窗口,所述第二合成窗口基于所述折點(diǎn)被配置為具有值0并對(duì)應(yīng)第一子塊的窗口、對(duì)應(yīng)第二子塊中額外信息區(qū)域的窗口、具有值1并對(duì)應(yīng)第二子塊中其余區(qū)域的窗口,在這里所述第一子塊表示語(yǔ)音特征信號(hào),且所述第二子塊表示音頻特征信號(hào)。
12.如權(quán)利要求9所述的解碼設(shè)備,其中,所述第二解碼單元,解碼輸入信號(hào)的當(dāng)前幀中與折點(diǎn)不相鄰的塊,且所述塊補(bǔ)償單元, 對(duì)輸入信號(hào)的當(dāng)前幀中與折點(diǎn)相鄰的子塊應(yīng)用第二合成窗口。
13.如權(quán)利要求9所述的解碼設(shè)備,其中,所述第一解碼單元,解碼根據(jù)異質(zhì)譯碼方式編碼的額外信息,來(lái)還原輸入信號(hào)的當(dāng)前幀中的音頻特征信號(hào)。
14.如權(quán)利要求9所述的解碼設(shè)備,其中,當(dāng)所述當(dāng)前幀被配置為具有N/4大小的子塊時(shí),所述折點(diǎn)被設(shè)置在N/4或3N/4點(diǎn)處。
15.一種解碼設(shè)備,包括塊補(bǔ)償單元,當(dāng)輸入信號(hào)的當(dāng)前幀中存在在語(yǔ)音特征信號(hào)和音頻特征信號(hào)之間發(fā)生切換的折點(diǎn)時(shí),其對(duì)所述當(dāng)前幀和從語(yǔ)音特征信號(hào)中提取出的額外信息分別應(yīng)用合成窗口, 來(lái)還原輸入信號(hào)。
16.如權(quán)利要求15所述的解碼設(shè)備,其中,所述塊補(bǔ)償單元,通過(guò)對(duì)當(dāng)前幀和額外信息應(yīng)用不超過(guò)折點(diǎn)的合成窗口,來(lái)執(zhí)行重疊相加操作。
17.如權(quán)利要求15所述的解碼設(shè)備,其中,所述塊補(bǔ)償單元應(yīng)用合成窗口,所述合成窗口基于所述折點(diǎn)被配置為具有值0并對(duì)應(yīng)第一子塊的窗口、對(duì)應(yīng)第二子塊中額外信息區(qū)域的窗口、具有值1并對(duì)應(yīng)第二子塊中其余區(qū)域的窗口,在這里所述第一子塊表示語(yǔ)音特征信號(hào),且所述第二子塊表示音頻特征信號(hào)。
18.如權(quán)利要求17所述的解碼設(shè)備,其中,所述塊補(bǔ)償單元,對(duì)與輸入信號(hào)的當(dāng)前幀中的折點(diǎn)相鄰的子塊應(yīng)用合成窗口。
19.如權(quán)利要求15所述的解碼設(shè)備,其中,當(dāng)所述當(dāng)前幀被配置為具有N/4大小的子塊時(shí),所述折點(diǎn)被設(shè)置在N/4或3N/4點(diǎn)處。
全文摘要
本發(fā)明提供了在基于MDCT的譯碼器(205)和異質(zhì)譯碼器(204)之間轉(zhuǎn)換的編碼設(shè)備(101)和解碼設(shè)備。當(dāng)在基于MDCT的譯碼器(205)和異質(zhì)譯碼器(204)之間發(fā)生交換時(shí),所述編碼設(shè)備(101)可編碼附加信息以還原根據(jù)基于MDCT的譯碼方式編碼的輸入信號(hào)。由此,能夠防止生成不必要的比特流,且可編碼最小限度的附加信息。
文檔編號(hào)G10L19/14GK102216982SQ200980145832
公開(kāi)日2011年10月12日 申請(qǐng)日期2009年9月18日 優(yōu)先權(quán)日2008年9月18日
發(fā)明者姜京玉, 張大永, 樸浩綜, 樸榮喆, 李泰辰, 洪鎮(zhèn)佑, 白承權(quán), 金珉第 申請(qǐng)人:光云大學(xué)校 產(chǎn)學(xué)協(xié)力團(tuán), 韓國(guó)電子通信研究院
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1