編碼方法和解碼方法
【專利摘要】本發(fā)明提供了編碼方法和解碼方法。該編碼方法包括:根據(jù)不同于修正離散余弦變換(MDCT)編碼方案的異質(zhì)編碼方案,來編碼輸入信號的語音特征信號;和根據(jù)該MDCT編碼方案來編碼所述輸入信號的音頻特征信號,其中所述編碼語音特征信號的步驟包括:當(dāng)在該輸入信號中的語音特征信號和音頻特征信號之間發(fā)生切換時,編碼該語音特征信號中的額外信息。
【專利說明】編碼方法和解碼方法
[0001 ] 本專利申請是下列發(fā)明專利申請的分案申請:
[0002] 申請?zhí)枺?00980145832. X
[0003] 申請日:2009年9月18日
[0004] 發(fā)明名稱:在基于修正離散余弦變換的譯碼器與異質(zhì)譯碼器間轉(zhuǎn)換的編碼設(shè)備和 解碼設(shè)備
【技術(shù)領(lǐng)域】
[0005] 本發(fā)明涉及一種設(shè)備與方法,其用于在把基于修正離散余弦變換(MDCT)的音頻 譯碼器和不同的語音/音頻譯碼器相結(jié)合來編解碼音頻信號時,減少在執(zhí)行不同類型譯碼 器轉(zhuǎn)換時生成的扭曲(artifact)。
【背景技術(shù)】
[0006] 當(dāng)根據(jù)輸入信號的特征而對語音和音頻相結(jié)合的輸入信號應(yīng)用不同的編碼/解 碼方法時,可改善性能和音質(zhì)。例如,對具有語音信號相似特征的信號應(yīng)用基于碼激勵線性 預(yù)測 CELP 的編碼器(Code Excited Linear Prediction-based encoder),而對與音頻信 號相同的信號應(yīng)用基于變頻的編碼器(frequency conversion-based encoder),是有效率 的。
[0007] 通過應(yīng)用上面所述的概念,可開發(fā)統(tǒng)一語音和音頻編碼USAC (Unified Speech and Audio Coding)。該USAC可不斷地接收輸入信號并在特定時間分析輸入信號。然后,USAC 可通過根據(jù)輸入信號的特征進行切換來應(yīng)用不同類型的編碼設(shè)備,來編碼輸入信號。
[0008] USAC中的信號切換(signal switching)過程中,會生成信號扭曲(signal artifact)。由于USAC為每個區(qū)塊編碼輸入信號,所以在應(yīng)用不同類型的編碼時會生成塊 扭曲(blocking artifact)。為了克服這種缺點,USAC可在應(yīng)用不同編碼時對塊應(yīng)用窗口, 來執(zhí)行重疊相加操作。但是,這種情況下,可能會因為重疊而需要額外的比特流信息,且當(dāng) 頻繁出現(xiàn)切換時,用于消除塊扭曲的額外的比特流可能會增加。當(dāng)比特流增加,編碼效率會 降低。
[0009] 特別是,USAC可采用基于修正離散余弦變換(MDCT)的編碼設(shè)備來編碼音頻特征 信號。MDCT方式可將時域的輸入信號變換為頻域的輸入信號,并在塊間執(zhí)行重疊相加操作。 MDCT方式具有即使執(zhí)行重疊相加操作,比特率也可能不會增加的優(yōu)點,但存在可能會在時 域中生成混疊的缺點。
[0010] 在這種情況下,基于MDCT方式,50 %重疊相加操作會被對相鄰塊執(zhí)行來還原輸入 信號。也就是說,要被輸出的當(dāng)前塊可基于前一個塊的輸出結(jié)果被解碼。但是,當(dāng)前一個塊 沒有使用MDCT方式的USAC被編碼時,使用MDCT方式編碼的當(dāng)前塊,可能無法通過重疊相 加操作解碼,因為前一個塊的MDCT信息可能無法使用。因此,在切換之后使用MDCT方式編 碼當(dāng)前塊時,USAC可能會額外要求前一個塊的MDCT信息。
[0011] 當(dāng)頻繁發(fā)生切換時,用于解碼的額外的MDCT信息比例可增加至切換量。在這種情 況下,比特率會由于額外的MDCT信息而增加,而編碼效率可能會明顯降低。因此,需要一種 方法,來在切換過程中去除塊扭曲并盡可能減少額外的MDCT信息。
【發(fā)明內(nèi)容】
[0012] 本發(fā)明的一個方面,提供了一種編碼方法及設(shè)備和解碼方法及設(shè)備,其可去除塊 信號扭曲并盡可能減少切換時所需的MDCT信息。
[0013] 根據(jù)本發(fā)明的一個方面,提供了第一編碼單元,其根據(jù)不同于基于MDCT的譯 石馬方式(Modified Discrete Cosine Transform-based coding scheme)的異質(zhì)譯石馬方 式(hetero coding scheme)來編碼輸入信號的語音特征信號(speech characteristic signal);和第二編碼單元,其根據(jù)基于MDCT的譯碼方式來編碼輸入信號的音頻特征信號 (audio characteristic signal)。當(dāng)所述輸入信號的當(dāng)前巾貞中存在在語音特征信號和音 頻特征信號之間發(fā)生切換的折點(folding point)時,所述第二編碼單元,可通過應(yīng)用不超 過所述折點的分析窗口來執(zhí)行編碼。折點可以是當(dāng)MDCT和反MDCTaMDCT :Inverse MDCT) 被執(zhí)行時,混疊信號被折疊處的區(qū)域。當(dāng)執(zhí)行N點MDCT (N-point MDCT)時,折點可位于N/4 和3N/4點處。折點可以是與MDCT相關(guān)的眾所周知的特征的任何一個,用于折點的數(shù)學(xué)基 礎(chǔ)(mathematical basis)在此將不做說明。另外,MDCT和折點的概念的描述,將參照圖5 詳細說明。
[0014] 此外,為方便說明,當(dāng)前一個幀信號是語音特征信號而當(dāng)前幀是音頻特征信號時, 當(dāng)連接兩種不同類型特征的信號時使用的折點,以下可稱為"發(fā)生切換處的折點"。同時,當(dāng) 后一個幀信號是語音特征信號而當(dāng)前幀信號是音頻特征信號時,在連接兩個不同類型特征 的信號時使用的折點,以下可稱為"發(fā)生切換處的折點"。
[0015] 根據(jù)本發(fā)明的一個方面,提供了一種編碼設(shè)備,包括:窗口處理單元,其對輸入信 號的當(dāng)前幀應(yīng)用分析窗口;MDCT變換單元,其針對應(yīng)用了分析窗口的當(dāng)前幀執(zhí)行MDCT變 換;和比特流生成單元,其編碼已進行了 MDCT變換的當(dāng)前幀并生成輸入信號的比特流。當(dāng) 所述輸入信號的當(dāng)前幀中存在在語音特征信號和音頻特征信號之間發(fā)生切換的折點時,所 述窗口處理單元應(yīng)用不超過折點的分析窗口。
[0016] 根據(jù)本發(fā)明的一個方面,提供了一種解碼設(shè)備,包括:第一解碼單元,其根據(jù)不同 于基于MDCT的譯碼方式的異質(zhì)譯碼方式來解碼被編碼的輸入信號的語音特征信號;第二 解碼單元,其根據(jù)基于MDCT的譯碼方式來解碼被編碼的輸入信號的音頻特征信號;和塊 補償單元,其針對第一解碼單元的結(jié)果和第二解碼單元的結(jié)果來執(zhí)行塊補償并還原輸入信 號。當(dāng)所述輸入信號的當(dāng)前幀中存在在語音特征信號和音頻特征信號之間發(fā)生切換的折點 時,所述塊補償單元應(yīng)用不超過所述折點的合成窗口。
[0017] 根據(jù)本發(fā)明的一個方面,提供一種解碼設(shè)備,包括:塊補償單元,當(dāng)輸入信號的當(dāng) 前幀中存在在語音特征信號和音頻特征信號之間發(fā)生切換的折點時,其對所述當(dāng)前幀和從 語音特征信號中提取出的額外的信息分別應(yīng)用合成窗口,來還原輸入信號。
[0018] 根據(jù)本發(fā)明的一個方面,提供一種編碼方法,包括:根據(jù)不同于修正離散余弦變換 (MDCT)編碼方案的異質(zhì)編碼方案,來編碼輸入信號的語音特征信號;和根據(jù)該MDCT編碼方 案來編碼所述輸入信號的音頻特征信號,其中所述編碼語音特征信號的步驟包括:當(dāng)在該 輸入信號中的語音特征信號和音頻特征信號之間發(fā)生切換時,編碼該語音特征信號中的額 外信息。
[0019] 根據(jù)本發(fā)明的一個方面,提供一種編碼方法,包括:向指示音頻特征信號的當(dāng)前幀 應(yīng)用分析窗口;針對其中應(yīng)用分析窗口的當(dāng)前幀來執(zhí)行MDCT ;編碼當(dāng)前幀;和生成包括編 碼的當(dāng)前幀和額外信息的輸入信號的比特流,其中該額外信息對應(yīng)于語音特征信號中的區(qū) 域,用于基于該MDCT編碼方案來還原當(dāng)前幀。
[0020] 根據(jù)本發(fā)明的一個方面,提供一種解碼方法,包括:對根據(jù)不同于MDCT編碼方案 的異質(zhì)編碼方案所編碼的輸入信號的語音特征信號進行解碼;對根據(jù)該MDCT編碼方案所 編碼的輸入信號的音頻特征信號進行解碼;和基于解碼結(jié)果還原該輸入信號,其中所述解 碼音頻特征信號的步驟包括:當(dāng)在該語音特征信號和該音頻特征信號之間發(fā)生切換時,基 于該額外信息來執(zhí)行塊補償。
[0021] 根據(jù)本發(fā)明的一個方面,提供一種解碼方法,包括:基于不同于MDCT編碼方案的 異質(zhì)編碼方案,來對與語音特征信號相關(guān)的編碼后額外信息進行解碼;基于解碼后額外信 息來解碼音頻特征信號,其中當(dāng)在該語音特征信號和該音頻特征信號之間發(fā)生切換時,對 編碼后額外信息進行編碼。
[0022] 技術(shù)效果
[0023] 根據(jù)本發(fā)明的一個方面,提供了一種編碼方法及設(shè)備和解碼方法及設(shè)備,其可減 少根據(jù)輸入信號的特征在不同類型的譯碼器之間發(fā)生切換時所需的額外MDCT信息,并去 除塊信號扭曲。
[0024] 此外,根據(jù)本發(fā)明的一個方面,提供了一種編碼方法及設(shè)備和解碼方法及設(shè)備,其 可減少根據(jù)輸入信號的特征在不同類型的譯碼器之間發(fā)生切換時所需的額外MDCT信息, 并阻止比特率增加,改善編碼效率。
【專利附圖】
【附圖說明】
[0025] 圖1是示出根據(jù)本發(fā)明的一實施例的編碼設(shè)備和解碼設(shè)備的框圖;
[0026] 圖2是示出根據(jù)本發(fā)明的一實施例的編碼設(shè)備的配置的框圖;
[0027] 圖3是示出根據(jù)本發(fā)明的一實施例的通過第二編碼單元來編碼輸入信號的操作 的示圖;
[0028] 圖4是示出根據(jù)本發(fā)明的一實施例的通過窗口處理來編碼輸入信號的操作的示 圖;
[0029] 圖5是示出根據(jù)本發(fā)明的一實施例的MDCT(Modified Discrete Cosine Transform,修正離散余弦變換)操作的示圖;
[0030] 圖6是示出根據(jù)本發(fā)明的一實施例的異質(zhì)譯碼操作Cl、C2的示圖;
[0031] 圖7是示出根據(jù)本發(fā)明的一實施例的在Cl中生成比特流操作的示圖;
[0032] 圖8是示出根據(jù)本發(fā)明的一實施例的在Cl中通過窗口處理來編碼輸入信號的操 作的示圖;
[0033] 圖9是示出根據(jù)本發(fā)明的一實施例的在C2中生成比特流操作的示圖;
[0034] 圖10是示出根據(jù)本發(fā)明的一實施例的在C2中通過窗口處理來編碼輸入信號的操 作的示圖;
[0035] 圖11是示出根據(jù)本發(fā)明的一實施例的當(dāng)輸入信號被編碼時應(yīng)用的額外信息的示 圖;
[0036] 圖12是示出根據(jù)本發(fā)明的一實施例的解碼設(shè)備的配置的框圖;
[0037] 圖13是示出根據(jù)本發(fā)明的一實施例的通過第二解碼單元來解碼比特流的操作的 示圖;
[0038] 圖14是示出根據(jù)本發(fā)明的一實施例的通過重疊相加操作提取輸出信號的操作的 示圖;
[0039] 圖15是示出根據(jù)本發(fā)明的一實施例的在Cl中生成輸出信號的操作的示圖;
[0040] 圖16是示出根據(jù)本發(fā)明的一實施例的在Cl中的塊補償操作的示圖;
[0041] 圖17是示出根據(jù)本發(fā)明的一實施例的在C2中生成輸出信號的操作的示圖;和
[0042] 圖18是示出根據(jù)本發(fā)明的一實施例的在C2中的塊補償操作的示圖。
【具體實施方式】
[0043] 現(xiàn)在將參照附圖對本發(fā)明的實施例進行詳細描述,所述實施例的示例在附圖中被 示出,其中相同的參照數(shù)字始終表示相同的元素。下面將參照數(shù)字描述實施例,以對本發(fā)明 進行說明。
[0044] 圖1是示出根據(jù)本發(fā)明的一實施例的編碼設(shè)備101和解碼設(shè)備102的框圖。
[0045] 所述編碼設(shè)備101可通過為每個塊編碼輸入信號生成比特流。在這種情況下,編 碼設(shè)備101可編碼語音特征信號和音頻特征信號。語音特征信號可具有與嗓音信號相似的 特征,音頻特征信號可具有與音頻信號相似的特征。編碼結(jié)果,生成輸入信號的相關(guān)比特 流,并被傳送到解碼設(shè)備102。解碼設(shè)備102可通過解碼比特流來生成輸出信號,并由此還 原被編碼的輸入信號。
[0046] 具體來說,編碼設(shè)備101可分析不斷輸入的信號的狀態(tài),并根據(jù)分析的結(jié)果進行 切換來應(yīng)用對應(yīng)輸入信號的特征的編碼方式。由此,編碼設(shè)備101可編碼應(yīng)用了異質(zhì)譯 碼方式處的塊。例如,編碼設(shè)備101可根據(jù)碼激勵線性預(yù)測CELP(Code Excited Linear Prediction)方式編碼語音特征信號并根據(jù)修正離散余弦變換MDCT方式編碼音頻特征信 號。相反,解碼設(shè)備102,可通過根據(jù)CELP方式來解碼根據(jù)CELP方式編碼的輸入信號,并根 據(jù)MDCT方式來解碼根據(jù)MDCT方式編碼的輸入信號,來還原輸入信號。
[0047] 在這種情況下,當(dāng)輸入信號被從語音特征信號切換到音頻特征信號時,編碼設(shè)備 101可通過從CELP方式切換到MDCT方式來進行編碼。由于每個塊都進行編碼,可能會生成 塊扭曲。在這種情況下,解碼設(shè)備102可通過在塊間進行重疊相加操作來去除塊扭曲。
[0048] 此外,當(dāng)輸入信號的當(dāng)前塊根據(jù)MDCT方式被編碼時,還原輸入信號需要前一個塊 的MDCT信息。但是,當(dāng)前一個塊是根據(jù)CELP方式被編碼時,由于前一個塊的MDCT信息不 存在,所以根據(jù)MDCT方式會無法還原當(dāng)前塊。因此,需要前一個塊的額外的MDCT信息。此 夕卜,所述編碼設(shè)備101可減少額外的MDCT信息從而可以防止比特率增加。
[0049] 圖2是示出根據(jù)本發(fā)明的一實施例的編碼設(shè)備的配置的框圖。
[0050] 參照圖2,編碼設(shè)備101可包括塊延遲單元201、狀態(tài)分析單元202、信號切割單元 203、第一編碼單元204、和第二編碼單元205。
[0051] 塊延遲單元201可為每個塊延遲輸入信號。輸入信號可以為每個塊被處理用來編 碼。塊延遲單元201可后退延遲(-)或向前延遲(+)輸入的當(dāng)前塊。
[0052] 狀態(tài)分析單元202可確定輸入信號的特征。例如,狀態(tài)分析單元202可決定輸入 信號是語音特征信號還是音頻特征信號。在這種情況下,狀態(tài)分析單元202可輸出控制參 數(shù)。該控制參數(shù)可用于確定哪些編碼方式用于編碼輸入信號的當(dāng)前塊。
[0053] 例如,狀態(tài)分析單元202可分析輸入信號的特征,并將信號周期對應(yīng)下列 狀態(tài)的信號確定為語音特征信號,即:⑴呈現(xiàn)出清晰并穩(wěn)定諧波分量的穩(wěn)定諧波 SH(steady-harmonic)狀態(tài);(2)在低頻率帶寬呈現(xiàn)出強大穩(wěn)定特征且呈現(xiàn)出較長周期的 諧波分量的低穩(wěn)定諧波LSH(low steady harmonic)狀態(tài);(3)穩(wěn)定噪聲SN(steady-noise) 狀態(tài)。狀態(tài)分析單元202可分析輸入信號的特征,并將信號周期對應(yīng)下列狀態(tài)的信號確 定為音頻特征信號,即:(4)呈現(xiàn)出不同的音調(diào)分量被結(jié)合的復(fù)雜和聲結(jié)構(gòu)的復(fù)雜諧波 CH(complex-harmonic)狀態(tài);(5)包括不穩(wěn)定噪聲分量的復(fù)雜噪聲狀態(tài)。在這里,所述信號 周期可對應(yīng)輸入信號的塊單位。
[0054] 信號切割單元203可使塊單位的輸入信號成為子集。
[0055] 第一編碼單元204可在塊單位的輸入信號之中編碼語音特征信號。例如,第一編 碼單元204可根據(jù)線性預(yù)測譯碼LPC (Linear Predictive Coding)編碼時域中的語音特征 信號。在這種情況下,第一編碼單元204可根據(jù)基于CELP的譯碼方式來編碼所述語音特征 信號。雖然圖3示出了單一第一編碼單元204,但也可以配置一個或多個第一編碼單元。
[0056] 第二編碼單元205可在塊單位的輸入信號之中編碼音頻特征信號。例如,第二編 碼單元205可將音頻特征信號從時域變換到頻域以進行編碼。這種情況下,第二編碼單元 205可根據(jù)基于MDCT方式的譯碼方式來編碼音頻特征信號。比特流中可生成第一解碼單 元204的結(jié)果和第二編碼單元205的結(jié)果,且在每個編碼單元中生成的比特流可通過比特 流多路復(fù)用器(MUX)被控制為單一比特流。
[0057] 也就是說,編碼設(shè)備101可通過根據(jù)狀態(tài)分析單元202的控制參數(shù)進行切換,通 過第一編碼單元204、第二編碼單元205中的任何一個來編碼輸入信號。同時,第一編碼單 元204可根據(jù)不同于基于MDCT的譯碼方式的異質(zhì)譯碼方式,來編碼輸入信號的語音特征信 號。此外,第二編碼單元205可根據(jù)基于MDCT的譯碼方式,來編碼輸入信號的音頻特征信 號。
[0058] 圖3是示出根據(jù)本發(fā)明的一實施例的通過第二編碼單元來編碼輸入信號的操作 的示圖。
[0059] 參照圖3,第二編碼單元205可包括窗口處理單元301、MDCT變換單元302、比特流 生成單元303。
[0060] 在圖3中,X (b)可指輸入信號的基本塊單位。輸入信號將參照圖4和圖6來詳細 說明。輸入信號可被輸入到窗口處理單元301,也可通過塊延遲單元201被輸入到窗口處理 單元301。
[0061] 窗口處理單元301,可對輸入信號的當(dāng)前幀應(yīng)用分析窗口。具體來說,窗口處理單 元301可對當(dāng)前塊X(b)和延遲的塊X(b-2)應(yīng)用分析窗口。當(dāng)前塊X(b)可通過塊延遲單 元201被后退延遲到前一個塊X (b-2)。
[0062] 例如,當(dāng)當(dāng)前幀中存在在語音特征信號和音頻特征信號之間發(fā)生切換的折點時, 窗口處理單元301,可對當(dāng)前幀應(yīng)用不超過折點的分析窗口。在這種情況下,窗口處理單元 301,可應(yīng)用所述分析窗口,所述分析窗口可基于所述折點被配置為:具有值0并對應(yīng)第一 子塊的窗口、對應(yīng)第二子塊中額外信息區(qū)域的窗口、具有值1并對應(yīng)第二子塊中其余區(qū)域 的窗口。在這里,所述第一子塊可表示語音特征信號,且所述第二子塊可表示音頻特征信 號。
[0063] 由塊延遲單元201執(zhí)行的塊延遲的度,可根據(jù)輸入信號的塊單位有所不同。當(dāng)輸入 信號通過窗口處理單元301時,分析窗口可被應(yīng)用,且由此{X(b-2),X(b)} ? Walialysis 可被提取。由此,MDCT變換單元302可針對應(yīng)用了分析窗口的當(dāng)前幀執(zhí)行MDCT。此外,t匕 特流生成單元303可編碼當(dāng)前幀并生成輸入信號的比特流。
[0064] 圖4是示出根據(jù)本發(fā)明的一實施例的通過窗口處理來編碼輸入信號的操作的示 圖。
[0065] 參照圖4,窗口處理單元301,可對輸入信號應(yīng)用分析窗口。在這種情況下,分析窗 口可以是矩形或正弦形式。分析窗口的形式可根據(jù)輸入信號有所不同。
[0066] 當(dāng)當(dāng)前塊X(b)被輸入,窗口處理單元301可對當(dāng)前塊X(b)和前一個塊X(b_2)應(yīng) 用分析窗口。在這里,前一個塊X (b-2)可被塊延遲單元102后退延遲。例如,塊X (b)可按 照如下給出的公式1被設(shè)置為輸入信號的基本單位。在這種情況下,兩個塊可被設(shè)置為單 一的巾貞并被編碼。
[0067] [公式 1]
[0068] X(b) = [s (b~l), s (b) ]τ
[0069] 在這種情況下,s (b)可指被配置為單一塊的子塊,并可被定義為:
[0070] [公式 2]
[0071] s (b) = [s ((b_l) · N/4),s ((b_l) · N/4+1),· · ·,s ((b_l) · N/4+N/4-1) ]τ
[0072] s (η):輸入信號的一個采樣。
[0073] 在這里,N可指輸入信號的塊的大小。也就是說,輸入信號中可包括多個塊,且每 個塊可包括兩個子塊。包含在單一塊中的子塊的數(shù)目可以根據(jù)系統(tǒng)配置和輸入信號有所不 同。
[0074] 例如,可按如下給出的公式3定義分析窗口。此外,根據(jù)公式2和公式3,對輸入信 號的當(dāng)前塊應(yīng)用分析窗口的結(jié)果,可以表示為公式4。
[0075] [公式 3]
[0076] Wanalysis = [W1, w2, w3, w4]τ
[0077] Wi = [Wi(O),..., Wi (N/4-1) ]τ
[0078] [公式 4]
[0079]
【權(quán)利要求】
1. 一種編碼方法,包括: 根據(jù)不同于修正離散余弦變換(MDCT)編碼方案的異質(zhì)編碼方案,來編碼輸入信號的 語音特征信號;和 根據(jù)該MDCT編碼方案來編碼所述輸入信號的音頻特征信號, 其中所述編碼語音特征信號的步驟包括: 當(dāng)在該輸入信號中的語音特征信號和音頻特征信號之間發(fā)生切換時,編碼該語音特征 信號中的額外信息。
2. 如權(quán)利要求1所述的編碼方法,其中所述編碼音頻特征信號的步驟包括: 基于輸入信號中的語音特征信號和音頻特征信號之間發(fā)生切換的折點,來應(yīng)用分析窗 □。
3. 如權(quán)利要求2所述的編碼方法,其中當(dāng)輸入信號的當(dāng)前幀被配置為具有N/4大小的 子塊時,所述折點被設(shè)置在所述當(dāng)前幀的N/4或3N/4點處。
4. 如權(quán)利要求1所述的編碼方法,其中在該語音特征信號中編碼該額外信息,用于在 解碼設(shè)備中基于該MDCT編碼方案來還原音頻特征信號。
5. -種編碼方法,包括: 向指示音頻特征信號的當(dāng)前幀應(yīng)用分析窗口; 針對其中應(yīng)用分析窗口的當(dāng)前幀來執(zhí)行MDCT ; 編碼當(dāng)前幀;和 生成包括編碼的當(dāng)前幀和額外信息的輸入信號的比特流, 其中該額外信息對應(yīng)于語音特征信號中的區(qū)域,用于基于該MDCT編碼方案來還原當(dāng) 前幀。
6. 如權(quán)利要求5所述的編碼方法,其中所述應(yīng)用分析窗口的步驟包括: 基于輸入信號中的語音特征信號和音頻特征信號之間發(fā)生切換的折點,來應(yīng)用分析窗 □。
7. 如權(quán)利要求6所述的編碼方法,其中當(dāng)當(dāng)前幀被配置為具有N/4大小的子塊時,所述 折點被設(shè)置在所述當(dāng)前幀的N/4或3N/4點處。
8. 如權(quán)利要求5所述的編碼方法,其中根據(jù)不同于MDCT編碼方案的異質(zhì)編碼方案,來 編碼該額外信息。
9. 一種解碼方法,包括: 對根據(jù)不同于MDCT編碼方案的異質(zhì)編碼方案所編碼的輸入信號的語音特征信號進行 解碼; 對根據(jù)該MDCT編碼方案所編碼的輸入信號的音頻特征信號進行解碼;和 基于解碼結(jié)果還原該輸入信號, 其中所述解碼音頻特征信號的步驟包括: 當(dāng)在該語音特征信號和該音頻特征信號之間發(fā)生切換時,基于該額外信息來執(zhí)行塊補 償。
10. 如權(quán)利要求9所述的解碼方法,其中當(dāng)在該輸入信號中的語音特征信號和音頻特 征信號之間發(fā)生切換時,在語音特征信號中編碼該額外信息。
11. 如權(quán)利要求9所述的解碼方法,其中基于該異質(zhì)編碼方案來解碼該額外信息,以解 碼該音頻特征信號。
12. 如權(quán)利要求9所述的解碼方法,其中當(dāng)該輸入信號的當(dāng)前幀被配置為具有N/4大小 的子塊時,折點被設(shè)置在所述當(dāng)前幀的N/4或3N/4點處。
13. -種解碼方法,包括: 基于不同于MDCT編碼方案的異質(zhì)編碼方案,來對與語音特征信號相關(guān)的編碼后額外 信息進行解碼; 基于解碼后額外信息來解碼音頻特征信號, 其中當(dāng)在該語音特征信號和該音頻特征信號之間發(fā)生切換時,對編碼后額外信息進行 編碼。
14. 如權(quán)利要求13所述的解碼方法,其中塊補償單元通過向該當(dāng)前幀和該額外信息應(yīng) 用不超出折點的分析窗口,來執(zhí)行重疊相加操作。
15. 如權(quán)利要求13所述的解碼方法,其中通過基于該額外信息應(yīng)用分析窗口,來解碼 該音頻特征信號。
16. 如權(quán)利要求15所述的解碼方法,其中基于輸入信號中的語音特征信號和音頻特征 信號之間發(fā)生切換的折點,來應(yīng)用分析窗口。
17. 如權(quán)利要求16所述的解碼方法,其中當(dāng)該音頻特征信號的當(dāng)前幀被配置為具有 N/4大小的子塊時,所述折點被設(shè)置在所述當(dāng)前幀的N/4或3N/4點處。
【文檔編號】G10L19/02GK104240713SQ201410428865
【公開日】2014年12月24日 申請日期:2009年9月18日 優(yōu)先權(quán)日:2008年9月18日
【發(fā)明者】白承權(quán), 李泰辰, 金珉第, 張大永, 姜京玉, 洪鎮(zhèn)佑, 樸浩綜, 樸榮喆 申請人:韓國電子通信研究院, 光云大學(xué)校 產(chǎn)學(xué)協(xié)力團