聲音編碼方法、聲音譯碼方法、聲音編碼裝置和聲音譯碼裝置的制作方法

文檔序號(hào)：2820773閱讀：189來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：聲音編碼方法、聲音譯碼方法、聲音編碼裝置和聲音譯碼裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及對(duì)聲音信號(hào)進(jìn)行數(shù)字信號(hào)的壓縮編碼譯碼時(shí)使用的聲音編碼譯碼方法和聲音編碼譯碼裝置，特別涉及用來(lái)使用低比特率再生高品質(zhì)的聲音的聲音編碼方法、聲音譯碼方法、聲音編碼裝置和聲音譯碼裝置。
背景技術(shù)：
過(guò)去，作為高效率聲音編碼方法，典型的有碼驅(qū)動(dòng)線性預(yù)測(cè)編碼(Code-Excited Linear PredictionCELP)，對(duì)該技術(shù)，“Code-ExcitedLinear Prediction(CELP)High-quality speech at very 1ow bitrates”(M．R．Shroeder and B．S．Atal著、ICASSP'85，pp．937-940，1985)已有敘述。
圖6是表示一例CELP聲音編碼方法的整體構(gòu)成的圖。圖中101是編碼部，102是譯碼部，103是多路復(fù)用裝置，104是分離裝置。編碼部101由線性預(yù)測(cè)參數(shù)分析裝置105、線性預(yù)測(cè)參數(shù)編碼裝置106、合成濾波器107、適應(yīng)代碼簿108、驅(qū)動(dòng)代碼簿109、增益編碼裝置110、距離計(jì)算裝置111和加權(quán)相加計(jì)算裝置138構(gòu)成。此外，譯碼部102由線性預(yù)測(cè)參數(shù)譯碼裝置112、合成濾波器113、適應(yīng)代碼簿114、驅(qū)動(dòng)代碼簿115、增益譯碼裝置116和加權(quán)相加計(jì)算裝置139構(gòu)成。
在CELP聲音編碼中，將5-50ms作為一幀，將該幀的聲音分成頻譜信息和聲音源信息后進(jìn)行編碼。首先，說(shuō)明CELP聲音編碼方法的動(dòng)作。在編碼部101中，線性預(yù)測(cè)參數(shù)分析裝置105分析輸入聲音S101，抽出作為聲音頻譜信息的線性預(yù)測(cè)參數(shù)。線性預(yù)測(cè)參數(shù)編碼裝置106對(duì)該線性預(yù)測(cè)參數(shù)進(jìn)行編碼，將該編碼后的線性預(yù)測(cè)參數(shù)作為合成濾波器的系數(shù)來(lái)設(shè)定。
其次，說(shuō)明聲音源信息的編碼。在適應(yīng)代碼簿108中，存儲(chǔ)過(guò)去的驅(qū)動(dòng)聲音源信號(hào)，并與距離計(jì)算裝置111輸入的適應(yīng)代碼對(duì)應(yīng)輸出周期性的重復(fù)過(guò)去的驅(qū)動(dòng)聲音源信號(hào)的時(shí)間序列矢量。在驅(qū)動(dòng)代碼簿109中，存儲(chǔ)多個(gè)時(shí)間序列矢量，該時(shí)間序列矢量構(gòu)成為例如能夠進(jìn)行學(xué)習(xí)，使學(xué)習(xí)用聲音和它的編碼聲音的失真很小。從適應(yīng)代碼簿108、驅(qū)動(dòng)代碼簿109來(lái)的各時(shí)間序列矢量與增益編碼裝置110給出的各增益對(duì)應(yīng)，在加權(quán)相加計(jì)算裝置138中進(jìn)行加權(quán)相加，將該計(jì)算結(jié)果作為驅(qū)動(dòng)聲音信號(hào)供給合成濾波器107，得到編碼聲音。距離計(jì)算裝置111求出編碼聲音和輸入聲音S101的距離，尋求距離最小的適應(yīng)代碼、驅(qū)動(dòng)代碼和增益。在上述編碼結(jié)束后，將線性預(yù)測(cè)參數(shù)的代碼以及使輸入聲音和編碼聲音的失真最小的適應(yīng)代碼、驅(qū)動(dòng)代碼、增益的代碼作為編碼結(jié)果輸出。
其次，說(shuō)明CPEL聲音譯碼方法的動(dòng)作。
另一方面，在聲音譯碼部102中，線性預(yù)測(cè)參譯編碼裝置112根據(jù)線性預(yù)測(cè)參數(shù)的代碼對(duì)該線性預(yù)測(cè)參數(shù)進(jìn)行譯碼，并作為合成濾波器的系數(shù)來(lái)設(shè)定。其次，適應(yīng)代碼簿114與適應(yīng)代碼對(duì)應(yīng)輸出周期性的重復(fù)過(guò)去的驅(qū)動(dòng)聲音源信號(hào)的時(shí)間序列矢量，驅(qū)動(dòng)代碼簿115與驅(qū)動(dòng)代碼對(duì)應(yīng)時(shí)間序列矢量。這些時(shí)間序列矢量與增益譯碼裝置中從增益代碼譯碼的各增益對(duì)應(yīng)，在加權(quán)相加計(jì)算裝置139中進(jìn)行加權(quán)相加，將該計(jì)算結(jié)果作為驅(qū)動(dòng)聲音信號(hào)供給合成濾波器113，得到輸出聲音S103。
此外，在CELP聲音編碼譯碼方法中，作為以提高再生聲音品質(zhì)為目的進(jìn)行改良的先有的聲音編碼譯碼方法，有“Phonetically-basedvector excitation coding of speech at 3．6kbps”(S．wang andA．Gersho著、ICASSP'89，pp．49-52，1989)所示的方法。圖7示出一例該先有的聲音編碼譯碼方法的整體構(gòu)成，對(duì)與圖6對(duì)應(yīng)的裝置添加相同的符號(hào)，在圖中的編碼部101中，117是聲音狀態(tài)判定裝置，118是驅(qū)動(dòng)代碼簿切換裝置，119是第1驅(qū)動(dòng)代碼簿，120是第2驅(qū)動(dòng)代碼簿。此外，在圖中的譯碼裝置102中，121是驅(qū)動(dòng)代碼簿切換裝置，122是第1驅(qū)動(dòng)代碼簿，123是第2驅(qū)動(dòng)代碼簿。說(shuō)明這樣構(gòu)成的編碼譯碼方法的動(dòng)作。首先，在編碼裝置101中，聲音狀態(tài)判定裝置117分析輸入聲音S101，判定聲音狀態(tài)例如是有聲、無(wú)聲兩種狀態(tài)中的哪一種狀態(tài)。驅(qū)動(dòng)代碼簿切換裝置118根據(jù)該聲音狀態(tài)的判定結(jié)果切換驅(qū)動(dòng)代碼簿，例如，若是有聲則使用第1驅(qū)動(dòng)代碼簿119編碼，若是無(wú)聲則使用第2驅(qū)動(dòng)代碼簿120編碼，此外，對(duì)使用了哪一個(gè)驅(qū)動(dòng)代碼簿也進(jìn)行編碼。
其次，在譯碼裝置102中，驅(qū)動(dòng)代碼簿切換裝置121與在編碼裝置中使用了哪一個(gè)驅(qū)動(dòng)代碼簿的代碼對(duì)應(yīng)切換到第1驅(qū)動(dòng)代碼簿或第2驅(qū)動(dòng)代碼簿，使其與編碼裝置101使用的驅(qū)動(dòng)代碼簿相同。通過(guò)這樣的構(gòu)成，對(duì)聲音的每一個(gè)狀態(tài)準(zhǔn)備一個(gè)與編碼適應(yīng)的驅(qū)動(dòng)代碼簿，通過(guò)與輸入的聲音狀態(tài)對(duì)應(yīng)切換使用驅(qū)動(dòng)代碼簿，可以提高再生聲音的品質(zhì)。
此外，作為不增加比特?cái)?shù)去切換多個(gè)驅(qū)動(dòng)代碼簿的先有的聲音編碼譯碼方法，有特開平8-185198號(hào)公報(bào)公開的方法。它是與用適應(yīng)代碼簿選擇的音調(diào)周期對(duì)應(yīng)去切換使用多個(gè)驅(qū)動(dòng)代碼簿的方法。因此，可以在不增加傳送信息的情況下使用與輸入信號(hào)的特征相適應(yīng)的驅(qū)動(dòng)代碼簿。
如上所述，在圖6所示的先有的聲音編碼譯碼方法中，使用單一的驅(qū)動(dòng)代碼簿生成合成聲音。為了即使在低比特率時(shí)也能得到高品質(zhì)的編碼聲音，存儲(chǔ)在驅(qū)動(dòng)代碼簿中的時(shí)間序列矢量變成包含很多脈沖的無(wú)噪聲的東西。因此，當(dāng)將背景噪聲或磨擦性子音等有噪聲的聲音編碼合成時(shí)。編碼聲音存在產(chǎn)生“嘰哩嘰哩”“嘁哩嘁哩”等不自然的聲音的問(wèn)題。若使驅(qū)動(dòng)編碼簿只由帶噪聲的時(shí)間序列矢量構(gòu)成，雖然可以解決該問(wèn)題，但作為編碼聲音的整體品質(zhì)卻變差了。
此外，在已改良的圖7所示的先有的聲音編碼譯碼方法中，與輸入聲音的狀態(tài)對(duì)應(yīng)切換多個(gè)驅(qū)動(dòng)代碼簿并生成編碼聲音。因此，對(duì)例如輸入聲音是有噪聲的無(wú)聲部分，可以使用由有噪聲的時(shí)間序列矢量構(gòu)成的驅(qū)動(dòng)代碼簿，對(duì)除此之外的有聲部分可以使用由無(wú)噪聲的時(shí)間序列矢量構(gòu)成的驅(qū)動(dòng)代碼簿，即使對(duì)有噪聲的聲音進(jìn)行編碼、也不會(huì)發(fā)生“嘰哩嘰哩”的聲音。但是，因譯碼側(cè)也使用和編碼側(cè)相同的驅(qū)動(dòng)代碼簿，故有必要對(duì)使用了哪一個(gè)驅(qū)動(dòng)編碼簿的信息重新進(jìn)行編碼傳送，存在妨礙低比特率化的問(wèn)題。
此外，在不增加發(fā)送比特?cái)?shù)的情況下切換多個(gè)驅(qū)動(dòng)代碼簿的先有的聲音編碼譯碼方法中，與用適應(yīng)代碼選擇的音調(diào)周期對(duì)應(yīng)切換驅(qū)動(dòng)代碼簿。但是，因用適應(yīng)代碼選擇的音調(diào)周期與實(shí)際的聲音音調(diào)周期有差別，只根據(jù)該值不能判定輸入聲音的狀態(tài)是有噪聲還是無(wú)噪聲，故不能解決聲音的噪聲部分的編碼聲音不自然的問(wèn)題。
本發(fā)明是為了解決有關(guān)的問(wèn)題而提出的，其目的在于提供一種聲音編碼譯碼方法和聲音編碼譯碼裝置，即使在低比特率的情況下也能再生高品質(zhì)的聲音。
發(fā)明的公開為了解決上述課題，本發(fā)明的聲音編碼方法使用頻譜信息、功率信息和音調(diào)信息中的至少一個(gè)代碼或編碼結(jié)果，對(duì)該編碼區(qū)間中的聲音的噪聲水平進(jìn)行評(píng)價(jià)，根據(jù)評(píng)價(jià)結(jié)果選擇多個(gè)驅(qū)動(dòng)代碼中的一個(gè)。
進(jìn)而，下一個(gè)發(fā)明的聲音編碼方法具有多個(gè)驅(qū)動(dòng)代碼簿，所存儲(chǔ)的時(shí)間序列矢量的噪聲水平不同，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果切換多個(gè)驅(qū)動(dòng)代碼簿。
進(jìn)而，下一個(gè)發(fā)明的聲音編碼方法根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，使存儲(chǔ)在驅(qū)動(dòng)代碼簿中時(shí)間序列矢量的噪聲水平發(fā)生變化。
進(jìn)而，下一個(gè)發(fā)明的聲音編碼方法具有存儲(chǔ)有噪聲的時(shí)間序列矢量的驅(qū)動(dòng)代碼簿，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，通過(guò)問(wèn)拔驅(qū)動(dòng)聲音源的信號(hào)樣品去生成噪聲水平低的時(shí)間序列矢量。
進(jìn)而，下一個(gè)發(fā)明的聲音編碼方法具有存儲(chǔ)有噪聲的時(shí)間序列矢量的第1驅(qū)動(dòng)代碼簿和存儲(chǔ)無(wú)噪聲的時(shí)間序列矢量的第2驅(qū)動(dòng)代碼簿，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，生成將第1驅(qū)動(dòng)代碼簿的時(shí)間序列矢量和第2驅(qū)動(dòng)代碼簿的時(shí)間序列矢量加權(quán)相加后的時(shí)間序列矢量。
進(jìn)而，下一個(gè)發(fā)明的聲音譯碼方法使用頻譜信息、功率信息和音調(diào)信息中的至少一個(gè)代碼或譯碼結(jié)果，對(duì)該譯碼區(qū)間中的聲音的噪聲水平進(jìn)行評(píng)價(jià)，根據(jù)評(píng)價(jià)結(jié)果選擇多個(gè)驅(qū)動(dòng)代碼中的一個(gè)。
進(jìn)而，下一個(gè)發(fā)明的聲音譯碼方法具有多個(gè)驅(qū)動(dòng)代碼簿，所存儲(chǔ)的時(shí)間序列矢量的噪聲水平不同，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果切換多個(gè)驅(qū)動(dòng)代碼簿。
進(jìn)而，下一個(gè)發(fā)明的聲音譯碼方法根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，使存儲(chǔ)在驅(qū)動(dòng)代碼簿中時(shí)間序列矢量的噪聲水平發(fā)生變化。
進(jìn)而，下一個(gè)發(fā)明的聲音譯碼方法具有存儲(chǔ)有噪聲的時(shí)間序列矢量的驅(qū)動(dòng)代碼簿，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，通過(guò)間拔驅(qū)動(dòng)聲音源的信號(hào)樣品去生成噪聲水平低的時(shí)間序列矢量。
進(jìn)而，下一個(gè)發(fā)明的聲音譯碼方法具有存儲(chǔ)有噪聲的時(shí)間序列矢量的第1驅(qū)動(dòng)代碼簿和存儲(chǔ)無(wú)噪聲的時(shí)間序列矢量的第2驅(qū)動(dòng)代碼簿，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，生成將第1驅(qū)動(dòng)代碼簿的時(shí)間序列矢量和第2驅(qū)動(dòng)代碼簿的時(shí)間序列矢量加權(quán)相加后的時(shí)間序列矢量。
進(jìn)而，下一個(gè)發(fā)明的聲音編碼裝置包括頻譜信息編碼部，對(duì)輸入聲音的頻譜信息進(jìn)行編碼并作為編碼結(jié)果的一個(gè)要素輸出；噪聲水平評(píng)價(jià)部，使用根據(jù)從該頻譜信息編碼部來(lái)的已編碼的頻譜信息得到的頻譜信息和功率信息中的至少一個(gè)代碼或編碼結(jié)果，對(duì)該編碼區(qū)間內(nèi)的聲音的噪聲水平進(jìn)行評(píng)價(jià)并輸出評(píng)價(jià)結(jié)果；存儲(chǔ)多個(gè)無(wú)噪聲的時(shí)間序列矢量的第1驅(qū)動(dòng)代碼簿；存儲(chǔ)多個(gè)有噪聲的時(shí)間序列矢量的第2驅(qū)動(dòng)代碼簿；根據(jù)上述噪聲水平評(píng)價(jià)部的評(píng)價(jià)結(jié)果切換第1驅(qū)動(dòng)代碼簿和第2驅(qū)動(dòng)代碼簿的驅(qū)動(dòng)代碼簿切換部；加權(quán)相加計(jì)算部，對(duì)從上述第1驅(qū)動(dòng)代碼簿或第2驅(qū)動(dòng)代碼簿來(lái)的時(shí)間序列矢量，分別與各時(shí)間序列矢量的增益對(duì)應(yīng)進(jìn)行加權(quán)相加；合成濾波器，將該加權(quán)的時(shí)間序列矢量作為驅(qū)動(dòng)聲音源信號(hào)，在該驅(qū)動(dòng)聲音源信號(hào)和從上述頻譜信息編碼部來(lái)的已編碼的頻譜信息的基礎(chǔ)上得到編碼聲音；距離計(jì)算部，求出該編碼聲音和上述輸入聲音的距離，尋求距離最小的驅(qū)動(dòng)代碼和增益，并將該結(jié)果作為驅(qū)動(dòng)代碼和增益代碼的編碼結(jié)果輸出。
進(jìn)而，下一個(gè)發(fā)明的聲音譯碼裝置包括頻譜信息譯碼部，從頻譜信息的代碼中譯碼出頻譜信息；噪聲水平評(píng)價(jià)部，使用根據(jù)從該頻譜信息譯碼部來(lái)的已譯碼的頻譜信息得到的頻譜信息和功率信息中的至少一個(gè)譯碼結(jié)果或上述頻譜信息的代碼，對(duì)該譯碼區(qū)間內(nèi)的聲音的噪聲水平進(jìn)行評(píng)價(jià)并輸出評(píng)價(jià)結(jié)果；存儲(chǔ)多個(gè)無(wú)噪聲的時(shí)間序列矢量的第1驅(qū)動(dòng)代碼簿；存儲(chǔ)多個(gè)有噪聲的時(shí)間序列矢量的第2驅(qū)動(dòng)代碼簿；根據(jù)上述噪聲水平評(píng)價(jià)部的評(píng)價(jià)結(jié)果切換第1驅(qū)動(dòng)代碼簿和第2驅(qū)動(dòng)代碼簿的驅(qū)動(dòng)代碼簿切換部；加權(quán)相加計(jì)算部，對(duì)從上述第1驅(qū)動(dòng)代碼簿或第2驅(qū)動(dòng)代碼簿來(lái)的時(shí)間序列矢量，分別與各時(shí)間序列矢量的增益對(duì)應(yīng)進(jìn)行加權(quán)相加；合成濾波器，將該加權(quán)的時(shí)間序列矢量作為驅(qū)動(dòng)聲音源信號(hào)，在該驅(qū)動(dòng)聲音源信號(hào)和從上述頻譜信息譯碼部來(lái)的已譯碼的頻譜信息的基礎(chǔ)上得到譯碼聲音。
本發(fā)明的聲音編碼裝置的特征在于，在編碼驅(qū)動(dòng)線性預(yù)測(cè)(CELP)聲音編碼裝置中，包括使用頻譜信息、功率信息和音調(diào)信息中的至少一個(gè)代碼或編碼結(jié)果對(duì)該編碼區(qū)間內(nèi)的聲音的噪聲水平進(jìn)行評(píng)價(jià)的噪聲水平評(píng)價(jià)部；根據(jù)上述噪聲水平評(píng)價(jià)部的評(píng)價(jià)結(jié)果切換多個(gè)驅(qū)動(dòng)代碼簿的驅(qū)動(dòng)代碼簿切換部。
本發(fā)明的聲音譯碼裝置的特征在于，在編碼驅(qū)動(dòng)線性預(yù)測(cè)(CELP)聲音譯碼裝置中，包括使用頻譜信息、功率信息和音調(diào)信息中的至少一個(gè)代碼或譯碼結(jié)果對(duì)該譯碼區(qū)問(wèn)內(nèi)的聲音的噪聲水平進(jìn)行評(píng)價(jià)的噪聲水平評(píng)價(jià)部；根據(jù)上述噪聲水平評(píng)價(jià)部的評(píng)價(jià)結(jié)果切換多個(gè)驅(qū)動(dòng)代碼簿的驅(qū)動(dòng)代碼簿切換部。
附圖的簡(jiǎn)單說(shuō)明圖1是表示本發(fā)明的聲音編碼和聲音譯碼裝置的實(shí)施形態(tài)1的整體構(gòu)成的方框圖。
圖2是向圖1的實(shí)施形態(tài)1的噪聲水平評(píng)價(jià)的說(shuō)明提供的表。
圖3是表示本發(fā)明的聲音編碼和聲音譯碼裝置的實(shí)施形態(tài)3的整體構(gòu)成的方框圖。
圖4是表示本發(fā)明的聲音編碼和聲音譯碼裝置的實(shí)施形態(tài)5的整體構(gòu)成的方框圖。
圖5是向圖4的實(shí)施形態(tài)5的加權(quán)決定處理的說(shuō)明提供的表。
圖6是表示先有的CELP聲音編碼譯碼裝置的整體構(gòu)成的方框圖。
圖7是表示過(guò)去改良了的CELP聲音編碼譯碼裝置的整體構(gòu)成的方框圖。
實(shí)施本發(fā)明的最佳形態(tài)下面，參照

本發(fā)明的實(shí)施形態(tài)。
實(shí)施形態(tài)1。
圖1示出本發(fā)明的聲音編碼方法和聲音譯碼方法的實(shí)施形態(tài)1的整體構(gòu)成的方框圖。圖中，1是編碼部，2是譯碼部，3是多路復(fù)用部，4是分離部。編碼部1由線性預(yù)測(cè)參數(shù)分析部5、線性預(yù)測(cè)參數(shù)編碼部6、合成濾波器7、適應(yīng)代碼簿8、增益編碼部10、距離計(jì)算裝置11、第1驅(qū)動(dòng)代碼簿19、第2驅(qū)動(dòng)代碼簿20、噪聲水平評(píng)價(jià)部24、驅(qū)動(dòng)代碼簿切換部25和加權(quán)相加計(jì)算部38構(gòu)成。此外，譯碼部2由線性預(yù)測(cè)參數(shù)譯碼部12、合成濾波器13、適應(yīng)代碼簿14、第1驅(qū)動(dòng)代碼簿22、第2驅(qū)動(dòng)代碼簿23、噪聲水平評(píng)價(jià)部26、驅(qū)動(dòng)代碼簿切換部27、增益譯碼部16和加權(quán)相加計(jì)算部39構(gòu)成。圖1中的5是作為頻譜信息分析部的線性預(yù)測(cè)參數(shù)分析部，分析輸入聲音S1，抽出作為聲音頻譜信息的線性預(yù)測(cè)參數(shù)，6是作為頻譜信息編碼部的線性預(yù)測(cè)參數(shù)編碼部，對(duì)作為頻譜信息的該線性預(yù)測(cè)參數(shù)進(jìn)行編碼，將該編碼后的線性預(yù)測(cè)參數(shù)作為合成濾波器7的系數(shù)來(lái)設(shè)定，19、22是存儲(chǔ)多個(gè)無(wú)噪聲的時(shí)間序列矢量的第1驅(qū)動(dòng)代碼簿，20、23是存儲(chǔ)多個(gè)有噪聲的時(shí)間序列矢量的第2驅(qū)動(dòng)代碼簿，24、26是評(píng)價(jià)噪聲水平的噪聲水平評(píng)價(jià)部，25、27是根據(jù)噪聲水平切換驅(qū)動(dòng)代碼簿的驅(qū)動(dòng)代碼簿切換部。
下面，說(shuō)明動(dòng)作。首先，在編碼部1中，線性預(yù)測(cè)參數(shù)分析部5分析輸入聲音S1，抽出作為聲音頻譜信息的線性預(yù)測(cè)參數(shù)。線性預(yù)測(cè)參數(shù)編碼部6對(duì)該線性預(yù)測(cè)參數(shù)進(jìn)行編碼，將該編碼后的線性預(yù)測(cè)參數(shù)作為合成濾波器7的系數(shù)來(lái)設(shè)定，同時(shí)，向噪聲水平評(píng)價(jià)部24輸出。其次，說(shuō)明聲音源信息的編碼。適應(yīng)代碼簿8存儲(chǔ)過(guò)去的驅(qū)動(dòng)聲音源信號(hào)，并與距離計(jì)算裝置11輸入的適應(yīng)代碼對(duì)應(yīng)輸出周期性的重復(fù)過(guò)去的驅(qū)動(dòng)聲音源信號(hào)的時(shí)間序列矢量。噪聲水平評(píng)價(jià)部24根據(jù)從上述線性預(yù)測(cè)參數(shù)編碼部6輸入的已編碼的線性預(yù)測(cè)參數(shù)和適應(yīng)代碼，例如如圖2所示那樣，從頻譜的傾斜、短期預(yù)測(cè)增益和音調(diào)變動(dòng)去評(píng)價(jià)該編碼區(qū)間的噪聲水平，并將評(píng)價(jià)結(jié)果輸出給驅(qū)動(dòng)代碼簿切換部25。驅(qū)動(dòng)代碼簿切換部25根據(jù)上述噪聲水平的評(píng)價(jià)結(jié)果去切換編碼時(shí)用的驅(qū)動(dòng)代碼簿，例如，若噪聲水平低，則切換到第1驅(qū)動(dòng)代碼簿19，若噪聲水平高，則切換到第2驅(qū)動(dòng)代碼簿20。
在第1驅(qū)動(dòng)代碼簿19中存儲(chǔ)多個(gè)無(wú)噪聲的時(shí)間序列矢量，該時(shí)間序列矢量構(gòu)成為例如能夠進(jìn)行學(xué)習(xí)，使學(xué)習(xí)用聲音和它的編碼聲音的失真很小。此外，在第2驅(qū)動(dòng)代碼簿20中存儲(chǔ)多個(gè)有噪聲的時(shí)間序列矢量，例如，存儲(chǔ)由隨機(jī)噪聲生成的多個(gè)時(shí)問(wèn)序列矢量，輸出與從距離計(jì)算部11輸入的各個(gè)驅(qū)動(dòng)代碼對(duì)應(yīng)的時(shí)間序列矢量。從適應(yīng)代碼簿8、第1驅(qū)動(dòng)代碼簿19或第2驅(qū)動(dòng)代碼簿20來(lái)的各時(shí)間序列矢量與增益編碼部10加給的各增益對(duì)應(yīng)，在加權(quán)相加計(jì)算部38中進(jìn)行加權(quán)相加。將該計(jì)算結(jié)果作為驅(qū)動(dòng)聲音信號(hào)供給合成濾波器7，得到編碼聲音。距離計(jì)算部11求出編碼聲音和輸入聲音S1的距離，尋求距離最小的適應(yīng)代碼、驅(qū)動(dòng)代碼和增益。在上述編碼結(jié)束后，將線性預(yù)測(cè)參數(shù)的代碼以及使輸入聲音和編碼聲音的失真最小的適應(yīng)代碼、驅(qū)動(dòng)代碼。增益的代碼作為編碼結(jié)果輸出。以上是本實(shí)施形態(tài)1的聲音編碼方法的特征動(dòng)作。
其次，說(shuō)明譯碼部2。在譯碼部2中，線性預(yù)測(cè)參數(shù)譯碼部12從線性預(yù)測(cè)參數(shù)的代碼中譯碼出線性預(yù)測(cè)參數(shù)并作為合成濾波器13的系數(shù)來(lái)設(shè)定，同時(shí)，向噪聲水平評(píng)價(jià)部26輸出。其次，說(shuō)明聲音源信息的譯碼。適應(yīng)代碼簿14與適應(yīng)代碼對(duì)應(yīng)，輸出周期地重復(fù)過(guò)去的驅(qū)動(dòng)聲音源信號(hào)的時(shí)間序列矢量。噪聲水平評(píng)價(jià)部26使用和編碼部1的噪聲水平評(píng)價(jià)部24相同的方法，根據(jù)從上述線性預(yù)測(cè)參數(shù)譯碼部12輸入的已譯碼的線性預(yù)測(cè)參數(shù)和適應(yīng)代碼去評(píng)價(jià)噪聲水平，并將評(píng)價(jià)結(jié)果輸出給驅(qū)動(dòng)代碼簿切換部27。驅(qū)動(dòng)代碼簿切換部27和編碼部1的驅(qū)動(dòng)代碼簿切換部25一樣，根據(jù)上述噪聲水平的評(píng)價(jià)結(jié)果切換第1驅(qū)動(dòng)代碼簿22和第2驅(qū)動(dòng)代碼簿23。
在第1驅(qū)動(dòng)代碼簿22中存儲(chǔ)多個(gè)無(wú)噪聲的時(shí)間序列矢量，該時(shí)間序列矢量構(gòu)成為例如能夠進(jìn)行學(xué)習(xí)，使學(xué)習(xí)用聲音和它的編碼聲音的失真很小，而在第2驅(qū)動(dòng)代碼簿20中存儲(chǔ)多個(gè)有噪聲的時(shí)間序列矢量，例如，存儲(chǔ)由隨機(jī)噪聲生成的多個(gè)時(shí)間序列矢量，輸出與從距離計(jì)算部11輸入的各個(gè)驅(qū)動(dòng)代碼對(duì)應(yīng)的時(shí)間序列矢量。從適應(yīng)代碼簿14和第1驅(qū)動(dòng)代碼簿22或第2驅(qū)動(dòng)代碼簿23來(lái)的各時(shí)間序列矢量與在增益譯碼部16中從增益代碼譯碼出的各增益對(duì)應(yīng)，在加權(quán)相加計(jì)算部39中進(jìn)行加權(quán)相加，將該計(jì)算結(jié)果作為驅(qū)動(dòng)聲音信號(hào)供給合成濾波器13，得到輸出聲音S3。以上是本實(shí)施形態(tài)1的聲音譯碼方法的特征動(dòng)作。
若按照該實(shí)施形態(tài)1，通過(guò)根據(jù)代碼和編碼結(jié)果對(duì)輸入聲音的噪聲水平進(jìn)行評(píng)價(jià)并根據(jù)評(píng)價(jià)結(jié)果使用不同的驅(qū)動(dòng)代碼簿，可以用少量的信息再生出高品質(zhì)的聲音。
此外，在上述實(shí)施形態(tài)中，對(duì)驅(qū)動(dòng)代碼簿19、20、22、23說(shuō)明了存儲(chǔ)多個(gè)時(shí)間序列矢量的情況，但只要存儲(chǔ)至少一個(gè)時(shí)間序列矢量，就可以實(shí)施本發(fā)明。
實(shí)施形態(tài)2在上述實(shí)施形態(tài)1中，切換使用兩個(gè)驅(qū)動(dòng)代碼簿，但也可以具有三個(gè)以上的驅(qū)動(dòng)代碼簿，根據(jù)噪聲水平進(jìn)行切換使用。若按照該實(shí)施形態(tài)2，因?yàn)椴恢皇菍⒙曇舴殖捎性肼暫蜔o(wú)噪聲兩種類型，對(duì)于有一點(diǎn)噪聲的中間狀態(tài)的聲音也可以使用與其相應(yīng)的驅(qū)動(dòng)代碼簿，所以能夠再生出高品質(zhì)的聲音。
實(shí)施形態(tài)3圖3示出本發(fā)明的聲音編碼方法和聲音譯碼方法的實(shí)施形態(tài)3的整體構(gòu)成，對(duì)與圖1對(duì)應(yīng)的部分添加相同的符號(hào)，圖中28、30是存儲(chǔ)有噪聲的時(shí)間序列矢量的驅(qū)動(dòng)代碼簿，29、31是將時(shí)間序列矢量的小振幅樣品的振幅值為零的樣品間拔部。
下面，說(shuō)明動(dòng)作。首先，在編碼部1中，線性預(yù)測(cè)參數(shù)分析部5分析輸入聲音S1，抽出作為聲音頻譜信息的線性預(yù)測(cè)參數(shù)。線性預(yù)測(cè)參數(shù)編碼部6對(duì)該線性預(yù)測(cè)參數(shù)進(jìn)行編碼，將該編碼后的線性預(yù)測(cè)參數(shù)作為合成濾波器7的系數(shù)來(lái)設(shè)定，同時(shí)，向噪聲水平評(píng)價(jià)部24輸出。其次，說(shuō)明聲音源信息的編碼。適應(yīng)代碼簿8存儲(chǔ)過(guò)去的驅(qū)動(dòng)聲音源信號(hào)，并與距離計(jì)算部11輸入的適應(yīng)代碼對(duì)應(yīng)輸出周期性的重復(fù)過(guò)去的驅(qū)動(dòng)聲音源信號(hào)的時(shí)間序列矢量。噪聲水平評(píng)價(jià)部24根據(jù)從上述線性預(yù)測(cè)參數(shù)編碼部6輸入的已編碼的線性預(yù)測(cè)參數(shù)和適應(yīng)代碼，例如從頻譜的傾斜、短期預(yù)測(cè)增益和音調(diào)變動(dòng)去評(píng)價(jià)該編碼區(qū)間的噪聲水平，并將評(píng)價(jià)結(jié)果輸出給樣品間拔部29。
在驅(qū)動(dòng)代碼簿28中存儲(chǔ)例如由隨機(jī)噪聲生成的多個(gè)時(shí)間序列矢量，輸出與從距離計(jì)算部11輸入驅(qū)動(dòng)代碼對(duì)應(yīng)的時(shí)間序列矢量。樣品間拔部29根據(jù)上述噪聲水平的評(píng)價(jià)結(jié)果，若噪聲水平低，則在從上述驅(qū)動(dòng)代碼簿28輸入的時(shí)間序列矢量中輸出使例如未達(dá)到規(guī)定的振幅值的樣品的振幅值為零的時(shí)間序列矢量，此外，若噪聲水平高，則直接輸出從上述驅(qū)動(dòng)代碼簿28輸入的時(shí)間序列矢量。從適應(yīng)代碼簿8、樣品間拔部29來(lái)的各時(shí)間序列矢量與增益編碼部10加給的各增益對(duì)應(yīng)，在加權(quán)相加計(jì)算部38中進(jìn)行加權(quán)相加，將該計(jì)算結(jié)果作為驅(qū)動(dòng)聲音信號(hào)供給合成濾波器7，得到編碼聲音。距離計(jì)算部11求出編碼聲音和輸入聲音S1的距離，尋求距離最小的適應(yīng)代碼、驅(qū)動(dòng)代碼和增益。在上述編碼結(jié)束后，將線性預(yù)測(cè)參數(shù)的代碼以及使輸入聲音和編碼聲音的失真最小的適應(yīng)代碼、驅(qū)動(dòng)代碼、增益的代碼作為編碼結(jié)果S2輸出。以上是本實(shí)施形態(tài)1的聲音編碼方法的特征動(dòng)作。
其次，說(shuō)明譯碼部2。在譯碼部2中，線性預(yù)測(cè)參數(shù)譯碼部12從線性預(yù)測(cè)參數(shù)的代碼中譯碼出線性預(yù)測(cè)參數(shù)并作為合成濾波器13的系數(shù)來(lái)設(shè)定，同時(shí)，向噪聲水平評(píng)價(jià)部26輸出。其次，說(shuō)明聲音源信息的譯碼。適應(yīng)代碼簿14與適應(yīng)代碼對(duì)應(yīng)，輸出周期地重復(fù)過(guò)去的驅(qū)動(dòng)聲音源信號(hào)的時(shí)間序列矢量。噪聲水平評(píng)價(jià)部26使用和編碼部1的噪聲水平評(píng)價(jià)部24相同的方法，根據(jù)從上述線性預(yù)測(cè)參數(shù)譯碼部12輸入的已譯碼的線性預(yù)測(cè)參數(shù)和適應(yīng)代碼去評(píng)價(jià)噪聲水平，并將評(píng)價(jià)結(jié)果輸出給樣品間拔部31。
驅(qū)動(dòng)代碼簿30與驅(qū)動(dòng)代碼對(duì)應(yīng)輸出時(shí)間序列矢量。樣品間拔部31通過(guò)和上述編碼部1的樣品間拔部29同樣的處理，根據(jù)上述噪聲評(píng)價(jià)結(jié)果輸出時(shí)間序列矢量。從適應(yīng)代碼簿14和樣品間拔部31來(lái)的各時(shí)間序列矢量與增益譯碼部16加給的各增益對(duì)應(yīng)，在加權(quán)相加計(jì)算部39中進(jìn)行加權(quán)相加，將該計(jì)算結(jié)果作為驅(qū)動(dòng)聲音源信號(hào)供給合成濾波器13，得到輸出聲音S3。
若按照該實(shí)施形態(tài)3，具有存儲(chǔ)有噪聲的時(shí)間序列矢量的驅(qū)動(dòng)代碼簿，通過(guò)根據(jù)聲音的噪聲水平的結(jié)果對(duì)驅(qū)動(dòng)聲音源的信息樣品進(jìn)行間拔來(lái)生成噪聲水平低的驅(qū)動(dòng)聲音源，可以用少量的信息再生出高品質(zhì)的聲音。此外，因不需要多個(gè)驅(qū)動(dòng)代碼簿，故具有能夠減少用于存儲(chǔ)驅(qū)動(dòng)代碼簿的存儲(chǔ)器的數(shù)量的效果。
實(shí)施形態(tài)4在上述實(shí)施形態(tài)3中，對(duì)時(shí)間序列矢量的樣品有間拔和不間拔兩種選擇，但也可以在間拔樣品時(shí)根據(jù)噪聲水平變更振幅閾值。若按照該實(shí)施形態(tài)4，因?yàn)椴恢皇菍⒙曇舴殖捎性肼暫蜔o(wú)噪聲兩種類型，對(duì)于有一點(diǎn)噪聲的中間狀態(tài)的聲音也可以生成并使用與其相應(yīng)的時(shí)間序列矢量，所以能夠再生出高品質(zhì)的聲音。
實(shí)施形態(tài)5圖4示出本發(fā)明的聲音編碼方法和聲音譯碼方法的實(shí)施形態(tài)5的整體構(gòu)成，對(duì)與圖1對(duì)應(yīng)的部分添加相同的符號(hào)，圖中32、35是存儲(chǔ)有噪聲的時(shí)間序列矢量的第1驅(qū)動(dòng)代碼簿，33、36是存儲(chǔ)無(wú)噪聲的時(shí)間序列矢量的第2驅(qū)動(dòng)代碼簿，34、37是權(quán)重決定部。
下面，說(shuō)明動(dòng)作。首先，在編碼部1中，線性預(yù)測(cè)參數(shù)分析部5分析輸入聲音S1，抽出作為聲音頻譜信息的線性預(yù)測(cè)參數(shù)。線性預(yù)測(cè)參數(shù)編碼部6對(duì)該線性預(yù)測(cè)參數(shù)進(jìn)行編碼，將該編碼后的線性預(yù)測(cè)參數(shù)作為合成濾波器7的系數(shù)來(lái)設(shè)定，同時(shí)，向噪聲水平評(píng)價(jià)部24輸出。其次，說(shuō)明聲音源信息的編碼。適應(yīng)代碼簿8存儲(chǔ)過(guò)去的驅(qū)動(dòng)聲音源信號(hào)，并與距離計(jì)算部11輸入的適應(yīng)代碼對(duì)應(yīng)輸出周期性的重復(fù)過(guò)去的驅(qū)動(dòng)聲音源信號(hào)的時(shí)間序列矢量。噪聲水平評(píng)價(jià)部24根據(jù)從上述線性預(yù)測(cè)參數(shù)編碼部6輸入的已編碼的線性預(yù)測(cè)參數(shù)和適應(yīng)代碼，例如從頻譜的傾斜。短期預(yù)測(cè)增益和音調(diào)變動(dòng)去評(píng)價(jià)該編碼區(qū)間的噪聲水平，并將評(píng)價(jià)結(jié)果輸出給權(quán)重決定部34。
在第1驅(qū)動(dòng)代碼簿32中存儲(chǔ)例如由隨機(jī)噪聲生成的多個(gè)有噪聲的時(shí)間序列矢量，輸出與驅(qū)動(dòng)代碼對(duì)應(yīng)的時(shí)間序列矢量。在第2驅(qū)動(dòng)代碼簿20中存儲(chǔ)多個(gè)時(shí)間序列矢量，該時(shí)間序列矢量構(gòu)成為例如能夠進(jìn)行學(xué)習(xí)，使學(xué)習(xí)用聲音和它的編碼聲音的失真很小。輸出與從距離計(jì)算部11輸入的驅(qū)動(dòng)代碼對(duì)應(yīng)的時(shí)問(wèn)序列矢量。重量決定部34根據(jù)從上述噪聲水平評(píng)價(jià)部24輸入的噪聲水平評(píng)價(jià)結(jié)果，例如按照?qǐng)D5決定加給第1驅(qū)動(dòng)代碼簿32的時(shí)間序列矢量和第1驅(qū)動(dòng)代碼簿32的時(shí)間序列矢量的權(quán)重。第1驅(qū)動(dòng)代碼簿32和第2驅(qū)動(dòng)代碼簿33的各時(shí)間序列矢量根據(jù)上述權(quán)重決定部34給出的權(quán)重進(jìn)行加權(quán)相加。從適應(yīng)代碼簿8輸出的時(shí)間序列矢量和上述加權(quán)相加后生成的時(shí)間序列矢量與增益編碼部10加給的各增益對(duì)應(yīng)，在加權(quán)相加計(jì)算部38中進(jìn)行加權(quán)相加，將該計(jì)算結(jié)果作為驅(qū)動(dòng)聲音信號(hào)供給合成濾波器7，得到編碼聲音。距離計(jì)算部11求出編碼聲音和輸入聲音S1的距離，尋求距離最小的適應(yīng)代碼、驅(qū)動(dòng)代碼和增益。在上述編碼結(jié)束后，將線性預(yù)測(cè)參數(shù)的代碼以及使輸入聲音和編碼聲音的失真最小的適應(yīng)代碼、驅(qū)動(dòng)代碼、增益的代碼作為編碼結(jié)果輸出。
其次，說(shuō)明譯碼部2。在譯碼部2中，線性預(yù)測(cè)參數(shù)譯碼部12從線性預(yù)測(cè)參數(shù)的代碼中譯碼出線性預(yù)測(cè)參數(shù)并作為合成濾波器13的系數(shù)來(lái)沒(méi)定，同時(shí)，向噪聲水平評(píng)價(jià)部26輸出。其次，說(shuō)明聲音源信息的譯碼。適應(yīng)代碼簿14與適應(yīng)代碼對(duì)應(yīng)，輸出周期地重復(fù)過(guò)去的驅(qū)動(dòng)聲音源信號(hào)的時(shí)間序列矢量。噪聲水平評(píng)價(jià)部26使用和編碼部1的噪聲水平評(píng)價(jià)部24相同的方法，根據(jù)從上述線性預(yù)測(cè)參數(shù)譯碼部12輸入的已譯碼的線性預(yù)測(cè)參數(shù)和適應(yīng)代碼去評(píng)價(jià)噪聲水平，并將評(píng)價(jià)結(jié)果輸出給權(quán)重決定部37。
第1驅(qū)動(dòng)代碼簿35和第2驅(qū)動(dòng)代碼部36與驅(qū)動(dòng)代碼對(duì)應(yīng)輸出時(shí)間序列矢量。權(quán)重決定部37和編碼部1的權(quán)重決定部34一樣，根據(jù)從上述噪聲水平評(píng)價(jià)部26輸入的噪聲水平評(píng)價(jià)結(jié)果給出權(quán)重。從第1驅(qū)動(dòng)代碼簿35、第2驅(qū)動(dòng)代碼簿36來(lái)的各時(shí)間序列矢量與上述權(quán)重決定部37加給的各權(quán)重對(duì)應(yīng)進(jìn)行加權(quán)相加。從適應(yīng)代碼簿14輸出的時(shí)間序列矢量和上述權(quán)重相加生成的時(shí)間序列矢量與在增益譯碼部16中從增益代碼譯碼出的各增益對(duì)應(yīng)，在加權(quán)相加計(jì)算部39中進(jìn)行加權(quán)相加，將該計(jì)算結(jié)果作為驅(qū)動(dòng)聲音信號(hào)供給合成濾波器13，得到輸出聲音S3。
若按照該實(shí)施形態(tài)5，根據(jù)代碼和編碼結(jié)果對(duì)輸入聲音的噪聲水平進(jìn)行評(píng)價(jià)并根據(jù)評(píng)價(jià)結(jié)果對(duì)有噪聲的時(shí)間序列矢量和無(wú)噪聲的時(shí)間序列矢量進(jìn)行加權(quán)相加后再使用，因此，可以用少量的信息再生出高品質(zhì)的聲音。
實(shí)施形態(tài)6在上述實(shí)施形態(tài)1-5中，進(jìn)而還可以根據(jù)噪聲水平的評(píng)價(jià)結(jié)果去變更增益的代碼簿。若按照該實(shí)施形態(tài)6，因?yàn)榭梢愿鶕?jù)驅(qū)動(dòng)代碼部使用最佳的增益代碼簿，所以能夠再生出高品質(zhì)的聲音。
實(shí)施形態(tài)7在上述實(shí)施形態(tài)1-6中，對(duì)聲音的噪聲水平進(jìn)行評(píng)價(jià)并根據(jù)評(píng)價(jià)結(jié)果切換驅(qū)動(dòng)代碼簿，也可以分別對(duì)有聲音的突然出現(xiàn)和破裂性子音等進(jìn)行判定、評(píng)價(jià)并根據(jù)評(píng)價(jià)結(jié)果切換驅(qū)動(dòng)代碼簿。若按照該實(shí)施形態(tài)7，因?yàn)椴恢粚?duì)聲音的噪聲狀態(tài)進(jìn)行分類，而是對(duì)有聲音的突然出現(xiàn)和破裂性子音等進(jìn)一步進(jìn)行仔細(xì)分類，可以使用各自合適的驅(qū)動(dòng)代碼部，所以能夠再生出高品質(zhì)的聲音。
實(shí)施形態(tài)8在上述實(shí)施形態(tài)1-6中，從圖2所示的頻譜傾斜、短期預(yù)測(cè)增益和音調(diào)變動(dòng)去評(píng)價(jià)編碼區(qū)間的噪聲水平，但也可以使用相對(duì)適應(yīng)代碼簿的輸出的增益值的大小去進(jìn)行評(píng)價(jià)。
工業(yè)上利用的可能性若按照本發(fā)明的聲音編碼方法和聲音譯碼方法以及聲音編碼裝置和聲音譯碼裝置，使用頻譜信息、功率信息和音調(diào)信息中的至少一個(gè)代碼或編碼結(jié)果去評(píng)價(jià)該編碼區(qū)間的噪聲水平，并根據(jù)評(píng)價(jià)結(jié)果使用不同的驅(qū)動(dòng)代碼簿，所以，能用少量的信息再生高品質(zhì)的聲音。
此外，若按照本發(fā)明的聲音編碼方法和聲音譯碼方法，具有多個(gè)驅(qū)動(dòng)代碼簿，所存儲(chǔ)的驅(qū)動(dòng)聲音源的噪聲水平不同，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，切換使用多個(gè)驅(qū)動(dòng)代碼簿，所以，能用少量的信息再生高品質(zhì)的聲音。
此外，若按照本發(fā)明的聲音編碼方法和聲音譯碼方法，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，使存儲(chǔ)在驅(qū)動(dòng)代碼簿中的時(shí)間序列矢量的噪聲水平變化，所以，能用少量的信息再生高品質(zhì)的聲音。
此外，若按照本發(fā)明的聲音編碼方法和聲音譯碼方法，具有存儲(chǔ)有噪聲的時(shí)間序列矢量的驅(qū)動(dòng)代碼簿，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，通過(guò)間拔時(shí)間序列矢量的信息樣品去生成噪聲水平低的時(shí)間序列矢量，所以，能用少量的信息再生高品質(zhì)的聲音。
此外，若按照本發(fā)明的聲音編碼方法和聲音譯碼方法，具有存儲(chǔ)有噪聲的時(shí)間序列矢量的第1驅(qū)動(dòng)代碼簿和存儲(chǔ)無(wú)噪聲的時(shí)間序列矢量的第2驅(qū)動(dòng)代碼簿，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，對(duì)第1驅(qū)動(dòng)代碼簿的時(shí)間序列矢量和第2驅(qū)動(dòng)代碼簿的時(shí)間序列矢量進(jìn)行加權(quán)相加并生成時(shí)間序列矢量，所以，能用少量的信息再生高品質(zhì)的聲音。
權(quán)利要求
1．一種聲音編碼方法，其特征在于在碼驅(qū)動(dòng)線性預(yù)測(cè)編碼(Code-Excited Linear PredictionCELP)聲音編碼方法中，使用頻譜信息、功率信息和音調(diào)信息中的至少一個(gè)代碼或編碼結(jié)果，對(duì)該編碼區(qū)間中的聲音的噪聲水平進(jìn)行評(píng)價(jià)，根據(jù)評(píng)價(jià)結(jié)果選擇多個(gè)驅(qū)動(dòng)代碼簿中的一個(gè)。
2．權(quán)利要求1記載的聲音編碼方法，其特征在于具有多個(gè)驅(qū)動(dòng)代碼簿，其所存儲(chǔ)的時(shí)間序列矢量的噪聲水平不同，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果切換上述多個(gè)驅(qū)動(dòng)代碼簿。
3．權(quán)利要求1記載的聲音編碼方法，其特征在于根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，使存儲(chǔ)在驅(qū)動(dòng)代碼簿中時(shí)間序列矢量的噪聲水平發(fā)生變化。
4．權(quán)利要求3記載的聲音編碼方法，其特征在于具有存儲(chǔ)有噪聲的時(shí)間序列矢量的驅(qū)動(dòng)代碼簿，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，通過(guò)間拔上述時(shí)間序列矢量的信號(hào)樣品去生成噪聲水平低的時(shí)間序列矢量。
5．權(quán)利要求3記載的聲音編碼方法，其特征在于具有存儲(chǔ)有噪聲的時(shí)間序列矢量的第1驅(qū)動(dòng)代碼簿和存儲(chǔ)無(wú)噪聲的時(shí)間序列矢量的第2驅(qū)動(dòng)代碼簿，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，生成將第1驅(qū)動(dòng)代碼簿的時(shí)間序列矢量和第2驅(qū)動(dòng)代碼簿的時(shí)間序列矢量加權(quán)相加后的時(shí)間序列矢量。
6．一種聲音譯碼方法，其特征在于在碼驅(qū)動(dòng)線性預(yù)測(cè)(CELP)聲音譯碼方法中，使用頻譜信息、功率信息和音調(diào)信息中的至少一個(gè)代碼或譯碼結(jié)果，對(duì)該譯碼區(qū)間中的聲音的噪聲水平進(jìn)行評(píng)價(jià)，根據(jù)評(píng)價(jià)結(jié)果選擇多個(gè)驅(qū)動(dòng)代碼薄中的一個(gè)。
7．權(quán)利要求6記載的聲音譯碼方法，其特征在于具有多個(gè)驅(qū)動(dòng)代碼簿，其所存儲(chǔ)的時(shí)間序列矢量的噪聲水平不同，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果切換上述多個(gè)驅(qū)動(dòng)代碼簿。
8．權(quán)利要求6記載的聲音譯碼方法，其特征在于根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，使存儲(chǔ)在驅(qū)動(dòng)代碼簿中時(shí)間序列矢量的噪聲水平發(fā)生變化。
9．權(quán)利要求8記載的聲音譯碼方法，其特征在于具有存儲(chǔ)有噪聲的時(shí)間序列矢量的驅(qū)動(dòng)代碼簿，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，通過(guò)間拔上述時(shí)間序列矢量的信號(hào)樣品去生成噪聲水平低的時(shí)間序列矢量。
10．權(quán)利要求8記載的聲音譯碼方法，其特征在于具有存儲(chǔ)有噪聲的時(shí)間序列矢量的第1驅(qū)動(dòng)代碼簿和存儲(chǔ)無(wú)噪聲的時(shí)間序列矢量的第2驅(qū)動(dòng)代碼簿，根據(jù)聲音的噪聲水平的評(píng)價(jià)結(jié)果，生成將上述第1驅(qū)動(dòng)代碼簿的時(shí)間序列矢量和上述第2驅(qū)動(dòng)代碼簿的時(shí)間序列矢量加權(quán)相加后的時(shí)間序列矢量。
11．一種聲音編碼裝置，其特征在于，包括頻譜信息編碼部，對(duì)輸入聲音的頻譜信息進(jìn)行編碼并作為編碼結(jié)果的一個(gè)要素輸出；噪聲水平評(píng)價(jià)部，使用根據(jù)從該頻譜信息編碼部來(lái)的已編碼的頻譜信息得到的頻譜信息和功率信息中的至少一個(gè)代碼或編碼結(jié)果，對(duì)該編碼區(qū)間內(nèi)的聲音的噪聲水平進(jìn)行評(píng)價(jià)并輸出評(píng)價(jià)結(jié)果；存儲(chǔ)多個(gè)無(wú)噪聲的時(shí)間序列矢量的第1驅(qū)動(dòng)代碼簿；存儲(chǔ)多個(gè)有噪聲的時(shí)間序列矢量的第2驅(qū)動(dòng)代碼簿；根據(jù)上述噪聲水平評(píng)價(jià)部的評(píng)價(jià)結(jié)果切換第1驅(qū)動(dòng)代碼簿和第2驅(qū)動(dòng)代碼簿的驅(qū)動(dòng)代碼簿切換部；加權(quán)相加計(jì)算部，對(duì)從上述第1驅(qū)動(dòng)代碼簿或第2驅(qū)動(dòng)代碼簿來(lái)的時(shí)間序列矢量，分別與各時(shí)間序列矢量的增益對(duì)應(yīng)進(jìn)行加權(quán)相加；合成濾波器，將該加權(quán)的時(shí)間序列矢量作為驅(qū)動(dòng)聲音源信號(hào)，在該驅(qū)動(dòng)聲音源信號(hào)和從上述頻譜信息編碼部來(lái)的已編碼的頻譜信息的基礎(chǔ)上得到編碼聲音；距離計(jì)算部，求出該編碼聲音和上述輸入聲音的距離，尋求距離最小的驅(qū)動(dòng)代碼和增益，并將該結(jié)果作為驅(qū)動(dòng)代碼和增益代碼的編碼結(jié)果輸出。
12．一種聲音譯碼裝置，其特征在于，包括頻譜信息譯碼部，從頻譜信息的代碼中譯碼出頻譜信息；噪聲水平評(píng)價(jià)部，使用根據(jù)從該頻譜信息譯碼部來(lái)的已譯碼的頻譜信息得到的頻譜信息和功率信息中的至少一個(gè)譯碼結(jié)果或上述頻譜信息的代碼，對(duì)該譯碼區(qū)間內(nèi)的聲音的噪聲水平進(jìn)行評(píng)價(jià)并輸出評(píng)價(jià)結(jié)果；存儲(chǔ)多個(gè)無(wú)噪聲的時(shí)間序列矢量的第1驅(qū)動(dòng)代碼簿；存儲(chǔ)多個(gè)有噪聲的時(shí)間序列矢量的第2驅(qū)動(dòng)代碼簿；根據(jù)上述噪聲水平評(píng)價(jià)部的評(píng)價(jià)結(jié)果切換第1驅(qū)動(dòng)代碼簿和第2驅(qū)動(dòng)代碼簿的驅(qū)動(dòng)代碼簿切換部；加權(quán)相加計(jì)算部，對(duì)從上述第1驅(qū)動(dòng)代碼簿或第2驅(qū)動(dòng)代碼簿來(lái)的時(shí)間序列矢量，分別與各時(shí)間序列矢量的增益對(duì)應(yīng)進(jìn)行加權(quán)相加；合成濾波器，將該加權(quán)的時(shí)間序列矢量作為驅(qū)動(dòng)聲音源信號(hào)，在該驅(qū)動(dòng)聲音源信號(hào)和從上述頻譜信息譯碼部來(lái)的已譯碼的頻譜信息的基礎(chǔ)上得到譯碼聲音。
13．一種聲音編碼裝置，其特征在于，在編碼驅(qū)動(dòng)線性預(yù)測(cè)(CELP)聲音編碼裝置中，包括使用頻譜信息、功率信息和音調(diào)信息中的至少一個(gè)代碼或編碼結(jié)果對(duì)該編碼區(qū)間內(nèi)的聲音的噪聲水平進(jìn)行評(píng)價(jià)的噪聲水平評(píng)價(jià)部；根據(jù)上述噪聲水平評(píng)價(jià)部的評(píng)價(jià)結(jié)果切換多個(gè)驅(qū)動(dòng)代碼簿的驅(qū)動(dòng)代碼簿切換部。
14．一種聲音譯碼裝置，其特征在于，在編碼驅(qū)動(dòng)線性預(yù)測(cè)(CELP)聲音譯碼裝置中，包括使用頻譜信息、功率信息和音調(diào)信息中的至少一個(gè)代碼或譯碼結(jié)果對(duì)該譯碼區(qū)間內(nèi)的聲音的噪聲水平進(jìn)行評(píng)價(jià)的噪聲水平評(píng)價(jià)部；根據(jù)上述噪聲水平評(píng)價(jià)部的評(píng)價(jià)結(jié)果切換多個(gè)驅(qū)動(dòng)代碼簿的驅(qū)動(dòng)代碼簿切換部。
全文摘要
在將聲音信號(hào)壓縮編碼成數(shù)字信號(hào)的聲音編碼譯碼中,使用較少的信息量再生高品質(zhì)的聲音。在碼驅(qū)動(dòng)線性預(yù)測(cè)(CELP)聲音編碼中,使用頻譜信息、功率信息和音調(diào)信息中的至少一個(gè)代碼或編碼結(jié)果對(duì)該編碼區(qū)間內(nèi)的聲音的噪聲水平進(jìn)行評(píng)價(jià),根據(jù)評(píng)價(jià)結(jié)果使用不同的驅(qū)動(dòng)代碼簿19、20。
文檔編號(hào)G10L19/14GK1283298SQ98812682
公開日2001年2月7日申請(qǐng)日期1998年12月7日優(yōu)先權(quán)日1997年12月24日
發(fā)明者山浦正申請(qǐng)人:三菱電機(jī)株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載