編碼設(shè)備、編碼方法、解碼設(shè)備、解碼方法以及程序的制作方法

文檔序號：2836014閱讀：416來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：編碼設(shè)備、編碼方法、解碼設(shè)備、解碼方法以及程序的制作方法
技術(shù)領(lǐng)域：
本公開內(nèi)容涉及一種編碼設(shè)備、編碼方法、解碼設(shè)備、解碼方法以及程序，并且更具體地，涉及一種能夠生成具有更自然聲音的、用于隱藏的音頻信號的編碼設(shè)備、編碼方法、解碼設(shè)備、解碼方法以及程序。
背景技術(shù)：
近年來，音頻信號通常被數(shù)字化，并且得到的數(shù)字信號被壓縮和編碼，然后被傳送或保存。音頻信號的編碼通常分類為波形編碼和分析/合成編碼。波形編碼包括頻帶劃分編碼和變換編碼，在頻帶劃分編碼中，使用頻帶劃分濾波器將音頻信號劃分成多個頻率分量并編碼，在變換編碼中，數(shù)字音頻信號逐塊地經(jīng)受時間-頻率變換并且得到的譜被編碼。在波形編碼中，已使用頻帶劃分濾波器或時間-頻率變換劃分成頻率分量的音頻信號逐塊地被量化，并且利用所謂的聽覺遮蔽效果等經(jīng)受高效編碼。圖1是示出執(zhí)行變換編碼的編碼設(shè)備的配置示例的框圖。圖1中示出的編碼設(shè)備10包括時間-頻率變換單元11、譜歸一化單元12、譜量化單元13、熵編碼單元14、比例因子編碼單元15以及復(fù)用器16。編碼設(shè)備10的時間-頻率變換單元11接收作為時間信號的音頻信號。時間-頻率變換單元11逐幀地對輸入音頻信號執(zhí)行時間-頻率變換(諸如修正的離散余弦變換 (MDCT))。時間-頻率變換單元11將得到的每幀的頻譜系數(shù)(MDCT系數(shù))提供給譜歸一化單元12。譜歸一化單元12以針對特定帶寬的量化(量化單位)為基礎(chǔ)對從時間-頻率變換單元11提供的幀的頻譜系數(shù)分組。譜歸一化單元12使用以下表達式(1)和特定步長的系數(shù)2_λ XSF[n]，逐幀地對分組的量化單位的頻譜系數(shù)進行歸一化。XNorm(k) =X(k)X2_AXSF[(.(l)在表達式(1)中，X(k)表示第η個量化單位的第k個頻譜系數(shù)，并且\。M(k)表示歸一化的頻譜系數(shù)。另外，λ是用于確定步長的值。例如，如果λ =0.5，則步長為3(^。這里，假設(shè)階段幅度λ為常數(shù)而與幀無關(guān)。另外，這里，作為關(guān)于系數(shù)2_AXSF[n]的信息的指數(shù)SF[n](整數(shù))被稱為“比例因子”。譜歸一化單元12將如上所述歸一化的、每幀的頻譜系數(shù)提供給譜量化單元13，并且將用于歸一化的、每幀的比例因子提供給比例因子編碼單元15。譜量化單元13使用特定數(shù)量的比特對從譜歸一化單元12提供的歸一化的每幀的頻譜系數(shù)進行量化，并將量化的每幀的頻譜系數(shù)提供給熵編碼單元14。另外，譜量化單元 13將表示歸一化的每幀的頻譜系數(shù)的每個量化單位的量化期間的比特數(shù)的量化信息提供給復(fù)用器16。熵編碼單元14通過哈夫曼編碼、算術(shù)編碼等，對從譜量化單元13提供的量化的每幀的頻譜系數(shù)執(zhí)行可逆壓縮，并且將得到的頻譜系數(shù)提供給復(fù)用器16作為編碼的譜數(shù)據(jù)。比例因子編碼單元15對從譜歸一化單元12提供的每幀的比例因子進行編碼。比例因子編碼單元15將編碼的每幀的比例因子提供給復(fù)用器16作為編碼的比例因子。復(fù)用器16對來自熵編碼單元14的編碼的譜數(shù)據(jù)、來自比例因子編碼單元15的編碼的比例因子、以及來自譜量化單元13的量化信息進行復(fù)用，以便生成每幀的編碼數(shù)據(jù)。復(fù)用器16輸出編碼的數(shù)據(jù)。在上述編碼設(shè)備10中，由于諸如幀的比特數(shù)小于編碼所需的比特數(shù)或者編碼花費比在其期間可以執(zhí)行實時處理的時段更長時間的原因，可能出現(xiàn)編碼錯誤。在這種情況下，由于難以再次執(zhí)行編碼，因此需要準(zhǔn)備錯誤隱藏裝置，其輸出用于隱藏的編碼數(shù)據(jù)以替代不規(guī)則數(shù)據(jù)，使得不輸出不規(guī)則數(shù)據(jù)作為編碼數(shù)據(jù)。作為錯誤隱藏裝置，例如，提出了如下技術(shù)如果編碼沒有在時間限制之前結(jié)束，則輸出位于要編碼的幀之前的幀的編碼數(shù)據(jù)作為用于隱藏的編碼數(shù)據(jù)，以替代要編碼的幀的編碼數(shù)據(jù)(例如，參照日本專利第3463592號)。另外，作為錯誤隱藏裝置，提出了如下另一技術(shù)通過對無聲信號等進行編碼來預(yù)先準(zhǔn)備用于隱藏的編碼數(shù)據(jù)，并且輸出該編碼數(shù)據(jù)以替代出現(xiàn)了編碼錯誤的幀的編碼數(shù)據(jù) (例如，參照日本未審查專利申請公布第2003-5798號)。另一方面，提出了如下音頻壓縮傳輸設(shè)備如果在解碼期間檢測到編碼數(shù)據(jù)的同步異常，則輸出預(yù)先存儲的無聲編碼數(shù)據(jù)替代編碼數(shù)據(jù)作為用于隱藏的編碼數(shù)據(jù)(例如，參照日本專利第2731514號)。另外，提出了如下設(shè)備其根據(jù)來自外部的弱音(mute)指示，利用預(yù)先創(chuàng)建的無聲編碼數(shù)據(jù)替換編碼數(shù)據(jù)，并且輸出該無聲編碼數(shù)據(jù)(例如，參照日本未審查專利申請公布第 9-294077 號)。

發(fā)明內(nèi)容
然而，在日本專利第3463592號中描述的錯誤隱藏裝置的情況下，如果要編碼的音頻信號的水平隨時間的改變較大，則用于隱藏的編碼數(shù)據(jù)的信號水平與出現(xiàn)了編碼錯誤的幀的原始編碼數(shù)據(jù)的信號水平顯著不同。結(jié)果，作為對用于隱藏的編碼數(shù)據(jù)進行解碼的結(jié)果，會生成具有不自然聲音的音頻信號。另外，在日本未審查專利申請公布第2003-5798號中描述的錯誤隱藏裝置的情況下，用于隱藏的編碼數(shù)據(jù)的信號水平和出現(xiàn)了編碼錯誤的幀的原始編碼數(shù)據(jù)的信號水平彼此顯著不同。結(jié)果，作為對用于隱藏的編碼數(shù)據(jù)進行解碼的結(jié)果，會生成具有異常聲音或不連續(xù)的不自然聲音的音頻信號。期望生成具有更自然聲音的用于隱藏的音頻信號。根據(jù)本公開內(nèi)容的第一實施例的編碼設(shè)備包括時間-頻率變換單元，其對音頻信號執(zhí)行時間-頻率變換；歸一化單元，其對通過時間-頻率變換獲得的頻譜系數(shù)進行歸一化，以便生成音頻信號的編碼數(shù)據(jù)；水平計算單元，其計算音頻信號的水平；比例因子改變單元，其基于音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，該隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及輸出單元，如果在音頻信號的編碼期間未出現(xiàn)錯誤，則輸出單元輸出由歸一化單元生成的音頻信號的編碼數(shù)據(jù)，并且如果在音頻信號的編碼期間出現(xiàn)了錯誤，則輸出單元輸出改變了其隱藏比例因子的編碼的隱藏數(shù)據(jù)作為音頻信號的編碼數(shù)據(jù)。
根據(jù)本公開內(nèi)容的第一實施例的編碼方法和程序與根據(jù)本公開內(nèi)容的第一實施例的編碼設(shè)備對應(yīng)。根據(jù)本公開內(nèi)容的第一實施例，音頻信號經(jīng)受時間-頻率變換；對通過時間-頻率變換獲得的頻譜系數(shù)進行歸一化，以便生成音頻信號的編碼數(shù)據(jù)；計算音頻信號的水平；基于音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，該隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及如果在音頻信號的編碼期間未出現(xiàn)錯誤，則輸出通過歸一化單元生成的音頻信號的編碼數(shù)據(jù)，并且如果在音頻信號的編碼期間出現(xiàn)了錯誤，則輸出改變了其隱藏比例因子的編碼的隱藏數(shù)據(jù)作為音頻信號的編碼數(shù)據(jù)。根據(jù)本公開內(nèi)容的第二實施例的解碼設(shè)備包括逆歸一化單元，其使用包括在從編碼設(shè)備提供的編碼數(shù)據(jù)中的編碼數(shù)據(jù)的比例因子，對編碼數(shù)據(jù)執(zhí)行逆歸一化，其中，如果在音頻信號的編碼期間未出現(xiàn)錯誤，則編碼設(shè)備輸出通過對音頻信號執(zhí)行時間-頻率變換和歸一化而生成的編碼數(shù)據(jù)，并且如果在音頻信號的編碼期間出現(xiàn)了錯誤，則編碼設(shè)備基于音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，并且然后輸出編碼的隱藏數(shù)據(jù)作為音頻信號的編碼數(shù)據(jù)，隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及頻率-時間變換單元，其對作為由逆歸一化單元執(zhí)行的逆歸一化的結(jié)果獲得的頻譜執(zhí)行頻率-時間變換。根據(jù)本公開內(nèi)容的第二實施例的解碼方法和程序與根據(jù)本公開內(nèi)容的第二實施例的解碼設(shè)備對應(yīng)。根據(jù)本公開內(nèi)容的第二實施例，使用包括在從編碼設(shè)備提供的編碼數(shù)據(jù)中的編碼數(shù)據(jù)的比例因子，對編碼數(shù)據(jù)執(zhí)行逆歸一化，其中，如果在音頻信號的編碼期間未出現(xiàn)錯誤，則編碼設(shè)備輸出通過對音頻信號執(zhí)行時間-頻率變換和歸一化而生成的編碼數(shù)據(jù)，并且如果在音頻信號的編碼期間出現(xiàn)了錯誤，則編碼設(shè)備基于音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，并且輸出編碼的隱藏數(shù)據(jù)作為音頻信號的編碼數(shù)據(jù)，該隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及對作為逆歸一化的結(jié)果獲得的頻譜執(zhí)行頻率-時間變換。根據(jù)本公開內(nèi)容的第一實施例，可以生成具有更自然聲音的、用于隱藏的音頻信號的編碼數(shù)據(jù)。根據(jù)本公開內(nèi)容的第二實施例，可以生成具有更自然聲音的、用于隱藏的音頻信號。

圖1是示出現(xiàn)有技術(shù)中的編碼設(shè)備的配置示例的框圖；圖2是示出根據(jù)本公開內(nèi)容的實施例的編碼設(shè)備的配置示例的框圖；圖3是示出編碼的隱藏數(shù)據(jù)的幀結(jié)構(gòu)的示例的圖；圖4是示出編碼的比例因子的改變的圖；圖5是示出由圖2中示出的編碼設(shè)備執(zhí)行的編碼處理的流程圖；圖6是示出解碼設(shè)備的配置示例的框圖7是示出由圖6中示出的解碼設(shè)備執(zhí)行的解碼處理的流程圖；圖8是示出解碼設(shè)備的配置的另一示例的框圖；圖9是示出編碼數(shù)據(jù)的比較的圖；圖10是示出由圖8中示出的解碼設(shè)備執(zhí)行的解碼處理的流程圖；以及圖11是示出根據(jù)實施例的計算機的配置示例的框圖。
具體實施例方式根據(jù)本公開內(nèi)容的實施例，公開了一種編碼設(shè)備包括時間-頻率變換單元，其對音頻信號執(zhí)行時間-頻率變換；歸一化單元，其對通過時間-頻率變換獲得的頻譜系數(shù)進行歸一化，以便生成音頻信號的編碼數(shù)據(jù)；水平計算單元，其計算音頻信號的水平；比例因子改變單元，其基于音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，該隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及輸出單元，如果在音頻信號的編碼期間未出現(xiàn)錯誤，則輸出單元輸出由歸一化單元生成的音頻信號的編碼數(shù)據(jù)，并且如果在音頻信號的編碼期間出現(xiàn)了錯誤，則輸出單元輸出改變了其隱藏比例因子的編碼的隱藏數(shù)據(jù)作為音頻信號的編碼數(shù)據(jù)。根據(jù)本公開內(nèi)容的另一實施例，公開了一種編碼方法，包括使得編碼設(shè)備對音頻信號執(zhí)行時間-頻率變換；對通過時間-頻率變換獲得的頻譜系數(shù)進行歸一化，以便生成音頻信號的編碼數(shù)據(jù)；計算音頻信號的水平；基于音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及如果在音頻信號的編碼期間未出現(xiàn)錯誤，則輸出通過歸一化生成的音頻信號的編碼數(shù)據(jù)，并且如果在音頻信號的編碼期間出現(xiàn)了錯誤，則輸出改變了其隱藏比例因子的編碼的隱藏數(shù)據(jù)作為音頻信號的編碼數(shù)據(jù)。根據(jù)本公開內(nèi)容的又一實施例，公開了一種解碼設(shè)備，包括逆歸一化單元，其使用包括在從編碼設(shè)備提供的編碼數(shù)據(jù)中的編碼數(shù)據(jù)的比例因子，對編碼數(shù)據(jù)執(zhí)行逆歸一化，其中，如果在音頻信號的編碼期間未出現(xiàn)錯誤，則編碼設(shè)備輸出通過對音頻信號執(zhí)行時間-頻率變換和歸一化而生成的編碼數(shù)據(jù)，并且如果在音頻信號的編碼期間出現(xiàn)了錯誤，則編碼設(shè)備基于音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，并且然后輸出編碼的隱藏數(shù)據(jù)作為音頻信號的編碼數(shù)據(jù)，隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及頻率-時間變換單元，其對作為由逆歸一化單元執(zhí)行的逆歸一化的結(jié)果獲得的頻譜執(zhí)行頻率-時間變換。根據(jù)本公開內(nèi)容的再一實施例，公開了一種解碼方法，包括使得解碼設(shè)備使用包括在從編碼設(shè)備提供的編碼數(shù)據(jù)中的編碼數(shù)據(jù)的比例因子，對編碼數(shù)據(jù)執(zhí)行逆歸一化，其中，如果在音頻信號的編碼期間未出現(xiàn)錯誤，則編碼設(shè)備輸出通過對音頻信號執(zhí)行時間-頻率變換和歸一化而生成的編碼數(shù)據(jù)，并且如果在音頻信號的編碼期間出現(xiàn)了錯誤，則編碼設(shè)備基于音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，并且然后輸出編碼的隱藏數(shù)據(jù)作為音頻信號的編碼數(shù)據(jù)，隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及對作為逆歸一化的結(jié)果獲得的頻譜執(zhí)行頻率-時間變換。實施例根據(jù)實施例的編碼設(shè)備的配置示例圖2是示出根據(jù)本公開內(nèi)容的實施例的編碼設(shè)備的配置示例的框圖。在圖2中示出的配置中，對與圖1中示出的部件相同的部件給予與圖1中相同的附圖標(biāo)記。如需要，省略冗余描述。圖2中示出的編碼設(shè)備30的配置與圖1中示出的配置不同在于，新提供了錯誤檢測單元31、信號水平計算單元32、編碼的比例因子替換單元33、以及替選編碼數(shù)據(jù)輸出單元34，并且提供比例因子編碼單元35和復(fù)用器36分別替代比例因子編碼單元15和復(fù)用器 16。如果出現(xiàn)編碼錯誤，則編碼設(shè)備30基于音頻信號的水平，針對每幀生成用于隱藏的音頻信號的編碼數(shù)據(jù)(在下文中稱為“編碼的隱藏數(shù)據(jù)”)。更具體地，編碼設(shè)備30的錯誤檢測單元31逐幀地判斷在編碼期間是否出現(xiàn)了錯誤，并且判斷從編碼開始是否經(jīng)過了特定時段(例如，在其期間可以執(zhí)行實時處理的時段)。錯誤檢測單元31基于判斷結(jié)果而檢測編碼錯誤，并且然后將檢測的結(jié)果提供給信號水平計算單元32和復(fù)用器36。信號水平計算單元32根據(jù)從錯誤檢測單元31提供的檢測結(jié)果，計算由譜歸一化單元12獲得的幀的比例因子的平均值、最大值或最小值等，作為要編碼的音頻信號的幀的譜水平。信號水平計算單元32將所算出的譜水平提供給編碼的比例因子替換單元33。編碼的比例因子替換單元33接收預(yù)先存儲在編碼設(shè)備30的存儲器(未示出)中的編碼的隱藏數(shù)據(jù)。作為編碼的隱藏數(shù)據(jù)，例如，可使用具有可以由編碼設(shè)備30處理的最小幀長度(比特數(shù))的數(shù)據(jù)，通過以對于要輸入到編碼設(shè)備30的音頻信號相同的方式、對作為用于隱藏的音頻信號的微小噪聲信號進行編碼而得到該數(shù)據(jù)。編碼的比例因子替換單元33用作比例因子改變裝置，并且基于從信號水平計算單元32提供的譜水平而改變包括在編碼的隱藏數(shù)據(jù)中的編碼的比例因子。編碼的比例因子替換單元33將改變了其編碼的比例因子的編碼的隱藏數(shù)據(jù)提供給替選編碼數(shù)據(jù)輸出單元34。另外，編碼的比例因子替換單元33將與改變后的編碼的比例因子對應(yīng)的比例因子提供給比例因子編碼單元35，并使比例因子編碼單元35保持該比例因子。替選編碼數(shù)據(jù)輸出單元34對從編碼的比例因子替換單元33提供的編碼的隱藏數(shù)據(jù)執(zhí)行填充，使得編碼的隱藏數(shù)據(jù)的比特數(shù)對應(yīng)于輸出比特率。由于編碼的隱藏數(shù)據(jù)是具有可以由編碼設(shè)備30處理的最小幀長度的數(shù)據(jù)，因此替選編碼數(shù)據(jù)輸出單元34可以通過執(zhí)行填充，生成具有與任意輸出比特率對應(yīng)的幀長度的編碼的隱藏數(shù)據(jù)。因此，不需要編碼設(shè)備30為每個幀長度保持編碼的隱藏數(shù)據(jù)，由此減少了要存儲在用于保持編碼的隱藏數(shù)據(jù)的存儲器(未示出)中的數(shù)據(jù)量。替選編碼數(shù)據(jù)輸出單元34將經(jīng)受了填充的編碼的隱藏數(shù)據(jù)提供給復(fù)用器36。比例因子編碼單元35使用由其保持的過去幀的比例因子，對從譜歸一化單元12 提供的每幀的比例因子執(zhí)行幀間預(yù)測編碼。因此，由于比例因子編碼單元35對比例因子執(zhí)行幀間預(yù)測編碼，因此可以改進編碼效率。比例因子編碼單元35將經(jīng)受了幀間預(yù)測編碼的每幀的比例因子提供給復(fù)用器36 作為編碼的比例因子。另外，比例因子編碼單元35將從譜歸一化單元12提供的每幀的比例因子或從編碼的比例因子替換單元33提供的比例因子保持作為過去幀的比例因子。復(fù)用器36根據(jù)從錯誤檢測單元31提供的檢測的結(jié)果，對來自熵編碼單元14的編碼的譜數(shù)據(jù)、來自比例因子編碼單元35的編碼的比例因子、以及來自譜量化單元13的量化信息進行復(fù)用，以便生成每幀的編碼數(shù)據(jù)。復(fù)用器36用作輸出裝置，并且根據(jù)來自錯誤檢測單元31的檢測結(jié)果，輸出所生成的每幀的編碼數(shù)據(jù)，或輸出經(jīng)受了填充并從替選編碼數(shù)據(jù)輸出單元34提供的編碼的隱藏數(shù)據(jù)作為出現(xiàn)了編碼錯誤的幀的編碼數(shù)據(jù)。從復(fù)用器36 輸出的編碼數(shù)據(jù)或編碼的隱藏數(shù)據(jù)例如暫時由輸出緩沖器(未示出)保持，并且然后被傳送到另一設(shè)備。如果編碼錯誤的原因是幀的比特數(shù)小于編碼所需的比特數(shù)、或者從編碼開始經(jīng)過了特定時段，則在執(zhí)行復(fù)雜比特分配的量化期間很可能出現(xiàn)編碼錯誤。因此，當(dāng)檢測到編碼錯誤時，很可能算出了每幀的比例因子。為此，在該實施例中，信號水平計算單元32使用每幀的比例因子來計算譜水平。然而，如果當(dāng)檢測到編碼錯誤時沒有算出每幀的比例因子，則使用在檢測到編碼錯誤之前獲得的每幀的頻譜系數(shù)或音頻信號本身來計算譜水平。例如，如果在檢測到編碼錯誤之前已算出每幀的頻譜系數(shù)，則計算頻譜系數(shù)的平均值或最大值作為譜水平。如果在檢測到編碼錯誤之前僅檢測到每幀的音頻信號，則根據(jù)由時間-頻率變換單元11執(zhí)行的時間-頻率變換來對音頻信號的時間樣本的最大值、平均值或能量等執(zhí)行適當(dāng)?shù)目s放，并獲得譜水平。編碼的隱藏數(shù)據(jù)的幀結(jié)構(gòu)的示例圖3是示出編碼的隱藏數(shù)據(jù)的幀結(jié)構(gòu)的示例的圖。如圖3所示，在編碼的隱藏數(shù)據(jù)中，針對每幀對比例因子的編碼模式、編碼的比例因子、量化信息、以及用于隱藏的音頻信號的編碼譜等進行復(fù)用。比例因子的編碼模式可以是例如執(zhí)行編碼成偏移值和與該偏移值的差的偏移模式、執(zhí)行量化單位間預(yù)測編碼的量化單位間預(yù)測模式、執(zhí)行幀間預(yù)測編碼的幀間預(yù)測模式、執(zhí)行通道間預(yù)測編碼的通道間預(yù)測模式等。在該實施例中，以偏移模式對用于隱藏的音頻信號的比例因子進行編碼。因此，如圖3所示，編碼的隱藏數(shù)據(jù)的編碼的比例因子由偏移值Sf_offSet (整數(shù))、由以下表達式 ⑵定義的差信息ASF[n]的比特數(shù)N、以及差信息ASF[n]構(gòu)成。Δ SF [n] = SFec [η]-sf_offset— (2)在表達式⑵中，SFe。[n]表示第η個量化單位的用于隱藏的音頻信號的比例因子。另外，由于用于隱藏的音頻信號是微小噪聲信號，因此差A(yù)SF[n]足夠小，即約N= 2。另外，雖然未示出，但是原始音頻信號的編碼數(shù)據(jù)的幀結(jié)構(gòu)以與圖3中示出的編碼的隱藏數(shù)據(jù)的幀結(jié)構(gòu)相同的方式構(gòu)成。然而，編碼模式是幀間預(yù)測模式，并且將與過去幀的每個量化單位的比例因子有關(guān)的差信息等布置為編碼的比例因子。編碼的隱藏數(shù)據(jù)的比例因子的改變的描述圖4是示出由編碼的比例因子替換單元33進行的、編碼的隱藏數(shù)據(jù)的編碼的比例因子的改變的圖。要注意的是，在圖4中，水平軸表示分配給量化單位的數(shù)目n，而垂直軸表示比例因子的水平。如圖4所示，如果假設(shè)要輸入到編碼設(shè)備30的音頻信號的每幀的比例因子為SFsig[n]，并且假設(shè)由信號水平計算單元32算出的譜水平為SigLev，則編碼的比例因子替換單元33將編碼的比例因子的偏移值Sf_offSet改變成由以下表達式C3)表示的偏移值 sf_offset‘sf_offset' = SigLev—A···在表達式(3)中，“A”是用于調(diào)整用于隱藏的音頻信號的水平的整數(shù)。如圖4所示，期望設(shè)置整數(shù)A使得用于隱藏的音頻信號的校正之后的比例因子SF' ec[n]變得略小于(若干dB)譜水平SigLev。當(dāng)偏移值Sf_0fTSet改變成偏移值Sf_ofTSet'時，改變之后的用于隱藏的音頻信號的比例因子SF' ec[n]由以下表達式⑷表示SF' ec[n] = Δ SF[n]+sf_offset' — (4)如上所述，在編碼的隱藏數(shù)據(jù)的編碼的比例因子的情況下，每幀的用于隱藏的音頻信號的每個量化單位的比例因子SFe。[n]由與偏移值Sf_offSet的差A(yù)SF[n]表示。因此，編碼的比例因子替換單元33可以僅通過改變偏移值Sf_offSet，容易地改變每幀的用于隱藏的音頻信號的所有量化單位的比例因子。另外，由于編碼的比例因子替換單元33僅改變偏移值sf_offset，因此差信息Δ SF[η]的比特數(shù)N和差信息Δ SF[η]不改變。由編碼設(shè)備執(zhí)行的處理的描述圖5是示出由圖2中示出的編碼設(shè)備30執(zhí)行的編碼處理的流程圖。針對每幀執(zhí)行編碼處理，同時順序?qū)⒚繋囊纛l信號設(shè)置為編碼目標(biāo)。在圖5中示出的步驟Sll中，編碼設(shè)備30開始對編碼目標(biāo)進行編碼。更具體地，開始由時間-頻率變換單元11、譜歸一化單元12、譜量化單元13、熵編碼單元14、以及比例因子編碼單元35執(zhí)行的處理。當(dāng)編碼目標(biāo)是第一幀的音頻信號時，對編碼設(shè)備30進行初始化，并然后執(zhí)行編碼。在步驟S12中，錯誤檢測單元31判斷是否檢測到編碼錯誤。更具體地，錯誤檢測單元31判斷在編碼期間是否出現(xiàn)錯誤，并且判斷從編碼開始是否經(jīng)過特定時段(例如，在其期間可以執(zhí)行實時處理的時段)。如果在編碼期間出現(xiàn)錯誤或者如果從編碼開始經(jīng)過了特定時段，則在步驟S12中判斷出檢測到了編碼錯誤。錯誤檢測單元31將指示檢測到編碼錯誤的檢測結(jié)果提供給信號水平計算單元32和復(fù)用器36。在步驟S13中，編碼設(shè)備30停止編碼目標(biāo)的編碼，并且在以下的步驟S14至S19 中執(zhí)行錯誤隱藏處理。更具體地，在步驟S14中，信號水平計算單元32根據(jù)來自錯誤檢測單元31的檢測結(jié)果，計算由譜歸一化單元12獲得的幀的比例因子的平均值、最大值或最小值等作為譜水平。信號水平計算單元32將所算出的譜水平提供給編碼的比例因子替換單元33。在步驟S15中，編碼的比例因子替換單元33基于從信號水平計算單元32提供的譜水平，使用上述表達式C3)來計算偏移值Sf_ofTSet'。在步驟S16中，編碼的比例因子替換單元33基于偏移值Sf_offSet'，改變包括在編碼的隱藏數(shù)據(jù)中的編碼的比例因子的偏移值。編碼的比例因子替換單元33將改變了其偏移值的編碼的隱藏數(shù)據(jù)提供給替選編碼數(shù)據(jù)輸出單元34。在步驟S17中，替選編碼數(shù)據(jù)輸出單元34對編碼的隱藏數(shù)據(jù)執(zhí)行填充，使得從編碼的比例因子替換單元33提供的編碼的隱藏數(shù)據(jù)的比特數(shù)與輸出比特率對應(yīng)。然后，替選編碼數(shù)據(jù)輸出單元；34將經(jīng)受了填充的編碼的隱藏數(shù)據(jù)提供給復(fù)用器36。在步驟S18中，復(fù)用器36根據(jù)從錯誤檢測單元31提供的檢測結(jié)果，將經(jīng)受了填充的并且從替選編碼數(shù)據(jù)輸出單元34提供的編碼的隱藏數(shù)據(jù)輸出為目標(biāo)編碼數(shù)據(jù)。在步驟S19中，編碼的比例因子替換單元33將與在步驟S16中執(zhí)行的處理中改變了其偏移值的編碼的比例因子對應(yīng)的、并由上述表達式(4)表示的比例因子SF' ec[n]提供給比例因子編碼單元35，并且使得比例因子編碼單元35保持該比例因子SF' ec[n]。結(jié)果，由以下表達式(5)表示由比例因子編碼單元35保持的比例因子SFsig[n]SFsig [n] = SF' ec[n] = Δ SF[n]+sf_offset' ...(5)因此，即使出現(xiàn)了編碼錯誤，由于比例因子編碼單元35保持作為目標(biāo)編碼數(shù)據(jù)的編碼的隱藏數(shù)據(jù)的比例因子，因此當(dāng)對下一幀進行編碼時，比例因子編碼單元35也可以使用由其保持的比例因子來正確地執(zhí)行幀間預(yù)測編碼。另一方面，如果沒發(fā)生錯誤并且從編碼開始沒有經(jīng)過特定時段，則在步驟S12中判斷出沒有檢測到編碼錯誤。錯誤檢測單元31將指示沒有檢測到編碼錯誤的檢測結(jié)果提供給信號水平計算單元32和復(fù)用器36。在步驟S20中，編碼設(shè)備30判斷編碼目標(biāo)的編碼是否已結(jié)束。如果判斷出編碼目標(biāo)的編碼沒有結(jié)束，則處理返回到步驟S12。然后重復(fù)步驟S12到S20的處理，直到編碼目標(biāo)的編碼結(jié)束為止。如果在步驟S20中判斷出編碼目標(biāo)的編碼已結(jié)束，則復(fù)用器36根據(jù)從錯誤檢測單元31提供的檢測結(jié)果來輸出通過編碼生成的目標(biāo)編碼數(shù)據(jù)，并且終止處理。如上所述，由于編碼設(shè)備30基于要編碼的音頻信號的水平而改變編碼的隱藏數(shù)據(jù)的比例因子，因此可以生成具有更自然聲音的編碼的隱藏數(shù)據(jù)。解碼設(shè)備的配置示例圖6是示出對從圖2中示出的編碼設(shè)備30輸出的編碼數(shù)據(jù)進行解碼的解碼設(shè)備的配置示例的框圖。圖6中示出的解碼設(shè)備50包括逆復(fù)用器51、熵解碼單元52、譜逆量化單元53、比例因子解碼單元M、譜逆歸一化單元55以及頻率-時間變換單元56。解碼設(shè)備50對從編碼設(shè)備30輸出的每幀的編碼數(shù)據(jù)進行解碼，并且輸出得到的音頻信號。更具體地，逆復(fù)用器51用作提取裝置，并且如果從編碼設(shè)備30提供的每幀的編碼數(shù)據(jù)經(jīng)受了填充，則逆復(fù)用器51從編碼數(shù)據(jù)中提取填充之前的編碼數(shù)據(jù)。逆復(fù)用器51對所提取的填充之前的編碼數(shù)據(jù)、或沒有經(jīng)受填充的并從編碼設(shè)備30提供的每幀的編碼數(shù)據(jù)執(zhí)行逆復(fù)用，以便提取編碼的譜數(shù)據(jù)、編碼的縮放因子、以及量化信息。逆復(fù)用器51將編碼的譜數(shù)據(jù)提供給熵解碼單元52，并且將量化信息提供給譜逆量化單元53。另外，逆復(fù)用器51將編碼的比例因子提供給比例因子解碼單元M。熵解碼單元52對從逆復(fù)用器51提供的編碼的譜數(shù)據(jù)執(zhí)行與諸如哈夫曼編碼或算術(shù)編碼的可逆壓縮對應(yīng)的可逆解碼，并將得到的量化的每幀的頻譜系數(shù)提供給譜逆量化單
兀53ο譜逆量化單元53基于從逆復(fù)用器51提供的量化信息，對從熵解碼單元52提供的量化的每幀的頻譜系數(shù)執(zhí)行逆量化，以便獲得歸一化的每幀的頻譜系數(shù)。譜逆量化單元53 將歸一化的每幀的頻譜系數(shù)提供給譜逆歸一化單元55。
比例因子解碼單元M對從逆復(fù)用器51提供的編碼的比例因子進行解碼，以便獲得每幀的比例因子。更具體地，如果編碼模式是偏移模式，則比例因子解碼單元M使用包括在編碼的比例因子中的偏移值Sf_offSet'和差信息ASF[n]以及上述表達式，計算比例因子SF' ec[n]0另一方面，如果編碼模式是幀間預(yù)測模式，則比例因子解碼單元M使用由其保持的過去幀的比例因子，對編碼的比例因子執(zhí)行幀間預(yù)測解碼。更具體地，比例因子解碼單元 54通過將包括在編碼的比例因子中的差信息與由其保持的過去幀的比例因子相加，計算當(dāng)前幀的比例因子。比例因子解碼單元討保持所獲得的每幀的比例因子，并且將該比例因子提供給譜逆歸一化單元陽。譜逆歸一化單元55基于從比例因子解碼單元M提供的每幀的比例因子，針對每個量化單位，對從譜逆量化單元53提供的每幀的歸一化頻譜系數(shù)執(zhí)行逆歸一化。譜逆歸一化單元55將作為逆歸一化結(jié)果獲得的每幀的頻譜系數(shù)提供給頻率-時間變換單元56。頻率-時間變換單元56對從譜逆歸一化單元55提供的每幀的頻譜系數(shù)執(zhí)行諸如逆修正的離散余弦變換(IMDCT)的頻率-時間變換。頻率-時間變換單元56輸出作為得到的每幀的時間信號的音頻信號。如果對每幀的頻譜系數(shù)執(zhí)行IMDCT，則每幀的音頻信號是通過對與相應(yīng)幀的頻譜系數(shù)對應(yīng)的音頻信號和與先前幀的頻譜系數(shù)對應(yīng)的音頻信號進行疊加獲得的音頻信號。這里，如上所述，編碼的隱藏數(shù)據(jù)的比例因子是基于在出現(xiàn)編碼錯誤的時刻處的音頻信號的譜水平而設(shè)置的。因此，用于隱藏的音頻信號的譜水平與原始音頻信號的譜水平?jīng)]有顯著地不同。結(jié)果，通過使用頻率-時間變換單元56對與先前和下一幀的頻譜系數(shù)對應(yīng)的音頻信號進行相加，用于隱藏的音頻信號可以平滑地連接到先前和下一幀的音頻信號。解碼處理的描述圖7是示出由圖6中示出的解碼設(shè)備50執(zhí)行的解碼處理的流程圖。當(dāng)將例如將從圖2中示出的編碼設(shè)備30輸出的每幀的編碼數(shù)據(jù)輸入到解碼設(shè)備50時，解碼處理開始。當(dāng)對第一幀的編碼數(shù)據(jù)執(zhí)行解碼處理時，在解碼處理之前對解碼設(shè)備50進行初始化。在圖7中示出的步驟S31中，逆復(fù)用器51對從編碼設(shè)備30提供的每幀的編碼數(shù)據(jù)執(zhí)行逆復(fù)用，以便提取編碼的譜數(shù)據(jù)、編碼的比例因子以及量化信息。如果從編碼設(shè)備30 提供的每幀的編碼數(shù)據(jù)經(jīng)受了填充，則逆復(fù)用器51提取填充之前的編碼數(shù)據(jù)，并且然后執(zhí)行逆復(fù)用。逆復(fù)用器51將編碼的譜數(shù)據(jù)提供給熵解碼單元52，并且將量化信息提供給譜逆量化單元53。另外，逆復(fù)用器51將編碼的比例因子提供給比例因子解碼單元M。在步驟S32中，熵解碼單元52對從逆復(fù)用器51提供的編碼的譜數(shù)據(jù)執(zhí)行與諸如哈夫曼編碼或算術(shù)編碼的可逆壓縮對應(yīng)的可逆解碼。熵解碼單元52然后將得到的量化的每幀的頻譜系數(shù)提供給譜逆量化單元53。在步驟S33中，譜逆量化單元53基于從逆復(fù)用器51提供的量化信息，對從熵解碼單元52提供的量化的每幀的頻譜系數(shù)執(zhí)行逆量化。譜逆量化單元53將得到的歸一化的每幀的頻譜系數(shù)提供給譜逆歸一化單元陽。在步驟S34中，比例因子解碼單元M根據(jù)包括在編碼的比例因子中的編碼模式，對從逆復(fù)用器51提供的編碼的比例因子進行解碼，以便獲得比例因子。
在步驟S35中，比例因子解碼單元M保持所獲得的比例因子。如果位于要解碼的當(dāng)前幀之后的幀的編碼的比例因子的編碼模式是幀間預(yù)測模式，則該比例因子用來對編碼的比例因子進行解碼。比例因子解碼單元M將所獲得的比例因子提供給譜逆歸一化單元 55。在步驟S36中，譜逆歸一化單元55基于從比例因子解碼單元M提供的每幀的比例因子，針對每個量化單位，對從譜逆量化單元53提供的歸一化的每幀的頻譜系數(shù)執(zhí)行逆歸一化。譜逆歸一化單元55將作為逆歸一化結(jié)果獲得的每幀的頻譜系數(shù)提供給頻率-時間變換單元56。在步驟S37中，頻率-時間變換單元56對從譜逆歸一化單元55提供的每幀的頻譜系數(shù)執(zhí)行諸如IMDCT的頻率-時間變換。在步驟S38中，頻率-時間變換單元56輸出音頻信號，并且然后終止處理，其中，該音頻信號是作為頻率-時間變換的結(jié)果獲得的每幀的時間信號。如上所述，解碼設(shè)備50基于包括在編碼的隱藏數(shù)據(jù)中并基于原始音頻信號的譜水平改變的編碼的比例因子，對編碼的隱藏數(shù)據(jù)的歸一化的頻譜系數(shù)執(zhí)行逆歸一化。結(jié)果，解碼設(shè)備50可以生成用于隱藏的音頻信號作為解碼的結(jié)果，該用于隱藏的音頻信號的譜水平與原始音頻信號的譜水平對應(yīng)并且具有自然的聲音。解碼設(shè)備的另一配置示例圖8是示出對從編碼設(shè)備30輸出的編碼數(shù)據(jù)進行解碼的解碼設(shè)備的另一配置示例的框圖。在圖8中示出的配置中，對與圖6中示出的部件相同的部件給予與圖6中相同的附圖標(biāo)記。如需要，省略冗余描述。圖8中示出的解碼設(shè)備70的配置與圖6中示出的配置的不同之處在于，新提供了隱藏數(shù)據(jù)檢測單元71和隱藏譜生成單元72，并且提供譜逆歸一化單元73以替代譜逆歸一化單元55。如果從編碼設(shè)備30提供的每幀的編碼數(shù)據(jù)是編碼的隱藏數(shù)據(jù)，則解碼設(shè)備70 不對編碼的隱藏數(shù)據(jù)進行解碼，而是新生成用于隱藏的音頻信號。更具體地，解碼設(shè)備70的隱藏數(shù)據(jù)檢測單元71用作判斷裝置，并且對由存儲器 (未示出)保持的并且與由編碼設(shè)備30保持的編碼的隱藏數(shù)據(jù)相同的編碼的隱藏數(shù)據(jù)和從編碼設(shè)備30提供的每幀的編碼數(shù)據(jù)進行比較。隱藏數(shù)據(jù)檢測單元71基于比較結(jié)果，判斷從編碼設(shè)備30提供的每幀的編碼數(shù)據(jù)是否是編碼的隱藏數(shù)據(jù)，并且將判斷結(jié)果提供給隱藏譜生成單元72。隱藏譜生成單元72根據(jù)從隱藏數(shù)據(jù)檢測單元71提供的判斷結(jié)果，基于由譜逆量化單元53獲得的歸一化的每幀的頻譜系數(shù)，生成用于隱藏的系數(shù)。用于隱藏的系數(shù)是由解碼設(shè)備70生成的用于隱藏的音頻信號的歸一化頻譜系數(shù)。隱藏譜生成單元72將所生成的用于隱藏的系數(shù)提供給譜逆歸一化單元73。譜逆歸一化單元73基于來自比例因子編碼單元M的比例因子，對來自譜逆量化單元53的歸一化頻譜系數(shù)或來自隱藏譜生成單元72的用于隱藏的系數(shù)執(zhí)行逆歸一化。譜逆歸一化單元73將作為逆歸一化的結(jié)果獲得的頻譜系數(shù)提供給頻率-時間變換單元56。結(jié)果，生成與來自譜逆量化單元53的歸一化頻譜系數(shù)對應(yīng)的音頻信號作為原始信號，并且生成與用于隱藏的系數(shù)對應(yīng)的音頻信號作為新的用于隱藏的音頻信號。
編碼數(shù)據(jù)的比較的描述圖9是示出由圖8中示出的隱藏數(shù)據(jù)檢測單元71執(zhí)行的編碼數(shù)據(jù)的比較的圖。如圖9所示，在由存儲器(未示出)保持的編碼的隱藏數(shù)據(jù)和從編碼設(shè)備30提供的每幀的編碼數(shù)據(jù)的每幀中布置編碼模式、編碼的比例因子、量化信息以及編碼譜。隱藏數(shù)據(jù)檢測單元71對編碼的隱藏數(shù)據(jù)和除編碼的比例因子之外的每幀的編碼數(shù)據(jù)進行比較。要注意的是，隱藏數(shù)據(jù)檢測單元71可一次共同地對除編碼的比例因子之外的數(shù)據(jù)進行比較，或可通過劃分數(shù)據(jù)逐步地對數(shù)據(jù)進行比較。如果隱藏數(shù)據(jù)檢測單元71逐步地對除編碼的比例因子之外的數(shù)據(jù)進行比較，則首先，從編碼的隱藏數(shù)據(jù)和每幀的編碼數(shù)據(jù)中提取在編碼譜中最具特色的圖9中示出的若干字節(jié)的數(shù)據(jù)(1)。數(shù)據(jù)(1)可以是例如其形式出現(xiàn)頻率較低的若干字節(jié)的數(shù)據(jù)。接下來，隱藏數(shù)據(jù)檢測單元71對編碼的隱藏數(shù)據(jù)和每幀的編碼數(shù)據(jù)的數(shù)據(jù)(1)進行比較。由于數(shù)據(jù)⑴是若干字節(jié)的數(shù)據(jù)，因此可以以高速率執(zhí)行比較。如果作為比較的結(jié)果發(fā)現(xiàn)編碼的隱藏數(shù)據(jù)和每幀的編碼數(shù)據(jù)的數(shù)據(jù)(1)不匹配，則隱藏數(shù)據(jù)檢測單元71判斷出每幀的編碼數(shù)據(jù)不是編碼的隱藏數(shù)據(jù)。另一方面，如果編碼的隱藏數(shù)據(jù)和每幀的編碼數(shù)據(jù)的數(shù)據(jù)(1)匹配，則隱藏數(shù)據(jù)檢測單元71提取編碼的隱藏數(shù)據(jù)和每幀的編碼數(shù)據(jù)中的、例如作為編碼譜中除數(shù)據(jù)(1)之外的數(shù)據(jù)的數(shù)據(jù)0)，并且對數(shù)據(jù)(2)進行比較。如果作為比較的結(jié)果發(fā)現(xiàn)編碼的隱藏數(shù)據(jù)和每幀的編碼數(shù)據(jù)的數(shù)據(jù)( 不匹配，則隱藏數(shù)據(jù)檢測單元71判斷出每幀的編碼數(shù)據(jù)不是編碼的隱藏數(shù)據(jù)。以如上相同的方式，隱藏數(shù)據(jù)檢測單元71從編碼的隱藏數(shù)據(jù)和每幀的編碼數(shù)據(jù)中提取量化信息(3)，并且對量化信息(3)進行比較。如果量化信息(3)匹配，則隱藏數(shù)據(jù)檢測單元71從編碼的隱藏數(shù)據(jù)和每幀的編碼數(shù)據(jù)中提取數(shù)據(jù)(4)并且對數(shù)據(jù)(4)進行比較，其中數(shù)據(jù)(4)是除編碼的比例因子、數(shù)據(jù)(1)、數(shù)據(jù)O)以及量化信息C3)之外的數(shù)據(jù)。如果編碼的隱藏數(shù)據(jù)和每幀的編碼數(shù)據(jù)的數(shù)據(jù)(1)、數(shù)據(jù)O)、量化信息(3)以及數(shù)據(jù)(4) 全部匹配，則隱藏數(shù)據(jù)檢測單元71判斷出每幀的編碼數(shù)據(jù)是編碼的隱藏數(shù)據(jù)。另一方面，如果編碼的隱藏數(shù)據(jù)和每幀的編碼數(shù)據(jù)的量化信息(3)或數(shù)據(jù)(4)不匹配，則隱藏數(shù)據(jù)檢測單元71判斷出每幀的編碼數(shù)據(jù)不是編碼的隱藏數(shù)據(jù)。如上所述，當(dāng)逐步地對除編碼的比例因子之外的數(shù)據(jù)進行比較時，在編碼的隱藏數(shù)據(jù)和每幀的編碼數(shù)據(jù)的數(shù)據(jù)(1)、數(shù)據(jù)O)、量化信息(3)以及數(shù)據(jù)(4)中任一不匹配時，隱藏數(shù)據(jù)檢測單元71可以判斷出每幀的編碼數(shù)據(jù)不是編碼的隱藏數(shù)據(jù)。因此，隱藏數(shù)據(jù)檢測單元71可以有效地判斷每幀的編碼數(shù)據(jù)是否是編碼的隱藏數(shù)據(jù)。另外，當(dāng)除了編碼的比例因子之外的所有數(shù)據(jù)匹配時，隱藏數(shù)據(jù)檢測單元71判斷出每幀的編碼數(shù)據(jù)是編碼的隱藏數(shù)據(jù)，可以準(zhǔn)確地檢測編碼的隱藏數(shù)據(jù)。要理解的是，對數(shù)據(jù)O)、量化信息(3)以及數(shù)據(jù)⑷的比較的順序不限于上述情況。另一解碼處理的描述圖10是示出由圖8中示出的解碼設(shè)備70執(zhí)行的解碼處理的流程圖。當(dāng)例如將從圖2中示出的編碼設(shè)備30輸出的每幀的編碼數(shù)據(jù)輸入到解碼設(shè)備70時，解碼處理開始。當(dāng)對第一幀的編碼數(shù)據(jù)執(zhí)行解碼處理時，在解碼處理之前對解碼設(shè)備70進行初始化。
在圖10中示出的步驟S51至S55中執(zhí)行的處理與在圖7中示出的步驟S31至S35 中執(zhí)行的處理相同，并且因此省略其描述。在步驟S55中執(zhí)行的處理之后，如圖9所示，在步驟S56中，隱藏數(shù)據(jù)檢測單元71 對要解碼的每幀的編碼數(shù)據(jù)和編碼的隱藏數(shù)據(jù)中的、除編碼的比例因子之外的數(shù)據(jù)進行比較。在步驟S57中，隱藏數(shù)據(jù)檢測單元71基于比較結(jié)果，判斷要解碼的每幀的編碼數(shù)據(jù)是否是編碼的隱藏數(shù)據(jù)，并且將判斷結(jié)果提供給隱藏譜生成單元72。如果在步驟S57中判斷出要解碼的每幀的編碼數(shù)據(jù)不是編碼的隱藏數(shù)據(jù)，則處理進行到步驟S58。在步驟S58中，譜逆歸一化單元73基于來自比例因子解碼單元M的比例因子，對來自譜逆量化單元53的歸一化頻譜系數(shù)執(zhí)行逆歸一化。譜逆歸一化單元73將作為逆歸一化的結(jié)果獲得的頻譜系數(shù)提供給頻率-時間變換單元56。然后，處理進行到步驟 S61。另一方面，如果在步驟S57中判斷出要解碼的每幀的編碼數(shù)據(jù)是編碼的隱藏數(shù)據(jù)，則處理進行到步驟S59。在步驟S59中，隱藏譜生成單元72基于由譜逆量化單元53獲得的歸一化頻譜系數(shù)，生成用于隱藏的系數(shù)。更具體地，隱藏譜生成單元72生成位于要解碼的幀之前的幀的歸一化頻譜系數(shù)的平均值、或位于緊挨在要解碼的幀之前和之后的幀的歸一化頻譜系數(shù)的平均值，作為用于隱藏的系數(shù)。然而，如果位于要解碼的幀之后的幀的歸一化頻譜系數(shù)用來生成用于隱藏的系數(shù)，則產(chǎn)生延遲。要理解的是，用于生成用于隱藏的系數(shù)的方法不限于上述方法。隱藏譜生成單元72將所生成的用于隱藏的系數(shù)提供給譜逆歸一化單元73。在步驟S60中，譜逆歸一化單元73基于來自比例因子解碼單元M的比例因子，對從隱藏譜生成單元72提供的用于隱藏的系數(shù)執(zhí)行逆歸一化。譜逆歸一化單元73將作為逆歸一化結(jié)果獲得的頻譜系數(shù)提供給頻率-時間變換單元56。然后，處理進行到步驟S61。在步驟S61和S62中執(zhí)行的處理與圖7中示出的步驟S37和S38中執(zhí)行的處理相同，因此省略其描述。如果通過在步驟S59至S61中執(zhí)行的上述處理判斷出要解碼的編碼數(shù)據(jù)是編碼的隱藏數(shù)據(jù)，則使用包括在編碼的隱藏數(shù)據(jù)中的編碼的比例因子和位于編碼的隱藏數(shù)據(jù)之前或之后的編碼數(shù)據(jù)，生成新的用于隱藏的音頻信號。因此，在這種情況下，隱藏譜生成單元 72、譜逆歸一化單元73以及頻率-時間變換單元56用作用于生成新的用于隱藏的音頻信號的生成裝置。要注意的是，雖然在圖10中示出的解碼處理中假設(shè)執(zhí)行步驟S52和S53中的處理，而不管解碼目標(biāo)是編碼的隱藏數(shù)據(jù)還是原始音頻信號的編碼數(shù)據(jù)，但是當(dāng)解碼目標(biāo)是編碼的隱藏數(shù)據(jù)時，不一定執(zhí)行步驟S52和S53中的處理。如上所述，解碼設(shè)備70通過對要解碼的每幀的編碼數(shù)據(jù)和編碼的隱藏數(shù)據(jù)進行比較，判斷要解碼的每幀的編碼數(shù)據(jù)是否是編碼的隱藏數(shù)據(jù)。因此，編碼設(shè)備30不需要向解碼設(shè)備70傳送表示編碼數(shù)據(jù)是否是編碼的隱藏數(shù)據(jù)的標(biāo)志，由此減少要傳送的比特數(shù)。相反，當(dāng)需要向解碼設(shè)備傳送表示編碼數(shù)據(jù)是否是編碼的隱藏數(shù)據(jù)的標(biāo)志時，即，例如當(dāng)已經(jīng)確定編碼數(shù)據(jù)的格式時，需要向編碼數(shù)據(jù)添加標(biāo)志作為新頭，或確定新格式。
另外，如果要解碼的每幀的編碼數(shù)據(jù)是編碼的隱藏數(shù)據(jù)，則解碼設(shè)備70生成用于隱藏的系數(shù)，并且基于包括在編碼的隱藏數(shù)據(jù)中的編碼的比例因子，對該用于隱藏的系數(shù)執(zhí)行逆歸一化。因此，解碼設(shè)備70可以僅通過生成用于隱藏的系數(shù)容易地生成如下用于隱藏的音頻信號其頻譜與原始音頻信號的譜水平對應(yīng)并且具有自然聲音。相反，在不使用基于發(fā)生了編碼錯誤的幀的原始音頻信號的譜水平的比例因子來生成用于隱藏的音頻信號的解碼設(shè)備的情況下，需要諸如計算單元和存儲器的多個資源，并且難以生成具有自然聲音的用于隱藏的音頻信號。此外，由于解碼設(shè)備70基于至少位于要解碼的幀之前或之后的幀的歸一化頻譜系數(shù)而生成用于隱藏的系數(shù)，因此可以生成具有更自然聲音的用于隱藏的音頻信號。雖然在該實施例中用于隱藏的音頻信號的比例因子的編碼模式是偏移模式，但是編碼模式不限于此。例如，可以確定左通道的用于隱藏的音頻信號的比例因子的編碼模式為量化單位間預(yù)測模式，而右通道的用于隱藏的音頻信號的比例因子的編碼模式為通道間預(yù)測模式。然而，不期望將幀間預(yù)測模式設(shè)置為用于隱藏的音頻信號的比例因子的編碼模式。當(dāng)不設(shè)置幀間預(yù)測模式時，可以減少錯誤隱藏處理的處理量，并且因此可以減少要存儲在編碼設(shè)備30的存儲區(qū)域中的數(shù)據(jù)量。另外，可以針對每幀設(shè)置比例因子的編碼模式。此外，雖然上述編碼數(shù)據(jù)包括編碼的比例因子，但是包括在編碼數(shù)據(jù)中的關(guān)于歸一化的信息不一定是編碼的比例因子，而可以是用于歸一化的系數(shù)或比例因子本身。應(yīng)用本公開內(nèi)容的計算機的描述現(xiàn)在，可通過硬件或軟件執(zhí)行上述系列處理。如果通過軟件執(zhí)行系列處理，則包括在軟件中的程序安裝在通用計算機等上。圖11示出了在其上安裝了執(zhí)行上述系列處理的程序的、根據(jù)實施例的計算機的配置示例。程序可預(yù)先記錄在作為并入計算機的記錄介質(zhì)的、存儲單元208或只讀存儲器 (ROM) 202 上。替選地，程序可存儲(記錄)在可移動介質(zhì)211中。這樣的可移動介質(zhì)可設(shè)置為所謂的封裝軟件。這里，可移動介質(zhì)211可以是例如軟盤、光盤只讀存儲器(CD-ROM)、磁-光 (MO)盤、數(shù)字多功能盤(DVD)、磁盤、半導(dǎo)體存儲器等。程序不僅可以通過驅(qū)動器210從上述可移動介質(zhì)211安裝在計算機上，而且可以通過經(jīng)由通信網(wǎng)絡(luò)或廣播網(wǎng)絡(luò)將程序下載到計算機而安裝在并入計算機的存儲單元208 上。即，程序可以例如通過用于數(shù)字衛(wèi)星廣播的人造衛(wèi)星從下載站點無線傳遞到計算機，或者通過諸如局域網(wǎng)(LAN)或因特網(wǎng)的纜線網(wǎng)絡(luò)傳遞到計算機。計算機包括中央處理單元(CPU) 201。輸入/輸出接口 205通過總線204連接到 CPU 201。當(dāng)例如操作輸入單元206的用戶通過輸入/輸出接口 205將命令輸入到CPU 201 時，CPU 201執(zhí)行存儲在ROM 202中的程序。替選地，CPU201將存儲在存儲單元208中的程序裝載到隨機存取存儲器(RAM) 203中，并執(zhí)行該程序。因此，CPU 201執(zhí)行根據(jù)上述流程圖的處理、或根據(jù)在上述框圖中示出的配置的處理。然后，CPU 201例如當(dāng)需要時通過輸入/輸出接口 205，從輸出單元207輸出處理的結(jié)果，從通信單元209傳送處理的結(jié)果，或者將處理的結(jié)果記錄在存儲單元208上。輸入單元206由鍵盤、鼠標(biāo)、麥克風(fēng)等構(gòu)成。輸出單元207由液晶顯示器(IXD)、揚聲器等構(gòu)成。不一定按這里的流程圖中描述的順序、按時間序列來執(zhí)行由計算機根據(jù)程序所執(zhí)行的處理。即，由計算機根據(jù)程序所執(zhí)行的處理包括彼此并行或單獨執(zhí)行的處理(例如，并行處理或使用對象執(zhí)行的處理)。另外，程序可由單臺計算機(處理器)處理、或者可經(jīng)受由多臺計算機執(zhí)行的分布式處理。此外，程序可被傳遞到遠程計算機并被執(zhí)行。本公開內(nèi)容的實施例不限于上述實施例，并且可以以不偏離本公開內(nèi)容的范圍的各種方式進行修改。本公開內(nèi)容包含與2010年12月3日向日本專利局提交的日本優(yōu)先權(quán)專利申請JP 2010-270M4中公開的主題內(nèi)容相關(guān)的主題內(nèi)容，在此通過引用將其全文合并于此。本領(lǐng)域的技術(shù)人員應(yīng)該理解，在所附權(quán)利要求或其等同方案的范圍內(nèi)，根據(jù)設(shè)計需要和其它因素，可進行各種修改、組合、子組合以及變更。
權(quán)利要求
1.一種編碼設(shè)備，包括時間-頻率變換單元，其對音頻信號執(zhí)行時間-頻率變換；歸一化單元，其對通過所述時間-頻率變換獲得的頻譜系數(shù)進行歸一化，以便生成所述音頻信號的編碼數(shù)據(jù)；水平計算單元，其計算所述音頻信號的水平；比例因子改變單元，其基于所述音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，所述隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及輸出單元，如果在所述音頻信號的編碼期間未出現(xiàn)錯誤，則所述輸出單元輸出由所述歸一化單元生成的所述音頻信號的編碼數(shù)據(jù)，并且如果在所述音頻信號的編碼期間出現(xiàn)了錯誤，則所述輸出單元輸出改變了其隱藏比例因子的所述編碼的隱藏數(shù)據(jù)作為所述音頻信號的編碼數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的編碼設(shè)備，其中，所述水平計算單元計算原始比例因子的平均值、最大值或最小值作為所述音頻信號的水平，所述原始比例因子是與用于由所述歸一化單元對所述音頻信號執(zhí)行的歸一化的系數(shù)有關(guān)的比例因子。
3.根據(jù)權(quán)利要求1所述的編碼設(shè)備，其中，所述隱藏比例因子被編碼成特定偏移值和所述特定偏移值與所述隱藏比例因子之間的差，并且其中，所述比例因子改變單元通過改變所述特定偏移值來改變所述隱藏比例因子。
4.根據(jù)權(quán)利要求1所述的編碼設(shè)備，還包括比例因子編碼單元，其對原始比例因子執(zhí)行幀間預(yù)測編碼并保持所述原始比例因子，所述原始比例因子是與用于由所述歸一化單元對所述音頻信號執(zhí)行的歸一化的系數(shù)有關(guān)的比例因子，其中，如果在所述音頻信號的編碼期間出現(xiàn)了錯誤，則所述比例因子改變單元使得所述歸一化單元保持經(jīng)受了由所述比例因子改變單元進行的改變的所述隱藏比例因子作為所述音頻信號的原始比例因子，并且其中，所述比例因子編碼單元使用由所述比例因子編碼單元保持的所述原始比例因子，對所述原始比例因子執(zhí)行幀間預(yù)測編碼。
5.根據(jù)權(quán)利要求1所述的編碼設(shè)備，其中，所述編碼的隱藏數(shù)據(jù)的比特數(shù)是能夠由所述編碼設(shè)備處理的最小比特數(shù)，并且其中，所述輸出單元對所述編碼的隱藏數(shù)據(jù)執(zhí)行填充，使得所述編碼的隱藏數(shù)據(jù)的比特數(shù)對應(yīng)于輸出比特率，并且輸出所述編碼的隱藏數(shù)據(jù)。
6.一種編碼方法，包括使得編碼設(shè)備對音頻信號執(zhí)行時間-頻率變換；對通過所述時間-頻率變換獲得的頻譜系數(shù)進行歸一化，以便生成所述音頻信號的編碼數(shù)據(jù)；計算所述音頻信號的水平；基于所述音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，所述隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及如果在所述音頻信號的編碼期間未出現(xiàn)錯誤，則輸出通過歸一化生成的所述音頻信號的編碼數(shù)據(jù)，并且如果在所述音頻信號的編碼期間出現(xiàn)了錯誤，則輸出改變了其隱藏比例因子的所述編碼的隱藏數(shù)據(jù)作為所述音頻信號的編碼數(shù)據(jù)。
7.一種用于使得計算機執(zhí)行以下處理的程序，所述處理包括對音頻信號執(zhí)行時間-頻率變換；對通過所述時間-頻率變換獲得的頻譜系數(shù)進行歸一化，以便生成所述音頻信號的編碼數(shù)據(jù)；計算所述音頻信號的水平；基于所述音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，所述隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及如果在所述音頻信號的編碼期間未出現(xiàn)錯誤，則輸出通過歸一化生成的所述音頻信號的編碼數(shù)據(jù)，并且如果在所述音頻信號的編碼期間出現(xiàn)了錯誤，則輸出改變了其隱藏比例因子的所述編碼的隱藏數(shù)據(jù)作為所述音頻信號的編碼數(shù)據(jù)。
8.一種解碼設(shè)備，包括逆歸一化單元，其使用包括在從編碼設(shè)備提供的編碼數(shù)據(jù)中的所述編碼數(shù)據(jù)的比例因子，對所述編碼數(shù)據(jù)執(zhí)行逆歸一化，其中，如果在音頻信號的編碼期間未出現(xiàn)錯誤，則所述編碼設(shè)備輸出通過對所述音頻信號執(zhí)行時間-頻率變換和歸一化而生成的編碼數(shù)據(jù)，并且如果在所述音頻信號的編碼期間出現(xiàn)了錯誤，則所述編碼設(shè)備基于所述音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，并且然后輸出所述編碼的隱藏數(shù)據(jù)作為所述音頻信號的編碼數(shù)據(jù)，所述隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及頻率-時間變換單元，其對作為由所述逆歸一化單元執(zhí)行的逆歸一化的結(jié)果而獲得的頻譜執(zhí)行頻率-時間變換。
9.根據(jù)權(quán)利要求8所述的解碼設(shè)備，還包括判斷單元，其通過對所述編碼數(shù)據(jù)與用于比較的編碼的隱藏數(shù)據(jù)進行比較，判斷所述編碼數(shù)據(jù)是否是所述編碼的隱藏數(shù)據(jù)，所述用于比較的編碼的隱藏數(shù)據(jù)是改變所述隱藏比例因子之前的所述編碼的隱藏數(shù)據(jù)。
10.根據(jù)權(quán)利要求9所述的解碼設(shè)備，其中，所述判斷單元對作為包括在所述編碼數(shù)據(jù)中的、除所述比例因子之外的數(shù)據(jù)的第一數(shù)據(jù)與作為包括在所述用于比較的編碼的隱藏數(shù)據(jù)中的、除了所述隱藏比例因子之外的數(shù)據(jù)的第二數(shù)據(jù)進行比較，并且如果所述第一數(shù)據(jù)與所述第二數(shù)據(jù)匹配，則判斷出所述編碼數(shù)據(jù)是所述編碼的隱藏數(shù)據(jù)。
11.根據(jù)權(quán)利要求9所述的解碼設(shè)備，還包括生成單元，如果所述判斷單元判斷出所述編碼數(shù)據(jù)是所述編碼的隱藏數(shù)據(jù)，則使用包括在所述編碼的隱藏數(shù)據(jù)中的所述隱藏比例因子和所述編碼的隱藏數(shù)據(jù)前面的編碼數(shù)據(jù)來生成用于隱藏的音頻信號，其中，如果所述判斷單元判斷出所述編碼數(shù)據(jù)不是所述編碼的隱藏數(shù)據(jù)，則所述逆歸一化單元對所述編碼數(shù)據(jù)執(zhí)行逆歸一化。
12.根據(jù)權(quán)利要求8所述的解碼設(shè)備，其中，所述隱藏比例因子被編碼成特定偏移值和所述特定偏移值與所述隱藏比例因子之間的差。
13.根據(jù)權(quán)利要求8所述的解碼設(shè)備，還包括比例因子解碼單元，其對不是所述編碼的隱藏數(shù)據(jù)的所述編碼數(shù)據(jù)的所述比例因子執(zhí)行幀間預(yù)測解碼，并且保持作為解碼的結(jié)果獲得的比例因子，其中，所述比例因子解碼單元將所述隱藏比例因子保持為作為解碼的結(jié)果獲得的所述比例因子，并且使用由所述比例因子解碼單元保持的所述比例因子來執(zhí)行幀間預(yù)測解碼。
14.根據(jù)權(quán)利要求8所述的解碼設(shè)備，還包括提取單元，其從經(jīng)受了填充并從所述編碼設(shè)備提供的編碼的隱藏數(shù)據(jù)提取所述編碼的隱藏數(shù)據(jù)。
15.一種解碼方法，包括使得解碼設(shè)備使用包括在從編碼設(shè)備提供的編碼數(shù)據(jù)中的所述編碼數(shù)據(jù)的比例因子，對所述編碼數(shù)據(jù)執(zhí)行逆歸一化，其中，如果在音頻信號的編碼期間未出現(xiàn)錯誤，則所述編碼設(shè)備輸出通過對所述音頻信號執(zhí)行時間-頻率變換和歸一化而生成的編碼數(shù)據(jù)，并且如果在所述音頻信號的編碼期間出現(xiàn)了錯誤，則所述編碼設(shè)備基于所述音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，并且然后輸出所述編碼的隱藏數(shù)據(jù)作為所述音頻信號的編碼數(shù)據(jù)，所述隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及對作為所述逆歸一化的結(jié)果獲得的頻譜執(zhí)行頻率-時間變換。
16.一種用于使得計算機執(zhí)行以下處理的程序，所述處理包括使用包括在從編碼設(shè)備提供的編碼數(shù)據(jù)中的所述編碼數(shù)據(jù)的比例因子，對所述編碼數(shù)據(jù)執(zhí)行逆歸一化，其中，如果在音頻信號的編碼期間未出現(xiàn)錯誤，則所述編碼設(shè)備輸出通過對所述音頻信號執(zhí)行時間-頻率變換和歸一化而生成的編碼數(shù)據(jù)，并且如果在所述音頻信號的編碼期間出現(xiàn)了錯誤，則所述編碼設(shè)備基于所述音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，并且然后輸出所述編碼的隱藏數(shù)據(jù)作為所述音頻信號的編碼數(shù)據(jù)，所述隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及對作為所述逆歸一化的結(jié)果獲得的頻譜執(zhí)行頻率-時間變換。
全文摘要
本公開內(nèi)容提供了一種編碼設(shè)備、編碼方法、解碼設(shè)備、解碼方法以及程序。其中，編碼設(shè)備包括時間-頻率變換單元，其對音頻信號執(zhí)行時間-頻率變換；歸一化單元，其對通過時間-頻率變換獲得的頻譜系數(shù)進行歸一化，以便生成音頻信號的編碼數(shù)據(jù)；水平計算單元，其計算音頻信號的水平；比例因子改變單元，其基于音頻信號的水平，改變包括在通過對微小噪聲信號執(zhí)行時間-頻率變換和歸一化而獲得的編碼的隱藏數(shù)據(jù)中的隱藏比例因子，該隱藏比例因子是與用于歸一化的系數(shù)有關(guān)的比例因子；以及輸出單元，其輸出由歸一化單元生成的音頻信號的編碼數(shù)據(jù)、或者輸出改變了其隱藏比例因子的編碼的隱藏數(shù)據(jù)作為音頻信號的編碼數(shù)據(jù)。
文檔編號G10L19/00GK102486923SQ20111038079
公開日2012年6月6日申請日期2011年11月25日優(yōu)先權(quán)日2010年12月3日
發(fā)明者前田祐兒, 戶栗康裕, 松本淳, 松村祐樹, 鈴木志朗申請人:索尼公司

完整全部詳細技術(shù)資料下載