專利名稱:使用超級幀收發(fā)多信道音頻信號的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種收發(fā)多信道音頻信號的方法及裝置,尤其涉及一種利用超級幀收發(fā)多信道音頻信號的方法及裝置?!?br>
背景技術(shù):
最近對多信道音頻編碼的方法的研究較多。在動態(tài)圖像專家組(MPEG)環(huán)繞技術(shù)中也形成對多信道音頻的編碼/譯碼方式的標準化,使用將下混合的多信道音頻分成立體聲音頻信號和附加信號而編碼的方法。這時,適應(yīng)于其應(yīng)用,下混合的立體聲音頻信號根據(jù)高級音頻編碼(Advanced Audio Coding, AAC),位片算數(shù)編碼(Bit Sliced ArithmeticCoding, BSAC)等音頻編碼方法編碼。同時,數(shù)字多媒體廣播(Digital Multimedia Broadcasting, DMB)作為可在移動環(huán)境收信的多媒體服務(wù),通過手機、掌上電腦(PDA)、車用接收機等終端形成服務(wù)。該DMB只支持立體聲音頻,最近也研究擴張該技術(shù),提供多信道音頻的方法。如此,在基于立體聲的DMB中提供多信道音頻服務(wù)時最重要的一點是需要維持與現(xiàn)有的基于立體聲的DMB服務(wù)之間的逆互換性,有效地傳輸數(shù)據(jù)。相比立體聲音頻,多信道音頻具有數(shù)據(jù)率高的特點,不過相比數(shù)字電視(DTV)等類似媒體,DMB具有傳輸率低的缺點。特別是DMB采用MPEG-2傳送流(Transport Stream,TS) ,MPEG-2系統(tǒng)規(guī)格規(guī)定不同的基本碼流(Elementary Straem,ES)擁有不同的標志碼傳輸包(PID)。因此,有可能發(fā)生即使ES的輸出率很低,TS的輸出率也可能很高的狀況。如前所述,對于因編碼多信道音頻而形成的附加信號,雖然ES的數(shù)據(jù)率不高,但是每幀都將其打包為TS傳輸時,該TS的輸出率可以達到ES的輸出率的兩倍以上。因此,為了通過DMB傳輸多信道音頻,需要與現(xiàn)有DMB維持逆互換性,并且有效地打包多信道音頻后傳輸,以避免數(shù)據(jù)率不至于很高。為了主視頻及主語音服務(wù),DMB服務(wù)規(guī)定傳輸一個視頻客體及一個音頻客體,此時音頻客體可能是單信道或者立體聲。最近,隨著多媒體技術(shù)的發(fā)展DTV(DigitalTelevision),數(shù)字多功能光盤(Digital Versatile Disc, DVD)等也提供較多的多信道音頻服務(wù),用戶對多信道音頻服務(wù)的需要也增加。在此趨勢下,最近進行著通過DMB提供多信道音頻的技術(shù)開發(fā)。DMB將單信道或者立體聲音頻編碼成BSAC或者AAC進行傳輸,但是多信道音頻的傳輸需要傳輸追加的數(shù)據(jù),所以需要修改現(xiàn)有的傳輸方法。同時,MPEG環(huán)繞、音源定位編碼(Sound Source Location Cue Coding, SSLCC)等多信道編碼方法針對將多信道音頻分離成下混合立體聲和附加信號后傳輸并再生的方式進行了標準化,而為了逆互換性地進行多信道服務(wù),該多信道編碼技術(shù)是很好的編碼方法。即,若對多信道音頻信號進行編碼,并分離成下混合立體聲信號和附加信號,則下混合立體聲信號可以與基于現(xiàn)有的立體聲音頻服務(wù)互換使用。為了通過DMB提供多信道音頻服務(wù),曾提議使用這種多信道音頻編碼方法,但該方法也是將多信道音頻分成下混合立體聲信號和附加信號而傳輸。此時為了與現(xiàn)有DMB的逆互換性,下混合立體聲信號編碼成BSAC或者AAC,附加信號假設(shè)為追加的ES,采用以各個附加信號的幀為區(qū)分進行打包并傳輸?shù)姆椒?。但是,將附加信號以幀為區(qū)分打包傳輸?shù)臅r候,DMB的數(shù)據(jù)傳輸率會比較高。這種因附加信號的數(shù)據(jù)傳輸率的增加是因為附加信號在每個幀都會經(jīng)過TS打包過程,因此傳輸一個幀的附加信號,起碼傳輸一個以上的TS包。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種在DMB的播放環(huán)境中降低數(shù)據(jù)傳輸率,從而有效地收發(fā)多信道音頻信號的方法及裝置。而且,本發(fā)明的另一個目的在于提供一種具有在能夠再生多信道音頻的終端,甚至是在不能再生多信道音頻的終端上都可以顯示單信道或者立體聲音頻的互換性的收發(fā) 多信道音頻的方法及裝置。并且,本發(fā)明的又一個目的在于提供一種利用包含于超級幀的附加信號幀的數(shù)量信息及長度信息,更加準確地收發(fā)附加信號幀,并且可以與下混合音頻信號進行同步的收發(fā)多信道音頻的方法及裝置。本發(fā)明的目的不限于以上的所述,沒有提及的本發(fā)明的其他目的及優(yōu)點可以通過以下說明理解,并通過本發(fā)明的實施例更加明確地理解。并且,通過權(quán)利要求范圍提示的技術(shù)手段及其組合,可以實現(xiàn)本發(fā)明的目的及優(yōu)點。為了實現(xiàn)上述目的,本發(fā)明的多信道音頻信號發(fā)信裝置,其特征之一為包含多信道音頻下混合器,接收多信道音頻信號之后轉(zhuǎn)換成下混合音頻信號和附加信號;超級幀產(chǎn)生器,產(chǎn)生包含多個附加信號幀的超級幀;打包器,以用于打包超級幀;超級幀具有,包含于超級幀的附加信號幀的數(shù)量信息和長度信息。而且,本發(fā)明的多信道音頻信號收信裝置,另一個特征在于包含收信器,接收包含超級幀的包;解包器,將接收的包解包之后,獲取包含于包的超級幀;超級幀分析器,利用包含于超級幀的附加信號幀的數(shù)量信息以及長度信息,獲取包含于超級幀的多個附加信號中貞。并且,本發(fā)明的多信道音頻信號發(fā)信方法,又一個特征在于包含接收多信道音頻信號之后轉(zhuǎn)換成下混合音頻信號和附加信號的步驟;產(chǎn)生包含多個附加信號幀的超級幀的步驟;打包所述超級幀的步驟;所述超級幀具備,包含于超級幀的附加信號幀的數(shù)量信息和長度信息。而且,本發(fā)明的多信道音頻信號收信方法,再一個特征在于包含接收包含超級幀的包的步驟;解包所接收的包,獲取包含于所述包的超級幀的步驟;以及利用包含于超級幀的附加信號幀的數(shù)量信息和長度信息,獲取包含于所述超級幀的多個附加信號幀的步驟。如前所述,本發(fā)明的優(yōu)點在于可以在DMB的播放環(huán)境中降低數(shù)據(jù)傳輸率,從而有效地收發(fā)多信道音頻信號。而且,本發(fā)明優(yōu)點還在于提供可以在能夠再生多信道音頻的終端,甚至是在不能再生多信道音頻的終端上顯示單信道或者立體聲音頻的互換性。而且,本發(fā)明的優(yōu)點還在于利用包含于超級幀的附加信號幀的數(shù)量信息及長度信息,更加準確地收發(fā)附加信號幀,并且可以與下混合音頻信號進行同步。
圖I是根據(jù)本發(fā)明一實施例的多信道音頻發(fā)信裝置的組成圖;圖2是根據(jù)本發(fā)明另一實施例的多信道音頻傳輸裝置的組成圖;圖3是圖I及圖2所示的超級幀產(chǎn)生器的一個實施例的組成圖;圖4是根據(jù)本發(fā)明的另一實施例的多信道音頻發(fā)信裝置打包的超級幀的組成圖;圖5是用于說明根據(jù)本發(fā)明的多信道音頻信號發(fā)信方法的順序圖; 圖6是根據(jù)本發(fā)明一實施例的多信道音頻收信裝置的組成圖;圖7是根據(jù)本發(fā)明另一實施例的多信道音頻收信裝置的組成圖;圖8是圖6及圖7所示的超級幀分析器的一個實施例的組成圖;圖9是用于說明根據(jù)本發(fā)明的多信道音頻信號收信方法的順序圖。
具體實施例方式參照附圖來詳細說明所述的目的、特征及優(yōu)點,由此屬于本發(fā)明技術(shù)領(lǐng)域的擁有一般知識的技術(shù)人員可以容易地實施本發(fā)明的技術(shù)思想。在對本發(fā)明進行說明時,如果與本發(fā)明相關(guān)的現(xiàn)有技術(shù)的具體說明影響了本發(fā)明的主旨,則省略其詳細的說明。以下參照附圖詳細說明本發(fā)明的優(yōu)選實施例。附圖中相同的附圖標記指同一個或者類似的組成要素。圖I是根據(jù)本發(fā)明一實施例的多信道音頻發(fā)信裝置的組成圖。如圖I所示,根據(jù)本發(fā)明的一實施例的多信道音頻發(fā)信裝置包含多信道音頻下混合器102,立體聲音頻編碼器104,超級幀產(chǎn)生器106,視頻編碼器108,打包器110及多路復(fù)用器112。圖I中雖然未提示,但是為了發(fā)送多信道音頻發(fā)信裝置產(chǎn)生的流還包含發(fā)信器。多信道音頻下混合器102接收多信道音頻信號,將接收的多信道音頻信號轉(zhuǎn)換成立體聲音頻信號和附加信號。之后,多信道音頻下混合器102向立體聲音頻編碼器104提供立體聲音頻信號,并向超級幀產(chǎn)生器106提供附加信號。在本發(fā)明的其他實施例,多信道音頻下混合器102可以將接收的多信道音頻信號轉(zhuǎn)換成單信道音頻信號和附加信號。由多信道音頻下混合器102提供的立體聲音頻信號被立體聲音頻編碼器104壓縮編碼并形成音頻ES (Elementary Stream),將此提供給打包器110。超級幀產(chǎn)生器106從多信道音頻下混合器102接收附加信號,形成一個超級幀(或者超級幀形態(tài)的附加信號ES),該超級幀包含所提供的附加信號的多個幀。在此,附加信號是指表示用于多信道音頻的多信道音頻信號的空間信息等附加信息。超級幀產(chǎn)生器106判斷即將生成的超級幀應(yīng)該包含幾個附加信號幀,并根據(jù)其結(jié)果生成超級幀。超級幀產(chǎn)生器106依據(jù)已確定的超級幀的長度(例如,150字節(jié)),在不超過此長度的范圍內(nèi)可包含多個附加信號幀。又,也可以無關(guān)于超級幀的長度,預(yù)先確定超級幀將要包含的附加信號幀的個數(shù)(例如,3個附加信號幀),生成包含所定個數(shù)的附加信號幀的超級幀。根據(jù)多信道音頻的收發(fā)和再生環(huán)境、傳輸規(guī)格、再生規(guī)格、以及其他系統(tǒng)設(shè)定等因素,可以改變包含于超級幀的附加信號幀的個數(shù)。并且,生成的超級幀包括包含于該超級幀的附加信號幀的數(shù)量信息及附加信號幀的長度信息。這種數(shù)量信息和長度信息利用于接收側(cè)接收該超級幀,并從該超級幀獲取正確的附加信號。對于超級幀產(chǎn)生器106,在后面詳細進行說明。視頻編碼器108對輸入的視頻信號進行編碼之后產(chǎn)生視頻ES,并將其提供給打包器 110。打包器110接收如同音頻ES、超級幀形式的附加信號ES、視頻ES的音頻/視頻信號和如同對象描述符(Object Descriptor, 0D)、場景描述符流(Binary Format forScene, BIFS)、初始對象描述符(Initial Object Descriptor, I0D)的信令信息之后打包。在這里,OD用于告知構(gòu)成客體的基本碼流序列號(Elementary Stream ID, ES_ID),而BIFS起到布置客體的作用。并且,IOD具有向相關(guān)的所有流的第一接近點告知OD或者BIFS的ES_ID的作用。而且,打包器110使被打包的超級幀包含再生時刻信息,該再生時刻信息用于接收側(cè)再生立體聲音頻信號時,同步立體聲音頻信號和附加信號。打包器110將包含于超級幀的多個附加信號幀中最先再生的附加信號幀的再生時刻設(shè)定為該超級幀的再生時刻信 息。對于再生時刻信息,在后面進行更詳細的說明。通過打包器110生成的音頻包、附加信號包、視頻包、信令信息包都提供給多路復(fù)用器112。多路復(fù)用器112將接收的包多路復(fù)用之后生成如同MPEG-2TS(TransportStream)的流。這樣生成的MPEG-2TS規(guī)格的流通過DMB等播放服務(wù)傳輸?shù)皆偕b置或者存
儲裝置。圖2是根據(jù)本發(fā)明另一實施例的多信道音頻傳輸裝置的組成圖。如圖2所示,根據(jù)本發(fā)明另一實施例的多信道音頻傳輸裝置包含多信道音頻下混合器202、下混合音頻編碼器204、超級幀產(chǎn)生器206、視頻編碼器208、OD產(chǎn)生器210、BIFS產(chǎn)生器212、IOD產(chǎn)生器214、同步層(SL)打包器216、打包基本流(PES)打包器218、14496分段(section)打包器220、節(jié)目專用信息(PSI)分段打包器222、TS多路復(fù)用器224。雖然圖2未表示,但是多信道音頻傳輸裝置還包含傳輸所生成的流的發(fā)信器。多信道音頻下混合器202對輸入的多信道音頻信號進行編碼,生成下混合單信道或立體聲的下混合音頻信號和附加信號。之后,多信道音頻下混合器202分別將生成的下混合音頻信號發(fā)送到下混合音頻編碼器204,并將附加信號發(fā)送到超級幀產(chǎn)生器206。下混合音頻編碼器204壓縮、編碼由多信道音頻下混合器202提供的下混合音頻信號,以生成音頻ES,將此發(fā)送到SL打包器216。超級幀產(chǎn)生器206接收多信道音頻下混合器202提供的附加信號,并生成包含多個所提供的附加信號的幀的一個超級幀(或者超級幀形式的附加信號ES)。生成的超級幀被發(fā)送到SL打包器216。并且,視頻編碼器208接收視頻信號并進行編碼,由此生成視頻ES,并將此發(fā)送到SL打包器216。OD產(chǎn)生器210和BIFS產(chǎn)生器212分別生成OD流和BIFS流,并將生成的流發(fā)送到SL打包器216。IOD產(chǎn)生器214利用從外部輸入的IOD文本數(shù)據(jù)而生成IOD數(shù)據(jù),并發(fā)送到PSI分段打包器222。SL打包器具有生成作為各媒體流(音頻ES,附件信號ES,視頻ES,OD流,BIFS流)之間的同步包的SL(synchronization layer)包的作用。由SL打包器216產(chǎn)生的音頻SL包、附加信號SL包、視頻SL包發(fā)送到PES打包器218,OD SL包和BIFS SL包發(fā)送到14496分段打包器220。而且,SL打包器216在將附件信號ES轉(zhuǎn)換成附件信號SL包的過程中,使附件信號SL包的報頭中包含超級幀的再生時刻信息(CTs=Composition Time Stamp)。多信道音頻收信裝置接收多信道音頻并進行再生時,該再生時刻信息用于再生的單信道/立體聲音頻信號與附件信號的同步。設(shè)定超級幀的再生時刻信息時,SL打包器216可以將包含于超級幀的多個附加幀中,在時間上最先再生的附加信號幀的再生時刻設(shè)定為超級幀再生時刻信息。例如,包含于某個超級幀的三個附件信號幀分別具有1:10:45(1小時10分45秒)、1:10:46、1:10:47的再生時刻,則該超級幀的再生時刻信息設(shè)定為1:10:45。多信道音頻收信裝置接收了包含這種數(shù)據(jù)幀的包之后,將超級幀的再生時刻信息設(shè)定為包含于超級幀的多個附加信號幀中的在時間上最先再生的附加信號幀的再生時刻(1:10:45),再根據(jù)預(yù)先計算的時間間隔(一秒)設(shè)定其他兩個附加信號幀的再生時刻(1:10:46,1:10:47) 0·
將由SL打包器216產(chǎn)生的音頻SL包、附件信號SL包、視頻SL包發(fā)送到PES打包器218。PES打包器218將接收的頻SL包、附件信號SL包、視頻SL包分別轉(zhuǎn)換成音頻PES包、附件信號PES包、視頻PES包,并發(fā)送到TS多路復(fù)用器224。由SL打包器216生成的OD SL包和BIFS SL包發(fā)送到14496分段打包器22。14496分段打包器220將接收的OD SL包和BIFS SL包分別轉(zhuǎn)換成OD 14496分段包和BIFS 14496分段包,再發(fā)送到TS多路復(fù)用器224。PSI分段打包器222生成包含從IOD產(chǎn)生器214發(fā)送的IOD數(shù)據(jù)的PSI分段,并發(fā)送到TS多路復(fù)用器224。TS多路復(fù)用器224多路復(fù)用所接收的音頻PES包、附件信號PES包、視頻PES包、OD14496 分段包、BIFS 14496 分段包、PSI 分段,生成 MPEG-2 傳輸流(TS transport Stream)。這樣產(chǎn)生的MPEG-2TS通過發(fā)信器發(fā)信到多信道音頻收信裝置。圖3是圖I及圖2所示的超級幀產(chǎn)生器的一個實施例的組成圖。如圖3所示,超級幀產(chǎn)生器302包含超級幀產(chǎn)生控制單元304。超級幀產(chǎn)生控制單元304接收多信道音頻下混合器發(fā)送的附加信號,并生成包含所提供的附加信號的多個幀的一個超級幀(或是超級幀形式的附加信號ES)。這時,超級幀產(chǎn)生控制單元304判斷將要生成的超級幀需要包含幾個附加信號幀,并根據(jù)判斷結(jié)果產(chǎn)生超級幀。該內(nèi)容通過圖I進行過說明,所以在此省略。另外,所產(chǎn)生的超級幀可以包括包含于該超級幀的附加信號幀的數(shù)量信息和附加信號幀的長度信息。這種數(shù)量信息和長度信息應(yīng)用于接收側(cè)接收該超級幀,并從超級幀獲取正確的附加信號。表I是示出根據(jù)本發(fā)明的一實施例的多信道音頻附件信號超級幀的語法。表I
權(quán)利要求
1.一種多信道音頻信號發(fā)信裝置,其特征在于包含 多信道音頻下混合器,接收多信道音頻信號之后轉(zhuǎn)換成下混合音頻信號和附加信號; 超級幀產(chǎn)生器,產(chǎn)生包含多個附加信號幀的超級幀; 打包器,以用于打包所述超級幀; 所述超級幀包括包含于該超級幀的附加信號幀的數(shù)量信息和長度信息。
2.根據(jù)權(quán)利要求I所述的多信道音頻信號發(fā)信裝置,其特征在于由所述打包器打包的超級幀還包含用于與所述下混合音頻信號同步的再生時刻信息。
3.根據(jù)權(quán)利要求2所述的多信道音頻信號發(fā)信裝置,其特征在于所述再生時刻信息設(shè)定為所述多個附加信號幀中,在時間上最先再生的附加信號幀的再生時刻。
4.根據(jù)權(quán)利要求I所述的多信道音頻信號發(fā)信裝置,其特征在于所述超級幀還包含用于所述附件信號幀的字節(jié)對齊的填充位。
5.—種多信道音頻信號收信裝置,其特征在于包含 收信器,接收包含超級幀的包; 解包器,將接收的包進行解包,以從所述包獲取超級幀; 超級幀分析器,利用包含于所述超級幀的附加信號幀的數(shù)量信息以及長度信息,從所述超級幀獲取多個附加信號幀。
6.根據(jù)權(quán)利要求5所述的多信道音頻信號收信裝置,其特征在于所述超級幀分析器設(shè)定所述多個附加信號幀的再生時刻。
7.根據(jù)權(quán)利要求6所述的多信道音頻信號收信裝置,其特征在于所述超級幀分析器獲取包含于超級幀的再生時刻信息,并將所述超級幀的再生時刻信息設(shè)定為所述多個附加信息幀中在時間上最先再生的附加信號幀的再生時刻,并利用預(yù)先計算的時間間隔確定其他附加信號幀的再生時刻。
8.根據(jù)權(quán)利要求5所述的多信道音頻信號收信裝置,其特征在于用所述超級幀還包含于所述附加信號幀的字節(jié)對齊的填充位。
9.一種多信道音頻信號發(fā)信方法,其特征在于包含 接收多信道音頻信號之后轉(zhuǎn)換成下混合音頻信號和附加信號的步驟; 產(chǎn)生包含多個附加信號幀的超級幀的步驟; 打包所述超級幀的步驟; 所述超級幀包括,包含于該超級幀的附加信號幀的數(shù)量信息和長度信息。
10.根據(jù)權(quán)利要求9所述的多信道音頻信號發(fā)信方法,其特征在于在所述打包步驟中打包的超級幀還包含用于與所述下混合音頻信號同步的再生時刻信息。
11.根據(jù)權(quán)利要求10所述的多信道音頻信號發(fā)信方法,其特征在于所述再生時刻信息設(shè)定為所述多個附加信息幀中在時間上最先再生的附加信號幀的再生時刻。
12.根據(jù)權(quán)利要求9所述的多信道音頻信號發(fā)信方法,其特征在于所述超級幀還包含用于所述附加信號幀的字節(jié)對齊的填充位。
13.一種多信道音頻信號收信方法,其特征在于包含 接收包含超級幀的包的步驟; 解包所接收的包,從所述包中獲取超級幀的步驟; 利用包含于所述超級幀的附加信號幀的數(shù)量信息和長度信息,從所述超級幀獲取多個附加信號幀的步驟。
14.根據(jù)權(quán)利要求13所述的多信道音頻信號收信方法,其特征在于還包含設(shè)定所述多個附加信號幀的再生時刻的步驟。
15.根據(jù)權(quán)利要求14所述的多信道音頻信號收信方法,其特征在于設(shè)定所述多個附加信號幀的再生時刻的步驟包含 獲取包含在所述接收的包的所述超級幀的再生時刻信息; 所述超級幀的再生時刻設(shè)定為多個附加信息幀中在時間上最先再生的附加信號幀的再生時刻; 利用預(yù)先計算的時間間隔設(shè)定該其他附加信號幀的再生時刻。
16.根據(jù)權(quán)利要求13所述的多信道音頻信號收信方法,其特征在于所述超級幀還包含用于所述附加信號幀的字節(jié)對齊的填充位。
全文摘要
本發(fā)明涉及一種收發(fā)多信道音頻信號的方法及裝置。本發(fā)明的多信道音頻信號發(fā)信裝置,包含多信道音頻下混合器,接收多信道音頻信號之后轉(zhuǎn)換成下混合音頻信號和附加信號;超級幀產(chǎn)生器,產(chǎn)生包含多個附加信號幀的超級幀;打包器,以用于打包所述超級幀,所述超級幀包括,包含于該超級幀的附加信號幀的數(shù)量信息和長度信息。根據(jù)本發(fā)明,可以在DMB的播放環(huán)境中降低數(shù)據(jù)傳輸率,從而有效地收發(fā)多信道音頻信號。
文檔編號H04B7/204GK102763364SQ200980105894
公開日2012年10月31日 申請日期2009年4月29日 優(yōu)先權(quán)日2008年4月30日
發(fā)明者姜京玉, 張大永, 徐廷一, 李用主, 林鐘秀, 洪鎮(zhèn)祐, 白承權(quán), 金鎮(zhèn)雄 申請人:韓國電子通信研究院