亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

水印嵌入方法和裝置的制作方法

文檔序號:7761586閱讀:172來源:國知局
專利名稱:水印嵌入方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明總體上涉及媒體測量,更具體來說,涉及用于在壓縮數(shù)字?jǐn)?shù)據(jù)流中嵌入水 印的方法和裝置。
背景技術(shù)
在現(xiàn)代電視或無線電廣播站中,一般使用壓縮數(shù)字?jǐn)?shù)據(jù)流承載要傳輸?shù)囊曨l和/ 或音頻數(shù)據(jù)。例如,美國的用于數(shù)字電視(DTV)廣播的高級電視制式委員會(ATSC)標(biāo)準(zhǔn),其 采用用于承載視頻內(nèi)容的活動畫面專家組(MPEG)標(biāo)準(zhǔn)(如MPEG-l、MPEG-2、MPEG-3、MPEG-4
等)和用于承載音頻內(nèi)容的數(shù)字音頻壓縮標(biāo)準(zhǔn)(如AC-3,也被稱為Dolby Digital )(即, ATSC標(biāo)準(zhǔn)數(shù)字音頻壓縮(AC-3),修訂版A,2001年8月)。AC-3壓縮標(biāo)準(zhǔn)基于這樣一種感 知數(shù)字音頻編碼技術(shù),即,該技術(shù)在使感知失真最小化的同時減少了再現(xiàn)原音頻信號所需 的數(shù)據(jù)量。具體來說,AC-3壓縮標(biāo)準(zhǔn)認(rèn)識到人耳無法感知比特定譜頻率處的掩蔽能量要小 的該特定譜頻率處的譜能量變化。該掩蔽能量是取決于音頻段的音調(diào)和類噪聲特性的音頻 段特性??梢允褂貌煌墓睦砺晫W(xué)模型來確定特定譜頻率處的掩蔽能量。此外,AC-3 壓縮標(biāo)準(zhǔn)提供了用于數(shù)字電視(DTV)、高清晰度電視(HDTV)、數(shù)字多功能盤(DVD)、數(shù)字電 纜以及衛(wèi)星傳輸?shù)亩嗦暤罃?shù)字音頻格式(例如,5. 1聲道格式),該多聲道數(shù)字音頻格式使 得可以對特殊聲音效果(例如,環(huán)繞聲)進行廣播?,F(xiàn)有電視或無線電廣播站采用水印技術(shù)把水印嵌入根據(jù)諸如AC-3壓縮標(biāo)準(zhǔn)和 MPEG高級音頻編碼(AAC)壓縮標(biāo)準(zhǔn)等的壓縮標(biāo)準(zhǔn)而壓縮的視頻和/或音頻數(shù)據(jù)流內(nèi)。典 型地,水印是用于唯一地標(biāo)識廣播商和/或節(jié)目的數(shù)字?jǐn)?shù)據(jù)。典型地,在一個或更多個接收 點(例如,家庭或其他媒體消費點)處使用解碼操作提取水印,由此,可以將該水印用于評 估單個家庭和/或家庭組的收看特性,以生成收視率信息。然而,許多現(xiàn)有水印技術(shù)被設(shè)計成與模擬廣播系統(tǒng)一起使用。具體來說,現(xiàn)有加 水印技術(shù)將模擬節(jié)目數(shù)據(jù)轉(zhuǎn)換成解壓縮的數(shù)字?jǐn)?shù)據(jù)流,將水印數(shù)據(jù)插入解壓縮數(shù)字?jǐn)?shù)據(jù)流 中,并在傳輸之前將加水印的數(shù)據(jù)流轉(zhuǎn)換成模擬格式。隨著正在向全數(shù)字廣播環(huán)境(其中 通過廣播網(wǎng)絡(luò)把壓縮視頻和音頻流傳輸?shù)奖镜芈?lián)播臺)的轉(zhuǎn)變,可能需要將水印數(shù)據(jù)直接 嵌入或插入壓縮數(shù)字?jǐn)?shù)據(jù)流中?,F(xiàn)有加水印技術(shù)可以將壓縮數(shù)字?jǐn)?shù)據(jù)流解壓縮成時域樣 本,將水印數(shù)據(jù)插入這些時域樣本中,并將這些加水印的時域樣本再壓縮成加水印的壓縮 數(shù)字?jǐn)?shù)據(jù)流。這種解壓/壓縮可能導(dǎo)致壓縮數(shù)字?jǐn)?shù)據(jù)流中的媒體內(nèi)容的質(zhì)量劣化。此外, 現(xiàn)有解壓/壓縮技術(shù)需要附加設(shè)備并導(dǎo)致在某些情況下可能無法接受的廣播音頻分量的 延遲。此外,本地聯(lián)播臺所采用的用于從它們的父網(wǎng)絡(luò)接收壓縮數(shù)字?jǐn)?shù)據(jù)流并通過復(fù)雜拼 接(splicing)設(shè)備插入本地內(nèi)容的方法不允許在對數(shù)字?jǐn)?shù)據(jù)流進行再壓縮之前把壓縮數(shù) 字?jǐn)?shù)據(jù)流轉(zhuǎn)換成時域(解壓縮)信號。


圖1是一示例媒體監(jiān)視系統(tǒng)的框圖表示;圖2是一示例水印嵌入系統(tǒng)的框圖表示;圖3是與圖2的示例水印嵌入系統(tǒng)相關(guān)聯(lián)的示例解壓縮數(shù)字?jǐn)?shù)據(jù)流的框圖表示;圖4是可用于實現(xiàn)圖2的示例水印嵌入系統(tǒng)的示例嵌入裝置的框圖表示;圖5示出了與圖4的示例嵌入裝置相關(guān)聯(lián)的示例壓縮數(shù)字?jǐn)?shù)據(jù)流;圖6示出了可用于實現(xiàn)圖2的示例水印嵌入系統(tǒng)的示例量化查找表;圖7示出了可以使用圖2的示例水印嵌入系統(tǒng)來壓縮然后處理的另一示例解壓縮 數(shù)字?jǐn)?shù)據(jù)流;圖8示出了與圖7的示例解壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的示例壓縮數(shù)字?jǐn)?shù)據(jù)流;圖9示出了其中可以對圖2的示例水印嵌入系統(tǒng)進行配置以嵌入水印的一種方 式;圖10示出了其中可以實現(xiàn)圖9的修改過程的一種方式;圖11示出了其中可以處理數(shù)據(jù)幀的一種方式;圖12示出了其中可以將水印嵌入壓縮數(shù)字?jǐn)?shù)據(jù)流中的一種方式;圖13示出了可用于實現(xiàn)圖2的示例水印嵌入系統(tǒng)的示例編碼頻率指數(shù)表;以及圖14是可用于實現(xiàn)圖2的示例水印嵌入系統(tǒng)的示例處理器系統(tǒng)的框圖表示。
具體實施例方式總體上,本文公開了用于將水印嵌入壓縮數(shù)字?jǐn)?shù)據(jù)流中的方法和裝置??梢詫⑦@ 里公開的方法和裝置用于把水印嵌入壓縮數(shù)字?jǐn)?shù)據(jù)流中而不必預(yù)先對壓縮數(shù)字?jǐn)?shù)據(jù)流進 行解壓縮。因此,這里公開的方法和裝置無需對壓縮數(shù)字?jǐn)?shù)據(jù)流進行多次解壓/壓縮循環(huán), 由于多次解壓/壓縮循環(huán)可能顯著劣化壓縮數(shù)字?jǐn)?shù)據(jù)流中的媒體內(nèi)容質(zhì)量,因此,這一般 對于例如電視廣播網(wǎng)絡(luò)的聯(lián)播臺來說是不可接受的。在進行廣播之前,例如,可以將這里公開的方法和裝置用于對改進型離散余弦變 換(MDCT)系數(shù)組(其與根據(jù)諸如AC-3壓縮標(biāo)準(zhǔn)的數(shù)字音頻壓縮標(biāo)準(zhǔn)而格式化的壓縮數(shù)字 數(shù)據(jù)流相關(guān)聯(lián))進行解包(unpack)。可以修改解包出的MDCT系數(shù)組的尾數(shù)以嵌入水印,該 水印不可感知地增大了壓縮數(shù)字?jǐn)?shù)據(jù)流。當(dāng)接收到壓縮數(shù)字?jǐn)?shù)據(jù)流時,接收裝置(如在媒 體消費點處的機頂電視計量裝置)可以從解壓縮的模擬輸出(例如,從電視機喇叭發(fā)出的 輸出)提取嵌入的水印信息??梢詫⑻崛〉乃⌒畔⒂糜谧R別與在媒體消費點處當(dāng)前正在 消費(如收看、收聽等)的媒體相關(guān)聯(lián)的媒體源和/或節(jié)目(如廣播站)。接著,可以按公 知的方式將該源和節(jié)目識別信息用于生成收視率信息和/或任何其他信息,這些信息可用 于評估與單個家庭和/或家庭組相關(guān)聯(lián)的收看特性。參照圖1,使用受眾測量系統(tǒng)計量示例廣播系統(tǒng)100,該示例廣播系統(tǒng)100包括業(yè) 務(wù)提供商110、電視120、遙控裝置125以及接收裝置130??梢园慈魏喂绞竭B接廣播 系統(tǒng)100的多個部分。例如,將電視120置于位于住有一個或更多個人的家庭中的收看區(qū) 150中,將這些人稱為家庭成員160,這些人中的一些或所有人已同意參與受眾測量調(diào)查研 究。接收裝置130可以是連接到電視120的機頂盒(STB)、磁帶錄像機、數(shù)字錄像機、個人錄像機、個人計算機、數(shù)字視頻盤播放器等。收看區(qū)150包括電視120所在的區(qū)域,位于收看 區(qū)150中的一個或更多個家庭成員160可以從收看區(qū)150收看電視120。在所例示的示例中,將計量裝置140構(gòu)造成根據(jù)從接收裝置130傳送到電視120 的視頻/音頻輸出信號識別收看信息。計量裝置140通過網(wǎng)絡(luò)170把該收看信息以及其他 調(diào)諧和/或人口統(tǒng)計數(shù)據(jù)提供給數(shù)據(jù)收集設(shè)備180??梢允褂糜布蜔o線通信鏈路(例如 包括因特網(wǎng)、以太網(wǎng)連接、數(shù)字用戶線(DSL)、電話線、蜂窩電話系統(tǒng)、同軸電纜等)的任何 期望的組合實現(xiàn)網(wǎng)絡(luò)170??梢詫?shù)據(jù)收集設(shè)備180設(shè)計成處理并且/或者存儲從計量裝 置140接收的數(shù)據(jù)以生成收視率信息。業(yè)務(wù)提供商110可以通過任何業(yè)務(wù)提供商實現(xiàn),例如有線電視業(yè)務(wù)提供商112、射 頻(RF)電視業(yè)務(wù)提供商114和/或衛(wèi)星電視業(yè)務(wù)提供商116。電視120接收由業(yè)務(wù)提供 商110通過多個頻道發(fā)送的多個電視信號,并且可以使電視120適合于處理和顯示按任何 格式提供的電視信號,該格式為如國家電視標(biāo)準(zhǔn)委員會(NTSC)電視信號格式、高清晰度電 視(HDTV)信號格式、高級電視制式委員會(ATSC)電視信號格式、逐行倒相(PAL)電視信號 格式、數(shù)字視頻廣播(DVB)電視信號格式、無線電工商業(yè)協(xié)會(ARIB)電視信號格式等。用戶操作的遙控裝置125使得用戶(例如,家庭成員160)可以將電視120調(diào)諧到 期望的頻道并接收在該期望頻道上發(fā)送的信號,并使得電視120處理并呈現(xiàn)或放出在該期 望頻道上發(fā)送的信號中所包含的節(jié)目或媒體內(nèi)容。電視120執(zhí)行的處理例如可以包括提 取經(jīng)由接收信號傳遞的視頻和/或音頻分量、使得在與電視120相關(guān)聯(lián)的屏幕/顯示器上 顯示視頻分量以及使得由與電視120相關(guān)聯(lián)的喇叭發(fā)出音頻分量。包含在電視信號中的節(jié) 目內(nèi)容例如可以包括電視節(jié)目、電影、廣告、視頻游戲、網(wǎng)頁、靜態(tài)圖像和/或由業(yè)務(wù)提供商 110當(dāng)前提供的或?qū)硪峁┑钠渌?jié)目內(nèi)容的預(yù)演。盡管圖1所示的多個部分被示為廣播系統(tǒng)100內(nèi)的多個獨立部分,但是可以把由 這些結(jié)構(gòu)中的某些結(jié)構(gòu)執(zhí)行的功能集成在單個單元內(nèi),或者可以使用兩個或更多個獨立部 分來實現(xiàn)這些功能。例如,盡管電視120和接收裝置130被示為獨立結(jié)構(gòu),但是可以將電視 120和接收裝置130集成在單個單元(如集成數(shù)字電視機)中。在另一示例中,可以將電視 120、接收裝置130和/或記錄裝置140集成在單個單元中。為了評估單個家庭成員160和/或家庭組的收看特性,水印嵌入系統(tǒng)(如圖2的 水印嵌入系統(tǒng)200)可以把用于唯一地識別廣播商和/或節(jié)目的水印編碼到來自業(yè)務(wù)提供 商110的廣播信號中。可以在業(yè)務(wù)提供商110處實現(xiàn)水印嵌入系統(tǒng),使得由業(yè)務(wù)提供商110 發(fā)送的多個媒體信號(例如,電視信號)中的每一個都包括一個或更多個水印。根據(jù)家庭 成員160的選擇,接收裝置130可以調(diào)諧到期望的頻道并接收在期望的頻道上發(fā)送的媒體 信號,并使得電視120處理并呈現(xiàn)在期望的頻道上發(fā)送的信號中所包含的節(jié)目內(nèi)容。計量 裝置140可以根據(jù)從接收裝置130傳送到電視120的視頻/音頻輸出信號識別水印信息。 因此,計量裝置140可以通過網(wǎng)絡(luò)170向數(shù)據(jù)收集設(shè)備180提供該水印信息和其他調(diào)諧和 /或人口統(tǒng)計數(shù)據(jù)。在圖2中,示例水印嵌入系統(tǒng)200包括嵌入裝置210和水印源220。將嵌入裝置 210構(gòu)造成把來自水印源220的水印信息230插入壓縮數(shù)字?jǐn)?shù)據(jù)流240中??梢愿鶕?jù)音頻 壓縮標(biāo)準(zhǔn)(如AC-3壓縮標(biāo)準(zhǔn)和/或MPEG-AAC壓縮標(biāo)準(zhǔn),可以使用這兩者中的任何一個來 通過使用來自多個音頻信號塊中每一塊的預(yù)定數(shù)量個數(shù)字化樣本來處理音頻信號塊)對壓縮數(shù)字?jǐn)?shù)據(jù)流240進行壓縮??梢园蠢?8千赫(kHZ)的速率對壓縮數(shù)字?jǐn)?shù)據(jù)流240 的源(未示出)進行采樣,以形成如下所述的音頻塊。典型地,音頻壓縮技術(shù)(諸如基于AC-3壓縮標(biāo)準(zhǔn)的音頻壓縮技術(shù))使用交疊音頻 塊和MDCT算法將音頻信號轉(zhuǎn)換成壓縮數(shù)字?jǐn)?shù)據(jù)流(如圖2的壓縮數(shù)字?jǐn)?shù)據(jù)流240)。根據(jù) 樣本音頻信號的動態(tài)特性可以使用兩個不同的塊大小(即,短塊和長塊)。例如,可以使用 AC-3短塊以使音頻信號的瞬變段的前回聲最小化,而可以使用AC-3長塊以實現(xiàn)用于音頻 信號的非瞬變段的高壓縮增益。根據(jù)AC-3壓縮標(biāo)準(zhǔn),AC-3長塊對應(yīng)于512時域音頻樣本 塊,而AC-3短塊對應(yīng)于256個時域音頻樣本。根據(jù)在AC-3壓縮標(biāo)準(zhǔn)中使用的MDCT算法的 交疊結(jié)構(gòu),在AC-3長塊的情況下,通過把前一(舊)塊的256個時域樣本與當(dāng)前(新)塊的 256個時域樣本連接起來以獲得512個時域樣本,從而創(chuàng)建512個時域樣本的音頻塊。然后 使用MDCT算法對AC-3長塊進行變換以生成256個變換系數(shù)。根據(jù)同一標(biāo)準(zhǔn),從一對連續(xù) 的時域樣本音頻塊類似地獲得AC-3短塊。然后使用MDCT算法對AC-3短塊進行變換以生 成128個變換系數(shù)。然后使與兩個相鄰短塊對應(yīng)的該128個變換系數(shù)交錯以生成一組256 個變換系數(shù)。因此,對AC-3長塊或AC-3短塊中的任何一個的處理都得到相同數(shù)量個MDCT 系數(shù)。根據(jù)作為另一示例的MPEG-AAC壓縮標(biāo)準(zhǔn),短塊含有128個樣本,長塊含有1024個樣 本。在圖3的示例中,解壓縮數(shù)字?jǐn)?shù)據(jù)流300包括多個256樣本時域音頻塊310,通常 如AO、Al、A2、A3、A4以及A5所示。MDCT算法對音頻塊310進行處理以生成MDCT系數(shù)組 320,例如如嫩0、嫩1、嫩2、嫩3、嫩4以及MA5(其中未示出MA5)所示。例如,MDCT算法可 以對音頻塊AO和Al進行處理以生成MDCT系數(shù)組ΜΑΟ。將音頻塊AO與Al連接起來以生 成512樣本音頻塊(如AC-3長塊),使用MDCT算法對該512樣本音頻塊進行MDCT變換以 生成包括256個MDCT系數(shù)的MDCT系數(shù)組ΜΑΟ。類似地,可以對音頻塊Al和Α2進行處理 以生成MDCT系數(shù)組ΜΑ1。因此,音頻塊Al是交疊音頻塊,因為它被用于生成MDCT系數(shù)組 MAO和MAl兩者。按類似的方式,使用MDCT算法對音頻塊Α2和A3進行變換以生成MDCT系 數(shù)組ΜΑ2,對音頻塊A3和Α4進行變換以生成MDCT系數(shù)組ΜΑ3,對音頻塊Α4和Α5進行變換 以生成MDCT系數(shù)組ΜΑ4等。因此,音頻塊Α2是用于生成MDCT系數(shù)組MAl和ΜΑ2的交疊音 頻塊,音頻塊A3是用于生成MDCT系數(shù)組ΜΑ2和ΜΑ3的交疊音頻塊,音頻塊Α4是用于生成 MDCT系數(shù)組ΜΑ3和ΜΑ4的交疊音頻塊等。多個MDCT系數(shù)組320 —起形成了壓縮數(shù)字?jǐn)?shù)據(jù) 流 240。如下詳細(xì)描述的,圖2的嵌入裝置210可以將來自水印源220的水印信息或水印 230嵌入或插入壓縮數(shù)字?jǐn)?shù)據(jù)流240中。例如,水印230可以用于唯一地識別廣播商和/或 節(jié)目,使得可以生成媒體消費信息(如收看信息)和/或收視率信息。因此,嵌入裝置210 生成了要傳輸?shù)募铀〉膲嚎s數(shù)字?jǐn)?shù)據(jù)流250。在圖4的示例中,嵌入裝置210包括識別單元410、解包單元420、修改單元430以 及再打包單元440。盡管以下根據(jù)AC-3壓縮標(biāo)準(zhǔn)對嵌入裝置210的操作進行描述,但是可 以將嵌入裝置210實現(xiàn)為通過另外或其他壓縮標(biāo)準(zhǔn)(如MPEG-AAC壓縮標(biāo)準(zhǔn))來操作。結(jié) 合圖5更詳細(xì)地描述嵌入裝置210的操作。首先,將識別單元410構(gòu)造成識別與壓縮數(shù)字?jǐn)?shù)據(jù)流240相關(guān)聯(lián)的一個或更多個 幀510,這些幀中的一部分幀例如被示為圖5中的幀A和幀B。如前所述,壓縮數(shù)字?jǐn)?shù)據(jù)流240可以是根據(jù)AC-3標(biāo)準(zhǔn)壓縮的數(shù)字?jǐn)?shù)據(jù)流(以下稱為“AC-3數(shù)據(jù)流”)。盡管AC-3數(shù)據(jù) 流240可以包括多個聲道,但是,為簡明起見,以下示例將AC-3數(shù)據(jù)流240描述成只包括一 個聲道。在AC-3數(shù)據(jù)流240中,各幀510包括多個MDCT系數(shù)組520。根據(jù)AC-3壓縮標(biāo)準(zhǔn), 例如,各幀510包括6個MDCT系數(shù)組(即,6個“audblk (音頻塊)”)。例如,幀A包括MDCT 系數(shù)組 MAO、MAl、MA2、MA3、MA4 以及 MA5,幀 B 包括 MDCT 系數(shù)組 MBO、MB1、MB2、MB3、MB4 以 及 MB5。還將識別單元410構(gòu)造成識別與各幀510相關(guān)聯(lián)的報頭信息,例如,與AC_3數(shù)據(jù) 流240相關(guān)聯(lián)的聲道數(shù)。盡管示例AC-3數(shù)據(jù)流240如上所述只包括一個聲道,但是以下結(jié) 合圖7和8對具有多個聲道的示例壓縮數(shù)字?jǐn)?shù)據(jù)流進行描述。參照圖5,將解包單元420構(gòu)造成對MDCT系數(shù)組520進行解包以確定壓縮信息,例 如原壓縮過程的參數(shù)(即,音頻壓縮技術(shù)壓縮音頻信號或音頻數(shù)據(jù)以形成壓縮數(shù)字?jǐn)?shù)據(jù)流 240的方式)。例如,解包單元420可以確定使用了多少位來表示MDCT系數(shù)組520內(nèi)的各 MDCT系數(shù)。此外,壓縮參數(shù)可以包括用于限制AC-3數(shù)據(jù)流240可被修改的程度的信息,以 確保通過AC-3數(shù)據(jù)流240傳送的媒體內(nèi)容具有足夠高的質(zhì)量級。嵌入裝置210隨后使用 解包單元420所識別的壓縮信息將期望的水印信息230嵌入/插入到AC-3數(shù)據(jù)流240中, 從而確保按與信號中提供的壓縮信息相一致的方式執(zhí)行水印插入。如在AC-3壓縮標(biāo)準(zhǔn)中詳細(xì)描述的那樣,壓縮信息還包括與各MDCT系數(shù)相關(guān)聯(lián)的 尾數(shù)和冪。AC-3壓縮標(biāo)準(zhǔn)采用技術(shù)來減少用于表示各MDCT系數(shù)的位數(shù)。心理聲學(xué)掩蔽是 可被這些技術(shù)利用的一個因子。例如,在特定頻率k(如音調(diào))處或跨越靠近該特定頻率k 的頻帶(如類噪聲特性)存在的聲能Ek產(chǎn)生了掩蔽效應(yīng)。即,如果在頻率k處或跨越靠近 該頻率k的頻帶的頻譜區(qū)中的能量變化小于給定能量閾值A(chǔ)Ek,那么人耳無法感知該能量 變化。由于人耳的該特性,可以利用與ΔEk有關(guān)的步長對與頻率k相關(guān)聯(lián)的MDCT系數(shù)mk 進行量化,而不存在給音頻內(nèi)容帶來任何人類可感知變化的風(fēng)險。對于AC-3數(shù)據(jù)流240,將 各MDCT系數(shù)mk表示成尾數(shù)Mk和冪Xk,使得mk = Mk · 2_\。根據(jù)在AC-3壓縮標(biāo)準(zhǔn)中公布的 已知量化查找表(如圖6的量化查找表600)可以確定用于表示MDCT系數(shù)組520的各MDCT 系數(shù)的尾數(shù)Mk的位數(shù)。在圖6的示例中,量化查找表600給出了 MDCT系數(shù)的由四位數(shù)表 示的尾數(shù)碼或位模式和對應(yīng)的尾數(shù)值。如下詳細(xì)描述的,可以改變(如增大)尾數(shù)Mk以表 示MDCT系數(shù)的修改值,以將水印嵌入AC-3數(shù)據(jù)流240中。回到圖5,將修改單元430構(gòu)造成對各MDCT系數(shù)組520執(zhí)行逆變換以生成時域音 頻塊 530,例如如 TA0,、TA3”、TA4,、TA4”、TA5,、TA5”、TB0,、TB0”、TB1,、TB1” 以及 TB5,所示 (未示出TAO”到TA3,和TB2,到TB4”)。修改單元430執(zhí)行逆變換操作以生成與多個256 樣本時域音頻塊(將這些256樣本時域音頻塊連接起來以形成AC-3數(shù)據(jù)流240的MDCT系 數(shù)組520)相關(guān)聯(lián)的前一(舊)時域音頻塊(被表示為主塊(prime block))組和當(dāng)前(新) 時域音頻塊(被表示為雙主塊(double-prime block))組。例如,修改單元430對MDCT系數(shù) 組MA5執(zhí)行逆變換以生成時域塊TA4”和TA5,,對MDCT系數(shù)組MBO執(zhí)行逆變換以生成TA5” 和ΤΒ0,,對MDCT系數(shù)組MBl執(zhí)行逆變換以生成ΤΒ0”和ΤΒΓ等。按此方式,修改單元430 生成經(jīng)重構(gòu)的時域音頻塊540,該經(jīng)重構(gòu)的時域音頻塊540提供了對被壓縮的原時域音頻 塊的重構(gòu),以形成AC-3數(shù)據(jù)流240。為了生成經(jīng)重構(gòu)的時域音頻塊540,修改單元430可以 例如根據(jù)如以下文獻所描述的公知的Princen-Bradley時域混疊抵消(TDAC)技術(shù)添加時域音步頁塊Princen等人,Analysis/Synthesis FilterBank Design Based on Time Domain Aliasing Cancellation, Institute ofElectrical and Electronics Engineers(IEEE) Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-35, No. 5, pp. 1153-1161(1996)。例如,通過使用Princen-Bradley TDAC技術(shù)添加主時域音頻塊TA5, 和雙主時域音頻塊TA5”,修改單元430可以重構(gòu)時域音頻塊TA5(即,TA5R)。類似地,通過 使用Princen-Bradley TDAC技術(shù)添加主音頻塊TBO,和雙主音頻塊TBO”,修改單元430可 以重構(gòu)時域音頻塊TBO (即,TB0R)。按此方式,重構(gòu)用于形成AC-3數(shù)據(jù)流240的原時域音 頻塊以使得可以將水印230直接嵌入或插入AC-3數(shù)據(jù)流240中。還將修改單元430構(gòu)造成將水印230插入經(jīng)重構(gòu)的時域音頻塊540中以生成加水 印的時域音頻塊550,例如如TA0W、TA4W、TA5W、TB0W、TB1W以及TB5W所示(未示出塊TA1W、 TA2W、TA3W、TB2W、TB3W以及TB4W))。為了插入水印230,修改單元430通過把兩個相鄰的 經(jīng)重構(gòu)的時域音頻塊連接起來生成可修改時域音頻塊,以創(chuàng)建512樣本音頻塊。例如,修改 單元430可以把經(jīng)重構(gòu)的時域音頻塊TA5R與TB0R(各為256樣本音頻塊)連接起來以形 成512樣本音頻塊。然后修改單元430可以把水印230插入由經(jīng)重構(gòu)的時域音頻塊TA5R和 TBOR形成的512樣本音頻塊中,以生成加水印的時域音頻塊TA5W和TB0W??梢允褂弥T如 在美國專利No. 6,272,176,No. 6,504,870以及No. 6,621,881中描述的編碼過程將水印230 插入經(jīng)重構(gòu)的時域音頻塊540中。因此通過引用將美國專利No. 6,272,176,No. 6,504,870 以及6,621,881的全部公開并入于此。在美國專利No. 6,272,176、No. 6,504,870以及No. 6,621,881中所描述的示例編 碼方法和設(shè)備中,可以將水印插入512樣本音頻塊中。例如,各512樣本音頻塊承載水印 230的一位嵌入或插入數(shù)據(jù)。具體來說,可以修改或增大指數(shù)為和f2的譜頻率分量以插 入與水印230相關(guān)聯(lián)的數(shù)據(jù)位。例如,為了插入二進制“1”,可以增強或增大與指數(shù)相關(guān) 聯(lián)的第一譜頻率處的功率以使其成為在頻率鄰域內(nèi)的譜功率最大值(如由指數(shù)1-2、1-1、 f\、f1+U f\+2定義的頻率鄰域)。此時,衰減或增大與指數(shù)f2相關(guān)聯(lián)的第二譜頻率處的功 率以使其成為在頻率鄰域內(nèi)的譜功率最小值(如由指數(shù)f2_2、f2-l、f2、f2+l、f2+2定義的頻 率鄰域)。相反,為了插入二進制“0”,衰減與指數(shù)相關(guān)聯(lián)的第一譜頻率處的功率以使其 成為局部譜功率最小值,而增強與指數(shù)f2相關(guān)聯(lián)的第二譜頻率處的功率以使其成為局部譜 功率最大值?;氐綀D5,根據(jù)加水印的時域音頻塊550,修改單元430生成加水印的MDCT系數(shù) 組 560,例如如 mm、MA4W、MA5W、MBOff 以及 MB5W 所示(未示出塊 MA1W、MA2W、MA3W、MBlff, MB2W、MB3W以及MB4W)。按照上述示例,修改單元430根據(jù)加水印的時域音頻塊TA5W和TBOW 生成加水印的MDCT系數(shù)組MA5W。具體來說,修改單元430將加水印的時域音頻塊TA5W與 TBOW連接起來以形成512樣本音頻塊,并將該512樣本音頻塊轉(zhuǎn)換成加水印的MDCT系數(shù)組 MA5W,如以下更加詳細(xì)描述的,該加水印的MDCT系數(shù)組MA5W可以用于修改原MDCT系數(shù)組 MA5。MDCT系數(shù)組520與加水印的MDCT系數(shù)組560之間的差別表示由于嵌入或插入水 印230而產(chǎn)生的AC-3數(shù)據(jù)流240的變化。如結(jié)合圖6所描述的那樣,例如,修改單元430 可以根據(jù)對應(yīng)的加水印的MDCT系數(shù)組MA5W中的系數(shù)與原MDCT系數(shù)組MA5中的系數(shù)之間 的差別,修改MDCT系數(shù)組MA5中的尾數(shù)值。量化查找表(如圖6的查找表600)可以用于確定與加水印的MDCT系數(shù)組560的MDCT系數(shù)相關(guān)聯(lián)的新尾數(shù)值,以替代與MDCT系數(shù)組 520的MDCT系數(shù)相關(guān)聯(lián)的舊尾數(shù)值。由此,新尾數(shù)值表示由于嵌入或插入水印230而產(chǎn)生 的AC-3數(shù)據(jù)流240的變化或增大。需要特別指出的是,在本示例實現(xiàn)中,MDCT系數(shù)的冪未 改變。改變該冪可能需要重新計算基本的壓縮信號表示,從而要求對該壓縮信號進行真正 的解壓/壓縮循環(huán)。如果只對尾數(shù)進行修改不足以完全反映加水印的MDCT系數(shù)與原MDCT 系數(shù)之間的差,那么合適的話將受到影響的MDCT尾數(shù)設(shè)置為最大或最小值。在存在這種編 碼限制的情況下,加水印過程中所包含的冗余使得可以對正確的水印進行解碼。返回到圖6,示例量化查找表600包括在-0. 9333到+0. 9333范圍內(nèi)的示例尾數(shù) Mk的15級量化的尾數(shù)碼和尾數(shù)值。盡管示例量化查找表600給出了與MDCT系數(shù)相關(guān)聯(lián)的 使用4位表示的尾數(shù)信息,但是AC-3壓縮標(biāo)準(zhǔn)提供了與每個MDCT系數(shù)的其他適當(dāng)位數(shù)相 關(guān)聯(lián)的量化查找表。為了例示其中修改單元430可以修改包含在MDCT系數(shù)組MA5中的尾 數(shù)為Mk的特定MDCT系數(shù)mk的一種方式,假設(shè)原尾數(shù)值為-0. 2666 (即,-4/15)。使用量化 查找表600,將與MDCT系數(shù)組MA5中的特定MDCT系數(shù)mk對應(yīng)的尾數(shù)碼確定為0101。加水 印的MDCT系數(shù)組MA5W包括尾數(shù)值為WMk的加水印的MDCT系數(shù)wmk。此外,假設(shè)加水印的 MDCT系數(shù)組MA5W中的對應(yīng)加水印的MDCT系數(shù)wmk的新尾數(shù)值是-0. 4300,該值在尾數(shù)碼 0011與0100之間。換句話說,在本示例中,水印230導(dǎo)致在原尾數(shù)值-0. 2666與加水印的 尾數(shù)值-0. 4300之間產(chǎn)生了 -0. 1667的差。為了將水印230嵌入或插入AC-3數(shù)據(jù)流240中,修改單元430可以使用加水印 的MDCT系數(shù)組MA5W來修改或增大MDCT系數(shù)組MA5中的MDCT系數(shù)。接著上述示例,由 于與對應(yīng)的加水印的MDCT系數(shù)Wmk相關(guān)聯(lián)的加水印的尾數(shù)WMk在尾數(shù)碼0011與0100之 間(因為對應(yīng)于加水印的MDCT系數(shù)wmk的尾數(shù)值是-0. 4300),因此尾數(shù)碼0011或尾數(shù) 碼0100均可以代替與MDCT系數(shù)mk相關(guān)聯(lián)的尾數(shù)碼0101。對應(yīng)于尾數(shù)碼0011的尾數(shù)值 是-0. 5333 (即,-8/15),對應(yīng)于尾數(shù)碼0100的尾數(shù)值是-0. 4 ( S卩,-6/15)。在本示例中,由 于對應(yīng)于尾數(shù)碼0100的尾數(shù)值-0. 4最接近于期望的加水印的尾數(shù)值-0. 4300,因此修改單 元430選擇尾數(shù)碼0100而非尾數(shù)碼0011來代替與MDCT系數(shù)mk相關(guān)聯(lián)的尾數(shù)碼0101。結(jié) 果,與加水印的MDCT系數(shù)wmk的加水印的尾數(shù)WMk對應(yīng)的新尾數(shù)位模式0100代替原尾數(shù)位 模式0101。類似地,按上述方式可以修改MDCT系數(shù)組MA5中的各MDCT系數(shù)。如果加水印 的尾數(shù)值在尾數(shù)值量化范圍以外(即,大于0. 9333或小于-0. 9333),那么合適的話選擇正 極限值1110或負(fù)極限值0000作為新尾數(shù)碼。此外,如上所述,盡管可以如上所述地修改與 MDCT系數(shù)組的各MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)碼,但是與MDCT系數(shù)相關(guān)聯(lián)的冪保持不變。將再打包單元440構(gòu)造成對與要傳輸?shù)腁C-3數(shù)據(jù)流240的各幀相關(guān)聯(lián)的加水印 的MDCT系數(shù)組560進行再打包。具體來說,再打包單元440識別出AC-3數(shù)據(jù)流240的幀內(nèi) 的各MDCT系數(shù)組的位置,使得可以把對應(yīng)的加水印的MDCT系數(shù)組用于修改MDCT系數(shù)組。 例如,為了重建加水印的幀A,再打包單元440可以識別出MDCT系數(shù)組MAO到MA5的位置, 并根據(jù)在對應(yīng)識別位置處的對應(yīng)加水印的MDCT系數(shù)組MAOW到MA5W修改MDCT系數(shù)組MAO 到MA5。利用這里所描述的解包、修改以及再打包過程,AC-3數(shù)據(jù)流240仍然是壓縮數(shù)字?jǐn)?shù) 據(jù)流,同時把水印230嵌入或插入了 AC-3數(shù)據(jù)流240中。結(jié)果,在不進行可能劣化AC-3數(shù) 據(jù)流240中的媒體內(nèi)容質(zhì)量的附加解壓/壓縮循環(huán)的情況下,嵌入裝置210將水印230插 入了 AC-3數(shù)據(jù)流240中。
為簡單起見,結(jié)合圖5描述了包括單個聲道的AC-3數(shù)據(jù)流240。然而,如下所述, 可以將這里所公開的方法和裝置應(yīng)用于具有與多個聲道(如5.1聲道(即,5個全帶寬聲 道))相關(guān)聯(lián)的音頻塊的壓縮數(shù)字?jǐn)?shù)據(jù)流。在圖7的示例中,解壓縮的數(shù)字?jǐn)?shù)據(jù)流700可以 包括多個音頻塊組710。各音頻塊組710可以包括與多個聲道720和730相關(guān)聯(lián)的音頻塊, 這些聲道720和730例如包括前左聲道、前右聲道、中央聲道、環(huán)繞左聲道、環(huán)繞右聲道以及 低頻效果(LFE)聲道(例如,重低音聲道)。例如,音頻塊組AUDO包括與前左聲道相關(guān)聯(lián)的 音頻塊A0L、與前右聲道相關(guān)聯(lián)的音頻塊A0R、與中央聲道相關(guān)聯(lián)的音頻塊A0C、與環(huán)繞左聲 道相關(guān)聯(lián)的音頻塊A0SL、與環(huán)繞右聲道相關(guān)聯(lián)的音頻塊AOSR以及與LFE聲道相關(guān)聯(lián)的音頻 塊A0LFE。類似地,音頻塊組AUDI包括與前左聲道相關(guān)聯(lián)的音頻塊AIL、與前右聲道相關(guān)聯(lián) 的音頻塊A1R、與中央聲道相關(guān)聯(lián)的音頻塊A1C、與環(huán)繞左聲道相關(guān)聯(lián)的音頻塊A1SL、與環(huán) 繞右聲道相關(guān)聯(lián)的音頻塊AlSR以及與LFE聲道相關(guān)聯(lián)的音頻塊A1LFE??梢园磁c以上結(jié)合圖5和6描述的方式類似的方式對與音頻塊組710中的特定聲 道相關(guān)聯(lián)的各音頻塊進行處理。例如,可以對與圖8的中央聲道810相關(guān)聯(lián)的多個音頻塊 (例如如AOC、A1C、A2C以及A3C所示)進行變換以生成與壓縮數(shù)字?jǐn)?shù)據(jù)流800相關(guān)聯(lián)的 MDCT系數(shù)組820。如上所指出的,可以根據(jù)把前一(舊)256樣本音頻塊與當(dāng)前(新)256 樣本音頻塊連接起來而形成的512樣本音頻塊導(dǎo)出各MDCT系數(shù)組820。然后MDCT算法可 以對時域音頻塊810 (如AOC到A5C)進行處理以生成MDCT系數(shù)組(如MOC到M5C)。根據(jù)壓縮數(shù)字?jǐn)?shù)據(jù)流800的MDCT系數(shù)組820,識別單元410如上所述識別出多個 幀(未示出)以及與各幀相關(guān)聯(lián)的報頭信息。該報頭信息包括與壓縮數(shù)字?jǐn)?shù)據(jù)流800相關(guān) 聯(lián)的壓縮信息。對于各幀,解包單元420對MDCT系數(shù)組820進行解包以確定與MDCT系數(shù) 組820相關(guān)聯(lián)的壓縮信息。例如,解包單元420可以識別出由原壓縮過程用來表示各MDCT 系數(shù)組820中的各MDCT系數(shù)的尾數(shù)的位數(shù)。如以上結(jié)合圖6所描述的那樣,可以將這種 壓縮信息用于嵌入水印230。然后修改單元430生成經(jīng)逆變換的時域音頻塊830,例如如 TA0C”、TA1C,、TA1C”、TA2C,、TA2C”以及TA3C,所示。時域音頻塊830包括前一(舊)時域 音頻塊(被表示為主塊)組和當(dāng)前(新)時域音頻塊(被表示為雙主塊)組。通過例如根 據(jù)Princen-Bradley TDAC技術(shù)添加對應(yīng)的主塊和雙主塊,可以重構(gòu)被壓縮以形成AC-3數(shù) 字?jǐn)?shù)據(jù)流800的原時域音頻塊(S卩,經(jīng)重構(gòu)的時域音頻塊840)。例如,修改單元430可以添 加時域音頻塊TA1C,和TA1C”以重構(gòu)時域音頻塊TAlC (即,TA1CR)。類似地,修改單元430 可以添加時域音頻塊TA2C,和TA2C”以重構(gòu)時域音頻塊TA2C( S卩,TA2CR)。為了插入來自水印源220的水印230,修改單元430將兩個相鄰的經(jīng)重構(gòu)的時域 音頻塊連接起來以創(chuàng)建512樣本音頻塊(即,可修改時域音頻塊)。例如,修改單元430可 以將經(jīng)重構(gòu)的時域音頻塊TAlCR與TA2CR(均為256樣本短塊)連接起來以形成512樣本 音頻塊。然后修改單元430將水印230插入由經(jīng)重構(gòu)的時域音頻塊TAlCR和TA2CR形成的 512樣本音頻塊以生成加水印的時域音頻塊TAlCW和TA2CW。根據(jù)加水印的時域音頻塊850,修改單元430可以生成加水印的MDCT系數(shù)組860。 例如,修改單元430可以將加水印的時域音頻塊TAlCW與TA2CW連接起來以生成加水印的 MDCT系數(shù)組M1CW。修改單元430根據(jù)多個加水印的MDCT系數(shù)組860中的對應(yīng)一個修改 MDCT系數(shù)組820。例如,修改單元430可以使用加水印的MDCT系數(shù)組MlCW來修改原MDCT 系數(shù)組M1C。然后修改單元430可以針對與各聲道相關(guān)聯(lián)的音頻塊重復(fù)上述過程以將水印
11230插入壓縮數(shù)字?jǐn)?shù)據(jù)流800中。圖9是示出其中可以將圖2的示例水印嵌入系統(tǒng)構(gòu)造成把水印嵌入或插入壓縮數(shù) 字?jǐn)?shù)據(jù)流中的一種方式的流程圖。利用存儲在機器可訪問介質(zhì)(如易失性或非易失性存儲 器)或其他大容量存儲裝置(例如,軟盤、CD以及DVD)的任何組合上的許多不同編程代碼 中的任何編程代碼,可以將圖9的示例過程實現(xiàn)為機器可訪問指令。例如,可以在以下機器 可訪問介質(zhì)中實現(xiàn)該機器可訪問指令可編程門陣列、專用集成電路(ASIC)、可擦除可編 程只讀存儲器(EPROM)、只讀存儲器(ROM)、隨機存取存儲器(RAM)、磁介質(zhì)、光介質(zhì)和/或任 何其他合適類型的介質(zhì)。此外,盡管圖9例示了特定次序的動作,但是也可以按其他時間順 序執(zhí)行這些動作。而且,所給出并結(jié)合圖2到5描述的流程圖900僅僅是作為用于將系統(tǒng) 構(gòu)造成把水印嵌入壓縮數(shù)字?jǐn)?shù)據(jù)流中的一種方式的示例。在圖9的示例中,該過程開始于識別單元410(圖4)識別與壓縮數(shù)字?jǐn)?shù)據(jù)流 240(圖2)相關(guān)聯(lián)的幀(如幀A(圖5))(塊910)。所識別的幀可以包括通過交疊和連接多 個音頻塊而形成的多個MDCT系數(shù)組。例如,根據(jù)AC-3壓縮標(biāo)準(zhǔn),一幀可以包括6個MDCT 系數(shù)組(即,6個“audblk”)。此外,識別單元410(0 4)還識別與該幀相關(guān)聯(lián)的報頭信息 (塊920)。例如,識別單元410可以識別與壓縮數(shù)字?jǐn)?shù)據(jù)流240相關(guān)聯(lián)的聲道數(shù)。然后解包單元420對該多個MDCT系數(shù)組進行解包以確定與用于生成壓縮數(shù)字?jǐn)?shù) 據(jù)流240的原壓縮過程相關(guān)聯(lián)的壓縮信息(塊930)。具體來說,解包單元420識別各MDCT 系數(shù)組的各MDCT系數(shù)mk的尾數(shù)Mk和冪Xk。然后可以按與AC-3壓縮標(biāo)準(zhǔn)相適應(yīng)的方式對 MDCT系數(shù)的冪進行分組。解包單元420 (圖4)還確定用于表示各MDCT系數(shù)的尾數(shù)的位數(shù), 使得可以如以上結(jié)合圖6所描述的那樣可以使用由AC-3壓縮標(biāo)準(zhǔn)指定的合適的量化查找 表來修改或增大所述多個MDCT系數(shù)組。然后控制進行到塊940,以下結(jié)合圖10對該塊940 進行更詳細(xì)的描述。如圖10所示,修改過程940這樣開始利用修改單元430 (圖4)對MDCT系數(shù)組執(zhí) 行逆變換以生成經(jīng)逆變換的時域音頻塊(塊1010)。具體來說,修改單元430生成與用于生 成對應(yīng)的MDCT系數(shù)組的各256樣本原時域音頻塊相關(guān)聯(lián)的前一(舊)時域音頻塊(例如, 被表示為圖5中的主塊)和當(dāng)前(新)時域音頻塊(被表示為圖5中的雙主塊)。如結(jié)合 圖5所描述的那樣,例如,修改單元430可以根據(jù)MDCT系數(shù)組MA5生成TA4”和TA5,,根據(jù) MDCT系數(shù)組MBO生成TA5”和TBO,,根據(jù)MDCT系數(shù)組MBl生成TBO ”和ΤΒΓ。對于各時域 音頻塊,修改單元430例如根據(jù)Princen-Bradley TDAC技術(shù)添加對應(yīng)的主塊和雙主塊以重 構(gòu)時域音頻塊(塊1020)。根據(jù)上述示例,可以添加主塊TA5’和雙主塊TA5”以重構(gòu)時域音 頻塊TA5 (即,經(jīng)重構(gòu)的時域音頻塊TA5R),而可以添加主塊ΤΒ0’和雙主塊ΤΒ0”以重構(gòu)時域 音頻塊TBO (即,經(jīng)重構(gòu)的時域音頻塊TB0R)。為了插入水印230,修改單元430使用經(jīng)重構(gòu)的時域音頻塊生成可修改時域音頻 塊(塊1030)。修改單元430使用兩個相鄰的經(jīng)重構(gòu)的時域音頻塊生成可修改的512樣本 時域音頻塊。例如,修改單元430可以通過將圖5的經(jīng)重構(gòu)的時域音頻塊TA5R與TBOR連 接起來生成可修改時域音頻塊。通過實現(xiàn)編碼過程,例如在美國專利No. 6,272,176、No. 6,504, 870和/或 6,621,881中所描述的一個或更多個編碼方法和裝置,修改單元430將來自水印源220的水 印230插入可修改時域音頻塊中(塊1040)。例如,修改單元430可以將水印230插入通過使用經(jīng)重構(gòu)的時域音頻塊TA5R和TBOR而生成的512樣本時域音頻塊中,以生成加水印的 時域音頻塊TA5W和TB0W。根據(jù)這些加水印的時域音頻塊和壓縮信息,修改單元430生成 加水印的MDCT系數(shù)組(塊1050)。如上所指出的,兩個加水印的時域音頻塊(其中各塊均 包括256個樣本)可以用于生成加水印的MDCT系數(shù)組。例如,可以把加水印的時域音頻塊 TA5W與TBOW連接起來然后把它們用于生成加水印的MDCT系數(shù)組MA5W。如以上結(jié)合圖6描述的那樣,根據(jù)與壓縮數(shù)字?jǐn)?shù)據(jù)流240相關(guān)聯(lián)的壓縮信息,修改 單元430計算與加水印的MDCT系數(shù)組MA5W中的各加水印的MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)值。 按此方式,修改單元430可以使用加水印的MDCT系數(shù)組修改或增大原MDCT系數(shù)組以將水 印230嵌入或插入壓縮數(shù)字?jǐn)?shù)據(jù)流240中(塊1060)。按照以上示例,修改單元430可以根 據(jù)圖5的加水印的MDCT系數(shù)組MA5W代替原MDCT系數(shù)組MA5。例如,修改單元430可以將 MDCT系數(shù)組MA5中的原MDCT系數(shù)置換為來自加水印的MDCT系數(shù)組MA5W中的對應(yīng)加水印 的MDCT系數(shù)(其具有增大的尾數(shù)值)。另選地,修改單元430可以計算在與原MDCT系數(shù) 和對應(yīng)加水印的MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)碼之間的差(即,AMk = Mk-WMk)并根據(jù)該差A(yù)Mk 修改原MDCT系數(shù)。在任一情況下,在修改了原MDCT系數(shù)組之后,修改過程940結(jié)束并且控 制返回到塊950。回到圖9,再打包單元440對壓縮數(shù)字?jǐn)?shù)據(jù)流的幀進行再打包(塊950)。再打包 單元440識別MDCT系數(shù)組在幀內(nèi)的位置,使得可以在原MDCT系數(shù)組的位置處替換為經(jīng)修 改的MDCT系數(shù)組以重建該幀。在塊960處,如果嵌入裝置210確定需要處理壓縮數(shù)字?jǐn)?shù)據(jù) 流240的其他幀,那么控制返回到塊910。而如果已處理完壓縮數(shù)字?jǐn)?shù)據(jù)流240的所有幀, 那么過程900結(jié)束。如上所指出的,典型地,公知的加水印技術(shù)將壓縮數(shù)字?jǐn)?shù)據(jù)流解壓縮成解壓縮的 時域樣本,將水印插入該時域樣本,并將加水印的時域樣本再壓縮成加水印的壓縮數(shù)字?jǐn)?shù) 據(jù)流。與之對照的是,在這里所描述的示例解包、修改以及再打包過程中,數(shù)字?jǐn)?shù)據(jù)流240 保持壓縮狀態(tài)。結(jié)果,在不進行可能劣化壓縮數(shù)字?jǐn)?shù)據(jù)流500中的內(nèi)容質(zhì)量的附加解壓/ 壓縮循環(huán)的情況下,將水印230嵌入了壓縮數(shù)字?jǐn)?shù)據(jù)流240中。為了進一步說明圖9和10的示例修改過程,圖11示出了其中可以處理數(shù)據(jù)幀(如 AC-3幀)的一種方式。示例幀處理過程1100這樣開始嵌入裝置210讀取所獲得的幀(如 AC-3幀)的報頭信息(塊1110)并將MDCT系數(shù)組計數(shù)初始化成0(塊1120)。在處理的是 AC-3幀的情況下,每個AC-3幀都包括具有壓縮域數(shù)據(jù)的6個MDCT系數(shù)組(如圖5的ΜΑΟ、 ΜΑ1、ΜΑ2、ΜΑ3、ΜΑ4以及ΜΑ5,在AC-3標(biāo)準(zhǔn)中也被稱為“audblk”)。因此,嵌入裝置210確定 MDCT系數(shù)組計數(shù)是否等于6 (塊1130)。如果MDCT系數(shù)組計數(shù)尚不等于6,則表示至少還有 一個MDCT系數(shù)組需要處理,嵌入裝置210提取與該幀的MDCT系數(shù)相關(guān)聯(lián)的冪(塊1140) 和尾數(shù)(塊1150)(如以上結(jié)合圖6所描述的原尾數(shù)Mk)。嵌入裝置210計算出與在塊1220 處讀取的碼符號相關(guān)聯(lián)的新尾數(shù)(如以上結(jié)合圖6所描述的新尾數(shù)WMk)(塊1160),并根據(jù) 該新尾數(shù)修改與該幀相關(guān)聯(lián)的原尾數(shù)(塊1170)。例如,可以根據(jù)該新尾數(shù)與原尾數(shù)之差 (但是限制在與原尾數(shù)的位表示相關(guān)聯(lián)的范圍之內(nèi))修改原尾數(shù)。嵌入裝置210使MDCT系 數(shù)組計數(shù)加1(塊1180)并且控制返回到塊1130。盡管將以上圖11的示例過程描述成包括 6個MDCT系數(shù)組(如MDCT系數(shù)組計數(shù)的閾值為6),但是也可以使用利用了更多或更少個 MDCT系數(shù)組的過程。在塊1130處,如果MDCT系數(shù)組計數(shù)等于6,那么已處理完所有MDCT系數(shù)組,從而已嵌入了水印并且嵌入裝置210對幀進行了再打包(塊1190)。如上所指出的,已知很多用于將人耳不可感知的水印(如不可聽碼)嵌入解壓縮 音頻信號中的方法。例如,在Jensen等人的美國專利No. 6,421,445中描述的一種公知方 法,通過引用將其全部公開內(nèi)容并入于此。具體來說,如Jensen等人所述,碼信號(如水 印)可以包括按10個不同頻率組合的信息,這些頻率可以由解碼器使用音頻樣本序列(例 如,如下詳細(xì)描述的12,288個音頻樣本序列)的傅立葉譜分析而檢測到。例如,可以按48 千赫(kHz)的速率對音頻信號進行采樣以輸出可被處理(如使用傅立葉變換)的12,288 個音頻樣本的音頻序列,以獲得對經(jīng)解壓縮的音頻信號的相對高分辨率(如3. 9Hz)的頻域 表示。然而,根據(jù)Jensen等人公開的方法的編碼過程,在整個音頻樣本序列上具有常數(shù)幅 值的正弦碼信號是不可接受的,因為人耳可以感知到正弦碼信號。為了滿足掩蔽能量限制 (即,為了確保正弦碼信號信息保持不可被感知),使用掩蔽能量分析在整個12,288個音頻 樣本的序列上對正弦碼信號進行合成,該掩蔽能量分析用于確定各音頻樣本塊內(nèi)的局部正 弦幅值(例如,其中每個音頻樣本塊都可以包括512個音頻樣本)。由此,根據(jù)該掩蔽能量 分析,局部正弦波形在12,288個音頻樣本序列上可以是(相位)相干,但是具有變化的幅 值。然而,與Jensen等人公開的方法相比,可以將這里所描述的方法和裝置用于按這 樣的方式把水印或其他碼信號嵌入壓縮音頻信號中,即,使得在解包、修改以及再打包過程 中包含有壓縮音頻信號的壓縮數(shù)字?jǐn)?shù)據(jù)流保持壓縮狀態(tài)。圖12示出了其中可以將水印(如 Jensen等人公開的水印)插入壓縮音頻信號的一種方式。該示例過程1200開始于將幀計 數(shù)初始化為0(塊1210)??梢詫Ρ硎靖饕纛l聲道的總共12,288個音頻樣本的8個幀(如 AC-3幀)進行處理,以將一個或更多個碼符號(例如,圖13所示并且由Jensen等人描述的 一個或更多個符號“0”、“1”、“S”以及“E”)嵌入音頻信號中。盡管這里所描述的壓縮數(shù)字 數(shù)據(jù)流包括12,288個音頻樣本,但是該壓縮數(shù)字?jǐn)?shù)據(jù)流可以具有更多或更少個音頻樣本。 嵌入裝置210 (圖2)可以從水印源220讀取水印230以將一個或更多個碼符號插入幀序列 中(塊1220)。嵌入裝置210可以獲得這些幀中的一個幀(塊1230)并進行到上述幀處理 操作1100以對獲得的幀進行處理。因此,示例幀處理操作1100結(jié)束,并且控制回到塊1250 以使幀計數(shù)加1。嵌入裝置210確定該幀計數(shù)是否為8(塊1260)。如果幀計數(shù)不是8,則嵌 入裝置210返回去獲得該序列中的另一幀并重復(fù)如以上結(jié)合圖11所描述的示例幀處理操 作1100來處理另一幀。而如果幀計數(shù)為8,則嵌入裝置210返回到塊1210以將幀計數(shù)重新 初始化為0并重復(fù)過程1200以處理另一幀序列。如以上指出的,可以將碼信號(如水印230)嵌入或插入壓縮數(shù)字?jǐn)?shù)據(jù)流(如AC-3 數(shù)據(jù)流)。如圖13的示例表1300所示和由Jensen等人描述的那樣,碼信號可以包括與頻 率指數(shù)到f10對應(yīng)的10個正弦分量的組合以表示4個碼符號“0”、“1”、“S”以及“Ε”中 的一個。例如,碼符號“0”可以表示二進制值0,碼符號“1”可以表示二進制值1。此外,碼 符號“S”可以表示消息的開始,碼符號‘ ”可以表示消息的結(jié)束。盡管圖13只示出了 4個 碼符號,但是也可以使用更多或更少個碼符號。此外,表1300列出了與各符號的10個正弦 分量大致所在的中心頻率對應(yīng)的變換位(transform bins)。例如,512樣本中心頻率指數(shù) (如10、12、14、16、18、20、22、24、26以及28)與壓縮數(shù)字?jǐn)?shù)據(jù)流的低分辨率頻域表示相關(guān) 聯(lián),12,288 樣本中心頻率指數(shù)(如 240、288、336、384、432、480、528、576、624 以及 672)與壓縮數(shù)字?jǐn)?shù)據(jù)流的高分辨率頻域表示相關(guān)聯(lián)。如以上所指出的,可以使用與表1300所示的頻率指數(shù)到f1(l相關(guān)聯(lián)的10個正弦 分量形成各碼符號。例如,用于插入或嵌入碼符號“0”的碼信號包括分別與頻率指數(shù)237、 289、339、383、429、481、531、575、621以及673對應(yīng)的10個正弦分量。類似地,用于插入或 嵌入碼符號“1”的碼信號包括分別與頻率指數(shù)239、291、337、381、431、483、529、573、623以 及675對應(yīng)的10個正弦分量。如示例表1300所示,頻率指數(shù)到f1(1中的每一個都具有 位于或靠近12,288樣本中心頻率指數(shù)中每一個的唯一頻率值。使用這里描述的方法和裝置可以在時域中對與頻率指數(shù)&到€1(|相關(guān)聯(lián)的10個正 弦分量中的每一個進行合成。例如,用于插入或嵌入碼符號“0”的碼信號可以包括正弦曲 線 C1 (k)、C2 (k)、C3 (k)、C4 (k)、C5 (k)、C6 (k)、C7 (k)、C8 (k)、C9 (k)以及 Cltl (k)。可以在時域中
將第一正弦曲線C1 (k)合成為如下樣本序列q(幻=COS2^ 237fc,對于k = 0到12287。但
122oo
是,按此方式生成的正弦曲線C1 (k)在整個12,288樣本窗口上將具有常數(shù)幅值。相反地,為 了生成其幅值可以隨音頻塊變化的正弦曲線,可以如下計算與第一正弦曲線C1 (k)相關(guān)聯(lián)
權(quán)利要求
一種用于在壓縮媒體數(shù)據(jù)流中嵌入媒體識別信息的方法,該方法包括以下步驟根據(jù)所述壓縮媒體數(shù)據(jù)流來重構(gòu)非壓縮媒體數(shù)據(jù)流,所述非壓縮媒體數(shù)據(jù)流與所述壓縮媒體數(shù)據(jù)流是分離的;將所述媒體識別信息嵌入所述非壓縮媒體數(shù)據(jù)流中,以確定加水印的非壓縮媒體數(shù)據(jù)流;以及修改與關(guān)聯(lián)于所述壓縮媒體數(shù)據(jù)流的第一變換系數(shù)相對應(yīng)的第一尾數(shù)值,以將所述媒體識別信息嵌入所述壓縮媒體數(shù)據(jù)流中而無需解壓縮所述壓縮媒體數(shù)據(jù)流,所述第一尾數(shù)值的修改是基于所述第一變換系數(shù)與對應(yīng)的第二變換系數(shù)之差來進行的,所述第二變換系數(shù)是根據(jù)所述加水印的非壓縮媒體數(shù)據(jù)流而生成的。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述壓縮媒體數(shù)據(jù)流包括壓縮音頻數(shù)據(jù)流,而所 述非壓縮媒體數(shù)據(jù)流包括時域音頻數(shù)據(jù)流。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述媒體識別信息包括表示節(jié)目或源識別信息 中的至少一個的水印。
4.根據(jù)權(quán)利要求1所述的方法,其中,所述第一、第二變換系數(shù)包括各自的第一、第二 經(jīng)修改的離散余弦變換MDCT系數(shù)。
5.根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)所述壓縮媒體數(shù)據(jù)流來重構(gòu)非壓縮媒體數(shù) 據(jù)流的步驟包括以下處理對所述壓縮媒體數(shù)據(jù)流的副本進行逆變換,以確定第一、第二逆變換數(shù)據(jù)塊;以及將所述第一、第二逆變換數(shù)據(jù)塊組合以形成所述非壓縮媒體數(shù)據(jù)流。
6.根據(jù)權(quán)利要求1所述的方法,其中,將所述媒體識別信息嵌入所述非壓縮媒體數(shù)據(jù) 流中以確定加水印的非壓縮媒體數(shù)據(jù)流的步驟包括以下處理增大所述非壓縮媒體數(shù)據(jù)流的第一頻率分量并減小所述非壓縮媒體數(shù)據(jù)流的第二頻 率分量,以表示與所述媒體識別信息相關(guān)聯(lián)的第一數(shù)據(jù)值;以及減小所述非壓縮媒體數(shù)據(jù)流的所述第一頻率分量并增大所述非壓縮媒體數(shù)據(jù)流的所 述第二頻率分量,以表示與所述媒體識別信息相關(guān)聯(lián)的第二數(shù)據(jù)值。
7.根據(jù)權(quán)利要求1所述的方法,其中,將所述媒體識別信息嵌入所述非壓縮媒體數(shù)據(jù) 流以確定加水印的非壓縮媒體數(shù)據(jù)流的步驟包括以下處理確定多個碼信號分量,以表示與所述媒體識別信息相關(guān)聯(lián)的數(shù)據(jù)值;以及基于所確定的掩蔽能量,將所述多個碼信號分量與所述非壓縮媒體數(shù)據(jù)流進行組合。
8.根據(jù)權(quán)利要求1所述的方法,其中,修改與關(guān)聯(lián)于所述壓縮媒體數(shù)據(jù)流的所述第一 變換系數(shù)相對應(yīng)的第一尾數(shù)值的步驟包括以下處理確定與根據(jù)所述加水印的非壓縮媒體數(shù)據(jù)流生成的所述第二變換系數(shù)相關(guān)聯(lián)的第二 尾數(shù)值;基于與所述第一尾數(shù)值相關(guān)聯(lián)的壓縮信息來量化所述第二尾數(shù)值;以及用量化后的第二尾數(shù)值來替換所述第一尾數(shù)值。
9.根據(jù)權(quán)利要求1所述的方法,其中,所述第一變換系數(shù)還包括所述第一尾數(shù)值和第 一指數(shù)值,并且其中,所述第一指數(shù)值未被修改而嵌入所述媒體識別信息。
10.根據(jù)權(quán)利要求9所述的方法,其中,當(dāng)僅所述第一尾數(shù)值的修改不足以說明所述第 一變換系數(shù)與所述第二變換系數(shù)之差時,基于與所述第一尾數(shù)值相關(guān)聯(lián)的壓縮信息,將所述第一尾數(shù)值設(shè)置為最小值或最大值中的至少一個。
11.一種用于確定等級信息的方法,該方法包括以下步驟提取嵌入在所呈現(xiàn)的媒體內(nèi)容中的識別信息,所述識別信息被嵌入在與所呈現(xiàn)的媒體 內(nèi)容相對應(yīng)的所廣播的壓縮音頻數(shù)據(jù)流中,通過以下步驟將所述識別信息嵌入到所述壓縮 音頻數(shù)據(jù)流中而無需解壓縮所述壓縮音頻數(shù)據(jù)流修改與關(guān)聯(lián)于所述壓縮音頻數(shù)據(jù)流的第一變換系數(shù)相對應(yīng)的第一尾數(shù)值,以將所述識 別信息嵌入所述壓縮音頻數(shù)據(jù)流中,所述第一尾數(shù)值的修改是基于所述第一變換系數(shù)與對 應(yīng)的第二變換系數(shù)之差來進行的,所述第二變換系數(shù)是根據(jù)也嵌入了所述識別信息的、所 述壓縮音頻數(shù)據(jù)流的分離非壓縮版本而生成的。
12.根據(jù)權(quán)利要求11所述的方法,其中,所述識別信息包括表示節(jié)目或源識別信息中 的至少一個的水印。
13.根據(jù)權(quán)利要求11所述的方法,該方法還包括以下步驟在接收裝置處對所廣播的壓縮音頻數(shù)據(jù)流進行解壓縮,以生成與所呈現(xiàn)的媒體內(nèi)容相 對應(yīng)的非壓縮音頻數(shù)據(jù)流;以及從與所述非壓縮音頻數(shù)據(jù)流相對應(yīng)的模擬音頻信號中提取所述識別信息,所述模擬音 頻信號是由所述接收裝置的揚聲器或模擬輸出中的至少一個提供的。
全文摘要
公開了用于嵌入水印的方法和裝置。在示例方法中,識別與壓縮數(shù)字?jǐn)?shù)據(jù)流(240)相關(guān)聯(lián)的一個或更多個幀。對該一個或更多個幀中的每個幀進行解包以確定多個變換系數(shù)組(320)。修改該多個變換系數(shù)組(320)以嵌入水印(230)。
文檔編號H04N7/24GK101950561SQ20101050120
公開日2011年1月19日 申請日期2004年6月14日 優(yōu)先權(quán)日2003年6月13日
發(fā)明者韋努高博·斯里尼瓦桑 申請人:尼爾森(美國)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1