專利名稱:字幕定位解碼設備的制作方法
技術領域:
本發(fā)明涉及字幕技術,尤其是對字幕進行彩色劃變和定位。
背景技術:
疊加在視頻圖像上的字幕把附屬于該視頻圖像的信息傳遞給觀眾。以卡拉OK(Karaoke)為例,歌詞作為字幕顯示在視頻圖像上,觀眾則伴同視頻圖像的聲跡作演唱。字幕還以被顯示的方式把信息傳遞給觀眾。例如,卡拉OK中的強亮度的歌詞提示人們開始演唱,而將歌詞移出視屏則告訴觀眾停止演唱。
電視廣播或視頻再現(xiàn)(例如自視盤)提供了與視頻圖像一起顯示的字幕。然而,這些字幕總是與所基于的視頻圖像相結合而成為一體,而且只能在發(fā)送端(或記錄端)操作而不能在接收端(或再現(xiàn)端)操作。就是說,電視廣播或視頻再現(xiàn)所顯示的字幕是“固定”的而無法在接收(或再現(xiàn))端被突出或被移動。該字幕也不能被關斷,在卡拉OK中演唱者打算試一試他/她的歌唱能力或享受音樂而不打斷字幕的情況下,這種關斷動能尤為有用。
電視廣播和再現(xiàn)系統(tǒng)不能在發(fā)送端(或記錄端)充分地操作字幕。電視廣播系統(tǒng)及再現(xiàn)系統(tǒng)需要對字幕作跟蹤、誤差校正之類的令人不快的操作。以卡拉OK為例,隨歌唱的音樂畫面是成批產生的,所希望的是每一個音樂畫面都能快速而有效地產生。利用電視廣播和再現(xiàn)系統(tǒng)不可能做到這一點,因為它們需要有緩慢且乏味的工作才能為顧客制作每一個音樂畫面。尤其是,由于字幕是視頻圖像的整體部分,所以在固定式電視廣播或記錄中不可能作動態(tài)定位。把字幕移動就會在曾經疊加有字幕處留下空白。
小型盤圖形技術(CD-G)在顯示字幕方面提供了更大的靈活性,因為這種技術是以子碼的形式在CD上記錄圖形。然而,由于這種CD-G技術局限于在CD上的應用,所以有嚴重的不足,尤其從電視標準角度看,顯得太慢。就是說,這種CD-G技術無益于以實時電視廣播或視頻再現(xiàn)的方式產生及操作字幕。
CD-G的計算機應用是成功的,因為圖形是被事先編程,而且為產生圖形所需的大量處理時間大部分不為終端用戶所見。然而,如參考圖16a-16c和圖17所見,為產生完整CD-G屏幕所需超前時間是10.24秒,這對于標準電視或視頻廣播而言是很不足的。
圖16a示出CD-G數(shù)據(jù)的格式,其中一幀包括子碼的一個字節(jié)和音頻通道數(shù)據(jù)的32字節(jié)。就這32字節(jié)而言,24字節(jié)分配給L和R音頻通道數(shù)據(jù)(每一通道有6個樣本,而每個樣本兩字節(jié)),而8個字節(jié)分配給糾錯碼。如圖16b所示,這些幀被分組成98個幀的數(shù)據(jù)塊(幀0、幀1、......幀96和幀97)。8個塊P、Q、R、S、T、U、V和W被發(fā)送,如圖16C所示。對于幀0和1的子碼在每一塊中被定義為同步模式S0和S1,而其余的96個幀存儲著各種子碼數(shù)據(jù)。在分成一組的8個塊當中,前兩個塊P、Q分配給檢索數(shù)據(jù),用來在整個記錄軌道上進行搜索;而圖形數(shù)據(jù)可分配給余下6個塊R、S、T、U、V和W中的子碼。
由于98幀的每一塊都是以75Hz的重復頻率傳輸,所以1個塊數(shù)據(jù)的傳輸速率是(75×98字節(jié))7.35KHz,得到的子碼位速率是7.35K字節(jié)/秒。用于發(fā)送存在于塊R、S、T、U、V和W中的信息的傳輸格式示于圖17中。6個塊(R、S、T、U、V、和W)的96個幀(2、3......97)的每一個被設置成包括每通道96個碼元的6個通道(R至W)的數(shù)據(jù)包。該數(shù)據(jù)包還被細分成24個碼元的4個子包,每一碼元(碼元0到23)都代表著一個幀。
一個CD-G字符是由6×12個像素組成。由于每一子包是6×24,所以,6×12的字符很容易容納于每一子包中。CD-G格式把6個通道(R、S、T、U、V和W)和8到19的12個碼元分配給一個字符。在這些子包的每個中的其余碼元存儲與字符相關的信息。
模式信息存儲在每一子包中碼元0的前三個通道(R、S、T),而項目信息存儲在碼元0的后三個通道(U.V.W)。下表中示出了模式信息和項目信息的組合,定義了用于存儲在相應子包中字符的模式
表1
一個指令存儲在碼元1的所有通道中。而對應的模式、項目、奇偶性或指令的附加信息存儲在碼元2-7的全部通道中。碼元0-19的通道中的全部數(shù)據(jù)的奇偶性存儲在每一子包中最后四個碼元(20-23)的所有通道中。
如所討論的那樣,數(shù)據(jù)是以75Hz的重復頻率發(fā)送的。因此,包括4個子包的一個數(shù)據(jù)包是以每秒300子包的速率(75×4個子包)發(fā)送的。就是說,對于分配給6×12像素范圍的一個字符來說,1秒鐘可發(fā)送300個字符。
然而,CD-G屏幕要求多于300個字符。一個CD-G屏幕被確定為288個水平圖像單元×192個垂直圖像單元,要求在1秒內發(fā)送多于300個字符的兩倍。因而一個288×192的屏幕的總的發(fā)送時間是2.56秒,由下列公式計算(288/6)×(192/12)÷300=2.56秒考慮到屏幕通常是每0.6秒就被刷新一次,這一數(shù)值對于每一屏幕的再生而言是太長了。因為每一16進制表達式需要4個比特代表一個像素,當16進制碼被用于字符時,這一問題更為復雜化。結果是,上面描述的4倍的數(shù)據(jù)的發(fā)送把傳輸速率提高到10.24秒。由于每一屏的發(fā)送要求10.24秒的延時,所以,當利用CD-G技術發(fā)送屏幕時,屏幕的連續(xù)發(fā)送即意味著要經歷10.24秒的滯后時間。
所以,CD-G技術不是實時執(zhí)行的,且對于實時廣播的使用是慢難以接受。在一般產生卡拉OK音樂視像的實例中,幾乎不可能把字幕與所要唱的歌詞的瞬時精確地同步,因為該字幕將不得不在音樂視像之前10.24秒而被產生。
這種CD-G系統(tǒng)還會受到再現(xiàn)字幕時的缺陷的困擾。CD-G系統(tǒng)只是在普通再現(xiàn)時才顯示字幕,而在像快進或快退再現(xiàn)這種特殊重放時就不產生字幕。CD-G圖像還受到歌唱現(xiàn)象(其中字符的傾斜部分被毛糙化)或閃爍的干擾,因為這種系統(tǒng)只分配一位數(shù)據(jù)給每一圖像單元。這種CD-G圖像的滯后時間還妨礙了以高速度對顯示的字幕的通斷切換。
在一種類型的系統(tǒng)中(稱之為“主導(CAPTAIN)”系統(tǒng)),是以點圖形以及字符碼表示字幕。然而這種系統(tǒng)絲毫不比CD-G系統(tǒng)好,且有與CD-G相同的不足。比如,兩種系統(tǒng)中的字幕都缺少細節(jié),因為這些系統(tǒng)不提供足夠的分辨率來顯示字幕。例如“主導”系統(tǒng)產生248(水平圖像單元)×192(垂直圖像單元)的顯示,而不是720×480的高分辨率視頻圖像。
在現(xiàn)有技術WO9510704A中,公開了一種用“劃變條(wipe bar)”來與字幕一起顯示,以此來改變字幕字符的色彩的技術。但它并不能真正直接改變每個字符的顏色。
發(fā)明內容
因此本發(fā)明的目的是提供一種用于真正對字幕字符進行彩色劃變的字幕方法及裝置。
本發(fā)明的進一步的目的是提供一種以操作者的命令并以實時方式對字幕字符進行彩色劃變的字幕方法及裝置。
本發(fā)明又一目的是提供一種用于動態(tài)定位字幕的字幕方法和裝置。
本發(fā)明更進一步的目的是提供一種以操作者的命令和實時方式動態(tài)地定位字幕的字幕方法及裝置。
根據(jù)本發(fā)明的上述目的,本發(fā)明提供了一種字幕彩色劃變編碼裝置,它包括字幕產生裝置,用于產生各視頻圖像的字幕;彩色查詢表裝置,用于產生包括每個碼代表所述字幕的彩色分量的多個碼的彩色查詢表;混合比率產生裝置,用于產生一確定在顯示時所述字幕的像素與視頻圖像混合的混合比率,使得在顯示時所述字幕逐漸與視頻圖像混合;編碼裝置,用于將所說字幕編碼成所述彩色查詢表的所述碼并用于將所說視頻圖像單獨編碼成已編碼的視頻數(shù)據(jù);和彩色劃變裝置,用于使所說字幕的至少一部分具有與所說字幕的其它部分不同的色彩。
本發(fā)明還提供一種字幕彩色劃變編碼的方法,包括以下步驟產生各視頻圖像的字幕;將所述字幕編碼成彩色查詢表的多個碼,每個碼代表所述字幕的彩色分量;產生一確定在顯示時所述字幕的像素與視頻圖像混合的混合比率,使得在顯示時所述字幕逐漸與視頻圖像混合;將所說視頻圖像單獨編碼成已編碼的視頻數(shù)據(jù);和彩色劃變所述字幕的至少一部分,使所述部分具有與所說字幕的其它部分不同的色彩。
本發(fā)明還提供一種字幕彩色劃變解碼裝置,提供有多路復合的編碼為彩色查詢表的碼的字幕數(shù)據(jù)和視頻數(shù)據(jù)和確定在顯示時所述字幕的像素與視頻圖像混合以使得在顯示時所述字幕逐漸與視頻圖像混合的混合比率,其中每個碼表示字幕的像素的彩色分量,它包括視頻解碼裝置,用于對將被顯示視頻圖像的視頻數(shù)據(jù)解碼;緩沖器裝置,用于存儲包括要解碼和與所說視頻圖像同時顯示的字幕數(shù)據(jù);控制裝置,用于在所說視頻圖像的實時顯示期間定時從所說緩沖器裝置讀出所說字幕數(shù)據(jù)的讀出操作;字幕解碼裝置,用于根據(jù)所述彩色查詢表將存儲在所說緩沖器裝置中的字幕數(shù)據(jù)從所述碼解碼為所述彩色分量;混合裝置,用于根據(jù)所述混合比率把由所說視頻解碼裝置所解碼的所述視頻信號與由所說字幕解碼裝置所解碼的所述字幕數(shù)據(jù)相混合,使得在顯示時所述字幕逐漸與視頻圖像相混合;以及彩色劃變裝置,用于在預定位置改變所說字幕至少一部分的色彩。
本發(fā)明還提供一種字幕彩色劃變解碼方法,用于解碼與視頻數(shù)據(jù)多路復合的編碼為彩色查詢表的碼的字幕數(shù)據(jù)和確定在顯示時所述字幕的像素與視頻圖像混合以使得在顯示時所述字幕逐漸與視頻圖像混合的混合比率,其中每個碼表示字幕的像素的彩色分量,該方法包括以下步驟對將被顯示視頻圖像的視頻數(shù)據(jù)進行視頻解碼;在緩沖器中存儲要解碼和與所說視頻圖像同時顯示的字幕數(shù)據(jù);控制在所說視頻圖像的實時顯示期間從所說緩沖器裝置讀出所說字幕數(shù)據(jù)的讀出操作的定時;根據(jù)所述彩色查詢表將存儲在所說緩沖器中的字幕數(shù)據(jù)從所述碼解碼為所述彩色分量;根據(jù)所述混合比率把由所說視頻解碼步驟所解碼的所述視頻數(shù)據(jù)與由所說字幕解碼步驟所解碼的所述字幕數(shù)據(jù)相混合,使得在顯示時所述字幕逐漸與視頻圖像相混合;以及在預定位置改變所說字幕至少一部分的色彩來彩色劃變所述字幕。
本發(fā)明還提供一種字幕彩色劃變解碼方法,用于解碼與視頻數(shù)據(jù)多路復合的編碼為彩色查詢表的碼的字幕數(shù)據(jù)和確定在顯示時所述字幕的像素與視頻圖像混合以使得在顯示時所述字幕逐漸與視頻圖像混合的混合比率,其中每個碼表示字幕的像素的彩色分量,該方法包括以下步驟對將被顯示視頻圖像的視頻數(shù)據(jù)進行視頻解碼;在緩沖器中存儲要解碼和與所說視頻圖像同時顯示的字幕數(shù)據(jù);控制在所說視頻圖像的實時顯示期間從所說緩沖器裝置讀出所說字幕數(shù)據(jù)的讀出操作的定時;根據(jù)所述彩色查詢表將存儲在所說緩沖器中的字幕數(shù)據(jù)從所述碼解碼為所述彩色分量;根據(jù)所述混合比率把由所說視頻解碼步驟所解碼的所述視頻數(shù)據(jù)與由所說字幕解碼步驟所解碼的所述字幕數(shù)據(jù)相混合,使得在顯示時所述字幕逐漸與視頻圖像相混合;以及在預定位置改變所說字幕至少一部分的色彩來彩色劃變所述字幕。
本發(fā)明還提供一種字幕位置解碼裝置,提供有多路復合的編碼為彩色查詢表的碼的字幕數(shù)據(jù)和視頻數(shù)據(jù)和確定在顯示時所述字幕的像素與視頻圖像混合以使得在顯示時所述字幕逐漸與視頻圖像混合的混合比率,其中每個碼表示字幕的像素的彩色分量,它包括視頻解碼裝置,用于對將被顯示視頻圖像的視頻數(shù)據(jù)解碼;緩沖器裝置,用于存儲包括要解碼和與所說視頻圖像同時顯示的字幕數(shù)據(jù);字幕解碼裝置,用于根據(jù)所述彩色查詢表將存儲在所說緩沖器裝置中的字幕數(shù)據(jù)從所述碼解碼為所述彩色分量;控制裝置,用于在所說視頻圖像的實時顯示期間定時從所說緩沖器裝置讀出所說字幕數(shù)據(jù)的讀出操作;混合裝置,用于根據(jù)所述混合比率把由所說視頻解碼裝置所解碼的所述視頻數(shù)據(jù)與由所說字幕解碼裝置所解碼的所述字幕數(shù)據(jù)相混合,使得在顯示時所述字幕逐漸與視頻圖像相混合;以及用于在顯示期間動態(tài)地改變在視頻圖像中疊加所說字幕的位置的裝置。
本發(fā)明還提供一種字幕位置解碼方法,用于解碼與視頻數(shù)據(jù)多路復合的編碼為彩色查詢表的碼的字幕數(shù)據(jù)和確定在顯示時所述字幕的像素與視頻圖像混合以使得在顯示時所述字幕逐漸與視頻圖像混合的混合比率,其中每個碼表示字幕的像素的彩色分量,該方法包括以下步驟對將被顯示視頻圖像的編碼視頻數(shù)據(jù)進行視頻解碼;在緩沖器中存儲要與所說視頻圖像同時顯示的編碼的字幕數(shù)據(jù);根據(jù)所述彩色查詢表將存儲在所說緩沖器中的字幕數(shù)據(jù)從所述碼字幕解碼為所述彩色分量;定時在所說視頻圖像的實時顯示期間從所說緩沖器裝置讀出所說字幕數(shù)據(jù)的讀出操作;根據(jù)所述混合比率把解碼的所述視頻數(shù)據(jù)與解碼的所述字幕數(shù)據(jù)相混合,使得在顯示時所述字幕逐漸與視頻圖像相混合;以及在顯示期間動態(tài)地改變在視頻圖像中疊加所說字幕的位置。
本發(fā)明還提供了一種與再現(xiàn)設備相結合使用的解碼設備,包括接收單元,用于接收多路復合的、被編碼為彩色查詢表的代碼的字幕數(shù)據(jù)和視頻數(shù)據(jù),每個代碼表示字幕的一個像素的彩色分量和一個混合比率,所述混合比率確定在顯示期間所述字幕的一個像素與一個視頻圖像混合的程度,以便在顯示期間所述字幕與所述視頻圖像逐漸地混合;視頻解碼單元,用于解碼要顯示的所述視頻圖像的視頻數(shù)據(jù);字幕解碼單元,用于按照所述彩色查詢表將來自所述代碼的字幕數(shù)據(jù)解碼為所述彩色分量;混合器,用于按照所述混合比率將由所述視頻解碼單元解碼的所述視頻數(shù)據(jù)與由所述字幕解碼單元解碼的所述字幕數(shù)據(jù)相混合,以便在顯示期間所述字幕逐漸地混合到所述視頻圖像中;彩色劃變裝置,用于改變在預定位置的所述字幕的至少一部分的色彩。
本發(fā)明還提供了一種與再現(xiàn)設備相結合地被執(zhí)行的解碼方法,包括步驟接收與視頻數(shù)據(jù)多路復合的、被編碼為彩色查詢表的代碼的字幕數(shù)據(jù),每個代碼表示所述字幕的一個像素的彩色分量和一個混合比率,所述混合比率確定在顯示期間所述字幕的一個像素與所述視頻圖像混合的程度,以便在顯示期間所述字幕與所述視頻圖像逐漸地混合;解碼要顯示的所述視頻圖像的視頻數(shù)據(jù);按照所述彩色查詢表將來自所述代碼的所述字幕數(shù)據(jù)解碼為所述彩色分量;按照所述混合比率將由所述視頻解碼步驟解碼的所述視頻數(shù)據(jù)與由所述字幕解碼步驟解碼的所述編碼字幕數(shù)據(jù)相混合,以便所述字幕逐漸地與所述視頻圖像混合;通過改變在預定位置的所述字幕的至少一部分的色彩來彩色劃變所述字幕。
本發(fā)明還提供了一種與再現(xiàn)設備相結合使用的解碼設備,包括接收單元,用于接收多路復合的字幕數(shù)據(jù)和視頻數(shù)據(jù),所述編碼的字幕數(shù)據(jù)被編碼為彩色查詢表的代碼,每個代碼表示字幕的一個像素的彩色分量和一個混合比率,所述混合比率確定在顯示期間所述字幕的一個像素與所述視頻圖像混合的程度,以便在顯示期間所述字幕與所述視頻圖像逐漸地混合;視頻解碼單元,用于解碼要顯示的所述視頻圖像的視頻數(shù)據(jù);字幕解碼單元,用于按照所述彩色查詢表將來自所述代碼的所述字幕數(shù)據(jù)解碼為所述彩色分量;混合器,用于按照所述彩色查詢表的所述混合比率將由所述視頻解碼單元解碼的所述視頻數(shù)據(jù)與由所述字幕解碼單元解碼的所述編碼數(shù)據(jù)相混合,以便在顯示期間所述字幕逐漸地與所述視頻圖像混合;處理單元,用于改變視頻圖像中在顯示期間疊加所述字幕的位置。
本發(fā)明還提供了一種與再現(xiàn)設備相結合地被執(zhí)行的解碼方法,包括步驟接收與視頻數(shù)據(jù)多路復合的字幕數(shù)據(jù),所述編碼的字幕數(shù)據(jù)被編碼為彩色查詢表的代碼,每個代碼表示所述字幕的一個像素的彩色分量和一個混合比率,所述混合比率確定在顯示期間所述字幕的一個像素與所述視頻圖像混合的程度,以便在顯示期間所述字幕與所述視頻圖像逐漸地混合;解碼要顯示的所述視頻圖像的視頻數(shù)據(jù);按照所述彩色查詢表將來自所述代碼的、存儲在所述緩沖器中的所述字幕數(shù)據(jù)字幕解碼為所述彩色分量;按照所述混合比率將解碼的視頻數(shù)據(jù)與解碼的字幕數(shù)據(jù)相混合,以便在顯示期間所述字幕逐漸地與所述視頻圖像混合;動態(tài)地改變視頻圖像中在顯示期間疊加所述字幕的位置。
因而本發(fā)明提供了字幕的彩色劃變和動態(tài)定位的方法,由于字幕的編碼及解碼是是與視頻圖像分開的,因而該字幕可以用很多控制手段并實時進行操作??旖莞咝У赝瓿刹噬珓澴兛墒共僮髡呖膳可a制作令顧客滿意的加字幕的視頻圖像。字幕的動態(tài)定位同樣快捷而有效。在一個幀周期上應用這種彩色劃變和定位,當字幕漸漸被彩色劃變或在一時間周期上重新定位時給終端觀眾帶來動感。隨著參考附圖對本發(fā)明最佳實施例的描述,這些及其它優(yōu)點將變?yōu)轱@見。
通過下面結合附圖的詳細描述,易于獲得對本發(fā)明更完整的理解及其許多附帶優(yōu)點的了解。
圖1是本發(fā)明數(shù)據(jù)解碼裝置的方塊圖。
圖2是圖1所示字幕解碼器的方塊圖。
圖3是圖1系統(tǒng)控制器及圖2控制器之間的通信表。
圖4是圖1和圖2的部件之間通信的參數(shù)表。
圖5A至5C是展示本發(fā)明數(shù)據(jù)編碼的信號圖。
圖6是對字幕數(shù)據(jù)編碼時所參考的彩色查詢表。
圖7A和7B是構成本發(fā)明編碼裝置的方塊圖。
圖8A和8B是示出圖7A的劃變數(shù)據(jù)采樣器的方塊圖。
圖9是執(zhí)行彩色劃變操作時所要參考的彩色查詢表。
圖10是解釋代碼緩沖器操作的圖表。
圖11是說明圖2中代碼緩沖器內部操作的方塊圖。
圖12A-12C表示彩色劃變操作的方案。
圖13是說明根據(jù)圖12A-12C的彩色劃變操作的方塊圖。
圖14A-14C描述動態(tài)定位操作的方案。
圖15是描繪根據(jù)圖14A-14C的動態(tài)定位操作的方塊圖。
圖16A-16C說明根據(jù)CD-G格式的數(shù)據(jù)分布。
圖17說明在CD-G格式下數(shù)據(jù)的傳輸格式。
具體實施例方式
現(xiàn)參考附圖描述本發(fā)明,其中同一標號始終代表同一或相應部件。
解碼裝置圖1所示結合本發(fā)明的數(shù)據(jù)解碼裝置對再現(xiàn)信號進行解碼。數(shù)據(jù)解碼裝置的系統(tǒng)控制器14使再現(xiàn)信號經處理然后送到字幕解碼器7。系統(tǒng)控制器與字幕解碼器的控制器35(圖2)通信,以便解碼字幕并將其疊加在解碼的視頻圖像上以在電視屏幕上顯出。
數(shù)據(jù)解碼器和信號分離器1從(例如)VCB接收數(shù)字再現(xiàn)信號。該數(shù)據(jù)解碼器和信號分離器1最好是采用糾錯碼(ECC)技術對再現(xiàn)信號作錯誤解碼,并將已錯誤解碼的再現(xiàn)信號分離成視頻、字幕和音頻信號。存儲器2可用作(例如)緩沖存儲器以及為對再現(xiàn)信號進行錯誤解碼和信號分離之目的工作區(qū)。
視頻解碼器3對來自視頻數(shù)據(jù)流的已作信號分離的視頻數(shù)據(jù)解碼。與數(shù)據(jù)解碼器和信號分離器1采用的存儲器2的操作相似,存儲器4可被用作解碼視頻數(shù)據(jù)的操作。
信箱電路5把4∶3寬高比的(擠壓模式)視頻信號轉換成16∶9的信箱比。這種轉換是用4至3的分樣過程執(zhí)行的,每4個水平行被分樣成3個水平行,從而將視頻圖像擠壓成3/4的圖像,根據(jù)這種信箱格式,垂直分辨率分量是出自視頻圖像的其余1/4,用于增強已分樣的視頻圖像的垂直分辨率。定時控制存儲器6確保該信箱圖像的1/4不被發(fā)送。當視頻解碼器3所產生的解碼的視頻數(shù)據(jù)已經是16∶9的信箱格式時,該信箱電路就將分樣操作旁路掉,并將解碼的視頻數(shù)據(jù)直接發(fā)送到字幕解碼器7。
同時,由數(shù)據(jù)解碼器和信號分離器1作信號分離的已解碼字幕數(shù)據(jù)被直接送到字幕解碼器7。根據(jù)來自系統(tǒng)控制器14的指令,字幕解碼器7對字幕數(shù)據(jù)解碼并將解碼的字幕數(shù)據(jù)和解碼的視頻數(shù)據(jù)混合。
復合編碼器8將混合的字幕數(shù)據(jù)和視頻數(shù)據(jù)編碼為字幕視頻圖像N格式,例如NTSC/PAL。模式顯示器9與用戶面接并指示出與之相連接的(例如)一個電視監(jiān)視器的模式。D/A轉換器10把從復合編碼器8接收的已編碼信號轉換成適于以所指出模式顯示的模擬信號,例如NTSL或PAL模式。
由數(shù)據(jù)解碼器和信號分離器1解碼的音頻/視頻信號的音頻部分由一音頻解碼器11解碼,它是利用一個存儲器12(例如)對已作信號分離的音頻數(shù)據(jù)解碼。利用D/A轉換器13把從音頻解碼器輸出的已解碼音頻數(shù)據(jù)轉換成模擬音頻信號,以適于經電視監(jiān)視器播出。字幕解碼器要參考圖2討論的字幕解碼器7將已經編碼的字幕數(shù)據(jù)解碼并將已解碼的字幕數(shù)據(jù)與相應的視頻數(shù)據(jù)相混合??刂破?5控制字幕解碼器的操作并利用圖2示出的命令信號(如圖3所列舉)與解碼器(圖1)的系統(tǒng)控制器14通信。同時,該控制器和系統(tǒng)控制器對字幕數(shù)據(jù)的解碼定時,以使得該字幕數(shù)據(jù)與視頻圖像數(shù)據(jù)混合在該字幕將要出現(xiàn)在視頻圖像上的精確位置。
字幕解碼器7的字檢測器20接收按位流分組的字幕數(shù)據(jù)。每一組位流都由將被疊加在視頻圖像上的一個字幕幀(或頁)構成。位流的不同組可代表以不同重放模式顯示的字幕,例如普通重放、快倒或快進。系統(tǒng)控制器利用“位流選擇”信號指示字檢測器顯示哪一種重放模式,且針對所指示的重放模式,該字檢測器選擇合適的信號流。在不同通道上顯示不同視頻圖像的情形下,對應于“通道選擇”信號,系統(tǒng)控制器把合適的通道指示給字檢測器,并且該字檢測器改變通道以便只接收所選通道上的那些數(shù)據(jù)流。
構成一幀且由字檢測器所接收的位流的一組中包括標題信息(“S.標題”),它描述位流組的格式。該標題信息伴隨有標題錯誤信息(“標題錯誤”)和數(shù)據(jù)錯誤信息(“數(shù)據(jù)錯誤”)。系統(tǒng)控制器利用標題來確定如何解析成組的位流并提取相關的字幕數(shù)據(jù)。系統(tǒng)控制器利用標題錯誤信息來校正標題信息中的偏差并利用數(shù)據(jù)錯誤信息來校正字幕數(shù)據(jù)中的偏差。
字檢測器把字幕數(shù)據(jù)(位映像)連同其它的解碼信息(有當前時間標記“PTS”、位置數(shù)據(jù)“位置數(shù)據(jù)”和彩色查詢表數(shù)據(jù)“CLUT數(shù)據(jù)”)一起送到代碼檢測器22。PTS是指示將被顯示的字幕的時間長度的信號。位置數(shù)據(jù)指示字幕所要疊加處的視頻圖像的水平和垂直位置。“CLUT數(shù)據(jù)”指示要用于構成字幕的像素的色彩。例如,系統(tǒng)控制器確定一幅視頻圖像正被顯示,并使得代碼緩沖器在由“位置數(shù)據(jù)”所指示的在視頻圖像中由水平和垂直位置表征的位置、以由“CLUT數(shù)據(jù)”所指示的色彩、并在由PTS所指示的時間周期上輸出相應的字幕數(shù)據(jù)(位映像)。
調度器21用來保證從信號分離器(圖1)接收的數(shù)據(jù)不在代碼緩沖器22中出現(xiàn)溢出。通過確定接收由字檢測器所選的位流的I/O接口(沒示出)的帶寬,該調度器控制著對代碼緩沖器的讀寫存取。在某一時刻,該帶寬表示提供到I/O端口并行位的數(shù)目,它是通過以從代碼緩沖器讀出數(shù)據(jù)的速率去除信號分離器多路分離數(shù)據(jù)的速率而計算的。例如,信號分離器的20Mbps的數(shù)據(jù)速率除以緩沖器數(shù)據(jù)讀出速率2.5Mbps等于8位。所以,調度器將設置1/0端口并行接收8位,以維持代碼緩沖器數(shù)據(jù)出入的恒定流速。因此,代碼緩沖器接收字幕數(shù)據(jù)(位映象)并等待來自系統(tǒng)控制器的“解碼啟動”信號,以讀出數(shù)據(jù)。
當系統(tǒng)控制器從水平和垂直同步信號確定該電視掃描部件是處在對應于由“位置數(shù)據(jù)”所指示的位置時,則該系統(tǒng)控制器執(zhí)行實時的讀出。對于實時顯示來說,讀出速率應當對應于一個圖像單元的采樣速率,最好是13.5MHz。如所討論,字幕數(shù)據(jù)最好是以2.5MHz或更大的速率寫入代碼緩沖器。因此,13.5MHz的采樣時鐘被分成每一個為3.375MHz的四個時鐘周期。這四個3.375MHz時鐘周期之一被分配給寫入(因為寫入至少要求2.5MHz),而其余三個時鐘周期被分配用作從代碼緩沖器讀出數(shù)據(jù),從而滿足了實時顯示的要求。
所描述的讀/寫操作不僅實時執(zhí)行,而且提供了更高的分辨率。對于三個時鐘周期的每一個從代碼緩沖器22中讀出8位字幕數(shù)據(jù),即每采樣時鐘有24位。當每第四個時鐘周期由電視監(jiān)視器執(zhí)行圖像的顯示時,則是以每個時鐘周期顯示這24個位的四分之一,即(24/4=)6位。就是說,每一字幕圖像單元可包括6個位,它足以充分實現(xiàn)字幕的高清晰度顯示。
代碼緩沖器22的操作以及圖2的相應成分以圖11的方塊圖示出。代碼緩沖器22-1累加字幕數(shù)據(jù)流直到有至少一頁字幕數(shù)據(jù)被累加在代碼緩沖器中為止。當顯示時間標記(PTS)與同步時鐘(SCR)對準時,這一頁的字幕數(shù)據(jù)則從代碼緩沖器22-1轉送到顯示存儲器22-2(它用作一個字幕解碼器的緩沖器)。在指出當前正讀哪一個字幕數(shù)據(jù)地址的讀操作期間,在顯示存儲器22-2中,同步時鐘前進一個指針。將會看到,在單個單元中設置這種代碼緩沖器和顯示存儲器是最佳的,因為這種代碼緩沖器只需增遞1指針在存儲有下一套字幕數(shù)據(jù)的顯示存儲器22-2中指示當前地址。因此,沒有由于傳送所引起的延遲,從而實現(xiàn)字幕數(shù)據(jù)的高速傳輸。
當在普通重放模式中讀代碼緩沖器時,同步時鐘以每個脈沖推進顯示存儲器22-2的指針。然而,在特殊再現(xiàn)模式中(如快進、快倒重放模式中),必須以不同速率來推進指針。首先是將一“特殊”命令送到控制器35,而控制器35再送回一個確認信號(“特殊-確認”),確認將啟動特殊再現(xiàn)。為了根據(jù)特殊再現(xiàn)速率均勻地加速(或減速)字幕解碼器的操作,可借助于添加或減少時鐘脈沖來變換系統(tǒng)時鐘基準(SCR)。減法脈沖是以對應于快進或快倒饋送速率的n倍而產生的。例如,當出現(xiàn)有特殊再現(xiàn)的時候,根據(jù)從代碼緩沖器讀出的字幕數(shù)據(jù)位流以n倍的速率執(zhí)行實時減法,且指針以所希望的速率推進以實現(xiàn)特殊重放模式。
另一方面,當特殊再現(xiàn)操作對應于暫停操作時,不產生減法脈沖。相反,同一幀被連續(xù)地從代碼緩沖器重復讀出,從而提供一個該字幕被暫停的視覺。
當字幕解碼器7判定達到字幕幀的一“頁結束”(EOP)時,就結束讀操作。系統(tǒng)控制器14發(fā)送“重復時間”信號到控制器35,指示一頁的長度,反向行程電路24包括有一個計數(shù)器并當計數(shù)器計數(shù)值達到由“重復時間”信號所指示的值時,發(fā)送一個“顯示結束”信號到控制器。當控制器35確定該重復時間達到時,停止代碼緩沖器的讀操作。為實現(xiàn)本發(fā)明目的,該代碼緩沖器最好至少存儲兩頁字幕數(shù)據(jù),因為當一頁被寫入該代碼緩沖器時,將讀出另一頁。
當代碼緩沖器出現(xiàn)溢出時,控制器35則發(fā)出一個“緩沖器溢出”信號到系統(tǒng)控制器14。在字檢測器20接收關于下一頁的EOP信號以前,當控制器從行程電路24接收“顯示結束”信號時可以確定一個溢出的發(fā)生。此時,系統(tǒng)控制器14將停止從數(shù)據(jù)解碼器和信號分離器1到字檢測器的字幕數(shù)據(jù)傳輸以防止代碼緩沖器的溢出。當溢出狀態(tài)過去之后,下一個數(shù)據(jù)流將被寫入代碼緩沖器并顯示在正確的顯示起始位置。
當代碼緩沖器已完成讀出一整頁的字幕數(shù)據(jù)而又沒有進一步的數(shù)據(jù)存在于該代碼緩沖器中時,就會出現(xiàn)下溢的情況。在圖10中,具有兩頁容量的代碼緩沖器是以“代碼緩沖量”來表示的。以圖示表示,圖10中的下溢是以線(C)延伸到代碼緩沖器下限以下的一個垂直部分表示。與之相對照,當讀入到代碼緩沖器的字幕數(shù)據(jù)太大時,圖10中溢出(上溢)狀態(tài)是以延伸到線(B)之外的線(C)的水平部部分所圖示的。
圖10以作圖方式表示出代碼緩沖器22的數(shù)據(jù)的流入和流出。T軸(橫軸)代表時間,而D軸(縱軸)表示每頁數(shù)據(jù)的數(shù)據(jù)量。因此,梯度(上升/行程)表示流入代碼緩沖器的數(shù)據(jù)流速。曲線(C)表示字幕數(shù)據(jù)的數(shù)據(jù)流。曲線(C)的垂直部分代表當顯示時間標記(PTS)與由字幕解碼器7內部產生的同步時鐘(SCR)對準時從代碼緩沖器來的字幕數(shù)據(jù)的傳送。曲線(C)的水平部分表示進入代碼緩沖器的字幕數(shù)據(jù)的傳送。例如,在由代碼緩沖器接收頁(S0)的顯示時間標記(PTS)之時刻,字幕數(shù)據(jù)的前一頁從代碼緩沖器傳送出且將頁(S0)寫入該代碼緩沖器。當代碼緩沖器接收另一個顯示時間標記(PTS)時,頁(S0)的字幕數(shù)據(jù)從代碼緩沖器傳送出,且將頁(S1)寫入。相似地,余下頁(S2)、(S3)按指示寫入和讀出該代碼緩沖器。
為了精確地把從代碼緩沖器的字幕數(shù)據(jù)的讀出與視頻圖像的顯示定時,必須執(zhí)行延時補償,以實現(xiàn)在字幕解碼器內的延時。在采用外部存儲器作為顯示存儲器的場合這一點尤其重要,因為外部存儲器增加了延遲因素。延時補償是通過控制來自系統(tǒng)控制器14的“解碼啟動”命令的時序來實現(xiàn)的。系統(tǒng)控制器14把“解碼啟動”命令延時等于處理信箱圖像的時間(大約一場),而且,使由在控制器同步時鐘(SCR)瞬時進行的視頻解碼所引起的延時與顯示時間標志(PTS)相對準。延遲補償特別地有用,因為視頻、音頻和字幕數(shù)據(jù)被多路復合的前題是該視頻、音頻和字幕數(shù)據(jù)信號中每一個的解碼延時在數(shù)據(jù)解碼裝置中是零。
在垂直消隱周期(V)內,當一頁的字幕數(shù)據(jù)從顯示存儲器22-2(圖11)中讀出時,該位流的標題由分析程序22-3分離開,并送到反向可變長度編碼器或行程解碼器23、24。該反向VLC(可變長度編碼)電路23(圖2)對字幕數(shù)據(jù)作可變長度解碼。經過可變長度解碼的字幕數(shù)據(jù)包括電平數(shù)據(jù)(“1”或“0”)以及行程數(shù)椐作為成對數(shù)據(jù)。在不采用可變長度解碼情形中,可將該反向VLC電路旁路,并把從代碼緩沖器讀出的字幕數(shù)據(jù)直接輸出到反向行程電路24。通過從若干行程數(shù)據(jù)單元產生出數(shù)據(jù)電平,該反向行程電路24執(zhí)行行程解碼。所以,VLC電路23和行程電路24對已按壓縮數(shù)據(jù)存儲于代碼緩沖器22中的字幕數(shù)據(jù)作解壓縮。
解壓縮的字幕數(shù)據(jù)再被送到3∶4濾波器25。該3∶4濾波器從系統(tǒng)控制器14接收“X擠壓”信號,表示相應電視監(jiān)視器的寬高比。此處的信號指示該監(jiān)視器具有4∶3的寬高比,該3∶4濾波器對字幕數(shù)據(jù)施加3∶4濾波處理,以使字幕的大小與視頻圖像尺寸相匹配。在最佳的實施例中,在H同步脈沖產生以前,控制器35從代碼緩沖器22讀出90個像素的字幕數(shù)據(jù)。在電視監(jiān)視器已經具有16∶9寬高比的情況下,或解壓縮字幕數(shù)據(jù)代表字形的條件下,則該3∶4濾波器如圖11所示被旁路。
彩色查詢表26(CLUT)從3∶4濾波器25接收字幕數(shù)據(jù),并從代碼緩沖器22接收“CLUT_數(shù)據(jù)”。彩色查詢表從“CLUT_數(shù)據(jù)”產生用于字幕數(shù)據(jù)的字幕色彩。該彩色查詢表選擇與每一像素字幕數(shù)據(jù)相對應的地址,并把混合比率K、彩色分量Y(亮度)、CR(色差信號R-Y)和CB(色差信號B-Y)送到混合器34。當彩色分量Y、CR和CB在混合器以混合比率K相混合時,產生具有由彩色查詢表所指示的色彩的像素。
背景視頻數(shù)據(jù)包括在彩色查詢表的排列中。例如,查詢表地址0包括具有00h值的關鍵數(shù)據(jù)K;這表示該字幕數(shù)據(jù)將不被看到,而將顯示背景視頻數(shù)據(jù),如圖5C的T1和T5區(qū)域所示。查詢表的地址1h至6h的地址包括線性增加(20、40......CO,16進制)的關鍵數(shù)據(jù)K的值;這意味著根據(jù)這些地址的字幕數(shù)據(jù)與圖5C的區(qū)域T2和T4所示的背景數(shù)據(jù)相混合。最終,查詢表的地址8h到Fh包括為E0h的關鍵數(shù)據(jù)K值;這就意味著分量Y、Cr和Cb不與圖5C所示區(qū)域T3的任何背景視頻數(shù)據(jù)相混合。彩色查詢表數(shù)據(jù)是從系統(tǒng)控制器產生,并在解碼之前預先向下裝入到CLUT電路。利用該查詢表,經過濾波的字幕數(shù)據(jù)被變換成合適的彩色像素以顯示在電視監(jiān)視器上。
圖6示出了一個彩色查詢表的實例,其中按照地址0......F(16進制)排列有分量Y、Cr、Cb和K。如所解釋的那樣,彩色劃變是通過改變“CLUT_數(shù)據(jù)”而被執(zhí)行的,從而利用彩色劃變查詢表替代該彩色查詢表的部分,如圖9所示。通常,由于一秒鐘電視上的幀要被刷新若干次,所以一個特定字幕幀要被刷新幾次。當這些字幕被刷新時,將采用相同的字幕數(shù)據(jù)。但是由于已改變的彩色查詢表,其色彩將是不同。所以,當對于每個連續(xù)幀對字幕進行刷新,這些字幕將呈現(xiàn)出被作彩色劃變。
混合器34(圖2)把來自彩色查詢表26的像素與來自視頻解碼器3(圖1)的視頻數(shù)據(jù)相混合。所得混合數(shù)據(jù)表示帶有疊加的字幕的視頻圖像,并隨時可輸出到電視監(jiān)視器。混合器34受控將視頻圖像中的字幕定位。通過指定屏幕顯示的垂直位置的控制器35,系統(tǒng)控制器14把一個由操作者指令所產生的“U_位置”信號送到混合器。該“U_位置”值可以(由用戶、發(fā)射器或其它方式)改變,以允許用戶把字幕置于沿垂直軸的任何地方。
本發(fā)明的解碼裝置可以圖4所示的不同信號的參數(shù)實現(xiàn)。但本發(fā)明不局限于圖中所給出的參數(shù),并可用于不同的視頻系統(tǒng)。
利用本發(fā)明,觀看者利用模式顯示裝置9控制字幕的顯示。根據(jù)來自用戶的命令,系統(tǒng)控制器14發(fā)送“控制”信號到混合器34(圖2),接通或關斷字幕。由于本發(fā)明是實時解碼字幕,當接通或關斷字幕時,用戶不經歷任何不愉快的延時。而且,可以由用戶或其它方式控制字幕以可變的速率而被漸顯漸隱。這種效果是通過以一個指定的速度把一個衰減系數(shù)與代表字幕的圖形數(shù)據(jù)相乘而實現(xiàn)的。這種功能還可以使得字幕的編輯者按照音頻/視頻圖像廣播的情況以不同的視覺把字幕展示給觀眾。例如,新聞信息可快速“閃現(xiàn)”,以吸引觀眾的注意力,相反,緩慢音樂圖像中的字幕可“靜靜地”出現(xiàn),以不防礙觀眾享受音樂圖像。
編碼技術現(xiàn)參考圖5a、5b、5c及圖6對本發(fā)明采用的編碼技術作更詳細的描述。作為一個實例,對圖5a編碼一個字母“A”的技術作說明。沿連續(xù)水平行掃描字母“A”并沿水平行產生圖5b所示的字母“A”的填充數(shù)據(jù)。應指出,電平“E0”表示從圖6所示的彩色查詢表再造彩色像素的最高等級,而電平“0”表示沒有字幕數(shù)據(jù)的情況。
關鍵數(shù)據(jù)(K)(即混合比率)確定填充數(shù)據(jù)與背景視頻相混合的程度。
關鍵數(shù)據(jù)的區(qū)域T1和T5對應于不被填充數(shù)據(jù)所疊加的視頻圖像區(qū);因此,這些區(qū)域由圖6中的地址0所指示的級0所表示。區(qū)域T2和T4是混合區(qū)域,其中字幕是逐漸與背景視頻圖像相混合從而使字幕融進背景視頻圖像中而沒有強列的反差。這一區(qū)域的任何填充數(shù)據(jù)都被存入彩色查詢表的地址1至6中。字母“A”的主要部分被顯示在T3區(qū)域中,其中對背景信息進行躁聲抑制。區(qū)域T3中的字幕信息存儲在地址7至F(16進制)。圖6的彩色查詢表是按亮度分量Y的變化程度排列。比如說,當要存儲區(qū)域T3中的像素時,該特定像素的亮度分量Y的級是20(16進制),則對于該像素的彩色信息即從地址9中獲得。以此方式,將字幕字符的其余像素編碼。
編碼裝置本發(fā)明的編碼裝置示于圖7a和b中。音頻和視頻信息分別由麥克風53和攝像機51接收并送到多路復合器58。字幕數(shù)據(jù)經字符發(fā)生器55或飛點掃描器56輸入并由字幕編碼電路57編碼。已編碼的字幕信息送到多路復合器58并與音頻/視頻信息組合,送到記錄光盤91或通道用于發(fā)送、顯示記錄等目的。
攝像機51產生視頻信號并將其送到視頻編碼器單元52,將其從模擬形式轉換成數(shù)字形式。數(shù)字化的視頻信號再被壓縮以作視頻傳輸并送到速率控制器52a,該控制器控制該壓縮視頻數(shù)據(jù)的速率,使之以與字幕送到多路復合器的速率同步地送到該多路復合器。以此種方式,壓縮的視頻數(shù)據(jù)在正確的時間與字幕數(shù)據(jù)相結合。與之類似,由麥克風53獲得的音頻信息在送往多路復合器之前由音頻編碼單元54編碼。音頻編碼單元并不必包括速率控制器,因為該音頻數(shù)據(jù)最終可被記錄在不同的軌道上或經過與視頻數(shù)據(jù)不同通道來發(fā)射。
字幕是由字符發(fā)生器55或是由飛點掃描器56產生。字符發(fā)生器包括監(jiān)視器和允許用戶把字符手動操作地插入視頻圖像的鍵盤。操作者通過用鍵盤鍵入字幕的方法編輯字幕。另一方面,在字幕已經置于外部視頻圖像中的場合提供飛點掃描器56。該飛點掃描器掃描該視頻圖像并確定字幕定位的位置并從其產生相應的字幕數(shù)據(jù)。從飛點掃描器來的字幕由處理電路63作預處理,以使之與由字符發(fā)生器所產生且送到字幕編碼電路的字幕相一致。
來自字符發(fā)生器55或飛點掃描器的字幕數(shù)據(jù)再被選擇以供壓縮。該字符發(fā)生器輸出消隱數(shù)據(jù)、字幕數(shù)據(jù)和關鍵數(shù)據(jù)。字幕數(shù)據(jù)和關鍵數(shù)據(jù)送到開關61,按照預充的時序切換以選擇字幕或關鍵數(shù)據(jù)。被開關61選擇的數(shù)據(jù)由濾波器72所濾波并送到另一個開關62。開關62在來自字符發(fā)生器的消隱數(shù)據(jù)、已濾波數(shù)據(jù)和來自飛點掃描器的已處理數(shù)據(jù)之間切換。當確定沒有字幕存在時,則由開關62選擇消隱數(shù)據(jù)。當有字幕數(shù)據(jù)時,則根據(jù)是哪一個裝置被用于產生字幕數(shù)據(jù)而由開關62在字符發(fā)生器數(shù)據(jù)或飛點掃描器數(shù)據(jù)之間作選擇。
利用基于從字幕緩沖檢驗器68反饋回的數(shù)據(jù)的量化,由量化電路64對開關62所選的數(shù)據(jù)作量化??杀粔嚎s的量化數(shù)據(jù)送到開關69并(在正常操作中)送到差分脈沖編碼調制(DPCM)電路65,以進行脈沖編碼調制。已調制的數(shù)據(jù)由一行程編碼電路66和可變長度編碼電路67作行程編碼和可變長度編碼,并將其送到字幕緩沖檢驗器68以在被送到多路復合器58之前作最終的處理。
字幕緩沖檢驗器68驗證該緩沖器被充分填充數(shù)據(jù)而不溢出。這種驗證是通過把一控制信號(參考圖7A的已濾波信號)饋回量化電路64而實現(xiàn)的??刂菩盘柛淖兞炕娐返牧炕墸纱烁淖兞擞糜谝惶囟ㄗ帜坏木幋a數(shù)據(jù)的量。通過增大量化級,字幕數(shù)據(jù)所需的數(shù)據(jù)量減少并隨即使流向字幕緩沖檢驗器的位速率降低。當該字幕緩沖檢驗器確認出現(xiàn)有數(shù)據(jù)下溢時,控制信號則減小量化級并使從量化電路輸出的數(shù)據(jù)量增加,從而填充字幕緩沖檢驗器。
字幕緩沖檢驗器還負責準備用于傳輸?shù)淖帜粩?shù)據(jù)(例如經電視信號發(fā)射波)。該字幕緩沖檢驗器插入所需信息,以對編碼的字幕數(shù)據(jù)解碼。該信息包括“普通/特殊重放”信號,指出該字幕是否是以普通或特殊(快速進/退)模式記錄的。插入一個“上限值”信號,它指出針對一幀字幕數(shù)據(jù)的存儲器容量的上限值。還插入一“EOP”信號指出字幕數(shù)據(jù)幀的頁結束。插入的“時間碼”信號用于在解碼過程中作為時間標記“PTS”。插入的“字幕編碼信息”還包括在對字幕數(shù)據(jù)進行編碼中所使用的信息,例如量化因子?!岸ㄎ恍畔ⅰ北徊迦?,并在進行解碼時用作“位置數(shù)據(jù)”。被插入的“動態(tài)/靜態(tài)”信號表示該字幕數(shù)據(jù)是靜態(tài)的還是動態(tài)的模式。該字幕緩沖檢驗器還插入彩色查詢表地址,用于傳輸?shù)浇獯a器,以使得顯示的色彩與在產生字幕時采用的色彩相匹配。
字幕緩沖檢驗器最好是與解碼器(圖2)的代碼緩沖器22類似的一個代碼緩沖器。說到低,認為緩沖檢驗器的操作與圖11的代碼緩沖器操作圖相對稱是有益的(即執(zhí)行該代碼緩沖器的相反功能)。比如說,字幕彩色像素被轉換成數(shù)字表示;該數(shù)字字幕由行程編碼器和可變長度編碼器所編碼;加入標題信息,再將得到的字幕信息存儲在緩沖器中并送到多路復合器與音頻和視頻數(shù)據(jù)多路復合。
多路復合器58最好是采用時間分割的多路復合編碼單元將該編碼的字幕數(shù)據(jù)與視頻和音頻數(shù)據(jù)多路復合。該多路復合器還提供糾錯處理(例如糾錯編碼)和調制處理(例如,EFM,8-14調制)。多路復合的數(shù)據(jù)再被(經電視廣播、記錄、或其它傳送措施)發(fā)送到用于解碼及顯示的解碼裝置。
彩色劃變編碼彩色劃變代表一種處理過程,借助該過程使一個圖像,例如字幕,由另一個圖像漸漸地覆蓋。這種彩色劃變的應用的一個例子是醒目顯示,其中字幕的一個幀隨時間的推進從左到右地被動態(tài)地加強顯示。醒目顯示在例如卡拉OK演唱時尤其有用,其中隨著歌詞的演唱把被顯示歌詞從左到右地加強顯示。本發(fā)明是借助在字幕顯示的不同位置改變彩色查詢表來執(zhí)行彩色劃變。例如,開始的字幕幀是用圖6中的標準彩色查詢表產生的。當執(zhí)行彩色劃變時,彩色查詢表被改變成圖9的彩色查詢表。隨著每一幀的推移,彩色查詢表從彩色劃變變成標準彩色查詢的位置的漸變提供出一種字幕從左到右地隨時間動態(tài)改變色彩的感覺。
現(xiàn)來參考圖7a、8a和8b討論彩色劃變的編碼操作。在編碼字幕過程中,操作者可能希望對事先編碼的字幕進行彩色劃變。因此,為操作者配備彩色劃變控制桿以控制彩色劃變,并有一監(jiān)視器84以實時觀察彩色劃變。劃變控制桿連接到一個適配器82,以將劃變控制桿的模擬電壓與數(shù)字脈沖字幕相適配,以實現(xiàn)數(shù)字操作。適配器的數(shù)字輸出饋送到轉換器83和劃變數(shù)據(jù)取樣器70。轉換器把彩色查詢表切換到由劃變桿位置所代表的值,并產生用于在監(jiān)視器上顯示的字幕彩色像素。所以,操作者可在進行彩色劃變的同時對其過程進行查看,并調節(jié)劃變的速度和色彩使之令人滿意。
劃變數(shù)據(jù)取樣器和位置取樣器70從適配器信號確定在視頻圖像中該彩色查詢表開始改變的位置,并將該信息輸出到(經開關69)編碼電路65、66和67,以進行編碼,并發(fā)送到多路復合器58,圖8a和8b示出了劃變數(shù)據(jù)和位置取樣器操作的方塊圖。比較器把由適配器產生的當前像素信號與來自適配器的先前像素信號相比較。這種比較是通過把當前像素值傳送到比較器301的輸入端A而同時把鎖存在寄存器300中的先前像素值送到比較器301的輸入端B實現(xiàn)的。當目前的和先前的像素具有相同值且計數(shù)器遞增一計數(shù)值時,該比較器輸出一個布爾邏輯“真”值到計數(shù)器302(它以每一水平或垂直同步脈沖復位)。就是說,當從同一彩色查詢表產生上升直到該位置的像素時,比較器寄存一個真實條件。因此,在彩色查詢表改變的位置當前和先前像素變?yōu)椴幌嗤?即它們色彩改變)且比較器產生“假”的布爾邏輯條件。因而計數(shù)值等于當前和先前值之間匹配的數(shù)目,它與該彩色查詢表改變的位置的值是同一值。在下一垂直同步脈沖出現(xiàn)時將該計數(shù)值鎖存于寄存器303,并傳送到編碼電路(經開關69),以便發(fā)送。
彩色劃變解碼現(xiàn)參考圖12a-12c和圖13討論彩色劃變解碼。圖12a示出彩色查詢表在點A從彩色劃變查詢表(圖9)切換到標準彩色查詢表(圖6)的位置。圖12b描繪了一個字幕方案以及以顯示時間標記(PTS(n)......PTS(n+t))的離散塊排列的彩色劃變數(shù)據(jù)。第一個顯示時間標記PTS(n)對應于普通字幕數(shù)據(jù)而其余的顯示時間標記PTS(n+1......n+t)對應于彩色劃變數(shù)據(jù)(WPA......WPZ)。圖12c示出對應于顯示時間標記的連續(xù)幀(n.......n+t)。為執(zhí)行彩色劃變,每一連續(xù)彩色劃變幀(WPA......WPZ)都設置一個彩色查詢表進一步沿所顯示的字幕被切換的位置(點A)。從而作為時間的函數(shù)而動態(tài)地執(zhí)行彩色劃變。
彩色劃變解碼的操作方塊圖示于圖13。垂直同步脈沖觸發(fā)一個寄存器205以鎖存當前的字幕幀(圖13表示正被鎖存的彩色劃變幀WP)。由寄存器鎖存的彩色劃變數(shù)據(jù)指示彩色查詢表切換的位置。像素計數(shù)器在每一水平同步脈沖遞減由彩色劃變數(shù)據(jù)所指示的值,并輸出一個布爾邏輯的“真”標志到彩色查詢表26。在標志是“真”的同時,彩色查詢表采用彩色劃變表(圖9)以對字幕像素的色彩解碼。當像素計數(shù)器達到零時,即達到彩色查詢表進行切換的位置,且像素計數(shù)器發(fā)出一個布爾邏輯“假”標志到彩色查詢表26。此時,彩色查詢表把彩色劃變查詢表(圖9)切換到標準的查詢表(圖6),且該字幕幀的余部以標準色模式顯示。每個連續(xù)的彩色劃變幀(WPA......WPZ)移動著切換位置;所以,每一刷新的字幕幀都推進(或后退)彩色劃變,從而執(zhí)行動態(tài)彩色劃變。
圖9的彩色劃變查詢表結合了兩套色彩(一套是從地址0h到7h,第二套是從8h-Fh)。所以,可以通過簡單地改變彩色查詢表地址的最高有效位(MSB)可把彩色劃變轉變到第二種色彩。例如,彩色劃變的第一套色彩有“0”的MSB,而第二套有“1”的MSB。改變地址7h的MSB為“1”轉換該地址到Fh且以彩色劃變色彩改變。舉例而言,這一點可借助設置MSB等于像素計數(shù)器208的標志來實現(xiàn)。
采用MSB在兩套彩色間變換具有的優(yōu)點是減少了需要被編碼的位數(shù)。由于MSB已知,在每個像素要用4位的時候,就只有三個較低階的位需要被編碼。在每像素只用兩個位的場合,字幕數(shù)據(jù)的編碼只是針對最低有效位。在每兩個像素4位的格式中,只有MSB被用于彩色控制而其余的三個位可省下來用作像素信息。所以,借助采用MSB可使被編碼的位數(shù)減少,而且用于編碼和解碼的總的處理時間被優(yōu)化。
動態(tài)字幕定位采且上述關于彩色劃變的類似技術,可將字幕作為時間的函數(shù)而動態(tài)地重新定位。如圖14a-C所示,位置數(shù)據(jù)是沿水平軸(圖14a)測出的,并在對應于顯示時間標記(例如圖14b的“PTS(n)”)的適當幀(圖14C)期間,連同字幕數(shù)據(jù)一道送到字幕解碼器。
現(xiàn)參考圖15來說明定位操作。位置數(shù)據(jù)是代表沿水平軸的字幕幀的位置值,它是從顯示緩沖器讀出并根據(jù)每一個垂直同步脈沖鎖存在寄存器205中。像素計數(shù)器208按每一水平同步脈沖遞減位置數(shù)據(jù)并發(fā)送布爾邏輯標志到控制器35(圖2和圖15)以指示還沒有達到字幕幀的位置。當像素計數(shù)器達到零時,則字幕幀的位置已經達到并觸發(fā)布爾邏輯標記以將此情況通知控制器。已經延遲代碼緩沖器22(圖2)讀操作的控制器則使得該代碼緩沖器把字幕數(shù)據(jù)讀出到行程解碼器(圖2)。字幕數(shù)據(jù)再按上述方式解碼并以對應的視頻圖像顯示。以此方式,字幕幀的位置隨每一幀而變,從而提供了字幕幀的動態(tài)移動。
因此,本發(fā)明提供了字幕彩色劃變及動態(tài)定位。由于字幕是與音頻/視頻數(shù)據(jù)相分離地實時編碼及解碼,所以能以大的靈活性對字幕加以控制。例如,在卡拉OK中,當希望測試演唱者的歌唱技能時,字幕可在任何時刻并即時地關斷。字幕的彩色劃變和動態(tài)定位也可以實時執(zhí)行,使操作者能以批量方式快而易地產生視頻圖像。而且,彩色劃變和動態(tài)定位的結果可被操作者即時觀察,并調節(jié)至滿意,提供了每一音頻/視頻圖像的剪輯方便。
可以理解,本發(fā)明可應用于其它的應用場合,例如電視或視頻圖形技術。因而應當明白,在所附權利要求的范圍內,本發(fā)明可以不同于說明書所述的方式來實現(xiàn)。
權利要求
1.一種解碼設備,用于至少對字幕數(shù)據(jù)和視頻數(shù)據(jù)進行解碼,所述字幕數(shù)據(jù)至少具有顯示時間數(shù)據(jù)、位置數(shù)據(jù)和顏色信息數(shù)據(jù),所述解碼設備包括視頻解碼器(3),用于對要顯示的視頻數(shù)據(jù)進行解碼;字幕解碼器(7),用于對要顯示的字幕數(shù)據(jù)進行解碼;混合器(34),用于將所述被解碼的字幕數(shù)據(jù)疊加到所述被解碼的視頻數(shù)據(jù)中;以及控制器(34),用于基于所述顯示時間數(shù)據(jù)、所述位置數(shù)據(jù)和顏色信息數(shù)據(jù),而控制所述疊加字幕數(shù)據(jù)的顯示時間、顯示位置和顯示顏色。
2.如權利要求1所述的解碼設備,其中,所述混合器按每1幀來處理所述疊加過程。
3.一種解碼方法,用于至少對字幕數(shù)據(jù)和視頻數(shù)據(jù)進行解碼,所述字幕數(shù)據(jù)至少具有顯示時間數(shù)據(jù)、位置數(shù)據(jù)和顏色信息數(shù)據(jù),所述解碼方法包括以下步驟對要顯示的視頻數(shù)據(jù)進行解碼;對要顯示的字幕數(shù)據(jù)進行解碼;將所述被解碼的字幕數(shù)據(jù)疊加到所述被解碼的視頻數(shù)據(jù)中;以及其中,在進行所述疊加步驟時,基于所述顯示時間數(shù)據(jù)、所述位置數(shù)據(jù)和顏色信息數(shù)據(jù),而控制所述疊加字幕數(shù)據(jù)。
4.一種編碼設備,用于至少對字幕數(shù)據(jù)和視頻數(shù)據(jù)進行編碼,所述編碼設備包括視頻編碼器(52),用于對視頻數(shù)據(jù)進行編碼;字幕編碼器(57),用于至少通過顯示時間數(shù)據(jù)、位置數(shù)據(jù)和顏色信息數(shù)據(jù),而對字幕數(shù)據(jù)進行編碼,以供在將所述字幕數(shù)據(jù)疊加到所述視頻數(shù)據(jù)中時使用;多路復合器(58),用于至少對所述被編碼的字幕數(shù)據(jù)和所述被編碼的視頻數(shù)據(jù)進行多路復合。
5.一種編碼方法,用于至少對字幕數(shù)據(jù)和視頻數(shù)據(jù)進行編碼,所述編碼方法包括以下步驟對視頻數(shù)據(jù)進行編碼;至少通過顯示時間數(shù)據(jù)、位置數(shù)據(jù)和顏色信息數(shù)據(jù),而對字幕數(shù)據(jù)進行編碼,以供在將所述字幕數(shù)據(jù)疊加到所述視頻數(shù)據(jù)中時使用;至少對所述被編碼的字幕數(shù)據(jù)和所述被編碼的視頻數(shù)據(jù)進行多路復合。
全文摘要
通過獨立于視頻圖像對字幕編碼和解碼實現(xiàn)字幕彩色劃變及動態(tài)定位。在編碼器產生各相應視頻圖像的字幕。改變圖像中一定位置字幕色彩執(zhí)行彩色劃變。在解碼器,緩沖器存儲伴有字幕解碼信息的字幕??刂破骶_定時緩沖器讀操作以在圖像實時顯示期間讀出字幕;改變字幕解碼信息指示位置處字幕的部分色彩執(zhí)行彩色劃變。延遲控制器執(zhí)行讀出操作的時間實現(xiàn)字幕動態(tài)定位。當對若干幀重復此解碼技術時,觀眾感受到隨彩色劃變和定位的漸變的移動。
文檔編號H04N7/24GK1770827SQ20051011873
公開日2006年5月10日 申請日期1996年4月3日 優(yōu)先權日1995年4月3日
發(fā)明者塚越郁夫 申請人:索尼公司