專利名稱:伴隨發(fā)音顯示字幕的方法及其裝置的制作方法
技術領域:
本發(fā)明涉及一種伴隨發(fā)音顯示字幕的方法及其裝置,特別是一種適用于對字幕顯示操作的技術領域中,依據(jù)每個單字中字符的發(fā)音長度,加以計算每個單字的顯示速度,再對每個單字以各自的顯示速度進行顯示操作的方法。
目前,在一些娛樂或?qū)W習的光盤或軟件產(chǎn)品中,經(jīng)常需要一種讓使用者一邊伴隨圖像、聲音等媒體的播放,一邊對字幕進行跟讀、跟錄的功能。在跟讀、跟錄的同時需要對字幕進行變色掃描,以引導使用者讀出正確的語速。
而在一些多媒體教學光盤產(chǎn)品(如BBC英語)中,所使用的方法是對每一字幕進行等速掃描,即按字幕中每個單字的顯示長度(或字母個數(shù))來平均分配掃描時間,比如掃描字幕“This is abook”假設整句發(fā)音即掃描時間是1秒,因此句共有11個字母,若按上述掃描方法,則每個字母分配的掃描時間是1/11秒,因此“This”這個單字的掃描時間是1/11×4=4/11秒,同理,“is”、“a”、“book”的掃描速度分別是2/11秒、1/11秒、4/11秒,由此可看出“This”與“a”的掃描時間之比為4∶1,很明顯地,這兩個單字的實際發(fā)音時間長度并沒有如此大的差距,按這種速度跟讀會覺得“This”太長,而“a”太短。
因此這種方法的缺點是掃描速度與自然語速(實際發(fā)音速度)不一致,導致使用者不能按正確語速跟讀字幕。
為了改善上述的缺點,已知需使用人工編輯方式,亦即由人工聽著字幕發(fā)音逐句進行控制并記錄變色的掃描速度,并且每一句字幕都要經(jīng)過反復調(diào)整,才能使掃描進度與自然語速相同,但很明顯地,此種工作非常繁雜且工作量大。
因此,本發(fā)明的主要目的在于提供一種可以伴隨發(fā)音顯示字幕的方法,本發(fā)明所揭露的方法可以自動調(diào)整掃描速度與節(jié)奏(亦即是前述的顯示操作速度),同時也可以引導使用者跟隨字幕的掃描速度而以自然語速進行跟讀或跟唱,可以改善公知的使用人工編輯的變色掃描方式,需花費相當多的時間在調(diào)整掃描速度的不便。
根據(jù)本發(fā)明的技術,其中揭露了一種可根據(jù)每一字幕中的字符,如可為英文、中文或其它語言的字符的發(fā)音長度來決定顯示的操作內(nèi)容,如變色或跳現(xiàn),以達到自動調(diào)整顯示操作的速度與節(jié)奏的技術。本發(fā)明所提供的伴隨發(fā)音顯示字幕的方法包含(1)存儲一字幕庫、一字典庫以及一字符的發(fā)音長度表至一存儲單元中;(2)判斷當前的時間是否大于等于某一該字幕段落的起始播放時間,若為是,進行下一步驟,若為否,則繼續(xù)執(zhí)行此步驟;(3)顯示該字幕段落于一顯示單元;(4)依照該字幕段落中每個單字所含的字符從該字符發(fā)音長度表中查出相應的發(fā)音長度,再配合其它字幕段落的相關數(shù)據(jù),計算出字幕段落中每個單字的顯示操作速度;(5)通過一顯示單元對該字幕段落中的每個單字依其各自的發(fā)音速度進行顯示操作;以及(6)判斷該字幕段落是否為最后的字幕段落,若為是,則結束作業(yè),若為否,則返回至步驟(2)。而本發(fā)明所揭露的裝置,包括有提供一存儲單元,其中存儲有字幕的相關數(shù)據(jù)(包括有每一字幕段落中的句子、單字、及其相應的發(fā)音符號、每一字幕段落的起始播放時間以及結束播放時間值)以及一字符的發(fā)音長度表,例如英文字母發(fā)音長度表,提供一邏輯處理單元,用以在未進行掃描之前,依照該字幕段落中每個單字(是由一個以上的字符所組成)從一字符的發(fā)音長度表中查出相應的發(fā)音長度單位數(shù),再配合其它字幕的相關數(shù)據(jù),而計算出字幕中每個單字的顯示操作速度,通過控制一顯示單元對字幕中的每個單字依其各自的發(fā)音速度進行顯示操作,如變色或跳現(xiàn)處理。
為使本發(fā)明的上述和其他目的、特征和優(yōu)點能更明顯易懂,下文特舉一較佳實施例,并配合附圖,作詳細說明如下
圖1,為本發(fā)明的伴隨發(fā)音顯示字幕的裝置的第一實施例方塊圖。
圖2,為本發(fā)明的伴隨發(fā)音顯示字幕的裝置第一實施例增加單元后的方塊圖。
圖3,為本發(fā)明的伴隨發(fā)音顯示字幕的方法的運作流程圖。
圖4,顯示尚未對“This is a book”此字幕段落進行變色掃描。
圖5,顯示正在對“book”這個單字進行掃描。
圖6,顯示已對“This is a book”此字幕段落進行完變色掃描。
對有關下文說明中的名詞意義說明如下像素點為熒光屏中構成圖像的最小單位;單字的顯示長度是指單字在熒光屏上的顯示長度,其以像素點(pixel)為單位;掃描速度其單位為毫秒/像素點(毫秒/pixel),是指每掃描一個像素點所花費的時間。
參照圖1,其中揭露實現(xiàn)本發(fā)明方法的裝置,其包括有一存儲單元10,用以存儲字幕的相關數(shù)據(jù),其中字幕可為英文、中文或是其它語言的字幕,而在本發(fā)明所揭露的實施例中則以英文字幕為例說明,至于其它語言字幕的實施手段則與英文相類似,在此不另外多加詳談,在本實施例中將英文字幕的相關數(shù)據(jù)分別存儲成三個數(shù)據(jù)庫,分別是一字幕庫,如表1所示,其中包含字幕段落中的英文句以及每一字幕段落的起始播放時間、結束播放時間;一字典庫,如表2所示,其中包含字幕段落中的英文單字及相對應的音標;以及一英文母音發(fā)音長度表,如表3所示,其中包括所有英文母音的發(fā)音長度單位數(shù),而關于英文母音的發(fā)音長度單位數(shù)制定規(guī)則是以母音[I]的發(fā)音長度為對比標準,將其定為1個發(fā)音長度單位(也可定為其它數(shù)值),再對其它母音的發(fā)音長度進行測量并與[I]的發(fā)音長度進行比較,則可以得到其它母音的發(fā)音長度數(shù),當然在此并不限于一定要以母音[I]為對比標準,也可以其它母音為對比標準,至于是那一個母音,則視使用者而定。
表1
表2
表3
一邏輯處理單元30,用以從該存儲單元10中提取數(shù)據(jù)并依本發(fā)明所揭露的方法計算每個單字(是由一個以上的英文字母所組成者)的顯示操作速度;一顯示單元40,可為熒光屏,液晶熒光屏,觸控式熒光屏或是其他功能類似之一者,用以對各個單字以各自的發(fā)音速度進行顯示操作(可為變色或跳現(xiàn)處理)。
當然在上述的裝置中還可增加一些單元,以提升本發(fā)明的優(yōu)點,例如可設置一輸出單元50,用以在顯示單元40對字幕進行顯示操作的同時,輸出相對應的讀音,以教導使用者讀出正確的讀音;或是設置一內(nèi)存存儲單元60,用以儲存顯示單元40已進行顯示操作的字幕段落的相關數(shù)據(jù),以更增加邏輯處理單元30提取數(shù)據(jù)的速度,如圖2所示。
另外,若是為了要增加視覺或聽覺效果,可在存儲單元10中存儲一MPEG(Movie Picture Expert Group,一種圖像壓縮格式標準)圖像媒體,由顯示單元40或輸出單元50顯示或輸出相對應的圖像或聲音,以當成導引畫面或背景音樂。
現(xiàn)以圖1的裝置,再結合圖3的流程圖來說明其中整個裝置的運作情形步驟1程序開始步驟2將一字幕庫、一字典庫以及一字符的發(fā)音長度表(如英文母音的發(fā)音長度表)存儲至一存儲單元中,將當前字幕段落號N設為1,其中若是在存儲單元中有存儲MPEG圖像媒體時,可以在此開始播放媒體;步驟3邏輯處理單元會開始不停地將當前的時間與存儲單元中每一字幕段落的起始播放時間相對比,若是當前時間大于等于(>=)某一字幕段落的起始播放時間,則進行下一步驟,反之,則繼續(xù)執(zhí)行步驟3;其中在此若有播放MPEG圖像媒體時,邏輯處理單元會依照當前的播放時間與存儲單元中每一字幕段落的起始時間相對比,以判斷媒體播放時間是否大于等于(>=)其中一字幕段落的起始時間,若為是,進行下一步驟,若為否,則繼續(xù)執(zhí)行此步驟3;步驟4顯示單元會顯示該字幕段落中所有的字符;步驟5邏輯處理單元會依照該字幕段落中每個單字(由一個以上的字符所組成)從一字符的發(fā)音長度表中查出相應的發(fā)音長度,再配合其它字幕段落的相關數(shù)據(jù)(例如字幕庫、字典庫的數(shù)據(jù)),從而計算出字幕段落中每個單字的顯示操作速度;步驟6顯示單元會對該字幕段落中每個單字以各自的發(fā)音速度進行顯示操作,此時如果有輸出單元,則此輸出單元會在顯示單元進行顯示操作的同時播出相對應的讀音或音樂;步驟7邏輯處理單元會判斷該字幕段落是否為最后的字幕段落,若為是,則執(zhí)行步驟9,若為否,則繼續(xù)下一步驟;步驟8將字幕段落號N+1=2,回到步驟3;步驟9結束。
其中關于步驟5從一字符的發(fā)音長度表計算每個單字的顯示操作速度的詳細步驟流程如下所述其中為了便于了解下述公式的解釋,現(xiàn)將有關的符號作一解釋說明C字幕段落的播放時間B字幕段落的起始播放時間S字幕段落的播放長度E字幕段落播放的結束播放時間A該字幕段落中所有單字的發(fā)音長度單位個數(shù)之和A1第1個單字的發(fā)音長度單位數(shù)A2第2個單字的發(fā)音長度單位數(shù)A3第3個單字的發(fā)音長度單位數(shù)An第n個單字的發(fā)音長度單位數(shù)t該字幕段落中一個字符發(fā)音長度單位的時間長度t1第1個單字的顯示操作時間t2第2個單字的顯示操作時間t3第3個單字的顯示操作時間tn第n個單字的顯示操作時間
l1第1個單字的顯示長度l2第2個單字的顯示長度l3第3個單字的顯示長度ln第n個單字的顯示長度V1第1個單字的顯示操作速度V2第2個單字的顯示操作速度V3第3個單字的顯示操作速度Vn第n個單字的顯示操作速度步驟1計算該字幕段落的播放長度(S),其計算公式為S=E-B步驟2依照字符的發(fā)音長度表計算該字幕段落所有單字的發(fā)音長度單位個數(shù)之和(A),此系由字典庫中找到每個單字的發(fā)音符號,統(tǒng)計其包含的發(fā)音符號種類、數(shù)量,然后通過查找字符的發(fā)音長度表計算其所包含的單字發(fā)音長度單位個數(shù),其計算公式為A=A1+A2+A3+……+An;步驟3計算該字幕段落中一個字符發(fā)音長度單位的時間長度(t),其計算公式為t=S/A;步驟4計算該字幕段落中每個單字的顯示操作時間;其計算公式為t1=A1×tt2=A2×tt3=A3×ttn=An×t步驟5計算該字幕段落中每個單字的顯示操作速度,其計算公式為V1=l1/t1V2=l2/t2V3=l3/t3Vn=ln/tn。
其中每個單字顯示長度(11、12、13…1n)是與顯示單元的解析度有關,因此可直接由顯示單元的內(nèi)部設定得知。
為了要更清楚說明上述的計算過程,現(xiàn)以一實施例來加以說明,假設邏輯處理單元判斷當前的時間>=“This is a book”這一字幕段落的起始時間,則代表要對“This is a book”這一字幕段落進行顯示操作(在此是變色掃描),首先邏輯處理單元會從表1中找尋此字幕段落的起始播放時間與結束播放時間,如表1所示,此字幕段落預定開始播出的時間為第15秒(其中前15秒可能為播放另一字幕段落,或是背景音樂等引導畫面),結束時間為第16.5秒,此時在第15秒時,顯示單元會先在熒光屏上顯示此字幕段落中的所有單字,其中為了要讓后續(xù)的變色掃描過程能更明顯,在此是以較暗的顏色來顯示該字幕段落,如圖4所示,而開始掃描之前,需先計算每一單字的掃描速度,依照上述的計算方法,其演算步驟如下1、此字幕段落的播放長度(S)=16.5-15=1.5秒;2、在“This is a book”此字幕段落中共有4個單字,由表2中查到它們所含的發(fā)音符號(在此則以母音為主)分別為IIu,由表3可找出相對應的發(fā)音長度單位個數(shù)分別是1、1、1、1.5,因此該字幕段落所有單字母音長度單位個數(shù)之和(A)=1+1+1+1.5=4.5;3、此字幕段落中一個母音長度單位的時間長度(t)=S/A=1.5/4.5=0.33秒;4、該字幕段落中每個單字的掃描時間This掃描時間(t1)=1×0.33=0.33秒;is掃描時間(t2)=1×0.33=0.33秒;a掃描時間(t3)=1×0.33=0.33秒;book掃描時間(t4)=1.5×0.33=0.5秒;5、每個單字的顯示長度分別為This11=20個像素點;is12=10個像素點;a13=5個像素點;book14=20個像素點;因此每個單字的掃描速度分別為ThisV1=20/0.33=像素點/16.5毫秒;isV2=10/0.33=像素點/33毫秒;aV3=5/0.33=像素點/66毫秒;以及bookV4=20/0.5=像素點/25毫秒。
根據(jù)計算得到的掃描速度,顯示單元會分別以每16.5、33、66、25毫秒掃描一個像素點的速度對每個單字進行逐點掃描,其掃描過程如圖4、5、6所示,其中尚未進行變色掃描之時,顯示單元會以暗色顯示將“This isa book”此字幕段落顯示,如圖4所示,而進行變色掃描時會以較亮的顏色依續(xù)對每個單字掃描一次,如圖5所示,顯示單元已分別以每16.5、33、66毫秒掃描一個像素點的速度對“This”、“is”、“a”這三個單字進行變色掃描完畢,現(xiàn)正以25毫秒掃描一個像素點的速度掃描“book”這個單字,圖6則表示“book”這個單字已變色掃描完畢,亦即這一字幕段落的變色掃描過程已完全進行完畢。
其中在上述掃描過程中,若是有設置一輸出單元時,可由此輸出單元在顯示單元依序掃描“This”、“is”、“a”、“book”的同時輸出相對應的讀音。
其中若在“This is a book”此字幕段落后尚還有“That is a pencil”這一字幕段落,如表1所示時,系統(tǒng)會根據(jù)此字幕段落的數(shù)據(jù),再重復以上的記算方式與掃描方式,直到最后一個字幕段落為止。
當然上述的變色掃描方式只是其中一種顯示操作方式,使用者端可視其需求,而改以其它的顯示操作方式代替,例如跳線或是其它的操作方式。
依照本發(fā)明的計算掃描速度的方法,可以自動調(diào)整字符字幕的掃描速度與節(jié)奏,以達到與自然語音一致的效果,可以省掉大量的編輯工作與時間。
同時,依照本發(fā)明的變色掃描方式,可以引導使用者跟隨字幕的掃描速度而以自然語速進行跟讀或跟唱。
雖然本發(fā)明所揭露的實施例是對英文字幕進行顯示操作,但這并不代表本發(fā)明的技術只能針對英文字幕,其它例如中文、日文或是其它的語言也都是可以實施,只要依照本發(fā)明所揭露的技術,再針對所選用的字幕種類,例如中文或日文,在實施方法上做些小修改,都可以實施,因此本發(fā)明的保護范圍應當以權利要求所界定的范圍為準。
權利要求
1.一種伴隨發(fā)音顯示字幕的方法,用以將當前顯示于顯示單元的字幕,按其中所含字符的發(fā)音速度控制其顯示的操作內(nèi)容,包含(1)存儲一字幕庫、一字典庫以及一字符的發(fā)音長度表至一存儲單元中;(2)判斷當前的時間是否大于等于某一該字幕段落的起始播放時間,若為是,進行下一步驟,若為否,則繼續(xù)執(zhí)行此步驟;(3)顯示該字幕段落于一顯示單元;(4)依照該字幕段落中每個單字所含的字符從該字符發(fā)音長度表中查出相應的發(fā)音長度,再配合其它字幕段落的相關數(shù)據(jù),計算出字幕段落中每個單字的顯示操作速度;(5)通過一顯示單元對該字幕段落中的每個單字依其各自的發(fā)音速度進行顯示操作;以及(6)判斷該字幕段落是否為最后的字幕段落,若為是,則結束作業(yè),若為否,則返回至步驟(2)。
2.如權利要求1所述的伴隨發(fā)音顯示字幕的方法,其中該顯示單元的顯示操作為對該字幕進行變色或跳現(xiàn)處理。
3.如權利要求1所述的伴隨發(fā)音顯示字幕的方法,其中該字符可為英文字符。
4.如權利要求1所述的伴隨發(fā)音顯示字幕的方法,其中該字符的發(fā)音長度表可為一英文母音發(fā)音長度表。
5.如權利要求1所述的伴隨發(fā)音顯示字幕的方法,其中取得該顯示速度的計算方法包括有a.取得該字幕段落的播放長度;b.取得該字幕段落所有該字符的發(fā)音長度單位個數(shù)之和;c.取得該字幕段落中一個字符發(fā)音長度單位的時間長度;d.取得該字幕段落中每個單字的顯示時間;以及e.取得該字幕段落中每個單字的該顯示操作速度。
6.如權利要求1所述的伴隨發(fā)音顯示字幕的方法,其中該字幕庫包含每一字幕段落中的句子以及每一字幕段落的起始播放時間與結束播放時間值。
7.如權利要求1所述的伴隨發(fā)音顯示字幕的方法,其中該字典庫包含每一字幕段落中的所有單字及相對應的發(fā)音符號。
8.如權利要求1所述的伴隨發(fā)音顯示字幕的方法,其中該字符的發(fā)音長度表中包括所有字符的發(fā)音長度單位數(shù)。
9.如權利要求8所述的伴隨發(fā)音顯示字幕的方法,其中該字符的發(fā)音長度表是由下列方法完成的,包括有A、選擇其中一個字符的發(fā)音長度設定為一標準值;以及B、對其它字符的發(fā)音長度進行測量并與該標準值的發(fā)音長度進行比較,并記錄其它字符的發(fā)音長度值。
10.一種伴隨發(fā)音顯示字幕的方法,用以將當前顯示于顯示單元的字幕,按其中所含字符的發(fā)音速度控制其顯示的操作內(nèi)容,該方法包括(1)依照該字幕段落中每個單字所含的字符從一字符的發(fā)音長度表中查出相應的發(fā)音長度單位數(shù),再配合其它字幕的相關數(shù)據(jù),從而計算出字幕中每個單字的顯示操作速度;以及(2)通過一顯示單元對該字幕段落中的每個單字依其各自的發(fā)音速度進行該顯示操作。
11.如權利要求10所述的伴隨發(fā)音顯示字幕的方法,其中該字符可為英文字符。
12.如權利要求10所述的伴隨發(fā)音顯示字幕的方法,其中該字符的發(fā)音長度表可為一英文母音發(fā)音長度表。
13.如權利要求10所述的伴隨發(fā)音顯示字幕的方法,其中該顯示單元的顯示操作可為對該字幕進行變色或跳現(xiàn)處理。
14.如權利要求10所述的伴隨發(fā)音顯示字幕的方法,其中該字符的發(fā)音長度表中包括所有字符的發(fā)音長度單位數(shù)。
15.如權利要求14所述的伴隨發(fā)音顯示字幕的方法,其中該字符的發(fā)音長度表是由下列方法完成的,包括有A、選擇其中一個字符的發(fā)音長度設定為一標準值;以及B、對其它字符的發(fā)音長度進行測量并與該標準值的發(fā)音長度進行比較,并記錄其它字符的發(fā)音長度值。
16.如權利要求10所述的伴隨發(fā)音顯示字幕的方法,其中取得該顯示速度的計算方法包括有a、取得該字幕段落的播放長度;b、取得該字幕段落所有該字符的發(fā)音長度單位個數(shù)之和;c、取得該字幕段落中一個字符發(fā)音長度單位的時間長度;d、取得該字幕段落中每個單字的顯示操作時間;以及e、取得該字幕段落中每個單字的該顯示操作速度。
17.一種伴隨發(fā)音顯示字幕的裝置,用以將當前顯示于顯示單元的字幕,按其中包含字符的發(fā)音速度控制其顯示的操作內(nèi)容,其中該裝置包括有一存儲單元,用以存儲該字幕的相關數(shù)據(jù),其中至少包括一字幕庫、一字典庫以及一字符的發(fā)音長度表;一邏輯處理單元,用以計算該字幕段落中每個單字的顯示操作速度,以及一顯示單元,用以對該字幕段落中的每個單字依其各自的發(fā)音速度進行顯示操作。
18.如權利要求17所述的伴隨發(fā)音顯示字幕的裝置,其中該字符可為英文字符。
19.如權利要求17所述的伴隨發(fā)音顯示字幕的裝置,其中該字符的發(fā)音長度表可為一英文母音發(fā)音長度表。
20.如權利要求17所述的伴隨發(fā)音顯示字幕的裝置,其中該字幕庫包含每一字幕段落中的句子以及每一字幕段落的起始播放時間與結束播放時間。
21.如權利要求17所述的伴隨發(fā)音顯示字幕的裝置,其中該字典庫包含每一字幕段落中的所有單字及其相應的發(fā)音符號。
22.如權利要求17所述的伴隨發(fā)音顯示字幕的裝置,其中該字符的發(fā)音長度表中包括所有字符的發(fā)音長度單位數(shù)。
23.如權利要求22所述的伴隨發(fā)音顯示字幕的裝置,其中該字符的發(fā)音長度表系藉由下列步驟完成的,包括有A、選擇其中一個字符的發(fā)音長度設定為一標準值;以及B、對其它字符的發(fā)音長度進行測量并與該標準值的發(fā)音長度進行比較,并記錄其它字符的發(fā)音長度值。
24.如權利要求17所述的伴隨發(fā)音顯示字幕的裝置,其中該裝置還可包含一輸出單元,用以在該顯示單元對字幕進行顯示操作的同時,輸出相對應的讀音。
25.如權利要求17所述的伴隨發(fā)音顯示字幕的裝置,其中該裝置還可包括一內(nèi)存存儲單元,用以存儲已顯示的該字幕字幕段落的相關數(shù)據(jù)。
26.如權利要求17所述的伴隨發(fā)音顯示字幕的裝置,其中該顯示單元可為熒光屏,液晶熒光屏,觸控式熒光屏或是其他功能類似者。
全文摘要
一種伴隨發(fā)音顯示字幕的方法及其裝置,可根據(jù)每一字幕段落中字符發(fā)音長度決定字符顯示操作內(nèi)容,以達到自動調(diào)整顯示操作的速度與節(jié)奏;該裝置包括:存儲單元,存儲有字幕的相關數(shù)據(jù)及字符發(fā)音長度表,邏輯處理單元,用以在未進行掃描前,相應于每一字符發(fā)音長度表中查出相應于目前顯示字符發(fā)音長度,配合其它字幕的相關數(shù)據(jù),計算字幕中每個單字的顯示操作速度,通過顯示單元對字幕中的每個單字依其發(fā)音速度進行顯示操作。
文檔編號G09B19/00GK1274141SQ9910660
公開日2000年11月22日 申請日期1999年5月14日 優(yōu)先權日1999年5月14日
發(fā)明者段劍雄, 宋建福, 林光信 申請人:英業(yè)達股份有限公司