視頻語言翻譯方法、系統(tǒng)及智能顯示設(shè)備的制作方法
【專利摘要】本發(fā)明公開了一種視頻語言翻譯方法、系統(tǒng)及智能顯示設(shè)備。本發(fā)明的視頻語言翻譯方法包括以下步驟:獲取當(dāng)前視頻,當(dāng)前視頻包括當(dāng)前圖像幀和/或當(dāng)前語音;自動獲取目標(biāo)語言;對當(dāng)前視頻進(jìn)行文字識別和/或語音識別,在識別結(jié)果為符合目標(biāo)語言時播送視頻;將當(dāng)前圖像幀中的文字和/或當(dāng)前語音翻譯為目標(biāo)語言,并將翻譯結(jié)果添加至當(dāng)前視頻中;播放視頻。本發(fā)明的視頻語言翻譯方法、系統(tǒng)及智能顯示設(shè)備,能夠為觀眾將非母語節(jié)目或視頻近乎即時地轉(zhuǎn)換為近似于母語的節(jié)目或視頻,幫助觀眾克服語言障礙,改善通過網(wǎng)絡(luò)觀看節(jié)目或視頻的觀看體驗。
【專利說明】視頻語言翻譯方法、系統(tǒng)及智能顯示設(shè)備
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種視頻語言翻譯方法、系統(tǒng)及智能顯示設(shè)備。
【背景技術(shù)】
[0002] 隨著智能電視和網(wǎng)絡(luò)的普及,越來越多的電視觀眾會選擇收看網(wǎng)絡(luò)上的視頻。相 比于傳統(tǒng)的電視渠道,在網(wǎng)絡(luò)上所能收看的電視節(jié)目或者視頻的種類和數(shù)量均遠(yuǎn)遠(yuǎn)多于前 者。在網(wǎng)絡(luò)上的海量節(jié)目或者視頻,不僅包括了本國本地區(qū)的節(jié)目,還包括了大量國外的節(jié) 目。這就帶來了一個問題,即所播放的視頻語言可能不是本國語言或者觀眾的母語,而語言 障礙會大大影響觀眾的觀看體驗。
[0003] 顯然,若能夠設(shè)法對于正在播放的非母語節(jié)目和視頻進(jìn)行一定處理,以幫助觀眾 克服語言障礙,將能夠大大提升觀眾的觀看體驗,更有效地利用互聯(lián)網(wǎng)上的資源。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明要解決的技術(shù)問題是為了克服現(xiàn)有技術(shù)中觀眾或用戶通過網(wǎng)絡(luò)觀看節(jié)目 或視頻時難以克服語言障礙因而觀感不佳的缺陷,提出一種視頻語言翻譯方法、系統(tǒng)及智 能顯示設(shè)備。
[0005] 本發(fā)明是通過下述技術(shù)方案來解決上述技術(shù)問題的:
[0006] 本發(fā)明提供了一種視頻語言翻譯方法,其特征在于,包括以下步驟:
[0007] Si、一顯示設(shè)備獲取當(dāng)前視頻,當(dāng)前視頻包括當(dāng)前圖像幀和/或當(dāng)前語音;
[0008] S2、該顯示設(shè)備與一終端設(shè)備通信,并獲取該終端設(shè)備上的設(shè)置語言作為目標(biāo)語 言;
[0009] S3、該顯示設(shè)備對當(dāng)前視頻進(jìn)行文字識別和/或語音識別,在識別結(jié)果為符合該目 標(biāo)語言的情況下,將當(dāng)前視頻作為待播送視頻并執(zhí)行步驟S5,在識別結(jié)果為不符合預(yù)設(shè)的 目標(biāo)語言的情況下執(zhí)行步驟S 4 ;
[0010] S4、該顯示設(shè)備將當(dāng)前圖像幀中的文字和/或當(dāng)前語音翻譯為該目標(biāo)語言,并將翻 譯結(jié)果添加至當(dāng)前視頻中,以形成待播送視頻;
[0011] S5、該顯示設(shè)備播放待播送視頻
[0012] 本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,采用任何設(shè)備進(jìn)行視頻的播放,實質(zhì)上均需先獲取視 頻,然后再進(jìn)行播放。當(dāng)兩者的間隔非常短時,對于觀眾而言就相當(dāng)于即時播放。上述的當(dāng) 前視頻即設(shè)備獲取的視頻,而在視頻播放之前或播放過程中需要執(zhí)行上述步驟s 2?S4。
[0013] 其中步驟&對目標(biāo)語言的自動獲取可以是根據(jù)用戶設(shè)置的終端設(shè)備上的顯示語 言自動獲得的,一般情況下認(rèn)為終端設(shè)備上用戶設(shè)置的語言即為觀眾的母語,也即目標(biāo)語 言。這里所說的終端設(shè)備,可以是用戶的智能手機(jī)、平板電腦等移動終端。經(jīng)上述步驟&處 理后,至少保證了在獲取的視頻和母語不符的情況下,將翻譯得到的內(nèi)容附加于視頻中進(jìn) 行播放,從而幫助觀眾至少在一定程度上得以跨越語言障礙以更理解播放的內(nèi)容,改善其 觀看體驗。
[0014] 較佳地,當(dāng)前視頻包括當(dāng)前圖像幀和當(dāng)前語音,該步驟S4包括以下步驟:
[0015] S41、將當(dāng)前語音翻譯為該目標(biāo)語言以形成待播送語音;
[0016] S42、將當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加至相應(yīng) 的原文字在當(dāng)前圖像幀中所處位置的周圍,以形成待播送圖像幀;
[0017] S43、根據(jù)待播送語音和待播送圖像幀的時序?qū)⒍吆铣蔀榇ニ鸵曨l。
[0018] 較佳地,當(dāng)前視頻具有一標(biāo)簽;
[0019] 步驟S41為:該顯示設(shè)備根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言語音包,若 搜索到則采用目標(biāo)語言語音包匹配當(dāng)前語音,以獲取待播送語音,若未搜索到則將當(dāng)前語 音翻譯為該目標(biāo)語言以形成待播送語音;
[0020] 步驟s42為:該顯示設(shè)備根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言字幕包,若 搜索到則采用目標(biāo)語言字幕包匹配當(dāng)前圖像幀中的文字,以形成待播送圖像幀,若未搜索 到則將當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加至相應(yīng)的原文字 在當(dāng)前圖像幀中所處位置的周圍,以形成待播送圖像幀。
[0021] 這里的標(biāo)簽可以是當(dāng)前視頻的名稱、網(wǎng)絡(luò)資源地址等信息或者多種信息的組合, 其能夠反映當(dāng)前視頻的特征,從而便于依據(jù)其進(jìn)行語音包或者字幕包的搜索。
[0022] 本發(fā)明還提供了一種視頻語言翻譯方法,其特征在于,包括以下步驟:
[0023] Si、一顯示設(shè)備獲取當(dāng)前視頻,當(dāng)前視頻包括當(dāng)前圖像幀和/或當(dāng)前語音;
[0024] S2、該顯示設(shè)備將當(dāng)前視頻傳輸至一終端設(shè)備;
[0025] S3、該終端設(shè)備讀取自身的設(shè)置語言作為目標(biāo)語言,并對當(dāng)前視頻進(jìn)行文字識別 和/或語音識別,在識別結(jié)果為符合預(yù)設(shè)的目標(biāo)語言的情況下,將當(dāng)前視頻作為待播送視 頻并執(zhí)行步驟S 5,在識別結(jié)果為不符合預(yù)設(shè)的目標(biāo)語言的情況下執(zhí)行步驟S4 ;
[0026] S4、該終端設(shè)備將當(dāng)前圖像幀中的文字和/或當(dāng)前語音翻譯為該目標(biāo)語言,并將翻 譯結(jié)果添加至當(dāng)前視頻中,以形成待播送視頻,然后將待播送視頻發(fā)送至該顯示設(shè)備;
[0027] S5、該顯示設(shè)備播放待播送視頻。
[0028] 應(yīng)當(dāng)理解的是,采用上述方法盡管增加了顯示設(shè)備和終端設(shè)備之間的數(shù)據(jù)傳輸, 但同時大大降低了對于顯示設(shè)備本身的性能要求。此處的顯示設(shè)備即便是非智能化的、較 為老式的視頻播放設(shè)備,只要其具有播放能力和數(shù)據(jù)傳輸能力,而不需數(shù)據(jù)處理能力,同樣 能夠?qū)崿F(xiàn)將非母語視頻轉(zhuǎn)換為一定程度上為母語的視頻的功能。而需要一定的數(shù)據(jù)處理能 力的終端設(shè)備則可以采用智能手機(jī)或可穿戴設(shè)備等。
[0029] 數(shù)據(jù)傳輸可以采用有線形式,譬如USB、MHL接口(即Mobile High-Definition Link,是移動終端高清影音標(biāo)準(zhǔn)接口)等傳輸,亦可利用無線傳輸技術(shù),譬如WIFI。
[0030] 較佳地,當(dāng)前視頻包括當(dāng)前圖像幀和當(dāng)前語音,該步驟S4包括以下步驟:
[0031] S41、該終端設(shè)備將當(dāng)前語音翻譯為該目標(biāo)語言以形成待播送語音;
[0032] S42、該終端設(shè)備將當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字 添加至相應(yīng)的原文字在當(dāng)前圖像幀中所處位置的周圍,以形成待播送圖像幀;
[0033] S43、該終端設(shè)備根據(jù)待播送語音和待播送圖像幀的時序?qū)⒍吆铣蔀榇ニ鸵?頻;
[0034] S44、該終端設(shè)備將待播送視頻發(fā)送至該顯示設(shè)備。
[0035] 較佳地,當(dāng)前視頻具有一標(biāo)簽;
[0036] 步驟S41為:該終端設(shè)備根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言語音包,若 搜索到則采用目標(biāo)語言語音包匹配當(dāng)前語音,以獲取待播送語音,若未搜索到則將當(dāng)前語 音翻譯為該目標(biāo)語言以形成待播送語音;
[0037] 步驟S42為:該終端設(shè)備根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言字幕包,若 搜索到則采用目標(biāo)語言字幕包匹配當(dāng)前圖像幀中的文字,以形成待播送圖像幀,若未搜索 到則將當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加至相應(yīng)的原文字 在當(dāng)前圖像幀中所處位置的周圍,以形成待播送圖像幀。
[0038] 本發(fā)明還提供了一種智能顯示設(shè)備,包括一視頻獲取模塊、一目標(biāo)語言模塊、一識 別模塊和一播放模塊。
[0039] 該視頻獲取模塊用于獲取當(dāng)前視頻,當(dāng)前視頻包括當(dāng)前圖像幀和/或當(dāng)前語音。 該目標(biāo)語言模塊用于與終端設(shè)備通信,獲取終端設(shè)備上的設(shè)置語言,即默認(rèn)為目標(biāo)語言。
[0040] 該識別模塊用于對當(dāng)前視頻進(jìn)行文字識別和/或語音識別,在識別結(jié)果為符合該 目標(biāo)語言的情況下,將當(dāng)前視頻作為待播送視頻發(fā)送至一播放模塊,在識別結(jié)果為不符合 預(yù)設(shè)的目標(biāo)語言的情況下,將當(dāng)前圖像幀中的文字和/或當(dāng)前語音翻譯為該目標(biāo)語言,并 將翻譯結(jié)果添加至當(dāng)前視頻中,以形成待播送視頻。該播放模塊則用于播放待播送視頻。
[0041] 較佳地,當(dāng)前視頻包括當(dāng)前圖像幀和當(dāng)前語音,該識別模塊包括一語音處理單元、 一圖像處理單元和一合成單元。
[0042] 其中,該語音處理單元用于將當(dāng)前語音翻譯為該目標(biāo)語言以形成待播送語音,該 圖像處理單元用于將當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加至 相應(yīng)的原文字在當(dāng)前圖像幀中所處位置的周圍,以形成待播送圖像幀,該合成單元用于根 據(jù)待播送語音和待播送圖像幀的時序?qū)⒍吆铣蔀榇ニ鸵曨l。
[0043] 較佳地,當(dāng)前視頻具有一標(biāo)簽,該識別模塊還包括一網(wǎng)絡(luò)搜索單元。該網(wǎng)絡(luò)搜索單 元用于根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言語音包,若搜索到則采用目標(biāo)語言語 音包匹配當(dāng)前語音,以獲取待播送語音,并根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言 字幕包,若搜索到則采用目標(biāo)語言字幕包匹配當(dāng)前圖像幀中的文字,以形成待播送圖像幀, 若未搜索到目標(biāo)語言語音包則啟用該語音處理單元,若未搜索到目標(biāo)語言字幕包則啟用該 圖像處理單元,若目標(biāo)語言語音包和目標(biāo)語言字幕包均搜索到則啟用該合成單元。
[0044] 本發(fā)明還提供了一種視頻翻譯系統(tǒng),包括一顯示設(shè)備和一終端設(shè)備。
[0045] 該顯示設(shè)備包括一視頻獲取模塊、一傳輸模塊和一播放模塊,該視頻獲取模塊用 于獲取當(dāng)前視頻,當(dāng)前視頻包括當(dāng)前圖像幀和/或當(dāng)前語音,該傳輸模塊用于將當(dāng)前視頻 傳輸至該終端設(shè)備以及從該終端設(shè)備接收待播送視頻,該播放模塊用于播放待播送視頻。 [0046] 該終端設(shè)備包括一傳輸模塊和一識別模塊,該傳輸模塊用于完成和該顯不設(shè)備之 間的視頻收發(fā),該識別模塊用于對當(dāng)前視頻進(jìn)行文字識別和/或語音識別,在識別結(jié)果為 符合該目標(biāo)語言的情況下,將當(dāng)前視頻作為待播送視頻發(fā)送至一播放模塊,在識別結(jié)果為 不符合預(yù)設(shè)的目標(biāo)語言的情況下,將當(dāng)前圖像幀中的文字和/或當(dāng)前語音翻譯為該目標(biāo)語 言,并將翻譯結(jié)果添加至當(dāng)前視頻中,以形成待播送視頻。
[0047] 較佳地,該顯示設(shè)備可為智能電視,該終端設(shè)備可為智能手機(jī)或是可穿戴設(shè)備。 [0048] 較佳地,當(dāng)前視頻包括當(dāng)前圖像幀和當(dāng)前語音,該識別模塊包括一語音處理單元、 一圖像處理單元和一合成單元。
[0049] 該語音處理單元用于將當(dāng)前語音翻譯為該目標(biāo)語言以形成待播送語音,該圖像處 理單元用于將當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加至相應(yīng)的 原文字在當(dāng)前圖像幀中所處位置的周圍,以形成待播送圖像幀,該合成單元用于根據(jù)待播 送語音和待播送圖像幀的時序?qū)⒍吆铣蔀榇ニ鸵曨l。
[0050] 較佳地,當(dāng)前視頻具有一標(biāo)簽,該識別模塊還包括一網(wǎng)絡(luò)搜索單元。該網(wǎng)絡(luò)搜索單 元用于根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言語音包,若搜索到則采用目標(biāo)語言語 音包匹配當(dāng)前語音,以獲取待播送語音,并根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言 字幕包,若搜索到則采用目標(biāo)語言字幕包匹配當(dāng)前圖像幀中的文字,以形成待播送圖像幀, 若未搜索到目標(biāo)語言語音包則啟用該語音處理單元,若未搜索到目標(biāo)語言字幕包則啟用該 圖像處理單元,若目標(biāo)語言語音包和目標(biāo)語言字幕包均搜索到則啟用該合成單元。
[0051] 在符合本領(lǐng)域常識的基礎(chǔ)上,上述各優(yōu)選條件,可任意組合,即得本發(fā)明各較佳實 例。
[0052] 本發(fā)明的積極進(jìn)步效果在于:
[0053] 本發(fā)明的視頻語言翻譯方法、系統(tǒng)及智能顯示設(shè)備,能夠為觀眾將非母語節(jié)目或 視頻近乎即時地轉(zhuǎn)換為近似于母語的節(jié)目或視頻,幫助觀眾克服語言障礙,改善通過網(wǎng)絡(luò) 或電視觀看節(jié)目或視頻的觀看體驗。
【專利附圖】
【附圖說明】
[0054] 圖1為本發(fā)明實施例1的視頻語言翻譯方法的流程圖。
[0055] 圖2為本發(fā)明實施例2的視頻語言翻譯方法的流程圖。
[0056] 圖3為本發(fā)明實施例3的智能顯示設(shè)備的示意圖。
[0057] 圖4為本發(fā)明實施例3的視頻翻譯系統(tǒng)的示意圖。
【具體實施方式】
[0058] 下面結(jié)合附圖給出本發(fā)明較佳實施例,以詳細(xì)說明本發(fā)明的技術(shù)方案,但并不因 此將本發(fā)明限制在所述的實施例范圍之中。
[0059] 實施例1
[0060] 如圖1所示,本實施例的視頻語言翻譯方法包括以下步驟:
[0061] Si、獲取當(dāng)前視頻,當(dāng)前視頻包括當(dāng)前圖像幀和當(dāng)前語音,當(dāng)前視頻還具有一標(biāo) 簽;
[0062] S2、自動獲取用戶的終端設(shè)備的設(shè)置語言作為目標(biāo)語言;
[0063] S3、對當(dāng)前視頻進(jìn)行文字識別和語音識別,在識別結(jié)果為符合該目標(biāo)語言的情況 下,將當(dāng)前視頻作為待播送視頻并執(zhí)行步驟s 5,在識別結(jié)果為不符合預(yù)設(shè)的目標(biāo)語言的情 況下執(zhí)行步驟S41;
[0064] S41、根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言語音包,若搜索到則采用目標(biāo) 語言語音包匹配當(dāng)前語音,以獲取待播送語音,若未搜索到則將當(dāng)前語音翻譯為該目標(biāo)語 言以形成待播送語音;
[0065] S42、根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言字幕包,若搜索到則采用目標(biāo) 語言字幕包匹配當(dāng)前圖像幀中的文字,以形成待播送圖像幀,若未搜索到則將當(dāng)前圖像幀 中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加至相應(yīng)的原文字在當(dāng)前圖像幀中所 處位置的周圍,以形成待播送圖像幀;
[0066] S43、根據(jù)待播送語音和待播送圖像幀的時序?qū)⒍吆铣蔀榇ニ鸵曨l;
[0067] S5、播放待播送視頻。
[0068] 本實施例中,該標(biāo)簽為當(dāng)前視頻的網(wǎng)絡(luò)資源地址,該目標(biāo)語言為中文。并且當(dāng)前視 頻包括若干幀圖像幀。
[0069] 實施例2
[0070] 參考圖2所示,本實施例的視頻語言翻譯方法包括以下步驟:
[0071] Si、一顯示設(shè)備獲取當(dāng)前視頻,當(dāng)前視頻包括當(dāng)前圖像幀和當(dāng)前語音,且當(dāng)前視頻 還具有一標(biāo)簽;
[0072] S2、該顯示設(shè)備將當(dāng)前視頻傳輸至一終端設(shè)備;
[0073] S3、該終端設(shè)備對當(dāng)前視頻進(jìn)行文字識別和語音識別,在識別結(jié)果為符合預(yù)設(shè)的 目標(biāo)語言的情況下,將當(dāng)前視頻作為待播送視頻并執(zhí)行步驟S 5,在識別結(jié)果為不符合預(yù)設(shè) 的目標(biāo)語言的情況下執(zhí)行步驟S41 ;
[0074] S41、該終端設(shè)備根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言語音包,若搜索到 則采用目標(biāo)語言語音包匹配當(dāng)前語音,以獲取待播送語音,若未搜索到則將當(dāng)前語音翻譯 為該目標(biāo)語言以形成待播送語音;
[0075] S42、該終端設(shè)備根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言字幕包,若搜索到 則采用目標(biāo)語言字幕包匹配當(dāng)前圖像幀中的文字,以形成待播送圖像幀,若未搜索到則將 當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加至相應(yīng)的原文字在當(dāng)前 圖像幀中所處位置的周圍,以形成待播送圖像幀;
[0076] S43、該終端設(shè)備根據(jù)待播送語音和待播送圖像幀的時序?qū)⒍吆铣蔀榇ニ鸵?頻;
[0077] S44、該終端設(shè)備將待播送視頻發(fā)送至該顯示設(shè)備;
[0078] S5、該顯示設(shè)備播放待播送視頻。
[0079] 本實施例采用上述方法盡管增加了顯示設(shè)備和終端設(shè)備之間的數(shù)據(jù)傳輸,但同時 大大降低了對于顯示設(shè)備本身的性能要求。而本實施例中的終端設(shè)備為一穿戴設(shè)備。
[0080] 實施例3
[0081] 參考圖3所示,本實施例的智能顯示設(shè)備包括一視頻獲取模塊1、一目標(biāo)語言模塊 2、一識別模塊3和一播放模塊4。
[0082] 該視頻獲取模塊用于獲取當(dāng)前視頻,當(dāng)前視頻包括當(dāng)前圖像幀和當(dāng)前語音,并具 有一標(biāo)簽。該目標(biāo)語言模塊用于與終端設(shè)備通信,自動獲取終端設(shè)備的設(shè)置語言,將其作為 目標(biāo)語目。
[0083] 該識別模塊包括一語音處理單元、一圖像處理單元、一網(wǎng)絡(luò)搜索單元和一合成單 J Li 〇
[0084] 其中,該網(wǎng)絡(luò)搜索單元用于根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言語音 包,若搜索到則采用目標(biāo)語言語音包匹配當(dāng)前語音,以獲取待播送語音,并根據(jù)該標(biāo)簽在網(wǎng) 絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言字幕包,若搜索到則采用目標(biāo)語言字幕包匹配當(dāng)前圖像幀中 的文字,以形成待播送圖像幀,若未搜索到目標(biāo)語言語音包則啟用該語音處理單元,若未搜 索到目標(biāo)語言字幕包則啟用該圖像處理單元,若目標(biāo)語言語音包和目標(biāo)語言字幕包均搜索 到則啟用該合成單元。
[0085] 該語音處理單元用于將當(dāng)前語音翻譯為該目標(biāo)語言以形成待播送語音,該圖像處 理單元用于將當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加至相應(yīng)的 原文字在當(dāng)前圖像幀中所處位置的周圍,以形成待播送圖像幀,該合成單元用于根據(jù)待播 送語音和待播送圖像幀的時序?qū)⒍吆铣蔀榇ニ鸵曨l。該播放模塊則用于播放待播送視 頻。
[0086] 本實施例采用上述方法以智能顯示設(shè)備為主體,減少了顯示設(shè)備和終端設(shè)備之間 的數(shù)據(jù)傳輸,但對智能顯示設(shè)備本身的性能要求較高。本實施例中的智能顯示設(shè)備為智能 電視。
[0087] 實施例4
[0088] 參考圖4所示,本實施例的視頻翻譯系統(tǒng)包括有一顯示設(shè)備和一終端設(shè)備。
[0089] 該顯不設(shè)備包括一視頻獲取模塊11、一傳輸模塊13和一播放模塊12,該視頻獲取 模塊11用于獲取當(dāng)前視頻,當(dāng)前視頻包括當(dāng)前圖像幀和當(dāng)前語音,還具有一標(biāo)簽。該傳輸 模塊13用于將當(dāng)前視頻傳輸至該終端設(shè)備以及從該終端設(shè)備接收待播送視頻,該播放模 塊12用于播放待播送視頻。
[0090] 該終端設(shè)備包括一傳輸模塊22和一識別模塊21,該傳輸模塊22用于完成和該顯 示設(shè)備之間的視頻收發(fā),該識別模塊21用于對當(dāng)前視頻進(jìn)行文字識別和語音識別,在識別 結(jié)果為符合該目標(biāo)語言的情況下,將當(dāng)前視頻作為待播送視頻發(fā)送至一播放模塊,在識別 結(jié)果為不符合預(yù)設(shè)的目標(biāo)語言的情況下,將當(dāng)前圖像幀中的文字和當(dāng)前語音翻譯為該目標(biāo) 語言,并將翻譯結(jié)果添加至當(dāng)前視頻中,以形成待播送視頻。
[0091] 該識別模塊21包括一語音處理單元、一圖像處理單元、一網(wǎng)絡(luò)搜索單元和一合成 單元。
[0092] 該網(wǎng)絡(luò)搜索單元用于根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言語音包,若 搜索到則采用目標(biāo)語言語音包匹配當(dāng)前語音,以獲取待播送語音,并根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上 搜索當(dāng)前視頻的目標(biāo)語言字幕包,若搜索到則采用目標(biāo)語言字幕包匹配當(dāng)前圖像幀中的文 字,以形成待播送圖像幀,若未搜索到目標(biāo)語言語音包則啟用該語音處理單元,若未搜索到 目標(biāo)語言字幕包則啟用該圖像處理單元,若目標(biāo)語言語音包和目標(biāo)語言字幕包均搜索到則 啟用該合成單元。
[0093] 該語音處理單元用于將當(dāng)前語音翻譯為該目標(biāo)語言以形成待播送語音,該圖像處 理單元用于將當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加至相應(yīng)的 原文字在當(dāng)前圖像幀中所處位置的周圍,以形成待播送圖像幀,該合成單元用于根據(jù)待播 送語音和待播送圖像幀的時序?qū)⒍吆铣蔀榇ニ鸵曨l。
[0094] 雖然以上描述了本發(fā)明的【具體實施方式】,但是本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這些 僅是舉例說明,本發(fā)明的保護(hù)范圍是由所附權(quán)利要求書限定的。本領(lǐng)域的技術(shù)人員在不背 離本發(fā)明的原理和實質(zhì)的前提下,可以對這些實施方式做出多種變更或修改,但這些變更 和修改均落入本發(fā)明的保護(hù)范圍。
【權(quán)利要求】
1. 一種視頻語言翻譯方法,其特征在于,包括以下步驟: Si、一顯示設(shè)備獲取當(dāng)前視頻,當(dāng)前視頻包括當(dāng)前圖像幀和/或當(dāng)前語音; s2、該顯示設(shè)備與一終端設(shè)備通信,并獲取該終端設(shè)備上的設(shè)置語言作為目標(biāo)語言; s3、該顯示設(shè)備對當(dāng)前視頻進(jìn)行文字識別和/或語音識別,在識別結(jié)果為符合該目標(biāo)語 言的情況下,將當(dāng)前視頻作為待播送視頻并執(zhí)行步驟s 5,在識別結(jié)果為不符合預(yù)設(shè)的目標(biāo) 語言的情況下執(zhí)行步驟S4; s4、該顯示設(shè)備將當(dāng)前圖像幀中的文字和/或當(dāng)前語音翻譯為該目標(biāo)語言,并將翻譯結(jié) 果添加至當(dāng)前視頻中,以形成待播送視頻; s5、該顯示設(shè)備播放待播送視頻。
2. 如權(quán)利要求1所述的視頻語言翻譯方法,其特征在于,當(dāng)前視頻包括當(dāng)前圖像幀和 當(dāng)前語音,該步驟s4包括以下步驟: S41、該顯示設(shè)備將當(dāng)前語音翻譯為該目標(biāo)語言以形成待播送語音; s42、該顯示設(shè)備將當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加 至相應(yīng)的原文字在當(dāng)前圖像幀中所處位置的周圍,以形成待播送圖像幀; s43、該顯示設(shè)備根據(jù)待播送語音和待播送圖像幀的時序?qū)⒍吆铣蔀榇ニ鸵曨l。
3. 如權(quán)利要求2所述的視頻語言翻譯方法,其特征在于,當(dāng)前視頻具有一標(biāo)簽; 步驟S41為:該顯示設(shè)備根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言語音包,若搜索 到則采用目標(biāo)語言語音包匹配當(dāng)前語音,以獲取待播送語音,若未搜索到則將當(dāng)前語音翻 譯為該目標(biāo)語言以形成待播送語音; 步驟S42為:該顯示設(shè)備根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言字幕包,若搜索 到則采用目標(biāo)語言字幕包匹配當(dāng)前圖像幀中的文字,以形成待播送圖像幀,若未搜索到則 將當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加至相應(yīng)的原文字在當(dāng) 前圖像幀中所處位置的周圍,以形成待播送圖像幀。
4. 一種視頻語言翻譯方法,其特征在于,包括以下步驟: 51、 一顯示設(shè)備獲取當(dāng)前視頻,當(dāng)前視頻包括當(dāng)前圖像幀和/或當(dāng)前語音; 52、 該顯示設(shè)備將當(dāng)前視頻傳輸至一終端設(shè)備; 53、 該終端設(shè)備讀取自身的設(shè)置語言作為目標(biāo)語言,并對當(dāng)前視頻進(jìn)行文字識別和/或 語音識別,在識別結(jié)果為符合預(yù)設(shè)的目標(biāo)語言的情況下,將當(dāng)前視頻作為待播送視頻并執(zhí) 行步驟S 5,在識別結(jié)果為不符合預(yù)設(shè)的目標(biāo)語言的情況下執(zhí)行步驟S4 ; 54、 該終端設(shè)備將當(dāng)前圖像幀中的文字和/或當(dāng)前語音翻譯為該目標(biāo)語言,并將翻譯結(jié) 果添加至當(dāng)前視頻中,以形成待播送視頻,然后將待播送視頻發(fā)送至該顯示設(shè)備; 55、 該顯示設(shè)備播放待播送視頻。
5. 如權(quán)利要求4所述的視頻語言翻譯方法,其特征在于,當(dāng)前視頻包括當(dāng)前圖像幀和 當(dāng)前語音,該步驟S4包括以下步驟: 541、 該終端設(shè)備將當(dāng)前語音翻譯為該目標(biāo)語言以形成待播送語音; 542、 該終端設(shè)備將當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加 至相應(yīng)的原文字在當(dāng)前圖像幀中所處位置的周圍,以形成待播送圖像幀; 543、 該終端設(shè)備根據(jù)待播送語音和待播送圖像幀的時序?qū)⒍吆铣蔀榇ニ鸵曨l; 544、 該終端設(shè)備將待播送視頻發(fā)送至該顯示設(shè)備。
6. 如權(quán)利要求5所述的視頻語言翻譯方法,其特征在于,當(dāng)前視頻具有一標(biāo)簽; 步驟S41為:該終端設(shè)備根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言語音包,若搜索 到則采用目標(biāo)語言語音包匹配當(dāng)前語音,以獲取待播送語音,若未搜索到則將當(dāng)前語音翻 譯為該目標(biāo)語言以形成待播送語音; 步驟S42為:該終端設(shè)備根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言字幕包,若搜索 到則采用目標(biāo)語言字幕包匹配當(dāng)前圖像幀中的文字,以形成待播送圖像幀,若未搜索到則 將當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加至相應(yīng)的原文字在當(dāng) 前圖像幀中所處位置的周圍,以形成待播送圖像幀。
7. -種智能顯示設(shè)備,其特征在于,包括: 一視頻獲取模塊,用于獲取當(dāng)前視頻,當(dāng)前視頻包括當(dāng)前圖像幀和/或當(dāng)前語音; 一目標(biāo)語言模塊,用于與終端設(shè)備通信,并獲取終端設(shè)備上的設(shè)置語言作為目標(biāo)語 言; 一識別模塊,用于對當(dāng)前視頻進(jìn)行文字識別和/或語音識別,在識別結(jié)果為符合該目 標(biāo)語言的情況下,將當(dāng)前視頻作為待播送視頻發(fā)送至一播放模塊,在識別結(jié)果為不符合預(yù) 設(shè)的目標(biāo)語言的情況下,將當(dāng)前圖像幀中的文字和/或當(dāng)前語音翻譯為該目標(biāo)語言,并將 翻譯結(jié)果添加至當(dāng)前視頻中,以形成待播送視頻; 該播放模塊,用于播放待播送視頻。
8. 如權(quán)利要求7所述的智能顯示設(shè)備,其特征在于,當(dāng)前視頻包括當(dāng)前圖像幀和當(dāng)前 語音,該識別模塊包括一語音處理單元、一圖像處理單元和一合成單元; 該語音處理單元用于將當(dāng)前語音翻譯為該目標(biāo)語言以形成待播送語音,該圖像處理單 元用于將當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加至相應(yīng)的原文 字在當(dāng)前圖像幀中所處位置的周圍,以形成待播送圖像幀,該合成單元用于根據(jù)待播送語 音和待播送圖像幀的時序?qū)⒍吆铣蔀榇ニ鸵曨l。
9. 如權(quán)利要求8所述的智能顯示設(shè)備,其特征在于,當(dāng)前視頻具有一標(biāo)簽,該識別模塊 還包括一網(wǎng)絡(luò)搜索單元; 該網(wǎng)絡(luò)搜索單元用于根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言語音包,若搜索到 則采用目標(biāo)語言語音包匹配當(dāng)前語音,以獲取待播送語音,并根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng) 前視頻的目標(biāo)語言字幕包,若搜索到則采用目標(biāo)語言字幕包匹配當(dāng)前圖像幀中的文字,以 形成待播送圖像幀,若未搜索到目標(biāo)語言語音包則啟用該語音處理單元,若未搜索到目標(biāo) 語言字幕包則啟用該圖像處理單元,若目標(biāo)語言語音包和目標(biāo)語言字幕包均搜索到則啟用 該合成單元。
10. -種視頻翻譯系統(tǒng),其特征在于,包括一顯示設(shè)備和一終端設(shè)備; 該顯示設(shè)備包括一視頻獲取模塊、一傳輸模塊和一播放模塊,該視頻獲取模塊用于獲 取當(dāng)前視頻,當(dāng)前視頻包括當(dāng)前圖像幀和/或當(dāng)前語音,該傳輸模塊用于將當(dāng)前視頻傳輸 至該終端設(shè)備以及從該終端設(shè)備接收待播送視頻,該播放模塊用于播放待播送視頻: 該終端設(shè)備包括一傳輸模塊和一識別模塊,該傳輸模塊用于完成和該顯示設(shè)備之間的 視頻收發(fā),該識別模塊用于對當(dāng)前視頻進(jìn)行文字識別和/或語音識別,在識別結(jié)果為符合 該目標(biāo)語言的情況下,將當(dāng)前視頻作為待播送視頻發(fā)送至一播放模塊,在識別結(jié)果為不符 合預(yù)設(shè)的目標(biāo)語言的情況下,將當(dāng)前圖像幀中的文字和/或當(dāng)前語音翻譯為該目標(biāo)語言, 并將翻譯結(jié)果添加至當(dāng)前視頻中,以形成待播送視頻。
11. 如權(quán)利要求10所述的視頻翻譯系統(tǒng),其特征在于,當(dāng)前視頻包括當(dāng)前圖像幀和當(dāng) 前語音,該識別模塊包括一語音處理單元、一圖像處理單元和一合成單元; 該語音處理單元用于將當(dāng)前語音翻譯為該目標(biāo)語言以形成待播送語音,該圖像處理單 元用于將當(dāng)前圖像幀中的文字翻譯為該目標(biāo)語言,并將翻譯得到的文字添加至相應(yīng)的原文 字在當(dāng)前圖像幀中所處位置的周圍,以形成待播送圖像幀,該合成單元用于根據(jù)待播送語 音和待播送圖像幀的時序?qū)⒍吆铣蔀榇ニ鸵曨l。
12. 如權(quán)利要求11所述的視頻翻譯系統(tǒng),其特征在于,當(dāng)前視頻具有一標(biāo)簽,該識別模 塊還包括一網(wǎng)絡(luò)搜索單元; 該網(wǎng)絡(luò)搜索單元用于根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng)前視頻的目標(biāo)語言語音包,若搜索到 則采用目標(biāo)語言語音包匹配當(dāng)前語音,以獲取待播送語音,并根據(jù)該標(biāo)簽在網(wǎng)絡(luò)上搜索當(dāng) 前視頻的目標(biāo)語言字幕包,若搜索到則采用目標(biāo)語言字幕包匹配當(dāng)前圖像幀中的文字,以 形成待播送圖像幀,若未搜索到目標(biāo)語言語音包則啟用該語音處理單元,若未搜索到目標(biāo) 語言字幕包則啟用該圖像處理單元,若目標(biāo)語言語音包和目標(biāo)語言字幕包均搜索到則啟用 該合成單元。
13. 如權(quán)利要求10-12中任意一項所述的視頻翻譯系統(tǒng),其特征在于,該顯示設(shè)備為智 能電視,該終端設(shè)備為智能手機(jī)或可穿戴設(shè)備。
【文檔編號】H04N5/278GK104219459SQ201410522251
【公開日】2014年12月17日 申請日期:2014年9月30日 優(yōu)先權(quán)日:2014年9月30日
【發(fā)明者】張卓立, 張清華, 丁伯爐, 趙冀楊 申請人:上海摩軟通訊技術(shù)有限公司