本發(fā)明屬于語音識(shí)別技術(shù)領(lǐng)域,涉及一種新聞轉(zhuǎn)寫方法及系統(tǒng),具體是一種視頻新聞實(shí)時(shí)轉(zhuǎn)寫存儲(chǔ)方法及系統(tǒng)。
背景技術(shù):
新聞直播,指不經(jīng)過預(yù)先錄音或者錄像將事件現(xiàn)場情況、演播室播講或表演同步播出的廣播電視傳播形式。視頻新聞直播一般通過流媒體服務(wù)器向用戶在線直播新聞,用戶通過客戶端觀看視頻新聞,但是,當(dāng)用戶因一些原因無法實(shí)時(shí)觀看視頻新聞,用戶又想了解新聞內(nèi)容時(shí),需要提供一種可將視頻新聞直播實(shí)時(shí)存儲(chǔ),并轉(zhuǎn)寫為文本,提供文字閱讀和視頻觀看兩種方式供用戶選擇的系統(tǒng),本案由此產(chǎn)生。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種操作簡單、使用方便的視頻新聞實(shí)時(shí)轉(zhuǎn)寫存儲(chǔ)方法及系統(tǒng)。
本發(fā)明的目的可以通過以下技術(shù)方案實(shí)現(xiàn):
一種視頻新聞實(shí)時(shí)轉(zhuǎn)寫存儲(chǔ)方法,包括以下步驟:
步驟S1,視頻新聞通過流媒體服務(wù)器輸出視頻流到本地客戶端進(jìn)行播放;
步驟S2,本地客戶端對(duì)接收到的視頻流進(jìn)行編碼,生成視頻文件存儲(chǔ)在本地硬盤內(nèi);
步驟S3,本地客戶端通過音頻提取模塊對(duì)視頻文件進(jìn)行處理,提取其中的音頻數(shù)據(jù),生成音頻文件;
步驟S4,本地客戶端將音頻文件發(fā)送到語音識(shí)別服務(wù)器,語音識(shí)別服務(wù)器對(duì)音頻文件進(jìn)行轉(zhuǎn)寫,生成文字信息;
步驟S5,語音識(shí)別服務(wù)器通過文字校正模塊對(duì)文字信息進(jìn)行校正,并將校正后的文字信息發(fā)送到本地客戶端;
步驟S6,本地客戶端將接收到的文字信息與視頻文件進(jìn)行合成,生成帶字幕的視頻文件,同時(shí)將文字信息單獨(dú)保存為文本文件,存儲(chǔ)在本地硬盤內(nèi),供用戶查閱。
一種視頻新聞實(shí)時(shí)轉(zhuǎn)寫存儲(chǔ)系統(tǒng),包括通過網(wǎng)絡(luò)連接的流媒體服務(wù)器、本地客戶端和語音識(shí)別服務(wù)器;
所述的流媒體服務(wù)器,接收到新聞現(xiàn)場的實(shí)時(shí)視頻信號(hào),并以流式協(xié)議向本地客戶端進(jìn)行直播,輸出視頻流到本地客戶端;
所述的本地客戶端包括
視頻編碼模塊,用于對(duì)接收到的視頻流進(jìn)行編碼,生成視頻文件;
本地硬盤,用于存儲(chǔ)視頻文件和文本文件;
音頻提取模塊,用于對(duì)生成的視頻文件進(jìn)行處理,提取其中的音頻數(shù)據(jù),生成音頻文件,并發(fā)送到語音識(shí)別服務(wù)器;
文本編輯模塊,用于接收語音識(shí)別服務(wù)器返回的文字信息,并對(duì)文字信息進(jìn)行處理,生成文本文件,存儲(chǔ)到本地硬盤;
以及字幕嵌入模塊,用于接收語音識(shí)別服務(wù)器返回的文字信息,并對(duì)文字信息進(jìn)行處理,生成字幕文件,并將字幕文件嵌入視頻文件內(nèi),生成帶字幕的視頻文件;
所述的語音識(shí)別服務(wù)器包括
語音識(shí)別模塊,用于接收本地客戶端發(fā)送的音頻文件,并對(duì)音頻文件的聲音信息進(jìn)行識(shí)別,轉(zhuǎn)寫為文字信息;
語義理解模塊,根據(jù)轉(zhuǎn)寫的文字信息,判斷文字的內(nèi)涵,理解新聞的真實(shí)意義,輸出語義理解信息;
文字校正模塊,根據(jù)語音識(shí)別模塊轉(zhuǎn)寫的文字信息和語義理解模塊的輸出的語義理解信息,對(duì)轉(zhuǎn)寫文字進(jìn)行校正,并發(fā)送到本地客戶端。
進(jìn)一步地,所述的語音識(shí)別服務(wù)器采用訊飛在線語音識(shí)別服務(wù)器。
本發(fā)明的有益效果:本發(fā)明提供的一種視頻新聞實(shí)時(shí)轉(zhuǎn)寫存儲(chǔ)系統(tǒng),通過本地客戶端將直播視頻流轉(zhuǎn)換為視頻文件存儲(chǔ),并提取其中的音頻文件,發(fā)送到語音識(shí)別服務(wù)器進(jìn)行轉(zhuǎn)寫,得到文字信息返回到本地客戶端,本地客戶端將接收到的文字信息與視頻文件進(jìn)行合成,生成帶字幕的視頻文件,供用戶查看,使無法及時(shí)觀看新聞直播的用戶可在空閑時(shí)觀看,并且提供字幕,方便聾啞人閱讀新聞;同時(shí),本地客戶端將文字信息單獨(dú)保存為文本文件,存儲(chǔ)在本地硬盤內(nèi),供用戶查閱,為沒有時(shí)間觀看視頻的用戶提供文字閱讀新聞,為用戶實(shí)時(shí)閱讀新聞提供便利。
附圖說明
下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
圖1是本發(fā)明的系統(tǒng)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明提供了一種視頻新聞實(shí)時(shí)轉(zhuǎn)寫存儲(chǔ)方法,包括以下步驟:
步驟S1,視頻新聞通過流媒體服務(wù)器輸出視頻流到本地客戶端進(jìn)行播放。
步驟S2,本地客戶端對(duì)接收到的視頻流進(jìn)行編碼,生成視頻文件存儲(chǔ)在本地硬盤內(nèi)。
步驟S3,本地客戶端通過音頻提取模塊對(duì)視頻文件進(jìn)行處理,提取其中的音頻數(shù)據(jù),生成音頻文件。
步驟S4,本地客戶端將音頻文件發(fā)送到語音識(shí)別服務(wù)器,語音識(shí)別服務(wù)器對(duì)音頻文件進(jìn)行轉(zhuǎn)寫,生成文字信息。
步驟S5,語音識(shí)別服務(wù)器通過文字校正模塊對(duì)文字信息進(jìn)行校正,并將校正后的文字信息發(fā)送到本地客戶端。
步驟S6,本地客戶端將接收到的文字信息與視頻文件進(jìn)行合成,生成帶字幕的視頻文件,同時(shí)將文字信息單獨(dú)保存為文本文件,存儲(chǔ)在本地硬盤內(nèi),供用戶查閱。
如圖1所示,一種視頻新聞實(shí)時(shí)轉(zhuǎn)寫存儲(chǔ)系統(tǒng),包括通過網(wǎng)絡(luò)連接的流媒體服務(wù)器、本地客戶端和語音識(shí)別服務(wù)器,本地客戶端安裝在用戶本地計(jì)算機(jī)內(nèi)。
流媒體服務(wù)器,接收到新聞現(xiàn)場的實(shí)時(shí)視頻信號(hào),并以流式協(xié)議(RTP/RTSP、MMS、RTMP等)向本地客戶端進(jìn)行直播,輸出視頻流到本地客戶端。
本地客戶端包括視頻編碼模塊、本地硬盤、音頻提取模塊、文本編輯模塊以及字幕嵌入模塊。
視頻編碼模塊,用于對(duì)接收到的視頻流進(jìn)行編碼,生成視頻文件。
本地硬盤,用于存儲(chǔ)視頻文件和文本文件。
音頻提取模塊,用于對(duì)生成的視頻文件進(jìn)行處理,提取其中的音頻數(shù)據(jù),生成音頻文件,并發(fā)送到語音識(shí)別服務(wù)器。
文本編輯模塊,用于接收語音識(shí)別服務(wù)器返回的文字信息,并對(duì)文字信息進(jìn)行處理,生成文本文件。
字幕嵌入模塊,用于接收語音識(shí)別服務(wù)器返回的文字信息,并對(duì)文字信息進(jìn)行處理,生成字幕文件,并將字幕文件嵌入視頻文件內(nèi),生成帶字幕的視頻文件。
語音識(shí)別服務(wù)器,使用訊飛在線語音識(shí)別服務(wù)器,包括語音識(shí)別模塊、語義理解模塊以及文字校正模塊。
語音識(shí)別模塊,用于接收本地客戶端發(fā)送的音頻文件,并對(duì)音頻文件的聲音信息進(jìn)行識(shí)別,轉(zhuǎn)寫為文字信息。
語義理解模塊,根據(jù)轉(zhuǎn)寫的文字信息,基于場景應(yīng)用技術(shù),判斷文字的內(nèi)涵,理解新聞的真實(shí)意義,輸出語義理解信息。
文字校正模塊,根據(jù)語音識(shí)別模塊轉(zhuǎn)寫的文字信息和語義理解模塊的輸出的語義理解信息,對(duì)轉(zhuǎn)寫文字進(jìn)行校正,并發(fā)送到本地客戶端。
本發(fā)明提供的一種視頻新聞實(shí)時(shí)轉(zhuǎn)寫存儲(chǔ)系統(tǒng),通過本地客戶端將直播視頻流轉(zhuǎn)換為視頻文件存儲(chǔ),并提取其中的音頻文件,發(fā)送到語音識(shí)別服務(wù)器進(jìn)行轉(zhuǎn)寫,得到文字信息返回到本地客戶端,本地客戶端將接收到的文字信息與視頻文件進(jìn)行合成,生成帶字幕的視頻文件,供用戶查看,使無法及時(shí)觀看新聞直播的用戶可在空閑時(shí)觀看,并且提供字幕,方便聾啞人閱讀新聞;同時(shí),本地客戶端將文字信息單獨(dú)保存為文本文件,存儲(chǔ)在本地硬盤內(nèi),供用戶查閱,為沒有時(shí)間觀看視頻的用戶提供文字閱讀新聞,為用戶實(shí)時(shí)閱讀新聞提供便利。
為了描述的方便,描述以上裝置時(shí)以功能分為各種單元、模塊分別描述。當(dāng)然,在實(shí)施本申請(qǐng)時(shí)可以把各單元、模塊的功能在同一個(gè)或多個(gè)軟件和/或硬件中實(shí)現(xiàn)。
通過以上的實(shí)施方式的描述可知,本領(lǐng)域的技術(shù)人員可以清楚地了解到本申請(qǐng)可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn)?;谶@樣的理解,本申請(qǐng)的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在存儲(chǔ)介質(zhì)中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施方式或者實(shí)施方式的某些部分所述的方法。
以上所描述的裝置實(shí)施方式僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施方式方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。
本申請(qǐng)可用于眾多通用或?qū)S玫挠?jì)算系統(tǒng)環(huán)境或配置中。例如:個(gè)人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、置頂盒、可編程的消費(fèi)電子設(shè)備、網(wǎng)絡(luò)PC、小型計(jì)算機(jī)、大型計(jì)算機(jī)、包括以上任何系統(tǒng)或設(shè)備的分布式計(jì)算環(huán)境等等。
本申請(qǐng)可以在由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計(jì)算環(huán)境中實(shí)踐本申請(qǐng),在這些分布式計(jì)算環(huán)境中,由通過通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序模塊可以位于包括存儲(chǔ)設(shè)備在內(nèi)的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。
在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“示例”、“具體示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對(duì)上述術(shù)語的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
以上內(nèi)容僅僅是對(duì)本發(fā)明結(jié)構(gòu)所作的舉例和說明,所屬本技術(shù)領(lǐng)域的技術(shù)人員對(duì)所描述的具體實(shí)施例做各種各樣的修改或補(bǔ)充或采用類似的方式替代,只要不偏離發(fā)明的結(jié)構(gòu)或者超越本權(quán)利要求書所定義的范圍,均應(yīng)屬于本發(fā)明的保護(hù)范圍。