播放多媒體文件的方法及裝置的制造方法
【專利摘要】本發(fā)明公開了一種播放多媒體文件的方法及裝置。方法包括:獲取用戶輸入的檢索信息;根據(jù)檢索信息查詢多媒體信息數(shù)據(jù)庫,獲取候選多媒體信息記錄,候選多媒體信息記錄包括多媒體信息數(shù)據(jù)庫中與檢索信息相匹配的多媒體信息記錄;輸出候選多媒體信息記錄;接收用戶針對候選多媒體信息記錄的選擇指令,其中,該選擇指令用于指示用戶從候選多媒體信息記錄中選出的目標(biāo)多媒體信息記錄;根據(jù)目標(biāo)多媒體信息記錄中的時段信息,播放目標(biāo)多媒體信息記錄中的多媒體文件標(biāo)識信息所表示的多媒體文件。由此,可以節(jié)省用戶在搜索多媒體文件的過程中的決策時間,提高多媒體文件檢索的工作效率。
【專利說明】
播放多媒體文件的方法及裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及視頻搜索播放領(lǐng)域,具體地,涉及一種播放多媒體文件的方法及裝置。 【背景技術(shù)】
[0002]視頻素材的管理和檢索是好多擁有視頻素材廠商的痛點(diǎn)。不同于文本檢索可以通過輸入關(guān)鍵字的匹配進(jìn)行查找,視頻文件的檢索通常都是由人工方法將視頻中講述的“內(nèi)容”以手工的方式標(biāo)記出來,比如一個視頻中含有小明出席了同學(xué)聚會,手工人員會將小明、同學(xué)聚會等關(guān)鍵詞記錄下來并與視頻文件捆綁。檢索視頻時可以通過輸入小明或同學(xué)聚會的關(guān)鍵字找到該視頻。但是,如果使用者想要了解在該視頻文件中何時出現(xiàn)了小明或同學(xué)聚會,則檢索到結(jié)果后,使用者還需要對全片視頻文件進(jìn)行預(yù)覽才能得到想要的結(jié)果, 這就導(dǎo)致費(fèi)時費(fèi)力,檢索效率低下。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的是提供一種播放多媒體文件的方法及裝置,以節(jié)省用戶在搜索多媒體文件的過程中的決策時間,提高多媒體文件檢索的工作效率。
[0004]為了實(shí)現(xiàn)上述目的,本發(fā)明提供一種播放多媒體文件的方法,所述方法包括:獲取用戶輸入的檢索信息;根據(jù)所述檢索信息查詢多媒體信息數(shù)據(jù)庫,獲取候選多媒體信息記錄,所述候選多媒體信息記錄包括所述多媒體信息數(shù)據(jù)庫中與所述檢索信息相匹配的多媒體信息記錄,其中,所述多媒體信息數(shù)據(jù)庫中預(yù)置有至少一條多媒體信息記錄,每條多媒體信息記錄包括以下:多媒體文件標(biāo)識信息,時段信息,以及在所述多媒體文件標(biāo)識信息所表示的多媒體文件中、與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息,其中,所述多媒體內(nèi)容的標(biāo)識信息用于與所述檢索信息進(jìn)行匹配;輸出所述候選多媒體信息記錄;接收用戶針對所述候選多媒體信息記錄的選擇指令,其中,所述選擇指令用于指示用戶從所述候選多媒體信息記錄中選出的目標(biāo)多媒體信息記錄;根據(jù)所述目標(biāo)多媒體信息記錄中的所述時段信息,播放所述目標(biāo)多媒體信息記錄中的所述多媒體文件標(biāo)識信息所表示的多媒體文件。
[0005]可選地,所述根據(jù)所述檢索信息查詢多媒體信息數(shù)據(jù)庫,獲取候選多媒體信息記錄,包括:將所述檢索信息與所述多媒體信息數(shù)據(jù)庫中的所述多媒體內(nèi)容的標(biāo)識信息進(jìn)行匹配;將與所述檢索信息相匹配的所述多媒體內(nèi)容的標(biāo)識信息所在的多媒體信息記錄獲取為是所述候選多媒體信息記錄。
[0006]可選地,在輸出的所述候選多媒體信息記錄中,所述多媒體內(nèi)容的標(biāo)識信息用于用戶選擇所述目標(biāo)多媒體信息記錄。
[0007]可選地,所述多媒體內(nèi)容的標(biāo)識信息為所述多媒體內(nèi)容的文本信息;以及所述輸出所述候選多媒體信息記錄,包括:顯示所述候選多媒體信息記錄,并將所述候選多媒體信息記錄中包括的所述多媒體內(nèi)容的標(biāo)識信息中、與所述檢索信息相一致的部分突出顯示。
[0008]可選地,所述多媒體信息數(shù)據(jù)庫通過以下方式來建立:從多媒體資源庫獲取多媒體文件和與所述多媒體文件相對應(yīng)的多媒體文件標(biāo)識信息;按照預(yù)設(shè)的時間間隔為所述多媒體文件添加時間戳,其中,相鄰兩個時間戳用于限定所述多媒體文件的時段信息;針對每個所述時段信息,對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容進(jìn)行識別,得到與所述時段信息相對應(yīng)的多媒體內(nèi)容的文本信息,其中,所述文本信息作為所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息;針對每個所述時段信息,將所述多媒體文件標(biāo)識信息、所述時段信息、以及所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息作為一條多媒體信息記錄存儲在所述多媒體信息數(shù)據(jù)庫中。
[0009]可選地,所述對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容進(jìn)行識另IJ,得到與所述時段信息相對應(yīng)的多媒體內(nèi)容的文本信息,包括:對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的字幕部分進(jìn)行文字識別,得到字幕識別結(jié)果;對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的語音部分進(jìn)行語音識別,得到語音識別結(jié)果;以及根據(jù)所述字幕識別結(jié)果和所述語音識別結(jié)果,得到與所述時段信息相對應(yīng)的多媒體內(nèi)容的文本信息。
[0010]本發(fā)明還提供一種播放多媒體文件的裝置,所述裝置包括:檢索信息獲取模塊,被配置為獲取用戶輸入的檢索信息;查詢模塊,被配置為根據(jù)所述檢索信息查詢多媒體信息數(shù)據(jù)庫,獲取候選多媒體信息記錄,所述候選多媒體信息記錄包括所述多媒體信息數(shù)據(jù)庫中與所述檢索信息相匹配的多媒體信息記錄,其中,所述多媒體信息數(shù)據(jù)庫中預(yù)置有至少一條多媒體信息記錄,每條多媒體信息記錄包括以下:多媒體文件標(biāo)識信息,時段信息,以及在所述多媒體文件標(biāo)識信息所表示的多媒體文件中、與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息,其中,所述多媒體內(nèi)容的標(biāo)識信息用于與所述檢索信息進(jìn)行匹配;輸出模塊,被配置為輸出所述候選多媒體信息記錄;選擇指令接收模塊,被配置為接收用戶針對所述候選多媒體信息記錄的選擇指令,其中,所述選擇指令用于指示用戶從所述候選多媒體信息記錄中選出的目標(biāo)多媒體信息記錄;播放模塊,被配置為根據(jù)所述目標(biāo)多媒體信息記錄中的所述時段信息,播放所述目標(biāo)多媒體信息記錄中的所述多媒體文件標(biāo)識信息所表示的多媒體文件。
[0011]可選地,所述查詢模塊包括:匹配子模塊,被配置為將所述檢索信息與所述多媒體信息數(shù)據(jù)庫中的所述多媒體內(nèi)容的標(biāo)識信息進(jìn)行匹配;第一獲取子模塊,被配置為將與所述檢索信息相匹配的所述多媒體內(nèi)容的標(biāo)識信息所在的多媒體信息記錄獲取為是所述候選多媒體信息記錄。
[0012]可選地,在所述輸出模塊輸出的所述候選多媒體信息記錄中,所述多媒體內(nèi)容的標(biāo)識信息用于用戶選擇所述目標(biāo)多媒體信息記錄。
[0013]可選地,所述多媒體內(nèi)容的標(biāo)識信息為所述多媒體內(nèi)容的文本信息;以及所述輸出模塊包括:顯示子模塊,被配置為顯示所述候選多媒體信息記錄,并將所述候選多媒體信息記錄中包括的所述多媒體內(nèi)容的標(biāo)識信息中、與所述檢索信息相一致的部分突出顯示。 [〇〇14]可選地,所述多媒體信息數(shù)據(jù)庫通過多媒體信息數(shù)據(jù)庫建立模塊來建立,并且所述多媒體信息數(shù)據(jù)庫建立模塊包括:第二獲取子模塊,被配置為從多媒體資源庫獲取多媒體文件和與所述多媒體文件相對應(yīng)的多媒體文件標(biāo)識信息;時間戳添加子模塊,被配置為按照預(yù)設(shè)的時間間隔為所述多媒體文件添加時間戳,其中,相鄰兩個時間戳用于限定所述多媒體文件的時段信息;識別子模塊,被配置為針對每個所述時段信息,對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容進(jìn)行識別,得到與所述時段信息相對應(yīng)的多媒體內(nèi)容的文本信息,其中,所述文本信息作為所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息;存儲子模塊,被配置為針對每個所述時段信息,將所述多媒體文件標(biāo)識信息、所述時段信息、以及所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息作為一條多媒體信息記錄存儲在所述多媒體信息數(shù)據(jù)庫中。
[0015]可選地,所述識別子模塊包括:第一識別單元,被配置為對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的字幕部分進(jìn)行文字識別,得到字幕識別結(jié)果;第二識別單元,被配置為對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的語音部分進(jìn)行語音識別,得到語音識別結(jié)果;以及文本信息確定單元,被配置為根據(jù)所述字幕識別結(jié)果和所述語音識別結(jié)果,得到與所述時段信息相對應(yīng)的多媒體內(nèi)容的文本信息。
[0016]在上述技術(shù)方案中,由于反饋給用戶的與其檢索信息相匹配的多媒體信息記錄中包含有時段信息,因此,當(dāng)用戶選定某個多媒體信息記錄作為目標(biāo)多媒體信息記錄時,可以直接根據(jù)該目標(biāo)多媒體信息記錄中的時段信息,來播放該目標(biāo)多媒體信息記錄中的多媒體文件標(biāo)識信息所表示的多媒體文件。這樣,用戶無需全部瀏覽完整的多媒體文件,只需要花費(fèi)較短時間就能了解該多媒體文件是否是想要的素材,因此,節(jié)省了用戶在搜索多媒體文件的過程中的決策時間,提升了多媒體文件檢索的工作效率。
[0017]本發(fā)明的其他特征和優(yōu)點(diǎn)將在隨后的【具體實(shí)施方式】部分予以詳細(xì)說明?!靖綀D說明】
[0018]附圖是用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與下面的【具體實(shí)施方式】一起用于解釋本發(fā)明,但并不構(gòu)成對本發(fā)明的限制。在附圖中:
[0019]圖1是根據(jù)本發(fā)明的實(shí)施方式的建立多媒體信息數(shù)據(jù)庫的方法的流程圖;
[0020]圖2是一示例多媒體文件分割并添加時間戳的示意圖;[0021 ]圖3是一示例多媒體信息數(shù)據(jù)庫的示意圖;
[0022]圖4是根據(jù)本發(fā)明的實(shí)施方式的播放多媒體文件的方法的流程圖;
[0023]圖5A至圖5C示出了根據(jù)本發(fā)明的實(shí)施方式的播放多媒體文件的裝置的框圖。
[0024]圖6A至圖6B示出了根據(jù)本發(fā)明的實(shí)施方式的多媒體信息數(shù)據(jù)庫建立模塊的框圖?!揪唧w實(shí)施方式】
[0025]以下結(jié)合附圖對本發(fā)明的【具體實(shí)施方式】進(jìn)行詳細(xì)說明。應(yīng)當(dāng)理解的是,此處所描述的【具體實(shí)施方式】僅用于說明和解釋本發(fā)明,并不用于限制本發(fā)明。
[0026]在本發(fā)明中,多媒體文件可以包括但不限于視頻文件、音頻文件等。[〇〇27]在詳細(xì)描述本發(fā)明提供的播放多媒體文件的方法之前,先描述一下如何建立多媒體信息數(shù)據(jù)庫的方法,以為后續(xù)多媒體文件檢索建立基礎(chǔ)。
[0028]圖1示出了根據(jù)本發(fā)明的實(shí)施方式的建立多媒體信息數(shù)據(jù)庫的方法的流程圖。如圖1所示,該方法可以包括:[〇〇29]在步驟101中,從多媒體資源庫獲取多媒體文件和與該多媒體文件相對應(yīng)的多媒體文件標(biāo)識信息。
[0030]在多媒體資源庫中存儲有大量的多媒體文件,可以首先獲取其中一個多媒體文件及該多媒體文件相對應(yīng)的多媒體文件標(biāo)識信息,并針對該多媒體文件進(jìn)行以下處理。之后,再一一遍歷該多媒體資源庫中包含的其他多媒體文件,利用同樣的方法進(jìn)行處理,從而完成多媒體信息數(shù)據(jù)庫的建立。
[0031]在本發(fā)明中,多媒體文件標(biāo)識信息可以用于唯一地表示所對應(yīng)的多媒體文件。其中,該多媒體文件標(biāo)識信息可以例如為所對應(yīng)的多媒體文件的編號、名稱等等。
[0032]在步驟102中,按照預(yù)設(shè)的時間間隔為多媒體文件添加時間戳,其中,相鄰兩個時間戳用于限定該多媒體文件的時段信息。
[0033]預(yù)設(shè)的時間間隔可以視實(shí)際需求來設(shè)定,通常設(shè)定得相對較短,例如,5秒。也就是說,從該多媒體文件的起始處開始,每隔5秒為該多媒體文件添加時間戳。通過這一步驟,可以將一個完整的多媒體文件分割成多個多媒體文件片段,并且每個多媒體文件片段對應(yīng)一個時段信息。
[0034]例如,如圖2所示,假設(shè)一個完整的多媒體文件(其相對應(yīng)的多媒體文件標(biāo)識為 “001”)的總時長為1分鐘,那么按照每隔5秒添加時間戳,則該多媒體文件可以總共被分割成12個多媒體文件片段S1?S12。相鄰兩個時間戳可以限定一個時段信息,這樣,每個多媒體文件片段就可以對應(yīng)一個時段信息。例如,如圖2所示,S1所對應(yīng)的時段信息可以為“00: 00-00:05”,S2所對應(yīng)的時段信息可以為“00:05-00:10”,S3所對應(yīng)的時段信息可以為“00: 10-00:15”,依次類推。
[0035]在步驟103中,針對每個時段信息,對多媒體文件中與該時段信息相對應(yīng)的多媒體內(nèi)容進(jìn)行識別,得到與該時段信息相對應(yīng)的多媒體內(nèi)容的文本信息,其中,該文本信息作為多媒體文件中與該時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息。
[0036]例如,假設(shè)針對圖2所示的多媒體文件,針對“00:05-00:10”這一時段信息,可以針對與該時段信息相對應(yīng)的多媒體內(nèi)容(即,多媒體文件片段S2中包含的多媒體內(nèi)容)進(jìn)行識另IJ,得到關(guān)于該多媒體內(nèi)容的文本信息。
[0037]在進(jìn)行識別時,可以采用文字識別技術(shù)或語音識別技術(shù)進(jìn)行識別。例如,在一個實(shí)施方式中,針對有字幕的視頻文件,可以利用文字識別技術(shù)(例如,0CR(0ptical Character Recognit1n)光學(xué)字符識別技術(shù))來識別出字幕部分對應(yīng)的文本信息,并將該文本信息作為相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息?;蛘?,在另一個實(shí)施方式中,針對無字幕的視頻文件, 可以利用語音識別技術(shù)(ASR,Auto Speech Recognize)來識別出語音部分對應(yīng)的文本信息,并將該文本信息作為相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息。
[0038]在步驟104中,針對每個時段信息,將該多媒體文件標(biāo)識信息、該時段信息、以及該多媒體文件中與該時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息作為一條多媒體信息記錄存儲在多媒體信息數(shù)據(jù)庫中。[〇〇39]例如,假設(shè)針對圖2所示的多媒體文件,經(jīng)過步驟102至步驟104,能夠得到12條多媒體信息記錄,如圖3所示,這12條多媒體信息記錄被存儲在多媒體信息數(shù)據(jù)庫中。
[0040]針對多媒體資源庫中的每一個多媒體文件,都可以按照上述方法處理,由此,完成多媒體信息數(shù)據(jù)庫的建立。另外,一旦多媒體資源庫中有更新,則可以按照上述方法同步更新多媒體信息數(shù)據(jù)庫。
[0041]如上所述,在進(jìn)行識別時,可以采用文字識別技術(shù)或語音識別技術(shù)進(jìn)行識別。不過,OCR技術(shù)在識別一些特定內(nèi)容時精度不高,例如,字母、數(shù)字等。因此,為了提高文本信息的識別準(zhǔn)確率,在本發(fā)明的一個可選的實(shí)施方式中,采用這兩種技術(shù)共同進(jìn)行識別,如下所述。
[0042]在執(zhí)行步驟103時,首先,可以對多媒體文件中與該時段信息相對應(yīng)的多媒體內(nèi)容的字幕部分進(jìn)行文字識別,得到字幕識別結(jié)果。[〇〇43]接下來,對多媒體文件中與該時段信息相對應(yīng)的多媒體內(nèi)容的語音部分進(jìn)行語音識別,得到語音識別結(jié)果。
[0044]最后,根據(jù)字幕識別結(jié)果和語音識別結(jié)果,得到與該時段信息相對應(yīng)的多媒體內(nèi)容的文本信息。
[0045]具體地,首先,字幕識別結(jié)果中可能包括多個字符,該多個字符中可能包括漢字、 外語單詞、字母、數(shù)字或者符號中的一種或者多種,因此可以先將字幕識別結(jié)果進(jìn)行分詞, 用于將所述字幕識別結(jié)果劃分為多個字符集合,每個字符集合中包括一個或多個字符,BP 每個字符集合可能是一個字、詞、句,也可能是一個字母、一個單詞、一個或一組數(shù)字。例如, 假設(shè)字幕為“最早對印刷體漢字識別進(jìn)行研究的是IBM公司的Casey和Nagy,1966年他們發(fā)表了第一篇關(guān)于漢字識別的文章”,在通過OCR對字幕進(jìn)行識別后,假設(shè)得到的字幕識別結(jié)果為“最早對印刷體漢字識別進(jìn)行研究的是IBM公司的Casey和Nagy,1966年他們發(fā)表了第一篇關(guān)于漢字識別的文章”。在對該字幕識別結(jié)果進(jìn)行分詞后,示例地,假設(shè)得到的分詞結(jié)果為:“最早,對,印刷體,漢字識別,進(jìn)行研究的,是,1BM,公司,的,Casey和Nagy,1966,年, 他們,發(fā)表了,第一篇,關(guān)于,漢字識別,的文章”。
[0046]接下來,將上述分詞得到的多個字符集合分別與預(yù)定義的關(guān)鍵詞進(jìn)行對比,在所有的字符集合中查找與預(yù)定義的關(guān)鍵詞匹配的字符集合,與預(yù)定義的關(guān)鍵詞匹配的字符集合就是需要找到的目標(biāo)字符。示例地,預(yù)定義的關(guān)鍵詞可以包括兩類,一類為代表數(shù)字的關(guān)鍵詞,例如:年、月、日,時、分、秒等時間單位,以及重量,體積,價錢等度量單位;另一類為代表字母的關(guān)鍵詞,例如:品牌,公司,地名等名詞形式的詞語。從而,根據(jù)這里的關(guān)鍵詞,可以確定上述分詞得到的多個字符集合“最早,對,印刷體,漢字識別,進(jìn)行研究的,是,1BM,公司,的,Casey和Nagy,1966,年,他們,發(fā)表了,第一篇,關(guān)于,漢字識別,的文章”中與預(yù)定義的關(guān)鍵詞匹配的為“公司”和“年”,從而字幕識別結(jié)果中的目標(biāo)字符就是“公司”和“年”。
[0047]當(dāng)查找到目標(biāo)字符時,確定目標(biāo)字符所匹配的關(guān)鍵詞所屬的分類,分類包括代表數(shù)字的關(guān)鍵詞,或代表字母的關(guān)鍵詞。以上述示例為例,“公司”為代表字母的關(guān)鍵詞,“年” 為代表數(shù)字的關(guān)鍵詞。
[0048]當(dāng)目標(biāo)字符所匹配的關(guān)鍵詞屬于代表數(shù)字的關(guān)鍵詞時,將目標(biāo)字符之前和/或目標(biāo)字符之后的一個或多個字符確定為字符屬性為數(shù)字的字符。
[0049]在本實(shí)施例中,將目標(biāo)字符之前和/或目標(biāo)字符之后的一個或多個字符確定為字符屬性為數(shù)字的字符可以理解為,將目標(biāo)字符之前的,或者目標(biāo)字符之后的,或者目標(biāo)字符前后的確定為字符屬性為數(shù)字的字符,而實(shí)際需要采用上述三種情況中的哪一種可以根據(jù)目標(biāo)字符所匹配的關(guān)鍵詞,以及與該關(guān)鍵詞對應(yīng)的判定策略來確定。示例地,由于年、月、 日,時、分、秒等時間單位,以及重量,體積,價錢等度量單位之前的字符為數(shù)字的可能性大于為字母的可能性,因此其對應(yīng)的判定策略可以為:將目標(biāo)字符之前的字符確定為字符屬性為數(shù)字的字符。[〇〇5〇]因此,由于在上面得到的分詞結(jié)果中,在目標(biāo)字符“年”之前的字符集合為“1966”, 從而結(jié)合之前確定出的“年”為代表數(shù)字的關(guān)鍵詞,以及上述的判定策略,可以將目標(biāo)字符“年”之前的字符集合“1966”確定為字符屬性為數(shù)字的字符。[0051 ]相類似地,當(dāng)目標(biāo)字符所匹配的關(guān)鍵詞屬于代表字母的關(guān)鍵詞時,將目標(biāo)字符之前和/或目標(biāo)字符之后的一個或多個字符確定為字符屬性為字母的字符。
[0052]其中,將目標(biāo)字符之前和/或目標(biāo)字符之后的一個或多個字符確定為字符屬性為字母的字符可以理解為,將目標(biāo)字符之前的,或者目標(biāo)字符之后的,或者目標(biāo)字符前后的確定為字符屬性為字母的字符,而實(shí)際需要采用上述三種情況中的哪一種可以根據(jù)目標(biāo)字符所匹配的關(guān)鍵詞,以及與該關(guān)鍵詞對應(yīng)的判定策略來確定。示例地,由于品牌,公司,地名等名詞形式的詞語之前的字符為字母的可能性大于為數(shù)字的可能性,因此其對應(yīng)的判定策略可以為:將目標(biāo)字符之前的字符確定為字符屬性為字母的字符。[〇〇53]因此,由于在上面得到的分詞結(jié)果中,在目標(biāo)字符“公司”之前的字符集合為 “IBM”,從而結(jié)合之前確定出的“公司”為代表字母的關(guān)鍵詞,以及上述的判定策略,可以將目標(biāo)字符“公司”之前的字符集合“IBM”確定為字符屬性為字母的字符。
[0054]接下來,將字符屬性為字母的字符標(biāo)記為字母,將字符屬性為數(shù)字的字符標(biāo)記為數(shù)字。
[0055]示例地,字符集合“1966”為字符屬性為數(shù)字的字符,字符集合“IBM”為字符屬性為字母的字符,因此,將字符集合“1966”中的字符標(biāo)記為數(shù)字,將字符集合“IBM”中的字符標(biāo)記為字母。
[0056]針對字幕識別結(jié)果中被標(biāo)記為數(shù)字和字母的字符集合,可以利用語音識別結(jié)果來對其進(jìn)行驗(yàn)證,并在驗(yàn)證有誤時利用語音識別結(jié)果對其進(jìn)行校正。
[0057]示例地,如上所述,字幕識別結(jié)果為“最早對印刷體漢字識別進(jìn)行研究的是IBM公司的Casey和Nagy,1966年他們發(fā)表了第一篇關(guān)于漢字識別的文章”,按照以上方式,能夠確定出“1966”為數(shù)字,“IBM”為字母。隨后,通過結(jié)合語音識別結(jié)果對其進(jìn)行驗(yàn)證,發(fā)現(xiàn)OCR進(jìn)行字幕識別的結(jié)果中將“1966”錯誤地識別為“1966”,以及將“IBM”錯誤地識別為“IBM”。這時,通過語音識別結(jié)果對其進(jìn)行校正,利用語音識別結(jié)果中的“1966”和“IBM”這兩個內(nèi)容分別替換字幕識別結(jié)果中的相應(yīng)內(nèi)容,即“1966”和“IBM”。這樣,就能夠得到與時段信息相對應(yīng)的多媒體內(nèi)容的文本信息為“最早對印刷體漢字識別進(jìn)行研究的是IBM公司的Casey和 Nagy,1966年他們發(fā)表了第一篇關(guān)于漢字識別的文章”。[〇〇58]通過結(jié)合OCR和ASR技術(shù)得到多媒體內(nèi)容的文本信息,可以提高識別準(zhǔn)確率,兩種技術(shù)所得結(jié)果之間可以進(jìn)行交叉校驗(yàn),從而確保獲取到正確的文本信息,為后續(xù)的檢索提供準(zhǔn)確的數(shù)據(jù)支持。[〇〇59]圖4示出了根據(jù)本發(fā)明的實(shí)施方式的播放多媒體文件的方法的流程圖。其中,該方法可以應(yīng)用于各種類型的電子設(shè)備,例如,服務(wù)器、終端(包括個人計算機(jī)、智能手機(jī)、平板電腦等)等等。如圖4所示,該方法可以包括以下步驟:
[0060]在步驟401中,獲取用戶輸入的檢索信息。
[0061]用戶可以通過各種類型的信息輸入設(shè)備來輸入該檢索信息,其中,所述信息輸入設(shè)備可以例如包括鍵盤、觸摸屏等等。另外,該檢索信息可以包括至少一個關(guān)鍵詞,或者也可以為一句話、一段話。[〇〇62]在步驟402中,根據(jù)檢索信息查詢多媒體信息數(shù)據(jù)庫,獲取候選多媒體信息記錄, 其中,該候選多媒體信息記錄包括多媒體信息數(shù)據(jù)庫中與檢索信息相匹配的多媒體信息記錄。并且,如上所述,多媒體信息數(shù)據(jù)庫中預(yù)置有至少一條多媒體信息記錄,每條多媒體信息記錄可以包括以下:多媒體文件標(biāo)識信息,時段信息,以及在多媒體文件標(biāo)識信息所表示的多媒體文件中、與該時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息,其中,該多媒體內(nèi)容的標(biāo)識信息用于與檢索信息進(jìn)行匹配。
[0063]示例地,當(dāng)檢索信息包括一個或多個關(guān)鍵詞時,可以直接利用所包括的關(guān)鍵詞查詢多媒體信息數(shù)據(jù)庫。當(dāng)檢索信息包括一句話或者一段話時,在查詢多媒體信息數(shù)據(jù)庫之前,可以首先對檢索信息進(jìn)行分詞處理,之后,利用所得到的分詞查詢多媒體信息數(shù)據(jù)庫。
[0064]在獲取與檢索信息相匹配的多媒體信息記錄時,可以首先將檢索信息與多媒體信息數(shù)據(jù)庫中的多媒體內(nèi)容的標(biāo)識信息進(jìn)行匹配,例如,如圖3所示,將檢索信息與多媒體信息數(shù)據(jù)庫中的“多媒體內(nèi)容的標(biāo)識信息”這一列字段中的內(nèi)容進(jìn)行匹配。示例地,判斷檢索信息與某個多媒體內(nèi)容的標(biāo)識信息是否匹配可以基于以下準(zhǔn)則:該多媒體內(nèi)容的標(biāo)識信息是否包含檢索信息中的內(nèi)容。當(dāng)滿足上述準(zhǔn)則時,確定檢索信息與該多媒體內(nèi)容的標(biāo)識信息相匹配,否則,確定檢索信息與該多媒體內(nèi)容的標(biāo)識信息不匹配。
[0065]接下來,將與檢索信息相匹配的多媒體內(nèi)容的標(biāo)識信息所在的多媒體信息記錄獲取為是與檢索信息相匹配的多媒體信息記錄,即,上述候選多媒體信息記錄。例如,假設(shè)用戶輸入的檢索信息為“天津爆炸”,則通過查詢?nèi)鐖D3所示的多媒體信息數(shù)據(jù)庫,可以確定與該檢索信息相匹配的多媒體信息記錄為第1條多媒體信息記錄,獲取該條多媒體信息記錄作為候選多媒體信息記錄。[0〇66]在步驟403中,輸出候選多媒體信息記錄。
[0067]在輸出候選多媒體信息記錄時,可以例如通過顯示的方式將獲取到的候選多媒體信息記錄顯示出來,呈現(xiàn)方式可以例如采用列表的方式。另外,如上所述,多媒體內(nèi)容的標(biāo)識信息為該多媒體內(nèi)容的文本信息。這樣,在顯示候選多媒體信息記錄時,還可以將該候選多媒體信息記錄中包括的多媒體內(nèi)容的標(biāo)識信息中、與檢索信息相一致的部分突出顯示, 其中,突出顯示的方式包括但不限于以下中的至少一者:放大、標(biāo)紅、加粗、加下劃線、變斜體等。例如,假設(shè)檢索信息為“天津爆炸”,那么在顯示圖3中的第1條多媒體信息記錄時,可以將該多媒體信息記錄中包括的多媒體內(nèi)容的標(biāo)識信息中的“天津”和“爆炸”字樣突出顯示,以便于用戶更方便且清晰地查看和判斷檢索到的多媒體信息記錄是否符合預(yù)期,從而便于用戶快速了解多媒體文件的概要內(nèi)容。
[0068]在步驟404中,接收用戶針對候選多媒體信息記錄的選擇指令,其中,該選擇指令用于指示用戶從候選多媒體信息記錄中選出的目標(biāo)多媒體信息記錄。
[0069]輸出候選多媒體信息記錄的目的在于向用戶反饋檢索結(jié)果。當(dāng)滿足用戶檢測條件的結(jié)果反饋給用戶時,用戶可以根據(jù)自身需求來從中選擇哪個或哪些多媒體信息記錄為目標(biāo)多媒體信息記錄,即,用戶期望的多媒體信息記錄。
[0070]在用戶選擇目標(biāo)多媒體信息記錄時,在一種實(shí)施方式中,用戶可以任意選取其中的一個或一些多媒體信息記錄作為目標(biāo)多媒體信息記錄。或者,在另一種實(shí)施方式中,在輸出的候選多媒體信息記錄中,多媒體內(nèi)容的標(biāo)識信息用于用戶選擇目標(biāo)多媒體信息記錄。 也就是說,用戶可以通過閱讀候選多媒體信息記錄中的多媒體內(nèi)容的標(biāo)識信息,來快速了解相應(yīng)多媒體內(nèi)容的概要,并選取其中感興趣的多媒體信息記錄作為目標(biāo)多媒體信息記錄。
[0071]當(dāng)用戶做出選擇時,通過步驟404,執(zhí)行該方法的電子設(shè)備可以接收到選擇指令, 并且在該選擇指令中指示了用戶期望的多媒體信息記錄,即,目標(biāo)多媒體信息記錄。
[0072]在步驟405中,根據(jù)目標(biāo)多媒體信息記錄中的時段信息,播放目標(biāo)多媒體信息記錄中的多媒體文件標(biāo)識信息所表示的多媒體文件。
[0073]當(dāng)接收到選擇指令之后,可以確定出目標(biāo)多媒體信息記錄是哪條。在執(zhí)行該方法的電子設(shè)備中可以配置有播放模塊,在這種情況下,播放模塊可以首先根據(jù)該目標(biāo)多媒體信息記錄中的多媒體文件標(biāo)識信息確定要播放哪個多媒體文件,之后,再根據(jù)該目標(biāo)多媒體信息記錄中的時段信息確定要播放該多媒體文件中的哪部分多媒體內(nèi)容。在一個實(shí)施方式中,播放模塊可以只播放該多媒體文件中與該時段信息相對應(yīng)的多媒體內(nèi)容。或者,在另一個實(shí)施方式中,播放模塊可以將該時段信息作為播放起始點(diǎn),從該多媒體文件中與該時段信息對應(yīng)的多媒體內(nèi)容開始向后播放。
[0074]通過根據(jù)時段信息來播放多媒體文件,可以實(shí)現(xiàn)定位播放。
[0075]綜上所述,在上述技術(shù)方案中,由于反饋給用戶的與其檢索信息相匹配的多媒體信息記錄中包含有時段信息,因此,當(dāng)用戶選定某個多媒體信息記錄作為目標(biāo)多媒體信息記錄時,可以直接根據(jù)該目標(biāo)多媒體信息記錄中的時段信息,來播放該目標(biāo)多媒體信息記錄中的多媒體文件標(biāo)識信息所表示的多媒體文件。這樣,用戶無需全部瀏覽完整的多媒體文件,只需要花費(fèi)較短時間就能了解該多媒體文件是否是想要的素材。例如,針對一個30分鐘的視頻文件,用戶不用全部瀏覽,使用該方法后只需要5分鐘就能了解視頻是否是想要的素材。因此,有效節(jié)省了用戶在搜索多媒體文件的過程中的決策時間,提升了多媒體文件檢索的工作效率。[〇〇76]圖5A至圖5C示出了根據(jù)本發(fā)明的實(shí)施方式的播放多媒體文件的裝置500的框圖。 其中,該裝置500可以配置于各種類型的電子設(shè)備,例如,服務(wù)器、終端(包括個人計算機(jī)、智能手機(jī)、平板電腦等)等等。如圖5A所示,該裝置500可以包括:
[0077]檢索信息獲取模塊510,被配置為獲取用戶輸入的檢索信息;
[0078]查詢模塊520,被配置為根據(jù)所述檢索信息查詢多媒體信息數(shù)據(jù)庫,獲取候選多媒體信息記錄,所述候選多媒體信息記錄包括所述多媒體信息數(shù)據(jù)庫中與所述檢索信息相匹配的多媒體信息記錄,其中,所述多媒體信息數(shù)據(jù)庫中預(yù)置有至少一條多媒體信息記錄,每條多媒體信息記錄包括以下:多媒體文件標(biāo)識信息,時段信息,以及在所述多媒體文件標(biāo)識信息所表示的多媒體文件中、與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息,其中,所述多媒體內(nèi)容的標(biāo)識信息用于與所述檢索信息進(jìn)行匹配;
[0079]輸出模塊530,被配置為輸出所述候選多媒體信息記錄;
[0080]選擇指令接收模塊540,被配置為接收用戶針對所述候選多媒體信息記錄的選擇指令,其中,所述選擇指令用于指示用戶從所述候選多媒體信息記錄中選出的目標(biāo)多媒體信息記錄;[0081 ]播放模塊550,被配置為根據(jù)所述目標(biāo)多媒體信息記錄中的所述時段信息,播放所述目標(biāo)多媒體信息記錄中的所述多媒體文件標(biāo)識信息所表示的多媒體文件。
[0082]綜上所述,在上述技術(shù)方案中,由于反饋給用戶的與其檢索信息相匹配的多媒體信息記錄中包含有時段信息,因此,當(dāng)用戶選定某個多媒體信息記錄作為目標(biāo)多媒體信息記錄時,可以直接根據(jù)該目標(biāo)多媒體信息記錄中的時段信息,來播放該目標(biāo)多媒體信息記錄中的多媒體文件標(biāo)識信息所表示的多媒體文件。這樣,用戶無需全部瀏覽完整的多媒體文件,只需要花費(fèi)較短時間就能了解該多媒體文件是否是想要的素材。例如,針對一個30分鐘的視頻文件,用戶不用全部瀏覽,使用該方法后只需要5分鐘就能了解視頻是否是想要的素材。因此,有效節(jié)省了用戶在搜索多媒體文件的過程中的決策時間,提升了多媒體文件檢索的工作效率。[〇〇83] 可選地,如圖5B所示,所述查詢模塊520可以包括:
[0084]匹配子模塊521,被配置為將所述檢索信息與所述多媒體信息數(shù)據(jù)庫中的所述多媒體內(nèi)容的標(biāo)識信息進(jìn)行匹配;
[0085]第一獲取子模塊522,被配置為將與所述檢索信息相匹配的所述多媒體內(nèi)容的標(biāo)識信息所在的多媒體信息記錄獲取為是所述候選多媒體信息記錄。
[0086]可選地,在所述輸出模塊530輸出的所述候選多媒體信息記錄中,所述多媒體內(nèi)容的標(biāo)識信息用于用戶選擇所述目標(biāo)多媒體信息記錄。
[0087]可選地,如上所述,多媒體內(nèi)容的標(biāo)識信息為該多媒體內(nèi)容的文本信息。這樣,如圖5C所示,所述輸出模塊530可以包括:[〇〇88]顯示子模塊531,被配置為顯示所述候選多媒體信息記錄,并將所述候選多媒體信息記錄中包括的所述多媒體內(nèi)容的標(biāo)識信息中、與所述檢索信息相一致的部分突出顯示。 [〇〇89]可選地,所述多媒體信息數(shù)據(jù)庫通過多媒體信息數(shù)據(jù)庫建立模塊來建立,其中,該多媒體信息數(shù)據(jù)庫建立模塊可以配置于上述播放多媒體文件的裝置500中,或者可以與上述播放多媒體文件的裝置500相獨(dú)立。圖6A至圖6B示出了根據(jù)本發(fā)明的實(shí)施方式的多媒體信息數(shù)據(jù)庫建立模塊600的框圖。如圖6A所示,所述多媒體信息數(shù)據(jù)庫建立模塊600可以包括:
[0090]第二獲取子模塊610,被配置為從多媒體資源庫獲取多媒體文件和與所述多媒體文件相對應(yīng)的多媒體文件標(biāo)識信息;
[0091]時間戳添加子模塊620,被配置為按照預(yù)設(shè)的時間間隔為所述多媒體文件添加時間戳,其中,相鄰兩個時間戳用于限定所述多媒體文件的時段信息;
[0092]識別子模塊630,被配置為針對每個所述時段信息,對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容進(jìn)行識別,得到與所述時段信息相對應(yīng)的多媒體內(nèi)容的文本信息,其中,所述文本信息作為所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息;[〇〇93]存儲子模塊640,被配置為針對每個所述時段信息,將所述多媒體文件標(biāo)識信息、 所述時段信息、以及所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息作為一條多媒體信息記錄存儲在所述多媒體信息數(shù)據(jù)庫中。[〇〇94] 可選地,如圖6B所示,所述識別子模塊630可以包括:
[0095]第一識別單元631,被配置為對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的字幕部分進(jìn)行文字識別,得到字幕識別結(jié)果;
[0096]第二識別單元632,被配置為對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的語音部分進(jìn)行語音識別,得到語音識別結(jié)果;以及
[0097]文本信息確定單元633,被配置為根據(jù)所述字幕識別結(jié)果和所述語音識別結(jié)果,得到與所述時段信息相對應(yīng)的多媒體內(nèi)容的文本信息。
[0098]關(guān)于上述實(shí)施例中的裝置,其中各個模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說明。
[0099]以上結(jié)合附圖詳細(xì)描述了本發(fā)明的優(yōu)選實(shí)施方式,但是,本發(fā)明并不限于上述實(shí)施方式中的具體細(xì)節(jié),在本發(fā)明的技術(shù)構(gòu)思范圍內(nèi),可以對本發(fā)明的技術(shù)方案進(jìn)行多種簡單變型,這些簡單變型均屬于本發(fā)明的保護(hù)范圍。
[0100]另外需要說明的是,在上述【具體實(shí)施方式】中所描述的各個具體技術(shù)特征,在不矛盾的情況下,可以通過任何合適的方式進(jìn)行組合。為了避免不必要的重復(fù),本發(fā)明對各種可能的組合方式不再另行說明。
[0101]此外,本發(fā)明的各種不同的實(shí)施方式之間也可以進(jìn)行任意組合,只要其不違背本發(fā)明的思想,其同樣應(yīng)當(dāng)視為本發(fā)明所公開的內(nèi)容。
【主權(quán)項(xiàng)】
1.一種播放多媒體文件的方法,其特征在于,所述方法包括:獲取用戶輸入的檢索信息;根據(jù)所述檢索信息查詢多媒體信息數(shù)據(jù)庫,獲取候選多媒體信息記錄,所述候選多媒 體信息記錄包括所述多媒體信息數(shù)據(jù)庫中與所述檢索信息相匹配的多媒體信息記錄,其 中,所述多媒體信息數(shù)據(jù)庫中預(yù)置有至少一條多媒體信息記錄,每條多媒體信息記錄包括 以下:多媒體文件標(biāo)識信息,時段信息,以及在所述多媒體文件標(biāo)識信息所表示的多媒體文 件中、與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息,其中,所述多媒體內(nèi)容的標(biāo)識信息 用于與所述檢索信息進(jìn)行匹配;輸出所述候選多媒體信息記錄;接收用戶針對所述候選多媒體信息記錄的選擇指令,其中,所述選擇指令用于指示用 戶從所述候選多媒體信息記錄中選出的目標(biāo)多媒體信息記錄;根據(jù)所述目標(biāo)多媒體信息記錄中的所述時段信息,播放所述目標(biāo)多媒體信息記錄中的 所述多媒體文件標(biāo)識信息所表示的多媒體文件。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述檢索信息查詢多媒體信息數(shù) 據(jù)庫,獲取候選多媒體信息記錄,包括:將所述檢索信息與所述多媒體信息數(shù)據(jù)庫中的所述多媒體內(nèi)容的標(biāo)識信息進(jìn)行匹配;將與所述檢索信息相匹配的所述多媒體內(nèi)容的標(biāo)識信息所在的多媒體信息記錄獲取 為是所述候選多媒體信息記錄。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在輸出的所述候選多媒體信息記錄中,所 述多媒體內(nèi)容的標(biāo)識信息用于用戶選擇所述目標(biāo)多媒體信息記錄。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述多媒體內(nèi)容的標(biāo)識信息為所述多媒體 內(nèi)容的文本信息;以及所述輸出所述候選多媒體信息記錄,包括:顯示所述候選多媒體信息記錄,并將所述候選多媒體信息記錄中包括的所述多媒體內(nèi) 容的標(biāo)識信息中、與所述檢索信息相一致的部分突出顯示。5.根據(jù)權(quán)利要求1-4中任一項(xiàng)所述的方法,其特征在于,所述多媒體信息數(shù)據(jù)庫通過以 下方式來建立:從多媒體資源庫獲取多媒體文件和與所述多媒體文件相對應(yīng)的多媒體文件標(biāo)識信息;按照預(yù)設(shè)的時間間隔為所述多媒體文件添加時間戳,其中,相鄰兩個時間戳用于限定 所述多媒體文件的時段信息;針對每個所述時段信息,對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容進(jìn) 行識別,得到與所述時段信息相對應(yīng)的多媒體內(nèi)容的文本信息,其中,所述文本信息作為所 述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息;針對每個所述時段信息,將所述多媒體文件標(biāo)識信息、所述時段信息、以及所述多媒體 文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息作為一條多媒體信息記錄存儲在 所述多媒體信息數(shù)據(jù)庫中。6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述對所述多媒體文件中與所述時段信息 相對應(yīng)的多媒體內(nèi)容進(jìn)行識別,得到與所述時段信息相對應(yīng)的多媒體內(nèi)容的文本信息,包 括:對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的字幕部分進(jìn)行文字識別, 得到字幕識別結(jié)果;對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的語音部分進(jìn)行語音識別, 得到語音識別結(jié)果;以及根據(jù)所述字幕識別結(jié)果和所述語音識別結(jié)果,得到與所述時段信息相對應(yīng)的多媒體內(nèi) 容的文本信息。7.—種播放多媒體文件的裝置,其特征在于,所述裝置包括:檢索信息獲取模塊,被配置為獲取用戶輸入的檢索信息;查詢模塊,被配置為根據(jù)所述檢索信息查詢多媒體信息數(shù)據(jù)庫,獲取候選多媒體信息 記錄,所述候選多媒體信息記錄包括所述多媒體信息數(shù)據(jù)庫中與所述檢索信息相匹配的多 媒體信息記錄,其中,所述多媒體信息數(shù)據(jù)庫中預(yù)置有至少一條多媒體信息記錄,每條多媒 體信息記錄包括以下:多媒體文件標(biāo)識信息,時段信息,以及在所述多媒體文件標(biāo)識信息所 表示的多媒體文件中、與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息,其中,所述多媒體 內(nèi)容的標(biāo)識信息用于與所述檢索信息進(jìn)行匹配;輸出模塊,被配置為輸出所述候選多媒體信息記錄;選擇指令接收模塊,被配置為接收用戶針對所述候選多媒體信息記錄的選擇指令,其 中,所述選擇指令用于指示用戶從所述候選多媒體信息記錄中選出的目標(biāo)多媒體信息記 錄;播放模塊,被配置為根據(jù)所述目標(biāo)多媒體信息記錄中的所述時段信息,播放所述目標(biāo) 多媒體信息記錄中的所述多媒體文件標(biāo)識信息所表示的多媒體文件。8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述查詢模塊包括:匹配子模塊,被配置為將所述檢索信息與所述多媒體信息數(shù)據(jù)庫中的所述多媒體內(nèi)容 的標(biāo)識信息進(jìn)行匹配;第一獲取子模塊,被配置為將與所述檢索信息相匹配的所述多媒體內(nèi)容的標(biāo)識信息所 在的多媒體信息記錄獲取為是所述候選多媒體信息記錄。9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,在所述輸出模塊輸出的所述候選多媒體信 息記錄中,所述多媒體內(nèi)容的標(biāo)識信息用于用戶選擇所述目標(biāo)多媒體信息記錄。10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述多媒體內(nèi)容的標(biāo)識信息為所述多媒 體內(nèi)容的文本信息;以及所述輸出模塊包括:顯示子模塊,被配置為顯示所述候選多媒體信息記錄,并將所述候選多媒體信息記錄 中包括的所述多媒體內(nèi)容的標(biāo)識信息中、與所述檢索信息相一致的部分突出顯示。11.根據(jù)權(quán)利要求7-10中任一項(xiàng)所述的裝置,其特征在于,所述多媒體信息數(shù)據(jù)庫通過 多媒體信息數(shù)據(jù)庫建立模塊來建立,并且所述多媒體信息數(shù)據(jù)庫建立模塊包括:第二獲取子模塊,被配置為從多媒體資源庫獲取多媒體文件和與所述多媒體文件相對 應(yīng)的多媒體文件標(biāo)識信息;時間戳添加子模塊,被配置為按照預(yù)設(shè)的時間間隔為所述多媒體文件添加時間戳,其 中,相鄰兩個時間戳用于限定所述多媒體文件的時段信息;識別子模塊,被配置為針對每個所述時段信息,對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容進(jìn)行識別,得到與所述時段信息相對應(yīng)的多媒體內(nèi)容的文本信息,其 中,所述文本信息作為所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信 息;存儲子模塊,被配置為針對每個所述時段信息,將所述多媒體文件標(biāo)識信息、所述時段 信息、以及所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的標(biāo)識信息作為一條多 媒體信息記錄存儲在所述多媒體信息數(shù)據(jù)庫中。12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述識別子模塊包括:第一識別單元,被配置為對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的 字幕部分進(jìn)行文字識別,得到字幕識別結(jié)果;第二識別單元,被配置為對所述多媒體文件中與所述時段信息相對應(yīng)的多媒體內(nèi)容的 語音部分進(jìn)行語音識別,得到語音識別結(jié)果;以及文本信息確定單元,被配置為根據(jù)所述字幕識別結(jié)果和所述語音識別結(jié)果,得到與所 述時段信息相對應(yīng)的多媒體內(nèi)容的文本信息。
【文檔編號】G06F17/30GK106021368SQ201610307489
【公開日】2016年10月12日
【申請日】2016年5月10日
【發(fā)明人】王磊, 麥濤, 張旭, 白楊, 孔暢
【申請人】東軟集團(tuán)股份有限公司