亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

多媒體數(shù)據(jù)的獲取方法和裝置的制造方法

文檔序號(hào):9375599閱讀:232來(lái)源:國(guó)知局
多媒體數(shù)據(jù)的獲取方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明實(shí)施例涉及計(jì)算機(jī)信息技術(shù)領(lǐng)域,尤其涉及一種多媒體數(shù)據(jù)的獲取方法和
目.ο
【背景技術(shù)】
[0002]隨著國(guó)際互聯(lián)網(wǎng)在全球的迅猛發(fā)展,新聞、論壇、博客、微博、視頻、音頻等載體已成為現(xiàn)代人轉(zhuǎn)播和獲取信息的主要手段。人們能夠通過(guò)國(guó)際互聯(lián)網(wǎng),很方便地在計(jì)算機(jī)屏幕上獲得第一手的新聞資訊、熱門(mén)話題、圖片信息、視頻信息等,這使得互聯(lián)網(wǎng)日漸成為信息服務(wù)傳播領(lǐng)域中影響最大、最具發(fā)展?jié)摿Φ拿襟w之一。
[0003]針對(duì)互聯(lián)網(wǎng)上的新聞、論壇、博客、微博等傳統(tǒng)文本信息,目前通過(guò)數(shù)據(jù)抓取、存儲(chǔ)和對(duì)傳統(tǒng)文本信息的分析技術(shù)已經(jīng)研究出可以對(duì)海量文本數(shù)據(jù)進(jìn)行監(jiān)控分析的互聯(lián)網(wǎng)輿情監(jiān)測(cè)分析系統(tǒng)。通過(guò)互聯(lián)網(wǎng)輿情監(jiān)測(cè)分析系統(tǒng),人們可以實(shí)現(xiàn)對(duì)互聯(lián)網(wǎng)數(shù)據(jù)的監(jiān)測(cè)和分析。然而該系統(tǒng)的設(shè)計(jì)目前只能針對(duì)傳統(tǒng)的新聞、論壇、博客、微博等文本信息,忽略了互聯(lián)網(wǎng)上視頻、音頻等多媒體信息。由于目前網(wǎng)絡(luò)帶寬的逐步升級(jí),互聯(lián)網(wǎng)視頻和音頻信息點(diǎn)擊率越來(lái)越高,各視頻和音頻網(wǎng)站的影響力也就越來(lái)越大,如果只針對(duì)傳統(tǒng)的文本信息進(jìn)行監(jiān)控分析,那么面對(duì)互聯(lián)網(wǎng)的海量的多媒體數(shù)據(jù)并不能準(zhǔn)確的獲得針對(duì)多媒體數(shù)據(jù)監(jiān)測(cè)分析結(jié)果,也不能夠根據(jù)監(jiān)測(cè)分析結(jié)果獲取滿足用戶需求的多媒體數(shù)據(jù),用戶的體驗(yàn)性差。

【發(fā)明內(nèi)容】

[0004]本發(fā)明實(shí)施例提供一種多媒體數(shù)據(jù)的獲取方法和裝置,能夠根據(jù)多媒體文件的文本信息快速和準(zhǔn)確的獲取多媒體數(shù)據(jù),更能滿足用戶對(duì)多媒體數(shù)據(jù)個(gè)性化的需求,使用戶獲得更好的體驗(yàn)。
[0005]本發(fā)明提供了一種多媒體數(shù)據(jù)的獲取方法,包括:
[0006]接收用戶輸入的查詢請(qǐng)求,所述查詢請(qǐng)求包括多媒體信息關(guān)鍵詞;
[0007]根據(jù)所述多媒體信息關(guān)鍵詞,對(duì)數(shù)據(jù)庫(kù)中的元數(shù)據(jù)進(jìn)行檢索,確定與所述多媒體信息關(guān)鍵詞相匹配的文本信息對(duì)應(yīng)的目的標(biāo)識(shí),所述元數(shù)據(jù)包括多媒體文件的文本信息及其對(duì)應(yīng)的標(biāo)識(shí);
[0008]向用戶輸出與所述多媒體信息關(guān)鍵詞相匹配的文本信息;
[0009]接收用戶對(duì)所述文本信息的確認(rèn)響應(yīng);
[0010]根據(jù)與所述確認(rèn)響應(yīng)相對(duì)應(yīng)的文本信息的目的標(biāo)識(shí)從服務(wù)器中獲取多媒體數(shù)據(jù);
[0011]將所述多媒體數(shù)據(jù)向用戶輸出。
[0012]本發(fā)明還提供了一種多媒體數(shù)據(jù)的獲取裝置,包括:
[0013]接收模塊,用于接收用戶輸入的查詢請(qǐng)求,所述查詢請(qǐng)求包括多媒體信息關(guān)鍵詞;
[0014]檢索模塊,用于根據(jù)所述多媒體信息關(guān)鍵詞,對(duì)數(shù)據(jù)庫(kù)中的元數(shù)據(jù)進(jìn)行檢索;
[0015]確定模塊,用于確定與所述多媒體信息關(guān)鍵詞相匹配的文本信息對(duì)應(yīng)的目的標(biāo)識(shí),所述元數(shù)據(jù)包括多媒體文件的文本信息及其對(duì)應(yīng)的標(biāo)識(shí);
[0016]輸出模塊,用于向用戶輸出與所述多媒體信息關(guān)鍵詞相匹配的文本信息;
[0017]所述接收模塊,還用于接收用戶對(duì)所述文本信息的確認(rèn)響應(yīng);
[0018]獲取模塊,用于根據(jù)與所述確認(rèn)響應(yīng)相對(duì)應(yīng)的文本信息的目的標(biāo)識(shí)從服務(wù)器中獲取多媒體數(shù)據(jù);
[0019]所述輸出模塊,用于將所述多媒體數(shù)據(jù)向用戶輸出。
[0020]本發(fā)明一種多媒體數(shù)據(jù)的獲取方法和裝置,通過(guò)接收用戶輸入的查詢請(qǐng)求,該查詢請(qǐng)求包括多媒體信息關(guān)鍵詞;根據(jù)多媒體信息關(guān)鍵詞,對(duì)數(shù)據(jù)庫(kù)中的元數(shù)據(jù)進(jìn)行檢索,確定與多媒體信息關(guān)鍵詞相匹配的文本信息對(duì)應(yīng)的目的標(biāo)識(shí),該元數(shù)據(jù)包括多媒體文件的文本信息及其對(duì)應(yīng)的標(biāo)識(shí);向用戶輸出與多媒體信息關(guān)鍵詞相匹配的文本信息;接收用戶對(duì)文本信息的確認(rèn)響應(yīng);根據(jù)與確認(rèn)響應(yīng)相對(duì)應(yīng)的文本信息的目的標(biāo)識(shí)從服務(wù)器中獲取多媒體數(shù)據(jù);將多媒體數(shù)據(jù)向用戶輸出。本發(fā)明能夠根據(jù)多媒體文件的文本信息快速和精準(zhǔn)的獲取多媒體數(shù)據(jù),更能滿足用戶對(duì)多媒體數(shù)據(jù)個(gè)性化的需求,使用戶獲得更好的體驗(yàn)。
【附圖說(shuō)明】
[0021]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0022]圖1為本發(fā)明多媒體數(shù)據(jù)的獲取方法實(shí)施例一的流程圖;
[0023]圖2為本發(fā)明多媒體數(shù)據(jù)的獲取方法實(shí)施例二的第一流程圖;
[0024]圖3為本發(fā)明多媒體數(shù)據(jù)的獲取方法實(shí)施例二的第二流程圖;
[0025]圖4為本發(fā)明多媒體數(shù)據(jù)的獲取裝置實(shí)施例一的結(jié)構(gòu)示意圖;
[0026]圖5為本發(fā)明多媒體數(shù)據(jù)的獲取裝置實(shí)施例二的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0027]為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0028]本發(fā)明實(shí)施例中,多媒體文件可包括視頻文件和音頻文件,具體的,在視頻文件中包括視頻數(shù)據(jù)和文本信息,視頻數(shù)據(jù)包括視頻成品,視頻關(guān)鍵幀和視頻字幕或語(yǔ)音文本。在音頻文件中包括音頻數(shù)據(jù)和文本信息,音頻數(shù)據(jù)包括音頻成品和音頻文本。
[0029]圖1為本發(fā)明多媒體數(shù)據(jù)的獲取方法實(shí)施例一的流程圖,如圖1所示,本實(shí)施例的執(zhí)行主體為具有存儲(chǔ)空間的用戶終端,具體可以在用戶終端中通過(guò)軟件方式實(shí)現(xiàn)。則該方法包括:
[0030]步驟101,接收用戶輸入的查詢請(qǐng)求,該查詢請(qǐng)求包括多媒體信息關(guān)鍵詞。
[0031]本實(shí)施例中,在接收用戶輸入的查詢請(qǐng)求前,可根據(jù)用戶輸入的配置規(guī)則,生成與配置規(guī)則相關(guān)的多媒體信息關(guān)鍵詞,接收用戶輸入的查詢請(qǐng)求,在查詢請(qǐng)求中包括多媒體信息關(guān)鍵詞。如在接收用戶輸入的查詢請(qǐng)求前,用戶輸入的配置規(guī)則為:“北京房?jī)r(jià)”,根據(jù)“北京房?jī)r(jià)”的配置規(guī)則,生成的與“北京房?jī)r(jià)”相關(guān)的多媒體信息關(guān)鍵詞有“北京房?jī)r(jià)”、“國(guó)五條”、“房產(chǎn)稅”等。那么在查詢請(qǐng)求中將包括“北京房?jī)r(jià)”、“國(guó)五條”、“房產(chǎn)稅”等多媒體信息關(guān)鍵詞。
[0032]步驟102,根據(jù)多媒體信息關(guān)鍵詞,對(duì)數(shù)據(jù)庫(kù)中的元數(shù)據(jù)進(jìn)行檢索,確定與多媒體信息關(guān)鍵詞相匹配的文本信息對(duì)應(yīng)的目的標(biāo)識(shí),該元數(shù)據(jù)包括多媒體文件的文本信息及其對(duì)應(yīng)的標(biāo)識(shí)。
[0033]本實(shí)施例中,數(shù)據(jù)庫(kù)是(Hadoop Database,簡(jiǎn)稱Hbase)數(shù)據(jù)庫(kù),Hbase數(shù)據(jù)庫(kù)是適合于非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)的數(shù)據(jù)庫(kù),它是基于列的而不是基于行的模式,更方便的讀寫(xiě)大數(shù)據(jù)內(nèi)容。在Hbase數(shù)據(jù)庫(kù)中存儲(chǔ)大量的元數(shù)據(jù)。元數(shù)據(jù)包括多媒體文件的文本信息及其對(duì)應(yīng)的標(biāo)識(shí)。其中多媒體文件的文本信息包括:多媒體數(shù)據(jù)的標(biāo)題、作者、發(fā)布時(shí)間、所屬網(wǎng)站、鏈接地址、地域信息、多媒體摘要等。其中的地域信息可以是多媒體數(shù)據(jù)所屬網(wǎng)站的地域信息,也可以是多媒體數(shù)據(jù)所屬的網(wǎng)站的具體某個(gè)頻道的地域信息。
[0034]本實(shí)施例中,根據(jù)多媒體信息關(guān)鍵詞,對(duì)數(shù)據(jù)庫(kù)中的元數(shù)據(jù)進(jìn)行檢索是周期性進(jìn)行的,因?yàn)榛ヂ?lián)網(wǎng)的多媒體文件是不斷更新的,在數(shù)據(jù)庫(kù)中的元數(shù)據(jù)也是處于不斷更新的過(guò)程中,在進(jìn)行周期性的檢索中,能夠找到不斷更新的與多媒體信息關(guān)鍵詞相匹配的文本信息,使檢索更具有實(shí)時(shí)性和準(zhǔn)確性。具體的檢索周期可預(yù)先設(shè)定,如設(shè)定為每10分鐘檢索一次,檢索周期的大小本實(shí)施例不作限定。
[0035]本實(shí)施例中在對(duì)數(shù)據(jù)庫(kù)中的元數(shù)據(jù)進(jìn)行檢索前,為每一個(gè)元數(shù)據(jù)的文本信息中的多媒體數(shù)據(jù)的標(biāo)題、作者、發(fā)布時(shí)間、所屬網(wǎng)站、鏈接地址、地域信息、多媒體摘要等創(chuàng)建的索引,使檢索更加快速。
[0036]步驟103,向用戶輸出與多媒體信息關(guān)鍵詞相匹配的文本信息。
當(dāng)前第1頁(yè)1 2 3 4 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1