亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框架的制作方法

文檔序號:6506238閱讀:227來源:國知局
基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框架的制作方法
【專利摘要】本發(fā)明公開了一種基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框架,針對網(wǎng)絡視頻文本信息所具有的信息量少和噪聲多等特點,利用關鍵詞間的語義信息,通過動態(tài)調(diào)整關聯(lián)規(guī)則中的支持度,減少由于噪聲、同義詞、多義詞和多語言等問題對文本和視覺信息間關系的影響,增強文本信息的魯棒性,使其建立起視覺近似關鍵幀和高層語義之間的一座橋梁。本發(fā)明充分利用了文本信息間的語義相關性,以及文本信息和視覺信息間的關系,減少文本信息中的噪聲對視覺近似關鍵幀與事件間關系的影響,增強視覺近似關鍵幀與對應事件間的相關性,使其更好的適應于噪聲多且信息量少的網(wǎng)絡視頻的事件挖掘。
【專利說明】基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框架
【技術領域】
[0001]本發(fā)明屬于數(shù)據(jù)挖掘領域,具體涉及熱點話題檢索與跟蹤中大規(guī)模網(wǎng)絡視頻事件 挖掘研究。
【背景技術】
[0002]社交網(wǎng)絡的流行使得網(wǎng)絡視頻爆炸式的增長,瀏覽海量網(wǎng)絡視頻時的一個關鍵任 務是事件挖掘。隨著多媒體技術、網(wǎng)絡技術和有線電視的發(fā)展,視頻已經(jīng)成為人們?nèi)粘I?中獲取信息和享受娛樂的主要載體。到2009年9月,大約每分鐘有20小時的新視頻數(shù)據(jù) 上傳到YouTube。YouTube占用了整個互聯(lián)網(wǎng)約10%的流量,占據(jù)總在線視頻量的60%?;?聯(lián)網(wǎng)已經(jīng)成為多媒體信息發(fā)布和共享中心,同時網(wǎng)絡電視臺、“播客”已經(jīng)成為互聯(lián)網(wǎng)上重 要的多媒體信息獲取渠道。社交網(wǎng)絡爆炸式的增長使得數(shù)以百萬計的網(wǎng)絡視頻可供人們觀 看,大量的視頻在互聯(lián)網(wǎng)上傳輸,通過互聯(lián)網(wǎng)搜索并觀看豐富的視頻內(nèi)容已成為廣大網(wǎng)民 獲取信息的主流方式。面對互聯(lián)網(wǎng)上的海量視頻數(shù)據(jù),如何對大規(guī)模視頻數(shù)據(jù)進行有效的 事件挖掘已成為一項迫切的用戶需求,也是新一代視頻搜索引擎的主要研究熱點問題。
[0003]目前,由于網(wǎng)絡視頻的多樣性,相對較模糊的視頻圖像質(zhì)量以及視頻后期編輯處 理,使得僅僅使用視覺信息進行事件挖掘變得更加困難。因此,最近多通過視覺和文本信息 融合的方式進行事件挖掘。然而,有限的標題和標簽等文本信息卻通常使用籠統(tǒng)、概括、模 糊的單詞來大致的概括視頻的主要內(nèi)容,其中包含較多嗓音,不準確,甚至是誤導或者錯誤 的標簽。這些標題和標簽通常較短,寥寥數(shù)詞無法囊括視頻中豐富的內(nèi)容,這給網(wǎng)絡視頻事 件挖掘帶來了新的挑戰(zhàn)。

【發(fā)明內(nèi)容】

[0004]鑒于現(xiàn)有技術的以上缺點,為了克服文本信息的缺點和不足,能夠更好的進行文 本和視覺信息的融合。本發(fā)明的目的是提出一種基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框 架,使之克服現(xiàn)有技術的以上缺
[0005]本發(fā)明的目的通過如下手段來實現(xiàn)的。
[0006]1、基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框架,對網(wǎng)絡視頻文本和視覺信息的融 合進行事件挖掘;分別處理視頻信息和文本信息;
[0007]視頻數(shù)據(jù)預處理,首先,采用SIFT特征中的Harris-Laplace方法進行局部特征點 提??;其次,通過公用工具進行相似關鍵幀的檢測,得到相似關鍵幀集;最后,利用相似 關鍵幀集間的相關性信息,通過傳遞閉包進一步聚類,形成“相似關鍵幀集”;
[0008]文本信息預處理,從視頻的標題和標簽中提取的單詞作為文本信息,去除無效的 特殊字符,再通過詞干提取對文本信息進行凈化后,按如下步驟進行動態(tài)關聯(lián)規(guī)則挖掘;
[0009](I)根據(jù)相關單詞的個數(shù)分成N個項目,其中N指項目中所包含的單詞數(shù)目;將所 有單詞組成不同“組合”,并將這些“組合”按其所包含的單詞數(shù)目由小到大排序;
[0010](2)根據(jù)初始設置的支持度挖掘單詞間相關性,假設每個項目中最多有K種組合;支持度的計算方法如公式I所示:
【權利要求】
1.基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框架,對網(wǎng)絡視頻文本和視覺信息的融合進行事件挖掘;分別處理視頻信息和文本信息;視頻數(shù)據(jù)預處理,首先,采用SIFT特征中的Harris-Laplace方法進行局部特征點提取;其次,通過公用工具進行相似關鍵幀的檢測,得到相似關鍵幀集;最后,利用相似關鍵幀集間的相關性信息,通過傳遞閉包進一步聚類,形成“相似關鍵幀集”;文本信息預處理,從視頻的標題和標簽中提取的單詞作為文本信息,去除無效的特殊字符,再通過詞干提取對文本信息進行凈化后,按如下步驟進行動態(tài)關聯(lián)規(guī)則挖掘;(1)根據(jù)相關單詞的個數(shù)分成N個項目,其中N指項目中所包含的單詞數(shù)目;將所有單詞組成不同“組合”,并將這些“組合”按其所包含的單詞數(shù)目由小到大排序;(2)根據(jù)初始設置的支持度挖掘單詞間相關性,假設每個項目中最多有K種組合;支持度的計算方法如公式I所示:
【文檔編號】G06F17/30GK103440248SQ201310308489
【公開日】2013年12月11日 申請日期:2013年7月22日 優(yōu)先權日:2013年7月22日
【發(fā)明者】吳曉, 張承德, 彭強 申請人:西南交通大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1