基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框架的制作方法

文檔序號：6506238閱讀：227來源：國知局

基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框架的制作方法
【專利摘要】本發(fā)明公開了一種基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框架，針對網(wǎng)絡視頻文本信息所具有的信息量少和噪聲多等特點，利用關鍵詞間的語義信息，通過動態(tài)調(diào)整關聯(lián)規(guī)則中的支持度，減少由于噪聲、同義詞、多義詞和多語言等問題對文本和視覺信息間關系的影響，增強文本信息的魯棒性，使其建立起視覺近似關鍵幀和高層語義之間的一座橋梁。本發(fā)明充分利用了文本信息間的語義相關性，以及文本信息和視覺信息間的關系，減少文本信息中的噪聲對視覺近似關鍵幀與事件間關系的影響，增強視覺近似關鍵幀與對應事件間的相關性，使其更好的適應于噪聲多且信息量少的網(wǎng)絡視頻的事件挖掘。
【專利說明】基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框架
【技術領域】
[0001]本發(fā)明屬于數(shù)據(jù)挖掘領域，具體涉及熱點話題檢索與跟蹤中大規(guī)模網(wǎng)絡視頻事件挖掘研究。
【背景技術】
[0002]社交網(wǎng)絡的流行使得網(wǎng)絡視頻爆炸式的增長，瀏覽海量網(wǎng)絡視頻時的一個關鍵任務是事件挖掘。隨著多媒體技術、網(wǎng)絡技術和有線電視的發(fā)展，視頻已經(jīng)成為人們?nèi)粘Ｉ?中獲取信息和享受娛樂的主要載體。到2009年9月，大約每分鐘有20小時的新視頻數(shù)據(jù) 上傳到YouTube。YouTube占用了整個互聯(lián)網(wǎng)約10%的流量，占據(jù)總在線視頻量的60%?；?聯(lián)網(wǎng)已經(jīng)成為多媒體信息發(fā)布和共享中心，同時網(wǎng)絡電視臺、“播客”已經(jīng)成為互聯(lián)網(wǎng)上重要的多媒體信息獲取渠道。社交網(wǎng)絡爆炸式的增長使得數(shù)以百萬計的網(wǎng)絡視頻可供人們觀看，大量的視頻在互聯(lián)網(wǎng)上傳輸，通過互聯(lián)網(wǎng)搜索并觀看豐富的視頻內(nèi)容已成為廣大網(wǎng)民獲取信息的主流方式。面對互聯(lián)網(wǎng)上的海量視頻數(shù)據(jù)，如何對大規(guī)模視頻數(shù)據(jù)進行有效的事件挖掘已成為一項迫切的用戶需求，也是新一代視頻搜索引擎的主要研究熱點問題。
[0003]目前，由于網(wǎng)絡視頻的多樣性，相對較模糊的視頻圖像質(zhì)量以及視頻后期編輯處理，使得僅僅使用視覺信息進行事件挖掘變得更加困難。因此，最近多通過視覺和文本信息融合的方式進行事件挖掘。然而，有限的標題和標簽等文本信息卻通常使用籠統(tǒng)、概括、模糊的單詞來大致的概括視頻的主要內(nèi)容，其中包含較多嗓音，不準確，甚至是誤導或者錯誤的標簽。這些標題和標簽通常較短，寥寥數(shù)詞無法囊括視頻中豐富的內(nèi)容，這給網(wǎng)絡視頻事件挖掘帶來了新的挑戰(zhàn)。

【發(fā)明內(nèi)容】

[0004]鑒于現(xiàn)有技術的以上缺點，為了克服文本信息的缺點和不足，能夠更好的進行文本和視覺信息的融合。本發(fā)明的目的是提出一種基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框架，使之克服現(xiàn)有技術的以上缺
[0005]本發(fā)明的目的通過如下手段來實現(xiàn)的。
[0006]1、基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框架，對網(wǎng)絡視頻文本和視覺信息的融合進行事件挖掘；分別處理視頻信息和文本信息；
[0007]視頻數(shù)據(jù)預處理,首先,采用SIFT特征中的Harris-Laplace方法進行局部特征點提??；其次，通過公用工具進行相似關鍵幀的檢測，得到相似關鍵幀集；最后，利用相似關鍵幀集間的相關性信息，通過傳遞閉包進一步聚類，形成“相似關鍵幀集”；
[0008]文本信息預處理，從視頻的標題和標簽中提取的單詞作為文本信息，去除無效的特殊字符，再通過詞干提取對文本信息進行凈化后，按如下步驟進行動態(tài)關聯(lián)規(guī)則挖掘；
[0009](I)根據(jù)相關單詞的個數(shù)分成N個項目，其中N指項目中所包含的單詞數(shù)目；將所有單詞組成不同“組合”，并將這些“組合”按其所包含的單詞數(shù)目由小到大排序；
[0010](2)根據(jù)初始設置的支持度挖掘單詞間相關性，假設每個項目中最多有K種組合；支持度的計算方法如公式I所示:
【權利要求】
1.基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框架，對網(wǎng)絡視頻文本和視覺信息的融合進行事件挖掘；分別處理視頻信息和文本信息；視頻數(shù)據(jù)預處理，首先，采用SIFT特征中的Harris-Laplace方法進行局部特征點提取；其次，通過公用工具進行相似關鍵幀的檢測，得到相似關鍵幀集；最后，利用相似關鍵幀集間的相關性信息，通過傳遞閉包進一步聚類，形成“相似關鍵幀集”；文本信息預處理，從視頻的標題和標簽中提取的單詞作為文本信息，去除無效的特殊字符，再通過詞干提取對文本信息進行凈化后，按如下步驟進行動態(tài)關聯(lián)規(guī)則挖掘；(1)根據(jù)相關單詞的個數(shù)分成N個項目，其中N指項目中所包含的單詞數(shù)目；將所有單詞組成不同“組合”，并將這些“組合”按其所包含的單詞數(shù)目由小到大排序；(2)根據(jù)初始設置的支持度挖掘單詞間相關性，假設每個項目中最多有K種組合；支持度的計算方法如公式I所示:
【文檔編號】G06F17/30GK103440248SQ201310308489
【公開日】2013年12月11日申請日期:2013年7月22日優(yōu)先權日:2013年7月22日
【發(fā)明者】吳曉, 張承德, 彭強申請人:西南交通大學

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：吳曉;張承德;彭強
技術所有人：西南交通大學
我是此專利的發(fā)明人

上一篇：一種dsp器件單粒子翻轉效應檢測方法
上一篇：用于移動社交網(wǎng)絡中實時推薦好友的方法和設備的制作方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

關聯(lián)規(guī)則挖掘相關技術

關聯(lián)規(guī)則挖掘算法相關技術

多維關聯(lián)規(guī)則挖掘算法相關技術

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于動態(tài)關聯(lián)規(guī)則的網(wǎng)絡視頻事件挖掘框架的制作方法