專利名稱:一種視頻摘要生成方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電子通信及視頻圖像處理領(lǐng)域,特別涉及一種視頻摘要生成方法。
背景技術(shù):
隨著數(shù)字視頻技術(shù)的快速發(fā)展,對視頻分析和處理要求不斷提高。而從海量監(jiān)控視頻數(shù)據(jù)中查找某個時間段發(fā)生的事情,十分耗時耗力。如何快速獲取大容量視頻的內(nèi)容,幫助用戶迅速瀏覽視頻數(shù)據(jù),成為目前監(jiān)控行業(yè)的迫切需求。作為基于內(nèi)容的視頻分析的一種主要應(yīng)用,近年來有大量的研究集中在視頻摘要提取算法上。視頻摘要,是通過對視頻的結(jié)構(gòu)和內(nèi)容進行分析,從原始視頻中提取出有意義的部分,并將它們以某種方式進行組合而成的緊湊的、能充分表達視頻語義內(nèi)容。它是對視頻內(nèi)容的簡單概括,觀眾可以通過觀看摘要快速而準確的獲取視頻內(nèi)容。視頻摘要可分為靜態(tài)視頻摘要和動態(tài)視頻摘要兩類。靜態(tài)視頻摘要一般是提取關(guān)鍵幀序列,通過多個關(guān)鍵幀組合成視頻得到的視頻摘要。動態(tài)視頻摘要也稱為縮略視頻,相比關(guān)鍵幀序列,它由原始視頻中提取的運動信息組成。顯然運動視頻比靜止的圖像幀更有意義,從語義方面增加了對原始視頻的表達力。目前,最為經(jīng)典的視 頻摘要生成方法是通過抽取原視頻的關(guān)鍵幀,將關(guān)鍵幀聚合在一起,形成不同主題的場景視頻片段,選取出其中一些場景按時間順序組合起來,編碼形成視頻摘要輸出。這種方法存在如下缺點:首先,該方法選取的原視頻中的關(guān)鍵幀,并不能覆蓋盡可能多的鏡頭從而得到最完備的視頻摘要,因此,會造成大量行為信息的丟失,無法充分滿足用戶獲取全面信息的需求;另外,該種采用截取關(guān)鍵幀的方法很難做到普適性,比如對于一方面要求能提供一個比原始視頻短得多的壓縮視頻片段,另一方面必須保持原始視頻中的絕大部分的運動信息的監(jiān)控視頻就不適用。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)存在的上述問題,本發(fā)明的目的是:提供一種視頻摘要生成方法,該方法解決了現(xiàn)有技術(shù)在生產(chǎn)視頻摘要過程中存在的信息完備性差、應(yīng)用普遍性低的技術(shù)問題。為實現(xiàn)上述發(fā)明目的,本發(fā)明采用如下技術(shù)方案:一種視頻摘要生成方法,包括如下步驟:SI,接收視頻文件,并將該視頻文件的視頻信息分解成序列視頻幀;S2,對步驟SI中的序列視頻幀進行運動物體檢測,得到運動物體的輪廓,該運動物體的輪廓稱為團塊,對檢測得到團塊進行跟蹤,根據(jù)運動物體的輪廓確定團塊在各序列視頻巾貞中的運動軌跡;S3,利用遺傳算法對步驟S2得到的團塊運動軌跡進行組合優(yōu)化,具體如下:S31,將視頻摘要的長度定義為SynopLen,并預(yù)先設(shè)定SynopLen的值,預(yù)先設(shè)定循環(huán)終止條件,該循環(huán)終止條件為循環(huán)次數(shù)經(jīng)驗值或代價損失最小閾值Emin ;
S32,選擇操作,具體如下:S321,采用實數(shù)編碼的方式,將步驟S31中得到的團塊的運動軌跡進行實數(shù)編碼,得到各個團塊的運動軌跡的集合,定義從視頻文件中檢測出的各個團塊的運動軌跡的集合為B, B=Od1, b2, b3***b1---bn}, IDi表示從視頻文件中檢測出的第i個團塊的運動軌跡,η表示從視頻文件中檢測出的團塊的數(shù)量;所述團塊的運動軌跡的集合B映射到視頻摘要中的運
動軌跡集合為
權(quán)利要求
1.一種視頻摘要生成方法,其特征在于,包括如下步驟: S1,接收視頻文件,并將該視頻文件的視頻信息分解成序列視頻幀; S2,對步驟SI中的序列視頻幀進行運動物體檢測,得到運動物體的輪廓,該運動物體的輪廓稱為團塊,對檢測得到團塊進行跟蹤,根據(jù)運動物體的輪廓確定團塊在各序列視頻幀中的運動軌跡; S3,利用遺傳算法對步驟S2得到的團塊運動軌跡進行組合優(yōu)化,具體如下: s31,將視頻摘要的長度定義為SynopLen,并預(yù)先設(shè)定SynopLen的值,預(yù)先設(shè)定循環(huán)終止條件,該循環(huán)終止條件為循環(huán)次數(shù)經(jīng)驗值或代價損失最小閾值Emin ; s32,選擇操作,具體如下: S321,采用實數(shù)編碼的方式,將步驟S31中得到的團塊的運動軌跡進行實數(shù)編碼,得到各個團塊的運動軌跡的集合,定義從視頻文件中檢測出的各個團塊的運動軌跡的集合為B,B=Od1, b2, bflvbj ,IDi表示從視頻文件中檢測出的第i個團塊的運動軌跡,η表示從視頻文件中檢測出的團塊的數(shù)量;所述團塊的運動軌跡的集合B映射到視頻摘要中的運動軌跡集合為B'b:2, / : ■../);■..b'k丨,々=W ,其中,6表示第i個團塊的運動軌跡映射到視頻摘要中的運動軌跡,k表示映射到視頻摘要中的團塊數(shù)量;將視頻摘要中的運動軌跡集合B,中的每條運動軌跡的起始幀的幀序號作為基因組合成染色體,所述運動軌跡集合B'中的每條運動軌跡的起始巾貞的巾貞序號為O至SynopLen間的隨機整數(shù); S322,將步驟S331的過程重復(fù)Q次,Q為正整數(shù),得到Q條染色體,將該Q條染色體作為父代種群; S323,根據(jù)式(2)表示的適應(yīng)度函數(shù)計算所述Q條染色體各自對應(yīng)的代價損失值,將最小的代價損失值記為Emin',記錄Emin'及其對應(yīng)的染色體,并將該染色體作為首次優(yōu)化的染色體;
2.如權(quán)利要求1所述的視頻摘要生成方法,其特征在于,所述步驟S2中采用碼本模型運動檢測法對運動物體進行檢測。
3.如權(quán)利要求1所述的視頻摘 要生成方法,其特征在于,所述步驟S2中采用粒子濾波跟蹤算法對運動物體進行跟蹤,確定團塊運動軌跡。
4.如權(quán)利要求1所述的視頻摘要生成方法,其特征在于,所述步驟S332中的T> 20。
全文摘要
本發(fā)明提供視頻摘要生成方法,該方法步驟包括首先,接收視頻文件,并將該視頻文件的視頻信息分解成序列視頻幀;其次,對序列視頻幀進行運動物體檢測和跟蹤,獲得運動物體各序列視頻幀中的運動軌跡;再次,利用遺傳算法對運動物體的運動軌跡進行組合優(yōu)化得到最優(yōu)染色體;最優(yōu),將最優(yōu)染色體中各個基因?qū)?yīng)的起始幀所確定的視頻摘要中的運動軌跡,按照各個基因的排列順序粘貼到背景幀中,生成視頻摘要輸出。本方法對原始視頻中所有運動物體的運動軌跡進行操作,信息損失量更小,同時也更具普遍性,另外由于本方法采用遺產(chǎn)算法對運動軌跡的進行組合優(yōu)化,不但減低了運動軌跡的信息損失量,而且提高了視頻摘要生成的效率。
文檔編號G06N3/12GK103246922SQ20131016483
公開日2013年8月14日 申請日期2013年5月7日 優(yōu)先權(quán)日2013年5月7日
發(fā)明者徐玲, 顏昕驊, 張小洪, 周小龍, 洪明堅 申請人:重慶大學(xué)