亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于視頻語義建模的視頻瀏覽方法

文檔序號(hào):6371185閱讀:214來源:國知局
專利名稱:一種基于視頻語義建模的視頻瀏覽方法
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理領(lǐng)域,特別涉及一種基于視頻語義建模的視頻瀏覽方法。
背景技術(shù)
在互聯(lián)網(wǎng)上提供視頻的技術(shù),目前已經(jīng)做了很多研究。這些技術(shù)包括視頻服務(wù)器的設(shè)計(jì)[McCanne & Jacobson 1995],提供代理[Floyd 1997],自適應(yīng)視頻編碼[Rowe1994]和低層次的網(wǎng)絡(luò)協(xié)議的修改[McManus & Ross 1996,Chen 1998]。目前的微軟和RealNetworks的RealPlayer使用wmplayer前置緩沖區(qū) ,它在傳輸?shù)耐瑫r(shí),解碼的視頻文件。這將大大減少輪候時(shí)間,但會(huì)因?yàn)閭鬏?,凍結(jié)視頻流導(dǎo)致播放時(shí)滯后。馮等[1998]提出了在視頻流中提供一個(gè)包含演繹信息的前置緩沖管理。該計(jì)劃還需要監(jiān)測(cè)現(xiàn)有的帶寬。上述方法都存在致命的問題。這種服務(wù)器、代理或網(wǎng)絡(luò)協(xié)議是不可伸縮,無法預(yù)測(cè),并限制在一時(shí)間的訪問次數(shù)。無論有多高效的服務(wù)器,代理或協(xié)議,當(dāng)訪問的數(shù)量增加時(shí),它會(huì)卡住。這可能發(fā)生在一個(gè)視頻點(diǎn)播系統(tǒng)。用前置緩沖區(qū)或自適應(yīng)編碼視頻流應(yīng)用程序仍然是不切實(shí)際的。如果緩沖區(qū)足夠大,它可能相當(dāng)于下載整個(gè)視頻。添加緩沖管理也將增加額外的開銷,視頻服務(wù)器會(huì)大大降低效率。

發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)的缺點(diǎn)和不足,提供一種基于視頻語義建模的視頻瀏覽方法,提高了視頻瀏覽的效率。本發(fā)明通過下述技術(shù)方案實(shí)現(xiàn)一種基于視頻語義建模的視頻瀏覽方法,包括ViMeta-VU系統(tǒng)、一個(gè)視頻語義瀏覽界面、一個(gè)2. 5維affirn變換器以及智能代理;所述ViMeta-VU系統(tǒng)是語義視頻對(duì)象分級(jí)跟蹤處理系統(tǒng);所述2. 5維affirn變換器用于統(tǒng)計(jì)變化檢測(cè)與時(shí)空濾器相合的語義視頻對(duì)象平面自動(dòng)分割,包括如下步驟(I)視頻分割檢測(cè)幀間運(yùn)動(dòng)和拼接多個(gè)幀;(2)視頻語義表征和建模把視頻語義對(duì)象和可視對(duì)象都稱之為感知的對(duì)象;幀是一個(gè)完整的單元;堆棧幀形成一個(gè)連續(xù)的視頻序列;(3)視頻的多址訪問和移動(dòng)代理代理AL和代理AM為一組代理,共同瀏覽遠(yuǎn)程站點(diǎn)的視頻文件;代理AL是安裝在本地用戶計(jì)算機(jī)的代理,代理AM是安裝在遠(yuǎn)程計(jì)算機(jī)的代理;所述代理AL交互式的從用戶瀏覽的視頻部分獲取他想要瀏覽的視頻語義特征信息,然后,此視頻語義特征信息發(fā)送到通過XML文檔瀏覽的代理AM,檢索幀序列,并發(fā)送配對(duì)到代理AL。本發(fā)明相對(duì)于現(xiàn)有技術(shù),具有如下的優(yōu)點(diǎn)及效果由于視頻是一個(gè)非常復(fù)雜的媒體,操縱和處理視頻數(shù)據(jù)的困難主要是由于視頻數(shù)據(jù)的語義理解信息的缺乏。基于視頻語義信息基礎(chǔ)上推出了提供的某些行為的智能代理,如瀏覽行為、集中行為、參加行為等。解決方案不僅提供了視頻對(duì)象的快速訪問,也提供了靈活性,以滿足視頻鏡頭的需要。本發(fā)明的應(yīng)用將有利于視頻瀏覽效率的提高。該方法將著力于在互聯(lián)網(wǎng)上提供視頻對(duì)象。有很多應(yīng)用這種技術(shù),如網(wǎng)絡(luò)教育、視頻點(diǎn)播、電子報(bào)、計(jì)算機(jī)支持的協(xié)同等方面。


圖I為本發(fā)明的視頻語義結(jié)構(gòu)圖。
具體實(shí)施例方式下面結(jié)合具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步具體詳細(xì)描述,但本發(fā)明的實(shí)施方式不限于此,對(duì)于未特別注明的工藝參數(shù),可參照常規(guī)技術(shù)進(jìn)行。實(shí)施例如圖I所示,基于視頻語義建模的視頻瀏覽方法,包括ViMeta-VU系統(tǒng)、一個(gè)視頻語義瀏覽界面、一個(gè)2. 5維affirn變換器以及智能代理;所述ViMeta-VU系統(tǒng)為語義視頻對(duì)象分級(jí)跟蹤處理系統(tǒng);所述2. 5維affirn變換器用于統(tǒng)計(jì)變化檢測(cè)與時(shí)空濾器相合的語義視頻對(duì)象平面自動(dòng)分割,包括如下步驟(一)視頻分割檢測(cè)幀間運(yùn)動(dòng)和拼接多個(gè)幀;視頻分割一個(gè)基于內(nèi)容分割的重要一步是檢測(cè)幀間運(yùn)動(dòng)和拼接多個(gè)幀。對(duì)于幀之間的動(dòng)作,方法描述了三個(gè)旋轉(zhuǎn)角度(roll, pitch and yaw)定義為(a,0y ),三個(gè)變換為(Tx,Ty,Tz)。一個(gè)空間點(diǎn)《,¥,2)與圖像坐標(biāo)(11,^0。在下一幀將移動(dòng)到(x’,y’,z’)的圖像中的點(diǎn)移動(dòng)到(u’,v’)。假設(shè)相機(jī)焦距f在移動(dòng)以后是f',下一個(gè)針孔攝像機(jī)模型,它們之間的關(guān)系坐標(biāo)是
權(quán)利要求
1.一種基于視頻語義建模的視頻瀏覽方法,其特征在于包括ViMeta-VU系統(tǒng)、一個(gè)視頻語義瀏覽界面、一個(gè)2. 5維affirn變換器以及智能代理;所述ViMeta-VU系統(tǒng)是語義視頻對(duì)象分級(jí)跟蹤處理系統(tǒng);所述2. 5維affirn變換器用于統(tǒng)計(jì)變化檢測(cè)與時(shí)空濾器相合的語義視頻對(duì)象平面自動(dòng)分割,包括如下步驟 (1)視頻分割檢測(cè)幀間運(yùn)動(dòng)和拼接多個(gè)幀; (2)視頻語義表征和建模把視頻語義對(duì)象和可視對(duì)象都稱之為感知的對(duì)象;幀是一個(gè)完整的單元;堆棧幀形成一個(gè)連續(xù)的視頻序列; (3)視頻的多址訪問和移動(dòng)代理代理AL和代理AM為一組代理,共同瀏覽遠(yuǎn)程站點(diǎn)的視頻文件;代理AL是安裝在本地用戶計(jì)算機(jī)的代理,代理AM是安裝在遠(yuǎn)程計(jì)算機(jī)的代理。
2.根據(jù)權(quán)利要求I所述的基于視頻語義建模的視頻瀏覽方法,其特征在于所述代理 AL交互式的從用戶瀏覽的視頻部分獲取他想要瀏覽的視頻語義特征信息,然后,此視頻語義特征信息發(fā)送到通過XML文檔瀏覽的代理AM,檢索幀序列,并發(fā)送配對(duì)到代理AL。
全文摘要
本發(fā)明公開了一種基于視頻語義建模的視頻瀏覽方法,包括ViMeta-VU系統(tǒng)、視頻語義瀏覽界面、2.5維affirn變換器以及智能代理;ViMeta-VU系統(tǒng)是語義視頻對(duì)象分級(jí)跟蹤處理系統(tǒng);2.5維affirn變換器用于統(tǒng)計(jì)變化檢測(cè)與時(shí)空濾器相合的語義視頻對(duì)象平面自動(dòng)分割,包括如下步驟視頻分割、視頻語義表征和建模、視頻的多址訪問和移動(dòng)代理。本發(fā)明的技術(shù)意義在于基于視頻語義信息基礎(chǔ)上推出了提供的某些行為的智能代理,如瀏覽行為、集中行為、參加行為等。解決方案不僅提供了視頻對(duì)象的快速訪問,也提供了靈活性,以滿足視頻鏡頭的需要,將有利于視頻瀏覽效率的提高。
文檔編號(hào)G06F17/30GK102750349SQ20121018899
公開日2012年10月24日 申請(qǐng)日期2012年6月8日 優(yōu)先權(quán)日2012年6月8日
發(fā)明者張昱, 肖海兵, 謝小鵬 申請(qǐng)人:華南理工大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1