高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的系統(tǒng)和方法

文檔序號(hào)：10655208閱讀：584來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的系統(tǒng)和方法
【專利摘要】本發(fā)明公開(kāi)了一種高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的系統(tǒng)和方法，該方法包括以下步驟：利用詞匯網(wǎng)路輔助分析標(biāo)注詞之間的相關(guān)性，從一幅圖像的眾多候選關(guān)鍵詞中挑出最相關(guān)、最具代表性的詞，濾除掉無(wú)關(guān)噪聲詞匯，同時(shí)結(jié)合通過(guò)視覺(jué)信息判斷圖像的相似性，從相似的圖像中獲得缺失的標(biāo)注信息；生成語(yǔ)義場(chǎng)并將在邏輯上將具有相同語(yǔ)義信息的圖像組織在一起，構(gòu)成等勢(shì)線；通過(guò)分析這些具有圖像的語(yǔ)義，進(jìn)一步進(jìn)行標(biāo)注的傳播和噪聲的消除，實(shí)現(xiàn)圖像標(biāo)注改善。本發(fā)明的目的是為了使視頻內(nèi)容的檢索更加方便，符合人的主觀效果。
【專利說(shuō)明】
高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的系統(tǒng)和方法
技術(shù)領(lǐng)域
[0001 ]本發(fā)明涉及一種高維空間點(diǎn)智能視頻檢索技術(shù)，特別是涉及一種高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的系統(tǒng)和方法。
【背景技術(shù)】
[0002]隨著多媒體影像技術(shù)和存儲(chǔ)設(shè)備的快速發(fā)展，互聯(lián)網(wǎng)上視頻信息呈爆炸性增長(zhǎng)。視覺(jué)圖像信息與文本信息相比，更加生動(dòng)、易于理解。如何幫助用戶快速、準(zhǔn)確地找到需要的圖像成為近年來(lái)多媒體研究的熱點(diǎn)課題之一，無(wú)論是商業(yè)界還是學(xué)術(shù)界，快速、高效的視頻檢索技術(shù)都成為了一個(gè)重要研究方向。
[0003]視頻檢索技術(shù)始于基于文本的圖像檢索，然而，隨著數(shù)字圖像越來(lái)越多，基于文本的圖像檢索不僅費(fèi)時(shí)費(fèi)力，而且標(biāo)注結(jié)果帶有主觀性。為了克服這些問(wèn)題，研究人員于20世紀(jì)80年代提出了基于內(nèi)容的圖像檢索。由于基于內(nèi)容的圖像檢索是基于圖像底層視覺(jué)特征的表示，避免了人工標(biāo)注的不準(zhǔn)確性和主觀性，但是它也帶來(lái)了若干新的問(wèn)題，如“語(yǔ)義鴻溝”問(wèn)題，“維數(shù)災(zāi)難”問(wèn)題等，因此，基于內(nèi)容的圖像檢索技術(shù)很難被實(shí)用化。近幾年來(lái)，研究人員試圖將基于文本的圖像檢索和基于內(nèi)容的圖像檢索結(jié)合起來(lái)，提高檢索性能和速度，自動(dòng)視頻標(biāo)注方法自然地被提出來(lái)，成為新的研究熱點(diǎn)。
[0004]真實(shí)世界環(huán)境(Real-World)的概念與一般自動(dòng)圖像標(biāo)注方法所設(shè)定的受限環(huán)境相對(duì)。在受限環(huán)境下，訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)都是來(lái)自于同一個(gè)人工收集的小規(guī)模圖像數(shù)據(jù)庫(kù)，同時(shí)可能待標(biāo)注的概念非常少，測(cè)試圖像一般不包含其它信息等等。而在真實(shí)世界環(huán)境下，特別是互聯(lián)網(wǎng)環(huán)境下，這些限制一般都不存在或者是不合理的。許多受限條件下的自動(dòng)圖像標(biāo)注方法基本沒(méi)有考慮真實(shí)世界環(huán)境下的圖像標(biāo)注問(wèn)題，在實(shí)際應(yīng)用中表現(xiàn)并不好，如圖像標(biāo)注性能不高，用戶對(duì)圖像標(biāo)注的感受不好，無(wú)法處理大量的語(yǔ)義概念等問(wèn)題。因此，如果要將圖像標(biāo)注實(shí)用化，必須要實(shí)現(xiàn)真實(shí)世界環(huán)境下的自動(dòng)圖像標(biāo)注方法。現(xiàn)在對(duì)真實(shí)世界環(huán)境下的自動(dòng)圖像標(biāo)注的研究才剛剛開(kāi)始，比如如何利用圖像的元數(shù)據(jù)進(jìn)行圖像標(biāo)注，如何建立真實(shí)世界下的圖像標(biāo)注方法的標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)等。

【發(fā)明內(nèi)容】

[0005]本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的系統(tǒng)和方法，其使視頻內(nèi)容的檢索更加方便，符合人的主觀效果，可以用于監(jiān)控、視頻流等領(lǐng)域，可以在大規(guī)模視頻數(shù)據(jù)庫(kù)建立有效的索引結(jié)構(gòu)，提高判斷近似重復(fù)視頻的查詢過(guò)程，提高查詢的效率。
[0006]本發(fā)明是通過(guò)下述技術(shù)方案來(lái)解決上述技術(shù)問(wèn)題的:一種高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的方法，其特征在于，其包括以下步驟:步驟一:利用詞匯網(wǎng)路輔助分析標(biāo)注詞之間的相關(guān)性，從一幅圖像的眾多候選關(guān)鍵詞中挑出最相關(guān)、最具代表性的詞，濾除掉無(wú)關(guān)噪聲詞匯，同時(shí)結(jié)合通過(guò)視覺(jué)信息判斷圖像的相似性，從相似的圖像中獲得缺失的標(biāo)注信息；步驟二:生成語(yǔ)義場(chǎng)并將在邏輯上將具有相同語(yǔ)義信息的圖像組織在一起，構(gòu)成等勢(shì)線；步驟三:通過(guò)分析這些具有圖像的語(yǔ)義，進(jìn)一步進(jìn)行標(biāo)注的傳播和噪聲的消除，實(shí)現(xiàn)圖像標(biāo)注改善。
[0007]優(yōu)選地，所述步驟二包括以下步驟:對(duì)自然圖像所在的語(yǔ)意環(huán)境進(jìn)行分析并生成語(yǔ)意場(chǎng);對(duì)原始視頻圖像進(jìn)行自動(dòng)歸類處理，按語(yǔ)意網(wǎng)絡(luò)環(huán)境進(jìn)行歸屬；自動(dòng)歸類當(dāng)前使用局部特征點(diǎn)歸屬，得到集合;使用空間覆蓋體進(jìn)行集合的覆蓋，覆蓋體的形狀是超球或超橢球體;對(duì)覆蓋體的每個(gè)學(xué)習(xí)階段標(biāo)記其優(yōu)先關(guān)系，按優(yōu)先關(guān)系的不同，描述其回歸覆蓋的優(yōu)先次序;對(duì)樣本學(xué)習(xí)的每個(gè)角度，用不同的優(yōu)先關(guān)系的構(gòu)造序列。
[0008]優(yōu)選地，所述步驟三包括以下步驟:對(duì)原始圖像內(nèi)容進(jìn)行網(wǎng)絡(luò)歸類;對(duì)視頻圖像進(jìn)行特征獲取;按語(yǔ)義場(chǎng)獲取優(yōu)先順序，使用優(yōu)先順序進(jìn)行的高維空間點(diǎn)比對(duì);按比較結(jié)果進(jìn)行空間點(diǎn)覆蓋的獲取，比較局部特征點(diǎn)和整個(gè)圖像特征點(diǎn)的邏輯關(guān)系，排序后獲取可能的圖像。
[0009]本發(fā)明還提供一種高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的系統(tǒng)，其特征在于，其包括:
[0010]語(yǔ)意分析模塊，用于對(duì)視頻圖像的上下文進(jìn)行語(yǔ)意分析；
[0011]語(yǔ)意場(chǎng)管理模塊，通過(guò)不同的語(yǔ)意通道，實(shí)現(xiàn)對(duì)語(yǔ)意的優(yōu)先關(guān)系覆蓋模型；
[0012]視覺(jué)相似性度量計(jì)算模塊，通過(guò)對(duì)圖像內(nèi)容的空間點(diǎn)覆蓋，實(shí)現(xiàn)基于高維空間的點(diǎn)幾何關(guān)系運(yùn)算；
[0013]圖像數(shù)據(jù)庫(kù)，用于存取圖像數(shù)據(jù)可的訓(xùn)練數(shù)據(jù)樣本，訓(xùn)練數(shù)據(jù)樣本包括對(duì)同角度的優(yōu)先排序序列。
[0014]優(yōu)選地，所述圖像數(shù)據(jù)庫(kù)支持高維空間點(diǎn)覆蓋方法的比較方法。
[0015]本發(fā)明的積極進(jìn)步效果在于:本發(fā)明的目的是為了使視頻內(nèi)容的檢索更加方便，符合人的主觀效果。發(fā)明結(jié)果可以用于監(jiān)控、視頻流等領(lǐng)域。研究結(jié)果可以在大規(guī)模視頻數(shù)據(jù)庫(kù)建立有效的索引結(jié)構(gòu)，提高判斷近似重復(fù)視頻的查詢過(guò)程，提高查詢的效率。在進(jìn)行圖像標(biāo)注改善時(shí)，根據(jù)目標(biāo)的語(yǔ)義信息，有針對(duì)性地定位到在語(yǔ)義上與之相同或接近的等勢(shì)線上，等勢(shì)線的引入可以將真實(shí)世界圖像的標(biāo)注信息進(jìn)行有效地組織，使語(yǔ)義上相近的圖像有機(jī)地聚集在一起。這樣的組織不僅可以提高基于關(guān)鍵字的檢索，使檢索過(guò)程更有針對(duì)性，而且，由于在同一等勢(shì)線上的圖像具有某一相同的語(yǔ)義，可以認(rèn)為這些圖像間的其他語(yǔ)義也具有相關(guān)性，通過(guò)語(yǔ)義分析和篩選，實(shí)現(xiàn)圖像標(biāo)注的補(bǔ)充。需要說(shuō)明的是，本項(xiàng)目中圖像標(biāo)注改善是一個(gè)不斷迭代和完善的過(guò)程，即語(yǔ)義場(chǎng)是建立在結(jié)合詞匯網(wǎng)路和視覺(jué)相似性濾除噪聲詞匯之上的，而構(gòu)建語(yǔ)義場(chǎng)后進(jìn)行具有同等勢(shì)線間的圖像標(biāo)注傳播后難免會(huì)存在噪聲詞匯，需要進(jìn)一步利用詞匯網(wǎng)路和視覺(jué)相似性進(jìn)行噪聲標(biāo)注的消除，循環(huán)往復(fù)，逐步提高圖像標(biāo)注的質(zhì)量。使用者通過(guò)文字標(biāo)記的方法獲取視頻檢索，有很大的局限性，很難實(shí)現(xiàn)對(duì)視頻的精準(zhǔn)搜索。通過(guò)本發(fā)明描述的視頻語(yǔ)意網(wǎng)絡(luò)及高維空間點(diǎn)的覆蓋方法，可以實(shí)現(xiàn)快速視頻標(biāo)注和定位。對(duì)于互聯(lián)網(wǎng)應(yīng)用來(lái)說(shuō)，當(dāng)一個(gè)視頻被上傳時(shí)，若能快速地檢測(cè)出視頻庫(kù)中是否已經(jīng)存在重復(fù)視頻不僅可以避免版權(quán)糾分，而且可以刪除視頻庫(kù)中的重復(fù)視頻，減少存儲(chǔ)空間，提高網(wǎng)絡(luò)視頻檢索系統(tǒng)中檢索結(jié)果的效果，更好的滿足用戶的需求。
【附圖說(shuō)明】
[0016]圖1為本發(fā)明尚維空間點(diǎn)超球覆蓋視頻序列標(biāo)注方法的視頻序列等勢(shì)線不意圖。
[0017]圖2為本發(fā)明高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注方法的視頻圖像標(biāo)注改善框架示意圖。
[0018]圖3為本發(fā)明高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的系統(tǒng)的原理框圖。
【具體實(shí)施方式】
[0019]下面結(jié)合附圖及實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明較佳實(shí)施方式，借此對(duì)本發(fā)明如何應(yīng)用技術(shù)手段來(lái)解決技術(shù)問(wèn)題，并達(dá)成技術(shù)效果的實(shí)現(xiàn)過(guò)程能充分理解并據(jù)以實(shí)施。
[0020]如圖3所示，本發(fā)明高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的系統(tǒng)包括:
[0021]語(yǔ)意分析模塊，用于對(duì)視頻圖像的上下文進(jìn)行語(yǔ)意分析；
[0022]語(yǔ)意場(chǎng)管理模塊，通過(guò)不同的語(yǔ)意通道，實(shí)現(xiàn)對(duì)語(yǔ)意的優(yōu)先關(guān)系覆蓋模型；
[0023]視覺(jué)相似性度量計(jì)算模塊，通過(guò)對(duì)圖像內(nèi)容的空間點(diǎn)覆蓋，實(shí)現(xiàn)基于高維空間的點(diǎn)幾何關(guān)系運(yùn)算；
[0024]圖像數(shù)據(jù)庫(kù)，用于存取圖像數(shù)據(jù)可的訓(xùn)練數(shù)據(jù)樣本，訓(xùn)練數(shù)據(jù)樣本包括對(duì)同角度的優(yōu)先排序序列。圖像數(shù)據(jù)庫(kù)支持高維空間點(diǎn)覆蓋方法的比較方法，能夠快速定位到具體的局部特征點(diǎn)序列。
[0025]語(yǔ)意分析模塊、視覺(jué)相似性度量計(jì)算模塊、圖像數(shù)據(jù)庫(kù)都與語(yǔ)意場(chǎng)管理模塊連接。
[0026]如圖1和圖2所示，本發(fā)明高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的方法包括以下步驟:
[0027]步驟一:利用詞匯網(wǎng)路輔助分析標(biāo)注詞之間的相關(guān)性，從一幅圖像的眾多候選關(guān)鍵詞中挑出最相關(guān)、最具代表性的詞，濾除掉無(wú)關(guān)噪聲詞匯，同時(shí)結(jié)合通過(guò)視覺(jué)信息判斷圖像的相似性，從相似的圖像中獲得缺失的標(biāo)注信息；
[0028]步驟二:生成語(yǔ)義場(chǎng)并將在邏輯上將具有相同語(yǔ)義信息的圖像組織在一起，構(gòu)成等勢(shì)線；圖像包括第一圖像1、第二圖像2、第三圖像3、第四圖像4、第五圖像5、第六圖像6。等勢(shì)線包括第一等勢(shì)線11、第二等勢(shì)線12、第三等勢(shì)線13。
[0029]步驟三:通過(guò)分析這些具有圖像的語(yǔ)義，進(jìn)一步進(jìn)行標(biāo)注的傳播和噪聲的消除，實(shí)現(xiàn)圖像標(biāo)注改善。
[0030]步驟二包括以下步驟:對(duì)自然圖像所在的語(yǔ)意環(huán)境進(jìn)行分析并生成語(yǔ)意場(chǎng);對(duì)原始視頻圖像進(jìn)行自動(dòng)歸類處理，按語(yǔ)意網(wǎng)絡(luò)環(huán)境進(jìn)行歸屬；自動(dòng)歸類當(dāng)前使用局部特征點(diǎn)歸屬，得到集合;使用空間覆蓋體進(jìn)行集合的覆蓋，覆蓋體的形狀可以是超球或超橢球體；對(duì)覆蓋體的每個(gè)學(xué)習(xí)階段標(biāo)記其優(yōu)先關(guān)系P，按優(yōu)先關(guān)系P的不同，可以描述其回歸覆蓋的優(yōu)先次序;對(duì)樣本學(xué)習(xí)的每個(gè)角度，用不同的優(yōu)先關(guān)系P的構(gòu)造’序列。
[0031]步驟三包括以下步驟:對(duì)原始圖像內(nèi)容進(jìn)行網(wǎng)絡(luò)歸類;對(duì)視頻圖像進(jìn)行特征獲取；按語(yǔ)義場(chǎng)獲取優(yōu)先順序Pl，使用優(yōu)先順序Pl進(jìn)行的高維空間點(diǎn)比對(duì);按比較結(jié)果進(jìn)行空間點(diǎn)覆蓋的獲取，比較局部特征點(diǎn)和整個(gè)圖像特征點(diǎn)的邏輯關(guān)系，排序后獲取可能的圖像。
[0032]本發(fā)明主要從如下幾個(gè)方面進(jìn)行處理:
[0033]—、基于編程模型的并行化計(jì)算，實(shí)現(xiàn)大規(guī)模數(shù)據(jù)集的圖像語(yǔ)義學(xué)習(xí)。
[0034]真實(shí)世界環(huán)境下一般需要大規(guī)模的圖像訓(xùn)練集才能實(shí)現(xiàn)有效的語(yǔ)義概念的學(xué)習(xí)和標(biāo)注。研究基于編程模型的學(xué)習(xí)任務(wù)并行化操作機(jī)制，提升針對(duì)大規(guī)模數(shù)據(jù)進(jìn)行學(xué)習(xí)的能力。如何推廣現(xiàn)有算法來(lái)適用大規(guī)模圖像訓(xùn)練數(shù)據(jù)庫(kù)，如何構(gòu)建大規(guī)模圖像訓(xùn)練數(shù)據(jù)并行處理結(jié)構(gòu)，把一個(gè)學(xué)習(xí)任務(wù)劃合理分成若干并行子任務(wù)，并將子任務(wù)合理的分派給線程，使各線程的工作量均衡。如何處理并行操作中出現(xiàn)的故障，如何對(duì)最后的學(xué)習(xí)任務(wù)進(jìn)行合并匯總等等。這些都是值得研究的問(wèn)題。
[0035]二、基于迀移學(xué)習(xí)的標(biāo)注模型擴(kuò)展。
[0036]基于分類的圖像標(biāo)注方法可以在少量概念時(shí)獲得比較好的標(biāo)注性能，卻無(wú)法同時(shí)對(duì)大規(guī)模概念同時(shí)學(xué)習(xí)。研究基于迀移學(xué)習(xí)的標(biāo)注模型擴(kuò)展，將學(xué)習(xí)好的標(biāo)注模型推廣到其它標(biāo)注。迀移哪些知識(shí)到目標(biāo)對(duì)象中，何種情況下進(jìn)行知識(shí)的迀移以及如何設(shè)計(jì)合理的迀移策略，將學(xué)習(xí)好的標(biāo)注模型自動(dòng)地推廣到其它標(biāo)注的情況，降低對(duì)標(biāo)注問(wèn)題訓(xùn)練集的要求，降低學(xué)習(xí)的代價(jià)，這些都是本項(xiàng)目需要研究的問(wèn)題。
[0037]三、圖像標(biāo)注改善。
[0038]由于在真實(shí)世界環(huán)境下圖像來(lái)源于不同的領(lǐng)域，因此，圖像標(biāo)注不僅范圍廣，而且同一個(gè)語(yǔ)義往往可用不同的標(biāo)注詞進(jìn)行標(biāo)注，此外，一幅圖像含義的語(yǔ)義信息是非常豐富的，通過(guò)外部信息或者學(xué)習(xí)獲得的圖像標(biāo)注往往是不完整的、含有大量的噪聲數(shù)據(jù)。項(xiàng)目研究在真實(shí)世界環(huán)境下，圖像標(biāo)注結(jié)果的組織和統(tǒng)一，分析標(biāo)注詞間的語(yǔ)義相關(guān)性，并結(jié)合視覺(jué)特征，去除不相關(guān)的標(biāo)注，以達(dá)到圖像標(biāo)注改善的目的。
[0039]本發(fā)明主要運(yùn)用高維空間超球交織快速定位技術(shù)。對(duì)線性時(shí)間視頻而言，其中關(guān)鍵視頻幀描述是快速定位的關(guān)鍵，主要分為以下三個(gè)關(guān)鍵點(diǎn):
[0040]—、分析過(guò)程
[0041 ]對(duì)關(guān)鍵數(shù)據(jù)幀的內(nèi)容，幀數(shù)據(jù)的某個(gè)特征區(qū)域進(jìn)行特征點(diǎn)獲取F，F(xiàn) = {FI，F(xiàn)2，...Fm}，其中Fk被定義為區(qū)域特征值集合Fk= {Cl，C2，...Cp}，同理通過(guò)對(duì)時(shí)間序列Tt，可以得到Ft。而后對(duì)其中的特征排序，使得其特征有序分布在特定半徑的超球面上，最終Tt描述為竹={^142，...切}，同理可以另外一段時(shí)間序列為擴(kuò)的不同或相同的視頻為1'‘^‘t’ = {t‘l，t‘2，...t‘m}，其中t與t‘可以不同。
[0042]二、定位過(guò)程
[0043]通過(guò)排序后的特征組Tt，T‘t’進(jìn)行快速比較。通過(guò)判斷空間幾何判斷:t‘l與tl及tn關(guān)系分別為dll，dln，tm與tl及tn關(guān)系分別為dml，dmn，得到Dl = (dll-dml)*(dll_dmn)與D2=(dln-dml)*(dln-dmn)，如果 516~(01)〈>516~(02)或01=0|02 = 0，說(shuō)明兩個(gè)序列在空間球中有相互覆蓋，那么繼續(xù)l/2*t時(shí)間內(nèi)的序列進(jìn)行搜著，直到?jīng)]有超球交織為止，然后定位最小的Dl，D2位置，此時(shí)得到的特征序列可能是分布在有限時(shí)間范圍內(nèi)的一個(gè)或多個(gè)鏡頭場(chǎng)景幀。如何解決超球中的交叉關(guān)系是本研究提尚速度的關(guān)鍵。
[0044]三、時(shí)間復(fù)雜度分析
[0045]視頻流獲取特征時(shí)間O(N)，特征排序時(shí)間為N*L0G2N，超球獲取相似特征時(shí)間因?yàn)樯婕暗絀 /2查找，所以時(shí)間復(fù)雜度為N*L0G2N。所以總的時(shí)間復(fù)雜度可以為N*L0G2N，算法可以達(dá)到較高的速度。
[0046]視頻標(biāo)注不僅范圍廣，而且同一個(gè)語(yǔ)義往往可用不同的標(biāo)注詞進(jìn)行標(biāo)注，此外，一幅圖像含義的語(yǔ)義信息是非常豐富的，通過(guò)外部信息或者學(xué)習(xí)獲得的圖像標(biāo)注往往是不完整的、含有大量的噪聲數(shù)據(jù)，建立語(yǔ)意框架
[0047]項(xiàng)目首先利用WordNet輔助分析標(biāo)注詞之間的相關(guān)性，從一幅圖像的眾多候選關(guān)鍵詞中挑出最相關(guān)、最具代表性的詞，濾除掉無(wú)關(guān)噪聲詞匯，同時(shí)結(jié)合通過(guò)視覺(jué)信息判斷圖像的相似性，從相似的圖像中獲得缺失的標(biāo)注信息;然后生成語(yǔ)義場(chǎng)并將在邏輯上將具有相同語(yǔ)義信息的圖像組織在一起，構(gòu)成等勢(shì)線。由于在同一等勢(shì)線上的圖像具有某種相同的語(yǔ)義，可以認(rèn)為這些圖像間的其他語(yǔ)義也具有相關(guān)性;最后，通過(guò)分析這些具有圖像的語(yǔ)義，進(jìn)一步進(jìn)行標(biāo)注的傳播和噪聲的消除，實(shí)現(xiàn)圖像標(biāo)注改善。
[0048]定義視頻關(guān)聯(lián)場(chǎng)、等勢(shì)線，場(chǎng)的概念最早是1937年由英國(guó)物理學(xué)家法拉第提出，用于描述物質(zhì)粒子間的非接觸相互作用。隨著場(chǎng)論思想的發(fā)展，人們將其抽象為一個(gè)數(shù)學(xué)概念，用來(lái)描述某個(gè)物理量或者數(shù)學(xué)函數(shù)在空間內(nèi)的分布規(guī)律。基礎(chǔ)物理學(xué)中討論得最多的是有源矢量場(chǎng)，主要特征是空間中存在無(wú)數(shù)條以場(chǎng)源為中心的等勢(shì)線。處在同一等勢(shì)線上的物體受力的雖方向不同，但大小相同。受上述物理思想的啟發(fā)，本研究嘗試將場(chǎng)理論抽象到語(yǔ)義空間中，考慮將具有相同語(yǔ)義信息的圖像組織在一起，構(gòu)成等勢(shì)線，因此，真實(shí)世界的圖像可以構(gòu)成若干條等勢(shì)線，等勢(shì)線圖如附錄。
[0049]在進(jìn)行圖像標(biāo)注改善時(shí)，根據(jù)目標(biāo)的語(yǔ)義信息，有針對(duì)性地定位到在語(yǔ)義上與之相同或接近的等勢(shì)線上，等勢(shì)線的引入可以將真實(shí)世界圖像的標(biāo)注信息進(jìn)行有效地組織，使語(yǔ)義上相近的圖像有機(jī)地聚集在一起。這樣的組織不僅可以提高基于關(guān)鍵字的檢索，使檢索過(guò)程更有針對(duì)性，而且，由于在同一等勢(shì)線上的圖像具有某一相同的語(yǔ)義，可以認(rèn)為這些圖像間的其他語(yǔ)義也具有相關(guān)性，通過(guò)語(yǔ)義分析和篩選，實(shí)現(xiàn)圖像標(biāo)注的補(bǔ)充。需要說(shuō)明的是，本項(xiàng)目中圖像標(biāo)注改善是一個(gè)不斷迭代和完善的過(guò)程，即語(yǔ)義場(chǎng)是建立在結(jié)合WordNet和視覺(jué)相似性濾除噪聲詞匯之上的，而構(gòu)建語(yǔ)義場(chǎng)后進(jìn)行具有同等勢(shì)線間的圖像標(biāo)注傳播后難免會(huì)存在噪聲詞匯，需要進(jìn)一步利用WordNet和視覺(jué)相似性進(jìn)行噪聲標(biāo)注的消除，循環(huán)往復(fù)，逐步提尚圖像標(biāo)注的質(zhì)量。
[0050]除了設(shè)計(jì)向量空間或距離空間這類單層次的索引外，如何創(chuàng)建一個(gè)類似的層次結(jié)構(gòu)用于索引全局特征及其對(duì)應(yīng)的局部特征也是本發(fā)明的要點(diǎn)。
[0051]以上所述的具體實(shí)施例，對(duì)本發(fā)明的解決的技術(shù)問(wèn)題、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步詳細(xì)說(shuō)明，所應(yīng)理解的是，以上所述僅為本發(fā)明的具體實(shí)施例而已，并不用于限制本發(fā)明，凡在本發(fā)明的精神和原則之內(nèi)，所做的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的方法，其特征在于，其包括以下步驟: 步驟一:利用詞匯網(wǎng)路輔助分析標(biāo)注詞之間的相關(guān)性，從一幅圖像的眾多候選關(guān)鍵詞中挑出最相關(guān)、最具代表性的詞，濾除掉無(wú)關(guān)噪聲詞匯，同時(shí)結(jié)合通過(guò)視覺(jué)信息判斷圖像的相似性，從相似的圖像中獲得缺失的標(biāo)注信息；步驟二:生成語(yǔ)義場(chǎng)并將在邏輯上將具有相同語(yǔ)義信息的圖像組織在一起，構(gòu)成等勢(shì)線；步驟三:通過(guò)分析這些具有圖像的語(yǔ)義，進(jìn)一步進(jìn)行標(biāo)注的傳播和噪聲的消除，實(shí)現(xiàn)圖像標(biāo)注改善。2.根據(jù)權(quán)利要求1所述的高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的方法，其特征在于，所述步驟二包括以下步驟:對(duì)自然圖像所在的語(yǔ)意環(huán)境進(jìn)行分析并生成語(yǔ)意場(chǎng);對(duì)原始視頻圖像進(jìn)行自動(dòng)歸類處理，按語(yǔ)意網(wǎng)絡(luò)環(huán)境進(jìn)行歸屬；自動(dòng)歸類當(dāng)前使用局部特征點(diǎn)歸屬，得到集合;使用空間覆蓋體進(jìn)行集合的覆蓋，覆蓋體的形狀是超球或超橢球體;對(duì)覆蓋體的每個(gè)學(xué)習(xí)階段標(biāo)記其優(yōu)先關(guān)系，按優(yōu)先關(guān)系的不同，描述其回歸覆蓋的優(yōu)先次序;對(duì)樣本學(xué)習(xí)的每個(gè)角度，用不同的優(yōu)先關(guān)系的構(gòu)造序列。3.根據(jù)權(quán)利要求1所述的高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的方法，其特征在于，所述步驟三包括以下步驟:對(duì)原始圖像內(nèi)容進(jìn)行網(wǎng)絡(luò)歸類;對(duì)視頻圖像進(jìn)行特征獲取;按語(yǔ)義場(chǎng)獲取優(yōu)先順序，使用優(yōu)先順序進(jìn)行的高維空間點(diǎn)比對(duì);按比較結(jié)果進(jìn)行空間點(diǎn)覆蓋的獲取，比較局部特征點(diǎn)和整個(gè)圖像特征點(diǎn)的邏輯關(guān)系，排序后獲取可能的圖像。4.一種高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的系統(tǒng)，其特征在于，其包括: 語(yǔ)意分析模塊，用于對(duì)視頻圖像的上下文進(jìn)行語(yǔ)意分析；語(yǔ)意場(chǎng)管理模塊，通過(guò)不同的語(yǔ)意通道，實(shí)現(xiàn)對(duì)語(yǔ)意的優(yōu)先關(guān)系覆蓋模型；視覺(jué)相似性度量計(jì)算模塊，通過(guò)對(duì)圖像內(nèi)容的空間點(diǎn)覆蓋，實(shí)現(xiàn)基于高維空間的點(diǎn)幾何關(guān)系運(yùn)算；圖像數(shù)據(jù)庫(kù)，用于存取圖像數(shù)據(jù)可的訓(xùn)練數(shù)據(jù)樣本，訓(xùn)練數(shù)據(jù)樣本包括對(duì)同角度的優(yōu)先排序序列。5.根據(jù)權(quán)利要求4所述的高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的系統(tǒng)，其特征在于，所述圖像數(shù)據(jù)庫(kù)支持高維空間點(diǎn)覆蓋方法的比較方法。
【文檔編號(hào)】G06K9/00GK106021365SQ201610307201
【公開(kāi)日】2016年10月12日
【申請(qǐng)日】2016年5月11日
【發(fā)明人】楊珺, 朱世交
【申請(qǐng)人】上海迪目信息科技有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：楊珺;朱世交;
技術(shù)所有人：上海迪目信息科技有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

序列標(biāo)注模型相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

高維空間點(diǎn)超球覆蓋視頻序列標(biāo)注的系統(tǒng)和方法