一種視頻標注方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明實施例提供一種視頻標注方法及系統(tǒng),所述方法包括:服務(wù)器端設(shè)置標注接口;當視頻播放終端在播放過程中,針對視頻圖像生成標注信息并通過所述標注接口向服務(wù)器提交,則服務(wù)器接收所述標注信息,并根據(jù)所述標注信息提取相應的視頻區(qū)段;服務(wù)器判斷所述視頻區(qū)段內(nèi),是否存在重合度與所述標注信息達到重合閾值的視頻標注,若存在則將所述標注信息合并到所述視頻標注中;若不存在則根據(jù)所述標注信息生成視頻標注。
【專利說明】一種視頻標注方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,特別涉及一種視頻標注方法及系統(tǒng)。
【背景技術(shù)】
[0002] 視頻標注,是現(xiàn)階段網(wǎng)絡(luò)視頻播放過程中,為用戶提供的一種新功能。所謂視頻標 注就是標注出在視頻圖像里出現(xiàn)的某些人物、物品或場景等元素,并向用戶展示該元素的 相關(guān)信息,或者提供顯示與該元素相關(guān)的鏈接。
[0003] 例如圖IA所示,為視頻圖像中呈現(xiàn)的"女孩面孔";圖中線框圈出的位置,即表示該 圖像中被標注的區(qū)域;圖IA中"女孩佩戴的眼鏡"這一元素為標注對象。當用戶指令停留 在被標注的區(qū)域時,圖像中便可浮現(xiàn)出被標注元素相關(guān)的關(guān)聯(lián)信息,所述關(guān)聯(lián)信息可以是 被標注元素(女孩佩戴的眼鏡)的相關(guān)信息,如圖IB所示。
[0004] 用戶可在觀看視頻的過程中,既可以查看現(xiàn)有的標注,也可以自行對視頻進行標 注以供其他觀看者查看。不過現(xiàn)有技術(shù)中,大量用戶對視頻圖像進行標注,所導致的缺陷 是,圖像中相同或類似的區(qū)域所顯示的元素往往被重復標注,很容易導致關(guān)聯(lián)信息顯示的 混亂。
【發(fā)明內(nèi)容】
[0005] 有鑒于此,本發(fā)明的目的在于提供一種視頻標注方法及系統(tǒng),通過合并同區(qū)域標 注,以實現(xiàn)標注信息的有序顯示。
[0006] 為實現(xiàn)上述目的,本發(fā)明有如下技術(shù)方案:
[0007] -種視頻標注方法,所述方法包括:
[0008] 服務(wù)器端設(shè)置標注接口;
[0009] 當視頻播放終端在播放過程中,針對視頻圖像生成標注信息并通過所述標注接口 向服務(wù)器提交,則服務(wù)器接收所述標注信息,并根據(jù)所述標注信息提取相應的視頻區(qū)段; [0010] 服務(wù)器判斷所述視頻區(qū)段內(nèi),是否存在重合度與所述標注信息達到重合閾值的視 頻標注,若存在則將所述標注信息合并到所述視頻標注中;若不存在則根據(jù)所述標注信息 生成視頻標注。
[0011] 所述針對視頻圖像生成標注信息具體為:
[0012] 視頻播放終端針對特定視頻圖像中的固定區(qū)域進行視頻標注,并將被標注的圖像 區(qū)域?qū)男畔⒆鳛闃俗⑿畔ⅲ?br>
[0013] 則所述標注信息包括視頻編號、標注時刻和標注區(qū)域;
[0014] 所述視頻編號為被標注視頻的ID ;所述標注時刻為被標注圖像顯示時,被標注視 頻的播放時間;所述標注區(qū)域為視頻標注覆蓋被標注視頻圖像的坐標范圍。
[0015] 所述根據(jù)所述標注信息提取相應的視頻區(qū)段具體為:
[0016] 根據(jù)圖像內(nèi)容將視頻分為若干區(qū)段,并按照播放時間為所述區(qū)段建立視頻索引;
[0017] 通過所述視頻編號查找相應的視頻索引,并根據(jù)所述標注時刻對所述視頻索引查 詢,得到該標注時刻對應的視頻區(qū)段。
[0018] 所述方法還包括:
[0019] 當通過所述視頻編號未查找到相應的視頻索引,則為所述視頻編號對應的視頻建 立視頻索引,并獲取所建立的視頻索引。
[0020] 所述標注區(qū)域與所述視頻標注包括坐標數(shù)據(jù),則判斷所述視頻區(qū)段內(nèi),是否存在 重合度與所述標注信息達到重合閾值的視頻標注具體為:
[0021] 預設(shè)重合閾值,并獲取所述視頻區(qū)段內(nèi)已存在的視頻標注;
[0022] 計算所述標注區(qū)域的坐標數(shù)據(jù),與視頻區(qū)段內(nèi)視頻標注的坐標數(shù)據(jù)的差值;
[0023] 若所述差值不大于所述重合閾值,則認為所述標注區(qū)域與所述視頻標注的重合度 達到重合閾值。
[0024] 所述方法還包括:
[0025] 若所述視頻區(qū)段內(nèi),不存在重合度與所述標注信息達到重合閾值的視頻標注,則 根據(jù)所述標注信息生成一個視頻標注。
[0026] -種視頻標注系統(tǒng),所述系統(tǒng)包括:
[0027] 提取模塊,用于通過標注接口接收視頻播放終端所設(shè)定的標注信息,并根據(jù)所述 標注信息提取相應的視頻區(qū)段;
[0028] 判斷模塊,用于判斷所述視頻區(qū)段內(nèi),是否存在重合度與所述標注信息達到重合 閾值的視頻標注,若存在則將所述標注信息合并到所述視頻標注中。
[0029] 所述標注信息包括:
[0030] 視頻編號、標注時刻和標注區(qū)域。
[0031] 所述提取模塊包括:
[0032] 接收單元,用于接收視頻播放終端所設(shè)定的標注信息;
[0033] 索引單元,用于根據(jù)圖像內(nèi)容將視頻分為若干區(qū)段,并按照播放時間為所述區(qū)段 建立視頻索引;
[0034] 查詢單元,用于通過所述視頻編號查找相應的視頻索引,并根據(jù)所述標注時刻對 所述視頻索引查詢,得到該標注時刻對應的視頻區(qū)段。
[0035] 所述判斷模塊包括:
[0036] 設(shè)置單元,用于預設(shè)重合閾值,并獲取所述視頻區(qū)段內(nèi)已存在的視頻標注;
[0037] 計算單元,用于計算所述標注區(qū)域的坐標數(shù)據(jù),與視頻區(qū)段內(nèi)視頻標注的坐標數(shù) 據(jù)的差值;在所述差值不大于所述重合閾值時,認為所述標注區(qū)域與所述視頻標注的重合 度達到重合閾值。
[0038] 通過以上技術(shù)方案可知,本發(fā)明存在的有益效果是:通過合并相同或相近區(qū)域內(nèi) 的視頻標注,避免了建立重復的視頻標注,使得視頻標注的關(guān)聯(lián)信息的顯示得以明確有序。
【專利附圖】
【附圖說明】
[0039] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明 的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù) 這些附圖獲得其他的附圖。
[0040] 圖IA?圖ID為所述視頻標注示意圖;
[0041] 圖2為本發(fā)明實施例所述方法流程圖;
[0042] 圖3為本發(fā)明另一實施例所述方法流程圖;
[0043] 圖4為本發(fā)明實施例所述系統(tǒng)結(jié)構(gòu)示意圖。
【具體實施方式】
[0044] 為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員 在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0045] 參照圖IA?圖1B,可以明確的了解所謂視頻標注的概念。在視頻標注技術(shù)當中, 可使每個用戶都享用標注功能;這就極容易出現(xiàn),大量不同用戶均標注了相同或者相近的 區(qū)域,并可能為該區(qū)域關(guān)聯(lián)相同或者不同的關(guān)聯(lián)信息。如圖IC所示,三個有重疊的線框為 不同用戶所標注的區(qū)域,當用戶指令停留在重疊區(qū)域內(nèi)時,浮現(xiàn)出的關(guān)聯(lián)信息就可能是任 意標注的關(guān)聯(lián)信息。當大量用戶進行標注,使得某個區(qū)域存在數(shù)十個甚至上百個標注時,關(guān) 聯(lián)信息顯示的混亂可想而知。這也是現(xiàn)有技術(shù)中亟待解決的問題。
[0046] 本發(fā)明將通過合并相同或相近區(qū)域內(nèi)的視頻標注,解決以上技術(shù)問題。具體的,本 發(fā)明將提供一種視頻標注方法,參見圖2所示為本發(fā)明所述方法的具體實施例:
[0047] 步驟201、服務(wù)器端設(shè)置標注接口。
[0048] 服務(wù)器設(shè)置標注接口,并將所述標注接口向播放終端提供,即意味著向播放終端 提供了視頻進行標注的相關(guān)功能;播放終端通過該標注接口可以提交相關(guān)的標注信息以生 產(chǎn)標注。
[0049] 步驟202、當視頻播放終端在播放過程中,針對視頻圖像生成標注信息并通過所述 標注接口向服務(wù)器提交,則服務(wù)器接收所述標注信息,并根據(jù)所述標注信息提取相應的視 頻區(qū)段。
[0050] 當播放終端的用戶通過標注接口,針對特定視頻圖像中的固定區(qū)域進行視頻標注 時,便會得到將被標注的圖像區(qū)域?qū)男畔?,而這部分信息將作為標注信息。
[0051] 所述標注信息包括視頻編號、標注時刻和標注區(qū)域。所述視頻編號為被標注視頻 的ID ;所述標注時刻為被標注圖像顯示時,被標注視頻的播放時間;所述標注區(qū)域為視頻 標注覆蓋被標注視頻圖像的坐標范圍,具體可以是視頻標注覆蓋的坐標范圍,也就類似于 圖IB或圖IC中的線框。
[0052] 用戶通過播放終端設(shè)定了標注信息并將標注信息上傳至視頻服務(wù)器;視頻服務(wù)器 便明確了標注的具體形式,以便于后續(xù)根據(jù)所述標注信息實際生成視頻標注。另外,所述標 注信息中還可以根據(jù)需要,加帶該標注對應的關(guān)聯(lián)信息。
[0053] 本實施例中,視頻服務(wù)器接收了所述標注信息之后,根據(jù)所述標注信息查找到被 標注的視頻,并且從被標注視頻中提取出相應的視頻區(qū)段。所述視頻區(qū)段,是由視頻中在 標注時刻乃至標注時刻前后若干時間范圍內(nèi)所有視頻幀所組成的,視頻區(qū)段內(nèi)所有的視頻 幀,具有相同或者相類似的圖像。
[0054] 例如在同一場景鏡頭下的連續(xù)圖像,即被劃分在同一視頻區(qū)段之內(nèi)。假設(shè)某視頻 0"?20"顯示的圖像類似于圖IA所示的"女孩面孔";隨即鏡頭進行切換,20"?38"顯示 的圖像類似于圖ID所示的"小狗"。那么該視頻0"?20"為一個視頻區(qū)段,20"?38"為 另一個視頻區(qū)段。
[0055] 可以理解,如果僅僅標注所述標注時刻處的一幀或幾幀圖像,那么該視頻標注存 在的時間將過于短暫,無法被用戶使用。而在視頻區(qū)段內(nèi),同一圖像區(qū)域往往顯示的始終是 同一元素。所以一般來說,視頻標注不應僅僅存在于標注時刻,而是應該在視頻區(qū)段時間內(nèi) 是始終存在的。
[0056] 步驟203、服務(wù)器判斷所述視頻區(qū)段內(nèi),是否存在重合度與所述標注信息達到重合 閾值的視頻標注,若存在則將所述標注信息合并到所述視頻標注中;若不存在則根據(jù)所述 標注信息生成視頻標注。
[0057] 本實施例中為避免重復標注導致的信息顯示混亂,所以提取到所述視頻區(qū)段之 后,判斷該視頻區(qū)段之內(nèi),是否已經(jīng)存在于標注信息中標注區(qū)域重合度較高的視頻標注。如 果存在,便不再為所述標注信息建立新的視頻標注,而是將其合并到已存在的視頻標注當 中,保留原有的標準化的標注區(qū)域。由此避免了重復的標注。相同或相近區(qū)域內(nèi)如果不存 在重復的視頻標注,自然也就不會產(chǎn)生關(guān)聯(lián)信息顯示混亂的問題。
[0058] 反之如果該區(qū)段之內(nèi)尚不存在重合度較高的標注,則根據(jù)本次提交的標注信息生 成新的標注。
[0059] 通過以上技術(shù)方案可知,本實施例存在的有益效果是:通過合并相同或相近區(qū)域 內(nèi)的視頻標注,避免了建立重復的視頻標注,使得視頻標注的關(guān)聯(lián)信息的顯示得以明確有 序。
[0060] 參照圖3所示,為本發(fā)明所述方法的另一個具體實施例。本實施例中將在前述實 施例的基礎(chǔ)之上,進行更為詳細的描述和公開。本實施例中所述方法包括以下步驟:
[0061] 步驟301、根據(jù)圖像內(nèi)容將視頻分為若干區(qū)段,并按照播放時間為所述區(qū)段建立視 頻索引。
[0062] 本實施例中,視頻服務(wù)器可以預先完成視頻區(qū)段的劃分,并根據(jù)劃分情況建立視 頻索引。
[0063] 例如,對視頻編號為00001的視頻,進行視頻區(qū)段的劃分,該視頻總長度為1',其 中0"?15"為第一個視頻區(qū)段,15"?35"為第二個視頻區(qū)段,35"?53"為第三個視頻區(qū) 段,53"?60"為第四個視頻區(qū)段。對此劃分結(jié)果建立一個視頻索引如表1 :
[0064]
【權(quán)利要求】
1. 一種視頻標注方法,其特征在于,所述方法包括: 服務(wù)器端設(shè)置標注接口; 當視頻播放終端在播放過程中,針對視頻圖像生成標注信息并通過所述標注接口向服 務(wù)器提交,則服務(wù)器接收所述標注信息,并根據(jù)所述標注信息提取相應的視頻區(qū)段; 服務(wù)器判斷所述視頻區(qū)段內(nèi),是否存在重合度與所述標注信息達到重合閾值的視頻標 注,若存在則將所述標注信息合并到所述視頻標注中;若不存在則根據(jù)所述標注信息生成 視頻標注。
2. 根據(jù)權(quán)利要求1所述方法,其特征在于,所述針對視頻圖像生成標注信息具體為: 視頻播放終端針對特定視頻圖像中的固定區(qū)域進行視頻標注,并將被標注的圖像區(qū)域 對應的信息作為標注信息; 則所述標注信息包括視頻編號、標注時刻和標注區(qū)域; 所述視頻編號為被標注視頻的ID ;所述標注時刻為被標注圖像顯示時,被標注視頻的 播放時間;所述標注區(qū)域為視頻標注覆蓋被標注視頻圖像的坐標范圍。
3. 根據(jù)權(quán)利要求2所述方法,其特征在于,所述根據(jù)所述標注信息提取相應的視頻區(qū) 段具體為: 根據(jù)圖像內(nèi)容將視頻分為若干區(qū)段,并按照播放時間為所述區(qū)段建立視頻索引; 通過所述視頻編號查找相應的視頻索引,并根據(jù)所述標注時刻對所述視頻索引查詢, 得到該標注時刻對應的視頻區(qū)段。
4. 根據(jù)權(quán)利要求3所述方法,其特征在于,所述方法還包括: 當通過所述視頻編號未查找到相應的視頻索引,則為所述視頻編號對應的視頻建立視 頻索引,并獲取所建立的視頻索引。
5. 根據(jù)權(quán)利要求2所述方法,其特征在于,所述標注區(qū)域與所述視頻標注包括坐標數(shù) 據(jù),則判斷所述視頻區(qū)段內(nèi),是否存在重合度與所述標注信息達到重合閾值的視頻標注具 體為: 預設(shè)重合閾值,并獲取所述視頻區(qū)段內(nèi)已存在的視頻標注; 計算所述標注區(qū)域的坐標數(shù)據(jù),與視頻區(qū)段內(nèi)視頻標注的坐標數(shù)據(jù)的差值; 若所述差值不大于所述重合閾值,則認為所述標注區(qū)域與所述視頻標注的重合度達到 重合閾值。
6. 根據(jù)權(quán)利要求1?5任意一項所述方法,其特征在于,所述方法還包括: 若所述視頻區(qū)段內(nèi),不存在重合度與所述標注信息達到重合閾值的視頻標注,則根據(jù) 所述標注信息生成一個視頻標注。
7. -種視頻標注系統(tǒng),其特征在于,所述系統(tǒng)包括: 提取模塊,用于通過標注接口接收視頻播放終端所設(shè)定的標注信息,并根據(jù)所述標注 信息提取相應的視頻區(qū)段; 判斷模塊,用于判斷所述視頻區(qū)段內(nèi),是否存在重合度與所述標注信息達到重合閾值 的視頻標注,若存在則將所述標注信息合并到所述視頻標注中。
8. 根據(jù)權(quán)利要求7所述系統(tǒng),其特征在于,所述標注信息包括: 視頻編號、標注時刻和標注區(qū)域。
9. 根據(jù)權(quán)利要求8所述系統(tǒng),其特征在于,所述提取模塊包括: 接收單元,用于接收視頻播放終端所設(shè)定的標注信息; 索引單元,用于根據(jù)圖像內(nèi)容將視頻分為若干區(qū)段,并按照播放時間為所述區(qū)段建立 視頻索引; 查詢單元,用于通過所述視頻編號查找相應的視頻索引,并根據(jù)所述標注時刻對所述 視頻索引查詢,得到該標注時刻對應的視頻區(qū)段。
10.根據(jù)權(quán)利要求8所述系統(tǒng),其特征在于,所述判斷模塊包括: 設(shè)置單元,用于預設(shè)重合閾值,并獲取所述視頻區(qū)段內(nèi)已存在的視頻標注; 計算單元,用于計算所述標注區(qū)域的坐標數(shù)據(jù),與視頻區(qū)段內(nèi)視頻標注的坐標數(shù)據(jù)的 差值;在所述差值不大于所述重合閾值時,認為所述標注區(qū)域與所述視頻標注的重合度達 到重合閾值。
【文檔編號】H04N21/845GK104391960SQ201410714405
【公開日】2015年3月4日 申請日期:2014年11月28日 優(yōu)先權(quán)日:2014年11月28日
【發(fā)明者】何裕南, 楊琛 申請人:北京奇藝世紀科技有限公司