專(zhuān)利名稱(chēng):用于管理視頻內(nèi)容的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用 于管理視頻內(nèi)容的方法和裝置,并且更具體地,但是非排它的,涉及用戶(hù)可以向視頻托管(hosting)站點(diǎn)上傳視頻內(nèi)容以供其他用戶(hù)訪問(wèn)的環(huán)境。
背景技術(shù):
在視頻托管網(wǎng)站中,諸如YouTube, Google Video (谷歌視頻)和Yahoo ! Video(雅虎!視頻),可由用戶(hù)將視頻內(nèi)容上傳到站點(diǎn)并通過(guò)搜索引擎使其它用戶(hù)能夠獲得所述視頻內(nèi)容??梢韵嘈诺氖?,當(dāng)前的web視頻搜索引擎基于用戶(hù)錄入的特定文本查詢(xún),根據(jù)視頻內(nèi)容的相關(guān)性分?jǐn)?shù)來(lái)提供經(jīng)過(guò)排名的搜索結(jié)果的列表。然后,用戶(hù)必須考慮該結(jié)果以查找感興趣的視頻或多個(gè)視頻。由于用戶(hù)容易向托管網(wǎng)站上傳視頻,獲得視頻以及再次發(fā)布經(jīng)過(guò)一些修改的視頻,視頻搜索結(jié)果中潛在地存在大量復(fù)制、或相近的復(fù)制、內(nèi)容。舉例來(lái)說(shuō),復(fù)制的視頻內(nèi)容可包括具有不同的格式、編碼參數(shù)、諸如顏色或亮度的光度變化、用戶(hù)編輯和內(nèi)容修改的視頻。這樣可能使得用戶(hù)查找自己實(shí)際所期望的內(nèi)容變得困難或不方便。例如,基于來(lái)自YouTube, Google Video (谷歌視頻)和Yahoo ! Video (雅虎!視頻)的查詢(xún)的樣本,可以發(fā)現(xiàn)在搜索結(jié)果中列出了平均有超過(guò)27%的近似復(fù)制視頻,對(duì)于更流行的視頻,結(jié)果中會(huì)有更多的復(fù)制。假設(shè)搜索結(jié)果的很高百分率的復(fù)制視頻,用戶(hù)必須花費(fèi)大量時(shí)間對(duì)其進(jìn)行篩選以找到他們所需要的視頻,并且必須重復(fù)地觀看那些已經(jīng)瀏覽過(guò)的相似視頻的拷貝。當(dāng)用戶(hù)從網(wǎng)站搜索視頻時(shí),他們通常對(duì)第一屏上所示出的結(jié)果感興趣。復(fù)制的結(jié)果會(huì)降低視頻搜索、獲取和瀏覽的用戶(hù)體驗(yàn)。此外,這些復(fù)制的視頻內(nèi)容增加了網(wǎng)絡(luò)存儲(chǔ)開(kāi)銷(xiāo)和通過(guò)網(wǎng)絡(luò)傳遞復(fù)制的視頻內(nèi)容的開(kāi)銷(xiāo)。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的第一方面,一種管理視頻內(nèi)容的方法,包括使特定視頻文件具有描述指定視頻文件的內(nèi)容的至少一個(gè)關(guān)聯(lián)標(biāo)簽。分析所述至少一個(gè)關(guān)聯(lián)標(biāo)簽同與數(shù)據(jù)存儲(chǔ)中的多個(gè)視頻文件相關(guān)聯(lián)的標(biāo)簽之間的語(yǔ)義關(guān)系。使用分析的結(jié)果從多個(gè)視頻文件中選擇視頻文件的集合。將指定視頻文件的內(nèi)容與所選集合的內(nèi)容進(jìn)行比較,以確定內(nèi)容的相似度。將所述確定的結(jié)果用于更新與數(shù)據(jù)存儲(chǔ)中視頻文件的相似度相關(guān)的信息。通過(guò)使用來(lái)自標(biāo)簽的語(yǔ)義信息來(lái)識(shí)別可能具有相似內(nèi)容的這些視頻文件,其允許從在通過(guò)將指定視頻與所述集合中包括的那些視頻進(jìn)行比較的復(fù)制檢測(cè)之前可用的總數(shù)的文件中選擇用于進(jìn)一步處理的視頻文件的集合。通過(guò)減少必須考慮的內(nèi)容的數(shù)量,使得更為有效并且更少資源集中地應(yīng)用視頻復(fù)制檢測(cè)技術(shù)。特別有益的是在數(shù)據(jù)存儲(chǔ)中保持與視頻文件的相似度相關(guān)的信息,以用于改善視頻搜索結(jié)果,且其還可能有益于其他目的,例如,用于對(duì)存檔內(nèi)容進(jìn)行組織。視頻復(fù)制和相似度檢測(cè)在其潛在的搜索、主題追蹤和版權(quán)保護(hù)中具有潛力。標(biāo)簽可以是用戶(hù)生成的。例如,當(dāng)用戶(hù)向托管網(wǎng)站上傳視頻文件時(shí),可以邀請(qǐng)他們添加關(guān)鍵詞或其他描述符。存在對(duì)用戶(hù)使用準(zhǔn)確的且提供有用信息的標(biāo)簽的激勵(lì),使得可能希望查看該內(nèi)容的其他用戶(hù)能夠方便的找到該內(nèi)容。然而,添加標(biāo)簽或多個(gè)標(biāo)簽的用戶(hù)不需要是向數(shù)據(jù)存儲(chǔ)添加視頻文件的人。例如,可能為人分配對(duì)已經(jīng)存檔的內(nèi)容進(jìn)行索引的工作。在一種方法中,提供標(biāo)簽而是由用戶(hù)分配標(biāo)簽時(shí)可能涉及一定程度的自動(dòng)化,但這樣可能趨于提供更低價(jià)值的語(yǔ)義信息。當(dāng)要向數(shù)據(jù)存儲(chǔ)添加指定的視頻文件時(shí),可以應(yīng)用所述方法。然而,其可以用于管理之前已經(jīng)添加到數(shù)據(jù)存儲(chǔ)中的視頻內(nèi)容,以便舉例來(lái)說(shuō),對(duì)與數(shù)據(jù)存儲(chǔ)所保持的視頻內(nèi)容的相似度有關(guān)的信息進(jìn)行改進(jìn)。在一個(gè)實(shí)施例中,數(shù)據(jù)存儲(chǔ)中包括的視頻文件中的任意一個(gè)可以被視為指定的視頻文件并且用作查找數(shù)據(jù)存儲(chǔ)中的相似視頻文件的查詢(xún)。根據(jù)本發(fā)明的另一方面,一種被編程或配置為執(zhí)行根 據(jù)第一方面的方法的設(shè)備。
現(xiàn)在將僅通過(guò)實(shí)例并且參考附圖來(lái)描述本發(fā)明的一些實(shí)施例,其中圖I示例性地示出了根據(jù)本發(fā)明的實(shí)現(xiàn)方式;圖2示例性地示出了圖I的實(shí)現(xiàn)方式的視頻復(fù)制檢測(cè)步驟的一部分。
具體實(shí)施例方式參照?qǐng)D1,視頻托管網(wǎng)站包括視頻數(shù)據(jù)庫(kù)1,其保持視頻內(nèi)容、與視頻內(nèi)容相關(guān)聯(lián)的標(biāo)簽以及與內(nèi)容的關(guān)系相關(guān)的信息。當(dāng)用戶(hù)上傳了新的視頻2時(shí),他們還可以將標(biāo)簽分配給視頻內(nèi)容。標(biāo)簽是以某種方式描述視頻文件的內(nèi)容的關(guān)鍵詞或術(shù)語(yǔ)。標(biāo)簽提供了視頻內(nèi)容的個(gè)性化查看并且因此提供了視頻語(yǔ)義信息的一部分。第一步是使用標(biāo)簽來(lái)選擇視頻數(shù)據(jù)庫(kù)I中已經(jīng)包括的視頻,其中所述視頻在語(yǔ)義上與新上傳的視頻I相關(guān)。這將通過(guò)標(biāo)簽關(guān)系處理器3來(lái)執(zhí)行,其接受與新視頻2相關(guān)聯(lián)的標(biāo)簽和與來(lái)自數(shù)據(jù)庫(kù)I的之前上傳的視頻相關(guān)聯(lián)的標(biāo)簽。由于用戶(hù)通常會(huì)為視頻內(nèi)容分配多于一個(gè)的標(biāo)簽,因此還需要確定標(biāo)簽之間的關(guān)系。通常,存在兩種類(lèi)型的關(guān)系A(chǔ)ND (和)或者OR (或)。對(duì)標(biāo)簽應(yīng)用不同的關(guān)系給出不同的結(jié)果。在標(biāo)簽之間僅應(yīng)用AND關(guān)系,將促使選擇與標(biāo)簽中的每一個(gè)相關(guān)聯(lián)的那些視頻。這可能導(dǎo)致排除實(shí)際上與新上傳的視頻在語(yǔ)義上相關(guān)的一些視頻。例如,如果將新上傳的視頻標(biāo)記為“Susan Boyle”(蘇珊大媽)和“from Scotland”(來(lái)自蘇格蘭)并且應(yīng)用AND關(guān)系,則所選的視頻必須將“Susan Boyle”和“from Scotland”這兩者作為相關(guān)聯(lián)的標(biāo)簽。由于標(biāo)簽“from Scotland”和“Susan Boyle” 一起出現(xiàn)的頻率非常低,所以所選擇的視頻集合不包括僅利用“Susan Boyle”進(jìn)行標(biāo)記的許多視頻。然而,后者在語(yǔ)義上最可能與新上傳的視頻相關(guān)。在標(biāo)簽之間僅應(yīng)用OR關(guān)系,可能導(dǎo)致選擇比所需視頻更多的視頻。例如,如果將新上傳的視頻標(biāo)記為“apple”和“ipod”,則所選的集合可能包括與“iphone”相關(guān)的視頻和包括與“apple-fruit (蘋(píng)果-水果)”相關(guān)的視頻,但是后者在語(yǔ)義上與新上傳的視頻不相關(guān)。
在3處進(jìn)行標(biāo)簽關(guān)系分析,語(yǔ)義信息用于提供對(duì)用于進(jìn)一步處理的視頻文件集合的有益選擇,以檢測(cè)復(fù)制或相近復(fù)制。為了在多個(gè)標(biāo)簽之間導(dǎo)出正確的關(guān)系,基于來(lái)自同之前添加到數(shù)據(jù)庫(kù)I的現(xiàn)有視頻文件相關(guān)聯(lián)的大量標(biāo)簽的集合知識(shí)(collectiveknowledge),來(lái)測(cè)量標(biāo)簽同現(xiàn)(cooccurrence)信息。標(biāo)簽同現(xiàn)包含用于在語(yǔ)義域中捕捉標(biāo)簽相似度的有益信息。當(dāng)標(biāo)簽一起出現(xiàn)的概率較高,高于指定值時(shí),意味著使用AND關(guān)系來(lái)選擇通過(guò)多個(gè)標(biāo)簽獲取的視頻。當(dāng)標(biāo)簽同現(xiàn)的功率較低,低于指定值時(shí),基于多個(gè)標(biāo)準(zhǔn)來(lái)選擇與這些標(biāo)簽相關(guān)聯(lián)的視頻,所述標(biāo)準(zhǔn)例如是標(biāo)簽出現(xiàn)的頻率、標(biāo)簽的流行度、或其它合適參數(shù)。這樣的選擇有助于降低要被考慮的視頻文件的總數(shù)。因此,對(duì)于特定的新上傳的視頻,如果存在用戶(hù)分配的多于一個(gè)的標(biāo)簽,則由處理器3導(dǎo)出標(biāo)簽之間的關(guān)系。由于在視頻托管網(wǎng)站中存在大量被標(biāo)記的視頻,來(lái)自現(xiàn)有視頻的標(biāo)簽提供了用于確定標(biāo)簽關(guān)系的集合知識(shí)。根據(jù)標(biāo)簽關(guān)系的測(cè)量來(lái)計(jì)算標(biāo)簽同現(xiàn)頻率。存在用于計(jì)算標(biāo)簽同現(xiàn)的多種方法。例如,使用方程
權(quán)利要求
1.一種管理視頻內(nèi)容的方法,包括 獲取具有描述指定視頻文件的內(nèi)容的至少一個(gè)關(guān)聯(lián)標(biāo)簽的指定視頻文件; 分析所述至少一個(gè)關(guān)聯(lián)標(biāo)簽和與數(shù)據(jù)存儲(chǔ)中的多個(gè)視頻文件相關(guān)聯(lián)的標(biāo)簽之間的語(yǔ)義關(guān)系; 使用分析的結(jié)果從多個(gè)視頻文件中選擇視頻文件的集合; 將指定的視頻文件的內(nèi)容與所選集合的內(nèi)容進(jìn)行比較,以確定內(nèi)容的相似度;以及 使用確定的結(jié)果來(lái)更新與數(shù)據(jù)存儲(chǔ)中視頻文件的相似度相關(guān)的信息。
2.根據(jù)權(quán)利要求I所述的方法,其中使用標(biāo)簽同現(xiàn)的概率來(lái)導(dǎo)出所述語(yǔ)義關(guān)系。
3.根據(jù)權(quán)利要求2所述的方法,在概率大于指定值的情況下,在進(jìn)行集合選擇時(shí)對(duì)至少兩個(gè)標(biāo)簽應(yīng)用AND操作符;并且,在概率小于指定值的情況下,使用一個(gè)或多個(gè)其它標(biāo)準(zhǔn)來(lái)進(jìn)行集合選擇。
4.根據(jù)權(quán)利要求3所述的方法,其中其它標(biāo)準(zhǔn)包括以下內(nèi)容中的至少一個(gè)標(biāo)簽出現(xiàn)的頻率,和標(biāo)簽的流行度。
5.根據(jù)前述任意權(quán)利要求所述的方法,其中由用戶(hù)將指定的視頻文件添加到數(shù)據(jù)存儲(chǔ)中。
6.根據(jù)權(quán)利要求5所述的方法,其中所述用戶(hù)分配用于與指定的視頻文件相關(guān)聯(lián)的至少一個(gè)標(biāo)簽。
7.根據(jù)前述任意權(quán)利要求所述的方法,包括響應(yīng)于搜索查詢(xún),使用與數(shù)據(jù)存儲(chǔ)中視頻文件的相似度相關(guān)的信息來(lái)提供結(jié)果。
8.根據(jù)前述任意權(quán)利要求所述的方法,包括 安排視頻關(guān)系圖內(nèi)所選集合中包括的視頻文件,以指示所選集合中視頻文件的重疊內(nèi)容;并且使用視頻關(guān)系圖來(lái)確定所選集合與指定視頻文件之間的內(nèi)容相似度。
9.根據(jù)權(quán)利要求8所述的方法,其中在安排視頻關(guān)系圖內(nèi)所選集合中包括的視頻文件之后,將指定視頻文件的內(nèi)容和所選集合中的非重疊內(nèi)容進(jìn)行比較。
10.根據(jù)權(quán)利要求8或9所述的方法,包括更新視頻關(guān)系圖,以包括來(lái)自指定視頻文件的信息。
11.根據(jù)權(quán)利要求2所述的方法,包括使用下述方程來(lái)計(jì)算標(biāo)簽同現(xiàn)的概率
12.根據(jù)權(quán)利要求2所述的方法,包括使用Jaccard系數(shù)來(lái)計(jì)算標(biāo)簽同現(xiàn)的概率
13.一種被編程或被配置為執(zhí)行包括以下步驟的方法的設(shè)備 獲取具有描述指定視頻文件的內(nèi)容的至少一個(gè)關(guān)聯(lián)標(biāo)簽的指定視頻文件; 分析所述至少一個(gè)關(guān)聯(lián)標(biāo)簽和與數(shù)據(jù)存儲(chǔ)中的多個(gè)視頻文件相關(guān)聯(lián)的標(biāo)簽之間的語(yǔ)義關(guān)系; 使用分析的結(jié)果從多個(gè)視頻文件中選擇視頻文件的集合; 將指定的視頻文件的內(nèi)容與所選集合的內(nèi)容進(jìn)行比較,以確定內(nèi)容的相似度;以及 使用確定的結(jié)果來(lái)更新與數(shù)據(jù)存儲(chǔ)中視頻文件的相似度相關(guān)的信息。
14.根據(jù)權(quán)利要求13所述的設(shè)備,所述設(shè)備被編程或被配置為使用標(biāo)簽同現(xiàn)的概率來(lái)導(dǎo)出所述語(yǔ)義關(guān)系。
15.根據(jù)權(quán)利要求14所述的設(shè)備,所述設(shè)備被編程或被配置為,在概率大于指定值的情況下,在進(jìn)行集合選擇時(shí)對(duì)至少兩個(gè)標(biāo)簽應(yīng)用AND操作符;并且,在概率小于指定值的情況下,使用一個(gè)或多個(gè)其它標(biāo)準(zhǔn)來(lái)進(jìn)行集合選擇。
16.根據(jù)權(quán)利要求15所述的設(shè)備,其中其它標(biāo)準(zhǔn)包括以下內(nèi)容中的至少一個(gè)標(biāo)簽出現(xiàn)的頻率,和標(biāo)簽的流行度。
17.根據(jù)權(quán)利要求13至16任一項(xiàng)所述的設(shè)備,其 中由用戶(hù)將指定的視頻文件添加到數(shù)據(jù)存儲(chǔ)中。
18.根據(jù)權(quán)利要求17所述的設(shè)備,其中所述用戶(hù)分配用于與指定的視頻文件相關(guān)聯(lián)的至少一個(gè)標(biāo)簽。
19.根據(jù)權(quán)利要求13至18中任一項(xiàng)所述的設(shè)備,所述設(shè)備被編程或被配置為響應(yīng)于搜索查詢(xún),使用與數(shù)據(jù)存儲(chǔ)中視頻文件的相似度相關(guān)的信息來(lái)提供結(jié)果。
20.根據(jù)權(quán)利要求13至19中任一項(xiàng)所述的設(shè)備,所述設(shè)備被編程或被配置為包括以下步驟 安排視頻關(guān)系圖內(nèi)所選集合中包括的視頻文件,以指示所選集合中視頻文件的重疊內(nèi)容;并且使用視頻關(guān)系圖來(lái)確定所選集合與指定視頻文件之間的內(nèi)容相似度。
21.根據(jù)權(quán)利要求20所述的設(shè)備,所述設(shè)備被編程或被配置為包括以下步驟 在安排視頻關(guān)系圖內(nèi)所選集合中包括的視頻文件之后,將指定視頻文件的內(nèi)容和所選集合中的非重疊內(nèi)容進(jìn)行比較。
22.根據(jù)權(quán)利要求20或21所述的設(shè)備,所述設(shè)備被編程或被配置為包括步驟更新視頻關(guān)系圖,以包括來(lái)自指定視頻文件的信息。
23.根據(jù)權(quán)利要求13所述的設(shè)備,所述設(shè)備被編程或被配置為使用下述方程來(lái)計(jì)算標(biāo)簽同現(xiàn)的概率
24.根據(jù)權(quán)利要求13所述的設(shè)備,所述設(shè)備被編程或被配置為使用Jaccard系數(shù)來(lái)計(jì)算標(biāo)簽同現(xiàn)的概率
25.一種存儲(chǔ)機(jī)器可執(zhí)行程序的數(shù)據(jù)存儲(chǔ)介質(zhì),所述機(jī)器可執(zhí)行程序用于執(zhí)行管理視頻內(nèi)容的方法,包含以下步驟 獲取具有描述指定視頻文件的內(nèi)容的至少一個(gè)關(guān)聯(lián)標(biāo)簽的指定視頻文件; 分析所述至少一個(gè)關(guān)聯(lián)標(biāo)簽和與數(shù)據(jù)存儲(chǔ)中的多個(gè)視頻文件相關(guān)聯(lián)的標(biāo)簽之間的語(yǔ)義關(guān)系; 使用分析的結(jié)果從多個(gè)視頻文件中選擇視頻文件的集合; 將指定的視頻文件的內(nèi)容與所選集合的內(nèi)容進(jìn)行比較,以確定內(nèi)容的相似度;以及 使用確定的結(jié)果來(lái)更新與數(shù)據(jù)存儲(chǔ)中視頻文件的相似度相關(guān)的信息。
全文摘要
通過(guò)分析指定視頻文件的至少一個(gè)關(guān)聯(lián)描述標(biāo)簽和與數(shù)據(jù)存儲(chǔ)中的視頻文件相關(guān)聯(lián)的標(biāo)簽之間的語(yǔ)義關(guān)系,管理數(shù)據(jù)存儲(chǔ)中存儲(chǔ)的視頻文件。使用分析的結(jié)果在所述數(shù)據(jù)存儲(chǔ)中存儲(chǔ)的視頻文件中選擇視頻文件的集合。將指定視頻文件的內(nèi)容與所選集合的內(nèi)容進(jìn)行比較以確定內(nèi)容的相似度。響應(yīng)于搜索查詢(xún),可使用確定的結(jié)果來(lái)更新與數(shù)據(jù)存儲(chǔ)中視頻文件的相似度相關(guān)的信息,例如,在提供結(jié)果時(shí)使用所述信息。
文檔編號(hào)G06F17/30GK102959542SQ201180032219
公開(kāi)日2013年3月6日 申請(qǐng)日期2011年6月24日 優(yōu)先權(quán)日2010年6月30日
發(fā)明者Y·任, F·常, T·伍德, R·恩索爾 申請(qǐng)人:阿爾卡特朗訊公司