專利名稱:一種媒體發(fā)布網(wǎng)絡(luò)中的發(fā)布內(nèi)容控制方法
技術(shù)領(lǐng)域:
本發(fā)明屬于數(shù)字版權(quán)保護(hù)技術(shù)領(lǐng)域,特別是涉及一種媒體發(fā)布網(wǎng)絡(luò)中的發(fā) 布內(nèi)容控制方法。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)和多媒體技術(shù)的快速發(fā)展,新的媒體創(chuàng)造、發(fā)布、共享的 社會網(wǎng)絡(luò)平臺成為當(dāng)前的熱點。在這種媒體發(fā)布網(wǎng)絡(luò)中,人人都可以匿名的方 式制造和上傳媒體內(nèi)容作品。另一方面,人人都可以自由下載和觀看作品內(nèi)容。
其中最受關(guān)注的YouTube網(wǎng)站便是這種新興媒體方式的代表。You Tube的風(fēng)行是 對傳統(tǒng)電視媒體主導(dǎo)地位的挑戰(zhàn),也標(biāo)志著網(wǎng)民擁有更多自主權(quán)的全球性社區(qū) 化視頻時代的到來。它己成為面向全世界觀眾的網(wǎng)絡(luò)視頻互動平臺。據(jù)統(tǒng)計, 2007年7月,YouTube世界范圍內(nèi)的流量達(dá)到平均每天620萬人次,其中不到1/4 來自美國。未來,這種媒體創(chuàng)造的社會網(wǎng)絡(luò)平臺極有可能代替?zhèn)鹘y(tǒng)電視媒體的 主導(dǎo)地位。
由于媒體內(nèi)容可以任意自由上傳、自由下載,同時帶來嚴(yán)重的內(nèi)容安全問 題,包括色情、恐怖、隱私以及盜版等等不良內(nèi)容的散布問題。因此,作為網(wǎng) 站經(jīng)營者,對網(wǎng)站上發(fā)布的媒體內(nèi)容產(chǎn)生的社會影響負(fù)有責(zé)任。截至目前為止, 主要采用人工方式對上傳媒體內(nèi)容進(jìn)行審査并采取措施。隨著媒體交流呈數(shù)量 級增長,人工方式顯然難以有效地完成此項復(fù)雜繁重的工作。尤其是大量的影 視作品被通過網(wǎng)絡(luò)被非法拷貝傳播,給合法版權(quán)擁有者帶來具大經(jīng)濟(jì)損失,破壞了數(shù)字知識產(chǎn)權(quán)保護(hù)秩序。
發(fā)明內(nèi)容
本發(fā)明目的在于針對現(xiàn)有技術(shù)的不足,提出一種媒體發(fā)布網(wǎng)絡(luò)中發(fā)布內(nèi)容控制方法,采取自動內(nèi)容審查機(jī)制防治盜版等不良內(nèi)容的散布問題。
本發(fā)明的技術(shù)方案為構(gòu)建用于提供認(rèn)證標(biāo)準(zhǔn)的媒體特征數(shù)據(jù)庫,采集對比媒體內(nèi)容的內(nèi)容識別特征,并結(jié)合內(nèi)容識別特征和相關(guān)身份信息作為該對比媒體內(nèi)容的媒體特征,所有對比媒體內(nèi)容的媒體特征存儲到媒體特征數(shù)據(jù)庫;對用戶提交的待發(fā)布媒體內(nèi)容進(jìn)行認(rèn)證,若認(rèn)證通過則允許待發(fā)布媒體內(nèi)容在媒體發(fā)布網(wǎng)絡(luò)中公開,否則禁止公開,所述對用戶提交的待發(fā)布媒體內(nèi)容進(jìn)行認(rèn)證過程包括以下步驟,
步驟1.1,從用戶提交的待發(fā)布媒體內(nèi)容中提取內(nèi)容識別特征;步驟1.2,從媒體特征數(shù)據(jù)庫內(nèi)的媒體特征中搜索步驟1.1得到的內(nèi)容識別特征;步驟1.3,判斷媒體特征數(shù)據(jù)庫內(nèi)的媒體特征中是否存在一個步驟1.1得到的內(nèi)容識別特征,若結(jié)果為存在,則認(rèn)證不通過;若結(jié)果為不存在,則認(rèn)證通過。
而且,所述相關(guān)身份信息包括媒體內(nèi)容的內(nèi)容身份碼ID、媒體內(nèi)容名字Name和媒體制造者名字Producer,媒體特征的構(gòu)成形式為〈ID, Name, Producer,IF>,其中IF表示識別特征。
而且,當(dāng)媒體內(nèi)容為圖像時,從媒體內(nèi)容中提取內(nèi)容識別特征的具體方式包括以下步驟,
步驟3.1,將圖像分割為M塊,對每一塊進(jìn)行DCT變換,然后選擇每塊的頭N個系數(shù),構(gòu)成MxN個系數(shù)序列;
步驟3.2,以量化因子q量化系數(shù)序列,對系數(shù)序列做L-級離散小波變換;步驟3.3,從系數(shù)序列中選擇頭n個子帶小波系數(shù),對所選子帶小波系數(shù)做密碼哈希變換,得到內(nèi)容識別特征的數(shù)值。
而且,當(dāng)媒體內(nèi)容為音頻時,從媒體內(nèi)容中提取內(nèi)容識別特征的具體方式包括以下步驟,
步驟4.1,將音頻分割為M段信號,對每一段進(jìn)行DCT變換,然后選擇每段的頭N個系數(shù),構(gòu)成MxN個系數(shù)序列;
步驟4.2,以量化因子量化系數(shù)序列,對系數(shù)序列做L-級離散小波變換;步驟4.3,從系數(shù)序列中選擇頭n個子帶小波系數(shù),對所選子帶小波系數(shù)做密碼哈希變換,得到內(nèi)容識別特征的數(shù)值。
而且,當(dāng)媒體內(nèi)容為視頻時,從媒體內(nèi)容中提取內(nèi)容識別特征的具體方式包括以下步驟,
步驟5.1,將視頻關(guān)鍵幀圖像分割為M塊,對每一塊進(jìn)行DCT變換,然后選擇每塊的頭N個系數(shù),構(gòu)成MxN個系數(shù)序列;
步驟5.2,以量化因子量化系數(shù)序列,對系數(shù)序列做L-級離散小波變換;步驟5.3,從系數(shù)序列中選擇頭n個子帶小波系數(shù),對所選子帶小波系數(shù)做密碼哈希變換,得到內(nèi)容識別特征的數(shù)值。
而且,所述對比媒體內(nèi)容為色情、恐怖或隱私內(nèi)容。
或者,所述對比媒體內(nèi)容為具有合法版權(quán)的內(nèi)容。
而且,將步驟1.3判斷認(rèn)證通過的待發(fā)布媒體內(nèi)容作為對比媒體內(nèi)容,將其內(nèi)容識別特征和相關(guān)身份信息作為媒體特征更新到媒體特征數(shù)據(jù)庫。
本發(fā)明提出的自動內(nèi)容審査方式可以通過計算機(jī)技術(shù)高效方便地實現(xiàn),替代了低效率的人工審查手段,是社會視頻網(wǎng)站解決不良內(nèi)容散布問題的有效辦法,在提高效率的同時降低了成本。特別是通過本發(fā)明,可以嚴(yán)格控制上傳的內(nèi)容不能和已有的可鑒別的產(chǎn)商的拷貝相沖突,上傳的內(nèi)容不能和其他用戶已經(jīng)制造的內(nèi)容拷貝相沖突。因此,本發(fā)明既能維護(hù)廠商的商業(yè)利益,也能夠維護(hù)個人創(chuàng)造者的版權(quán)利益,具有在互聯(lián)網(wǎng)絡(luò)全面推廣的前景。
圖l為本發(fā)明的原理示意圖2為本發(fā)明實施例總體過程示意圖3為本發(fā)明實施例的媒體特征數(shù)據(jù)庫初始化流程圖4為本發(fā)明實施例的版權(quán)認(rèn)證流程圖5為本發(fā)明實施例的搜索內(nèi)容識別特征流程圖6為本發(fā)明實施例的內(nèi)容識別特征提取流程圖7為本發(fā)明實施例的系數(shù)選取示意圖。
具體實施例方式
以下結(jié)合附圖詳細(xì)說明本發(fā)明的技術(shù)方案
本發(fā)明提出對用戶提交的待發(fā)布媒體內(nèi)容進(jìn)行認(rèn)證,若認(rèn)證不通過,則禁止待發(fā)布媒體內(nèi)容在媒體發(fā)布網(wǎng)絡(luò)中公開,若認(rèn)證通過則允許待發(fā)布媒體內(nèi)容在媒體發(fā)布網(wǎng)絡(luò)中公開。參見附圖l,本發(fā)明提出自動安全認(rèn)證機(jī)制,也就是說給出標(biāo)準(zhǔn)來進(jìn)行認(rèn)證,發(fā)布用戶生成上傳的媒體內(nèi)容只有符合標(biāo)準(zhǔn),才能在網(wǎng)絡(luò)中發(fā)布,供收看用戶點擊使用。標(biāo)準(zhǔn)可以根據(jù)需要,制定色情、恐怖、暴力、隱私、盜版等內(nèi)容。只要將需要防止擴(kuò)散的色情、恐怖、暴力、隱私等不良內(nèi)容作為對比媒體內(nèi)容,通過與待發(fā)布媒體內(nèi)容進(jìn)行內(nèi)容識別特征的比較,就可以防止同樣的媒體內(nèi)容在網(wǎng)絡(luò)中流傳。本發(fā)明還采用這種安全認(rèn)證機(jī)制解決了目前網(wǎng)絡(luò)環(huán)境中最迫切的版權(quán)保護(hù)問題,只需將具有合法版權(quán)的內(nèi)容作為對比媒體內(nèi)容,就可以排除其它拷貝在網(wǎng)絡(luò)中流傳。
為了方便網(wǎng)站對大量個人用戶要求發(fā)布的媒體內(nèi)容進(jìn)行版權(quán)認(rèn)證,也為了更方便保護(hù)廠商的合法版權(quán),本發(fā)明提出對比媒體內(nèi)容主要來自有合法資格的廠商,例如電影制片商、發(fā)行商,對廠商進(jìn)行身份認(rèn)證后,他們提供的媒體內(nèi)容可直接作為可靠的對比媒體內(nèi)容。其它用戶提供的媒體內(nèi)容通過版權(quán)認(rèn)證后,也可作為對比媒體內(nèi)容,其媒體特征更新到媒體特征數(shù)據(jù)庫,即可不斷擴(kuò)大版權(quán)自動保護(hù)的范圍,方便地保護(hù)個人用戶的獨創(chuàng)成果,同時也防止了重復(fù)發(fā)布,節(jié)約了網(wǎng)絡(luò)資源。具體實施時,可以在社會視頻網(wǎng)站的服務(wù)器上采用現(xiàn)有數(shù)據(jù)庫技術(shù)建立媒體特征數(shù)據(jù)庫,這屬于成熟的計算機(jī)技術(shù)手段,本發(fā)明不予贅述。
在認(rèn)證前,采集對比媒體內(nèi)容的內(nèi)容識別特征(簡稱IF),并結(jié)合內(nèi)容識別特征和相關(guān)身份信息作為該對比媒體內(nèi)容的媒體特征(簡稱MF),所有對比媒體內(nèi)容的媒體特征存儲到媒體特征數(shù)據(jù)庫(簡稱MFD)。這個過程可以被稱為媒體特征數(shù)據(jù)庫初始化。采集對比媒體內(nèi)容的內(nèi)容識別特征,并結(jié)合其相關(guān)身份信息,可以有條理地存儲在媒體特征數(shù)據(jù)庫中,在需要版權(quán)認(rèn)證時供調(diào)用。相關(guān)身份信息一般包括媒體內(nèi)容的內(nèi)容身份碼ID、媒體內(nèi)容名字Name和媒體制造者名字Producer,媒體特征的構(gòu)成形式為〈ID, Name, Producer, IF>, 其中IF表示識別特征。IF—般由N個比特位組成,N=256, 512, 1024,或2048。例如,一個MF為〈10024,"Love the Summar", "Fox", "0012ABCDEF00...">。因而,MFD由數(shù)量眾多的MF信息組成。
為了便于實施,本發(fā)明以社會視頻網(wǎng)站進(jìn)行版權(quán)沖突控制為實施例,提供了總體過程和媒體特征數(shù)據(jù)庫初始化流程。參見附圖2,已認(rèn)證媒體產(chǎn)商所提供
的媒體內(nèi)容都作為對比媒體內(nèi)容,經(jīng)MFD初始化過程,對比媒體內(nèi)容的MF存 入MFD。發(fā)布用戶自行生成媒體內(nèi)容,上傳到社會視頻網(wǎng)站的服務(wù)器,根據(jù) MFD的存儲內(nèi)容進(jìn)行版權(quán)認(rèn)證,若認(rèn)證通過則在社會視頻網(wǎng)站發(fā)布,供瀏覽該 網(wǎng)站的用戶點擊。參見附圖3, MFD初始化過程為己認(rèn)證媒體產(chǎn)商生成媒體內(nèi) 容,然后將這類媒體內(nèi)容作為對比媒體內(nèi)容采集IF、構(gòu)成MF、存儲到MFD。
本發(fā)明還提供了對待發(fā)布媒體內(nèi)容進(jìn)行版權(quán)認(rèn)證的過程,參見附圖4和附 圖5,實施時可以參照實施例流程,采用計算機(jī)方便地實現(xiàn)自動認(rèn)證。從發(fā)布用 戶角度出發(fā),用戶生成媒體內(nèi)容,然后包括以下步驟從用戶提交的待發(fā)布媒 體內(nèi)容中提取內(nèi)容識別特征;從媒體特征數(shù)據(jù)庫內(nèi)的媒體特征中搜索待發(fā)布媒 體內(nèi)容的內(nèi)容識別特征;判斷媒體特征數(shù)據(jù)庫內(nèi)的媒體特征中是否存在一個待 發(fā)布媒體內(nèi)容的內(nèi)容識別特征,若結(jié)果為存在,則若版權(quán)認(rèn)證結(jié)果是待發(fā)布媒 體內(nèi)容與對比媒體內(nèi)容發(fā)生沖突;若結(jié)果為不存在,則若版權(quán)認(rèn)證結(jié)果是待發(fā) 布媒體內(nèi)容沒有與對比媒體內(nèi)容發(fā)生沖突,將待發(fā)布媒體內(nèi)容的內(nèi)容識別特征 和相關(guān)身份信息作為該待發(fā)布媒體內(nèi)容的媒體特征,更新到媒體特征數(shù)據(jù)庫。 一般來說,搜索內(nèi)容識別特征的過程也就是提取媒體特征數(shù)據(jù)庫內(nèi)的媒體特征 逐個比較判斷的過程。內(nèi)容識別特征的具體提取方式?jīng)Q定了比較效率,合適的 提取方式能夠唯一標(biāo)志相應(yīng)的媒體內(nèi)容,避免誤判。從對比媒體內(nèi)容和待認(rèn)證 媒體內(nèi)容中提取IF和構(gòu)成MF的方式應(yīng)當(dāng)是一致的,這樣才能進(jìn)行比較判斷。
因為媒體內(nèi)容的類型多樣,包括圖像、音頻、視頻等多種形式,本發(fā)明提 供了一種圖像的內(nèi)容識別特征的優(yōu)選提取方式供實施參考,其它形式都可以按 類似方式實現(xiàn)提取,區(qū)別僅在于分割的對象不同,音頻是分割M段信號,視頻是抽出視頻關(guān)鍵幀圖像分割為M塊。參見附圖6:將圖像分割為M塊,對每一
塊進(jìn)行DCT變換,然后如附圖7選擇每塊的頭N個系數(shù)(DC系數(shù)、AC1系數(shù)、 AC2系數(shù)…),構(gòu)成MxN個系數(shù)序列A=<a。, a「.., a目.f, 一般選擇N=l,
2,…32。;
以量化因子q量化系數(shù)序列,得A"=DWT(A')= 〈a"。,a'、,…,a",.,; 對系數(shù)序列做L-級離散小波(DWT)變換,得A"=DWT(A')= 〈a"Q,a':…,a"廳^;
從系數(shù)序列中選擇頭n (如n=2)個子帶小波系數(shù)A'"=A"(1: MN/2"" 〈a"o,a'、,…,a"T , (T=MN/2");
對所選系數(shù)做密碼哈希變換,得到內(nèi)容識別特征的數(shù)值IF-Hash(A", b。b,.. .bHl 。 這里,bj是二值比特("1"或"0"); Hash()是密碼哈希函數(shù)值,如采用SHA或 MD5算法;H根據(jù)哈希函數(shù)不同而變, 一般,H=128, 256, 512, 1024,...。
這種內(nèi)容識別特征的提取方式直接采用數(shù)值標(biāo)志,因此處理速度快。具體 實施時也可采用其它提取方式作為等同替代方案,但也應(yīng)在本發(fā)明提供的版權(quán) 沖突控制技術(shù)方案保護(hù)范圍內(nèi)。
權(quán)利要求
1.一種媒體發(fā)布網(wǎng)絡(luò)中的發(fā)布內(nèi)容控制方法,其特征在于構(gòu)建用于提供認(rèn)證標(biāo)準(zhǔn)的媒體特征數(shù)據(jù)庫,采集對比媒體內(nèi)容的內(nèi)容識別特征,并結(jié)合內(nèi)容識別特征和相關(guān)身份信息作為該對比媒體內(nèi)容的媒體特征,所有對比媒體內(nèi)容的媒體特征存儲到媒體特征數(shù)據(jù)庫;對用戶提交的待發(fā)布媒體內(nèi)容進(jìn)行認(rèn)證,若認(rèn)證通過則允許待發(fā)布媒體內(nèi)容在媒體發(fā)布網(wǎng)絡(luò)中公開,否則禁止公開,所述對用戶提交的待發(fā)布媒體內(nèi)容進(jìn)行認(rèn)證過程包括以下步驟,步驟1.1,從用戶提交的待發(fā)布媒體內(nèi)容中提取內(nèi)容識別特征;步驟1.2,從媒體特征數(shù)據(jù)庫內(nèi)的媒體特征中搜索步驟1.1得到的內(nèi)容識別特征;步驟1.3,判斷媒體特征數(shù)據(jù)庫內(nèi)的媒體特征中是否存在一個步驟1.1得到的內(nèi)容識別特征,若結(jié)果為存在,則認(rèn)證不通過;若結(jié)果為不存在,則認(rèn)證通過。
2. 根據(jù)權(quán)利要求l所述的媒體發(fā)布網(wǎng)絡(luò)中的發(fā)布內(nèi)容控制方法,其特征在于 所述相關(guān)身份信息包括媒體內(nèi)容的內(nèi)容身份碼ID、媒體內(nèi)容名字Name和媒體制 造者名字Producer,媒體特征的構(gòu)成形式為〈ID, Name, Producer, IF〉, 其中 IF表示識別特征。
3. 根據(jù)權(quán)利要求l所述的媒體發(fā)布網(wǎng)絡(luò)中的發(fā)布內(nèi)容控制方法,其特征在于 當(dāng)媒體內(nèi)容為圖像時,從媒體內(nèi)容中提取內(nèi)容識別特征的具體方式包括以下步 驟,步驟3. 1,將圖像分割為M塊,對每一塊進(jìn)行DCT變換,然后選擇每塊的頭N個 系數(shù),構(gòu)成MXN個系數(shù)序列;步驟3.2,以量化因子量化系數(shù)序列,對系數(shù)序列做L-級離散小波變換; 步驟3.3,從系數(shù)序列中選擇頭n個子帶小波系數(shù),對所選子帶小波系數(shù)做密碼 哈希變換,得到內(nèi)容識別特征的數(shù)值。
4. 根據(jù)權(quán)利要求l所述的媒體發(fā)布網(wǎng)絡(luò)中的發(fā)布內(nèi)容控制方法,其特征在于 當(dāng)媒體內(nèi)容為音頻時,從媒體內(nèi)容中提取內(nèi)容識別特征的具體方式包括以下步 驟,步驟4. 1,將音頻分割為M段信號,對每一段進(jìn)行DCT變換,然后選擇每段的頭 N個系數(shù),構(gòu)成MXN個系數(shù)序列;步驟4.2,以量化因子量化系數(shù)序列,對系數(shù)序列做L-級離散小波變換; 步驟4.3,從系數(shù)序列中選擇頭n個子帶小波系數(shù),對所選子帶小波系數(shù)做密碼 哈希變換,得到內(nèi)容識別特征的數(shù)值。
5. 根據(jù)權(quán)利要求l所述的媒體發(fā)布網(wǎng)絡(luò)中的發(fā)布內(nèi)容控制方法,其特征在于 當(dāng)媒體內(nèi)容為視頻時,從媒體內(nèi)容中提取內(nèi)容識別特征的具體方式包括以下步 驟,步驟5. 1,將視頻關(guān)鍵幀圖像分割為M塊,對每一塊進(jìn)行DCT變換,然后選擇每 塊的頭N個系數(shù),構(gòu)成MXN個系數(shù)序列;步驟5.2,以量化因子量化系數(shù)序列,對系數(shù)序列做L-級離散小波變換; 步驟5.3,從系數(shù)序列中選擇頭n個子帶小波系數(shù),對所選子帶小波系數(shù)做密碼 哈希變換,得到內(nèi)容識別特征的數(shù)值。
6. 根據(jù)權(quán)利要求1或2或3或4或5所述的媒體發(fā)布網(wǎng)絡(luò)中的發(fā)布內(nèi)容控制方 法,其特征在于所述對比媒體內(nèi)容為色情、恐怖或隱私內(nèi)容。
7. 根據(jù)權(quán)利要求1或2或3或4或5所述的媒體發(fā)布網(wǎng)絡(luò)中的發(fā)布內(nèi)容控制方法,其特征在于所述對比媒體內(nèi)容為具有合法版權(quán)的內(nèi)容。
8.根據(jù)權(quán)利要求7所述的媒體發(fā)布網(wǎng)絡(luò)中的發(fā)布內(nèi)容控制方法,其特征在于 將步驟1.3判斷認(rèn)證通過的待發(fā)布媒體內(nèi)容作為對比媒體內(nèi)容,將其內(nèi)容識別 特征和相關(guān)身份信息作為媒體特征更新到媒體特征數(shù)據(jù)庫。
全文摘要
本發(fā)明涉及一種媒體發(fā)布網(wǎng)絡(luò)中的發(fā)布內(nèi)容控制方法,其特征在于對用戶提交的待發(fā)布媒體內(nèi)容進(jìn)行版權(quán)認(rèn)證,若版權(quán)認(rèn)證結(jié)果是與已認(rèn)證媒體內(nèi)容發(fā)生沖突,則禁止待發(fā)布媒體內(nèi)容在媒體發(fā)布網(wǎng)絡(luò)中公開,若版權(quán)認(rèn)證結(jié)果是沒有與已認(rèn)證媒體內(nèi)容發(fā)生沖突,則允許待發(fā)布媒體內(nèi)容在媒體發(fā)布網(wǎng)絡(luò)中公開。采用本發(fā)明所提供的方案適合在媒體創(chuàng)造的社會網(wǎng)絡(luò)上傳中,進(jìn)行自動內(nèi)容審查和控制,提供了拷貝版權(quán)沖突解決方案,對凈化社會網(wǎng)絡(luò)資源環(huán)境,促進(jìn)和保護(hù)數(shù)字知識產(chǎn)權(quán)發(fā)展具有重要意義,可以取得重大市場應(yīng)用價值。
文檔編號G06F21/00GK101645117SQ20081004870
公開日2010年2月10日 申請日期2008年8月6日 優(yōu)先權(quán)日2008年8月6日
發(fā)明者葉登攀, 廉士國, 王麗娜 申請人:武漢大學(xué)