視頻內(nèi)容評級方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種視頻內(nèi)容評級方法,包括:獲取多個客戶端針對待評級視頻的多個播放行為數(shù)據(jù);對多個播放行為數(shù)據(jù)進行統(tǒng)計以生成待評級視頻的特征數(shù)據(jù);以及根據(jù)特征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模型確定待評級視頻對應(yīng)的視頻內(nèi)容等級。本發(fā)明實施例的方法,通過收集用戶的播放行為數(shù)據(jù)進行分析處理以實現(xiàn)對視頻內(nèi)容的自動化評級,降低了評級分析成本,降低了運算量、增強了抗干擾能力,且在評級的過程中,不需要復(fù)雜的識別運算,提高了運算效率。本發(fā)明還公開了一種視頻內(nèi)容評級裝置。
【專利說明】視頻內(nèi)容評級方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,尤其設(shè)及一種視頻內(nèi)容評級方法及裝置。
【背景技術(shù)】
[0002] 目前,大量的視頻內(nèi)容存在于網(wǎng)絡(luò)上,其中有相當一部分不具有正能量(如設(shè)及 暴力、情色等)內(nèi)容,該對于未成年人來說存在極大的危害性。因此,電影市場通過內(nèi)容評 級W監(jiān)督市場行為和幫助家長正確指導未成年人觀看電影,使得內(nèi)容評級具有重要社會意 義和商業(yè)價值。
[0003] 傳統(tǒng)的視頻內(nèi)容評級一般是通過電影審查管理機構(gòu)對將要進入市場的視頻或電 影進行審查W避免色情暴力等內(nèi)容的公開展現(xiàn)。但是,傳統(tǒng)的視頻內(nèi)容評級方法已經(jīng)不能 夠滿足互聯(lián)網(wǎng)市場的視頻評級的需求。當前的互聯(lián)網(wǎng)內(nèi)容還沒有專業(yè)的審查機構(gòu)負責對內(nèi) 容的審查,用戶可W自由上傳和轉(zhuǎn)發(fā),海量的視頻數(shù)據(jù)使得依賴人工的方法力所不及。
[0004] 目前,針對互聯(lián)網(wǎng)上視頻內(nèi)容的評級方法主要有W下幾種方法:
[0005] (1)人工鑒定方法,即通過人工審查確定視頻內(nèi)容的等級;
[0006] (2)用戶反饋與標簽方法,即通過用戶主動反饋的方式評定視頻內(nèi)容的等級,例 如,網(wǎng)站或視頻播放器通過為用戶提供反饋和舉報的接口、或者允許用戶W標注標簽等形 式,得到用戶對視頻內(nèi)容的反饋,進而篩選暴力色情視頻;
[0007] (3)文本內(nèi)容分析方法,即對文件名和視頻內(nèi)容文字開展的自然語言處理,通過機 器學習的方法鑒定內(nèi)容;
[000引 (4)依賴智能圖像識別技術(shù)的新方法,即通過圖像處理與模式識別方法,直接對視 頻內(nèi)容進行自動化的識別。
[0009] 目前存在的問題是;(1)通過人工對視頻內(nèi)容進行鑒定,會導致人力成本過高; (2)依賴用戶的主動反饋,若用戶的主觀意愿不強烈,可能會導致隨機性很大;(3)情色暴 力視頻內(nèi)容往往會通過串改名稱進入互聯(lián)網(wǎng),其內(nèi)容簡單甚至完全不含文本,使得文本內(nèi) 容分析方法適用性受到極大局限;(4)通過圖像處理與模式識別方法對視頻內(nèi)容進行自動 化的識別,會導致成本高、運算量大、可靠性差等問題。
【發(fā)明內(nèi)容】
[0010] 本發(fā)明的目的旨在至少在一定程度上解決上述的技術(shù)問題之一。
[0011] 為此,本發(fā)明的第一個目的在于提出一種視頻內(nèi)容評級方法。該方法通過收集用 戶的播放行為數(shù)據(jù)進行分析處理W實現(xiàn)對視頻內(nèi)容的自動化評級,降低了評級分析成本, 降低了運算量、增強了抗干擾能力,且在評級的過程中,不需要復(fù)雜的識別運算,提高了運 算效率。
[0012] 本發(fā)明的第二目的在于提出一種視頻內(nèi)容評級裝置。
[0013] 為了實現(xiàn)上述目的,本發(fā)明第一方面實施例的視頻內(nèi)容評級方法,包括:獲取多個 客戶端針對待評級視頻的多個播放行為數(shù)據(jù);對所述多個播放行為數(shù)據(jù)進行統(tǒng)計W生成所 述待評級視頻的特征數(shù)據(jù);w及根據(jù)所述特征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模型確定所述待 評級視頻對應(yīng)的視頻內(nèi)容等級。
[0014] 本發(fā)明實施例的視頻內(nèi)容評級方法,可獲取多個客戶端針對待評級視頻的多個播 放行為數(shù)據(jù),并對多個播放行為數(shù)據(jù)進行統(tǒng)計W生成待評級視頻的特征數(shù)據(jù),W及根據(jù)特 征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模型確定待評級視頻對應(yīng)的視頻內(nèi)容等級,通過收集用戶的 播放行為數(shù)據(jù)進行分析處理W實現(xiàn)對視頻內(nèi)容的自動化評級,降低了評級分析成本,降低 了運算量、增強了抗干擾能力,且在評級的過程中,不需要復(fù)雜的識別運算,提高了運算效 率。
[0015] 為了實現(xiàn)上述目的,本發(fā)明第二方面實施例的視頻內(nèi)容評級裝置,包括:第一獲取 模塊,用于獲取多個客戶端針對待評級視頻的多個播放行為數(shù)據(jù);生成模塊,用于對所述多 個播放行為數(shù)據(jù)進行統(tǒng)計W生成所述待評級視頻的特征數(shù)據(jù);W及確定模塊,用于根據(jù)所 述特征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模型確定所述待評級視頻對應(yīng)的視頻內(nèi)容等級。
[0016] 本發(fā)明實施例的視頻內(nèi)容評級裝置,可通過第一獲取模塊獲取多個客戶端針對待 評級視頻的多個播放行為數(shù)據(jù),生成模塊對多個播放行為數(shù)據(jù)進行統(tǒng)計W生成待評級視頻 的特征數(shù)據(jù),確定模塊根據(jù)特征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模型確定待評級視頻對應(yīng)的視 頻內(nèi)容等級,通過收集用戶的播放行為數(shù)據(jù)進行分析處理W實現(xiàn)對視頻內(nèi)容的自動化評 級,降低了評級分析成本,降低了運算量、增強了抗干擾能力,且在評級的過程中,不需要復(fù) 雜的識別運算,提局了運算效率。
[0017] 本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實踐了解到。
【專利附圖】
【附圖說明】
[001引本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變 得明顯和容易理解,其中,
[0019] 圖1是根據(jù)本發(fā)明一個實施例的視頻內(nèi)容評級方法的流程圖;
[0020] 圖2是根據(jù)本發(fā)明一個實施例的建立預(yù)設(shè)的視頻內(nèi)容評級模型的流程圖;
[0021] 圖3是根據(jù)本發(fā)明另一個實施例的視頻內(nèi)容評級方法的流程圖;
[0022] 圖4是根據(jù)本發(fā)明一個實施例的視頻內(nèi)容評級裝置的結(jié)構(gòu)示意圖;
[0023] 圖5是根據(jù)本發(fā)明另一個實施例的視頻內(nèi)容評級裝置的結(jié)構(gòu)示意圖;
[0024] 圖6是根據(jù)本發(fā)明又一個實施例的視頻內(nèi)容評級裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0025] 下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
[0026] 下面參考附圖描述根據(jù)本發(fā)明實施例的視頻內(nèi)容評級方法及裝置。
[0027] 本發(fā)明提出了一種視頻內(nèi)容評級方法,包括;獲取多個客戶端針對待評級視頻的 多個播放行為數(shù)據(jù);對多個播放行為數(shù)據(jù)進行統(tǒng)計W生成待評級視頻的特征數(shù)據(jù);W及根 據(jù)特征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模型確定待評級視頻對應(yīng)的視頻內(nèi)容等級。
[002引圖1是根據(jù)本發(fā)明一個實施例的視頻內(nèi)容評級方法的流程圖。如圖1所示,該視 頻內(nèi)容評級方法可W包括:
[0029] S101,獲取多個客戶端針對待評級視頻的多個播放行為數(shù)據(jù)。
[0030] 例如,可通過日志上傳的方式在不同載體收集客戶端針對待評級視頻的播放行為 數(shù)據(jù),即用戶針對待評級視頻的播放行為數(shù)據(jù)。應(yīng)當理解,在本發(fā)明的實施例中,還可通過 實時數(shù)據(jù)回傳和/或網(wǎng)頁會話(Session)等方式收集播放行為數(shù)據(jù)。其中,在本發(fā)明的施例 中,播放行為的展現(xiàn)方式可包括但不限于網(wǎng)頁在線播放、媒體播放器播放和Flash展示等。 播放行為的載體可包括但不限于PC (Personal Computer,個人計算機)機、移動終端等,移 動終端可W是手機、平板電腦、個人數(shù)字助理等具有各種操作系統(tǒng)的硬件設(shè)備。播放行為數(shù) 據(jù)可包括但不限于播放起止時間、播放快進次數(shù)和拖動播放次數(shù)等。
[0031] 舉例而言,假設(shè)用戶通過網(wǎng)頁找到視頻內(nèi)容A,選擇并播放該視頻內(nèi)容A,其中用 戶在觀看視頻內(nèi)容A時有跳躍播放操作,在用戶觀看視頻內(nèi)容A的整個過程中,客戶端(如 播放器客戶端和/或網(wǎng)頁客戶端等)可記錄視頻內(nèi)容A的視頻編號id、視頻長度Ti、播放 開始時間t,、結(jié)束時間t。、播放快進次數(shù)S。、拖動播放次數(shù)m。、除掉暫停的總播放時長Ti等 數(shù)據(jù),可將單個播放行為記為W,其中w= {id,Ti,t,,twSt,m。,...}。之后,客戶端可將播放 行為數(shù)據(jù)壓縮打包,通過HTTP協(xié)議上傳到服務(wù)器,W使服務(wù)器獲取到客戶端針對視頻內(nèi)容 A的播放行為數(shù)據(jù)。其中,上傳的方式可包括但不限于實時上傳、壓縮打包上傳、與其他數(shù)據(jù) 混合上傳等。
[0032] S102,對多個播放行為數(shù)據(jù)進行統(tǒng)計W生成待評級視頻的特征數(shù)據(jù)。
[0033] 具體地,可對多個播放行為數(shù)據(jù)進行整理,得到多個客戶端上傳的播放行為數(shù)據(jù) 集合W,(W = (Wi,W,,. . . W。. . . },Wi為第i個客戶端上傳的播放行為數(shù)據(jù)),并根據(jù)播放行 為數(shù)據(jù)集合W對播放起止時間、播放快進次數(shù)、拖動播放次數(shù)、播放時長等參數(shù)分別進行統(tǒng) 計,得到待評級視頻的播放開始時間的概率分布r\t、播放快進次數(shù)的概率分布Tf。、平均 開始時間t,、平均播放時長Ti等數(shù)據(jù),并將上述數(shù)據(jù)作為待評級視頻的特征數(shù)據(jù)。
[0034] S103,根據(jù)特征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模型確定待評級視頻對應(yīng)的視頻內(nèi)容 等級。
[0035] 具體而言,可將特征數(shù)據(jù)代入預(yù)設(shè)的視頻內(nèi)容評級模型進行分類,得到待評級視 頻對應(yīng)的視頻內(nèi)容等級。
[0036] 在本發(fā)明的一個實施例中,如圖2所示,預(yù)設(shè)的視頻內(nèi)容評級模型可通過W下步 驟建立:
[0037] S201,獲取多個樣本待評級視頻,并獲取多個樣本客戶端針對每個樣本待評級視 頻的多個播放行為數(shù)據(jù)。
[003引 S202,對多個播放行為數(shù)據(jù)進行統(tǒng)計W生成每個樣本待評級視頻的特征數(shù)據(jù)。
[0039] S203,對每個樣本待評級視頻的特征數(shù)據(jù)進行分析,得到特征數(shù)據(jù)與視頻內(nèi)容等 級之間的相關(guān)關(guān)系。
[0040] 具體地,可通過建立統(tǒng)計數(shù)據(jù)圖形、或表格展示的方式,可直觀獲取特征數(shù)據(jù)與視 頻內(nèi)容等級之間的相關(guān)關(guān)系。舉例而言,W特征數(shù)據(jù)中的播放開始時間為例,可根據(jù)每個 樣本待評級的特征數(shù)據(jù)中的播放開始時間建立一個統(tǒng)計數(shù)據(jù)圖形,該數(shù)據(jù)圖形中具有多個 樣本客戶端針對每個樣本待評級視頻的多個播放開始時間數(shù)據(jù),之后可根據(jù)圖形中的數(shù)據(jù) 分布與其對應(yīng)的視頻內(nèi)容類型得到播放開始時間與視頻內(nèi)容等級之間的相關(guān)關(guān)系。例如, 播放開始時間集中在凌晨3點至4點播放的視頻,具有情色暴力情節(jié)的概率比較高;又如, 平均開始播放時間為凌晨左右且平均快進次數(shù)在=次左右且播放時長不超過30分鐘的視 頻,具有情色畫面的概率非常高。
[0041] 需要說明的是,在本發(fā)明的實施例中,還可通過聚類方法,如K均值方法、層次方 法等,對每個樣本待評級視頻的特征數(shù)據(jù)進行分析W得到不同的分類,即可自動將具有相 同或相近的特征數(shù)據(jù)的視頻分成一類。還可通過統(tǒng)計工具SPSS對特征數(shù)據(jù)進行自動化分 析,得出統(tǒng)計規(guī)律,通過統(tǒng)計規(guī)律得到特征數(shù)據(jù)與視頻內(nèi)容等級之間的相關(guān)關(guān)系。
[0042] S204,根據(jù)特征數(shù)據(jù)與視頻內(nèi)容等級之間的相關(guān)關(guān)系建立預(yù)設(shè)的視頻內(nèi)容評級模 型。
[0043] 舉例而言,假設(shè)W通過支持向量機方法來建立預(yù)設(shè)的視頻內(nèi)容評級模型,首先,可 獲取10000個具有明顯特征的樣本待評級視頻的播放行為數(shù)據(jù),對每個樣本待評級視頻, 有統(tǒng)計的平均播放開始時間[、平均播放時長吊、平均拖動播放次數(shù);^^:等,根據(jù)視頻內(nèi)容, 標記情色程度Ps、暴力程度Pv。之后,通過SVM(Suppcxrt Vector Machine,支持向量機)訓 練器,訓練該10000個數(shù)據(jù)皆不,心,...I /,,.,/0,得到預(yù)設(shè)的視頻內(nèi)容評級模型,即有效特征 向量數(shù)據(jù)。
[0044] 由此,可將特征數(shù)據(jù)代入預(yù)設(shè)的視頻內(nèi)容評級模型進行分類,可根據(jù)預(yù)設(shè)的視頻 內(nèi)容評級模型中的特征數(shù)據(jù)與視頻內(nèi)容等級之間的相關(guān)關(guān)系,得到待評級視頻對應(yīng)的視頻 內(nèi)容等級。例如,假設(shè)待評級視頻的特征數(shù)據(jù)為平均播放開始時間^、平均播放時長、平 均拖動播放次數(shù)?等,即W =化,,...),可根據(jù)W =化,7;,心...)通過支持向量機(SVM)方 法對待評級視頻進行分類,并得到待評級視頻對應(yīng)的視頻內(nèi)容等級。
[0045] 綜上所述,本發(fā)明提出的視頻內(nèi)容評級方法針對視頻內(nèi)容播放行為,如播放時間 點、播放或觀看方式等信息,推測視頻內(nèi)容等級。該種方法完全自動化、運算少、抗干擾能力 強。相比較于相關(guān)技術(shù)中熱口的圖像識別、文字識別方法,該方法不依賴視頻內(nèi)容本身,不 依賴文字內(nèi)容,而是從用戶行為角度進行分析,具備強的反作弊抗干擾能力,且不需要復(fù)雜 的識別算法,運算效率高。
[0046] 本發(fā)明實施例的視頻內(nèi)容評級方法,可獲取多個客戶端針對待評級視頻的多個播 放行為數(shù)據(jù),并對多個播放行為數(shù)據(jù)進行統(tǒng)計W生成待評級視頻的特征數(shù)據(jù),W及根據(jù)特 征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模型確定待評級視頻對應(yīng)的視頻內(nèi)容等級,通過收集用戶的 播放行為數(shù)據(jù)進行分析處理W實現(xiàn)對視頻內(nèi)容的自動化評級,降低了評級分析成本,降低 了運算量、增強了抗干擾能力,且在評級的過程中,不需要復(fù)雜的識別運算,提高了運算效 率。
[0047] 圖3是根據(jù)本發(fā)明另一個實施例的視頻內(nèi)容評級方法的流程圖。
[0048] 為了提高評級結(jié)果的準確度,在本發(fā)明的實施例中,可根據(jù)客戶端針對待評級視 頻的視頻內(nèi)容等級評估結(jié)果的反饋信息改進預(yù)設(shè)的視頻內(nèi)容評級模型。具體地,如圖3所 示,該視頻內(nèi)容評級方法可W包括:
[0049] S301,獲取多個客戶端針對待評級視頻的多個播放行為數(shù)據(jù)。
[0050] 其中,在本發(fā)明的施例中,每個播放行為數(shù)據(jù)可包括但不限于播放起止時間、播放 快進次數(shù)和拖動播放次數(shù)等。
[0051] S302,對多個播放行為數(shù)據(jù)進行統(tǒng)計W生成待評級視頻的特征數(shù)據(jù)。
[0052] S303,根據(jù)特征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模型確定待評級視頻對應(yīng)的視頻內(nèi)容 等級。
[0053] S304,獲取多個客戶端針對待評級視頻的視頻內(nèi)容等級評估結(jié)果的反饋信息。
[0化4] 具體地,在根據(jù)特征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模型確定待評級視頻對應(yīng)的視頻 內(nèi)容等級之后,客戶端可對該待評級視頻的視頻內(nèi)容等級的評估結(jié)果進行反饋,服務(wù)器可 獲取客戶端的反饋信息。例如,在本步驟中,可為客戶端提供反饋和舉報的接口,當用戶發(fā) 現(xiàn)待評級視頻的視頻內(nèi)容等級的評估結(jié)果不正確,可通過該反饋和舉報的接口進行反饋。 [0化5] S305,根據(jù)反饋信息對預(yù)設(shè)的視頻內(nèi)容評級模型進行更新。
[0056] 其中,在本發(fā)明的實施例中,更新方法可包括但不限于W下兩種;(1)增加新的標 記數(shù)據(jù),重新計算模型與參數(shù),并更新到線上服務(wù);(2)在線更新,利用不斷更新的數(shù)據(jù)(如 反饋信息中的數(shù)據(jù)等),自動更新模型。
[0化7] 本發(fā)明實施例的視頻內(nèi)容評級方法,可獲取多個客戶端針對待評級視頻的視頻內(nèi) 容等級評估結(jié)果的反饋信息,并根據(jù)反饋信息對預(yù)設(shè)的視頻內(nèi)容評級模型進行更新,改進 了視頻內(nèi)容的評級模型,從而提高了評級結(jié)果的準確度。
[005引為了實現(xiàn)上述實施例,本發(fā)明還提出了一種視頻內(nèi)容評級裝置,包括:第一獲取模 塊,用于獲取多個客戶端針對待評級視頻的多個播放行為數(shù)據(jù);生成模塊,用于對多個播放 行為數(shù)據(jù)進行統(tǒng)計W生成待評級視頻的特征數(shù)據(jù);W及確定模塊,用于根據(jù)特征數(shù)據(jù)和預(yù) 設(shè)的視頻內(nèi)容評級模型確定待評級視頻對應(yīng)的視頻內(nèi)容等級。
[0059] 圖4是根據(jù)本發(fā)明一個實施例的視頻內(nèi)容評級裝置的結(jié)構(gòu)示意圖。如圖4所示, 該視頻內(nèi)容評級裝置可W包括;第一獲取模塊10、生成模塊20和確定模塊30。
[0060] 具體地,第一獲取模塊10可用于獲取多個客戶端針對待評級視頻的多個播放行 為數(shù)據(jù)。例如,第一獲取模塊10可通過日志上傳的方式在不同載體收集客戶端針對待評級 視頻的播放行為數(shù)據(jù),即用戶針對待評級視頻的播放行為數(shù)據(jù)。應(yīng)當理解,在本發(fā)明的實施 例中,還可通過實時數(shù)據(jù)回傳和/或網(wǎng)頁會話(Session)等方式收集播放行為數(shù)據(jù)。其中, 在本發(fā)明的實施例中,播放行為的展現(xiàn)方式可包括但不限于網(wǎng)頁在線播放、媒體播放器播 放和Flash展示等。播放行為的載體可包括但不限于PC機、移動終端等,移動終端可W是 手機、平板電腦、個人數(shù)字助理等具有各種操作系統(tǒng)的硬件設(shè)備。播放行為數(shù)據(jù)可包括但不 限于播放起止時間、播放快進次數(shù)和拖動播放次數(shù)等。
[0061] 舉例而言,假設(shè)用戶通過網(wǎng)頁找到視頻內(nèi)容A,選擇并播放該視頻內(nèi)容A,其中用 戶在觀看視頻內(nèi)容A時有跳躍播放操作,在用戶觀看視頻內(nèi)容A的整個過程中,客戶端(如 播放器客戶端和/或網(wǎng)頁客戶端等)可記錄視頻內(nèi)容A的視頻編號id、視頻長度Ti、播放 開始時間t,、結(jié)束時間t。、播放快進次數(shù)S。、拖動播放次數(shù)m。、除掉暫停的總播放時長Ti等 數(shù)據(jù),可將單個播放行為記為W,其中W = {id, T。t,,t。,S。,m。,. . . }。之后,客戶端可將播放 行為數(shù)據(jù)壓縮打包,通過HTTP協(xié)議上傳到服務(wù)器,W使第一獲取模塊10獲取到客戶端針對 視頻內(nèi)容A的播放行為數(shù)據(jù)。其中,上傳的方式可包括但不限于實時上傳、壓縮打包上傳、 與其他數(shù)據(jù)混合上傳等。
[0062] 生成模塊20可用于對多個播放行為數(shù)據(jù)進行統(tǒng)計W生成待評級視頻的特征數(shù) 據(jù)。更具體地,生成模塊20可對多個播放行為數(shù)據(jù)進行整理,得到多個客戶端上傳的播放 行為數(shù)據(jù)集合W,(W = (wi,W,,. . . W。. . . },Wi為第i個客戶端上傳的播放行為數(shù)據(jù)),并根 據(jù)播放行為數(shù)據(jù)集合W對播放起止時間、播放快進次數(shù)、拖動播放次數(shù)、播放時長等參數(shù)分 別進行統(tǒng)計,得到待評級視頻的播放開始時間的概率分布r\t、播放快進次數(shù)的概率分布 r f。、平均開始時間[、平均播放時長r等數(shù)據(jù),并將上述數(shù)據(jù)作為待評級視頻的特征數(shù)據(jù)。
[0063] 確定模塊30可用于根據(jù)特征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模型確定待評級視頻對 應(yīng)的視頻內(nèi)容等級。具體而言,在本發(fā)明的實施例中,確定模塊30可具體用于將特征數(shù)據(jù) 代入預(yù)設(shè)的視頻內(nèi)容評級模型進行分類,得到待評級視頻對應(yīng)的視頻內(nèi)容等級。
[0064] 進一步的,在本發(fā)明的一個實施例中,如圖5所示,該視頻內(nèi)容評級裝置還可包括 模型建立模塊40。模型建立模塊40可用于建立預(yù)設(shè)的視頻內(nèi)容評級模型。具體而言,在本 發(fā)明的實施例中,如圖5所示,模型建立模塊40可包括獲取單元41、生成單元42、分析單元 43和建立單元44。
[0065] 更具體地,獲取單元41可用于獲取多個樣本待評級視頻,并獲取多個樣本客戶端 針對每個樣本待評級視頻的多個播放行為數(shù)據(jù)。生成單元42可用于對多個播放行為數(shù)據(jù) 進行統(tǒng)計W生成每個樣本待評級視頻的特征數(shù)據(jù)。分析單元43可用于對每個樣本待評級 視頻的特征數(shù)據(jù)進行分析,得到特征數(shù)據(jù)與視頻內(nèi)容等級之間的相關(guān)關(guān)系。建立單元44可 用于根據(jù)特征數(shù)據(jù)與視頻內(nèi)容等級之間的相關(guān)關(guān)系建立預(yù)設(shè)的視頻內(nèi)容評級模型。
[0066] 更具體地,分析單元43可通過建立統(tǒng)計數(shù)據(jù)圖形、或表格展示的方式,可直觀獲 取特征數(shù)據(jù)與視頻內(nèi)容等級之間的相關(guān)關(guān)系。舉例而言,W特征數(shù)據(jù)中的播放開始時間為 例,分析單元43可根據(jù)每個樣本待評級的特征數(shù)據(jù)中的播放開始時間建立一個統(tǒng)計數(shù)據(jù) 圖形,該數(shù)據(jù)圖形中具有多個樣本客戶端針對每個樣本待評級視頻的多個播放開始時間數(shù) 據(jù),之后可根據(jù)圖形中的數(shù)據(jù)分布與其對應(yīng)的視頻內(nèi)容類型得到播放開始時間與視頻內(nèi)容 等級之間的相關(guān)關(guān)系。例如,播放開始時間集中在凌晨3點至4點播放的視頻,具有情色暴 力情節(jié)的概率比較高;又如,平均開始播放時間為凌晨左右且平均快進次數(shù)在=次左右且 播放時長不超過30分鐘的視頻,具有情色畫面的概率非常高。
[0067] 需要說明的是,在本發(fā)明的實施例中,分析單元43還可通過聚類方法,如K均值方 法、層次方法等,對每個樣本待評級視頻的特征數(shù)據(jù)進行分析W得到不同的分類,即可自動 將具有相同或相近的特征數(shù)據(jù)的視頻分成一類。還可通過統(tǒng)計工具SPSS對特征數(shù)據(jù)進行 自動化分析,得出統(tǒng)計規(guī)律,通過統(tǒng)計規(guī)律得到特征數(shù)據(jù)與視頻內(nèi)容等級之間的相關(guān)關(guān)系。
[0068] 舉例而言,假設(shè)W通過支持向量機方法來建立預(yù)設(shè)的視頻內(nèi)容評級模型,首先, 可獲取10000個具有明顯特征的樣本待評級視頻的播放行為數(shù)據(jù),對每個樣本待評級 視頻,有統(tǒng)計的平均播放開始時間[、平均播放時長平均拖動播放次數(shù)心等,根據(jù) 視頻內(nèi)容,標記情色程度P,、暴力程度IV之后,通過SVM訓練器,訓練該10000個數(shù)據(jù) (廠京,而,...I /,,,/;.、),得至順設(shè)的視頻內(nèi)容評級模型,即有效特征向量數(shù)據(jù)。
[0069] 由此,確定模塊30可將特征數(shù)據(jù)代入預(yù)設(shè)的視頻內(nèi)容評級模型進行分類,可根據(jù) 預(yù)設(shè)的視頻內(nèi)容評級模型中的特征數(shù)據(jù)與視頻內(nèi)容等級之間的相關(guān)關(guān)系,得到待評級視頻 對應(yīng)的視頻內(nèi)容等級。例如,假設(shè)待評級視頻的特征數(shù)據(jù)為平均播放開始時間[、平均播放 時長S、平均拖動播放次數(shù)而等,即;;'二護,石心,…),可根據(jù)W=反京,而,…)通過支持向量 機(SVM)方法對待評級視頻進行分類,并得到待評級視頻對應(yīng)的視頻內(nèi)容等級。
[0070] 進一步的,在本發(fā)明的一個實施例中,如圖6所示,該視頻內(nèi)容評級裝置還可W包 括第二獲取模塊50和更新模塊60。
[0071] 具體地,第二獲取模塊50可用于獲取多個客戶端針對待評級視頻的視頻內(nèi)容等 級評估結(jié)果的反饋信息。更具體地,在確定模塊30根據(jù)特征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模 型確定待評級視頻對應(yīng)的視頻內(nèi)容等級之后,客戶端可對該待評級視頻的視頻內(nèi)容等級的 評估結(jié)果進行反饋,第二獲取模塊50可獲取客戶端的反饋信息。例如,可為客戶端提供反 饋和舉報的接口,當用戶發(fā)現(xiàn)待評級視頻的視頻內(nèi)容等級的評估結(jié)果不正確,可通過該反 饋和舉報的接口進行反饋。
[0072] 更新模塊60可用于根據(jù)反饋信息對預(yù)設(shè)的視頻內(nèi)容評級模型進行更新。其中,在 本發(fā)明的實施例中,更新方法可包括但不限于W下兩種;(1)增加新的標記數(shù)據(jù),重新計算 模型與參數(shù),并更新到線上服務(wù);(2)在線更新,利用不斷更新的數(shù)據(jù)(如反饋信息中的數(shù) 據(jù)等),自動更新模型。
[0073] 由此,根據(jù)反饋信息對預(yù)設(shè)的視頻內(nèi)容評級模型進行更新,改進了視頻內(nèi)容的評 級模型,從而提高了評級結(jié)果的準確度。
[0074] 本發(fā)明實施例的視頻內(nèi)容評級裝置,可通過第一獲取模塊獲取多個客戶端針對待 評級視頻的多個播放行為數(shù)據(jù),生成模塊對多個播放行為數(shù)據(jù)進行統(tǒng)計W生成待評級視頻 的特征數(shù)據(jù),確定模塊根據(jù)特征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模型確定待評級視頻對應(yīng)的視 頻內(nèi)容等級,通過收集用戶的播放行為數(shù)據(jù)進行分析處理W實現(xiàn)對視頻內(nèi)容的自動化評 級,降低了評級分析成本,降低了運算量、增強了抗干擾能力,且在評級的過程中,不需要復(fù) 雜的識別運算,提局了運算效率。
[0075] 在本發(fā)明的描述中,需要理解的是,術(shù)語"第一"、"第二"僅用于描述目的,而不能 理解為指示或暗示相對重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有"第 一"、"第二"的特征可W明示或者隱含地包括至少一個該特征。在本發(fā)明的描述中,"多個" 的含義是至少兩個,例如兩個,=個等,除非另有明確具體的限定。
[0076] 流程圖中或在此W其他方式描述的任何過程或方法描述可W被理解為,表示包括 一個或更多個用于實現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部 分,并且本發(fā)明的優(yōu)選實施方式的范圍包括另外的實現(xiàn),其中可W不按所示出或討論的順 序,包括根據(jù)所設(shè)及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,該應(yīng)被本發(fā)明 的實施例所屬【技術(shù)領(lǐng)域】的技術(shù)人員所理解。
[0077] 在流程圖中表示或在此W其他方式描述的邏輯和/或步驟,例如,可W被認為是 用于實現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可W具體實現(xiàn)在任何計算機可讀介質(zhì)中,W 供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計算機的系統(tǒng)、包括處理器的系統(tǒng)或其他可W從指 令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合該些指令執(zhí)行系統(tǒng)、裝置 或設(shè)備而使用。就本說明書而言,"計算機可讀介質(zhì)"可W是任何可W包含、存儲、通信、傳 播或傳輸程序W供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合該些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使 用的裝置。計算機可讀介質(zhì)的更具體的示例(非窮盡性列表)包括w下:具有一個或多個 布線的電連接部(電子裝置),便攜式計算機盤盒(磁裝置),隨機存取存儲器(RAM),只讀 存儲器(ROM),可擦除可編輯只讀存儲器巧PROM或閃速存儲器),光纖裝置,W及便攜式光 盤只讀存儲器(CDR0M)。另外,計算機可讀介質(zhì)甚至可W是可在其上打印所述程序的紙或其 他合適的介質(zhì),因為可W例如通過對紙或其他介質(zhì)進行光學掃描,接著進行編輯、解譯或必 要時W其他合適方式進行處理來W電子方式獲得所述程序,然后將其存儲在計算機存儲器 中。
[007引應(yīng)當理解,本發(fā)明的各部分可W用硬件、軟件、固件或它們的組合來實現(xiàn)。在上述 實施方式中,多個步驟或方法可W用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件 或固件來實現(xiàn)。例如,如果用硬件來實現(xiàn),和在另一實施方式中一樣,可用本領(lǐng)域公知的下 列技術(shù)中的任一項或他們的組合來實現(xiàn);具有用于對數(shù)據(jù)信號實現(xiàn)邏輯功能的邏輯口電路 的離散邏輯電路,具有合適的組合邏輯口電路的專用集成電路,可編程口陣列(PGA),現(xiàn)場 可編程口陣列(FPGA)等。
[0079] 本【技術(shù)領(lǐng)域】的普通技術(shù)人員可W理解實現(xiàn)上述實施例方法攜帶的全部或部分步 驟是可W通過程序來指令相關(guān)的硬件完成,所述的程序可W存儲于一種計算機可讀存儲介 質(zhì)中,該程序在執(zhí)行時,包括方法實施例的步驟之一或其組合。
[0080] 此外,在本發(fā)明各個實施例中的各功能單元可W集成在一個處理模塊中,也可W 是各個單元單獨物理存在,也可W兩個或兩個W上單元集成在一個模塊中。上述集成的模 塊既可W采用硬件的形式實現(xiàn),也可W采用軟件功能模塊的形式實現(xiàn)。所述集成的模塊如 果W軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可W存儲在一個計算機 可讀取存儲介質(zhì)中。
[0081] 上述提到的存儲介質(zhì)可W是只讀存儲器,磁盤或光盤等。
[0082] 在本說明書的描述中,參考術(shù)語"一個實施例"、"一些實施例"、"示例"、"具體示 例"、或"一些示例"等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特 點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不 必須針對的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可W在任 一個或多個實施例或示例中W合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技 術(shù)人員可W將本說明書中描述的不同實施例或示例W及不同實施例或示例的特征進行結(jié) 合和組合。
[0083] 盡管上面已經(jīng)示出和描述了本發(fā)明的實施例,可W理解的是,上述實施例是示例 性的,不能理解為對本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可W對上述 實施例進行變化、修改、替換和變型。
【權(quán)利要求】
1. 一種視頻內(nèi)容評級方法,其特征在于,包括以下步驟: 獲取多個客戶端針對待評級視頻的多個播放行為數(shù)據(jù); 對所述多個播放行為數(shù)據(jù)進行統(tǒng)計以生成所述待評級視頻的特征數(shù)據(jù);以及 根據(jù)所述特征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模型確定所述待評級視頻對應(yīng)的視頻內(nèi)容 等級。
2. 如權(quán)利要求1所述的視頻內(nèi)容評級方法,其特征在于,每個播放行為數(shù)據(jù)包括播放 起止時間、播放快進次數(shù)和拖動播放次數(shù)。
3. 如權(quán)利要求1所述的視頻內(nèi)容評級方法,其特征在于,所述根據(jù)所述特征數(shù)據(jù)和預(yù) 設(shè)的視頻內(nèi)容評級模型確定所述待評級視頻對應(yīng)的視頻內(nèi)容等級具體包括: 將所述特征數(shù)據(jù)代入預(yù)設(shè)的視頻內(nèi)容評級模型進行分類,得到所述待評級視頻對應(yīng)的 視頻內(nèi)容等級。
4. 如權(quán)利要求1或3所述的視頻內(nèi)容評級方法,其特征在于,所述預(yù)設(shè)的視頻內(nèi)容評級 模型通過以下步驟建立: 獲取多個樣本待評級視頻,并獲取多個樣本客戶端針對每個樣本待評級視頻的多個播 放行為數(shù)據(jù); 對所述多個播放行為數(shù)據(jù)進行統(tǒng)計以生成所述每個樣本待評級視頻的特征數(shù)據(jù); 對所述每個樣本待評級視頻的特征數(shù)據(jù)進行分析,得到所述特征數(shù)據(jù)與視頻內(nèi)容等級 之間的相關(guān)關(guān)系;以及 根據(jù)所述特征數(shù)據(jù)與視頻內(nèi)容等級之間的相關(guān)關(guān)系建立預(yù)設(shè)的視頻內(nèi)容評級模型。
5. 如權(quán)利要求1所述的視頻內(nèi)容評級方法,其特征在于,還包括: 獲取多個客戶端針對待評級視頻的視頻內(nèi)容等級評估結(jié)果的反饋信息; 根據(jù)所述反饋信息對所述預(yù)設(shè)的視頻內(nèi)容評級模型進行更新。
6. -種視頻內(nèi)容評級裝置,其特征在于,包括: 第一獲取模塊,用于獲取多個客戶端針對待評級視頻的多個播放行為數(shù)據(jù); 生成模塊,用于對所述多個播放行為數(shù)據(jù)進行統(tǒng)計以生成所述待評級視頻的特征數(shù) 據(jù);以及 確定模塊,用于根據(jù)所述特征數(shù)據(jù)和預(yù)設(shè)的視頻內(nèi)容評級模型確定所述待評級視頻對 應(yīng)的視頻內(nèi)容等級。
7. 如權(quán)利要求6所述的視頻內(nèi)容評級裝置,其特征在于,每個播放行為數(shù)據(jù)包括播放 起止時間、播放快進次數(shù)和拖動播放次數(shù)。
8. 如權(quán)利要求6所述的視頻內(nèi)容評級裝置,其特征在于,所述確定模塊具體用于: 將所述特征數(shù)據(jù)代入預(yù)設(shè)的視頻內(nèi)容評級模型進行分類,得到所述待評級視頻對應(yīng)的 視頻內(nèi)容等級。
9. 如權(quán)利要求6或8所述的視頻內(nèi)容評級裝置,其特征在于,還包括: 模型建立模塊,用于建立所述預(yù)設(shè)的視頻內(nèi)容評級模型; 所述模型建立模塊包括: 獲取單元,用于獲取多個樣本待評級視頻,并獲取多個樣本客戶端針對每個樣本待評 級視頻的多個播放行為數(shù)據(jù); 生成單元,用于對所述多個播放行為數(shù)據(jù)進行統(tǒng)計以生成所述每個樣本待評級視頻的 特征數(shù)據(jù); 分析單元,用于對所述每個樣本待評級視頻的特征數(shù)據(jù)進行分析,得到所述特征數(shù)據(jù) 與視頻內(nèi)容等級之間的相關(guān)關(guān)系;以及 建立單元,用于根據(jù)所述特征數(shù)據(jù)與視頻內(nèi)容等級之間的相關(guān)關(guān)系建立預(yù)設(shè)的視頻內(nèi) 容評級模型。
10.如權(quán)利要求6所述的視頻內(nèi)容評級裝置,其特征在于,還包括: 第二獲取模塊,用于獲取多個客戶端針對待評級視頻的視頻內(nèi)容等級評估結(jié)果的反饋 信息; 更新模塊,用于根據(jù)所述反饋信息對所述預(yù)設(shè)的視頻內(nèi)容評級模型進行更新。
【文檔編號】H04N21/258GK104486649SQ201410797428
【公開日】2015年4月1日 申請日期:2014年12月18日 優(yōu)先權(quán)日:2014年12月18日
【發(fā)明者】歐陽利萍 申請人:北京百度網(wǎng)訊科技有限公司