亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種影視節(jié)目處理方法和系統(tǒng)的制作方法

文檔序號:10492780閱讀:661來源:國知局
一種影視節(jié)目處理方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明實(shí)施例提供了一種影視節(jié)目處理方法和系統(tǒng),其中,所述方法包括:對影視節(jié)目進(jìn)行場景檢測,確定至少一個(gè)場景;對所述至少一個(gè)場景分別進(jìn)行特征提取,得到各個(gè)場景各自對應(yīng)的可視特征和/或音頻特征;根據(jù)所述各個(gè)場景各自對應(yīng)的可視特征和/或音頻特征,分別確定各個(gè)場景的類別;根據(jù)確定的各個(gè)場景的類別,選擇滿足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn)行標(biāo)注。通過本發(fā)明實(shí)施例提高了對影視節(jié)目內(nèi)容的查找效率,節(jié)約了用戶時(shí)間,提升了用戶體驗(yàn),保證了標(biāo)注的準(zhǔn)確性。
【專利說明】
-種影視節(jié)目處理方法和系統(tǒng)
技術(shù)領(lǐng)域
[0001 ]本發(fā)明設(shè)及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體設(shè)及一種影視節(jié)目處理方法和系統(tǒng)。
【背景技術(shù)】
[0002] 如今,隨著互聯(lián)網(wǎng)技術(shù)的應(yīng)用和普及,用戶習(xí)慣利用各種終端設(shè)備從互聯(lián)網(wǎng)獲取 需要的信息。尤其是,很多用戶都喜歡在閑暇時(shí)間,觀看互聯(lián)網(wǎng)影視節(jié)目。通過選擇收看互 聯(lián)網(wǎng)影視節(jié)目已成為各種終端用戶消磨時(shí)間的一種重要方式。
[0003] 然而,目前影視節(jié)目的時(shí)長越來越久,例如,一個(gè)電影通常時(shí)長在兩個(gè)小時(shí)左右, 用戶需要花費(fèi)大量的時(shí)間去完成觀看。如何快速有效便捷選擇收看互聯(lián)網(wǎng)影視節(jié)目內(nèi)容已 成為目前亟待解決的一個(gè)關(guān)鍵問題。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明實(shí)施例提供一種影視節(jié)目處理方法和系統(tǒng),W解決如何快速有效便捷選擇 收看互聯(lián)網(wǎng)影視節(jié)目內(nèi)容的問題。
[0005] 本發(fā)明實(shí)施例提供一種影視節(jié)目處理方法,包括
[0006] 對影視節(jié)目進(jìn)行場景檢測,確定至少一個(gè)場景;
[0007] 對所述至少一個(gè)場景分別進(jìn)行特征提取,得到各個(gè)場景各自對應(yīng)的可視特征和/ 或音頻特征;
[000引根據(jù)所述各個(gè)場景各自對應(yīng)的可視特征和/或音頻特征,分別確定各個(gè)場景的類 別;
[0009] 根據(jù)確定的各個(gè)場景的類別,選擇滿足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn)行標(biāo)注。
[0010] 本發(fā)明實(shí)施例還提供一種影視節(jié)目處理系統(tǒng),包括:
[0011] 檢測模塊,用于對影視節(jié)目進(jìn)行場景檢測,確定至少一個(gè)場景;
[0012] 提取模塊,用于對所述至少一個(gè)場景分別進(jìn)行特征提取,得到各個(gè)場景各自對應(yīng) 的可視特征和/或音頻特征;
[0013] 確定模塊,用于根據(jù)所述各個(gè)場景各自對應(yīng)的可視特征和/或音頻特征,分別確定 各個(gè)場景的類別;
[0014] 標(biāo)注模塊,用于根據(jù)確定的各個(gè)場景的類別,選擇滿足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn)行 標(biāo)注。
[0015] 與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例所述的影視節(jié)目處理方案,可W對影視節(jié)目中的 各個(gè)場景分別進(jìn)行特征提取,根據(jù)提取得到的各個(gè)場景各自對應(yīng)的可視特征和/或音頻特 征確定各個(gè)場景的類別,最后,根據(jù)確定的各個(gè)場景的類別,選擇滿足預(yù)置類別標(biāo)準(zhǔn)的場景 進(jìn)行標(biāo)注。可見,在本發(fā)明實(shí)施例中,可W根據(jù)確定的場景類別對場景進(jìn)行標(biāo)注,進(jìn)而用戶 可W根據(jù)標(biāo)注信息來有選擇的觀看影視節(jié)目內(nèi)容,提高了對影視節(jié)目內(nèi)容的查找效率,節(jié) 約了用戶時(shí)間,提升了用戶體驗(yàn)。特別是,可W采用同時(shí)包括可視特征和音頻特征的融合檢 測的方法來確定各個(gè)場景的類別,提高了對影片節(jié)目中各個(gè)場景的類別判斷的準(zhǔn)確率,保 證了標(biāo)注的準(zhǔn)確性。
【附圖說明】
[0016] 圖1是本發(fā)明實(shí)施例一中一種影視節(jié)目處理方法的步驟流程圖;
[0017] 圖2是本發(fā)明實(shí)施例二中一種影視節(jié)目處理方法的步驟流程圖;
[0018] 圖3是本發(fā)明實(shí)施例=中一種影視節(jié)目處理系統(tǒng)的結(jié)構(gòu)框圖;
[0019] 圖4是本發(fā)明實(shí)施例=中一種優(yōu)選的影視節(jié)目處理系統(tǒng)的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0020] 為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí) 施方式對本發(fā)明作進(jìn)一步詳細(xì)的說明。
[0021 ]實(shí)施例一
[0022] 參照圖1,示出了本發(fā)明實(shí)施例一中一種影視節(jié)目處理方法的步驟流程圖。在本實(shí) 施例中,所述影視節(jié)目處理方法包括:
[0023] 步驟102,對影視節(jié)目進(jìn)行場景檢測,確定至少一個(gè)場景。
[0024] -個(gè)影視節(jié)目通常由多個(gè)鏡頭(視頻鏡頭)組成,然而單個(gè)鏡頭包含的信息內(nèi)容較 少,因此需要把相似的鏡頭組織成場景,換而言之,一個(gè)場景可W是由多個(gè)連續(xù)且語義相關(guān) 的鏡頭組成,組成所述場景的多個(gè)鏡頭表達(dá)相同的內(nèi)容。一個(gè)影視節(jié)目可W由至少一個(gè)場 景組成。
[0025] 在本實(shí)施例中,可W通過任意一種適當(dāng)?shù)姆绞綄τ耙暪?jié)目進(jìn)行場景的檢測,確定 所述影視節(jié)目中的各個(gè)場景。例如,可W采用基于圖的描述方法來實(shí)現(xiàn)對影視節(jié)目場景的 檢測:基于場景轉(zhuǎn)移圖的方法和基于鏡頭相似圖的方法。其中,基于場景轉(zhuǎn)移圖的方法首先 運(yùn)用聚類技術(shù)對鏡頭進(jìn)行聚類,然后在聚類的基礎(chǔ)上生成有向圖,生成的有向圖的每個(gè)頂 點(diǎn)代表一組鏡頭,邊代表兩組鏡頭的過渡?;阽R頭相似圖的方法,通過規(guī)范化消減技術(shù)對 圖進(jìn)行分割得到場景。
[0026] 步驟104,對所述至少一個(gè)場景分別進(jìn)行特征提取,得到各個(gè)場景各自對應(yīng)的可視 特征和/或音頻特征。
[0027] -般地,影視節(jié)目是由視頻數(shù)據(jù)部分和音頻數(shù)據(jù)兩部分組成的,在本實(shí)施例中,在 對場景進(jìn)行特征提取時(shí),可W分別從視頻數(shù)據(jù)中提取得到所述可視特征,和/或,從音頻數(shù) 據(jù)中提取得到所述音頻特征。
[0028] 步驟106,根據(jù)所述各個(gè)場景各自對應(yīng)的可視特征和/或音頻特征,分別確定各個(gè) 場景的類別。
[0029] 在影視節(jié)目中,一般是通過畫面與聲音的緊密結(jié)合來表現(xiàn)緊張、激烈的故事情節(jié)。 在本實(shí)施例中,可W根據(jù)所述可視特征和/或音頻特征來確定各個(gè)場景的不同類別。例如, 若所述可視特征所指示的畫面為高速畫面(如,人或物體快速移動(dòng)畫面),所述音頻特征所 指示的聲音尖銳、強(qiáng)烈、節(jié)奏快(如,汽車追逐時(shí)的輪胎摩擦聲、格斗場面的槍聲、尖叫聲), 則可W確定當(dāng)前場景為第一類場景,而將其他畫面不滿足高速,聲音不滿足尖銳、強(qiáng)烈、節(jié) 奏快特性的場景確定為其他類別的場景,本實(shí)施例對此不作限制。
[0030] 當(dāng)然,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)明了的是,各個(gè)場景對應(yīng)需要滿足的條件(如,第一類 場景滿足畫面高速,聲音尖銳、強(qiáng)烈、節(jié)奏快)可W根據(jù)實(shí)際情況確定。例如,還可W將滿足 畫面緩慢、聲音穩(wěn)定特性的場景確定為第二類場景,那么,在所述可視特征所指示的畫面為 低速畫面,所述音頻特征所指示的聲音持續(xù)穩(wěn)定時(shí),確定當(dāng)前場景為第二類場景,本實(shí)施例 在此不再一一寶述。
[0031] 步驟108,根據(jù)確定的各個(gè)場景的類別,選擇滿足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn)行標(biāo)注。
[0032] 在本實(shí)施例中,根據(jù)上述步驟可W分別確定所述一個(gè)影視節(jié)目中的所有場景的類 另IJ,進(jìn)而可W根據(jù)場景的類別對各個(gè)場景進(jìn)行標(biāo)注。例如,可W選擇滿足同一預(yù)置類別標(biāo)準(zhǔn) 的場景進(jìn)行標(biāo)注。
[0033] W上述第一類場景為例,在影視節(jié)目中,可W但不僅限于將所述第一類場景對應(yīng) 的影視節(jié)目片段視為是該影視節(jié)目中的高潮部分情節(jié),在本實(shí)施例中,在確定各個(gè)場景的 類別之后,可W選擇類別為第一類場景的場景進(jìn)行標(biāo)注,進(jìn)而,可W在用戶請求"極速預(yù)覽 影視節(jié)目"或"極速播放影視節(jié)目"時(shí),根據(jù)場景標(biāo)注,提取得到所有第一類場景,然后進(jìn)行 場景合并,W滿足用戶的"極速預(yù)覽影視節(jié)目"或"極速播放影視節(jié)目"請求,便于用戶快速 瀏覽影視節(jié)目的精彩部分內(nèi)容。
[0034] 綜上所述,本實(shí)施例所述的影視節(jié)目處理方法,可W對影視節(jié)目中的各個(gè)場景分 別進(jìn)行特征提取,根據(jù)提取得到的各個(gè)場景各自對應(yīng)的可視特征和/或音頻特征確定各個(gè) 場景的類別,最后,根據(jù)確定的各個(gè)場景的類別,選擇滿足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn)行標(biāo)注。 可見,在本發(fā)明實(shí)施例中,可W根據(jù)確定的場景類別對場景進(jìn)行標(biāo)注,進(jìn)而用戶可W根據(jù)標(biāo) 注信息來有選擇的觀看影視節(jié)目內(nèi)容,提高了對影視節(jié)目內(nèi)容的查找效率。節(jié)約了用戶時(shí) 間,提升了用戶體驗(yàn)。特別是,可W采用同時(shí)包括可視特征和音頻特征的融合檢測方法來確 定各個(gè)場景的類別,提高了對影片節(jié)目中各個(gè)場景的類別判斷的準(zhǔn)確率,保證了標(biāo)注的準(zhǔn) 確性。
[00對實(shí)施例二
[0036] 參照圖2,示出了本發(fā)明實(shí)施例二中一種影視節(jié)目處理方法的步驟流程圖。在本實(shí) 施例中,所述影視節(jié)目處理方法包括:
[0037] 步驟202,對影視節(jié)目進(jìn)行場景檢測,確定至少一個(gè)場景。
[0038] 如前所述,一個(gè)影視節(jié)目中可W包括多種不同類型的場景,在本實(shí)施例中,首先可 W對影視節(jié)目進(jìn)行場景檢測,確定出各個(gè)場景,然后在進(jìn)一步確定各個(gè)場景的類別。
[0039] 需要說明的是,在本實(shí)施例中,可W將緊張場景、激烈場景和動(dòng)作場景中的任意一 種作為預(yù)置類別標(biāo)準(zhǔn)的場景,換而言之,可W將緊張場景、激烈場景和動(dòng)作場景中的任意一 種劃分為第一類場景。
[0040] 步驟204,對所述至少一個(gè)場景分別進(jìn)行特征提取,得到各個(gè)場景各自對應(yīng)的可視 特征和/或音頻特征。
[0041] 在本實(shí)施例中,可W采用任意一種適當(dāng)?shù)姆绞綄梢曁卣骱?或音頻特征進(jìn)行提 取,
[0042] 優(yōu)選的,所述可視特征包括但不僅限于:所述當(dāng)前場景內(nèi)鏡頭的平均運(yùn)動(dòng)強(qiáng)度和 鏡頭的平均長度;其中,所述鏡頭的平均長度用于指示所述當(dāng)前場景內(nèi)的鏡頭密度。所述音 頻特征包括但不僅限于:所述當(dāng)前場景內(nèi)的音頻的類別和能量賭。進(jìn)一步優(yōu)選的,在對場景 進(jìn)行特征提取時(shí),具體可W提取得到所述當(dāng)前場景內(nèi)鏡頭的平均運(yùn)動(dòng)強(qiáng)度、鏡頭的平均長 度、音頻的類別和能量賭。
[0043] 步驟206,根據(jù)所述各個(gè)場景各自對應(yīng)的可視特征和/或音頻特征,分別確定各個(gè) 場景的類別。
[0044] 在本實(shí)施例中,可W分別對可視特征和音頻特征進(jìn)行判斷,然后,根據(jù)可視特征和 音頻特征兩者的判斷結(jié)果來綜合判斷確定各個(gè)場景的類別。
[0045] 具體地,可W判斷所述當(dāng)前場景的可視特征是否滿足設(shè)定可視特征規(guī)則,W及,判 斷所述當(dāng)前場景的音頻特征是否滿足設(shè)定音頻特征規(guī)則;若當(dāng)前場景的可視特征滿足設(shè)定 可視特征規(guī)則,且,所述當(dāng)前場景的音頻特征滿足設(shè)定音頻特征規(guī)則,則確定所述當(dāng)前場景 的類別為第一類場景。
[0046] 當(dāng)然,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)明了的是,也可W只對可視特征或只對音頻特征進(jìn)行 判斷,相應(yīng)地,根據(jù)可視特征的判斷結(jié)果或音頻特征的判斷結(jié)果來確定當(dāng)前場景的類別。
[0047] 其中,下面分別對可視特征的判斷過程和音頻特征的判斷過程進(jìn)行說明。
[004引1、可視特征的判斷過程
[0049] 在本實(shí)施例中,所述判斷所述當(dāng)前場景的可視特征是否滿足設(shè)定可視特征規(guī)則, 具體可W包括:判斷所述當(dāng)前場景內(nèi)鏡頭的平均運(yùn)動(dòng)強(qiáng)度是否滿足設(shè)定強(qiáng)度闊值,W及,判 斷所述當(dāng)前場景內(nèi)鏡頭的平均長度是否滿足設(shè)定長度闊值。
[0050] 其中,若所述當(dāng)前場景內(nèi)鏡頭的平均運(yùn)動(dòng)強(qiáng)度滿足所述設(shè)定強(qiáng)度闊值,且,所述當(dāng) 前場景內(nèi)鏡頭的平均長度滿足所述設(shè)定長度闊值,則確定所述當(dāng)前場景的可視特征滿足第 一設(shè)定可視特征規(guī)則。
[0051] 1.1、在本實(shí)施例中,一種可行的鏡頭的平均運(yùn)動(dòng)強(qiáng)度的提取判斷方法可W如下:
[0052] -般地,鏡頭中的空間變化和鏡頭的持續(xù)時(shí)間決定了鏡頭的運(yùn)動(dòng)強(qiáng)度。在本實(shí)施 例中,為了實(shí)現(xiàn)對鏡頭的平均運(yùn)動(dòng)強(qiáng)度的度量,可W先抽取鏡頭中的運(yùn)動(dòng)序列,然后在根據(jù) 公式來計(jì)算確定各個(gè)鏡頭的運(yùn)動(dòng)強(qiáng)度,最后,對計(jì)算得到的各個(gè)鏡頭的運(yùn)動(dòng)強(qiáng)度進(jìn)行平均, 得到鏡頭的平均運(yùn)動(dòng)強(qiáng)度。
[0053] 其中,各個(gè)鏡頭的運(yùn)動(dòng)強(qiáng)度的計(jì)算公式可W如下:
[0化4]
[0055] 其中,< (州,H)是運(yùn)動(dòng)序列在第k個(gè)鏡頭中的第i帖,m和n是運(yùn)動(dòng)序列圖像的水平和 垂直分辨率,b和e分別是第k個(gè)鏡頭的起始和結(jié)束帖號,T是第k個(gè)鏡頭的長度,其中,T = e-b。由此可見,在本實(shí)施例中,持續(xù)時(shí)間越短、包含運(yùn)動(dòng)越多的鏡頭運(yùn)動(dòng)強(qiáng)度越大。根據(jù)公式1 可W分別計(jì)算得到各個(gè)鏡頭的運(yùn)動(dòng)強(qiáng)度,進(jìn)而可W確定得到鏡頭的平均運(yùn)動(dòng)強(qiáng)度。
[0056] 需要說明的是,運(yùn)動(dòng)序列的抽取過程可W如下:確定影視節(jié)目對應(yīng)的視頻數(shù)據(jù),將 所述視頻數(shù)據(jù)轉(zhuǎn)換為灰度圖像(例如,可W通過二維的小波分解將所述視頻數(shù)據(jù)轉(zhuǎn)換為一 系列空間簡化了的視頻帖的灰度圖像)。然后,確定灰度圖像中的各個(gè)象素點(diǎn)的灰度在時(shí)間 上的變化,并進(jìn)行小波分析轉(zhuǎn)換過濾,最后可W得到運(yùn)動(dòng)序列的圖像。在本實(shí)施例中,采用 小波分析的方法來抽取運(yùn)行序列,可W得到視頻數(shù)據(jù)中運(yùn)動(dòng)對象的空間變化,生成的運(yùn)動(dòng) 序列的圖像在運(yùn)動(dòng)對象的邊界上包括非零值,有效降低了計(jì)算的復(fù)雜程度。
[0057] 1.2、在本實(shí)施例中,一種可行的鏡頭的平均長度的提取判斷方法可W如下:
[005引如前所述,緊張、激烈的內(nèi)容一般是通過連續(xù)短時(shí)間的鏡頭的切換來加 W表現(xiàn)的, 因此,可W將場景內(nèi)的鏡頭密度也作為衡量一個(gè)場景內(nèi)是否包含緊張、激烈內(nèi)容的標(biāo)準(zhǔn)。其 中,場景內(nèi)的鏡頭密度可W用鏡頭的平均長度來表示:鏡頭的平均長度=場景的長度/場景 中的鏡頭數(shù)。
[0059] 需要說明的是,在本實(shí)施例中,可W將鏡頭的平均運(yùn)動(dòng)強(qiáng)度超過設(shè)定強(qiáng)度闊值 (如,視頻畫面面積的1/6)、且鏡頭平均長度小于設(shè)定長度闊值(如,3秒/個(gè))的場景作為可 能含有緊張、激烈內(nèi)容的候選場景,也即,作為第一類場景的候選場景。
[0060] 2、音頻特征的判斷過程
[0061] 在本實(shí)施例中,所述判斷所述當(dāng)前場景的音頻特征是否滿足設(shè)定音頻特征規(guī)則, 具體可W包括:判斷所述當(dāng)前場景內(nèi)的音頻的類別是否滿足設(shè)定音頻類別,W及,判斷所述 當(dāng)前場景內(nèi)的音頻的能量賭是否滿足設(shè)定能量賭。
[0062] 其中,若所述當(dāng)前場景內(nèi)的音頻的類別滿足設(shè)定音頻類別,且,所述當(dāng)前場景內(nèi)的 音頻的能量賭滿足設(shè)定能量賭,則確定所述當(dāng)前場景的音頻特征滿足設(shè)定音頻特征規(guī)則。
[0063] 2.1、在本實(shí)施例中,一種可行的場景內(nèi)的音頻的類別的提取判斷方法可W如下:
[0064] -般地,緊張、激烈的場面常伴隨一些非語音的特殊聲音(如:爆炸聲、尖叫聲、槍 聲、玻璃的破碎聲等)和特殊的背景音樂。在本實(shí)施例中,可W通過高斯模型法(W由各類樣 本向量的均值向量和協(xié)方差矩陣確定音頻的類別),將場景內(nèi)的音頻簡單的劃分為激烈類 別和非激烈類別。
[0065] 為了實(shí)現(xiàn)對場景內(nèi)的音頻的類別的判斷,可W通過樣本采集的方式進(jìn)行模型的訓(xùn) 練:從大量的影視節(jié)目樣本中選擇得到緊張、激烈的場景,將選擇得到的緊張、激烈的場景 對應(yīng)的音軌作為音頻樣本,通過高斯算法計(jì)算得到樣本向量和樣本協(xié)方差矩陣,通過將場 景內(nèi)的音頻與所述樣本向量和樣本協(xié)方差矩陣的分析比較,可W確定場景內(nèi)的音頻的類 別。
[0066] 2.2、在本實(shí)施例中,一種可行的場景內(nèi)的音頻的能量賭的提取判斷方法可W如 下:
[0067] 許多的激烈事件(如:擊打、槍擊、爆炸等)都伴有一些特殊的聲響,而且運(yùn)類激烈 事件往往在極短的時(shí)間內(nèi)發(fā)生。在本實(shí)施例中,可W將聲音信號能量的突然變化作為緊張、 激烈場面判斷的又一特征,其中,可W通過"能量賭"來指示聲音信號能量的突然變化。
[0068] 具體地,可W將場景中的音頻鏡頭分割成若干片段,然后計(jì)算各個(gè)片段中聲音信 號的能量,最后除W音頻鏡頭的總能量進(jìn)行歸一化。音頻鏡頭的能量賭I可W根據(jù)如下公式 確定:
[0069]
[0070] 其中,J是音頻鏡頭片段的總數(shù),O2是音頻鏡頭中第i個(gè)片段的歸一化的能量值。根 據(jù)能量賭的定義可W看出:音頻鏡頭的能量賭的值可W反應(yīng)聲音信號的能量變化,能量基 本恒定的音頻鏡頭具有較大的能量賭。
[0071] 需要說明的是,在本實(shí)施例中,如果場景內(nèi)的音頻的類別為激烈類別,且,場景中 存在能量賭小于設(shè)定能量賭(如,6)的音頻鏡頭,則可W將當(dāng)前場景作為可能含有緊張、激 烈內(nèi)容的候選場景,也即,作為第一類場景的候選場景。
[0072] 在本實(shí)施例中,可W在當(dāng)前場景同時(shí)滿足如下條件時(shí),將所述當(dāng)前場景作為第一 類場景:鏡頭的平均運(yùn)動(dòng)強(qiáng)度超過設(shè)定強(qiáng)度闊值、鏡頭平均長度小于設(shè)定長度闊值、場景內(nèi) 的音頻的類別為激烈類別、和、場景中存在能量賭小于設(shè)定能量賭的音頻鏡頭。也即,在當(dāng) 前場景同時(shí)滿足兩個(gè)候選場景條件時(shí),將所述當(dāng)前場景確定為第一類場景。
[0073] 步驟208,根據(jù)確定的各個(gè)場景的類別,選擇滿足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn)行標(biāo)注。
[0074] 在本實(shí)施例中,如前所述,第一類場景與所述預(yù)置類別標(biāo)準(zhǔn)的場景是對應(yīng)匹配的, 因此,可W選擇第一類場景進(jìn)行標(biāo)注:根據(jù)確定的各個(gè)場景的類別,選擇場景類別為第一類 場景的場景作為所述滿足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn)行標(biāo)注。
[0075] 步驟210,選擇攜帶有所述標(biāo)注的場景進(jìn)行合成。
[0076] 在本實(shí)施例中,可W將攜帶有標(biāo)注的場景進(jìn)行視頻合成,得到合成視頻,所述合成 視頻中包含了影視節(jié)目中的所有緊張、激烈內(nèi)容,在保證用戶瀏覽影視節(jié)目質(zhì)量的同時(shí)節(jié) 約了用戶瀏覽時(shí)間,提升了用戶體驗(yàn)。
[0077] 綜上所述,本實(shí)施例所述的影視節(jié)目處理方法,可W對影視節(jié)目中的各個(gè)場景分 別進(jìn)行特征提取,根據(jù)提取得到的各個(gè)場景各自對應(yīng)的可視特征和/或音頻特征確定各個(gè) 場景的類別,最后,根據(jù)確定的各個(gè)場景的類別,選擇滿足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn)行標(biāo)注。 可見,在本發(fā)明實(shí)施例中,可W根據(jù)確定的場景類別對場景進(jìn)行標(biāo)注,進(jìn)而用戶可W根據(jù)標(biāo) 注信息來有選擇的觀看影視節(jié)目內(nèi)容,提高了對影視節(jié)目內(nèi)容的查找效率。節(jié)約了用戶時(shí) 間,提升了用戶體驗(yàn)。特別是,可W采用同時(shí)包括可視特征和音頻特征融合檢測的方法來確 定各個(gè)場景的類別,提高了對影片節(jié)目中各個(gè)場景的類別判斷的準(zhǔn)確率,保證了標(biāo)注的準(zhǔn) 確性。
[0078] 進(jìn)一步地,在本實(shí)施例中,將較長時(shí)間的影視節(jié)目縮短為較短時(shí)間的合成視頻進(jìn) 行播放,而合成視頻中的場景均為緊張、激烈內(nèi)容的場景,可見,通過本實(shí)施例所述的方法, 既保證了用戶對影視節(jié)目的觀看質(zhì)量,同時(shí)又縮短了用戶的觀看時(shí)間,節(jié)約了用戶時(shí)間。
[0079] 需要說明的是,對于方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作組 合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明實(shí)施例并不受所描述的動(dòng)作順序的限制,因?yàn)橐?據(jù)本發(fā)明實(shí)施例,某些步驟可W采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該 知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所設(shè)及的動(dòng)作并不一定是本發(fā)明實(shí)施 例所必須的。
[0080] 實(shí)施例S
[0081] 參照圖3,示出了本發(fā)明實(shí)施例=中一種影視節(jié)目處理系統(tǒng)的結(jié)構(gòu)框圖。在本實(shí)施 例中,所述影視節(jié)目處理系統(tǒng)包括:
[0082] 檢測模塊302,用于對影視節(jié)目進(jìn)行場景檢測,確定至少一個(gè)場景。
[0083] 提取模塊304,用于對所述至少一個(gè)場景分別進(jìn)行特征提取,得到各個(gè)場景各自對 應(yīng)的可視特征和/或音頻特征。
[0084] 確定模塊306,用于根據(jù)所述各個(gè)場景各自對應(yīng)的可視特征和/或音頻特征,分別 確定各個(gè)場景的類別。
[0085] 標(biāo)注模塊308,用于根據(jù)確定的各個(gè)場景的類別,選擇滿足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn) 行標(biāo)注。
[0086] 在本實(shí)施例中,參照圖4,示出了本發(fā)明實(shí)施例=中一種優(yōu)選的影視節(jié)目處理系統(tǒng) 的結(jié)構(gòu)框圖。
[0087] 其中,優(yōu)選的,所述確定模塊306具體可W包括:
[0088] 第一判斷子模塊3062,用于判斷所述當(dāng)前場景的可視特征是否滿足設(shè)定可視特征 規(guī)則。
[0089] 在本實(shí)施例中,所述可視特征包括但不僅限于:所述當(dāng)前場景內(nèi)鏡頭的平均運(yùn)動(dòng) 強(qiáng)度和鏡頭的平均長度。其中,所述鏡頭的平均長度用于指示所述當(dāng)前場景內(nèi)的鏡頭密度。 所述第一判斷子模塊3062,具體可W用于判斷所述當(dāng)前場景內(nèi)鏡頭的平均運(yùn)動(dòng)強(qiáng)度是否滿 足設(shè)定強(qiáng)度闊值,W及,判斷所述當(dāng)前場景內(nèi)鏡頭的平均長度是否滿足設(shè)定長度闊值。其 中,若所述當(dāng)前場景內(nèi)鏡頭的平均運(yùn)動(dòng)強(qiáng)度滿足所述設(shè)定強(qiáng)度闊值,且,所述當(dāng)前場景內(nèi)鏡 頭的平均長度滿足所述設(shè)定長度闊值,則確定所述當(dāng)前場景的可視特征滿足第一設(shè)定可視 特征規(guī)則。
[0090] 第二判斷子模塊3064,用于判斷所述當(dāng)前場景的音頻特征是否滿足設(shè)定音頻特征 規(guī)則。
[0091] 在本實(shí)施例中,所述音頻特征包括但不僅限于:所述當(dāng)前場景內(nèi)的音頻的類別和 能量賭。所述第二判斷子模塊3064,具體可W用于判斷所述當(dāng)前場景內(nèi)的音頻的類別是否 滿足設(shè)定音頻類別,W及,判斷所述當(dāng)前場景內(nèi)的音頻的能量賭是否滿足設(shè)定能量賭。其 中,若所述當(dāng)前場景內(nèi)的音頻的類別滿足設(shè)定音頻類別,且,所述當(dāng)前場景內(nèi)的音頻的能量 賭滿足設(shè)定能量賭,則確定所述當(dāng)前場景的音頻特征滿足設(shè)定音頻特征規(guī)則。
[0092] 類別確定子模塊3066,用于在當(dāng)前場景的可視特征滿足設(shè)定可視特征規(guī)則,且,所 述當(dāng)前場景的音頻特征滿足設(shè)定音頻特征規(guī)則時(shí),確定所述當(dāng)前場景的類別為第一類場 景。
[0093] 在本實(shí)施例中,優(yōu)選的,所述標(biāo)注模塊308,具體可W用于根據(jù)確定的各個(gè)場景的 類別,選擇場景類別為第一類場景的場景作為所述滿足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn)行標(biāo)注。其 中,所述預(yù)置類別標(biāo)準(zhǔn)的場景包括:緊張場景、激烈場景和動(dòng)作場景中的至少一種。
[0094] 綜上所述,本實(shí)施例所述的影視節(jié)目處理系統(tǒng),可W對影視節(jié)目中的各個(gè)場景分 別進(jìn)行特征提取,根據(jù)提取得到的各個(gè)場景各自對應(yīng)的可視特征和/或音頻特征確定各個(gè) 場景的類別,最后,根據(jù)確定的各個(gè)場景的類別,選擇滿足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn)行標(biāo)注。 可見,在本發(fā)明實(shí)施例中,可W根據(jù)確定的場景類別對場景進(jìn)行標(biāo)注,進(jìn)而用戶可W根據(jù)標(biāo) 注信息來有選擇的觀看影視節(jié)目內(nèi)容,提高了對影視節(jié)目內(nèi)容的查找效率。節(jié)約了用戶時(shí) 間,提升了用戶體驗(yàn)。特別是,可W采用同時(shí)包括可視特征和音頻特征的融合檢測的方案來 確定各個(gè)場景的類別,提高了對影片節(jié)目中各個(gè)場景的類別判斷的準(zhǔn)確率,保證了標(biāo)注的 準(zhǔn)確性。
[0095] 進(jìn)一步地,在本實(shí)施例中,將較長時(shí)間的影視節(jié)目縮短為較短時(shí)間的合成視頻進(jìn) 行播放,而合成視頻中的場景均為緊張、激烈內(nèi)容的場景,可見,通過本實(shí)施例所述的系統(tǒng), 既保證了用戶對影視節(jié)目的觀看質(zhì)量,同時(shí)又縮短了用戶的觀看時(shí)間,節(jié)約了用戶時(shí)間。
[0096] 對于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所W描述的比較簡單,相關(guān) 之處參見方法實(shí)施例的部分說明即可。
[0097] 本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與 其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。
[0098] 本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明實(shí)施例的實(shí)施例可提供為方法、裝置、或計(jì)算 機(jī)程序產(chǎn)品。因此,本發(fā)明實(shí)施例可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和 硬件方面的實(shí)施例的形式。而且,本發(fā)明實(shí)施例可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可 用程序代碼的計(jì)算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上 實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0099] 本發(fā)明實(shí)施例是參照根據(jù)本發(fā)明實(shí)施例的方法、終端設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序 產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖 中的每一流程和/或方框、W及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻\(yùn)些 計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理終端設(shè) 備的處理器W產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器執(zhí) 行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中 指定的功能的裝置。
[0100] 運(yùn)些計(jì)算機(jī)程序指令也可存儲在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備 W特定方式工作的計(jì)算機(jī)可讀存儲器中,使得存儲在該計(jì)算機(jī)可讀存儲器中的指令產(chǎn)生包 括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方 框或多個(gè)方框中指定的功能。
[0101] 運(yùn)些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備上,使得 在計(jì)算機(jī)或其他可編程終端設(shè)備上執(zhí)行一系列操作步驟W產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在 計(jì)算機(jī)或其他可編程終端設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程 和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0102] 盡管已描述了本發(fā)明實(shí)施例的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基 本創(chuàng)造性概念,則可對運(yùn)些實(shí)施例做出另外的變更和修改。所W,所附權(quán)利要求意欲解釋為 包括優(yōu)選實(shí)施例W及落入本發(fā)明實(shí)施例范圍的所有變更和修改。
[0103] 最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將 一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示運(yùn)些實(shí)體或操作 之間存在任何運(yùn)種實(shí)際的關(guān)系或者順序。而且,術(shù)語"包括"、"包含"或者其任何其他變體意 在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者終端設(shè)備不僅包 括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為運(yùn)種過程、方法、物品 或者終端設(shè)備所固有的要素。在沒有更多限制的情況下,由語句"包括一個(gè)……"限定的要 素,并不排除在包括所述要素的過程、方法、物品或者終端設(shè)備中還存在另外的相同要素。
[0104] W上對本發(fā)明所提供的一種影視節(jié)目處理方法和系統(tǒng)進(jìn)行了詳細(xì)介紹,本文中應(yīng) 用了具體個(gè)例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,W上實(shí)施例的說明只是用于幫助理 解本發(fā)明的方法及其核屯、思想;同時(shí),對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在 【具體實(shí)施方式】及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā) 明的限制。
【主權(quán)項(xiàng)】
1. 一種影視節(jié)目處理方法,其特征在于,包括: 對影視節(jié)目進(jìn)行場景檢測,確定至少一個(gè)場景; 對所述至少一個(gè)場景分別進(jìn)行特征提取,得到各個(gè)場景各自對應(yīng)的可視特征和/或音 頻特征; 根據(jù)所述各個(gè)場景各自對應(yīng)的可視特征和/或音頻特征,分別確定各個(gè)場景的類別; 根據(jù)確定的各個(gè)場景的類別,選擇滿足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn)行標(biāo)注。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述各個(gè)場景各自對應(yīng)的可視特 征和/或音頻特征,分別確定各個(gè)場景的類別,包括: 判斷所述當(dāng)前場景的可視特征是否滿足設(shè)定可視特征規(guī)則,以及,判斷所述當(dāng)前場景 的音頻特征是否滿足設(shè)定音頻特征規(guī)則; 若當(dāng)前場景的可視特征滿足設(shè)定可視特征規(guī)則,且,所述當(dāng)前場景的音頻特征滿足設(shè) 定音頻特征規(guī)則,則確定所述當(dāng)前場景的類別為第一類場景。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述可視特征包括:所述當(dāng)前場景內(nèi)鏡頭 的平均運(yùn)動(dòng)強(qiáng)度和鏡頭的平均長度;其中,所述鏡頭的平均長度用于指示所述當(dāng)前場景內(nèi) 的鏡頭密度。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述判斷所述當(dāng)前場景的可視特征是否滿 足設(shè)定可視特征規(guī)則,包括: 判斷所述當(dāng)前場景內(nèi)鏡頭的平均運(yùn)動(dòng)強(qiáng)度是否滿足設(shè)定強(qiáng)度閾值,以及,判斷所述當(dāng) 前場景內(nèi)鏡頭的平均長度是否滿足設(shè)定長度閾值; 其中,若所述當(dāng)前場景內(nèi)鏡頭的平均運(yùn)動(dòng)強(qiáng)度滿足所述設(shè)定強(qiáng)度閾值,且,所述當(dāng)前場 景內(nèi)鏡頭的平均長度滿足所述設(shè)定長度閾值,則確定所述當(dāng)前場景的可視特征滿足第一設(shè) 定可視特征規(guī)則。5. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述音頻特征包括:所述當(dāng)前場景內(nèi)的音 頻的類別和能量熵。6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述判斷所述當(dāng)前場景的音頻特征是否滿 足設(shè)定音頻特征規(guī)則,包括: 判斷所述當(dāng)前場景內(nèi)的音頻的類別是否滿足設(shè)定音頻類別,以及,判斷所述當(dāng)前場景 內(nèi)的音頻的能量熵是否滿足設(shè)定能量熵; 其中,若所述當(dāng)前場景內(nèi)的音頻的類別滿足設(shè)定音頻類別,且,所述當(dāng)前場景內(nèi)的音頻 的能量熵滿足設(shè)定能量熵,則確定所述當(dāng)前場景的音頻特征滿足設(shè)定音頻特征規(guī)則。7. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)確定的各個(gè)場景的類別,選擇滿 足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn)行標(biāo)注,包括: 根據(jù)確定的各個(gè)場景的類別,選擇場景類別為第一類場景的場景作為所述滿足預(yù)置類 別標(biāo)準(zhǔn)的場景進(jìn)行標(biāo)注。8. 根據(jù)權(quán)利要求1-7任一項(xiàng)所述的方法,其特征在于,所述預(yù)置類別標(biāo)準(zhǔn)的場景包括: 緊張場景、激烈場景和動(dòng)作場景中的至少一種。9. 一種影視節(jié)目處理系統(tǒng),其特征在于,包括: 檢測模塊,用于對影視節(jié)目進(jìn)行場景檢測,確定至少一個(gè)場景; 提取模塊,用于對所述至少一個(gè)場景分別進(jìn)行特征提取,得到各個(gè)場景各自對應(yīng)的可 視特征和/或音頻特征; 確定模塊,用于根據(jù)所述各個(gè)場景各自對應(yīng)的可視特征和/或音頻特征,分別確定各個(gè) 場景的類別; 標(biāo)注模塊,用于根據(jù)確定的各個(gè)場景的類別,選擇滿足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn)行標(biāo)注。10. 根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述確定模塊,包括: 第一判斷子模塊,用于判斷所述當(dāng)前場景的可視特征是否滿足設(shè)定可視特征規(guī)則; 第二判斷子模塊,用于判斷所述當(dāng)前場景的音頻特征是否滿足設(shè)定音頻特征規(guī)則; 類別確定子模塊,用于在當(dāng)前場景的可視特征滿足設(shè)定可視特征規(guī)則,且,所述當(dāng)前場 景的音頻特征滿足設(shè)定音頻特征規(guī)則時(shí),確定所述當(dāng)前場景的類別為第一類場景。11. 根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述可視特征包括:所述當(dāng)前場景內(nèi)鏡 頭的平均運(yùn)動(dòng)強(qiáng)度和鏡頭的平均長度;其中,所述鏡頭的平均長度用于指示所述當(dāng)前場景 內(nèi)的鏡頭密度。12. 根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述第一判斷子模塊,用于判斷所述當(dāng) 前場景內(nèi)鏡頭的平均運(yùn)動(dòng)強(qiáng)度是否滿足設(shè)定強(qiáng)度閾值,以及,判斷所述當(dāng)前場景內(nèi)鏡頭的 平均長度是否滿足設(shè)定長度閾值;其中,若所述當(dāng)前場景內(nèi)鏡頭的平均運(yùn)動(dòng)強(qiáng)度滿足所述 設(shè)定強(qiáng)度閾值,且,所述當(dāng)前場景內(nèi)鏡頭的平均長度滿足所述設(shè)定長度閾值,則確定所述當(dāng) 前場景的可視特征滿足第一設(shè)定可視特征規(guī)則。13. 根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述音頻特征包括:所述當(dāng)前場景內(nèi)的 音頻的類別和能量熵。14. 根據(jù)權(quán)利要求13所述的系統(tǒng),其特征在于,所述第二判斷子模塊,用于判斷所述當(dāng) 前場景內(nèi)的音頻的類別是否滿足設(shè)定音頻類別,以及,判斷所述當(dāng)前場景內(nèi)的音頻的能量 熵是否滿足設(shè)定能量熵;其中,若所述當(dāng)前場景內(nèi)的音頻的類別滿足設(shè)定音頻類別,且,所 述當(dāng)前場景內(nèi)的音頻的能量熵滿足設(shè)定能量熵,則確定所述當(dāng)前場景的音頻特征滿足設(shè)定 音頻特征規(guī)則。15. 根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述標(biāo)注模塊,用于根據(jù)確定的各個(gè)場 景的類別,選擇場景類別為第一類場景的場景作為所述滿足預(yù)置類別標(biāo)準(zhǔn)的場景進(jìn)行標(biāo) 注。16. 根據(jù)權(quán)利要求9-15任一項(xiàng)所述的系統(tǒng),其特征在于,所述預(yù)置類別標(biāo)準(zhǔn)的場景包 括:緊張場景、激烈場景和動(dòng)作場景中的至少一種。
【文檔編號】H04N21/44GK105847964SQ201610184631
【公開日】2016年8月10日
【申請日】2016年3月28日
【發(fā)明人】蔡煒
【申請人】樂視控股(北京)有限公司, 樂視致新電子科技(天津)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1