專利名稱:基于新聞視頻結(jié)構(gòu)特征的口播幀自動(dòng)提取方法與系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明是一種根據(jù)新聞視頻的結(jié)構(gòu),自動(dòng)提取口播幀,實(shí)現(xiàn)基于口播幀的新聞視頻單元自動(dòng)劃分處理的一種方法與系統(tǒng)。
背景技術(shù):
新聞視頻具有鮮明的結(jié)構(gòu)特征,而且各個(gè)地區(qū)的各類新聞節(jié)目的特征具有較強(qiáng)的類似性。準(zhǔn)確定位新聞視頻中新聞單元的起點(diǎn)和結(jié)束點(diǎn),是新聞單元?jiǎng)澐肿詣?dòng)處理的基礎(chǔ)。其中,標(biāo)志新聞單元起點(diǎn)和結(jié)束點(diǎn)最重要的特征就是口播幀(新聞主持人畫(huà)面),因此在新聞視頻中自動(dòng)挑選口播幀是新聞單元自動(dòng)劃分的一個(gè)關(guān)鍵問(wèn)題,是實(shí)現(xiàn)新聞視頻自動(dòng)標(biāo)引、檢索的核心內(nèi)容。
已有的口播幀檢測(cè)方法,大多是在提取口播幀的各類圖像特征,并在此基礎(chǔ)上對(duì)口播幀進(jìn)行識(shí)別的一類方法。如文獻(xiàn)“基于規(guī)則分析的視頻口播幀檢測(cè)”(于俊清,閆東,等。計(jì)算機(jī)工程與應(yīng)用,2004(6)84-86)提出了利用視頻主色調(diào)分布特征的口播幀檢測(cè)方法,該方法當(dāng)口播幀中出現(xiàn)畫(huà)中畫(huà)或頻幕下方出現(xiàn)文字干擾時(shí)易產(chǎn)生誤檢;文獻(xiàn)“Knowledge guided in video database”(Swanberg D,Shu C F,Jian R.InNibblack W ed.IS&T/SPIE.San Jose,CASPIE.199313~14.)用事先構(gòu)造標(biāo)準(zhǔn)模板進(jìn)行匹配的方式進(jìn)行口播幀的檢測(cè),為滿足實(shí)時(shí)性檢測(cè)的需要,標(biāo)準(zhǔn)模板的數(shù)量受到限制,因而難以適應(yīng)不同時(shí)期的新聞節(jié)目(新聞主持人本身或主持人著裝會(huì)發(fā)生改變);文獻(xiàn)“新聞視頻口播幀檢測(cè)方法的研究”(馬宇飛,白雪生,等。軟件學(xué)報(bào),200112(3)377~382)提出一種基于知識(shí)的新聞視頻分析方法,二階段的模板匹配,該方法以半身像輪廓作為通用模板,忽略口播幀背景顏色的作用,并以通用模板匹配出專用模板,取得一定效果。但新聞節(jié)目的內(nèi)容是多樣性的,非口播幀的半身像畫(huà)面也會(huì)經(jīng)常出現(xiàn)在視頻中,特別地,某些新聞節(jié)目中的主持人畫(huà)面為非標(biāo)準(zhǔn)半身像,故以標(biāo)準(zhǔn)半身像作為通用模板是不合適的。綜上所述,現(xiàn)存口播幀識(shí)別算法往往只考慮口播幀的畫(huà)面特征,強(qiáng)調(diào)以模板匹配為基礎(chǔ)進(jìn)行檢測(cè)識(shí)別,計(jì)算開(kāi)銷大復(fù)雜程度高,并且難以適應(yīng)所有新聞節(jié)目,通用性受到很大限制。
盡管不同新聞視頻之間存在差異,但它們的口播幀仍具有以下共同的特點(diǎn)1)口播幀畫(huà)面廣泛均勻分布于整段新聞之中,時(shí)間跨度最長(zhǎng),貫穿于新聞視頻的始末;2)每段口播幀畫(huà)面會(huì)持續(xù)出現(xiàn)一段時(shí)間,其間圖像特征保持不變。
值得注意的是,許多新聞視頻中的場(chǎng)景,如記者采訪畫(huà)面、人物專訪畫(huà)面以及靜止文字畫(huà)面都滿足上述特點(diǎn)2)。而只有口播幀場(chǎng)景滿足特點(diǎn)1)。
本發(fā)明依據(jù)上述新聞視頻的結(jié)構(gòu)特征,提出了一種基于口播幀分布特點(diǎn)的無(wú)模板口播幀檢測(cè)算法,具有實(shí)用性強(qiáng)、應(yīng)用范圍廣、適應(yīng)能力強(qiáng)等特點(diǎn)。實(shí)驗(yàn)結(jié)果證明,該方法基本上能可靠識(shí)別各種新聞視頻中的口播幀畫(huà)面。
發(fā)明內(nèi)容
本發(fā)明的目的是為新聞視頻無(wú)模版條件下口播幀自動(dòng)提取建立了一種具有良好通用性的方法,為新聞視頻單元的自動(dòng)劃分提供了一種方法與系統(tǒng)。
本發(fā)明包括以下幾個(gè)方面的內(nèi)容(a)通過(guò)視頻圖像序列的相似性分析得到視頻各階段的相似圖像集;(b)相似性分析通過(guò)三階段匹配過(guò)程進(jìn)行;(c)從各相似圖像集中抽取一幀圖像幀作為各圖像集的描述幀,稱為關(guān)鍵幀,由此形成關(guān)鍵幀集,該圖像集是以圖像某種特征形式存在的;(d)利用新聞視頻的結(jié)構(gòu)特征的,通過(guò)聚類方法從關(guān)鍵幀集中提取不同時(shí)段、不同形式的口播幀;(e)基于口播幀集進(jìn)行新聞視頻單元的自動(dòng)劃分。
內(nèi)容(a)包括(a1)相似集預(yù)定義模版的選取;(a2)圖像的特征提取。
內(nèi)容(b)包括(b1)均值匹配方法;(b2)直方圖匹配方法;以及(b3)線段灰度匹配方法。
內(nèi)容(c)包括(c1)依據(jù)新聞視頻結(jié)構(gòu)特征確定有意義相似圖像集的條件;(c2)從相似圖像集中選取關(guān)鍵幀。
內(nèi)容(d)包括(d1)新聞視頻結(jié)構(gòu)特征的建立;(d2)聚類分析方法;以及(d3)口播幀提取。
內(nèi)容(e)包括(e1)新聞視頻單元兩種形式的開(kāi)始時(shí)間點(diǎn);(e2)新聞視頻單元結(jié)束時(shí)間點(diǎn)。
圖1是新聞視頻結(jié)構(gòu)2是提取口播幀的聚類分析流程圖具體實(shí)施方式
本發(fā)明的主要特點(diǎn)就是利用新聞視頻的結(jié)構(gòu)特征,在無(wú)預(yù)定義的口播幀模版的前提下,通過(guò)聚類分析方法,自動(dòng)提取口播幀,從而根據(jù)各口播幀相似集,確定含有口播幀序列幀和不含口播幀序列幀的新聞視頻單元的開(kāi)始點(diǎn)與結(jié)束點(diǎn),實(shí)現(xiàn)新聞視頻單元的自動(dòng)劃分。
從語(yǔ)義劃分,一段新聞視頻單元主要由片頭、片尾、口播幀鏡頭和若干新聞鏡頭組成。由新聞視頻結(jié)構(gòu)的先驗(yàn)知識(shí)和口播幀特點(diǎn),可以合理定位新聞片頭和片尾,因此只要根據(jù)口播幀的特點(diǎn)將之與新聞場(chǎng)景分離即可達(dá)到目的。
1.圖像特征提取切除被檢測(cè)幀圖像下緣可能包含文字區(qū)域的一部分,避免文字出現(xiàn)的影響。將剩下部分若干個(gè)(一般情形下為等分型式)圖像子塊,本發(fā)明系統(tǒng)中采取等分九個(gè)圖像子塊的做法。分別統(tǒng)計(jì)各子塊的灰度均值和灰度直方圖,為減少計(jì)算開(kāi)銷,灰度直方圖經(jīng)平滑處理后,直方圖的灰度等級(jí)為64。當(dāng)新聞口播幀出現(xiàn)畫(huà)中畫(huà)時(shí),由于采取圖像分塊的做法,只會(huì)對(duì)少數(shù)圖像子塊的灰度均值和灰度直方圖有影響;沿圖像橫向或縱向方向等間距的采集p條線段上的灰度值,p太大會(huì)導(dǎo)致計(jì)算開(kāi)銷增加,太小則涵蓋面太少,本發(fā)明的系統(tǒng)中,選擇p=9。
2.預(yù)定義模版的選取在分析開(kāi)始時(shí),以視頻的第一幀圖像作為預(yù)模版與后續(xù)的圖像幀進(jìn)行特征匹配,找出相似的圖像集合。待前一相似圖像集合確定后,以前一相似圖像集合中尾幀的后一幀作為新的預(yù)模版,并繼續(xù)上述匹配運(yùn)算,找出新的相似圖像集合。
3.圖像的三階段匹配方法為加快匹配運(yùn)算過(guò)程,根據(jù)匹配方法運(yùn)算量的大小,按由少到多的方式進(jìn)行圖像的匹配比較,具體過(guò)程為(1)按算式ρ1i=1-|averagemi-avergageci|255]]>(i=1,2,…,9),對(duì)當(dāng)前幀圖像九個(gè)圖像子塊與預(yù)定義模版相應(yīng)的圖像子塊均值進(jìn)行匹配,其中averagemi為預(yù)模板第i個(gè)圖像子塊的灰度平均值,averageci為被檢測(cè)幀第i個(gè)圖像子塊的平均值,ρ1i(0≤ρ1i≤1]]>)為第i個(gè)圖像子塊均值匹配系數(shù)。若九個(gè)系數(shù)ρ1i中有多數(shù)(本系統(tǒng)確定為六個(gè))系數(shù)大于閾值C1,則判定均值匹配成功,轉(zhuǎn)入(2)進(jìn)行直方圖匹配。若上述條件不滿足,則可判定當(dāng)前幀與預(yù)模版不匹配,并將當(dāng)前幀作為下一個(gè)相似圖像集的預(yù)模版,按三階段匹配方法尋找新的相似圖像集。
(2)按算式ρ2i=Σn=064(fi(n)-f‾i)(gi(n)-g‾i)Σn=064(fi(n)-f‾i)2Σn=064(gi(n)-g‾i)2]]>(i=1,2,…,9)對(duì)當(dāng)前幀圖像九個(gè)圖像子塊與預(yù)模版所對(duì)應(yīng)的圖像子塊進(jìn)行直方圖匹配,其中fi(n)為預(yù)模板第i個(gè)圖像子塊的灰度直方圖,gi(n)為被檢測(cè)幀第i個(gè)圖像子塊的灰度直方圖, 和 分別為預(yù)模板和被檢測(cè)幀第f個(gè)圖像子塊的灰度直方圖均值,ρ2i(-1≤ρ2i≤1]]>)為第i個(gè)圖像子塊直方圖匹配相似系數(shù)。當(dāng)九個(gè)匹配系數(shù)ρ2i中有六個(gè)系數(shù)大于系數(shù)大于閾值C2,則判定直方圖匹配成功,轉(zhuǎn)入(3)進(jìn)行直線灰度分布的匹配。若上述條件不成立,則判定該當(dāng)前幀與預(yù)模版不匹配,并將此幀作為下一個(gè)相似圖像集的預(yù)模版。
(3)按算式ρ3i=Σn=mN-m(Fi(n)-F‾i)(Gi(n)-G‾i)Σn=mN-m(Fi(n)-F‾i)2Σn=mN-m(Gi(n+k)-G‾i)2]]>(k=-m,…,0,…m)對(duì)當(dāng)前幀圖像的九條直線灰度分布曲線與預(yù)模版的相應(yīng)位置上的九條直線的灰度分布曲線進(jìn)行灰度匹配比較,其中(i=1,2,…,p),k為左右移動(dòng)距離,N為線段上像素點(diǎn)的總數(shù),F(xiàn)i(n)和Gi(n)為預(yù)模板與被檢測(cè)幀第i條線段上的灰度分布曲線, 和 為預(yù)模板與被檢測(cè)幀第i條線段上灰度均值,ρ3i(-1≤ρ3i≤1]]>)為第i條線段灰度分布曲線相似系數(shù)。匹配過(guò)程中,考慮到口播幀序列中,前后幀可能因?yàn)橹鞒秩祟^部的輕微晃動(dòng),導(dǎo)致局部區(qū)域灰度分布的偏移,因此直線灰度分布曲線的匹配方式采取了左右移動(dòng)匹配的方式進(jìn)行,并從中挑選最大的匹配系數(shù)作直線段灰度分布曲線的匹配系數(shù)ρ3i。當(dāng)九條直線灰度分布曲線匹配系數(shù)中有六個(gè)系數(shù)大于閾值C3,則判定當(dāng)前幀與與模版匹配,并將此幀歸入預(yù)模版所在的相似圖像集中,然后取當(dāng)前幀的下一幀,重復(fù)步驟(1)(2)(3),直至找到該相似圖像集的最后一幀圖像。如果上述條件不成立,則判定當(dāng)前幀與預(yù)模版不匹配,將當(dāng)前幀作為下一個(gè)相似圖像集的預(yù)模版,重復(fù)步驟(1)(2)(3),直至找到下一個(gè)新的相似圖像集。
通過(guò)上述匹配方法,可以將整段新聞視頻分為一系列的相似圖像集合。
4.有意義相似圖像集的選取及其所對(duì)應(yīng)的關(guān)鍵幀新聞視頻中,主持人畫(huà)面一般延續(xù)時(shí)間較長(zhǎng),基于這一事實(shí),可對(duì)相似圖像集合進(jìn)行時(shí)間冗余性的判斷,當(dāng)某個(gè)相似圖像集的延續(xù)時(shí)間小于或等于閾值T1,則判定該相似圖像集為非口播幀相似集,并將此相似圖像集去除。當(dāng)相似圖像集的延續(xù)時(shí)間大于T1,則定義該相似圖像集為有意義的相似圖像集。所謂有意義的相似圖像集指的是該相似圖像集在時(shí)間冗余性上符合口播幀相似圖像集的特征,即該相似圖像集是可能的口播幀相似圖像集。從各個(gè)有意義的相似圖像集中任去一幀圖像作為該相似圖像集的關(guān)鍵幀,由此產(chǎn)生了關(guān)鍵幀圖像集,并記錄各相似圖像集首幀及尾幀所對(duì)應(yīng)的時(shí)間戳。
5.利用聚類分析方法從有意義的相似圖像集中選出各個(gè)時(shí)段、同一新聞視頻中不同形式的口播幀根據(jù)新聞視頻的結(jié)構(gòu)性特征,新聞口播幀一般會(huì)在某個(gè)新聞單元播放結(jié)束之后再次出現(xiàn),這表明新聞口播幀不僅在某一時(shí)段具備相似冗余性,且在不同時(shí)段上亦具備相似冗余性;在兩個(gè)不同時(shí)段口播幀相似圖像集之間,一般有一個(gè)較長(zhǎng)的時(shí)間出現(xiàn)不同的新聞鏡頭。因此,口播幀相似集的再次出現(xiàn)一定要經(jīng)歷一個(gè)較長(zhǎng)的時(shí)間;口播幀相似集的第三個(gè)特征是口播幀相似集在整個(gè)新聞視頻中與其他不同時(shí)段仍相似的那些非口播幀相似圖像集相比,具有最大的分散度,口播幀是以一種不確定的方式分布在整個(gè)新聞視頻中?;谶@些特征,可通過(guò)聚類方法從眾多相似圖像集中挑選出口播幀相似集。具體做法如下設(shè)新聞視頻的幀序列組成為Clip={f1,f2,…,fN},通過(guò)3.所述的三階段匹配方法將視頻分為一系列相似圖像集,由4.所述方法去除掉無(wú)意義的相似圖像集,并因此得到一系列有意義的相似圖像集KeyScene={c1,c2,...,cM}(M<N)在各個(gè)有意義的相似圖像集中任取一幀圖像作為關(guān)鍵幀,并因此得到關(guān)鍵幀集KeyFrame={x1,x2,...,xM}構(gòu)造集合Xp(p=1,2,…,K)并稱與之對(duì)應(yīng)的xi為該集合的關(guān)鍵元素。
Xp={xq|xq與xp相匹配}(p≤M,M關(guān)鍵幀個(gè)數(shù))由此,得兩兩不相似點(diǎn)集的集合X={X1,X2,...,XK}其中K<M。
記ξp(xq)=1,xq∈Xp0,xq∉Xp,]]>稱n(Xp)=Σq=1kξp((xq)]]>為點(diǎn)集Xp的大小度量。
記ζ(xm,xn)=1,(xm∈Xp,xn∈Xq,p=q)∞,(p≠q)(p,q=1,···,K)]]>η(xm,xn)=1,(xm∈Xp,xn∈Xq,p=q)-∞(p≠q)(p,q=1,···,K)]]>
d2(xm,xn)=η(xm,xn)|t(m)-t(n)|(m,n=1,…,M)這里t(i)為相似圖像集Ci第1幀到視頻開(kāi)始幀f1的時(shí)間跨度對(duì)于p,取D1p={d1(xm,xn)}xm∈Xp,xn∈Xq},D2p={d2(xm,xn)|xm∈Xp,xn∈Xq),其中(q=1,…,K),稱d1(Xp)=supD1p為點(diǎn)集Xp的最小直徑,d2(Xp)=infD2p為點(diǎn)集Xp的最大直徑。于是Xpa={Xp|n(Xp)>T2,d1(Xp)>T3,d2(Xp)>T4,p=1,···,K}]]>為同一形式的口播幀集,該集為不同時(shí)段相似口播關(guān)鍵幀組成。
通過(guò)上述聚類分析方法,可將不同時(shí)段、不同形式的口播幀(比如同一新聞視頻中出現(xiàn)的單人口播幀,雙人口播幀)分別從相似圖像集中分離出來(lái)。
6.基于口播幀的新聞視頻單元?jiǎng)澐滞ㄟ^(guò)聚類分析方法,獲得不同時(shí)段口播相似圖像集,記錄各口播相似圖像集中首幀與尾幀的時(shí)間戳,根據(jù)不同時(shí)段口播幀相似圖像集的首幀與尾幀所對(duì)應(yīng)的日寸間戳,分別給出包含口播幀序列幀以及不包含口播幀序列幀的新聞單元的開(kāi)始時(shí)間點(diǎn),并可由下一個(gè)新聞單元含口播幀序列幀的開(kāi)始時(shí)間點(diǎn),確定當(dāng)前新聞單元的結(jié)束時(shí)間點(diǎn)。通過(guò)兩種新聞單元的時(shí)間開(kāi)始點(diǎn),能將新聞視頻單元作出兩種不同的劃分,一種是新聞單元是以主持人畫(huà)面開(kāi)始而開(kāi)始的;另一種是劃分的新聞單元不包含主持人畫(huà)面的出現(xiàn)。
7.試驗(yàn)結(jié)果根據(jù)發(fā)明提出的方法,我們選取中央電視臺(tái)一套的新聞聯(lián)播、國(guó)際時(shí)訊,上海電視臺(tái)環(huán)球新聞?wù)?,新聞坊等十三種不同的新聞節(jié)目,在DELL Pentium 4PC機(jī)上進(jìn)行了口播幀檢測(cè)測(cè)試。新聞視頻中包括廣告、新聞片頭、新聞?wù)?、新聞單元等?nèi)容。其中部分試驗(yàn)結(jié)果如下表所示
從實(shí)驗(yàn)結(jié)果來(lái)看,本發(fā)明取得了令人滿意的結(jié)果,并且能夠排除廣告、新聞片頭等干擾因素的影響。對(duì)這十三種不同新聞節(jié)目,口播幀的檢測(cè)率率達(dá)到100%,且無(wú)誤檢情形發(fā)生。充分說(shuō)明本發(fā)明方法充分考慮口播幀的分布特性。該方法在無(wú)口播幀模版的前提下,具有很高的檢測(cè)準(zhǔn)確性和良好的普適性與實(shí)用性。
權(quán)利要求
1.基于新聞視頻結(jié)構(gòu)特征的口播幀自動(dòng)提取方法與系統(tǒng),包括根據(jù)視頻的相似性分析得到有意義的相似圖像集,并可由此產(chǎn)生一個(gè)關(guān)鍵幀圖像特征集;通過(guò)聚類分析方法,可從有意義的相似圖像集中抽取出各時(shí)段口播幀相似圖像集;基于口播幀相似圖像集的時(shí)間戳,可對(duì)新聞視頻進(jìn)行基于口播幀的新聞單元的自動(dòng)劃分。
2.根據(jù)權(quán)力要求1的基于新聞視頻結(jié)構(gòu)特征的口播幀自動(dòng)提取方法與系統(tǒng),其特征在于該方法是一種事后的分析處理方法。
3.根據(jù)權(quán)力要求1的基于新聞視頻結(jié)構(gòu)特征的口播幀自動(dòng)提取方法與系統(tǒng),其特征在于該方法是一種無(wú)需預(yù)先選定口播幀模版的無(wú)模版方法。
4.根據(jù)權(quán)力要求1的基于新聞視頻結(jié)構(gòu)特征的口播幀自動(dòng)提取方法與系統(tǒng),其特征在于該方法可利用本發(fā)明方法提取的口播幀進(jìn)行的新聞視頻單元的自動(dòng)劃分。
5.根據(jù)權(quán)力要求1的基于新聞視頻結(jié)構(gòu)特征的口播幀自動(dòng)提取方法與系統(tǒng),其特征在于口播幀是從有意義的相似圖像集中提取。
6.根據(jù)權(quán)力要求1的基于新聞視頻結(jié)構(gòu)特征的口播幀自動(dòng)提取方法與系統(tǒng),其特征在于口播幀是依據(jù)新聞視頻結(jié)構(gòu)沿時(shí)域方向的結(jié)構(gòu)特征提取的。
7.根據(jù)權(quán)力要求1的基于新聞視頻結(jié)構(gòu)特征的口播幀自動(dòng)提取方法與系統(tǒng),其特征在于相似圖像集是利用圖像特征的相似性匹配得到的。
8.根據(jù)權(quán)力要求2的基于新聞視頻結(jié)構(gòu)特征的口播幀自動(dòng)提取方法與系統(tǒng),其特征在于該方法可作為其它的口播幀實(shí)時(shí)提取系統(tǒng)的檢驗(yàn)或糾錯(cuò)方法。
9.根據(jù)權(quán)力要求2的基于新聞視頻結(jié)構(gòu)特征的口播幀自動(dòng)提取方法與系統(tǒng),其特征在于該方法可在新聞視頻播放了一定時(shí)間后或新聞視頻全部播放完畢以后,對(duì)口播幀進(jìn)行自動(dòng)提取。
10.根據(jù)權(quán)力要求4的基于新聞視頻結(jié)構(gòu)特征的口播幀自動(dòng)提取方法與系統(tǒng),其特征在于該方法可與任何一種新聞字幕提取系統(tǒng)結(jié)合起來(lái),實(shí)現(xiàn)新聞視頻單元的更為精細(xì)的劃分。
11.根據(jù)權(quán)力要求4、8的基于新聞視頻結(jié)構(gòu)特征的口播幀自動(dòng)提取方法與系統(tǒng),其特征在于該方法可以與任何一個(gè)口播幀實(shí)時(shí)提取方法結(jié)合起來(lái)使用。
12.根據(jù)權(quán)力要求5的基于新聞視頻結(jié)構(gòu)特征的口播幀自動(dòng)提取方法與系統(tǒng),其特征在于圖像特征的匹配方法是通過(guò)灰度均值、灰度直方圖、圖像中直線灰度分布曲線的匹配完成的。
13.根據(jù)權(quán)力要求6的基于新聞視頻結(jié)構(gòu)特征的口播幀自動(dòng)提取方法與系統(tǒng),其特征在于新聞視頻的結(jié)構(gòu)特征為同一時(shí)段口播幀具備較大的時(shí)間冗余度;兩個(gè)不同時(shí)段口播幀之間有較長(zhǎng)的時(shí)間跨度;口播幀分布在整個(gè)新聞視頻時(shí)段上,具備最大的離散度。
全文摘要
基于對(duì)新聞視頻的結(jié)構(gòu)特征,提出了一種新聞視頻口播幀自動(dòng)提取方法。該方法的最大特點(diǎn)是無(wú)需預(yù)先給出口播幀模版,通過(guò)建立有意義的相似圖像集合,并依據(jù)口播幀在整個(gè)新聞視頻時(shí)段中的固有特征,以及口播幀的時(shí)間冗余性,利用聚類分析方法,在無(wú)口播幀模版的條件下,從有意義的相似圖像集中抽取出各時(shí)段的口播幀集。根據(jù)各時(shí)段口播幀集的時(shí)間戳,可實(shí)現(xiàn)基于口播幀的新聞視頻的自動(dòng)劃分。該方法抽取的口播幀集具有較高的準(zhǔn)確度,且具有良好的普適性。
文檔編號(hào)H04N5/272GK101026695SQ20061003372
公開(kāi)日2007年8月29日 申請(qǐng)日期2006年2月21日 優(yōu)先權(quán)日2006年2月21日
發(fā)明者高健, 陳寶輝, 阮根印, 陳瑩瑩 申請(qǐng)人:廣州市紐帝亞資訊科技有限公司