專利名稱:人物縮圖序列產(chǎn)生系統(tǒng)與方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于一種人物縮圖序列產(chǎn)生系統(tǒng)與方法,特別關(guān)于一種利用一計算機(jī)軟件來分析一視頻(Video)內(nèi)容以自動產(chǎn)生人物縮圖序列(Thumbnail Sequence)的系統(tǒng)與方法。
背景技術(shù):
一般而言,視頻是連續(xù)輸出的單張圖象,例如,在NTSC標(biāo)準(zhǔn)中,其播放一秒鐘可能是包含29.97張圖象的連續(xù)切換,而在PAL標(biāo)準(zhǔn)中,其播放一秒鐘可能是包含25張圖象的連續(xù)切換,當(dāng)使用者檢視該圖象時,最大的問題就是該圖象的數(shù)量實在太多,以NTSC標(biāo)準(zhǔn)為例,一分鐘的視頻就包括了將近1800張圖象,以此類推,使用者必須檢視將近二萬張的圖象,才能檢視完10分鐘的視頻中的所有圖象,因此,當(dāng)使用計算機(jī)軟件來編輯視頻內(nèi)容時,常常僅就視頻內(nèi)容的第一張圖象代表該視頻,部份計算機(jī)軟件為了方便使用者更容易對該視頻內(nèi)容有所了解,以利視頻編輯的進(jìn)行,常會以縮圖序列的方式顯示該視頻的部份圖象,然而其挑選該視頻中部份圖象的方法,目前有挑選拍攝日期不同或時間不連續(xù)的第一張圖象,或每隔一時間間隔后挑選一張圖象,或分析視頻內(nèi)容挑選鏡頭變換不同的第一張圖象,以及以人工方式挑選圖象等方法。
當(dāng)視頻內(nèi)容為一生活剪影、MTV、戲劇、影片或影集時,人物通常為該視頻內(nèi)容的主角,因此以人物角色縮圖序列來代表視頻,能夠提供使用者快速檢視于生活剪影、MTV、戲劇、影片或影集中的人物角色的圖象,尤其該圖象對使用者來說是有意義且具代表性的。然而,目前并未有就視頻內(nèi)容的人物角色挑選視頻的部份圖象產(chǎn)生縮圖序列,因此,如何自動挑選該視頻中有意義且具代表性的人物圖象畫面并產(chǎn)生縮圖序列以代表該視頻正是當(dāng)前一個重要的課題。
發(fā)明內(nèi)容
針對上述問題,本發(fā)明的目的是提供一種能夠有效率地分析視頻,并且產(chǎn)生所需的人物縮圖序列的人物縮圖序列產(chǎn)生系統(tǒng)與方法。
為達(dá)上述目的,本發(fā)明的人物縮圖序列產(chǎn)生系統(tǒng)包括一視頻接收模塊、一譯碼模塊、一視頻擷取模塊以及一人物縮圖序列產(chǎn)生模塊。在本發(fā)明中,視頻接收模塊接收一原視頻資料,而譯碼模塊將原視頻資料譯碼成為一視頻資料,然后視頻擷取模塊依據(jù)一人物圖象擷取方針自視頻資料中擷取至少一關(guān)鍵畫面(key frame),最后由人物縮圖序列產(chǎn)生模塊依據(jù)所擷取的關(guān)鍵畫面產(chǎn)生一人物縮圖序列。
承上所述,依本發(fā)明的人物縮圖序列產(chǎn)生系統(tǒng)還包含一圖象處理模塊,其于擷取關(guān)鍵畫面后,針對所擷取的關(guān)鍵畫面進(jìn)行圖象處理。
本發(fā)明的人物縮圖序列產(chǎn)生系統(tǒng)還包含一擷取方針選擇模塊,其接受一使用者的選擇以提供人物圖象擷取方針。
本發(fā)明亦提供一種人物縮圖序列產(chǎn)生方法,其包括一視頻接收步驟、一譯碼步驟、一視頻擷取步驟以及一人物縮圖序列產(chǎn)生步驟。在本發(fā)明中,視頻接收步驟先接收原視頻資料,接著譯碼步驟譯碼原視頻資料以取得視頻資料,然后視頻擷取步驟依據(jù)人物圖象擷取方針擷取關(guān)鍵畫面,最后人物縮圖序列產(chǎn)生步驟依據(jù)關(guān)鍵畫面產(chǎn)生人物縮圖序列。
另外,本發(fā)明的人物縮圖序列產(chǎn)生方法還包括一圖象處理步驟,圖象處理步驟于擷取關(guān)鍵畫面后,針對所擷取的關(guān)鍵畫面進(jìn)行圖象處理。
由于本發(fā)明的人物縮圖序列產(chǎn)生系統(tǒng)與方法能夠自動分析視頻,并自動擷取符合需求的圖象,因此能夠有效率地產(chǎn)生所需的人物縮圖序列。
以下將參照相關(guān)附圖,說明本發(fā)明較佳實施例的人物縮圖序列產(chǎn)生系統(tǒng)與方法,其中相同的組件將以相同的參照符號加以說明。
圖1為一示意圖,顯示依本發(fā)明較佳實施例的人物縮圖序列產(chǎn)生系統(tǒng)的結(jié)構(gòu);
圖2為一流程圖,顯示依本發(fā)明較佳實施例的人物縮圖序列產(chǎn)生方法的流程;圖3為一示意圖,顯示于本發(fā)明較佳實施例的人物縮圖序列產(chǎn)生方法中擷取關(guān)鍵畫面的示意圖;圖4為一示意圖,顯示依本發(fā)明較佳實施例的相異臉孔圖象館的資料儲存結(jié)構(gòu)的示意圖。
圖中符號說明101視頻接收模塊102譯碼模塊103視頻擷取模塊104圖象處理模塊105人物縮圖序列產(chǎn)生模塊106擷取方針選擇模塊2 人物縮圖序列產(chǎn)生方法201~207 人物縮圖序列產(chǎn)生方法的流程301單張圖象302關(guān)鍵畫面40 原視頻資料41 視頻資料411音頻資料412圖象資料50 人物圖象擷取方針501音頻分析算法則502鏡頭變換分析算法則503臉孔檢測分析算法則60 計算機(jī)設(shè)備601信號源接口602內(nèi)存603中央處理單元604輸入裝置605儲存裝置
70 人物縮圖序列8 相異臉孔圖象館80 資料表格81 第一圖象信息811第一臉部特征組合812第一位置信息813第一指針82 第二圖象信息821第二臉部特征組合822第二位置信息823第二指針A 指針AB 指針BC 指針CD 指針D具體實施方式
請參照圖1所示,本發(fā)明較佳實施例的人物縮圖序列產(chǎn)生系統(tǒng)包括一視頻接收模塊101、一譯碼模塊102、一視頻擷取模塊103、一圖象處理模塊104、一人物縮圖序列產(chǎn)生模塊105以及一擷取方針選擇模塊106。
在本實施例中,人物縮圖序列產(chǎn)生系統(tǒng)可以應(yīng)用于一計算機(jī)設(shè)備60中,而計算機(jī)設(shè)備60可以是現(xiàn)有的計算機(jī)裝置,其包括一信號源接口601、一內(nèi)存602、一中央處理單元(CPU)603、一輸入裝置604以及一儲存裝置605。其中,信號源接口601與一信號源輸出裝置或是一信號源紀(jì)錄裝置連接,例如是光驅(qū)、FireWire(IEEE 1394 Interface)、通用串行端口(USB)等接口裝置,而信號源輸出裝置例如是數(shù)字?jǐn)z影機(jī),信號源紀(jì)錄裝置例如是VCD、DVD等。內(nèi)存602可以是DRAM或EEPROM等任何一種或多種設(shè)置于計算機(jī)裝置中的暫存內(nèi)存。中央處理單元603則可采用任何一種現(xiàn)有的中央處理器架構(gòu),例如,包括ALU、緩存器與控制器等,以進(jìn)行各種資料的處理與運(yùn)算,以及控制計算機(jī)設(shè)備60中各組件的工作。輸入裝置604可以是鼠標(biāo)、鍵盤等能夠由使用者自行輸入訊息,或是操作各軟件模塊的裝置。儲存裝置605可以是硬盤機(jī)、軟盤機(jī)等任何一種或多種計算機(jī)可讀取的資料儲存裝置。
本實施例中的各模塊是指儲存于儲存裝置605中或是一紀(jì)錄媒體中的軟件模塊。中央處理單元603在讀取各模塊之后,即可經(jīng)由計算機(jī)設(shè)備60中的各組件來實現(xiàn)各模塊的功能。然而需注意的是,本領(lǐng)域技術(shù)人員亦可將本實施例中所公開的軟件模塊制作成硬件,如ASIC(application-specific integrated circuit)芯片等,而不違反本發(fā)明的精神與范疇。
以下詳細(xì)說明本實施例中各模塊的功能。
在本實施例中,視頻接收模塊101接收一原視頻資料40,譯碼模塊102譯碼原視頻資料40以取得一視頻資料41,擷取方針選擇模塊106提供給一使用者選取所需的一人物圖象擷取方針50,視頻擷取模塊103則依據(jù)人物圖象擷取方針50自視頻資料41中擷取至少一關(guān)鍵畫面302,然后,圖象處理模塊104針對視頻擷取模塊103所擷取的關(guān)鍵畫面302進(jìn)行圖象處理;最后,人物縮圖序列產(chǎn)生模塊105依據(jù)經(jīng)過圖象處理的關(guān)鍵畫面302產(chǎn)生一人物縮圖序列70。
如上所述,視頻接收模塊101與信號源接口601配合,例如,視頻接收模塊101可以通過FireWire(IEEE 1394 Interface)取得儲存于數(shù)字?jǐn)z影機(jī)中的原視頻資料40,或是通過光驅(qū)取得記錄于VCD、DVD中的原視頻資料40。原視頻資料40是由各種視頻擷取裝置或接收裝置如數(shù)字?jǐn)z影機(jī)、電視卡、機(jī)上盒等,以及各種視頻儲存裝置如DVD、VCD所儲存、傳送、廣播(Broadcasting)或接收的視頻,且其能夠以各種視頻資料格式(如MPEG-1,MPEG-2,MPEG-4,AVI,ASF,MOV等)儲存、傳送、廣播或接收。
譯碼模塊102能夠針對輸入的原視頻資料40的視頻格式、編碼方式、或壓縮方式進(jìn)行譯碼轉(zhuǎn)換還原為編碼前的資料或近似于編碼前的資料,例如,若編碼方式采用失真壓縮方式(Lossy Compression),則譯碼后只能夠取得近似于編碼前的資料,以便產(chǎn)生一視頻資料41。在本實施例中,視頻資料41包括一音頻資料411以及一圖象資料412。音頻資料411為視頻資料41中所播放的聲音;圖象資料412為視頻資料41所顯示的所有單張圖象,通常每秒鐘的視頻資料41是由25張單張圖象或29.97張單張圖象連續(xù)播放所構(gòu)成。本實施例中以小時分秒畫面,來表示每一畫面相對于視頻資料41的位置信息;例如,01112025為視頻資料41第1小時第11分20秒的第25個畫面。
擷取方針選擇模塊106與輸入裝置604配合,以便使用者能夠利用輸入裝置604于擷取方針選擇模塊106中選取所需的人物圖象擷取方針50。依本實施例所提供的人物圖象擷取方針50會依據(jù)使用者輸入的選項設(shè)定信息(Preference),決定是否要利用音頻分析算法則501與鏡頭變換分析算法則502,作為視頻資料進(jìn)行臉孔檢測分析算法則503的前處理程序。音頻分析算法則501與鏡頭變換分析算法則502的處理程序會精簡并減少進(jìn)行臉孔檢測分析算法則503的視頻資料量。
音頻分析算法則501是分析視頻資料41的音頻資料411,以篩選音頻資料411中具有人聲的音頻資料片段及其對應(yīng)圖象資料片段。因此能將非人聲的音頻資料片段(如噪音、靜音)及其對應(yīng)圖象資料片段,分離不進(jìn)行臉孔檢測分析算法則的處理。
音頻分析算法則501利用特征抽取(Features Extraction)與特征匹配(Features Matching)方式進(jìn)行分析,將人物角色的聲音區(qū)分并分類。音頻資料411的特征包括如頻譜特征(Spectral Features)、音量(Volume)、零軸交會率(Zero Crossing Rate)、音調(diào)(Pitch)等。如上所述,當(dāng)抽取頻譜特征(Spectral Features)后,其經(jīng)由雜音衰減(Noise Reduction)、分段(Segmentation),并利用快速傅利葉轉(zhuǎn)換(Fast Fourier Transform)將音頻資料411轉(zhuǎn)至頻率域(Frequency),然后由一組頻率濾波器(Filters)進(jìn)行特征值抽取,這組特征值組成一個頻譜特征向量(Spectral FeatureVector)。音量是容易測量的一種特征,其可利用均方根值(RMS,RootMean Square)代表其特征值,然后由音量(Volume)分析可輔助分段(Segmentation)的進(jìn)行,亦即通過靜音檢測(Silence Detection)幫助音頻資料411段落邊界(Boundaries)的決定。零軸交會率(Zero Crossing Rate)為計算每段(Clips)聲音波形(Waveform)與零軸(Zero Axis)交會的次數(shù)。音調(diào)(Pitch)為聲音波形(Waveform)的基頻(Fundamental Frequency)。因此,音頻資料411可利用上述的音頻特征及其特征值所組成的特征向量(Feature Vector)與人聲音頻樣本(Audio templates)的特征進(jìn)行分析比對,進(jìn)行分析比對,以便取得所需具有人聲的音頻資料片段及其對應(yīng)圖象資料片段。
鏡頭變換分析算法則502是分析視頻資料41中圖象資料412的鏡頭變換,并篩選視頻資料41中圖象資料412中每個鏡頭變換后的第一個畫面,作為進(jìn)行臉孔檢測分析算法則503的圖象資料。鏡頭變換分析算法則502所分析的圖象資料412可為經(jīng)過音頻分析算法則501篩選后具有人聲的音頻資料所對應(yīng)的圖象資料412或未經(jīng)音頻分析算法則501處理的視頻資料41中的圖象資料412。
一般而言,視頻資料41為一視頻串行(Video Sequence),其通常由許多場景(Scenes)所組成,而每一場景又由多個鏡頭變換(Shots)所組成。在影片中的最小單位是一個鏡頭變換,而影片便是由許多的鏡頭變換所堆砌起來的。通常,一個鏡頭由多個視覺特性(如色彩(Color)、紋理(Texture)、形狀(Shape)、動作(Motion))具一致性的畫面(Frames)所組成,并且,其是依據(jù)攝影機(jī)運(yùn)動方向(Camera Direction)與攝影取景角度(View Angle)的改變而有變化,例如,當(dāng)攝影機(jī)以不同的攝影取景角度來拍攝同一場景時,會產(chǎn)生不同的鏡頭變換,或以相同的攝影取景角度但拍攝不同的區(qū)域時,亦會產(chǎn)生不同的鏡頭變換。由于鏡頭變換可由一些基本視覺特性而區(qū)分,因此將視頻資料41分割成多個連續(xù)的鏡頭變換是相當(dāng)容易達(dá)成的,此技術(shù)主要由分析一些基本視覺特性的統(tǒng)計資料如視覺特性柱狀圖(Histogram),因此,當(dāng)一畫面的視覺特性與前一畫面的視覺特性差異達(dá)到某一程度時,就可在此畫面與前一畫面間作一分割并視作為鏡頭變換,在本實施例中,可以挑選此鏡頭變換后的第一個畫面作為進(jìn)行臉孔檢測分析算法則503的圖象資料。
臉孔檢測分析算法則503利用臉孔檢測(Face Detection),臉孔辨識(Face Recognition)技術(shù)尋找視頻資料41中具有相異臉孔特征的視頻畫面以作為關(guān)鍵畫面302。臉孔檢測分析算法則503所分析的圖象資料412可為經(jīng)過音頻分析算法則501或鏡頭變換分析算法則502篩選后的圖象資料412,或未經(jīng)過音頻分析算法則501或鏡頭變換分析算法則502篩選后的圖象資料412。
在本實施例中,利用相異臉孔圖象館8以資料表格80儲存具有相異臉孔的圖象信息、該相異臉孔圖象的臉部特征組合及圖象的位置信息,并以資料鏈接串行儲存與該相異臉孔圖象具有相同臉部特征的圖象的位置信息。如圖4所示,其顯示于相異臉孔圖象館8中所儲存的資料,例如,在資料表格80的第一列中,儲存具有一第一臉孔的一第一圖象信息81、表示第一臉孔的一第一臉部特征組合811、第一圖象的一第一位置信息812,以及鏈接至具有第一臉孔的其它圖象的多個第一指針(pointer)813,例如指針A、指針B、指針C、指針D等等。依此類推,在資料表格8的第二列中,儲存具有一第二臉孔的一第二圖象信息82、表示第二臉孔的一第二臉部特征組合821、第二圖象的一第二位置信息822,以及鏈接至具有第二臉孔的其它圖象的多個第二指針823。
在本實施例中,先將輸入的圖象資料412,經(jīng)臉孔檢測(FaceDetection)技術(shù)篩選具有臉孔畫面的圖象后,針對具有臉孔畫面的圖象,檢測臉部特征,將第一張具有臉孔畫面的圖象、及其臉部特征組合與圖象的位置信息存入“相異臉孔圖象館”,當(dāng)再檢視其它具有臉孔畫面的圖象時,將其圖象中臉部特征組合與“相異臉孔圖象館”中存盤的臉部特征組合進(jìn)行比對,若該張圖象的臉部特征組合與已存入“相異臉孔圖象館”中存盤的臉部特征組合相同則該張圖象被淘汰,并將此被淘汰的圖象的位置信息儲存于“相異臉孔圖象館”中特征組合相同的圖象所對應(yīng)的資料鏈接串行中,若該張圖象的臉部特征組合與所有已存入“相異臉孔圖象館”中存盤的臉部特征組合相異,則該張圖象及其臉部特征組合與圖象的位置信息存入“相異臉孔圖象館”,如此將輸入的圖象資料412一一完成臉孔辨識比對。最后存于“相異臉孔圖象館”的圖象則為本實施例中所篩選的關(guān)鍵畫面302。目前最常被用來做臉孔辨識的方法的一就是主要元素分析(Principal Component Analysis,PCA),以此方法所建立的臉孔辨識器通常稱為特征臉(Eigenface)辨識系統(tǒng)。
視頻擷取模塊103可以是儲存在儲存裝置605的一軟件模塊,并配合中央處理單元603的運(yùn)算,依據(jù)本實施例所提供的人物圖象擷取方針50,分析比對視頻資料41中的圖象,進(jìn)而擷取合乎人物圖象擷取方針50的關(guān)鍵畫面302。
圖象處理模塊104可以是儲存在儲存裝置605的一軟件模塊,并通過中央處理單元603的運(yùn)算,以便針對所擷取的關(guān)鍵畫面302進(jìn)行圖象處理,例如調(diào)整圖象大小(Rescaling)等圖象處理(Image processing)功能。
人物縮圖序列產(chǎn)生模塊105可以是儲存在儲存裝置605的一軟件模塊,并通過中央處理單元603的運(yùn)算,將經(jīng)過圖象處理的關(guān)鍵畫面302整合匯出,以產(chǎn)生人物縮圖序列70。
另外,所產(chǎn)生的人物縮圖序列70可以儲存在儲存裝置605中,而所儲存的資料包括人物縮圖序列70的串行頭(Head)、各關(guān)鍵畫面302(或縮圖)的鏈接串行(Linked List)或指針(Pointer)等。
為使本發(fā)明的內(nèi)容更容易理解,以下將舉一實例,以說明依本發(fā)明較佳實施例的人物縮圖序列產(chǎn)生方法的流程。
請參照圖2所示,在依本發(fā)明較佳實施例的人物縮圖序列產(chǎn)生方法2中,步驟201接收原視頻資料40,例如,可以將數(shù)字?jǐn)z影機(jī)中紀(jì)錄的資料經(jīng)由傳輸線送至信號源接口601,以提供作為產(chǎn)生人物縮圖序列70的畫面與內(nèi)容。
在步驟202中,譯碼模塊102辨識原視頻資料40的格式并譯碼原視頻資料40以產(chǎn)生經(jīng)過譯碼的視頻資料41,例如,原視頻資料40為Interlaced MPEG-2格式,亦即是,一個訊框是由兩個訊場(field)所組成,所以,在此步驟中,可以先進(jìn)行MPEG-2格式的譯碼,然后利用內(nèi)插法(Interpolation)解交錯以得到視頻資料41。
在步驟203中,視頻擷取模塊103依據(jù)使用者由輸入裝置604輸入的選項設(shè)定信息,執(zhí)行于擷取方針選擇模塊106中選取的人物圖象擷取方針50來擷取關(guān)鍵畫面302,亦即,由使用者決定是否要利用音頻分析算法則501與鏡頭變換分析算法則502,作為視頻資料進(jìn)行人物角色的臉孔檢測分析算法則503的前處理程序。針對視頻資料41的每一視頻畫面與內(nèi)容(包含音頻內(nèi)容),進(jìn)行分析搜尋并篩選取得符合人物圖象擷取方針50的關(guān)鍵畫面302。需注意的是,本實施例可以擷取出多張的關(guān)鍵畫面302。如圖3所示,原視頻資料40經(jīng)過譯碼后會得到視頻資料41,其包括多張單張圖象301(每秒25張或29.97張),而經(jīng)過依據(jù)人物圖象擷取方針50的分析搜尋后會從該單張圖象301中擷取出至少一關(guān)鍵畫面302。
步驟204是判斷是否已經(jīng)完成視頻資料41中所有內(nèi)容的分析比對,當(dāng)未完成視頻資料41中所有內(nèi)容的分析比對時,重復(fù)進(jìn)行步驟203;當(dāng)完成視頻資料41中所有內(nèi)容的分析比對時,進(jìn)行步驟205。
在步驟205中,圖象處理模塊104依據(jù)于步驟203中取得的關(guān)鍵畫面302,針對縮框的分辨率(Resolution)、大小(Size)來進(jìn)行圖象處理(Image Processing),例如調(diào)整圖象大小的處理程序。
在步驟206中,人物縮圖序列產(chǎn)生模塊105整合經(jīng)過圖象處理的關(guān)鍵畫面302以產(chǎn)生人物縮圖序列70。例如,所擷取出的關(guān)鍵畫面302經(jīng)過調(diào)整大小之后,人物縮圖序列產(chǎn)生模塊105將其依序排列于一窗口中,并且,當(dāng)圖象數(shù)超過一窗口所能夠顯示的數(shù)量時,利用滾動條(Scroll bar)方式提供給使用者進(jìn)行人物縮圖序列70的瀏覽。
又,關(guān)鍵畫面302可以是如圖4所示的第一圖象信息81、第二圖象信息82等等,因此,所產(chǎn)生的人物縮圖序列70顯示在視頻資料41中所有相異臉孔的圖象,其可以代表視頻資料41中所有出場人物的縮圖序列。另外,關(guān)鍵畫面302可以是如圖4所示的第一圖象信息81及具有第一臉孔的其它圖象,因此,所產(chǎn)生的人物縮圖序列70顯示在視頻資料41中所有具有第一臉孔的圖象,其可以代表視頻資料41中具有第一臉孔的人物的縮圖序列。除此之外,具有第一臉孔的圖象的關(guān)鍵畫面302還可以匯整為一特定人物的專輯視頻資料,其可以視作為具有第一臉孔的特定人物的個人專輯。
最后,步驟207是在儲存裝置605中儲存人物縮圖序列70,并且以程序定義的數(shù)據(jù)結(jié)構(gòu)如鏈接串行來儲存。其中,鏈接串行的串行頭將包含人物縮圖序列70的文件名稱等信息,每一節(jié)點將包含一人物縮圖的信息(人物縮象資料或人物縮象的指針)以及與前(后)節(jié)點的鏈接(Link)信息。
綜上所述,由于依本發(fā)明較佳實施例的人物縮圖序列產(chǎn)生系統(tǒng)與方法能夠自動分析視頻資料,并針對視頻資料的音頻資料及圖象資料,來整合視頻內(nèi)容分析、音頻分析、臉孔檢測、臉孔辨識等技術(shù),以產(chǎn)生人物縮圖序列,所以能夠有效率地利用視頻資料來產(chǎn)生所需的人物縮圖序列。
另外,在利用本發(fā)明實施例中人物縮圖序列產(chǎn)生系統(tǒng)與方法時,若使用者產(chǎn)生人物縮圖序列的選項設(shè)定(Preference)未選擇音頻分析算法則501及鏡頭變換分析算法則502進(jìn)行篩選,則使用者可挑選人物縮圖序列中的縮圖,并由“相異臉孔圖象館”中該縮圖對應(yīng)的相異臉孔的圖象及其對應(yīng)的資料鏈接串行(其儲存與該人物縮象具有相同臉部特征的圖象的位置信息)取得視頻中具有相同臉部特征的圖象,進(jìn)行批次(Batch)的視頻編輯或圖象編輯,刪除或取代所有該相同臉部特征的圖象,圖象強(qiáng)化(Enhancement)加入視頻特效(Effect)、亮度、色彩調(diào)整等處理工作。
若使用者產(chǎn)生人物縮圖序列的選項設(shè)定有選擇音頻分析算法5501或鏡頭變換分析算法則502進(jìn)行篩選,則使用者可挑選人物縮圖序列中的縮圖,并由“相異臉孔圖象館”中該縮圖對應(yīng)的相異臉孔的圖象及其對應(yīng)的資料鏈接串行取得被音頻分析算法則501或鏡頭變換分析算法則502篩選后具有相同臉部特征的圖象,進(jìn)行批次的視頻編輯或圖象編輯,刪除或取代所有該相同臉部特征的圖象,圖象強(qiáng)化、加入視頻特效、亮度、色彩調(diào)整等處理工作。
例如,可以依批次的方式將所有具有相同臉部特征的圖象合并為此特定人物的個人視頻剪輯,而且可以由使用者手動通過圖象處理模塊104對所選取出的個人視頻剪輯作視頻編輯或圖象編輯,如刪除或取代所有該相同臉部特征的圖象、進(jìn)行圖象強(qiáng)化、加入視頻特效、或調(diào)整圖象亮度、色彩等處理工作。
以上所述僅為舉例性,而非為限制性。任何未脫離本發(fā)明的精神與范疇,而對其進(jìn)行的等效修改或變更,均應(yīng)包含本專利的保護(hù)范圍中。
權(quán)利要求
1.一種人物縮圖序列產(chǎn)生系統(tǒng),包含一視頻接收模塊,其接收一原視頻資料;一譯碼模塊,其譯碼該原視頻資料以取得一視頻資料;一視頻擷取模塊,其依據(jù)一人物圖象擷取方針自該視頻資料中擷取一關(guān)鍵畫面;以及一人物縮圖序列產(chǎn)生模塊,其依據(jù)所擷取的該關(guān)鍵畫面產(chǎn)生一人物縮圖序列。
2.根據(jù)權(quán)利要求1所述的人物縮圖序列產(chǎn)生系統(tǒng),其特征在于還包含一圖象處理模塊,其于擷取該關(guān)鍵畫面后,針對所擷取的該關(guān)鍵畫面進(jìn)行圖象處理。
3.根據(jù)權(quán)利要求1所述的人物縮圖序列產(chǎn)生系統(tǒng),其特征在于還包含一擷取方針選擇模塊,其接受一使用者的選擇以提供該人物圖象擷取方針。
4.根據(jù)權(quán)利要求1所述的人物縮圖序列產(chǎn)生系統(tǒng),其特征在于該人物圖象擷取方針包含一臉孔檢測分析算法則,其分析該視頻資料中具有臉孔特征的一圖象資料,該視頻擷取模塊依據(jù)該臉孔檢測分析算法則從該圖象資料中擷取該關(guān)鍵畫面。
5.根據(jù)權(quán)利要求4所述的人物縮圖序列產(chǎn)生系統(tǒng),其特征在于該視頻擷取模塊是依據(jù)該臉孔檢測分析算法則擷取具有相同的臉孔特征的該圖象資料以作為該關(guān)鍵畫面。
6.根據(jù)權(quán)利要求5所述的人物縮圖序列產(chǎn)生系統(tǒng),其特征在于該人物縮圖序列為一特定人物的縮圖序列。
7.根據(jù)權(quán)利要求6所述的人物縮圖序列產(chǎn)生系統(tǒng),其特征在于還依據(jù)該特定人物的縮圖序列產(chǎn)生該特定人物的專輯視頻資料。
8.根據(jù)權(quán)利要求4所述的人物縮圖序列產(chǎn)生系統(tǒng),其特征在于該視頻擷取模塊是依據(jù)該臉孔檢測分析算法則擷取具有相異的臉孔特征的該圖象資料以作為該關(guān)鍵畫面。
9.根據(jù)權(quán)利要求4所述的人物縮圖序列產(chǎn)生系統(tǒng),其特征在于該人物圖象擷取方針還包含一音頻分析算法則,其分析該視頻資料中的一音頻資料,該視頻擷取模塊是依據(jù)該音頻分析算法則篩選具有人聲的該音頻資料所對應(yīng)的該圖象資料,然后依據(jù)該臉孔檢測分析算法則從該圖象資料中擷取該關(guān)鍵畫面。
10.根據(jù)權(quán)利要求4所述的人物縮圖序列產(chǎn)生系統(tǒng),其特征在于該人物圖象擷取方針還包含一鏡頭變換分析算法則,其是分析該視頻資料中一圖象資料的鏡頭變換,該視頻擷取模塊是依據(jù)該鏡頭變換分析算法則篩選該圖象資料,然后依據(jù)該臉孔檢測分析算法則從該圖象資料中擷取該關(guān)鍵畫面。
11.一種人物縮圖序列產(chǎn)生方法,包含一視頻接收步驟,其接收一視頻資料;一譯碼步驟,其譯碼該原視頻資料以取得一視頻資料;一視頻擷取步驟,其依據(jù)一人物圖象擷取方針自該視頻資料中擷取一關(guān)鍵畫面;以及一縮圖序列產(chǎn)生步驟,其依據(jù)所擷取的該關(guān)鍵畫面產(chǎn)生一縮圖序列。
12.根據(jù)權(quán)利要求11所述的人物縮圖序列產(chǎn)生方法,其特征在于還包含一圖象處理步驟,其在擷取該關(guān)鍵畫面后,針對所擷取的該關(guān)鍵畫面進(jìn)行圖象處理。
13.根據(jù)權(quán)利要求11所述的人物縮圖序列產(chǎn)生方法,其特征在于還包含一擷取方針選擇步驟,其接受一使用者的選擇以提供該人物圖象擷取方針。
14.根據(jù)權(quán)利要求11所述的人物縮圖序列產(chǎn)生方法,其特征在于該人物圖象擷取方針包含一臉孔檢測分析算法則,其分析該視頻資料中具有臉孔特征的一圖象資料,該視頻擷取步驟依據(jù)該臉孔檢測分析算法則從該圖象資料中擷取該關(guān)鍵畫面。
15.根據(jù)權(quán)利要求14所述的人物縮圖序列產(chǎn)生方法,其特征在于該視頻擷取步驟是依據(jù)該臉孔檢測分析算法則擷取具有相同的臉孔特征的該圖象資料以作為該關(guān)鍵畫面。
16.根據(jù)權(quán)利要求15所述的人物縮圖序列產(chǎn)生方法,其特征在于該人物縮圖序列為一特定人物的縮圖序列。
17.根據(jù)權(quán)利要求16所述的人物縮圖序列產(chǎn)生方法,其特征在于還依據(jù)該特定人物的縮圖序列產(chǎn)生該特定人物的專輯視頻資料。
18.根據(jù)權(quán)利要求14所述的人物縮圖序列產(chǎn)生方法,其特征在于該視頻擷取步驟是依據(jù)該臉孔檢測分析算法則擷取具有相異的臉孔特征的該圖象資料以作為該關(guān)鍵畫面。
19.根據(jù)權(quán)利要求14所述的人物縮圖序列產(chǎn)生方法,其特征在于該人物圖象擷取方針還包含一音頻分析算法則,其分析該視頻資料中的一音頻資料,該視頻擷取步驟是依據(jù)該音頻分析算法則先篩選具有人聲的該音頻資料所對應(yīng)的該圖象資料,然后依據(jù)該臉孔檢測分析算法則從該圖象資料中擷取該關(guān)鍵畫面。
20.根據(jù)權(quán)利要求14所述的人物縮圖序列產(chǎn)生方法,其特征在于該人物圖象擷取方針還包含一鏡頭變換分析算法則,其是分析該視頻資料中一圖象資料的鏡頭變換,該視頻擷取步驟是依據(jù)該鏡頭變換分析算法則篩選該圖象資料,然后依據(jù)該臉孔檢測分析算法則從該圖象資料中擷取該關(guān)鍵畫面。
21.一種記錄媒體,其是記錄用以使計算機(jī)達(dá)成一人物縮圖序列產(chǎn)生方法的程序,該人物縮圖序列產(chǎn)生方法包含一視頻接收步驟,其接收一視頻資料;一譯碼步驟,其譯碼該原視頻資料以取得一視頻資料;一視頻擷取步驟,其依據(jù)一人物圖象擷取方針自該視頻資料中擷取一關(guān)鍵畫面;以及一人物縮圖序列產(chǎn)生步驟,其依據(jù)所擷取的該關(guān)鍵畫面產(chǎn)生一人物縮圖序列。
22.根據(jù)權(quán)利要求21所述的記錄媒體,其特征在于該人物縮圖序列產(chǎn)生方法還包含一圖象處理步驟,其在擷取該關(guān)鍵畫面后,針對所擷取的該關(guān)鍵畫面進(jìn)行圖象處理。
23.根據(jù)權(quán)利要求21所述的記錄媒體,其特征在于該人物縮圖序列產(chǎn)生方法還包含一擷取方針選擇步驟,其接受一使用者的選擇以提供該人物圖象擷取方針。
24.根據(jù)權(quán)利要求21所述的記錄媒體,其特征在于該人物圖象擷取方針包含一臉孔檢測分析算法則,其分析該視頻資料中具有臉孔特征的一圖象資料,該視頻擷取步驟依據(jù)該臉孔檢測分析算法則從該圖象資料中擷取該關(guān)鍵畫面。
25.根據(jù)權(quán)利要求24所述的記錄媒體,其特征在于該視頻擷取步驟是依據(jù)該臉孔檢測分析算法則擷取具有相同的臉孔特征的該圖象資料以作為該關(guān)鍵畫面。
26.根據(jù)權(quán)利要求25所述的記錄媒體,其特征在于該人物縮圖序列為一特定人物的縮圖序列。
27.根據(jù)權(quán)利要求26所述的記錄媒體,其特征在于還依據(jù)該特定人物的縮圖序列產(chǎn)生該特定人物的專輯視頻資料。
28.根據(jù)權(quán)利要求24所述的記錄媒體,其特征在于該視頻擷取步驟是依據(jù)該臉孔檢測分析算法則擷取具有相異的臉孔特征的該圖象資料以作為該關(guān)鍵畫面。
29.根據(jù)權(quán)利要求24所述的記錄媒體,其特征在于該人物圖象擷取方針還包含一音頻分析算法則,其分析該視頻資料中的一音頻資料,該視頻擷取步驟是依據(jù)該音頻分析算法則先篩選具有人聲的該音頻資料所對應(yīng)的該圖象資料,然后依據(jù)該臉孔檢測分析算法則從該圖象資料中擷取該關(guān)鍵畫面。
30.根據(jù)權(quán)利要求24所述的記錄媒體,其特征在于該人物圖象擷取方針還包含一鏡頭變換分析算法則,其是分析該視頻資料中一圖象資料的鏡頭變換,該視頻擷取步驟是依據(jù)該鏡頭變換分析算法則篩選該圖象資料,然后依據(jù)該臉孔檢測分析算法則從該圖象資料中擷取該關(guān)鍵畫面。
全文摘要
本發(fā)明提供一種人物縮圖序列產(chǎn)生系統(tǒng),其包括一視頻接收模塊、一譯碼模塊、一視頻擷取模塊以及一人物縮圖序列產(chǎn)生模塊。在本發(fā)明中,視頻接收模塊接收一原視頻資料;譯碼模塊將原視頻資料譯碼成為一視頻資料;視頻擷取模塊則依據(jù)一人物圖象擷取方針自視頻資料中擷取至少一關(guān)鍵畫面;人物縮圖序列產(chǎn)生模塊依據(jù)所擷取的關(guān)鍵畫面產(chǎn)生一縮圖序列。本發(fā)明亦公開一種依據(jù)上述系統(tǒng)實施的人物縮圖序列產(chǎn)生方法。
文檔編號G06T5/00GK1412719SQ0114154
公開日2003年4月23日 申請日期2001年10月12日 優(yōu)先權(quán)日2001年10月12日
發(fā)明者吳昌隆, 黃維仁 申請人:力新國際科技股份有限公司