一種基于語義分析將圖像合成新視頻的方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻生成領(lǐng)域,具體而言,涉及一種基于語義分析將圖像合成新視頻的方法和系統(tǒng)。
【背景技術(shù)】
[0002]拍照、視頻錄制是日常生活中常見的兩種拍攝方式,這兩種拍攝方式所得到的產(chǎn)物都可以稱為圖像(拍照所得到的是某個畫面照片,視頻可以理解為是將大量的照片、圖像幀合成為能夠表現(xiàn)連貫動作的動畫)。
[0003]在進(jìn)行基礎(chǔ)的拍照和視頻錄制之后,可以進(jìn)一步通過PS、flash制作軟件對圖像進(jìn)行編輯,以實現(xiàn)制作一個邏輯型更強或者能夠展現(xiàn)作者需求的連續(xù)型動畫。常見的如電影,通常是預(yù)先拍攝大量的分鏡頭,再通過后期的視頻處理將大量的分鏡頭整合成一個完成的電影,從而完成電影的制作。
[0004]當(dāng)然,這種電影的制作方式同樣適用于某個用戶個體。傳統(tǒng)的用戶制作視頻的方式通常使用非線性影音編輯軟件手工進(jìn)行編輯,如使用繪聲繪影等視頻編輯軟件將多個視頻以時間點,或者以圖像幀為參照進(jìn)行刪除、組合,還可以將拍攝得到的照片進(jìn)行插入。
[0005]隨著智能手機(jī)的普及,隨著用戶拍攝照片、視頻數(shù)量的不斷增加,進(jìn)而將拍攝到的照片和視頻整理成可講述故事的視頻的需求不斷增加。但使用傳統(tǒng)的如繪聲繪影等視頻制作軟件進(jìn)行視頻整合的難度較高,集中體現(xiàn)在此類視頻制作軟件過于專業(yè)化,很多需要進(jìn)行照片、視頻整合的個人用戶難以熟練的操作此類軟件,并且由于個人用戶期望編輯的照片和視頻的數(shù)量較大,進(jìn)一步拖緩了視頻合成速度。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的在于提供一種基于語義分析將圖像合成新視頻的方法和裝置,以降低用戶進(jìn)行視頻合成的難度。
[0007]第一方面,本發(fā)明實施例提供了一種基于語義分析將圖像合成新視頻的方法,包括:
[0008]客戶端將預(yù)先獲取的圖像提交至服務(wù)器;
[0009]服務(wù)器對客戶端提交的圖像進(jìn)行語義分析;
[0010]根據(jù)語義分析的結(jié)果,選擇相應(yīng)的視頻合成模板,并使用所選擇的視頻合成模板對圖像進(jìn)行渲染,以合成新視頻。
[0011]結(jié)合第一方面,本發(fā)明實施例提供了第一方面的第一種可能的實施方式,其中,月艮務(wù)器對客戶端提交的圖像進(jìn)行語義分析包括:
[0012]對圖像進(jìn)行語義分析,識別出圖像的內(nèi)容;
[0013]對識別出的圖像內(nèi)容進(jìn)行提取,得到結(jié)構(gòu)化信息;
[0014]將得到的結(jié)構(gòu)化信息和結(jié)構(gòu)化語法數(shù)據(jù)庫進(jìn)行對比,得出結(jié)構(gòu)化信息的本體描述。
[0015]結(jié)合第一方面,本發(fā)明實施例提供了第一方面的第二種可能的實施方式,其中,選擇相應(yīng)的視頻合成模板包括:
[0016]選擇視頻合成模板數(shù)據(jù)庫中與本體描述相對應(yīng)的視頻合成模板,視頻模板數(shù)據(jù)庫存儲有基于本體描述設(shè)計的視頻合成模板。
[0017]結(jié)合第一方面,本發(fā)明實施例提供了第一方面的第三種可能的實施方式,其中,語義分析包括:
[0018]物體動作分析、鏡頭運動分析、視頻穩(wěn)定性分析、人臉識別分析、情景分析、人臉捕捉及索引、物體捕捉及跟蹤、人物捕捉、語音捕捉、音定位分析、音樂分析以及故事話題分析。
[0019]結(jié)合第一方面,本發(fā)明實施例提供了第一方面的第四種可能的實施方式,其中,使用所選擇的視頻合成模塊對圖像進(jìn)行渲染,以合成新視頻包括:
[0020]根據(jù)對圖像進(jìn)行語義分析的結(jié)果進(jìn)行故事編輯,將編輯好的故事合成音頻;
[0021]根據(jù)選擇的視頻模板對獲取到的圖像和合成的音頻進(jìn)行渲染,以合成新視頻。
[0022]結(jié)合第一方面,本發(fā)明實施例提供了第一方面的第五種可能的實施方式,其中,還包括:
[0023]將合成后的新視頻以視頻索引的形式發(fā)送至客戶端。
[0024]第二方面,本發(fā)明實施例還提供了一種基于語義分析將圖像合成新視頻的系統(tǒng),包括:
[0025]客戶端模塊,用于將預(yù)先獲取的圖像提交至服務(wù)器;
[0026]服務(wù)器端語義分析模塊,用于對客戶端提交的圖像進(jìn)行語義分析;
[0027]服務(wù)器端視頻渲染合成模塊,用于根據(jù)語義分析的結(jié)果,選擇相應(yīng)的視頻合成模板,并使用所選擇的視頻合成模板對圖像進(jìn)行渲染,以合成新視頻。
[0028]結(jié)合第二方面,本發(fā)明實施例提供了第二方面的第一種可能的實施方式,其中,月艮務(wù)器端語義分析模塊包括:
[0029]圖像識別單元,用于對圖像進(jìn)行語義分析,識別出圖像的內(nèi)容;
[0030]結(jié)構(gòu)化信息獲取單元,用于對識別出的圖像內(nèi)容進(jìn)行提取,得到結(jié)構(gòu)化信息;
[0031]本體描述獲取單元,用于將得到的結(jié)構(gòu)化信息和結(jié)構(gòu)化語法數(shù)據(jù)庫進(jìn)行對比,得出結(jié)構(gòu)化信息的本體描述。
[0032]結(jié)合第二方面,本發(fā)明實施例提供了第二方面的第二種可能的實施方式,其中,圖像識別單元包括:
[0033]物體動作分析子單元、鏡頭運動分析子單元、視頻穩(wěn)定性分析子單元、人臉識別子單元、情景分析子單元、人物捕捉子單元、語音捕捉子單元、聲音定位分析子單元、音樂分析子單元以及故事話題分析子單元。
[0034]結(jié)合第二方面,本發(fā)明實施例提供了第二方面的第三種可能的實施方式,其中,月艮務(wù)器端視頻渲染合成模塊包括:
[0035]故事編輯單元,用于根據(jù)語義分析模塊的分析結(jié)果,進(jìn)行故事編輯,并將編輯好的故事合成音頻;
[0036]服務(wù)器端視頻渲染合成單元,用于將選擇的視頻模板和合成的音頻進(jìn)行渲染,合成新視頻。
[0037]本發(fā)明實施例提供的一種基于語義分析將圖像合成新視頻的方法,采用語義分析的視頻合成方式,與現(xiàn)有技術(shù)中的視頻軟件的使用難度較高,導(dǎo)致用戶進(jìn)行視頻合成的難度變高相比,其通過客戶端將預(yù)先獲取的圖像提交至服務(wù)器,以使服務(wù)器能夠獲得進(jìn)行視頻編輯的基礎(chǔ)文件,進(jìn)而服務(wù)器對客戶端所提交的圖像進(jìn)行語義分析,進(jìn)而確定圖像的主體內(nèi)容,并且根據(jù)主體內(nèi)容選擇相應(yīng)的視頻合成模板對客戶端所發(fā)出的圖像進(jìn)行渲染,從而自動合成了新視頻。
[0038]為使本發(fā)明的上述目的、特征和優(yōu)點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細(xì)說明如下。
【附圖說明】
[0039]為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,應(yīng)當(dāng)理解,以下附圖僅示出了本發(fā)明的某些實施例,因此不應(yīng)被看作是對范圍的限定,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他相關(guān)的附圖。
[0040]圖1示出了本發(fā)明實施例所提供的一種基于語義分析將圖像合成新視頻的方法流程圖;
[0041]圖2示出了本發(fā)明實施例所提供的一種基于語義分析將圖像合成新視頻的細(xì)節(jié)流程圖
[0042]圖3示出了本發(fā)明實施例所提供的一種基于語義分析將圖像合成新視頻的系統(tǒng)結(jié)構(gòu)示意圖。
[0043]主要元件符號說明:
[0044]S101-S103為基于語義分析將圖像合成新視頻的方法步驟;
[0045]S1021-S1023為基于語義分析將圖像合成新視頻的細(xì)節(jié)流程步驟;