用于分布式轉(zhuǎn)碼的內(nèi)容自適應(yīng)組塊的制作方法
【專利摘要】公開用于轉(zhuǎn)碼視頻剪輯的系統(tǒng)和方法。在一個(gè)實(shí)施方式中,計(jì)算機(jī)系統(tǒng)確定要將視頻剪輯分為N+1個(gè)連續(xù)組塊的N個(gè)幀,其中N是正整數(shù),并且其中基于視頻剪輯的圖像內(nèi)容、最小組塊大小、以及最大組塊大小來確定幀。將N+1個(gè)組塊中的每個(gè)提供給用于轉(zhuǎn)碼的相應(yīng)的處理器,以及根據(jù)經(jīng)轉(zhuǎn)碼的N+1個(gè)組塊生成經(jīng)轉(zhuǎn)碼的視頻剪輯。
【專利說明】
用于分布式轉(zhuǎn)碼的內(nèi)容自適應(yīng)組塊
技術(shù)領(lǐng)域
[0001]本公開的方面和實(shí)施方式涉及數(shù)據(jù)處理,并且更具體地涉及數(shù)字內(nèi)容的轉(zhuǎn)碼。
【背景技術(shù)】
[0002]轉(zhuǎn)碼是一種編碼向另一種編碼的直接數(shù)字-數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換。在將視頻剪輯向客戶端機(jī)器(例如,臺式計(jì)算機(jī)、智能電話、平板計(jì)算機(jī)等等)遞送時(shí)經(jīng)常使用轉(zhuǎn)碼,以提供對各種屏幕分辨率、高寬比、文件格式、編解碼器等等的支持。
【發(fā)明內(nèi)容】
[0003]下面給出本公開的各種方面的簡化概括,以便提供對這些方面的基本理解。該概括并非所有設(shè)想的方面的廣泛概述,并且既不旨在識別關(guān)鍵或重要的元件,也不是要記述這樣的方面的范圍。其目的是按照簡化形式給出本公開的一些概念,作為下面要給出的更詳細(xì)描述的前序。
[0004]在本公開的方面中,計(jì)算機(jī)系統(tǒng)確定要將視頻剪輯分為N+1個(gè)連續(xù)組塊的N個(gè)幀,其中N是正整數(shù),并且其中基于視頻剪輯的圖像內(nèi)容、最小組塊大小以及最大組塊大小來確定幀。在一個(gè)實(shí)施方式中,將N+1個(gè)組塊中的每個(gè)提供給用于轉(zhuǎn)碼的相應(yīng)的處理器,并且然后通過經(jīng)轉(zhuǎn)碼的N+1個(gè)組塊生成經(jīng)轉(zhuǎn)碼的視頻剪輯。
【附圖說明】
[0005]根據(jù)下面給出的詳細(xì)描述以及根據(jù)本公開的各種方面的附圖和實(shí)施方式,能夠更完整地理解本公開的方面和實(shí)施方式,但是,本公開的實(shí)施方式不應(yīng)用于將本公開限于特定方面或?qū)嵤┓绞?,而是僅用于說明和理解。
[0006]圖1描繪說明性視頻剪輯的部分以及視頻剪輯的說明性固定大小和內(nèi)容自適應(yīng)組塊。
[0007]圖2圖示出根據(jù)本公開一個(gè)實(shí)施方式的示例性系統(tǒng)架構(gòu)。
[0008]圖3是轉(zhuǎn)碼管理器的一個(gè)實(shí)施方式的框圖。
[0009]圖4描繪用于視頻剪輯的分布式轉(zhuǎn)碼的方法的方面的流程圖。
[0010]圖5描繪用于依照其來確定將視頻分為組塊的邊界幀的方法的方面的流程圖。
[0011 ]圖6描繪根據(jù)本公開的方面和實(shí)施方式操作的說明性計(jì)算機(jī)系統(tǒng)的框圖。
【具體實(shí)施方式】
[0012]為了視頻剪輯的分布式轉(zhuǎn)碼而公開本公開的方面和實(shí)施方式。具體而言,本公開的實(shí)施方式能夠?qū)⒁曨l剪輯分為組塊,將組塊中的每個(gè)提供給相應(yīng)的處理器(例如,相應(yīng)的服務(wù)器的中央處理單元、多處理器計(jì)算機(jī)的相應(yīng)的處理器等等)用于轉(zhuǎn)碼,以及根據(jù)轉(zhuǎn)碼組塊生成經(jīng)轉(zhuǎn)碼的視頻剪輯。因?yàn)榭赏ㄟ^處理器將組塊并行轉(zhuǎn)碼,所以可以用單個(gè)處理器轉(zhuǎn)碼整個(gè)視頻剪輯所需時(shí)間的一小部分將視頻剪輯轉(zhuǎn)碼。
[0013]但是,由于這樣的策略所致的問題在于,組塊會(huì)在它們的視頻代碼化復(fù)雜度方面廣泛變化。更具體而言,當(dāng)跨越具有不同視頻代碼化復(fù)雜度的相鄰組塊來分割場景時(shí),在組塊邊界處結(jié)果會(huì)是不連續(xù)的,當(dāng)組塊邊界足夠大的時(shí)候,它對于經(jīng)轉(zhuǎn)碼的視頻剪輯的觀看者而言是可見的。例如,在相鄰組塊之間的量化步長大小中存在不連續(xù)性,當(dāng)它足夠大的時(shí)候,會(huì)導(dǎo)致在組塊邊界處峰值信噪比(PSNR)的可見的不連續(xù)性。
[0014]在使用組塊來轉(zhuǎn)碼視頻時(shí)的進(jìn)一步的問題來自于視頻壓縮的性質(zhì)。更具體而言,視頻壓縮利用不同類型的幀一一I幀以及非I幀,I幀包含完全指定的圖像,非I幀只存儲相鄰幀之間的變化(例如,被稱為P幀的預(yù)測圖片幀、被稱為B幀的雙預(yù)測圖片幀等等)。雖然組塊的首幀始終是I幀,但是組塊的末幀可以是I幀,也可以是非I幀。此外,I幀以及非I幀表現(xiàn)出不同的量化噪聲模式。因此,組塊的最末非I幀與下一個(gè)組塊的最初I幀之間的質(zhì)量差異會(huì)導(dǎo)致被稱為I脈沖的可見閃爍,特別是在較低比特率編碼方案中(例如,較低比特率H.264/MPEG-4編碼等等)。
[0015]本公開的實(shí)施方式可通過使用內(nèi)容自適應(yīng)算法來減輕組塊的這些固有問題。更具體而言,并非簡單地將視頻剪輯分為固定大小(或者接近固定大小)的組塊,本公開的實(shí)施方式基于視頻剪輯的圖像內(nèi)容(例如,視頻剪輯的幀的像素值、視頻剪輯的特征等等)、最小組塊大小、以及最大組塊大小來確定組塊邊界。這樣的途徑在組塊邊界處給出更少的偽象,從而為用戶帶來更好的觀看體驗(yàn)。
[0016]在本公開的一些實(shí)施方式中,基于視頻剪輯的圖像內(nèi)容確定組塊邊界包括識別視頻剪輯中的場景變化(例如,經(jīng)由對諸如淡入或淡出的效果的提取、經(jīng)由幀之間基于像素的差異、經(jīng)由幀之間基于柱狀圖的差異、經(jīng)由特征的統(tǒng)計(jì)分析等等)。通過識別場景變化,以及在可能的時(shí)候,將組塊邊界與場景變化對齊(align),縫合在一起的經(jīng)轉(zhuǎn)碼的視頻剪輯的質(zhì)量得到改善,同時(shí),在與場景變化一致時(shí),由于組塊所致的偽象對于觀看者而言通常不太明顯。
[0017]圖1描繪說明性視頻剪輯的部分,其包括按照(a)視頻剪輯的說明性固定大小組塊;以及(b)視頻剪輯的說明性內(nèi)容自適應(yīng)組塊來劃分的場景101-1至101-5。如圖1所示,當(dāng)兩種組塊途徑都產(chǎn)生了五個(gè)組塊邊界時(shí),與固定大小組塊相比,內(nèi)容自適應(yīng)組塊在場景內(nèi)出現(xiàn)的邊界更少,從而得到更高質(zhì)量的經(jīng)轉(zhuǎn)碼的視頻剪輯。
[0018]在一些實(shí)施方式中,除了最小組塊大小和最大組塊大小之外,組塊邊界的確定還基于默認(rèn)組塊大小。在一些這樣的實(shí)施方式中,默認(rèn)組塊大小大于或等于最小組塊大小,且小于或等于最大組塊大小。
[0019]在一些實(shí)施方式中,當(dāng)場景超過最大組塊大小時(shí),在組塊邊界處場景的分割可以基于圖像內(nèi)容。例如,組塊邊界可以基于場景中的獨(dú)立的幀的亮度的測量來確定(例如,在亮度的測量具有最小變化率的幀處分割場景等等),或者基于跨越場景的幀的運(yùn)動(dòng)的測量來確定(例如,在運(yùn)動(dòng)的測量具有最小變化率的幀處分割場景等等)。
[0020]根據(jù)一些實(shí)施方式,可以先將組塊解碼為中間的“通用”格式,然后從通用格式轉(zhuǎn)碼為目標(biāo)編碼。此外在一些實(shí)施方式中,可將視頻剪輯轉(zhuǎn)碼為多個(gè)不同的編碼(例如,
H.264/MPEG-4、MPEG-2等等)。在一些這樣的實(shí)施方式中,將每個(gè)組塊轉(zhuǎn)碼為多個(gè)不同的編碼,且通過組裝對應(yīng)的經(jīng)轉(zhuǎn)碼的組塊來生成用于每個(gè)編碼的經(jīng)轉(zhuǎn)碼的視頻剪輯(例如,通過由10^6-2編碼的組塊組裝10^6-2視頻剪輯、通過由!1.264/10^6-4編碼組塊組裝!1.264/MPEG-4視頻剪輯等等)。應(yīng)當(dāng)注意,在一些實(shí)施方式中,通用格式可以是未壓縮的,而在其他實(shí)施方式中,通用格式可以是壓縮的。
[0021]因此,本公開的方面和實(shí)施方式能夠提高經(jīng)由并行和分布式處理被轉(zhuǎn)碼的視頻剪輯的質(zhì)量。由于場景內(nèi)組塊邊界的減少、長場景的智能分割(例如,通過將落入這樣的場景內(nèi)的邊界處的亮度、運(yùn)動(dòng)等等的變化率最小化)、以及經(jīng)轉(zhuǎn)碼的視頻剪輯中I幀數(shù)量的總體減少,當(dāng)與簡單、固定大小的組塊策略相比時(shí),經(jīng)轉(zhuǎn)碼的視頻剪輯具有更少的明顯偽象。因此,本公開的方面和實(shí)施方式經(jīng)由分布式和并行處理提供將視頻剪輯轉(zhuǎn)碼的速度優(yōu)點(diǎn),同時(shí)減輕由于這樣的處理所致的質(zhì)量下降。
[0022]應(yīng)當(dāng)注意,雖然是在轉(zhuǎn)碼視頻剪輯的場境中公開方面和實(shí)施方式,但是本公開的技術(shù)也適合于轉(zhuǎn)碼其他類型的媒體項(xiàng)(例如,音頻剪輯、圖像等等)。例如,在視頻剪輯中場景變化的模擬可以是音頻剪輯中的靜默時(shí)間間隔。
[0023]圖2圖示出根據(jù)本公開一個(gè)實(shí)施方式的示例系統(tǒng)架構(gòu)200。系統(tǒng)架構(gòu)200包括服務(wù)器機(jī)器215、媒體儲存器220、web頁面儲存器230、客戶端機(jī)器202-1至202-M、以及連接到網(wǎng)絡(luò)204的轉(zhuǎn)碼服務(wù)器260-1至260-N,其中M和N是正整數(shù)。網(wǎng)絡(luò)204可以是公共網(wǎng)絡(luò)(例如,互聯(lián)網(wǎng))、專用網(wǎng)絡(luò)(例如,局域網(wǎng)(LAN)或廣域網(wǎng)(WAN))、或者它們的組合。
[0024]客戶端機(jī)器202-1至202-M可以是個(gè)人計(jì)算機(jī)(PC)、膝上型計(jì)算機(jī)、移動(dòng)電話、平板計(jì)算機(jī)、機(jī)頂盒、電視、視頻游戲機(jī)、數(shù)字助理或任何其他計(jì)算設(shè)備??蛻舳藱C(jī)器202-1至202-M可以運(yùn)行操作系統(tǒng)(未示出),所述操作系統(tǒng)管理客戶端機(jī)器202-1至202-M的硬件和軟件。瀏覽器(未示出)可以在一些客戶端機(jī)器上執(zhí)行(例如,在客戶端機(jī)器的OS上)。瀏覽器可以是web瀏覽器,所述web瀏覽器通過導(dǎo)航到內(nèi)容服務(wù)器240的web頁面(例如,使用超文本傳輸協(xié)議(HTTP))使得web瀏覽器可以訪問服務(wù)器機(jī)器215的內(nèi)容服務(wù)器240所供應(yīng)的內(nèi)容。瀏覽器可以向內(nèi)容服務(wù)器240發(fā)出命令和查詢,諸如上傳媒體項(xiàng)(例如,視頻剪輯、音頻剪輯、圖像等等)、搜索媒體項(xiàng)、共享媒體項(xiàng)等等的命令。
[0025]客戶端機(jī)器202-1至202-M中的一個(gè)或多個(gè)可包括與內(nèi)容服務(wù)器240所提供的服務(wù)相關(guān)聯(lián)的應(yīng)用??梢允褂眠@樣的應(yīng)用(app)的客戶端機(jī)器的示例包括移動(dòng)電話、“智能”電視、平板計(jì)算機(jī)等等。應(yīng)用或app可以在不訪問內(nèi)容服務(wù)器240的web頁面的情況下訪問由內(nèi)容服務(wù)器240所提供的內(nèi)容、向內(nèi)容服務(wù)器240發(fā)出命令等等。
[0026]通常,如果合適的話,在一個(gè)實(shí)施例中被描述為由內(nèi)容服務(wù)器240執(zhí)行的功能在其他實(shí)施例中也可以在客戶端機(jī)器202-1至202-M上被執(zhí)行。此外,歸因于特定組件的功能性也可由不同的組件或者一起操作的多個(gè)組件來執(zhí)行。內(nèi)容服務(wù)器240也可通過適當(dāng)?shù)膽?yīng)用編程接口,作為向其他系統(tǒng)或設(shè)備所提供的服務(wù)被訪問,并因此不限于在網(wǎng)站中使用。
[0027]服務(wù)器機(jī)器215可以是機(jī)架服務(wù)器、路由器計(jì)算機(jī)、個(gè)人計(jì)算機(jī)、便攜式數(shù)字助理、移動(dòng)電話、膝上型計(jì)算機(jī)、平板計(jì)算機(jī)、照相機(jī)、攝像機(jī)、上網(wǎng)本、臺式計(jì)算機(jī)、媒體中心、或上述的任何組合。服務(wù)器機(jī)器215包括內(nèi)容服務(wù)器240和轉(zhuǎn)碼管理器250。在替選的實(shí)施例中,內(nèi)容服務(wù)器240和轉(zhuǎn)碼管理器250可以在不同的機(jī)器上運(yùn)行。
[0028]媒體儲存器220是持久儲存器,其能夠存儲媒體項(xiàng)(例如,視頻剪輯、音頻剪輯、圖像等等)以及數(shù)據(jù)結(jié)構(gòu),以標(biāo)記、組織和索引媒體項(xiàng)。媒體儲存器220可由一個(gè)或多個(gè)儲存器設(shè)備托管,諸如主存儲器、基于磁或光儲存器的盤、磁帶或硬盤驅(qū)動(dòng)、NAS、SAN等等。在一些實(shí)施方式中,媒體儲存器220可以是附接網(wǎng)絡(luò)的文件服務(wù)器,而在其他實(shí)施例中,媒體儲存器220可以是諸如面向?qū)ο蟮臄?shù)據(jù)庫、關(guān)系數(shù)據(jù)庫等等的一些其他類型的持久儲存器,它們可由服務(wù)器機(jī)器215或者經(jīng)由網(wǎng)絡(luò)204被耦合到服務(wù)器機(jī)器215的一個(gè)或多個(gè)不同機(jī)器托管。媒體儲存器220中存儲的媒體項(xiàng)可包括用戶生成的媒體項(xiàng)(由客戶端機(jī)器上傳)、以及來自服務(wù)提供者的媒體項(xiàng)(例如,新聞機(jī)構(gòu)、出版商、圖書館等等)。在一些實(shí)施方式中,媒體儲存器220可由第三方服務(wù)提供,而在一些其他實(shí)施方式中,媒體儲存器220可由維護(hù)服務(wù)器機(jī)器215的相同實(shí)體維護(hù)。
[0029]web頁面儲存器230是持久儲存器,其能夠存儲向客戶端供應(yīng)的web頁面和/或移動(dòng)app文檔以及以標(biāo)記、組織和索引web頁面和/或移動(dòng)app文檔(例如,提供給移動(dòng)app,用于在移動(dòng)設(shè)備上呈現(xiàn)的文檔)的數(shù)據(jù)結(jié)構(gòu)。web頁面儲存器230可以由一個(gè)或多個(gè)儲存器設(shè)備托管,諸如主存儲器、基于磁或光儲存器的盤、磁帶或硬盤驅(qū)動(dòng)器、NAS、SAN等等。在一些實(shí)施方式中,web頁面儲存器230可以是附接網(wǎng)絡(luò)的文件服務(wù)器,而在其他實(shí)施例中,web頁面儲存器230可以是諸如面向?qū)ο蟮臄?shù)據(jù)庫、關(guān)系數(shù)據(jù)庫等等的一些其他類型的持久儲存器,它們可由服務(wù)器機(jī)器215或者經(jīng)由網(wǎng)絡(luò)204被耦合到服務(wù)器機(jī)器215的一個(gè)或多個(gè)不同機(jī)器托管。web頁面儲存器230中存儲的web頁面和/或移動(dòng)app文檔可具有由用戶生成并由客戶端機(jī)器上傳、由新聞機(jī)構(gòu)提供等等的嵌入式內(nèi)容(例如,媒體儲存器220中存儲的媒體項(xiàng)、互聯(lián)網(wǎng)上其他地方存儲的媒體項(xiàng)等等)。
[0030]根據(jù)一些實(shí)施方式,轉(zhuǎn)碼管理器250能夠?qū)⑸蟼鞯拿襟w項(xiàng)存儲在媒體儲存器220中,在媒體儲存器220中索引媒體項(xiàng),如下關(guān)于圖3至圖5所述的轉(zhuǎn)碼媒體項(xiàng),以及執(zhí)行圖像、視頻和音頻處理(例如,濾波、抗混疊、線性檢測、場景變化檢測、特征提取等等)。下面關(guān)于圖3詳細(xì)描述轉(zhuǎn)碼管理器250的實(shí)施方式。
[0031]轉(zhuǎn)碼服務(wù)器260-1至260-N中的每個(gè)是包括存儲器以及一個(gè)或多個(gè)處理器的機(jī)器,且能夠經(jīng)由網(wǎng)絡(luò)204接收來自服務(wù)器機(jī)器215的一個(gè)或多個(gè)組塊,將組塊轉(zhuǎn)碼為一個(gè)或多個(gè)編碼,以及經(jīng)由網(wǎng)絡(luò)204將經(jīng)轉(zhuǎn)碼的組塊傳傳送回服務(wù)器機(jī)器。應(yīng)當(dāng)注意,在一些替選的實(shí)施方式中,可經(jīng)由除了網(wǎng)絡(luò)204之外的網(wǎng)絡(luò)(例如,局域網(wǎng)、私有城域網(wǎng)或廣域網(wǎng)等等)將轉(zhuǎn)碼服務(wù)器260-1至260-N連接到服務(wù)器機(jī)器215。此外應(yīng)當(dāng)注意,其他實(shí)施方式可以采用并行多處理器機(jī)器來代替轉(zhuǎn)碼服務(wù)器260-1至260-N,并且一些這樣的實(shí)施方式可以使用并行多處理器機(jī)器來執(zhí)行服務(wù)器機(jī)器215的一些或全部功能。
[0032]圖3是轉(zhuǎn)碼管理器的一個(gè)實(shí)施方式的框圖。轉(zhuǎn)碼管理器300可以與圖2的轉(zhuǎn)碼管理器250相同,并且可包括解復(fù)用器/復(fù)用器302、場景變化識別引擎304、組塊邊界判定引擎306、分割器/組裝器308、控制器309、以及數(shù)據(jù)儲存器310。根據(jù)特定實(shí)施方式,可將這些組件組合在一起,或者分離為進(jìn)一步的組件。應(yīng)當(dāng)注意,在一些實(shí)施方式中,轉(zhuǎn)碼管理器300的各種組件可以在分離的機(jī)器上運(yùn)行。
[0033]數(shù)據(jù)儲存器310可以與媒體儲存器220相同,或者與web頁面儲存器230相同,或者與這兩者相同,或者可以是不同的數(shù)據(jù)儲存器(例如,臨時(shí)緩沖器或永久數(shù)據(jù)儲存器),以保存一個(gè)或多個(gè)媒體項(xiàng)(例如,被存儲在媒體儲存器220中,要被嵌入在web頁面中,要被處理等等)、媒體項(xiàng)中的一個(gè)或多個(gè)組塊、在媒體儲存器220中用于索引媒體項(xiàng)的一個(gè)或多個(gè)數(shù)據(jù)結(jié)構(gòu)、(例如,要存儲在web頁面儲存器230中,要被供應(yīng)給客戶端等等的)一個(gè)或多個(gè)web頁面、在web頁面儲存器230中用于索引web頁面的一個(gè)或多個(gè)數(shù)據(jù)結(jié)構(gòu)、或者這些數(shù)據(jù)的一些組合。數(shù)據(jù)儲存器310可以由一個(gè)或多個(gè)儲存器設(shè)備托管,諸如主存儲器、基于磁或光儲存器的盤、磁帶或硬盤驅(qū)動(dòng)器等等。
[0034]解復(fù)用器/復(fù)用器302能夠?qū)⒁曨l剪輯的視頻部分和音頻部分分離,以及能夠?qū)⒁曨l數(shù)據(jù)和音頻數(shù)據(jù)組合進(jìn)視頻剪輯內(nèi)。下面關(guān)于圖4更詳細(xì)地描述解復(fù)用器/復(fù)用器302的一些操作。
[0035]場景變化識別引擎304能夠識別視頻剪輯中的場景變化(例如,經(jīng)由對諸如淡入或淡出的效果的提取、經(jīng)由幀之間基于像素的差異、經(jīng)由幀之間基于柱狀圖的差異、經(jīng)由特征的統(tǒng)計(jì)分析等等)。下面關(guān)于圖5更詳細(xì)地描述場景變化識別引擎304的一些操作。
[0036]組塊邊界判定引擎306能夠確定將視頻剪輯分為連續(xù)組塊所依照的視頻剪輯的幀。在一個(gè)方面中,組塊邊界判定引擎306基于視頻剪輯的圖像內(nèi)容、最小組塊大小、以及最大組塊大小來確定組塊邊界幀。在一個(gè)實(shí)施方式中,除了最小組塊大小和最大組塊大小之夕卜,組塊邊界幀的確定還基于視頻剪輯中的場景變化以及默認(rèn)組塊大小。下面關(guān)于圖4和圖5更詳細(xì)地描述組塊邊界判定引擎306的一些操作。
[0037]分割器/組裝器308能夠根據(jù)組塊邊界幀的集合將視頻剪輯分割為連續(xù)組塊,以及將組塊組合進(jìn)視頻剪輯內(nèi)??刂破?09能夠?qū)⒔M塊提供給相應(yīng)的轉(zhuǎn)碼服務(wù)器260用于轉(zhuǎn)碼,以及從轉(zhuǎn)碼服務(wù)器260接收經(jīng)轉(zhuǎn)碼的組塊。在一些實(shí)施方式中,控制器309可包含用于將組塊分配給特定轉(zhuǎn)碼服務(wù)器的邏輯(例如,負(fù)載平衡邏輯等等)。下面關(guān)于圖4和圖5更詳細(xì)地描述分割器/組裝器308和控制器309的一些操作。
[0038]圖4描繪用于將視頻剪輯分為用于分布式轉(zhuǎn)碼的組塊的方法的方面的流程圖。圖4描繪用于視頻剪輯的分布式轉(zhuǎn)碼的方法的方面的流程圖。所述方法通過處理邏輯來執(zhí)行,所述處理邏輯可包括硬件(電路、專用邏輯等等)、軟件(諸如,在通用計(jì)算機(jī)系統(tǒng)或?qū)S脵C(jī)器上運(yùn)行的軟件)、或兩者的組合。在一個(gè)實(shí)施方式中,所述方法通過圖2的服務(wù)器機(jī)器215來執(zhí)行,而在一些其他實(shí)施方式中,圖4的一個(gè)或多個(gè)塊可通過另一個(gè)機(jī)器來執(zhí)行。
[0039]為了簡化說明,將方法描繪并描述為一系列動(dòng)作。但是,根據(jù)本公開的動(dòng)作可以按照多種順序出現(xiàn)和/或同時(shí)出現(xiàn),并且在本文中不呈現(xiàn)和描述其他動(dòng)作。另外,不要求所有圖示出的動(dòng)作來實(shí)現(xiàn)根據(jù)所公開的主題內(nèi)容的方法。此外,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,可經(jīng)由狀態(tài)圖或事件將所述方法替選地表現(xiàn)為一系列相關(guān)的狀態(tài)。此外,應(yīng)當(dāng)理解,本說明書中公開的方法能夠被存儲在制品中,以促進(jìn)將這些方法運(yùn)輸和傳遞到計(jì)算設(shè)備。如同本文所使用的,術(shù)語制品旨在涵蓋可通過任何計(jì)算機(jī)可讀設(shè)備或存儲介質(zhì)訪問的計(jì)算機(jī)程序。
[0040]在塊401處,接收用戶上傳的視頻剪輯,并且在塊402處,將視頻剪輯存儲在媒體儲存器220中。根據(jù)一個(gè)方面,由內(nèi)容服務(wù)器240來執(zhí)行塊401和塊402。
[0041]在塊403處,將視頻剪輯的視頻部分和音頻部分分離。根據(jù)一個(gè)方面,由轉(zhuǎn)碼管理器250的解復(fù)用器/復(fù)用器302來執(zhí)行塊403。
[0042]在一些實(shí)施方式中,可以先將視頻剪輯的視頻部分解碼為中間“通用”格式,下面在塊406至塊408處可以通過“通用”格式獲得一個(gè)或多個(gè)目標(biāo)編碼。在一些這樣的實(shí)施方式中,通用格式可以是未壓縮的,而在一些其他實(shí)施方式中,通用格式可以是壓縮的。應(yīng)當(dāng)注意,在一些方面中,解碼為通用格式可以作為塊403的一部分被執(zhí)行,而在一些其他方面中,解碼可以替代性地在圖4的方法的一些其他點(diǎn)處出現(xiàn)(例如,在圖4中未描繪的單獨(dú)的塊,作為另一個(gè)塊的一部分,諸如塊404至塊410的其中一個(gè)塊,等等),或者在圖5的方法中的一些點(diǎn)處出現(xiàn),圖5的方法由轉(zhuǎn)碼服務(wù)器260執(zhí)行并在下文描述。
[0043]在塊404處,基于視頻剪輯的圖像內(nèi)容、最小組塊大小、以及最大組塊大小來確定用于將視頻部分分為組塊的組塊邊界幀。下面關(guān)于圖5詳細(xì)描述用于執(zhí)行塊404的方法的實(shí)施方式。
[0044]在塊405處,根據(jù)在塊404處確定的組塊邊界幀將視頻剪輯分割為連續(xù)組塊。根據(jù)一個(gè)方面,由轉(zhuǎn)碼管理器250的分割器/組裝器308來執(zhí)行塊405。應(yīng)當(dāng)注意,當(dāng)視頻剪輯已經(jīng)被解碼為中間“通用”格式時(shí),組塊可通過將通用格式視頻分割為通用格式組塊來獲得。
[0045]在塊406處,將組塊提供給轉(zhuǎn)碼服務(wù)器260(例如,將第一組塊提供給轉(zhuǎn)碼服務(wù)器260-1,將第二組塊提供給轉(zhuǎn)碼服務(wù)器260-2等等)用于轉(zhuǎn)碼。根據(jù)一個(gè)方面,通過轉(zhuǎn)碼管理器250的控制器309來執(zhí)行塊406。在一些實(shí)施方式中,控制器309可包含按照智能方式將組塊分配給特定轉(zhuǎn)碼服務(wù)器的邏輯(例如,負(fù)載平衡邏輯等等)。
[0046]在塊407處,從轉(zhuǎn)碼服務(wù)器260接收經(jīng)轉(zhuǎn)碼的組塊。根據(jù)一個(gè)方面,通過控制器309來執(zhí)行塊407。根據(jù)一些實(shí)施方式,由多個(gè)轉(zhuǎn)碼服務(wù)器260并行地轉(zhuǎn)碼組塊,并且一旦轉(zhuǎn)碼完成,每個(gè)轉(zhuǎn)碼服務(wù)器將它的經(jīng)轉(zhuǎn)碼的組塊提供給控制器309。應(yīng)當(dāng)注意,在一些實(shí)施方式中,轉(zhuǎn)碼服務(wù)器260可直接地或者經(jīng)由中間通用格式將每個(gè)組塊轉(zhuǎn)碼為多個(gè)不同的編碼(例如,
H.264/MPEG-4、MPEG-2等等),并將多個(gè)經(jīng)轉(zhuǎn)碼的組塊提供給控制器309。應(yīng)當(dāng)進(jìn)一步注意,在一些替選的實(shí)施方式中,轉(zhuǎn)碼服務(wù)器260還可以負(fù)責(zé)將組塊解碼為通用格式,而不是如上所述,在分割為組塊之前將整個(gè)視頻剪輯解碼為通用格式。
[0047]在塊408處,根據(jù)經(jīng)轉(zhuǎn)碼的組塊生成一個(gè)或多個(gè)經(jīng)轉(zhuǎn)碼的視頻。更具體而言,在將組塊轉(zhuǎn)碼為單個(gè)編碼時(shí),根據(jù)經(jīng)轉(zhuǎn)碼的組塊生成單個(gè)經(jīng)轉(zhuǎn)碼的視頻;在將組塊轉(zhuǎn)碼為多個(gè)編碼時(shí)(例如,通用格式、MPEG-2、H.264/MPEG-4等等),可通過組裝被轉(zhuǎn)碼為第一編碼的組塊來生成第一經(jīng)轉(zhuǎn)碼的視頻,通過組裝被轉(zhuǎn)碼為第二編碼的組塊來生成第二經(jīng)轉(zhuǎn)碼的視頻,等等。根據(jù)一個(gè)方面,由控制器309來執(zhí)行塊408。
[0048]在塊409處,根據(jù)在塊408處生成的每個(gè)經(jīng)轉(zhuǎn)碼的視頻以及根據(jù)在塊403獲得的音頻來生成相應(yīng)的視頻剪輯。換言之,在單個(gè)編碼的情況下,根據(jù)音頻以及在塊408處生成的經(jīng)轉(zhuǎn)碼的視頻來生成單個(gè)經(jīng)轉(zhuǎn)碼的視頻剪輯,而在多個(gè)編碼的情況下,根據(jù)音頻以及在塊408處生成的第一經(jīng)轉(zhuǎn)碼的視頻來生成第一經(jīng)轉(zhuǎn)碼的視頻剪輯,根據(jù)音頻以及在塊408處生成的第二經(jīng)轉(zhuǎn)碼的視頻來生成第二經(jīng)轉(zhuǎn)碼的視頻剪輯,等等。根據(jù)一個(gè)方面,由轉(zhuǎn)碼管理器250的解復(fù)用器/復(fù)用器302來執(zhí)行塊409。
[0049]在塊410處,將在塊409處生成的一個(gè)或多個(gè)經(jīng)轉(zhuǎn)碼的視頻剪輯存儲在媒體儲存器220中。應(yīng)當(dāng)注意,當(dāng)視頻剪輯已經(jīng)被解碼為通用格式時(shí),也可將視頻剪輯的該版本存儲在媒體儲存器220中。在一些實(shí)施方式中,可以在塊410處將通用格式視頻剪輯存儲在媒體儲存器220中,而在一些其他實(shí)施方式中,可以在該方法的更早時(shí)間點(diǎn)將通用格式視頻剪輯存儲在媒體儲存器220中(例如,緊接著在上述塊403處解碼為通用格式等等)ο根據(jù)一個(gè)方面,由控制器309來執(zhí)行塊410。
[0050]應(yīng)當(dāng)注意,雖然在圖4的流程圖中由用戶來上傳要轉(zhuǎn)碼的視頻剪輯,但是在一些其他實(shí)施方式中,可通過一些其他方式來獲得要轉(zhuǎn)碼的視頻剪輯,或者,要轉(zhuǎn)碼的視頻剪輯已經(jīng)存儲在媒體儲存器220中(例如,媒體公司所提供的視頻庫等等)。應(yīng)當(dāng)進(jìn)一步注意,雖然在圖4的流程圖中當(dāng)服務(wù)器機(jī)器215接收到每個(gè)上傳的視頻剪輯時(shí)將其轉(zhuǎn)碼,但是在一些其他實(shí)施方式中,上傳的視頻剪輯的轉(zhuǎn)碼可以替代性地在以后的時(shí)間出現(xiàn)(例如,夜間執(zhí)行的批量作業(yè)等等)。
[0051]圖5描繪用于確定要將視頻分為組塊的邊界幀的方法的方面的流程圖。所述方法由處理邏輯執(zhí)行,所述處理邏輯可包括硬件(電路、專用邏輯等等)、軟件(諸如,在通用計(jì)算機(jī)系統(tǒng)或?qū)S脵C(jī)器上運(yùn)行的軟件)、或兩者的組合。在一個(gè)實(shí)施方式中,所述方法通過圖2的服務(wù)器機(jī)器215執(zhí)行,而在一些其他實(shí)施方式中,圖5的一個(gè)或多個(gè)塊可通過另一個(gè)機(jī)器來執(zhí)行。根據(jù)一個(gè)方面,由控制器309來執(zhí)行塊501。
[0052]在塊501處,識別視頻中的一個(gè)或多個(gè)場景變化。在一些實(shí)施方式中,場景變化識別可包括對諸如淡入或淡出的效果的提取,而在一些其他實(shí)施方式中,場景變化識別可包括計(jì)算連續(xù)幀之間像素值的差異并且將所述差異的函數(shù)(例如,對于所有像素差異的總和等等)與閾值相比較,而在一些其他實(shí)施方式中,場景變化識別可包括構(gòu)造幀中像素值的柱狀圖,對于連續(xù)幀計(jì)算柱狀圖之間的差異,并且將這些差異的函數(shù)(例如,對應(yīng)的柱狀圖直條之間差異的總和等等)與閾值相比較,而在其他實(shí)施方式中,場景變化識別可包括對從幀提取的特征的統(tǒng)計(jì)分析,而在其他實(shí)施方式中,可通過一些其他方式來識別場景變化。根據(jù)一個(gè)方面,由轉(zhuǎn)碼管理器250的場景變化識別引擎304來執(zhí)行塊501。
[0053]在塊502處,將變量S初始化為空集,并且在塊503處,將變量chunkStart初始化為零。在塊504處,將變量chunkEnd的值設(shè)置為chunkStart與默認(rèn)組塊大小(defaultChunkSize)的和。在一些實(shí)施方式中,默認(rèn)組塊大小可以處在最小組塊大小與最大組塊大小之間,含最小組塊大小和最大組塊大小(即,大于或等于最小組塊大小且小于或等于最大組塊大小)。
[0054]在塊505處,將變量P設(shè)置為chunkEnd前面第一場景變化的幀的索引,并將變量q設(shè)置為chunkEnd后面第一場景變化的幀的索引。塊506將(q-chunkStart)與最大組塊大小maxChunkSize相比較;如果(q-chunkStart)小于或等于maxChunkSize,則執(zhí)行繼續(xù)進(jìn)行到塊507,否則執(zhí)行在塊508處繼續(xù)。
[0055]在塊507處,將變量chunkEnd的值設(shè)置為變量q的值。執(zhí)行塊507之后,執(zhí)行在塊510處繼續(xù)。
[0056]塊508將(p-chunkStart)與最小組塊大小minChunkSize相比較;如果(p-chunkStart)大于或等于minChunkSize,則執(zhí)行繼續(xù)進(jìn)行到塊509,否則執(zhí)行在塊510處繼續(xù)。
[0057]在塊509處,將變量chunkEnd的值設(shè)置為變量P的值。在塊510,將與組塊邊界幀相對應(yīng)的chunkEnd的值添加到集合S。
[0058]塊511基于變量chunkEnd是否等于視頻的末幀的索引來分岔;如果不等于,則執(zhí)行在塊512處繼續(xù),否則執(zhí)行繼續(xù)進(jìn)行到塊513。在塊512處,將變量chunkStart的值設(shè)置為chunkEnd+Ι,并且在執(zhí)行塊512之后,執(zhí)行回到塊504處繼續(xù)。在塊513處,將包含組塊邊界幀的指數(shù)的集合S返回。
[0059]應(yīng)當(dāng)注意,雖然在圖5的實(shí)施方式中將組塊邊界幀限定為組塊的末幀,但是通過對圖5的方法進(jìn)行適當(dāng)?shù)淖兓?,在一些其他?shí)施方式中,可將組塊邊界幀替代性地限定為組塊的首幀。此外,在一些其他實(shí)施方式中,組塊邊界幀的確定可以基于最小組塊大小和最大組塊大小,但是除了最小大小和最大大小之外,不基于默認(rèn)組塊大小。
[0060]應(yīng)當(dāng)進(jìn)一步注意,在一些其他實(shí)施方式中,可將圖5的實(shí)施方式修改為處理場景超過最大組塊大小的情況。在一些這樣的實(shí)施方式中,在組塊邊界處對場景的分割可以基于圖像內(nèi)容;例如,可以基于對場景的獨(dú)立幀的亮度的測量來確定組塊邊界(例如,在亮度的測量具有最小變化率的幀處分割場景等等),或者基于跨越場景的幀的運(yùn)動(dòng)的測量來確定組塊邊界(例如,在運(yùn)動(dòng)的測量具有最小變化率的幀處分割場景等等),或者基于以上兩者,而在其他實(shí)施例中,可以基于根據(jù)場景中幀的像素值所獲得的一些其他信息來確定超過最大大小的場景的邊界。
[0061]應(yīng)當(dāng)進(jìn)一步注意,雖然是在轉(zhuǎn)碼視頻剪輯的場境中公開圖4和圖5的實(shí)施方式,但是在這些實(shí)施方式中采用的技術(shù)可以容易地適合于轉(zhuǎn)碼其他類型的媒體項(xiàng)(例如,音頻剪輯、圖像等等)。例如,在音頻剪輯中幀的模擬可以是脈沖代碼調(diào)制(PCM)的聲音樣本,而視頻中場景變化的模擬可以是音頻剪輯中的靜默時(shí)間間隔。
[0062]圖6示出示例性計(jì)算機(jī)系統(tǒng),其中可以執(zhí)行指令集,用于致使機(jī)器執(zhí)行本文討論的方法論中的任何一個(gè)或多個(gè)。在替選的實(shí)施方式中,可以在LAN、內(nèi)聯(lián)網(wǎng)、外聯(lián)網(wǎng)或互聯(lián)網(wǎng)中將機(jī)器連接(例如,聯(lián)網(wǎng))到其他機(jī)器。機(jī)器可以在客戶端-服務(wù)器網(wǎng)絡(luò)環(huán)境中作為服務(wù)器機(jī)器操作。機(jī)器可以是個(gè)人計(jì)算機(jī)(PC)、機(jī)頂盒(STB)、服務(wù)器、網(wǎng)絡(luò)路由器、開關(guān)或網(wǎng)橋,或者是能夠執(zhí)行指定將要由機(jī)器采取的動(dòng)作的指令集(按順序或相反)的任何機(jī)器。進(jìn)一步地,雖然僅圖示出單個(gè)機(jī)器,但是術(shù)語“機(jī)器”可用于包括獨(dú)立或聯(lián)合執(zhí)行指令集(或多個(gè)集),以執(zhí)行本文討論的方法論的任何一個(gè)或多個(gè)的機(jī)器的任何集合。
[0063]示例性計(jì)算機(jī)系統(tǒng)600包括處理系統(tǒng)(處理器)602、主存儲器604(例如,只讀存儲器(ROM)、閃速存儲器、動(dòng)態(tài)隨機(jī)存取存儲器(DRAM)(諸如,同步DRAM(SDRAM))、靜態(tài)存儲器606(例如,閃速存儲器、靜態(tài)隨機(jī)存取存儲器(SRAM))、以及數(shù)據(jù)儲存器設(shè)備616,它們經(jīng)由總線608相互通信。
[0064]處理器602表示諸如微處理器、中央處理單元等等的一個(gè)或多個(gè)通用處理設(shè)備。更具體而言,處理器602可以是復(fù)雜指令集計(jì)算(CISC)微處理器、精簡指令集計(jì)算(RISC)微處理器、超長指令字(VLIW)微處理器、或者實(shí)現(xiàn)其他指令集的處理器、或者實(shí)現(xiàn)指令集組合的處理器。處理器602也可以是一個(gè)或多個(gè)專用處理設(shè)備,諸如,專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、數(shù)字信號處理器(DSP)、網(wǎng)絡(luò)處理器等等。處理器602被配置為執(zhí)行用于執(zhí)行本文討論的操作和步驟的指令626,。
[0065]計(jì)算機(jī)系統(tǒng)600可進(jìn)一步包括網(wǎng)絡(luò)接口設(shè)備622。計(jì)算機(jī)系統(tǒng)600可包括視頻顯示單元610(例如,液晶顯示器(IXD)或陰極射線管(CRT))、字母數(shù)字輸入設(shè)備612(例如,鍵盤)、光標(biāo)控制設(shè)備614(例如,鼠標(biāo))、以及信號生成設(shè)備620(例如,揚(yáng)聲器)。
[0066]數(shù)據(jù)儲存器設(shè)備616可包括計(jì)算機(jī)可讀介質(zhì)624,上面存儲具體實(shí)施本文所述方法論或功能中的任何一個(gè)或多個(gè)的一個(gè)或多個(gè)指令集626(例如,由轉(zhuǎn)碼管理器225執(zhí)行的指令等等)。在由計(jì)算機(jī)系統(tǒng)600執(zhí)行期間,指令626可以完全或者至少部分地駐留在主存儲器604和/或處理器602內(nèi),主存儲器604和處理器602也構(gòu)成計(jì)算機(jī)可讀介質(zhì)。此外,可經(jīng)由網(wǎng)絡(luò)接口設(shè)備622通過網(wǎng)絡(luò)進(jìn)一步傳送或接收指令626。
[0067]雖然在示例性實(shí)施例中將計(jì)算機(jī)可讀存儲介質(zhì)624示出為單個(gè)介質(zhì),但是術(shù)語“計(jì)算機(jī)可讀存儲介質(zhì)”應(yīng)當(dāng)用于包括存儲一個(gè)或多個(gè)指令集的單個(gè)介質(zhì)或多個(gè)介質(zhì)(例如,集中式或分布式數(shù)據(jù)庫和/或相關(guān)聯(lián)的高速緩存和服務(wù)器)。術(shù)語“計(jì)算機(jī)可讀存儲介質(zhì)”應(yīng)當(dāng)用于包括能夠存儲、編碼或承載通過機(jī)器執(zhí)行并致使機(jī)器執(zhí)行本公開的方法論中的任何一個(gè)或多個(gè)的指令集的任何介質(zhì)。因此,術(shù)語“計(jì)算機(jī)可讀存儲介質(zhì)”應(yīng)當(dāng)用于包括但不限于固態(tài)存儲器、光介質(zhì)以及磁介質(zhì)。
[0068]在以上描述中給出多個(gè)細(xì)節(jié)。但是對于得益于本公開的本領(lǐng)域技術(shù)人員而言顯而易見的是,沒有這些具體細(xì)節(jié)也可以實(shí)踐實(shí)施例。在一些實(shí)例中,按照框圖的形式而不是通過細(xì)節(jié)示出公知的結(jié)構(gòu)和設(shè)備,以免混淆描述。
[0069]說明書有些部分按照對于計(jì)算機(jī)存儲器中的數(shù)據(jù)比特的操作的算法和符號表示來呈現(xiàn)。這些算法描述和表示是數(shù)據(jù)處理領(lǐng)域的普通技術(shù)人員用來將他們工作的實(shí)質(zhì)最有效地傳達(dá)給其他技術(shù)人員的手段。在此通常將算法視為帶來期望結(jié)果的步驟的自洽序列。步驟是要求對物理量的物理操縱的步驟。通常,雖然并非必要,但是這些量采取能夠被存儲、傳遞、組合、比較或操縱的電信號或磁信號的形式。在原理上由于公共使用的原因,已經(jīng)證明將這些信號稱為比特、值、元素、符號、字符、術(shù)語、數(shù)字等等有時(shí)候是方便的。
[0070]但是應(yīng)當(dāng)牢記,所有這些術(shù)語和類似術(shù)語都與適當(dāng)?shù)奈锢砹肯嚓P(guān)聯(lián),并且僅僅是應(yīng)用于這些量的方便標(biāo)簽。除非從以上討論明確另外聲明,應(yīng)當(dāng)理解在整個(gè)說明書中,利用諸如“確定”、“提供”、“生成”等術(shù)語的討論來指計(jì)算機(jī)系統(tǒng)或類似電子計(jì)算設(shè)備的動(dòng)作和處理,計(jì)算機(jī)系統(tǒng)操縱在計(jì)算機(jī)系統(tǒng)的寄存器和存儲器內(nèi)被表示為物理(例如,電子)量的數(shù)據(jù)并將其變換成類似地被表示為計(jì)算機(jī)系統(tǒng)存儲器或寄存器或其他這樣的信息儲存器、傳輸或顯示設(shè)備中的物理量的其他數(shù)據(jù)。
[0071]此外,本公開的方面和實(shí)施方式涉及用于執(zhí)行本文中的操作的裝置。該裝置可以專門為所需目的而構(gòu)造,或者它可以包括通過計(jì)算機(jī)中存儲的計(jì)算機(jī)程序選擇性被激活或重新配置的通用計(jì)算機(jī)。這樣的計(jì)算機(jī)程序可以被存儲在計(jì)算機(jī)可讀存儲介質(zhì)中,諸如但不限于任何類型的磁盤,包括軟盤、光盤、⑶-R0M、以及磁光盤、只讀存儲器(R0M)、隨機(jī)存取存儲器(RAM)、EPR0M、EEPR0M、磁存儲卡或光存儲卡、或者適合于存儲電子指令的任何類型介質(zhì)。
[0072]本文給出的算法和顯示并不內(nèi)在地涉及任何特定的計(jì)算機(jī)或其他裝置。根據(jù)本文的教導(dǎo),可通過程序使用各種通用系統(tǒng),或者可以證明,構(gòu)造更加專用的裝置來執(zhí)行所需的方法步驟是方便的。對于多種這些系統(tǒng)而言所需的結(jié)構(gòu)將從以下描述出現(xiàn)。此外,本公開并非參照任何特定的編程語言來描述。應(yīng)當(dāng)理解,可以使用各種編程語言來實(shí)現(xiàn)本文所述本公開的教導(dǎo)。
[0073]應(yīng)當(dāng)理解,以上描述目的是說明性而非限制性的。通過閱讀和理解以上描述,對于本領(lǐng)域技術(shù)人員而言很多其他實(shí)施例將顯而易見。此外,作為替代或者除了媒體剪輯之外,可將上述技術(shù)應(yīng)用于其他類型的數(shù)據(jù)(例如,圖像、音頻剪輯、文本文檔、web頁面等等)。因此,應(yīng)當(dāng)參照所附權(quán)利要求,連同賦予這些權(quán)利要求的等同物的完整范圍一起來確定本公開的范圍。
【主權(quán)項(xiàng)】
1.一種將視頻剪輯轉(zhuǎn)碼的方法,所述方法包括: 由計(jì)算機(jī)系統(tǒng)確定要將所述視頻剪輯分為N+1個(gè)連續(xù)組塊的所述視頻剪輯的N個(gè)幀,其中N是正整數(shù),并且其中所述確定是基于所述視頻剪輯的圖像內(nèi)容、最小組塊大小、以及最大組塊大小; 將所述N+1個(gè)組塊中的每個(gè)提供給相應(yīng)處理器,用于轉(zhuǎn)碼;以及 根據(jù)經(jīng)轉(zhuǎn)碼的N+1個(gè)組塊,生成經(jīng)轉(zhuǎn)碼的視頻剪輯。2.根據(jù)權(quán)利要求1所述的方法,其中確定N個(gè)幀進(jìn)一步基于默認(rèn)組塊大小,所述默認(rèn)組塊大小大于或等于所述最小組塊大小,且小于或等于所述最大組塊大小。3.根據(jù)權(quán)利要求1所述的方法,其中所述N個(gè)幀中的至少一個(gè)是基于所述視頻剪輯中的場景變化來確定的。4.根據(jù)權(quán)利要求3所述的方法,進(jìn)一步包括:識別所述視頻剪輯中的一個(gè)或多個(gè)場景變化。5.根據(jù)權(quán)利要求1所述的方法,其中所述相應(yīng)處理器中的每個(gè)處理器與相應(yīng)計(jì)算機(jī)系統(tǒng)相關(guān)聯(lián)。6.根據(jù)權(quán)利要求1所述的方法,其中所述視頻剪輯包括超過所述最大組塊大小的場景,并且其中,所述場景內(nèi)的幀是基于對于所述場景中的至少兩個(gè)幀的亮度的測量來確定的。7.根據(jù)權(quán)利要求6所述的方法,其中所述幀出現(xiàn)在所述場景中所述亮度的測量具有最小變化率的點(diǎn)處。8.一種裝置,包括: 用于存儲視頻剪輯的存儲器;以及 處理器,用于: 確定要將所述視頻剪輯分為N+1個(gè)連續(xù)組塊的所述視頻剪輯的N個(gè)幀,其中N是正整數(shù),并且其中所述確定是基于所述視頻剪輯的圖像內(nèi)容、最小組塊大小、以及最大組塊大?。?將所述N+1個(gè)組塊中的每個(gè)提供給相應(yīng)處理器,用于轉(zhuǎn)碼為第一編碼以及轉(zhuǎn)碼為第二編碼; 根據(jù)被轉(zhuǎn)碼為所述第一編碼的所述N+1個(gè)組塊,來生成第一視頻剪輯;以及 根據(jù)被轉(zhuǎn)碼為所述第二編碼的所述N+1個(gè)組塊,來生成第二視頻剪輯。9.根據(jù)權(quán)利要求8所述的裝置,其中所述N+1個(gè)組塊通過所述相應(yīng)處理器被并行轉(zhuǎn)碼。10.根據(jù)權(quán)利要求8所述的裝置,其中所述N個(gè)幀中的至少一個(gè)是基于所述視頻剪輯中的場景變化來確定。11.根據(jù)權(quán)利要求10所述的裝置,其中所述處理器進(jìn)一步用于識別所述視頻剪輯中的一個(gè)或多個(gè)場景變化。12.根據(jù)權(quán)利要求8所述的裝置,其中確定N個(gè)幀進(jìn)一步基于默認(rèn)組塊大小,所述默認(rèn)組塊大小大于或等于所述最小組塊大小,且小于或等于所述最大組塊大小。13.根據(jù)權(quán)利要求8所述的裝置,其中所述視頻剪輯包括超過所述最大組塊大小的場景,并且其中,所述場景內(nèi)的幀是基于對于所述場景中的至少兩個(gè)幀的運(yùn)動(dòng)的測量來確定的。14.根據(jù)權(quán)利要求13所述的裝置,其中所述幀出現(xiàn)在所述場景中所述運(yùn)動(dòng)的測量具有最小變化率的點(diǎn)處。15.—種其中存儲指令的非暫時(shí)性計(jì)算機(jī)可讀存儲介質(zhì),所述指令在被執(zhí)行時(shí)致使計(jì)算機(jī)系統(tǒng)執(zhí)行操作,所述操作包括: 由計(jì)算機(jī)系統(tǒng)確定要將所述視頻剪輯分為N+1個(gè)連續(xù)組塊的所述視頻剪輯的N個(gè)幀,其中N是正整數(shù),并且其中所述確定是基于所述視頻剪輯的圖像內(nèi)容、最小組塊大小、以及最大組塊大??; 將所述N+1個(gè)組塊的每個(gè)提供給相應(yīng)處理器,用于轉(zhuǎn)碼;以及 根據(jù)經(jīng)轉(zhuǎn)碼的N+1個(gè)組塊,生成經(jīng)轉(zhuǎn)碼的視頻剪輯。16.根據(jù)權(quán)利要求15所述的非暫時(shí)性計(jì)算機(jī)可讀存儲介質(zhì),其中所述N個(gè)幀中的至少一個(gè)是基于所述視頻剪輯中的場景變化來確定的。17.根據(jù)權(quán)利要求16所述的非暫時(shí)性計(jì)算機(jī)可讀存儲介質(zhì),其中所述操作進(jìn)一步包括:識別所述視頻剪輯中的一個(gè)或多個(gè)場景變化。18.根據(jù)權(quán)利要求15所述的非暫時(shí)性計(jì)算機(jī)可讀存儲介質(zhì),其中所述視頻剪輯包括超過所述最大組塊大小的場景,并且其中,所述場景內(nèi)的幀是基于對于所述場景中的至少兩個(gè)幀的亮度的測量來確定的。19.根據(jù)權(quán)利要求18所述的非暫時(shí)性計(jì)算機(jī)可讀存儲介質(zhì),其中所述幀出現(xiàn)在所述場景中所述亮度的測量具有最小變化率的點(diǎn)處。20.根據(jù)權(quán)利要求15所述的非暫時(shí)性計(jì)算機(jī)可讀存儲介質(zhì),其中所述視頻剪輯包括超過所述最大組塊大小的場景,并且其中,所述場景內(nèi)的幀是基于對于所述場景中的至少兩個(gè)幀的運(yùn)動(dòng)的測量來確定的。21.根據(jù)權(quán)利要求20所述的非暫時(shí)性計(jì)算機(jī)可讀存儲介質(zhì),其中所述幀出現(xiàn)在所述場景中所述運(yùn)動(dòng)的測量具有最小變化率的點(diǎn)處。
【文檔編號】H04N21/44GK105874813SQ201480071787
【公開日】2016年8月17日
【申請日】2014年12月30日
【發(fā)明人】薩姆·約翰, 琴尚郁, 史蒂文·本汀, 蒂埃里·富屈, 林耀中
【申請人】谷歌公司