基于特征的圖像集合壓縮的制作方法
【專利說(shuō)明】基于特征的圖像集合壓縮
【背景技術(shù)】
[0001] 人們可W存儲(chǔ)和/或與其他人(例如,朋友和/或親屬)共享多個(gè)數(shù)字圖像(例 如,照片)。取決于圖像的大小,存儲(chǔ)運(yùn)些圖像可能使用大量的存儲(chǔ)空間。如果可WW很小 的(如果存在的話)可感知的圖像質(zhì)量損失來(lái)壓縮多個(gè)數(shù)字圖像,那么可W使用較小的存 儲(chǔ)空間來(lái)存儲(chǔ)多個(gè)數(shù)字圖像,和/或使用較小的帶寬來(lái)通過(guò)通信網(wǎng)絡(luò)發(fā)送多個(gè)數(shù)字圖像。 如果數(shù)字圖像可W被使用較小的空間來(lái)存儲(chǔ)和/或被更容易地發(fā)送,那么人們可W與其他 人共享額外的數(shù)字圖像。例如,通過(guò)減小相冊(cè)的存儲(chǔ)大小,當(dāng)使用服務(wù)器W及作為照片的主 機(jī)的云存儲(chǔ)服務(wù)時(shí),可W減小用于存儲(chǔ)相冊(cè)和/或存儲(chǔ)相冊(cè)的備份副本的存儲(chǔ)空間的量。
【發(fā)明內(nèi)容】
[0002] 為了W簡(jiǎn)化的形式介紹構(gòu)思的選擇,提供了本
【發(fā)明內(nèi)容】
,下文在【具體實(shí)施方式】中 進(jìn)一步描述了所述構(gòu)思的選擇。本
【發(fā)明內(nèi)容】
不旨在識(shí)別要求保護(hù)的主題的關(guān)鍵或者基本特 征;也不是用于確定或者限制要求保護(hù)的主題的范圍。
[0003] 本文所描述的一些示例可W從圖像采集生成一個(gè)或多個(gè)壓縮圖像集合??蒞基于 每個(gè)圖像中的一個(gè)或多個(gè)特征將來(lái)自圖像采集的圖像聚集成一個(gè)或多個(gè)圖像集合??蒞基 于每個(gè)圖像中的一個(gè)或多個(gè)特征來(lái)從一個(gè)或多個(gè)圖像集合中的每個(gè)圖像集合創(chuàng)建相關(guān)結(jié) 構(gòu)(例如,圖像的最小生成樹(shù)或者其它類似的結(jié)構(gòu))。可W使用基于特征的最小生成樹(shù)來(lái)執(zhí) 行基于特征的預(yù)測(cè)??蒞生成對(duì)應(yīng)于一個(gè)或多個(gè)圖像集合的一個(gè)或多個(gè)壓縮圖像集合。
【附圖說(shuō)明】
[0004] 參照附圖描述了【具體實(shí)施方式】。在附圖中,附圖標(biāo)記的最左數(shù)位識(shí)別其中該附圖 標(biāo)記第一次出現(xiàn)的附圖。不同附圖中的相同的附圖標(biāo)記表示相似或者相同的項(xiàng)目。 陽(yáng)〇化]圖1是根據(jù)一些實(shí)現(xiàn)方式的、包括圖像采集的說(shuō)明性架構(gòu)。
[0006] 圖2是根據(jù)一些實(shí)現(xiàn)方式的、包括輸出經(jīng)編碼的比特流的示例過(guò)程的流程圖。
[0007] 圖3是根據(jù)一些實(shí)現(xiàn)方式的、包括基于特征的最小生成樹(shù)的說(shuō)明性架構(gòu)。
[0008] 圖4是根據(jù)一些實(shí)現(xiàn)方式的、預(yù)測(cè)算法的示例過(guò)程的流程圖。
[0009] 圖5是根據(jù)一些實(shí)現(xiàn)方式的、包括接收?qǐng)D像采集的示例過(guò)程的流程圖。
[0010] 圖6是根據(jù)一些實(shí)現(xiàn)方式的、包括聚集圖像的示例過(guò)程的流程圖。
[0011] 圖7是根據(jù)一些實(shí)現(xiàn)方式的、包括生成最小生成樹(shù)的示例過(guò)程的流程圖。
[0012] 圖8示出了可W用于實(shí)現(xiàn)本文所描述的模塊、技術(shù)和功能的計(jì)算設(shè)備和環(huán)境的示 例配置。
【具體實(shí)施方式】
[0013] 本文所描述的是壓縮數(shù)字圖像(本文中還被稱為"圖像")的采集的框架連同示例 系統(tǒng)和技術(shù)。壓縮一個(gè)或多個(gè)圖像的集合可W包括移除圖像之間的冗余(例如,圖像間冗 余或者集合冗余)W及移除特定圖像內(nèi)的冗余(例如,圖像內(nèi)冗余或者圖像冗余)。本文所 描述的系統(tǒng)和技術(shù)采用壓縮方案W基于局部特征和全局特征二者來(lái)移除圖像間冗余。壓縮 方案可W采用允許從經(jīng)壓縮的數(shù)據(jù)重建精確的原始數(shù)據(jù)的無(wú)損壓縮、允許從經(jīng)壓縮的數(shù)據(jù) 重建原始數(shù)據(jù)的近似的有損壓縮、或者二者的組合。SIFT(尺度不變特征變換)描述符可W 被用于W可W對(duì)于圖像區(qū)域中的一個(gè)或多個(gè)物體的尺度和旋轉(zhuǎn)不變的方式來(lái)描繪圖像區(qū) 域的特征。SIFT描述符可W被用于測(cè)量和進(jìn)一步增強(qiáng)圖像間的相關(guān)。給定圖像集合,可W 根據(jù)圖像之間的基于SIFT的預(yù)測(cè)測(cè)量來(lái)建立最小成本預(yù)測(cè)結(jié)構(gòu)。另外,基于SIFT的全局 轉(zhuǎn)換可W被用于通過(guò)在幾何形狀和強(qiáng)度二者方面將兩個(gè)或更多個(gè)圖像彼此對(duì)齊來(lái)增強(qiáng)兩 個(gè)或更多個(gè)圖像之間的相關(guān)??蒞通過(guò)基于塊的運(yùn)動(dòng)估計(jì)和率失真優(yōu)化(RDO)來(lái)進(jìn)一步地 減小集合冗余W及圖像冗余。不管圖像集合的屬性如何,本文所描述的系統(tǒng)和技術(shù)都可W 被用于壓縮數(shù)字圖像的采集。
[0014] 因此,本文所描述的圖像集合壓縮技術(shù)可W被用于創(chuàng)建相關(guān)的視覺(jué)數(shù)據(jù)的集合的 緊湊表示,W實(shí)現(xiàn)對(duì)相關(guān)的圖像集合(例如,層析圖像、多光譜圖片和相冊(cè))的傳輸和存儲(chǔ)。 可W通過(guò)除了減小每個(gè)圖像之內(nèi)的冗余(例如,圖像冗余)之外還減小圖像集合內(nèi)部的冗 余(例如,集合冗余)來(lái)獲得緊湊表示。例如,本文所描述的技術(shù)可W被用于壓縮包括物體 的旋轉(zhuǎn)和縮放的圖像集合。使用SIFT描述符的基于SIFT的圖像集合壓縮技術(shù)可W被用于 評(píng)估兩個(gè)圖像之間的相似性。另外,當(dāng)將兩個(gè)或更多個(gè)圖像編碼時(shí),可W在幾何形狀W及強(qiáng) 度方面將兩個(gè)或更多個(gè)圖像彼此對(duì)齊,而不是僅使用一個(gè)圖像作為預(yù)測(cè)的基礎(chǔ)。
[0015] 說(shuō)明性架構(gòu)
[0016] 圖1是根據(jù)一些實(shí)現(xiàn)方式的、包括圖像采集的說(shuō)明性架構(gòu)100。架構(gòu)100包括一個(gè) 或多個(gè)計(jì)算設(shè)備102,其經(jīng)由網(wǎng)絡(luò)106禪合到一個(gè)或多個(gè)額外的計(jì)算設(shè)備。
[0017] 計(jì)算設(shè)備102可W包括一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)108W及一個(gè)或多個(gè)處理器 110。計(jì)算機(jī)可讀介質(zhì)108可W包括一個(gè)或多個(gè)應(yīng)用112,例如,壓縮模塊114。應(yīng)用112可 W包括指令,所述指令可由一個(gè)或多個(gè)處理器110執(zhí)行W執(zhí)行各種功能。例如,壓縮模塊 114可W包括可由一個(gè)或多個(gè)處理器110執(zhí)行的、用W使用本文所描述的技術(shù)來(lái)壓縮包括 多個(gè)圖像集合的圖像采集116的指令。 陽(yáng)01引圖像采集116可W包括N個(gè)圖像(其中,N〉0),例如,第一圖像118至第N圖像120。 圖像采集116中的圖像可W包括一個(gè)或多個(gè)圖像文件格式(例如(但不限于),聯(lián)合圖像專 家組(JPEG)、標(biāo)記圖像文件格式(TIFF)、RAW(或者其它無(wú)損格式)、圖形圖像格式(GIF)、 位圖度MP)、便攜式網(wǎng)絡(luò)圖像(PNG)等)的數(shù)字圖像。圖像采集116中的圖像中的至少一些 圖像可W包括相同物體的至少一部分。例如,去度假的個(gè)人可W拍攝包括地標(biāo)(例如,自由 女神像、埃菲爾鐵塔、泰姬陵、中國(guó)長(zhǎng)城等)或者特定的人(例如,配偶、小孩、親屬或者其它 與該個(gè)人具有關(guān)系的人)的數(shù)字圖像(例如,照片)。為了使用地標(biāo)來(lái)示出,數(shù)字圖像可W 包括出自不同的角度和/或不同的有利位置的地標(biāo)。數(shù)字圖像中的一些數(shù)字圖像可W被放 大或者特寫(xiě)W提供地標(biāo)的特定部分的詳細(xì)視圖,和/或被縮小W提供在地標(biāo)的周圍的環(huán)境 內(nèi)的地標(biāo)。
[0019] 壓縮模塊114可W將來(lái)自圖像采集的N個(gè)圖像118至120分組為數(shù)字圖像集合, 每個(gè)所述數(shù)字圖像集合包括一個(gè)或多個(gè)數(shù)字圖像。可W基于特征來(lái)將N個(gè)圖像118至120 分組。例如,特征可W包括圖像的子集共有(例如,包括在圖像的子集中)的一個(gè)或多個(gè)物 體。例如,壓縮模塊114可W將N個(gè)圖像118至120分組為M個(gè)圖像集合(其中,M〉0),例 如,第一圖像集合122至第M圖像集合124。M個(gè)圖像集合中的每個(gè)圖像集合可W包括一個(gè) 或多個(gè)圖像。第一圖像集合122可W包括P個(gè)圖像(其中,P〉0),從第1圖像至第P圖像, 而第M圖像集合124可W包括Q個(gè)圖像(其中,Q〉0并且Q不需要等于巧,從第一圖像130 至第Q圖像132。第一圖像集合122可W各自包括特征,例如,相同的物體(例如,地標(biāo)、人 等)的至少一部分。相似地,第M圖像集合可W各自包括另一個(gè)特征,例如,另一個(gè)物體(例 如,地標(biāo)、人等)的至少一部分。
[0020] 壓縮模塊114可W壓縮M個(gè)圖像集合122至124W創(chuàng)建相應(yīng)的壓縮圖像集合,包 括第一壓縮圖像集合134至第M壓縮圖像集合136。例如,第一壓縮圖像集合134可W對(duì) 應(yīng)于第一圖像集合122,而第M壓縮圖像集合136可W對(duì)應(yīng)于第M圖像集合124。第一壓縮 圖像集合134可W包括對(duì)應(yīng)于P個(gè)圖像126至128的P個(gè)壓縮圖像138至140。第M壓縮 圖像集合136可W包括對(duì)應(yīng)于Q個(gè)圖像130至132的Q個(gè)壓縮圖像142至144。M個(gè)壓縮 圖像集合134至136可W包括已經(jīng)通過(guò)減少圖像間冗余和/或通過(guò)減少圖像內(nèi)冗余被壓縮 的圖像。在一些情況下,壓縮模塊114可W生成經(jīng)編碼的比特流138,所述經(jīng)編碼的比特流 138包括M個(gè)壓縮圖像集合134至136。
[0021] 壓縮模塊114可W被用在各種各樣的情況中。例如,個(gè)人可W使用計(jì)算設(shè)備102 中的一個(gè)或多個(gè)計(jì)算設(shè)備來(lái)存儲(chǔ)壓縮格式的圖像采集116。作為另一個(gè)示例,個(gè)人可W使 用計(jì)算設(shè)備102中的一個(gè)或多個(gè)計(jì)算設(shè)備來(lái)將M個(gè)壓縮圖像集合134至136存儲(chǔ)為圖像采 集116的備份。在運(yùn)些示例中,計(jì)算設(shè)備102可W包括個(gè)人計(jì)算機(jī)(例如,