專利名稱:圖像清理和預編碼的制作方法
技術領域:
本發(fā)明一般地涉及圖像處理,更加具體地涉及圖像和視頻清理和預編碼。
背景技術:
傳統(tǒng)的圖像噪聲去除(或減小)算法可以分為兩類統(tǒng)計方法和核方法。一種統(tǒng)計方法的算法是中值濾波。在中值濾波中,將在圖像中要被清理的一組(有噪聲的)象素中的相應象素的值確定為特定窗口中的中間象素值,該窗口在相應象素處的中心。盡管中值濾波在去除或降低脈沖噪聲中是有效的,但是它通常難以去除高斯(白)噪聲,并且可能使圖像模糊(即圖像會被平滑)。當窗口例如在具有高百分比的脈沖噪聲的圖像中較大時,模糊可能更加明顯。
另一種統(tǒng)計方法即順序統(tǒng)計量(OS)濾波可提供減小數(shù)量或程度的模糊。在順序統(tǒng)計量濾波中,窗口中的象素組按照有序序列排列,并使用合適的預定加權按該序列的線性組合替代相應象素。然而,對于圖像中的每一象素使用的是同樣的窗口(形狀和尺寸)和同樣的加權。因此,常常難以保持或維持總體的圖像銳度。
核方法例如是移動平均(MA)濾波、無限沖激響應(IIR)或自回歸移動平均(ARMA)濾波法(即與自回歸反饋相結合的MA)以及卷積濾波,其在減小高斯噪聲方面更加有效,但是在減小脈沖噪聲發(fā)明效率較低。此外,根據(jù)濾波系數(shù)(也稱為濾波器加權),核方法在保持圖像銳度方面具有比統(tǒng)計方法更大的困難。
傳統(tǒng)的圖像濾波包括統(tǒng)計方法和核方法,其通??赏ㄟ^圖像平滑以及通過損失圖像銳度來實現(xiàn)噪聲降低。這可能導致圖像過分模糊。在試圖修改這些方法來保持一定量的圖像銳度(例如,對于每一象素根據(jù)負梯度使用卷積遮罩)時,這種方法必然增大計算成本和復雜性,并且常常要使用多級圖像處理(即圖像處理的多次迭代)。
近來在圖像噪聲去除方面的進展包括″最大后驗”(MAP)和變分方法。該MAP方法本質(zhì)上是統(tǒng)計學的(即離散的)。該變分方法是分析的,其常常作為能量函數(shù)的最小化問題而提出,該最小化問題常常定義為彎曲或內(nèi)部(″先驗”)能量函數(shù)的總和。當內(nèi)部能量函數(shù)調(diào)節(jié)輸出的圖像質(zhì)量時,外部能量函數(shù)測量對要被清理的輸入圖像的近似性。可以使用正常數(shù)作為用于相比于輸入的有噪聲圖像(由外部能源調(diào)節(jié)),來平衡輸出的″干凈”圖像的圖像(平滑度/銳度)質(zhì)量和保真度的參數(shù)。解決能量最小化問題的歐拉-拉格朗日方程的最速下降方法會引起(各向同性和各向異性的)擴散和擴散反應的偏微分方程(PDE)。盡管變分方法和其他近來的相關方法(如各向異性擴散或擴散反應的PDE的數(shù)值解)通常提供對如上所述的傳統(tǒng)算法的改進,但是該改進通常必然會增大計算成本和復雜性,并且常常使用多級圖像處理。
因此,需要一種改進的圖像處理方法,該方法可去除或減小圖像中的噪聲,同時大體上保持圖像內(nèi)容(例如圖像結構和圖像邊緣)。此外需要減小計算成本、減小復雜性和單遍掃描或減小圖像處理過程中的級數(shù)。
發(fā)明內(nèi)容
描述了一種過濾數(shù)字圖像的方法。將濾波核應用于一組象素中的相應象素,以便依照第一濾波參數(shù)來平滑噪聲和保持與數(shù)字圖像中的圖像邊緣相關聯(lián)的空間頻率。該濾波核是相應象素的函數(shù),并且對于相應象素具有閉合形式。濾波核包括來自第一組相鄰象素的貢獻(contribution),并具有內(nèi)容相關的標準化,使得濾波核中元素的總和等于一個大體上固定的值??商鎿Q地說法是,元素的總和等于或近似等于固定值。
所述應用包括相應象素的單遍掃描。可以對象素組中的每一象素執(zhí)行該應用,以便產(chǎn)生過濾的數(shù)字圖像。對象素組中的每一象素應用濾波核附加的一次或多次可以使過濾的數(shù)字圖像大體上不變。
第一濾波參數(shù)可以確定平滑和銳化之間的邊界。通過減小數(shù)字圖像中一位置處的噪聲平滑,該第一濾波參數(shù)可以大體上維持數(shù)字圖像中的紋理信息,所述數(shù)字圖像包含比閾值更大的空間頻率。
濾波核中的偏心元素包括第一組相鄰象素中的象素和在各向異性擴散方程的離散化中相應象素之差的量。濾波核中的中心象素對應于相應象素。第一濾波參數(shù)可以在各向異性擴散方程的離散化中使時間步長映射到內(nèi)容相關的標度(scale)。在各向異性擴散方程的離散化中的傳導率是子波變換的函數(shù)。來自傳導函數(shù)的離散傳導元素可以實現(xiàn)為查詢表。
濾波核可對應于尺寸為(2m+1)×(2n+1)的窗口,并可包括第一組相鄰象素。濾波核的m和n是象素尺寸的函數(shù)。m可以等于n。
在一些實施例中,該方法還包括使用濾波核修改顏色或象素的顏色分量。
在一些實施例中,濾波核包括來自第二組相鄰象素的貢獻,并進一步與第二濾波參數(shù)一致。
在過濾數(shù)字圖像的方法的一個可替換實施例中,將濾波核應用到象素組中的相應象素上,以依照濾波參數(shù)來平滑噪聲和保持與數(shù)字圖像中的圖像邊緣相關聯(lián)的空間頻率。過濾的象素對應于Σm,n1γM⊗U,]]>其中M是閉合形式的陣列,該陣列是相應象素的函數(shù)并具有(2m+1)×(2n+1)(m和n是正整數(shù))的窗口尺寸,M包括來自(2m+1)×(2n+1)組相鄰象素的貢獻,U是象素組中的子陣列并包括相應象素和相鄰象素組,表示M中元素和U中元素的逐個元素的乘積,γ是時間比上內(nèi)容相關標度,導致濾波核M的標準化,使得 中元素的總和等于或近似等于一個固定的值。
過濾數(shù)字圖像的方法和相關裝置可提供減小的噪聲,同時大體上保持圖像內(nèi)容。該方法和相關裝置還可以在數(shù)字圖像的處理中提供減小的計算成本、減小的復雜性和單遍掃描或減小的級數(shù)。
為了更好地理解本發(fā)明,可以結合隨附的附圖參考下面詳細的說明,其中圖1是示出了過濾數(shù)字圖像的過程的實施例的流程圖。
圖2是示出了過濾數(shù)字圖像的過程的實施例的流程圖。
圖3是示出了客戶端或服務器的實施例的方框圖。
圖4是示出了設備的實施例的方框圖。
圖5是示出了過濾數(shù)字圖像的過程的實施例的流程圖。
圖6是示出了轉變參數(shù)的方框圖。
圖7是示出了在圖像邊緣上一點處的局部坐標的方框圖。
圖8是示出了確定濾波核的過程的實施例的流程圖。
圖9是示出了圖像片中一組象素的方框圖。
圖10是示出了將濾波核構建在圖像片的邊角處的相應象素的過程的實施例的流程圖。
圖11是示出了將濾波核構建在圖像片邊界上的相應象素的過程的實施例的流程圖。
圖12是示出了將濾波核構建在圖像片內(nèi)部的相應象素的過程的實施例的流程圖。
圖13是示出了構建和使用濾波核的過程的實施例的流程圖。
圖14是示出了構建和使用濾波核的過程的實施例的流程圖。
圖15是示出了過濾數(shù)字圖像的過程的實施例的流程圖。
圖16是示出了過濾用于圖像壓縮或在圖像壓縮中的P或B幀的過程的實施例的方框圖。
圖17是示出了過濾用于圖像壓縮或在圖像壓縮中的宏塊的過程的實施例的方框圖。
圖18是示出了過濾三維數(shù)字圖像的過程的實施例的方框圖。
圖19是示出了未過濾的和過濾了的數(shù)字圖像的實施例的方框圖。
在所有附圖中同樣的參考數(shù)字表示對應的部件。
具體實施例方式
現(xiàn)在將詳細地參考實施例,該實施例的實例在隨附的附圖中示出。在下面詳細的說明中,為了提供對本發(fā)明的全面理解,闡明了多個具體的細節(jié)。然而,對本領域技術人員來說顯而易見的是,本發(fā)明可以在沒有這些具體細節(jié)的情況下實施。在其他情況下,為了不至于使實施例的形態(tài)不清楚,沒有詳細地描述公知的方法、步驟、元件和電路。
描述了一種圖像處理方法以及相關的裝置和系統(tǒng)。該圖像處理位于計算上有效率的濾波核的中心,該濾波核可改進圖像質(zhì)量(例如減小或去除噪聲),減小通信帶寬和/或減小數(shù)字圖像或一組圖像(例如視頻)的存儲尺寸,同時保持和/或增強圖像內(nèi)容。濾波核可以作為預濾器或預編碼器包括在圖像和視頻壓縮系統(tǒng)中,該系統(tǒng)使用圖像和視頻壓縮技術例如JPEG、JPEG-2000、MPEG、H263或H264。在視頻壓縮的應用中,濾波核可以用來預過濾I幀、P幀、B幀和/或宏塊,以及在所謂的運動補償?shù)膱D像立方的3維預過濾中使用。濾波核可以在掃描儀、打印機、數(shù)字照相機(在移動電話、其它便攜設備和/或單獨的照相機中)和可攜式攝像機中使用以及在圖像的后處理中使用。濾波核可以實現(xiàn)到軟件和/或硬件中,例如特定用途集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、數(shù)字信號處理(DSP)或其它集成電路中。在一些實施例中,濾波核具有閉合形式。濾波核可以在單遍掃描中應用于對應于相應圖像的一組象素,以便產(chǎn)生過濾的圖像。隨后將濾波核應用到過濾的圖像上可使過濾的圖像大體上不變。例如,在一個或多個空間頻率處的量值變化小于預過濾值的5至10%。如果多次應用濾波核,與濾波核相關聯(lián)的一個或多個平滑度/銳度參數(shù)可以不變或者被修改。
濾波核是非線性的和內(nèi)容相關的(下文表示為內(nèi)容相關的濾波器或CDF)。對于圖像中的相應象素組,2維的CDF對應于(2m+1)×(2n+1)(對于任意的正整數(shù)m和n)的窗口或濾波器尺寸。該CDF基于各向異性擴散的模型和/或各向異性擴散反應的模型。在各向異性擴散的模型中傳導項的梯度運算可以沿水平和/或垂直方向由子波變換替換。不計算獲得的偏微分方程(PDE)的數(shù)值解,這會需要許多的迭代步驟,而是引入一個或多個時間-標度變換。這些變換可把在PDE的離散化中恒定的時間步長參數(shù)映射到一個或多個內(nèi)容相關的標度,對于圖像或圖像的子集中的每一象素來說該標度通常會變化。該映射與窗口中的中心象素和窗口中一組或多組相鄰象素中的相應象素之間的差一致和/或通過一個子波變換。因此一般地,對于待處理的每一象素來說得到的CDF會變化,即對于不同的(或者更加一般地,具有局部圖像內(nèi)容的)象素值來說濾波系數(shù)或濾波加權會變化。然而,CDF可以具有閉合形式。同樣地,可以在單次操作中執(zhí)行每一象素的圖像處理,即CDF可以是單遍掃描濾波器。在一些實施例中,CDF可以以多遍掃描開實現(xiàn),但是具有比傳統(tǒng)的圖像濾波器(其可能使用多達100次運算或階段)更少的運算或階段。
在構建CDF的過程中,時間-標度變換(也稱為時間-標度映射)可以根據(jù)期望的CDF的窗口尺寸而采取不同的形式。該窗口尺寸與圖像中的象素尺寸和/或圖像分辨率一致。例如,對于較小的象素尺寸(高分辨率)來說圖像中的噪聲可以在幾個象素上擴展。因此,在這種情況下可以使用較大的窗口。下面對用于幾個濾波器窗口尺寸(包括3×3的窗口)的推導的描述可以擴展成任意窗口尺寸,以及擴展成具有3維窗口的濾波器,以便去除或減小3維圖像中的圖像噪聲。同樣地,可認為該推導是說明性的一般方法。時間-標度變換包括至少一個用于調(diào)節(jié)圖像的平滑度/銳度的參數(shù)。至少一個參數(shù)可以是預定義的,或者可以自動和/或手動地進行調(diào)節(jié)。該調(diào)節(jié)與光強、快門速度和/或圖像中的圖像內(nèi)容一致。通過減小圖像中一位置處的噪聲平滑度,至少一個參數(shù)可以維持圖像中的紋理信息,所述圖像包含比閾值更大的空間頻率。
現(xiàn)在我們轉向用于過濾數(shù)字圖像的過程以及相關的裝置和系統(tǒng)的實施例。圖1是示出了過濾數(shù)字圖像的過程的實施例100的流程圖。為濾波過程可確定用于濾波核的窗口尺寸,其包括第一組相鄰象素??梢詾榈谝唤M相鄰象素(110)中的相應象素確定或構建濾波核,如用于CDF的濾波核。該濾波核可依照第一濾波參數(shù)平滑噪聲并保持與圖像邊緣相關聯(lián)的空間頻率??梢允褂每蛇x擇的子波變換確定與濾波核相關聯(lián)的傳導率(114)??蛇x地依照第二濾波參數(shù)確定來自第二組相鄰象素對濾波核的貢獻(116)。將濾波核應用到第一組相鄰象素中的每一象素(包括中心象素)上,以便產(chǎn)生過濾的數(shù)字象素(118)??蛇x地使用對應的濾波核修改相應象素的顏色(120)。對于象素組中的附加象素可以重復一次或多次所述過程(122)。對于一個或多個彩色通道可以重復一次或多次所述過程。相應彩色通道可以是RGB、Y Cb Cr、YUV或YIQ彩色通道。對于圖像中的至少一個象素的子集來說,所述過程100可以重復多次,包括至少一次迭代。在一些實施例中,可以使用并行的處理器或電路并行地處理多個象素。過程100可以包括更少的運算和/或附加運算。此外,兩種或多種運算可以組合在一起和/或可以修改運算的順序。
圖2是示出了過濾數(shù)字圖像的過程200的實施例的流程圖??蛻舳嗽O備210(例如包括圖像傳感器的設備)將一組象素(214)發(fā)送給服務器設備(例如包括處理器、DSP或ASIC的設備)212。接收像素組(216)??蛇x地為該象素組中的每一象素確定或構建一個或多個濾波核(218)。將相應濾波核應用到該象素組中的每一象素上,以便產(chǎn)生過濾的數(shù)字圖像(220)。將該過濾的數(shù)字圖像發(fā)送(222)給客戶端設備(210)。接收過濾的數(shù)字圖像(224)。所述過程200可以包括更少的運算或附加運算。此外,兩種或多種運算可以組合在一起和/或可以修改運算的順序。
圖3是示出了客戶端計算機、客戶端設備或服務器設備(例如包括處理器、DSP、或ASIC的設備)300的實施例的方框圖。該客戶端計算機、客戶端設備或服務器設備300包括至少一個數(shù)據(jù)處理器、視頻處理器和/或中央處理單元(CPU)310、一個或多個可選擇的用戶接口314、用于和其他計算機、服務器和/或設備400(圖4)通信的通信或網(wǎng)絡接口324、存儲器324和一個或多個用于將這些部件彼此連接在一起的通信總線或信號線312。該至少一個數(shù)據(jù)處理器、視頻處理器和/或中央處理單元(CPU)310可支持多線程和/或并行的處理。用戶接口314具有一個或多個顯示器316、鍵盤318和/或指示器320(例如鼠標)??蛻舳嘶蚍掌髟O備300包括一個或多個高速緩沖存儲器308,該高速緩沖存儲器可用作至少一組象素的子集的滾動緩沖器。
存儲器324包括高速隨機存取存儲器和/或非易失性存儲器,包括ROM、RAM、EPROM、EEPROM、一個或多個閃速磁盤驅(qū)動器、一個或多個光盤驅(qū)動器和/或一個或多個磁盤存儲設備。存儲器324可以存儲操作系統(tǒng)326,如LINUX、UNIX、OS9或WINDOWS,該操作系統(tǒng)包括用于處理基本系統(tǒng)服務和用于執(zhí)行硬件相關的任務的進程(或一組指令)。存儲器324還可以將通信程序(或一組指令)存儲在網(wǎng)絡通信模塊328中。該通信程序可以用于和一個或多個計算機、服務器和/或設備400(圖4)通信。
存儲器324還包括下面的元素、或者這種元素的子集或超集,包括圖像處理模塊330(或一組指令)、子波變換模塊336(或一組指令)、顏色變換模塊338(或一組指令)、編碼/解碼模塊340(或一組指令)如JPEG或MPEG、一組或多組象素342和/或一個或多個過濾的數(shù)字圖像344。該圖像處理模塊330包括濾波核發(fā)生器332和/或一個或多個濾波核334。在一些實例中,存儲器324進一步包括圖像壓縮模塊350,用于利用圖像或視頻壓縮方法(例如JPEG、JPEG-2000、MPEG、H263或H264)產(chǎn)生過濾和壓縮的圖像352,來壓縮過濾的數(shù)字圖像344。
盡管圖3示出了作為多個離散項的客戶端或服務器300,但是圖3是表示對出現(xiàn)在客戶端或服務器300中的各個特征的功能描述,而不是在這里描述的實施例的結構圖解。實際上,正如本領域技術人員所認識到的,客戶端或服務器300的功能可以分配到多個服務器或客戶端上,同時各組客戶端或服務器執(zhí)行這些功能的特定子集。在圖3中單獨示出的項可以組合在一起,一些項可以是單獨的和/或可以包括其它項。
圖4是示出了設備400的實施例的方框圖,所述設備例如是包括照相機、數(shù)碼相機或可攜式攝像機的移動電話。該設備400包括一個或多個數(shù)據(jù)處理器、視頻處理器和/或中央處理單元(CPU)410、一個或多個可選的用戶接口414、一個或多個圖像傳感器418、用于和其它計算機、服務器和/或設備400通信的通信接口422(例如USB)、存儲器424和用于將這些部件彼此連接的一個或多個通行總線或信號線412。所述一個或多個數(shù)據(jù)處理器、視頻處理器和/或中央處理單元(CPU)410可支持多線程和/或并行數(shù)據(jù)處理。用戶接口414具有一個或多個顯示器416和/或一個或多個按鍵或鍵盤。設備400還包括電源420。設備40包括一個或多個高速緩沖存儲器408,其可用作一組象素的至少一個子集的滾動緩沖器。
存儲器424包括高速隨機存取存儲器和/或非易失性存儲器,包括ROM、RAM、EPROM、EEPROM、一個或多個閃速磁盤驅(qū)動器、一個或多個光盤驅(qū)動器和/或一個或多個磁盤存儲設備。存儲器424可以存儲嵌入式操作系統(tǒng)426,如LINUX、OS9、UNIX或WINDOWS或適合于在工業(yè)或商業(yè)設備上使用的實時操作系統(tǒng)(例如風河系統(tǒng)公司的Vx Works)。該嵌入式操作系統(tǒng)426包括用于處理基本系統(tǒng)服務和用于執(zhí)行硬件相關的任務的進程(或一組指令)。存儲器424還可以將通信程序(或一組指令)存儲在通信模塊428中。該通信程序可以用于和一個或多個計算機、服務器和/或設備400(圖4)通信。
存儲器424還包括下面的元素、或者這種元素的子集或超集,包括圖像處理模塊430(或一組指令)、子波變換模塊436(或一組指令)、顏色變換模塊438(或一組指令)、編碼/解碼模塊440(或一組指令)如JPEG或MPEG、一組或多組象素442。該圖像處理模塊430包括濾波核發(fā)生器432和/或一個或多個濾波核434。該設備400還包括一個或多個過濾的數(shù)字圖像444。該過濾的數(shù)字圖像444可以存儲在存儲器424或單獨的非易失性存儲器中,如閃速存儲器,該存儲器是可移除的。在一些實例中,存儲器424進一步包括圖像壓縮模塊450,用于利用圖像或視頻壓縮方法(例如JPEG、JPEG-2000、MPEG、H263或H264)產(chǎn)生過濾和壓縮的圖像452,來壓縮過濾的數(shù)字圖像444。
盡管圖4示出了作為多個離散項的設備400,但是圖4是表示對出現(xiàn)在設備400中的各個特征的功能描述,而不是在這里描述的實施例的結構圖解。在圖4中單獨示出的項可以組合在一起,一些項目可以是單獨的和/或可以包括其它項。
圖5是示出了過濾數(shù)字圖像或視頻的過程的實施例500的流程圖。接收有噪聲的圖像(510)??蛇x地預處理圖像(512),預處理包括模數(shù)轉換(如果必要)和/或顏色變換。將一個或多個濾波核應用到多個通道上(514)。清理相應顏色空間中的圖像(516)。對圖像進行編碼(518),例如,使用JPEG或MPEG壓縮。流程圖500包括更少的運算或附加的運算。此外,兩種或多種運算可以組合在一起和/或可以修改運算的順序。
現(xiàn)在將注意轉向用于CDF的濾波核。如前面所論述的,用于噪聲去除或減小的傳統(tǒng)的圖像處理包括MAP和變分方法。對于變分方法可以使用基于各向異性擴散的PDE的方法,以及基于各向異性擴散反應的PDE的方法。這里可以使能量函數(shù)最小化,使得擴散模型的對應傳導函數(shù)c不是恒定的,從而得到非線性的PDE。一般地,可以使用迭代處理用數(shù)字解出這種非線性的PDE。
一些傳統(tǒng)的方法通過將傳導率c定義為函數(shù)c(p)=’(p)/p而可以擴展基于各向異性擴散的PDE的方法,所述函數(shù)對應于可微的非遞減函數(shù)(p),其中(O)=O。(如果(p)是內(nèi)部能量泛函的內(nèi)部能量密度函數(shù),那么解出最小能量問題中的歐拉-拉格朗日方程的最速下降方法對于外部能量的離散公式可得到各向異性擴散的PDE,對于外部能量的連續(xù)公式可得到擴散反應的PDE)。函數(shù)”(p)612(其中雙引號表示二階導數(shù))作為p610的函數(shù)如圖6所示,其中p=| u|,u的空間梯度的量值,該量值是在某一時間時刻處各向異性擴散的方程的(未知)解。一種內(nèi)部能量密度函數(shù)的通用選擇是(p)=p。對于該選擇,對應的傳導函數(shù)c(p)=1/p。較小的p值610對應于圖像內(nèi)容的快速分散。因此,圖像細節(jié)如圖像結構和光圖像邊緣可能在圖像處理的過程中丟失。較大的p值610對應于圖像內(nèi)容中邊緣的銳化。盡管在這些極值之間存在連續(xù)變分,但是表示為轉變參數(shù)po614的零交叉可分離這兩種狀態(tài)。
圖7是示出了在圖像邊緣上某一點處局部坐標700的方框圖,包括橫向的單位矢量t710和法向的單位矢量n712。當p=|u|(圖6)大于轉變參數(shù)po614時,會由于沿法向單位矢量n712的反向擴散而產(chǎn)生銳化。注意,法向單位矢量n712是沿(未知)解u的梯度方向的單位矢量,利用右手規(guī)則使橫向單位矢量t710垂直于n。當p=|u|(圖6)小于轉變參數(shù)po614時,會沿著法向單位矢量n712產(chǎn)生最小擴散,并因此不容易看到模糊。對于轉變參數(shù)po614的適當選擇,可以保持或增強圖像銳度同時去除或減小圖像噪聲。然而如前所論述的,基于各向異性擴散的PDE的這些和其他模型增大了復雜性,并增大了用來找到數(shù)值解的計算量。典型地,非線性各向異性擴散的PDE的這些和其他解使用了多次迭代或多級圖像處理。例如,可以使用不變的時間步長參數(shù)Δt使PDE離散化,從而公式化非線性的差分方程。有噪聲的輸入圖像可用作PDE的初始條件。對應于″干凈的”輸出圖像的數(shù)值解通常包括多個迭代步驟或運算(達到100或更大),并取決于用于終止迭代過程的停止時間的特定選擇。
在下面描述的CDF的推導中,使各向異性擴散的PDF離散化。在其他實施例中,使相關的非線性PDE如擴散反應的PDE離散化。有噪聲的圖像可用作初始條件。傳導函數(shù)c(p)定義為p=|u|的函數(shù)。在示例性的實施例中,傳導函數(shù)可以是c(p)=e-p22po2,]]>c(p)=po2po2+p2,]]>或者c(p)=min(1,1p).]]>代替在數(shù)值上求解PDE,可以使時間參數(shù)映射到象素相關的標度。該標度消除了停止時間的使用,并允許圖像處理在單遍掃描中實現(xiàn)。作為說明性的實施例,可以考慮3×3的濾波器窗口。此外還示出了6×5、5×5和7×7的濾波器窗口的結果。對本領域技術人員來說很明顯的是,也可以構建具有更大的濾波器尺寸的CDF,以及3維的CDF。
下面推導的CDF在水平方向和垂直方向具有有限的濾波長度(CDF的3維實施例也在三個方向具有有限的長度)。在被濾波的圖像的至少一個子集中的每一象素具有其自身的CDF濾波器。在一些實施例中,這些CDF濾波器對應于在水平方向和垂直方向具有對稱形狀的窗口。該窗口對應于(2m+1)×(2n+1)的象素,其中m和n是任意正整數(shù)(對于3維實施例來說,沿第三方向的維數(shù)是q)。在一個示例性實施例中,m和n是介于1和50之間的正整數(shù)(對于3維的實施例來說,q是介于1和10之間的正整數(shù))。在一些實施例中,m可以等于n,即窗口可以是正方形。在一些實施例中,窗口可以是矩形。在一些實施例中,窗口具有非對稱的形狀,例如奇數(shù)×偶數(shù)的象素或偶數(shù)×奇數(shù)的象素。CDF可以合并幾個不同于上面描述的形式中的附加特征。在該過程中,圖像處理可以以單次通過的方式實現(xiàn),即以非迭代的方式。
為了對CDF更加有效,在一些實施例中,窗口中的項(entry)可以不具有任一的零濾波系數(shù)或加權。例如,當設計3×3的濾波器時,可以根據(jù)各向異性擴散模型的傳導函數(shù)來確定濾波器矩陣FUk中的角落項。因此,在一些實施例中,可以依照窗口的尺寸使所有與窗口的中心象素相關的地理方向離散化,由此確定窗口中所有元素的項。
傳導函數(shù)c|u|的使用提出了難題,該函數(shù)是未知解u的空間梯度的量值的函數(shù)。特別地,由于該未知解u用于最初地表示輸入圖像數(shù)據(jù),它可能被噪聲污染,并且u的空間梯度值可以是不精確的,并具有很強的波動。為了解決這個問題,在離散的傳導函數(shù)中輸入圖像的空間梯度在水平和/或垂直方向可以由輸入圖像的子波變換替換。在可替換的實施例中,傳導函數(shù)中輸入圖像的空間梯度可以修改成使得在應用梯度運算之前在(未知)解u上執(zhí)行高斯卷積。當CDF以單遍掃描的方式應用時,如果可以多次應用CDF,隨后迭代可以或者不使用上面描述的傳導函數(shù)c|u|的修改版本,因為過濾的圖像不再帶有噪聲。
此外,引入了時間-標度變換(也稱為時間-標度映射)。這些變換使在各向異性擴散的PDE的離散化中恒定的時間步長參數(shù)Δt(下文用λ表示)映射到一個或多個象素相關的標度。這些標度可公式化為有噪聲的輸入圖像中的中心象素的函數(shù),以及濾波器窗口中其相鄰象素的函數(shù)。如下面進一步描述的,時間-標度變換與一個或多個參數(shù)相關聯(lián),所述參數(shù)可確定圖像平滑度/銳度調(diào)節(jié)。該一個或多個參數(shù)可以用于產(chǎn)生令人滿意的模糊效果,同時使某些個別圖像邊緣的銳度保持大體上完好。時間-標度變換的使用可以為CDF構建濾波核,而不用在數(shù)值上解出各向異性擴散或其它的PDE。因此,當應用CDF來去除或減小圖像中的噪聲時,不需要迭代步驟和停止時間k。
在離散化之后,各向異性擴散的PDE可以表達為uijk+1=uijk+Δth2+[CEk∂E+CSk∂S+CWk∂W+CNk∂N]uijk,]]>其中uij0表示輸入圖像的第(i,j)個象素,uijk表示k次迭代(或k次迭代時間步長)之后差分方程的解(在第(i,j)個象素的位置),同時恒定的時間步長參數(shù)用Δt表示,相鄰的象素距離用h表示。CEk、CSk、CWk和CNk表示沿東(E)、南(S)、西(W)、和北(N)的地理方向或沿與第一組相鄰象素相關聯(lián)的定向?qū)鲗Ш瘮?shù)c|u|的離散化。下文中,這些都表示為離散的傳導函數(shù)。由于傳導函數(shù)c|u|是未知解u=u(x,y,t)的梯度的函數(shù),其中(x,y)是空間坐標和t是時間變量,因此差分方程也取決于該未知解,因此也是圖像內(nèi)容相關的。在上面的公式中,E、S、W和N表示應用于象素上的一階空間差分,特別地∂Euijk=ui+1,jk-uijk]]>∂Suijk=ui,j-1k-uijk]]>∂Wuijk=ui-1,jk-uijk]]>∂Nuijk=ui,j+1k-uijk.]]>該差分方程可以重新表達為uijk+1=[1-Δth2(CEk+CSk+CWk+CNk)]uijk+Δth2CEkui+1jk+Δth2CSkuij-1k+Δth2CWkui-1jk+Δth2CNkuij+1k.]]>反過來,該差分方程可以依次被重新公式化為迭代象素相關的濾波過程,其中濾波器用矩陣模板表示,F(xiàn)ijk=0ΔtcNk/h20ΔtcWk/h21-Δt(cNk+cEk+cSk+cWk)/h2ΔtcEk/h20ΔtcSk/h20,]]>其中離散的傳導函數(shù)CEk、CSk、CWk和CNk是第一組相鄰象素以及中心象素的函數(shù),即uijk,ui+1,jk,ui,j-1k,ui-1,jk,ui,j+1k.
因此,CEk、CSk、CWk和CNk也取決于象素位置(i,j)。然而為了計數(shù)簡單,沒有顯示下標i,j。在現(xiàn)有的迭代濾波方法中,迭代濾波過程(k=0,1,2...)可以用分量方式的矩陣乘法(也稱為逐項乘法或逐個元素的乘法)描述,其可由所有得到的矩陣分量的總和獲得或由下式獲得ui,jk+1=ΣFijk⊗uijk,]]>其中uijk是在k次迭代后象素組中對應于濾波窗口的中心象素。
為了給具有3×3濾波器窗口的CDF構建濾波核,也可以使沿東北(NE)、東南(SE)、西南(SW)和西北(NW)方向的第二組相鄰象素離散化。該差分方程可以擴展成包括這4個附加象素,uijk+1=uijk+Δth2[(CEk∂E+···+CNk∂N)+v(CNEk∂NE+···+CNWk∂NW)]uijk]]>其中v是獨立進行調(diào)節(jié)的參數(shù),或者是可以耦合到λ=Δt的參數(shù),從而對于圖像的平滑度/銳度調(diào)節(jié)可以僅使用一個自由參數(shù)。通過定義一個內(nèi)容相關的標度值,可以修改CDF中的差分方程kij=1+αh2[(CE0+···+CN0)+v(CNE0+···+CNW0)],]]>其中α是對應于圖像平滑度/銳度調(diào)節(jié)的參數(shù),并且通過引入時間-標度變換Δt=λ→αkij,]]>該變換使恒定的時間-步長參數(shù)Δt映射到象素相關的也就是內(nèi)容相關的標度 該得到的用于清理有噪聲的輸入圖像的CDF是uij=ΣFij⊗uij0.]]>符號表示分量方式的矩陣乘法,符號∑表示得到矩陣中所有分量或項的總和。注意,迭代指數(shù)k不再存在。3×3的CDF可以用下面的矩陣模板表示Fij=1kijμCNW0h2αCN0h2μCNE0h2αCW0h21αCE0h2μCSW0h2αCS0h2μCSE0h2,]]>其中引入了另一圖像平滑/銳化參數(shù)μ=αv(如前所述,參數(shù)α可以和參數(shù)μ相耦合,從而得到圖像平滑/銳化調(diào)節(jié)的單個自由參數(shù))。在一個示例性實施例中,μ=α/4。該CDF還可以明確地寫為uij=1kij{(μCNW0h2ui-1,j+10+αCN0h2ui,j+10+μCNE0h2ui+1,j+10)+(αCW0h2ui-1,j0+uij0+αCE0h2ui+1,j0)+(μCSW0h2ui-1,j-10+αCS0h2ui,j-10+μCSE0h2ui+1,j-10)}.]]>注意,濾波器加權是相鄰象素和中心象素之間差值與參數(shù)(α或μ)的乘積,參數(shù)(α或μ)對應于第一組相鄰象素或第二組相鄰象素。還需注意,內(nèi)容相關的標度值kij與中心象素相關,并確保矩陣Fij被標準化,從而濾波器加權或元素的總和等于或近似等于一個固定的值。濾波器加權的總和由于數(shù)值處理偽象等類似物而從該固定值略微變化。CDF中的偏心元素可以確定輸入圖像的平滑。
類似地,可以確定或構建用于3×5、5×5和7×7的窗口的CDF。對于3×5的窗口,該CDF可以公式化為λci+1,j-2/ki,jβci+1,j-1/ki,jαci+1,j/ki,jβci+1,j+1/ki,jλci+1,j+2/ki,jωci,j-2/ki,jαci,j-1/ki,j1/kijαci,j+1/ki,jωci,j+2/ki,j.
λci-1,j-2/ki,jβci-1,j-1/ki,jαci-1,j/ki,jβci-1,j+1/ki,jλci-1,j+2/ki,j注意,通過使用指數(shù)(i+2,j+1)...(i-2,j+1)已經(jīng)考慮了附加方向(NE-E,E-E,SE-E,SW-W,W-W,NW-W),對應于附加相鄰象素組的附加平滑/銳化參數(shù)已經(jīng)包括在內(nèi)。在該CDF的公式中使用的四個參數(shù)(α,β,γ,ω)可以結合在一起,以產(chǎn)生一個或兩個獨立參數(shù)。典型的 比例 包括 1/2,1/4,3/4,3/8,5/8,7/8,1/1 6,3/16,5/16,7/16,9/16,11/16,13/16,15/16,1/32,3/32,5/32,7/32,9/32,11/32,13/32,15/32,17/32,19/32,21/32,23/32,25/32,27/32,29/32和31/32。對于5×5的窗口,該CDF可以公式化為γci-2,j+2/ki,jλci-1,j+2/ki,jνci,j+2/ki,jλci+1,j+2/ki,jγci+2,j+2/ki,jλci-2,j+1/ki,jβci-1,j+1/ki,jαci,j+1/ki,jβci+1,j+1/ki,jλci+2,j+1/ki,jνci-2,j/ki,jαci-1,j/ki,j1/kijαci+1,j/ki,jνci+2,j/ki,j·λci-2,j-1/ki,jβci-1,j-1/ki,jαci,j-1/ki,jβci+1,j-1/ki,jλci+2,j-1/ki,jγci-2,j-2/ki,jλci-1,j-2/ki,jνci,j-2/ki,jλci+1,j-2/ki,jγci+2,j-2/ki,j在該CDP的公式中使用的五個參數(shù)(α,β,γ,ω,v)可以結合在一起,以產(chǎn)生一個或兩個獨立參數(shù)。
典型的比例包括1/2,1/4,3/4,3/8,5/8,7/8,1/16,3/16,5/16,7/16,9/16,11/16,13/16,15/16,1/32,3/32,5/32,7/32,9/32,11/32,13/32,15/32,17/32,19/32,21/32,23/32,25/32,27/32,29/32和31/32。對于7×7的窗口,該CDF可以公式化為
σci-3,j+3/ki,jχci-2,j+3/ki,jδci-1,j+3/ki,jκci,j+3/ki,jδci+1,j+3/ki,jχci+2,j+3/ki,jσci+3,j+3/ki,jχci-3,j+2/ki,jγci-2,j+2/ki,jλci-1,j+2/ki,jνci,j+2/ki,jλci+1,j+2/ki,jγci+2,j+2/ki,jχci+3,j+2/ki,jδci-3,j+1/ki,jλci-2,j+1/ki,jβci-1,j+1/ki,jαci,j+1/ki,jβci+1,j+1/ki,jλci+2,j+1/ki,jδci+3,j+1/ki,jκci-3,j/ki,jνci-2,j/ki,jαci-1,j/ki,j1/kijαci+1,j/ki,jνci+2,j/ki,jκci+3,j/ki,jδci-3,j-1/ki,jλci-2,j-1/ki,jβci-1,j-1/ki,jαci,j-1/ki,jβci+1,j-1/ki,jλci+2,j-1/ki,jδci+3,j-1/ki,jχci-3,j-2/ki,jγci-2,j-2/ki,jλci-1,j-2/ki,jνci,j-2/ki,jλci+1,j-2/ki,jγci+2,j-2/ki,jχci+3,j-2/ki,jσci-3,j-3/ki,jχci-2,j-3/ki,jδci-1,j-3/ki,jκci,j-3/ki,jδci+1,j-3/ki,jχci+2,j-3/ki,jσci+3,j-3/ki,j在該CDF的公式中使用的九個參數(shù)(α,β,γ,ω,ν,κ,δ,χ,γ)可以結合在一起,以產(chǎn)生一個或兩個獨立參數(shù)。典型的比例包括1/2,1/4,3/4,3/8,5/8,7/8,1/16,3/16,5/16,7/16,9/16,11/16,13/16,15/16,1/32,3/32,5/32,7/32,9/32,11/32,13/32,15/32,17/32,19/32,21/32,23/32,25/32,27/32,29/32,31/32,1/64,3/64,5/64,7/64,9/64,11/64,13/64,15/64,17/64,19/64,21/64,23/64,25/64,27/64,29/64,31/64,33/64,35/64,37/64,39/64,41/64,43/64,45/64,47/64,49/64,51/64,53/64,55/64,57/64,59/64,61/64,63/64和65/64。
現(xiàn)在我們轉向子波變換的實施例。圖8是示出了確定或構建濾波核的過程的實施例800的流程圖,所述濾波核包括前面描述的子波變換。接收圖像u(810)。使用u與低通濾波器L的卷積來產(chǎn)生過濾的圖像(L*u)(812)。在一些實施例中,沿水平方向和/或垂直方向的L的加權總和具有有限數(shù)值。(L*u)的差分運算是沿水平或垂直方向的u的子波變換。如果該子波變換未沿兩個方向之一應用,那么可以替代地沿該方向使用一階差分運算。在一些實施例中,可以使用其他子波變換。確定子波變換(|(L*u)|)的量值或一階差分(814)。該數(shù)值可以量子化為相應傳導電平I(816)。可以對帶噪聲的輸入圖像使用子波變換(代替一階差分運算)。該結果可對應于對應的傳導率c(i*2m-n)(818)。流程圖500包括更少的運算或附加的運算。此外,兩種或多種運算可以組合在一起和/或可以修改運算的順序。
如圖8所示,有噪聲的輸入圖像可以被修改以產(chǎn)生與傳導函數(shù)相關聯(lián)的離散傳導元素。在一個示例性實施例中,代替用于離散的梯度運算的一階差分,例如通過結合電平/傳導率圖表應用u的低通濾波的差分運算,可以代替地實現(xiàn)子波變換。在一個示例性實施例中,在c|u|中u的空間梯度可以用u的一些離散的樣條子波變換替換。例如c|u|中的u用(L*u)=Wu替換,其中L是與一些期望的基數(shù)B樣條函數(shù)相關聯(lián)的低通濾波器,符號*表示標準的卷積運算,并且Wu表示離散的子波變換運算。算子L和W可以沿相應(地理)方向相對有噪聲的輸入圖像u的中心象素來確定。例如WEui,j=E(L*u)ij,WSui,j=S(L*u)i,j,WWui,j=W(L*u)i,j,WNui,j=N(L*u)i,j,WNEui,j=NE(L*u)i,j,WSWui,j=SW(L*u)i,j,WNWui,j=NW(L*u)i,j在可替換的實施例中,可以在應用差分運算來產(chǎn)生期望的離散化之前使用高斯卷積作為u的低通濾波器。
表1示出了一個傳導電平/傳導函數(shù)圖表的實施例,其使傳導電平與離散傳導元素的值相關聯(lián)。如果輸入圖像對每個通道具有r位灰度級(典型地,r=8)并且使傳導電平量子化為s位(s小于或等于r并且通常其范圍介于1至8),那么p=|u|的范圍是序列
。如果使該序列量子化為2r-s
,那么傳導函數(shù)c(p)將
映射到[c(0),c(2r-s),...,c(2r-s(2s-1))]。如前所述,傳導函數(shù)的典型實例包括c(p)=e-p/k,c(p)=e-p2/K2]]>,和c(p)=K2/(K2+P2),其中K對于所有圖像象素是正整數(shù),或者(對于圖像平滑度/銳度的調(diào)節(jié))可以自適應于相鄰象素的值。在K作為全局標量的一個示例性實例中,K可以是50。對于許多圖像,該數(shù)字幾乎大于圖像中梯度值的量值的90%。獲得的表格可以用于查詢程序,如下面參考圖13和14進一步描述的,其中有噪聲的1位圖像(單個圖像邊緣可分離為0位的″黑色”部分和1位的″白色”部分)可認為是輸入圖像,相應(中心)象素是圖13中圖像邊緣上的象素,而不是圖14中圖像邊緣上的象素。
表1.傳導電平/傳導函數(shù)表。
現(xiàn)在我們轉向附加的實施例,其示出了CDF的確定或構建和其使用。圖9是示出了在圖像、圖像片、或圖像塊如尺寸為5×5的P或B幀(以視頻壓縮的方式)的宏塊中的一組象素900的方框圖。圖10、11和12示出了對應的2維CDF的結構,其分別對于標記為A、B和C的象素組具有3×3的窗口,以便去除或減小5×5的圖像片中的噪聲。圖9中的象素組A示出了用于圖10中角象素uoo的CDF的結構和應用。圖9中的象素組B示出了用于圖11中邊界象素uio的CDF的結構和應用。圖9中的象素組C示出了用于圖11中內(nèi)部中心象素uij的CDF的結構和應用。對于標記為A的象素組,中心象素是象素組900中的角象素。因此,它可以根據(jù)其3個相鄰象素的象素值用一值替換。對于標記為B的象素組,中心象素是象素900組中的邊界象素,它可以根據(jù)其5個相鄰象素的象素值用一值替換。對于標記為C的象素組,中心象素是象素組900中的內(nèi)部象素,它可以根據(jù)其8個相鄰象素的象素值用一值替換。
圖10是示出了為CDF構建濾波核并將該CDF應用于角象素uoo的過程的實施例1000的流程圖。將一階差分運算應用于一組象素1010,以產(chǎn)生使用電平和傳導率圖(如表1所示)進行映射的元素1012,進而產(chǎn)生離散傳導元素1014。通過使離散傳導元素1014的預定義子集與平滑和銳化參數(shù)α和μ相乘,可以構建濾波核1016。在示例性的實施例中,α近似介于0.0625和1之間,μ近似介于0和1之間。例如,α=0.25和μ=0.0625。元素1016與象素組1010逐個元素地相乘1022,從而產(chǎn)生元素1024。對元素1024(1025)求和以產(chǎn)生值ro,o1026。也可以對元素1016(1018)求和以產(chǎn)生時間-標度值ko,o1020,有時稱為標準化值。值ro,o和時間-標度值ko,o1020的比率1027是對應的過濾的輸出象素值1028。
圖11是示出了為CDF構建濾波核并將該CDF應用于邊界象素uio的過程的實施例1100的流程圖。將一階差分運算應用于一組象素1110,以產(chǎn)生使用電平和傳導率圖(如表1所示)進行映射的元素1112,進而產(chǎn)生離散傳導元素1114。通過使離散傳導元素1114的預定義子集與平滑和銳化參數(shù)α和μ相乘,可以構建濾波核1116。該元素1116與象素組1110逐個元素地相乘1122,從而產(chǎn)生元素1124。對元素1124求和(1125)以產(chǎn)生值ri,o1126。對元素1116求和(1118)以產(chǎn)生時間-標度值ki,o1120,有時稱為標準化值。值ri,o和時間-標度值ki,o1120的比率1127是對應的過濾的輸出象素值1128,其對應于輸入象素值ui,o。
圖12是示出了為CDF構建濾波核并將該CDF應用于內(nèi)部(中心)象素uij的過程的實施例1200的流程圖。將一階差分運算應用于一組象素1210,以產(chǎn)生使用電平和傳導率圖(如表1所示)進行映射的元素1212,進而產(chǎn)生離散傳導元素1214。通過使離散傳導元素1214的預定義子集與平滑和銳化參數(shù)α和μ相乘,可以構建濾波核1216。該元素1216與象素組1210逐個元素地相乘1222,從而產(chǎn)生元素1224。對元素1224求和(1225)以產(chǎn)生值ri,j1226。對元素1216求和(1218)以產(chǎn)生時間-標度值ki,j1220,有時稱為標準化值。計算值ri,j1226和時間-標度值ki,j1220的比率1227以生成過濾的輸出象素值1228(ri,j/ki,j),其對應于輸入象素值ui,j。
圖13是示出了構建和使用用于CDF的濾波核的過程的實施例1300的流程圖。將一階差分運算應用于一組象素1310以產(chǎn)生元素1311,其中一中心象素位于圖像邊緣上(在圖像片或陣列內(nèi))。該實例中的象素組1310表示圖像的亮區(qū)域和暗區(qū)域之間的垂直邊緣。使元素1311量子化為對應的傳導電平,以產(chǎn)生離散的傳導函數(shù)值1312,并使用電平和傳導率圖表(如表1所示)進行映射以產(chǎn)生元素1314。使元素1314的預定義子集與平滑和銳化參數(shù)α和μ相乘,以產(chǎn)生濾波核1316。象素組1310與濾波核1316逐個元素地相乘(1322),從而產(chǎn)生元素1324。對元素1324求和(1325)以產(chǎn)生值ri,j=28.9316(1326)。對濾波核元素1316求和(1318)以產(chǎn)生時間-標度值ki,j=3.0015(1320)。計算值ri,j1326和時間-標度值ki,j1320的比率1327,以產(chǎn)生過濾的輸出象素值1328(ri,j/ki,j=9.6275),其對應于輸入象素值ui,j在該實例中,過濾的象素1328可以量子化為數(shù)值10。在實施例1300中,α=0.5,μ=0.25,K=50,傳導函數(shù)選擇成c(p)=e-p22po2.]]>圖14是示出了構建和使用用于CDF的濾波核的過程的實施例1400的流程圖。將一階差分運算應用于一組象素1410以產(chǎn)生元素1411,其中中心象素不在圖像邊緣上,使元素1411量子化為對應的傳導電平以產(chǎn)生離散的傳導函數(shù)值1412,并使用電平和傳導率圖表(如表1所示)進行映射以產(chǎn)生元素1414。使元素1414的預定義子集與平滑和銳化參數(shù)α和μ相乘以及逐個元素(或者以項的方式)相乘,以產(chǎn)生濾波核1416?,F(xiàn)在將具有初始中心象素=230的輸入圖像片1410與CDF1416逐個元素地相乘1422,從而產(chǎn)生元素1424。對元素1424求和(1425)以產(chǎn)生值ri,j(921.826)1426,并對CDF的元素1416求和1418以產(chǎn)生時間-標度值ki,j(3.995)1420。計算值ri,j1426和時間-標度值ki,j1420的比率1427,以產(chǎn)生過濾的輸出象素值(230.745)1428,其對應于輸入象素值ui,j。過濾的象素1428可以量子化為數(shù)值231。在實施例1400中,α=0.5,μ=0.25,K=50,傳導函數(shù)選擇成c(p)=e-p22po2.]]>CDF可以用作預編碼器,用于去除或減小圖像中的噪聲,它可以是視頻序列的I幀。例如,在圖15的實施例1500中,8×8的圖像片1512或I幀由CDF1514處理。將過濾的圖像1516的圖像片或I幀發(fā)送到編碼器1518。該編碼器1518包括離散的余弦變換(DCT)1520、量子化1522和熵編碼1524。輸出具有較小比特率的編碼位流1526。流程圖1500可以包括更少的運算和/或附加運算。此外,兩種或多種運算可以組合在一起和/或可以改變運算的順序。
相應CDF可以作為預編碼器集成到現(xiàn)有的編碼器中,例如MJPEG、MPEG-1,2,4,7和H263、AVC或H264。使用相應CDF或一組CDF產(chǎn)生的過濾的圖像可與現(xiàn)有解碼器兼容。CDF的相應濾波核以用來在運動估計補償中清理I幀、P幀和/或宏塊。圖16是示出了這種過程的實施例1600的方框圖。濾波核1612應用于運動補償?shù)腜幀1608,并從過濾的I幀1610(其示出于圖15中)減去1614。將DCT1618和量子化1620應用于得到的過濾的B/P幀1616。
圖17是示出了一過程的實施例1700的方框圖,該過程可過濾1718數(shù)字圖像或圖像片如幀172,特別地,其可用于過濾171816×16的宏塊以便于運動補償。在一些實施例中,使用前面的I或P幀1710來確定運動矢量1716_1和/或使用隨后的P或B幀1714來確定運動矢量1716_2。如果幀1712是P幀則產(chǎn)生前者,如果幀1712是B幀則產(chǎn)生后者。
圖18是過濾或預編碼三維數(shù)字圖像也就是圖像立方的過程1800的實施例的流程圖。在過程1800中,在將運動估計和補償應用于P幀和B幀(其示出于圖17中),以產(chǎn)生視頻幀1810、1812和1814之后,產(chǎn)生3維CDF并應用1816它來減小或消除來自圖像立方的噪聲,該立方基于三個連續(xù)的視頻幀1810、1812、1814。在一些實施例中,例如MJEP、視頻幀1810、1812和1814是I幀。在一些實施例中,用于CDF的濾波核可以應用于構成圖像立方的I、P和/或B幀的混合幀。
用于CDF的濾波核可應用于一個或多個圖像,或一個或多個圖像的一個或多個子集,從而減小或消除噪聲同時保持圖像內(nèi)容大體上不變,所述圖像內(nèi)容例如是與圖像邊緣相關聯(lián)的紋理和/或空間頻率。如圖19所示,它示出了未過濾的圖像和使用本發(fā)明的實施例所產(chǎn)生的過濾的數(shù)字圖像。
為了說明和描述的目的,在上面提供了對本發(fā)明特定實施例的描述。它們不是為了窮盡或者將本發(fā)明限制到公開的精確形式。相反,應該理解,考慮到上面的教導可許多修改和變化都是可能的。為了最佳地說明本發(fā)明的原理和其實際應用選擇和描述了多個實施例,由此使本領域技術人員能夠最佳地利用本發(fā)明,并且具有各種修改的各個實施例適于所設想的特定用途。
權利要求
1.一種過濾數(shù)字圖像的方法,包括將濾波核應用于一組象素中的相應象素,以便依照第一濾波參數(shù)來平滑噪聲和保持與數(shù)字圖像中的圖像邊緣相關聯(lián)的空間頻率,其中該濾波核是相應象素的函數(shù),并且對于相應象素具有閉合形式,并且其中濾波核包括來自第一組相鄰象素的貢獻,并具有內(nèi)容相關的標準化,使得濾波核中元素的總和等于一個大體上固定的值。
2.根據(jù)權利要求1的方法,其中所述應用包括相應象素的單遍掃描。
3.根據(jù)權利要求1的方法,其中對象素組中的每一象素執(zhí)行所述應用以便產(chǎn)生過濾的數(shù)字圖像。
4.根據(jù)權利要求3的方法,其中對象素組中的每一象素應用濾波核附加的一次或多次而使過濾的數(shù)字圖像大體上不變。
5.根據(jù)權利要求1的方法,其中第一濾波參數(shù)確定平滑和銳化之間的邊界。
6.根據(jù)權利要求1的方法,其中通過減小數(shù)字圖像中一位置處的噪聲平滑,該第一濾波參數(shù)大體上維持數(shù)字圖像中的紋理信息,所述數(shù)字圖像包含比閾值更大的空間頻率。
7.根據(jù)權利要求1的方法,其中濾波核中的偏心元素包括第一組相鄰象素中的象素和在各向異性擴散方程的離散化中相應象素之差的量,濾波核中的中心象素對應于相應象素,以及其中第一濾波參數(shù)使各向異性擴散方程的離散化中的時間步長映射到內(nèi)容相關的標度。
8.根據(jù)權利要求7的方法,其中各向異性擴散方程的離散化中的傳導率是子波變換的函數(shù)。
9.根據(jù)權利要求8的方法,其中該子波變換被實現(xiàn)為查詢表。
10.根據(jù)權利要求1的方法,還包括使用濾波核來修改象素的顏色。
11.根據(jù)權利要求10的方法,其中修改顏色包括顏色分量。
12.根據(jù)權利要求1的方法,其中濾波核包括來自第二組相鄰象素的貢獻,并進一步與第二濾波參數(shù)一致。
13.根據(jù)權利要求1的方法,其中濾波核對應于尺寸為(2m+1)×(2n+1)的窗口,并包括第一組相鄰象素。
14.根據(jù)權利要求13的方法,其中m等于n。
15.根據(jù)權利要求13的方法,其中相應象素的m和n選自由1至50之間的正整數(shù)構成的組。
16.根據(jù)權利要求1的方法,其中濾波核的m和n是象素尺寸和圖像分辨率的函數(shù)。
17.根據(jù)權利要求1的方法,其中數(shù)字圖像包括視頻數(shù)據(jù)。
18.根據(jù)權利要求1的方法,其中對象素組中的每一象素執(zhí)行所述應用,以便產(chǎn)生預編碼的數(shù)字圖像,該方法還包括根據(jù)預定義的圖像壓縮方法來壓縮該預編碼的數(shù)字圖像。
19.一種過濾數(shù)字圖像的方法,包括將濾波核應用到一組象素中的相應象素上,以依照濾波參數(shù)來平滑噪聲和保持與數(shù)字圖像中的圖像邊緣相關聯(lián)的空間頻率,其中過濾的象素對應于Σm,n1γM⊗U,]]>其中M是閉合形式的陣列,該陣列是相應象素的函數(shù)并具有(2m+1)×(2n+1)的窗口尺寸,其中m和n是正整數(shù),并且M包括來自(2m+1)×(2n+1)組相鄰象素的貢獻,U是象素組中的子陣列并包括相應象素和相鄰象素組,表示M中元素和U中元素的逐個元素的乘積,并且γ是內(nèi)容相關的標準化因子,使得陣列 中元素的總和等于一個大體上固定的值。
20.一種數(shù)字圖像處理器,包括存儲器;處理器;和程序,其中該程序存儲在存儲器中,并配置成由處理器執(zhí)行,該程序包括用于將濾波核應用到一組象素中的相應象素上以依照濾波參數(shù)來平滑噪聲和保持與數(shù)字圖像中的圖像邊緣相關聯(lián)的空間頻率的指令,其中濾波核是相應象素的函數(shù),并且對于相應象素具有閉合形式,并且其中濾波核包括來自第一組相鄰象素的貢獻,并具有內(nèi)容相關的標準化,使得濾波核中元素的總和等于一個大體上固定的值。
21.一種用于過濾數(shù)字圖像的計算機程序產(chǎn)品,包括計算機可讀的存儲介質(zhì)和嵌入于其中的計算機程序機構,該計算機程序機構包括用于將濾波核應用到一組象素中的相應象素上以依照濾波參數(shù)來平滑噪聲和保持與數(shù)字圖像中的圖像邊緣相關聯(lián)的空間頻率的指令,其中濾波核是相應象素的函數(shù),并且對于相應象素具有閉合形式,并且其中濾波核包括來自第一組相鄰象素的貢獻,并具有內(nèi)容相關的標準化,使得濾波核中元素的總和等于一個大體上固定的值。
22.一種數(shù)字圖像處理器,包括存儲器裝置;處理器裝置;和程序機構,其中該程序機構存儲于存儲器裝置中,并配置成由處理器裝置執(zhí)行,該程序機構包括用于將濾波核應用到一組象素中的相應象素上以依照濾波參數(shù)來平滑噪聲和保持與數(shù)字圖像中的圖像邊緣相關聯(lián)的空間頻率的指令,其中濾波核是相應象素的函數(shù),并且對于相應象素具有閉合形式,其中濾波核包括來自第一組相鄰象素的貢獻,并具有內(nèi)容相關的標準化,使得濾波核中元素的總和等于一個大體上固定的值。
全文摘要
描述了一種過濾數(shù)字圖像的方法。將濾波核應用于一組象素中的相應象素,以便依照第一濾波參數(shù)消除噪聲和保持與數(shù)字圖像中圖像邊緣相關聯(lián)的空間頻率。該濾波核是相應象素的函數(shù),并且對相應象素具有閉合形式。濾波核包括來自第一組相鄰象素的貢獻,并具有內(nèi)容相關的標準化,使得濾波核中元素的總和等于一個大體上固定的值。
文檔編號G06K9/64GK101027681SQ200580026770
公開日2007年8月29日 申請日期2005年6月14日 優(yōu)先權日2004年6月14日
發(fā)明者崔錦泰, 王建忠 申請人:普瑞科德公司