亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)的量化方法與流程

文檔序號(hào):11157553閱讀:1481來源:國(guó)知局
一種基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)的量化方法與制造工藝

本發(fā)明屬于多媒體通信中的圖像壓縮技術(shù)領(lǐng)域。



背景技術(shù):

圖像壓縮一直是圖像處理領(lǐng)域的經(jīng)典問題之一,旨在于去除圖像中的冗余和相關(guān),以實(shí)現(xiàn)圖像數(shù)據(jù)的高效傳輸或存儲(chǔ)。為滿足日益增長(zhǎng)的應(yīng)用需求,多媒體通信技術(shù)的快速發(fā)展,視頻、圖像等多媒體文件不斷向更高精度、更高分辨率方向突破,隨之而來的龐大數(shù)據(jù)量對(duì)有限的傳輸帶寬以及存儲(chǔ)能力提出了嚴(yán)峻的挑戰(zhàn)。為了有效解決這一問題,圖像壓縮一直是圖像處理領(lǐng)域的研究熱點(diǎn)。

圖像壓縮方法可分為兩大類:即無損壓縮和有損壓縮。前者要求解碼端必須無失真的恢復(fù)出原圖像,而后者允許存在少量的失真。在實(shí)際應(yīng)用中,我們通常并不要求精確的恢復(fù)出原圖像,因此有損壓縮方法的使用更為廣泛。有損壓縮系統(tǒng)一般由三部分組成:圖像變換,量化和編碼。JPEG和JPEG2000是目前最為常用的兩種圖像壓縮標(biāo)準(zhǔn),分別以離散預(yù)先變換(DCT)和離散小波變換(DWT)實(shí)現(xiàn)圖像變換。在接下來的量化步驟中,JPEG根據(jù)人類視覺系統(tǒng)對(duì)高、低頻系數(shù)敏感性的不同選擇量化矩陣,控制壓縮的比例,在大小和畫質(zhì)中找到平衡;JPEG2000則先用較小的步長(zhǎng)對(duì)信號(hào)進(jìn)行細(xì)致的量化,然后根據(jù)用戶的需求,采用不同的步長(zhǎng)進(jìn)行逆量化,以提供給用戶不同質(zhì)量的圖像。最后,JPEG和JPEG2000分別對(duì)量化系數(shù)采用霍夫曼編碼和算術(shù)編碼進(jìn)行熵編碼。

近年來,“基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)”引起了眾多研究者的興趣。該系統(tǒng)進(jìn)行圖像壓縮的思路主要基于圖像的稀疏表示理論。所謂稀疏表示,即以少量基函數(shù)的線性組合來近似圖像信號(hào),從而可以用較少的系數(shù)表示圖像信息。因此,“基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)”的壓縮原理就是對(duì)圖像進(jìn)行變換,使圖像能量得到充分的集中,以獲得圖像的稀疏表示,進(jìn)而對(duì)其中少量的非零系數(shù)進(jìn)行編碼,由此達(dá)到壓縮的目的。

“基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)”的數(shù)學(xué)模型可表示為:

X=DW+ε,

其中,X表示待壓縮的圖像,D表示學(xué)習(xí)字典,即變換基,W表示稀疏系數(shù)矩陣,ε表示近似誤差。與DCT和DWT的完備正交基相比,利用過完備變換基的冗余性可以產(chǎn)生更加稀疏的變換系數(shù),因此D一般具有過完備性。同時(shí),不同類別的圖像具有各自不同的特點(diǎn),例如圖像可分為自然圖像、遙感圖像、人臉圖像等。進(jìn)一步細(xì)分,遙感圖像又可分為平滑圖像、細(xì)紋理圖像、粗紋理圖像等,自然圖像可分為人物圖像、景物圖像等。針對(duì)特定圖像類型選用適應(yīng)圖像內(nèi)容的過完備變換基,可以更有效的捕捉圖像的各種特征。因此,如何訓(xùn)練過完備變換基,即對(duì)學(xué)習(xí)字典算法的研究,成為“基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)”的關(guān)鍵之一。該壓縮系統(tǒng)的另一關(guān)鍵是,給定待壓縮圖像X和學(xué)習(xí)字典D,如何實(shí)現(xiàn)圖像的稀疏變換,得到系數(shù)矩陣W。由于該問題是一個(gè)NP問題,難以求得精確解,因此大量研究集中于尋求問題的最優(yōu)近似解,試圖在最小的近似誤差下得到最稀疏的解。

“基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)”框圖如圖1所示,包括離線和在線兩部分。在離線部分中,編碼端采用字典學(xué)習(xí)算法對(duì)大量訓(xùn)練樣本進(jìn)行學(xué)習(xí),得到學(xué)習(xí)字典D,存儲(chǔ)在編碼和解碼兩端。在線部分中,采用稀疏編碼算法對(duì)待壓縮圖像X在D下稀疏分解,得到系數(shù)矩陣W。接下來,提取W中的非零系數(shù)Y及相應(yīng)的位置S,對(duì)Y進(jìn)行量化,對(duì)量化系數(shù)和S進(jìn)行熵編碼,轉(zhuǎn)換為適合存儲(chǔ)或傳輸?shù)臄?shù)據(jù)形式。在解碼端,對(duì)接收數(shù)據(jù)進(jìn)行熵解碼和系數(shù)矩陣的重建,將與學(xué)習(xí)字典D相乘,即可得到重建圖像

目前,大多數(shù)“基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)”以字典學(xué)習(xí)和稀疏編碼算法為研究重點(diǎn)。其中,經(jīng)典的字典學(xué)習(xí)算法有KSVD,MOD,ML等,以及稀疏編碼算法OMP,Lasso,BP等。

常用量化方法有下列兩種:

量化作為圖像壓縮系統(tǒng)的一大組成部分,發(fā)揮著重要的作用。量化用于將信號(hào)的連續(xù)取值近似為較少的離散值,因此是造成編解碼失真的根源。在一定的主觀保真度圖像的前提下,量化通過丟掉那些對(duì)視覺影響不大的信息,獲得較高的壓縮比。但目前,“基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)”尚未對(duì)量化展開進(jìn)一步的研究和技術(shù)的創(chuàng)新,現(xiàn)有系統(tǒng)設(shè)計(jì)普遍采用均勻量化和K均值聚類量化。

均勻量化

設(shè)輸入信號(hào)的最小值和最大值分別為a和b,量化電平數(shù)為M,則均勻量化的量化間隔為

量化器輸出量化值mq

mq=qi,當(dāng)mi-1<m≤mi

其中,mi為第i個(gè)量化區(qū)間的終點(diǎn),可寫成mi=a+iΔv,qi為第i個(gè)量化區(qū)間的量化電平,可選取i=1,2,...,M。

通常,均勻量化的性能由量化信噪比Sq/Nq來度量。其中,Sq為量化器的信號(hào)功率,表示為

其中,x為輸入信號(hào)值,f(x)為x的概率密度函數(shù)。

Nq為量化噪聲功率,表示為

均勻量化操作簡(jiǎn)單,但它的顯著缺點(diǎn)是量化信噪比隨信號(hào)電平的減小而下降。注意到無論輸入信號(hào)大小如何,量化噪聲的均方根值都固定不變。因此,當(dāng)信號(hào)較小時(shí),量化信噪比很小。

K均值聚類量化

K均值算法是一種聚類算法,它以歐式距離作為相似度準(zhǔn)則,將所有數(shù)據(jù)與K個(gè)聚類中心的距離最小為目標(biāo)進(jìn)行迭代優(yōu)化,最終將數(shù)據(jù)聚為K類,同時(shí)得到K個(gè)最優(yōu)的聚類中心。具體算法如下:

(1)初始化:設(shè)定迭代終止誤差ε,隨機(jī)選取K個(gè)值作為初始的聚類中心Q(0)=[Q1(0),Q2(0),...,QK(0)],每個(gè)聚類中心代表一個(gè)類別。

(2)迭代:

①更新類別:在第m次迭代中,計(jì)算所有數(shù)據(jù)與K個(gè)聚類中心的距離,定義為差值的二范數(shù):

距離=||yn-Qk(m)||,n=1,2,...,Ni k=1,...,K

將數(shù)據(jù)歸入距離最小的類別中。

②更新聚類中心:將每個(gè)類別中所有數(shù)據(jù)的均值作為新的聚類中心Qk(m+1)。

(3)若則迭代終止,否則返回(2)。

K均值聚類量化以聚類中心作為量化電平,將數(shù)據(jù)映射為其所屬類別的聚類中心,從而實(shí)現(xiàn)量化。K均值聚類量化的步長(zhǎng)通常與數(shù)據(jù)的密集程度相關(guān),即某個(gè)范圍內(nèi)的數(shù)據(jù)越集中,量化越精細(xì)。然而當(dāng)數(shù)據(jù)具有不同的權(quán)重時(shí),尤其是當(dāng)數(shù)據(jù)密集區(qū)域的權(quán)重較小時(shí),該方法的量化性能較差。



技術(shù)實(shí)現(xiàn)要素:

通過分析圖像X由學(xué)習(xí)字典D變換得到的系數(shù)的特點(diǎn),提出一種“基于學(xué)習(xí)字典的圖像壓縮系統(tǒng)”的量化方法。由于量化方法的設(shè)計(jì)以及參數(shù)的選取與系數(shù)直接相關(guān),因此在介紹本發(fā)明之前,首先對(duì)系數(shù)特點(diǎn)進(jìn)行分析。

本發(fā)明解決問題的思路:

系數(shù)矩陣W為一稀疏矩陣,即包含大量的零系數(shù),以其中少量的非零系數(shù)代替W,可達(dá)到壓縮的目的。由于圖像的重要可視信息都集中在幅值較大的系數(shù)上,隨著系數(shù)的幅值減小,所攜帶的圖像有關(guān)信息也隨之減少。因此,通過舍棄一部分近似為零的系數(shù)可進(jìn)一步提高壓縮比。

分別測(cè)試10幅遙感圖像,10幅自然圖像和10幅人臉圖像,觀察截?cái)嘞禂?shù)百分比p對(duì)重建圖像PSNR的影響,結(jié)果取10幅圖像的平均值。如圖2所示,隨著p增大,PSNR呈現(xiàn)下滑趨勢(shì),與理論相符。實(shí)際應(yīng)用中,p可根據(jù)對(duì)重建圖像PSNR的需求選取。例如,若要求重建PSNR不低于50dB,則遙感圖像,自然圖像,人臉圖像的截?cái)啾壤謩e取60%,75%,50%。

接下來,進(jìn)一步觀察保留系數(shù)的分布特點(diǎn)。為統(tǒng)一圖像的系數(shù)取值范圍,均歸一化到(0,10]區(qū)間。以1為間隔,將(0,10]區(qū)間均勻劃分為10個(gè)子區(qū)間,統(tǒng)計(jì)各子區(qū)間的系數(shù)比例。結(jié)果圖3如所示。結(jié)果表明,90%以上的系數(shù)集中在(0,1]區(qū)間。若采用均勻量化對(duì)保留系數(shù)進(jìn)行量化,由于系數(shù)分布的不均勻性,會(huì)造成較大的量化誤差。若采用K均值聚類量化,根據(jù)其最小歐氏距離準(zhǔn)則,大多數(shù)量化電平將集中在(0,1]區(qū)間。但系數(shù)的幅值大小與所帶信息量的多少呈正相關(guān),因此圖像也會(huì)因大幅值系數(shù)沒有分配到足夠多的量化電平而產(chǎn)生較大失真。

基于上述分析,本發(fā)明提出一種針對(duì)“基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)”的量化方法。該方法結(jié)合了均勻量化和K均值聚類量化,同時(shí)根據(jù)圖像類型以及實(shí)際的應(yīng)用需求,選擇合適的參數(shù)取值(包括截?cái)嘞禂?shù)百分比p,子區(qū)間個(gè)數(shù)M),實(shí)現(xiàn)系數(shù)的自適應(yīng)量化。

本發(fā)明的特征在于:是在一個(gè)基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)中,采用均勻量化和K均值聚類量化相結(jié)合的方法依次按以下步驟實(shí)現(xiàn)的:

離線部分:

用K-SVD字典學(xué)習(xí)算法對(duì)自然圖像、遙感圖像、人臉圖像或其他類型圖像的至少一幅用于訓(xùn)練的圖像數(shù)據(jù)進(jìn)行學(xué)習(xí),得到學(xué)習(xí)字典,

在線部分:

在編碼端,依次按以下步驟把待壓縮的圖像數(shù)據(jù)轉(zhuǎn)化為適合信道傳輸?shù)谋忍亓鳎?/p>

步驟(1),初始化:

存入所述的學(xué)習(xí)字典D,

設(shè)定一幅待壓縮的圖像X經(jīng)重建后至少要達(dá)到的峰值信噪比稱為重建圖像最低給定值,

設(shè)定分配給采用均勻量化法均分出的各子區(qū)間的初始的量化電平數(shù)目c,

設(shè)定K均值聚類量化算法在滿足終止迭代條件時(shí)的誤差允許范圍ε1,

設(shè)定K均值聚類量化算法的最大迭代次數(shù)為T,用t表示迭代次數(shù)的序號(hào),

輸入:待壓縮的圖像,先分解為互不重疊的有限數(shù)的圖像塊,再把每個(gè)所述圖像塊拉伸為列向量,組成矩陣,然后用OMP稀疏分解算法對(duì)其進(jìn)行稀疏表示,得到系數(shù)矩陣W;

步驟(2),采用均勻量化和K均值聚類量化相結(jié)合的方法對(duì)所述系數(shù)矩陣W進(jìn)行量化:

步驟(2.1),采用均勻量化的方法對(duì)截?cái)嗪蟊A粝聛淼姆橇阆禂?shù)序列進(jìn)行量化,以均分出子區(qū)間:

步驟(2.1.1)掃描所述系數(shù)矩陣W,以舍棄其中的零值,保留非零系數(shù)并記錄其行列位置,在對(duì)所有的所述非零系數(shù)由小到大順序排序后,得到所述系數(shù)矩陣W的非零系數(shù)序列Y,表示如下:

Y=[y1,y2,...,yn,...,yN],n為非零系數(shù)序號(hào),n=1,2,...,n,...,N,N為非零系數(shù)的個(gè)數(shù),并對(duì)各非零系數(shù)的行列位置進(jìn)行調(diào)整,表示為S,

步驟(2.1.2),按照步驟(1)中的重建圖像最低給定值估計(jì)一個(gè)截?cái)嘞禂?shù)百分比p,順序截?cái)喟俜直萷的非零系數(shù)序列Y,保留下來的非零系數(shù)序列記作Y′,并再次調(diào)整其行列位置為S′,

步驟(2.1.3),用均勻量化法劃分出所述Y′的各子區(qū)間:

把所述Y′均勻劃分為估算得到的有限的M段間隔,各間隔長(zhǎng)度均為1,把所述Y′歸一化到(0,M]區(qū)間,對(duì)各所述子區(qū)間分配等量的量化電平數(shù)目,各c個(gè),得到所述Y′的初始的總量化電平數(shù)C=c×M,各間隔表示為:I1=(0,1],I2=(1,2],...,IM=(M-1,M],所述各間隔用子區(qū)間Im表示,m=1,2,...,m,...,M,下同,

步驟(2.1.4),把所述Y′中的每一個(gè)非零系數(shù)按幅值大小歸類到各對(duì)應(yīng)的子區(qū)間Im中,得到:Y′1∈I1,Y′2∈I2,...,Y′m∈Im,...,Y′M∈IM,其中:Y′m表示所述Y′中歸類到子區(qū)間Im中的所有系數(shù),

步驟(2.2),對(duì)步驟(2.1.4)得到的所有的所述子區(qū)間Im用K均值聚類量化法獨(dú)立產(chǎn)生量化電平,

步驟(2.2.1),將屬于各所述子區(qū)間Im的所有非零系數(shù)記為Y′m,表示為:n為Y′m中各元素序號(hào),n=1,2,...,n,...,Nm,Nm為Y′m中所有元素的個(gè)數(shù),

步驟(2.2.2),對(duì)每個(gè)所述子區(qū)間Im進(jìn)行K均值聚類算法的初始化:

在屬于各所述子區(qū)間Im的所有元素Y′m中任意選取c個(gè)元素,構(gòu)成一個(gè)初始聚類中心序列Qm(0),符號(hào)“0”表示初始狀態(tài),Qm(0)={qm1(0),qm2(0),...,qmk(0),...,qmc(0)},k是各聚類中心的序號(hào),k=1,2,...,k,...,c,qmk表示子區(qū)間Im內(nèi)第k個(gè)聚類中心的值,

步驟(2.2.3),按以下步驟對(duì)各所述子區(qū)間Im進(jìn)行K均值聚類量化迭代:

步驟(2.2.3.1),在第t次迭代時(shí),計(jì)算Y′m中的每個(gè)元素與各個(gè)所述聚類中心qmk(t)的距離,定義為差值的二范數(shù):

步驟(2.2.3.2),把每個(gè)所述元素歸入與自己距離最小的某個(gè)聚類中心的類別中,

步驟(2.2.3.3),更新聚類中心:

經(jīng)過K均值聚類后,把各類別的所述聚類中心中所有元素的均值作為該類別的新的聚類中心qmk(t+1),用于第t+1次迭代,

步驟(2.2.3.4),若各聚類中心均滿足迭代終止條件:則迭代終止,將各類別中所有的非零系數(shù)都量化為對(duì)應(yīng)的聚類中心,若所述迭代終止條件不滿足,若t<T,則返回步驟(2.2.3.1)繼續(xù)迭代,直至滿足所述迭代終止條件為止,若t≥T,則迭代終止,返回步驟(2.2.2)重新迭代,直至滿足所述迭代終止條件為止,最終得到截?cái)嗪蟊A粝聛淼姆橇阆禂?shù)序列Y′經(jīng)過K均值聚類量化后的量化值序列Y″,

步驟(3),采用霍夫曼編碼或算術(shù)編碼對(duì)所述Y″及其行列位置S′進(jìn)行熵編碼,去除冗余的圖像數(shù)據(jù)后再將得到的編碼符號(hào)轉(zhuǎn)化為適合信道傳輸?shù)谋忍亓靼l(fā)送到解碼端,

在解碼端,依次執(zhí)行以下步驟:

步驟(4),熵解碼后,重建系數(shù)矩陣簡(jiǎn)稱

步驟(5),利用預(yù)先存儲(chǔ)的與編碼端存儲(chǔ)的相同的學(xué)習(xí)字典D,與所述相乘,得到重建圖像

步驟(6),按下式計(jì)算所述重建圖像的

U,V分別為待壓縮圖像X在橫軸u、縱軸v上的像素總數(shù),

步驟(7),計(jì)算重建圖像的峰值信噪比與在步驟(1)中的重建圖像的最低給定值之差:若:

則程序終止,

則更新截?cái)嘞禂?shù)百分比重復(fù)執(zhí)行步驟(2.1.2)至步驟(6),直到滿足終止條件為止。

本發(fā)明的優(yōu)點(diǎn)在于比單獨(dú)使用均勻量化或K均值聚類量化具有更好的量化性能,尤其在比特率較大時(shí),本發(fā)明的性能優(yōu)勢(shì)更明顯。

附圖說明

圖1,基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)框圖。

圖2,截?cái)嘞禂?shù)百分比與重建圖像PSNR,

分別代表遙感圖像、自然圖像和人臉圖像。

圖3,非零系數(shù)各區(qū)間分布比例,

分別代表遙感圖像、自然圖像和人臉圖像。

圖4,10幅用于訓(xùn)練學(xué)習(xí)字典的自然圖像樣本。

圖5,待壓縮的自然圖像。

圖6,三種量化方法用于“基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)”的性能比較,

分別代表均勻量化、K均值聚類量化和本發(fā)明。

圖7,本發(fā)明的程序流程框圖。

具體實(shí)施方式

具體要求:

用圖4所示的10幅大小為512×512的自然圖像訓(xùn)練學(xué)習(xí)字典,利用該學(xué)習(xí)字典對(duì)圖5所示的大小為512×512的自然圖像使用“基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)”進(jìn)行壓縮,要求其重建圖像PSNR至少達(dá)到50dB。

離線部分:

采用K-SVD字典學(xué)習(xí)算法,以圖4所示的10幅大小為512×512的自然圖像數(shù)據(jù)為訓(xùn)練樣本,訓(xùn)練一個(gè)大小為64×512的學(xué)習(xí)字典D,

在線部分:

在編碼端,依次按以下步驟把圖5所示的待壓縮的自然圖像數(shù)據(jù),轉(zhuǎn)化為適合信道傳輸?shù)谋忍亓鳎?/p>

步驟(1),初始化:

存入所述的學(xué)習(xí)字典D,

設(shè)定重建圖像最低給定值為50dB,

設(shè)定分配給采用均勻量化法均分出的各子區(qū)間的初始的量化電平數(shù)目c為10,

設(shè)定K均值聚類量化算法在滿足終止迭代條件時(shí)的誤差允許范圍ε1為(0,0.01),

設(shè)定K均值聚類量化算法的最大迭代次數(shù)為T為100,用t表示迭代次數(shù)的序號(hào),

輸入:待壓縮的圖像,先分解為大小為8×8的互不重疊的圖像塊,再把每個(gè)所述圖像塊拉伸為列向量,組成大小為64×4096的矩陣,然后用OMP稀疏分解算法對(duì)其進(jìn)行稀疏表示,得到大小為512×4096的系數(shù)矩陣W;

步驟(2),采用均勻量化和K均值聚類量化相結(jié)合的方法對(duì)所述系數(shù)矩陣W進(jìn)行量化:

步驟(2.1),采用均勻量化的方法對(duì)截?cái)嗪蟊A粝聛淼姆橇阆禂?shù)序列進(jìn)行量化,以均分出子區(qū)間:

步驟(2.1.1)掃描所述系數(shù)矩陣W,其中零系數(shù)共計(jì)1848322個(gè),非零系數(shù)共計(jì)248830個(gè),舍棄其中的零值,保留非零系數(shù)并記錄其行列位置,在對(duì)所有的所述非零系數(shù)由小到大順序排序后,得到所述系數(shù)矩陣W的非零系數(shù)序列Y,表示如下:

Y=[y1,y2,...,yn,...,yN],n為非零系數(shù)序號(hào),n=1,2,...,n,...,N,N為非零系數(shù)的個(gè)數(shù),N=248830,并對(duì)各非零系數(shù)的行列位置進(jìn)行調(diào)整,表示為S,

步驟(2.1.2),按照步驟(1)中的重建圖像最低給定值50dB估計(jì)截?cái)嘞禂?shù)百分比p,初次設(shè)定為70%,則順序截?cái)喟俜直萷的非零系數(shù)序列Y,保留下來的非零系數(shù)序列記作Y′,并再次調(diào)整其行列位置為S′,

步驟(2.1.3),用均勻量化法劃分出所述Y′的各子區(qū)間:

把所述Y′均勻劃分為估算得到的有限的7段間隔,把所述Y′歸一化到(0,7]區(qū)間,將區(qū)間(0,7]均勻劃分為7段間隔,各間隔長(zhǎng)度均為1,對(duì)各所述子區(qū)間分配等量的量化電平數(shù)目,各10個(gè),得到所述Y′的初始的總量化電平數(shù)C=70,各間隔表示為:I1=(0,1],I2=(1,2],...,I7=(6,7],所述各間隔用子區(qū)間Im表示,m=1,2,...,m,...,7,下同,

步驟(2.1.4),把所述Y′中的每一個(gè)非零系數(shù)按幅值大小歸類到各對(duì)應(yīng)的子區(qū)間Im中,得到:Y′1∈I1,Y′2∈I2,...,Y′m∈Im,...,Y′M∈IM,其中:Y′m表示所述Y′中歸類到子區(qū)間Im中的所有系數(shù),

步驟(2.2),對(duì)步驟(2.1.4)得到的所有的所述子區(qū)間Im用K均值聚類量化獨(dú)立產(chǎn)生量化電平,

步驟(2.2.1),將屬于各所述子區(qū)間Im的所有非零系數(shù)記為Y′m,表示為:n為Y′m中各元素序號(hào),n=1,2,...,n,...,Nm,Nm為Y′m中所有元素的個(gè)數(shù),

步驟(2.2.2),對(duì)每個(gè)所述子區(qū)間Im進(jìn)行K均值聚類算法的初始化:

在屬于各所述子區(qū)間Im的所有元素Y′m中任意選取10個(gè)元素,構(gòu)成一個(gè)初始聚類中心序列Qm(0),符號(hào)“0”表示初始狀態(tài),Qm(0)={qm1(0),qm2(0),...,qmk(0),...,qm10(0)},k是各聚類中心的序號(hào),k=1,2,...,k,...,10,qmk表示子區(qū)間Im內(nèi)第k個(gè)聚類中心的值,

步驟(2.2.3),按以下步驟對(duì)各所述子區(qū)間Im進(jìn)行K均值聚類量化迭代:

步驟(2.2.3.1),在第t次迭代時(shí),計(jì)算Y′m中的每個(gè)元素與各個(gè)所述聚類中心qmk(t)的距離,定義為差值的二范數(shù):步驟(2.2.3.2),把每個(gè)所述元素歸入與自己距離最小的某個(gè)聚類中心的類別中,

步驟(2.2.3.3),更新聚類中心:

經(jīng)過K均值聚類后,把各類別的所述聚類中心中所有元素的均值作為該類別的新的聚類中心qmk(t+1),用于第t+1次迭代,

步驟(2.2.3.4),前38次迭代均不滿足迭代終止條件:返回步驟(2.2.3.1)繼續(xù)迭代,第39次迭代后,各聚類中心均滿足迭代終止條件,迭代終止,將各類別中所有的非零系數(shù)都量化為對(duì)應(yīng)的聚類中心,最終得到截?cái)嗪蟊A粝聛淼姆橇阆禂?shù)序列Y′經(jīng)過K均值聚類量化后的量化值序列Y″,

步驟(3),采用霍夫曼編碼或算術(shù)編碼對(duì)所述Y″及其行列位置S′進(jìn)行熵編碼,去除冗余的圖像數(shù)據(jù)后再將得到的編碼符號(hào)轉(zhuǎn)化為適合信道傳輸?shù)谋忍亓靼l(fā)送到解碼端,

在解碼端,依次執(zhí)行以下步驟:

步驟(4),熵解碼后,重建系數(shù)矩陣簡(jiǎn)稱

步驟(5),利用預(yù)先存儲(chǔ)的與編碼端存儲(chǔ)的相同的學(xué)習(xí)字典D,與所述相乘,得到重建圖像

步驟(6),按下式計(jì)算所述重建圖像的

步驟(7),計(jì)算重建圖像的峰值信噪比與在步驟(1)中的重建圖像的最低給定值之差:

則更新截?cái)嘞禂?shù)百分比再次執(zhí)行步驟(2.1.2)至步驟(6),

經(jīng)計(jì)算,滿足終止條件。

分別使用均勻量化和K均值聚類量化替換掉本發(fā)明的量化方法,同樣對(duì)圖5所示的自然圖像通過“基于字典學(xué)習(xí)的圖像壓縮系統(tǒng)”進(jìn)行壓縮,對(duì)單獨(dú)使用均勻量化、K均值聚類量化時(shí)的性能和使用本發(fā)明提出的量化方法的性能進(jìn)行比較,結(jié)果如圖6所示。低比特率下,三者的性能相近,隨著比特率的提高,三者性能均穩(wěn)步上升,差距也逐漸拉開。例如當(dāng)比特率為1bpp時(shí),使用本發(fā)明提出的量化方法比單獨(dú)使用均勻量化和K均值聚類量化分別有1dB和2dB的性能優(yōu)勢(shì)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1