一種用于立體圖像質(zhì)量客觀評價的極端學(xué)習(xí)機(jī)的制作方法
【專利說明】-種用于立體圖像質(zhì)量客觀評價的極端學(xué)習(xí)機(jī) 所屬技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于圖像處理領(lǐng)域,設(shè)及圖像質(zhì)量評價方法改進(jìn)優(yōu)化,尤其是設(shè)及PCA和 GA-ELM在立體圖像質(zhì)量客觀評價中的應(yīng)用。
【背景技術(shù)】
[0002] 近幾年來,隨著計(jì)算機(jī)科學(xué)技術(shù)的飛速發(fā)展,人們對立體可視化的興趣越來越濃 厚,計(jì)算機(jī)圖形學(xué)也在各行業(yè)得到迅速的發(fā)展,計(jì)算機(jī)進(jìn)入=維時代。來自計(jì)算機(jī)圖像學(xué)、 計(jì)算機(jī)視覺、多媒體W及相關(guān)的其他技術(shù)的融合,使得多種新的視覺媒體得到快速發(fā)展,例 如立體視頻和自由視點(diǎn)視頻,給人類帶來了新的視覺感受,遠(yuǎn)遠(yuǎn)超越了傳統(tǒng)的2D視頻W。 隨著立體成像技術(shù)的不斷成熟,立體產(chǎn)品真正走進(jìn)人們的生活中,從此3D世界的重現(xiàn),不 再僅僅是夢想。立體顯示技術(shù)在室外b-"的應(yīng)用也越來越普及。
[0003] 現(xiàn)階段,進(jìn)行立體圖像質(zhì)量評價主要是人們利用人眼來獲取圖像的立體信息,然 后大腦將各種立體信息進(jìn)行整合使我們感受到立體的感覺,進(jìn)而來分析判斷立體圖像質(zhì)量 的優(yōu)劣。通常情況下,采用兩種方法對立體圖像質(zhì)量進(jìn)行評價;主觀評價和客觀評價。主觀 評價主要是通過選擇大量的測試人員,依據(jù)觀測者看到的立體圖像的立體效果、清晰度W 及事先根據(jù)ITU制定的圖像質(zhì)量的評分標(biāo)準(zhǔn),對選取的立體圖像樣本按照個人主觀感受進(jìn) 行等級評分。雖然該種方法能夠獲得較準(zhǔn)確的圖像評價,但它花費(fèi)時間長、成本高,難W操 作。因此,建立一套有效的、規(guī)范的立體圖像質(zhì)量客觀評價標(biāo)準(zhǔn)已經(jīng)成為立體成像技術(shù)領(lǐng)域 中一項(xiàng)主要研究內(nèi)容。其中客觀評價方法主要通過提取立體圖像相應(yīng)的立體信息指標(biāo),然 后利用數(shù)學(xué)公式或建立的數(shù)學(xué)模型描述人們對立體圖像的主觀感受,進(jìn)而評判立體圖像的 質(zhì)量等級,該方法省時省力、可操作性更強(qiáng)。因此建立與主觀評價結(jié)果相一致的客觀評價模 型是未來的發(fā)展趨勢,國內(nèi)外學(xué)者也已對此進(jìn)行了一系列的探索。
[0004] 最初,人們主要是通過引進(jìn)平面圖像質(zhì)量的評價方法來評價立體圖像的質(zhì)量等 級。在過去幾十年來,研究學(xué)者所提出的二維圖像質(zhì)量評價方法有;峰值信噪比(PSNR)、均 方誤差(MSE)、結(jié)構(gòu)相似度(SSIM)指標(biāo)及基于信息內(nèi)容權(quán)值的IWSSIM算法W等等。 You^等人將其中的一些2D圖像質(zhì)量評價方法應(yīng)用到立體圖像當(dāng)中,并對其性能進(jìn)行了相 應(yīng)的分析比較。
[0005] 化wage?等人提出首先計(jì)算深度圖的輪廓并將其二值化,然后通過PSNR方法對 立體圖像質(zhì)量進(jìn)行評價,該文獻(xiàn)介紹了一種基于深度圖邊緣信息的半?yún)⒖紙D像質(zhì)量評價算 法模型,能夠基本符合人眼的視覺感受。DingW等人介紹了一種利用圖像的局部統(tǒng)計(jì)相關(guān) 性的全參考圖像質(zhì)量評價算法模型,此方法在小波域提取圖像的局部相關(guān)性并匯集出一個 客觀評價分?jǐn)?shù),通過測試結(jié)果可知該方法不但在具有非常高的精度而且與主觀評價結(jié)果基 本一致;通過總結(jié)影響用戶視覺感知hw的一些因素;串?dāng)_等級、攝像機(jī)基線W及場景內(nèi)容, 據(jù)此提出了一種基于立體圖像串?dāng)_感知的客觀質(zhì)量評價算法,該算法首先從立體圖像中計(jì) 算出深度圖,然后根據(jù)原始的W及受損的圖像獲得SSIMmap中相應(yīng)權(quán)值。在文獻(xiàn)W中,作 者A化ter等人介紹了一種基于分割圖像的局部特性和視差信息的無參考圖像質(zhì)量客觀 評價算法,該方法的靈感來源于人類的視覺系統(tǒng)(HumanVisualSystem,HV巧W及任何立 體顯示的感知失真和視差信息依賴于圖像的局部特征如非平面的邊緣信息、平面的非邊緣 區(qū)域;文獻(xiàn)是出了一種基于差異圖的立體圖像質(zhì)量評價方法,該方法將主觀實(shí)驗(yàn)作為立 體信息質(zhì)量評價的準(zhǔn)則,使用深度圖度量圖像的垂直偏差W及時間一致性;
[0006] 針對立體圖像的質(zhì)量評價,雖然近年來研究者對人類視覺系統(tǒng)進(jìn)行了一系列的深 入探索,但是由于人眼系統(tǒng)的復(fù)雜性,人類對人眼視覺系統(tǒng)的認(rèn)知仍然比較膚淺,所W人們 仍然無法提出與人眼主觀感受完全一致的立體圖像質(zhì)量客觀評價算法。為此,一些學(xué)者 考慮將神經(jīng)網(wǎng)絡(luò)運(yùn)用到立體圖像質(zhì)量客觀評價方面,并取得了良好的效果。文獻(xiàn)首先 通過獨(dú)立成分分析(ICA)提取立體圖像的有效特征,然后通過基于二叉樹的支持向量機(jī) 炬T-SVM)算法設(shè)計(jì)了一種能夠用于立體圖像質(zhì)量客觀評價的分類識別系統(tǒng);在文獻(xiàn)M中, 作者顧珊波等人根據(jù)圖像的奇異值具有非常穩(wěn)定的特性,然后結(jié)合立體圖像的主觀視覺感 知特性,構(gòu)造了一種基于SVR和立體圖像視覺感知特性的客觀評價算法模型。該方法首先 提取左右圖像奇異值,然后依據(jù)各個圖像的失真情況進(jìn)行融合,最后利用SVR模型輸出立 體圖像的客觀評價值;文獻(xiàn)采用峰值信噪比W及結(jié)構(gòu)相似度來描述圖像質(zhì)量,設(shè)計(jì)了一 種基于神經(jīng)網(wǎng)絡(luò)和支持向量的立體圖像質(zhì)量分類識別系統(tǒng)。
[0007] 神經(jīng)網(wǎng)絡(luò)客觀評價模型具有高度的并行結(jié)構(gòu)和并行實(shí)現(xiàn)能力,能夠有效處理非線 性問題,因而神經(jīng)網(wǎng)絡(luò)在立體圖像質(zhì)量客觀評價方面能夠取得較好效果。文獻(xiàn)提出了極 端學(xué)習(xí)機(jī)在立體圖像質(zhì)量評價中的應(yīng)用,極端學(xué)習(xí)機(jī)巧LM)對于立體圖像質(zhì)量的客觀評價 能夠解決傳統(tǒng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度慢、易陷入局部極小值和泛化性能低等問題。ELM在單隱層 神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上發(fā)展而來,它的輸入層與隱藏層之間的權(quán)重W及隱藏層的闊值無需反復(fù) 迭代,只要隨機(jī)賦值即可。因此極端學(xué)習(xí)機(jī)的最終結(jié)果有很大的差異,需要通過多次運(yùn)行求 其平均值作為最終結(jié)果,然而該種方法卻錯過最優(yōu)結(jié)果的選擇。
[000引參考文獻(xiàn)
[0009] [1]Smolic,K.Mueller,P.Merkle,C.Fehn,P.Kauff,P.Eisert,T.Wiegand. 3D videoandfreeview-pointvideo-technologies,applicationsandMPEG st過nd過rds[C].InternationalConferenceonMultimedi過過ndExpo,Toronto,Ont過rio,C anada,2006:2161-2164.
[0010] [2]ReittererJ,FidlerF,SchmidG,etal.Designandevaluation ofalarge-scaleautostereoscopicmulti-viewlaserdisplayforoutdoor applications[J].OpticsExpress, 2014, 22(22):27063-27068.
[00川 [3]HIR0TSUGUY,MAK0T0K,SYUJIM,etal.Enlargementofviewingarea ofstereoscopicfull-colorleddisplaybyuseofaparallaxbarrier[J].Appl.Opt.,2002, 41 (32) : 6907-6919.
[00。] [4]BaselgiaC,BosseM,ZlotR,etal.SolidModelReconstruction ofLarge-ScaleOutdoorScenesfrom3DLidarData[C].FieldandServiceRobotics.SpringerBerlinHeidelberg, 2014:541-554.
[0013] [5]Z.Wang,A.C.Bovik,H.民.SheikhandE.P.Simoncalli.Imagequality 過ssessme打t:
[0014] Fromerrorvisibilitytostructuralsimilarity[J].IEEETrans.Image Process, 2004, 13 (4) : 600-612.
[001 日] [6]WangZ,LiQ.Informationcontentweightingforperceptual imagequalityassessment[J].ImageProcessing,IEEETransactions on, 2011,20 巧):1185-1198.
[0016] [7]YouJ,XingL,PerkisA,etal.Perceptualqualityassessment forstereoscopicimagesbasedon2Dimagequalitymetricsanddisparity analysis[C].Proc.ofInternationalWorkshoponVideoProcessingandQuality MetricsforConsumerElectronics,Scottsdale,AZ,USA, 2010.
[0017] [8]HewageCTER,MartiniMG.Reduced-referencequalitymetricfor3D depthmaptransmission[C]. 3DTV-Conference:TheTrueVision-Capture,Transmission andDisplayof3DVideo(3DTV-C0N),2010,IE邸,2010:1-4.
[0018] [9]DingY,WangS,andZhangD.Full-referenceimagequalityassessment usingstatisticallocalcorrelation[J].ElectronicsLetters, 2014,50(2):79-81.
[0019][lOjXingL,YouJ,EbrahimiT,etal.Aperceptualqualitymetricfor stereoscopiccrosstalkperception[C].ImageProcessing(ICIP),201017thIEEE InternationalConferenceon,IEEE,2010:4033-4036.
[0020] [11]AlditerR,SazzadZMP,HoritaY,etal.No-ReferenceStereoscopic ImageQualityAssessment[C].Proc.IS&T/SPIE,ElectronicImaging,SanJose, California,USA,F(xiàn)eb15, 2010.
[002U[12]KIMDH,MINDB,OHJH,etal.Depthmapqualitymetricfor three-dimensionalvideo[C].ProceedingsoftheSPIEVolume7237:Stereoscop