多光譜圖像數(shù)據(jù)分析和挖掘方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及一種數(shù)據(jù)存儲和挖掘技術(shù),尤其設(shè)及一種多光譜圖像數(shù)據(jù)分析和挖掘 方法,屬于多光譜圖像處理領(lǐng)域。
【背景技術(shù)】
[0002] 針對遙感信息提取方法可比性,普適性,和通用性差的特點,應(yīng)該按照一定標(biāo)準(zhǔn)建 立可W驗證各類信息提取算法的圖像庫、紋理庫、相關(guān)地表信息和知識數(shù)據(jù)庫。
[0003] 首先,在建立基于高光譜信息的數(shù)據(jù)庫時,其組織和建模必須滿足如下的需求:能 夠描述高光譜數(shù)據(jù)的圖譜合一特性,將變化性很強的圖像光譜維數(shù)據(jù)與圖像空間維數(shù)據(jù)很 好地結(jié)合在一起,準(zhǔn)確地刻畫圖像的時空特性;滿足高光譜波段眾多(高者達到數(shù)百波段, 納米級的光譜分辨率),千兆量級的數(shù)據(jù)構(gòu)成的海量存儲需求;每個波段的數(shù)據(jù)都可能需 要單獨提出,用作分析、計算,同時需要對光譜曲線進行提取分析。按照上述要求,在高光譜 數(shù)據(jù)庫管理系統(tǒng)中,數(shù)據(jù)W記錄(records)形式被永久保存,一條記錄即一個對象實例,例 如一幅影像。不同表中記錄不同的空間影像數(shù)據(jù)、光譜數(shù)據(jù)與屬性數(shù)據(jù),包括影像數(shù)據(jù)本 身、影像的特征信息、影像數(shù)據(jù)的屬性信息等。在實際應(yīng)用時,單純將整幅影像作為一條記 錄寫入數(shù)據(jù)庫中往往是不現(xiàn)實的,需要利用I/O并行性能,將元數(shù)據(jù)的基本信息W索引的 形式存儲于數(shù)據(jù)庫中,數(shù)據(jù)信息則存儲為本地文件。并按照一定的規(guī)則對影像進行分塊,實 現(xiàn)多分辨率和并行讀取。
【發(fā)明內(nèi)容】
[0004] 鑒于上述現(xiàn)有技術(shù)的不足之處,本發(fā)明的目的在于提供一種多光譜圖像數(shù)據(jù)分析 和挖掘方法。
[0005] 為了達到上述目的,本發(fā)明采取了W下技術(shù)方案;相較于現(xiàn)有技術(shù),本發(fā)明提供的 多光譜圖像數(shù)據(jù)分析和挖掘方法,使用實體圖像數(shù)據(jù)表,縮略圖數(shù)據(jù)表與本地元數(shù)據(jù)的方 法來存儲,使用其來讀取任意相關(guān)數(shù)據(jù)文件中的光譜信息讀取到內(nèi)存中并顯示倒序存儲的 RGB像素。
[0006] 本發(fā)明提供另一種多光譜圖像數(shù)據(jù)分析和挖掘方法,使用實體圖像數(shù)據(jù)表,縮略 圖數(shù)據(jù)表與本地元數(shù)據(jù)的方法來存儲,使用其來讀取任意相關(guān)數(shù)據(jù)文件中的光譜信息讀取 到內(nèi)存中并顯示倒序存儲的RGB像素;根據(jù)多光譜數(shù)據(jù)建立起來的數(shù)據(jù)庫,其具體分析包 括W下步驟:
[0007] 步驟一、基礎(chǔ)信息管理;包括目標(biāo)的波譜數(shù)據(jù)、參數(shù)信息和景觀照片的管理,具備 單個數(shù)據(jù)入庫、修改、刪除、查詢,并根據(jù)查詢結(jié)果顯示相應(yīng)的波譜曲線及景觀照片;
[000引步驟二、數(shù)據(jù)預(yù)處理:包括數(shù)據(jù)格式轉(zhuǎn)換、反射率計算、粗差檢測與剔除、數(shù)據(jù)平滑 和純光譜求混計算;
[0009]步驟=、可視化分析;通過多條曲線的疊加顯示,對比分析同類地物或各類地物在 不同或相同環(huán)境下的光譜特征,其中背景光源根據(jù)用戶需要進行改動;
[0010] 步驟四、光譜曲線特征分析與光譜匹配;包括光譜數(shù)據(jù)的歸一化處理與分析、導(dǎo)數(shù) 光譜分析、光譜重采樣,用W消除背景、光照及噪聲對數(shù)據(jù)造成的影響,提取光譜典型特征, 用包絡(luò)線、光譜角度匹配進行光譜匹配,分析診斷光譜,查找到與未知地物最為相近的匹配 曲線,W定位未知地物的名稱及其屬性;
[0011] 步驟五、從空間數(shù)據(jù)庫中提取用戶感興趣的空間模型與特征,空間與非空間數(shù)據(jù) 的普遍關(guān)系,及其它一些隱含在數(shù)據(jù)庫中的普遍的數(shù)據(jù)特征,通過決策樹分類法、基于貝 葉斯概率的非監(jiān)督分類法、人工神經(jīng)網(wǎng)絡(luò)、粗趟集方法、用于產(chǎn)生關(guān)聯(lián)規(guī)則的方法等方法中 的一種或多種。
[0012] 本發(fā)明提供的一種多光譜圖像數(shù)據(jù)分析和挖掘方法,向人們介紹了具體如何對海 量的多光譜圖像數(shù)據(jù)進行分析和挖掘,如何建立相應(yīng)的多光譜圖像數(shù)據(jù)庫,為人們提供了 明確的方法步驟和指導(dǎo)。
【具體實施方式】
[0013] 本發(fā)明提供一種多光譜圖像數(shù)據(jù)分析和挖掘方法,為使本發(fā)明的目的、技術(shù)方案 及效果更加清楚、明確,W下參照附圖并舉實施例對本發(fā)明進一步詳細(xì)說明。應(yīng)當(dāng)理解,此 處所描述的具體實施例僅用W解釋本發(fā)明,并不用于限定本發(fā)明。
[0014] 實施例
[0015] 本實施例公開的多光譜圖像數(shù)據(jù)分析和挖掘方法,包括。
[0016] 對于海量的高光譜數(shù)據(jù)圖像,使用實體圖像數(shù)據(jù)表,縮略圖數(shù)據(jù)表與本地元數(shù)據(jù) 的方法來存儲,可W使用其來讀取任意相關(guān)數(shù)據(jù)文件中的光譜信息讀取到內(nèi)存中并顯示倒 序存儲的RGB像素。
[0017] 高光譜數(shù)據(jù)庫部分核屯、表結(jié)構(gòu)定義如下。
[001引 (1)高光譜元數(shù)據(jù)表HI_IMAGE
[0019] 存儲高光譜影像的成像時間、地點、數(shù)據(jù)類型、行數(shù)、像元比特數(shù)、光譜范圍、視場 角、瞬時視場角、波段數(shù)、光譜分辨率、帖速率、空間像元數(shù)等信息。其中,ImagelD為高光譜 影像標(biāo)識,標(biāo)識號唯一,為表Image的主關(guān)鍵詞,數(shù)據(jù)類型為化iqueidentifier,用來區(qū)分 高光譜影像對象;
[0020]InterLeave為影像類型標(biāo)識BSQ、BIP或BIL格式;
[0021] 化taType表示為高光譜影像數(shù)據(jù)編碼結(jié)構(gòu),由字符和數(shù)字組成,編碼意義由用戶 定義。
[0022] FileType表示影像數(shù)據(jù)存儲方式,可選有皿F4/5,TIFF,EnviW及bitmap圖像數(shù) 據(jù)文件集,數(shù)據(jù)庫系統(tǒng)根據(jù)文件類型不同選擇不同的處理方式。
[0023]
[0024] (2)高光譜影像縮略圖數(shù)據(jù)信息HI_ColorImage
[0025] 本地存儲影像低分辨率數(shù)據(jù)及相關(guān)參數(shù)。其中,ImagelD為縮略圖所對應(yīng)的高光譜 數(shù)據(jù)標(biāo)識號,為關(guān)鍵字;IstrueColor字段判定是來自全波段積分得到縮略圖是取相關(guān)RGB 波段的偽彩色圖像合成。
[0026] StrechCount表示縮略圖的比例。
[0027] (3)目標(biāo)光譜曲線信息表HI_S陽CTRUM
[002引存儲目標(biāo)光譜曲線信息。SpectrumID為光譜表示號,每個光譜對應(yīng)的元數(shù)據(jù)標(biāo)識 為ImagelD,對應(yīng)元數(shù)據(jù)的像素位置用positionX,positionY存儲,對應(yīng)的光譜反射率存儲 為SpectrumRefData,對應(yīng)的DN值為SpectrmnDNData;因為光譜的反射率和DN值信息都是 W二進制的形式存儲于表中的,在系統(tǒng)中應(yīng)用該數(shù)據(jù)需要對信息進行序列化和反序列化: 其中把對象轉(zhuǎn)換為字節(jié)序列的過程稱為對象的序列化;把字節(jié)序列恢復(fù)為對象的過程稱為 對象的反序列化。公共語言運行時(CLR)管理對象在內(nèi)存中的分布,.NET框架則通過使用 反射提供自動的序列化機制。對象序列化后,類的名稱、程序集W及類實例的所有數(shù)據(jù)成員 均被寫入存儲媒體中。對象通常用成員變量來存儲對其他實例的引用。類序列化后,序列 化引擎將跟蹤所有已序列化的引用對象,W確保同一對象不被序列化多次。.NET框架所提 供的序列化體系結(jié)構(gòu)可W自動正確處理對象圖表和循環(huán)引用。
[0029] 按照上述高光譜數(shù)據(jù)庫設(shè)計,建立起高光譜數(shù)據(jù)庫管理與分析系統(tǒng),系統(tǒng):
[0030] (1)基礎(chǔ)信息管理;包括目標(biāo)的波譜數(shù)據(jù)、參數(shù)信息和景觀照片的管理,具備單個 數(shù)據(jù)入庫、修改、刪除、查詢等功能,并根據(jù)查詢結(jié)果顯示相應(yīng)的波譜曲線及景觀照片。
[0031] (2)數(shù)據(jù)預(yù)處理;包括數(shù)據(jù)格式轉(zhuǎn)換、反射率計算、粗差檢測與剔除、數(shù)據(jù)平滑、純 光譜求混計算等。
[0032] (3)可視化分析;通過多條曲線的疊加顯示,對比分析同類地物或各類地物在不 同或相同環(huán)境下的光譜特征。背景光源根據(jù)用戶需要進行改動。
[0033] (4)光譜曲線特征分析與光譜匹配;數(shù)據(jù)庫實現(xiàn)了W下特征分析功能,如;光譜數(shù) 據(jù)的歸一化處理與分析、導(dǎo)數(shù)光譜分析、光譜重采樣等,用W消除背景、光照及噪聲等因素 對數(shù)據(jù)造成的影響,提取光譜典型特征,用包絡(luò)線、光譜角度匹配等方法進行光譜匹配,分 析診斷光譜,查找到與未知地物最為相近的匹配曲線,W定位未知地物的名稱及其屬性。數(shù) 據(jù)庫設(shè)計(模式)是否支持應(yīng)用系統(tǒng)的對象模型,該是判斷是否是面向?qū)ο髷?shù)據(jù)庫系統(tǒng)的 基本出發(fā)點。由于應(yīng)用系統(tǒng)設(shè)計在前,數(shù)據(jù)庫設(shè)計隨后,所W應(yīng)用系統(tǒng)對象模型向數(shù)據(jù)庫模 式的映射是面向?qū)ο髷?shù)據(jù)庫設(shè)計的關(guān)鍵。
[0034] 一般數(shù)據(jù)庫設(shè)計多參照AN化/SPARC關(guān)于數(shù)據(jù)庫模式的