一種基于云平臺的遙感影像分割方法
【專利摘要】本發(fā)明公開了一種基于云平臺的遙感影像分割方法,其通過構建特征樣本庫,基于特征樣本對不同衛(wèi)星的不同傳感器分別進行訓練生成對應的算法模型;處理過程首先根據(jù)用戶提供的衛(wèi)星號、傳感器號以及拍攝日期到構建好的遙感影像數(shù)據(jù)庫中進行搜索,找到對應的遙感影像;然后根據(jù)衛(wèi)星號和傳感器號以及用戶所選擇的算法在算法模型庫中挑選出對應的算法模型,利用算法模型對相應的遙感影像特征數(shù)據(jù)進行處理,最后再將處理好的遙感影像存放到HBase當中。因此,本發(fā)明利用HBase的鍵值對特性以及Spark基于內存計算的特性來對遙感影像數(shù)據(jù)進行分割處理,具有較強的擴展性,對于遙感影像處理的應用具有很好的實用價值。
【專利說明】
一種基于云平臺的遙感影像分割方法
技術領域
[0001] 本發(fā)明屬于數(shù)據(jù)存儲與處理技術領域,具體涉及一種基于云平臺的遙感影像分割 方法。
【背景技術】
[0002] 隨著遙感技術以及高分辨率衛(wèi)星技術的發(fā)展,高分辨率遙感影像數(shù)據(jù)的規(guī)模和復 雜性在飛速增長,當今社會對高分辨率遙感衛(wèi)星數(shù)據(jù)的存儲和處理需求也越來越大。由于 遙感影像數(shù)據(jù)由于不同衛(wèi)星和傳感器所生產的數(shù)據(jù)格式、數(shù)據(jù)特征也有一定的差異性,這 給遙感影像數(shù)據(jù)的存儲以及處理都帶來了一定的困難,隨著衛(wèi)星運行時間的增長數(shù)據(jù)量也 在不斷的增長給存儲帶來了許多挑戰(zhàn),同時也給遙感影像數(shù)據(jù)資源的共享與數(shù)據(jù)產品的分 發(fā)帶來了巨大的困難,使得遙感影像數(shù)據(jù)的傳輸和管理面臨新的挑戰(zhàn)。隨著中國高分辨率 衛(wèi)星技術的不斷發(fā)展,高分1號、高分2號衛(wèi)星的發(fā)射,高分辨率遙感影像的數(shù)量也在不斷增 長,國內對于遙感影像數(shù)據(jù)存儲的需求也十分急切。為了解決這一問題,目前海量遙感影像 的存儲均采用分布式存儲系統(tǒng)。
[0003] 遙感影像的分割是遙感數(shù)據(jù)分析和信息提取的重要工具,一直是遙感領域的研究 熱點。目前對遙感影像進行分割多采用機器學習算法進行處理,主要包括監(jiān)督學習的方法, 例如決策樹,和非監(jiān)督學習的方法,例如KMeans。由于遙感影像數(shù)據(jù)具有格式多樣性、類型 豐富、數(shù)據(jù)海量的特點,在進行特征提取、分類等工作時,會帶來很大的困難。傳統(tǒng)的機器學 習方法都是采用單機模式進行處理,盡管目前服務器性能普遍提高,但對海量的遙感影像 數(shù)據(jù)進行處理仍然很費力。另外,傳統(tǒng)的遙感影像處理方法一般是采用串行的方式對單張 遙感影像進行處理,此類方法對于數(shù)量較少、數(shù)據(jù)量較小的遙感影像較為適用,但面對海量 高分辨率遙感影像時就顯得無能為力。
【發(fā)明內容】
[0004] 針對現(xiàn)有技術所存在的上述技術問題,本發(fā)明提供了一種基于云平臺的遙感影像 分割方法,利用了云平臺的可擴展性和并行性方面的優(yōu)勢,可以處理海量的遙感影像數(shù)據(jù)。
[0005] -種基于云平臺的遙感影像分割方法,包括如下步驟:
[0006] (1)收集來自不同衛(wèi)星不同傳感器所拍攝的遙感影像,并對這些遙感影像中的各 類區(qū)域(如城市、河流、森林、農村等)進行人工標記;
[0007] (2)對于任一衛(wèi)星上的任一傳感器,對由該傳感器所拍攝的遙感影像進行特征提 取以得到多組特征樣本,基于所述的特征樣本從機器學習庫Spark Mllib中任取一種分類 算法進行訓練以得到關于該傳感器遙感影像區(qū)域劃分的分割模型;依此遍歷所有衛(wèi)星、所 有傳感器以及所有分類算法,以得到多個分割模型并存儲于算法模型庫內;
[0008] (3)創(chuàng)建遙感影像數(shù)據(jù)庫,采集來源于不同衛(wèi)星不同傳感器以及不同拍攝時間的 遙感影像存儲于所述的遙感影像數(shù)據(jù)庫內;
[0009] (4)根據(jù)用戶的處理請求從遙感影像數(shù)據(jù)庫中查找所要處理的遙感影像,從算法 模型庫中查找所要選用的分割模型;進而對所要處理的遙感影像進行特征提取,并將得到 的特征數(shù)據(jù)輸入至所要選用的分割模型中以得到分割后的遙感影像。
[0010] 所述的特征樣本存儲于特征樣本庫內,特征樣本包括遙感影像各像素點的特征信 息(包含像素點各通道的值)以及各像素點關于區(qū)域的人工標記信息。
[0011] 所述步驟(2)中采用分類算法進行訓練的過程以特征樣本的特征信息作為分割模 型的輸入,以特征樣本的人工標記信息作為分割模型的輸出進行學習。
[0012] 所述的步驟(2)在構建算法模型庫時,由于Spark MLlib提供多種分類算法,選擇 其中幾種算法對特征樣本庫中的樣本進行訓練,生成算法模型;構建算法模型庫時利用了 Spark基于內存計算的優(yōu)勢,加快了處理速度。
[0013] 優(yōu)選地,所述的遙感影像數(shù)據(jù)庫采用分布式存儲系統(tǒng)HBase;可以利用HBase鍵值 對特征解決因為不同衛(wèi)星、不同傳感器拍攝的遙感影像數(shù)據(jù)異構存儲問題,同時也能快速 查找到所需的數(shù)據(jù),同時具有很強的存儲擴展性。
[0014] 所述的步驟(3)中創(chuàng)建遙感影像數(shù)據(jù)庫時,根據(jù)遙感影像來源的衛(wèi)星、傳感器以及 拍攝時間創(chuàng)建遙感影像數(shù)據(jù)庫的列簇、列和行鍵,并使所述的列簇對應遙感影像所來源的 衛(wèi)星,所述的列對應遙感影像所來源衛(wèi)星上的傳感器,所述的行鍵對應遙感影像的拍攝時 間。
[0015] 所述的處理請求包括待分割遙感影像所來源的衛(wèi)星編號、傳感器編號、拍攝時間 以及所要采用分割模型對應的分類算法名稱。
[0016] 所述步驟(4)的具體實現(xiàn)過程如下:
[0017]首先,根據(jù)用戶處理請求中的衛(wèi)星編號、傳感器編號以及拍攝時間從遙感影像數(shù) 據(jù)庫的原始遙感影像數(shù)據(jù)表中去查找列簇為衛(wèi)星編號,列為傳感器編號,行鍵為拍攝時間 的遙感影像;根據(jù)用戶處理請求中的衛(wèi)星編號、傳感器編號以及分類算法名稱從算法模型 庫中查找所要選用的分割模型;
[0018] 然后,對查找到的遙感影像進行特征提取,并將得到的特征數(shù)據(jù)輸入至所要選用 的分割模型中以得到分割后的遙感影像;
[0019] 最后,將分割后的遙感影像存儲于遙感影像數(shù)據(jù)庫的處理后遙感影像數(shù)據(jù)表中, 對應列簇為衛(wèi)星編號,列為傳感器編號,行鍵為拍攝時間_分類算法名稱的位置。
[0020] 傳統(tǒng)的對遙感影像進行分割的方法是基于單機處理的方法,面對海量數(shù)據(jù)具有明 顯缺陷;而本發(fā)明基于云平臺的遙感影像處理方法利用了云平臺的可擴展性的優(yōu)勢,可以 處理海量的遙感影像數(shù)據(jù),具體優(yōu)勢體現(xiàn)如下:
[0021] (1)本發(fā)明利用HBase來存儲遙感影像數(shù)據(jù)對于遙感影像時空檢索具有很好的使 用價值:一方面可以很好地利用HBase的鍵值對特性存儲各種異構的遙感影像數(shù)據(jù),滿足不 同的存儲需求;另一方面可以很好地利用HBase的鍵值對特性快速訪問遙感影像數(shù)據(jù)。 [0022] (2)Spark作為一個具有內存計算特性的平臺,集成了MLlib庫,便于進行機器學習 算法的處理,本發(fā)明利用Spark Mllib對遙感影像數(shù)據(jù)進行處理,能夠加快對遙感影像的處 理速度。
【附圖說明】
[0023]圖1為本發(fā)明基于云平臺的遙感影像分割方法流程示意圖。
[0024] 圖2為遙感影像訓練樣本庫及算法模型庫的構建示意圖。
【具體實施方式】
[0025] 為了更為具體地描述本發(fā)明,下面結合附圖及【具體實施方式】對本發(fā)明的技術方案 進行詳細說明。
[0026]本實例在具體處理某個待分割的遙感影像數(shù)據(jù)前,需要先構建該分割處理模型, 構建過程包括:
[0027] 步驟1:創(chuàng)建遙感數(shù)據(jù)存儲數(shù)據(jù)庫:首先根據(jù)衛(wèi)星號、傳感器號分別作為存儲遙感 影像原始數(shù)據(jù)表的列簇和列創(chuàng)建表,表結構如表1所示:
[0028] 表 1
[0030] 然后根據(jù)待存儲的遙感影像數(shù)據(jù)的衛(wèi)星號、傳感器號和拍攝日期將該遙感影像數(shù) 據(jù)存儲到對應位置;以遙感影像GF1_PMS1_E119·0_N31·9_20130712_L2A0000121522-MSSl. tiff為例,該遙感影像的拍攝衛(wèi)星是GFl、傳感器是PMSl、拍攝日期是2013-07-12,所 以將該遙感影像數(shù)據(jù)存放到原始遙感影像數(shù)據(jù)表中列簇為GF1、列為PMS1、行鍵為20130712 的位置。同時創(chuàng)建處理后遙感影像數(shù)據(jù)表,創(chuàng)建過程跟上述過程類似,不再贅述,表結構如 表2所示:
[0031] 表2
[0033] 步驟2:創(chuàng)建遙感影像樣本特征庫,分別提取不同衛(wèi)星不同傳感器拍攝的遙感影像 中的實物樣本并標記。以衛(wèi)星GFl、傳感器PMSl為例,手動提取GFl、PMS1拍攝的遙感影像中 的城市、農村、河流、森林等實物的樣本點,并手動標記,然后將訓練樣本存放到樣本庫中。
[0034] 在構建樣本庫時,因為不同衛(wèi)星不同傳感器拍攝的遙感影像數(shù)據(jù)特征不同,所以 需要對不同衛(wèi)星不同傳感器所拍的數(shù)據(jù)進行特征提取,提取出影像中的城市、河流、森林、 農村等區(qū)域的像素點并標記存放到樣本庫,如圖2所示。
[0035] 步驟3:創(chuàng)建遙感影像算法模型庫。以Spark Mllib中Decision Tree訓練衛(wèi)星GF1、 傳感器PMSl衛(wèi)星拍攝的遙感影像為例,到樣本特征庫中找到衛(wèi)星GF1、傳感器PMSl拍攝的遙 感影像訓練數(shù)據(jù)的樣本點,調用Spark MLlib中Decision Tree訓練得到一個模型,即GF1_ PMSlDecisionTree模型,然后將該訓練好的模型存放到算法模型庫中,如圖2所示。
[0036]至此,算法模型構建完畢。
[0037]接下來是對遙感影像進行分割的部分。當用戶發(fā)送處理請求時,以用戶需要利用 Decision Tree處理遙感影像GF1_PMS1_E119·0_N31·9_20130712_L2A0000121522-MSSl. tiff為例;如圖1所示,具體實施過程分為以下步驟:
[0038]步驟1:首先,根據(jù)該遙感影像的名字,可以得到遙感影像所拍攝的衛(wèi)星為GFMf 感器為PMSl,以及拍攝時間為2013-07-12,然后根據(jù)遙感影像所拍攝的衛(wèi)星GF1、傳感器 PMSl以及拍攝日期2013-07-12到HBase數(shù)據(jù)庫原始遙感影像數(shù)據(jù)表中去尋找列簇為GFl,列 為PMSl,行鍵為2013-07-12所對應的遙感影像數(shù)據(jù)rs_data,該數(shù)據(jù)即為待處理的遙感影 像。
[0039]步驟2:根據(jù)遙感影像所拍攝的衛(wèi)星GFl、傳感器PMSl以及用戶請求使用的算法 Decision Tree到算法模型庫中提取出訓練好的算法模型GFl_PMSl_DecisionTree,我們暫 且稱為a Igorithm 〇
[0040] 步驟3 :首先根據(jù)衛(wèi)星號GFl,傳感器號PMSl,拍攝日期2013-07-12和處理算法 DecisionTree到處理后遙感影像數(shù)據(jù)表中去查找是否存在處理好的數(shù)據(jù),如果存在,直接 返回結果,如果不存在,則進行處理。處理時,用算法模型algorithm對遙感影像數(shù)據(jù)rs_ data進行處理,得到分割后的遙感影像rs_data',將處理好的遙感影像數(shù)據(jù)存放到HBase數(shù) 據(jù)庫中的處理后遙感影像數(shù)據(jù)表中,此時,該處理后的數(shù)據(jù)應該放在該表中列簇為GFljO 為 PMS1,行鍵為 2013-07-12_DecisonTree 的位置。
[0041] 上述的對實施例的描述是為便于本技術領域的普通技術人員能理解和應用本發(fā) 明。熟悉本領域技術的人員顯然可以容易地對上述實施例做出各種修改,并把在此說明的 一般原理應用到其他實施例中而不必經過創(chuàng)造性的勞動。因此,本發(fā)明不限于上述實施例, 本領域技術人員根據(jù)本發(fā)明的揭示,對于本發(fā)明做出的改進和修改都應該在本發(fā)明的保護 范圍之內。
【主權項】
1. 一種基于云平臺的遙感影像分割方法,包括如下步驟: (1) 收集來自不同衛(wèi)星不同傳感器所拍攝的遙感影像,并對這些遙感影像中的各類區(qū) 域進行人工標記; (2) 對于任一衛(wèi)星上的任一傳感器,對由該傳感器所拍攝的遙感影像進行特征提取以 得到多組特征樣本,基于所述的特征樣本從機器學習庫Spark Mllib中任取一種分類算法 進行訓練以得到關于該傳感器遙感影像區(qū)域劃分的分割模型;依此遍歷所有衛(wèi)星、所有傳 感器以及所有分類算法,以得到多個分割模型并存儲于算法模型庫內; (3) 創(chuàng)建遙感影像數(shù)據(jù)庫,采集來源于不同衛(wèi)星不同傳感器以及不同拍攝時間的遙感 影像存儲于所述的遙感影像數(shù)據(jù)庫內; (4) 根據(jù)用戶的處理請求從遙感影像數(shù)據(jù)庫中查找所要處理的遙感影像,從算法模型 庫中查找所要選用的分割模型;進而對所要處理的遙感影像進行特征提取,并將得到的特 征數(shù)據(jù)輸入至所要選用的分割模型中以得到分割后的遙感影像。2. 根據(jù)權利要求1所述的遙感影像分割方法,其特征在于:所述的特征樣本存儲于特征 樣本庫內,特征樣本包括遙感影像各像素點的特征信息以及各像素點關于區(qū)域的人工標記 信息。3. 根據(jù)權利要求2所述的遙感影像分割方法,其特征在于:所述步驟(2)中采用分類算 法進行訓練的過程以特征樣本的特征信息作為分割模型的輸入,以特征樣本的人工標記信 息作為分割模型的輸出進行學習。4. 根據(jù)權利要求1所述的遙感影像分割方法,其特征在于:所述的遙感影像數(shù)據(jù)庫采用 分布式存儲系統(tǒng)HBase。5. 根據(jù)權利要求1所述的遙感影像分割方法,其特征在于:所述的步驟(3)中創(chuàng)建遙感 影像數(shù)據(jù)庫時,根據(jù)遙感影像來源的衛(wèi)星、傳感器以及拍攝時間創(chuàng)建遙感影像數(shù)據(jù)庫的列 簇、列和行鍵,并使所述的列簇對應遙感影像所來源的衛(wèi)星,所述的列對應遙感影像所來源 衛(wèi)星上的傳感器,所述的行鍵對應遙感影像的拍攝時間。6. 根據(jù)權利要求1所述的遙感影像分割方法,其特征在于:所述的處理請求包括待分割 遙感影像所來源的衛(wèi)星編號、傳感器編號、拍攝時間以及所要采用分割模型對應的分類算 法名稱。7. 根據(jù)權利要求6所述的遙感影像分割方法,其特征在于:所述步驟(4)的具體實現(xiàn)過 程如下: 首先,根據(jù)用戶處理請求中的衛(wèi)星編號、傳感器編號以及拍攝時間從遙感影像數(shù)據(jù)庫 的原始遙感影像數(shù)據(jù)表中去查找列簇為衛(wèi)星編號,列為傳感器編號,行鍵為拍攝時間的遙 感影像;根據(jù)用戶處理請求中的衛(wèi)星編號、傳感器編號以及分類算法名稱從算法模型庫中 查找所要選用的分割模型; 然后,對查找到的遙感影像進行特征提取,并將得到的特征數(shù)據(jù)輸入至所要選用的分 割模型中以得到分割后的遙感影像; 最后,將分割后的遙感影像存儲于遙感影像數(shù)據(jù)庫的處理后遙感影像數(shù)據(jù)表中,對應 列簇為衛(wèi)星編號,列為傳感器編號,行鍵為拍攝時間_分類算法名稱的位置。
【文檔編號】G06K9/34GK105844230SQ201610161519
【公開日】2016年8月10日
【申請日】2016年3月22日
【發(fā)明人】陳華鈞, 張松陽, 張曉兵, 羅丹, 鄭國軸
【申請人】浙江大學