亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于動態(tài)時間規(guī)整和劃分算法的波形分類方法

文檔序號:9489733閱讀:1649來源:國知局
基于動態(tài)時間規(guī)整和劃分算法的波形分類方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于地震數(shù)據(jù)處理領(lǐng)域,具體涉及一種地震波形分類技術(shù)。
【背景技術(shù)】
[0002]地震波形是地震數(shù)據(jù)的基本性質(zhì),它包含了所有的定性和定量信息,如反射模式、相位、頻率和振幅等信息,是地震信息的總體特征,其動態(tài)變化蘊含了豐富的內(nèi)在信息,能夠真實地反映地下結(jié)構(gòu)的特征。波形分類法是最常采用的地震相分析方法,通過對地震信號波形進行分類,可以實現(xiàn)對地震相的劃分。波形分類針對含有各種波形的地震數(shù)據(jù)樣本集,通過合適的分類或者聚類方法,將樣本劃分到不同的類別,以達到區(qū)分波形樣本的目的。
[0003]波形分類技術(shù)分為聚類分析和統(tǒng)計分類。聚類分析是把從圖像或者信號中提取到的輸入特征屬性以“聚類”的形式分開,最后達到區(qū)分這些圖像或者信號的目的。聚類分析是無監(jiān)督的,不需要使用標簽信息,沒有樣本數(shù)據(jù)的先驗知識,挖掘的是樣本之間的內(nèi)在聯(lián)系。統(tǒng)計分類主要是基于概率統(tǒng)計模型的方法,通過現(xiàn)實有標簽的樣本集得到各種特征屬性和內(nèi)在規(guī)律作為后續(xù)的分類依據(jù),然后再對樣本數(shù)據(jù)進行分類和識別,屬于有監(jiān)督的學習過程。
[0004]目前的波形分類技術(shù)主要基于無監(jiān)督分類算法。聚類分析不需要先驗信息,只需要輸入工區(qū)的振幅數(shù)據(jù),就能進行波形分類,對地震相進行劃分。聚類分析的策略,是讓同一類的成員間相似性最大,同時不同類的成員間相似性最小。通常采用的相似性度量方法是計算各個波形之間的“距離”。距離計算方法不同,各個樣本之間的相似度就不同,最終的劃分結(jié)果也就隨之變化。因此,距離的計算方法在聚類分析中占有舉足輕重的地位。
[0005]在波形分類中,相似性度量通常使用歐氏距離。歐氏距離是最易于理解的一種距離計算方法,源自歐氏空間中兩點間的距離公式,也是使用最廣泛的相似性度量方法。但是,歐氏距離存在著很明顯的缺陷,當層位不準確且未校準層位時,在沿層位截取數(shù)據(jù)之后,同相軸沒有對齊,此時如果用歐式距離計算相似性,會使原本比較相似的兩道數(shù)據(jù)距離增大,即求得的相似性比實際的相似性要小很多,從而在后續(xù)的聚類過程中,可能把原本應該聚到同一個簇的兩個樣本,分到了兩個不同的簇,從而出現(xiàn)錯誤的結(jié)果。歐氏距離對層位解釋錯誤非常敏感,而層位解釋錯誤在地震數(shù)據(jù)中是普遍存在的,尤其對于一些開發(fā)尚不成熟的工區(qū)。如果要使用歐氏距離來衡量波形的相似性,則需要另外的步驟來校正層位。
[0006]無監(jiān)督的波形分類即為聚類,聚類分析最簡單、最基本的版本是劃分?;趧澐值木垲愃惴ㄊ窃诮o定η道地震數(shù)據(jù)集D以及要區(qū)分的地震相種類數(shù)k的條件下,把地震數(shù)據(jù)組織成k(k<n)個分區(qū),其中,一個分區(qū)稱為一個簇,每個簇代表一種地震相。這些簇的形成旨在優(yōu)化一個客觀劃分準則,如基于距離的相異性函數(shù),使得根據(jù)數(shù)據(jù)集的屬性,在同一個簇中的對象是“相似的”,而不同簇中的對象是“相異的”。最著名、最常用的劃分方法有:k-means和k-medoids,這些名稱是根據(jù)選定的簇中心的方法不同來區(qū)別的。k_means算法中,每個簇的中心都用簇中所有對象的均值來表示;而k-medoids是一種基于中心點或中心對象進行劃分的算法。但現(xiàn)有的定義族的中心的方法,不能很好地代表一個族的特征。

【發(fā)明內(nèi)容】

[0007]本發(fā)明所要解決的技術(shù)問題為:當存在層位解釋錯誤時,如何準確地度量地震數(shù)據(jù)之間的相似性以及在基于劃分的聚類算法中如何準確確定簇的中心;為解決所述技術(shù)問題,提出一種基于動態(tài)時間規(guī)整和劃分算法的波形分類方法,采用動態(tài)時間規(guī)整(DTff, Dynamic Time Wrapping)來求兩道地震數(shù)據(jù)之間的距離,由于使用DTW距離來度量兩道數(shù)據(jù)之間的相似性,因此在形成簇之后,采用了相應的簇中心更新算法。
[0008]本發(fā)明采用的技術(shù)方案是:基于動態(tài)時間規(guī)整和劃分算法的波形分類方法,包括以下步驟:
[0009]S1:確定地震數(shù)據(jù)樣本集;
[0010]S2:根據(jù)地震數(shù)據(jù)樣本集的地震相種類,確定地震數(shù)據(jù)樣本集的分類數(shù)目k ;
[0011]S3:從地震數(shù)據(jù)樣本集中選擇k個樣本作為初始質(zhì)心;
[0012]S4:基于DTW距離,將未被選為初始質(zhì)心的樣本數(shù)據(jù)分配到對應質(zhì)心所在的簇;
[0013]S5:迭代地更新簇的質(zhì)心;
[0014]S6:判斷是否達到迭代次數(shù)上限,是則結(jié)束,得到最終分配的k個簇;否則根據(jù)步驟S5得到的簇的更新的質(zhì)心執(zhí)行步驟S4,對未被選為初始質(zhì)心的樣本數(shù)據(jù)進行重新分配。
[0015]進一步地,步驟S1所述地震數(shù)據(jù)樣本集為:疊前地震數(shù)據(jù)樣本集或疊后地震數(shù)據(jù)樣本集。
[0016]更進一步地,所述疊前地震數(shù)據(jù)樣本集通過將疊前地震數(shù)據(jù)進行預處理,得到疊前地震數(shù)據(jù)樣本集,具體過程為:由每一道疊前地震數(shù)據(jù)包括m個不同的偏移距,每個偏移距下有η個米樣點;初始化若干值為0的列向量,且將每一列向量分成m'個部分,每部分長度都為n',將每一道原始地震數(shù)據(jù)的偏移距按照從小到大進行排序,依次將同一偏移距的數(shù)據(jù)存入列向量對應序號的部分;最后得到疊前地震數(shù)據(jù)樣本集;
[0017]其中,m蘭 m、,η 蘭 η、。
[0018]更進一步地,對疊前地震數(shù)據(jù)樣本集,基于DTW距離,求解最短距離時,必須滿足:起點為(1,1),終點為(m*n,m*n);且,必經(jīng)過點(j*n, j*n);
[0019]其中,j為m個不同偏移距的序號,j = 1,2,……,(m-1)。
[0020]進一步地,步驟S2中所述地震數(shù)據(jù)樣本集的地震相種類,由歷史數(shù)據(jù)資料以及經(jīng)驗值,通過統(tǒng)計分析得到。
[0021]進一步地,所述步驟S3具體為:
[0022]S31:從輸入的地震數(shù)據(jù)樣本集中隨機選擇一道樣本數(shù)據(jù)作為初始質(zhì)心,并計初始質(zhì)心個數(shù)p = 1 ;
[0023]S32:對于樣本集中,未被選為初始質(zhì)心的每一道樣本數(shù)據(jù),通過DTW距離,計算出在初始質(zhì)心集合中與該道樣本數(shù)據(jù)距離最小的初始質(zhì)心,并記錄下對應距離d(i);
[0024]其中,i表示樣本集中未被選為初始質(zhì)心的樣本數(shù)據(jù)的序號;
[0025]S33:將由步驟S32得到的所有d(i)相加得到SUM,并生成一個屬于[0,SUM]的隨機數(shù) Random ;
[0026]S34:執(zhí)行 Random = Random-d (i);
[0027]S35:當Random彡0,此時的i所對應的樣本數(shù)據(jù)為新的初始質(zhì)心,則p = p+1,并繼續(xù)步驟S36 ;否則轉(zhuǎn)至步驟S34 ;
[0028]S36:當p = k時,得到k個初始質(zhì)心,否則轉(zhuǎn)至步驟S32。
[0029]進一步地,所述步驟S4具體為:根據(jù)由步驟S3選出的k個初始質(zhì)心,基于DTW距離,計算得到每一個未被選為初始質(zhì)心的樣本數(shù)據(jù)與k個初始質(zhì)心的最小距離,將樣本數(shù)據(jù)分配到最小距離對應初始質(zhì)心所在的簇,得到k個新的簇。
[0030]進一步地,所述步驟S5具體為:
[0031]S51:遍歷簇中每一個樣本數(shù)據(jù),與該簇質(zhì)心對齊,得到該簇中各樣本數(shù)據(jù)與該簇質(zhì)心對齊的點對;
[0032]S52:根據(jù)步驟S51中得到的點對,得到該簇各樣本數(shù)據(jù)與該簇質(zhì)心對其的的對齊點,并將對齊點振幅相加,取平均值得到該簇新的質(zhì)心;
[0033]S53:判斷是否達到第二迭代次數(shù)上限,是則結(jié)束,得到該簇更新后的質(zhì)心;否則,以步驟S52得到的該簇新的質(zhì)心,執(zhí)行步驟S51至步驟S52。
[0034]本發(fā)明的有益效果:本發(fā)明的基于動態(tài)時間規(guī)整和劃分算法的波形分類方法,針對存在層位解釋誤差的數(shù)據(jù),采用動態(tài)時間規(guī)整來對齊地震數(shù)據(jù),減小了層位解釋誤差的影響,更精確地度量了兩道地震數(shù)據(jù)之間的相似性;本發(fā)明基于劃分算法,利用簇的質(zhì)心來作為簇的中心,相較于傳統(tǒng)劃分算法中定義的簇的中心,更準確,更能代表一個簇的特征;本發(fā)明將DTW距離和劃分算法相結(jié)合,形成一個完整的波形分類流程,能更好地劃分地震相。
【附圖說明】
[0035]圖1為本發(fā)明提供的序列對齊不意圖。
[0036]圖2為本發(fā)明提供的方案流程圖。
【具體實施方式】
[0037]為便于本領(lǐng)域技術(shù)人員理解本發(fā)明的技術(shù)內(nèi)容,下面結(jié)合附圖對本
【發(fā)明內(nèi)容】
進一步闡釋。
[0038]動態(tài)時間規(guī)整(DTW, Dynamic Time Wrapping)是一種衡量兩個時間序列的相似度的方法,與歐氏距離不同的是,它不僅可以比較兩個等長的時間序列之間的相似性,對于長度不同的時間序列也能比較相似性,同時還能消除序列之間的相位作用。
[0039]在波形分類中,根據(jù)層位加窗取得的數(shù)據(jù)是一道波形,由于存在層位解釋錯誤、按層位截取出來的三維數(shù)據(jù),每一道的第一個點與實際的層位剖面距離并不相同,存在一定的相位誤差。為此,采用動態(tài)時間規(guī)整的方法來度量兩道地震波形的相似性,從而消除這種相位誤差。我們以一道數(shù)據(jù)為基準,取需要與該道計算相似性的一道作為對比道,遍歷基準道中的每一個點,按照一定的規(guī)則,在對比道中尋找與基準道中的點最相似的點。這個過程,稱為對齊。這樣不僅可以校正層位,消除相位誤差,把與實際層位剖面距離相同的點校正到同一個剖面,同時,也是一個計算相似性的過程。如圖1所示,是兩個波形C、Q對齊的例子,圖A是需要比較相似性的兩個波形,圖B是將C、Q對齊的過程,圖C是將兩個序列對齊的結(jié)果顯示。具體的DTW距離算法為現(xiàn)有的技術(shù),因此在此處不作詳細描述。
[0040]如圖2所示為本發(fā)明方案的流程圖,本發(fā)明的基于動態(tài)時間規(guī)整和劃分算法的波形分類方法具體包括:
[0041]S1:確定地震數(shù)據(jù)樣本集;
[0042]S2:根據(jù)地震數(shù)據(jù)樣本集的地震相種類,確定地震數(shù)據(jù)樣本集的分類數(shù)目k ;
[0043]S3:從地震數(shù)據(jù)樣本集中選擇k個樣本作為初始質(zhì)心;
[0044]S4:基于DTW距離,將未被選為初始質(zhì)心的樣本數(shù)據(jù)分配到對應質(zhì)心所在的簇;
[0045]S5:迭代地更新簇的質(zhì)心;
[0046]S6:判斷是否達到迭代次數(shù)上限,是則結(jié)束,得到最終分配的k個簇;否則根據(jù)步驟S5得到的簇的更新的質(zhì)心執(zhí)行步驟S4,對未被選為初始質(zhì)心的樣本數(shù)據(jù)進行重新分配。
[0047]步驟S1所述的地震數(shù)據(jù)樣本集為:疊前地震數(shù)據(jù)樣本集或疊后地震數(shù)據(jù)樣本集;疊后地震數(shù)據(jù)即為樣本集格式名不需進行數(shù)據(jù)預處理,直接進行后續(xù)處理。
[0048]所述疊前地震數(shù)據(jù)樣本集通過將疊前地震數(shù)據(jù)進行預處理,得到疊前地震
當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1