本發(fā)明涉及一種抽油井故障診斷技術,具體地說是一種基于曲波變換和核稀疏的抽油井半監(jiān)督故障診斷方法。
背景技術:
在實際的石油開采過程中,常用的有桿泵抽油井系統(tǒng)所處的生產(chǎn)環(huán)境較為惡劣,故障發(fā)生率高,經(jīng)常無法正常工作。各種故障會導致諸如產(chǎn)油量減少,油井停產(chǎn)甚至設備損壞等嚴重后果。在傳統(tǒng)的石油生產(chǎn)中,一般依靠有經(jīng)驗的技術人員人為的對采集到的井上示功圖或者經(jīng)轉(zhuǎn)化而得到的井下泵功圖進行分析,來判斷系統(tǒng)當前是否正常工作。這種方法效率低,且受主觀影響大,無法滿足企業(yè)的生產(chǎn)需求。因此,利用計算機自動實現(xiàn)有桿泵抽油井系統(tǒng)的故障診斷是一種非常有意義的技術。
有桿泵抽油井系統(tǒng)的故障診斷可以看成是一個模式識別問題,通常分為兩個步驟:特征提取和分類。常用的針對井上示功圖或者井下泵功圖的特征提取方法主要有網(wǎng)格法,鏈碼法,傅里葉級數(shù)法等;分類一般采用經(jīng)典的支持向量機和bp神經(jīng)網(wǎng)絡。這些經(jīng)典方法往往并不能很好的結(jié)合實際生產(chǎn)情況。
當前的有桿泵抽油井系統(tǒng)的故障診斷方法大都為有監(jiān)督方法,即所有的訓練數(shù)據(jù)都人為的標記出故障類型。在實際生產(chǎn)中,有標簽的數(shù)據(jù)是非常昂貴的,很難獲得大量的標記數(shù)據(jù),相對的,存在大量的未被利用的無標記的數(shù)據(jù)。如何利用好這些無標記數(shù)據(jù)的信息,是一個亟待解決的問題。
技術實現(xiàn)要素:
針對現(xiàn)有技術中有桿泵抽油井系統(tǒng)故障診斷方法中存在大量的未被利用的無標記的數(shù)據(jù)、不能很好的結(jié)合實際生產(chǎn)情況等不足,本發(fā)明要解決的問題是提供一種可有效利用未標記數(shù)據(jù)信息的基于曲波變換和核稀疏的抽油井半監(jiān)督故障診斷方法。
為解決上述技術問題,本發(fā)明采用的技術方案是:
本發(fā)明一種基于曲波變換和核稀疏的抽油井半監(jiān)督故障診斷方法,包括以下步驟:
1)通過現(xiàn)場示功儀獲取n(n=l+u)個示功圖數(shù)據(jù)作為訓練樣本,其中l(wèi)個示功圖為已知標簽數(shù)據(jù),u個示功圖為無標簽數(shù)據(jù);
2)根據(jù)波動方程,利用有限差分法將n個示功圖轉(zhuǎn)化為井下泵功圖,再將每個泵功圖轉(zhuǎn)化大小為m×m像素的灰度圖像;
3)對每個泵功圖xi進行曲波變換,得到第i個泵功圖的s個尺度的系數(shù)矩陣ci:
ci={cij},i=1,…,n,j=1,…,s,其中n為泵功圖總數(shù)量,s=log2m-3;
4)根據(jù)第一個尺度的系數(shù)矩陣ci1計算單幅泵功圖的特征向量vi;
5)將全部有標簽的泵功圖的特征向量作為字典d,d={vi},i=1,…,l;對每個未標記泵功圖特征向量vj,j=l,…,l+u,求稀疏系數(shù)
6)利用稀疏系數(shù),計算每個無標簽泵功圖的虛擬標簽
7)將訓練樣本中所有泵功圖的特征向量作為字典d',d'={vi},i=1,…,l+u;對每一個待診斷的測試樣本,計算其特征向量vtest,并求得其對應的稀疏系數(shù)
8)利用稀疏系數(shù)
步驟4)中,根據(jù)第一個尺度的系數(shù)矩陣ci1計算單幅泵功圖的特征向量vi為:對由曲波變換得到的尺度系數(shù)矩陣中的第一個尺度的系數(shù)矩陣ci1,采用非重疊的方式按照2×2的大小進行二進剖分,分別計算每個剖分子塊的灰度均值,得到一個特征矩陣c′i1,將矩陣c′i1按照如下公式進行歸一化:
將歸一化后的矩陣c′i1的每一列級聯(lián)成一個向量,即得到單幅泵功圖的特征向量vi。
步驟6)利用稀疏系數(shù)
利用稀疏系數(shù)
步驟8)利用稀疏系數(shù)
利用稀疏系數(shù)
標簽ytest中數(shù)值最大的元素所對應的序號i,即代表當前發(fā)生第i類故障。
本發(fā)明具有以下有益效果及優(yōu)點:
1.本發(fā)明通過對井下泵功圖進行曲波變換后得到的特征向量能更精確的描述出泵功圖的特征,基于核方法的半監(jiān)督稀疏表達分類器不僅可以有效的利用未標記數(shù)據(jù)的信息,而且對有標記的樣本數(shù)量要求不高,可以節(jié)省大量用來標記樣本的人力成本。
2.本發(fā)明通過有限差分法將井上示功圖轉(zhuǎn)化為井下泵功圖,并對得到的井下泵功圖進行曲波變換并提取特征,所得到的特征向量能更精確的描述出泵功圖的特征,以便于后續(xù)診斷。
3.基于核方法的半監(jiān)督稀疏表達分類器只需要計算訓練樣本間的稀疏關系,不需要預先測試超參數(shù),具有很強的泛化能力,可以更好的結(jié)合實際生產(chǎn)情況。
附圖說明
圖1為本發(fā)明出基于曲波變換和核稀疏的抽油井半監(jiān)督故障診斷方法流程圖;
圖2為本發(fā)明方法中有限差分法求解泵功圖中補格法示意圖;
圖3為本發(fā)明方法中利用有限差分法求得的泵功圖;
圖4為本發(fā)明方法對泵功圖進行曲波變換得到的系數(shù)矩陣可視化的結(jié)果示意圖。
具體實施方式
下面結(jié)合說明書附圖對本發(fā)明作進一步闡述。
如圖1所示,本發(fā)明一種基于曲波變換和核稀疏的抽油井半監(jiān)督故障診斷方法包括以下步驟:
1)通過現(xiàn)場示功儀獲取n(n=l+u)個示功圖數(shù)據(jù)作為訓練樣本,其中l(wèi)個示功圖為已知標簽數(shù)據(jù),u個示功圖為無標簽數(shù)據(jù);
2)根據(jù)經(jīng)典波動方程,利用有限差分法將n個示功圖轉(zhuǎn)化為井下泵功圖,再將每個泵功圖轉(zhuǎn)化大小為256×256像素的灰度圖像;
3)對每個泵功圖xi進行曲波變換,得到第i個泵功圖的s個尺度的系數(shù)矩陣ci:
ci={cij},i=1,…,n,j=1,…,s,其中n為泵功圖總數(shù)量,s=log2256-3=5;
4)據(jù)第一個尺度的系數(shù)矩陣ci1計算單幅泵功圖的特征向量vi;
5)將全部有標簽的泵功圖的特征向量作為字典d,d={vi},i=1,…,l;對每個未標記泵功圖特征向量vj,j=l,…,l+u,求稀疏系數(shù)
6)利用稀疏系數(shù),計算每個無標簽泵功圖的虛擬標簽
7)將訓練樣本中所有泵功圖的特征向量作為字典d',d'={vi},i=1,…,l+u;對每一個待診斷的測試樣本,其特征向量vtest,求得其稀疏系數(shù)
8)利用稀疏系數(shù)
步驟2)中,以某油田為例,三級組合桿柱每根桿長為523.61m,664.32m和618.35m,桿柱的直徑為0.025m,0.022m和0.019m。抽油桿密度為8456kg/m3,石油密度為843kg/m3,彈性模量e=2.1×1011pa,粘滯阻尼系數(shù)c=0.4654,應力傳播速度a=4970m/s。
根據(jù)如下波動方程:
利用有限差分法將所有井上示功圖轉(zhuǎn)化為井下泵功圖,設驢頭的下始點為坐標原點,將每根抽油桿分為k段,選取每段的步長為δx,同理,選取δt為時間t的步長,下角標i表示位置,j表示時間,則有:
將以上三式帶入波動方程可以得到:
根據(jù)井上示功圖可知地面光桿位移為u1,u2,…,uk,光桿動載荷為f1,f2,...,fk,根據(jù)胡克定律則波動方程的邊界條件為:
(1)u1,1=-u1;u1,2=-u2;…;u1,k=-uk
其中a為抽油桿截面積。
由于示功圖是一個周期函數(shù),如圖2所示,采用補格法可得到邊界條件:
(3)ui,k=ui,0
(4)ui+1,1=ui,k+1
步長δx和δt的選取,應滿足如下的穩(wěn)定性條件:
在桿柱末端(泵)處,位移為:
up=-ui+1
桿柱末端(泵)處,載荷為:
根據(jù)所求得的泵位移和泵載荷,即可繪制出井下泵功圖。所求得的泵功圖如圖3所示。之后將每個泵功圖轉(zhuǎn)化大小為256×256像素的灰度圖像。步驟3)中,利用第二代curvelet工具包對每個泵功圖xi進行曲波變換,得到5個尺度的系數(shù)矩陣ci,ci={cij},i=1,…,n,j=1,2,3,4,5。泵功圖及其對應的系數(shù)矩陣可視化結(jié)果如圖4所示。
步驟4)中,將第一個尺度的系數(shù)矩陣ci1,采用非重疊的方式按照2×2的大小進行二進剖分,分別計算每個剖分子塊的灰度均值,得到一個10×10的矩陣c′i1,將矩陣c′i1按照如下公式進行歸一化:
將歸一化后的矩陣c′i1的每一列級聯(lián)成一個100×1的向量,得到單幅泵功圖的特征向量vi。
步驟5)中,關于稀疏系數(shù)
k(x,xc)=exp(-||x-xc||/σ)
其中,xc為核函數(shù)中心和σ為核函數(shù)的寬度參數(shù),控制了核函數(shù)的徑向控制范圍。取σ=8d,d為特征向量的維度。
將全部有標簽的泵功圖的特征向量作為字典d,d={vi},i=1,…,l。對每個未標記的泵功圖特征向量vj,j=l,…,l+u,其相應的稀疏系數(shù)
其中,φ(·)代表非線性映射函數(shù),并滿足φ(x1)φ(x2)=k(x1,x2),核函數(shù)向量kj=[k(vj,v1),...,k(vj,vl)],k為如下形式的核函數(shù)矩陣:
步驟6)中,利用稀疏系數(shù)
其中,yd為全部有標簽的泵功圖的標簽向量集合,yd={yi},i=1,...,l。
步驟7)中,將訓練樣本中所有泵功圖的特征向量作為字典d',d'={vi},i=1,…,l+u。對每一個待診斷的測試樣本,計算其特征向量vtest,其相應的稀疏系數(shù)
其中,核向量ktest=[k(vtest,v1),...,k(vtest,vl)],k為如下形式的核函數(shù)矩陣:為
式中,αtest為待診斷樣本所對應的稀疏系數(shù),vtest為待診斷樣本的特征向量,λ為權(quán)衡因子,αij為αj中的第i個元素,vi,
步驟8)中,根據(jù)稀疏系數(shù)
其中,
虛擬標簽ytest中數(shù)值最大的元素所對應的序號i,即代表當前發(fā)生第i類故障。
本發(fā)明通過有限差分法將所有訓練數(shù)據(jù)即井上示功圖轉(zhuǎn)化為井下泵功圖并轉(zhuǎn)為灰度圖像,利用曲波變換對泵功圖進行特征提取后,將其中所有的有標簽的泵功圖的特征向量作為字典,對每一個無標簽泵功圖特征向量求其相對應的稀疏表達系數(shù),根據(jù)稀疏表達系數(shù)計算虛擬標簽以補所有全訓練數(shù)據(jù)的標簽,最后將訓練樣本中所有泵功圖的特征向量作為字典,對每一個待診斷的測試樣本,求其特征向量所對應的稀疏系數(shù),并計算診斷樣本的標簽,完成診斷。本發(fā)明所采用的曲波變換,能更精確的描述出泵功圖的特征;基于核方法的稀疏表達分類器不僅可以有效的利用未標記數(shù)據(jù)以便提高故障診斷的正確率,而且對有標記的樣本數(shù)量要求不高。