本發(fā)明涉及工業(yè)系統(tǒng)建模以及工業(yè)系統(tǒng)模型參數(shù)辨識技術領域。
背景技術:
實際的工業(yè)系統(tǒng),包括機械設備、發(fā)動機等,都屬于復雜的非線性系統(tǒng),對這些系統(tǒng)的精確建模是控制和優(yōu)化方法設計與實現(xiàn)的前提條件。而線性變參數(shù)模型能夠有效的對此類工業(yè)過程進行建模,其實際意義遠遠超過了傳統(tǒng)的建模方法。因此,對線性變參數(shù)模型的研究很有必要。
在利用線性變參數(shù)模型對復雜工業(yè)過程進行建模時,對已經(jīng)建好的模型進行參數(shù)辨識需要考慮以下常見因素:存在系統(tǒng)時滯、系統(tǒng)的輸出數(shù)據(jù)隨機缺失、系統(tǒng)的輸出數(shù)據(jù)中含有異常值。這些因素都會很大程度上影響模型參數(shù)辨識的精度。
技術實現(xiàn)要素:
本發(fā)明的目的是為了解決現(xiàn)有技術存在系統(tǒng)時滯、系統(tǒng)的輸出數(shù)據(jù)隨機缺失、系統(tǒng)的輸出數(shù)據(jù)中含有異常值導致模型參數(shù)辨識精度較低的問題,而提出一種量測數(shù)據(jù)隨機缺失的線性變參數(shù)時滯系統(tǒng)的魯棒辨識方法。
一種量測數(shù)據(jù)隨機缺失的線性變參數(shù)時滯系統(tǒng)的魯棒辨識方法包括以下步驟:
步驟一:建立線性變參數(shù)(lpv)時滯模型;
步驟二:根據(jù)步驟一建立線性變參數(shù)(lpv)時滯模型,建立基于學生氏t-分布線性變參數(shù)(lpv)時滯魯棒概率模型;
步驟三:基于廣義期望最大化(generalizedexpectationmaximization,gem)算法,對步驟二建立的基于學生氏t-分布lpv時滯魯棒概率模型進行辨識,得到線性變參數(shù)時滯模型的參數(shù)θ*,δ*,
本發(fā)明的有益效果為:
本發(fā)明方法在考慮系統(tǒng)時滯、輸出數(shù)據(jù)缺失、包含異常值的情況下,在gem算法的框架下,提出了一種lpv時滯系統(tǒng)的魯棒辨識方法,能夠有效的解決此類系統(tǒng)的模型參數(shù)辨識問題,對線性變參數(shù)系統(tǒng)辨識理論的完善及其工業(yè)實際應用起到了極大的促進作用。
將本發(fā)明方法lpvt-gem與經(jīng)典方法lpv-riv(refinedinstrumentalvariable)對相同的仿真模型進行仿真,仿真結(jié)果的對比能夠很好的證明本發(fā)明方法的有效性。當輸出數(shù)據(jù)中包含不同比例的奇異值,信噪比的情況下,參數(shù)估計結(jié)果為:當真值為1時,本發(fā)明方法的均值為1.0014,標準差為0.0305,經(jīng)典方法lpv-riv的均值為0.9462,標準差為0.0414;當真值為-0.5時,本發(fā)明方法的均值為-0.5039,標準差為0.0874,經(jīng)典方法lpv-riv的均值為0.7054,標準差為0.4068;當真值為-0.1時,本發(fā)明方法的均值為-0.0861,標準差為0.1066,經(jīng)典方法lpv-riv的均值為-1.5323,標準差為0.4517。當信噪比增加時,每個參數(shù)估計的標準差不斷減小,標準差越小,估計的效果越好;在信噪比一致的條件下,本發(fā)明方法lpvt-gem的參數(shù)估計效果要明顯好于作為對比的lpv-riv方法。
附圖說明
圖1為輸出數(shù)據(jù)缺失10%以及輸出異常值比例為10%的情況下,lpvt-gem方法中,q-函數(shù)的迭代過程圖。在圖中,q-函數(shù)的值不斷增加,在第25次迭代時,q-函數(shù)收斂;
圖2為信噪比為snr=20db以及輸出異常值比例為0%的情況下,lpvt-gem與lpv-riv方法的系統(tǒng)參數(shù)估計均值與標準差對比圖;
圖3為信噪比為snr=10db以及輸出異常值比例為0%的情況下,lpvt-gem與lpv-riv方法的系統(tǒng)參數(shù)估計均值與標準差對比圖;
圖4為信噪比為snr=5db以及輸出異常值比例為0%的情況下,lpvt-gem與lpv-riv方法的系統(tǒng)參數(shù)估計均值與標準差對比圖。
具體實施方式
具體實施方式一:一種量測數(shù)據(jù)隨機缺失的線性變參數(shù)時滯系統(tǒng)的魯棒辨識方法包括以下步驟:
步驟一:建立線性變參數(shù)(lpv)時滯模型;
步驟二:根據(jù)步驟一建立線性變參數(shù)(lpv)時滯模型,建立基于學生氏t-分布線性變參數(shù)(lpv)時滯魯棒概率模型;
步驟三:基于廣義期望最大化(generalizedexpectationmaximization,gem)算法,對步驟二建立的基于學生氏t-分布lpv時滯魯棒概率模型進行辨識,得到線性變參數(shù)時滯模型的參數(shù)θ*,δ*,
θ*:是最優(yōu)的模型參數(shù)多項式系數(shù),θ是模型參數(shù)多項式系數(shù);δ*為最優(yōu)的尺度變量,δ為尺度變量;
具體實施方式二:本實施方式與具體實施方式一不同的是:所述步驟一中建立線性變參數(shù)時滯模型的具體過程為:
假設一個線性變參數(shù)(lpv)時滯系統(tǒng)用下面的線性變參數(shù)(lpv)輸出誤差(outputerror,oe)模型表示:
xk=g(ωk,z-1)uk-d
yk=xk+εk
其中yk表示系統(tǒng)的輸出,xk為系統(tǒng)的無噪聲輸出,uk表示系統(tǒng)的輸入,ωk為可測量的調(diào)度變量,調(diào)度變量決定了系統(tǒng)的操作模式,d表示時間延遲,εk表示零均值的隨機噪聲;g(ωk,z-1)表示輸入與輸出之間的傳遞函數(shù),表示為:
其中的多項式a和b都是與調(diào)度變量ωk相關的;與調(diào)度變量ωk相關的也是就是,如果ωk的值改變,那么a和b的值也相應的改變;
寫成如下表達式:
其中na為模型輸出的階次;nb為模型輸入的階次;m和n為迭代變量,m的取值為:1,2,3……na,n的取值為:1,2,3……nb;ωk為可測量的調(diào)度變量,調(diào)度變量決定了系統(tǒng)的操作模式。z-m為m階遞歸因子,物理含義為z-mxk=xk-m;z-n為n階遞歸因子,物理含義為z-nxk=xk-n;am(ωk)和bn(ωk)表示的是兩個函數(shù);z-1表示一個遞歸因子,它表示后退一個采樣時刻,比如:k時刻的模型無噪聲輸出為xk,k-1時刻的模型無噪聲輸出為xk-1,那么這兩個時刻的輸出之間的關系是z-1xk=xk-1;am(ωk):是一個多項式函數(shù),它表示k-m時刻,模型無噪聲輸出xk-m前面的系數(shù);bn(ωk):是一個多項式函數(shù),它表示k-n-d時刻,模型輸入uk-n-d前面的系數(shù)。
在多項式a和b中,系數(shù)寫為ωk的亞純函數(shù)的線性組合:
其中
由此可以看出,調(diào)度變量的改變會引起系統(tǒng)的動態(tài)特性變化,當調(diào)度變量為常值時,系統(tǒng)的動態(tài)特性也保持不變。根據(jù)上述描述,線性變參數(shù)(lpv)時滯系統(tǒng)的模型寫為:
a(ωk,z-1)xk=b(ωk,z-1)uk-d
其中uk-d表示k-d時刻的模型輸入;
分別定義兩個維數(shù)為na(nα+1)+nb(nβ+1)的向量
其中θ是模型參數(shù)多項式系數(shù)(θ本身也是一個向量);xk-1為k-1時刻的模型無噪聲輸出;xk-2為k-2時刻的模型無噪聲輸出;
φ0(ωk)是構(gòu)成as(ωk)的第一項亞純函數(shù);
χ0(ωk)是構(gòu)成bj(ωk)的第一項亞純函數(shù);
θ由多項式函數(shù)
得到:
其中θ為自由度參數(shù),
其它步驟及參數(shù)與具體實施方式一相同。
具體實施方式三:本實施方式與具體實施方式一或二不同的是:所述步驟二中根據(jù)步驟一建立線性變參數(shù)時滯模型,建立基于學生氏t-分布線性變參數(shù)時滯魯棒概率模型的具體過程為:
一般來說,噪聲序列{εk}k=1,…,n假設為零均值的高斯白噪聲,服從分布
基于t-分布來建立lpv時滯系統(tǒng)的魯棒概率模型,步驟可分為:
步驟二一:將局部噪聲變化參數(shù)為δ/λk,由此得到:
其中δ為尺度變量,εk為噪聲序列,k=1,….n;表示噪聲序列εk服從高斯分布,均值為0,方差為δ/λk;λk是權重參數(shù):
其中
步驟二二:yk的邊緣分布通過聯(lián)合邊緣分布
通過上式不難看出,yk的邊緣分布實際上是一個t-分布,其中:
其它步驟及參數(shù)與具體實施方式一或二相同。
具體實施方式四:本實施方式與具體實施方式一至三之一不同的是:所述步驟三中廣義期望最大化算法的具體過程為:
<1>先作一個簡單符號解釋:
在整個辨識過程中,能夠直接獲取的數(shù)據(jù)集包括:輸入數(shù)據(jù)u1;n={uk}k=1,…,n,輸出數(shù)據(jù)y1:n={yk}k=1,…,n,調(diào)度變量ω1:n={ωk}k=1,…,n。在本發(fā)明方法中,考慮了隨機缺失了部分數(shù)據(jù),表示為
<2>gem本質(zhì)上是一種求解極大似然(maximumlikelihood,ml)估計的優(yōu)化算法,通過兩個步驟:e-step(期望步驟)和m-step(最大化步驟)不斷迭代優(yōu)化以達到最后的優(yōu)化效果。在e-step中,先計算出完整數(shù)據(jù)集c={cobs,cmis}的對數(shù)似然函數(shù)logp(cmis,cobs|θ),基于當前的參數(shù)估計θs和觀測數(shù)據(jù)集cobs,將對數(shù)似然函數(shù)對缺失數(shù)據(jù)集cmis求取期望,所得函數(shù)被稱為q-函數(shù),其數(shù)學表達式為:
在m-step中,通過最大化q-函數(shù),得到新的參數(shù)估計θs+1,再令θs=θs+1,不斷循環(huán)迭代,直到最后全部被估計參數(shù)收斂。綜上所述,gem算法總結(jié)如下:
待估計的參數(shù)θ1:在迭代開始之前,對需要辨識的模型參數(shù)θ賦予一個初始值,這個初始值θ=θ1;
步驟1)初始化:初始化待估計的參數(shù)θ1,迭代次數(shù)s設為1;
步驟2)e-step:計算推導出q-函數(shù):
其中l(wèi)ogp(cmis,cobs|θ)為完整數(shù)據(jù)集c={cobs,cmis}的對數(shù)似然函數(shù),θs為當前的模型參數(shù)(第s次迭代得到的線性變參數(shù)時滯模型的參數(shù)),
θs為上一次迭代得到的模型參數(shù),也是這一次迭代的參數(shù)初始值,也就是當前的模型參數(shù)。
步驟3)m-step:通過最大化q-函數(shù),得到新的參數(shù)估計θs+1,使得:
q(θs+1|θs)≥q(θs|θs)
再令:θs=θs+1;
q(θs|θs)為上一次迭代中求得的q函數(shù)值;q(θs+1|θs)為本次迭代中,所希望得到的q函數(shù)值;
步驟4)令s=s+1,返回到步驟2),不斷重復執(zhí)行e-step和m-step,直到最后待估參數(shù)收斂為止。收斂條件是:
其它步驟及參數(shù)與具體實施方式一至三之一相同。
具體實施方式五:本實施方式與具體實施方式一至四之一不同的是:所述步驟三中對步驟二建立的基于學生氏t-分布lpv時滯魯棒概率模型進行辨識,得到線性變參數(shù)時滯模型的參數(shù)θ*,δ*,
e-step:
(1)計算完整數(shù)據(jù)集c={cobs,cmis}的對數(shù)似然函數(shù)logp(cmis,cobs|θ),利用概率鏈式法則,對數(shù)似然函數(shù)寫為:
此時,為了推導得到q-函數(shù)(q(θ|θs)),將上述對數(shù)似然函數(shù)分別對離散的時間延遲d、隨機缺失的數(shù)據(jù)
其中τ為時間延遲,τ1表示時間延遲的下限值;τ2表示時間延遲的上限值;m1,m2,m3……mβ表示輸出數(shù)據(jù)隨機丟失的時刻;o1,o2,o3……oα表示輸出數(shù)據(jù)沒有丟失的時刻,輸出數(shù)據(jù)可用的時刻;n:表示系統(tǒng)的輸入輸出數(shù)據(jù)一共包含的采樣時刻數(shù);
(2)為了計算q-函數(shù),先計算d=τ的后驗概率和上述公式中的所有積分項;d=τ的后驗概率表示為:
其中δs為當前迭代中得到的尺度變量的值;
對于積分項,需要分情況討論:
當yk缺失時,λk的后驗分布表示為:
λk以及l(fā)ogλk的期望為:
<λk>m=∫p(λk|cobs,d=τ,θs)λkdλk=1
ψ(x)是gamma函數(shù)γ(x)的一階導數(shù);
q-函數(shù)中的雙重積分表示為:
在雙重積分中,gs(ωk,z-1)表示傳遞函數(shù)在第s次迭代中,用該次迭代中得到的估計參數(shù)θs代替參數(shù)θ所得;
當yk屬于觀測數(shù)據(jù)時,λk的后驗分布表示為:
其中:
此時,λk以及l(fā)ogλk的期望為:
<λk>o是分配給每個觀測數(shù)據(jù)對應模型預測偏差的平方的權重;
(3)q-函數(shù)中,第二個積分項
當yk屬于觀測數(shù)據(jù)集時,q-函數(shù)中第三個積分項
當yk缺失時,第三個積分項可以寫為:
則q-函數(shù)表示為:
q1(θ,δ)表示關于變量θ,δ的函數(shù),它是q(θ|θs)函數(shù)的一部分;
其中:
c1與任何變量都不相關,所以認為它是一個常量。
m-step:
步驟三一:為了計算尺度變量δ,將q1(θ,δ)對δ求導,并令導數(shù)等于零,得:
步驟三二:為了計算模型參數(shù)θ,將δs+1代入到函數(shù)q1(θ,δ)中,得到:
在準則函數(shù)q3(θ)中,<λk>o是分配給每個觀測數(shù)據(jù)對應模型預測偏差的平方的權重。如果yk是異常值時,<λk>o就非常趨近于零,因此可以很大程度上消除異常值對辨識算法帶來的負面影響。為了得到模型參數(shù)θ的估計表達式,利用阻尼牛頓方法優(yōu)化準則函數(shù)q3(θ),利用輔助模型準則構(gòu)造輔助模型,并利用輔助模型的輸出來替代向量
其中μ表示阻尼牛頓常數(shù),取值范圍在0到1之間;i為單位矩陣;
其中:
向量
基于當前的參數(shù)估計和輔助模型準則構(gòu)造輔助模型,通過對下式中的輔助模型進行仿真求得
步驟三三:為了估計自由度參數(shù)
解上述方程得參數(shù)
步驟三四:獲得時間延遲d=τ的估計值;假設τ均勻分布在整數(shù)區(qū)間[τ1,τ2]中,在每次迭代過程中,已經(jīng)計算得到時間延遲d的后驗概率函數(shù)pd,τ,則d的估計值通過下式更新得到:
步驟三五:在m-step中,通過循環(huán)迭代步驟三一至步驟三四估計得到系統(tǒng)的模型參數(shù),分別將最后的迭代結(jié)果記作:
其它步驟及參數(shù)與具體實施方式一至四之一相同。
采用以下實施例驗證本發(fā)明的有益效果:
實施例一:
本實施例一種量測數(shù)據(jù)隨機缺失的線性變參數(shù)時滯系統(tǒng)的魯棒辨識方法具體是按照以下步驟實施的:
算法的輸入為
步驟一、分別構(gòu)造觀測數(shù)據(jù)集:cobs和缺失數(shù)據(jù)集:cmis;
步驟二、初始化參數(shù)θ1,并且設置s=1;
步驟三、更新后驗概率分布以及期望:
利用e-step中給出的公式,在k=1,…,n時,計算各個時刻λk的后驗分布以及期望<λk>m,<logλk>m,<λk>o,and<logλk>o;
τ在整數(shù)區(qū)間[τ1,τ2]中,對于整數(shù)區(qū)間[τ1,τ2]中的每一個值,計算τ的后驗概率分布;
步驟四、更新模型參數(shù)估計:
更新無噪聲輸出估計
更新模型參數(shù)估計θ,尺度參數(shù)δ,自由度參數(shù)
步驟五、令s=s+1,直到估計參數(shù)收斂。
<1>考慮下面的lpv時滯模型:
yk=xk+εk
其中:
a(ωk,z-1)=1+a1(ωk)z-1+a2(ωk)z-2
b(ωk,z-1)=b1(ωk)z-1+b2(ωk)z-2
并且:
<2>設置仿真參數(shù):
系統(tǒng)的輸入選取為均勻分布的隨機噪聲:
圖1展示了在每次迭代過程中,q-函數(shù)(q(θs+1|θs))值的變化情況,不難看出,q-函數(shù)的值一直在不斷增加,且在第25次迭代時,q-函數(shù)收斂。
<3>仿真驗證:
為了方便描述,將本發(fā)明方法簡記為:lpvt-gem。作為對比,我們利用經(jīng)典方法lpv-riv(refinedinstrumentalvariable)對相同的仿真模型進行仿真,仿真結(jié)果的對比能夠很好的證明本發(fā)明方法的有效性。
lpv-riv方法是無法估計輸出時間延遲的,故而在lpv-riv方法的仿真中,我們假設τ=2是已知的。
為了較好的驗證本發(fā)明方法,針對lpvt-gem和lpv-riv方法,在輸出數(shù)據(jù)中不包含奇異值、信噪比分別為snr=20db、snr=10db、snr=5db的情況下,分別做了100次蒙特卡洛仿真,每組仿真將得到100個參數(shù)估計序列,求取每個參數(shù)的均值和標準差。具體的對比仿真結(jié)果見附圖2到附圖4。圖2為信噪比為snr=20db以及輸出異常值比例為0%的情況下,lpvt-gem與lpv-riv方法的系統(tǒng)參數(shù)估計均值與標準差對比圖,菱形表示lpvt-gem方法參數(shù)估計的均值,*表示lpvt-riv方法參數(shù)估計的均值,菱形上的棒條表示lpvt-gem方法參數(shù)估計的標準差,*上的棒條表示lpvt-riv方法參數(shù)估計的標準差,棒條的長度越短,標準差越小,參數(shù)估計效果越好;圖3為信噪比為snr=10db以及輸出異常值比例為0%的情況下,lpvt-gem與lpv-riv方法的系統(tǒng)參數(shù)估計均值與標準差對比圖,菱形表示lpvt-gem方法參數(shù)估計的均值,*表示lpvt-riv方法參數(shù)估計的均值,菱形上的棒條表示lpvt-gem方法參數(shù)估計的標準差,*上的棒條表示lpvt-riv方法參數(shù)估計的標準差,棒條的長度越短,標準差越小,參數(shù)估計效果越好;圖4為信噪比為snr=5db以及輸出異常值比例為0%的情況下,lpvt-gem與lpv-riv方法的系統(tǒng)參數(shù)估計均值與標準差對比圖,菱形表示lpvt-gem方法參數(shù)估計的均值,*表示lpvt-riv方法參數(shù)估計的均值,菱形上的棒條表示lpvt-gem方法參數(shù)估計的標準差,*上的棒條表示lpvt-riv方法參數(shù)估計的標準差,棒條的長度越短,標準差越小,參數(shù)估計效果越好。
當輸出數(shù)據(jù)中包含不同比例的奇異值,信噪比的情況下,參數(shù)估計結(jié)果如下表所示:
表1異常值比例為10%、信噪比為snr=5db時參數(shù)估計結(jié)果
仿真結(jié)果總結(jié):
當信噪比增加時,每個參數(shù)估計的標準差不斷減小,標準差越小,估計的效果越好;
在信噪比一致的條件下,本發(fā)明方法lpvt-gem的參數(shù)估計效果要明顯好于作為對比的lpv-riv方法;
根據(jù)表1的仿真結(jié)果,可以看出在lpv-riv方法中,部分參數(shù)估計的結(jié)果是錯誤的,說明本發(fā)明方法對存在系統(tǒng)時滯、異常值、缺失輸出數(shù)據(jù)情況下有很強的魯棒性。
本發(fā)明還可有其它多種實施例,在不背離本發(fā)明精神及其實質(zhì)的情況下,本領域技術人員當可根據(jù)本發(fā)明作出各種相應的改變和變形,但這些相應的改變和變形都應屬于本發(fā)明所附的權利要求的保護范圍。