本發(fā)明屬于電力傳動控制設(shè)備的技術(shù)領(lǐng)域,涉及五自由度無軸承永磁同步電機(jī)的控制器結(jié)構(gòu)及其構(gòu)造方法,適用于五自由度無軸承永磁同步電機(jī)的高性能控制。五自由度無軸承永磁同步電機(jī)在離心機(jī)、密封泵、航空航天、數(shù)控機(jī)床、飛輪儲能、生命科學(xué)等眾多高速、超高速特種電氣傳動領(lǐng)域應(yīng)用廣闊。
背景技術(shù):
五自由度無軸承永磁同步電機(jī)由一臺二自由度無軸承永磁同步電機(jī)和一個(gè)三自由度混合磁軸承構(gòu)成,是多變量、強(qiáng)耦合的非線性復(fù)雜系統(tǒng)。五自由度無軸承永磁同步電機(jī)具備運(yùn)行可靠、質(zhì)量輕、運(yùn)行損耗低、控制性能好等優(yōu)良特性。在五自由度無軸承永磁同步電機(jī)的控制系統(tǒng)里,控制器設(shè)計(jì)往往需要精確的電機(jī)參數(shù)值來輔助設(shè)計(jì),如無速度傳感器控制、矢量控制等。但是隨著溫度、負(fù)載和磁飽和程度的變化,永磁同步電機(jī)的定子電感、繞組電阻和轉(zhuǎn)子永磁磁鏈幅值等參數(shù)值大小都會隨之而變化,當(dāng)電機(jī)實(shí)際參數(shù)值相對于常溫下的設(shè)計(jì)參數(shù)值發(fā)生比較大變化時(shí),會對所設(shè)計(jì)的控制系統(tǒng)性能造成很大影響,甚至?xí)屍錈o法工作。同樣的,三自由度混合磁軸承由于鐵芯飽和以及溫度對永磁體影響等因素也導(dǎo)致類似問題。
自適應(yīng)控制器具有修正自己的特性以適應(yīng)對象擾動的能力。在系統(tǒng)運(yùn)行中,自適應(yīng)控制器依靠不斷采集控制過程信息,確定被控對象的當(dāng)前實(shí)際工作狀態(tài),以優(yōu)化性能為準(zhǔn)則,產(chǎn)生自適應(yīng)控制規(guī)律,從而實(shí)時(shí)地調(diào)整控制器結(jié)構(gòu)或參數(shù),使系統(tǒng)始終自動地工作在最優(yōu)或次最優(yōu)狀態(tài)下。然而要實(shí)施自適應(yīng)控制,通常需要準(zhǔn)確獲得被控對象的數(shù)學(xué)模型,而五自由度無軸承永磁同步電機(jī)系統(tǒng)是一個(gè)多變量、非線性、強(qiáng)耦合的復(fù)雜系統(tǒng),很難獲取其精確的數(shù)學(xué)模型。
中國專利公開號為CN1737708的文獻(xiàn)中公開的“基于神經(jīng)網(wǎng)絡(luò)逆五自由度無軸承永磁同步電機(jī)控制系統(tǒng)及控制方法”,對五自由度無軸承永磁同步電機(jī)系統(tǒng)設(shè)計(jì)了神經(jīng)網(wǎng)絡(luò)逆解耦控制器,該神經(jīng)網(wǎng)絡(luò)需要事先讀取訓(xùn)練數(shù)據(jù),進(jìn)行大量離線訓(xùn)練,權(quán)值一旦固定無法在線調(diào)節(jié),導(dǎo)致控制器無法克服五自由度無軸承永磁同步電機(jī)系統(tǒng)參數(shù)變化、負(fù)載突變、鐵芯飽和等不確定因素對系統(tǒng)的影響,魯棒性差。中國專利公開號為CN102790579A的文獻(xiàn)中公開的“一種五自由度無軸承永磁同步電機(jī)解耦控制器的構(gòu)造方法”,對五自由度無軸承永磁同步電機(jī)系統(tǒng)設(shè)計(jì)了基于支持向量機(jī)逆的解耦控制器,該支持向量機(jī)逆解耦控制器同樣存在學(xué)習(xí)之后不能在線調(diào)節(jié)參數(shù)的問題,導(dǎo)致控制器無法克服五自由度無軸承永磁同步電機(jī)系統(tǒng)參數(shù)變化、負(fù)載突變、鐵芯飽和等不確定因素對系統(tǒng)的影響。
執(zhí)行器–評價(jià)器算法(Actor-Critic,AC),也稱為自適應(yīng)啟發(fā)式評價(jià)算法,是一種重要的強(qiáng)化學(xué)習(xí)算法,具有無模型在線學(xué)習(xí)能力。它包含兩個(gè)部件:執(zhí)行器(Actor)和評價(jià)器(Critic)。執(zhí)行器即策略結(jié)構(gòu),用于選擇動作。評價(jià)器即值函數(shù),用于評估執(zhí)行器選擇的動作。執(zhí)行器–評價(jià)器算法中,動作的選擇與值函數(shù)的更新釆用了相同的策略。評價(jià)器必須了解和評價(jià)執(zhí)行器當(dāng)前采用的策略。評價(jià)采用瞬時(shí)差分誤差的方式。這個(gè)標(biāo)量信號是評價(jià)器的唯一輸出并推動了執(zhí)行器–評價(jià)器的所有學(xué)習(xí)。一般情況下,評價(jià)器是一個(gè)狀態(tài)值函數(shù),評價(jià)器的實(shí)現(xiàn)機(jī)制,即值函數(shù)的更新可以采用時(shí)間差分學(xué)習(xí)(Temporal-Difference learning,TD)。評價(jià)器的作用在于,在每個(gè)動作選擇之后,評價(jià)器評估新狀態(tài)來決定事情是否比期望的好或者更糟,這個(gè)評估就是瞬時(shí)差分誤差。如果瞬時(shí)差分誤差是正值,表明未來選擇當(dāng)前動作的傾向要被加強(qiáng),但是如果瞬時(shí)差分誤差是負(fù)值,表明傾向要被減弱。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是為解決現(xiàn)有五自由度無軸承永磁同步電機(jī)控制存在的自適應(yīng)控制需要精確數(shù)學(xué)模型的難題,解決現(xiàn)有單一神經(jīng)網(wǎng)絡(luò)控制器需要事先讀取訓(xùn)練數(shù)據(jù),進(jìn)行大量離線訓(xùn)練,權(quán)值一旦固定無法在線調(diào)節(jié)的問題,提出一種可使五自由度無軸承永磁同步電機(jī)具有優(yōu)良的動、靜態(tài)控制性能的自適應(yīng)強(qiáng)化學(xué)習(xí)控制器,同時(shí)提出該強(qiáng)化學(xué)習(xí)控制器的構(gòu)造方法。
本發(fā)明五自由度無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器采用的技術(shù)方案是:由一個(gè)電流控制模塊、六個(gè)微分器和三個(gè)執(zhí)行器-評價(jià)器模塊組成,三個(gè)執(zhí)行器-評價(jià)器模塊的輸出經(jīng)電流控制模塊連接無軸承永磁同步電機(jī)系統(tǒng),電流控制模塊的輸出是組成無軸承永磁同步電機(jī)中二自由度無軸承永磁同步電機(jī)的轉(zhuǎn)矩繞組電流iMa、iMb、iMc、懸浮繞組電流iBa、iBb、iBc、組成無軸承永磁同步電機(jī)中三自由度混合磁軸承徑向位移控制電流ia、ib、ic和軸向位移控制電流iz;無軸承永磁同步電機(jī)系統(tǒng)的輸出為二自由度無軸承永磁同步電機(jī)實(shí)時(shí)徑向位移值x、y與實(shí)際轉(zhuǎn)速ω以及所述磁軸承徑向位移xr、yr與軸向位移z;實(shí)時(shí)徑向位移值x、y、實(shí)際轉(zhuǎn)速ω以及磁軸承徑向位移xr、yr與軸向位移z分別與相應(yīng)的給定值x*、y*、xr*、yr*、z*、ω*一一對應(yīng)地比較得到實(shí)時(shí)徑向位移誤差ex、ey、實(shí)際轉(zhuǎn)速eω誤差以及磁軸承徑向位移誤差exr、eyr與軸向位移ez這6個(gè)誤差,每個(gè)誤差各輸入一個(gè)對應(yīng)的微分器得到誤差誤差ex、ey、是第一執(zhí)行器-評價(jià)器模塊的輸入,誤差eω、是第二執(zhí)行器-評價(jià)器模塊的輸入,誤差exr、eyr、ez、是第三執(zhí)行器-評價(jià)器模塊的輸入,第一執(zhí)行器-評價(jià)器模塊的輸出是二自由度無軸承永磁同步電機(jī)d-q坐標(biāo)系下的懸浮繞組給定電流iBd*、iBq*,第二執(zhí)行器-評價(jià)器模塊的輸出是d-q坐標(biāo)系下的轉(zhuǎn)矩繞組給定電流iMd*、iMq*,第三執(zhí)行器-評價(jià)器模塊的輸出是三自由度混合磁軸承控制電流ix*、iy*、iz*。
本發(fā)明五自由度無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器的構(gòu)造方法采用的技術(shù)方案是:其特別是包括以下步驟:
步驟1:構(gòu)造電流控制模塊和五自由度無軸承永磁同步電機(jī)系統(tǒng);
步驟2:采用三個(gè)執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)同時(shí)實(shí)現(xiàn)三個(gè)執(zhí)行器神經(jīng)網(wǎng)絡(luò)和評價(jià)器神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),每個(gè)執(zhí)行器與評價(jià)器共享執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)的輸入層和隱含層,構(gòu)造出三個(gè)執(zhí)行器神經(jīng)網(wǎng)絡(luò)與三個(gè)評價(jià)器神經(jīng)網(wǎng)絡(luò);
步驟3:構(gòu)造三個(gè)強(qiáng)化信號模塊,第一強(qiáng)化信號模塊輸出強(qiáng)化信號r1(t)=αxrx(t)+αyry(t),rx(t)、ry(t)分別為x、y軸向位移誤差強(qiáng)化信號,αx、αy分別為x、y軸向位移誤差強(qiáng)化信號系數(shù);第二強(qiáng)化信號模塊輸出強(qiáng)化信號r2(t)=βω1rω1(t)+βω2rω2(t),rω1(t)、rω2(t)分別為轉(zhuǎn)速當(dāng)前時(shí)刻誤差強(qiáng)化信號和轉(zhuǎn)速誤差變化強(qiáng)化信號,βω1和βω2分別為它們的權(quán)重;第三強(qiáng)化信號模塊輸出強(qiáng)化信號r3(t)=αxrrxr(t)+αyrryr(t)+αzrz(t),rxr(t)、ryr(t)和rz(t)分別為磁軸承x、y軸向位移誤差強(qiáng)化信號和z軸向位移強(qiáng)化信號,αxr、αyr和αz分別為x、y軸向位移誤差強(qiáng)化信號系數(shù)和z軸向位移強(qiáng)化信號系數(shù);
步驟4.構(gòu)造三個(gè)瞬時(shí)差分模塊,瞬時(shí)差分信號δa(t)=ra(t)+γaVa(t+1)-Va(t),γa折扣因子,0≤γa≤1,t為當(dāng)前時(shí)刻,Va(t+1)和Va(t)分別為更新前后的值函數(shù),a=1,2,3,分別代表第一、第二、第二執(zhí)行器-評價(jià)器模塊;
步驟5:由三個(gè)執(zhí)行器-評價(jià)器模塊與電流控制模塊共同組成五自由度無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器。
本發(fā)明的優(yōu)點(diǎn)在于:
1.本發(fā)明將人工智能領(lǐng)域強(qiáng)化學(xué)習(xí)中的執(zhí)行器-評價(jià)器(Actor-Critic,AC)與傳統(tǒng)矢量控制技術(shù)相結(jié)合,利用強(qiáng)化學(xué)習(xí)中的執(zhí)行器-評價(jià)器算法,也稱為自適應(yīng)啟發(fā)式評價(jià)算法,是一種重要的強(qiáng)化學(xué)習(xí)算法,由評價(jià)器評價(jià)五自由度無軸承永磁同步電機(jī)系統(tǒng)的轉(zhuǎn)速與位移反饋信息,并指導(dǎo)執(zhí)行器輸出五自由度無軸承永磁同步電機(jī)的各個(gè)電流,能夠在沒有電機(jī)精確模型的情況下在線更新控制器參數(shù),維持五自由度無軸承永磁同步電機(jī)的穩(wěn)定運(yùn)行,抗電機(jī)參數(shù)變化及抗負(fù)載擾動能力強(qiáng),同時(shí)克服了系統(tǒng)參數(shù)變化、負(fù)載突變等不確定因素對系統(tǒng)性能的影響,具有更好的魯棒性,能夠維持五自由度無軸承永磁同步電機(jī)的高性能穩(wěn)定運(yùn)行和跟蹤控制。
2.本發(fā)明采用了徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBF network)。RBF神經(jīng)網(wǎng)絡(luò)能夠逼近任意的非線性函數(shù),可以處理系統(tǒng)內(nèi)的難以解析的規(guī)律性,具有良好的泛化能力。同時(shí)RBF神經(jīng)網(wǎng)絡(luò)作為一種局部逼近網(wǎng)絡(luò)相比BP神經(jīng)網(wǎng)絡(luò)等全局逼近網(wǎng)絡(luò)具有更快的學(xué)習(xí)收斂速度。已成功應(yīng)用于非線性函數(shù)逼近、時(shí)間序列分析、數(shù)據(jù)分類、模式識別、信息處理、圖像處理、系統(tǒng)建模、控制和故障診斷等。
附圖說明
圖1是本發(fā)明五自由度無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器的結(jié)構(gòu)框圖;
圖2是圖1中電流控制模塊和五自由度無軸承永磁同步電機(jī)系統(tǒng)的放大的構(gòu)造框圖及等效圖;
圖3是圖1中第一執(zhí)行器-評價(jià)器模塊1的構(gòu)造框圖及等效圖;
圖4是圖1中第二執(zhí)行器-評價(jià)器模塊2的構(gòu)造框圖及等效圖;
圖5是圖1中第三執(zhí)行器-評價(jià)器模塊3的構(gòu)造框圖及等效圖;
圖6是圖3中復(fù)合RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖;
圖7是圖4中復(fù)合RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖;
圖8是圖5中復(fù)合RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖;
圖9是圖3中第一強(qiáng)化信號模塊13的構(gòu)造原理圖;
圖10是圖4中第二強(qiáng)化信號模塊23的構(gòu)造原理圖;
圖11是圖5中第三強(qiáng)化信號模塊23的構(gòu)造原理圖;
圖12是圖3中第一瞬時(shí)差分模塊14的構(gòu)造原理圖;
圖13是圖4中第二瞬時(shí)差分模塊24的構(gòu)造原理圖;
圖14是圖5中第三瞬時(shí)差分模塊34的構(gòu)造原理圖;
圖15是圖1中三個(gè)執(zhí)行器-評價(jià)器模塊的算法流程圖。
圖中:1.第一執(zhí)行器-評價(jià)器模塊;2.第二執(zhí)行器-評價(jià)器模塊;3.第三執(zhí)行器-評價(jià)器模塊;4.電流控制模塊;7.五自由度無軸承永磁同步電機(jī)系統(tǒng);8.五自由度無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器;9.復(fù)合被控對象;11.第一執(zhí)行器神經(jīng)網(wǎng)絡(luò);12.第一評價(jià)器神經(jīng)網(wǎng)絡(luò);13.第一強(qiáng)化信號模塊;14.第一瞬時(shí)差分模塊;
21.第二執(zhí)行器神經(jīng)網(wǎng)絡(luò);22.第二評價(jià)器神經(jīng)網(wǎng)絡(luò);23.第二強(qiáng)化信號模塊;24.第二瞬時(shí)差分模塊;
31.第三執(zhí)行器神經(jīng)網(wǎng)絡(luò);32.第三評價(jià)器神經(jīng)網(wǎng)絡(luò);33.第三強(qiáng)化信號模塊;34.第三瞬時(shí)差分模塊;
41.第一PI調(diào)節(jié)器;42.第二PI調(diào)節(jié)器;43.第一IPARK變換器;44.第一SVPWM;45.第一PARK變換器;46.第一CLARK變換器;47.第一電流傳感器;48.第一電壓源逆變器;49.第三PI調(diào)節(jié)器;
50.第四PI調(diào)節(jié)器;51.第二SVPWM;52.第二電壓源逆變器;53.第二CLARK變換器;54.第二電流傳感器;55.功率放大器;56.第五PI調(diào)節(jié)器;57.第六PI調(diào)節(jié)器;58.第二IPARK變換器;59.第三SVPWM;
60.第三電壓源逆變器;61.第三電流傳感器;62.第三CLARK變換器;63.第二PARK變換器;64.光電編碼器;65.位移傳感器;66.五自由度無軸承永磁同步電機(jī)。
具體實(shí)施方式
參見圖1,本發(fā)明五自由度無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器8由一個(gè)電流控制模塊4、六個(gè)微分器和三個(gè)執(zhí)行器-評價(jià)器模塊組成,三個(gè)執(zhí)行器-評價(jià)器模塊分別是第一執(zhí)行器-評價(jià)器模塊1、第二執(zhí)行器-評價(jià)器模塊2和第三執(zhí)行器-評價(jià)器模塊3。三個(gè)執(zhí)行器-評價(jià)器模塊的輸出端連接電流控制模塊4的輸入端,電流控制模塊4的輸出端連接五自由度無軸承永磁同步電機(jī)系統(tǒng)7。五自由度無軸承永磁同步電機(jī)系統(tǒng)7中的五自由度無軸承永磁同步電機(jī)由一臺二自由度無軸承永磁同步電機(jī)和一個(gè)三自由度混合磁軸承構(gòu)成。
由無軸承永磁同步電機(jī)系統(tǒng)7和電流控制模塊4組成復(fù)合被控對象9,復(fù)合被控對象9的輸出即無軸承永磁同步電機(jī)系統(tǒng)7的輸出,為二自由度無軸承永磁同步電機(jī)實(shí)時(shí)徑向位移值x、y與實(shí)際轉(zhuǎn)速ω以及三自由度混合磁軸承徑向位移xr、yr與軸向位移z。電流控制模塊4的輸出是二自由度無軸承永磁同步電機(jī)的轉(zhuǎn)矩繞組電流iMa、iMb、iMc、二自由度無軸承永磁同步電機(jī)的懸浮繞組電流iBa、iBb、iBc、三自由度混合磁軸承徑向位移控制電流ia、ib、ic和軸向位移控制電流iz。
將電機(jī)實(shí)時(shí)徑向位移值x、y、實(shí)際轉(zhuǎn)速ω以及磁軸承徑向位移xr、yr與軸向位移z作為反饋值,分別與相應(yīng)的給定值x*、y*、xr*、yr*、z*、ω*一一對應(yīng)地進(jìn)行比較,得到電機(jī)實(shí)時(shí)徑向位移誤差ex、ey、實(shí)際轉(zhuǎn)速eω誤差以及磁軸承徑向位移誤差exr、eyr與軸向位移ez這6個(gè)誤差,將每個(gè)誤差各輸入一個(gè)對應(yīng)的微分器d/dt,通過6個(gè)微分器分別對時(shí)間求導(dǎo),得到誤差將其中的誤差ex、ey、作為第一執(zhí)行器-評價(jià)器模塊1的輸入,誤差eω、作為第二執(zhí)行器-評價(jià)器模塊2的輸入,誤差exr、eyr、ez、作為第三執(zhí)行器-評價(jià)器模塊3的輸入。第一執(zhí)行器-評價(jià)器模塊1的輸出是二自由度無軸承永磁同步電機(jī)d-q坐標(biāo)系下的懸浮繞組給定電流iBd*、iBq*,第二執(zhí)行器-評價(jià)器模塊2的輸出是d-q坐標(biāo)系下的轉(zhuǎn)矩繞組給定電流iMd*、iMq*,第三執(zhí)行器-評價(jià)器模塊3的輸出是三自由度混合磁軸承控制電流ix*、iy*、iz*。復(fù)合被控對象9的輸入即電流控制模塊4的輸入,為三個(gè)執(zhí)行器-評價(jià)器模塊的輸入。
如圖2所示,電流控制模塊4由6個(gè)PI調(diào)節(jié)器、2個(gè)PARK變換器與2個(gè)IPARK變換器、3個(gè)CLARK變換器、3個(gè)SVPWM、3個(gè)電流傳感器與3個(gè)電壓源逆變器以及1個(gè)功率放大器55組成。五自由度無軸承永磁同步電機(jī)系統(tǒng)7由位移傳感器65、光電編碼器64和五自由度無軸承永磁同步電機(jī)66組成。其中,6個(gè)PI調(diào)節(jié)器分別是第一PI調(diào)節(jié)器41、第二PI調(diào)節(jié)器42、第三PI調(diào)節(jié)器49、第四PI調(diào)節(jié)器50、第五PI調(diào)節(jié)器56和第六PI調(diào)節(jié)器57;2個(gè)PARK變換器分別是第一PARK變換器45和第二PARK變換器63;2個(gè)IPARK變換器分別是第一IPARK變換器43和第二IPARK變換器58;3個(gè)CLARK變換器分別是第一CLARK變換器46、第二CLARK變換器53和第三CLARK變換器62;3個(gè)SVPWM分別是第一SVPWM44、第二SVPWM51和第三SVPWM59;3個(gè)電流傳感器分別是第一電流傳感器47、第二電流傳感器54和第三電流傳感器61;3個(gè)電壓源逆變器分別是第一電壓源逆變器48、第二電壓源逆變器52和第三電壓源逆變器60。
位移傳感器65采用五個(gè)電渦流位移傳感器分別檢測二自由度無軸承永磁同步電機(jī)轉(zhuǎn)子的x軸與y軸的實(shí)時(shí)徑向位移值x、y以及三自由度混合磁軸承的徑向位移xr、yr和軸向位移z,采用光電編碼器64檢測二自由度無軸承永磁同步電機(jī)轉(zhuǎn)子的轉(zhuǎn)速ω。
第三電流傳感器61檢測二自由度無軸承永磁同步電機(jī)的懸浮繞組電流iBa、iBb、iBc,第三電流傳感器61的輸出端依序連接第三CLARK變換器62和第二PARK變換器63,懸浮繞組電流iBa、iBb、iBc經(jīng)第三CLARK變換器62處理后生成α-β坐標(biāo)系下的懸浮繞組電流iBα、iBβ。第二PARK變換器63處理α-β坐標(biāo)系下的懸浮繞組電流iBα、iBβ生成d-q坐標(biāo)系下的懸浮繞組電流iBd、iBq。將該懸浮繞組電流iBd、iBq作為反饋電流,與d-q坐標(biāo)系下的懸浮繞組給定電流iBd*、iBq*比較,比較得到的誤差分別一一對應(yīng)地輸出到第五PI調(diào)節(jié)器56和第六PI調(diào)節(jié)器57,第五PI調(diào)節(jié)器56和第六PI調(diào)節(jié)器57的輸出端依序連接第二IPARK變換器58、第三SVPWM59和第三電壓源逆變器60,比較得到的誤差經(jīng)第五PI調(diào)節(jié)器56和第六PI調(diào)節(jié)器57處理后分別生成d-q坐標(biāo)系下的懸浮繞組電壓VBd*和VBq*,懸浮繞組電壓VBd*和VBq*經(jīng)第二IPARK變換器58處理后生成α-β坐標(biāo)系下的懸浮繞組電壓VBα*和VBβ*。α-β坐標(biāo)系下的懸浮繞組電壓VBα*和VBβ*經(jīng)第三SVPWM59處理后生成第三電壓源逆變器60的開關(guān)信號SB(B=1,2,3,4,5,6)。第三電壓源逆變器60根據(jù)開關(guān)信號SB控制二自由度無軸承永磁同步電機(jī)的懸浮繞組電流。
第一電流傳感器47檢測二自由度無軸承永磁同步電機(jī)的轉(zhuǎn)矩繞組電流iMa、iMb、iMc,第一電流傳感器47的輸出端依序連接第一CLARK變換器46和第一PARK變換器45,轉(zhuǎn)矩繞組電流iMa、iMb、iMc經(jīng)第一CLARK變換器46處理后生成α-β坐標(biāo)系下的轉(zhuǎn)矩繞組電流iMα、iMβ,第一PARK變換器45處理α-β坐標(biāo)系下的轉(zhuǎn)矩繞組電流iMα、iMβ生成d-q坐標(biāo)系下的轉(zhuǎn)矩繞組電流iMd、iMq,將轉(zhuǎn)矩繞組電流iMd、iMq作為反饋電流,與d-q坐標(biāo)系下的轉(zhuǎn)矩繞組給定電流iMd*、iMq*比較,比較得到誤差分別一一對應(yīng)地輸出到第一PI調(diào)節(jié)器41和第二PI調(diào)節(jié)器42,比較得到的誤差經(jīng)第一PI調(diào)節(jié)器41和第二PI調(diào)節(jié)器42處理后分別生成d-q坐標(biāo)系下的轉(zhuǎn)矩繞組電壓VMd*和VMq*,第一PI調(diào)節(jié)器41和第二PI調(diào)節(jié)器42的輸出端依次串接第一IPARK變換器43、第一SVPWM44和第一電壓源逆變器48,第一IPARK變換器43處理d-q坐標(biāo)系下的轉(zhuǎn)矩繞組電壓VMd*和VMq*,生成α-β坐標(biāo)系下的轉(zhuǎn)矩繞組電壓VMα*和VMβ*,α-β坐標(biāo)系下的轉(zhuǎn)矩繞組電壓VMα*和VMβ*經(jīng)第一SVPWM44處理后生成第一電壓源逆變器48的開關(guān)信號SM(M=1,2,3,4,5,6)。第一電壓源逆變器48根據(jù)開關(guān)信號SM控制二自由度無軸承永磁同步電機(jī)的轉(zhuǎn)矩繞組電流。
第二電流傳感器54檢測三自由度混合磁軸承徑向位移控制電流ia、ib、ic,徑向位移控制電流ia、ib、ic經(jīng)第二CLARK變換器53處理后生成α-β坐標(biāo)系下的徑向位移控制電流ix、iy,將α-β坐標(biāo)系下的徑向位移控制電流ix、iy作為反饋電流,與給定徑向位移控制電流ix*、iy*比較,比較得到的誤差分別一一對應(yīng)地輸出到第三PI調(diào)節(jié)器49和第四PI調(diào)節(jié)器50,比較誤差經(jīng)第三PI調(diào)節(jié)器49和第四PI調(diào)節(jié)器50處理后生成α-β坐標(biāo)系下的徑向位移控制電壓Vx*和Vy*。第三PI調(diào)節(jié)器49和第四PI調(diào)節(jié)器50的輸出端依次串接第二SVPWM51和第二電壓源逆變器52,α-β坐標(biāo)系下的徑向位移控制電壓Vx*和Vy*經(jīng)第二SVPWM51處理后生成第二電壓源逆變器52的開關(guān)信號ST(T=1,2,3,4,5,6),第二電壓源逆變器52根據(jù)開關(guān)信號ST控制三自由度混合磁軸承徑向位移控制電流。
三自由度磁軸承軸向位移控制電流iz直接經(jīng)由軸向位移給定電流iz*經(jīng)過功率放大器55得到。
如圖3所示,第一執(zhí)行器-評價(jià)器模塊1由第一執(zhí)行器神經(jīng)網(wǎng)絡(luò)11、第一評價(jià)器神經(jīng)網(wǎng)絡(luò)12、第一強(qiáng)化信號模塊13和第一瞬時(shí)差分模塊14組成。誤差ex、ey、為第一執(zhí)行器神經(jīng)網(wǎng)絡(luò)11和第一評價(jià)器神經(jīng)網(wǎng)絡(luò)12的共同輸入,第一評價(jià)器神經(jīng)網(wǎng)絡(luò)12的輸出端經(jīng)第一瞬時(shí)差分模塊14連接第一執(zhí)行器神經(jīng)網(wǎng)絡(luò)11,第一瞬時(shí)差分模塊14的輸出端還連接第一評價(jià)器神經(jīng)網(wǎng)絡(luò)12的輸入端。誤差ex、ey作為第一強(qiáng)化信號模塊13的輸入,第一強(qiáng)化信號模塊13的輸出端連接第一瞬時(shí)差分模塊14,第一強(qiáng)化信號模塊13輸出強(qiáng)化信號r1(t)。第一評價(jià)器神經(jīng)網(wǎng)絡(luò)12生成并輸出值函數(shù)V1(t),第一執(zhí)行器神經(jīng)網(wǎng)絡(luò)11輸出d-q坐標(biāo)系下的懸浮繞組給定電流iBd*、iBq*,第一瞬時(shí)差分模塊14根據(jù)強(qiáng)化信號r1(t)和值函數(shù)V1(t)生成瞬時(shí)差分信號δ1(t)。第一執(zhí)行器神經(jīng)網(wǎng)絡(luò)11和第一評價(jià)器神經(jīng)網(wǎng)絡(luò)12根據(jù)瞬時(shí)差分信號δ1(t)調(diào)整權(quán)值。
如圖4所示,第二執(zhí)行器-評價(jià)器模塊2由第二執(zhí)行器神經(jīng)網(wǎng)絡(luò)21、第二評價(jià)器神經(jīng)網(wǎng)絡(luò)22、第二強(qiáng)化信號模塊23和第二瞬時(shí)差分模塊24組成。將誤差eω、作為第二執(zhí)行器神經(jīng)網(wǎng)絡(luò)21和第二評價(jià)器神經(jīng)網(wǎng)絡(luò)22的共同輸入,第二評價(jià)器神經(jīng)網(wǎng)絡(luò)22的輸出端經(jīng)第二瞬時(shí)差分模塊24連接第二執(zhí)行器神經(jīng)網(wǎng)絡(luò)21,第二瞬時(shí)差分模塊24的輸出端還連接第二評價(jià)器神經(jīng)網(wǎng)絡(luò)22的輸入端。第二強(qiáng)化信號模塊23以eω作為的輸入,第二強(qiáng)化信號模塊23的輸出端連接第二瞬時(shí)差分模塊24,輸出強(qiáng)化信號r2(t)。第二評價(jià)器神經(jīng)網(wǎng)絡(luò)22生成輸出值函數(shù)V2(t),第二執(zhí)行器神經(jīng)網(wǎng)絡(luò)21輸出d-q坐標(biāo)系下的轉(zhuǎn)矩繞組給定電流iMd*、iMq*。第二瞬時(shí)差分模塊24根據(jù)強(qiáng)化信號r2(t)和值函數(shù)V2(t)生成瞬時(shí)差分信號δ2(t)。第二執(zhí)行器神經(jīng)網(wǎng)絡(luò)21和第二評價(jià)器神經(jīng)網(wǎng)絡(luò)22根據(jù)瞬時(shí)差分信號δ2(t)調(diào)整權(quán)值。
如圖5所示,第三執(zhí)行器-評價(jià)器模塊3由第三執(zhí)行器神經(jīng)網(wǎng)絡(luò)31、第三評價(jià)器神經(jīng)網(wǎng)絡(luò)32、第三強(qiáng)化信號模塊33和第三瞬時(shí)差分模塊34組成。將誤差exr、eyr、ez、作為第三執(zhí)行器神經(jīng)網(wǎng)絡(luò)31和第三評價(jià)器神經(jīng)網(wǎng)絡(luò)32的共同輸入,第三評價(jià)器神經(jīng)網(wǎng)絡(luò)32的輸出端經(jīng)第三瞬時(shí)差分模塊34連接第三執(zhí)行器神經(jīng)網(wǎng)絡(luò)31,第三瞬時(shí)差分模塊34的輸出端還連接第三評價(jià)器神經(jīng)網(wǎng)絡(luò)32的輸入端。第三強(qiáng)化信號模塊33以exr、eyr、ez作為的輸入,第三強(qiáng)化信號模塊33的輸出端連接第三瞬時(shí)差分模塊34,輸出強(qiáng)化信號r3(t)。第三評價(jià)器神經(jīng)網(wǎng)絡(luò)32生成輸出值函數(shù)V3(t),第三執(zhí)行器神經(jīng)網(wǎng)絡(luò)31輸出三自由度混合磁軸承控制電流ix*、iy*、iz*,第三瞬時(shí)差分模塊34根據(jù)強(qiáng)化信號r3(t)和值函數(shù)V3(t)生成瞬時(shí)差分信號δ3(t),第三執(zhí)行器神經(jīng)網(wǎng)絡(luò)31和第三評價(jià)器神經(jīng)網(wǎng)絡(luò)32根據(jù)瞬時(shí)差分信號δ3(t)調(diào)整權(quán)值。
五自由度無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器8的具體構(gòu)造方法分以下6步:
1.構(gòu)造電流控制模塊4和五自由度無軸承永磁同步電機(jī)系統(tǒng)7
如圖2所示,由6個(gè)PI調(diào)節(jié)器、2個(gè)PARK變換器與2個(gè)IPARK變換器、3個(gè)CLARK變換器、3個(gè)SVPWM、3個(gè)電流傳感器與3個(gè)電壓源逆變器以及1個(gè)功率放大器55構(gòu)成電流控制模塊4。由位移傳感器65、光電編碼器64和五自由度無軸承永磁同步電機(jī)66構(gòu)成五自由度無軸承永磁同步電機(jī)系統(tǒng)7。
第三電流傳感器61檢測二自由度無軸承永磁同步電機(jī)的懸浮繞組電流iBa、iBb、iBc,懸浮繞組電流iBa、iBb、iBc經(jīng)第三CLARK變換器62處理后生成α-β坐標(biāo)系下的懸浮繞組電流iBα、iBβ。第二PARK變換器63處理α-β坐標(biāo)系下的懸浮繞組電流iBα、iBβ生成d-q坐標(biāo)系下的懸浮繞組電流iBd、iBq。懸浮繞組電流iBd、iBq作為反饋電流與d-q坐標(biāo)系下的懸浮繞組給定電流iBd*、iBq*比較,比較誤差分別輸出到第五PI調(diào)節(jié)器56和第六PI調(diào)節(jié)器57,比較誤差經(jīng)第五PI調(diào)節(jié)器56和第六PI調(diào)節(jié)器57處理后生成d-q坐標(biāo)系下的懸浮繞組電壓VBd*和VBq*。第二IPARK變換器58處理d-q坐標(biāo)系下的懸浮繞組電壓VBd*和VBq*生成α-β坐標(biāo)系下的懸浮繞組電壓VBα*和VBβ*。α-β坐標(biāo)系下的懸浮繞組電壓VBα*和VBβ*經(jīng)第三SVPWM59處理后生成第三電壓源逆變器60的開關(guān)信號SB(B=1,2,3,4,5,6)。第三電壓源逆變器60根據(jù)開關(guān)信號控制二自由度無軸承永磁同步電機(jī)的懸浮繞組電流。第一電流傳感器47檢測二自由度無軸承永磁同步電機(jī)的轉(zhuǎn)矩繞組電流iMa、iMb、iMc,轉(zhuǎn)矩繞組電流iMa、iMb、iMc經(jīng)第一CLARK變換器46處理后生成α-β坐標(biāo)系下的轉(zhuǎn)矩繞組電流iMα、iMβ。第一PARK變換器45處理α-β坐標(biāo)系下的轉(zhuǎn)矩繞組電流iMα、iMβ生成d-q坐標(biāo)系下的轉(zhuǎn)矩繞組電流iMd、iMq。轉(zhuǎn)矩繞組電流iMd、iMq作為反饋電流與d-q坐標(biāo)系下的轉(zhuǎn)矩繞組給定電流iMd*、iMq*比較,比較誤差分別輸出到第一PI調(diào)節(jié)器41和第二PI調(diào)節(jié)器42,比較誤差經(jīng)第一PI調(diào)節(jié)器41和第二PI調(diào)節(jié)器42處理后生成d-q坐標(biāo)系下的轉(zhuǎn)矩繞組電壓VMd*和VMq*。第一IPARK變換器43處理d-q坐標(biāo)系下的轉(zhuǎn)矩繞組電壓VMd*和VMq*生成α-β坐標(biāo)系下的轉(zhuǎn)矩繞組電壓VMα*和VMβ*。α-β坐標(biāo)系下的轉(zhuǎn)矩繞組電壓VMα*和VMβ*經(jīng)第一SVPWM44處理后生成第一電壓源逆變器48的開關(guān)信號SM(M=1,2,3,4,5,6)。第一電壓源逆變器48根據(jù)開關(guān)信號控制二自由度無軸承永磁同步電機(jī)的轉(zhuǎn)矩繞組電流。第二電流傳感器54檢測三自由度混合磁軸承徑向位移控制電流ia、ib、ic,徑向位移控制電流ia、ib、ic經(jīng)第二CLARK變換器53處理后生成α-β坐標(biāo)系下的徑向位移控制電流ix、iy。α-β坐標(biāo)系下的徑向位移控制電流ix、iy作為反饋電流與g給定徑向位移控制電流ix*、iy*比較,比較誤差分別輸出到第三PI調(diào)節(jié)器49和第四PI調(diào)節(jié)器50,比較誤差經(jīng)第三PI調(diào)節(jié)器49和第四PI調(diào)節(jié)器50處理后生成α-β坐標(biāo)系下的徑向位移控制電壓Vx*和Vy*。α-β坐標(biāo)系下的徑向位移控制電壓Vx*和Vy*經(jīng)第二SVPWM51處理后生成第二電壓源逆變器的開關(guān)信號ST(T=1,2,3,4,5,6)。第二電壓源逆變器52根據(jù)開關(guān)信號控制三自由度混合磁軸承徑向位移控制電流。三自由度磁軸承軸向位移控制電流iz直接由iz*經(jīng)過功率放大器55得到。
2.構(gòu)造第一執(zhí)行器神經(jīng)網(wǎng)絡(luò)11、第二執(zhí)行器神經(jīng)網(wǎng)絡(luò)21、第三執(zhí)行器神經(jīng)網(wǎng)絡(luò)31與第一評價(jià)器神經(jīng)網(wǎng)絡(luò)12、第二評價(jià)器神經(jīng)網(wǎng)絡(luò)22、第三評價(jià)器神經(jīng)網(wǎng)絡(luò)32。
如圖6、7、8所示,本發(fā)明采用三個(gè)執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)同時(shí)實(shí)現(xiàn)三個(gè)執(zhí)行器神經(jīng)網(wǎng)絡(luò)和評價(jià)器神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),每個(gè)執(zhí)行器與評價(jià)器共享執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)的輸入層和隱含層資源。如圖6所示,第一執(zhí)行器-評價(jià)器模塊1的復(fù)合RBF神經(jīng)網(wǎng)絡(luò)共有三層,第一層為輸入層節(jié)點(diǎn)數(shù)為4個(gè),第二層為隱含層節(jié)點(diǎn)數(shù)為8個(gè),第三層為輸出層節(jié)點(diǎn)數(shù)為3個(gè)。如圖7所示,第二執(zhí)行器-評價(jià)器模塊2的復(fù)合RBF神經(jīng)網(wǎng)絡(luò)共有三層,第一層為輸入層節(jié)點(diǎn)數(shù)為2個(gè),第二層為隱含層節(jié)點(diǎn)數(shù)為6個(gè),第三層為輸出層節(jié)點(diǎn)數(shù)為3個(gè)。如圖8所示,第三執(zhí)行器-評價(jià)器模塊3的復(fù)合RBF神經(jīng)網(wǎng)絡(luò)共有三層,第一層為輸入層節(jié)點(diǎn)數(shù)為6個(gè),第二層為隱含層節(jié)點(diǎn)數(shù)為12個(gè),第三層為輸出層節(jié)點(diǎn)數(shù)為4個(gè)。
如圖6,第一執(zhí)行器-評價(jià)器模塊1的復(fù)合RBF神經(jīng)網(wǎng)絡(luò)的第一層為輸入層,每個(gè)輸入節(jié)點(diǎn)代表狀態(tài)向量的一個(gè)分量,其中t代表當(dāng)前時(shí)刻,上標(biāo)T表示矩陣的轉(zhuǎn)置。第二層為隱含層,隱含層的節(jié)點(diǎn)基函數(shù)采用高斯核函數(shù)。第j個(gè)隱含層節(jié)點(diǎn)的輸出為:
其中:
μ(1)j=[μ(1)1jμ(1)2jμ(1)3jμ(1)4j]T
為第一個(gè)神經(jīng)網(wǎng)絡(luò)的第j個(gè)節(jié)點(diǎn)的基函數(shù)中心向量,μ(1)1j,μ(1)2j,μ(1)3j,μ(1)4j分別對應(yīng)狀態(tài)變量ex(t)、ey(t)、的基函數(shù)中心向量,t為當(dāng)前時(shí)刻,上標(biāo)T表示矩陣的轉(zhuǎn)置。σ(1)j為第一個(gè)神經(jīng)網(wǎng)絡(luò)的第j個(gè)節(jié)點(diǎn)的方差。下標(biāo)(1)代表執(zhí)行器-評價(jià)器模塊1。第三層為輸出層,由執(zhí)行器輸出和評價(jià)器輸出兩個(gè)部分組成。執(zhí)行器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)I1m(t)和評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)V1(t)由下面式子計(jì)算:
其中w(1)jk(t)為第一個(gè)神經(jīng)網(wǎng)絡(luò)的第j個(gè)隱含層節(jié)點(diǎn)到執(zhí)行器的第k個(gè)輸出節(jié)點(diǎn)的權(quán)值。I(1)1(t)、I(1)2(t)分別對應(yīng)iBd*、iBq*。
其中v(1)j(t)為第j個(gè)隱含層節(jié)點(diǎn)到評價(jià)器輸出節(jié)點(diǎn)的權(quán)值。
如圖7,第二執(zhí)行器-評價(jià)器模塊2的復(fù)合RBF神經(jīng)網(wǎng)絡(luò)的第一層為輸入層,每個(gè)輸入節(jié)點(diǎn)代表狀態(tài)向量的一個(gè)分量,其中t代表當(dāng)前時(shí)刻。第二層為隱含層,隱含層的節(jié)點(diǎn)基函數(shù)采用高斯核函數(shù)。第j個(gè)隱含層節(jié)點(diǎn)的輸出為:
其中:
μ(2)j=[μ(2)1jμ(2)2j]T
為第二個(gè)神經(jīng)網(wǎng)絡(luò)的第j個(gè)節(jié)點(diǎn)的基函數(shù)中心向量,μ(2)1j、μ(2)2j分別對應(yīng)狀態(tài)變量eω(t)、的基函數(shù)中心向量。σ(2)j為第二個(gè)神經(jīng)網(wǎng)絡(luò)的第j個(gè)節(jié)點(diǎn)的方差。下標(biāo)(2)代表第二執(zhí)行器-評價(jià)器模塊2。第三層為輸出層由執(zhí)行器輸出和評價(jià)器輸出兩個(gè)部分組成。執(zhí)行器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)I2m(t)和評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)V2(t)由下面式子計(jì)算:
其中w(2)jk(t)為第二個(gè)神經(jīng)網(wǎng)絡(luò)的第j個(gè)隱含層節(jié)點(diǎn)到執(zhí)行器的第k個(gè)輸出節(jié)點(diǎn)的權(quán)值。I(2)1(t)、I(2)2(t)分別對應(yīng)iMd*、iMq*。
其中v(2)j(t)為第二個(gè)神經(jīng)網(wǎng)絡(luò)第j個(gè)隱含層節(jié)點(diǎn)到評價(jià)器輸出節(jié)點(diǎn)的權(quán)值。
如圖8,第三執(zhí)行器-評價(jià)器模塊3的復(fù)合RBF神經(jīng)網(wǎng)絡(luò)的第一層為輸入層,每個(gè)輸入節(jié)點(diǎn)代表狀態(tài)向量的一個(gè)分量,其中t代表當(dāng)前時(shí)刻。第二層為隱含層,隱含層的節(jié)點(diǎn)基函數(shù)采用高斯核函數(shù)。第j個(gè)隱含層節(jié)點(diǎn)的輸出為:
其中:
μ(3)j=[μ1jμ2jμ3jμ4jμ5jμ6j]T
為第三個(gè)神經(jīng)網(wǎng)絡(luò)的第j個(gè)節(jié)點(diǎn)的基函數(shù)中心向量,μ1j、μ2j、μ3j、μ4j、μ5j、μ6j分別對應(yīng)狀態(tài)變量exr(t)、eyr(t)、ez(t)、的基函數(shù)中心向量,上標(biāo)T表示矩陣的轉(zhuǎn)置。σ(3)j為第三個(gè)神經(jīng)網(wǎng)絡(luò)的第j個(gè)節(jié)點(diǎn)的方差。下標(biāo)(3)代表第三執(zhí)行器-評價(jià)器模塊3。第三層為輸出層由執(zhí)行器輸出和評價(jià)器輸出兩個(gè)部分組成。執(zhí)行器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)I3m(t)和評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)V3(t)由下面式子計(jì)算:
其中w(3)jk(t)為第三個(gè)神經(jīng)網(wǎng)絡(luò)的第j個(gè)隱含層節(jié)點(diǎn)到執(zhí)行器的第k個(gè)輸出節(jié)點(diǎn)的權(quán)值。I(3)1(t)、I(3)2(t)、I(3)3(t)分別對應(yīng)ix*、iy*、iz*。
其中v(3)j(t)為第三個(gè)神經(jīng)網(wǎng)絡(luò)第j個(gè)隱含層節(jié)點(diǎn)到評價(jià)器輸出節(jié)點(diǎn)的權(quán)值。
3.構(gòu)造第一強(qiáng)化信號模塊13、第二強(qiáng)化信號模塊23、第三強(qiáng)化信號模塊33。
如圖3和圖9所示,第一強(qiáng)化信號模塊13有兩個(gè)輸入端,一個(gè)輸出端。輸入為二自由度無軸承永磁同步電機(jī)位移誤差信號ex、ey,輸出為強(qiáng)化信號r1(t)。強(qiáng)化信號的計(jì)算由以下公式得到:
r1(t)=αxrx(t)+αyry(t),
其中rx(t)、ry(t)分別為x軸向位移誤差強(qiáng)化信號,y軸向位移誤差強(qiáng)化信號。αx、αy分別為x軸向位移誤差強(qiáng)化信號系數(shù),y軸向位移誤差強(qiáng)化信號系數(shù)。這里兩個(gè)系數(shù)值都取0.5。
x軸向位移誤差強(qiáng)化信號rx(t),y軸向位移誤差強(qiáng)化信號ry(t)的計(jì)算由以下公式得到:
rx(t)=βx1rx1(t)+βx2rx2(t)
ry(t)=βy1ry1(t)+βy2ry2(t)
其中rx1(t),rx2(t)分別為x軸向位移當(dāng)前時(shí)刻誤差強(qiáng)化信號和x軸向位移誤差變化強(qiáng)化信號,系數(shù)βx1和βx2分別為他們的權(quán)重,這里均取0.5。其中ry1(t),ry2(t)分別為y軸向位移當(dāng)前時(shí)刻誤差強(qiáng)化信號和誤差變化強(qiáng)化信號系數(shù)βy1和βy2分別為他們的權(quán)重,均取0.5。ex(t)為x軸向位移當(dāng)前時(shí)刻誤差,ey(t)為y軸向位移當(dāng)前時(shí)刻誤差,ex(t-1)為x軸向位移上一時(shí)刻誤差,ey(t-1)為y軸向位移上一時(shí)刻誤差,εx和εy分別為x軸向位移誤差信號的容許誤差帶,y軸向位移誤差信號的容許誤差帶,統(tǒng)一設(shè)為反饋量大小的1%。
如圖4和圖10所示,第二強(qiáng)化信號模塊23有一個(gè)輸入端,一個(gè)輸出端。輸入為轉(zhuǎn)速誤差信號eω,輸出為強(qiáng)化信號r2(t)。強(qiáng)化信號的計(jì)算由以下公式得到:
r2(t)=βω1rω1(t)+βω2rω2(t)
其中rω1(t)、rω2(t)分別為轉(zhuǎn)速當(dāng)前時(shí)刻誤差強(qiáng)化信號和轉(zhuǎn)速誤差變化強(qiáng)化信號。系數(shù)βω1和βω2分別為它們的權(quán)重,這里均取0.5。轉(zhuǎn)速當(dāng)前時(shí)刻誤差強(qiáng)化信號rω1(t)和轉(zhuǎn)速誤差變化強(qiáng)化信號rω2(t)的計(jì)算由以下公式得到:
其中eω(t)為轉(zhuǎn)速當(dāng)前時(shí)刻誤差,eω(t-1)為轉(zhuǎn)速上一時(shí)刻誤差,εω轉(zhuǎn)速誤差信號的容許誤差帶,設(shè)為反饋量大小的1%。
如圖5和圖11所示,第三強(qiáng)化信號模塊33有三個(gè)輸入端,一個(gè)輸出端。輸入為三自由度混合磁軸承徑向與軸向位移誤差信號exr、eyr和ez,輸出為強(qiáng)化信號r3(t)。強(qiáng)化信號的計(jì)算由以下公式得到:
r3(t)=αxrrxr(t)+αyrryr(t)+αzrz(t)
其中rxr(t)、ryr(t)和rz(t)分別為三自由度混合磁軸承x軸向位移誤差強(qiáng)化信號,y軸向位移誤差強(qiáng)化信號和z軸向位移強(qiáng)化信號。αxr、αyr和αz分別為x軸向位移誤差強(qiáng)化信號系數(shù),y軸向位移誤差強(qiáng)化信號系數(shù)和z軸向位移強(qiáng)化信號系數(shù)。這里三個(gè)系數(shù)值都取0.3。
三自由度混合磁軸承的x軸向位移誤差強(qiáng)化信號rxr(t)、y軸向位移誤差強(qiáng)化信號ryr(t)和x軸向位移誤差強(qiáng)化信號rz(t)的計(jì)算由以下公式得到:
rxr(t)=βxr1rxr1(t)+βxr2rxr2(t)
ryr(t)=βyr1ryr1(t)+βyr2ryr2(t)
rz(t)=βz1rz1(t)+βz2rz2(t)
其中rxr1(t),rxr2(t)分別為三自由度混合磁軸承x軸向位移當(dāng)前時(shí)刻誤差強(qiáng)化信號和x軸向位移誤差變化強(qiáng)化信號,系數(shù)βxr1和βxr2分別為它們的權(quán)重,這里均取0.5。ryr1(t),ryr2(t)分別為三自由度混合磁軸承y軸向位移當(dāng)前時(shí)刻誤差強(qiáng)化信號和誤差變化強(qiáng)化信號系數(shù)βyr1和βyr2分別為他們的權(quán)重,均取0.5。rz1(t),rz2(t)分別為三自由度混合磁軸承z軸向位移當(dāng)前時(shí)刻誤差強(qiáng)化信號和誤差變化強(qiáng)化信號系數(shù)βz1和βz2分別為他們的權(quán)重,均取0.5。exr(t)為x軸向位移當(dāng)前時(shí)刻誤差,eyr(t)為y軸向位移當(dāng)前時(shí)刻誤差,ez(t)為z軸向位移當(dāng)前時(shí)刻誤差。exr(t-1)為x軸向位移上一時(shí)刻誤差,eyr(t-1)為y軸向位移上一時(shí)刻誤差,ez(t-1)為z軸向位移上一時(shí)刻誤差。εxr、εyr和εz分別為x軸向位移誤差信號的容許誤差帶,y軸向位移誤差信號的容許誤差帶和z軸向位移誤差信號的容許誤差帶,統(tǒng)一設(shè)為反饋量大小的1%。
4.構(gòu)造第一瞬時(shí)差分模塊14、第二瞬時(shí)差分模塊24和第三瞬時(shí)差分模塊34。
如圖3-5所示,三個(gè)瞬時(shí)差分模塊14、24、34中的每個(gè)都有兩個(gè)輸入端和兩個(gè)輸出端。兩個(gè)輸入分別為強(qiáng)化信號ra(t)(a=1,2,3,分別代表執(zhí)行器-評價(jià)器模塊1,2,3),評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)Va(t)(a=1,2,3),兩個(gè)輸出相同都為瞬時(shí)差分信號δa(t)(a=1,2,3),一個(gè)輸出到執(zhí)行器神經(jīng)網(wǎng)絡(luò),一個(gè)輸出到評價(jià)器神經(jīng)網(wǎng)絡(luò)。如圖12、13和圖14所示,瞬時(shí)差分信號δa(t)的計(jì)算由以下公式得到:
δa(t)=ra(t)+γaVa(t+1)-Va(t)(a=1,2,3)
其中0≤γa≤1(a=1,2,3)為折扣因子,其大小表明了未來的回報(bào)相對于當(dāng)前回報(bào)的重要程度。特別的,γa=0時(shí),相當(dāng)于只考慮立即不考慮長期回報(bào),γa=1時(shí),將長期回報(bào)和立即回報(bào)看得同等重要。t為當(dāng)前時(shí)刻,Va(t+1)和Va(t)分別為更新前后的值函數(shù)。
5.確定執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)參數(shù)更新方式。
在執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)中需要更新的參數(shù)有w(a)jk,v(a)j,μ(a)j和σ(a)j(a=1,2,3)。其計(jì)算方法由如下公式得到:
w(a)jk(t+1)=w(a)jk(t)+α(a)Aδa(t)Φ(a)j(t),
v(a)j(t+1)=v(a)j(t)+α(a)Cδa(t)Φ(a)j(t),
其中α(a)A和α(a)C分別為執(zhí)行器和評價(jià)器的學(xué)習(xí)率,α(a)μ和α(a)σ分別為中心向量和方差的學(xué)習(xí)率,所有學(xué)習(xí)率的取值范圍均為0到1。所有的下標(biāo)a可取1,2,3表示執(zhí)行器-評價(jià)器模塊1,2,3。
6.確定執(zhí)行器-評價(jià)器算法流程
本發(fā)明中的強(qiáng)化學(xué)習(xí)執(zhí)行器評價(jià)器算法流程如圖15所示。具體步驟如下:
步驟1:初始化第一、第二、第三執(zhí)行器評價(jià)器模塊1,2,3中各個(gè)參數(shù)。
步驟2:由系統(tǒng)輸出得到反饋值x、y、xr、yr、z、ω。
步驟3:將反饋值x、y、xr、yr、z、ω與給定值x*、y*、xr*、yr*、z*、ω*比較得到系統(tǒng)誤差ex、ey、exr、eyr、ez、eω,
步驟4:誤差信號分別對時(shí)間求導(dǎo),得到
步驟5:構(gòu)造狀態(tài)向量:
步驟6:計(jì)算三個(gè)執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)的輸出I(a)m(t)、V(a)(t)。
步驟7:計(jì)算三個(gè)強(qiáng)化信號r(a)(t)。
步驟8:計(jì)算下一采樣時(shí)間的系統(tǒng)輸出。
步驟9:計(jì)算t+1時(shí)刻三個(gè)執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)輸出I(a)m(t+1)、V(a)(t+1)。
步驟10:計(jì)算強(qiáng)化信號r(a)(t+1)。
步驟11:計(jì)算瞬時(shí)差分信號δa(t)。
步驟12:更新執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)的參數(shù)包括w(a)jk、v(a)j、μ(a)j、σ(a)j。
步驟13:判斷系統(tǒng)是否穩(wěn)定即誤差信號是否處于容許誤差帶。若系統(tǒng)穩(wěn)定則結(jié)束流程,否則跳轉(zhuǎn)到步驟8。
最終由第一、第二、第三執(zhí)行器-評價(jià)器模塊1,2,3與電流控制模塊4共同組成完整的五自由度無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器8,如圖1所示。