一種基于大腦情感學習的無人機推力變向智能控制方法
【技術領域】
[0001]本發(fā)明涉及一種固定翼無人機飛行控制技術領域,具體涉及一種基于大腦情感學習的無人機推力變向智能控制方法。
【背景技術】
[0002]推力矢量控制技術是目前比較先進的飛行控制手段,在現(xiàn)代噴氣式飛行器中得到成功的應用。推力變向控制實現(xiàn)直接力控制,有足夠大的可用過載和足夠快的動態(tài)響應時間,能夠?qū)崿F(xiàn)對高速、大機動目標的有效攔截和攻擊。另外,其在低速、高空狀態(tài)下仍可產(chǎn)生很大的控制力矩,能滿足無人機機動性強和迎角大的要求。推力矢量技術在有人機上已被驗證能夠改善飛機的隱身性、機動能力和敏捷性等,因此推力矢量技術的應用已成為無人機發(fā)展的重要趨勢。
[0003]類似于噴氣式飛機的推力矢量技術,本發(fā)明針對的是螺旋槳無人機的推力變向技術。推力變向技術具有推力矢量技術的優(yōu)勢特點,即能夠提高無人機姿態(tài)和軌跡的控制性能,補償氣動舵面的功能,區(qū)別在于應用對象不一樣。
[0004]對于螺旋槳無人機,氣動舵面與推力變向協(xié)調(diào)工作有利于飛機機動控制。推力變向控制作為輔助控制機構(gòu),在一般情況下不參與控制。氣動舵面和推力變向的操縱效率不同,在高動壓時,前者效率高于后者,在低動壓大迎角時則相反。為提高推力變向控制的自適應能力,將大腦情感學習算法用于推力變向控制中。
[0005]大腦情感學習(BEL)智能控制是一種啟發(fā)于哺乳動物大腦內(nèi)部情感學習方式的智能控制技術。伊朗學者Moren和Balkenius基于大腦神經(jīng)邏輯學于2000年建立了大腦情感學習的計算模型,它是基于大腦中杏仁體和眶額皮層組織間信息傳遞方式進行建模。Lucas于2004年首先提出了大腦情感學習智能控制器,被應用于永磁同步電動機、電力系統(tǒng)、開關磁阻電動機、電壓調(diào)節(jié)系統(tǒng)的控制中。
[0006]文獻《變推力軸線無人機的大腦情感學習智能飛行控制》和《變推力軸線無人機飛行控制技術研宄》,針對縱向飛行姿態(tài)控制問題,設計了基于氣動舵面控制、推力矢量控制和大腦情感學習逆模型補償控制相結(jié)合的混合控制結(jié)構(gòu)。
[0007]發(fā)明專利《推力變向無人機的姿態(tài)控制系統(tǒng)及控制方法》是基于一種現(xiàn)代控制理論的氣動舵面和推力變向綜合控制方法。
[0008]現(xiàn)有技術均存在一定程度上的缺陷,考慮如何加裝推力偏轉(zhuǎn)裝置的螺旋槳無人機,研宄如何設計推力偏轉(zhuǎn)裝置的自動控制方法,成為了現(xiàn)有技術發(fā)展的方向。
【發(fā)明內(nèi)容】
[0009]發(fā)明目的:為了克服現(xiàn)有技術中存在的不足,本發(fā)明提供一種基于大腦情感學習的無人機推力變向智能控制方法,將大腦情感學習智能控制原理應用到無人機的推力變向控制中,改變飛機受力和力矩作用,克服了現(xiàn)有技術的不足。
[0010]技術方案:為實現(xiàn)上述目的,本發(fā)明采用的技術方案為:一種基于大腦情感學習的無人機推力變向智能控制方法,其特征在于,包括推力縱向偏轉(zhuǎn)控制模塊和推力橫向偏轉(zhuǎn)控制模塊;
[0011]所述推力縱向偏轉(zhuǎn)控制模塊包括推力縱向智能控制接收器;推力橫向偏轉(zhuǎn)控制模塊包括推力橫向偏轉(zhuǎn)控制智能控制接收器;
[0012]該方法包括如下步驟:
[0013]I)推力縱向偏轉(zhuǎn)控制模塊步驟:
[0014]1.1)參數(shù)初始化:設定感官輸入函數(shù)和情感暗示函數(shù)的權(quán)系數(shù)向量ω1ωι;設定杏仁體組織A的學習權(quán)值初值Vlm,眶額皮質(zhì)組織O的學習權(quán)值初值Wlm;設定A-O組織權(quán)值的調(diào)節(jié)率系數(shù)
[0015]1.2)推力縱向智能控制器接收外部縱向輸入信號,所述外部縱向輸入信號包括俯仰姿態(tài)角反饋值、俯仰姿態(tài)角指令值、俯仰角速率反饋值和升降舵偏角反饋值;
[0016]所述外部縱向輸入信號通過推力縱向智能控制器后得到縱向感官輸入信號SIlm和縱向獎勵信號REWw
[0017]SIlon= ω 1οη(1)θ0 + ω1οη⑵ θ+ω1οη(3) Θ c+ω lon(4) q+ω 1οη(5) δ e
[0018]REfflon= ω lon(5)ee + olon(6)q+olon(7) δ e
[0019]1.3)縱向下更新杏仁體組織A的學習權(quán)值初值Vlm和眶額皮質(zhì)組織O的學習權(quán)值初值Wlm,更新律表示為:
[0020]杏仁體組織A的學習權(quán)值更新率:
[0021]AVlon= υ lon(l)max(0, REWlon-VlonSIlon),此時 Vlon= V lon+AVlon;
[0022]眶額皮質(zhì)組織O的學習權(quán)值更新率:
[0023]Δ Wlon= υ lon(2) (VlonSIlon-WlonSIlon-REfflon),此時 Wlon= W 1οη+ Δ fflon;
[0024]1.4)縱向下計算杏仁體組織和眶額皮質(zhì)組織輸出信號Alm,以及縱向智能控制模塊輸出信號Olm,分別為:
[0025]Alon — V 1nSIlon
[0026]Olon= W lonSIlon
[0027]差值為縱向偏角?目號Elm= A ιοη-01οη;
[0028]2)推力橫向偏轉(zhuǎn)控制模塊步驟:
[0029]2.1)參數(shù)初始化:設定感官輸入函數(shù)和情感暗示函數(shù)的權(quán)系數(shù)向量olat;設定杏仁體組織A的學習權(quán)值初值Vlat,眶額皮質(zhì)組織O的學習權(quán)值初值Wlat;設定A-O組織權(quán)值的調(diào)節(jié)率系數(shù)ulat;
[0030]2.2)推力橫向智能控制器接收外部橫向輸入信號,所述外部橫向輸入信號包括滾轉(zhuǎn)姿態(tài)角反饋值、滾轉(zhuǎn)姿態(tài)角指令值、滾轉(zhuǎn)角速率反饋值和副翼偏角反饋值;
[0031]所述外部橫向輸入信號通過推力橫向智能控制器后得到橫向感官輸入信號SIlat和橫向獎勵信號REWlat:
[0032]SIlat= ω ι3?(1)θφ + ω?3?(2) Φ + ω1ει?(3) φ c+ω lat ⑷ ρ+ω lat (5) δ r
[0033]REfflat = ω lat (6) θφ+ω lat (7) ρ+ω lat (8) δ r
[0034]2.3)橫向下更新杏仁體組織A的學習權(quán)值初值Vlat,眶額皮質(zhì)組織O的學習權(quán)值初值Wlat,更新律表示為:
[0035]杏仁體組織A的學習權(quán)值更新率:
[0036]Δ Vlat= υ lat (I).max (O, REfflat-VlatSIlat),Vlat= V lat+ Δ Vlat;
[0037]眶額皮質(zhì)組織O的學習權(quán)值更新率:
[0038]Afflat= υ lat(2) (VlatSIlat-WlatSIlat-REfflat),Wlat= W lat+Δ Wlat ;
[0039]2.4)橫向下計算計算杏仁體組織和眶額皮質(zhì)組織輸出信號Alat,以及橫向智能控制模塊輸出信號Olat,分別為:
[0040]Alat=VlatSIlat
[0041]Olat=WlatSIlat
[0042]差值為推力橫向偏角信號Elat= A lat-0lat;
[0043]3)將所述推力縱向偏角信號Elm和推力橫向偏角信號Elat輸入給推力偏轉(zhuǎn)裝置執(zhí)行機構(gòu),通過偏轉(zhuǎn)裝置實現(xiàn)偏轉(zhuǎn)運動。
[0044]有益效果:本發(fā)明提供的
[0045](I)由于感官輸入信號和獎勵信號的函數(shù)形式可以自行設計,可使得控制器的結(jié)構(gòu)變得靈活、多樣。
[0046](2)氣動舵面包括升降舵、副翼和方向舵,還有油門開度,仍然采用常規(guī)控制方法,或者采用其他先進方法,這樣保證了無人機的基本飛行性能,而推力變向控制作為輔助控制,在必要時候補償氣動舵面效率甚至替代氣動舵面,使得無人機飛行控制系統(tǒng)的余度增加,增強了飛行性能和可靠性。
[0047](3)所設計的推力變向控制方法,控制律計算比較簡單,但是控制參數(shù)具有在線調(diào)節(jié)能力,提高了飛行控制系統(tǒng)的智能水平。
【附圖說明】
[0048]圖1為俯仰角控制響應;
[0049]圖2為升降舵響應;
[0050]圖3為滾轉(zhuǎn)角控制響應;
[0051]圖4為副翼響應;
[0052]圖5為推力縱向偏角響應;
[0053]圖6為推力橫向偏角響應;
[0054]圖7為大腦情感學習(BEL)計算模型的基本結(jié)構(gòu);
【具體實施方式】
[0055]下面結(jié)合附圖對本發(fā)明作更進一步的說明。
[0056]Moren等人根據(jù)大腦中杏仁體組織和眶額皮質(zhì)組織之間的信息傳遞方式,提出了大腦情感學習模型,如圖7所示。模型主要包括杏仁體和眶額皮質(zhì)兩部分。大腦情感的學習過程主要發(fā)生在杏仁體內(nèi),而眶額皮質(zhì)對杏仁體內(nèi)發(fā)生的情感學習過程起到監(jiān)控作用,避免其出現(xiàn)過學習和欠學習。
[0057]杏仁體是哺乳動物大腦里中央顳腦葉(Medial Temporal Lobe)中的微小組織,是中性(Neutral)和情感刺激之間進行學習聯(lián)結(jié)的主要場所,而眶額皮質(zhì)是依靠菌髓(Context)等來抑制這種聯(lián)結(jié)表達的場所。杏仁體與小腦的條件作用機理不同,前者基于感官一情感的聯(lián)結(jié)關系,后者基于刺激一反應的學習過程。
[0058]杏仁體是負責情感學習的主要部分??纛~皮質(zhì)組織是輔助情感學習的主要部分,在杏仁體學習過程中能夠加快情感的學習速度,在杏仁體過學習或欠學習時能夠很好地調(diào)節(jié)大腦情感的學習過程。
[0059]本發(fā)明采用的大腦情感學習算法比國內(nèi)公開文獻發(fā)表的大腦情感學習算法計算更簡單,大腦情感學習算法計算公式如下:
[0060]A = SI.V
[0061]O = S1.W
[0062]E = A-O
[0063]AV= υ a.max (O, REff-A)
[0064]AW=Uo (E-REW)
[0065]式中,A為杏仁體組織的輸出,O為眶額皮質(zhì)組織的輸出,E為輸出信號,SI為外部感官輸入信號或組合,REW為獎勵信號。V為杏仁體內(nèi)部學習權(quán)值,杏仁體內(nèi)情感的學習過程即為權(quán)值的動態(tài)調(diào)節(jié)過程,Δ V為權(quán)值V的調(diào)節(jié)率,表示學習速度。W為眶額皮質(zhì)內(nèi)部學習權(quán)值,眶額皮質(zhì)內(nèi)的情感學習是通過動態(tài)調(diào)節(jié)權(quán)值來實現(xiàn)的,AW權(quán)值W的調(diào)節(jié)率即學習速度。u為調(diào)節(jié)率系數(shù)。
[0066]其次,基于上述大腦情感學習智能控制算法原理,下面推導在無人機推力變向控制中的應用。
[0067]由于推力變向控制包含兩個控制量,因此需要設計兩個