專利名稱:機(jī)器人及機(jī)器人的姿態(tài)控制方法
技術(shù)領(lǐng)域:
本發(fā)明涉及具有多個(gè)可移動(dòng)部分,例如腿的機(jī)器人,以及控制這種機(jī)器人的姿態(tài)的方法。特別是,本發(fā)明涉及按照預(yù)定穩(wěn)定標(biāo)準(zhǔn)自主保持其姿態(tài)穩(wěn)定性的機(jī)器人,以及控制這種機(jī)器人姿態(tài)的方法。
尤其是,本發(fā)明涉及不采用ZMP(零力矩點(diǎn),zero moment point)作為穩(wěn)定標(biāo)準(zhǔn)的控制其身體姿態(tài)的穩(wěn)定性的機(jī)器人,以及控制這種機(jī)器人姿態(tài)的方法。尤其是,本發(fā)明涉及通過關(guān)注機(jī)器人的移動(dòng)部分的周期性運(yùn)動(dòng)來控制其身體姿態(tài)的穩(wěn)定性的機(jī)器人,以及控制這種機(jī)器人的姿態(tài)的方法。
本申請(qǐng)要求于2003年8月25日申請(qǐng)的日本專利申請(qǐng)第2003-300521號(hào)和于2004年8月11日申請(qǐng)的日本專利申請(qǐng)第2004-234022號(hào)的優(yōu)先權(quán),上述申請(qǐng)?jiān)诖俗鳛閰⒖疾⑷搿?br>
背景技術(shù):
通過電和/或磁操作,適合于按照類似于人類運(yùn)動(dòng)的方式運(yùn)動(dòng)的機(jī)械設(shè)備被稱作“機(jī)器人”。據(jù)說“機(jī)器人”這個(gè)詞是從斯拉夫語“ROBOTA”(奴隸機(jī)器)演化而來的。
在日本,從60后代后期機(jī)器人開始變得流行起來,盡管它們中許多是工業(yè)機(jī)器人,例如為工廠的自動(dòng)化生產(chǎn)操作和節(jié)省人力的目的而安裝的機(jī)械手和傳送機(jī)器人。近年來,對(duì)裝配有可移動(dòng)的腿,并適合于站著工作的機(jī)器人進(jìn)行了研究和開發(fā)。對(duì)于將這種可移動(dòng)的機(jī)器人投入實(shí)際應(yīng)用的期望非常高。兩條腿的模擬人類運(yùn)動(dòng)的可移動(dòng)機(jī)器人被稱為具有人類特點(diǎn)的機(jī)器人。
盡管與爬行類的機(jī)器人和四腿或六腿的機(jī)器人相比,基于人類兩足運(yùn)動(dòng)的機(jī)器人伴有不穩(wěn)定問題和難于進(jìn)行姿態(tài)控制和行走控制的問題,它們?nèi)匀痪哂袃?yōu)越性,包括它們可自己適應(yīng)不平的地面、路上帶障礙和有起伏的行走表面以及不連續(xù)的行走表面,例如逐漸上升和下降的樓梯和梯子,從而可以以靈活的方式移動(dòng)。
已經(jīng)提出大量技術(shù)用于兩腿可移動(dòng)機(jī)器人的姿態(tài)控制和穩(wěn)定行走。在此使用的穩(wěn)定“行走”定義為“使用腿,而不蹣跚并跌倒的移動(dòng)”。當(dāng)機(jī)器人的身體蹣跚并跌倒時(shí),意味著將中止機(jī)器人正在進(jìn)行的操作,并且機(jī)器人將花費(fèi)大量的能量和時(shí)間用于從跌倒的位置站立起來,重新開始操作。另外,當(dāng)機(jī)器人蹣跚并跌倒時(shí),增加了機(jī)器人本身和/或跌倒的機(jī)器人碰撞的物體遭到致命損壞的危險(xiǎn)。因此,防止機(jī)器人蹣跚并跌倒的姿態(tài)/穩(wěn)定性控制是開發(fā)兩腿可移動(dòng)機(jī)器人需要優(yōu)先解決的問題之一。
基于人類兩足運(yùn)動(dòng)的機(jī)器人的站立姿態(tài)作為基本姿態(tài)是不穩(wěn)定的。通常采用ZMP(零力矩點(diǎn))作為兩腿可移動(dòng)機(jī)器人的行走穩(wěn)定性的標(biāo)準(zhǔn)。采用ZMP來評(píng)價(jià)行走的穩(wěn)定性是根據(jù)d’Alembert的理論,即行走系統(tǒng)施加到地面表面的重力和慣性力及它們的力矩(moment)分別與地面表面施加到行走系統(tǒng)的反作用力及其力矩相平衡。作為動(dòng)態(tài)特性框架的推理結(jié)果,存在一個(gè)俯仰軸力矩和翻滾軸力矩都等于零的點(diǎn),或在由相對(duì)于地面的底部和地面表面足底的接觸點(diǎn)所形成的支撐多邊形(或ZMP穩(wěn)定區(qū)域)的一個(gè)邊上,或在其內(nèi)部的一個(gè)ZMP點(diǎn)(參見非專利參考文獻(xiàn)1)。
基于ZMP標(biāo)準(zhǔn)的兩足行走模式的產(chǎn)生具有優(yōu)越性,包括有可能預(yù)先定義足底接觸點(diǎn),同時(shí),考慮腳尖相應(yīng)于地面表面的輪廓的運(yùn)動(dòng)約束也是容易的。另外,采用ZMP評(píng)估穩(wěn)定性意味著并不是力,而是運(yùn)動(dòng)軌跡被作為控制運(yùn)動(dòng)的目標(biāo)進(jìn)行處理,從而在技術(shù)上更加可行。
當(dāng)計(jì)劃進(jìn)行運(yùn)動(dòng),以在每時(shí)每刻獲得動(dòng)態(tài)平衡時(shí),目標(biāo)ZMP控制已經(jīng)在真正的機(jī)器人上得到成功。采用ZMP作為穩(wěn)定性標(biāo)準(zhǔn)的運(yùn)動(dòng)產(chǎn)生技術(shù)可以真正實(shí)現(xiàn)穩(wěn)定的兩足行走,因而是已被證實(shí)的技術(shù)。換句話說,在一個(gè)方面,基于ZMP的穩(wěn)定性控制一直由一個(gè)等式限定,因此為了按照ZMP標(biāo)準(zhǔn)設(shè)計(jì)運(yùn)動(dòng)軌跡,必須對(duì)機(jī)器人自身和環(huán)境進(jìn)行精確建模,同時(shí),通過高精確度的軌跡跟蹤控制系統(tǒng),一直使計(jì)劃與環(huán)境模型相匹配。換句話說,基于ZMP的穩(wěn)定性控制伴有對(duì)于未知環(huán)境的適應(yīng)性的問題。求解ZMP等式的過程需要相當(dāng)繁重的計(jì)算花費(fèi),因而在實(shí)時(shí)控制情況下是非常困難的。
滿足ZMP等式對(duì)于機(jī)器人的姿態(tài)穩(wěn)定性控制是充分條件,而不是必要條件。很明顯,人類的行走并不需要最大化ZMP穩(wěn)定裕度。
換句話說,人類利用自身具有的生物結(jié)構(gòu)行走,適當(dāng)?shù)貞?yīng)用四肢的從動(dòng)動(dòng)態(tài)特性(passive dynamics),而不依靠ZMP。如果機(jī)器人可以精確地應(yīng)用從動(dòng)動(dòng)態(tài)特性,它也有可能實(shí)現(xiàn)具有高能量轉(zhuǎn)換效率的行走運(yùn)動(dòng),既不需要精巧的設(shè)計(jì)模型(從而也不需要計(jì)算操作的繁重的計(jì)算花費(fèi)),也不需要大驅(qū)動(dòng)力矩的致動(dòng)器。
例如,可以認(rèn)為行走運(yùn)動(dòng)為周期性的運(yùn)動(dòng),并認(rèn)為至少機(jī)器人的每個(gè)移動(dòng)部分的部分為物理振蕩器。于是,有可能通過確定或控制振蕩器的相位和振蕩頻率來控制機(jī)器人的行走。當(dāng)繼續(xù)進(jìn)行這種周期性運(yùn)動(dòng)時(shí),可以將其作為“穩(wěn)定的行走”。如果在一個(gè)周期內(nèi)有一個(gè)時(shí)刻,失去了動(dòng)態(tài)平衡,進(jìn)而失去穩(wěn)定性時(shí)(根據(jù)ZMP理論),只要通過重復(fù)該周期來恢復(fù)穩(wěn)定的限制周期,有可能繼續(xù)行走運(yùn)動(dòng)。更進(jìn)一步,如果在一定時(shí)期內(nèi)沒有恢復(fù)穩(wěn)定限制周期,只要在一個(gè)實(shí)際的時(shí)間周期內(nèi)將運(yùn)動(dòng)收斂于恒定的周期性運(yùn)動(dòng),運(yùn)動(dòng)也能夠繼續(xù)。
如果通過關(guān)注機(jī)器人的行走運(yùn)動(dòng)而如此定義穩(wěn)定性,則可能實(shí)現(xiàn)“全面的穩(wěn)定性”,這是因?yàn)槿绻箼C(jī)器人面臨外部的未知干擾,其能在幾個(gè)周期內(nèi)恢復(fù)穩(wěn)定狀態(tài)。于是,結(jié)果是,既不需要精確的模型,也不需要精確的軌跡跟蹤控制。另外,可降低致動(dòng)器的增益,從而可能減少花費(fèi),同時(shí),以小增益提高穩(wěn)定性。(換句話說,如果需要精確的模型和精確的軌跡跟蹤控制,則由于需要高增益和精度,則將提高花費(fèi))。更進(jìn)一步,從全面的觀點(diǎn)來看,允許機(jī)器人離開穩(wěn)定區(qū)。然后,可以采用種種模式實(shí)現(xiàn)行走和其他腿的運(yùn)動(dòng)(姿態(tài)),以提高機(jī)器人的表達(dá)潛力,并改進(jìn)對(duì)于環(huán)境的適應(yīng)性。
關(guān)注行走運(yùn)動(dòng)周期的利用腿移動(dòng)的機(jī)器人的行走技術(shù)包括從生物學(xué)上得到啟示的四足動(dòng)物機(jī)器人在不規(guī)則區(qū)域上的適應(yīng)性的動(dòng)態(tài)行走(參見非專利文獻(xiàn)D2)以及在外部干擾下重新設(shè)定節(jié)奏與人類的兩足行走運(yùn)動(dòng)的行走的動(dòng)態(tài)穩(wěn)定性之間的關(guān)系(參見非專利文獻(xiàn)D3)。
根據(jù)前述的文獻(xiàn),通過在在獨(dú)特的非線性動(dòng)態(tài)特性基礎(chǔ)上耦合機(jī)械系統(tǒng)和神經(jīng)系統(tǒng)而形成的動(dòng)態(tài)系統(tǒng)與環(huán)境的交互作用下,創(chuàng)造性地產(chǎn)生了適應(yīng)性運(yùn)動(dòng)。然而,上述文獻(xiàn)記載相位和頻率是由非線性的不等式(Matsuoka振蕩器)誘導(dǎo),揭示了不可能獲得物理振蕩器的相位的分析結(jié)果,從而不可能在數(shù)學(xué)上設(shè)計(jì)該系統(tǒng)。簡(jiǎn)而言之,不可能得到任何特定的設(shè)計(jì)理論。
根據(jù)最后一篇文獻(xiàn),通過對(duì)兩足行走運(yùn)動(dòng)應(yīng)用動(dòng)態(tài)模型有可能在數(shù)學(xué)上分析包含相位復(fù)位的運(yùn)動(dòng)軌跡與動(dòng)態(tài)穩(wěn)定性之間的關(guān)系。然而,這只描述了在已知的外部干擾之后通過開環(huán)方法,立即調(diào)節(jié)物理振蕩器的相位,缺少從物理系統(tǒng)的任何反饋,因而缺少對(duì)未知狀態(tài)和外部干擾的適應(yīng)性。
非專利文獻(xiàn)1Miomir Vukobratovic,“利用腿運(yùn)動(dòng)的機(jī)器人”(IchiroKato等人的,“行走機(jī)器人及人造腳”,Nikkan Kogyo Shinbun公司)。
非專利文獻(xiàn)2Fukuoka等人的,“從生物學(xué)上得到啟發(fā)的四足動(dòng)物在不規(guī)則區(qū)域上的適應(yīng)性動(dòng)態(tài)行走-耦合神經(jīng)-機(jī)械系統(tǒng)的設(shè)計(jì)原理及對(duì)于傾斜(pitch)運(yùn)動(dòng)、CPG和滾動(dòng)運(yùn)動(dòng)之間的互相誘導(dǎo)的估計(jì)”(日本機(jī)器人世界雜志,第21卷,5號(hào),2003年7月)非專利文獻(xiàn)3Yamazaki等人的,“在外部干擾下的節(jié)奏復(fù)位與人類兩足行走運(yùn)動(dòng)的動(dòng)態(tài)穩(wěn)定性之間的關(guān)系”,(IEICE技術(shù)報(bào)告,電子、信息和通信工程師協(xié)會(huì),)發(fā)明內(nèi)容根據(jù)上述情況,本發(fā)明目的是提供一種高級(jí)機(jī)器人,根據(jù)給定的穩(wěn)定性標(biāo)準(zhǔn),它可自主保持姿態(tài)的穩(wěn)定性,以及控制這種機(jī)器人姿態(tài)的方法。
本發(fā)明的另一個(gè)目的是,提供一種高級(jí)機(jī)器人,它不需更采用ZMP(零力矩點(diǎn))作為穩(wěn)定性的標(biāo)準(zhǔn),即可控制其身體姿態(tài)的穩(wěn)定性,以及一種控制這種機(jī)器人姿態(tài)的方法。
本發(fā)明的另一個(gè)目的是,提供一種高級(jí)機(jī)器人,通過關(guān)注其運(yùn)動(dòng)部件的周期性運(yùn)動(dòng),可控制其身體姿態(tài)的穩(wěn)定性,以及一種控制這種機(jī)器人姿態(tài)的方法。
本發(fā)明的另一個(gè)目的是,提供一種高級(jí)機(jī)器人,通過將其每個(gè)可移動(dòng)部分的至少部分作為物理振蕩器,并生成數(shù)學(xué)上容易處理的相位,適于控制它的可移動(dòng)部分,并自適應(yīng)處理任何未知的干擾,以及一種控制這種機(jī)器人的方法。
本發(fā)明達(dá)到了上述目的。通過本發(fā)明的一個(gè)方面,提供了一種具有多個(gè)可移動(dòng)部分的機(jī)器人,該機(jī)器人包括相位信號(hào)發(fā)生裝置,用來產(chǎn)生與至少部分可移動(dòng)部分的周期運(yùn)動(dòng)相關(guān)的相位信號(hào);控制裝置,用來根據(jù)相位信號(hào)產(chǎn)生對(duì)于可移動(dòng)部分的控制信號(hào);驅(qū)動(dòng)裝置,用來根據(jù)控制信號(hào)驅(qū)動(dòng)可移動(dòng)部分;狀態(tài)量檢測(cè)裝置,用來檢測(cè)驅(qū)動(dòng)裝置所驅(qū)動(dòng)的可移動(dòng)部分的狀態(tài)量;以及估計(jì)裝置,用來根據(jù)狀態(tài)量估計(jì)可移動(dòng)部分周期運(yùn)動(dòng)的相位或角頻率;相位信號(hào)發(fā)生裝置,適于根據(jù)估計(jì)裝置所估計(jì)的相位或角頻率來更新相位信號(hào)。
控制裝置包括多個(gè)具有不同的控制規(guī)則的控制器,根據(jù)相位信號(hào)來選擇適當(dāng)?shù)目刂破?,所選擇的控制器根據(jù)相位信號(hào)生成可移動(dòng)部分的控制信號(hào)。
因此,根據(jù)本發(fā)明的機(jī)器人,可移動(dòng)部分的運(yùn)動(dòng)是作為周期性的運(yùn)動(dòng),因此,從廣義上來說,可通過調(diào)節(jié)可移動(dòng)部分的傳輸,來穩(wěn)定地控制機(jī)器人的姿態(tài)。特別是,在機(jī)器人系統(tǒng)中可采用一個(gè)或多于一個(gè)相位生成裝置,同時(shí),根據(jù)生成的相位來選擇多個(gè)控制器中的一個(gè)。于是,控制器根據(jù)連續(xù)的相位信息,來控制可移動(dòng)部分的驅(qū)動(dòng)。另外,從物理系統(tǒng)中估計(jì)實(shí)際的相位,同時(shí),通過采用估計(jì)值來調(diào)節(jié)相位生成器的相位和頻率。由于機(jī)器人系統(tǒng)的物理相位和相位生成器受到互相誘導(dǎo),因此有可能通過有效應(yīng)用機(jī)器人動(dòng)態(tài)特性來控制機(jī)器人的運(yùn)動(dòng)。
圖1示意性和概念性地說明根據(jù)本發(fā)明的機(jī)器人姿態(tài)穩(wěn)定控制系統(tǒng)的配置。在機(jī)器人中,可移動(dòng)部分的運(yùn)動(dòng)認(rèn)為是周期性的運(yùn)動(dòng),行走及可移動(dòng)部分的其他運(yùn)動(dòng)按照相位來描述。
機(jī)器人系統(tǒng)的每個(gè)物理系統(tǒng)定義了一個(gè)或多于一個(gè)的相位生成器。提供具有不同控制規(guī)則的多個(gè)控制器,因此,可根據(jù)機(jī)器人系統(tǒng)輸出的相位來選擇適當(dāng)?shù)目刂破鳌?br>
所選擇的控制器根據(jù)相位生成器提供的連續(xù)的相位信息,來控制機(jī)器人可移動(dòng)部分的驅(qū)動(dòng)。
在機(jī)器人系統(tǒng)中提供傳感器來檢測(cè)當(dāng)驅(qū)動(dòng)可移動(dòng)部分時(shí),可移動(dòng)部分的狀態(tài)量(state quantity)。相位估計(jì)器估計(jì)根據(jù)傳感器信息得到的角頻率ω和相位。
下一步,相位生成器根據(jù)相位估計(jì)器估計(jì)的運(yùn)動(dòng)的相位和角頻率,來調(diào)節(jié)可移動(dòng)部分周期性運(yùn)動(dòng)的相位和頻率。
傳統(tǒng)上,當(dāng)將行走運(yùn)動(dòng)作為周期性運(yùn)動(dòng)時(shí),通過神經(jīng)振蕩器(neuraloscillator)或類似裝置來生成周期性信號(hào),并采用上述周期性信號(hào)來控制致動(dòng)器。于是,通過觀察行走運(yùn)動(dòng)的周期性信號(hào),并使神經(jīng)振蕩器相互作用,從而實(shí)現(xiàn)穩(wěn)定的行走運(yùn)動(dòng)。(參見非專利文獻(xiàn)2)相反,根據(jù)本發(fā)明,當(dāng)同樣將行走運(yùn)動(dòng)作為周期性運(yùn)動(dòng)時(shí),沒有采用神經(jīng)振蕩器或類似裝置來產(chǎn)生幅值信號(hào),而是作為從相位生成器生成的相位信號(hào)所得到的控制輸出。由于這種設(shè)計(jì),有可能在誘導(dǎo)控制和得到寬穩(wěn)定性區(qū)域方面,顯著簡(jiǎn)化設(shè)計(jì)操作。
通常采用下述更新規(guī)則來調(diào)節(jié)相位信號(hào)。
公式1ω=ω0+Δωφ=φ0+Δφ在上面的公式中,Δω和Δ是相位估計(jì)器和相位生成器在運(yùn)動(dòng)中的相位誤差的估計(jì)值,其通過觀察該運(yùn)動(dòng)得到。運(yùn)動(dòng)的相位可從機(jī)器人傳感器中估計(jì)得到。更進(jìn)一步,在行走運(yùn)動(dòng)情況下,可從足底開關(guān)(或接觸確認(rèn)傳感器)的接觸時(shí)間和運(yùn)動(dòng)周期估計(jì)得出相位。在基于指尖接觸目標(biāo)的接觸轉(zhuǎn)換的時(shí)間和運(yùn)動(dòng)開始的時(shí)間,從胳膊的運(yùn)動(dòng)能預(yù)測(cè)整個(gè)身體的協(xié)調(diào)性周期運(yùn)動(dòng)的情況下,可從相似的關(guān)節(jié)運(yùn)動(dòng)開始的時(shí)間和運(yùn)動(dòng)周期來估計(jì)該相位。
下一步,通過適當(dāng)?shù)膫鬏斚辔恍盘?hào)來得到機(jī)器人可移動(dòng)部分的輸入信號(hào)(控制輸出)U,該相位信號(hào)是由相位信號(hào)生成裝置所生成的。
公式2U=f()如果從觀察信號(hào)的矢量V估計(jì)得到的相位和角頻率分別為0和ω0,相位誤差的估計(jì)值可以按照下述公式得出(作為對(duì)上述方法的改進(jìn),比較控制輸出U和觀察矢量V的估計(jì)方法,或者直接從和V或0和U或U,V和估計(jì)的估計(jì)方法也是可能的。)公式3Δ=0·Δω=ω0·ω為了保證平穩(wěn)運(yùn)動(dòng),可以得到一種利用動(dòng)態(tài)特性逐步改變相位或處理相位的技術(shù)。例如,可以得到一種采用下面公式的技術(shù)。
公式4αdxdt=-x+Δφ]]>βdydt=-y+Δω]]>公式5=0+xω=ω0+y
當(dāng)可以預(yù)測(cè)到急劇的相位變化時(shí)(例如,作為在行走過程中絆倒的結(jié)果),應(yīng)用動(dòng)態(tài)系統(tǒng)處理輸入信號(hào)(控制輸出)U,并將其發(fā)送給機(jī)器人的可移動(dòng)部分的技術(shù)是可以得到的。例如,應(yīng)用下面的公式可以實(shí)現(xiàn)平穩(wěn)的運(yùn)動(dòng)。(相位平穩(wěn)變化的技術(shù)適合于以幾個(gè)臺(tái)階結(jié)束的行走,例如于在斜坡上行走。另一方面,對(duì)于例如需要快速反應(yīng)的跌倒的運(yùn)動(dòng),相位急劇變化,且控制基準(zhǔn)自身也被轉(zhuǎn)變。在這種情況下,控制器可保證平穩(wěn)運(yùn)動(dòng)。)公式6rdzdt=-z+f(φ)]]>U=z在將機(jī)器人可移動(dòng)部分的運(yùn)動(dòng)作為周期性運(yùn)動(dòng)的許多傳統(tǒng)的控制方法中,通過采用時(shí)間作為參數(shù),描述運(yùn)動(dòng)的目標(biāo)軌跡。相反,采用相位描述目標(biāo)軌跡。
另外,根據(jù)本發(fā)明,為一個(gè)機(jī)器人系統(tǒng)定義一個(gè)或多于一個(gè)相位生成器。由于相位生成器的配置并不受特定的限制,從設(shè)計(jì)角度看,可以期望通過相位復(fù)位得到行為的分析結(jié)果。相位生成器是機(jī)器人的機(jī)器機(jī)體本身。然而,相位生成器允許變化。例如,機(jī)器人的機(jī)器機(jī)體可以作為相位生成器?;蛘?,可以這樣考慮,為每個(gè)關(guān)節(jié)的每個(gè)自由度提供一個(gè)相位生成器(將在下面描述)。
另外,根據(jù)本發(fā)明,根據(jù)從機(jī)器人系統(tǒng)的相位輸出來選擇適當(dāng)?shù)目刂破?。例如,如下表所示,根?jù)腿的狀態(tài)來確定機(jī)器人系統(tǒng)的相位,為每個(gè)可能的狀態(tài)提供控制器。如果兩個(gè)或多于兩個(gè)控制器是基于同樣的PD控制方法,需要應(yīng)用不同的控制參數(shù)(例如,不同的增益值)。
表1
所選擇的控制器根據(jù)連續(xù)的相位信息來控制可移動(dòng)部分。當(dāng)按照動(dòng)態(tài)系統(tǒng)描述運(yùn)動(dòng)時(shí),如果發(fā)生急劇的相位改變,控制器可保證平穩(wěn)運(yùn)動(dòng)。
圖2示意地表示出當(dāng)兩腿可動(dòng)機(jī)器人進(jìn)行行走運(yùn)動(dòng)時(shí),按照切換方式交替地采用左腿和右腿作為支撐腿腿和擺動(dòng)腿,根據(jù)相位信息適當(dāng)?shù)剡x擇控制器的機(jī)制。
在圖示的實(shí)例中,提供一個(gè)根據(jù)相位信息,用于控制擺動(dòng)腿的抬起運(yùn)動(dòng)的控制器(擺動(dòng)控制器);一個(gè)根據(jù)相位信息,用于控制擺動(dòng)腿的接觸地面運(yùn)動(dòng)的控制器(接觸控制器);一個(gè)根據(jù)相位信息,用于控制以兩腿支撐機(jī)器人的運(yùn)動(dòng)的控制器(雙支撐控制器)以及一個(gè)根據(jù)相位信息,用于控制以單獨(dú)腿支撐機(jī)器人的運(yùn)動(dòng)的控制器(單支撐控制器)。
在行走運(yùn)動(dòng)中的當(dāng)前時(shí)刻,相位生成器生成相位。然后,根據(jù)相位來選擇控制器,并將相位信息提供給控制器。
控制器根據(jù)提供的相位信息,為機(jī)器人的可移動(dòng)部分生成控制輸出U。根據(jù)控制器參量U,驅(qū)動(dòng)機(jī)器人的可移動(dòng)部分進(jìn)行行走運(yùn)動(dòng)。
在行走運(yùn)動(dòng)中,獲取可移動(dòng)部分中關(guān)節(jié)的角、角速度、角加速度等的傳感器的輸出值,并將輸出值輸入到相位估計(jì)器。相位估計(jì)器根據(jù)傳感器輸出值,估計(jì)周期運(yùn)動(dòng)中的相位和角頻率,或者可移動(dòng)部分的狀態(tài)量,并將它們提供給相位生成器。
相位生成器根據(jù)相位估計(jì)器估計(jì)的相位和角頻率,更新相位信號(hào),并調(diào)節(jié)機(jī)器人系統(tǒng)周期運(yùn)動(dòng)的相位。
機(jī)器人每個(gè)可移動(dòng)部分的關(guān)節(jié)自由度不小于1。然后,狀態(tài)量檢測(cè)裝置檢測(cè)關(guān)節(jié)角和關(guān)節(jié)角速度作為狀態(tài)量。然后,估計(jì)裝置可根據(jù)關(guān)節(jié)角和關(guān)節(jié)角速度,來估計(jì)每個(gè)關(guān)節(jié)的周期運(yùn)動(dòng)的相位或頻率。
作為最簡(jiǎn)單的例子,假設(shè)將相位作為關(guān)節(jié)角輸出。然后,在圖形中得到正旋曲線波形圖,其中,水平軸表示時(shí)間T,垂直軸表示關(guān)節(jié)角θ(見圖3)。在圖中得到單元電路的相位圖表,其中水平軸代表關(guān)節(jié)角,垂直軸代表關(guān)節(jié)角速度。下一步,在給定時(shí)刻的旋轉(zhuǎn)角(由連接單元電路的一個(gè)點(diǎn)和原點(diǎn)的直線和水平軸所形成的角)是周期運(yùn)動(dòng)的相位(見圖4)。
可提供多個(gè)可動(dòng)腿作為可移動(dòng)部分。如果這樣的話,狀態(tài)量檢測(cè)裝置檢測(cè)可動(dòng)腿每個(gè)足底從地面得到的反作用力作為狀態(tài)量。下一步,估計(jì)裝置根據(jù)地面對(duì)每個(gè)可動(dòng)腿的足底的反作用力,來估計(jì)相位或角頻率。例如,可根據(jù)地面的反作用力,確定或者左腿、或者右腿的單腿支撐周期,以及雙腿支撐周期。下一步,可估計(jì)對(duì)支撐腿確定的結(jié)果作為行走運(yùn)動(dòng)的相位。
正如上面指出的,可提供多個(gè)可動(dòng)腿作為可移動(dòng)部分的機(jī)器人。在這種情況下,狀態(tài)量檢測(cè)裝置可檢測(cè)每個(gè)可動(dòng)腿的足底受到的地面的反作用力作為狀態(tài)量。下一步,估計(jì)裝置可根據(jù)地面對(duì)每個(gè)可動(dòng)腿的足底的反作用力,估計(jì)可移動(dòng)部分的周期運(yùn)動(dòng)的相位或角頻率。
替代的,狀態(tài)量檢測(cè)裝置可檢測(cè)可動(dòng)腿每個(gè)足底從地面獲得的在移動(dòng)方向或垂直于移動(dòng)方向的方向上的摩擦力作為狀態(tài)量。接著,估計(jì)裝置根據(jù)可動(dòng)腿足底從地面接收的摩擦力,來估計(jì)每個(gè)可移動(dòng)部分周期運(yùn)動(dòng)的相位或角頻率。
可提供具有軀干部位的機(jī)器人,狀態(tài)量檢測(cè)裝置可檢測(cè)軀干部位的傾斜度作為狀態(tài)量。然后,估計(jì)裝置可根據(jù)軀干部位的傾斜度,估計(jì)每個(gè)可移動(dòng)部分的周期運(yùn)動(dòng)的相位或角頻率。
狀態(tài)量檢測(cè)裝置可檢測(cè)機(jī)器人或每個(gè)可移動(dòng)部分的加速度來作為狀態(tài)量,估計(jì)裝置也可根據(jù)加速度來估計(jì)每個(gè)可移動(dòng)部分的周期運(yùn)動(dòng)的相位或角頻率。
估計(jì)裝置可響應(yīng)于預(yù)先確定的事件的發(fā)生,復(fù)位與關(guān)節(jié)的周期運(yùn)動(dòng)相關(guān)的相位。
估計(jì)裝置可學(xué)習(xí)與狀態(tài)量檢測(cè)裝置檢測(cè)的狀態(tài)量相關(guān)的訓(xùn)練信號(hào)以及可移動(dòng)部分的周期,根據(jù)學(xué)習(xí)到的訓(xùn)練信號(hào),來估計(jì)相位或角頻率。
估計(jì)裝置可由神經(jīng)網(wǎng)絡(luò)構(gòu)成,其根據(jù)狀態(tài)量檢測(cè)裝置檢測(cè)的狀態(tài)量,輸出與可移動(dòng)部分的周期運(yùn)動(dòng)相關(guān)的相位和角頻率。
估計(jì)裝置可根據(jù)從多個(gè)連續(xù)設(shè)置的內(nèi)部傳感器得到的信息,通過前饋神經(jīng)網(wǎng)絡(luò),連續(xù)估計(jì)相位或角頻率。
當(dāng)估計(jì)的相位是離散的,例如,在每個(gè)足底的接觸確認(rèn)傳感器輸出的基礎(chǔ)上,為研究起見,一條腿的接觸地面和另一條腿的接觸地面可分別定義為相位0和相位π。在這種情況下,可以從左腿和右腿接觸地面的時(shí)間間隔來計(jì)算頻率。
根據(jù)本發(fā)明的機(jī)器人,可為每個(gè)物理系統(tǒng)定義一個(gè)或多于一個(gè)的相位生成器。機(jī)器機(jī)體可作為進(jìn)行周期運(yùn)動(dòng)的物理振蕩器,同時(shí),單獨(dú)的相位生成器可定義為整個(gè)機(jī)器機(jī)體,如圖5所示。
作為選擇,當(dāng)關(guān)注行走或一些其它的腿運(yùn)動(dòng)時(shí),每條腿的運(yùn)動(dòng)可作為一個(gè)獨(dú)立的周期運(yùn)動(dòng)。然后,可為每條腿定義一個(gè)相位生成器,如圖6所示。
當(dāng)關(guān)注行走或一些其它的腿運(yùn)動(dòng)時(shí),左腿和右腿以一種協(xié)調(diào)的方式操作,以交替重復(fù)一條腿支撐和兩條腿支撐。因此,可認(rèn)為下肢在進(jìn)行單獨(dú)的周期運(yùn)動(dòng),而認(rèn)為上肢、軀干和其它部分在進(jìn)行另一個(gè)周期運(yùn)動(dòng)。于是,可為下肢和上肢、軀干以及其它部分分別定義相位生成器,如圖7所示。然而,在這種情況下,每條腿的運(yùn)動(dòng)可作為獨(dú)立的周期運(yùn)動(dòng)。因此,可為每條腿定義一個(gè)相位生成器,如圖8所示。
作為選擇,當(dāng)關(guān)注行走或其它機(jī)器機(jī)體的運(yùn)動(dòng)時(shí),每條腿、胳膊、軀干和頭的運(yùn)動(dòng)可作為一個(gè)獨(dú)立的周期運(yùn)動(dòng)。然后,可為每個(gè)部分定義一個(gè)相位生成器,如圖9所示。
然而,不需要認(rèn)為每個(gè)可移動(dòng)部分在進(jìn)行由于組合相鄰關(guān)節(jié)的運(yùn)動(dòng)所產(chǎn)生的周期運(yùn)動(dòng)。換句話說,每個(gè)關(guān)節(jié)的運(yùn)動(dòng)可作為獨(dú)立的周期運(yùn)動(dòng)。因此,可為每個(gè)關(guān)節(jié)定義一個(gè)相位生成器,如圖10所示。
當(dāng)如圖6到10所示,在一個(gè)單一的機(jī)器人上定義多個(gè)相位生成器時(shí),為每個(gè)可移動(dòng)部分提供控制器,為所述可移動(dòng)部分定義了相位生成器并認(rèn)為其在進(jìn)行周期運(yùn)動(dòng),所述控制器具有相應(yīng)的不同控制規(guī)則。在這種情況下,可為機(jī)器人另外提供協(xié)調(diào)裝置,用于協(xié)調(diào)來自可移動(dòng)部分控制器的控制參量,從而使整個(gè)機(jī)器人進(jìn)行協(xié)調(diào)運(yùn)動(dòng)。
機(jī)器人所有可移動(dòng)部分的運(yùn)動(dòng)也可不作為周期運(yùn)動(dòng)。換句話說,可以將一些可移動(dòng)部分的運(yùn)動(dòng)作為周期運(yùn)動(dòng),同時(shí)其它一些可移動(dòng)部分的運(yùn)動(dòng)不作為周期運(yùn)動(dòng)。
如果在這種情況下,可為可移動(dòng)部分提供第二控制裝置,所述控制裝置適合于按照與周期運(yùn)動(dòng)無關(guān)的控制規(guī)則來控制各自的可移動(dòng)部分,以便可以適當(dāng)?shù)乜刂撇蛔鲋芷谶\(yùn)動(dòng)的可移動(dòng)部分。第二控制裝置通常根據(jù)ZMP穩(wěn)定標(biāo)準(zhǔn)來產(chǎn)生控制信號(hào)。
如果在這種情況下,機(jī)器人可進(jìn)一步包括協(xié)調(diào)裝置,用于按照周期運(yùn)動(dòng)的相位,協(xié)調(diào)從控制裝置輸出的進(jìn)行周期運(yùn)動(dòng)的可移動(dòng)部分的控制參數(shù),及從第二控制裝置輸出的不進(jìn)行周期運(yùn)動(dòng)的可移動(dòng)部分的控制參數(shù),從而使整個(gè)機(jī)器人進(jìn)行協(xié)調(diào)運(yùn)動(dòng)(見圖11)。
總之,根據(jù)本發(fā)明,提供一種高級(jí)機(jī)器人,能夠不采用ZMP作為穩(wěn)定性標(biāo)準(zhǔn),來控制其機(jī)體姿態(tài)的穩(wěn)定性,以及控制這種機(jī)器人的方法。
根據(jù)本發(fā)明,提供一種高級(jí)機(jī)器人,通過關(guān)注其可移動(dòng)部分的周期運(yùn)動(dòng)來控制其機(jī)體姿態(tài)的穩(wěn)定性,以及控制這種機(jī)器人的方法。
根據(jù)本發(fā)明,提供一種高級(jí)機(jī)器人,其通過將每個(gè)可移動(dòng)部分的至少部分作為物理振蕩器并生成數(shù)學(xué)上容易處理的相位,適合于控制其可移動(dòng)部分并適應(yīng)于處理任何未知的干擾,以及控制這種機(jī)器人的方法。
本發(fā)明的其它目的、性能特點(diǎn)及優(yōu)越性通過下面給出的優(yōu)選實(shí)施例,結(jié)合相關(guān)附圖,將變得容易理解。
圖1示意性地,從概念上說明根據(jù)本發(fā)明的機(jī)器人姿態(tài)穩(wěn)定性控制機(jī)構(gòu)的配置;圖2示意性地說明當(dāng)兩腿可動(dòng)機(jī)器人進(jìn)行行走運(yùn)動(dòng),并采用左腿和右腿以切換的方式交替作為支撐腿和搖擺腿時(shí),根據(jù)相位信息適當(dāng)選擇控制器的機(jī)制;圖3示意性地說明可移動(dòng)部分的關(guān)節(jié)角θ與其周期運(yùn)動(dòng)的相位之間的關(guān)系;圖4示意性地說明對(duì)于給定的相位,可移動(dòng)部分的關(guān)節(jié)角θ與其關(guān)節(jié)角速度之間的關(guān)系;圖5示意性地說明將整個(gè)機(jī)器人的運(yùn)動(dòng)作為周期運(yùn)動(dòng)時(shí),為機(jī)器人的整個(gè)機(jī)器機(jī)體定義的單一的相位生成器;圖6示意性地說明將每個(gè)左腿和右腿的運(yùn)動(dòng)作為獨(dú)立的周期運(yùn)動(dòng)時(shí),分別為左腿和右腿定義的相位生成器;圖7示意性地說明將下部肢體和包括上部肢體和軀干的其它部分的每個(gè)部分的運(yùn)動(dòng)作為獨(dú)立的周期運(yùn)動(dòng)時(shí),分別為下部肢體和包括上部肢體和軀干的其它部分定義的相位生成器;圖8示意性地說明將左腿、右腿和包括上部肢體和軀干的其它部分的每個(gè)部分的運(yùn)動(dòng)作為獨(dú)立的周期運(yùn)動(dòng)時(shí),分別為每個(gè)部分定義的相位生成器;圖9示意性地說明將左腿、右腿、左臂、右臂、軀干和頭的每個(gè)部分的運(yùn)動(dòng)作為獨(dú)立的周期運(yùn)動(dòng)時(shí),分別為每個(gè)部分定義的相位生成器;圖10示意性地說明將每個(gè)關(guān)節(jié)的運(yùn)動(dòng)作為獨(dú)立的周期運(yùn)動(dòng)時(shí),分別為每個(gè)關(guān)節(jié)定義的相位生成器;圖11示意性地說明通過協(xié)調(diào)可移動(dòng)部分的控制參數(shù),為實(shí)現(xiàn)整個(gè)機(jī)器人的協(xié)調(diào)運(yùn)動(dòng)的裝置;圖12示意性地說明本發(fā)明一個(gè)實(shí)施例中有腿和站立的可動(dòng)人形機(jī)器人100的透視前視圖;圖13示意性地說明本發(fā)明一個(gè)實(shí)施例中有腿和站立的可動(dòng)人形機(jī)器人100的透視后視圖;圖14示意性地圖示有腿的可動(dòng)機(jī)器人100具有的每個(gè)關(guān)節(jié)的自由度;圖15示意性地說明有腿的可動(dòng)機(jī)器人100的控制系統(tǒng)的配置;圖16示意性地說明Matsuoka的神經(jīng)振蕩器模型;圖17示意性地說明采用DB的用于CPG誘導(dǎo)現(xiàn)象的實(shí)驗(yàn)性硬件;圖18示意性地說明在與環(huán)境交互作用下,通過在徑向平面兩足模型的每個(gè)關(guān)節(jié)處布置神經(jīng)振蕩器,如何產(chǎn)生自主行走;圖19示意性說明行走運(yùn)動(dòng)的三個(gè)狀態(tài);圖20圖示類似圓規(guī)狀的兩足模型;圖21示意性說明神經(jīng)振蕩器和關(guān)聯(lián)數(shù);圖22示意性說明作為實(shí)驗(yàn)性硬件使用的機(jī)器人機(jī)器機(jī)體的連接部分;圖23示意性說明反饋路徑;圖24示意性說明為前后腿替換目標(biāo)角的值;圖25示意性說明轉(zhuǎn)換LM輸出的符號(hào)并輸入到SW;圖26表示說明正常行走運(yùn)動(dòng)的測(cè)量結(jié)果的曲線;圖27是示意性的機(jī)器人左側(cè)髖關(guān)節(jié)的相平面視圖;圖28是表示穩(wěn)定輸入值C、行走速度/機(jī)械能消耗/移動(dòng)效率的無次元值和傳送能量之間關(guān)系的曲線圖;圖29是表示通過將腿的長(zhǎng)度/質(zhì)量標(biāo)準(zhǔn)化得到的關(guān)節(jié)最大力矩與采用通常的目標(biāo)ZMP標(biāo)準(zhǔn)得到的值相比較得出的結(jié)果的圖表;圖30示意性說明基于適當(dāng)縮放由學(xué)習(xí)人類行走運(yùn)動(dòng)以及采用在相位振蕩器基礎(chǔ)上形成的簡(jiǎn)單具有有限周期的有節(jié)奏運(yùn)動(dòng)而得到的運(yùn)動(dòng)的比例,所產(chǎn)生的機(jī)器人行走運(yùn)動(dòng),并將該運(yùn)動(dòng)局部加權(quán)回歸作為CPG模型;圖31示意性說明具有平面五段的兩足機(jī)器人的模型;圖32示意性說明對(duì)學(xué)習(xí)的運(yùn)動(dòng)軌跡進(jìn)行的變化;圖33示意性和概念性說明根據(jù)本發(fā)明的實(shí)施例的機(jī)器人的控制系統(tǒng);圖34是表示從采集的數(shù)據(jù)得到的右腿從一個(gè)接觸點(diǎn)到下一個(gè)接觸點(diǎn)的關(guān)節(jié)角和運(yùn)動(dòng)周期的圖表;圖35是表示運(yùn)動(dòng)學(xué)習(xí)基元的學(xué)習(xí)人類行走軌跡的一些結(jié)果的圖表;圖36是表示在運(yùn)動(dòng)學(xué)習(xí)基元的輸出中t為0到20的情況下,目標(biāo)關(guān)節(jié)軌跡和機(jī)器人關(guān)節(jié)軌跡的圖表;圖37圖示在兩個(gè)行走周期中(四步),機(jī)器人左腿目標(biāo)關(guān)節(jié)軌跡、關(guān)節(jié)軌跡和腿的接觸時(shí)間的圖表;圖38圖示關(guān)節(jié)力矩命令值;圖39示意性說明機(jī)器人如何在穩(wěn)定狀態(tài)行走;圖40示意性說明兩個(gè)耦合的相位振蕩器的動(dòng)態(tài)特性;圖41圖示行走仿真的一些結(jié)果的圖表;圖42示意性說明基于擺動(dòng)腿是由自由振蕩擺動(dòng)的假設(shè),具有不同長(zhǎng)度的兩個(gè)單獨(dú)擺體的運(yùn)動(dòng);圖43示意性說明相位振蕩器和相位復(fù)位機(jī)構(gòu);圖44示意性說明使用兩腿可動(dòng)機(jī)器人足底切換的相位估計(jì)機(jī)制;圖45示意性說明按照連續(xù)交互作用的相位復(fù)位機(jī)制;圖46圖表表示示范性相位響應(yīng)曲線;圖47示意性說明誘導(dǎo)不等式;圖48示意性說明在相位響應(yīng)曲線上尋找靜態(tài)解決方案的穩(wěn)定性的操作;圖49示意性說明在兩個(gè)相位生成器之間應(yīng)用互相離散信號(hào)的誘導(dǎo);圖50圖表表示互相誘導(dǎo)的不等式;圖51示意性說明具有通過支撐桿約束到兩維平面的五段的兩腿可動(dòng)機(jī)器人;圖52示意性說明圖51所示的真正的機(jī)器人的狀態(tài)變化;圖53圖表表示一個(gè)實(shí)施例得到的行走中的關(guān)節(jié)角軌跡;圖54圖表表示一個(gè)實(shí)施例得到的輸出力矩軌跡;圖55示意性說明最終得到的記錄的行走樣本;圖56示意性說明采用貓的動(dòng)物實(shí)施例;圖57示意性說明具有簡(jiǎn)單的3段配置的遠(yuǎn)程機(jī)器人模型;圖58示意性說明行走軌跡生成模型;圖59示意性說明學(xué)習(xí)(左)狀態(tài)定義和行為(右)定義;圖60圖表說明在學(xué)習(xí)期間(第25次練習(xí))的實(shí)驗(yàn)性行走軌跡;圖61圖表表示在學(xué)習(xí)期間之后的穩(wěn)定行走軌跡;圖62圖表表示在一個(gè)仿真中,當(dāng)機(jī)器人行走50步時(shí),特定值的變化;
圖63圖表表示在正常的行走運(yùn)動(dòng)中的測(cè)試結(jié)果;圖64示意性說明機(jī)器人左側(cè)髖關(guān)節(jié)的相平面視圖;圖65圖表表示涉及相位復(fù)位和不涉及相位復(fù)位的測(cè)試的比較;圖66A和66B表示施加外力作為外部干擾的響應(yīng)實(shí)例;圖67表示在最前一行的學(xué)習(xí)之前的行走軌跡和30次練習(xí)之后的中間行的行走軌跡;圖68表示在每次練習(xí)中累積的獎(jiǎng)勵(lì);圖69表示仿真得到的值函數(shù);圖70表示機(jī)器人在學(xué)習(xí)之前的行走運(yùn)動(dòng);圖71表示機(jī)器人在學(xué)習(xí)之后的行走運(yùn)動(dòng);圖72表示應(yīng)用真實(shí)的硬件進(jìn)行實(shí)驗(yàn)所得到的值函數(shù)結(jié)果;圖73表示每次實(shí)驗(yàn)的Jacobian矩陣的平均本征值。
具體實(shí)施例方式
在此將參考附圖詳細(xì)描述本發(fā)明。
A.機(jī)器人的配置圖12和13是本發(fā)明的一個(gè)實(shí)施例的有腿的站立可動(dòng)類人機(jī)器人100的示意性透視前視圖和后視圖。如圖所示,有腿的可動(dòng)機(jī)器人100具有能被驅(qū)動(dòng)以進(jìn)行移動(dòng)操作的軀干部分、頭部、左右上肢和左右下肢。機(jī)器機(jī)體(machinebody)的操作是由控制部分(未示出)進(jìn)行控制的,控制部分通常安置在軀干中。
每個(gè)下肢具有大腿部分、膝蓋部分、小腿部分、踝、腳背,實(shí)質(zhì)上與軀干部分的下端通過髖關(guān)節(jié)連接。每個(gè)上肢包括上臂、肘和前臂,通過肩關(guān)節(jié)與相應(yīng)的軀干部分的上部側(cè)邊緣相連接。頭部實(shí)質(zhì)上通過頸關(guān)節(jié)與軀干部分的中央頂端連接。
控制部分是個(gè)腔,包含用于處理來自驅(qū)動(dòng)控制和有腿可動(dòng)機(jī)器人100的每個(gè)關(guān)節(jié)致動(dòng)器的傳感器(在后面將詳細(xì)描述)的外部輸入的控制器(主控制部分)、供電電路和其它外圍設(shè)備。控制部分可另外包含一個(gè)或多于一個(gè)通信接口和用于遠(yuǎn)程控制目的的通信設(shè)備。
具有上述配置的有腿的可動(dòng)機(jī)器人100在控制部分對(duì)整個(gè)機(jī)體的協(xié)調(diào)行動(dòng)控制下,能夠用兩條腿行走。這種兩腿行走是通過重復(fù)一個(gè)行走周期來實(shí)現(xiàn)的。上述行走周期通常劃分為下述的運(yùn)動(dòng)周期。
1)左腿的單腿支撐周期,右腿舉起2)雙腿支撐周期,右腿在地面上3)右腿的單腿支撐周期,左腿舉起4)雙腿支撐周期,左腿在地面上有腿的可動(dòng)機(jī)器人100的行走通常由預(yù)先設(shè)計(jì)每個(gè)下肢的目標(biāo)軌跡、應(yīng)用ZMP作為穩(wěn)定性標(biāo)準(zhǔn)及在每個(gè)上述周期修改計(jì)劃的軌跡來控制。在雙腿支撐周期,中止修改每個(gè)下肢軌跡的操作,通過對(duì)設(shè)計(jì)的軌跡使用整個(gè)修改參量,修改髖部的高度到一個(gè)常值。在單腿支撐周期,生成修改軌跡,使得恢復(fù)已修改的每條腿的踝和髖的相關(guān)位置關(guān)系,并使其與設(shè)計(jì)的軌跡相匹配。
另外,有可能將至少部分有腿可動(dòng)機(jī)器人100的可移動(dòng)部分,例如左腿和右腿,作為物理振蕩器,并基于傳感器的輸出,根據(jù)得到的內(nèi)部狀態(tài)和外部環(huán)境,通過數(shù)學(xué)運(yùn)算生成物理振蕩器的相位,從而實(shí)現(xiàn)廣義上說的機(jī)器機(jī)體的穩(wěn)定性,并使其適應(yīng)地響應(yīng)任何未知的外部干擾。
圖14示意性說明有腿可動(dòng)機(jī)器人100設(shè)置的每個(gè)關(guān)節(jié)的自由度。如圖14所示,有腿可動(dòng)機(jī)器人100的結(jié)構(gòu)為具有包括兩個(gè)上臂和頭部1的上肢、包括兩條腿用于實(shí)現(xiàn)移動(dòng)運(yùn)動(dòng)的下肢以及連接上肢和下肢的軀干部分。簡(jiǎn)要地說,有腿的可動(dòng)機(jī)器人100具有多個(gè)肢體。
支撐頭部的頸關(guān)節(jié)有由頸關(guān)節(jié)搖擺(yaw)軸1、第一和第二頸關(guān)節(jié)傾斜(pitch)軸2a和2b、及頸關(guān)節(jié)滾動(dòng)軸3提供的三個(gè)自由度。
每條胳膊具有肩關(guān)節(jié)傾斜軸4、肩關(guān)節(jié)滾動(dòng)軸5、上臂搖擺軸6、肘關(guān)節(jié)傾斜軸7、腕關(guān)節(jié)搖擺軸8和手部,用于提供自由度。手部實(shí)際是多關(guān)節(jié)的結(jié)構(gòu),包括多個(gè)手指,并具有自由度。
軀干部分具有兩個(gè)自由度,由軀干傾斜軸9和軀干滾動(dòng)軸10提供。
下肢的每條腿具有髖關(guān)節(jié)搖擺軸11、髖關(guān)節(jié)傾斜軸12、髖關(guān)節(jié)滾動(dòng)軸13、膝關(guān)節(jié)傾斜軸14、踝關(guān)節(jié)傾斜軸15、踝關(guān)節(jié)滾動(dòng)軸16和腳。
然而,如果有腿的可動(dòng)機(jī)器人100設(shè)計(jì)用于娛樂,機(jī)器人不必具有上述所有的自由度。機(jī)器人也不限于上述所列的自由度。不消說,根據(jù)在設(shè)計(jì)和生產(chǎn)階段中的限制條件和規(guī)格要求,可以增加或減少自由度或關(guān)節(jié)的數(shù)目。
本實(shí)施例的有腿可動(dòng)機(jī)器人100的重心布置在髖部。因此,髖部是在姿態(tài)穩(wěn)定性控制中的重要對(duì)象,并作為機(jī)器人的“基本身體部分”進(jìn)行操作。
圖15示意性說明了有腿可動(dòng)機(jī)器人100的控制系統(tǒng)的配置。如圖15所示,有腿可動(dòng)機(jī)器人100包括對(duì)應(yīng)于人類四肢的機(jī)構(gòu)單元30、40、50R/L和60R/L,以及自適應(yīng)控制機(jī)構(gòu)單元以實(shí)現(xiàn)機(jī)器人的協(xié)調(diào)運(yùn)動(dòng)的控制單元80(R和L是分別代表右和左的后綴)。
整個(gè)有腿可動(dòng)機(jī)器人100的運(yùn)動(dòng)由控制單元80全面控制??刂茊卧?0包括主控制部分81,其包括CPU(中央處理器),其它主電路部件,例如內(nèi)存(沒有示出);和包括供電電路和接口(沒有示出)的外圍電路82,控制單元80通過上述接口與不同的部件交換數(shù)據(jù)和指令。
外圍電路82包括安裝在機(jī)器機(jī)體上的外圍設(shè)備、通過電纜及無線電波與機(jī)器機(jī)體相連接的外部外圍設(shè)備、和用于電連接充電站(未示出)和其它外圍設(shè)備的接口連接器。
當(dāng)實(shí)現(xiàn)本發(fā)明時(shí),中央處理器80的安裝位置并不受任何特定的限制。雖然在圖15中,它是安裝在軀干單元40中,但是它也可選的安裝在頭部單元30。同樣可選的,控制單元80可以布置在有腿可動(dòng)機(jī)器人100的外部,從而與有腿可動(dòng)機(jī)器人100的機(jī)器機(jī)體通過有線或無線的方式進(jìn)行通信。
表示在圖14中的有腿可動(dòng)機(jī)器人100的每個(gè)關(guān)節(jié)的自由度是由非常多的致動(dòng)器來實(shí)現(xiàn)的。具體地說,頸關(guān)節(jié)搖擺軸致動(dòng)器A1、頸關(guān)節(jié)傾斜軸致動(dòng)器A2和頸關(guān)節(jié)滾動(dòng)軸致動(dòng)器A3設(shè)置在頭部單元30,分別用于頸關(guān)節(jié)搖擺軸1、頸關(guān)節(jié)傾斜軸2和頸關(guān)節(jié)滾動(dòng)軸3。
軀干單元40設(shè)置有軀干傾斜軸致動(dòng)器A9和軀干滾動(dòng)軸致動(dòng)器A10,分別用于軀干傾斜軸9和軀干滾動(dòng)軸10。
胳膊單元50R/L分別包括上臂單元51R/L、肘關(guān)節(jié)單元52R/L和前臂單元53R/L,它們中每個(gè)均設(shè)置有肩關(guān)節(jié)傾斜軸致動(dòng)器A4、肩關(guān)節(jié)滾動(dòng)軸致動(dòng)器A5、上臂搖擺軸致動(dòng)器A6、肘關(guān)節(jié)傾斜軸致動(dòng)器A7、腕關(guān)節(jié)搖擺軸致動(dòng)器A8,分別用于肩關(guān)節(jié)傾斜軸4、肩關(guān)節(jié)滾動(dòng)軸5、上臂搖擺軸6、肘關(guān)節(jié)傾斜軸7和腕關(guān)節(jié)搖擺軸8。
腿單元60R/L分別包括大腿單元61R/L、膝蓋單元62R/L和小腿單元63R/L,它們中每個(gè)均設(shè)置有髖關(guān)節(jié)搖擺軸致動(dòng)器A11、髖關(guān)節(jié)傾斜軸致動(dòng)器A12、髖關(guān)節(jié)滾動(dòng)軸致動(dòng)器A13、膝關(guān)節(jié)傾斜軸致動(dòng)器A14、踝關(guān)節(jié)傾斜軸致動(dòng)器A15、踝關(guān)節(jié)滾動(dòng)軸致動(dòng)器A16,分別用于髖關(guān)節(jié)搖擺軸11、髖關(guān)節(jié)傾斜軸12、髖關(guān)節(jié)滾動(dòng)軸13、膝關(guān)節(jié)傾斜軸14、踝關(guān)節(jié)傾斜軸15和踝關(guān)節(jié)滾動(dòng)軸16。
分別布置在相應(yīng)的關(guān)節(jié)軸上的每個(gè)致動(dòng)器A1、A2、A3,...最好是緊湊型的致動(dòng)器,其直接耦合到傳動(dòng)裝置(gear)上,并以一個(gè)芯片的形式出現(xiàn),從而可以安裝在電機(jī)單元中。
機(jī)械單元包括頭部單元30、軀干單元40、胳膊單元50和腿單元60,分別設(shè)置有輔助控制部分35、45、55、65,用于控制驅(qū)動(dòng)致動(dòng)器的操作。
機(jī)器機(jī)體的軀干部分40提供有加速度傳感器95和姿態(tài)傳感器96。通常為X、Y和Z軸布置加速度傳感器95。當(dāng)加速度傳感器95布置在機(jī)器機(jī)體的髖部時(shí),有可能選擇髖部(其是需要大量的處理量的部件)作為控制目標(biāo),直接研究部件的姿態(tài)和加速度,從而應(yīng)用ZMP控制姿態(tài)穩(wěn)定性。
每條腿60R和60L設(shè)置有一個(gè)或多于一個(gè)的觸地(touch down)確認(rèn)傳感器91或92,以及一個(gè)或多于一個(gè)的加速度傳感器93或94,只要它們適合即可。接觸確認(rèn)傳感器91和92為壓力傳感器,安裝到相應(yīng)的足底,根據(jù)有或沒有地面的反作用力,來檢測(cè)有腿可動(dòng)機(jī)器人100的足底中的一個(gè)或兩個(gè)是否接觸地面。因此,有可能檢測(cè)兩腿支撐周期和單腿支撐周期,并估計(jì)作為物理振蕩器進(jìn)行操作的每個(gè)可動(dòng)腿的相位和角頻率ω。
加速度傳感器93和94布置在X和Y軸。由于左右腳提供有加速度傳感器93和94,有可能將最接近ZMP位置的腳直接用ZMP等式表示。
主控制部分80根據(jù)機(jī)器人100的內(nèi)部狀態(tài)和外部環(huán)境,按照傳感器91到93的輸出,控制姿態(tài)穩(wěn)定性。尤其是,它適于控制輔助控制部分35、45、55、65,從而以協(xié)調(diào)的方式驅(qū)動(dòng)上肢、軀干和下肢。姿態(tài)穩(wěn)定性控制的第一技術(shù)為設(shè)計(jì)一個(gè)運(yùn)動(dòng),從而可應(yīng)用ZMP作為標(biāo)準(zhǔn)為目標(biāo)ZMP控制在每個(gè)時(shí)刻建立動(dòng)態(tài)平衡。姿態(tài)穩(wěn)定性控制的第二技術(shù)為通常在行走運(yùn)動(dòng)過程中,提取至少部分機(jī)器機(jī)體,例如可動(dòng)的腿的周期運(yùn)動(dòng),并根據(jù)內(nèi)部狀態(tài)和外部環(huán)境,為該周期運(yùn)動(dòng)生成相位信號(hào),從而根據(jù)該相位信號(hào)驅(qū)動(dòng)并控制可移動(dòng)部分。
B.根據(jù)生物學(xué)原理的兩足運(yùn)動(dòng)本發(fā)明的發(fā)明人為了實(shí)現(xiàn)基于信息處理技術(shù)的類人機(jī)器人,一直在研究人類的行為,該信息處理技術(shù)類似于人類信息處理技術(shù)。在對(duì)人類信息處理系統(tǒng)的深入研究,并發(fā)現(xiàn)人類兩足運(yùn)動(dòng)的生物學(xué)原理的基礎(chǔ)上,本發(fā)明人已經(jīng)開發(fā)出驅(qū)動(dòng)機(jī)器人以類似于人的、平穩(wěn)和自然的方式行走的技術(shù)。其將在下面詳細(xì)進(jìn)行描述。在本專利文獻(xiàn)中,主要討論下面的三個(gè)主題。
(1)CPG(中央模式生成器)和兩足運(yùn)動(dòng)特性近些年進(jìn)行的應(yīng)用神經(jīng)振蕩器的關(guān)于CPG的研究已經(jīng)實(shí)現(xiàn)了理想的周期運(yùn)動(dòng),并且已經(jīng)通過實(shí)驗(yàn)發(fā)現(xiàn)周期運(yùn)動(dòng)的一些特性。然而,為應(yīng)用CPG實(shí)現(xiàn)兩足運(yùn)動(dòng)所必須的周期運(yùn)動(dòng)的基本特性仍然不清楚。CPG的特性對(duì)于應(yīng)用本專利文獻(xiàn)中描述的CPG來實(shí)現(xiàn)兩足運(yùn)動(dòng)是不可缺少的。本發(fā)明的申請(qǐng)人已利用神經(jīng)振蕩器,通過CPG成功實(shí)現(xiàn)了小型兩足機(jī)器人的期望行走運(yùn)動(dòng)。
(2)兩足運(yùn)動(dòng)的基本原理本發(fā)明的申請(qǐng)人一直在從物理和數(shù)學(xué)的角度尋找行走的基本元素,以發(fā)展用于領(lǐng)會(huì)和控制行走的動(dòng)態(tài)技術(shù)。在本專利文獻(xiàn)中,將描述關(guān)于生成周期運(yùn)動(dòng)的基于非線性動(dòng)態(tài)系統(tǒng)的一個(gè)新的CPG概念以及它的有效性。
(3)行走學(xué)習(xí)控制方法下面將詳細(xì)描述使更高層元件的多個(gè)估計(jì)標(biāo)準(zhǔn)能用于行走控制器的學(xué)習(xí)技術(shù)。在該技術(shù)框架內(nèi),學(xué)習(xí)行走狀態(tài)和行走周期的轉(zhuǎn)化。另外,將描述用于生成穩(wěn)定的行走軌跡,同時(shí)實(shí)現(xiàn)既穩(wěn)固又有效的學(xué)習(xí)技術(shù)。根據(jù)本發(fā)明,通過行走學(xué)習(xí)控制方法,類人機(jī)器人可實(shí)現(xiàn)類似于人類的靈巧的行走運(yùn)動(dòng)。
下面將按照下列項(xiàng)目描述本發(fā)明的一個(gè)實(shí)施例。
1.關(guān)于CPG(中央模式生成器)基本特性的學(xué)習(xí)應(yīng)用神經(jīng)振蕩器的兩足運(yùn)動(dòng)2.行走的基本原理學(xué)習(xí)人類行走,應(yīng)用基本運(yùn)動(dòng)和自適應(yīng)3.學(xué)習(xí)行走控制利用基于模型強(qiáng)化學(xué)習(xí)的一種兩足運(yùn)動(dòng)的有效的學(xué)習(xí)算法B-1.應(yīng)用神經(jīng)振蕩器的兩足運(yùn)動(dòng)本發(fā)明申請(qǐng)人的根本目標(biāo)是建立一種可以代替?zhèn)鹘y(tǒng)的目標(biāo)ZMP控制方法的非基于模型的兩足運(yùn)動(dòng)控制方法。基于ZMP標(biāo)準(zhǔn)的傳統(tǒng)方法是通過采用控制工程技術(shù)以便簡(jiǎn)化及隨后通過分析得到答案形成的很通用的方法。換句話說,它需要為機(jī)器人和環(huán)境產(chǎn)生精確的設(shè)計(jì)模型。結(jié)果就是,機(jī)器人硬件需要高度精確性。另外,數(shù)學(xué)地得出的機(jī)器人運(yùn)動(dòng)與人類得行走方式有明顯不同。認(rèn)識(shí)到這些問題,本發(fā)明申請(qǐng)人根據(jù)將在下面描述的從運(yùn)動(dòng)生理學(xué)、頭顱神經(jīng)科學(xué)和計(jì)算機(jī)獲得的知識(shí),研究出一種“實(shí)現(xiàn)非常接近人類行走的行走的行走控制方法”。在本章,將關(guān)注中央模式生成器(CPG),它是一種存在于生物脊髓中的節(jié)律生成器,應(yīng)用神經(jīng)振蕩器對(duì)其進(jìn)行建模,以理解它的特性并試圖將其應(yīng)用于真實(shí)硬件。
B-1-1.中央模式生成器(CPG)特性B-1-1-1.實(shí)驗(yàn)證明,生命體在脊髓[1]中具有被稱為CPG的節(jié)律(rhythm)生成器。頻繁引用的示例包括關(guān)于七鰓鰻的推動(dòng)運(yùn)動(dòng)的實(shí)驗(yàn),以及關(guān)于被切除大腦的貓的行走運(yùn)動(dòng),上述七鰓鰻是一種鰻魚并且最原始的魚類之一。后者為驅(qū)動(dòng)貓的實(shí)驗(yàn),那些貓的大腦和脊髓被分割開,讓其在腳踏器(treadmill)上走,同時(shí)改變腳踏器的速度。已知切除大腦的貓會(huì)根據(jù)速度改變它們的行走模式。這些實(shí)驗(yàn)說明控制貓的行走運(yùn)動(dòng)的不是大腦,而是在貓的脊髓中有一種節(jié)律生成器,它的操作由某種傳感器反饋來調(diào)節(jié)(例如,接觸信息)。
當(dāng)單獨(dú)取出脊髓神經(jīng)時(shí),它表現(xiàn)出動(dòng)搖不定的刺激,而沒有在行走運(yùn)動(dòng)中觀察到的任何傳感器輸入。因此,堅(jiān)定地相信在脊髓神經(jīng)中存在有節(jié)律生成器,其獨(dú)立于大腦和傳感器信息固有地振蕩。這種節(jié)律生成器被稱為CPG(雖然人類是否有CPG仍然是討論的主題,但從下述報(bào)告認(rèn)為人類身體中存在固有的節(jié)律生成器,即報(bào)告顯示小孩子應(yīng)用左腿和右腿表現(xiàn)出節(jié)律性的步進(jìn)運(yùn)動(dòng),當(dāng)被外界暫停,并且成長(zhǎng)受到阻礙的人在被向其脊髓施加周期性的電刺激時(shí),表現(xiàn)出改進(jìn)的恢復(fù)效果。)B-1-1-2.通常將Matsuoka的神經(jīng)振蕩器模型用作神經(jīng)振蕩器CPG(見圖16)[2]。在圖16中,x1、x2、v1、v2是變量,c、β、γ、τ1、τ2為常數(shù),而g是輸入、y是輸出。因此,振蕩的時(shí)間常數(shù)和輸出波形的輪廓由τ1和τ2來確定。注意,時(shí)間并不肯定表示在下面的公式中。
τ1x·1=c-x1-βv1-γ[x2]+-Σhj[gj]+]]>τ2v·1=[x1]+-v1]]>τ1x·2=c-x2-βv2-γ[x1]+-Σhj[gj]-]]>τ2v·2=[x2]+-v2]]>youtput=[x1]+-[x2]+參考上述公式,振蕩器的波形和頻率由τ1和τ2確定。c的值是控制幅值的參數(shù)。c作為恒定的輸入,確定輸出的幅值。由于很難分析性地確定輸出,在公式中表示為一個(gè)特定的數(shù)據(jù)值[3]。
神經(jīng)振蕩器以固有頻率ωn振蕩,ωn由τ1和τ2確定,與輸入g無關(guān)。如果有具有充分的振幅和頻率接近ωn的輸入g,輸出以恒定的相位關(guān)系相對(duì)于輸入是固定的。換句話說,出現(xiàn)“誘導(dǎo)(entrainment)現(xiàn)象”。這是神經(jīng)振蕩器的最典型的特性。
B-1-1-3.應(yīng)用DB的實(shí)驗(yàn)應(yīng)用命名為動(dòng)態(tài)大腦(DB)的類人機(jī)器人進(jìn)行實(shí)驗(yàn)(1)yoyo(上下移動(dòng))運(yùn)動(dòng),(2)(卷簧的)slinky(體態(tài))運(yùn)動(dòng),以定性地理解由CPG引起的誘導(dǎo)。實(shí)際上,首先采用DB模擬器將CPG安裝到位,由實(shí)際機(jī)器來驗(yàn)證結(jié)果(見圖17)。為了模擬yoyo運(yùn)動(dòng),用肘部的垂直往復(fù)運(yùn)動(dòng)振蕩一個(gè)具有一個(gè)自由度的彈簧質(zhì)量(spring-mass)系統(tǒng)。利用手腕的力矩作為CPG的輸入,肘部的角度用作它的輸出(因?yàn)閷⒊錆M水的瓶子作為重量,將橡膠繩作為彈簧,因此涉及非線性)。相比于應(yīng)用正旋波形來驅(qū)動(dòng),觀察到具有恒定幅值的快速誘導(dǎo)。確認(rèn)當(dāng)質(zhì)量和彈簧常數(shù)在一定范圍內(nèi)變化時(shí),發(fā)生誘導(dǎo)。也進(jìn)行繼續(xù)slinky(其是彈簧玩具)振蕩的振蕩實(shí)驗(yàn)。觀察到當(dāng)手腕力矩的幅值減小時(shí),slinky如何停止振蕩,以及它如何適應(yīng)性地調(diào)整自己,以在周期中改變。無論如何,要注意下列項(xiàng)目。
(1)神經(jīng)振蕩器的吸引池(basin of attraction)并不是很寬如參考文獻(xiàn)[3]所述,只有在接近神經(jīng)振蕩器的固有頻率的范圍內(nèi)才會(huì)發(fā)生誘導(dǎo)。在yoyo運(yùn)動(dòng)的情況下,當(dāng)質(zhì)量在200g到500g的范圍內(nèi)(對(duì)應(yīng)于大約固有頻率的±20%的差)時(shí),觀察到誘導(dǎo),但在超過這個(gè)范圍時(shí)則很難確保穩(wěn)定的振蕩。換句話說,需要預(yù)先進(jìn)行一定程度的建模。實(shí)際上,振蕩器的時(shí)間常數(shù)是預(yù)先從彈簧質(zhì)量系統(tǒng)的固有頻率確定的,并定義為參考值。Kotosaka等人為了擴(kuò)大誘導(dǎo)的范圍,采用類似于鎖相環(huán)(PLL)技術(shù)的技術(shù)改變了時(shí)間常數(shù)[4]。
(2)反饋信號(hào)的幅值振蕩器的輸入和輸出分別是力矩和關(guān)節(jié)角。由于要結(jié)合不同尺寸的值,因此需要某種標(biāo)準(zhǔn)化。DB的力矩傳感器表示偏移和死區(qū),因此不能使用模擬器得到的值。換句話說,要得到相應(yīng)的值,實(shí)驗(yàn)是不可缺少的。當(dāng)應(yīng)用肘部的力矩作為反饋信號(hào)進(jìn)行實(shí)驗(yàn)時(shí),由于肘部的垂直往復(fù)運(yùn)動(dòng)而產(chǎn)生的前臂部分的慣性力矩在彈簧減震系統(tǒng)的力的波動(dòng)中重疊,因此不可能保持振蕩器刺激。盡管可通過應(yīng)用反轉(zhuǎn)動(dòng)態(tài)特性來減少解決這個(gè)問題,還是需要精確的模型。也可以通過反饋模擬器上的重疊的絕對(duì)速度來進(jìn)行振蕩器實(shí)驗(yàn)。盡管由于這種布置完全消除了機(jī)體的動(dòng)態(tài),而能觀察到高度穩(wěn)定的誘導(dǎo),但由于需要外部傳感器,還沒有在實(shí)際機(jī)器上進(jìn)行實(shí)驗(yàn)。
(3)反饋信號(hào)的相位盡管可以容易地確定神經(jīng)振蕩器的誘導(dǎo),但帶來了如何形成目標(biāo)限制周期的問題。在成功的情形下,目標(biāo)被激勵(lì),這可通過“當(dāng)施加大力矩時(shí)抬高肘部”來實(shí)現(xiàn)。相反的,如果目標(biāo)是限制振蕩激勵(lì),則僅需要反轉(zhuǎn)反饋信號(hào)的符號(hào)。這可在模擬器上證實(shí)。然而,依據(jù)任務(wù),可能需要固定相位90度,那么應(yīng)用單一的神經(jīng)振蕩器是不可行的。Miyakoshi等人提出了一種應(yīng)用四個(gè)神經(jīng)元的自動(dòng)相位調(diào)節(jié)機(jī)構(gòu)。
B-1-2 應(yīng)用于兩足運(yùn)動(dòng)在本部分中,將簡(jiǎn)要介紹在先技術(shù),并討論在控制實(shí)際的機(jī)器人時(shí)帶來的問題,以探討應(yīng)用神經(jīng)振蕩器的兩足運(yùn)動(dòng)。
將CPG應(yīng)用到兩足運(yùn)動(dòng)起始于Taga[6,7,8]的先驅(qū)研究。Taga主張一種觀念,稱為球形誘導(dǎo),其與依靠控制工程的關(guān)于行走的傳統(tǒng)研究相對(duì)立。根據(jù)傳統(tǒng)的工程方法,認(rèn)為機(jī)器人是控制的目標(biāo)并對(duì)其進(jìn)行建模,以便在開始標(biāo)稱的運(yùn)動(dòng)目標(biāo)軌跡后,控制機(jī)器人,將機(jī)器人的實(shí)際運(yùn)動(dòng)與標(biāo)稱的軌跡之間的誤差最小化。在環(huán)境和那些機(jī)器人參數(shù)的任何變化都被認(rèn)為是來自標(biāo)稱狀態(tài)或外部干擾的諸多誤差。從控制方的角度,這些變化被認(rèn)為是“不希望的,因?yàn)樗鼈兪箼C(jī)器人離開標(biāo)稱狀態(tài)”。根據(jù)生物進(jìn)行類推,認(rèn)為神經(jīng)系統(tǒng)=控制系統(tǒng)和肌肉骨骼系統(tǒng)=非控制系統(tǒng)的關(guān)系為真。換句話說,認(rèn)為神經(jīng)系統(tǒng)控制肌肉骨骼系統(tǒng),并發(fā)出指令使對(duì)于標(biāo)稱狀態(tài)的誤差達(dá)到最小。傳送ZMP控制也基于同樣的觀點(diǎn)。相反,Taga從他的神經(jīng)生理學(xué)發(fā)現(xiàn)“神經(jīng)系統(tǒng)和肌肉骨骼系統(tǒng)被描述為動(dòng)態(tài)的系統(tǒng),并且在同一層面上互相作用”出發(fā),主張“限制周期吸引物形成在拓?fù)淇臻g,該空間是由神經(jīng)系統(tǒng)和肌肉骨骼系統(tǒng)通過節(jié)律誘導(dǎo)組合形成,并對(duì)應(yīng)于穩(wěn)定的柔性行走的產(chǎn)生”。他將該現(xiàn)象稱為球形誘導(dǎo),通過該誘導(dǎo)改變了環(huán)境,改變了肌肉骨骼系統(tǒng)和參與行走產(chǎn)生的物理系統(tǒng)和控制系統(tǒng)的所有元件。因此,與傳統(tǒng)的控制工程不同,在神經(jīng)系統(tǒng)和肌肉骨骼系統(tǒng)中不存在明確的主-從關(guān)系。如圖18所示,在徑向(sagittal)平面兩足模型的每個(gè)關(guān)節(jié)布置神經(jīng)振蕩器,在其與環(huán)境的交互作用下自主產(chǎn)生行走。他也通過仿真表示出在斜坡上如何自主調(diào)節(jié)步幅,以及通過改變神經(jīng)系統(tǒng)行動(dòng)等級(jí)(輸出力矩幅值和參數(shù)穩(wěn)定輸入值c),將行走模式自然的從走變?yōu)榕堋?br>
同時(shí),盲目地定義一個(gè)神經(jīng)振蕩器是不可能生成行走運(yùn)動(dòng)的。根據(jù)神經(jīng)生理學(xué),Taga定義了神經(jīng)振蕩器的布置和組合及傳感器反饋路徑。這里的問題是如何發(fā)現(xiàn)這些組合及如何對(duì)它們進(jìn)行加權(quán)。從上面描述的DB實(shí)驗(yàn)可以看到,盡管很容易形成某種或其它的限制周期,但很難形成任務(wù)特有的限制周期。尤其是,當(dāng)神經(jīng)振蕩器的輸入包含所有的肌肉骨骼系統(tǒng)和環(huán)境的交互作用時(shí),不可能分析性地解決這個(gè)問題。Taga在反復(fù)實(shí)驗(yàn)的基礎(chǔ)上手動(dòng)調(diào)節(jié)加權(quán)系數(shù)。他在參數(shù)調(diào)整上花費(fèi)了大量時(shí)間。
遵循Taga的主張,Hase等人采用遺傳算法[9,10]優(yōu)化了手動(dòng)調(diào)節(jié)。結(jié)果是,通過應(yīng)用Taga提出的反饋路徑,有可能自動(dòng)獲得稍微簡(jiǎn)單的神經(jīng)結(jié)構(gòu)。從那時(shí)開始,Hase等人研究的技術(shù)已經(jīng)成為采用神經(jīng)振蕩器獲得行走模式的標(biāo)準(zhǔn)技術(shù)。Sato等人應(yīng)用與Taga[11]的模式相同的模式獲得了反饋加權(quán)系數(shù),盡管他得到的值與Taga定義的值不同。
總的來說,以前應(yīng)用神經(jīng)振蕩器在兩足運(yùn)動(dòng)上的研究維持在仿真水平上。就兩足運(yùn)動(dòng)而言,由于對(duì)地面的反作用力的建模不完美,及一些其它的原因,仿真器的輸出與真實(shí)硬件的輸出互相并不一致。因此,可以安全地假設(shè),上面描述的成就并不能應(yīng)用到真實(shí)的硬件上。這是為什么自從Taga在十多年之前提出他的主張以來,還沒有報(bào)道過一個(gè)成功的實(shí)驗(yàn)的主要原因。
Kimura等人所開發(fā)的四足機(jī)器人提供了采用神經(jīng)振蕩器作為CPG用于真實(shí)硬件的行走控制的一個(gè)成功的例子(12,13)。他們證明通過獨(dú)創(chuàng)地將神經(jīng)振蕩器、反射系統(tǒng)、PD伺服系統(tǒng)和狀態(tài)機(jī)結(jié)合起來,有可能使機(jī)器人在非常不平的地面上行走,盡管讓一個(gè)常規(guī)的機(jī)器人完成這樣的動(dòng)作是非常困難的。尤其是,CPG并不驅(qū)動(dòng)關(guān)節(jié),而只是根據(jù)輸出控制腿的相位、伺服增益選擇及所發(fā)生的狀態(tài)轉(zhuǎn)變。將傳感器信息輸入到神經(jīng)振蕩器,以調(diào)節(jié)腿的相位關(guān)系。盡管神經(jīng)振蕩器的輸出通常用于指揮相應(yīng)的關(guān)節(jié)力矩,但高度的運(yùn)動(dòng)性能只是通過離散地控制相位來實(shí)現(xiàn)的。盡管Kimura等人沒有提供分析性的討論,許多參數(shù)也是在研究中實(shí)驗(yàn)性選擇的,他們證明了采用CPG控制機(jī)器人的潛能。另外,這個(gè)機(jī)器人表現(xiàn)得非常象有生命的物體。Kimura等人研究的目標(biāo)是開發(fā)出能夠應(yīng)用于真實(shí)硬件的CPG控制器。因此,將在下面部分討論Kimura等人對(duì)于兩足運(yùn)動(dòng)的方法的應(yīng)用,該應(yīng)用在實(shí)驗(yàn)上得到成功。由于到目前為止,還沒有報(bào)導(dǎo)過一個(gè)應(yīng)用CPG驅(qū)動(dòng)真實(shí)的兩足機(jī)器人成功的實(shí)驗(yàn),首要的就是直觀地實(shí)現(xiàn)成功的控制器。
B-1-3.兩足運(yùn)動(dòng)仿真在這部分,作為應(yīng)用真實(shí)硬件的初級(jí)階段,討論應(yīng)用SD/Fast安裝在兩足仿真器上的不同的控制器,該控制器是由本發(fā)明的發(fā)明人開發(fā)的。首先,將描述模擬器,并討論安裝在模擬器上的控制器。
B-1-3-1.兩足模擬器本發(fā)明申請(qǐng)人開發(fā)的兩足模擬器采用通用的動(dòng)態(tài)模擬器,或SD/Fast,用于動(dòng)態(tài)計(jì)算。應(yīng)用軀干、大腿和小腿形成每條腿并且為了簡(jiǎn)化沒有踝關(guān)節(jié),并假設(shè)踝關(guān)節(jié)不參與對(duì)于行走至關(guān)重要的運(yùn)動(dòng),這是從觀察當(dāng)象常規(guī)行走一樣踩著高蹺行走而產(chǎn)生的地面反作用力的分布得出的結(jié)論。假設(shè)當(dāng)行走時(shí)每條腿的腳趾在一個(gè)點(diǎn)上與地面接觸,應(yīng)用的接觸模型是簡(jiǎn)單的彈簧/阻尼器模型??刂浦芷跒?毫秒,指令以力矩的方式發(fā)送給每個(gè)關(guān)節(jié)。然而,由于很多硬件機(jī)器人配置了PD伺服系統(tǒng),從裝配的角度將PD控制器布置在內(nèi)部,通過給出位置目標(biāo)值來控制每條腿的軌跡。假設(shè)每條腿的腳趾接觸地面,所有的狀態(tài)變量是可觀察的,并且傳感器信息沒有延遲。
B-1-3-2.狀態(tài)機(jī)首先,為了直觀地理解行走運(yùn)動(dòng),將討論采用狀態(tài)機(jī)的行走。行走運(yùn)動(dòng)分為三個(gè)狀態(tài),如圖19所示。注意,為了簡(jiǎn)化,PD增益在所有的相位中都是固定的。
參考圖19,在姿態(tài)(stance)1,從移動(dòng)方向觀察,布置在前面的腿(在此后稱為“前腿”)以雙支撐狀態(tài)彎曲,從而向前和向后移動(dòng)重心。前穩(wěn)定裕度(SM)用作觀察前腿負(fù)載的指數(shù)。由于重心位于充分接近髖關(guān)節(jié)(基礎(chǔ)機(jī)體部件)的位置,而大腿和小腿的質(zhì)量很小,為了簡(jiǎn)化,采用髖關(guān)節(jié)在地面的投影點(diǎn)與前腿接觸地面點(diǎn)之間的相對(duì)距離。定性地,將動(dòng)態(tài)結(jié)果與SM合并得到的指數(shù)為ZMP的前穩(wěn)定裕度。
由于繼續(xù)姿態(tài)1的運(yùn)動(dòng),SM落到給定值之下。然后,停止彎曲前腿,開始伸展運(yùn)動(dòng)(姿態(tài)2)。由于伸展提高了重心,將勢(shì)能施加到保持行走所必需的隨后注入的動(dòng)能。注意,伸展函數(shù)不是以時(shí)間,而是以SM來表示。換句話說,如果重心向前和向后快速移動(dòng),伸展運(yùn)動(dòng)快速進(jìn)行。在搖擺中,由于從運(yùn)動(dòng)方向觀察的布置在后腿面的腿(在后面稱為“后腿”)因繼續(xù)姿態(tài)1而離開地面,姿態(tài)1轉(zhuǎn)變?yōu)樽藨B(tài)2。在搖擺腿的軌跡上,髖關(guān)節(jié)作為SM的函數(shù)給出,膝關(guān)節(jié)作為時(shí)間的函數(shù)給出。由于大腿的質(zhì)量相對(duì)大,當(dāng)搖擺腿位于支撐腿前面時(shí),重心移動(dòng)到穩(wěn)定側(cè)以實(shí)現(xiàn)雙支撐狀態(tài)。從直觀上說,快速離開單支撐相位(phase)的行走模式能夠很容易引起跌倒情形,并通過移動(dòng)到雙支撐相位來阻止跌倒。可以證實(shí),通過在模擬器上安裝控制器使行走得到繼續(xù)。
上述算法提供如下優(yōu)越性(1)它可以容易地直觀上理解。
(2)由于不涉及基于時(shí)間的開環(huán)軌跡,它可以自適應(yīng)(對(duì)于相對(duì)小的外部干擾)。
(3)它不需要任何復(fù)雜的設(shè)計(jì)模型。
B-1-3-3.狀態(tài)機(jī)+CPG在緊靠前面的部分采用SM和接觸信息簡(jiǎn)單地切換狀態(tài)。盡管這部分信息可能不會(huì)引起模擬器的任何問題,真實(shí)的硬件可能由于傳感器噪聲和其它問題而操作不正確。因此,本發(fā)明的發(fā)明人試圖采用CPG來切換狀態(tài)。尤其是,通過采用SM位移信號(hào)作為輸入來誘導(dǎo)CPG,并只應(yīng)用CPG輸出的正或負(fù)符號(hào)來切換相位。
由于在上一部分中,只應(yīng)用SM的離散值來切換相位,當(dāng)在這部分中應(yīng)用連續(xù)的SM值時(shí),該相位估計(jì)為穩(wěn)定的??梢宰C實(shí)當(dāng)在模擬器上試驗(yàn)時(shí),可以持續(xù)行走運(yùn)動(dòng)。如果與基于狀態(tài)機(jī)的行走運(yùn)動(dòng)相比,這行走運(yùn)動(dòng)是平穩(wěn)的。但是,如果與在緊接前面部分中描述的算法相比,不可能看到包括關(guān)于參數(shù)波動(dòng)的穩(wěn)定性的令人滿意的優(yōu)點(diǎn)。這可能是因?yàn)槟M器的干凈的環(huán)境。
Kimura提出的算法提供一種優(yōu)越性,即可以估計(jì)相位,同時(shí)接觸信息可有效地反饋給CPG。例如,可另外提供維持機(jī)器人姿態(tài)的函數(shù)特性,用于在一條接觸地面的腿處于比所估計(jì)的地面水平高的情況下,通過伸展另一條腿(滾動(dòng)/傾斜緊張反射)來應(yīng)付這種情況。但是,這種反射系統(tǒng)只在四足動(dòng)物上是可行的反饋系統(tǒng),而在沒有某種或其它修改的情況下不能適用于兩足動(dòng)物。下面將描述使兩足運(yùn)動(dòng)得以繼續(xù)的傳感器反饋系統(tǒng)。
B-1-3-4.彈道(ballistic)行走+CPG在很多傳統(tǒng)的CPG方法中,神經(jīng)振蕩器布置在每個(gè)關(guān)節(jié)處,關(guān)節(jié)由力矩輸出來驅(qū)動(dòng)。從運(yùn)動(dòng)生理學(xué)的觀點(diǎn)來看,使振蕩器輸出與有反作用的肌肉相對(duì)應(yīng)是很自然的想法。從機(jī)器人工程學(xué)的觀點(diǎn)來看,這種布置是直接的運(yùn)動(dòng)學(xué)想法,并不能直觀地理解每個(gè)神經(jīng)振蕩器的輸出是如何反應(yīng)到整個(gè)系統(tǒng)上(例如,重心的高度)。如果機(jī)器人在跌倒或者沒有跌倒但調(diào)整了很多參數(shù),在整個(gè)系統(tǒng)的更高的水平例如標(biāo)準(zhǔn)水平來評(píng)估神經(jīng)振蕩器是很困難的。從機(jī)器人工程學(xué)的觀點(diǎn)來看,在這種情況下,通常的方法是采用反運(yùn)動(dòng)學(xué)。換句話說,在笛卡兒坐標(biāo)系統(tǒng)中,驅(qū)動(dòng)每個(gè)振蕩器沿X和Z方向振蕩。但是,這是完全的工程學(xué)方法,因此,并不知道這種方法是否能模擬人類的行走運(yùn)動(dòng)。(也存在硬件限制的問題。當(dāng)在模擬器上實(shí)驗(yàn)時(shí),發(fā)現(xiàn)實(shí)驗(yàn)硬件沒有完全的膝力矩,當(dāng)重心保持在一個(gè)固定的高度,并驅(qū)動(dòng)它在移動(dòng)方向前后移動(dòng)時(shí),會(huì)絆倒)。
因此,我們考慮了類似圓規(guī)的兩足,在行走時(shí)模擬人類,并在直觀上是有希望的。兩足動(dòng)物適于將腿的運(yùn)動(dòng)分解為從髖關(guān)節(jié)到相應(yīng)腿的接觸點(diǎn)的線性運(yùn)動(dòng)(LM)和圍繞髖關(guān)節(jié)的搖擺運(yùn)動(dòng)(SW)(見圖20)。
根據(jù)Miyakoshi的觀點(diǎn),有可能制造類似圓規(guī)的兩足動(dòng)物,當(dāng)施加適當(dāng)?shù)某跏妓俣冉o腿和軀干時(shí),其腿的長(zhǎng)度主動(dòng)移動(dòng),而髖關(guān)節(jié)從動(dòng)運(yùn)動(dòng),形成一個(gè)開環(huán)。同樣知道,響應(yīng)這種行走的地面的反作用力類似于人類行走所得到的反作用力。因此,LM的頻率大于SW14的三倍。根據(jù)這個(gè)發(fā)現(xiàn),本發(fā)明的發(fā)明人為行走的線性運(yùn)動(dòng)和搖擺運(yùn)動(dòng)的自由度分配CPG。
圖21示意性地說明神經(jīng)振蕩器的布置和關(guān)聯(lián)(incidence)數(shù)。如此定義參數(shù),即每個(gè)CPG的固有頻率是這樣的,參考在緊靠前面的部分之前部分中描述的行走頻率,LM的頻率大于SW頻率的三倍。然后,使神經(jīng)振蕩器表現(xiàn)穩(wěn)定振蕩,隨后輸出頻率給模擬器模型,該模型被施加一個(gè)初始速度。最初,不給CPG反饋,觀察機(jī)器人的運(yùn)動(dòng)。結(jié)果是,發(fā)現(xiàn)盡管已經(jīng)調(diào)整了參數(shù),機(jī)器人在走了大約7步左右后跌倒。在此之后,提供相應(yīng)于雙腿支撐周期中SW的反饋給SW神經(jīng)振蕩器。然后發(fā)現(xiàn),由于SW神經(jīng)振蕩器已被誘導(dǎo)到適當(dāng)?shù)南辔魂P(guān)系中,盡管在線性運(yùn)動(dòng)系統(tǒng)中沒有清楚的反饋路徑,機(jī)器人能夠繼續(xù)行走。然而,對(duì)于參數(shù)改變的敏感性很高。例如,當(dāng)搖擺角只改變1度時(shí),機(jī)器人就跌倒了。特別是,由于很難發(fā)現(xiàn)在穩(wěn)定的基礎(chǔ)上施加并產(chǎn)生穩(wěn)定的限制周期的初始速度,行走的初始階段的狀態(tài)是個(gè)問題。
B-1-4.在硬件中的應(yīng)用在這部分中,將在緊接前面部分描述的兩足動(dòng)物仿真的細(xì)節(jié)應(yīng)用到真實(shí)硬件。通過采用如B-1-3-4中描述的控制器并根據(jù)仿真中得到的發(fā)現(xiàn),在實(shí)驗(yàn)的基礎(chǔ)上調(diào)整機(jī)器,可實(shí)現(xiàn)行走。
B-1-4-1.實(shí)驗(yàn)硬件圖22示意性地說明在實(shí)驗(yàn)硬件中采用的機(jī)器人的機(jī)器機(jī)體的連接部分。由于機(jī)器人的行為根據(jù)足底的輪廓而改變,改進(jìn)該機(jī)器,使具有不同輪廓的部分,可有選擇地安裝在除接觸點(diǎn)外的足底的位置。另外,可以如此設(shè)計(jì)機(jī)器人,使其增加機(jī)械開關(guān),用于觀察接觸。致動(dòng)器上采用DC無刷電機(jī),并用于準(zhǔn)-直接驅(qū)動(dòng)模式,從而可消除任何因減少齒輪而產(chǎn)生的摩擦和粘滯。
B-1-4-2.步進(jìn)運(yùn)動(dòng)首先,讓我們考慮現(xiàn)場(chǎng)中的步進(jìn)運(yùn)動(dòng)。在開始行走之前在現(xiàn)場(chǎng)實(shí)現(xiàn)步進(jìn)運(yùn)動(dòng)是應(yīng)用神經(jīng)振蕩器觀察行走的常規(guī)的方法15,16。
在上面描述的實(shí)驗(yàn)硬件的情況下,由于該機(jī)器沒有任何踝關(guān)節(jié),在行走方向張開腿到一個(gè)給定的角度,以防止其跌倒。通過產(chǎn)生一個(gè)線性運(yùn)動(dòng)(LM)來生成傾斜振蕩器。反饋路徑如圖23所示,以繼續(xù)振蕩。對(duì)于姿態(tài)腿,施加相互抑制到其伸展/收縮側(cè)使繼續(xù)振蕩。在雙支撐相位,根據(jù)軀干的傾斜在伸展腿的方向調(diào)節(jié)反饋。尤其是,如果軀干向前傾斜,延伸前腿的支撐腿周期。由于前腿和后腿以如圖21所示的方式耦合,采用振蕩器生成前/后步進(jìn)運(yùn)動(dòng)。
作為實(shí)驗(yàn)性調(diào)節(jié)參數(shù)的結(jié)果來進(jìn)一步確認(rèn)步進(jìn)運(yùn)動(dòng)。當(dāng)施加一個(gè)外部干擾時(shí),可以證實(shí),通過延長(zhǎng)步進(jìn)周期和支撐腿周期,恢復(fù)步進(jìn)運(yùn)動(dòng)。當(dāng)機(jī)器人非常向前傾斜,同時(shí)后腿抬起時(shí),由于為保持平衡的傳感器反饋只在雙腿支撐階段有效,恢復(fù)力矩的量級(jí)依賴于足底的外形。
B-1-4-3.CPG+狀態(tài)機(jī)行走運(yùn)動(dòng)是由在緊接前面部分中實(shí)現(xiàn)的步進(jìn)運(yùn)動(dòng)和搖擺運(yùn)動(dòng)結(jié)合生成的。應(yīng)用狀態(tài)機(jī)來切換腿,當(dāng)后腿為搖擺腿且前穩(wěn)定裕度落到給定水平之下時(shí),切換前腿的角度目標(biāo)值和后腿的角度目標(biāo)值(見圖24)。
直觀地說,行走運(yùn)動(dòng)是通過“當(dāng)機(jī)器人將要跌倒時(shí)向前邁步”而實(shí)現(xiàn)的。已經(jīng)證實(shí),當(dāng)應(yīng)用真實(shí)硬件時(shí)機(jī)器人能夠行走。這時(shí),手動(dòng)調(diào)節(jié)神經(jīng)振蕩器的參數(shù)、PD增益、LM幅值、SW幅值和穩(wěn)定裕度的閾值。盡管連續(xù)行走的距離根據(jù)實(shí)驗(yàn)硬件的硬件問題(由于電機(jī)過熱或其它問題引起的機(jī)器特性變化)而變化,機(jī)器人通??尚凶叽蠹s50步(360連續(xù)步、行走距離50米、最大行走速度0.4m/s)。另外,機(jī)器人可使其自身適應(yīng)于在地面材料和阻止運(yùn)動(dòng)機(jī)器人的力的一定程度的變化。
當(dāng)與搖擺運(yùn)動(dòng)相結(jié)合,對(duì)于步幅和周期自動(dòng)調(diào)節(jié)步進(jìn)運(yùn)動(dòng),機(jī)器人象有生命的機(jī)體一樣移動(dòng)。這可以是,當(dāng)CPG路徑計(jì)劃和狀態(tài)機(jī)的路徑計(jì)劃都不明確包含時(shí)間時(shí)觀察到的現(xiàn)象。
B-1-4-4.只有CPG現(xiàn)在,考慮通過采用神經(jīng)振蕩器來驅(qū)動(dòng)腿從而實(shí)現(xiàn)搖擺運(yùn)動(dòng)(SW)。由于搖擺運(yùn)動(dòng)需要與線性運(yùn)動(dòng)(LM)相協(xié)調(diào),通過轉(zhuǎn)變輸出信號(hào)的符號(hào)(見圖25),將LM的輸出輸入到SW。
在這種結(jié)合的情況下,LM與SW之間的相位差為180度。SW的頻率與LM的頻率相等。實(shí)驗(yàn)的結(jié)果是,發(fā)現(xiàn)機(jī)器人能夠在應(yīng)用狀態(tài)機(jī)的情況下行走。
然而,如果與應(yīng)用狀態(tài)機(jī)相比較,很難將機(jī)器人從行走的最開始帶入穩(wěn)定狀態(tài)。這可能是由于SW需要時(shí)間來被LM以適當(dāng)?shù)南辔魂P(guān)系誘導(dǎo)。圖63表示模擬的結(jié)果,圖26表示實(shí)驗(yàn)的比較結(jié)果。由于LM與SW之間的最優(yōu)相位差限于180度,從實(shí)際數(shù)據(jù)可以清楚得出,SW帶有相位延遲地被誘導(dǎo)。
接觸腿的膝關(guān)節(jié)也表現(xiàn)出很大的背離,這也是很明顯的。這歸因于小的增益。從傳統(tǒng)的軌跡跟蹤控制觀點(diǎn)來看,可以認(rèn)為這是不好的控制特性。然而,也有可能認(rèn)為機(jī)器人在行走,有效地利用虛擬的小增益致動(dòng)器的彈簧阻尼特性,正如在Kimura等人的四足機(jī)器人的情況。通過上述結(jié)果,很明顯增益對(duì)于機(jī)器人行走具有顯著影響。
圖64是表示振蕩器的相位變化的相位平面圖,上述相位變化是當(dāng)將左側(cè)髖關(guān)節(jié)作為物理振蕩器(PDF)進(jìn)行周期運(yùn)動(dòng)模擬所得到的結(jié)果,圖27表示實(shí)驗(yàn)的比較結(jié)果。通過圖表,可以清楚看出在這里形成了限制周期。由于在接觸的時(shí)刻出現(xiàn)大的角速度改變,很明顯,腳尖在接觸時(shí)并不是以零相對(duì)速度接觸地面。由于在這里涉及的沖擊使機(jī)器人的行為不穩(wěn)定,傳統(tǒng)的ZMP技術(shù)避免這種沖擊。機(jī)器人表現(xiàn)出不自然的“躡手躡腳”的行走方式。
另一方面,由于它象人類的行走,主動(dòng)利用腳跟的碰撞以調(diào)節(jié)行走速度,機(jī)器人的腳尖以相對(duì)于地面零速度的接觸使它的行走表現(xiàn)得接近于人類的行走。對(duì)于行走周期,由于神經(jīng)振蕩器的自然行走周期為0.33秒每步,穩(wěn)定狀態(tài)的行走周期平均為0.368秒,證明了它是由誘導(dǎo)特性所調(diào)節(jié)。另外,由于它相對(duì)接近人類的行走周期,與后者差8%,這個(gè)值可以代表機(jī)器人更自然的行走。機(jī)器人行走的步幅不必要為常值,可觀察到左腿和右腿具有不同的步幅。無論如何,不考慮步幅差別,機(jī)器人能夠連續(xù)行走證明了本算法能夠使用,即使機(jī)器人表現(xiàn)出步幅差別?,F(xiàn)在,考慮通過調(diào)節(jié)步幅來調(diào)節(jié)行走速度。
Taga報(bào)告機(jī)器人的行走步態(tài)可通過增加穩(wěn)定輸入值c從走變?yōu)榕埽鲜龇€(wěn)定輸入值c改變神經(jīng)振蕩器6的表現(xiàn)(幅值)。c值可從1.8變?yōu)?.5,在穩(wěn)定輸入值的范圍之外,機(jī)器人不能行走。當(dāng)c值很小時(shí),步幅過分減小,穩(wěn)定裕度將降低,因此,機(jī)器人很容易蹣跚和跌倒。另一方面,當(dāng)步幅過分增大時(shí),由于搖擺腿接觸地面時(shí)機(jī)器人受到很大沖擊,機(jī)器人的步態(tài)變得不穩(wěn)定。
機(jī)器人行走步態(tài)的印象隨c值而變化。當(dāng)c值很小時(shí),機(jī)器人行走步態(tài)給人優(yōu)雅的印象,而當(dāng)c值很大時(shí),給人機(jī)器化的印象。因此,c可用來作為表達(dá)的手段。
圖28為表示穩(wěn)定輸入值c、行走速度/機(jī)械能量消耗/移動(dòng)效率的無次元值與電阻率(specific resistance)之間關(guān)系的圖表。消耗的能量是從到伺服驅(qū)動(dòng)器的力矩指令值和測(cè)量的角速度計(jì)算得出,電阻率是通過利用消耗能量和測(cè)量的行走速度計(jì)算得出。通過增加c值,可能增大步幅并改變行走速度。但是,速度調(diào)節(jié)的范圍是有限的,在這種實(shí)驗(yàn)硬件沒有任何踝關(guān)節(jié)的情況下,非常依賴足底的圓弧半徑。
當(dāng)前的算法目的是通過積極利用動(dòng)態(tài)效果使機(jī)器人連續(xù)行走,并且機(jī)器人只在接近機(jī)器機(jī)體傾斜方向的固有頻率的頻率范圍內(nèi)能夠行走。這一特性是在如“從動(dòng)動(dòng)態(tài)行走”17示出的、積極利用機(jī)器機(jī)體的從動(dòng)動(dòng)態(tài)特性的機(jī)器人行走共同的問題??雌饋?,低行走速度的運(yùn)動(dòng)不可缺少地需要利用踝力矩和反饋路徑的控制操作。Taga認(rèn)為在現(xiàn)場(chǎng)單步行走和穩(wěn)定行走需要不同的結(jié)構(gòu)。
隨c值的增加,能量消耗也增大。這是通過確定能量消耗為最小時(shí)的電阻率和當(dāng)c值等于1.8時(shí)該電阻率表現(xiàn)為一個(gè)很大值發(fā)現(xiàn)的。通過應(yīng)用當(dāng)前的算法,有可能使腿可動(dòng)機(jī)器人以很高的能量消耗率運(yùn)動(dòng)。能量消耗完全機(jī)器輸出由來確定的,當(dāng)c=2.05(效率0.7%)時(shí),施加給致動(dòng)器的電功率為大約340瓦。在針對(duì)高效率行走的Spring Flamingo18的情況下,機(jī)器輸出為5瓦時(shí),電功率為200瓦(效率為2.5%)。因此,尤其在長(zhǎng)的電池操作時(shí)間方面,首先需要改善硬件特性,從而改善凈效率。
通過觀察當(dāng)前算法所實(shí)現(xiàn)的行走,可以發(fā)現(xiàn),膝部只彎曲很小的程度。圖29是一個(gè)示意圖,表示對(duì)腿部長(zhǎng)度/質(zhì)量所標(biāo)準(zhǔn)化的關(guān)節(jié)的最大力矩以及采用典型目標(biāo)ZMP判據(jù)所獲得的最大力矩進(jìn)行比較而得到的結(jié)果。從圖中可以看出施加到膝部的力矩減小到了約1/3。
當(dāng)前算法的一個(gè)最重要的優(yōu)點(diǎn)就是能夠選擇一較低的關(guān)節(jié)增益。當(dāng)前可用的腿移動(dòng)機(jī)器人之所以必然昂貴的原因就是要選擇較大的增益來實(shí)現(xiàn)高精度的軌跡追蹤。要獲得較大增益,就必須滿足嚴(yán)格的硬件要求,包括齒輪后沖(backlash)的減少和響應(yīng)特性的提高。此外,從人-機(jī)器人交互作用的觀點(diǎn)來看,關(guān)節(jié)硬度高的狀態(tài)是非常危險(xiǎn)的。基于反射的運(yùn)動(dòng)根據(jù)環(huán)境來變化。因此,機(jī)器人對(duì)倒下的響應(yīng)會(huì)根據(jù)機(jī)器人周圍的條件而不同。本發(fā)明的發(fā)明人認(rèn)為機(jī)器人的這一特性問題是使機(jī)器人不會(huì)干擾人類的一個(gè)關(guān)鍵點(diǎn)。
B-2.利用運(yùn)動(dòng)學(xué)習(xí)前向的人類行走學(xué)習(xí)及其應(yīng)用已經(jīng)開發(fā)出具有人類特點(diǎn)的機(jī)器人,包括SDR(Sony),ASIMO(Honda),HRP(國家高級(jí)工業(yè)科學(xué)技術(shù)學(xué)院)和H7(東京大學(xué)),高水平雙足運(yùn)動(dòng)的進(jìn)步是值得注意的。在許多機(jī)器人(如前所述)中,通過用ZMP的關(guān)節(jié)軌跡方法可產(chǎn)生一種行走模式。在采用ZMP作為判據(jù)的運(yùn)動(dòng)產(chǎn)生算法被證明為實(shí)現(xiàn)雙足穩(wěn)定運(yùn)動(dòng)的較好的技術(shù)的同時(shí),軌跡設(shè)計(jì)需要對(duì)機(jī)器人精確建模的操作,需要高精度軌跡追蹤控制系統(tǒng)來實(shí)現(xiàn)運(yùn)動(dòng)。此外,也指出了具有彎曲膝部的行走模式的問題。該行走模式設(shè)計(jì)用來避免反向運(yùn)動(dòng)的異常姿態(tài)。
除此以外,還作出了多種嘗試采用神經(jīng)振蕩生物刺激的控制算法(如前所述)利用CPG自適應(yīng)機(jī)構(gòu)產(chǎn)生行走運(yùn)動(dòng)。由Matsuoka提出、并通過對(duì)屈肌伸肌建模的非線性微分方程而獲得的神經(jīng)振蕩已廣泛地用作CPG[2],并利用伴有與環(huán)境交互作用的誘導(dǎo)特性來控制周期運(yùn)動(dòng)。特定的例子包括雙足運(yùn)動(dòng)控制[19,20],四足運(yùn)動(dòng)控制[12],晃動(dòng)控制[21],振動(dòng)[4]和slinky(螺旋彈簧)控制[3]。然而,對(duì)于設(shè)計(jì)控制系統(tǒng)仍存在很多問題,包括如何設(shè)計(jì)振蕩器的相互結(jié)合,以及調(diào)整振蕩器參數(shù)以便用來實(shí)現(xiàn)目標(biāo)運(yùn)動(dòng)的困難。
在本節(jié),注意力放在行走機(jī)器人的物理和動(dòng)態(tài)特性上,并描述了設(shè)計(jì)控制系統(tǒng)的技術(shù),該控制系統(tǒng)可實(shí)現(xiàn)機(jī)器人自然和平穩(wěn)的行走運(yùn)動(dòng),從而使它看上去更象人類。本發(fā)明的發(fā)明人研究了通過模仿來實(shí)現(xiàn)類似人類的復(fù)雜和平穩(wěn)運(yùn)動(dòng)的運(yùn)動(dòng)產(chǎn)生/運(yùn)動(dòng)描述算法。本發(fā)明的發(fā)明人已經(jīng)提出,通過非線性微分方程和一種通過靜態(tài)學(xué)習(xí)技術(shù)[22]來迅速學(xué)習(xí)老師演示運(yùn)動(dòng)的運(yùn)動(dòng)學(xué)習(xí)基元,來描述關(guān)節(jié)軌跡。在本節(jié),通過把律動(dòng)運(yùn)動(dòng)基元和局部加權(quán)學(xué)習(xí)(局部加權(quán)回歸)[23]用作CPG模型來產(chǎn)生機(jī)器人行走運(yùn)動(dòng)的操作,學(xué)習(xí)人類行走運(yùn)動(dòng)并適當(dāng)?shù)乇壤枰倪\(yùn)動(dòng),該律動(dòng)運(yùn)動(dòng)基元具有在相位振蕩器基礎(chǔ)上形成的極限環(huán)吸引區(qū)(attractor)。圖30是該操作的示意性概念圖。
采用該基元作為CPG的優(yōu)點(diǎn)包括,它可迅速學(xué)習(xí)教師的演示運(yùn)動(dòng),該演示運(yùn)動(dòng)一般為測(cè)量到的人類行走模式的形式,它還易于比例化(scale)所學(xué)律動(dòng)運(yùn)動(dòng)的幅度、周期和偏移。在本節(jié),將提出相位復(fù)元(resetting),該相位復(fù)元采用了來自環(huán)境[24]的反饋和行走周期自應(yīng)用規(guī)則,并利用了相位振蕩器、機(jī)器系統(tǒng)和環(huán)境的交互作用產(chǎn)生的誘導(dǎo);該技術(shù)的基礎(chǔ)效應(yīng)將通過數(shù)值模擬的方式來進(jìn)行討論。
在本節(jié),采用雙足機(jī)器人作為數(shù)值模擬的模型,該機(jī)器人具有如圖31所示的五個(gè)平面段(link)。機(jī)器人的總高度為40厘米,機(jī)器人的重量為3千克。它采用下表中所列的物理參數(shù)來進(jìn)行數(shù)值模擬。
參照?qǐng)D31,假定該機(jī)器人在髖關(guān)節(jié)具有兩個(gè)致動(dòng)器,并在每個(gè)膝關(guān)節(jié)還具有兩個(gè)致動(dòng)器,且其運(yùn)動(dòng)限制在徑向面上。在模擬中,機(jī)器人的動(dòng)態(tài)方程通過采用SD/FAST[25]來推導(dǎo)出,并利用龍格-庫塔法以1微秒的時(shí)間間隔求積分,地面的反作用力利用與地面接觸的彈簧/阻尼模型來計(jì)算。
B-2-1.利用動(dòng)態(tài)運(yùn)動(dòng)基元的人類行走學(xué)習(xí)
B-2-1-1.律動(dòng)動(dòng)態(tài)運(yùn)動(dòng)基元在本節(jié),對(duì)本發(fā)明發(fā)明人提出的動(dòng)態(tài)運(yùn)動(dòng)基元(primitive)[22]進(jìn)行簡(jiǎn)單描述。運(yùn)動(dòng)學(xué)習(xí)基元適用于通過一非線性微分方程來描述教師的演示運(yùn)動(dòng),并通過靜態(tài)學(xué)習(xí)方法迅速學(xué)習(xí)該運(yùn)動(dòng),以便用來產(chǎn)生機(jī)器人的運(yùn)動(dòng)。下面將描述周期運(yùn)動(dòng)的運(yùn)動(dòng)學(xué)習(xí)基元的形式。
作為基本周期運(yùn)動(dòng)模式產(chǎn)生器,讓我們假定一極限周期振蕩器系統(tǒng)通過由下式表示的極坐標(biāo)系統(tǒng)(Φ,r)來表示,[公式8]Tφ·=1---Tr·=-μ(r-r0)]]>在上式中,(Φ,r)分別表示振蕩器的相位和幅度。τ為時(shí)間常數(shù),r0為(相對(duì))目標(biāo)幅值,同時(shí)μ為正常數(shù)。上式的相位動(dòng)態(tài)特性也可用以下的公式來表示。應(yīng)當(dāng)注意,下式對(duì)應(yīng)于一相位發(fā)生器,用來為作為振蕩器的機(jī)器人的周期運(yùn)動(dòng)產(chǎn)生相位信號(hào)Φ。
φ·=ω]]>其中ω=def1/T]]>運(yùn)動(dòng)學(xué)習(xí)基元的輸出y通過下式來描述,該公式表示了采用相位振蕩器的狀態(tài)(Φ,r)和通過坐標(biāo)轉(zhuǎn)換所獲得作為輸入的v(hat)=[rcosΦ,rsinΦ]T的二階系統(tǒng)動(dòng)態(tài)特性。
TZ·=αZ(βz(ym-y)-Z)]]>Ty·=z+f(V~,φ)]]>在上式中,αz和βz為正常數(shù),ym是輸出偏移,同時(shí)利用由下式表示的局部線性模型[23],f表示非線性函數(shù)近似器(approximater),該局部線性模型由高斯Ψi=exp(-hi(mod(Φ,2π)-ci)2)進(jìn)行加權(quán)。其輸出通過計(jì)算局部線性模型的加權(quán)平均值來獲得。
f(V~,φ)=Σi=1NΨiWiTV~Σi=1NΨi]]>在上式中,wi是局部線性模型的一個(gè)參數(shù),它在給定示范的軌跡時(shí)由局部加權(quán)回歸來確定,如以下將更詳細(xì)描述的。
以上兩個(gè)公式[公式10]和[公式11]描述了機(jī)器人的一個(gè)周期運(yùn)動(dòng),如通過相位信息Φ的行走運(yùn)動(dòng),并對(duì)應(yīng)于一個(gè)控制可移動(dòng)部分如腿的驅(qū)動(dòng)操作的控制器。通過這樣一個(gè)控制器,有可能只需簡(jiǎn)單選擇參數(shù)值就可連續(xù)輕松地改變幅值、同步性、偏移等等。
圖32是對(duì)運(yùn)動(dòng)的學(xué)習(xí)軌跡作出改變的示意圖,表示了在本節(jié)所述的運(yùn)動(dòng)學(xué)習(xí)基元的特征特性。通過改變參數(shù)r0、τ(=1/ω)和Ym,可以輕松地改變學(xué)習(xí)運(yùn)動(dòng)的幅值、周期以及偏移量。本發(fā)明的發(fā)明人在一個(gè)實(shí)驗(yàn)中證明了該運(yùn)動(dòng)學(xué)習(xí)基元的有效性,在該實(shí)驗(yàn),模擬人的機(jī)器人DB受驅(qū)動(dòng)畫出數(shù)字8并學(xué)習(xí)打鼓運(yùn)動(dòng)[22]。
B-2-1-2.利用運(yùn)動(dòng)學(xué)習(xí)基元的雙足機(jī)器人控制系統(tǒng)圖33是表示根據(jù)本發(fā)明機(jī)器人一個(gè)實(shí)施例的控制系統(tǒng)的示意和概念圖。如B-2-1-1中所述,一運(yùn)動(dòng)學(xué)習(xí)基元用作CPG模型,輸出用于機(jī)器人的目標(biāo)關(guān)節(jié)軌跡θdes。這里,運(yùn)動(dòng)學(xué)習(xí)基元用來產(chǎn)生每個(gè)關(guān)節(jié)(i=1-4)的目標(biāo)軌跡。一個(gè)局部PD控制器用來控制機(jī)器人每個(gè)關(guān)節(jié)的關(guān)節(jié)角度。觸地(touchdown)信息從機(jī)器人反饋到CPG用來進(jìn)行相位復(fù)原[24],并更新振蕩器的固有頻率。
在本節(jié),將要描述將接觸腿的振蕩器的相位減小到Φ=0的操作,以及在接觸時(shí),將另一腿的振蕩器的相位減小到Φ=π的操作,以作為相位復(fù)原。在B-2-4中將詳細(xì)描述用來更新每個(gè)振蕩器的固有頻率以使其適應(yīng)行走周期的規(guī)則。在本節(jié)的后面將詳細(xì)討論相位復(fù)原。
B-2-1-3.學(xué)習(xí)人類的行走模式行走數(shù)據(jù)在本節(jié),采用了一位行人的關(guān)節(jié)角度數(shù)據(jù)(男性,29歲,身高176cm,體重83.5公斤,右髖關(guān)節(jié)和右膝關(guān)節(jié))[26]。在將來,會(huì)收集各種條件的數(shù)據(jù)以供學(xué)習(xí)。圖34的左圖表示從所收集數(shù)據(jù)中獲得的關(guān)節(jié)角度,圖34的右圖表示從右腿的一次接觸到下一次接觸期間關(guān)節(jié)的角度。在下一節(jié)將描述的學(xué)習(xí)過程中,周期的軌跡重復(fù)20次,所獲得的周期軌跡用作學(xué)習(xí)數(shù)據(jù)。圖34的行走數(shù)據(jù)只是用作方便的目的,還希望在通過實(shí)際觀察人類的行走來獲得行走數(shù)據(jù)時(shí),可獲得足夠大量周期的數(shù)據(jù)。從數(shù)據(jù)中,通過借助于離散FFT獲得能譜和自相關(guān),來估計(jì)出周期T=1.17秒,頻率f=1/T=0.855Hz。
局部加權(quán)學(xué)習(xí)將要討論在從人類范例性運(yùn)動(dòng)中獲得關(guān)節(jié)軌跡ydemo時(shí),通過采用上式[公式10]中的學(xué)習(xí)參數(shù)wi來確定局部加權(quán)學(xué)習(xí)的技術(shù)[23],該公式對(duì)應(yīng)一控制器。
假定給出了在一給定時(shí)間t的數(shù)據(jù)點(diǎn)或數(shù)據(jù)點(diǎn)(ftarget,v(hat))。
ftarget=y·demo-βz(ym-ydemo)]]>此時(shí),學(xué)習(xí)參數(shù)wi通過局部加權(quán)回歸[23]順序更新。
wit+1=wit+Pit+1v~ei]]>其中[公式14]Pit+1=1λ(Pit-Pitv~v~TPitλΨi+v~TPitv~),ei=ftarget-wiTv~]]>其中λ∈
是遺忘系數(shù)。為了學(xué)習(xí),有可能通過使局部模型的數(shù)字和排列相加,并在在線基礎(chǔ)上優(yōu)化局部模型的相關(guān)區(qū)域,來近似出具有期望近似精度水平的未知的這似值目標(biāo),而無需預(yù)先確定函數(shù)近似器的結(jié)構(gòu),。
圖35表示了運(yùn)動(dòng)學(xué)習(xí)基元的學(xué)習(xí)人類行走軌跡的一些結(jié)果的示意圖。由于在以下所述的模擬中只收集了右腿的數(shù)據(jù),分別對(duì)應(yīng)右髖關(guān)節(jié)(R_HIP)和右膝關(guān)節(jié)(R_KNEE)的學(xué)習(xí)參數(shù)根據(jù)右髖關(guān)節(jié)和右膝關(guān)節(jié)的數(shù)據(jù)來確定。于是,通過采用分別對(duì)應(yīng)左髖關(guān)節(jié)(L_HIP)和左膝關(guān)節(jié)(L_KNEE)的右髖關(guān)節(jié)和右膝關(guān)節(jié)學(xué)習(xí)參數(shù),并把左振蕩器的相位從右振蕩器的相位移動(dòng)π[弧度],產(chǎn)生了一目標(biāo)行走軌跡。
B-2-1-4.數(shù)值模擬參數(shù)值選擇在數(shù)值模擬中,為運(yùn)動(dòng)學(xué)習(xí)基元、PD控制器以及以下表中所示的內(nèi)容選擇參數(shù)值 當(dāng)前,上述參數(shù)值通過模擬經(jīng)驗(yàn)確定。然而,這些參數(shù)的物理意義對(duì)于周期和幅度來說卻是原本就直觀的,因此如果與其他CPG模型相比,它們相對(duì)更容易調(diào)節(jié)。在本節(jié)所述的模擬中,振蕩器的周期逐步移動(dòng),從行走開始到第二步等于1.5秒(根據(jù)角頻率ω=4.19弧度/秒),從第三步到第九步等于1.2秒(根據(jù)角頻率ω=5.24弧度/秒),從第十步向上為1.0秒(據(jù)角頻率ω=6.28弧度/秒)。這些值經(jīng)驗(yàn)化獲得。在以下描述中,將討論采用誘導(dǎo)現(xiàn)象的行走周期的自適應(yīng)規(guī)則,以及通過應(yīng)用自適應(yīng)規(guī)則所獲結(jié)果而獲得比例化周期的規(guī)則。
模擬結(jié)果在模擬中,設(shè)計(jì)器產(chǎn)生了從兩腿并排放在地面上的狀態(tài)到作第一步行走的軌跡。圖36表示了對(duì)于t=0到20,具有行走學(xué)習(xí)基元輸出的目標(biāo)關(guān)節(jié)軌跡和機(jī)器人關(guān)節(jié)軌跡。圖37是表示機(jī)器人左腿的目標(biāo)關(guān)節(jié)軌跡、關(guān)節(jié)軌跡、以及在兩個(gè)行走周期(四步)腿部的接觸時(shí)間的示意圖。圖38表示關(guān)節(jié)力矩指令值的示意圖。髖關(guān)節(jié)的指令速度和膝關(guān)節(jié)的指令速度分別在-3.12到2.22弧度/秒和-6.09到5.23弧度/秒的范圍內(nèi)。
在時(shí)間t=11.2到11.6秒時(shí),從膝關(guān)節(jié)的力矩指令值可以看出,實(shí)際上不需要力矩來使膝部擺動(dòng)。根據(jù)這一發(fā)現(xiàn)可以想到,膝部以下關(guān)節(jié)的擺動(dòng)可以通過大腿關(guān)節(jié)的搖擺運(yùn)動(dòng)而從動(dòng)地實(shí)現(xiàn)。圖39是表示機(jī)器人如何在穩(wěn)定狀態(tài)下行走的示意圖。在兩個(gè)相鄰幀之間的時(shí)間間隔為66毫秒。
B-2-2.采用相位振蕩器誘導(dǎo)的行走周期自適應(yīng)B-2-2-1.耦合相位振蕩器通過誘導(dǎo)的同步通過相差反饋的誘導(dǎo)首先,將討論一耦合相位振蕩器系統(tǒng)通過相差反饋誘導(dǎo)的同步[27]。讓我們考慮如圖40所示的兩個(gè)耦合相位振蕩器的動(dòng)態(tài)特性。下式對(duì)應(yīng)一相位發(fā)生器,該發(fā)生器產(chǎn)生與機(jī)器人兩個(gè)可移動(dòng)部分的周期運(yùn)動(dòng)相關(guān)的相位信息Φ1和Φ2。
φ·1=ω1+K1(φ2-φ1)]]>φ·2=ω2+K2(φ1-φ2)]]>當(dāng)相差Ψ定義成Ψ=Φ2-Φ1時(shí),時(shí)間微分用下式來表示[公式16]ψ·=(ω2-ω1)-(K1+K2)ψ]]>于是,平衡點(diǎn)Ψ*由下式定義[公式17]ψ*=ω2-ω1K1+K2]]>每個(gè)振蕩器的頻率由如下式所定義的方式誘導(dǎo)[公式18]ω*=K2ω1+K1ω2K1+K2]]>因此,可以看出,作為每個(gè)振蕩器誘導(dǎo)的結(jié)果,振蕩器以漸進(jìn)同步的方式振蕩,頻率ω*=(K2ω1+k1ω2)/(K1+K2),相差Ψ=Φ2-Φ=(ω2-ω1)/(K1+K2)。
通過固有頻率適應(yīng)的目標(biāo)相差的實(shí)現(xiàn)在上述相位振蕩器的情況下,如果振蕩器的固有頻率ω1和ω2被固定,它們以同步方式振蕩,作為誘導(dǎo)的結(jié)果,相差Ψ=Φ2-Φ1=(ω2-ω1)/(K1+K2)。如果ω1=ω2,顯而易見振蕩器以相差0振蕩。因此,讓我們?cè)诖丝紤]如下式所示地引入更新固有頻率的動(dòng)態(tài)特性,并漸進(jìn)地使ω1→ω2,以通過誘導(dǎo)的頻率一致和0相差來實(shí)現(xiàn)同步。
φ·1(t)=ω1(t)+K1(φ2(t)-φ1(t))]]>ω·1(t)=-K(ω2-ω1(t))]]>φ·2(t)=ω2+K2(φ1(t)-φ2(t))]]>因此,由于ω1→ω2漸進(jìn)地發(fā)生,實(shí)現(xiàn)了相差Ψ=Φ2-Φ→0。
B-2-2-2.行走周期的自適應(yīng)規(guī)則在本節(jié),將討論利用運(yùn)動(dòng)學(xué)習(xí)基元,把上述誘導(dǎo)耦合相位振蕩器應(yīng)用到行走控制中行走周期的自適應(yīng)控制。如圖30所示,本實(shí)施例的控制系統(tǒng)被看作是采用運(yùn)動(dòng)學(xué)習(xí)基元的CPG和機(jī)器系統(tǒng)振蕩器(機(jī)器人)的結(jié)合。
對(duì)于采用正弦合成波的目標(biāo)關(guān)節(jié)軌跡的產(chǎn)生,本發(fā)明的發(fā)明人考慮通過下式,利用機(jī)器人每一步所測(cè)量到的時(shí)間來更新模式產(chǎn)生器的頻率。
ω^n+1=ω^n+K(ωmeasuredn-ω^n)]]>相位估計(jì)器處理測(cè)量到的相位值ωn,其基于狀態(tài)量V作為估計(jì)相位值。然而,要注意使下式保持成立。
ωmeasuredn=πTmeasuredn]]>測(cè)得的Tn定義為機(jī)器人在第n步走出一步所需的時(shí)間(振蕩器的半個(gè)周期)。從在B-2-2-1所述的相位振蕩器動(dòng)態(tài)特性的角度來看,這恰好是前面的公式[公式19]的離散形式。然而,由于只更新頻率就不存在相差的反饋,顯然,上述設(shè)計(jì)對(duì)于通過誘導(dǎo)實(shí)現(xiàn)預(yù)期的相差是不夠的。因此,在本實(shí)施例中,由下式所表示的自適應(yīng)規(guī)則將被引入到運(yùn)動(dòng)學(xué)習(xí)基元(相位發(fā)生器)中,從而根據(jù)B-2-2-1的描述,通過在接觸時(shí)的“相位復(fù)原”,進(jìn)一步離散地反饋相差。通過相位復(fù)原,可以提高和穩(wěn)定在行走或一些其他運(yùn)動(dòng)中的瞬態(tài)特性(以下將更具體地描述)。以下方程對(duì)應(yīng)一相位發(fā)生器的更新規(guī)則,用來根據(jù)由相位估計(jì)器估計(jì)的相位和角度頻率來更新相位信號(hào)。
φ·=ω^n+δ(t-theelstrike)(φheelstrikerobot-φ)]]>ω^n+1=ω^n+K(ωmeasuredn-ω^n)]]>在上式中,n是邁步的數(shù)量,Φrobottheelstrike是在接觸時(shí)機(jī)器系統(tǒng)振蕩器(機(jī)器人)的相位。更具體地,相位復(fù)原相對(duì)于基元(相位發(fā)生器)定義,以便在該腿的接觸時(shí)間Φrobottheelstrike=0,而另一腿的接觸時(shí)間Φrobottheelstrike=π。通過對(duì)B-2-2-1的相位振蕩器動(dòng)態(tài)特性的分析,規(guī)則的關(guān)系顯示出實(shí)現(xiàn)了預(yù)期的同步,從而實(shí)現(xiàn)相位振蕩器和機(jī)器系統(tǒng)振蕩器的行走。同時(shí)ω在本節(jié)離散地更新,還可以引入如下式所定義的自適應(yīng)規(guī)則來連續(xù)地更新ω,并考慮了相位反饋的增益。
φ·=ω+K1δ(t-theelstrike)(φheelstrikerobot-φ)]]>ω·=K2(ωmeasuredn-ω)]]>B2-2-3.數(shù)值模擬本節(jié)將要對(duì)前一節(jié)中所述的行走周期的自適應(yīng)規(guī)則進(jìn)行模擬。對(duì)于角頻率ω的初始值選擇了4.78弧度/秒(振蕩器周期1.5秒)的值。圖41表示了在選擇關(guān)聯(lián)數(shù)K=0.2,0.5和0.8時(shí),一些行走模擬結(jié)果的示意圖。在圖41,左圖表示走一步需要的時(shí)間,而右圖表示角頻率ω的更新值。從圖41中很清楚,行走周期的自適應(yīng)通過CPG和機(jī)器系統(tǒng)的交互誘導(dǎo)來實(shí)現(xiàn)。
B-2-3.運(yùn)動(dòng)定標(biāo)的討論設(shè)計(jì)者根據(jù)經(jīng)驗(yàn)標(biāo)度了行走周期,從而實(shí)現(xiàn)在B-2-2-3所述模擬中機(jī)器人的行走。然而,如B-2-2-2所述,對(duì)于機(jī)器人物理特性所希望的行走周期可以通過利用誘導(dǎo)現(xiàn)象來獲得,從而使CPG和機(jī)器系統(tǒng)以同步的方式操作,而無需清楚給出目標(biāo)周期。因此,在本節(jié)要討論測(cè)得的人類行走周期和作為自適應(yīng)結(jié)果獲得的機(jī)器人行走周期之間的關(guān)系。
假定一行人的擺腿向前擺動(dòng)一次,讓我們來考慮圖4所示的兩個(gè)具有不同長(zhǎng)度的單個(gè)擺體的運(yùn)動(dòng)。眾所周知,假定為線性動(dòng)態(tài)的擺體運(yùn)動(dòng)由下式所表示。
θ··+glθ=0]]>接著,固有頻率ω由下面的公式表示[公式25]ω=gl]]>因此,當(dāng)人類行走的頻率ωhuman,人類腿部的長(zhǎng)度lhuman,以及機(jī)器人腿部長(zhǎng)度lrobot給定后,預(yù)期的機(jī)器人頻率ωrobot可通過下式在單個(gè)擺體頻率的比率基礎(chǔ)上估計(jì)出來。
ω^robot=ωhumanlhumanlrobot]]>接著,下面將討論在B-2-2-2的模擬中人類行走數(shù)據(jù)和通過自適應(yīng)獲得的機(jī)器人行走周期之間的關(guān)系。
在參考文獻(xiàn)[26]中包含的行走數(shù)據(jù)是身高176cm、年齡為29歲的男子的行走數(shù)據(jù)。從人類解剖學(xué)已知,腿的長(zhǎng)度占人體身高的約49%[28]。因此,在此假定人的腿部長(zhǎng)度為lhuman=1.76×0.49=0.86m。由于機(jī)器人的腿部長(zhǎng)度為lrobot=0.4m,可以在上述公式[公式26]標(biāo)度的規(guī)則的基礎(chǔ)上,利用下式,來估計(jì)行走頻率和機(jī)器人走一步所需要的時(shí)間。
行走頻率ω^robot=7.87rad/s]]>(弧度/秒)每一步所需時(shí)間0.399sec(秒)作為機(jī)器人模擬的結(jié)果,利用B-2-2-2的自適應(yīng)規(guī)則,獲得以下所示的近似公式(對(duì)于K=0.2,0.5和0.8在第90步到第100步之間的平均值)。
行走頻率ω^robot=8.120rad/s]]>每一步所需時(shí)間0.387sec上述結(jié)果表示了在估計(jì)值和通過模擬獲得的各自對(duì)應(yīng)值之間的誤差約為3%,并且可以在上述公式[公式26]的頻率定標(biāo)規(guī)則的基礎(chǔ)上計(jì)算預(yù)期的機(jī)器人行走周期。
接著,將通過模擬來表示,相位復(fù)原對(duì)于行走針對(duì)外部干擾的魯棒性是有效的。在該模擬中,外部推力在0.1秒內(nèi)的各個(gè)時(shí)間點(diǎn)作為外部干擾向前或向后施加到行走機(jī)器人上,來觀察機(jī)器人抵抗外部力而不摔倒可以持續(xù)多長(zhǎng)時(shí)間,該外部力是變化的。更具體地,觀察了行走機(jī)器人可承受外部干擾的大小以及在0和2π之間的每個(gè)相位Φ(以0.1弧度的間隔)的繼續(xù)行走。圖65表示了涉及相位復(fù)原的測(cè)試值和不涉及相位復(fù)原的測(cè)試值相比較的示意圖。圖66A和66B表示了-2.0N的外部力作為外部干擾、以Φ=2.0弧度(用2.0N的力推動(dòng)機(jī)器人向后)施加0.1秒的響應(yīng)例子。圖66A表示涉及相位復(fù)原的例子,而圖66B表示不涉及相位復(fù)原的例子。根據(jù)所獲結(jié)果,可以看出相位復(fù)元對(duì)于提高機(jī)器人針對(duì)外部干擾的魯棒性是有效的。
B-2-4.對(duì)于分布式相位發(fā)生器的相位復(fù)原根據(jù)本發(fā)明,定義了一種機(jī)器人,該機(jī)器人被看作是表現(xiàn)出周期運(yùn)動(dòng)和產(chǎn)生相位信號(hào)的相位發(fā)生器的一物理振蕩器。如果發(fā)現(xiàn)多個(gè)獨(dú)立展現(xiàn)出各周期運(yùn)動(dòng)的可移動(dòng)部分(如,左腿和右腿,腿和軀干的結(jié)合部等),則為上述各個(gè)可移動(dòng)部分的每一個(gè)定義多個(gè)相位發(fā)生器,參見圖6到圖10。
另一方面,盡管為了實(shí)現(xiàn)類似于生命體運(yùn)動(dòng)的機(jī)器運(yùn)動(dòng)的目的,神經(jīng)振蕩器(CPG)、從動(dòng)動(dòng)態(tài)特性、狀態(tài)機(jī)、強(qiáng)化學(xué)習(xí)、優(yōu)化和動(dòng)能約束可用來替代ZMP,但要建立一種可覆蓋所有非線性動(dòng)態(tài)系統(tǒng)(不基于數(shù)學(xué)原理的系統(tǒng))的實(shí)際設(shè)計(jì)理論是很困難的。
這樣,通過相位響應(yīng)曲線或相位復(fù)原曲線來描述多個(gè)分布式神經(jīng)振蕩器和物理世界的交互作用的、用來設(shè)計(jì)機(jī)器人的想法是可行的。由于處理相位振蕩器是唯一必需的,因而,當(dāng)物理世界設(shè)定為一部分時(shí),只需要對(duì)于一離散動(dòng)態(tài)系統(tǒng)解析地獲得用于建立穩(wěn)定周期的解。這樣,最終結(jié)果就很簡(jiǎn)單了。盡管整個(gè)系統(tǒng)是一混和控制系統(tǒng),通過相位復(fù)原對(duì)來自物理世界反饋的近似,就可得到簡(jiǎn)化。相反地,對(duì)于針對(duì)物理世界的神經(jīng)振蕩器的行為,信息的連續(xù)流通過采用目標(biāo)軌跡局部反饋的增益、力矩、對(duì)肌肉的運(yùn)動(dòng)指令、剛度、以及目標(biāo)軌跡的偏離中的至少部分來設(shè)定。至于振蕩器對(duì)相位的影響,將在一個(gè)周期內(nèi)執(zhí)行兩次或三次相位復(fù)原操作,如果可能的話只執(zhí)行一次單獨(dú)的相位復(fù)原操作。
至于分布式設(shè)置的相位發(fā)生器的相互同步,盡管可以通過穩(wěn)定變量的擴(kuò)散和/或涉及一正弦函數(shù)相差的連續(xù)動(dòng)態(tài)系統(tǒng)等來設(shè)計(jì)它,從設(shè)計(jì)和實(shí)現(xiàn)不同相差(門電路)能夠獲得較好前景的角度看,最好還是通過相位響應(yīng)曲線來設(shè)計(jì)。
當(dāng)通過實(shí)際證明否定了無需刺激而產(chǎn)生一律動(dòng)運(yùn)動(dòng)的CPG的存在時(shí),由反射學(xué)建立者Sherington確定的一系列刺激→響應(yīng)→刺激→響應(yīng)所導(dǎo)致的復(fù)雜行為(包括行走)的描述得到了簡(jiǎn)化。例如,據(jù)說一竹節(jié)蟲(七段)就是基于這一原理行走的,CPG通過感觀的輸入得到修改。盡管狀態(tài)機(jī)沒有正面地采用任何振蕩器,但是,通過進(jìn)一步粗略地觀察振蕩器相位,將其分成少量的區(qū)域,并只觀注僅在一定相位范圍驅(qū)動(dòng)的運(yùn)動(dòng)系統(tǒng)的上-下型運(yùn)動(dòng)程序,振蕩器就可以被描述出來。于是,可以有把握地說,在詞語的負(fù)面意義上,相位振蕩器就設(shè)立于狀態(tài)機(jī)的背景下。根據(jù)本發(fā)明設(shè)計(jì)一機(jī)器人的原理本質(zhì)上就在于系統(tǒng)化地把狀態(tài)機(jī)縮減為相位振蕩器和相位復(fù)原。
圖43為相位振蕩器和相位復(fù)原機(jī)構(gòu)的示意圖。在所舉例子中,對(duì)應(yīng)一相位發(fā)生器和物理振蕩器P的神經(jīng)振蕩器N包括檢測(cè)可移動(dòng)部分的傳感器,其狀態(tài)量取自狀態(tài)機(jī),它可以是一腿部移動(dòng)的機(jī)器人。神經(jīng)振蕩器N連續(xù)地提供相位信息Φ和/或基于相位信息的控制輸出U。另一方面,物理振蕩器P提供相位復(fù)原信息。
本發(fā)明的發(fā)明人考慮了通過一連續(xù)的交互作用、或通過對(duì)某一連續(xù)交互作用的近似,來對(duì)相位發(fā)生器進(jìn)行相位復(fù)原。理由如下??梢詳喽ǎ凶咄ㄟ^離散的現(xiàn)象,包括接觸、站立和擺動(dòng)來實(shí)現(xiàn)。就離散地復(fù)原相位并連續(xù)地控制軌跡、力量和剛性的混和控制而言,當(dāng)涉及拓?fù)渖舷嗤拈_或閉運(yùn)動(dòng)鏈,并注意到離散過程(接觸)、離散地復(fù)原相位(因而多個(gè)程序)時(shí),從非線性動(dòng)態(tài)系統(tǒng)的角度看,應(yīng)用連續(xù)控制規(guī)則是合理的,這些連續(xù)控制規(guī)則就實(shí)質(zhì)而言是相同的。
在行走運(yùn)動(dòng)中腿部的相位是以這樣的方式離散估計(jì)的,即通過利用如上B-2-2所述的足底的轉(zhuǎn)換(switch),使一腿接觸的相位Φ=0,而另一腿接觸的相位是Φ=π。圖44為利用雙腿移動(dòng)機(jī)器人足底轉(zhuǎn)換的相位估計(jì)機(jī)構(gòu)。在所示例子中,每次當(dāng)抬起或接觸動(dòng)作由左腿和右腿足底開關(guān)之一所檢測(cè)到時(shí),相位就復(fù)原。更具體地,在每個(gè)周期,左腿和右腿輪流保持站立和擺動(dòng),該周期被重復(fù)。由于接觸信息比抬起信息表現(xiàn)出更高程度的置信度,因此前者更適合用于相位復(fù)原的計(jì)時(shí)。
然而,僅僅通過足底的轉(zhuǎn)換(switch)來估計(jì)一離散過程(相位)是不夠精確靈敏的。換句話說,通過不僅利用足底的轉(zhuǎn)換而且利用其他各種狀態(tài)量來估計(jì)相位,置信度才可以得到提高??紤]到置信度,希望通過前饋神經(jīng)網(wǎng)絡(luò)來估計(jì)相位,以便在置信度高、條件嚴(yán)格的情況下進(jìn)行相位復(fù)原。值得希望的是,小腦具有相位估計(jì)器(前向模型)和相位復(fù)原器(反向模型)。
圖45是通過連續(xù)交互作用復(fù)原相位的機(jī)構(gòu)的示意圖。從機(jī)器人的機(jī)器機(jī)體上可以看到多個(gè)表現(xiàn)出獨(dú)立周期運(yùn)動(dòng)的可移動(dòng)部分。神經(jīng)振蕩器N1、N2、N3、N4定義為機(jī)器人每個(gè)身體部件的相位發(fā)生器。
相位發(fā)生器N1、N2、N3、N4輸出相位信息給下層控制器C,即物理振蕩器。接著,控制器C產(chǎn)生控制信息,并根據(jù)相位信息將控制信息輸出給相應(yīng)的可移動(dòng)部分。
在示例的控制機(jī)構(gòu)中,每個(gè)相位發(fā)生器都設(shè)置了一相位前饋模型(即相位估計(jì)器)。這樣,隨著可移動(dòng)部分的狀態(tài)量得到檢測(cè),就可在狀態(tài)量的基礎(chǔ)上估計(jì)可移動(dòng)部分的周期運(yùn)動(dòng)的相位或角頻率。接著,估計(jì)值送回到相位發(fā)生器N1、N2、N3、N4,相位發(fā)生器再接著根據(jù)預(yù)定的更新規(guī)則,利用估計(jì)的相位或角頻率來更新相位信號(hào)。
下面將討論圖44所示的控制機(jī)構(gòu)的操作順序。
(1)作為相位發(fā)生器操作的神經(jīng)振蕩器N切換下層控制器C,該下層控制器控制了驅(qū)動(dòng)可移動(dòng)部分的操作。
(2)作為相位發(fā)生器操作的神經(jīng)振蕩器N的相位根據(jù)物理振蕩器的可移動(dòng)部分的單個(gè)相位(或多個(gè)相位)來復(fù)原。
(3)通過利用相位響應(yīng)曲線、根據(jù)周期-相位物理系統(tǒng)中神經(jīng)振蕩器的行為使相位生成器彼此同步。相位響應(yīng)曲線將在下一節(jié)中更具體的描述。
(4)利用相位估計(jì)的前饋模型來進(jìn)行相位復(fù)原。
B-2-5.利用相位響應(yīng)曲線的相位發(fā)生器的更新規(guī)則相位發(fā)生器的更新規(guī)則通過利用相位響應(yīng)曲線(PRC),或相位復(fù)原曲線,可靠地設(shè)計(jì)用來產(chǎn)生一易于直觀理解形式的穩(wěn)定周期解。
一相位響應(yīng)曲線根據(jù)對(duì)產(chǎn)生生命體協(xié)調(diào)的律動(dòng)現(xiàn)象(如睡眠和清醒的周期,人類的手指敲擊)的觀察,來表示外部刺激和振蕩器相位改變之間的關(guān)系。例如,如果外部干擾在短時(shí)期內(nèi)按周期運(yùn)動(dòng)施加到擺體,在長(zhǎng)時(shí)間過去之后,如果外部干擾不是很顯著,擺體會(huì)恢復(fù)同一周期的原始運(yùn)動(dòng)。盡管作為收斂結(jié)果而獲得的運(yùn)動(dòng)可具有與外部干擾之前的原始運(yùn)動(dòng)周期相同的周期,還是有可能產(chǎn)生相移。相位響應(yīng)曲線(PRC)是圖中的一曲線,其中水平軸表示外部干擾施加的時(shí)間,縱軸表示產(chǎn)生的相移(向前或向后)。
讓我們來考慮圖46所示的相位響應(yīng)曲線作為例子。如果相位發(fā)生器產(chǎn)生的相位信號(hào)為Φk,則當(dāng)一信號(hào)從相位估計(jì)器輸入時(shí),產(chǎn)生ΔΦk的相移。接著,讓我們通過設(shè)計(jì)一能夠有效利用機(jī)器人機(jī)器機(jī)體動(dòng)態(tài)特性的相位反應(yīng)曲線,來依照外部律動(dòng),產(chǎn)生一希望的周期運(yùn)動(dòng)??衫脧?qiáng)化學(xué)習(xí)的框架來設(shè)計(jì)這樣一個(gè)PRC。
在此假定相位估計(jì)器每周期離散地產(chǎn)生一輸出。更具體地,當(dāng)機(jī)器人右腿接觸時(shí),它輸出一信號(hào)。接著,讓我們考慮利用相位響應(yīng)曲線更新規(guī)則,用來離散地執(zhí)行相移ΔΦk。為了簡(jiǎn)化的目的,在此假定頻率ω沒有更新。換句話說,TP和TN各自為常值。
圖47是一誘導(dǎo)微分方程的示意圖,其中TN是相位發(fā)生器的固有周期,TP是執(zhí)行周期運(yùn)動(dòng)的機(jī)器人可移動(dòng)部分的固有周期,同時(shí)Φ是用作相位發(fā)生器的神經(jīng)振蕩器的相位,Δ(Φ)是相位發(fā)生器的相位響應(yīng)曲線(在向前移動(dòng)時(shí)其符號(hào)為正),而Φk則是在第K個(gè)采樣時(shí)期,脈沖由物理振蕩器產(chǎn)生時(shí),神經(jīng)振蕩器的相位。
根據(jù)圖47和以下的公式(1)和(2),在相位估計(jì)器利用相位響應(yīng)曲線PRC,對(duì)于相位調(diào)節(jié)后產(chǎn)生的新相位產(chǎn)生下一輸出時(shí),相位Φk+1通過以下的公式(3)來表示。對(duì)于穩(wěn)定周期運(yùn)動(dòng),在充足的時(shí)間過去后,相位產(chǎn)生器的輸出和來自相位估計(jì)器的輸入表現(xiàn)出某種固定的相位關(guān)系是必需的。因此,在公式(3)中,Φk+1=Φk。因此,如公式(4)所表示的,獲得了一平衡點(diǎn)。
舊相位φk(1)新相位φk+Δ(φk) (2)φk+1=φk+Δ(φk)+TP-TNTN---(3)]]>平衡點(diǎn)Δ(φk)=TN-TPTN---(4)]]>TN>TP需要相位超前TN<TP需要相位延遲通過利用相位響應(yīng)曲線PRC,就可能在曲線上獲得靜態(tài)求解的穩(wěn)定性。圖48表示了一相位響應(yīng)曲線上所示的上述公式(4)。如所示的,公式和曲線的相交點(diǎn)表示收斂后的相移。如果相位響應(yīng)曲線的梯度為負(fù),相交點(diǎn)就是表示靜態(tài)周期解存在的穩(wěn)態(tài)平衡點(diǎn)。另一方面,如果相位響應(yīng)曲線的梯度為正,則由于相位發(fā)散而不存在穩(wěn)態(tài)解。因此,通過設(shè)計(jì)這樣一條相位響應(yīng)曲線,可能很容易在曲線上保證靜態(tài)周期解的存在。
利用相位響應(yīng)曲線的設(shè)計(jì)可以應(yīng)用到一組相位發(fā)生器中。圖49是利用兩個(gè)相位發(fā)生器之間相互離散的信號(hào)的誘導(dǎo)的示意圖。
對(duì)于互導(dǎo)(mutual entrainment)的微分方程用以下的公式(5)到(7)表示。圖50表示了互導(dǎo)的微分方程的示意圖。如圖50所示,可以根據(jù)曲線確定穩(wěn)定性。因此,通過利用一相位響應(yīng)曲線,可以根據(jù)曲線來輕而易舉地在一組相位發(fā)生器中獲得靜態(tài)周期解。
φk+1=T2T1-1+φk+Δ1(φk)-T2T1Δ2[T1T2{1-φk-Δ1(φk)}]]]>B-2-6.利用一神經(jīng)網(wǎng)絡(luò)的相位估計(jì)器在上述實(shí)施例中,足底的轉(zhuǎn)換被用來離散地估計(jì)在行走運(yùn)動(dòng)中例如一條腿接觸的相位Φ=0,另一條腿接觸的相位Φ=π。然而,僅靠足底的轉(zhuǎn)換來估計(jì)離散過程(相位)是不夠靈敏精確的。換句話說,通過不僅利用足底的轉(zhuǎn)換而且利用其他各種狀態(tài)量來估計(jì)相位,穩(wěn)定的程度才可以得到提高。在本節(jié),將描述利用神經(jīng)網(wǎng)絡(luò)的相位估計(jì)器的一般構(gòu)造。
一神經(jīng)網(wǎng)絡(luò)構(gòu)造成在傳感器讀數(shù)v的基礎(chǔ)上輸出估計(jì)的相位值Φ’。作為例子,采用下式所示的線性模型。
φ′=Σi=1nwibi(v)]]>在上式中,wi是第i個(gè)網(wǎng)絡(luò)的負(fù)載(參數(shù)),而bi()是第i個(gè)基礎(chǔ)函數(shù)。例如,可采用下式表示的徑向基礎(chǔ)函數(shù)。在下式中,n是基礎(chǔ)函數(shù)的數(shù)量。
bi(v)=exp(-(V-Vi)TD(V-Vi))在上式中,vi是第i個(gè)基礎(chǔ)函數(shù)的中心值,D是確定該基礎(chǔ)函數(shù)的大小的參數(shù)。
接著,讓我們考慮利用神經(jīng)網(wǎng)絡(luò)的輸出,由下式所表示的正態(tài)分布所實(shí)現(xiàn)的概率模型。
P(φ|V)=12πσ2exp{-(φ-φ′)22σ2}]]>在上式中,σ2表示方差。通過采用上式對(duì)于當(dāng)前相位可獲得一概率模型。這樣,如果Φa<Φ<Φb且P(Φ|V)>a成立,就可以切換一控制器。在上述表達(dá)式中,Φa和Φb表示切換控制器的相位,a表示閾值。
還可以利用概率模型并通過Bayes(貝葉斯)估計(jì)來構(gòu)造一相位估計(jì)器。
首先,作為例子,相位的先驗(yàn)概率通過下式所表達(dá)的正態(tài)分布來表示。
p(φ)=12πσ02exp{-(φ-φ0)22σ02}]]>在上式中,Φ0是來自相位輸出單元的平均相位輸出,σ2是其方差。此外,當(dāng)相位給定時(shí)所預(yù)測(cè)的傳感器讀數(shù)的概率模型由下面的公式來表示。
P(V|φ)=1(2π)d/2|Σ|1/2exp{-12(V-V′(φ))TΣ-1(V-V′(φ))}]]>在上式中,V’(Φ)是輸出來自當(dāng)前相位的讀數(shù)的函數(shù),∑是讀數(shù)的協(xié)方差矩陣。接著,通過Bayes估計(jì)獲得下式。
P(φ|V)=P(V|φ)P(φ)P(V)]]>因此,如果Φa<Φ<Φb且P(Φ|V)>a成立,例如,就可切換一控制器。在上述表達(dá)式中,Φa和Φb表示切換控制器的相位,a表示閾值。
還可以采用一混和分布來作為表達(dá)更復(fù)雜概率分布的技術(shù)。
B-3.利用基于模型的強(qiáng)化學(xué)習(xí)的雙足運(yùn)動(dòng)有效學(xué)習(xí)算法為了理解人類的行走學(xué)習(xí)機(jī)制,并通過學(xué)習(xí)算法的過程實(shí)現(xiàn)有效行走,本節(jié)將描述雙足機(jī)器人的學(xué)習(xí)算法。盡管行走運(yùn)動(dòng)可表達(dá)為一項(xiàng)向前邁步進(jìn)入下一步而不會(huì)跌倒的任務(wù),獲得教師的軌跡從而產(chǎn)生一穩(wěn)定的行走卻常常是不容易的。因此,在本實(shí)施例中,強(qiáng)化學(xué)習(xí)用來作為學(xué)習(xí)的框架。
B-3-1.雙足機(jī)器人在本節(jié)將處理通過支撐柱(rod)限定在兩維平面上的一個(gè)五段機(jī)器人(見圖51)。由于采用了直接驅(qū)動(dòng)型電機(jī)作為致動(dòng)器,改進(jìn)的真實(shí)機(jī)器人具有高水平的背后操作性能。在下表中列出了機(jī)器人的識(shí)別的物理參數(shù)。
要處理雙足運(yùn)動(dòng)的問題,在地面(floor)和足底之間的接觸/碰撞是一個(gè)問題。在改進(jìn)的模擬器中采用的碰撞模型由下式表示。
Fx=kx(xg-x)-bxx·,Fz=kz(zg-z)-bzz·(ifz<zg)]]>Fx=0,F(xiàn)z=0(if z≥zg)在上式中,F(xiàn)x和Fz分別代表在地面水平方向的反作用力和垂直方向的反作用力,x、z分別代表足尖的水平位置和垂直位置,同時(shí)xg表示足尖的接觸點(diǎn),zg表示足尖的高度。一彈簧阻尼器模型用來表示地面的反作用力。kx=3000的位置增益和bx=30的速度增益用于水平方向,而kz=500的位置增益和bz=100的速度增益用于垂直方向。對(duì)于水平地面接觸模型,當(dāng)Fx>cFz時(shí),采用xg=x,其中c=1.0,是靜態(tài)摩擦系數(shù)。
B-3-2.實(shí)現(xiàn)采用狀態(tài)機(jī)的真實(shí)機(jī)器人的雙足運(yùn)動(dòng)在本節(jié)將討論提供學(xué)習(xí)算法基礎(chǔ)的技術(shù)。作為最初的嘗試,一種采用狀態(tài)機(jī)[29]的方法被應(yīng)用到真實(shí)機(jī)器人中(見圖51),其中該狀態(tài)機(jī)已作為建立行走控制器的技術(shù)獲得了良好的效果。
B-3-2-1.狀態(tài)轉(zhuǎn)換圖對(duì)于采用狀態(tài)機(jī)的方法,定義轉(zhuǎn)換的狀態(tài)和條件是必需的。狀態(tài)和條件的定義通過模擬和實(shí)際硬件來實(shí)驗(yàn)性地提供。圖52是一真實(shí)機(jī)器人的狀態(tài)轉(zhuǎn)換示意圖。
參照?qǐng)D52,狀態(tài)1是雙足支撐狀態(tài)。隨著擺腿從地面舉起,轉(zhuǎn)換發(fā)生,產(chǎn)生狀態(tài)2。狀態(tài)2是擺腿向前擺動(dòng)的狀態(tài)。隨著擺腿的足尖通過支撐腿移動(dòng),轉(zhuǎn)換發(fā)生,產(chǎn)生狀態(tài)3。狀態(tài)3是擺腿伸伸展的狀態(tài)。隨著上身在支撐腿上移動(dòng),轉(zhuǎn)換發(fā)生,產(chǎn)生狀態(tài)4。狀態(tài)4是輕微彎曲的支撐腿膝部伸開、踢到地面,從而注入能量的狀態(tài)。隨著擺腿接觸,轉(zhuǎn)換發(fā)生,回到狀態(tài)1。通過這種方式,左腿和右腿輪流作為支撐腿和擺腿動(dòng)作。
B-3-2-2.試驗(yàn)結(jié)果圖53表示了通過試驗(yàn)獲得的表示行走中關(guān)節(jié)角度軌跡的曲線,圖54表示了通過試驗(yàn)獲得的表示輸出力矩軌跡的曲線。圖55是記錄的行走模式的示意圖,該行走模式通過采用真實(shí)的硬件所獲得(真實(shí)機(jī)器人的行走模式,(左欄)左腿為支撐腿,(右欄);右腿為支撐腿,行走過程從上到下)。
B-3-3.行走周期的估計(jì)在剛剛的上一節(jié)里描述了采用狀態(tài)機(jī)的動(dòng)態(tài)雙足運(yùn)動(dòng)。然而,采用相同參數(shù)的狀態(tài)機(jī)可能無法處理環(huán)境中的改變。在本節(jié)將討論行走控制器的環(huán)境適應(yīng)能力。
圖56是采用了貓的動(dòng)物試驗(yàn)的示意圖。圖56左側(cè)示意圖表示了貓的行走配合試驗(yàn)。只有向左的踏步可改變其速度。圖56的右側(cè)示意圖表示了小腦的模型和CPG。在該示意圖中,CF表示攀緣纖維。CF從CPG接收反饋。該試驗(yàn)表明,小腦參與了中央模式發(fā)生器(CPG)[30]的參數(shù)的改變??梢韵嘈?,大腦的學(xué)習(xí)一般是監(jiān)控的學(xué)習(xí),其采用攀緣纖維[31]所發(fā)送的誤差信號(hào)。有報(bào)告顯示,在需要改變CPG參數(shù)[30]的適應(yīng)性試驗(yàn)中,攀緣纖維的觸發(fā)頻率顯著上升??紤]到以上知識(shí),可以有把握的說,問題在于獲得某些類型的誤差信號(hào),用來通過行走對(duì)象和周圍環(huán)境的交互作用來改變CPG參數(shù)。
盡管不清楚實(shí)際涉及什么樣的誤差信號(hào),本發(fā)明的發(fā)明人想到了通過行走周期來檢測(cè)誤差的方法。讓我們通過采用周圍環(huán)境信息來使行走軌跡發(fā)生器的行走周期適應(yīng)于主題的動(dòng)態(tài)系統(tǒng)。用來實(shí)現(xiàn)目標(biāo)行走周期的角頻率ω*可從實(shí)際行走所需的周期中導(dǎo)出,從而獲得下式。
ω*=πT]]>這樣,誤差信號(hào)就可用下式來表示。
E=ω*-ω^n]]>在上式中,ωn是第n步估計(jì)的角頻率。這樣,角頻率的更新規(guī)則可由下式表示。
ωΛn+1=ωΛn+K(ω*-ωΛ)]]>如圖57所示的具有簡(jiǎn)單三段結(jié)構(gòu)的雙足機(jī)器人模型用來驗(yàn)證上述技術(shù)。使所用的控制器跟蹤如下式所示的周期目標(biāo)軌跡。
Tl=k(asinφ-θl)-bθ·l]]>Tr=k(-asinφ-θr)-bθ·r]]>在上式中,τ1和τr分別是施加到左腿的力矩和施加到右腿的力矩,k=5.0和b=0.1分別是位置增益和速度增益,同時(shí)θ1和θr分別是左腿的角度和右腿的角度。估計(jì)的當(dāng)前相位由Φ=ω(hat)t所示,其中t是當(dāng)前時(shí)鐘時(shí)間。
B-3-3-1.模擬結(jié)果首先,對(duì)于行走周期未估計(jì)的情況通過模擬進(jìn)行試驗(yàn)。對(duì)于在平坦的地面(坡度角=0)上易于行走的行走周期,給定了適當(dāng)?shù)某跏紬l件(在移動(dòng)方向上的初始速度0.2[米/秒]),并選擇了初始值(T=0.42[秒],ω0=15[弧度/秒])。當(dāng)機(jī)器人行走在上坡(3度),接著再下坡(4度)的時(shí)候,在每個(gè)斜坡上行走10步之前,它就絆跌并倒下了。
另一方面,在估計(jì)了行走周期時(shí),機(jī)器人就能在上述斜坡上持續(xù)行走。然而,要注意,在行走周期已經(jīng)估計(jì)時(shí),上述坡度角表示機(jī)器人持續(xù)行走的限度。當(dāng)坡度角超過了上述各限度,機(jī)器人就不能僅靠估計(jì)行走周期應(yīng)付這些斜坡。
B-3-4.通過采用強(qiáng)化學(xué)習(xí)來獲得行走運(yùn)動(dòng)由上所述,可以看出通過使周期行走軌跡與環(huán)境動(dòng)態(tài)系統(tǒng)的計(jì)時(shí)相匹配,就可獲得穩(wěn)定的行走。然而,沒有手段修改行走軌跡。在本節(jié)將要討論一種對(duì)于機(jī)器人在原始給定的行走軌跡下無法穩(wěn)定行走的情況,通過采用強(qiáng)化學(xué)習(xí)的框架、學(xué)習(xí)能使機(jī)器人行走的軌跡的方法。在此,一種類似于B-3-2節(jié)所述狀態(tài)機(jī)框架的框架用于提出的模型。此外,由于根據(jù)相位給定了轉(zhuǎn)換條件,前一節(jié)所述的估計(jì)行走周期的方法也是可用的。
通過本節(jié)提出的技術(shù),在行走軌跡中,在兩個(gè)poincare部分上(相位Φ=π/2,Φ=3π/2)實(shí)現(xiàn)參數(shù)更新和行為確定。如圖58所示,行走軌跡通過四個(gè)中間姿態(tài)(路徑點(diǎn))(只在相位Φ=π/2,Φ=3π/2處的poincare部分上實(shí)現(xiàn)參數(shù)更新和行為選擇)來表示。然而,應(yīng)該注意,由于橫向?qū)ΨQ,只需要確定兩個(gè)中間姿態(tài)。這一框架表示了狀態(tài)的狀態(tài)轉(zhuǎn)換條件是通過相位來確定的(如圖58所示,狀態(tài)轉(zhuǎn)換的進(jìn)行發(fā)生在相位Φ=0,Φ=π/2,Φ=π和Φ=3π/2上)。對(duì)于狀態(tài)轉(zhuǎn)換條件,還提出了采用Matsuoka振蕩器[2]輸出的技術(shù)作為類似的框架,并成功應(yīng)用于四足機(jī)器人[32]中。提出的技術(shù)被看作是一種采用了四個(gè)作為路徑點(diǎn)[33]的中間姿態(tài)的軌跡產(chǎn)生方法。
接著,將通過采用模型來設(shè)計(jì)學(xué)習(xí)技術(shù)。使學(xué)習(xí)器官的輸入x的狀態(tài)包括來自支撐腿的足尖和加速部件的上身的位移。圖59是學(xué)習(xí)狀態(tài)的定義(左)和行為的定義(右)的示意圖。簡(jiǎn)短來說,這里采用了對(duì)應(yīng)于倒擺的狀態(tài)表述,該倒擺采用支撐腿作為支撐點(diǎn)。如圖59所示,學(xué)習(xí)器官的輸出是擺腿的膝關(guān)節(jié)的目標(biāo)角度,它對(duì)應(yīng)于擺腿接觸點(diǎn)的選擇。
B-3-4-1.基于模型的強(qiáng)化學(xué)習(xí)方法本節(jié)將簡(jiǎn)單描述利用一模型[34,35]的強(qiáng)化學(xué)習(xí)。如果控制對(duì)象模型已知,它就可用于強(qiáng)化學(xué)習(xí)。然而,在此假定這種模型是未知的。那么,就必須了解控制對(duì)象的模型。因而,這里首先將描述了解一模型的方法。
模型學(xué)習(xí)在監(jiān)控學(xué)習(xí)的框架內(nèi)可獲得一控制對(duì)象的模型。通過利用本實(shí)施例的技術(shù)來了解一動(dòng)態(tài)模型意味著獲得從相位π/2到相位3π/2的映射狀態(tài)x(由于對(duì)稱,同樣是從Φ=3π/2到相位Φ=π/2)。離散時(shí)間動(dòng)態(tài)特性用如下所示的方式來表述。讓我們利用一函數(shù)近似器來考慮近似。
X3π2=f(Xπ2,uπ2)]]>換句話說,采用了一種由以下公式所表述的、具有參數(shù)m的函數(shù)近似器來估計(jì)動(dòng)態(tài)特性。如下所示的在一離散時(shí)間上的狀態(tài)可用于一訓(xùn)練信號(hào)。
f^(Xπ2,uπ2)=f^(Xπ2,uπ2;m)]]>學(xué)習(xí)一值函數(shù)強(qiáng)化學(xué)習(xí)的目的是要獲得一行為規(guī)則,最大化(或最小化)通過一系列行為在各時(shí)間所接受的獎(jiǎng)勵(lì)(或懲罰)之和。換句話說,如果在時(shí)間T接受的獎(jiǎng)勵(lì)是r(T),則更新行為規(guī)則,以最大化由下式定義的累積獎(jiǎng)勵(lì)的預(yù)期值(稱為值函數(shù)),其中γ(0≤γ≤1)表示折減(discount)率。
V(x(T))=E[r(T+1)+γr(T+2)+γ2r(T+3)+...]這里的問題是,如何用它來通過學(xué)習(xí)和更新行為規(guī)則的方式估計(jì)值函數(shù)。
在此,讓我們考慮用下式,通過采用一連續(xù)函數(shù)的函數(shù)近似器來近似值函數(shù)。
V^(x)=V^(x;V)]]>在上式中,v代表函數(shù)近似器的參數(shù)向量。來自獎(jiǎng)勵(lì)和滿足以上公式[公式44]的值函數(shù)之間關(guān)系的偏差通過下式表示,并稱為時(shí)間差分(temporaldifference)誤差(TD誤差)。
δ(T)=r(T+1)+γV^(T+1)-V^(T)]]>值函數(shù)利用上述誤差,按照下式所述的方式來更新。然而,注意β=0.2是學(xué)習(xí)速率,它必須定義為參數(shù)。
V^(x(T))←V^(x(T))+βδ(T)]]>學(xué)習(xí)行為規(guī)則估計(jì)模型和值函數(shù)用來更新行為規(guī)則。更新行為規(guī)則的過程如下所示。
(1)利用當(dāng)前行為規(guī)則和估計(jì)模型來估計(jì)下一時(shí)鐘時(shí)間(相位)的狀態(tài)。
(2)計(jì)算在下一時(shí)鐘時(shí)間(相位),狀態(tài)的值函數(shù)的梯度V/x。
(3)計(jì)算在下一時(shí)鐘時(shí)間(相位),狀態(tài)的模型輸入的梯度f/u。
(4)盡管希望更新行為規(guī)則以便使?fàn)顟B(tài)向值函數(shù)梯度V/x的轉(zhuǎn)化得以發(fā)生,但通過控制輸入,在一步的離散時(shí)間內(nèi)發(fā)生這樣的轉(zhuǎn)換是不可能的。因此,在使控制輸入通過模型輸入的梯度f/u來進(jìn)行該操作的方向上,執(zhí)行映射操作。換句話說,在V/x·f/u的方向上更新行為規(guī)則。
u(x(T))←u(x(T))+α∂V∂x∂f∂u]]>在上式中,α=0.2,是學(xué)習(xí)速率,它被定義為參數(shù)。
作為函數(shù)近似器,采用了相應(yīng)場(chǎng)加權(quán)回歸(RFWR)[23]。
試驗(yàn)結(jié)果上述技術(shù)用于如圖51所示的5段模型,并通過模擬得到了驗(yàn)證。然而,對(duì)于初始步驟,目標(biāo)軌跡是單獨(dú)準(zhǔn)備的。
圖60表示了在學(xué)習(xí)過程(第25次嘗試)中舉例性的行走軌跡的示意曲線。由于搜索作用,在接觸時(shí)間對(duì)于擺腿膝關(guān)節(jié)的目標(biāo)角度的輸出表現(xiàn)為發(fā)散。由于輸出目標(biāo)姿態(tài)通過采用最小抖動(dòng)(jerk)標(biāo)準(zhǔn)(5階樣條函數(shù)(spline))的軌跡進(jìn)行插值,每個(gè)關(guān)節(jié)的目標(biāo)角度都表現(xiàn)為平滑連續(xù)。這種技術(shù)由Wada等人[33]以及Miyamoto等人[36]提出。在大約50次嘗試后獲得穩(wěn)定的行走。圖61表示經(jīng)過學(xué)習(xí)過程之后,穩(wěn)定行走軌跡的示意曲線。在第一個(gè)四步左右,膝蓋很大程度上地彎曲,隨后伸展接觸地面,以便注入能量并防止跌倒。
圖67在上面一行表示學(xué)習(xí)之前的行走軌跡,中間一行表示30次嘗試之后的行走軌跡。圖68表示在每次嘗試之后的累積獎(jiǎng)勵(lì)。在行走50步時(shí)獲得的行走定義為成功。作為五次試驗(yàn)的結(jié)果,平均在80次嘗試之后獲得行走運(yùn)動(dòng)。圖67的下一行表示獲得的行走軌跡。
圖69表示通過模擬獲得的值函數(shù)。根據(jù)圖69,可以得出以下定性推論。(d,d)=(-0.2,-1.0)或支撐腿向前放置,且髖關(guān)節(jié)表示向后速度,這樣機(jī)器人容易向后倒下。這時(shí),值函數(shù)表現(xiàn)為較小的值。當(dāng)(d,d)=(0.0,0.5)或支撐腿處于垂直于髖關(guān)節(jié)的線上,并表現(xiàn)出向前速度,則值函數(shù)表現(xiàn)為較大的值。換句話說,當(dāng)機(jī)器人向前移動(dòng),值函數(shù)表現(xiàn)為較大值。根據(jù)以上內(nèi)容,可以理解獲得了定性合理的值函數(shù)。
提出的該技術(shù)應(yīng)用到了實(shí)際硬件中。圖70表示在學(xué)習(xí)之前的行走運(yùn)動(dòng)??梢钥闯鰴C(jī)器人在很少幾步內(nèi)跌倒了。圖71表了學(xué)習(xí)之后的行走運(yùn)動(dòng)。在大約50次嘗試之后,機(jī)器人獲得了穩(wěn)定行走運(yùn)動(dòng)。一般,在多自由度系統(tǒng)學(xué)習(xí)例如行走,在實(shí)際硬件的學(xué)習(xí)收斂之前,需要幾百次到幾萬次的嘗試,因此實(shí)際上不可能驗(yàn)證實(shí)際硬件的學(xué)習(xí)。相反,通過上述技術(shù),機(jī)器人的學(xué)習(xí)在大約只有50次之后就收斂了,這對(duì)于實(shí)際硬件來說是一個(gè)可行的數(shù)字。因此,證明了該技術(shù)的有效性。圖72表示作為采用實(shí)際硬件的試驗(yàn)結(jié)果所獲得的值函數(shù)??梢钥闯觯摵瘮?shù)的分布曲線類似圖69所示的模擬的結(jié)果。
為了驗(yàn)證機(jī)器人對(duì)于環(huán)境改變的適應(yīng)性,通過使用作為學(xué)習(xí)結(jié)果獲得的控制器,驅(qū)動(dòng)機(jī)器人行走在具有斜坡的環(huán)境中。通過改變斜坡步幅,每次提高0.1度的梯度,對(duì)機(jī)器人進(jìn)行了測(cè)試。人們發(fā)現(xiàn),機(jī)器人可穩(wěn)定行走在梯度不大于0.6度的上坡,以及梯度不大于0.2度的下坡上。使行走周期等于T=0.79[秒](ω=8.0[弧度/]秒)。這些結(jié)果與B-4-2所述的采用真實(shí)硬件所獲得的結(jié)果基本上是相同的。
B-3-4-2.行走周期估計(jì)方法的應(yīng)用環(huán)境改變的可能應(yīng)用如上一節(jié)所述進(jìn)行了測(cè)試。由于其不能產(chǎn)生踝力矩,機(jī)器人幾乎不能使自己適應(yīng)假定的具有較大梯度的上坡。由于定義的行走周期與下坡的動(dòng)態(tài)特性不匹配,機(jī)器人也不能使自己適應(yīng)假定的下坡。然而,本實(shí)施例的學(xué)習(xí)方法采用了相位作為轉(zhuǎn)換條件,就可以采用B-3-3所具體描述的行走周期估計(jì)方法。因此,采用行走估計(jì)方法,通過模擬進(jìn)行了適應(yīng)性試驗(yàn)。對(duì)于環(huán)境,選擇了1.5度的下坡。接著,機(jī)器人在前七次嘗試不斷跌倒之后,在第八次嘗試時(shí)成功實(shí)現(xiàn)了穩(wěn)定行走。
B-3-4-3.所獲行為規(guī)則的分析本節(jié)將驗(yàn)證離散動(dòng)態(tài)特性的穩(wěn)定性,它是由分別在圖58所示的相位Φ=π/2,Φ=3π/2處,在poincare橫截面中所獲的行為規(guī)則所產(chǎn)生的。在各poincare橫截面處的離散動(dòng)態(tài)特性的Jacobean本征值用于驗(yàn)證方法[37,38]??梢哉J(rèn)為,如果每個(gè)本征值λi為|λi(J)|<1,周期軌跡就是穩(wěn)定的。由于本實(shí)施例的技術(shù)采用了連續(xù)函數(shù)來表示動(dòng)態(tài)模型和行為規(guī)則,有可能如下式所示解析地獲得Jacobean矩陣J。
J=dfdx=∂f∂x+∂f∂u∂u(x)∂x]]>然而,請(qǐng)注意,在學(xué)習(xí)中對(duì)于搜索行為只采用了大體的表述,并且在圖59中動(dòng)態(tài)特性只采用了輸入狀態(tài)x作為狀態(tài)考慮。因而,動(dòng)態(tài)特性的近似精度可能是低于并接近穩(wěn)態(tài)行走軌跡。因此,通過模擬驅(qū)動(dòng)機(jī)器人行走50步,只在穩(wěn)定行走期間對(duì)模型進(jìn)行更新。圖62表示了所獲得的本征值變化。可以看出Jacobean矩陣的本征值隨著模型誤差的降低而變成小于1。此時(shí),行為規(guī)則不再更新。換句話說,可以確認(rèn),已學(xué)到的行為規(guī)則可根據(jù)本征值的計(jì)算來產(chǎn)生一穩(wěn)定的行走周期。
通過試驗(yàn)、利用實(shí)際硬件獲得的控制器的穩(wěn)定性在采用仿真時(shí)得到了檢驗(yàn)。每次嘗試中本征值的平均值如圖73所示用公式49來確定。從圖73中可以看出,隨著學(xué)習(xí)繼續(xù),本征值降低到最終變?yōu)樾∮?。這樣,確認(rèn)了在試驗(yàn)中用實(shí)際硬件學(xué)習(xí)到的行為規(guī)則可通過計(jì)算本征值來產(chǎn)生一穩(wěn)定行走周期。
本發(fā)明通過參考具體實(shí)施例在上面得到了具體描述。然而,顯然對(duì)于本發(fā)明所處領(lǐng)域的普通技術(shù)人員來說不只限于所述的實(shí)施例,這些實(shí)施例可以進(jìn)行修改和變化,而不脫離本發(fā)明的范圍。
本發(fā)明并不限于稱為“機(jī)器人”的產(chǎn)品。換句話說,本發(fā)明可應(yīng)用于移動(dòng)機(jī)器和通過利用電或磁效應(yīng)而展現(xiàn)出類似于人類運(yùn)動(dòng)的其他一般設(shè)備,即使這些產(chǎn)品屬于機(jī)器人工業(yè)以外的工業(yè),比如玩具。
簡(jiǎn)短地說,本發(fā)明在此只是通過實(shí)施例進(jìn)行了描述,本發(fā)明決不限于說明書的字面描述。本發(fā)明只由后附的權(quán)利要求書所限定。
<參考文獻(xiàn)>
1Avis H.Cohen,“運(yùn)動(dòng)控制原理——看向生物”(AMAM 2003)2Matsuoka,K.,“由具有自適應(yīng)的交互抑制神經(jīng)產(chǎn)生的持續(xù)振蕩”(生物控制論,52,第345-353頁(1985))3Matthew M.Williamson,“律動(dòng)性手臂運(yùn)動(dòng)的神經(jīng)控制”(神經(jīng)網(wǎng)絡(luò),第11卷,第7-8期,第1379-1394(1998))4Kotosaka,S.Schaal,“通過神經(jīng)振蕩器的同步機(jī)器人振動(dòng)”(日本機(jī)器人協(xié)會(huì)期刊,第19卷,第1,第116-123頁(2001))5Miyakoshi,Taga,Kuniyoshi,“對(duì)于一神經(jīng)振蕩器參數(shù)的自調(diào)整機(jī)構(gòu)”(機(jī)器人討論會(huì)文集,第301-306頁(2000))6G.Taga,Y.Yamaguchi,Hi Shimizu,“在不可預(yù)知環(huán)境中通過神經(jīng)振蕩器的雙足運(yùn)動(dòng)的自組織控制,生物控制論,第65卷,第147-159頁(1991)”7G.Taga,“對(duì)于I型人類運(yùn)動(dòng)的神經(jīng)-肌肉-骨骼系統(tǒng)模型”(基礎(chǔ)步法的產(chǎn)生,生物控制論,第73卷,第97-111頁(1995))8G.Taga,“對(duì)于II型人類運(yùn)動(dòng)的神經(jīng)-肌肉-骨骼系統(tǒng)模型”(各種約束下的實(shí)時(shí)自適應(yīng),生物控制論,第73卷,第113-121頁(1995))9Hase,Yamazaki,“利用神經(jīng)振蕩器和基因算法的真假雙足運(yùn)動(dòng)的產(chǎn)生”(儀表和控制工程師協(xié)會(huì)學(xué)報(bào),第33卷,第5,第448-454頁(1997))10Hase,Yamazaki,“產(chǎn)生雙足運(yùn)動(dòng)的神經(jīng)結(jié)構(gòu)的自發(fā)獲得”“日本機(jī)械工程師協(xié)會(huì)期刊(叢書C),第64卷,第625,第3541-3547頁(1998)”11M.Sato,Y.Nakamura,S.Ishii,“雙足運(yùn)動(dòng)的強(qiáng)化學(xué)習(xí)”(ICANN(2002))12Fukuoka,Kimura,“四足機(jī)器人在不平坦區(qū)域的生物激勵(lì)自適應(yīng)動(dòng)態(tài)行走——基于軀體感覺和前庭感覺的調(diào)整”(日本機(jī)器人協(xié)會(huì)期刊,第19卷,第4,第510-517頁(2001))13H.Kimura,Y.Fukuoka,T.Miura,“四足機(jī)器人基于綜合運(yùn)動(dòng)自適應(yīng)的動(dòng)態(tài)特性”(AMA2003)14Miyakoshi,Yamamoto,Taga,Kuniyoshi,“類似圓規(guī)的雙足運(yùn)動(dòng)模擬報(bào)告”(日本機(jī)器人協(xié)會(huì)第18屆年會(huì)論文集(2000))15G.Taga,“一種綜合姿勢(shì)與運(yùn)動(dòng)的模型”(國際生物力學(xué)計(jì)算機(jī)仿真會(huì)議論文集(1997))
16Miyakoshi,Taga,Kuniyoshi,Nagakubo,“利用神經(jīng)振蕩器的三維雙足步伐運(yùn)動(dòng)——模擬真實(shí)世界的人類運(yùn)動(dòng)”(日本機(jī)器人協(xié)會(huì)期刊,第18卷,第1,第87-93頁(2000))17T.McGeer,“從動(dòng)動(dòng)態(tài)行走”(IJRRR,第62-82頁(1990))18Pratt,Jerry,“在雙足行走機(jī)器人的控制中采用固有魯棒性和固有動(dòng)態(tài)特性”(馬薩諸塞州,劍橋,麻省理工學(xué)院,計(jì)算機(jī)科學(xué)系,Thesis博士(2000))19Hase,K.,Yamazaki,N.,“采用神經(jīng)-肌肉-骨骼模型的人類雙足行走的計(jì)算機(jī)運(yùn)算”(人工生命和機(jī)器人,第3卷,第133-138頁,1999)20Taga,G.,“人類電機(jī)控制的非線性動(dòng)態(tài)特性——運(yùn)動(dòng)和運(yùn)動(dòng)開發(fā)的實(shí)時(shí)和預(yù)測(cè)自適應(yīng)”(國際動(dòng)物和機(jī)器自適應(yīng)運(yùn)動(dòng)會(huì)議論文集,2000)21Miyakoshi,S.,Yamakita,M.,F(xiàn)uruta,K.,“利用神經(jīng)振蕩器的判別控制”(IEEE/RSJ國際智能機(jī)器人和系統(tǒng)會(huì)議論文集,第1186-1193頁,1994)22Ijspeert,A.,Nakanishi,J.,Schaal.S.,“用于學(xué)習(xí)電機(jī)基元的學(xué)習(xí)吸引景觀”(神經(jīng)信息處理系統(tǒng)(NIPS 2002),2002)23Schaal,S.,Atkeson,C.G.,“只根據(jù)局部信息的結(jié)構(gòu)性遞增學(xué)習(xí)”(神經(jīng)計(jì)算,第10卷第8,第2047-2084頁,1998)24Mitsuo Kawato,“對(duì)于活體的律動(dòng)現(xiàn)象的工程研究”(醫(yī)學(xué)電子和生物工程期刊,第19卷第3,第171-178,1981)25http//www.sdfast.com26Yoshihiro Ehara,Sumiko Yamamoto,“對(duì)軀體動(dòng)態(tài)特性的介紹——開始行走和行走的分析”(Ishiyaku公開物,2002)27Strogatz,S.H.,“非線性動(dòng)態(tài)特性與混沌狀態(tài)用于物理學(xué)”(Addison-Wesley,1994)28Dempster,W.T.,Gaughran,G.R.L.,“基于尺寸和重量的軀體片段特性”(美國解剖學(xué)雜志,第120卷,第33-54頁,1965)29M.H.Raibert,“平衡的有腿機(jī)器人”(MIT出版物,劍橋,MA,1986)30Dai Yanagihara“運(yùn)動(dòng)學(xué)習(xí)與小腦”(身體訓(xùn)練科學(xué),第46卷,第6,第455-463頁,1996)31Mitsuo Kawato“大腦計(jì)算原理”“Sanyo Tosho,1996”32Y.Fukuoka,H.Kimura,“基于生物概念的四足機(jī)器人在不平坦區(qū)域的自適應(yīng)動(dòng)態(tài)行走”(國際機(jī)器人協(xié)會(huì)期刊,第22卷,第2,第187-202頁,2003)33Y.Wada,M.Kawato,“基于最小化原理的草寫體理論”(生物控制論,第73卷,第3-15頁,1995)34R.S.Sutton,A.G.Barto,“強(qiáng)化學(xué)習(xí)概論”(MIT出版物,劍橋,MA,1998)35K.Doya,“在連續(xù)時(shí)間和空間上的強(qiáng)化學(xué)習(xí)”(神經(jīng)計(jì)算,第12卷,第1,第219-245,2000)36H.Miyamoto,S.Schaal,F(xiàn).Gandolfo,H.Gomi,Y.Koike,R.Osu,E.Nakano,Y.Wada,M.Kawato,“基于雙向原理的Kendama學(xué)習(xí)機(jī)器人”(神經(jīng)網(wǎng)絡(luò),第9卷,第1281-1302頁,1996)37M.Garcia,A.Chatterjee,A.Ruina,M.J.Colemang,“最簡(jiǎn)單的行走模型;穩(wěn)定性,復(fù)雜性及定標(biāo)”(ASME生物力學(xué)工程雜志,第120卷,第2,第281-288頁,1998)38R.Q.Van der Linde,“通過相位肌肉收縮的從動(dòng)雙足行走”(生物控制論,第82卷,第227-237頁,1999)
權(quán)利要求
1.一種具有多個(gè)可移動(dòng)部分的機(jī)器人,該機(jī)器人包括相位信號(hào)發(fā)生裝置,用來產(chǎn)生與至少部分可移動(dòng)部分的周期運(yùn)動(dòng)相關(guān)的相位信號(hào);控制裝置,用來根據(jù)相位信號(hào)產(chǎn)生對(duì)于可移動(dòng)部分的控制信號(hào);驅(qū)動(dòng)裝置,用來根據(jù)控制信號(hào)驅(qū)動(dòng)可移動(dòng)部分;狀態(tài)量檢測(cè)裝置,用來檢測(cè)驅(qū)動(dòng)裝置所驅(qū)動(dòng)的可移動(dòng)部分的狀態(tài)量;以及估計(jì)裝置,用來根據(jù)狀態(tài)量估計(jì)可移動(dòng)部分周期運(yùn)動(dòng)的相位或角頻率;相位信號(hào)發(fā)生裝置適于根據(jù)估計(jì)裝置所估計(jì)的相位或角頻率來更新相位信號(hào)。
2.根據(jù)權(quán)利要求1的機(jī)器人,其中控制裝置包括多個(gè)具有不同控制規(guī)則的控制器,并根據(jù)相位信號(hào)選擇一適當(dāng)?shù)目刂破?,該選擇的控制器根據(jù)相位信號(hào)產(chǎn)生對(duì)可移動(dòng)部分的控制信號(hào)。
3.根據(jù)權(quán)利要求1的機(jī)器人,其中可移動(dòng)部分具有一個(gè)或多個(gè)關(guān)節(jié),狀態(tài)量檢測(cè)裝置檢測(cè)該一個(gè)關(guān)節(jié)或各個(gè)關(guān)節(jié)的角度和角速度作為狀態(tài)量,同時(shí)估計(jì)裝置根據(jù)該一個(gè)關(guān)節(jié)或各個(gè)關(guān)節(jié)的角度和角速度來估計(jì)與該一個(gè)關(guān)節(jié)或各個(gè)關(guān)節(jié)的周期運(yùn)動(dòng)相關(guān)的相位或角頻率。
4.根據(jù)權(quán)利要求1的機(jī)器人,其中該機(jī)器人具有多個(gè)可移動(dòng)腿作為可移動(dòng)部分,且狀態(tài)量檢測(cè)裝置檢測(cè)由各可移動(dòng)腿的足底所受到的地面反作用力作為狀態(tài)量,同時(shí)估計(jì)裝置根據(jù)各可移動(dòng)腿的足底所受到的地面反作用力來估計(jì)各可移動(dòng)部分的周期運(yùn)動(dòng)的相位或角頻率。
5.相據(jù)權(quán)利要求1的機(jī)器人,其中機(jī)器人具有多個(gè)可移動(dòng)腿作為可移動(dòng)部分,且狀態(tài)量檢測(cè)裝置檢測(cè)各可移動(dòng)腿的足底在移動(dòng)方向或垂直于移動(dòng)方向的方向上所受到的摩擦力作為狀態(tài)量,同時(shí)估計(jì)裝置根據(jù)各可移動(dòng)腿的足底從地面所受到的摩擦力來估計(jì)各可移動(dòng)部分的周期運(yùn)動(dòng)的相位或角頻率。
6.根據(jù)權(quán)利要求1的機(jī)器人,其中該機(jī)器人具有軀干部分,該狀態(tài)量檢則裝置檢測(cè)軀干部分的傾斜度作為狀態(tài)量,同時(shí)估計(jì)裝置根據(jù)軀干部分的傾斜度來估計(jì)各可移動(dòng)部分的周期運(yùn)動(dòng)的相位或角頻率。
7.根據(jù)權(quán)利要求1的機(jī)器人,其中狀態(tài)量檢測(cè)裝置檢測(cè)機(jī)器人或各可移動(dòng)部分的加速度作為狀態(tài)量,并且估計(jì)裝置根據(jù)該加速度來估計(jì)各可移動(dòng)部分的周期運(yùn)動(dòng)的相位或角頻率。
8.根據(jù)權(quán)利要求1的機(jī)器人,其中估計(jì)裝置響應(yīng)預(yù)定事件的發(fā)生,復(fù)原與該關(guān)節(jié)或各關(guān)節(jié)的周期運(yùn)動(dòng)相關(guān)的相位。
9.根據(jù)權(quán)利要求1的機(jī)器人,其中估計(jì)裝置學(xué)習(xí)與狀態(tài)量檢測(cè)裝置所檢測(cè)到的狀態(tài)量以及各可移動(dòng)部分的頻率相關(guān)的訓(xùn)練信號(hào),并根據(jù)所學(xué)的訓(xùn)練信號(hào)來估計(jì)相位或角頻率。
10.根據(jù)權(quán)利要求1的機(jī)器人,其中估計(jì)裝置由一神經(jīng)網(wǎng)絡(luò)所構(gòu)成,適于根據(jù)狀態(tài)量檢測(cè)裝置所檢測(cè)的狀態(tài)量來輸出與各可移動(dòng)部分的周期運(yùn)動(dòng)相關(guān)的相位或角頻率。
11.根據(jù)權(quán)利要求1的機(jī)器人,其中該機(jī)器人包括多個(gè)認(rèn)為在作周期運(yùn)動(dòng)的可移動(dòng)部分,且控制裝置為每個(gè)認(rèn)為在作周期運(yùn)動(dòng)的可移動(dòng)部分提供一控制器,該機(jī)器人進(jìn)一步包括協(xié)調(diào)裝置,用來協(xié)調(diào)來自可移動(dòng)部分的各控制器的控制量,以實(shí)現(xiàn)整個(gè)機(jī)器人的協(xié)調(diào)運(yùn)動(dòng)。
12.根據(jù)權(quán)利要求1的機(jī)器人,其中該機(jī)器人包括多個(gè)認(rèn)為在作周期運(yùn)動(dòng)的可移動(dòng)部分,以及不認(rèn)為在作周期運(yùn)動(dòng)的可移動(dòng)部分,該機(jī)器人進(jìn)一步包括第二控制裝置,用來根據(jù)那些不認(rèn)為在作周期運(yùn)動(dòng)的可移動(dòng)部分的控制規(guī)則,來產(chǎn)生控制信號(hào);以及協(xié)調(diào)裝置,用來協(xié)調(diào)來自控制裝置以及第二控制裝置的控制量,以實(shí)現(xiàn)整個(gè)機(jī)器人的協(xié)調(diào)運(yùn)動(dòng)。
13.一種具有多個(gè)可移動(dòng)部分的機(jī)器人的姿態(tài)控制方法,該方法包括相位信號(hào)產(chǎn)生步驟,產(chǎn)生與至少部分可移動(dòng)部分的周期運(yùn)動(dòng)相關(guān)的相位信號(hào);控制步驟,根據(jù)相位信號(hào)產(chǎn)生對(duì)于可移動(dòng)部分的控制信號(hào);驅(qū)動(dòng)步驟,根據(jù)控制信號(hào)驅(qū)動(dòng)可移動(dòng)部分;狀態(tài)量檢測(cè)步驟,檢測(cè)在驅(qū)動(dòng)步驟所驅(qū)動(dòng)的可移動(dòng)部分的狀態(tài)量;以及估計(jì)步驟,根據(jù)狀態(tài)量估計(jì)可移動(dòng)部分周期運(yùn)動(dòng)的相位或角頻率;相位信號(hào)產(chǎn)生步驟適于根據(jù)估計(jì)步驟所估計(jì)的相位或角頻率來更新相位信號(hào)。
14.根據(jù)權(quán)利要求13的方法,其中控制步驟包括基于不同控制規(guī)則的多個(gè)控制子步驟,根據(jù)相位信號(hào)選擇一適當(dāng)?shù)目刂谱硬襟E,并根據(jù)來自所選控制子步驟的相位信號(hào)產(chǎn)生對(duì)可移動(dòng)部分的控制信號(hào)。
15.根據(jù)權(quán)利要求13的方法,其中可移動(dòng)部分具有一個(gè)或多個(gè)關(guān)節(jié),狀態(tài)量檢測(cè)步驟適于檢測(cè)該一個(gè)關(guān)節(jié)或各個(gè)關(guān)節(jié)的角度和角速度作為狀態(tài)量,同時(shí)估計(jì)步驟適于根據(jù)該一個(gè)關(guān)節(jié)或各個(gè)關(guān)節(jié)的角度和角速度來估計(jì)與該一個(gè)關(guān)節(jié)或各個(gè)關(guān)節(jié)的周期運(yùn)動(dòng)相關(guān)的相位或角頻率。
16.根據(jù)權(quán)利要求13的方法,其中機(jī)器人具有多個(gè)可移動(dòng)腿作為可移動(dòng)部分,且狀態(tài)量檢測(cè)步驟適于檢測(cè)由各可移動(dòng)腿的足底所受到的地面反作用力作為狀態(tài)量,同時(shí)估計(jì)步驟適于根據(jù)各可移動(dòng)腿的足底所受到的地面反作用力來估計(jì)各可移動(dòng)部分的周期運(yùn)動(dòng)的相位或角頻率。
17.根據(jù)權(quán)利要求13的方法,其中機(jī)器人具有多個(gè)可移動(dòng)腿作為可移動(dòng)部分,且狀態(tài)量檢測(cè)步驟適于檢測(cè)各可移動(dòng)腿的足底在移動(dòng)方向或垂直于移動(dòng)方向的方向上所受到的摩擦力作為狀態(tài)量,同時(shí)估計(jì)步驟適于根據(jù)各可移動(dòng)腿的足底從地面所受到的摩擦力來估計(jì)各可移動(dòng)部分的周期運(yùn)動(dòng)的相位或角頻率。
18.根據(jù)權(quán)利要求13的方法,其中機(jī)器人具有軀干部分,狀態(tài)量檢測(cè)步驟適于檢測(cè)軀干部分的傾斜度作為狀態(tài)量,同時(shí)估計(jì)步驟適于根據(jù)軀干部分的傾斜度來估計(jì)各可移動(dòng)部分的周期運(yùn)動(dòng)的相位或角頻率。
19.根據(jù)權(quán)利要求13的方法,其中狀態(tài)量檢測(cè)步驟適于檢測(cè)機(jī)器人或各可移動(dòng)部分的加速度作為狀態(tài)量,估計(jì)步驟適于根據(jù)該加速度來估計(jì)各可移動(dòng)部分的周期運(yùn)動(dòng)的相位或角頻率。
20.根據(jù)權(quán)利要求13的方法,其中估計(jì)步驟適于響應(yīng)預(yù)定事件的發(fā)生,復(fù)原與該關(guān)節(jié)或各關(guān)節(jié)的周期運(yùn)動(dòng)相關(guān)的相位。
21.根據(jù)權(quán)利要求13的方法,其中估計(jì)步驟適于學(xué)習(xí)與狀態(tài)量檢測(cè)步驟所檢測(cè)到的狀態(tài)量以及各可移動(dòng)部分的周期相關(guān)的訓(xùn)練信號(hào),并根據(jù)所學(xué)的訓(xùn)練信號(hào)來估計(jì)相位或角頻率。
22.根據(jù)權(quán)利要求13的方法,其中估計(jì)步驟由一神經(jīng)網(wǎng)絡(luò)所實(shí)現(xiàn),該神經(jīng)網(wǎng)絡(luò)適于根據(jù)狀態(tài)量檢測(cè)步驟所檢測(cè)的狀態(tài)量來輸出與各可移動(dòng)部分的周期運(yùn)動(dòng)相關(guān)的相位或角頻率。
23.根據(jù)權(quán)利要求13的方法,其中該機(jī)器人包括多個(gè)認(rèn)為在作周期運(yùn)動(dòng)的可移動(dòng)部分,且控制步驟包括對(duì)應(yīng)于認(rèn)為在作周期運(yùn)動(dòng)的各可移動(dòng)部分的控制子步驟,該方法進(jìn)一步包括協(xié)調(diào)步驟,協(xié)調(diào)來自各可移動(dòng)部分的控制子步驟的控制量,以實(shí)現(xiàn)整個(gè)機(jī)器人的協(xié)調(diào)運(yùn)動(dòng)。
24.根據(jù)權(quán)利要求13的方法,其中機(jī)器人包括多個(gè)認(rèn)為在作周期運(yùn)動(dòng)的可移動(dòng)部分,以及不認(rèn)為在作周期運(yùn)動(dòng)的可移動(dòng)部分,該方法進(jìn)一步包括第二控制步驟,根據(jù)那些不認(rèn)為在作周期運(yùn)動(dòng)的可移動(dòng)部分的控制規(guī)則,來產(chǎn)生控制信號(hào);以及協(xié)調(diào)步驟,用來協(xié)調(diào)來自控制步驟以及第二控制步驟的控制量,以實(shí)現(xiàn)整個(gè)機(jī)器人的協(xié)調(diào)運(yùn)動(dòng)。
全文摘要
機(jī)器人可移動(dòng)部分的運(yùn)動(dòng)采取周期運(yùn)動(dòng),以便機(jī)器人的姿態(tài)通過調(diào)節(jié)可移動(dòng)部分的移動(dòng)而在廣義上得到穩(wěn)定的控制。更具體地,一個(gè)或多個(gè)相位發(fā)生器用于機(jī)器人系統(tǒng),且根據(jù)產(chǎn)生的相位來選擇多個(gè)控制器中的一個(gè)。接著,控制器根據(jù)連續(xù)相位信息控制可移動(dòng)部分的驅(qū)動(dòng)。此外,實(shí)際相位根據(jù)物理系統(tǒng)而估計(jì),相位發(fā)生器的頻率和相位通過利用估計(jì)值來進(jìn)行調(diào)節(jié),同時(shí)機(jī)器人系統(tǒng)的物理相位和相位發(fā)生器受到交互誘導(dǎo),因此可以通過有效地利用機(jī)器人的動(dòng)態(tài)特性來控制機(jī)器人的運(yùn)動(dòng)。
文檔編號(hào)B25J13/08GK1590039SQ20041008742
公開日2005年3月9日 申請(qǐng)日期2004年8月25日 優(yōu)先權(quán)日2003年8月25日
發(fā)明者遠(yuǎn)藤玄, 川人光男, 高登·程, 中西淳, 森本淳 申請(qǐng)人:索尼株式會(huì)社, 株式會(huì)社國際電氣通信基礎(chǔ)技術(shù)研究所