一種計(jì)劃任務(wù)執(zhí)行能力度量與風(fēng)險(xiǎn)評(píng)估方法
【專利摘要】本發(fā)明涉及一種計(jì)劃任務(wù)執(zhí)行能力度量與風(fēng)險(xiǎn)評(píng)估方法,該方法包括如下步驟:首先,建立計(jì)劃任務(wù)的馬爾科夫決策過(guò)程,利用已有的方法,計(jì)算馬爾科夫決策過(guò)程的最優(yōu)解;其次,為每個(gè)狀態(tài)計(jì)算最佳執(zhí)行路徑,并將計(jì)算結(jié)果保存在最佳執(zhí)行路徑集合中;最后,按任務(wù)執(zhí)行的時(shí)間單元重復(fù)執(zhí)行計(jì)劃跟蹤與評(píng)估方法(Plan?Trace?and?Evaluation,簡(jiǎn)記為PlaTE),直到任務(wù)成功率達(dá)到期望的指標(biāo)或任務(wù)執(zhí)行所耗費(fèi)的時(shí)間超過(guò)指定的限度。該方法有利于提高指揮調(diào)度和管理決策水平,具有積極的現(xiàn)實(shí)意義。
【專利說(shuō)明】一種計(jì)劃任務(wù)執(zhí)行能力度量與風(fēng)險(xiǎn)評(píng)估方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種計(jì)劃任務(wù)執(zhí)行能力度量與風(fēng)險(xiǎn)評(píng)估方法,主要用于解決客觀世界中存在的計(jì)劃任務(wù)不確定性和執(zhí)行風(fēng)險(xiǎn)難以評(píng)估把握的問(wèn)題?!颈尘凹夹g(shù)】
[0002]現(xiàn)實(shí)世界的很多過(guò)程可以描述為計(jì)劃任務(wù),比如一個(gè)軍事行動(dòng)隊(duì)執(zhí)行某種占領(lǐng)任務(wù),一個(gè)突發(fā)事件應(yīng)急處置小組進(jìn)行火災(zāi)或地震的救援工作,一個(gè)救護(hù)小組進(jìn)行病人生命的搶救,一些項(xiàng)目管理過(guò)程,如房屋的建造、機(jī)器人規(guī)劃等等。計(jì)劃任務(wù)的執(zhí)行過(guò)程往往伴隨著不確定性因素,導(dǎo)致計(jì)劃任務(wù)執(zhí)行的結(jié)果或質(zhì)量存在一些難以準(zhǔn)確估計(jì)的情況,形成計(jì)劃任務(wù)的執(zhí)行風(fēng)險(xiǎn)。
[0003]以救火過(guò)程為例,救援小組在接到火災(zāi)報(bào)警后期望以最快的速度趕到救援現(xiàn)場(chǎng),然而在向火災(zāi)現(xiàn)場(chǎng)移動(dòng)的過(guò)程中不可避免地要受到天氣、交通等條件的影響,使得救援人員的到達(dá)時(shí)間和滅火進(jìn)度都會(huì)存在一些不確定性。這些情況在任務(wù)完成以前如果不能準(zhǔn)確估計(jì)會(huì)導(dǎo)致整個(gè)救火任務(wù)的效率和質(zhì)量都存在不確定性和任務(wù)執(zhí)行的風(fēng)險(xiǎn)。如何對(duì)這種不確定性任務(wù)進(jìn)行量化評(píng)估,使得救援指揮人員能夠事先就有一種可以量化的評(píng)估方法,對(duì)計(jì)劃任務(wù)的執(zhí)行能夠有一個(gè)科學(xué)的把握并能夠充分認(rèn)清任務(wù)執(zhí)行過(guò)程的風(fēng)險(xiǎn)性因素,從而更加有效地把握和控制計(jì)劃任務(wù)的執(zhí)行,這成為計(jì)劃任務(wù)風(fēng)險(xiǎn)評(píng)估領(lǐng)域亟需解決的問(wèn)題。然而,現(xiàn)有技術(shù)主要側(cè)重于如何尋找最優(yōu)路徑完成此類計(jì)劃任務(wù),并未就參與人員對(duì)計(jì)劃任務(wù)的執(zhí)行能力和執(zhí)行風(fēng)險(xiǎn)評(píng)估提出明確的解決辦法。
【發(fā)明內(nèi)容】
[0004]本發(fā)明所要解決的技術(shù)問(wèn)題是針對(duì)上述現(xiàn)實(shí)問(wèn)題提供一種計(jì)劃任務(wù)執(zhí)行能力度量與風(fēng)險(xiǎn)評(píng)估方法,該方法能為指揮員或其他管理者提供可參考的量化指標(biāo),也能為計(jì)劃任務(wù)執(zhí)行能力度量和風(fēng)險(xiǎn)評(píng)估提供參考依據(jù)。
[0005]本發(fā)明解決上述問(wèn)題所采用的技術(shù)方案為:一種計(jì)劃任務(wù)執(zhí)行能力度量與風(fēng)險(xiǎn)評(píng)估方法,其特征在于:包括如下步驟:
[0006](I)、將任務(wù)的執(zhí)行者稱為智能體,智能體所要執(zhí)行的計(jì)劃任務(wù)具有不確定性和貫序性,即后序任務(wù)的執(zhí)行只與該任務(wù)當(dāng)前的執(zhí)行狀況相關(guān)聯(lián),而與該任務(wù)之前的執(zhí)行狀況無(wú)關(guān),首先,建立計(jì)劃任務(wù)的馬爾科夫決策過(guò)程,記為S,A, T, R, Stl, G,其中,S為計(jì)劃任務(wù)執(zhí)行過(guò)程中每個(gè)狀態(tài)的集合,即S=Isi, I ≤ i ≤ k},其中Si為狀態(tài),k為狀態(tài)的數(shù)量;A為智能體可采取的行為集合,即A= {a” I≤Bi≤h},其中Bi為行為,h為行為的數(shù)量;T為計(jì)劃任務(wù)執(zhí)行過(guò)程中狀態(tài)間的轉(zhuǎn)換概率,T (Si, a, Sj)代表由狀態(tài)Si采取行為a進(jìn)入狀態(tài)S」的轉(zhuǎn)換概率;R為完成計(jì)劃任務(wù)所能夠獲得的可量化的回報(bào)集合,R(Si)為狀態(tài)Si所獲取的回報(bào);S0為智能體的起始狀態(tài),G為智能體的目標(biāo)態(tài)集合;
[0007](2)、計(jì)算(I)中馬爾科夫決策過(guò)程的最優(yōu)解Q,Π,即尋找完成計(jì)劃任務(wù)的最佳執(zhí)行路徑,其中,Q為計(jì)算獲得的每個(gè)狀態(tài)的值,Π則記錄了每一個(gè)狀態(tài)的最優(yōu)行為;[0008](3)、為每個(gè)狀態(tài)計(jì)算其最佳執(zhí)行路徑p,并將計(jì)算結(jié)果保存在最佳執(zhí)行路徑集合P中,計(jì)算方法如下:
[0009]現(xiàn)定義狀態(tài)節(jié)點(diǎn)η為計(jì)劃任務(wù)所經(jīng)歷路徑的構(gòu)成單位,每個(gè)狀態(tài)節(jié)點(diǎn)η由其狀態(tài)元素s和概率元素pr構(gòu)成,即n= (s, pr),相應(yīng)地,n.s為狀態(tài)節(jié)點(diǎn)η所對(duì)應(yīng)的狀態(tài),n.pr為該狀態(tài)節(jié)點(diǎn)η的可達(dá)概率,例如,初始狀態(tài)節(jié)點(diǎn)Iitl所對(duì)應(yīng)的計(jì)劃任務(wù)過(guò)程的初始態(tài)可以表不為 H0= (s0, I);
[0010]計(jì)劃任務(wù)所經(jīng)歷的路徑中某一狀態(tài)節(jié)點(diǎn)IIj的可達(dá)概率定義為由某一起始節(jié)點(diǎn)ns出發(fā),利用最佳路徑到達(dá)本路徑的目的節(jié)點(diǎn)r^_的成功概率,因此有:
【權(quán)利要求】
1.一種計(jì)劃任務(wù)執(zhí)行能力度量與風(fēng)險(xiǎn)評(píng)估方法,其特征在于:包括如下步驟: (1)、將任務(wù)的執(zhí)行者稱為智能體,智能體所要執(zhí)行的計(jì)劃任務(wù)具有一定不確定性和貫序性,即后序任務(wù)的執(zhí)行只與該任務(wù)當(dāng)前的執(zhí)行狀況相關(guān)聯(lián),而與該任務(wù)之前的執(zhí)行狀況無(wú)關(guān),首先,建立計(jì)劃任務(wù)的馬爾科夫決策過(guò)程,記為S,A, T, R, S0, G,其中,S為計(jì)劃任務(wù)執(zhí)行過(guò)程中每個(gè)狀態(tài)的集合,即S=Isi, I < i < k},其中Si為狀態(tài),k為狀態(tài)的數(shù)量;A為智能體可采取的行為集合,即A= {a” I≤Bi≤h},其中Bi為行為,h為行為的數(shù)量;T為計(jì)劃任務(wù)執(zhí)行過(guò)程中狀態(tài)間的轉(zhuǎn)換概率,T (Si, a, Sj)代表由狀態(tài)Si采取行為a進(jìn)入狀態(tài)S」的轉(zhuǎn)換概率;R為完成計(jì)劃任務(wù)所能夠獲得的可量化的回報(bào)集合,R(Si)為狀態(tài)Si所獲取的回報(bào);S0為智能體的起始狀態(tài),G為智能體的目標(biāo)態(tài)集合; (2)、計(jì)算(I)中馬爾科夫決策過(guò)程的最優(yōu)解Q,Π,即尋找完成計(jì)劃任務(wù)的最佳執(zhí)行路徑,其中,Q為計(jì)算獲得的每個(gè)狀態(tài)的值,Π則記錄了每一個(gè)狀態(tài)的最優(yōu)行為; (3)、為每個(gè)狀態(tài)計(jì)算其最佳執(zhí)行路徑p,并將計(jì)算結(jié)果保存在最佳執(zhí)行路徑集合P中,計(jì)算方法如下: 狀態(tài)節(jié)點(diǎn)η為計(jì)劃任務(wù)所經(jīng)歷路徑的構(gòu)成單位,每個(gè)狀態(tài)節(jié)點(diǎn)η由其狀態(tài)元素s和概率元素Pr構(gòu)成,即n= (s, pr),相應(yīng)地,n.s為狀態(tài)節(jié)點(diǎn)η所對(duì)應(yīng)的狀態(tài),n.pr為該狀態(tài)節(jié)點(diǎn)η的可達(dá)概率,例如,初始狀態(tài)節(jié)點(diǎn)Iitl所對(duì)應(yīng)的計(jì)劃任務(wù)過(guò)程的初始態(tài)可以表示為nO= (S0,I); 計(jì)劃任務(wù)所經(jīng)歷的路徑中某一狀態(tài)節(jié)點(diǎn)rij的可達(dá)概率定義為由某一起始節(jié)點(diǎn)ns出發(fā),利用最佳路徑到達(dá)本路徑的目的節(jié)點(diǎn)r^_的成功概率,因此有:
【文檔編號(hào)】G06F19/00GK103514371SQ201310430955
【公開(kāi)日】2014年1月15日 申請(qǐng)日期:2013年9月22日 優(yōu)先權(quán)日:2013年9月22日
【發(fā)明者】林勇 申請(qǐng)人:寧波開(kāi)世通信息科技有限公司