基于多智能體月臺調(diào)度智能排序模型的構(gòu)造
【專利摘要】本發(fā)明公開一種基于多智能體月臺調(diào)度智能排序模型的構(gòu)造;鋼材的物流配送屬于運輸中的重型運輸,需要專用的裝卸設(shè)備和大型的運輸車輛,配送裝車過程中,車輛的裝車效率和順序(即月臺調(diào)度)直接關(guān)系到配送時效,但月臺調(diào)度是個多約束條件的組合優(yōu)化復雜系統(tǒng),合理排序取得最優(yōu)化至關(guān)重要。本發(fā)明引入多智能體技術(shù)對實時的車輛調(diào)度決策進行研究,構(gòu)造基于月臺的調(diào)度排序系統(tǒng)和多智能體算法設(shè)計作為多約束條件的組合優(yōu)化復雜系統(tǒng),實現(xiàn)多智能體技術(shù)對實時的車輛調(diào)度決策進行研究提供了新的解決方法,以提高貨運作業(yè)效率,解決了獲取最優(yōu)解的問題,輔以車輛識別技術(shù)對配送車輛全程監(jiān)控,實現(xiàn)車輛調(diào)度的高效和裝卸過程的精準,達到鋼材精準配送目標。
【專利說明】
基于多智能體月臺調(diào)度智能排序模型的構(gòu)造
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及一種多智能體月臺調(diào)度系統(tǒng)模型的構(gòu)造,具體地是一種按照供應鏈和 Agent來構(gòu)造的模型。
【背景技術(shù)】
[0002] 本發(fā)明提出之前,在供應鏈中,貨物的運送涉及到的因素諸多,各種因素下的水平 指標也會存在不一致,例如:
[0003] 1)送貨時間
[0004] 由于客戶訂單數(shù)量和周期不同,當DPS系統(tǒng)收到訂單,將自動比對現(xiàn)有庫存和貨物 數(shù)據(jù),同時標識出材料的斷點時間,提示業(yè)務(wù)員給予關(guān)注,根據(jù)備貨系數(shù)的調(diào)整,智能進行 原料分配及生產(chǎn)計劃安排。并前期確定最優(yōu)的送貨時間。
[0005] 2)車輛數(shù)量
[0006] 參與運輸操作的車輛數(shù)同樣影響著整個月臺的運作效率,不同的車輛參與裝卸需 要提供不同的調(diào)度優(yōu)化策略。多輛運輸車可以在其他條件允許的情況下同時在不同的倉庫 門進行裝卸,也可能在更節(jié)省時間的前提下在同一倉庫門前進行等待。
[0007] 3)車輛類型
[0008] 考慮到混裝,就是一臺車如果太大了,可能把兩個客戶東西湊在一起。車輛類型的 不同意味著裝運剛才的品種與重要不同,也一定程度影響著貨物的裝卸時間和物流成本, 從調(diào)度、進庫、裝配的靈活性上游很大程度的提高,大型車輛載重量大,貨物裝卸耗時長,對 月臺的管理和車輛調(diào)度帶來一定的影響。
[0009] 4)緊急響應
[0010]系統(tǒng)在每一個運輸指令的關(guān)鍵環(huán)節(jié)上都設(shè)置了預警功能,當實際執(zhí)行確認指令未 在計劃時間內(nèi)反饋至系統(tǒng),預警信息會立即顯示在系統(tǒng)看板上,異常情況的處理主動性 強,響應速度快。例如當客戶的需求時間較為緊迫時,系統(tǒng)需要對相應的車輛裝車時間進行 提前處理。
[0011] 5)設(shè)備故障率
[0012] 在公司的長期運作中,設(shè)備不可避免的會出現(xiàn)故障,當參與裝卸工作的行車出現(xiàn) 故障時,會嚴重影響對應倉庫的裝卸任務(wù),從而導致整個月臺的調(diào)度做出調(diào)整,等待設(shè)備故 障修復。
【發(fā)明內(nèi)容】
[0013] 本發(fā)明的目的在于,克服上述各種因素中存在的弊端,提供一種多智能體系統(tǒng) (Multi-Agent System,MAS)理論,構(gòu)造基于月臺的調(diào)度排序系統(tǒng)作為多約束條件的組合優(yōu) 化復雜系統(tǒng),實現(xiàn)多智能體技術(shù)對實時的車輛調(diào)度決策進行研究提供了新的解決方法,以 提高貨運作業(yè)效率。
[0014] 實現(xiàn)本發(fā)明的技術(shù)方案是,這種基于多智能體月臺調(diào)度智能排序模型的構(gòu)造,其 特征在于:多智能體系統(tǒng)(Multi-Agent System,MAS)是由一個在一個環(huán)境中交互的多個智 能體組成的計算系統(tǒng);多智能體系統(tǒng)也能被用在解決分離的智能體以及單層系統(tǒng)中難以解 決的問題;智能體通過一些方法,函數(shù),過程,搜索算法來實現(xiàn),其中各智能體的通信是通過 彼此協(xié)調(diào)擱置行為實現(xiàn)相互之間的通信,是以通信技術(shù)為基礎(chǔ);
[0015] 本發(fā)明包括基于月臺調(diào)度的排序系統(tǒng)和多智能體算法設(shè)計兩個部分:其中,所述 的基于月臺調(diào)度的排序系統(tǒng)還包括配送模式、Agent建模、車輛調(diào)度;
[0016] 所述配送模式是基于月臺調(diào)度的物流配送模式,配送中心從上游獲取貨源,經(jīng)過 收貨、存儲、組裝和調(diào)度車輛等流程,最后將貨物送到客戶;任何情況的物流配送車輛調(diào)度 問題都可以按照數(shù)學建模的方法,表達成有目標函數(shù)和約束條件兩部分構(gòu)成的數(shù)學規(guī)劃模 型;本發(fā)明基于月臺調(diào)度的車輛調(diào)度需求方案,其數(shù)學模型可以表述為:min or max z = f (x)根據(jù)實際項目的需求,可以分析得出約束條件:送貨時間相關(guān)的約束、運輸車輛相關(guān)的 約束、標準工時相關(guān)的約束、緊急響應相關(guān)的約束、人力資源相關(guān)的約束、裝卸設(shè)備相關(guān)的 約束;
[0017]所述Agent建模指的是:基于MAS處理多約束條件目標優(yōu)化問題的明顯優(yōu)勢,本發(fā) 明將MAS應用到月臺調(diào)度系統(tǒng)中,不同層次的主體(影響因素)可以通過不同層次的Agent來 進行描述和表達;不同層次的Agent相互聯(lián)系、相互作用共同組成了一個實際的調(diào)度系統(tǒng);
[0018] 所述車輛調(diào)度是針對月臺調(diào)度智能排序的目標而設(shè)計的最為關(guān)鍵的模塊,相應的 影響因素主要涉及倉庫和車輛兩個方面,在多倉庫的環(huán)境中,將待運車輛調(diào)度到合適的倉 庫門來提高整個廠區(qū)的裝卸效率涉及較多的影響因素,如該倉庫的繁忙程度、倉庫的貨物 儲備量等;綜合各方面的因素,結(jié)合廠區(qū)內(nèi)的各個倉庫門,車輛與相應的倉庫智能匹配;對 于一個倉庫的不同庫門,存儲不同的產(chǎn)品,正常情況下,每個庫門對應一種產(chǎn)品(窄帶、板 等),由于不同車輛需要混裝的實際情況,可能存在該倉庫門存放著少量的本不屬于該庫門 的產(chǎn)品,當客戶訂單完成后,安排車輛根據(jù)客戶訂單到對應的倉庫庫門去取相應的產(chǎn)品;根 據(jù)各個倉庫門的繁忙程度或是裝卸水平因素的影響,車輛可能不同的運輸路徑到達對應的 倉庫門以最短的時間完成裝車工作,方便后面車輛的運作,提高系統(tǒng)整體的運行效率;
[0019] 本發(fā)明基于多智能體的月臺調(diào)度排序數(shù)學模型的構(gòu)造如下:
[0020]
[0021]
[0022]
[0023]
[0024]
[0025]上述模型中涉及的參數(shù)作如下說明:
[0026] G:倉庫門的集合 [0027] V:參與配送車輛的集合 [0028] ti:車輛到達倉庫i的用時
[0029] U:倉庫i最晚服務(wù)的時間(廠區(qū)24小時工作,可忽略)
[0030] Ei:倉庫i最早服務(wù)的時間(廠區(qū)24小時工作,可忽略)
[0031] a1:倉庫最早可提供裝車服務(wù)的時間(車輛到達倉庫時需等待的最短時間)
[0032] b1:倉庫最晚可提供裝車服務(wù)的時間(車輛到達倉庫時需等待的最長時間)
[0033] f1:車輛到達倉庫早于倉庫提供服務(wù)時間的懲罰系數(shù)
[0034] f2:車輛到達倉庫晚于倉庫提供服務(wù)時間的懲罰系數(shù)
[0035] cij:車輛經(jīng)過倉庫i和j之間的耗時(范圍為5-10min)
[0036] Pi:倉庫門i裝完一輛車所需產(chǎn)品的耗時
[0037] q:車輛的容量
[0038] n1:倉庫門i提供給車的貨物容量
[0039]
[0040]
[0041]
[0042] 本發(fā)明基于多智能體的月臺調(diào)度排序模型的算法采用兩種應用廣發(fā)的啟發(fā)式算 法,遺傳算法與禁忌搜索算法相結(jié)合的混合算法實現(xiàn),遺傳算法(GA)是根據(jù)達爾文的自然 選擇和遺傳理論,將生物進化過程中適者生存規(guī)則與同一群染色體的隨進信息交換相結(jié)合 的智能算法;遺傳算法的性能在很大程度上依賴于交叉和變異的操作,這取決于在解集中 如何抽取樣本解;禁忌搜索算法(TA)最重要的思想是標記對應已搜索的局部最優(yōu)解的一些 對象,并在進一步的迭代搜索中盡量避開這些對象,而不是絕對禁止循環(huán),從而保證對不同 的有效搜索途徑的探索;
[0043]混合后算法的主要策略就是:首先通過遺傳算法進行全局搜索,采用自然數(shù)對所 有倉庫和可調(diào)配車輛進行編碼,將各倉庫的供貨能力同車輛的運載能力進行全局的路徑優(yōu) 化;然后運用禁忌搜索對種群中的個體以一定的概率進行局部搜索,也就是針對同一輛車 對所有倉庫進行局部運輸路徑優(yōu)化;本發(fā)明首先設(shè)置初始種群,然后模擬生物進化,在初始 種群之間產(chǎn)生選擇、變異、交叉作為新一代種群,對新一代種群做僅僅搜索優(yōu)化,留下好的 個體,經(jīng)過多代的遺傳,最后形成適應度最好的個體;
[0044]本發(fā)明所采用的混合算法求解過程如下:
[0045] (1)倉庫門直接排列自然數(shù)編碼
[0046]首先可以設(shè)計多個1-G不同的不糊重復的自然數(shù)排列,該自然數(shù)排列就構(gòu)成一個 個體。按照約束條件可以依次將倉庫門插入到行駛路線中,例如調(diào)用兩輛車到達4的倉庫 點,假設(shè)車的行駛路徑為1234,即依次遍歷標號為1,2,3,4的倉庫點,首先將第一個倉庫點 插入到行駛路線中,如果滿足上述所有約束條件,插入第二個倉庫點,若滿足繼續(xù)進行,當 超出車輛的運載量時,調(diào)用第二輛車。
[0047] (2)設(shè)置初始種群
[0048]隨機的生成1-G這G個互不重復的自然數(shù)排列,即生成一個個體。假設(shè)初始種群的 數(shù)目為N,則產(chǎn)生N個這樣不同的個體。
[0049] (3)適應度評價標準確定
[0050] 因為優(yōu)化目標是求最小值,而遺傳算法的適應度表示適應能力最強的個體,故可 用目標函數(shù)的倒數(shù)表示適應度。
[0051] f = l/Zi
[0052] (4)復制操作
[0053]本設(shè)計通過保留最佳個體和賭盤策略來完成對種群個體優(yōu)勝劣汰的操作。
[0054] (5)交叉操作
[0055] 通過一定的概率交換兩個父代個體的部分片段來完成交叉操作,常見的交叉算子 有部分交叉算子、順序交叉算子、循環(huán)交叉算子和類0X算子等。
[0056] 本設(shè)計采用順序交叉算子,例如一輛車完成根據(jù)裝運工作需要經(jīng)過1、2、3、4、5、6、 7這七個倉庫門裝載相應的產(chǎn)品,現(xiàn)有兩種不同的車輛行駛路線:1^ = 1234567,R2 = 3425167,Ri表不車輛依次經(jīng)過1號門、2號門、...、7號門,R2表不車輛依次經(jīng)過3號門、4號 門.....7號門,從中選擇一個匹配段,
[0057]
[0058]
[0059] 根據(jù)匹配段的映射關(guān)系,在匹配段區(qū)域外對應的位置標注為A,即:
[0060]
[0061]
[0062] 再移動匹配段到起始位置,并在后面預留和匹配段空間相同的位置,標注為A,即:
[0063]
[0064]
[0065]最后將兩個序列的匹配段相互交換,得到兩個新的后代,即:
[0066]
[0067]
[0068] (6)變異操作
[0069] 變異操作體現(xiàn)了自然界基因突變的思想,常見的變異算子有逆轉(zhuǎn)變異、交換變異 和插入變異。
[0070] 本設(shè)計采用逆轉(zhuǎn)變異,隨機選擇一個序列中的兩個點進行位置互換,將兩點內(nèi)字 符反序插入到原序列中。例如對于一輛車的行駛路線為Ri = 1234567,將第二個位置和第五 個位置進行逆轉(zhuǎn)變異,得到的序列為R/=1543267。
[0071] (7)利用禁忌搜索法對當前解進行改進 [0072]禁忌算法采用
[0073]:寸當前解進行評價 i=V*
[0074] 其中T(i)表示車輛到達倉庫點需要的時間,E(i)表示車輛在倉庫點裝卸貨物和等 待的時間,W(i)表示車輛的車載量,p代表懲罰系數(shù)。
[0075]禁忌搜索算法的執(zhí)行步驟如下:
[0076] 步驟一:選定初始解(有遺傳算法得到)xn?,令禁忌表// = 0。
[0077] 步驟二:若滿足終止準則,轉(zhuǎn)步驟四;否則,在xn?的領(lǐng)域N(xn?)中選出滿足禁忌要 求的候選集can_N(x n°w),執(zhí)行步驟三。
[0078] 步驟三:在can_N(x_)選出一組評價值最優(yōu)解/^,令xn°w = xbest,更新禁忌表,轉(zhuǎn) 步驟二。
[0079] 步驟四:輸出運算結(jié)果。
[0080] (8)終止準則
[0081] 因為影響車輛調(diào)度系統(tǒng)穩(wěn)定性的動態(tài)因素較多,對決策系統(tǒng)的時效性要高,本設(shè) 計擬采用指定代數(shù)步數(shù)終止的終止準則;
[0082] 本發(fā)明基于多智能體的月臺調(diào)度排序模型的算法設(shè)計如下:
[0083]輸入?yún)?shù):
[0084] 種群規(guī)模N,表示不同的初始車輛的運行路線
[0085] 進化代數(shù)T,表示種群要繁衍的代數(shù) [0086] 交叉概率卩。
[0087] 變異概率Pm [0088]懲罰系數(shù)p
[0089] 輸出結(jié)果:
[0090] 車輛調(diào)度路線和優(yōu)化目標值
[0091] 算法主體:
[0092] 根據(jù)車輛倉庫匹配矩陣產(chǎn)生多個不同的初始種群P(0),
[0093] 當前代數(shù)為t = 0;
[0094] 計算初始種群的適應度
[0095]
[0097] 具體地,所述Agent建模包括:客戶Agent、倉庫Agent、車輛Agent、路網(wǎng)Agent、勞動 力Agent、訂單處理Agent、緊急響應Agent、車輛調(diào)度Agent、裝卸調(diào)度Agent及總調(diào)度Agent, 其中:
[0098] 1)客戶Agent包含客戶名稱、客戶代碼、發(fā)貨計劃、要求送達時間、所需捆包的類 型和數(shù)量等信息;
[0099] 2)倉庫Agent包含捆包類型、捆包號、備貨系數(shù)等信息;
[0100] 3)車輛Agent同司機綁定,包含車輛位置狀態(tài)(車輛等待、正在裝車、裝完車輛)、車 輛裝載量、車牌、司機、車批等信息;
[0101] 4)路網(wǎng)Agent包含不同的倉庫點的庫門、庫位以及它們之間切換耗時信息;
[0102] 5)勞動力Agent包含單包裝車標準工時、裝卸工人信息(總?cè)藬?shù)、已分配人數(shù)、待分 配人數(shù))等信息;
[0103] 6)訂單處理Agent會根據(jù)倉庫的貨物存儲現(xiàn)狀和客戶的訂單要求初步評估現(xiàn)有的 貨物量能否滿足客戶的需求,并將最終的評估報告反映給最上層的總調(diào)度Agent,總調(diào)度 Agent根據(jù)評估報告決定采取生成裝運計劃單(計劃單號作為訂單ID)還是安排相關(guān)貨物貨 物的生產(chǎn)計劃;
[0104] 7)緊急響應Agent屬于單方向依賴的智能體,用來處理系統(tǒng)中的緊急情況;作用于 系統(tǒng)的每一個運輸指令的關(guān)鍵環(huán)節(jié)上,當實際執(zhí)行確認指令未在計劃時間內(nèi)反饋至總調(diào)度 Agent,預警信息會立即顯示在系統(tǒng)看板上,異常情況的處理主動性強;
[0105] 總調(diào)度根據(jù)生成的裝運計劃,計算裝運裝運線和運輸里程(用在根據(jù)理論在途時 間計算出廠時間上);將裝運計劃提供給車輛調(diào)度Agent,車輛調(diào)度Agent完成車輛調(diào)度;最 后根據(jù)車輛調(diào)度Agent的計算結(jié)果倒退車輛進場時間;
[0106] 8)車輛調(diào)度Agent是整個調(diào)度系統(tǒng)的關(guān)鍵,當客戶訂單生成并且系統(tǒng)沒有發(fā)生意 外情況下,總調(diào)度Agent提取裝載調(diào)度Agent的人力資源信息,將其同訂單一并下發(fā)給車輛 調(diào)度Agent,車輛調(diào)度Agent根據(jù)訂單和車輛等資源,對裝車順序合理調(diào)度,是系統(tǒng)整體效率 達到最尚;
[0107] 9)裝卸調(diào)度Agent負責勞動力的調(diào)動,合理的安排工人工作時間和地點,讓工人在 正確的時間出現(xiàn)在正確的倉庫門口裝卸貨物,計算裝車用時,就計算結(jié)果返給上級Agent, 讓車輛在倉庫停留時間最少;
[0108] 總調(diào)度Agent是整個系統(tǒng)的大腦,負責整個系統(tǒng)的同步和管理,協(xié)調(diào)各個Agent,使 它們之間協(xié)作,保證整個系統(tǒng)有序的運行。
[0109] 具體地,所述車輛調(diào)度模塊中,D表示倉庫,0表示不同影響因素的權(quán)重,表示第 i個倉庫對第j個影響因素的評價情況,倉庫裝卸能力表示當前倉庫的裝車水平,在實時狀 態(tài)下裝載單位產(chǎn)品的用時;車輛到倉庫耗時表示空載車輛(沒有裝載貨物)從場內(nèi)發(fā)車點到 對應倉庫門的用時;倉庫貨物儲量表示當前倉庫門能夠提供的對應貨物的最大量,決定著 是否滿足車輛的需求;車輛實載率表示當前車輛的裝載狀態(tài),剩余可供產(chǎn)品裝車的空間還 有多少,影響著車輛選擇合適的倉庫門。權(quán)重表示各個因素對車輛調(diào)度的重要程度。
[0110] 車輛初始??课恢玫淖罴哑ヅ渌惴ǎㄒ詡}庫門DQ1為例):
[0111] 步驟一:標準化匹配矩陣的指標,將不同的單位換算成可用來比較的同一量;
[0112]
[0113]
[0114]
[0115]
[0116]
[0117]
[01 18]對 Δ 101、Δ 201、Δ 301、Δ 401、Δ 501、Δ 601 進Ι?單位歸一化
[0119] 步驟二:歸一化處理各影響因素的權(quán)重;
[0120] 衡量4、02、4、£)4、&、匕的值,并使其滿足:
[01 21 ] 9j + 0,+ 9:j. +:c?4. +.3S =..1.
[0122] 步驟三:計算倉庫停靠的綜合評價值;
[0123] 綜合評價值的計算公式為:
[0124]
[0125] 步驟四:當有一個或多個車輛同時參與運輸時,綜合考慮評價值最高的倉庫作為 配送車輛??康某跏甲罴褌}庫。
[0126] 具體地,所述基于多智能體的月臺調(diào)度排序數(shù)學模型中式(3.1)作為整個模型的 優(yōu)化目標,表示車輛經(jīng)過排序最后完成任務(wù)的時間最短,約束條件(3.2)表示車輛到達倉庫 的時間不能早于倉庫開始提供服務(wù)的時間,不能晚于倉庫關(guān)閉服務(wù)的時間,對于廠區(qū)24小 時工作,可忽略此條件;式(3.3)表示車輛最終的運載量不能超過車輛本身的運載能力;式 (3.4)、(3.5)表示一個車輛一次且最多只能一次經(jīng)過同一個倉庫且經(jīng)過倉庫的總數(shù)不能超 過倉庫的總數(shù)。
[0127] 本發(fā)明的優(yōu)點在于:整個方案的設(shè)計采用了多種理論和算法,并根據(jù)事件的應用 需求對原有的算法做出了改進,綜合體現(xiàn)了三個方面的優(yōu)勢。
[0128] 1.多智能體理論的優(yōu)勢。
[0129] 采用多智能體理論搭建排序系統(tǒng),可以充分發(fā)揮多智能體理論的優(yōu)勢。
[0130]自治性:各個Agent可以獨立的完成數(shù)據(jù)本Agent任務(wù)的工作,需要其他Agent的數(shù) 據(jù)時,可以通過與其他Agent建立通信獲取。
[0131] 預動性:各個Agent可以根據(jù)整個系統(tǒng)的資源調(diào)度,適時地預測本Agent所負責的 資源狀態(tài),及時的更新資源,避免不必要的耗時。
[0132] 可擴展性:隨著生產(chǎn)方式和需求的變化,系統(tǒng)需要根據(jù)實際需要作出調(diào)整,多智能 可以在原先結(jié)構(gòu)的基礎(chǔ)上很容易擴展新的Agent,不需要做大的改動。
[0133] 社會性:多智能體根據(jù)實際問題可以很好的對問題進行劃分,將耦合性低的模塊 分給不同的Agent去處理,清晰了工作流程,提高了工作效率,提升了系統(tǒng)性能。
[0134] 2.混合算法的優(yōu)勢
[0135] 處理車輛調(diào)度問題的傳統(tǒng)方式是采用精確算法進行求解,包括分支定界算法、動 態(tài)規(guī)劃法等,這些算法都收限于問題的規(guī)模和約束條件的不變性。在處理大規(guī)模多變約束 條件下的問題是通常采用啟發(fā)式算法,常見的啟發(fā)式算法有遺傳算法、禁忌搜索算法、蟻群 算法等,但是單個算法存在固有的缺陷。
[0136] 遺傳算法雖然有很好的靈活性和魯棒性,適合大規(guī)模問題的求解,但其存在過早 地收斂和局部搜索能力差的缺陷。而在遺傳算法的基礎(chǔ)上添加禁忌搜索算法的混合算法可 以解除禁忌搜索算法局部優(yōu)化的優(yōu)點很好的彌補了這一缺陷。整個混合算法的思想就是通 過遺傳算法構(gòu)造禁忌搜索算法的初始解,作為禁忌搜索模塊的鄰域,通過禁忌搜索算法進 一步優(yōu)化個體,提升整個種群的質(zhì)量,使更優(yōu)的個體在最少的迭代步數(shù)內(nèi)出現(xiàn)。
[0137] 3.應用實際的突破
[0138] 以往的基于啟發(fā)式算法的車輛調(diào)度都應用在物流公司對客戶需求的配送中,考慮 的都是從物流中心出發(fā)到客戶手中的車輛調(diào)度,且考慮限制條件相對單一和存在很大的理 論性。本設(shè)計從廠區(qū)的實際需求出發(fā),突破以往的場外物流條件,綜合考慮廠區(qū)中實際存在 的約束條件,采用啟發(fā)式算法完成廠區(qū)內(nèi)部車輛來往于不同倉庫的調(diào)度問題,從原先的從 集中到分散的一對多配送模式轉(zhuǎn)變?yōu)楫斍暗膹膫}庫到這車輛的多對一物流模式,依據(jù)實際 對原有算法進行大膽的創(chuàng)新,以解決實際物流問題。
[0139] 本設(shè)計基于實際項目背景,利用MAS多智能體模型搭建了基于月臺的車輛調(diào)度系 統(tǒng)模型,并在充分分析需求的基礎(chǔ)上,設(shè)計了以車輛運作時間最短為目標的車輛調(diào)度數(shù)學 模型,其中運用到了在物流調(diào)度問題上廣泛采用的啟發(fā)式算法:遺傳算法和禁忌搜索算 法,在提取兩者優(yōu)勢的基礎(chǔ)上設(shè)計了基于兩者的混合遺傳算法,使車輛調(diào)度達到最優(yōu)。
【附圖說明】
[0140] 圖1是基于月臺調(diào)度的物流配送模式模型示意圖;
[0141 ]圖2是基于MAS的智能調(diào)度排序模型示意圖;
[0142] 圖3是車輛調(diào)度排序模型示意圖;
[0143] 圖4是車輛調(diào)度匹配算法的流程圖;
[0144] 圖5是倉庫模型分析平面圖;
[0145] 圖6混合算法模型示意圖;
[0146] 圖7混合算法算法流程示意圖。
【具體實施方式】
[0147] 下面結(jié)合附圖和具體實施例對本發(fā)明作進一步的詳細說明。
[0148] 本發(fā)明提供一種多智能體系統(tǒng)Multi-Agent System,MAS理論,構(gòu)造基于月臺的調(diào) 度排序系統(tǒng)作為多約束條件的組合優(yōu)化復雜系統(tǒng),實現(xiàn)多智能體技術(shù)對實時的車輛調(diào)度決 策進行研究提供了新的解決方法,以提高貨運作業(yè)效率。
[0149]多智能體(Multi-Agent System,MAS)作為分布式人工智能研究的前沿領(lǐng)域和支 持智能決策的重要方法之一,因其具備的特點而被公認為是研究各類復雜系統(tǒng)的重要理論 模型?;谠屡_的調(diào)度排序系統(tǒng)作為多約束條件的組合優(yōu)化復雜系統(tǒng),引入多智能體技術(shù) 對實時的車輛調(diào)度決策進行研究提供了新的解決方法,具備很好的理論意義和實用價值。
[0150] 多智能體系統(tǒng)(Multi-Agent System,MAS)是由一個在一個環(huán)境中交互的多個智 能體組成的計算系統(tǒng)。多智能體系統(tǒng)也能被用在解決分離的智能體以及單層系統(tǒng)難以解決 的問題。智能體可以由一些方法,函數(shù),過程,搜索算法或加強學習來實現(xiàn)。Agent具有自治 性、反應性、預動性、社會性的特點。MAS本身具有協(xié)作性、并行性、健壯性、易擴展性以及分 布求解等特點,使得它在處理動態(tài)復雜系統(tǒng)方面具有天然的優(yōu)越性。MAS是幾個半自治或自 治的Agent按照一定的協(xié)議和某種語言,能與其他Agent通信來完成一個復雜問題求解的一 個系統(tǒng)。具有協(xié)作性、并行性、健壯性、易擴展性、分布性等特征。MAS系統(tǒng)中各智能體的通 信是通過彼此協(xié)調(diào)擱置行為實現(xiàn)相互之間的通信,是以通信技術(shù)為基礎(chǔ)。自主性、動態(tài)性、 分布性和協(xié)調(diào)性等特點是人工智能研究領(lǐng)域的MAS具備的優(yōu)勢,MAS之間的協(xié)作也經(jīng)常用于 優(yōu)化資源配置和分布式問題合作求解。
[0151] 本發(fā)明包括基于月臺調(diào)度的排序系統(tǒng)和多智能體算法設(shè)計兩個部分:其中,所述 的基于月臺調(diào)度的排序系統(tǒng)還包括配送模式、Agent建模、車輛調(diào)度;
[0152] A、配送模式:基于月臺調(diào)度的物流配送模式大致如圖1所示,配送中心從上游獲取 貨源,經(jīng)過收貨、存儲、組裝和調(diào)度車輛等流程,最后將貨物送到客戶,基于月臺的車輛調(diào)度 主要負責廠區(qū)內(nèi)的車輛進車裝貨并出廠的過程。
[0153] 任何情況的物流配送車輛調(diào)度問題都可以按照數(shù)學建模的方法,表達成有目標函 數(shù)和約束條件兩部分構(gòu)成的數(shù)學規(guī)劃模型。根據(jù)基于月臺調(diào)度的車輛調(diào)度需求方案,其數(shù) 學模型可以表述為:
[0154] min or max z = f(x)
[0155] 根據(jù)實際項目的需求,可以分析得出約束條件:送貨時間相關(guān)的約束、運輸車輛相 關(guān)的約束、標準工時相關(guān)的約束、緊急響應相關(guān)的約束、人力資源相關(guān)的約束、裝卸設(shè)備相 關(guān)的約束等。
[0156] B、Agent建模:基于MAS處理多約束條件目標優(yōu)化問題的明顯優(yōu)勢,本設(shè)計將MAS應 用到月臺調(diào)度系統(tǒng)中,不同層次的主體(影響因素)可以通過不同層次的Agent來進行描述 和表達。不同層次的Agent相互聯(lián)系、相互作用共同組成了一個實際的調(diào)度系統(tǒng)。
[0157] 按照供應鏈和Agent建模的思想,整個基于MAS的月臺智能系統(tǒng)模型如圖2所示。
[0158] 1、客戶Agent包含客戶名稱、客戶代碼、發(fā)貨計劃、要求送達時間、所需捆包的類型 和數(shù)量等信息。
[0159] 2、倉庫Agent包含捆包類型、捆包號、備貨系數(shù)等信息。
[0160] 3、車輛Agent同司機綁定,包含車輛位置狀態(tài)(車輛等待、正在裝車、裝完車輛)、車 輛裝載量、車牌、司機、車批等信息。
[0161] 4、路網(wǎng)Agent包含不同的倉庫點的庫門、庫位以及它們之間切換耗時信息。
[0162] 5、勞動力Agent包含單包裝車標準工時、裝卸工人信息(總?cè)藬?shù)、已分配人數(shù)、待分 配人數(shù))等信息。
[0163] 訂單處理Agent會根據(jù)倉庫的貨物存儲現(xiàn)狀和客戶的訂單要求初步評估現(xiàn)有的貨 物量能否滿足客戶的需求,并將最終的評估報告反映給最上層的總調(diào)度Agent,總調(diào)度 Agent根據(jù)評估報告決定采取生成裝運計劃單(計劃單號作為訂單ID)還是安排相關(guān)貨物貨 物的生產(chǎn)計劃。
[0164]緊急響應Agent屬于單方向依賴的智能體,用來處理系統(tǒng)中的緊急情況。作用于系 統(tǒng)的每一個運輸指令的關(guān)鍵環(huán)節(jié)上,當實際執(zhí)行確認指令未在計劃時間內(nèi)反饋至總調(diào)度 Agent,預警信息會立即顯示在系統(tǒng)看板上,異常情況的處理主動性強。
[0165] 總調(diào)度根據(jù)生成的裝運計劃,計算裝運裝運線和運輸里程(用在根據(jù)理論在途時 間計算出廠時間上)。將裝運計劃提供給車輛調(diào)度Agent,車輛調(diào)度Agent完成車輛調(diào)度。最 后根據(jù)車輛調(diào)度Agent的計算結(jié)果倒退車輛進場時間。
[0166] 車輛調(diào)度Agent是整個調(diào)度系統(tǒng)的關(guān)鍵,當客戶訂單生成并且系統(tǒng)沒有發(fā)生意外 情況下,總調(diào)度Agent提取裝載調(diào)度Agent的人力資源信息,將其同訂單一并下發(fā)給車輛調(diào) 度Agent,車輛調(diào)度Agent根據(jù)訂單和車輛等資源,對裝車順序合理調(diào)度,是系統(tǒng)整體效率達 到最尚。
[0167] 裝卸調(diào)度Agent負責勞動力的調(diào)動,合理的安排工人工作時間和地點,讓工人在正 確的時間出現(xiàn)在正確的倉庫門口裝卸貨物,計算裝車用時,就計算結(jié)果返給上級Agent,讓 車輛在倉庫停留時間最少。
[0168] 裝車計劃耗時為標準工時=捆包個數(shù)*標準工時
[0169] 總調(diào)度Agent是整個系統(tǒng)的大腦,負責整個系統(tǒng)的同步和管理,協(xié)調(diào)各個Agent,使 它們之間協(xié)作,保證整個系統(tǒng)有序的運行。
[0170] C、車輛調(diào)度:針對月臺調(diào)度智能排序的目標,整個系統(tǒng)中最為關(guān)鍵的模塊是車輛 調(diào)度Agent模塊,相應的影響因素主要涉及倉庫和車輛兩個方面,相關(guān)的影響因素關(guān)系圖如 圖3所示。
[0171] 在多倉庫的環(huán)境中,將代運車輛調(diào)度到合適的倉庫門來提高整個廠區(qū)的裝卸效率 涉及較多的影響因素,如該倉庫的繁忙程度、倉庫的貨物儲備量等。綜合各方面的因素,結(jié) 合廠區(qū)內(nèi)的13個倉庫門,車輛與相應的倉庫匹配矩陣如表1所示。
[0172] 表1車輛與倉庫的匹配矩陣
[0173]
[0174] 表1中D表示倉庫,.0_表示不同影響因素的權(quán)重,△ ij表示第i個倉庫對第j個影響因 素的評價情況,倉庫裝卸能力表示當前倉庫的裝車水平,在實時狀態(tài)下裝載單位產(chǎn)品的用 時;車輛到倉庫耗時表示空載車輛(沒有裝載貨物)從場內(nèi)發(fā)車點到對應倉庫門的用時;倉 庫貨物儲量表示當前倉庫門能夠提供的對應貨物的最大量,決定著是否滿足車輛的需求; 車輛實載率表示當前車輛的裝載狀態(tài),剩余可供產(chǎn)品裝車的空間還有多少,影響著車輛選 擇合適的倉庫門。權(quán)重表示各個因素對車輛調(diào)度的重要程度。
[0175] 車輛初始停靠位置的最佳匹配算法(以倉庫門DQ1為例):
[0176] 步驟一:標準化匹配矩陣的指標,將不同的單位換算成可用來比較的同一量;
[0177] Δ 101 =卩揚搬*〇 · 6+P行輛?'κ遁*0 · 2+P··個 *0 · 2
[0178] Δ 2〇1 = Ρρ達倉南'1個
[0179] A 301 = Ρ棚3*編;>1<〇 · 9+Ρ難r*=品*0 · 1
[0180 ] Δ4〇ι = Ρ^?3|?/Ρ^???
[0181]
[0182]
[0183] 對 Δ ιο?、Δ 2。1、Δ 3。1、Δ 4。1、Δ 5。1、Δ 6。1進單位歸一化
[0184] 步驟二:歸一化處理各影響因素的權(quán)重;
[0185] 衡量氣、%、%、04、03、%的值,并使其滿足:
[0186] 0, + + 3, + θ4 + θ3 + θ6 - 1
[0187] 步驟三:計算倉庫??康木C合評價值;
[0188] 綜合評價值的計算公式為:
[0189]
[0190] 步驟四:當有一個或多個車輛同時參與運輸時,綜合考慮評價值最高的倉庫作為 配送車輛??康某跏甲罴褌}庫。匹配算法的流程圖如圖4所示。
[0191] 由于存在一個倉庫貨物短缺或是其他原因而存在一個倉庫不能滿足配送車輛運 輸需求的情況,車輛需要到其他倉庫門提取需要裝載的貨物,在到達其他倉庫提取相應的 貨物時,由于裝卸水平的限制,出現(xiàn)多個車輛的時候需要后面的車輛等待前面車輛離開后 才能裝載,浪費了時間,降低了運輸效率。
[0192] 廠區(qū)倉庫模型:以倉庫1為例(其他兩個庫房同倉庫1),對倉庫模型進行分析,倉庫 1的平面圖如圖5所示。
[0193] 倉庫1對應六個庫門,其中1號門和7號門共用裝卸設(shè)備,2號門和6號門共用裝卸設(shè) 備,3號門和5號門共用裝卸設(shè)備,對于一個倉庫的不同庫門,存儲不同的產(chǎn)品,正常情況下, 每個庫門對應一種產(chǎn)品(窄帶、板等),由于不同車輛需要混裝的實際情況,可能存在該倉 庫門存放著少量的本不屬于該庫門的產(chǎn)品,當客戶訂單完成后,安排車輛根據(jù)客戶訂單到 對應的倉庫庫門去取相應的產(chǎn)品。根據(jù)各個倉庫門的繁忙程度或是裝卸水平因素的影響, 車輛可能不同的運輸路徑到達對應的倉庫門以最短的時間完成裝車工作,方便后面車輛的 運作,提高系統(tǒng)整體的運行效率。
[0194] 根據(jù)用時最優(yōu)的目標設(shè)計調(diào)度模型,模型中涉及的參數(shù)作如下說明:
[0195] G:倉庫門的集合
[0196] V:參與配送車輛的集合
[0197] ti:車輛到達倉庫i的用時
[0198] Li:倉庫i最晚服務(wù)的時間(廠區(qū)24小時工作,可忽略)
[0199] Ei:倉庫i最早服務(wù)的時間(廠區(qū)24小時工作,可忽略)
[0200] a1:倉庫最早可提供裝車服務(wù)的時間(車輛到達倉庫時需等待的最短時間)
[0201] b1:倉庫最晚可提供裝車服務(wù)的時間(車輛到達倉庫時需等待的最長時間)
[0202] f1:車輛到達倉庫早于倉庫提供服務(wù)時間的懲罰系數(shù)
[0203] f2:車輛到達倉庫晚于倉庫提供服務(wù)時間的懲罰系數(shù)
[0204] Cij:車輛經(jīng)過倉庫i和j之間的耗時(范圍為5-lOmin)
[0205] Pi:倉庫門i裝完一輛車所需產(chǎn)品的耗時
[0206] q:車輛的容量
[0207] m:倉庫門i提供給車的貨物容量
[0208]
[0209]
[0210]
[0211] 數(shù)學模型:
[0212]
[0213]
[0214]
[0215]
[0216]
[0217] 式(3.1)作為整個模型的優(yōu)化目標,表示車輛經(jīng)過排序最后完成任務(wù)的時間最短, 約束條件(3.2)表示車輛到達倉庫的時間不能早于倉庫開始提供服務(wù)的時間,不能晚于倉 庫關(guān)閉服務(wù)的時間,對于廠區(qū)24小時工作,可忽略此條件;式(3.3)表示車輛最終的運載量 不能超過車輛本身的運載能力;式(3.4)、(3.5)表示一個車輛一次且最多只能一次經(jīng)過同 一個倉庫且經(jīng)過倉庫的總數(shù)不能超過倉庫的總數(shù)。
[0218] 本發(fā)明基于多智能體月臺調(diào)度排序模型的構(gòu)造算法設(shè)計:
[0219] 混合算法:
[0220] 在車輛調(diào)度相關(guān)問題的求解中,普遍采取的是啟發(fā)式算法,本設(shè)計采用兩種應用 廣發(fā)的啟發(fā)式算法,遺傳算法與禁忌搜索算法相結(jié)合的混合算法實現(xiàn),混合后的算法既具 有遺傳算法的全局性優(yōu)點,有具有禁忌搜索算法的爬山能力,可以較大程度的避免早熟,提 生會
[0221] 遺傳算法(GA)是根據(jù)達爾文的自然選擇和遺傳理論,將生物進化過程中適者生 存規(guī)則與同一群染色體的隨進信息交換相結(jié)合的智能算法。
[0222] 遺傳算法的性能在很大程度上依賴于交叉和變異的操作,這取決于在解集中如何 抽取樣本解。
[0223]禁忌搜索算法(TA)最重要的思想是標記對應已搜索的局部最優(yōu)解的一些對象,并 在進一步的迭代搜索中盡量避開這些對象(而不是絕對禁止循環(huán)),從而保證對不同的有效 搜索途徑的探索。
[0224]混合后算法的主要策略就是:首先通過遺傳算法進行全局搜索,采用自然數(shù)對所 有倉庫和可調(diào)配車輛進行編碼,將各倉庫的供貨能力同車輛的運載能力進行全局的路徑優(yōu) 化;然后運用禁忌搜索對種群中的個體以一定的概率進行局部搜索,也就是針對同一輛車 對所有倉庫進行局部運輸路徑優(yōu)化?;旌纤惴ǖ脑O(shè)計策略如圖6所示。
[0225] 剛開始只有初始種群(十個藍色六角星),然后模擬生物進化,在初始種群之間產(chǎn) 生選擇(適應性強的個體保留,留下六個藍色六角星)、變異(出現(xiàn)兩個四角星)、交叉(出現(xiàn) 一個紅色六角星)作為新一代種群,對新一代種群做僅僅搜索優(yōu)化,留下好的個體,經(jīng)過多 代的遺傳,最后形成適應度最好的個體(一個紅色六角星和一個藍色五角星)。
[0226] 混合算法求解:
[0227] (1)倉庫門直接排列自然數(shù)編碼
[0228] 首先可以設(shè)計多個1-G不同的不糊重復的自然數(shù)排列,該自然數(shù)排列就構(gòu)成一個 個體。按照約束條件可以依次將倉庫門插入到行駛路線中,例如調(diào)用兩輛車到達4的倉庫 點,假設(shè)車的行駛路徑為1234,即依次遍歷標號為1,2,3,4的倉庫點,首先將第一個倉庫點 插入到行駛路線中,如果滿足上述所有約束條件,插入第二個倉庫點,若滿足繼續(xù)進行,當 超出車輛的運載量時,調(diào)用第二輛車。
[0229] (2)設(shè)置初始種群
[0230]隨機的生成1-G這G個互不重復的自然數(shù)排列,即生成一個個體。假設(shè)初始種群的 數(shù)目為N,則產(chǎn)生N個這樣不同的個體。
[0231] (3)適應度評價標準確定
[0232] 因為優(yōu)化目標是求最小值,而遺傳算法的適應度表示適應能力最強的個體,故可 用目標函數(shù)的倒數(shù)表示適應度。
[0233] f = l/Zi
[0234] (4)復制操作
[0235] 本設(shè)計通過保留最佳個體和賭盤策略來完成對種群個體優(yōu)勝劣汰的操作。
[0236] (5)交叉操作
[0237] 通過一定的概率交換兩個父代個體的部分片段來完成交叉操作,常見的交叉算子 有部分交叉算子、順序交叉算子、循環(huán)交叉算子和類0X算子等。
[0238]本設(shè)計采用順序交叉算子,例如一輛車完成根據(jù)裝運工作需要經(jīng)過1、2、3、4、5、6、 7這七個倉庫門裝載相應的產(chǎn)品,現(xiàn)有兩種不同的車輛行駛路線:1^ = 1234567,R2 = 3425167,Ri表不車輛依次經(jīng)過1號門、2號門、...、7號門,R2表不車輛依次經(jīng)過3號門、4號 門.....7號門,從中選擇一個匹配段,
[0239]
[0240] ^
[0241 ]根據(jù)匹配段的映射關(guān)系,在匹配段區(qū)域外對應的位置標注為A,即:
[0242]
[0243]
[0244] 再移動匹配段到起始位置,并在后面預留和匹配段空間相同的位置,標注為A,即:
[0245]
[0246] ____________
[0247] 最后將兩個序列的匹配段相互交換,得到兩個新的后代,即:
[0248]
[0249]
[0250] (6)變異操作
[0251] 變異操作體現(xiàn)了自然界基因突變的思想,常見的變異算子有逆轉(zhuǎn)變異、交換變異 和插入變異。
[0252] 本設(shè)計采用逆轉(zhuǎn)變異,隨機選擇一個序列中的兩個點進行位置互換,將兩點內(nèi)字 符反序插入到原序列中。例如對于一輛車的行駛路線為Ri = 1234567,將第二個位置和第五 個位置進行逆轉(zhuǎn)變異,得到的序列為R/=1543267。
[0253] (7)利用禁忌搜索法對當前解進行改進
[0254] 禁忌算法采用
[0255]
:寸當前解進行評價
[0256] 其中T(i)表示車輛到達倉庫點需要的時間,E(i)表示車輛在倉庫點裝卸貨物和 等待的時間,W(i)表示車輛的車載量,p代表懲罰系數(shù)。
[0257] 禁忌搜索算法的執(zhí)行步驟如下:
[0258] 步驟一:選定初始解(有遺傳算法得到)xn?,令禁忌表// =0。
[0259] 步驟二:若滿足終止準則,轉(zhuǎn)步驟四;否則,在xn1勺領(lǐng)域N(xn?)中選出滿足禁忌要 求的候選集can_N(x n°w),執(zhí)行步驟三。
[0260] 步驟三:在can_N(x_)選出一組評價值最優(yōu)解/^,令xn°w = xbest,更新禁忌表,轉(zhuǎn) 步驟二。
[0261] 步驟四:輸出運算結(jié)果。
[0262] (8)終止準則
[0263] 因為影響車輛調(diào)度系統(tǒng)穩(wěn)定性的動態(tài)因素較多,對決策系統(tǒng)的時效性要高,本設(shè) 計擬采用指定代數(shù)步數(shù)終止的終止準則。
[0264]算法流程:結(jié)合了遺傳算法和緊急搜索算法的混合算法的流程圖如圖7所示。
[0265] 算法設(shè)計:
[0266] 輸入?yún)?shù):
[0267] 種群規(guī)模N,表示不同的初始車輛的運行路線
[0268] 進化代數(shù)T,表示種群要繁衍的代數(shù)
[0269] 交叉概率卩。
[0270] 變異概率Pm
[0271] 懲罰系數(shù)p [0272]輸出結(jié)果:
[0273] 車輛調(diào)度路線和優(yōu)化目標值
[0274] 算法主體:
[0275] 根據(jù)車輛倉庫匹配矩陣產(chǎn)生多個不同的初始種群P(0),當前代數(shù)為t = 0;
[0276] 計算初始種群的適應度
[0277]
[0278] 資源狀態(tài),及時的更新資源,避免不必要的耗時。
[0285] 可擴展性:隨著生產(chǎn)方式和需求的變化,系統(tǒng)需要根據(jù)實際需要作出調(diào)整,多智能 可以在原先結(jié)構(gòu)的基礎(chǔ)上很容易擴展新的Agent,不需要做大的改動。
[0286] 社會性:多智能體根據(jù)實際問題可以很好的對問題進行劃分,將耦合性低的模塊 分給不同的Agent去處理,清晰了工作流程,提高了工作效率,提升了系統(tǒng)性能。
[0287] 2、混合算法的優(yōu)勢
[0288] 處理車輛調(diào)度問題的傳統(tǒng)方式是采用精確算法進行求解,包括分支定界算法、動 態(tài)規(guī)劃法等,這些算法都收限于問題的規(guī)模和約束條件的不變性。在處理大規(guī)模多變約束 條件下的問題是通常采用啟發(fā)式算法,常見的啟發(fā)式算法有遺傳算法、禁忌搜索算法、蟻群 算法等,但是單個算法存在固有的缺陷。
[0289] 遺傳算法雖然有很好的靈活性和魯棒性,適合大規(guī)模問題的求解,但其存在過早 地收斂和局部搜索能力差的缺陷。而在遺傳算法的基礎(chǔ)上添加禁忌搜索算法的混合算法可 以解除禁忌搜索算法局部優(yōu)化的優(yōu)點很好的彌補了這一缺陷。整個混合算法的思想就是通 過遺傳算法構(gòu)造禁忌搜索算法的初始解,作為禁忌搜索模塊的鄰域,通過禁忌搜索算法進 一步優(yōu)化個體,提升整個種群的質(zhì)量,使更優(yōu)的個體在最少的迭代步數(shù)內(nèi)出現(xiàn)。
[0290] 3、應用實際的突破
[0291] 以往的基于啟發(fā)式算法的車輛調(diào)度都應用在物流公司對客戶需求的配送中,考慮 的都是從物流中心出發(fā)到客戶手中的車輛調(diào)度,且考慮限制條件相對單一和存在很大的理 論性。本設(shè)計從廠區(qū)的實際需求出發(fā),突破以往的場外物流條件,綜合考慮廠區(qū)中實際存在 的約束條件,采用啟發(fā)式算法完成廠區(qū)內(nèi)部車輛來往于不同倉庫的調(diào)度問題,從原先的從 集中到分散的一對多配送模式轉(zhuǎn)變?yōu)楫斍暗膹膫}庫到這車輛的多對一物流模式,依據(jù)實際 對原有算法進行大膽的創(chuàng)新,以解決實際物流問題。
[0292] 本發(fā)明基于實際項目背景,利用MAS多智能體模型搭建了基于月臺的車輛調(diào)度系 統(tǒng)模型,并在充分分析需求的基礎(chǔ)上,設(shè)計了以車輛運作時間最短為目標的車輛調(diào)度數(shù)學 模型,其中運用到了在物流調(diào)度問題上廣泛采用的啟發(fā)式算法:遺傳算法和禁忌搜索算法, 在提取兩者優(yōu)勢的基礎(chǔ)上設(shè)計了基于兩者的混合遺傳算法,使車輛調(diào)度達到最優(yōu)。
【主權(quán)項】
1.一種基于多智能體月臺調(diào)度智能排序模型的構(gòu)造,其特征在于:多智能體系統(tǒng) (Multi-Agent System,MAS)是由一個在一個環(huán)境中交互的多個智能體組成的計算系統(tǒng);多 智能體系統(tǒng)也能被用在解決分離的智能體W及單層系統(tǒng)中難W解決的問題;智能體通過一 些方法,函數(shù),過程,捜索算法來實現(xiàn),其中各智能體的通信是通過彼此協(xié)調(diào)擱置行為實現(xiàn) 相互之間的通信,是W通信技術(shù)為基礎(chǔ); 本發(fā)明包括基于月臺調(diào)度的排序系統(tǒng)和多智能體算法設(shè)計兩個部分:其中,所述的基 于月臺調(diào)度的排序系統(tǒng)還包括配送模式、Agent建模、車輛調(diào)度; 所述配送模式是基于月臺調(diào)度的物流配送模式,配送中屯、從上游獲取貨源,經(jīng)過收貨、 存儲、組裝和調(diào)度車輛等流程,最后將貨物送到客戶;任何情況的物流配送車輛調(diào)度問題都 可W按照數(shù)學建模的方法,表達成有目標函數(shù)和約束條件兩部分構(gòu)成的數(shù)學規(guī)劃模型;本 發(fā)明基于月臺調(diào)度的車輛調(diào)度需求方案,其數(shù)學模型可W表述為:min or max z = f(x)根 據(jù)實際項目的需求,可W分析得出約束條件:送貨時間相關(guān)的約束、運輸車輛相關(guān)的約束、 標準工時相關(guān)的約束、緊急響應相關(guān)的約束、人力資源相關(guān)的約束、裝卸設(shè)備相關(guān)的約束; 所述Agent建模指的是:基于MAS處理多約束條件目標優(yōu)化問題的明顯優(yōu)勢,本發(fā)明將 MS應用到月臺調(diào)度系統(tǒng)中,不同層次的主體(影響因素)可W通過不同層次的Agent來進行 描述和表達;不同層次的Agent相互聯(lián)系、相互作用共同組成了一個實際的調(diào)度系統(tǒng); 所述車輛調(diào)度是針對月臺調(diào)度智能排序的目標而設(shè)計的最為關(guān)鍵的模塊,相應的影響 因素主要設(shè)及倉庫和車輛兩個方面,在多倉庫的環(huán)境中,將待運車輛調(diào)度到合適的倉庫口 來提高整個廠區(qū)的裝卸效率設(shè)及較多的影響因素,如該倉庫的繁忙程度、倉庫的貨物儲備 量等;綜合各方面的因素,結(jié)合廠區(qū)內(nèi)的各個倉庫口,車輛與相應的倉庫智能匹配;對于一 個倉庫的不同庫口,存儲不同的產(chǎn)品,正常情況下,每個庫口對應一種產(chǎn)品(窄帶、板等),由 于不同車輛需要混裝的實際情況,可能存在該倉庫口存放著少量的本不屬于該庫口的產(chǎn) 品,當客戶訂單完成后,安排車輛根據(jù)客戶訂單到對應的倉庫庫口去取相應的產(chǎn)品;根據(jù)各 個倉庫口的繁忙程度或是裝卸水平因素的影響,車輛可能不同的運輸路徑到達對應的倉庫 口 W最短的時間完成裝車工作,方便后面車輛的運作,提高系統(tǒng)整體的運行效率; 本發(fā)明基于多智能體的月臺調(diào)度排序數(shù)學模型的構(gòu)造如下:上述模型中設(shè)及的參數(shù)作如下說明: G:倉庫口的集合 V:參與配送車輛的集合 ti:車輛到達倉庫i的用時 Li:倉庫i最晚服務(wù)的時間(廠區(qū)24小時工作,可忽略) El:倉庫i最早服務(wù)的時間(廠區(qū)24小時工作,可忽略) ai:倉庫最早可提供裝車服務(wù)的時間(車輛到達倉庫時需等待的最短時間) bi:倉庫最晚可提供裝車服務(wù)的時間(車輛到達倉庫時需等待的最長時間) fi:車輛到達倉庫早于倉庫提供服務(wù)時間的懲罰系數(shù) f2:車輛到達倉庫晚于倉庫提供服務(wù)時間的懲罰系數(shù) cij:車輛經(jīng)過倉庫i和j之間的耗時(范圍為5-lOmin) Pi:倉庫口 i裝完一輛車所需產(chǎn)品的耗時 q:車輛的容量 m:倉庫口 i提供給車的貨物容量本發(fā)明基于多智能體的月臺調(diào)度排序模型的算法采用兩種應用廣發(fā)的啟發(fā)式算法,遺 傳算法與禁忌捜索算法相結(jié)合的混合算法實現(xiàn),遺傳算法(GA)是根據(jù)達爾文的自然選擇和 遺傳理論,將生物進化過程中適者生存規(guī)則與同一群染色體的隨進信息交換相結(jié)合的智能 算法;遺傳算法的性能在很大程度上依賴于交叉和變異的操作,運取決于在解集中如何抽 取樣本解;禁忌捜索算法(TA)最重要的思想是標記對應已捜索的局部最優(yōu)解的一些對象, 并在進一步的迭代捜索中盡量避開運些對象,而不是絕對禁止循環(huán),從而保證對不同的有 效捜索途徑的探索; 混合后算法的主要策略就是:首先通過遺傳算法進行全局捜索,采用自然數(shù)對所有倉 庫和可調(diào)配車輛進行編碼,將各倉庫的供貨能力同車輛的運載能力進行全局的路徑優(yōu)化; 然后運用禁忌捜索對種群中的個體W-定的概率進行局部捜索,也就是針對同一輛車對所 有倉庫進行局部運輸路徑優(yōu)化;本發(fā)明首先設(shè)置初始種群,然后模擬生物進化,在初始種群 之間產(chǎn)生選擇、變異、交叉作為新一代種群,對新一代種群做僅僅捜索優(yōu)化,留下好的個體, 經(jīng)過多代的遺傳,最后形成適應度最好的個體; 本發(fā)明所采用的混合算法求解過程如下: (1)倉庫口直接排列自然數(shù)編碼 首先可W設(shè)計多個1-G不同的不糊重復的自然數(shù)排列,該自然數(shù)排列就構(gòu)成一個個體。 按照約束條件可W依次將倉庫口插入到行駛路線中,例如調(diào)用兩輛車到達4的倉庫點,假設(shè) 車的行駛路徑為1234,即依次遍歷標號為1,2,3,4的倉庫點,首先將第一個倉庫點插入到行 駛路線中,如果滿足上述所有約束條件,插入第二個倉庫點,若滿足繼續(xù)進行,當超出車輛 的運載量時,調(diào)用第二輛車。 (2) 設(shè)置初始種群 隨機的生成1-G運G個互不重復的自然數(shù)排列,即生成一個個體。假設(shè)初始種群的數(shù)目 為N,則產(chǎn)生N個運樣不同的個體。 (3) 適應度評價標準確定 因為優(yōu)化目標是求最小值,而遺傳算法的適應度表示適應能力最強的個體,故可用目 標函數(shù)的倒數(shù)表示適應度。 f=l/Zi (4) 復制操作 本設(shè)計通過保留最佳個體和賭盤策略來完成對種群個體優(yōu)勝劣汰的操作。 (5) 交叉操作 通過一定的概率交換兩個父代個體的部分片段來完成交叉操作,常見的交叉算子有部 分交叉算子、順序交叉算子、循環(huán)交叉算子和類0X算子等。 本設(shè)計采用順序交叉算子,例如一輛車完成根據(jù)裝運工作需要經(jīng)過1、2、3、4、5、6、7運 屯個倉庫口裝載相應的產(chǎn)品,現(xiàn)有兩種不同的車輛行駛路線:Ri = 1234567,R2 = 3425167,Ri 表示車輛依次經(jīng)過1號口、2號口.....7號口,R2表示車輛依次經(jīng)過3號口、4號口.....7號 Π ,從中選擇一個匹配段, 巧=12;34;567 巧2 =34; 25; 167 根據(jù)匹配段的映射關(guān)系,在匹配段區(qū)域外對應的位置標注為A,即: 巧* =1/);34;/?67 R* = AA\25\\bl 再移動匹配段到起始位置,并在后面預留和匹配段空間相同的位置,標注為A,即: 巧 ** 二 Μ;/?/?;671 R" =25\ΛΑ·Λ6? 最后將兩個序列的匹配段相互交換,得到兩個新的后代,即: 巧 *** =%;25乂71 屬/*'=25;34;167 (6) 變異操作 變異操作體現(xiàn)了自然界基因突變的思想,常見的變異算子有逆轉(zhuǎn)變異、交換變異和插 入變異。 本設(shè)計采用逆轉(zhuǎn)變異,隨機選擇一個序列中的兩個點進行位置互換,將兩點內(nèi)字符反 序插入到原序列中。例如對于一輛車的行駛路線為化= 1234567,將第二個位置和第五個位 置進行逆轉(zhuǎn)變異,得到的序列為Ri*=1543267。 (7) 利用禁忌捜索法對當前解進行改進 禁忌算法采用計當前解進行評價 其中τα)表示車輛到達倉庫點需要的時間,E(i)表示車輛在倉庫點裝卸貨物和等待的 時間,W(i)表示車輛的車載量,P代表懲罰系數(shù)。 禁忌捜索算法的執(zhí)行步驟如下: 步驟一:選定初始解(有遺傳算法得到)χη?,令禁忌表i? = 0。 步驟二:若滿足終止準則,轉(zhuǎn)步驟四;否則,在χη?的領(lǐng)域Ν(χη?)中選出滿足禁忌要求的 候選集can_N(xn?),執(zhí)行步驟=。 步驟Ξ:在Can_N(Xn?)選出一組評價值最優(yōu)解xbest,令χη?二xbest,更新禁忌表,轉(zhuǎn)步驟 --〇 步驟四:輸出運算結(jié)果。 (8)終止準則 因為影響車輛調(diào)度系統(tǒng)穩(wěn)定性的動態(tài)因素較多,對決策系統(tǒng)的時效性要高,本設(shè)計擬 采用指定代數(shù)步數(shù)終止的終止準則; 本發(fā)明基于多智能體的月臺調(diào)度排序模型的算法設(shè)計如下: 輸入?yún)?shù): 種群規(guī)模N,表示不同的初始車輛的運行路線 進化代數(shù)T,表示種群要繁衍的代數(shù) 交叉概率Pc 變異概率Pm 懲罰系數(shù)P 輸出結(jié)果: 車輛調(diào)度路線和優(yōu)化目標值 算法主體: 根據(jù)車輛倉庫匹配矩陣產(chǎn)生多個不同的初始種群P(〇),當前代數(shù)為t = 0; 計算初始種群的適應度 怖ile(t<T) { 將當前代數(shù)適應度最高的個體進行復制操作,插入到新一代中p(t+l); 根據(jù)適應度和賭盤選擇策略,計算每個個體的選擇概率Pi ; for(k = 0;k< = N;k+ = 2) { 根據(jù)選擇概率Pi從父代種群中選擇兩個父代個體; r=[0,l]之間的隨機值 i 地 < = Pc) 對兩個父代個體進行交叉操作,添加到新一代種群P(t+1)中; else { r=[0,l]之間的隨機值 if (;r< = Pm) 對兩個父代個體1進行變異操作,添加到新一代種群P(t+1)中; else父代個體1直接復制,添加到新一代種群P(t+1)中; r= [0,1]之間的隨機值 if (;r< = Pm) 對兩個父代個體2進行變異操作,添加到新一代種群P( t+1)中; else父代個體2直接復制,添加到新一代種群P(t+1)中; 禁忌捜索算法; } } 計算P(t+1)代種群適應度; t = t+l ; } 輸出結(jié)果。2.根據(jù)權(quán)利要求1所述的基于多智能體月臺調(diào)度智能排序模型的構(gòu)造,其特征在于:所 述Agent建模包括:客戶Agent、倉庫Agent、車輛Agent、路網(wǎng)Agent、勞動力Agent、訂單處理 Agent、緊急響應Agent、車輛調(diào)度Agent、裝卸調(diào)度Agent及總調(diào)度Agent,其中: 1) 客戶Agent包含客戶名稱、客戶代碼、發(fā)貨計劃、要求送達時間、所需捆包的類型和 數(shù)量等信息; 2) 倉庫Agent包含捆包類型、捆包號、備貨系數(shù)等信息; 3) 車輛Agent同司機綁定,包含車輛位置狀態(tài)(車輛等待、正在裝車、裝完車輛)、車輛裝 載量、車牌、司機、車批等信息; 4) 路網(wǎng)Agent包含不同的倉庫點的庫口、庫位W及它們之間切換耗時信息; 5) 勞動力Agent包含單包裝車標準工時、裝卸工人信息(總?cè)藬?shù)、已分配人數(shù)、待分配人 數(shù))等?胃息; 6) 訂單處理Agent會根據(jù)倉庫的貨物存儲現(xiàn)狀和客戶的訂單要求初步評估現(xiàn)有的貨物 量能否滿足客戶的需求,并將最終的評估報告反映給最上層的總調(diào)度Agent,總調(diào)度Agent 根據(jù)評估報告決定采取生成裝運計劃單(計劃單號作為訂單ID)還是安排相關(guān)貨物貨物的 生產(chǎn)計劃; 7) 緊急響應Agent屬于單方向依賴的智能體,用來處理系統(tǒng)中的緊急情況;作用于系統(tǒng) 的每一個運輸指令的關(guān)鍵環(huán)節(jié)上,當實際執(zhí)行確認指令未在計劃時間內(nèi)反饋至總調(diào)度 Agent,預警信息會立即顯示在系統(tǒng)看板上,異常情況的處理主動性強; 總調(diào)度根據(jù)生成的裝運計劃,計算裝運裝運線和運輸里程(用在根據(jù)理論在途時間計 算出廠時間上);將裝運計劃提供給車輛調(diào)度Agent,車輛調(diào)度Agent完成車輛調(diào)度;最后根 據(jù)車輛調(diào)度Agent的計算結(jié)果倒退車輛進場時間; 8) 車輛調(diào)度Agent是整個調(diào)度系統(tǒng)的關(guān)鍵,當客戶訂單生成并且系統(tǒng)沒有發(fā)生意外情 況下,總調(diào)度Agent提取裝載調(diào)度Agent的人力資源信息,將其同訂單一并下發(fā)給車輛調(diào)度 Agent,車輛調(diào)度Agent根據(jù)訂單和車輛等資源,對裝車順序合理調(diào)度,是系統(tǒng)整體效率達到 最局; 9)裝卸調(diào)度Agent負責勞動力的調(diào)動,合理的安排工人工作時間和地點,讓工人在正 確的時間出現(xiàn)在正確的倉庫口口裝卸貨物,計算裝車用時,就計算結(jié)果返給上級Agent,讓 車輛在倉庫停留時間最少; 總調(diào)度Agent是整個系統(tǒng)的大腦,負責整個系統(tǒng)的同步和管理,協(xié)調(diào)各個Agent,使它們 之間協(xié)作,保證整個系統(tǒng)有序的運行。3. 根據(jù)權(quán)利要求1所述的基于多智能體月臺調(diào)度智能排序模型的構(gòu)造,其特征在于:所 述車輛調(diào)度模塊中,D表示倉庫,S表示不同影響因素的權(quán)重,Δυ表示第i個倉庫對第j個影 響因素的評價情況,倉庫裝卸能力表示當前倉庫的裝車水平,在實時狀態(tài)下裝載單位產(chǎn)品 的用時;車輛到倉庫耗時表示空載車輛(沒有裝載貨物)從場內(nèi)發(fā)車點到對應倉庫口的用 時;倉庫貨物儲量表示當前倉庫口能夠提供的對應貨物的最大量,決定著是否滿足車輛的 需求;車輛實載率表示當前車輛的裝載狀態(tài),剩余可供產(chǎn)品裝車的空間還有多少,影響著車 輛選擇合適的倉庫口。權(quán)重表示各個因素對車輛調(diào)度的重要程度。 車輛初始停靠位置的最佳匹配算法倉庫口 Doi為例): 步驟一:標準化匹配矩陣的指標,將不同的單位換算成可用來比較的同一量;A 101、Δ 201、Δ 301、Δ 401、Δ 501、Δ ^ 步驟二:歸一化處理各影響因素的權(quán)重; 衡量新、@2、&、At、Ss、5.6.的值,并使其滿足: 巧 +.? + +S.4 +'巧5 +S.6 = 1 步驟Ξ:計算倉庫停靠的綜合評價值; 綜合評價值的計算公式為:步驟四:當有一個或多個車輛同時參與運輸時,綜合考慮評價值最高的倉庫作為配送 車輛??康某跏甲罴褌}庫。4. 根據(jù)權(quán)利要求1所述的基于多智能體月臺調(diào)度智能排序模型的構(gòu)造,其特征在于:所 述基于多智能體的月臺調(diào)度排序數(shù)學模型中式(3.1)作為整個模型的優(yōu)化目標,表示車輛 經(jīng)過排序最后完成任務(wù)的時間最短,約束條件(3.2)表示車輛到達倉庫的時間不能早于倉 庫開始提供服務(wù)的時間,不能晚于倉庫關(guān)閉服務(wù)的時間,對于廠區(qū)24小時工作,可忽略此條 件;式(3.3)表示車輛最終的運載量不能超過車輛本身的運載能力;式(3.4)、(3.5)表示一 個車輛一次且最多只能一次經(jīng)過同一個倉庫且經(jīng)過倉庫的總數(shù)不能超過倉庫的總數(shù)。
【文檔編號】G06Q10/04GK105976030SQ201610145780
【公開日】2016年9月28日
【申請日】2016年3月15日
【發(fā)明人】高山, 王永川, 姚琳, 車靜, 張東, 劉利
【申請人】武漢寶鋼華中貿(mào)易有限公司