專(zhuān)利名稱(chēng):一種基于pbs的電力應(yīng)用封裝方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及一種基于PBS的電力應(yīng)用封裝方法。
背景技術(shù):
高性能集群是用于進(jìn)行高性能計(jì)算的軟硬件系統(tǒng)的總稱(chēng)。硬件上通常由高性能服務(wù)器、高速存儲(chǔ)、高速網(wǎng)絡(luò)、機(jī)房基礎(chǔ)設(shè)施(如供電、制冷)等部分組成;軟件方面,通常包括作業(yè)調(diào)度軟件、集群監(jiān)控管理軟件、并行存儲(chǔ)軟件等部分組成。作業(yè)調(diào)度系統(tǒng)是負(fù)責(zé)完成應(yīng)用作業(yè)調(diào)度的軟件系統(tǒng)。從功能上說(shuō),通常由資源管理器、作業(yè)調(diào)度器、任務(wù)執(zhí)行器等部分組成;調(diào)度系統(tǒng)類(lèi)似于一個(gè)操作系統(tǒng),一般會(huì)提供比較完善的對(duì)于作業(yè)、資源等內(nèi)部對(duì)象進(jìn)行管理的接口,包括命令行接口、API接口。比較常 見(jiàn)的調(diào)度系統(tǒng)包括LSF、SGE、PBS (Torque是pbs的一個(gè)分支)。批量作業(yè)作為PBS的一種作業(yè)提交方式。該方式下,可以通過(guò)一次提交產(chǎn)生若干個(gè)作業(yè)。這些作業(yè)對(duì)應(yīng)的作業(yè)腳本是相同的。只是在運(yùn)行時(shí),各自在腳本中可以通過(guò)特定的環(huán)境變量(PBS_ARRAYID)進(jìn)行區(qū)分。該類(lèi)作業(yè)適合批量完成有大量同類(lèi)計(jì)算任務(wù)的情況。潮流計(jì)算和穩(wěn)定計(jì)算均為電力仿真計(jì)算,該類(lèi)任務(wù)計(jì)算的輸出(bse文件)是穩(wěn)定計(jì)算的輸入文件。穩(wěn)定計(jì)算應(yīng)用需要3個(gè)輸入文件,除了 Pf的輸出bse之外,還需要故障文件(.fit)和SWI文件。對(duì)于同一組穩(wěn)定計(jì)算來(lái)說(shuō),BSE和SWI文件是相同的,但是故障文件是各不相同的。通常采集到的原始故障文件通常是一個(gè)故障集,里面通常包含幾十或者幾百個(gè)故障記錄。目前,計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域最重要的計(jì)算類(lèi)型就是潮流和穩(wěn)定。目前用戶(hù)一般的使用場(chǎng)景類(lèi)似于工作站方式,即登錄到計(jì)算節(jié)點(diǎn)、提交潮流任務(wù),等待計(jì)算完成后,再提交穩(wěn)定任務(wù),同時(shí)提交之前還要手工完成故障的拆分。任務(wù)提交之后還需要守候計(jì)算任務(wù)完成。這樣的不足在于首先,潮流任務(wù)和穩(wěn)定任務(wù)的數(shù)據(jù)依賴(lài)需要人為干預(yù),難以提高運(yùn)行效率;其次,故障集合需要拆分成大量穩(wěn)定任務(wù)才能更快的計(jì)算,而手工拆分工作非常 ’最后,每個(gè)穩(wěn)定任務(wù)都會(huì)產(chǎn)生一定的計(jì)算數(shù)據(jù),數(shù)據(jù)的回收和管理非常繁瑣?,F(xiàn)有技術(shù)中,用戶(hù)基本上是基于單機(jī)手工運(yùn)行的,即(I)用戶(hù)先準(zhǔn)備好穩(wěn)定輸入DAT文件,然后啟動(dòng)潮流任務(wù),通過(guò)程序頁(yè)面監(jiān)控作業(yè)在運(yùn)行狀態(tài)。等潮流任務(wù)結(jié)束了,取到輸出BSE文件;(2).手動(dòng)拆分故障集文件為若干個(gè)文件,將BSE、SWI和拆分后的FLT—同作為輸入,啟動(dòng)若干個(gè)穩(wěn)定任務(wù);(3).分別監(jiān)控各穩(wěn)定任務(wù)的運(yùn)行狀態(tài);(4).手工回收各任務(wù)的計(jì)算結(jié)果。以上模式有如下的缺點(diǎn)受限于單機(jī)的工作能力,很難做到很高的并行度;需要人為鏈接潮流任務(wù)和穩(wěn)定任務(wù);輸出數(shù)據(jù)的回收比較麻煩。
發(fā)明內(nèi)容
為了克服上述現(xiàn)有技術(shù)的不足,本發(fā)明提供一種基于PBS的電力應(yīng)用封裝方法,通過(guò)作業(yè)依賴(lài)、作業(yè)組、file-stage等機(jī)制,有效的提高電力應(yīng)用的運(yùn)行效率和集群的整體利用率。為了實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明采取如下技術(shù)方案一種基于PBS的電力應(yīng)用封裝方法,所述方法包括以下步驟步驟I :用戶(hù)通過(guò)頁(yè)面Portal選擇潮流穩(wěn)定計(jì)算的原始輸入,并提交任務(wù);步驟2 :后臺(tái)自動(dòng)處理輸入文件并提交作業(yè),且潮流任務(wù)參與調(diào)度;步驟3 :潮流計(jì)算成功,產(chǎn)生的BSE文件自動(dòng)通過(guò)file-stage回傳到自身作業(yè)的數(shù)據(jù)回收目錄;·
步驟4 :穩(wěn)定任務(wù)使用輸入文件完成計(jì)算,開(kāi)源作業(yè)調(diào)度系統(tǒng)通過(guò)file-stage將自身輸出拷貝到自身的數(shù)據(jù)回收目錄。 所述步驟2中,DAT文件為潮流任務(wù)的輸入,F(xiàn)LT文件被拆分為單個(gè)故障,為穩(wěn)定任務(wù)的輸入;同時(shí),設(shè)置穩(wěn)定任務(wù)對(duì)于潮流任務(wù)的依賴(lài)關(guān)系afterok和file-stage參數(shù),使得穩(wěn)定任務(wù)自動(dòng)拷貝潮流任務(wù)的輸出BSE到自身目錄作為輸入。穩(wěn)定任務(wù)設(shè)置對(duì)于潮流的依賴(lài)關(guān)系afterok,其處于保留狀態(tài),不參與調(diào)度。所述步驟3中,潮流計(jì)算成功,穩(wěn)定任務(wù)自動(dòng)恢復(fù)為排隊(duì)狀態(tài),等待調(diào)度運(yùn)行。所述穩(wěn)定任務(wù)運(yùn)行時(shí),開(kāi)源作業(yè)調(diào)度系統(tǒng)自動(dòng)通過(guò)file-stage從潮流作業(yè)的數(shù)據(jù)回收目錄拷貝BSE文件和SWI文件到自身工作目錄。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于本發(fā)明提供一種基于PBS的電力應(yīng)用封裝方法,通過(guò)作業(yè)依賴(lài)、作業(yè)組、file-stage等機(jī)制,有效的提高電力應(yīng)用的運(yùn)行效率和集群的整體利用率;該方法簡(jiǎn)單可靠,易執(zhí)行。
圖I是基于PBS的電力應(yīng)用封裝方法流程圖。
具體實(shí)施例方式下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。如圖1,本發(fā)明提供一種基于PBS的電力應(yīng)用封裝方法,所述方法包括以下步驟步驟I :用戶(hù)通過(guò)頁(yè)面Portal選擇潮流穩(wěn)定計(jì)算的原始輸入,并提交任務(wù);步驟2 :后臺(tái)自動(dòng)處理輸入文件并提交作業(yè),且潮流任務(wù)參與調(diào)度;DAT文件為潮流任務(wù)的輸入,F(xiàn)LT文件被拆分為單個(gè)故障,為穩(wěn)定任務(wù)的輸入;同時(shí),設(shè)置穩(wěn)定任務(wù)對(duì)于潮流任務(wù)的依賴(lài)關(guān)系afterok和file-stage參數(shù),使得穩(wěn)定任務(wù)自動(dòng)拷貝潮流任務(wù)的輸出BSE到自身目錄作為輸入。穩(wěn)定任務(wù)設(shè)置對(duì)于潮流的依賴(lài)關(guān)系afterok,其處于保留狀態(tài),不參與調(diào)度。步驟3 :潮流計(jì)算成功,產(chǎn)生的BSE文件自動(dòng)通過(guò)file-stage回傳到自身作業(yè)的數(shù)據(jù)回收目錄;潮流計(jì)算成功,穩(wěn)定任務(wù)自動(dòng)恢復(fù)為排隊(duì)狀態(tài),等待調(diào)度運(yùn)行。所述穩(wěn)定任務(wù)運(yùn)行時(shí),開(kāi)源作業(yè)調(diào)度系統(tǒng)自動(dòng)通過(guò)file-stage從潮流作業(yè)的數(shù)據(jù)回收目錄拷貝BSE文件和SWI文件到自身工作目錄。
步驟4 :穩(wěn)定任務(wù)使用輸入文件完成計(jì)算,開(kāi)源作業(yè)調(diào)度系統(tǒng)通過(guò)file-stage將自身輸出拷貝到自身的數(shù)據(jù)回收目錄。最后應(yīng)當(dāng)說(shuō)明的是以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案而非對(duì)其限制,盡管參照上述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,所屬領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解依然可以對(duì)本發(fā)明的具體實(shí)施方式
進(jìn)行修改或者等同替換,而未脫離本發(fā) 明精神和范圍的任何修改或者等同替換,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
權(quán)利要求
1.一種基于PBS的電力應(yīng)用封裝方法,其特征在于所述方法包括以下步驟 步驟I :用戶(hù)通過(guò)頁(yè)面Portal選擇潮流穩(wěn)定計(jì)算的原始輸入,并提交任務(wù); 步驟2 :后臺(tái)自動(dòng)處理輸入文件并提交作業(yè),且潮流任務(wù)參與調(diào)度; 步驟3 :潮流計(jì)算成功,產(chǎn)生的BSE文件自動(dòng)通過(guò)file-stage回傳到自身作業(yè)的數(shù)據(jù)回收目錄; 步驟4 :穩(wěn)定任務(wù)使用輸入文件完成計(jì)算,開(kāi)源作業(yè)調(diào)度系統(tǒng)通過(guò)file-stage將自身輸出拷貝到自身的數(shù)據(jù)回收目錄。
2.根據(jù)權(quán)利要求I所述的基于PBS的電力應(yīng)用封裝方法,其特征在于所述步驟2中,DAT文件為潮流任務(wù)的輸入,F(xiàn)LT文件被拆分為單個(gè)故障,為穩(wěn)定任務(wù)的輸入;同時(shí),設(shè)置穩(wěn)定任務(wù)對(duì)于潮流任務(wù)的依賴(lài)關(guān)系afterok和file-stage參數(shù),使得穩(wěn)定任務(wù)自動(dòng)拷貝潮流任務(wù)的輸出BSE到自身目錄作為輸入。
3.根據(jù)權(quán)利要求2所述的基于PBS的電力應(yīng)用封裝方法,其特征在于穩(wěn)定任務(wù)設(shè)置對(duì)于潮流的依賴(lài)關(guān)系afterok,其處于保留狀態(tài),不參與調(diào)度。
4.根據(jù)權(quán)利要求I所述的基于PBS的電力應(yīng)用封裝方法,其特征在于所述步驟3中,潮流計(jì)算成功,穩(wěn)定任務(wù)自動(dòng)恢復(fù)為排隊(duì)狀態(tài),等待調(diào)度運(yùn)行。
5.根據(jù)權(quán)利要求4所述的基于PBS的電力應(yīng)用封裝方法,其特征在于所述穩(wěn)定任務(wù)運(yùn)行時(shí),開(kāi)源作業(yè)調(diào)度系統(tǒng)自動(dòng)通過(guò)file-stage從潮流作業(yè)的數(shù)據(jù)回收目錄拷貝BSE文件和SWI文件到自身工作目錄。
全文摘要
本發(fā)明提供一種基于PBS的電力應(yīng)用封裝方法,包括以下步驟用戶(hù)通過(guò)頁(yè)面Portal選擇潮流穩(wěn)定計(jì)算的原始輸入,并提交任務(wù);后臺(tái)自動(dòng)處理輸入文件并提交作業(yè),且潮流任務(wù)參與調(diào)度;潮流計(jì)算成功,產(chǎn)生的BSE文件自動(dòng)通過(guò)file-stage回傳到自身作業(yè)的數(shù)據(jù)回收目錄;穩(wěn)定任務(wù)使用輸入文件完成計(jì)算,開(kāi)源作業(yè)調(diào)度系統(tǒng)通過(guò)file-stage將自身輸出拷貝到自身的數(shù)據(jù)回收目錄。本發(fā)明通過(guò)作業(yè)依賴(lài)、作業(yè)組、file-stage等機(jī)制,有效的提高電力應(yīng)用的運(yùn)行效率和集群的整體利用率。
文檔編號(hào)G06F9/46GK102915252SQ20121034818
公開(kāi)日2013年2月6日 申請(qǐng)日期2012年9月18日 優(yōu)先權(quán)日2012年9月18日
發(fā)明者張濤 申請(qǐng)人:曙光信息產(chǎn)業(yè)(北京)有限公司