本發(fā)明涉及服務(wù)器故障的技術(shù)領(lǐng)域,特別是涉及一種熱替換NC節(jié)點(diǎn)的方法及裝置。
背景技術(shù):
隨著日常生活中的業(yè)務(wù)越來(lái)越多,越來(lái)越復(fù)雜,對(duì)服務(wù)器的性能要求也越來(lái)越高,為提高服務(wù)器的性能,單靠提高單個(gè)CPU節(jié)點(diǎn)的性能已經(jīng)無(wú)法滿足人們對(duì)服務(wù)器性能的要求,因此需要提高服務(wù)器中CPU的路數(shù)來(lái)提高性能;同時(shí)也對(duì)服務(wù)器的可靠性要求也越來(lái)越高,在服務(wù)器日常運(yùn)轉(zhuǎn)中,一旦服務(wù)器停機(jī)會(huì)對(duì)業(yè)務(wù)帶來(lái)極大不便,服務(wù)器NC節(jié)點(diǎn)出現(xiàn)故障時(shí),盡可能在不停機(jī)的情況下,將出現(xiàn)故障的那個(gè)NC節(jié)點(diǎn)進(jìn)行熱替換。
在服務(wù)器領(lǐng)域,系統(tǒng)運(yùn)行的穩(wěn)定性和可靠性是非常重要的。人們希望服務(wù)器不間斷運(yùn)行,以便保證商業(yè)網(wǎng)站、電信系統(tǒng)和銀行系統(tǒng)等的持續(xù)運(yùn)轉(zhuǎn)。由于服務(wù)器需要保持不間斷的待機(jī)能力,所以熱插拔就成為鑒別服務(wù)器可用性的關(guān)鍵因素。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明目的是提供一種熱替換NC節(jié)點(diǎn)的方法及裝置,能夠快速方便的,在不停機(jī)的情況下,將出現(xiàn)故障的NC節(jié)點(diǎn)進(jìn)行熱替換。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用以下的技術(shù)方案:
本發(fā)明提供一種熱替換NC節(jié)點(diǎn)的方法,包括以下步驟:
在不停機(jī)的情況下,將所有NC節(jié)點(diǎn)的內(nèi)存以及節(jié)點(diǎn)下CPU管理的內(nèi)存進(jìn)行緩存一致性寫(xiě)回操作;
基本輸入輸出系統(tǒng)設(shè)置同一節(jié)點(diǎn)的CPU和其他NC節(jié)點(diǎn),停止向故障NC節(jié)點(diǎn)發(fā)送數(shù)據(jù);
移除并更換故障NC節(jié)點(diǎn)。
優(yōu)選地,在不停機(jī)的情況下,將所有NC節(jié)點(diǎn)的內(nèi)存以及節(jié)點(diǎn)下CPU管理的內(nèi)存進(jìn)行緩存一致性寫(xiě)回操作之前,還包括:將出現(xiàn)故障的NC節(jié)點(diǎn)告知服務(wù)器系統(tǒng)。
優(yōu)選地,通過(guò)外部配置的方式,將出現(xiàn)故障的NC節(jié)點(diǎn)告知服務(wù)器系統(tǒng)。
優(yōu)選地,在基本輸入輸出系統(tǒng)設(shè)置同一節(jié)點(diǎn)的CPU和其他NC節(jié)點(diǎn),停止向故障NC節(jié)點(diǎn)發(fā)送數(shù)據(jù)之后,還包括:基本輸入輸出系統(tǒng)告知服務(wù)器系統(tǒng),故障NC節(jié)點(diǎn)停止運(yùn)行。
優(yōu)選地,在移除并更換故障NC節(jié)點(diǎn)之后,還包括:將更換后的NC節(jié)點(diǎn)進(jìn)行上電,初始化更換后的NC節(jié)點(diǎn)與其他NC節(jié)點(diǎn)間的鏈路參數(shù)以及更換后的NC節(jié)點(diǎn)與同一節(jié)點(diǎn)的CPU間的鏈路參數(shù)。
優(yōu)選地,在將更換后的NC節(jié)點(diǎn)進(jìn)行上電,初始化更換后的NC節(jié)點(diǎn)與其他NC節(jié)點(diǎn)間的鏈路參數(shù)以及更換后的NC節(jié)點(diǎn)與同一節(jié)點(diǎn)的CPU間的鏈路參數(shù)之后,還包括:初始化更換后的NC節(jié)點(diǎn),將更換后的NC節(jié)點(diǎn)添加到服務(wù)器系統(tǒng)中。
本發(fā)明還提供一種熱替換NC節(jié)點(diǎn)的裝置,包括:
緩存一致性寫(xiě)回操作模塊,用于在不停機(jī)的情況下,將所有NC節(jié)點(diǎn)的內(nèi)存以及節(jié)點(diǎn)下CPU管理的內(nèi)存進(jìn)行緩存一致性寫(xiě)回操作;
CPU設(shè)置模塊,用于基本輸入輸出系統(tǒng)設(shè)置同一節(jié)點(diǎn)的CPU和其他NC節(jié)點(diǎn),停止向故障NC節(jié)點(diǎn)發(fā)送數(shù)據(jù);
故障NC節(jié)點(diǎn)移除更換模塊,用于移除并更換故障NC節(jié)點(diǎn)。
優(yōu)選地,還包括:第一告知模塊,用于將出現(xiàn)故障的NC節(jié)點(diǎn)告知服務(wù)器系統(tǒng);
第二告知模塊,用于基本輸入輸出系統(tǒng)告知服務(wù)器系統(tǒng),故障NC節(jié)點(diǎn)停止運(yùn)行。
優(yōu)選地,還包括:初始化模塊,用于將更換后的NC節(jié)點(diǎn)進(jìn)行上電,初始化更換后的NC節(jié)點(diǎn)與其他NC節(jié)點(diǎn)間的鏈路參數(shù)以及更換后的NC節(jié)點(diǎn)與同一節(jié)點(diǎn)的CPU間的鏈路參數(shù)。
優(yōu)選地,還包括:更換后的NC節(jié)點(diǎn)添加模塊,用于初始化更換后的NC節(jié)點(diǎn),將更換后的NC節(jié)點(diǎn)添加到服務(wù)器系統(tǒng)中。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn):
本發(fā)明在不停機(jī)的情況下,將所有NC節(jié)點(diǎn)的內(nèi)存以及節(jié)點(diǎn)下CPU管理的內(nèi)存進(jìn)行緩存一致性寫(xiě)回操作,然后基本輸入輸出系統(tǒng)設(shè)置同一節(jié)點(diǎn)的CPU和其他NC節(jié)點(diǎn),停止向故障NC節(jié)點(diǎn)發(fā)送數(shù)據(jù),移除并更換故障NC節(jié)點(diǎn),最后初始化更換后的NC節(jié)點(diǎn)與其他NC節(jié)點(diǎn)間的鏈路參數(shù)以及更換后的NC節(jié)點(diǎn)與同一節(jié)點(diǎn)的CPU間的鏈路參數(shù),將更換后的NC節(jié)點(diǎn)添加到服務(wù)器系統(tǒng)中。在服務(wù)器NC節(jié)點(diǎn)出現(xiàn)故障時(shí),在不停機(jī)的情況下,將出現(xiàn)故障的NC節(jié)點(diǎn)進(jìn)行熱替換,提高了服務(wù)器系統(tǒng)運(yùn)行的穩(wěn)定性和可靠性。
上述熱替換NC節(jié)點(diǎn)的方法的有益效果與熱替換NC節(jié)點(diǎn)的裝置的有益效果類似,此處不再贅述。
附圖說(shuō)明
圖1是本發(fā)明實(shí)施例一種熱替換NC節(jié)點(diǎn)的方法的流程示意圖;
圖2是本發(fā)明實(shí)施例服務(wù)器的結(jié)構(gòu)框圖;
圖3是本發(fā)明實(shí)施例一種熱替換NC節(jié)點(diǎn)的裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了便于理解,對(duì)本發(fā)明中出現(xiàn)的部分名詞作以下解釋說(shuō)明:
BIOS:基本輸入輸出系統(tǒng)(Basic Input Output System),它是一組固化到計(jì)算機(jī)內(nèi)主板上一個(gè)ROM芯片上的程序,它保存著計(jì)算機(jī)最重要的基本輸入輸出的程序、開(kāi)機(jī)后自檢程序和系統(tǒng)自啟動(dòng)程序,它可從CMOS中讀寫(xiě)系統(tǒng)設(shè)置的具體信息。其主要功能是為計(jì)算機(jī)提供最底層的、最直接的硬件設(shè)置和控制。
下面結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明的具體實(shí)施方式作進(jìn)一步詳細(xì)描述:
本實(shí)施例提供一種熱替換NC節(jié)點(diǎn)的方法,包括以下步驟:
在不停機(jī)的情況下,將所有NC節(jié)點(diǎn)的內(nèi)存以及節(jié)點(diǎn)下CPU管理的內(nèi)存進(jìn)行緩存一致性寫(xiě)回操作;
基本輸入輸出系統(tǒng)設(shè)置同一節(jié)點(diǎn)的CPU和其他NC節(jié)點(diǎn),停止向故障NC節(jié)點(diǎn)發(fā)送數(shù)據(jù);
移除并更換故障NC節(jié)點(diǎn)。
請(qǐng)參考圖1和圖2,圖1是本發(fā)明實(shí)施例一種熱替換NC節(jié)點(diǎn)的方法的流程示意圖,圖2是本發(fā)明實(shí)施例服務(wù)器的結(jié)構(gòu)框圖,其中Clump指的是節(jié)點(diǎn),圖2以服務(wù)器16路為例進(jìn)行說(shuō)明,但本發(fā)明不僅僅限于16路的使用。
本實(shí)施例提供一種熱替換NC節(jié)點(diǎn)的方法,包括以下步驟:
步驟S101,通過(guò)外部配置的方式,將出現(xiàn)故障的NC節(jié)點(diǎn)告知服務(wù)器系統(tǒng);
在本實(shí)施例中,每個(gè)NC節(jié)點(diǎn)對(duì)應(yīng)一個(gè)撥碼開(kāi)關(guān),NC節(jié)點(diǎn)出現(xiàn)故障時(shí),可以通過(guò)撥碼開(kāi)關(guān)的方式告知服務(wù)器系統(tǒng)出現(xiàn)故障的NC節(jié)點(diǎn)。
步驟S102,在不停機(jī)的情況下,將所有NC節(jié)點(diǎn)的內(nèi)存以及節(jié)點(diǎn)下CPU管理的內(nèi)存進(jìn)行緩存一致性寫(xiě)回操作;
由于NC節(jié)點(diǎn)出現(xiàn)故障時(shí),需要進(jìn)行移除操作,因此將所有NC節(jié)點(diǎn)的內(nèi)存以及節(jié)點(diǎn)下CPU管理的內(nèi)存進(jìn)行緩存一致性寫(xiě)回操作,這樣保證內(nèi)存中的數(shù)據(jù)都是最新的,后面進(jìn)行移除故障NC節(jié)點(diǎn)時(shí),保證了緩存的一致性。
步驟S103,基本輸入輸出系統(tǒng)設(shè)置同一節(jié)點(diǎn)的CPU和其他NC節(jié)點(diǎn),停止向故障NC節(jié)點(diǎn)發(fā)送數(shù)據(jù);
BIOS設(shè)置同一節(jié)點(diǎn)的CPU和其他NC節(jié)點(diǎn),不再向故障NC節(jié)點(diǎn)發(fā)送數(shù)據(jù),這樣,與故障NC節(jié)點(diǎn)處于同一節(jié)點(diǎn)的CPU和故障NC節(jié)點(diǎn)的數(shù)據(jù)鏈路斷開(kāi)。
步驟S104,基本輸入輸出系統(tǒng)告知服務(wù)器系統(tǒng),故障NC節(jié)點(diǎn)停止運(yùn)行;
步驟S105,移除并更換故障NC節(jié)點(diǎn);
步驟S106,將更換后的NC節(jié)點(diǎn)進(jìn)行上電,初始化更換后的NC節(jié)點(diǎn)與其他NC節(jié)點(diǎn)間的鏈路參數(shù)以及更換后的NC節(jié)點(diǎn)與同一節(jié)點(diǎn)的CPU間的鏈路參數(shù);
步驟S107,初始化更換后的NC節(jié)點(diǎn),將更換后的NC節(jié)點(diǎn)添加到服務(wù)器系統(tǒng)中。
在本實(shí)施例中,更換后的NC節(jié)點(diǎn)完成與其他NC節(jié)點(diǎn)間的鏈路以及更換后的NC節(jié)點(diǎn)與同一節(jié)點(diǎn)的CPU間的鏈路初始化后,向主CPU節(jié)點(diǎn)發(fā)送中斷,主CPU 節(jié)點(diǎn)收到后,初始化更換后的NC節(jié)點(diǎn),然后將更換后的NC節(jié)點(diǎn)添加到服務(wù)器系統(tǒng)中。
本發(fā)明在不停機(jī)的情況下,將所有NC節(jié)點(diǎn)的內(nèi)存以及節(jié)點(diǎn)下CPU管理的內(nèi)存進(jìn)行緩存一致性寫(xiě)回操作,然后基本輸入輸出系統(tǒng)設(shè)置同一節(jié)點(diǎn)的CPU和其他NC節(jié)點(diǎn),停止向故障NC節(jié)點(diǎn)發(fā)送數(shù)據(jù),移除并更換故障NC節(jié)點(diǎn),最后初始化更換后的NC節(jié)點(diǎn)與其他NC節(jié)點(diǎn)間的鏈路參數(shù)以及更換后的NC節(jié)點(diǎn)與同一節(jié)點(diǎn)的CPU間的鏈路參數(shù),將更換后的NC節(jié)點(diǎn)添加到服務(wù)器系統(tǒng)中。在服務(wù)器NC節(jié)點(diǎn)出現(xiàn)故障時(shí),在不停機(jī)的情況下,將出現(xiàn)故障的NC節(jié)點(diǎn)進(jìn)行熱替換,提高了服務(wù)器系統(tǒng)運(yùn)行的穩(wěn)定性和可靠性。
本發(fā)明實(shí)施例還提供一種熱替換NC節(jié)點(diǎn)的裝置,包括:
緩存一致性寫(xiě)回操作模塊,用于在不停機(jī)的情況下,將所有NC節(jié)點(diǎn)的內(nèi)存以及節(jié)點(diǎn)下CPU管理的內(nèi)存進(jìn)行緩存一致性寫(xiě)回操作;
CPU設(shè)置模塊,用于基本輸入輸出系統(tǒng)設(shè)置同一節(jié)點(diǎn)的CPU和其他NC節(jié)點(diǎn),停止向故障NC節(jié)點(diǎn)發(fā)送數(shù)據(jù);
故障NC節(jié)點(diǎn)移除更換模塊,用于移除并更換故障NC節(jié)點(diǎn)。
請(qǐng)參考圖3,圖3是本發(fā)明一種熱替換NC節(jié)點(diǎn)的裝置的結(jié)構(gòu)示意圖;本實(shí)施例提供一種熱替換NC節(jié)點(diǎn)的裝置,包括:第一告知模塊301、緩存一致性寫(xiě)回操作模塊302、CPU設(shè)置模塊303、第二告知模塊304、故障NC節(jié)點(diǎn)移除更換模塊305、初始化模塊306和更換后的NC節(jié)點(diǎn)添加模塊307,第一告知模塊301依次順序與緩存一致性寫(xiě)回操作模塊302、CPU設(shè)置模塊303、第二告知模塊304、故障NC節(jié)點(diǎn)移除更換模塊305、初始化模塊306和更換后的NC節(jié)點(diǎn)添加模塊307連接。
第一告知模塊301,用于將出現(xiàn)故障的NC節(jié)點(diǎn)告知服務(wù)器系統(tǒng);
緩存一致性寫(xiě)回操作模塊302,用于在不停機(jī)的情況下,將所有NC節(jié)點(diǎn)的內(nèi)存以及節(jié)點(diǎn)下CPU管理的內(nèi)存進(jìn)行緩存一致性寫(xiě)回操作;
CPU設(shè)置模塊303,用于基本輸入輸出系統(tǒng)設(shè)置同一節(jié)點(diǎn)的CPU和其他NC節(jié)點(diǎn),停止向故障NC節(jié)點(diǎn)發(fā)送數(shù)據(jù);
第二告知模塊304,用于基本輸入輸出系統(tǒng)告知服務(wù)器系統(tǒng),故障NC節(jié)點(diǎn)停止運(yùn)行;
故障NC節(jié)點(diǎn)移除更換模塊305,用于移除并更換故障NC節(jié)點(diǎn);
初始化模塊306,用于將更換后的NC節(jié)點(diǎn)進(jìn)行上電,初始化更換后的NC節(jié)點(diǎn)與其他NC節(jié)點(diǎn)間的鏈路參數(shù)以及更換后的NC節(jié)點(diǎn)與同一節(jié)點(diǎn)的CPU間的鏈路參數(shù);
更換后的NC節(jié)點(diǎn)添加模塊307,用于初始化更換后的NC節(jié)點(diǎn),將更換后的NC節(jié)點(diǎn)添加到服務(wù)器系統(tǒng)中。
以上所示僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。