一種服務器管理的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明實施例提供了一種服務器管理的方法及系統(tǒng),涉及計算機領域,用以靈活有效的提高服務器管理的可靠性。所述方法包括應用于服務器管理系統(tǒng),所述服務器管理系統(tǒng)包括系統(tǒng)管理控制器SMC,包含定時子模塊可編程硬件模塊,所述方法包括:所述可編程硬件模塊確定喂狗周期;所述可編程硬件模塊確定在其內的定時子模塊到達所述喂狗周期期間,是否接收到所述SMC發(fā)送的喂狗信號;若所述可編程硬件模塊在其內的定時子模塊到達所述喂狗周期期間未接收到SMC發(fā)送的喂狗信號,則向SMC發(fā)出第一復位信號;所述SMC接收所述第一復位信號,并根據(jù)所述第一復位信號,進行復位處理。
【專利說明】
一種服務器管理的方法及系統(tǒng)
技術領域
[0001 ]本發(fā)明涉及計算機技術領域,尤其涉及一種服務器管理的方法及系統(tǒng)。
【背景技術】
[0002]隨著科學技術的發(fā)展,數(shù)據(jù)中心中配備了大量的服務器,這些服務器的高效管理有賴于穩(wěn)定可靠的服務器管理系統(tǒng)。隨著管理功能需求的增多,與之相應的服務器管理系統(tǒng)的處理器運行速度越來越快,硬件平臺和軟件代碼都更加復雜,根據(jù)可靠性建模理論,系統(tǒng)越復雜,可靠性越低。
[0003]為提高系統(tǒng)可靠性,通常在處理器內置有看門狗定時器,這種看門狗定時器可能會在處理器產生嚴重錯誤進入異常模式時失效,存在工作不可靠問題。
【發(fā)明內容】
[0004]本發(fā)明的實施例提供一種服務器管理的方法及系統(tǒng),用以靈活有效的提高服務器管理的可靠性。
[0005]為達到上述目的,本發(fā)明的實施例采用如下技術方案:
[0006]本發(fā)明實施例提供了一種服務器管理的方法,應用于服務器管理系統(tǒng),所述服務器管理系統(tǒng)包括系統(tǒng)管理控制器SMC,包含定時子模塊可編程硬件模塊,所述方法包括:所述可編程硬件模塊確定喂狗周期;所述可編程硬件模塊確定在其內的定時子模塊到達所述喂狗周期期間,是否接收到所述SMC發(fā)送的喂狗信號;若所述可編程硬件模塊在其內的定時子模塊到達所述喂狗周期期間未接收到SMC發(fā)送的喂狗信號,則向SMC發(fā)出第一復位信號;所述SMC接收所述第一復位信號,并根據(jù)所述第一復位信號,進行復位處理。
[0007]可選地,在所述可編程硬件模塊確定檢測周期之前,還包括:所述SMC向所述可編程硬件模塊發(fā)送設置信息;所述設置信息用于指示出所述可編程硬件模塊的喂狗周期;所述可編程硬件模塊確定喂狗周期包括:所述可編程硬件模塊根據(jù)所述設置信息,確定喂狗周期。
[0008]可選地,還包括:若所述可編程硬件模塊在其內的定時子模塊到達所述喂狗周期期間接收到所述SMC發(fā)送的喂狗信號,則所述可編程硬件模塊將所述定時子模塊清零,并重新確定其內的定時子模塊在到達所述喂狗周期期間,是否接收到所述SMC發(fā)送的喂狗信號。
[0009]可選地,所述SMC向所述可編程硬件模塊發(fā)送設置信息包括:所述SMC根據(jù)所述SMC的運行階段,向可編程硬件模塊發(fā)送設置信息;所述SMC的運行階段包括:SMC操作系統(tǒng)啟動階段,SMC管理進程運行階段,SMC管理固件更新階段。
[0010]可選地,還包括:所述服務器管理系統(tǒng)還包括:基板管理控制器BMC;在所述SMC處于所述SMC管理進程運行階段時,所述方法還包括:所述SMC在接收所述BMC發(fā)送的初始化完成信號時,向所述BMC發(fā)送狀態(tài)報告周期;所述BMC接收所述SMC發(fā)送的狀態(tài)報告周期,并根據(jù)所述狀態(tài)報告周期向所述SMC發(fā)送報告信息;若所述SMC在BMC的狀態(tài)報告周期內未接收到所述BMC發(fā)送的報告信息,則向所述BMC發(fā)送第二復位信號;所述BMC接收所述第二復位信號,并根據(jù)所述第二復位信號進行復位處理。
[0011]進一步的,本發(fā)明實施例提供了一種服務器管理系統(tǒng),包括:包含有定時子模塊的可編程硬件模塊,系統(tǒng)管理控制器SMC;其中,所述可編程硬件模塊,用于確定喂狗周期;所述定時子模塊,用于記錄時間;所述可編程硬件模塊,還用于確定在其內的定時子模塊到達所述喂狗周期期間,是否接收到所述SMC發(fā)送的喂狗信號;所述可編程硬件模塊,還用于確定出其內的定時子模塊到達所述喂狗周期期間未接收到SMC發(fā)送的喂狗信號時,向SMC發(fā)出第一復位信號;所述SMC,用于接收所述第一復位信號,并根據(jù)所述第一復位信號,進行復位處理。
[0012]可選地,所述SMC,還用于向所述可編程硬件模塊發(fā)送設置信息;所述設置信息用于指示出所述可編程硬件模塊的喂狗周期;所述可編程硬件模塊,具體用于根據(jù)所述設置信息,確定喂狗周期。
[0013]可選地,所述可編程硬件模塊,還用于確定出其內的定時子模塊到達所述喂狗周期期間接收到所述SMC發(fā)送的喂狗信號時,將所述定時子模塊記錄的時間清零,并重新確定其內的定時子模塊在到達所述喂狗周期期間,是否接收到所述SMC發(fā)送的喂狗信號。
[0014]可選地,所述SMC,具體用于根據(jù)所述SMC的運行階段,向可編程硬件模塊發(fā)送設置信息;所述SMC的運行階段包括:SMC操作系統(tǒng)啟動階段,SMC管理進程運行階段,SMC管理固件更新階段。
[0015]可選地,還包括:基板管理控制器BMC;所述SMC,還用于在所述SMC處于所述SMC管理進程運行階段時,若接收所述BMC發(fā)送的初始化完成信號時,向所述BMC發(fā)送狀態(tài)報告周期;所述BMC,用于接收所述SMC發(fā)送的狀態(tài)報告周期,并根據(jù)所述狀態(tài)報告周期向所述SMC發(fā)送報告信息;所述SMC,還用于在BMC的狀態(tài)報告周期內未接收到所述BMC發(fā)送的報告信息時,向所述BMC發(fā)送第二復位信號;所述BMC,還用于接收所述第二復位信號,并根據(jù)所述第二復位信號進行復位處理。
[0016]本發(fā)明實施例提供了一種服務器管理的方法及系統(tǒng),應用于服務器管理系統(tǒng),所述服務器管理系統(tǒng)包括系統(tǒng)管理控制器SMC,可編程硬件模塊,其中,可編程硬件模塊確定喂狗周期;可編程硬件模塊確定在其內的定時子模塊在到達喂狗周期期間,是否接收到SMC發(fā)送的喂狗信號;若可編程硬件模塊在其內的定時子模塊到達喂狗周期期間未接收到SMC發(fā)送的喂狗信號,則向SMC發(fā)出第一復位信號;SMC接收第一復位信號,并根據(jù)第一復位信號,進行復位處理。這樣,服務器管理系統(tǒng)中的可編程硬件模塊包含有定時子模塊,且可編程硬件模塊獨立的SMC,在SMC發(fā)生異常時,可編程硬件模塊可以向SMC發(fā)送第一復位信號,以便SMC根據(jù)第一復位信號進行復位。這樣一來,包含有定時子模塊的可編程硬件模塊外置于SMC,在SMC發(fā)生故障時,可以及時復位SMC,從而可以提高SMC的可靠性,進而靈活有效的提高服務器管理系統(tǒng)的可靠性。
【附圖說明】
[0017]為了更清楚地說明本發(fā)明實施例的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0018]圖1為本發(fā)明實施例提供的第一種服務器管理的方法的流程示意圖;
[0019]圖2為本發(fā)明實施例提供的第二種服務器管理的方法的流程示意圖;
[0020]圖3為本發(fā)明實施例提供的第三種服務器管理的方法的流程示意圖;
[0021 ]圖4為本發(fā)明實施例提供的第四種服務器管理的方法的流程示意圖;
[0022]圖5為本發(fā)明實施例提供的一種服務器管理系統(tǒng)的結構示意圖;
[0023]圖6為本發(fā)明實施例提供的另一種服務器管理系統(tǒng)的結構示意圖。
【具體實施方式】
[0024]下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0025]本發(fā)明實施例提供了一種服務器管理的方法,應用于服務器管理系統(tǒng),所述服務器管理系統(tǒng)包括SMC(System management controlIer,系統(tǒng)管理控制器),包含定時子模塊可編程硬件模塊。如圖1所示,包括:
[0026]步驟101、可編程硬件模塊確定喂狗周期。
[0027]具體的,可編程硬件模塊是對SMC進行監(jiān)控,防止SMC發(fā)生異常時,SMC無法進行復位處理。而SMC的運行階段可以分為三個階段即為SMC操作系統(tǒng)啟動階段,SMC管理進程運行階段,SMC管理固件更新階段,可編程硬件模塊在SMC的不同階段,其喂狗周期各不相同。因此,可編程硬件模塊在對SMC進行監(jiān)控之前,需先確定出喂狗周期。
[0028]此時,可編程硬件模塊可以根據(jù)SMC發(fā)送的信號來確定喂狗周期。例如,SMC向可編程硬件模塊發(fā)送第一信號,可編程硬件模塊可以確定SMC在SMC操作系統(tǒng)啟動階段,此時,確定出的喂狗周期為SMC操作系統(tǒng)啟動階段對應的喂狗周期。SMC向可編程硬件模塊發(fā)送第二信號,可編程硬件模塊可以確定SMC在SMC管理進行運行階段,此時,確定出的喂狗周期為SMC管理進行運行階段對應的喂狗周期。SMC向可編程硬件模塊發(fā)送第三信號,可編程硬件模塊可以確定SMC在SMC管理固件更新階段,此時,確定出的喂狗周期為SMC管理固件更新階段對應的喂狗周期。
[0029]需要說明的是,而在可編程硬件模塊進行監(jiān)控的過程中,若沒有接收到SMC發(fā)送的指示其進入其他階段的信號時,可編程硬件模塊則確定其喂狗周期為當前SMC所在的階段對應的喂狗周期。
[0030]需要說明的是,在本發(fā)明實施例中,服務器管理系統(tǒng)的可編程硬件模塊通過看門狗機制實現(xiàn)對SMC的監(jiān)控,因此需要設置喂狗周期,及SMC需向可編程硬件模塊發(fā)送喂狗信號。
[0031]需要說明的是,本發(fā)明實施例中的喂狗周期可以由管理員根據(jù)實際情況進行設定,若設定喂狗周期不準確時,還可以重新設定,本發(fā)明對此不做限制。
[0032]步驟102、可編程硬件模塊確定在其內的定時子模塊到達喂狗周期期間,是否接收到SMC發(fā)送的喂狗信號。
[0033]具體的,可編程硬件模塊確定了喂狗周期后,由于SMC在沒有異常的情況下,需要在喂狗周期內向可編程硬件模塊發(fā)送喂狗信號,以便告知可編程硬件模塊其未異常,使可編程硬件模塊內的定時模塊清零,重新計時。因此,可編程硬件模塊可以看其內的定時子模塊記錄的時間到達喂狗周期期間,是否接收到SMC發(fā)送的喂狗信號。
[0034]需要說明的是,定時子模塊用于記錄時間,喂狗信號即為使可編程硬件模塊中的定時子模塊記錄的時間清零的信號。
[0035]需要說明的是,在本發(fā)明實施例中,由于信號在傳輸過程中可能存在時延,因此可編程硬件模塊確定在其內的定時子模塊到達喂狗周期期間,是否接收到SMC發(fā)送的喂狗信號時,可以將不同喂狗周期對應的時延誤差考慮進去,即為可編程硬件模塊確定在其內的定時子模塊記錄的時間到達喂狗周期加其對應的時延誤差期間是否接收到SMC發(fā)送的喂狗信號。
[0036]需要說明的是,不同的喂狗周期對應的時延誤差可以由管理員進行設定,本發(fā)明對此不作限制。
[0037]步驟103、若可編程硬件模塊在其內的定時子模塊到達喂狗周期期間未接收到SMC發(fā)送的喂狗信號,則向SMC發(fā)出第一復位信號。
[0038]具體的,可編程硬件模塊在其內的定時子模塊記錄的時間到達喂狗周期期間均沒有接收到SMC發(fā)送的喂狗信號時,說明此SMC發(fā)生異常,此時,可編程硬件模塊可以向SMC發(fā)送第一復位信號。
[0039]步驟104、SMC接收所述第一復位信號,并根據(jù)第一復位信號,進行復位處理。
[0040]具體的,SMC接收到第一復位信號后,利用此第一復位信號進行相應的復位。
[0041]本發(fā)明實施例提供了一種服務器管理的方法,應用于服務器管理系統(tǒng),所述服務器管理系統(tǒng)包括系統(tǒng)管理控制器SMC,可編程硬件模塊,其中,可編程硬件模塊確定喂狗周期;可編程硬件模塊確定在其內的定時子模塊在到達喂狗周期期間,是否接收到SMC發(fā)送的喂狗信號;若可編程硬件模塊在其內的定時子模塊到達喂狗周期期間未接收到SMC發(fā)送的喂狗信號,則向SMC發(fā)出第一復位信號;SMC接收第一復位信號,并根據(jù)第一復位信號,進行復位處理。這樣,服務器管理系統(tǒng)中的可編程硬件模塊包含有定時子模塊,且可編程硬件模塊獨立的SMC,在SMC發(fā)生異常時,可編程硬件模塊可以向SMC發(fā)送第一復位信號,以便SMC根據(jù)第一復位信號進行復位。這樣一來,包含有定時子模塊的可編程硬件模塊外置于SMC,在SMC發(fā)生故障時,可以及時復位SMC,從而可以提高SMC的可靠性,進而靈活有效的提高服務器管理系統(tǒng)的可靠性。
[0042]進一步的,在上述步驟101之前,如圖2所示,還包括:
[0043]步驟105、SMC向可編程硬件模塊發(fā)送設置信息。
[0044]其中,設置信息用于指示出可編程硬件模塊的喂狗周期。
[0045]具體的,可編程硬件模塊在對SMC進行監(jiān)控的喂狗周期可以是SMC設定。此時,SMC可以將指示出喂狗周期的設置信息發(fā)送給可編程硬件模塊。
[0046]進一步的,由于SMC可以有不同的運行階段,而其運行階段不同時,其喂狗周期可以設置為不同的時間,此時,SMC向所述可編程硬件模塊發(fā)送設置信息包括:SMC根據(jù)SMC的運行階段,向可編程硬件模塊發(fā)送設置信息。
[0047]其中,SMC的運行階段包括:SMC操作系統(tǒng)啟動階段,SMC管理進程運行階段,SMC管理固件更新階段。
[0048]即為,預先設定了SMC的不同運行階段對應不同的喂狗周期。例如,SMC操作系統(tǒng)啟動階段,由于SMC操作系統(tǒng)啟動時間較長,此時可以將此階段對應的喂狗周期設置的時間略大。而SMC管理進程運行階段需要實時的檢測各個進程的運行情況,此時,可以將此階段對應的喂狗周期設置的時間略小。此時,SMC可以根據(jù)其當前所在的階段,確定出當前階段對應的喂狗周期,進而可以根據(jù)確定的當前階段對應的喂狗周期生成設定信息,進而將此設定信息發(fā)送至可編程硬件模塊??删幊逃布K可以接收到設置信息。
[0049]需要說明的是,SMC的每個運行階段對應的喂狗周期可以是用戶預先設定的。
[0050]此時步驟101可編程硬件模塊確定喂狗周期包括:可編程硬件模塊根據(jù)設置信息,確定喂狗周期。
[0051]具體的,可編程硬件模塊在接收到設置信息后,可以解析設置信息,進而可以解析出設置信息中喂狗周期,進而可以確定喂狗周期。
[0052]這樣一來,通過上述步驟105SMC可以在SMC的不同運行階段為可編程硬件模塊設置不同的喂狗周期,此時,可編程硬件可以根據(jù)接收的設置信息,獲知對應的喂狗周期,進而進行根據(jù)獲取的喂狗周期對SMC進行相應的監(jiān)控。
[0053]進一步的,在上述步驟102中可編程硬件模塊需確定在其內的定時子模塊到達喂狗周期期間,是否接收到SMC發(fā)送的喂狗信號,此時,可編程硬件模塊的確定結果有兩種,一種是在其內的定時子模塊到達喂狗周期期間,未接收到SMC發(fā)送的喂狗信號;另一種是在其內的定時子模塊到達喂狗周期期間,接收到SMC發(fā)送的喂狗信號。這樣,可編程硬件模塊根據(jù)其確定的結果不同,下面執(zhí)行的步驟不同。在確定在其內的定時子模塊到達喂狗周期期間,未接收到SMC發(fā)送的喂狗信號時,執(zhí)行步驟103-104。在確定其內的定時子模塊到達喂狗周期期間,接收到SMC發(fā)送的喂狗信號,執(zhí)行步驟106,如圖3所示。
[0054]步驟106、若可編程硬件模塊在其內的定時子模塊到達喂狗周期期間接收到SMC發(fā)送的喂狗信號,則可編程硬件模塊將定時子模塊清零,并重新確定其內的定時子模塊在到達喂狗周期期間,是否接收到SMC發(fā)送的喂狗信號。
[0055]具體的,可編程硬件模塊確定出在其內的定時子模塊到達喂狗周期期間接收到SMC發(fā)送的喂狗信號時,則說明SMC并未發(fā)生異常,此時可編程硬件模塊可以將其內的定時子模塊記錄的時間清零。定時子模塊在記錄的時間清零后,可以重新記錄時間,進而使得可編程硬件模塊重新確定定時子模塊重新記錄的時間在到達喂狗周期期間是否接收到SMC發(fā)送的喂狗信號。即為,在將定時子模塊在記錄的時間清零后,重新執(zhí)行步驟102。
[0056]這樣一來,可編程硬件模塊可以一直對SMC進行監(jiān)控,使得服務器管理系統(tǒng)更可
A+-.與巨O
[0057]進一步的,在服務器管理系統(tǒng)還包括:BMC(BaseboardManagement Controller,基板管理控制器)時,在SMC處于SMC管理進程運行階段時,上述方法,如圖4所示,還包括:
[0058]步驟201、SMC在接收BMC發(fā)送的初始化完成信號時,向BMC發(fā)送狀態(tài)報告周期。
[0059]具體的,為了增加服務器管理系統(tǒng)的可靠性,可以通過SMC對BMC的狀態(tài)進行監(jiān)控。此時,在BMC進行完初始化設置后,需要向SMC發(fā)送初始化完成信號,此時,SMC需要對BMC的狀態(tài)進行監(jiān)控,此時,SMC向BMC發(fā)送狀態(tài)報告周期。
[0060]需要說明的是,BMC的狀態(tài)報告周期可以是管理員根據(jù)實際需要設置的,在設置完成后,可以通過SMC發(fā)送至BMC。
[0061 ] 步驟202、BMC接收SMC發(fā)送的狀態(tài)報告周期,并根據(jù)狀態(tài)報告周期向SMC發(fā)送報告?目息O
[0062]具體的,BMC接收到SMC發(fā)送的狀態(tài)報告周期后,可以獲知其需發(fā)送報告信息的周期,此時,BMC在其未發(fā)生異常時,可以按照此狀態(tài)報告周期向SMC發(fā)送報告信息。此時,SMC可以接收到BMC發(fā)送的報告信息,并記錄此BMC的報告信息。由于在服務器管理系統(tǒng)中可以包含有多個BMC,因此,SMC可以對每個BMC的報告信息分別進行記錄。
[0063]步驟203、若SMC在狀態(tài)報告周期內未接收至IjBMC發(fā)送的報告信息,則向BMC發(fā)送第二復位ig號。
[0064]具體的,SMC若在BMC的狀態(tài)報告周期內沒有接收到BMC發(fā)送的報告信息,則可以確定此BMC發(fā)生異常,此時可以向此BMC發(fā)送第二復位信號。
[0065]步驟204、BMC接收第二復位信號,并根據(jù)第二復位信號進行復位處理。
[0066]具體的,BMC在接收到第二復位信號后,可以根據(jù)此第二復位信號,進行相應的復位處理。
[0067]需要說明的是,BMC進行的重啟操作如果不是由SMC發(fā)起的,則SMC通過檢測BMC的初始化完成信號獲得BMC的狀態(tài)為啟動進行中的狀態(tài),SMC可以執(zhí)行相應定時的復位操作。
[0068]需要說明的是,BMC進行重啟和固件更新操作由SMC統(tǒng)一控制,SMC需對其進行記錄并執(zhí)行不同定時的復位操作,SMC對BMC的重啟監(jiān)控類似于可編程硬件模塊對SMC所執(zhí)行的監(jiān)控操作,SMC對BMC的管理固件更新監(jiān)控,類似于可編程硬件模塊對SMC所執(zhí)行的SMC管理固件更新階段的監(jiān)控操作,在此不再贅述。
[0069]進一步的,可編程硬件模塊對SMC所執(zhí)行的SMC管理固件更新階段的監(jiān)控操作為:SMC在其固件更新時,可以在SMC管理固件更新階段對應的喂狗周期期間,若未發(fā)生異常,這可以向可編程硬件模塊發(fā)送喂狗信號。此時,可編程硬件模塊接收到喂狗信號,并可以將定時子模塊記錄的時間清零,并重新對SMC進行監(jiān)控。在SMC管理固件更新階段對應的喂狗周期期間,若發(fā)生異常,沒有向可編程硬件模塊發(fā)送喂狗信號。此時,可編程硬件模塊在定時子模塊記錄的時間到達SMC管理固件更新階段對應的喂狗周期時,未接收到喂狗信號,可以確定出SMC發(fā)生異常,此時可以向SMC發(fā)送第一復位信號。SMC接收到第一復位信號后,可以進行相應的復位處理。
[0070]需要說明的是,SMC管理進程運行階段是SMC管理服務器管理系統(tǒng)中各個器件對應的進程運行的階段,因此,在此階段中,SMC可以對BMC的運行狀態(tài)進行監(jiān)控。因此,上述步驟201-204需在SMC管理進程運行階段進行。
[0071]本發(fā)明實施例提供了一種服務器管理的方法,應用于服務器管理系統(tǒng),所述服務器管理系統(tǒng)包括系統(tǒng)管理控制器SMC,可編程硬件模塊,其中,可編程硬件模塊確定喂狗周期;可編程硬件模塊確定在其內的定時子模塊在到達喂狗周期期間,是否接收到SMC發(fā)送的喂狗信號;若可編程硬件模塊在其內的定時子模塊到達喂狗周期期間未接收到SMC發(fā)送的喂狗信號,則向SMC發(fā)出第一復位信號;SMC接收第一復位信號,并根據(jù)第一復位信號,進行復位處理。這樣,服務器管理系統(tǒng)中的可編程硬件模塊包含有定時子模塊,且可編程硬件模塊獨立的SMC,在SMC發(fā)生異常時,可編程硬件模塊可以向SMC發(fā)送第一復位信號,以便SMC根據(jù)第一復位信號進行復位。這樣一來,包含有定時子模塊的可編程硬件模塊外置于SMC,在SMC發(fā)生故障時,可以及時復位SMC,從而可以提高SMC的可靠性,進而靈活有效的提高服務器管理系統(tǒng)的可靠性。
[0072]本發(fā)明實施例提供了一種服務器管理系統(tǒng),如圖5所示,包括:包含有定時子模塊511的可編程硬件模塊51,系統(tǒng)管理控制器SMC52。其中,
[0073]可編程硬件模塊51,用于確定喂狗周期。
[0074]定時子模塊511,用于記錄時間。
[0075]可編程硬件模塊51,還用于確定在其內的定時子模塊511到達喂狗周期期間,是否接收到SMC52發(fā)送的喂狗信號。
[0076]可編程硬件模塊51,還用于確定出其內的定時子模塊到達喂狗周期期間未接收到SMC52發(fā)送的喂狗信號時,向SMC52發(fā)出第一復位信號。
[0077]SMC52,用于接收第一復位信號,并根據(jù)第一復位信號,進行復位處理。
[0078]進一步的,SMC52,還用于向可編程硬件模塊51發(fā)送設置信息。
[0079]其中,設置信息用于指示出可編程硬件模塊51的喂狗周期。
[0080]具體的,SMC52,具體用于根據(jù)SMC52的運行階段,向可編程硬件模塊51發(fā)送設置信息。
[0081 ] 其中,SMC52的運行階段包括:SMC操作系統(tǒng)啟動階段,SMC管理進程運行階段,SMC管理固件更新階段。
[0082]可編程硬件模塊51,具體用于根據(jù)設置信息,確定喂狗周期。
[0083]進一步的,可編程硬件模塊51,還用于確定出其內的定時子模塊511到達喂狗周期期間接收到SMC52發(fā)送的喂狗信號時,將定時子模塊52記錄的時間清零,并重新確定其內的定時子模塊52在到達喂狗周期期間,是否接收到SMC52發(fā)送的喂狗信號。
[0084]進一步的,上述服務器管理系統(tǒng),如圖6所示,還包括:基板管理控制器BMC53。
[0085]此時,SMC52,還用于在所述SMC處于所述SMC管理進程運行階段時,若接收BMC53發(fā)送的初始化完成信號時,向BMC53發(fā)送狀態(tài)報告周期。
[0086]BMC53,用于接收SMC52發(fā)送的狀態(tài)報告周期,并根據(jù)狀態(tài)報告周期向SMC發(fā)送報告
?目息O
[0087]SMC52,還用于在BMC53的狀態(tài)報告周期內未接收到BMC53發(fā)送的報告信息時,向BMC53發(fā)送第二復位信號。
[0088]BMC53,還用于接收第二復位信號,并根據(jù)第二復位信號進行復位處理。
[0089]進一步的,上述可編程硬件模塊51可以為CPLD(Complex Programmable LogicDevice,復雜可編程邏輯器件)。
[0090]需要說明的是,服務器管理系統(tǒng)中還包括具有多個刀片的服務器,有一個管理載板和若干個計算單元,及機箱電源、風扇等必備組件。其中,管理載板上放置一顆SMC,每個計算單元上各放置一顆BMC,由CPLD實現(xiàn)SMC的看門狗的功能。
[0091 ]這樣,SMC設置CPLD喂狗周期的GP10(General Purpose Input Output,通用輸入/輸出)有兩根引腳,即為CPLD有兩個輸入引腳,此時SMC可以通過CPLD的兩個輸入引腳,設置SMC的不同運行階段對應的喂狗周期。由于CPLD的兩個輸入引腳具有00b、01b、1b和Ilb四個電平狀態(tài),可支持四種喂狗周期的設置,這里使OOb對應SMC操作系統(tǒng)啟動階段的設置,Olb對應SMC管理進程運行階段的設置,1b對應SMC管理固件更新階段的設置,Ilb作為保留設置。通過對CPLD進行編程可實現(xiàn)對上述三種喂狗周期的設置的支持。這樣一來,CPLD通過檢測其引腳的電平即可確定出設置的喂狗周期。
[0092]本發(fā)明實施例提供了一種服務器管理系統(tǒng),應用于服務器管理系統(tǒng),所述服務器管理系統(tǒng)包括系統(tǒng)管理控制器SMC,可編程硬件模塊,其中,可編程硬件模塊確定喂狗周期;可編程硬件模塊確定在其內的定時子模塊在到達喂狗周期期間,是否接收到SMC發(fā)送的喂狗信號;若可編程硬件模塊在其內的定時子模塊到達喂狗周期期間未接收到SMC發(fā)送的喂狗信號,則向SMC發(fā)出第一復位信號;SMC接收第一復位信號,并根據(jù)第一復位信號,進行復位處理。這樣,服務器管理系統(tǒng)中的可編程硬件模塊包含有定時子模塊,且可編程硬件模塊獨立的SMC,在SMC發(fā)生異常時,可編程硬件模塊可以向SMC發(fā)送第一復位信號,以便SMC根據(jù)第一復位信號進行復位。這樣一來,包含有定時子模塊的可編程硬件模塊外置于SMC,在SMC發(fā)生故障時,可以及時復位SMC,從而可以提高SMC的可靠性,進而靈活有效的提高服務器管理系統(tǒng)的可靠性。
[0093]最后應說明的是:以上實施例僅用以說明本發(fā)明的技術方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發(fā)明各實施例技術方案的精神和范圍。
【主權項】
1.一種服務器管理的方法,其特征在于,應用于服務器管理系統(tǒng),所述服務器管理系統(tǒng)包括系統(tǒng)管理控制器SMC,包含定時子模塊可編程硬件模塊,所述方法包括: 所述可編程硬件模塊確定喂狗周期; 所述可編程硬件模塊確定在其內的定時子模塊到達所述喂狗周期期間,是否接收到所述SMC發(fā)送的喂狗信號; 若所述可編程硬件模塊在其內的定時子模塊到達所述喂狗周期期間未接收到SMC發(fā)送的喂狗信號,則向SMC發(fā)出第一復位信號; 所述SMC接收所述第一復位信號,并根據(jù)所述第一復位信號,進行復位處理。2.根據(jù)權利要求1所述的方法,其特征在于,在所述可編程硬件模塊確定檢測周期之前,還包括: 所述SMC向所述可編程硬件模塊發(fā)送設置信息;所述設置信息用于指示出所述可編程硬件模塊的喂狗周期; 所述可編程硬件模塊確定喂狗周期包括: 所述可編程硬件模塊根據(jù)所述設置信息,確定喂狗周期。3.根據(jù)權利要求2所述的方法,其特征在于,還包括: 若所述可編程硬件模塊在其內的定時子模塊到達所述喂狗周期期間接收到所述SMC發(fā)送的喂狗信號,則所述可編程硬件模塊將所述定時子模塊清零,并重新確定其內的定時子模塊在到達所述喂狗周期期間,是否接收到所述SMC發(fā)送的喂狗信號。4.根據(jù)權利要求2或3所述的方法,其特征在于, 所述SMC向所述可編程硬件模塊發(fā)送設置信息包括: 所述SMC根據(jù)所述SMC的運行階段,向可編程硬件模塊發(fā)送設置信息;所述SMC的運行階段包括:SMC操作系統(tǒng)啟動階段,SMC管理進程運行階段,SMC管理固件更新階段。5.根據(jù)權利要求4所述的方法,其特征字在于,還包括: 所述服務器管理系統(tǒng)還包括:基板管理控制器BMC;在所述SMC處于所述SMC管理進程運行階段時,所述方法還包括: 所述SMC在接收所述BMC發(fā)送的初始化完成信號時,向所述BMC發(fā)送狀態(tài)報告周期; 所述BMC接收所述SMC發(fā)送的狀態(tài)報告周期,并根據(jù)所述狀態(tài)報告周期向所述SMC發(fā)送報告信息; 若所述SMC在BMC的狀態(tài)報告周期內未接收到所述BMC發(fā)送的報告信息,則向所述BMC發(fā)送第二復位信號; 所述BMC接收所述第二復位信號,并根據(jù)所述第二復位信號進行復位處理。6.一種服務器管理系統(tǒng),其特征在于,包括:包含有定時子模塊的可編程硬件模塊,系統(tǒng)管理控制器SMC;其中, 所述可編程硬件模塊,用于確定喂狗周期; 所述定時子模塊,用于記錄時間; 所述可編程硬件模塊,還用于確定在其內的定時子模塊到達所述喂狗周期期間,是否接收到所述SMC發(fā)送的喂狗信號; 所述可編程硬件模塊,還用于確定出其內的定時子模塊到達所述喂狗周期期間未接收到SMC發(fā)送的喂狗信號時,向SMC發(fā)出第一復位信號; 所述SMC,用于接收所述第一復位信號,并根據(jù)所述第一復位信號,進行復位處理。7.根據(jù)權利要求6所述的系統(tǒng),其特征在于, 所述SMC,還用于向所述可編程硬件模塊發(fā)送設置信息;所述設置信息用于指示出所述可編程硬件模塊的喂狗周期; 所述可編程硬件模塊,具體用于根據(jù)所述設置信息,確定喂狗周期。8.根據(jù)權利要求7所述的系統(tǒng),其特征在于, 所述可編程硬件模塊,還用于確定出其內的定時子模塊到達所述喂狗周期期間接收到所述SMC發(fā)送的喂狗信號時,將所述定時子模塊記錄的時間清零,并重新確定其內的定時子模塊在到達所述喂狗周期期間,是否接收到所述SMC發(fā)送的喂狗信號。9.根據(jù)權利要求7或8所述的系統(tǒng),其特征在于, 所述SMC,具體用于根據(jù)所述SMC的運行階段,向可編程硬件模塊發(fā)送設置信息;所述SMC的運行階段包括:SMC操作系統(tǒng)啟動階段,SMC管理進程運行階段,SMC管理固件更新階段。10.根據(jù)權利要求9所述的系統(tǒng),其特征在于,還包括:基板管理控制器BMC; 所述SMC,還用于在所述SMC處于所述SMC管理進程運行階段時,若接收所述BMC發(fā)送的初始化完成信號時,向所述BMC發(fā)送狀態(tài)報告周期; 所述BMC,用于接收所述SMC發(fā)送的狀態(tài)報告周期,并根據(jù)所述狀態(tài)報告周期向所述SMC發(fā)送報告信息; 所述SMC,還用于在BMC的狀態(tài)報告周期內未接收到所述BMC發(fā)送的報告信息時,向所述BMC發(fā)送第二復位信號; 所述BMC,還用于接收所述第二復位信號,并根據(jù)所述第二復位信號進行復位處理。
【文檔編號】G06F11/07GK105912414SQ201610202102
【公開日】2016年8月31日
【申請日】2016年4月1日
【發(fā)明人】李清石, 金長新, 劉強, 張雁鵬
【申請人】浪潮集團有限公司