亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

利用基板管理控制器取得儲存裝置故障信號的方法

文檔序號:6336017閱讀:337來源:國知局

專利名稱::利用基板管理控制器取得儲存裝置故障信號的方法
技術(shù)領(lǐng)域
:本發(fā)明涉及一種取得儲存裝置故障信號的方法,特別涉及一種利用基板管理控制器(BaseboardManagementController,BMC)取得儲存裝置故障信號的方法。
背景技術(shù)
:隨著計(jì)算機(jī)的普及與網(wǎng)絡(luò)技術(shù)的快速發(fā)展,僅由普通計(jì)算機(jī)或設(shè)備所能提供的服務(wù)以不敷使用,故發(fā)展出了服務(wù)器的技術(shù)。服務(wù)器是為一種善于處理網(wǎng)絡(luò)技術(shù)的計(jì)算機(jī)平臺,其可連結(jié)至各種網(wǎng)絡(luò)系統(tǒng),并對通過網(wǎng)絡(luò)系統(tǒng)相連結(jié)的計(jì)算機(jī)提供各種的應(yīng)用服務(wù)。服務(wù)器大多具有大容量的儲存裝置,以提供諸如多媒體播放、網(wǎng)絡(luò)硬盤或是企業(yè)用數(shù)據(jù)庫等服務(wù)。由此可知,儲存裝置是服務(wù)器中相當(dāng)重要的一個組件,一旦發(fā)生故障就會對服務(wù)器乃至提供給客戶的服務(wù)造成嚴(yán)重的不良影響。而為了管理服務(wù)器,智能型平臺管理接口(IntelligentPlatformManagementlnterface,IPMI)的技術(shù)應(yīng)運(yùn)而生。管理者可以通過IPMI以及配置于服務(wù)器中的基板管理控制器(BaseboardManagementController,BMC)監(jiān)控服務(wù)器。但是目前的服務(wù)器在儲存裝置故障后,是通過獨(dú)立運(yùn)作的硬件發(fā)出故障信號再點(diǎn)亮服務(wù)器上的燈號,而不會通知管理員。也就是說,現(xiàn)有的故障信號是直接由硬件譯碼控制。因此造成現(xiàn)有的服務(wù)器無法整合并行的故障信號與管理機(jī)制,也無法有效率地通知管理員故障事件的問題。
發(fā)明內(nèi)容為了解決上述問題,本發(fā)明的目的在于提供一種利用基板管理控制器(BaseboardManagementController,BMC)取得儲存裝置故障信號的方法。利用BMC取得儲存裝置故障信號的方法適用于具有一BMC以及一儲存裝置的一服務(wù)器。利用基板管理控制器取得儲存裝置故障信號的方法包括于BMC的一記憶區(qū)塊中建立對應(yīng)的一儲存裝置檢測器數(shù)據(jù)記錄(sensordatarecord,SDR)以及一儲存裝置平臺事件篩選(platformeventfilter,PEF);啟動儲存裝置的一自我監(jiān)測系統(tǒng)(Self-MonitoringAnalysisandReportingTechnology,S.Μ.A.R.Τ.),并令S.Μ.A.R.Τ.定期檢測儲存裝置的一健康檢測數(shù)據(jù);將對應(yīng)于健康檢測數(shù)據(jù)的至少一健康臨界值寫入BMC的記憶區(qū)塊;以及提供一更新指令,使得S.Μ.A.R.Τ.通過更新指令定期將健康檢測數(shù)據(jù)寫入儲存裝置SDR。其中健康檢測數(shù)據(jù)可包括至少一健康項(xiàng)目,且每一個健康項(xiàng)目分別對應(yīng)一個健康臨界值。健康項(xiàng)目可以是壞軌數(shù)(uncorrectablesectorcount)、目前溫度(temperature)或目前轉(zhuǎn)速(speed)。健康項(xiàng)目也可以是讀取錯誤率(readerrorrate)、旋轉(zhuǎn)再試數(shù)(spinretrycount)或目前處理磁道數(shù)(currentpendingsectorcount)。而S.Μ.A.R.Τ.可通過一智能型平臺管理接口intelligentPlatformManagementInterface,IPMI)的一門坎值設(shè)置指令(setsensorthresholdcommand)將對應(yīng)于健康檢測數(shù)據(jù)的健康臨界值寫入BMC。根據(jù)一實(shí)施范例,利用BMC取得儲存裝置故障信號的方法還可包括依據(jù)儲存裝置SDR、健康臨界值以及儲存裝置PEF執(zhí)行一儲存裝置管理程序。其中儲存裝置管理程序可包括通知通過一智能平臺管理總線(IntelligentPlatformManagementBus,IPMB)與BMC相連的一遠(yuǎn)程管理程序。儲存裝置管理程序還可包括依據(jù)儲存裝置SDR、健康臨界值暫停儲存裝置的至少一儲存單元。儲存裝置管理程序也可包括依據(jù)儲存裝置SDR、健康臨界值點(diǎn)亮對應(yīng)于儲存裝置的一發(fā)光二極管(lightemittingdiode,LED)組。而儲存裝置可包括多個儲存單元,發(fā)光二極管組則包括分別對應(yīng)于這些儲存單元的多個發(fā)光二極管燈號。且儲存裝置管理程序可依據(jù)健康檢測數(shù)據(jù)、健康臨界值點(diǎn)亮至少一個發(fā)光二極管燈號。綜上所述,利用BMC取得儲存裝置故障信號的方法利用儲存裝置SDR以及S.M.A.R.T.獲得儲存裝置目前的健康狀態(tài)。且在BMC能夠點(diǎn)亮對應(yīng)的LED組,同時并通知在遠(yuǎn)程的管理員。因此由硬件控制的磁盤故障點(diǎn)燈機(jī)制被整合入BMC管理的事件之中,使管理接口得以統(tǒng)一而增進(jìn)管理效率。以下結(jié)合附圖和具體實(shí)施例對本發(fā)明進(jìn)行詳細(xì)描述,但不作為對本發(fā)明的限定。圖1為一實(shí)施范例的服務(wù)器的示意圖;圖2為一實(shí)施范例的利用基板管理控制器取得儲存裝置故障信號的方法的流程圖;圖3為另一實(shí)施范例的利用基板管理控制器取得儲存裝置故障信號的方法的流程圖;圖4為另一實(shí)施范例的服務(wù)器的示意圖。其中,附圖標(biāo)記20服務(wù)器21基板管理控制器210記憶區(qū)塊212儲存裝置SDR214儲存裝置PEF22儲存裝置222,222a,222b,222c儲存單元23自我監(jiān)測系統(tǒng)24中央處理器25發(fā)光二極管組252,252a,252b,252c發(fā)光二極管燈號30遠(yuǎn)程計(jì)算器32遠(yuǎn)程管理程序具體實(shí)施例方式以下在實(shí)施方式中詳細(xì)敘述本發(fā)明的詳細(xì)特征以及優(yōu)點(diǎn),其內(nèi)容足以使任何本領(lǐng)域技術(shù)人員了解本發(fā)明的技術(shù)內(nèi)容并據(jù)以實(shí)施,且根據(jù)本說明書所揭露的內(nèi)容、權(quán)利要求范圍及圖式,任何本領(lǐng)域技術(shù)人員可輕易地理解本發(fā)明相關(guān)的目的及優(yōu)點(diǎn)。本發(fā)明是關(guān)于一種利用基板管理控制器(BaseboardManagementController,BMC)取得儲存裝置故障信號的方法,其適用于具有一基板管理控制器(BMC)以及一儲存裝置的一服務(wù)器。請參照圖1,其為一實(shí)施范例的服務(wù)器的示意圖。服務(wù)器20包括BMC21、儲存裝置22、一自我監(jiān)測系統(tǒng)(Self-MonitoringAnalysisandReportingTechnology,S.Μ.Α.R.Τ.)23以及一中央處理器(centralprocessingunit,CPU)24,其中中央處理器24與儲存裝置22以及S.M.A.R.T.23電性相連。儲存裝置22可以例如是各種大容量的硬盤,或是磁盤陣列(redundantarrayofinexpensivedisk,RAID)系統(tǒng)。服務(wù)器20并可通過網(wǎng)絡(luò)與一遠(yuǎn)程計(jì)算器(remotecomputer)30相連,而遠(yuǎn)程計(jì)算器30則可通過一遠(yuǎn)程管理程序32以及BMC21管理服務(wù)器20。服務(wù)器20可支持智能型平臺管理接口(IntelligentPlatformManagementlnterface,IPMI),并通過上述硬件運(yùn)行一操作系統(tǒng)。其中服務(wù)器20可使用Unix的Linux、FreeBSD或是微軟(Microsoft)的Windows(窗口操作系統(tǒng))Server2003等操作系統(tǒng),也可為磁盤操作系統(tǒng)(DiskOperatingSystem,DOS)或是可延伸固件接口(可擴(kuò)展固件接口,ExtensibleFirmwareInterface,EFI)的系統(tǒng)。且服務(wù)器20也可各種廠牌的各種服務(wù)器產(chǎn)品,本發(fā)明并不對其限制。更詳細(xì)地說,智能型平臺管理接口是一種服務(wù)器管理平臺的標(biāo)準(zhǔn)架構(gòu),它包含BMC21、系統(tǒng)接口(SystemInterface)、非揮發(fā)性儲存單元(Non-volatileMorage)、智能平臺管理總線(IntelligentPlatformManagementBus,IPMB)以及智能型機(jī)箱管理總線(IntelligentChassisManagementBus,ICMB)等5項(xiàng)組件。而其中最重要的就是BMC21。BMC21就像是一臺獨(dú)立的計(jì)算機(jī),包括自己的處理器以及記憶體等資源。且BMC21的運(yùn)作均使用自己具有的資源,而不會占用服務(wù)器20的硬件模塊的其它資源。舉例而言,遠(yuǎn)程計(jì)算器30可使用惠普(HP)公司的iLO系統(tǒng)、戴爾(DELL)公司的iDRAC系統(tǒng),或是英特爾(Intel)公司的ESB2系統(tǒng)。S.M.A.R.T.23系為IBM公司開發(fā)的一種硬盤自我診斷檢測技術(shù),且此技術(shù)受各家計(jì)算機(jī)硬件制造大廠以及硬盤大廠所采用。因此目前大部分的硬盤或磁盤陣列皆有支持S.M.A.R.T.23的功能。簡單來說,S.M.A.R.T.23用以監(jiān)控儲存裝置22的系統(tǒng),其可檢測儲存裝置22的健康狀態(tài)并進(jìn)行回報(bào)。S.M.A.R.T.23能夠針對儲存裝置22的目前溫度或是目前轉(zhuǎn)速等各種項(xiàng)目定期檢測。請配合圖1并參照圖2,圖2為一實(shí)施范例的利用BMC取得儲存裝置故障信號的方法的流程圖。首先于BMC21的一記憶區(qū)塊210中建立對應(yīng)的一儲存裝置檢測器數(shù)據(jù)記錄(sensordatarecord,SDR)212以及一儲存裝置平臺事件篩選(platformeventfilter,PEF)214(步驟S100)。其中儲存裝置PEF214可以具有至少一儲存裝置管理程序,以提供BMC21管理儲存裝置22的依據(jù)。對應(yīng)于儲存裝置22的儲存裝置SDR212以及儲存裝置PEF214建立后,啟動儲存裝置22的S.M.A.R.T.23,并令S.M.A.R.T.23定期檢測儲存裝置22的一健康檢測數(shù)據(jù)(步驟S110)。接著將對應(yīng)于健康檢查數(shù)據(jù)的至少一健康臨界值寫入BMC21的記憶區(qū)塊210(步驟S120)。因此BMC21的記憶區(qū)塊210存有互相對應(yīng)的至少一組儲存裝置SDR212、儲存裝置PEF214以及健康臨界值。其中健康檢測數(shù)據(jù)可包括至少一健康項(xiàng)目,且每一個健康項(xiàng)目分別對應(yīng)一個健康臨界值。健康項(xiàng)目例如可以是壞軌數(shù)(uncorrectablesectorcount)、目前溫度(temperature)或目前轉(zhuǎn)速(speed)。健康項(xiàng)目也可以是讀取錯誤率(readerrorrate)、旋轉(zhuǎn)再試數(shù)(spinretrycount)或巨前處理磁道數(shù)(currentpendingsectorcount)。而S.Μ.A.R.Τ.23可通過IPMI的一門坎值設(shè)置指令(setsensorthresholdcommand),將對應(yīng)于健康檢測數(shù)據(jù)的健康臨界值寫入BMC21。BMC21可以提供一更新指令,使得S.M.A.R.T.23通過更新指令定期將最新的健康檢測數(shù)據(jù)寫入儲存裝置SDR212(步驟S130)。也就是說,BMC21可通過儲存裝置SDR212以及S.M.A.R.T.23得到儲存裝置22目前的健康狀態(tài),而不需要對儲存裝置22增設(shè)額外的檢測器。請參照圖3,其為另一實(shí)施范例的利用BMC取得儲存裝置故障信號的方法的流程圖。利用BMC取得儲存裝置故障信號的方法還可以依據(jù)儲存裝置SDR212、健康臨界值以及儲存裝置PEF214執(zhí)行儲存裝置管理程序(步驟S140)。BMC21定期讀取至少一個健康項(xiàng)目,并比較此健康項(xiàng)目目前的值以及對應(yīng)的健康臨界值,以判斷儲存裝置22是否出現(xiàn)異常。例如當(dāng)儲存裝置22的目前溫度或是壞軌數(shù)高于對應(yīng)的健康臨界值時,BMC21可認(rèn)定儲存裝置22故障。BMC21可將此故障的事件寫入一系統(tǒng)事件登錄文件(systemeventlog,SEL)之中,并按照SEL的內(nèi)容在儲存裝置PEF214中找尋適當(dāng)?shù)膬Υ嫜b置管理程序執(zhí)行。其中儲存裝置管理程序可包括通知通過IPMB與BMC21相連的遠(yuǎn)程管理程序32。而當(dāng)儲存裝置22故障情形嚴(yán)重時,儲存裝置管理程序還可包括依據(jù)儲存裝置SDR212、健康臨界值暫停儲存裝置22的至少一儲存單元。此外,儲存裝置管理程序也可包括依據(jù)儲存裝置SDR212、健康臨界值點(diǎn)亮對應(yīng)于儲存裝置22的一發(fā)光二極管(lightemittingdiode,LED)組25。也就是說,點(diǎn)亮LED組25以及通知遠(yuǎn)程管理程序32的功能整合為均由BMC21執(zhí)行。請配合參照圖4,其為另一實(shí)施范例的服務(wù)器的示意圖。儲存裝置22可包括多個儲存單元222,例如儲存單元22、儲存單元222b以及儲存單元222c;而LED組25則可包括與儲存單元222數(shù)量相同的多個LED燈號252,例如LED燈號252a、LED燈號252b以及LED燈號252。BMC21依據(jù)儲存裝置SDR212以及健康臨界值能夠得知發(fā)生故障的是儲存裝置22中的哪一個儲存單元222,再據(jù)以點(diǎn)亮故障的儲存單元222對應(yīng)的LED燈號252。如此一來,可以使得前來查看服務(wù)器20的管理員輕松地得知儲存裝置22的故障情況。綜上所述,利用BMC取得儲存裝置故障信號的方法提供用以更新儲存裝置SDR的更新指令給S.M.A.R.T.,此獲得儲存裝置目前的健康狀態(tài)。且在查知異常后,儲存裝置管理程序不但能點(diǎn)亮對應(yīng)的LED組,也能通知在遠(yuǎn)程的管理員。也就是說,原先獨(dú)立由硬件控制的磁盤故障點(diǎn)燈機(jī)制被整合入BMC管理的事件之中,使管理接口得以統(tǒng)一。如此一來,可以解決現(xiàn)有技術(shù)像多頭馬車并行般的雜亂的管理方式,而能以更簡潔且有效率的方法管理服務(wù)器,并有效率地再發(fā)生故障事件時通知管理員。當(dāng)然,本發(fā)明還可有其它多種實(shí)施例,在不背離本發(fā)明精神及其實(shí)質(zhì)的情況下,熟悉本領(lǐng)域的技術(shù)人員當(dāng)可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變形,但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。權(quán)利要求1.一種利用基板管理控制器BMC取得儲存裝置故障信號的方法,適用于具有一基板管理控制器BMC以及一儲存裝置的一服務(wù)器,其特征在于,該利用基板管理控制器取得儲存裝置故障信號的方法包括于該BMC的一記憶區(qū)塊中建立對應(yīng)的一儲存裝置檢測器數(shù)據(jù)記錄SDR以及一儲存裝置平臺事件篩選PEF;啟動該儲存裝置的一自我監(jiān)測系統(tǒng),并令該自我監(jiān)測系統(tǒng)定期檢測該儲存裝置的一健康檢測數(shù)據(jù);將對應(yīng)于該健康檢測數(shù)據(jù)的至少一健康臨界值寫入該BMC的該記憶區(qū)塊;以及提供一更新指令,使得該自我監(jiān)測系統(tǒng)通過該更新指令定期將該健康檢測數(shù)據(jù)寫入該儲存裝置SDR。2.根據(jù)權(quán)利要求1所述的利用基板管理控制器取得儲存裝置故障信號的方法,其特征在于,該健康檢測數(shù)據(jù)包括至少一健康項(xiàng)目,且每一該健康項(xiàng)目分別對應(yīng)一個該健康臨界值。3.根據(jù)權(quán)利要求2所述的利用基板管理控制器取得儲存裝置故障信號的方法,其特征在于,該健康項(xiàng)目是壞軌數(shù)、目前溫度或目前轉(zhuǎn)速。4.根據(jù)權(quán)利要求3所述的利用基板管理控制器取得儲存裝置故障信號的方法,其特征在于,該健康項(xiàng)目是讀取錯誤率、旋轉(zhuǎn)再試數(shù)或目前處理磁道數(shù)。5.根據(jù)權(quán)利要求1所述的利用基板管理控制器取得儲存裝置故障信號的方法,其特征在于,該自我監(jiān)測系統(tǒng)通過一智能型平臺管理接口的一門坎值設(shè)置指令將對應(yīng)于該健康檢測數(shù)據(jù)的該健康臨界值寫入該BMC。6.根據(jù)權(quán)利要求1所述的利用基板管理控制器取得儲存裝置故障信號的方法,其特征在于,還包括依據(jù)該儲存裝置SDR、該健康臨界值以及該儲存裝置PEF執(zhí)行一儲存裝置管理程序。7.根據(jù)權(quán)利要求6所述的利用基板管理控制器取得儲存裝置故障信號的方法,其特征在于,該儲存裝置管理程序包括通知通過一智能平臺管理總線與該BMC相連的一遠(yuǎn)程管理程序。8.根據(jù)權(quán)利要求6所述的利用基板管理控制器取得儲存裝置故障信號的方法,其特征在于,該儲存裝置管理程序包括依據(jù)該儲存裝置SDR、該健康臨界值暫停該儲存裝置的至少一儲存單元。9.根據(jù)權(quán)利要求6所述的利用基板管理控制器取得儲存裝置故障信號的方法,其特征在于,該儲存裝置管理程序包括依據(jù)該儲存裝置SDR、該健康臨界值點(diǎn)亮對應(yīng)于該儲存裝置的一發(fā)光二極管組。10.根據(jù)權(quán)利要求9所述的利用基板管理控制器取得儲存裝置故障信號的方法,其特征在于,該儲存裝置包括多個儲存單元,該發(fā)光二極管組包括分別對應(yīng)于該些儲存單元的多個發(fā)光二極管燈號,且該儲存裝置管理程序依據(jù)該健康檢測數(shù)據(jù)、該健康臨界值點(diǎn)亮至少一該發(fā)光二極管燈號。全文摘要一種利用基板管理控制器BMC取得儲存裝置故障信號的方法包括于BMC的記憶區(qū)塊中建立對應(yīng)的儲存裝置檢測器數(shù)據(jù)記錄SDR以及儲存裝置平臺事件篩選PEF;啟動儲存裝置的一自我監(jiān)測系統(tǒng),并令自我監(jiān)測系統(tǒng)定期檢測儲存裝置的健康檢測數(shù)據(jù);將對應(yīng)于健康檢測數(shù)據(jù)的健康臨界值寫入BMC的記憶區(qū)塊;以及提供更新指令,使得自我監(jiān)測系統(tǒng)通過更新指令定期將健康檢測數(shù)據(jù)寫入儲存裝置SDR。文檔編號G06F11/32GK102467438SQ20101054675公開日2012年5月23日申請日期2010年11月12日優(yōu)先權(quán)日2010年11月12日發(fā)明者盧曉芬,陳志偉申請人:英業(yè)達(dá)股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1