一種對(duì)大規(guī)模數(shù)據(jù)中心硬件管理方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于大數(shù)據(jù)管理技術(shù)領(lǐng)域,涉及一種管理方法及系統(tǒng),特別是涉及一種對(duì)大規(guī)模數(shù)據(jù)中心硬件管理方法及系統(tǒng)。
【背景技術(shù)】
[0002]大規(guī)模數(shù)據(jù)中心擁有大量的服務(wù)器、存儲(chǔ)陣列及交換機(jī)等設(shè)備,如何對(duì)這些設(shè)備進(jìn)行管理便于系統(tǒng)管理員掌握硬件整體健康狀況,對(duì)故障設(shè)備及時(shí)進(jìn)行維護(hù)和替換,從整體上提高設(shè)備可用性、可靠性和利用率是十分重要的。業(yè)界對(duì)于服務(wù)器及存儲(chǔ)陣列均有成熟解決方案,前者基于 IPMI (Intelligent Platform Management Interface,智能平臺(tái)管理接口),后者基于SES(SCSI Enclosure Services,箱體服務(wù))。但是對(duì)于數(shù)據(jù)中心的綜合管理尚未有比較便捷的解決方案。各大IT廠商曾經(jīng)聯(lián)合定義過(guò)CIM(Common Informat1nModule,共有信息模塊)來(lái)對(duì)IT資產(chǎn)進(jìn)行管理,但是該協(xié)議體系大而無(wú)當(dāng),開(kāi)發(fā)學(xué)習(xí)成本較高;且基于HTTP和XML,對(duì)于用戶而言部署和維護(hù)也不容易,導(dǎo)致其并沒(méi)有真正的流行開(kāi)來(lái)。
[0003]一般而言,企業(yè)級(jí)服務(wù)器通常具有BMC (baseboard management controller,基板管理控制器),它是一個(gè)小型處理器,能夠獨(dú)立運(yùn)行操作系統(tǒng)而不依賴于主機(jī)上安裝的操作系統(tǒng)。BMC 支持 IPMI, IPMI 是由 Dell, Hewlett-Packard, Intel 和 NEC 等幾大 IT 公司共同制定的硬件管理協(xié)議。管理員可以通過(guò)ipmitool與BMC板上的IPMI agent (IPMI代理)通信,可以實(shí)現(xiàn)獲取傳感器(例如CPU溫度、風(fēng)扇轉(zhuǎn)速)的信息、顯示系統(tǒng)日志內(nèi)容、網(wǎng)絡(luò)遠(yuǎn)程開(kāi)關(guān)機(jī)等功能。
[0004]SES是對(duì)存儲(chǔ)機(jī)箱的一種管理方式。Enclosure包含了電源、風(fēng)扇、溫度傳感器等元素。SES-2 規(guī)定使用 SCSI 命令集的 RECEIVE DIAGNOSTIC RESULTS 和 SEND DIAGNOSTIC兩個(gè)命令來(lái)進(jìn)行管理。控制管理端通過(guò)SEND DIAGNOSTIC命令來(lái)設(shè)置機(jī)箱背板的表現(xiàn),t匕如某個(gè)磁盤出現(xiàn)了 S.M.A.R.T Threshold預(yù)警,控制器就會(huì)發(fā)出這個(gè)命令給磁盤組的背板,之后背板會(huì)把這個(gè)磁盤的紅色警告等點(diǎn)亮,從而讓系統(tǒng)管理員發(fā)現(xiàn)問(wèn)題;同樣的,控制管理端還可以發(fā)出RECEIVE DIAGN0STICRESULTS命令來(lái)獲取機(jī)箱的各種狀態(tài)信息,比如電源電壓、溫度、風(fēng)扇以及最重要的各個(gè)磁盤插槽等狀態(tài)。
[0005]服務(wù)器和存儲(chǔ)機(jī)箱是數(shù)據(jù)中心里主要的硬件設(shè)備,但是無(wú)論IPMI和SES,都只能對(duì)某個(gè)組件進(jìn)行管理,而無(wú)法形成一個(gè)整合的設(shè)備視圖,以便更直觀的向系統(tǒng)管理員提供信息。比如一臺(tái)存儲(chǔ)服務(wù)器,它同時(shí)安裝了 SAS (Serial Attached SCSI)卡和BMC板,并通過(guò)SAS卡管理了若干個(gè)存儲(chǔ)機(jī)柜。管理員能夠分別通過(guò)對(duì)應(yīng)工具獲得SAS卡和BMC板上的信息并對(duì)其實(shí)施控制和管理;但是無(wú)法通過(guò)單一界面對(duì)這個(gè)存儲(chǔ)服務(wù)器進(jìn)行統(tǒng)一管理,所獲得的信息也是割裂的。而對(duì)于某個(gè)機(jī)架上具有內(nèi)在邏輯聯(lián)系的多個(gè)服務(wù)器和存儲(chǔ)陣列,也無(wú)法得到整合的以機(jī)架為單位的管理視圖。
[0006]因此,如何提供一種對(duì)大規(guī)模數(shù)據(jù)中心硬件管理方法及系統(tǒng),已解決現(xiàn)有技術(shù)中對(duì)于擁有大量服務(wù)器、存儲(chǔ)陣列及交換機(jī)等硬件設(shè)備的大規(guī)模數(shù)據(jù)中心無(wú)法準(zhǔn)確掌握這些硬件設(shè)備整體健康狀態(tài),更加無(wú)法通過(guò)單一界面對(duì)這些硬件設(shè)備進(jìn)行統(tǒng)一管理而導(dǎo)致硬件設(shè)備可用性、可靠性、利用率不高等種種缺陷,實(shí)已成為本領(lǐng)域從業(yè)者亟待解決的技術(shù)問(wèn)題。
【發(fā)明內(nèi)容】
[0007]鑒于以上所述現(xiàn)有技術(shù)的缺點(diǎn),本發(fā)明的目的在于提供一種對(duì)大規(guī)模數(shù)據(jù)中心硬件管理方法及系統(tǒng),用于解決現(xiàn)有技術(shù)中對(duì)于擁有大量服務(wù)器、存儲(chǔ)陣列及交換機(jī)等硬件設(shè)備的大規(guī)模數(shù)據(jù)中心無(wú)法準(zhǔn)確掌握這些硬件設(shè)備整體健康狀態(tài),更加無(wú)法通過(guò)單一界面對(duì)這些硬件設(shè)備進(jìn)行統(tǒng)一管理而導(dǎo)致硬件設(shè)備可用性、可靠性、利用率不高的問(wèn)題。
[0008]為實(shí)現(xiàn)上述目的及其他相關(guān)目的,本發(fā)明一方面提供一種對(duì)大規(guī)模數(shù)據(jù)中心硬件管理方法,應(yīng)用于管理多個(gè)數(shù)據(jù)中心,所述數(shù)據(jù)中心包括多個(gè)機(jī)架,每一所述機(jī)架下包括多個(gè)不同硬件設(shè)備,每一所述硬件設(shè)備包括多個(gè)組件,其中,每一機(jī)架、硬件設(shè)備、組件具有管理屬性,所述對(duì)大規(guī)模數(shù)據(jù)中心硬件管理方法包括以下步驟:收集每一所述數(shù)據(jù)中心、機(jī)架、硬件設(shè)備、及組件的管理屬性;根據(jù)收集到的所述數(shù)據(jù)中心、機(jī)架、硬件設(shè)備、及組件的管理屬性構(gòu)建一硬件數(shù)據(jù)結(jié)構(gòu)拓?fù)鋱D;根據(jù)用戶需求按照所述硬件數(shù)據(jù)結(jié)構(gòu)拓?fù)鋱D的順序下發(fā)管理請(qǐng)求;
[0009]根據(jù)所述管理請(qǐng)求并按照預(yù)存的第一設(shè)備管理方式或第二設(shè)備管理方式執(zhí)行對(duì)多個(gè)不同硬件設(shè)備下多個(gè)組件的管理。
[0010]可選地,所述對(duì)大規(guī)模數(shù)據(jù)中心硬件管理方法還包括:對(duì)處于同一級(jí)別的多個(gè)數(shù)據(jù)中心構(gòu)建第一視圖,在所述第一視圖中設(shè)置進(jìn)入多個(gè)數(shù)據(jù)中心的入口 ;對(duì)處于同一級(jí)別的多個(gè)機(jī)架構(gòu)建第二視圖,在所述第二視圖中設(shè)置進(jìn)入多個(gè)機(jī)架的入口 ;對(duì)處于同一級(jí)別的多個(gè)不同硬件設(shè)備構(gòu)建第三視圖,在所述第三視圖中設(shè)置進(jìn)入不同硬件設(shè)備的入口 ;對(duì)所述硬件設(shè)備中包括的多個(gè)組件構(gòu)建第四視圖,在所述第四視圖中設(shè)置進(jìn)入不同組件的入□。
[0011]可選地,所述對(duì)大規(guī)模數(shù)據(jù)中心硬件管理方法還包括:在所述第一視圖中設(shè)置進(jìn)入多個(gè)數(shù)據(jù)中心的入口的同時(shí),對(duì)所述第一視圖中多個(gè)數(shù)據(jù)中心配置與其匹配的管理屬性;在所述第二視圖中設(shè)置進(jìn)入多個(gè)機(jī)架的入口的同時(shí),對(duì)所述第二視圖中多個(gè)機(jī)架配置與其匹配的管理屬性;在所述第三視圖中設(shè)置進(jìn)入不同硬件設(shè)備的入口的同時(shí),對(duì)所述第三視圖中不同硬件設(shè)備配置與其匹配的管理屬性;在所述第四視圖中設(shè)置進(jìn)入不同組件的入口同時(shí),對(duì)所述第四視圖中不同組件配置與其匹配的管理屬性。
[0012]可選地,所述的對(duì)大規(guī)模數(shù)據(jù)中心硬件管理方法還包括在構(gòu)建所述第一視圖、第二視圖、第三視圖、及第四視圖之后,將所述第一視圖與所述第二視圖鏈接,所述第二視圖與所述第三視圖鏈接、及所述第三視圖與所述第四視圖鏈接。
[0013]可選地,所述對(duì)大規(guī)模數(shù)據(jù)中心硬件管理方法還包括產(chǎn)生執(zhí)行管理結(jié)果響應(yīng)。
[0014]可選地,所述管理請(qǐng)求為讀取/查詢/操作/設(shè)置請(qǐng)求。
[0015]本發(fā)明另一方面還提供一種對(duì)大規(guī)模數(shù)據(jù)中心硬件管理系統(tǒng),應(yīng)用于管理多個(gè)數(shù)據(jù)中心,所述數(shù)據(jù)中心包括多個(gè)機(jī)架,每一所述機(jī)架下包括多個(gè)不同硬件設(shè)備,每一所述硬件設(shè)備包括多個(gè)組件,其中,每一機(jī)架、硬件設(shè)備、組件具有管理屬性,所述對(duì)大規(guī)模數(shù)據(jù)中心硬件管理系統(tǒng)包括:收集模塊,用于收集每一所述數(shù)據(jù)中心、機(jī)架、硬件設(shè)備、及組件的管理屬性;拓?fù)錁?gòu)建模塊,用于根據(jù)收集到的所述數(shù)據(jù)中心、機(jī)架、硬件設(shè)備、及組件的管理屬性構(gòu)建一硬件數(shù)據(jù)結(jié)構(gòu)拓?fù)鋱D;第一管理層,用于根據(jù)用戶需求按照所述硬件數(shù)據(jù)結(jié)構(gòu)拓?fù)鋱D的順序下發(fā)管理請(qǐng)求;第二管理層,用于轉(zhuǎn)發(fā)管理請(qǐng)求;第三管理層,用于管理所述多個(gè)不同硬件設(shè)備;第四管理層,用于根據(jù)所述管理請(qǐng)求并按照預(yù)存的第一設(shè)備管理方式或第二設(shè)備管理方式執(zhí)行對(duì)多個(gè)不同硬件設(shè)備下多個(gè)組件的管理。