亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

在通信環(huán)境中提供動態(tài)可靠性和安全性的制作方法

文檔序號:7992615閱讀:416來源:國知局
在通信環(huán)境中提供動態(tài)可靠性和安全性的制作方法
【專利摘要】提供了動態(tài)可靠性和安全性能力。動態(tài)可靠性和安全性能力。動態(tài)可靠性和安全性能力可以配置為支持動態(tài)可靠性概況(DRP)的使用,該DRP依據(jù)時間并依據(jù)客戶的應(yīng)用或服務(wù)的要求來指明客戶的可靠性參數(shù)??煽啃詤?shù)可以指明客戶的可靠性要求和/或目標(biāo),從而提供隨時間而變化的要求/目標(biāo)概況。動態(tài)可靠性和安全性能力可以配置為動態(tài)地配置云資源,以提供DRP所指明的要求的可靠性。RSG能力可配置為接著對行為進(jìn)行監(jiān)視和計量,以確保所指明的可靠性實際上得到遞送,這包括使用自我治療能力來提供服務(wù)保證。
【專利說明】在通信環(huán)境中提供動態(tài)可靠性和安全性
【技術(shù)領(lǐng)域】
[0001]本發(fā)明總體上涉及通信環(huán)境,更具體但不排他地涉及在通信環(huán)境中提供可靠性和安全性。
【背景技術(shù)】
[0002]云計算提供了使用快速、自服務(wù)的供應(yīng)通過互聯(lián)網(wǎng)向客戶遞送服務(wù)和資源的方式,同時將服務(wù)和資源的客戶與底層基礎(chǔ)架構(gòu)的管理隔離開來。然而,盡管云計算有各種優(yōu)勢并且云計算的使用近來得到增長,但是,許多客戶仍然在一些方面存有疑慮,例如云計算的可靠性和安全性,等等。

【發(fā)明內(nèi)容】

[0003]通過在云環(huán)境中提供可靠性和安全性的實施例解決了現(xiàn)有技術(shù)中的多項不足。
[0004]在一個實施例中,一種裝置包括處理器,該處理器配置為接收與云提供商的客戶相關(guān)聯(lián)的動態(tài)可靠性概況(Profile)(DRP),并基于所述客戶的DRP確定用于該客戶的云資源的配置,其中所述DRP指明依據(jù)時間和所述客戶的應(yīng)用或服務(wù)的要求兩者的該客戶的可
靠性參數(shù)。
[0005]在一個實施例中,一種計算機可讀存儲介質(zhì)存儲有指令,所述指令當(dāng)被計算機執(zhí)行時,致使計算機執(zhí)行這樣一種方法,該方法包括,接收與云提供商的客戶相關(guān)聯(lián)的動態(tài)可靠性概況(DRP),并基于所述客戶的DRP確定用于該客戶的云資源的配置,其中所述DRP指明依據(jù)時間和所述客戶的應(yīng)用或服務(wù)的要求兩者的該客戶的可靠性參數(shù)。
[0006]在一個實施例中,一種方法包括,接收與云提供商的客戶相關(guān)聯(lián)的動態(tài)可靠性概況(DRP),并基于所述客戶的DRP確定用于該客戶的云資源的配置,其中所述DRP指明依據(jù)時間和所述客戶的應(yīng)用或服務(wù)的要求兩者的該客戶的可靠性參數(shù)。
【專利附圖】

【附圖說明】
[0007]通過考慮接下來結(jié)合附圖進(jìn)行的詳細(xì)描述,更易于理解本文的教導(dǎo),在附圖中:
[0008]圖1描繪了包括可靠性和安全性守衛(wèi)(RSG)的云系統(tǒng)的一個實施例;
[0009]圖2描繪了用于圖1的RSG的示例性動態(tài)可靠性概況(DRP);
[0010]圖3描繪了用于圖1的云系統(tǒng)的三個客戶的隨時間變化而變化的示例性應(yīng)用組合;
[0011]圖4描述了用于將客戶應(yīng)用信息映射到圖1的云系統(tǒng)的物理資源的過程的實施例;
[0012]圖5描繪了從應(yīng)用拓?fù)涞轿锢砘A(chǔ)架構(gòu)的示例性映射;
[0013]圖6描繪了圖1的RSG的示例性使用,以執(zhí)行事件關(guān)聯(lián)并確定反應(yīng)/預(yù)測控制信息;
[0014]圖7描繪了適用于執(zhí)行圖1的RSG的自可靠計算存儲單元(CSU)的一個實施例;[0015]圖8描繪了圖7的多個CSU在客戶域的示例性部署,以形成分布式自可靠云系統(tǒng);
[0016]圖9描繪了在圖1的云系統(tǒng)的一部分內(nèi)部署的、適用于實現(xiàn)圖1的RSG的系統(tǒng)控制單元(SOT)的一個實施例;
[0017]圖10描繪了用于為云系統(tǒng)的客戶提供可靠性的方法的一個實施例;以及
[0018]圖11描繪了適用于執(zhí)行本文所描述的功能的計算機的高層級框圖。
[0019]為了便于理解,在可能的情況下,使用相同的附圖標(biāo)記來指示圖中共有的相同部件。
【具體實施方式】
[0020]總體來說,本文描繪和描述了可靠性和安全性能力,不過也會提及各種其他能力。
[0021]云計算提供了使用快速、自服務(wù)的供應(yīng)通過互聯(lián)網(wǎng)向客戶遞送服務(wù)和資源的方式,同時將服務(wù)和資源的客戶與底層基礎(chǔ)架構(gòu)的管理隔離開來。在許多情況下,云提供商所提供的服務(wù)是效用計算,它典型地基于云系統(tǒng)的軟件的抽象級別和云系統(tǒng)的資源的管理級別進(jìn)行辨識。該圖譜的一端例如是這樣一種實施方式,其中抽象位于物理硬件層,客戶可以控制整個軟件棧,內(nèi)核以上(盡管這使得難以提供故障轉(zhuǎn)移能力)。該圖譜的另一端例如是這樣一種實施方式,它是利用無狀態(tài)計算和有狀態(tài)存儲系統(tǒng)的、專用于web應(yīng)用的應(yīng)用域。應(yīng)注意其他實施方式也可以落入該圖譜的中間部分。
[0022]云計算具有許多相關(guān)聯(lián)的優(yōu)勢??傮w來說,云計算使得能夠?qū)崿F(xiàn)高度的可擴展性、可配置性、資源可用性的動態(tài)彈性、易于返回,及類似優(yōu)勢。云計算為硬件供應(yīng)提供眾多能力,以創(chuàng)建這樣一種表象,“無限”的計算資源基于需求而可用,足夠快速地滿足負(fù)載的浪潮,從而消除對提前供應(yīng)的需要。在易于調(diào)整尺寸的前提下,云計算使得能夠?qū)崿F(xiàn)更廉價的故障轉(zhuǎn)移方案,這是因為云服務(wù)的按需而定或現(xiàn)購現(xiàn)付的特點。在云計算中,客戶根據(jù)需要短期地為計算資源的使用進(jìn)行付費(例如,按小時計處理器,按天計存儲量,等等),并可以根據(jù)需要對其進(jìn)行請求和釋放。云計算還考慮到了規(guī)模經(jīng)濟(jì)(例如,電力、凈帶寬、操作、軟件和硬件等方面的改善因素),允許統(tǒng)計上的多重復(fù)用以增加資源利用率,并簡化操作。還將意識到云計算的各種其他優(yōu)勢。
[0023]然而,盡管云計算存在前述優(yōu)勢和增長,許多客戶仍然為解決關(guān)于其可靠性和安全性的問題而掙扎。例如,物理資源的共享帶來了安全性問題(例如,數(shù)據(jù)對于他人可見,在故障或退出之后留下數(shù)據(jù)印跡,等等)。此外,廣泛采用云服務(wù)的障礙不能被忽略,例如,安全性/數(shù)據(jù)隱私和管轄權(quán)問題、服務(wù)級別協(xié)定(SLA)的可變性/初期、性能和訪問控制/延遲、可靠性和賣主中立性、將云服務(wù)與商業(yè)應(yīng)用相整合的能力、云服務(wù)模型的相對不成熟和持續(xù)的發(fā)展,等等。并且,注意到,部署有任務(wù)關(guān)鍵型應(yīng)用的企業(yè)通常通過SLA尋求合理的系統(tǒng)響應(yīng)率的保證,通過在多租戶環(huán)境中的數(shù)據(jù)隔離尋求保護(hù),尋求故障轉(zhuǎn)移保護(hù)來最小化服務(wù)中斷,尋求可預(yù)測的再裝載率以及各種相關(guān)的服務(wù)和能力。而且,對于任務(wù)關(guān)鍵型應(yīng)用的保證不是可以量化的,突出公共云(例如,提供便利)相對于私有云(例如,提供安全性和私密性的更好的控制和保證)的成本/收益的量度并不清楚。如此,云系統(tǒng)的軟件的抽象級別和云系統(tǒng)的資源的管理級別具有成為云提供之間的關(guān)鍵區(qū)分的潛在可能。
[0024]在一個實施例中,可以通過使用新系統(tǒng)體系架構(gòu)、新設(shè)備/部件、新編程模型、新開發(fā)環(huán)境、和新測試方法中的一個或多個,來解決上述顧慮和/或需求的至少一部分,其中這樣的體系架構(gòu)、設(shè)備/部件、模型、環(huán)境和/或方法可被配置為基于針對性能、可用性、安全性、彈性、使用計數(shù)等的對客戶的SLA要求的更深理解,提供自可靠的系統(tǒng)。注意到,這將使得公共云計算和私有云計算都能夠變得更加可靠和安全,因此,適合于任務(wù)關(guān)鍵型的使用。
[0025]在一個實施例中,可以通過使用云系統(tǒng)中的可靠性和安全性守衛(wèi)(RSG)能力來解決上述顧慮和/或需求的至少一部分。
[0026]RSG能力可配置為支持動態(tài)可靠性概況(profile) (DRP)的使用,其中DRP可被包含為客戶SLA的一部分,并依據(jù)時間,以及依據(jù)客戶的應(yīng)用或服務(wù)的要求這兩者來指明客戶的可靠性參數(shù)??煽啃詤?shù)可以指明客戶的可靠性要求和/或目標(biāo),從而提供隨時間變化的要求/目標(biāo)概況。RSG能力可配置為動態(tài)地配置云資源,以提供DRP所指明的所需的可靠性。RSG能力可配置為,接下來對行為進(jìn)行監(jiān)視和計量,以保證所指明的可靠性事實上正被遞送,這可包括使用自我治療能力來提供服務(wù)保證。注意到,由于可靠性與可用性相關(guān),動態(tài)可靠性概況在這里也可被稱為動態(tài)可靠性/可用性概況。
[0027]RSG能力可配置為執(zhí)行或提供以下中的一個或多個:將遞送到客戶的服務(wù)的可靠性增加為不中斷的體驗;使得系統(tǒng)能夠自動地重新均衡到功能可用性級別而沒有用戶可見的影響或手動干預(yù);提供對性能、可靠性、可用性、安全性和彈性使用計數(shù)等等的服務(wù)級別協(xié)定(SLA)要求的動態(tài)保證,從而使得公共和/或私有云計算能夠變得更加可靠、安全和彈性,因而適合于任務(wù)關(guān)鍵型使用;依據(jù)時間和應(yīng)用或服務(wù)的要求這兩者來描繪客戶的可靠性要求/目標(biāo);提供自可靠的系統(tǒng),其配置為動態(tài)地配置云資源,以提供所要求/所期望的可靠性;監(jiān)視和計量該系統(tǒng),以保證所要求/所期望的可靠性得到滿足;通過安全收集和對可用的網(wǎng)絡(luò)和服務(wù)數(shù)據(jù)的集中,跨整個方案接近實時地監(jiān)視端對端服務(wù)的可用性;產(chǎn)生可靠性完整性計量,該計量從可用的網(wǎng)絡(luò)和服務(wù)數(shù)據(jù)導(dǎo)出關(guān)鍵的端對端服務(wù)可用性的量度,并觸發(fā)適當(dāng)?shù)幕謴?fù)和控制動作;提供預(yù)防性的控制能力,該能力使得能夠產(chǎn)生對緊迫問題和前攝的服務(wù)進(jìn)行中測試的指示,以持續(xù)地檢測并排除關(guān)鍵問題;等等。
[0028]RSG能力可配置為提供各種其他相關(guān)聯(lián)的功能。換而言之,就好像,客戶可以呼叫一定可靠性,云系統(tǒng)做出反應(yīng)來嘗試遞送該可靠性。
[0029]在一個實施例中,RSG能力部署在基礎(chǔ)架構(gòu)層之內(nèi)。注意到,云計算的一個總體趨勢是朝向與工業(yè)對齊的、動態(tài)的、自我學(xué)習(xí)的以及自我管理的方案。在一個實施例中,部署方案級別的能力,以能夠構(gòu)建有機的、自我意識以及自我治療的網(wǎng)絡(luò),從而使得云提供商能夠在客戶需要的時候提供客戶所需的保證。還注意到,這樣的有機的、自我意識和自我治療的網(wǎng)絡(luò)可以支持各種客戶應(yīng)用,包括高價值的應(yīng)用。在一個實施例中,為了支持這樣的應(yīng)用(包括高價值的應(yīng)用),(I)在平臺層之內(nèi)將可靠性作為服務(wù)來提供(標(biāo)注為RaaS,可靠性作為服務(wù)),(2)在基礎(chǔ)架構(gòu)層之內(nèi)提供被稱為RSG能力的能力,其中RSG能力被配置為提供各種功能,諸如動態(tài)配置,用于高可用性的資源調(diào)度,完整性計量,服務(wù)進(jìn)行中的魯棒性測試,故障的預(yù)測和防止,網(wǎng)絡(luò)事件的關(guān)聯(lián)以識別并診斷故障邊緣和安全條件邊界,等等,以及以上功能的各種組合。以這樣的方式,可以提供動態(tài)自可靠云系統(tǒng)。
[0030]在一個實施例中,RSG能力部署在客戶網(wǎng)絡(luò)之內(nèi)。這克服了與現(xiàn)有云系統(tǒng)相關(guān)聯(lián)的安全性障礙。也就是說,在現(xiàn)有云系統(tǒng)中,由于嚴(yán)格的安全性考慮,云服務(wù)提供商很少允許客戶訪問他們的內(nèi)部管理系統(tǒng)或他們的性能和故障數(shù)據(jù)。例如,在極少數(shù)情況下,可以允許客戶“只讀”訪問報警和性能數(shù)據(jù),用于離線分析的目的。相反,在支持RaaS的情況下,RSG能力可以駐留在客戶網(wǎng)絡(luò)內(nèi),這樣,RSG能力和客戶網(wǎng)絡(luò)內(nèi)的各種其他實體(例如,數(shù)據(jù)收集實體,管理實體,等等)之間的接口就可以被實現(xiàn)為信任接口。并不需要非軍事化(DMZ)功能(例如,通過安全虛擬私有網(wǎng)絡(luò)(VPN)路由的加密數(shù)據(jù)),因為所有數(shù)據(jù)都在客戶域之內(nèi)本地地訪問和分析。并且,由于不涉及外部實體,有可能基于所監(jiān)視的數(shù)據(jù)進(jìn)行前攝性控制。因此,通過將RSG能力嵌入在客戶網(wǎng)絡(luò)之內(nèi)而克服了現(xiàn)有的安全性障礙,這使得能夠構(gòu)建真正有機、自我意識以及自我治療的網(wǎng)絡(luò)。
[0031]云系統(tǒng)可以經(jīng)由一個或多個能力,諸如,經(jīng)由這里描繪和描述的可靠性和安全性守衛(wèi)(RSG),支持上述功能。參照圖1描繪和描述一個不例性云系統(tǒng)中的不例性RSG。
[0032]圖1描繪了包含可靠性和安全性守衛(wèi)(RSG)的云系統(tǒng)的一個實施例。
[0033]如圖1所描繪,云系統(tǒng)100包括物理基礎(chǔ)架構(gòu)101,它通過為客戶102提供云服務(wù)的云提供商來管理。云系統(tǒng)100還包括可靠性/安全性守衛(wèi)(RSG) 120,配置為使得云提供商在使用物理基礎(chǔ)架構(gòu)101向客戶102提供云服務(wù)的背景下,向客戶102提供服務(wù)保證。
[0034]物理基礎(chǔ)架構(gòu)101包括云資源110,可選地還包括可以由云提供商部署來支持云服務(wù)的任何其他物理基礎(chǔ)架構(gòu)。
[0035]客戶102是可以訪問和使用云資源110的任何適當(dāng)類型的客戶。例如,客戶102可以是企業(yè)客戶,家庭客戶,等等。
[0036]客戶102能夠提供可用于產(chǎn)生用于客戶102的SLA103的信息。SLA典型地是客戶特定的,并定義客戶的虛擬環(huán)境,客戶典型地僅僅對相對于其虛擬環(huán)境所滿足的SLA感興趣,而對云系統(tǒng)的整個基礎(chǔ)架構(gòu)的整體不感興趣。云提供商典型地支持多個客戶(盡管,如以上所注意到的,這里出于清楚的目的僅僅描繪和描述了單個客戶120)。于是,云提供商典型地確保云系統(tǒng)的基礎(chǔ)架構(gòu)能夠滿足用于其所有客戶的所有虛擬環(huán)境的SLA。注意到,云系統(tǒng)100被配置為能夠使得云提供商提供這樣的能力。
[0037]客戶102能夠提供可用于產(chǎn)生用于客戶102的動態(tài)可靠性概況(DRP)105的信息。用于客戶102的DRP105可以由客戶102直接指明,可以由客戶102在SLA103之內(nèi)指明,可以通過處理為SLA103而輸入的信息,和/或處理SLA103自身(例如,通過可靠性指示器104和/或任何其他適當(dāng)?shù)南到y(tǒng)或部件)而確定,等等,以及通過以上的各種組合來確定。DRP105可以以任何適當(dāng)?shù)牧6忍峁?例如,用于具體的應(yīng)用,用于一組應(yīng)用,用于具體的服務(wù),用于一組服務(wù),用于一個或多個服務(wù)以及一個或多個應(yīng)用,用于客戶102整體,等等)。如圖1所描繪,用于客戶102的DRP105被提供給RSG120。
[0038]云資源110可以配置為由客戶102使用。云資源110可包括計算資源111,內(nèi)存資源112,存儲資源113,輸入輸出資源114,以及網(wǎng)絡(luò)資源115。注意到,云資源110可以假定為虛擬無限的(也就是,有足夠的云資源110來滿足任何客戶需求)。還注意到,云資源110可以是分布式的,并可以動態(tài)分組。本領(lǐng)域技術(shù)人員將可以理解將云資源110分配給客戶120使用的典型方式。盡管對于特定類型的云資源110進(jìn)行初步地描繪和描述,不過將可以理解,云資源110可以包含可配置為用于客戶使用的任何其他類型的云資源。
[0039]RSG120配置為提供使得云系統(tǒng)100可以操作為自可靠系統(tǒng)的各種功能。例如,RSG120可以配置為接收客戶102的DRP105,動態(tài)配置云系統(tǒng)100的云資源110,以提供DRP105所指明的要求的可靠性。RSG120還配置為接著對行為進(jìn)行監(jiān)視和計量,以保證所指明的可靠性實際上正得到遞送。RSG120還配置為提供各種其他相關(guān)聯(lián)的功能。注意到,如圖1所呈現(xiàn)的,RSG120可以以集中的或分布式的方式實現(xiàn)。
[0040]RSG120包括四個功能部件:配置引擎(CE) 122,調(diào)度引擎(SE) 124,監(jiān)視引擎(ME)126,以及控制引擎(CE) 128。注意到,這四個功能部件可以使用一個或多個物理設(shè)備來實現(xiàn)(例如,RSG120的功能可以集中在單個系統(tǒng)中,跨一個或多個系統(tǒng)分布,等等)。相應(yīng)地,RSG120使用虛線框來表示,旨在示出四個功能部件可以在云系統(tǒng)100內(nèi)執(zhí)行的各種方式。
[0041]CE122接收客戶102定義的DRP105(或者包含DRP105的SLA103),使用DRP105來動態(tài)產(chǎn)生用于客戶102的虛擬配置131。虛擬配置131指明滿足客戶102的DRP105(例如,滿足DRP105的要求和/或目標(biāo))的用于客戶102的虛擬配置。虛擬配置131可以依據(jù)時間而被指明。CE122可以動態(tài)地產(chǎn)生滿足DRP105的虛擬配置131,同時負(fù)責(zé)云系統(tǒng)100的當(dāng)前狀態(tài)和/或云系統(tǒng)100所施加的政策/約束。CE122將虛擬配置131提供給SE124。CE 122可以提供本文所討論的各種其他功能。
[0042]SE 124從CE122接收虛擬配置131。SE 124在通過DRP105和云系統(tǒng)100的當(dāng)前狀態(tài)和/或云系統(tǒng)100施加的政策/約束管控的適當(dāng)時間處,將虛擬配置131映射到物理基礎(chǔ)架構(gòu)101 (例如,映射到云資源110)。由SE124確定的映射標(biāo)注為映射132。SE124可以指明與DRP105的實現(xiàn)相關(guān)聯(lián)的必要類型的冗余和/或恢復(fù)方案。注意到,如同DRP105可以以任何適當(dāng)粒度指明一樣,相關(guān)聯(lián)的映射132可以以任何適當(dāng)粒度來提供。SE124配置為在物理基礎(chǔ)架構(gòu)101內(nèi)執(zhí)行映射132 (例如,經(jīng)由物理基礎(chǔ)架構(gòu)101的配置使得客戶102能夠使用云資源110),從而使得客戶102于是可以利用云資源110。SE124可以提供本文所討論的各種其他功能。
[0043]ME126觀測物理基礎(chǔ)架構(gòu)101的部件(例如,云資源110的計算資源111,內(nèi)存資源112,存儲資源113,輸入輸出資源114,網(wǎng)絡(luò)資源115,以及云資源110的任何其他相關(guān)聯(lián)的物理部件或資源)的狀態(tài)。ME126通過接收和分析在ME126處從物理基礎(chǔ)架構(gòu)101接收的系統(tǒng)狀態(tài)信息133 (例如,警報,探針,日志文件,等等,以及以上的各種組合),來觀測物理基礎(chǔ)架構(gòu)101的部件的狀態(tài)。ME126將物理基礎(chǔ)架構(gòu)101的部件的所觀測狀態(tài)轉(zhuǎn)譯成客戶102的虛擬環(huán)境的狀態(tài)。ME126可配置為將與可靠性和安全性相關(guān)的事件和狀態(tài)捕獲作為可靠性/安全性信息134 (在至少一些實施例中,該信息134可以表示為可靠性完整性計量(RIM))0 ME126可配置為確定用于CE128使用的控制信息(標(biāo)注為控制信息135)(例如,用于CE128在對云系統(tǒng)100中的事件或條件做出反應(yīng)時使用的反應(yīng)控制信息,用于CE128在防止云系統(tǒng)100中發(fā)生潛在事件或條件時使用的預(yù)先防止控制信息,等等,以及以上的各種組合)。ME126可以提供本文所討論的各種其他功能。
[0044]CE 128配置為從ME126接收控制信息135,接收政策/約束信息136 (該信息例如可以被指明為SLA103,DRP105等等的一部分,以及以上的各種組合),并使用控制信息135和政策/約束信息136來確定適用于控制/配置云系統(tǒng)100的物理基礎(chǔ)架構(gòu)101 (例如,云資源110)的反饋動作137。CE 128將反饋動作137提供到物理基礎(chǔ)架構(gòu)101,以控制/配置云系統(tǒng)100的物理基礎(chǔ)架構(gòu)101。反饋動作137可以包括反應(yīng)性反饋動作(例如,對識別的事件或條件作出反應(yīng))以及/或者預(yù)測性防止性反饋動作(例如,用于防止預(yù)測的事件或條件發(fā)生)。例如,CE128可以當(dāng)檢測到故障時觸發(fā)恢復(fù)動作,和/或啟動防止性措施,以避免故障發(fā)生。CE128可以提供本文所討論的各種其他功能。[0045]如圖1所描繪,RSG120的部件可以以適當(dāng)方式嵌入在云系統(tǒng)100中。例如,在一個實施例中,RSG120的部件可以嵌入在云系統(tǒng)100的基礎(chǔ)架構(gòu)、平臺和服務(wù)層中。將從圖1和本文提供的其他描述中了解,云系統(tǒng)100的自可靠特性通過以下特征/益處中的一個或多個來表征:(I)向客戶提供服務(wù)可用性,而不管硬件和/或軟件故障或中斷,(2)保護(hù)服務(wù)、數(shù)據(jù)和基礎(chǔ)架構(gòu)免于攻擊,確保個人數(shù)據(jù)的私密性,(3)基于事件或政策實時提供靈活和動態(tài)的資源分配,也就是,可擴展性,(4)可預(yù)測的性能,其橫跨寬范圍的工作負(fù)載需求并具有可接受的遞送成本。通過圖1和本文提供的其他描述將了解通過使用云系統(tǒng)100的實施例可以實現(xiàn)的各種其他特征/益處。
[0046]如本文所描述的,DRP105依據(jù)時間以及客戶102的應(yīng)用或服務(wù)的要求這兩者指明客戶102的可靠性參數(shù)(例如,要求/目標(biāo))。應(yīng)理解,并不是客戶群組中的所有應(yīng)用/服務(wù)都預(yù)期具有相同的可靠性需求,并且,應(yīng)用/服務(wù)的可靠性需求可以隨時間而改變。參照圖2描繪和描述一個示例性DRP105,它示出了其時間改變的特性。[0047]圖2描繪了由圖1的RSG使用的示例性動態(tài)可靠性概況(DRP)。如圖2所描繪,DRP105表示客戶的可靠性需求(在I軸上示出)隨時間(在X軸上示出)的改變。如本文所描述,RSG120配置為使用DRP105來動態(tài)配置云資源110,以提供DRP105中指明的所要求的可靠性。注意到,在具有虛擬無限云資源的云系統(tǒng)中,這帶來資源的更高利用率,節(jié)省成本,電源使用的高效,以及各種其他優(yōu)勢。
[0048]如本文所描述的,云系統(tǒng)100可以支持多個客戶102,每個客戶具有一個或多個相關(guān)聯(lián)的DRP105。于是,云系統(tǒng)100需要同時管理多個客戶102的DRP105,同時顧及到DRP105是隨時間變化的概況這一事實。對于多個客戶102的DRP105的隨時間而改變的特性,這里考慮接下來的三種情況(注意到,盡管也可以考慮各種其他情況):(1)給定客戶的應(yīng)用組合的要求可能隨時間變化,(2)客戶組的要求可能隨時間變化,以及(3)給定應(yīng)用的要求可能隨時間變化。參照圖3描繪和描述具有不同應(yīng)用組合的三個客戶102的例子。
[0049]圖3描繪了用于圖1的云系統(tǒng)的三個客戶的、依據(jù)時間的示例性應(yīng)用組合。
[0050]如圖3所描繪,應(yīng)用組合300示出標(biāo)注為客戶A、B和C的三個客戶的應(yīng)用的示例性組合。三個客戶A、B和C的應(yīng)用分別標(biāo)注為Ap Bi和C”應(yīng)用Ap Bi和Ci的每個具有與其相關(guān)聯(lián)的可靠性要求(其中,出于清楚的目的,支持如下三個可能的可靠性要求:高度(HIGH),、中度(MED)和低度(LOW))。在這個例子中,高度的可靠性要求指示出,預(yù)期有完全的活動/活動冗余度,中度的可靠性要求指示出,預(yù)期活動/備用的冗余方案,而低度的可靠性要求指示出預(yù)期沒有冗余度。
[0051]應(yīng)用組合300隨時間而改變,描繪了四個示例性時間段31(^-31(^(總體上,時間段310),用于示出應(yīng)用組合300隨時間的改變。
[0052]在時間段SlO1,客戶A具有應(yīng)用Al到A5,其中應(yīng)用Al、,A3和A4每個都具有高度的可靠性要求,應(yīng)用A2具有中度的可靠性要求,而應(yīng)用A4具有低度的可靠性要求。同樣在時間段3101;客戶B具有應(yīng)用BI到B4,其中應(yīng)用BI和B2每個具有中度的可靠性要求,應(yīng)用B3和B4每個具有高度的可靠性要求。同樣在時間段SlO1,客戶C具有應(yīng)用Cl,它具有中度的可靠性要求。
[0053]在時間段3102,客戶A、B和C的應(yīng)用的組合與時間段3%的應(yīng)用組合300相同(也就是,沒有改變)。[0054]在時間段3103,客戶A、B和C的應(yīng)用的組合發(fā)生了多種方式的改變(例如,之前的應(yīng)用不再存在,仍然存在的之前應(yīng)用的可靠性要求發(fā)生改變,引用新的應(yīng)用,等等)。在時間段3103,客戶A具有應(yīng)用A2、A4、A5、A6 (新的)和A7 (新的),其中應(yīng)用A2和A7每個具有中度的可靠性要求,應(yīng)用A4具有高度的可靠性要求,而應(yīng)用A5和A6每個具有低度的可靠性要求。同樣在時間段3103,客戶B具有應(yīng)用B3、B5、B6和B7,其中應(yīng)用B3和B5每個具有高度的可靠性要求,應(yīng)用B6具有中度的可靠性要求,應(yīng)用B7具有低度的可靠性要求。同樣在時間段3103,客戶C具有應(yīng)用C2 (新的),它具有中度的可靠性要求。
[0055]在時間段3104,客戶A、B和C的應(yīng)用的組合再次發(fā)生多種方式的改變(例如,之前的應(yīng)用不再存在,仍然存在的之前應(yīng)用的可靠性要求發(fā)生改變,引用新的應(yīng)用,等等)。
[0056]注意到,參照圖3描繪和描述的可靠性要求僅僅是示例性的。實際中,粒度可以更加細(xì)致,應(yīng)用的復(fù)雜性及其相關(guān)聯(lián)的可靠性要求可以不同。例如,可以使用其他值表示示例性可靠性要求的一個或多個,可以以其他方式限定示例性可靠性要求的一個或多個,可以支持更少或更多的可靠性要求(包括不同的可靠性要求),可以支持各種可靠性目標(biāo)(例如,取代于以及/或者附加于上述可靠性要求),等等,以及以上的各種組合。
[0057]圖4描繪了將客戶應(yīng)用信息映射到圖1的云系統(tǒng)的物理資源的過程的一個實施例。
[0058]總體來說,過程400執(zhí)行一種受約束映射,該映射將客戶102所需要的和/或所期望的映射到可在底層云基礎(chǔ)架構(gòu)中實現(xiàn)的(也就是,就好像,客戶102可以呼叫一定可靠性,云系統(tǒng)100嘗試遞送它)。
[0059]在一個實施例中,通過RSG120的CE122來執(zhí)行方法400。
[0060]如圖4所描繪,在方法400中的特定點處接收并使用輸入信息。輸入信息包括客戶應(yīng)用信息401和云系統(tǒng)信息402。客戶應(yīng)用信息401包括客戶102的客戶應(yīng)用拓?fù)湫畔?例如,可以從描述中具體地指明和/或提取),客戶102的客戶SLA信息,客戶102的DRP105,等等。云系統(tǒng)信息402包括當(dāng)前系統(tǒng)狀態(tài)信息,政策/約束信息(例如,硬件和/或軟件資源使用信息、客戶概況信息、要求的性能信息、安全性約束、成本約束等信息中的一個或多
小、坐坐I ),寸寸O
[0061]在步驟410,使用客戶應(yīng)用信息401的至少一部分和/或云系統(tǒng)信息402的至少一部分產(chǎn)生虛擬應(yīng)用拓?fù)?15。例如,在一個實施例中,可以使用應(yīng)用拓?fù)湫畔?、?dāng)前系統(tǒng)狀態(tài)信息和政策約束來產(chǎn)生虛擬應(yīng)用拓?fù)?15。
[0062]在步驟420,使用云系統(tǒng)信息402的至少一部分和虛擬應(yīng)用拓?fù)?15(可選地,還有客戶應(yīng)用信息401的至少一部分,盡管出于清楚的目的這被省略了),產(chǎn)生可靠性繪圖425??煽啃岳L圖425標(biāo)識出預(yù)期滿足客戶102的應(yīng)用需求和/或目標(biāo)的可靠性配置。在一個實施例中,可靠性繪圖425可以表示為可靠性框圖表(RBD)。注意到,有許多與可靠性繪圖425的產(chǎn)生相關(guān)聯(lián)的考慮。例如,冗余體系架構(gòu)和故障轉(zhuǎn)移方案受到處理器資源的位置的影響(例如,處理器資源是否位于同一多核芯片中,位于同一刀片上,跨多個刀片,跨底架,在LAN之內(nèi),跨LAN,等等)。例如,還可以考慮內(nèi)存和磁盤的分配。例如,還可以考慮磁盤分配,文件系統(tǒng)和數(shù)據(jù)庫配置,本地還是遠(yuǎn)程。此外,可靠性繪圖425的產(chǎn)生可以更加復(fù)雜,因為容錯要求(例如,如DRP105所指明)可能僅僅是問題的一部分(例如,在確定最優(yōu)配置時,連同DRP105,性能、安全性、成本等等是需要考慮的其他要素)。[0063]在步驟430,使用云系統(tǒng)信息402的至少一部分和可靠性繪圖425 (可選地,還有客戶應(yīng)用信息401的至少一部分,盡管出于清楚的目的這被省略了),確定物理配置435。例如,在一個實施例中,可以使用可靠性繪圖425、當(dāng)前系統(tǒng)狀態(tài)信息和政策/約束信息來確定物理配置435。物理配置435指明從客戶102的可靠性繪圖425到云系統(tǒng)100的可用物理基礎(chǔ)架構(gòu)101 (例如,到云資源110)的映射。例如,物理配置435指明從客戶102的可靠性繪圖425到處理器、內(nèi)存單元、磁盤、文件、數(shù)據(jù)庫、輸入輸出資源、網(wǎng)絡(luò)資源等等中的一個或多個的映射。
[0064]圖5描繪了從應(yīng)用拓?fù)涞轿锢砘A(chǔ)架構(gòu)的示例性映射。
[0065]圖5的示例性映射500對應(yīng)于參照圖4的方法400描繪和描述的步驟。圖5的示例性映射500示出了應(yīng)用拓?fù)?10 (例如,隨時間提供應(yīng)用可靠性說明)、可靠性繪圖520(例如,隨時間提供DRP說明),以及物理配置530 (例如,隨時間指明到物理部件的映射),這分別對應(yīng)于圖4的虛擬應(yīng)用拓?fù)?15、可靠性繪圖425和物理配置435。
[0066]如圖5所描繪,不例性映射500用于其可靠性需求隨時間而改變的應(yīng)用。應(yīng)用隨時間而改變,示出了四個示例性時間段SOl1-SOl4 (總體上,時間段501),用于示出應(yīng)用隨時間的改變。
[0067]應(yīng)用拓?fù)?10示出應(yīng)用中的應(yīng)用部件511和應(yīng)用部件511的相關(guān)聯(lián)的可靠性要求(圖示地,使用H、M和L來分別標(biāo)注出高度、中度和低度可靠性要求)。在時間段SOl1,應(yīng)用包括兩個應(yīng)用部件,包括具有高度可靠性要求的第一應(yīng)用部件和具有低度可靠性要求的第二應(yīng)用部件。在其他的時間段501,應(yīng)用拓?fù)?10隨著應(yīng)用的改變而改變。
[0068]可靠性繪圖520表示為RBD的形式。在時間段SOl1,應(yīng)用映射成兩個部件A和B,其中部件A是冗余對Al和A2 (由于其高度可靠性要求)。部件B與部件A級聯(lián),并且單工操作(由于其低度可靠性要求)。在其他時間段501,表示為RBD的可靠性繪圖520隨著應(yīng)用拓?fù)?10的改變而改變。
[0069]物理配置530指明從應(yīng)用的可靠性繪圖(圖示地,應(yīng)用的RBD的應(yīng)用部件)到云系統(tǒng)的可用物理基礎(chǔ)架構(gòu)的映射。例如,物理配置530可以指明從可靠性繪圖520到處理器、內(nèi)存單元、磁盤、文件、數(shù)據(jù)庫、輸入輸出資源、網(wǎng)絡(luò)鏈路等等中的一個或多個的映射。在時間段5011;包括冗余對Al和A2的應(yīng)用部件A映射到被配置為提供這樣的冗余度的兩個處理器資源,應(yīng)用部件B映射到一個處理器資源。在其他時間段501,物理配置530隨著表示為RBD的可靠性繪圖520的改變而改變。盡管主要參照映射到處理器資源進(jìn)行描繪和描述,應(yīng)注意,物理配置530可以指明從應(yīng)用的可靠性繪圖520到任何適當(dāng)?shù)馁Y源的映射,例如,更詳細(xì)地映射到處理器資源(例如,與安全性和用戶概況說明相一致對文件、數(shù)據(jù)庫、I/O和通信端口具有適當(dāng)特權(quán)、讀/寫/執(zhí)行許可和訪問權(quán)的處理器,等等),映射到其他類型的資源(例如,內(nèi)存單元,磁盤,文件,數(shù)據(jù)庫,輸入輸出資源,網(wǎng)絡(luò)鏈路,等等),等其他,以及以上的各種組合。
[0070]再次回到圖1,ME126配置為執(zhí)行對云系統(tǒng)100的監(jiān)視和計量功能。ME126可以與RSG120的其他部件協(xié)作,以使得自可靠能力能夠在云系統(tǒng)100中得到支持。
[0071]ME126可以配置為周期性地掃描云系統(tǒng)100中的計算資源,以識別出故障,識別出安全性攻擊,測量應(yīng)用的性能,等等,并進(jìn)一步地匯報相關(guān)聯(lián)的結(jié)果(例如,故障的識別,安全性攻擊的識別,性能降級的檢測,等等,以及以上的各種組合)。[0072]ME126可以配置為在檢測到異常時產(chǎn)生警報,相關(guān)的警報被關(guān)聯(lián)和分析,以確定影響網(wǎng)絡(luò)狀況的服務(wù)的存在(或不存在)。
[0073]ME126可配置為收集警告(例如,從云系統(tǒng)100的一些或全部網(wǎng)絡(luò)部件),并基于時間和/或空間相關(guān)性,將收集的警告相對于警報條件進(jìn)行關(guān)聯(lián)。
[0074]ME126可配置為聚集云系統(tǒng)100的網(wǎng)絡(luò)拓?fù)湫畔?,并將網(wǎng)絡(luò)拓?fù)湫畔⒉⑷氲接糜趫?zhí)行這樣的關(guān)聯(lián)功能的一個或多個模型中。
[0075]ME126可配置為確定獨立網(wǎng)絡(luò)事件的根本原因,并且可選地,還將檢測的網(wǎng)絡(luò)事件標(biāo)記為中斷相關(guān)的(影響服務(wù)的)和非中斷相關(guān)的(不影響服務(wù)的)。
[0076]ME126可配置為計算在特定時間段中用于特定聚合級別的服務(wù)可用性,這通過以下方式實現(xiàn):分析獨立根本原因事件的組,以確定落入所述特定時間段的組,組合相關(guān)聯(lián)事件的持續(xù)時間,以計算所述特定時間段中的中斷時間的總量,將所述事件與網(wǎng)絡(luò)拓?fù)湫畔⒑褪苁录绊懙姆?wù)類型相對比,以及,使用網(wǎng)絡(luò)影響的范圍和中斷時間的百分比,確定所評估的服務(wù)的總服務(wù)可用性。注意到,服務(wù)可用性的確定可以依賴于所考慮的子網(wǎng)絡(luò),所使用的底層網(wǎng)絡(luò)技術(shù),網(wǎng)絡(luò)拓?fù)?大小,等因素。
[0077]ME126可配置為確定可靠性完整性計量,并確定用于CE128使用的控制信息。參照圖6描繪和描述了示例性地使用ME126來執(zhí)行這樣的功能。
[0078]圖6描繪了示例性使用圖1的RSG來執(zhí)行事件關(guān)聯(lián)/聚合并確定反應(yīng)性/前攝性控制信息。
[0079]如圖6所描繪,ME126配置為執(zhí)行事件關(guān)聯(lián)/聚合,并確定反應(yīng)性/前攝性控制信
肩、O
[0080]ME126接收事件602和政策/約束信息604。如圖6所描繪,事件602可以直接從云系統(tǒng)100的物理基礎(chǔ)架構(gòu)101接收,和/或從代表云系統(tǒng)100的物理基礎(chǔ)架構(gòu)101的其他一個或多個監(jiān)視和/或管理元件/系統(tǒng)接收(例如,一個或多個探針,一個或多個元件管理系統(tǒng)(EMS),一個或多個網(wǎng)絡(luò)管理系統(tǒng)(匪S),等等)。事件602的監(jiān)視可以由ME126執(zhí)行,和/或跨云系統(tǒng)100的物理基礎(chǔ)架構(gòu)101執(zhí)行(例如,用于報告給ME126)。對其執(zhí)行監(jiān)視的事件602的類型可以包括,子系統(tǒng)產(chǎn)生的軟件警報、在用于各種量度的測量計數(shù)器中出現(xiàn)的閾值穿越、應(yīng)用故障(例如,總的和/或部分的)、導(dǎo)致服務(wù)受到影響的安全性攻擊、硬件故障(例如,可恢復(fù)的或不可恢復(fù)的)、業(yè)務(wù)負(fù)載的變動、網(wǎng)絡(luò)故障,等等。如圖4所描繪,政策/約束信息604可以包括硬件和/或軟件資源使用信息、客戶概況信息、要求的性能信息、安全性約束、成本約束等等中的一個或多個,以及以上的各種組合。
[0081]ME126包括聚合引擎612、關(guān)聯(lián)分析引擎614以及處理引擎616。ME126還包括歷史數(shù)據(jù)庫619。
[0082]聚合引擎612接收與物理基礎(chǔ)架構(gòu)101相關(guān)聯(lián)的事件602,并對事件602進(jìn)行聚合。在執(zhí)行用于特定時間段的處理時,聚合引擎612可以通過分析事件602以確定落入該特定時間段的組,以此來聚合事件602。聚合引擎612可以將聚合的事件信息提供給關(guān)聯(lián)分析引擎614和/或歷史數(shù)據(jù)庫619。
[0083]關(guān)聯(lián)分析引擎614接收聚合的事件信息(例如,從聚合引擎612和/或從歷史數(shù)據(jù)庫619),并對聚合的事件執(zhí)行關(guān)聯(lián)。關(guān)聯(lián)分析引擎614可以執(zhí)行任何適當(dāng)?shù)年P(guān)聯(lián)功能。例如,相關(guān)的事件602可以被關(guān)聯(lián)和分析,以確定存在(或不存在)影響網(wǎng)絡(luò)狀況的服務(wù),事件602可以基于時間上和/或空間上的相關(guān)性相對于警報條件進(jìn)行關(guān)聯(lián),等等,以及以上的各種組合。關(guān)聯(lián)分析引擎614可以將關(guān)聯(lián)的事件信息提供給處理引擎616和/或歷史數(shù)據(jù)庫619。
[0084]處理引擎619接收政策/約束信息604并接收關(guān)聯(lián)的事件信息(例如,從關(guān)聯(lián)分析引擎614和/或從歷史數(shù)據(jù)庫619)。
[0085]處理引擎616產(chǎn)生可靠性完整性計量(RH0622,其可以包括對ME126所監(jiān)視、聚合和關(guān)聯(lián)的信息的總結(jié)。處理引擎616可以本地地存儲RM622 (例如,存儲在歷史DB619),和/或?qū)M622提供給適當(dāng)?shù)南到y(tǒng)、設(shè)備、引擎和/或其他部件或元件。
[0086]處理引擎616產(chǎn)生反應(yīng)性/預(yù)測性控制信息624。ME126將該反應(yīng)性/預(yù)測性控制信息624提供給CE128,用于CE128在執(zhí)行云系統(tǒng)100的物理基礎(chǔ)架構(gòu)101中的控制功能時使用。例如,ME126 (I)將反應(yīng)性控制信息提供給CE128用于CE128的一個或多個反應(yīng)性控制引擎使用,以提供云系統(tǒng)100的物理基礎(chǔ)架構(gòu)101中的反應(yīng)性控制功能,(2)將預(yù)測性防止控制信息提供給CE128用于CE128的一個或多個預(yù)測性防止控制引擎使用,以提供云系統(tǒng)100的物理基礎(chǔ)架構(gòu)101中的預(yù)測性防止控制功能。
[0087]處理引擎616可配置為,從ME126所收集的原始數(shù)據(jù)計算各種類型的性能量度(例如,關(guān)鍵質(zhì)量指標(biāo)(KQI),關(guān)鍵性能指標(biāo)(KPI),等等)。這些量度可以計算用于包含在RIM622中。例如,可用于可靠性計量的性能量度可以包括用于硬件和/或軟件的故障頻率(例如,在服務(wù)層級,部件層級,或任何其他適當(dāng)層級),用于硬件和/或軟件的停機時間(例如,在服務(wù)層級,部件層級,或任何其他適當(dāng)層級),用于硬件和/或軟件的可用性(例如,在服務(wù)層級,部件層級,或任何其他適當(dāng)層級),數(shù)據(jù)不可用性(例如,由于故障、安全性攻擊等等)等等中的一個或多個,以及以上的各種組合。注意到,量度可以在任何適當(dāng)層級指明(例如,用于虛擬化的應(yīng)用或部件,用于一組虛擬化的應(yīng)用或部件,用于服務(wù),用于一組服務(wù),用于端對端的解決方案,用于數(shù)據(jù)中心,等等,以及以上的各種組合)。注意到,性能指標(biāo)可以是與所考慮的客戶102最為相關(guān)的指標(biāo)。處理引擎616還可以配置為將性能指標(biāo)與預(yù)期值相比較。
[0088]如圖6所進(jìn)一步描繪的,CE128配置為從ME126接收反應(yīng)性/預(yù)測性控制信息624,并使用該反應(yīng)性/預(yù)測性控制信息624來執(zhí)行云系統(tǒng)100的物理基礎(chǔ)架構(gòu)101中的反應(yīng)性/預(yù)測性控制功能。CE128可以通過將相關(guān)聯(lián)的反饋動作(例如,參照圖1描繪和描述的反饋動作137)提供給物理基礎(chǔ)架構(gòu)101,來提供反應(yīng)性控制功能和預(yù)測性防止性控制功能。注意到,在ME126觀察并測量云系統(tǒng)100的行為的同時,CE128關(guān)閉環(huán)路以確保測量的行為與預(yù)期行為相匹配,進(jìn)一步地,如果存在偏差,則啟動適當(dāng)?shù)募m正動作。進(jìn)一步注意到,ME126執(zhí)行功能,并產(chǎn)生最終驅(qū)動CE128所執(zhí)行的控制動作的結(jié)果(例如,ME126將關(guān)聯(lián)分析引擎614的結(jié)果和政策/約束信息604組合,產(chǎn)生包含在RM622中的量度,將結(jié)果和當(dāng)前狀態(tài)作為歷史信息存儲在歷史數(shù)據(jù)庫619中,并使用政策/約束信息604和歷史信息來驅(qū)動CE128所執(zhí)行的反應(yīng)性和預(yù)測性防止性控制動作)。
[0089]CE 128包括反應(yīng)性控制引擎632和預(yù)測性防止性控制引擎634。
[0090]反應(yīng)性控制引擎632從ME126接收反應(yīng)性控制信息,在物理基礎(chǔ)架構(gòu)101中執(zhí)行反應(yīng)性控制功能。反應(yīng)性控制引擎632可配置為用動作進(jìn)行響應(yīng),以從某種狀況(例如,事件、故障,等等)中恢復(fù)。例如,恢復(fù)動作可以包括,執(zhí)行進(jìn)程的重新開始,執(zhí)行處理器重引導(dǎo)并在另一處理器上(例如,本地的或遠(yuǎn)程的)執(zhí)行進(jìn)程的重新開始,重新建立失效的網(wǎng)絡(luò)連接,在存儲單元上執(zhí)行重新開始,執(zhí)行與軟故障有關(guān)的恢復(fù)動作(例如,數(shù)據(jù)的重新初始化,進(jìn)程的重新存儲或重置,等等),等等,以及以上的各種組合。反應(yīng)性控制引擎632可以配置為運行診斷測試,以識別狀況的來源或根本原因。
[0091]預(yù)測性防止控制引擎634從ME126接收預(yù)測性防止性控制信息,并在物理基礎(chǔ)架構(gòu)101中執(zhí)行預(yù)測性防止性控制功能。預(yù)測性防止控制引擎634可配置為執(zhí)行預(yù)測性防止性措施,諸如,執(zhí)行重組,執(zhí)行再均衡動作,執(zhí)行審計,執(zhí)行預(yù)先測試,等等。
[0092]例如,預(yù)測性防止控制引擎634可配置為對資源進(jìn)行重組(例如,由于構(gòu)成新服務(wù)或由于系統(tǒng)中出現(xiàn)的近期事件而進(jìn)行的動態(tài)模型構(gòu)建,改變現(xiàn)有復(fù)合服務(wù)的結(jié)構(gòu)的再構(gòu)成,等等X
[0093]例如,預(yù)測性防止控制引擎634可配置為執(zhí)行碎片整理(例如,通過周期性對存儲系統(tǒng)進(jìn)行碎片整理來使得磁盤訪問更加平滑更加有效,從而改善性能,節(jié)約磁盤壽命)。
[0094]例如,預(yù)測性防止控制引擎634可配置為執(zhí)行動態(tài)可靠性建模,其中動態(tài)可靠性計算是基于失效數(shù)據(jù)的遞增更新。在一個實施例中,動態(tài)可靠性建模集中于從運行時數(shù)據(jù)收集到可靠性評估的整個過程,重點在于數(shù)據(jù)收集和動態(tài)建立概況,而不是僅使用歷史數(shù)據(jù)。在一個實施例中,RM622可以動態(tài)更新,因為軟件被重新構(gòu)成以滿足云系統(tǒng)100的變化的環(huán)境。
[0095]例如,預(yù)測性防止控制引擎634可配置為執(zhí)行再均衡操作(例如,通過對服從于政策/約束信息604的可用資源上的負(fù)載進(jìn)行再均衡)。
[0096]例如,預(yù)測性防止控制引擎634可配置為執(zhí)行審計。在一個實施例中,執(zhí)行周期性審計,以追蹤物理和邏輯資源,維持?jǐn)?shù)據(jù)完整性并確保安全性。在一個實施例中,可以對(I)資源庫(例如,CPU,內(nèi)存,I/O以及網(wǎng)絡(luò)資源)以及(2)基礎(chǔ)架構(gòu)的拓?fù)?例如,包括冗余配置的部件之間的連接性)執(zhí)行審計。在一個實施例中,對用戶數(shù)據(jù)庫和文件執(zhí)行審計,以確保數(shù)據(jù)完整性和揭露任何潛在問題。
[0097]例如,預(yù)測性防止控制引擎634可配置為執(zhí)行前攝性測試。在一個實施例中,前攝性測試可以包括,執(zhí)行服務(wù)進(jìn)行中的模擬攻擊、故障邊緣條件測試、以及與計劃的維護(hù)動作(例如,拔下插頭)有關(guān)的測試。在一個實施例中,這樣的前攝性測試的至少一部分依賴于物理基礎(chǔ)架構(gòu)101中的虛擬無限資源的可用性。這種類型的測試可以幫助確保云系統(tǒng)100持續(xù)保持健壯。
[0098]以這樣的方式,RSG120配置為使得云系統(tǒng)100能夠作用為自可靠的系統(tǒng)。
[0099]盡管參照RSG120的提供特定功能的特定部件(圖示地,CE122,SE124,ME126和CE128)進(jìn)行了初步描繪和描述,不過應(yīng)注意,RSG120的功能可以使用任何適當(dāng)?shù)囊粋€或多個部件來提供。例如,描繪和描述為分別由圖示的部件所執(zhí)行的功能可以以不同方式跨所圖示的部件分布。例如,可以使用一個或多個其他部件(例如,取代于和/或附加于圖示的部件)來提供被描繪和描述為由圖示的部件所執(zhí)行的功能。
[0100]盡管參照云系統(tǒng)100中的RSG120的特定部署(例如,使用特定的分布式體系)進(jìn)行了初步描繪和描述,但可以了解,RSG120可以使用任何其他適當(dāng)?shù)牟渴?,包括集中地或分散地部署RSG120的各個功能,在云系統(tǒng)100中執(zhí)行。
[0101]因此,可以了解,RSG120可以以任何適當(dāng)?shù)姆绞讲⑷氲皆葡到y(tǒng)100中。[0102]在一個實施例中,RSG120可以使用以下項目并入到云系統(tǒng)100中:(I)虛擬層,由一個或多個計算存儲單元(CSU)構(gòu)成,其示例性實施例參照圖7和8進(jìn)行描繪和描述,(2)物理層,由一個或多個系統(tǒng)控制單元(SCU)構(gòu)成,其示例性實施例參照圖9進(jìn)行描繪和描述。
[0103]圖7描繪了適用于實現(xiàn)圖1的RSG的自可靠的計算存儲單元(CSU)的一個實施例。
[0104]CSU700是云系統(tǒng)100的分布式版本的抽象基本構(gòu)造框圖。CSU700可以由客戶102指明,客戶102期望CSU700是安全的以及可恢復(fù)的。CSU700可以基于可以由客戶102提供的各種參數(shù)(例如,SLA103,DRP105,QoS參數(shù),等等)來控制??蛻?02還可以提供有關(guān)信息(例如,分布式云系統(tǒng)的拓?fù)?,用于分布式云系統(tǒng)的管控政策規(guī)則,等等)。注意到,客戶域可包括一個或多個CSU。在客戶域包括多個CSU700的情況下,多個CSU700可以彼此通信,以形成虛擬的分布式計算機器。在一個實施例中,RSG120嵌入在每個CSU700中,以確保每個CSU700如所指示的那樣自可靠。
[0105]CSU700包括虛擬機(VM) 710,虛擬存儲卷體(VSV) 720,虛擬子網(wǎng)接口(VSI) 730,虛擬探針(VP) 740,虛擬可靠性/安全性守衛(wèi)(VRSG) 750,CSU控制器(CC) 760,以及CSU說明(CS)770。
[0106]VM710包括配置為提供CSU700的各種功能的處理器和相關(guān)聯(lián)的內(nèi)存。它可以作為基本計算引擎使用,配置用于若干級別的性能和可靠性。
[0107]VSV720為CSU700提供存儲。VSV720可以包括一個或多個數(shù)據(jù)庫,一個或多個文件,一個或多個磁盤,一個或多個閃存部件,等等,以及以上的各種組合。
[0108]VSI730提供到云系統(tǒng)100的其他CSU700的接口(例如,用于共享與VM710相關(guān)聯(lián)的虛擬內(nèi)存,用于共享VSV中的存儲,等等)。VSI730可以支持安全連接,以提供這樣的共享能力。參照圖8描繪和描述示例性分布式自可靠云系統(tǒng),該云系統(tǒng)使用多個CSU700,它們經(jīng)由多個相關(guān)聯(lián)的VSI730通信。
[0109]VP740收集用于CSU700的使用率、可靠性、性能和安全性數(shù)據(jù)。
[0110]VRSG750配置為,作為CSU700的RSG120操作,執(zhí)行參照圖1_6描繪和描述的分別由CE122、SE124、ME126和CE128執(zhí)行的配置、調(diào)度、監(jiān)視和控制功能。VRSG750還可配置為監(jiān)視和管理CSU700的部件(例如,用于監(jiān)視和管理CSU700中的部件的恢復(fù),包括執(zhí)行恢復(fù)動作,該恢復(fù)動作用于從其中執(zhí)行VRSG750的CSU700和/或具有其他VRSG750的CSU700內(nèi)的故障中恢復(fù))。
[0111]CC760配置為管理CSU400的操作。CC760可以與云提供商交互。CC760還可以經(jīng)由VRSG750監(jiān)視虛擬基礎(chǔ)架構(gòu)的狀態(tài)。CC760配置為與SCU通信。
[0112]CS770維持與CSU700相關(guān)聯(lián)的屬性(例如,CPU要求,內(nèi)存要求,用于VSV720的存儲卷體附加,經(jīng)由VSI730與其他CSU700的連接,可靠性等級,恢復(fù)方案,在諸如故障之類的狀況時的行為,可擴展性政策屬性,QoS屬性,安全性約束,性能約束,等等,以及以上的各種組合)。注意到,在CSU700內(nèi)的元件之間可能存在安全性,類似地,在包含多個自可靠CSU700的分布式云系統(tǒng)的情況下,在自可靠CSU700之間也可能存在安全性。CS770可以通過供應(yīng)來支持屬性的改變。
[0113]如本文所述,客戶域可以包括任何適當(dāng)數(shù)目的CSU700。在其中客戶域包括多個CSU700的一個實施例中,多個CSU700可以彼此通信,以形成分布式自可靠云系統(tǒng),該系統(tǒng)配置為操作為虛擬的分布式的計算機器。在一個這樣的實施例中,多個CSU700的VRSG750可以經(jīng)由多個CSU700的VSI730彼此通信,以形成分布式子可靠云系統(tǒng)。參照圖8描繪和描述一個例子。
[0114]圖8示出圖7的多個CSU在客戶域的示例性部署,以形成分布式自可靠云系統(tǒng)。
[0115]如圖8所描繪,客戶域800包括三個CsUTOO1-TOO3,其中每個CSU700如參照圖7的CSU700所描繪和描述的那樣實現(xiàn)。
[0116]三個CSU700配置為經(jīng)由通信網(wǎng)絡(luò)810彼此通信。更具體地,CSU700的VRSG750配置為通過經(jīng)由CSU700各自的VSI訪問通信網(wǎng)絡(luò)810來彼此通信。在一個實施例中,如果CSU700在物理服務(wù)器上鞏固合并,于是相關(guān)聯(lián)的對平臺的網(wǎng)絡(luò)化需求加強,那么可以將本地通信虛擬化(例如,取代于將CSU700之間的所有通信強制到平臺的物理層),其中虛擬化可以以任何適當(dāng)方式執(zhí)行(例如,使用一個或多個虛擬交換機,其可以配置為像物理交換機一樣運作,但是被虛擬化到平臺,或者以其他適當(dāng)方式運作)。
[0117]三個CSU700可以配置為使用可靠適應(yīng)性分布協(xié)議(RADP)彼此通信。RADP使得三個CSU700能夠交換各種類型的信息(例如,關(guān)于可靠性、安全性、性能、拓?fù)?、事件?shù)據(jù)等中的一個或多個的信息,以及以上的各種組合),從而使得三個CSU700能夠協(xié)調(diào)動作。
[0118]注意到,可以支持其他有關(guān)通信的能力。例如,在一個實施例中,缺省網(wǎng)絡(luò)被局限為在同一子網(wǎng)上的VM710之間交換。例如,在一個實施例中,VSV720僅對于同一 CSU700內(nèi)的連接和映像可見。例如,在一個實施例中,CSU700之間對來自VSV720的信息的共享局限為通過安全路徑傳輸。
[0119]以這樣的方式,云提供商可以使用通信網(wǎng)絡(luò)810的延伸和標(biāo)度,跨物理基礎(chǔ)架構(gòu)101有效地分布云服務(wù)。
[0120]如以上注意到的,RSG120除了使用由一個或多個CSU700構(gòu)成的虛擬層,還可以使用由一個或多個S⑶構(gòu)成的物理層,由此并入到云系統(tǒng)100中。
[0121]圖9描繪了在圖1的云系統(tǒng)的一部分中部署的、適用于在圖1的RSG中執(zhí)行的系統(tǒng)控制單元(SOT)的一個實施例。
[0122]如圖9所描繪,簡化的物理基礎(chǔ)架構(gòu)900包括物理資源部分910和S⑶920。
[0123]物理資源部分910包括物理基礎(chǔ)架構(gòu)900的物理資源911 (其可以是參照圖1描繪和描述的物理基礎(chǔ)架構(gòu)101的一部分)和管理程序919。
[0124]物理資源911可以包括計算資源,內(nèi)存資源,輸入輸出資源,存儲資源,等等,以及以上的各種組合。
[0125]管理程序919配置為提供物理資源911的管理功能。管理程序919配置為支持CPU虛擬化,從而使得CPU能夠被多個操作系統(tǒng)所共享。管理程序919可以提供各種其他功能。
[0126]S⑶920配置為提供CSU管理功能,用于管理客戶域的CSU(例如,圖7的CSU700中的一個或多個)。S⑶920配置為與客戶域的CSU700的CC760通信。S⑶920配置為執(zhí)行CSU管理功能,這可以包括諸如創(chuàng)建/管理/刪除虛擬部件,管理針對CSU內(nèi)和CSU間交互而限定的連接性政策等功能,以及以上的各種組合。
[0127]SCU920包括主機管理器(HM) 921,資源管理器(RM) 922,存儲管理器(SM) 923,物理可靠性/安全性守衛(wèi)(PRSG) 924,以及物理探針(PP) 925。
[0128]HM921在特許的虛擬機中的物理主機上(例如,主機OS)運行,管理和批準(zhǔn)在物理主機上發(fā)生的動作。HM921通過中轉(zhuǎn)對物理主機的各種資源(例如,計算,存儲,網(wǎng)絡(luò),等等)的訪問,迫使CSU700彼此隔離并與S⑶920隔離。HM921將抽象虛擬模型轉(zhuǎn)譯成適合于物理主機的底層管理程序919的配置數(shù)據(jù)。HM921與SM923交互,以根據(jù)主機化的虛擬機的要求,創(chuàng)建和移除虛擬塊設(shè)備。CSU700可以執(zhí)行為單個共享物理網(wǎng)絡(luò)上的虛擬覆蓋網(wǎng)絡(luò),而不需要任何特殊硬件。網(wǎng)絡(luò)層提供資源控制,以限制虛擬機帶寬消耗并區(qū)分其優(yōu)先次序。
[0129]S⑶920和管理程序919可以協(xié)作,以執(zhí)行從虛擬應(yīng)用拓?fù)涞皆葡到y(tǒng)的物理基礎(chǔ)架構(gòu)的映射(例如,如參照圖4和圖5所描繪和描述的)。客戶102指明對于虛擬機、虛擬存儲塊和虛擬網(wǎng)絡(luò)的想要的拓?fù)洌渲蓄A(yù)期指明的拓?fù)錆M足一組定義的約束。上述約束包括,允許的通信樣式、虛擬機托管約束、QoS約束等等,以及以上的各種組合。拓?fù)浜图s束描述可以響應(yīng)于各種條件(例如,負(fù)載條件,故障條件,等等)而動態(tài)改變??蛻粲虻腃SU700于是可以自動地適應(yīng)以滿足改變的要求。注意到,在存儲側(cè),存在可擴展的、持久的以及加密的存儲,該存儲即使是在負(fù)載條件下也允許服務(wù)維持?jǐn)?shù)據(jù)吞吐量。
[0130]參照圖1-9描繪和描述的自可靠體系可以利用和/或提供各種其他能力和/或技術(shù),其中的至少一部分對于自可靠體系內(nèi)的服務(wù)可靠性具有支撐和關(guān)聯(lián)。
[0131]第一能力涉及自可靠體系背景下的故障模式和恢復(fù)。
[0132]在許多情況下,自可靠系統(tǒng)與冗余度和容錯有關(guān)。由于沒有單一部件可以確保100%正常運行時間,所述體系允許個別部件出現(xiàn)故障而不影響整個系統(tǒng)的可用性。自可靠操作預(yù)期,分布式系統(tǒng)中的許多系統(tǒng)(如果不是全部的話)可以容忍它所依賴的其他系統(tǒng)的故障。
[0133]在一個實施例中,RSG120在虛擬層級和在物理層級處負(fù)責(zé)檢測、抑制各種類型的故障并從中恢復(fù)。在一個這樣的實施例中,由于云系統(tǒng)100的物理基礎(chǔ)架構(gòu)的共享特性,錯誤抑制可以擔(dān)當(dāng)極高的重要性。
[0134]在一個實施例中,可以支持以下的故障類型和相關(guān)聯(lián)的恢復(fù)模式:(1)進(jìn)程故障(例如,本地進(jìn)程重置/重啟;進(jìn)程在另一 CPU上重啟;進(jìn)程在另一托管的刀片、支架、容器和/或CPU上重啟;進(jìn)程在遠(yuǎn)程CPU上重啟,以及其他),(2)應(yīng)用故障(例如,本地重啟;另一 CPU,刀片,支架,容器;遍布服務(wù)器的多個進(jìn)程,遠(yuǎn)程的,其他的),(3)處理器/CPU故障(例如,CPU,刀片,支架,容器,站點的故障;其他),以及(4)網(wǎng)絡(luò)故障(例如,鏈路、節(jié)點等的故障,網(wǎng)絡(luò)路徑的周期性審計,其他)。
[0135]在一個實施例中,一旦檢測到錯誤,立即“檢疫隔離”物理單元。凍結(jié)安全性邊界。該恢復(fù)可以由DRP105、與云系統(tǒng)100相關(guān)聯(lián)的系統(tǒng)狀態(tài)信息和/或與云系統(tǒng)100相關(guān)聯(lián)的政策/約束信息來指導(dǎo)。恢復(fù)策略可以是預(yù)先建立的,或者可以由RSG120決定。在恢復(fù)策略由RSG120決定的一個實施例中,RSG120可以基于一個或多個因素(例如,可靠性等級,成本,性能,安全性考慮,等等)決定恢復(fù)策略。例如,在從進(jìn)程故障恢復(fù)的情況下,RSG120可以決定在本地重啟進(jìn)程,在同一刀片上的另一處理器上重啟進(jìn)程,在同一機架中的不同刀片上重啟進(jìn)程,在另一支架中的刀片上重啟進(jìn)程,或者在遠(yuǎn)程支架中的刀片上重啟進(jìn)程。RSG120可以針對其他類型的故障條件和相關(guān)聯(lián)的恢復(fù)模式做出其他決定。
[0136]第二能力涉及在自可靠體系的背景下提供前攝性測試。
[0137]在一個實施例中,前攝性測試的目的是周期性地執(zhí)行服務(wù)進(jìn)行中的彈性和魯棒性測試,以確保系統(tǒng)的準(zhǔn)備就緒能夠?qū)嶋H上經(jīng)受住故障。例如,前攝性測試可以包括,模擬各種條件來驗證云系統(tǒng)100在所模擬的條件下繼續(xù)運行的能力。例如,前攝性測試可以包括模擬故障邊緣條件,以驗證云系統(tǒng)100在高壓力條件期間繼續(xù)運作的能力。
[0138]在一個實施例中,RSG120周期性執(zhí)行這樣的測試,該測試隨機禁用產(chǎn)品實例,以確保云系統(tǒng)100可以經(jīng)受住這樣的常見類型的故障,而不影響客戶。在一個實施例中,RSG120執(zhí)行前攝性診斷,以揭露無聲故障(silent failure)。在一個實施例中,云系統(tǒng)100的“無限資源”的特點使得RSG120能夠以更大的規(guī)模執(zhí)行活動的、備用的恢復(fù)場景。在至少一些這樣的實施例中,測試可以設(shè)計為覆蓋任何適當(dāng)?shù)牟考?例如,CPU,內(nèi)存,存儲器,1/0,網(wǎng)絡(luò),等等,以及以上的各種組合)。
[0139]在一個實施例中,RSG120可以支持適用于評估云系統(tǒng)100的可靠性和安全性的一個或多個服務(wù)進(jìn)行中的測試。例如,RSG120可配置為執(zhí)行服務(wù)進(jìn)行中的配置測試,諸如:
(I)使用多個版本的網(wǎng)絡(luò)驅(qū)動器,調(diào)節(jié)OS和驅(qū)動器等級網(wǎng)絡(luò)設(shè)置,使內(nèi)核獲得熱修復(fù),并將其施用于服務(wù)中;(2)切換虛擬化提供商,改變TCP/IP主機模型,以及(3)在多個地理位置核查配置和運行時問題。例如,RSG120可以配置為執(zhí)行服務(wù)進(jìn)行中的破壞和故障轉(zhuǎn)移測試,諸如:(1)隨機地啟用、禁用、斷連和重連處理器、內(nèi)存、磁盤、網(wǎng)絡(luò)端口等資源,以模擬故障和/或維護(hù)動作并觸發(fā)恢復(fù)動作,(2)對處理器和數(shù)據(jù)庫執(zhí)行故障轉(zhuǎn)移測試,確??鏑SU700存在數(shù)據(jù)的多份冗余拷貝,并核查N+1冗余度,以及(3)周期地或恒常地進(jìn)行安全性攻擊。例如,RSG120可配置為執(zhí)行服務(wù)進(jìn)行中的負(fù)載和能力測試,諸如,驗證云系統(tǒng)100應(yīng)付由不常見的活動導(dǎo)致的大的負(fù)載尖峰的能力,以及,驗證云系統(tǒng)100應(yīng)付瞬時故障的連鎖效應(yīng)的能力。例如,RSG120可配置為執(zhí)行服務(wù)進(jìn)行中的延遲和超時測試,諸如,(I)核查超時,設(shè)置侵略性的超時,核查低效運行,以及驗證恢復(fù)時間,(2)在客戶服務(wù)器通信層誘導(dǎo)人為延遲,以模擬服務(wù)降級并測量上游服務(wù)響應(yīng)以及核查依賴性故障。例如,RSG120可配置為執(zhí)行服務(wù)進(jìn)行中的審計和健康核查測試,諸如,(I)在每個實例上運行健康核查,監(jiān)視健康的外部跡象(例如,CPU負(fù)載)以檢測不健康的實例,執(zhí)行在線測試(例如,使用壞的輸入,缺乏命令條目,以及類似條件)以揭露事務(wù)性故障,(2)執(zhí)行測試以找出那些不遵從最佳實踐的子系統(tǒng)實例,(3)搜索不使用的資源并確保它們被返回到可用資源池,以及(4)運行測試以找出安全性違反或弱點。
[0140]第三能力涉及在自可靠體系的背景下,數(shù)據(jù)的完整性/安全性和數(shù)據(jù)的機密性??傮w來說,客戶102易于受到可靠性問題引起的數(shù)據(jù)丟失。在一個實施例中,使用RSG120,每個CSU700: (I)保護(hù)客戶免于彼此的不法行為,(2)保護(hù)基礎(chǔ)架構(gòu)免于客戶的不法行為,
(3)保護(hù)客戶免于提供商的不法行為。注意到,安全性故障可以因為以下原因中的一個或多個而產(chǎn)生:不是所有資源都得到虛擬化,虛擬化軟件有程序缺陷,代碼毀壞的情況,不正確的網(wǎng)絡(luò)虛擬化(它允許客戶訪問云提供商基礎(chǔ)架構(gòu)的敏感部分或其他客戶的資源)。
[0141]第四能力涉及在自可靠體系的背景下數(shù)據(jù)的可用性/不可用性。
[0142]在許多情況下,軟件應(yīng)用和數(shù)據(jù)對于商業(yè)相當(dāng)重要,從而使得,在軟件應(yīng)用和/或數(shù)據(jù)不可用時(例如,由于中斷的狀況),商業(yè)被延緩或者甚至潛在地停滯,直到可用性得到恢復(fù)。在短期內(nèi),這樣的中斷狀況導(dǎo)致數(shù)據(jù)丟失,員工和客戶受挫,失去收益。長期地,這樣的中斷狀況會在整個商業(yè)的生命期對該商業(yè)造成影響(并且,丟失記錄、交易和/或會計文件甚至可能將商業(yè)置于違反法規(guī)的風(fēng)險中)??梢粤私?,數(shù)據(jù)可能因為許多原因而變得不可用,這可以用狀態(tài)圖表來表示,該圖表匯總從數(shù)據(jù)完全可訪問的正常狀態(tài)(標(biāo)注為正常狀態(tài))到數(shù)據(jù)部分可用或不可用的異常狀態(tài)的轉(zhuǎn)變。例如,當(dāng)系統(tǒng)由于安全性攻擊而受到黑客襲擊時(標(biāo)注為襲擊狀態(tài)),由于操作員失誤或程序瑕疵而當(dāng)機時(標(biāo)注為當(dāng)機/受損狀態(tài)),由于丟失加密密鑰而變得不可用時(標(biāo)注為當(dāng)機/受損狀態(tài)),或者經(jīng)歷計劃中的維護(hù)動作時(標(biāo)注為維護(hù)狀態(tài)),會出現(xiàn)上述異常狀態(tài)。
[0143]在一個實施例中,RSG120配置為保衛(wèi)客戶數(shù)據(jù)以確保其可用性不會受損。RSG120可以通過審計、服務(wù)進(jìn)行中的測試、數(shù)據(jù)修復(fù),等等,以及以上的各種組合,來保衛(wèi)客戶數(shù)據(jù)。注意到,數(shù)據(jù)備份和存儲方案通常是災(zāi)難恢復(fù)計劃的主要組成。在一個實施例中,客戶數(shù)據(jù)可以根據(jù)需要容易地、自動地移動。在一個實施例中,可以通過在多個位置存儲客戶數(shù)據(jù)的多個拷貝,其中數(shù)據(jù)保持同步,以此恢復(fù)客戶數(shù)據(jù)。在一個實施例中,可以針對特定類型的條件而指明數(shù)據(jù)恢復(fù)策略(例如,在文件或數(shù)據(jù)庫或磁盤故障的情況下,可以使用以下數(shù)據(jù)恢復(fù)策略中的一個或多個:(I)冷備份方案,其中抓取文件快照,并存儲和備份文件;
(2)暖備份方案,其中為客戶保留資源;(3)熱備份方案,其中由遠(yuǎn)程站點處的同步化資源管理數(shù)據(jù)的復(fù)制(例如,在中斷的情況下,作為副本的替代性的故障轉(zhuǎn)移站點立即接管)。
[0144]第五能力涉及自可靠體系背景下的錯誤和警告處理。
[0145]在一個實施例中,RSG120配置為執(zhí)行主動監(jiān)視,以在客戶服務(wù)受到影響之前早期檢測CSU700和SCU920上的異常行為。
[0146]在一個實施例中,VRSG750配置為分析問題,確定相關(guān)聯(lián)的防止性控制動作。在一個這樣的實施例中,VRSG750配置為,響應(yīng)于接收到CSU700的部件檢測到異常事件并恢復(fù)時產(chǎn)生的警報,執(zhí)行這樣的功能。
[0147]在一個實施例中,VRSG750配置為處理各種類型的輸入信息,以提供各種控制功能(例如,控制,過濾,錯誤分析,等等,以及以上的各種組合)。
[0148]VRSG750可以處理關(guān)于每個CSU700的信息,以提供各種控制功能。云系統(tǒng)100配置為,在其操作期間,在任何或所有層級(例如,在物理SCU層級,虛擬CSU層級,網(wǎng)絡(luò)層級,服務(wù)層級,等等中的一個或多個),產(chǎn)生異常事件(例如,警報,警告,等等)。云系統(tǒng)100還配置為,收集各種類型的性能數(shù)據(jù)。如果達(dá)到異常條件,被監(jiān)視的事件變量的值會遭受到閾值。在至少一些情況下,應(yīng)用過濾準(zhǔn)則,記錄滿足準(zhǔn)則的變量(例如,在日志文件中)。應(yīng)理解,對于每個時間間隔,存在有限數(shù)目的事件變量被記錄。事件變量捕獲相關(guān)聯(lián)的部件的行為,并提供附加的上下文用于事件處理。例如,事件變量可以包括,攀升的函數(shù)錯誤,恢復(fù)的陷入/異常,CPU總使用率,內(nèi)存總使用率,中斷的事務(wù),進(jìn)程重啟,發(fā)送的錯誤TPDU,接收的錯誤Trou,發(fā)生傳輸超時,健全超時的數(shù)目,刀片重啟,故障轉(zhuǎn)移的數(shù)目,磁盤訪問故障,文件訪問故障,磁盤使用,以及關(guān)鍵警告的數(shù)目。如以上注意到的,VRSG750配置為處理關(guān)于每個CSU700的這樣的信息,以提供各種控制功能。
[0149]VRSG750可以接收和處理來自若干源的信息(例如,來自CSU750的部件的自主故障報告,來自客戶和對等VRSG750的問題報告,來自VRSG750的診斷/訓(xùn)練/審計的結(jié)果,
(4)來自性能管理器的損傷指示,來自配置管理器的網(wǎng)絡(luò)配置數(shù)據(jù),等等,以及以上的各種組合)。VRSG750配置為整合這樣的信息,并提供諸如控制、過濾、錯誤分析之類的功能。作為VRSG750進(jìn)行這樣的處理的結(jié)果,可以識別故障的基礎(chǔ)架構(gòu)資源,辨識出錯誤的根本原因,安排和規(guī)劃修復(fù)動作,并將故障的資源返回到服務(wù)。
[0150]VRSG750和PRSG924可以配置為接收事件通知。警報和警告采集可以包括硬件和/或軟件事件,其中的至少一些基于CSU700 (用于VRSG750)和SCU920 (用于PRSG924)所指明的準(zhǔn)則在本地主機中進(jìn)行處理。在一個實施例中,即使?fàn)顩r得到解決,事件通知也被發(fā)送到PRSG750和VRSG924。以這樣的方式,可以保持歷史信息用于特征分析并確定可能的防止性動作。注意到,在軟件錯誤的情況下,僅僅相對小數(shù)目的這樣的錯誤會導(dǎo)致不可恢復(fù)的異常,因為大部分錯誤通常被異常處理器所解決。進(jìn)一步注意到,至少一些動作由主機機器在本地執(zhí)行,在這樣的情況下,可以只是通知PRSG750和PRSG924已采取的動作。
[0151]第六能力涉及自可靠體系架構(gòu)背景下的可靠和可擴展存儲。在許多情況下,為了滿足規(guī)模和成本的目標(biāo),云系統(tǒng)用商品服務(wù)器、磁盤和網(wǎng)絡(luò)的集群構(gòu)建,它們分布在多個地理上分散的數(shù)據(jù)中心。注意到,在這樣的環(huán)境中,可能有大數(shù)目的故障場景(例如,磁盤故障,網(wǎng)絡(luò)中斷,電力分布中斷和災(zāi)難,等等)。于是,在一些情況中的底層存儲系統(tǒng)的語義不明時,從存儲故障進(jìn)行恢復(fù)對于云應(yīng)用的開發(fā)者來說非常困難。例如,導(dǎo)致數(shù)據(jù)不一致的故障狀況包括部分寫入、存儲節(jié)點沖突、網(wǎng)絡(luò)分區(qū)、在多個站點的多個讀取者/寫入者,等等。在一個實施例中,客戶可以指明不同的編碼,以實現(xiàn)不同的成本、能力和可靠性的平衡。例如,臨時的、容易再創(chuàng)建的數(shù)據(jù)可以以最小冗余度進(jìn)行存儲,而耗成本的、檔案性的數(shù)據(jù)可以廣泛分散,以提高可靠性,存儲可以提供最終一致的語義,等等。在一個實施例中,存儲系統(tǒng)可以在不同操作條件下(例如,數(shù)據(jù)的復(fù)制,RAID,擦除編碼,等等)提供不同類型的冗余度和一致性。
[0152]第七能力涉及自可靠體系背景下的性能和超負(fù)荷。在許多情況下,對服務(wù)的需求隨時間而變化,從而導(dǎo)致性能不可預(yù)測。應(yīng)理解,為數(shù)據(jù)中心提供僅持續(xù)數(shù)據(jù)中心的操作時間中的很小百分比的峰值負(fù)載條件將導(dǎo)致數(shù)據(jù)中心資源的利用。于是,可以優(yōu)選現(xiàn)購現(xiàn)付方案(例如,對計算資源按小時計費)。然而,現(xiàn)購現(xiàn)付方式也可能具有相關(guān)聯(lián)的問題(例如,需求是預(yù)先未知的(例如,在開始是很大的尖峰,后面是穩(wěn)定的業(yè)務(wù)量),經(jīng)由云所購買的小時可以隨時間不均勻地變化,等等)。此外,許多服務(wù)還經(jīng)歷季節(jié)性或周期性的需求變化(例如,十二月中的電子商務(wù),由于新事件導(dǎo)致的非預(yù)期的需求,等等)。并且,性能降級可能是由于故障、超負(fù)荷或設(shè)計(例如,由于計劃中的受控的超負(fù)荷政策控制而導(dǎo)致的失去交易可用性,業(yè)務(wù)量超負(fù)荷,VM之間的I/O性能的變化,VM之間的I/O干擾,等等,以及以上的各種組合)。
[0153]第八能力涉及自可靠體系背景下的電源管理和硬件壽命。在一些情況下,數(shù)據(jù)中心具有大數(shù)目的服務(wù)器上的大數(shù)目的用戶(例如,支持幾百萬用戶的幾千個服務(wù)器)。在許多這樣的情況下,電源和冷卻是主要的問題和開銷。在一個實施例中,通過使用軟件棧、可擴展的存儲、具有密集刀片的服務(wù)器塊、具有基于閃存的非易失性存儲器的分解的存儲器刀片、跨層的電源管理等等,以及以上的各種組合,可以使得基礎(chǔ)架構(gòu)的各個部分更加高效。在一個實施例中,可以通過軟件策略延長硬件壽命,所述軟件策略例如是自動的磁盤碎片整理,其防止或延遲客戶抱怨的最常見原因之一,等等。
[0154]第九能力涉及自可靠體系背景下的系統(tǒng)可用性和商業(yè)連續(xù)性。注意到,連續(xù)性是另一個因素,因為單個公司進(jìn)行的云計算服務(wù)的管理是單點故障(例如,甚至對不同位置的多個數(shù)據(jù)中心,它們具有共同的軟件基礎(chǔ)架構(gòu)、賬目、和其他共同的元件和能力)。在一個實施例中,支持商業(yè)連續(xù)性策略。在一個這樣的實施例中,商業(yè)連續(xù)性策略可以不僅僅指明數(shù)據(jù)恢復(fù),因為在多數(shù)情況下,數(shù)據(jù)僅僅是真正的商業(yè)連續(xù)性和災(zāi)難恢復(fù)計劃的一個組成。
[0155]盡管獨立地對分開的能力進(jìn)行了初步描述,但是注意到,可以一起使用這樣的能力的各種組合,以提供各種功能。
[0156]圖10描繪了用于為云系統(tǒng)的客戶提供可靠性的方法的一個實施例。注意到,當(dāng)結(jié)合本文描繪和描述的圖1到圖9的相關(guān)部分進(jìn)行考慮時,可以更好地理解方法1000的各個步驟。
[0157]在步驟1010,方法1000開始。
[0158]在步驟1020,接收客戶的DRP。該客戶可以是管理云系統(tǒng)的云提供商的客戶。
[0159]在步驟1030,基于客戶的DRP,確定用于該客戶的云資源的配置。
[0160]在步驟1040,使用確定的云資源的配置,為該客戶配置云資源。
[0161]在步驟1050,監(jiān)視云系統(tǒng)的狀況和/或潛在狀況。
[0162]在步驟1060,確定是否檢測到一個或多個狀況。如果沒有檢測到狀況,那么方法1000返回步驟1050 (也就是,繼續(xù)監(jiān)視云系統(tǒng)的狀況和/或潛在狀況)。如果檢測到狀況,方法1000前進(jìn)到步驟1070。
[0163]在步驟1070,基于檢測到的狀況,啟動一個或多個動作。從步驟1070,方法1000返回到步驟1050 (也就是,繼續(xù)監(jiān)視云系統(tǒng)的狀況和/或潛在狀況)。
[0164]注意到,在云系統(tǒng)中,可靠性僅僅是要考慮的一個組成(例如,要考慮的其他組成包括,性能,安全性,成本,等等)。因此,盡管本文參照云系統(tǒng)的可靠性和可用性方面的考慮進(jìn)行了初步描繪和描述,但是應(yīng)理解,參照改善云系統(tǒng)的可靠性和可用性方面所描繪和描述的各種原則、能力和功能可以擴展,以處理一個或多個這樣的其他考慮(例如,性能,安全性,成本,等等)。
[0165]盡管在云系統(tǒng)的背景下進(jìn)行了初步描繪和描述,注意到,本文描繪和描述的各種能力和功能可以適用于其他環(huán)境。例如,本文在云系統(tǒng)的背景下描繪和描述的各種能力和功能可以適用于機器對機器的環(huán)境,智能計量環(huán)境,等等。
[0166]圖11描繪了適用于執(zhí)行本文描述的功能的計算機的高層級框圖。
[0167]如圖11所描繪,計算機1100包括處理器元件1102 (例如,中央處理單元(CPU)和/或其他適當(dāng)?shù)奶幚砥?以及存儲器1104 (例如,隨機存取存儲器(RAM),只讀存儲器(R0M),等等)。計算機1100還可以包括協(xié)作模塊/過程1105和/或各種輸入/輸出設(shè)備1106(例如,用戶輸入設(shè)備(諸如鍵盤,鍵板,鼠標(biāo),等等),用戶輸出設(shè)備(諸如顯示器,揚聲器,等等),輸入端口,輸出端口,接收器,發(fā)送器,和存儲設(shè)備(例如,磁帶驅(qū)動器,軟盤驅(qū)動器,硬盤驅(qū)動器,光盤驅(qū)動器,等等))。
[0168]可以了解,本文描繪和描述的功能可以用軟件執(zhí)行(例如,通過在一個或多個處理器上執(zhí)行軟件)和/或可以用硬件執(zhí)行(例如,使用通用目的計算機,一個或多個應(yīng)用專用集成電路(ASIC),和/或任何其他硬件等同物)。
[0169]可以了解,本文描繪和描述的功能可以用軟件執(zhí)行(例如,在通用目的計算機上執(zhí)行(例如,經(jīng)由一個或多個處理器的執(zhí)行),以執(zhí)行特殊目的計算機)和/或可以用硬件執(zhí)行(例如,使用一個或多個應(yīng)用專用集成電路(ASIC),和/或任何其他硬件等同物)。
[0170]在一個實施例中,協(xié)作過程1105可以被加載到存儲器1104并由處理器1102執(zhí)行,以執(zhí)行本文討論的功能。因此,協(xié)作過程1105 (包括相關(guān)聯(lián)的數(shù)據(jù)結(jié)構(gòu))可以存儲在計算機可讀的存儲介質(zhì)上,例如,RAM存儲器,磁盤或光盤驅(qū)動器或軟盤,等等。
[0171]應(yīng)理解,圖11描繪的計算機1100提供適用于執(zhí)行本文描述的功能元件和/或本文描述的功能元件的部分的通用體系和功能性。例如,計算機1100提供適用于執(zhí)行本文描述的各種物理資源、模塊、單元、元件、部件等等中的一個或多個的通用體系和功能性。
[0172]可以設(shè)想,本文描述的作為軟件方法的一些步驟可以在硬件中執(zhí)行,例如,作為與處理器協(xié)作來執(zhí)行各種方法步驟的電路。本文所描述的功能/元件的部分可以執(zhí)行為計算機程序產(chǎn)品,其中計算機指令當(dāng)由計算機處理時可調(diào)配計算機的操作,使得本文描述的方法和/或技術(shù)得到調(diào)用或以其他方式提供。調(diào)用發(fā)明性方法的指令可以存儲在固定的或可移除的介質(zhì)中,經(jīng)由廣播或其他信號承載介質(zhì)中的數(shù)據(jù)流傳輸,和/或存儲在根據(jù)指令進(jìn)行操作的計算設(shè)備中的存儲器中。
[0173]權(quán)利要求指明各個實施例的方面。下面編號的條款指明各個實施例的那些和其他方面:
[0174]1.一種裝置,包括:
[0175]處理器和存儲器,所述處理器配置為:
[0176]接收與云提供商的客戶相關(guān)聯(lián)的動態(tài)可靠性概況(DRP),其中所述DRP指明依據(jù)時間和所述客戶的應(yīng)用或服務(wù)的要求兩者的該客戶的可靠性參數(shù);以及
[0177]基于所述客戶的DRP確定用于該客戶的云資源的配置。
[0178]2.如條款I(lǐng)所述的裝置,其中DRP配置為被指明為與客戶相關(guān)聯(lián)的服務(wù)級別協(xié)定(SLA)的一部分。
[0179]3.如條款I(lǐng)所述的裝置,其中所述云資源包括計算資源、內(nèi)存資源、輸入輸出資源、存儲資源和網(wǎng)絡(luò)資源中的至少一個。
[0180]4.如條款I(lǐng)所述的裝置,其中所述處理器配置為通過以下方式基于客戶的DRP確定用于客戶的云資源的配置:
[0181]使用客戶應(yīng)用信息以及與云提供商的云系統(tǒng)相關(guān)聯(lián)的云系統(tǒng)信息,確定用于客戶的虛擬應(yīng)用拓?fù)洌?br> [0182]使用用于客戶的所述虛擬應(yīng)用拓?fù)湟约芭c所述云系統(tǒng)相關(guān)聯(lián)的云系統(tǒng)信息,確定可靠性繪圖;以及
[0183]使用所述可靠性繪圖和與所述云系統(tǒng)相關(guān)聯(lián)的云系統(tǒng)信息,確定云資源的配置。
[0184]5.如條款4所述的裝置,其中所述云系統(tǒng)信息包括,政策信息和約束信息中的至少一個,以及與所述云系統(tǒng)相關(guān)聯(lián)的當(dāng)前系統(tǒng)狀態(tài)信息。
[0185]6.如條款4所述的裝置,其中所述可靠性繪圖表示為可靠性框圖表(RBD),其配置為就應(yīng)用部件的各自可靠性需求以及應(yīng)用部件之間的至少一個關(guān)系而言來表示應(yīng)用的多個應(yīng)用部件。
[0186]7.如條款I(lǐng)所述的裝置,其中所述處理器配置為,在多個時間段的每一個中確定用于客戶的云資源的配置。
[0187]8.如條款I(lǐng)所述的裝置,其中所述處理器還配置為:
[0188]監(jiān)視云資源的行為,用以確定所述DRP中指明的可靠性參數(shù)是否得到滿足。
[0189]9.如條款I(lǐng)所述的裝置,其中所述處理器還配置為:
[0190]計量用以滿足所述DRP中指明的可靠性參數(shù)的所述云資源的行為。
[0191]10.如條款I(lǐng)所述的裝置,其中所述處理器還配置為提供配置引擎,該配置引擎配置為:[0192]處理與所述客戶相關(guān)聯(lián)的DRP,以產(chǎn)生虛擬配置;以及
[0193]將所述虛擬配置提供給調(diào)度引擎,該調(diào)度引擎配置為將虛擬配置映射到云資源。
[0194]11.如條款I(lǐng)所述的裝置,其中所述處理器配置為提供調(diào)度引擎,該調(diào)度引擎配置為:
[0195]接收虛擬配置,該虛擬配置滿足與客戶相關(guān)聯(lián)的DRP ;以及
[0196]將該虛擬配置映射到云資源。
[0197]12.如條款I(lǐng)所述的裝置,其中所述處理器配置為提供監(jiān)視引擎,該監(jiān)視引擎配置為:
[0198]使用所述云系統(tǒng)的云提供商所指明的政策信息和約束信息中的至少一個和與云提供商的云系統(tǒng)相關(guān)聯(lián)的系統(tǒng)狀態(tài)信息,產(chǎn)生可靠性完整性計量和配置用以在控制云系統(tǒng)的云資源時使用的控制信息中的至少一個。
[0199]13.如條款12所述的裝置,其中所述監(jiān)視引擎包括:
[0200]聚合引擎,配置為接收并聚合與所述云系統(tǒng)的物理基礎(chǔ)架構(gòu)相關(guān)聯(lián)的事件;
[0201]關(guān)聯(lián)分析引擎,配置為對聚合的事件進(jìn)行關(guān)聯(lián),以形成與所述云系統(tǒng)相關(guān)聯(lián)的系統(tǒng)狀態(tài)信息;以及
[0202]處理引擎,配置為處理所述云系統(tǒng)的云提供商所指明的政策信息和約束信息中的至少一個和與所述云系統(tǒng)相關(guān)聯(lián)的所述系統(tǒng)狀態(tài)信息,以產(chǎn)生可靠性完整性計量和配置用以在控制云系統(tǒng)的云資源時使用的控制信息中的至少一個。
[0203]14.如條款12所述的裝置,其中所述可靠性完整性計量包括,系統(tǒng)狀態(tài)信息和從系統(tǒng)狀態(tài)信息導(dǎo)出的量度中的至少一個。
[0204]15.如條款12所述的裝置,其中配置用以在控制云系統(tǒng)的云資源時使用的所述控制信息包括以下中的至少一個:配置為對云系統(tǒng)中的至少一個狀況進(jìn)行反應(yīng)的反應(yīng)性控制信息,以及配置為防止至少一個狀況在云系統(tǒng)中發(fā)生的預(yù)測性防止性控制信息。
[0205]16.如條款I(lǐng)所述的裝置,其中所述處理器配置為提供控制引擎,該控制引擎配置為:
[0206]接收控制信息,所述控制信息配置為用以在控制云資源時使用;以及
[0207]使用所述控制信息,產(chǎn)生至少一個反饋動作,該反饋動作配置為修改所述云資源的至少一部分。
[0208]17.如條款I(lǐng)所述的裝置,其中所述處理器配置為支持計算存儲單元(CSU),其中所述CSU包括以下中的至少一個:
[0209]虛擬機,包括虛擬處理器和內(nèi)存資源;
[0210]虛擬存儲卷體,包括虛擬存儲資源;
[0211]虛擬子網(wǎng)絡(luò)接口,配置為支持與至少一個其他S⑶的至少一個安全連接;
[0212]虛擬可靠性/安全性守衛(wèi)(VRSG),配置為執(zhí)行以下中的至少一個:
[0213]管理CSU的元件的恢復(fù);以及
[0214]與至少一個其他CSU交換可靠性、安全性、性能、拓?fù)浜褪录?shù)據(jù)中的至少一個;
[0215]虛擬探針,配置為收集用于CSU的利用率、可靠性、性能和安全性數(shù)據(jù)中的至少一個;
[0216]控制器,配置為管理所述CSU ;以及[0217]CSU說明,包括CSU的多個屬性。
[0218]18.如條款I(lǐng)所述的裝置,其中所述處理器布置在物理主機上,其中所述處理器配置為支持用于物理主機的系統(tǒng)控制單元(S⑶),其中S⑶包括以下中的至少一個:
[0219]主機管理器(HM),配置為執(zhí)行以下中的至少一個:管理所述物理主機上的動作,創(chuàng)建和刪除用于所述物理主機上使用的計算存儲單元(CSU),以及強制進(jìn)行在所述物理主機和至少一個其他物理主機上的CSU之間的安全通信;
[0220]資源管理器(RM),配置為管理所述物理主機上的資源;
[0221]存儲管理器(SM),配置為管理所述物理主機上的存儲;
[0222]物理可靠性/安全性守衛(wèi)(PRSG),配置為監(jiān)視和管理物理主機上的CSU的恢復(fù);以及
[0223]物理探針,配置為收集與所述物理主機相關(guān)聯(lián)的利用率、可靠性、性能和安全性數(shù)據(jù)中的至少一個。
[0224]19.一種計算機可讀存儲介質(zhì),用于存儲指令,所述指令當(dāng)被計算機執(zhí)行時,致使計算機執(zhí)行一種方法,該方法包括:
[0225]接收與云提供商的客戶相關(guān)聯(lián)的動態(tài)可靠性概況(DRP),其中所述DRP指明依據(jù)時間和所述客戶的應(yīng)用或服務(wù)的要求兩者的該客戶的可靠性參數(shù);以及
[0226]基于所述客戶的DRP確定用于該客戶的云資源的配置。
[0227]20.—種方法,包括:
[0228]使用處理器,用以:
[0229]接收與云提供商的客戶相關(guān)聯(lián)的動態(tài)可靠性概況(DRP),其中所述DRP指明依據(jù)時間和所述客戶的應(yīng)用或服務(wù)的要求兩者的該客戶的可靠性參數(shù);以及
[0230]基于所述客戶的DRP確定用于該客戶的云資源的配置。
[0231]盡管本文詳細(xì)示出和描述了并入有本發(fā)明的教導(dǎo)的各種實施例,本領(lǐng)域技術(shù)人員可以容易地設(shè)計出也并入有這些教導(dǎo)的許多其他變形的實施例。
【權(quán)利要求】
1.一種裝置,包括: 處理器和存儲器,所述處理器配置為: 接收與云提供商的客戶相關(guān)聯(lián)的動態(tài)可靠性概況(DRP),其中所述DRP指明依據(jù)時間和所述客戶的應(yīng)用或服務(wù)的要求兩者的該客戶的可靠性參數(shù);以及基于所述客戶的DRP確定用于所述客戶的云資源的配置。
2.如權(quán)利要求1所述的裝置,其中所述處理器配置為通過以下方式基于客戶的DRP確定用于所述客戶的云資源的配置: 使用客戶應(yīng)用信息以及與云提供商的云系統(tǒng)相關(guān)聯(lián)的云系統(tǒng)信息,確定用于所述客戶的虛擬應(yīng)用拓?fù)洌? 使用用于所述客戶的所述虛擬應(yīng)用拓?fù)湟约芭c所述云系統(tǒng)相關(guān)聯(lián)的云系統(tǒng)信息,確定可靠性繪圖;以及 使用所述可靠性繪圖和與所述云系統(tǒng)相關(guān)聯(lián)的云系統(tǒng)信息,確定云資源的配置。
3.如權(quán)利要求1所述的裝置,其中所述處理器配置為,在多個時間段的每一個中確定用于所述客戶的云資源的配置。
4.如權(quán)利要求1所述的裝置,其中所述處理器還配置為: 監(jiān)視云資源的行為,用以確定所述DRP中指明的可靠性參數(shù)是否得到滿足; 計量用以滿足所述DRP中指明的可靠性參數(shù)的所述云資源的行為。
5.如權(quán)利要求1所述的裝置,其中所述處理器配置為提供配置引擎,該配置引擎配置為: 處理與所述客戶相關(guān)聯(lián)的DRP,以產(chǎn)生虛擬配置;以及 將所述虛擬配置提供給調(diào)度引擎,該調(diào)度引擎配置為將所述虛擬配置映射到云資源。
6.如權(quán)利要求1所述的裝置,其中所述處理器配置為提供調(diào)度引擎,該調(diào)度引擎配置為: 接收虛擬配置,該虛擬配置滿足與所述客戶相關(guān)聯(lián)的DRP ;以及 將該虛擬配置映射到云資源。
7.如權(quán)利要求1所述的裝置,其中所述處理器配置為提供監(jiān)視引擎,該監(jiān)視引擎配置為: 使用所述云系統(tǒng)的云提供商所指明的政策信息和約束信息中的至少一個和與云提供商的云系統(tǒng)相關(guān)聯(lián)的系統(tǒng)狀態(tài)信息,產(chǎn)生可靠性完整性計量和被配置用以在控制所述云系統(tǒng)的云資源時使用的控制信息中的至少一個。
8.如權(quán)利要求1所述的裝置,其中所述處理器配置為提供控制引擎,該控制引擎配置為: 接收控制信息,所述控制信息配置為用以在控制所述云資源時使用;以及使用所述控制信息,產(chǎn)生至少一個反饋動作,該反饋動作配置為修改所述云資源的至少一部分。
9.一種計算機可讀存儲介質(zhì),用于存儲指令,所述指令當(dāng)被計算機執(zhí)行時,致使計算機執(zhí)行一種方法,該方法包括: 接收與云提供商的客戶相關(guān)聯(lián)的動態(tài)可靠性概況(DRP),其中所述DRP指明依據(jù)時間和所述客戶的應(yīng)用或服務(wù)的要求兩者的該客戶的可靠性參數(shù);以及基于所述客戶的DRP確定用于所述客戶的云資源的配置。
10.一種方法,包括: 使用處理器,用以: 接收與云提供商的客戶相關(guān)聯(lián)的動態(tài)可靠性概況(DRP),其中所述DRP指明依據(jù)時間和所述客戶的應(yīng)用或服務(wù)的要求兩者的該客戶的可靠性參數(shù);以及基于所述客戶的DRP確定用于所`述客戶的云資源的配置。
【文檔編號】H04L12/24GK103875210SQ201280050376
【公開日】2014年6月18日 申請日期:2012年10月1日 優(yōu)先權(quán)日:2011年10月14日
【發(fā)明者】A·阿薩那, M·S·班諾威茨, U·錢德拉謝卡爾 申請人:阿爾卡特朗訊公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1