需要指出的 是,由于計(jì)算節(jié)點(diǎn)的運(yùn)行狀態(tài)變化十分頻繁,故接收模塊110接收的這組向量中,每個(gè)向量 元素表示的均為對(duì)應(yīng)時(shí)間點(diǎn)向前回溯一段時(shí)間,如1小時(shí),內(nèi)的平均值,如接收模塊110接 收的節(jié)點(diǎn)N在當(dāng)前時(shí)間點(diǎn)的CPU使用率為76. 5%,表示節(jié)點(diǎn)N在當(dāng)前時(shí)間點(diǎn)向前回溯一段 時(shí)間,如1小時(shí),內(nèi)的平均CPU使用率為76. 5%。
[0153] 數(shù)據(jù)模塊120 :存儲(chǔ)由接收模塊接收的計(jì)算節(jié)點(diǎn)運(yùn)行狀態(tài)歷史數(shù)據(jù)和運(yùn)行狀態(tài)實(shí) 時(shí)數(shù)據(jù),以及裝置提取的節(jié)點(diǎn)失效特征和節(jié)點(diǎn)實(shí)時(shí)特征;包括節(jié)點(diǎn)運(yùn)行狀態(tài)數(shù)據(jù)存儲(chǔ)單元 121,存儲(chǔ)接收模塊接收的計(jì)算節(jié)點(diǎn)運(yùn)行狀態(tài)歷史數(shù)據(jù)和運(yùn)行狀態(tài)實(shí)時(shí)數(shù)據(jù);節(jié)點(diǎn)失效特征 存儲(chǔ)單元122,存儲(chǔ)裝置提取的節(jié)點(diǎn)失效特征;節(jié)點(diǎn)實(shí)時(shí)特征存儲(chǔ)單元123,存儲(chǔ)裝置提取 的節(jié)點(diǎn)實(shí)時(shí)特征。
[0154] 特征提取模塊130 :執(zhí)行云計(jì)算節(jié)點(diǎn)失效特征提取過(guò)程,和云計(jì)算節(jié)點(diǎn)實(shí)時(shí)特征 提取過(guò)程,并將提取的特征分別存入數(shù)據(jù)模塊中的節(jié)點(diǎn)失效特征存儲(chǔ)單元122,和節(jié)點(diǎn)實(shí) 時(shí)特征存儲(chǔ)單元123 ;包括:初始化單元131,初始化云計(jì)算節(jié)點(diǎn)失效特征提取過(guò)程,和云計(jì) 算節(jié)點(diǎn)實(shí)時(shí)特征提取過(guò)程中涉及的相關(guān)參數(shù);提取單元132,根據(jù)數(shù)據(jù)模塊中,節(jié)點(diǎn)運(yùn)行狀 態(tài)數(shù)據(jù)存儲(chǔ)單元121,存儲(chǔ)接收模塊接收的計(jì)算節(jié)點(diǎn)運(yùn)行狀態(tài)歷史數(shù)據(jù),和運(yùn)行狀態(tài)實(shí)時(shí)數(shù) 據(jù),分別提取云計(jì)算節(jié)點(diǎn)失效特征,和云計(jì)算節(jié)點(diǎn)實(shí)時(shí)特征;輸出單元13 3,將提取單元提 取的云計(jì)算節(jié)點(diǎn)失效特征,和云計(jì)算節(jié)點(diǎn)實(shí)時(shí)特征,分別存儲(chǔ)至數(shù)據(jù)模塊中的節(jié)點(diǎn)失效特 征存儲(chǔ)單元122,和節(jié)點(diǎn)實(shí)時(shí)特征存儲(chǔ)單元123。
[0155] 節(jié)點(diǎn)失效預(yù)警模塊140 :執(zhí)行云計(jì)算節(jié)點(diǎn)失效預(yù)警過(guò)程,輸出有可能失效的云計(jì) 算節(jié)點(diǎn)序號(hào)列表。
[0156] 本裝置可部署于一個(gè)現(xiàn)有的服務(wù)器中,也可部署于一個(gè)單獨(dú)設(shè)置的、專用于進(jìn)行 云計(jì)算節(jié)點(diǎn)失效預(yù)警的服務(wù)器中。
[0157] 如圖2所示為云計(jì)算節(jié)點(diǎn)失效特征提取過(guò)程。云計(jì)算節(jié)點(diǎn)失效特征提取過(guò)程包 括:
[0158] (1)裝置接收服務(wù)器提取云計(jì)算節(jié)點(diǎn)失效特征的指令;
[0159] (2)裝置初始化相關(guān)參數(shù);
[0160] (3)裝置對(duì)節(jié)點(diǎn)運(yùn)行狀態(tài)屬性a對(duì)應(yīng)的運(yùn)行狀態(tài)歷史矩陣Ra,關(guān)于其對(duì)應(yīng)的節(jié)點(diǎn) 特征矩陣Da和時(shí)間特征矩陣E a,構(gòu)造訓(xùn)練目標(biāo)函數(shù)Fa。
[0161] (4)裝置判斷提取迭代控制變量k已達(dá)到上限K。
[0162] ⑶裝置判斷F,E 3和D 3收斂。
[0163] (6)裝置關(guān)于EJP D 3對(duì)F 3進(jìn)行迭代優(yōu)化。
[0164] (7)裝置判斷已處理完所有的節(jié)點(diǎn)運(yùn)行狀態(tài)屬性。
[0165] (8)對(duì)于所有云計(jì)算節(jié)點(diǎn)1~N,對(duì)其運(yùn)行狀態(tài)屬性1~A,在時(shí)間點(diǎn)1~T,根據(jù) 節(jié)點(diǎn)失效歷史記錄矩陣Y,和提取的節(jié)點(diǎn)特征矩陣Di~D A和時(shí)間特征矩陣E E A,構(gòu)造并 輸出所有失效節(jié)點(diǎn)實(shí)例的特征,存入數(shù)據(jù)模塊中的節(jié)點(diǎn)失效特征存儲(chǔ)單元122。
[0166] 如圖3所示為云計(jì)算節(jié)點(diǎn)實(shí)時(shí)特征提取過(guò)程。云計(jì)算節(jié)點(diǎn)實(shí)時(shí)特征提取過(guò)程包 括:
[0167] (1)裝置接收服務(wù)器提取云計(jì)算節(jié)點(diǎn)實(shí)時(shí)特征的指令;
[0168] (2)裝置結(jié)合云計(jì)算節(jié)點(diǎn)實(shí)時(shí)運(yùn)行狀態(tài)向量組{Bp B2,…,BJ,和云計(jì)算節(jié)點(diǎn)歷史 運(yùn)行狀態(tài)矩陣組{&,R2,…,RA},構(gòu)造云計(jì)算節(jié)點(diǎn)最近窗口運(yùn)行狀態(tài)矩陣IA,C 2,…,CA}
[0169] (3)裝置初始化相關(guān)參數(shù);
[0170] (4)對(duì)節(jié)點(diǎn)運(yùn)行狀態(tài)屬性a對(duì)應(yīng)的最近窗口運(yùn)行狀態(tài)矩陣Ca,關(guān)于其對(duì)應(yīng)的節(jié)點(diǎn) 特征矩陣Da和時(shí)間特征矩陣E a,構(gòu)造訓(xùn)練目標(biāo)函數(shù)Fa;
[0171] (5)裝置判斷提取迭代控制變量k已達(dá)到上限K。
[0172] ⑶裝置判斷F,E 3和D 3收斂。
[0173] (7)裝置關(guān)于EJP D 3對(duì)F 3進(jìn)行迭代優(yōu)化。
[0174] (8)裝置判斷已處理完所有的節(jié)點(diǎn)運(yùn)行狀態(tài)屬性。
[0175] (9)對(duì)于所有云計(jì)算節(jié)點(diǎn)1~N,對(duì)其運(yùn)行狀態(tài)屬性1~A,構(gòu)造并輸出其運(yùn)行狀態(tài) 實(shí)時(shí)特征,數(shù)據(jù)模塊中的節(jié)點(diǎn)實(shí)時(shí)特征存儲(chǔ)單元123。
[0176] 如圖4所示為云計(jì)算節(jié)點(diǎn)失效預(yù)警過(guò)程。云計(jì)算節(jié)點(diǎn)失效預(yù)警過(guò)程包括:
[0177] (1)裝置接收服務(wù)器進(jìn)行云計(jì)算節(jié)點(diǎn)失效預(yù)警的指令;
[0178] (2)裝置從節(jié)點(diǎn)失效特征存儲(chǔ)單元122取出節(jié)點(diǎn)失效特征;
[0179] (3)裝置從節(jié)點(diǎn)實(shí)時(shí)特征存儲(chǔ)單元123中取出節(jié)點(diǎn)實(shí)時(shí)特征;
[0180] (4)裝置對(duì)節(jié)點(diǎn)1~N,根據(jù)其節(jié)點(diǎn)失效特征和節(jié)點(diǎn)實(shí)時(shí)特征,判斷其當(dāng)前時(shí)刻是 否會(huì)失效;
[0181] (5)裝置將可能失效的云計(jì)算節(jié)點(diǎn)序號(hào)列表輸出,作為預(yù)警判斷結(jié)果;
[0182] 本發(fā)明專門作用于計(jì)算節(jié)點(diǎn)運(yùn)行狀態(tài)歷史數(shù)據(jù),能夠進(jìn)行符合統(tǒng)計(jì)規(guī)律、準(zhǔn)確度 高、復(fù)雜度低的一種云計(jì)算節(jié)點(diǎn)失效預(yù)警。下面,對(duì)本發(fā)明所提供的一種云計(jì)算節(jié)點(diǎn)失效預(yù) 警裝置和方法進(jìn)行詳細(xì)說(shuō)明。
[0183] 圖2為本發(fā)明實(shí)施例中云計(jì)算節(jié)點(diǎn)失效特征提取流程示意圖。參見(jiàn)圖2,該過(guò)程包 括:
[0184] 步驟201 :裝置接收服務(wù)器提取云計(jì)算節(jié)點(diǎn)失效特征的指令。
[0185] 本步驟中,服務(wù)器向裝置發(fā)送指令的方式為:定期、或根據(jù)所述裝置的通知、或根 據(jù)某服務(wù)器的通知,將要求從云計(jì)算節(jié)點(diǎn)運(yùn)行狀態(tài)歷史數(shù)據(jù)中提取云計(jì)算節(jié)點(diǎn)失效特征的 指令發(fā)送給裝置。
[0186] 步驟202 :裝置初始化相關(guān)參數(shù)。
[0187] 本步驟中,裝置需要初始化的參數(shù)包括:特征空間維數(shù)D、節(jié)點(diǎn)特征矩陣組 他,D2,…,DJ、時(shí)間特征矩陣組取,E2,…,EJ、提取迭代控制變量k、提取迭代上限K和收 斂判定閾值γ。其中:
[0188] 特征空間維數(shù)D :是控制需要提取的特征的維數(shù)的變量,初始化為正整數(shù),如20。
[0189] 節(jié)點(diǎn)特征矩陣組{Di,D2,…,DJ :對(duì)應(yīng)節(jié)點(diǎn)運(yùn)行狀態(tài)屬性{1,2,…,Α},根據(jù)云計(jì)算 節(jié)點(diǎn)個(gè)數(shù)N和特征空間維數(shù)D,建立的A個(gè)N行,D列的矩陣,其中每個(gè)元素初始化為為開(kāi)區(qū) 間(〇,〇· 1)內(nèi)的隨機(jī)數(shù)。
[0190] 時(shí)間特征矩陣組{Ei,E2,…,EJ :對(duì)應(yīng)節(jié)點(diǎn)運(yùn)行狀態(tài)屬性{1,2,…,A},根據(jù)云計(jì)算 節(jié)點(diǎn)運(yùn)行狀態(tài)歷史數(shù)據(jù)涉及的時(shí)間節(jié)點(diǎn)數(shù)T和特征空間維數(shù)D,建立的A個(gè)T行,D列的矩 陣,其中每個(gè)元素初始化為為開(kāi)區(qū)間(〇, 0.1)內(nèi)的隨機(jī)數(shù)。
[0191] 提取迭代控制變量k :控制提取迭代過(guò)程的變量,初始化為0。
[0192] 提取迭代上限K:控制提取迭代過(guò)程中,迭代次數(shù)上限的變量,初始化為正整數(shù), 如 100〇
[0193] 收斂判定閾值γ :判斷提取迭代過(guò)程是否已收斂的閾值參數(shù),初始化為極小正 數(shù),如0.01。
[0194] 步驟203 :對(duì)節(jié)點(diǎn)運(yùn)行狀態(tài)屬性a對(duì)應(yīng)的運(yùn)行狀態(tài)歷史矩陣Ra,關(guān)于其對(duì)應(yīng)的節(jié)點(diǎn) 特征矩陣Da和時(shí)間特征矩陣E a,構(gòu)造訓(xùn)練目標(biāo)函數(shù)Fa。
[0195] 本步驟中,訓(xùn)練目標(biāo)函數(shù)?3以下式表示:
[0197] 其中
表示計(jì)算矩陣RjPDaEa T間的歐式距離的平方。該目標(biāo)函數(shù)的物 理意義為,使用歐式距離衡量矩陣&和D j/間的差異,并通過(guò)優(yōu)化方法使該差異最小化。
[0198] 步驟204 :裝置判斷提取迭代控制變量k已達(dá)到上限K。
[0199] 本步驟中,裝置首先在提取迭代控制變量k上累加1,然后判斷提取迭代控制變量 k是否大于提取迭代上限N。
[0200] 步驟205 :裝置判斷F,E 3和D 3收斂。
[0201 ] 本步驟中,裝置判斷FJi E 3和D a收斂為,本輪迭代開(kāi)始前,F(xiàn) a的數(shù)值,對(duì)比上輪迭 代開(kāi)始前,F(xiàn)a的數(shù)值,其差的絕對(duì)值是否小于收斂判定閾值γ ;如果小于,則判定為已收斂, 反之,則判定為未收斂。
[0202] 步驟206 :裝置關(guān)于E,D 3對(duì)F 行迭代優(yōu)化。
[0203] 本步驟中,關(guān)于EJP D 3對(duì)F a進(jìn)行迭代優(yōu)化,迭代優(yōu)化的計(jì)算公式如下:
[0206] 其中D+k)表示矩陣D a的第N行,第k列的元素;E aak)表示矩陣E a的第T行,第 k列的元素;1?表示矩陣DJ]轉(zhuǎn)置; < 表示矩陣Ea的轉(zhuǎn)置。其物理含義為,使用非負(fù)矩陣 因式分解的非負(fù)參數(shù)乘積更新方法,在Fa上對(duì)E 3和D a相對(duì)于Ra進(jìn)行迭代優(yōu)化。
[0207] 步驟207 :裝置判斷已處理完所有的節(jié)點(diǎn)運(yùn)行狀態(tài)屬性。
[0208] 本步驟中,裝置判斷當(dāng)前處理的節(jié)點(diǎn)運(yùn)行狀態(tài)屬性a是否是所有待處理節(jié)點(diǎn)運(yùn)行 狀態(tài)屬性{1,2,···,A}的最后一個(gè)屬性,如果是,則判定已處理完所有屬性,反之,則判定還 未處理完所有屬性。
[0209] 步驟208 :對(duì)于所有云計(jì)算節(jié)點(diǎn)1~N,對(duì)其運(yùn)行狀態(tài)屬性1~A,在時(shí)間點(diǎn)1~T, 根據(jù)節(jié)點(diǎn)失效歷史記錄矩陣Y,和提取的節(jié)點(diǎn)特征矩陣Di~D A和時(shí)間特征矩陣E E A,構(gòu) 造并輸出所有失效節(jié)點(diǎn)實(shí)例的特征,存入數(shù)據(jù)模塊中的節(jié)點(diǎn)失效特征存儲(chǔ)單元122。
[0210] 本步驟中,裝置構(gòu)造節(jié)點(diǎn)失效特征的方法為:
[0211] 遍歷節(jié)點(diǎn)失效歷史記錄矩陣Y,如果節(jié)點(diǎn)N在時(shí)間點(diǎn)T上被標(biāo)記為失效,即Υ(ΝιΤ) = 1,則從節(jié)點(diǎn)特征矩陣組{Dp D2,…,DA}的每個(gè)矩陣中提取第N行,即對(duì)應(yīng)于節(jié)點(diǎn)N的特征向 量,總共提取A個(gè)向量,構(gòu)造一個(gè)A行,D列的節(jié)點(diǎn)特征矩陣J ;
[0212] 同時(shí),從時(shí)間特征矩陣組{Ei,E2,…,EA}中,提取第T行,即對(duì)應(yīng)于時(shí)刻T的特征向 量,總共提取A個(gè)向量,構(gòu)造一個(gè)A行,D列的時(shí)刻特征矩陣S ;
[0213] 然后,將J和S按列進(jìn)行合并,構(gòu)造節(jié)點(diǎn)N在時(shí)刻T的失效特征矩陣L,如下式所示
[0214] L(n, t) = {J S}
[0215] 其物理意義為,根據(jù)云計(jì)算系統(tǒng)中節(jié)點(diǎn)1~N,時(shí)刻1~T的歷史運(yùn)行狀態(tài)整體數(shù) 據(jù)對(duì)各節(jié)點(diǎn)和各時(shí)刻的特征進(jìn)行建模,并使用符合統(tǒng)計(jì)規(guī)律的優(yōu)化方法進(jìn)行特征提取,最 后用該特征描述特定節(jié)點(diǎn)在特定時(shí)刻的失效狀態(tài)。
[0216] 最后,裝置將構(gòu)造完成的節(jié)點(diǎn)失效特征存入數(shù)據(jù)模塊中的節(jié)點(diǎn)失效特征存儲(chǔ)單元 122〇
[0217] 圖3為本發(fā)明實(shí)施例中,云計(jì)算節(jié)點(diǎn)實(shí)時(shí)特征提取過(guò)程示意圖。該過(guò)程包括:
[0218] 步驟301 :裝置接收服務(wù)器提取云計(jì)算節(jié)點(diǎn)實(shí)時(shí)特征的指令;
[0219] 本步驟中,服務(wù)器向裝置發(fā)送指令的方式為:定期、或根據(jù)所述裝置的通知、或根 據(jù)某服務(wù)器的通知,將要求從云計(jì)算節(jié)點(diǎn)運(yùn)行狀態(tài)實(shí)時(shí)數(shù)據(jù)中提取云計(jì)算節(jié)點(diǎn)失效特征的 指令發(fā)送給裝置。
[0220] 步驟302 :裝置結(jié)合云計(jì)算節(jié)點(diǎn)實(shí)時(shí)運(yùn)行狀態(tài)向量組{Bi,B2,…,ΒΑ},和云計(jì)算節(jié) 點(diǎn)歷史運(yùn)行狀態(tài)矩陣組{RuRd ···,&},構(gòu)造云計(jì)算節(jié)點(diǎn)最近窗口運(yùn)行狀態(tài)矩陣ΙΑ,Ο;,… ,CA}
[0221] 本步驟中,裝置結(jié)合云計(jì)算節(jié)點(diǎn)實(shí)時(shí)運(yùn)行狀態(tài)向量組{Bi,B2,…,BJ,和云計(jì)算節(jié) 點(diǎn)歷史運(yùn)行狀態(tài)矩陣組{&,R2,…,RJ,構(gòu)造云計(jì)算節(jié)點(diǎn)最近窗口運(yùn)行狀態(tài)矩陣組IA, C2,… ,cA}是:
[0222] 將云計(jì)算節(jié)點(diǎn)歷史運(yùn)行狀態(tài)矩陣組{&,R2,…,RJ和云計(jì)算節(jié)點(diǎn)實(shí)時(shí)運(yùn)行狀態(tài)向 量組ΙΛ,B2,…,BA}按列進(jìn)行合并,以下式表示:
[0224] 其中,BaT表示云計(jì)算節(jié)點(diǎn)實(shí)時(shí)運(yùn)行狀態(tài)向量Ba轉(zhuǎn)置而成的N行,1列的矩陣。其物 理意義為,將當(dāng)前的云計(jì)算節(jié)點(diǎn)實(shí)時(shí)運(yùn)行狀態(tài)向量組,結(jié)合云計(jì)算節(jié)點(diǎn)歷史 運(yùn)行狀態(tài)矩陣組{&,R2,…,RA},構(gòu)造云計(jì)算節(jié)點(diǎn)最近窗口運(yùn)行狀態(tài)矩陣組IA, C2,…,CJ。
[0225] 步驟303 :裝置初始化相關(guān)參數(shù);
[0226] 本步驟中,裝置需要初始化的參數(shù)包括:特