例中,設(shè)計(jì)了啟發(fā)式數(shù)據(jù)部署算法,在多項(xiàng)式時(shí)間復(fù)雜度下求得 較優(yōu)的部署策略。所設(shè)計(jì)的算法分兩個(gè)階段:首先結(jié)合大規(guī)模云數(shù)據(jù)間的關(guān)聯(lián)關(guān)系和數(shù)據(jù) 中心的存儲(chǔ)空間信息,對(duì)云數(shù)據(jù)進(jìn)行限定規(guī)模的聚類劃分,將關(guān)聯(lián)緊密的云數(shù)據(jù)劃分到相 同數(shù)據(jù)子集;然后在數(shù)據(jù)放置階段,結(jié)合數(shù)據(jù)集間傳輸量大小和數(shù)據(jù)中心間彼此的帶寬資 源,決定數(shù)據(jù)集部署位置;具體如下
[0053] 依據(jù)數(shù)據(jù)間關(guān)聯(lián)依賴關(guān)系的強(qiáng)弱對(duì)其進(jìn)行劃分,使關(guān)聯(lián)強(qiáng)的數(shù)據(jù)被劃分到相同數(shù) 據(jù)子集并部署到同一數(shù)據(jù)中心上。但數(shù)據(jù)中心存儲(chǔ)空間有限,當(dāng)對(duì)數(shù)據(jù)劃分時(shí)須考慮數(shù)據(jù) 子集規(guī)模是否超出單個(gè)數(shù)據(jù)中心的最大存儲(chǔ)能力。因此先根據(jù)數(shù)據(jù)中心存儲(chǔ)空間大小對(duì)其 進(jìn)行降序排序。在該排序基礎(chǔ)上,限定規(guī)模的數(shù)據(jù)劃分算法流程如下。首先對(duì)有固定部署 限制的數(shù)據(jù),根據(jù)其部署數(shù)據(jù)中心的存儲(chǔ)能力決定相應(yīng)的數(shù)據(jù)子集規(guī)模;根據(jù)關(guān)聯(lián)緊密程 度和數(shù)據(jù)大小,從須固定部署到相同位置的數(shù)據(jù)集合和無部署位置限制的數(shù)據(jù)集合中選取 該數(shù)據(jù)子集的成員。重復(fù)上述過程直至固定部署需求集合中的全部數(shù)據(jù)被劃分完畢。其次 對(duì)于無部署位置限制的數(shù)據(jù),根據(jù)當(dāng)前單個(gè)數(shù)據(jù)中心的最大存儲(chǔ)能力決定部署到該數(shù)據(jù)中 心的數(shù)據(jù)子集規(guī)模;并根據(jù)數(shù)據(jù)間的關(guān)聯(lián)緊密程度和數(shù)據(jù)大小,從數(shù)據(jù)集合中選取該數(shù)據(jù) 子集的成員。重復(fù)上述過程直至無位置限制集合中的全部數(shù)據(jù)被劃分完畢。至此,全部數(shù) 據(jù)均被劃分到對(duì)應(yīng)的數(shù)據(jù)子集中。具體算法如下:
[0054] 輸入:計(jì)算任務(wù)集合R,數(shù)據(jù)集合D,數(shù)據(jù)中心集合V
[0055] 輸出:云數(shù)據(jù)劃分子集的集合P= {Pi,P2, ···}根據(jù)數(shù)據(jù)中心存儲(chǔ)空間大小降序排 列,得到VSOTt;
[0056] FOR(Dflx 中每個(gè)數(shù)據(jù)dflx)
[0057] intsubSetSize=C(1 (dfix)) $設(shè)為空;
[0058] GetPartition(R,D,Ρ?;subSetSize,fix-DataList);
[0059] P=PUP1;D=D-P1;
[0060] F0R(VSC]rt中每個(gè)數(shù)據(jù)中心vJ
[0061] intsubSetSize=C(vj七設(shè)為空;
[0062] GetPartition(R,D,Ρ?;subSetSize,null);
[0063] P=PUP1;D=D-P1;
[0064] IF(D==null)BREAK;
[0065] EXIT.
[0066] 過程GetPartition(R,D,Pi,subSetSize,fix-DataList)參數(shù):計(jì)算任務(wù)集合R, 數(shù)據(jù)集合D,待劃分子集Pi,子集規(guī)模subSetSize,已確定元素列表fix-DataList。
[0067] 輸出:劃分完成后的子集
[0068] P!={fixDataList}
[0069] WHILE(s(Pj〈subSetSize)
[0070] Pi=PiU{randomElement(D)};
[0071] P2=D_PnPunid=P「{fixDataList};
[0072] FOR(Punid 中每個(gè)數(shù)據(jù)dpl)
[0073] 計(jì)算PJPP2間的傳輸量T';
[0074] IF(Tr <T)
[0075] 交換dpl和dp2;Punid=Pumd_ {dp2};BREAK;
[0076] ELSE
[0077] 繼續(xù)嘗試交換P2中新的數(shù)據(jù);
[0078] IF(循環(huán)中未交換任何元素)Punid=Pumd_{dpl};
[0079] IF(Pumd==null)BREAK;
[0080] EXIT.
[0081] 以上的所述乃是本發(fā)明的具體實(shí)施例及所運(yùn)用的技術(shù)原理,若依本發(fā)明的構(gòu)想所 作的改變,其所產(chǎn)生的功能作用仍未超出說明書所涵蓋的精神時(shí),仍應(yīng)屬本發(fā)明的保護(hù)范 圍。
【主權(quán)項(xiàng)】
1. 一種跨數(shù)據(jù)中心的關(guān)聯(lián)云數(shù)據(jù)部署方法,其特征在于包括如下步驟:(1)基于云數(shù) 據(jù)間的關(guān)聯(lián)關(guān)系與數(shù)據(jù)中心的存儲(chǔ)空間信息對(duì)云數(shù)據(jù)進(jìn)行聚類劃分,得到數(shù)據(jù)子集; (2)結(jié)合數(shù)據(jù)子集之間的傳輸量大小和數(shù)據(jù)中心間的帶寬資源,完成數(shù)據(jù)子集的部署。2. 根據(jù)權(quán)利要求1所述的一種跨數(shù)據(jù)中心的關(guān)聯(lián)云數(shù)據(jù)部署方法,其特征在于:所述 步驟(1)采用限定規(guī)模的云數(shù)據(jù)劃分算法完成聚類劃分,得到數(shù)據(jù)集,步驟如下: (a) 依據(jù)云數(shù)據(jù)間關(guān)聯(lián)依賴關(guān)系的強(qiáng)弱,將云數(shù)據(jù)劃分成若干數(shù)據(jù)子集,并部署到同一 數(shù)據(jù)中心上; (b) 根據(jù)數(shù)據(jù)中心的存儲(chǔ)空間大小對(duì)其進(jìn)行降序排序; (c) 在該排序基礎(chǔ)上,對(duì)有固定部署限制的數(shù)據(jù),根據(jù)其部署數(shù)據(jù)中心的存儲(chǔ)能力決定 相應(yīng)的數(shù)據(jù)子集規(guī)模;根據(jù)關(guān)聯(lián)緊密程度和數(shù)據(jù)大小,從固定部署到相同位置的數(shù)據(jù)集合 和無部署位置限制的數(shù)據(jù)集合中選取該數(shù)據(jù)子集的成員; (d) 重復(fù)執(zhí)行步驟(c)直至固定部署需求集合中的全部數(shù)據(jù)被劃分完畢; (e) 對(duì)于無部署位置限制的數(shù)據(jù),根據(jù)當(dāng)前單個(gè)數(shù)據(jù)中心的最大存儲(chǔ)能力決定部署到 該數(shù)據(jù)中心的數(shù)據(jù)子集規(guī)模;并根據(jù)數(shù)據(jù)間的關(guān)聯(lián)緊密程度和數(shù)據(jù)大小,從數(shù)據(jù)集合中選 取該數(shù)據(jù)子集的成員; (f) 重復(fù)執(zhí)行步驟(e)直至無位置限制集合中的全部數(shù)據(jù)被劃分完畢;至此,全部數(shù)據(jù) 均被劃分到對(duì)應(yīng)的數(shù)據(jù)子集中。3. 根據(jù)權(quán)利要求1所述的一種跨數(shù)據(jù)中心的關(guān)聯(lián)云數(shù)據(jù)部署方法,其特征在于:所述 步驟(2)完成數(shù)據(jù)集的部署的步驟如下: (i) 當(dāng)數(shù)據(jù)子集有固定部署要求時(shí),將該數(shù)據(jù)子集部署到其要求的數(shù)據(jù)中心上; (ii) 當(dāng)數(shù)據(jù)子集沒有固定部署要求時(shí),且數(shù)據(jù)子集面對(duì)多個(gè)滿足約束條件的數(shù)據(jù)中心 時(shí),則對(duì)數(shù)據(jù)中心的網(wǎng)絡(luò)帶寬資源進(jìn)行排序比較,將數(shù)據(jù)子集部署到帶寬資源充足的數(shù)據(jù) 中心上。4. 根據(jù)權(quán)利要求3所述的一種跨數(shù)據(jù)中心的關(guān)聯(lián)云數(shù)據(jù)部署方法,其特征在于:所述 數(shù)據(jù)中心的網(wǎng)絡(luò)帶寬資源的大小是基于圖論中節(jié)點(diǎn)度的概念,將每個(gè)數(shù)據(jù)中心與其他數(shù)據(jù) 中心間的通信帶寬資源量相加得到。5. 根據(jù)權(quán)利要求2所述的一種跨數(shù)據(jù)中心的關(guān)聯(lián)云數(shù)據(jù)部署方法,其特征在于:所述 固定部署限制的數(shù)據(jù)與無部署位置限制的數(shù)據(jù)的定義如下:設(shè)D = W1, d2, ...,dj為全部 數(shù)據(jù)組成的集合,將數(shù)據(jù)集分為固定數(shù)據(jù)集DflJP非固定數(shù)據(jù)集D unflx,其中:Dflx*的數(shù)據(jù) 必須部署到固定的數(shù)據(jù)中心;而Dunflx中的數(shù)據(jù)則對(duì)其部署數(shù)據(jù)中心沒有限制;D中每個(gè)數(shù) 據(jù)由一個(gè)三元組(I i= < s, 1,f >表示,其中=S(Cli)表示數(shù)據(jù)山的大小;Udi)表示數(shù)據(jù)所 部署的數(shù)據(jù)中心;f(di)為true則表示(I i是固定數(shù)據(jù);反之,fd)為false則表示(Ii是非 固定數(shù)據(jù)。6. 根據(jù)權(quán)利要求3所述的一種跨數(shù)據(jù)中心的關(guān)聯(lián)云數(shù)據(jù)部署方法,其特征在于:所述 得到約束條件的過程如下: (A) 設(shè)定各數(shù)據(jù)中心存儲(chǔ)空間信息為C,帶寬信息為B,數(shù)據(jù)密集型計(jì)算任務(wù)請求集合 為R,執(zhí)行任務(wù)請求時(shí)所需的數(shù)據(jù)集D1; (B) 對(duì)于跨數(shù)據(jù)中心的云數(shù)據(jù)部署問題引入三個(gè)離散變量進(jìn)行建模,三個(gè)離散變量的 定義如下:(C)得到模型表達(dá)式為基于模型表達(dá)式得到約束條件。7. 根據(jù)權(quán)利要求3或6所述的一種跨數(shù)據(jù)中心的關(guān)聯(lián)云數(shù)據(jù)部署方法,其特征在于: 所述的約束條件包括6個(gè),如下所示:8. 根據(jù)權(quán)利要求6所述的一種跨數(shù)據(jù)中心的關(guān)聯(lián)云數(shù)據(jù)部署方法,其特征在于:所述 步驟(A)的數(shù)據(jù)密集型計(jì)算任務(wù)請求集合為R = Ir1, r2,. . .,rk},其中對(duì)于!TiG R,則有D ; =Wil, di2, . . . },用于表示計(jì)算任務(wù)請求!Ti執(zhí)行時(shí)所需數(shù)據(jù)的集合。
【專利摘要】本發(fā)明涉及一種跨數(shù)據(jù)中心的關(guān)聯(lián)云數(shù)據(jù)部署方法,首先結(jié)合大規(guī)模云數(shù)據(jù)間的關(guān)聯(lián)關(guān)系和數(shù)據(jù)中心的存儲(chǔ)空間信息,對(duì)云數(shù)據(jù)進(jìn)行限定規(guī)模的聚類劃分,將關(guān)聯(lián)緊密的云數(shù)據(jù)劃分到相同數(shù)據(jù)子集;然后在數(shù)據(jù)放置階段,結(jié)合數(shù)據(jù)集間傳輸量大小和數(shù)據(jù)中心間彼此的帶寬資源,決定數(shù)據(jù)集部署位置。有益效果在于:(1)本方法解決了跨數(shù)據(jù)中心的數(shù)據(jù)傳輸影響計(jì)算任務(wù)執(zhí)行的難題;(2)本方法在滿足數(shù)據(jù)中心存儲(chǔ)能力約束的前提下,將依賴度高的數(shù)據(jù)盡可能部署到相同或彼此間網(wǎng)絡(luò)帶寬資源充沛的數(shù)據(jù)中心上。
【IPC分類】H04L29/08
【公開號(hào)】CN105357257
【申請?zhí)枴緾N201510628675
【發(fā)明人】周天和, 盧曉飛, 蔡榮, 張?jiān)? 徐赟
【申請人】杭州天寬科技有限公司
【公開日】2016年2月24日
【申請日】2015年9月29日