專利名稱:一種基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于云計算技術(shù)領(lǐng)域,具體涉及一種基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu)。
背景技術(shù):
現(xiàn)有數(shù)據(jù)挖掘平臺底層沒有部署云平臺,數(shù)據(jù)挖掘系統(tǒng)中所欲的軟件都是通過物理和邏輯部署的,這樣就對硬件的要求比較高,每個子系統(tǒng)相對獨(dú)立,沒有將應(yīng)用完美的集中整合到到一起,形成獨(dú)立的體系結(jié)構(gòu)。對于數(shù)據(jù)集的共享問題,現(xiàn)有的系統(tǒng)和模型沒有比較好的解決辦法,大多數(shù)還是采用數(shù)據(jù)庫存儲和調(diào)用。但是在多系統(tǒng)同時運(yùn)行進(jìn)行數(shù)據(jù)分析和挖掘時就會顯示出明顯的共享性差的缺陷。
發(fā)明內(nèi)容
為了克服上述現(xiàn)有技術(shù)的不足,本發(fā)明提供一種基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu),算法層、應(yīng)用層和用戶層均以XML作為通訊語言,并基于表象化狀態(tài)轉(zhuǎn)變的Web服務(wù)形式內(nèi)部調(diào)用以更好的支持各層的可伸縮性,并最終以開放接口形式對外開放,即用戶可基于任意層做開發(fā),將已有的服務(wù)導(dǎo)入其系統(tǒng)內(nèi),這大大增強(qiáng)了數(shù)據(jù)挖掘系統(tǒng)的開放性跟易用性;同時本發(fā)明解決了數(shù)據(jù)存儲及共享的問題。為了實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明采取如下技術(shù)方案一種基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu),所述架構(gòu)包括算法層、應(yīng)用層和用戶層,算法層為用戶層和應(yīng)用層提供算法服務(wù),用戶層提出的應(yīng)用需求傳遞給應(yīng)用層,應(yīng)用層通過對上層消息的響應(yīng)得出反饋,并向下傳遞需求信息給算法層,算法層通過算法的尋址調(diào)度,為應(yīng)用層和用戶層提供服務(wù)。所述算法層使用下層提供的統(tǒng)一數(shù)據(jù)源實(shí)現(xiàn)算法調(diào)用及其管理接口,算法層提供的服務(wù)包括算法注冊與注銷、可視化算法調(diào)用、數(shù)據(jù)清洗算法調(diào)用和數(shù)據(jù)挖掘算法調(diào)度。所述算法注冊與注銷是指上層的應(yīng)用層和用戶層需要調(diào)用算法時,在算法層中對需要調(diào)用的算法進(jìn)行注冊,調(diào)用完成后,對該算法進(jìn)行注銷;所述可視化算法調(diào)用是指將數(shù)據(jù)挖掘的處理結(jié)果通過圖形界面化得方式呈現(xiàn)給用戶;所述數(shù)據(jù)清洗算法調(diào)用是指將錯誤的數(shù)據(jù)、重復(fù)的數(shù)據(jù)和不完整的數(shù)據(jù)進(jìn)行清理,針對有噪聲數(shù)據(jù)的數(shù)據(jù)集在執(zhí)行數(shù)據(jù)挖掘算法之前的預(yù)處理方法調(diào)用接口,清洗之后的數(shù)據(jù)將通過數(shù)據(jù)層存入數(shù)據(jù)挖掘系統(tǒng)提供的存儲空間為接下來的數(shù)據(jù)挖掘服務(wù);所述數(shù)據(jù)挖掘算法調(diào)度是指在使用之前對已經(jīng)清洗過的數(shù)據(jù)或者不需要清洗的數(shù)據(jù)進(jìn)行統(tǒng)一的數(shù)據(jù)挖掘分析。所述應(yīng)用層將數(shù)據(jù)挖掘過程中涉及到的數(shù)據(jù)、算法以及他們內(nèi)部和外部之間的關(guān)系和順序描述為任務(wù),以單個或多個任務(wù)為基礎(chǔ),提供以 應(yīng)用服務(wù)為單位的調(diào)用和維護(hù)。所述應(yīng)用服務(wù)包括應(yīng)用注冊與注銷和應(yīng)用調(diào)用服務(wù);所述應(yīng)用注冊與注銷以插件的方式管理各種任務(wù)以及相應(yīng)對任務(wù)的定義文件,所述應(yīng)用調(diào)用服務(wù)提供已經(jīng)注冊的服務(wù)的調(diào)用接口。所述用戶層提供數(shù)據(jù)挖掘系統(tǒng)對于用戶身份和授權(quán)的管理,是用戶與數(shù)據(jù)挖掘系統(tǒng)交互的接口。通過用戶層提供用戶身份與授權(quán)接口,并對用戶進(jìn)行增刪改查操作;用戶層包含用戶所需要的通信協(xié)議和數(shù)據(jù)服務(wù)。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于提供一種基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu),算法層、應(yīng)用層和用戶層均以XML作為通訊語言,并基于表象化狀態(tài)轉(zhuǎn)變的Web服務(wù)形式內(nèi)部調(diào)用以更好的支持各層的可伸縮性,并最終以開放接口形式對外開放,即用戶可基于任意層做開發(fā),將已有的服務(wù)導(dǎo)入其系統(tǒng)內(nèi),這大大增強(qiáng)了數(shù)據(jù)挖掘系統(tǒng)的開放性跟易用性;同時本發(fā)明解決了數(shù)據(jù)存儲及共享的問題。
圖I是基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu)結(jié)構(gòu)圖。
具體實(shí)施方式
下面結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)說明。如圖1,提供一種基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu),所述架構(gòu)包括算法層、應(yīng)用層和用戶層,算法層為用戶層和應(yīng)用層提供算法服務(wù),用戶層提出的應(yīng)用需求傳遞給應(yīng)用層,應(yīng)用層通過對上層消息的響應(yīng)得出反饋,并向下傳遞需求信息給算法層,算法層通過算法的尋址調(diào)度,為應(yīng)用層和用戶層提供服務(wù)。一層一層的向上傳遞,最終相應(yīng)給用戶層,用戶層將算法的相應(yīng)向上傳遞給用戶界面和開放接口,通過開放接口的調(diào)度,用戶可以共享數(shù)據(jù)挖掘系統(tǒng)中的數(shù)據(jù),調(diào)用自己需要的各種算法,并通過云端集成到自己的應(yīng)用上去。其中應(yīng)用層和算法層為為數(shù)據(jù)挖掘系統(tǒng)的主題,算法層和應(yīng)用層給予數(shù)據(jù)挖掘系統(tǒng)設(shè)計,通過虛擬化技術(shù)為用戶層提供多樣化的服務(wù)。所述算法層使用下層提供的統(tǒng)一數(shù)據(jù)源實(shí)現(xiàn)算法調(diào)用及其管理接口,算法層提供的服務(wù)包括算法注冊與注銷、可視化算法調(diào)用、數(shù)據(jù)清洗算法調(diào)用和數(shù)據(jù)挖掘算法調(diào)度。所述算法注冊與注銷是指上層的應(yīng)用層和用戶層需要調(diào)用算法時,在算法層中對需要調(diào)用的算法進(jìn)行注冊,調(diào)用完成后,對該算法進(jìn)行注銷,以免消耗系統(tǒng)的內(nèi)存,減少資源消耗。算法注冊于注銷服務(wù)本質(zhì)上是一個算法管理模塊,并以插件的方式開管理各種算法模塊,實(shí)現(xiàn)了及時調(diào)用,及時歸檔。所述可視化算法調(diào)用是指將數(shù)據(jù)挖掘的處理結(jié)果通過圖形界面化得方式呈現(xiàn)給用戶,這樣即使用戶了解了數(shù)據(jù)處理前后的情況,又可以根據(jù)可視化的服務(wù)對數(shù)據(jù)進(jìn)行二次分析。為數(shù)據(jù)挖據(jù)后的其它分析工作提供了良好的可視化依據(jù)。所述數(shù)據(jù)清洗算法調(diào)用是指將錯誤的數(shù)據(jù)、重復(fù)的數(shù)據(jù)和不完整的數(shù)據(jù)進(jìn)行清理,針對有噪聲數(shù)據(jù)的數(shù)據(jù)集在執(zhí)行數(shù)據(jù)挖掘算法之前的預(yù)處理方法調(diào)用接口,清洗之后的數(shù)據(jù)將通過數(shù)據(jù)層存入數(shù)據(jù)挖掘系統(tǒng)提供的存儲空間為接下來的數(shù)據(jù)挖掘服務(wù);所述數(shù)據(jù)挖掘算法調(diào)度是指在使用之前對已經(jīng)清洗過的數(shù)據(jù)或者不需要清洗的數(shù)據(jù)進(jìn)行統(tǒng)一的數(shù)據(jù)挖掘分析。所述應(yīng)用層本層抽象其下一層(算法層)的操作,是整個系統(tǒng)的應(yīng)用核心,其將數(shù)據(jù)挖掘過程中涉及到的數(shù)據(jù)、算法以及他們內(nèi)部和外部之間的關(guān)系和順序描述為任務(wù),以單個或多個任務(wù)為基礎(chǔ),提供以應(yīng)用服務(wù)為單位的調(diào)用和維護(hù)。
所述應(yīng)用服務(wù)包括應(yīng)用注冊與注銷和應(yīng)用調(diào)用服務(wù);所述應(yīng)用注冊與注銷以插件的方式管理各種任務(wù)以及相應(yīng)對任務(wù)的定義文件,所述應(yīng)用調(diào)用服務(wù)提供已經(jīng)注冊的服務(wù)的調(diào)用接口。所述用戶層提供數(shù)據(jù)挖掘系統(tǒng)對于用戶身份和授權(quán)的管理,是用戶與數(shù)據(jù)挖掘系統(tǒng)交互的接口。通過用戶層提供用戶身份與授權(quán)接口,授權(quán)信息作為向下調(diào)度各層服務(wù)的通行證保證了系統(tǒng)的安全性。并對用戶進(jìn)行增刪改查操作;用戶層包含用戶所需要的通信協(xié)議和數(shù)據(jù)服務(wù)。最后應(yīng)當(dāng)說明的是以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案而非對其限制,盡管參照上述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,所屬領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解依然
可以對本發(fā)明的具體實(shí)施方式
進(jìn)行修改或者等同替換,而未脫離本發(fā)明精神和范圍的任何修改或者等同替換,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
權(quán)利要求
1.一種基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu),其特征在于所述架構(gòu)包括算法層、應(yīng)用層和用戶層,算法層為用戶層和應(yīng)用層提供算法服務(wù),用戶層提出的應(yīng)用需求傳遞給應(yīng)用層,應(yīng)用層通過對上層消息的響應(yīng)得出反饋,并向下傳遞需求信息給算法層,算法層通過算法的尋址調(diào)度,為應(yīng)用層和用戶層提供服務(wù)。
2.根據(jù)權(quán)利要求I所述的基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu),其特征在于所述算法層使用下層提供的統(tǒng)一數(shù)據(jù)源實(shí)現(xiàn)算法調(diào)用及其管理接口,算法層提供的服務(wù)包括算法注冊與注銷、可視化算法調(diào)用、數(shù)據(jù)清洗算法調(diào)用和數(shù)據(jù)挖掘算法調(diào)度。
3.根據(jù)權(quán)利要求2所述的基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu),其特征在于所述算法注冊與注銷是指上層的應(yīng)用層和用戶層需要調(diào)用算法時,在算法層中對需要調(diào)用的算法進(jìn)行注冊,調(diào)用完成后,對該算法進(jìn)行注銷;所述可視化算法調(diào)用是指將數(shù)據(jù)挖掘的處理結(jié)果通過圖形界面化得方式呈現(xiàn)給用戶;所述數(shù)據(jù)清洗算法調(diào)用是指將錯誤的數(shù)據(jù)、重復(fù)的數(shù)據(jù)和不完整的數(shù)據(jù)進(jìn)行清理,針對有噪聲數(shù)據(jù)的數(shù)據(jù)集在執(zhí)行數(shù)據(jù)挖掘算法之前的預(yù)處理方法調(diào)用接口,清洗之后的數(shù)據(jù)將通過數(shù)據(jù)層存入數(shù)據(jù)挖掘系統(tǒng)提供的存儲空間為接下來的數(shù)據(jù)挖掘服務(wù);所述數(shù)據(jù)挖掘算法調(diào)度是指在使用之前對已經(jīng)清洗過的數(shù)據(jù)或者不需要清洗的數(shù)據(jù)進(jìn)行統(tǒng)一的數(shù)據(jù)挖掘分析。
4.根據(jù)權(quán)利要求I所述的基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu),其特征在于所述應(yīng)用層將數(shù)據(jù)挖掘過程中涉及到的數(shù)據(jù)、算法以及他們內(nèi)部和外部之間的關(guān)系和順序描述為任務(wù),以單個或多個任務(wù)為基礎(chǔ),提供以應(yīng)用服務(wù)為單位的調(diào)用和維護(hù)。
5.根據(jù)權(quán)利要求4所述的基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu),其特征在于所述應(yīng)用服務(wù)包括應(yīng)用注冊與注銷和應(yīng)用調(diào)用服務(wù);所述應(yīng)用注冊與注銷以插件的方式管理各種任務(wù)以及相應(yīng)對任務(wù)的定義文件,所述應(yīng)用調(diào)用服務(wù)提供已經(jīng)注冊的服務(wù)的調(diào)用接□。
6.根據(jù)權(quán)利要求I所述的基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu),其特征在于所述用戶層提供數(shù)據(jù)挖掘系統(tǒng)對于用戶身份和授權(quán)的管理,是用戶與數(shù)據(jù)挖掘系統(tǒng)交互的接□。
7.根據(jù)權(quán)利要求6所述的基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu),其特征在于通過用戶層提供用戶身份與授權(quán)接口,并對用戶進(jìn)行增刪改查操作;用戶層包含用戶所需要的通信協(xié)議和數(shù)據(jù)服務(wù)。
全文摘要
本發(fā)明提供一種基于云計算的數(shù)據(jù)挖掘系統(tǒng)功能層析架構(gòu),包括算法層、應(yīng)用層和用戶層,算法層為用戶層和應(yīng)用層提供算法服務(wù),用戶層提出的應(yīng)用需求傳遞給應(yīng)用層,應(yīng)用層通過對上層消息的響應(yīng)得出反饋,并向下傳遞需求信息給算法層,算法層通過算法的尋址調(diào)度,為應(yīng)用層和用戶層提供服務(wù)。本發(fā)明中,算法層、應(yīng)用層和用戶層均以XML作為通訊語言,并基于表象化狀態(tài)轉(zhuǎn)變的Web服務(wù)形式內(nèi)部調(diào)用以更好的支持各層的可伸縮性,并最終以開放接口形式對外開放,即用戶可基于任意層做開發(fā),將已有的服務(wù)導(dǎo)入其系統(tǒng)內(nèi),這大大增強(qiáng)了數(shù)據(jù)挖掘系統(tǒng)的開放性跟易用性;同時本發(fā)明解決了數(shù)據(jù)存儲及共享的問題。
文檔編號G06F9/44GK102929607SQ201210379710
公開日2013年2月13日 申請日期2012年10月9日 優(yōu)先權(quán)日2012年10月9日
發(fā)明者齊磊 申請人:曙光信息產(chǎn)業(yè)(北京)有限公司