亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種支持可視化和流程化的大數(shù)據(jù)ETL調(diào)度系統(tǒng)的制作方法

文檔序號(hào):11230639閱讀:1759來(lái)源:國(guó)知局
一種支持可視化和流程化的大數(shù)據(jù)ETL調(diào)度系統(tǒng)的制造方法與工藝

本發(fā)明涉及大數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種支持可視化和流程化的大數(shù)據(jù)etl調(diào)度系統(tǒng)。



背景技術(shù):

etl(extract-transform-load,提取、轉(zhuǎn)換和加載)是bi(大數(shù)據(jù))項(xiàng)目最重要的一個(gè)環(huán)節(jié),通常情況下etl會(huì)花掉整個(gè)項(xiàng)目的1/3的時(shí)間,etl設(shè)計(jì)的好壞直接關(guān)接到bi項(xiàng)目的成敗。

大數(shù)據(jù)etl也是一個(gè)長(zhǎng)期的過(guò)程,只有不斷的發(fā)現(xiàn)問(wèn)題并解決問(wèn)題,才能使etl運(yùn)行效率更高,為項(xiàng)目后期開(kāi)發(fā)提供準(zhǔn)確的數(shù)據(jù)。大數(shù)據(jù)etl負(fù)責(zé)將分散的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到大數(shù)據(jù)平臺(tái)系統(tǒng)后,進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到大數(shù)據(jù)平臺(tái)、數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘提供決策支持的數(shù)據(jù)。這個(gè)過(guò)程通常都需要在后臺(tái)進(jìn)行相關(guān)操作,且后臺(tái)操作復(fù)雜,降低了etl的開(kāi)發(fā)速度和效率,同時(shí)對(duì)于集群來(lái)說(shuō)可能存在著誤操作的風(fēng)險(xiǎn),大大增加企業(yè)項(xiàng)目實(shí)施成本。



技術(shù)實(shí)現(xiàn)要素:

為解決上述問(wèn)題,本發(fā)明提供了一種支持可視化和流程化的大數(shù)據(jù)etl調(diào)度系統(tǒng),其能夠有效摒棄復(fù)雜的后臺(tái)操作,極大提升了etl的開(kāi)發(fā)速度和效率,同時(shí)降低了企業(yè)項(xiàng)目實(shí)施的成本。

本發(fā)明采用以下技術(shù)方案:

一種支持可視化和流程化的大數(shù)據(jù)etl調(diào)度系統(tǒng),基于b/s架構(gòu)實(shí)現(xiàn),其包括大數(shù)據(jù)組件操作單元、etl作業(yè)管理模塊、etl調(diào)度管理模塊、系統(tǒng)管理模塊及作業(yè)配置數(shù)據(jù)庫(kù),所述etl作業(yè)管理模塊、etl調(diào)度管理模塊與大數(shù)據(jù)組件操作單元彼此獨(dú)立、互不影響,其中:

所述大數(shù)據(jù)組件操作單元包括支持可視化操作的數(shù)據(jù)查詢(xún)模塊、組件腳本編輯模塊、腳本執(zhí)行監(jiān)控模塊、平臺(tái)組件驅(qū)動(dòng)模塊、大數(shù)據(jù)平臺(tái)、本地業(yè)務(wù)系統(tǒng)及遠(yuǎn)程業(yè)務(wù)系統(tǒng);

所述etl作業(yè)管理模塊用于對(duì)大數(shù)據(jù)抽取、清洗、加載的配置提供可視化操作,并生成json或xml格式作業(yè)配置文件進(jìn)行提交或保存到作業(yè)配置數(shù)據(jù)庫(kù);

所述etl調(diào)度管理模塊用于進(jìn)行etl作業(yè)的定時(shí)調(diào)度工作以及完成對(duì)etl作業(yè)執(zhí)行過(guò)程的監(jiān)控,并生成作業(yè)監(jiān)控結(jié)果;

所述系統(tǒng)管理模塊用于針對(duì)系統(tǒng)各模塊提供用戶(hù)、角色、資源的管理以及訪(fǎng)問(wèn)權(quán)限控制,其包括資源管理子模塊、權(quán)限管理子模塊及系統(tǒng)驅(qū)動(dòng)子模塊,所述驅(qū)動(dòng)子模塊連接所述作業(yè)配置數(shù)據(jù)庫(kù)。

優(yōu)選地,所述etl作業(yè)管理模塊包括抽取配置子模塊、清洗配置子模塊、加載配置子模塊,所述抽取配置子模塊用于實(shí)現(xiàn)大數(shù)據(jù)抽取的可視化操作,所述清洗配置子模塊用于實(shí)現(xiàn)大數(shù)據(jù)清洗的可視化操作,所述加載配置子模塊用于實(shí)現(xiàn)大數(shù)據(jù)加載的可視化操作。

優(yōu)選地,所述etl調(diào)度管理模塊包括流程配置子模塊、作業(yè)調(diào)度子模塊及調(diào)度監(jiān)控子模塊,所述流程配置子模塊用于提供etl作業(yè)流程配置的可視化操作,生成etl作業(yè)列表存儲(chǔ)到作業(yè)配置數(shù)據(jù)庫(kù),以及從作業(yè)配置數(shù)據(jù)庫(kù)中讀取etl作業(yè)列表,所述作業(yè)調(diào)度子模塊連接流程配置子模塊,用于實(shí)現(xiàn)etl作業(yè)的定時(shí)調(diào)度工作,所述調(diào)度監(jiān)控子模塊用于對(duì)etl作業(yè)執(zhí)行過(guò)程進(jìn)行監(jiān)控,并生成作業(yè)監(jiān)控結(jié)果。

優(yōu)選地,所述作業(yè)監(jiān)控結(jié)果包括etl作業(yè)的日志、狀態(tài)、結(jié)果以及告警信息。

優(yōu)選地,所述大數(shù)據(jù)平臺(tái)的組件包括hdfs、hive、hbase、solr、yarn、oozie、spark、storm、sqoop、pig、impala、zookeeper。

采用上述技術(shù)方案后,本發(fā)明與背景技術(shù)相比,具有如下優(yōu)點(diǎn):

本發(fā)明有效摒棄復(fù)雜的后臺(tái)操作,極大提升了etl的開(kāi)發(fā)速度和效率,同時(shí)降低了企業(yè)項(xiàng)目實(shí)施的成本。

附圖說(shuō)明

圖1為本發(fā)明結(jié)構(gòu)示意圖;

圖2為本發(fā)明大數(shù)據(jù)組件操作單元的工作流程示意圖;

圖3為本發(fā)明etl作業(yè)管理模塊和etl調(diào)度管理模塊的工作流程示意圖;

圖4為本發(fā)明etl作業(yè)管理模塊和etl調(diào)度管理模塊的工作流程示意圖。

具體實(shí)施方式

為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

實(shí)施例一

請(qǐng)參閱圖1,本發(fā)明公開(kāi)了一種支持可視化和流程化的大數(shù)據(jù)etl調(diào)度系統(tǒng),基于b/s架構(gòu)實(shí)現(xiàn),其包括大數(shù)據(jù)組件操作單元、etl作業(yè)管理模塊、etl調(diào)度管理模塊、系統(tǒng)管理模塊及作業(yè)配置數(shù)據(jù)庫(kù),所述etl作業(yè)管理模塊、etl調(diào)度管理模塊與大數(shù)據(jù)組件操作單元彼此獨(dú)立、互不影響,其中:

參考圖1所示,所述大數(shù)據(jù)組件操作單元包括支持可視化操作的數(shù)據(jù)查詢(xún)模塊、組件腳本編輯模塊、腳本執(zhí)行監(jiān)控模塊、平臺(tái)組件驅(qū)動(dòng)模塊、大數(shù)據(jù)平臺(tái)、本地業(yè)務(wù)系統(tǒng)及遠(yuǎn)程業(yè)務(wù)系統(tǒng)。大數(shù)據(jù)平臺(tái)的組件包括hdfs、hive、hbase、solr、yarn、oozie、spark、storm、sqoop、pig、impala、zookeeper。

所述etl作業(yè)管理模塊用于對(duì)大數(shù)據(jù)抽取、清洗、加載的配置提供可視化操作,并生成json或xml格式作業(yè)配置文件進(jìn)行提交或保存到作業(yè)配置數(shù)據(jù)庫(kù)。所述etl作業(yè)管理模塊包括抽取配置子模塊、清洗配置子模塊、加載配置子模塊,所述抽取配置子模塊用于實(shí)現(xiàn)大數(shù)據(jù)抽取的可視化操作,所述清洗配置子模塊用于實(shí)現(xiàn)大數(shù)據(jù)清洗的可視化操作,所述加載配置子模塊用于實(shí)現(xiàn)大數(shù)據(jù)加載的可視化操作。

所述etl調(diào)度管理模塊用于進(jìn)行etl作業(yè)的定時(shí)調(diào)度工作以及完成對(duì)etl作業(yè)執(zhí)行過(guò)程的監(jiān)控,并生成作業(yè)監(jiān)控結(jié)果。所述etl調(diào)度管理模塊包括流程配置子模塊、作業(yè)調(diào)度子模塊及調(diào)度監(jiān)控子模塊,所述流程配置子模塊用于提供etl作業(yè)流程配置的可視化操作,生成etl作業(yè)列表存儲(chǔ)到作業(yè)配置數(shù)據(jù)庫(kù),以及從作業(yè)配置數(shù)據(jù)庫(kù)中讀取etl作業(yè)列表,所述作業(yè)調(diào)度子模塊連接流程配置子模塊,用于實(shí)現(xiàn)etl作業(yè)的定時(shí)調(diào)度工作,所述調(diào)度監(jiān)控子模塊用于對(duì)etl作業(yè)執(zhí)行過(guò)程進(jìn)行監(jiān)控,并生成作業(yè)監(jiān)控結(jié)果。所述作業(yè)監(jiān)控結(jié)果包括etl作業(yè)的日志、狀態(tài)、結(jié)果以及告警信息。

所述系統(tǒng)管理模塊用于針對(duì)系統(tǒng)各模塊提供用戶(hù)、角色、資源的管理以及訪(fǎng)問(wèn)權(quán)限控制,其包括資源管理子模塊、權(quán)限管理子模塊及系統(tǒng)驅(qū)動(dòng)子模塊,所述驅(qū)動(dòng)子模塊連接所述作業(yè)配置數(shù)據(jù)庫(kù)。

為便于更好的理解本發(fā)明,下面結(jié)合附圖對(duì)本發(fā)明各模塊的工作流程做進(jìn)一步說(shuō)明。

參考圖2所示,大數(shù)據(jù)組件操作單元的工作流程為:

用戶(hù)根據(jù)實(shí)際需要選擇數(shù)據(jù)查詢(xún)模塊、組件腳本編輯模塊、腳本執(zhí)行監(jiān)控模塊進(jìn)行可視化操作,并加載平臺(tái)組件驅(qū)動(dòng)模塊,平臺(tái)組件驅(qū)動(dòng)模塊讀取大數(shù)據(jù)平臺(tái)、本地業(yè)務(wù)系統(tǒng)及遠(yuǎn)程業(yè)務(wù)系統(tǒng)的數(shù)據(jù)信息。

參考圖3所示,etl作業(yè)管理模塊和etl調(diào)度管理模塊的工作流程為:

用戶(hù)通過(guò)etl作業(yè)管理模塊對(duì)大數(shù)據(jù)抽取、清洗、加載的配置進(jìn)行可視化操作,并生成json或xml格式的作業(yè)配置文件,作業(yè)配置文件提交到平臺(tái)組件驅(qū)動(dòng)模塊和系統(tǒng)驅(qū)動(dòng)子模塊,大數(shù)據(jù)平臺(tái)、本地業(yè)務(wù)系統(tǒng)及遠(yuǎn)程業(yè)務(wù)系統(tǒng)基于作業(yè)配置文件進(jìn)行etl作業(yè),系統(tǒng)驅(qū)動(dòng)子模塊將作業(yè)配置文件保存到作業(yè)配置數(shù)據(jù)庫(kù);etl調(diào)度管理模塊讀取作業(yè)配置數(shù)據(jù)庫(kù)的etl作業(yè)列表,根據(jù)etl作業(yè)列表進(jìn)行作業(yè)調(diào)度,并對(duì)etl作業(yè)執(zhí)行過(guò)程進(jìn)行監(jiān)控。

參考圖4所示,系統(tǒng)管理模塊的工作流程為:

用戶(hù)通過(guò)系統(tǒng)管理模塊進(jìn)行用戶(hù)、角色、資源的管理以及訪(fǎng)問(wèn)權(quán)限控制,并通過(guò)系統(tǒng)驅(qū)動(dòng)子模塊將用戶(hù)、角色、資源的管理信息以及訪(fǎng)問(wèn)權(quán)限保存到作業(yè)配置數(shù)據(jù)庫(kù)。

以上所述,僅為本發(fā)明較佳的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范圍為準(zhǔn)。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1