本發(fā)明涉及大數據分析處理技術領域,特別涉及一種大數據可視化分析展示框架構建方法及可視化分析展示框架。
背景技術:
隨著物聯網和大數據的發(fā)展,以往看似不相關的數據經過大規(guī)模的并行分布式計算處理,變得可以理解,并能產生重要的意義。數據正在提供越來越重要的價值,不僅僅在企業(yè),數據下正成為企業(yè)管理變革過程中提供重要決策依據的關鍵資產,在公共事業(yè)領域,數據也正在發(fā)揮越來越重要的作用。當前大數據的關鍵與核心技術集中的數據分析方法和技術上,但大數據分析的結果才是用戶最為關心的問題,人類視覺對圖形圖象的敏感性導致數據不能以其原本的樣子向最終用戶呈現,因為那會由于誤導和復雜性導致理解偏差,直接影響用戶的決策過程。而數據的可視化展示,則能通過直觀的方式向用戶以圖形化的形式展現數據。
當前數據可視化方案主要分為商用解決方案和為特定數據分析和展現業(yè)務構建的特殊解決方案。商用解決方案如Microsoft的Excel、PowerBI,IBM Statistics SPSS等專用軟件,優(yōu)點是界面友好功能強大,但是其自帶的可視化配置方案固定,無法方便有效地進行定制和擴展,對于數據源也有很嚴格的要求,很難滿足特定的數據展示需求,所以一般用在報表等固定的場合,同時其學習曲線也相對陡峭,并不能有效解決大數據環(huán)境下的數據可視化展示問題。而為特定數據分析和展現業(yè)務構建的特殊解決方案,會涉及到一個新系統(tǒng)的構建,對于每一個展現業(yè)務要分別構建一個新和系統(tǒng),開發(fā)的周期和成本很高,也很不方便,并且這類解決方案通常都是面對專業(yè)的研究人員和技術人員,對于特定領域的可視化展示任務,需要特定領域的專業(yè)研究人員配合專業(yè)的技術開發(fā)人員進行編程開發(fā)。
技術實現要素:
本發(fā)明提供一種大數據可視化分析展示框架構建方法及可視化分析展示框架,解決現有上述的問題。
為解決上述問題,本發(fā)明實施例提供一種大數據可視化分析展示框架構建方法,包括如下步驟:
輸入數據經分布式并行運算集群處理后以不同格式存放在不同的數據源集合里;
將數據源中的數據轉換為選定的可視化算法需要的目標格式;
根據算法參數對可視化算法庫中選定的算法進行編譯;
編譯后數據用于處理目標格式的數據得到算法輸出數據;
監(jiān)聽算法輸出數據以及外觀屬性參數的數據變動;
調用相應函數,得到新數據,并用新數據重新繪制可視化區(qū)域圖形。
作為一種實施方式,所述輸入數據經分布式并行運算集群處理后以不同格式存放在不同的數據源集合里,將數據源中的數據轉換為選定的可視化算法需要的目標格式步驟是用于實現輸入的數據源集合到可視化算法需要的目標格式的數據源集合的映射,其中,令輸入的數據源集合為為其中的一種數據源,令可視化算法需要的目標格式的數據源集合為其中的一種數據源,F為所實現的映射的集合,映射的兩個數據源集合滿足如下關系:
作為一種實施方式,所述將數據源中的數據轉換為選定的可視化算法需要的目標格式步驟,具體包括以下步驟:
令輸入的數據源集合為為其中的一種數據源;
從輸入的數據源集合Dsource中選擇一個數據源根據數據源的類型,采用不同的方式,將數據轉換成統(tǒng)一的中間JSON形式JSONintermedia,JSONintermedia為單純的鍵值對。
作為一種實施方式,所述根據數據源的類型,采用不同的方式,將數據轉換成統(tǒng)一的中間JSON形式JSONintermedia步驟,具體包括以下步驟:
若數據源的類型為RDBMS文件時,則用列名為Key,字段值為value構造JSONintermedia;
若數據源的類型為Object Store文件時,則直接取出相應的JSON記錄作為JSONintermedia數據;
若數據源的類型為Plain Text文件時,則根據相應的文本文件解析方案將其構造為JSONintermedia數據;
將JSONintermedia數據內的Key-value對重新組合,形成可視化算法的目標數據。
作為一種實施方式,所述根據算法參數對可視化算法庫中選定的算法進行編譯,編譯后數據用于處理目標格式的數據得到算法輸出數據步驟,具體包括以下步驟:
選擇存儲的可視化算法;
導入算法參數;
目標數據根據算法參數對選定的算法進行編譯;
編譯后數據用于處理目標格式的數據得到算法輸出數據。
作為一種實施方式,所述監(jiān)聽算法輸出數據以及外觀屬性參數的數據變動,調用相應函數,得到新數據,并用新數據重新繪制可視化區(qū)域圖形步驟,具體包括以下步驟:
接收算法輸出數據以及外觀屬性參數;
將算法輸出數據以及外觀屬性參數與V層進行綁定;
監(jiān)聽由V層交互引起的外觀屬性參數的數據變動;
通過雙向綁定機制重新繪制可視化區(qū)域圖形。
為解決上述問題,本發(fā)明實施例還提供一種可視化分析展示框架,包括可視化核心以及耦接可視化核心的數據轉換接入模塊、算法構造接入模塊、參數設置模塊和UI展示模塊,
可視化核心,用于調度各個模塊工作;
數據轉換接入模塊,用于將數據源中的數據轉換為選定的可視化算法需要的目標格式;
算法構造接入模塊,用于根據算法參數對可視化算法庫中選定的算法進行編譯,編譯后數據用于處理目標格式的數據得到算法輸出數據;
參數設置模塊,用于提供算法參數和外觀屬性參數;
UI展示模塊,用于將重新繪制可視化區(qū)域圖形以WEB方式可視化呈現。
作為一種實施方式,所述UI展示模塊采用MVVM架構,包括M層、VM層和V層,其中,
M層,用于接收算法輸出數據和外觀屬性參數,并監(jiān)聽數據變動;
VM層,用于將算法輸出數據和外觀屬性參數和V層進行綁定。
作為一種實施方式,所述參數設置模塊包括算法參數設置模塊和外觀屬性參數設置模塊。
本發(fā)明相比于現有技術的有益效果在于:有效克服了現有數據可視化系統(tǒng),在應用進行不同數據可視化展示任務時,需要特定領域的專業(yè)研究人員配合專業(yè)的技術開發(fā)人員進行編程開發(fā),并且無法適配不同數據源,不可擴展的弊端,對于完成大量不同展示方案的數據可視化展示任務這樣的復雜問題具有較好的效果。
附圖說明
圖1為本發(fā)明的可視化分析展示框架的整體架構圖;
圖2為本發(fā)明的可視化分析展示框架的數據邏輯圖;
圖3為本發(fā)明的大數據可視化分析展示框架構建方法的流程圖。
附圖標注:1、可視化核心;2、數據轉換接入模塊;3、算法構造接入模塊;31、可視化算法庫;32、可視化算法參數模塊;33、可視化算法編譯模塊;4、參數設置模塊;41、算法參數設置模塊;42、外觀屬性參數設置模塊;5、UI展示模塊。
具體實施方式
以下結合附圖,對本發(fā)明上述的和另外的技術特征和優(yōu)點進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明的部分實施例,而不是全部實施例。
如圖1至2所示,本發(fā)明的一種可視化分析展示框架,包括可視化核心1以及耦接可視化核心1的數據轉換接入模塊2、算法構造接入模塊3、參數設置模塊4和UI展示模塊5,可視化核心1用于調度各個模塊工作;數據轉換接入模塊2,用于將數據源中的數據轉換為選定的可視化算法需要的目標格式;算法構造接入模塊3,用于根據算法參數對可視化算法庫31中選定的算法進行編譯,編譯后數據用于處理目標格式的數據得到算法輸出數據;參數設置模塊4,用于提供算法參數和外觀屬性參數;UI展示模塊5,用于將重新繪制可視化區(qū)域圖形以WEB方式可視化呈現。其中,算法構造接入模塊3包括可視化算法庫31、可視化算法參數模塊32、可視化算法編譯模塊33。UI展示模塊5采用MVVM架構,包括M層、VM層和V層,M層,用于接收算法輸出數據和外觀屬性參數,并監(jiān)聽數據變動,VM層用于將算法輸出數據和外觀屬性參數和V層進行綁定。參數設置模塊4包括算法參數設置模塊41和外觀屬性參數設置模塊42。
具體工作過程如下:數據源集合的數據經過數據轉換接入模塊2處理后,等待可視化核心1的數據請求,算法構造接入模塊3需要數據時,向可視化核心1發(fā)送請求,可視化核心1將請求轉發(fā)給數據轉換接入模塊2并將數據傳輸給算法構造接入模塊3,可視化核心1同時根據算法構造接入模塊3的請求,向參數設置模塊4發(fā)送參數請求,并向算法構造接入模塊3返回算法參數,算法構造接入模塊3處理完成后可視化核心1向參數設置模塊4發(fā)送外觀屬性參數請求,并將算法輸出數據和外觀屬性參數發(fā)送給UI展示模塊5,UI展示模塊5監(jiān)聽到數據變動,調用相應函數,用新數據重新繪制可視化區(qū)域圖形。
如圖3所示,本發(fā)明還提供一種大數據可視化分析展示框架構建方法,包括如下步驟:
S100:輸入數據經分布式并行運算集群處理后以不同格式存放在不同的數據源集合里;
S101:將數據源中的數據轉換為選定的可視化算法需要的目標格式;
S102:根據算法參數對可視化算法庫中選定的算法進行編譯;
S103:編譯后數據用于處理目標格式的數據得到算法輸出數據;
S104:監(jiān)聽算法輸出數據以及外觀屬性參數的數據變動;
S105:調用相應函數,得到新數據,并用新數據重新繪制可視化區(qū)域圖形。
其中,步驟S100和步驟S101實現輸入的數據源集合到可視化算法需要的目標格式的數據源集合的映射,其中,令輸入的數據源集合為為其中的一種數據源,令可視化算法需要的目標格式的數據源集合為其中的一種數據源,F為所實現的映射的集合,映射的兩個數據源集合滿足如下關系:
考慮到數據源的形式和格式問題,數據可以存放在關系型數據庫(RDBMS)中,也可以存放在對象存儲(Object Store)中,甚至是文本型數據(Plain Text)。首先從輸入的數據源集合Dsource中選擇一個數據源根據數據源的類型,采用不同的方式,將數據轉換成統(tǒng)一的中間JSON形式JSONintermedia,JSONintermedia為單純的鍵值對。若數據源的類型為RDBMS文件時,則用列名為Key,字段值為value構造JSONintermedia;若數據源的類型為Object Store文件時,則直接取出相應的JSON記錄作為JSONintermedia數據;若數據源的類型為Plain Text文件時,則根據相應的文本文件解析方案將其構造為JSONintermedia數據;將JSONintermedia數據內的Key-value對重新組合,形成可視化算法的目標數據。
步驟S102和步驟S103具體包括以下步驟:
S200:選擇存儲的可視化算法;
S201:導入算法參數,算法參數集合為為其中的一個算法參數,算法參數其中,confk為參數名稱,valuek為參數的值;
S202:目標數據根據算法參數對選定的算法進行編譯;
S203:編譯后數據用于處理目標格式的數據得到算法輸出數據,算法輸出數據其中,dset為數據集,vis為可視化的繪圖類型,為vis對應的配置信息。
步驟S104和步驟S105具體包括以下步驟:
S300:接收算法輸出數據以及外觀屬性參數,外觀屬性參數集合為其中的一個外觀屬性參數,外觀屬性參數其中,confk為參數名稱,valuek為參數的值;
S301:將算法輸出數據以及外觀屬性參數與V層進行綁定;
S302:監(jiān)聽由V層交互引起的外觀屬性參數的數據變動;
S303:通過雙向綁定機制重新繪制可視化區(qū)域圖形。
本發(fā)明相比于現有技術的有益效果在于:有效克服了現有數據可視化系統(tǒng),在應用進行不同數據可視化展示任務時,需要特定領域的專業(yè)研究人員配合專業(yè)的技術開發(fā)人員進行編程開發(fā),并且無法適配不同數據源,不可擴展的弊端,對于完成大量不同展示方案的數據可視化展示任務這樣的復雜問題具有較好的效果。
以上所述的具體實施例,對本發(fā)明的目的、技術方案和有益效果進行了進一步的詳細說明,應當理解,以上所述僅為本發(fā)明的具體實施例而已,并不用于限定本發(fā)明的保護范圍。特別指出,對于本領域技術人員來說,凡在本發(fā)明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。