一種數據處理方法及電子設備的制造方法
【專利摘要】本發(fā)明公開了一種數據處理方法及電子設備,所述方法包括:獲得目標圖表,所述目標圖表包括:可視化組件;基于所述可視化組件,獲得映射集合中與所述目標圖表中的可視化組件相對應的目標映射關系,所述目標映射關系為:所述可視化組件與相應的句式模式之間的映射關系;依據所述目標映射關系中的目標句式模式,確定所述目標圖表中的圖表標示。本發(fā)明中無需人工進行標示的設置,而是通過對預先獲得的映射集合中的映射關系找到與待標注的可視化組件相對應的句式模式,進而匹配到該可視化組件對應的圖表標示,這一過程中無需人工設置操作,而是自動匹配完成,明顯提高后續(xù)的圖表生成效率。
【專利說明】
一種數據處理方法及電子設備
技術領域
[0001]本發(fā)明涉及數據處理技術領域,特別涉及一種數據處理方法及電子設備。
【背景技術】
[0002]數據可視化是數據轉變成洞見的重要途徑,為此,現有技術中存在多種可視化工具如?6]1丨3110、丨3131611、卩111^ view、athena view等來將數據轉換成圖表格式,實現數據可視化。這些工具架構在關系數據庫或者分布式數據倉庫智商,方便的允許人來將對應的數據方便的呈現出來。
[0003]而所有這些工具中,仍然需要人工設置數據檢索內容及對應圖標參數來標注圖表中的標示,導致后續(xù)圖表的生成效率較低。
【發(fā)明內容】
[0004]有鑒于此,本發(fā)明提供了一種數據處理方法及電子設備,用以解決現有技術中圖表的標示需要人工設置,導致后續(xù)圖表的生成效率較低的技術問題。
[0005]本發(fā)明提供了一種數據處理方法,包括:
[0006]獲得目標圖表,所述目標圖表包括:可視化組件;
[0007]基于所述可視化組件,獲得映射集合中與所述目標圖表中的可視化組件相對應的目標映射關系,所述目標映射關系為:所述可視化組件與相應的句式模式之間的映射關系;
[0008]依據所述目標映射關系中的目標句式模式,確定所述目標圖表中的圖表標示。
[0009]上述方法,優(yōu)選的,所述映射集合基于采集到的歷史圖表數據及歷史網頁數據獲得,所述映射集合中包括所述歷史圖表數據及歷史網頁數據中的可視化組件與相應的句式模式之間的映射關系。
[0010]上述方法,優(yōu)選的,獲得所述映射集合,包括:
[0011]對采集到的歷史圖表數據及歷史網頁數據進行結構和語義解析,以得到所述歷史圖表數據及歷史網頁數據中的可視化組件及圖表標題信息;
[0012]基于所述可視化組件及所述圖表標題信息,獲得圖表頁面集合,所述圖表頁面集合包括:圖表塊,所述圖表塊包括可視化組件、標題信息及標注信息;
[0013]對所述圖表塊中的標題信息及標注信息進行句式分解,以得到與該圖表塊中可視化組件相對應的句式模式,進而得到映射集合;
[0014]其中,所述映射集合中包括所述圖表塊中的可視化組件與相應的句式模式之間的映射關系。
[0015]上述方法,優(yōu)選的,所述基于所述可視化組件,獲得映射集合與所述目標圖表中的可視化組件相對應的目標映射關系,包括:
[0016]基于所述映射集合中的映射關系,查找具有與所述目標圖表中的可視化組件相一致的目標可視化組件;
[0017]確定所述目標可視化組件所屬的映射關系為目標映射關系,所述目標映射關系為:所述目標可視化組件與相應的句式模式之間的映射關系。
[0018]上述方法,優(yōu)選的,依據所述目標映射關系中的目標句式模式,確定所述目標圖表中的圖表標示,包括:
[0019]提取所述目標句式模式中的目標圖表標示作為所述目標圖表的圖表標示,所述圖表標示與所述目標圖表中的可視化組件相對應。
[0020]上述方法,優(yōu)選的,依據所述目標映射關系中的目標句式模式,確定所述目標圖表中的圖表標示,包括:
[0021]接收用戶的輸入操作,所述輸入操作為用戶基于所述目標句式模式相關的提示信息進行輸入所產生;
[0022]確定所述輸入操作對應的目標圖表標示作為所述目標圖表的圖表標示,所述圖表標示與所述目標圖表中的可視化組件相對應。
[0023 ] 本發(fā)明還提供了一種電子設備,包括處理器和存儲器,其中:
[0024]所述處理器,用于獲得目標圖表,所述目標圖表包括:可視化組件,基于所述可視化組件,獲得映射集合中與所述目標圖表中的可視化組件相對應的目標映射關系,所述目標映射關系為:所述可視化組件與相應的句式模式之間的映射關系,再依據所述目標映射關系中的目標句式模式,確定所述目標圖表中的圖表標示;
[0025]所述存儲器,用于存儲所述處理器運行程序所需的數據。
[0026]上述電子設備,優(yōu)選的,還包括:
[0027]顯示器,用于將所述處理器輸出的圖表標示及所述目標圖表進行顯示。
[0028]由上述方案可知,本發(fā)明提供的一種數據處理方法及電子設備,通過對預設的映射集合中查找到與待標注的圖表中的可視化組件相對應的映射關系,進而找到該可視化組件所對應的句式模式,進而依據該句式模式中的句式結構或句式內容來確定圖表中可視化組件的圖表標示,實現本發(fā)明目的。本發(fā)明中無需人工進行標示的設置,而是通過對預先獲得的映射集合中的映射關系找到與待標注的可視化組件相對應的句式模式,進而匹配到該可視化組件對應的圖表標示,這一過程中無需人工設置操作,而是自動匹配完成,明顯提高后續(xù)的圖表生成效率。
【附圖說明】
[0029]為了更清楚地說明本發(fā)明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據提供的附圖獲得其他的附圖。
[0030]圖1為本發(fā)明實施例一提供的一種數據處理方法的實現流程圖;
[0031 ]圖2及圖3分別為本發(fā)明實施例一的部分流程圖;
[0032]圖4為本發(fā)明實施例二提供的一種電子設備的結構示意圖;
[0033]圖5為本發(fā)明實施例一■的另一結構不意圖;
[0034]圖6為本發(fā)明實施例二的部分結構示意圖;
[0035]圖7?圖9分別為本發(fā)明實施例的應用示例圖。
【具體實施方式】
[0036]下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0037]參考圖1,為本發(fā)明實施例一提供的一種數據處理方法的實現流程圖,其中,所述方法用于確定待標注的目標圖表中可視化組件的圖表標示。
[0038]在本實施例中,所述方法可以包括以下步驟:
[0039]步驟101:獲得目標圖表。
[0040]其中,所述目標圖表中至少包括有:可視化組件,本實施例中需要對所述目標圖表中的可視化組件進行標示的標注,這里的標示可以理解為圖表的標題及備注信息等內容。
[0041]需要說明的是,本實施例中,所述目標圖表的數據具有以下圖表數據格式:G=〈V,R>。其中,V對應圖表呈現塊,簡稱圖表塊,而圖表塊V具有以下數據格式V = {comp,data,title,notes},即一個圖表呈現塊包括可視化組件即呈現組件、呈現塊數據及圖表呈現塊的標題和標注;R對應著不同圖表呈現塊之間的關系,相應的,R具有以下數據格式:R=Ivi,Vj,c0nnecti0n},一個關系包括關聯的兩個圖表呈現塊及他們之間的關系,所謂的關系是指:數據模型的關系,比如說,vi和vj是統一維度,但是不同測量,或者是不同數據抽象層面的關系。
[0042]步驟102:基于所述可視化組件,獲得映射集合中與所述目標圖表的可視化組件相對應的目標映射關系。
[0043]其中,所述目標映射關系為:所述可視化組件與相應的句式模式之間的映射關系。
[0044]需要說明的是,所述映射集合為預先獲得,所述映射集合中除了包括一個或多個映射關系之外,還包括每個所述映射關系所對應的可視化組件及相應的句式模式,這些可視化組件組成可視化組件集合,這些句式模式組成句式模式集合,也就是說,所述映射集合中包括:可視化組件集合、句式模式集合以及可視化組件及句式模式之間的映射關系。其數據結構:P =〈C,S,RX>,其中,C為可視化組件集合;S為句式模式集合,其中的每個句式模式包括一系列的模式化句子,比如“@a整體趨勢上比@b更有競爭力”,還包括param對應著參數的描述和定義,例如:@a和Ob分別為兩個數據對象;RX對應著句式模式和可視化組件的映射關系,其數據結構RX= {comp,s,strength},其中,strength表明組件和描述之間關聯的強度。
[0045]而在實現本實施例時,可以在所述映射集合中,獲得與所述目標圖表中的可視化組件相對應的目標映射關系,而所述目標映射關系為所述可視化組件與其對應的目標句式模式之間的映射關系。
[0046]步驟103:依據所述目標映射關系中的目標句式模式,確定所述目標圖表中的圖表標不O
[0047]其中,本實施例中可以通過對所述目標句式模式進行解析,提取出該目標句式模式中的標題信息及標注信息等,進而確定所述目標圖表中可視化組件的圖表標示。
[0048]由上述方案可知,本發(fā)明實施例一提供的一種數據處理方法,通過對預設的映射集合中查找到與待標注的圖表中的可視化組件相對應的映射關系,進而找到該可視化組件所對應的句式模式,進而依據該句式模式中的句式結構或句式內容來確定圖表中可視化組件的圖表標示,實現本實施例目的。本實施例中無需人工進行標示的設置,而是通過對預先獲得的映射集合中的映射關系找到與待標注的可視化組件相對應的句式模式,進而匹配到該可視化組件對應的圖表標示,這一過程中無需人工設置操作,而是自動匹配完成,明顯提高后續(xù)的圖表生成效率。
[0049]需要說明的是,上文中的映射集合可以基于預先采集到的歷史圖表數據及歷史網頁數據獲得,所述映射集合中包括:所述歷史圖圖表數據及所述歷史網頁數據中的可視化組件與相應的句式模式之間的映射關系。
[0050]具體的,如圖2中所示,為本發(fā)明實施例中,獲得所述映射集合可以通過以下步驟實現:
[0051]步驟201:對采集到的歷史圖表數據及歷史網頁數據進行結構和語義解析,以得到所述歷史圖表數據及歷史網頁數據中的可視化組件及圖表標題信息。
[0052]其中,在本實施例中可以通過網絡爬蟲等工具采集網絡上的歷史圖表數據及歷史網頁數據,例如提取數據庫中的電子圖表文檔集合進行保存,并在公開的互聯網上爬取包含圖表內容的網頁進行保存,之后再對這些歷史圖表數據及歷史網頁數據借助網頁結構分析和語義關聯分析,以提取到所述歷史圖表數據及歷史網頁數據中的圖表內容,進而得到這些圖表內容中可視化組件及相關的圖表標題信息及描述信息(標注)等。
[0053]步驟202:基于所述可視化組件及所述圖表標題信息,獲得圖表頁面集合,所述圖表頁面集合包括:圖表塊,所述圖表塊包括可視化組件、標題信息及標注信息。
[0054]具體的,本實施例中可以借助于可視化組件的信息從圖表組件提供商的數據庫中進行組件類型定位,進而確定所述歷史圖表數據和歷史網頁數據的可視化組件的組件類型,進而建立圖表頁面集合,其中包括多個圖表頁面:W=〈VX,SOurCe>,其中,VX對應著圖表塊,VX= {comp,title,notes},一個圖表頁面的圖表塊通常會包括組件、標題和標注,而source對應著該圖表塊的來源。其中,comp可以表現為三元組〈type,vendor〉,其中type對應著可視化組件的類型,包括折現圖、柱狀圖及散點圖等類型。
[0055]步驟203:對所述圖表塊中的標題信息及標注信息進行句式分解,以得到與該圖表塊中可視化組件相對應的句式模式,進而得到映射集合。
[0056]其中,所述映射集合中包括所述圖表塊中的可視化組件與相應的句式模式之間的映射關系。
[0057]具體的,本實施例中對所述圖表頁面集合進行分析,對每個圖表塊中的ti11e和notes進行句式分析,從句子中分析描述對象和描述內容,進而將對應的描述對象和描述內容進行參數化形成對應的句式表述模式,即句式模式,最終形成映射集合P =〈C,S,RX>。
[0058]由上述方案可知,本實施例獲得映射集合的所有數據來自公開的Web和其他電子材料,對應樣本豐富,能夠比較豐富地提取描述樣本,并且考慮到發(fā)表的內容大都是經過仔細推敲的,因此描述是比較容易理解和接受的描述,因此對應生成的內容可讀性和實用性都較強。
[0059]具體的,本實施例中在基于所述可視化組件,獲得映射集合與所述目標圖表中的可視化組件相對應的目標映射關系時,具體可以通過以下步驟實現,如圖3中所示:
[0060]步驟301:基于所述映射集合中的映射關系,查找具有與所述目標圖表中的可視化組件相一致的目標可視化組件。
[0061]也就是說,在所述映射集合中的所有映射關系的內容如可視化組件、句式模式及之間的對應關系中,確定與所述目標圖表中的可視化組件相一致的目標可視化組件。
[0062]步驟302:確定所述目標可視化組件所屬的映射關系為目標映射關系,所述目標映射關系為:所述目標可視化組件與相應的句式模式之間的映射關系。
[0063]相應的,基于前述實現,所述步驟103可以通過以下方式實現:
[0064]提取所述目標句式模式中的目標圖表標示作為所述目標圖表的圖表標示,所述圖表標示與所述目標圖表中的可視化組件相對應。
[0065]也就是說,本實施例中直接將所述目標句式模式中的圖表標示作為所述目標圖表中可視化組件的圖表標示進行設置,進而使得后續(xù)得到的目標圖表中可視化組件能夠具有較為準確的圖表標示。
[0066]或者,所述步驟103也可以通過以下方式實現:
[0067]接收用戶的輸入操作,所述輸入操作為用戶基于所述目標句式模式相關的提示信息進行輸入所產生,之后,確定該輸入操作對應的目標圖表標示作為所述目標圖表的圖表標示,所述圖表標示與所述目標圖表中的可視化組件相對應。
[0068]也就是說,本實施例中在得到所述目標句式模式之后,通過顯示界面提示給用戶,由用戶對所述目標句式模式中的圖表標示進行選擇或確認的輸入操作,進而本實施例在接收到所述輸入操作之后,可以通過解析該輸入操作來確定用戶所選擇的目標圖表標示,該目標圖表標示即為所述目標圖表中可視化組件的圖表標示。由此,利用本實施例能夠實現對用戶圖表制作中標題和備注提示的自動輔助實現,提升圖表制作中呈現的效果,協助數據分析師快速實現高水平的數據圖表制作和詮釋,降低了數據圖表制作的難度,能夠加速企業(yè)基于數據驅動的轉型。
[0069]進一步的,在本實施例中確定所述目標圖表的圖表標示之后,可以將用戶的輸入操作等能夠表明用戶選擇意向信息及對應的圖表標示進行保存,進而豐富所述映射集合中的映射關系,形成自我學習用戶的圖表表述或繪制的偏好,進而在后續(xù)中可以對本實施例中的目標句式模式選擇的方案進行改進或修正,進而降低用戶圖表描述的個性化,提高圖表繪制的準確性,改善用戶體驗。
[0070]參考圖4,為本發(fā)明實施例二提供的一種電子設備的結構示意圖,其中,所述電子設備可以包括以下結構:處理器401和存儲器402,其中:
[0071 ] 所述處理器401,用于獲得目標圖表,所述目標圖表包括:可視化組件,基于所述可視化組件,獲得映射集合中與所述目標圖表中的可視化組件相對應的目標映射關系,所述目標映射關系為:所述可視化組件與相應的句式模式之間的映射關系,再依據所述目標映射關系中的目標句式模式,確定所述目標圖表中的圖表標示。
[0072]其中,所述處理器401的具體實現結構及實現方式可以參考前文中相關的實施例內容,此處不再詳述。
[0073]所述存儲器402,用于存儲所述處理器運行程序所需的數據。
[0074]其中,所述存儲器402可以為硬盤、磁盤、SD卡等存儲設備,用以存儲所述處理器401運行程序所使用的數據以及運行程序過程中所產生的數據。
[0075]由上述方案可知,本發(fā)明實施例二提供的一種電子設備,通過對預設的映射集合中查找到與待標注的圖表中的可視化組件相對應的映射關系,進而找到該可視化組件所對應的句式模式,進而依據該句式模式中的句式結構或句式內容來確定圖表中可視化組件的圖表標示,實現本實施例目的。本實施例中無需人工進行標示的設置,而是通過對預先獲得的映射集合中的映射關系找到與待標注的可視化組件相對應的句式模式,進而匹配到該可視化組件對應的圖表標示,這一過程中無需人工設置操作,而是自動匹配完成,明顯提高后續(xù)的圖表生成效率。
[0076]基于上述實施例,所述電子設備還可以包括以下結構,如圖5中所示:
[0077]顯示器403,用于將所述處理器401輸出的圖表標示及所述目標圖表進行顯示。
[0078]其中,所述顯示器403可以為液晶顯示器或投影顯示器等設備實現。
[0079]需要說明的是,在實際應用中,上述處理器401中可以包括多個功能模式實現其相應的功能,具體的,如圖6中所示,所述處理器401可以具有以下功能模塊:電子文檔管理模塊、網絡爬蟲、圖表頁面識別模塊、句式表述模式提取模塊、用戶制表插件、圖表標注推薦模塊及自學習優(yōu)化模塊等。
[0080]具體的,各個功能模塊主要功能及工作流如下:
[0081]電子文檔管理模塊,用于提取電子圖表文檔集合并保存到對應的數據庫中。
[0082]網頁爬蟲,用于從公開的互聯網上爬取包含圖表內容的網頁,并將相關數據存放到數據庫中。
[0083]圖表頁面識別模塊,用于基于電子圖表文檔和網頁,借助于結構分析和語義關聯分析,提取出組件和相關的標題以及描述,借助于組件的信息從圖表組件提供商進行組件類型定位,形成圖表頁面集合W=<VX,Source〉并保存到數據庫中。
[0084]句式表述模式提取模塊,用于根據圖表內容W,借助于句式分析參數化描述實體和描述內容,形成句式表述模式集合即映射集合的提取,其中和組件的關聯強度除去考慮數量也考慮對應數據源的可信度,綜合建立對應的強度關聯,最終形成P =〈C,S,RX>,并保存到數據庫中。
[0085]用戶制作插件,用于根據用戶的圖表制作工具,提供當前對應的制作狀態(tài)和圖表和相關的數據內容,并形成用戶制表上下文信息,包括圖表組件,圖表數據對象和當前制作狀態(tài)。
[0086]圖表標注推薦模塊,用于根據用戶制作上下文信息,當用戶完成圖表繪制和屬性選擇后,當用戶有一定停留后,即所述目標圖表中的可視化組件已經繪制完成需要進行標題及標注的設置,此時,確定目標句式模式之后,觸發(fā)表述的描述推薦,即:根據組件和表述的關聯強度,結合數據實體進行對句式表述模式集合即映射集合進行檢索,得到目標句式模式中的內容推薦給用戶,由用戶進行選擇,并輔助用戶進行編輯,最終形成用戶圖表表述內容。
[0087]自學習優(yōu)化模塊,用于根據用戶對表述模式(句式模式)的選擇和對應編輯修改的記錄,了解用戶的習慣和個性化特點,進行調整優(yōu)化算法和后續(xù)編寫的主動提示,提高易用性和用戶體驗。
[0088]以下為利用本發(fā)明的上述技術方案獲得目標圖表的圖表標示的示例詳述:
[0089]根據電子文檔管理和網頁提取,獲得一系列原始數據,電子圖表文檔,或者網頁,如下:
[0090]Docs = {docI,doc2,..,docm},其中每一個對應一個電子圖表文檔;
[0091 ] Web= {web’ I,web2,…web’n},其中每一個對應著一個網頁信息;
[0092]其中每個網頁信息保留其數據源,對應數據源可以自動或者人工標注其權威性SA0
[0093]圖表頁面識別模塊,根據上述提取的網頁和文檔,借助于結構和語義管理分析,建立圖表組件和標題和內容的提取,并根據數量和數據源權威信息SA,建立初步的關系強度加權,其中標題和標注的提取可以借助于圖表環(huán)繞相關相近,還有網頁的標題的關鍵字(通常對應描述的內容),借助于這個關鍵字尋找相關的語義關聯詞(比如網頁關鍵詞為污染,燃煤對應的污染源,事件,地點等就是這個關聯詞),借助于關聯詞定位到對應的段落,再結合定位詞的具體實體識別,最終選擇對應的文字段落,最終形成對圖表頁面集合W=〈VX,Source〉,如圖7中所示。
[0094]句式表述模式提取模塊,根據W提取的內容,進行句式分析,提取描述對象和描述內容,并進行參數化,比如提取的語句如下:“從污染源來看,冬季取暖產生的比汽車產生的要大得多(高20%)”,對應句法分析將提取:數據對象-污染源,數據對象實體1-冬季取暖,數據對象實體2-汽車,數據對比-高20% ο將上述內容進行參數化,形成如下句式模板:從@013」6(:1:(31&8 8來看,@013」6(^&產生的比Oobjectb產生的要大得多(Odifference),如圖8中所不O
[0095]之后,對于上述句式可以再進一步壓縮,所謂壓縮就是同義詞的聚合,比如上邊的“大得多”可以和“顯著得多”合并。進而對于模式就存在對應組件和對應表述的一個計數,再結合數據源的權威性SA,最終形成組件和表述之間的對應關系強度,最終形成P =〈C,S,RX>0
[0096]然后,提取用戶標注制作上下文,當用戶完成圖表的表現調整,比如用戶連續(xù)調整圖表存在一定時間的空閑,則觸發(fā)對應的推薦,并提取用戶的編輯上下文,比如編輯的圖表類型,圖表數據實體的個數,對應關鍵的差異內容(比如趨勢,突起點,平均值等)。比如:當前用戶的上下文為:
[0097]{折線圖,2個數據實體-Yoga3和Gaming 600的銷售,銷售增量速度,相差10個度量}
[0098]圖表標注推薦模塊,根據用戶的上下午從句式表述模式集合中根據圖表類型,數據實體個數還有表述差別提取合適的句式表達模式,并按照關聯性進行排序,比如最終選定句式表達模式如下(從系統角度上可以增加一個整體切換模塊):
[0099]從Oobjectclass來看,Oobjecta產生的比Oobjectb產生的要大得多(Odifference)。
[0100]系統會自動進行對應內容映射,并將對應的部分默認置為可選擇,如圖9中所示。
[0101]而當用戶編輯完成后,對應的內容將自動入庫,并再次解析完成對應的句式模式庫,并增加用戶的信息和偏好,如果用戶存在行業(yè)特色,這些信息將一并進入,最終會根據用戶的背景和個人習慣,優(yōu)化推薦喜歡,更重要的是根據行業(yè)信息自動從互聯網提取行業(yè)術語,優(yōu)化句式模式數據庫,使得標注更專業(yè),提示整個體驗,盡量減少用戶的再次編輯。
[0102]對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本申請并不受所描述的動作順序的限制,因為依據本申請,某些步驟可以采用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定是本申請所必須的。
[0103]本說明書中各個實施例采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似部分互相參見即可。對于實施例公開的裝置而言,由于其與實施例公開的方法相對應,所以描述的比較簡單,相關之處參見方法部分說明即可。
[0104]需要說明的是,在本文中,諸如第一和第二等之類的關系術語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關系或者順序。而且,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。
[0105]為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當然,在實施本申請時可以把各單元的功能在同一個或多個軟件和/或硬件中實現。
[0106]通過以上的實施方式的描述可知,本領域的技術人員可以清楚地了解到本申請可借助軟件加必需的通用硬件平臺的方式來實現?;谶@樣的理解,本申請的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,該計算機軟件產品可以存儲在存儲介質中,如R0M/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)執(zhí)行本申請各個實施例或者實施例的某些部分所述的方法。
[0107]對所公開的實施例的上述說明,使本領域專業(yè)技術人員能夠實現或使用本申請。對這些實施例的多種修改對本領域的專業(yè)技術人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本申請的精神或范圍的情況下,在其它實施例中實現。因此,本申請將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的范圍。
【主權項】
1.一種數據處理方法,包括: 獲得目標圖表,所述目標圖表包括:可視化組件; 基于所述可視化組件,獲得映射集合中與所述目標圖表中的可視化組件相對應的目標映射關系,所述目標映射關系為:所述可視化組件與相應的句式模式之間的映射關系; 依據所述目標映射關系中的目標句式模式,確定所述目標圖表中的圖表標示。2.根據權利要求1所述的方法,其特征在于,所述映射集合基于采集到的歷史圖表數據及歷史網頁數據獲得,所述映射集合中包括所述歷史圖表數據及歷史網頁數據中的可視化組件與相應的句式模式之間的映射關系。3.根據權利要求2所述的方法,其特征在于,獲得所述映射集合,包括: 對采集到的歷史圖表數據及歷史網頁數據進行結構和語義解析,以得到所述歷史圖表數據及歷史網頁數據中的可視化組件及圖表標題信息; 基于所述可視化組件及所述圖表標題信息,獲得圖表頁面集合,所述圖表頁面集合包括:圖表塊,所述圖表塊包括可視化組件、標題信息及標注信息; 對所述圖表塊中的標題信息及標注信息進行句式分解,以得到與該圖表塊中可視化組件相對應的句式模式,進而得到映射集合; 其中,所述映射集合中包括所述圖表塊中的可視化組件與相應的句式模式之間的映射關系。4.根據權利要求3所述的方法,其特征在于,所述基于所述可視化組件,獲得映射集合與所述目標圖表中的可視化組件相對應的目標映射關系,包括: 基于所述映射集合中的映射關系,查找具有與所述目標圖表中的可視化組件相一致的目標可視化組件; 確定所述目標可視化組件所屬的映射關系為目標映射關系,所述目標映射關系為:所述目標可視化組件與相應的句式模式之間的映射關系。5.根據權利要求1、2、3或4所述的方法,其特征在于,依據所述目標映射關系中的目標句式模式,確定所述目標圖表中的圖表標示,包括: 提取所述目標句式模式中的目標圖表標示作為所述目標圖表的圖表標示,所述圖表標示與所述目標圖表中的可視化組件相對應。6.根據權利要求1、2、3或4所述的方法,其特征在于,依據所述目標映射關系中的目標句式模式,確定所述目標圖表中的圖表標示,包括: 接收用戶的輸入操作,所述輸入操作為用戶基于所述目標句式模式相關的提示信息進行輸入所產生; 確定所述輸入操作對應的目標圖表標示作為所述目標圖表的圖表標示,所述圖表標示與所述目標圖表中的可視化組件相對應。7.一種電子設備,包括處理器和存儲器,其中: 所述處理器,用于獲得目標圖表,所述目標圖表包括:可視化組件,基于所述可視化組件,獲得映射集合中與所述目標圖表中的可視化組件相對應的目標映射關系,所述目標映射關系為:所述可視化組件與相應的句式模式之間的映射關系,再依據所述目標映射關系中的目標句式模式,確定所述目標圖表中的圖表標示; 所述存儲器,用于存儲所述處理器運行程序所需的數據。8.根據權利要求7所述的電子設備,其特征在于,還包括:顯示器,用于將所述處理器輸出的圖表標示及所述目標圖表進行顯示。
【文檔編號】G06F17/30GK105893574SQ201610203155
【公開日】2016年8月24日
【申請日】2016年3月31日
【發(fā)明人】胡長建, 王文莉, 蘇亮
【申請人】聯想(北京)有限公司