本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及基于血緣分析進(jìn)行數(shù)據(jù)表溯源的方法及裝置。
背景技術(shù):
大數(shù)據(jù)是繼云計(jì)算、物聯(lián)網(wǎng)之后,已經(jīng)成為IT產(chǎn)業(yè)的又一次顛覆性技術(shù)變革,對(duì)國(guó)家治理方式、決策、組織和業(yè)務(wù)流程、提供公共服務(wù)的方式等都將產(chǎn)生巨大的影響。而伴隨著智慧城市建設(shè)對(duì)互聯(lián)網(wǎng)、云計(jì)算、物聯(lián)網(wǎng)等信息技術(shù)的要求,大量數(shù)據(jù)的收集、儲(chǔ)存、分析、處理及其應(yīng)用變得更加方便,政府或公眾的決策行為將逐漸基于數(shù)據(jù)和分析而做出。數(shù)據(jù)溯源是對(duì)數(shù)據(jù)的起源以及數(shù)據(jù)產(chǎn)生過(guò)程的描述信息,這些信息在很多方面發(fā)揮著重要的作用。目前,大數(shù)據(jù)系統(tǒng)開(kāi)發(fā)中,沒(méi)有針對(duì)多種不同數(shù)據(jù)源的數(shù)據(jù)表溯源方法。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)現(xiàn)有技術(shù)的缺陷,本發(fā)明旨在提供一種基于血緣分析進(jìn)行數(shù)據(jù)表溯源的方法及裝置,可以對(duì)隸屬于多種不同類(lèi)型數(shù)據(jù)源的數(shù)據(jù)表進(jìn)行有效溯源,直觀的定位隸屬于不同數(shù)據(jù)源的數(shù)據(jù)表的歸屬,可快速通過(guò)定位其找到數(shù)據(jù)出現(xiàn)的質(zhì)量問(wèn)題。
第一方面,本發(fā)明提供了一種基于血緣分析進(jìn)行數(shù)據(jù)表溯源的方法,具體包括以下步驟:
步驟S1:配置需要進(jìn)行溯源操作的數(shù)據(jù)表的映射關(guān)系轉(zhuǎn)換模式;
步驟S2:根據(jù)步驟S1配置完成的映射關(guān)系轉(zhuǎn)換模式制定轉(zhuǎn)換規(guī)則;
步驟S3:根據(jù)步驟S1配置的映射關(guān)系轉(zhuǎn)換模式以及步驟S2制定的轉(zhuǎn)換規(guī)則建立映射關(guān)系表;
步驟S4:依據(jù)所述映射關(guān)系表進(jìn)行目標(biāo)數(shù)據(jù)表的溯源。
進(jìn)一步地,在步驟S1進(jìn)行映射關(guān)系轉(zhuǎn)換模式配置前判斷需進(jìn)行溯源操作的數(shù)據(jù)表所隸屬的數(shù)據(jù)源類(lèi)型。
進(jìn)一步地,所述步驟S3中根據(jù)步驟S1配置的映射關(guān)系轉(zhuǎn)換模式以及步驟S2制定的轉(zhuǎn)換規(guī)則建立映射關(guān)系表的具體操作步驟為:
步驟S301:為所述映射關(guān)系轉(zhuǎn)換模式以及轉(zhuǎn)換規(guī)則建立相應(yīng)字段,并將其固定在映射關(guān)系表的字段中;
步驟S302:為所述映射關(guān)系表的每個(gè)固定的字段分配字段長(zhǎng)度和字段類(lèi)型并為每個(gè)固定的字段添加備注信息;
進(jìn)一步地,所述步驟S4中依據(jù)所述映射關(guān)系表進(jìn)行目標(biāo)數(shù)據(jù)表的溯源的具體操作步驟為:
步驟S401:以要進(jìn)行溯源的數(shù)據(jù)表做為目標(biāo)數(shù)據(jù)表,進(jìn)行檢索所述目標(biāo)數(shù)據(jù)表的源數(shù)據(jù)表;
步驟S402:判斷源數(shù)據(jù)表是否仍存在源數(shù)據(jù)表;
步驟S403:若步驟S402中判斷結(jié)果為是則重復(fù)進(jìn)行步驟S402的判斷操作,直到最終找不出源數(shù)據(jù)表后進(jìn)入步驟S404;
步驟S404:記錄檢索到的源數(shù)據(jù)表,并按檢索到的時(shí)間先后順序依次排列并輸出。
進(jìn)一步地,所述步驟S402中判斷源數(shù)據(jù)表是否仍存在源數(shù)據(jù)表的判斷方法為:將該源數(shù)據(jù)表作為目標(biāo)數(shù)據(jù)表進(jìn)行步驟S401的檢索操作;檢索完成后對(duì)其檢索結(jié)果進(jìn)行判斷。
由上述技術(shù)方案可知,本發(fā)明提供的基于血緣分析進(jìn)行數(shù)據(jù)表溯源的方法可以對(duì)隸屬于多種不同類(lèi)型數(shù)據(jù)源的數(shù)據(jù)表進(jìn)行有效溯源,直觀的定位隸屬于不同數(shù)據(jù)源的數(shù)據(jù)表的歸屬,可快速通過(guò)定位其找到數(shù)據(jù)出現(xiàn)的質(zhì)量問(wèn)題。
一旦出現(xiàn)任意數(shù)據(jù)表中的元數(shù)據(jù)出現(xiàn)質(zhì)量問(wèn)題,即可通過(guò)本發(fā)明的基于血緣分析進(jìn)行數(shù)據(jù)表溯源的方法對(duì)出現(xiàn)問(wèn)題的數(shù)據(jù)表進(jìn)行溯源檢索,通過(guò)檢索其源數(shù)據(jù)表,定位該問(wèn)題的根源所在。本方法可直接客觀的確定出數(shù)據(jù)質(zhì)量的問(wèn)題所在,定位問(wèn)題效率高、速度快。使用戶可以快速定位出現(xiàn)問(wèn)題的數(shù)據(jù)的關(guān)鍵所在,從而提高決策能力??焖僮R(shí)別使用其它分析方式無(wú)法發(fā)現(xiàn)的影響決策的因素。
第二方面,本發(fā)明提供了基于血緣分析進(jìn)行數(shù)據(jù)表溯源的裝置,包括
模式配置模塊:用于配置需要進(jìn)行溯源操作的數(shù)據(jù)表的映射關(guān)系轉(zhuǎn)換模式;
規(guī)則制定模塊:用于根據(jù)映射關(guān)系轉(zhuǎn)換模式制定轉(zhuǎn)換規(guī)則;
映射關(guān)系表建立模塊:用于根據(jù)映射關(guān)系轉(zhuǎn)換模式以及轉(zhuǎn)換規(guī)則建立映射關(guān)系表;
溯源模塊:用于依據(jù)所述映射關(guān)系表進(jìn)行目標(biāo)數(shù)據(jù)表的溯源。
進(jìn)一步地,所述基于血緣分析進(jìn)行數(shù)據(jù)表溯源的裝置還包括:
判斷模塊:用于判斷需進(jìn)行溯源操作的數(shù)據(jù)表所隸屬的數(shù)據(jù)源類(lèi)型。
進(jìn)一步地,所述映射關(guān)系表建立模塊包括:
字段建立單元:為所述映射關(guān)系轉(zhuǎn)換模式以及轉(zhuǎn)換規(guī)則建立相應(yīng)字段,并將其固定在映射關(guān)系表的字段中;
字段配置單元:為所述映射關(guān)系表的每個(gè)固定的字段分配字段長(zhǎng)度和字段類(lèi)型并為每個(gè)固定的字段添加備注信息。
進(jìn)一步地,所述溯源模塊包括:
檢索單元:用于以要進(jìn)行溯源的數(shù)據(jù)表做為目標(biāo)數(shù)據(jù)表,進(jìn)行檢索所述目標(biāo)數(shù)據(jù)表的源數(shù)據(jù)表;
判斷單元:用于判斷源數(shù)據(jù)表是否仍存在源數(shù)據(jù)表;
遞歸計(jì)算單元:用于判斷源數(shù)據(jù)表是否仍存在源數(shù)據(jù)表;若結(jié)果為是則仍進(jìn)行判斷操作,直到最終檢索不出源數(shù)數(shù)據(jù)表時(shí)進(jìn)入記錄單元;
記錄輸出單元:用于記錄檢索到的源數(shù)據(jù)表,并按檢索到的時(shí)間先后順序依次向前排列并輸出。
進(jìn)一步地,所述判斷單元進(jìn)行判斷源數(shù)據(jù)表是否仍存在源數(shù)據(jù)表的方法為將該源數(shù)據(jù)表作為目標(biāo)數(shù)據(jù)表在檢索單元進(jìn)行檢索操作,若仍檢索出源數(shù)據(jù)表則判定結(jié)果為是,若檢索不出源數(shù)據(jù)表則判定結(jié)果為否。
由上述技術(shù)方案可知,本發(fā)明提供的基于血緣分析進(jìn)行數(shù)據(jù)表溯源的裝置,可以對(duì)隸屬于多種不同類(lèi)型數(shù)據(jù)源的數(shù)據(jù)表進(jìn)行有效溯源,直觀的定位隸屬于不同數(shù)據(jù)源的數(shù)據(jù)表的歸屬,可快速通過(guò)定位其找到數(shù)據(jù)出現(xiàn)的質(zhì)量問(wèn)題。
一旦出現(xiàn)任意數(shù)據(jù)表中的元數(shù)據(jù)出現(xiàn)質(zhì)量問(wèn)題,即可通過(guò)本發(fā)明的基于血緣分析進(jìn)行數(shù)據(jù)表溯源的裝置對(duì)出現(xiàn)問(wèn)題的數(shù)據(jù)表進(jìn)行溯源檢索,通過(guò)檢索其源數(shù)據(jù)表,定位該問(wèn)題的根源所在。本裝置可直接客觀的確定出數(shù)據(jù)質(zhì)量的問(wèn)題所在,定位問(wèn)題效率高、速度快。使用戶可以快速定位出現(xiàn)問(wèn)題的數(shù)據(jù)的關(guān)鍵所在,從而提高決策能力??焖僮R(shí)別使用其它分析方式無(wú)法發(fā)現(xiàn)的影響決策的因素。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明具體實(shí)施方式或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)具體實(shí)施方式或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹。在所有附圖中,類(lèi)似的元件或部分一般由類(lèi)似的附圖標(biāo)記標(biāo)識(shí)。附圖中,各元件或部分并不一定按照實(shí)際的比例繪制。
圖1示出了本發(fā)明實(shí)施例所提供的基于血緣分析進(jìn)行數(shù)據(jù)表溯源的方法的流程圖;
圖2示出了本發(fā)明實(shí)施例所提供的基于血緣分析進(jìn)行數(shù)據(jù)表溯源的方法的溯源操作具體步驟的流程圖;
圖3出了本發(fā)明實(shí)施例所提供的基于血緣分析進(jìn)行數(shù)據(jù)表溯源的裝置的模塊圖;
圖4出了本發(fā)明實(shí)施例所提供的基于血緣分析進(jìn)行數(shù)據(jù)表溯源的裝置的映射關(guān)系表建立模塊的單元結(jié)構(gòu)圖;
圖5出了本發(fā)明實(shí)施例所提供的基于血緣分析進(jìn)行數(shù)據(jù)表溯源的裝置的溯源模塊的單元結(jié)構(gòu)圖。
具體實(shí)施方式
下面將結(jié)合附圖對(duì)本發(fā)明技術(shù)方案的實(shí)施例進(jìn)行詳細(xì)的描述。以下實(shí)施例僅用于更加清楚地說(shuō)明本發(fā)明的技術(shù)方案,因此只是作為示例,而不能以此來(lái)限制本發(fā)明的保護(hù)范圍。需要注意的是,除非另有說(shuō)明,本申請(qǐng)使用的技術(shù)術(shù)語(yǔ)或者科學(xué)術(shù)語(yǔ)應(yīng)當(dāng)為本發(fā)明所屬領(lǐng)域技術(shù)人員所理解的通常意義。
數(shù)據(jù)血統(tǒng)(Lineage,Provenance,Pedigree)亦可譯做(血緣、起源、世系、譜系),對(duì)于數(shù)據(jù)庫(kù)系統(tǒng),有時(shí)需要通過(guò)數(shù)據(jù)血統(tǒng)的追蹤,可以獲得數(shù)據(jù)在數(shù)據(jù)流中的演化過(guò)程。這一演化過(guò)程即為數(shù)據(jù)的血緣分析。
本發(fā)明實(shí)施例一提供了基于血緣分析進(jìn)行數(shù)據(jù)表溯源的方法,如圖1所示,實(shí)施例包括以下步驟:
步驟S1:配置需要進(jìn)行溯源操作的數(shù)據(jù)表的映射關(guān)系轉(zhuǎn)換模式;
步驟S2:根據(jù)步驟S1配置完成的映射關(guān)系轉(zhuǎn)換模式制定轉(zhuǎn)換規(guī)則;
步驟S3:根據(jù)步驟S1配置的映射關(guān)系轉(zhuǎn)換模式以及步驟S2制定的轉(zhuǎn)換規(guī)則建立映射關(guān)系表;
步驟S4:依據(jù)所述映射關(guān)系表進(jìn)行目標(biāo)數(shù)據(jù)表的溯源。本實(shí)施例中所述步驟S1中的溯源操作即為基于數(shù)據(jù)血緣分析對(duì)數(shù)據(jù)庫(kù)中數(shù)據(jù)表的源數(shù)據(jù)表進(jìn)行溯源的方法。
本實(shí)施例中,映射關(guān)系表固定的格式如表1所示:
表1
本實(shí)施例中,在步驟S1進(jìn)行映射關(guān)系轉(zhuǎn)換模式配置前判斷需進(jìn)行溯源操作的數(shù)據(jù)表所隸屬的數(shù)據(jù)源類(lèi)型。
本實(shí)施例中,所述步驟S3中根據(jù)步驟S1配置的映射關(guān)系轉(zhuǎn)換模式以及步驟S2制定的轉(zhuǎn)換規(guī)則建立映射關(guān)系表的具體操作步驟為:
步驟S301:為所述映射關(guān)系轉(zhuǎn)換模式以及轉(zhuǎn)換規(guī)則建立相應(yīng)字段,并將其固定在映射關(guān)系表的字段中。
步驟S302:為所述映射關(guān)系表的每個(gè)固定的字段分配字段長(zhǎng)度和字段類(lèi)型并為每個(gè)固定的字段添加備注信息。
本實(shí)施例中,所述步驟S4中依據(jù)所述映射關(guān)系表進(jìn)行目標(biāo)數(shù)據(jù)表的溯源的具體操作步驟為:
步驟S401:以要進(jìn)行溯源的數(shù)據(jù)表做為目標(biāo)數(shù)據(jù)表,進(jìn)行檢索所述目標(biāo)數(shù)據(jù)表的源數(shù)據(jù)表。
步驟S402:判斷源數(shù)據(jù)表是否仍存在源數(shù)據(jù)表。
步驟S403:若步驟S402中判斷結(jié)果為是則重復(fù)進(jìn)行步驟S402的判斷操作,直到最終找不出源數(shù)據(jù)表后進(jìn)入步驟S404。
步驟S404:記錄檢索到的源數(shù)據(jù)表,并按檢索到的時(shí)間先后順序依次向前排列并輸出。
例如,現(xiàn)有PEOPLE、TEST、TEST1隸屬于三種不同類(lèi)型數(shù)據(jù)源的數(shù)據(jù)表,如果想找出PEOPLE數(shù)據(jù)表的血緣則:
首先在步驟S401中以PEOPLE數(shù)據(jù)表作為目標(biāo)數(shù)據(jù)表,進(jìn)行檢索PEOPLE數(shù)據(jù)表的源數(shù)據(jù)表。
根據(jù)源模式、目標(biāo)模式以及轉(zhuǎn)換規(guī)則(如表2所示)檢索出所述PEOPLE數(shù)據(jù)表的源數(shù)據(jù)表為T(mén)EST數(shù)據(jù)表。
表2
在步驟S402中判斷TEST數(shù)據(jù)表是否仍存在源數(shù)據(jù)表。判斷過(guò)程需根據(jù)源模式、目標(biāo)模式以及轉(zhuǎn)換規(guī)則(如表2所示)將TEST數(shù)據(jù)表作為目標(biāo)數(shù)據(jù)表進(jìn)行檢索其源數(shù)據(jù)表。此處檢索的結(jié)果為檢索到TEST數(shù)據(jù)表的源數(shù)據(jù)表TEST1。
在步驟S403中重復(fù)進(jìn)行步驟S402的判斷步驟,判斷數(shù)據(jù)表TEST1是否仍存在源數(shù)據(jù)表。判斷過(guò)程需根據(jù)判斷過(guò)程需根據(jù)源模式、目標(biāo)模式以及轉(zhuǎn)換規(guī)則(如表2所示)將TEST1數(shù)據(jù)表作為目標(biāo)數(shù)據(jù)表進(jìn)行檢索其源數(shù)據(jù)表。此處的檢索結(jié)果為T(mén)EST1數(shù)據(jù)表不存在源數(shù)據(jù)表。
在步驟S404中記錄檢索到的源數(shù)據(jù)表TEST、TEST1,并按檢索到的時(shí)間先后順序依次排列并輸出。此處得出的輸出結(jié)果為T(mén)EST1(3)->TEST(2)->PEOPLE(1)。
本發(fā)明實(shí)施例一提供的基于血緣分析進(jìn)行數(shù)據(jù)表溯源的方法可以對(duì)隸屬于多種不同類(lèi)型數(shù)據(jù)源的數(shù)據(jù)表進(jìn)行有效溯源,直觀的定位隸屬于不同數(shù)據(jù)源的數(shù)據(jù)表的歸屬,可快速通過(guò)定位其找到數(shù)據(jù)出現(xiàn)的質(zhì)量問(wèn)題。
一旦出現(xiàn)任意數(shù)據(jù)表中的元數(shù)據(jù)出現(xiàn)質(zhì)量問(wèn)題,即可通過(guò)本發(fā)明的基于血緣分析進(jìn)行數(shù)據(jù)表溯源的方法對(duì)出現(xiàn)問(wèn)題的數(shù)據(jù)表進(jìn)行溯源檢索,通過(guò)檢索其源數(shù)據(jù)表,定位該問(wèn)題的根源所在。本方法可直接客觀的確定出數(shù)據(jù)質(zhì)量的問(wèn)題所在,定位問(wèn)題效率高、速度快。使用戶可以快速定位出現(xiàn)問(wèn)題的數(shù)據(jù)的關(guān)鍵所在,從而提高決策能力。快速識(shí)別使用其它分析方式無(wú)法發(fā)現(xiàn)的影響決策的因素。
本發(fā)明實(shí)施例二提供了基于血緣分析進(jìn)行數(shù)據(jù)表溯源的裝置,包括
模式配置模塊:用于配置需要進(jìn)行溯源操作的數(shù)據(jù)表的映射關(guān)系轉(zhuǎn)換模式。
規(guī)則制定模塊:用于根據(jù)映射關(guān)系轉(zhuǎn)換模式制定轉(zhuǎn)換規(guī)則。
映射關(guān)系表建立模塊:用于根據(jù)映射關(guān)系轉(zhuǎn)換模式以及轉(zhuǎn)換規(guī)則建立映射關(guān)系表;
溯源模塊:用于依據(jù)所述映射關(guān)系表進(jìn)行目標(biāo)數(shù)據(jù)表的溯源。
本實(shí)施例中,所述基于血緣分析進(jìn)行數(shù)據(jù)表溯源的裝置還包括:
判斷模塊:用于判斷需進(jìn)行溯源操作的數(shù)據(jù)表所隸屬的數(shù)據(jù)源類(lèi)型。
本實(shí)施例中,所述映射關(guān)系表建立模塊包括:
字段建立單元:為所述映射關(guān)系轉(zhuǎn)換模式以及轉(zhuǎn)換規(guī)則建立相應(yīng)字段,并將其固定在映射關(guān)系表的字段中。
字段配置單元:為所述映射關(guān)系表的每個(gè)固定的字段分配字段長(zhǎng)度和字段類(lèi)型并為每個(gè)固定的字段添加備注信息。
本實(shí)施例中,所述溯源模塊包括:
檢索單元:用于以要進(jìn)行溯源的數(shù)據(jù)表做為目標(biāo)數(shù)據(jù)表,進(jìn)行檢索所述目標(biāo)數(shù)據(jù)表的源數(shù)據(jù)表。
判斷單元:用于判斷源數(shù)據(jù)表是否仍存在源數(shù)據(jù)表。
遞歸計(jì)算單元:用于判斷源數(shù)據(jù)表是否仍存在源數(shù)據(jù)表;若結(jié)果為是則仍進(jìn)行判斷操作,直到最終找不出源數(shù)數(shù)據(jù)表時(shí)進(jìn)入記錄單元。
記錄輸出單元:用于記錄檢索到的源數(shù)據(jù)表,并按檢索到的時(shí)間先后順序依次向前排列并輸出。
本實(shí)施例中,所述判斷單元進(jìn)行判斷源數(shù)據(jù)表是否仍存在源數(shù)據(jù)表的方法為將該源數(shù)據(jù)表作為目標(biāo)數(shù)據(jù)表在檢索單元進(jìn)行檢索操作,若仍檢索出源數(shù)據(jù)表則判定結(jié)果為是,若檢索不出源數(shù)據(jù)表則判定結(jié)果為否。
本發(fā)明實(shí)施例二提供的基于血緣分析進(jìn)行數(shù)據(jù)表溯源的裝置,可以對(duì)隸屬于多種不同類(lèi)型數(shù)據(jù)源的數(shù)據(jù)表進(jìn)行有效溯源,直觀的定位隸屬于不同數(shù)據(jù)源的數(shù)據(jù)表的歸屬,可快速通過(guò)定位其找到數(shù)據(jù)出現(xiàn)的質(zhì)量問(wèn)題。
一旦出現(xiàn)任意數(shù)據(jù)表中的元數(shù)據(jù)出現(xiàn)質(zhì)量問(wèn)題,即可通過(guò)本發(fā)明的基于血緣分析進(jìn)行數(shù)據(jù)表溯源的裝置對(duì)出現(xiàn)問(wèn)題的數(shù)據(jù)表進(jìn)行溯源檢索,通過(guò)檢索其源數(shù)據(jù)表,定位該問(wèn)題的根源所在。本裝置可直接客觀的確定出數(shù)據(jù)質(zhì)量的問(wèn)題所在,定位問(wèn)題效率高、速度快。使用戶可以快速定位出現(xiàn)問(wèn)題的數(shù)據(jù)的關(guān)鍵所在,從而提高決策能力??焖僮R(shí)別使用其它分析方式無(wú)法發(fā)現(xiàn)的影響決策的因素。
最后應(yīng)說(shuō)明的是:以上各實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求和說(shuō)明書(shū)的范圍當(dāng)中。