一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法
【專利摘要】本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,具體而言,涉及一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法,包括如下步驟:步驟1,用戶終端向評(píng)估系統(tǒng)終端發(fā)送數(shù)據(jù)庫(kù)質(zhì)量評(píng)估請(qǐng)求;步驟2,評(píng)估系統(tǒng)終端響應(yīng)請(qǐng)求;步驟3,配置關(guān)系型數(shù)據(jù)庫(kù)數(shù)據(jù)源;步驟4,評(píng)估數(shù)據(jù);步驟5,儲(chǔ)存評(píng)估值并記錄即時(shí)評(píng)估時(shí)間;步驟6,輸出評(píng)估值。上述方法可實(shí)現(xiàn)關(guān)系型數(shù)據(jù)的質(zhì)量評(píng)估,能更準(zhǔn)確的分析數(shù)據(jù),以便數(shù)據(jù)進(jìn)行進(jìn)一步的利用。
【專利說明】一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,具體而言,涉及一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法。
【背景技術(shù)】
[0002] 我國(guó)目前各個(gè)行業(yè)的信息化建設(shè)已經(jīng)如火如荼的開展了很多年,積累了豐富的數(shù) 據(jù)。這些數(shù)據(jù)五花八門,存儲(chǔ)結(jié)構(gòu)也是千變?nèi)f化。但是這些數(shù)據(jù)的數(shù)據(jù)質(zhì)量卻普遍不高,導(dǎo) 致基于這些數(shù)據(jù)的分析結(jié)果不準(zhǔn)確,數(shù)據(jù)無法很好的被利用。由于這些數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù) 里面,信息部門的管理人員很難真正掌握這些數(shù)據(jù)的數(shù)據(jù)質(zhì)量。
[0003]目前,針對(duì)關(guān)系型數(shù)據(jù)庫(kù)所存儲(chǔ)數(shù)據(jù)內(nèi)容的數(shù)據(jù)質(zhì)量分析方法不多,尤其是對(duì)于 特定的應(yīng)存儲(chǔ)國(guó)家標(biāo)準(zhǔn)數(shù)據(jù)的數(shù)據(jù)內(nèi)容的分析更是處于空白狀態(tài)。該類存儲(chǔ)代碼的數(shù)據(jù), 比如性別,國(guó)家有專門的標(biāo)準(zhǔn),必須取值范圍在一定的數(shù)字之內(nèi),但是實(shí)際的情況卻是大多 數(shù)的數(shù)據(jù)完全與國(guó)家標(biāo)準(zhǔn)代碼不符。導(dǎo)致數(shù)據(jù)不標(biāo)準(zhǔn),不統(tǒng)一,無法被很好的使用。
【發(fā)明內(nèi)容】
[0004] 為了克服上述【背景技術(shù)】中存在的缺陷,本發(fā)明要解決的技術(shù)問題是提供一種關(guān)系 型數(shù)據(jù)質(zhì)量的評(píng)估方法。
[0005] 為解決上述技術(shù)問題,本發(fā)明的關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法,包括如下步驟:
[0006] 步驟1,用戶終端向評(píng)估系統(tǒng)終端發(fā)送數(shù)據(jù)庫(kù)質(zhì)量評(píng)估請(qǐng)求;
[0007]步驟2,評(píng)估系統(tǒng)終端響應(yīng)請(qǐng)求;
[0008] 步驟3,配置關(guān)系型數(shù)據(jù)庫(kù)數(shù)據(jù)源,包括如下步驟:
[0009] 3. 1,輸入被評(píng)估數(shù)據(jù)庫(kù)的信息,所述信息包括數(shù)據(jù)庫(kù)的IP地址,數(shù)據(jù)庫(kù)用戶名, 密碼或端口,并將所述信息儲(chǔ)存至評(píng)估系統(tǒng);
[0010] 3. 2,建立與被評(píng)估數(shù)據(jù)庫(kù)的鏈接;
[0011] 3. 3,獲取所述被評(píng)估數(shù)據(jù)庫(kù)所對(duì)應(yīng)的表及字段的結(jié)構(gòu),所述評(píng)估系統(tǒng)可以選擇任 意一個(gè)表的任意一個(gè)字段進(jìn)行配置;
[0012] 3. 4,初始化字段分析規(guī)則;
[0013] 步驟4,評(píng)估數(shù)據(jù),包括如下步驟:
[0014] 4. 1,選擇被評(píng)估數(shù)據(jù)庫(kù)中的待評(píng)估數(shù)據(jù),所述待評(píng)估數(shù)據(jù)包括若干個(gè)待評(píng)估的 表,所述表結(jié)構(gòu)下包括一個(gè)或多個(gè)待評(píng)估字段;
[0015] 4. 2,所述評(píng)估系統(tǒng)配置待評(píng)估的字段的分析規(guī)則對(duì)待評(píng)估的字段進(jìn)行評(píng)估得出 評(píng)估值,所述評(píng)估值可根據(jù)分析字段類型的不同而分類,所述分析規(guī)則包括與國(guó)家標(biāo)準(zhǔn)代 碼的匹配,包括如下步驟:
[0016] 4. 2. 1,讀取所述待評(píng)估的字段對(duì)應(yīng)的國(guó)家標(biāo)準(zhǔn)代碼,將所述待評(píng)估的字段與對(duì)應(yīng) 的國(guó)家標(biāo)準(zhǔn)代碼進(jìn)行匹配;
[0017] 4. 2. 2,其中,在所述待評(píng)估字段與國(guó)家標(biāo)準(zhǔn)代碼匹配符合的情況下,將所述待評(píng) 估字段對(duì)應(yīng)的權(quán)重值加至對(duì)應(yīng)的評(píng)估值;
[0018] 步驟5,儲(chǔ)存評(píng)估值并記錄即時(shí)評(píng)估時(shí)間;
[0019] 步驟6,輸出評(píng)估值。
[0020] 進(jìn)一步地,所述分析規(guī)則還包括字段長(zhǎng)度比對(duì),包括如下步驟:預(yù)先設(shè)置標(biāo)準(zhǔn)字段 的長(zhǎng)度,將所述待評(píng)估的字段與所述標(biāo)準(zhǔn)字段的長(zhǎng)度進(jìn)行比對(duì);其中,在所述待評(píng)估字段長(zhǎng) 度與所述標(biāo)準(zhǔn)字段的長(zhǎng)度符合的情況下,將所述待評(píng)估字段對(duì)應(yīng)的權(quán)重值加至對(duì)應(yīng)的評(píng)估 值。
[0021] 進(jìn)一步地,所述分析規(guī)則還包括字段缺失檢測(cè),所述包括如下步驟:將所述待評(píng)估 的字段逐個(gè)對(duì)比檢測(cè),所述檢測(cè)的范圍包括數(shù)字、文字、圖案等所有記錄性信息;其中,在所 述待評(píng)估字段不缺失的情況下,將所述待評(píng)估字段對(duì)應(yīng)的權(quán)重值加至對(duì)應(yīng)的評(píng)估值。
[0022] 進(jìn)一步地,所述分析規(guī)則還包括同類字段匹配,包括如下步驟:將所述待評(píng)估的字 段逐個(gè)對(duì)比檢測(cè),所述檢測(cè)的范圍包括數(shù)字、文字、圖案或極其相結(jié)合等所有相關(guān)記錄性信 息;其中,在所述待評(píng)估字段為同一類字段的情況下,所述同一類字段包括所只為數(shù)字或只 為文字或只為圖形或以相同形式結(jié)合的字段,將所述待評(píng)估的重復(fù)字段對(duì)應(yīng)的權(quán)重值加至 對(duì)應(yīng)的評(píng)估值。
[0023] 進(jìn)一步地,所述分析規(guī)則可聯(lián)合使用對(duì)待評(píng)估字段進(jìn)行匹配。
[0024] 本發(fā)明數(shù)據(jù)質(zhì)量的評(píng)估方法可將數(shù)據(jù)庫(kù)里面的數(shù)據(jù)按照預(yù)先設(shè)定的分析規(guī)則進(jìn) 行評(píng)估,能更準(zhǔn)確的分析數(shù)據(jù),以便數(shù)據(jù)進(jìn)行進(jìn)一步的利用。具體的,所使用的分析規(guī)則包 括與國(guó)家標(biāo)準(zhǔn)代碼的匹配、字段長(zhǎng)度比對(duì)、字段缺失檢測(cè)和同類字段匹配,將字段數(shù)據(jù)與上 述分析規(guī)則進(jìn)行比對(duì)校檢,形成匹配結(jié)果,數(shù)據(jù)的比對(duì)是一種簡(jiǎn)便高效的評(píng)估手段,數(shù)據(jù)比 對(duì)的對(duì)象可包括數(shù)字、文字、圖案或及其相結(jié)合等所有相關(guān)記錄性信息,匹配形成的結(jié)果可 顯示數(shù)據(jù)的完整性,數(shù)據(jù)的相關(guān)度,數(shù)據(jù)的同步性,數(shù)據(jù)的合理性,進(jìn)一步根據(jù)權(quán)重累加來 評(píng)估數(shù)據(jù)的質(zhì)量。
【專利附圖】
【附圖說明】
[0025] 為了更清楚地說明發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)本發(fā)明實(shí)施例 或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)要介紹,顯而易見地,下面描述中的附圖僅僅是 本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可根據(jù) 這些附圖獲得其它的附圖;
[0026] 圖1為本發(fā)明一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法實(shí)施例的流程圖;
[0027] 圖2為本發(fā)明一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法實(shí)施例中配置關(guān)系型數(shù)據(jù)庫(kù)數(shù)據(jù) 源的流程圖;
[0028] 圖3為本發(fā)明一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法實(shí)施例中國(guó)家標(biāo)準(zhǔn)代碼數(shù)據(jù)評(píng)估 的流程圖;
[0029] 圖4為本發(fā)明一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法實(shí)施例中另一種評(píng)估方法的流程 圖。
【具體實(shí)施方式】
[0030] 圖1所示為本發(fā)明一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法實(shí)施例的流程圖,包括如下步 驟:步驟1,用戶終端向評(píng)估系統(tǒng)終端發(fā)送數(shù)據(jù)庫(kù)質(zhì)量評(píng)估請(qǐng)求;步驟2,評(píng)估系統(tǒng)終端響應(yīng) 請(qǐng)求;步驟3,配置關(guān)系型數(shù)據(jù)庫(kù)數(shù)據(jù)源;步驟4,評(píng)估數(shù)據(jù);步驟5,儲(chǔ)存評(píng)估值并記錄即時(shí) 評(píng)估時(shí)間;步驟6,輸出評(píng)估值。上述方法可實(shí)現(xiàn)關(guān)系型數(shù)據(jù)的質(zhì)量評(píng)估,能更準(zhǔn)確的分析 數(shù)據(jù),以便數(shù)據(jù)進(jìn)行進(jìn)一步的利用。
[0031] 圖2所示為本發(fā)明一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法實(shí)施例中配置關(guān)系型數(shù)據(jù)庫(kù) 數(shù)據(jù)源的流程圖,包括如下步驟:步驟3. 1,輸入被評(píng)估數(shù)據(jù)庫(kù)的信息,信息包括數(shù)據(jù)庫(kù)的 IP地址,數(shù)據(jù)庫(kù)用戶名,密碼或端口,并將信息儲(chǔ)存至評(píng)估系統(tǒng);步驟3. 2,建立與被評(píng)估數(shù) 據(jù)庫(kù)的鏈接;步驟3. 3,獲取被評(píng)估數(shù)據(jù)庫(kù)所對(duì)應(yīng)的表及字段的結(jié)構(gòu),評(píng)估系統(tǒng)可以選擇任 意一個(gè)表的任意一個(gè)字段進(jìn)行配置;步驟3. 4,初始化字段分析規(guī)則。
[0032] 圖3所示為本發(fā)明一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法實(shí)施例中國(guó)家標(biāo)準(zhǔn)代碼數(shù)據(jù) 評(píng)估的流程圖,包括如下步驟:步驟401,選擇被評(píng)估數(shù)據(jù)庫(kù)中的待評(píng)估數(shù)據(jù),待評(píng)估數(shù)據(jù) 包括若干個(gè)待評(píng)估的表,表結(jié)構(gòu)下包括一個(gè)或多個(gè)待評(píng)估字段;步驟402,評(píng)估系統(tǒng)配置待 評(píng)估的字段的分析規(guī)則對(duì)待評(píng)估的字段進(jìn)行評(píng)估得出評(píng)估值,評(píng)估值可根據(jù)分析字段類型 的不同而分類,分析規(guī)則為與國(guó)家標(biāo)準(zhǔn)代碼的匹配,讀取待評(píng)估的字段對(duì)應(yīng)的國(guó)家標(biāo)準(zhǔn)代 碼;步驟403,將待評(píng)估的字段與對(duì)應(yīng)的國(guó)家標(biāo)準(zhǔn)代碼進(jìn)行匹配;步驟404,其中,在待評(píng)估 字段與國(guó)家標(biāo)準(zhǔn)代碼匹配符合的情況下,將待評(píng)估字段對(duì)應(yīng)的權(quán)重值加至對(duì)應(yīng)的評(píng)估值。
[0033] 比如,對(duì)于性別這個(gè)國(guó)家標(biāo)準(zhǔn)代碼,可以進(jìn)行如下編排:
[0034] 代碼分類名稱:性別;
[0035] 代碼值域:1,2,3,4;
[0036] 比如對(duì)于民族這個(gè)國(guó)家標(biāo)準(zhǔn)代碼,可以進(jìn)行如下編排:
[0037] 代碼分類名稱:民族;
[0038] 代碼值域:1,2,3,4,5...56;
[0039] 以此類推,將用得到的國(guó)家標(biāo)準(zhǔn)代碼維護(hù)起來。放到系統(tǒng)里面供后續(xù)步驟使用。這 些數(shù)據(jù)將使用表T_GGZY進(jìn)行存儲(chǔ),以性別為例,該表核心字段如下:
[0040]
【權(quán)利要求】
1. 一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法,包括如下步驟: 步驟1,用戶終端向評(píng)估系統(tǒng)終端發(fā)送數(shù)據(jù)庫(kù)質(zhì)量評(píng)估請(qǐng)求; 步驟2,評(píng)估系統(tǒng)終端響應(yīng)請(qǐng)求; 步驟3,配置關(guān)系型數(shù)據(jù)庫(kù)數(shù)據(jù)源,包括如下步驟: 3. 1,輸入被評(píng)估數(shù)據(jù)庫(kù)的信息,所述信息包括數(shù)據(jù)庫(kù)的IP地址,數(shù)據(jù)庫(kù)用戶名,密碼 或端口,并將所述信息儲(chǔ)存至評(píng)估系統(tǒng); 3. 2,建立與被評(píng)估數(shù)據(jù)庫(kù)的鏈接; 3. 3,獲取所述被評(píng)估數(shù)據(jù)庫(kù)所對(duì)應(yīng)的表及字段的結(jié)構(gòu),所述評(píng)估系統(tǒng)可以選擇任意一 個(gè)表的任意一個(gè)字段進(jìn)行配置; 3. 4,初始化字段分析規(guī)則; 步驟4,評(píng)估數(shù)據(jù),包括如下步驟: 4. 1,選擇被評(píng)估數(shù)據(jù)庫(kù)中的待評(píng)估數(shù)據(jù),所述待評(píng)估數(shù)據(jù)包括若干個(gè)待評(píng)估的表,所 述表結(jié)構(gòu)下包括一個(gè)或多個(gè)待評(píng)估字段; 4. 2,所述評(píng)估系統(tǒng)配置待評(píng)估的字段的分析規(guī)則對(duì)待評(píng)估的字段進(jìn)行評(píng)估得出評(píng)估 值,所述評(píng)估值可根據(jù)分析字段類型的不同而分類,所述分析規(guī)則包括與國(guó)家標(biāo)準(zhǔn)代碼的 匹配,包括如下步驟: 4. 2. 1,讀取所述待評(píng)估的字段對(duì)應(yīng)的國(guó)家標(biāo)準(zhǔn)代碼,將所述待評(píng)估的字段與對(duì)應(yīng)的國(guó) 家標(biāo)準(zhǔn)代碼進(jìn)行匹配; 4. 2. 2,其中,在所述待評(píng)估字段與國(guó)家標(biāo)準(zhǔn)代碼匹配符合的情況下,將所述待評(píng)估字 段對(duì)應(yīng)的權(quán)重值加至對(duì)應(yīng)的評(píng)估值; 步驟5,儲(chǔ)存評(píng)估值并記錄即時(shí)評(píng)估時(shí)間; 步驟6,輸出評(píng)估值。
2. 根據(jù)權(quán)利要求1所述的一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法:所述分析規(guī)則還包括字段 長(zhǎng)度比對(duì),包括如下步驟:預(yù)先設(shè)置標(biāo)準(zhǔn)字段的長(zhǎng)度,將所述待評(píng)估的字段與所述標(biāo)準(zhǔn)字段 的長(zhǎng)度進(jìn)行比對(duì);其中,在所述待評(píng)估字段長(zhǎng)度與所述標(biāo)準(zhǔn)字段的長(zhǎng)度符合的情況下,將所 述待評(píng)估字段對(duì)應(yīng)的權(quán)重值加至對(duì)應(yīng)的評(píng)估值。
3. 根據(jù)權(quán)利要求1或2所述的一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法:所述分析規(guī)則還包括 字段缺失檢測(cè),所述包括如下步驟:將所述待評(píng)估的字段逐個(gè)對(duì)比檢測(cè),所述檢測(cè)的范圍包 括數(shù)字、文字、圖案等所有記錄性信息;其中,在所述待評(píng)估字段不缺失的情況下,將所述待 評(píng)估字段對(duì)應(yīng)的權(quán)重值加至對(duì)應(yīng)的評(píng)估值。
4. 根據(jù)權(quán)利要求3所述的一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法:所述分析規(guī)則還包括同類 字段匹配,包括如下步驟:將所述待評(píng)估的字段逐個(gè)對(duì)比檢測(cè),所述檢測(cè)的范圍包括數(shù)字、 文字、圖案或極其相結(jié)合等所有相關(guān)記錄性信息;其中,在所述待評(píng)估字段為同一類字段 的情況下,所述同一類字段包括所只為數(shù)字或只為文字或只為圖形或以相同形式結(jié)合的字 段,將所述待評(píng)估的重復(fù)字段對(duì)應(yīng)的權(quán)重值加至對(duì)應(yīng)的評(píng)估值。
5. 根據(jù)權(quán)利要求4所述的一種關(guān)系型數(shù)據(jù)質(zhì)量的評(píng)估方法:所述分析規(guī)則可聯(lián)合使用 對(duì)待評(píng)估字段進(jìn)行匹配。
【文檔編號(hào)】G06F17/30GK104484448SQ201410827598
【公開日】2015年4月1日 申請(qǐng)日期:2014年12月26日 優(yōu)先權(quán)日:2014年12月26日
【發(fā)明者】葉建鋒 申請(qǐng)人:浙江協(xié)同數(shù)據(jù)系統(tǒng)有限公司