數(shù)據(jù)生成方法和裝置的制造方法
【專利摘要】本發(fā)明公開了一種數(shù)據(jù)生成方法,所述數(shù)據(jù)生成方法包括以下步驟:根據(jù)預(yù)置關(guān)鍵詞在數(shù)據(jù)庫中查找到對應(yīng)的數(shù)據(jù);將查找到的數(shù)據(jù)按預(yù)置關(guān)鍵詞劃分為對應(yīng)的序列;根據(jù)預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。本發(fā)明還公開了一種數(shù)據(jù)生成裝置。本發(fā)明能夠補齊數(shù)據(jù)中空缺數(shù)據(jù)。
【專利說明】
數(shù)據(jù)生成方法和裝置
技術(shù)領(lǐng)域
[0001 ]本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)生成方法和裝置。
【背景技術(shù)】
[0002]數(shù)據(jù)的自動生成在數(shù)據(jù)查漏、數(shù)據(jù)修復(fù)和軟件測試等領(lǐng)域有著廣泛的應(yīng)用。常見的實際數(shù)據(jù)其表示往往是同義而不同形式的。比如,“I層I號”和“I樓2號”實際上是同一個類型的表達,但分別用了帶“層”和“樓”的形式來表達。同時在實際應(yīng)用時用戶可能在數(shù)據(jù)庫記錄數(shù)據(jù)時將相同屬性的數(shù)據(jù)記錄在其他屬性中。這就讓自動化數(shù)據(jù)生成前,對現(xiàn)有數(shù)據(jù)的規(guī)律難于捕捉。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的主要目的在于提出一種數(shù)據(jù)生成方法和裝置,旨在實現(xiàn)自動補全空缺數(shù)據(jù)。
[0004]為實現(xiàn)上述目的,本發(fā)明提供的一種數(shù)據(jù)生成方法,所述數(shù)據(jù)生成方法包括以下步驟:
[0005]根據(jù)預(yù)置關(guān)鍵詞在數(shù)據(jù)庫中查找到對應(yīng)的數(shù)據(jù);
[0006]將查找到的數(shù)據(jù)按預(yù)置關(guān)鍵詞劃分為對應(yīng)的序列;
[0007]根據(jù)預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。
[0008]可選地,所述根據(jù)預(yù)置關(guān)鍵詞在數(shù)據(jù)庫中查找到對應(yīng)的數(shù)據(jù)的步驟之前還包括:
[0009]建立預(yù)置關(guān)鍵字和序列的對應(yīng)關(guān)系;
[0010]將查找到的數(shù)據(jù)按預(yù)置關(guān)鍵詞劃分為對應(yīng)的序列的步驟包括:
[0011]根據(jù)預(yù)置關(guān)鍵字和序列的對應(yīng)關(guān)系將查找到的數(shù)據(jù)劃分為對應(yīng)的序列。
[0012]可選地,所述根據(jù)預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)的步驟包括:
[0013]識別所述序列中各個數(shù)據(jù)的含義,獲得識別結(jié)果;
[0014]根據(jù)所述識別結(jié)果獲得對應(yīng)的數(shù)據(jù)規(guī)則;
[0015]根據(jù)所述數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。
[0016]可選地,根據(jù)所述識別結(jié)果獲得對應(yīng)的數(shù)據(jù)規(guī)則的步驟還包括:
[0017]根據(jù)所述識別結(jié)果將每個序列拆分為至少一個組;
[0018]分別計算每個組的閾值;
[0019]獲得每個序列中各組的閾值的交集,作為數(shù)據(jù)規(guī)則;
[0020]根據(jù)所述數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)的步驟包括:
[0021]根據(jù)每個序列中各組的閾值的交集獲得該序列的補集;
[0022]將所述補集作為空缺數(shù)據(jù)。
[0023]可選地,所述方法還包括:
[0024]將同一序列的數(shù)據(jù)中含義相近關(guān)鍵詞替換為同一關(guān)鍵詞。
[0025]此外,為實現(xiàn)上述目的,本發(fā)明還提供一種數(shù)據(jù)生成裝置,所述數(shù)據(jù)生成裝置包括:
[0026]查找模塊,用于根據(jù)預(yù)置關(guān)鍵詞在數(shù)據(jù)庫中查找到對應(yīng)的數(shù)據(jù);
[0027]劃分模塊,用于將查找到的數(shù)據(jù)按預(yù)置關(guān)鍵詞劃分為對應(yīng)的序列;
[0028]生成模塊,用于根據(jù)預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。
[0029]可選地,所述數(shù)據(jù)生成裝置還包括:
[0030]建立模塊,用于建立預(yù)置關(guān)鍵字和序列的對應(yīng)關(guān)系;
[0031]所述劃分模塊還用于根據(jù)預(yù)置關(guān)鍵字和序列的對應(yīng)關(guān)系將查找到的數(shù)據(jù)劃分為對應(yīng)的序列。
[0032]可選地,所述生成模塊包括:
[0033]識別單元,用于識別所述序列中各個數(shù)據(jù)的含義,獲得識別結(jié)果;
[0034]獲得單元,用于根據(jù)所述識別結(jié)果獲得對應(yīng)的數(shù)據(jù)規(guī)則;
[0035]生成單元,用于根據(jù)所述數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。
[0036]可選地,所述獲得單元包括:
[0037]拆分子單元,用于根據(jù)所述識別結(jié)果將每個序列拆分為至少一個組;
[0038]計算子單元,用于分別計算每個組的閾值;
[0039]獲得子單元,用于獲得每個序列中各組的閾值的交集,作為數(shù)據(jù)規(guī)則;
[0040]所述生成單元還用于根據(jù)每個序列中各組的閾值的交集獲得該序列的補集;將所述補集作為空缺數(shù)據(jù)。
[0041]可選地,所述數(shù)據(jù)生成裝置還包括:
[0042]替換模塊,用于將同一序列的數(shù)據(jù)中含義相近關(guān)鍵詞替換為同一關(guān)鍵詞。
[0043]本發(fā)明通過根據(jù)預(yù)置關(guān)鍵詞在數(shù)據(jù)庫中查找到對應(yīng)的數(shù)據(jù);將查找到的數(shù)據(jù)按預(yù)置關(guān)鍵詞劃分為對應(yīng)的序列;根據(jù)預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。通過上述方式,本發(fā)明根據(jù)關(guān)鍵詞在數(shù)控庫中查找對應(yīng)的數(shù)據(jù),從而可以避免用戶將在數(shù)據(jù)庫記錄數(shù)據(jù)時將相同屬性的數(shù)據(jù)記錄在其他屬性中,同時還根據(jù)查找到的數(shù)據(jù)生成序列,根據(jù)關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則補齊序列中的空缺數(shù)據(jù)。
【附圖說明】
[0044]圖1為本發(fā)明數(shù)據(jù)生成方法第一實施例的流程示意圖;
[0045]圖2為本發(fā)明實施例中根據(jù)預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)的一種流程示意圖;
[0046]圖3為本發(fā)明實施例中根據(jù)所述識別結(jié)果獲得對應(yīng)的數(shù)據(jù)規(guī)則的一種流程示意圖
[0047]圖4為本發(fā)明數(shù)據(jù)生成方法第二實施例的流程示意圖;
[0048]圖5為本發(fā)明數(shù)據(jù)生成裝置第一實施例的流程示意圖;
[0049]圖6為本發(fā)明實施例中生成模塊的細(xì)化功能模塊示意圖;
[0050]圖7為本發(fā)明實施例中獲得單元的細(xì)化功能模塊示意圖;
[0051 ]圖8為本發(fā)明數(shù)據(jù)生成裝置第二實施例的流程示意圖。
[0052]本發(fā)明目的的實現(xiàn)、功能特點及優(yōu)點將結(jié)合實施例,參照附圖做進一步說明。
【具體實施方式】
[0053]應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0054]本發(fā)明提供一種數(shù)據(jù)生成方法。
[0055]參照圖1,圖1為本發(fā)明數(shù)據(jù)生成方法第一實施例的流程示意圖。
[0056]在本實施例中,該數(shù)據(jù)生成方法包括:
[0057]步驟S10,根據(jù)預(yù)置關(guān)鍵詞在數(shù)據(jù)庫中查找到對應(yīng)的數(shù)據(jù);
[0058]一般用戶在數(shù)據(jù)庫中存儲信息時,會給數(shù)據(jù)庫中相同類型的數(shù)據(jù)建立多個列,每個列都會建立對應(yīng)不同的屬性,即相同屬性的內(nèi)容會在同一列,比如房屋編號通常為同一列。同時數(shù)據(jù)庫中每列分別定義其類型,比如數(shù)值類型、字符類型、指針類型和空類型等,數(shù)據(jù)庫中屬性相同的列通常有多個。從而使得屬性相同的列至少為一個,如果按照屬性進行劃分,則按照屬性劃分的列中可能存在形式不同或者表示的含義完全不相同的內(nèi)容,比如查找屬性為文本類型的列,可能會查到名稱、備注等等,因此可能導(dǎo)致查找結(jié)果不準(zhǔn)確。
[0059]本實施例中根據(jù)關(guān)鍵詞,具體地,本實施例事先在數(shù)據(jù)庫中建立預(yù)置關(guān)鍵詞和序列的對應(yīng)關(guān)系。在數(shù)據(jù)庫中存儲有多個關(guān)鍵詞,相近的關(guān)鍵詞對應(yīng)為同一序列。比如樓、層對應(yīng)同一序列。具體實施中為提高劃分序列的正確性,還可以在查找到對應(yīng)數(shù)據(jù)后檢測查找到的數(shù)據(jù)中是否包含對應(yīng)形式的內(nèi)容,從而避免查到的內(nèi)容為不需要的內(nèi)容。
[0060]根據(jù)預(yù)置的關(guān)鍵詞在數(shù)據(jù)庫中進行查詢,查找到包括預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù),進一步地,還可以根據(jù)判斷查找到的數(shù)據(jù)中是否包含對應(yīng)形式的內(nèi)容,從而提高查找的數(shù)據(jù)的正確性。
[0061]步驟S20,將查找到的數(shù)據(jù)按預(yù)置關(guān)鍵詞劃分為對應(yīng)的序列;
[0062]根據(jù)步驟SlO查找到的數(shù)據(jù),按照實現(xiàn)預(yù)置的預(yù)置關(guān)鍵詞和序列的對應(yīng)關(guān)系,將查找到的數(shù)據(jù)劃分為對應(yīng)的序列。舉例來說,假設(shè)查找到數(shù)據(jù)庫中存在數(shù)據(jù)包括:I樓2號、2樓I號和3樓3號,則將些數(shù)據(jù)劃分為同一序列。
[0063]步驟S30,根據(jù)預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。
[0064]根據(jù)步驟S20中劃分的同一序列,根據(jù)每個序列中對應(yīng)的關(guān)鍵詞所對應(yīng)的數(shù)據(jù)規(guī)貝1J,對該序列進行補空,生成對應(yīng)的空缺數(shù)據(jù)。比如同一個數(shù)據(jù)中包括的多個屬性中,用戶可能在其他的屬性列填寫了另一個屬性的數(shù)據(jù),使得另一屬性的數(shù)據(jù)則為空,具體地,在備注信息列寫入了地址信息或者樓層信息,使得地址信息欄為空,則將備注信息中的地址信息或者樓層信息填寫到地址信息欄。
[0065]本發(fā)明通過根據(jù)預(yù)置關(guān)鍵詞在數(shù)據(jù)庫中查找到對應(yīng)的數(shù)據(jù);將查找到的數(shù)據(jù)按預(yù)置關(guān)鍵詞劃分為對應(yīng)的序列;根據(jù)預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。通過上述方式,本發(fā)明根據(jù)關(guān)鍵詞在數(shù)控庫中查找對應(yīng)的數(shù)據(jù),從而可以避免用戶將在數(shù)據(jù)庫記錄數(shù)據(jù)時將相同屬性的數(shù)據(jù)記錄在其他屬性中,同時還根據(jù)查找到的數(shù)據(jù)生成序列,根據(jù)關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則補齊序列中的空缺數(shù)據(jù)。
[0066]參照圖2,圖2為本發(fā)明實施例中根據(jù)預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)的一種流程示意圖。
[0067]基于本發(fā)明數(shù)據(jù)生成方法第一實施例,步驟S30可以包括:
[0068]步驟S31,識別所述序列中各個數(shù)據(jù)的含義,獲得識別結(jié)果;
[0069]步驟S32,根據(jù)所述識別結(jié)果獲得對應(yīng)的數(shù)據(jù)規(guī)則;
[0070]步驟S33,根據(jù)所述數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。
[0071]本實施例中為提高補充數(shù)據(jù)的正確性,不同的序列中關(guān)鍵詞不同所對應(yīng)的數(shù)據(jù)規(guī)則也會有所區(qū)別,可以事先根據(jù)不同的序列設(shè)置不同的數(shù)據(jù)規(guī)則,然后可以在劃分不同的序列時,可以根據(jù)所述數(shù)據(jù)的屬性和所述數(shù)據(jù)的內(nèi)容識別劃分的各個序列中各個數(shù)據(jù)的含義,獲得對應(yīng)的識別結(jié)果,然后根據(jù)對應(yīng)的識別結(jié)果根據(jù)預(yù)先設(shè)置的數(shù)據(jù)規(guī)則獲得對應(yīng)的數(shù)據(jù)規(guī)則,進而根據(jù)所述數(shù)據(jù)規(guī)則生成對應(yīng)序列中的空缺數(shù)據(jù)。比如在數(shù)據(jù)庫中的序號列,其數(shù)據(jù)一般都是從遞增整數(shù),即序號列為1,2,3....進行排序,此時該序列的規(guī)則為遞增的整數(shù)序列,根據(jù)該規(guī)則生成對應(yīng)的空缺數(shù)據(jù)。
[0072]參照圖3,圖3為本發(fā)明實施例中根據(jù)所述識別結(jié)果獲得對應(yīng)的數(shù)據(jù)規(guī)則的一種流程不意圖。
[0073]基于本發(fā)明數(shù)據(jù)生成方法第二實施例,步驟S32可以包括:
[0074]步驟S321,根據(jù)所述識別結(jié)果將每個序列拆分為至少一個組;
[0075]步驟S322,分別計算每個組的閾值;
[0076]步驟S323,獲得每個序列中各組的閾值的交集,作為數(shù)據(jù)規(guī)則;
[0077]由于查詢到的數(shù)據(jù)中可能存在含義不相同的數(shù)據(jù),比如有些地名可能表示名字,從而需要采取的數(shù)據(jù)規(guī)則不同。為提高空缺數(shù)據(jù)的正確性,本實施例中根據(jù)識別結(jié)果將每個序列中數(shù)據(jù)拆分為至少一個組,然后分別計算獲得的每個組的閾值,再獲得每個序列中各組的閾值的交集,作為數(shù)據(jù)規(guī)則,比如查找到的數(shù)據(jù)包括:1A3,2A1,3B3,識別出其分別代表的含義為表示樓層和房間編號,則其各組的數(shù)值變化遵循自然數(shù)遞交規(guī)則,字母按照A-Z增加,將其劃分為3個組,各組的閾值分別為[I,3 ]、[ A,B ]和[I,3 ],交集則為{I Al,IA2,I A3,IBl,1B2,1B3,2A1,2A2,2A3,2B1,2B2,2B3,3A1,3A2,3A3,3B1,3B2,3B3}。
[0078]步驟S33可以包括:
[0079]步驟S331,根據(jù)每個序列中各組的閾值的交集獲得該序列的補集;
[0080]步驟S332,將所述補集作為空缺數(shù)據(jù)。
[0081]然后在所查詢到的數(shù)據(jù)中確定其中的空缺數(shù)據(jù),根據(jù)上述獲得的每個序列中各組的閾值的交集,獲得該序列的補集,將補集作為空缺數(shù)據(jù),寫入對應(yīng)的空缺位置,從而對數(shù)據(jù)進修復(fù)。
[0082]參照圖4,圖4為本發(fā)明數(shù)據(jù)生成方法第三實施例的流程示意圖。
[0083]基于本發(fā)明數(shù)據(jù)生成方法第一實施例,所述數(shù)據(jù)生成方法可以包括:
[0084]步驟S40,將同一序列的數(shù)據(jù)中含義相近關(guān)鍵詞替換為同一關(guān)鍵詞。
[0085]為了統(tǒng)一數(shù)據(jù),方便用戶查看,本實施例中還將修復(fù)完成后的數(shù)據(jù)中各個序列的數(shù)據(jù)中相近的關(guān)鍵詞替換為同一關(guān)鍵詞,比如將樓、層同一替換為樓。
[0086]本發(fā)明進一步提供一種數(shù)據(jù)生成裝置。
[0087]參照圖5,圖5為本發(fā)明數(shù)據(jù)生成裝置第一實施例的流程示意圖。
[0088]在本實施例中,該數(shù)據(jù)生成裝置包括:
[0089]查找模塊10,用于根據(jù)預(yù)置關(guān)鍵詞在數(shù)據(jù)庫中查找到對應(yīng)的數(shù)據(jù);
[0090]—般用戶在數(shù)據(jù)庫中存儲信息時,會給數(shù)據(jù)庫中相同類型的數(shù)據(jù)建立多個列,每個列都會建立對應(yīng)不同的屬性,即相同屬性的內(nèi)容會在同一列,比如房屋編號通常為同一列。同時數(shù)據(jù)庫中每列分別定義其類型,比如數(shù)值類型、字符類型、指針類型和空類型等,數(shù)據(jù)庫中屬性相同的列通常有多個。從而使得屬性相同的列至少為一個,如果按照屬性進行劃分,則按照屬性劃分的列中可能存在形式不同或者表示的含義完全不相同的內(nèi)容,比如查找屬性為文本類型的列,可能會查到名稱、備注等等,因此可能導(dǎo)致查找結(jié)果不準(zhǔn)確。
[0091]本實施例中還可以包括建立模塊(圖未示),用于建立預(yù)置關(guān)鍵字和序列的對應(yīng)關(guān)系;
[0092]本實施例中根據(jù)關(guān)鍵詞,具體地,本實施例事先在數(shù)據(jù)庫中建立預(yù)置關(guān)鍵詞和序列的對應(yīng)關(guān)系。在數(shù)據(jù)庫中存儲有多個關(guān)鍵詞,相近的關(guān)鍵詞對應(yīng)為同一序列。比如樓、層對應(yīng)同一序列。具體實施中為提高劃分序列的正確性,還可以在查找到對應(yīng)數(shù)據(jù)后檢測查找到的數(shù)據(jù)中是否包含對應(yīng)形式的內(nèi)容,從而避免查到的內(nèi)容為不需要的內(nèi)容。
[0093]根據(jù)預(yù)置的關(guān)鍵詞在數(shù)據(jù)庫中進行查詢,查找到包括預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù),進一步地,還可以根據(jù)判斷查找到的數(shù)據(jù)中是否包含對應(yīng)形式的內(nèi)容,從而提高查找的數(shù)據(jù)的正確性。
[0094]劃分模塊20,用于將查找到的數(shù)據(jù)按預(yù)置關(guān)鍵詞劃分為對應(yīng)的序列;
[0095]所述劃分模塊20還用于根據(jù)預(yù)置關(guān)鍵字和序列的對應(yīng)關(guān)系將查找到的數(shù)據(jù)劃分為對應(yīng)的序列。
[0096]根據(jù)查找到的數(shù)據(jù),按照實現(xiàn)預(yù)置的預(yù)置關(guān)鍵詞和序列的對應(yīng)關(guān)系,將查找到的數(shù)據(jù)劃分為對應(yīng)的序列。舉例來說,假設(shè)查找到數(shù)據(jù)庫中存在數(shù)據(jù)包括:I樓2號、2樓I號和3樓3號,則將些數(shù)據(jù)劃分為同一序列。
[0097]生成模塊30,用于根據(jù)預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。
[0098]根據(jù)劃分模塊20劃分的同一序列,根據(jù)每個序列中對應(yīng)的關(guān)鍵詞所對應(yīng)的數(shù)據(jù)規(guī)貝1J,對該序列進行補空,生成對應(yīng)的空缺數(shù)據(jù)。比如同一個數(shù)據(jù)中包括的多個屬性中,用戶可能在其他的屬性列填寫了另一個屬性的數(shù)據(jù),使得另一屬性的數(shù)據(jù)則為空,具體地,在備注信息列寫入了地址信息或者樓層信息,使得地址信息欄為空,則將備注信息中的地址信息或者樓層信息填寫到地址信息欄。
[0099]本發(fā)明通過根據(jù)預(yù)置關(guān)鍵詞在數(shù)據(jù)庫中查找到對應(yīng)的數(shù)據(jù);將查找到的數(shù)據(jù)按預(yù)置關(guān)鍵詞劃分為對應(yīng)的序列;根據(jù)預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。通過上述方式,本發(fā)明根據(jù)關(guān)鍵詞在數(shù)控庫中查找對應(yīng)的數(shù)據(jù),從而可以避免用戶將在數(shù)據(jù)庫記錄數(shù)據(jù)時將相同屬性的數(shù)據(jù)記錄在其他屬性中,同時還根據(jù)查找到的數(shù)據(jù)生成序列,根據(jù)關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則補齊序列中的空缺數(shù)據(jù)。
[0100]參照圖6,圖6為本發(fā)明實施例中生成模塊的細(xì)化功能模塊示意圖
[0101]基于本發(fā)明數(shù)據(jù)生成裝置第一實施例,生成模塊30可以包括:
[0102]識別單元31,用于識別所述序列中各個數(shù)據(jù)的含義,獲得識別結(jié)果;
[0103]獲得單元32,用于根據(jù)所述識別結(jié)果獲得對應(yīng)的數(shù)據(jù)規(guī)則;
[0104]生成單元33,用于根據(jù)所述數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。
[0105]本實施例中為提高補充數(shù)據(jù)的正確性,不同的序列中關(guān)鍵詞不同所對應(yīng)的數(shù)據(jù)規(guī)則也會有所區(qū)別,可以事先根據(jù)不同的序列設(shè)置不同的數(shù)據(jù)規(guī)則,然后可以在劃分不同的序列時,可以根據(jù)所述數(shù)據(jù)的屬性和所述數(shù)據(jù)的內(nèi)容識別劃分的各個序列中各個數(shù)據(jù)的含義,獲得對應(yīng)的識別結(jié)果,然后根據(jù)對應(yīng)的識別結(jié)果根據(jù)預(yù)先設(shè)置的數(shù)據(jù)規(guī)則獲得對應(yīng)的數(shù)據(jù)規(guī)則,進而根據(jù)所述數(shù)據(jù)規(guī)則生成對應(yīng)序列中的空缺數(shù)據(jù)。比如在數(shù)據(jù)庫中的序號列,其數(shù)據(jù)一般都是從遞增整數(shù),即序號列為1,2,3....進行排序,此時該序列的規(guī)則為遞增的整數(shù)序列,根據(jù)該規(guī)則生成對應(yīng)的空缺數(shù)據(jù)。
[0106]參照圖7,圖7為本發(fā)明實施例中獲得單元的細(xì)化功能模塊示意圖
[0107]基于本發(fā)明數(shù)據(jù)生成裝置上述實施例,獲得單元32包括:
[0108]拆分子單元321,用于根據(jù)所述識別結(jié)果將每個序列拆分為至少一個組;
[0109]計算子單元322,用于分別計算每個組的閾值;
[0110]獲得子單元323,用于獲得每個序列中各組的閾值的交集,作為數(shù)據(jù)規(guī)則;
[0111]所述生成單元33還用于根據(jù)每個序列中各組的閾值的交集獲得該序列的補集;將所述補集作為空缺數(shù)據(jù)。
[0112]由于查詢到的數(shù)據(jù)中可能存在含義不相同的數(shù)據(jù),比如有些地名可能表示名字,從而需要采取的數(shù)據(jù)規(guī)則不同。為提高空缺數(shù)據(jù)的正確性,本實施例中根據(jù)識別結(jié)果將每個序列中數(shù)據(jù)拆分為至少一個組,然后分別計算獲得的每個組的閾值,再獲得每個序列中各組的閾值的交集,作為數(shù)據(jù)規(guī)則,比如查找到的數(shù)據(jù)包括:1A3,2A1,3B3,識別出其分別代表的含義為表示樓層和房間編號,則其各組的數(shù)值變化遵循自然數(shù)遞交規(guī)則,字母按照A-Z增加,將其劃分為3個組,各組的閾值分別為[I,3 ]、[ A,B ]和[I,3 ],交集則為{I Al,IA2,I A3,IBl,1B2,1B3,2A1,2A2,2A3,2B1,2B2,2B3,3A1,3A2,3A3,3B1,3B2,3B3}。
[0113]然后在所查詢到的數(shù)據(jù)中確定其中的空缺數(shù)據(jù),根據(jù)上述獲得的每個序列中各組的閾值的交集,獲得該序列的補集,將補集作為空缺數(shù)據(jù),寫入對應(yīng)的空缺位置,從而對數(shù)據(jù)進修復(fù)。
[0114]參照圖8,圖8為本發(fā)明數(shù)據(jù)生成裝置第二實施例的流程示意圖
[0115]基于本發(fā)明數(shù)據(jù)生成裝置第一實施例,所述數(shù)據(jù)生成裝置可以包括:
[0116]替換模塊40,用于將同一序列的數(shù)據(jù)中含義相近關(guān)鍵詞替換為同一關(guān)鍵詞。
[0117]為了統(tǒng)一數(shù)據(jù),方便用戶查看,本實施例中還將修復(fù)完成后的數(shù)據(jù)中各個序列的數(shù)據(jù)中相近的關(guān)鍵詞替換為同一關(guān)鍵詞,比如將樓、層同一替換為樓。
[0118]以上僅為本發(fā)明的優(yōu)選實施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護范圍內(nèi)。
【主權(quán)項】
1.一種數(shù)據(jù)生成方法,其特征在于,所述數(shù)據(jù)生成方法包括以下步驟: 根據(jù)預(yù)置關(guān)鍵詞在數(shù)據(jù)庫中查找到對應(yīng)的數(shù)據(jù); 將查找到的數(shù)據(jù)按預(yù)置關(guān)鍵詞劃分為對應(yīng)的序列; 根據(jù)預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。2.如權(quán)利要求1所述的數(shù)據(jù)生成方法,其特征在于,所述根據(jù)預(yù)置關(guān)鍵詞在數(shù)據(jù)庫中查找到對應(yīng)的數(shù)據(jù)的步驟之前還包括: 建立預(yù)置關(guān)鍵字和序列的對應(yīng)關(guān)系; 將查找到的數(shù)據(jù)按預(yù)置關(guān)鍵詞劃分為對應(yīng)的序列的步驟包括: 根據(jù)預(yù)置關(guān)鍵字和序列的對應(yīng)關(guān)系將查找到的數(shù)據(jù)劃分為對應(yīng)的序列。3.如權(quán)利要求1所述的數(shù)據(jù)生成方法,其特征在于,所述根據(jù)預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)的步驟包括: 識別所述序列中各個數(shù)據(jù)的含義,獲得識別結(jié)果; 根據(jù)所述識別結(jié)果獲得對應(yīng)的數(shù)據(jù)規(guī)則; 根據(jù)所述數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。4.如權(quán)利要求3所述的數(shù)據(jù)生成方法,其特征在于,所述根據(jù)所述識別結(jié)果獲得對應(yīng)的數(shù)據(jù)規(guī)則的步驟還包括: 根據(jù)所述識別結(jié)果將每個序列拆分為至少一個組; 分別計算每個組的閾值; 獲得每個序列中各組的閾值的交集,作為數(shù)據(jù)規(guī)則; 根據(jù)所述數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)的步驟包括: 根據(jù)每個序列中各組的閾值的交集獲得該序列的補集; 將所述補集作為空缺數(shù)據(jù)。5.如權(quán)利要求1所述的數(shù)據(jù)生成方法,其特征在于,所述方法還包括: 將同一序列的數(shù)據(jù)中含義相近關(guān)鍵詞替換為同一關(guān)鍵詞。6.一種數(shù)據(jù)生成裝置,其特征在于,所述數(shù)據(jù)生成裝置包括: 查找模塊,用于根據(jù)預(yù)置關(guān)鍵詞在數(shù)據(jù)庫中查找到對應(yīng)的數(shù)據(jù); 劃分模塊,用于將查找到的數(shù)據(jù)按預(yù)置關(guān)鍵詞劃分為對應(yīng)的序列; 生成模塊,用于根據(jù)預(yù)置關(guān)鍵詞對應(yīng)的數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。7.如權(quán)利要求6所述的數(shù)據(jù)生成裝置,其特征在于,所述數(shù)據(jù)生成裝置還包括: 建立模塊,用于建立預(yù)置關(guān)鍵字和序列的對應(yīng)關(guān)系; 所述劃分模塊還用于根據(jù)預(yù)置關(guān)鍵字和序列的對應(yīng)關(guān)系將查找到的數(shù)據(jù)劃分為對應(yīng)的序列。8.如權(quán)利要求6所述的數(shù)據(jù)生成裝置,其特征在于,所述生成模塊包括: 識別單元,用于識別所述序列中各個數(shù)據(jù)的含義,獲得識別結(jié)果; 獲得單元,用于根據(jù)所述識別結(jié)果獲得對應(yīng)的數(shù)據(jù)規(guī)則; 生成單元,用于根據(jù)所述數(shù)據(jù)規(guī)則生成所述序列中空缺數(shù)據(jù)。9.如權(quán)利要求8所述的數(shù)據(jù)生成裝置,其特征在于,所述獲得單元包括: 拆分子單元,用于根據(jù)所述識別結(jié)果將每個序列拆分為至少一個組; 計算子單元,用于分別計算每個組的閾值; 獲得子單元,用于獲得每個序列中各組的閾值的交集,作為數(shù)據(jù)規(guī)則; 所述生成單元還用于根據(jù)每個序列中各組的閾值的交集獲得該序列的補集;將所述補集作為空缺數(shù)據(jù)。10.如權(quán)利要求6所述的數(shù)據(jù)生成裝置,其特征在于,所述數(shù)據(jù)生成裝置還包括: 替換模塊,用于將同一序列的數(shù)據(jù)中含義相近關(guān)鍵詞替換為同一關(guān)鍵詞。
【文檔編號】G06F17/30GK106095825SQ201610380315
【公開日】2016年11月9日
【申請日】2016年5月31日
【發(fā)明人】張銳
【申請人】深圳市永興元科技有限公司