一種異構(gòu)數(shù)據(jù)搜索方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)搜索技術(shù)領(lǐng)域,特別涉及一種異構(gòu)數(shù)據(jù)搜索方法及裝置。
【背景技術(shù)】
[0002]異構(gòu)數(shù)據(jù)是指采用多種數(shù)據(jù)格式、有著不同數(shù)據(jù)模型和語義環(huán)境的數(shù)據(jù),其中,異構(gòu)數(shù)據(jù)可以包括:結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。由于異構(gòu)數(shù)據(jù)庫(kù)中所包括的數(shù)據(jù)量較大,對(duì)于異構(gòu)數(shù)據(jù)的搜索較難實(shí)現(xiàn)。
[0003]現(xiàn)有的搜索技術(shù)可以采用百度等搜索引擎實(shí)現(xiàn),其具體的搜索方式可以包括:獲取針對(duì)搜索目標(biāo)的搜索請(qǐng)求,根據(jù)搜索請(qǐng)求在異構(gòu)數(shù)據(jù)的數(shù)據(jù)庫(kù)中搜索該搜索目標(biāo)。
[0004]然而,異構(gòu)數(shù)據(jù)的數(shù)據(jù)庫(kù)中包括有大量的結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),在針對(duì)某一個(gè)結(jié)構(gòu)的數(shù)據(jù),例如,結(jié)構(gòu)化數(shù)據(jù),在異構(gòu)數(shù)據(jù)的數(shù)據(jù)庫(kù)中進(jìn)行搜索時(shí),需要在該存儲(chǔ)量較大的數(shù)據(jù)庫(kù)中依次遍歷每一個(gè)數(shù)據(jù)直到搜索到搜索目標(biāo),導(dǎo)致搜索效率較低。
【發(fā)明內(nèi)容】
[0005]有鑒于此,本發(fā)明提供一種異構(gòu)數(shù)據(jù)搜索方法及裝置,以提高搜索效率。
[0006]本發(fā)明提供了一種異構(gòu)數(shù)據(jù)搜索方法,將不同數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)存儲(chǔ)至不同的數(shù)據(jù)庫(kù)中,包括:
[0007]接收針對(duì)搜索目標(biāo)的搜索請(qǐng)求,其中,所述搜索請(qǐng)求攜帶所述搜索目標(biāo)的屬性值;
[0008]根據(jù)所述搜索請(qǐng)求,在索引庫(kù)中查找所述搜索目標(biāo)的屬性值對(duì)應(yīng)的索引信息;
[0009]根據(jù)查找到的索引信息,確定所述搜索目標(biāo)的存儲(chǔ)地址和所述搜索目標(biāo)的數(shù)據(jù)結(jié)構(gòu);
[0010]根據(jù)所述搜索目標(biāo)的存儲(chǔ)地址,向所述搜索目標(biāo)的數(shù)據(jù)結(jié)構(gòu)所對(duì)應(yīng)的數(shù)據(jù)庫(kù)中搜索所述搜索目標(biāo)。
[0011]優(yōu)選地,
[0012]進(jìn)一步包括:設(shè)置不同數(shù)據(jù)結(jié)構(gòu)的元數(shù)據(jù)標(biāo)準(zhǔn);
[0013]進(jìn)一步包括:確定待索引數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu);根據(jù)所述待索引數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)所對(duì)應(yīng)的元數(shù)據(jù)標(biāo)準(zhǔn),建立所述待索引數(shù)據(jù)的索引,并將索引信息存儲(chǔ)至索引庫(kù)中;其中,索引信息包括元數(shù)據(jù)信息和存儲(chǔ)地址的對(duì)應(yīng)關(guān)系。
[0014]優(yōu)選地,所述根據(jù)所述待索引數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)所對(duì)應(yīng)的元數(shù)據(jù)標(biāo)準(zhǔn),建立所述待索引數(shù)據(jù)的索引,包括:
[0015]在所述待索引數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)包括結(jié)構(gòu)化數(shù)據(jù)時(shí),根據(jù)結(jié)構(gòu)化數(shù)據(jù)所對(duì)應(yīng)的元數(shù)據(jù)標(biāo)準(zhǔn),創(chuàng)建所述待索引數(shù)據(jù)的元數(shù)據(jù),并將創(chuàng)建的所述待索引數(shù)據(jù)的元數(shù)據(jù)存儲(chǔ)至結(jié)構(gòu)化數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)庫(kù)中;根據(jù)所述待索引數(shù)據(jù)的元數(shù)據(jù)的存儲(chǔ)地址,對(duì)該元數(shù)據(jù)建立索弓丨;
[0016]在所述待索引數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)包括非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù)時(shí),抓取所述待索引數(shù)據(jù)的文本內(nèi)容,并根據(jù)非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù)所對(duì)應(yīng)的元數(shù)據(jù)標(biāo)準(zhǔn),創(chuàng)建所述待索引數(shù)據(jù)的索引。
[0017]優(yōu)選地,進(jìn)一步包括:
[0018]設(shè)置數(shù)據(jù)結(jié)構(gòu)包括非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù)時(shí)的元數(shù)據(jù)標(biāo)準(zhǔn)包括:文件名稱、文件類型、文件創(chuàng)建時(shí)間、文件內(nèi)容摘要、文件存儲(chǔ)路徑、文件內(nèi)容、數(shù)據(jù)類型和文件內(nèi)容描述中的一種或多種屬性值。
[0019]優(yōu)選地,進(jìn)一步包括:
[0020]根據(jù)所述搜索目標(biāo)的數(shù)據(jù)結(jié)構(gòu)創(chuàng)建相應(yīng)的搜索器,并利用創(chuàng)建的搜索器向所述搜索目標(biāo)的數(shù)據(jù)結(jié)構(gòu)所對(duì)應(yīng)的數(shù)據(jù)庫(kù)中搜索所述搜索目標(biāo)。
[0021]本發(fā)明還提供了一種異構(gòu)數(shù)據(jù)搜索裝置,包括:
[0022]處理單元,用于將不同數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)存儲(chǔ)至不同的數(shù)據(jù)庫(kù)中;
[0023]接收單元,用于接收針對(duì)搜索目標(biāo)的搜索請(qǐng)求,其中,所述搜索請(qǐng)求攜帶所述搜索目標(biāo)的屬性值;
[0024]查找單元,用于根據(jù)所述搜索請(qǐng)求,在索引庫(kù)中查找所述搜索目標(biāo)的屬性值對(duì)應(yīng)的索引?目息;
[0025]確定單元,用于根據(jù)查找到的索引信息,確定所述搜索目標(biāo)的存儲(chǔ)地址和所述搜索目標(biāo)的數(shù)據(jù)結(jié)構(gòu);
[0026]搜索單元,用于根據(jù)所述搜索目標(biāo)的存儲(chǔ)地址,向所述搜索目標(biāo)的數(shù)據(jù)結(jié)構(gòu)所對(duì)應(yīng)的數(shù)據(jù)庫(kù)中搜索所述搜索目標(biāo)。
[0027]優(yōu)選地,
[0028]進(jìn)一步包括:存儲(chǔ)單元,用于存儲(chǔ)不同數(shù)據(jù)結(jié)構(gòu)的元數(shù)據(jù)標(biāo)準(zhǔn);
[0029]進(jìn)一步包括:索引建立單元,用于確定待索引數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu);根據(jù)所述待索引數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)所對(duì)應(yīng)的元數(shù)據(jù)標(biāo)準(zhǔn),建立所述待索引數(shù)據(jù)的索引,并將索引信息存儲(chǔ)至索引庫(kù)中;其中,索引信息包括元數(shù)據(jù)信息和存儲(chǔ)地址的對(duì)應(yīng)關(guān)系。
[0030]優(yōu)選地,所述索引建立單元,用于在所述待索引數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)包括結(jié)構(gòu)化數(shù)據(jù)時(shí),根據(jù)結(jié)構(gòu)化數(shù)據(jù)所對(duì)應(yīng)的元數(shù)據(jù)標(biāo)準(zhǔn),創(chuàng)建所述待索引數(shù)據(jù)的元數(shù)據(jù),并將創(chuàng)建的所述待索引數(shù)據(jù)的元數(shù)據(jù)存儲(chǔ)至結(jié)構(gòu)化數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)庫(kù)中;根據(jù)所述待索引數(shù)據(jù)的元數(shù)據(jù)的存儲(chǔ)地址,對(duì)該元數(shù)據(jù)建立索引;在所述待索引數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)包括非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù)時(shí),抓取所述待索引數(shù)據(jù)的文本內(nèi)容,并根據(jù)非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù)所對(duì)應(yīng)的元數(shù)據(jù)標(biāo)準(zhǔn),創(chuàng)建所述待索引數(shù)據(jù)的索引。
[0031]優(yōu)選地,所述存儲(chǔ)單元,用于存儲(chǔ)數(shù)據(jù)結(jié)構(gòu)包括非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù)時(shí)的元數(shù)據(jù)標(biāo)準(zhǔn)包括:文件名稱、文件類型、文件創(chuàng)建時(shí)間、文件內(nèi)容摘要、文件存儲(chǔ)路徑、文件內(nèi)容、數(shù)據(jù)類型和文件內(nèi)容描述中的一種或多種屬性值。
[0032]優(yōu)選地,所述搜索單元,用于根據(jù)所述搜索目標(biāo)的數(shù)據(jù)結(jié)構(gòu)創(chuàng)建相應(yīng)的搜索器,并利用創(chuàng)建的搜索器向所述搜索目標(biāo)的數(shù)據(jù)結(jié)構(gòu)所對(duì)應(yīng)的數(shù)據(jù)庫(kù)中搜索所述搜索目標(biāo)。
[0033]本發(fā)明實(shí)施例提供了一種異構(gòu)數(shù)據(jù)搜索方法及裝置,通過將不同數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)存儲(chǔ)至不同的數(shù)據(jù)庫(kù)中,并在接收到搜索請(qǐng)求,根據(jù)搜索請(qǐng)求確定搜索目標(biāo)的數(shù)據(jù)結(jié)構(gòu),在數(shù)據(jù)庫(kù)中進(jìn)行搜索目標(biāo)的搜索時(shí),只需在該搜索目標(biāo)所在的數(shù)據(jù)庫(kù)中進(jìn)行搜索即可,無需對(duì)包括有所有數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)的數(shù)據(jù)庫(kù)進(jìn)行搜索,從而減小了搜索范圍,進(jìn)而提高了搜索效率。
【附圖說明】
[0034]圖1是本發(fā)明實(shí)施例提供的方法流程圖;
[0035]圖2是本發(fā)明另一實(shí)施例提供的方法流程圖;
[0036]圖3是本發(fā)明實(shí)施例提供的裝置所在設(shè)備的硬件架構(gòu)圖;
[0037]圖4是本發(fā)明實(shí)施例提供的裝置結(jié)構(gòu)示意圖;
[0038]圖5是本發(fā)明另一實(shí)施例提供的裝置結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0039]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0040]如圖1所示,本發(fā)明實(shí)施例提供了一種異構(gòu)數(shù)據(jù)搜索方法,將不同數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)存儲(chǔ)至不同的數(shù)據(jù)庫(kù)中,該方法可以包括以下步驟:
[0041]步驟101:接收針對(duì)搜索目標(biāo)的搜索請(qǐng)求,其中,搜索請(qǐng)求攜帶所述搜索目標(biāo)的屬性值。
[0042]步驟102:根據(jù)搜索請(qǐng)求,在索引庫(kù)中查找搜索目標(biāo)的屬性值對(duì)應(yīng)的索引信息。
[0043]步驟103:根據(jù)查找到的索引信息,確定搜索目標(biāo)的存儲(chǔ)地址和所述搜索目標(biāo)的數(shù)據(jù)結(jié)構(gòu)。
[0044]步驟104:根據(jù)搜索目標(biāo)的存儲(chǔ)地址,向搜索目標(biāo)的數(shù)據(jù)結(jié)構(gòu)所對(duì)應(yīng)的數(shù)據(jù)庫(kù)中搜索出搜索目標(biāo)。
[0045]根據(jù)上述方案,通過將不同數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)存儲(chǔ)至不同的數(shù)據(jù)庫(kù)中,并在接收到搜索請(qǐng)求,根據(jù)搜索請(qǐng)求確定搜索目標(biāo)的數(shù)據(jù)結(jié)構(gòu),在數(shù)據(jù)庫(kù)中進(jìn)行搜索目標(biāo)的搜索時(shí),只需在該搜索目標(biāo)所在的數(shù)據(jù)庫(kù)中進(jìn)行搜索即可,無需對(duì)包括有所有數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)的數(shù)據(jù)庫(kù)進(jìn)行搜索,從而減小了搜索范圍,進(jìn)而提高了搜索效率。
[0046]為了實(shí)現(xiàn)不同數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)在搜索時(shí)的效率較高,還需要預(yù)先為各個(gè)數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)建立索引,在待索引數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)包括結(jié)構(gòu)化數(shù)據(jù)時(shí),根據(jù)結(jié)構(gòu)化數(shù)據(jù)所對(duì)應(yīng)的元數(shù)據(jù)標(biāo)準(zhǔn),創(chuàng)建所述待索引數(shù)據(jù)的元數(shù)據(jù),并將創(chuàng)建的待索引數(shù)據(jù)的元數(shù)據(jù)存儲(chǔ)至結(jié)構(gòu)化數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)庫(kù)中;根據(jù)待索引數(shù)據(jù)的元數(shù)據(jù)的存儲(chǔ)地址,對(duì)該元數(shù)據(jù)建立索引;在待索引數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)包括非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù)時(shí),抓取待索引數(shù)據(jù)的文本內(nèi)容,并根據(jù)非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù)所對(duì)應(yīng)的元數(shù)據(jù)標(biāo)準(zhǔn),創(chuàng)建待索引的數(shù)據(jù)的索引信息。
[0047]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖及具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步地詳細(xì)描述。
[0048]如圖2所示,本發(fā)明實(shí)施例提供了一種異構(gòu)數(shù)據(jù)搜索方法,該方法可以包括以下步驟:
[0049]步驟201:設(shè)置不同數(shù)據(jù)結(jié)構(gòu)的元數(shù)據(jù)標(biāo)準(zhǔn)。
[0050]在本實(shí)施例中,數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)可以包括:結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。其中,結(jié)構(gòu)化數(shù)據(jù)簡(jiǎn)單是指數(shù)據(jù)庫(kù),例如,企業(yè)ERP、財(cái)務(wù)系統(tǒng)、醫(yī)療HIS數(shù)據(jù)庫(kù)、教育一卡通、政府行政審批、其他核心數(shù)據(jù)庫(kù)等。半結(jié)構(gòu)化數(shù)據(jù)可以包括郵件、HTML、報(bào)表、資源庫(kù)等。非結(jié)構(gòu)化數(shù)