亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

數(shù)據(jù)庫查詢的方法和設(shè)備的制造方法

文檔序號(hào):10665800閱讀:196來源:國(guó)知局
數(shù)據(jù)庫查詢的方法和設(shè)備的制造方法【專利摘要】本發(fā)明實(shí)施例提供了一種數(shù)據(jù)庫查詢的方法和設(shè)備,該方法包括:獲取待查詢語句,待查詢語句為自然語言查詢語句;根據(jù)預(yù)設(shè)詞庫劃分待查詢語句,得到N個(gè)詞語;從預(yù)設(shè)數(shù)據(jù)庫中確定第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,第一詞語為N個(gè)詞語中的任一詞語,為N個(gè)詞語中的各個(gè)詞語分別標(biāo)注標(biāo)簽,得到與待查詢語句對(duì)應(yīng)的標(biāo)注信息;根據(jù)標(biāo)注信息生成K個(gè)查詢條件,K個(gè)查詢條件中的每個(gè)查詢條件包括第二詞語、操作符和第三詞語;根據(jù)標(biāo)注信息生成查詢目標(biāo),查詢目標(biāo)包括N個(gè)詞語中的至少一個(gè)詞語的數(shù)據(jù)庫實(shí)體;根據(jù)K個(gè)查詢條件和查詢目標(biāo)進(jìn)行查詢,得到查詢結(jié)果。本發(fā)明實(shí)施例方法能夠根據(jù)用戶請(qǐng)求進(jìn)行數(shù)據(jù)庫查詢,提升用戶體驗(yàn)?!緦@f明】數(shù)據(jù)庫查詢的方法和設(shè)備
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及通信領(lǐng)域,特別涉及一種數(shù)據(jù)庫查詢的方法和設(shè)備。【
背景技術(shù)
】[0002]對(duì)于傳統(tǒng)的數(shù)據(jù)庫查詢,當(dāng)前仍然需要專業(yè)人員深入理解數(shù)據(jù)庫內(nèi)部的結(jié)構(gòu)信息,并且構(gòu)建適當(dāng)?shù)慕Y(jié)構(gòu)化查詢語言(StructuredQueryLanguage,SQL)查詢語句,對(duì)于非專業(yè)人員來說,如果不具備數(shù)據(jù)庫的專業(yè)知識(shí),對(duì)于數(shù)據(jù)庫操作將比較困難。而隨著互聯(lián)網(wǎng)搜索引擎技術(shù)的不斷發(fā)展,人們逐漸習(xí)慣了在搜索框中輸入自然語言搜索結(jié)果,同樣希望通過自然語言查詢數(shù)據(jù)庫。[0003]由于普通用戶不了解數(shù)據(jù)庫中的結(jié)構(gòu)、數(shù)據(jù)庫字段名/值,同時(shí)在描述查詢請(qǐng)求的時(shí)候會(huì)省略上下文信息,因此現(xiàn)有技術(shù)存在諸多問題,例如,用戶請(qǐng)求中的描述無法完全和數(shù)據(jù)庫字段名/值一一對(duì)應(yīng),而對(duì)于SQL,如果描述的請(qǐng)求與數(shù)據(jù)庫字段名/值對(duì)應(yīng)不上可能查詢不到結(jié)果;用戶請(qǐng)求中可能包含歧義的信息,即用戶查詢語句中包含的一個(gè)或者多個(gè)詞語可能包含不只一種數(shù)據(jù)庫對(duì)象(表、字段),導(dǎo)致無法得到查詢結(jié)果,用戶體驗(yàn)差。[0004]因此,希望提供一種技術(shù),能夠根據(jù)用戶請(qǐng)求進(jìn)行數(shù)據(jù)庫查詢。【
發(fā)明內(nèi)容】[0005]本發(fā)明實(shí)施例提供了一種數(shù)據(jù)庫查詢的方法和設(shè)備,該方法能夠根據(jù)用戶請(qǐng)求進(jìn)行數(shù)據(jù)庫查詢,提升用戶體驗(yàn)。[0006]第一方面,提供了一種數(shù)據(jù)庫查詢的方法,包括:獲取待查詢語句,該待查詢語句為自然語言查詢語句;根據(jù)預(yù)設(shè)詞庫劃分該待查詢語句,得到N個(gè)詞語,N為大于或等于I的整數(shù);從預(yù)設(shè)數(shù)據(jù)庫中確定第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,該第一詞語為該N個(gè)詞語中的任一詞語;為該N個(gè)詞語中的各個(gè)詞語分別標(biāo)注標(biāo)簽,得到與該待查詢語句對(duì)應(yīng)的標(biāo)注信息,該標(biāo)注信息包括該N個(gè)詞語和與該N個(gè)詞語中的各個(gè)詞語呈一一對(duì)應(yīng)關(guān)系的標(biāo)簽,其中,與該第一詞語呈一一對(duì)應(yīng)關(guān)系的標(biāo)簽用于表示該第一詞語的數(shù)據(jù)類型,該第一詞語的標(biāo)簽包括屬性名或?qū)傩灾?;根?jù)該標(biāo)注信息生成K個(gè)查詢條件,該K個(gè)查詢條件中的每個(gè)查詢條件包括第二詞語、操作符和第三詞語,其中,該操作符表示該第二詞語和該第三詞語的關(guān)系,該第二詞語的標(biāo)簽為屬性名,該第三詞語的標(biāo)簽為屬性值,K為大于或等于I且小于N的整數(shù);根據(jù)該標(biāo)注信息生成查詢目標(biāo),該查詢目標(biāo)包括該N個(gè)詞語中的至少一個(gè)詞語的數(shù)據(jù)庫實(shí)體,其中,該至少一個(gè)詞語的標(biāo)簽為屬性名,該至少一個(gè)詞語中的每個(gè)詞語的數(shù)據(jù)庫實(shí)體為該每個(gè)詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體中的一個(gè);根據(jù)該K個(gè)查詢條件和該查詢目標(biāo)進(jìn)行查詢,得到查詢結(jié)果。[0007]結(jié)合第一方面,在第一種可能的實(shí)現(xiàn)方式中,該根據(jù)預(yù)設(shè)詞庫劃分該待查詢語句,得到N個(gè)詞語,包括:根據(jù)預(yù)設(shè)詞庫劃分該待查詢語句,得到N個(gè)初始詞語;根據(jù)預(yù)設(shè)規(guī)則,規(guī)范化該N個(gè)初始詞語,得到該N個(gè)詞語。[0008]結(jié)合第一方面或第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,該從預(yù)設(shè)數(shù)據(jù)庫中確定第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,包括:從預(yù)設(shè)數(shù)據(jù)庫中確定該第一詞語的η個(gè)初始候選數(shù)據(jù)庫實(shí)體,η為大于或等于I的整數(shù);當(dāng)η大于I時(shí),確定該η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與該第一詞語的相關(guān)度,將該η個(gè)初始候選數(shù)據(jù)庫實(shí)體中相關(guān)度高于預(yù)設(shè)閾值的初始候選數(shù)據(jù)庫實(shí)體確定為該第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,或者,當(dāng)η等于I時(shí),將該第一詞語的η個(gè)初始候選數(shù)據(jù)庫實(shí)體確定為該第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體。[0009]結(jié)合第二種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,該確定該η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與該第一詞語的相關(guān)度,包括:根據(jù)以下方法中的至少一種方法確定該η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與該第一詞語的相關(guān)度:命中率、向量空間余弦和編輯距離。[0010]結(jié)合第一方面、第一至第三種可能的實(shí)現(xiàn)方式中的任一種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,在根據(jù)該標(biāo)注信息生成K個(gè)查詢條件之前,還包括:根據(jù)該標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并該標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語,得到第一合并詞語,該第一合并詞語為該標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用該第一合并詞語替換該標(biāo)注信息中該連續(xù)標(biāo)簽為屬性名的詞語,以對(duì)該標(biāo)注信息進(jìn)行更新,和/或根據(jù)該標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并該標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語,得到第二合并詞語,該第二合并詞語為該標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用該第二合并詞語替換該標(biāo)注信息中該連續(xù)標(biāo)簽為屬性值的詞語,以對(duì)該標(biāo)注信息進(jìn)行更新,其中,該根據(jù)該標(biāo)注信息生成K個(gè)查詢條件,包括根據(jù)更新后的標(biāo)注信息生成該K個(gè)查詢條件,該根據(jù)該標(biāo)注信息生成查詢目標(biāo),包括根據(jù)更新后的標(biāo)注信息生成該查詢目標(biāo)。[0011]結(jié)合第一方面、第一至第四種可能的實(shí)現(xiàn)方式中的任一種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,該根據(jù)該標(biāo)注信息生成K個(gè)查詢條件,包括:根據(jù)該標(biāo)注信息生成M個(gè)候選查詢條件,該M個(gè)候選查詢條件中的每個(gè)候選查詢條件包括第一候選詞語、操作符和第二候選詞語的對(duì)應(yīng)關(guān)系,其中第一候選詞語的標(biāo)簽為屬性名,第二候選詞語的標(biāo)簽為屬性值,M為大于或等于K的整數(shù);確定該每個(gè)候選查詢條件的第一候選詞語和該第二候選詞語的匹配指數(shù);將該M個(gè)候選查詢條件中的匹配指數(shù)大于預(yù)設(shè)閾值的K個(gè)候選查詢條件確定為該K個(gè)查詢條件。[0012]結(jié)合第五種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,該根據(jù)該標(biāo)注信息生成M個(gè)候選查詢條件,包括:根據(jù)該標(biāo)注信息生成M個(gè)初始候選查詢條件;根據(jù)用戶信息,對(duì)該M個(gè)初始候選查詢條件進(jìn)行消歧處理,得到該M個(gè)候選查詢條件,該消歧處理包括根據(jù)用戶信息消除該M個(gè)初始候選查詢條件中存在歧義的初始候選查詢條件中的歧義,其中,該用戶信息包括終端設(shè)備的硬件信息、終端系統(tǒng)的軟件信息、保存在終端內(nèi)存或者存儲(chǔ)設(shè)備上的用戶數(shù)據(jù)、用戶的歷史操作和用戶的設(shè)定中的至少一種。[0013]結(jié)合第五種或第六種可能的實(shí)現(xiàn)方式,在第七種可能的實(shí)現(xiàn)方式中,該確定該每個(gè)候選查詢條件的第一候選詞語和該第二候選詞語的匹配指數(shù),包括:根據(jù)該第一候選詞語和該第二候選詞語的配對(duì)概率、序列距離、數(shù)據(jù)庫數(shù)據(jù)類型匹配度和語言習(xí)慣約束中的至少一種確定該匹配指數(shù)。[0014]結(jié)合第七種可能的實(shí)現(xiàn)方式,在第八種可能的實(shí)現(xiàn)方式中,該配對(duì)概率由該第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與該第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集決定,其中,該第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與該第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集越少,該配對(duì)概率越大,該匹配指數(shù)越大。[0015]結(jié)合第七種或第八種可能的實(shí)現(xiàn)方式,在第九種可能的實(shí)現(xiàn)方式中,該序列距離由該第一候選詞語和該第二候選詞語在該標(biāo)注信息或該查詢語句中的距離決定,其中,該第一候選詞語和該第二候選詞語在該標(biāo)注信息或該查詢語句中的距離越大,該序列距離越大,該匹配指數(shù)越小,該標(biāo)注信息或該查詢語句中該第一候選詞語和該第二候選詞語之間的詞語的多少,表示該距離的大小。[0016]結(jié)合第七至第九種可能的實(shí)現(xiàn)方式中的任一種可能的實(shí)現(xiàn)方式,在第十種可能的實(shí)現(xiàn)方式中,該數(shù)據(jù)庫數(shù)據(jù)類型匹配度由該第一候選詞語和該第二候選詞語的數(shù)據(jù)庫數(shù)據(jù)類型是否一致決定,其中,該第一候選詞語和該第二候選詞語的數(shù)據(jù)類型一致時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度大于該第一候選詞語和該第二候選詞語的數(shù)據(jù)類型不一致時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度,該匹配指數(shù)與該數(shù)據(jù)庫類型匹配度正相關(guān)。[0017]結(jié)合第七至第十種可能的實(shí)現(xiàn)方式中的任一種可能的實(shí)現(xiàn)方式,在第十一種可能的實(shí)現(xiàn)方式中,該語言習(xí)慣約束由該第一候選詞語和該第二候選詞語是否符合數(shù)據(jù)庫或語言習(xí)慣決定,其中,該第一候選詞語和該第二候選詞語符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束小于該第一候選詞語和該第二候選詞語不符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束,該匹配指數(shù)與該語言習(xí)慣約束負(fù)相關(guān)。[0018]結(jié)合第一方面、第一至第十一種可能的實(shí)現(xiàn)方式中的任一種可能的實(shí)現(xiàn)方式,在第十二種可能的實(shí)現(xiàn)方式中,該根據(jù)該標(biāo)注信息生成查詢目標(biāo),包括:確定該標(biāo)注信息中的標(biāo)簽為屬性名的詞語滿足預(yù)設(shè)條件和/或?yàn)楣曼c(diǎn)詞語,其中該孤點(diǎn)詞語沒有對(duì)應(yīng)的標(biāo)簽為屬性值的詞語;將該標(biāo)注信息中的標(biāo)簽為屬性名的詞語的屬性名作為該查詢目標(biāo)。[0019]第二方面,提供了一種數(shù)據(jù)庫查詢的設(shè)備,包括:獲取單元,用于獲取待查詢語句,該待查詢語句為自然語言查詢語句;劃分單元,用于根據(jù)預(yù)設(shè)詞庫劃分該待查詢語句,得到N個(gè)詞語,N為大于或等于I的整數(shù);確定單元,用于從預(yù)設(shè)數(shù)據(jù)庫中確定第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,該第一詞語為該N個(gè)詞語中的任一詞語;標(biāo)注單元,用于為該N個(gè)詞語中的各個(gè)詞語分別標(biāo)注標(biāo)簽,得到與該待查詢語句對(duì)應(yīng)的標(biāo)注信息,該標(biāo)注信息包括該N個(gè)詞語和與該N個(gè)詞語中的各個(gè)詞語呈一一對(duì)應(yīng)關(guān)系的標(biāo)簽,其中,與該第一詞語呈一一對(duì)應(yīng)關(guān)系的標(biāo)簽用于表示該第一詞語的數(shù)據(jù)類型,該第一詞語的標(biāo)簽包括屬性名或?qū)傩灾?;第一生成單元,用于根?jù)該標(biāo)注信息生成K個(gè)查詢條件,該K個(gè)查詢條件中的每個(gè)查詢條件包括第二詞語、操作符和第三詞語,其中,該操作符表示該第二詞語和該第三詞語的關(guān)系,該第二詞語的標(biāo)簽為屬性名,該第三詞語的標(biāo)簽為屬性值,K為大于或等于I且小于N的整數(shù);第二生成單元,用于根據(jù)該標(biāo)注信息生成查詢目標(biāo),該查詢目標(biāo)包括該N個(gè)詞語中的至少一個(gè)詞語的數(shù)據(jù)庫實(shí)體,其中,該至少一個(gè)詞語的標(biāo)簽為屬性名,該至少一個(gè)詞語中的每個(gè)詞語的數(shù)據(jù)庫實(shí)體為該每個(gè)詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體中的一個(gè);查詢單元,用于根據(jù)該K個(gè)查詢條件和該查詢目標(biāo)進(jìn)行查詢,得到查詢結(jié)果。[0020]結(jié)合第二方面,在第一種可能的實(shí)現(xiàn)方式中,該劃分單元根據(jù)預(yù)設(shè)詞庫劃分該待查詢語句,得到N個(gè)初始詞語;根據(jù)預(yù)設(shè)規(guī)則,規(guī)范化該N個(gè)初始詞語,得到該N個(gè)詞語。[0021]結(jié)合第二方面或第二方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,該確定單元從預(yù)設(shè)數(shù)據(jù)庫中確定該第一詞語的η個(gè)初始候選數(shù)據(jù)庫實(shí)體,η為大于或等于I的整數(shù);當(dāng)η大于I時(shí),確定該η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與該第一詞語的相關(guān)度,將該η個(gè)初始候選數(shù)據(jù)庫實(shí)體中相關(guān)度高于預(yù)設(shè)閾值的初始候選數(shù)據(jù)庫實(shí)體確定為該第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,或者,當(dāng)η等于I時(shí),將該第一詞語的η個(gè)初始候選數(shù)據(jù)庫實(shí)體確定為該第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體。[0022]結(jié)合第二方面的第二種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,該確定單元根據(jù)以下方法中的至少一種方法確定該η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與該第一詞語的相關(guān)度:命中率、向量空間余弦和編輯距離。[0023]結(jié)合第二方面、第二方面的第一至第三種可能的實(shí)現(xiàn)方式中的任一種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,還包括:合并單元,用于在第一生成單元根據(jù)該標(biāo)注信息生成K個(gè)查詢條件之前,根據(jù)該標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并該標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語,得到第一合并詞語,該第一合并詞語為該標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用該第一合并詞語替換該標(biāo)注信息中該連續(xù)標(biāo)簽為屬性名的詞語,以對(duì)該標(biāo)注信息進(jìn)行更新,和/或根據(jù)該標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并該標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語,得到第二合并詞語,該第二合并詞語為該標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用該第二合并詞語替換該標(biāo)注信息中該連續(xù)標(biāo)簽為屬性值的詞語,以對(duì)該標(biāo)注信息進(jìn)行更新,其中,該第一生成單元根據(jù)更新后的標(biāo)注信息生成該K個(gè)查詢條件,該第二生成單元根據(jù)更新后的標(biāo)注信息生成該查詢目標(biāo)。[0024]結(jié)合第二方面、第二方面的第一至第四種可能的實(shí)現(xiàn)方式中的任一種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,該第一生成單元根據(jù)該標(biāo)注信息生成M個(gè)候選查詢條件,該M個(gè)候選查詢條件中的每個(gè)候選查詢條件包括第一候選詞語、操作符和第二候選詞語的對(duì)應(yīng)關(guān)系,其中第一候選詞語的標(biāo)簽為屬性名,第二候選詞語的標(biāo)簽為屬性值,M為大于或等于K的整數(shù);確定該每個(gè)候選查詢條件的第一候選詞語和該第二候選詞語的匹配指數(shù);將該M個(gè)候選查詢條件中的匹配指數(shù)大于預(yù)設(shè)閾值的K個(gè)候選查詢條件確定為該K個(gè)查詢條件。[0025]結(jié)合第二方面的第五種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,該第一生成單元,根據(jù)該標(biāo)注信息生成M個(gè)初始候選查詢條件;根據(jù)用戶信息,對(duì)該M個(gè)初始候選查詢條件進(jìn)行消歧處理,得到該M個(gè)候選查詢條件,該消歧處理包括根據(jù)用戶信息消除該M個(gè)初始候選查詢條件中存在歧義的初始候選查詢條件中的歧義,其中,該用戶信息包括終端設(shè)備的硬件信息、終端系統(tǒng)的軟件信息、保存在終端內(nèi)存或者存儲(chǔ)設(shè)備上的用戶數(shù)據(jù)、用戶的歷史操作和用戶的設(shè)定中的至少一種。[0026]結(jié)合第二方面的第五種或第六種可能的實(shí)現(xiàn)方式,在第七種可能的實(shí)現(xiàn)方式中,該第一生成單元根據(jù)該第一候選詞語和該第二候選詞語的配對(duì)概率、序列距離、數(shù)據(jù)庫數(shù)據(jù)類型匹配度和語言習(xí)慣約束中的至少一種確定該匹配指數(shù)。[0027]結(jié)合第二方面的第七種可能的實(shí)現(xiàn)方式,在第八種可能的實(shí)現(xiàn)方式中,該配對(duì)概率由該第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與該第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集決定,其中,該第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與該第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集越少,該配對(duì)概率越大,該匹配指數(shù)越大。[0028]結(jié)合第二方面的第七種或第八種可能的實(shí)現(xiàn)方式,在第九種可能的實(shí)現(xiàn)方式中,該序列距離由該第一候選詞語和該第二候選詞語在該標(biāo)注信息或該查詢語句中的距離決定,其中,該第一候選詞語和該第二候選詞語在該標(biāo)注信息或該查詢語句中的距離越大,該序列距離越大,該匹配指數(shù)越小,該標(biāo)注信息或該查詢語句中該第一候選詞語和該第二候選詞語之間的詞語的多少,表示該距離的大小。[0029]結(jié)合第二方面的第七至第九種可能的實(shí)現(xiàn)方式中的任一種可能的實(shí)現(xiàn)方式,在第十種可能的實(shí)現(xiàn)方式中,該數(shù)據(jù)庫數(shù)據(jù)類型匹配度由該第一候選詞語和該第二候選詞語的數(shù)據(jù)庫數(shù)據(jù)類型是否一致決定,其中,該第一候選詞語和該第二候選詞語的數(shù)據(jù)類型一致時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度大于該第一候選詞語和該第二候選詞語的數(shù)據(jù)類型不一致時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度,該匹配指數(shù)與該數(shù)據(jù)庫類型匹配度正相關(guān)。[0030]結(jié)合第二方面的第七至第十種可能的實(shí)現(xiàn)方式中的任一種可能的實(shí)現(xiàn)方式,在第十一種可能的實(shí)現(xiàn)方式中,該語言習(xí)慣約束由該第一候選詞語和該第二候選詞語是否符合數(shù)據(jù)庫或語言習(xí)慣決定,其中,該第一候選詞語和該第二候選詞語符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束小于該第一候選詞語和該第二候選詞語不符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束,該匹配指數(shù)與該語言習(xí)慣約束負(fù)相關(guān)。[0031]結(jié)合第二方面、第一至第十一種可能的實(shí)現(xiàn)方式中的任一種可能的實(shí)現(xiàn)方式,在第十二種可能的實(shí)現(xiàn)方式中,該第二生成單元確定該標(biāo)注信息中的標(biāo)簽為屬性名的詞語滿足預(yù)設(shè)條件和/或?yàn)楣曼c(diǎn)詞語,其中,該孤點(diǎn)詞語沒有對(duì)應(yīng)的標(biāo)簽為屬性值的詞語;將該標(biāo)注信息中的標(biāo)簽為屬性名的詞語的屬性名作為該查詢目標(biāo)。[0032]基于上述技術(shù)方案,本發(fā)明實(shí)施例通過將為自然語言查詢語句的待查詢語句生成查詢目標(biāo)和查詢條件,根據(jù)查詢目標(biāo)和查詢條件進(jìn)行查詢,進(jìn)而得到查詢結(jié)果,能夠根據(jù)用戶請(qǐng)求進(jìn)行數(shù)據(jù)庫查詢。本發(fā)明實(shí)施例無需用戶熟悉數(shù)據(jù)庫查詢語言,提升用戶體驗(yàn)?!靖綀D說明】[0033]為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)本發(fā)明實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面所描述的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。[0034]圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)庫查詢的方法的示意性流程圖。[0035]圖2是根據(jù)本發(fā)明另一實(shí)施例的數(shù)據(jù)庫查詢的方法的示意性流程圖。[0036]圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)庫查詢的設(shè)備的示意框圖。[0037]圖4是根據(jù)本發(fā)明另一實(shí)施例的數(shù)據(jù)庫查詢的設(shè)備的示意框圖?!揪唧w實(shí)施方式】[0038]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明的一部分實(shí)施例,而不是全部實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都應(yīng)屬于本發(fā)明保護(hù)的范圍。[0039]應(yīng)理解,在本發(fā)明實(shí)施例中,用戶設(shè)備(UE,UserEquipment)包括但不限于移動(dòng)臺(tái)(MS,MobileStat1n)、移動(dòng)終端(MobileTerminal)、移動(dòng)電話(MobileTelephone)、手機(jī)(handset)及便攜設(shè)備(portableequipment)等,該用戶設(shè)備可以經(jīng)無線接入網(wǎng)(RAN,Rad1AccessNetwork)與一個(gè)或多個(gè)核心網(wǎng)進(jìn)行通信,例如,用戶設(shè)備可以是移動(dòng)電話(或稱為“蜂窩”電話)、具有無線通信功能的計(jì)算機(jī)等,用戶設(shè)備還可以是計(jì)算機(jī)、Pad、便攜式、袖珍式、手持式、計(jì)算機(jī)內(nèi)置的或者車載的移動(dòng)裝置。[0040]圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)庫查詢的方法的示意性流程圖。圖1所示的方法可以由數(shù)據(jù)庫查詢的設(shè)備執(zhí)行,具體地,如圖1所示的方法包括:[0041]110,獲取待查詢語句,待查詢語句為自然語言查詢語句。[0042]120,根據(jù)預(yù)設(shè)詞庫劃分待查詢語句,得到N個(gè)詞語,N為大于或等于I的整數(shù)。[0043]130,從預(yù)設(shè)數(shù)據(jù)庫中確定第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,第一詞語為N個(gè)詞語中的任一詞語。[0044]140為N個(gè)詞語中的各個(gè)詞語分別標(biāo)注標(biāo)簽,得到與待查詢語句對(duì)應(yīng)的標(biāo)注信息,標(biāo)注信息包括N個(gè)詞語和與N個(gè)詞語中的各個(gè)詞語呈一一對(duì)應(yīng)關(guān)系的標(biāo)簽,其中,與第一詞語呈一一對(duì)應(yīng)關(guān)系的標(biāo)簽用于表示第一詞語的數(shù)據(jù)類型,第一詞語的標(biāo)簽包括屬性名或?qū)傩灾?。[0045]150,根據(jù)標(biāo)注信息生成K個(gè)查詢條件,K個(gè)查詢條件中的每個(gè)查詢條件包括第二詞語、操作符和第三詞語,其中,操作符表示第二詞語和第三詞語的關(guān)系,第二詞語的標(biāo)簽為屬性名,第三詞語的標(biāo)簽為屬性值,K為大于或等于I且小于N的整數(shù)。[0046]160,根據(jù)標(biāo)注信息生成查詢目標(biāo),查詢目標(biāo)包括N個(gè)詞語中的至少一個(gè)詞語的數(shù)據(jù)庫實(shí)體,其中,至少一個(gè)詞語的標(biāo)簽為屬性名,至少一個(gè)詞語中的每個(gè)詞語的數(shù)據(jù)庫實(shí)體為每個(gè)詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體中的一個(gè)。[0047]170,根據(jù)K個(gè)查詢條件和查詢目標(biāo)進(jìn)行查詢,得到查詢結(jié)果。[0048]因此,本發(fā)明實(shí)施例通過根據(jù)將為自然語言查詢語句的待查詢語句生成查詢目標(biāo)和查詢條件,根據(jù)查詢目標(biāo)和查詢條件進(jìn)行查詢,進(jìn)而得到查詢結(jié)果,能夠根據(jù)用戶請(qǐng)求進(jìn)行數(shù)據(jù)庫查詢。本發(fā)明實(shí)施例無需用戶熟悉數(shù)據(jù)庫查詢語言,提升用戶體驗(yàn)。[0049]應(yīng)理解,N個(gè)詞語可以為待查詢語句中的Y個(gè)詞語中的N個(gè)具有實(shí)際意義的詞語,例如,對(duì)于查詢語句“大于30歲的人數(shù)”,可以劃分為Y=4個(gè)詞語“大于”“30歲”“的”和“人數(shù)”,其中,N個(gè)詞語為4個(gè)詞語中的2個(gè)詞語,即N=2,該2個(gè)詞語為“30歲”和“人數(shù)”。換句話說,N個(gè)詞語中的每一個(gè)詞語都存在候選數(shù)據(jù)庫實(shí)體,也就是說N個(gè)詞語可以為Y個(gè)詞語中具有候選數(shù)據(jù)庫實(shí)體的詞語。N可以為大于或等于I的整數(shù)。還應(yīng)理解,數(shù)據(jù)庫實(shí)體為數(shù)據(jù)庫中的屬性名或?qū)傩灾?,?shù)據(jù)庫實(shí)體也可以為具有實(shí)際意義的詞,例如可以為實(shí)詞等。[0050]應(yīng)理解,操作符可以包括多種符號(hào),例如可以為彡、彡、=、〈、>等。其中,可以通過預(yù)定義規(guī)則的方式,識(shí)別查詢語句中包含的操作符。例如預(yù)定義操作符與規(guī)則對(duì)為“〈:在**以下I小于”,那么對(duì)于“年齡在30歲以下”,識(shí)別出查詢條件(年齡,操作符,30),“在**以下”根據(jù)預(yù)定義規(guī)則為操作符“〈”,那么完整的查詢條件為(年齡,〈,30)。[0051]應(yīng)理解,本發(fā)明實(shí)施例中的標(biāo)注信息也可以表述為標(biāo)注序列或標(biāo)注序列信息。[0052]應(yīng)注意,在150中,第二詞語和第三詞語中的至少一個(gè)為N個(gè)詞語的候選數(shù)據(jù)庫實(shí)體中的數(shù)據(jù)庫實(shí)體。第二詞語也可以稱為第二數(shù)據(jù)庫實(shí)體,第三詞語也可以稱為第三數(shù)據(jù)庫實(shí)體;換句話說,在150中,根據(jù)標(biāo)注信息生成K個(gè)查詢條件,K個(gè)查詢條件中的每個(gè)查詢條件包括第二數(shù)據(jù)庫實(shí)體、操作符和第三數(shù)據(jù)庫實(shí)體,其中,操作符表示第二數(shù)據(jù)庫實(shí)體和第三數(shù)據(jù)庫實(shí)體的關(guān)系,第二數(shù)據(jù)庫實(shí)體的標(biāo)簽為屬性名,第三數(shù)據(jù)庫實(shí)體的標(biāo)簽為屬性值。其中第二數(shù)據(jù)庫實(shí)體和第三數(shù)據(jù)庫實(shí)體中的至少一個(gè)為N個(gè)詞語的候選數(shù)據(jù)庫實(shí)體中的數(shù)據(jù)庫實(shí)體,I(K<N0[0053]可選地,在170中,可以根據(jù)K個(gè)查詢條件和查詢目標(biāo)生成目標(biāo)查詢語句,目標(biāo)查詢語句為數(shù)據(jù)庫查詢語言,執(zhí)行目標(biāo)查詢語句,得到查詢結(jié)果。[0054]例如,用戶輸入查詢語句(待查詢語句)“年齡小于30歲的高級(jí)工程師的姓名”,經(jīng)過上述過程可以得到查詢條件為:“age〈30歲”和“Job=高級(jí)工程師”,查詢目標(biāo)為“姓名”(name),則生成的sql語句(目標(biāo)查詢語句)為:selectnamefromviewwhereage〈30andjob=‘高級(jí)工程師’。[0055]應(yīng)理解,數(shù)據(jù)庫查詢語言可以是SQL語言,也可以為NO-SQL語言,本發(fā)明實(shí)施例并不對(duì)此做限定。[0056]可選地,作為另一實(shí)施例,在120中,根據(jù)預(yù)設(shè)詞庫劃分待查詢語句,得到N個(gè)初始詞語;根據(jù)預(yù)設(shè)規(guī)則,規(guī)范化N個(gè)初始詞語,得到N個(gè)詞語。[0057]應(yīng)理解,在本發(fā)明實(shí)施例中的詞語可以為詞組或者短語等。[0058]具體而言,可以根據(jù)從自然語言的詞語、詞組或者短語的概念、關(guān)系、屬性等方面,解析待查詢語句,例如,可以根據(jù)詞語、詞組或者短語的概念、關(guān)系、屬性等對(duì)用戶查詢語句(待查詢語句)進(jìn)行分詞,即將待查詢語句切分成N個(gè)詞語、詞組或者短語(初始詞語)。[0059]根據(jù)詞語、詞組或者短語的概念、關(guān)系、屬性等對(duì)用戶查詢語句進(jìn)行命名實(shí)體識(shí)另IJ,即標(biāo)識(shí)用戶查詢語句中的特定詞語、詞組或者短語的實(shí)體名稱、類別。例如用戶查詢語句“銷售部過去三年的業(yè)績(jī)”,命名實(shí)體的結(jié)果可以為“銷售部-機(jī)構(gòu)名”,“過去三年-時(shí)間”等。同時(shí)還可以將其中的特定詞語、詞組、短語規(guī)范化成特定的詞語,例如“過去三年”可以規(guī)范化成距離當(dāng)前時(shí)間前三年的日期時(shí)間,最終得到N個(gè)詞語。[0060]根據(jù)本發(fā)明實(shí)施例,還可以從自然語言的句法方面,解析用戶查詢語句,包括但不限于:根據(jù)詞法分析結(jié)果,以及自然語言的句法結(jié)果,為其中的每個(gè)詞標(biāo)注詞性,劃分包含多個(gè)詞、詞組的短句,并且生成句法結(jié)構(gòu)圖便于后續(xù)生成查詢條件。[0061]應(yīng)理解,詞庫保存了特定詞語、詞組、短語和指示其概念、屬性、關(guān)系的實(shí)體之間的關(guān)聯(lián)。詞庫還可以保存詞語的同義詞、近義詞等。詞庫可以但不限于保存在文件或者數(shù)據(jù)庫中。[0062]可選地,作為另一實(shí)施例,在130中,可以根據(jù)N個(gè)詞語從預(yù)設(shè)數(shù)據(jù)庫中確定N個(gè)詞語中的第一詞語的η個(gè)初始候選數(shù)據(jù)庫實(shí)體;,η為大于或等于I的整數(shù);當(dāng)η大于I時(shí),確定η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與第一詞語的相關(guān)度,將η個(gè)初始候選數(shù)據(jù)庫實(shí)體中相關(guān)度高于預(yù)設(shè)閾值的初始候選數(shù)據(jù)庫實(shí)體確定為第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,或者,當(dāng)η等于I時(shí),將第一詞語的η個(gè)初始候選數(shù)據(jù)庫實(shí)體確定為第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體。[0063]應(yīng)理解,第一詞語可以為N個(gè)詞語中的任意一個(gè)詞語。[0064]進(jìn)一步地,作為另一實(shí)施例,確定η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與每個(gè)詞語的相關(guān)度,包括:根據(jù)以下方法中的至少一種方法確定η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與第一詞語的相關(guān)度:命中率、向量空間余弦和編輯距離等。[0065]具體地,相關(guān)度也可以稱為相似度,例如,可以根據(jù)命中率、向量空間余弦,編輯距離等確定至少一個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與每個(gè)詞語的相關(guān)度,并對(duì)至少一個(gè)初始候選數(shù)據(jù)庫實(shí)體的實(shí)體進(jìn)行排序或過濾。假設(shè)以編輯距離作為相似度的計(jì)算方式,關(guān)鍵詞“北京大學(xué)”的候選數(shù)據(jù)庫實(shí)體有{屬性值I一一北京大學(xué),屬性值2—一北京大學(xué)深圳分院},對(duì)于屬性值I的編輯距離為0,屬性值2的編輯距離為4,屬性值比屬性值2的要小,則認(rèn)為屬性值I更相似。假如設(shè)定編輯距離過濾閾值為1,那么屬性值2將被過濾掉。[0066]應(yīng)理解,預(yù)定閾值為已確定的值,可以認(rèn)為預(yù)先已設(shè)定好的值,也可以認(rèn)為是在之前的預(yù)測(cè)過程中得到的值,較優(yōu)的,本發(fā)明實(shí)施例中的預(yù)定閾值可以直接使用,不需要計(jì)算或通過其他求解即可獲得。[0067]可選地,作為另一實(shí)施例,在140中,可以對(duì)每一個(gè)待識(shí)別的實(shí)體檢索數(shù)據(jù)庫實(shí)體庫,得到至少一個(gè)候選數(shù)據(jù)庫實(shí)體。檢索的方式可以是直接使用待識(shí)別實(shí)體本身或其數(shù)據(jù)類型。待識(shí)別實(shí)體假如是時(shí)間/日期型或者數(shù)值型,默認(rèn)是待確定的屬性值。例如用戶查詢語句“2013年畢業(yè)于北京大學(xué)的有多少人”,經(jīng)過步驟120后,換句話說預(yù)處理后,輸出若干關(guān)鍵詞序列(2013年/Date,畢業(yè),北京大學(xué)),那么對(duì)于“2013年”是時(shí)間/日期類型,則檢索其相同數(shù)據(jù)類型的屬性名,比如可能的候選數(shù)據(jù)庫實(shí)體{屬性名I——銷售時(shí)間?’屬性名2—一入職時(shí)間;屬性名3—一離職時(shí)間……},而對(duì)于“畢業(yè)”可能的候選數(shù)據(jù)庫實(shí)體{屬性名1--畢業(yè)時(shí)間;屬性名2--畢業(yè)學(xué)校;屬性名3--畢業(yè)證書},對(duì)于“北京大學(xué)”可能為{屬性值I——北京大學(xué),屬性值2——北京大學(xué)深圳分院}。從上面可見“2013年”是默認(rèn)的待確定屬性值,標(biāo)注為value(屬性值),“畢業(yè)”的候選數(shù)據(jù)實(shí)體都是屬性名,可標(biāo)注為field(屬性名),“北京大學(xué)”的候選數(shù)據(jù)庫實(shí)體都是屬性值,可標(biāo)注為value,那么輸出的標(biāo)注信息為(2013年/value,畢業(yè)/field,北京大學(xué)/value)。[0068]可選地,作為另一實(shí)施例,在150之前,本發(fā)明實(shí)施例方法還包括:根據(jù)標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語,得到第一合并詞語,第一合并詞語為標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用第一合并詞語替換標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語,以對(duì)標(biāo)注信息進(jìn)行更新,和/或根據(jù)標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語,得到第二合并詞語,第二合并詞語為標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用第二合并詞語替換標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語,以對(duì)標(biāo)注信息進(jìn)行更新,其中,在150中,根據(jù)更新后的標(biāo)注信息生成K個(gè)查詢條件。在160中,根據(jù)更新后的標(biāo)注信息生成KG個(gè)查詢條件[0069]具體而言,合并標(biāo)注信息中連續(xù)標(biāo)簽為屬性名或?qū)傩灾档脑~語,包括合并計(jì)算P(Fieldfield_l,field_2...field_n)或P(Value|value_l,value_2...value_n);具體地,當(dāng)標(biāo)注信息出現(xiàn)連續(xù)的field或value標(biāo)簽時(shí),以貪心的方式嘗試合并field_l,field_2...field_n或value_l,value_2...value_n,計(jì)算減少原候選數(shù)據(jù)庫實(shí)體數(shù)量的概率。例如用戶查詢語句“張三所屬崗位的職責(zé)”,其中關(guān)鍵詞“崗位”的候選數(shù)據(jù)庫實(shí)體可能有{崗位名稱,崗位職責(zé),崗位類型……},關(guān)鍵詞“職責(zé)”可能有{職位職責(zé),崗位職責(zé)……},用戶查詢語句對(duì)應(yīng)的標(biāo)注信息(張三/value,崗位/field,職責(zé)/field),其中“崗位”與“職責(zé)”出現(xiàn)連續(xù)field,那么嘗試合并“崗位”和“職責(zé)”,主要通過對(duì)兩者的候選數(shù)據(jù)庫實(shí)體求交集進(jìn)行判定是否最終合并,如果交集中候選數(shù)據(jù)庫實(shí)體數(shù)量減少了(不為0),證明P(Field|崗位,職責(zé))比P(FieldI崗位)和P(FieldI職責(zé))要大,那么直接合并,繼續(xù)嘗試合并下一個(gè),直到P(Field|field_l,field_2...field_n)或P(Value|value_l,value_2...value_n)出現(xiàn)最大值,更新標(biāo)注信息,比如當(dāng)前查詢語句合并后,更新標(biāo)注信息為(張三/value,崗位職責(zé)/field)。[0070]可選地,作為另一實(shí)施例,在150中,根據(jù)標(biāo)注信息生成M個(gè)候選查詢條件,M個(gè)候選查詢條件中的每個(gè)候選查詢條件包括第一候選詞語、操作符和第二候選詞語的對(duì)應(yīng)關(guān)系,其中第一候選詞語的標(biāo)簽為屬性名,第二候選詞語的標(biāo)簽為屬性值,M為大于或等于K的整數(shù);[0071]確定每個(gè)候選查詢條件的第一候選詞語和第二候選詞語的匹配指數(shù);[0072]將M個(gè)候選查詢條件中的匹配指數(shù)大于預(yù)設(shè)閾值的K個(gè)候選查詢條件確定為K個(gè)查詢條件。[0073]根據(jù)標(biāo)注信息生成M個(gè)候選查詢條件;[0074]換句話說,根據(jù)M個(gè)候選查詢條件得到第一候選查詢條件,第一候選查詢條件包括第一候選詞語、操作符和第二候選詞語的對(duì)應(yīng)關(guān)系,其中第一候選詞語的標(biāo)簽為屬性名,第二候選詞語的標(biāo)簽為屬性值;其中第一候選詞語和第二候選詞語中的至少一個(gè)為N個(gè)詞語中的詞語;確定第一候選詞語和第二候選詞語的匹配指數(shù);在匹配指數(shù)大于預(yù)設(shè)參數(shù)閾值時(shí),將第一候選查詢條件確定為第一查詢條件,其中,第一候選詞語作為第一詞語,第二候選詞語作為為第二詞語。[0075]具體而言,可以掃描標(biāo)注信息,配對(duì)field和value,或者根據(jù)隱指的Field,生成候選查詢條件。例如用戶查詢語句“年齡小于30歲的高級(jí)工程師”,其標(biāo)注信息為(年齡/field,小于,30歲/value,高級(jí)工程師/value),其中“年齡”對(duì)應(yīng)屬性名“Age”,“30歲”隱指“Age”的屬性值,“高級(jí)工程師”隱指屬性名“Job”的屬性值,假如沒有存在歧義或多個(gè)候選數(shù)據(jù)庫實(shí)體,則可配對(duì)field與value。沒配對(duì)的“高級(jí)工程師/value”,使用其隱指的field,生成候選查詢條件(age,操作符,30)和“(Job,操作符,高級(jí)工程師)”。[0076]進(jìn)一步地,作為另一實(shí)施例,根據(jù)標(biāo)注信息生成M個(gè)候選查詢條件,包括:根據(jù)標(biāo)注信息生成M個(gè)初始候選查詢條件;根據(jù)用戶信息,對(duì)M個(gè)初始候選查詢條件進(jìn)行消歧處理,得到M個(gè)候選查詢條件,消歧處理包括根據(jù)用戶信息消除M個(gè)初始候選查詢條件中存在歧義的初始候選查詢條件中的歧義,其中,用戶信息包括終端設(shè)備的硬件信息、終端系統(tǒng)的軟件信息、保存在終端內(nèi)存或者存儲(chǔ)設(shè)備上的用戶數(shù)據(jù)、用戶的歷史操作和用戶的設(shè)定中的至少一種。[0077]具體而言,可以根據(jù)用戶個(gè)人信息,消除用戶查詢語句中的歧義。例如在企業(yè)HR(HumanResource,人力資源)數(shù)據(jù)庫搜索系統(tǒng)中,用戶查詢“部門任職高級(jí)工程師的有多少人”,其中“部門”是存在歧義的實(shí)體,不知道其指的是某個(gè)或某幾個(gè)部門,但是從查詢用戶的個(gè)人信息,如工號(hào)、姓名、所在部門等信息,可以確認(rèn)查詢語句中的“部門”隱性表示是用戶的所在部門,根據(jù)用戶信息對(duì)其進(jìn)行消歧處理,得到查詢條件。[0078]應(yīng)理解,用戶個(gè)人信息包括用戶個(gè)人信息數(shù)據(jù)包括但不限于:終端設(shè)備的硬件信息,包括但不限于日期和時(shí)鐘信息(例如但不限于當(dāng)前日期、時(shí)間、時(shí)區(qū)等),位置信息(例如但不限于GPS、國(guó)家、城市),通過傳感器產(chǎn)生的信息(例如但不限于加速度、磁力、方向、陀螺儀、光線感應(yīng)、壓力、溫度、臉部感應(yīng)、重力、旋轉(zhuǎn)矢量等信息),或者上述方式的混合。終端系統(tǒng)的軟件信息,包括但不限于操作系統(tǒng)和運(yùn)行的軟件、進(jìn)程、服務(wù)的狀態(tài)、事件和提供的數(shù)據(jù)。保存在終端內(nèi)存或者存儲(chǔ)設(shè)備上的用戶數(shù)據(jù),包括但不限于短文本,通訊錄,備忘錄,提醒事項(xiàng),照片,應(yīng)用,視頻,音頻,郵件,書簽,網(wǎng)頁瀏覽記錄,商品/服務(wù)的購(gòu)買記錄,酒店預(yù)訂記錄,機(jī)票購(gòu)買記錄。用戶的歷史操作,包括但不限于用戶歷史查詢語句。用戶的設(shè)定,包括但不限于用戶信息(例如姓名、電話號(hào)、地址、賬戶等等),用戶偏好設(shè)置。[0079]可選地,作為另一實(shí)施例,確定每個(gè)候選查詢條件的第一候選詞語和第二候選詞語的匹配指數(shù),包括:[0080]根據(jù)第一候選詞語和第二候選詞語的配對(duì)概率、序列距離、數(shù)據(jù)庫數(shù)據(jù)類型匹配度和語言習(xí)慣約束中的至少一種確定匹配指數(shù)。[0081]其中,匹配指數(shù)與配對(duì)概率、序列距離和語言習(xí)慣約束成負(fù)相關(guān)。匹配指數(shù)與數(shù)據(jù)庫數(shù)據(jù)類型匹配度成正相關(guān)。配對(duì)概率、序列距離、數(shù)據(jù)庫數(shù)據(jù)類型匹配度和語言習(xí)慣約束的定義如下,配對(duì)概率指第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集的多少,當(dāng)?shù)谝缓蜻x詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集越少,配對(duì)概率越大;序列距離也可以稱為語句距離,指在標(biāo)注信息或查詢語句中第一候選詞語和第二候選詞語之間的詞語或字?jǐn)?shù)的多少,當(dāng)查詢語句中第一候選詞語和第二候選詞語之間的詞語或字?jǐn)?shù)越多時(shí),序列距離越大;數(shù)據(jù)庫數(shù)據(jù)類型匹配度指第一候選詞語和第二候選詞語的數(shù)據(jù)庫數(shù)據(jù)類型是否匹配(一致),第一候選詞語和第二候選詞語的數(shù)據(jù)類型匹配時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度大于第一候選詞語和第二候選詞語的數(shù)據(jù)類型不匹配時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度;語言習(xí)慣約束指第一候選詞語和第二候選詞語是否符合數(shù)據(jù)庫或語言習(xí)慣決定,第一候選詞語和第二候選詞語符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束小于第一候選詞語和第二候選詞語不符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束。[0082]本發(fā)明實(shí)施例中,可以根據(jù)用戶查詢語句上下文,對(duì)序列中存在歧義或有多個(gè)候選數(shù)據(jù)庫實(shí)體的待識(shí)別實(shí)體計(jì)算上述特征值(配對(duì)概率、序列距離、數(shù)據(jù)庫數(shù)據(jù)類型匹配度和語言習(xí)慣約束)。[0083]具體而言,配對(duì)概率由第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集決定,其中,第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集越少,配對(duì)概率越大,匹配指數(shù)越大。[0084]配對(duì)概率:P(Field-ValueIfield,value)表示序列中field與value配對(duì),生成查詢條件(Field,操作符,Value)的概率,主要方式是根據(jù)兩者的候選數(shù)據(jù)庫實(shí)體是否存在交集,交集的元素的多少?zèng)Q定。例如用戶查詢語句用戶查詢語句“去年畢業(yè)的研究生有多少人”,假設(shè)“去年”的候選數(shù)據(jù)庫實(shí)體有{畢業(yè)時(shí)間,入職時(shí)間,離職時(shí)間……},“畢業(yè)”的候選數(shù)據(jù)庫實(shí)體有{畢業(yè)學(xué)校,畢業(yè)證書,畢業(yè)時(shí)間……},其標(biāo)注信息為(去年/value,畢業(yè)/field,研究生/value),計(jì)算P(Field_ValueI畢業(yè),去年)時(shí),兩者存在交集{畢業(yè)時(shí)間},可認(rèn)為P(FieId-ValueI畢業(yè),去年)=s(s>0),即生成查詢條件(畢業(yè)時(shí)間,操作符,去年)的概率為S。假如交集中存在m元素,P(Field-ValueI畢業(yè),去年)=s/m。而對(duì)于P(FieId-ValueI畢業(yè),研究生),因不存在交集,則為O。[0085]具體而言,序列距離由第一候選詞語和第二候選詞語在標(biāo)注信息或查詢語句中的距離決定,其中,第一候選詞語和第二候選詞語在標(biāo)注信息或查詢語句中的距離越大,序列距離越大,匹配指數(shù)越小,標(biāo)注信息或查詢語句中第一候選詞語和第二候選詞語之間的詞語的多少,表示距離的大小。[0086]序列距離:L(Field-ValueIfield,value)表示序列中field與value配對(duì),生成查詢條件(Field,操作符,Value)時(shí)field與value之間的距離。距離越小,生成查詢條件的概率越大。主要的計(jì)算方式是根據(jù)兩者在標(biāo)注信息或查詢語句中的距離,例如(年齡/field,小于,30歲/value,職級(jí)/field,大于,18/value),其中“年齡”與“30歲,,在序列中相隔“小于”,即L(Field-ValueI年齡,30歲)為2;而L(Field-Value|年齡,18)則為8。[0087]具體而言,數(shù)據(jù)庫數(shù)據(jù)類型匹配度由第一候選詞語和第二候選詞語的數(shù)據(jù)庫數(shù)據(jù)類型是否一致決定,其中,第一候選詞語和第二候選詞語的數(shù)據(jù)類型一致時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度大于第一候選詞語和第二候選詞語的數(shù)據(jù)類型不一致時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度,匹配指數(shù)與數(shù)據(jù)庫類型匹配度正相關(guān)。[0088]數(shù)據(jù)庫數(shù)據(jù)類型匹配度:Type(Field-ValueIfield,value)表示序列中field的數(shù)據(jù)庫數(shù)據(jù)類型與value的數(shù)據(jù)類型是否一致。若一致,則配對(duì)生成查詢條件的可能性更大。例如“年齡/field”的數(shù)據(jù)庫數(shù)據(jù)類型是數(shù)值型,因此與數(shù)值型的“18/value”的Type(Field-Value年齡,18)=1,對(duì)于字符型“中國(guó)/value”的Type(Field-Value|年齡,中國(guó))=O。[0089]具體而言,語言習(xí)慣約束由第一候選詞語和第二候選詞語是否符合數(shù)據(jù)庫或語言習(xí)慣決定,其中,第一候選詞語和第二候選詞語符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束小于第一候選詞語和第二候選詞語不符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束,匹配指數(shù)與語言習(xí)慣約束負(fù)相關(guān)。[0090]語言習(xí)慣約束:C(Field-ValueIfield,value)表不序列中field與value配對(duì),value是否符合field在數(shù)據(jù)庫或語言習(xí)慣約束。若符合,則配對(duì)生成查詢條件的可能性更大,這里的約束一般指量詞與數(shù)值范圍約束。例如(年齡/field,小于,30歲/value,職級(jí)/field,大于,25/value),其中“職級(jí)/field”和“30歲/value,,,因量詞“歲”不符合“職級(jí)”的量詞約束,那么C(Field-ValUe|職級(jí),30歲)為O。假設(shè)“職級(jí)/field”在數(shù)據(jù)庫中數(shù)值范圍的約束是13?21,那么對(duì)于“職級(jí)/field”和“25/value”,因value不符合該約束,則C(Field-Value|職級(jí),25)為O。[0091]經(jīng)過以上處理,field和value配對(duì)生成查詢條件(Field,操作符,Value)的匹配指數(shù)可以為上述特征值的線性加權(quán)值。例如,[0092]匹配指數(shù)Score=zl*P+z2*L+z3*Type+z4*C。其中zl、z2、z3和z4為預(yù)先確定的權(quán)重值。[0093]最后通過設(shè)定預(yù)設(shè)閾值(過濾規(guī)則),篩選輸出查詢條件。[0094]可選地,作為另一實(shí)施例,在160中,可以確定標(biāo)注信息中的標(biāo)簽為屬性名的詞語滿足預(yù)設(shè)條件和/或?yàn)楣曼c(diǎn)詞語,其中,孤點(diǎn)詞語沒有對(duì)應(yīng)的標(biāo)簽為屬性值的詞語和隱性標(biāo)簽為屬性值的詞語;將標(biāo)注信息中的標(biāo)簽為屬性名的詞語的屬性名作為查詢目標(biāo)。[0095]具體地,預(yù)設(shè)條件可以包括通過句法或者預(yù)定義規(guī)則的方式,換句話說可以通過句法或者預(yù)定義規(guī)則的方式識(shí)別用戶查詢語句或標(biāo)注信息中的查詢目標(biāo)。例如預(yù)設(shè)條件包括標(biāo)簽為屬性名的詞語之前具有“的”字,例如,預(yù)設(shè)條件可以為*的fieldl和field2”表示查詢目標(biāo)是fieldl和field2,當(dāng)用戶輸入查詢語句類似“張三的工號(hào)和部門”時(shí),標(biāo)注信息為(張三/value,的,工號(hào)/field,和,部門/field),符合該預(yù)定義規(guī)則,“工號(hào)”和“部門”即為查詢目標(biāo);類似的,預(yù)設(shè)條件可以為*的field”。[0096]本發(fā)明實(shí)施例中,也可以將孤點(diǎn)詞語作為查詢目標(biāo),例如,如果出現(xiàn)沒有value與其配對(duì)的fieId,則忽略或者加入到查詢目標(biāo)當(dāng)中;如果出現(xiàn)沒有fieId與其配對(duì)的value,且value的候選數(shù)據(jù)庫實(shí)體擁有同一個(gè)隱性field,則使用隱性的field與其配對(duì)生成查詢條件,否則忽略。例如用戶查詢語句“年齡張三的部門”,其中“年齡/fieId”,但是沒有value與其配對(duì),且不是查詢目標(biāo),則忽略或者加入查詢目標(biāo)當(dāng)中。例如用戶查詢語句“銷售部過去三年的業(yè)績(jī)”,其中“銷售部/value”的候選數(shù)據(jù)庫實(shí)體{屬性值I一一手機(jī)銷售部,屬性值2—一服務(wù)器銷售部},所有的候選數(shù)據(jù)庫實(shí)體擁有同一個(gè)隱性的field—一“部門”,則生成查詢條件(部門,操作符,手機(jī)銷售部)和(部門,操作符,服務(wù)器銷售部)。[0097]上文中結(jié)合圖1詳細(xì)描述了本發(fā)明實(shí)施例的數(shù)據(jù)庫查詢的方法,下面將結(jié)合圖2具體地例子,更加詳細(xì)的描述本發(fā)明實(shí)施例的數(shù)據(jù)庫查詢的方法。應(yīng)注意,圖2的例子是為了幫助本領(lǐng)域技術(shù)人員更好地理解本發(fā)明實(shí)施例,而非要限制本發(fā)明實(shí)施例的范圍。本領(lǐng)域技術(shù)人員根據(jù)所給出的圖2的例子,顯然可以進(jìn)行各種等價(jià)的修改或變化,這樣的修改或變化也落入本發(fā)明實(shí)施例的范圍內(nèi)。[0098]應(yīng)理解,上述各過程的序號(hào)的大小并不意味著執(zhí)行順序的先后,各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定,而不應(yīng)對(duì)本發(fā)明實(shí)施例的實(shí)施過程構(gòu)成任何限定。[0099]圖2是根據(jù)本發(fā)明另一實(shí)施例的數(shù)據(jù)庫查詢的方法的示意性流程圖。如圖2所示的方法包括:[0100]201,獲取查詢語句。[0101]具體地,接收用戶輸入的自然語言查詢語句,例如查詢語句可以為“去年我部門畢業(yè)于北大,年齡小于30任職大于18級(jí)人員所在的崗位的名稱”。[0102]202,預(yù)處理。[0103]具體地,預(yù)處理過程包括對(duì)查詢語句進(jìn)行分句、分詞、詞性標(biāo)注、命名實(shí)體識(shí)別、句法分析等。同時(shí)進(jìn)行規(guī)范化,例如查詢語句中的“去年”規(guī)范化成2013年(假設(shè)當(dāng)前時(shí)間是2014年),并且關(guān)聯(lián)實(shí)體“時(shí)間”,“北大”關(guān)聯(lián)實(shí)體“機(jī)構(gòu)名”,“30”及“18級(jí)”關(guān)聯(lián)為數(shù)量詞等等。識(shí)別謂語(動(dòng)詞)“畢業(yè)”的直接賓語“北大”等。[0104]203,獲取候選數(shù)據(jù)庫實(shí)體。[0105]具體地,根據(jù)預(yù)處理的結(jié)果,對(duì)每一個(gè)待識(shí)別的實(shí)體檢索數(shù)據(jù)庫實(shí)體庫,返回一個(gè)或多個(gè)候選數(shù)據(jù)庫實(shí)體一一屬性名(field)或者屬性值(value)。對(duì)于時(shí)間/日期、數(shù)字型等待識(shí)別實(shí)體,獲取數(shù)據(jù)庫中相同數(shù)據(jù)類型的屬性名作為其候選數(shù)據(jù)庫實(shí)體。其余字符型關(guān)鍵詞,獲取屬性名/屬性值中包含該關(guān)鍵詞或者同義詞的屬性名/屬性值作為候選數(shù)據(jù)庫實(shí)體,假如通過先驗(yàn)知識(shí)知道待識(shí)別實(shí)體是數(shù)據(jù)庫實(shí)體的別名,應(yīng)使用數(shù)據(jù)庫實(shí)體的正式名稱去獲取相關(guān)的候選數(shù)據(jù)庫實(shí)體,例如查詢語句中“畢業(yè)”的候選數(shù)據(jù)實(shí)體可能是{畢業(yè)時(shí)間,畢業(yè)學(xué)校,畢業(yè)證書……};而對(duì)于“北大”,它是北京大學(xué)的別名,應(yīng)該以“北京大學(xué)”這個(gè)正式的數(shù)據(jù)庫實(shí)體去獲取其他相關(guān)的候選數(shù)據(jù)庫實(shí)體,比如{北京大學(xué),北京大學(xué)研究生院,北京大學(xué)深圳研究院……},不應(yīng)該包含“北京理工大學(xué)”等只命中關(guān)鍵詞的數(shù)據(jù)庫實(shí)體。最終輸出與用戶查詢語句對(duì)應(yīng)的標(biāo)注信息(2013年/value,我部門,畢業(yè)/field,北京大學(xué)/value,年齡/field,小于,30/value,任職/field,大于,18級(jí)/value,人員,所在,的,崗位/field,的,名稱/field)。[0106]204,相似度計(jì)算。[0107]具體地,計(jì)算待識(shí)別實(shí)體或數(shù)據(jù)實(shí)體正式名與候選數(shù)據(jù)庫實(shí)體之間的相似度(相關(guān)度)。可以根據(jù)命中率、向量空間余弦和編輯距離中的至少一種確定相似度,例如以命中率和覆蓋率的線性加權(quán)計(jì)算相似度。命中率={關(guān)鍵詞或數(shù)據(jù)庫實(shí)體正式名與候選數(shù)據(jù)庫實(shí)體的交集的權(quán)重和}/{關(guān)鍵詞的權(quán)重和},比如查詢語句中“畢業(yè)”與候選數(shù)據(jù)庫實(shí)體“畢業(yè)時(shí)間”的交集是{畢業(yè)},其權(quán)重為wl,那么關(guān)鍵詞“畢業(yè)”與候選數(shù)據(jù)庫實(shí)體“畢業(yè)時(shí)間”的命中=wl/wl=1.0;覆蓋率={關(guān)鍵詞或數(shù)據(jù)庫實(shí)體正式名與候選數(shù)據(jù)庫實(shí)體的交集的權(quán)重和}/{候選數(shù)據(jù)庫實(shí)體的權(quán)重和},比如查詢語句中“畢業(yè)”與候選數(shù)據(jù)庫實(shí)體“畢業(yè)時(shí)間”的交集是{畢業(yè)},其權(quán)重為wl,“畢業(yè)時(shí)間”包含兩個(gè)詞“畢業(yè)”與“時(shí)間”,假設(shè)“時(shí)間”的權(quán)重為w2,那么“畢業(yè)時(shí)間”的權(quán)重和=wl+w2,關(guān)鍵詞“畢業(yè)”與候選數(shù)據(jù)庫實(shí)體“畢業(yè)時(shí)間”的覆蓋率=wl/(wl+w2)。最后關(guān)鍵詞“畢業(yè)”與候選數(shù)據(jù)庫實(shí)體“畢業(yè)時(shí)間”的相似度=al*命中率+a2*覆蓋率,其中al與a2分別為命中率與覆蓋率的權(quán)重,al和a2可以為預(yù)設(shè)值。[0108]205,合并計(jì)算。[0109]具體地,根據(jù)標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體合并標(biāo)注信息中連續(xù)標(biāo)簽為屬性名或?qū)傩灾档脑~語,得到合并詞語,合并詞語為標(biāo)注信息中連續(xù)標(biāo)簽為屬性名或?qū)傩灾档脑~語的候選數(shù)據(jù)庫實(shí)體的交集;使用合并詞語替換標(biāo)注信息中連續(xù)標(biāo)簽為屬性名或?qū)傩灾档脑~語,以對(duì)標(biāo)注信息進(jìn)行更新。[0110]換句話說,根據(jù)標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語,得到第一合并詞語,第一合并詞語為標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用第一合并詞語替換標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語,以對(duì)標(biāo)注信息進(jìn)行更新,和/或根據(jù)標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語,得到第二合并詞語,第二合并詞語為標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用第二合并詞語替換標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語,以對(duì)標(biāo)注信息進(jìn)行更新,[0111]具體地,掃描輸出序列(標(biāo)注信息),發(fā)現(xiàn)“崗位”和“名稱”是連續(xù)field,“崗位”的候選數(shù)據(jù)庫實(shí)體有{崗位職責(zé),崗位名稱,崗位等級(jí)},“名稱”的候選數(shù)據(jù)庫實(shí)體有{職位名稱,崗位名稱},嘗試合并,兩者候選數(shù)據(jù)庫實(shí)體交集{崗位名稱},元素個(gè)數(shù)為1,數(shù)量比原來要小,根新標(biāo)注信息為(2013年/value,我部門,畢業(yè)/field,北京大學(xué)/value,年齡/field,小于,30/value,任職/field,大于,18級(jí)/value,人員,所在,的,崗位名稱/field)。[0112]206,查詢目標(biāo)識(shí)別。[0113]具體地,通過句法或者預(yù)定義規(guī)則的方式識(shí)別用戶查詢語句中的查詢目標(biāo)。例如預(yù)定義規(guī)則*的field”表示查詢目標(biāo)是field。當(dāng)前查詢語句符合該規(guī)則,生成查詢目標(biāo)“崗位名稱”。[0114]207,查詢條件識(shí)別。[0115]具體地,掃描標(biāo)注信息,配對(duì)field和value,或者根據(jù)隱指的Field,生成候選查詢條件。由于序列中多個(gè)待識(shí)別實(shí)體包含多個(gè)候選數(shù)據(jù)庫實(shí)體,所以判斷存在歧義,需要消歧。[0116]208,是否存在歧義。[0117]具體地,如果存在歧義則執(zhí)行步驟209,如果不存在歧義,則執(zhí)行步驟211。[0118]209,用戶信息消歧。[0119]具體地,通過用戶的個(gè)人信息和預(yù)定義規(guī)則的方式對(duì)查詢語句進(jìn)行消歧。例如在用戶登錄的情況下,輸入查詢語句,默認(rèn)情況下或針對(duì)某類型關(guān)鍵詞增加某類查詢條件,對(duì)于標(biāo)注信息中的“我部門”等此類關(guān)鍵詞,結(jié)合用戶信息,在查詢條件中增加(部門,操作符,用戶所在部門)進(jìn)行消歧。[0120]應(yīng)理解,用戶個(gè)人信息包括用戶個(gè)人信息數(shù)據(jù)包括但不限于:終端設(shè)備的硬件信息,包括但不限于日期和時(shí)鐘信息(例如但不限于當(dāng)前日期、時(shí)間、時(shí)區(qū)等),位置信息(例如但不限于GPS、國(guó)家、城市),通過傳感器產(chǎn)生的信息(例如但不限于加速度、磁力、方向、陀螺儀、光線感應(yīng)、壓力、溫度、臉部感應(yīng)、重力、旋轉(zhuǎn)矢量等信息),或者上述方式的混合。終端系統(tǒng)的軟件信息,包括但不限于操作系統(tǒng)和運(yùn)行的軟件、進(jìn)程、服務(wù)的狀態(tài)、事件和提供的數(shù)據(jù)。保存在終端內(nèi)存或者存儲(chǔ)設(shè)備上的用戶數(shù)據(jù),包括但不限于短文本,通訊錄,備忘錄,提醒事項(xiàng),照片,應(yīng)用,視頻,音頻,郵件,書簽,網(wǎng)頁瀏覽記錄,商品/服務(wù)的購(gòu)買記錄,酒店預(yù)訂記錄,機(jī)票購(gòu)買記錄。用戶的歷史操作,包括但不限于用戶歷史查詢語句。用戶的設(shè)定,包括但不限于用戶信息(例如姓名、電話號(hào)、地址、賬戶等等),用戶偏好設(shè)置。[0121]210,上下文消歧。[0122]具體地,根據(jù)用戶查詢語句上下文,對(duì)序列中存在歧義或多個(gè)候選數(shù)據(jù)庫實(shí)體的待識(shí)別實(shí)體計(jì)算以下特征值,假設(shè)“年齡”的候選數(shù)據(jù)庫實(shí)體有{年齡},“30”按數(shù)據(jù)類型可能獲得的候選數(shù)據(jù)庫實(shí)體有{年齡,任職等級(jí),試用期天數(shù)……},“18級(jí)”按按數(shù)據(jù)類型可能的候選數(shù)據(jù)庫實(shí)體有{年齡,任職等級(jí),試用期天數(shù)……},下面舉例以“年齡/field”和“30/value”與“18級(jí)/value”配對(duì)時(shí)的計(jì)算過程:[0123]具體地,可以根據(jù)第一候選詞語和第二候選詞語的配對(duì)概率P、序列距離L、數(shù)據(jù)庫數(shù)據(jù)類型匹配度Type和語言習(xí)慣約束C中的至少一種確定匹配指數(shù)。[0124]其中,P(Field_ValueIfield,value)表示序列中field與value配對(duì),生成查詢條件(Field,操作符,Value)的概率。主要方式是根據(jù)兩者的候選數(shù)據(jù)庫實(shí)體是否存在交集,交集的元素的多少?zèng)Q定。對(duì)于標(biāo)注信息,計(jì)算P(Field-ValueI年齡,30)時(shí),兩者存在交集{年齡}且元素個(gè)數(shù)為I,可認(rèn)為P(Field-ValueI年齡,30)=s(s>0),生成查詢條件(畢業(yè)時(shí)間,操作符,去年)的概率為S。同理P(Field-ValueI年齡,18級(jí))=S。[0125]L(Field-Value|field,value)表示序列中field與value配對(duì),生成查詢條件(Field,操作符,Value)時(shí),field與value之間的距離。距離越小,生成查詢條件的概率越大。主要的計(jì)算方式是根據(jù)兩者在標(biāo)注信息或查詢語句中的距離。對(duì)于標(biāo)注信息中L(Field-ValueI年齡,30)為2;而L(Field-Value|年齡,18級(jí))則為8。[0126]Type(Field-ValueIfield,value)表示序列中field的數(shù)據(jù)庫數(shù)據(jù)類型與value的數(shù)據(jù)類型是否一致。若一致,則配對(duì)生成查詢條件的可能性更大。對(duì)于標(biāo)注信息中Type(Field-Value年齡,30)=I,Type(Field-Value年齡,18級(jí))=I。[0127]C(Field-ValueIfield,value)表不序列中field與value配對(duì),value是否符合field在數(shù)據(jù)庫或語言習(xí)慣約束。若符合,則配對(duì)生成查詢條件的可能性更大,這里的約束一般指量詞與數(shù)值范圍約束。對(duì)于標(biāo)注信息中C(Field-Value|年齡,30)=1,C(Field-ValueI年齡,18級(jí))=O。[0128]經(jīng)過以上處理,年齡和30的匹配指數(shù)為:[0129]Scorel=zl*P(Field-Value年齡,30)+z2*L(FieId-Value|年齡,30)+z3*Type(Field-ValueI年齡,30)+z4*C(Field-Value|年齡,30)=zl*s+z2*2+z3*l+z4*l=zl*s+z2*2+z3+z4[0130]年齡和18級(jí)的匹配指數(shù)為:[0131]Score2=zl*P(Field-Value年齡,18級(jí))+z2*L(Field-Value|年齡,18級(jí))+z3*Type(Field-ValueI年齡,18級(jí))+z4*C(Field-Value|年齡,18級(jí))=zl*s+z2*2+z3*l+z4*0=zl*s+z2*8+z3[0132]其中zl、z2、z3和z4是線下通過機(jī)器學(xué)習(xí)的方式生成的權(quán)重值,換句話說,zl、z2、z3和z4為預(yù)先確定的值,存放在語義消歧模型中。從上述特征的設(shè)計(jì)上看,特征I)、3)、4)為正向特征,則zl,z3,和z4為正數(shù),而z2為負(fù)向特征,其值為負(fù)數(shù),可知Scorel要比Score2大。最后通過設(shè)定閾值或過濾規(guī)則,篩選查詢條件,比如C(Field-ValueIfield,value)為O的查詢條件忽略,那么查詢條件(年齡,操作符,18級(jí))就被忽略掉了。[0133]211,孤點(diǎn)處理。[0134]具體地,假如出現(xiàn)沒有value與其配對(duì)的field,則忽略或者加入到查詢目標(biāo)當(dāng)中;假如出現(xiàn)沒有field與其配對(duì)的value,且value的候選數(shù)據(jù)庫實(shí)體擁有同一個(gè)隱性field,則使用隱性的field與其配對(duì)生成查詢條件,否則忽略。按上述計(jì)算,當(dāng)前標(biāo)注信息不存在孤點(diǎn)。[0135]212,操作符處理。[0136]換句話說,識(shí)別操作符,具體地,通過預(yù)定義規(guī)則的方式,識(shí)別查詢語句中包含的操作符。例如默認(rèn)操作符為“=”,預(yù)定義其他操作符與規(guī)則對(duì)為“〈:在**以下I小于”,那么對(duì)于查詢條件(年齡,操作符,30),其在查詢語句或序列中,(年齡/field,小于,30/value)符合預(yù)定義規(guī)則,那么完整的查詢條件為(年齡,〈,30)。最后輸出的查詢目標(biāo)一一崗位名稱,查詢條件為(畢業(yè)時(shí)間,=,2013年)、(畢業(yè)學(xué)校,=,北京大學(xué))、(年齡,〈,30)、(任職等級(jí),=,18級(jí))以及(部門,=,用戶所在部門)。[0137]213,數(shù)據(jù)庫查詢語句生成。[0138]具體地,根據(jù)上述模塊輸出查詢條件與目標(biāo),生成數(shù)據(jù)庫查詢語句,如SQL,那么對(duì)于當(dāng)前查詢語句生成的數(shù)據(jù)庫查詢語句為--select崗位名稱fromviewwhere畢業(yè)時(shí)間=2013and畢業(yè)學(xué)校=北京大學(xué)and年齡<30and任職等級(jí)=18and部門=用戶所在部門,對(duì)數(shù)據(jù)庫進(jìn)行檢索。[0139]214,輸出結(jié)果。[0140]具體地,執(zhí)行數(shù)據(jù)庫查詢語句,把檢索結(jié)果返回給用戶。[0141]因此,本發(fā)明實(shí)施例通過根據(jù)將為自然語言查詢語句的待查詢語句生成查詢目標(biāo)和查詢條件,根據(jù)查詢目標(biāo)和查詢條件進(jìn)行查詢,進(jìn)而得到查詢結(jié)果,能夠根據(jù)用戶請(qǐng)求進(jìn)行數(shù)據(jù)庫查詢。本發(fā)明實(shí)施例無需用戶熟悉數(shù)據(jù)庫查詢語言,提升用戶體驗(yàn)。[0142]上文中結(jié)合圖1至圖2,詳細(xì)描述了根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫查詢的方法,下面結(jié)合圖3至圖4詳細(xì)描述根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫查詢的設(shè)備。[0143]圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)庫查詢的設(shè)備的示意框圖。數(shù)據(jù)庫查詢的設(shè)備可以為用戶設(shè)備或數(shù)據(jù)庫服務(wù)器等,如圖3所示3的設(shè)備300包括:獲取單元310、劃分單元320、確定單元330、標(biāo)注單元340、第一生成單元350、第二生成單元360和查詢單元370。[0144]具體地,獲取單元310用于獲取待查詢語句,待查詢語句為自然語言查詢語句;劃分單元320用于根據(jù)預(yù)設(shè)詞庫劃分待查詢語句,得到N個(gè)詞語;確定單元330用于從預(yù)設(shè)數(shù)據(jù)庫中確定第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,第一詞語為N個(gè)詞語中的任一詞語;標(biāo)注單元340用于為N個(gè)詞語中的各個(gè)詞語分別標(biāo)注標(biāo)簽,得到與待查詢語句對(duì)應(yīng)的標(biāo)注信息,標(biāo)注信息包括N個(gè)詞語和與N個(gè)詞語中的各個(gè)詞語呈一一對(duì)應(yīng)關(guān)系的標(biāo)簽,其中,與第一詞語呈一一對(duì)應(yīng)關(guān)系的標(biāo)簽用于表示第一詞語的數(shù)據(jù)類型,第一詞語的標(biāo)簽包括屬性名或?qū)傩灾?;第一生成單?50用于根據(jù)標(biāo)注信息生成K個(gè)查詢條件,K個(gè)查詢條件中的每個(gè)查詢條件包括第二詞語、操作符和第三詞語,其中,操作符表示第二詞語和第三詞語的關(guān)系,第二詞語的標(biāo)簽為屬性名,第三詞語的標(biāo)簽為屬性值;第二生成單元360用于根據(jù)標(biāo)注信息生成查詢目標(biāo),查詢目標(biāo)包括N個(gè)詞語中的至少一個(gè)詞語的數(shù)據(jù)庫實(shí)體,其中,至少一個(gè)詞語的標(biāo)簽為屬性名,至少一個(gè)詞語中的每個(gè)詞語的數(shù)據(jù)庫實(shí)體為每個(gè)詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體中的一個(gè);查詢單元370用于根據(jù)K個(gè)查詢條件和查詢目標(biāo)進(jìn)行查詢,得到查詢結(jié)果。[0145]因此,本發(fā)明實(shí)施例通過將為自然語言查詢語句的待查詢語句生成查詢目標(biāo)和查詢條件,根據(jù)查詢目標(biāo)和查詢條件進(jìn)行查詢,進(jìn)而得到查詢結(jié)果,能夠根據(jù)用戶請(qǐng)求進(jìn)行數(shù)據(jù)庫查詢。本發(fā)明實(shí)施例無需用戶熟悉數(shù)據(jù)庫查詢語言,提升用戶體驗(yàn)。[0146]可選地,作為另一實(shí)施例,劃分單元320根據(jù)預(yù)設(shè)詞庫劃分待查詢語句,得到N個(gè)初始詞語;根據(jù)預(yù)設(shè)規(guī)則,規(guī)范化N個(gè)初始詞語,得到N個(gè)詞語。[0147]可選地,作為另一實(shí)施例,確定單元330從預(yù)設(shè)數(shù)據(jù)庫中確定第一詞語的η個(gè)初始候選數(shù)據(jù)庫實(shí)體,η為大于或等于I的整數(shù);當(dāng)η大于I時(shí),確定η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與第一詞語的相關(guān)度,將η個(gè)初始候選數(shù)據(jù)庫實(shí)體中相關(guān)度高于預(yù)設(shè)閾值的初始候選數(shù)據(jù)庫實(shí)體確定為第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,或者,當(dāng)η等于I時(shí),將第一詞語的η個(gè)初始候選數(shù)據(jù)庫實(shí)體確定為第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體。[0148]進(jìn)一步地,作為另一實(shí)施例,確定單元330根據(jù)以下方法中的至少一種方法確定η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與第一詞語的相關(guān)度:命中率、向量空間余弦和編輯距離。[0149]可選地,作為另一實(shí)施例,設(shè)備300還包括:合并單元。具體地,合并單元用于在第一生成單元350根據(jù)標(biāo)注信息生成K個(gè)查詢條件之前,根據(jù)標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語,得到第一合并詞語,第一合并詞語為標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用第一合并詞語替換標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語,以對(duì)標(biāo)注信息進(jìn)行更新,和/或根據(jù)標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語,得到第二合并詞語,第二合并詞語為標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用第二合并詞語替換標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語,以對(duì)標(biāo)注信息進(jìn)行更新,其中,第一生成單元350根據(jù)更新后的標(biāo)注信息生成K個(gè)查詢條件,第二生成單元360根據(jù)更新后的標(biāo)注信息生成查詢目標(biāo)。[0150]可選地,作為另一實(shí)施例,第一生成單元350根據(jù)標(biāo)注信息生成M個(gè)候選查詢條件,M個(gè)候選查詢條件中的每個(gè)候選查詢條件包括第一候選詞語、操作符和第二候選詞語的對(duì)應(yīng)關(guān)系,其中第一候選詞語的標(biāo)簽為屬性名,第二候選詞語的標(biāo)簽為屬性值;確定每個(gè)候選查詢條件的第一候選詞語和第二候選詞語的匹配指數(shù);將M個(gè)候選查詢條件中的匹配指數(shù)大于預(yù)設(shè)閾值的K個(gè)候選查詢條件確定為K個(gè)查詢條件。[0151]進(jìn)一步地,作為另一實(shí)施例,第一生成單元350根據(jù)標(biāo)注信息生成M個(gè)初始候選查詢條件;根據(jù)用戶信息,對(duì)M個(gè)初始候選查詢條件進(jìn)行消歧處理,得到M個(gè)候選查詢條件,消歧處理包括根據(jù)用戶信息消除M個(gè)初始候選查詢條件中存在歧義的初始候選查詢條件中的歧義,其中,用戶信息包括終端設(shè)備的硬件信息、終端系統(tǒng)的軟件信息、保存在終端內(nèi)存或者存儲(chǔ)設(shè)備上的用戶數(shù)據(jù)、用戶的歷史操作和用戶的設(shè)定中的至少一種。[0152]進(jìn)一步地,作為另一實(shí)施例,第一生成單元350根據(jù)第一候選詞語和第二候選詞語的配對(duì)概率、序列距離、數(shù)據(jù)庫數(shù)據(jù)類型匹配度和語言習(xí)慣約束中的至少一種確定匹配指數(shù)。[0153]具體地,作為另一實(shí)施例,配對(duì)概率由第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集決定,其中,第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集越少,配對(duì)概率越大,匹配指數(shù)越大。[0154]具體地,作為另一實(shí)施例,序列距離由第一候選詞語和第二候選詞語在標(biāo)注信息或查詢語句中的距離決定,其中,第一候選詞語和第二候選詞語在標(biāo)注信息或查詢語句中的距離越大,序列距離越大,匹配指數(shù)越小,標(biāo)注信息或查詢語句中第一候選詞語和第二候選詞語之間的詞語的多少,表示距離的大小。[0155]具體地,作為另一實(shí)施例,數(shù)據(jù)庫數(shù)據(jù)類型匹配度由第一候選詞語和第二候選詞語的數(shù)據(jù)庫數(shù)據(jù)類型是否一致決定,其中,第一候選詞語和第二候選詞語的數(shù)據(jù)類型一致時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度大于第一候選詞語和第二候選詞語的數(shù)據(jù)類型不一致時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度,匹配指數(shù)與數(shù)據(jù)庫類型匹配度正相關(guān)。[0156]具體地,作為另一實(shí)施例,語言習(xí)慣約束由第一候選詞語和第二候選詞語是否符合數(shù)據(jù)庫或語言習(xí)慣決定,其中,第一候選詞語和第二候選詞語符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束小于第一候選詞語和第二候選詞語不符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束,匹配指數(shù)與語言習(xí)慣約束負(fù)相關(guān)。[0157]可選地,作為另一實(shí)施例,第二生成單元360確定標(biāo)注信息中的標(biāo)簽為屬性名的詞語滿足預(yù)設(shè)條件和/或?yàn)楣曼c(diǎn)詞語,其中,孤點(diǎn)詞語沒有對(duì)應(yīng)的標(biāo)簽為屬性值的詞語;將標(biāo)注信息中的標(biāo)簽為屬性名的詞語的屬性名作為查詢目標(biāo)。[0158]應(yīng)注意,圖3所示的數(shù)據(jù)庫查詢的設(shè)備能夠?qū)崿F(xiàn)圖1-圖2的方法實(shí)施例中由數(shù)據(jù)庫查詢的設(shè)備完成的各個(gè)過程。數(shù)據(jù)庫查詢的設(shè)備300的其他功能和操作可以參考圖1和圖2的方法實(shí)施例中涉及數(shù)據(jù)庫查詢的設(shè)備的各個(gè)過程。為避免重復(fù),此處不再詳述。[0159]圖4是根據(jù)本發(fā)明另一實(shí)施例的數(shù)據(jù)庫查詢的設(shè)備的示意框圖。如圖4所示的設(shè)備400包括:處理器410、存儲(chǔ)器420和總線系統(tǒng)430。[0160]具體地,處理器410通過總線系統(tǒng)430調(diào)用存儲(chǔ)在存儲(chǔ)器420中的代碼,獲取待查詢語句,待查詢語句為自然語言查詢語句;根據(jù)預(yù)設(shè)詞庫劃分待查詢語句,得到N個(gè)詞語;從預(yù)設(shè)數(shù)據(jù)庫中確定第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,第一詞語為N個(gè)詞語中的任一詞語;為N個(gè)詞語中的各個(gè)詞語分別標(biāo)注標(biāo)簽,得到與待查詢語句對(duì)應(yīng)的標(biāo)注信息,標(biāo)注信息包括N個(gè)詞語和與N個(gè)詞語中的各個(gè)詞語呈一一對(duì)應(yīng)關(guān)系的標(biāo)簽,其中,與第一詞語呈一一對(duì)應(yīng)關(guān)系的標(biāo)簽用于表示第一詞語的數(shù)據(jù)類型,第一詞語的標(biāo)簽包括屬性名或?qū)傩灾担桓鶕?jù)標(biāo)注信息生成K個(gè)查詢條件,K個(gè)查詢條件中的每個(gè)查詢條件包括第二詞語、操作符和第三詞語,其中,操作符表示第二詞語和第三詞語的關(guān)系,第二詞語的標(biāo)簽為屬性名,第三詞語的標(biāo)簽為屬性值;根據(jù)標(biāo)注信息生成查詢目標(biāo),查詢目標(biāo)包括N個(gè)詞語中的至少一個(gè)詞語的數(shù)據(jù)庫實(shí)體,其中,至少一個(gè)詞語的標(biāo)簽為屬性名,至少一個(gè)詞語中的每個(gè)詞語的數(shù)據(jù)庫實(shí)體為每個(gè)詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體中的一個(gè);根據(jù)K個(gè)查詢條件和查詢目標(biāo)進(jìn)行查詢,得到查詢結(jié)果。[0161]因此,本發(fā)明實(shí)施例通過根據(jù)將為自然語言查詢語句的待查詢語句生成查詢目標(biāo)和查詢條件,根據(jù)查詢目標(biāo)和查詢條件進(jìn)行查詢,進(jìn)而得到查詢結(jié)果,能夠根據(jù)用戶請(qǐng)求進(jìn)行數(shù)據(jù)庫查詢。本發(fā)明實(shí)施例無需用戶熟悉數(shù)據(jù)庫查詢語言,提升用戶體驗(yàn)。[0162]上述本發(fā)明實(shí)施例揭示的方法可以應(yīng)用于處理器410中,或者由處理器410實(shí)現(xiàn)。處理器410可能是一種集成電路芯片,具有信號(hào)的處理能力。在實(shí)現(xiàn)過程中,上述方法的各步驟可以通過處理器410中的硬件的集成邏輯電路或者軟件形式的指令完成。上述的處理器410可以是通用處理器、數(shù)字信號(hào)處理器(英文DigitalSignalProcessor,簡(jiǎn)稱DSP)、專用集成電路(英文Applicat1nSpecificIntegratedCircuit,簡(jiǎn)稱ASIC)、現(xiàn)成可編程門陣列(英文FieldProgrammableGateArray,簡(jiǎn)稱FPGA)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件。可以實(shí)現(xiàn)或者執(zhí)行本發(fā)明實(shí)施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器等。結(jié)合本發(fā)明實(shí)施例所公開的方法的步驟可以直接體現(xiàn)為硬件譯碼處理器執(zhí)行完成,或者用譯碼處理器中的硬件及軟件模塊組合執(zhí)行完成。軟件模塊可以位于隨機(jī)存取存儲(chǔ)器(英文RandomAccessMemory,簡(jiǎn)稱RAM)、閃存、只讀存儲(chǔ)器(英文Read-OnlyMemory,簡(jiǎn)稱ROM)、可編程只讀存儲(chǔ)器或者電可擦寫可編程存儲(chǔ)器、寄存器等本領(lǐng)域成熟的存儲(chǔ)介質(zhì)中。該存儲(chǔ)介質(zhì)位于存儲(chǔ)器420,處理器410讀取存儲(chǔ)器420中的信息,結(jié)合其硬件完成上述方法的步驟,該總線系統(tǒng)430除包括數(shù)據(jù)總線之外,還可以包括電源總線、控制總線和狀態(tài)信號(hào)總線等。但是為了清楚說明起見,在圖中將各種總線都標(biāo)為總線系統(tǒng)430。[0163]可選地,作為另一實(shí)施例,處理器410根據(jù)預(yù)設(shè)詞庫劃分待查詢語句,得到N個(gè)初始詞語;根據(jù)預(yù)設(shè)規(guī)則,規(guī)范化N個(gè)初始詞語,得到N個(gè)詞語。[0164]可選地,作為另一實(shí)施例,處理器410從預(yù)設(shè)數(shù)據(jù)庫中確定第一詞語的η個(gè)初始候選數(shù)據(jù)庫實(shí)體,η為大于或等于I的整數(shù);當(dāng)η大于I時(shí),確定η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與第一詞語的相關(guān)度,將η個(gè)初始候選數(shù)據(jù)庫實(shí)體中相關(guān)度高于預(yù)設(shè)閾值的初始候選數(shù)據(jù)庫實(shí)體確定為第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,或者,當(dāng)η等于I時(shí),將第一詞語的η個(gè)初始候選數(shù)據(jù)庫實(shí)體確定為第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體。[0165]進(jìn)一步地,作為另一實(shí)施例,處理器410根據(jù)以下方法中的至少一種方法確定η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與第一詞語的相關(guān)度:命中率、向量空間余弦和編輯距離。[0166]可選地,作為另一實(shí)施例,處理器410在根據(jù)標(biāo)注信息生成K個(gè)查詢條件之前,根據(jù)標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語,得到第一合并詞語,第一合并詞語為標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用第一合并詞語替換標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語,以對(duì)標(biāo)注信息進(jìn)行更新,和/或根據(jù)標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語,得到第二合并詞語,第二合并詞語為標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用第二合并詞語替換標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語,以對(duì)標(biāo)注信息進(jìn)行更新,其中,處理器410根據(jù)更新后的標(biāo)注信息生成K個(gè)查詢條件,包括根據(jù)更新后的標(biāo)注信息生成查詢目標(biāo)。[0167]可選地,作為另一實(shí)施例,處理器410根據(jù)標(biāo)注信息生成M個(gè)候選查詢條件,M個(gè)候選查詢條件中的每個(gè)候選查詢條件包括第一候選詞語、操作符和第二候選詞語的對(duì)應(yīng)關(guān)系,其中第一候選詞語的標(biāo)簽為屬性名,第二候選詞語的標(biāo)簽為屬性值;確定每個(gè)候選查詢條件的第一候選詞語和第二候選詞語的匹配指數(shù);將M個(gè)候選查詢條件中的匹配指數(shù)大于預(yù)設(shè)閾值的K個(gè)候選查詢條件確定為K個(gè)查詢條件。[0168]進(jìn)一步地,作為另一實(shí)施例,處理器410根據(jù)標(biāo)注信息生成M個(gè)初始候選查詢條件;根據(jù)用戶信息,對(duì)M個(gè)初始候選查詢條件進(jìn)行消歧處理,得到M個(gè)候選查詢條件,消歧處理包括根據(jù)用戶信息消除M個(gè)初始候選查詢條件中存在歧義的初始候選查詢條件中的歧義,其中,用戶信息包括終端設(shè)備的硬件信息、終端系統(tǒng)的軟件信息、保存在終端內(nèi)存或者存儲(chǔ)設(shè)備上的用戶數(shù)據(jù)、用戶的歷史操作和用戶的設(shè)定中的至少一種。[0169]進(jìn)一步地,作為另一實(shí)施例,處理器410根據(jù)第一候選詞語和第二候選詞語的配對(duì)概率、序列距離、數(shù)據(jù)庫數(shù)據(jù)類型匹配度和語言習(xí)慣約束中的至少一種確定匹配指數(shù)。[0170]具體地,作為另一實(shí)施例,配對(duì)概率由第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集決定,其中,第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集越少,配對(duì)概率越大,匹配指數(shù)越大。[0171]具體地,作為另一實(shí)施例,序列距離由第一候選詞語和第二候選詞語在標(biāo)注信息或查詢語句中的距離決定,其中,第一候選詞語和第二候選詞語在標(biāo)注信息或查詢語句中的距離越大,序列距離越大,匹配指數(shù)越小,標(biāo)注信息或查詢語句中第一候選詞語和第二候選詞語之間的詞語的多少,表示距離的大小。[0172]具體地,作為另一實(shí)施例,數(shù)據(jù)庫數(shù)據(jù)類型匹配度由第一候選詞語和第二候選詞語的數(shù)據(jù)庫數(shù)據(jù)類型是否一致決定,其中,第一候選詞語和第二候選詞語的數(shù)據(jù)類型一致時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度大于第一候選詞語和第二候選詞語的數(shù)據(jù)類型不一致時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度,匹配指數(shù)與數(shù)據(jù)庫類型匹配度正相關(guān)。[0173]具體地,作為另一實(shí)施例,語言習(xí)慣約束由第一候選詞語和第二候選詞語是否符合數(shù)據(jù)庫或語言習(xí)慣決定,其中,第一候選詞語和第二候選詞語符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束小于第一候選詞語和第二候選詞語不符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束,匹配指數(shù)與語言習(xí)慣約束負(fù)相關(guān)。[0174]可選地,作為另一實(shí)施例,處理器410確定標(biāo)注信息中的標(biāo)簽為屬性名的詞語滿足預(yù)設(shè)條件和/或?yàn)楣曼c(diǎn)詞語,其中,孤點(diǎn)詞語沒有對(duì)應(yīng)的標(biāo)簽為屬性值的詞語;將標(biāo)注信息中的標(biāo)簽為屬性名的詞語的屬性名作為查詢目標(biāo)。[0175]應(yīng)注意,圖4所示的數(shù)據(jù)庫查詢的設(shè)備400與圖3所示的數(shù)據(jù)庫查詢的設(shè)備300相對(duì)應(yīng),能夠?qū)崿F(xiàn)圖1-圖2的方法實(shí)施例中由數(shù)據(jù)庫查詢的設(shè)備完成的各個(gè)過程。數(shù)據(jù)庫查詢的設(shè)備400的其他功能和操作可以參考圖1和圖2的方法實(shí)施例中涉及數(shù)據(jù)庫查詢的設(shè)備的各個(gè)過程。為避免重復(fù),此處不再詳述。[0176]應(yīng)理解,說明書通篇中提到的“一個(gè)實(shí)施例”或“一實(shí)施例”意味著與實(shí)施例有關(guān)的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一個(gè)實(shí)施例中。因此,在整個(gè)說明書各處出現(xiàn)的“在一個(gè)實(shí)施例中”或“在一實(shí)施例中”未必一定指相同的實(shí)施例。此外,這些特定的特征、結(jié)構(gòu)或特性可以任意適合的方式結(jié)合在一個(gè)或多個(gè)實(shí)施例中。應(yīng)理解,在本發(fā)明的各種實(shí)施例中,上述各過程的序號(hào)的大小并不意味著執(zhí)行順序的先后,各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定,而不應(yīng)對(duì)本發(fā)明實(shí)施例的實(shí)施過程構(gòu)成任何限定。[0177]另外,本文中術(shù)語“系統(tǒng)”和“網(wǎng)絡(luò)”在本文中常被可互換使用。本文中術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對(duì)象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨(dú)存在A,同時(shí)存在A和B,單獨(dú)存在B這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對(duì)象是一種“或”的關(guān)系。[0178]應(yīng)理解,在本發(fā)明實(shí)施例中,“與A相應(yīng)的B”表示B與A相關(guān)聯(lián),根據(jù)A可以確定Bo但還應(yīng)理解,根據(jù)A確定B并不意味著僅僅根據(jù)A確定B,還可以根據(jù)A和/或其它信息確定B。[0179]本領(lǐng)域普通技術(shù)人員可以意識(shí)到,結(jié)合本文中所公開的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、計(jì)算機(jī)軟件或者二者的結(jié)合來實(shí)現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來使用不同方法來實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。[0180]所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為了描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng)、裝置和單元的具體工作過程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過程,在此不再贅述。[0181]在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng)、裝置和方法,可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口、裝置或單元的間接耦合或通信連接,也可以是電的,機(jī)械的或其它的形式連接。[0182]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本發(fā)明實(shí)施例方案的目的。[0183]另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以是兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。[0184]通過以上的實(shí)施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可以用硬件實(shí)現(xiàn),或固件實(shí)現(xiàn),或它們的組合方式來實(shí)現(xiàn)。當(dāng)使用軟件實(shí)現(xiàn)時(shí),可以將上述功能存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中或作為計(jì)算機(jī)可讀介質(zhì)上的一個(gè)或多個(gè)指令或代碼進(jìn)行傳輸。計(jì)算機(jī)可讀介質(zhì)包括計(jì)算機(jī)存儲(chǔ)介質(zhì)和通信介質(zhì),其中通信介質(zhì)包括便于從一個(gè)地方向另一個(gè)地方傳送計(jì)算機(jī)程序的任何介質(zhì)。存儲(chǔ)介質(zhì)可以是計(jì)算機(jī)能夠存取的任何可用介質(zhì)。以此為例但不限于:計(jì)算機(jī)可讀介質(zhì)可以包括RAM、ROM、EEPROM、CD-ROM或其他光盤存儲(chǔ)、磁盤存儲(chǔ)介質(zhì)或者其他磁存儲(chǔ)設(shè)備、或者能夠用于攜帶或存儲(chǔ)具有指令或數(shù)據(jù)結(jié)構(gòu)形式的期望的程序代碼并能夠由計(jì)算機(jī)存取的任何其他介質(zhì)。此外。任何連接可以適當(dāng)?shù)某蔀橛?jì)算機(jī)可讀介質(zhì)。例如,如果軟件是使用同軸電纜、光纖光纜、雙絞線、數(shù)字用戶線(DSL)或者諸如紅外線、無線電和微波之類的無線技術(shù)從網(wǎng)站、服務(wù)器或者其他遠(yuǎn)程源傳輸?shù)?,那么同軸電纜、光纖光纜、雙絞線、DSL或者諸如紅外線、無線和微波之類的無線技術(shù)包括在所屬介質(zhì)的定影中。如本發(fā)明所使用的,盤(Disk)和碟(disc)包括壓縮光碟(CD)、激光碟、光碟、數(shù)字通用光碟(DVD)、軟盤和藍(lán)光光碟,其中盤通常磁性的復(fù)制數(shù)據(jù),而碟則用激光來光學(xué)的復(fù)制數(shù)據(jù)。上面的組合也應(yīng)當(dāng)包括在計(jì)算機(jī)可讀介質(zhì)的保護(hù)范圍之內(nèi)。[0185]總之,以上所述僅為本發(fā)明技術(shù)方案的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)?!局鳈?quán)項(xiàng)】1.一種數(shù)據(jù)庫查詢的方法,其特征在于,包括:獲取待查詢語句,所述待查詢語句為自然語言查詢語句;根據(jù)預(yù)設(shè)詞庫劃分所述待查詢語句,得到N個(gè)詞語,N為大于或等于I的整數(shù);從預(yù)設(shè)數(shù)據(jù)庫中確定第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,所述第一詞語為所述N個(gè)詞語中的任一詞語;為所述N個(gè)詞語中的各個(gè)詞語分別標(biāo)注標(biāo)簽,得到與所述待查詢語句對(duì)應(yīng)的標(biāo)注信息,所述標(biāo)注信息包括所述N個(gè)詞語和與所述N個(gè)詞語中的各個(gè)詞語呈一一對(duì)應(yīng)關(guān)系的標(biāo)簽,其中,與所述第一詞語呈一一對(duì)應(yīng)關(guān)系的標(biāo)簽用于表示所述第一詞語的數(shù)據(jù)類型,所述第一詞語的標(biāo)簽包括屬性名或?qū)傩灾?;根?jù)所述標(biāo)注信息生成K個(gè)查詢條件,所述K個(gè)查詢條件中的每個(gè)查詢條件包括第二詞語、操作符和第三詞語,其中,所述操作符表示所述第二詞語和所述第三詞語的關(guān)系,所述第二詞語的標(biāo)簽為屬性名,所述第三詞語的標(biāo)簽為屬性值,K為大于或等于I且小于N的整數(shù);根據(jù)所述標(biāo)注信息生成查詢目標(biāo),所述查詢目標(biāo)包括所述N個(gè)詞語中的至少一個(gè)詞語的數(shù)據(jù)庫實(shí)體,其中,所述至少一個(gè)詞語的標(biāo)簽為屬性名,所述至少一個(gè)詞語中的每個(gè)詞語的數(shù)據(jù)庫實(shí)體為所述每個(gè)詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體中的一個(gè);根據(jù)所述K個(gè)查詢條件和所述查詢目標(biāo)進(jìn)行查詢,得到查詢結(jié)果。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)預(yù)設(shè)詞庫劃分所述待查詢語句,得到N個(gè)詞語,包括:根據(jù)預(yù)設(shè)詞庫劃分所述待查詢語句,得到N個(gè)初始詞語;根據(jù)預(yù)設(shè)規(guī)則,規(guī)范化所述N個(gè)初始詞語,得到所述N個(gè)詞語。3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述從預(yù)設(shè)數(shù)據(jù)庫中確定第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,包括:從預(yù)設(shè)數(shù)據(jù)庫中確定所述第一詞語的η個(gè)初始候選數(shù)據(jù)庫實(shí)體,η為大于或等于I的整數(shù);當(dāng)η大于I時(shí),確定所述η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與所述第一詞語的相關(guān)度,將所述η個(gè)初始候選數(shù)據(jù)庫實(shí)體中相關(guān)度高于預(yù)設(shè)閾值的初始候選數(shù)據(jù)庫實(shí)體確定為所述第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,或者,當(dāng)η等于I時(shí),將所述第一詞語的η個(gè)初始候選數(shù)據(jù)庫實(shí)體確定為所述第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述確定所述η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與所述第一詞語的相關(guān)度,包括:根據(jù)以下方法中的至少一種方法確定所述η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與所述第一詞語的相關(guān)度:命中率、向量空間余弦和編輯距離。5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其特征在于,在根據(jù)所述標(biāo)注信息生成K個(gè)查詢條件之前,還包括:根據(jù)所述標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并所述標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語,得到第一合并詞語,所述第一合并詞語為所述標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用所述第一合并詞語替換所述標(biāo)注信息中所述連續(xù)標(biāo)簽為屬性名的詞語,以對(duì)所述標(biāo)注信息進(jìn)行更新,和/或根據(jù)所述標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并所述標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語,得到第二合并詞語,所述第二合并詞語為所述標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用所述第二合并詞語替換所述標(biāo)注信息中所述連續(xù)標(biāo)簽為屬性值的詞語,以對(duì)所述標(biāo)注信息進(jìn)行更新,其中,所述根據(jù)所述標(biāo)注信息生成K個(gè)查詢條件,包括根據(jù)更新后的標(biāo)注信息生成所述K個(gè)查詢條件,所述根據(jù)所述標(biāo)注信息生成查詢目標(biāo),包括根據(jù)更新后的標(biāo)注信息生成所述查詢目標(biāo)。6.根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述標(biāo)注信息生成K個(gè)查詢條件,包括:根據(jù)所述標(biāo)注信息生成M個(gè)候選查詢條件,所述M個(gè)候選查詢條件中的每個(gè)候選查詢條件包括第一候選詞語、操作符和第二候選詞語的對(duì)應(yīng)關(guān)系,其中第一候選詞語的標(biāo)簽為屬性名,第二候選詞語的標(biāo)簽為屬性值,M為大于或等于K的整數(shù);確定所述每個(gè)候選查詢條件的第一候選詞語和所述第二候選詞語的匹配指數(shù);將所述M個(gè)候選查詢條件中的匹配指數(shù)大于預(yù)設(shè)閾值的K個(gè)候選查詢條件確定為所述K個(gè)查詢條件。7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)所述標(biāo)注信息生成M個(gè)候選查詢條件,包括:根據(jù)所述標(biāo)注信息生成M個(gè)初始候選查詢條件;根據(jù)用戶信息,對(duì)所述M個(gè)初始候選查詢條件進(jìn)行消歧處理,得到所述M個(gè)候選查詢條件,所述消歧處理包括根據(jù)用戶信息消除所述M個(gè)初始候選查詢條件中存在歧義的初始候選查詢條件中的歧義,其中,所述用戶信息包括終端設(shè)備的硬件信息、終端系統(tǒng)的軟件信息、保存在終端內(nèi)存或者存儲(chǔ)設(shè)備上的用戶數(shù)據(jù)、用戶的歷史操作和用戶的設(shè)定中的至少一種。8.根據(jù)權(quán)利要求6或7所述的方法,其特征在于,所述確定所述每個(gè)候選查詢條件的第一候選詞語和所述第二候選詞語的匹配指數(shù),包括:根據(jù)所述第一候選詞語和所述第二候選詞語的配對(duì)概率、序列距離、數(shù)據(jù)庫數(shù)據(jù)類型匹配度和語言習(xí)慣約束中的至少一種確定所述匹配指數(shù)。9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述配對(duì)概率由所述第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與所述第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集決定,其中,所述第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與所述第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集越少,所述配對(duì)概率越大,所述匹配指數(shù)越大。10.根據(jù)權(quán)利要求8或9所述的方法,其特征在于,所述序列距離由所述第一候選詞語和所述第二候選詞語在所述標(biāo)注信息或所述查詢語句中的距離決定,其中,所述第一候選詞語和所述第二候選詞語在所述標(biāo)注信息或所述查詢語句中的距離越大,所述序列距離越大,所述匹配指數(shù)越小,所述標(biāo)注信息或所述查詢語句中所述第一候選詞語和所述第二候選詞語之間的詞語的多少,表示所述距離的大小。11.根據(jù)權(quán)利要求8至10中任一項(xiàng)所述的方法,其特征在于,所述數(shù)據(jù)庫數(shù)據(jù)類型匹配度由所述第一候選詞語和所述第二候選詞語的數(shù)據(jù)庫數(shù)據(jù)類型是否一致決定,其中,所述第一候選詞語和所述第二候選詞語的數(shù)據(jù)類型一致時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度大于所述第一候選詞語和所述第二候選詞語的數(shù)據(jù)類型不一致時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度,所述匹配指數(shù)與所述數(shù)據(jù)庫類型匹配度正相關(guān)。12.根據(jù)權(quán)利要求8至11中任一項(xiàng)所述的方法,其特征在于,所述語言習(xí)慣約束由所述第一候選詞語和所述第二候選詞語是否符合數(shù)據(jù)庫或語言習(xí)慣決定,其中,所述第一候選詞語和所述第二候選詞語符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束小于所述第一候選詞語和所述第二候選詞語不符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束,所述匹配指數(shù)與所述語言習(xí)慣約束負(fù)相關(guān)。13.根據(jù)權(quán)利要求1至12中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述標(biāo)注信息生成查詢目標(biāo),包括:確定所述標(biāo)注信息中的標(biāo)簽為屬性名的詞語滿足預(yù)設(shè)條件和/或?yàn)楣曼c(diǎn)詞語,其中所述孤點(diǎn)詞語沒有對(duì)應(yīng)的標(biāo)簽為屬性值的詞語;將所述標(biāo)注信息中的標(biāo)簽為屬性名的詞語的屬性名作為所述查詢目標(biāo)。14.一種數(shù)據(jù)庫查詢的設(shè)備,其特征在于,包括:獲取單元,用于獲取待查詢語句,所述待查詢語句為自然語言查詢語句;劃分單元,用于根據(jù)預(yù)設(shè)詞庫劃分所述待查詢語句,得到N個(gè)詞語,N為大于或等于I的整數(shù);確定單元,用于從預(yù)設(shè)數(shù)據(jù)庫中確定第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,所述第一詞語為所述N個(gè)詞語中的任一詞語;標(biāo)注單元,用于為所述N個(gè)詞語中的各個(gè)詞語分別標(biāo)注標(biāo)簽,得到與所述待查詢語句對(duì)應(yīng)的標(biāo)注信息,所述標(biāo)注信息包括所述N個(gè)詞語和與所述N個(gè)詞語中的各個(gè)詞語呈一一對(duì)應(yīng)關(guān)系的標(biāo)簽,其中,與所述第一詞語呈一一對(duì)應(yīng)關(guān)系的標(biāo)簽用于表示所述第一詞語的數(shù)據(jù)類型,所述第一詞語的標(biāo)簽包括屬性名或?qū)傩灾担坏谝簧蓡卧?,用于根?jù)所述標(biāo)注信息生成K個(gè)查詢條件所述K個(gè)查詢條件中的每個(gè)查詢條件包括第二詞語、操作符和第三詞語,其中,所述操作符表示所述第二詞語和所述第三詞語的關(guān)系,所述第二詞語的標(biāo)簽為屬性名,所述第三詞語的標(biāo)簽為屬性值,K為大于或等于I且小于N的整數(shù);第二生成單元,用于根據(jù)所述標(biāo)注信息生成查詢目標(biāo),所述查詢目標(biāo)包括所述N個(gè)詞語中的至少一個(gè)詞語的數(shù)據(jù)庫實(shí)體,其中,所述至少一個(gè)詞語的標(biāo)簽為屬性名,所述至少一個(gè)詞語中的每個(gè)詞語的數(shù)據(jù)庫實(shí)體為所述每個(gè)詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體中的一個(gè);查詢單元,用于根據(jù)所述K個(gè)查詢條件和所述查詢目標(biāo)進(jìn)行查詢,得到查詢結(jié)果。15.根據(jù)權(quán)利要求14所述的設(shè)備,其特征在于,所述劃分單元根據(jù)預(yù)設(shè)詞庫劃分所述待查詢語句,得到N個(gè)初始詞語;根據(jù)預(yù)設(shè)規(guī)則,規(guī)范化所述N個(gè)初始詞語,得到所述N個(gè)詞語。16.根據(jù)權(quán)利要求14或15所述的設(shè)備,其特征在于,所述確定單元從預(yù)設(shè)數(shù)據(jù)庫中確定所述第一詞語的η個(gè)初始候選數(shù)據(jù)庫實(shí)體,η為大于或等于I的整數(shù);當(dāng)11大于I時(shí),確定所述η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與所述第一詞語的相關(guān)度,將所述η個(gè)初始候選數(shù)據(jù)庫實(shí)體中相關(guān)度高于預(yù)設(shè)閾值的初始候選數(shù)據(jù)庫實(shí)體確定為所述第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體,或者,當(dāng)η等于I時(shí),將所述第一詞語的η個(gè)初始候選數(shù)據(jù)庫實(shí)體確定為所述第一詞語的至少一個(gè)候選數(shù)據(jù)庫實(shí)體。17.根據(jù)權(quán)利要求16所述的設(shè)備,其特征在于,所述確定單元根據(jù)以下方法中的至少一種方法確定所述η個(gè)初始候選數(shù)據(jù)庫實(shí)體中每個(gè)初始候選數(shù)據(jù)庫實(shí)體與所述第一詞語的相關(guān)度:命中率、向量空間余弦和編輯距離。18.根據(jù)權(quán)利要求14至17中任一項(xiàng)所述的設(shè)備,其特征在于,還包括:合并單元,用于在第一生成單元根據(jù)所述標(biāo)注信息生成K個(gè)查詢條件之前,根據(jù)所述標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并所述標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語,得到第一合并詞語,所述第一合并詞語為所述標(biāo)注信息中連續(xù)標(biāo)簽為屬性名的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用所述第一合并詞語替換所述標(biāo)注信息中所述連續(xù)標(biāo)簽為屬性名的詞語,以對(duì)所述標(biāo)注信息進(jìn)行更新,和/或根據(jù)所述標(biāo)注信息中的詞語的候選數(shù)據(jù)庫實(shí)體,合并所述標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語,得到第二合并詞語,所述第二合并詞語為所述標(biāo)注信息中連續(xù)標(biāo)簽為屬性值的詞語的候選數(shù)據(jù)庫實(shí)體的交集,使用所述第二合并詞語替換所述標(biāo)注信息中所述連續(xù)標(biāo)簽為屬性值的詞語,以對(duì)所述標(biāo)注信息進(jìn)行更新,其中,所述第一生成單元根據(jù)更新后的標(biāo)注信息生成所述K個(gè)查詢條件,所述第二生成單元根據(jù)更新后的標(biāo)注信息生成所述查詢目標(biāo)。19.根據(jù)權(quán)利要求14至18中任一項(xiàng)所述的設(shè)備,其特征在于,所述第一生成單元根據(jù)所述標(biāo)注信息生成M個(gè)候選查詢條件,所述M個(gè)候選查詢條件中的每個(gè)候選查詢條件包括第一候選詞語、操作符和第二候選詞語的對(duì)應(yīng)關(guān)系,其中第一候選詞語的標(biāo)簽為屬性名,第二候選詞語的標(biāo)簽為屬性值,M為大于或等于K的整數(shù);確定所述每個(gè)候選查詢條件的第一候選詞語和所述第二候選詞語的匹配指數(shù);將所述M個(gè)候選查詢條件中的匹配指數(shù)大于預(yù)設(shè)閾值的K個(gè)候選查詢條件確定為所述K個(gè)查詢條件。20.根據(jù)權(quán)利要求19所述的設(shè)備,其特征在于,所述第一生成單元,根據(jù)所述標(biāo)注信息生成M個(gè)初始候選查詢條件;根據(jù)用戶信息,對(duì)所述M個(gè)初始候選查詢條件進(jìn)行消歧處理,得到所述M個(gè)候選查詢條件,所述消歧處理包括根據(jù)用戶信息消除所述M個(gè)初始候選查詢條件中存在歧義的初始候選查詢條件中的歧義,其中,所述用戶信息包括終端設(shè)備的硬件信息、終端系統(tǒng)的軟件信息、保存在終端內(nèi)存或者存儲(chǔ)設(shè)備上的用戶數(shù)據(jù)、用戶的歷史操作和用戶的設(shè)定中的至少一種。21.根據(jù)權(quán)利要求19或20所述的設(shè)備,其特征在于,所述第一生成單元根據(jù)所述第一候選詞語和所述第二候選詞語的配對(duì)概率、序列距離、數(shù)據(jù)庫數(shù)據(jù)類型匹配度和語言習(xí)慣約束中的至少一種確定所述匹配指數(shù)。22.根據(jù)權(quán)利要求21所述的設(shè)備,其特征在于,所述配對(duì)概率由所述第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與所述第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集決定,其中,所述第一候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體與所述第二候選詞語所對(duì)應(yīng)的數(shù)據(jù)庫實(shí)體之間的交集越少,所述配對(duì)概率越大,所述匹配指數(shù)越大。23.根據(jù)權(quán)利要求21或22所述的設(shè)備,其特征在于,所述序列距離由所述第一候選詞語和所述第二候選詞語在所述標(biāo)注信息或所述查詢語句中的距離決定,其中,所述第一候選詞語和所述第二候選詞語在所述標(biāo)注信息或所述查詢語句中的距離越大,所述序列距離越大,所述匹配指數(shù)越小,所述標(biāo)注信息或所述查詢語句中所述第一候選詞語和所述第二候選詞語之間的詞語的多少,表示所述距離的大小。24.根據(jù)權(quán)利要求21至23中任一項(xiàng)所述的設(shè)備,其特征在于,所述數(shù)據(jù)庫數(shù)據(jù)類型匹配度由所述第一候選詞語和所述第二候選詞語的數(shù)據(jù)庫數(shù)據(jù)類型是否一致決定,其中,所述第一候選詞語和所述第二候選詞語的數(shù)據(jù)類型一致時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度大于所述第一候選詞語和所述第二候選詞語的數(shù)據(jù)類型不一致時(shí)的數(shù)據(jù)庫數(shù)據(jù)類型匹配度,所述匹配指數(shù)與所述數(shù)據(jù)庫類型匹配度正相關(guān)。25.根據(jù)權(quán)利要求21至24中任一項(xiàng)所述的設(shè)備,其特征在于,所述語言習(xí)慣約束由所述第一候選詞語和所述第二候選詞語是否符合數(shù)據(jù)庫或語言習(xí)慣決定,其中,所述第一候選詞語和所述第二候選詞語符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束小于所述第一候選詞語和所述第二候選詞語不符合數(shù)據(jù)庫或語言習(xí)慣時(shí)的語言習(xí)慣約束,所述匹配指數(shù)與所述語言習(xí)慣約束負(fù)相關(guān)。26.根據(jù)權(quán)利要求14至25中任一項(xiàng)所述的設(shè)備,其特征在于,所述第二生成單元確定所述標(biāo)注信息中的標(biāo)簽為屬性名的詞語滿足預(yù)設(shè)條件和/或?yàn)楣曼c(diǎn)詞語,其中,所述孤點(diǎn)詞語沒有對(duì)應(yīng)的標(biāo)簽為屬性值的詞語;將所述標(biāo)注信息中的標(biāo)簽為屬性名的詞語的屬性名作為所述查詢目標(biāo)?!疚臋n編號(hào)】G06F17/30GK106033466SQ201510123021【公開日】2016年10月19日【申請(qǐng)日】2015年3月20日【發(fā)明人】姜南【申請(qǐng)人】華為技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1