專利智能檢索方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息檢索及分析挖掘領(lǐng)域,具體地,涉及專利智能檢索方法及系統(tǒng)。
【背景技術(shù)】
[0002]當(dāng)前隨著科技的迅速發(fā)展和經(jīng)濟(jì)的全球化,專利數(shù)據(jù)的作用越來越得到人們的重視。尤其是如今的專利信息增長極為迅速,全球每年公布的專利文獻(xiàn)數(shù)據(jù)呈快速增長趨勢。與此同時(shí),例如科研人員等社會(huì)公眾對(duì)于專利數(shù)據(jù)檢索的需求也越來越多樣化和依賴性。
[0003]在專利檢索請(qǐng)求和專利數(shù)據(jù)存量龐大的情況下,通過數(shù)據(jù)庫檢索相關(guān)專利信息需要耗費(fèi)大量的時(shí)間與精力,往往難以避免漏檢或者檢索精度不夠檢索結(jié)果數(shù)量過多等問題,因此,如何迅速準(zhǔn)確地提供檢索者所真正需信息是目前面臨的一個(gè)重要技術(shù)問題。
[0004]經(jīng)檢索發(fā)現(xiàn),專利文獻(xiàn)(申請(qǐng)?zhí)?201210141567.1;公開號(hào):CN102708179A)公開了一種專利數(shù)據(jù)的自動(dòng)檢索方法和裝置,包括:S1、獲取用戶設(shè)定的檢索條件;S2、判斷本次檢索是否為針對(duì)所述用戶設(shè)定的檢索條件進(jìn)行的首次檢索,如果否,執(zhí)行高頻關(guān)鍵詞提取步驟;S3、將所述用戶設(shè)定的檢索條件附加一個(gè)專利日期檢索區(qū)間作為新的檢索條件,利用新的檢索條件進(jìn)行專利數(shù)據(jù)的檢索,得到檢索結(jié)果;其中附加的所述專利日期檢索區(qū)間為:上一檢索日向前推預(yù)設(shè)天數(shù)的日期至當(dāng)前檢索日,結(jié)束本次檢索,待下一檢索周期時(shí)轉(zhuǎn)至所述檢索結(jié)果A獲取步驟,所述預(yù)設(shè)天數(shù)為自然數(shù)。
[0005]現(xiàn)有技術(shù)存在如下不足之處:
[0006](1)檢索結(jié)果完全依賴于用戶輸入的關(guān)鍵詞,若關(guān)鍵詞不當(dāng),則導(dǎo)致檢索方向出現(xiàn)偏差;
[0007](2)僅支持對(duì)關(guān)鍵詞進(jìn)行檢索,缺少對(duì)專利文獻(xiàn)整體相似度的判斷,在專利預(yù)警檢索中導(dǎo)致漏檢;
[0008](3)專利數(shù)據(jù)的分析功能簡單,不能對(duì)專利價(jià)值進(jìn)行檢索;
[0009](4)發(fā)明的新穎性檢索時(shí)缺少對(duì)現(xiàn)有外觀設(shè)計(jì)專利文獻(xiàn)的檢索。
【發(fā)明內(nèi)容】
[0010]針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明的目的是提供一種專利智能檢索方法及系統(tǒng)。
[0011]根據(jù)本發(fā)明提供的一種專利智能檢索方法,包括:
[0012]第一檢索式獲取步驟:獲取用戶輸入的第一檢索式,其中,第一檢索式包括用戶輸入的初始關(guān)鍵詞;
[0013]檢索結(jié)果A獲取步驟:利用第一檢索式進(jìn)行檢索,得到檢索結(jié)果A;
[0014]尚頻關(guān)鍵詞提取步驟:從檢索結(jié)果A中提取出專利文獻(xiàn)的尚頻關(guān)鍵詞;
[0015]第二檢索式獲取步驟:將第一檢索式中的初始關(guān)鍵詞替換為高頻關(guān)鍵詞,得到第二檢索式;
[0016]檢索結(jié)果B獲取步驟:利用第二檢索式進(jìn)行檢索,得到檢索結(jié)果B;
[0017]特征向量提取步驟:從檢索結(jié)果B中提取出專利文獻(xiàn)的特征向量,該特征向量主要由專利文獻(xiàn)的文本特征和/或附圖特征構(gòu)成;
[0018]檢索結(jié)果C獲取步驟:將特征向量與專利數(shù)據(jù)庫中的各個(gè)專利文獻(xiàn)進(jìn)行相似度匹配,得到相似專利文獻(xiàn)作為檢索結(jié)果C。
[0019]優(yōu)選地,還包括如下任一個(gè)或任多個(gè)步驟:
[0020]-新穎性檢索步驟:對(duì)檢索結(jié)果C以申請(qǐng)日為關(guān)鍵詞進(jìn)行二次篩選,得到新穎性檢索結(jié)果;
[0021]-專利價(jià)值檢索步驟:對(duì)檢索結(jié)果C以公開日為關(guān)鍵詞進(jìn)行二次篩選,得到專利價(jià)值檢索結(jié)果;
[0022]-競爭對(duì)手檢索步驟:對(duì)檢索結(jié)果C以申請(qǐng)人為關(guān)鍵詞進(jìn)行二次篩選,得到競爭對(duì)手檢索結(jié)果。
[0023]優(yōu)選地,所述高頻關(guān)鍵詞提取步驟包括:
[0024]精確關(guān)鍵詞提取步驟:在檢索結(jié)果A中,從排序在前N個(gè)的專利文獻(xiàn)的著錄項(xiàng)目中提取出尚頻關(guān)鍵詞;N為正整數(shù);
[0025]其中,在提取出高頻關(guān)鍵詞的過程中,將設(shè)定的專利術(shù)語排除在高頻關(guān)鍵詞之外。
[0026]優(yōu)選地,所述特征向量提取步驟包括:
[0027]精確特征提取步驟:在檢索結(jié)果B中,從排序在前Μ個(gè)的專利文獻(xiàn)的全文內(nèi)容中提取出特征向量,其中,Μ為正整數(shù)。
[0028]優(yōu)選地,還包括:
[0029]關(guān)聯(lián)建立步驟:在歷史上檢索的得到的檢索結(jié)果C中的各個(gè)專利文獻(xiàn)之間建立關(guān)聯(lián)關(guān)系;
[0030]所述高頻關(guān)鍵詞提取步驟包括:
[0031 ]關(guān)聯(lián)關(guān)鍵詞提取步驟:在檢索結(jié)果Α中,從排序在前Ν個(gè)的專利文獻(xiàn)及與該前Ν個(gè)的專利文獻(xiàn)建立有關(guān)聯(lián)關(guān)系的專利文獻(xiàn)的者錄項(xiàng)目中提取出尚頻關(guān)鍵詞;N為正整數(shù);
[0032]所述特征向量提取步驟包括:
[0033]關(guān)聯(lián)特征提取步驟:在檢索結(jié)果B中,從排序在前Μ個(gè)的專利文獻(xiàn)及與該前Μ個(gè)的專利文獻(xiàn)建立有關(guān)聯(lián)關(guān)系的專利文獻(xiàn)的全文內(nèi)容中提取出特征向量,其中,Μ為正整數(shù)。
[0034]根據(jù)本發(fā)明提供的一種專利智能檢索系統(tǒng),包括:
[0035]第一檢索式獲取裝置:獲取用戶輸入的第一檢索式,其中,第一檢索式包括用戶輸入的初始關(guān)鍵詞;
[0036]檢索結(jié)果Α獲取裝置:利用第一檢索式進(jìn)行檢索,得到檢索結(jié)果Α;
[0037]尚頻關(guān)鍵詞提取裝置:從檢索結(jié)果A中提取出專利文獻(xiàn)的尚頻關(guān)鍵詞;
[0038]第二檢索式獲取裝置:將第一檢索式中的初始關(guān)鍵詞替換為高頻關(guān)鍵詞,得到第二檢索式;
[0039]檢索結(jié)果B獲取裝置:利用第二檢索式進(jìn)行檢索,得到檢索結(jié)果B;
[0040]特征向量提取裝置:從檢索結(jié)果B中提取出專利文獻(xiàn)的特征向量,該特征向量主要由專利文獻(xiàn)的文本特征和/或附圖特征構(gòu)成;
[0041]檢索結(jié)果C獲取裝置:將特征向量與專利數(shù)據(jù)庫中的各個(gè)專利文獻(xiàn)進(jìn)行相似度匹配,得到相似專利文獻(xiàn)作為檢索結(jié)果C。
[0042]優(yōu)選地,還包括如下任一個(gè)或任多個(gè)裝置:
[0043]-新穎性檢索裝置:對(duì)檢索結(jié)果C以申請(qǐng)日為關(guān)鍵詞進(jìn)行二次篩選,得到新穎性檢索結(jié)果;
[0044]-專利價(jià)值檢索裝置:對(duì)檢索結(jié)果C以公開日為關(guān)鍵詞進(jìn)行二次篩選,得到專利價(jià)值檢索結(jié)果;
[0045]-競爭對(duì)手檢索裝置:對(duì)檢索結(jié)果C以申請(qǐng)人為關(guān)鍵詞進(jìn)行二次篩選,得到競爭對(duì)手檢索結(jié)果。
[0046]優(yōu)選地,所述高頻關(guān)鍵詞提取裝置包括:
[0047]精確關(guān)鍵詞提取裝置:在檢索結(jié)果A中,從排序在前N個(gè)的專利文獻(xiàn)的著錄項(xiàng)目中提取出尚頻關(guān)鍵詞;N為正整數(shù);
[0048]其中,在提取出高頻關(guān)鍵詞的過程中,將設(shè)定的專利術(shù)語排除在高頻關(guān)鍵詞之外。
[0049]優(yōu)選地,所述特征向量提取裝置包括:
[0050]精確特征提取裝置:在檢索結(jié)果B中,從排序在前Μ個(gè)的專利文獻(xiàn)的全文內(nèi)容中提取出特征向量,其中,Μ為正整數(shù)。
[0051 ] 優(yōu)選地,還包括:
[0052]關(guān)聯(lián)建立裝置:在歷史上檢索的得到的檢索結(jié)果C中的各個(gè)專利文獻(xiàn)之間建立關(guān)聯(lián)關(guān)系;
[0053]所述高頻關(guān)鍵詞提取裝置包括:
[0054]關(guān)聯(lián)關(guān)鍵詞提取裝置:在檢索結(jié)果Α中,從排序在前Ν個(gè)的專利文獻(xiàn)及與該前Ν個(gè)的專利文獻(xiàn)建立有關(guān)聯(lián)關(guān)系的專利文獻(xiàn)的者錄項(xiàng)目中提取出尚頻關(guān)鍵詞;N為正整數(shù);
[0055]所述特征向量提取裝置包括:
[0056]關(guān)聯(lián)特征提取裝置:在檢索結(jié)果B中,從排序在前Μ個(gè)的專利文獻(xiàn)及與該前Μ個(gè)的專利文獻(xiàn)建立有關(guān)聯(lián)關(guān)系的專利文獻(xiàn)的全文內(nèi)容中提取出特征向量,其中,Μ為正整數(shù)。
[0057]優(yōu)選地,Ν為大于等于2的正整數(shù),Μ為大于Ν的正整數(shù)。
[0058]與現(xiàn)有技術(shù)相比,本發(fā)明具有如下的有益效果:
[0059]1、本發(fā)明在整個(gè)檢索過程中,用戶只需要輸入一次初始的檢索式,即可得到數(shù)據(jù)分析及檢索結(jié)果,并可以繼續(xù)開展二次篩選以得到更為個(gè)性化的檢索結(jié)果;
[0060]2、本發(fā)明能夠智能化的自動(dòng)調(diào)整關(guān)鍵詞,以修正檢索方向;
[0061]3、本發(fā)明根據(jù)關(guān)鍵詞得到初步的檢索結(jié)果后,從初步的檢索結(jié)果中提取出特征,從而用特征檢索代替關(guān)鍵詞檢索,進(jìn)而提尚了檢索精度;
[0062]4、本發(fā)明利用特征進(jìn)行內(nèi)容相似度檢索,能夠有效防止漏檢;
[0063]5、本發(fā)明中結(jié)合公開日等關(guān)鍵詞進(jìn)行二次篩選,能夠得到專利預(yù)警、專利價(jià)值等高級(jí)分析功能的檢索結(jié)果。
[0064]6、通過多次不同范圍的檢索,逐步得到各個(gè)檢索結(jié)果,從而減少了檢索的計(jì)算量和檢索量,縮短了檢索時(shí)間。
【附圖說明】
[0065]通過閱讀參照以下附圖對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0066]圖1為本發(fā)明提供的專利智能檢索方法的步驟流程圖。
[0067]圖2為本發(fā)明提供的專利智能檢索系統(tǒng)的裝置結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0068]下面結(jié)合具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)說明。以下實(shí)施例將有助于本領(lǐng)域的技術(shù)人員進(jìn)一步理解本發(fā)明,但不以任何形式限制本發(fā)明。應(yīng)當(dāng)指出的是,對(duì)本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變化和改進(jìn)。這些都屬于本發(fā)明的保護(hù)范圍。
[0069]根據(jù)本發(fā)明提供的一種專利智能檢索系統(tǒng),包括:
[0070]第一檢索式獲取裝置:獲取用戶輸入的第一檢索式,其中,第一檢索式包括用戶輸入的初始關(guān)鍵詞;
[0071]檢索結(jié)果A獲取裝置:利用第一檢索式進(jìn)行檢索,得到檢索結(jié)果A;
[0072]尚頻關(guān)鍵詞提取裝置:從檢索結(jié)果A中提取出專利文獻(xiàn)的尚頻關(guān)鍵詞;
[0073]第二檢索式獲取裝置:將第一檢索式中的初始關(guān)鍵詞替換為高頻關(guān)鍵詞,得到第二檢索式;
[0074]檢索結(jié)果B獲取裝置:利用第二檢索式進(jìn)行檢索,得到檢索結(jié)果B;
[0075]特征向量提取裝置:從檢索結(jié)果B中提取出專利文獻(xiàn)的特征向量,該特征向量主要由專利文獻(xiàn)的文本特征和/或附圖特征構(gòu)成;
[0076]檢索結(jié)果C獲取裝置:將特征向量與專利數(shù)據(jù)庫中的各個(gè)專利文獻(xiàn)進(jìn)行相似度匹配,得到相似專利文獻(xiàn)作為檢索結(jié)果C;
[0077]新穎性檢索裝置:對(duì)檢索結(jié)果C以申請(qǐng)日為關(guān)鍵詞進(jìn)行二次篩選,得到新穎性檢索結(jié)果;
[0078]專利價(jià)值檢索裝置:對(duì)檢索結(jié)果C以公開日為關(guān)鍵詞進(jìn)行二次篩選,得到專利價(jià)值檢索結(jié)果;
[0079]競爭對(duì)手檢索裝置:對(duì)檢索結(jié)果C以申請(qǐng)人為關(guān)鍵詞進(jìn)行二次篩選,得到競爭對(duì)手檢索結(jié)果。
[0080]在一個(gè)優(yōu)選例中,所述高頻關(guān)鍵詞提取裝置包括:
[0081 ]精確關(guān)鍵詞提取裝置:在檢索結(jié)果A中,從排序在前N個(gè)的專利文獻(xiàn)的著錄項(xiàng)目中提取出尚頻關(guān)鍵詞;N為大于等于2的正整數(shù);
[0082]其中,在提取出高頻關(guān)鍵詞的過程中,將設(shè)定的專利術(shù)語排除在高頻關(guān)鍵詞之外。
[0083]所述特征向量提取裝置包括:
[0084]精確特征提取裝置:在檢索結(jié)果B中,從排序在前Μ個(gè)的專利文獻(xiàn)的全文內(nèi)容中提取出特征向量,其中,Μ為大于Ν的正整數(shù)。