亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

目標(biāo)檢索電子文獻(xiàn)集合中多章節(jié)文獻(xiàn)的方法、系統(tǒng)和設(shè)備的制作方法

文檔序號(hào):6596487閱讀:135來源:國知局
專利名稱:目標(biāo)檢索電子文獻(xiàn)集合中多章節(jié)文獻(xiàn)的方法、系統(tǒng)和設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及電子文獻(xiàn)集合,并響應(yīng)于查詢的接收,檢索電子文獻(xiàn)集合。更具體地,本發(fā)明涉及對(duì)每篇文獻(xiàn)的多個(gè)章節(jié)進(jìn)行分類,并響應(yīng)于集合中的文獻(xiàn)的所分類章節(jié),有效處理查詢。
背景技術(shù)
所有用于注冊(cè)或?qū)彶榈闹R(shí)產(chǎn)權(quán)文獻(xiàn)(包括專利、商標(biāo)和版權(quán)申請(qǐng))必須提交給指定受理這些申請(qǐng)的政府機(jī)構(gòu)。提交給政府專利部門以用于審查的專利申請(qǐng)必須滿足某些要求,這些要求包括每件專利必須被認(rèn)為是新穎的、實(shí)用的和非顯而易見的。即使不是全部,但大多數(shù)的國外專利部門都采用相似的標(biāo)準(zhǔn)。為了恰當(dāng)?shù)販?zhǔn)備用于審查的專利申請(qǐng),知曉相關(guān)技術(shù)領(lǐng)域中的先前專利(即,現(xiàn)有技術(shù))是有益的,這是因?yàn)橐豁?xiàng)發(fā)明僅授予一項(xiàng)專 利權(quán)。確定現(xiàn)有技術(shù)的過程被稱為專利檢索。專利檢索的結(jié)果通常有助于隨后專利申請(qǐng)的任何撰寫人將精力集中到能被授權(quán)的主題上,并有助于制定一套合理的策略,以實(shí)現(xiàn)該發(fā)明人或者專利權(quán)所有人的目標(biāo)。眾所周知,在技術(shù)革命進(jìn)入到當(dāng)今的電子信息時(shí)代之前,通過人工進(jìn)行專利檢索。檢索者將瀏覽專利公開內(nèi)容,并根據(jù)專利分類系統(tǒng)來確定該專利公開內(nèi)容的分類位置,并然后進(jìn)行檢索。隨著信息技術(shù)的到來,由于所有的專利和出版的專利申請(qǐng)僅以電子形式存在,所以不再使用紙質(zhì)檢索。即使對(duì)于電子形式的專利文獻(xiàn),仍然可以采用與手工檢索類似的方式,對(duì)電子專利數(shù)據(jù)庫進(jìn)行檢索??梢圆捎貌煌?jí)別的檢索,以獲得不同的結(jié)果。例如,可以采用新穎性檢索以確定是否提交專利申請(qǐng)。可以采用產(chǎn)品確權(quán)檢索以確定產(chǎn)品是否被目前專利的權(quán)利要求所覆蓋。可以采用無效檢索以判斷專利提出的權(quán)利要求是否有效,等等。過去的電子檢索工具不支持不同級(jí)別的檢索。因而,檢索人(也稱為檢索者)需要承擔(dān)如下工作量根據(jù)檢索的范圍,在檢索時(shí)限制專利文獻(xiàn)中需要瀏覽的章節(jié)。由于數(shù)據(jù)庫中的專利和公布的專利申請(qǐng)的數(shù)量不斷增加,所以每次檢索需要瀏覽更多的專利和公布的專利申請(qǐng),從而增加了檢索的工作量。因此,檢索者需要使用一種用來減輕檢索及相關(guān)檢索范圍方面的工作量的工具。該工具應(yīng)當(dāng)能夠使檢索者在檢索過程中均衡利用專利文獻(xiàn)的不同章節(jié),從而更高效和有效地得到精確的和期望的檢索結(jié)果。

發(fā)明內(nèi)容
本發(fā)明包括用于高效和有效地檢索諸如專利文獻(xiàn)等知識(shí)產(chǎn)權(quán)文獻(xiàn)的集合的方法、系統(tǒng)和廣品。一方面,本發(fā)明提供了一種用于檢索電子文獻(xiàn)集合的計(jì)算機(jī)方法。對(duì)知識(shí)產(chǎn)權(quán)文獻(xiàn)的集合進(jìn)行匯編,其中所述集合中的各個(gè)所述知識(shí)產(chǎn)權(quán)文獻(xiàn)包括多個(gè)章節(jié)。例如,在為所述進(jìn)行集合編制索引時(shí),為所述集合中的各個(gè)專利文獻(xiàn)獲得至少一個(gè)文獻(xiàn)向量。所述文獻(xiàn)向量的所述獲得包括為所述集合中的各個(gè)文獻(xiàn)生成至少一個(gè)靜態(tài)文獻(xiàn)向量。在向所述集合提交查詢時(shí),基于與查詢輸入一起提交的字符串生成動(dòng)態(tài)文獻(xiàn)向量。通過向集合提交查詢輸入,將所述查詢輸入有關(guān)的所述動(dòng)態(tài)文獻(xiàn)向量與所述集合中的各個(gè)靜態(tài)文獻(xiàn)向量進(jìn)行比較?;谒鰟?dòng)態(tài)文獻(xiàn)向量與所述集合中的所述靜態(tài)文獻(xiàn)向量的所述比較,返回關(guān)聯(lián)專利文獻(xiàn)的匯編。另一方面,本發(fā)明提供了一種計(jì)算機(jī)系統(tǒng),所述計(jì)算機(jī)系統(tǒng)設(shè)有處理器,所述處理器與存儲(chǔ)介質(zhì)通信,在所述存儲(chǔ)介質(zhì)上保存電子文獻(xiàn)集合。所述電子文獻(xiàn)集合是專利或者其它知識(shí)產(chǎn)權(quán)文獻(xiàn)的匯編。基于專利文獻(xiàn)的特性,所述集合中的各個(gè)所述專利文獻(xiàn)具有多個(gè)章節(jié)。在編制索引時(shí),為集合中的各個(gè)專利文獻(xiàn)獲得至少一個(gè)文獻(xiàn)向量。所述文獻(xiàn)向量的所述獲得包括為所述文獻(xiàn)集合中的各個(gè)專利文獻(xiàn)生成至少一個(gè)靜態(tài)文獻(xiàn)向量。在查詢時(shí),基于查詢輸入中的字符串?dāng)?shù)據(jù),生成動(dòng)態(tài)文獻(xiàn)向量。在生成所述動(dòng)態(tài)文獻(xiàn)之后,向所述電子專利文獻(xiàn)集合提交所述查詢輸入。響應(yīng)于向所述專利文獻(xiàn)集合提交的所述查詢輸入,與輸入管理器通信的查詢管理器將所述動(dòng)態(tài)文獻(xiàn)向量與所述集合中的各個(gè)靜態(tài)文獻(xiàn)向量相比較。在所述查詢管理器所進(jìn)行的所述提交之后,基于所述動(dòng)態(tài)文獻(xiàn)向量與所述靜態(tài)文獻(xiàn)向量的所述比較,返回關(guān)聯(lián)專利文獻(xiàn)的匯編。·又一方面,本發(fā)明提供了一種具有計(jì)算機(jī)可讀載體的產(chǎn)品,所述計(jì)算機(jī)可讀載體包括用于檢索計(jì)算機(jī)存儲(chǔ)器上的電子文獻(xiàn)集合的計(jì)算機(jī)程序指令。所述計(jì)算機(jī)可讀載體包括在文獻(xiàn)集合上執(zhí)行的計(jì)算機(jī)程序指令。所述指令用于對(duì)所述專利文獻(xiàn)的集合進(jìn)行匯編。所述集合中的各個(gè)所述專利文獻(xiàn)劃分成多個(gè)章節(jié)。在為所述集合編制索引時(shí),提供用于為所述集合中的各個(gè)專利文獻(xiàn)獲得至少一個(gè)文獻(xiàn)向量的指令。所述獲得包括為所述文獻(xiàn)集合中的各個(gè)專利文獻(xiàn)生成至少一個(gè)靜態(tài)文獻(xiàn)向量。在向所述集合提交查詢時(shí),提供用于基于查詢輸入中的字符串?dāng)?shù)據(jù)生成動(dòng)態(tài)文獻(xiàn)向量的指令。在生成所述動(dòng)態(tài)文獻(xiàn)向量之后,向所述電子文獻(xiàn)集合提交所述查詢,以便將所述動(dòng)態(tài)文獻(xiàn)向量與所述集合中的各個(gè)靜態(tài)文獻(xiàn)向量進(jìn)行比較。通過提交所述查詢,基于所述動(dòng)態(tài)文獻(xiàn)向量與所述集合中的所述靜態(tài)文獻(xiàn)向量的所述比較,返回的關(guān)聯(lián)專利文獻(xiàn)的匯編。通過下面結(jié)合附圖而對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行的詳細(xì)描述,將更清楚地了解本發(fā)明的其它特征和優(yōu)點(diǎn)。


這里參照的附圖構(gòu)成說明書的一部分。除非明確說明,附圖所示的特征僅用于說明本發(fā)明的某些實(shí)施例,但并不是說明本發(fā)明的所有實(shí)施例。另外,這不含有與之相反的意思。圖I是表示檢索電子文獻(xiàn)集合的流程圖,更具體地,是表示檢索與專利和專利出版物有關(guān)的集合的流程圖;圖2是表示向?qū)@墨I(xiàn)集合提交查詢的整體過程的流程圖;圖3是表示使用停止詞(stop word)以進(jìn)一步解析專利文獻(xiàn)集合中的靜態(tài)文獻(xiàn)向量的過程的流程圖;圖4是表示針對(duì)集合中的各個(gè)專利文獻(xiàn)生成多個(gè)文獻(xiàn)向量的過程的流程圖;圖5是表示本發(fā)明的優(yōu)選實(shí)施例的向具有多個(gè)文獻(xiàn)向量的文獻(xiàn)集合提交查詢的過程的流程圖,并建議將本圖印刷在公告專利的扉頁上;圖6是表示所采用的用于向電子合提交查詢的一組工具的框圖;以及圖7是用于指定用戶輸入以檢索電子文獻(xiàn)集合的圖形用戶界面的框圖。
具體實(shí)施例方式應(yīng)容易理解,這里,可以通過不同的配置來布置和設(shè)計(jì)本發(fā)明的如在附圖中概述及圖示的組件。因此,如附圖所示,下文對(duì)本發(fā)明的設(shè)備、系統(tǒng)和方法的詳細(xì)說明僅是選自本發(fā)明的有代表性的實(shí)施例,而不是要限制本發(fā)明要求保護(hù)的范圍。本說明書中描述的功能單元稱作管理器。管理器可以在諸如現(xiàn)場(chǎng)可編程門陣列、可編程陣列邏輯、可編程邏輯器件等可編程硬件器件中實(shí)現(xiàn)。管理器也可以在由各種處理器執(zhí)行的軟件中實(shí)現(xiàn)。例如,由可執(zhí)行代碼構(gòu)成的等同管理器可以包括一個(gè)或多個(gè)物理塊或邏輯塊的計(jì)算機(jī)指令,這些計(jì)算機(jī)指令可以被構(gòu)建成例如對(duì)象、程序、函數(shù)或其他結(jié)構(gòu)。 盡管如此,等同管理器的可執(zhí)行文件無需物理地放置在一起,而是可以包括存儲(chǔ)在不同位置的不同指令,當(dāng)這些指令邏輯地聯(lián)合在一起時(shí),則它們組成管理器并實(shí)現(xiàn)管理器的規(guī)定目標(biāo)。事實(shí)上,由可執(zhí)行代碼構(gòu)成的管理器可以是一條指令或多條指令,甚至可以分布于多個(gè)不同的代碼段、不同的應(yīng)用程序、及多個(gè)不同的存儲(chǔ)器中。同樣地,這里,操作數(shù)據(jù)可以在管理器的范圍內(nèi)進(jìn)行等同和說明,其可以實(shí)施為任何適當(dāng)?shù)男问?,也可以?gòu)建成任何適當(dāng)類型的數(shù)據(jù)結(jié)構(gòu)。操作數(shù)據(jù)可以集成為單個(gè)數(shù)據(jù)集合,或可以分布到包括不同存儲(chǔ)器在內(nèi)的不同位置,還可以至少部分地作為電子信號(hào)存在于系統(tǒng)或網(wǎng)絡(luò)上。整個(gè)說明書中所提到的“所選實(shí)施例”、“一個(gè)實(shí)施例”或“實(shí)施例”意味著,結(jié)合該實(shí)施例所描述的特定特點(diǎn)、結(jié)構(gòu)、或者特征包含在本發(fā)明的至少一個(gè)實(shí)施例中。因此,在整個(gè)說明書中的各處出現(xiàn)的用語“所選實(shí)施例”、“在一個(gè)實(shí)施例中”或“在實(shí)施例中”不一定是指同一個(gè)實(shí)施例。而且,在一個(gè)或多個(gè)實(shí)施例中,可以以任何適當(dāng)?shù)姆绞浇M合所描述的特點(diǎn)、結(jié)構(gòu)或者特征。在下文中,提供了大量的詳細(xì)描述,例如文獻(xiàn)管理器、輸入管理器、查詢管理器等的示例,以便全面理解本發(fā)明的實(shí)施例。然而,所屬技術(shù)領(lǐng)域的技術(shù)人員應(yīng)意識(shí)到,在省略一個(gè)或多個(gè)具體細(xì)節(jié),或用其他方法、構(gòu)件、用具等的情況下,也可實(shí)現(xiàn)本發(fā)明。在其它情況下,為避免使本發(fā)明的發(fā)明點(diǎn)變得費(fèi)解,對(duì)于眾所周知的結(jié)構(gòu)、用具或者操作則不再詳細(xì)示出或說明。通過參考附圖可以更好地理解本發(fā)明的實(shí)施例,其中,在整個(gè)說明書中,使用相同的附圖標(biāo)記表示相同的部分。下面僅用舉例的方式簡(jiǎn)述與在此所保護(hù)的發(fā)明相一致的設(shè)備、系統(tǒng)和方法的某些選擇實(shí)施例。概述知識(shí)產(chǎn)權(quán)文獻(xiàn)采用靜態(tài)文獻(xiàn)向量和動(dòng)態(tài)文獻(xiàn)向量。下面將具體針對(duì)專利文獻(xiàn)展開討論。在一個(gè)實(shí)施例中,文獻(xiàn)向量可應(yīng)用于任何知識(shí)產(chǎn)權(quán)文獻(xiàn)。文獻(xiàn)向量是(關(guān)鍵詞、權(quán)重)對(duì)的集合,其中關(guān)鍵詞是與基礎(chǔ)文獻(xiàn)有關(guān)的詞或短語,而權(quán)重是該關(guān)鍵詞在文獻(xiàn)中的重要性的數(shù)值度量。更具體地,文獻(xiàn)向量是一種文獻(xiàn)識(shí)別標(biāo)記,其用于以有助于文獻(xiàn)之間的比較的方式來表示文獻(xiàn)內(nèi)容。它是文獻(xiàn)的未受到結(jié)構(gòu)化的文字內(nèi)容的數(shù)字表示。由于專利和公布的專利申請(qǐng)不會(huì)頻繁改變,所以靜態(tài)文獻(xiàn)向量與這些文獻(xiàn)相關(guān)聯(lián)。動(dòng)態(tài)文獻(xiàn)向量與提交到專利文獻(xiàn)集合的查詢字符串?dāng)?shù)據(jù)(下文中稱為字符串)相關(guān)聯(lián)。靜態(tài)文獻(xiàn)向量可解析成排除專利所特有的字符串及在進(jìn)行檢索時(shí)幾乎沒有價(jià)值的字符串。所排除的字符串稱作“停止詞”。在一個(gè)實(shí)施例中,這里使用的停止詞是專利領(lǐng)域特有的。此外,每篇專利文獻(xiàn)中具有規(guī)定的章節(jié),各個(gè)章節(jié)表示專利文獻(xiàn)的不同部分。當(dāng)進(jìn)行專利檢索時(shí),對(duì)專利文獻(xiàn)的不同章節(jié)設(shè)置不同的值。這樣,根據(jù)專利檢索的范圍,可以將檢索限制到專利文獻(xiàn)的特定章節(jié)。所以,在專利文獻(xiàn)集合中采用文獻(xiàn)向量,以便通過與提交至專利文獻(xiàn)集合的查詢有關(guān)的數(shù)據(jù)來高效和有效地生成結(jié)果集合,該結(jié)果集合是專利文獻(xiàn)集合中的一篇或多篇文獻(xiàn),上述一篇或多篇文獻(xiàn)的靜態(tài)文獻(xiàn)向量經(jīng)計(jì)算落入到與所提交的查詢字符串?dāng)?shù)據(jù)相關(guān)的動(dòng)態(tài)文獻(xiàn)向量的設(shè)定數(shù)學(xué)范圍內(nèi)。技術(shù)細(xì)節(jié)
在實(shí)施例的下述描述中,參照用于構(gòu)成本文一部分的附圖來進(jìn)行說明,這些附圖表示可以實(shí)施本發(fā)明的具體實(shí)施例。應(yīng)當(dāng)理解,在不脫離本發(fā)明范圍的前提下可以進(jìn)行結(jié)構(gòu)變化,從而可以采用其它實(shí)施例。圖I是表示電子文獻(xiàn)集合的檢索的總體流程圖(100),更具體地,其是表示專利和專利出版物相關(guān)的集合的總體檢索流程圖(100)。首先,對(duì)專利文獻(xiàn)的集合進(jìn)行匯編(步驟102)。應(yīng)認(rèn)識(shí)到,專利和專利出版物是由多個(gè)章節(jié)構(gòu)成。在匯編這些文獻(xiàn)之后,為該集合編制索引(步驟104),該匯編的編制索引過程包括將數(shù)據(jù)集合轉(zhuǎn)換成適于搜索與檢索的數(shù)據(jù)庫。更具體地,文獻(xiàn)集合的索引編制包括獲得集合中各個(gè)專利文獻(xiàn)的文獻(xiàn)向量(步驟106)。文獻(xiàn)向量包括詞和短語的加權(quán)列表。在一個(gè)實(shí)施例中,被選入文獻(xiàn)向量的術(shù)語包括但不限于名詞短語、不出現(xiàn)在句首并首字母大寫的詞以及文獻(xiàn)中頻繁出現(xiàn)的詞。計(jì)算被放入向量中的術(shù)語的權(quán)重。在一個(gè)實(shí)施例中,下列用于計(jì)算權(quán)重的方法可包括但不限于將詞在文獻(xiàn)中出現(xiàn)的頻率標(biāo)準(zhǔn)化成I和O之間數(shù)值(其中,將I指定到文獻(xiàn)中最常出現(xiàn)的詞)、增加文獻(xiàn)的被選區(qū)域中的詞或者詞對(duì)的權(quán)重、向名詞短語指定較高的權(quán)重、提高文獻(xiàn)正文中的首字母大寫的詞的權(quán)重、并相對(duì)較短的字符串向較長字符串指定較高的權(quán)重。一旦選擇了列入到文獻(xiàn)向量中的詞和短語,并且為這些詞和短語選擇了權(quán)重,通過使用積分器來計(jì)算文獻(xiàn)向量。在一個(gè)實(shí)施例中,積分器能夠選擇哪些區(qū)域列入到向量中以及所列入的詞和短語的權(quán)重增加程度、能夠選擇各個(gè)因數(shù)對(duì)最終術(shù)語權(quán)重的貢獻(xiàn)程度、以及能夠?qū)?shí)體類型加入向量中,例如,提高在文件中發(fā)現(xiàn)的公司實(shí)體的重要性,并增加停止詞列表以移除數(shù)據(jù)庫中發(fā)現(xiàn)的常見短語。為集合中的各個(gè)專利文獻(xiàn)生成的文獻(xiàn)向量稱作“靜態(tài)文獻(xiàn)向量”。除個(gè)別例外情況之外,一旦專利文獻(xiàn)公布,通常不會(huì)發(fā)生變化。而例外情況包括但不限于證書修正的發(fā)布、公布專利的再次審查和公布專利的再次公布。為了處理這些例外情況,需要更新文獻(xiàn)集合。更具體地,建立時(shí)間間隔,以用于更新集合中的文獻(xiàn)以及相關(guān)的文獻(xiàn)向量的任何變化(步驟108)。時(shí)間間隔的示例包括但不限于每月、每半年、每年等等。然后,判斷所建立的時(shí)間間隔是否到期(步驟110)。若步驟(110)處的判斷結(jié)果是肯定的,則接下來返回到步驟(102)。反之,若步驟(110)處的判斷結(jié)果是否定的,則接下來等待所設(shè)定的時(shí)段,以更新專利文獻(xiàn)向量,以便將專利文獻(xiàn)的所有變化加入到文獻(xiàn)向量中(步驟112),接下來返回到步驟(110)。在一個(gè)實(shí)施例中,專利文獻(xiàn)不限于授權(quán)專利,還包括公布的專利申請(qǐng)。因此,鑒于專利的內(nèi)在屬性,專利文獻(xiàn)集合應(yīng)當(dāng)定期更新,以處理集合中所有專利的所有變化。一旦已解析文獻(xiàn)集合以生成該集合的靜態(tài)文獻(xiàn)向量,就能夠查詢?cè)摷?。圖2是表示向?qū)@墨I(xiàn)集合提交查詢的整體過程的流程圖(200)。首先,接收輸入查詢(步驟202)。在一個(gè)實(shí)施例中,輸入查詢是由字符串組成。為輸入查詢生成文獻(xiàn)向量(步驟204)。由于查詢的文獻(xiàn)向量是在提交時(shí)生成的,所以下文稱之為“動(dòng)態(tài)文獻(xiàn)向量”。動(dòng)態(tài)文獻(xiàn)向量是基于查詢的文本輸入生成的。更具體地,動(dòng)態(tài)文獻(xiàn)向量是由查詢輸入文本中的最相關(guān)的術(shù)語構(gòu)成。為了選擇動(dòng)態(tài)文獻(xiàn)向量中所 包括的字符串,以及為了向所選擇的包含在動(dòng)態(tài)文獻(xiàn)向量中的術(shù)語分配權(quán)重,可以采用不同的工具。在一個(gè)實(shí)施例中,從輸入查詢提取如下字符串名詞短語、首字母大寫(即,第一個(gè)字母大寫但不出現(xiàn)在句首)的詞、文獻(xiàn)中頻繁出現(xiàn)的詞、文獻(xiàn)中頻繁出現(xiàn)的成對(duì)詞。對(duì)于靜態(tài)文獻(xiàn)向量中的指定的停止詞,將其從動(dòng)態(tài)文獻(xiàn)向量中移除,從而不包含在動(dòng)態(tài)文獻(xiàn)向量中。在從輸入查詢的文本提取了所選擇的包含在動(dòng)態(tài)向量中的術(shù)語之后,為這些術(shù)語分配權(quán)重。在一個(gè)實(shí)施例中,將各個(gè)詞或者短語在文獻(xiàn)中出現(xiàn)的頻率標(biāo)準(zhǔn)化成I和O之間的數(shù)字,其中將I分配給文獻(xiàn)中最常出現(xiàn)的詞。同樣,在一個(gè)實(shí)施例中,增加諸如名稱等特殊區(qū)域中的詞或者成對(duì)詞的權(quán)重,向名詞短語分配較高的權(quán)重,增加文獻(xiàn)正文中的首字母大寫的詞的權(quán)重,向較長字符串分配高于較短字符串的權(quán)重,等等。文獻(xiàn)向量的計(jì)算具有較高的配置性。在一個(gè)實(shí)施例中,用戶能夠向檢索術(shù)語分配權(quán)重。因此,能夠使用如下各種工具,該工具能夠基于查詢輸入生成合適的動(dòng)態(tài)文獻(xiàn)向量。在步驟(204)之后,具有動(dòng)態(tài)文獻(xiàn)向量形式的查詢被提交至文獻(xiàn)集合(步驟206),其中,將動(dòng)態(tài)文獻(xiàn)向量與專利文獻(xiàn)集合中的靜態(tài)文獻(xiàn)向量進(jìn)行比較(步驟208)。然后,判斷在文獻(xiàn)集合中是否存在落入動(dòng)態(tài)文獻(xiàn)向量的定義數(shù)學(xué)范圍內(nèi)的靜態(tài)文獻(xiàn)向量(步驟210)。若步驟(210)的判斷結(jié)果是肯定的,則接下來將文獻(xiàn)集合中的所有具有一個(gè)或多個(gè)落入定義數(shù)學(xué)范圍內(nèi)的靜態(tài)文獻(xiàn)向量的基礎(chǔ)專利文獻(xiàn)放入結(jié)果集中(步驟212)。在步驟(212)之后或者步驟(210)處的判斷結(jié)果是否定的時(shí),判斷用戶是否希望向文獻(xiàn)集合提交新的查詢(步驟214)。在一個(gè)實(shí)施例中,新的查詢可以縮小先前提交的查詢的范圍。類似地,新的查詢也可以擴(kuò)大先前提交的查詢的范圍。不管新的查詢的范圍如何,若步驟(214)處的判斷結(jié)果是肯定的,則接下來返回到步驟(204)。類似地,步驟(214)處的否定判斷表明向文獻(xiàn)集合的查詢提交過程結(jié)束。因此,向文獻(xiàn)集合的提交查詢包括將提交的字符串轉(zhuǎn)換成動(dòng)態(tài)文獻(xiàn)向量,并對(duì)動(dòng)態(tài)文獻(xiàn)向量與文獻(xiàn)集合的靜態(tài)向量進(jìn)行比較。專利文獻(xiàn)集合是獨(dú)特的技術(shù)文獻(xiàn)集合。專利文獻(xiàn)的形式具有公告的授權(quán)專利和公開的專利申請(qǐng)。這兩類文獻(xiàn)之間的差別確定了它們的強(qiáng)制力。更具體地,授權(quán)專利是能夠由法院強(qiáng)制執(zhí)行的實(shí)際財(cái)產(chǎn)權(quán),而公開的專利申請(qǐng)只是待審查的申請(qǐng),是待定的專利權(quán)。撰寫的每篇專利文獻(xiàn)包括申請(qǐng)中慣用的詞和短語。然而,由于這些詞和短語出現(xiàn)在大多數(shù)專利文獻(xiàn)中,而并非發(fā)明所特有的,所以這些詞和短語幾乎沒有檢索的價(jià)值。例如,這些詞和短語的示例包括但不限于“實(shí)施例”、“示例性的”、“現(xiàn)有技術(shù)”等等。類似地,各個(gè)國家的專利申請(qǐng)中可以具有不同的常用詞。例如,在某些國家,詞“特征在于”是常用詞,幾乎沒有授權(quán)或者檢索的價(jià)值。這里,這些詞稱為“停止詞”。用于識(shí)別國家、語言和/或文化所特有的停止詞的目的在于使待要檢索的文獻(xiàn)向量的規(guī)模盡可能地小??山馕鰧@墨I(xiàn)集合中的各個(gè)文獻(xiàn)向量,以便將確認(rèn)的停止詞從文獻(xiàn)集合中移除。
圖3是表示使用停止詞以進(jìn)一步解析專利文獻(xiàn)集合中的靜態(tài)文獻(xiàn)向量的過程的流程圖(300)。在向文獻(xiàn)集合提交查詢之前,判斷是否應(yīng)當(dāng)解析停止詞以獲得靜態(tài)文獻(xiàn)向量。停止詞受限于特定國家(302)、特定語言(304)和/或特定文化(306)。在對(duì)步驟(302)、(304)和/或(306)處的任何單個(gè)選擇或者組合選擇的肯定響應(yīng)之后,生成停止詞的匯編,以便解析專利文獻(xiàn)集合中的靜態(tài)文獻(xiàn)向量(步驟308)。對(duì)專利文獻(xiàn)的集合進(jìn)行匯編(步驟310)。在一個(gè)實(shí)施例中,專利文獻(xiàn)的集合可能受限于所選擇的國家、語言和/或特定文化。在匯編文獻(xiàn)(步驟310)之后,為集合編制索引(步驟312),并且從集合中解析出停止詞(步驟314)。編制索引及從匯編中移除停止詞的過程包括將數(shù)據(jù)集合轉(zhuǎn)換成適于搜索和檢索的數(shù)據(jù)庫。在步驟(314)之后,選擇集合中文獻(xiàn)的一個(gè)或多個(gè)章節(jié),以加入集合的待生成的文獻(xiàn)向量中(步驟316)?;诓襟E(316)中的至少一個(gè)章節(jié)的選擇,為集合中的各個(gè)專利文獻(xiàn)生成文獻(xiàn)向量(步驟318)。更具體地,在為文獻(xiàn)集合編制索引之后,得到集合中的每篇專利文獻(xiàn)的被選擇章節(jié)的文獻(xiàn)向量,并從所得到的文獻(xiàn)向量中刪除經(jīng)識(shí)別的停止詞。這里,這類文獻(xiàn)向量稱作靜態(tài)文獻(xiàn)向量。除非個(gè)別特殊情況,一旦專利文獻(xiàn)公告,通常不會(huì)發(fā)生變化。為了處理這些個(gè)別特殊情況,不定期地更新文獻(xiàn)集合。更具體地,建立時(shí)間間隔(320),以便對(duì)集合中的文獻(xiàn)及 關(guān)聯(lián)文獻(xiàn)向量的任何變化進(jìn)行更新。例如,時(shí)間間隔包括但不限于每月、每半年、每年等等。然后,判斷建立的時(shí)間間隔是否已經(jīng)到期(322)。若步驟(322)處的判斷結(jié)果是否定的,則接下來等待設(shè)定的時(shí)間周期(324),以更新專利文獻(xiàn)向量,從而將專利文獻(xiàn)的任何變化加入到文獻(xiàn)向量中,之后返回到步驟(320)。然而,若步驟(322)處的判斷結(jié)果是肯定的,則接下來判斷是否存在任何新的應(yīng)用到文獻(xiàn)集合中的停止詞(步驟326)。若步驟(326)處的判斷結(jié)果是否定的,則接下來返回到步驟(310);若步驟(326)處的判斷結(jié)果是肯定的,則接下來將新的停止詞和/或短語加入到非相關(guān)專利術(shù)語的匯編中(步驟328)。在步驟(328)之后,專利文獻(xiàn)集合的靜態(tài)文獻(xiàn)向量的生成和/或更新過程返回到步驟(310)。因而,可以解析靜態(tài)文獻(xiàn)向量,來選擇經(jīng)識(shí)別的停止詞,從而能夠?qū)⒉樵兊奶峤患械届o態(tài)文獻(xiàn)集合中的相關(guān)字符串。應(yīng)認(rèn)識(shí)到,公告專利和公開的專利申請(qǐng)分為多個(gè)章節(jié)。要提交完整的專利申請(qǐng),專利文獻(xiàn)的各個(gè)章節(jié)都是必需的,并且專利的各個(gè)章節(jié)都有其用途。在此不再詳細(xì)討論專利申請(qǐng)的各章節(jié)的細(xì)節(jié)。然而,將會(huì)識(shí)別出這些不同的章節(jié)。大多數(shù)情況下,各個(gè)專利申請(qǐng)包括名稱、優(yōu)先權(quán)日、摘要、背景技術(shù)、摘要、附圖的簡(jiǎn)要說明(如果有的話)具體實(shí)施方式
和權(quán)利要求。在專利活動(dòng)中,根據(jù)檢索目的而采用不同的檢索類別。例如,侵權(quán)和/或產(chǎn)品確權(quán)檢索與權(quán)利要求中的詞有關(guān),因而應(yīng)當(dāng)對(duì)文獻(xiàn)集合中存在的權(quán)利要求進(jìn)行檢索。有效和/或無效檢索與任何已知的現(xiàn)有技術(shù)有關(guān),并需要核實(shí)專利文獻(xiàn)的優(yōu)先權(quán)日。當(dāng)發(fā)明人在提交專利申請(qǐng)之前或者之后想要判斷他們的發(fā)明的新穎性時(shí),發(fā)明人或者他/她的代理人或者代表人可以采用新穎性檢索。這種檢索可不再強(qiáng)調(diào)權(quán)利要求,而重點(diǎn)關(guān)注發(fā)明的具體實(shí)施方式
。因此,如這里所說明,每種檢索著重于文獻(xiàn)集合中的專利文獻(xiàn)的不同章節(jié)。如上所述,可以解析文獻(xiàn)集合中的各個(gè)專利,以選擇在檢索集合時(shí)幾乎沒有意義的停止詞。然而,除了選擇停止詞之外,還期望為單個(gè)專利文獻(xiàn)匯編多個(gè)靜態(tài)文獻(xiàn)向量,并且各個(gè)不同的文獻(xiàn)向量與集合中的專利文獻(xiàn)的各個(gè)經(jīng)識(shí)別章節(jié)有關(guān)。多個(gè)文獻(xiàn)向量(其中各個(gè)文獻(xiàn)向量用于識(shí)別一個(gè)特定章節(jié))的生成能夠基于界定的檢索范圍使文獻(xiàn)集合的檢索變得精確。例如,可將文獻(xiàn)集合的侵權(quán)檢索限定到文獻(xiàn)集合中的各個(gè)專利的權(quán)利要求章節(jié)有關(guān)的文獻(xiàn)向量。圖4是表示為集合中的每篇專利文獻(xiàn)生成多個(gè)文獻(xiàn)向量的過程的流程圖(400)。首先,匯編專利文獻(xiàn)的集合(步驟402),并為其編制索引(步驟404)。將變量MT()tal指定為專利文獻(xiàn)集合中的文獻(xiàn)的總數(shù),計(jì)數(shù)變量M指定為整數(shù)I (步驟408)。識(shí)別出集合中的專利文獻(xiàn)M所具有的章節(jié)的數(shù)量(步驟410)。在步驟(410)之后,變量NT()tal指定為專利文獻(xiàn)M中的章節(jié)的總數(shù),計(jì)數(shù)變量N指定為整數(shù)I (步驟414)。為集合中的每篇專利文獻(xiàn)的各個(gè)章節(jié)生成文獻(xiàn)向量。更具體地,為專利文獻(xiàn)M中的各個(gè)章節(jié)N生成文獻(xiàn)向量(步驟416)。一旦在步驟(416)處生成文獻(xiàn)向量,如果專利文獻(xiàn)還有其它章節(jié),遞增計(jì)數(shù)變量N(步驟418),從而進(jìn)入專利文獻(xiàn)的下一個(gè)章節(jié)以便為下一個(gè)章節(jié)生成下一個(gè)文獻(xiàn)向量。在步驟(418)之后,判斷專利文獻(xiàn)中是否還存在要生成文獻(xiàn)向量的其它章節(jié)(步驟420)。若步驟(420)處的判斷結(jié)果是否定的,則接下來返回到步驟(416)。反之,若步驟(420)處的判斷結(jié)果是肯定的,則接下來遞增變量M(步驟422)。然后,判斷集合中的各個(gè)文獻(xiàn)是否已受到解析以生 成多個(gè)文獻(xiàn)向量(步驟424)。在步驟(424)處的判斷結(jié)果是否定的時(shí),接下來返回到步驟(410),為集合中的下一個(gè)文獻(xiàn)生成多個(gè)文獻(xiàn)向量。如上所述,本領(lǐng)域已知的是,可能需要定期更新靜態(tài)文獻(xiàn)集合。更新的頻率可能是頻繁的或者不頻繁的,這取決于集合的準(zhǔn)確性。在一個(gè)實(shí)施例中,靜態(tài)文獻(xiàn)向量的更新頻率可與專利的公告速率成比例。步驟(424)處的肯定判斷結(jié)果表明為每篇專利文獻(xiàn)生成多個(gè)文獻(xiàn)向量而已經(jīng)解析專利文獻(xiàn)集合。然后,判斷用于更新集合中的靜態(tài)向量的時(shí)間間隔是否已經(jīng)到期(步驟426)。若步驟(426)處的判斷結(jié)果是肯定的,則接下來返回到步驟(402)。反之,若步驟(426)處的判斷結(jié)果是否定的,則接下來在返回到步驟(426)之前,等待設(shè)定的時(shí)間間隔,以便更新專利文獻(xiàn)向量,從而將專利文獻(xiàn)的任何變化加入到文獻(xiàn)向量中(步驟428)。因而,可以解析文獻(xiàn)集合中的每篇專利文獻(xiàn),以生成多個(gè)靜態(tài)文獻(xiàn)向量,其中各個(gè)向量與專利文獻(xiàn)的一個(gè)經(jīng)識(shí)別章節(jié)有關(guān)。一旦專利文獻(xiàn)已受到解析從而為集合中的各個(gè)文獻(xiàn)生成多個(gè)文獻(xiàn)向量,提交的查詢就能夠均衡利用文獻(xiàn)章節(jié)的解析。圖5是表示向具有多個(gè)文獻(xiàn)向量的文獻(xiàn)集合提交查詢的過程的流程圖(500)。首先,向集合提交查詢的用戶界定檢索的范圍(步驟502)。在一個(gè)實(shí)施例中,可以向用戶提供作為計(jì)算機(jī)指令的面板的圖形用戶界面,從而便于選擇檢索的范圍。在步驟(502)之后,將界定的檢索范圍與為文獻(xiàn)集合選擇的文獻(xiàn)向量類別相關(guān)聯(lián)(步驟504),并且向文獻(xiàn)集合提交查詢字符串(步驟506)。然后,為所提交的查詢字符串生成動(dòng)態(tài)文獻(xiàn)向量(步驟508),將動(dòng)態(tài)文獻(xiàn)向量提交至文獻(xiàn)集合以確定關(guān)聯(lián)文獻(xiàn)(步驟510)。查詢提交受限于動(dòng)態(tài)文獻(xiàn)向量與文獻(xiàn)集合的選擇靜態(tài)文獻(xiàn)向量之間的比較(步驟512)。在一個(gè)實(shí)施例中,選擇的靜態(tài)文獻(xiàn)向量可以是選擇的一組靜態(tài)文獻(xiàn)向量(步驟513)。更具體地,受限于專利文獻(xiàn)中的權(quán)利要求章節(jié)的檢索僅檢索專利文獻(xiàn)集合中專利的權(quán)利要求章節(jié)的靜態(tài)文獻(xiàn)向量或者類似靜態(tài)文獻(xiàn)向量的群組。步驟(512)中的比較是動(dòng)態(tài)文獻(xiàn)向量與靜態(tài)文獻(xiàn)向量之間的數(shù)學(xué)比較?;跀?shù)學(xué)比較,將比較的結(jié)果集進(jìn)行排序(步驟514)。在一個(gè)實(shí)施例中,根據(jù)文獻(xiàn)集合的靜態(tài)文獻(xiàn)向量與動(dòng)態(tài)文獻(xiàn)向量的接近度(closeness)來進(jìn)行上述排序。因而,通過動(dòng)態(tài)文獻(xiàn)向量與集合的靜態(tài)文獻(xiàn)向量的比較產(chǎn)生了結(jié)果集。一旦對(duì)結(jié)果集進(jìn)行排序(步驟514),就采用數(shù)值來界定所排序的被確定為關(guān)聯(lián)文獻(xiàn)的接近度范圍(步驟516)。在步驟(516)之后,判斷在排序集合中是否存在任何文獻(xiàn)落在界定的數(shù)學(xué)范圍內(nèi)(518)。若步驟(518)處的判斷結(jié)果是肯定的,則接下來將靜態(tài)文獻(xiàn)向量處于動(dòng)態(tài)文獻(xiàn)向量的界定范圍內(nèi)的所有基礎(chǔ)專利的列表放置在結(jié)果集中(步驟520)。在步驟(520)之后或者步驟(518)處的比較結(jié)果是否定的時(shí),判斷用戶是否想要提交新的查詢字符串或者進(jìn)一步限制先前提交的查詢字符串(步驟522)。若判斷步驟(522)的結(jié)果是否定的,則表明查詢提交過程結(jié)束。反之,若步驟(522)處的判斷結(jié)果是肯定的,則接下來判斷用戶是否想要改變檢索中的與查詢(即,動(dòng)態(tài)文獻(xiàn)向量)相比較的章節(jié)(即,靜態(tài)文獻(xiàn)向量)(步驟524)。在一個(gè)實(shí)施例中,通過改變檢索的范圍可以直接改變檢索中所使用靜態(tài)文獻(xiàn)向量的選擇。若步驟(524)處的判斷結(jié)果是肯定的,則接下來返回到步驟(502),新的查詢將改變專利文獻(xiàn)中在下一輪查詢中要評(píng)估的章節(jié)。反之,若步驟(524)處的判斷結(jié)果是否定的,則表明新的查詢將進(jìn)一步限制先前查詢的范圍,同時(shí)保持對(duì)專利集合中的與先前查詢相同的文獻(xiàn)向量的限制。以此方式,在判斷結(jié)果是否定的之后,提交進(jìn)一步修改的查詢,而不提交專利文獻(xiàn)集合的文獻(xiàn)向量,然后返回到步驟(506)。因而,能夠從兩方面修改 檢索的范圍,從而根據(jù)查詢的動(dòng)態(tài)文獻(xiàn)向量與專利文獻(xiàn)集合的靜態(tài)文獻(xiàn)向量的比較來修改結(jié)果集合。如圖I-圖5所示,為專利文獻(xiàn)集合生成特定的文獻(xiàn)向量,然后使用文獻(xiàn)向量進(jìn)行查詢的提交,從而通過落入集合的動(dòng)態(tài)文獻(xiàn)向量的界定范圍內(nèi)的靜態(tài)文獻(xiàn)向量,生成結(jié)果集。圖6是表不一組工具的框圖(600),上述一組工具用來生成靜態(tài)文獻(xiàn)向量和動(dòng)態(tài)文獻(xiàn)向量,以及用于使用與提交至文獻(xiàn)集合的查詢相關(guān)聯(lián)的向量。如圖6所示,計(jì)算機(jī)系統(tǒng)(602)包括處理器單元(604),該處理器單元(604)通過總線結(jié)構(gòu)(608)耦合到存儲(chǔ)器(606)。雖然只示出了一個(gè)處理器單元,在一個(gè)實(shí)施例中,在擴(kuò)展設(shè)計(jì)中可設(shè)置多個(gè)處理器單元。所示的計(jì)算機(jī)系統(tǒng)(602)與存儲(chǔ)介質(zhì)(640)相互通信,存儲(chǔ)介質(zhì)(640)用于保存文獻(xiàn)集合(642)。在一個(gè)實(shí)施例中,電子文獻(xiàn)集合包含專利文獻(xiàn)的匯編,專利文獻(xiàn)的匯編包括公告的專利和公開的專利申請(qǐng)。存儲(chǔ)介質(zhì)(640)與處理器單元(604)進(jìn)行通信。此外,所示的系統(tǒng)與用于顯示可視化數(shù)據(jù)的可視顯示器(650)相互通信。這里示出和說明的各個(gè)要素都支持提交至文獻(xiàn)集合¢42)的查詢。在計(jì)算機(jī)系統(tǒng)(602)本地設(shè)置文獻(xiàn)管理器¢60),并且文獻(xiàn)管理器(660)與存儲(chǔ)器(606)相互通信。文獻(xiàn)管理器(660)在將集合¢42)中的各個(gè)專利文獻(xiàn)編入索引時(shí),為集合¢42)中的各個(gè)專利文獻(xiàn)產(chǎn)生文獻(xiàn)向量。更具體地,文獻(xiàn)管理器(660)為集合(642)中的每篇專利文獻(xiàn)生成至少一個(gè)靜態(tài)文獻(xiàn)向量¢44)。如上所述,各個(gè)專利文獻(xiàn)是由特定的標(biāo)準(zhǔn)化章節(jié)組成,如果各個(gè)專利文獻(xiàn)是由同一專利局管轄區(qū)域發(fā)布,則它們也可以是統(tǒng)一的。在一個(gè)實(shí)施例中,采用文獻(xiàn)管理器¢60),以便為每篇專利文獻(xiàn)生成多個(gè)靜態(tài)文獻(xiàn)向量(644)。由文獻(xiàn)管理器(660)生成的文獻(xiàn)向量(644)保存在存儲(chǔ)介質(zhì)¢40)中。也在計(jì)算機(jī)系統(tǒng)(602)本地設(shè)置輸入管理器(662),并且輸入管理器(662)與存儲(chǔ)器(606)相互通信。輸入管理器(662)根據(jù)接收自查詢輸入的字符串?dāng)?shù)據(jù),在查詢時(shí)生成動(dòng)態(tài)文獻(xiàn)向量。輸入管理器(662)與查詢管理器(664)相互通信,查詢管理器(664)也設(shè)置在計(jì)算機(jī)系統(tǒng)(602)本地,并且與存儲(chǔ)器(606)相互通信。查詢管理器(664)響應(yīng)于向文獻(xiàn)集合(642)提交的查詢輸入,將輸入管理器(662)生成的動(dòng)態(tài)文獻(xiàn)向量與各個(gè)靜態(tài)文獻(xiàn)向量(644)進(jìn)行比較。通過該比較產(chǎn)生關(guān)聯(lián)專利文獻(xiàn)¢46)的匯編。在一個(gè)實(shí)施例中,匯編顯示在可視顯示器(650)上。類似地,在一個(gè)實(shí)施例中,匯編可以保存在(易失性的或者持久性的)存儲(chǔ)器上??梢圆捎梅窍嚓P(guān)字符串?dāng)?shù)據(jù)的匯編(648),以便通過靜態(tài)文獻(xiàn)向量(644)解析出非相關(guān)字符串?dāng)?shù)據(jù)。在一個(gè)實(shí)施例中,非相關(guān)字符串?dāng)?shù)據(jù)¢48)的匯編保存在存儲(chǔ)介質(zhì)(640)中,并由文獻(xiàn)管理器(660)定期更新。無論是否采用非相關(guān)字符串?dāng)?shù)據(jù),文獻(xiàn)管理器(660)都可以為文獻(xiàn)集合¢42)中的每篇專利文獻(xiàn)生成多個(gè)靜態(tài)文獻(xiàn)向量。選擇管理器(666)設(shè)置在計(jì)算機(jī)系統(tǒng)(602)本地,并與存儲(chǔ)器(606)相互通信。更具體地,選擇管理器(666)與查詢管理器(664)相互通信,以選擇文獻(xiàn)集合的檢索范圍。所選擇的檢索范圍決定了對(duì)靜態(tài)文獻(xiàn)向量的選擇,查詢管理器(664)使用這些選擇來處理查詢。在一個(gè)實(shí)施例中,輸入管理器(662)、查詢管理器(664)、文獻(xiàn)管理器(660)和選擇管理器(666)可以駐留在計(jì)算機(jī)系統(tǒng)(602)本地的存儲(chǔ)器¢06)中。然而,本發(fā)明不限于這些實(shí)施例。例如,在一個(gè)實(shí)施例中,輸入管理器、查詢管理器、文獻(xiàn)管理器和選擇管理器¢60)4666)中的每一個(gè)管理器都可以是駐留在本地存儲(chǔ)器(606)外部的硬件工具,或者它們也可通過使用硬件和軟件的組合來實(shí)現(xiàn)。類似地,在一個(gè)實(shí)施例中,管理器(660)-(666)可以駐留在與存儲(chǔ)介質(zhì)(640)通信的遠(yuǎn)程系統(tǒng)中。因而,管理器可通過軟件工·具或者硬件工具實(shí)現(xiàn),這些軟件工具或硬件工具支持向電子專利文獻(xiàn)集合提交一個(gè)或多個(gè)查詢,以產(chǎn)生關(guān)聯(lián)專利文獻(xiàn)的匯編。如本文所述,可通過使用與執(zhí)行查詢時(shí)所處理的靜態(tài)文獻(xiàn)向量有關(guān)的特定指令,向?qū)@墨I(xiàn)集合提交查詢。圖7是圖形用戶界面(702)的框圖(700),圖形用戶界面(702)用于支持指令的提交。界面(702)充當(dāng)用于支持電子文獻(xiàn)集合的基礎(chǔ)數(shù)據(jù)庫的指令的上層虛擬界面。如圖7所示,存在四個(gè)主要區(qū)域。第一區(qū)域(710)包括用于向文獻(xiàn)集合提交查詢的信息欄(712)。第二區(qū)域(720)包括多個(gè)用于選擇檢索類別的區(qū)域。更具體地,所示的第二區(qū)域(720)可包括用于選擇檢索類別的下列子區(qū)域新穎性(722)、技術(shù)現(xiàn)狀(724)、侵權(quán)(726)、產(chǎn)品確權(quán)(728)、有效/無效(730)。在一個(gè)實(shí)施例中,檢索區(qū)域(720)可支持一個(gè)以上的子區(qū)域的選擇。第三區(qū)域(740)包括多個(gè)區(qū)域,所述多個(gè)區(qū)域用于選擇匯編結(jié)果中返回的最大數(shù)量的檢索文獻(xiàn)。更具體地,第三區(qū)域(740)可包括如下子區(qū)域十個(gè)文獻(xiàn)(742)、五十個(gè)文獻(xiàn)(744)、一百個(gè)文獻(xiàn)(746)、五百個(gè)文獻(xiàn)(748)、一千個(gè)文獻(xiàn)(750)和用于支持用戶自定義輸入的要返回的最大數(shù)量的輸入?yún)^(qū)域(752)。本發(fā)明不限于(742)-(750)所示的子區(qū)域數(shù)量。這里提供的數(shù)字僅是示例性的。界面的第四區(qū)域(760)用于向文獻(xiàn)集合提交查詢字符串。在一個(gè)實(shí)施例中,第四區(qū)域(760)包括提交按鈕(762)和取消按鈕(764),提交按鈕(762)用于進(jìn)入查詢的提交,取消按鈕(764)用于退出提交。因而,這里所示的界面便于與電子文獻(xiàn)集合通信,及便于向電子文獻(xiàn)集合提交查詢,從而有效使用電子文獻(xiàn)集合中的一個(gè)或多個(gè)靜態(tài)文獻(xiàn)向量。在一個(gè)實(shí)施例中,本發(fā)明在軟件中實(shí)施,所述軟件包括但不限于固件、常駐軟件、微代碼等等。本發(fā)明可以是存取自計(jì)算機(jī)可用介質(zhì)或者計(jì)算機(jī)可讀介質(zhì)的計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)程序產(chǎn)品提供由計(jì)算機(jī)或任何指令執(zhí)行系統(tǒng)使用的程序代碼,或者提供與計(jì)算機(jī)或任何指令執(zhí)行系統(tǒng)相關(guān)的程序代碼。出于說明的目的,計(jì)算機(jī)可用介質(zhì)或計(jì)算機(jī)可讀介質(zhì)可以是能夠容納、存儲(chǔ)、通信、傳播、或者傳輸程序的裝置,上述程序由指令執(zhí)行系統(tǒng)、設(shè)備或裝置使用或與指令執(zhí)行系統(tǒng)、設(shè)備或裝置相關(guān)。本發(fā)明范圍內(nèi)的實(shí)施例還包括產(chǎn)品,該產(chǎn)品包括具有編碼程序代碼的程序存儲(chǔ)裝置。該程序存儲(chǔ)裝置可以是能通過通用或?qū)S糜?jì)算機(jī)訪問的任何介質(zhì)。舉例來說,該程序存儲(chǔ)裝置可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其他光盤存儲(chǔ)器、磁盤存儲(chǔ)器或其他磁存儲(chǔ)設(shè)備、或者能用于存儲(chǔ)期望程序代碼并能夠由通用或?qū)S糜?jì)算機(jī)訪問的任何其他介質(zhì)。上述裝置的組合也應(yīng)當(dāng)包含在該程序存儲(chǔ)裝置的范圍內(nèi)。上述介質(zhì)可以是電子學(xué)系統(tǒng)、磁系統(tǒng)、光學(xué)系統(tǒng)、電磁系統(tǒng)、紅外線系統(tǒng)或半導(dǎo)體系統(tǒng)(或裝置或設(shè)備)或傳播介質(zhì)。計(jì)算機(jī)可讀介質(zhì)的示例包括半導(dǎo)體或者固態(tài)存儲(chǔ)器、磁帶、可移動(dòng)的計(jì)算機(jī)軟盤、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、硬盤和光盤。目前的光盤示例包括只讀的高密度磁盤B (⑶-ROM)、讀/寫高密度磁盤B (⑶-R/W)和DVD。適用于存儲(chǔ)和/或執(zhí)行程序代碼的數(shù)據(jù)處理系統(tǒng)至少包括一個(gè)通過系統(tǒng)總線直接或間接地連接到存儲(chǔ)元件的處理器。存儲(chǔ)元件可包括在程序代碼實(shí)際執(zhí)行時(shí)所采用的本地存儲(chǔ)器、大容量存儲(chǔ)器和緩存存儲(chǔ)器,該緩存存儲(chǔ)器臨時(shí)存儲(chǔ)至少一些程序代碼,從而在執(zhí)行過程中可以減少從大容量存儲(chǔ)器中取代碼的次數(shù)。輸入/輸出或I/O設(shè)備(包括但不限于鍵盤、顯示器、指針設(shè)備等等)可以直接或 通過I/o控制器耦合到系統(tǒng)。網(wǎng)絡(luò)適配器也可以耦合到系統(tǒng),以便使數(shù)據(jù)處理系統(tǒng)可以通過中間的私人或公共網(wǎng)絡(luò)與其它數(shù)據(jù)處理系統(tǒng)或遠(yuǎn)程打印機(jī)或存儲(chǔ)設(shè)備相耦合。 軟件工具可以是由計(jì)算機(jī)可用介質(zhì)或計(jì)算機(jī)可讀介質(zhì)訪問的計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)程序產(chǎn)品用于提供由計(jì)算機(jī)或者任何指令執(zhí)行系統(tǒng)使用的或與計(jì)算機(jī)或者任何指令執(zhí)行系統(tǒng)有關(guān)的程序代碼。相對(duì)于現(xiàn)有技術(shù)的優(yōu)點(diǎn)在本領(lǐng)域中已知的是,每篇專利文獻(xiàn)需要具有符合法定的申請(qǐng)要求的規(guī)定章節(jié)名稱。為各個(gè)單獨(dú)的電子文獻(xiàn)生成多個(gè)文獻(xiàn)向量,并且可選擇地從文獻(xiàn)向量移除非相關(guān)專利字符串。在一個(gè)實(shí)施例中,為文獻(xiàn)集合的權(quán)利要求章節(jié)生成一個(gè)文獻(xiàn)向量,為文獻(xiàn)集合的名稱、摘要和權(quán)利要求章節(jié)生成第二個(gè)文獻(xiàn)向量,為文獻(xiàn)集合的合并的所有章節(jié)生成第三個(gè)文獻(xiàn)向量。通過解析向量,產(chǎn)生一個(gè)更小且更簡(jiǎn)潔的文獻(xiàn)向量,其中更小的文獻(xiàn)向量提高了查詢處理的效率,這是因?yàn)樵撓蛄坎恍枰獙?duì)解析字符串進(jìn)行額外的處理。并非所有的查詢都如此。向集合提交不同的查詢,以產(chǎn)生不同的結(jié)果。因此,靜態(tài)文獻(xiàn)向量的分類以及對(duì)非相關(guān)專利詞語的解析能夠高效及有效地處理查詢提交,從而產(chǎn)生文獻(xiàn)結(jié)果的期望匯編??蛇x實(shí)施例應(yīng)當(dāng)理解,盡管出于說明的目的而在此說明了本發(fā)明的一些具體實(shí)施例,但在不偏離本發(fā)明的精神和范圍的前提下可以作很多修改。特別是,知識(shí)產(chǎn)權(quán)文獻(xiàn)的檢索不限于已授權(quán)的專利和公開的專利申請(qǐng)。檢索可以擴(kuò)大到涵蓋所有形式的知識(shí)產(chǎn)權(quán)文獻(xiàn),包括但不限于商標(biāo)注冊(cè)和申請(qǐng)、版權(quán)登記和申請(qǐng)、以及所有形式的專利文獻(xiàn)。無論查詢提交的文獻(xiàn)類別如何,都存在更新文獻(xiàn)集合中的靜態(tài)文獻(xiàn)向量的麻煩。基于科學(xué)發(fā)展的自然進(jìn)程,由于每周或者其它單位時(shí)段有新的文獻(xiàn)加入到文獻(xiàn)集合中,該文獻(xiàn)集合不斷增大。由于知識(shí)產(chǎn)權(quán)文獻(xiàn)是按設(shè)定的頻率授權(quán)或者公開,所以為了更新靜態(tài)文獻(xiàn)向量而設(shè)定的時(shí)間間隔可以是常數(shù)。然而,在一個(gè)實(shí)施例中,可以采用一個(gè)或多個(gè)變量來改變時(shí)間間隔。例如,在一個(gè)實(shí)施例中,可以根據(jù)在規(guī)定的時(shí)間段內(nèi)加入到集合中的文獻(xiàn)的數(shù)量來改變時(shí)間間隔變量。上述目的在于保持準(zhǔn)確的文獻(xiàn)集合,文獻(xiàn)集合需要定期更新集合中的靜態(tài)文獻(xiàn)向量以確保完整的數(shù)據(jù)庫。
此外,對(duì)知識(shí)產(chǎn)權(quán)文獻(xiàn)相關(guān)的電子文獻(xiàn)集合進(jìn)行了具體說明。但是,本發(fā)明不限于這些具體類型的電子文獻(xiàn)。在一個(gè)實(shí)施例中,電子文獻(xiàn)集合可包括具有規(guī)定的多個(gè)章節(jié)的任何類型的文獻(xiàn)。這使得管理器能夠?qū)⑽墨I(xiàn)解析成規(guī)定的章節(jié),為各個(gè)規(guī)定的章節(jié)生成多個(gè)靜態(tài)文獻(xiàn)向量,并且根據(jù)文獻(xiàn)的規(guī)定章節(jié)來界定查詢。因而,本發(fā)明的保護(hù)范圍僅限于權(quán) 利要求和它們的等同物。
權(quán)利要求
1.一種由計(jì)算機(jī)執(zhí)行的用于檢索電子文獻(xiàn)集合的方法,其包括 對(duì)知識(shí)產(chǎn)權(quán)文獻(xiàn)的集合進(jìn)行匯編,所述集合中的各個(gè)所述文獻(xiàn)具有至少ー個(gè)章節(jié); 在編制索引時(shí),基于所述至少ー個(gè)章節(jié),為所述集合中的各個(gè)文獻(xiàn)獲得至少ー個(gè)文獻(xiàn)向量,所述獲得步驟包括為所述文獻(xiàn)集合中的各個(gè)文獻(xiàn)生成至少ー個(gè)靜態(tài)文獻(xiàn)向量; 在查詢時(shí),基于查詢輸入,識(shí)別特定文獻(xiàn)向量; 將所識(shí)別的特定文獻(xiàn)向量提交至搜索引擎,并且 基于所識(shí)別的特定文獻(xiàn)向量與所生成的至少ー個(gè)靜態(tài)文獻(xiàn)向量的比較,返回關(guān)聯(lián)文獻(xiàn)的匯編。
2.如權(quán)利要求I所述的方法,其中,基于查詢輸入識(shí)別特定文獻(xiàn)向量的所述步驟還包括 基于所述查詢輸入中的字符串?dāng)?shù)據(jù),生成動(dòng)態(tài)文獻(xiàn)向量。
3.如權(quán)利要求I所述的方法,還包括 在文件中生成停止字符串知識(shí)產(chǎn)權(quán)術(shù)語的匯編,并將所述匯編應(yīng)用到所述文獻(xiàn)向量,所述應(yīng)用步驟包括從各個(gè)所述文獻(xiàn)向量中排除所述匯編中的各個(gè)字符串。
4.如權(quán)利要求3所述的方法,其中,所述知識(shí)產(chǎn)權(quán)術(shù)語的匯編是特定語言的。
5.如權(quán)利要求3所述的方法,其中,所述知識(shí)產(chǎn)權(quán)術(shù)語的匯編是特定文化的。
6.如權(quán)利要求3所述的方法,還包括 動(dòng)態(tài)地更新所述停止字符串知識(shí)產(chǎn)權(quán)術(shù)語的匯編,所述更新步驟包括識(shí)別特定術(shù)語以列入到所述匯編中。
7.如權(quán)利要求I所述的方法,還包括 將所述靜態(tài)文獻(xiàn)向量限定到從知識(shí)產(chǎn)權(quán)文獻(xiàn)選擇的區(qū)域,所述區(qū)域選自由下列章節(jié)構(gòu)成的群組名稱、摘要、背景技術(shù)、發(fā)明內(nèi)容具體實(shí)施方式
、權(quán)利要求、附圖及它們的組合。
8.如權(quán)利要求7所述的方法,還包括 為所述集合中的各個(gè)知識(shí)產(chǎn)權(quán)文獻(xiàn)生成一組的多個(gè)靜態(tài)文獻(xiàn)向量,各個(gè)靜態(tài)文獻(xiàn)向量是基于所述知識(shí)產(chǎn)權(quán)文獻(xiàn)的ー個(gè)或多個(gè)區(qū)域而生成。
9.如權(quán)利要求8所述的方法,還包括 選擇應(yīng)用到所述文獻(xiàn)集合的檢索范圍,其中,所選擇的檢索范圍與所述文獻(xiàn)集合中的至少ー個(gè)靜態(tài)文獻(xiàn)向量類別相關(guān)聯(lián),以及 基于界定的檢索范圍,將所選擇的至少ー個(gè)靜態(tài)向量類別與所生成的動(dòng)態(tài)向量相比較。
10.如權(quán)利要求9所述的方法,其中,所述檢索范圍是知識(shí)產(chǎn)權(quán)侵權(quán)檢索,且所述方法還包括 針對(duì)所述侵權(quán)檢索,選擇權(quán)利要求向量類別, 其中,所選擇的權(quán)利要求向量類別將所述文獻(xiàn)集合中的所述靜態(tài)文獻(xiàn)向量限定到所述基礎(chǔ)文獻(xiàn)集合中包括的權(quán)利要求。
11.如權(quán)利要求9所述的方法,其中,所述檢索范圍是知識(shí)產(chǎn)權(quán)侵權(quán)檢索無效檢索,且所述方法還包括 針對(duì)所述無效檢索,選擇權(quán)利要求名稱向量類別、摘要向量類別、發(fā)明內(nèi)容向量類別具體實(shí)施方式
向量類別、權(quán)利要求向量類別和附圖向量類別,其中,所選擇的向量類別將所述文獻(xiàn)集合中的所述靜態(tài)文獻(xiàn)向量限定到所述基礎(chǔ)文獻(xiàn)集合中包括的知識(shí)產(chǎn)權(quán)文獻(xiàn)的具有文獻(xiàn)向量形式的代表性章節(jié)。
12.如權(quán)利要求9所述的方法,其中,所述檢索范圍是專利新穎性檢索,且所述方法還包括 針對(duì)所述新穎性檢索,選擇具體實(shí)施方式
向量類別, 其中,所選擇的具體實(shí)施方式
向量類別將所述文獻(xiàn)集合中的所述靜態(tài)文獻(xiàn)向量限定到所述基礎(chǔ)文獻(xiàn)集合中包括的知識(shí)產(chǎn)權(quán)文獻(xiàn)的具有文獻(xiàn)向量形式的具體實(shí)施方式
章節(jié)。
13.如權(quán)利要求9所述的方法,還包括 使用圖形用戶界面層來選擇所述檢索范圍。
14.如權(quán)利要求I所述的方法,還包括 為所述檢索中返回的所述關(guān)聯(lián)文獻(xiàn)的數(shù)量設(shè)置上限。
15.如權(quán)利要求I所述的方法,其中,所返回的關(guān)聯(lián)文獻(xiàn)的匯編包括文獻(xiàn),所包括的文獻(xiàn)被確定為具有至少ー個(gè)處于所述動(dòng)態(tài)文獻(xiàn)向量的界定數(shù)學(xué)范圍內(nèi)的靜態(tài)文獻(xiàn)向量。
16.—種系統(tǒng),其包括 處理器,其與存儲(chǔ)介質(zhì)通信; 所述存儲(chǔ)介質(zhì),其用于存儲(chǔ)電子文獻(xiàn)集合,所述電子文獻(xiàn)集合包括知識(shí)產(chǎn)權(quán)文獻(xiàn)的匯編,所述集合中的各個(gè)所述知識(shí)產(chǎn)權(quán)文獻(xiàn)具有多個(gè)章節(jié); 文獻(xiàn)管理器,其用于在編制索引吋,為所述集合中的各個(gè)知識(shí)產(chǎn)權(quán)文獻(xiàn)獲得至少ー個(gè)文獻(xiàn)向量,所述獲得包括為所述文獻(xiàn)集合中的各個(gè)知識(shí)產(chǎn)權(quán)文獻(xiàn)生成至少ー個(gè)靜態(tài)文獻(xiàn)向量; 輸入管理器,其用于在查詢時(shí),基于查詢輸入中的字符串?dāng)?shù)據(jù)生成動(dòng)態(tài)文獻(xiàn)向量,所述查詢輸入被提交至所述電子知識(shí)產(chǎn)權(quán)文獻(xiàn)集合; 查詢管理器,其與所述輸入管理器通信,所述查詢管理器用于響應(yīng)于提交至所述知識(shí)產(chǎn)權(quán)文獻(xiàn)集合的所述查詢輸入,將所述動(dòng)態(tài)文獻(xiàn)向量與所述集合中的各個(gè)靜態(tài)文獻(xiàn)向量進(jìn)行比較;以及 關(guān)聯(lián)知識(shí)產(chǎn)權(quán)文獻(xiàn)的匯編,其是響應(yīng)于所述查詢管理器并基于所述動(dòng)態(tài)文獻(xiàn)向量與所述靜態(tài)文獻(xiàn)向量的所述比較而返回。
17.如權(quán)利要求16所述的系統(tǒng),還包括 存儲(chǔ)在文件中的非相關(guān)字符串知識(shí)產(chǎn)權(quán)術(shù)語的匯編,以及 所述查詢管理器用于將所述匯編應(yīng)用到所述靜態(tài)文獻(xiàn)向量,所述應(yīng)用包括從各個(gè)所述文獻(xiàn)向量排除所述匯編中的各個(gè)字符串。
18.如權(quán)利要求17所述的系統(tǒng),其中,所述知識(shí)產(chǎn)權(quán)術(shù)語的匯編是特定語言的。
19.如權(quán)利要求17所述的系統(tǒng),其中,所述知識(shí)產(chǎn)權(quán)術(shù)語的匯編是特定文化的。
20.如權(quán)利要求17所述的系統(tǒng),還包括 所述文獻(xiàn)管理器用于動(dòng)態(tài)地更新所述非相關(guān)知識(shí)產(chǎn)權(quán)術(shù)語的匯編,所述更新包括識(shí)別特定術(shù)語以列入到所述匯編中。
21.如權(quán)利要求16所述的系統(tǒng),還包括 所述文獻(xiàn)管理器用于將所述靜態(tài)文獻(xiàn)向量限定到從知識(shí)產(chǎn)權(quán)文獻(xiàn)選擇的區(qū)域,所述區(qū)域選自由下列章節(jié)構(gòu)成的群組名稱、背景技術(shù)、摘要、發(fā)明內(nèi)容具體實(shí)施方式
、權(quán)利要求、附圖及它們的組合。
22.如權(quán)利要求20所述的系統(tǒng),其中,所述文獻(xiàn)管理器為所述集合中的各個(gè)知識(shí)產(chǎn)權(quán)文獻(xiàn)生成多個(gè)靜態(tài)文獻(xiàn)向量,各個(gè)靜態(tài)文獻(xiàn)向量是基于所述知識(shí)產(chǎn)權(quán)文獻(xiàn)的ー個(gè)或多個(gè)區(qū)域而生成。
23.如權(quán)利要求22所述的系統(tǒng),還包括 選擇管理器,其與所述查詢管理器通信,所述選擇管理器用于選擇應(yīng)用到所述文獻(xiàn)集合的檢索范圍,其中,所選擇的檢索范圍與所述文獻(xiàn)集合中的至少ー個(gè)靜態(tài)文獻(xiàn)向量類別相關(guān)聯(lián),并且所述選擇管理器用于根據(jù)界定的檢索范圍將所選擇的至少ー個(gè)靜態(tài)向量類別與所生成的動(dòng)態(tài)向量進(jìn)行比較。
24.如權(quán)利要求23所述的系統(tǒng),其中,所述檢索范圍是侵權(quán)檢索,且所述系統(tǒng)還包括 所述選擇管理器用于針對(duì)侵權(quán)檢索,選擇權(quán)利要求向量類別,其中,所選擇的權(quán)利要求向量類別將所述文獻(xiàn)集合中的所述靜態(tài)文獻(xiàn)向量限定到所述基礎(chǔ)文獻(xiàn)集合中包括的權(quán)利要求。
25.如權(quán)利要求23所述的系統(tǒng),其中,所述檢索范圍是無效檢索,且所述系統(tǒng)還包括 所述選擇管理器用于針對(duì)所述無效檢索,選擇權(quán)利要求名稱向量類別、摘要向量類別、發(fā)明內(nèi)容向量類別具體實(shí)施方式
向量類別、權(quán)利要求向量類別和附圖向量類別,其中,所選擇的向量類別將所述文獻(xiàn)集合中的所述靜態(tài)文獻(xiàn)向量限定到所述基礎(chǔ)文獻(xiàn)集合中包括的知識(shí)產(chǎn)權(quán)文獻(xiàn)的具有文獻(xiàn)向量形式的代表性章節(jié)。
26.如權(quán)利要求23所述的系統(tǒng),其中,所述檢索范圍是新穎性檢索,且所述系統(tǒng)還包括 所述選擇管理器用于針對(duì)所述新穎性檢索,選擇具體實(shí)施方式
向量類別,其中,所選擇的具體實(shí)施方式
向量類別將所述文獻(xiàn)集合中的所述靜態(tài)文獻(xiàn)向量限定到所述基礎(chǔ)文獻(xiàn)集合中包括的知識(shí)產(chǎn)權(quán)文獻(xiàn)的具有文獻(xiàn)向量形式的具體實(shí)施方式
章節(jié)。
27.如權(quán)利要求23所述的系統(tǒng),還包括 圖形用戶界面,其與所述查詢管理器通信,所述圖形用戶界面具有一組規(guī)定的輸入選擇器,所述輸入選擇器用于選擇應(yīng)用到所述文獻(xiàn)集合的所述檢索范圍。
28.一種用于檢索計(jì)算機(jī)存儲(chǔ)器上的電子文獻(xiàn)集合的產(chǎn)品,所述產(chǎn)品包括 計(jì)算機(jī)可讀載體,其包括計(jì)算機(jī)程序指令,并用于執(zhí)行查詢,所述指令包括 用于對(duì)知識(shí)產(chǎn)權(quán)文獻(xiàn)的集合進(jìn)行匯編的指令,所述集合中的各個(gè)所述知識(shí)產(chǎn)權(quán)文獻(xiàn)具有多個(gè)章節(jié); 在編制索引時(shí),用于為所述集合中的各個(gè)知識(shí)產(chǎn)權(quán)文獻(xiàn)獲得至少ー個(gè)文獻(xiàn)向量的指令,所述獲得包括為所述文獻(xiàn)集合中的各個(gè)知識(shí)產(chǎn)權(quán)文獻(xiàn)生成至少ー個(gè)靜態(tài)文獻(xiàn)向量; 在查詢時(shí),用于基于查詢輸入中的字符串?dāng)?shù)據(jù)生成動(dòng)態(tài)文獻(xiàn)向量的指令; 用于將所述查詢輸入提交至所述電子文獻(xiàn)集合的指令,所述提交包括將所述動(dòng)態(tài)文獻(xiàn)向量與所述集合中的各個(gè)靜態(tài)文獻(xiàn)向量進(jìn)行比較;以及 基于所述動(dòng)態(tài)文獻(xiàn)向量與所述靜態(tài)文獻(xiàn)向量的比較,返回關(guān)聯(lián)知識(shí)產(chǎn)權(quán)文獻(xiàn)的匯編。
29.如權(quán)利要求27所述的產(chǎn)品,還包括 用于在文件中生成在不相關(guān)字符串知識(shí)產(chǎn)權(quán)術(shù)語的匯編及用于將所述匯編應(yīng)用到所述文獻(xiàn)向量的指令,所述應(yīng)用包括從各個(gè)所述文獻(xiàn)向量中排除所述匯編中的各個(gè)字符串。
30.如權(quán)利要求29所述的產(chǎn)品,其中,所述知識(shí)產(chǎn)權(quán)術(shù)語的匯編是特定語言的。
31.如權(quán)利要求29所述的產(chǎn)品,其中,所述知識(shí)產(chǎn)權(quán)術(shù)語的匯編是特定文化的。
32.如權(quán)利要求29所述的產(chǎn)品,還包括 用于動(dòng)態(tài)地更新所述不相關(guān)知識(shí)產(chǎn)權(quán)詞語的匯編的指令,所述更新包括識(shí)別特定術(shù)語,以列入到所述匯編中。
33.如權(quán)利要求28所述的產(chǎn)品,還包括 用于將所述靜態(tài)文獻(xiàn)向量限定到從知識(shí)產(chǎn)權(quán)文獻(xiàn)選擇的區(qū)域的指令,所述區(qū)域選自由下列章節(jié)構(gòu)成的群組名稱、摘要、背景技術(shù)、發(fā)明內(nèi)容具體實(shí)施方式
、權(quán)利要求、附圖及它們的組合。
34.如權(quán)利要求33所述的產(chǎn)品,還包括 用于為所述集合中的各個(gè)知識(shí)產(chǎn)權(quán)文獻(xiàn)生成多個(gè)靜態(tài)文獻(xiàn)向量的指令,各個(gè)靜態(tài)文獻(xiàn)向量是基于所述知識(shí)產(chǎn)權(quán)文獻(xiàn)的一個(gè)或多個(gè)區(qū)域而生成。
35.如權(quán)利要求34所述的產(chǎn)品,還包括 用于選擇應(yīng)用到所述文獻(xiàn)集合的檢索范圍的指令,其中,所選擇的檢索范圍與所述文獻(xiàn)集合中的至少一個(gè)靜態(tài)文獻(xiàn)向量類別相關(guān)聯(lián),及 所述用于選擇的指令還用于基于所界定的檢索范圍將所選擇的至少一個(gè)靜態(tài)向量類另Ij與所生成的動(dòng)態(tài)向量相比較。
36.如權(quán)利要求35所述的產(chǎn)品,其中所述檢索范圍是侵權(quán)檢索,且所述產(chǎn)品還還包括 針對(duì)所述侵權(quán)檢索,用于選擇權(quán)利要求向量類別的指令, 其中,所選擇的權(quán)利要求向量類別將所述文獻(xiàn)集合中的所述靜態(tài)文獻(xiàn)向量限定到所述基礎(chǔ)文獻(xiàn)集合中包括的權(quán)利要求。
37.如權(quán)利要求35所述的產(chǎn)品,其中,所述檢索范圍是無效檢索,且所述產(chǎn)品還包括 針對(duì)所述無效檢索,用于選擇名稱向量類別、摘要向量類別、發(fā)明內(nèi)容向量類別具體實(shí)施方式
向量類別、權(quán)利要求向量類別和附圖向量類別的指令, 其中,所選擇的向量類別將所述文獻(xiàn)集合中的所述靜態(tài)文獻(xiàn)向量限定到所述基礎(chǔ)文獻(xiàn)集合中包括的知識(shí)產(chǎn)權(quán)文獻(xiàn)的具有文獻(xiàn)向量形式的代表性章節(jié)。
38.如權(quán)利要求35所述的產(chǎn)品,其中,所述檢索范圍是新穎性檢索,且所述產(chǎn)品還包括 針對(duì)所述新穎性檢索,用于選擇具體實(shí)施方式
向量類別的指令, 其中,所選擇的具體實(shí)施方式
向量類別將所述文獻(xiàn)集合中的所述靜態(tài)文獻(xiàn)向量限定到所述基礎(chǔ)文獻(xiàn)集合中包括的知識(shí)產(chǎn)權(quán)文獻(xiàn)的具有文獻(xiàn)向量形式的具體實(shí)施方式
章節(jié)。
39.一種用于檢索計(jì)算機(jī)存儲(chǔ)器上的電子文獻(xiàn)集合的產(chǎn)品,所述產(chǎn)品包括 計(jì)算機(jī)可讀載體,其包括計(jì)算機(jī)程序指令,并用于執(zhí)行查詢,所述指令包括 用于對(duì)知識(shí)產(chǎn)權(quán)文獻(xiàn)的集合進(jìn)行匯編的匯編構(gòu)件,所述集合中的各個(gè)所述知識(shí)產(chǎn)權(quán)文獻(xiàn)具有多個(gè)章節(jié); 用于在編制索引時(shí)為所述集合中的各個(gè)知識(shí)產(chǎn)權(quán)文獻(xiàn)獲得至少一個(gè)文獻(xiàn)向量的構(gòu)件,所述獲得包括為所述文獻(xiàn)集合中的各個(gè)知識(shí)產(chǎn)權(quán)文獻(xiàn)生成至少一個(gè)靜態(tài)文獻(xiàn)向量; 用于在查詢時(shí)基于查詢輸入中的字符串?dāng)?shù)據(jù)生成動(dòng)態(tài)文獻(xiàn)向量的構(gòu)件; 用于將所述查詢輸入提交至所述電子文獻(xiàn)集合的構(gòu)件,所述提交包括將所述動(dòng)態(tài)文獻(xiàn)向量與所述集合中的各個(gè)靜態(tài)文獻(xiàn)向量進(jìn)行比較;并且 用于基于所述動(dòng)態(tài)文獻(xiàn)向量與所述靜態(tài)文獻(xiàn)向量的所述比較返回關(guān)聯(lián)知識(shí)產(chǎn)權(quán)文獻(xiàn)的匯編的構(gòu)件?!?br> 全文摘要
本發(fā)明涉及用于高效和有效地檢索電子文獻(xiàn)集合的方法、系統(tǒng)和產(chǎn)品。在該集合中的各個(gè)文獻(xiàn)事先被劃分成子章節(jié),為各個(gè)文獻(xiàn)中的各章節(jié)中的一個(gè)或者其組合生成一個(gè)靜態(tài)文獻(xiàn)向量。針對(duì)提交至文獻(xiàn)集合的查詢字符串生成動(dòng)態(tài)文獻(xiàn)向量?;诓樵兊膮?shù),通過將動(dòng)態(tài)文獻(xiàn)向量與所選靜態(tài)文獻(xiàn)向量進(jìn)行比較,來選擇各個(gè)文獻(xiàn)的子章節(jié)?;诼淙雱?dòng)態(tài)文獻(xiàn)向量的范圍內(nèi)的所有相關(guān)的靜態(tài)文獻(xiàn)向量,生成IP文獻(xiàn)的匯編。
文檔編號(hào)G06F7/00GK102804125SQ200980159986
公開日2012年11月28日 申請(qǐng)日期2009年5月8日 優(yōu)先權(quán)日2009年5月8日
發(fā)明者賈森·大衛(wèi)·雷斯尼克, 蘭迪·W·拉卡斯 申請(qǐng)人:Cpa軟件有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1