亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種文獻檢索及分析系統(tǒng)的制作方法

文檔序號:9597962閱讀:312來源:國知局
一種文獻檢索及分析系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息檢索領(lǐng)域,具體涉及一種文獻檢索及分析系統(tǒng)。
【背景技術(shù)】
[0002]隨著信息技術(shù)的迅速發(fā)展,電子文件由于其形式多樣、容量大、體積小且便于信息共享和易于復(fù)制的優(yōu)點而正在取代部分傳統(tǒng)紙質(zhì)出版物。隨之而來的電子文獻檢索已經(jīng)成為信息獲取的較為有效的途徑。
[0003]現(xiàn)今存在的電子文獻檢索方法通常是以統(tǒng)計詞頻的方式為基礎(chǔ)實現(xiàn)的,這類方法都是機械式的進行統(tǒng)計和匹配,忽視了詞語本身在語義上的實際意義和詞語之間在語義上的關(guān)聯(lián)性,檢索效果并不理想。
[0004]同時各企業(yè)為了避免在技術(shù)推廣應(yīng)用方面出現(xiàn)不必要的專利糾紛,在進行市場評估時都會進行相應(yīng)的風(fēng)險分析。目前,這種方式主要是靠人工進行,即通過人工方式對企業(yè)競爭對手在有關(guān)國家或地區(qū)的專利申請、分析有關(guān)專利申請的保護范圍進行分析。與企業(yè)相關(guān)的專利文獻數(shù)量可能非常龐大,同時在對專利文獻進行分析時需要依賴人員的專業(yè)知識及工作經(jīng)驗,人工成本較高,對專利風(fēng)險評估是較為不利的。

【發(fā)明內(nèi)容】

[0005]本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)存在的技術(shù)缺陷,提供一種新的文獻檢索及分析系統(tǒng)。
[0006]本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的:
一方面,本發(fā)明提供了一種文獻檢索及分析系統(tǒng),包括:
基本檢索模塊,用于根據(jù)所述搜索請求在結(jié)構(gòu)化數(shù)據(jù)庫中進行搜索;
拓展檢索模塊,用于根據(jù)所述請求結(jié)合自然語言處理技術(shù)在數(shù)據(jù)庫中進行搜索;
多數(shù)據(jù)源集成檢索模塊,用于對專利數(shù)據(jù)庫的多數(shù)據(jù)源整合以及用戶的跨庫檢索和多庫檢索等功能;
檢索結(jié)果處理模塊,用于對上述模塊檢索到的專利信息根據(jù)相關(guān)度進行抽取,獲得特定技術(shù)領(lǐng)域術(shù)語集;
語義庫建設(shè)模塊,利用檢索結(jié)果處理模塊得到的特定技術(shù)領(lǐng)域的術(shù)語集并結(jié)合關(guān)聯(lián)分析、專家評估等步驟,構(gòu)建特定技術(shù)領(lǐng)域語義庫,實現(xiàn)對專利的智能檢索功能;
數(shù)據(jù)挖掘和自然語言處理模塊,用于對檢索到的專利信息數(shù)據(jù)的深入挖掘和自然語言的進一步處理;
專利信息智能分析結(jié)果可視化技術(shù)研究模塊,用于對檢索到的專利信息數(shù)據(jù)進行智能分析與可視化研究;
用戶管理模塊,用于將上述分析得到的數(shù)據(jù)匯總到用戶管理模塊進行總體管理,并根據(jù)用戶需求進行最終端等輸出。
[0007]所述多數(shù)據(jù)源集成檢索模塊包括多技術(shù)領(lǐng)域?qū)I(yè)詞庫的詞典型搜索和以語義分析為核心的語義網(wǎng)文檔搜索兩種檢索策略;
所述語義庫建設(shè)模塊還包括相關(guān)度選擇模塊,用于選擇檢索處理模塊得到的特定技術(shù)領(lǐng)域術(shù)語集中的語義相關(guān)的詞條,構(gòu)建特定技術(shù)領(lǐng)域語義庫;
所述用戶管理模塊得到的文獻檢索分析匯總結(jié)果,能夠根據(jù)用戶需求選擇在計算器終端進行顯示或從終端進行最后的結(jié)果輸出。
[0008]所述文獻檢索及分析系統(tǒng)中,以數(shù)據(jù)采集及加工為基礎(chǔ),從年份、申請人、發(fā)明人、關(guān)鍵詞等多個專利著錄項的角度出發(fā),對專利數(shù)據(jù)進行統(tǒng)計、關(guān)聯(lián)等分析,同時結(jié)合可視化技術(shù)對分析結(jié)果予以展示;可視化作為專利分析的一種手段,將數(shù)據(jù)挖掘、知識發(fā)現(xiàn)等技術(shù)綜合運用到整個系統(tǒng)中;并且將信息對象進行綜合、抽象、概念化、知識化、從而更方便簡潔地實現(xiàn)可視化,并進一步發(fā)現(xiàn)專利之間地關(guān)系以及專利作者的信息等。
[0009]與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點在于:實現(xiàn)了對專利信息的智能檢索,并在此基礎(chǔ)上對專利數(shù)據(jù)進行統(tǒng)計、關(guān)聯(lián)等分析,同時結(jié)合可視化技術(shù),對分析結(jié)果進行可視化展示。
【附圖說明】
[0010]圖1位本發(fā)明文獻檢索及分析系統(tǒng)示意圖。
【具體實施方式】
[0011]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合具體實施例對本發(fā)明進一步詳細說明。應(yīng)當(dāng)理解,此處所描述的【具體實施方式】僅僅用以解釋本發(fā)明,但并不用于限定本發(fā)明。
[0012]圖1位本發(fā)明文獻檢索及分析系統(tǒng)一個實施例示意圖,如圖1所示,文獻檢索及分析系統(tǒng)包括:
基本檢索模塊101,用于根據(jù)所述搜索請求在結(jié)構(gòu)化數(shù)據(jù)庫中進行搜索。
[0013]拓展檢索模塊102,用于根據(jù)所述請求結(jié)合自然語言處理技術(shù)在數(shù)據(jù)庫中進行搜索。
[0014]多數(shù)據(jù)源集成檢索模塊103,用于對專利數(shù)據(jù)庫的多數(shù)據(jù)源整合以及用戶的跨庫檢索和多庫檢索等功能。
[0015]檢索結(jié)果處理模塊104,用于對專利信息進行抽取,獲得特定技術(shù)領(lǐng)域術(shù)語集。
[0016]語義庫建設(shè)模塊105,利用檢索結(jié)果處理模塊得到的術(shù)語集并結(jié)合關(guān)聯(lián)分析、專家評估等步驟,構(gòu)建特定技術(shù)領(lǐng)域語義庫。
[0017]數(shù)據(jù)挖掘和自然語言處理模塊106,用于數(shù)據(jù)的深入挖掘和自然語言的進一步處理。
[0018]專利信息智能分析結(jié)果可視化技術(shù)研究模塊107,用于對檢索到的專利信息數(shù)據(jù)進行智能分析與可視化研究。
[0019]用戶管理模塊108,用于將上述分析得到的數(shù)據(jù)匯總到用戶管理模塊,最終完成對所需文獻的檢索及分析匯總,并根據(jù)用戶需求進行最終的輸出。
[0020]基于本發(fā)明上述實施例提供的文獻檢索及分析系統(tǒng),以國內(nèi)外專利數(shù)據(jù)庫技術(shù)為核心,通過構(gòu)建特定技術(shù)領(lǐng)域語義庫,綜合運用以多技術(shù)領(lǐng)域?qū)I(yè)詞庫為核心詞典型搜索與語義分析為核心的與以往文檔搜索兩種檢索策略,實現(xiàn)對專利數(shù)據(jù)倉庫的多數(shù)據(jù)源整合以及用戶的跨庫檢索和多庫檢索等功能,結(jié)合自然語言處理技術(shù),實現(xiàn)對專利信息的智能檢索;通過對檢索的專利數(shù)據(jù)進行統(tǒng)計、關(guān)聯(lián)分析,完成對專利信息的分析研究,結(jié)合可視化技術(shù)對分析結(jié)果進行可視化展示。
[0021]本發(fā)明的描述是為了示例和描述起見而給出的,并不是無遺漏的或者將本發(fā)明限于所公開的形式。其中很多修改和變化對于本領(lǐng)域的普通技術(shù)人員而言是顯然的。選擇和描述實施例是為了更好地說明本發(fā)明的原理和實際應(yīng)用,并且使本領(lǐng)域的普通技術(shù)人員能夠理解本發(fā)明從而設(shè)計適于特定用途的帶有各種修改的各種實施例。
【主權(quán)項】
1.一種文獻檢索及分析系統(tǒng),包括:基本檢索模塊、拓展檢索模塊、多數(shù)據(jù)源集成檢索模塊、檢索結(jié)果處理模塊、語義庫建設(shè)模塊、數(shù)據(jù)挖掘和自然語言處理模塊、專利信息智能分析結(jié)果可視化技術(shù)研究模塊、用戶管理模塊; 所述基本檢索模塊,用于根據(jù)所述搜索請求在結(jié)構(gòu)化數(shù)據(jù)庫中進行搜索; 所述拓展檢索模塊,用于根據(jù)所述請求結(jié)合自然語言處理技術(shù)在數(shù)據(jù)庫中進行搜索; 所述多數(shù)據(jù)源集成檢索模塊,用于對專利數(shù)據(jù)庫的多數(shù)據(jù)源整合以及用戶的跨庫檢索和多庫檢索等功能; 所述檢索結(jié)果處理模塊,用于對上述模塊檢索到的專利信息根據(jù)相關(guān)度進行抽取,獲得特定技術(shù)領(lǐng)域術(shù)語集; 所述語義庫建設(shè)模塊,利用檢索結(jié)果處理模塊得到的特定技術(shù)領(lǐng)域的術(shù)語集并結(jié)合關(guān)聯(lián)分析、專家評估等步驟,構(gòu)建特定技術(shù)領(lǐng)域語義庫,實現(xiàn)對專利的智能檢索功能; 所述數(shù)據(jù)挖掘和自然語言處理模塊,用于對檢索到的專利信息數(shù)據(jù)的深入挖掘和自然語言的進一步處理; 所述專利信息智能分析結(jié)果可視化技術(shù)研究模塊,用于對檢索到的專利信息數(shù)據(jù)進行智能分析與可視化研究; 所述用戶管理子模塊,用于將上述分析得到的數(shù)據(jù)匯總到用戶管理模塊進行總體管理,并根據(jù)用戶需求進行最終輸出。2.根據(jù)權(quán)利要求1所述的一種文獻檢索及分析系統(tǒng),其特征在于, 所述多數(shù)據(jù)源集成檢索模塊包括多技術(shù)領(lǐng)域?qū)I(yè)詞庫的詞典型搜索和以語義分析為核心的語義網(wǎng)文檔搜索兩種檢索策略。3.根據(jù)權(quán)利要求1所述的一種文獻檢索及分析系統(tǒng),其特征在于,所述語義庫建設(shè)模塊還包括相關(guān)度選擇模塊,用于選擇檢索處理模塊得到的特定技術(shù)領(lǐng)域術(shù)語集中的語義相關(guān)的詞條,構(gòu)建特定技術(shù)領(lǐng)域語義庫。4.根據(jù)權(quán)利要求1所述的一種文獻檢索及分析系統(tǒng),其特征在于,所述專利信息智能分析結(jié)果可視化技術(shù)研究模塊,將專利信息進行綜合、抽象、概念化、知識化,并自動化生成專利化分析的可視化圖譜,得到最后的可視化的專利分析結(jié)果。5.根據(jù)權(quán)利要求1所述的一種文獻檢索及分析系統(tǒng),其特征在于, 所述用戶管理模塊得到的文獻檢索分析匯總結(jié)果,能夠根據(jù)用戶需求選擇在計算器終端進行顯示或從終端進行最后的結(jié)果輸出。
【專利摘要】本發(fā)明提供一種文獻檢索及分析系統(tǒng),包括:基本檢索模塊、拓展檢索模塊、多數(shù)據(jù)源集成檢索模塊、檢索結(jié)果處理模塊、語義庫建設(shè)模塊、數(shù)據(jù)挖掘和自然語言處理模塊、專利信息智能分析結(jié)果可視化技術(shù)研究模塊、用戶管理模塊;該文獻檢索及分析系統(tǒng)以數(shù)據(jù)采集及加工為基礎(chǔ),從年份、申請人、發(fā)明人、關(guān)鍵詞等多個專利著錄項的角度出發(fā),對專利數(shù)據(jù)進行統(tǒng)計、關(guān)聯(lián)等分析,同時結(jié)合可視化技術(shù)對分析結(jié)果予以展示,并進一步發(fā)現(xiàn)專利之間地關(guān)系以及專利作者的信息等。與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點在于:實現(xiàn)了對專利信息的智能檢索,并在此基礎(chǔ)上對專利數(shù)據(jù)進行統(tǒng)計、關(guān)聯(lián)等分析,同時結(jié)合可視化技術(shù),對分析結(jié)果進行可視化展示。
【IPC分類】G06F17/30
【公開號】CN105354325
【申請?zhí)枴緾N201510804564
【發(fā)明人】劉延淮, 孫瑞陽
【申請人】上海熠派信息科技有限公司
【公開日】2016年2月24日
【申請日】2015年11月20日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1