一種行業(yè)技術(shù)信息搜集方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及信息檢索技術(shù)領(lǐng)域,特別是設(shè)及一種行業(yè)技術(shù)信息捜集方法及系統(tǒng)。
【背景技術(shù)】
[0002] 電網(wǎng)企業(yè)在進(jìn)行技術(shù)創(chuàng)新時(shí),需要進(jìn)行新技術(shù)、新方法等技術(shù)信息的收集,并W收 集到的技術(shù)信息作為基礎(chǔ)進(jìn)行創(chuàng)造性的革新和拓展?;趻人饕?,使用者在輸入查詢(xún)內(nèi) 容后,捜索引擎可W根據(jù)查詢(xún)內(nèi)容提供相應(yīng)的技術(shù)信息給用戶(hù)。
[0003] 在實(shí)際應(yīng)用過(guò)程中,捜索引擎往往會(huì)返回大量與技術(shù)創(chuàng)新無(wú)關(guān)的技術(shù)信息,例如 用戶(hù)需要通過(guò)百度捜索引擎捜索高壓相關(guān)的技術(shù)信息,輸入查詢(xún)內(nèi)容"高壓",捜索引擎一 般會(huì)返回包括高壓鍋信息的電商網(wǎng)站信息或者高壓故障的新聞網(wǎng)站信息,上述信息均與高 壓技術(shù)無(wú)關(guān),用戶(hù)需要額外做大量的重復(fù)分析判斷工作,從而從上述信息中提取出有效信 息,嚴(yán)重影響用戶(hù)的檢索效率,信息捜集效率低下,不適用于技術(shù)創(chuàng)新。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實(shí)施例中提供了一種行業(yè)技術(shù)信息捜集方法及系統(tǒng),W解決現(xiàn)有技術(shù)中的 信息捜集效率低的問(wèn)題。
[0005] 為了解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例公開(kāi)了如下技術(shù)方案:
[0006] 本發(fā)明實(shí)施例公開(kāi)了一種行業(yè)技術(shù)信息捜集方法,該方法包括W下步驟:
[0007] 獲取用戶(hù)查詢(xún)內(nèi)容;
[000引根據(jù)所述用戶(hù)查詢(xún)內(nèi)容,生成行業(yè)相關(guān)的聯(lián)想關(guān)鍵字,并顯示;
[0009] 從用戶(hù)的訪問(wèn)記錄中提取網(wǎng)站域名地址,并根據(jù)網(wǎng)站域名地址對(duì)應(yīng)的網(wǎng)站行業(yè)相 關(guān)度,整理行業(yè)網(wǎng)站;
[0010] 從整理的網(wǎng)站中獲取技術(shù)信息,所述技術(shù)信息包括標(biāo)題、摘要、時(shí)間和鏈接;
[0011] 利用所述聯(lián)想關(guān)鍵字檢索所述技術(shù)信息,獲取檢索結(jié)果;
[0012] 將所述檢索結(jié)果按照排序規(guī)則重排,所述排序規(guī)則包括根據(jù)檢索結(jié)果的時(shí)間、訪 問(wèn)次數(shù)、行業(yè)詞匯數(shù)量W及原排序位置確定的排序規(guī)則,將重排后的檢索結(jié)果顯示。
[0013] 優(yōu)選地,所述根據(jù)所述查詢(xún)內(nèi)容,生成行業(yè)相關(guān)的聯(lián)想關(guān)鍵字,包括:
[0014] 根據(jù)所述查詢(xún)內(nèi)容,查詢(xún)包括技術(shù)問(wèn)題和解決方案的技術(shù)庫(kù),獲得初始詞;
[0015] 從所述初始詞中篩選出初始關(guān)鍵字;
[0016] 利用所述初始關(guān)鍵字W及所述查詢(xún)內(nèi)容,分別查詢(xún)學(xué)術(shù)數(shù)據(jù)庫(kù),獲得學(xué)術(shù)關(guān)鍵字;
[0017] 將所述初始關(guān)鍵字、所述查詢(xún)內(nèi)容W及所述學(xué)術(shù)關(guān)鍵字合并為聯(lián)想關(guān)鍵字。
[0018] 優(yōu)選地,所述從用戶(hù)的訪問(wèn)記錄中提取網(wǎng)站域名地址,并根據(jù)網(wǎng)站域名地址對(duì)應(yīng) 的網(wǎng)站行業(yè)相關(guān)度,整理行業(yè)網(wǎng)站,包括:
[0019] 根據(jù)所述網(wǎng)絡(luò)訪問(wèn)記錄訪問(wèn)網(wǎng)絡(luò)頁(yè)面,獲取所述網(wǎng)絡(luò)頁(yè)面中的鏈接地址;
[0020] 從所述鏈接地址中,獲取網(wǎng)站域名地址;
[0021] 根據(jù)所述網(wǎng)站域名地址對(duì)應(yīng)的網(wǎng)站中出現(xiàn)的行業(yè)詞匯數(shù),計(jì)算所述網(wǎng)站的網(wǎng)站行 業(yè)相關(guān)度;
[0022] 根據(jù)所述網(wǎng)站行業(yè)相關(guān)度,整理網(wǎng)站。
[0023] 優(yōu)選地,所述將所述檢索結(jié)果按照排序規(guī)則重排,包括:
[0024] 根據(jù)檢索結(jié)果的時(shí)間、訪問(wèn)次數(shù)、行業(yè)詞匯數(shù)量W及原排序位置,分別計(jì)算確定檢 索結(jié)果的時(shí)間排序值、訪問(wèn)次數(shù)排序值、檢索行業(yè)相關(guān)度排序值W及位置排序值;
[0025] 通過(guò)加權(quán)計(jì)算所述時(shí)間排序值、所述訪問(wèn)次數(shù)排序值、所述檢索行業(yè)相關(guān)度排序 值W及所述位置排序值,得到總排序值;
[0026] 根據(jù)所述總排序值,對(duì)所述檢索結(jié)果重排。
[0027] 優(yōu)選地,所述行業(yè)技術(shù)信息捜集方法還包括:
[0028] 獲取行業(yè)類(lèi)別信息,所述行業(yè)類(lèi)別信息為包括電力、航天、能源和醫(yī)學(xué)中的一個(gè)或 多個(gè)的類(lèi)別信息;
[0029] 根據(jù)所述檢索內(nèi)容,生成與所述行業(yè)類(lèi)別信息相對(duì)應(yīng)的、行業(yè)相關(guān)的聯(lián)想關(guān)鍵字;
[0030] 從用戶(hù)的訪問(wèn)記錄中提取網(wǎng)站域名地址,并根據(jù)網(wǎng)站域名地址對(duì)應(yīng)的網(wǎng)站行業(yè)相 關(guān)度,整理與所述行業(yè)類(lèi)別信息相對(duì)應(yīng)的行業(yè)網(wǎng)站庫(kù);
[0031] 根據(jù)所述行業(yè)類(lèi)別信息計(jì)算所述行業(yè)詞匯數(shù)量,并根據(jù)檢索結(jié)果的時(shí)間、訪問(wèn)次 數(shù)、所述行業(yè)詞匯數(shù)量W及原排序位置確定排序規(guī)則。
[0032] 優(yōu)選地,所述行業(yè)技術(shù)信息捜集方法還包括,W預(yù)定周期,從用戶(hù)的訪問(wèn)記錄中提 取網(wǎng)站域名地址,并根據(jù)網(wǎng)站域名地址對(duì)應(yīng)的網(wǎng)站行業(yè)相關(guān)度,整理行業(yè)網(wǎng)站;W及從整理 的網(wǎng)站中獲取技術(shù)信息,所述技術(shù)信息包括標(biāo)題、摘要、時(shí)間和鏈接。
[0033] 本發(fā)明實(shí)施例還公開(kāi)了一種行業(yè)技術(shù)信息捜集系統(tǒng),該系統(tǒng)包括:
[0034] 瀏覽器,用于獲取用戶(hù)查詢(xún)內(nèi)容;
[0035] 關(guān)鍵字聯(lián)想裝置,用于根據(jù)所述查詢(xún)內(nèi)容,生成行業(yè)相關(guān)的聯(lián)想關(guān)鍵字,并將所述 聯(lián)想關(guān)鍵字發(fā)送至瀏覽器顯示;
[0036] 行業(yè)網(wǎng)站整理裝置,用于從用戶(hù)的訪問(wèn)記錄中提取網(wǎng)站域名地址,并根據(jù)網(wǎng)站域 名地址對(duì)應(yīng)的網(wǎng)站行業(yè)相關(guān)度,整理行業(yè)網(wǎng)站;
[0037] 技術(shù)信息收集裝置,用于從整理的網(wǎng)站中獲取技術(shù)信息,所述技術(shù)信息包括標(biāo)題、 摘要、時(shí)間和鏈接;
[0038] 捜索服務(wù)器,用于利用所述聯(lián)想關(guān)鍵字從所述技術(shù)信息中,獲取檢索結(jié)果;
[0039] 檢索結(jié)果重排裝置,用于將所述檢索結(jié)果按照排序規(guī)則重排,所述排序規(guī)則包括 按照檢索結(jié)果的時(shí)間、訪問(wèn)次數(shù)、行業(yè)詞匯數(shù)量W及原排序位置確定的排序規(guī)則,將重排后 的檢索結(jié)果發(fā)送至所述瀏覽器并顯示。
[0040] 優(yōu)選地,所述關(guān)鍵字聯(lián)想裝置包括:
[0041] 初始詞獲取模塊,用于根據(jù)所述查詢(xún)內(nèi)容,查詢(xún)包括技術(shù)問(wèn)題和解決方案的技術(shù) 庫(kù),獲得初始詞;
[0042] 初始關(guān)鍵字獲取模塊,用于從所述初始詞中篩選出初始關(guān)鍵字;
[0043] 學(xué)術(shù)關(guān)鍵字獲取模塊,用于利用所述初始關(guān)鍵字W及所述查詢(xún)內(nèi)容,分別查詢(xún)學(xué) 術(shù)數(shù)據(jù)庫(kù),獲得學(xué)術(shù)關(guān)鍵字;
[0044] 聯(lián)想關(guān)鍵字組合模塊,用于將所述初始關(guān)鍵字、所述查詢(xún)內(nèi)容W及所述學(xué)術(shù)關(guān)鍵 字合并為聯(lián)想關(guān)鍵字。
[0045] 優(yōu)選地,所述行業(yè)網(wǎng)站整理裝置包括:
[0046] 鏈接地址抓取模塊,用于根據(jù)所述網(wǎng)絡(luò)訪問(wèn)記錄訪問(wèn)網(wǎng)絡(luò)頁(yè)面,獲取所述網(wǎng)絡(luò)頁(yè) 面中的鏈接地址;
[0047] 網(wǎng)站域名地址獲取模塊,用于從所述鏈接地址中,獲取網(wǎng)站域名地址;
[0048] 網(wǎng)站行業(yè)相關(guān)度計(jì)算模塊,用于所述網(wǎng)站域名地址對(duì)應(yīng)的網(wǎng)站中出現(xiàn)的行業(yè)詞匯 數(shù),計(jì)算所述網(wǎng)站的網(wǎng)站行業(yè)相關(guān)度;
[0049] 網(wǎng)站庫(kù)整理模塊,用于將所述網(wǎng)站域名地址整理加入行業(yè)網(wǎng)站庫(kù)。
[0050] 優(yōu)選地,所述檢索結(jié)果重排裝置包括:
[0051] 排序值計(jì)算模塊,用于根據(jù)檢索結(jié)果的時(shí)間、訪問(wèn)次數(shù)、行業(yè)詞匯數(shù)量W及原排序 位置,分別計(jì)算確定檢索結(jié)果的時(shí)間排序值、訪問(wèn)次數(shù)排序值、檢索行業(yè)相關(guān)度排序值W及 位置排序值;
[0052] 總排序值計(jì)算模塊,用于通過(guò)加權(quán)計(jì)算所述時(shí)間排序值、所述訪問(wèn)次數(shù)排序值、所 述檢索行業(yè)相關(guān)度排序值W及所述位置排序值,得到總排序值;
[0053] 排序模塊,用于根據(jù)所述總排序值,對(duì)所述檢索結(jié)果重排;
[0054] 優(yōu)選地,所述行業(yè)技術(shù)信息捜集系統(tǒng)還包括行業(yè)類(lèi)別信息獲取裝置,其中:
[0055] 所述行業(yè)類(lèi)別信息獲取裝置用于獲取行業(yè)類(lèi)別信息,所述行業(yè)類(lèi)別信息為包括電 力、航天、能源和醫(yī)學(xué)中的一個(gè)或多個(gè)的類(lèi)別信息;
[0056] 所述行業(yè)類(lèi)別信息獲取裝置還用于將所述行業(yè)類(lèi)別信息發(fā)送至關(guān)鍵字聯(lián)想裝置, 指示所述關(guān)鍵字聯(lián)想裝置根據(jù)所述用戶(hù)檢索內(nèi)容,生成與所述行業(yè)類(lèi)別信息相對(duì)應(yīng)的、行 業(yè)相關(guān)的聯(lián)想關(guān)鍵字;
[0057] 所述行業(yè)類(lèi)別信息獲取裝置還用于將所述行業(yè)類(lèi)別信息發(fā)送至所述行業(yè)網(wǎng)站整 理裝置,用于指示所述行業(yè)網(wǎng)站整理裝置從用戶(hù)的訪問(wèn)記錄或者所述聯(lián)想關(guān)鍵字在互聯(lián)網(wǎng) 中的捜索記錄中提取網(wǎng)站地址,并根據(jù)網(wǎng)站地址的網(wǎng)站行業(yè)相關(guān)度,整理與所述行業(yè)類(lèi)別 信息相對(duì)應(yīng)的行業(yè)網(wǎng)站庫(kù);
[005引所述行業(yè)類(lèi)別信息獲取裝置還用于將所述行業(yè)類(lèi)別信息發(fā)送至所述檢索結(jié)果重 排裝置,用于指示所述檢索結(jié)果重排裝置計(jì)算所述行業(yè)詞匯數(shù)量,并根據(jù)檢索結(jié)果的時(shí)間、 訪問(wèn)次數(shù)、所述行業(yè)詞匯數(shù)量W及原排序位置確定排序規(guī)則。
[0059] 優(yōu)選地,所述行業(yè)技術(shù)信息捜集系統(tǒng)還包括定時(shí)器,所述定時(shí)器W預(yù)定周期向所 述行業(yè)網(wǎng)站整理裝置W及所述技術(shù)信息收集裝置發(fā)送觸發(fā)信息;所述觸發(fā)信息用于觸發(fā)所 述行業(yè)網(wǎng)站整理裝置從用戶(hù)的訪問(wèn)記錄中提取網(wǎng)站域名地址,并根據(jù)網(wǎng)站域名地址對(duì)應(yīng)的 網(wǎng)站行業(yè)相關(guān)度,整理網(wǎng)站;W及,所述觸發(fā)信息用于觸發(fā)所述技術(shù)信息收集裝置,從整理 的網(wǎng)站中獲取技術(shù)信息,所述技術(shù)信息包括標(biāo)題、摘要、時(shí)間和鏈接。
[0060] 由W上技術(shù)方案可見(jiàn),本發(fā)明實(shí)施例提供的行業(yè)技術(shù)信息捜集方法及系統(tǒng),通過(guò) 獲取用戶(hù)查詢(xún)內(nèi)容;根據(jù)所述用戶(hù)查詢(xún)內(nèi)容,生成行業(yè)相關(guān)的聯(lián)想關(guān)鍵字,并顯示;從用戶(hù) 的訪問(wèn)記錄中提取網(wǎng)站地址,并根據(jù)網(wǎng)站地址的網(wǎng)站行業(yè)相關(guān)度,整理網(wǎng)站,從所述行業(yè)網(wǎng) 站庫(kù)的網(wǎng)站中獲取技術(shù)信息,所述技術(shù)信息包括標(biāo)題、摘要、時(shí)間和鏈接;利用所述聯(lián)想關(guān) 鍵字檢索所述技術(shù)信息,獲取檢索結(jié)果;將所述檢索結(jié)果按照排序規(guī)則重排,所述排序規(guī)則 包括根據(jù)檢索結(jié)果的時(shí)間、訪問(wèn)次數(shù)、行業(yè)詞匯數(shù)量W及原排序位置確定的排序規(guī)則,最后 將重排后的檢索結(jié)果顯示。在上述過(guò)程中,所述聯(lián)想關(guān)鍵字與待查詢(xún)的行業(yè)緊密相關(guān),而且 通過(guò)整理行業(yè)網(wǎng)站庫(kù),進(jìn)一步保證行業(yè)網(wǎng)站庫(kù)的專(zhuān)業(yè)性,排除行業(yè)無(wú)關(guān)網(wǎng)站的干擾,最后獲 得的重排后的檢索結(jié)果與用戶(hù)的檢索需求更加匹配,有效提高了檢索效率,并對(duì)技術(shù)創(chuàng)新 起到輔助和支持作用。
【附圖說(shuō)明】
[0061] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,對(duì)于本領(lǐng)域普通技術(shù)人員而 言,在不付出創(chuàng)造性勞動(dòng)的前提下,還可W根據(jù)運(yùn)些附圖獲得其他的附圖。
[0062] 圖1為本發(fā)明實(shí)施例提供的一種行業(yè)技術(shù)信息捜集方法的流程示意圖;
[0063] 圖2為本發(fā)明實(shí)施例提供的一種關(guān)鍵字聯(lián)想生成方法的流程示意圖;
[0064] 圖3為本發(fā)明實(shí)施例提供的一種行業(yè)網(wǎng)站整理方法的流程示意圖;
[0065] 圖4為本發(fā)明實(shí)施例提供的一種檢索結(jié)果重排方法的流程示意圖;
[0066] 圖5為本發(fā)明實(shí)施例提供的另一種行業(yè)技術(shù)信息捜集方法的流程示意圖;
[0067] 圖6為本發(fā)明實(shí)施例提供的一種行業(yè)技術(shù)信息捜集系統(tǒng)的結(jié)構(gòu)示意圖;
[0068] 圖7為本發(fā)明實(shí)施例提供的一種關(guān)鍵字聯(lián)想裝置的結(jié)構(gòu)示意圖;
[0069] 圖8為本發(fā)明實(shí)施例提供的一種行業(yè)網(wǎng)站整理裝置的結(jié)構(gòu)示意圖;
[0070] 圖9為本發(fā)明實(shí)施例提供的一種檢索結(jié)果重排裝置的結(jié)構(gòu)示意圖;
[0071] 圖10為本發(fā)明實(shí)施例提供的另一種行業(yè)技術(shù)信息捜集系統(tǒng)的結(jié)構(gòu)示意圖;
[0072] 圖11為本發(fā)明實(shí)施例提供的又一種行業(yè)技術(shù)信息捜集系統(tǒng)的結(jié)構(gòu)示意圖;
[0073] 圖12為本發(fā)明實(shí)施例提供的再一種行業(yè)技術(shù)信息捜集系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0074] 為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明中的技術(shù)方案,下面將結(jié)合本發(fā)明實(shí) 施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施 例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通 技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù) 的范圍。
[0075] 技術(shù)創(chuàng)新主要分為Ξ種模式:自主創(chuàng)新、模仿創(chuàng)新和合作創(chuàng)新。目前,電網(wǎng)企業(yè)技 術(shù)創(chuàng)新W模仿創(chuàng)新為主將新技術(shù)、新方法與當(dāng)前電網(wǎng)生產(chǎn)實(shí)踐相結(jié)合。模仿創(chuàng)新是指在率 先創(chuàng)新的示范影響和利益誘導(dǎo)之下,創(chuàng)新主體通過(guò)合法方式引進(jìn)創(chuàng)新成果,并在此基礎(chǔ)上 進(jìn)行改進(jìn)的一種創(chuàng)新形式。模仿創(chuàng)新過(guò)程中前沿新技術(shù)、新方法收集及其電網(wǎng)生產(chǎn)實(shí)踐的 結(jié)合可抽象為固有模式;在新技術(shù)、新方法的收集過(guò)程中,用戶(hù)一般借助捜索引擎,在捜索 引擎中輸入查詢(xún)內(nèi)容W獲得相應(yīng)的檢索結(jié)果,其中檢索的關(guān)鍵字、檢索的網(wǎng)站W(wǎng)及檢索結(jié) 果的排序是決定用戶(hù)檢索效率的核屯、因素。
[0076] 參見(jiàn)圖1,為本發(fā)明實(shí)施例提供的一種行業(yè)技術(shù)信息捜集方法的流程示意圖,所述 信息檢索方法包括W下步驟:
[0077] 步驟S101:獲取用戶(hù)查詢(xún)內(nèi)容。
[0078] 所述查詢(xún)內(nèi)容為用戶(hù)從需要查詢(xún)的技術(shù)信息中提煉出的關(guān)鍵字,例如用戶(hù)如果需 要檢索高壓設(shè)備驅(qū)鳥(niǎo)相關(guān)的技術(shù)信息,可W輸入查詢(xún)內(nèi)容"驅(qū)鳥(niǎo)";同樣,所述查詢(xún)內(nèi)容可W 包括一個(gè)