亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

網(wǎng)絡(luò)中文信息綜合搜索器的制作方法

文檔序號(hào):6615630閱讀:214來源:國知局
專利名稱:網(wǎng)絡(luò)中文信息綜合搜索器的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)信息的處理系統(tǒng),特別是一種網(wǎng)絡(luò)中文信息綜合搜索器。
當(dāng)今Internet頁面全球約有10億個(gè),涉及到日常生活的各個(gè)方面。曾經(jīng)人們還為Internet上的信息少而苦惱,如今卻陷入到知識(shí)爆炸、太多的信息使人無所適從的境地。從YAHOO搜索引擎的出世,到今天越來越多的搜索引擎的出現(xiàn),無不顯示出人們對(duì)信息查找的重視,如何在浩瀚的信息世界找到自己所要的信息,成為人們不得不思索的問題。
近幾年來在INTERNET上出現(xiàn)的METAENGINE是將各個(gè)搜索引擎的數(shù)據(jù)庫集中起來,為用戶提供復(fù)蓋率更廣、更精確的搜索,因?yàn)橐患乙婧茈y窮盡世界所有的頁面,從技術(shù)上、操作上都不可能。
隨著中國INTERNET的普及,中國上網(wǎng)人數(shù)每隔數(shù)月就翻一番,中文的信息量也越來越大。同樣的信息查找問題擺在人們面前,目前提供中文搜索的引擎主要是,中文YAHOO、SOHU中文、新浪中文、天網(wǎng)、悠游等幾家,他們收錄的中文信息有限,同時(shí)對(duì)中文的分類、整理并沒有仔細(xì)的處理,人們往往查到的信息并不是他們所要的。
INTERNET上至今還沒有一個(gè)中文的METAENGINE,如果將各個(gè)中文引擎的數(shù)據(jù)庫放到一起,同時(shí)對(duì)搜索的結(jié)果都精挑細(xì)選,那么讓中國人也能享受到先進(jìn)查詢帶來的好處。
本發(fā)明的目的就是為了解決已有技術(shù)的問題滿足用戶對(duì)中文信息的查詢檢索的需求。采用SERVLET技術(shù),運(yùn)用最新的技術(shù)處理目前國內(nèi)復(fù)雜的網(wǎng)絡(luò)環(huán)境。
本發(fā)明的系統(tǒng)結(jié)構(gòu)包括一種網(wǎng)絡(luò)中文信息綜合搜索器,系統(tǒng)結(jié)構(gòu)主要包括輸入端、噪音過濾,解釋端和對(duì)對(duì)方引擎的自動(dòng)調(diào)整適應(yīng)處理,根據(jù)所設(shè)網(wǎng)絡(luò)模擬數(shù)學(xué)模型分析搜索到的信息,并依據(jù)用戶請(qǐng)求,編排后交用戶使用,其特征在于所述網(wǎng)絡(luò)模擬數(shù)學(xué)模型分析為采用Wideway Search引擎對(duì)所有引擎反饋的頁面作統(tǒng)一的數(shù)學(xué)模型分析歸類,并對(duì)各不同反饋結(jié)果統(tǒng)一相關(guān)度,該相關(guān)度分析條件為原始引擎的權(quán)重KL、頁面本身的相關(guān)度C、頁面反饋的時(shí)間T、一個(gè)引擎反饋的結(jié)果數(shù)N,經(jīng)鐘型脈沖數(shù)學(xué)公式分析后得統(tǒng)一相關(guān)度。


圖1是本發(fā)明的系統(tǒng)結(jié)構(gòu)示意圖下面結(jié)合附圖進(jìn)一步說明本發(fā)明的實(shí)施例用戶在輸入端提出檢索請(qǐng)求如主題詞、關(guān)鍵詞等,進(jìn)入頁面智能分析引擎,該引擎收錄了目前中文最權(quán)威的搜索引擎如中文YAHOO、中文EXITE、新浪中文、搜狐中文、北大天網(wǎng)、悠游、飛花中文、中文網(wǎng)典、歐姆龍、搜索客、網(wǎng)易中文。本搜索引擎還支持英文,收錄目前世界技術(shù)最前沿、資料最全的五家搜索引擎YAHOO、ALAVESTA、NORTHERNLIGHT、DIRECTHIT、GOOGLE。由于中國目前的網(wǎng)絡(luò)帶寬有限,頁面的分析經(jīng)常要靠原始引擎的結(jié)果。為了從有限的信息中獲得更多的信息,本引擎采用智能推理分析頁面,將用戶輸入的請(qǐng)求經(jīng)噪音過濾,對(duì)信息自動(dòng)分類處理后,由解釋端從反饋回來的頁面自動(dòng)找出相關(guān)的詞,計(jì)入相關(guān)度中,然后對(duì)對(duì)方的引擎調(diào)整自動(dòng)適應(yīng)處理,與此同時(shí)用戶的請(qǐng)求進(jìn)入并行頁面請(qǐng)求引擎進(jìn)行搜索,并將搜索到的信息返饋頁面智能分析引擎,根據(jù)所設(shè)網(wǎng)絡(luò)模擬數(shù)學(xué)模型分析搜索到的信息,并依據(jù)用戶請(qǐng)求編排后交用戶使用。
網(wǎng)絡(luò)模擬數(shù)學(xué)模型分析采用WIDEWAYSEARCH引擎對(duì)所有的引擎反饋的頁面作統(tǒng)一的數(shù)學(xué)模型分析歸類,對(duì)不同的引擎反饋的結(jié)果都有統(tǒng)一的相關(guān)度。
該相關(guān)度分析條件1、原始引擎的權(quán)重KL這是基本權(quán)重。由于中文引擎質(zhì)量存在差別,所以將引擎分類,對(duì)于好的引擎,反饋回的記錄的權(quán)重將高于其他的引擎反饋的結(jié)果。
2、頁面本身的相關(guān)度C對(duì)每條反饋的結(jié)果作智能分析,判斷結(jié)果的相關(guān)度,即對(duì)簡介作全文檢索分析。
3、頁面反饋的時(shí)間T由于相關(guān)度和服務(wù)器與用戶的距離有關(guān),比如YAHOO的某條記錄特別符合用戶的需要,但是要鏈接到該頁面可能化用戶10分鐘,這條記錄的有效性將受到懷疑。因此監(jiān)測(cè)每條記錄的反饋結(jié)果,提供給用戶參考鏈接該記錄的花費(fèi)時(shí)間。而不使用戶作無用的嘗試。
4、一個(gè)引擎反饋的結(jié)果數(shù)N它將被最終的相關(guān)度作參考,我們注意到,反饋的結(jié)果數(shù)其實(shí)和該引擎的數(shù)據(jù)庫大小有關(guān),而該引擎的復(fù)蓋率明顯會(huì)對(duì)用戶判斷該記錄的權(quán)威性產(chǎn)生影響。
根據(jù)以上相關(guān)度分析條件經(jīng)鐘型脈沖數(shù)學(xué)公式分析后得統(tǒng)一相關(guān)度。
本發(fā)明優(yōu)點(diǎn)是采用多分類處理,在目前國內(nèi)復(fù)雜的網(wǎng)絡(luò)環(huán)境中用戶可以根據(jù)相關(guān)度、時(shí)間、域名、選擇的引擎進(jìn)行分類,讓用戶更容易在信息中方便導(dǎo)航,采用SERVLET技術(shù)構(gòu)建,有很大的伸縮空間以應(yīng)付大量用戶的請(qǐng)求,同時(shí)對(duì)服務(wù)程序作了特殊的負(fù)載自適應(yīng)處理,能提供給用戶多而精細(xì)的信息,并可大大減少用戶等待的時(shí)間。
權(quán)利要求
1.一種網(wǎng)絡(luò)中文信息綜合搜索器,系統(tǒng)結(jié)構(gòu)主要包括輸入端、噪音過濾,解釋端和對(duì)對(duì)方引擎的自動(dòng)調(diào)整適應(yīng)處理,根據(jù)所設(shè)網(wǎng)絡(luò)模擬數(shù)學(xué)模型分析搜索到的信息,并依據(jù)用戶請(qǐng)求,編排后交用戶使用,其特征在于所述網(wǎng)絡(luò)模擬數(shù)學(xué)模型分析為采用WidewaySearch引擎對(duì)所有引擎反饋的頁面作統(tǒng)一的數(shù)學(xué)模型分析歸類,并對(duì)各不同反饋結(jié)果統(tǒng)一相關(guān)度,該相關(guān)度分析條件為原始引擎的權(quán)重KL、頁面本身的相關(guān)度C、頁面反饋的時(shí)間T、一個(gè)引擎反饋的結(jié)果數(shù)N,經(jīng)鐘型脈沖數(shù)學(xué)公式分析后得統(tǒng)一相關(guān)度。
全文摘要
網(wǎng)絡(luò)中文信息綜合搜索器,系統(tǒng)結(jié)構(gòu)包括輸入端、噪音過濾,解釋端和對(duì)對(duì)方引擎的自動(dòng)調(diào)整適應(yīng)處理,根據(jù)所設(shè)網(wǎng)絡(luò)模擬數(shù)學(xué)模型分析搜索列的信息,并依據(jù)用戶請(qǐng)求,編排后交用戶使用,該模擬數(shù)學(xué)模型分析采用Wideway Search引擎對(duì)所有引擎反饋的頁面作統(tǒng)一的數(shù)學(xué)模型分析歸類,并對(duì)各不同反饋結(jié)果統(tǒng)一相關(guān)度,設(shè)條件為:原始引擎權(quán)重KL、頁面本身相關(guān)度C、頁面反饋時(shí)間T、一個(gè)引擎反饋結(jié)果數(shù)N,經(jīng)鐘型脈沖數(shù)學(xué)公式分析后得統(tǒng)一相關(guān)度。
文檔編號(hào)G06F17/30GK1325076SQ0011579
公開日2001年12月5日 申請(qǐng)日期2000年5月23日 優(yōu)先權(quán)日2000年5月23日
發(fā)明者林宏, 鮑勁松 申請(qǐng)人:上海萬緯信息技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1