專利名稱:一種結(jié)構(gòu)化信息價值評估方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明實(shí)施例設(shè)計(jì)數(shù)字?jǐn)?shù)據(jù)處理技術(shù),特別是設(shè)計(jì)一種結(jié)構(gòu)化信息價值評估方法和設(shè)備。
背景技術(shù):
由于人們在使用搜索引擎時對數(shù)據(jù)準(zhǔn)確性的要求越來越高,新的搜索引擎服務(wù)模 式應(yīng)運(yùn)而生,即行業(yè)搜索引擎。它是通過針對某一特定領(lǐng)域、某一特定人群或某一特定需求 提供的有一定價值的信息和相關(guān)服務(wù)。相比通用搜索引擎海量信息的無序化,行業(yè)搜索引 擎則顯得更加專注、具體、深入和具有行業(yè)色彩。行業(yè)搜索引擎為用戶提供的并不是上百甚 至上千萬相關(guān)網(wǎng)頁,而是范圍極為縮小、極具針對性的具體信息。行業(yè)搜索引擎所抓取的數(shù)據(jù),都是集中出現(xiàn)在幾個行業(yè)垂直網(wǎng)站上,這使得現(xiàn)有 的信息價值評估機(jī)制難以使用,因此無法滿足客戶對信息評價的需求。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種結(jié)構(gòu)化信息價值評估方法和設(shè)備??梢宰詣釉u估信息價 值,為信息處理人員提供了依據(jù),節(jié)省了大量工作。本發(fā)明實(shí)施例提供的一種結(jié)構(gòu)化信息價值評估方法,包括將輸入的結(jié)構(gòu)化信息按照第一預(yù)設(shè)規(guī)則分解為信息域;將所述信息域按照第二預(yù)設(shè)規(guī)則與知識庫對應(yīng);根據(jù)所述知識庫中的記錄評估所述知識庫的價值;根據(jù)所述知識庫價值評估所述信息域的價值;根據(jù)所述信息域價值評估所述結(jié)構(gòu)化信息的價值。本發(fā)明實(shí)施例提供的一種結(jié)構(gòu)化信息價值評估設(shè)備,包括第一分解模塊,用于將輸入的結(jié)構(gòu)化信息按照第一預(yù)設(shè)規(guī)則分解為信息域;第一對應(yīng)模塊,用于將所述信息域按照第二預(yù)設(shè)規(guī)則與知識庫對應(yīng);第一評估模塊,用于根據(jù)所述知識庫中的記錄評估所述知識庫的價值;第二評估模塊,根據(jù)所述知識庫價值評估所述信息域的價值;第三評估模塊,用于根據(jù)所述信息域價值評估所述結(jié)構(gòu)化信息的價值。本發(fā)明實(shí)施例提供的一種結(jié)構(gòu)化信息價值評估方法和設(shè)備。解決了通用信息處理 方法無法自動評估信息的價值的問題,滿足了不同行業(yè)對信息評價的需求,為信息處理人 員提供了依據(jù),節(jié)省了大量工作。
為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例中所需要使用的 附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng) 域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明價值評估方法實(shí)施例示意
圖2為本發(fā)明價值評估方法另一實(shí)施例示意圖;圖3為本發(fā)明價值評估設(shè)備實(shí)施例示意
圖4為本發(fā)明價值評估設(shè)備另一實(shí)施例示意圖。
具體實(shí)施例方式本發(fā)明實(shí)施例提供了一種結(jié)構(gòu)化信息價值評估方法和設(shè)備,下面對本發(fā)明實(shí)施例 的技術(shù)方案做進(jìn)一步的詳細(xì)描述。圖1為本發(fā)明價值評估方法實(shí)施例示意圖。本實(shí)施例包括;步驟101,將輸入的結(jié)構(gòu)化信息按照第一預(yù)設(shè)規(guī)則分解為信息域;步驟102,將所述信息域按照第二預(yù)設(shè)規(guī)則與知識庫對應(yīng);步驟103,根據(jù)所述知識庫中的記錄評估所述知識庫的價值;步驟104,根據(jù)所述知識庫價值評估所述信息域的價值;步驟105,根據(jù)所述信息域價值評估所述結(jié)構(gòu)化信息的價值。本實(shí)施例的執(zhí)行主體可以是通用計(jì)算機(jī)、網(wǎng)絡(luò)服務(wù)器等設(shè)備。本實(shí)施例通過輸入 網(wǎng)頁或文本信息,生成結(jié)構(gòu)化信息,并分解為不同的信息域,通過信息域價值,評估信息價 值,可以自動評估信息價值。結(jié)構(gòu)化信息可以由人工輸入、從數(shù)據(jù)庫輸入、或者通過行業(yè)搜索引擎抓取。行業(yè)搜 索引擎包括現(xiàn)有的Web Harvest (網(wǎng)絡(luò)果實(shí))數(shù)據(jù)挖掘工具等,通過WebHarvest可以將網(wǎng)頁 處理為結(jié)構(gòu)化信息。第一預(yù)設(shè)規(guī)則按照結(jié)構(gòu)化信息的情況確定,比如結(jié)構(gòu)化信息為簡歷時, 第一預(yù)設(shè)規(guī)則可以為,將畢業(yè)院校設(shè)為一個域,項(xiàng)目經(jīng)驗(yàn)設(shè)為一個域,工作經(jīng)歷設(shè)為一個域 等,在這種情況下,將結(jié)構(gòu)化信息分解為信息域的過程就是將一份簡歷分解為畢業(yè)院校、項(xiàng) 目經(jīng)驗(yàn)、工作經(jīng)歷等域;結(jié)構(gòu)化信息為設(shè)備參數(shù)時,可以將功耗設(shè)為一個域,體積設(shè)為一個 域,速度設(shè)為一個域等。第二預(yù)設(shè)規(guī)則也是按照結(jié)構(gòu)化信息的情況確定,比如結(jié)構(gòu)化信息為簡歷時,對于 畢業(yè)院校域,可以與不同的院校排名等知識庫對應(yīng),項(xiàng)目經(jīng)驗(yàn)可以與使用工具、時間長度等 知識庫對應(yīng)。在評價知識庫價值時,可以采取將結(jié)構(gòu)化信息與對應(yīng)的知識庫中的記錄相比,再 進(jìn)行評估的方法。比如,如果結(jié)構(gòu)化信息是簡歷,待評估的域是畢業(yè)院校,則可以將畢業(yè)院 校中的信息,如XX大學(xué)和院校排名相比,結(jié)果是前10名,那么該記錄價值為100,在本例中, 僅有一條記錄與信息相符,如果符合的記錄多于一條,則需要加權(quán)或平均,比如
權(quán)利要求
1.一種結(jié)構(gòu)化信息價值評估方法,其特征在于,包括 將輸入的結(jié)構(gòu)化信息按照第一預(yù)設(shè)規(guī)則分解為信息域; 將所述信息域按照第二預(yù)設(shè)規(guī)則與知識庫對應(yīng); 根據(jù)所述知識庫中的記錄評估所述知識庫的價值;根據(jù)所述知識庫價值評估所述信息域的價值; 根據(jù)所述信息域價值評估所述結(jié)構(gòu)化信息的價值。
2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述知識庫中的記錄評估所述知 識庫的價值包括確定所述結(jié)構(gòu)化信息是否符合所述記錄中的條件; 將符合條件的所述結(jié)構(gòu)化信息對應(yīng)的記錄的價值加權(quán)或平均。
3.如權(quán)利要求1或2所述的方法,其特征在于,所述根據(jù)所述知識庫價值評估所述信息 域的價值包括將所述知識庫的價值加權(quán)或平均。
4.如權(quán)利要求1或2所述的方法,其特征在于,所述根據(jù)所述信息域價值評估所述結(jié)構(gòu) 化信息的價值包括將所述信息域的價值加權(quán)或平均。
5.如權(quán)利要求2所述的方法,其特征在于,還包括 獲取所述記錄中的條件;根據(jù)所述條件評估所述記錄的價值。
6.一種結(jié)構(gòu)化信息價值評估設(shè)備,其特征在于,包括第一分解模塊,用于將輸入的結(jié)構(gòu)化信息按照第一預(yù)設(shè)規(guī)則分解為信息域; 第一對應(yīng)模塊,用于將所述信息域按照第二預(yù)設(shè)規(guī)則與知識庫對應(yīng); 第一評估模塊,用于根據(jù)所述知識庫中的記錄評估所述知識庫的價值; 第二評估模塊,根據(jù)所述知識庫價值評估所述信息域的價值; 第三評估模塊,用于根據(jù)所述信息域價值評估所述結(jié)構(gòu)化信息的價值。
7.如權(quán)利要求6所述的一種設(shè)備,其特征在于,所述第一評估模塊包括 第一處理子模塊,用于確定所述結(jié)構(gòu)化信息是否符合所述記錄中的條件;第二處理子模塊,用于將符合條件的所述結(jié)構(gòu)化信息對應(yīng)的記錄的價值加權(quán)或平均。
8.如權(quán)利要求6或7所述的一種設(shè)備,其特征在于,所述根據(jù)所述知識庫價值評估所述 信息域的價值包括將所述知識庫的價值加權(quán)或平均。
9.如權(quán)利要求6或7所述的一種設(shè)備,其特征在于,所述根據(jù)所述信息域價值評估所述 結(jié)構(gòu)化信息的價值包括將所述信息域的價值加權(quán)或平均。
10.如權(quán)利要求6所述的一種設(shè)備,其特征在于,還包括 第一獲取模塊,用于獲取所述記錄中的條件;第四評估模塊,用于根據(jù)所述條件評價所述記錄的價值。
全文摘要
本發(fā)明實(shí)施例提供了一種結(jié)構(gòu)化信息價值評估方法和設(shè)備。本發(fā)明實(shí)施例的方法包括將輸入的結(jié)構(gòu)化信息按照第一預(yù)設(shè)規(guī)則分解為信息域;將所述信息域按照第二預(yù)設(shè)規(guī)則與知識庫對應(yīng);根據(jù)所述知識庫中的記錄評估所述知識庫的價值;根據(jù)所述知識庫價值評估所述信息域的價值;根據(jù)所述信息域價值評估所述結(jié)構(gòu)化信息的價值。本發(fā)明實(shí)施例解決了通用信息處理方法無法自動評估信息的價值的問題,滿足了不同行業(yè)對信息評價的需求,為信息處理人員提供了依據(jù),節(jié)省了大量工作。
文檔編號G06F17/30GK102043778SQ200910167969
公開日2011年5月4日 申請日期2009年10月20日 優(yōu)先權(quán)日2009年10月20日
發(fā)明者吳強(qiáng), 張紹蔚, 李航宇, 陶亞平 申請人:成都市華為賽門鐵克科技有限公司