亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種索引更新的方法

文檔序號:6551058閱讀:233來源:國知局
一種索引更新的方法
【專利摘要】一種索引更新的方法,包括步驟:A、根據(jù)規(guī)則為實時創(chuàng)建的普通索引增加記載權值的索引權值標簽,作為增量索引放入增量索引池緩存;B、判斷符合基礎索引的更新條件時,根據(jù)更新規(guī)則將增量索引池中的增量索引根據(jù)索引權值標簽記載的權值大小排序,并依次更新至基礎索引中。由上,根據(jù)所述更新條件、更新規(guī)則可以實現(xiàn)新增量索引靈活的動態(tài)更新。
【專利說明】一種索引更新的方法

【技術領域】
[0001]本發(fā)明涉及一種數(shù)據(jù)處理技術,特別是指一種索引更新的方法。

【背景技術】
[0002]全文檢索引擎不能時時更新增量索引,只能在規(guī)定的時間去解析新增的文件,提取文件中的文本,然后將文本轉為索引,再追加到全文檢索引擎,這個過程是個循環(huán),文件越多,耗費的時間越多。每次做索引更新時,應用都無法使用索引,所以時間越長,應用無法使用索引的時間也就越長,導致效率降低。
[0003]為了優(yōu)化索引更新,中國專利申請?zhí)朇N201010554536提供了一種云環(huán)境中的文本索引在線更新方法,其要更新的各個節(jié)點分批次執(zhí)行索引更新,逐個節(jié)點進行更新,來替代由于整體更新時帶來的節(jié)點不可訪問的問題,從整體上解決了在更新增量索引時無法使用索引的問題。
[0004]但是對于某個節(jié)點進行更新時,對于該節(jié)點,其全文檢索更新仍是獨占模式。其要更新所要的新增索引量數(shù)據(jù)量大時,該節(jié)點仍無法被訪問,如何能夠實現(xiàn)新增量索引更新的更加靈活,是所要解決的技術問題。


【發(fā)明內(nèi)容】

[0005]有鑒于此,本發(fā)明的主要目的在于提供一種索引更新的方法,以實現(xiàn)新增量索引靈活的動態(tài)更新。
[0006]本發(fā)明提供的索引更新的方法,包括步驟:
[0007]A、根據(jù)規(guī)則為實時創(chuàng)建的普通索引增加記載權值的索引權值標簽,作為增量索引放入增量索引池緩存;
[0008]B、判斷符合基礎索引的更新條件時,根據(jù)更新規(guī)則將增量索引池中的增量索引根據(jù)索引權值標簽記載的權值大小排序,并依次更新至基礎索引中。
[0009]由上,將增量索引根據(jù)一定規(guī)則設定不同的權值,從而具有不同的優(yōu)先級,當增量索引追加到基礎索引時,根據(jù)增量索引的各個權值的優(yōu)先級來決定各增量索引更新的時間、范圍等,以實現(xiàn)新增量索引靈活的動態(tài)更新。
[0010]較佳的,步驟A所述權值包括不同類型的權值;步驟B所述更新規(guī)則包括指定類型的權值或由不同類型的權值計算的綜合權值;相應的,步驟B所述根據(jù)索引權值標簽記載的權值大小排序是根據(jù)所述指定類型的權值大小排序,或根據(jù)計算出的所述綜合權值大小排序。
[0011]由上,將增量索引根據(jù)一定規(guī)則設定不同的權值,從而具有不同的優(yōu)先級,當增量索引追加到基礎索引時,根據(jù)增量索引的各個權值的優(yōu)先級來決定各增量索引更新的時間、范圍等,以實現(xiàn)新增量索引靈活的動態(tài)更新。
[0012]可選的,所述索引權值標簽記載有下述至少之一的類型的權值:用于體現(xiàn)同一文件出現(xiàn)頻率的出現(xiàn)頻率權值、用于體現(xiàn)文件內(nèi)容字節(jié)的長度的長度權值、用于體現(xiàn)文件對應業(yè)務類型的業(yè)務規(guī)則權值、文件格式權值。
[0013]由上,通過不同權重對應其不同的修改權限,可以間接體現(xiàn)出文件重要性。
[0014]可選的,所述綜合權值的計算步驟包括

【權利要求】
1.一種索引更新的方法,其特征在于,包括步驟: A、根據(jù)規(guī)則為實時創(chuàng)建的普通索引增加記載權值的索引權值標簽,作為增量索引放入增量索引池緩存; B、判斷符合基礎索引的更新條件時,根據(jù)更新規(guī)則將增量索引池中的增量索引根據(jù)索引權值標簽記載的權值大小排序,并依次更新至基礎索引中。
2.根據(jù)權利要求1所述的方法,其特征在于, 步驟A所述權值包括不同類型的權值; 步驟B所述更新規(guī)則包括指定類型的權值或由不同類型的權值計算的綜合權值;相應的,步驟B所述根據(jù)索引權值標簽記載的權值大小排序是根據(jù)所述指定類型的權值大小排序,或根據(jù)計算出的所述綜合權值大小排序。
3.根據(jù)權利要求2所述的方法,其特征在于,所述索引權值標簽記載有下述至少之一的類型的權值: 用于體現(xiàn)同一文件出現(xiàn)頻率的出現(xiàn)頻率權值、用于體現(xiàn)文件內(nèi)容字節(jié)的長度的長度權值、用于體現(xiàn)文件對應業(yè)務類型的業(yè)務規(guī)則權值、文件格式權值。
4.根據(jù)權利要求2所述的方法,其特征在于,所述綜合權值的計算步驟包括:
其中,X綜合指要計算的綜合權值,Xi表示每類權值,ai表示每類權值的系數(shù)。
5.根據(jù)權利要求2所述的方法,其特征在于,步驟B所述判斷符合基礎索引的更新條件包括以下之一或任意組合: 判斷是否到達設定時間確定是否符合基礎索引的更新條件; 判斷與基礎索引前次更新的時間間隔是否到達設定時長確定是否符合基礎索引的更新條件; 判斷某權值以上的索引量是否達到某預定值確定是否符合基礎索引的更新條件; 判斷新增的增量索引權值是否大于設定權值確定是否符合基礎索引的更新條件; 判斷增量索引池內(nèi)緩存的索引是否到達到一定容量確定是否符合基礎索引的更新條件。
6.根據(jù)權利要求5所述的方法,其特征在于,還包括: 基礎索引更新過程所限定的更新時長。
7.根據(jù)權利要求1所述的方法,其特征在于,步驟B所述更新規(guī)則包括對應的以下之一或任意組合: 更新過程所限定的更新時長;相應的,步驟B所述依次更新至基礎索引中是在所述更新時長內(nèi)執(zhí)行; 更新過程所限定的權值;相應的,步驟B所述依次更新至基礎索引中是將符合所述權值的增量索引更新至基礎索引; 不同時刻所對應的更新過程所限定的不同權值;相應的,步驟B所述依次更新至基礎索引中是將所述時刻符合所述權值的增量索引更新至基礎索引。
【文檔編號】G06F17/30GK104077379SQ201410295061
【公開日】2014年10月1日 申請日期:2014年6月25日 優(yōu)先權日:2014年6月25日
【發(fā)明者】管延軍, 蔣紅宇, 李文琦 申請人:北京海泰方圓科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1