基于數(shù)據(jù)缺失標記的信息檢索系統(tǒng)及方法
【專利摘要】本發(fā)明公開一種基于數(shù)據(jù)缺失標記的信息檢索系統(tǒng)及方法。根據(jù)本發(fā)明一個實施例的信息檢索系統(tǒng),包括:數(shù)據(jù)庫,包含數(shù)據(jù)被區(qū)分為多個數(shù)據(jù)塊而存儲的數(shù)據(jù)存儲區(qū)域、以及存儲各數(shù)據(jù)塊所對應的關(guān)鍵詞缺失信息的元數(shù)據(jù)區(qū)域;檢索器,從用戶處接收包含檢索對象關(guān)鍵詞以及檢索對象區(qū)間的關(guān)鍵詞檢索請求,并利用所請求的關(guān)鍵詞而檢索存儲于所述數(shù)據(jù)庫中的數(shù)據(jù);關(guān)鍵詞管理器,從所述檢索器接收基于關(guān)鍵詞檢索結(jié)果的關(guān)鍵詞缺失信息,并在所述數(shù)據(jù)庫中記錄所述關(guān)鍵詞缺失信息。
【專利說明】基于數(shù)據(jù)缺失標記的信息檢索系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明的實施例涉及一種大容量數(shù)據(jù)的高效的檢索技術(shù)。
【背景技術(shù)】
[0002]隨著電子商務、SNS(SocialNetworking Services,社會性網(wǎng)絡服務)、VoIP(Voiceover Internet Protocol,互聯(lián)網(wǎng)語音傳輸協(xié)議)服務等網(wǎng)絡服務系統(tǒng)的普遍化,開發(fā)出了用于有效地運用這些服務系統(tǒng)的多種模塊。對于服務系統(tǒng)而言,通常要對用戶的接入記錄、錯誤發(fā)生記錄等日志數(shù)據(jù)或者記錄有系統(tǒng)內(nèi)發(fā)生的事件的事件數(shù)據(jù)等進行儲存并管理。這種數(shù)據(jù)可被用來掌握服務系統(tǒng)或系統(tǒng)內(nèi)服務組件等的狀態(tài)并應對發(fā)生的問題,或者可以用來事先預測問題的發(fā)生。
[0003]隨著服務系統(tǒng)趨于復雜化、大型化且使用該系統(tǒng)的用戶的數(shù)量增加,服務系統(tǒng)中記錄的數(shù)據(jù)的容量也將增加。因此為了有效地加以利用,需要從大容量數(shù)據(jù)中迅速而高效地搜索出所要的關(guān)鍵詞。為此,現(xiàn)有技術(shù)中的數(shù)據(jù)管理系統(tǒng)利用了針對數(shù)據(jù)庫中經(jīng)常被檢索的特定行(row)或經(jīng)常被檢索的數(shù)據(jù)塊生成索引(index)的方式。然而事先預測用戶會經(jīng)常檢索哪些數(shù)據(jù)是一件非常困難的事,而且為了索引需要另外消耗硬件資源,因此這種方法尤其在面對大容量數(shù)據(jù)時存在效率低下的問題。
[0004]而且,最近為了管理大容量數(shù)據(jù),趨于利用非關(guān)系型數(shù)據(jù)庫(NoSQL)等非結(jié)構(gòu)化數(shù)據(jù)庫的,然而對于這種非結(jié)構(gòu)化數(shù)據(jù)庫而言,由于不支持對特定數(shù)據(jù)的自動索引,因此為了索引,不得不直接運用索引算法。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實施例的目的在于提供一種用于有效地檢索日志數(shù)據(jù)等大容量數(shù)據(jù)的方案。
[0006]根據(jù)本發(fā)明一個實施例的信息檢索系統(tǒng)包括:數(shù)據(jù)庫,包含數(shù)據(jù)被區(qū)分為多個數(shù)據(jù)塊而存儲的數(shù)據(jù)存儲區(qū)域、以及存儲各數(shù)據(jù)塊所對應的關(guān)鍵詞缺失信息的元數(shù)據(jù)區(qū)域;檢索器,從用戶處接收包含檢索對象關(guān)鍵詞以及檢索對象區(qū)間的關(guān)鍵詞檢索請求,并利用所請求的關(guān)鍵詞而檢索存儲于所述數(shù)據(jù)庫中的數(shù)據(jù);關(guān)鍵詞管理器,從所述檢索器接收基于關(guān)鍵詞檢索結(jié)果的關(guān)鍵詞缺失信息,并在所述數(shù)據(jù)庫中記錄所述關(guān)鍵詞缺失信息。
[0007]所述檢索器可從記錄于所述數(shù)據(jù)庫中的所述關(guān)鍵詞缺失信息中判斷出接收的檢索對象區(qū)間中是否存在關(guān)鍵詞缺失區(qū)間,且如果存在關(guān)鍵詞缺失區(qū)間,則可以在檢索對象區(qū)間當中除了所述關(guān)鍵詞缺失區(qū)間之外的其余區(qū)間內(nèi)利用檢索對象關(guān)鍵詞而對所述數(shù)據(jù)庫進行檢索。
[0008]所述關(guān)鍵詞管理器可接收從所述檢索器檢索到的關(guān)鍵詞的檢索區(qū)間、以及對應檢索區(qū)間內(nèi)的關(guān)鍵詞缺失信息,并可以將檢索到的所述關(guān)鍵詞缺失信息標記在對應于多個數(shù)據(jù)塊當中缺失關(guān)鍵詞的塊的元數(shù)據(jù)區(qū)域。
[0009]所述關(guān)鍵詞管理器可用于分別管理:關(guān)鍵詞歷史表,存儲在設(shè)定的期間內(nèi)從所述檢索器接收的關(guān)鍵詞;主過濾器,將存儲于所述關(guān)鍵詞歷史表中的關(guān)鍵詞的哈希值進行存儲;沖突關(guān)鍵詞歷史表,在從所述檢索器接收的關(guān)鍵詞中,將與已存儲于所述主過濾器中的關(guān)鍵詞發(fā)生沖突的關(guān)鍵詞進行存儲。
[0010]所述主過濾器可以是計數(shù)布隆過濾器(Counting Bloom Filter)。
[0011]所述關(guān)鍵詞管理器可通過從所述檢索器接收的關(guān)鍵詞計算設(shè)定的個數(shù)的互不相同的哈希值,且在所述主過濾器的各單元(cell)中對應于計算出的哈希值的單元的值均大于O時,可將接收到的關(guān)鍵詞存儲于所述沖突關(guān)鍵詞歷史表。
[0012]所述關(guān)鍵詞管理器在對應于計算出的哈希值的所述主過濾器的單元值中至少有一個為O時,可將對應于哈希值的所述主過濾器的單元值分別增加1,并將接收的關(guān)鍵詞存儲于所述關(guān)鍵詞歷史表。
[0013]所述關(guān)鍵詞管理器可將存儲于所述關(guān)鍵詞歷史表中的關(guān)鍵詞缺失信息標記于所述元數(shù)據(jù)區(qū)域。
[0014]所述關(guān)鍵詞管理器在存儲于所述關(guān)鍵詞歷史表中的特定關(guān)鍵詞在已設(shè)定的期間內(nèi)未被使用的情況下,可將對應于所述特定關(guān)鍵詞的哈希值的所述主過濾器的單元值減小1,并將所述特定關(guān)鍵詞從所述關(guān)鍵詞歷史表中刪除。
[0015]所述關(guān)鍵詞管理器在存儲于所述關(guān)鍵詞歷史表中的關(guān)鍵詞被刪除時,可將存儲于所述沖突關(guān)鍵詞歷史表的關(guān)鍵詞當中不會再與已存儲于所述主過濾器的關(guān)鍵詞發(fā)生沖突的關(guān)鍵詞刪除,并將從所述沖突關(guān)鍵詞歷史表中被刪除的關(guān)鍵詞登記于所述關(guān)鍵詞歷史表以及所述主過濾器。
[0016]所述檢索器可利用所述主過濾器而判斷是否標記檢索對象關(guān)鍵詞缺失信息,且在判斷出檢索對象關(guān)鍵詞缺失信息已標記于所述數(shù)據(jù)庫時,可通過檢索所述數(shù)據(jù)庫的元數(shù)據(jù)區(qū)域而獲取檢索對象關(guān)鍵詞缺失區(qū)間的信息。
[0017]另外,根據(jù)本發(fā)明一個實施例的信息檢索方法,包括如下步驟:在檢索器中,從用戶處接收包含檢索對象關(guān)鍵詞以及檢索對象區(qū)間的關(guān)鍵詞檢索請求;在所述檢索器中,利用所請求的關(guān)鍵詞而檢索存儲于數(shù)據(jù)庫中的數(shù)據(jù);在關(guān)鍵詞管理器中,將基于關(guān)鍵詞檢索結(jié)果的關(guān)鍵詞缺失信息記錄于所述數(shù)據(jù)庫。
[0018]在所述信息檢索方法中,在執(zhí)行所述的檢索數(shù)據(jù)的步驟之前,還可以包括如下步驟:在所述檢索器中,從記錄于所述數(shù)據(jù)庫的關(guān)鍵詞缺失信息中判斷接收的檢索對象區(qū)間中是否存在關(guān)鍵詞缺失區(qū)間,而且,在所述的檢索數(shù)據(jù)的步驟中,如果進行所述判斷的結(jié)果為存在關(guān)鍵詞缺失區(qū)間,則可以在所述檢索對象區(qū)間當中除了關(guān)鍵詞缺失區(qū)間之外的其余區(qū)間內(nèi)利用所述檢索對象關(guān)鍵詞而對所述數(shù)據(jù)庫進行檢索。
[0019]在所述的記錄關(guān)鍵詞缺失信息的步驟中,還可以包括如下步驟:從所述檢索器接收關(guān)鍵詞檢索區(qū)間以及檢索結(jié)果;判斷接收的關(guān)鍵詞是否與已存儲于主過濾器中的關(guān)鍵詞發(fā)生沖突;根據(jù)所述判斷的結(jié)果而將關(guān)鍵詞存儲于關(guān)鍵詞歷史表或沖突關(guān)鍵詞歷史表中。
[0020]所述主過濾器可以是計數(shù)布隆過濾器(Counting Bloom Filter)。
[0021]在所述的判斷是否發(fā)生沖突的步驟中,可通過從所述檢索器接收到的關(guān)鍵詞計算設(shè)定個數(shù)的互不相同的哈希值,并可以根據(jù)所述主過濾器的各單元中對應于計算出的哈希值的單元的值是否均為大于O的值而判斷所述關(guān)鍵詞是否與存儲于所述主過濾器中的關(guān)鍵詞發(fā)生沖突。
[0022]在所述的存儲關(guān)鍵詞的步驟中,如果判斷是否發(fā)生所述沖突的結(jié)果為對應于計算出的哈希值的所述主過濾器的單元值中至少有一個為0,則可以將對應于所述哈希值的所述主過濾器的單元值分別增加1,并將接收到的關(guān)鍵詞存儲于所述關(guān)鍵詞歷史表。
[0023]在所述的儲存關(guān)鍵詞的步驟中,如果判斷是否發(fā)生所述沖突的結(jié)果為對應于計算出的哈希值的所述主過濾器的單元值均大于0,則可以將接收到的關(guān)鍵詞存儲于所述沖突關(guān)鍵詞歷史表。
[0024]所述信息檢索方法在執(zhí)行完所述的記錄關(guān)鍵詞缺失信息的步驟之后,還可以包括如下步驟:如果存儲于所述關(guān)鍵詞歷史表中的特定關(guān)鍵詞在已設(shè)定的期間內(nèi)未被使用,便將對應于所述特定關(guān)鍵詞的哈希值的所述主過濾器的單元值減小1,并將所述特定關(guān)鍵詞從所述關(guān)鍵詞歷史表中刪除。
[0025]在所述的將特定關(guān)鍵詞從關(guān)鍵詞歷史表中刪除的步驟中,可將存儲于所述沖突關(guān)鍵詞歷史表的關(guān)鍵詞中不再與已存儲于所述主過濾器中的關(guān)鍵詞發(fā)生沖突的關(guān)鍵詞予以刪除,并將從所述沖突關(guān)鍵詞歷史表中刪除的關(guān)鍵詞登記于所述關(guān)鍵詞歷史表以及主過濾器。
[0026]根據(jù)本發(fā)明的實施例,利用已執(zhí)行的檢索結(jié)果而對數(shù)據(jù)庫內(nèi)的特定關(guān)鍵詞缺失區(qū)間進行標記,從而可以使檢索關(guān)鍵詞時的執(zhí)行檢索的區(qū)間最小化,由此具有可提聞檢索效率的優(yōu)點。
[0027]并且,在執(zhí)行所述數(shù)據(jù)缺失區(qū)間標記時,對于與已經(jīng)標記的關(guān)鍵詞發(fā)生沖突的關(guān)鍵詞進行單獨的管理,從而可以在檢索缺失區(qū)間時事先防止正誤的發(fā)生。
【專利附圖】
【附圖說明】
[0028]圖1為用于說明根據(jù)本發(fā)明一個實施例的信息檢索系統(tǒng)100的模塊圖。
[0029]圖2為表示根據(jù)本發(fā)明一個實施例的數(shù)據(jù)庫102的詳細構(gòu)成的模塊圖。
[0030]圖3為表示根據(jù)本發(fā)明一個實施例的檢索器104的詳細構(gòu)成的模塊圖。
[0031]圖4為表示根據(jù)本發(fā)明一個實施例的關(guān)鍵詞管理器106的詳細構(gòu)成的模塊圖。
[0032]圖5為用于說明在根據(jù)本發(fā)明一個實施例的關(guān)鍵詞管理器106中添加新的關(guān)鍵詞的過程500的順序圖。
[0033]圖6為舉例表示根據(jù)本發(fā)明一個實施例的主過濾器的圖。
[0034]圖7為舉例表示在圖6所示主過濾器中添加了新的關(guān)鍵詞的狀態(tài)的圖。
[0035]圖8為用于說明在根據(jù)本發(fā)明一個實施例的關(guān)鍵詞管理器106中刪除關(guān)鍵詞的過程800的順序圖。
[0036]圖9為舉例表示從圖7所示主過濾器中刪除了特定關(guān)鍵詞的狀態(tài)的圖。
[0037]圖10為用于說明根據(jù)本發(fā)明一個實施例的關(guān)鍵詞檢索及元數(shù)據(jù)更新過程1000的順序圖。
[0038]圖11為用于說明根據(jù)本發(fā)明一個實施例的利用了關(guān)鍵詞缺失信息的關(guān)鍵詞檢索過程1100的順序圖。
[0039]符號說明:
[0040]100:信息檢索系統(tǒng)102:數(shù)據(jù)庫
[0041]104:檢索器106:關(guān)鍵詞管理器
[0042]200:數(shù)據(jù)存儲區(qū)域202:元數(shù)據(jù)區(qū)域
[0043]300:關(guān)鍵詞檢索單元302:元數(shù)據(jù)檢索單元
[0044]304:關(guān)鍵詞信息登記及查詢單元400:關(guān)鍵詞信息管理單元
[0045]402:元數(shù)據(jù)管理單元
【具體實施方式】
[0046]以下,參照附圖對本發(fā)明的具體實施形態(tài)進行說明。然而這僅僅是示例,本發(fā)明并不局限于此。
[0047]在對本發(fā)明進行說明時,如果認為對有關(guān)本發(fā)明的公知技術(shù)的具體說明有可能對本發(fā)明的主旨造成不必要的混亂,則省略其詳細說明。而且,后述的術(shù)語均為考慮本發(fā)明中的功能而定義的,可能因使用者、運用者的意圖或習慣等而不同。因此要以整個說明書的內(nèi)容為基礎(chǔ)對其進行定義。
[0048]本發(fā)明的技術(shù)思想由權(quán)利要求書確定,以下的實施例只是用于將本發(fā)明的技術(shù)思想有效地說明給本發(fā)明所屬【技術(shù)領(lǐng)域】中具有普通知識的人員的一種方式。
[0049]圖1為用于說明根據(jù)本發(fā)明一個實施例的信息檢索系統(tǒng)100的模塊圖。如圖所示,根據(jù)本發(fā)明一個實施例的信息檢索系統(tǒng)100包括數(shù)據(jù)庫102、檢索器104、以及關(guān)鍵詞管理器 106。
[0050]數(shù)據(jù)庫102存儲作為檢索對象的數(shù)據(jù)。在本發(fā)明的實施例中,存儲于數(shù)據(jù)庫102中的所述數(shù)據(jù)例如可以是在互聯(lián)網(wǎng)上提供VoIP (Voice over Internet Protocol,互聯(lián)網(wǎng)語音傳輸協(xié)議)等服務的服務系統(tǒng)運行時產(chǎn)生的接入記錄、出錯詳情等日志(log)信息或事件信息。然而,本發(fā)明的實施例并不局限于特定類型的數(shù)據(jù),須知本發(fā)明適用于任何類型的數(shù)據(jù)。數(shù)據(jù)庫102可以由非關(guān)系型數(shù)據(jù)庫(NoSQL)等非結(jié)構(gòu)化數(shù)據(jù)庫構(gòu)成,然而也可以與之不同而由關(guān)系型數(shù)據(jù)庫(RDBMS)等構(gòu)成。
[0051]檢索器104從用戶處接收關(guān)鍵詞檢索請求,并利用包含于所述關(guān)鍵詞檢索請求中的檢索對象關(guān)鍵詞而檢索存儲于數(shù)據(jù)庫102中的數(shù)據(jù)。所述關(guān)鍵詞例如可以是包含于存儲在數(shù)據(jù)庫102的日志消息或事件消息中的重要的消息文本、作為主要監(jiān)控對象事先登記的用戶賬戶(ID)等。
[0052]并且,所述關(guān)鍵詞檢索請求在所述檢索對象關(guān)鍵詞之外還可以一并包括用于檢索出檢索對象關(guān)鍵詞的檢索對象區(qū)間。例如,所述用戶可以對最近七天之內(nèi)存儲到數(shù)據(jù)庫102的數(shù)據(jù)中是否包含特定出錯消息(例如“DBError”等消息)、或是否有特定人的接入記錄(例如ID為“ABC”的用戶的連接登錄)的情況提出檢索請求。
[0053]關(guān)鍵詞管理器106根據(jù)檢索器104中執(zhí)行的關(guān)鍵詞檢索結(jié)果而從檢索器104接收關(guān)鍵詞缺失信息,并在數(shù)據(jù)庫102中記錄所述關(guān)鍵詞缺失信息。例如,根據(jù)用戶的檢索請求進行檢索的結(jié)果,如果“DBError”消息只在作為檢索期間的最近七天中的第一天出現(xiàn),則檢索器104便將告知其余六天內(nèi)沒有出現(xiàn)“DBError”消息的消息(關(guān)鍵詞缺失信息)傳送給關(guān)鍵詞管理器106,而關(guān)鍵詞管理器106可將接收的關(guān)鍵詞缺失信息記錄于數(shù)據(jù)庫102中。
[0054]在本發(fā)明的實施例中,與所述關(guān)鍵詞缺失信息相關(guān)的消息可以構(gòu)成為多種形態(tài)。例如,檢索器104既可以將基于關(guān)鍵詞檢索結(jié)果的檢索結(jié)果以及檢索區(qū)間原樣地傳送給關(guān)鍵詞管理器106,也可以從所述檢索結(jié)果以及檢索區(qū)間計算出關(guān)鍵詞缺失區(qū)間并傳送給關(guān)鍵詞管理器106。
[0055]如果基于檢索的關(guān)鍵詞的檢索結(jié)果的缺失信息被記錄于數(shù)據(jù)庫102中,則檢索器104在之后遇到對同一關(guān)鍵詞的檢索請求時,可參照記錄于數(shù)據(jù)庫102中的關(guān)鍵詞缺失信息而將記錄有數(shù)據(jù)缺失信息的區(qū)間除外之后執(zhí)行對請求的關(guān)鍵詞的檢索。例如,當從用戶處再次接收到針對“DBError”關(guān)鍵詞的檢索請求時,檢索器104利用記錄于數(shù)據(jù)庫102中的關(guān)鍵詞缺失信息而判斷接收的檢索對象區(qū)間內(nèi)是否存在關(guān)鍵詞缺失區(qū)間,且如果存在關(guān)鍵詞缺失區(qū)間,便在除了該區(qū)間之外的其余區(qū)間內(nèi)進行對檢索對象關(guān)鍵詞的檢索。由此,根據(jù)本發(fā)明的實施例,尤其對于經(jīng)常檢索的關(guān)鍵詞而言,檢索重復得越多,越能提高數(shù)據(jù)檢索的速度。
[0056]圖2為表示根據(jù)本發(fā)明一個實施例的數(shù)據(jù)庫102的詳細構(gòu)成的模塊圖。如圖所示,根據(jù)本發(fā)明一個實施例的數(shù)據(jù)庫102構(gòu)成為包括數(shù)據(jù)存儲區(qū)域200以及元數(shù)據(jù)區(qū)域202。
[0057]數(shù)據(jù)存儲區(qū)域200為用于存儲作為檢索對象的數(shù)據(jù)的區(qū)域。數(shù)據(jù)存儲區(qū)域200可被構(gòu)成為將所述數(shù)據(jù)劃分為多個數(shù)據(jù)塊而存儲。例如,可將數(shù)據(jù)存儲區(qū)域200構(gòu)成為根據(jù)數(shù)據(jù)的產(chǎn)生時間點而按照日或周等時間單位將其劃分,并將劃分的數(shù)據(jù)分別存儲于不同的數(shù)據(jù)塊。
[0058]元數(shù)據(jù)區(qū)域202為用于將存儲于數(shù)據(jù)存儲區(qū)域200中的數(shù)據(jù)的關(guān)鍵詞所對應的缺失信息進行存儲的區(qū)域。如前所述,數(shù)據(jù)存儲區(qū)域200可將數(shù)據(jù)劃分為多個塊而存儲,且在此情況下,元數(shù)據(jù)區(qū)域202可按照劃分的各數(shù)據(jù)塊分別存儲關(guān)鍵詞缺失信息。即,如果參照元數(shù)據(jù)區(qū)域202,則可以輕易地識別出沒有存儲待檢索的數(shù)據(jù)的數(shù)據(jù)塊。在一個實施例中,元數(shù)據(jù)區(qū)域202可對各數(shù)據(jù)塊分別應用布隆過濾器(Bloom Filter)而存儲各數(shù)據(jù)塊所對應的關(guān)鍵詞缺失信息,然而本發(fā)明并不局限于用于存儲關(guān)鍵詞缺失信息的特定數(shù)據(jù)結(jié)構(gòu)。
[0059]圖3為表示根據(jù)本發(fā)明一個實施例的檢索器104的詳細構(gòu)成的模塊圖。如圖所示,根據(jù)本發(fā)明一個實施例的檢索器104包括關(guān)鍵詞檢索單元300、元數(shù)據(jù)檢索單元302、關(guān)鍵詞信息登記及查詢單元304。
[0060]關(guān)鍵詞檢索單元300從用戶處接收關(guān)鍵詞檢索請求,并根據(jù)所述關(guān)鍵詞檢索請求而利用一個以上的關(guān)鍵詞來執(zhí)行針對數(shù)據(jù)庫102的數(shù)據(jù)存儲區(qū)域200的檢索,并將檢索結(jié)果返回給所述用戶。
[0061]元數(shù)據(jù)檢索單元302對數(shù)據(jù)庫102的元數(shù)據(jù)區(qū)域202進行檢索而判斷所請求的關(guān)鍵詞的檢索對象區(qū)間內(nèi)是否有缺失對應關(guān)鍵詞的區(qū)間(關(guān)鍵詞缺失區(qū)間)存在。如果對元數(shù)據(jù)區(qū)域202進行檢索的結(jié)果發(fā)現(xiàn)檢索對象區(qū)間當中存在對應的關(guān)鍵詞缺失區(qū)間,則關(guān)鍵詞檢索單元300只對除了所述缺失區(qū)間之外的其余區(qū)間執(zhí)行針對于對應關(guān)鍵詞的檢索。
[0062]關(guān)鍵詞信息登記及查詢單元304將包含關(guān)鍵詞檢索單元300中執(zhí)行的檢索結(jié)果的關(guān)鍵詞信息登記于后述的關(guān)鍵詞管理器106中。并且,關(guān)鍵詞信息登記及查詢單元304在接收到關(guān)鍵詞檢索請求時,向關(guān)鍵詞管理器106詢問所接收的檢索對象關(guān)鍵詞的信息,并接收相應的結(jié)果。與關(guān)鍵詞信息的登記及詢問(查詢)相關(guān)的詳細構(gòu)成將在后面敘述。
[0063]圖4為表示根據(jù)本發(fā)明一個實施例的關(guān)鍵詞管理器104的詳細構(gòu)成的模塊圖。如圖所示,根據(jù)本發(fā)明一個實施例的關(guān)鍵詞管理器106包括關(guān)鍵詞信息管理單元400以及元數(shù)據(jù)管理單元402。
[0064]關(guān)鍵詞信息管理單元400存儲從關(guān)鍵詞信息登記及查詢單元304接收的關(guān)鍵詞信息。而且,關(guān)鍵詞信息管理單元400在從關(guān)鍵詞信息登記及查詢單元304接收到對關(guān)鍵詞信息的請求時,提供對應于有關(guān)請求的關(guān)鍵詞信息。并且,元數(shù)據(jù)管理單元402將從關(guān)鍵詞信息管理單元400接收的各關(guān)鍵詞的缺失信息標記(Marking)于數(shù)據(jù)庫102的元數(shù)據(jù)區(qū)域202。
[0065]在本發(fā)明的實施例中,關(guān)鍵詞信息是指對于當前正在用于數(shù)據(jù)庫102的關(guān)鍵詞的一種歷史信息。即,對于日志數(shù)據(jù)等而言,由于具有最新數(shù)據(jù)比以前的數(shù)據(jù)查詢得更多、更頻繁的特點,因此通過存儲當前時間點經(jīng)常被檢索的關(guān)鍵詞的信息而可以實現(xiàn)更為高效的檢索。
[0066]在一個實施例中,關(guān)鍵詞信息管理單元400為了管理關(guān)鍵詞信息而可以利用包括關(guān)鍵詞歷史表、主過濾器、以及沖突關(guān)鍵詞歷史表的三個數(shù)據(jù)結(jié)構(gòu)。
[0067]首先,關(guān)鍵詞歷史表為用于存儲在預定期間內(nèi)通過檢索器104接收的關(guān)鍵詞的數(shù)據(jù)結(jié)構(gòu)。例如,可以將關(guān)鍵詞歷史表構(gòu)成為存儲最近七天內(nèi)通過檢索器104接收的關(guān)鍵詞。在不同的實施例中,所述關(guān)鍵詞歷史表不僅可以包括最近檢索的關(guān)鍵詞,還可以一并包括過去的檢索關(guān)鍵詞。例如,關(guān)鍵詞歷史表可包括多個塊,其中可以在第一個塊中存儲最近期間(例如最近七天)的檢索關(guān)鍵詞,在第二個塊中存儲其之前期間(8?14日)的檢索關(guān)鍵詞,而在第三個塊中存儲其之前期間(15?21日)的檢索關(guān)鍵詞。在此情況下,存儲于第一個塊中的關(guān)鍵詞可以認為是當前頻繁地被檢索出的關(guān)鍵詞。
[0068]主過濾器為用于將存儲于所述關(guān)鍵詞歷史表中的關(guān)鍵詞的哈希值進行存儲的過濾器。所述主過濾器例如可以利用計數(shù)布隆過濾器(Counting Bloom Filter)實現(xiàn)。如前所述,如果關(guān)鍵詞歷史表連過去檢索過的關(guān)鍵詞也一并包括,則主過濾器可以只存儲其中的在最近期間內(nèi)檢索到的關(guān)鍵詞。如果存儲于所述主過濾器中的關(guān)鍵詞在預定期間內(nèi)未被使用,則可以將對應關(guān)鍵詞從所述主過濾器刪除。
[0069]沖突關(guān)鍵詞歷史表為用于存儲從檢索器104接收到的關(guān)鍵詞當中與已存儲于主過濾器的關(guān)鍵詞發(fā)生沖突的關(guān)鍵詞的數(shù)據(jù)結(jié)構(gòu)。具體而言,關(guān)鍵詞信息管理單元400在從檢索器104接收到關(guān)鍵詞時,首先判斷是否可以將對應關(guān)鍵詞存儲于主過濾器,且在可以存儲于主過濾器時將對應關(guān)鍵詞存儲于關(guān)鍵詞歷史表,而在不能存儲時存儲于沖突關(guān)鍵詞歷史表。
[0070]以下參照圖5?圖9而對利用所述關(guān)鍵詞歷史表、主過濾器、以及沖突關(guān)鍵詞歷史表的關(guān)鍵詞的添加以及刪除過程進行說明。
[0071]圖5為用于說明在根據(jù)本發(fā)明一個實施例的關(guān)鍵詞管理器106中添加新的關(guān)鍵詞的過程500的順序圖。首先,如果從檢索器104新收到之前沒有使用的關(guān)鍵詞(502),則關(guān)鍵詞管理器106的關(guān)鍵詞信息管理單元400將預先設(shè)定的個數(shù)的互不相同的哈希函數(shù)應用于所接收的關(guān)鍵詞而計算出多個哈希值(504),并根據(jù)對應于計算出的各哈希值的主過濾器的各單元值而確定是否可以將接收的所述關(guān)鍵詞添加到主過濾器(508)。
[0072]例如,假定通過檢索器104新收到之前未曾存儲于關(guān)鍵詞信息管理單元400的新的關(guān)鍵詞“abc”。關(guān)鍵詞信息管理單元400對接收到的關(guān)鍵詞“abc”應用多個互不相同的哈希函數(shù)而計算出多個哈希值。例如,假設(shè)對所述關(guān)鍵詞應用互不相同的三個哈希函數(shù)而得的結(jié)果分別為3、6、100。則關(guān)鍵詞信息管理單元400在分別讀取已存儲于主過濾器的第三個、第六個、第一百個單元(cell)中的值之后,根據(jù)各單元的值是否分別大于O而確定是否可以將接收的所述關(guān)鍵詞添加到主過濾器。
[0073]具體而言,關(guān)鍵詞信息管理單元400在對應于計算出的哈希值的主過濾器的單元值中至少有一個為O時,將對應于哈希值的主過濾器的單元值分別增加I而將對應關(guān)鍵詞存儲于主過濾器(510)。
[0074]圖6和圖7舉例表示關(guān)鍵詞信息管理單元400中的主過濾器更新過程。在圖中,各四邊形表示主過濾器的各單元,四邊形內(nèi)部的數(shù)字表示各單元的值,而下方的數(shù)字表示各單元的序列號。例如,如圖6所示,如果主過濾器的第三個、第六個、第一百個單元的值分別為1、0、2,則關(guān)鍵詞信息管理單元400將如圖7所示地將對應于哈希值的各單元的值分別增加I。即,在此情況下,主過濾器的第三個、第六個、第一百個單元的值分別成為2、1、3。
[0075]而且,在如上所述地將新的關(guān)鍵詞添加到主過濾器的情況下,關(guān)鍵詞信息管理單元400將新添加的關(guān)鍵詞儲存于關(guān)鍵詞歷史表(512)。
[0076]與此相反,如果主過濾器的各單元(cell)當中對應于計算出的哈希值的單元的值均大于0,則關(guān)鍵詞信息管理單元400將無法在主過濾器中添加對應關(guān)鍵詞。之所以出現(xiàn)這種情況是因為這是一種即使在布隆過濾器或計數(shù)布隆過濾器中不添加對應關(guān)鍵詞也會在詢問對應關(guān)鍵詞時返回得到肯定(True)的情形(即,對于對應關(guān)鍵詞出現(xiàn)了正誤(positivefalse))。因此在這種情況下,關(guān)鍵詞信息管理單元400將對應關(guān)鍵詞存儲于沖突關(guān)鍵詞歷史表中(514)。
[0077]如果通過這種過程而將新的關(guān)鍵詞存儲于關(guān)鍵詞歷史表或沖突關(guān)鍵詞歷史表中的某一個中,則元數(shù)據(jù)管理單元402最終地將新儲存的關(guān)鍵詞的缺失信息標記于數(shù)據(jù)庫102的元數(shù)據(jù)區(qū)域202中,從而更新元數(shù)據(jù)區(qū)域202 (516)。
[0078]在本發(fā)明的實施例中之所以在主過濾器以外對專門的沖突關(guān)鍵詞歷史表進行管理有如下原因。如前所述,對于主過濾器而言,將計數(shù)布隆過濾器利用為數(shù)據(jù)結(jié)構(gòu),其存在即使實際上沒有存儲關(guān)鍵詞也返回得到對于關(guān)鍵詞詢問的肯定(True)(即出現(xiàn)正誤)的可能性。然而在本發(fā)明中計數(shù)布隆過濾器并非用于表示特定關(guān)鍵詞的存在而是用于表示“缺失”,問題可能出現(xiàn)于此。即,由于作為計數(shù)布隆過濾器的特性的正誤,實際上存在關(guān)鍵詞的區(qū)間可能被誤判為關(guān)鍵詞缺失區(qū)間,而在此情況下,由于對被誤判為缺失區(qū)間的區(qū)間根本不去執(zhí)行關(guān)鍵詞的檢索,因此存在檢索結(jié)果歪曲事實的可能性。因此在本發(fā)明中將與已存儲的關(guān)鍵詞發(fā)生沖突而不能添加的關(guān)鍵詞另行儲存于沖突關(guān)鍵詞歷史表,從而預先防止了正誤的發(fā)生。
[0079]圖8為用于說明根據(jù)本發(fā)明一個實施例的在關(guān)鍵詞管理器106中刪除關(guān)鍵詞的過程800的順序圖。
[0080]關(guān)鍵詞管理器106的關(guān)鍵詞信息管理單元400將存儲于關(guān)鍵詞歷史表的特定關(guān)鍵詞中的、在已設(shè)定的期間內(nèi)未被使用的關(guān)鍵詞指定為刪除對象關(guān)鍵詞,并由所述刪除對象關(guān)鍵詞計算多個哈希值(802)。然后,關(guān)鍵詞管理器106提取對應于計算出的哈希值的主過濾器的各單元值(804),并根據(jù)各單元值的大小判斷是否可以刪除對應關(guān)鍵詞(806)。
[0081]只要提取的主過濾器的單元值當中有任何一個取值為O的單元,則是不能將對應關(guān)鍵詞從主過濾器中刪除的情形,因此關(guān)鍵詞信息管理單元400將輸出告知不能刪除對應關(guān)鍵詞的報錯消息(808)。但如果與此相反而提取的主過濾器的單元值均大于0,則關(guān)鍵詞信息管理單元400將對應于計算出的哈希值的主過濾器的單元值減少1,從而將所述刪除對象關(guān)鍵詞從關(guān)鍵詞歷史表中刪除(810)。圖9舉例表示了通過這種過程而從如圖7所示的主過濾器中刪除關(guān)鍵詞“abc”的狀態(tài)。即,關(guān)鍵詞信息管理單元400將對應于關(guān)鍵詞“abc”的主過濾器的第三個、第六個、第一百個單元值從2、1、3減小為1、0、2。
[0082]另外,在此情況下,關(guān)鍵詞信息管理單元400在從主過濾器中刪除關(guān)鍵詞時,將存儲于沖突關(guān)鍵詞歷史表的關(guān)鍵詞當中將由于刪除所述關(guān)鍵詞而不會再發(fā)生沖突的關(guān)鍵詞從沖突關(guān)鍵詞歷史表中刪除,并可以重新添加到主過濾器(812)。
[0083]圖10為用于說明根據(jù)本發(fā)明一個實施例的關(guān)鍵詞檢索及元數(shù)據(jù)更新過程1000的順序圖。
[0084]首先,檢索器104利用從用戶處接收的檢索對象關(guān)鍵詞以及檢索對象區(qū)間信息而向數(shù)據(jù)庫102傳送關(guān)鍵詞檢索詢問(1002),而數(shù)據(jù)庫102根據(jù)接收的關(guān)鍵詞檢索詢問執(zhí)行檢索之后反饋檢索結(jié)果(1004)。
[0085]然后,檢索器104將基于接收的所述檢索結(jié)果的關(guān)鍵詞缺失信息傳送給關(guān)鍵詞管理器106 (1006),而關(guān)鍵詞管理器106根據(jù)接收的所述關(guān)鍵詞缺失信息而將關(guān)鍵詞缺失信息標記于數(shù)據(jù)庫102的元數(shù)據(jù)區(qū)域202 (1008)。
[0086]圖11為用于說明利用根據(jù)本發(fā)明一個實施例的關(guān)鍵詞缺失信息的關(guān)鍵詞檢索過程1100的順序圖。
[0087]首先,檢索器104從用戶處接收包含檢索對象關(guān)鍵詞以及檢索對象區(qū)間的關(guān)鍵詞檢索請求,并向關(guān)鍵詞管理器106詢問包含于接收的所述檢索請求中的檢索對象關(guān)鍵詞的信息(I 102)。
[0088]接收到所述詢問的關(guān)鍵詞管理器106通過搜索判斷接收的檢索對象關(guān)鍵詞是否儲存于主過濾器與沖突關(guān)鍵詞歷史表中的某一個當中,并將所述搜索的結(jié)果傳送給檢索器104 (1104)。
[0089]如果所述詢問的結(jié)果得知對應檢索對象關(guān)鍵詞存儲于主過濾器中,則檢索器104便通過搜索數(shù)據(jù)庫102的元數(shù)據(jù)區(qū)域202而檢索出對應的關(guān)鍵詞缺失區(qū)間,從而獲取檢索對象關(guān)鍵詞缺失區(qū)間的信息(1106,1108),并在除了獲取的缺失區(qū)間之外的其余區(qū)間執(zhí)行對檢索對象關(guān)鍵詞的檢索(1110,1112)。S卩,由于這一情形為對應關(guān)鍵詞缺失的信息標記于數(shù)據(jù)庫102的情形,因此利用元數(shù)據(jù)而只在除了缺失區(qū)間之外的其余區(qū)間執(zhí)行檢索。
[0090]然而,對于對應檢索關(guān)鍵詞沒有存儲于沖突關(guān)鍵詞歷史表中或者關(guān)鍵詞管理器106中的情況而言,由于其屬于因沖突而無法標記對應關(guān)鍵詞或者之前沒有檢索歷史的情形,因此檢索器104將在整個檢索對象區(qū)間執(zhí)行針對檢索對象關(guān)鍵詞的檢索。
[0091]另外,本發(fā)明的實施例中可以包括記錄有用于在計算機上執(zhí)行本說明書中記載的方法的程序的計算機可讀記錄介質(zhì)。計算機可讀記錄介質(zhì)既可以單獨包括程序命令、本地數(shù)據(jù)文件、本地數(shù)據(jù)結(jié)構(gòu)等,也可以包括它們的組合。介質(zhì)可以是為了本發(fā)明而特別設(shè)計并構(gòu)成的,也可以是計算機軟件領(lǐng)域中具有普通知識的人員所公知而可以使用的。計算機可讀記錄介質(zhì)之例中包括硬盤、軟盤以及磁帶之類的磁介質(zhì);CD-R0M (只讀光盤)、DVD之類的光記錄介質(zhì);軟盤之類的磁光介質(zhì);以及ROM (只讀存儲器)、RAM (隨機存儲器)、閃存等為了存儲并執(zhí)行程序命令而特別構(gòu)成的硬件裝置。程序命令之例中不僅可以包括通過編譯器制作的機器語言代碼,而且還可以包括使用解釋器等而通過計算機執(zhí)行的高級語言代碼。
[0092]以上通過代表性實施例對本發(fā)明進行了詳細說明,然而不難理解只要是本發(fā)明所屬【技術(shù)領(lǐng)域】中具有普通知識的人員即可在不脫離本發(fā)明范圍的限度內(nèi)對所述的實施例進行多種變形。
[0093]因此本發(fā)明的權(quán)利范圍不能局限于所述的實施例而進行確定,而是要根據(jù)權(quán)利要求書及其等價內(nèi)容來確定。
【權(quán)利要求】
1.一種信息檢索系統(tǒng),包括: 數(shù)據(jù)庫,包含數(shù)據(jù)被區(qū)分為多個數(shù)據(jù)塊而存儲的數(shù)據(jù)存儲區(qū)域、以及存儲各數(shù)據(jù)塊所對應的關(guān)鍵詞缺失信息的元數(shù)據(jù)區(qū)域; 檢索器,從用戶處接收包含檢索對象關(guān)鍵詞以及檢索對象區(qū)間的關(guān)鍵詞檢索請求,并利用所請求的關(guān)鍵詞而檢索存儲于所述數(shù)據(jù)庫中的數(shù)據(jù); 關(guān)鍵詞管理器,從所述檢索器接收基于關(guān)鍵詞檢索結(jié)果的關(guān)鍵詞缺失信息,并在所述數(shù)據(jù)庫中記錄所述關(guān)鍵詞缺失信息。
2.如權(quán)利要求1所述的信息檢索系統(tǒng),其中,所述檢索器從記錄于所述數(shù)據(jù)庫中的所述關(guān)鍵詞缺失信息中判斷出接收的檢索對象區(qū)間中是否存在關(guān)鍵詞缺失區(qū)間,且如果存在關(guān)鍵詞缺失區(qū)間,則在檢索對象區(qū)間當中除了所述關(guān)鍵詞缺失區(qū)間之外的其余區(qū)間內(nèi)利用檢索對象關(guān)鍵詞而對所述數(shù)據(jù)庫進行檢索。
3.如權(quán)利要求1所述的信息檢索系統(tǒng),其中,所述關(guān)鍵詞管理器接收從所述檢索器檢索到的關(guān)鍵詞的檢索區(qū)間、以及對應檢索區(qū)間內(nèi)的關(guān)鍵詞缺失信息,并將檢索到的所述關(guān)鍵詞缺失信息標記在對應于多個數(shù)據(jù)塊當中缺失關(guān)鍵詞的塊的元數(shù)據(jù)區(qū)域。
4.如權(quán)利要求3所述的信息檢索系統(tǒng),其中,所述關(guān)鍵詞管理器用于分別管理: 關(guān)鍵詞歷史表,存儲在設(shè)定的期間內(nèi)從所述檢索器接收的關(guān)鍵詞; 主過濾器,將存儲于所述關(guān)鍵詞歷史表中的關(guān)鍵詞的哈希值進行存儲; 沖突關(guān)鍵詞歷史表,在從所述檢索器接收的關(guān)鍵詞中,將與已存儲于所述主過濾器中的關(guān)鍵詞發(fā)生沖突的關(guān)鍵詞進行存儲。
5.如權(quán)利要求4所述的信息檢索系統(tǒng),其中,所述主過濾器為計數(shù)布隆過濾器。
6.如權(quán)利要求5所述的信息檢索系統(tǒng),其中,所述關(guān)鍵詞管理器通過從所述檢索器接收的關(guān)鍵詞計算設(shè)定的個數(shù)的互不相同的哈希值,且在所述主過濾器的各單元中對應于計算出的哈希值的單元的值均大于O時,將接收到的關(guān)鍵詞存儲于所述沖突關(guān)鍵詞歷史表。
7.如權(quán)利要求6所述的信息檢索系統(tǒng),其中,所述關(guān)鍵詞管理器在對應于計算出的哈希值的所述主過濾器的單元值中至少有一個為O時,將對應于哈希值的所述主過濾器的單元值分別增加1,并將接收的關(guān)鍵詞存儲于所述關(guān)鍵詞歷史表。
8.如權(quán)利要求7所述的信息檢索系統(tǒng),其中,所述關(guān)鍵詞管理器將存儲于所述關(guān)鍵詞歷史表中的關(guān)鍵詞缺失信息標記于所述元數(shù)據(jù)區(qū)域。
9.如權(quán)利要求5所述的信息檢索系統(tǒng),其中,所述關(guān)鍵詞管理器在存儲于所述關(guān)鍵詞歷史表中的特定關(guān)鍵詞在已設(shè)定的期間內(nèi)未被使用的情況下,將對應于所述特定關(guān)鍵詞的哈希值的所述主過濾器的單元值減小1,并將所述特定關(guān)鍵詞從所述關(guān)鍵詞歷史表中刪除。
10.如權(quán)利要求9所述的信息檢索系統(tǒng),其中,所述關(guān)鍵詞管理器在存儲于所述關(guān)鍵詞歷史表中的關(guān)鍵詞被刪除時,將存儲于所述沖突關(guān)鍵詞歷史表的關(guān)鍵詞當中不會再與已存儲于所述主過濾器的關(guān)鍵詞發(fā)生沖突的關(guān)鍵詞刪除,并將從所述沖突關(guān)鍵詞歷史表中被刪除的關(guān)鍵詞登記于所述關(guān)鍵詞歷史表以及所述主過濾器。
11.如權(quán)利要求4所述的信息檢索系統(tǒng),其中,所述檢索器利用所述主過濾器而判斷是否標記檢索對象關(guān)鍵詞缺失信息,且在判斷出檢索對象關(guān)鍵詞缺失信息已標記于所述數(shù)據(jù)庫時,通過檢索所述數(shù)據(jù)庫的元數(shù)據(jù)區(qū)域而獲取檢索對象關(guān)鍵詞缺失區(qū)間的信息。
12.一種信息檢索方法,包括如下步驟: 在檢索器中,從用戶處接收包含檢索對象關(guān)鍵詞以及檢索對象區(qū)間的關(guān)鍵詞檢索請求; 在所述檢索器中,利用所請求的關(guān)鍵詞而檢索存儲于數(shù)據(jù)庫中的數(shù)據(jù); 在關(guān)鍵詞管理器中,將基于關(guān)鍵詞檢索結(jié)果的關(guān)鍵詞缺失信息記錄于所述數(shù)據(jù)庫。
13.如權(quán)利要求12所述的信息檢索方法,其中,在執(zhí)行所述的檢索數(shù)據(jù)的步驟之前,還包括如下步驟: 在所述檢索器中,從記錄于所述數(shù)據(jù)庫的關(guān)鍵詞缺失信息中判斷接收的檢索對象區(qū)間中是否存在關(guān)鍵詞缺失區(qū)間, 而且,在所述的檢索數(shù)據(jù)的步驟中,如果進行所述判斷的結(jié)果為存在關(guān)鍵詞缺失區(qū)間,則在所述檢索對象區(qū)間當中除了關(guān)鍵詞缺失區(qū)間之外的其余區(qū)間內(nèi)利用所述檢索對象關(guān)鍵詞而對所述數(shù)據(jù)庫進行檢索。
14.如權(quán)利要求12所述的信息檢索方法,其中,在所述的記錄關(guān)鍵詞缺失信息的步驟中,還包括如下步驟: 從所述檢索器接收關(guān)鍵詞檢索區(qū)間以及檢索結(jié)果; 判斷接收的關(guān)鍵詞是否與已存儲于主過濾器中的關(guān)鍵詞發(fā)生沖突; 根據(jù)所述判斷的結(jié)果而將關(guān)鍵詞存儲于關(guān)鍵詞歷史表或沖突關(guān)鍵詞歷史表中。
15.如權(quán)利要求14所述的信息檢索方法,其中,所述主過濾器為計數(shù)布隆過濾器。
16.如權(quán)利要求15所述的信息檢索方法,其中,在所述的判斷是否發(fā)生沖突的步驟中,通過從所述檢索器接收到的關(guān)鍵詞計算設(shè)定個數(shù)的互不相同的哈希值,并根據(jù)所述主過濾器的各單元中對應于計算出的哈希值的單元的值是否均為大于O的值而判斷所述關(guān)鍵詞是否與存儲于所述主過濾器中的關(guān)鍵詞發(fā)生沖突。
17.如權(quán)利要求16所述的信息檢索方法,其中,在所述的存儲關(guān)鍵詞的步驟中,如果判斷是否發(fā)生所述沖突的結(jié)果為對應于計算出的哈希值的所述主過濾器的單元值中至少有一個為O,便將對應于所述哈希值的所述主過濾器的單元值分別增加1,并將接收到的關(guān)鍵詞存儲于所述關(guān)鍵詞歷史表。
18.如權(quán)利要求16所述的信息檢索方法,其中,在所述的儲存關(guān)鍵詞的步驟中,如果判斷是否發(fā)生所述沖突的結(jié)果為對應于計算出的哈希值的所述主過濾器的單元值均大于O,便將接收到的關(guān)鍵詞存儲于所述沖突關(guān)鍵詞歷史表。
19.如權(quán)利要求17所述的信息檢索方法,其中,在執(zhí)行所述的記錄關(guān)鍵詞缺失信息的步驟之后,還包括如下步驟: 如果存儲于所述關(guān)鍵詞歷史表中的特定關(guān)鍵詞在已設(shè)定的期間內(nèi)未被使用,便將對應于所述特定關(guān)鍵詞的哈希值的所述主過濾器的單元值減小1,并將所述特定關(guān)鍵詞從所述關(guān)鍵詞歷史表中刪除。
20.如權(quán)利要求19所述的信息檢索方法,其中,在將所述特定關(guān)鍵詞從關(guān)鍵詞歷史表中刪除的步驟中,將存儲于所述沖突關(guān)鍵詞歷史表的關(guān)鍵詞中不再與已存儲于所述主過濾器中的關(guān)鍵詞發(fā)生沖突的關(guān)鍵詞予以刪除,并將從所述沖突關(guān)鍵詞歷史表中刪除的關(guān)鍵詞登記于所述關(guān)鍵詞歷史表以及主過濾器。
【文檔編號】G06F17/30GK104182435SQ201310681804
【公開日】2014年12月3日 申請日期:2013年12月12日 優(yōu)先權(quán)日:2013年5月24日
【發(fā)明者】尹一智, 吳寶利, 崔載碩 申請人:三星Sds株式會社