基于關聯(lián)度的案例檢索方法及其系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種基于關聯(lián)度的案例檢索方法及其系統(tǒng),所述方法通過將從案例記錄集中提取的特征詞構建代表案例類別的特征集,根據(jù)所述特征詞、案例類別以及計算得到的兩者之間的關聯(lián)度得到候選關聯(lián)庫,再根據(jù)接收到的檢索特征詞及其所在的候選關聯(lián)庫,找出對應案例類別的特征集,分別采用所述對應案例類別的特征集中各個特征詞進行案例檢索。在進行案例檢索時,能根據(jù)檢索特征詞及與其關聯(lián)的其他特征詞進行案例檢索,使得即使在案例數(shù)量非常龐大的案例庫中,亦能快速、精確地進行案例檢索。
【專利說明】
基于關聯(lián)度的案例檢索方法及其系統(tǒng)
技術領域
[0001]本發(fā)明涉及數(shù)據(jù)處理領域,特別是一種基于關聯(lián)度的案例檢索方法及其系統(tǒng)。
【背景技術】
[0002]案例庫檢索與推薦是實現(xiàn)案例推理的核心關鍵部分,案例檢索與推薦的效率直接影響了系統(tǒng)的應用效率。如何通過關鍵字迅速準確地找到所需信息,是確保設備案例庫高效實用的關鍵技術難題。
[0003]目前,傳統(tǒng)案例庫檢索方法有以下幾種:最近鄰檢索策略,是利用相似度理論對案例特征之間的關系進行評價計算,在此基礎上從案例庫中找出一個或多個與當前情況距離最近,相似度最大的案例特征作為檢索的結果;知識引導方法,是一種利用知識來進行推理的方法,它把領域的知識以規(guī)則的形式表示,根據(jù)己知的規(guī)則來確定哪些屬性是案例的重要屬性,并依據(jù)這些特征屬性來指導案例的檢索;以及歸納推理方法,是從歷史數(shù)據(jù)中提取規(guī)則,構建決策樹,通過規(guī)則和決策樹來分類或指引檢索案例記錄。
[0004]然而,傳統(tǒng)案例庫檢索方法存在以下問題:(I)案例檢索效率不高:常用的最近鄰檢索策略方法雖實用方便,但當案例庫成長到一定規(guī)模時,或者案例庫的案例數(shù)量非常大時,米用該方法檢索效率就會很差。(2)案例檢索不精準:常用的知識引導、歸納推理方法在實際應用過程中,需要大量、全面、完備的規(guī)則,會造成知識解釋性不清楚,容易在內容或概念上不符合用戶的信息需求。
【發(fā)明內容】
[0005]針對上述現(xiàn)有技術中存在的問題,本發(fā)明提供一種基于關聯(lián)度的案例檢索方法及其系統(tǒng),在案例數(shù)量非常龐大的案例庫中,能夠快速、精確地進行案例檢索。
[0006]本發(fā)明的基于關聯(lián)度的案例檢索方法,技術方案如下:
[0007]在預設的案例記錄集中提取特征詞,根據(jù)所述特征詞構建代表案例類別的特征集;
[0008]計算每類案例類別的所述特征集中各個特征詞與案例類別的關聯(lián)度,根據(jù)所述特征詞、案例類別以及兩者的關聯(lián)度得到候選關聯(lián)庫;
[0009]根據(jù)接收到的檢索特征詞及其所在的候選關聯(lián)庫,找出對應案例類別的特征集,分別采用所述對應案例類別的特征集中各個特征詞進行案例檢索。
[0010]本發(fā)明的基于關聯(lián)度的案例檢索系統(tǒng),包括:
[0011]特征詞提取模塊,用于在預設的案例記錄集中提取特征詞,根據(jù)所述特征詞構建代表案例類別的特征集;
[0012]關聯(lián)庫生成模塊,用于計算每類案例類別的所述特征集中各個特征詞與案例類別的關聯(lián)度,根據(jù)所述特征詞、案例類別以及兩者的關聯(lián)度得到候選關聯(lián)庫;
[0013]案例檢索模塊,用于根據(jù)接收到的檢索特征詞及其所在的候選關聯(lián)庫,找出對應案例類別的特征集,分別采用所述對應案例類別的特征集中各個特征詞進行案例檢索。
[0014]本發(fā)明的基于關聯(lián)度的案例檢索方法及其系統(tǒng),通過將從案例記錄集中提取的特征詞構建代表案例類別的特征集,根據(jù)所述特征詞、案例類別以及計算得到的兩者之間的關聯(lián)度得到候選關聯(lián)庫,再根據(jù)接收到的檢索特征詞及其所在的候選關聯(lián)庫,找出對應案例類別的特征集,分別采用所述對應案例類別的特征集中各個特征詞進行案例檢索。在進行案例檢索時,能根據(jù)檢索特征詞及與其關聯(lián)的其他特征詞進行案例檢索,使得即使在案例數(shù)量非常龐大的案例庫中,亦能快速、精確地進行案例檢索。
【附圖說明】
[0015]圖1為一個實施例的基于關聯(lián)度的案例檢索方法的流程示意圖;
[0016]圖2為一個實施例的基于關聯(lián)度的案例檢索系統(tǒng)的結構示意圖。
【具體實施方式】
[0017]為了使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合附圖對本發(fā)明作進一步地詳細描述。
[0018]請參閱圖1中一個實施例的基于關聯(lián)度的案例檢索方法的流程示意圖,包括步驟SlOl至步驟S103:
[0019]SlOl,在預設的案例記錄集中提取特征詞,根據(jù)所述特征詞構建代表案例類別的特征集。
[0020]所述案例記錄集可以是通過數(shù)據(jù)庫形式記錄案例的數(shù)據(jù)庫,也可以是通過文本形式記錄案例的文本或者文本集;所述特征詞是指案例中具有專屬特性的詞。本步驟通過在案例記錄集中提取特征詞,并根據(jù)所述特征詞構建代表案例類別的特征集,使得后續(xù)的案例檢索更具針對性,案例檢索更加準確。
[0021]優(yōu)選地,可通過以下方式在預設的案例記錄集中提取特征詞:根據(jù)預設的詞庫對所述案例記錄集進行分詞,得到若干候選特征詞,統(tǒng)計各候選特征詞出現(xiàn)的頻率;若候選特征詞的頻率大于設定閾值,提取該候選特征詞作為特征詞。通過上述方式提取特征詞,使得特征詞更能反映案例的專屬特性,進一步提高后續(xù)案例檢索的準確度。
[0022]S102,計算每類案例類別的所述特征集中各個特征詞與案例類別的關聯(lián)度,根據(jù)所述特征詞、案例類別以及兩者的關聯(lián)度得到候選關聯(lián)庫。
[0023]相同的案例類別可以有多個不同的特征詞,關聯(lián)度則反映了各個特征詞與案例類別的關聯(lián)程度;根據(jù)特征詞、案例類別以及兩者的關聯(lián)度得到的候選關聯(lián)庫,則構成了案例類別中不同特征詞對應的案例之間的映射關系,其中映射關系可通過量化的形式表示,亦即通過關聯(lián)度表示。通過該步驟即使在案例數(shù)量非常龐大的案例庫中,亦能快速構建案例之間的關聯(lián),進一步提尚后續(xù)案例檢索的速度。
[0024]進一步地,步驟S102中可通過以下公式計算所述特征集中各個特征詞與案例類別的關聯(lián)度:
[0025]conf(w,c) =Dw, c/Dw,
[0026]其中,conf(w,c)為特征詞w與案例類別c的關聯(lián)度,Dw,c為案例記錄集中包含特征詞w且屬于案例類別c的案例數(shù)量,Dw為案例記錄集中包含特征詞w的案例數(shù)量。
[0027]進一步地,在計算所述特征集中各個特征詞與案例類別的關聯(lián)度之后,判斷特征詞與案例類別的關聯(lián)度是否小于閾值,若是,則從所述特征集中刪除該特征詞。刪除與案例類別的關聯(lián)度小于閾值的特征詞,優(yōu)化了案例的特征詞,進一步提高后續(xù)案例檢索的準確度。
[0028]進一步地,所述根據(jù)所述特征詞、案例類別以及兩者的關聯(lián)度生成候選關聯(lián)庫,包括根據(jù)特征詞、案例類別以及兩者的關聯(lián)度得到單元對集為:
[0029]Kn= (wn,ck,conf),其中,Wn為特征集W= {wi,w2,…,wn}的第η個特征詞,Ck為預設的案例類別集C= {Cl,C2,…,Ck}的第k個案例類別,conf為特征詞Wn與案例類別Ck的關聯(lián)度;根據(jù)各個特征詞對應的單元對集構建候選關聯(lián)庫為:F= IK1,K2,…,Kn}。
[0030]該步驟的候選關聯(lián)庫將案例類別相近的若干特征詞相互映射,放在一個組別中,相互之間的相似度程度用關聯(lián)度表示;再將各組別進行集合,進而構成候選關聯(lián)庫。例如:案例類別為過熱的組別可表示為:K過熱,發(fā)熱,0.8),(過熱,金具,0.7),(過熱,異常,
0.5)}ο
[0031 ] S103,根據(jù)接收到的檢索特征詞及其所在的候選關聯(lián)庫,找出對應案例類別的特征集,分別采用所述對應案例類別的特征集中各個特征詞進行案例檢索。該步驟對檢索特征詞、以及檢索特征詞所在關聯(lián)庫中其他特征詞進行檢索,從而使得即使在案例數(shù)量非常龐大的案例庫中,亦能快速、精確地進行案例檢索。
[0032]進一步地,在分別采用所述對應案例類別的特征集中各個特征詞進行案例檢索之后,輸出通過采用所述檢索特征詞檢索得到的案例,以及輸出采用該檢索特征詞所在關聯(lián)庫中其他特征詞檢索得到的推薦案例。
[0033]進一步地,所述輸出采用該檢索特征詞所在關聯(lián)庫中其他特征詞檢索得到的推薦案例,還包括獲取該檢索特征詞與其所在關聯(lián)庫中其他特征詞的近似度,根據(jù)所述近似度,對采用該檢索特征詞所在關聯(lián)庫中其他特征詞檢索得到的推薦案例進行排序輸出。
[0034]當某一案例類別中的一個特征詞被檢索時,相當于該特征詞所在的集合中的每個特征詞均被檢索;檢索結果中包括通過該特征詞檢索得到的案例結果,以及推薦的相近案例類別的案例推薦結果,推薦案例的排列順序可根據(jù)該檢索特征詞與其所在關聯(lián)庫中其他特征詞的近似度確定。
[0035]由上述實施例的基于關聯(lián)度的案例檢索方法可知,通過將從案例記錄集中提取的特征詞構建代表案例類別的特征集,根據(jù)所述特征詞、案例類別以及計算得到的兩者之間的關聯(lián)度得到候選關聯(lián)庫,再根據(jù)接收到的檢索特征詞及其所在的候選關聯(lián)庫,找出對應案例類別的特征集,分別采用所述對應案例類別的特征集中各個特征詞進行案例檢索。在進行案例檢索時,能根據(jù)檢索特征詞及與其關聯(lián)的其他特征詞進行案例檢索,使得即使在案例數(shù)量非常龐大的案例庫中,亦能快速、精確地進行案例檢索。
[0036]以下為本發(fā)明的基于關聯(lián)度的案例檢索方法的一個較佳實現(xiàn)方式,本實現(xiàn)方式具體針對設備缺陷案例進行論述,包括步驟一至步驟四:
[0037]步驟一:提取特征詞。
[0038]具體地,對于設備缺陷案例描述記錄集合對應的缺陷類別為C={(^,(^,‘-,(^},根據(jù)設備缺陷專業(yè)詞庫,對集合0進行分詞操作,經過預處理后形成代表設備缺陷類別的特征集1={*1,'\¥2,...,'^}。
[0039]其中,形成特征集W的具體過程如下:Α、對設備缺陷記錄集進行分詞,在分詞的過程中統(tǒng)計每類設備缺陷的候選特征詞,記錄所有候選特征出現(xiàn)的頻率;B、將候選特征按照頻率從大到小進行排序;C、按排序后的順序依次選取特征詞,如果頻率大于閾值,將該特征詞作為代表此缺陷類別的特征詞,并繼續(xù)選取下一個特征詞;如果累積頻率小于等于閾值,則截尾,將所有選出的特征詞作為缺陷記錄類別的特征詞;D、對所有的設備缺陷類別的案例重復以上步驟,從而得到每類設備缺陷類別的特征集W= {W1,w_,wn}。例如對設備過熱缺陷類別描述文本進行特征提取,形成代表設備過熱缺陷類別特征集W= {發(fā)熱,金具,異常}。
[0040]本步驟提出文本特征量提取方法,豐富短文本所攜帶的特征量,形成代表設備缺陷類型的特征集合,能高效地解析代表短文本的特征詞。
[0041 ]步驟二:關聯(lián)度計算。
[0042]計算特征集W中各個特征詞與設備缺陷類別的關聯(lián)度,若關聯(lián)度小于閾值,則從該集合中刪除,然后根據(jù)特征詞的類別趨向度將特征詞集劃分為若干個與缺陷類別一一對應的單元對集Kn。具體如下:
[0043]a)定義并計算關聯(lián)度:特征詞w對于設備缺陷類別c的關聯(lián)度記為conf (w,c),其數(shù)學定義式為:
[0044]conf(w,c) =Dw’c/Dw,
[0045]其中,conf(w,c)為特征詞w與案例類別c的關聯(lián)度,Dw,。為案例記錄集中包含特征詞w且屬于案例類另Ijc的案例數(shù)量,Dw為案例記錄集中包含特征詞w的案例數(shù)量。計算特征集中各個特征詞與設備缺陷類別的關聯(lián)度,若關聯(lián)度小于閾值β(0.5<β<1),則從該集合中刪除該特征詞。
[0046]b)形成單元對集:根據(jù)特征詞、設備缺陷類別以及兩者的關聯(lián)度得到特征詞與設備缺陷類別--對應的單元對集:Kn= (Wn,Ck,conf),其中,其中,Wn為特征集W= {W1,W2,...,
Wnl的第η個特征詞,Ck為預設的案例類別集C= {Cl,C2,…,Ck}的第k個案例類別,conf為特征詞¥?與案例類別Ck的關聯(lián)度。
[0047]步驟三:生成候選關聯(lián)庫。
[0048]根據(jù)形成的單元對集Kn=(wn,ck,conf ),并以這些二元組構成候選關聯(lián)庫為:F ={Kl,K2,...,Κη}ο
[0049]所述候選關聯(lián)知識庫,將設備缺陷類別相近的若干特征詞相互映射,放在一個組別中,相互之間的相似度程度用關聯(lián)度表示;再將各組別進行集合,進而構成候選關聯(lián)庫。例如:設備缺陷類別為過熱的組別可表示為:K過熱,發(fā)熱,0.8),(過熱,金具,0.7),(過熱,異常,0.5)}。
[0050]步驟四:推薦案例輸出。
[0051]根據(jù)接收到的檢索特征詞及其所在的候選關聯(lián)庫,找出對應設備缺陷類別的特征集,分別采用所述對應設備缺陷類別的特征集中各個特征詞進行案例檢索,輸出通過采用所述檢索特征詞檢索得到的案例,以及輸出采用該檢索特征詞所在關聯(lián)庫中其他特征詞檢索得到的推薦案例。還可以獲取該檢索特征詞與其所在關聯(lián)庫中其他特征詞的近似度,根據(jù)所述近似度,對推薦案例進行排序。
[0052]由上述基于關聯(lián)度的案例檢索方法的較佳實現(xiàn)方式可知,通過將從案例記錄集中提取的特征詞構建代表案例類別的特征集,根據(jù)所述特征詞、案例類別以及計算得到的兩者之間的關聯(lián)度得到候選關聯(lián)庫,再根據(jù)接收到的檢索特征詞及其所在的候選關聯(lián)庫,找出對應案例類別的特征集,分別采用所述對應案例類別的特征集中各個特征詞進行案例檢索。在進行案例檢索時,能根據(jù)檢索特征詞及與其關聯(lián)的其他特征詞進行案例檢索,使得即使在案例數(shù)量非常龐大的案例庫中,亦能快速、精確地進行案例檢索。
[0053]本發(fā)明還提供一種基于關聯(lián)度的案例檢索系統(tǒng),如圖2所示,包括特征詞提取模塊201,關聯(lián)庫生成模塊202以及案例檢索模塊203。
[0054]所示特征詞提取模塊201用于在預設的案例記錄集中提取特征詞,根據(jù)所述特征詞構建代表案例類別的特征集;所述關聯(lián)庫生成模塊202用于計算每類案例類別的所述特征集中各個特征詞與案例類別的關聯(lián)度,根據(jù)所述特征詞、案例類別以及兩者的關聯(lián)度得到候選關聯(lián)庫;以及所述案例檢索模塊203用于根據(jù)接收到的檢索特征詞及其所在的候選關聯(lián)庫,找出對應案例類別的特征集,分別采用所述對應案例類別的特征集中各個特征詞進行案例檢索。
[0055]由上述實施例的基于關聯(lián)度的案例檢索系統(tǒng)可知,通過將從案例記錄集中提取的特征詞構建代表案例類別的特征集,根據(jù)所述特征詞、案例類別以及計算得到的兩者之間的關聯(lián)度得到候選關聯(lián)庫,再根據(jù)接收到的檢索特征詞及其所在的候選關聯(lián)庫,找出對應案例類別的特征集,分別采用所述對應案例類別的特征集中各個特征詞進行案例檢索。在進行案例檢索時,能根據(jù)檢索特征詞及與其關聯(lián)的其他特征詞進行案例檢索,使得即使在案例數(shù)量非常龐大的案例庫中,亦能快速、精確地進行案例檢索。
[0056]在其中一個實施例中,所述關聯(lián)庫生成模塊202包括關聯(lián)度計算子模塊,用于通過以下公式計算所述特征集中各個特征詞與案例類別的關聯(lián)度:
[0057]conf(w,c) =Dw, c/Dw,
[0058]其中,conf(w,c)為特征詞w與案例類別c的關聯(lián)度,Dw,c為案例記錄集中包含特征詞w且屬于案例類別c的案例數(shù)量,Dw為案例記錄集中包含特征詞w的案例數(shù)量。
[0059]在其中一個實施例中,所述關聯(lián)庫生成模塊202還包括關聯(lián)度優(yōu)化子模塊,用于在計算所述特征集中各個特征詞與案例類別的關聯(lián)度之后,判斷特征詞與案例類別的關聯(lián)度是否小于閾值,若是,則從所述特征集中刪除該特征詞。刪除與案例類別的關聯(lián)度小于閾值的特征詞,優(yōu)化了案例的特征詞,進一步提高后續(xù)案例檢索的準確度。
[0060]在其中一個實施例中,所述關聯(lián)庫生成模塊202還包括關聯(lián)庫生成子模塊,用于根據(jù)特征詞、案例類別以及兩者的關聯(lián)度得到單元對集為:Kn=(wn,ck,conf),其中,其中,wn為特征集W= {wi,W2,…,wn}的第η個特征詞,Ck為預設的案例類別集C= {Cl,C2,…,Ck}的第k個案例類別,conf為特征詞%與案例類別Ck的關聯(lián)度;根據(jù)各個特征詞對應的單元對集構建候選關聯(lián)庫為:F= IKnK2,...,!(?}。
[0061]在其中一個實施例中,所述特征詞提取模塊201包括特征詞提取子模塊,用于根據(jù)預設的詞庫對所述案例記錄集進行分詞,得到若干候選特征詞,統(tǒng)計各候選特征詞出現(xiàn)的頻率;若候選特征詞的頻率大于設定閾值,提取該候選特征詞作為特征詞,使得特征詞更能反映案例的專屬特性,進一步提高后續(xù)案例檢索的準確度。
[0062]在其中一個實施例中,所述案例檢索模塊203包括案例輸出子模塊,所述案例輸出子模塊用于輸出通過采用所述檢索特征詞檢索得到的案例,以及輸出采用該檢索特征詞所在關聯(lián)庫中其他特征詞檢索得到的推薦案例。所述案例輸出子模塊進一步包括排序輸出子模塊,用于獲取該檢索特征詞與其所在關聯(lián)庫中其他特征詞的近似度,根據(jù)所述近似度,對采用該檢索特征詞所在關聯(lián)庫中其他特征詞檢索得到的推薦案例進行排序輸出。
[0063]以上所述實施例的各技術特征可以進行任意的組合,為使描述簡潔,未對上述實施例中的各個技術特征所有可能的組合都進行描述,然而,只要這些技術特征的組合不存在矛盾,都應當認為是本說明書記載的范圍。
[0064]以上所述實施例僅表達了本發(fā)明的幾種實施方式,其描述較為具體和詳細,但并不能因此而理解為對本發(fā)明專利范圍的限制。應當指出的是,對于本領域的普通技術人員來說,在不脫離本發(fā)明構思的前提下,還可以做出若干變形和改進,這些都屬于本發(fā)明的保護范圍。因此,本發(fā)明專利的保護范圍應以所附權利要求為準。
【主權項】
1.基于關聯(lián)度的案例檢索方法,其特征在于,包括如下步驟: 在預設的案例記錄集中提取特征詞,根據(jù)所述特征詞構建代表案例類別的特征集; 計算每類案例類別的所述特征集中各個特征詞與案例類別的關聯(lián)度,根據(jù)所述特征詞、案例類別以及兩者的關聯(lián)度得到候選關聯(lián)庫; 根據(jù)接收到的檢索特征詞及其所在的候選關聯(lián)庫,找出對應案例類別的特征集,分別采用所述對應案例類別的特征集中各個特征詞進行案例檢索。2.根據(jù)權利要求1所述的基于關聯(lián)度的案例檢索方法,其特征在于,所述計算每類案例類別的所述特征集中各個特征詞與案例類別的關聯(lián)度,包括: 通過以下公式計算所述特征集中各個特征詞與案例類別的關聯(lián)度:conf (w,c) — Dw, c/Dw, 其中,conf (w,c)為特征詞w與案例類別c的關聯(lián)度,Dw,c為案例記錄集中包含特征詞w且屬于案例類別c的案例數(shù)量,Dw為案例記錄集中包含特征詞w的案例數(shù)量。3.根據(jù)權利要求2所述的基于關聯(lián)度的案例檢索方法,其特征在于,所述計算所述特征集中各個特征詞與案例類別的關聯(lián)度之后,包括: 判斷特征詞與案例類別的關聯(lián)度是否小于閾值,若是,則從所述特征集中刪除該特征Τ.κ| ο4.根據(jù)權利要求2或3所述的基于關聯(lián)度的案例檢索方法,其特征在于,所述根據(jù)所述特征詞、案例類別以及兩者的關聯(lián)度生成候選關聯(lián)庫,包括: 根據(jù)特征詞、案例類別以及兩者的關聯(lián)度得到單元對集為:Kn — ( Wn,Ck,COnf), 其中,Wn為特征集W= {W1,W2,…,wn}的第η個特征詞,Ck為預設的案例類別集C= {Cl,C2,…,Ck}的第k個案例類別,conf為特征詞Wn與案例類別Ck的關聯(lián)度; 根據(jù)各個特征詞對應的單元對集構建候選關聯(lián)庫為:5.根據(jù)權利要求1所述的基于關聯(lián)度的案例檢索方法,其特征在于,所述在預設的案例記錄集中提取特征詞,包括: 根據(jù)預設的詞庫對所述案例記錄集進行分詞,得到若干候選特征詞,統(tǒng)計各候選特征詞出現(xiàn)的頻率; 若候選特征詞的頻率大于設定閾值,提取該候選特征詞作為特征詞。6.根據(jù)權利要求1所述的基于關聯(lián)度的案例檢索方法,其特征在于,所述分別采用所述對應案例類別的特征集中各個特征詞進行案例檢索,之后包括: 輸出通過采用所述檢索特征詞檢索得到的案例,以及輸出采用該檢索特征詞所在關聯(lián)庫中其他特征詞檢索得到的推薦案例; 所述輸出采用該檢索特征詞所在關聯(lián)庫中其他特征詞檢索得到的推薦案例,還包括: 獲取該檢索特征詞與其所在關聯(lián)庫中其他特征詞的近似度,根據(jù)所述近似度,對所述推薦案例進行排序輸出。7.基于關聯(lián)度的案例檢索系統(tǒng),其特征在于,包括: 特征詞提取模塊,用于在預設的案例記錄集中提取特征詞,根據(jù)所述特征詞構建代表案例類別的特征集; 關聯(lián)庫生成模塊,用于計算每類案例類別的所述特征集中各個特征詞與案例類別的關聯(lián)度,根據(jù)所述特征詞、案例類別以及兩者的關聯(lián)度得到候選關聯(lián)庫; 案例檢索模塊,用于根據(jù)接收到的檢索特征詞及其所在的候選關聯(lián)庫,找出對應案例類別的特征集,分別采用所述對應案例類別的特征集中各個特征詞進行案例檢索。8.根據(jù)權利要求7所述的基于關聯(lián)度的案例檢索系統(tǒng),其特征在于,所述關聯(lián)庫生成模塊包括: 關聯(lián)度計算子模塊,用于通過以下公式計算所述特征集中各個特征詞與案例類別的關聯(lián)度:conf (w,c) — Dw, c/Dw, 其中,conf (w,c)為特征詞w與案例類別c的關聯(lián)度,Dw,c為案例記錄集中包含特征詞w且屬于案例類別c的案例數(shù)量,Dw為案例記錄集中包含特征詞w的案例數(shù)量。9.根據(jù)權利要求8所述的基于關聯(lián)度的案例檢索系統(tǒng),其特征在于,所述關聯(lián)庫生成模塊還包括: 關聯(lián)庫生成子模塊,用于根據(jù)特征詞、案例類別以及兩者的關聯(lián)度得到單元對集為:Kn= (wn,ck,conf),其中,其中,wn為特征集W= {wi,w2,...,wn}的第η個特征詞,Ck為預設的案例類別集C= {C1,C2,…,ck}的第k個案例類別,conf為特征詞%與案例類別Ck的關聯(lián)度;根據(jù)各個特征詞對應的單元對集構建候選關聯(lián)庫為:F= {Κι,Κ2,...,Κη}。10.根據(jù)權利要求7所述的基于關聯(lián)度的案例檢索方法,其特征在于,所述案例檢索模塊包括: 案例輸出子模塊,用于輸出通過采用所述檢索特征詞檢索得到的案例,以及輸出采用該檢索特征詞所在關聯(lián)庫中其他特征詞檢索得到的推薦案例; 所述案例輸出子模塊進一步包括: 排序輸出子模塊,用于獲取該檢索特征詞與其所在關聯(lián)庫中其他特征詞的近似度,根據(jù)所述近似度,對所述推薦案例進行排序輸出。
【文檔編號】G06F17/30GK105930358SQ201610219204
【公開日】2016年9月7日
【申請日】2016年4月8日
【發(fā)明人】廖新征, 黃成 , 劉典安, 鄧琨, 趙國杰, 林圳杰, 溫啟良, 許德成, 李銳海, 王頌, 孫迅, 鄒林
【申請人】南方電網科學研究院有限責任公司