一種基于知識粒度的矩陣增量約簡方法
【專利摘要】本發(fā)明公開了一種基于知識粒度的矩陣增量約簡方法,包括如下步驟:首先利用等價關(guān)系矩陣計算已有決策表(稱為舊決策表)的最小屬性約簡(REDU);接著當(dāng)一些新對象添加到舊決策表后(稱為新決策表),通過矩陣增量方法計算舊決策表中最小屬性約簡的知識粒度和新決策表的知識粒度,并判斷他們是否相等,如不相等,在新決策表中利用矩陣增量方法計算除REDU之外所有屬性的外部重要性,并依次循環(huán)選取其中外部重要性最大的屬性添加到REDU中,再計算REDU的知識粒度,直到其與新決策表的知識粒度相等為止;最后循環(huán)刪除REDU中的冗余屬性,得到新決策表的最小屬性約簡。本發(fā)明有效地解決了決策表中對象動態(tài)增加時快速求解最小屬性約簡的問題,從而有助于提高知識發(fā)現(xiàn)的效率。
【專利說明】一種基于知識粒度的矩陣増量約簡方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及人工智能中粒計算和粗糙集理論的【技術(shù)領(lǐng)域】,具體涉及一種基于知識 粒度的矩陣增量約簡方法。
【背景技術(shù)】
[0002] 目前隨著存儲技術(shù)的不斷發(fā)展和廣泛應(yīng)用,實際應(yīng)用中的信息系統(tǒng)不僅積累了海 量的、各種各樣的數(shù)據(jù),而且這些實時數(shù)據(jù)每時每刻都會發(fā)生變化,用傳統(tǒng)批量學(xué)習(xí)的知識 獲取方法對復(fù)雜數(shù)據(jù)進行挖掘,需要耗費大量的時間,這使得批量學(xué)習(xí)算法將很難及時、高 效地從動態(tài)數(shù)據(jù)中提取有用的信息及知識。增量學(xué)習(xí)是一個能夠不斷從來自環(huán)境的新樣本 中學(xué)習(xí)到新的知識,并能保留大部分以前已有知識的學(xué)習(xí)系統(tǒng)。通過使用增量學(xué)習(xí)技術(shù),可 以漸進地進行知識更新,修正和加強以前的知識,而不必重新學(xué)習(xí)全部數(shù)據(jù),這在一定程度 更能適應(yīng)實際需求。
[0003] 由于經(jīng)典的知識粒度約簡方法是利用集合交與并的方式來實現(xiàn),計算和表示形式 都比較復(fù)雜,矩陣?yán)碚撌且婚T具有實用價值的數(shù)學(xué)理論,它是處理大量有限維空間方式與 數(shù)量關(guān)系的強有力工具,已廣泛應(yīng)用于科學(xué)研宄和工程應(yīng)用等領(lǐng)域,用矩陣方法解決粗糙 集屬性約簡問題具有重要應(yīng)用價值。本發(fā)明基于知識粒度的矩陣增量約簡方法,只涉及到 矩陣運算,通過等價關(guān)系矩陣的加減計算決策表的知識粒度、決策表的核、條件屬性的內(nèi)部 和外部重要性等,由于現(xiàn)有大部分軟件工具(如MATLAB等)支持矩陣運算,故本發(fā)明提出 的基于知識粒度的矩陣增量約簡方法可以借助已有工具易于實現(xiàn)。
【發(fā)明內(nèi)容】
[0004] 鑒于現(xiàn)有的實時數(shù)據(jù)每時每刻都會發(fā)生變化,傳統(tǒng)批量學(xué)習(xí)的知識獲取方法需要 耗費大量的時間,很難及時、高效地從動態(tài)數(shù)據(jù)中提取有用的信息,本發(fā)明的目的是運用矩 陣運算操作簡單的優(yōu)勢,有效地解決決策表中對象動態(tài)增加時,充分利用舊決策表已經(jīng)得 到的結(jié)果,快速求解最小屬性約簡的問題,避免重復(fù)計算,提高約簡效率。
[0005] 本發(fā)明的目的是通過如下手段實現(xiàn):
[0006] 一種基于知識粒度的矩陣增量約簡方法,利用舊決策表計算約簡的過程中已經(jīng)得 到的結(jié)果一包括舊決策表的知識粒度、屬性外部重要性及最小屬性約簡來計算新決策表的 知識粒度、外部重要性及最小屬性約簡,避免重復(fù)計算,具體包括如下步驟:
[0007] 步驟1 :輸入舊決策表及其最小屬性約簡REDuX-REDu中每個屬性a相對于RED1^ 外部重要性(".則沿.仍、知識粒度GPu(D I C)、REDu的知識粒度GP u(D I REDu)和增量數(shù)據(jù) Ux - ixn+i,Xn+2,***? xn+t^ !
[0008] 步驟2 :計算增加對象后新決策表的等價關(guān)系矩陣(叫;
[0009] 步驟3 :在舊決策表知識粒度GPu(D I C)和最小屬性約簡GPu(D I REDu)基礎(chǔ)上,利 用增量方法計算新決策表知識粒度gSw1 Plc)和REDu的知識粒度,如果 GY;.⑷I O=GY丨,:(/.〕I Λ/ΓΑ ),則跳轉(zhuǎn)到步驟5,否則跳轉(zhuǎn)到步驟4 ;
[0010] 少驟I :、VW L Φ狀A(yù).)#(;/丨(D Γ),在舊決策表屬性子集C-REDu中每個屬性 a相對于REDu的外部重要性,仍基礎(chǔ)上,通過增量方法計算新決策表屬性子集 C-REDu中每個屬性a相對于REDu的外部重要性,〃),依次循環(huán)選取最大的屬性 重要性《。= 孤Α?),β eDtJ 添加到 RED#,即 RED u- RED uU {a。},計算增加 aQ后RED u的知識粒度直到其與新決策表的知識粒度相等為止;
[0011] 步驟5 :在新決策表中,從后向前遍歷REDu*的每一個屬性a,利用矩陣方法計算 REDu刪除屬性a后的知識粒度研,U) /似),-!"Π,如果研.「,(/.)壯認(rèn)->}) = G/f. Γι(/) 〇 則刪除屬性a,即REDu^ RED u-{a}。最后得到的REDuS新決策表的最小屬性約簡;
[0012] 步驟6 : ΙΑ% ,輸出新決策表的最小屬性約簡IAw
[0013] 其中GPu(D I C)為舊決策表的知識粒度,GPu(D I REDu)為舊決策表中REDu的知識粒 度,Sgr (MS)ti,!))為舊決策表屬性子集C-REDu中屬性a相對于RED "的外部重要性,RED " 為舊決策表的最小屬性約簡,(Μ?「Λμκμ為新決策表的等價關(guān)系矩陣,其中φ I 〇 為新決策表的知識粒度,GZ^ri(DIMDr)為新決策表中REDu的知識粒度, 為新決策表屬性子集C-REDu中屬性a相對于REDj^外部重要性,---Ι)為新 決策表REDJ*去屬性a的知識粒度,(,為新決策表的最小屬性約簡。
[0014] 本發(fā)明方法在舊決策表的等價關(guān)系矩陣、知識粒度及外部屬性重要性的基礎(chǔ)上, 利用增量方法計算新決策表的等價關(guān)系矩陣、知識粒度以及外部屬性重要性分別為:
【權(quán)利要求】
1. 一種基于知識粒度的矩陣增量約簡方法,利用舊決策表計算約簡的過程中已經(jīng)得到 的結(jié)果一包括舊決策表的知識粒度、屬性外部重要性及最小屬性約簡來計算新決策表的知 識粒度、外部重要性及最小屬性約簡,避免重復(fù)計算,具體包括如下步驟: 步驟1 :輸入舊決策表及其最小屬性約簡REDu、C-REDu中每個屬性a相對于REDU的外 部重要性廠_ (?.兄?, 、知識粒度GPu(DIC)、REDu的知識粒度GPJDIREDu)和增量數(shù)據(jù)集 Ux - {x n+i, Xn+2) *** ) Xn+t^ ! 步驟2 :計算增加對象后新決策表的等價關(guān)系矩陣k+,>x("+(); 步驟3 :在舊決策表知識粒度GPu(DlC)和最小屬性約簡GPu(DlREDu)基礎(chǔ)上,利用 增量方法計算新決策表知識粒度(DIC)和REDu的知識粒度GPtvif7i(DI) ?如果 GUDIC)=GUZ)|iW叫),則跳轉(zhuǎn)到步驟5,否則跳轉(zhuǎn)到步驟4 ; 步驟4 :當(dāng)I (D|C),在舊決策表屬性子集C-REDu中每個屬性a 相對于REDu的外部重要性.?)基礎(chǔ)上,通過增量方法計算新決策表屬性子集C-REDu中每個屬性a相對于RED"的外部重要性,依次循環(huán)選取最大的屬 性重要性% =milx.丨.?'., ew叫丨添加到RED#,即REDu^REDuU{aJ^ aQ后REDu的知識粒度直到其與新決策表的知識粒度相等為止; 步驟5 :在新決策表中,從后向前遍歷REDu*的每一個屬性a,利用矩陣方法計算RED11 刪除屬性a后的知識粒度ΦIW),如果(Z)I-M)=Φ1C),則刪 除屬性a,即REDu^RED{a}。最后得到的REDuS新決策表的最小屬性約簡; 步驟6 : t·輸出新決策表的最小屬性約簡; 其中GPu(DlC)為舊決策表的知識粒度,GPu(DlREDu)為舊決策表中REDu的知識粒度, 為舊決策表屬性子集C-REDu中屬性a相對于RED亦外部重要性,RED ^ 舊決策表的最小屬性約簡,WU(n+,,x(_為新決策表的等價關(guān)系矩陣,其中ΦIC)為 新決策表的知識粒度,為新決策表中REDu的知識粒度,^:〇@外,卬為 新決策表屬性子集C-REDu中屬性a相對于RED"的外部重要性,GPt7ut7x(DIMDc7 -W)為新決 策表中REDJ*去屬性a的知識粒度,I.為新決策表的最小屬性約簡。
2. 根據(jù)權(quán)利要求1所述的一種基于知識粒度的矩陣增量約簡方法,其特征在于:在舊 決策表的等價關(guān)系矩陣、知識粒度及外部屬性重要性的基礎(chǔ)上,利用增量方法計算新決策 表的等價關(guān)系矩陣、知識粒度以及外部屬性重要性分別為:
其中(Μ?+_+〇為新決策表的等價關(guān)系矩陣,(也:為舊決策表的等價關(guān)系矩陣, (Quiuvtn^iQk,^u, Ca^1)?"^if 決策表的條件屬性和決策屬性的等價關(guān)系增量矩陣,:為增量數(shù)據(jù)集的等價關(guān)系矩 陣,<?UD|〇為新決策表的知識粒度,GPu(DlC)為舊決策表的知識粒度,GP[V(別〇為增 量數(shù)據(jù)集的知識粒度,IuUUxI是新決策表所有對象的個數(shù),Iul是舊決策表所有對象的個 數(shù),I Ux I是增量數(shù)據(jù)集所有對象的個數(shù),·%Γ'?A. ./M是屬性子集C-REDu中屬性a相對 于REDJ^外部重要性,Sum( ·)txn為矩陣所有元素的和,I·I2代表對象個數(shù)的平方。
3.根據(jù)權(quán)利要求1所述的一種基于知識粒度的矩陣增量約簡方法,其特征在于:已有 決策表,亦稱為舊決策表,包括:對象集U、條件屬性集C和決策屬性集D以及對象的屬性 值,新對象,記為增量數(shù)據(jù)集Ux={xn+1,xn+2,…,xn+t},添加到舊決策表后形成的新決策表。
【文檔編號】G06F17/16GK104462020SQ201410562442
【公開日】2015年3月25日 申請日期:2014年10月21日 優(yōu)先權(quán)日:2014年10月21日
【發(fā)明者】李天瑞, 景運革, 余增 申請人:西南交通大學(xué)