亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種面向?qū)傩詧D集的頻繁近似子圖挖掘方法_2

文檔序號:8922659閱讀:來源:國知局
p;是t-相似圖,且圖GD的個(gè)數(shù)不小于-X|D|,即supp(gs,D)彡〇,則稱子圖&是頻繁 近似子圖;接著在圖集S中查找子圖gs的所有擴(kuò)展邊,根據(jù)每條擴(kuò)展邊對子圖§3進(jìn)行擴(kuò)展 得到新的擴(kuò)展子圖,并判斷擴(kuò)展子圖是否為頻繁近似子圖。按照上述過程遍歷圖集S中的 所有子圖,同時(shí)根據(jù)屬性圖集D、兩個(gè)閾值〇和t、代價(jià)函數(shù)d找出所有頻繁近似子圖。
[0045] (11)頻繁近似子圖P的存儲(chǔ)信息:每個(gè)頻繁近似子圖P保存三個(gè)信息:子圖P的最 小DFS(DeepFirstSearch)編碼Min(P)、子圖P在屬性圖集S中的同構(gòu)嵌入集0 (P,S)、 子圖P在屬性圖集D中的近似嵌入集0 (P,D)。其中Min(P)是一個(gè)字符串,用于唯一表示子 圖P; ? (P,S)是一個(gè)二元組集合,每個(gè)元組包含子圖P在圖集S中的同構(gòu)嵌入子圖Ps和嵌 入子圖Ps所在圖的標(biāo)號n,即0(P,S) = {(Psl,ni),…(PSi,ni),一} ;0(P,D)是一個(gè)三元組 集合,每個(gè)元組包含子圖P在圖集D中的近似嵌入子圖PD、嵌入子圖PD所在圖的標(biāo)號n和嵌 入子圖PD與子圖P之間的圖編輯距離dism(PD,P),即0(P,D) = {(PD1,ni,dism(PD1,P)),… ,(PDi,叫,dism(PDi,P)),〇
[0046] (12)由子圖P的三個(gè)信息計(jì)算擴(kuò)展子圖P'的三個(gè)信息:由于P' =P°e且e= (u,v),所以,
[0047] l)Min(P'):在Min(P)后加上擴(kuò)展邊e的編碼得到;
[0048] 2) 0 (P',S):將PSG0 (P,S)與es= (us,vs)GExtSet(P,S)連接得到擴(kuò)展子圖 Ps' =Ps°es,若子圖Ps'和子圖P'是同構(gòu)圖,將子圖Ps'加入到0 (P',S);
[0049]3)0(P',D):將PDG0 (P,D)與eD=(uD,vD)GExtSet(P,D)連接得到擴(kuò) 展子圖PD' =PD。eD,計(jì)算dism(PD',P'),若dism(PD',P')彡 1-t,將PD' 加入到 0 (P,,D);否則計(jì)算子圖PD和子圖P'的dism(PD,P'),若dism(PD,P')彡1- 了,將 卩1)加入到@(?',〇)中。其中,(118111(?1/,?')=(118111(? 1),?)+(1(〈61),65>)+(1(〈¥1),¥ 5>),
。此計(jì)算過程展現(xiàn)了在圖匹配過程中允許 頂點(diǎn)或者邊的缺失或者特征向量不同。
[0050] 本發(fā)明包括如下步驟:
[0051] (1)輸入屬性圖集D、支持度閾值〇、近似度閾值t和代價(jià)函數(shù)d。
[0052] (3)挖掘頻繁近似頂點(diǎn):根據(jù)屬性圖集D和S、兩個(gè)閾值〇和t、代價(jià)函數(shù)d,挖掘 只包含一個(gè)頂點(diǎn)的頻繁近似子圖,將頻繁近似頂點(diǎn)的三個(gè)相關(guān)信息加入到集合C,令頻繁近 似子圖集F=C。
[0053] (4)子圖擴(kuò)展:對于每個(gè)子圖PGC,找到子圖P在屬性圖集S中的擴(kuò)展邊集 ExtSet(P,S),對于每條擴(kuò)展邊esGExtSet(P,S),將子圖P和邊es連接得到擴(kuò)展子圖P' =P°es。同時(shí)計(jì)算擴(kuò)展子圖P'的三個(gè)相關(guān)信息:子圖P'的最小DFS編碼Min(P')、子圖 P'在圖集S中的同構(gòu)嵌入集0 (P',S)和子圖P'在圖集D中的近似嵌入集0(P',D)。
[0054] (5)計(jì)算擴(kuò)展子圖P'在屬性圖集D中的支持度,若supp(P',D)彡〇,則有F= FUP',并重復(fù)步驟(4),直至所有子圖均被發(fā)現(xiàn)或者子圖的支持度小于支持度閾值〇。
[0055] (6)輸出頻繁近似子圖集F。
[0056] 參照圖1,本發(fā)明提出一種面向?qū)傩詧D集的頻繁近似子圖挖掘方法,具體包括以下 步驟:
[0057]S1,輸入屬性圖集D、支持度閾值〇、近似度閾值t和代價(jià)函數(shù)d。
[0058]S2,構(gòu)造屬性圖集S。
[0059] 參照圖2,構(gòu)造屬性圖集S具體包括如下步驟:
[0060] 321,輸入屬性圖集0。
[0061] S22,對屬性圖集D中所有頂點(diǎn)的特征向量組成的特征向量集進(jìn)行聚類;對屬性圖 集D中所有邊的特征向量組成的特征向量集進(jìn)行聚類。
[0062] S23,將屬性圖集D中每個(gè)頂點(diǎn)的特征向量用其所在簇的簇心特征向量代替,將屬 性圖集D中每條邊的特征向量用其所在簇的簇心特征向量代替,其他保持不變。
[0063] S24,輸出屬性圖集S。圖3是屬性圖集D和S中各一實(shí)例圖,圖3(a)是屬性圖集 D中一個(gè)實(shí)例圖GD,圖3(b)是屬性圖集S中一個(gè)實(shí)例圖Gs。由圖3可知,圖Gs是將圖GD中 每個(gè)頂點(diǎn)的特征向量和每條邊的特征向量分別用它們所在簇的簇心特征向量替換、其他保 持不變得到的。
[0064] S3,根據(jù)屬性圖集D和S、支持度閾值〇、近似度閾值t和代價(jià)函數(shù)d,進(jìn)行頻繁近 似子圖挖掘。
[0065] 參照圖4,頻繁近似子圖挖掘具體包括如下步驟:
[0066] S31,輸入屬性圖集D和S、支持度閾值〇、近似度閾值t和代價(jià)函數(shù)山發(fā)出請求。
[0067]S32,挖掘頻繁近似頂點(diǎn)集C,并令頻繁近似子圖集F=C。
[0068] S33,子圖增長和頻繁近似子圖挖掘,包括兩步:
[0069] 1)對于每個(gè)子圖PGC,找到子圖P在屬性圖集S中的擴(kuò)展邊集ExtSet(P,S),對 于每條擴(kuò)展邊esGExtSet(P,S),將子圖P和邊es連接得到擴(kuò)展子圖P' =P°es,計(jì)算擴(kuò) 展子圖P'的三個(gè)相關(guān)信息Min(P')、0 (P',S)和0(P',D)。
[0070] 2)計(jì)算擴(kuò)展子圖P'的支持度,若supp(P',D)彡〇,將子圖P'加入到頻繁近似子 圖集F,即F =FUP',并重復(fù)步驟D,直至所有子圖均被訪問過或者子圖的支持度小于支 持度閾值〇。
[0071]S34,輸出頻繁近似子圖集F。圖5為頻繁近似子圖集F的索引樹。其中每個(gè)結(jié)點(diǎn) 表示一個(gè)頻繁近似子圖,其中存儲(chǔ)頻繁近似子圖相關(guān)的三個(gè)信息:最小DFS編碼、子圖在 屬性圖集S中的同構(gòu)嵌入集、子圖在屬性圖集D中的近似嵌入集。
【主權(quán)項(xiàng)】
1. 一種面向?qū)傩詧D集的頻繁近似子圖挖掘方法,其特征在于,包括如下步驟: (1) 輸入屬性圖集D、支持度閾值σ、近似度閾值τ和代價(jià)函數(shù)d; (2) 構(gòu)造屬性圖集S :對屬性圖集D中頂點(diǎn)特征向量集和邊特征向量集分別進(jìn)行聚類, 根據(jù)簇心特征向量構(gòu)造一個(gè)新的圖集S ;之后在屬性圖集D和S上進(jìn)行頻繁近似子圖搜索; (3) 挖掘頻繁近似頂點(diǎn):根據(jù)屬性圖集D和S、兩個(gè)閾值〇和τ、代價(jià)函數(shù)d,挖掘只包 含一個(gè)頂點(diǎn)的頻繁近似子圖,將頻繁近似頂點(diǎn)的三個(gè)相關(guān)信息加入到集合C,令頻繁近似子 圖集F = C; (4) 子圖擴(kuò)展:對于每個(gè)子圖P e C,找到子圖P在屬性圖集S中的擴(kuò)展邊集 ExtSet (P, S),對于每條擴(kuò)展邊ese ExtSet (P, S),將子圖P和邊e s連接得到擴(kuò)展子圖P' = P 〇es;同時(shí)計(jì)算擴(kuò)展子圖P'的三個(gè)相關(guān)信息:子圖P'的最小DFS編碼Min (P')、子圖P' 在圖集S中的同構(gòu)嵌入集Θ (P',S)和子圖P'在圖集D中的近似嵌入集0 (P',D); (5) 計(jì)算擴(kuò)展子圖P'在屬性圖集D中的支持度,若supp(P',D)彡σ,則有F = F U P', 并重復(fù)步驟(4),直至所有子圖均被發(fā)現(xiàn)或者子圖的支持度小于支持度閾值σ ; (6) 輸出頻繁近似子圖集F。2. 根據(jù)權(quán)利要求1所述的一種面向?qū)傩詧D集的頻繁近似子圖挖掘方法,其特征在于: 所述代價(jià)函數(shù)d,設(shè)〈Qi,Q,是圖編輯路徑中的中一個(gè)編輯操作,其中^是Q i的第k個(gè)特征 值,qk是Q」的第k個(gè)特征值,d (<Q i,Qj>)表示編輯操作說,Q,的代價(jià)函數(shù),則有:3. 根據(jù)權(quán)利要求1所述的一種面向?qū)傩詧D集的頻繁近似子圖挖掘方法,其特征在于: 所述的近似嵌入集,給定圖P,圖G,圖gi,其中圖gi是圖G的一個(gè)子圖,若圖P和圖g 1是 τ-近似圖,則稱圖81是圖P在圖G中的一個(gè)近似嵌入;用〇 (P,G)表示圖P在圖G中的近 似嵌入集,則有。(P,G) = {gi|gi是圖G的子圖,圖P和圖81是τ-近似圖};用0 (P,D) 表示圖P在圖集D中的所有近似嵌入,則有0 (P,D) =U d〇 (P,G)。4. 根據(jù)權(quán)利要求3所述的一種面向?qū)傩詧D集的頻繁近似子圖挖掘方法,其特征在于: 所述的τ-近似圖,給定兩個(gè)圖Gp GjP近似度閾值τ,如果GJPh的圖編輯距離不大于 I- τ,即disn^Gi, Gj) < I- τ,則稱圖Gi和圖G』是τ -近似圖。5. 根據(jù)權(quán)利要求1所述的一種面向?qū)傩詧D集的頻繁近似子圖挖掘方法,其特征在于: 在所述的屬性圖集D和S上進(jìn)行頻繁近似子圖搜索,以屬性圖集S中的圖為基準(zhǔn)進(jìn)行子圖 搜索,同時(shí)根據(jù)屬性圖集D、兩個(gè)閾值〇和τ、代價(jià)函數(shù)d來判斷子圖是否為頻繁近似子 圖,圖Gse S,存在子圖gse Gs,若在屬性圖集D中存在包含子圖gD的圖GD,使得gD和g 3是 相似圖,且圖Gd的個(gè)數(shù)不小于cpX|D|,即supp(gs,D)彡σ,則稱子圖83是頻繁近似子圖; 接著在圖集S中查找子圖gs的所有擴(kuò)展邊,根據(jù)每條擴(kuò)展邊對子圖g s進(jìn)行擴(kuò)展得到新的擴(kuò) 展子圖,并判斷擴(kuò)展子圖是否為頻繁近似子圖;按照上述過程遍歷屬性圖集S中的所有子 圖,同時(shí)根據(jù)屬性圖集D、兩個(gè)閾值〇和τ、代價(jià)函數(shù)d找出所有頻繁近似子圖。
【專利摘要】本發(fā)明屬于圖挖掘技術(shù)領(lǐng)域,具體涉及一種面向?qū)傩詧D集的頻繁近似子圖挖掘方法。本發(fā)明包括:輸入屬性圖集D;構(gòu)造屬性圖集S;挖掘頻繁近似頂點(diǎn);子圖擴(kuò)展;計(jì)算擴(kuò)展子圖P’在屬性圖集D中的支持度;輸出頻繁近似子圖集F。本發(fā)明提出一種面向?qū)傩詧D集的頻繁近似子圖挖掘方法,首先利用聚類算法將屬性圖集中連續(xù)數(shù)值型特征向量分割成離散特征向量,從而構(gòu)建一個(gè)新的屬性圖集S,方便子圖的搜索;然后在圖近似匹配過程中采用具有較強(qiáng)容錯(cuò)能力的圖編輯距離,符合現(xiàn)實(shí)世界中噪聲和圖失真普遍存在的現(xiàn)象,可以發(fā)現(xiàn)更多重要模式,具有更實(shí)際的應(yīng)用前景。
【IPC分類】G06F17/30
【公開號】CN104899292
【申請?zhí)枴緾N201510306230
【發(fā)明人】潘海為, 高琳琳, 韓啟龍, 戰(zhàn)宇, 翟霄, 李文博
【申請人】哈爾濱工程大學(xué)
【公開日】2015年9月9日
【申請日】2015年6月8日
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1