專利名稱::一種醫(yī)學(xué)圖像識別的方法
技術(shù)領(lǐng)域:
:本發(fā)明屬于醫(yī)學(xué)圖像的計(jì)算機(jī)分析技術(shù)的應(yīng)用領(lǐng)域,具體涉及一種醫(yī)學(xué)圖像識別的方法。
背景技術(shù):
:自20世紀(jì)70年代以來,隨著計(jì)算機(jī)斷層掃描CT、核磁共振成像MRI、超聲US等醫(yī)學(xué)成像技術(shù)的產(chǎn)生和飛速發(fā)展,醫(yī)院中產(chǎn)生并存儲了大量的可供臨床診斷和分析的醫(yī)學(xué)圖像。近年來,隨著計(jì)算機(jī)及其相關(guān)技術(shù)的迅速發(fā)展以及圖形圖像技術(shù)的日趨成熟,人們可以對醫(yī)學(xué)圖像進(jìn)行任意放大、縮小、旋轉(zhuǎn)、對比調(diào)整、分割、配準(zhǔn)、三維重建等處理,醫(yī)務(wù)工作者可以從多方位、多層次、多角度對醫(yī)學(xué)圖像進(jìn)行觀察,從而輔助醫(yī)生對病變體及其他感興趣區(qū)域進(jìn)行重點(diǎn)分析,提高了臨床診斷的準(zhǔn)確性,開創(chuàng)了數(shù)字醫(yī)療的新時(shí)代。但是,目前圖像診斷方法絕大部分仍是通過肉眼觀察圖像中的病變區(qū)域,依靠醫(yī)生個(gè)人的臨床經(jīng)驗(yàn)和主觀判斷來進(jìn)行診斷。該方法存在如下不足①信息利用率不高,由于醫(yī)學(xué)圖像一般具有很高的分辨率(如CT圖像灰度級高達(dá)4096級),那些人眼無法分辨的圖像信息和圖像特征就得不到充分應(yīng)用,從而會影響病情的早期判斷;②醫(yī)生帶有個(gè)人的主觀性,診斷結(jié)果很大程度上依賴于醫(yī)生個(gè)人的臨床經(jīng)驗(yàn),對于那些臨床經(jīng)驗(yàn)較少的醫(yī)生來說,要做出正確的診斷是非常困難的。另外,同一張醫(yī)學(xué)圖像,不同的醫(yī)生也有可能得出不同的診斷結(jié)果,相互之間的差別可能很大,發(fā)生誤診或漏診現(xiàn)象是不可避免的;③人工觀察耗時(shí)多,對于單個(gè)病人的診斷,醫(yī)生直接觀察患者的病變區(qū)域所耗時(shí)間和精力是可以接受,但若對大量臨床圖像進(jìn)行病理研究時(shí),仍然采取人工讀圖的方式就讓人難以接受了。因此,如何充分利用計(jì)算機(jī)圖像處理技術(shù)快速、準(zhǔn)確地將醫(yī)學(xué)圖像中的病變區(qū)域識別出來,即確定醫(yī)學(xué)圖像中各組織器官所屬的類別(正?;虍惓?,確保臨床診斷更客觀、準(zhǔn)確和科學(xué),己成為醫(yī)學(xué)圖像診斷中的一個(gè)關(guān)鍵技術(shù)。另外,醫(yī)學(xué)圖像識別也是可視人計(jì)劃(VHP)、醫(yī)學(xué)圖像指導(dǎo)治療技術(shù)、醫(yī)學(xué)圖像后處理及其治療方法、手術(shù)計(jì)劃與導(dǎo)航和醫(yī)學(xué)虛擬現(xiàn)實(shí)及其相關(guān)技術(shù)等實(shí)現(xiàn)中的一項(xiàng)重要工作。目前國內(nèi)外在這方面的研究很活躍。例如,Maria-Luiza.A(ApplicationofTataMiningTechniquesforMeTicalImage)等人用圖像挖掘方法對胸部圖像進(jìn)行了較為深入的研究,所提出的方法首先是對胸部圖像進(jìn)行預(yù)處理,然后將圖像分成四個(gè)規(guī)則區(qū)域,提取每個(gè)區(qū)域的紋理特征,最后用兩種算法(關(guān)聯(lián)規(guī)則和神經(jīng)網(wǎng)絡(luò))對它進(jìn)行數(shù)據(jù)挖掘。該方法通過圖像數(shù)據(jù)挖掘,將圖像分成正常和異常兩類,實(shí)現(xiàn)了胸部圖像乳腺癌的自動診斷。VasileiosMegalooikonomou(MiningLesion-TeficitAssociationsinABrainImageTatabase)等人利用數(shù)據(jù)挖掘技術(shù)對腦部圖像進(jìn)行了研究,發(fā)現(xiàn)了人腦的結(jié)構(gòu)與功能的聯(lián)系,大大方便了醫(yī)生對人腦疾病的診斷。PetmPerner(MiningKnowleTgeforHEp-2CellImageClassification)提出基于診斷的圖像挖掘系統(tǒng),首先提取圖像的顏色、紋理、形狀等低層物理特征和專家對圖像的診斷信息,然后用決策樹挖掘圖像特征和診斷的關(guān)聯(lián),輔助醫(yī)生進(jìn)行臨床診斷。對上述這些研究進(jìn)行分析可以發(fā)現(xiàn),目前這些醫(yī)學(xué)圖像分類研究所采用的方法一般是通過提取描述圖像的特征集,使原始圖像數(shù)據(jù)變成適合于傳統(tǒng)數(shù)據(jù)挖掘技術(shù)的數(shù)據(jù)形式,然后進(jìn)行圖像分類研究;還有的是通過特征集的關(guān)聯(lián)規(guī)則進(jìn)行臨床自動診斷研究。這些方法或多或少存在以下幾個(gè)問題①僅限于對整幅圖像的特征進(jìn)行挖掘研究,而臨床診斷中人體圖像的局部區(qū)域特征更具有臨床意義。日前絕大多數(shù)的特征提取都是建立在整幅圖像基礎(chǔ)之上,或者簡單地把圖像分成規(guī)則的幾部分,分別提取每部分的特征,這些特征不能真正表示圖像中的真實(shí)信息,而識別效果的好壞很大程度上取決于所提取的特征;②用于醫(yī)學(xué)圖像分類的方法還停留在關(guān)聯(lián)規(guī)則等傳統(tǒng)的數(shù)據(jù)挖掘算法的直接使用上,醫(yī)學(xué)圖像數(shù)據(jù)是復(fù)雜和高維的,需要研究適合其特點(diǎn)的分類算法;③對于醫(yī)學(xué)圖像的識別僅局限于個(gè)別特定的組織器官,比如乳房,顱腦等,所取得的研究成果并不具有對其它器官知識挖掘應(yīng)用的普遍適應(yīng)性;方法所取特征僅僅是一些基本的顏色、紋理、形狀等特征,還沒有充分考慮醫(yī)學(xué)圖像本身的特點(diǎn);⑤分類方法訓(xùn)練時(shí)間長、準(zhǔn)確率低,不具有實(shí)用性。因此,尋找更加高效和準(zhǔn)確的醫(yī)學(xué)圖像識別方法是計(jì)算機(jī)和醫(yī)學(xué)研究工作者們所追求的。四
發(fā)明內(nèi)容本發(fā)明的目的在于針對現(xiàn)有方法的不足,提出一種醫(yī)學(xué)圖像識別的方法,該方法能更加準(zhǔn)確地識別出新醫(yī)學(xué)圖像的類別(正常與異常)。本發(fā)明的進(jìn)一步目的還在于能夠?qū)︶t(yī)學(xué)圖像庫內(nèi)的圖像進(jìn)行快速分類。本發(fā)明的再一個(gè)發(fā)明目的是醫(yī)學(xué)圖像快速并準(zhǔn)確地進(jìn)行類別識別。實(shí)現(xiàn)本發(fā)明目的的技術(shù)方案是一種醫(yī)學(xué)圖像識別的方法,包括關(guān)聯(lián)規(guī)則分類庫的構(gòu)造及其更新和醫(yī)學(xué)圖像識別步驟,其特征在于,所述關(guān)聯(lián)規(guī)則分類庫的構(gòu)造及其6更新步驟中包括下列步驟(1)醫(yī)學(xué)圖像樣本數(shù)據(jù)的準(zhǔn)備及預(yù)處理,包括醫(yī)學(xué)圖像的格式轉(zhuǎn)換、尺度歸一化以及去噪與增強(qiáng);(2)采用基于密度聚類的醫(yī)學(xué)圖像分割方法分別識別出每幅樣本醫(yī)學(xué)圖像中待分析的局部區(qū)域;(3)分別提取出每幅樣本醫(yī)學(xué)圖像中局部區(qū)域的特征,構(gòu)造醫(yī)學(xué)圖像樣本數(shù)據(jù)庫T,這些特征包括means(均值,它反映的是一副醫(yī)學(xué)圖像的平均灰度值)、variance(方差,它反映的是一副醫(yī)學(xué)圖像灰度在數(shù)值上的離散分布情況)、skewness(傾斜度,它反映的是醫(yī)學(xué)圖像直方圖分布的不對稱程度)、kurtosis(峰態(tài),它反映的是醫(yī)學(xué)圖像灰度分布在接近均值時(shí)的大致狀態(tài))、energy(能量,它反映的是灰度分布的均勻程度)、entropy(熵,它反映的是直方圖灰度分布的均勻性)和JF(聚類特征);(4)特征值離散化;(5)挖掘醫(yī)學(xué)圖像樣本數(shù)據(jù)庫中的頻繁項(xiàng)目集;(6)根據(jù)頻繁項(xiàng)目集構(gòu)造關(guān)聯(lián)規(guī)則分類庫。上述技術(shù)方案的有益效果如下醫(yī)學(xué)圖像是表達(dá)人體組織、器官等解剖結(jié)構(gòu)的信息集合,其信息很難用人類語言唯一描述,通常用如顏色、紋理、形狀、空間關(guān)系、圓形、方形、聚類等特征來表示或描述。本發(fā)明從醫(yī)學(xué)圖像的成像機(jī)制、醫(yī)學(xué)圖像數(shù)據(jù)的特性等方面入手,研究了醫(yī)學(xué)圖像的灰度及其密度與人體組織器官的解剖語義,給出了一種基于核密度估計(jì)聚類的醫(yī)學(xué)圖像定性特征表達(dá)方式,即本發(fā)明所述的聚類特征,聚類特征能夠很好地表達(dá)醫(yī)學(xué)圖像的語義內(nèi)容,與傳統(tǒng)的定量特性相比具有更好的可區(qū)分性。一般情況下,一幅醫(yī)學(xué)圖像包含許多豐富的組織,局部組織的病灶有時(shí)會與周圍正常組織在灰度、形狀上十分相似,整幅醫(yī)學(xué)圖像的特征可能無法反映出某一局部組織器官的微小病變,僅取圖像的全局特征顯然是不準(zhǔn)確的。本發(fā)明以醫(yī)學(xué)圖像底層次的可視特征為標(biāo)準(zhǔn),給出了一種醫(yī)學(xué)圖像的自動分割方法,將圖像中具有特殊含義的不同區(qū)域或組織區(qū)分開來,實(shí)現(xiàn)醫(yī)學(xué)圖像中人體組織器官的自動分割。本發(fā)明通過步驟(2)和步驟(3)的技術(shù)特征,建立起更科學(xué)合理的醫(yī)學(xué)圖像樣本數(shù)據(jù)庫,使得新圖像的類別識別更加準(zhǔn)確,達(dá)到本發(fā)明的發(fā)明目的。作為本發(fā)明的進(jìn)一步改進(jìn),所述步驟(5)中進(jìn)一步包括下列步驟①將醫(yī)學(xué)圖像樣本數(shù)據(jù)庫T分類,分為正常類Ti和異常T2;②分別構(gòu)造T!、T2的類別屬性除外的頻繁模式樹FPrt、FP2-t;③由FP!-t、FP2-t確定各自的頻繁項(xiàng)目集FI卜FI2。作為本發(fā)明的進(jìn)一步改進(jìn),所述步驟(6)中進(jìn)一步包括下列步驟分別計(jì)算頻繁項(xiàng)目集Fh、Fl2在T2和I^中的支持?jǐn)?shù);⑤根據(jù)閾值確定關(guān)聯(lián)規(guī)則分類規(guī)則;⑥存入關(guān)聯(lián)規(guī)則分類庫。上述改進(jìn)是針對現(xiàn)有關(guān)聯(lián)分類規(guī)則挖掘方法中內(nèi)存要求高、類別屬性處理難、1/0訪問次數(shù)多等問題提出了相應(yīng)的解決方案,本發(fā)明所提出的關(guān)聯(lián)分類規(guī)則挖掘方法同時(shí)考慮所有屬性,取得比同樣基于規(guī)則的決策樹分類算法C4.5更好的分類效果。作為本發(fā)明的進(jìn)一步改進(jìn),所述頻繁項(xiàng)目集更新步驟中進(jìn)一步包括下列步驟⑦候選新頻繁項(xiàng)目集的生成a處理新增醫(yī)學(xué)圖像,包括醫(yī)學(xué)圖像的格式轉(zhuǎn)換、尺度歸一化和去噪與增強(qiáng);b采用基于密度聚類的醫(yī)學(xué)圖像分割方法分別識別出每幅樣本醫(yī)學(xué)圖像中待分析的局部區(qū)域;c分別提取出每幅樣本醫(yī)學(xué)圖像中局部區(qū)域的特征,形成新增醫(yī)學(xué)圖像樣本數(shù)據(jù)t,這些特征包括means(均值,它反映的是一副醫(yī)學(xué)圖像的平均灰度值)、variance(方差,它反映的是一副醫(yī)學(xué)圖像灰度在數(shù)值上的離散分布情況)、skewness(傾斜度,它反映的是醫(yī)學(xué)圖像直方圖分布的不對稱程度)、kurtosis(峰態(tài),它反映的是醫(yī)學(xué)圖像灰度分布在接近均值時(shí)的大致狀態(tài))、energy(能量,它反映的是灰度分布的均勻程度)、entropy(熵,它反映的是直方圖灰度分布的均勻性)和JF(聚類特征);d特征值離散化;e掃描t求得n(FI=FI1UFI2)中各項(xiàng)目集在t中的支持?jǐn)?shù);f掃描t一次,確定T中的強(qiáng)頻繁項(xiàng)目集LT;g確定t中的候選強(qiáng)頻繁項(xiàng)目集C汰,k=l,2,...n;i.求t中的候選強(qiáng)頻繁項(xiàng)目集,所謂t中的強(qiáng)頻繁項(xiàng)目集是在指在t和tuT中均為頻繁的項(xiàng)目集;ii.使用函數(shù)Apriori-gen生成t中的候選新頻繁項(xiàng)目集,其參數(shù)為Ctk。本發(fā)明將新頻繁項(xiàng)目集的生成分為兩部分,一是T中新頻繁項(xiàng)目集的生成,二是t中新頻繁項(xiàng)目集的生成。對于前者,只需掃描t一次即可完成,其運(yùn)算量是很少的。對于后者,本發(fā)明采用了一種新的方法,具體是①求t中的候選強(qiáng)頻繁項(xiàng)目集,所謂t中的強(qiáng)頻繁項(xiàng)目集是在指在t和tuT中均為頻繁的項(xiàng)目集;②使用函數(shù)Apriori-gen生成t中的候選新頻繁項(xiàng)目集,其參數(shù)為t中的候選強(qiáng)頻繁項(xiàng)目集,可以證明此方法可以生成t中所有的新頻繁項(xiàng)目集,且其規(guī)模將遠(yuǎn)遠(yuǎn)低于現(xiàn)有更新方法。⑧候選新頻繁項(xiàng)目集的修剪iii.確認(rèn)新增醫(yī)學(xué)圖像樣本數(shù)據(jù)庫t的Qk是否為空,如果為空執(zhí)行步驟xW;iv.掃描t計(jì)算Qk中各項(xiàng)目集在t中的支持?jǐn)?shù);V.刪除Qk中t的非頻繁k-項(xiàng)目集;vi.刪除Ctk中T的頻繁k-項(xiàng)目集;vii.確定最小候選項(xiàng)目數(shù)閾值mc,mc=max{10,|Lk|*10%},|Lk|AT中頻繁k-項(xiàng)目集的個(gè)數(shù);viii.確認(rèn)ICtkpmc,如果成立,執(zhí)行步驟x;ix.掃描T計(jì)算Qk中各項(xiàng)目集在T中的支持?jǐn)?shù);X.生成t中的強(qiáng)頻繁k-項(xiàng)目集Ltk';Xi.生成t中的候選強(qiáng)頻繁(k+l)-項(xiàng)目集Ct(k+1);xii.使k:k+l;xiii.重復(fù)執(zhí)行步驟iii;xiv.產(chǎn)生最新樣本數(shù)據(jù)庫中的頻繁項(xiàng)目集FIw、FIn2。本發(fā)明除使用常用的修剪方法外,還采用了一種新的修剪方法,艮P:刪除準(zhǔn)則1:項(xiàng)目集XeCnk,minXT=min{CountT(Y)|YcX,|Y|=pC|-l}。如果Countt(X)+minXT<|Tut|xminSup,那么有XgLk,XgSFIt。其中,minSup表示最小支持度閾值,CountT(Y)表示項(xiàng)目集Y在T中的支持?jǐn)?shù),Countt(X)表示項(xiàng)目集X在t中的支持?jǐn)?shù),U為T中的頻繁k-項(xiàng)目集,SFIt為t中強(qiáng)頻繁項(xiàng)目集的集合。刪除準(zhǔn)則2:對于項(xiàng)目集X,如果Supt(X)2minSup,且X為T中的非頻繁項(xiàng)目集,那么有XgLk,XgSFIt成立。其中,Supt(X)表示項(xiàng)目集X在t中的支持度。一般情況下,t的規(guī)模要遠(yuǎn)遠(yuǎn)低于T的規(guī)模,相對于原頻繁項(xiàng)目集規(guī)模而言,新增頻繁項(xiàng)目集的規(guī)模總是很小的,為此本發(fā)明設(shè)置了一個(gè)最小候選項(xiàng)目數(shù)閾值mc,并給出了閾值mc的確定方法,mc的值可以取10和|1^|*10%中的最大值,當(dāng)候選新頻繁項(xiàng)目集的個(gè)數(shù)低于mc時(shí),暫不計(jì)算其支持?jǐn)?shù),其支持?jǐn)?shù)在下次掃描T時(shí)一起計(jì)算,從而不必為了求少數(shù)個(gè)項(xiàng)目集的支持?jǐn)?shù)而需掃描T一次。⑨關(guān)聯(lián)分類規(guī)則的構(gòu)造及更新根據(jù)頻繁項(xiàng)目集構(gòu)造關(guān)聯(lián)分類規(guī)則庫,關(guān)聯(lián)分類規(guī)則的形式為A^c,minsup,minconf。其中,c為類別屬性(在本發(fā)明中,c有兩類,即正常與異常),A為醫(yī)學(xué)圖像的特征及其范圍的集合,minsup、minconf分別表示關(guān)聯(lián)分類規(guī)則的支持度和置信度。如關(guān)聯(lián)分類規(guī)則variances(0.15,0.20)andJFe(0.90,0.95)-normal,minsupport=0.460,minconf=0.719。該規(guī)則表示若方差(variance)在0.15與0.20之間,聚類特征(JF)在0.90與0.95之間時(shí),該醫(yī)學(xué)圖像為正常(normal)的概率為0.719,此規(guī)則的置信度為0.46。本發(fā)明在頻繁項(xiàng)目集的挖掘和更新中,主要在以下兩方面進(jìn)行了改進(jìn)1.在對現(xiàn)有頻繁項(xiàng)目集更新方法中所存在不足提出了如下的解決方案(1)候選項(xiàng)目集的規(guī)模。主要表現(xiàn)在以下兩個(gè)方面①在現(xiàn)有更新方法中,掃描t的候選項(xiàng)目集C=Apriori-gen(L'(k-d),在本發(fā)明中,掃描1的候選項(xiàng)目集0=Apriori-gen(L't(k-d)。由于LVd^L,t(^),因此在掃描t時(shí),本發(fā)明將有更小的候選頻繁項(xiàng)目集;②在本發(fā)明中,一方面t中較小的候選頻繁項(xiàng)目集將導(dǎo)致較小的候選新頻繁項(xiàng)目集;另一方面,刪除準(zhǔn)則1和2的使用進(jìn)一步減少了候選新頻繁項(xiàng)目集的數(shù)目,因此,在掃描T時(shí),本發(fā)明將具有更小的候選頻繁項(xiàng)目集。(2)掃描事務(wù)數(shù)據(jù)庫的次數(shù)。主要表現(xiàn)在以下兩個(gè)方面①一方面,T中更小的候選頻繁項(xiàng)目集將導(dǎo)致掃描T次數(shù)的減少。另一方面,步驟⑧中最小候選項(xiàng)目數(shù)閾值mc的設(shè)置可以進(jìn)一步減少掃描T的次數(shù),因此,本發(fā)明中更新醫(yī)學(xué)圖像樣本數(shù)據(jù)庫時(shí),掃描數(shù)據(jù)庫T的次數(shù)更少。②在現(xiàn)有更新方法中,掃描t的結(jié)束條件是Ctk=-,而在本發(fā)明中,掃描t的結(jié)束條件是<:,.汰=-。由于C汰2C,tk,因此本發(fā)明在掃描t的次數(shù)上較小。總之,本發(fā)明在掃描醫(yī)學(xué)圖像樣本數(shù)據(jù)庫T的次數(shù)、掃描新增醫(yī)學(xué)圖像樣本數(shù)據(jù)庫t的次數(shù)以及候選項(xiàng)目集規(guī)模上均占較大的優(yōu)勢。作為本發(fā)明的進(jìn)一步改進(jìn),所述醫(yī)學(xué)圖像的識別步驟進(jìn)一步包括下列步驟①「待處理醫(yī)學(xué)圖像數(shù)據(jù)的準(zhǔn)備及預(yù)處理,包括醫(yī)學(xué)圖像的格式轉(zhuǎn)換、尺度歸一化以及去噪與增強(qiáng);②「采用基于密度聚類的醫(yī)學(xué)圖像分割方法識別出該幅醫(yī)學(xué)圖像中待分析的局部區(qū)域;③「提取出該幅醫(yī)學(xué)圖像中局部區(qū)域的特征,這些特征包括means(均值,它反映的是一副醫(yī)學(xué)圖像的平均灰度值)、variance(方差,它反映的是一副醫(yī)學(xué)圖像灰度在數(shù)值上的離散分布情況)、skewness(傾斜度,它反映的是醫(yī)學(xué)圖像直方圖分布的不對稱程度)、kurtosis(峰態(tài),它反映的是醫(yī)學(xué)圖像灰度分布在接近均值時(shí)的大致狀態(tài))、energy(能量,它反映的是灰度分布的均勻程度)、entropy(熵,它反映的是直方圖灰度分布的均勻性)和JF(聚類特征);④「特征值離散化;(D「根據(jù)關(guān)聯(lián)規(guī)則分類庫中的規(guī)則確定該醫(yī)學(xué)圖像的類別(正?;虍惓?。如給定一張醫(yī)學(xué)圖像,其類別屬性是未知的,經(jīng)預(yù)處理及特征提取后的特征值為VarianCe=0.17、JF=0.92,則根據(jù)關(guān)聯(lián)分類規(guī)則庫中已有的分類規(guī)則可以確定該醫(yī)學(xué)圖像為正常的概率為0.719,相應(yīng)的置信度為0.46。圖1是本發(fā)明實(shí)施例的結(jié)構(gòu)框圖圖2是本發(fā)明實(shí)施例中頻繁項(xiàng)目集挖掘流程圖圖3是本發(fā)明實(shí)施例中關(guān)聯(lián)分類規(guī)則庫構(gòu)造流程圖4是本發(fā)明實(shí)施例中候選項(xiàng)目閾值與時(shí)間關(guān)系圖圖5是本發(fā)明實(shí)施例中頻繁項(xiàng)目集更新流程圖結(jié)構(gòu)圖圖6是本發(fā)明實(shí)施例中的頻繁模式樹FPH結(jié)構(gòu)圖具體實(shí)施例方式下面以肝臟CT醫(yī)學(xué)圖像為例,簡單地說明本發(fā)明的執(zhí)行過程。本實(shí)例共選擇了120幅肝臟CT圖像,其中正常圖像80幅,異常圖像40幅,具體執(zhí)行步驟如下如圖1所示,一種醫(yī)學(xué)圖像識別的方法,包括關(guān)聯(lián)規(guī)則分類庫的構(gòu)造及其更新和醫(yī)學(xué)圖像識別步驟,其特征在于,所述關(guān)聯(lián)規(guī)則分類庫的構(gòu)造及其更新步驟中包括下列步驟(1)分別對這120幅肝臟CT圖像進(jìn)行格式轉(zhuǎn)換以及醫(yī)學(xué)圖像去噪和增強(qiáng)處理等。(2)分別提取每張圖像的相關(guān)特征并進(jìn)行歸一化處理,結(jié)果如表1所示。本發(fā)明提取的特征包括均值、方差、傾斜度、峰態(tài)、能量、熵和聚類特征。在這120幅圖像中,前面100幅作為原樣本數(shù)據(jù),后20幅作為增量樣本數(shù)據(jù)。表l肝臟CT醫(yī)學(xué)圖像特征表<table>tableseeoriginaldocumentpage11</column></row><table><table>tableseeoriginaldocumentpage12</column></row><table><table>tableseeoriginaldocumentpage13</column></row><table><table>tableseeoriginaldocumentpage14</column></row><table><table>tableseeoriginaldocumentpage15</column></row><table>其中node-name記錄結(jié)點(diǎn)所表示的項(xiàng)目名,node-count記錄能到達(dá)該結(jié)點(diǎn)的醫(yī)學(xué)圖像數(shù),node-link為指向頻繁模式樹中具有相同的node-name值的下一結(jié)點(diǎn),即通過node-link將頻繁模式樹中具有相同node-name值的結(jié)點(diǎn)鏈接起來,node-parent為指向父結(jié)點(diǎn)的指針。另外,為了方便樹遍歷,創(chuàng)建一個(gè)頻繁項(xiàng)目頭表,它由兩個(gè)域組成項(xiàng)目名稱item-name以及結(jié)點(diǎn)鏈頭node-head,其中node-head為指向頻繁模式樹中具有相同node-name值的首結(jié)點(diǎn)的指針。類別屬性為正常的前五條記錄所形成的頻繁模式樹如圖6所示,圖中結(jié)點(diǎn)形式已略做簡化。其余記錄可用同樣的方法插入樹FP"中。同樣可以構(gòu)造頻繁模式樹FP2-t。(6)在FPrt、FP2-t上挖掘出頻繁項(xiàng)目集,得到頻繁項(xiàng)目集和FI2。設(shè)最小支持度為0.4,則FI產(chǎn)U聚類特征48》,{傾斜度=01},{聚類特征=18,傾斜度=01},{聚類特征=18,傾斜度=01,均值=20,熵=11,峰態(tài)=05},......},?12={{聚類特征=04},{聚類特征=04,方差=11,傾斜度=10,能量=04},......}。(7)使用FIi和Fl2構(gòu)造關(guān)聯(lián)分類規(guī)則,如FIi中的頻繁項(xiàng)目集(聚類特征48,傾斜度=01,均值=20,熵=11,峰態(tài)=05}所構(gòu)造的分類規(guī)則為{聚類特征=18,傾斜度=01,均值=20,熵-11,峰態(tài)=05}=*正常,F(xiàn)l2中的頻繁項(xiàng)目集(聚類特征-04,方差=11,傾斜度=10,能量=04}所構(gòu)造的分類規(guī)則為{聚類特征=04,方差=11,傾斜度=10,能量^4)^異常。在實(shí)際使用時(shí),應(yīng)分別將數(shù)字屬性轉(zhuǎn)換成相應(yīng)的區(qū)間,即將i,2,3,...,20分別轉(zhuǎn)換成(0.00,0.05],(0.05,0.10],...,(0.95,1.00]。關(guān)聯(lián)分類規(guī)則庫構(gòu)造流程如圖3所示,具體包括①分別計(jì)算頻繁項(xiàng)目集FI,、Fl2在T2和T,中的支持?jǐn)?shù);②根據(jù)閾值確定關(guān)聯(lián)規(guī)則分類規(guī)則;③存入關(guān)聯(lián)規(guī)則分類庫。(8)使用表1中的后20條記錄更新頻繁項(xiàng)目集FL和Fh。如FI!中的頻繁項(xiàng)目集{聚類特征=18,傾斜度=01,均值=20,熵=11,峰態(tài)=05}將變?yōu)閧聚類特征=18,傾斜度=01,均值=20,熵=11,峰態(tài)=04}等等。頻繁項(xiàng)目集FI,和Fl2更新過程如圖5所示。具體如下④候選新頻繁項(xiàng)目集的生成a處理新增醫(yī)學(xué)圖像,包括醫(yī)學(xué)圖像的格式轉(zhuǎn)換、尺度歸一化和去噪與增強(qiáng);b采用基于密度聚類的醫(yī)學(xué)圖像分割方法分別識別出每幅樣本醫(yī)學(xué)圖像中待分析的局部區(qū)域;c分別提取出每幅樣本醫(yī)學(xué)圖像中局部區(qū)域的特征,這些特征包括means(均值,它反映的是一副醫(yī)學(xué)圖像的平均灰度值)、variance(方差,它反映的是一副醫(yī)學(xué)圖像灰度在數(shù)值上的離散分布情況)、skewness(傾斜度,它反映的是醫(yī)學(xué)圖像直方圖分布的不對稱程度)、kurtosis(峰態(tài),它反映的是醫(yī)學(xué)圖像灰度分布在接近均值時(shí)的大致狀態(tài))、energy(能量,它反映的是灰度分布的均勻程度)、entropy(熵,它反映的是直方圖灰度分布的均勻性)和JF(聚類特征);d特征值離散化,形成新增醫(yī)學(xué)圖像樣本數(shù)據(jù)庫t;e掃描t求得FI(FbFIi^Fl2)中各項(xiàng)目集在t中的支持?jǐn)?shù);f掃描t一次,確定T中的強(qiáng)頻繁項(xiàng)目集LT;g確定t中的候選強(qiáng)頻繁項(xiàng)目集C汰,k=l,2,...n;i.求t中的候選強(qiáng)頻繁項(xiàng)目集,所謂t中的強(qiáng)頻繁項(xiàng)目集是在指在t和tuT中均為頻繁的項(xiàng)目集;ii.使用函數(shù)Apriori-gen生成t中的候選新頻繁項(xiàng)目集,其參數(shù)為Ctk。⑤候選新頻繁項(xiàng)目集的修剪iii.確認(rèn)新增醫(yī)學(xué)圖像樣本數(shù)據(jù)庫t的Qk是否為空,如果為空執(zhí)行步驟xiv;iv.掃描t計(jì)算Qk中各項(xiàng)目集在t中的支持?jǐn)?shù);V.刪除Qk中t的非頻繁k-項(xiàng)目集;Vi.刪除C汰中T的頻繁k-項(xiàng)目集;vii.確定最小候選項(xiàng)目數(shù)閾值mc,mc=max{10,|Lk|*10%},|Lk|AT中頻繁k-項(xiàng)目集的個(gè)數(shù);viii.確認(rèn)ICtkpmc,如果成立,執(zhí)行步驟x;ix.掃描T計(jì)算Qk中各項(xiàng)目集在T中的支持?jǐn)?shù);x.生成t中的強(qiáng)頻繁k-項(xiàng)目集Ltk,;xi.生成t中的候選強(qiáng)頻繁(k+l)-項(xiàng)目集Ct(k+1);xii.使k二k+l;xiii.重復(fù)執(zhí)行步驟iii;xiv.產(chǎn)生最新樣本數(shù)據(jù)庫中的頻繁項(xiàng)目集F^、FIn2。如圖1所示,肝臟CT醫(yī)學(xué)圖像類別識別流程如下⑥「待處理醫(yī)學(xué)圖像數(shù)據(jù)的準(zhǔn)備及預(yù)處理,包括醫(yī)學(xué)圖像的格式轉(zhuǎn)換、尺度歸一化以及去噪與增強(qiáng);⑦「采用基于密度聚類的醫(yī)學(xué)圖像分割方法識別出該幅醫(yī)學(xué)圖像中待分析的局部區(qū)域;⑧「提取出該幅醫(yī)學(xué)圖像中局部區(qū)域的特征,這些特征包括means(均值,它反映的是一副醫(yī)學(xué)圖像的平均灰度值)、variance(方差,它反映的是一副醫(yī)學(xué)圖像灰度在數(shù)值上的離散分布情況)、skewness(傾斜度,它反映的是醫(yī)學(xué)圖像直方圖分布的不對稱程度)、kurtosis(峰態(tài),它反映的是醫(yī)學(xué)圖像灰度分布在接近均值時(shí)的大致狀態(tài))、energy(能量,它反映的是灰度分布的均勻程度)、entropy(熵,它反映的是直方圖灰度分布的均勻性)和JF(聚類特征);⑨rf寺征值離散化;⑩「根據(jù)關(guān)聯(lián)規(guī)則分類庫中的規(guī)則確定該醫(yī)學(xué)圖像的類別(正?;虍惓?。權(quán)利要求1.一種醫(yī)學(xué)圖像識別的方法,包括關(guān)聯(lián)規(guī)則分類庫的構(gòu)造及其更新和醫(yī)學(xué)圖像識別步驟,其特征在于,所述關(guān)聯(lián)規(guī)則分類庫的構(gòu)造及其更新步驟中包括下列步驟(1)醫(yī)學(xué)圖像樣本數(shù)據(jù)的準(zhǔn)備及預(yù)處理,包括醫(yī)學(xué)圖像的格式轉(zhuǎn)換、尺度歸一化以及去噪與增強(qiáng);(2)采用基于密度聚類的醫(yī)學(xué)圖像分割方法分別識別出每幅樣本醫(yī)學(xué)圖像中待分析的局部區(qū)域;(3)分別提取出每幅樣本醫(yī)學(xué)圖像中局部區(qū)域的特征,構(gòu)造醫(yī)學(xué)圖像樣本數(shù)據(jù)庫T,這些特征包括均值、方差、傾斜度、峰態(tài)、能量、熵和聚類特征;(4)特征值離散化;(5)挖掘醫(yī)學(xué)圖像樣本數(shù)據(jù)庫中的頻繁項(xiàng)目集;根據(jù)頻繁項(xiàng)目集構(gòu)造關(guān)聯(lián)規(guī)則分類庫。2、根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟(5)中進(jìn)一步包括下列步驟①將醫(yī)學(xué)圖像樣本數(shù)據(jù)庫T分類,分為正常類T,和異常T2;②分別構(gòu)造Ti、T2的類別屬性除外的頻繁模式樹FPH、FP2-t;③由FP廣t、FP2-t確定各自的頻繁項(xiàng)目集FI"FI2。3、根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟(6)中進(jìn)一步包括下列步驟④分別計(jì)算頻繁項(xiàng)目集FI卜Fb在丁2和1中的支持?jǐn)?shù);⑤根據(jù)閾值確定關(guān)聯(lián)規(guī)則分類規(guī)則;⑥存入關(guān)聯(lián)規(guī)則分類庫。4、根據(jù)權(quán)利要求1所述的識別方法,其特征在于,頻繁項(xiàng)目集更新步驟中進(jìn)一步包括下列步驟⑦候選新頻繁項(xiàng)目集的生成a處理新增醫(yī)學(xué)圖像,包括醫(yī)學(xué)圖像的格式轉(zhuǎn)換、尺度歸一化和去噪與增強(qiáng);b采用基于密度聚類的醫(yī)學(xué)圖像分割方法分別識別出每幅樣本醫(yī)學(xué)圖像中待分析的局部區(qū)域;c分別提取出每幅樣本醫(yī)學(xué)圖像中局部區(qū)域的特征,形成新增醫(yī)學(xué)圖像樣本數(shù)據(jù)t,這些特征包括means(均值,它反映的是一副醫(yī)學(xué)圖像的平均灰度值)、variance(方差,它反映的是一副醫(yī)學(xué)圖像灰度在數(shù)值上的離散分布情況)、skewness(傾斜度,它反映的是醫(yī)學(xué)圖像直方圖分布的不對稱程度)、kurtosis(峰態(tài),它反映的是醫(yī)學(xué)圖像灰度分布在接近均值時(shí)的大致狀態(tài))、energy(能量,它反映的是灰度分布的均勻程度)、entropy(熵,它反映的是直方圖灰度分布的均勻性)和JF(聚類特征);d特征值離散化;e掃描t求得FI(FI=FIiUFI2)中各項(xiàng)目集在t中的支持?jǐn)?shù);f掃描t一次,確定T中的強(qiáng)頻繁項(xiàng)目集LT;g確定t中的候選強(qiáng)頻繁項(xiàng)目集Qk,k=l,2,...n;i.求t中的候選強(qiáng)頻繁項(xiàng)目集,所謂t中的強(qiáng)頻繁項(xiàng)目集是在指在t和tuT中均為頻繁的項(xiàng)目集;ii.使用函數(shù)Apriori-gen生成t中的候選新頻繁項(xiàng)目集,其參數(shù)為Qk。①候選新頻繁項(xiàng)目集的修剪;②關(guān)聯(lián)分類規(guī)則的構(gòu)造及更新。5、根據(jù)權(quán)利要求1所述的識別方法,其特征在于,所述醫(yī)學(xué)圖像的識別步驟進(jìn)一步包括下列步驟③待處理醫(yī)學(xué)圖像數(shù)據(jù)的準(zhǔn)備及預(yù)處理,包括醫(yī)學(xué)圖像的格式轉(zhuǎn)換、尺度歸一化以及去噪與增強(qiáng);采用基于密度聚類的醫(yī)學(xué)圖像分割方法識別出該幅醫(yī)學(xué)圖像中待分析的局部區(qū)域;◎提取出該幅醫(yī)學(xué)圖像中局部區(qū)域的特征,這些特征包括均值、方差,、傾斜度,它反映的是醫(yī)學(xué)圖像直方圖分布的不對稱程度、峰態(tài)、能量和熵;⑥特征值離散化;⑦根據(jù)關(guān)聯(lián)規(guī)則分類庫中的規(guī)則確定該醫(yī)學(xué)圖像的類別。6、根據(jù)權(quán)利要求4所述的方法,其特征在于,所述步驟⑧具體包括下列步驟iii.確認(rèn)新增醫(yī)學(xué)圖像樣本數(shù)據(jù)庫t的Ctk是否為空,如果為空執(zhí)行步驟xiv;iv.掃描t計(jì)算Qk中各項(xiàng)目集在t中的支持?jǐn)?shù);V.刪除Qk中t的非頻繁k-項(xiàng)目集;Vi.刪除Qk中T的頻繁k-項(xiàng)目集;vii.確定最小候選項(xiàng)目數(shù)閾值mc,mc=max{10,|Lk|*10%},|Lk^T中頻繁k-項(xiàng)目集的個(gè)數(shù);viii.確認(rèn)ICtkpmc,如果成立,執(zhí)行步驟x;ix.掃描T計(jì)算Qk中各項(xiàng)目集在T中的支持?jǐn)?shù);X.生成t中的強(qiáng)頻繁k-項(xiàng)目集Ltk';Xi.生成t中的候選強(qiáng)頻繁(k+l)-項(xiàng)目集Q(k+1);xii.使k-k+l;xiii.重復(fù)執(zhí)行步驟iii;xiv.產(chǎn)生最新樣本數(shù)據(jù)庫中的頻繁項(xiàng)目集F^、FIn2。7、根據(jù)權(quán)利要求4所述的方法,其特征在于,所述步驟⑨具體包括下列步驟根據(jù)頻繁項(xiàng)目集構(gòu)造關(guān)聯(lián)分類規(guī)則庫,關(guān)聯(lián)分類規(guī)則的形式為A^C,minsup,minconf;其中,c為類別屬性,包括正常類與異常類,A為醫(yī)學(xué)圖像的特征及其范圍的集合,minsup、minconf分別表示關(guān)聯(lián)分類規(guī)則的支持度和置信度。全文摘要本發(fā)明涉及一種醫(yī)學(xué)圖像識別的方法,目的在于提供一種能更準(zhǔn)確地識別出新醫(yī)學(xué)圖像的類別的方法。該方法包括關(guān)聯(lián)規(guī)則分類庫的構(gòu)造及其更新和醫(yī)學(xué)圖像識別步驟,所述關(guān)聯(lián)規(guī)則分類庫的構(gòu)造及其更新步驟中包括下列步驟醫(yī)學(xué)圖像樣本數(shù)據(jù)的準(zhǔn)備及預(yù)處理;采用基于密度聚類的醫(yī)學(xué)圖像分割方法分別識別出每幅樣本醫(yī)學(xué)圖像中待分析的局部區(qū)域;分別提取出每幅樣本醫(yī)學(xué)圖像中局部區(qū)域的特征,構(gòu)造醫(yī)學(xué)圖像樣本數(shù)據(jù)庫T,這些特征包括均值、方差、傾斜度、峰態(tài)、能量、熵和聚類特征;特征值離散化;特征值離散化;挖掘醫(yī)學(xué)圖像樣本數(shù)據(jù)庫中的頻繁項(xiàng)目集;根據(jù)頻繁項(xiàng)目集構(gòu)造關(guān)聯(lián)規(guī)則分類庫。文檔編號G06F19/00GK101295309SQ200810024999公開日2008年10月29日申請日期2008年5月22日優(yōu)先權(quán)日2008年5月22日發(fā)明者蕾孫,宋余慶,峰朱,朱玉全,謝從華,耿陳申請人:江蘇大學(xué)