基于稀疏非負(fù)張量分解的大腦特定視覺認(rèn)知狀態(tài)判定方法
【專利摘要】本發(fā)明公開了基于稀疏非負(fù)張量分解的大腦特定視覺認(rèn)知狀態(tài)判定方法,其創(chuàng)新點(diǎn)在于,采用SNTF算法,把fMRI認(rèn)知數(shù)據(jù)當(dāng)成一個(gè)大張量,從張量的層面上構(gòu)建高階非負(fù)張量模型,然后對fMRI認(rèn)知數(shù)據(jù)每個(gè)維度上進(jìn)行特征降維,從而得到維度較小的稀疏非負(fù)特征張量,最后結(jié)合支持向量機(jī)的特點(diǎn),有效地實(shí)現(xiàn)對大腦特定視覺的認(rèn)知狀態(tài)的判定。本發(fā)明的方法利用稀疏非負(fù)張量分解進(jìn)行降維和特征提取多方向、多角度的提取出原有數(shù)據(jù)中的潛在結(jié)構(gòu)信息,由于l1范數(shù)正則化和非負(fù)性的約束使得提取出的相關(guān)成分更稀疏,合乎大腦感知的直觀體驗(yàn),再結(jié)合支持向量機(jī)的特點(diǎn),提高了分類判別的準(zhǔn)確性。
【專利說明】基于稀疏非負(fù)張量分解的大腦特定視覺認(rèn)知狀態(tài)判定方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于生物特征提取以及大腦認(rèn)知狀態(tài)判別領(lǐng)域,涉及與任務(wù)相關(guān)的功能核磁成像(functional magnetic resonance images,即fMRI)的預(yù)處理、稀疏非負(fù)張量分解(sparse nonnegative tensor factorization,即 SNTF)的特征提取和支持向量機(jī)(support vector machine,即SVM)的判別分類,具體涉及一種基于稀疏非負(fù)張量分解的大腦特定視覺認(rèn)知狀態(tài)判定方法,可用于生物特征提取、維度約減、模式識別等領(lǐng)域。
【背景技術(shù)】
[0002]近年來,隨著腦功能磁共振成像(functionalMagnetic Resonance Imaging,fMRI)技術(shù)的發(fā)展,人們進(jìn)行腦研究的能力大大增強(qiáng),與此同時(shí)也產(chǎn)生了大量的數(shù)據(jù),而僅僅利用計(jì)算機(jī)對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行簡單的存儲、查詢和計(jì)算,根本無法挖掘出數(shù)據(jù)背后隱藏的大量信息,更不能滿足研究的需求。因此,必須利用數(shù)據(jù)挖掘的方法,合理組織腦功能成像數(shù)據(jù),把目前散亂的研究數(shù)據(jù)和結(jié)果加以有序化,整合心理學(xué)、語言學(xué)、腦科學(xué)等不同層次的研究數(shù)據(jù),運(yùn)用先進(jìn)的信息學(xué)工具和方法幫助研究人員對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析、處理、整合和建模,從而發(fā)現(xiàn)新的規(guī)律,揭示腦高級認(rèn)知活動(dòng)的深層機(jī)制。
[0003]目前fMRI已被廣泛的用來研究腦在執(zhí)行某項(xiàng)認(rèn)知功能時(shí)的激活,而已有的研究工作大多是比較不同任務(wù)的腦圖或任務(wù)腦圖與靜息腦圖之間的差異。但fMRI所采集的數(shù)據(jù)是一類維度高、數(shù)據(jù)量大,結(jié)構(gòu)特別復(fù)雜的數(shù)據(jù)。因此,腦fMRI數(shù)據(jù)分析是一件困難而意義重大的工作,它直接決定了采用fMRI方法進(jìn)行腦功能研究的成敗。目前對fMRI數(shù)據(jù)分析的技術(shù)有多種,其中比較流行的有相關(guān)分析、方差分析、獨(dú)立成分分析等。
[0004]相關(guān)分析是利用實(shí)驗(yàn)任務(wù)的先驗(yàn)知識來確定激活區(qū)和它們的強(qiáng)度,該方法的不足之處在于如果實(shí)驗(yàn)的fMRI信號變化的模型是未知的或不是常量時(shí),例如,受試者是腦疾病患者或者正在進(jìn)行復(fù)雜的學(xué)習(xí)任務(wù),這種技術(shù)就不能探測出激活區(qū)。
[0005]方差分析需要數(shù)據(jù)滿足4個(gè)假設(shè):(I)隨機(jī)變量的分布是已知的;(2)每次實(shí)驗(yàn)都有相同的方差和協(xié)方差;(3)不同因子的時(shí)間序列可預(yù)先被可靠地估計(jì);(4)不同像素的信號是獨(dú)立的,然而fMRI數(shù)據(jù)并不能保證滿足所有的假設(shè)。
[0006]獨(dú)立成分分析(Independent Component Analysis,即ICA)是一種米用高階統(tǒng)計(jì)量的盲源分析方法(Blind Source Separation,即BSS),目的在于從未知源信號的觀測混合信號中分離(或抽取)相互統(tǒng)計(jì)獨(dú)立的源信號。但該方法有一定的局限性:
[0007](I)在單任務(wù)刺激中,ICA方法可以成功地分離出與任務(wù)相關(guān)的分量,主要是因?yàn)樵撊蝿?wù)與其它的心理活動(dòng)所激活的腦區(qū)之間是空間獨(dú)立的。但是,在多任務(wù)的情況下,我們不能假定不同任務(wù)所激活的腦區(qū)是空間獨(dú)立的,因此,利用ICA方法進(jìn)行功能定位必然受到局限。
[0008](2) ICA方法分解的獨(dú)立成分往往會有負(fù)成分的存在,即它不一定保證分解的成分是非負(fù)的。從計(jì)算的角度來看,分解的結(jié)果中可以存在負(fù)值,但負(fù)值元素在實(shí)際問題中往往缺失物理意義。[0009]目前常用的分析方法的共同點(diǎn)是允許分解后的結(jié)果中出現(xiàn)負(fù)值,但就應(yīng)用角度看負(fù)值是沒有實(shí)際意義的,采用非負(fù)矩陣分解通過添加“矩陣中所有元素均為非負(fù)數(shù)”的限制條件,可以保證分解結(jié)果的可解釋性,同時(shí),它還具有實(shí)現(xiàn)簡便和占用存儲空間小的優(yōu)點(diǎn),從而更加貼近應(yīng)用領(lǐng)域的特點(diǎn),此外上述數(shù)據(jù)分析方法很少從機(jī)器學(xué)習(xí)的層面上進(jìn)行大腦認(rèn)知判定。文獻(xiàn)“Padilla P, Lopez M, Gorriz J M, et al.NMF-SVM Based CAD ToolApplied to Functional Brain Images for the Diagnosis of Alzheimer’s Disease[J].Medical Imaging, IEEE Transactions on,2012,31 (2): 207-216.”利用 NMF (非負(fù)矩陣)對fMRI數(shù)據(jù)進(jìn)行特征提取,同時(shí)結(jié)合支持向量機(jī)的特點(diǎn)獲取了對癡呆病人的診斷。在進(jìn)行特征提取時(shí),它先將fMRI數(shù)據(jù)矢量化處理,然后利用非負(fù)矩陣進(jìn)行特征分解。非負(fù)矩陣是盲源分析方法的一種,即它不需要人為設(shè)定參數(shù)或是根據(jù)任何經(jīng)驗(yàn)?zāi)P蛯τ?jì)算進(jìn)行干預(yù),最后的結(jié)果只與數(shù)據(jù)相關(guān),同時(shí)它也克服了矩陣分解中負(fù)成分存在的局限性。正是由于具有非負(fù)性和稀疏性等特點(diǎn),使得它對于特征提取和數(shù)據(jù)降維都具有很好的效果。在模式識別領(lǐng)域,它已成功運(yùn)用到了人臉圖像的識別當(dāng)中。
[0010]但是,在現(xiàn)代科學(xué)技術(shù)和工程問題中常常會碰到大量的大規(guī)模數(shù)據(jù)處理問題,而非負(fù)矩陣分解在對大規(guī)模高維數(shù)據(jù)處理時(shí),僅僅是將圖像數(shù)據(jù)矢量化再根據(jù)特征值和特征向量進(jìn)行特征提取,而忽略了處理對象往往是多維數(shù)據(jù)這個(gè)因素,從而造成了只在一個(gè)方向上投射而導(dǎo)致的降維效果不理想以及破壞了原始圖像的結(jié)構(gòu)和相關(guān)性,不能完全保持原始圖像中的冗余和結(jié)構(gòu)等問題。
[0011]作為向量和矩陣的推廣,張量相當(dāng)于一個(gè)高維的矩陣。由于張量模型可以處理指標(biāo)集為多維的數(shù)據(jù),所以相比矩陣模型其更能接近于實(shí)際問題的屬性,因此能更好地描述實(shí)際問題。同矩陣的低秩逼近的思想一樣,對于高階張量模型人們也想借助于張量的分解模型來提取張量模型數(shù)據(jù)中潛在的內(nèi)部結(jié)構(gòu)信息。
【發(fā)明內(nèi)容】
[0012]本發(fā)明針對傳統(tǒng)矩陣分解模型和方法的不足,結(jié)合機(jī)器學(xué)習(xí)中支持向量機(jī)(SVM)的特點(diǎn),提出了一種基于稀疏非負(fù)張量分解(SNTF)的大腦特定視覺認(rèn)知狀態(tài)判定方法。
[0013]為解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案:結(jié)合SNTF和SVM的特點(diǎn),利用SNTF-SVM算法有效地進(jìn)行大腦所處認(rèn)知任務(wù)狀態(tài)的鑒別。實(shí)現(xiàn)本發(fā)明目的的技術(shù)思路是,對從磁共振機(jī)器采集到的靜息態(tài)數(shù)據(jù)先進(jìn)行預(yù)處理分析,然后利用稀疏限制的非負(fù)張量(SNTF)方法分離出一個(gè)或多個(gè)與實(shí)驗(yàn)任務(wù)相關(guān)的獨(dú)立成分,得到與腦部任務(wù)相關(guān)的激活區(qū)域,最后利用支持向量機(jī)(SVM),獲得對大腦認(rèn)知狀態(tài)的判定。
[0014]本發(fā)明的方法包括如下步驟:
[0015]步驟一:輸入樣本集,對fMRI認(rèn)知數(shù)據(jù)進(jìn)行預(yù)處理,并把樣本集按照掃描時(shí)間序列以及行為實(shí)驗(yàn)類別重新組合,并分為訓(xùn)練集和測試集兩部分,每部分都包含一定比例的認(rèn)知數(shù)據(jù)。
[0016]對輸入數(shù)據(jù)進(jìn)行預(yù)處理,具體步驟如下:
[0017]a、對磁共振采集到的數(shù)據(jù)進(jìn)行時(shí)間差異矯正,時(shí)間差異矯正就是矯正I個(gè)volume中層與層之間的采集時(shí)間的差異,進(jìn)而保證各層之間都是從相同的時(shí)間得到的;
[0018]b、由于腦功能成像實(shí)驗(yàn)持續(xù)時(shí)間比較長,被試的呼吸、血流脈動(dòng)等生理因素造成的頭部運(yùn)動(dòng)在所難免,所以對時(shí)間矯正過的數(shù)據(jù)進(jìn)行頭動(dòng)對齊,也就是將一個(gè)序列的每一幀圖像都和這個(gè)序列的第一幀圖像進(jìn)行配準(zhǔn),配準(zhǔn)到同一坐標(biāo)系下,以矯正頭動(dòng),對齊后再對頭動(dòng)矯正后的數(shù)據(jù)進(jìn)行人工檢查,如果平移和旋轉(zhuǎn)分別超過I毫米和I度就排除掉、不予分析;
[0019]C、頭動(dòng)對齊后的數(shù)據(jù)空間標(biāo)準(zhǔn)化,試驗(yàn)中存在多個(gè)被試,被試和被試之間的腦部大小形狀存在一定的差異,為了后續(xù)的統(tǒng)計(jì)分析,須進(jìn)行大腦形狀的歸一化,將被試的大腦配準(zhǔn)歸一化到標(biāo)準(zhǔn)的大腦模板上;
[0020]d、米用6毫米半高全寬(FWHM,Full Width at Half Maximum)的高斯核函數(shù)平滑處理標(biāo)準(zhǔn)化后的數(shù)據(jù),以達(dá)到降低噪聲、提高信噪比及消除不同被試腦結(jié)構(gòu)之間的細(xì)微差別的目的;
[0021]e、將預(yù)處理后的圖像數(shù)據(jù)按照掃描時(shí)間序列以及行為實(shí)驗(yàn)類別進(jìn)行重新組合,并將其與包括灰質(zhì)、白質(zhì)、腦脊液的統(tǒng)計(jì)模版進(jìn)行匹配,去除白質(zhì)區(qū)域,構(gòu)成樣本數(shù)據(jù)集;
[0022]f、將樣本集按照掃描時(shí)間序列以及行為實(shí)驗(yàn)類別重新組合,并分為訓(xùn)練集和測試集兩部分,每部分都包含一定比例的認(rèn)知數(shù)據(jù)。
[0023]步驟二:計(jì)算訓(xùn)練樣本集的特征分解,求出特征向量以及特征變換矩陣,將樣本投射到特征子空間,得到特征張量,之后直接矢量化,得到訓(xùn)練集的特征向量集。
[0024]計(jì)算訓(xùn)練樣本的特征分解,求出特征張量以及最優(yōu)稀疏特征變換矩陣
【權(quán)利要求】
1.基于稀疏非負(fù)張量分解的大腦特定視覺認(rèn)知狀態(tài)判定方法,其特征在于:采用基于張量模型的稀疏非負(fù)張量分解(SNTF)的特征降維和支持向量機(jī)(SVM)的分類判定,包括如下步驟: 1)輸入樣本集,對fMRI認(rèn)知數(shù)據(jù)進(jìn)行預(yù)處理,并把樣本集按照掃描時(shí)間序列以及行為實(shí)驗(yàn)類別重新組合,并分為訓(xùn)練集和測試集兩部分,每部分都包含一定比例的認(rèn)知數(shù)據(jù); 2)計(jì)算訓(xùn)練樣本集的特征分解,求出特征向量以及特征變換矩陣,將樣本投射到特征子空間,得到特征張量之后直接矢量化,得到訓(xùn)練集的特征向量集; 3)將上述SNTF降維后的特征向量集作為SVM的輸入,提取支持向量,構(gòu)建最優(yōu)分類器; 4)特征分類,利用構(gòu)建好的分類器對測試樣本進(jìn)行分類判別。
2.根據(jù)權(quán)利要求1所述的基于稀疏非負(fù)張量分解的大腦特定視覺認(rèn)知狀態(tài)判定方法,其特征在于:所述的步驟I)中,對fMRI認(rèn)知數(shù)據(jù)的預(yù)處理步驟如下: a)利用SPM軟件對fMRI認(rèn)知數(shù)據(jù)進(jìn)行預(yù)處理,包括時(shí)間校正、空間校正、配準(zhǔn)圖像、分害I]、圖像標(biāo)準(zhǔn)化、平滑處理步驟; b)將預(yù)處理后的圖像數(shù)據(jù)按照掃描時(shí)間序列以及行為實(shí)驗(yàn)類別進(jìn)行重新組合,并將其與統(tǒng)計(jì)模版進(jìn)行匹配,構(gòu)成樣本數(shù)據(jù)集; c)將樣本集按照掃描時(shí)間序列以及行為實(shí)驗(yàn)類別重新組合,并分為訓(xùn)練集和測試集兩部分,每部分都包含一定比例的認(rèn)知數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的基于稀疏非負(fù)張量分解的大腦特定視覺認(rèn)知狀態(tài)判定方法,其特征在于:所述的步驟2)中,計(jì)算特征張量及特征變換矩陣的步驟如下: a)選取訓(xùn)練樣本,構(gòu)建張量空間:對于選取的訓(xùn)練樣本,定義M個(gè)樣本 1XZ2X-XZv組成的集合為{Xi,X2,..., XM},每個(gè)樣本對應(yīng)的張量空間為反' _ 0-.細(xì)、,其中In(l≤η≤N)是張量的n-mode (模式)維度;尋找多維稀疏變換矩陣集Ρ(--η = 1,...,?ν},υω代表n-mode (模式)方向上的非負(fù)特征投射矩陣; b)初始化:對非負(fù)特征投射矩陣集=…,Λ([進(jìn)行隨機(jī)初始化,滿足非負(fù)要求; c)求解特征變換矩陣:在迭代優(yōu)化的過程中,對Imb1&RhxJ\n 二 I,…,iV}作進(jìn)一步優(yōu)化,保證優(yōu)化的?二I,…,iV[始終是稀疏的、非負(fù)的; d)計(jì)算訓(xùn)練樣本的特征張量集:訓(xùn)練樣本π(πι=1,...,Μ)向稀疏非負(fù)張量投影算子分解(SNTF)之后的非負(fù)特征張量子空間上投影,得到訓(xùn)練樣本的特征張量集為{G = Zm X1 U(lf x2 Ui2fU(N)1 ,m = I,--,Μ},Gm.e)將特征張量G進(jìn)行矢量化處理,得到訓(xùn)練集的特征向量集。
4.根據(jù)權(quán)利要求1所述的基于稀疏非負(fù)張量分解的大腦特定視覺認(rèn)知狀態(tài)判定方法,其特征在于:所述的步驟3)中,利用SVM構(gòu)建最優(yōu)超平面分類器的步驟如下:a)對訓(xùn)練集中的各個(gè)樣本的特征向量分類標(biāo)記,根據(jù)所屬的類別分別標(biāo)記為C1, C2, C3,…; b)對已經(jīng)標(biāo)記好的特征向量進(jìn)行SVM訓(xùn)練,得到多個(gè)最優(yōu)超平面分類器,即以標(biāo)記好的特征向量集作為支持向量機(jī)的輸入,求取最優(yōu)SVM投射方向W及偏移常量b。
5.根據(jù)權(quán)利要求1所述的基于稀疏非負(fù)張量分解的大腦特定視覺認(rèn)知狀態(tài)判定方法,其特征在于:所述的步驟4)中,利用訓(xùn)練得到的最優(yōu)分類器對測試樣本分類的步驟如下: a)將測試樣本分別輸入到多個(gè)最優(yōu)分類器中,得到相應(yīng)的分類結(jié)果,累計(jì)計(jì)算各類的得分; b)統(tǒng)計(jì)步驟a)中所得的分類結(jié)果,選擇得分最高的類作為測試數(shù)據(jù)的類別,從而獲得各個(gè)樣本的分 類。
【文檔編號】G06K9/66GK103440513SQ201310425299
【公開日】2013年12月11日 申請日期:2013年9月17日 優(yōu)先權(quán)日:2013年9月17日
【發(fā)明者】李軍, 王洪勇, 董明皓, 徐鑫秀, 袁森, 李文思, 王苓芝, 趙恒 , 秦偉 申請人:西安電子科技大學(xué)