專利名稱:一種無需設定閾值的腦電信號中眼電偽跡自動去除的方法
技術領域:
本發(fā)明涉及生物信息技術領域,特別涉及腦電信號(Electooenc-ephalogram,EEG)的預處理技術。具體是涉及一種無需人工設定閾值的腦電信號中眼電偽跡(Ocular Artifact, 0A)的自動去除技術。
背景技術:
腦電信號是一種微弱的電生理信號,其中包含了大量的生理與疾病信息,在臨床醫(yī)學、認知心理學等研究領域中發(fā)揮著重要作用。頭皮表面記錄腦電的方式是目前腦電信號研究中所采用的最主要的信號采集方式,該方式記錄技術簡單、易操作,但信號易受噪聲的干擾。腦電干擾給腦電信號的解釋與分析造成了很大的困難。因此,有效識別并去除腦電信號中的偽跡,得到純凈的腦電信號,對進一步研究大腦的真實活動具有重要意義。影響腦電信號的偽跡主要包括眼電偽跡、心電偽跡、肌電偽跡、50Hz工頻干擾等。相對于其它偽跡成分而言,眼電偽跡是使EEG信號失真的一種最主要的干擾成分。眼電偽跡的幅值較大,最大可達到IOOmV,并且眼電信號源距離測量電極較近,對腦電信號造成了很大的干擾。眼電的產生是由于跨膜間存在靜息電位,角膜側為正,鞏膜側為負,這可以看作是有一個電偶極子存在。眼球轉動過程中,該偶極子改變了眼睛周圍的電場,從而影響頭皮電場,眼球運動方向一側的電極記錄到眼電偽跡為正,眼球運動相反方向一側的電極記錄得到的眼電偽跡為負,由于大腦是電的良導體,眼電信號從前額處向后傳播,遍歷整個頭部,放置在頭部用于采集腦電信號的電極可以采集到這些信號,造成對腦電信號的干擾。而且,眼電偽跡的頻帶與腦電信號的頻帶相混疊,很難使用傳統(tǒng)的濾波方法進行去除,因此,腦電信號預處理階段最重要的工作就是如何有效地去除眼電偽跡。從腦電信號中有效地去除眼電偽跡一直是生物醫(yī)學信號處理領域的研究熱點,其中一些主要的研究成果有I實驗控制法這種方法要求研究人員給予受試者一定的實驗指導,例如要求受試者在實驗過程中始終保持閉眼狀態(tài)或盡量避免眨眼和眼球轉動以減少眼電偽跡的干擾,這樣做雖然可以在一定程度上抑制干擾,但是前者會引入α波的干擾,后者在長時間的實驗過程中極易引起疲勞,并且不易做到。2偽跡剔除法它的主要思想是將受到眼電偽跡影響腦電信號剔除以獲得較純凈的腦電信號,但是這樣做的同時剔除了大量的腦電信號,造成了信息的遺漏,并且人工剔除干擾信號的勞動量過大,主觀性強,而且不適應在線腦機接口系統(tǒng)的需求。3回歸方法研究表明眼電偽跡在測量電極處的衰減程度與電極到眼部的距離有關,此方法利用這一原理通過計算得到眼電信號在每個頭皮電極處的衰減因子,然后將采集到的每導腦電信號減去乘以衰減因子的眼電信號,從而得到偽跡去除后的數(shù)據(jù)。它的模型為IiliC,{ε) = !]‘:(;、(ε) - ηΕΟΟ ( I )
式中,EOG表不測量得到的眼電信號;EEGS( ε )表不原始腦電信號;EEG( ε )表不偽跡去除后的腦電信號;ε表示相應的測量通道;η表示比例系數(shù),即眼電信號在第ε導處的衰減因子。H值常用回歸分析的方法進行估計。這種偽跡去除方法的優(yōu)點是直觀易懂,物理意義明確,缺點是沒有考慮到腦電信號的雙向傳播性,即實際測得的眼電信號中也包含一些腦電成分。因此,回歸方法去除偽跡的同時不可避免的去除某些腦電成分。4小波變換法小波變換(Wavelet Transform, WT)是數(shù)學領域的一個重要分支,近年來越來越受到各個學科領域的極大重視。由于其在時頻兩域都具有表征信號局部特征的能力和多分辨率分析的特點,因此被譽為“數(shù)學顯微鏡”。小波變換的基本思想是將原始信號通過伸縮和平移后,分解為一系列具有不同時間分辨率、不同頻率特性的子帶信號,這些子帶信號具有良好的時域、頻域等局部特征,進而可以實現(xiàn)對信號在時域和頻域的局部化分析,從而克服了傅里葉分析在處理非平穩(wěn)信號和復雜圖像時所存在的局限性。但是使用小波變換法去除偽跡要求信號和噪聲的頻帶不能混疊。而腦電信號與眼電偽跡的頻帶相混疊,于是研究者開始將傳統(tǒng)的小波變換法與其它去除偽跡的方法相結合,取長補短,期望獲得更好的效果。
5主成分分析法(Principal Components Analysis, PCA):主成分分析是一種多通道的信號處理方法,其基本思想是利用正交原理將一組相關變量轉化成為另一組相互獨立的變量(即主成分),分解出來的主成分按大小排序,通常前面幾個主成分就包括了信號80%的信息,因此PCA也被用來數(shù)據(jù)降維,去除冗余。PCA可以把多導聯(lián)的腦電信號分解為相互正交的成分,去掉噪聲和偽跡成分,再對其余成分進行重構,就可以得到較為純凈的腦電信號。PCA的主要缺點在于I信號和噪音波形相似時,難以從EEG中去除偽跡;2它只對正交的信號源比較有效,在去除偽跡時只能去除與腦電信號相正交的干擾成分;3它只適合于分解低階相關信號,難以分解高階的相關信號。6獨立分量分析(Independent Component Analysis, I CA)獨立分量分析理論的發(fā)展可追溯到上個世紀80年代初期,法國學者J. Hernah和C. Juttne等人首次提出了ICA分析的基本概念,最初被用來解決“雞尾酒會”問題,隨著近年來在ICA方面研究興趣的增加,該理論已被廣泛應用在圖像處理、天線陣列、控制科學、生物醫(yī)學信號處理等領域,其研究熱潮方興未艾。ICA是實現(xiàn)盲源分離(Blind Source Separation, BSS)最主要的方法之一,是一種基于高階統(tǒng)計量的分析方法,處理對象為非高斯信號。理論上可以認為腦電信號、眼電偽跡、心電偽跡、肌電偽跡以及其他干擾源所產生的干擾信號都是由相互獨立的源產生的,而且可以將觀測信號視為是偽跡與腦電信號的線性組合,并且偽跡源的數(shù)目通常比頭皮上測量的腦電通道數(shù)要少,因而獨立成分分析方法適用于分離腦電信號中的各種偽跡。在實際應用中,ICA方法可以很好的分離頻帶相重疊的信號,彌補了小波分析去除偽跡的不足。但是ICA方法也有缺陷在分離出信號和偽跡后,需要人工識別并篩選出偽跡成分再進行去除,費時費力,且具有很大的主觀性。
發(fā)明內容
本發(fā)明針對傳統(tǒng)腦電信號中眼電偽跡去除的過程中需要人工對眼電偽跡進行識另|J、費時費力、工作量大的缺陷,提出了一種眼電偽跡自動去除的方法。其主要特征包括首先利用獨立分量分析對含有眼電偽跡的腦電信號進行分解,得到若干個獨立分量,然后求取每個獨立分量的峭度、序列renyi熵和樣本熵作為區(qū)分腦電信號和眼電偽跡成分的特征,進而采用k均值聚類分析——一種無監(jiān)督的分類算法進行特征分類,通過將含有眼電偽跡的獨立分量置零重構出純凈腦電信號。具體步驟如下I獨立分量分解本發(fā)明采用1999年芬蘭學者Aapo Hyvarinen等人提出的基于負熵的固定點ICA算法,簡稱fastica算法,進行獨立分量分解。設η通道觀測信號x (t) = [Xl (t),X2 (t),…,xn(t)],經過 ICA 分解得到 m 個獨立分量 y (O = Iiy1 (t),y2 (t),…,ym(t)]。 2特征提取經過ICA分解得到m個獨立分量y (t) = Hy1 (t),Yi (t),…,ym(t)],分別求取它們的峭度、序列renyi熵和樣本熵作為分類特征。2. I峭度峭度是時間序列的四階累計量,可以表征信號的波動情況。眼電偽跡的峭度值要顯著大于腦電信號,因此,利用該參數(shù)作為識別眼電偽跡的特征。2. 2 renyi熵renyi熵是一種反映信號隨機性的參數(shù),眼電偽跡的renyi熵值明顯小于腦電成分,因而使用其作為區(qū)分眼電偽跡和腦電成分的特征。2.3樣本熵樣本熵是一種測量時間序列復雜度的方法,而且眼電偽跡的樣本熵值比腦電成分低,因此使用樣本熵作為特征區(qū)分眼電偽跡和腦電成分。3特征分類本發(fā)明使用k均值聚類分析的方法進行分類,這是一種動態(tài)的、無監(jiān)督的分類方法。區(qū)分眼電偽跡和腦電成分顯然是一個兩分類問題,因此先隨機取兩個樣本作為聚類中心,計算每個樣本到這兩個中心的距離,把樣本歸入最近的聚類中心,然后用本類所有樣本的均值代替原有的聚類中心的值,這樣就得到了新的聚類中心,再重新計算各樣本到新的聚類中心的距離,重新分類、修改中心點,直到新的聚類中心與上一次的中心點一致時,算法停止,然后再按照最小距離原則將獨立分量分為兩類,算法流程如圖2所示。4信號的重構將含有眼電偽跡的獨立分量置零,其它獨立分量不變,對信號進行重構,得到純凈的腦電成分。具體如下一種無需人工設定閾值的腦電信號中眼電偽跡自動去除的方法,其特征在于首先,對采集的腦電信號進行獨立分量分解,得到m個獨立分量;其次,對于每一個獨立分量,求取它們的峭度、序列renyi熵和樣本熵作為特征向量;然后,使用k均值聚類分析——一種無監(jiān)督的分類算法自動識別出含有眼電偽跡的獨立分量;最后,將含有眼電偽跡的獨立分量置零,其余獨立分量不變,對信號進行重構,得到純凈的腦電信號;包括以下步驟I)獨立分量分解使用fastICA算法對信號進行分解,它的基本模型表達式為x(/) = As[l)(I)式中,χα)=[χια),χ2α),···,χηα)]τ e RnxN是η通道的觀測向量,為測量得到,I彡t彡N,N表示采樣點總數(shù),S (t) e rXN為源信號,混合矩陣RnXm,獨立分量分析的目標是求解分離矩陣W,通過w從觀測信號x(t)中恢復出未知的源信號s (t),源信號s (t)使用下式估計得到⑵式中,y⑴是源信號s⑴的估計,y (t) = [Yl (t),Yi⑴,…,ym (t) ]T e RmXN是求得的m個獨立分量,其中Ii (t)是第i個獨立分量,I^i 為整數(shù),t表示第t個采樣點,分離矩陣w e Rmxn ;2)特征提取2. I峭度對于每一個獨立分量Ji (t),求取它的峭度;k = m4-3m( 3)
式中,k為獨立分量yi(t)的峭度值,I彡i彡m,i為整數(shù);me為yi⑴的β階中心矩,Hie=EKyi (O-Iii1) 0}, β ={2,4}, Ε( ·)表示對括號里的表達式求均值,Hi1為Yi (t)的均值;2. 2 renyi熵對于每一個獨立分量Ji (t),其計算公式為H (y;{>)) = logΣΣ('( ~^ (Λ))(4)
y—oc iv /=1 h=i式中,G(g.2cr2)=^-L.^ e—F , Θ =Yi(J-)-Yi (h);方差 σ =0. 2 0. 3, α =1. 8, N 為獨
立分量Ii (t)的采樣點個數(shù),yi (j)與Ii (h)是獨立分量Ii⑴在采樣點j和h的采樣值;2. 3樣本熵對于每一個獨立分量Ji (t),其樣本熵的計算過程如下第一步設獨立分量Yi⑴有N個采樣點,t表示第t個采樣點,I彡t彡N,t為整數(shù);第二步從獨立分量Ji (t)中提取b維矢量,b=2,即
_8] Yb{t) = VyMyl^m(5)式中,yi(t)和7七+1)是獨立分量Yi⑴在采樣點t和t+Ι的采樣值,I彡t彡N-I,t為整數(shù);第三步使用第二步的方法得到兩個b維矢量為Yb (t)和YJt1),定義它們之間的距離為d[γ ( = max[|χ· {t + c)~y, {ti + c)|](6)式中,I彡 Lt1SN-I, t 關整數(shù),Yb(t)和 YbU1)為公式(5)中 Yb(t)在采樣點t和的值% (t+c)和Yi (ti+c)為獨立分量Yi (t)在采樣點t+c和h+c的采樣值,C e {O, 1},求取差值的最大值,即為兩個b維矢量的距離;第四步設定一個閾值r, r= (O. I "O. 25) StcKyi (t)), StcKyi (t))為 Yi (t)的標準差;對于每一個t值,統(tǒng)計d[Yb (t), YbU1)]小于r的數(shù)目,記為T, I ^ t, ^ N-1, t幸t1;t、&為整數(shù),&可以取N-2個值,因此,總的距離數(shù)為N-2,計算T與總的距離數(shù)N-2的比
值,記為O·),即
^ (O = ^η)第五步計算B1; (/·)的均值,即^(/-) = 77-7^^00C8)
—丨,1第六步再從同一個獨立分量Ji⑴中提取Id1維矢量,b1=3,即V、(/) = ^,(0^,(/ + 1)^,(/ + 2)] (9)式中,yi (t)、Yi (t+1)和yi (t+2)是獨立分量Ii (t)在采 樣點t、t+1和t+2的采樣值,I彡t彡N-2,t為整數(shù);第七步使用第六步的方法得到兩個Id1維矢量為&的和1;1@1),定義它們之間的距離為d[7&i (t) Jbi^)] = max^[|>>; (t + e)-yt (t, + e)|](10)式中,I^ t, ti ^ N-2, t 幸 t1; t、ti 為整數(shù),Yi (O和K (G)為公式(9)中八 O)在
采樣點t、&的采樣值;yi (t+e)和yi (t+e)為獨立分量Ji (t)在采樣點t+e和tje的采樣值,e e {0,1,2},求取差值的最大值,即為兩個匕維矢量的距離;第八步在第四步中已計算得到閾值r,對于每一個t值,統(tǒng)計<& {t)Jh (^1)]小于r的數(shù)目,記為T1,1彡t, h ( N-2, t Φ t1; U1為整數(shù),&可以取N-3個值,因此總的距離數(shù)為N-3,計算T1與總的距離數(shù)N-3的比值,記力W (/)即B; (r) = -^-(11)
Jy—j第九步計算皮1M的均值Bb^ {r) = ~^~MBHr) (12)
W-Z t=i第十步樣本熵的計算公式為SiimpKii = - In[5*1 (r)/ Bh (/·)] (13)3)特征分類經過上面的計算,對于每個獨立分量yi(t) {I ( i Sm},可計算得三個特征量,將其依序構成如下特征向量,即
_2] f = [fu f2t /3;Γ(14)式中,分別表示yi(t)的峭度、renyi熵和樣本熵;分別針對每一個特征進行一次k均值聚類分析,共進行三次分類,以f 為例,給出計算步驟3. I給定樣本種類,選定初始聚類中心;顯然,這是一個兩分類問題,初始聚類中心選為 fn, f12 兩個分量,即 Center1 (O) =fn, Center2 (O) =f12 ; center, (O)表示第 q 類初始聚類中心,q=l或2,第P次迭代計算的聚類中心用Centerq(P)表示;3. 2將樣本按最小距離原則分為兩個類,即在第P次迭代時,若I Ai-Center1 (P) I I < I I ^i-Center2 (P) I I,則 e C1 (p),否則 e c2 (p) ; | | · | | 表示
對其中的兩個向量求取它們之間的歐式距離;cq(p)表示在第P次迭代計算中第q類的聚類域,fn e Cq(P)表示將樣本fu劃分到第q類,q=l或2 ;3. 3重新計算聚類中心;以本類所有樣本的均值代替原有的聚類中心值;即centerq (夕+ O = 士 Σ ,Ii1為第q類樣本總數(shù);
nI3. 4若兩次迭代計算的聚類中心相同,即Centerq(P-I)=Centerq(P),則計算完畢, 否則令P=P+I,返回3. 2 ;4信號的重構眼電偽跡的峭度值明顯高于腦電信號,而renyi熵和樣本熵的數(shù)值低于腦電信號,因此,綜合三次分類的結果,將所有獨立分量分為C1和C2兩類,設C1類表示含有眼電偽跡的獨立分量,C2類表示腦電獨立分量;將C1類中所有成分置零,C2不變,得到去除眼電偽跡后的獨立分量f,利用式(15)進行重構,即可得到純凈的腦電成分i ;X= H' 1J'(15)式中,w—1為第I部分求得的分離矩陣w的偽逆矩陣。本方法無需人工設定閾值就可以達到自動識別并去除眼電偽跡的目的,改善了以往方法中設定閾值時需要研究人員具備一定的先驗知識、主觀性強的不足
圖I腦電信號中眼電偽跡自動去除的算法流程2 K均值聚類分析算法流程3國際10-20系統(tǒng)標準電極放置4 C3導聯(lián)眼電偽跡去除效果5 Cz導聯(lián)眼電偽跡去除效果6 C4導聯(lián)眼電偽跡去除效果圖
具體實施例方式本發(fā)明提出一種無需人工設定閾值的腦電信號中眼電偽跡的自動去除方法,完整的算法流程包括下面四(I. 2. 3. 4)個部分。其中,第I部分是現(xiàn)有方法,本發(fā)明申請的特征包括三(2. 3. 4)個部分完整的算法流程如圖I所示。I獨立分量分解本發(fā)明采用fastICA算法,該算法有如下優(yōu)點①收斂速度比批處理和自適應處理都快;②負熵作為高斯性度量的效果優(yōu)于累計量;③采用牛頓迭代法,收斂有保證;它的基本模型表達式為jc(t) = As{t)(2)
式中,χα)=[χια),χ2α),···,χηα)]τ e RnxN是η通道的觀測向量,為測量得到,1≤t≤ N,N表示采樣點總數(shù),s (t) e RmXNS源信號,混合矩陣A e Rnxm,獨立分量分析的
目標是求解分離矩陣w,通過w從觀測信號X (t)中恢復出未知的源信號s (t),源信號s (t)使用下式估計得到
權利要求
1.一種無需人工設定閾值的腦電信號中眼電偽跡自動去除的方法,其特征在于首先,對采集的腦電信號進行獨立分量分解,得到m個獨立分量;其次,對于每一個獨立分量,求取它們的峭度、序列renyi熵和樣本熵作為特征向量;然后,使用k均值聚類分析——一種無監(jiān)督的分類算法自動識別出含有眼電偽跡的獨立分量;最后,將含有眼電偽跡的獨立分量置零,其余獨立分量不變,對信號進行重構,得到純凈的腦電信號;包括以下步驟 1)獨立分量分解 使用fastICA算法對信號進行分解,它的基本模型表達式為
全文摘要
本發(fā)明提出一種無需人工設定閾值的腦電信號中眼電偽跡自動去除的方法,屬于生物信息技術領域,主要應用于腦電信號的預處理過程中。具體包括對采集的含有眼電偽跡的腦電信號進行獨立分量分解;并且求取每個獨立分量的峭度、序列renyi熵和樣本熵作為特征向量,進而使用k均值聚類分析的方法自動識別出含有眼電偽跡的獨立分量,并將其置零,其余分量不變,對信號進行重構,得到純凈的腦電信號。本發(fā)明解決了傳統(tǒng)的眼電偽跡去除過程中需要人工對偽跡進行識別、費時費力、工作量大的問題,并且本方法無需人工設定閾值就可以實現(xiàn)自動識別并去除眼電偽跡的目的,彌補了以往方法中設定閾值時需要研究人員具備一定的先驗知識、主觀性強的不足。
文檔編號A61B5/0476GK102835955SQ20121033119
公開日2012年12月26日 申請日期2012年9月8日 優(yōu)先權日2012年9月8日
發(fā)明者李明愛, 李驤, 張譯帆, 崔燕, 喬俊飛, 楊金福, 郝冬梅 申請人:北京工業(yè)大學