專利名稱:診斷系統(tǒng)性自身免疫疾病的模式識別法的制作方法
相關(guān)申請的交互參考本申請是2000年10月17日提交的美國專利申請NO.09/691405的部分繼續(xù),其內(nèi)容納入本文作為參考。
背景技術(shù):
1.發(fā)明領(lǐng)域本發(fā)明涉及自身免疫疾病和這些疾病及其它疾病的診斷方法領(lǐng)域。本發(fā)明也涉及數(shù)據(jù)分析的統(tǒng)計學(xué)方法和它們在免疫診斷學(xué)中的應(yīng)用。
2.現(xiàn)有技術(shù)描述自身免疫疾病是免疫系統(tǒng)攻擊患者自身機體的細胞、組織和器官,而非外部侵入機體的細菌、病毒和其它微生物的疾病。有許多不同的自身免疫疾病,攻擊機體的不同部位,從腸道到大腦,例如從脈管系統(tǒng)到皮膚,發(fā)生攻擊的方式不同。某些自身免疫病有組織或器官特異性,而其它則可影響多種組織,后一類型的疾病稱為“系統(tǒng)性自身免疫疾病”,病人之間的癥狀可能不同,其組織損傷和炎癥可發(fā)生在器官中與疾病抗原攝取無關(guān)的多個部位。系統(tǒng)性自身免疫疾病通常指風(fēng)濕病或結(jié)締組織病(CTD)。系統(tǒng)性自身免疫疾病的例子是類風(fēng)濕性關(guān)節(jié)炎、系統(tǒng)性紅斑狼瘡(SLE)、硬皮病、多肌炎、皮肌炎、斯耶格倫綜合征(SS)和脊椎關(guān)節(jié)病如關(guān)節(jié)強硬性脊椎炎。自身免疫疾病通常起源于多種因素,一些因素有遺傳素質(zhì)、宿主因素(如T細胞缺陷和難以控制的B細胞多克隆激活)、環(huán)境因素(如某些微生物感染)和抗原產(chǎn)生的機制(如隔離抗原和交叉反應(yīng)性外源抗原)。自身免疫疾病(的原因)仍然有待驗明(如抗磷脂綜合征),而有些已確定的疾病在性質(zhì)上常被認作是自身免疫疾病(如腹腔疾病)。
由于自身免疫疾病的癥狀重疊和病因復(fù)雜而難以診斷。診斷的嘗試常常依據(jù)癥狀,加上體檢時的發(fā)現(xiàn)和實驗室檢測所得結(jié)果。許多自身免疫病的癥狀是非特異性的,雖然實驗室檢測結(jié)果可給予幫助,但常不足以證實診斷,特別是在疾病的早期。如同許多病例那樣,當(dāng)癥狀短暫而實驗室結(jié)果又不可信時此問題更為嚴重。對于某些自身免疫病而言,如能在早期得到確定,病人對治療會有完全反應(yīng)。然而常常是直到疾病晚期才能做出具體診斷。此問題在系統(tǒng)性自身免疫疾病特別嚴重。
通常認為自身免疫抗體的存在表示患有自身免疫病。然而此看法由于以下事實而不能成立,即幾乎任何個體都存在可檢測量的自身抗體,與健康個體的參考水平相比由于人口統(tǒng)計數(shù)據(jù)如性別、年齡、戶籍的地理區(qū)域、民族和種族關(guān)系,正常人的抗體水平差別很大而沒法作比較。此外診斷中需要研究的不同抗體的數(shù)量很大,想獲得特異性和合理的精確診斷,對于臨床實驗室常常是難以應(yīng)對的負擔(dān)。
鑒定系統(tǒng)性自身免疫病應(yīng)用最為廣泛的方法是間接免疫熒光(IFA)顯微術(shù),一種需要訓(xùn)練有素技術(shù)人員的手工方法。當(dāng)用此法觀察固定在載玻片上,用血清處理,洗滌然后標(biāo)記的細胞(通常為HeLa細胞)時,結(jié)果看到的是一種能區(qū)別性特征分析的模式。該模式的可區(qū)別性特征是相對的斑點狀、相對均勻的外觀等,通過將該模式與患有已知疾病的個體的模式作比較而做出診斷。然而,最常見的模式與幾種診斷尚不清楚的疾病相關(guān)。結(jié)果還需要檢測特異性抗體。甚至必須請求有經(jīng)驗的免疫學(xué)家或風(fēng)濕病專家來解釋這些結(jié)果而做出最終診斷。
近年來已采用酶聯(lián)免疫吸附試驗(ELISA)對有自身免疫疾病癥狀的病人進行初步篩檢。篩檢試驗呈陽性的標(biāo)本再送交特異性診斷試驗以確定是存在那種特異性自身抗體,從而提示患有那種特異性疾病。然而,許多自身免疫病病人患有兩種或多種不同的自身免疫病,當(dāng)采用這種診斷方法時此種努力難以獲得準確診斷。此外,許多醫(yī)生囑付的篩檢試驗(如ANA篩檢)目前對采用特異性抗體所得結(jié)果的經(jīng)驗有限。其結(jié)果難以解釋。因此,采用特異性抗體的結(jié)果(做出診斷)通常不是最佳的。然而,鑒于初步結(jié)果的陽性預(yù)測價值低,產(chǎn)生陽性篩檢結(jié)果和產(chǎn)生特異性抗體結(jié)果之間的延誤對于病人和醫(yī)生都是困難的。當(dāng)結(jié)果可接受時,它們對某些病例有高度提示性(如抗-Scl-70抗體陽性),但常常是不那么有用(如抗SmRNP單陽性)。甚至極有經(jīng)驗的風(fēng)濕專家也不能將不常見的模式與疾病狀態(tài)相關(guān)聯(lián)。
因此需要提供自動化系統(tǒng)和方法,根據(jù)特異性抗體檢測結(jié)果而表明某病人是否可能患有系統(tǒng)性自身免疫疾病。這種系統(tǒng)和方法還應(yīng)表明是否患有兩種或多種自身免疫疾病。
發(fā)明概述本發(fā)明各方面的內(nèi)容是通過提供鑒定病人樣品中存在的一種或多種系統(tǒng)性自身免疫疾病的系統(tǒng)和方法,來應(yīng)對上面列舉的困難和其它困難。一方面獲得系統(tǒng)性自身免疫疾病疑似患者的多分析物測定數(shù)據(jù),對此數(shù)據(jù)進行統(tǒng)計學(xué)模式識別處理或算法,將其與多個參考數(shù)據(jù)組作比較。這種比較的結(jié)果可表明患者所患的具體疾病。在計算機軟件幫助下模式識別算法可處理醫(yī)學(xué)決策支持系統(tǒng)(MDSS)中得到的所有模式。以此方式應(yīng)用模式識別處理使臨床醫(yī)生可利用獲自病人的一種生物樣品的檢測結(jié)果來同時獲得疾病診斷和對該診斷置信水平的評估。臨床醫(yī)生可利用NDSS結(jié)果作為診斷輔助工具,例如輔助醫(yī)生做出診斷。醫(yī)生也可利用MDSS結(jié)果來提出隨訪試驗。選擇的自身抗體可以是已知的在各種系統(tǒng)性自身免疫疾病中經(jīng)常升高的抗體,可按照它們與具體疾病或可能患的一組疾病已意識到的相關(guān)性,將具體抗體包括在其中或?qū)⑵鋭h除??赏瑫r診斷兩種或多種疾病,認定各自的置信水平而不需要分離樣品或分別分析樣品。
本發(fā)明具有優(yōu)于目前已知診斷方法的一些優(yōu)點。一個優(yōu)點是不需要用手工進行檢測試驗,因為該多種試驗本身可用自動化儀器進行。另一優(yōu)點是篩檢后即能獲得診斷而不需要再做驗證試驗。此外,本發(fā)明用一步樣品分析即能對許多可能的疾病提出診斷。還有本發(fā)明不需要熟練的專職人員參與來解釋結(jié)果。因此可將結(jié)果直接轉(zhuǎn)交給主管醫(yī)生,即使該醫(yī)生是全科醫(yī)生對所檢測的自身抗體不熟悉。
本發(fā)明一方面的內(nèi)容是,提供一種用計算機執(zhí)行的、根據(jù)某病人測試樣品中存在的自身抗體水平來鑒定該病人測試樣品是否與一種或多種特定的系統(tǒng)性自身免疫病(SAD)相關(guān)的方法。該方法通常包括將多個參考數(shù)據(jù)組存入存儲器,各數(shù)據(jù)組的數(shù)值代表了多種特定自身抗體中每一種的水平,其中各特定SAD的參考數(shù)據(jù)組包括至少一個與該特定SAD相關(guān)的參考數(shù)據(jù)組,且所述參考數(shù)據(jù)組包括至少一個與該特定SAD無關(guān)的參考數(shù)據(jù)組。該方法通常包括接收樣品數(shù)據(jù)組,其數(shù)值代表某病人測試樣品中所述多種自身抗體中每一種的水平,以及將k-最近鄰過程(k-nearest neighborprocess)自動應(yīng)用于該樣品數(shù)據(jù)組和參考數(shù)據(jù)組,以產(chǎn)生能表明該病人測試樣品是否與所述特定SAD無關(guān),或與所述特定SAD中的一種或多種相關(guān)的統(tǒng)計學(xué)決定。
本發(fā)明另一方面的內(nèi)容是,提供了一種配制成可提供輸出數(shù)據(jù)的計算機系統(tǒng),根據(jù)某病人測試樣品中存在的自身抗體水平,所述輸出數(shù)據(jù)可表明該病人測試樣品是否與多種特定的系統(tǒng)性自身免疫疾病(SAD)中的一種或多種相關(guān)。該系統(tǒng)通常包括存儲多個參考數(shù)據(jù)組的存儲裝置,各數(shù)據(jù)組的數(shù)值代表了多種特定自身抗體中每一種的水平,其中各特定SAD的參考數(shù)據(jù)組包括至少一個與該特定SAD相關(guān)的參考數(shù)據(jù)組,且所述參考數(shù)據(jù)組包括至少一個與該特定SAD無關(guān)的參考數(shù)據(jù)組。該系統(tǒng)通常還包括接收樣品數(shù)據(jù)組的裝置,該樣品數(shù)據(jù)組的數(shù)值代表某病人測試樣品中所述多種自身抗體中每一種的水平,和處理所述樣品數(shù)據(jù)組和參考組數(shù)據(jù)的裝置,處理采用k-最近鄰過程,以產(chǎn)生表明該病人測試樣品是否與所述特定SAD無關(guān),或與所述特定SAD中的一種或多種相關(guān)的統(tǒng)計學(xué)決定。該系統(tǒng)還可包括能提供包括所述統(tǒng)計學(xué)決定的輸出數(shù)據(jù)的裝置。
本發(fā)明的這些和其它目的、優(yōu)點、特征和實施方式可從以下描述中得以明白。
附圖簡述
圖1說明了本發(fā)明可能實施的醫(yī)學(xué)決策支持系統(tǒng)(MDSS)。
圖2說明了本發(fā)明數(shù)據(jù)表的一個例子。
圖3和4說明了按照本發(fā)明一種實施方式進行KNN處理推理的一個例子。
圖5說明了MDSS系統(tǒng)顯示的GUI顯示面板的一個例子。
圖6說明了可能的用戶顯示MDSS系統(tǒng)產(chǎn)生的輸出數(shù)據(jù)。
發(fā)明詳述圖1說明了可實現(xiàn)本發(fā)明目的的醫(yī)學(xué)決策支持系統(tǒng)(MDSS)100。如圖所示,MDSS100包括MDSS計算機系統(tǒng)105,如圖所示,其具有處理器115和存儲器模塊110。計算機系統(tǒng)105還包括通過一個或多個直連(如USB、火線或其他接口)和一個或多個網(wǎng)絡(luò)連接(如,包括調(diào)制解調(diào)器或其他網(wǎng)絡(luò)接口設(shè)備)來發(fā)送和接收信息的通信模塊(未顯示),。存儲器模塊110可包括內(nèi)部存儲裝置和一個或多個外部存儲裝置。計算機105還包括顯示模塊,如監(jiān)視器或打印機。一方面,計算機105通過直連或網(wǎng)絡(luò)140從測試系統(tǒng)150或其他測試結(jié)果來源接收數(shù)據(jù),例如患者測試的結(jié)果。例如,測試系統(tǒng)150可被配制成對一個或多個樣品155進行多分析物檢測并向計算機105自動提供測試結(jié)果。測試系統(tǒng)150可以直接與計算機系統(tǒng)105耦合,或者可通過網(wǎng)絡(luò)140遠程耦合。眾所周知,計算機105也可以通過網(wǎng)絡(luò)140從一個或多個客戶系統(tǒng)130接收或發(fā)送數(shù)據(jù)。例如,提問的醫(yī)生可利用客戶系統(tǒng)130,從安裝在實驗室或醫(yī)院內(nèi)的MDSS計算機105獲取并查看報告。
網(wǎng)絡(luò)140可以是LAN(局域網(wǎng))、WAN(廣域網(wǎng))、無線網(wǎng)絡(luò)、點到點網(wǎng)絡(luò)、星形網(wǎng)絡(luò)、令牌環(huán)網(wǎng)、集線器網(wǎng)絡(luò)或其它配置。目前最常用的網(wǎng)絡(luò)類型是TCP/IP(傳輸控制協(xié)議和網(wǎng)間協(xié)議)網(wǎng)絡(luò),如常稱作“英特網(wǎng)”的用大寫字母“I”表示的全球網(wǎng),是本文許多實施例中采用的,但應(yīng)知道本發(fā)明可采用的網(wǎng)絡(luò)不限于此,雖然TCP/IP是當(dāng)前優(yōu)選的方案。
圖1顯示該系統(tǒng)中的幾種元件可包括常規(guī)熟知的元件,無需在此詳述。例如,計算機105可包括臺式個人計算機、工作站、主機、膝上型計算機等。各客戶系統(tǒng)130可包括臺式個人計算機、工作站、膝上型計算機、PDA、移動電話、或任何支持WAP的裝置,或任何其它能直接或間接連通英特網(wǎng)或其它網(wǎng)絡(luò)連接的計算機裝置??蛻粝到y(tǒng)130通常運行HTTP客戶端,例如瀏覽器程序,如微軟的Internet ExplorerTM瀏覽器、Netscape的NavigatorTM瀏覽器、Opera的瀏覽器、或者移動電話、PDA或其它無線裝置等使用的支持WAP的瀏覽器,使客戶系統(tǒng)的使用者可通過網(wǎng)絡(luò)140訪問計算機105,從其獲得、處理和查看信息和網(wǎng)頁。各客戶系統(tǒng)130通常也包括一個或多個用戶接口裝置,如鍵盤、鼠標(biāo)、觸摸屏、書寫筆等,以便能在顯示器(如監(jiān)視屏、LCD顯示器等)135上通過瀏覽器提供的圖形用戶介面(GUI)進行人機對話,與計算機105提供的網(wǎng)頁形式和其它信息一起運作。如上所述,本發(fā)明適合英特網(wǎng)使用,英特網(wǎng)指特定的全球國際網(wǎng)絡(luò)。然而應(yīng)知道也可利用其它網(wǎng)絡(luò)來代替英特網(wǎng),如內(nèi)聯(lián)網(wǎng)、外聯(lián)網(wǎng)、虛擬個人網(wǎng)絡(luò)(VPN)、不基于TCP/IP的網(wǎng)絡(luò)、任何LAN或WAN等。
按照一實施方式,每個客戶系統(tǒng)130及其所有組件可由操作人員利用諸如瀏覽器的應(yīng)用軟件加以配置,所述應(yīng)用軟件包括用中央處理單元如Intel Pentium處理器等運行的計算機代碼。類似的,MDSS計算機105及其所有組件可由操作人員利用應(yīng)用軟件加以配置,所述應(yīng)用軟件包括用中央處理單元115如Intel Pentium處理器等或多處理單元運行的計算機代碼。宜將操作和配置MDSS計算機105以按本文所述處理數(shù)據(jù)的檢測結(jié)果的計算機代碼下載并貯存在硬盤中,但整個程序代碼或其部分也可貯存在熟知的任何其它易失或不易失存儲介質(zhì)或裝置如ROM或RAM中,或提供在能貯存程序代碼的任何其它計算機可讀介質(zhì)160上,如高密度磁盤(CD)介質(zhì)、數(shù)字多功能盤(DVD)介質(zhì)、軟盤等。此外,如熟知的那樣,例如通過英特網(wǎng)可軟件源或從服務(wù)器傳輸和下載整個程序代碼或其一部分,或者通過利用任何熟知通信媒介和協(xié)議(如TCP/IP、HTTP、HTTPS、Ethernet等)的任何熟知的其它常規(guī)網(wǎng)絡(luò)連接傳輸。也可認為實現(xiàn)本發(fā)明諸方面內(nèi)容的計算機代碼可采用能用計算機系統(tǒng)執(zhí)行的任何編程語言來執(zhí)行,如C、C+、HTML、Java、JavaScript語言,或任何其它腳本語言如VBScript。
在本發(fā)明一優(yōu)選方面,MDSS計算機105實施模式識別系統(tǒng),根據(jù)貯存的各自與一種或多種已知疾病或未知疾病檢測結(jié)果的數(shù)據(jù)庫,分析病人的檢測結(jié)果,數(shù)據(jù)可貯存在存儲存儲器110中的一張或多張數(shù)據(jù)表或其它邏輯數(shù)據(jù)結(jié)構(gòu)中,或分別貯存,或使數(shù)據(jù)庫系統(tǒng)與計算機105耦合。
用于實施本發(fā)明的模式識別系統(tǒng)通常開始時是產(chǎn)生一種“訓(xùn)練組(training set)”,此術(shù)語如統(tǒng)計學(xué)數(shù)據(jù)分析領(lǐng)域所理解,指得自可靠(“純種(pedigreed)”)來源的一組樣品的數(shù)據(jù)。此組包括的樣品是先前曾獨立診斷為患病者的以及無病者的樣品。實施本發(fā)明一個方面的方法,開始時是獲得和分析從已知患有,或曾經(jīng)患有某特定自身免疫疾病的一組病人,以及已知無此病的一位或多位的一組對象的參比樣品。該訓(xùn)練組包括需要研究的特定病人或病人總體所有范圍的系統(tǒng)性自身免疫疾病。對該訓(xùn)練組的每個樣品進行多種分析,將結(jié)果輸入計算機系統(tǒng)以類似于多維陣列的方式貯存,陣列中各樣品成為多維空間中的一個點。確定某點在該空間中的位置的該點坐標(biāo)代表了測試的結(jié)果,每個測試一個坐標(biāo)。例如一個例子是,如果對該訓(xùn)練組中每個樣品進行測試的數(shù)目只是兩種,那么訓(xùn)練組的諸點顯示排列為二維圖象(x,y),其中水平軸(x)對應(yīng)于一種測試,而垂直軸(y)對應(yīng)于另一測試。除測試結(jié)果所確定的二維圖中的位置(即x和y值)外,每個點都標(biāo)記為與其來源相關(guān)的具體疾病。三種測試系統(tǒng)對應(yīng)的陣列是含有正交x、y和z軸的三維圖。涉及4種或更多種測試系統(tǒng)的相應(yīng)陣列無法顯示,但能以類似方式建立。
一旦建立了訓(xùn)練組,將其測試數(shù)據(jù)輸入數(shù)據(jù)庫。例如,可將代表抗體檢測結(jié)果的數(shù)據(jù)或代表抗體水平的數(shù)值貯存在按行列或區(qū)域局部排列的數(shù)據(jù)表中。圖2顯示這種數(shù)據(jù)表一部分的例子。如所示,可加入一區(qū)域來包括病人D或顯示樣品來源的其它信息。人口統(tǒng)計學(xué)信息,如性別、年齡等也可包括在這些區(qū)域中。在此方式中,數(shù)據(jù)表的每一行(或記錄)均代表某具體測試樣品的測定值。每行還包括與該測試樣品相關(guān)的先前曾作出的疾病診斷,如果已知提供該樣品的病人無病,此診斷可以是“無病”或“NEG”。一實施方式中,與一種以上疾病相關(guān)的測試組,每種疾病產(chǎn)生不同的行。例如,一組測定數(shù)據(jù)與SLE和SS兩種病相關(guān)時,在該訓(xùn)練組數(shù)據(jù)表中產(chǎn)生二行,一行為SLE,一行為SS,在抗體區(qū)域中的值也分成同樣的每行。
一旦將訓(xùn)練組數(shù)據(jù)輸入數(shù)據(jù)庫,計算機系統(tǒng)就準備接收一個病人樣品數(shù)據(jù)或一連串病人樣品數(shù)據(jù),而不需要重建該數(shù)據(jù)庫,或重新分析該訓(xùn)練組,或選擇并分析不同的訓(xùn)練組。對病人樣品進行與訓(xùn)練組樣品相同的檢測?!拔粗辈∪藰悠返囊粋€例子見圖2表中最上行。利用前節(jié)的說明性描述,可將病人樣品檢測結(jié)果顯示為N-維空間中的一個點,以其測定值相應(yīng)的坐標(biāo)可確定其位置。
通過病人樣品檢測結(jié)果值(圖2中的“未知”)和訓(xùn)練組值之間的統(tǒng)計學(xué)比較可實現(xiàn)具體疾病的認定。進行比較例子的可采用的各種統(tǒng)計學(xué)分析方法是k-最近鄰過程、多重線性回歸分析、貝葉斯概率推理、神經(jīng)網(wǎng)絡(luò)分析和主成分分析。雖然這些方法的每一種是本領(lǐng)域已知的,但以下解釋有助于讀者了解如何應(yīng)用各算法來實施本發(fā)明。
最近鄰模式識別最近鄰模式識別是一種已良好建立的比較不同數(shù)據(jù)組的方法,上世紀70年代廣泛用于自動化分析質(zhì)譜數(shù)據(jù),質(zhì)譜儀輸出一系列的譜線(m/z比)和強度。用戶準備已知化合物的質(zhì)譜庫,或利用公眾庫,然后用最近鄰算法來評價未知化合物。例如,可將未知物與庫中的幾種鄰苯二甲酸鹽作匹配;也許沒有一種適宜匹配或良好匹配,但分析者確信該未知化合物是某種類型的鄰苯二甲酸鹽,這種“思路”就足以認定需要進行下面的步驟。一方面,本發(fā)明系統(tǒng)的操作方式相似。因為輸入的是一系列強度(抗體水平),將這些強度與先前創(chuàng)建的庫中病人的強度作比較,而輸出是一系列與該庫中病人(強度)可能的匹配。本發(fā)明系統(tǒng)可進行其它軟件處理來檢驗匹配和產(chǎn)生輸出數(shù)據(jù),總結(jié)那種疾病是具有最佳匹配病人中最常見的。該系統(tǒng)也提供表明一致性值的輸出。例如,所述輸出可包括關(guān)于該報告疾病在具有最佳匹配(如75%或以上)病人中是否是“有非常強代表性的”一致性值或文本指示符;或例如以“強”和“中等”所代表的具有較少的一致性程度。
最近鄰模式識別有兩個重要特征。第一個是事先建立庫(訓(xùn)練組數(shù)據(jù)庫)本身的大小和品質(zhì)。第二個是收集供檢驗的鄰居數(shù)(number of neighbor)。鄰居數(shù)通常稱為“k”;因此將k-最近鄰縮寫為kNN。這兩種特征是相聯(lián)的,因為大的庫能允許貯存更大的k值。實際采用的k值優(yōu)選10-15,因為這意味著由于只與該庫中一個病人匹配因此沒有匹配可報告。故可理解應(yīng)采用小于10或大于15的k值。在下述的一具體實施方式
中,采用的k值為11。
在k-最近鄰的一個實施方式中,所述系統(tǒng)讀取病人樣品的數(shù)據(jù),將其輸入也含有訓(xùn)練組數(shù)據(jù)庫的存儲器(如存儲器110)中。處理然后計算出從該病人測試點到存儲器中鄰近該病人測試點的數(shù)據(jù)(訓(xùn)練組)點的數(shù)字距離。從這些點,經(jīng)處理選出距離最短或最小的k數(shù)據(jù)點。例如,二維圖中的數(shù)字距離通常是公式[(x1-x2)2+(y1-y2)2]1/2的笛卡爾距離度量。因此,如果k是11,該算法選擇離病人測試點距離最短的11個數(shù)據(jù)點。然后認定與該k最近數(shù)據(jù)點相關(guān)的疾病是該病人樣品所代表的疾病,如果這些k點與一種以上疾病相關(guān),在診斷中注明每種疾病。精細處理是比較不同點的距離數(shù)值,當(dāng)代表兩種不同疾病點的數(shù)值相差不到最低差異值時,可認為此兩種疾病可能相同。進一步精細處理時,配置的處理器能處理距離的數(shù)字值以確定置信水平。這可利用病人測定結(jié)果和每個K數(shù)據(jù)點之間的“類似”值來進行,通過該疾病的類似值和除以類似值之和來認定每種疾病的相對值。通常選擇具有最高相關(guān)值的疾病作為最終診斷。
通常,k最近鄰算法是一種“病例取向(case-oriented)”系統(tǒng),可用于比較病人測試數(shù)據(jù)與其它個體的數(shù)據(jù),所述其它個體的數(shù)據(jù)指除疾病外,可得到的例如該個體的年齡、性別、患病時間多長和類似因素的人口統(tǒng)計學(xué)信息和其它個人信息。這些信息使得診斷醫(yī)生可能就是否采用該處理所提出的這些病人的信息作為診斷參考點做出個人判斷。
示范性kNN匹配過程圖3和4說明本發(fā)明實施方式的一種示范性KNN過程。簡而言之,在MDSS 100的處理空間(如包括一個或多個處理器105和存空間)中執(zhí)行KNN算法。KNN算法從數(shù)據(jù)表檢索訓(xùn)練組的分析物值(如通過SQL調(diào)用),并用檢索到的數(shù)據(jù)處理測試樣品的分析物值產(chǎn)生輸出值。優(yōu)選將輸出值顯示在屏幕上(如顯示監(jiān)視儀125上),打印或傳送到遠程系統(tǒng)。較后將描述的輸出內(nèi)容可包括,例如簡單的陽性或陰性指示,診斷,或包括診斷和數(shù)據(jù)庫表返回行并提示疾病名稱和各行的行一致性的圖。例如,下表1提供了可能顯示的輸出值。也可通過網(wǎng)絡(luò)140向客戶系統(tǒng)130提供輸出數(shù)據(jù),顯示在客戶監(jiān)視器135上或供進一步處理。圖5顯示了一種顯示輸出的例子(如通過瀏覽器顯示在面板上),該輸出顯示了對疾病的診斷,病人測試結(jié)果與所診斷疾病之間相關(guān)的程度,和病人的具體信息如病人的ID。應(yīng)理解如需要,也可采用其它顯示方式和展示其它信息。
如圖3所示,在優(yōu)化的處理步驟10中,要標(biāo)準化測試對象或病人的分析物輸入值。例如,將這些值轉(zhuǎn)變到0-100標(biāo)準范圍內(nèi)。例如,一實施方式中,通過以下計算log10(x+1)×99.66將分析物值加工成為抗體指數(shù)形式。應(yīng)理解,也可部分依照數(shù)據(jù)格式采用其它標(biāo)準化技術(shù)。在優(yōu)選方面,貯存在數(shù)據(jù)表中的數(shù)據(jù)也要標(biāo)準化,然而數(shù)據(jù)表中可包括未標(biāo)準化的數(shù)據(jù),但當(dāng)檢索數(shù)據(jù)庫時,這種數(shù)據(jù)宜標(biāo)準化。在步驟15中,此過程能確定所有的分析物輸入值是否符合分析物截取值的下限(LAVC)域值。如果所有的分析物輸入值低于LAVC,步驟20中將返回陰性結(jié)果(NEG)。否則該結(jié)果為陽性。例如,在一方面,將LAVC設(shè)置在0-100范圍中的30,然而如需要也可采用其它LAVC域值。
在步驟25中,kNN行將構(gòu)成確定診斷的基礎(chǔ)。例如,在一實施方式中,通過用距離度量將分析物輸入值與數(shù)據(jù)庫中的所有行作比較,來確定k最近行。一方面,所述距離度量是一種簡單的N-維距離度量,如上所述,其形式為[(x1-x2)2+(y1-y2)2]1/2的。因此k行與返回的輸入數(shù)據(jù)距離“最短”。在一實施方式中,利用特異性水平域值來判斷某行是否可包括在構(gòu)成診斷依據(jù)的kNN行中。此實施方式中,不包括行一致性低于該特異性水平的行。行一致性通常指kNN數(shù)據(jù)庫表的某行如何與該病人的分析物輸入值密切匹配。一方面,距離度量被用于行一致性。一方面,此過程通過比較病人的分析物值與數(shù)據(jù)表各行的值,可產(chǎn)生每行的行一致性值。然后此過程選出行一致性值符合該特異性水平域值的那些行,此過程可返回具有最佳行一致性值的那些行??煞祷卦S多k行,但可能k行的少數(shù)符合該特異性水平域值。在一方面,有三種可判斷的特異性水平(雖然可采用更多或更少的),具體例子如下10%(中等);35%(高);和60%(最高)。
因此如果將該特異性水平設(shè)為高時,不采用經(jīng)測定kNN行的行一致性值低于此“高”特異性域值(如<35%)的行。
在步驟30中,此過程可確定步驟25中返回的或“創(chuàng)建”的kNN行數(shù)是否超過最小截取(MinCutoff)域值。如果“創(chuàng)建了”較少的低于“MinCutoff”的行,則步驟35的返回值為“NA”或“無病”?!癗A”結(jié)果指這些分析物通過了LAVC域值(因此必然是陽性)的情況,但該算法(kNN)不能使它們與某特定疾病完全一致。此兩種情況包括陰性特定病例。kNN(值)決定了其結(jié)果是陰性,但這可能與LAVC規(guī)定不一致。
返回值為無病。kNN無法(a)找到足夠好的kNN行用于其計算,或(b)鑒定一種疾病一致性足夠強的疾病結(jié)果。
kNN算法返回了行的k值,但只“創(chuàng)建”行結(jié)果符合該特異性水平域值的那些行。例如,假設(shè)k=5,但5個返回行中有3行結(jié)果不符合該特異性水平域值,因此只創(chuàng)建了二行。如果將MinCutoff設(shè)置為3,則返回值為”NA”。如果kNN行數(shù)大于MinCutoff,可利用步驟40中的kNN行來確定相一致的疾病。相一致疾病的計算指計算出KNN諸行中顯示疾病結(jié)果重要性的(行)。一方面,kNN諸行所鑒定的某具體疾病的相一致疾病等于該疾病的行數(shù)除以總行數(shù)。例如,如果k=5和諸行顯示為SS、SS、SS、SLE和MYO,那么與SS相符的疾病(可能性)=60.0%,與SLE相符的疾病=20%;與MYO相符的疾病=20%。
在步驟45中,此過程可確定疾病一致性是否高于用戶可判斷的域值,如非常強的截取(VSC)域值。例如,可將VSC設(shè)為75%或90%。如果與某疾病的一致性大于該VSC,則在步驟50中進行陰性特定病例(NSC,Negative Special Case)檢測,此時如果確定將該疾病稱作陰性或NEG,則將其結(jié)果改變成“NA”(見上述陰性特定病倒)。否則輸出值將該疾病稱作為非常強的一致性或相關(guān)性(疾病)。
如果不能確定某疾病的一致性大于或等于該VSC,那么在步驟60中(圖4),該算法可確定最佳一致性的疾病是否超過用戶可判斷的中等截取(MC)域值。例如,可將MC設(shè)置為25%或30%。如果具有最佳一致性的疾病不符合該MC域值則步驟65返回值為“NA”結(jié)果。如果具有最佳一致性的疾病不能滿足該MC域值,則步驟70中該算法可確定具有第二最佳一致性的疾病是否滿足該MC域值。如果是,在步驟75中進行NSC檢測,如果NSC檢測滿意,則表明它們一致性的步驟80中返回(顯示)出最佳和第二最佳疾病。如果該MC域值不滿意,則在步驟85中進行最佳疾病的NSC檢測,如果滿意,則在表明其一致性的步驟90中返回(顯示)出最佳疾病。在以上實例中,SS、SLE和MYO的相符值分別為60%、20%和20%,如果將VSC設(shè)置為65%,將MC設(shè)置為35%,則該算法將返回(顯示)“具有中等相符的SS”。
一方面,在此過程中也采用強截取(SC)域值。例如,此過程可確定滿足MC域值的某疾病是否也滿足SC域值,如果是,輸出結(jié)果將顯示強相符。例如,如果在上述例子中將SC設(shè)置為50%,結(jié)果可能是“具有強相符的SS”。故宜將SC設(shè)置為50%或更高。
下表1顯示在kNN匹配期間真實原始數(shù)據(jù)的一個例子。表1顯示了“未知”以及被該過程認為是“最佳匹配”的11個鄰居的11種分析物的結(jié)果,用AI表示(除分析物dsDNA用IU/ml表示)。一方面,提供表1中的數(shù)據(jù)作為用戶顯示輸出,優(yōu)選將AI值參見如圖3步驟10所述標(biāo)準化。將dsDNA值先除以10以轉(zhuǎn)變成AI。
表1 MDSS結(jié)果的例子
該算法選出和匹配疾病是SLE,非常強相關(guān)性AI≥1.0為陽性dsDNA≥10IU/ml為陽性;<5為陰性;5-9不確定。
在此例中,11個“鄰居”中有9個被診斷為SLE,二個不是;醫(yī)生診斷術(shù)語說“應(yīng)該報告為CTD陰性”。醫(yī)生對這二例提供的確切診斷是“類風(fēng)濕性關(guān)節(jié)炎”(RA)和“無病”??赡芰钊梭@奇的是二例具有典型SLE的dsDNA和染色質(zhì)抗體水平而未診斷為此病,但這是常見的。診斷為SA的病人可能有稱為“RUPUS”的狀態(tài),這基本上是一種SLE和RA相重疊的疾病,見于<5%的RA病人?!盁o病”病人可能不符合SLE標(biāo)準,即使血清學(xué)結(jié)果強烈提示為此病。
圖6顯示的是為KNN匹配產(chǎn)生的一種可能的用戶顯示輸出。如所示,所有數(shù)值都已標(biāo)準化?!疤禺愋浴敝溉缟纤龅男幸恢滦灾怠4死?,MDSS報告提示SLE具有非常強(如100%)的疾病一致性。
訓(xùn)練組所用的樣品本發(fā)明系統(tǒng)數(shù)據(jù)庫中所用的血清庫應(yīng)符合許多標(biāo)準。首先,應(yīng)反映遵照識別標(biāo)準的高級醫(yī)生的臨床診斷。訓(xùn)練組實例所用的1413個樣品見表2,是由眾所周知的研究院俄克拉荷馬醫(yī)學(xué)研究基金會(Oklahoma Medical Research Foundation)、斯坦佛大學(xué)(Stanford University)和UCLA的醫(yī)生收集的具有CTD的那些樣品。這些醫(yī)生也提供了無病者的樣品,和纖維肌痛、骨關(guān)節(jié)炎、其它結(jié)締組織病如抗磷脂綜合征及脈管炎個體的樣品。其它樣品獲自緬因州血液研究基金會(Foundation for BloodResearch);加入這些樣品使該數(shù)據(jù)庫包括沒有診斷為CTD的不明確和陽性ANA的樣品,因為這類樣品臨床上常遇到。訓(xùn)練組的樣品確切分布見下表2。
表2 MDSS訓(xùn)練組中的樣品醫(yī)生診斷NCREST 34CREST/SS1CTD 29DMYO20DMYO/SLE1纖維肌痛68纖維肌痛/OA 2纖維肌痛/SLE1MCTD/SLE1MCTD25MCTD/CREST/SLE 1MCTD/雷諾病/SLE 1MCTD/SLE1NEG 373OA 70OA/纖維肌痛 2OA/RA 3OA/SLE 1
PMYO51RA 232RA/纖維肌痛 2RA/SS 2雷諾病 2SLE 374SLE/CREST 1SLE/雷諾病 14SLE/SS 19SLE/AA/雷諾病 2SLE/UCTD1SS 24SS/UCTD 1硬皮病 29UCTD25總計1413當(dāng)該系統(tǒng)產(chǎn)生陽性結(jié)果時,臨床醫(yī)生根據(jù)表3所示的輸出提供可進行隨訪檢測的相關(guān)建議。
表3 可能輸出的列表
本發(fā)明在改進ANA篩檢時特別有用。ANA篩檢具體可用作SLE的“排除”試驗,但在差別診斷中價值很小。由于對陽性NA篩檢要進行隨訪,醫(yī)生必然要求測定特異性抗體。通過賦予相關(guān)性或提議考慮合適的隨訪檢測,本發(fā)明系統(tǒng)可幫助醫(yī)生完成此任務(wù)。實施例見表3所示。這些相關(guān)性在性質(zhì)上類似于SLE“同源性”模式和硬皮病“核仁模式”的傳統(tǒng)相關(guān)性;醫(yī)生已運用這些傳統(tǒng)相關(guān)性數(shù)十年。這些傳統(tǒng)相關(guān)性的高水平舒適度得以從IFA方法轉(zhuǎn)變?yōu)楦碌腅IA方法,為許多實驗室難以進行。除了將本發(fā)明系統(tǒng)加入ANA篩檢外,實驗室引導(dǎo)醫(yī)生適當(dāng)進行隨訪檢測的能力得到恢復(fù)并且事實上得到改進。
NA相關(guān)性和顯示一種以上相關(guān)性的報告如以上和表3中所述,本系統(tǒng)的一種可能輸出值包括“NA(無相關(guān)疾病-抗體水平?jīng)]能顯示與系統(tǒng)性自身免疫病相關(guān)的模式)”。一方面,此輸出數(shù)值表明至少檢測到一種陽性抗體,但該數(shù)據(jù)庫成員匹配不充分,超過給定的截取值,和/或匹配的疾病總共低于某百分比,如25%。因為有許多樣品得自數(shù)據(jù)庫中的非-CTD,如纖維肌痛和RA,NA相關(guān)常表示所獲得的匹配疾病是RA而不是SLE。
該數(shù)據(jù)庫中的許多樣品可不含有陽性抗體。數(shù)據(jù)庫中宜包括這類樣品,因為如果需要,它們可使本系統(tǒng)能計算特異性。得自纖維肌痛、骨關(guān)節(jié)炎(OA)、皮肌炎(DMYO)和類風(fēng)濕性關(guān)節(jié)炎病人的大多數(shù)樣品是抗體陰性。
采用kNN算法的一個主要優(yōu)點是能報告兩種聯(lián)合征(association)。如表2所示,醫(yī)生常常做作一種以上的診斷;SLE合并SS(斯耶格倫病)最常見。許多SLE病人還常合并雷諾綜合征。本發(fā)明的系統(tǒng)將經(jīng)常報告SLE/SS、SLE/SclCR和SLE/NA。
表1所示的實例得自抗-dsDNA抗體和抗染色質(zhì)抗體水平非常高的病人(“未知”)。存在兩種非常高的抗體幾乎總會導(dǎo)致良好的疾病相關(guān)。然而,許多樣品缺乏這種明確的模式。這類病例中,典型的輸出相關(guān)可能是SLE/NA,表明該系統(tǒng)未能報告類似于SLE病人但也類似于患其它疾病的病人,見表3。
由于本系統(tǒng)的一個目的是提供高預(yù)測價值,故有時會將SLE樣品報告為NA。這些樣品可能含有中等水平的診斷性抗體,如抗dsDNA抗體和抗-Sm抗體。
如表1所示,某些模式可能與某疾病強相關(guān),而其它可能是更適度相關(guān)。SLE/NA代表了給定的某未知樣品與狼瘡最適度相關(guān)一方面,具有更強相關(guān)的樣品在輸出中鑒定為“中等”、“強”或“非常強”相關(guān)。表1顯示非常強相關(guān)的一個例子(如大于所選擇匹配疾病的75%診斷為同一疾病)。另外,圖5說明顯示面板的一個例子,包括表示相關(guān)疾病強度的圖例。
屏幕輸出與詳細的抗體報告在美國,希望醫(yī)生遵照臨床實踐指南(clinical practice guidelines)來選擇ANA測試的病人和排序隨訪試驗。因為特異性抗體檢測與屏幕補嘗不相適合,大多數(shù)醫(yī)院和研究所不能得到抗體輸出,如表1所示本發(fā)明產(chǎn)生的11種抗體的輸出。通過本系統(tǒng)輸出與ANA屏幕上的“陽性”輸出的聯(lián)合,一方面,本發(fā)明給予醫(yī)生的報能表提供了相關(guān)疾病的選項而不會招致增加排序特異性抗體的費用。用于產(chǎn)生屏幕顯示結(jié)果的樣品通常不能用于產(chǎn)生特異性抗體結(jié)果;實驗室必須用適當(dāng)排序重新分析這些樣品。
在某些醫(yī)院臨床實施指南能支持所有抗體輸出,不論是第一線測試的或隨訪測試的抗體的直接報表用另一方法進行篩選檢測。因此在一方面,本發(fā)明系統(tǒng)的配制有利于提供一報表選項將抗體輸出與相關(guān)疾病組合在一起。圖5說明在顯示面板中提供的這種輸出的一個例子。一方面,對任何樣品不提供抗體輸出,除非需要所有的如11種特異性抗體。
其它有用的智能系統(tǒng)/統(tǒng)計學(xué)分析方法貝葉斯算法與k最近鄰算法的不同在于以訓(xùn)練組的所有數(shù)據(jù)為基礎(chǔ),而非根據(jù)其接近測試病人所選擇的有限組來計算概率結(jié)果。貝葉斯算法從訓(xùn)練組數(shù)據(jù)庫中的諸數(shù)據(jù)點抽取兩種類型數(shù)據(jù),一種提供疾病的流行性,另一種提供統(tǒng)計學(xué)度量如平均值和標(biāo)準差。測定病人樣品和每種疾病的概率密度(函數(shù)),計算每種疾病的可能性。然后以該疾病的似然率除以所有疾病的總似然率確定各疾病的相對值,選出具有相對值的疾病完成診斷。類似k最近鄰算法,貝葉斯算法可用于檢測一位病人存在的兩種疾病。
神經(jīng)網(wǎng)絡(luò)系統(tǒng)是按層排列通過通信通道連接的節(jié)點或單純數(shù)字處理單元組成的網(wǎng)絡(luò)。所述通道按訓(xùn)練組輸入的信息作了不同加權(quán)。數(shù)據(jù)按對這些通道指定的不同加權(quán)從第一層通過進入后續(xù)層。給定層的每個節(jié)點乘以先前層所有節(jié)點值再除以加入二層節(jié)點中的連接通道的權(quán)重,然后確定這些值的和。然后使所述和通過S形(“S曲線”)函數(shù)來鑒定疾病。
主要成分分析是一種多變量技術(shù),利用正交因子空間將數(shù)據(jù)矩陣還原為其最低維度。可按照此技術(shù)處理訓(xùn)練組來鑒定許多主要成分。然后利用此信息來模擬病人測試數(shù)據(jù),所用技術(shù)為例如靶轉(zhuǎn)換或曲線擬合。主要成分分析或神經(jīng)網(wǎng)絡(luò)分析都不適合檢測兩種疾病。
也可采用統(tǒng)計學(xué)數(shù)據(jù)分析技術(shù)人員已知的其它模式識別技術(shù),本領(lǐng)域技術(shù)人員不難明白本發(fā)明提出可采納這些技術(shù)用于系統(tǒng)性自身免疫疾病。不論采用(那種)模式識別技術(shù),不難使該技術(shù)及其應(yīng)用在本發(fā)明中用計算機來執(zhí)行。為具體分析專門設(shè)計的軟件業(yè)已開發(fā)成為熟練的軟件工程師的常規(guī)材料。
抗體和試驗本發(fā)明用的測試數(shù)據(jù)包括與系統(tǒng)性自身免疫疾病不同程度相關(guān)的各種抗體水平成比例的或代表性的數(shù)值。目前已知自身免疫疾病表達了100種以上的抗體。例子見Peter,J.B.等,Autoantibodies(自身抗體);Elsevier Science B,V,Amsterdam(1996)所列的表,其內(nèi)容納入本文作參考。可從市場上購買到這些抗體中許多種的抗原,根據(jù)文獻中對它們的描述不難合成其它抗體的相應(yīng)抗原。這些抗原的一些來源有BioPacific,Emeryville,California,USA;Immunovision,Springdale,Arkansas,USA;和KMI Diagnostics,Inc.,Minneapolis,Minnesota,USA。自身免疫性疾病中表達的可在免疫試驗中用與其結(jié)合的抗原鑒定的抗體例子見下表SSA 60SSA 60SSA 52SSB 48Sm BB’Sm D1SmSmRNPRNP 68RNP ARNP C核仁纖維蛋白核糖體蛋白P0、P1和P2dsDNA核小體Ku著絲粒A著絲粒BScl-70Pm-SclRNA-聚合酶1、2和3ThJo-1Mi-2PL7PL12
SRP本發(fā)明不限于用上表所列抗原鑒定的抗體。而是,訓(xùn)練組要檢測和定量的抗體數(shù)目,及病人樣品中要檢測和定量的抗體數(shù)目可以不同,這不是本發(fā)明的關(guān)鍵處。然而所選擇的具體抗體和選出組中這類抗體的數(shù)目可能影響試驗的準確度和鑒定所存在的自身免疫疾病的能力。在大多數(shù)病倒中,考慮可檢測10-100種抗體,優(yōu)選15-25種抗體。在本發(fā)明優(yōu)選實施方式中,用上表所列抗原鑒定至少10種抗體,在其它優(yōu)選實施方式中,采用上表所列的所有抗體。
例如,在一實施方式中,測試組采用了以下抗體(用它們所結(jié)合的抗原鑒定)SSA 60,SSA 52,SSB 48,Sm,SmRNP,RNP 68,RNP A,核糖體蛋白P0、P1和P2,dsDNA,核小體,著絲粒B,Scl-70,和Jo-1。
然而,對于上列抗原不可能鑒定皮肌炎。
在一實施方式中,檢測和采用稱為SmRNP的抗原,它是一種多種蛋白的復(fù)合物,包含SmD1和RNP 68RNPA,可用作“驗證”個體抗原的測試結(jié)果,因為它可幫助該系統(tǒng)檢索出這些蛋白質(zhì)。
類似地,用于開發(fā)訓(xùn)練組的不同來源參比樣品的數(shù)目也可以不同,這不是本發(fā)明的關(guān)鍵處,雖然所選擇的數(shù)目可能影響可檢測自身免疫病的范圍。大多數(shù)病例考慮采用100-10000個參比樣品,優(yōu)選200-2000個或更多。
可用常規(guī)抗體試驗檢測每種抗體的定量水平。通常優(yōu)選免疫試驗??刹捎每乖东@(間接免疫試驗)和(抗體)類型捕獲試驗,優(yōu)選抗原捕獲,可用酶標(biāo)記、放射標(biāo)記或熒光標(biāo)記進行檢測。試驗可以是比色法、發(fā)光法、熒光法、酶法、放射法或其它方法如濁度法、比濁法、顆粒計數(shù)或肉眼觀察評估。酶標(biāo)記的例子有堿性磷酸酶、D-半乳糖苷酶、葡萄糖-6-磷酸脫氫酶、辣根過氧化氫酶、內(nèi)酰胺酶、蜂毒肽和脲酶。放射性同位素標(biāo)記的例子有鈷-57和碘-125。熒光標(biāo)記的例子有以下的琥珀酰亞胺酯和乙烯基砜呫噸、花青、香豆素、苯甲亞胺、菲啶、乙啡啶染料、吖啶染料、咔唑染料、吩嗪染料、卟啉染料、喹啉染料和天然產(chǎn)生的蛋白質(zhì)染料。熒光素和羅丹明是呫噸染料的具體類型。具體例子有6-羧基熒光素黃、6-羧基-4’,5’-二氯-2’,7’-二甲氧基熒光素、N,N,N’,N’-四甲基-6-羧基羅丹明、6-羧基-X-羅丹明、5-羧基羅丹明-6G、5-羧基羅丹明-6G、四甲基羅丹明、羅丹明綠和羅丹明紅。7-羥基香豆素是香豆素的一個例子。Hoechst 33258是苯甲亞胺染料的一個例子。德克薩斯紅是菲啶染料的一個例子?;ㄇ噻牾啺孵ト玖系睦佑辛虻饣ㄇ噻牾啺孵ァ?羧基烷基)花青琥珀酰亞胺酯和BODIPY琥珀酰亞胺酯(Molecular Probes,Inc.,Eugene,Oregon,USA)。天然產(chǎn)生的蛋白質(zhì)染料例子是藻紅素。本領(lǐng)域技術(shù)人員不難明白還有許多其它例子。
實施本發(fā)明進行多種抗體定量試驗所用的序列和方式可有很大不同。在優(yōu)選實施方式中,通過多重系統(tǒng)對一個樣品進行這些試驗,所述多重系統(tǒng)能區(qū)分這些試驗從而提供每種抗體的檢測值。這可通過多種方式實現(xiàn)。在異質(zhì)性結(jié)合試驗中,將一種結(jié)合成員固定在固相上是最有效的,因為此法可使結(jié)合對與未結(jié)合物質(zhì)相分離。在多重異質(zhì)結(jié)合試驗中,作為說明性例子,將固體顆粒,優(yōu)選磁性微球作為固定相。這些試驗中,將微球分成許多組,各組含有供一種試驗用的能共價結(jié)合在微球表面的試劑,憑借可鑒別特征不同組可相互區(qū)別,從而得以分別檢測一組與其它組的試驗結(jié)果。區(qū)別參數(shù)可以是顆粒大小、熒光(當(dāng)采用熒光標(biāo)記的試驗時,該試驗應(yīng)采用獨立的熒光標(biāo)記)、光散射、發(fā)射光和光吸收。共價結(jié)合于微球表面的結(jié)合成員依據(jù)所用免疫試驗的類型而不同。因為本發(fā)明的分析物都是抗體,故明確這些抗體的相應(yīng)抗原是結(jié)合微球表面的特別方便的結(jié)合成員。通過流式細胞術(shù)不難實現(xiàn)各組的實際區(qū)分。
當(dāng)采用磁珠時,其磁性使得能快速分離固相與液相,并且固相洗滌方便。可采用順磁材料、磁鐵材料、鐵氧磁性材料或金屬磁性材料制成的珠以賦予這些珠磁性。磁性反應(yīng)材料宜作為該珠的一種成分,珠的其余成分為加入該磁性材料中的聚合材料,或?qū)⑺鼈兓旌稀K鼍酆喜牧峡梢允腔瘜W(xué)方法產(chǎn)生的能允許加入到該結(jié)合反應(yīng)中的抗原或其它試驗試劑附著。
這里描述的多重系統(tǒng)以及對于實踐本發(fā)明有用的其它系統(tǒng)披露于1999年4月30日提交的題為“Multiplex Flow Assays Preferably With Magnetic Particles as SolidsPhase(優(yōu)選含有磁珠作為固相的多重流動試驗)”的發(fā)明人為Micheal I.Watkins等的待批美國專利申請No.09/302,920中。該申請的完整內(nèi)容納入本文作為參考。
進行測試的生物樣品可以是抽取自病人的任何生物液體,其中含有要檢測的疾病的特征性可檢測抗體群??刹捎醚?、血漿、尿液或腦脊液。優(yōu)選血清樣品。
本發(fā)明總體上可用于檢測和診斷系統(tǒng)性自身免疫疾病。例子包括系統(tǒng)性紅斑狼瘡(SLE)、斯耶格倫綜合征(SS)、硬皮病、多肌炎和皮肌炎、CREST(鈣質(zhì)沉著、雷諾現(xiàn)象、累及食道、指趾硬皮病和毛細血管擴張)、混合性結(jié)締組織病,韋格納病、類風(fēng)濕性關(guān)節(jié)炎和脊椎結(jié)節(jié)病。
以上所述目的是為了說明。本領(lǐng)域技術(shù)人員不難明白可對本發(fā)明的組成和方法的各種參數(shù)作進一步修改和變化。例如,可調(diào)整模式識別算法,通過設(shè)置能區(qū)分某具體疾病的“健康”與“不健康”的邊界線水平高于其它疾病的相應(yīng)邊界線,從而減少表明該疾病存在與否的樣品數(shù)目,來控制假陰性率。但是這些和其它變化均屬于本發(fā)明的范圍內(nèi)。
權(quán)利要求
1.一種用計算機執(zhí)行的根據(jù)病人測試樣品中存在的自身抗體來鑒定該病人測試樣品是否與一種或多種特定的系統(tǒng)性自身免疫疾病(SAD)相關(guān)的方法,其特征在于,該方法包括將多個參考數(shù)據(jù)組存入存儲器,各數(shù)據(jù)組的數(shù)值代表多種特定自身抗體中每一種的水平,其中各特定SAD的參考數(shù)據(jù)組包括至少一個與該特定SAD相關(guān)的參考數(shù)據(jù)組,且所述參考數(shù)據(jù)組包括至少一個與該特定SAD無關(guān)的參考數(shù)據(jù)組;接收樣品數(shù)據(jù)組,其數(shù)值代表病人測試樣品中所述多種自身抗體中每一種的水平;和將k-最近鄰過程自動應(yīng)用于該樣品數(shù)據(jù)組和參考數(shù)據(jù)組,以產(chǎn)生能表明該病人測試樣品是否與所述特定SAD無關(guān),或與所述特定SAD中的一種或多種相關(guān)的統(tǒng)計學(xué)決定。
2.如權(quán)利要求1所述的用計算機執(zhí)行的方法,其特征在于,所述SAD包括選自系統(tǒng)性紅斑狼瘡、硬皮病(SLE)、斯耶格倫綜合征(SS)、多肌炎(PMYO)、皮肌炎(DMYO)、CREST和混合性結(jié)締組織病(MCTD)的兩種或多種系統(tǒng)性自身免疫疾病。
3.如權(quán)利要求1所述的用計算機執(zhí)行的方法,其特征在于,所述SAD包括選自系統(tǒng)性紅斑狼瘡(SLE)、硬皮病、斯耶格倫綜合征(SS)、肌炎(MYO)、多肌炎(PMYO)、皮肌炎(DMYO)、CREST、結(jié)締組織病(MCTD)、纖維肌痛、骨關(guān)節(jié)炎(OA)、雷諾綜合征和類風(fēng)濕性關(guān)節(jié)炎(RA)的兩種或多種系統(tǒng)性自身免疫疾病。
4.如權(quán)利要求1所述的用計算機執(zhí)行的方法,其特征在于,所述多種自身抗體包括針對以下抗原中至少十種的抗體SSA 60,SSA 52,SSB 48,Sm BB’,Sm D1,Sm,SmRNP,RNP 68,RNP A,RNP C,核仁纖維蛋白,核糖體蛋白P0、P1和P2,dsDNA,核小體,Ku,著絲粒A,著絲粒B,Scl-70,Pm-Scl,RNA-聚合酶1、2和3,Th,Jo-1,Mi-2,PL7,PL12,和SRP。
5.如權(quán)利要求1所述的用計算機執(zhí)行的方法,其特征在于,所述多種自身抗體由針對以下抗原的抗體構(gòu)成SSA 60,SSA 52,SSB 48,Sm,SmRNP,RNP 68,RNP A,核糖體蛋白P0、P1和P2,dsDNA,核小體,著絲粒B,Scl-70,和Jo-1。
6.如權(quán)利要求1所述的用計算機執(zhí)行的方法,還包括生成能說明該病人測試樣品是否與所述特定SAD無關(guān),或與所述特定SAD中的一種或多種相關(guān)的顯示輸出。
7.如權(quán)利要求6所述的用計算機執(zhí)行的方法,其特征在于,所述生成包括發(fā)送顯示輸出到遠程計算機系統(tǒng)并在與遠程計算機系統(tǒng)耦合的顯示屏上提供該顯示輸出。
8.如權(quán)利要求1所述的用計算機執(zhí)行的方法,其特征在于,所述接收包括通過網(wǎng)絡(luò)連接從自動化測試系統(tǒng)接收樣品數(shù)據(jù)組。
9.如權(quán)利要求8所述的用計算機執(zhí)行的方法,其特征在于,所述存儲包括通過網(wǎng)絡(luò)連接從自動化測試系統(tǒng)接收參考組數(shù)據(jù)。
10.如權(quán)利要求1所述的用計算機執(zhí)行的方法,其特征在于,所述存儲包括從一個或多個測試來源接收參考數(shù)據(jù)組。
11.如權(quán)利要求1所述的用計算機執(zhí)行的方法,其特征在于,所述k-最近鄰過程包括對各參考數(shù)據(jù)組確定樣品數(shù)據(jù)組與參考數(shù)據(jù)組之間的一致性值,并將各一致性值與域值作比較,該過程只采用一致性值高于域值的最先幾個參考數(shù)據(jù)組。
12.如權(quán)利要求11所述的用計算機執(zhí)行的方法,其特征在于,所述k-最近鄰過程還包括對各參考數(shù)據(jù)組確定樣品數(shù)據(jù)組與參考數(shù)據(jù)組之間的距離度量值。
13.如權(quán)利要求11所述的用計算機執(zhí)行的方法,其特征在于,所述過程還包括確定所述最先幾個參考數(shù)據(jù)組的數(shù)目是否高于最小截取值,如果不,表明該病人測試樣品與任何特定SAD不相關(guān),和如果是,確定該病人測試樣品是否與一種或多種特定SAD相關(guān)。
14.如權(quán)利要求11所述的用計算機執(zhí)行的方法,其特征在于,所述過程還包括確定所述最先幾個參考數(shù)據(jù)組中每一組的疾病一致性值。
15.如權(quán)利要求14述的用計算機執(zhí)行的方法,其特征在于,確定疾病一致性值包括對于與最先幾個參考數(shù)據(jù)組相關(guān)的各SAD加入與該SAD相關(guān)的最先幾個參考數(shù)據(jù)組的數(shù)目并除以最先幾個參考數(shù)據(jù)組的總數(shù)以產(chǎn)生該SAD的疾病一致性值。
16.如權(quán)利要求15所述的用計算機執(zhí)行的方法,還包括將各疾病一致性值與第一域值作比較,并返回一致性值高于第一域值的相關(guān)SAD。
17.如權(quán)利要求16所述的用計算機執(zhí)行的方法,還包括將各疾病一致性值與第二域值作比較,并返回一致性值高于第二域值的相關(guān)SAD。
18.一種配制成提供輸出數(shù)據(jù)的計算機系統(tǒng),根據(jù)病人測試樣品中存在的自身抗體水平,所述輸出數(shù)據(jù)表明該病人的測試樣品是否與多種特定的系統(tǒng)性自身免疫疾病(SAD)中的一種或多種相關(guān);該系統(tǒng)包括存儲多個參考數(shù)據(jù)組的存儲裝置,各數(shù)據(jù)組的數(shù)值代表多種特定自身抗體中每一種的水平,其中各特定SAD的參考數(shù)據(jù)組包括至少一個與該特定SAD相關(guān)的參考數(shù)據(jù)組,且所述參考數(shù)據(jù)組包括至少一個與該特定SAD無關(guān)的參考數(shù)據(jù)組;接收樣品數(shù)據(jù)組的裝置,該樣品數(shù)據(jù)組的數(shù)值代表了病人測試樣品中所述多種自身抗體中每一種的水平;處理所述樣品數(shù)據(jù)組和參考組數(shù)據(jù)的裝置,處理采用k-最近鄰過程,以產(chǎn)生表明該病人測試樣品是否與所述特定SAD無關(guān),或與所述特定SAD中的一種或多種相關(guān)的統(tǒng)計學(xué)決定;和提供包括所述統(tǒng)計學(xué)決定的輸出數(shù)據(jù)的裝置。
19.如權(quán)利要求18所述的系統(tǒng),其特征在于,所述SAD包括選自系統(tǒng)性紅斑狼瘡(SLE)、硬皮病、斯耶格倫綜合征(SS)、肌炎(MYO)、多肌炎(PMYO)、皮肌炎(DMYO)、CREST、結(jié)締組織病(MCTD)、纖維肌痛、骨關(guān)節(jié)炎(OA)、雷諾綜合征和類風(fēng)濕性關(guān)節(jié)炎(RA)的兩種或多種系統(tǒng)性自身免疫疾病。
20.如權(quán)利要求18所述的系統(tǒng),其特征在于,所述多種自身抗體包括針對以下抗原中至少十種的抗體SSA 60,SSA 52,SSB 48,Sm BB’,Sm D1,Sm,SmRNP,RNP 68,RNP A,RNP C,核仁纖維蛋白,核糖體蛋白P0、P1和P2,dsDNA,核小體,Ku,著絲粒A,著絲粒B,Scl-70,Pm-Scl,RNA-聚合酶1、2和3,Th,Jo-1,Mi-2,PL7,PL12,和SRP。
21.如權(quán)利要求18所述的系統(tǒng),其特征在于,所述多種自身抗體由針對以下抗原的抗體構(gòu)成SSA 60,SSA 52,SSB 48,Sm,SmRNP,RNP 68,RNP A,核糖體蛋白P0、P1和P2,dsDNA,核小體,著絲粒B,Scl-70,和Jo-1。
22.如權(quán)利要求18所述的系統(tǒng),其特征在于,所述提供輸出數(shù)據(jù)的裝置包括一個顯示輸出數(shù)據(jù)的監(jiān)視器,打印輸出數(shù)據(jù)的打印機和將輸出數(shù)據(jù)提供給各計算機系統(tǒng)的通信接口裝置。
23.如權(quán)利要求18所述的系統(tǒng),其特征在于,所述接收樣品數(shù)據(jù)組的裝置包括配置成從遠程自動檢測系統(tǒng)接收數(shù)據(jù)的界面裝置,手動輸入裝置,和配置成從計算機可讀介質(zhì)讀取數(shù)據(jù)的裝置。
24.如權(quán)利要求18所述的系統(tǒng),其特征在于,所述存儲裝置包括RAM、ROM、計算機可讀磁盤介質(zhì)、硬盤裝置和單獨的數(shù)據(jù)庫系統(tǒng)中的一種。
25.如權(quán)利要求18所述的系統(tǒng),其特征在于,所述k-最近鄰過程對各參考數(shù)據(jù)組確定樣品數(shù)據(jù)組與參考數(shù)據(jù)組之間的一致性值,并將各一致性值與域值作比較,該過程只采用一致性值高于域值的最先幾個參考數(shù)據(jù)組。
26.如權(quán)利要求25所述的系統(tǒng),其特征在于,所述k-最近鄰過程還對各參考數(shù)據(jù)組確定樣品數(shù)據(jù)組與參考數(shù)據(jù)組之間的距離度量值。
27.如權(quán)利要求25所述的系統(tǒng),其特征在于,所述k-最近鄰過程還確定最先幾個參考數(shù)據(jù)組的數(shù)目是否高于最小截取值,如果不,表明該病人測試樣品與任何特定SAD不相關(guān),和如果是,確定該病人測試樣品是否與一種或多種特定SAD相關(guān)。
28.如權(quán)利要求25所述的系統(tǒng),其特征在于,所述k-最近鄰過程還確定最先幾個參考數(shù)據(jù)組中每一組的疾病一致性值。
29.如權(quán)利要求28所述的系統(tǒng),其特征在于,對于與最先幾個參考數(shù)據(jù)組相關(guān)的各SAD,通過加入與該SAD相關(guān)的最先幾個參考數(shù)據(jù)組的數(shù)目并除以最先幾個參考數(shù)據(jù)組的總數(shù)以產(chǎn)生該SAD的疾病一致性值來確定疾病一致性值。
30.如權(quán)利要求29所述的系統(tǒng),其特征在于,所述過程還將各疾病一致性值與第一域值作比較,并返回一致性值高于第一域值的相關(guān)SAD。
31.如權(quán)利要求30所述的系統(tǒng),其特征在于,所述過程還將各疾病一致性值與第二域值作比較,并返回一致性值高于第二域值的相關(guān)SAD。
全文摘要
一種定量測定和分析病人樣品中自身抗體的陣列,可用于診斷系統(tǒng)性自身免疫疾病。該分析采用各種已知的模式識別技術(shù)中的任何一種,例如k-最近鄰分析,將此定量數(shù)據(jù)陣列與先前獲自患有已知系統(tǒng)性自身免疫疾病的患者的數(shù)據(jù)組作比較,從而確定該病人所患的疾病,及此決定的置信程度或可能的準確度。此法能有效鑒定一種疾病和同時存在的兩種或多種疾病。此法易于實施自動化數(shù)據(jù)處理、能消除診斷這些疾病先前遭遇到的許多人為判斷錯誤。
文檔編號G06F19/00GK1961212SQ200580011721
公開日2007年5月9日 申請日期2005年4月20日 優(yōu)先權(quán)日2004年4月20日
發(fā)明者S·R·賓德, J·格魯森戈 申請人:生物輻射實驗室股份有限公司