專利名稱:通過ms使序列數(shù)據(jù)相關(guān)的計算機的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及使數(shù)據(jù)相關(guān)的計算機系統(tǒng)和方法,更具體地涉及對標(biāo)記的數(shù)據(jù)和與該標(biāo)記數(shù)據(jù)有關(guān)的信息進行相關(guān)分析的計算機系統(tǒng)和方法。
背景技術(shù):
構(gòu)成寡核苷酸(ODN)的堿基序列的鑒定通常通過以在1976年引入測序的Fred Sanger博士命名的Sanger測序法進行。正如目前所用的,Sanger測序利用放射性標(biāo)記的分子測定樣品寡核苷酸的序列。放射性標(biāo)記的分子在放射性標(biāo)記的寡核苷酸片段的酶合成中使用。為了測定樣品寡核苷酸的序列,用凝膠電泳分離通過Sanger測序產(chǎn)生的放射性標(biāo)記片段。凝膠電泳產(chǎn)生二維圖譜,通過分析產(chǎn)生有關(guān)樣品核苷酸堿基序列的信息。
雖然Sanger測序在全世界實驗室中使用,但是它有顯著缺點。一個缺點是二維凝膠電泳圖譜是通過分析片段的放射性來測定的。放射性物質(zhì)對許多在此領(lǐng)域工作的人產(chǎn)生健康問題。特別地,此方法很難獲得提供由約1,000個以上堿基構(gòu)成的寡核苷酸的序列信息的單一圖譜。另一缺點是它很難自動分析二維凝膠電泳圖譜。
目前部分克服這些缺點的方法是用熒光標(biāo)記的分子而不是放射性標(biāo)記的分子來制備片段。正如通常所用的,使用對應(yīng)于每種獨特堿基(例如A、T、C和G)的四種獨特標(biāo)記。熒光標(biāo)記分子的使用允許使用柱層析而不是凝膠電泳來分離標(biāo)記的片段。柱層析通常是比凝膠電泳更有效的分離片段技術(shù)并且比凝膠電泳更易于自動化。盡管避免了放射性并且可提高分離效率,熒光標(biāo)記分子與Sanger測序的結(jié)合使用并不廣泛。用熒光標(biāo)記進行Sanger測序的主要問題是在一次分析中只能檢測定少量熒光標(biāo)記(總是少于8,通常僅為4),這使DNA測序的處理量限制在每泳道或每柱一個或兩個樣品。目前可以商業(yè)購買使用熒光標(biāo)記的、可以自動對片段測序的儀器。然而,這些儀器相當(dāng)昂貴并且仍然有這個主要問題。
因此,本領(lǐng)域需要對基本Sanger測序改進的方法。優(yōu)選地,改進的方法將避免使用放射性標(biāo)記的分子、易于自動化、利用在研究和開發(fā)實驗室中通??傻玫降脑O(shè)備、對甚至長寡核苷酸序列也高度準確并且允許有效地同時分析多個寡核苷酸樣品。
發(fā)明概述本發(fā)明提供一種使生物分子(例如DNA)特征(例如核苷酸類型)與具有與生物分子相關(guān)的獨特分子量的分子標(biāo)記相關(guān)的方法和系統(tǒng)。在一個實施方案中,標(biāo)記分子應(yīng)用于合成生物分子時所用的引物上。系統(tǒng)最初接收每個生物分子特征與相應(yīng)分子標(biāo)記分子量的對應(yīng)關(guān)系。系統(tǒng)也接收在分析與分子標(biāo)記結(jié)合的生物分子時測得的分子量信號。對于每個檢測的分子量,系統(tǒng)根據(jù)接收的對應(yīng)關(guān)系決定對應(yīng)于所測分子量的特征。然后系統(tǒng)表明分析的生物分子具有測定的特征。
附圖簡述
圖1是說明核苷酸測序系統(tǒng)組件的框圖。
圖2是說明BCID系統(tǒng)所用表格的圖。
圖3是說明質(zhì)譜儀輸出結(jié)果的圖。
圖4含有說明在不同時間間隔對于分子量110、120、130和140檢測的不同分子量的分子數(shù)的圖譜。
圖5是運行定義運行組件的例行程序(routine)流程圖。
圖6是運行產(chǎn)生ODN序列組件的例行程序流程圖。
圖7是運行顯示ODN序列組件的例行程序流程圖。
發(fā)明詳述本發(fā)明提供一種通過將分子標(biāo)記應(yīng)用于生物分子、測定分子標(biāo)記的特征并用這些特征鑒定生物分子本身的特征來分析生物分子的基于計算機的方法和系統(tǒng)。本發(fā)明的生物分子特征鑒定(“BCID”)系統(tǒng)接收分子標(biāo)記特征與相應(yīng)生物分子特征的對應(yīng)關(guān)系。然后將分子標(biāo)記應(yīng)用于生物分子。然后通過測定分子標(biāo)記的特征來分析標(biāo)記的生物分子。BCID系統(tǒng)使用這些測得的特征和對應(yīng)關(guān)系來鑒定生物分子的特征。
在一個實施方案中,分子標(biāo)記的特征是分子量。每種分子標(biāo)記具有獨特的分子量因此它可以得到唯一鑒定。標(biāo)記的生物分子通過質(zhì)譜儀加以分析以鑒定應(yīng)用于生物分子的生物標(biāo)記的分子量。然后根據(jù)分子標(biāo)記鑒定生物分子的特征。標(biāo)記的生物分子可以在分析前用質(zhì)譜儀預(yù)處理使得可以推導(dǎo)出標(biāo)記生物分子的其它特征。例如,標(biāo)記的生物分子可以通過填充柱洗脫使得標(biāo)記的生物分子以基于標(biāo)記生物分子長度的順序從填充柱流出。也就是說,較短的生物分子先從填充柱流出。因此,質(zhì)譜儀首先分析較短的標(biāo)記的生物分子。BCID系統(tǒng)使用分子量與特征的對應(yīng)關(guān)系以及從預(yù)處理得到的信息鑒定生物分子的特征。
BCID系統(tǒng)可用于在多個不同分析和方法中鑒定生物分子的特征。在下文中,BCID系統(tǒng)得到描述,它用于鑒定寡核苷酸包括任何長度DNA片段的堿基序列(核苷酸測序)、測定兩種寡核苷酸序列是否不同(突變檢測)以及比較生物樣品中表達的基因(差異展示)。核苷酸測序核苷酸測序是鑒定序列未知的寡核苷酸(“ODN”)中的堿基序列的過程。核苷酸測序中的第一步是得到未知序列的ODN樣品(“原始ODN”)。例如,原始ODN可能具有目前未知的序列TAGCATTAGCTGCC。核苷酸測序中的第二步是從原始ODN制備多個ODN(“互補ODN”)。雖然這些互補ODN均具有相同(也是未知的)序列,但是這些序列與原始ODN序列反向互補。例如,原始序列的互補序列是GGCAGCTAATGCTA。核苷酸測序中的第三步是將這些互補ODN分成四部分,即每一部分對應(yīng)于每種堿基(即A、T、C和G)并將每部分置于各自的容器中。四個容器中各含有一套綜合的生物分子,當(dāng)與互補ODN混合時,合成具有與互補ODN序列互補并由此與原始ODN序列相同的序列的ODN。例如,合成的ODN具有與原始ODN序列相同的序列TAGCATTAGCTGCC。這些綜合的生物分子包括用于酶合成的酶和四種合成單元(即dATP,dTTP,dCTP和dGTP)。酶使用“引物”序列以起始合成單元向合成ODN的合成。
此時,四個容器都含有相同成分互補ODN和綜合的生物分子。然而,核苷酸測序中的第四步是向每個容器加入獨特的分子標(biāo)記。向第一個容器加入dATP的雙脫氧類似物ddATP和帶有具獨特分子量(MW1)的分子標(biāo)記的引物。與dATP(“A”)摻入合成的ODN相競爭,酶將把ddATP(“A*”)摻入合成的ODN中。然而,ddATP與dATP功能上的不同在于在ddATP摻入合成的ODN中之后,酶不能再把其它堿基摻入此特定ODN中。例如,如果完全合成的ODN具有序列TAGCATTAGCTGCC,那么酶通過從左到右向引物添加(即開始添加T到引物上以提供引物T,然后添加A到引物T上以提供引物TA,添加G到引物TA以提供引物TAG等等)來合成此序列。在有些情況下酶將添加ddATP而不是dATP到引物T上從而提供引物TA*。酶將不能夠繼續(xù)合成序列,因為A*有效地阻止酶添加下一個堿基。然而,在其它情況下,酶將添加dATP(“A”)到引物T序列上以提供序列引物TA。然后酶將繼續(xù)添加G和C以提供引物TAGC。然而,此時,當(dāng)酶將添加A到引物TAGC上時,可能添加A或A*。如果添加A*,那么產(chǎn)生引物TAGCA*,并且酶不能再添加任何其它堿基到此序列上。如果添加A,那么產(chǎn)生引物TAGCA,并且酶可以繼續(xù)添加堿基,直至產(chǎn)生引物TAGCATT。此時,又可能添加A或A*。
酶具有足夠時間在第一個容器中起作用之后,將合成四種特征為具有以下序列的ODN引物TAGCATTAGCTGCC、引物TAGCATTA*、引物TAGCA*和引物TA*。因為所有ddATP分子都與帶有具分子量MW1的分子標(biāo)記的引物結(jié)合,所以含有少于完整序列的14個堿基的每種合成ODN都將帶有具分子量MW1的分子標(biāo)記。更具體地,具有分子量MW1的分子標(biāo)記將存在于2、5和8個堿基長(不計入具有恒定長度的引物序列)的合成ODN中。
向第二個容器添加dTTP的雙脫氧類似物ddTTP。添加的ddTTP對于dTTP的作用與ddATP對于dATP的作用方式類似。添加的ddTTP分子與帶有具獨特分子量(MW2)的分子標(biāo)記的引物結(jié)合。因此,在第二個容器中,將合成以下序列引物TAGCATTAGCTGCC、引物TAGCATTAGCT*、引物TAGCATT*、引物TAGCAT*和引物T*。因此,具有分子量MW2的分子標(biāo)記將存在于1、6、7和11個堿基長的合成ODN中。
以類似的方式,向第三個容器添加dCTP的雙脫氧類似物ddCTP。添加的ddCTP分子與帶有具獨特分子量(MW3)的分子標(biāo)記的引物結(jié)合。因此,在第三個容器中,將合成以下序列引物TAGCATTAGCTGCC*、引物TAGCATTAGCTGC*、引物TAGCATTAGC*和引物TAGC*。具有分子量MW3的分子標(biāo)記將存在于4、10、13和14個堿基長的合成ODN中。向第四個容器添加dGTP的雙脫氧類似物ddGTP。添加的ddGTP分子與帶有具獨特分子量(MW4)分子標(biāo)記的引物結(jié)合。因此,在第四個容器中,將合成以下序列引物TAGCATTAGCTG*、引物TAGCATTAG*和引物TAG*。具有分子量MW4的分子標(biāo)記將存在于3、9和12個堿基長的合成ODN中。
核苷酸測序的第五步是合并四個容器的內(nèi)容物并使用高壓液相色譜(HPLC)通過填充柱來洗脫合并的內(nèi)容物。結(jié)果是合成的ODN基于大小分離,其中較短的合成ODN先通過填充柱洗脫出來。因此,首先從填充柱洗脫的合成ODN將是引物T*,接著將是引物TA*,然后是引物TAG*等。
核苷酸測序的第六步是用與質(zhì)譜儀連接的標(biāo)記切割單元處理填充柱的輸出物(即洗脫物)。因此,當(dāng)引物T*從填充柱流出時,釋放分子標(biāo)記并且質(zhì)譜儀記錄分子量MW2的存在,因為ddTTP(T*)與帶有具分子量MW2的分子標(biāo)記的引物結(jié)合。同樣,當(dāng)引物TA*從填充柱流出時,質(zhì)譜儀記錄分子量MW1的存在,因為ddATP與帶有具分子量MW1的分子標(biāo)記的引物結(jié)合。因此,質(zhì)譜儀將由此依次記錄分子量MW2、MW1、MW4、MW3、MW1、MW2、MW2、MW1、MW4、MW3、MW2、MW4、MW3和MW3。
然后BCID系統(tǒng)可利用以前定義的分子標(biāo)記與堿基的對應(yīng)關(guān)系鑒定原始ODN的序列。BCID系統(tǒng)接收每種分子量并確定對應(yīng)的堿基。因為合成的ODN已通過填充柱預(yù)處理,所以記錄到的分子量順序與原始ODN中的堿基順序相對應(yīng)。BCID系統(tǒng)輸出測定的堿基序列作為原始ODN的核苷酸序列。
使用具有獨特分子量的分子標(biāo)記的核苷酸測序可用于同時鑒定多個未知序列樣品ODN的序列。每個樣品ODN有其自己的一套四個分開的容器。對多樣品ODN中的每個樣品ODN進行與單一樣品ODN頭四步相同的步驟。具體地,將每個樣品ODN的互補ODN置于四個分開的容器中。每個容器含有酶和合成單元。對于樣品ODN,一套四個容器中的每個容器各含有四種雙脫氧類似物中的一種。然而,每種雙脫氧類似物與帶有分子標(biāo)記的引物結(jié)合,其中分子標(biāo)記具有在所有樣品ODN的所有容器中獨一無二的分子量。例如,第一個樣品ODN的容器可能含有與帶有具分子量MW1的分子標(biāo)記的引物結(jié)合的ddATP,而第二個樣品的容器可能含有與帶有具分子量MW5的分子標(biāo)記的引物結(jié)合的ddATP。在核苷酸測序的第五步中,不是僅僅合并單一ODN四個容器的內(nèi)容物,而是合并所有樣品的所有容器的內(nèi)容物。然后通過填充柱洗脫合并的內(nèi)容物。因為合并了多個樣品的內(nèi)容物,所以對于每個樣品ODN,將有具每種長度的一種序列。因為多個合成的ODN具有相同的長度,所以合成的具相同長度的ODN將同時通過填充柱洗脫出來并且同時進入質(zhì)譜儀。例如,如果合成兩個樣品ODN并且它們合并的內(nèi)容物通過填充柱洗脫出來,那么合成的具長度1的ODN將同時從填充柱流出。如果第一個樣品ODN的第一個堿基的雙脫氧類似物帶有具分子量MW2的分子標(biāo)記而第二個樣品ODN的第一個堿基的雙脫氧類似物帶有具分子量MW5的分子標(biāo)記,那么質(zhì)譜儀將報告分子量MW2和分子量MW5同時存在。
BCID系統(tǒng)含有具獨特分子量的每種分子標(biāo)記與樣品ODN以及其代表的堿基之間的對應(yīng)關(guān)系。用此對應(yīng)關(guān)系,BCID系統(tǒng)可以測定例如第一個樣品ODN序列中的第一個堿基是T而第二個樣品ODN序列中的第一個堿基是A。對于質(zhì)譜儀測得的每種分子量,BCID重復(fù)此過程以同時鑒定每個樣品ODN的序列。
圖1是說明核苷酸測序系統(tǒng)組件的框圖。核苷酸測序系統(tǒng)包括容器101、填充柱102、標(biāo)記切割單元104、質(zhì)譜儀105和BCID系統(tǒng)110。容器101裝有準備通過填充柱102洗脫的合成ODN。填充柱的輸出物經(jīng)分流器103分流至標(biāo)記切割單元104。然后將標(biāo)記切割單元104的輸出物輸入質(zhì)譜儀105。然后將質(zhì)譜儀的輸出結(jié)果輸入BCID系統(tǒng)110。標(biāo)記切割單元使分子標(biāo)記與合成的ODN分離。然后將這些分子標(biāo)記送入質(zhì)譜儀以分析其分子量。BCID系統(tǒng)110包括不同數(shù)據(jù)構(gòu)件111-113和不同功能組件114-117。標(biāo)記套定義表111含有用于鑒定樣品ODN堿基的每套四種分子標(biāo)記的分子量的標(biāo)識。對于其合成的ODN被合并(匯集)并同時通過填充柱洗脫出來的每個樣品ODN定義一套分子標(biāo)記。樣品池定義表112識別分配給樣品池中每個樣品ODN的標(biāo)記套。運行定義表113含有準備連續(xù)通過核苷酸測序系統(tǒng)運行的所有樣品池的目錄。定義運行組件114給用戶提供一個界面,通過它定義每個樣品池和待用在樣品池中的每個樣品ODN上的分子標(biāo)記套。定義運行組件也允許用戶鑒定計劃連續(xù)通過核苷酸測序系統(tǒng)運行的樣品池。收集分子量(MW)數(shù)據(jù)組件115接收質(zhì)譜儀得到的數(shù)據(jù)并鑒定數(shù)據(jù)內(nèi)的各個峰。這些峰表明在一定時間間隔中測定的具有一定分子量的分子標(biāo)記。產(chǎn)生ODN序列組件116使用表111-113使由質(zhì)譜儀測定的分子量與對應(yīng)于這些分子量的序列匹配。顯示ODN序列組件117顯示分子量和相應(yīng)序列的圖譜。顯示ODN序列組件允許用戶對鑒定到的序列進行修飾以校正任何源于自動測序的錯誤。BCID系統(tǒng)表的組件和數(shù)據(jù)構(gòu)件可以永久地存貯于計算機可讀介質(zhì)如CD-ROM上,并且可下載到計算機系統(tǒng)的存儲器中以進行BCID系統(tǒng)的處理。
圖2是說明BCID系統(tǒng)所用表格的圖。標(biāo)記套定義表201對于12個樣品的每一個含有一行,這些樣品可合并到單一樣品池中并同時由核苷酸測序系統(tǒng)進行處理。標(biāo)記套定義表優(yōu)選地由BCID系統(tǒng)開發(fā)者預(yù)裝。此表以數(shù)套與核苷酸測序系統(tǒng)一起提供的分子標(biāo)記的分子量預(yù)裝。表的每行定義一套分子標(biāo)記。每套含有對四種堿基(即A、T、C和G)特有的分子標(biāo)記。標(biāo)記套定義表201含有樣品數(shù)據(jù)。標(biāo)記套數(shù)據(jù)表的第一行對應(yīng)于第一套并表明該套中分子標(biāo)記的分子量是分別對應(yīng)于堿基A、T、C和G的100、110、120和130。標(biāo)記套定義表中每種分子量是獨有的使得每個樣品的每個堿基可以得到唯一鑒定。樣品池定義表202和203含有標(biāo)記套與準備合并到單一樣品池中的每個樣品ODN的樣品ID(標(biāo)識,identification)之間的相關(guān)性。如表202中所示,將對應(yīng)于John Smith的樣品ID分配給標(biāo)記套號1,它們是具有分子量100、110、120和130的分子標(biāo)記。核苷酸測序系統(tǒng)的用戶將信息輸入BCID系統(tǒng)以表示哪些標(biāo)記套分給了哪幾個樣品ODN。BCID系統(tǒng)的用戶可以定義各個樣品池。每個樣品池有其自己的樣品池定義表。運行定義表204列出了準備通過核苷酸測序系統(tǒng)連續(xù)處理的各個樣品池。運行定義表的每行含有樣品池號的標(biāo)識和樣品池定義表的索引。
圖3是說明質(zhì)譜儀輸出結(jié)果的圖。質(zhì)譜儀周期性地測定標(biāo)記切割單元提供的樣品的分子量。例如,質(zhì)譜儀可以每分鐘取樣測定分子量100次。質(zhì)譜儀每次取樣測定分子量時,將測得的每種分子量的分子數(shù)保存在分子量表中。例如,如在時間間隔3中所示,質(zhì)譜儀測得有50個分子具有分子量110,沒有分子具有分子量120或130,有200個分子具有分子量520,并且有5個分子具有分子量530。
圖4含有說明在不同時間間隔對于分子量110、120、130和140檢測的不同分子量的分子數(shù)的圖譜。圖中水平軸代表時間,垂直軸代表分子數(shù)。圖上的每個峰表示在該時間通過填充柱洗脫的具有特定長度的特定合成ODN。例如,峰401表示質(zhì)譜儀在時間4測定到的多個具有分子量100的分子。收集分子量數(shù)據(jù)組件分析分子量表以鑒定不同的峰。對于給定的具有各種分子量的標(biāo)記套,在一個時間對一種分子量應(yīng)該僅檢測到一個峰。不同的過濾技術(shù)可用于測定分子量表中的峰。一旦檢測到峰,產(chǎn)生ODN序列組件就可處理每標(biāo)記套的分子量信息以確定序列。BCID系統(tǒng)首先鑒定與樣品ODN第一個峰有關(guān)的分子量。然后BCID系統(tǒng)從標(biāo)記套定義表檢索與該分子量有關(guān)的特定堿基。BCID系統(tǒng)輸出特定堿基作為樣品ODN序列中的第一個堿基。然后BCID系統(tǒng)鑒定與樣品ODN第二個峰有關(guān)的分子量。BCID系統(tǒng)測定與該分子量有關(guān)的堿基并且輸出作為樣品ODN序列中的第二個堿基。BCID系統(tǒng)對所有峰和所有樣品ODN重復(fù)此過程。序列402說明從分析圖4的圖譜數(shù)據(jù)得到的堿基序列。圖譜的左邊是如標(biāo)記套定義表的標(biāo)記套號1所示的與每種分子量有關(guān)的堿基。因為分子量100的圖譜具有對應(yīng)于位置1、4和7的峰,所以存在于序列中的1、4和7位的堿基均為A。然后顯示ODN序列組件以類似于圖4的方式顯示信息。然后給用戶機會校正序列中可能不正確的任何堿基。盡管在圖4的實例中峰數(shù)據(jù)相當(dāng)離散,但是在實際數(shù)據(jù)中峰可能不象那么容易識別。結(jié)果,峰檢測規(guī)則系統(tǒng)可能不確定地檢測錯誤峰。圖4的信息顯示允許用戶圖示觀察峰信息和相應(yīng)序列并按需要進行校正。
圖5是運行定義運行組件的例行程序流程圖。定義運行組件允許用戶指定哪幾種標(biāo)記套用于哪幾個樣品ODN,哪幾個樣品ODN合并到一起以及哪幾個樣品ODN的樣品池準備同時通過核苷酸測序系統(tǒng)運行。在步驟501-504中,例行程序循環(huán)(loop)允許用戶指定分配給分至每個樣品池中的每個樣品ODN的分子標(biāo)記套。在步驟501中,例行程序顯示樣品池定義網(wǎng)。樣品池定義網(wǎng)大約對應(yīng)于圖2中所示的樣品池定義表的輪廓。標(biāo)記套的數(shù)目預(yù)先設(shè)定。用戶在對應(yīng)于分配給該樣品ODN的分子標(biāo)記套的一行輸入樣品池中每個樣品ODN的樣品標(biāo)識(人名)。在步驟502中,例行程序接收樣品標(biāo)識。在步驟503中,例行程序以下一個樣品池ID保存樣品池定義表。在步驟504中,如果用戶指示樣品池的定義完整,那么例行程序繼續(xù)到步驟506,否則例行程序轉(zhuǎn)至步驟501以輸入下一個樣品池定義。在步驟506中,例行程序顯示運行定義網(wǎng)。在一個實施方案中,運行定義網(wǎng)有對應(yīng)于運行中每個可能樣品池的行和含有樣品池號的一列以及定義該運行的樣品池的樣品池定義表的索引。在步驟507中,例行程序接收來自用戶的樣品池指示以包括在運行中。在步驟508中,例行程序?qū)⑦\行定義信息保存于運行定義表中并且完成程序。
圖6是運行產(chǎn)生ODN序列組件的例行程序流程圖。此例行程序處理通過質(zhì)譜儀得到的一個樣品池的數(shù)據(jù)。此例行程序用于運行中處理的每個樣品池。在步驟601-608中,例行程序循環(huán)選擇樣品池中的每個樣品并鑒定該樣品的每個序列。在步驟601中,例行程序從第一個樣品開始在當(dāng)前樣品池中選擇下一個樣品。在步驟602中,如果所有樣品都已選擇,那么例行程序結(jié)束,否則例行程序繼續(xù)到步驟603。在步驟603中,例行程序從標(biāo)記套定義表檢索所選樣品的分子量。在步驟604-608中,例行程序?qū)z索的分子量的每個測定的峰的循環(huán)進行一次重復(fù)。循環(huán)鑒定哪一個檢索的分子量有隨后通過質(zhì)譜儀測定的分子量峰。在步驟604中,例行程序預(yù)置每一檢索的分子量到分子量表中第一峰時間的索引iA、iT、iC和iG。例如,對于標(biāo)記套號1,分子量是100、110、120和130。因此,參照圖4的圖譜,例行程序設(shè)置索引iA相當(dāng)于2、索引iT相當(dāng)于1、索引iC相當(dāng)于4而索引iG相當(dāng)于3。這些索引用于追蹤分子量表中的峰。在步驟605中,例行程序從第一個時間開始選擇下一個時間。在步驟606中,如果所有檢索的分子量的分子量數(shù)據(jù)都已選擇,那么例行程序轉(zhuǎn)回步驟601以選擇下一個樣品,否則例行程序繼續(xù)到步驟607。在步驟607中,程序?qū)⑿蛄兄械南乱粋€堿基設(shè)置為對應(yīng)于具有最小值的指數(shù)的堿基。例如,第一次通過循環(huán)時,例行程序檢測到索引iT含有最小值1。然后例行程序?qū)⑿蛄兄械牡谝粋€堿基設(shè)置為T。在步驟608中,例行程序預(yù)置到對應(yīng)于其下一個峰的時間的具有最小值的索引。例如,在第一次經(jīng)過此循環(huán)過程中,例行程序就預(yù)置到其時間6處的下一個峰的時間的索引iT。然后例行程序轉(zhuǎn)回步驟605以選擇下一個峰。
圖7是執(zhí)行顯示ODN序列組件的例行程序流程圖。在步驟701中,程序接收用戶對樣品ID的選擇。在步驟702中,如果用戶指示顯示是完全的,那么例行程序完成,否則例行程序繼續(xù)到步驟703。在步驟703中,例行程序檢索含有對應(yīng)于所選樣品ID的信息的分子量表的一部分。例行程序利用樣品池定義表以確定分配給所選樣品ID的分子標(biāo)記套。然后例行程序從標(biāo)記套定義表檢索該分子標(biāo)記套的分子量。在步驟704中,程序顯示分配的檢索的分子量數(shù)據(jù)的圖譜。圖4表示這樣的圖譜的顯示。在步驟705中,例行程序顯示所選樣品ID的ODN序列,其中堿基排列在峰下面。在步驟706中,例行程序允許用戶輸入對顯示序列中任一堿基的校正。在步驟707中,用戶改變了序列,然后例行程序修正ODN序列并轉(zhuǎn)回步驟701從而接收用戶對樣品ID的下一個選擇。突變檢測具有獨特分子量的分子標(biāo)記也可用于同時測定多對DNA(即測試DNA和參照DNA)是否具有不同序列。每對DNA之間的差異可能由DNA突變引起。因此,檢測差異的系統(tǒng)稱為突變檢測系統(tǒng)。突變檢測系統(tǒng)使用與圖4中所示的核苷酸測序系統(tǒng)相同的填充柱、標(biāo)記切割單元和質(zhì)譜儀配置。BCID系統(tǒng)含有其它組件和表以測定多對測試和參照DNA中的每對中是否發(fā)生了突變。
突變檢測系統(tǒng)可同時處理48對DNA。突變檢測的第一步是將每對待比較的DNA樣品置于一對容器中。因此將有48對容器,其中每對容器中的一個容器含有測試DNA而另一個容器含有參照DNA。突變檢測的第二步是將兩種引物加入每個容器中。一種引物將各與測試和參照DNA的一條鏈結(jié)合,而另一種引物將各與測試和參照DNA的另一條鏈結(jié)合。每對容器中的兩種引物之一具有分子量標(biāo)記,但對于每對容器分子量是不同的。因此每對容器分配到具有獨特分子量的分子標(biāo)記。突變檢測的第三步是擴增DNA。擴增到的DNA片段通過兩種引物結(jié)合位點定界。突變檢測的第四步是將每對容器的測試和參照DNA片段合并到單一容器中并且然后使每對容器的內(nèi)容物解鏈和重新退火。當(dāng)解開的鏈重新退火時,存在產(chǎn)物的獨立分配,即測試DNA片鏈的一部分將與測試DNA片段的互補鏈退火,參照DNA片段鏈的一部分將與參照DNA片段的互補鏈退火,并且測試DNA片段鏈的一部分將與參照DNA片段的互補鏈退火以形成測試-參照DNA片段。如果測試DNA片段具有不同于參照DNA片段的序列,那么將出現(xiàn)一個或多個堿基的錯配。例如,堿基T可能與堿基C或堿基G配對。由于這種錯配,測試-參照DNA片段具有不同于測試-測試DNA或參照-參照DNA片段的構(gòu)象。當(dāng)然,如果測試和參照DNA片段相同,那么測試-參照DNA的構(gòu)象與測試-測試DNA或參照-參照DNA片段的構(gòu)象相同。
突變檢測的第五步是合并所有容器的內(nèi)容物并通過填充柱洗脫合并的內(nèi)容物。各種DNA片段將以取決于其構(gòu)象的不同速率流過填充柱。具體地,如果存在錯配,測試-參照DNA片段將在測試-測試DNA和參照-參照DNA片段之后流出填充柱。突變檢測的第六步是將填充柱的流出物送到標(biāo)記切割單元并將切割的分子標(biāo)記送到質(zhì)譜儀。質(zhì)譜儀在不同時間間隔記錄分子量。
質(zhì)譜儀的輸出結(jié)果包括每個時間間隔對于每種分子量檢測到的分子標(biāo)記數(shù)。如果在不同時間有相同分子量的兩個峰,那么一個峰代表測試-參照DNA片段而另一個峰代表測試-測試和參照-參照DNA片段。檢測到兩個峰表明測試-參照DNA片段具有不同于測試-測試和參照-參照DNA片段的構(gòu)象。因此,測試DNA片段和參照DNA片段具有不同的序列并且表明有突變。
用于突變檢測的BCID系統(tǒng)包括與核苷酸測序和分析中所用的那些表相類似的表。標(biāo)記定義表含有對應(yīng)于具有相應(yīng)分子量信號的48個分子標(biāo)記中的每一個的一行。樣品池定義表含有對應(yīng)于48對測試和參照DNA片段中的每一對的一行。每行含有各對的標(biāo)識(例如John Smith)以及分配給該對的分子標(biāo)記的標(biāo)識。BCID系統(tǒng)處理通過質(zhì)譜儀得到的分子量表以確定DNA對是否相同。然后BCID系統(tǒng)轉(zhuǎn)回選擇樣品池定義表的其它行。BCID系統(tǒng)測定與從標(biāo)記定義表選出的行相關(guān)的分子量。然后BCID系統(tǒng)分析該分子量的分子量表以確定該分子量是有一個還是兩個峰。如果存在兩個峰,那么BCID系統(tǒng)表明測試片段的DNA序列不同于參照片段的DNA序列,即在測試片段中存在突變。差異展示當(dāng)多個引物應(yīng)用于測試mRNA群體時,具有獨特分子量的分子標(biāo)記也可用于同時測定測試mRNA群體的特征。然后可將這些特征與用相同引物測得的參照mRNA群體的特征比較。可以觀察到這些特征中的差異。用核苷酸測序系統(tǒng)可鑒定導(dǎo)致差異的mRNA部分并且對其進行測序。鑒定差異的方法稱為差異展示分析。差異分析的目的是鑒定存在于一個mRNA群體中的獨特mRNA種類及其在其它地方的減少或缺乏。本發(fā)明的差異展示系統(tǒng)使用與圖4中所示的核苷酸測序系統(tǒng)相同的填充柱、標(biāo)記切割單元和質(zhì)譜儀配置,并加入了分流器和餾分收集器。BCID系統(tǒng)含有其它組件和表以鑒定測試mRNA群體與參照mRNA群體之間的差異。
差異展示系統(tǒng)同時處理將多個引物應(yīng)用于測試mRNA群體的結(jié)果。差異展示的第一步是制備對應(yīng)于測試mRNA群體的測試cDNA。第二步是將cDNA的一部分加入分開的容器中。差異展示的第三步是加入獨特的引物對,其中之一具有每個容器特有的分子標(biāo)記。每個容器中的引物將與容器中的cDNA的一部分結(jié)合。第四步是擴增每個容器的內(nèi)容物。擴增到的內(nèi)容物將得到多個從引物結(jié)合位點起始合成的cDNA片段。因此,每個引物對將產(chǎn)生一系列具有不同長度和不同序列的片段。此系列是原始樣品中cDNA群體的亞群。差異展示的第五步是合并所有容器的內(nèi)容物并通過填充柱洗脫合并的內(nèi)容物。由于這些片段將具有不同長度,這些片段將以不同速度從填充柱中洗脫。因此,每個容器的內(nèi)容物將洗脫出一系列峰,每個峰代表給定長度的片段。因為每個容器中的片段帶有具獨特分子量的分子標(biāo)記,所以每個容器的內(nèi)容物可通過質(zhì)譜儀得到唯一鑒定。差異展示的第六步是將填充柱的流出物送到標(biāo)記切割單元并將切割的分子標(biāo)記送到質(zhì)譜儀。質(zhì)譜儀在不同時間間隔記錄分子量。質(zhì)譜儀的輸出結(jié)果包括每個時間間隔對于每種分子量檢測到的分子標(biāo)記數(shù)。時間系列中對應(yīng)于單一標(biāo)記的每個峰代表從原始cDNA群體擴增的片段。因此,特定峰的存在與否與mRNA群體中獨特mRNA的存在與否相關(guān)。
差異展示的BCID系統(tǒng)包括與核苷酸序列分析中所用的那些表相類似的表。標(biāo)記定義表含有對應(yīng)于具有相應(yīng)分子量信號的分子標(biāo)記的一行。樣品池定義表含有對應(yīng)于每個容器的一行以鑒定引物和鑒定應(yīng)用于該引物上的分子標(biāo)記。BCID系統(tǒng)比較通過質(zhì)譜儀得到的測試mRNA群體的分子量表和以與測試mRNA相同的方式處理得到的參照mRNA群體的分子量表。具體地,BCID系統(tǒng)選擇分配給每種引物的分子量。BCID系統(tǒng)比較所選分子量的測試mRNA與參照mRNA的分子量數(shù)據(jù)并記錄任何顯著差異。這些差異表明測試mRNA片段與參照mRNA的相應(yīng)片段不同。
BCID系統(tǒng)也允許對這些差異進行測序。BCID系統(tǒng)記錄與任何觀察到的測試mRNA和參照mRNA之間的差異相關(guān)的時間。然后BCID系統(tǒng)要求用戶通過填充柱洗脫容器中用具有用于觀察差異的分子量的分子標(biāo)記擴增的其它內(nèi)容物。在記錄時間,BCID系統(tǒng)在短時間內(nèi)使填充柱底部的分流器將填充柱的流出物導(dǎo)入收集容器而不是標(biāo)記切割單元。因此,收集容器的內(nèi)容物是導(dǎo)致觀察到的差異的片段。然后可用上述核苷酸測序系統(tǒng)對這些片段進行測序或通過其它標(biāo)準技術(shù)加以鑒定。
與根據(jù)本發(fā)明所述的具有獨特分子量的標(biāo)記有關(guān)的適當(dāng)生物分子描述于各于1997年1月22日提交的美國專利申請Nos.08/786,835;08/786,834和08/787,521和各于1997年7月22日提交的具有申請?zhí)?8/898,180;08/898,564和08/898,501的三個美國部分繼續(xù)專利申請以及PCT國際公開Nos.WO 97/27331;WO 97/27325和97/27327中。這6個美國專利申請和3個PCT國際公開在此分別充分引用其全文作為參考。
可用于本發(fā)明方法的生物分子陣列可以按照1997年7月22日提交的題為“基于聚乙烯亞胺的生物分子陣列”和與其同時提交的同樣題目的美國非臨時專利申請No.____中公開的以及1997年7月22日提交的題為“將溶液排列到固體支持物上的裝置和方法”的美國臨時專利申請No.60/053,435和與其同時提交的同樣題目的美國非臨時專利申請No._____中所述的技術(shù)加以制備,在此引用所有這些公開文獻的全文作為參考。
本發(fā)明方法也可用于分析擴增和其它酶反應(yīng),如在1997年7月22日提交的題為“在核酸陣列上進行的擴增和其它酶反應(yīng)”的美國臨時專利申請No.60/053,428和與其同時提交的同樣題目的美國非臨時專利申請No._____中所述,以及單元內(nèi)含有一個以上寡核苷酸序列的陣列中。在單元中含有一個以上寡核苷酸序列的生物分子陣列及其用途描述于1997年7月22日提交的題為“陣列單元內(nèi)的多功能性及其用途”的美國臨時專利申請No.60/053,436和與其同時提交的同樣題目的美國非臨時專利申請No._____中。在此分別充分引用這些申請的全文作為參考。
雖然本發(fā)明已通過各種實施方案得到描述,但并不意味著本發(fā)明局限于這些實施方案。在下面的權(quán)利要求定義本發(fā)明范圍的基礎(chǔ)上,在本發(fā)明精神內(nèi)的修飾對于本領(lǐng)域技術(shù)人員將是顯而易見的。
權(quán)利要求
1.一種在計算機系統(tǒng)中使生物分子特征與具有與生物分子相關(guān)的獨特分子量的分子標(biāo)記相關(guān)的方法,此方法包括接收生物分子的每個特征與和特征相關(guān)的分子標(biāo)記的相應(yīng)分子量之間的對應(yīng)關(guān)系;接收在分析與分子標(biāo)記結(jié)合的生物分子時測得的分子量信號;并且對于每個檢測的分子量,根據(jù)接收的對應(yīng)關(guān)系決定對應(yīng)于所測分子量的生物分子特征;并且表明生物分子具有測定的特征。
2.權(quán)利要求1所述的方法,其中在合成生物分子時將分子標(biāo)記應(yīng)用于所用的引物上。
3.權(quán)利要求1所述的方法,其中表明是鑒定寡核苷酸的堿基序列。
4.權(quán)利要求1所述的方法,其中生物分子特征是鑒定堿基,其中分子量以對應(yīng)于生物分子堿基序列中的堿基位置的順序加以測定,并且其中表明是表明生物分子中的堿基序列。
5.權(quán)利要求4所述的方法,其中特征是進一步鑒定同時分析的多個生物分子中的一個生物分子。
6.權(quán)利要求1所述的方法,其中表明是鑒定一個DNA片段是否與另一個DNA片段不同。
7.權(quán)利要求1所述的方法,其中特征是鑒定已解鏈和重新退火的測試和參照DNA片段,其中每一片段都具有堿基序列,并且其中在不同時間檢測到相同分子量時,確定由該相同分子量所識別的測試和參照DNA片段的堿基序列是不同的。
8.權(quán)利要求1所述的方法,其中表明是鑒定兩個mRNA群體之間的差異。
9.權(quán)利要求1所述的方法,其中特征是鑒定用于合成cDNA群體的引物并且其中在不同時間檢測到的具有相同分子量的分子標(biāo)記的數(shù)目反映cDNA群體中的堿基序列。
10.權(quán)利要求9所述的方法,其中將具有相同分子量的分子標(biāo)記的數(shù)目與從用于合成另一cDNA群體的引物得到的具有相同分子量的分子標(biāo)記的數(shù)目比較以鑒定堿基序列中的差異。
11.一種在計算機系統(tǒng)中同時測定多個樣品寡核苷酸(ODN)序列的方法,其中每種序列含有四種堿基A、T、C和G,此方法包括對于多個樣品ODN中的每個樣品,接收與待用于樣品ODN的分子標(biāo)記相關(guān)的四種分子量信號,四種分子量中的每一種對應(yīng)于四種堿基中的一種,每種分子量在待用于所有樣品ODN的所有分子標(biāo)記的所有分子量中是獨一無二的;并且對于對應(yīng)于序列長度的多個位置的每個位置,接收與已用于樣品ODN的分子標(biāo)記相關(guān)的分子量信號,通過質(zhì)譜儀檢測分子量,其中質(zhì)譜儀檢測每個位置分配給多個樣品ODN中的每個樣品的四種分子量中的一種分子量;并且對于多個樣品ODN中每個樣品,用接收的樣品ODN信號確定測得的分子量代表的堿基;并且將處于樣品ODN序列中位置的堿基定為測得的堿基。
12.權(quán)利要求11所述的方法,包括接收對樣品ODN的選擇;對于四種堿基中的每種堿基,顯示說明分配給所選樣品ODN的該堿基的分子量的檢測的圖譜;并且顯示樣品ODN的序列。
13.權(quán)利要求12所述的方法,包括從用戶接收對顯示序列的改變。
14.一種在計算機系統(tǒng)中測定多對測試和參照DNA片段是否不同的方法,此方法包括對于多對片段中的每對片段,接收具有與片段對相關(guān)的獨特分子量的分子標(biāo)記信號;對于不同時間,接收在同時分析已用不同引物合成的多對片段時測得的具有每種分子量的分子標(biāo)記數(shù)信號;并且對于具有獨特分子量的每種分子量,測定對于該分子量測得的分子標(biāo)記數(shù)中是否有一個以上峰;并且當(dāng)測定到對于該分子量測得的分子標(biāo)記數(shù)中存在一個以上峰時,表明DNA片段對是不同的。
15.一種在計算機系統(tǒng)中鑒定兩個mRNA群體是否不同的方法,此方法包括對于多種引物中的每種引物,接受具有與引物相關(guān)的獨特分子量的分子標(biāo)記信號;對于不同時間,接收在同時分析已用多個引物中的每個引物從mRNA分別合成cDNA的結(jié)果時測得的具有每種分子量的分子標(biāo)記數(shù)信號;并且對于分子標(biāo)記的分子量中的每種分子量,測定接收的分子標(biāo)記數(shù)是否與在各種時間對另一mRNA群體測得的分子標(biāo)記數(shù)大概相同;并且當(dāng)測定到測得的數(shù)目不同時,表明mRNA群體是不同的。
16.一種使樣品生物分子特征與具有與樣品生物分子相關(guān)的獨特分子量的分子標(biāo)記相關(guān)的計算機系統(tǒng),包括表明每種分子標(biāo)記分子量的分子標(biāo)記定義表;用于產(chǎn)生每個樣品生物分子與分子標(biāo)記之間的對應(yīng)關(guān)系的定義運行組件;用于接收在分析已與分子標(biāo)記結(jié)合的樣品生物分子時測得的分子量信號的分子量收集組件;和基于接收的對應(yīng)關(guān)系測定對應(yīng)于所測分子量的生物分子特征并且表明生物分子具有測定的特征的相關(guān)組件。
17.權(quán)利要求16所述的計算機系統(tǒng),其中表明是鑒定寡核苷酸的堿基序列。
18.權(quán)利要求16所述的計算機系統(tǒng),其中表明是鑒定一個DNA片段是否與另一個DNA片段不同。
19.權(quán)利要求16所述的計算機系統(tǒng),其中表明是鑒定兩個mRNA群體之間的差異。
全文摘要
本發(fā)明提供一種使生物分子(例如DNA)特征(例如核苷酸類型)與具有與生物分子相關(guān)的獨特分子量的分子標(biāo)記相關(guān)的方法和系統(tǒng)。在一個實施方案中,標(biāo)記分子應(yīng)用于合成生物分子時所用的引物上。系統(tǒng)最初接收每個生物分子特征與相應(yīng)分子標(biāo)記分子量的對應(yīng)關(guān)系。系統(tǒng)也接收在分析與分子標(biāo)記結(jié)合的生物分子時測得的分子量信號。對于每個檢測的分子量,系統(tǒng)根據(jù)接收的對應(yīng)關(guān)系決定對應(yīng)于所測分子量的特征。然后系統(tǒng)表明分析的生物分子具有測定的特征。
文檔編號C12Q1/68GK1265157SQ98807544
公開日2000年8月30日 申請日期1998年7月21日 優(yōu)先權(quán)日1997年7月22日
發(fā)明者J·范尼斯, J·C·泰伯恩, J·豪伯特, J·T·馬利甘 申請人:拉普吉恩公司