專利名稱:應用snp陣列測量染色體、基因或特定核苷酸序列拷貝數(shù)的方法
應用SNP陣列測量染色體、基因或特定核苷酸序列拷貝數(shù)
的方法
背景技術(shù):
1.發(fā)明領域本發(fā)明涉及測量染色體、基因或特定核苷酸序列拷貝數(shù)的方法,其包括如下步驟 (a)將純合DNA與測試樣品DNA混合;(b)利用SNP陣列分析該DNA混合物;以及(c)通過 測量純合DNA與測試樣品DNA信號輸出的差異來測定染色體、基因或特定核苷酸序列的拷 貝數(shù)。2.相關技術(shù)描述特定染色體序列的改變常常與人類疾病和綜合癥有關。這些改變包括如一個 完整染色體的添加或缺失,如在唐氏綜合征中;幾百萬個堿基對的缺失,如在迪喬治綜合 征中;以及小染色體片段的缺失或重復,如在貝克爾或杜興肌營養(yǎng)不良中。亞端粒缺失 (subtelomericdeletion)在智力遲鈍患者中也經(jīng)常被報道(Lamb等,1989)。此外,特定基 因如BRCAl或MLH1/MLH2的染色體區(qū)域在腫瘤中也常常被改變,已知這對于基因表達是重 要的(Petrij-Bosch等,1997 ;Wijnen等,1998)。從應用ERBB2特異性抗體治療乳腺癌患 者——其具有擴增的ERBB2基因——的實例可知,基因拷貝數(shù)改變的分析對于癌癥患者的 治療可能是重要的(Leyland-Jones和Smith,2001)。目前,許多技術(shù)被用來測定染色體改變的拷貝數(shù)。測量染色體數(shù)目和結(jié)構(gòu)改變最 標準的方法是核型分析方法。根據(jù)該方法,需要培養(yǎng)患者的血液、成纖維細胞或羊膜細胞, 并且需要很多時間和人力來解釋其結(jié)果。核型分析方法通常僅僅可以檢測1百萬個堿基 或更多個堿基的染色體改變。該敏感性問題可以用熒光原位雜交(FISH)方法來彌補。然 而,F(xiàn)ISH方法也需要很多時間和人力并且通常無法每次測量四個或更多個不同靶基因的 改變(Klinger 等,1992)。此外,多色染色體涂染方法(multicolor chromosome painting method)作為核型分析自動化的方法而引入。該方法通過用不同顏色的熒光物質(zhì)標記每個 染色體部分使得染色體的缺失、重復或易位容易被檢測(美國專利號6,066,459)。盡管多 色染色體涂染方法與核型分析方法相比敏感性略微增加,但其基本上需要核型分析所需的 細胞培養(yǎng)和后處理。為了克服對時間和人力的要求,最近已經(jīng)開發(fā)了幾種分子方法來檢測染色體的 改變?;陉嚵械谋容^基因組雜交(CGH)是最有前途的方法之一并且已經(jīng)嘗試了許多試 驗以用于診斷遺傳疾病或檢測癌癥組織中染色體的改變(Pinkel等,1998;美國專利號 6,197,501和6,159,685)。該方法將BAC克隆固定在基材表面以形成陣列,并且將預標記 的標準DNA和樣品DNA與該陣列雜交。根據(jù)該方法,比較標準DNA和樣品DNA的信號相對 量,以檢測諸如缺失或重復的染色體改變。另外,存在通過用多重PCR方法測量相對擴增來測定拷貝數(shù)的方法(Rahil 等,2002)。最近,作為其改進的方法,引入了多重連接依賴性探針擴增(multiplex ligation-dependent probe amplification)(MLPA)(Schouten 等,2002; 專 利 號 W09615271)。
雜合性丟失(LOH)是檢測染色體缺失或重復的最常見的方法。微衛(wèi)星標記已經(jīng)被 用于LOH的研究(Call等,1990)。然而,應用微衛(wèi)星標記的LOH方法除純合缺失的情況以 外不能區(qū)別染色體改變是缺失還是重復。Pont-Kindon和Lyon (2003)報道了應用SNP檢測染色體異常的另一種方法。它們 應用解鏈曲線分析來檢測雜合等位基因的相對量。當兩個等位基因的相對量不同于正常比 率時,該方法檢測到存在三體性。另外,引入了利用SNP陣列檢測染色體缺失或重復的方法(Lindblad-Toh等, 2000)。該方法巨大的潛力在于,可以延伸陣列以檢測大量SNP。然而,用于檢測染色體改變 的SNP陣列的局限性在于,其需要測試DNA中存在雜合等位基因。常見SNP是存在于5%以 上的群中的SNPJfi SNP的數(shù)目和用于CNV(拷貝數(shù)變異)的雜合體頻率在單一基因中是低 的。因此,為了檢測感興趣的特定SNP,對于方法的改進存在迫切需求。因此,本發(fā)明人努力解決上述問題并且開發(fā)了測量染色體、基因或特定核苷酸序 列拷貝數(shù)的更加有效的方法。最終,本發(fā)明人開發(fā)了包括如下步驟的方法將純合DNA與測 試樣品DNA混合,以及利用能夠測量稀有SNP的SNP陣列分析該DNA混合物,以測量每個樣 品信號輸出的差異。他們發(fā)現(xiàn),該方法與測定特定基因拷貝數(shù)的其它分子方法相比能夠得 到更精確的值,以及明顯減少成本和所需人力,從而完成本發(fā)明。發(fā)明概述本發(fā)明的目的是提供測量染色體、基因或特定核苷酸序列拷貝數(shù)的方法,其包括 如下步驟(a)將純合DNA與測試樣品DNA混合;(b)利用SNP陣列分析該DNA混合物;以 及(c)通過測量純合DNA與測試樣品DNA信號輸出的差異來測定染色體、基因或特定核苷 酸序列的拷貝數(shù)。發(fā)明效果根據(jù)本發(fā)明的測量染色體、基因或特定核苷酸序列拷貝數(shù)的分析試劑盒和方法, 當測定特定基因的拷貝數(shù)時可以得到比其它分子方法更精確的值,以及當分析染色體的改 變時顯著減少時間和需要的人力。因此,該方法與已知方法相比可以容易地檢測染色體或 基因的重復和缺失。附圖簡述
圖1是顯示當單獨分析正常測試樣品DNA和分析正常測試樣品DNA和純合DNA的 11混合物時每個等位基因的相對信號強度的示意圖;圖2是顯示當一個等位基因的缺失發(fā)生時每個等位基因的相對信號強度的示意 圖;圖3是說明本發(fā)明實驗方法和分析方法的示意圖;圖4是顯示通過應用純合的葡萄胎(水泡狀脂塊)細胞系DNA和唐氏綜合征細胞 DNAWl 1混合物分析拷貝數(shù)的SNP陣列結(jié)果的示意圖;圖5是顯示通過應用唐氏綜合征樣品(測試樣品)和正常對照DNA(純合體)分 析拷貝數(shù)的Illumina SNP陣列(317K Duo)結(jié)果的示意圖,其中三角表示染色體1上的SNP 分析結(jié)果以及菱形表示染色體21上的SNP分析結(jié)果;圖6是顯示應用唐氏綜合征DNA(染色體1和染色體21)作為樣品的Illumina SNP 陣列(317K Duo)分析后信號強度比較結(jié)果的示意圖,其中三角表示染色體1上的SNP分析
4結(jié)果以及菱形表示染色體21上的SNP分析結(jié)果;以及圖7是顯示應用唐氏綜合征DNA(染色體1和染色體21)作為樣品的Illumina SNP 陣列(317K Duo)分析后每個SNP的信號比的示意圖,其中三角表示染色體1上的SNP分析 結(jié)果以及菱形表示染色體21上的SNP分析結(jié)果。優(yōu)選實施方式描述在一個方面,為了達到上述目的,本發(fā)明涉及測量染色體、基因或特定核苷酸序列 拷貝數(shù)的方法,其包括如下步驟(a)將純合DNA與測試樣品DNA混合;(b)利用SNP陣列分 析該DNA混合物;以及(c)通過測量純合DNA與測試樣品DNA信號輸出的差異來測定染色 體、基因或特定核苷酸序列的拷貝數(shù)。具體地,步驟(a)中的純合DNA為任何細胞系,而沒有限制,只要其是純合的,以及 依照本發(fā)明的目的,優(yōu)選源自單性生殖細胞系或葡萄胎細胞系的純合體。如本文所用,術(shù)語“單性生殖細胞系”指由未受精的卵(η)發(fā)育的二倍體(2η)細 胞系,以及術(shù)語“葡萄胎細胞系”指來自大量異常胚胎組織的細胞系,其中DNA(2η)僅源自 精子(η)。因此,單性生殖細胞系和葡萄胎細胞系的所有DNA均是純合DNA。如本文所用,術(shù)語“純合體”除上述單性生殖細胞系或葡萄胎細胞系之外還可以是 單倍型(haplotype)或BAC克隆DNA。將DNA混合物擴增,然后用于下一步驟,SNP陣列中。如本文所用,術(shù)語“擴增”指進一步合成目標序列的過程。擴增過程可以通過本領 域中使用的常規(guī)方法來完成,而沒有限制,優(yōu)選聚合酶鏈反應(PCR)。完成該過程以從樣品 獲得足夠的DNA。一般而言,擴增過程包括退火、合成(延伸或延長)和變性的過程。樣品 序列通過上述方法進行擴增,然后用于SNP陣列中。如本文所用,術(shù)語“樣品”是來自活有機體的生物物質(zhì)以及主要指來源于人的生物 物質(zhì)。術(shù)語“測試樣品”指用于測量染色體、基因或特定核苷酸序列拷貝數(shù)的對象。待用作 測試樣品的樣品種類沒有具體的限制,以及其可以優(yōu)選是從懷疑具有染色體數(shù)目異?;蚋?變的個體獲得的樣品。在本發(fā)明的優(yōu)選實施例中,來自唐氏綜合征對象的樣品被用作測試 樣品,并且分析基因拷貝數(shù)的改變。步驟(b)是對擴增的DNA片段化和標記,以及將標記的DNA雜交在SNP陣列芯片 上的步驟。此時,優(yōu)選根據(jù)摻入SNP位置的堿基類型使用不同種類的熒光材料。當通過SNP 陣列分析純合DNA和樣品DNA的混合物時,信號比可以通過兩種不同類型細胞或兩種不同 堿基——當堿基彼此不同時——的等位基因獲得。如果染色體異常如缺失或重復出現(xiàn),則 信號比變得與正常染色體的信號比不同。在本發(fā)明中,SNP陣列可以通過本領域中通常使 用的SNP陣列方法和商業(yè)獲得的SNP陣列芯片例如Affymetrix制造的SNP陣列芯片(10K、 100K、500K等)來完成。如本文所用,術(shù)語“單核苷酸多態(tài)性”(SNP)是單核苷酸的多態(tài)性。也即,在種群 中,基因組中的單核苷酸在配對的染色體成員之間不同,并且SNP通常每300-1000個堿基 對出現(xiàn)大約一次。因此,在人基因組中存在三百萬個SNP。SNP分為rSNP(調(diào)節(jié)SNP),其發(fā)現(xiàn)于與轉(zhuǎn)錄活性調(diào)節(jié)有關的區(qū)域如啟動子區(qū)域 中;cSNP(編碼SNP),其誘導外顯子的氨基酸突變;iSNP(內(nèi)含子SNP),其發(fā)現(xiàn)于內(nèi)含子中; sSNP (沉默SNP),其誘導外顯子的沉默突變;以及gSNP (基因組SNP),其發(fā)現(xiàn)于其它基因組 區(qū)域中,并且可用于本發(fā)明的SNP的類型并不限于這些實例。
5
在人基因組中,99. 9%的DNA序列是相同的,以及剩余0. 的DNA含有與種群多 樣性相關的序列變異,如疾病易感性或藥物個體反應。最近,據(jù)報道,SNP與藥物的敏感性 或副作用直接相關。因為SNP是非常豐富的并且分布于整個基因組中,所以它們是可以用 于研究疾病易感性或藥物個體反應的可靠的多態(tài)性。通過研究SNP,可以了解自然遺傳變異 和疾病之間的關系,并且也可以分析藥物敏感性或副作用。因此,這些SNP研究可以提供進 一步篩選遺傳疾病和設計個性化藥物治療的出發(fā)點。一般而言,SNP由非常高度保守的周圍序列進行定義。一個單核苷酸與任何一個其 它核苷酸的置換,或核苷酸的缺失或重復導致SNP。具體而言,稀有SNP指等位基因頻率低 于5%的SNP,以及常見SNP指等位基因頻率高于5%的SNP。稀有SNP可以根據(jù)種(race/ ethnicity)不同而發(fā)生。依照本發(fā)明的目的,稀有SNP的定義可能根據(jù)定義的種群是否限 于人種或是否限于特定種群而不同。還有,明顯的是,即使變異在一個種群中作為常見SNP 而存在,其在其它種群中也可以是稀有SNP。因此,即使稀有SNP僅存在于某一種群中,其 在本發(fā)明中也被認為是稀有SNP。如上所述,根據(jù)種(race/ethnicity)不同而發(fā)生的稀有 SNP可以用于組成有效的陣列。基于待分析的種群的特異性,可以測定種群規(guī)模。因此,明 顯的是,稀有SNP的定義可以不同。這些SNP特性(profile)用可于篩選特定種群以及人 種的疾病模型。如本文所用,術(shù)語“多態(tài)位點”指可以發(fā)現(xiàn)不同堿基的位置。通常,SNP具有至少兩 個等位基因,以及其頻率在一般情況下指或更高的出現(xiàn)。最經(jīng)常出現(xiàn)的等位基因的形式 被稱為野生型形式,以及不經(jīng)常出現(xiàn)的等位基因的形式被稱為突變的等位基因。如本文所用,術(shù)語“等位基因”指同源染色體上存在于給定基因座中的相同基因的 不同形式。等位基因可以用來表示多態(tài)性的一種形式,例如大部分SNP是雙等位基因的。如本文所用,術(shù)語“SNP陣列芯片”指生物微芯片,其能夠通過排列和附著幾百至幾 十萬個生物分子作為探針來分析樣品DNA中所含有的SNP的存在,所述生物分子如具有已 知序列的DNA、DNA片段、cDNA、寡核苷酸、RNA或RNA片段,它們被以一定的間隔固定在由玻 璃、硅或尼龍形成的小固體基材上。根據(jù)互補的程度,樣品中含有的核酸和固定在表面的探 針之間發(fā)生雜交。通過檢測和判斷雜交,可以同時獲得關于樣品中含有的物質(zhì)的信息。步驟(c)是通過測量純合DNA與測試樣品DNA信號輸出的差異來測定染色體、基 因或特定核苷酸序列的拷貝數(shù)的步驟。信號檢測可以通過本領域中使用的任何常規(guī)方法完成,而沒有限制,例如激光誘 導熒光檢測方法、電化學檢測方法、質(zhì)量檢測方法或表面等離子共振(SPR)。在激光誘導熒 光檢測方法中,熒光物質(zhì)與樣品DNA偶聯(lián),在雜交后,應用熒光檢測設備檢測反應的結(jié)果, 以通過光學方法測定雜交。在電化學檢測方法中,通過應用電化學反應,即電極上其它化學 物質(zhì)的還原和氧化反應,檢測雜交。在質(zhì)量檢測方法中,探針和樣品DNA之間的相互作用被 電信號化和檢測。作為通常的實例,有電化學石英晶體微天平(QCM)檢測方法,其根據(jù)固定 在高頻率振蕩的石英上的捕獲探針的質(zhì)量測量頻率變化。表面等離子共振(SPR)是一種這 樣的現(xiàn)象其在生物分子如蛋白結(jié)合至傳感器的表面后引起信號改變,以及通過光學方法, 如沿著金屬表面?zhèn)鬟f的自由電子的量化振動,檢測探針質(zhì)量改變產(chǎn)生的sra信號改變。該 方法能夠檢測因質(zhì)量差異引起的DNA結(jié)合親和性,而不用另外的熒光物質(zhì)標記樣品。優(yōu)選 的方法可以是激光誘導熒光檢測方法。
染色體、基因或特定核苷酸序列的拷貝數(shù)可以通過測量純合DNA與測試樣品DNA 信號輸出的差異容易地測定。通過本發(fā)明的測定拷貝數(shù)的方法,可以測定增加的拷貝數(shù)和 減少的拷貝數(shù)。也即,可以測定因染色體重復而增加的拷貝數(shù)(例如,常染色體中的三體性 或四體性)和因染色體缺失而減少的拷貝數(shù)。具體地,在變更純合等位基因的情況下,也就是,當測試樣品DNA的SNP等位基因 是純合的,但其堿基序列不同于純合細胞系DNA等位基因的堿基序列時,測試樣品和純合 細胞系的SNP等位基因彼此不同。因此,測量每個DNA的SNP信號(SR)比率,從而分析拷 貝數(shù)的改變。式樣品的SNP信號/純合細胞系的SNP信號例如,當樣品DNA和純合細胞系DNA的1 1混合物用于SNP陣列中時,每個DNA 的SNP信號(SR)比率將是1 1。就此而言,如果比率不是1 1,則表明拷貝數(shù)的改變。 如果在實踐過程中難以將混合比率保持在1 1,則測量兩個DNA的總信號比率,以校正 SR,從而更加精確地測量拷貝數(shù)的改變。此外,當測試樣品DNA是純合等位基因時,通過本發(fā)明的方法兩種堿基的信號強 度出現(xiàn)1 3或3 1的比率。比率根據(jù)拷貝數(shù)的改變而變化。因此,即使測試樣品DNA 是純合等位基因,也可以測定拷貝數(shù)。與單獨分析正常DNA的已知方法相比,本發(fā)明的方法能夠提供關于拷貝數(shù)改變的 更加有價值的信息。依照本發(fā)明的一個優(yōu)選實施方式,與僅應用測試樣品的已知分析方法 相比(圖6和7),即使應用很小量的SNP,通過本發(fā)明的方法也可以很容易和精確地檢測特 定物質(zhì)的染色體重復和缺失(圖6和7)。如本文所用,術(shù)語“變更(alter)純合等位基因”指這樣的SNP,其中測試樣品DNA 的SNP等位基因是純合的,但其堿基序列不同于純合細胞系DNA等位基因的堿基序列,以及 該術(shù)語由本發(fā)明人為更好地描述而引入。在優(yōu)選的實施方式中,當本發(fā)明的方法應用于稀有SNP的SNP陣列時,關于拷貝數(shù) 改變的信息可以更加有用地獲得。例如,如圖1和2中所示,在單獨分析正常DNA樣品后,六個SNP中兩個可以只用在 SNP陣列中。然而,當在稀有SNP之中,僅選擇純合細胞系DNA中發(fā)現(xiàn)的SNP用于SNP陣列 中時,即使應用小量的SNP也可以獲得大量信息。也即,當由頻率為5%的SNP組成的SNP 陣列被用來分析100個SNP時,發(fā)現(xiàn)大約10個雜合SNP,由此可以獲得關于拷貝數(shù)改變的信 息。同時,當由頻率低于的稀有SNP組成的SNP陣列被用來分析100個SNP時,可以有 利地使用陣列中98%以上的雜合等位基因。另外,可以使用所有低頻率的SNP。因此,在單 性生殖細胞系中,選擇具有許多稀有SNP的細胞系或使用其它種的純合細胞系來更加準確 地測定特定區(qū)域拷貝數(shù)的改變。同樣,本發(fā)明的方法對于僅由稀有SNP組成的SNP陣列非常有用,而且也可應用于 商業(yè)獲得的由稀有和常見SNP組成的SNP陣列。也即,應用商業(yè)獲得的SNP陣列單獨分析 變更純合等位基因,以測定拷貝數(shù)。本發(fā)明的實踐可以采用有機化學、聚合物技術(shù)、分子生物學(包括重組技術(shù))、細 胞生物學、生物化學和免疫學的常規(guī)技術(shù)和描述,其均在本領域的技能內(nèi)。這些常規(guī)技術(shù)
7包括聚合物陣列合成、雜交、連接和應用標記檢測雜交。這些常規(guī)的技術(shù)和描述可以發(fā)現(xiàn) 在標準實驗室手冊中,諸如Genome Analysis :A Laboratory Manual Series (Vols. I-IV)、 Using Antibodies :A Laboratory Manual、Cells :A Laboratory Manual、PCR Primer A Laboratory Manual 禾口 Molecular Cloning :A Laboratory Manual (全部來自 Cold Spring Harbor Laboratory Press)、Biochemistry (Stryer, L. Freeman, New York)、 Oligonucleotide Synthesis :A Practical Approach(Gait,1984, IRL Press, London) Lehninger Principles of Biochemistry(Nelson 禾口 Cox,2000, W. H. Freeman Pub., New York)和 Biochemistry (Berg 等 2002,W. H. Freeman Pub.,New York),所有這些通過引用其 全部并入本文,用于所有目的。 在本發(fā)明中可用于聚合物陣列合成的方法和技術(shù)已經(jīng)描述在美國序列號
09/536;,841、WO 00,/58516、美國專利號5,143,854,5, 242,974,5, 252,743,5,324,633、5,384,261,5,405,783,5,424,186,5,451,683、5,482,867,5,491,074,5,527,681、5,550,215,5,571,639,5,578,832,5,593,839、5,599,695,5,624,711,5,631,734、5,795,716,5,831,070,5,837,832,5,856,101、5,858,659,5,936,324,5,968,740、5,974,164,5,981,185,5,981,956,6,025,601、6,033,860,6,040,193,6,090,555、
6,136,269,6, 269,846 和 6,428,752 以及 WO 99/36760 和 WO 01/58593 中,它們通過引用其 全部均并入本文,用于所有目的。核酸陣列描述在許多專利中,包括美國專利號5,412,087,6, 147,205,6, 262,216、 6,310, 189,5,889, 165和5,959,098,但相同的技術(shù)用于多肽陣列。本發(fā)明還可以考慮基因表達監(jiān)測技術(shù)、序型分析技術(shù)、文庫篩選技術(shù)和基因型分 型技術(shù)?;虮磉_監(jiān)測和序型分析方法可以顯示在美國專利號5,800, 992,6, 013,449、 6,020,135,6, 033,860,6, 040,138,6, 177,248 和 6,309,822 中?;蛐头中图捌鋺蔑@示 在美國序列號 10/442,021、10/013,598 和美國專利號 5,856,092,6, 300,063,5, 858,659、 6,284,460,6, 361,947,6, 368,799 和 6,333,179 中。在本發(fā)明中,基因組樣品可以通過各種機制擴增,其中一些可以采用PCR。 參見,例如,PCR Technology principles and Applications for DNA 擴增(Ed. H. A. Erlich, Freeman Press, NY, N. Y. ,1992) ;PCRProtocols :A Guide to Methods and Applications(Eds. Innis, et al. , Academic Press, San Diego, Calif. ,1990) ;Mattila 等,Nucleic Acids Res.19,4967(1991) ;Eckert φ, PCR Methods and Applications 1, 17(1991) ;PCR(Eds. McPherson et al.,IRL Press, Oxford);以及美國專利號 4,683,202、 4,683,195,4, 800,159,4, 965,188 和 5,333,675。雜交測定的方法描述在=Maniatis 等 Molecular Cloning :A Laboratory Manual (2nd Ed. Cold Spring Harbor, N. Y. , 1989) ;Berger 禾口 Kimmel Methods in Enzymology, Vol. 152, Guide to Molecular Cloning Techniques(Academic Press,Inc., San Diego, Calif. , 1987) ;Young 和 Davism,P. N. A. S,80 :1194(1983)中。雜交的信號檢測的方法描述在美國專利號5,143,854,5, 578,832 ;5,631,734 ; 5,834,758 ;5,936,324 ;5,981,956 ;6,025,601 ;6,141,096 ;6,185,030 ;6,201,639 ; 6,218,803 ;和 6,225,625 以及 W099/47964 中。本發(fā)明的實踐還可以采用常規(guī)生物學方法、軟件和系統(tǒng)。本發(fā)明的計算機軟件
8產(chǎn)品通常包括具有計算機可執(zhí)行指令的計算機可讀介質(zhì),所述計算機可執(zhí)行指令用于 完成本發(fā)明方法的邏輯步驟。適合的計算機可讀介質(zhì)包括軟盤、⑶-R0M/DVD/DVD-R0M、 硬盤驅(qū)動器、閃存、ROM/RAM、磁帶等。計算機可執(zhí)行指令可以以適合的計算機語言或幾 種語言的組合編寫?;镜挠嬎闵飳W方法描述在Introduction to Computational Biology Methods(PffS Publishing Company, Boston,1997) ;Computational Methods in Molecular Biology,(Elsevier,Amsterdam,1998) ;Bioinformatics Basics Application in Biological Science and Medicine(CRC Press, London,2000)禾口 Bioinformatics :A Practical Guide for Analysis of Gene and Proteins(Wiley & Sons, Inc. ,2. sup. nd ed.,2001)中。本發(fā)明還可以利用各種計算機程序產(chǎn)品和軟件,用于多種目的,如探針設計、數(shù)據(jù) 管理、分析和儀器操作。參見,美國專利號5,593,839,5, 795,716,5, 733,729,5, 974,164、 6,066,454,6, 090,555,6, 185,561,6, 188,783,6, 223,127,6, 229,911 和 6,308,170。本發(fā)明可以用來診斷和篩選因重復和缺失的染色體異常,如三體性、單體性和性 染色體異常。另外,本發(fā)明用于診斷因小染色體缺失的遺傳性疾病,如杜興肌營養(yǎng)不良,以 及用于檢測疾病中小染色體的改變,所述疾病具有多種原因所引發(fā)的遺傳傾向,諸如智力 遲鈍、阿爾茨海默病和糖尿病。進一步,本發(fā)明可以用來分析腫瘤組織中致癌基因和腫瘤抑 制基因拷貝數(shù)的變化,或總?cè)旧w數(shù)目的異常。染色體的拷貝數(shù)因個體而不同,據(jù)報道,這 種拷貝數(shù)變異與一些疾病相關(Iafrate等,2004)。因此,本發(fā)明可以用于檢測個體之間的 拷貝數(shù)變異。具體而言,與已知方法相比,本發(fā)明的分析方法是強有力的工具,其可以檢測 高于3η的增殖和有效分析小染色體區(qū)域的擴增。下面,參考下列實施例對本發(fā)明進行更加 詳細的描述。然而,這些實施例僅用于說明性目的,本發(fā)明不意欲受實施例限制。實施例1.用于檢測增加的拷貝數(shù)的SNP陣列在單獨分析正常測試樣品DNA和分析正常測試樣品DNA和純合DNA的1 1混合 物后,每個等位基因的相對信號強度被顯示。正常測試樣品(正常)中等位基因的相對信號 強度顯示在圖的左側(cè)。當拷貝數(shù)變?yōu)槿w性時等位基因的相對信號強度顯示在圖的右側(cè), 其中每個DNA鏈的改變被分別描述。在分析了關于測試樣品和純合DNA的所有等位基因的 信息后,根據(jù)本發(fā)明的方法應用SNP陣列分析每個等位基因。當拷貝數(shù)可測量時,其由O表 示。當拷貝數(shù)不可測量時,其由X表示。P表示,拷貝數(shù)的增加或減少不能通過特定等位基 因的相對信號強度測定,但卻發(fā)現(xiàn)改變,并且所述增加或減少能夠通過總信號強度測定。實施例2.用于檢測減少拷貝數(shù)的SNP陣列一個等位基因的缺失被顯示為每個等位基因的相對信號強度,其中每個DNA鏈的 缺失被分別描述。當SNP陣列僅在測試樣品上進行時,缺失不能由一個等位基因的結(jié)果測 定,以及缺失的可能性可以通過分析鄰近的等位基因來測定。然而,當應用本發(fā)明的方法 時,可以分析每個等位基因,從而測定缺失,并且與現(xiàn)有方法相比其分析性能改進很多(圖 2)。實施例3.純合葡萄胎DNA和唐氏綜合征患者DNA——來自純合葡萄胎細胞系和 具有三個拷貝的染色體21的唐氏綜合征患者——的SNP陣列以1 1的比率彼此混合,然 后將該SNP陣列用來分析拷貝數(shù)。除染色體21和X染色體之外,SR被發(fā)現(xiàn)為1 1、1 3 和3 1。染色體21被發(fā)現(xiàn)顯示2 3、3 2、1 4和4 1的SR,其中2 3或3 2的SR表明唐氏綜合征患者中三個拷貝的染色體21 (圖4)。實施例4.唐氏綜合征和正常對照DNA的Illumina SNP陣列,唐氏綜合征DNA和 正常對照DNA被用作樣品,并且分別與葡萄胎DNA(1 1)混合。然后,Illumina SNP陣列 (317K Duo)被用來進行SNP分析。只有在葡萄胎中顯示AA并且在唐氏綜合征細胞中顯示 BB的SNP被單獨分析。300個相應的SNP被分別從染色體1和21中提取并且分析(圖5)。 結(jié)果發(fā)現(xiàn),唐氏綜合征中的額外染色體21(3n)的拷貝數(shù)容易與正常染色體1 (2η)的拷貝數(shù) 區(qū)分。為了證實本發(fā)明的檢測方法的有用性,唐氏綜合征DNA(正常染色體1和三個拷 貝的染色體21,無純合對照DNA)被作為樣品用來通過Illumina SNP陣列(317 DUO)完成 SNP分析。分析通常通過信號強度比較的方法和通過分析A和B等位基因信號強度比的方 法來完成。如在本發(fā)明的方法中,300個SNP結(jié)果被提取,并且然后每個結(jié)果均顯示在圖表 中(圖6和7)。結(jié)果,當應用本發(fā)明的方法時(圖5),與只分析信號強度而不與正常對照樣品混 合的方法(圖6)相比,染色體或基因擴增可以更容易區(qū)分。具體而言,當僅應用測試樣品 分析信號強度時,染色體21的信號強度(由菱形表示)比染色體1的信號強度增加得多, 但總體變化太高以致無法區(qū)分信號。另外,當分析每個峰的信號強度比時(圖7),比值在0. 5上下波動,因此難以區(qū) 分信號的擴增和減少。具體地,正常染色體1具有在0. 5附近雜合體的比值,以及染色體 21 (3n)具有在0.66和0.33附近的比值。因此,難以區(qū)分樣品的染色體21的擴增和減少 (圖7)。而且,如果染色體增殖高于8η (而非3η)或小部分染色體被增殖,則難以區(qū)別信號 與背景。例如。如果染色體或基因的擴增在4或5倍以上,則比值變得接近1或0,使分析 難以進行。與具有上述問題的已知方法相比,本發(fā)明的應用正常對照組和測試樣品混合物的 分析方法的優(yōu)勢在于,可以容易地區(qū)別染色體增殖,可以精確地分析高于3η的增殖,以及 也可以有效地分析小部分染色體的擴增。
權(quán)利要求
測量染色體、基因或特定核苷酸序列拷貝數(shù)的方法,包括如下步驟(a)將純合DNA與測試樣品DNA混合;(b)利用SNP陣列分析所述DNA混合物;以及(c)通過測量所述純合DNA與所述測試樣品DNA信號輸出的差異來測定染色體、基因或特定核苷酸序列的拷貝數(shù)。
2.根據(jù)權(quán)利要求1所述的方法,其中所述純合DNA是單性生殖細胞系或葡萄胎細胞系 的 DNA。
3.根據(jù)權(quán)利要求1所述的方法,其中所述純合DNA是克隆的DNA片段。
4.根據(jù)權(quán)利要求1所述的方法,其中所述純合DNA在步驟(a)中與所述測試樣品DNA 以1 1的比率混合。
5.根據(jù)權(quán)利要求1所述的方法,其中所述SNP陣列是被設計來測量稀有SNP的SNP陣列。
6.根據(jù)權(quán)利要求1所述的方法,其中在步驟(c)中,如果所述純合DNA和所述測試樣 品DNA是變更純合等位基因,則所述純合DNA和所述測試樣品DNA的SNP等位基因的信號 比(SR)通過下式測量樣品的SNP信號/純合細胞系的SNP信號,然后與其它區(qū)域的信號 比比較,以測定染色體、基因或特定核苷酸序列拷貝數(shù)的改變。
7.根據(jù)權(quán)利要求1所述的方法,其中如果所述測試樣品DNA是雜合等位基因,則將兩個 堿基的信號強度與其它區(qū)域的信號強度進行比較,以測定染色體、基因或特定核苷酸序列 拷貝數(shù)的改變。
全文摘要
本發(fā)明涉及測量染色體、基因或特定核苷酸序列拷貝數(shù)的方法,其包括如下步驟(a)將純合DNA與測試樣品DNA混合;(b)利用SNP陣列分析該DNA混合物;以及(c)通過測量純合DNA與測試樣品DNA信號輸出的差異來測定染色體、基因或特定核苷酸序列的拷貝數(shù)。
文檔編號C12Q1/68GK101918597SQ200980101478
公開日2010年12月15日 申請日期2009年3月5日 優(yōu)先權(quán)日2008年3月11日
發(fā)明者洪暻滿 申請人:國立癌中心