用于檢測(cè)基因組拷貝數(shù)變化的系統(tǒng)和方法
【專利說明】用于檢測(cè)基因組拷貝數(shù)變化的系統(tǒng)和方法
[0001] 本申請(qǐng)要求2013年3月15日提交的臨時(shí)專利申請(qǐng)系列號(hào)61/787, 419的優(yōu)先權(quán), 其通過引用以其整體結(jié)合到本文中。 發(fā)明領(lǐng)域
[0002] 本發(fā)明涉及用于檢測(cè)基因組拷貝數(shù)變化的系統(tǒng)和方法。具體而言,本發(fā)明涉及用 于檢測(cè)拷貝數(shù)變化的下一代測(cè)序方法。
[0003] 背景 拷貝數(shù)改變(CNV)是大小范圍為500個(gè)堿基以上(經(jīng)常在五千和五百萬個(gè)堿基之間) 的基因組區(qū)域的獲得或丟失。全基因組研究已顯示,在人類中存在大量的CNV區(qū)域,和在普 通人群之間存在廣泛范圍的遺傳多樣性。因?yàn)槠湓谌祟愡z傳病癥中的作用,CNV已經(jīng)成為 許多新近研究的焦點(diǎn)。參見例如Iafrate等,2004,NatGenet36: 949-951;Sebat等, 2004,Science305: 525-528;Redon等,2006,Nature444: 444-454;Wong等,2007, AmJHumGenet80: 91-104;Ropers, 2007,AmJHumGenet81: 199-207;Lupski, 2007,NatGenet39:S43-S47,上述各文獻(xiàn)通過引用予以結(jié)合。非整倍性,例如三體性或 全染色體缺失,是與多種人類疾病相關(guān)的拷貝數(shù)改變的限制類型。
[0004] 比較基因組雜交(CGH)是一種用于檢測(cè)拷貝數(shù)變化和其它基因組畸變的技術(shù)。在 CGH中,通常將試驗(yàn)樣品與參考樣品比較,以測(cè)定基因組畸變的存在。通常,將來自試驗(yàn)樣品 的核酸與來自參考樣品的核酸差異標(biāo)記,并通常將來自兩種樣品的核酸雜交至探針的微陣 列。然后自雜交至微陣列的核酸檢測(cè)信號(hào)。自試驗(yàn)和參考核酸的標(biāo)記產(chǎn)生的信號(hào)的對(duì)數(shù)比 率(log比率)與期望值(例如,對(duì)于二倍體區(qū)域?yàn)椹?的偏差經(jīng)檢測(cè)和可用作拷貝數(shù)差異 的指示。
[0005] 目前可用的CGH技術(shù)仍具有明顯的局限性。例如,通常稱為〃GC波〃(其可由于用 于CGH的探針的鳥嘌呤/胞嘧啶(GC)含量所致)的某些泛基因組的人工產(chǎn)物可引起對(duì)數(shù) 比率偏離其期望值,產(chǎn)生假陽(yáng)性。GC-波可加入大范圍的變異性至探針信號(hào)比率,并干擾數(shù) 據(jù)分析算法,這是因?yàn)樗鼈兛墒剐盘?hào)對(duì)數(shù)比率數(shù)據(jù)偏斜遠(yuǎn)離期望值。GC-波人工產(chǎn)物可增 加在特定的基因組區(qū)域中的假陽(yáng)性畸變調(diào)用的可能性,并還可遮掩真實(shí)的畸變調(diào)用(參見 Marioni等,(2007),GenomeBiology, 8:R228)〇
[0006] 熒光原位雜交(FISH)、實(shí)時(shí)PCR和數(shù)字PCR(ddPCR)方法已用于檢測(cè)基因拷貝數(shù) 變化,然而使用這些技術(shù),可多重檢測(cè)(樣品、目的區(qū)域和變體類型)的程度受到限制。與 FISH、實(shí)時(shí)PCR和數(shù)字PCR技術(shù)相比,下一代測(cè)序具有進(jìn)行明顯更高程度的多重檢測(cè)(全部 在單個(gè)測(cè)定中進(jìn)行樣品多重檢測(cè)、靶區(qū)域多重檢測(cè)和變體類型多重檢測(cè))的能力(參見例 如,(Castle等,(2010)BMCGenomics, 11:244;Wood等,NucleicAcidsResearch,第 38 卷,第 14 期,el51;Conway等,(2012)TheJournalofMolecularDiagnostics, 第 14卷,第 2期,pl04-lll)。
[0007] 此外,具體而言,F(xiàn)ISH缺乏區(qū)分密切存在的局部改變的"精微"的分辨力。測(cè)序方 法例如全基因組測(cè)序已用于檢測(cè)拷貝數(shù)改變(Xi等,PNAS108:E1128 (2011);Zong等, Science(2012)第338卷第114期第1622-1626頁(yè))。然而,這樣的方法是耗時(shí)和昂貴 的,并需要大量的生物信息學(xué)分析以確定拷貝數(shù)改變。
[0008] 需要用于檢測(cè)CNV的另外的方法。
[0009] 簡(jiǎn)述 本發(fā)明涉及用于檢測(cè)基因組拷貝數(shù)變化的系統(tǒng)和方法。具體而言,本發(fā)明涉及用于檢 測(cè)拷貝數(shù)變化的下一代測(cè)序方法。
[0010] 例如,在一些實(shí)施方案中,本發(fā)明提供確定目的核酸區(qū)域的染色體拷貝數(shù)變化 (例如,增加或減少(例如缺失))或基因表達(dá)變化(例如增加或減少)的方法,其包括:a) 從目的區(qū)域和至少一個(gè)對(duì)照區(qū)域擴(kuò)增核酸以產(chǎn)生靶和對(duì)照擴(kuò)增子;b)將靶和對(duì)照擴(kuò)增子 測(cè)序以產(chǎn)生測(cè)序讀出;和c)比較靶擴(kuò)增子的水平與對(duì)照擴(kuò)增子的水平。在一些實(shí)施方案 中,從靶核酸產(chǎn)生2個(gè)或更多個(gè)擴(kuò)增子(例如,2、3、4、5、6、7、8、9、10或更多)。在一些實(shí)施 方案中,目的區(qū)域是少于全基因組的核酸區(qū)域(例如,染色體、染色體的臂、染色體的區(qū)域、 一個(gè)或多個(gè)基因或非編碼區(qū))。在一些實(shí)施方案中,至少一個(gè)對(duì)照區(qū)域包含在與目的區(qū)域相 同的染色體上的第一對(duì)照區(qū)域和在不同于目的區(qū)域的核酸(例如染色體)上的第二對(duì)照區(qū) 域。在一些實(shí)施方案中,所述比較包括將第一對(duì)照擴(kuò)增子和第二對(duì)照擴(kuò)增子的比率與靶擴(kuò) 增子和第二對(duì)照擴(kuò)增子的比率進(jìn)行比較。在一些實(shí)施方案中,大于或小于第一對(duì)照擴(kuò)增子 和第二對(duì)照擴(kuò)增子的比率的靶擴(kuò)增子和第二對(duì)照擴(kuò)增子的比率指示目的區(qū)域的染色體拷 貝數(shù)變化或基因表達(dá)變化。在一些實(shí)施方案中,拷貝數(shù)變化為至少2倍(例如,至少5、10、 20、30、40或更多倍)。在一些實(shí)施方案中,目的區(qū)域的染色體拷貝數(shù)變化或基因表達(dá)變化 指示在受試者中的疾?。ɡ绨┌Y)的診斷或預(yù)后。在一些實(shí)施方案中,預(yù)后是疾病發(fā)展 的可能性、疾病對(duì)治療的反應(yīng)、或疾病復(fù)發(fā)的可能性。在一些實(shí)施方案中,所述方法還包括 根據(jù)診斷或預(yù)后確定起作用的療程。在一些實(shí)施方案中,目的區(qū)域是基因組DNA,和染色體 拷貝數(shù)變化是位于所述基因組DNA中的基因的增加或減少(例如缺失)。在一些實(shí)施方案 中,目的區(qū)域是mRNA,和基因表達(dá)變化是增加或減少的mRNA表達(dá)(例如,由于基因融合所 致)。在一些實(shí)施方案中,所述方法還包括在擴(kuò)增期間或在擴(kuò)增后加入核酸銜接頭至擴(kuò)增 子。在一些實(shí)施方案中,銜接頭在擴(kuò)增后連接或在擴(kuò)增期間加入(例如,作為擴(kuò)增引物的一 部分)。在一些實(shí)施方案中,測(cè)序是下一代測(cè)序。在一些實(shí)施方案中,進(jìn)行45或更少(例如 40、35、34、33、32、31、30、29、28、27、26、25、24、23、22、20、15、10 或更少)個(gè)擴(kuò)增循環(huán)。本發(fā) 明不受限于引物的具體類型。實(shí)例包括但不限于化學(xué)修飾的引物、熒光修飾的引物、功能引 物(融合引物)、序列特異性引物、隨機(jī)引物、具有特異性和隨機(jī)序列兩者的引物、和DNA和 RNA引物。
[0011] 在進(jìn)一步的實(shí)施方案中,本發(fā)明提供確定目的核酸區(qū)域的染色體拷貝數(shù)變化(例 如,增加或減少)或基因表達(dá)變化的方法,其包括:a)從目的區(qū)域以及第一和第二對(duì)照區(qū) 域擴(kuò)增核酸以產(chǎn)生靶和對(duì)照擴(kuò)增子;b)將靶和對(duì)照擴(kuò)增子測(cè)序以產(chǎn)生測(cè)序讀出;和c)比 較靶擴(kuò)增子的水平和對(duì)照擴(kuò)增子的水平。
[0012] 在另外的實(shí)施方案中,本發(fā)明提供確定目的核酸區(qū)域的染色體拷貝數(shù)變化(例 如,增加或減少)或基因表達(dá)變化的方法,其包括:a)從目的區(qū)域以及第一和第二對(duì)照區(qū) 域擴(kuò)增核酸以產(chǎn)生靶以及第一和第二對(duì)照擴(kuò)增子;b)將靶和對(duì)照擴(kuò)增子測(cè)序以產(chǎn)生測(cè)序 讀出;和c)將第一對(duì)照擴(kuò)增子和第二對(duì)照擴(kuò)增子的比率與靶擴(kuò)增子和第二對(duì)照擴(kuò)增子的 比率進(jìn)行比較。
[0013] 在仍其它的實(shí)施方案中,本發(fā)明提供確定目的核酸區(qū)域的染色體拷貝數(shù)變化(例 如,增加或減少)或基因表達(dá)變化的方法,其包括:a)從目的區(qū)域和至少一個(gè)對(duì)照區(qū)域擴(kuò) 增核酸以產(chǎn)生靶和對(duì)照擴(kuò)增子,其中所述擴(kuò)增利用銜接核酸;b)將靶和對(duì)照擴(kuò)增子測(cè)序以 產(chǎn)生測(cè)序讀出;和c)比較靶擴(kuò)增子的水平和對(duì)照擴(kuò)增子的水平。
[0014] 在另外的實(shí)施方案中,本發(fā)明提供確定目的核酸區(qū)域的染色體拷貝數(shù)變化(例 如,增加或減少)或基因表達(dá)變化的方法,其包括:a)從目的區(qū)域以及第一和第二對(duì)照區(qū) 域擴(kuò)增核酸以產(chǎn)生靶以及第一和第二對(duì)照擴(kuò)增子;b)將靶和對(duì)照擴(kuò)增子測(cè)序以產(chǎn)生測(cè)序 讀出;和c)將第一對(duì)照擴(kuò)增子和第二對(duì)照擴(kuò)增子的比率與靶擴(kuò)增子和第二對(duì)照擴(kuò)增子的 比率進(jìn)行比較;和d)當(dāng)檢出大于或小于第一對(duì)照擴(kuò)增子和第二對(duì)照擴(kuò)增子的比率的靶擴(kuò) 增子和第二對(duì)照擴(kuò)增子的比率時(shí),確定目的區(qū)域的拷貝數(shù)變化或表達(dá)改變。
[0015] 本發(fā)明還提供試劑盒,其包含以下的一種或多種或全部,基本上由以下的一種或 多種或全部組成,或由以下的一種或多種或全部組成:a)用于擴(kuò)增靶核酸的第一組引物 對(duì);b)用于擴(kuò)增對(duì)照核酸的至少一組第二組引物;c)多個(gè)核酸銜接頭;和任選地d)與核 酸銜接頭特異性雜交的至少一種測(cè)序引物。在一些實(shí)施方案中,至少一組第二引物包含用 于擴(kuò)增兩個(gè)對(duì)照核酸(例如,在與靶核酸相同的染色體上的第一對(duì)照和在不同核酸(例如, 不同的染色體)上的第二對(duì)照)的兩組引物。在一些實(shí)施方案中,所述第一組引物與目的 基因特異性雜交。在一些實(shí)施方案中,試劑盒還包含數(shù)據(jù)分析軟件。
[0016] 本發(fā)明的實(shí)施方案提供測(cè)序靶擴(kuò)增子和對(duì)照擴(kuò)增子的方法,其包括:a)從靶和對(duì) 照核酸區(qū)域擴(kuò)增靶和對(duì)照擴(kuò)增子的文庫(kù);和b)使用大規(guī)模平行測(cè)序技術(shù)測(cè)序擴(kuò)增子的文 庫(kù),以產(chǎn)生多個(gè)測(cè)序讀出。在一些實(shí)施方案中,所述方法還包括當(dāng)相對(duì)于對(duì)照區(qū)域,從靶區(qū) 域產(chǎn)生增加數(shù)量的測(cè)序讀出時(shí),檢測(cè)靶核酸區(qū)域的拷貝數(shù)或表達(dá)的改變的步驟。
[0017] 本發(fā)明進(jìn)一步提供試劑盒,其包含以下的一種或多種或全部,基本上由以下的一 種或多種或全部組成,或由以下的一種或多種或全部組成:a)用于擴(kuò)增靶核酸的至少一組 第一組引物對(duì);b)用于擴(kuò)增第一和第二對(duì)照核酸的至少兩組引物;c)多個(gè)核酸銜接頭; 和d)與核酸銜接頭特異性雜交的至少一種測(cè)序引物。
[0018] 本發(fā)明進(jìn)一步提供試劑盒,其包含以下的一種或多種或全部,基本上由以下的一 種或多種或全部組成,或由以下的一種或多種或全部組成:a)用于擴(kuò)增靶核酸的至少一組 第一組引物對(duì);b)用于擴(kuò)增第一和第二對(duì)照核酸的至少兩組引物,其中第一對(duì)照核酸在與 靶相同的染色體上,和第二對(duì)照在與對(duì)照不同的核酸(例如不同的染色體)上;c)多個(gè)核 酸銜接頭;和d)與核酸銜接頭特異性雜交的至少一種測(cè)序引物。
[0019] 本發(fā)明另外提供組合物,其包含反應(yīng)混合物,基本上由反應(yīng)混合物組成,或由反應(yīng) 混合物組成,所述反應(yīng)混合物包含靶核酸、用于擴(kuò)增靶核酸的至少一組第一組引物對(duì)、用于 擴(kuò)增對(duì)照核酸的至少一組第二組引物、多個(gè)核酸銜接頭和與核酸銜接頭特異性雜交的至少 一種測(cè)序引物。
[0020] 根據(jù)本文包含的教導(dǎo),對(duì)相關(guān)領(lǐng)域的技術(shù)人員而言,其它實(shí)施方案將是顯而易見 的。
[0021] 附圖簡(jiǎn)述 圖1顯示用于本發(fā)明的實(shí)施方案的CNV檢測(cè)測(cè)定的示例性測(cè)定設(shè)計(jì)。
[0022] 圖2顯示用于本發(fā)明的實(shí)施方案的CNV檢測(cè)測(cè)定的示例性測(cè)定設(shè)計(jì)。
[0023] 圖3顯示EGFR拷貝數(shù)擴(kuò)增的理論結(jié)果。
[0024] 圖4顯示用包含不同量的腫瘤細(xì)胞的樣品進(jìn)行的EGFR拷貝數(shù)擴(kuò)增為40的理論結(jié) 果。
[0025] 圖5顯示用包含不同量的腫瘤細(xì)胞的樣品進(jìn)行的EGFR拷貝數(shù)擴(kuò)增為10的理論結(jié) 果。
[0026] 圖6顯示用包含不同量的腫瘤細(xì)胞的樣品進(jìn)行的EGFR拷貝數(shù)擴(kuò)增為5的理論結(jié) 果。
[0027] 圖7顯示使用本公開內(nèi)容的實(shí)施方案的方法的在測(cè)序后EGFR的CNV的檢測(cè)。
[0028] 圖8顯示使用本公開內(nèi)容的實(shí)施方案的方法的在測(cè)序后EGFR的CN