一種簡化基因組測序方法
【專利摘要】本發(fā)明涉及分子生物學(xué)【技術(shù)領(lǐng)域】,公開了一種簡化基因組測序方法,包含下述步驟:(1)以ⅡB型限制性內(nèi)切酶對基因組DNA進(jìn)行酶切;(2)對酶切產(chǎn)物連接接頭一和接頭二;(3)純化連接產(chǎn)物;(4)對純化后的產(chǎn)物進(jìn)行PCR擴(kuò)增;(5)純化PCR產(chǎn)物,得到測序文庫;(6)上機(jī)測序。本發(fā)明還提供了上述步驟(4)中對純化后的連接產(chǎn)物進(jìn)行擴(kuò)增的PCR擴(kuò)增體系及PCR程序,保證了本發(fā)明所提供的建庫方法得以順利實現(xiàn)且操作過程快捷。利用本發(fā)明所提供的方法對基因組DNA進(jìn)行測序,得到的數(shù)據(jù)利用率較高、測序結(jié)果的準(zhǔn)確可靠。
【專利說明】一種簡化基因組測序方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及分子生物學(xué)【技術(shù)領(lǐng)域】,特別涉及一種簡化基因組測序方法。
【背景技術(shù)】
[0002] 簡化基因組測序是一種對部分基因組進(jìn)行序列測定的高通量測序方法。具體來 說,它是指利用生物信息學(xué)方法,設(shè)計標(biāo)記開發(fā)方案,富集特異性長度片段,然后應(yīng)用高通 量測序技術(shù)獲得海量標(biāo)簽序列來代表目標(biāo)物種全基因組信息的測序方法。
[0003] 簡化基因組測序常用的測序文庫類型可以歸納為3個大類,①簡化測序,包括簡 化文庫和簡化多態(tài)序列復(fù)雜性;②限制性酶切位點關(guān)聯(lián)DNA測序;③低覆蓋基因分型文庫, 包括多元鳥槍法基因分型和基于測序的基因分型。
[0004] 基于II B型限制性內(nèi)切酶酶切的簡化基因組測序,即2b-RAD,這個方法屬于簡化 基因組測序方法中的限制性酶切位點關(guān)聯(lián)DNA測序這一類。相比于其他類的簡化基因組測 序方法,2b-RAD在建庫方法上有了新的改進(jìn),且成本更加便宜。該方法能涵蓋基因組中的幾 乎全部限制酶切位點,不同于RRLsXroPS和GBS等方法,僅僅能覆蓋一個有限的區(qū)域,一般 不超過500bp,所以可以更有效的進(jìn)行PCR和測序。2b-RAD的操作方法比較簡單,因此更適 合于大批樣本的同時分型。但是現(xiàn)有文獻(xiàn)中記載的2b-RAD方法大多存在酶切不均勻?qū)е?標(biāo)簽數(shù)少,接頭連接效率低和文庫濃度低等不足之處。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的一個目的在于提供一種簡化基因組測序方法,該測序方法步驟簡捷易 行、測序結(jié)果準(zhǔn)確性高。
[0006] 為解決上述技術(shù)問題,本發(fā)明的實施方式提供了一種簡化基因組測序方法,包含 下述步驟:(1)利用II B型限制性內(nèi)切酶對基因組DNA進(jìn)行酶切,得到酶切產(chǎn)物;(2)對酶 切產(chǎn)物連接接頭一和接頭二,得到連接產(chǎn)物;(3)對連接產(chǎn)物進(jìn)行純化,得到純化后的連接 產(chǎn)物;(4)將純化后的連接產(chǎn)物進(jìn)行PCR擴(kuò)增,得到PCR產(chǎn)物;(5)對PCR產(chǎn)物進(jìn)行純化,得 到測序文庫;(6)使用高通量測序平臺對測序文庫進(jìn)行測序。
[0007] 其中,步驟(4)中對純化后的連接產(chǎn)物進(jìn)行PCR擴(kuò)增的反應(yīng)體系如下所示:高保真 DNA聚合酶lμL,5XHFBuf?erl0μL,2·5mMdNTP6μL,10μMSEQIDN0:4(ICl-P5)所 示的 P5 接頭引物 1 μ L,10 μ M SEQ ID NO :5 (IC2-P7)所示的 P7 接頭引物 1 μ L,10 μ M SEQ ID NO :6 (ILL-Mpx)所示的R2引物1 μ L,10 μ M帶條形碼序列的Rl引物1 μ L,純化后的連 接產(chǎn)物20 μ L,CldH2O 9 μ L,總50 μ L。其中(下述堿基序列中,*A和*T分別代表硫代修飾 的A喊基和硫代修飾的T喊基):
[0008] SEQ ID NO :4 :5' -AATGATACGGCGACCACCG*A-3'
[0009] SEQ ID NO :5 :5'-CAAGCAGAAGACGGCATACG*A-3'
[0010] SEQ ID NO :6 :
[0011] 5' -AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATOT-3'
[0012] 此外,在上述擴(kuò)增體系中,帶條形碼序列的Rl引物的序列如SEQ ID NO: 7(ILL-RAD-bcl3)、SEQ ID N0:8(ILL-RAD-bcl4)、SEQ ID N0:9 (ILL-RAD-bcl5)或 SEQ ID NO :10 (ILL-RAD-bcl6)所示(下述堿基序列中,*T代表硫代修飾的T堿基):
[0013] SEQ ID NO :7 :
[0014] 5'-CAAGCAGAAGACGGCATACGAGATTTGACTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC *T-3'
[0015] SEQ ID NO :8 :
[0016] 5'-CAAGCAGAAGACGGCATACGAGATGGAACTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC *T-3'
[0017] SEQ ID NO :9 :
[0018] 5'-CAAGCAGAAGACGGCATACGAGATTGACATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC *T-3'
[0019] SEQ ID NO :10:
[0020] 5'-CAAGCAGAAGACGGCATACGAGATGGACGGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC *T-3'
[0021] 本發(fā)明的實施方式所提供的簡化基因組測序方法,首先采用II B型限制性內(nèi)切酶 對基因組DNA進(jìn)行酶切,在基因組DNA的靶標(biāo)位點上游和下游位點切斷DNA,獲得長度一致 的酶切產(chǎn)物DNA片段。然后,在酶切產(chǎn)物DNA片段的兩端再連接特異性接頭一和接頭二。 在對酶切產(chǎn)物進(jìn)行了接頭連接之后,本發(fā)明的實施方式增加了對連接產(chǎn)物進(jìn)行純化的步驟 (4),以去除連接產(chǎn)物中的蛋白等雜質(zhì),防止這些雜質(zhì)對后續(xù)PCR反應(yīng)的影響。然后,本發(fā)明 的實施方式對純化后的連接產(chǎn)物進(jìn)行PCR擴(kuò)增,對PCR產(chǎn)物進(jìn)行純化,進(jìn)而得到用于測序的 文庫,并通過高通量測序平臺進(jìn)行測序。該建得的測序文庫涵蓋基因組中的幾乎全部限制 酶切位點,可以更有效地進(jìn)行上機(jī)測序,該測序方法操作周期短,數(shù)據(jù)利用率較高、測序結(jié) 果的準(zhǔn)確性較高。
[0022] 優(yōu)選地,本發(fā)明的實施方式所提供的簡化基因組測序方法,步驟(1)中的II B型 限制性內(nèi)切酶為BsaXI酶,且步驟(2)中的接頭一由序列如SEQ ID NO :1(5ILL-NNN)和 SEQ ID NO :2(anti-ILL)所示的兩個核苷酸片段雜交合成、接頭二由序列如SEQ ID NO: 3(3ILL-NNN)和SEQ ID N0:2(anti-ILL)所示的兩個核苷酸片段雜交合成(在下述堿基序 列中,N代表一個任意堿基,*N代表該堿基N硫代修飾) :
[0023] SEQ ID NO :1 :5'-CTACACGACGCTCTTCCGATCTNN*N-3'
[0024] SEQ ID NO :2 :5,-/5Phos/AGATCGGAAGAGC/3InvdT/-3,
[0025] SEQ ID NO :3 :5'-CAGACGTGTGCTCTTCCGATCTNN*N-3'
[0026] 如上所示,在雜交合成接頭一或接頭二的核苷酸片段中,SEQ ID NO :1 (5ILL-NNN) 和 SEQ ID NO :3(3ILL-NNN)在 3' 末端都有硫代修飾;而 SEQ ID NO :2(anti-ILL)的 3' 末 端的羥基去除,這樣可起到封閉作用,其目的是防止酶切后3'末端連續(xù)地加上多個接頭。
[0027] 優(yōu)選地,本發(fā)明的實施方式所提供的簡化基因組測序方法中,步驟(1)中采用 BsaXI酶對基因組DNA進(jìn)行酶切時,BsaXI酶的用量為:每500ng基因組DNA使用1. 25 μ L BsaXI酶;且該酶切操作在PCR儀中進(jìn)行,PCR程序為:37°C,4小時。本發(fā)明的實施方式所 提供的II B型限制性內(nèi)切酶酶切的簡化基因組建庫方法中,在利用BsaXI酶對基因組DNA 進(jìn)行酶切時,提供了上述BsaXI酶的最佳用量和最佳酶切時間,具體來說:首先,對每500ng 基因組DNA使用1.25 μ L BsaXI酶進(jìn)行酶切,使酶切效果更明顯,但又不會反過來抑制酶切 效果;其次,本發(fā)明發(fā)現(xiàn)在利用BsaXI酶進(jìn)行酶切1小時后,基因組DNA降解不明顯;酶切 4小時后,降解較明顯;而如果酶切時間大于4h,并不會加強(qiáng)酶切效果,因此酶切時間設(shè)為4 小時為最佳方案。相對于現(xiàn)有技術(shù),本發(fā)明的實施方式在確保最終獲得較好建庫結(jié)果的前 提下,實現(xiàn)了對建庫時間和成本的有效控制。
[0028] 優(yōu)選地,本發(fā)明的實施方式所提供的簡化基因組測序方法中,步驟(2)中,雜交合 成接頭一或接頭二的PCR程序為:95°C,5分鐘,然后以0. TC /秒的速度降至4°C。該P(yáng)CR 程序的設(shè)定可保證序列如SEQ ID N0:1(5ILL-NNN)和SEQ ID N0:2(anti-ILL)所示的兩 個核苷酸片段成功雜交合成接頭一、同時序列如SEQ ID NO :3(3ILL-NNN)和SEQ ID NO: 2 (anti-ILL)所示的兩個核苷酸片段成功雜交合成接頭二,確保了后續(xù)實驗的順利進(jìn)行。
[0029] 優(yōu)選地,本發(fā)明的實施方式所提供的簡化基因組測序方法中,步驟(2)中對酶切 產(chǎn)物連接接頭一和接頭二所采用的反應(yīng)體系如下所示:酶切產(chǎn)物60 μ L,IOX T4連接酶緩 沖液 10 μ L,10 μ M 接頭一 2 μ L,10 μ M 接頭二 2 μ L,T4DNA 連接酶 2 μ L,CldH2O 24 μ L,總 100 μ L。上述對酶切產(chǎn)物進(jìn)行接頭連接的反應(yīng)體系為針對本發(fā)明的酶切產(chǎn)物和連接頭所專 門設(shè)定的,該連接反應(yīng)于4°C過夜進(jìn)行,保證了接頭一、接頭二與酶切產(chǎn)物兩端之間的特異 性連接。
[0030] 優(yōu)選地,本發(fā)明的實施方式所提供的簡化基因組測序方法中,步驟(3)中采用磁 珠法對連接產(chǎn)物進(jìn)行純化。相比于其他的純化方法,采用磁珠法對連接產(chǎn)物進(jìn)行純化,可減 少純化過程中化學(xué)、物理因素對核酸的破壞降解,且減少純化過程中引入誤差和污染的可 能性,進(jìn)一步提1?最終建得文庫的準(zhǔn)確性。
[0031] 優(yōu)選地,本發(fā)明的實施方式所提供的簡化基因組測序方法中,步驟(4)中利PCR反 應(yīng)體系對連接產(chǎn)物進(jìn)行擴(kuò)增的反應(yīng)程序如下所示:98°C 30秒;以98°C 10秒、65°C 30秒、 72°C 30秒為一個循環(huán),進(jìn)行12個循環(huán);然后72°C 5分鐘;最后4°C保存。本發(fā)明的實施方式 所提供的PCR反應(yīng)體系及反應(yīng)程序,能保證對純化后的連接產(chǎn)物完成擴(kuò)增,擴(kuò)增完成之后, 采用瓊脂糖凝膠電泳法對PCR產(chǎn)物進(jìn)行純化和膠回收,制備得到用于上機(jī)測序的文庫。本 發(fā)明的實施方式中,對制備得到的文庫進(jìn)行測序的高通量測序平臺可選擇Illumina HiSeq 2500 或 HiSeq 2000。
【專利附圖】
【附圖說明】
[0032] 圖1是實施例1中的甜瓜基因組DNA檢測電泳圖,其中從左至右各泳道依次代 表:MarkerU號甜瓜基因組DNA、2號甜瓜基因組DNA、3號甜瓜基因組DNA、4號甜瓜基因組 DNA ;
[0033] 圖2是實施例1中的酶切預(yù)實驗電泳圖,其中從左至右各泳道依次代表酶切時間 為1小時、2小時、3小時、4小時、6小時、8小時和16小時的酶切結(jié)果圖;
[0034] 圖3是實施例1中的PCR產(chǎn)物檢測電泳圖,其中從左至右各泳道依次代表Marker、 1號甜瓜基因組文庫、1號甜瓜基因組文庫、2號甜瓜基因組文庫、2號甜瓜基因組文庫、3號 甜瓜基因組文庫、3號甜瓜基因組文庫、4號甜瓜基因組文庫、4號甜瓜基因組文庫、Marker ;
[0035] 圖4是實施例1中的文庫2100檢測圖。
【具體實施方式】
[0036] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明的各實 施方式進(jìn)行詳細(xì)的闡述。然而,本領(lǐng)域的普通技術(shù)人員可以理解,在本發(fā)明各實施方式中, 為了使讀者更好地理解本申請而提出了許多技術(shù)細(xì)節(jié)。但是,即使沒有這些技術(shù)細(xì)節(jié)和基 于以下各實施方式的種種變化和修改,也可以實現(xiàn)本申請各權(quán)利要求所要求保護(hù)的技術(shù)方 案。
[0037] 實施例1
[0038] 1、設(shè)計并合成下表中的接頭與引物序列,以備在本實施例的建庫過程中使用:
[0039]
【權(quán)利要求】
1. 一種簡化基因組測序方法,其特征在于,包含下述步驟: (1) 利用II B型限制性內(nèi)切酶對基因組DNA進(jìn)行酶切,得到酶切產(chǎn)物; (2) 對酶切產(chǎn)物連接接頭一和接頭二,得到連接產(chǎn)物; (3) 對連接產(chǎn)物進(jìn)行純化,得到純化后的連接產(chǎn)物; (4) 將純化后的連接產(chǎn)物進(jìn)行PCR擴(kuò)增,得到PCR產(chǎn)物; (5) 對PCR產(chǎn)物進(jìn)行純化,得到測序文庫; (6) 使用高通量測序平臺對測序文庫進(jìn)行測序; 其中,所述步驟(4)中對純化后的連接產(chǎn)物進(jìn)行PCR擴(kuò)增的反應(yīng)體系如下所示: 高保真 DNA 聚合酶 1 ii L,5 X HF Buffer 10 ii L,2. 5mM dNTP 6 ii L,10 ii M SEQ ID NO : 4所示的?5接頭引物11^,1〇11]?3£〇10勵:5所示的?7接頭引物11^,1〇11]\13£〇10 NO :6所示的R2引物1 ii L,10 ii M帶條形碼序列的R1引物1 ii L,純化后的連接產(chǎn)物20 ii L, ddH20 9 u L,總 50 u L ; 所述帶條形碼序列的R1引物的序列如SEQ ID NO :7、SEQ ID NO :8、SEQ ID NO :9或 SEQ ID NO :10 所示。
2. 根據(jù)權(quán)利要求1所述的簡化基因組測序方法,其特征在于,所述步驟⑴中的II B型 限制性內(nèi)切酶為BsaXI酶。
3. 根據(jù)權(quán)利要求2所述的簡化基因組測序方法,其特征在于,所述步驟(1)中對基因 組DNA進(jìn)行酶切時,BsaXI酶的用量為:每500ng基因組DNA使用1. 25 ii L BsaXI酶進(jìn)行酶 切。
4. 根據(jù)權(quán)利要求1所述的簡化基因組測序方法,其特征在于,所述步驟(1)中的酶切在 PCR儀中進(jìn)行,PCR程序為:37°C,4小時。
5. 根據(jù)權(quán)利要求1所述的簡化基因組測序方法,其特征在于,所述步驟(2)中接頭一 由序列如SEQ ID NO :1和SEQ ID NO :2所示的兩個核苷酸片段雜交合成;接頭二由序列如 SEQ ID N0:3和SEQ ID N0:2所示的兩個核苷酸片段雜交合成。
6. 根據(jù)權(quán)利要求5所述的簡化基因組測序方法,其特征在于,所述雜交合成接頭一或 接頭二的PCR程序為:95°C,5分鐘,然后以0. 1°C /秒的速度降至4°C。
7. 根據(jù)權(quán)利要求1所述的簡化基因組測序方法,其特征在于,所述步驟(2)中,對酶切 產(chǎn)物連接接頭一和接頭二所采用的反應(yīng)體系如下所示: 酶切產(chǎn)物60 ii L,10 X T4連接酶緩沖液10 ii L,10 ii M接頭一 2 ii L,10 ii M接頭二2 ii L, T4DNA連接酶2 ii L,ddH20 24 ii L,總100 ii L,該連接反應(yīng)在4°C下過夜進(jìn)行。
8. 根據(jù)權(quán)利要求1所述的簡化基因組測序方法,其特征在于,所述步驟(3)中采用磁珠 法對連接產(chǎn)物進(jìn)行純化。
9. 根據(jù)權(quán)利要求1所述的簡化基因組測序方法,其特征在于,所述步驟(4)中對純化 后的連接產(chǎn)物進(jìn)行PCR擴(kuò)增的反應(yīng)程序如下所示:98°C 30秒;以98°C 10秒、65°C 30秒、 72°C 30秒為一個循環(huán),進(jìn)行12個循環(huán);然后72°C 5分鐘;最后4°C保存。
10. 根據(jù)權(quán)利要求1所述的簡化基因組測序方法,其特征在于,所述步驟¢)中的高通 量測序平臺為 Illumina HiSeq 2500 或 HiSeq 2000。
【文檔編號】C12Q1/68GK104480217SQ201410855165
【公開日】2015年4月1日 申請日期:2014年12月26日 優(yōu)先權(quán)日:2014年12月26日
【發(fā)明者】孫子奎, 高文學(xué), 丁方美, 王 鋒, 唐嘉婕 申請人:上海派森諾生物科技有限公司