高gc含量大片段dna的體外組裝方法及應(yīng)用
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于合成生物學(xué)技術(shù)領(lǐng)域,具體地,本發(fā)明涉及一種高GC含量大片段DNA 的體外組裝方法及應(yīng)用。
【背景技術(shù)】
[0002] 微生物(尤其是放線菌)產(chǎn)生的具有生物活性的天然產(chǎn)物(次級代謝產(chǎn)物),是人 類抵抗癌癥、衰老和感染性疾病等的寶貴財富。據(jù)統(tǒng)計,在已報道的天然藥物中,有50%左 右是由放線菌科的細(xì)菌產(chǎn)生的。同時,生物信息學(xué)分析顯示,已完成測序的放線菌基因組中 除了已知功能天然藥物的生物合成基因簇外,還含有大量的隱形天然產(chǎn)物生物成基因簇, 送些信息為將來新功能天然藥物的篩選挖掘提供了寶貴的資源庫。隨著細(xì)菌耐藥性問題日 益嚴(yán)峻,從放線菌資源庫中開發(fā)挖掘抗耐藥性菌株感染的新天然藥物變得尤為重要,而其 中天然產(chǎn)物生物合成基因簇(一般可達(dá)20-150化)的快速克隆,將是重要的關(guān)鍵技術(shù)之一。 傳統(tǒng)建庫篩選的方法操作步驟繁瑣,耗時耗力。隨著合成生物學(xué)的發(fā)展,各種DNA體外組裝 方法相繼誕生,如DNA assembler與Gibson等溫一步法。由于體外操作與方法設(shè)計的簡便 性,它們?yōu)榭焖倏寺√烊凰幬锏纳锖铣苫虼靥峁┝艘环N新方式。Gibson等溫一步法由 于操作簡單、組裝尺度大(目前拼接的最大分子尺度為580化),已被廣泛用于各個實驗室, 但還未見報道用于高GC含量DNA大片段(主要針對放線菌天然產(chǎn)物生物合成基因簇)的 組裝。
[0003]Gibson等溫一步法主要利用體外同源重組原理,在一個反應(yīng)體系中,可一次同時 組裝多個片段。該方法涉及H種酶,巧外切酶產(chǎn)生片段間重疊區(qū)的粘性末端,Phusion聚合 酶與Taq連接酶修補缺口。在拼接低GC含量片段(小于40% )時,組裝效率可達(dá)100%。 但文獻(xiàn)報道顯示,隨著片段與載體重疊區(qū)GC含量的增加,組裝效率逐級下降,當(dāng)GC含量為 40 %時,效率為80 %,而當(dāng)GC含量升高至60 %時,效率僅有30 %。推測主要原因是反應(yīng)在 較低溫度(5(TC)進(jìn)行,當(dāng)GC含量升高后,片段末端由于退火溫度過高不易解鏈或者解鏈后 易發(fā)生錯配,導(dǎo)致載體自連或者片段間錯誤連接。而放線菌來源DNA的GC含量一般都超過 70%,用傳統(tǒng)的Gibson等溫一步法顯然無法滿足拼接要求。本發(fā)明人的實驗結(jié)果也證實了 送一點,當(dāng)在載體末端引入來自組裝片段的40bp重疊區(qū),組裝3個5化的DNA片段時(片 段GC含量大于75 % ),其組裝效率為0。于是,本發(fā)明人對送種方法進(jìn)行了改進(jìn),改進(jìn)后可 明顯提高組裝效率。最后,運用改進(jìn)的方法應(yīng)用于始旋鏈霉菌原始霉素II生物合成基因簇 (67化)的組裝,驗證了方法的有效性,因此,該方法為放線菌來源的天然產(chǎn)物生物合成基因 簇W及各種高GC含量大片段DNA的快速克隆提供了很好的操作工具,本方法的推廣應(yīng)用將 能有效地推動新天然藥物挖掘開發(fā)的進(jìn)度。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是提供一種新的高GC含量DNA大片段的體外組裝方法,并用于原始 霉素II生物合成基因簇的快速克隆。
[0005] 在本發(fā)明的第一方面,提供了一種祀核酸序列的體外組裝方法,包括步驟:
[0006] (a)提供用于拼接的n個結(jié)構(gòu)單元,各結(jié)構(gòu)單元的序列記為Ln,其中所述的n為 > 2的正整數(shù);和線性化的載體元件;
[0007]其中,
[0008] (i)所述的n個所述結(jié)構(gòu)單元可拼接成式I所示結(jié)構(gòu)的、兩端分別帶有第一和第二 重疊區(qū)W及第一和第二限制性內(nèi)切酶酶切位點的第一級拼接序列:
[0009]L1-L2-L3-----LN(I)
[0010] 式中,
[0011] L1、L2、……、Ln為各結(jié)構(gòu)單元的核巧酸序列;
[0012] 并且,位于第一級拼接序列的5'端的L1具有從5'至3'方向的式II所示的結(jié) 構(gòu):
[0013]X0-X1-X2-X3-L1' (II)
[0014]式中,
[0015] X0為無或任意的長度為1-lOObp核巧酸序列;
[0016]XI為第一重疊區(qū);
[0017]X2為第一限制性內(nèi)切酶酶切位點;
[0018]X3為無或任意的長度為l-20bp核巧酸序列;
[0019] 11'為待保留的拼接單元序列;
[0020] 其中,X0-X1-X2-X3構(gòu)成位于5'端的第一側(cè)翼序列;
[0021] 并且,位于第一級拼接序列的3'端的Ln具有從5'至3'方向的式III所示的結(jié) 構(gòu):
[0022] Ln' -X4-X5-X6-X7 (III)
[0023]式中,
[0024]X7為無或任意的長度為1-lOObp核巧酸序列;
[00巧]X6為第二重疊區(qū);
[0026]X5為第二限制性內(nèi)切酶酶切位點;
[0027]X4為無或任意的長度為l-20bp核巧酸序列;
[0028] Ln'為待保留的拼接單元序列;
[0029] 其中,X4-X5-X6-X7構(gòu)成位于3'端的第二側(cè)翼序列;
[0030] 并且,第一重疊區(qū)和第二重疊區(qū)是互不相同的,且GC含量為0-50%;
[0031] (ii)所述線性化的載體元件的結(jié)構(gòu)如式IV所示,
[0032]XOb-X化-X2b-X3b-Z-X4b-X化-X化-X化 (IV)
[0033]式中,
[0034]X化為X0的互補序列;
[003引 X化為XI的互補序列,即第一重疊區(qū)的互補序列;
[0036]X化為所述的第二限制性內(nèi)切酶酶切位點;
[0037]X3b為X3的互補序列;
[0038]Z為載體的結(jié)構(gòu)序列;
[0039]X4b為X4的互補序列;
[0040] X化為所述第二限制性內(nèi)切酶酶切位點;;
[0041] X化為X6的互補序列,即第二重疊區(qū)的互補序列;
[0042] X化為X7的互補序列;
[0043] 化)在外切酶、聚合酶和/或連接酶酶存在下,使上述的n個結(jié)構(gòu)單元和線性化的 載體元件進(jìn)行組裝,從而形成式V所述的第一級連接產(chǎn)物,其中所述連接產(chǎn)物為環(huán)狀;
[0044] L1-L2-L3-----Ln-XOb-X化-X2b-X3b-Z-X4b-X化-X化-X化 (V)
[0045] 式中,1^、1^2、1^3、山^化^化、乂213^313、2^413^化^化^化的定義如上所述;
[0046] (C)任選地用所述的第一限制性內(nèi)切酶和/或第二限制性內(nèi)切酶上一步驟的連接 產(chǎn)物,從而獲得用于下一級組裝的結(jié)構(gòu)單元;并且任選地重復(fù)步驟(a)和步驟化)共j次, 從而形成j+1級組裝產(chǎn)物,其中j為>1的正整數(shù)。
[0047] 在另一優(yōu)選例中,乂0、乂3^4、和乂7中的一個或多個為無。
[0048] 在另一優(yōu)選例中,X化、X3b、X4b、和X化中的一個或多個為無。
[0049] 在另一優(yōu)選例中,所述的第一側(cè)翼序列為SEQIDNO.:1和/或所述的第二側(cè)翼序 列為沈QIDNO. :2。
[0050] 在另一優(yōu)選例中,所述的兩個相鄰的結(jié)構(gòu)單元之間設(shè)有長度為10-5化P的粘性末 端。
[0051] 在另一優(yōu)選例中,所述粘性末端的序列來自或不來自祀核巧酸序列的結(jié)構(gòu)基因的 序列,優(yōu)選地來自祀核巧酸序列的結(jié)構(gòu)基因序列。
[0052] 在另一優(yōu)選例中,j為1-5的正整數(shù),較佳地為1-3的正整數(shù)。
[005引在另一優(yōu)選例中,所述的第一限制性內(nèi)切酶選自下組:化eI、NdeI。
[0054] 在另一優(yōu)選例中,所述的第二限制性內(nèi)切酶選自下組:化el、Ndel。
[0055] 在另一優(yōu)選例中,所述的第一限制性內(nèi)切酶和第二限制性內(nèi)切酶是不同的酶。
[0056] 在另一優(yōu)選例中,n為2-6的正整數(shù),較佳地為2-4的正整數(shù)。
[0057] 在另一優(yōu)選例中,所述的核酸序列的長度大于15化,較佳地為20-500化,更佳地 為 30-300化。
[0058] 在另一優(yōu)選例中,所述的祀核酸序列的CG含量>55%,較佳地>60%,更佳地 > 65%或> 70% (如 70-80% )。
[0059] 在另一優(yōu)選例中,所述的第一重疊區(qū)的CG含量為0-50%。
[0060] 在另一優(yōu)選例中,所述的第二重疊區(qū)的CG含量為0-50%。
[0061] 在另一優(yōu)選例中,所述的第一側(cè)翼序列的CG含量為0-50%。
[0062] 在另一優(yōu)選例中,所述的第二側(cè)翼序列的CG含量為0-50%。
[0063] 在另一優(yōu)選例中,所述的祀核酸序列為DNA序列。
[0064] 在另一優(yōu)選例中,所述的祀核酸序列為基因簇序列。
[0065] 在另一優(yōu)選例中,所述的祀核酸序列為放線菌的核巧酸序列。
[0066] 在本發(fā)明的第二方面,提供了一種用于DNA體外組裝的構(gòu)建物,所述構(gòu)建物包括:
[0067] 用于拼接的n個結(jié)構(gòu)單元,各結(jié)構(gòu)單元的序列記為Ln,其中所述的n為> 2的正整 數(shù);和
[0068] 線性化的載體元件;
[006引其中,
[0070] (i)所述的n個所述結(jié)構(gòu)單元可拼接成式I所示結(jié)構(gòu)的、兩端分別帶有第一和第二 重疊區(qū)W及第一和第二限制性內(nèi)切酶酶切位點的第一級拼接序列:
[0071] L1-L2-L3-----Ln(I)
[0072] 式中,
[0073] 11、L2、……、Ln為各結(jié)構(gòu)單元的核巧酸序列;
[0074] 并且,位