專利名稱:高效基因組掃描方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種方法,通過對多個核酸樣品進行高效電泳來發(fā)現(xiàn)令人感興趣的核酸。本發(fā)明還涉及一種在該方法中使用過的電泳裝置。本發(fā)明中的方法在如下方面尤其有用,包括對基因組DNA多態(tài)性的檢測、遺傳分析、基因圖譜繪制以及構(gòu)建可包含一種生物整個基因組在內(nèi)的重疊群或物理圖譜。
背景技術(shù):
為了在核酸水平上檢測生物之間如品種之間的差異,常規(guī)上使用RFLP(限制性酶切片段長度多態(tài)性)和RAPD(隨機擴增的多態(tài)DNA)技術(shù)。然而,在RFLP方法中為了檢測出與某特定基因鄰近的標記,要求提供大量的DNA樣品,還要求有根據(jù)現(xiàn)有RFLP標記制作的被測生物的基因組圖譜。另外,構(gòu)建圖譜要求大量的時間、費用和人力。再有,僅有有限的生物具有包括足夠密度的RFLP標記的遺傳圖譜。相對而言,利用RAPD方法進行多態(tài)性檢測,可能應用于較大數(shù)目的樣品中。然而,一次試驗中獲得的穩(wěn)定的條帶數(shù)是有限的。為了增加條帶數(shù)目而放寬PCR條件,所得的多態(tài)性條帶存在重現(xiàn)性低下等問題。
目前AFLP(擴增的片斷長度多態(tài)性)方法的使用日益增加,因為該法能夠一次比較大量的條帶(50~100或更多)、DNA樣品的消耗較低而且其所得條帶也具有高重現(xiàn)性。然而,在該方法的原初程序中,測序凝膠有40~50cm大,且核酸條帶要利用同位素通過放射自顯影來檢測。因此,這種方法要求豐富的經(jīng)驗、僅能夠在限定的條件下使用、檢測花費時間較多而且不能分析大量樣品(一次至多僅能分析幾十條帶)。
最近發(fā)展起來一種方法,其中熒光引物PCR及自動測序儀的使用,使條帶檢測更加容易。所用的測序儀非常昂貴(不低于1~2千萬日元),而且該方法的一次試驗將在相當長的一段時間里占用這種本來是用于基因測序的測序儀。再者,由于該方法中的條帶檢測過程是利用一個使用自動測序僅的系統(tǒng)來完成的,因此在檢測過程之后,無法將所要的條帶分離出來以供分析。因此,一個主要的問題是,這些已檢測到的條帶不容易被做成可通過特異性引物檢測的SCAR(特征性序列擴增區(qū))標記。另外,目前可用的每套熒光引物只有8~9個類型,只能允許最多64~81個引物對組合。
RLGS(限制性酶切標記基因組掃描)是一種已知的用來一次對整個基因組多態(tài)性條帶進行檢測的方法。但這種方法也使用同位素,而且對低數(shù)量標記的檢測需要好幾天的時間。此外,該方法中還包括為每一個樣品處理一塊很大(40×30cm)或很狹長的瓊脂糖凝膠,這就要求操作者不僅有豐富的經(jīng)驗還要有強健的肌肉。另外,在瓊脂糖凝膠中用限制性內(nèi)切酶切割核酸要求使用大量昂貴的限制性內(nèi)切酶,從而使得該過程花費巨大。
舉例說明,在水稻基因組(450MB)的RLGS中,僅有有限的8-堿基限制性內(nèi)切酶如NotI可被用于對標記的部分進行限定。另外,從一次電泳周期中獲得的斑點數(shù)的理論上限是450MB÷48=13,700,但因為電泳的特性,實際上這一數(shù)值只能達到其1/3~1/6,也就是2,000~4,000個斑點。再者,從每一個體來的樣品是在一個單獨的凝膠上電泳,不同樣品的電泳圖譜常常不能完全匹配。因此,必須要求有一種昂貴的大型掃描和二維電泳軟件來比較個體間的不同。
在構(gòu)建基因組文庫的早期階段,這些基因組文庫中覆蓋整個基因組的相鄰的重疊克隆被基于它們之間的重疊區(qū)而組織并連接在一起,曾試圖使用諸如RFLP圖譜等現(xiàn)有圖譜中的標記。然而,即使在那些所謂的高密度圖譜中,也只有大約2,000個標記。甚至在具有小基因組(450MB)的水稻中,平均密度也僅為至少200KB/條帶。這樣的密度太低以至于不能構(gòu)建一個覆蓋整個基因組的重疊群。另一方面,檢索如此之多的RFLP標記將需要巨大數(shù)量的費用、人力和時間。
最近常常用來構(gòu)建一個覆蓋整個基因組的疊連群的方法如下一個文庫中的所屬克隆被合適的限制性內(nèi)切酶切割,所得片斷在高分辨率的凝膠上電泳,獲得的圖譜經(jīng)數(shù)字化后輸入一個數(shù)據(jù)庫,在計算機中具有相同圖譜的克隆被相互連接在一起。然而,這種方法也要求巨大的勞動力和費用來酶切所有這些克隆、在它們的末端進行放射標記以及進行放射性自顯影。
發(fā)明內(nèi)容
本發(fā)明是由于考慮到上述情況而完成的。本發(fā)明的一個目的是提供一種方法以及用于本方法的一套電泳裝置,該方法是為了有效且便宜地對大量核酸樣品進行電泳從而檢測所要的核酸。在本方法的優(yōu)選實施方案中,本發(fā)明提供了一種利用本方法在基因組DNA中檢測多態(tài)性的手段、一種遺傳分析的手段、一種構(gòu)建基因圖譜的手段、一種對特定條帶的一個基因組克隆進行鑒定的手段以及一種構(gòu)建一群覆蓋完整基因組的有組織的疊連群的手段。
為解決上述問題而進行廣泛深入地研究之后,本發(fā)明者們想到用一種通常用于蛋白電泳的小型凝膠來進行電泳,可能適用于對大量的核酸進行有效的電泳并檢測所要的核酸。
因此,本發(fā)明者們獨立地制作了一種用于核酸電泳的電泳裝置,在該裝置上一次可安裝多個10~30平方厘米大小的凝膠板、每塊凝膠板上至少可加32個核酸樣品,所有這些樣品可在該電泳裝置上同時進行電泳。利用該裝置,本發(fā)明者們檢索到了靠近Pyricularia oryzae Cavara中一個非病原基因或是靠近脆稈(kamairazu)突變基因的核酸標記。結(jié)果發(fā)現(xiàn),與傳統(tǒng)的RAPD方法比較,本法中檢出多態(tài)性條帶的效率有顯著提高。
對檢索到的多態(tài)性條帶進行連鎖分析表明,在檢索的多態(tài)性條帶中,即使是那些特別靠近靶基因處的條帶,其通過本方法被檢索的效率也明顯高于傳統(tǒng)方法。
另外,還發(fā)現(xiàn)本發(fā)明中的方法可用于分離和特異性地擴增各種重要的多態(tài)性條帶,比如說通過上述方法找到的那些條帶。例如,本發(fā)明者們使用本方法后,分離到了好幾個可用于鑒定10個主要的水稻品種的條帶;根據(jù)對10個品種之一的Akitakomachi具有特異性的條帶的序列信息設(shè)計了引物;繼而用從這10個精白米品種中得到的基因組DNA作模板進行了PCR。結(jié)果發(fā)現(xiàn),僅能對Akitakomachi得到特異性的PCR-擴增產(chǎn)物。因此說明,本發(fā)明中的方法可以有效地提供多態(tài)性條帶,這些條帶可被用于對水稻品種進行便利地鑒定。
此外,本發(fā)明者們發(fā)現(xiàn)本發(fā)明中的方法可以被用于獲得為構(gòu)建生物的遺傳圖譜或構(gòu)建覆蓋生物整個基因組的疊連群所需的核酸標記。
因此,本發(fā)明涉及到一種方法,該方法用于在高效率低花費的情況下進行電泳并檢測大量的核酸樣品,還涉及到一種本方法中用過的電泳裝置以及該裝置的使用權(quán)。更明確地說,本發(fā)明提供(1)一種用于核酸電泳的方法,該方法包括以下步驟a)用一種電泳裝置對核酸樣品進行電泳,在該裝置上一次可安裝多個10~30平方厘米大小的凝膠板,利用該裝置每塊凝膠板至少可使32個核酸樣品同時進行電泳。
b)電泳之后在凝膠上檢測核酸條帶。
(2)根據(jù)(1)中的方法,其中電泳用不連續(xù)緩沖系統(tǒng)的凝膠來進行;(3)根據(jù)(1)中的方法,其中的核酸樣品是通過變性使雙鏈DNA解離而制備的單鏈DNA,而且電泳是用變性凝膠完成;(4)根據(jù)(1)中的方法,其中對凝膠上核酸條帶的檢測是通過熒光染色或銀染色來完成的;(5)根據(jù)(1)、(2)或(4)中任何一個的方法,其中該方法的運用是為了在被測個體之間檢出基因組DNA的多態(tài)性;(6)根據(jù)(3)中的方法,其中該方法的運用是為了在被測個體之間檢出基因組DNA的多態(tài)性;(7)根據(jù)(5)中的方法,其中核酸樣品是通過AFLP法擴增的DNA片段;(8)根據(jù)(5)中的方法,其中核酸樣品是異源雙鏈DNA分子;(9)一種用于制備包含多態(tài)性的DNA片段的方法,該方法包括一種從凝膠中分離那些根據(jù)(5)~(8)中的任何一種方法檢出的包含多態(tài)性的DNA片段的步驟;(10)一種包含被測個體之間的多態(tài)性的DNA片段,該DNA片段是根據(jù)(9)中的方法分離得到的;(11)根據(jù)(1)~(8)中任何一個的方法,其中本方法的使用是為了進行遺傳學分析;(12)根據(jù)(11)中的方法,其中的遺傳學分析是F2代分析、RI(重組白交)分析或QTL(量化性狀位點)分析;(13)根據(jù)(1)~(8)中任何一個的方法,該方法是用于構(gòu)建生物的遺傳圖譜;(14)某生物的一種遺傳圖譜,該遺傳圖譜是通過利用包含多態(tài)性的基因組DNA條帶作為標記而構(gòu)建的,該DNA條帶是根據(jù)(13)中的方法檢測的;
(15)一種從某基因組DNA文庫中篩選克隆的方法,所篩選的克隆與通過(1)~(8)中任一方法在凝膠上檢測到的特定的核酸條帶相對應,該方法包括以下步驟a)把某一特定生物的基因組DNA文庫分成多個亞文庫,每一個亞文庫的大小最多為該生物的1個基因組。
b)給每一個亞文庫中的所有克隆分配屬于該亞文庫的一個行號、一個列號和一個板號,其中行、列和板分別是指X、Y和Z坐標。
c)通過以下過程來檢測條帶分別收集代表所有板中特定行的全部克隆(X坐標克隆組)、代表所有板中特定列的全部克隆(Y坐標克隆組)以及在一個亞文庫中特定板上的全部克隆(Z坐標克隆組),通過從收集的每一個克隆組中提取DNA作為坐標樣品,從該生物中制備基因組DNA作為對照,對比坐標樣品和對照組并利用權(quán)利要求1~4中任一方法進行電泳。
d)在每一個X坐標克隆組、Y坐標克隆組和Z坐標克隆組中確定一個克隆,該克隆相對應于某一個條帶,該條帶在凝膠上與對照中所感興趣的核酸具有相同的遷移率。
e)從亞文庫中選出一個與已確定的三維坐標相符合的克隆。
(16)根據(jù)(15)中的方法,其中該方法的使用是為了構(gòu)建覆蓋特定生物全部基因組DNA的重疊群。
(17)一套用于核酸電泳的電泳裝置,其中在該裝置上一次可安裝多個10~30平方厘米大小的凝膠板,而且利用該電泳裝置每塊凝膠板至少可使32個核酸樣品同時進行電泳。
1.電泳方法和電泳裝置本發(fā)明中的電泳裝置是這樣一種裝置,在其上可放置小型聚丙烯酰胺凝膠板(10~30平方厘米大小,標準大小18平方厘米),利用該裝置每塊凝膠板一次至少可對32個(標準64個)檢測樣品以及幾個(標準2~4個)分子量大小標記進行電泳,此外通過同時使用至少2塊(標準4塊)這樣的凝膠板,利用該裝置可對大量(標準256個)樣品進行電泳。
圖1至圖4展示了本發(fā)明中電泳裝置的一個實例。在該裝置中,用一塊18平方厘米的玻璃板制備了一塊1毫米厚的凝膠,其上有66個孔,一次可允許64個樣品和2個分子量大小標準進行電泳。該裝置還允許一次對4塊凝膠進行電泳。這些合在一起,一個周期可檢測256個樣品。
通常用于蛋白電泳的不連續(xù)聚丙烯酰胺電泳系統(tǒng)(Laemmli,英國(1970)自然,227680-685),可以用于本發(fā)明中的凝膠。利用這種凝膠,即使在寬度僅為1mm的泳道中,也可對多至10μl的樣品進行高分辨率電泳。它還可提高條帶檢測的靈敏度。
在根據(jù)本發(fā)明的核酸電泳中,優(yōu)選使用利用濃縮凝膠(Tris-HClpH6.8,0.5M)和分離凝膠(Tris-HCl pH8.8,1.5M)的雙層電泳,來提高凝膠上核酸條帶的分辨率。在核酸電泳中,根據(jù)目的不同,核酸可保持雙鏈狀態(tài)或被變性為單鏈。在后一種情況下,電泳中使用變性凝膠(凝膠中包含6~8.5M尿素)。當對核酸中的多態(tài)性檢測時,用異源雙鏈電泳可得到高度敏感檢測,這種方法能夠檢測到用傳統(tǒng)方法可能檢不到的微小多態(tài)性。
在本發(fā)明中的核酸電泳中,優(yōu)選使用銀染或熒光染色來檢測電泳后得到的核酸條帶。銀染可在短的時間范圍內(nèi)(1~2小時)進行高度靈敏的檢測,要求較低的專業(yè)技能,而且與用同位素的方法來比更加安全。另外,除了提高靈敏度以外,該材料還可經(jīng)過干燥來提供可保存的樣品。利用熒光染色,在大約染色30分鐘后可得到結(jié)果。由于該方法具有高的核酸回收率,熒光染色適于切割和收集條帶。
本發(fā)明的方法中,擴增后的DNA或類似樣品在凝膠上點樣的效率可能被大幅度提高,例如,通過設(shè)計一種電泳凝膠梳子,使其在與96(8×12)孔板中相同的間隔(9mm)內(nèi)至少可點兩行樣品。
2.核酸標記的檢測盡管與其它形式的核酸多態(tài)性檢測方法聯(lián)合使用也有可能性,但如果將本發(fā)明中的方法與AFLP(擴增片斷長度多態(tài)性。Vos P等,(1995)核酸研究234407-4414)聯(lián)合使用來檢測核酸多態(tài)性,能夠令人信服地產(chǎn)生最高的效率。
例如,使用AFLP技術(shù),在一個序列大小相當于水稻(450MB)的基因組中,用引物去擴增那些一個末端具有6堿基切割位點而另一個末端具有4堿基切割位點的基因組片斷,當在每一個末端的引物中使用3個經(jīng)過挑選的核苷酸(參照下述公式)時,每個泳道中可產(chǎn)生大約50個擴增條帶。一個包括標準的4塊凝膠256個樣品泳道的系統(tǒng),一次電泳周期將產(chǎn)生大約12,800個條帶(實施例2)。
完整基因組大小÷6堿基限制性內(nèi)切酶切后得到的片斷數(shù)÷使用3核苷酸在基因組片斷兩個末端進行選擇的選擇率=條帶數(shù)目(450MB÷46×2÷43×2=50)這一數(shù)目可與在RLGS法中幾塊凝膠中獲得的信息數(shù)相比。另外,在本發(fā)明中的方法里,將被用來進行比較的多個泳道可以相鄰放置,這樣就易于對原始數(shù)據(jù)進行直接比較而不必要求特殊的讀取裝置。
如圖6中所示(實施例2),在實際進行的AFLP試驗中,其中水稻基因組被EcoRI和MseI酶切,獲得的條帶數(shù)目接近于上述公式中估計的數(shù)目。不過,具有可靠清晰度的條帶大約是這一數(shù)目的一半。
取5~10μl樣品,利用0.2ml的微孔板對96個樣品進行PCR,可節(jié)約核酸以及諸如熱穩(wěn)定性DNA聚合酶等酶類的消耗,此外還可通過使用8道10μl取液器一次向凝膠上轉(zhuǎn)移8個樣品,來提高效率。因此,使用4塊凝膠的一次電泳周期可以很容易地在一天中完成。
在電泳完成以后,4塊凝膠可被同時置于一個容器中進行銀染,這是一種高效率、低消耗并且簡便的操作程序。一般來講,可以使用市售的蛋白銀染試劑盒。
至于用于AFLP的核苷酸引物,任何與所選定的限制性內(nèi)切酶相一致的核苷酸都可以使用。而且,任何長度為1~幾個堿基的選擇性序列都可以被加在引物的3’端。這樣就允許有幾乎無限多的引物組合。對于一種具有一個1GB或稍小一些的基因組的植物,使用EcoRI和MseI分別作為6堿基限制性內(nèi)切酶和4堿基限制性內(nèi)切酶,以及使用含有3核苷酸選擇序列的PCR引物,每一種引物都可有64個組合,擴增反應可以在64×64=4,096種組合下進行。這就可以在對其多態(tài)性比率為5~10%的親本之間進行的遺傳分析中的產(chǎn)生的10,000~20,000個多態(tài)性條帶進行搜索。這一數(shù)目實際上已經(jīng)足夠用于物理圖譜的構(gòu)建,并且超過了傳統(tǒng)遺傳圖譜中標記數(shù)目一個數(shù)量級或更多。
那些從全分析(Michelmore RW等,1991,美國科學院年報889828-9832)或其它方法中獲得的重要條帶,例如那些靠近目標基因的條帶,在染色以后可以被切出來供進一步分析切下來的凝膠經(jīng)壓碎后在適當?shù)木彌_液中提取,用于另一次PCR程序;該PCR產(chǎn)物接著被插入適當?shù)馁|(zhì)粒,經(jīng)連接篩選后用于測序(實施例4)。
利用上述引物組合方式,就有可能按照如下步驟進行高效電泳,例如先制備好一套4個樣品,其中2個來自于雜交親本,另2個來自于F2代純合個體,一個是大約10個顯性個體的混合物,另一個是大約10個隱性個體的混合物;電泳按照每對引物4個泳道來進行;使用一套標準的電泳裝置(4塊凝膠、256個泳道),64對引物的電泳可以一次完成。在本實施例中,通過64次電泳(共約2個月時間),可完成對選定引物的所有4,096個組合的檢測。在一種含有約10%的多態(tài)性的雜交組合中,例如indica-japonica雜交,這種方法適于對整個基因組中的20,000個多態(tài)性條帶掃描和搜索。這種方法的效率超過傳統(tǒng)方法1~2個數(shù)量級,而且不管有沒有遺傳圖譜存在都可以在短時期內(nèi)分離基因。用這種方法搜索所有4,096個組合所需的花費也是比較低的,大約為40萬日元。
3.遺傳分析1)F2代分析為確定任意的基因組合或多態(tài)性標記組合之間的遺傳距離(或圖上的距離),F(xiàn)2代分析是最常用的。將F2代分析與本發(fā)明協(xié)調(diào)使用,甚至能更有效地測定在2個多態(tài)性標記之間或一個多態(tài)性標記和一個基因之間的距離。
如同普通的F2代分析一樣,一個品系(A系)包含某一給定的基因,而另一個品系(B系)不含有這一基因、或在涉及該基因的性狀中有明顯的差異、抑或是在那些A品系的性狀中有適當?shù)奈⑿〔町?,這兩個品系被選定并進行雜交來產(chǎn)生大量的F2代個體。將被用作分析的F2代個體的數(shù)目多少,取決于分析的精確度。如要達到1CM的精確度,選50個純合個體(通常是隱性純合個體),通過測定在100條染色體上所要的基因和一個多態(tài)性標記之間的重組頻率,就足以確定該基因和該標記之間的遺傳距離。在隱性純合個體的分析中,如果沒有重組發(fā)生,那么所有的個體都應該具有與表現(xiàn)隱性性狀的一方親本相同的標記;重組頻率為1/100時,重組現(xiàn)象應該只能在一個個體的一條染色體上發(fā)現(xiàn)。
因為本發(fā)明的標準系統(tǒng)能夠一次分析256個個體,如果可以得到如此多的純合個體,一個電泳周期內(nèi)就可以在512條染色體上對多態(tài)性標記的重組進行檢測,這樣可以提供0.2CM的精確度。將AFLP技術(shù)用在多態(tài)性標記分析上,可以使用極少量的DNA樣品(100ng或更少)進行檢測?;蚪MDNA被從每一個個體中制備出來,然后用EcorI和MseI雙酶切。接著,把適于每一種酶的接頭與基因組DNA片段相結(jié)合。使用適于這些接頭的第一批引物進行第一次PCR,以便擴增這些基因組DNA片段。第二批引物是通過在每一個第一批引物的3′末端加上1~4個任意的堿基制備而成的。利用第二批引物,只有一部分其序列與所選擇的堿基序列相符的基因組片段才能通過PCR得到擴增。接著,用本發(fā)明中的電泳,PCR產(chǎn)物被按照分子量大小分離開。電泳完成以后,凝膠被用如銀染等方法染色,然后檢測在所要的多態(tài)性標記中發(fā)生的重組。
在與本發(fā)明相一致的情況下,用來自多至256個個體的少量DNA所作的F2代分析可在一次電泳周期中完成,其精確度在0.2CM的水平。而且,這一過程不需要轉(zhuǎn)印或放射性自顯影。另外,在染色和干燥以后,這4塊凝膠可被固定大小然后封在相夾中以便于分析結(jié)果。
2)RI分析RI(重組自交)系是指那些通過將由不同品系雜交得到的F2代個體之間反復自交幾代后得到的品系。作為重復自交的結(jié)果,多數(shù)座位都是純合的。因為雜合體的數(shù)量很有限,所以顯-隱性狀的分離比率是1∶1。因此,即使在顯性個體中,所要的基因也是純合的,這就使它們適合于本發(fā)明中的基因分析。這種基因分析方法比F2代分析更加精確,因為在F2代分析中雜合個體的比例是1/2,顯-隱性狀的分離比是3∶1。當有合適的RI品系可以利用時,按照與F2代分析同樣的方式,采用從RI品系的個體中提取的基因組DNA所進行的基因分析(RI分析)可在與本發(fā)明相一致的情況下進行。
3)鄰近標記的逼近篩選為了通過F2代分析縮小在混合分離群體分池分析中獲得的目的基因的鄰近標記的范圍,并最終在圖上標定出該基因最鄰近的標記,本發(fā)明中的電泳是很有用的;標準方法中,可一次對256個樣品進行電泳的能力,為基因分析提供了很高的效率。如2.中所述用水稻作例子(在indica-japonica雜交的情況下),假設(shè)20000個多態(tài)性標記的條帶平均分布在全長2000CM的基因組上,那么在從混合分離群體分池分析中獲得的目的基因的兩邊各10CM的范圍內(nèi),也就是20CM的區(qū)域內(nèi)所存在的標記的數(shù)目,估計可達到200個條帶。為了把數(shù)目如此多的鄰近標記縮減到只剩下最鄰近的標記,第一步是按每個標記選取14個F2代的隱性純合個體加上從每個親本來的DNA,在16條泳道上電泳,以檢查在目的基因和候選標記之間是否存在重組。這樣,每一標記在28條染色體上的重組頻率就被確定下來。這一過程的分辨率大約為3.5CM。這樣,每塊凝膠上可檢測4個候選標記條帶,相當于每一個電泳周期檢測16個標記條帶。同時,具有與目的基因距離最近的重組位點的個體也被鑒定出來。經(jīng)過這一過程以后,僅需使用8個泳道對6個具有最近重組位點的個體及其親本進行電泳,就可在6個電泳周期中完成對剩余192個標記的檢測。
假設(shè)標記的位置和染色體重組的位置是均勻分布的,可以預計,作為上述篩選的結(jié)果,在基因兩邊各4CM的范圍也就是8CM區(qū)域內(nèi)大約可以獲得40個標記條帶。第二個步驟是把經(jīng)第一步篩選后保留下來的標記以1CM的精確度定位于圖上。首先,為了獲得F2代的62個隱性純和個體及其親本的AFLP產(chǎn)物,給每個標記一塊凝膠,使12個標記在3個電泳周期內(nèi)完成檢測。這一步驟為基因周圍8CM的區(qū)域制出了一個精細的圖譜,其中顯示出了在緊靠著該基因,大約距該基因1CM之內(nèi)的區(qū)域有重組發(fā)生的個體。利用這些含有最近重組位點的個體,對剩余的28個條帶進行了分析以便確定它們在圖上的位置。通過一次有224個泳道的電泳周期,也就是8個泳道(6個具有最鄰近重組的個體加上其親本)乘以28種組合,完成對基因周圍區(qū)域的分析。
因此,從混合分離群體分池分析中所得的20000個多態(tài)性條帶中所選出的這200個候選鄰近標記,通過大約11個電泳周期,可以被縮小到只剩下在距基因大約1CM以內(nèi)的最鄰近標記。
在基因分離時,如果生物的基因組大小是1GB或更小些,那么這些標記中的平均1CM將是500kB或更小。因此,可以從一個平均插入大小約為150kB的BAC(細菌人工染色體)基因組文庫中選出鄰近基因的克隆,構(gòu)建一個疊連群。
還有可能通過使用256個隱性純合個體把分析精確度提高至0.2CM的水平。在這種情況下,通過選擇大約4個合適的鄰近標記并進行4次電泳周期,那些具有最鄰近基因的重組位點的個體就能被鑒定出來。按照第二步驟同樣的方式,利用這些具有鄰近重組位點的個體來檢查那些被假定為最靠近該基因的條帶中的重組情況,通過1次電泳周期,最鄰近的標記就可以很容易地被鑒定出來。
在這里,本發(fā)明的原理是通過兩個假設(shè)來描述的電泳獲得的條帶在基因組或染色體上幾乎是平均分布的;另外染色體的重組在該基因組上也是均勻發(fā)生的。然而,在實際上電泳條帶和重組位點在染色體上的分布是不均一的。因此,根據(jù)檢測中使用的F2代個體數(shù)目所得到的某鄰近標記和該目的基因之間的距離,可能大于所預期的均勻分布情況下的距離。
4)標記育種上的應用按照上述方法獲得的某特定性狀基因的一個鄰近標記,在通過雜交進行的傳統(tǒng)育種中也可以被用作一個十分可靠的標記。而且,當對大量的雜交后代進行標記分析時,采用基因組掃描的分析方法,使得對數(shù)目眾多的僅有少量DNA樣品的個體的分析變得更容易。與傳統(tǒng)的使用RFLP方法的技術(shù)相比,使用這種方法將提高操作效率并降低花費。
5)QTL(量化性狀座位)分析上的應用一個QTL是一個量化性狀的座位,其中該性狀的表達不如質(zhì)量性的表達那么強,而且在大多數(shù)情況下好幾個座位參與該性狀的表達。進行QTL分析是為了分析出在染色體上的什么位點的什么基因座位,對該性狀表達的貢獻有多大。
QTL分析要求,使用大量平均分布在整個基因組上的核酸標記時,應該對大批量的雜交后代個體中的多態(tài)性進行檢測。例如,利用分布在一個2000CM的完整基因組上,標記密度為大約10CM/標記的標記群來進行QTL分析時,200個標記就要求用至少50個F2代個體來檢測。用RFLP標記進行這一分析,需要用已被這50個個體的核酸轉(zhuǎn)印的膜進行200次雜交。因為一次雜交周期需要2天,即使一次操作4塊膜,整個過程也需要100天。即使一塊膜可重復使用10次,也必須從50個個體的每一個體中收集多至100μg的核酸來制備20塊膜。這些都要求巨大的勞動。
當用來研究的生物類似于水稻的indica-japonica雜交一樣,有大約1 0%的多態(tài)性時,通過使用本發(fā)明中的AFLP方法,一個泳道上能得到很少幾條多態(tài)性條帶。因此,通過采用合適的引物對,只需用50對多一點的引物進行電泳,就可完成對200個標記的搜索。因為1次電泳周期可使用5個引物對(50×5=250個泳道),10個電泳周期(總共10天)就能完成對所有200個標記在50個個體中的檢查。另外,每個個體只需要1μg的DNA就足夠完成這一過程。
明確地說,在實施這一方法之前必須用AFLP標記制備一個該生物的基因組圖譜。在沒有一個類似這樣的圖譜可以利用的情況下,可以按照本發(fā)明如下面5中描述的方法很容易地構(gòu)建一個圖譜。從該圖譜中選出以理想密度分布的標記群。這種情況下的效率是很高的,因為有可能選擇盡可能少的引物對數(shù)目來覆蓋整個基因組。
為了在育種中達到合適的多態(tài)性頻率,推薦選擇使用兩個遺傳關(guān)系較遠的品系,其中一個對所感興趣的性狀是強表達而另一個對該性狀僅表現(xiàn)出很低的表達。遠緣品系間的育種能夠抑制標記的緩慢分離。利用從這一育種過程得到的大約50個F2代或RI品系的個體(這一數(shù)目的變化取決于分析的目的),該感興趣的性狀就可被進行量化分析。而且,利用從每一個個體中制備的基因組DNA,可以通過在3.1)中描述的AFLP方法擴增基因組片斷,然后用本發(fā)明中的系統(tǒng)對這些片斷進行電泳,從而檢測并記錄這些標記條帶中的多態(tài)性。
為了表示靠近每一個標記的每個座位對所感興趣性狀表達的貢獻,將所感興趣性狀的個數(shù)乘以每一條帶在一個親本中的多態(tài)性個數(shù),將所得乘積為每一個標記條帶繪制在圖上。
本發(fā)明可以被有效地用來檢測必要的標記,對農(nóng)業(yè)、畜牧業(yè)或多種生物中的某一特定的品種和/或品系進行鑒定。用從大量將被用來比較的品種中取得的DNA來進行AFLP,并用本發(fā)明中的電泳裝置同時進行電泳,以便一次就可以為數(shù)十個、乃至100、以至于更多的品種比較數(shù)十打的條帶。因此,即使有大量的品種,特異性的識別條帶也可以被容易地選出來。
在該種應用中,雖然理論上n條帶的組合能夠鑒定多達2n個品種和/或品系,而在實際應用中可能稍微低于這一結(jié)果。
當用來比較的品種和/或品系相互之間親緣關(guān)系非常接近,以至于用常規(guī)的如AFLP方法很難獲得多態(tài)性時,可以把利用AFLP、RAPD或任何其它方法從參比樣品的基因組中獲得的產(chǎn)物混合在一起,經(jīng)過加熱后冷卻來產(chǎn)生異源雙鏈核酸分子;這些異源雙鏈核酸分子可以用于電泳以便對所感興趣的條帶進行比較。這樣,品種和/或品系間的差異可以被敏感、有效而且簡單地檢測出來。
當某一具有高度鑒別能力的特定條帶被確定出來后,可以按照7中描述的方法將該條帶分離出來,從而使該條帶可以被用作特定的引物進行PCR擴增。在PCR擴增以后,簡單的瓊脂糖凝膠電泳在約1個小時之內(nèi)就能夠?qū)υ撈贩N進行鑒定。此外,該引物還可被特定的熒光標記物標記,從而可以使用配備有熒光檢測儀的PCR儀來確定該引物擴增的產(chǎn)物中是否存在這一條帶。在該方法中,無需進行電泳,經(jīng)過2~30分鐘的PCR過程就可對該品種和/或品系進行鑒定。
5.構(gòu)建生物的遺傳圖譜為了構(gòu)建一個覆蓋某生物整個基因組的遺傳圖譜(準確地說是核酸標記圖譜),如同在QTL分析中一樣,必須用F2代個體對幾百乃至幾千或更多的標記進行分析,其中F2代個體的數(shù)目取決于所需圖譜的分辨率。在大多數(shù)高等植物尤其是主要作物中,基因組的總長度在1500~2000CM之間。因此,用傳統(tǒng)的RFLP方法構(gòu)建一個密度及精確度大約在1CM左右的基因組圖譜,需要從至少100個F2代個體中制備雜交膜,并且要把這些膜對大約1800個標記反復轉(zhuǎn)印雜交。由于包括制備探針在內(nèi),一次轉(zhuǎn)印雜交周期需要4天時間,即使一次可操作4個探針,整個過程也需要1800天。此外,該過程要求有很大量的核酸,每一個F2代個體都必須有至少1mg的DNA。這就是為什么已經(jīng)構(gòu)建成的遺傳圖譜都是通過一個包括數(shù)十人的團隊經(jīng)過好幾年的時間來完成的原因之一。
按照本發(fā)明,例如采用具有大約10%多態(tài)性的育種親本,平均一對引物可顯示4~5個多態(tài)性。因此,通過進行預檢測程序來選擇可顯示至少6個多態(tài)性的引物對,然后用選出來的引物對通過標準模式對128個F2代個體進行作圖,利用2個引物對在一次電泳周期中可對至少12個標記進行圖譜定位。這樣,一個包括1800個標記的精細圖譜可被一個人在總共150天內(nèi)完成,這比傳統(tǒng)方法的效率至少高了10倍。一個包括約300個標記的圖譜用1個人將在大約1個月內(nèi)完成。
詳細操作程序如下兩個具有合適的遺傳距離的品系進行雜交,獲得其數(shù)目符合所需圖譜精確度要求的RI系或F2代個體。為了是雜交不育和分離比率失真的可能性降到最低,這兩個品系間的平均多態(tài)性頻率應達到10%或稍高一些。要達到大約0.5~1CM的精確度,一般有64~128個個體就足夠了。從這些個體中制備基因組DNA,然后按照與已經(jīng)敘述過的F2代分析和RI分析相同的方式,用AFLP方法進行擴增。通過本發(fā)明中的系統(tǒng),擴增后的PCR片段被電泳、染色并分析。這些是按如下步驟來完成的已制備的基因組DNA被放置于96孔板中。一部分DNA(大約0.1μg)被EcoRI和MseI雙酶切。在切斷的末端加上接頭,然后用與接頭有相同的5′末端的引物進行預擴增。然后,利用預擴增的PCR產(chǎn)物作為模板,利用含有合適數(shù)目選擇性堿基的選擇性引物進行第二次擴增。擴增產(chǎn)物被用在本發(fā)明中的電泳裝置上進行電泳。采用8~12道的取液器或8~12道的微量調(diào)節(jié)注射器來提高凝膠加樣效率。當被檢測的樣品是64個時,可用4套引物在1次電泳周期中對大約20個標記進行操作;當被檢測的是128個樣品時,則用2套引物對10個標記進行操作。諸如MAPL或MAPMAKER等遺傳圖譜構(gòu)建軟件可用于多態(tài)性分析,來提高效率。
使用一種本發(fā)明以前的系統(tǒng)的一個參考案例被展示在這里(圖11)。在該系統(tǒng)中使用了8塊15個泳道的凝膠。利用Azumamugi和Kanto Nakate Gold這兩個大麥品種雜交育種產(chǎn)生的99個RI系個體,在大約2個月的時間里構(gòu)建了一個包括227個標記的AFLP圖譜。該AFLP圖譜被與一個已存在的包括45個標記的圖譜整合在了一起,從而產(chǎn)生一個具有272個標記的圖譜。在這個案例中,該AFLP圖譜被一個人在大約2個月的時間里完成,其效率比傳統(tǒng)的圖譜構(gòu)建方法如那些使用STS標記的方法高了約40倍。本發(fā)明中的操作效率甚至比這一早先系統(tǒng)更加提高。
6.在具有較大基因組生物中的應用當與AFLP聯(lián)合使用時,本發(fā)明按設(shè)想可發(fā)揮出它的最大潛力。AFLP的一個結(jié)果是因為基因組被EcoRI(識別6堿基序列)和MseI(識別4堿基序列)雙酶切成許多片斷而產(chǎn)生;與切斷的位點互補的接頭被加在片斷末端;在第一次擴增中接頭序列被用作PCR引物,以便使所有的片斷都能夠被擴增;第二次擴增中使用的引物是選擇性引物,該引物是在第一次擴增引物的3′末端附加上了1至幾個堿基的選擇性序列;因此只有那些在其兩個末端都有能與選擇性引物互補的序列的基因組片斷才能被特異性擴增。在生物具有相對較小基因組(如水稻450MB)的情況下,在兩個末端的EcoRI和MseI位點都附加了3堿基選擇性序列的選擇性引物被用作第二次擴增引物。因此,如“2.核酸標記的檢測”中所述,平均有約50個條帶被選擇性擴增。對于其基因組大小類似于絲狀真菌,如P.oryzae Cavara(40MB)的生物,在兩個切割位點各加上一個堿基就將產(chǎn)生50×(40MB/450MB)×16=70個條帶。對于基因組較大的生物,只需簡單地把AFLP引物中選擇性序列的堿基數(shù)提高到3或4個,基本上就可以應用本方法了。
作為選擇,電泳的條件可以被改變。通常,在PCR產(chǎn)物的電泳過程中,對在非變形條件下保持雙鏈狀態(tài)的PCR產(chǎn)物進行電泳十分方便。然而,對于一個具有較大基因組(如大麥5.5GB)的生物,如果PCR產(chǎn)物是雙鏈,電泳條帶可能就不會被很清楚地分離開來。因此,通過使用含有8.5M尿素的變性凝膠并且把DNA樣品在存在50%甲酰胺的情況下于90℃處理3分鐘,使DNA解離成為單鏈后再進行電泳,數(shù)目眾多的條帶就被清晰地區(qū)分開來(實施例4)。
實際上,當基因組大小增加時,進行AFLP的困難也會增加。因此,聯(lián)合起來使用以上兩種方法是值得推薦的。
7.為制備SCAR標記對重要條帶進行分離和測序在本發(fā)明的實施方案中,如上面已經(jīng)敘述過的3.、4和5.節(jié)中,每一種情況下條帶所具有的特定重要信息都被確定出來鄰近某一特定基因的條帶(在節(jié)3.中)、可用于品種鑒定的條帶(在節(jié)4.中)以及用作遺傳圖譜上的位置標記的條帶(在節(jié)5.中)。
這些條帶可被從凝膠中切出來,按照如下步驟生成SCAR(特征性序列擴增區(qū)域)標記在切下來的凝膠中的DNA物質(zhì),通過粉碎抽提、凍融、電泳或其它方法被洗脫出來,使用同樣的引物對其進行PCR擴增。所得PCR產(chǎn)物被插入合適的克隆載體用于測序。在確定其序列以后,兩個末端的序列被用作SCAR標記的引物(實施例3)。在這種情況下,諸如cyber綠等熒光染料的使用可以使核酸提取變得更加容易。使用測序儀的AFLP方法中,條帶可以被鑒定但不能被提取出來,與該方法相比較,本發(fā)明中的方法更加簡單,同時完全利用了AFLP的重要特性。
8.分離包含特定條帶的基因組克隆當發(fā)現(xiàn)包含重要信息的條帶后,如上面3.、4.和5.節(jié)中舉例說明的,包含這些條帶的基因組克隆可能需要被分離出來。特別是用定位克隆來分離某一具有重要功能的基因時,有必要按如下步驟制備一系列的重疊克隆通過如2或3中的方法將該基因兩端的最鄰近標記鑒定出來;利用這些標記,一個包含這些條帶的克隆被從一個象BAC文庫這樣的基因組文庫中分離出來;利用處在該克隆兩末端的標記,可鑒定出另一個相鄰的克隆,接著重復這一過程(步移);于是一個連續(xù)重疊克隆的系列被制備出來,這個克隆系列把那些位于該基因兩末端的標記(旁側(cè)標記)之間連接起來。
通過集落雜交,一個基因組文庫中的克隆成員被組織并連接在膜上,當這些高密度膜被制備好以后,利用擴增得到的條帶作為探針在這些膜上進行雜交,目標克隆就可能被篩選出來。這些條帶可以通過如7.節(jié)中描述的直接PCR擴增或是被當作SCAR標記來擴增的途徑進行制備。
作為選擇,包含感興趣條帶的克隆也可以按照如下步驟,在不需要雜交的情況下進行鑒定根據(jù)9.節(jié),目標生物的基因組文庫被分解成一些亞文庫;同等的標記是利用亞基因組文庫克隆的混合DNA制備的,這些克隆相對應于微孔板中的行、列和板號;這些同等的標記備用于使用同樣的引物對并以基因組DNA為對照的AFLP分析,然后進行本發(fā)明中的電泳;這樣,根據(jù)與對照中的擴增條帶相同的條帶所處的行、列以及板的坐標,包含感興趣條帶的克隆就被鑒定出來。
9.制備覆蓋生物整個基因組的重疊群如果按照一種生物的基因組文庫例如那些基于BAC的文庫的要求來講,所有這些組成克隆的鄰近情況若明確的話,那么相互重疊的克隆就被連接在一起從而構(gòu)建一個覆蓋整個基因組的更大的重疊群(物理圖譜)。以這種方式構(gòu)建成的物理圖譜是該生物基因組結(jié)構(gòu)的一種重現(xiàn)。即使在整個基因組的序列被測定之前,完成這樣的一個圖譜,也使得分離和鑒定重要的功能基因更加容易,而且使對該生物基因組的操作更加便利。實際上,一旦完成完整基因組的重疊群,隨后的基因組測序工作就可能被完全機械化。迄今為止,完整基因組重疊群的構(gòu)建仍然要求一個包括幾十個人員在內(nèi)的大研究組。然而,利用本發(fā)明,一個可覆蓋其基因組大小接近于水稻(大約500MB)的生物的完整基因組的重疊群,有可能僅用一個人在約一年的時間內(nèi)完成。
構(gòu)建一個完整基因組重疊群的主要困難,是由于難以獲得特異性的標簽來標記組成該基因組文庫的每一個克隆。在本發(fā)明中,通過與AFLP聯(lián)合使用,在一次電泳周期內(nèi)可獲得多至30~50個高度特異性的條帶,這些條帶被用兩個參數(shù)來標注,一個是在其兩端的3堿基序列、另一個是該條帶的堿基數(shù)(長度)。每一個這樣的特異性條帶都可能與一個該基因組的組成克隆相關(guān)聯(lián),而且這些條帶的分布密度可能被有效地降低到小于BAC克隆的長度。因此,就不難把擁有同樣標記的克隆連在一起。
為了在AFLP條帶和文庫克隆之間達到差不多一對一的對應性,把通常其容量有幾個乃至更多的基因組等價物的完整基因組文庫,分成幾個亞文庫,每一個亞文庫大約有相當于1個基因組的容量。通過微孔板的行坐標、列坐標和板坐標,每一個亞文庫的組成克隆都被唯一地鑒別出來。因此,利用行、列和板號作為坐標軸的坐標值,從具有共同的軸坐標的克隆群體中收集少量的DNA,然后將它們混合在一起來提供代表每一坐標軸上各位置的坐標樣品。通過進行本發(fā)明中的基因組掃描,具體是利用這些坐標樣品作為模板進行AFLP,利用完整基因組DNA作模板制備對照,將對照加在坐標樣品泳道的兩邊進行電泳,然后將所得AFLP電泳圖與對照泳道相比較,與基因組DNA模板擴增所得的特異性條帶相對應的克隆可以容易地被從亞文庫中查出來。當亞群體中有2~n個符合要求的克隆時,會有23=8~n3個克隆與這些條帶相對應。在這種情況下,通過除去這8個克隆并實施該基因組掃描方法中的第二次電泳,真實地符合要求的2個克隆就被鑒定出來。制備亞文庫的坐標樣品的特定程序展示于實施例5.中。
就一個其基因組大小與P.oryzae Cavara(大約40MB)處于一個級別且平均克隆插入為120kB的文庫來說,一個內(nèi)含大約為1個基因組等價物的亞克隆將包括約300個克隆,這些克隆可能被保存于8行、6列和6個半板中。因此,如果一塊凝膠包括22個泳道,將其中20個用于坐標樣品、2個用于對照,那么2塊凝膠就足以對相當于6個基因組等價物的亞克隆即完整的基因組文庫進行電泳。換句話說,如果用兩對引物在1次電泳周期能夠把大約60個條帶進行鑒定和坐標定位,那么在25個電泳周期內(nèi)就可以處理1500個條帶。這相當于40MB/1500個條帶=27kB/條帶的密度,也就等于在平均大小為120kB的每個BAC克隆中平均鑒定出4.4個條帶。假設(shè)有平均6個基因組等價物的克隆,這一密度預計足以覆蓋整個基因組(參照實施例5)。
當基因組大小與水稻(450MB)處于一個級別,如果該文庫相當于6個基因組等價物且平均克隆插入大小為150kB時,通過使用32塊微孔板制備一個其內(nèi)容相當于1個基因組等價物的16個行、12個列、16×2個板的矩陣,在1次電泳周期中就可完成對6個亞文庫的電泳。這就使得每個周期可鑒定25個條帶。因此,200個電泳周期將鑒定出5000個條帶,相當于450MB/5000個條帶=90kB/條帶的密度。這一密度應該足夠用來從一個其中平均克隆大小為150kB并以6倍冗余狀態(tài)存在的基因組中,構(gòu)建長重疊群。
附圖簡述圖1是在基因組掃描中使用的一個標準電泳裝置主體的正視圖和頂視圖,該電泳裝置一次能夠處理4塊18平方厘米大的凝膠。在每一塊凝膠上,用梳子做成的加樣孔可以1mm的寬度加載66~68個樣品。因為有2~4個泳道用來加載分子量標記或類似樣品,所以一次基本上可同時處理64個樣品/塊凝膠,也就是4塊凝膠上共256個樣品。通過使用8道微量取液器,PCR擴增所得樣品可被高效率地加在這些凝膠上。
圖2是一個在基因組掃描中使用的標準電泳裝置上固定凝膠的零件附圖。
圖3是一個在基因組掃描中使用的標準電泳裝置的梳子的附圖。
圖4是一個在基因組掃描中使用的一套完整的標準電泳裝置的照片。
圖5是一個電泳圖,該圖顯示了利用基因組篩選從混合分離群體分池分析中獲得的avrPib基因鄰近標記的候選者的初步篩選結(jié)果,該基因是P.oryzae Cavara的一個非致病基因。將基因組掃描和在A、B、C和D這4對引物上進行的AFLP結(jié)合使用,這4對引物能夠產(chǎn)生不同的鄰近標記候選者,進行電泳時,從左邊開始依次分別是avrPib-和+的親本株系、avrPib-和+的混合分離群體池以及avrPib-和+的六個F1代株系中的每一個成員。三角形圖形標記表示候選標記的條帶。用A、B和C引物對得到的初次篩選結(jié)果顯示了預期的共分離基因型。相反,用引物對D在一個-株系和一個+株系中觀察到了重組(黑三角形)。注意每一對引物產(chǎn)生了5~60個條帶。在一塊凝膠上可掃描3~4000個條帶。因此該裝置一次能夠處理4塊凝膠,在一個周期中可以對12~16000個條帶進行掃描。這些引物對中使用的選擇性核苷酸數(shù)在EcoRI端是3個,在MspI端是1個。用在這里的雜交系之間的多態(tài)性頻率約為5%。因為P.oryzae Cavara的完整基因組大小約為500CM,用256對引物可獲得約500個多態(tài)性條帶,即整個基因組都被密度為1CM/條帶的標記所覆蓋。
圖6是P.oryzae Cavara的一個非致病基因avrPib周圍的精細圖譜,其中該圖譜是利用125個F1代株系,通過RAPD方法和基因組掃描把該基因的鄰近標記進行圖譜定位而制得的。如表1中所示,尋找鄰近標記是通過利用700條引物的RAPD方法以及用251對引物的PCR進行的基因組掃描方法來完成的。用RAPD方法來尋找和作圖需3個月時間,而使用基因組掃描在1個月內(nèi)就可完成。由于僅有非常清晰的條帶才被記錄下來,所以記錄的條帶數(shù)看起來較少。An通過基因組掃描獲得的標記,(Rn)通過RAPD方法獲得的標記。
圖7是一個電泳圖譜,該圖展示了一個為尋找bc-3的鄰近標記而作的混合分離群體分池分析的實例,bc-3是水稻中纖維素合成突變體Kamairazu中的一個基因。為每一個引物顯示四個泳道從左邊開始依次是突變親本品系(M11japonica)、突變體(隱性)純系的混合分離群體池、野生型(顯性)純系的混合分離群體池以及野生型親本品系(Kasalathindica)。圖上的箭頭表示鄰近標記的候選者,它們表現(xiàn)了在不同的混合分離群體池之間的顯著差異。當僅記錄明顯的條帶時,每一泳道有20~30個條帶;把較狹小的條帶也包括進來以后,每個泳道平均可觀察到50個條帶,這個數(shù)目反映出了理論值。
圖8是一個用基因組掃描技術(shù)尋找大麥中控制雙棱基因的照片。用Azumamugi(六棱)對Azumamugi(六棱)和Kanto Nakate Gold(雙棱)的雜交種回交7代以上后,選出具有雙棱的品系來建立一個準純合的遺傳品系,該品系具有雙棱但卻是Azumamugi的遺傳背景。在圖8的照片中,通過基因組掃描對該品系及回交親本Azumamugi進行了比較。在32個泳道上尋找從16對引物中產(chǎn)生的差異,但只有很有限數(shù)目的條帶表現(xiàn)出差異。具有差異的條帶便可能是在與雙棱基因緊密連鎖區(qū)域中的多態(tài)性條帶。
圖9A展示了一些SCAR(特征性序列擴增區(qū)域)標記的實例,這些標記是通過分離針對一個水稻品種秋田小町(Akitakomachi)的特異性條帶而獲得的。反向的部分是制備好的引物。圖9B是一個電泳圖,顯示了利用圖9A中展示的引物,通過PCR對10個主要的水稻品種的核酸進行擴增所產(chǎn)生的條帶。僅從Akitakomachi中擴增得到了一個特異性的條帶。在“對照1”中,一個已被分離出來用于測序的特異性條帶被用作模板。
圖10顯示了一個相對應于某一特定條帶的克隆是怎樣被利用基因組掃描直接從基因組文庫中篩選出來。在這種情況下,其中包括6個基因組等價物且平均克隆插入大小為120kB的P.oryzae Cavara(基因組大小40MB)文庫,被分成6個亞文庫,每個亞文庫中含大約1個基因組等價物,在每一個亞文庫中對與基因組掃描條帶相對應的克隆進行鑒定。
在圖10A中,那個用一個斑點顯示的克隆被表示為行C、列4和板a。代表行C的坐標的坐標樣品的制備,是通過從全部半板上行C中所有列中的每一個克隆中各提取10ng DNA并混合在一起后制得的。在圖10B中,一個亞文庫由22個泳道組成,其中包括對照基因組泳道以及對應于8個行、6個列和6個半板的坐標樣品的泳道。6個基因組等價物可被加載于2塊凝膠上在1次電泳周期中進行處理。根據(jù)與對照顯示相同目標條帶的樣品所處的坐標,相應的克隆就被鑒定出來。
圖11是一個通過15泳道凝膠電泳構(gòu)建成功的大麥基因圖譜的實例,基因組掃描就是從其中發(fā)展起來的。在總共272個標記中,有227個AFLP標記是通過該方法進行圖譜定位的。
本發(fā)明實施的最佳模式提供以下這些實施例是為了更進一步說明本發(fā)明,但不能認為本發(fā)明僅限于這些特定的例子。
對鄰近一個對水稻無致病性的avrPib基因的核酸標記的精細作圖與水稻中的抗病基因Pi-b相對應的avrPib是P.oryzae Cavara中的非致病基因,該基因被用來尋找處于其周圍的核酸標記,而且這些標記和該基因之間的距離已被確定?;騛vrPib是P.oryzae Cavara中的一個非致病基因,該基因與水稻中的抗病基因Pi-b相對應;水稻對病原P.oryzae Cavara的抗性依賴于水稻中的Pi-b基因?qū)vrPib基因產(chǎn)物的識別。因此,在avrPib基因中的突變會破壞Pi-b基因引導的抗性。這樣,為了研究造成突變的原因以及抗性基因產(chǎn)物和非致病基因產(chǎn)物之間的相互作用,有必要從抗性已被破壞了的品系中分離avrPib基因。通過用從已觀察到抗性瓦解的部分中分離出來的P.oryzae Cavara與正在和Pi-b發(fā)生相互作用的P.oryzae Cavara進行雜交,比較了分別使用本發(fā)明中的方法和一種有代表性的傳統(tǒng)方法即RAPD方法對該非致病基因所作的精細作圖。
將保留有avrPib的株系(因此不能感染含有Pi-b的水稻)和沒有avrPib的株系(因此能感染含有Pi-b的水稻)之間進行雜交,來產(chǎn)生大量的F1代株系。為了確定在每一個株系中是否存在avrPib,這些F1代株系被注入含有Pi-b的水稻中。然后分別從存在avrPib的群體(+)和不存在avrPib的群體(-)中制備基因組DNA的混合分離群體池,在每一個群體中使用幾十個左右的株系。采用4個株系,即來自每一個親本株系的2個以及分別來自(+)和(-)混合分離群體池中的2個,用對64×4=256引物進行AFLP分析。因為P.oryzaeCavara的基因組大小約為40MB,是水稻基因組大小的1/10左右,所以覆蓋整個基因組所需的引物對數(shù)目是水稻所需的1/16左右。
為了對比,大約540個引物被用于RAPD(隨機擴增多態(tài)性DNA)擴增。在RAPD方法中,當進行混合分離群體分池分析需要有540×4=2160個泳道時,用一種大型的水下凝膠一次就可能對,例如,144個泳道進行處理。因為只有穩(wěn)定且明顯的條帶才能被選擇用于對比。這樣,經(jīng)15天的時間,經(jīng)過選擇的1860個條帶被在混合分離群體池之間進行比較,結(jié)果在親本之間得到了約100個多態(tài)性條帶。
與之相比,本發(fā)明中的方法在4天內(nèi)就可比較并查尋5700個條帶,結(jié)果得到304個多態(tài)性條帶(表1)。這表明該方法的效率比RAPD法的效率高11倍(5700/1860×15/4)。
表1多態(tài)性條帶平均條帶使用的引 獲得的總多態(tài)性百與avrPib連鎖的數(shù)/每引物物對數(shù)目 條帶數(shù) 總數(shù) 分率(%)(緊密連鎖的) 對RAPD 539 186110110(4)3.5 5.4AFLP 251 571030486(41) 22.75.3在這些多態(tài)性條帶中,6個來自RAPD以及41個來自AFLP的被認為是該基因鄰近標記條帶的候選者,其中混合分離群體分池分析揭示出在顯性和隱性純合群體之間有很顯著的差異。以12個F1代株系作為參比,這些候選條帶首先被提交進行初次篩選(圖5)。提高使用的F1代株系的數(shù)目,最后,當用到125個F1代株系時avrPib基因周圍的精細圖譜被構(gòu)建出來(圖6)。在距離目標avrPib基因20CM的范圍之內(nèi),RAPD方法顯示出兩個標記條帶而本發(fā)明中的方法則有12個條帶。用RAPD方法檢測到的距該基因最近的條帶在離該基因5.3CM的位置,而用本發(fā)明中方法檢測到的一個最近條帶則在距該基因1.8CM處,比用RAPD法得到的近得多。這一距離被認為小到足以用來構(gòu)建一個物理圖譜,因為在P.oryzae Cavara中1CM相當于約80kB。
水稻中的一個Kamairazu(脆稈)突變基因bc-3的精細作圖bc-3基因是造成水稻纖維素合成抑制突變(Kamairazu或脆稈)的基因,纖維素合成是水稻稈中細胞壁進行2次加厚所必需的過程。通過基因組掃描,鄰近bc-3基因的核酸標記被進行了檢查。一個iaponica中的bc-3突變M11和一個indica中的野生型Kasalath被用來作為雜交親本進行F2代分析。十個純合突變個體和八個純合的野生型個體被提高到F3代分析來鑒定,而它們的基因組DNA混合物與那些親本品系的一起被提交進行與AFLP結(jié)合起來的基因組掃描混合分離群體分池分析。這些核酸被兩個酶,即EcoRI(識別6堿基位點的)和MseI(識別4堿基位點的)雙酶切。然后,用1430個在酶切末端連接有3-堿基選擇性核苷酸的引物的組合,完成了依據(jù)混合分離群體分池分析法的基因組掃描。該結(jié)果的實例展示在圖7中。
結(jié)果獲得了97個鄰近標記的候選者,其中的50個可用于檢測隱性純合個體中的重組標記。為了縮小候選標記的范圍,每一個候選者都被用10個隱性純合個體(20條染色體)進行F2代分析。其中的24個候選標記被用32個隱性純合個體即64條染色體進行分析,發(fā)現(xiàn)有1個標記與靶基因(距其0CM)共分離(圖7)。
當本發(fā)明被用在對某種基因組很大的生物如大麥(5.5GB)進行的AFLP中時,如果在每一個基因組末端引物上所加的選擇性序列長度為3個堿基,那么如果仍然采用較小基因組如水稻基因組(450MB)所用的方法,即用于檢測的DNA保持在非變形條件下的雙鏈狀態(tài),則有可能得不到顯著的條帶。在這種情況下,有一種解決辦法是增加選擇性引物的數(shù)目。然而作為另一種選擇,通過電泳時把DNA變性成為單鏈的方法,即使仍用3堿基選擇性標記也可能達到足夠的條帶分辨率。為了提供這樣的變性條件,在凝膠中加入了6~8.5M的尿素,在樣品緩沖液中加入了50%的甲酰胺,而且在馬上進行電泳之前要把樣品置于90℃中3分鐘。
圖8是一個用基因組掃描技術(shù)尋找大麥中控制雙排穗性狀基因的結(jié)果。用Azumamugi(六棱)對Azumamugi(六棱)和Kanto Nakate Gold(雙棱)的雜交種回交7代以上后,選出具有雙棱的品系來建立一個準純合的遺傳品系,該品系具有雙棱但卻是Azumamugi的遺傳背景。在圖8的照片中,通過基因組掃描對該品系及回交親本Azumamugi進行了比較。在32個泳道上檢查了從16對引物中產(chǎn)生的差異,但只有很有限數(shù)目的條帶表現(xiàn)出差異。具有差異的條帶便可能是存在于與雙棱基因緊密連鎖區(qū)域中的多態(tài)性條帶。
就大麥來說,在這種條件下平均可鑒定出來58個條帶。假設(shè)用大規(guī)模測序凝膠(Castilioni等,1998,遺傳學1492039-2056)對大麥進行AFLP分析時平均可獲得約88個條帶,那么這些條帶中約有67%可被本方法鑒定。本發(fā)明中的方法能夠在每塊凝膠上每天處理256個泳道,其效率比使用處理能力大約為每天32個泳道的大凝膠的方法高5~6倍。
分離通過基因組掃描鑒定出來的水稻品種特異性條帶以及通過測序設(shè)計特異性引物一方面為了使市場銷售的精白米中進行品種鑒定更加容易,另一方面為了建立一個任何人用之都能通過進行快速的PCR很容易地鑒定水稻品種的系統(tǒng),本發(fā)明者們開發(fā)了SCAR標記。
通過使用55條引物的基因組掃描(AFLP),尋找那些可在10個主要的市售精大米中把不同品種區(qū)分開來的條帶。該檢測需2天時間。在發(fā)現(xiàn)的幾個適于用作品種鑒定的條帶中,一個對品種″Akitakomachi″有特異性的條帶被準備出來在寬泳道中進行電泳。電泳完成以后,用一種熒光染料(vistra綠)對該泳道染色,將條帶切出來在TE緩沖液中粉碎抽提,然后用AFLP中使用的引物對其進行PCR擴增。所得PCR產(chǎn)物被插入合適的質(zhì)粒以便導入E.Coli。在對E.Coli進行培養(yǎng)和擴增以后,該質(zhì)粒被提取出來并通過限制內(nèi)切酶鑒定來確定其中存在目的插入片斷。接下來對質(zhì)粒進行序列分析從而設(shè)計可特異地擴增該目的條帶的引物(圖9A)。當用從10個主要品種來的DNA為模板,用這些引物為引物進行PCR擴增時,發(fā)現(xiàn)僅能從Akitakomachi的擴增中得到一條特異性的條帶(圖9B)。
從文庫中篩選出相對應于某一核酸標記的克隆為了鑒別出與通過本方法從基因組文庫中獲得的某一特定條帶相對應的克隆,一般是用如上面實施例3中所述方法獲得的SCAR標記,通過對載有該文庫的高密度雜交膜進行集落雜交,從而篩選出陽性克隆。然而,這一方法需要耗費勞動和時間來制備大量的條帶。而且,分離出來的條帶其內(nèi)部序列不一定是唯一的。
文庫中相對應于某一特定條帶的克隆可通過下面的基因組掃描被直接篩選出來,而不需要分離標記條帶首先,用一種質(zhì)粒提取儀從全部文庫克隆中提取如BAC等基因組克隆的DNA,以便制備出DNA板子,使其中所載DNA與原來克隆板上所載克隆中含有的DNA序列相同。然后把整個基因組文庫分成幾個含有1個基因組等價物或更小的亞文庫。因此,對于一個特定的條帶來講每一個亞文庫中平均包括1個與之相對應的克隆。更進一步,以行、列和板號作為坐標,從構(gòu)成一個亞文庫的幾個板上選取具有相同坐標值的克隆,從每一個克隆中各采集10ng DNA,從而獲得對應于不同坐標位置的坐標樣品。例如,第3行的坐標樣品是在不考慮板號和列號的情況下,從每一個位于第3行的克隆中采集10ng DNA并混合在一起而得來的。所有的坐標樣品都是以同樣的方式制備的。以相同的方式對這些坐標樣品和作為對照的完整基因組樣品進行基因組掃描分析。坐標樣品DNA可以在不必抽提基因組文庫中的所有克隆的DNA的情況下進行制備;替代方法是,可以把每一行、列或板中的所有克隆混合在一起后,培養(yǎng)和擴增至約2ml,從其中提取混合的DNA從而得到坐標樣品。一旦一個完整基因組對照擴增產(chǎn)物中的感興趣條帶,在特定行、列和板號的坐標樣品擴增產(chǎn)物中找到與它相符的條帶,那么這些行、列和板號的值就表示出了靶克隆的一個三維坐標,這樣就能把該克隆從亞文庫中挑出來。在亞文庫中包括好幾個候選克隆的情況下,可把這些候選者挑選出來然后與對照一起進行再次基因組掃描,以確定最后的結(jié)果(圖10)。
本方法對于構(gòu)建完整基因組的重疊群是特別有效的,因為該法可以把從基因組掃描中獲得的所有條帶與文庫中的克隆相匹配,從而使一個基因組文庫的所有組成克隆都被覆蓋進來。這樣,一個全基因組的重疊群可以容易地被一個人構(gòu)建完成。
圖10A顯示了一個特定的克隆是怎樣被從一個包括6個半板(3個整板)的基因組亞文庫中鑒別出來,其中P.oryzae Cavara(基因組大小40MB)的基因組文庫(平均插入120kB,6個基因組等價物)被分成6個亞文庫,以使每個亞文庫大約包括1個基因組等價物。在每一個基因組亞文庫中,代表第1行的坐標樣品的制備,是通過把6個半板中所有第1行的克隆(6行×6個半板=36個克隆)的10μg DNA混合物收集起來而完成的。因此,每一個基因組亞文庫包括總數(shù)為20個的坐標樣品,代表8個行、6個列和6個板,可以對整個基因組亞文庫中的8×6×6=288個克隆進行鑒別。
如圖10B中所示,用基因組掃描一次進行22個泳道的電泳,其中在20個泳道上用那些坐標樣品作為坐標板,對照全基因組在2個泳道上被用作坐標板。這樣,相對應于對照中所獲得條帶的克隆可以方便地從亞基因組文庫中鑒別出來。
因為3個次級基因組文庫可被放置于1塊電泳凝膠(66個泳道)上進行電泳,僅需2塊凝膠就可以覆蓋整個基因組也即6個亞文庫。因此,就使用1對引物的1次AFLP周期來說,在其中有6個基因組等價物的完整基因組文庫中,尋找相對應于25~40個條帶的克隆的工作可用兩塊凝膠完成。由于標準的基因組掃描中每個周期可處理4塊凝膠,所以在整個基因組文庫中,對相對應于通過2對引物獲得的50~80個條帶的克隆進行的鑒別,可在1次電泳周期內(nèi)完成。
因此,即使按照保守的估計,在1次電泳周期中也可以把由2套引物產(chǎn)生的約50~80個條帶與其相對應的克隆進行匹配;在25個周期中可把約1200~2000個條帶與相對應的基因組進行匹配。假設(shè)P.oryzae Cavara的基因組大小為40MB,獲得1500個條帶將要求在基因組上的平均條帶分布密度為40MB/1500個條帶=27kB/條帶,其意味著在平均大小為120kB的一個克隆中平均能獲得4.4個條帶。把平均6倍的克隆冗余考慮進去,這一密度應該足以用來構(gòu)建一個基因組重疊群。這樣,在可使用BAC質(zhì)粒的情況下,一個由6個基因組等價物組成的完整基因組文庫的重疊群,可在約1個月內(nèi)完成。
假設(shè)有一臺自動化質(zhì)粒提取儀可供充分使用,18個板中的質(zhì)粒在2個星期左右就能制備完畢。
工業(yè)適用性本發(fā)明中的方法和電泳裝置,使得有可能十分容易且有效地為諸如下列用途檢測、鑒定和獲得核酸標記(1)通過利用鄰近該基因的核酸多態(tài)性,開發(fā)多態(tài)性標記來標記某一個控制重要功能和/或性狀的單基因。
對于這一用途,帶有目的基因的生物可以不具備一個由已知標記組成的基因組圖譜。
(2)在定位克隆過程中鑒定和分離鄰近靶基因的克隆。
在僅以染色體上的位置信息為基礎(chǔ)的情況下,為通過定位克隆技術(shù)分離和克隆某一控制重要功能和/或性狀的單基因,搜索了緊鄰該基因的標記,還提供了可用于從一個基因組文庫如BAC文庫中篩選位于該基因周圍區(qū)域內(nèi)的克隆的標記。對于這一用途,帶有目的基因的生物可以不具備一個由已知標記組成的基因組圖譜。
(3)基因分析和高密度作圖有效地提供了大量用于對一種生物進行基因作圖的核酸標記。對該生物F2代或RI品系的連鎖分析以及高密度作圖也是在高效率下完成的。因此,基于至少2個基因的貢獻的定量性狀位點(QTL)分析也可以容易地完成。
(4)品種鑒定用于對包括精白米在市場上銷售的食物和種子進行品種鑒定的標記條帶被有效地檢測出來。而且,為了設(shè)計用于SCAR(特征性序列擴增區(qū)域)分析的引物,所得鑒定條帶被分離并克隆后進行了序列分析。利用這樣的SCAR標記可以進行快速的品種鑒定。某一特定基因的鄰近標記也可以被提供做成SCAR標記,以便使它們可以被用作更容易使用的育種標記等等,或者被用于篩選該基因鄰近區(qū)域的BAC克隆。
(5)構(gòu)建覆蓋生物整個基因組的重疊群按照如下步驟,構(gòu)成某生物的基因組文庫的克隆可以被容易地連在一起構(gòu)建一個覆蓋整個基因組的重疊群一個含有幾個基因組等價物的基因組文庫被分成幾個亞文庫,每個亞文庫中大約包括一個基因組等價物。對于每一個構(gòu)成每個亞文庫的微孔板組,其行、列和板分別被指定為X、Y和Z軸。所有與某一軸直交的克隆的DNA被混合成一個群體,提供一種用作模板的坐標樣品。這些坐標樣品和作為對照的整個基因組DNA被作為模板置于電泳凝膠上并通過基因組掃描進行處理。這樣,一個相對應于整個基因組的泳道上的條帶的克隆就被鑒別出來(圖10)。假設(shè)所獲得條帶的分布密度相當于1條帶/20~50kB,一個其中平均含有幾倍克隆冗余的全基因組的重疊群,就被構(gòu)建成功了。
權(quán)利要求
1.一種用于核酸電泳的方法,該方法包括以下步驟a)用一種電泳裝置對核酸樣品進行電泳,在該裝置上一次可安裝多個10~30平方厘米大小的凝膠板,利用該裝置每塊凝膠板至少可使32個核酸樣品同時進行電泳。b)電泳之后在凝膠上檢測核酸條帶。
2.根據(jù)權(quán)利要求1中的方法,其中電泳是在使用不連續(xù)緩沖系統(tǒng)的凝膠上進行的。
3.根據(jù)權(quán)利要求1中的方法,其中的核酸樣品是通過變性使雙鏈DNA解離而制備的單鏈DNA,而且電泳是用變性凝膠完成。
4.根據(jù)權(quán)利要求1中的方法,其中對凝膠上核酸條帶的檢測是通過熒光染色或銀染色來完成的。
5.根據(jù)權(quán)利要求1、2或4中任何一個的方法,其中該方法的運用是為了在被測個體之間檢測基因組DNA的多態(tài)性。
6.根據(jù)權(quán)利要求3中的方法,其中該方法的運用是為了在被測個體之間檢測基因組DNA的多態(tài)性。
7.根據(jù)權(quán)利要求5中的方法,其中核酸樣品是通過AFLP法擴增而得的DNA片段。
8.根據(jù)權(quán)利要求5中的方法,其中核酸樣品是異源雙鏈DNA分子。
9.一種用于制備包含多態(tài)性的DNA片段的方法,該方法包括從凝膠中分離那些根據(jù)權(quán)利要求5~8中的任何一種方法檢測的,具有多態(tài)性的DNA片段的步驟。
10.一種包含被測個體之間的多態(tài)性的DNA片段,該DNA片段是根據(jù)權(quán)利要求9中的方法分離得到的。
11.根據(jù)權(quán)利要求1~8中任何一個的方法,其中所述方法的使用是為了進行遺傳學分析。
12.根據(jù)權(quán)利要求11中的方法,其中的遺傳學分析是F2代分析、RI(重組自交)分析或QTL(量化性狀位點)分析。
13.根據(jù)權(quán)利要求1~8中任何一個的方法,該方法是用于構(gòu)建一種生物的遺傳圖譜。
14.生物的遺傳圖譜,該遺傳圖譜是通過利用包含多態(tài)性的基因組DNA的條帶作為標記而構(gòu)建的,該DNA條帶是根據(jù)權(quán)利要求13中的方法檢測到的。
15.一種從基因組DNA文庫中篩選克隆的方法,所篩選的克隆與通過權(quán)利要求1~8中任一方法在凝膠上檢測到的特定核酸條帶相對應,該方法包括以下步驟a)把特定生物的基因組DNA文庫分成多個亞文庫,每一個亞文庫的大小最多為該生物的1個基因組;b)給每一個亞文庫中的所有克隆分配屬于該亞文庫的一個行號、一個列號和一個板號,其中行、列和板分別是指X、Y和Z坐標。c)分別收集代表所有板中特定行的全部克隆(X坐標克隆組)、代表所有板中特定列的全部克隆(Y坐標克隆組)以及在一個亞文庫中特定板上的全部克隆(Z坐標克隆組),從收集的每一個克隆組中提取DNA作為坐標樣品,并從該生物中制備基因組DNA作為對照,通過利用權(quán)利要求1~4中任一方法進行電泳來檢測條帶,從而對比坐標樣品和對照組;d)在每一個X坐標克隆組、Y坐標克隆組和Z坐標克隆組中確定一個克隆,該克隆對應于凝膠上與對照中目的核酸具有相同遷移率的條帶。e)從該亞文庫中選出一個與已確定的三維坐標相對應的克隆。
16.根據(jù)權(quán)利要求15中的方法,其中該方法的使用是為了構(gòu)建能覆蓋特定生物全部基因組DNA的重疊群。
17.一套用于核酸電泳的電泳裝置,其中在該裝置上一次可安裝多個10~30平方厘米大小的凝膠板,而且利用該電泳裝置每塊凝膠板至少可使32個核酸樣品同時進行電泳。
全文摘要
這里發(fā)現(xiàn),采用一種使用小型凝膠的電泳裝置,使得有可能以明顯高于傳統(tǒng)方法的效率來檢測多態(tài)性條帶。還發(fā)現(xiàn)該方法適用于遺傳分析、生物系統(tǒng)的鑒定等等。
文檔編號G01N27/447GK1399721SQ00816256
公開日2003年2月26日 申請日期2000年9月22日 優(yōu)先權(quán)日1999年9月24日
發(fā)明者川崎信二, 小松田隆夫, 間野吉郎 申請人:獨立行政法人農(nóng)業(yè)生物資源研究所