一種四倍體野生稻中涉及逆轉(zhuǎn)座子插入的直向同源基因驗證方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及分子生物學技術(shù)領(lǐng)域的基因結(jié)構(gòu)驗證方法,特別涉及一種通過引物優(yōu)化設計來驗證四倍體中直向同源基因是否涉及逆轉(zhuǎn)座子插入的方法。
【背景技術(shù)】
[0002]通過轉(zhuǎn)座子或逆轉(zhuǎn)座子活動形成新基因是生物基因組進化的重要方式之一。由于自主型轉(zhuǎn)座子或逆轉(zhuǎn)座子本身含有編碼區(qū),故而在基因組序列注釋中經(jīng)常出現(xiàn)注釋出來的基因與轉(zhuǎn)座子或逆轉(zhuǎn)座子相關(guān),如粳稻日本晴基因組中有30.26% (16941/55986)的注釋基因涉及到了轉(zhuǎn)座子或逆轉(zhuǎn)座子(http://rice, plantb1logy.msu.edu/);玉米基因組中有50%以上的基因其啟動子或轉(zhuǎn)錄區(qū)域涉及到轉(zhuǎn)座子或逆轉(zhuǎn)座子。
[0003]對于多倍體植物來說,同一物種內(nèi)不同亞基因組間直向同源基因?qū)撼蓡T之一如果涉及轉(zhuǎn)座子或逆轉(zhuǎn)座子則對其進行基因結(jié)構(gòu)驗證是十分困難的,因為直向同源基因?qū)Τ谵D(zhuǎn)座子或逆轉(zhuǎn)座子插入位點序列不一樣外,其余編碼區(qū)(CDS)部分的序列相似性是很高的。這就造成了涉及轉(zhuǎn)座子或逆轉(zhuǎn)座子插入的多倍體中直向同源基因結(jié)構(gòu)驗證的困難,目前還沒有發(fā)現(xiàn)相關(guān)簡便驗證方法的報道。
【發(fā)明內(nèi)容】
[0004]本發(fā)明通過特殊設計的引物及相應試驗實現(xiàn)了對一種四倍體野生稻中涉及逆轉(zhuǎn)座子插入的直向同源基因結(jié)構(gòu)的檢測與驗證。
[0005]直向同源基因中逆轉(zhuǎn)座子插入鑒定
在進行稻屬植物同源區(qū)研究中發(fā)現(xiàn)一種四倍體(基因組類型為(XDD)野生稻0.的注釋基因(編號為刀份^,位于DD亞組)的第三個內(nèi)含子中含有逆轉(zhuǎn)座子編碼的三個較大的外顯子(圖1,圖4 B),而位于CC亞組的其直向同源基因刀化7不含有這三個涉逆轉(zhuǎn)座子的外顯子(圖2,圖4 A)。重復序列注釋發(fā)現(xiàn)(圖1),該三個較大的外顯子序列與插入到此位置的一個逆轉(zhuǎn)座子序列重合。該逆轉(zhuǎn)座子的LTR長度為238bp,相似性為100% (圖3),插入位點特征重復序列(TSD)為CAAAC,另外還具有PBS、PLA等逆轉(zhuǎn)座子特征序列,包含LTR在內(nèi)的總長度為4481bp (從49248到53728)。序列比對結(jié)果表明,該逆轉(zhuǎn)座子編碼區(qū)序列與重復序列數(shù)據(jù)庫中的Tyl-copia-like類逆轉(zhuǎn)座子相似性顯著,但LTR沒有找到匹配序列。因此,插入刀從難]逆轉(zhuǎn)座子可能屬于Tyl-copia —類的目前尚未被報道過的新的逆轉(zhuǎn)座子,并且在進化上屬于近期插入的。由于逆轉(zhuǎn)座子具有編碼區(qū),因此,基因注釋軟件在進行DD亞組同源區(qū)序列注釋時將該逆轉(zhuǎn)座子的編碼區(qū)整合進刀基因了。
[0006]由逆轉(zhuǎn)座子活動造成基因組序列變異產(chǎn)生新基因是生物進化的重要驅(qū)動力。此處發(fā)現(xiàn)的涉逆轉(zhuǎn)座子插入的基因是否由上述機制產(chǎn)生的新基因?這一逆轉(zhuǎn)座子插入是否對該基因的轉(zhuǎn)錄造成影響?這些問題的解決都需要進行基因結(jié)構(gòu)檢測與驗證。
[0007]鑒定引物設計本發(fā)明通過考察該直向同源基因?qū)Φ男蛄斜葘Y(jié)果,根據(jù)PCR擴增的特點設計了比較高效的序列特異的專用引物。具體來說,引物設計是通過如下技術(shù)方案實現(xiàn)的:找到基因組型為(XDD的四倍體野生稻同源區(qū)中涉及逆轉(zhuǎn)座子插入的直向同源基因?qū)?J麻8—刀化7),進行序列比對(圖5),確定涉及逆轉(zhuǎn)座子編碼的外顯子(圖4 B,黑色向上箭頭所指三個較長的外顯子)。根據(jù)兩種假定進行引物設計。
[0008]假定1:刀從6確實是由逆轉(zhuǎn)座子活動而產(chǎn)生的融合有逆轉(zhuǎn)座子編碼區(qū)的新基因,引物設計可以按照圖4 B中粗線六角星、粗線五角星、粗線四角星所示位置進行,其產(chǎn)物大小分別為 311bp、807bp、1125bp。
[0009]假定2:刀劭猶基因結(jié)構(gòu)與CC亞組中的直向同源基因(J16J7)結(jié)構(gòu)相同,J16h8中的逆轉(zhuǎn)座子相關(guān)序列在轉(zhuǎn)錄加工過程中被拼接除去,因而該逆轉(zhuǎn)座子對宿主基因的轉(zhuǎn)錄沒有影響。這種情況下引物設計見圖5 (橫向箭頭的尾部標有相同星型的為一個引物對)、圖4 A (相應圖中橫向箭頭或數(shù)字下標有相同星型的為一個引物對),產(chǎn)物大小見圖4 C,分別為217bp (細線五角星)、183bp (細線六角星)、1011bp (細線四角星)。
[0010]由于該四倍體中兩個直向同源基因編碼區(qū)序列相似性高達97.8%,如何設計合理的引物使PCR反應只擴增目標的刀從盛因相關(guān)片段,而不擴增其直向同源基因(/^/7)是試驗成功與否的關(guān)鍵。相應引物設計的位置如上所述,引物序列見表1。
[0011]表1引物信息表
引物名稱引物序列產(chǎn)物大小bp
3ex-lin-807S GTCATCCCAGATAATACTGCATT 807 3ex-lin-807A GCCACCCTTCTTGGTGTTA 2ex-lin-1125S CGGGAAGAAAGTACAGACGTATT 1125 2ex-lin-1125A GAGCGAAGGCGGTATTGG 3 in-4ex-311S CACCACAAGCGAACGAAG311
3in-4ex-311A CTGACATACTCTCCACCTGATAG 3ex5-217SGTCATCCCAGATAATACTGCATT 217
3ex5-217ATTCGCAGAAAGGACACCA
lex3-183SCGTTAATTTTGTCATCCGT183
Iex3-183AAATGCAGTATTATCTGGGAT
5exl4-1011S CAAATGTGTGGTGTCCTTTC 1011 5exl4-1011A GGTATAGCGAGCGGTTTC 基因結(jié)構(gòu)驗證結(jié)果
四倍體野生稻0.alta (CXDD)的基因被一個長約4.5 kb的逆轉(zhuǎn)座子插入到第3個內(nèi)含子中(圖4 B)。為了檢驗長約4.5 kb的重復序列插入對該基因結(jié)構(gòu)與轉(zhuǎn)錄的影響,采用特殊設計的引物進行了 RT-PCR試驗。引物設計位置見圖5及圖4A、圖4 B,擴增結(jié)果見圖4 Co測序結(jié)果表明(圖6~圖8),該重復序列插入并沒有影響0.alta (CXDD)中基因的轉(zhuǎn)錄。0.alta (CXDD)中2個直向同源基因盡管其中一個被長約4.5 kb的逆轉(zhuǎn)座子插入但它們在基因轉(zhuǎn)錄水平上都是正常的,至于它們能否最終行使正常的基因功能,還需進一步深入研究。
[0012]
【附圖說明】
[0013]圖1是/化(上)與刀(下,DD亞組)直向同源基因外顯子-內(nèi)含子結(jié)構(gòu)比較; 圖1注:該圖由ACT (Artemis Comparison Tool)軟件展示,圖的上面是粳稻日本晴同源區(qū)的刀堪因區(qū)段,下面為四倍體(CXDD)野生稻0.alta的DD亞組中刀份?6基因區(qū)段;上下直向同源基因區(qū)段間用線連接的部分表示序列比對相似性在顯著水平以上(le-20,80%以上);圖中標尺刻度數(shù)據(jù)為兩個直向同源基因區(qū)段所在同源區(qū)的實際位置;標尺刻度的上下各三行表示DNA正義鏈、反義鏈各三個翻譯框,六個翻譯框中黑色的短豎線表示終止密碼子,位于不同翻譯框中的小方框表示外顯子,用折線鏈接,末端外顯子的小三角表示該基因的轉(zhuǎn)錄方向;與刀6同源基因區(qū)段相比DD亞組的同源區(qū)中插入了逆轉(zhuǎn)座子,該逆轉(zhuǎn)座子兩側(cè)的深色方框表示LTR,中間的方框表示逆轉(zhuǎn)座子除LTR外的中間部分。圖2說明除沒有逆轉(zhuǎn)座子外均同圖1。
[0014]圖2是/化(上)與J16j7 (下,CC亞組)直向同源基因外顯子_內(nèi)含子結(jié)構(gòu)比較; 圖3是插入J16h8 (DD亞組)基因第三內(nèi)含子中的逆轉(zhuǎn)座子的LTR序列比對;