亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

識(shí)別和使用上游開放閱讀框的新型方法與流程

文檔序號(hào):42041717發(fā)布日期:2025-05-30 17:40閱讀:16來源:國知局

本文涉及真核生物基因組中上游開放閱讀框的識(shí)別和利用。


背景技術(shù):

1、上游開放閱讀框(uorf)是一類短小保守orf的成員,其位于mrna的5’-非翻譯區(qū)(5’utr)蛋白質(zhì)編碼主要orf(morf)的上游。uorf充當(dāng)順式作用元件,可調(diào)節(jié)編碼多肽的下游序列的活性。因此,通過向uorf序列引入突變的基因編輯方法,它們?yōu)榛罨幋a感興趣多肽的下游開放閱讀框的表達(dá)提供了新的機(jī)會(huì)。因此,可以通過調(diào)節(jié)位于編碼多肽序列上游的負(fù)作用uorf的表達(dá)(例如,通過敲除或突變),從而實(shí)現(xiàn)靶標(biāo)多肽水平的上調(diào)。并非所有真核基因都含有uorf,迄今為止,上述方法的障礙在于識(shí)別uorf序列;由于這些元件的長度較短且通常經(jīng)由非aug起始密碼子啟動(dòng),現(xiàn)有算法通常無法準(zhǔn)確識(shí)別這些元件(hellens等,2016.trend?plant?sci.21:317-328)。本文提出了一種新型算法,通過分析所謂的核糖體概況數(shù)據(jù)來識(shí)別uorf的存在。然后靶uorf序列進(jìn)行遺傳修飾以產(chǎn)生新的所需表型,所述表型具有取決于具體細(xì)胞或生物體的多種應(yīng)用。此類應(yīng)用包括新的作物性狀(例如,產(chǎn)量增加、活力、抗脅迫耐受性、延遲或加速開花、形態(tài)改變或營養(yǎng)成分含量改良)、通過活化啟動(dòng)細(xì)胞死亡的基因網(wǎng)絡(luò)來控制雜草和其它害蟲、活化癌細(xì)胞中的細(xì)胞死亡或腫瘤抑制基因,和/或在發(fā)酵系統(tǒng)中產(chǎn)生所需的代謝物或肽。

2、uorf是真核mrna中普遍存在的調(diào)控元件。uorf位于mrna?5’-非翻譯區(qū)(5’utr)中蛋白質(zhì)編碼主要orf(也稱為長orf、主orf或morf)的上游。在一些情況下,認(rèn)為uorf能通過隔離核糖體來調(diào)節(jié)下游編碼序列(cds)的翻譯起始率。在其它情況下,uorf編碼演化保守的短肽(有時(shí)稱為“upeps”),所述短肽能充當(dāng)下游morf或其蛋白質(zhì)產(chǎn)物的順式阻遏肽。在許多情況下,uorf的實(shí)際存在在物種之間高度保守。因此,一旦在給定物種的靶標(biāo)基因座中識(shí)別出uorf,源自另一個(gè)物種的同源基因座通常也會(huì)含有uorf并受到uorf抑制。在此,我們應(yīng)用新型算法識(shí)別了源自模型植物擬南芥的一組含有uorf的基因座?,F(xiàn)在,這些數(shù)據(jù)提供了路線圖,可基于位于這些基因座處的morf編碼的多肽的同源性搜索,識(shí)別靶標(biāo)作物中含有uorf的基因座。因此,當(dāng)通過擬南芥(arabidopsis)的過表達(dá)基因識(shí)別出給定的所需性狀時(shí),若該基因座含有uorf,則能夠通過作物基因中uorf的突變以活化靶標(biāo)作物中的等效同源基因來獲得該所需性狀,該突變通常位于靶標(biāo)作物同源基因座中morf上游的類似位置。具體的實(shí)例是編輯lsggp2的uorf,lsggp2編碼生菜中維生素c生物合成的關(guān)鍵酶,該基因的靶向基于laing等證實(shí)其同源基因在擬南芥中受uorf控制(liang等,plant?cell.2015年3月;27(3):772–786)。編輯生菜同源物的uorf不僅提高了抗氧化脅迫耐受性,而且使抗壞血酸含量增加約150%(zhang等.nature?biotechnology第36卷,第894–898頁(2018)。

3、全基因組研究揭示了uorf在不同生物背景下的不同物種中具有廣泛的調(diào)控功能(zhang等.2019.trends?biochem.sci.44:782-794.doi:10.1016/j.tibs.2019.03.002)。給定的uorf能充當(dāng)翻譯控制元件,用于調(diào)控其相關(guān)下游主要開放閱讀框(morf)的表達(dá)。植物研究已證實(shí),高度保守的uorf響應(yīng)細(xì)胞代謝物水平對(duì)morf進(jìn)行翻譯調(diào)控(hayden?c.a.和jorgensen?r.a.2007.bmc?biol.5:32;tran?m.k.等.2008.bmc?genomics?9:361)。

4、已描述了各種用于識(shí)別真核生物的uorf的方法。例如,為了識(shí)別保守的肽uorf,hayden和jorgensen創(chuàng)建了perl程序“uorf-finder”,其將一個(gè)集合的cdna的morf氨基酸序列與另一個(gè)物種集合的morf序列進(jìn)行對(duì)比以識(shí)別推定morf同源物,然后對(duì)比兩個(gè)配對(duì)序列的5’utr中的uorf以識(shí)別具有保守氨基酸序列的uorf(hayden和jorgensen,2007.bmcbiology?5:32)。通過對(duì)比擬南芥和水稻的全長cdna序列,能識(shí)別保守肽uorf的不同同源組。skarshewski等描述了“upepperoni”的使用,其為用于上游開放閱讀框定位和轉(zhuǎn)錄本保守性分析的在線工具(skarshewski,a.,等.2014.bmc?bioinform.15:36.doi:10.1186/1471-2105-15-36)。

5、ingolia等并未使用基于生物信息學(xué)的分析,而是描述了用于核糖體概況的方法:通過評(píng)估上游開放閱讀框和其它序列的核糖體占有率來識(shí)別uorf。參見,例如us專利9,677,068;ingolia?n.t.,2014.cell?reports?8:5,1365–1379。另參見ingolian.t.2011.cell?11;147:789–802,其中作者描述了大多數(shù)推定lincrna如何包含與蛋白質(zhì)編碼基因相當(dāng)?shù)母叻g區(qū)域。特定起始位點(diǎn)以三尖杉酯堿(harringtonine)標(biāo)記,隨后是延伸至第一框內(nèi)終止密碼子的核糖體足跡(ribosome?footprints)。檢測到的大多數(shù)新型近同源起始位點(diǎn)驅(qū)動(dòng)uorf的翻譯。這與在許多5’utr上觀察到的高水平翻譯一致,而不同于3’utr,其幾乎無核糖體。

6、與先前描述的方法對(duì)比,本發(fā)明的新方法基于依據(jù)核糖體占有率在這些位置的驟降(即急劇下降)來明確劃分終止密碼子的能力來識(shí)別uorf,而不是識(shí)別起始密碼子,因?yàn)槠鹗济艽a子通常是非經(jīng)典的并且不易定義。

7、本發(fā)明涉及用于識(shí)別和表征真核生物(尤其是植物)中的uorf的方法和組合物,以及用于修飾uorf以產(chǎn)生所需性狀的方法。由此確定了生產(chǎn)具有商業(yè)價(jià)值的植物和作物的方法以及制造和使用它們的方法。

8、可以對(duì)用本方法識(shí)別和表征的uorf進(jìn)行修飾,以便生產(chǎn)具有改良性狀的植物,具體是滿足農(nóng)業(yè)、食品生產(chǎn)和材料生產(chǎn)需求以及環(huán)境修復(fù)和碳封存需求的性狀。這些性狀能提供重要價(jià)值,因?yàn)樗鼈冊(cè)试S植物在惡劣環(huán)境中茁壯成長,例如,溫度、水和營養(yǎng)利用率或鹽度可能會(huì)限制或阻止缺乏改良性狀的植物的生長。這些性狀還可以包括所需的形態(tài)改變,包括花期的改變、更大或更小的尺寸、抗病蟲害性、光響應(yīng)、生化組成的改變和其它所需的表型。具體地,隨著人們對(duì)在受控的室內(nèi)條件下生產(chǎn)作物的興趣日益濃厚,性狀(諸如花期延遲或更緊湊的結(jié)構(gòu))通常是人們所需的,尤其是在綠葉蔬菜中。

9、本發(fā)明還涉及用于消除作物或觀賞植物的栽培床或田地、草坪、運(yùn)動(dòng)場或市政環(huán)境中的不需要的植物(例如,雜草)的方法和組合物。

10、本發(fā)明的其它方面和實(shí)施方式如下所述,并且可以從本公開的整體教導(dǎo)中得出。


技術(shù)實(shí)現(xiàn)思路

1、本說明書涉及用于識(shí)別真核生物基因組內(nèi)調(diào)控區(qū)的新型方法,所述調(diào)控區(qū)包含一個(gè)或多個(gè)上游開放閱讀框(uorf),所述上游開放閱讀框位于編碼一個(gè)或多個(gè)多肽(包括調(diào)控多肽或轉(zhuǎn)錄因子)的一個(gè)或多個(gè)下游開放閱讀框的上游。一經(jīng)識(shí)別,即可通過基因編輯技術(shù)修飾uorf序列,以在細(xì)胞(即靶細(xì)胞)或生物體中誘導(dǎo)新的所需表型。

2、在一個(gè)實(shí)施方式中,本說明書涉及一種通過在核糖體概況數(shù)據(jù)上應(yīng)用算法以識(shí)別uorf的方法。與通過尋找經(jīng)典atg起始密碼子或甚至取代性起始密碼子(含或不含核糖體富集信息)來查找orf序列的傳統(tǒng)但通常不成功的方法不同,本算法和非傳統(tǒng)方法基于相同開放閱讀框內(nèi)從一個(gè)終止密碼子到下一個(gè)終止密碼子的間隔中存在核糖體富集來識(shí)別生物體基因組中uorf的存在。后一終止密碼子表示推定uorf的末端。所述后一終止密碼子上游的序列表示破壞uorf功能的基因編輯的潛在靶標(biāo)。一旦uorf功能被破壞,下游主orf的翻譯就會(huì)增加,并且由主orf編碼的多肽會(huì)在生物體或生物體的靶細(xì)胞中產(chǎn)生改良的性狀,即所需表型。

3、本方法通過應(yīng)用一種評(píng)估核糖體概況數(shù)據(jù)的算法來識(shí)別推定uorf,所述方法包括以下步驟:

4、a)識(shí)別生物體基因組中現(xiàn)有或推定的主開放閱讀框(orf),并獲取生物體基因組中的核糖體概況數(shù)據(jù)。orf的識(shí)別可通過原始研究(即從頭研究)或從現(xiàn)有的公共或私人知識(shí)中獲取功能性或推定功能性基因序列;

5、b)評(píng)估該orf上游的基因組中至少一個(gè)區(qū)域的核糖體占有率;

6、c)識(shí)別該orf上游的基因組位置,此處有核糖體富集且在該位置下游有核糖體占有率驟降;

7、d)由所述位置處核糖體占有率驟降的情形來識(shí)別基因組中的推定或?qū)嶋Huorf的終止密碼子;

8、e)識(shí)別推定uorf的終止密碼子上游且與之同框的先前或“第一”終止密碼子;以及

9、f)因此,該算法由從第一終止密碼子到相同開放閱讀框內(nèi)的推定uorf的終止密碼子的間隔內(nèi)的核糖體富集數(shù)據(jù)識(shí)別基因組中的推定uorf的存在。

10、本說明書還涉及在原生基因組的基因座處引入靶遺傳修飾的細(xì)胞、植物細(xì)胞、植物或其它生物體。原生基因組的基因座包含位于編碼具有細(xì)胞調(diào)控活性的多肽的基因的5’utr中的uorf突變。所述多肽包含與本技術(shù)的序列表中提供的多肽具有百分比同一性的氨基酸序列,其中所述百分比同一性為與本技術(shù)序列表中提供的多肽具有至少30%,或至少35%,或至少40%,或至少45%,或至少50%,或至少55%,或至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%,或至少99%,或約100%同一性。靶遺傳修飾提高了具有細(xì)胞調(diào)控活性的編碼多肽的表達(dá)水平和/或活性。

11、本說明書還涉及含有引入的靶遺傳修飾的作物、草皮、雜草或觀賞植物。引入的靶遺傳修飾包含非原生等位基因,該非原生等位基因進(jìn)一步包含位于編碼具有細(xì)胞調(diào)控活性的多肽的基因的5’utr中的uorf內(nèi)的突變。該多肽具有與本技術(shù)提供的序列表中所提供序列相同的氨基酸序列。序列表標(biāo)識(shí)了編碼受上游uorf控制的感興趣多肽的基因座,以及參考植物基因組(擬南芥)中uorf的識(shí)別位置和序列。靶標(biāo)作物中編碼同源多肽的morf上游的uorf的存在通常會(huì)被保留。與缺乏非原生等位基因的相同物種的參考或?qū)φ罩参飳?duì)比,遺傳修飾的植物表現(xiàn)出改良性狀。氨基酸序列與序列表中提供的序列具有至少30%或至少35%,或至少40%,或至少45%,或至少50%,或至少55%,或至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%,或至少99%,或約100%同一性。

12、本說明書還涉及一種在作物中產(chǎn)生改良性狀的方法,其包括向作物的基因組引入靶遺傳修飾。靶遺傳修飾產(chǎn)生基因的非原生等位基因,該基因進(jìn)一步包含編碼具有細(xì)胞調(diào)控活性的多肽的基因的5’utr中的uorf的突變。該多肽所具有的氨基酸序列與隨本說明書提交的序列表中所提供多肽具有百分比同一性。然后選擇作物的植物,并且所選植物含有非原生等位基因并且與缺乏非原生等位基因的相同物種的參考或?qū)φ罩参飳?duì)比表現(xiàn)出改良性狀。靶遺傳修飾調(diào)節(jié)具有轉(zhuǎn)錄調(diào)控活性的編碼多肽的表達(dá)水平和/或活性;并且百分比同一性為至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或約100%。

13、本說明書還涉及一種殺死植物細(xì)胞的方法,該方法涉及位于主orf的上游的uorf的突變,所述主orf編碼能觸發(fā)植物細(xì)胞死亡的壞死性誘導(dǎo)的多肽。在該方法中,植物的各部分與含有農(nóng)桿菌屬(agrobacterium)菌株細(xì)胞的懸浮液接觸,該農(nóng)桿菌屬菌株含有核酸構(gòu)建體。所述核酸構(gòu)建體還可以通過其它機(jī)制遞送至植物,包括被覆納米顆粒(諸如但不限于dna納米顆粒、碳納米管、碳化硅粉、磁轉(zhuǎn)染、肽納米顆粒和粘土納米片)。lv等2020,plantjournal,第104卷,880-891(doi.org/10.1111/tpj.14973)詳細(xì)介紹了遞送核酸構(gòu)建體到植物細(xì)胞的各種方法。所述核酸構(gòu)建體包含基因編輯系統(tǒng),所述系統(tǒng)在植物細(xì)胞中表達(dá)向?qū)na,所述向?qū)na在植物基因組中主orf上游的uorf中引入突變。

14、本說明書還涉及一種與植物(諸如雜草)接觸的除草組合物,其中所述植物的基因組包含編碼壞死誘導(dǎo)多肽的主orf,該多肽可觸發(fā)植物細(xì)胞的死亡。該除草組合物包含含有農(nóng)桿菌屬菌株細(xì)胞的懸浮液,該農(nóng)桿菌屬菌株含有包含基因編輯系統(tǒng)的核酸構(gòu)建體。所述基因編輯系統(tǒng)在靶標(biāo)雜草的細(xì)胞中表達(dá)向?qū)na,并且向?qū)na在植物或雜草基因組中主orf上游的uorf中引入突變。

15、本說明書還涉及一種基因修飾細(xì)胞,其包含通過基因編輯產(chǎn)生的非天然產(chǎn)生的多核苷酸。非天然產(chǎn)生的多核苷酸編碼一種多肽,與不包括非天然多核苷酸的對(duì)照微生物對(duì)比,該多肽導(dǎo)致靶標(biāo)分子或酶的產(chǎn)生水平增加。非天然產(chǎn)生的多核苷酸包含uorf中的突變,該uorf與編碼多肽的主orf位于相同轉(zhuǎn)錄本中。

16、本說明書還涉及一種控制癌細(xì)胞或腫瘤細(xì)胞的方法,所述方法包括使癌細(xì)胞或腫瘤細(xì)胞與含有核酸構(gòu)建體的遞送載體接觸,所述核酸構(gòu)建體包含在細(xì)胞中表達(dá)向?qū)na的基因編輯系統(tǒng),所述向?qū)na在所述細(xì)胞基因組中主orf上游的uorf中引入突變。主orf編碼觸發(fā)癌細(xì)胞或腫瘤細(xì)胞死亡或抑制其細(xì)胞分裂的多肽。

17、本說明書還涉及一種通過外源應(yīng)用由uorf編碼的短肽(所謂的“upep”)來改良植物性狀的方法。通過這此類方法,upep可用作生物刺激劑以增強(qiáng)作物的生長、產(chǎn)量、品質(zhì)、可收獲性和/或表現(xiàn)。

18、序列表和附圖簡要說明

19、序列表提供了本公開的示例性多核苷酸和多肽序列。序列表命名為uor-0002p_st25,創(chuàng)建于2022年5月27日,大小6,751,561字節(jié)。該序列表的全部內(nèi)容通過引用納入本文。

20、圖1至圖3顯示了核糖體概況和分析的圖示。黑線表示cdna序列長度上的核糖體覆蓋率。長orf(morf)是所述線上方的一條實(shí)心黑線,aug在覆蓋率=0處注釋為黑色三角形。所有核糖體概況比率(叉號(hào)(x))和核糖體概況差異(加號(hào)(+))均顯示在覆蓋率=0上方(并按比例縮放以適合最大核糖體概況計(jì)數(shù))。所有可能的aug密碼子均為覆蓋率=0處的黑色圓圈。終止-終止間隔>50在覆蓋率=0下方顯示為虛線、點(diǎn)線和點(diǎn)劃線水平線(表示三個(gè)閱讀框)(請(qǐng)注意,此處與長orf相對(duì)應(yīng)的長終止-終止是一條延伸至atg起始密碼子上游的虛線)。選擇具有統(tǒng)計(jì)學(xué)顯著性的比率(叉號(hào)(x))和/或差異(加號(hào)(+))的終止-終止片段在3’終止處進(jìn)行注釋。

21、圖4描繪了一種二元載體,其可通過農(nóng)桿菌屬或其它方法(諸如使用納米顆粒)遞送到植物細(xì)胞中。t-dna邊界所約束的基因包含基因編輯系統(tǒng),所述基因編輯系統(tǒng)將在植物細(xì)胞中表達(dá)以敲除或降低uorf的活性為目標(biāo)的向?qū)na(由注釋為“引導(dǎo)”的dna序列編碼),所述uorf具有抑制morf表達(dá)的原生作用,所述morf編碼導(dǎo)致感興趣性狀的多肽。轉(zhuǎn)化選擇通常編碼對(duì)除草劑或抗生素的抗性,這使得轉(zhuǎn)化的編輯細(xì)胞能夠被選擇并再生為整株植物。通過系統(tǒng)表達(dá),多肽在植物細(xì)胞中上調(diào),并獲得所需的性狀。在本發(fā)明的一個(gè)實(shí)施方式中,所討論的植物是雜草植物,并且t-dna不必定整合到宿主雜草基因組中,但基因編輯系統(tǒng)瞬時(shí)表達(dá)向?qū)na,所述向?qū)na敲除或降低能天然抑制引發(fā)細(xì)胞壞死的多肽的uorf活性。當(dāng)所述系統(tǒng)在靶標(biāo)雜草的細(xì)胞中被活化時(shí),會(huì)誘發(fā)壞死,雜草會(huì)被殺死或控制。

22、圖5和圖6顯示了所有擬南芥基因(其前導(dǎo)序列大于200個(gè)核苷酸和/或尾部序列長于200個(gè)核苷酸)在aug起始(圖5)和終止(圖6)密碼子兩側(cè)100個(gè)核苷酸處的相對(duì)核糖體概況覆蓋率(核糖體覆蓋率/rna-seq覆蓋率)。直方圖顯示了相對(duì)表達(dá)(核糖體覆蓋率/rna-seq覆蓋率)的計(jì)數(shù)位于相對(duì)于圖5中的aug起始密碼子(1=-70至-42,2=-41至-14,3=-13至14,4-15至42和5=43至70)和圖6中的終止密碼子(1=-70至-37,2=-36至-4,3=-3至14,4-15至42和5=43至70)的五個(gè)區(qū)域中。

23、圖7顯示了綠穗莧(amaranthus?hybridus)亞種(雜交)(雜交重疊群支架化到千穗谷):綠穗莧的修飾基因組重疊群支架化到千穗莧(amaranthus?hypochondriacus)的假染色體,為已完成(v1.0,id57429)版本?;疑硎救齻€(gè)閱讀框中各閱讀框的aug密碼子\(注意基因?yàn)榉聪蝽樞?,黑色柱表示三個(gè)閱讀框中各閱讀框的終止密碼子(uag、uaa和uga)(注意基因?yàn)榉聪蝽樞?。潛在的uorf由相同開放閱讀框中的兩個(gè)相鄰終止-終止間隔界定。通過這種方式,可以識(shí)別基因的推定uorf并作為基因編輯的候選對(duì)象進(jìn)行測試。

24、圖8說明了一種通過在轉(zhuǎn)錄本中包含uorf來抑制編碼蛋白質(zhì)的翻譯,從而優(yōu)化轉(zhuǎn)基因活性的方法。如果靶標(biāo)植物中已經(jīng)生成了轉(zhuǎn)基因事件,則可以通過基因編輯插入uorf?;蛘?,可以在轉(zhuǎn)化過程之前將uorf工程改造到轉(zhuǎn)化構(gòu)建體中。在后一種情況下,優(yōu)選在組裝轉(zhuǎn)化構(gòu)建體時(shí)將uorf引入待通過直接合成或連接過表達(dá)的轉(zhuǎn)基因的前導(dǎo)序列中。圖8中用斜體數(shù)字“1”表示的腳注1顯示了源自轉(zhuǎn)基因的mrna;引入的uorf抑制了morf的翻譯。圖8中用斜體數(shù)字“2”表示的腳注2顯示了有意引入此區(qū)域(通過基因編輯)的uorf,以通過減少編碼的mrna翻譯成蛋白質(zhì)來抑制轉(zhuǎn)基因的活性。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1