亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

氨酰基-tRNA合成酶的組合物及其用途的制作方法

文檔序號:440720閱讀:2947來源:國知局
專利名稱:氨?;璽RNA合成酶的組合物及其用途的制作方法
技術(shù)領(lǐng)域
本發(fā)明屬于轉(zhuǎn)譯生物化學領(lǐng)域。本發(fā)明涉及用于生產(chǎn)氨?;?tRNA合成酶的組合物的方法和氨?;?tRNA合成酶的組合物及其用途。本發(fā)明也涉及使用所述氨?;?tRNA合成酶和相關(guān)組合物在細胞中生產(chǎn)蛋白質(zhì)的方法。
背景技術(shù)
從細菌到人類的每種已知生物體的遺傳密碼編碼相同的20種常見氨基酸。相同的20種天然氨基酸的不同組合形成蛋白質(zhì),所述蛋白質(zhì)實際上執(zhí)行從光合作用到信號轉(zhuǎn)導和免疫反應的生命的所有復雜過程。為了研究和修飾蛋白質(zhì)結(jié)構(gòu)和功能,科學家已嘗試操縱蛋白質(zhì)的遺傳密碼和氨基酸序列。然而,仍難以除去由遺傳密碼施加的約束,其使蛋白質(zhì)受限于20種遺傳編碼的標準構(gòu)造單元(building block)(硒代半胱氨酸(參見(例如)A.Bock等人,(1991),Molecular Microbiology5515-20)和吡咯賴氨酸(參見(例如)G.Srinivasan等人,(2002),Science2961459-62)為少有的例外)。
對于除去所述約束已經(jīng)取得了一些進展,盡管所述進展是有限的并且合理地控制蛋白質(zhì)結(jié)構(gòu)和功能的能力仍處于其初期。舉例而言,化學工作者已開發(fā)出合成和操縱小分子結(jié)構(gòu)的方法和策略(參見(例如)E.J.Corey和X.-M.Cheng,The Logic of ChemicalSynthesis(Wiley-Interscience,New York,1995))。全合成(參見(例如)B.Merrifield,(1986),Science232341-7(1986))和半合成方法(參見(例如)D.Y.Jackson等人,(1994)Science266243-7;和P.E.Dawson和S.B.Kent,(2000),Annual Review of Biochemistry69923-60),已使合成肽和小蛋白質(zhì)成為可能,但是所述方法對超過10千道爾頓(kDa)的蛋白質(zhì)來說,具有有限的實用性。雖然突變方法是有效的,但是其受限于有限數(shù)量的結(jié)構(gòu)變化。在許多情況下,已經(jīng)有可能在整個蛋白質(zhì)中競爭性地并入常見氨基酸的封閉結(jié)構(gòu)類似物。參見(例如),R.Furter,(1998),Protein Science7419-26;K.Kirshenbaum等人,(2002),ChemBioChem3235-7;和V.Doring等人,(2001),Science292501-4?;瘜W肽連接和天然化學連接描述于美國專利第6,184,344號、美國專利公開案第2004/0138412號、美國專利公開案第2003/0208046號、WO 02/098902和WO 03/042235中,所述專利是以引用的方式并入本文中。Lu等人在Mol Cell.2001年10月;8(4)759-69中描述了一種方法,其中蛋白質(zhì)與含有非天然氨基酸的合成肽化學連接(經(jīng)表達蛋白質(zhì)連接)。
早期的工作證明大腸桿菌(E.coli)的轉(zhuǎn)譯機器將容納結(jié)構(gòu)上與常見20種氨基酸相似的氨基酸。參見,Hortin,G.和Boime,I.(1983)Methods Enzymol.96777-784。所述工作另外通過放寬內(nèi)源性大腸桿菌合成酶的特異性,以便其活化非天然氨基酸以及其同源天然氨基酸而擴展。此外,展示了編輯域中的突變也可用以擴展內(nèi)源性合成酶的底物范疇。參見,Doring,V.等人,(2001)Science292501-504。然而,所述策略都受限于重新編碼遺傳密碼而不是擴展遺傳密碼,并且導致常見20種氨基酸中之一者經(jīng)非天然氨基酸不同程度地取代。
新近,展示了非天然氨基酸可通過將經(jīng)化學氨基酰化的正交琥珀抑制基因tRNA添加到活體外轉(zhuǎn)錄/轉(zhuǎn)譯反應中,而得以在活體外部位特異性地并入蛋白質(zhì)中。參見(例如),Noren,C.J.等人,(1989)Science244182-188;Bain,J.D.等人,(1989)J.Am.Chem.Soc.1118013-8014;Dougherty,D.A.(2000)Curr.Opin.Chem.Biol.4,645-652;Cornish,V.W.等人,(1995)Angew.Chem.,Int.Ed.34621-633;J.A.Ellman等人,(1992),Science255197-200;和D.Mendel等人,(1995),Annual Review of Biophysics and BiomolecularStructure24435-462。所述研究展示,核糖體和轉(zhuǎn)譯因子可與大量非天然氨基酸,甚至是具有異常結(jié)構(gòu)的所述非天然氨基酸相容。不幸地,tRNA的化學氨基酰化是困難的,并且所述工藝的化學計量性質(zhì)嚴重地限制可產(chǎn)生的蛋白質(zhì)的量。
已經(jīng)將非天然氨基酸微量注射到細胞中。舉例而言,非天然氨基酸通過微量注射經(jīng)化學錯誤酰化的嗜熱四膜蟲(Tetrahymena thermophila)tRNA(例如,M.E.Saks等人,(1996),An engineered Tetrahymena tRNAGln for in vivo incorporation of unnatural aminoacids into proteins by nonsense suppression,J.Biol.Chem.27123169-23175)和相關(guān)mRNA而引入爪蟾卵母細胞(Xenopus oocyte)中的煙堿酸乙酰膽堿受體中(例如,M.W.Nowak等人,(1998),In vivo incorporation of unnatural amino acids into ion channels inXenopus oocyte expression system,Method Enzymol.293504-529)。又參見,D.A.Dougherty(2000),Unnatural amino acids as probes of protein structure and function,Curr.Opin.Chem.Biol.4645-652和M.W.Nowak,P.C.Kearney,J.R.Sampson,M.E.Saks,C.G.Labarca,S.K.Silverman,W.G.Zhong,J.Thorson,J.N.Abelson,N.Davidson,P.G.Schultz,D.A.Dougherty和H.A.Lester,Science,268439(1995)。爪蟾卵母細胞與以下活體外制得的兩種RNA物質(zhì)共同注射編碼在所關(guān)注的氨基酸位置處具有UAG終止密碼子的目標蛋白質(zhì)的mRNA,和經(jīng)所要的非天然氨基酸氨基酰化的琥珀抑制基因tRNA。然后,卵母細胞的轉(zhuǎn)譯機器在規(guī)定的位置上通過UAG將非天然氨基酸插入。不幸地,所述方法受限于在細胞中可微量注射的蛋白質(zhì),并且因為相關(guān)的tRNA經(jīng)活體外化學?;⑶也荒茉脔;?,所以蛋白質(zhì)的產(chǎn)量極低。
為了克服所述限制,將例如正交tRNA、正交氨?;?tRNA合成酶及其對的新穎組分添加到原核生物大腸桿菌(Escherichia coli,E.coli)(參見(例如)L.Wang等人,(2001),Science292498-500)和真核生物釀酒酵母(Sacchromyces cerevisiae,S.cerevisiae)(例如,J.Chin等人,Science301964-7(2003))的蛋白質(zhì)生物合成機器中,其已使非遺傳編碼的氨基酸能活體內(nèi)并入蛋白質(zhì)中。使用所述方法,響應(例如)琥珀密碼子(TAG)已經(jīng)將具有新穎化學、物理或生物性質(zhì),包括光親和標記和可光致異構(gòu)氨基酸、光致交聯(lián)氨基酸(參見(例如),Chin,J.W.等人(2002)Proc.Natl.Acad.Sci.U.S.A.9911020-11024;和Chin,J.W.等人(2002)J.Am.Chem.Soc.1249026-9027)、酮氨基酸(參見(例如),Wang,L.等人,(2003)Proc.Natl.Acad.Sci.U.S.A.10056-61和Zhang,Z.等人,Biochem.42(22)6735-6746(2003))、含有重原子的氨基酸和經(jīng)糖基化的氨基酸的大量新穎氨基酸有效地且以高保真度并入大腸桿菌和酵母中的蛋白質(zhì)中。參見(例如),J.W.Chin和P.G.Schultz,(2002),ChemBioChem3(11)1135-1137;和L.Wang和P.G.Schultz,(2002),Chem.Comm,11-11。
已經(jīng)報道了若干其他的正交對。從釀酒酵母tRNA和合成酶得到的谷氨酰胺?;?參見(例如),Liu,D.R.和Schultz,P.G.(1999)Proc.Natl.Acad.Sci.U.S.A.964780-4785)、天冬氨?;?參見(例如),Pastrnak,M.等人,(2000)Helv.Chim.Acta832277-2286)和酪氨酰基(參見(例如),Ohno,S.等人,(1998)J.Biochem.(Tokyo.Jpn.)1241065-1068;和Kowal,A.K.等人,(2001)Proc.Natl.Acad.Sci.U.S.A.982268-2273)系統(tǒng)已經(jīng)被描述用于將非天然氨基酸潛在地并入大腸桿菌中。從大腸桿菌谷氨酰胺酰基(參見(例如),Kowal,A.K.等人,(2001)Proc.Natl.Acad.Sci.U.S.A.982268-2273)和酪氨?;?參見(例如),Edwards,H.和Schimmel,P.(1990)Mol.Cell.Biol.101633-1641)合成酶得到的系統(tǒng)已經(jīng)被描述適用于釀酒酵母。大腸桿菌酪氨酰基系統(tǒng)已經(jīng)用于將3-碘-L-酪氨酸活體內(nèi)并入哺乳動物細胞中。參見,Sakamoto,K.等人,(2002)Nucleic Acids Res.304692-4699。通常,所述系統(tǒng)利用琥珀終止密碼子。為進一步擴展遺傳密碼,需要開發(fā)生物合成機器的改善和/或其他組分,例如氨?;?tRNA合成酶。如基于以下揭示案的評述將明顯可見,本發(fā)明滿足所述的和其他的需要。

發(fā)明內(nèi)容
為了擴展遺傳密碼,本發(fā)明提供正交氨?;?tRNA合成酶的組合物和生產(chǎn)正交氨?;?tRNA合成酶的方法。本發(fā)明的氨?;?tRNA合成酶用非天然編碼的氨基酸氨基?;痶RNA。這些轉(zhuǎn)譯組分可用來響應由tRNA識別出的選擇密碼子(selector codon)而將所選氨基酸并入生長多肽鏈中的特定位置中(在核酸轉(zhuǎn)譯期間))。
在細胞中用所選氨基酸在規(guī)定位置生產(chǎn)蛋白質(zhì)的方法也是本發(fā)明的特征。舉例而言,方法包括在適當培養(yǎng)基中使細胞生長,其中所述細胞包含包括至少一個選擇密碼子并且編碼蛋白質(zhì)的核酸;和提供所選氨基酸。細胞另外包含在細胞中起作用并且識別選擇密碼子的正交tRNA(O-tRNA);和用所選氨基酸優(yōu)先氨基?;疧-tRNA的正交氨酰基-tRNA合成酶(O-RS)。通常,O-tRNA包含在同源合成酶的存在下抑制活性。由所述方法生產(chǎn)的蛋白質(zhì)也是本發(fā)明的特征。


圖1-展示具有TΨC莖突變部位的J17 tRNA的四葉式交叉(cloverleaf)結(jié)構(gòu)。
圖2-展示使用J17或J17突變體(F12、F13、F14)和E9 RS的人類生長激素的琥珀突變的抑制。各個樣品總細胞溶胞產(chǎn)物通過SDS PAGE來分析。
圖3-展示在不同細胞系中,使用F13和E9 RS的人類生長激素的琥珀突變的抑制。
具體實施例方式
定義在詳細地描述本發(fā)明之前,應了解,本發(fā)明不受限于具體的生物系統(tǒng),本發(fā)明當然可以變化。也應了解,本文中使用的術(shù)語僅是為了描述具體的實施例,并且不希望限制本發(fā)明的范疇,本發(fā)明的范疇將僅由附加權(quán)利要求書來限制。如本文中和附加權(quán)利要求書中所使用,除非上下文另外清楚地規(guī)定,否則單數(shù)形式“一”和“所述”包括復數(shù)個參考物。因此,舉例而言,提及“一種細胞”包括兩種或兩種以上細胞的組合并且包括所屬領(lǐng)域的技術(shù)人員已知的其等價物,等等。提及“細菌”包括細菌的混合物諸如此類。
除非在本文中和以下說明書的剩余部分中規(guī)定,否則本文中使用的所有技術(shù)和科學術(shù)語具有與本發(fā)明所屬領(lǐng)域的技術(shù)人員通常所了解的相同的含義。
本文中提及的所有公開案和專利是以引用的方式并入本文中,以達到描述和揭示(例如)公開案中描述的,可能與當前描述的發(fā)明聯(lián)系使用的構(gòu)筑體和方法的目的。所提供的本文中討論的公開案僅為在本專利申請案的申請日之前的其揭示案。在此并非解釋為允許本發(fā)明者由于先前發(fā)明或由于任何其他原因而比所述揭示案提前得到授權(quán)。
同源(Homologous)蛋白質(zhì)和/或蛋白質(zhì)序列,當其天然地或人工地從共同的原始蛋白質(zhì)或蛋白質(zhì)序列得到時,是“同源的”。同樣地,核酸和/或核酸序列,當其天然地或人工地從共同的原始核酸或核酸序列得到時,是同源的。舉例而言,任何天然存在的核酸可通過任何可用的突變方法修飾以包括一個或一個以上選擇密碼子。當被表達時,所述經(jīng)突變的核酸編碼包含一種或一種以上所選氨基酸(例如非天然氨基酸)的多肽。當然,突變處理可另外改變一個或一個以上標準密碼子,進而也改變所得突變蛋白質(zhì)中的一種或一種以上標準氨基酸。所述一種或一種以上標準氨基酸可以變成非天然氨基酸或天然氨基酸。同源性通常從兩種或兩種以上的核酸或蛋白質(zhì)(或其序列)之間的序列相似性來推斷。適用于建立同源性的序列之間相似性的精確百分比隨所討論的核酸和蛋白質(zhì)而變化,但僅僅25%的序列相似性通常用以建立同源性。例如30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或99%以上的高水平的序列相似性也可用以建立同源性。用于確定序列相似性百分比的方法(例如,使用缺省參數(shù)的BLASTP和BLASTN)描述于本文中并且通??捎谩?br> 正交如本文中所使用,術(shù)語“正交”指的是通過所關(guān)注的系統(tǒng)(例如轉(zhuǎn)譯系統(tǒng),例如細胞)以降低的效率使用的分子(例如正交tRNA(O-tRNA)和/或正交氨?;鵷RNA合成酶(O-RS))。正交指的是正交tRNA和/或正交RS在所關(guān)注的轉(zhuǎn)譯系統(tǒng)中不能起作用或效率降低,例如小于20%有效、小于10%有效、小于5%有效或例如小于1%有效。舉例而言,當與內(nèi)源性tRNA通過內(nèi)源性RS的氨基?;啾容^時,所關(guān)注的轉(zhuǎn)譯系統(tǒng)中的正交tRNA是通過所關(guān)注的轉(zhuǎn)譯系統(tǒng)的任何內(nèi)源性RS以降低或甚至為零的效率氨基?;?。在另一實例中,當與內(nèi)源性tRNA通過內(nèi)源性RS的氨基?;啾容^時,正交RS以降低或甚至為零的效率氨基?;P(guān)注的轉(zhuǎn)譯系統(tǒng)中的任何內(nèi)源性tRNA??蓪⑴c第一正交分子一同起作用的第二正交分子引入細胞中。舉例而言,正交tRNA/RS對包括所引入的互補組分,所述互補組分在細胞中以某一效率(例如,約50%效率、約60%效率、約70%效率、約75%效率、約80%效率、約85%效率、約90%效率、約95%效率或約99%或99%以上的效率)一同對對應的tRNA/RS內(nèi)源性對的組分起作用?!罢恍缘母纳啤敝傅氖桥c起始物質(zhì)或天然存在的tRNA或RS相比較正交性增強。
同源物術(shù)語“同源物”指的是一同起作用的組分,例如tRNA和氨?;?tRNA合成酶。所述組分也可稱為互補組分。
優(yōu)先氨基酰化術(shù)語“優(yōu)先氨基?;敝傅氖桥cO-RS氨基?;烊淮嬖诘膖RNA或用以產(chǎn)生O-tRNA的起始物質(zhì)的效率相比較,O-RS用例如非天然氨基酸的所選氨基酸氨基?;疧-tRNA的效率,例如約70%有效、約75%有效、約80%有效、約85%有效、約90%有效、約95%有效或約99%或99%以上有效。因而,非天然氨基酸以高保真度,(例如)以對給定選擇密碼子來說大于約70%的效率、對給定選擇密碼子來說大于約75%的效率、對給定選擇密碼子來說大于約80%的效率、對給定選擇密碼子來說大于約85%的效率、對給定選擇密碼子來說大于約90%的效率、對給定選擇密碼子來說大于約95%的效率或?qū)o定選擇密碼子來說大于約99%的效率,并入生長多肽鏈中。
選擇密碼子術(shù)語“選擇密碼子”指的是在轉(zhuǎn)譯過程中通過O-tRNA識別并且不通過內(nèi)源性tRNA識別的密碼子。O-tRNA反密碼子環(huán)識別mRNA上的選擇密碼子并且在多肽中的所述部位處并入其氨基酸,例如所選氨基酸,諸如非天然氨基酸。選擇密碼子可包括(但不限于)(例如)無義密碼子,諸如包括(但不限于)琥珀密碼子、赭石密碼子和蛋白石密碼子的終止密碼子;4或4個以上堿基密碼子;稀有密碼子;由天然或非天然堿基對得到的密碼子和/或類似物。對給定系統(tǒng)來說,選擇密碼子也可包括天然3堿基密碼子之一,其中內(nèi)源性系統(tǒng)不使用(或很少使用)所述天然3堿基密碼子。舉例而言,內(nèi)源性系統(tǒng)包括缺乏識別天然3堿基密碼子的tRNA的系統(tǒng)和/或其中天然3堿基密碼子為稀有密碼子的系統(tǒng)。
抑制基因tRNA抑制基因tRNA是在給定轉(zhuǎn)譯系統(tǒng)中,(例如)通過提供響應選擇密碼子而將氨基酸并入多肽鏈中的機制,來改變信使RNA(mRNA)的讀取的tRNA。舉例而言,抑制基因tRNA可讀遍包括(但不限于)終止密碼子、4堿基密碼子或稀有密碼子的密碼子。
抑制活性術(shù)語“抑制活性”指的是例如抑制基因tRNA的tRNA讀遍選擇密碼子的能力?;钚钥杀硎緸楫斉c對照物(例如缺乏同源物合成酶)相比時,所觀察到的活性的百分比。
轉(zhuǎn)譯系統(tǒng)術(shù)語“轉(zhuǎn)譯系統(tǒng)”指的是將天然存在的氨基酸并入生長多肽鏈(蛋白質(zhì))中所必需的組分。轉(zhuǎn)譯系統(tǒng)的組分可包括(例如)核糖體、tRNA、合成酶、mRNA,諸如此類??蓪⒈景l(fā)明的組分添加到活體外或活體內(nèi)轉(zhuǎn)譯系統(tǒng)中。轉(zhuǎn)譯系統(tǒng)的實例包括(但不限于)非真核細胞,例如細菌(諸如大腸桿菌);真核細胞,例如酵母細胞、哺乳動物細胞、植物細胞、藻類細胞、真菌細胞、昆蟲細胞;無細胞的轉(zhuǎn)譯系統(tǒng),例如細胞溶胞產(chǎn)物;和/或類似物。
轉(zhuǎn)譯系統(tǒng)可以是細胞的或無細胞的,并且可以是原核的或真核的。細胞轉(zhuǎn)譯系統(tǒng)包括(但不限于)全細胞制劑,諸如透性化細胞或細胞培養(yǎng)物,其中所要的核酸序列可轉(zhuǎn)錄成mRNA并且所述mRNA被轉(zhuǎn)譯。無細胞轉(zhuǎn)譯系統(tǒng)為市售的并且許多不同類型和系統(tǒng)是熟知的。無細胞系統(tǒng)的實例包括(但不限于)原核溶胞產(chǎn)物,諸如大腸桿菌溶胞產(chǎn)物;和真核溶胞產(chǎn)物,諸如小麥胚芽提取物、昆蟲細胞溶胞產(chǎn)物、兔網(wǎng)織紅細胞溶胞產(chǎn)物、兔卵母細胞溶胞產(chǎn)物和人類細胞溶胞產(chǎn)物。當所得蛋白質(zhì)經(jīng)糖基化、磷酸化或另外修飾時,真核提取物或溶胞產(chǎn)物可為優(yōu)選的,因為許多所述修飾僅在真核系統(tǒng)中為可能的。一些所述提取物和溶胞產(chǎn)物為市售的(Promega;Madison,Wis.;Stratagene;La Jolla,Calif;Amersham;Arlington Heights,I11.;GIBCO/BRL;Grand Island,N.Y.)。諸如含有微粒體膜的犬胰腺提取物的膜狀提取物也可用,其適用于轉(zhuǎn)譯分泌蛋白。
也可以使用重構(gòu)轉(zhuǎn)譯系統(tǒng)。經(jīng)純化的轉(zhuǎn)譯因子的混合物以及由諸如起始因子-1(IF-1)、IF-2、IF-3(α或β)、延伸因子T(EF-Tu)或末端因子的經(jīng)純化的轉(zhuǎn)譯因子補充的溶胞產(chǎn)物的組合或溶胞產(chǎn)物也已經(jīng)成功用以將mRNA轉(zhuǎn)譯成蛋白質(zhì)。無細胞系統(tǒng)也可以是偶聯(lián)的轉(zhuǎn)錄/轉(zhuǎn)譯系統(tǒng),其中將DNA引入系統(tǒng)中,轉(zhuǎn)錄成mRNA并且將mRNA如Current Protocols in Molecular Biology(F.M.Ausubel等編,Wiley Interscience,1993)中所述來轉(zhuǎn)譯,該文獻在此特別以引用的方式并入。在真核轉(zhuǎn)錄系統(tǒng)中轉(zhuǎn)錄的RNA可以呈異核RNA(hnRNA)或5′-末端帽(7-甲基鳥嘌呤核苷)和3′-末端多聚A有尾成熟mRNA形式,其可為某些轉(zhuǎn)譯系統(tǒng)中的優(yōu)點。舉例而言,加帽mRNA以高效率在網(wǎng)織紅細胞溶胞產(chǎn)物系統(tǒng)中被轉(zhuǎn)譯。
所選氨基酸術(shù)語“所選氨基酸”指的是任何所要的天然存在的氨基酸或非天然氨基酸。如本文中所使用,術(shù)語“非天然氨基酸”或“非天然編碼的氨基酸”指的是任何氨基酸、經(jīng)修飾的氨基酸和/或不為20種常見天然存在的氨基酸之一或硒代半胱氨酸或吡咯賴氨酸的氨基酸類似物。可以與術(shù)語“非天然編碼的氨基酸”和“非天然氨基酸”同義地使用的其他術(shù)語為“非天然的氨基酸”、“非天然存在的氨基酸”和其各種用連字號連接的和未用連字號連接的型式。術(shù)語“非天然編碼的氨基酸”也包括(但不限于)通過修飾(例如,后轉(zhuǎn)譯修飾)天然編碼的氨基酸(包括但不限于20種常見氨基酸或吡咯賴氨酸和硒代半胱氨酸)產(chǎn)生的氨基酸,但不為通過轉(zhuǎn)譯復合物而將其本身天然地并入生長多肽鏈的氨基酸。所述非天然存在的氨基酸的實例包括(但不限于)N-乙酰氨基葡萄糖基-L-絲氨酸、N-乙酰氨基葡萄糖基-L-蘇氨酸和O-磷酸化酪氨酸。
由...得到如本文中所使用,術(shù)語“由…得到”指的是從規(guī)定分子或生物體分離的組分或使用來自規(guī)定分子或生物體信息制得的組分。
正性選擇或篩選標記物如本文中所使用,術(shù)語“正性選擇或篩選標記物”指的是當存在時(例如)經(jīng)表達、經(jīng)活化等等時使得具有正性選擇標記物的細胞從不具有正性選擇標記物的細胞鑒別出的標記物。
負性選擇或篩選標記物如本文中所使用,術(shù)語“負性選擇或篩選標記物”指的是當存在時(例如)經(jīng)表達、經(jīng)活化等等時容許鑒別出不具有所要性質(zhì)的細胞(例如,當與具有所要性質(zhì)的細胞相比時)的標記物。
報告基因(Reporter)如本文中所使用,術(shù)語“報告基因”指的是可用以選擇所關(guān)注系統(tǒng)的目標組分的組分。舉例而言,報告基因可包括蛋白質(zhì),例如給與抗生素抗性或敏感性的酶(包括(但不限于)β-內(nèi)酰胺酶、氯霉素乙酰轉(zhuǎn)移酶(CAT),諸如此類)、熒光篩選標記物(包括(但不限于)綠色熒光蛋白質(zhì)(例如GFP)、YFP、EGFP、RFP)、發(fā)光標記物(包括(但不限于)螢火蟲熒光素酶蛋白質(zhì))、基于親和力的篩選標記物;或正性或負性可選擇標記物基因,諸如lacZ、β-gal/lacZ(β-半乳糖苷酶)、ADH(醇脫氫酶)、his3、ura3、leu2、lys2等等。
真核生物如本文中所使用,術(shù)語“真核生物”指的是屬于真核種系發(fā)生域(phylogenetic domain Eucarya)的生物體,諸如動物(包括(但不限于)哺乳動物、昆蟲、爬蟲、鳥等),纖毛蟲,植物(包括(但不限于)單子葉植物、雙子葉植物、藻類等),真菌,酵母,鞭毛蟲,微粒子蟲目,原生生物等。
非真核生物如本文中所使用,術(shù)語“非真核生物”指的是非真核生物體。舉例而言,非真核生物體可屬于真細菌類(Eubacteria)(包括(但不限于)大腸桿菌、嗜熱細菌(Thermus thermophilics)、嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus)、熒光極毛桿菌(Pseudomonas fluorescens)、綠膿桿菌(Pseudomonas aeruginosa)、惡息極毛桿菌(Pseudomona sputida)等)種系發(fā)生域,或原生類(Archaea)(例如,詹氏甲烷球菌(Methanococcus jannaschii)、橫川病毒(Methanobacterium thermoautotrophicum)、諸如富饒鹽菌(Haloferax volcanii)和鹽桿菌種(Halobacterium species)NRC-1的鹽桿菌屬(Halobacterium)、閃爍古生球菌(Archaeoglobus fulgidus)、火球菌(Pyrococcus furiosus)、掘越氏熱球菌(Pyrococcus horikoshii)、嗜熱菌敏捷氣熱菌(Aeuropyrum pernix)等)種系發(fā)生域。
保守變體術(shù)語“保守變體”指的是例如保守變體O-tRNA或保守變體O-RS的轉(zhuǎn)譯組分,所述轉(zhuǎn)譯組分如例如O-tRNA或O-RS的組分(保守變體以其為基礎(chǔ))一樣執(zhí)行功能,但在序列中具有變化。舉例而言,盡管O-tRNA和保守變體O-tRNA不具有相同序列,但是O-RS將用例如非天然氨基酸的所選氨基酸氨基?;パa的O-tRNA或保守變體O-tRNA。同樣地,盡管O-RS和保守變體O-RS不具有相同序列,但是tRNA將通過互補的O-RS或保守變體O-RS,經(jīng)例如非天然氨基酸的所選氨基酸氨基?;V灰J刈凅w與對應的O-tRNA或O-RS互補,保守變體就可在序列中具有(例如)1種變化、2種變化、3種變化、4種變化或5種或5種以上的變化。
選擇或篩選劑如本文中所使用,術(shù)語“選擇或篩選劑”指的是當存在時,允許從群體中選擇/篩選某些組分的試劑。舉例而言,選擇或篩選劑包括(但不限于)(例如)營養(yǎng)素、抗生素、光的波長、抗體、經(jīng)表達的多核苷酸等等。選擇劑可(例如)因濃度、強度等而變化。
術(shù)語“未有效地識別出”指的是來自一種生物體的RS氨基?;疧-tRNA的例如小于約10%、小于約5%或小于約1%的效率。
具體實施方式
適于制造包括一種或一種以上例如非天然氨基酸的所選氨基酸的蛋白質(zhì)的轉(zhuǎn)譯系統(tǒng),描述于標題為“METHODS AND COMPOSITION FOR THE PRODUCTION OFORTHOGONAL tRNA-AMINOACYL tRNA SYNTHETASE PAIRS”的美國專利申請案10/126,931和標題為“IN VIVO INCORPORATION OF UNNATURALAMINO ACIDS”的美國專利申請案10/126,927中。另外,參見標題為“EXPANDING THE EUKARYOTICGENETIC CODE”USSN 10/825,867。每一所述申請案都以引用的方式全部并入本文中。所述轉(zhuǎn)譯系統(tǒng)通常包含,包括正交tRNA(O-tRNA)、正交氨?;鵷RNA合成酶(O-RS)和例如非天然氨基酸的所選氨基酸的細胞,其中O-RS用所選氨基酸氨基?;疧-tRNA。本發(fā)明的正交對包含O-tRNA(例如抑制基因tRNA、移碼tRNA等等)和O-RS。O-tRNA識別第一選擇密碼子并且在同源合成酶的存在下響應選擇密碼子而具有抑制活性。細胞使用所述組分將所選氨基酸并入生長多肽鏈中。舉例而言,包含編碼所關(guān)注的多肽的多核苷酸的核酸也可存在,其中多核苷酸包含通過O-tRNA識別出的選擇密碼子。轉(zhuǎn)譯系統(tǒng)也可為活體外系統(tǒng)。本發(fā)明的RS分子適用于包括在轉(zhuǎn)譯中利用核糖體的系統(tǒng)中的任何轉(zhuǎn)譯系統(tǒng)。
轉(zhuǎn)譯系統(tǒng)也可以是無細胞(活體外)轉(zhuǎn)譯系統(tǒng)。在可包括mRNA作為模板(活體外轉(zhuǎn)譯)或者DNA作為模板(經(jīng)組合的活體外轉(zhuǎn)錄和轉(zhuǎn)譯)的所述系統(tǒng)中,活體外合成通過核糖體引導。已經(jīng)對開發(fā)無細胞蛋白質(zhì)表達系統(tǒng)進行了相當大的努力。參見(例如),Kim,D.M.和J.R.Swartz,Biotechnology and Bioengineering,74309-316(2001);Kim,D.M.和J.R.Swartz,Biotechnology Letters,22,1537-1542,(2000);Kim,D.M.和J.R.Swartz,Biotechnology Progress,16,385-390,(2000);Kim,D.M.和J.R.Swartz,Biotechnology andBioengineering,66,180-188,(1999);和Patnaik,R.和J.R.Swartz,Biotechniques 24,862-868,(1998);美國專利第6,337,191號;美國專利公開案第2002/0081660號;WO00/55353;WO 90/05785,所述文獻是以引用的方式并入本文中。可以應用的另一種方法包括mRNA-肽融合技術(shù)。參見(例如),R.Roberts和J.Szostak,Proc.Natl Acad.Sci.(USA)9412297-12302(1997);A.Frankel等人,Chemistry&Biology 101043-1050(2003)。在所述方法中,與嘌呤霉素連接的mRNA模板在核糖體上被轉(zhuǎn)譯成肽。如果已經(jīng)修飾一個或一個以上tRNA分子,那么也可將非天然氨基酸并入肽中。在已經(jīng)閱讀末尾mRNA密碼子后,嘌呤霉素俘獲肽的C-末端。如果在活體外檢定中發(fā)現(xiàn)所得mRNA-肽結(jié)合物具有所關(guān)注的性質(zhì),那么其同一性可容易地從mRNA序列展現(xiàn)。這樣,所屬領(lǐng)域的技術(shù)人員可以篩選包含一種或一種以上非天然編碼的氨基酸的多肽的庫,以鑒別具有所要性質(zhì)的多肽。近期,已經(jīng)報道用經(jīng)純化的組分的活體外核糖體轉(zhuǎn)譯允許合成經(jīng)非天然編碼的氨基酸取代的肽。參見(例如)A.Forster等人,Proc.Natl Acad.Sci.(USA)1006353(2003)。
在某些實施例中,包含本發(fā)明的RS的大腸桿菌細胞包括所述轉(zhuǎn)譯系統(tǒng)。舉例而言,本發(fā)明的大腸桿菌細胞包括正交tRNA(O-tRNA),其中O-tRNA包含在同源合成酶存在下響應選擇密碼子的抑制活性;正交氨?;?tRNA合成酶(O-RS);所選氨基酸;和包含編碼所關(guān)注的多肽的多核苷酸的核酸,其中多核苷酸包含由O-tRNA識別的選擇密碼子。
本發(fā)明也提供在容許并入一種以上所選氨基酸的細胞中的多個O-tRNA/O-RS對。在某些實施例中,細胞可另外包括其他不同的O-tRNA/O-RS對和第二所選氨基酸,其中O-tRNA識別第二選擇密碼子并且O-RS用第二所選氨基酸優(yōu)先氨基酰化O-tRNA。舉例而言,細胞可另外包含(例如)由詹氏甲烷球菌的酪氨?;鵷RNA合成酶得到的琥珀抑制基因tRNA-氨?;鵷RNA合成酶對。
O-tRNA和/或O-RS可為天然存在的或可通過來自各種生物體的天然存在的tRNA和/或RS的突變而得到,例如所述突變產(chǎn)生tRNA的庫和/或RS的庫。舉例而言,一種生產(chǎn)正交tRNA/氨?;?tRNA合成酶對的策略涉及將來自(例如)不同于宿主細胞的來源或多個來源的異源性tRNA/合成酶對引進宿主細胞中。異源性合成酶候選者的性質(zhì)包括,(例如)其不裝填任何宿主細胞tRNA,并且異源性tRNA候選者的性質(zhì)包括,(例如)其不通過任何宿主細胞合成酶而氨基酰化。另外,異源性tRNA與所有宿主細胞合成酶正交。
用于產(chǎn)生正交對的第二種策略涉及產(chǎn)生從其篩選和/或選擇O-tRNA或O-RS的突變體庫。所述策略也可組合。
在各種實施例中,O-tRNA和O-RS是由至少一種生物體得到。在另一個實施例中,O-tRNA是由來自第一生物體的天然存在的或經(jīng)突變的天然存在的tRNA得到,并且O-RS是由來自第二生物體的天然存在的或經(jīng)突變的天然存在的RS得到。在一個實施例中,第一生物體和第二生物體是不同的。舉例而言,正交對可以包括由橫川病毒得到的tRNA合成酶和由古細菌tRNA(例如來自鹽桿菌種NRC-1)得到的tRNA。或者,第一生物體和第二生物體是相同的。為補充信息,參見本文中標題為“來源和宿主生物體”的部分。
在本發(fā)明的某些實施例中,本發(fā)明的O-RS包含如SEQ ID NO4中所述的多核苷酸序列或其互補多核苷酸序列或其保守變化,或通過如SEQ ID NO4中所述的多核苷酸序列或其互補多核苷酸序列或其保守變化來編碼。在某些實施例中,O-RS包含如SEQ IDNO5中所述的氨基酸序列。又參見本文中標題為“核酸和多肽序列和變體”的部分。
正交tRNA(O-tRNA)正交tRNA(O-tRNA)介導將所選氨基酸(例如)活體內(nèi)或活體外并入蛋白質(zhì)中,所述蛋白質(zhì)通過包含由O-tRNA識別的選擇密碼子的多核苷酸來編碼。O-tRNA可以通過包括(但不限于)化學氨基?;蛎复侔被;娜魏畏椒ɑ蚣夹g(shù)用所要氨基酸來氨基?;=?jīng)氨基?;腛-tRNA可以被直接地添加到轉(zhuǎn)譯系統(tǒng)中。O-tRNA可以通過本發(fā)明的RS用所選氨基酸活體外或活體內(nèi)氨基?;A硗?,RS可為O-RS。O-tRNA可直接地或通過提供編碼O-tRNA或其部分的多核苷酸而提供到轉(zhuǎn)譯系統(tǒng)(例如,活體外轉(zhuǎn)譯組分或細胞)中。舉例而言,O-tRNA或其部分通過如SEQ ID NO1、SEQ ID NO2、SEQ ID NO3中所述的多核苷酸序列或其互補多核苷酸序列或其保守變化來編碼。O-RS可直接地(例如SEQ ID NO5或SEQ ID NO17或其保守變化)或通過提供編碼O-RS或其部分的多核苷酸而提供到轉(zhuǎn)譯系統(tǒng)(例如,活體外轉(zhuǎn)譯組分或細胞)中。舉例而言,O-RS或其部分通過如SEQ ID NO4中所述的多核苷酸序列、編碼氨基酸序列SEQ IDNO17的多核苷酸序列或其互補多核苷酸序列或其保守變化來編碼。
本發(fā)明的O-tRNA包含在同源合成酶存在下響應選擇密碼子的抑制活性。抑制活性可通過所屬領(lǐng)域中已知的多種檢定中的任何一種來測定。舉例而言,可使用β-半乳糖苷酶報告基因檢定。(例如)在lacZ的肽VVLQRRDWEN的Leu-25經(jīng)例如TAG、TGA、AGGA等密碼子的選擇密碼子或酪氨酸、絲氨酸、白氨酸等的有義密碼子(作為對照)置換時,使用在啟動子控制下表達lacZ基因的質(zhì)粒的衍生物。將經(jīng)衍生的lacZ質(zhì)粒連同包含本發(fā)明的O-tRNA的質(zhì)粒一起引入來自適當生物體(例如,其中可使用正交組分的生物體)的細胞中。也可引入同源合成酶(作為多肽或者當被表達時編碼同源合成酶的多核苷酸)。使細胞在培養(yǎng)基中生長到所要密度,例如生長到OD600為約0.5,并且(例如)使用BetaFluorTMβ-半乳糖苷酶檢定試劑盒(Novagen)執(zhí)行β-半乳糖苷酶檢定。抑制百分比是按樣本相對于例如從經(jīng)衍生的lacZ構(gòu)筑體觀察到的值的可比較對照物的活性的百分比來計算,其中構(gòu)筑體在所要位置具有對應的有義密碼子而不是選擇密碼子。
適用于本發(fā)明的O-tRNA的實例是揭示于美國專利申請案10/126,931、10/126,927和10/825,867中的O-tRNA分子的任何一種分子。在tRNA分子中,胸苷嘧啶(T)經(jīng)尿嘧啶(U)置換。另外,可存在對堿基的其他修飾。本發(fā)明也包括O-tRNA的保守變化。舉例而言,O-tRNA的保守變化包括如O-tRNA一樣起作用并且維持tRNAL-形結(jié)構(gòu),但不具有相同序列(并且不同于野生型tRNA分子)的分子。又參見本文中標題為“核酸和多肽序列和變體”的部分。
包含O-tRNA的組合物可另外包括正交氨酰基-tRNA合成酶(O-RS),其中O-RS用所選氨基酸(例如非天然氨基酸)優(yōu)先氨基酰化O-tRNA。在某些實施例中,包括O-tRNA的組合物可另外包括轉(zhuǎn)譯系統(tǒng)(例如,活體外或活體內(nèi)轉(zhuǎn)譯系統(tǒng))。包含編碼所關(guān)注的多肽的多核苷酸的核酸也可存在于細胞或其他轉(zhuǎn)譯系統(tǒng)中,其中所述多核苷酸包含一個或一個以上由O-tRNA識別的選擇密碼子,或所述選擇密碼子的一個或一個以上的組合。又參見,本文中標題為“正交氨?;?tRNA合成酶(O-RS)”的部分。
生產(chǎn)例如O-tRNA的正交tRNA(O-tRNA)的方法也是本發(fā)明的特征。通過所述方法生產(chǎn)的例如O-tRNA的tRNA也是本發(fā)明的特征。
生產(chǎn)正交tRNA的方法包括使tRNA的集合中的每一tRNA的反密碼子環(huán)突變以容許識別選擇密碼子(例如,琥珀密碼子、蛋白石密碼子、4堿基密碼子等),進而提供多個可能的O-tRNA;且分析多個可能的O-tRNA的成員的二級結(jié)構(gòu)以鑒別二級結(jié)構(gòu)中的非規(guī)范堿基對;且視需要使非規(guī)范堿基對突變(例如,使非規(guī)范堿基對突變成規(guī)范堿基對)。非規(guī)范堿基對可位于二級結(jié)構(gòu)的莖區(qū)。O-tRNA可以具有一種或一種以上特征或活性的改善,諸如與例如多個tRNA序列的起始物質(zhì)相比,所要生物體的正交性的改善,同時保持其對所要RS的親和力。
或者,O-tRNA可以通過使已知tRNA突變來發(fā)展以調(diào)節(jié)其與一種或一種以上影響轉(zhuǎn)譯或為轉(zhuǎn)譯機器的組分的分子的相互作用或?qū)λ龇肿拥慕Y(jié)合親和力。所述組分包括(但不限于)延伸因子。細菌延伸因子EF-Tu在蛋白質(zhì)合成的延伸步驟中起關(guān)鍵作用。在tRNA通過tRNA合成酶氨基?;?,EF-Tu結(jié)合經(jīng)氨基?;膖RNA并且將其帶到核糖體的A部位。由于EF-Tu與經(jīng)氨基?;膖RNA之間的結(jié)合,經(jīng)裝填的氨基酸與tRNA之間的酯鍵受自發(fā)水解作用的保護。Stortchevoi等人研究了在TΨC莖中的大腸桿菌起始tRNAfMetU50:G64擺動堿基對的突變體,因為發(fā)現(xiàn)所述堿基對為阻斷延伸中的tRNA活性的第二負性決定子,估計可能由于EF-Tu.GTP與經(jīng)氨基?;膖RNA之間減弱的相互作用(JBC 2003 278(20)17672-17679)。同樣,LaRiviere等人在Science 2001年10月5日;294(5540)165-8中描述了氨基酸和tRNA體對與EF-Tu的總結(jié)合親和力的熱力學貢獻。他們指出,tRNA體和氨基酸的貢獻彼此獨立并且當tRNA經(jīng)正確?;瘯r,其相互補充。對EF-Tu.GTP與經(jīng)非天然氨基酸氨基?;膖RNA之間相互作用的改變可以影響將tRNA加載到核糖體的A部位的效率??赡艿耐蛔儾课灰部梢酝ㄟ^分析tRNA與諸如EF-Tu的轉(zhuǎn)譯機器的其他組分之間的復合體的晶體結(jié)構(gòu)而發(fā)現(xiàn)。舉例而言,Nissen等人已指出,EF-Tu.GTP與酵母苯丙氨酰基-轉(zhuǎn)移RNA(Phe-tRNA)的TΨC莖的磷酸酯骨架直接結(jié)合(Science 1995 270(5241)1464-1472)。
所述方法視需要包括分析tRNA和/或氨?;?tRNA合成酶的序列同源性,以確定似乎對特定生物體來說為正交的O-tRNA、O-RS和/或其對的可能候選者??墒褂盟鶎兕I(lǐng)域中已知的和本文中描述的計算機程序進行分析。在一個實例中,為選擇適用于原核生物體的可能的正交轉(zhuǎn)譯組分,選擇對原核生物體不顯示異常同源性的合成酶和/或tRNA。
tRNA的集合也可通過一致的策略生產(chǎn)。舉例而言,tRNA的集合是通過比對多個tRNA序列;確定一致序列;和使用至少一部分、大部分或全部一致序列產(chǎn)生tRNA的庫而生產(chǎn)。舉例而言,一致序列可用例如GCG程序堆積(GCG program pileup)的計算機程序來編輯。視需要,將通過所述程序確定的簡并位置(degenerate position)變成在所述位置處最常見的堿基。庫通過所屬領(lǐng)域中已知的技術(shù)使用一致序列合成。舉例而言,寡核苷酸的重疊延伸作用(其中tRNA基因的各部位可被合成為90%一致序列和10%其他3個堿基的混合物的摻雜混合物)可用以提供基于一致序列的庫。也可使用其他混合物,例如75%一致序列和25%其他3個堿基的混合物、80%一致序列和20%其他3個堿基的混合物、95%一致序列和5%其他3個堿基的混合物等。
突變tRNA的庫可使用所屬領(lǐng)域中已知的各種突變技術(shù)產(chǎn)生。舉例而言,突變tRNA可通過部位特異性突變、隨機點突變、同源重組、DNA滑移或其他遞歸突變方法、嵌合建構(gòu)或其任何組合產(chǎn)生。
其他突變可在例如反密碼子環(huán)、接納莖(acceptor stem)、D臂或環(huán)、可變環(huán)、TΨC臂或環(huán)的tRNA的所要環(huán)或區(qū)域、tRNA分子的其他區(qū)域或其組合中的例如非保守位置或保守位置、隨機化位置或其組合的特定位置上引入。突變可以包括在莖區(qū)中的匹配堿基對。
通常,O-tRNA通過使第一物種的細胞群體經(jīng)受負性選擇而獲得,其中細胞包含多個可能的O-tRNA的成員。負性選擇消除包含多個可能的O-tRNA的成員的細胞,所述O-tRNA通過對細胞來說為內(nèi)源性的氨酰基-tRNA合成酶(RS)氨基?;?。所述負性選擇提供與第一物種的細胞正交的tRNA的集合。
在負性選擇的某些實施例中,將選擇密碼子引入多核苷酸中,所述多核苷酸編碼負性選擇標記物,例如給與抗生素抗性的酶,例如β-內(nèi)酰胺酶;給與可檢測產(chǎn)物的酶,例如β半乳糖苷酶;氯霉素乙酰轉(zhuǎn)移酶(CAT),例如在非基本位置處的毒性產(chǎn)物,諸如barnase;等。篩選/選擇可通過在選擇劑(例如,抗生素,諸如氨芐青霉素(ampicillin))存在下,使細胞群體生長來進行。在一個實施例中,選擇劑的濃度是變化的。
舉例而言,為測量抑制基因tRNA的活性,使用基于例如無義密碼子的選擇密碼子的活體內(nèi)抑制,或引入編碼例如β-內(nèi)酰胺酶(bla)的基因的負性選擇標記物的多核苷酸中的移碼突變的選擇系統(tǒng)。舉例而言,建構(gòu)在某個位置上具有(例如)TAG、AGGA和TGA的多核苷酸變體,例如bla變體。例如細菌的細胞經(jīng)所述多核苷酸轉(zhuǎn)形。在不能通過內(nèi)源性大腸桿菌合成酶有效地裝填的正交tRNA的情況下,例如氨芐青霉素抗性的抗生素抗性應約為或小于不經(jīng)質(zhì)粒轉(zhuǎn)形的細菌的抗生素抗性。如果tRNA是非正交的,或如果能夠裝填tRNA的異源性合成酶在系統(tǒng)中被共表達,那么觀察到高水平的例如氨芐青霉素的抗生素的抗性。選擇在抗生素濃度約等于不經(jīng)質(zhì)粒轉(zhuǎn)形的細胞的LB瓊脂培養(yǎng)盤上不能生長的細胞,例如細菌。
在毒性產(chǎn)物(例如核糖核酸酶barnase)的情況下,當多個可能的tRNA的成員通過例如大腸桿菌合成酶的內(nèi)源性宿主氨基?;?也就是說,其不與例如大腸桿菌合成酶的宿主正交)時,選擇密碼子被抑制并且所產(chǎn)生的毒性多核苷酸產(chǎn)物導致細胞死亡。懷有正交tRNA或無功能的tRNA的細胞存活。
在一個實施例中,隨后使與所要生物體正交的tRNA的集合經(jīng)受正性選擇,其中將選擇密碼子放置在(例如)通過諸如β-內(nèi)酰胺酶基因的耐藥性基因編碼的正性選擇標記物中。正性選擇是在包含編碼或包含tRNA的集合的成員的多核苷酸、編碼正性選擇標記物的多核苷酸和編碼同源RS的多核苷酸的細胞上執(zhí)行。所述多核苷酸在細胞中表達并且細胞在例如氨芐青霉素的選擇劑存在下生長。然后,就響應所述選擇密碼子tRNA通過共表達的同源合成酶氨基?;哪芰筒迦氚被岬哪芰磉x擇tRNA。通常,與懷有無功能的tRNA或不能由所關(guān)注的合成酶有效識別出的tRNA的細胞相比,所述細胞展示抑制效率的增強。懷有無功能tRNA或通過所關(guān)注的合成酶不有效識別出的tRNA的細胞對抗生素敏感。因此,(i)不為內(nèi)源性宿主(例如大腸桿菌)合成酶的底物;(ii)可通過所關(guān)注的合成酶氨基酰化;和(iii)在轉(zhuǎn)譯中起作用的tRNA在兩種選擇中存活。
上述方法中選擇(例如正性選擇、負性選擇或正性和負性選擇)的嚴格性視需要可以變化。舉例而言,因為barnase是極具毒性的蛋白質(zhì),所以負性選擇的嚴格性可通過將不同數(shù)量的選擇密碼子引入barnase基因中和/或通過使用誘導型啟動子而控制。在另一個實例中,選擇或篩選劑(例如氨芐青霉素)的濃度是變化的。在一個方面中,因為在早期循環(huán)期間,所要活性可為低的,所以嚴格性是變化的。因此,在早期循環(huán)中應用較低嚴格性的選擇準則并且在選擇的后期循環(huán)中應用更嚴格的準則。在某些實施例中,負性選擇、正性選擇或負性和正性選擇可重復多次。可使用多種不同的負性選擇標記物、正性選擇標記物或負性和正性選擇標記物。在某些實施例中,正性和負性選擇標記物可為相同的。
其他類型的選擇/篩選可用于本發(fā)明以生產(chǎn)例如O-tRNA、O-RS和O-tRNA/O-RS對的正交轉(zhuǎn)譯組分。舉例而言,負性選擇標記物、正性選擇標記物或正性和負性選擇標記物可包括發(fā)熒光或在適合的反應物存在下催化發(fā)光反應的標記物。在另一個實施例中,標記物的產(chǎn)物通過熒光活化細胞揀選(FACS)或通過發(fā)光來檢測。視需要,標記物包括基于親和力的篩選標記物。參見,F(xiàn)rancisco,J.A.等人,(1993)Production andfluorescence-activated cell sorting of Escherichia coli expressing a functional antibodyfragment onthe external surface.Proc Natl Acad Sci U S A.9010444-8。
生產(chǎn)重組正交tRNA的其他方法可見于(例如)標題為“Methods and Compositionsfor the Production of Orthogonal tRNA-Aminoacyl tRNA Synthetase Pairs”的美國專利申請案10/126,931和標題為“In vivo Incorporation of Unnatural Amino Acids”的美國專利申請案10/126,127,和標題為“EXPANDING THE EUKARYOTIC GENETIC CODE”的USSN10/825,867中。又參見Forster等人,(2003)Programming peptidomimetic synthetases bytranslating genetic codes designed de novoPNAS100(11)6353-6357;和Feng等人,(2003),Expanding tRNA recognition of a tRNA synthetase fy a single amino acid change,PNAS100(10)5676-5681。
tRNA可以通過包括(但不限于)化學氨基?;蛎复侔被;娜魏畏椒ɑ蚣夹g(shù)用所要氨基酸氨基?;?。
氨基酰化可以通過氨?;鵷RNA合成酶或通過包括(但不限于)核糖酶的其他酶促分子完成。術(shù)語“核糖酶”可與“催化性RNA”互換。Cech和同事(Cech,1987,Science,2361532-1539;McCorkle等人,1987,Concepts Biochem.64221-226)證明可擔當催化劑(核糖酶)的天然存在的RNA的存在。然而,盡管已經(jīng)展示所述天然RNA觸媒僅對用于裂解和剪接的核糖核酸底物起作用,但是核糖酶的人工進化的近期發(fā)展已經(jīng)將催化作用的清單擴展到各種化學反應。研究已經(jīng)鑒別可在其自身(2′)3′-末端上催化氨?;?RNA鍵的RNA分子(Illangakekare等人,1995 Science 267643-647)和可將氨基酸從一個RNA分子轉(zhuǎn)移到另一個RNA分子的RNA分子(Lohse等人,1996,Nature381442-444)。
以引用的方式并入本文中的美國專利申請公開案2003/0228593,描述建構(gòu)核糖酶的方法和其在用天然編碼的和非天然編碼的氨基酸氨基?;痶RNA中的用途。包括(但不限于)核糖酶的可氨基?;痶RNA的酶促分子的底物固定形式,可以使經(jīng)氨基酰化的產(chǎn)物能夠有效親和力純化。適合底物的實例包括瓊脂糖、瓊脂糖凝膠和磁性珠粒。用于氨基?;暮颂敲傅牡孜锕潭ㄐ问降纳a(chǎn)和用途描述于Chemistry and Biology 2003,101077-1084和美國專利申請公開案2003/0228593中,其都以引用的方式并入本文中。
化學氨基酰化方法包括(但不限于)由Hecht和同事(Hecht,S.M.Acc.Chem.Res.1992,25,545;Heckler,T.G.;Roesser,J.R.;Xu,C.;Chang,P.;Hecht,S.M.Biochemistry1988,27,7254;Hecht,S.M.;Alford,B.L.;Kuroda,Y.;Kitano,S.J.Biol.Chem.1978,253,4517)和由Schultz、Chamberlin、Dougherty和其他人(Cornish,V.W.;Mendel,D.;Schultz,P.G.Angew.Chem.Iht.Ed.Engl.1995,34,621;Robertson,S.A.;Ellman,J.A.;Schultz,P.G.J.Am.Chem.Soc.1991,113,2722;Noren,C.J.;Anthony-Cahill,S.J.;Griffith,M.C.;Schultz,P.G.Science 1989,244,182;Bain,J.D.;Glabe,C.G.;Dix,T.A.;Chamberlin,A.R.J.Am.Chem.Soc.1989,111,8013;Bain,J.D.等人Nature 1992,356,537;Gallivan,J.P.;Lester,H.A.;Dougherty,D.A.Chem.Biol.1997,4,740;Turcatti等人,J.Biol.Chem.1996,271,19991;Nowak,M.W.等人,Science,1995,268,439;Saks,M.E.等人J.Biol.Chem.1996,271,23169;Hohsaka,T.等人J.Am.Chem.Soc.1999,121,34)所介紹的避免在氨基?;惺褂煤铣擅傅姆椒?。所述方法或其他化學氨基酰化方法可用以氨基?;痶RNA分子。
使用經(jīng)化學修飾的氨?;?tRNA的生物合成方法已經(jīng)用以將若干生物物理學探針活體外并入所合成的蛋白質(zhì)中。參見以下公開案和其中引用的參考文獻Brunner,J.NewPhotolabeling and crosslinking methods,Annu.Rev Biochem,62483-514(1993);和Krieg,U.C.,Walter,P.,Hohnson,A.E.Photocrosslinking of the signal sequence of nascentpreprolactin of the 54-kilodalton polypeptide of the signal recognition particle,Proc.Natl.Acad.Sci.83(22)8604-8608(1986)。
以前,已經(jīng)展示,非天然氨基酸可通過將經(jīng)化學氨基?;囊种苹騮RNA添加到用含有所要琥珀無義突變的基因程式化的蛋白質(zhì)合成反應中而在部位特異地活體外并入蛋白質(zhì)中。使用所述方法,所屬領(lǐng)域的技術(shù)人員可用封閉結(jié)構(gòu)的同源物取代大量常見的20種氨基酸,例如,氟苯丙氨酸取代苯丙氨酸,使用營養(yǎng)缺陷菌株取代具體的氨基酸。參見(例如),Noren,C.J.,Anthony-Cahill,Griffith,M.C.,Schultz,P.G.A general methodfor site-specific incorporation of unnatural amino acids into proteins,Science,244182-188(1989);M.W.Nowak等人,Science268439-42(1995);Bain,J.D.,Glabe,C.G.,Dix,T.A.,Chamberlin,A.R.,Diala,E.S.Biosynthetic site-specific Incorporation of a non-naturalamino acid into a polypeptide,J.Am Chem Soc,1118013-8014(1989);N.Budisa等人,F(xiàn)ASEB J.1341-51(1999);Ellman,J.A.,Mendel,D.,Anthony-Cahill,S.,Noren,C.J.,Schultz,P.G.Biosynthetic method for introducing unnatural amino acids site-specifically intoproteins.Methods in Enz.,第202卷,301-336(1992);和Mendel,D.,Cornish,V.W.和Schultz,P.G.Site-Directed Mutagenesis with an Expanded Genetic Code,Annu Rev Biophys.Biomol Struct.24,435-62(1995)。
舉例而言,制備識別終止密碼子UAG的抑制基因tRNA并且用非天然氨基酸將其化學氨基?;T用的定位突變用以在蛋白質(zhì)基因中的所關(guān)注的部位引入終止密碼子TAG。參見(例如),Sayers,J.R.,Schmidt,W.Eckstein,F(xiàn).5′-3′Exonucleases inphosphorothioate-based olignoucleotide-directed mutagensis,Nucleic Acids Res,16(3)791-802(1988)。當經(jīng)?;囊种苹騮RNA和突變基因在活體外轉(zhuǎn)錄/轉(zhuǎn)譯系統(tǒng)中組合時,響應UAG密碼子將非天然氨基酸并入,得到在規(guī)定位置上含有那個氨基酸的蛋白質(zhì)。使用[3H]-Phe的實驗和用α-羧酸的實驗證明,僅僅所要氨基酸在規(guī)定的位置上通過UAG密碼子并入,并且所述氨基酸未在蛋白質(zhì)中的任何其他部位并入。參見(例如),Noren等人,同上;Kobayashi等人,(2003)Nature Structural Biology 10(6)425-432;和Ellman,J.A.,Mendel,D.,Schultz,P.G. Site-specific incorporation of novel backbonestructures into proteins,Science,255(5041)197-200(1992)。
用于產(chǎn)生催化性RNA的方法可以涉及產(chǎn)生隨機化的核糖酶序列的分離池、對池執(zhí)行定位進化、為所需氨基?;钚远Y選池和選擇顯示所要氨基?;钚缘乃龊颂敲傅男蛄小?br> 核糖酶可包含有利于?;钚缘幕?或區(qū)域,諸如GGU基元和U富集區(qū)域。舉例而言,已經(jīng)報道U富集區(qū)域可促進氨基酸底物的識別,并且GGU-基元可與tRNA的3′末端形成堿基對。在組合時,GGU和基元和U富集區(qū)域同時促進氨基酸和tRNA的同時識別,并且進而促進tRNA的3′末端的氨基?;?。
核糖酶可通過使用與tRNAAsnCCCG結(jié)合的部分隨機化的r24mini進行活體外選擇,接著通過見于活性無性系中的一致序列的系統(tǒng)工程化而產(chǎn)生。通過所述方法獲得的示范性核糖酶被稱為“Fx3核糖酶”并且描述于美國公開申請案第2003/0228593號中,所述專利的內(nèi)容是以引用的方式并入本文中,所述核糖酶擔當多用途催化劑用于合成經(jīng)同源非天然氨基酸裝填的各種氨?;?tRNA。
底物上的固定可用以促成經(jīng)氨基?;膖RNA的有效親和力純化。適合的底物的實例包括(但不限于)瓊脂糖、瓊脂糖凝膠和磁性珠粒。核糖酶可通過利用RNA的化學結(jié)構(gòu)固定于樹脂上,諸如RNA的核糖上的3′-順式二醇可經(jīng)高碘酸鹽氧化以產(chǎn)生對應的二醛以促進RNA在樹脂上的固定??墒褂冒畠r酰肼樹脂的各種類型的樹脂,其中還原性胺化作用使樹脂與核糖酶之間的相互作用成為不可逆的鍵。氨酰基-tRNA的合成可通過所述管柱上氨基?;夹g(shù)而顯著地促進。Kourouklis等人Methods 2005;36239-4描述基于管柱的氨基?;到y(tǒng)。
經(jīng)氨基?;膖RNA的分離可以各種方式完成。一種適合的方法是,從具有諸如含有10mM EDTA的乙酸鈉溶液的緩沖液、含有50mM N-(2-羥乙基)哌嗪-N′-(3-丙烷磺酸)、pH7.0的12.5mM KCl、10mM EDTA的緩沖液或僅為經(jīng)EDTA緩沖的水(pH7.0)的管柱洗提經(jīng)氨基酰化的tRNA。
可將經(jīng)氨基酰化的tRNA添加到轉(zhuǎn)譯反應中,以便并入氨基酸,在通過轉(zhuǎn)譯反應制得的多肽中的特別位置上,tRNA被所述氨基酸氨基酰化。可以使用經(jīng)氨基?;膖RNA的轉(zhuǎn)譯系統(tǒng)的實例,包括(但不限于)細胞溶胞產(chǎn)物。細胞溶胞產(chǎn)物提供為從輸入mRNA活體外轉(zhuǎn)譯多肽所必需的反應組分。所述反應組分的實例包括(但不限于)核糖體蛋白、rRNA、氨基酸、tRNA、GTP、ATP、轉(zhuǎn)譯起始因子和延伸因子和與轉(zhuǎn)譯相關(guān)的其他因子。另外,轉(zhuǎn)譯系統(tǒng)可以是分批轉(zhuǎn)譯或隔開轉(zhuǎn)譯。分批轉(zhuǎn)譯系統(tǒng)在單一隔室中組合反應組分,而隔開轉(zhuǎn)譯系統(tǒng)使轉(zhuǎn)譯反應組分與可抑制轉(zhuǎn)譯效率的反應產(chǎn)物分離。所述轉(zhuǎn)譯系統(tǒng)是市售的。
另外,可以使用偶合轉(zhuǎn)錄/轉(zhuǎn)譯系統(tǒng)。偶合轉(zhuǎn)錄/轉(zhuǎn)譯系統(tǒng)允許將輸入的DNA轉(zhuǎn)錄成對應的mRNA,而mRNA又被反應組分轉(zhuǎn)譯。市售偶合轉(zhuǎn)錄/轉(zhuǎn)譯的實例是RapidTranslation System(RTS,Roche Inc.)。系統(tǒng)包括含有用于提供諸如核糖體的轉(zhuǎn)譯組分的大腸桿菌溶胞產(chǎn)物和轉(zhuǎn)譯因子的混合物。另外,包括RNA聚合酶用于將輸入DNA轉(zhuǎn)錄成適用于轉(zhuǎn)譯的mRNA模板。RTS可通過插入反應隔室(包括供應/消耗隔室和轉(zhuǎn)錄/轉(zhuǎn)譯隔室)之間的膜使反應組分隔開。
tRNA的氨基?;梢酝ㄟ^包括(但不限于)移轉(zhuǎn)酶、聚合酶、催化性抗體、多官能蛋白質(zhì),諸如此類的其他試劑執(zhí)行。
正交氨?;?tRNA合成酶(O-RS)
本發(fā)明的O-RS優(yōu)先地用所選氨基酸在活體外或活體內(nèi)氨基酰化O-tRNA。本發(fā)明的O-RS可通過包括O-RS的多肽和/或通過編碼O-RS或其部分的多核苷酸而提供到轉(zhuǎn)譯系統(tǒng)(例如,活體外轉(zhuǎn)譯組分或細胞)中。舉例而言,O-RS或其部分通過如SEQ IDNO.4中所述的多核苷酸序列或其互補多核苷酸序列或其保守變化編碼。本發(fā)明的O-RS可以氨基?;罅坎煌腛-tRNA分子,包括(但不限于)本文中揭示的所述O-tRNA分子。
用于鑒別供O-tRNA(例如O-tRNA)使用的正交氨?;?tRNA合成酶(O-RS)(例如O-RS)的方法也是本發(fā)明的特征。舉例而言,方法包括使第一物種的細胞群體經(jīng)受正性選擇,其中所述細胞各自包含1)多個氨?;?tRNA合成酶(RS)的成員,其中多個RS包含突變體RS、由不同于第一物種的物種得到的RS或突變體RS和由不同于第一物種的物種得到的RS兩者;2)來自第二物種的正交tRNA(O-tRNA);和3)編碼正性選擇標記物并且包含至少一個選擇密碼子的多核苷酸。對于與缺乏多個RS的成員或具有降低量的多個RS的成員的細胞相比,展示抑制效率增強的所述細胞來選擇或篩選細胞。具有抑制效率增強的細胞包含氨基酰化O-tRNA的活性RS。將來自第一物種的第一組tRNA的通過活性RS氨基?;?活體外或活體內(nèi))的水平,與來自第二物種的第二組tRNA的通過活性RS氨基酰化(活體外或活體內(nèi))的水平相比較。氨基酰化的水平可通過可檢測物質(zhì)(例如,經(jīng)標記的氨基酸或非天然氨基酸)測定。選擇與第一組tRNA相比,更有效地氨基酰化第二組tRNA的活性RS,進而提供供O-tRNA使用的正交氨酰基-tRNA合成酶。通過所述方法鑒別的例如O-RS的O-RS也是本發(fā)明的特征。
可使用大量檢定中的任何檢定來測定氨基?;?。所述檢定可在活體外或活體內(nèi)執(zhí)行。舉例而言,活體外氨基?;瘷z定描述于(例如)Hoben,P.和Soil,D.(1985)MethodsEnzymol.11355-59和美國專利申請公開案第2003/0228593號中。氨基?;部赏ㄟ^使用報告基因以及正交轉(zhuǎn)譯組分,并且檢測在細胞中表達包含至少一個編碼蛋白質(zhì)的選擇密碼子的多核苷酸的報告基因而測定。又參見,標題為“IN VIVO INCORPORATION OFUNNATURAL AMINO ACIDS”的美國專利申請案10/126,927和標題為“EXPANDINGTHE EUKARYOTIC GENETIC CODE”的USSN 10/825,867。
經(jīng)鑒別的O-RS可另外經(jīng)操縱以改變合成酶的底物特異性以便僅所要非天然氨基酸,而不是常見20種氨基酸的任何氨基酸被裝填到O-tRNA中。產(chǎn)生對非天然氨基酸具有底物特異性的正交氨?;鵷RNA合成酶的方法包括,使合成酶(例如)在合成酶中的活性部位、在合成酶中的編輯機制部位、在通過組合合成酶的不同域的不同部位等處突變,和應用選擇處理。使用基于正性選擇接著負性選擇的組合的策略。在正性選擇中,在正性標記物的非基本位置引入的選擇密碼子的抑制作用使細胞在正性選擇壓力下存活。在天然氨基酸和非天然氨基酸存在下,存活者因此編碼用天然氨基酸或非天然氨基酸裝填正交抑制基因tRNA的活性合成酶。在負性選擇中,在負性標記物的非基本位置引入的選擇密碼子的抑制作用除去具有天然氨基酸特異性的合成酶。負性和正性選擇的存活者編碼僅用非天然氨基酸氨基?;?裝填)正交抑制基因tRNA的合成酶。所述合成酶可隨后經(jīng)受例如DNA滑移或其他遞歸突變方法的其他突變。
突變體O-RS的庫可使用所屬領(lǐng)域中已知的各種突變技術(shù)產(chǎn)生。舉例而言,突變體RS可通過部位特異性突變、隨機點突變、同源重組、DNA滑移或其他遞歸突變方法、嵌合建構(gòu)或其任何組合產(chǎn)生。舉例而言,突變體RS的庫可由兩個或兩個以上的其他(例如更小、較少變化)的“子庫”產(chǎn)生。RS的嵌合庫也包括在本發(fā)明中。應注意,來自各種生物體(例如,諸如真細菌或太古細菌的微生物)的tRNA合成酶的庫,諸如包含天然多樣性的庫(參見(例如),Short等人的美國專利第6,238,884號;Schallenberger等人的美國專利第5,756,316號;Petersen等人的美國專利第5,783,431號;Thompson等人的美國專利第5,824,485號;Short等人的美國專利第5,958,672號)視需要經(jīng)建構(gòu)且對于正交對篩選。
一旦合成酶經(jīng)受正性和負性選擇/篩選策略,所述合成酶就可隨后經(jīng)受進一步突變。舉例而言,可分離編碼O-RS的核酸;可由所述核酸產(chǎn)生一組編碼經(jīng)突變的O-RS(例如,通過隨機突變、部位特異性突變、重組或其任何組合)的多核苷酸;并且,可重復所述單獨步驟或所述步驟的組合直到獲得用非天然氨基酸優(yōu)先氨基酰化O-tRNA的經(jīng)突變的O-RS。在本發(fā)明的一個方面中,將所述步驟執(zhí)行多次,例如至少2次。
其他水平的選擇/篩選嚴格性也可用于本發(fā)明的方法中,以生產(chǎn)O-tRNA、O-RS或其對。選擇或篩選嚴格性可在用以生產(chǎn)O-RS的方法的一個或兩個步驟中變化。其可包括(例如)改變所使用的選擇/篩選劑的量等。也可執(zhí)行正性和/或負性選擇的其他循環(huán)。選擇或篩選也可包含一次或多次包括(例如)氨基酸通透性的改變、轉(zhuǎn)譯效率的改變、轉(zhuǎn)譯保真度的改變等的正性或負性選擇或篩選。通常,所述一種或一種以上改變是基于其中使用正交tRNA-tRNA合成酶對來生產(chǎn)蛋白質(zhì)的生物體中的一個或一個以上基因的突變。
其他類型的選擇可用于本發(fā)明中,以用于(例如)O-RS、O-tRNA和O-tRNA/O-RS對。正性選擇標記物可為包括(但不限于)為生長提供營養(yǎng)補充的產(chǎn)物的各種分子中的任何分子,并且選擇是在缺乏營養(yǎng)補充的培養(yǎng)基上執(zhí)行。編碼正性選擇標記物的多核苷酸的實例包括(但不限于)(例如)基于補充細胞的營養(yǎng)缺陷氨基酸的報告基因、his3基因(例如,其中通過提供3-氨基三唑(3-AT)所檢測,his3基因編碼咪唑磷酸甘油脫水酶)、ura3基因、leu2基因、lys2基因、lacZ基因、adh基因等。參見(例如),G.M.Kishore和D.M.Shah,(1988),Amino acid biosynthesis inhibitors as herbicides,AnnualReview of Biochemistry 57627-663。在一個實施例中,lacZ生產(chǎn)是通過鄰硝基苯基-β-D-吡喃半乳糖苷(ONPG)水解作用檢測。參見(例如),I.G.Serebriiskii和E.A.Golemis,(2000),Uses of lacZ to study gene functionevaluation of beta-galactosidase assaysemployed in the yeast two-hybrid system,Analytical Biochemistry 2851-15。其他正性選擇標記物包括(例如)熒光素酶、綠色熒光蛋白質(zhì)(GFP)、YFP、EGFP、RFP、抗生素抗性基因的產(chǎn)物(例如,氯霉素乙酰轉(zhuǎn)移酶(CAT))、轉(zhuǎn)錄調(diào)節(jié)劑蛋白質(zhì)(例如GAL4)等。視需要,編碼正性選擇標記物的多核苷酸包含選擇密碼子。
編碼正性選擇標記物的多核苷酸可操作性地與反應元素連接。也可存在編碼調(diào)節(jié)從反應元素的轉(zhuǎn)錄并且包含至少一個選擇密碼子的轉(zhuǎn)錄調(diào)節(jié)劑蛋白質(zhì)的其他多核苷酸。通過經(jīng)非天然氨基酸氨基?;腛-tRNA將非天然氨基酸并入轉(zhuǎn)錄調(diào)節(jié)劑蛋白質(zhì)中,產(chǎn)生編碼正性選擇標記物的多核苷酸(例如報告基因)的轉(zhuǎn)錄。視需要,選擇密碼子位于或大體上靠近編碼轉(zhuǎn)錄調(diào)節(jié)劑蛋白質(zhì)的DNA結(jié)合域的多核苷酸的一部分。
編碼負性選擇標記物的多核苷酸也可操作性地與反應元素連接,從所述反應元素的轉(zhuǎn)錄是通過轉(zhuǎn)錄調(diào)節(jié)劑蛋白質(zhì)介導。參見(例如),A.J.DeMaggio等人,(2000),The yeastsplit-hybrid system,Method Enzymol.328128-137;H.M.Shih等人,(1996),A positivegenetic selection for disrupting protein-protein interactionsidentification of CREBmutations that prevent association with the coactivator CBP,Proc.Natl.Acad.Sci.U.S.A.9313896-13901;M.Vidal等人,(1996),Genetic characterization of a mammalianprotein-protein interaction domain by using a yeast reverse two-hybrid system,Proc.Natl.Acad.Sci.U.S.A.9310321-10326;和M.Vidal等人,(1996),Reverse two-hybrid andone-hybrid systems to detect dissociation of protein-protein and DNA-protein interactions(Proc.Natl.Acad.Sci.U.S.A.9310315-10320)。通過經(jīng)天然氨基酸氨基?;腛-tRNA將天然氨基酸并入轉(zhuǎn)錄調(diào)節(jié)劑蛋白質(zhì)中,產(chǎn)生負性選擇標記物的轉(zhuǎn)錄。視需要,負性選擇標記物包含選擇密碼子。本發(fā)明的正性選擇標記物和/或負性選擇標記物可包含至少兩個選擇密碼子,其各自或兩者可包含至少兩個不同的選擇密碼子或至少兩個相同的選擇密碼子。
轉(zhuǎn)錄調(diào)節(jié)劑蛋白質(zhì)是(直接地或間接地)與核酸序列(例如反應元件)結(jié)合的分子,并且調(diào)節(jié)操作性地與反應元素連接的序列的轉(zhuǎn)錄。轉(zhuǎn)錄調(diào)節(jié)劑蛋白質(zhì)可為轉(zhuǎn)錄活化劑蛋白質(zhì)(例如,GAL4、核激素受體、API、CREB、LEF/tcf家族成員、SMAD、VP16、SP1等),轉(zhuǎn)錄阻遏物蛋白質(zhì)(例如,核激素受體、Groucho/tle家族、中鋸齒家族(Engrailedfamily)等),或視環(huán)境而定具有兩種活性的蛋白質(zhì)(例如,LEF/tcf、同盒蛋白質(zhì)(homoboxprotein)等)。反應元素通常是由轉(zhuǎn)錄調(diào)節(jié)劑蛋白質(zhì)識別的核酸序列或起與轉(zhuǎn)錄調(diào)節(jié)劑蛋白質(zhì)一致的作用的其他試劑。
轉(zhuǎn)錄調(diào)節(jié)劑蛋白質(zhì)的另一個實例是轉(zhuǎn)錄活化劑蛋白質(zhì),GAL4。參見(例如),A.Laughon等人,(1984),Identification of two proteins encoded by the Saccharomycescerevisiae GAL4 gene,Molecular&Cellular Biology 4268-275;A.Laughon和R.F.Gesteland,(1984),Primary structure of the Saccharomyces cerevisiae GAL4 gene,Molecular&Cellular Biology 4260-267;L.Keegan等人,(1986),Separation of DNA binding from thetranscription-activating function of a eukaryotic regulatory protein,Science 231699-704;和M.Ptashne,(1988),How eukaryotic transcriptional activators work,Nature 335683-689。所述881氨基酸蛋白質(zhì)的N-末端147氨基酸形成特異性結(jié)合DNA序列的DNA結(jié)合域(DBD)。參見(例如),M.Carey等人,(1989),An amino-terminal fragment of GAL4 bindsDNA as a dimer,J.Mol.Biol.209423-432;和E.Giniger等人,(1985),Specific DNAbinding of GAL4,a positive regulatory protein of yeast,Cell 40767-774。DBD是通過插入蛋白質(zhì)序列與當與DNA結(jié)合時可活化轉(zhuǎn)錄的C-末端113氨基酸活化域(AD)連接。參見(例如),J.Ma和M.Ptashne,(1987),Deletion analysis of GAL4 defines twotranscriptional activating segments,Cell 48847-853;和J.Ma和M.Ptashne,(1987),Thecarboxy-terminal 30 amino acids of GAL4 are recognized by GAL80,Cell 50137-142。通過將琥珀密碼子朝向(例如)含有GAL4的N-末端DBD和其C-末端AD的單一多肽的N-末端DBD放置,通過O-tRNA/O-RS對的琥珀抑制作用可與通過GAL4的轉(zhuǎn)錄活化聯(lián)系。經(jīng)GAL4活化的報告基因可用以執(zhí)行使用基因的正性和負性選擇。
用于負性選擇的培養(yǎng)基可包含通過負性選擇標記物轉(zhuǎn)化為可檢測物質(zhì)的選擇或篩選劑。在本發(fā)明的一個方面中,可檢測物質(zhì)是毒性物質(zhì)。編碼負性選擇標記物的多核苷酸可為(例如)ura3基因。舉例而言,URA3報告基因可在含有GAL4 DNA結(jié)合部位的啟動子控制下放置。當負性選擇標記物(例如)通過編碼具有選擇密碼子的GAL4的多核苷酸的轉(zhuǎn)譯而生產(chǎn)時,GAL4活化URA3的轉(zhuǎn)錄。負性選擇是在包含5-氟乳清酸(5-FOA)的培養(yǎng)基上完成,所述5-氟乳清酸通過ura3基因的基因產(chǎn)物轉(zhuǎn)化為可檢測物質(zhì)(例如殺死細胞的毒性物質(zhì))。參見(例如),J.D.Boeke等人,(1984),A positive selectionfor mutants lacking orotidine-5′-phosphate decarboxylase activity in yeast5-fluorooroticacid resistance,Molecular&General Genetics 197345-346);M.Vidal等人,(1996),Geneticcharacterization of amammalian protein-protein interaction domain by using a yeast reversetwo-hybrid system.,Proc.Natl.Acad.Sci.U.S.A.9310321-10326;和M.Vidal等人,(1996),Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-proteinand DNA-protein interactions.,Proc.Natl.Acad.Sci.U.S.A.9310315-10320 。
與正性選擇標記物一樣,負性選擇標記物也可為各種分子中的任何分子。正性選擇標記物和/或負性選擇標記物可以是發(fā)熒光或在適合的反應物存在下催化發(fā)光反應的多肽。舉例而言,負性選擇標記物包括(但不限于)(例如)熒光素酶、綠色熒光蛋白質(zhì)(GFP)、YFP、EGFP、RFP、抗生素抗性基因的產(chǎn)物(例如,氯霉素乙酰轉(zhuǎn)移酶(CAT))、lacZ基因的產(chǎn)物、轉(zhuǎn)錄調(diào)節(jié)劑蛋白質(zhì)等。正性選擇標記物和/或負性選擇標記物可以通過熒光活化細胞揀選(FACS)或通過發(fā)光來檢測。正性選擇標記物和/或負性選擇標記物可以包含基于親和力的篩選標記物。相同多核苷酸可編碼正性選擇標記物和負性選擇標記物。舉例而言,正性選擇步驟、負性選擇步驟或正性和負性選擇步驟可包括使用報告基因,其中報告基因是通過熒光活化細胞揀選(FACS)檢測。舉例而言,正性選擇可先用例如氯霉素乙酰轉(zhuǎn)移酶(CAT)基因的正性選擇標記物進行,其中CAT基因包含在CAT基因中的例如琥珀終止密碼子的選擇密碼子,接著進行負性選擇篩選,其是基于在例如T7 RNA聚合酶基因的負性標記物中的位置上不能抑制(例如)兩個或兩個以上的選擇密碼子來進行。正性選擇標記物和負性選擇標記物可在例如質(zhì)粒的相同載體上見到。負性標記物的表達驅(qū)動例如綠色熒光蛋白質(zhì)(GFP)的報告基因的表達。選擇和篩選的嚴格性可以變化,例如,使報告基因發(fā)熒光所需要的光的強度可以變化。正性選擇可用報告基因作為正性選擇標記物來進行,所述報告基因是通過FACS篩選,接著進行負性選擇篩選,其是基于在例如barnase基因的負性標記物中的位置上不能抑制(例如)兩個或兩個以上的選擇密碼子來進行。
視需要,報告基因展示在細胞表面上,例如噬菌體展示(phage display)等等上。例如基于OmpA的細胞-表面展示系統(tǒng)的細胞-表面展示依靠例如與大腸桿菌細胞表面上的外膜孔蛋白OmpA融合的脊髓灰白質(zhì)病毒C3肽的具體抗原決定基的表達。僅當?shù)鞍踪|(zhì)信息中的選擇密碼子在轉(zhuǎn)譯期間被抑制時,抗原決定基才展示在細胞表面上。然后,所展示的肽含有由庫中的突變體氨?;?tRNA合成酶之一識別出的氨基酸,并且含有對應合成酶基因的細胞可用抵抗含有特定非天然氨基酸的肽而產(chǎn)生的抗體來分離。基于OmpA的細胞-表面展示系統(tǒng)是由Georgiou等人開發(fā)且優(yōu)化以作為噬菌體展示的替換物。參見,F(xiàn)rancisco,J.A.,Campbell,R.,Iverson,B.L.和Georgoiu,G.Production andfluorescence-activated cell sorting of Escherichia coli expressing a functional antibodyfragment on the external surface.Proc.Natl.Acad.Sci.USA 9010444-8(1993)。
本發(fā)明的其他實施例包括活體外進行一個或一個以上選擇步驟。例如合成酶和/或tRNA的所選組分可隨后被引入細胞中以用于活體內(nèi)并入非天然氨基酸。
生產(chǎn)O-RS和改變合成酶的底物特異性的其他細節(jié)可見于標題為“Methods andCompositions for the Production of Orthogonal tRNA-Aminoacyl tRNA Synthetase Pairs”的美國專利申請案10/126,931和標題為“EXPANDING THE EUKARYOTIC GENETICCODE”的USSN 10/825,867,其是以引用的方式并入本文中。生產(chǎn)O-RS的其他細節(jié)可見于Hamano-Takaku等人,(2000)A mutant Escherichia coli Tyrosyl-tRNA SynthetaseUtilizes the Unnatural Amino Acid Azatyrosine More Efficiently than Tyrosine,Journal ofBiological Chemistry,275(51)40324-40328;Kiga等人,(2002),An engineered Escherichiacoli tyrosyl-tRNA synthetase for site-specific incorporation of an unnatural amino acid intoproteins in eukaryotic translation and its application in a wheat germ cell-free system,PNAS99(15)9715-9723;和Francklyn等人,(2002),Aminoacyl-tRNA synthetasesVersatileplayers in the changing theater oftranslation;RNA,81363-1372,各參考文獻是以引用的方式并入本文中。
來源和宿主生物體本發(fā)明的轉(zhuǎn)譯組分通常由非真核生物體得到。舉例而言,正交O-tRNA可由例如古細菌,諸如詹氏甲烷球菌、橫川病毒、諸如富饒鹽菌和鹽桿菌種NRC-1的鹽桿菌屬、閃爍古生球菌、火球菌、掘越氏熱球菌、嗜熱菌敏捷氣熱菌等等;或真細菌,諸如大腸桿菌、嗜熱細菌、嗜熱脂肪芽孢桿菌等等的非真核生物體得到,而正交O-RS可由例如橫川病毒、諸如富饒鹽菌和鹽桿菌種NRC-1的鹽桿菌屬、閃爍古生球菌、火球菌、掘越氏熱球菌、嗜熱菌敏捷氣熱菌等等;或真細菌,諸如大腸桿菌、嗜熱細菌、嗜熱脂肪芽孢桿菌等等的非真核生物體得到。在一個實施例中,也可使用包括(但不限于)植物、藻類、原生生物、真菌、酵母、動物(例如哺乳動物、昆蟲、節(jié)肢動物等)等等的真核來源。
O-tRNA/O-RS對的個別組分可由相同生物體或不同生物體得到。在一個實施例中,O-tRNA/O-RS對是來自相同的生物體?;蛘撸琌-tRNA/O-RS對的O-tRNA和O-RS是來自不同的生物體。舉例而言,O-tRNA可由(例如)鹽桿菌種NRC-1得到,并且O-RS可由(例如)嗜熱自養(yǎng)甲烷桿菌得到。
O-tRNA、O-RS或O-tRNA/O-RS對可經(jīng)活體內(nèi)或活體外選擇或篩選和/或用于例如非真核細胞(諸如大腸桿菌細胞)或真核細胞的細胞中以生產(chǎn)具有所選氨基酸(例如非天然氨基酸)的多肽。非真核細胞可來自各種來源,諸如原生種系發(fā)生域,包括(但不限于)詹氏甲烷球菌、橫川病毒、諸如富饒鹽菌和鹽桿菌種NRC-1的鹽桿菌屬、閃爍古生球菌、火球菌、掘越氏熱球菌、嗜熱菌敏捷氣熱菌等等,或可屬于真細菌種系發(fā)生域,包括(但不限于)大腸桿菌、嗜熱細菌、嗜熱脂肪芽孢桿菌、熒光極毛桿菌、綠膿桿菌、惡息極毛桿菌等等。真核細胞可來自各種來源,包括(但不限于)植物(例如,諸如單子葉植物或雙子葉植物的復雜植物)、藻類、原生生物、真菌、酵母(包括(但不限于)釀酒酵母);動物(包括(但不限于)哺乳動物、昆蟲、節(jié)肢動物等)等等。具有本發(fā)明的轉(zhuǎn)譯組分的細胞的組合物也是本發(fā)明的特征。對在一種物種中篩選用于另一種物種的O-tRNA和/或O-RS來說,又參見,標題為“Expanding the Eukaryotic Genetic Code”的USSN 10/825,867。
為在宿主細胞中表達具有所選氨基酸的所關(guān)注的多肽,所屬領(lǐng)域的技術(shù)人員可以將編碼所關(guān)注的多肽的多核苷酸亞克隆到表達載體中,該表達載體含有指導轉(zhuǎn)錄的啟動子、轉(zhuǎn)錄/轉(zhuǎn)譯終止子和(如果對于編碼蛋白質(zhì)的核酸來說)用于轉(zhuǎn)譯起始的核糖體結(jié)合部位的。適合的細菌啟動子在所屬領(lǐng)域中為熟知的并且描述于(例如)Sambrook等人和Ausubel等人中。
用于表達所關(guān)注的多肽的細菌表達系統(tǒng)可在包括(但不限于)大腸桿菌、芽胞桿菌種、熒光極毛桿菌、綠膿桿菌、惡息極毛桿菌和沙門氏菌(沙門氏菌屬)中得到(Palva等人,Gene 22229-235(1983);Mosbach等人,Nature 302543-545(1983))。用于所述表達系統(tǒng)的試劑盒是市售的。用于哺乳動物細胞、酵母和昆蟲細胞的真核表達系統(tǒng)在所屬領(lǐng)域中是熟知的并且也是市售的。
本發(fā)明的tRNA和/或RS和/或所關(guān)注的多肽可以應用于和/或表達于包括(例如)酵母、昆蟲細胞、哺乳動物細胞和細菌的許多適合的表達系統(tǒng)中。示范性表達系統(tǒng)的描述提供于下文。
酵母如本文所使用,術(shù)語“酵母”包括能夠表達所關(guān)注的多肽的各種酵母中的任何酵母。所述酵母包括(但不限于)產(chǎn)子囊孢子酵母(內(nèi)孢霉目(Endomycetales))、擔子菌有孢子酵母(basidiosporogenous yeast)和屬于半知菌(芽生菌(Blastomycetes))群組的酵母。產(chǎn)子囊孢子酵母分成2個科,即蝕精霉科(Spermophthoraceae)和酵母科(Saccharomycetaceae)。后者包含4個亞科,即裂殖酵母亞科(Schizosaccharomycoideae)(例如,裂殖酵母屬(genus Schizosaccharomyces))、拿遜酵母亞科(Nadsonioideae)、Lipomycoideae和Saccharomycoideae(例如畢赤氏酵母屬(genera Pichia)、克盧費氏酵母屬(Kluyveromyces)和酵母菌屬(Saccharomyces))。擔子菌有孢子酵母包括擔子菌白冬孢酵母屬(genera Leucosporidium)、紅冬孢酵母屬(Rhodosporidium)、鎖擲酵母屬(Sporidiobolus)、線黑粉菌屬(Filobasidium)和香灰擬鎖擔菌屬(Filobasidiella)。屬于半知菌(芽生菌)群組的酵母分成2個科,即擲孢酵母科(Sporobolomycetaceae)(例如,擲孢酵母屬(genera Sporobolomyces)和布勒彈孢酵母屬(Bullera))和隱球酵母科(Cryptococcaceae)(例如念珠菌屬(genus Candida))。
供本發(fā)明使用的尤其受關(guān)注的是以下物種中的物種畢赤氏酵母屬、克盧費氏酵母屬、酵母菌屬、裂殖酵母屬、漢遜酵母屬(Hansenula)、球擬酵母屬(Torulopsis)和念珠菌屬,包括(但不限于)巴斯德畢赤酵母(P.pastoris)、P.guillerimondii、釀酒酵母、嘉士伯酵母(S.carlsbergensis)、糖化酵母(S.diastaticus)、道格拉斯酵母(S.douglasii)、科魯維爾酵母(S.kluyveri)、諾本斯酵母(S.norbensis)、卵形酵母(S.oviformis)、乳酸克魯維酵母(K.lactis)、乳糖酶酵母(K.fragilis)、白色念珠菌(C.albicans)、麥芽糖假絲酵母(C.maltosa)和漢森酵母(H.polymorpha)。酵母通??蓮陌?但不限于)以下來源的各種來源購得Yeast Genetic Stock Center、Department of Biophysics andMedical Physics,University of California(Berkeley,CA)和American Type CultureCollection(“ATCC”)(Manassas,VA)。
術(shù)語“酵母宿主”或“酵母宿主細胞”包括可用作或已經(jīng)用作用于重組載體或其他轉(zhuǎn)移DNA的接受者的酵母。術(shù)語包括已經(jīng)接受重組載體或其他轉(zhuǎn)移DNA的原始酵母宿主細胞的子代。應了解,由于意外的或有意的突變,單一親代細胞的子代可以不必在形態(tài)學或補充于原始母體的染色體組或總DNA方面完全相同。足夠相似于有待通過諸如編碼所關(guān)注的多肽的核苷酸序列存在的相關(guān)性質(zhì)表征的母體的親代細胞的子代包括在所述定義所指的子代中。
已經(jīng)開發(fā)包括染色體外復制子或合并載體的表達和轉(zhuǎn)形載體,用于轉(zhuǎn)形到許多酵母宿主中。舉例而言,已經(jīng)開發(fā)用于釀酒酵母的表達載體(Sikorski等人,GENETICS(1989)12219;Ito等人,J.BACTERIOL.(1983)153163;Hinnen等人,PROC.NATL.ACAD.SCI.USA(1978)751929);用于白色念珠菌的表達載體(Kurtz等人,MOL.CELL.BIOL.(1986)6142);用于麥芽糖假絲酵母的表達載體(Kunze等人,J.BASICMICROBIOL.(1985)25141);用于漢森酵母的表達載體(Gleeson等人,J.GEN.MICROBIOL.(1986)1323459;Roggenkamp等人,MOL.GENETICS AND GENOMICS(1986)202302);用于乳糖酶酵母的表達載體(Das等人,J.BACTERIOL.(1984)1581165);用于乳酸克魯維酵母的表達載體(De Louvencourt等人,J.BACTERIOL.(1983)154737;Van den Berg等人,BIOTECHNOLOGY(NY)(1990)8135);用于P.guillerimondii的表達載體(Kunze等人,J.BASIC MICROBIOL.(1985)25141);用于巴斯德畢赤酵母的表達載體(美國專利第5,324,639;4,929,555;和4,837,148號;Cregg等人,MOL.CELL.BIOL.(1985)53376);用于粟酒裂殖酵母(Schizosaccharomyces pombe)的表達載體(Beach等人,NATURE(1982)300706);和用于解脂耶羅威亞酵母(Y.lipolytica);構(gòu)巢曲霉(A.nidulans)的表達載體(Ballance等人,BIOCHEM.BIOPHYS.RES.COMMUN.(1983)112284-89;Tilburn等人,GENE(1983)26205-221;和Yelton等人,PROC.NATL.ACAD.SCI.USA(1984)811470-74);用于黑霉菌(A.niger)的表達載體(Kelly和Hynes,EMBO J.(1985)4475-479);用于里氏木霉(T.reesia)的表達載體(EP 0 244 234);和用于諸如脈孢菌屬(Neurospora)、青霉屬(Penicillium)、彎頸霉屬(Tolypocladium)的絲狀真菌的表達載體(WO 91/00357),各個參考文獻是以引用的方式并入本文中。
酵母載體的控制序列為所屬領(lǐng)域的技術(shù)人員所知并且包括(但不限于)來自諸如以下基因的基因的啟動子區(qū)域醇脫氫酶(ADH)(EP 0 284 044);烯醇酶;葡糖激酶;葡糖-6-磷酸異構(gòu)酶;甘油醛-3-磷酸-脫氫酶(GAP或GAPDH);己糖激酶;磷酸果糖激酶;3-磷酸甘油酸變位酶;和丙酮酸激酶(PyK)(EP 0 329 203)。編碼酸性磷酸酶的酵母PHO5基因也可以提供有效的啟動子序列(Miyanohara等人,PROC.NATL.ACAD.SCI.USA(1983)801)。供酵母宿主使用的其他適合的啟動子序列可以包括3-磷酸甘油酸激酶(Hitzernan等人,J.BIOL.CHEM.(1980)25512073);和其他糖解酶,諸如丙酮酸脫羧酶、磷酸丙糖異構(gòu)酶和磷酸葡糖異構(gòu)酶(Holland等人,Biochemistry(1978)174900;Hess等人,J.AdvEnzyme Reg.(1969)7149)的啟動子。具有通過生長條件來控制的轉(zhuǎn)錄的額外優(yōu)點的誘導型酵母啟動子,可以包括醇脫氫酶2;異細胞色素C;酸性磷酸酶;金屬硫蛋白;甘油醛-3-磷酸脫氫酶;與氮代謝相關(guān)的降解酶;和擔負麥芽糖和半乳糖應用的酶的啟動子區(qū)域。適用于酵母表達的適合的載體和啟動子另外描述于EP 0 073 657中。
酵母強化子也可以與酵母啟動子一起使用。另外,合成啟動子也可以起酵母啟動子的作用。舉例而言,酵母啟動子的上游活化序列(UAS)可以與另一酵母啟動子的轉(zhuǎn)錄活化區(qū)域接合,產(chǎn)生合成雜交啟動子。所述雜交啟動子的實例包括與GAP轉(zhuǎn)錄活化區(qū)域連接的ADH調(diào)節(jié)序列。參見美國專利第4,880,734和4,876,197號,其是以引用的方式并入本文中。雜交啟動子的其他實例所包括的啟動子由與諸如GAP或PyK的糖解酶基因的轉(zhuǎn)錄活化區(qū)域組合的ADH2、GAL4、GAL10或PHO5基因的調(diào)節(jié)序列組成。參見EP 0 164 556。此外,酵母啟動子可以包括具有結(jié)合酵母RNA聚合酶并且引發(fā)轉(zhuǎn)錄的能力的非酵母源的天然存在的啟動子。
可以包含部分酵母表達載體的其他控制元件包括(例如)來自GAPDH或烯醇酶基因的終止子(Holland等人,J.BIOL.CHEM.(1981)2561385)。另外,來自2μ質(zhì)粒源的復制源適用于酵母。適用于酵母的適合的選擇基因是存在于酵母質(zhì)粒中的trp1基因。參見,Tschumper等人,GENE(1980)10157;Kingsman等人,GENE(1979)7141。trp1基因提供為沒有能力在色氨酸中生長的酵母突變菌株的選擇標記物。同樣地,缺Leu2的酵母菌株(ATCC 20,622或38,626)是通過帶有Leu2基因的已知質(zhì)粒補充。
將外原性DNA引入酵母宿主中的方法為所屬領(lǐng)域的技術(shù)人員所知,并且通常包括(但不限于)用堿性陽離子處理的球形體或完整酵母宿主細胞的轉(zhuǎn)形。舉例而言,酵母的轉(zhuǎn)形可根據(jù)Hsiao等人,PROC.NATL.ACAD.SCI.USA(1979)763829和Van Solingen等人,J.BACT.(1977)130946中所述的方法進行。然而,諸如通過核注射、電穿孔或原生質(zhì)體融合的用于將DNA引入細胞中的其他方法,也可以如SAMBROOK等人,MOLECULAR CLONINGA LAB.MANUAL(2001)中的一般描述使用。然后,可以使用為所屬領(lǐng)域的技術(shù)人員所知的標準技術(shù)培養(yǎng)酵母宿主細胞。
用于在酵母宿主細胞中表達異源蛋白質(zhì)的其他方法為所屬領(lǐng)域的技術(shù)人員所知。通常參見,美國專利公開案第20020055169號、美國專利第6,361,969;6,312,923;6,183,985;6,083,723;6,017,731;5,674,706;5,629,203;5,602,034;和5,089,398號;美國再審專利第RE37,343和RE35,749號;PCT公開專利申請案WO 99/078621;WO 98/37208;和WO 98/26080;歐洲專利申請案EP 0946736;EP 0732403;EP 0480480;WO 90/10277;EP 0340986;EP 0329203;EP 0324274;和EP 0164556,所述專利是以引用的方式并入本文中。又參見Gellissen等人,ANTONIE VAN LEEUWENHOEK(1992)62(1-2)79-93;Romanos等人,YEAST(1992)8(6)423-488;Goeddel,METHODS INENZYMOLOGY(1990)1853-7,各個參考文獻是以引用的方式并入本文中。
酵母宿主菌株在擴增階段期間,使用為所屬領(lǐng)域的技術(shù)人員所知的標準進料分批發(fā)酵方法,在發(fā)酵罐中生長。發(fā)酵方法可以由于具體的酵母宿主的碳利用路徑或表達控制的模式的差異而修改。舉例而言,酵母菌屬酵母宿主的發(fā)酵可需要單一葡萄糖進料、復合氮源(例如酪蛋白水解物)和多次維生素增補。相反,甲基營養(yǎng)型酵母巴斯德畢赤酵母可需要甘油、甲醇和痕量礦物質(zhì)進料,但僅需要簡單的銨(氮)鹽以達到最佳生長和表達。參見(例如),以引用的方式并入本文中的美國專利第5,324,639號;Elliott等人,J.PROTEIN CHEM.(1990)995;和Fieschko等人,BIOTECH.BIOENG.(1987)291113。
然而,所述發(fā)酵方法可以具有某些獨立于所用酵母宿主菌株的共同特征。舉例而言,通常為碳的生長限制營養(yǎng)物可在擴增階段期間被添加到發(fā)酵罐中以容許最大生長。另外,發(fā)酵方法通常使用經(jīng)設(shè)計以含有足夠量的碳、氮、基本鹽、磷和其他微量養(yǎng)分(維生素、痕量礦物質(zhì)和鹽等)的發(fā)酵培養(yǎng)基。適于供畢赤氏酵母屬使用的發(fā)酵培養(yǎng)基的實例描述于美國專利第5,324,639和5,231,178號中,所述專利是以引用的方式并入本文中。
經(jīng)桿狀病毒感染的昆蟲細胞術(shù)語“昆蟲宿主”或“昆蟲宿主細胞”指的是可用作或已經(jīng)用作用于重組載體或其他轉(zhuǎn)移DNA的接受者的昆蟲。術(shù)語包括已經(jīng)被轉(zhuǎn)染的原始昆蟲宿主細胞的子代。應了解,由于意外的或有意的突變,單一親代細胞的子代可以不必在形態(tài)學或補充到原始母體的染色體組或總DNA方面完全相同。足夠相似于有待通過諸如編碼所關(guān)注的多肽的核苷酸序列存在的相關(guān)性質(zhì)表征的母體的親代細胞的子代包括在所述定義所指的子代中。
用于表達所關(guān)注的多肽的適合昆蟲細胞的選擇為所屬領(lǐng)域的技術(shù)人員所知。若干昆蟲物種充分描述于所屬領(lǐng)域中并且是市售的,包括埃及伊蚊(Aedes aegypti)、家蠶(Bombyx mori)、果蠅(Drosophila melanogaster)、草地夜蛾(Spodoptera frugiperda)和粉紋夜蛾(Trichoplusia ni)。在選擇用于表達的昆蟲宿主時,適合的宿主可以包括展示具有(尤其)良好分泌能力、低蛋白質(zhì)分解活性和總堅固性的所述宿主。昆蟲通??蓮陌?但不限于)以下來源的各種來源購得Insect Genetic Stock Center、Departmentof Biophysics and Medical Physics,University of California(Berkeley;CA);和AmericanType Culture Collection(“ATCC”)(Manassas,VA)。
通常,經(jīng)桿狀病毒感染的昆蟲表達系統(tǒng)的組分包括轉(zhuǎn)移載體,通常為細菌質(zhì)粒,其含有桿狀病毒基因組的片段和用于插入待表達的異源基因的適當?shù)南拗菩圆课唬痪哂信c轉(zhuǎn)移載體中的桿狀病毒特異性片段同源的序列的野生型桿狀病毒(其允許異源基因在桿狀病毒基因組中的同源重組);和適當?shù)睦ハx宿主細胞和生長培養(yǎng)基。用于構(gòu)建載體、轉(zhuǎn)染細胞、挑選溶菌斑、使細胞在培養(yǎng)物中生長諸如此類的物質(zhì)、方法和技術(shù)在所屬領(lǐng)域中為已知的并且描述所述技術(shù)的手冊是可用的。
將異源基因插入轉(zhuǎn)移載體中后,載體和野生型病毒基因組被轉(zhuǎn)染到載體和病毒基因組在其中重組的昆蟲宿主細胞中。表達經(jīng)包裝的重組病毒并且鑒別和純化重組溶菌斑。用于桿狀病毒/昆蟲細胞表達系統(tǒng)的物質(zhì)和方法,是以來自(例如)Invitrogen Corp.(Carlsbad,CA)的試劑盒形式市售。所述技術(shù)通常為所屬領(lǐng)域的技術(shù)人員所知并且全部描述于以引用的方式并入本文的SUMMERS和SMITH,TEXAS AGRICULTURALEXPERIMENT STATION BULLETIN第1555號(1987)中。又參見,Richardson,39METHODS IN MOLECULAR BIOLOGYBACULOVIRUS EXPRESSION PROTOCOLS(1995);AUSUBEL等人,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY16.9-16.11(1994);KING和POSSEE,THE BACULOVIRUS SYSTEMA LABORATORYGUIDE(1992);和O′REILLY等人,BACULOVIRUS EXPRESSION VECTORSALABORATORY MANUAL(1992)。
實際上,使用桿狀病毒/昆蟲細胞表達系統(tǒng)的各種異源蛋白質(zhì)的生產(chǎn)為所屬領(lǐng)域的技術(shù)人員所知。參見(例如),美國專利第6,368,825;6,342,216;6,338,846;6,261,805;6,245,528;6,225,060;6,183,987;6,168,932;6,126,944;6,096,304;6,013,433;5,965,393;5,939,285;5,891,676;5,871,986;5,861,279;5,858,368;5,843,733;5,762,939;5,753,220;5,605,827;5,583,023;5,571,709;5,516,657;5,290,686號;WO 02/06305;WO 01/90390;WO 01/27301;WO 01/05956;WO 00/55345;WO 00/20032;WO 99/51721;WO 99/45130;WO 99/31257;WO 99/10515;WO 99/09193;WO 97/26332;WO 96/29400;WO 96/25496;WO 96/06161;WO 95/20672;WO 93/03173;WO 92/16619;WO 92/02628;WO 92/01801;WO 90/14428;WO 90/10078;WO 90/02566;WO 90/02186;WO 90/01556;WO 89/01038;WO 89/01037;WO 88/07082號,所述專利以引用的方式并入本文中。
適用于桿狀病毒/昆蟲細胞表達系統(tǒng)的載體在所屬領(lǐng)域中為已知的并且包括(例如)由桿狀病毒苜蓿丫紋夜蛾(Autographacalifornica)核型多角體病毒(AcNPV)得到的昆蟲表達和轉(zhuǎn)移載體,其為輔助病毒(helper)獨立性、病毒表達載體。由所述系統(tǒng)得到的病毒表達載體通常使用強病毒性多角體蛋白基因啟動子來驅(qū)動異源基因的表達。通常參見,O′Reilly等人,BACULOVIRUS EXPRESSION VECTORSA LABORATORYMANUAL(1992)。
在將外來基因插入桿狀病毒基因組中之前,通常將包含啟動子、引子(如果需要)、所關(guān)注的編碼序列和轉(zhuǎn)錄終止序列的上述組分裝配成中間錯位構(gòu)筑體(轉(zhuǎn)移載體)。常將中間錯位構(gòu)筑體維持在諸如能夠穩(wěn)定維持在諸如細菌的宿主中的其他染色體元件(例如質(zhì)粒)的復制子中。復制子將會具有復制系統(tǒng),因此容許其被維持在用于克隆和擴增的適合的宿主中。更明確地說,質(zhì)??梢院卸嘟求w蛋白多聚腺苷酸化信號(Miller,Ann.Rev.Microbiol.(1988)42177)和原核抗氨芐青霉素(amp)基因和用于在大腸桿菌中選擇和繁殖的復制源。
用于將外來基因引入AcNPV中的一種常用轉(zhuǎn)移載體是pAc373。也已經(jīng)設(shè)計了為所屬領(lǐng)域的技術(shù)人員所知的許多其他載體,包括(例如)pVL985,其將多角體蛋白起始密碼子從ATG改變成ATT,并且在ATT下游的32個堿基對處引入BamHI克隆部位。參見,Luckow和Summers,Virology 17031(1989)。其他市售載體包括(例如)PBlueBac4.5/V5-His;pBlueBacHis2;pMelBac;pBlueBac4.5(Invitrogen Corp.,Carlsbad,CA)。
在插入異源基因后,將轉(zhuǎn)移載體和野生型桿狀病毒基因組共轉(zhuǎn)染到昆蟲細胞宿主中。用于將異源DNA引入桿狀病毒病毒中的所要部位中的方法在所屬領(lǐng)域中為已知的。參見,SUMMERS和SMITH,TEXASAGRICULTURALEXPERIMENTSTATIONBULLETIN第1555號(1987);Smith等人,MOL.CELL.BIOL.(1983)32156;Luckow和Summers,Virology(1989)17031。舉例而言,插入可為通過同源復式轉(zhuǎn)線軌道重組,插入到諸如多角體蛋白基因的基因中;插入也可為插入到被工程化成所要桿狀病毒基因的限制性內(nèi)切酶部位中。參見,Miller等人,Bioessays(1989)11(4)91。
轉(zhuǎn)染可以通過電穿孔完成。參見Trotter And Wood,39 Methods in Molecular BIOLOGY(1995);Mann和King,J.Gen.Virol.(1989)703501?;蛘?,脂質(zhì)體可用以轉(zhuǎn)染具有重組表達載體和桿狀病毒的昆蟲細胞。參見(例如),Liebman等人,Biotechniques(1999)26(1)36;Graves等人,BIOCHEMISTRY(1998)376050;Nomura等人,J.BIOL.CHEM.(1998)273(22)13570;SCHMIDT等人,PROTEIN EXPRESSION AND PURIFICATION(1998)12323;Siffert等人,NATURE GENETICS(1998)1845;TILKINS等人,CELLBIOLOGYA LABORATORY HANDBOOK 145-154(1998);CAI等人,PROTEINEXPRESSIONAND PURIFICATION(1997)10263;DOLPHIN等人,NATURE GENETICS(1997)17491;Kost等人,GENE(1997)190139;JAKOBSSON等人,J.BIOL.CHEM.(1996)27122203;Rowles等人,J.BIOL.CHEM.(1996)271(37)22376;Reverey等人,J.BIOL.CHEM.(1996)271(39)23607-10;Stanley等人,J.BIOL.CHEM.(1995)2704121;Sisk等人,J.Virol.(1994)68(2)766;和Peng等人,BIOTECHNIQUES(1993)14(2)274。市售脂質(zhì)體包括(例如)Cellfectin和Lipofectin(Invitrogen,Corp.,Carlsbad,CA)。另外,可以使用磷酸鈣轉(zhuǎn)染。參見,TROTTER AND WOOD,39 METHODS INMOLECULAR BIOLOGY(1995);Kitts,NAR(1990)18(19)5667;和,Mann和King,J.GEN.VIROL.(1989)703501。
桿狀病毒表達載體通常含有桿狀病毒啟動子。桿狀病毒啟動子是任何能夠結(jié)合桿狀病毒RNA聚合酶并且引發(fā)將編碼序列(例如結(jié)構(gòu)基因)下游(3′)轉(zhuǎn)錄成mRNA的DNA序列。啟動子將具有通常位于最接近于編碼序列的5′末端的轉(zhuǎn)錄起始區(qū)域。所述轉(zhuǎn)錄起始區(qū)域通常包括RNA聚合酶結(jié)合部位和轉(zhuǎn)錄起始部位。桿狀病毒啟動子也可以具有稱為強化子的第二域,如果存在,那么其通常遠離結(jié)構(gòu)基因。此外,表達可為調(diào)節(jié)性或為構(gòu)成性的。
在感染循環(huán)的后期充分轉(zhuǎn)錄的結(jié)構(gòu)基因提供尤其有效的啟動子序列。實例包括由編碼病毒多面體蛋白質(zhì)的基因(Friesen等人,The Regulation of Baculovirus Gene Expression,THE MOLECULAR BIOLOGY OF BACULOVIRUSES(1986);EP 0127839和0155476)和編碼p10蛋白質(zhì)的基因(Vlak等人,J.Gen.Virol.(1988)69765)得到的序列。
將新形成的桿狀病毒表達載體包裝到感染重組桿狀病毒中并且隨后,可以通過為所屬領(lǐng)域的技術(shù)人員所知的技術(shù)純化已生長的溶菌斑。參見,Miller等人,Bioessays(1989)1l(4)91;SUMMERS和SMITH,TEXAS AGRICULTURAL EXPERIMENT STATIONBULLETIN第1555號(1987)。
已經(jīng)開發(fā)用于感染到若干昆蟲細胞中的重組桿狀病毒表達載體。舉例而言,已經(jīng)開發(fā)尤其用于埃及伊蚊(ATCC第CCL-125號)、家蠶(ATCC第CRL-8910號)、果蠅(ATCC第1963號)、草地夜蛾和粉蚊夜蛾的重組桿狀病毒。參見,Wrigbt,NATURE(1986)321718;Carbonell等人,J.VIROL.(1985)56153;Smith等人,MOL.CELL.BIOL.(1983)32156。通常參見,F(xiàn)raser等人,INVITROCELL.DEV.BIOL.(1989)25225。更明確地說,用于桿狀病毒表達載體系統(tǒng)的細胞系通常包括(但不限于)Sf9(草地夜蛾)(ATCC第CRL-1711號)、Sf21(草地夜蛾)(Invitrogen Corp.,Cat.第11497-013號(Carlsbad,CA))、Tri-368(粉蚊夜蛾)和High-FiveTMBTI-TN-5B1-4(粉蚊夜蛾)。
用于在桿狀病毒/表達中直接表達和融合表達異源多肽的細胞和培養(yǎng)基是市售的,并且細胞培養(yǎng)技術(shù)通常為所屬領(lǐng)域的技術(shù)人員所知。
大腸桿菌、假單胞菌種和其他原核生物細菌表達技術(shù)為所屬領(lǐng)域的技術(shù)人員所知。多種載體可得到用于細菌宿主中。載體可以是單拷貝或低或高多拷貝載體。載體可以用于克隆和/或表達。鑒于關(guān)于載體、許多載體的工業(yè)效用和甚至描述載體和其限制圖和特征的手冊的豐富的文獻,在此不需要廣泛討論。如所熟知的,載體通常涉及允許選擇的標記物,所述標記物可以提供細胞毒性劑抗性、原營養(yǎng)或免疫性。常常,存在提供不同特征的多個標記物。
細菌啟動子是任何能夠結(jié)合細菌RNA聚合酶和引發(fā)將編碼序列(例如結(jié)構(gòu)基因)下游(3′)轉(zhuǎn)錄成mRNA的DNA序列。啟動子將具有通常位于最接近于編碼序列的5′末端的轉(zhuǎn)錄起始區(qū)域。所述轉(zhuǎn)錄起始區(qū)域通常包括RNA聚合酶結(jié)合部位和轉(zhuǎn)錄起始部位。細菌的啟動子也可以具有稱為操縱子的第二域,其可以重疊RNA合成開始處的鄰近RNA聚合酶結(jié)合部位。操縱子容許負性調(diào)節(jié)(誘導型)轉(zhuǎn)錄,因為基因阻遏蛋白可以結(jié)合操縱子并且進而抑制特定基因的轉(zhuǎn)錄。構(gòu)成性表達可以在不存在諸如操縱子的負性調(diào)節(jié)元件時發(fā)生。另外,正性調(diào)節(jié)可以通過基因活化子蛋白結(jié)合序列達成,如果存在,那么其通常最接近于RNA聚合酶結(jié)合序列(5′)?;蚧罨拥鞍踪|(zhì)的實例是代謝活化蛋白(CAP),其幫助引發(fā)lac操縱子在大腸桿菌中的轉(zhuǎn)錄[Raibaud等人,ANNU.REV.GENET.(1984)18173]。經(jīng)調(diào)節(jié)的表達因此可以是正性的或負性的,進而增強或者減少轉(zhuǎn)錄。
編碼代謝路徑酶的序列提供尤其有效的啟動子序列。實例包括由諸如半乳糖、乳糖(lac)[Chang等人,Nature(1977)1981056]和麥芽糖的糖代謝酶得到的啟動子序列。其他實例包括由諸如色氨酸(trp)的生物合成酶得到的啟動子序列[Goeddel等人,Nuc.Acids Res.(1980)84057;Yelverton等人,Nucl.Acids Res.(1981)9731;美國專利第4,738,921號;歐洲專利公開案第036 776和121 775號,其是以引用的方式并入本文中]。β-半乳糖苷酶(bla)啟動子系統(tǒng)[Weissmann(1981)“The cloning of interferon and othermistakes.”In Interferon 3(I.Gresser編)]、噬菌體λPL[Shimatake等人,Nature(1981)292128]和T5[美國專利第4,689,406號]啟動子系統(tǒng)也提供有效的啟動子序列。諸如T7啟動子的強啟動子可用以誘導高水平的所關(guān)注的多肽。所述載體的實例為所屬領(lǐng)域的技術(shù)人員所知并且包括來自Novagen的pET29系列和描述于以引用的方式并入本文中的WO99/05297中的pPOP載體。所述表達系統(tǒng)在宿主中產(chǎn)生高水平的多肽,而不會危害宿主細胞生存性或生長參數(shù)。pET19(Novagen)是在所屬領(lǐng)域中已知的另一種載體。
另外,非天然存在的合成啟動子也起細菌啟動子的作用。舉例而言,一個細菌啟動子或噬菌體啟動子的轉(zhuǎn)錄活化序列可以與另一個細菌啟動子或噬菌體啟動子的操縱子序列接合,產(chǎn)生合成雜交啟動子[美國專利第4,551,433號,所述專利是以引用的方式并入本文中]。舉例而言,tac啟動子是通過lac阻遏物調(diào)節(jié)的由trp啟動子和lac操縱子序列組成的雜交trp-lac啟動子[Amann等人,GENE(1983)25167;de Boer等人,PROC.NATL.ACAD.SCI.(1983)8021]。此外,細菌啟動子可包括具有結(jié)合細菌RNA聚合酶并且引發(fā)轉(zhuǎn)錄的能力的非細菌性源的天然存在的啟動子。非細菌性源的天然存在的啟動子也可與相容的RNA聚合酶偶合以產(chǎn)生一些基因在原核生物中的高水平表達。細菌磷酸酶(bacteriophase)T7 RNA聚合酶/啟動子系統(tǒng)是經(jīng)偶合的啟動子系統(tǒng)的實例[Studier等人,J.Mol.Biol.(1986)189113;Tabor等人,Proc Natl.Acad.Sci.(1985)821074]。另外,雜交啟動子也可由噬菌體啟動子和大腸桿菌操縱子區(qū)域組成(歐洲專利公開案第267 851號)。
除功能啟動子序列之外,有效的核糖體結(jié)合部位也適用于外來基因在原核生物中的表達。在大腸桿菌中,核糖體結(jié)合部位稱為Shine-Dalgarno(SD)序列并且包括起始密碼子(ATG)和定位于起始密碼子的3-11個核苷酸上游的長度為3-9個核苷酸的序列[Shine等人,Nature(1975)25434]。認為SD序列通過SD序列與大腸桿菌16S rRNA的3′末端之間的堿基的配對,而促進mRNA與核糖體的結(jié)合[Steitz等人“Genetic signalsand nucleotide sequences in messenger RNA”,In Biological Regulation and DevelopmentGene Expression(Ed.R.F.Goldberger,1979)]。用弱核糖體結(jié)合部位表達真核基因和原核基因[Sambrook等人“Expression of cloned genes in Escherichia coli”,Molecular CloningA Laboratory Manual,1989]。
術(shù)語“細菌宿主”或“細菌宿主細胞”指的是可用作或已經(jīng)用作用于重組載體或其他轉(zhuǎn)移DNA的接受者的細菌。術(shù)語包括已經(jīng)轉(zhuǎn)染的原始細菌宿主細胞的子代。應了解,由于意外的或有意的突變,單一親代細胞的子代可以不必在形態(tài)學或補充于原始母體的染色體組或總DNA方面完全相同。足夠相似于有待通過諸如編碼hGH的核苷酸序列存在的相關(guān)性質(zhì)表征的母體的親代細胞的子代包括在所述定義所指的子代中。
用于表達多肽的適合寄主細菌的選擇為所屬領(lǐng)域的技術(shù)人員所知。在選擇用于表達的細菌宿主時,適合的宿主可以包括展示具有(尤其)良好內(nèi)含體形成能力、低蛋白質(zhì)分解活性和總堅固性的所述宿主。細菌宿主通??蓮陌?但不限于)以下來源的各種來源購得Bacterial Genetic Stock Center、Department of Biophysics and MedicalPhysics,University of California(Berkeley,CA);和American Type Culture Collection(“ATCC”)(Manassas,VA)。工業(yè)發(fā)酵/醫(yī)藥發(fā)酵通常使用由K菌株(例如W3110)得到的細菌或由B菌株(例如BL21)得到的細菌。所述菌株是尤其有效的,因為其生長參數(shù)是十分熟知的和穩(wěn)固的。另外,所述菌株是非病原性的,其在商業(yè)上對安全性和環(huán)境原因為重要的。適合的大腸桿菌宿主的其他實例包括(但不限于)BL21、DH10B或其衍生物的菌株。在本發(fā)明的方法的另一個實施例中,大腸桿菌宿主是包括(但不限于)OMP-和LON-的蛋白酶負菌株。宿主細胞菌株可以是包括(但不限于)熒光極毛桿菌、綠膿桿菌和惡息極毛桿菌的假單胞桿菌種。已知命名為菌株MB 101的熒光極毛桿菌生物變種1適用于重組生產(chǎn)并且可用于治療性蛋白質(zhì)生產(chǎn)工藝。假單胞菌表達系統(tǒng)的實例包括可以宿主菌株(可在World Wide Web,dow.com上購得的Midland,MI)購自DowChemical Company的系統(tǒng)。以引用的方式并入本文中的美國專利第4,755,465和4,859,600號,描述假單胞菌株作為用于hGH生產(chǎn)的宿主細胞的用途。
一旦重組宿主細胞菌株已經(jīng)建立(也就是說,表達構(gòu)筑體已經(jīng)被引入宿主細胞中并且具有正確表達構(gòu)筑體的宿主細胞被分離),就在適于生產(chǎn)所關(guān)注的多肽的條件下培養(yǎng)重組宿主細胞菌株。如所屬領(lǐng)域的技術(shù)人員顯而易見的,培養(yǎng)重組宿主細胞菌株的方法將視所利用的表達構(gòu)筑體的性質(zhì)和宿主細胞的同一性而定。通常使用所屬領(lǐng)域中熟知的方法培養(yǎng)重組宿主菌株。重組宿主細胞通常是在含有碳、氮和無機鹽的可吸收源,和(視需要)含有維生素、氨基酸、生長因子和其他為所屬領(lǐng)域的技術(shù)人員所知的蛋白質(zhì)培養(yǎng)補充物的液體培養(yǎng)基中培養(yǎng)。用于培養(yǎng)宿主細胞的液體培養(yǎng)基可以視需要含有防止不良微生物生長的抗生素或抗真菌劑和/或包括(但不限于)選擇含有表達載體的宿主細胞的抗生素的化合物。
重組宿主細胞可以分批或以連續(xù)形式培養(yǎng),同時細胞收集(在所關(guān)注的多肽細胞內(nèi)積聚的情況下)或培養(yǎng)物上清液的收集以分批或以連續(xù)形式進行。為在原核宿主細胞中進行生產(chǎn),分批培養(yǎng)和細胞收集為優(yōu)選的。
選擇密碼子本發(fā)明的選擇密碼子擴展蛋白質(zhì)生物合成器的遺傳密碼子框架。舉例而言,選擇密碼子包括(例如)獨特的3堿基密碼子,無義密碼子,諸如包括(但不限于)琥珀密碼子(UAG)、赭石密碼子或蛋白石密碼子(UGA)的終止密碼子,非天然密碼子,4堿基(或4個以上)密碼子,稀有密碼子等等。大量選擇密碼子(例如一個或一個以上、兩個或兩個以上、3個或3個以上的選擇密碼子)可被引入所要基因或多核苷酸中。
在一個實施例中,方法涉及選擇密碼子的用途,該選擇密碼子為用于活體內(nèi)并入例如非天然氨基酸的所選氨基酸的終止密碼子。舉例而言,生產(chǎn)識別終止密碼子的O-tRNA并且通過O-RS用所選氨基酸氨基酰化。所述O-tRNA不能通過天然存在的宿主的氨?;?tRNA合成酶識別出。慣用定位突變可用以在所關(guān)注的多肽中的所關(guān)注部位引入終止密碼子。參見(例如),Sayers,J.R.等人(1988),5′-3′Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis.Nucleic Acids Res,16791-802。當O-RS、O-tRNA和編碼所關(guān)注的多肽的核酸(例如)活體內(nèi)組合時,響應終止密碼子并入所選氨基酸以得到在規(guī)定位置上含有例如非天然氨基酸的所選氨基酸的多肽。在本發(fā)明的一個實施例中,用作選擇密碼子的終止密碼子是琥珀密碼子UAG和/或蛋白石密碼子UGA。舉例而言,就識別琥珀密碼子的O-tRNA的實例來說,參見SEQ ID NO.6,并且就識別蛋白石密碼子的O-tRNA的實例來說,參見SEQ ID NO.7。UAG和UGA都用作選擇密碼子的遺傳密碼可編碼22種氨基酸,同時保持為最豐富終止信號的赭石無義密碼子UAA。
能在活體內(nèi)并入例如非天然氨基酸的所選氨基酸而不會顯著干擾宿主細胞。舉例而言,在諸如大腸桿菌的非真核細胞中,因為UAG密碼子的抑制效率視例如琥珀抑制基因tRNA的O-tRNA與釋放因子1(RF1)(其結(jié)合于UAG密碼子并且引發(fā)生長肽從核糖體的釋放)之間的競爭而定,所以抑制效率可通過(例如)增加例如抑制基因tRNA的O-tRNA的表達水平或使用缺乏RF1的菌株來調(diào)節(jié)。在真核細胞中,因為UAG密碼子的抑制效率視例如琥珀抑制基因tRNA的O-tRNA與真核釋放因子(例如eRF)(其結(jié)合于終止密碼子并且引發(fā)生長肽從核糖體的釋放)之間的競爭而定,所以抑制效率可通過(例如)增加例如抑制基因tRNA的O-tRNA的表達水平來調(diào)節(jié)。
非天然氨基酸也能由稀有密碼子編碼。舉例而言,當活體外蛋白質(zhì)合成反應中的精氨酸濃度降低時,已經(jīng)證明稀有的精氨酸密碼子,即AGG對通過由丙氨酸?;暮铣蓆RNA插入Ala來說為有效的。參見(例如),Ma等人,Biochemistry,327939(1993)。在所述情況下,合成tRNA與作為次要物種存在于大腸桿菌中的天然存在的tRNAArg競爭。一些生物體不使用所有的三聯(lián)體密碼子。藤黃微球菌(Micrococcus luteus)中的未指定的密碼子AGA已經(jīng)被應用于在活體外轉(zhuǎn)錄/轉(zhuǎn)譯提取物中插入氨基酸。參見(例如),Kowal和Oliver,Nucl.Acid.Res.,254685(1997)??僧a(chǎn)生本發(fā)明的組分以在活體內(nèi)使用所述稀有密碼子。
選擇密碼子也包含(例如)4個或4個以上堿基密碼子的擴展密碼子,諸如4個、5個、6個或6個以上堿基密碼子。4堿基密碼子的實例包括(但不限于)AGGA、CUAG、UAGA、CCCU,諸如此類。5堿基密碼子的實例包括(但不限于)AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC,諸如此類。特征可包括基于移碼抑制使用擴展密碼子。4個或4個以上堿基密碼子可將(例如)一種或多種包括(但不限于)非天然氨基酸的所選氨基酸插入相同蛋白質(zhì)中。舉例而言,在具有反密碼子環(huán),例如具有CU(X)nXXXAA序列(其中n=1)的例如特殊移碼抑制基因tRNA的經(jīng)突變O-tRNA的存在下,4個或4個以上堿基密碼子讀取為單一氨基酸。舉例而言,就識別出4堿基密碼子的O-tRNA來說,參見來自PCT/US04 22061的SEQ ID NO.6、SEQ ID NO.12。在其他實施例中,反密碼子環(huán)可解碼(例如)至少4-堿基密碼子、至少5-堿基密碼子或至少6-堿基密碼子或至少6個以上堿基密碼子。因為存在256種可能的4-堿基密碼子,所以可使用4個或4個以上堿基密碼子在相同細胞中編碼多個非天然氨基酸。參見,Anderson等人,(2002)Exploring the Limits of Codon and Anticodon Size,Chemistry and Biology,9237-244;Magliery,(2001)Expanding the Genetic CodeSelection of Efficient Suppressorsof Four-base Codons and Identification of″Shifty″Four-base Codons with a LibraryApproach in Escherichia coli,J.Mol.Biol.307755-769。
舉例而言,使用活體外生物合成方法,4-堿基密碼子已經(jīng)被用以將非天然氨基酸并入蛋白質(zhì)中。參見(例如),Ma等人,(1993)Biochemistry.327939;和Hohsaka等人,(1999)J.Am.Chem.Soc,12134。CGGG和AGGU用以同時將2-萘基丙氨酸和賴氨酸的NBD衍生物與兩種經(jīng)化學?;囊拼a抑制基因tRNA一起活體外并入抗生蛋白鏈菌素中。參見(例如),Hohsaka等人,(1999)J.Am.Chem.Soc,12112194。在活體內(nèi)研究中,Moore等人調(diào)查了具有NCUA反密碼子的tRNALeu衍生物抑制UAGN密碼子(N可為U、A、G或C)的能力,并且發(fā)現(xiàn)四聯(lián)體UAGA可通過具有UCUA反密碼子的tRNALeu,以13到26%的效率解碼,同時在0或-1框中少量解碼。參見,Moore等人,(2000)J.Mol.Biol.,298195。在一個實施例中,基于稀有密碼子或無義密碼子的擴展密碼子可用于本發(fā)明中,所述擴展密碼子可降低在其他不需要的部位上的錯義讀取和移碼抑制。
對給定系統(tǒng)來說,選擇密碼子也可包括天然3堿基密碼子之一,其中內(nèi)源性系統(tǒng)不使用(或很少使用)天然堿基密碼子。舉例而言,所述系統(tǒng)包括缺乏識別出天然3堿基密碼子的tRNA的系統(tǒng),和/或其中3堿基密碼子是稀有密碼子的系統(tǒng)。
選擇密碼子視需要包括非天然堿基對。所述非天然堿基對進一步擴展現(xiàn)存的遺傳字母表。一個額外的堿基對使三聯(lián)體密碼子的數(shù)目從64增加到125。第三堿基對的性質(zhì)包括穩(wěn)定的和選擇性的堿基配對、以高保真度通過聚合酶有效地酶促并入DNA中,和在初生非天然堿基對的合成后有效的連續(xù)的引物延伸??蛇m宜于方法和組合物的非天然堿基對的描述包括(例如)Hirao等人,(2002)An unnatural base pair for incorporating aminoacidanalogues intoprotein,Nature Biotechnology,20177 182。又參見,Wu,Y.等人,(2002)J.Am.Chem.Soc.12414626-14630。其他相關(guān)公開案列于下文。
對活體內(nèi)使用來說,非天然核苷可滲透膜并且經(jīng)磷酸化以形成對應的三磷酸鹽。另外,增加的遺傳信息是穩(wěn)定的并且不會被細胞酶破壞。Benner和其他人的早先努力利用不同于典型的Watson-Crick對中的所述型式的氫鍵型式,其中最值得注意的實例是iso-C:iso-G對。參見(例如),Switzer等人,(1989)J.Am.Chem.Soc,1118322;和Piccirilli等人,(1990)Nature.34333;Kool,(2000)Curr.Opin.Chem.Biol.,4602。所述堿基一般說來在某種程度上與天然堿基錯配并且不能酶促地復制。Kool和同事證明,堿基之間的疏水性包裝相互作用能置換氫鍵以驅(qū)動堿基對的形成。參見,Kool,(2000)Curr.Opin.Chem.Biol.,4602;和Guckian和Kool,(1998)Angew.Chem.Int.Ed.Engl.,36,2825。在致力于開發(fā)滿足所有上述要求的非天然堿基對的過程中,Schultz、Romesberg和同事系統(tǒng)地合成和研究了一系列非天然疏水性堿基。發(fā)現(xiàn)PICS:PICS自身對比天然堿基對更穩(wěn)定,并且可有效地通過大腸桿菌DNA聚合酶I的克林諾片段(Klenow fragment,KF))并入DNA中。參見(例如),McMinn等人,(1999)J.Am.Chem.Soc,12111585-6;和Ogawa等人,(2000)J.Am.Chem.Soc,1223274。3MN:3MN自身對能通過KF,以足夠用于生物功能的效率和選擇性來合成。參見(例如),Ogawa等人,(2000)J.Am.Chem.Soc,1228803。然而,兩個堿基擔當進一步復制的鏈終止劑。最近,已經(jīng)開發(fā)可用以復制PICS自身對的突變DNA聚合酶。另外,可復制7AI自身對。參見(例如),Tae等人,(2001)J.Am.Chem.Soc,1237439。也已經(jīng)開發(fā)了新穎的金屬堿基對,即Dipic:Py,其在結(jié)合銅(II)后形成穩(wěn)定的對。參見,Meggers等人,(2000)J.Am.Chem.Soc,12210714。因為擴展密碼子和非天然密碼子本質(zhì)上與天然密碼子正交,所以本發(fā)明的方法可以利用所述性質(zhì)來產(chǎn)生其正交的tRNA。
轉(zhuǎn)譯旁路系統(tǒng)也可用以將例如非天然氨基酸的所選氨基酸并入所要多肽中。在轉(zhuǎn)譯旁路系統(tǒng)中,大的序列被插入基因中但不轉(zhuǎn)譯成蛋白質(zhì)。序列含有充當誘導核糖體跳過序列并且在插入物的下游恢復轉(zhuǎn)譯的結(jié)構(gòu)。
所選氫基酸和非天然氨基酸如本文中所使用,所選氨基酸指的是任何所要求的天然存在的氨基酸或非天然氨基酸。天然存在的氨基酸包括20種經(jīng)遺傳編碼的α-氨基酸中的任何一種丙氨酸、精氨酸、天門冬酰胺、天門冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異白氨酸、白氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸、纈氨酸。在一個實施例中,所選氨基酸是以高保真度,以對給定選擇密碼子來說大于約70%的效率、以對給定選擇密碼子來說大于約75%的效率、以對給定選擇密碼子來說大于約80%的效率、以對給定選擇密碼子來說大于約85%的效率、以對給定選擇密碼子來說大于約90%的效率、以對給定選擇密碼子來說大于約95%的效率,或以對給定選擇密碼子來說大于約99%或99%以上的效率,并入生長多肽鏈中。
如本文中所使用,非天然氨基酸指的是任何氨基酸、經(jīng)修飾的氨基酸或不同于硒代半胱氨酸和/或吡咯賴氨酸和以下20種經(jīng)遺傳編碼的α-氨基酸的氨基酸類似物丙氨酸、精氨酸、天門冬酰胺、天門冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異白氨酸、白氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸、纈氨酸。α-氨基酸的通用結(jié)構(gòu)由式I說明 非天然氨基酸通常為具有式I的任何結(jié)構(gòu),其中R基團是不同于20種天然氨基酸中所用取代基的的任何取代基。就20種天然氨基酸的結(jié)構(gòu)來說,參見(例如)L.Stryer的Biochemistry,第三版.1988,F(xiàn)reeman and Company,New York。注意,本發(fā)明的非天然氨基酸可為不同于上述20種α-氨基酸的天然存在的化合物。
因為本發(fā)明的非天然氨基酸通常僅在側(cè)鏈的結(jié)構(gòu)上不同于天然氨基酸,所以非天然氨基酸以與酰胺鍵在天然存在的蛋白質(zhì)中形成的相同方式,與包括(但不限于)天然或非天然的其他氨基酸形成酰胺鍵。然而,非天然氨基酸具有使其區(qū)別于天然氨基酸的側(cè)鏈基團。舉例而言,式I中的R可以包含烷基-、芳基-、?;?、酮基-、疊氮基-、羥基-、肼、氰基-、鹵基-、酰肼、烯基、炔基、醚、硫醇、硒基-、磺?;?、硼酸基-、酉朋酸基、磷酸基、膦?;?、膦、雜環(huán)基、烯酮、亞胺、醛、酯、硫代酸、羥胺、胺,諸如此類或其任何組合。其他非天然存在的氨基酸包括(但不限于)包含可光活化的交聯(lián)劑的氨基酸、經(jīng)自旋標記的氨基酸、發(fā)熒光的氨基酸、結(jié)合金屬的氨基酸、含金屬的氨基酸、放射性氨基酸、具有新穎的官能團的氨基酸、共價地或非共價地與其他分子相互作用的氨基酸、光致籠罩和/或光致異構(gòu)化的氨基酸、包含生物素或生物素類似物的氨基酸、諸如經(jīng)糖取代的絲氨酸的經(jīng)糖基化的氨基酸、經(jīng)其他碳水化合物修飾的氨基酸、含酮的氨基酸、包含聚乙二醇或聚醚的氨基酸、經(jīng)重原子取代的氨基酸、可化學裂解和/或可光致裂解的氨基酸、當與天然氨基酸比較時具有伸長側(cè)鏈的氨基酸,所述伸長側(cè)鏈包括(但不限于)聚醚或(包括(但不限于))大于約5個或大于約10個碳的長鏈烴、經(jīng)碳連接的含糖氨基酸、氧化還原活性的氨基酸、含氨基硫代酸的氨基酸和包含一個或一個以上毒性部分的氨基酸。又參見,美國專利申請公開案2003/0082575和2003/0108885,其是以引用的方式并入本文中。非天然氨基酸可以具有用以(例如)將蛋白質(zhì)連接到固體支撐物的可光活化的交聯(lián)劑。非天然氨基酸可以具有與氨基酸側(cè)鏈連接的糖類部分。
除含有新穎側(cè)鏈的非天然氨基酸之外,(例如)由式II和III的結(jié)構(gòu)所說明,非天然氨基酸視需要也包含經(jīng)修飾的骨架結(jié)構(gòu)
其中Z通常包含OH、NH2、SH、NH-R′或S-R′;可為相同或不同的X和Y通常包含S或O,并且視需要為相同或不同的R和R′通常是選自上文對具有式I的非天然氨基酸所描述的R基團的成分的相同清單以及氫。舉例而言,如由式II和III所說明,非天然氨基酸可以包含在氨基或羧基上的取代。所述類型的非天然氨基酸包括(但不限于)α-羥酸、α-硫代酸、α-氨基硫代羧酸酯,例如具有對應于常見20種天然氨基酸的側(cè)鏈或非天然側(cè)鏈的那些非天然氨基酸。另外,在α-碳上的取代視需要包括L-取代、D-取代或α-α-二取代的氨基酸,諸如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨基丁酸,諸如此類。其他結(jié)構(gòu)替換物包括諸如脯氨酸類似物以及3、4、6、7、8和9元環(huán)脯氨酸類似物的環(huán)狀氨基酸,諸如經(jīng)取代β-丙氨酸和γ-氨基丁酸的β和γ氨基酸。
許多非天然氨基酸是基于諸如酪氨酸、谷氨酰胺、苯丙氨酸,諸如此類的天然氨基酸。酪氨酸類似物包括對位取代的酪氨酸、鄰位取代的酪氨酸和間位取的代酪氨酸,其中經(jīng)取代的酪氨酸包含酮基(包括(但不限于)乙?;?、苯甲?;?、氨基、肼、羥胺、硫醇基、羧基、異丙基、甲基、C6-C20直鏈或支鏈烴、飽和或不飽和烴、O-甲基、聚醚基、硝基等等。另外,也涵蓋經(jīng)多取代的芳基環(huán)。谷氨酰胺類似物包括(但不限于)α-羥基衍生物、γ-取代的衍生物、環(huán)狀衍生物和經(jīng)酰胺取代的谷氨酰胺衍生物。苯丙氨酸類似物的實例包括(但不限于)對位取代的苯丙氨酸、鄰位取代的苯丙氨酸和間位取代的苯丙氨酸,其中取代基包含羥基、甲氧基、甲基、烯丙基、醛、疊氮基、碘基、溴基、酮基(包括(但不限于)乙?;?等等。非天然氨基酸的特定實例包括(但不限于)對乙酰基-L-苯丙氨酸、對炔丙基-苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、三-O-乙?;?GlcNAcβ-絲氨酸、L-Dopa、氟化苯丙氨酸、異丙基-L-苯丙氨酸、對疊氮基-L-苯丙氨酸、對酰基-L-苯丙氨酸、對苯甲酰基-L-苯丙氨酸、L-磷酸絲氨酸、膦?;z氨酸、膦酰基酪氨酸、對碘-苯丙氨酸、對溴苯丙氨酸、對氨基-L-苯丙氨酸、異丙基-L-苯丙氨酸和對炔丙基氧基-苯丙氨酸,諸如此類。各種非天然氨基酸的結(jié)構(gòu)的實例提供于(例如)標題為“In vivoincorporation of unnatural amino acids”的WO 2002/085923中,其是以引用的方式并入本文中。對其他甲硫氨酸類似物來說,又參見,Kiick等人,(2002)Incorporation of azides intorecombinant proteins for chemoselective modification by the Staudinger ligation,PNAS9919-24,其是以引用的方式并入本文中。
在氨基末端并入多肽中的非天然氨基酸可包含為不同于20種天然氨基酸中所用取代基中的任何取代基的R基團,和不同于通常存在于α-氨基酸(參見式I)中的NH2基團的第二反應性基團。相似的非天然氨基酸可在羧基末端并入具有不同于通常存在于α-氨基酸(參見式I)中的COOH基團的第二反應性基團。
本發(fā)明的非天然氨基酸可以經(jīng)選擇或設(shè)計以提供在20種天然氨基酸中得不到的其他特征。舉例而言,非天然氨基酸可以視需要經(jīng)設(shè)計或選擇以改變(例如)所述非天然氨基酸并入其中的蛋白質(zhì)的生物學性質(zhì)。舉例而言,以下性質(zhì)可以視需要通過將非天然氨基酸包含于蛋白質(zhì)中來改變毒性,體內(nèi)分解,可溶性,例如熱穩(wěn)定性、水解穩(wěn)定性、氧化穩(wěn)定性、抗酶促降解諸如此類的穩(wěn)定性,純化和處理的容易性,結(jié)構(gòu)性質(zhì),光譜性質(zhì),化學的和/或光化性質(zhì),催化活性,氧化還原電位,半衰期,與其他分子(例如)共價地或非共價地反應的能力,諸如此類。
各種非天然氨基酸的結(jié)構(gòu)提供于(例如)標題為“In vivo incorporation of unnaturalamino acids”的WO 2002/085923的圖16、17、18、19、26和29中,其是以引用的方式并入本文中。所述實例不意謂著以任何方式限制可與本發(fā)明的tRNA連接的氨基酸。
非天然氨基酸的一個優(yōu)點是其存在可用以添加其他分子的其他化學部分。所述修飾可在真核或非真核細胞中,活體內(nèi)或活體外進行。因此,在某些實施例中,后轉(zhuǎn)譯修飾是通過非天然氨基酸實現(xiàn)。利用為所屬領(lǐng)域的技術(shù)人員所知的適于具體反應性基團的化學方法,多肽中的非天然氨基酸可用以將另一分子連接到多肽,包括(但不限于)將包含第二反應性基團的以下物質(zhì)連接到包含第一反應性基團的至少一種非天然氨基酸標記、染料、聚合物、水溶性聚合物、聚乙二醇的衍生物、光致交聯(lián)劑、放射性核素、細胞毒素化合物、藥物、親和標記、光親和標記、反應性化合物、樹脂、第二蛋白質(zhì)或多肽或多肽類似物、抗體或抗體片段、金屬螯合劑、輔助因子、脂肪酸、糖類、多核苷酸、DNA、RNA、反義多核苷酸、糖類、水溶性樹枝狀聚合物、環(huán)糊精、抑制性核糖核酸、生物材料、納米粒子、自旋標記物、熒光團、含金屬的部分、放射部分、新穎官能團、共價地或非共價地與其他分子相互作用的基團、光致籠罩部分、可光化輻射激發(fā)的部分、光致異構(gòu)化部分、生物素、生物素的衍生物、生物素類似物、并入重原子的部分、可化學裂解的基團、可光致裂解的基團、伸長的側(cè)鏈、經(jīng)碳連接的糖、氧化還原性活性劑、氨基硫代酸、毒性部分、經(jīng)同位素標記的部分、生物物理學探針、發(fā)磷光的基團、化學發(fā)光基團、電子密基團、磁性基團、插入基團、發(fā)色團、能量轉(zhuǎn)移劑、生物活性劑、可檢測的標記、小分子、量子點、納米傳導物,或上述物質(zhì)的任何組合或任何其他所需的化合物或物質(zhì)。
舉例而言,后轉(zhuǎn)譯修飾可通過親核-親電子反應進行。當前用于選擇性修飾蛋白質(zhì)的大多數(shù)反應涉及在親核與親電子反應搭配物之間形成共價鍵,包括(但不限于)α-鹵基酮與組氨酸或半胱氨酸側(cè)鏈的反應。所述情況下的選擇性是通過蛋白質(zhì)中的親核殘基的數(shù)量和可達性決定。在本發(fā)明的蛋白質(zhì)中,可使用其他更有選擇性的反應,諸如在活體外和活體內(nèi),非天然酮-氨基酸與酰肼或氨基氧基化合物的反應。參見(例如),Cornish等人,(1996)J.Am.Chem.Soc,1188150-8151;Mahal等人,(1997)Science,2761125-1128;Wang等人,(2001)Science292498-500;Chin等人,(2002)J.Am.Chem.Soc.1249026-9027;Chin等人,(2002)Proc.Natl.Acad.Sci.,9911020-11024; Wang等人,(2003)Proc.Natl.Acad.Sci.,10056-61;Zhang等人,(2003)Biochemistry.426735-6746;和Chin等人,(2003)Science,301964-7,其全部以引用的方式并入本文中。所述反應允許用包括熒光團、交聯(lián)劑、糖類衍生物和細胞毒素分子的大量試劑來選擇性標記幾乎任何的蛋白質(zhì)。又參見,標題為“Glycoprotein Synthesis”的美國專利第6,927,042號,其是以引用的方式并入本文中。(包括(但不限于))通過疊氮基氨基酸的后轉(zhuǎn)譯修飾也能通過Staudinger連接(包括(但不限于)用三芳基膦試劑)來進行。參見(例如)Kiick等人,(2002)Incorporation of azides into recombinant proteins forchemoselective modification by the Staudinger ligation,PNAS9919-24。
非天然氨基酸的化學合成許多非天然氨基酸可購自(例如)Sigma-Aldrich(St.Louis,MO,USA)、Novabiochem(a division of EMD Biosciences,Darmstadt,Germany)或Peptech(Burlington,MA,USA)。不能購得的所述氨基酸視需要如本文中所提供的或使用為所屬領(lǐng)域的技術(shù)人員所知的標準方法來合成。對有機合成技術(shù)來說,參見(例如),F(xiàn)essendon和Fessendon的OrganicChemistry(1982,第二版,Willard Grant Press,Boston Mass.);March的Advanced OrganicChemistry(第三版,1985,Wiley and Sons,New York);和Carey和Sundberg的AdvancedOrganic Chemistry(第三版,部分A和B,1990,Plenum Press,New York)。描述非天然氨基酸的合成的其他公開案包括(例如),標題為“In vivo incorporation of Unnatural AminoAcids”的WO 2002/085923;Matsoukas等人,(1995)J.Med.Chem.,38,4660-4669; King,F(xiàn).E.和Kidd,D.A.A.(1949)A New Synthesis of Glutamine and of y-Dipeptides of GlutamicAcid from Phthylated Intermediates.J.Chem.Soc,3315-3319;Friedman,O.M.和Chatterrji,R.(1959)Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents.J.Am.Chem.Soc.81,3750-3752;Craig,J.C.等人(1988)Absolute Configuration of theEnantiomers of 7-Chloro-4[[4-(diethylamino)-1-methylbutyl]amino]quinoline(Chloroquine).J.Org.Chem.53,1167-1170;Azoulay,M.,Vilmont,M.和Frappier,F(xiàn).(1991)Glutamineanalogues as Potential Antimalarials,Eur.J.Med.Chem.26,201-5;Koskinen,A.M.P.和Rapoport,H.(1989)Synthesis of 4-Substituted Prolines as Conformationally ConstrainedAmmo Acid Analogues.J.Org.Chem.54,1859-1866;Christie,B.D.和Rapoport,H.(1985)Synthesis of Optically Pure Pipecolates from L-Asparagine.Application to the TotalSynthesis of (+)-Apovincamine through Amino Acid Decarbonylation and Iminium IonCyclization.J.Org.Chem.501239-1246;Barton等人,(1987)Synthesis of Novelalpha-Amino-Acids and Derivatives Using Radical ChemistrySynthesis of L-andD-alpha-Amino-Adipic Acids,L-alpha-aminopimelic Acid and Appropriate UnsaturatedDerivatives.Tetrahedron434297-4308;和Subasinghe等人,(1992)Quisqualic acidanaloguessynthesis of beta-heterocyclic 2-aminopropanoic acid derivatives and theiractivity at a novel quisqualate-sensitized site.J.Med.Chem.354602-7。又參見,標題為“Protein Arrays”的美國專利公開案第US 2004/0198637號,其是以引用的方式并入本文中。
非天然氨基酸的細胞吸收非天然氨基酸通過細胞的吸收是通常在設(shè)計和選擇(例如)用于并入蛋白質(zhì)中的非天然氨基酸時,通??紤]的一個問題。舉例而言,α-氨基酸的高電荷密度暗示所述化合物不可能為可滲透細胞的。天然氨基酸是通過許多以蛋白質(zhì)為主的運輸系統(tǒng)而吸收到細胞中??蛇M行快速篩選,其評定哪種非天然氨基酸(”使有的話)被細胞吸收。參見(例如),在(例如)標題為“Protein Arrays”的美國專利公開案第US 2004/0198637號中的毒性檢定,所述專利是以引用的方式并入本文中;和Liu,D.R.和Schultz,P.G(1999)Progress toward the evolution of an organism with an expanded genetic code.PNAS UnitedStates964780-4785中的毒性檢定。雖然吸收容易用各種檢定來分析,但是設(shè)計經(jīng)受細胞吸收路徑的非天然氨基酸的另一選擇為提供活體內(nèi)產(chǎn)生氨基酸的生物合成路徑。
非天然氨基酸的生物合成許多生物合成路徑已經(jīng)存在于細胞中用于生產(chǎn)氨基酸和其他化合物。雖然具體的非天然氨基酸的生物合成方法可能實質(zhì)上不存在于(包括(但不限于))細胞中,但是本發(fā)明提供所述方法。舉例而言,非天然氨基酸的生物合成路徑視需要在宿主細胞中,通過添加新的酶或改變現(xiàn)有的宿主細胞路徑來產(chǎn)生。其他新的酶視需要為天然存在的酶或人工發(fā)展的酶。舉例而言,對氨基苯丙氨酸的生物合成(如標題為“In vivo incorporationof unnatural amino acids”的WO 2002/085923中所呈現(xiàn))依靠于添加來自其他生物體的已知酶的組合。所述酶的基因能通過用包含基因的質(zhì)粒使細胞轉(zhuǎn)形而引入細胞中。當在細胞中表達時,基因提供合成所要化合物的酶促路徑。視需要添加的酶的類型的實例提供于下文的實例中。其他的酶序列見于(例如)基因庫中。也視需要以同樣方式將人工發(fā)展的酶添加到細胞中。如此,操縱細胞器和細胞的資源以生產(chǎn)非天然氨基酸。
各種方法可用于生產(chǎn)供生物合成路徑使用或用于發(fā)展現(xiàn)有路徑的新穎的酶。舉例而言,視需要將(例如)如由Maxygen,Inc.開發(fā)的遞歸性重組(可在World Wide Web,maxygen.com上得到)用于開發(fā)新穎的酶和路徑。參見(例如),Stemmer(1994),Rapidevolution of a protein in vitro by DNA shuffling,Nature370(4)389-391;和Stemmer,(1994),DNA shuffling by random fragmentation and reassemblyIn vitro recombination formolecular evolution,Proc.Natl.Acad.Sci.USA.,9110747-10751。同樣地,視需要將由Genencor開發(fā)的DesignPathTM(可在World Wide Web,genencon.com上得到)用于代謝路徑工程化,例如用于工程化路徑以在細胞中產(chǎn)生O-甲基-L-酪氨酸。所述技術(shù)使用(包括(但不限于))通過功能基因組而鑒別的那些基因的新基因和分子進化和設(shè)計的組合,而在宿主生物體中重建現(xiàn)有路徑。Diversa Corporation(可在World Wide Web,diversa.com上得到)也提供快速篩選基因和基因路徑的庫(包括(但不限于))以產(chǎn)生新的路徑的技術(shù)。
通常,由本發(fā)明的工程化生物合成路徑生產(chǎn)的非天然氨基酸,是以包括(但不限于)天然細胞量的足夠用于有效的蛋白質(zhì)生物合成,但不達到影響其他氨基酸的濃度或耗盡細胞資源的程度的濃度來生產(chǎn)。以所述方式在活體內(nèi)生產(chǎn)的典型濃度是約10mM到約0.05mM。一旦細胞由包含用以生產(chǎn)特定路徑所需的酶的基因的質(zhì)粒轉(zhuǎn)形并且產(chǎn)生非天然氨基酸,活體內(nèi)選擇就視需要用以進一步優(yōu)化用于核糖體蛋白合成和細胞生長的非天然氨基酸的生產(chǎn)。
核酸和多肽序列和變體如上文和下文所述,本發(fā)明提供核酸多核苷酸序列和多肽氨基酸序列(例如tRNA和RS)和(例如)包含所述序列的組合物和方法。所述序列的實例(例如tRNA和RS)揭示于本文中。然而,所屬領(lǐng)域的技術(shù)人員將了解,本發(fā)明不限于揭示本文中(例如實例中)的所述序列。所屬領(lǐng)域的技術(shù)人員將了解,本發(fā)明也提供具有例如編碼O-tRNA或O-RS的本文中描述的功能的許多相關(guān)和無關(guān)的序列。
本發(fā)明提供多肽(O-RS)和例如O-tRNA的多核苷酸,編碼O-RS或其部分的多核苷酸,用以分離氨?;?tRNA合成酶無性系的寡核苷酸等。本發(fā)明的多核苷酸包括,編碼具有一個或一個以上選擇密碼子的本發(fā)明所關(guān)注的蛋白質(zhì)或多肽的多核苷酸。另外,本發(fā)明的多核苷酸包括,(例如)包含如SEQ ED NO.4中所述的核苷酸序列的多核苷酸;與其多核苷酸序列互補的多核苷酸或編碼其多核苷酸序列的多核苷酸,或其保守變化。本發(fā)明的多核苷酸也包括編碼本發(fā)明的多肽的多核苷酸。同樣地,在高度嚴格的條件下,在核酸的大體上全部長度上與上文指示的多核苷酸雜交的核酸是本發(fā)明的多核苷酸。在一個實施例中,組合物包括本發(fā)明的多肽和賦形劑(例如緩沖劑、水、醫(yī)藥學上可接受的賦形劑等)。另外,本發(fā)明的多肽包括,(例如)包含如SEQ ID NO.5中所述的氨基酸序列的多肽;與其多肽序列互補的多肽或編碼其多肽序列的多肽,或其保守變化。本發(fā)明也提供可與本發(fā)明的多肽特異地免疫反應的抗體或抗血清。
在某些實施例中,載體(例如,質(zhì)粒、粘質(zhì)粒、噬菌體、細菌、病毒、裸露多核苷酸、結(jié)合的多核苷酸等)包含本發(fā)明的多核苷酸。在一個實施例中,載體是表達載體。在另一個實施例中,表達載體包括操作性地與本發(fā)明的一種或一種以上多核苷酸連接的啟動子。在另一個實施例中,細胞包含包括本發(fā)明的多核苷酸的載體。
所屬領(lǐng)域的技術(shù)人員也將了解,所揭示序列的許多變體包括在本發(fā)明中。舉例而言,產(chǎn)生功能性相同的序列的所揭示序列的保守變化包括在本發(fā)明中。變體與至少一種所揭示序列雜交的核酸多核苷酸序列的變體,視為包括在本發(fā)明內(nèi)。如通過(例如)標準序列比較技術(shù)所測定的本文中所揭示序列的獨特子序列也包括在本發(fā)明內(nèi)。
保守變化由于遺傳密碼的簡并,“靜止的取代”(也就是說,不造成所編碼的多肽改變的核酸序列的取代)是編碼氨基酸的每種核酸序列的包含特征。同樣地,氨基酸序列中的一個或少數(shù)氨基酸的“保守氨基酸取代”是經(jīng)具有高度相似性質(zhì)的不同氨基酸取代,也易鑒別為高度相似于所揭示的構(gòu)筑體。各個所揭示序列的所述保守變化是本發(fā)明的特征。
具體核酸序列的“保守變化”指的是編碼相同或基本上相同的氨基酸序列的核酸,或其中核酸不將氨基酸序列編碼成基本上相同的序列的核酸。所屬領(lǐng)域的技術(shù)人員將認識到,改變、添加或刪去編碼序列中的單一氨基酸或小百分比氨基酸的個別取代、缺失或添加是“經(jīng)保守修飾的變化”或“經(jīng)保守修飾的變體”,其中所述改變造成氨基酸的缺失,氨基酸的添加或氨基酸由化學相似的氨基酸取代。因此,本發(fā)明的所列多肽序列的“保守變化”包括,用具有相同保守取代基的經(jīng)保守選擇的氨基酸取代多肽序列的小百分比,通常小于5%、更通常小于4%、2%或1%的氨基酸。不改變核酸分子的編碼活性的序列的添加,諸如無功能序列的添加,是基本核酸的保守變化。
提供功能性相似的氨基酸的保守取代表為所屬領(lǐng)域的技術(shù)人員所知。以下八種基團各自含有為用于彼此的保守取代的氨基酸1)丙氨酸(A)、甘氨酸(G);2)天門冬氨酸(D)、谷氨酸(E);3)天門冬酰胺(N)、谷氨酰胺(Q);4)精氨酸(R)、賴氨酸(K);5)異白氨酸(I)、白氨酸(L)、甲硫氨酸(M)、纈氨酸(V);6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);7)絲氨酸(S)、蘇氨酸(T);和8)半胱氨酸(C)、甲硫氨酸(M)(參見(例如),Creighton,ProteinsStructures and Molecular Properties(W HFreeman&Co.;第二版(1993年12月)核酸雜交比較性雜交可用以鑒別諸如SEQ ID NO.4的本發(fā)明的核酸,包括本發(fā)明的核酸的保守變化,并且所述比較性雜交方法是區(qū)別本發(fā)明的核酸的優(yōu)選方法。另外,在高、超高和/或超-超高嚴格條件下,雜交到由SEQ ID NO4表示的核酸的目標核酸是本發(fā)明的特征。所述核酸的實例包括與給定核酸序列相比,具有一種或少數(shù)靜止的或保守核酸取代的核酸。
當測試核酸雜交至少1/2到探針,同樣雜交至少1/2到完全匹配的互補目標時,也就是說,在完全匹配的探針以與對不匹配的目標核酸中的任何核酸的雜交所觀察到的至少約5x-10x高的信噪比而與完全匹配的互補目標結(jié)合的條件下,測試核酸以與探針雜交到目標的信噪比的至少1/2高的信噪比雜交,被說成特異性地雜交到探針核酸。
核酸當其通常在溶液中締合時會“雜交”。核酸由于諸如氫鍵、溶劑排斥、堿基堆積,諸如此類的各種經(jīng)充分表征的物理化學力而雜交。短語“嚴格的雜交條件”指的是如所屬領(lǐng)域中已知的低離子強度和高溫的條件。通常,在嚴格條件下,探針將雜交到核酸的復合混合物(包括(但不限于)總體細胞或庫的DNA或RNA)中的其目標子序列,但未雜交到復合混合物中的其他序列。核酸雜交的廣泛指南可見于Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with NucleicAcid Probes第2章第I部分,″Overview of principles of hybridization and the strategy ofnucleic acid probe assays,″(Elsevier,New York),以及見于Ausubel等人,Current Protocolsin Molecular Biology(1995)。英國,牛津,牛津大學出版社出版的Hames and Higgins(1995)Gene Probes 1IRL(Hames and Higgins 1)和英國,牛津,牛津大學出版社出版的Hamesand Higgins(1995)Gene Probes 2IRL(Hames and Higgins 2)提供合成、標記、檢測和定量包括寡核苷酸的DNA和RNA的詳細描述。通常,嚴格條件選擇為比在所定義的離子強度pH值下,特定序列的熱力學熔點(Tm)低約5-10℃。Tm是50%補充到目標的探針與處于平衡的目標序列雜交(因為目標序列在Tm下過量存在,所以50%的探針在平衡狀態(tài)下被占據(jù))的溫度(在所定義的離子強度、pH值和核酸濃度下)。嚴格條件可以是其中在pH7.0到8.3下,鹽濃度小于約1.0M鈉離子,通常約0.01到1.0M鈉離子濃度(或其他鹽)并且對短探針(包括(但不限于)10到50個核苷酸)來說,溫度至少約30℃并且對長探針(包括(但不限于)大于50個核苷酸)來說,溫度至少約60C的所述嚴格條件。嚴格條件也可以由添加諸如甲酰胺的去穩(wěn)定劑實現(xiàn)。對選擇性雜交或特異性雜交來說,正信號可以是至少2次背景雜交,視需要10次背景雜交。示范性嚴格雜交條件可如下50%甲酰胺、5XSSC和1%SDS,在42℃下培養(yǎng),或5XSSC、1%SDS,在65℃下培養(yǎng),并在65℃下,在0.2XSSC和0.1%SDS中洗滌。所述洗滌可執(zhí)行5、15、30、60、120或120分鐘以上。
在過濾器上,在南方墨點或北方墨點中,用于雜交具有超過100個互補殘基的互補核酸的嚴格雜交條件的實例是在42℃下,具有1mg的肝素50%的福爾馬林(formalin),以及將雜交執(zhí)行整夜。嚴格洗滌條件的實例是在65℃下0.2xSSC洗滌15分鐘(參見,Sambrook等人,Molecular Cloning,A Laboratory Manual(第三版2001)對SSC緩沖液的描述)。通常,高嚴格性的洗滌是在低嚴格性的洗滌之前進行以除去背景探針信號。實例低嚴格性的洗滌是在40C下2xSSC歷時15分鐘。一般而言,比在具體的雜交檢定中的對無關(guān)探針所觀察到的信噪比高5x(或更高)的信噪比指示特異性雜交的檢測。
在諸如南方雜交和北方雜交的核酸雜交實驗的上下文中的“嚴格的雜交洗滌條件”是序列依賴性的,并且在不同的環(huán)境參數(shù)下而不同。較長序列特別在更高的溫度下雜交。核酸的雜交的廣泛指南可見于Tijssen(1993),同上,并且見于Hames和Higgins,1和2中??扇菀讘{經(jīng)驗測定任何測試核酸的嚴格雜交和洗滌條件。舉例而言,在測定高嚴格的雜交和洗滌條件中,使雜交和洗滌條件逐漸增加(例如,在雜交或洗滌中,通過增加溫度、降低鹽濃度、增加洗滌劑濃度和/或增加諸如福爾馬林的有機溶劑的濃度)直到滿足所選的準則組。舉例而言,雜交和洗滌條件是逐漸增加,直到探針以與對探針雜交到不匹配目標所觀察到的信噪比的至少5x高的信噪比與完全匹配的互補目標結(jié)合。
選擇“極嚴格的”條件以使其等于具體探針的熱熔點(Tm)。Tm是50%的測試序列雜交到完全匹配的探針的溫度(在所定義的離子強度和pH值下)。出于本發(fā)明的目的,通常,選擇“高嚴格的”雜交和洗滌條件以使其比在所定義的離子強度和pH值下特定序列的Tm低約5℃。
“超高-嚴格性”雜交和洗滌條件是其中雜交和洗滌條件的嚴格性增加,直到探針結(jié)合到完全匹配的互補目標核酸的信噪比為對雜交到不匹配目標核酸中的任何核酸所觀察到的信噪比的至少10x高的所述條件。在所述條件下,以完全匹配的互補目標核酸的信噪比的至少1/2的信噪比雜交到探針的目標核酸,被說成在超高嚴格條件下結(jié)合到探針。
同樣地,甚至更高程度的嚴格性可通過逐漸增加相關(guān)雜交檢定的雜交和/或洗滌條件來測定。舉例而言,所述條件為,其中雜交和洗滌條件的嚴格性增加直到探針結(jié)合到完全匹配的互補目標核酸的信噪比為對雜交到不匹配目標核酸中的任何核酸所觀察到的信噪比的至少10X、20X、50X、100X或500X或500X以上高的條件。在所述條件下,以完全匹配的互補目標核酸的信噪比的1/2的信噪比雜交到探針的目標核酸,被說成在超-超高嚴格條件下結(jié)合到探針。
在嚴格條件下不彼此雜交的核酸,如果其編碼的多肽大體上相同的,那么其仍是大體上相同的。這發(fā)生在(例如)當使用由遺傳密碼允許的最大密碼子簡并來產(chǎn)生核酸的復本時。
獨特子序列在一個方面中,本發(fā)明提供包含選自本文中揭示的O-tRNA和O-RS的序列的核酸中的獨特子序列的核酸。與對應于任何已知的O-tRNA或O-RS核酸序列的核酸相比,獨特子序列是獨特的。可使用(例如)BLAST設(shè)定缺省參數(shù)來執(zhí)行比對。任何獨特子序列適于用作(例如)鑒別本發(fā)明的核酸的探針。
同樣地,本發(fā)明包括多肽,其包含選自本文中揭示的O-RS的序列的多肽中的獨特子序列。在此,與對應于已知多肽序列中的任何序列的多肽相比,獨特子序列是獨特的。
本發(fā)明也提供目標核酸,其在嚴格條件下雜交到編碼選自O(shè)-RS的序列的多肽中的獨特子序列的獨特編碼寡核苷酸,其中與對應于任何對照多肽(例如親本序列,本發(fā)明的合成酶(例如)通過突變自其得到)的多肽相比,獨特子序列是獨特的。獨特序列如上所述測定。
序列比較、同一性和同源性在兩個或兩個以上的核酸或多肽序列的情況下,術(shù)語“相同”或“同一性”百分比指的是當在比較窗口上或指定區(qū)域上比較和比對最大對應性時,按使用下文所述序列比較算法之一(或所屬領(lǐng)域的技術(shù)人員可用的其他算法)或通過手工比對和目測檢查所測量,為相同的或具有規(guī)定百分比的相同氨基酸殘基或核苷酸的兩個或兩個以上的序列或子序列。
在兩種核酸或多肽(例如,編碼O-tRNA或O-RS的DNA,或O-RS的氨基酸序列)的情況下,短語“大體上相同的”指的是當在比較窗口上或指定區(qū)域上比較和比對最大對應性時,如使用序列比較算法(或所屬領(lǐng)域的技術(shù)人員可用的其他算法)或通過手工比對和目測檢查所測量,具有至少約60%、約80%、約90-95%、約98%、約99%或99%以上的核苷酸或胺基酸殘基同一性的兩個或兩個以上的序列或子序列。所述“大體上相同的”序列通常被認為是“同源的”,而與實際祖先無關(guān)。“實質(zhì)同一性”可以在待比較的兩個序列的長度為至少約50個殘基的序列的區(qū)域內(nèi)、至少約100個殘基的區(qū)域內(nèi),或至少約150個殘基的區(qū)域內(nèi),或全長范圍內(nèi)存在。
對序列比較和同源性測定來說,通常一個序列擔當與測試序列比較的參考序列。當使用序列比較算法時,將測試序列和參考序列輸入計算機,(必要時)指定子序列坐標并且指定序列算法程序參數(shù)。序列比較算法隨后基于所指定的程序參數(shù)來計算測試序列相對于參考序列的序列同一性百分比。
用于比較的比對序列的方法為所屬領(lǐng)域的技術(shù)人員所知。用于比較的最佳序列比對法可(例如)通過Smith和WatermanAdv.Appl.Math.2482c(1981)的局部同源性算法,通過Needleman和WunschJ.Mol.Biol.48443(1970)的同源性比對算法,通過Pearson和LipmanProc.Nat′l.Acad.Sci.USA 852444(1988)的尋找相似性方法的研究,通過所述算法的計算機化實施(Wisconsin Genetics Software Package,Genetics Computer Group,575 Science Dr.,Madison,WI中的GAP、ESTFIT、FASTA和TFASTA);或通過手工比對和目測檢查(參見(例如)Ausubel等人,Current Protocols in Molecular Biology(1995增刊))來進行。
適合于測定序列同一性和序列相似性百分比的算法的一個實例是BLAST算法和BLAST 2.0算法,其分別描述于Altschul等人(1997)Nuc.Acids Res.253389-3402中,和Altschul等人J.Mol.Biol.215403-410(1990)中。用于執(zhí)行BLAST分析的軟件是在WorldWide Web,ncbi.nlm.nih.gov上通過National Center for Biotechnology Information而公開獲得。所述算法涉及,首先通過鑒別詢問序列中長度為W的短字而鑒別高記分序列對(HSP),當與數(shù)據(jù)庫序列中具有相同長度的字比對時,其匹配或滿足一些正值閾值記分T。T稱為鄰近字記分閾值(Altschul等人,同上)。所述初始鄰近字采樣數(shù)擔當啟動對含有其的更長HSP的搜索的種子。字采樣數(shù)然后在沿各個序列的兩個方向上擴展,直到累積比對記分可增加為止。核苷酸序列的累積記分使用參數(shù)M(一對匹配殘基的回報記分;始終>0)和N(錯配殘基的損失記分;始終<0)計算。對氨基酸序列來說,記分矩陣是用以計算累積分數(shù)。當累積比對記分從其達到的最大值減少了量X;由于一種或一種以上負性-記分殘基比對的積累,累積記分達到0或0以下;或達到各個序列的末端時,停止字采樣數(shù)在各個方向上的增加。BLAST算法參數(shù)W、T和X決定比對的敏感性和速度。BLASTN程序(對核苷酸序列來說)使用11的字長,10的期望值(E),100的截止值,M=5,N=-4和兩個鏈的比較作為默認值。對氨基酸序列來說,BLASTP程序使用3的字長和10的期望值(E)作為默認值,并且BLOSUM62記分矩陣(參見Henikoff和Henikoff(1992)Proc.Natl.Acad.Sci.USA 8910915)使用50的比對值(B),10的期望值(E),M=5,N=-4,和兩個鏈的比較作為默認值。BLAST算法通常在“低復雜性”濾器關(guān)閉時執(zhí)行。
除計算序列同一性百分比之外,BLAST算法也執(zhí)行兩個序列之間的相似性的統(tǒng)計分析(參見(例如)Karlin和AltschulProc.Nat’l.Acad.Sci.USA 905873-5787(1993))。通過BLAST算法提供的相似性的一種量度是最小總概率(P(N)),其指示兩個核苷酸或氨基酸序列之間的匹配將偶然發(fā)生的概率。舉例而言,如果在測試核酸與參考核酸的比較中的最小總概率小于約0.2,小于約0.01或小于約0.001,那么核酸可以視為與參考序列相似。
突變和其他分子生物學技術(shù)本發(fā)明和用于本發(fā)明的多核苷酸和多肽可使用分子生物技術(shù)來操縱。核苷酸序列可以方便地通過根據(jù)慣用方法的定位突變而被修飾。或者,核苷酸序列可以通過化學合成制備,包括(但不限于)通過使用寡核苷酸合成器制備,其中寡核苷酸是基于所要多肽的氨基酸序列,并且優(yōu)先選擇在其中產(chǎn)生重組多肽的宿主細胞中有利的所述密碼子而設(shè)計。舉例而言,若干編碼所要多肽的部分的小寡核苷酸可以通過PCR、連接或連接鏈反應合成和裝配。參見(例如),Barany等人,Proc.Natl.Acad.Sci.88189-193(1991);美國專利6,521,427,其是以引用的方式并入本文中。
本發(fā)明利用重組遺傳學領(lǐng)域中的常規(guī)技術(shù)。揭示用于本發(fā)明的通用方法的基本文章包括Sambrook等人,Molecular Cloning,A Laboratory Manual(第三版2001);Kriegler,Gene Transfer and ExpressionA Laboratory Manual(1990);和Current Protocols inMolecular Biology(Ausubel等人編,1994))。
描述分子生物技術(shù)的一般文章包括Berger和Kimmel,Guide to Molecular CloningTechniques,Methods in Enzymology第152卷Academic Press,Inc.,San Diego,CA(Berger);Sambrook等人,Molecular Cloning-ALaboratory Manual(第二版),第1-3卷,Cold Spring Harbor Laboratory,Cold Spring Harbor,New York,1989(″Sambrook″)和Current Protocols in Molecular Biology.F.M.Ausubel等人編,Current Protocols,a jointventure between Greene Publishing Associates,Inc.和John Wiley&Sons,Inc.,(通過1999補充)(″Ausubel″))。所述文章描述突變,載體、啟動子的用途和許多其他關(guān)于(例如)基因或多核苷酸的產(chǎn)生的相關(guān)主題,所述基因或多核苷酸包括用于產(chǎn)生包括所選氨基酸(例如非天然氨基酸)、正交tRNA、正交合成酶和其對的蛋白質(zhì)的選擇密碼子。
本發(fā)明中使用各種類型的突變用于各種目的,包括(但不限于)產(chǎn)生新穎的合成酶或tRNA,使tRNA分子突變,產(chǎn)生tRNA的庫,使RS分子突變,產(chǎn)生合成酶的庫,產(chǎn)生選擇密碼子,將編碼所選氨基酸的選擇密碼子插入所關(guān)注的蛋白質(zhì)或多肽中。所述突變包括(但不限于)定位、隨機點突變,同源重組,DNA滑移或其他遞歸突變方法,嵌合建構(gòu),使用含有模板的尿嘧啶的突變、寡核苷酸定位突變,經(jīng)硫代磷酸酯修飾的DNA突變、使用缺口雙鏈體DNA等等的突變,或其任何組合。其他適合方法包括點錯配修復、使用修復缺失宿主菌株的突變,限制-選擇和限制-純化、缺失突變、通過總基因合成的突變、雙鏈斷裂修復,諸如此類。包括(但不限于)涉及嵌合構(gòu)筑體的突變也包括在本發(fā)明中。在一個實施例中,突變可通過天然存在的分子或經(jīng)改變或突變的天然存在的分子的包括(但不限于)序列,序列比較,物理性質(zhì),二級、三級或四級結(jié)構(gòu),晶體結(jié)構(gòu)等等已知信息來加以指導。
本文中所見的文章和實例描述所述程序。其他信息見于以下本文中引用的公開案和參考文獻中Ling等人,Approaches to DNA mutagenesisan overview,Anal Biochem.254(2)157-178(1997);Dale等人,Oligonucleotide-directed random mutagenesis using thephosphorothioate method,Methods Mol.Biol.57369-374(1996);Smith,In vitromutagenesis,Ann.Rev.Genet.19423-462(1985);Botstein和Shortle,Strategies andapplications of in vitro mutagenesis,Science2291193-1201(1985);Carter,Site-directedmutagenesis,Biochem.J.2371-7(1986);Kunkel,The efficiency of oligonucleotide directedmutagenesis,在Nucleic Acids&Molecular Biology(Eckstein,F(xiàn).和Lilley,D.M.J.編,Springer Verlag,Berlin)(1987)中;Kunkel,Rapid and efficient site-specific mutagenesiswithout phenotypic selection,Proc.Natl.Acad.Sci.USA82488-492(1985);Kunkel等人,Rapid and efficient site-specific mutagenesis without phenotypic selection,Methods inEnzymol.154,367-382(1987);Bass等人,Mutant Trp repressors with new DNA-bindingspecificities,Science242240-245(1988);Zoller和Smith,Oligonucleotide-directedmutagenesis using M13-derived vectorsan efficient and general procedure for theproduction of point mutations in any DNA fragment,Nucleic Acids Res.106487-6500(1982);Zoller和Smith,Oliggonucleotide-directed mutagenesis of DNA fragments cloned intoM13 vectors,Methods in Enzymol.100468-500(1983);Zoller和Smith,Oligonucleotide-directed mutagenesisa simple method using two oliggonucleotide primersand a single-stranded DNA template,Methods in Enzymol.154329-350(1987);Taylor等人,The use of phosphorothioate-modified DNA in restriction enzyme reactions to preparenicked DNA,Nucl.Acids Res.138749-8764(1985);Taylor等人,The rapid generation ofoligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA,Nucl.Acids Res.138765-8785(1985);Nakamaye和Eckstein,Inhibition of restrictionendonuclease Nci I cleavage by phosphorothioate groups and its application tooligonucleotide-directed mutagenesis,Nucl.Acids Res.149679-9698(1986);Sayers等人,5′-3′Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis,Nucl.Acids Res.16791-802(1988);Sayers等人,Strand specific cleavage ofphosphorothioate-containing DNA by reaction with restriction endonucleases in the presenceof ethidum bromide,(1988)Nucl.Acids Res.16803-814;Kramer等人,The gapped duplexDNA approach to oligonucleotide-directed mutation construction,Nucl.Acids Res.129441-9456(1984);Kramer和Fritz,Oligonucleotide-directed construction of mutations viagapped duplex DNA,Methods in Enzymol.154350-367(1987);Kramer等人,Improvedenzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directedconstruction of mutations,Nucl.Acids Res.167207(1988);Fritz等人,Oligonucleotide-directed construction of mutationsagapped duplex DNA procedure withoutenzymatic reactions in vitro,Nucl.Acids Res.166987-6999(1988);Kramer等人,Differentbase/base mismatchesare corrected with different efficiencies by the methyl-directed DNAmismatch-repair system of E.coli,Cell38879-887(1984);Carter等人,Improvedoligonucleotide site-directed mutagenesis using M13 vectors,Nucl.Acids Res.134431-4443(1985);Carter,Improved oligonucleotide-directed mutagenesis using M13 vectors,Methods in Enzymol.154382-403(1987);Eghtedarzadeh和Henikoff,Use ofoligonucleotides to generate large deletions,Nucl.Acids Res.145115(1986);Wells等人,Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin,Phil.Trans.R.Soc.Lond.A 317415-423(1986);Nambiar等人,Total synthesis and cloning of agene coding for the ribonuclease S protein,Science2231299-1301(1984);Sakmar和Khorana,Total synthesis and expression of a gene for the alpha-subunit of bovine rod outersegment guanine nucleotide-binding protein(transducin),Nucl.Acids Res.146361-6372(1988);Wells等人,Cassette mutagenesisan efficient method for generation of multiplemutations at defined sites,Gene34315-323(1985);Grundstrm等人,Oligonucleotide-directed mutagenesis by microscale′shot-gun′gene synthesis,Nucl.AcidsRes.133305-3316(1985);Mandecki,Oligonucleotide-directed double-strand break repairin plasmids of Escherichia colia method for site-specific mutagenesis,Proc.Natl.Acad.Sci.USA,837177-7181(1986);Arnold,Protein engineering for unusual environments,CurrentOpinion in Biotechnology4450-455(1993);Sieber等人,Nature Biotechnology,19456-460(2001);W.P.C.Stemmer,Nature370,389-91(1994);和I.A.Lorimer,I.Pastan,NucleicAcids Res.23,3067-8(1995)。對許多上述方法的其他詳細描述可見于Methods inEnzymology第154卷中,其也描述對使用各種突變方法故障尋找問題的有效控制。
(例如)適用于例如使tRNA或合成酶的庫突變或改變tRNA或RS的本發(fā)明突變的寡核苷酸,通常是根據(jù)由Beaucage和Caruthers,Tetrahedron Letts.22(20)1859-1862,(1981)描述的固相亞磷酰胺三酯方法,(例如)使用如Needham-VanDevanter等人,Nucleic Acids Res.,126159-6168(1984)中所述的自動合成器來化學合成。
另外,基本上任何核酸都可從各種商業(yè)來源中的任何來源(諸如The MidlandCertified Reagent Company(mcrc@oligos.com)、The Great American Gene Company(www.genco.com)、ExpressGen Inc.(www.expressgen.com)、Operon Technologies Inc.(Alameda,Calif.))和許多其他來源定制或標準訂購。
本發(fā)明也涉及真核宿主細胞、非真核宿主細胞和用于通過正交tRNA/RS對活體內(nèi)并入非天然氨基酸的生物體。宿主細胞是由用本發(fā)明的多核苷酸,或包括本發(fā)明的多核苷酸(包括(但不限于)可為(例如)克隆載體或表達載體的本發(fā)明的載體)的構(gòu)筑體遺傳工程化(包括(但不限于)轉(zhuǎn)形、轉(zhuǎn)導或轉(zhuǎn)染)。舉例而言,正交tRNA、正交tRNA合成酶和待衍生化的蛋白質(zhì)的編碼區(qū)域是可操作地與在所要宿主細胞中起作用的基因表達控制元件連接。載體可(例如)呈質(zhì)粒、粘質(zhì)粒、噬菌體、細菌、病毒、裸露多核苷酸或結(jié)合的多核苷酸形式。載體通過包括以下方法的標準方法引入細胞和/或微生物中電穿孔(Fromm等人,Proc.Natl.Acad.Sci.USA82,5824(1985))、通過病毒載體進行感染、通過在小珠粒或粒子的基質(zhì)中或表面上具有核酸的小粒子的高速彈道滲透作用(Klein等人,Nature 327,70-73(1987)),和/或諸如此類。
將目標核酸引入細胞中的若干熟知的方法是可用的,任何的方法均可用于本發(fā)明中。所述方法包括將接受者細胞與含有DNA的細菌原生質(zhì)體融合、電穿孔、拋射體轟擊和用病毒載體進行感染(下文中進一步討論)等。細菌細胞可用以擴增含有本發(fā)明的DNA構(gòu)筑體的質(zhì)粒的數(shù)量。使細菌生長到對數(shù)期并且細菌中的質(zhì)??赏ㄟ^所屬領(lǐng)域中已知的各種方法分離(參見(例如)Sambrook)。另外,用于從細菌純化質(zhì)粒的試劑盒是市售的(參見(例如)EasyPrepTM、FlexiPrepTM,都來自Pharmacia Biotech;StrataCleanTM,來自Stratagene;和QIAprepTM,來自Qiagen)。然后進一步操縱經(jīng)分離和純化的質(zhì)粒來產(chǎn)生用以轉(zhuǎn)染細胞或并入相關(guān)載體中以感染生物體的其他質(zhì)粒。典型的載體含有轉(zhuǎn)錄和轉(zhuǎn)譯終止子、轉(zhuǎn)錄和轉(zhuǎn)譯起始序列和用于調(diào)節(jié)具體的目標核酸的表達的啟動子。載體視需要包含基因表達序列盒,所述表達序列盒含有至少一個獨立的終止子序列、允許序列盒在真核生物或原核生物或兩者(包括(但不限于)穿梭載體)中復制的序列和用于原核系統(tǒng)和真核系統(tǒng)的選擇標記物。載體適于在原核生物、真核生物或兩者中復制和合并。參見,Gillam和Smith,Gene 881(1979);Roberts等人,Nature,328731(1987);Schneider,E.等人,Protein Expr.Purif 6(1)10-14(1995);Ausubel,Sambrook,Berger(所有同上)。用于克隆的細菌和噬菌體的目錄(例如)由ATCC提供,例如由ATCC出版的The ATCC Catalogue of Bacteria and Bacteriophage(1992)Gherna等人(編)提供。用于定序、克隆及分子生物學的其他方面的其他基本程序和基礎(chǔ)的理論觀點也見于Watson等人(1992)Recombinant DNA Second Edition Scientific American Books,NY。另外,基本上任何核酸(和事實上任何經(jīng)標記的核酸,無論標準或非標準與否)可從各種商業(yè)來源中的任何來源(諸如Midland Certified Reagent Company(可在World Wide′Web,mcrc.com上購得的Midland,TX)、The Great American Gene Company(可在World WideWeb,genco.com上購得的Ramona,CA)、ExpressGen Inc.(可在World Wide Web,expressgen.com上購得的Chicago,IL)、Operon Technologies Inc.(Alameda,CA)和許多其他來源定制或標準訂購。
經(jīng)工程化的宿主細胞可在慣用營養(yǎng)培養(yǎng)基中培養(yǎng),所述營養(yǎng)培養(yǎng)基適當時對于諸如篩選步驟、活化啟動子或選擇轉(zhuǎn)化體的所述活性而改質(zhì)。可視需要將所述細胞培養(yǎng)成轉(zhuǎn)基因生物體。其他對(例如)細胞分離和培養(yǎng)(例如,對后續(xù)核酸分離)而言有用的參考文獻包括Freshney(1994)Culture of Animal Cells,a Manual of Basic Technique,第三版,Wiley-Liss,New York和其中引用的參考文獻;Payne等人(1992)Plant Cell and TissueCulture in Liquid SystemsJohn Wiley&Sons,Inc.New York,NY;Gamborg和Phillips(編)(1995)Plant Cell,Tissue and Organ Culture;Fundamental Methods Springer Lab Manual,Springer-Verlag(Berlin Heidelberg New York);和Atlas和Parks(編)The Handbook ofMicrobiological Media(1 993)CRC Press,Boca Raton,F(xiàn)L。
直接將非天然氨基酸活體內(nèi)并入蛋白質(zhì)中的能力提供包括(但不限于)以下優(yōu)點的多種優(yōu)點突變蛋白質(zhì)的高產(chǎn)率、技術(shù)簡易性、可能在細胞中或可能在活生物體中研究突變蛋白質(zhì),和在治療性治療和診斷用途中使用所述突變蛋白質(zhì)。使具有各種尺寸、酸性、親核性、疏水性和其他性質(zhì)的非天然氨基酸包括在蛋白質(zhì)中的能力可大大地擴展我們合理地并系統(tǒng)地操縱蛋白質(zhì)的結(jié)構(gòu)的能力,以探測蛋白質(zhì)功能并產(chǎn)生具有新穎性質(zhì)的新穎蛋白質(zhì)或生物體。
蛋白質(zhì)和所關(guān)注的多肽可出于多種目的而進行非天然氨基酸的并入,包括(但不限于)調(diào)節(jié)蛋白質(zhì)結(jié)構(gòu)和/或功能的改變,改變蛋白酶目標部位的尺寸、酸性、親核性、氫鍵、疏水性、可達性,將部分(包括(但不限于)蛋白質(zhì)陣列的部分)作為目標,添加生物活性分子,連接聚合物,連接放射性核素,調(diào)節(jié)血清半衰期,調(diào)節(jié)組織滲透(例如腫瘤),調(diào)節(jié)活性傳輸,調(diào)節(jié)組織、細胞或器官特異性或分布,調(diào)節(jié)免疫原性,調(diào)節(jié)蛋白酶抵抗性等。包括非天然氨基酸的蛋白質(zhì)可具有增強的或甚至全新的催化或生物物理學性質(zhì)。舉例而言,以下性質(zhì)視需要通過將非天然氨基酸包含于蛋白質(zhì)中而改變毒性、體內(nèi)分解、結(jié)構(gòu)性能、光譜性質(zhì)、化學和/或光化學性質(zhì)、催化能力、半衰期(包括(但不限于)血清半衰期)、與其他分子(包括(但不限于))共價地或非共價地反應的能力,諸如此類。包括包含至少一種非天然氨基酸的蛋白質(zhì)的組合物適用于(包括(但不限于))新穎治療、診斷學、催化酶、工業(yè)酶、結(jié)合蛋白(包括(但不限于)抗體)和(包括(但不限于))蛋白質(zhì)結(jié)構(gòu)和功能的研究。參見(例如),Dougherty,(2000)Unnatural Amino Acids as Probesof Protein Structure and Function,Current Opinion in Chemical Biology,4645-652。
蛋白質(zhì)可具有至少1種、至少2種、至少3種、至少4種、至少5種、至少6種、至少7種、至少8種、至少9種,或至少10種或10種以上的非天然氨基酸。非天然氨基酸可為相同的或不同的,(包括(但不限于))在蛋白質(zhì)中可能存在包含1種、2種、3種、4種、5種、6種、7種、8種、9種、10種或10種以上的不同的非天然氨基酸的1個、2個、3個、4個、5個、6個、7個、8個、9個、10個或10個以上的不同部位。蛋白質(zhì)可以具有存在于經(jīng)非天然氨基酸取代的蛋白質(zhì)中的具體氨基酸的至少一種氨基酸(但少于全部)。對給定的具有1種以上的非天然氨基酸的蛋白質(zhì)來說,非天然氨基酸可為相同的或不同的(包括(但不限于)蛋白質(zhì)可包括2種或2種以上不同類型的非天然氨基酸,或可包括兩種相同的非天然氨基酸)。對給定的具有2種以上的非天然氨基酸的蛋白質(zhì)來說,非天然氨基酸可為相同的、不同的或為多個具有相同種類的非天然氨基酸與至少1種不同的非天然氨基酸的組合。
對在真核細胞中產(chǎn)生所關(guān)注的具有至少1種非天然氨基酸的蛋白質(zhì)或多肽來說,蛋白質(zhì)或多肽通常將包括真核后轉(zhuǎn)譯修飾。在某些實施例中,蛋白質(zhì)包括至少1種非天然氨基酸和至少1種通過真核細胞在活體內(nèi)進行的后轉(zhuǎn)譯修飾,其中后轉(zhuǎn)譯修飾并非通過原核細胞進行。舉例而言,后轉(zhuǎn)譯修飾包括(包括(但不限于))乙?;?、?;⒅|(zhì)修飾、棕櫚酰化作用、棕櫚酸酯添加、磷酸化、糖脂鍵修飾、糖基化作用,諸如此類。在另一個方面中,后轉(zhuǎn)譯修飾包括前驅(qū)物(包括(但不限于)降血鈣素前驅(qū)物、降血鈣素基因相關(guān)的肽前驅(qū)物、前甲狀旁腺激素原激素、前胰島素原、胰島素原、前黑素細胞皮質(zhì)素原、黑素細胞皮質(zhì)素原,諸如此類)的解朊處理,裝配到多子單元蛋白質(zhì)中或大分子裝配,轉(zhuǎn)譯到細胞中的另一個部位(包括(但不限于)轉(zhuǎn)譯到諸如內(nèi)質(zhì)網(wǎng)、高爾基體(Golgi apparatus)、核、溶酶體、過氧化物酶體、線粒體、葉綠體、液泡等等的細胞器中,或通過分泌路徑)。在某些實施例中,蛋白質(zhì)包含分泌序列或定位序列、抗原決定基標簽、FLAG標簽、聚組氨酸標簽、GST融合體等等。
在細胞中用所選氨基酸在規(guī)定位置生產(chǎn)蛋白質(zhì)的方法也是本發(fā)明的特征。舉例而言,方法包括使細胞在適當培養(yǎng)基中生長,其中所述細胞包含包括至少一個選擇密碼子并且編碼蛋白質(zhì)的核酸;和提供所選氨基酸;其中細胞另外包含在細胞中起作用并且識別出選擇密碼子的正交tRNA(O-tRNA)和用所選氨基酸優(yōu)先氨基?;疧-tRNA的正交氨酰基-tRNA合成酶(O-RS)。通常,O-tRNA包含在同源合成酶的存在下響應選擇密碼子的抑制活性。通過所述方法產(chǎn)生的蛋白質(zhì)也是本發(fā)明的特征。
本發(fā)明的組合物和通過本發(fā)明的方法制得的組合物視需要是在細胞中。本發(fā)明的O-tRNA/O-RS對或個別組分可隨后用于宿主系統(tǒng)的轉(zhuǎn)譯機器中,其產(chǎn)生被并入蛋白質(zhì)中的例如非天然氨基酸的所選氨基酸。標題為“Expanding the Eukaryotic Genetic Code”的專利申請案USSN 10/825,867和標題為“IN VIVO INCORPORATION OF UNNATURALAMINO ACIDS”的10/126,927描述了所述方法并且所述專利以引用的方式餅入本文。舉例而言,當將O-tRNA/O-RS對引入例如大腸桿菌的宿主中時,所述對引起所選氨基酸(諸如非天然氨基酸,例如合成氨基酸,諸如白氨酸氨基酸的衍生物)的活體內(nèi)并入,所述對可外源地添加到生長培養(yǎng)基中,響應選擇密碼子而進入蛋白質(zhì)中。視需要,本發(fā)明的組合物可在活體外轉(zhuǎn)譯系統(tǒng)中,或在活體內(nèi)系統(tǒng)中。
包括例如非天然氨基酸的所選氨基酸(和(例如)包括一個或一個以上選擇密碼子的任何對應的編碼核酸)的任何蛋白質(zhì)(或其部分)可使用本文中的組合物和方法生產(chǎn)。任何多肽適于并入一種或一種以上所選氨基酸。未對鑒別數(shù)十萬種已知的蛋白質(zhì)進行嘗試,任何蛋白質(zhì)可經(jīng)修飾以包括一種或一種以上非天然氨基酸,例如通過調(diào)節(jié)任何可用的突變方法以在相關(guān)轉(zhuǎn)譯系統(tǒng)中包括一個或一個以上適當?shù)倪x擇密碼子。已知的蛋白質(zhì)的共用序列儲存庫包括基因庫EMBL、DDBJ和NCBI。其他儲存庫可容易通過國際互連網(wǎng)搜索而鑒別。
通常,蛋白質(zhì)是(例如)至少60%、至少70%、至少75%、至少80%、至少90%、至少95%或至少99%或99%以上與任何可用的蛋白質(zhì)(例如,治療性蛋白質(zhì)、診斷性蛋白質(zhì)、工業(yè)酶或其部分,諸如此類)相同,并且其包含一種或一種以上所選氨基酸??山?jīng)修飾以包含一種或一種以上例如非天然氨基酸的所選氨基酸的治療性、診斷性和其他蛋白質(zhì)的實例可見于(但不限于)標題為“Expanding the Eukaryotic Genetic Code”的USSN 10/825,867和標題為“IN VIVO INCORPORATION OF UNNATURAL AMINOACIDS”的美國專利申請案第10/126,927號中。
在某些實施例中,本發(fā)明的方法和/或組合物中的所關(guān)注的蛋白質(zhì)或多肽(或其部分)是通過核酸編碼。通常,核酸包含至少1個選擇密碼子、至少2個選擇密碼子、至少3個選擇密碼子、至少4個選擇密碼子、至少5個選擇密碼子、至少6個選擇密碼子、至少7個選擇密碼子、至少8個選擇密碼子、至少9個選擇密碼子、至少10個或10個以上的選擇密碼子。
編碼所關(guān)注的蛋白質(zhì)或多肽的基因可使用所屬領(lǐng)域的技術(shù)人員熟知的方法和以本文在“突變和其他分子生物學技術(shù)”中描述的方法突變,以包括(例如)用于并入例如非天然氨基酸的所選氨基酸的一個或一個以上選擇密碼子。舉例而言,用于所關(guān)注的蛋白質(zhì)的核酸經(jīng)突變以包括一個或一個以上選擇密碼子,提供一種或一種以上例如非天然氨基酸的所選氨基酸的插入。本發(fā)明包括任何所述變體,例如突變體、例如包括至少一種所選氨基酸的任何蛋白質(zhì)版本。同樣地,本發(fā)明也包括對應的核酸,也就是說,具有一個或一個以上編碼一種或一種以上所選氨基酸的選擇密碼子的任何核酸。
為制造包括所選氨基酸的蛋白質(zhì),所屬領(lǐng)域的技術(shù)人員可使用適合于通過正交tRNA/RS對活體內(nèi)并入所選氨基酸的宿主細胞和生物體。宿主細胞是經(jīng)一種或一種以上表達正交tRNA、正交tRNA合成酶的載體和編碼待衍生的蛋白質(zhì)的載體遺傳工程化(例如,轉(zhuǎn)形、轉(zhuǎn)導或轉(zhuǎn)染)。所述組分中的各個組分可在同一載體上,或各個組分可在分離的載體上,兩種組分可在一個載體上并且第三組分可在第二載體上。載體可(例如)呈質(zhì)粒、粘質(zhì)粒、噬菌體、細菌、病毒、裸露多核苷酸或結(jié)合的多核苷酸形式。
替代系統(tǒng)已經(jīng)使用若干策略以在非重組宿主細胞、經(jīng)突變的宿主細胞或在無細胞系統(tǒng)中,衍生化具有反應性側(cè)鏈諸如Lys、Cys和Tyr的氨基酸會造成賴氨酸向N2-乙?;?賴氨酸的轉(zhuǎn)化?;瘜W合成也提供并入非天然氨基酸的直接方法。隨著肽片段的酶促連接和天然化學連接的近期發(fā)展,有可能制造較大的蛋白質(zhì)。參見(例如),P.E.Dawson和S.B.H.Kent,Annu.Rev.Biochem,69923(2000)?;瘜W肽連接和天然化學連接描述于美國專利第6,184,344號、美國專利公開案第2004/0138412號、美國專利公開案第2003/0208046號、WO 02/098902和WO 03/042235中,所述專利是以引用的方式并入本文中。將經(jīng)所要非天然氨基酸化學?;囊种苹騮RNA添加到能夠支撐蛋白質(zhì)生物合成的活體外提取物的一般活體外生物合成方法,已經(jīng)用以將超過100種以上的非天然氨基酸部位特異地并入具有任何實際尺寸的各種蛋白質(zhì)中。參見(例如),V.W.Cornish,D.Mendel和P.G.Schultz,Angew.Chem.Int.Ed.Engl.,1995,34621(1995);C.J.Noren,S.J.Anthony-Cahill,M.C.Griffith,P.G.Schultz,A general method for site-specific incorporation of unnaturalamino acids into proteins,Science244182-188(1989);和J.D.Bain,C.G.Glabe,T.A.Dix,A.R.Chamberlin,E.S.Diala,Biosynthetic site-specific incorporation of a non-natural aminoacid into a polypeptide,J.Am.Chem.Soc.1118013-8014(1989)。已經(jīng)將廣泛范圍的官能團引入蛋白質(zhì)中以用于研究蛋白質(zhì)穩(wěn)定性、蛋白質(zhì)折疊、酶機制和信號轉(zhuǎn)導。
發(fā)展稱為選擇性壓力并入的活體內(nèi)方法以利用野生型合成酶的雜亂性。參見(例如),N.Budisa,C.Minks,S.Alefelder,W.Wenger,F(xiàn).M.Dong,L.Moroder和R.Huber,F(xiàn)ASEB J.,1341(1999)。供給細胞具體的天然氨基酸的相關(guān)代謝路徑被切斷的營養(yǎng)缺陷型菌株是在含有有限濃度的天然氨基酸的最小培養(yǎng)基中生長,而目標基因的轉(zhuǎn)錄被抑制。在靜止生長期開始時,天然氨基酸被耗盡并且經(jīng)非天然氨基酸類似物置換。誘導重組蛋白質(zhì)的表達造成含有非天然類似物的蛋白質(zhì)的累積。舉例而言,使用所述策略,鄰位、間位和對位氟苯丙氨酸已經(jīng)被并入蛋白質(zhì)中并且在可容易被鑒別的UV光譜中顯示兩個特征肩形突起,參見(例如),C.Minks,R.Huber,L.Moroder和N.Budisa,Anal.Biochem.,28429(2000);三氟甲硫氨酸已經(jīng)用以置換噬菌體T4溶菌酶中的甲硫氨酸以通過19F NMR研究其與殼寡糖配位體的相互作用,參見(例如),H.Duewel,E.Daub,V.Robinson和J.F.Honek,Biochemistry,363404(1997);并且,三氟白氨酸已被并入代替白氨酸,導致白氨酸-拉鏈蛋白質(zhì)的熱穩(wěn)定性和化學穩(wěn)定性增加。參見(例如),Y.Tang,G.Ghirlanda,W.A.Petka,T.Nakajima,W.F.DeGrado和D.A.Tirrell,Angew.Chem.Int.Ed.Engl.,401494(2001)。此外,硒代甲硫氨酸和碲代甲硫氨酸被并入各種重組蛋白質(zhì)中以在X射線結(jié)晶學中促進相的溶解。參見(例如),W.A.Hendrickson,J.R.Horton和D.M.Lemaster,EMBO J.,91665(1990);J.O.Boles,K.Lewinski,M.Kunkle,J.D.Odom,B.Dunlap,L.Lebioda和M.Hatada,Nat.Struct.Biol.,1283(1994);N.Budisa,B.Steipe,P.Demange,C.Eckerskorn,J.Kellermann和R.Huber,Eur J.Biochem..,230788(1995);和N.Budisa,W.Karnbrock,S.Steinbacher,A.Humm,L.Prade,T.Neuefeind,L.Moroder和R.Huber,J.Mol.Biol.,270616(1997)。具有烯烴或炔烴官能基的甲硫氨酸類似物也已被有效地并入,允許通過化學手段額外修飾蛋白質(zhì)。參見(例如),J.C.van Hest和D.A.Tirrell,F(xiàn)EBS Lett.,42868(1998);J.C.van Hest,K.L.Kiick和D.A.Tin-ell,J.Am.Chem.Soc.1221282(2000);和K.L.Kiick和D.A.Tirrell,Tetrahedron,569487(2000);美國專利第6,586,207號;美國專利公開案2002/0042097,其是以引用的方式并入本文中。
所述方法的成功取決于通過氨?;?tRNA合成酶識別非天然氨基酸類似物,一般而言,其需要高的選擇性以保證蛋白質(zhì)轉(zhuǎn)譯的保真度。擴展所述方法的范疇的一種方式是放寬氨?;?tRNA合成酶的底物特異性,其已經(jīng)在有限的情況下達成。舉例而言,通過在大腸桿菌苯丙氨?;?tRNA合成酶(PheRS)中用Gly置換Ala294會增加底物結(jié)合袋的尺寸,并且導致通過對氯苯丙氨酸(p-Cl-Phe)?;痶RNAPhe。參見,M.Ibba,P.Kast和H.Hennecke,Biochemistry,337107(1994)。懷有所述突變體PheRS的大腸桿菌菌株容許并入對氯苯丙氨酸或?qū)︿灞奖彼岽姹奖彼?。參?例如),M.Ibba和H.Hennecke,F(xiàn)EBS Lett.,364272(1995);和N.Sharma,R.Furter,P.Kast和D.A.Tirrell,F(xiàn)EBS Lett.,46737(2000)。同樣地,展示了靠近大腸桿菌酪氨酰tRNA合成酶的氨基酸結(jié)合部位的點突變Phel30Ser容許重氮酪氨酸比酪氨酸更有效地并入。參見,F(xiàn).Hamano-Takaku,T.Iwama,S.Saito-Yano,K.Takaku,Y.Monden,M.Kitabatake,D.Soil和S.Nishimura,J.Biol.Chem.,27540324(2000)。
將非天然氨基酸活體內(nèi)并入蛋白質(zhì)的另一個策略是修飾具有校對機制的合成酶。所述合成酶不能區(qū)別結(jié)構(gòu)上相似于同源天然氨基酸的氨基酸并且因此不能活化所述氨基酸。所述誤差在分離部位被校正,所述分離部位將來自tRNA的經(jīng)錯誤裝填的氨基酸去?;跃S持蛋白質(zhì)轉(zhuǎn)譯的保真度。如果喪失合成酶的校對活性,那么經(jīng)錯誤活化的結(jié)構(gòu)類似物可以避開編輯功能并且被并入。近期已經(jīng)用纈氨?;?tRNA合成酶(ValRS)證明了所述方法。參見,V.Doring,H.D.Mootz,L.A.Nangle,T.L.Hendrickson,V.deCrecy-Lagard,P.Schimmel和P.Marliere,Science,292501(2001)。ValRS可用Cys、Thr或氨基丁酸鹽(Abu)將tRNAVal錯誤氨基?;?;然后,通過編輯域使所述非同源氨基酸水解。在大腸桿菌染色體的隨機突變后,選擇在ValRS的編輯部位具有突變的突變大腸桿菌菌株。所述缺少編輯的ValRS用Cys不正確裝填tRNAVal。因為Abu空間上類似于Cys(Cys的-SH基團經(jīng)Abu中的-CH3置換),所以當所述突變大腸桿菌菌株在Abu存在下生長時,突變ValRS也將Abu并入蛋白質(zhì)中。質(zhì)譜分析展示,在原生蛋白質(zhì)中,約24%的纈氨酸在各個纈氨酸位置經(jīng)Abu置換。
固相合成和半合成方法也允許含有新穎氨基酸的大量蛋白質(zhì)的合成。舉例而言,參見以下公開案和其中引用的參考文獻,所述公開案如下Crick,F(xiàn).H.C.,Barrett,L.Brenner,S.Watts-Tobin,R.General nature of the genetic code for proteins.Nature,1921227-1232(1961);Hofmann,K.,Bohn,H.Studies on polypeptides.XXXVT.The effect ofpyrazole-imidazole replacements on the S-protein activating potency of an S-peptidefragment,J.Am Chem,88(24)5914-5919(1966);Kaiser,E.T.Synthetic approaches tobiologically active peptides and proteins including enyzmes,Acc Chem Res,2247-54(1989);Nakatsuka,T.,Sasaki,T.,Kaiser,E.T.Peptide segment coupling catalyzed by thesemisynthetic enzyme thiosubtilisin,J Am Chem Soc.1093808-3810(1987);Schnolzer,M.,Kent,S B H.Constructing proteins by dovetailing unprotected synthetic peptidesbackbone-engineered HIV protease,Science,256(5054)221-225(1992);Chaiken,I.M.Semisynthetic peptides andproteins,CRC Crit Rev Biochem.11(3)255-301(1981);Ofrord,R.E.Protein engineering by chemical means?Protein Eng.,1(3)151-157(1987);和Jackson,D.Y.,Burnier,J.,Quan,C.,Stanley,M.,Tom,J.,Wells,J.A.A Designed Peptide Ligase forTotal Synthesis of Ribonuclease A with Unnatural Catalytic Residues,Science,266(5183)243(1994)。
化學修飾已經(jīng)用以將包括輔助因子、自旋標記物和寡核苷酸的各種非天然側(cè)鏈活體外引入蛋白質(zhì)中。參見(例如),Corey,D.R.,Schultz,P.G.Generation of a hybridsequence-specific single-stranded deoxyribonuclease,Science,238(4832)1401-1403(1987);Kaiser,E.T.,Lawrence D.S.,Rokita,S.E.The chemical modification of enzymaticspecificity,Annu Rev Biochem,54565-595(1985);Kaiser,E.T.,Lawrence,D.S.Chemicalmutation of enyzme active sites,Science,226(4674)505-511(1984);Neet,K.E.,Nanci A,Koshland,D.E.Properties of thiol-subtilisin,J Biol.Chem,243(24)6392-6401(1968);Polgar,L.et M.L.Bender.A new enzyme containing a synthetically formed active site.Thiol-subtilisin.J.Am Chem Soc,883153-3154(1966);和Pollack,S.J.,Nakayarna,GSchultz,P.G Introduction of nucleophiles and spectroscopic probes into antibody combiningsites,Science,242(4881)1038-1040(1988)。
通過免疫反應性定義多肽因為本發(fā)明的多肽提供各種新穎多肽序列(例如,包含在本文中的轉(zhuǎn)譯系統(tǒng)中合成的蛋白質(zhì)的情況下,或在新穎合成酶、標準氨基酸的新穎序列的情況下的所選氨基酸(例如非天然氨基酸)),所以多肽也提供可(例如)在免疫學檢定中識別出的新穎結(jié)構(gòu)特征。特異性地結(jié)合本發(fā)明多肽的抗血清的產(chǎn)生,以及通過所述抗血清結(jié)合的多肽都是本發(fā)明的特征。如本文中所使用,術(shù)語“抗體”包括(但不限于)大體上通過特異性地結(jié)合并識別被分析物(抗原)的免疫球蛋白基因或其片段編碼的多肽。實例包括多克隆的抗體、單株抗體、嵌合抗體和單鏈抗體,諸如此類。包括Fab片段和由包括噬菌體展示的表達庫產(chǎn)生的片段的免疫球蛋白的片段也包括在如本文中所使用的術(shù)語“抗體”內(nèi)。對抗體結(jié)構(gòu)和術(shù)語來說,參見(例如),Paul,F(xiàn)undamental Immunology,第四版,1999,Raven Press,New York。
舉例而言,本發(fā)明包括RS和利用本發(fā)明的tRNA和/或RS制造的蛋白質(zhì),其特異性地與抵抗包含氨基酸序列的免疫原而產(chǎn)生的抗體或抗血清結(jié)合或特異性地與抵抗包含氨基酸序列的免疫原而產(chǎn)生的抗體或抗血清免疫反應。為消除與其他同源物的交叉反應性,抗體或抗血清是經(jīng)諸如野生型多肽的可用蛋白質(zhì)(例如“對照”多肽)減去。在野生型蛋白質(zhì)對應于核酸時,產(chǎn)生由核酸編碼的多肽并且將其用于抗體/抗血清減去用途。
在一個典型形式中,免疫檢定使用多克隆抗血清,所述多克隆抗血清經(jīng)產(chǎn)生以抵抗一種或一種以上多肽或其實質(zhì)序列(也就是說,至少約30%的所提供的全長序列)。由蛋白質(zhì)得到的可能多肽免疫原的組在下文中一起被稱為“免疫原性多肽”。所得抗血清視需要經(jīng)選擇以使其對于對照合成酶同源物具有低交叉反應性,并且任何所述交叉反應性是在免疫檢定中使用多克隆抗血清之前,通過(例如)免疫吸附用一種或一種以上對照同源物除去。
為生產(chǎn)適用于免疫檢定的抗血清,將一種或一種以上免疫原性多肽如本文中所述生產(chǎn)并純化。舉例而言,重組蛋白質(zhì)可在重組細胞中生產(chǎn)。小鼠的純系株(因為由于小鼠的實質(zhì)的遺傳同一性,結(jié)果為更可重現(xiàn),所以用于所述檢定)是經(jīng)與諸如弗氏佐劑(Freund′s adjuvant)的標準佐劑組合的免疫原性蛋白質(zhì)和標準小鼠免疫協(xié)議免疫(對抗體產(chǎn)生、免疫檢定形式和可用以測定特異免疫反應性的條件的標準描述來說,參見(例如),Harlow和Lane(1988)Antibodies,A Laboratory Manual,Cold Spring HarborPublications,New York)。
抗體的其他參考文獻和論述也見于本文中并且可應用于本文以通過免疫反應性定義多肽。或者,一種或一種以上由本文中揭示的序列得到的合成多肽或重組多肽是與載體蛋白結(jié)合并且用作免疫原。
將多克隆血清收集并且在免疫檢定中抵抗免疫原性多肽進行滴定,例如,在固相免疫檢定中,用一種或一種以上固定在固體支撐物上的免疫原性蛋白質(zhì)滴定。選擇具有106或106以上的效價的多克隆抗血清,將其匯集并且用對照合成酶多肽減去以產(chǎn)生經(jīng)減去匯集滴定的多克隆抗血清。
在比較免疫檢定中,測試經(jīng)減去匯集滴定的多克隆抗血清對于對照同源物的交叉反應性。在所述比較檢定中,測定經(jīng)減去滴定的多克隆抗血清的鑒別結(jié)合條件,所述條件產(chǎn)生與結(jié)合到對照合成酶同源物相比,高至少約5-10倍的將經(jīng)滴定的多克隆抗血清結(jié)合到免疫原性蛋白質(zhì)的信噪比。換句話說,結(jié)合反應的嚴格性是通過添加諸如白蛋白或脫脂奶粉的非特異競爭劑調(diào)整,和/或通過調(diào)整鹽條件、溫度和/或諸如此類來調(diào)整。所述結(jié)合條件用于后續(xù)用于測定測試多肽(待與免疫原性多肽和/或?qū)φ斩嚯南啾鹊亩嚯?是否通過經(jīng)匯集減去的多克隆抗血清而特異性結(jié)合的檢定中。
在另一個實例中,競爭結(jié)合形式的免疫檢定用于檢測測試多肽。舉例而言,(如所述)交叉反應抗體是通過與對照多肽的免疫吸附而從所匯集的抗血清混合物中除去。然后將免疫原性多肽固定到暴露于經(jīng)減去匯集的抗血清的固體支撐物上。將測試蛋白質(zhì)添加到檢定中以競爭與經(jīng)匯集減去的抗血清的結(jié)合。測試蛋白質(zhì)與固定的蛋白質(zhì)相比競爭與經(jīng)匯集減去的抗血清結(jié)合的能力,是與被添加到檢定中的免疫原性多肽競爭結(jié)合(免疫原性多肽有效地與固定免疫原性多肽競爭與經(jīng)匯集的抗血清的結(jié)合)的能力相比較。測試蛋白質(zhì)的交叉反應性百分比是使用標準計算法計算。
在平行檢定中,對照蛋白質(zhì)競爭與經(jīng)匯集減去的抗血清結(jié)合的能力,視需要如與免疫原性多肽競爭與抗血清結(jié)合的能力比較來測定。再次,對照多肽的交叉反應性百分比是使用標準計算法計算。在與對照多肽比較,測試多肽的交叉反應性百分比高至少5-10x時和/或在測試多肽的結(jié)合大致在免疫原性多肽的結(jié)合的范圍內(nèi)時,測試多肽被說成特異性地結(jié)合經(jīng)匯集減去的抗血清。
一般而言,經(jīng)免疫吸附和經(jīng)匯集的抗血清可如本文中所述用于競爭性結(jié)合免疫檢定中以將任何測試多肽與免疫原性和/或?qū)φ斩嚯倪M行比較。為進行所述比較,各自在廣泛濃度范圍下檢定免疫原性多肽、測試多肽和對照多肽,并且使用標準技術(shù)測定抑制經(jīng)減去的抗血清與(例如)固定對照蛋白質(zhì)、測試蛋白質(zhì)或免疫原性蛋白質(zhì)的結(jié)合的50%所需的各種多肽的量。如果在競爭性檢定中結(jié)合所需的測試多肽的量比所需的免疫原性多肽的量少兩倍,那么測試多肽被說成特異地結(jié)合對免疫原性蛋白質(zhì)所產(chǎn)生的抗體,前提條件是該量比對照多肽的量高至少約5-10x。
作為特異性的其他測定,經(jīng)匯集的抗血清視需要全部用免疫原性多肽(而不是對照多肽)免疫吸附,直到很少或沒有經(jīng)所得免疫原性多肽減去匯集的抗血清與用于免疫吸附的免疫原性多肽的結(jié)合可檢測到。然后測試所述經(jīng)全部免疫吸附的抗血清與測試多肽的反應性。如果觀察到很小或沒有反應性(也就是說,對經(jīng)全部免疫吸附的抗血清與免疫原性多肽的結(jié)合來說,觀察到不大于2x的信噪比),那么測試多肽是通過由免疫原性蛋白質(zhì)引出的抗血清特異性地結(jié)合。
對蛋白質(zhì)、抗體、抗血清等等的其他詳細描述可見于標題為“Expanding theEukaryotic Genetic Code”的USSN 10/825,867;標題為“IN VIVO INCORPORATION OFUNNATURAL AMINO ACIDS”的WO 2002/085923;標題為“Glycoprotein synthesis”的美國專利第6,927,042號;和標題為“Protein Arrays”的美國專利公開案第US2004/0198637號,所述專利是以引用的方式并入。
試劑盒試劑盒也是本發(fā)明的特征。舉例而言,提供用于在細胞中生產(chǎn)包含至少一種例如非天然氨基酸的所選氨基酸的蛋白質(zhì)的試劑盒,其中所述試劑盒包括含有編碼O-tRNA的多核苷酸序列和/或O-tRNA,和/或編碼O-RS的多核苷酸序列和/或O-RS的容器。在一個實施例中,試劑盒另外至少包括所選氨基酸。在另一個實施例中,試劑盒包括本發(fā)明的經(jīng)氨基?;膖RNA。在另一個實施例中,試劑盒另外包含用于生產(chǎn)蛋白質(zhì)的指導材料。
另一個實例是用于在無細胞轉(zhuǎn)譯系統(tǒng)中生產(chǎn)包含至少一種例如非天然氨基酸的所選氨基酸的蛋白質(zhì)的試劑盒,其中所述試劑盒包括含有編碼O-tRNA的多核苷酸序列和/或O-tRNA,和/或編碼O-RS的多核苷酸序列和/或O-RS的容器。在一個實施例中,試劑盒另外包括所選氨基酸。在另一個實施例中,試劑盒包括本發(fā)明的經(jīng)氨基?;膖RNA。在另一個實施例中,試劑盒另外包含用于生產(chǎn)蛋白質(zhì)的指導材料。
實例提供以下實例以說明,而不是限制所主張的發(fā)明。所屬領(lǐng)域的技術(shù)人員將認識到可在不脫離所主張的發(fā)明的范疇的情況下改變的各種非關(guān)鍵參數(shù)。
實例1相對于對乙?;奖彼岬陌滨;?tRNA合成酶選擇相對于對乙?;奖彼?一種非天然編碼的氨基酸)篩選兩個氨?;?tRNA合成酶的DNA庫。所述庫由來自pBK質(zhì)粒中的Methanococcous janneschii的酪氨?;鵷RNA合成酶基因的6種突變組成。
執(zhí)行由5次選擇的交替循環(huán)(3次正性選擇、2次負性選擇)組成的選擇程序。將庫以1∶1比率組合并且電穿孔到正性選擇細胞系(具有正性選擇質(zhì)粒pREP的GeneHog)中并且涂在具有適當?shù)目股睾头翘烊痪幋a的氨基酸對乙?;奖彼?pAF)的最小培養(yǎng)盤(GMML)上。在37℃下將培養(yǎng)盤培養(yǎng)約40小時,在所述時間點通過刮削收集細胞。使用Qiagen Mini-Prep程序提取DNA,然后純化瓊脂糖凝膠以分離庫質(zhì)粒DNA。
然后將所述DNA電穿孔到負性選擇細胞系(具有負性選擇質(zhì)粒pBAD衍生物的GeneHog)中。將所述轉(zhuǎn)化體涂在具有適當抗生素而不是非天然編碼的氨基酸(pAF)LB盤上。約17小時后,通過刮削收集所述細胞并且使用Qiagen Mini-Prep程序和瓊脂糖凝膠純化將質(zhì)粒DNA純化。
利用電穿孔、涂布、收集和DNA純化的相同方法進行選擇的后續(xù)循環(huán)。在選擇的最后一次(第五次)循環(huán)中,用涂在最小培養(yǎng)盤上的經(jīng)轉(zhuǎn)形的正性選擇細胞制成連續(xù)稀釋液。然后挑取個別群落并且使其在96孔塊中生長整夜。然后,用變化濃度的具有和不具有非天然氨基酸pAF的?;悄懰?正性選擇抗生素),在最小培養(yǎng)盤上重復涂布所述塊。在37℃下生長約40小時后,目測比較培養(yǎng)盤以確定哪一個群落在最高?;悄懰釢舛认律L而在不存在非天然編碼的氨基酸pAF時不生長或不良地生長。使?jié)M足所述標準的群落生長整夜。通過Mini-Prep和瓊脂糖凝膠純化從培養(yǎng)物中分離DNA并且定序。
從對pAF的所述選擇來看,發(fā)現(xiàn)13個無性系具有獨特的氨基酸序列并且使其經(jīng)受另外的表征以測定pAF-tRNA合成酶的保真度和持續(xù)性。
為表征所述合成酶,執(zhí)行小規(guī)模琥珀抑制以展示非天然編碼的氨基酸pAF被并入多肽中,并且通過SDS-PAGE目測結(jié)果。挑取單一群落并且使其在LB肉湯中生長整夜,然后將其用于接種50mL的LB。使細胞生長到OD為0.3-0.4,在所述時間點將1.5mL等分試樣作為先期誘導點并且將培養(yǎng)物分到2個燒瓶中。將1mM pAF添加到一份對分物中并且使兩者生長30分鐘。30分鐘生長后,用0.2%L-阿拉伯糖誘導2個培養(yǎng)物(+/-pAF)并且使其生長4.5小時并且記錄OD600。然后,取出+/-pAF燒瓶的1.5mL等分試樣用于SDS-PAGE分析。
在10,000xg下將1.5mL等分試樣(先期誘導,+pAF、-pAF)離心10分鐘以使細胞成粒。然后,使細胞懸浮于相對于細胞在收集時的OD600的成比例的細菌蛋白質(zhì)提取試劑(BPER,Pierce)量中。將DNase I添加到經(jīng)溶解的細胞中并且在4℃下培養(yǎng)20分鐘。然后,將樣品與還原劑組合并且加載染料并且在MES緩沖液中的4-12%Bis-TRIS凝膠上運行30分鐘。在DI H2O中將凝膠洗滌兩次歷時10分鐘并且用考馬斯亮藍(coommassie blue)染料染色。比較+/-pAF帶的pAF-tRNA RS引起pAF的并入的保真度,并且將+pAF帶與先前所選的pAF-tRNARS比較。
為檢查RS的持續(xù)性,用含有C-H6 S4am肌紅蛋白(S4am-Myo)的質(zhì)粒執(zhí)行相同程序。然后,通過IMAC純化S4am Myo并且將其送去進行蛋白質(zhì)定序以測定pAF并入量。
在從所述選擇識別的pAF-tRNA RS中,發(fā)現(xiàn)一種合成酶(E9)有效地并入pAF,其以大于95%效率將pAF并入S4am-Myo中。并入是通過氨基酸定序測定,而持續(xù)性是通過在SDS-PAGE凝膠上比較蛋白質(zhì)帶而展示。E9的核苷酸序列展示于SEQ ID NO4中,并且E9的氨基酸序列展示在SEQ ID NO5中。
具有與E9相似活性的另一突變體被鑒別出,并且具有展示于SEQ ID NO17中的氨基酸序列。
實例2tRNA突變產(chǎn)生tRNA J17的3種突變體。野生型J17的DNA序列展示為SEQ ID NO8并且在美國專利公開案第2003/0108885號中展示為SEQ ID NO1并且在US 2003/0082575中展示為SEQ ID NO1(分別為美國專利申請案第10/126,931和10/126,927號),兩個專利都以引用的方式并入本文中。如圖1所示,J17 tRNA具有在TΨC莖中的U51:G63擺動對。
產(chǎn)生3種J17突變體(F12、F13和F14)以在TΨC莖的位置51和63上產(chǎn)生Watson-Crick堿基對。通過重疊PCR執(zhí)行突變,并且將最終構(gòu)筑體克隆到pET19質(zhì)粒中的EcoRI和Ndel部位中,所述pET19質(zhì)粒包含編碼氨?;鵷RNA合成酶E9的多核苷酸序列(SEQ ID NO4)和編碼具有琥珀密碼子取代的人類生長激素(hGH)的多核苷酸序列(SEQ ID NO16)。hGH的表達是受T7啟動子的控制。
產(chǎn)生用于重疊PCR的2個片段。第一片段是通過引物延伸獲得。用以產(chǎn)生3種突變體中的每一種突變體的正向引物的序列是GTAACGCTGAATTCCCGGCGGTAGTTCAGCAGGGCAGAACGGCGGACTCTAAATCCGCATGGCGC(FTam11;SEQ ID NO9)。
為產(chǎn)生F12突變體(51C:63G),使用以下反向引物GATCTGCAGTGGTCCGGCGGGCCGGATTTGAACCGGCGCCATGCGGATTTAGAGTCCGCCGTTCTGC(FTam12;SEQ ID NO10)。
為產(chǎn)生F13突變體(51U:63A),使用以下反向引物GATCTGCAGTGGTCCGGCGGGCTGGATTTGAACCAGCGCCATGCGGATTTAGAGTCCGCCGTTCTGC(FTam13;SEQ ID NO11)。
為產(chǎn)生F14突變體(51A:63U),使用以下反向引物GATCTGCAGTGGTCCGGCGGGCAGGATTTGAACCTGCGCCATGCGGATTTAGAGTCCGCCGTTCTGC(FTam14;SEQ ID NO12)。
為產(chǎn)生第二片段,將包含J17 tRNA的多核苷酸序列(SEQ ID NO8)、編碼tRNA合成酶E9的多核苷酸序列(SEQ ID NO4)和編碼具有琥珀密碼子取代的人類生長激素的多核苷酸序列(SEQ ID NO16)的質(zhì)粒pET19 J17 E9 hGH用作用于由以下引物組擴增的模板CGCCGGACCACTGCAGATCCTTAGCGAAAGCTAAGGATTTTTTTTAAGC(正向引物;FTam15;SEQ ID NO13)和CAAATTCGTCCATATGGGATTCC(FTam 16;SEQTDNO14)。正向引物用以將序列從tRNA的3′末端擴展到質(zhì)粒的Nde I部位。將所得產(chǎn)物凝膠純化。
重疊PCR的最后步驟涉及正向引物GTAACGCTGAATTCCCGGCG(FTam17,SEQID NO15)、反向引物FTam16(SEQ ID NO14)、第一片段和第二片段。用EcoR I和Nde I消化經(jīng)裝配的產(chǎn)物并且將其連接到經(jīng)EcoR I和Nde I消化的質(zhì)粒pET19 J17 E9hGH中。各個構(gòu)筑體的序列是通過定序確認,并且J17突變體tRNA中的每一個tRNA的DNA序列展示為SEQ ID NO1(F12)、SEQ ID NO2(F13)和SEQ ID NO3(F14)。tRNA是以其對應的反向引物命名。
蛋白質(zhì)表達編碼tRNA(J17、F12、F13或F14)的質(zhì)粒各自通過化學方法轉(zhuǎn)形到大腸桿菌菌株1和菌株2細菌宿主細胞中,并且涂在具有50ug/ml羧芐青霉素的LB瓊脂培養(yǎng)盤上。在37℃下將培養(yǎng)盤培養(yǎng)整夜。對各tRNA來說,挑取單一群落以在37℃下,在具有50ug/ml羧芐青霉素的1ml 2xYT中開始整夜培養(yǎng)。所述1ml培養(yǎng)物是用以在37℃下接種具有50ug/ml羧芐青霉素的兩份10ml 2xYT培養(yǎng)物。一份10ml培養(yǎng)物是用4mM對乙?;奖彼嵫a充。在OD600=0.7時,用0.4mM IPTG誘導hGH表達。在37℃下,在250rpm下將細胞培養(yǎng)4小時后,通過在5000xg下離心5分鐘來收集細胞。用經(jīng)5ug/mlDNAse I補充的B-PER試劑(Pierce,Rockford,IL)溶解細胞。通過4-12%SDS PAGE分析總的細胞溶胞產(chǎn)物。
圖2展示通過SDS PAGE對大腸桿菌菌株1總細胞溶胞產(chǎn)物的分析。選擇密碼子在人類生長激素中的抑制作用是使用J17或J17突變體(F12、F13、F14)tRNA和氨酰基tRNA合成酶E9執(zhí)行。懷有J17突變體的細胞比懷有J17的細胞生長更加緩慢。通過SDS-PAGE,在不存在4mM對乙?;奖彼釙r,對tRNA突變體未觀察到全長hGH產(chǎn)物。在4mM對乙?;奖彼岽嬖谙?,全長產(chǎn)物經(jīng)tRNA突變體中的每一種突變體產(chǎn)生,證明所述tRNA突變體-RS E9對與大腸桿菌器正交?;赟DS-PAGE,J17突變體的經(jīng)抑制的hGH產(chǎn)率比在大腸桿菌菌株1中J17的經(jīng)抑制的hGH產(chǎn)率高大致1.5-2倍。
如圖3所示,進一步在大腸桿菌菌株2細菌細胞系中測試一種J17突變體F13的琥珀抑制。在大腸桿菌菌株2中,表達以及琥珀抑制產(chǎn)率相對于在大腸桿菌菌株1中的表達以及琥珀抑制產(chǎn)率降低。在不存在對乙?;奖彼釙r,通過SDS-PAGE未觀察到全長hGH產(chǎn)物。在存在4mM對乙酰基苯丙氨酸時,對兩種tRNA都觀察到全長hGH?;赟DS-PAGE,F(xiàn)13的經(jīng)抑制的hGH產(chǎn)率比J17的經(jīng)抑制的hGH產(chǎn)率高約3倍。
進行J17與F13的比較的發(fā)酵是用大致1.5L的最終體積執(zhí)行。將編碼J17 tRNA的質(zhì)粒和編碼F13 tRNA的質(zhì)粒各自轉(zhuǎn)形到大腸桿菌菌株1中。各者的最終細胞密度為大致190g濕細胞/升。J17無性系的hGH效價為347mg/L并且F13無性系的hGH效價為542mg/L。
雖然已經(jīng)出于明確性和理解的目的而相當詳細地描述了上述發(fā)明,但是閱讀本揭示案,所屬領(lǐng)域的技術(shù)人員將顯而易見,可在不脫離本發(fā)明真實范疇的情況下,進行形式和細節(jié)的各種變化。舉例而言,所有上述技術(shù)和裝置都可以各種組合使用。在本申請案中引用的所有公開案、專利、專利申請案和/或其他文獻是出于所有目的而以引用的方式全部并入,該程度就如同已個別指出地各個個別公開案、專利、專利申請案和/或其他文獻是出于所有目的而以引用的方式并入一般。
表1



序列表SEQUENCE LISTING<110>Paulsel,AndrewCho,Ho S.
<120>氨?;?tRNA合成酶的組合物及其用途<130>AMBX-0070.00PCT<150>US 60/639,146<151>2004-12-22<160>17<170>PatentIn version 3.3<210>1<211>77<212>DNA<213>人工序列<220>
<223>人工序列<400>1ccggcggtag ttcagcaggg cagaacggcg gactctaaat ccgcatggcg ccggttcaaa60tccggcccgc cggacca 77<210>2<211>77<212>DNA<213>人工序列<220>
<223>人工序列<400>2ccggcggtag ttcagcaggg cagaacggcg gactctaaat ccgcatggcg ctggttcaaa60tccagcccgc cggacca 77<210>3<211>77<212>DNA<213>人工序列<220>
<223>人工序列<400>3ccggcggtag ttcagcaggg cagaacggcg gactctaaat ccgcatggcg caggttcaaa60tcctgcccgc cggacca 77<210>4<211>921<212>DNA<213>人工序列<220>
<223>人工序列<400>4atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta60agagaggttt taaaaaaaga tgaaaaatct gctgttatag gttttgaacc aagtggtaaa120atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt180gatataatta tatatttggc tgatttacac gcctatttaa accagaaagg agagttggat240gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca300aaatatgttt atggaagtga acatggtctt gataaggatt atacactgaa tgtctataga360ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag420gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tgggattcat480tatgagggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca540agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat600ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa660gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca720ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa780tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag840gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag900ccaattagaa agagattata a 921<210>5<211>306<212>PRT<213>人工序列<220>
<223>人工序列<400>5Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser1 5 10 15Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Val20 25 30Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln35 40 45
Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile50 55 60Tyr Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp65 70 75 80Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met85 90 95Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu His Gly Leu Asp Lys100 105 110Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys115 120 125Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro130 135 140Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Gly Ile His145 150 155160Tyr Glu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile165 170 175His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His180 185 190Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser195 200 205Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala210 215 220Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro225 230 235240Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys245 250 255Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu260 265 270Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys275 280 285Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys290 295 300Arg Leu305<210>6<211>88<212>DNA<213>鹽桿菌種NRC-1<400>6cccagggtag ccaagctcgg ccaacggcga cggactctaa atccgttctc gtaggagttc60gagggttcga atcccttccc tgggacca 88<210>7<211>88<212>DNA<213>人工序列<220>
<223>人工序列<400>7gcgggggttg ccgagcctgg ccaaaggcgc cggacttcaa atccggtccc gtaggggttc 60cggggttcaa atccccgccc ccgcacca 88<210>8<211>77<212>DNA<213>詹氏甲烷球菌<400>8ccggcggtag ttcagcaggg cagaacggcg gactctaaat ccgcatggcg ctggttcaaa60tccggcccgc cggacca 77<210>9<211>65<212>DNA<213>人工序列<220>
<223>人工序列<400>9gtaacgctga attcccggcg gtagttcagc agggcagaac ggcggactct aaatccgcat60ggcgc65<210>10<211>67<212>DNA<213>人工序列
<220>
<223>人工序列<400>10gatctgcagt ggtccggcgg gccggatttg aaccggcgcc atgcggattt agagtccgcc60gttctgc 67<210>11<211>67<212>DNA<213>人工序列<220>
<223>人工序列<400>11gatctgcagt ggtccggcgg gctggatttg aaccagcgcc atgcggattt agagtccgcc60gttctgc 67<210>12<211>67<212>DNA<213>人工序列<220>
<223>人工序列<400>12gatctgcagt ggtccggcgg gcaggatttg aacctgcgcc atgcggattt agagtccgcc60gttctgc 67<210>13<211>49<212>DNA<213>人工序列<220>
<223>人工序列<400>13cgccggacca ctgcagatcc ttagcgaaag ctaaggattt tttttaagc49<210>14<211>23<212>DNA<213>人工序列<220>
<223>人工序列<400>14caaattcgtc catatgggat tcc23<210>15<211>20<212>DNA<213>人工序列<220>
<223>人工序列<400>15gtaacgctga attcccggcg20<210>16<211>600<212>DNA<213>智人<400>16atgggccacc accaccacca ccacttccca accattccct tatccaggct ttttgacaac60gctatgctcc gcgcccatcg tctgcaccag ctggcctttg acacctacca ggagtttgaa120gaagcctaga tcccaaagga acagaagtat tcattcctgc agaaccccca gacctccctc180gtttctcag agtctattcc gacaccctcc aacagggagg aaacacaaca gaaatccaac240ctagagctgc tccgcatctc cctgctgctc atccagtcgt ggctggagcc cgtgcagttc300ctcaggagtg tcttcgccaa cagcctggtg tacggcgcct ctgacagcaa cgtctatgac360ctcctaaagg acctagagga aggcatccaa acgctgatgg ggaggctgga agatggcagc420ccccggactg ggcagatctt caagcagacc tacagcaagt tcgacacaaa ctcacacaac480gatgacgcac tactcaagaa ctacgggctg ctctactgct tcaggaagga catggacaag540gtcgagacat tcctgcgcat cgtgcagtgc cgctctgtgg agggcagctg tggcttctaa600<210>17<211>306<212>PRT<213>人工序列<220>
<223>人工序列<400>17Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser1 5 10 15Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Val20 25 30Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln35 40 45Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile50 55 60Tyr Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp65 70 75 80Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met85 90 95Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu His Gly Leu Asp Lys100105 110Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys115 120 125Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro130 135 140Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Gly Ile His145 150 155 160Tyr Glu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile165 170 175His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His180185 190Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser195200 205Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala210 215 220Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro225 230 235 240Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys245 250 255Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu260 265 270Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Arg Leu Lys275 280 285Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys290 295 300Arg Leu30權(quán)利要求
1.一種組合物,其包含具有選自由以下序列組成的群組的核酸序列的氨?;鵷RNA合成酶(RS)SEQ ID NO4、編碼SEQ ID NO5的氨基酸序列的多核苷酸序列、編碼SEQ ID NO17的氨基酸序列的多核苷酸序列、其互補多核苷酸序列和其保守變化。
2.根據(jù)權(quán)利要求1所述的組合物,其中所述RS優(yōu)選氨基?;痶RNA。
3.根據(jù)權(quán)利要求2所述的組合物,其中所述tRNA是經(jīng)非天然編碼的氨基酸氨基?;?。
4.根據(jù)權(quán)利要求3所述的組合物,其中所述非天然編碼的氨基酸是對乙?;奖彼帷?br> 5.一種組合物,其包含根據(jù)權(quán)利要求1所述的RS和tRNA,其中所述tRNA是經(jīng)化學氨基?;?。
6.一種組合物,其包含根據(jù)權(quán)利要求1所述的RS和tRNA,其中所述tRNA是經(jīng)酶促氨基?;?。
7.根據(jù)權(quán)利要求6所述的組合物,其中所述tRNA是通過所述RS酶促氨基?;?br> 8.根據(jù)權(quán)利要求6所述的組合物,其中所述tRNA是通過核糖酶酶促氨基?;?br> 9.根據(jù)權(quán)利要求1所述的組合物,其另外包含tRNA,其中所述tRNA是通過所述RS用氨基酸氨基?;?br> 10.根據(jù)權(quán)利要求9所述的組合物,其中所述氨基酸是非天然編碼的氨基酸。
11.根據(jù)權(quán)利要求10所述的組合物,其中所述非天然編碼的氨基酸是對乙?;奖彼?。
12.根據(jù)權(quán)利要求9所述的組合物,其中所述tRNA是由原始tRNA得到。
13.根據(jù)權(quán)利要求9所述的組合物,其中所述tRNA是由詹氏甲烷球菌(M.janneschii)得到。
14.根據(jù)權(quán)利要求1所述的組合物,其另外包含轉(zhuǎn)譯系統(tǒng)。
15.根據(jù)權(quán)利要求14所述的組合物,其中所述轉(zhuǎn)譯系統(tǒng)是無細胞轉(zhuǎn)譯系統(tǒng)。
16.根據(jù)權(quán)利要求14所述的組合物,其中所述轉(zhuǎn)譯系統(tǒng)是細胞溶胞產(chǎn)物。
17.根據(jù)權(quán)利要求14所述的組合物,其中所述轉(zhuǎn)譯系統(tǒng)是重構(gòu)系統(tǒng)。
18.根據(jù)權(quán)利要求14所述的組合物,其中所述轉(zhuǎn)譯系統(tǒng)是細胞轉(zhuǎn)譯系統(tǒng)。
19.一種細胞,其包含轉(zhuǎn)譯系統(tǒng),其中所述轉(zhuǎn)譯系統(tǒng)包含根據(jù)權(quán)利要求1所述的RS。
20.根據(jù)權(quán)利要求19所述的細胞,其中所述細胞是真核細胞。
21.根據(jù)權(quán)利要求20所述的細胞,其中所述真核細胞是酵母細胞。
22.根據(jù)權(quán)利要求20所述的細胞,其中所述真核細胞是真菌細胞。
23.根據(jù)權(quán)利要求20所述的細胞,其中所述真核細胞是哺乳動物細胞。
24.根據(jù)權(quán)利要求20所述的細胞,其中所述真核細胞是昆蟲細胞。
25.根據(jù)權(quán)利要求20所述的細胞,其中所述真核細胞是植物細胞。
26.根據(jù)權(quán)利要求19所述的細胞,其中所述細胞是非真核細胞。
27.根據(jù)權(quán)利要求26所述的細胞,其中所述非真核細胞是大腸桿菌(E.coli)細胞。
28.根據(jù)權(quán)利要求19所述的細胞,其另外包含通過所述RS氨基?;膖RNA和編碼所關(guān)注的多肽的多核苷酸,其中所述多核苷酸包含通過所述tRNA識別的選擇密碼子。
29.根據(jù)權(quán)利要求28所述的細胞,其中所述所關(guān)注的多肽是人類生長激素。
30.一種大腸桿菌細胞,其包含根據(jù)權(quán)利要求1所述的RS。
31.一種酵母細胞,其包含根據(jù)權(quán)利要求1所述的RS。
32.一種真菌細胞,其包含根據(jù)權(quán)利要求1所述的RS。
33.一種哺乳動物細胞,其包含根據(jù)權(quán)利要求1所述的RS。
34.一種昆蟲細胞,其包含根據(jù)權(quán)利要求1所述的RS。
35.一種植物細胞,其包含根據(jù)權(quán)利要求1所述的RS。
36.一種載體,其包含編碼具有選自由以下序列組成的群組的核酸序列的RS的多核苷酸SEQ ID NO4、編碼SEQ ID NO5的氨基酸序列的多核苷酸序列、編碼SEQ IDNO17的氨基酸序列的多核苷酸序列、其互補多核苷酸序列和其保守變化。
37.根據(jù)權(quán)利要求36所述的載體,其中所述載體包含質(zhì)粒、粘質(zhì)粒、噬菌體或病毒。
38.根據(jù)權(quán)利要求36所述的載體,其中所述載體是表達載體。
39.一種細胞,其包含根據(jù)權(quán)利要求36所述的載體。
40.一種在細胞中用所選氨基酸在規(guī)定位置上生產(chǎn)多肽的方法,所述方法包含使所述細胞在適當培養(yǎng)基中生長,其中所述細胞包含包括至少一個選擇密碼子并編碼多肽的核酸;和,提供所述所選氨基酸;其中所述細胞另外包含在所述細胞中起作用的根據(jù)權(quán)利要求1所述的正交RS(O-RS),其中所述RS具有選自由以下序列組成的群組的氨基酸序列SEQ ID NO5、SEQ ID NO17、其互補多核苷酸序列和其保守變化;和,識別出所述選擇密碼子的正交tRNA(O-tRNA),其中所述O-RS用所述所選氨基酸氨基?;鯫-tRNA。
41.根據(jù)權(quán)利要求40所述的方法,其中所述所選氨基酸是對乙?;奖彼?。
42.一種通過根據(jù)權(quán)利要求40所述的方法產(chǎn)生的多肽。
43.根據(jù)權(quán)利要求40所述的多肽,其中所述所選氨基酸是對乙?;奖彼?。
44.根據(jù)權(quán)利要求40所述的方法,其中所述多肽是人類生長激素。
45.一種多核苷酸,其具有選自由以下序列組成的群組的核酸序列SEQ ID No.4、編碼SEQ ID NO5的氨基酸序列的多核苷酸序列、編碼SEQ ID NO17的氨基酸序列的多核苷酸序列、其互補多核苷酸序列和其保守變化。
全文摘要
本發(fā)明提供生產(chǎn)包括正交tRNA、正交氨?;璽RNA合成酶和tRNA/合成酶的正交對的蛋白質(zhì)生物合成器的組分的組合物和方法。本發(fā)明也提供用于鑒別所述正交對的方法以及使用所述正交對來生產(chǎn)蛋白質(zhì)的方法。
文檔編號C12P21/02GK101087875SQ200580044434
公開日2007年12月12日 申請日期2005年12月1日 優(yōu)先權(quán)日2004年12月22日
發(fā)明者安德魯·鮑賽爾, 丘霍松 申請人:Ambrx公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1