Axmi440毒素基因及其使用方法
【專利說明】AXM1440毒轟基因及其使用方法 發(fā)明領域
[0001] 本發(fā)明設及分子生物學領域。提供了編碼殺有害生物蛋白的新穎的基因。運些蛋 白和編碼它們的核酸序列在制備殺有害生物配制品中W及在生產轉基因抗有害生物植物 中是有用的。
[0002] 發(fā)明背景
[0003] 蘇云金芽抱桿菌是革蘭氏陽性產芽抱±壤細菌,其特征在于其產生晶狀內含體的 能力,所述晶狀內含體特異性地對于昆蟲的某些目和種具有毒性,但對于植物和其他非祀 生物是無害的。因此,包括蘇云金芽抱桿菌菌株或它們的殺昆蟲蛋白質的組合物可用作環(huán) 境上可接受的殺昆蟲劑W用于控制農業(yè)昆蟲有害生物或者各種人或動物疾病的昆蟲媒介。
[0004] 來自蘇云金芽抱桿菌的晶體(化y)蛋白(S-內毒素)具有主要針對鱗翅目、半翅目、 雙翅目、W及銷翅目幼蟲的有效的殺昆蟲活性。運些蛋白還已經(jīng)顯示針對膜翅目、同翅目、 風目、食毛目、W及婢蛾亞綱有害生物目(Acari pest order)、連同其他無脊椎動物目(如 線蟲動物口、扁形動物口、W及原生動物口肉鞭毛蟲亞口)的活性(費特遜(Feitelson) (1993)蘇云金芽抱桿菌家族樹(The Bacillus Hiuringiensis family tree).先進的工程 殺有害生物劑(Advanced Engineered Pesticides),馬塞爾稱德克爾格式(Marcel Dekker,Inc.),紐約,紐約州(N.Y.))。運些蛋白最初主要基于它們的殺昆蟲活性而分類為 CryI至Cr^。運些主要的類別是鱗翅類特異的(I)、鱗翅類與雙翅目特異的(II)、銷翅目特 異的(111)、雙翅目特異的(IV)、W及線蟲特異的(V)與(VI)。運些蛋白質進一步分類成亞家 族;在每個家族內更高度相關的蛋白質被指定了分組字母例如化y IAXry IB、化y IC等等。在 每個分組內更加密切相關的蛋白質被給予諸如化ylCl、化ylC2等的名稱。
[000引基于氨基酸序列同源性而不是昆蟲祀標特異性描述了 C巧基因的命名法(克里克 莫爾(Crickmore)等人(1998)微生物學與分子生物學評論(Microbiol .Mol .Biol .Rev. )62: 807-813)。在此分類中,每種毒素被指定了獨特的名稱,其中包括第一級(prima巧rank) (阿拉伯數(shù)字)、第二級(secondaiT rank)(大寫字母)、第S級(tertiary rank)(小寫字 母)、W及第四級(quaternary rank)(另一個阿拉伯數(shù)字)。在第一級中,羅馬數(shù)字已被換成 阿拉伯數(shù)字。具有低于45%的序列一致性的蛋白質具有不同的第一級,第二和第=級的標 準分別為78 %和95 %。
[0006] 晶體蛋白不展示殺昆蟲活性,直至其被攝取并溶解在昆蟲中腸之中。被攝取的原 毒素在昆蟲消化道中被蛋白酶水解成活性毒性分子。(H別'te和懷特利(Whiteley)(1989)微 生物學評論(Microbiol. Rev. )53:242-255)。運種毒素與祀幼蟲的中腸中的頂端刷狀緣受 體結合并插入頂端膜中,產生離子通道或孔,從而導致幼蟲死亡。
[0007] S-內毒素通常具有五個保守的序列結構域和S個保守的結構性結構域(參見,例 如戴馬格德(de Maagd)等人(2001)遺傳學趨勢17:193-199)。第一個保守的結構性結構域 由7個a螺旋組成并且參與膜插入和孔形成。結構域II由排列成希臘鑰匙構型的=個0片層 組成并且結構域HI由"果凍卷"結構中的兩個反向平行的0片層組成(de Maagd等人,2001, 上文)。結構域II和HI參與受體識別和結合,并且因此被認為是毒素特異性的決定簇。
[0008] 由于昆蟲可能帶來破壞、W及通過控制昆蟲有害生物在產量方面的改進,對于發(fā) 現(xiàn)新形式的殺有害生物毒素存在著不斷的需要。
[0009] 發(fā)明概述
[0010] 在此提供了用于賦予細菌、植物、植物細胞、組織W及種子殺有害生物活性的組合 物和方法。組合物包括針對殺有害生物的和殺昆蟲的多膚的核酸分子編碼序列、包括那些 核酸分子的載體、W及包括運些載體的宿主細胞。組合物還包括運些殺有害生物多膚序列 W及針對那些多膚的抗體。運些核巧酸序列可W用在DNA構建體或表達盒中,W用于在多種 生物(包括微生物和植物)中進行轉化和表達。運些核巧酸或氨基酸序列可W是合成序列, 運些合成序列已經(jīng)被設計為用于在一種生物中表達,該生物包括但不局限于:一種微生物 或一種植物。組合物還包括含有本發(fā)明的核巧酸序列的細菌、植物、植物細胞、組織、W及種 子。
[0011] 具體地說,提供了編碼一種殺有害生物蛋白的分離的或重組的核酸分子。另外,涵 蓋了與運些殺有害生物蛋白相應的氨基酸序列。具體地,本發(fā)明提供了一種分離或重組的 核酸分子,該核酸分子包括編碼SEQ ID N0:3-6中所示的氨基酸序列的核巧酸序列、或在 SEQ ID N0:1或2中列出的核巧酸序列、W及它們的生物活性變體和片段。還涵蓋了與本發(fā) 明的一個核巧酸序列互補的核巧酸序列、或與本發(fā)明的一個序列或其互補物雜交的核巧酸 序列。另外還提供了包括本發(fā)明的核巧酸序列或者編碼本發(fā)明的氨基酸序列的核巧酸序列 W及它們的生物活性變體和片段的載體、宿主細胞、植物W及種子。
[0012] 提供了用于產生本發(fā)明的多膚的方法、W及用于使用運些多膚來控制或殺死鱗翅 目、半翅目、銷翅目、線蟲、或雙翅目有害生物的方法。還包括用于檢測在樣品中的本發(fā)明的 運些核酸和多膚的方法和試劑盒。
[0013] 本發(fā)明的運些組合物和方法用于產生具有增強的有害生物抗性或耐受性的生物。 運些生物W及包括運些生物的組合物對于農業(yè)目的是所希望的。本發(fā)明的組合物還用于產 生具有殺有害生物活性的改變的或改進的蛋白、或檢測在產物或生物中的殺有害生物蛋白 或核酸的存在。
[0014] 詳細說明
[0015] 本發(fā)明描繪了用于調節(jié)生物(特別是植物或植物細胞)中的有害生物抗性或耐受 性的組合物和方法。"抗性"是指該有害生物(例如,昆蟲化攝取或W其他方式接觸本發(fā)明 的多膚類之后被殺死。"耐受性"是指該有害生物的運動、攝食、繁殖、或其他功能的損害或 降低。運些方法設及用編碼本發(fā)明的一種殺有害生物蛋白的核巧酸序列來轉化生物。具體 地說,本發(fā)明的核巧酸序列用于制備具有殺有害生物活性的植物和微生物。因此,提供了轉 化的細菌、植物、植物細胞、植物組織W及種子。組合物是桿菌或其他物種的殺有害生物核 酸和蛋白質。運些序列用于隨后轉化到感興趣的生物中的表達載體的構建,作為用于其他 同源(或部分同源的)基因的分離的探針,W及用于通過本領域中已知的方法(如,結構域交 換或DNA改組)來產生改變的殺有害生物蛋白,例如內毒素的化yl、Cry2W及化y9家族成員。 運些蛋白用于控制或殺死鱗翅目、半翅目、銷翅目、雙翅目、W及線蟲有害生物種群、W及用 于生產具有殺有害生物活性的組合物。
[0016] 關于"殺有害生物毒素"或"殺有害生物蛋白"是指一種毒素,該毒素具有針對一種 或多種有害生物的毒性,包括但不局限于:鱗翅目、雙翅目、半翅目W及銷翅目、或線蟲動物 口成員、或者與運種蛋白質具有同源性的一種蛋白質。已經(jīng)從生物中分離出殺有害生物蛋 白,運些生物包括例如,芽抱桿菌、雙酶梭菌、W及日本甲蟲類芽抱桿菌(Paenibacillus popilliae)。殺有害生物蛋白包括從在此披露的全長核巧酸序列中推導出的氨基酸序列、 W及比運些全長序列更短的氨基酸序列(或者由于使用了一個可替代的下游起始位點、或 者由于產生一個較短的具有殺有害生物活性的蛋白的加工過程)。加工可W在表達該蛋白 的生物內發(fā)生,或在該有害生物攝取該蛋白之后發(fā)生。
[0017]因此,在此提供了新穎的分離或重組的核巧酸序列,運些序列賦予了殺有害生物 活性。運些核巧酸序列編碼與已知的S-內毒素或二元毒素具有同源性的多膚。還提供了殺 有害生物蛋白的氨基酸序列。由運種基因的翻譯而產生的蛋白允許細胞控制或殺死攝取了 該蛋白的有害生物。
[001引分離的核酸分子、W及它們的變體和片段
[0019] 本發(fā)明的一個方面設及分離的或重組的核酸分子,運些核酸分子包括編碼殺有害 生物蛋白和多膚或它們的生物活性部分的核巧酸序列;W及足W用作雜交探針來鑒定編碼 具有序列同源性的區(qū)域的蛋白質的核酸分子的核酸分子。在此還涵蓋了能夠在如在此的其 他部分所定義的嚴格條件下與本發(fā)明的核巧酸序列雜交的核巧酸序列。如在此所使用的, 術語"核酸分子"旨在包括DNA分子(例如,重組DNA、CDNA或基因組DNA)和RNA分子(例如, mRNA似及使用核巧酸類似物產生的DNA或RNA的類似物。運種核酸分子可W是單鏈或雙鏈 的,但優(yōu)選是雙鏈DNA。
[0020] "分離的"或"重組的"核酸序列(或DNA)被用在此處是指一種核酸序列(或DNA),該 核酸序列(或DNA)不再存在于它的自然環(huán)境中(例如,在體外或在重組細菌或植物宿主細胞 中)。在一些實施例中,一種分離的或重組的核酸是不含有在衍生出該核酸的生物的基因組 DNA中天然地位于該核酸側翼的序列(即,位于該核酸的5'和3'末端的序列)(優(yōu)選編碼蛋白 質的序列)。出于本發(fā)明的目的,"分離的"當用于指核酸分子時不包括分離的染色體。例如, 在不同實施例中,編碼S-內毒素的分離的核酸分子可W包含小于約化b、4kb、3kb、、化b、 0.5化或0.化b的核巧酸序列,運些核巧酸序列天然地側翼于衍生出該核酸的細胞的基因組 DNA中的核酸分子。在不同的實施例中,基本上不含有細胞物質的一種S內毒素蛋白包括具 有少于約30%、20%、10%或5 % (按干重計)的非S內毒素蛋白(在此也被稱為"污染蛋白 質")的蛋白質制劑。在一些實施例中,本發(fā)明的重組核酸相對于SEQ ID NO: 1,或其變體或 片段包含一個或多個核巧酸置換。
[0021] 編碼本發(fā)明的運些蛋白質的核巧酸序列包括SEQ ID NO: 1或2中列出的序列W及 它們的變體、片段W及互補物。關于"互補物"是指與給定的核巧酸序列足夠地互補使得它 可W與該給定的核巧酸序列雜交由此形成一個穩(wěn)定的雙鏈體的核巧酸序列。對于由運些核 巧酸序列所編碼的殺有害生物蛋白的相應氨基酸序列在SEQ ID NO: 3-6中列出。
[0022] 本發(fā)明還涵蓋了 W下核酸分子,運些核酸分子是運些編碼殺有害生物蛋白的核巧 酸序列的片段。關于"片段"是指編碼一種殺有害生物蛋白的核巧酸序列的一個部分。核巧 酸序列的一個片段可W編碼殺有害生物蛋白的生物活性部分,或者它可W是使用W下披露 的方法可W用作一種雜交探針或PCR引物的一個片段。作為編碼殺有害生物蛋白的一個核 巧酸序列片段的核酸分子包括至少約50、100、200、300、400、500、600、700、800、900、1000、 1100、1200、1300、1350、1400個連續(xù)核巧酸,或達到在此披露的一種全長的編碼殺有害生物 蛋白的核巧酸序列中存在的核巧酸的數(shù)目,運取決于所預期的用途。關于"連續(xù)的"核巧酸 旨在指彼此鄰近的核巧酸殘基。本發(fā)明的核巧酸序列的片段將編碼保留殺有害生物蛋白的 生物活性、并且因此保留殺有害生物活性的蛋白質片段。因此,還涵蓋了在此披露的多膚的 生物活性片段。關于"保留活性"是指該片段將具有至少約30%、至少約50%、至少約70%、 80%、90%、95%或更高的該殺有害生物蛋白的殺有害生物活性。在一個實施例中,該殺有 害生物活性是殺銷翅目活性。在另一個實施例中,該殺有害生物活性是殺鱗翅目活性。在另 一個實施例中,該殺有害生物活性是殺線蟲活性。在另一個實施例中,該殺有害生物活性是 殺雙翅目活性。在另一個實施例中,該殺有害生物活性是殺半翅目活性。用于測量殺有害生 物活性的方法在本領域是熟知的。參見例如查普拉(Czapla)和朗化ang)(1990)經(jīng)濟昆蟲學 雜志(J.Econ.化tomol. )83:2480-2485;安德魯斯(Andrews)等人(1988)生物化學雜志 (Biochem.J. )252:199-206;馬羅內(Marrone)等人(1985)經(jīng)濟昆蟲學雜志(J.Of Economic 化tomology)78: 290-293; W及美國專利號5,743,477,所有運些文獻都通過引用W其全文 結合在此。
[0023] 編碼本發(fā)明的蛋白質的生物活性部分的編碼殺有害生物蛋白的核巧酸序列片段 將編碼至少約 15、25、30、50、75、100、125、150、175、200、250、300、350、400、450個連續(xù)氨基 酸,或達到在本發(fā)明的全長殺有害生物蛋白中存在的氨基酸的總數(shù)目。在一些實施例中,該 片段是蛋白酶切片段。例如,蛋白酶切片段可W相對于SEQ ID N0:3-6具有至少約100個氨 基酸、約120個、約130個、約140個、約150個、或約160個氨基酸的N末端或C末端截短。在一些 實施例中,在此所涵蓋的運些片段是由例如通過蛋白酶解或通過在編碼序列中插入終止密 碼子來除去C末端結晶結構域而產生。
[0024] 本發(fā)明的優(yōu)選殺有害生物蛋白是通過與SEQ ID NO: 1或2的核巧酸序列足夠地一 致的核巧酸序列編碼的,或者運些殺有害生物蛋白是與SEQ ID N0:3-6中所列出的氨基酸 序列足夠地一致的。關于"足夠地一致"是指使用標準參數(shù)、使用在此所描述的比對程序之 一,一種氨基酸或核巧酸序列與參考序列相比較具有至少約60%或65%序列一致性、約 70%或75%序列一致性、約80%或85%序列一致性、約90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%或更高的序列一致性。本領域的普通技術人員將會認識到,可W對運 些數(shù)值進行適當?shù)卣{整W便通過考慮密碼子簡并性、氨基酸相似性、閱讀框定位、等等來確 定由兩個核巧酸序列編碼的蛋白質的相應一致性。
[0025] 為了確定兩個氨基酸序列或兩個核酸的一致性百分比,針對最佳比較目的而比對 運些序列。運兩個序列之間的一致性百分比是由運些序列共有的相同位置的數(shù)目的函數(shù) (即,一致性百分比二相同位置的數(shù)目/位置(例如,重疊位置)的總數(shù)目X 100)。在一個實施 例中,運兩個序列是相同長度的。在另一個實施例中,該一致性百分比是貫穿參考序列(即, 在此披露的如SEQ ID NO: 1-6中任一項的序列)的整體來計算的。在兩個序列之間的一致性 百分比可W使用與W下說明的那些相似的技術來確定,其中允許或不允許空位。在計算一 致性百分比中,對典型地準確的匹配進行計數(shù)。空位,即,比對中在一個序列中存在殘基而 在另一個序列中不存在的位置,其被視為具有不一致殘基的位置。
[0026] 兩個序列之間的一致性百分比的確定可W通過使用數(shù)學算法來完成。用于兩個序 列的比較的數(shù)學算法的一個非限制性實例是卡爾林化arl in)和阿爾丘爾(Altschul) (1990)美國國家科學院院刊(Proc.化tl. Acad. Sci. USA)87:2264的算法,它在卡爾林和阿 爾丘爾(1993)美國國家科學院院刊90:5873-5877中進行了修改。運種算法被結合到阿爾丘 爾(Altschul)等人(1990)分子生物學雜志(J.Mol.Biol. )215:403 的 BLASTN 和 BLASTX 程序 中。BLAST核巧酸捜索可W用BLASTN程序(得分=100、字長=12)來進行,W獲得與本發(fā)明的 殺有害生物樣核酸分子同源的核巧酸序列。BLAST蛋白質捜索可W用化ASTX程序(得分= 50、字長=3)來進行,W獲得與本發(fā)明的殺有害生物蛋白分子同源的氨基酸序列。為了獲得 用于比較目標的有缺口的比對,可W利用如在阿爾丘爾等人(1997)核酸研究(Nucleic Acids Res. )25: 3389)中所述的有缺口的化AST(BLAST 2.0中)??商娲?,可W使用PSI-Blast進行迭代捜索,該迭代捜索檢測分子之間的遠近關系。參見阿爾丘爾(Altschul)等人 (1997)同上。當利用化AST、空位化AST和PSI-Blast程序時,可W使用對應的程序(例如, BLASTX和BLASTN)的默認參數(shù)。還可W通過檢查,手動進行比對。
[0027]用于序列比較的一種數(shù)學算法的另一個非限制實例是ClustalW算法(希金斯 化iggins)等人(1994)核酸研究(Nucleic Acids Res.)22:4673-4680))<Xlus化IW比較了 序列并且比對了該氨基酸或DNA序列的整體,并且因此可W提供有關整個氨基酸序列的序 列保守性的數(shù)據(jù)。ClustalW算法用于幾個可商購的DNA/氨基酸分析軟件包,如Vector NTI Program Suite的ALIGNX模塊(英杰公司(Invitrogen Corporation),卡爾斯己德 (化rlsbad),加利福尼亞(CA))。用ClustalW進行氨基酸序列比對之后,可W估算出氨基酸 一致性百分數(shù)。用于ClustalW比對分析的軟件程序的另一個非限制性實例是GE肥D0C?。 GE肥D0C?(卡爾稱尼古拉斯公司化arl Nicholas))允許在多個蛋白質之間評估氨基酸(或 DNA)相似性和一致性。用于比較序列的數(shù)學算法的另一個非限制性實例是邁爾斯(Myers) 和米勒(Miller)(1988)生物科學中的計算機應用(CABI0S)4:11-17的算法。運種算法被結 合到ALIGN程序(版本2.0)中,該程序是GCG威斯康星遺傳學軟件包(Wisconsin Genetics Software Package)(版本10)(可商購自阿塞勒德公司(Accebys , Inc.),斯克蘭頓路9685 號(9685 Scranton Rd.),圣地亞哥(San Diego),加利福尼亞州,美國)的一部分。當利用 ALIGN程序來比較多個氨基酸序列時,可W使用一個PAM120權重殘基表、空位長度罰分12、 W及空位罰分4。
[002引除非另有說明,GAP版本10(它采用了尼德爾曼(Needleman)和翁施(Wunsch) (1970)分子生物學雜志(J.Mol.Biol. )48(3) :443-453的算法)將使用W下參數(shù)用于測定序 列一致性或相似性:對于核巧酸序列的一致性% W及相似性%,使用GAP權重50和長度權重 3, W及nwsgapdna.cmp評分矩陣;對于氨基酸序列的一致性% W及相似性%,使用GAP權重8 和長度權重2W及化0SUM62評分程序。還可W使用等效程序。關于"等效程序"是指W下任何 序列比較程序,該程序針對所研究的任何兩個序列、當與由GAP版本10所產生的相應比對相 比時產生一個比對,該比對具有相同