環(huán)脂肽抗生素羅克霉素生物合成相關(guān)的基因簇的制作方法
【技術(shù)領(lǐng)域】:
[0001] 本發(fā)明屬于微生物基因資源和基因工程領(lǐng)域,具體涉及具有廣譜抗菌活性,特別 是抗病毒活性的環(huán)脂肽抗生素羅克霉素(locillomycin)的生物合成、分析、功能研究及應 用。 技術(shù)背景:
[0002] 脂肽類抗生素是枯草芽孢桿菌及其相近物種通過非核糖體合成途徑合成的一類 由親水性環(huán)狀短肽頭部和長鏈疏水性脂肪酸尾部組成的次生代謝產(chǎn)物,具有抗菌活性和溶 血性能,在醫(yī)藥、農(nóng)藥和工業(yè)上具有廣泛的應用價值。脂肽類抗生素根據(jù)其合成的基因簇和 化學結(jié)構(gòu)的差異可分為表面活性素(Surfactin)、伊枯草素(Iturin)和泛革素(Fengycin) 三大家簇。
[0003] 表面活性素家簇結(jié)構(gòu)的共同特點是由7個氨基酸殘基的多肽鏈通過酯鍵與含有 13~15個碳原子羥基脂肪酸交聯(lián)形成內(nèi)酯環(huán)狀結(jié)構(gòu)的極性化合物。表面活性素通過 作用于細胞膜的磷脂雙分子層而表現(xiàn)出較強溶血活性、抑制細菌和病毒的活性。該家簇主 要包括枯草芽孢桿菌產(chǎn)生的表面活性素,短小芽孢桿菌產(chǎn)生的表面活性劑(Pumilacidin), 地衣芽孢桿菌產(chǎn)生的地衣芽孢桿菌素(lichenysin)。由于表面活性素7個氨基酸殘基的變 異性較大,表現(xiàn)出很強的多樣性。
[0004] 伊枯草素家簇結(jié)構(gòu)的共同特點是由7個氨基酸殘基的多肽鏈與含有14~ 17 3 -氨基脂肪酸鏈相連形成的化合物。伊枯草素也具有較強的溶血活性,主要是通過影響 真菌細胞膜的表面張力,導致微孔的形成、促使電解質(zhì)及其他重要離子的滲漏而表現(xiàn)出強 的抗真菌活性。然而,伊枯草素對細菌和病毒的抑制活性較弱。伊枯草素家簇由枯草芽孢 桿菌及其近源菌種合成分泌,主要包括9個異構(gòu)體IturinA、C、D、E、BacillomycinD、F、L、 Lc和Mycosubtilin。
[0005] 泛革素家簇結(jié)構(gòu)的共同特點是由10個氨基酸殘基的多肽鏈通過酯鍵與含有14~ 18個羥基飽和或非飽和的脂肪酸交聯(lián)形成內(nèi)酯環(huán)。泛革素的溶血作用沒有表面活 性素和伊枯草素強烈,但表現(xiàn)出強烈的抗真菌活性和弱的抗細菌和病毒活性。泛革素也 主要是由枯草芽孢桿菌及其相近菌種合成分泌,主要包括4中異構(gòu)體FengycinA、B和 PlipastatinA、B〇
[0006] 脂肽類化合物合成酶系NRPSs是目前所發(fā)現(xiàn)的最大的酶系之一,由多個模塊 (Module)按一定的空間順序排列而成,一個典型的模塊大約有1000個氨基酸組成,主要負 責一次底物縮合反應,負責將一個氨基酸整合到延伸的肽骨架上。每個模塊一般都含有氨 基酸腺苷醜化(aminoacidadenylationdomain,A)、膚醜載體蛋白(peptidylcarrier proteindoamin,PCP)、和縮合(condensationdomain,C)三個基本結(jié)構(gòu)域。上述基本結(jié)構(gòu) 域?qū)被嵴系诫墓羌艿木唧w過程是:1)A結(jié)構(gòu)域從底物池中選擇結(jié)合特定的氨基酸, 在ATP的作用下將底物活化;2)活化的底物,氨酰-AMP與PCP結(jié)構(gòu)域上的輔因子磷酸泛酰 巰基乙胺(4' _phosphopantetheine,Ppant)的巰基結(jié)合,形成氨酰-S-載體復合物;3)分 別攜帶有氨?;碗孽;妮d體與C結(jié)構(gòu)域上的特定區(qū)域結(jié)合,形成新肽鍵,產(chǎn)生延長了 一個氨基酸的新的肽鍵-S-載體復合物和游離的載體。在上述基本結(jié)構(gòu)域的基礎(chǔ)上,有些 模塊還存在一些修飾結(jié)構(gòu)域,通常與基本結(jié)構(gòu)域毗鄰,對氨基酸殘基進行進一步修飾。如, 差向異構(gòu)化結(jié)構(gòu)域(Epimerization,E)催化L-型的氨基酸轉(zhuǎn)化為D-型氨基酸,甲基轉(zhuǎn)移 酶結(jié)構(gòu)域(methyltransferasedomain,M)。在合成酶系NRPSs的最后一個模塊包含一個 硫酯酶結(jié)構(gòu)域(Thioesterasedomain,TE),該結(jié)構(gòu)域負責脂肽類化合物的環(huán)化和從復合酶 上的釋放。脂肽類的化合物的肽序列和催化模塊的排列之間存在線性關(guān)系,即模塊的數(shù)量、 種類和排列的空間順序決定了相應脂肽類化合物肽序列的氨基酸殘個數(shù)、種類和順序。這 種具有共線性結(jié)構(gòu)域的NRPSs成為線性NRPSs(A型)。目前也發(fā)現(xiàn)一些偏離經(jīng)典的共線性 結(jié)構(gòu)體系的NRPSs,如重復性NRPSs(B型)和非線性NRPSs(C型)。
[0007] 上述脂肽類化合物大多數(shù)在幾十年前就被分離、鑒定和申請了專利。隨著基因工 程技術(shù)興起,這些脂肽類化合物的合成基因簇也被陸續(xù)克隆報道和申請了專利。在伊枯草 素家簇,1952年美國科學家申請了Mycosubtilin的專利,專利號為2602767 ;2001年日本 科學家申請了IturinA基因簇的專利,專利號為P2001-231561A;2004年德國科學家申請 了BacillomycinD基因簇的專利,專利號為W0 / 2004 / 111240A2;在2010年本研究團 隊也首次克隆報道了脂肽類抗生素BacillomycinL的結(jié)構(gòu)基因簇。目前發(fā)現(xiàn)報道的脂肽 類化合物的NRPSs都是共線性關(guān)系,未見重復性和非線性關(guān)系的報道。
[0008] 脂肽類化合物的一個重要特點是由脂肪酸和肽組成的雜合抗生素,催化脂肪酸和 肽連接的酶叫做聚酮合成酶(polyketidesynthases,PKSs)。盡管不同來源的PKSs都具 有比較高的同源性,但不同的PKSs作用的底物都有較強的底物專一性,底物結(jié)構(gòu)的變化會 給這些PKSs催化的活性造成很大影響。脂肽類化合物的另一個重要特點是其肽段含有非 蛋白質(zhì)性質(zhì)的氨基酸。這些非蛋白質(zhì)性質(zhì)氨基酸是經(jīng)過與腺苷?;Y(jié)構(gòu)域和毗鄰的后修飾 結(jié)構(gòu)域,包括:差向異構(gòu)、羥基化、羧基化和環(huán)氧化等結(jié)構(gòu)域催化得來。大多數(shù)情況下這些后 修飾步驟導致產(chǎn)生藥效團特性。對于聚酮合成酶、腺苷?;Y(jié)構(gòu)域和后修飾結(jié)構(gòu)域?qū)τ诘?物的選擇性也使其成為組合生物合成的引用注目的工具。
[0009] -直以來,提高菌株次生抗菌代謝化合物是工業(yè)生產(chǎn)抗菌化合物致力解決的優(yōu)先 問題。然而傳統(tǒng)的通過改善發(fā)酵條件,或者通過化學誘變篩選產(chǎn)量提高的抗菌化合物產(chǎn)生 菌株越來越受到限制,并且很容易達到飽和。脂肽類化合物的生產(chǎn)和應用也面臨著同樣的 問題。隨著生物技術(shù)的發(fā)展特別是基因工程的飛速發(fā)展,提供了通過改造抗菌化合物產(chǎn)生 菌株中相關(guān)基因而大幅度提高抗菌化合物產(chǎn)量的途徑。這其中增加正調(diào)控基因拷貝數(shù)或打 斷負調(diào)控基因是最重要的途徑之一。
【發(fā)明內(nèi)容】
:
[0010] 本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種新環(huán)脂肽抗生素羅克霉素生物 合成基因簇。本發(fā)明提供了羅克霉素生物合成相關(guān)的所有基因和蛋白信息,為生物合成羅 克霉素和遺傳改造提供了基礎(chǔ);本發(fā)明的羅克霉素生物合成基因簇及其蛋白可以廣泛用于 農(nóng)業(yè)、工業(yè)和醫(yī)藥領(lǐng)域。
[0011] 本發(fā)明通過以下的技術(shù)方案實現(xiàn)的:
[0012] 本發(fā)明涉及一種由枯草芽胞桿菌Bacillussubtilis916產(chǎn)生的具有廣譜抗菌活 性,特別是抗病毒活性的環(huán)脂肽抗生素-羅克霉素(locillomycin)的生物合成基因簇,其 序列如SEQIDNO:1所示。
[0013] 所述羅克霉素生物合成基因簇包含10個基因:
[0014]結(jié)構(gòu)基因 4 個:LocD、LocA、LocB和LocC;其中:
[0015] 所述基因LocD,位于SEQIDNO:1的第7565~11446位,
[0016] 所述基因LocA,位于 SEQIDN0 :1 的第 11667 ~18644 位,
[0017] 所述基因LocB,位于 SEQIDN0 :1 的第 18726 ~30332 位,
[0018] 所述基因LocC,位于 SEQIDN0 :1 的第 30402 ~36782 位;
[0019]轉(zhuǎn)運基因 4 個:orf1、orf5、orf6 和orf7;其中:
[0020] 所述基因orf1,位于SEQIDNO:1的第5675~6550位,
[0021] 所述基因 orf5,位于 SEQIDN0 :1 的第 39787 ~40551 位,
[0022] 所述基因 orf6,位于 SEQIDN0 :1 的第 40538 ~42446 位,
[0023] 所述基因orf7,位于 SEQID N0 :1 的第 42518 ~45550 位;
[0024] 調(diào)芐基因2個:orf3和orf4;其中:
[0025] 所述基因orf3,位于 SEQID N0 :1 的第 36883 ~37566 位,
[0026] 所述基因orf4,位于 SEQID N0 :1 的第 37563 ~38585 位。
[0027] 所述4個結(jié)構(gòu)基因編碼的蛋白具體為:
[0028] 所述基因LocD編碼的蛋白序列如SEQID N0 :4所示,該蛋白為含有聚酮化合物合 成酶模塊的多功能復合酶,命名為羅克霉素合成酶D;
[0029] 所述基因LocA編碼的蛋白序列如SEQID N0:5所示,該蛋白為含有肽鏈延伸模塊 的多功能復合酶,命名為羅克霉素合成酶A;
[0030] 所述基因LocB編碼的蛋白序列如SEQIDNO:6所不,該蛋白為該蛋白為含有膚鏈 延伸模塊的多功能復合酶,命名為羅克霉素合成酶B;
[0031] 所述基因LocC編碼的蛋白序列如SEQIDN0 :7所不,該蛋白為該蛋白為含有膚鏈 延伸模塊和肽鏈環(huán)化模塊的多功能復合酶,命名為羅克霉素合成酶C;
[0032] 所述4個轉(zhuǎn)運基因編碼的蛋白具體為:
[0033] 所述基因orfl編碼的蛋白序列如SEQIDN0:3所示,該蛋白為含有ATP結(jié)合結(jié)構(gòu) 域的ABC轉(zhuǎn)運蛋白,命名為potA;
[0034] 所述基因orf5編碼的蛋白序列如SEQIDNO:10所示,該蛋白為含有ATP結(jié)合結(jié) 構(gòu)域的ABC轉(zhuǎn)運蛋白,命名為potB;
[0035] 所述基因orf6編碼的蛋白序列如SEQIDNO