亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

諾卡噻唑菌素的生物合成基因簇及其應(yīng)用的制作方法

文檔序號(hào):585026閱讀:364來(lái)源:國(guó)知局
專利名稱:諾卡噻唑菌素的生物合成基因簇及其應(yīng)用的制作方法
技術(shù)領(lǐng)域
本發(fā)明屬于微生物基因資源和基因工程領(lǐng)域,具體涉及硫肽類抗生素諾卡噻唑菌 素(Nocathiacins)的生物合成基因簇的克隆,序列分析,基因功能研究及其應(yīng)用。
背景技術(shù)
諾卡噻唑菌素(Nocathiacins)是一類富含元素硫,氨基酸殘基被高度修飾的 環(huán)肽類抗生素,它們作為硫肽家族中十分重要的成員,最初是在篩選對(duì)有新青霉素抗性 的金黃色葡萄球菌(Methicillin-Resistant Staphylococcus aureus, MRSA)禾口有多種 耐藥性的糞腸球菌(Multi-Drug Resistant Enterococcus faecium, MREF)的生長(zhǎng)有 Φ 制作用的抗生素的過(guò)程中,從土壤樣品中發(fā)現(xiàn)的[J.Antibiot. 1998,51,715]。1998年, Tokushima研究中心率先從擬無(wú)枝酸菌(Amycolatopsis sp. MJ347-81F4)中分離純化到了 MJ347-81F4-A(Nocathiacin I )和B,并完成了它們的發(fā)酵、活性測(cè)試和結(jié)構(gòu)測(cè)定,但沒(méi)有 確定其絕對(duì)構(gòu)型。2003年,Bristol-Myers Squibb藥物研究所又從諾卡氏菌(Nocardia sp.ffff-12651)中發(fā)現(xiàn)了 Nocathiacin I、II、III,并對(duì)其進(jìn)行了發(fā)酵、分離純化和活性測(cè) 試,還利用NMR、X-ray等方法首次確定了其絕對(duì)構(gòu)型(圖1) [J. Antibiot. · 2003,56,226, 232 ;Clough, B. J. Org. Chem. 2002,67,8699]。諾卡噻唑菌素與硫肽家族其他抗生素一樣也擁有一個(gè)以三取代的吡啶為核心,由 多個(gè)噻唑及脫水氨基酸所構(gòu)成的環(huán)肽中心。其中Nocathiacin I在結(jié)構(gòu)上與該家族的另一 成員糖硫己糖二酐α極其相似,不同之處在于多了一個(gè)2,3_脫氫丙氨酰胺的邊鏈,吲哚酸 單元與大環(huán)相連部分的酯鍵替代了原來(lái)的硫酯鍵。研究表明諾卡噻唑菌素可以很好地抑制革蘭氏陽(yáng)性菌的生長(zhǎng),特別是對(duì)多種耐藥 性的條件致病菌具有極強(qiáng)的殺傷作用。其中Nocathiacin I對(duì)MRSA的MIC值為0. 003 μ g/ mL,對(duì)有青霉素抗性的月市炎鏈球菌(penicillin-resistant Streptococcus pneumoniae, PRSP)的MIC值達(dá)到0.001 μ g/mL,比萬(wàn)古霉素高出10-20倍。同時(shí),它還對(duì)近期出現(xiàn)的有 萬(wàn)古霉素(Vancomycin)抗性的獎(jiǎng)腸球菌(vancomycin-resistant Enterococci faeccium, VREF)具有良好的抗性,MIC值為0.015 μ g/mL。而且與萬(wàn)古霉素相比,諾卡噻唑菌素對(duì)感 染MRSA的小鼠具有更加顯著的療效,Nocathiacin I、IIJIIW PD5tl值分別為0. 8,0. 62、 0. 89mg/kg,萬(wàn)古霉素在同樣條件下僅為1. 3mg/kgo Nocathiacin I和II作為硫肽家族抗菌 活性最好的兩個(gè)化合物,在較低PH下還比其他成員具有更好的水溶性,可能是因?yàn)榉肿又?含有一個(gè)二甲基氨基己糖的緣故[Med. Chem. Lett. 2004. 14. 171-175]。近期發(fā)現(xiàn)這類抗生素的作用機(jī)制與硫鏈絲菌肽類似,也是與50S亞基的23S rRNA-Ll 1蛋白復(fù)合物結(jié)合,通過(guò)阻止或促進(jìn)Ll 1構(gòu)象的變化,影響aa_tRNA. Ef-Tu. GTP復(fù)合 物的識(shí)別及延伸因子的GTPase活性,從而抑制細(xì)菌體內(nèi)蛋白質(zhì)的合成來(lái)發(fā)揮活性作用的 [J. Am. Chem. Soc. 2008,130,12102-12110]。目前其具體的構(gòu)效關(guān)系還不是很清楚,但據(jù)推 測(cè)它們相似的環(huán)肽中心可能是其具有優(yōu)越活性的關(guān)鍵結(jié)構(gòu)。諾卡噻唑菌素作為新一代抗感染藥物的先導(dǎo)化合物,自發(fā)現(xiàn)之日起就引起了科學(xué)家們的濃厚興趣。考慮到它們的溶解度尚未達(dá)到靜脈注射藥劑的要求,不少化學(xué)家對(duì)其進(jìn) 行了化學(xué)半合成改造。Bristol-Myers Squibb藥物研究所通過(guò)在Nocathiacin I上添加 了一些極性水溶性基團(tuán),來(lái)提高它們的生物利用度如在吡啶環(huán)的羥基上或在吲哚酸側(cè)鏈 的氮上烷氧化[Bioorganic & Medicinal Chemistry Letters. 2004,14,3743-3746];通 過(guò)Michael加成在2,3_脫氫丙氨酰胺邊鏈上添加氨或硫醇[Tetrahedron Letters. 2004, 5,1059-1063];或者用化學(xué)法或酶法去掉2,3-脫氫丙氨酰胺,得到Nocathiacin IV,再進(jìn) 一步烷氧化或添加烴基胺[J. Org. Chem. 2002,67,8789]。但這些方法往往很難在提高水 溶性的同時(shí)保持原始結(jié)構(gòu)良好的抗菌活性。而這類抗生素的化學(xué)結(jié)構(gòu)極其復(fù)雜,二十多 年來(lái)人們只完成了部分模塊和酸性水解產(chǎn)物的合成[Tetrahedron Lett. 1984,25,2127 ; J. Org. Chem. 1996,61,4623 ;J. Org. Lett. 2003,5,4421 ;Tetrahedron Lett. 1991,32,4263 ; Angewandte Chemie. 2005,117,3802-3806 ;Chem. Commun. 2008,591-593]。直到近幾年有機(jī) 合成大師Moody和Nicolaou等人才完成了啟動(dòng)噻星A、淀硫霉素D、硫鏈絲菌肽、鹽屋霉素 A、GE2270A/T的全合成,諾卡噻唑菌素的全合成還沒(méi)有人報(bào)道[Angew. Chem. Int. Ed. 2007, 46, 7930-7954] 0并且由于該類抗生素復(fù)雜的多環(huán)結(jié)構(gòu),眾多的手性中心,使得單純利用全 合成的方法進(jìn)行改造步驟繁多,實(shí)際生產(chǎn)成本過(guò)高。而近年來(lái)隨著基因組學(xué)和蛋白質(zhì)組學(xué)的深入研究以及新型生物技術(shù)的快速發(fā)展, 使我們利用微生物作為“細(xì)胞工廠”,通過(guò)遺傳控制來(lái)大量合成具有良好生物活性和新型作 用機(jī)制的天然產(chǎn)物及其類似物成為可能。這也為我們?cè)谖⑸矬w內(nèi)獲得所需要的新型硫肽 類抗生素提供了一條新的思路。因此我們以微生物來(lái)源的諾卡噻唑菌素為目標(biāo)分子,從克隆諾卡噻唑菌素的生物 合成基因簇出發(fā),采用微生物學(xué)、分子生物學(xué)、生物化學(xué)以及有機(jī)化學(xué)相結(jié)合的方法來(lái)研究 其生物合成,闡明其生物合成途徑及調(diào)節(jié)機(jī)制,在此基礎(chǔ)上運(yùn)用代謝工程的原理,合理修飾 諾卡噻唑菌素的生物合成途徑,探索生物利用度更好、并能通過(guò)微生物發(fā)酵大量生產(chǎn)的新 型藥物。

發(fā)明內(nèi)容
本發(fā)明涉及一類由諾卡氏菌產(chǎn)生的具有良好抗菌活性的抗生素_諾卡噻唑菌素 (Nocathiacins)的生物合成基因簇的克隆、測(cè)序、分析、功能研究及其應(yīng)用。本發(fā)明中整個(gè)基因簇共包含37個(gè)基因的核苷酸序列或互補(bǔ)序列(序列1) (SEQ ID NO :1),其中有 8 個(gè)基因 noc28, noc20, noc21, noc22, noc23, noc9, noc24 禾口 noc30 負(fù)責(zé) Nocathiacin I大環(huán)骨架的生物合成;4個(gè)基因noc25,noc26, noc27和noc29負(fù)責(zé)吲哚酸 側(cè)鏈的生物合成;6個(gè)基因noc6,noclO, nocll, nocl2, nocl3和nocl4負(fù)責(zé)4_N,N- 二甲 基-2,4,6-脫氧己糖的生物合成;5個(gè)細(xì)胞色素P450氧化還原酶基因noc7,nocl5, nocl6, nocl8, nocl9,負(fù)責(zé)Nocathiacin I的氧化還原后修飾;2個(gè)甲基轉(zhuǎn)移酶基因noc8,noc36, 分別負(fù)責(zé)Nocathiacin I的甲基化后修飾和自身的抗性;2個(gè)抗性基因nOC17,nOC37 ;3個(gè) 調(diào)節(jié)基因noc5,noc33, noc34 ;4個(gè)與轉(zhuǎn)錄翻譯有關(guān)的基因nocl,noc2, noc3, noc4 ;以及3 個(gè)未知功能的基因noc31,noc32, noc35。本發(fā)明還提供了一個(gè)編碼諾卡噻唑菌素前體肽的核苷酸序列,由序列2中的氨基 酸序列組成,命名為noc28,其基因的核苷酸序列位于序列1中第38432-38581堿基處。
6
本發(fā)明還提供了一個(gè)編碼諾卡噻唑菌素噻唑環(huán)形成的環(huán)化酶的核苷酸序列, 由序列3中的氨基酸序列組成,命名為n0C23,其基因的核苷酸序列位于序列1中第 30980-32875 堿基處。本發(fā)明還提供了一個(gè)編碼諾卡噻唑菌素噻唑環(huán)形成的NADH脫氫酶的核苷酸序 列,由序列4中的氨基酸序列組成,命名為n0C22,其基因的核苷酸序列位于序列1中第 29544-30767 堿基處。本發(fā)明還提供了一個(gè)編碼諾卡噻唑菌素大環(huán)骨架形成的脫水酶的核苷酸序 列,由序列5中的氨基酸序列組成,命名為n0c21,其基因的核苷酸序列位于序列1中第 26965-29523 堿基處。本發(fā)明還提供了一個(gè)編碼諾卡噻唑菌素大環(huán)骨架形成的脫水酶的核苷酸序 列,由序列6中的氨基酸序列組成,命名為nOc20,其基因的核苷酸序列位于序列1中第 25968-26960 堿基處。本發(fā)明還提供了一個(gè)編碼自由基SAM硫胺合成酶的核苷酸序列,由序列7中的氨 基酸序列組成,命名為noc27,其基因的核苷酸序列位于序列1中第36848-37948堿基處。本發(fā)明還提供了一個(gè)編碼?;?CoA合成酶的核苷酸序列,由序列8中的氨基酸序 列組成,命名為noc25,其基因的核苷酸序列位于序列1中第34680-35912堿基處。本發(fā)明還提供了一個(gè)編碼?;D(zhuǎn)移酶的核苷酸序列,由序列9中的氨基酸序列組 成,命名為noc26,其基因的核苷酸序列位于序列1中第35933-36820堿基處。本發(fā)明還提供了一個(gè)編碼SAM依賴的氧化酶或甲基轉(zhuǎn)移酶的核苷酸序列,由序列 10中的氨基酸序列組成,命名為n0c29,其基因的核苷酸序列位于序列1中第38714-39976 堿基處。本發(fā)明還提供了一個(gè)編碼N-雙甲基轉(zhuǎn)移酶的核苷酸序列,由序列11中的氨基酸 序列組成,命名為noclO,其基因的核苷酸序列位于序列1中第14990-15703堿基處。本發(fā)明還提供了一個(gè)編碼NDP-己糖3位C上的甲基轉(zhuǎn)移酶的核苷酸序列,由序列 12中的氨基酸序列組成,命名為nocll,其基因的核苷酸序列位于序列1中第15728-16972 堿基處。本發(fā)明還提供了一個(gè)編碼NDP-己糖-3-酮還原酶的核苷酸序列,由序列13中的 氨基酸序列組成,命名為nocl2,其基因的核苷酸序列位于序列1中第16984-17970堿基處。本發(fā)明還提供了一個(gè)編碼dTDP-4-酮-6-脫氧葡萄糖2,3_脫水酶的核苷酸序 列,由序列14中的氨基酸序列組成,命名為n0cl3,其基因的核苷酸序列位于序列1中第 17988-19418 堿基處。本發(fā)明還提供了一個(gè)編碼NDP-6-脫氧-D-葡萄糖4位C上的氨基轉(zhuǎn)移酶的核苷 酸序列,由序列15中的氨基酸序列組成,命名為nocl4,其基因的核苷酸序列位于序列1中 第19424-20560堿基處。本發(fā)明還提供了一個(gè)編碼糖基轉(zhuǎn)移酶的氨基轉(zhuǎn)移酶的核苷酸序列,由序列16中 的氨基酸序列組成,命名為noc6,其基因的核苷酸序列位于序列1中第11505-12683堿基 處。本發(fā)明還提供了一個(gè)編碼細(xì)胞色素P450氧化還原酶的核苷酸序列,由序列17中 的氨基酸序列組成,命名為noc7,其基因的核苷酸序列位于序列1中第12704-13912堿基
7處。本發(fā)明還提供了一個(gè)編碼細(xì)胞色素P450氧化還原酶的核苷酸序列,由序列18中 的氨基酸序列組成,命名為nocl5,其基因的核苷酸序列位于序列1中第20591-21703堿基 處。本發(fā)明還提供了一個(gè)編碼細(xì)胞色素P450氧化還原酶的核苷酸序列,由序列19中 的氨基酸序列組成,命名為nocl6,其基因的核苷酸序列位于序列1中第21696-22934堿基 處。本發(fā)明還提供了一個(gè)編碼細(xì)胞色素P450氧化還原酶的核苷酸序列,由序列20中 的氨基酸序列組成,命名為nocl8,其基因的核苷酸序列位于序列1中第23507-24649堿基 處。本發(fā)明還提供了一個(gè)編碼細(xì)胞色素P450氧化還原酶的核苷酸序列,由序列21中 的氨基酸序列組成,命名為nocl9,其基因的核苷酸序列位于序列1中第24646-25947堿基 處。本發(fā)明還提供了一個(gè)編碼甲基轉(zhuǎn)移酶的核苷酸序列,由序列22中的氨基酸序列 組成,命名為noc8,其基因的核苷酸序列位于序列1中第13909-14532堿基處。本發(fā)明還提供了一個(gè)編碼甲基轉(zhuǎn)移酶的核苷酸序列,由序列23中的氨基酸序列 組成,命名為noc36,其基因的核苷酸序列位于序列1中第43983-44768堿基處。本發(fā)明還提供了一個(gè)編碼博來(lái)霉素抗性蛋白的核苷酸序列,由序列24中的氨基 酸序列組成,命名為nocl7,其基因的核苷酸序列位于序列1中第22956-23480堿基處。本發(fā)明還提供了一個(gè)編碼磷酸鹽ABC transporter的核苷酸序列,由序列25中的 氨基酸序列組成,命名為noc37,其基因的核苷酸序列位于序列1中第44914-45423堿基處。本發(fā)明還提供了一個(gè)編碼SARP家族的轉(zhuǎn)錄調(diào)節(jié)蛋白的核苷酸序列,由序列26中 的氨基酸序列組成,命名為noc5,其基因的核苷酸序列位于序列1中第10404-11387堿基 處。本發(fā)明還提供了一個(gè)編碼熱休克蛋白的核苷酸序列,由序列27中的氨基酸序列 組成,命名為noc33,其基因的核苷酸序列位于序列1中第42031-42456堿基處。本發(fā)明還提供了一個(gè)編碼hsplS轉(zhuǎn)錄調(diào)節(jié)因子的核苷酸序列,由序列28中的氨基 酸序列組成,命名為noc34,其基因的核苷酸序列位于序列1中第42565-43173堿基處。本發(fā)明還提供了一個(gè)編碼RNA聚合酶ECF-亞族的信號(hào)因子的核苷酸序列,由序列 29中的氨基酸序列組成,命名為n0C3,其基因的核苷酸序列位于序列1中第8731-9867堿 基處。本發(fā)明還提供了一個(gè)編碼ATP酶的信號(hào)因子的核苷酸序列,由序列30中的氨基酸 序列組成,命名為noc4,其基因的核苷酸序列位于序列1中第9968-10387堿基處。本發(fā)明還提供了一個(gè)編碼DGPFAETKE家族蛋白的核苷酸序列,由序列31中的氨基 酸序列組成,命名為noc2,其基因的核苷酸序列位于序列1中第8282-8725堿基處。本發(fā)明還提供了一個(gè)編碼50S核糖體蛋白L18的核苷酸序列,由序列32中的氨基 酸序列組成,命名為nocl,其基因的核苷酸序列位于序列1中第7731-8084堿基處。本發(fā)明還提供了一個(gè)編碼未知功能蛋白的核苷酸序列,由序列33中的氨基酸序 列組成,命名為noc9,其基因的核苷酸序列位于序列1中第14529-14984堿基處。
本發(fā)明還提供了一個(gè)編碼未知功能蛋白的核苷酸序列,由序列34中的氨基酸序 列組成,命名為noc24,其基因的核苷酸序列位于序列1中第32902-34683堿基處。本發(fā)明還提供了一個(gè)編碼未知功能蛋白的核苷酸序列,由序列35中的氨基酸序 列組成,命名為noc30,其基因的核苷酸序列位于序列1中第40174-40914堿基處。本發(fā)明還提供了一個(gè)編碼未知功能蛋白的核苷酸序列,由序列36中的氨基酸序 列組成,命名為noc31,其基因的核苷酸序列位于序列1中第41001-41408堿基處。本發(fā)明還提供了一個(gè)編碼未知功能蛋白的核苷酸序列,由序列37中的氨基酸序 列組成,命名為noc32,其基因的核苷酸序列位于序列1中第41492-41953堿基處。本發(fā)明還提供了一個(gè)編碼未知功能蛋白的核苷酸序列,由序列38中的氨基酸序 列組成,命名為noc35,其基因的核苷酸序列位于序列1中第43228-43758堿基處。在另一優(yōu)選例中,所述基因簇包括由n0C6至nOC30構(gòu)成的結(jié)構(gòu)基因;或包括由 nocl至n0C37構(gòu)成的結(jié)構(gòu)基因、抗性基因和調(diào)控基因。在另一優(yōu)選例中,所述的基因簇的核苷酸序列如SEQ ID NO :1中第7731-45423 位、SEQ ID NO 1 中第 11505-40916 位、或 SEQ ID NO 1 中第 1-44560 位所示。本發(fā)明還提供了本發(fā)明上述的諾卡噻唑菌素的生物合成基因簇的編碼蛋白。較佳 地,所述的編碼蛋白的氨基酸序列如SEQ ID N0:2-38所示。本發(fā)明還提供了含有上述的諾卡噻唑菌素的生物合成基因簇的表達(dá)載體。較佳 地,所述的表達(dá)載體是粘粒。本發(fā)明還提供了重組的含有上述的表達(dá)載體或染色體上整合有上述的諾卡噻唑 菌素的生物合成基因簇的宿主細(xì)胞。較佳地,所述的宿主細(xì)胞是鏈霉菌。本發(fā)明還提供了一種產(chǎn)生諾卡噻唑菌素的方法,包括步驟培養(yǎng)上述的宿主細(xì)胞 從而表達(dá)諾卡噻唑菌素,以及從培養(yǎng)液中分離諾卡噻唑菌素。本發(fā)明還提供了上述的諾卡噻唑菌素的生物合成基因簇或其部分基因的用途,它 們被用于在S.actuosus ATCC 25421相關(guān)基因缺失的突變株中進(jìn)行異源互補(bǔ),從而恢復(fù)產(chǎn) 生諾肽菌素;或者將后修飾基因在S.actuosus ATCC 25421中進(jìn)行異源表達(dá)產(chǎn)生,從而產(chǎn) 生諾肽菌素的結(jié)構(gòu)類似物。序列1的互補(bǔ)序列可根據(jù)DNA堿基互補(bǔ)原則得到。序列1的核苷酸序列或部分核 苷酸序列可以通過(guò)聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或用合適的限制性內(nèi)切酶消化相應(yīng)的DNA片段或 利用其他合適的技術(shù)得到。本發(fā)明還提供了獲得至少包含部分序列1中DNA片段的重組質(zhì) 粒的途徑。本發(fā)明還提供了諾卡噻唑菌素生物合成的微生物體途徑,至少其中之一的基因包 含有序列1中的核苷酸序列。本發(fā)明所提供的核苷酸序列或部分核苷酸序列,可利用聚合酶鏈?zhǔn)椒磻?yīng)(PCR)的 方法或包含本發(fā)明序列的DNA作為探針以Southern雜交等方法從其他生物體中得到與諾 卡噻唑菌素生物合成基因相似的基因。包含本發(fā)明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于從諾 卡氏菌Nocardia sp. ffff-12651基因組文庫(kù)中定位更多的文庫(kù)質(zhì)粒。這些文庫(kù)質(zhì)粒至少包 含本發(fā)明中的部分序列,也包含有Nocardia sp. ffff-12651基因組中以前鄰近區(qū)域未克隆的 DNA。
本發(fā)明所提供的核苷酸序列或至少部分核苷酸序列可以被修飾或突變。這些 途徑包括插入、置換或缺失,聚合酶鏈?zhǔn)椒磻?yīng),錯(cuò)誤介導(dǎo)聚合酶鏈?zhǔn)椒磻?yīng),位點(diǎn)特異性 突變,不同序列的重新連接,序列的不同部分或與其他來(lái)源的同源序列進(jìn)行定向進(jìn)化 (DNAshuffling),或通過(guò)紫外線或化學(xué)試劑誘變等。包含本發(fā)明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通過(guò)合 適的表達(dá)體系在外源宿主中表達(dá)以得到相應(yīng)的酶或其他更高的生物活性或產(chǎn)量的代謝產(chǎn) 物。這些外源宿主包括鏈霉菌、假單孢菌、大腸桿菌、芽孢桿菌、酵母、植物和動(dòng)物等。本發(fā)明所提供的氨基酸序列可以用來(lái)分離所需要的蛋白并可用于抗體的制備。包含本發(fā)明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些 氨基酸之后仍有生物活性甚至有新的生物學(xué)活性,或者提高了產(chǎn)量或優(yōu)化了蛋白動(dòng)力學(xué)特 征或其他致力于得到的性質(zhì)。包含本發(fā)明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在 異源宿主中表達(dá)并通過(guò)DNA芯片技術(shù)了解它們?cè)谒拗鞔x鏈中的功能。包含本發(fā)明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通 過(guò)遺傳重組來(lái)構(gòu)建重組質(zhì)粒以獲得其生物合成途徑,也可以通過(guò)插入、置換、缺失或失活進(jìn) 而獲得新的生物合成途徑。包含本發(fā)明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因或DNA片段 可以通過(guò)中斷諾卡噻唑菌素生物合成的一個(gè)或幾個(gè)步驟而得到新的諾卡噻唑菌素結(jié)構(gòu)類 似物。包含DNA片段或基因可以用來(lái)提高諾卡噻唑菌素或其衍生物的產(chǎn)量,本發(fā)明提供了 在基因工程微生物中提高產(chǎn)量的途徑。本發(fā)明所提供的核苷酸序列編碼核糖體機(jī)制諾卡噻唑菌素生物合成的前體肽 可以通過(guò)插入、置換或缺失,聚合酶鏈?zhǔn)椒磻?yīng),錯(cuò)誤介導(dǎo)聚合酶鏈?zhǔn)椒磻?yīng),位點(diǎn)特異性 突變,不同序列的重新連接,序列的不同部分或與其他來(lái)源的同源序列進(jìn)行定向進(jìn)化 (DNAshuffling),紫外線或化學(xué)試劑誘變等方法來(lái)產(chǎn)生新的硫肽類抗生素或其他多肽類代 謝產(chǎn)物。包含本發(fā)明所提供的核苷酸序列編碼的蛋白可以催化合成噻唑環(huán)、羥化吡啶環(huán)、 吲哚酸等結(jié)構(gòu)單元,并可以通過(guò)與其他天然產(chǎn)物的生物合成途徑或部分生物合成途徑重 組,來(lái)獲得包含有著這些結(jié)構(gòu)單元并且具有更好生物活性的代謝產(chǎn)物。包含本發(fā)明所提供的核苷酸序列編碼的蛋白可以催化合成諾卡噻唑菌素的大環(huán) 骨架和其結(jié)構(gòu)類似物。包含本發(fā)明所提供的核苷酸序列編碼的蛋白可以催化合成4-N,N-二甲基_2,4, 6-脫氧己糖,并可以通過(guò)與其他天然產(chǎn)物的生物合成途徑或部分生物合成途徑重組,來(lái)獲 得新的糖基化產(chǎn)物。本發(fā)明所提供的諾卡噻唑菌素的后修飾基因提供了通過(guò)遺傳修飾得到類似物的 途徑,所包含的氧化還原反應(yīng)也可有其他應(yīng)用??傊?,本發(fā)明所提供的包含諾卡噻唑菌素生物合成相關(guān)的所有基因和蛋白信息可 以幫助人們理解硫肽類抗生素的生物合成機(jī)制,為進(jìn)一步遺傳改造提供了材料和知識(shí)。本 發(fā)明所提供的基因及其蛋白質(zhì)也可以用來(lái)尋找和發(fā)現(xiàn)可用于醫(yī)藥、工業(yè)或農(nóng)業(yè)的化合物或 基因、蛋白。
10


圖1 諾卡噻唑菌素的化學(xué)結(jié)構(gòu)。圖2 諾卡噻唑菌素生物合成基因簇的基因結(jié)構(gòu)和限制性內(nèi)切酶譜。(A)6個(gè)交疊 的黏粒代表了諾卡氏菌Nocardia sp. ffff-12651基因組45kb的DNA區(qū)域,S代表限制性內(nèi) 切酶Smal,實(shí)體表示已被DNA測(cè)序的部分,黑色粗豎線表示標(biāo)記的探針部分;(B)諾卡噻唑 菌素生物合成基因簇的基因組成。圖3 提出的諾卡噻唑菌素大環(huán)骨架的生物合成途徑。圖4 提出的諾卡噻唑菌素吲哚酸側(cè)鏈的生物合成途徑。圖5 提出的諾卡噻唑菌素4-N,N- 二甲基_2,4,6_脫氧己糖的生物合成途徑。圖6 發(fā)酵產(chǎn)物Nocathiacin I的高效液相色譜-質(zhì)譜(HPLC-MS)分析。(A)高效液相色譜;⑶質(zhì)譜圖7 與諾卡噻唑菌素大環(huán)骨架生物合成相關(guān)的部分基因?qū)χZ肽菌素基因簇中相 似基因同框缺失突變株的異源互補(bǔ)。(A)諾肽菌素產(chǎn)生菌Str印tomyces actuosus ATCC25421野生型發(fā)酵產(chǎn)物的 HPLC-MS 檢測(cè)(B)諾肽菌素nosE同框缺失突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)(C)諾卡噻唑菌素n0c21異源回補(bǔ)突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)(D)諾肽菌素nosD同框缺失突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)(E)諾卡噻唑菌素nOc20異源回補(bǔ)突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)圖8 與諾卡噻唑菌素吲哚酸側(cè)鏈生物合成相關(guān)的部分基因?qū)χZ肽菌素基因簇中 相似基因同框缺失突變株的異源互補(bǔ)。(A)諾肽菌素產(chǎn)生菌Str印tomyces actuosus ATCC25421野生型發(fā)酵產(chǎn)物的 HPLC-MS 檢測(cè)(B)諾肽菌素nosl同框缺失突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)(C)諾卡噻唑菌素n0c25異源回補(bǔ)突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)(D)諾肽菌素nosL同框缺失突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)(E)諾卡噻唑菌素n0c27異源回補(bǔ)突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)圖9 諾卡噻唑菌素生物合成基因簇中部分P450氧化還原后修飾基因?qū)χZ肽菌素 基因簇中相似基因同框缺失突變株的異源互補(bǔ)。(A)諾肽菌素產(chǎn)生菌Str印tomyces actuosus ATCC25421野生型發(fā)酵產(chǎn)物的 HPLC-MS 檢測(cè)(B)諾肽菌素nosC同框缺失突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)(C)諾卡噻唑菌素n0cl9異源回補(bǔ)突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)(D)諾肽菌素nosB同框缺失突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)(E)諾卡噻唑菌素n0C7異源回補(bǔ)突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)圖10 諾卡噻唑菌素生物合成基因簇中部分P450氧化還原后修飾基因在諾肽菌 素產(chǎn)生菌Str印tomyces actuosus ATCC25421中的異源表達(dá)。(A)諾肽菌素產(chǎn)生菌Str印tomyces actuosus ATCC25421野生型發(fā)酵產(chǎn)物的
11HPLC-MS 檢測(cè)(B)諾卡噻唑菌素nocie異源表達(dá)突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)(C)諾卡噻唑菌素noclS異源表達(dá)突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)諾肽菌素結(jié)構(gòu)類似物A的化學(xué)結(jié)構(gòu)諾肽菌素結(jié)構(gòu)類似物B的化學(xué)結(jié)構(gòu)。圖11 諾卡噻唑菌素生物合成基因簇中與絲氨酸邊鏈剪切相關(guān)的基因?qū)χZ肽菌 素基因簇中相似基因同框缺失突變株的異源互補(bǔ)。(A)諾肽菌素產(chǎn)生菌Str印tomyces actuosus ATCC25421野生型發(fā)酵產(chǎn)物的 HPLC-MS 檢測(cè)(B)諾肽菌素nosA同框缺失突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)(C)諾卡噻唑菌素n0C9異源回補(bǔ)突變株發(fā)酵產(chǎn)物的HPLC-MS檢測(cè)符號(hào)說(shuō)明圖INocathiacin I 諾卡噻唑菌素I ;Nocathiacin II:諾卡噻唑菌素II; Nocathiacin III 諾卡噻唑菌素III ;MJ347-81F4-B 諾卡噻唑菌素I的去甲基化產(chǎn)物。圖 2 (A) B3 黏粒 pDY2-61-B3, D2 黏粒 pDY2_61_D2,C2 黏粒 pDY2_61_C2,A1 黏粒 pDY2-61-Ai; C4 黏粒 pDY2-61-C4 ;字母 S 代表 SmaI 限制性酶切位點(diǎn);⑶ suger 4-N,N- 二 甲基-2,4,6-脫氧己糖生物合成基因cyclop印tide諾卡噻唑菌素大環(huán)骨架生物合成基因 oxidation諾卡噻唑菌素P450氧化還原后修飾基因Indole acid諾卡噻唑菌素吲哚酸側(cè)鏈 生物合成基因resistance抗性基因regulation調(diào)節(jié)基因Unknown未知基因。圖3Noc20、21、22、23分別對(duì)應(yīng)本說(shuō)明書中描述的諾卡噻唑菌素基因簇中的基因 nOC20、21、22、23所編碼的蛋白,LP表示諾卡噻唑菌素的信號(hào)肽。圖4Noc25、26、27、29分別對(duì)應(yīng)本說(shuō)明書中描述的諾卡噻唑菌素基因簇中的基因 noc25、26、27、29所編碼的蛋白,Ado ·表示自由基。圖5Noc6、10、12、13、14分別對(duì)應(yīng)本說(shuō)明書中描述的諾卡噻唑菌素基因簇中的基 因noc6、10、12、13、14所編碼的蛋白。圖 6(A) 15min 為 Nocathiacin I 的保留時(shí)間(B) 1437 為 Nocathiacin I 的分子 離子峰。
具體實(shí)施例方式以下結(jié)合附圖對(duì)本發(fā)明進(jìn)一步詳細(xì)說(shuō)明。1.諾卡噻唑菌素生物合成基因簇中N,N-二甲基酶基因片段的克隆盡管有關(guān)硫肽類抗生素生物合成方面的研究早在上世紀(jì)70年代末就已開始,但 是迄今為止關(guān)于它們?cè)谖⑸矬w內(nèi)代謝途徑的研究都未能有效突破。早期的研究者主要 完成了硫鏈絲菌肽(Thiostr印ton)、諾肽菌素(Nosih印tide)、硫肽霉素I (sulfomycin I )、GE2270A、A10255G/B/E、諾卡噻唑菌素(Nocathiacins)等的氨基酸前體標(biāo)記實(shí)驗(yàn) (C13、C14、H2、H3、N15等),并由此推測(cè)了它們部分主要結(jié)構(gòu)可能的生物合成途徑如認(rèn)為 其中的噻唑或噻唑啉環(huán)來(lái)源于半胱氨酸和絲氨酸;而吲哚酸或喹哪酸結(jié)構(gòu)則是由色氨酸 經(jīng)過(guò)多步轉(zhuǎn)化得到的;還認(rèn)為它們核心結(jié)構(gòu)的氮雜六元環(huán)是通過(guò)[4+2]環(huán)加成反應(yīng)形成 的[J. Am. Chem. Soc. 1979,101,5069 ;1988,110,5800 ; 1993,115,7557 ; 1993,115,7992 ;1995,117,7606 ;1996,118,11363 ;Biorg.Med. Chem. 1996,4,1135 J. Antibiot. 1992,45, 1499 ;2001,54,1066 J. Chem.Soc.Chem. Commun. 1993,1612 ;Acc.Chem. Res. 1993,26,116 ; Tetrahedron Letters. 2008,49,6265-6268.]。標(biāo)記實(shí)驗(yàn)同樣也顯示這類抗生素大多具有相似的氨基酸前體,這在一定意義上說(shuō) 明它們?cè)谖⑸矬w內(nèi)可能是采用相似的生物合成途徑得到的。而微生物體內(nèi)典型的聚肽類 天然產(chǎn)物的生物合成途徑大體上可以分為兩類核糖體途徑和非核糖體途徑。Floss小組 曾根據(jù)氯霉素抑制實(shí)驗(yàn)的結(jié)果推測(cè)這類抗生素可能是采用非核糖體途徑合成的。隨后研究 者們嘗試了大量的方法來(lái)克隆這類抗生素的生物合成基因簇,如突變株互補(bǔ)、反向遺傳學(xué)、 抗性基因?yàn)樘结槨⒕幋a核糖體途徑前體肽的基因片段為探針、非核糖體途徑生物合成基因 的保守序列為引物、轉(zhuǎn)座子隨機(jī)中斷等方法,但是都沒(méi)有成功。這就提示我們需要尋找一條 全新的途徑來(lái)克隆這類抗生素的生物合成基因簇。根據(jù)糖肽類抗生素的糖基和母體骨架的生物合成基因大都連鎖分布在染色體的 同一區(qū)域上這一特點(diǎn),本發(fā)明人決定從克隆Nocathiacin I中脫氧氨基糖的生物合成基 因出發(fā),來(lái)克隆整個(gè)分子的生物合成基因簇。我們首先根據(jù)大量微生物來(lái)源的天然產(chǎn)物脫 氧糖基的生物合成途徑[Antimicrobial Agents And Chemotherapy, 1999,43,1565-1573 ; Chemistry& Biology,2004,11,959—969 ;Molecular Microbiology,2000,37,752-762.] 推測(cè)了 Nocathiacin I中4_N,N-二甲基-2,4,6_脫氧己糖可能的生物合成途徑,并選取 可能存在于該途徑催化后期的N,N- 二甲基轉(zhuǎn)移酶的保守序列,設(shè)計(jì)了簡(jiǎn)并性的PCR引物 Dimeth-Forl 5 ‘ -GCTGAC GTCGCCTGCGGSAC(C/G)GG(A/T/C/G)(G/A/T)(A/T/C/G)(A/T/C/ G)CA-3和 Dimeth-Rev2 5' -CGCG AACGT(G/C)TC(G/C)GG(A/G)AA CCACCA(A/T/G/C)GG(A/ T/G/C)TC-3',然后以Nocardia sp.ffff-12651的總DNA為模板進(jìn)行PCR擴(kuò)增,得到約0. 3kb 的PCR產(chǎn)物,克隆入pSP72載體,經(jīng)測(cè)序分析發(fā)現(xiàn)與已知的N,N- 二甲基轉(zhuǎn)移酶基因具有很 高的同源性。2.諾卡噻唑菌素生物合成基因簇的克隆,序列分析及功能分析將上述克隆到的N,N-二甲基酶基因片段用地高辛標(biāo)記為探針,對(duì)構(gòu)建好的 Nocardiasp. WW-12651的基因組文庫(kù)進(jìn)行篩選,共得到6個(gè)插入片段互相重疊的黏粒,分別 為=CDYAAeHT-Ap B3> C2, C4, D2, D4,涵蓋了染色體約 50kb 的 DNA 區(qū)域(圖 2A 和 2B)(制 法見實(shí)施例2)。選取限制性酶切物理圖譜中最左端和最右端的黏粒cDY446-2-47-B3、C2進(jìn) 行亞克隆測(cè)序,通過(guò)生物信息分析發(fā)現(xiàn),測(cè)定的45. 560kb的DNA區(qū)域,GC含量為73. 3%,共 包含了 44個(gè)開放式讀碼框(open reading frame,0RF),其中與諾卡噻唑菌素生物合成相 關(guān)的有37個(gè)。各個(gè)基因的功能分析見表1。表1諾卡噻唑菌素生物合成基因簇中各基因及編碼蛋白的功能分析
權(quán)利要求
一種具有良好抗菌活性的抗生素 諾卡噻唑菌素的生物合成基因簇,其特征在于,包括編碼諾卡噻唑菌素生物合成所涉及的37個(gè)基因,具體為1)負(fù)責(zé)諾卡噻唑菌素I大環(huán)骨架生物合成的基因,即noc28,noc20,noc21,noc22,noc23,noc9,noc24,noc30共8個(gè)基因noc28位于基因簇核苷酸序列第38434 38581個(gè)堿基處,長(zhǎng)度為150個(gè)堿基對(duì),編碼諾卡噻唑菌素的前體肽,長(zhǎng)度為49個(gè)氨基酸;noc23位于基因簇核苷酸序列第30980 32875個(gè)堿基處,長(zhǎng)度為1896個(gè)堿基對(duì),編碼雜環(huán)化蛋白,長(zhǎng)度為631個(gè)氨基酸;noc22位于基因簇核苷酸序列第29544 30983個(gè)堿基處,長(zhǎng)度為1440個(gè)堿基對(duì),編碼NADH脫氫酶,長(zhǎng)度為479個(gè)氨基酸;noc21位于基因簇核苷酸序列第26965 29523個(gè)堿基處,長(zhǎng)度為2559個(gè)堿基對(duì),編碼脫水酶,長(zhǎng)度為852個(gè)氨基酸;noc20位于基因簇核苷酸序列第25968 26960個(gè)堿基處,長(zhǎng)度為993個(gè)堿基對(duì),編碼脫水酶,長(zhǎng)度為330個(gè)氨基酸;noc9位于基因簇核苷酸序列第14529 14584個(gè)堿基處,長(zhǎng)度為456個(gè)堿基對(duì),編碼未知功能蛋白,長(zhǎng)度為151個(gè)氨基酸;noc24位于基因簇核苷酸序列第32902 34683個(gè)堿基處,長(zhǎng)度為1782個(gè)堿基對(duì),編碼未知功能蛋白,長(zhǎng)度為593個(gè)氨基酸;noc30位于基因簇核苷酸序列第40176 40916個(gè)堿基處,長(zhǎng)度為741個(gè)堿基對(duì),編碼未知功能蛋白,長(zhǎng)度為246個(gè)氨基酸;2)負(fù)責(zé)諾卡噻唑菌素I吲哚酸側(cè)鏈生物合成的基因,即noc25,noc26,noc27,noc29,共4個(gè)基因noc27位于基因簇核苷酸序列第36848 37948個(gè)堿基處,長(zhǎng)度為1101個(gè)堿基對(duì),編碼自由基SAM硫胺合成酶,長(zhǎng)度為366個(gè)氨基酸;noc25位于基因簇核苷酸序列第34680 35912個(gè)堿基處,長(zhǎng)度為1233個(gè)堿基對(duì),編碼酰基 CoA合成酶,長(zhǎng)度為410個(gè)氨基酸;noc26位于基因簇核苷酸序列第35933 36820個(gè)堿基處,長(zhǎng)度為888個(gè)堿基對(duì),編碼酰基轉(zhuǎn)移酶,長(zhǎng)度為295個(gè)氨基酸;noc29位于基因簇核苷酸序列第38714 39976個(gè)堿基處,長(zhǎng)度為1263個(gè)堿基對(duì),編碼SAM依賴的甲基轉(zhuǎn)移酶,長(zhǎng)度為420個(gè)氨基酸;3)負(fù)責(zé)諾卡噻唑菌素I脫氧糖基生物合成的基因,即noc6,noc10,noc11,noc12,noc13,noc14,共6個(gè)基因noc10位于基因簇核苷酸序列第14990 15703個(gè)堿基處,長(zhǎng)度為714個(gè)堿基對(duì),編碼N 雙甲基轉(zhuǎn)移酶,長(zhǎng)度為237個(gè)氨基酸;noc11位于基因簇核苷酸序列第15728 16972個(gè)堿基處,長(zhǎng)度為1245個(gè)堿基對(duì),編碼NDP 己糖3位C上的甲基轉(zhuǎn)移酶,長(zhǎng)度為414個(gè)氨基酸;noc12位于基因簇核苷酸序列第16984 17970個(gè)堿基處,長(zhǎng)度為987個(gè)堿基對(duì),編碼NDP 己糖 3 酮還原酶,長(zhǎng)度為328個(gè)氨基酸;noc13位于基因簇核苷酸序列第17988 19418個(gè)堿基處,長(zhǎng)度為1431個(gè)堿基對(duì),編碼dTDP 4 酮 6 脫氧葡萄糖2,3 脫水酶,長(zhǎng)度為476個(gè)氨基酸;noc14位于基因簇核苷酸序列第19424 20560個(gè)堿基處,長(zhǎng)度為1137個(gè)堿基對(duì),編碼NDP 6 脫氧 D 葡萄糖4位C上的氨基轉(zhuǎn)移酶,長(zhǎng)度為378個(gè)氨基酸;noc6位于基因簇核苷酸序列第11505 12683個(gè)堿基處,長(zhǎng)度為1179個(gè)堿基對(duì),編碼糖基轉(zhuǎn)移酶,長(zhǎng)度為392個(gè)氨基酸;4)細(xì)胞色素P450氧化還原酶基因,即noc7,noc15,noc16,noc18,noc19,共5個(gè)基因noc7位于基因簇核苷酸序列第12704 13912個(gè)堿基處,長(zhǎng)度為1209個(gè)堿基對(duì),編碼細(xì)胞色素P450氧化還原酶,長(zhǎng)度為402個(gè)氨基酸;noc15位于基因簇核苷酸序列第20591 21703個(gè)堿基處,長(zhǎng)度為1113個(gè)堿基對(duì),編碼細(xì)胞色素P450氧化還原酶,長(zhǎng)度為370個(gè)氨基酸;noc16位于基因簇核苷酸序列第21696 22934個(gè)堿基處,長(zhǎng)度為1239個(gè)堿基對(duì),編碼細(xì)胞色素P450氧化還原酶,長(zhǎng)度為412個(gè)氨基酸;noc18位于基因簇核苷酸序列第23507 24649個(gè)堿基處,長(zhǎng)度為1143個(gè)堿基對(duì),編碼細(xì)胞色素P450氧化還原酶,長(zhǎng)度為380個(gè)氨基酸;noc19位于基因簇核苷酸序列第24646 25926個(gè)堿基處,長(zhǎng)度為1281個(gè)堿基對(duì),編碼細(xì)胞色素P450氧化還原酶,長(zhǎng)度為426個(gè)氨基酸;5)甲基轉(zhuǎn)移酶基因,即noc8,noc36,共2個(gè)基因noc8位于基因簇核苷酸序列第13909 14532個(gè)堿基處,長(zhǎng)度為624個(gè)堿基對(duì),編碼甲基轉(zhuǎn)移酶,長(zhǎng)度為207個(gè)氨基酸;noc36位于基因簇核苷酸序列第43983 44768個(gè)堿基處,長(zhǎng)度為786個(gè)堿基對(duì),編碼甲基轉(zhuǎn)移酶,長(zhǎng)度為261個(gè)氨基酸;6)抗性基因,即noc17,noc37,共2個(gè)基因noc17位于基因簇核苷酸序列第22956 23480個(gè)堿基處,長(zhǎng)度為525個(gè)堿基對(duì),編碼博來(lái)霉素抗性蛋白,長(zhǎng)度為174個(gè)氨基酸;noc37位于基因簇核苷酸序列第44914 45423個(gè)堿基處,長(zhǎng)度為510個(gè)堿基對(duì),編碼磷酸鹽ABC transporter,長(zhǎng)度為169個(gè)氨基酸;7)調(diào)節(jié)基因,即noc5,noc33,noc34,共3個(gè)基因noc5位于基因簇核苷酸序列第10404 11387個(gè)堿基處,長(zhǎng)度為984個(gè)堿基對(duì),編碼SARP家族的轉(zhuǎn)錄調(diào)節(jié)蛋白,長(zhǎng)度為327個(gè)氨基酸;noc33位于基因簇核苷酸序列第42031 42456個(gè)堿基處,長(zhǎng)度為426個(gè)堿基對(duì),編碼熱休克蛋白,長(zhǎng)度為141個(gè)氨基酸;noc34位于基因簇核苷酸序列第42565 43173個(gè)堿基處,長(zhǎng)度為609個(gè)堿基對(duì),編碼hsp18轉(zhuǎn)錄調(diào)節(jié)因子,長(zhǎng)度為202個(gè)氨基酸;8)負(fù)責(zé)轉(zhuǎn)錄翻譯的基因,即noc1,noc2,noc3,noc4共4個(gè)基因noc1位于基因簇核苷酸序列第7731 8084個(gè)堿基處,長(zhǎng)度為354個(gè)堿基對(duì),編碼50S核糖體蛋白L18,長(zhǎng)度為117個(gè)氨基酸;noc2位于基因簇核苷酸序列第8282 8785個(gè)堿基處,長(zhǎng)度為444個(gè)堿基對(duì),編碼DGPFAETKE家族蛋白,長(zhǎng)度為147個(gè)氨基酸;noc3位于基因簇核苷酸序列第8731 9867個(gè)堿基處,長(zhǎng)度為1137個(gè)堿基對(duì),編碼RNA聚合酶ECF 亞族的信號(hào)因子,長(zhǎng)度為378個(gè)氨基酸;noc4位于基因簇核苷酸序列第9968 10387個(gè)堿基處,長(zhǎng)度為420個(gè)堿基對(duì),編碼ATP酶,長(zhǎng)度為139個(gè)氨基酸;9)未知功能基因,即noc31,noc32,noc35,共3個(gè)基因noc31位于基因簇核苷酸序列第41003 41410個(gè)堿基處,長(zhǎng)度為408個(gè)堿基對(duì),編碼未知功能蛋白,長(zhǎng)度為135個(gè)氨基酸;noc32位于基因簇核苷酸序列第41492 41953個(gè)堿基處,長(zhǎng)度為462個(gè)堿基對(duì),編碼未知功能蛋白,長(zhǎng)度為153個(gè)氨基酸;noc35位于基因簇核苷酸序列第43228 43758個(gè)堿基處,長(zhǎng)度為531個(gè)堿基對(duì),編碼未知功能蛋白,長(zhǎng)度為176個(gè)氨基酸。
2.根據(jù)權(quán)利要求1所述的基因簇,其特征在于,所述基因簇包括由noce至nOc30構(gòu)成 的結(jié)構(gòu)基因;或包括由nocl至n0C37構(gòu)成的結(jié)構(gòu)基因、抗性基因和調(diào)控基因。
3.根據(jù)權(quán)利要求1所述的基因簇,其特征在于,所述的基因簇的核苷酸序列如SEQID NO :1 中第 7731-45423 位、SEQ ID NO :1 中第 11505-40916 位、或SEQ ID NO 1 中第 1-44560 位所示。
4.根據(jù)權(quán)利要求1所述的諾卡噻唑菌素的生物合成基因簇的編碼蛋白。
5.根據(jù)權(quán)利要求4所述的編碼蛋白,其特征在于,所述的編碼蛋白的氨基酸序列如SEQ ID NO 2-38 所示。
6.根據(jù)權(quán)利要求1所述的諾卡噻唑菌素的生物合成基因簇的編碼蛋白用于催化合成 抗生素諾卡噻唑菌素及類似物;用于催化合成噻唑環(huán);用于催化合成羥化吡啶環(huán)肽中心; 用于催化合成吲哚酸結(jié)構(gòu)單元;用于催化合成諾卡噻唑菌素的大環(huán)骨架;和/或用于催化 合成4-N,N- 二甲基-2,4,6-脫氧己糖。
7.一種含有權(quán)利要求1所述的諾卡噻唑菌素的生物合成基因簇的表達(dá)載體。
8.—種重組的含有權(quán)利要求7所述的表達(dá)載體或染色體上整合有權(quán)利要求1所述的諾 卡噻唑菌素的生物合成基因簇的宿主細(xì)胞。
9.一種產(chǎn)生諾卡噻唑菌素的方法,其特征在于,包括步驟培養(yǎng)權(quán)利要求8所述的宿主 細(xì)胞從而表達(dá)諾卡噻唑菌素,以及從培養(yǎng)液中分離諾卡噻唑菌素。
10.根據(jù)權(quán)利要求1所述的諾卡噻唑菌素的生物合成基因簇或其部分基因的用途,其 中,用于在S.actuosus ATCC 25421相關(guān)基因缺失的突變株中進(jìn)行異源互補(bǔ),從而恢復(fù)產(chǎn)生 諾肽菌素;或者將后修飾基因在S.actuosus ATCC 25421中進(jìn)行異源表達(dá)產(chǎn)生,從而產(chǎn)生 諾肽菌素的結(jié)構(gòu)類似物。
全文摘要
本發(fā)明涉及諾卡噻唑菌素的生物合成基因簇及其應(yīng)用,具體地提供了一類由諾卡氏菌產(chǎn)生的具有良好抗菌活性的抗生素-諾卡噻唑菌素(Nocathiacins)的生物合成基因簇的克隆、測(cè)序、分析、功能研究及其應(yīng)用。整個(gè)基因簇共包含37個(gè)基因8個(gè)與大環(huán)骨架生物合成相關(guān)的基因,4個(gè)與吲哚酸側(cè)鏈合成相關(guān)的基因,6個(gè)與糖基合成相關(guān)的基因,5個(gè)P450氧化還原后修飾酶基因,2個(gè)甲基轉(zhuǎn)移酶基因,2個(gè)抗性基因,3個(gè)調(diào)節(jié)基因,3個(gè)未知功能的基因以及4個(gè)與轉(zhuǎn)錄翻譯有關(guān)的基因。通過(guò)對(duì)上述生物合成基因的異源表達(dá)可產(chǎn)生一系列新型硫肽類抗生素。本發(fā)明所提供的基因及其蛋白可以用來(lái)尋找和發(fā)現(xiàn)用于醫(yī)藥、工業(yè)或農(nóng)業(yè)的化合物或基因、蛋白。
文檔編號(hào)C12N15/31GK101962647SQ20101024088
公開日2011年2月2日 申請(qǐng)日期2010年7月23日 優(yōu)先權(quán)日2009年7月24日
發(fā)明者丁瑩, 劉 文, 潘海學(xué), 虞沂 申請(qǐng)人:中國(guó)科學(xué)院上海有機(jī)化學(xué)研究所