亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

棉桃阿舒氏囊霉的酶的制作方法

文檔序號:3552059閱讀:488來源:國知局
專利名稱:棉桃阿舒氏囊霉的酶的制作方法
技術領域
本發(fā)明涉及來自棉桃阿舒氏囊霉(Ashbya gossypii)的新穎多核苷酸;與之雜交的寡核苷酸;包含這些多核苷酸的表達盒和載體;由該多核苷酸轉化的微生物;由這些多核苷酸編碼的多肽;及將該新穎多肽和多核苷酸用作調節(jié)阿舒氏囊霉屬微生物的代謝,且尤其是提高維生素B2的產(chǎn)量的靶點。
背景技術
維生素B2(核黃素,乳黃素)是一種堿敏感和光敏感的維生素,其在溶液中顯示黃綠色熒光。維生素B2的缺乏可以導致外胚層的損害,尤其是白內障、角膜炎、角膜血管化,或導致自主泌尿生殖系統(tǒng)紊亂。維生素B2是FAD和FMN分子的前體,這兩種分子與NAD+和NADP+在生物學上對氫傳遞具有重要意義。維生素B2通過磷酸化(FMN)和隨后的腺苷酸化(FAD)形成這兩種分子。
維生素B2在植物,酵母菌以及多種微生物中由GTP和核酮酸-5-磷酸合成。該反應途徑首先打開GTP的嘧唑環(huán)并消除一個磷酸殘基。保留的磷酸鹽經(jīng)脫氨,還原,和消除形成5-氨基-6-核醇基(ribityl)氨基-2,4-嘧啶酮。該化合物與3,4-二羥基-2-丁酮-4-磷酸反應產(chǎn)生雙環(huán)分子6,7-二甲基-8-核醇基二氧四氫蝶啶。通過歧化反應該化合物轉化成三環(huán)化合物核黃素,該反應轉移了一個4-碳單位。
維生素B2存在于許多蔬菜和肉類中,在谷類產(chǎn)品中的含量較低。成人每日的維生素B2需要量為約1.4到2毫克。核黃素又是輔酶FMN和FAD在人體中的主要分解產(chǎn)物并就此被排出。
維生素B2是人類和動物的重要營養(yǎng)物質。因此研究人員努力使維生素B2可工業(yè)規(guī)模產(chǎn)生,并建議由微生物的途徑合成維生素B2??捎糜谠撃康牡奈⑸锸?,例如,枯草桿菌(Bacillus subtilis),子囊菌阿舒假囊酵母菌(Eremothecium ashbyii),棉桃阿舒氏囊霉及酵母Candida flareri和釀酒酵母(Saccharomyces cerevisiae)。為此使用的營養(yǎng)培養(yǎng)基包含作為碳源的糖蜜或植物油、無機鹽、氨基酸、動物或植物胨和蛋白質及維生素添加劑。在無菌有氧浸沒培養(yǎng)方法中,產(chǎn)率為每升培養(yǎng)液在幾天內生成10克以上維生素B2。所需條件為培養(yǎng)液良好的通風,小心攪動及設定低于約30℃的溫度。去掉生物質、蒸發(fā)并干燥濃縮液得到富含維生素B2的產(chǎn)物。
例如,WO-A-92/01060,EP-A-0 405 370和EP-A-0 531 708中描述了維生素B2的微生物生產(chǎn)。
在Ullmann氏工業(yè)化學百科全書A27卷,521頁及以下等中,可以找到關于維生素B2的重要性,出現(xiàn),生產(chǎn),生物合成和使用的調查。
活體系統(tǒng)獲得并利用實施各種功能需要的自由焓的整個過程稱為代謝。代謝途徑由提供特定產(chǎn)物的一系列酶反應組成。代謝反應途徑常分為兩類。第一類途徑參與降解(分解代謝)而第二類途徑參與生物合成(合成代謝)。在分解代謝途徑中,復雜的代謝物分解成簡單的產(chǎn)物并釋放能量。在這些過程中釋放的自由焓通過合成細胞中通用的高能化合物(ATP、NADPH)的方式儲存。ATP和NADPH是合成代謝途徑中許多生物合成反應的自由焓的主要來源。例如,產(chǎn)生精細化學品(例如核黃素的合成)的許多合成步驟都需要NADPH和ATP。
在分解代謝途徑中,大量不同底物(碳水化合物、脂類和蛋白質)被轉化成同樣的中間產(chǎn)物。相反的過程發(fā)生在生物合成中。相對較少的代謝物是大量不同生物合成產(chǎn)物的起始物質。可以通過有控制地干預或阻斷已經(jīng)合成的精細化學品的降解途徑以額外地增加其產(chǎn)量。
這些天然存在的代謝過程的一些產(chǎn)物或副產(chǎn)物在工業(yè)中有廣泛的用途,例如人類和動物食品工業(yè)、化妝品和藥物工業(yè)。這些被泛泛地稱為“精細化學品”的分子包括有機酸、蛋白原性(proteinogenic)和非蛋白原性的氨基酸、核苷酸和核苷、脂類和脂肪酸、二醇類、碳水化合物、芳香族化合物、維生素和輔因子以及酶。這些物質幾乎都在大容積的發(fā)酵罐里產(chǎn)生,其中所需分子被高濃度地分泌到培養(yǎng)基中。對這一方法尤其有用的生物體是絲狀子囊菌棉桃阿舒氏囊霉。
參與這些代謝途徑的蛋白在量和/或活性上的改變,對所需精細化學品的生產(chǎn)或生產(chǎn)效率可能有直接的影響。例如,可消除與所需精細化學品直接競爭中間產(chǎn)物的反應或優(yōu)化負責產(chǎn)生這種特定的中間產(chǎn)物的代謝途徑。
目前仍無利用代謝基因產(chǎn)生代謝受調控的微生物,優(yōu)選地為阿舒氏囊霉屬,尤其是棉桃阿舒氏囊霉株的描述。
發(fā)明概述本發(fā)明的目的是提供一種可用于影響阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉的代謝過程的新穎靶點。具體目的為特別地優(yōu)化這種微生物的特定代謝途徑。進一步的目的是通過這種微生物提高維生素B2的產(chǎn)量。
我們發(fā)現(xiàn)尤其可以通過提供在棉桃阿舒氏囊霉的維生素B2生產(chǎn)過程中被向上或下調節(jié)的編碼核酸序列實現(xiàn)該目的(基于試驗部分詳細描述的MPSS分析法發(fā)現(xiàn)的結果)a)優(yōu)選被下調的核酸序列,其編碼具有C1-四氫葉酸合成酶的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內部名稱為“Oligo 72”。
在再一優(yōu)選的實施方案中,根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內部名稱為“Oligo 72v”。
本發(fā)明第一方面涉及包含SEQ ID NO1所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO4所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 72”和“Oligo 72v”的插入序列與來自釀酒酵母的MIPS標簽“Ade3”有顯著的同源性。這些插入序列具有SEQ ID NO1或SEQ IDNO4所示的核酸序列。來自SEQ ID NO1或4所示的編碼鏈的氨基酸序列或氨基酸部分序列與釀酒酵母C1-四氫葉酸合成酶具有顯著的序列同源性。
b)優(yōu)選被上調的核酸序列,其編碼具有精氨基琥珀酸合成酶的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內部名稱為“Oligo 81”。
在另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內部名稱為“Oligo 81v”。
本發(fā)明第一方面涉及包含SEQ ID NO6所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO9所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 81”和“Oligo 81v”的插入序列與來自釀酒酵母的MIPS標簽“Arg1”有顯著的同源性,這些插入序列具有SEQ ID NO6或SEQ IDNO9所示的核酸序列。來自SEQ ID NO6的相應互補序列或來自SEQ IDNO9所示的編碼鏈的氨基酸序列或氨基酸部分序列與釀酒酵母精氨基琥珀酸合成酶具有顯著的序列同源性。
c)優(yōu)選被上調的核酸序列,其編碼具有氨基咪唑-琥珀酸甲酰胺核苷酸合成酶(phosphoribosyl aminoimidazole-succinocarboxamide synthase)的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內部名稱為“Oligo 86”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內部名稱為“Oligo 86v”。
本發(fā)明一方面涉及包含SEQ ID NO12所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO14所示的核酸序列或其片段的多核苷酸。該多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 86”和“Oligo 86v”的插入序列與來自釀酒酵母的MIPS標簽“Ade1”有顯著的同源性,這些插入序列具有SEQ ID NO12或SEQ IDNO14所示的核酸序列。來自SEQ ID NO12的相應互補鏈或來自SEQ IDNO14的編碼鏈的氨基酸序列或氨基酸部分序列與釀酒酵母氨基咪唑-琥珀酸甲酰胺核苷酸合成酶具有顯著的序列同源性。
d)優(yōu)選被下調的核酸序列,其編碼具有延胡索酸還原酶的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內部名稱為“Oligo 162”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內部名稱為“Oligo 162v”。
本發(fā)明一方面涉及包含SEQ ID NO16所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO18所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 162”和“Oligo 162v”的插入序列與來自釀酒酵母的MIPS標簽“FRDS1(2)”有顯著的同源性,這些插入序列具有SEQ ID NO16或SEQ ID NO18所示的核酸序列。來自該編碼鏈的氨基酸序列或氨基酸部分序列與釀酒酵母延胡索酸還原酶具有顯著的序列同源性。
e)優(yōu)選被上調的核酸序列,其編碼具有烯醇丙酮酸磷酸羧激酶的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內部名稱為“Oligo 178”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內部名稱為“Oligo 178v”。
本發(fā)明一方面涉及包含SEQ ID NO20所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO22所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 178和“Oligo 178v”的插入序列與來自釀酒酵母的MIPS標簽“PCK1”有顯著的同源性,這些插入序列具有SEQ ID NO20或SEQID NO22所示的核酸序列。來自SEQ ID NO20的相應互補鏈或來自SEQID NO22所示的編碼鏈的氨基酸序列與釀酒酵母烯醇丙酮酸磷酸羧激酶具有顯著的序列同源性。
f)優(yōu)選被上調的核酸序列,其編碼具有尿卟啉原脫羧酶的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內部名稱為“Oligo 64”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內部名稱為“Oligo 64v”。
本發(fā)明一方面涉及包含SEQ ID NO24所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO26所示的核酸序列或其片斷的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 64和“Oligo 64v”的插入序列與來自釀酒酵母的MIPS標簽“Hem12”有顯著的同源性,這些插入序列具有SEQ ID NO24或SEQ IDNO26所示的核酸序列。來自該編碼鏈的氨基酸序列或氨基酸部分序列與釀酒酵母尿卟啉原脫羧酶具有顯著的序列同源性。
g)優(yōu)選被上調的核酸序列,其編碼具有siroheme合成酶的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內部名稱為“Oligo 125”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內部名稱為“Oligo 125v”。
本發(fā)明一方面涉及包含SEQ ID NO28所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO30所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 125”和“Oligo 125v”的插入序列與來自釀酒酵母的MIPS標簽“Met1”有顯著的同源性,這些插入序列具有SEQ ID NO28或SEQID NO30所示的核酸序列。來自SEQ ID NO28的互補序列或來自SEQ IDNO30所示的編碼鏈的氨基酸序列或氨基酸部分序列與釀酒酵母的siroheme合成酶具有顯著的序列同源性。
h)優(yōu)選被上調的核酸序列,其編碼具有尿卟啉原III合成酶的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內部名稱為“Oligo 107”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內部名稱為“Oligo 107v”。
本發(fā)明一方面涉及包含SEQ ID NO32所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO34所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 107”和“Oligo 107v”的插入序列與來自釀酒酵母的MIPS標簽“Hem4”有顯著的同源性,這些插入序列具有SEQ ID NO32或SEQID NO34所示的核酸序列。來自該編碼鏈的氨基酸序列或氨基酸部分序列與釀酒酵母的尿卟啉原III合成酶具有顯著的序列同源性。
i)優(yōu)選被下調的核酸序列,其編碼具有磷酸甘油酸激酶的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內部名稱為“Oligo 136”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內部名稱為“Oligo 136v”。
本發(fā)明一方面涉及包含SEQ ID NO36所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO38所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 136”和“Oligo 136v”的插入序列與來自釀酒酵母的MIPS標簽“Pgk1”有顯著的同源性,這些插入序列具有SEQ ID NO36或SEQID NO38所示的核酸序列。來自兩個序列的編碼鏈的氨基酸序列與釀酒酵母的磷酸甘油酸激酶具有顯著的序列同源性。
k)優(yōu)選被下調的核酸序列,其編碼具有蛋白酶B抑制劑2的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內部名稱為“Oligo 157”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內部名稱為“Oligo 157v”。
本發(fā)明一方面涉及包含SEQ ID NO40所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO42所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 157”和“Oligo 157v”的插入序列與來自釀酒酵母的MIPS標簽“PBI2”有顯著的同源性,這些插入序列具有SEQ ID NO40或SEQID NO42所示的核酸序列。來自SEQ ID NO40的相應互補序列或來自SEQ ID NO42的編碼鏈的氨基酸序列與釀酒酵母蛋白酶B抑制劑2具有顯著的序列同源性。
l)優(yōu)選被上調的核酸序列,其編碼具有半胱氨酸合成酶的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內部名稱為“Oligo 108”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內部名稱為“Oligo 108v”。
本發(fā)明一方面涉及包含SEQ ID NO44所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO47所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 108”和“Oligo 108v”的插入序列與來自釀酒酵母的MIPS標簽“CYSK”有顯著的同源性,這些插入序列具有SEQ ID NO44或SEQID NO47所示的核酸序列。來自SEQ ID NO44的相應互補序列或來自SEQ ID NO47所示的編碼鏈的氨基酸序列或氨基酸部分序列與構巢曲霉(A.nidulans)半胱氨酸合成酶具有顯著的序列同源性。
本發(fā)明再一方面涉及尤其是在嚴格的條件下與以上多核苷酸之一雜交的寡核苷酸。
本發(fā)明還涉及可以與本發(fā)明的寡核苷酸之一雜交并編碼來自阿舒氏囊霉屬微生物的基因產(chǎn)物或該基因產(chǎn)物的功能等價物的多核苷酸。
本發(fā)明進一步涉及由上述多核苷酸編碼的多肽或蛋白質;及其具有如下氨基酸序列的肽片段,該氨基酸序列包含SEQ ID NO2,3,5,7,8,10,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39,41,43,45,46或SEQ IDNO48中顯示的至少10個連續(xù)的氨基酸殘基;以及本發(fā)明的多肽或蛋白質的功能等價物。
在這方面,功能等價物與本發(fā)明中具體公開的產(chǎn)物相比在氨基酸序列上于至少一個,例如1到30或1到20或1到10個序列位置由于添加,插入,替代,缺失或倒位而不同(這可以經(jīng)與其他蛋白質進行序列比對推斷),但功能等價物不喪失最初觀察到的蛋白功能。因此,與天然蛋白相比較功能等價物可能具有基本相同的、較高或較低的活性。
本發(fā)明其它方面涉及用于重組產(chǎn)生本發(fā)明蛋白的表達盒,其包含可操作地與至少一個調節(jié)核酸序列連接的上述核酸序列之一;并涉及包含至少一個這樣的本發(fā)明表達盒的重組載體。
本發(fā)明還提供了由至少一個上述類型的載體轉化的原核或真核宿主。一個優(yōu)選的實施方案提供了原核或真核宿主,在宿主中至少一種編碼上述本發(fā)明多肽的基因的功能性表達受到調節(jié)(例如被抑制或被過量表達);或上述定義的多肽的生物活性被降低或增加。優(yōu)選的宿主選自子囊菌,尤其是阿舒氏囊霉屬,優(yōu)選地為棉桃阿舒氏囊霉株。
上述意義的基因表達調節(jié)包括對表達的抑制(如通過阻斷表達的某一階段(尤其是轉錄或翻譯)抑制表達)以及基因的特異過量表達(例如通過修飾調節(jié)序列或增加編碼序列的拷貝數(shù))。
本發(fā)明另一方面涉及本發(fā)明的表達盒、本發(fā)明的載體或本發(fā)明的宿主在維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)中的應用。
本發(fā)明另一方面涉及本發(fā)明表達盒、本發(fā)明的載體或本發(fā)明的宿主在上述本發(fā)明多肽的重組生產(chǎn)中的應用。
本發(fā)明還提供了一種檢測或驗證可以用于調節(jié)維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)的效應物靶點的方法。該方法涉及使用能夠與選自上述本發(fā)明多肽或其編碼核酸序列的靶點相互作用(例如非共價結合)的效應物處理能夠以微生物學方式生產(chǎn)維生素B2和/或其前體和/或其衍生物的微生物,驗證該效應物對微生物生產(chǎn)的維生素B2和/或其前體和/或其衍生物的量的影響,以及在適當時分離靶點。在此優(yōu)選地通過與在缺乏該效應物而其他條件相同時微生物的維生素B2產(chǎn)生直接比較來進行驗證。
本發(fā)明另一方面涉及調節(jié)維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)(涉及產(chǎn)生的量和/或速率)的方法,其中用效應物處理能夠以微生物學方式產(chǎn)生維生素B2和/或其前體和/或其衍生物的微生物,該效應物可以與選自上面定義的本發(fā)明多肽或編碼該多肽的核酸序列的靶點相互作用。
應提及的上述效應物的優(yōu)選例子為a)抗體或其抗原結合片段;b)與a)不同并可以與本發(fā)明的多肽相互作用的多肽配體;c)可以調節(jié)本發(fā)明多肽的生物活性的低分子量效應物;d)可以與本發(fā)明的核酸序列相互作用的反義核酸序列。
本發(fā)明還涉及對至少一個以上定義的本發(fā)明靶點具有特異性的上述效應物。
本發(fā)明另一方面涉及微生物生產(chǎn)維生素B2和/或其前體和/或其衍生物的方法,其中在有利產(chǎn)生維生素B2和/或其前體和/或其衍生物的條件下培養(yǎng)以上定義的宿主,所需的產(chǎn)物自培養(yǎng)混合物中分離。在這方面,優(yōu)選地用以上定義的效應物在培養(yǎng)前和/或培養(yǎng)過程中處理該宿主。在此優(yōu)選的宿主選自阿舒氏囊霉屬微生物,尤其是上述轉化的宿主。
本發(fā)明最后的方面涉及利用本發(fā)明的多核苷酸或多肽作為調節(jié)阿舒氏囊霉屬微生物生產(chǎn)維生素B2和/或其前體和/或其衍生物的靶點。


圖1顯示本發(fā)明的氨基酸部分序列(相應于SEQ ID NO1第1位至第144位的鏈)(上面的序列)和來自釀酒酵母的MIPS標簽Ade3的部分序列(下面的序列)的比對。相同的序列位置在兩個序列之間標出。相似的序列位置以“+”標出。
圖2A顯示本發(fā)明的氨基酸部分序列(相應于SEQ ID NO6第862位至第551位的互補鏈)(上面的序列)和來自釀酒酵母的MIPS標簽Arg1的部分序列(下面的序列)的比對。圖2B顯示本發(fā)明的氨基酸部分序列(相應于SEQ ID NO6第912位至第859位的互補鏈)(上面的序列)和來自釀酒酵母的MIPS標簽Arg1的部分序列(下面的序列)的比對。在每一情況下相同的序列位置在兩個序列之間標出。相似的序列位置以“+”標出。
圖3顯示本發(fā)明的氨基酸部分序列(相應于SEQ ID NO12第117位至第1位的互補鏈)(上面的序列)和來自釀酒酵母的MIPS標簽Ade1的部分序列(下面的序列)的比對。相同的序列位置在兩個序列之間標出。相似的序列位置以“+”標出。
圖4顯示本發(fā)明的氨基酸部分序列(相應于SEQ ID NO16第1位至第882位的鏈)(上面的序列)和來自釀酒酵母的MIPS標簽FRDS1(2)的部分序列(下面的序列)的比對。相同的序列位置在兩個序列之間標出。相似的序列位置以“+”標出。
圖5顯示本發(fā)明的氨基酸部分序列(相應于SEQ ID NO20第783位至第1位的互補鏈)(上面的序列)和來自釀酒酵母的MIPS標簽PCK1的部分序列(下面的序列)的比對。相同的序列位置在兩個序列之間標出。相似的序列位置以“+”標出。
圖6顯示本發(fā)明的氨基酸部分序列(中間的序列)和來自釀酒酵母的MIPS標簽Hem12的部分序列(下面的序列)的比對。在這兩個序列上描繪了共有序列。缺乏同源性的位置由黑色長方形標志。
圖7顯示本發(fā)明的氨基酸部分序列(相應于SEQ ID NO28第964位至第529位的互補鏈)(上面的序列)和來自釀酒酵母的MIPS標簽Met1的部分序列(下面的序列)的比對。相同的序列位置在兩個序列之間標出。相似的序列位置以“+”標出。
圖8顯示本發(fā)明的氨基酸部分序列(相應于SEQ ID NO32第107位至第313位的鏈)(上面的序列)和來自釀酒酵母的MIPS標簽“Hem4”的部分序列(下面的序列)的比對。相同的序列位置在兩個序列之間標出。相似的序列位置以“+”標出。
圖9顯示本發(fā)明的氨基酸部分序列(相應于SEQ ID NO36第2位至第91位的鏈)(上面的序列)和來自釀酒酵母的MIPS標簽Pgk1的部分序列(下面的序列)的比對。相同的序列位置在兩個序列之間標出。相似的序列位置以“+”標出。
圖10顯示本發(fā)明的氨基酸部分序列(相應于SEQ ID NO40第713位至第513位的互補鏈)(上面的序列)和來自釀酒酵母的MIPS標簽“PBI2”的部分序列(下面的序列)的比對。相同的序列位置在兩個序列之間標出。相似的序列位置以“+”標出。
圖11A顯示本發(fā)明的氨基酸部分序列(相應于SEQ ID NO44第1596位至第1459位的互補鏈)(上面的序列)和來自構巢曲霉的MIPS標簽CYSK的部分序列(下面的序列)的比對。圖11B顯示本發(fā)明的氨基酸部分序列(相應于SEQ ID NO44第1441位至第971位的互補鏈)(上面的序列)和來自構巢曲霉的MIPS標簽CYSK的部分序列(下面的序列)的比對。相同的序列位置在兩個序列中間標出。相似的序列位置以“+”標出。
發(fā)明詳述本發(fā)明的核酸分子編碼的多肽或蛋白在此被稱為代謝蛋白(例如具有與至少一種所需生物產(chǎn)品或其中間產(chǎn)物的生物合成或副產(chǎn)品的分解相關的活性)或簡稱為“ME蛋白”。這些ME蛋白具有例如調節(jié)活體系統(tǒng)能量平衡的功能。由于已掌握了可用于棉桃阿舒氏囊霉的克隆載體(例如Wright和Philipsen(1991)基因(Gene),109,99-105中公開)以及棉桃阿舒氏囊霉和相關的酵母物種的遺傳操作技術,本發(fā)明的核酸分子可以用于這些生物體,尤其是棉桃阿舒氏囊霉的遺傳操作,從而使其更好并更有效的生產(chǎn)維生素B2和/或其前體和/或其衍生物。產(chǎn)量或生產(chǎn)效率的提高可以由操作本發(fā)明的基因的直接效應或該操作的間接效應導致。
本發(fā)明基于在此被稱為ME核酸和ME蛋白的新穎分子的提供,這些分子參與尤其是棉桃阿舒氏囊霉中的代謝(例如參與代謝酶的合成或調節(jié))。本發(fā)明的ME分子在棉桃阿舒氏囊霉中的活性影響該微生物的維生素B2生產(chǎn)。優(yōu)選對本發(fā)明的ME分子的活性進行調節(jié),以便本發(fā)明的ME蛋白參與的棉桃阿舒氏囊霉的代謝和/或能量途徑在維生素B2的產(chǎn)率、產(chǎn)量和/或生產(chǎn)效率方面受到調節(jié),即直接或間接地調節(jié)棉桃阿舒氏囊霉中維生素B2的產(chǎn)率、產(chǎn)量和/或生產(chǎn)效率。
本發(fā)明提供的核酸序列可以自例如棉桃阿舒氏囊霉株基因組分離,所述菌株可以從美國典型培養(yǎng)物保藏中心(保藏號為ATCC 10895)自由獲得。
維生素B2生產(chǎn)的改進通過改變本發(fā)明的ME蛋白的量和/或活性有多種可能的機制可以直接地影響棉桃阿舒氏囊霉株的維生素B2的產(chǎn)率、產(chǎn)量和/或生產(chǎn)效率。
因此,通過特異地控制代謝,可使所需產(chǎn)物(例如精細化學品)的生產(chǎn)效率較競爭產(chǎn)物相比得以增加或優(yōu)化。也可使細胞對外界影響更具抵抗力,從而增加細胞在發(fā)酵罐中的生存力并由此提高細胞的生產(chǎn)率。
對本發(fā)明的一種或多種ME蛋白的誘變也可以導致ME蛋白的活性改變(增加或降低),間接地影響棉桃阿舒氏囊霉株中所需產(chǎn)物的生產(chǎn)。例如可通過ME蛋白終止直接競爭目的化合物的中間產(chǎn)物的反應,或阻斷負責生成該特定中間產(chǎn)物的代謝途徑并由此優(yōu)化所需目的物質的生產(chǎn)??杀挥绊懙倪^程除所需產(chǎn)物的生物合成外,還包括細胞壁的構建、轉錄、翻譯、細胞生長和分裂所需化合物(例如核苷酸、氨基酸、維生素、脂類等)的生物合成(Lengeler等(1999))。通過改善這些修飾細胞的生長和繁殖,可以增加細胞在大規(guī)模培養(yǎng)中的生存力并提高分裂速率,從而使相對更多的生產(chǎn)細胞可以在發(fā)酵培養(yǎng)基中生存下來。生產(chǎn)的產(chǎn)率、產(chǎn)量或生產(chǎn)效率至少可以因為存在更大量有活力的均能產(chǎn)生所需產(chǎn)物的細胞而得以提高。
多肽本發(fā)明涉及包含上述的氨基酸序列或其特征性部分序列和/或由在此描述的核酸序列編碼的多肽。
本發(fā)明還包括具體公開的新穎多肽的“功能等價物”。
具體公開的多肽的“功能等價物”或類似物為本發(fā)明的目的是指與具體公開的多肽不同但仍具有所需生物活性(例如底物特異性)的多肽。
“功能等價物”在本發(fā)明中尤其指在至少一個上述序列位置中具有與具體公開所不同的氨基酸但仍具有一種上述的生物活性的突變體?!肮δ艿葍r物”因此包括可由一個或多個氨基酸添加,替換,缺失和/或倒位獲得的突變體,只要生成的突變體能具有本發(fā)明的性質譜,所述的修飾可發(fā)生于任何序列位置。功能等價物尤其還可以是這樣的形式,即突變體和未修飾的多肽就反應模式而言在性質上是一致的,即例如對同樣的底物的轉化速率不同。
上述意義的“功能等價物”也可以是所述多肽的前體以及該多肽的功能衍生物和鹽類?!胞}類”一詞指本發(fā)明蛋白分子的羧基的鹽和氨基的酸加成鹽??捎杀绢I域已知方式制備羧基的鹽,包括例如鈉,鈣,銨,鐵和鋅鹽等無機鹽以及與有機堿的鹽,例如與胺類如三乙醇胺、精氨酸、賴氨酸、哌啶等的鹽。本發(fā)明另一方面涉及酸加成鹽,例如與無機酸(例如鹽酸或硫酸)的鹽和與有機酸(例如乙酸和草酸)的鹽。
本發(fā)明多肽的“功能衍生物”也可由已知技術在氨基酸側鏈官能團上或在多肽的N末端或C末端制備。這樣的衍生物包括例如羧基的脂族酯和可通過與氨或與伯胺或仲胺反應得到的羧基的酰胺;通過與?;磻苽涞挠坞x氨基的N-酰基衍生物;或通過與?;磻苽涞挠坞x羥基的O-?;苌?。
“功能等價物”自然地也包括可自其他生物體獲得的多肽和自然出現(xiàn)的變體。例如,可以通過序列比對發(fā)現(xiàn)同源序列區(qū)并根據(jù)本發(fā)明的具體要求確立等價酶。
“功能等價物”還包括具有例如所需的生物學功能的片段,優(yōu)選為本發(fā)明多肽的單結構域或序列基序。
“功能等價物”還可以是具有上述多肽序列之一或其功能等價物和至少一個另外的具有不同功能的異源序列的融合蛋白,該異源序列在所述多肽序列或其功能等價物的N或C末端進行功能性連接(即該融合蛋白的各部分在功能方面產(chǎn)生的相互損害是微不足道的)。這種異源序列的非限制性例子為例如信號肽,酶,免疫球蛋白,表面抗原,受體或受體配體。
根據(jù)本發(fā)明,“功能等價物”包括本文具體公開的蛋白的同系物。通過Pearson和Lipman,Proc.Natl.Acad.Sci.(USA)85(8),1988,2444-2448.的算法計算,這些同系物與具體公開的序列之一具有至少60%,優(yōu)選地至少75%,尤其至少85%,例如90%,95%,或99%的同源性。
在可能存在蛋白糖基化的情況下,本發(fā)明的等價物包括以上定義的蛋白類型的去糖基化或糖基化形式,及可通過改變糖基化模式獲得的修飾形式。
誘變可產(chǎn)生本發(fā)明的蛋白或多肽的同系物,例如通過蛋白點突變或截短實現(xiàn)。這里使用的“同系物”一詞涉及可以對蛋白活性產(chǎn)生激動劑或拮抗劑作用的蛋白的變體形式。
可以通過篩選突變體(例如截短突變體)組合文庫鑒定本發(fā)明蛋白的同系物。通過核酸水平的組合誘變,例如通過合成的寡核苷酸混合物的酶促連接,可以產(chǎn)生一個多樣化的蛋白質變體文庫。大量方法可用于從簡并寡核苷酸序列產(chǎn)生潛在同系物的文庫。簡并基因序列的化學合成可在自動DNA合成儀中進行,然后可將合成的基因與適合的表達載體連接。利用一組簡并基因可在一個混合物中提供編碼一組所需的潛在蛋白質序列的所有序列。本領域技術人員已知合成簡并寡核苷酸的方法(例如Narang,S.A.(1983)Tetrahedron 393;Itakura等(1984)Annu.Rev.Biochem.53323;Itakura等(1984)Science 1981056;Ike等(1983)Nucleic Acids Res.1l477)。
此外,也可以利用蛋白密碼子的片段文庫來生成多樣的蛋白片段群用于篩選和隨后選擇本發(fā)明蛋白的同系物。在一個實施方案中,通過如下方法產(chǎn)生編碼序列片段文庫在每個分子只發(fā)生大約一次切割的條件下,以核酸酶處理編碼序列的雙鏈PCR片段,變性雙鏈DNA,之后使該DNA復性,從而形成可能包含來自不同切割產(chǎn)物的有義/反義對的雙鏈DNA,經(jīng)S1核酸酶處理自新形成的雙鏈體中去除單鏈部分,并將產(chǎn)生的片段文庫連接到表達載體中。可由這種方法得到編碼本發(fā)明蛋白的不同大小的N末端、C末端和內部片段的表達文庫。
現(xiàn)有技術中已知一些技術可以從點突變或截短產(chǎn)生的組合文庫中篩選基因產(chǎn)物和從cDNA文庫中篩選具有選定性質的基因產(chǎn)物。這些技術經(jīng)改造后可用于快速篩選由本發(fā)明同系物的組合誘變產(chǎn)生的基因文庫。最常用的高通量大型基因文庫篩選分析技術包括將該基因文庫克隆入可復制的表達載體中,使用產(chǎn)生的載體文庫轉化合適的細胞,并在檢測所需的活性有助于分離如下載體的條件下表達該組合基因,所述載體編碼的基因的產(chǎn)物是活性檢測中被檢出的產(chǎn)物。遞歸總體誘變(Recursive ensemblemutagenesis,REM)技術增加文庫中功能性突變體的頻率,因而可以與篩選實驗結合用于鑒定同系物。(Arkin和Yourvan(1992)PNAS897811-7815;Delgrave等(1993)蛋白質工程(Protein Engineering)6(3)327-331)。
可重組制備本發(fā)明的多肽(見以下部分)或可通過傳統(tǒng)的生化技術自微生物,特別是阿舒氏囊霉屬微生物中分離自然形式的多肽。(見Cooper,T.G.,Biochemische Arbeitsmethoden,Verlag Walter de Gruyter,柏林,紐約或Scopes,R.,蛋白質純化(Protein Purification),施普林格,紐約,海德堡,柏林)。
核酸序列本發(fā)明還涉及編碼上述多肽之一及其功能等價物的核酸序列(單鏈和雙鏈DNA和RNA序列,例如cDNA和mRNA),該核酸序列可以利用例如人工核苷酸類似物獲得。
本發(fā)明既涉及編碼本發(fā)明的多肽或蛋白質或其生物活性部分的分離的核酸分子,又涉及可用作例如鑒定或擴增本發(fā)明的編碼核酸的雜交探針或引物的核酸片段。
本發(fā)明的核酸分子還可包含來自基因編碼區(qū)的3’和/或5’末端的非翻譯序列。
“分離的”核酸分子自存在于該核酸的天然來源中的其他核酸分子中分離出來,如果該核酸分子由重組技術產(chǎn)生,還可以基本不含其他細胞物質或培養(yǎng)基;如果由化學方法合成,則基本不含化學前體或其他化學物質。
通過分子生物學標準技術以及本發(fā)明提供的序列信息可以分離本發(fā)明的核酸分子。例如,以一種具體公開的完全序列或其一部分為雜交探針,通過標準雜交技術(如Sambrook,J.,F(xiàn)ritsch,E.F.和Maniatis,T.分子克隆實驗室手冊,第二版,Molecular CloningA Laboratory Manual.2ndedition,美國冷泉港實驗室(Cold Spring Harbor Laboratory),美國冷泉港實驗室出版社,冷泉港,紐約,1989的描述),可以從適宜的cDNA文庫中分離cDNA。使用基于一種公開序列而構建的寡核苷酸引物、通過聚合酶鏈反應也可以分離獲得包含該序列或其一部分的核酸分子。由這種方法擴增的核酸分子可以被克隆入合適的載體中并由DNA序列分析法表征。由標準合成法,例如使用自動DNA合成儀也可以產(chǎn)生相應于ME核苷酸序列的本發(fā)明寡核苷酸。
本發(fā)明還包括與具體描述的核苷酸序列互補的核酸分子或其一部分。
本發(fā)明的核苷酸序列使得可產(chǎn)生能用于鑒定和/或克隆其他細胞類型和生物中的同源序列的探針和引物。這樣的探針和引物通常包括如下核苷酸序列區(qū)域,該區(qū)域可以在嚴格條件下與本發(fā)明核酸序列的有義鏈或相應的反義鏈中的至少約12,優(yōu)選地約25,例如約40,50或75個連續(xù)的核苷酸雜交。
本發(fā)明的其它核酸序列衍生自SEQ ID NO1,4,6,9,12,14,16,18,20,24,26,28,30,32,34,36,38,40,42,44或SEQ ID NO47并由于添加,替代、插入或缺失一個或多個核苷酸而與所衍生自的序列不同,但仍編碼具有所需性質譜的多肽。
本發(fā)明還包括含有所謂的沉默突變或經(jīng)過修飾(這是根據(jù)特定來源或宿主生物的密碼子使用與具體公開的序列相比而言的)的核酸序列以及它們的自然存在的變體(例如拼接變體或等位基因變體)。本發(fā)明還涉及可通過保守核苷酸替代(即相關的氨基酸被具有同樣電荷、大小、極性和/或溶解性的氨基酸替代)獲得的序列。
本發(fā)明還涉及由序列多態(tài)性自具體公開的核酸衍生得到的分子。這些遺傳多態(tài)性可由于自然變異存在于群體的個體中。這些自然變異通常導致基因的核苷酸序列出現(xiàn)1%至5%的變化。
本發(fā)明還包括與上述編碼序列雜交或互補的核酸序列。對基因組或cDNA文庫進行篩選可發(fā)現(xiàn)這些多核苷酸,適當時可以利用合適的引物通過PCR擴增這些多核苷酸,并例如使用合適的探針進行分離。另一種可能的方案是利用本發(fā)明的多核苷酸或載體轉化合適的微生物,增殖該微生物并由此擴增這些多核苷酸然后分離之。再一可能方案是通過化學途徑合成本發(fā)明的多核苷酸。
能與多核苷酸“雜交”的性質意味著多核苷酸或寡核苷酸在嚴格的條件下能與幾乎互補的序列結合,而在此條件下,非互補序列之間不發(fā)生非特異的結合。為此這些序列應具有70%至100%,優(yōu)選為90%至100%的互補性?;パa序列能夠特異性地互相結合的性質可用于例如Northern或Southern印跡雜交或在PCR或RT-PCR中用于引物的結合。為此目的通常使用長30個堿基對或以上的寡核苷酸。嚴格的條件指例如在Northern印跡雜交法中,在50-70℃,優(yōu)選地為60-65℃下進行洗滌,如用含有0.1xSSC緩沖液和0.1%SDS(20x SSC3M氯化鈉,0.3M檸檬酸鈉,pH 7.0)的洗滌溶液洗脫非特異雜交的cDNA探針或寡核苷酸。在此情況下,如上述只有高度互補的核酸互相保持結合。本領域技術人員已知這種嚴格條件的建立,并可參見例如Ausubel等的《Current Protocols in MolecularBiology》,John Wiley & Sons,紐約N.Y.(1989),6.3.1-6.3.6.中的描述。
本發(fā)明另一方面涉及反義核酸。其包含與有義編碼核酸互補的核苷酸序列。該反義核酸可與整個編碼鏈互補或僅與其中一部分互補。在另一個實施方案中,該反義核酸分子與核苷酸序列編碼鏈的非編碼區(qū)反義。“非編碼區(qū)”指序列中被稱為5’-和3’-非翻譯區(qū)的部分。
反義寡核苷酸可以是例如大約5,10,15,20,25,30,35,40,45或50個核苷酸長??捎杀绢I域已知的方法通過化學合成和酶促連接反應構建本發(fā)明的反義核酸。反義核酸可由天然存在的核苷酸或各種修飾的、設計以增強分子的生物穩(wěn)定性或增強反義和有義核酸間形成的雙鏈體的物理穩(wěn)定性的核苷酸通過化學方式合成??梢允褂玫睦影虼姿狨パ苌锖瓦灌と〈暮塑账帷?捎糜诋a(chǎn)生反義核酸的經(jīng)修飾的核苷有例如5-氟尿嘧啶,5-溴尿嘧啶,5-氯尿嘧啶,5-碘尿嘧啶,次黃嘌呤,黃嘌呤,4-乙酰胞嘧啶,.5-(羧基羥基甲基)尿嘧啶,5-羧基甲基氨基甲基-2-硫尿苷,5-羧基甲基氨基甲基尿嘧啶,二氫尿嘧啶,β-D-半乳糖基queuosine,肌苷,N6-異戊烯腺嘌呤,1-甲基鳥嘌呤,1-甲基肌苷,2,2-二甲基鳥嘌呤,2-甲基腺嘌呤,2-甲基鳥嘌呤,3-甲基胞嘧啶,5-甲基胞嘧啶,N6-甲基腺嘌呤,7-甲基鳥嘌呤,5-甲基氨基甲基尿嘧啶,5-甲氧基氨基甲基-2-硫尿嘧啶,β-D-甘露糖基queuosine,5-甲氧基羧基甲基尿嘧啶,5-甲氧基尿嘧啶,2-甲硫基-N6-異戊烯腺嘌呤,尿嘧啶-5-氧基乙酸(v),Wybutoxosine,假尿嘧啶,queuosine,2-硫代胞嘧啶,5-甲基-2-硫尿嘧啶,2-硫尿嘧啶,4-硫尿嘧啶,5-甲基尿嘧啶,尿嘧啶-5-氧乙酸甲基酯,3-(3-氨基-3-羧基丙基)尿嘧啶,(acp3)w和2,6-二氨基嘌呤等。也可利用其中以反義方向亞克隆了核酸的表達載體來生物產(chǎn)生反義核酸。
本發(fā)明的反義核酸分子通常被施用給細胞或在原位產(chǎn)生,這樣它們可以與該細胞mRNA和/或編碼DNA雜交或結合,通過例如抑制轉錄和/或翻譯抑制蛋白的表達。
可以例如通過使反義核酸分子與能結合細胞表面受體或抗原的肽或抗體相連接,以修飾反義分子從而使之能與在所選的細胞表面上表達的受體或抗原特異性地結合。該反義核酸分子還可通過在此描述的載體被給予細胞。為使細胞內的反義分子達到足夠的濃度,優(yōu)選使用的載體構建體為其中反義核酸分子處于強的細菌、病毒或真核細胞啟動子的控制之下的載體。
在另一個實施方案中,本發(fā)明的反義核酸分子是一種α-異頭核酸分子。α-異頭核酸分子(α-anomeric nucleic acid molecule)與互補的RNA形成特有的雙鏈雜交體,與通常的α單元不同,這兩條鏈的走向互相平行(Gaultier等,(1987)Nucleic Acids Res.156625-6641)。該反義核酸分子還可以包含2’-O-甲基核糖核苷酸(Inoue等.,(1987)Nucleic Acids Res.156131-6148)或嵌合RNA-DNA類似物(Inoue等.(1987)FEBS Lett.215327-330)。
本發(fā)明還涉及核酶。其為具有核糖核酸酶活性的催化性RNA分子,能夠切割具有與其互補的區(qū)域的單鏈核酸例如mRNA。因此核酶(例如錘頭核酶(見Haselhoff和Gerlach(1988)Nature 334585-591))可用于本發(fā)明轉錄物的催化性切割從而抑制相應核酸的翻譯。對本發(fā)明的編碼核酸具有特異性的核酶可以在例如本發(fā)明具體公開的cDNA的基礎上形成。例如,可構建四膜蟲-L-19 IVS RNA的衍生物,其中活性位點的核苷酸序列與本發(fā)明的編碼mRNA中待切割的核苷酸序列互補。(參考例如US-A-4 98707l和US-A-5 116 742)。可替換地,可用mRNA自RNA分子池中選擇具有特異的核糖核酸酶活性的催化性RNA(見例如Bartel,D.,和Szostak,J.W.(1993)Science 2611411-1418)。
可替換地,本發(fā)明序列的基因表達可通過與本發(fā)明核苷酸序列的調節(jié)區(qū)互補(例如與編碼序列的啟動子和/或增強子互補)的核苷酸序列的打靶來抑制,這種打靶可造成三股螺旋結構形成從而阻止目標細胞中相應基因的轉錄(Helene,C.(1991)Anticancer Drug Res.6(6)569-584;Helene,C.等,(1992)Ann.N.Y.Acad.Sci.66027-36;和Maher.,L.J.(1992)Bioassays 14(12)807-815)。
表達構建體和載體本發(fā)明還涉及包含在調節(jié)性核酸序列的遺傳控制下的編碼本發(fā)明多肽的核酸序列的表達構建體;以及包含至少一個這樣的表達構建體的載體。本發(fā)明的這種表達構建體優(yōu)選包含位于特定編碼序列5’端上游的啟動子以及位于特定編碼序列3’端下游的終止序列和,適當時,其他通常的調節(jié)元件,這些元件每一個都與該編碼序列可操作地連接?!翱刹僮鞯剡B接”指啟動子,編碼序列,終止子和適當時其他調節(jié)元件的相繼排列方式,這種方式使得每個調節(jié)元件都能按預期行使其功能用于編碼序列的表達。可操作連接的序列的例子為前導序列和增強子、多腺苷酸化信號等。其他調節(jié)元件包括選擇標記、擴增信號、復制起點等。適宜的調節(jié)序列在例如Goeddel,基因表達技術酶學方法(Gene Expression TechnologyMethodsin Enzymology)185,Academic Press,圣地亞哥San Diego,加利福尼亞州CA(1990)中有所描述。
除了人工調節(jié)序列,天然的調節(jié)序列仍可以存在于實際的結構基因之前。這種天然調節(jié)可在適當時通過基因修飾而關閉,從而使基因的表達可被增加或降低。然而,基因構建體也可具有較為簡單的結構,即在結構基因之前不插入附加的調節(jié)信號,且具有調節(jié)功能的天然啟動子未被刪除??商鎿Q地,可以使天然調節(jié)序列發(fā)生突變不再具有調節(jié)作用,從而增強或降低基因的表達。核酸序列在基因構建體中可有一個或多個拷貝。
可使用的啟動子的例子包括cos,tac,trp,tet,trp-tet,lpp,lac,lpp-lac,lacIq,T7,T5,T3,gal,trc,ara,SP6,λ-PR或λ-PL啟動子(它們優(yōu)選用于革蘭氏陰性細菌);革蘭氏陽性細菌啟動子amy和SPO2,酵母啟動子ADC1,MFα,AC,P-60,CYC1,GAPDH或植物啟動子CaMV/35S,SSU,OCS,lib4,usp,STLS1,B33,或泛素或菜豆蛋白啟動子。尤其優(yōu)選使用可誘導的啟動子,例如光誘導的啟動子,更優(yōu)選為溫度誘導的啟動子如PrPl啟動子。原則上所有天然啟動子以及它們的調節(jié)序列均可使用。此外,使用合成啟動子也可能是有利的。
所述的調節(jié)序列旨在用于實現(xiàn)核酸序列的特異表達。這意味著例如視宿主生物不同使基因只在誘導后才表達或過量表達或立即被表達和/或過量表達。
此外優(yōu)選調節(jié)序列或因子可以正面地產(chǎn)生影響,從而增加或減低表達。因此,調節(jié)元件的增強作用可以有利地使用強轉錄信號如啟動子和/或增強子在轉錄水平上發(fā)生。然而通過例如增加mRNA的穩(wěn)定性,也可加強其翻譯。
融合適宜的啟動子和適宜的本發(fā)明核苷酸序列以及終止信號或多腺苷酸化信號可以產(chǎn)生表達盒。為此目的可以使用常規(guī)的重組和克隆技術,參見T.Maniatis,E.F.Fritsch和J.Sambrook,分子克隆實驗室手冊(Molecular CloningA Laboratory Manual),Cold Spring HarborLaboratory,冷泉港Cold Spring Harbor,紐約(1989);T.J.Silhavy,M.L.Berman和L.W.Enquist,基因融合試驗(Experiments with GeneFusions),Cold Spring Harbor Laboratory,Cold Spring Harbor,紐約(1984);Ausubel,F(xiàn).M.等,Current Protocols in Molecular Biology,GreenePublishing Assoc.and Wiley Interscience(1987)。
為在適宜的宿主生物中表達,重組核酸構建體或基因構建體可以有利地插入宿主特異的載體中實現(xiàn)這些基因在宿主中的最佳表達。載體是本領域技術人員熟知的,并可在例如“克隆載體”(Cloning Vectors)(PouwelsP.H.等,eds,Elsevier,Amsterdam-New York-Oxford,1985)中找到有關內容。載體不僅指質粒,還包括本領域技術人員已知的所有其他載體,例如噬菌體,病毒如SV40、CMV、桿狀病毒和腺病毒,轉座子,IS元件,質粒,粘粒和線性或環(huán)狀DNA。這些載體可以在宿主生物中自主復制或隨染色體復制。
可以提及的適宜表達載體的例子有常規(guī)的融合表達載體如pGEX(Pharmacia Biotech Inc;Smith,D.B.和Johnson,K.S.(1988)Gene 6731-40),pMAL(New England Biolabs,Beverly,MA)和pRIT5(Pharmacia,Piscataway,NJ),使用這些載體可以分別使谷胱甘肽S-轉移酶(GST)、麥芽糖E結合蛋白和A蛋白融合至重組目標蛋白。
非融合蛋白表達載體如pTrc(Amann等(1988)Gene 69301-315)和pET 11d(Studier等,基因表達技術酶學方法(Gene ExpressionTechnologyMethods in Enzymology)185,Academic Press,圣地亞哥,加利福尼亞(1990)60-89)。
用于釀酒酵母中表達的酵母表達載體如pYepSec1(Baldari等(1987)Embo J.6229-234),pMF(Kurjan和Herskowitz(1982)細胞(Cell)30933-943),pJRY88(Schultz等(1987)基因(Gene)54113-123)和pYES2(Invitrogen Corporation,圣地亞哥,加利福尼亞)。有關適用于其他真菌(如絲狀真菌)的載體和載體構建方法的例子的詳細描述見例如van denHondel,C.A.M.J.J.& Punt,P.J.(1991)“絲狀真菌基因轉移系統(tǒng)和載體的發(fā)展”,《真菌的應用分子遺傳學》(Applied Molecular Genetics ofFungi),J.F.Peberdy等eds,pp.1-28,Cambridge University PressCambridge。
現(xiàn)有用于培養(yǎng)的昆蟲細胞(例如Sf9細胞)中蛋白的表達的桿狀病毒載體包括pAc系列(Smith等,(1983)Mol.Cell Biol.32156-2165)和pVL系列(Lucklow和Summers(1989)病毒學(Virology)17031-39)。
植物表達載體的例子的詳細描述見例如Becker,D.,Kemper,E.,Schell,J.和Masterson,R.(1992)“緊靠左邊界帶有選擇標記的新植物二元載體”,Plant Mol.Biol.201195-1197;和Bevan,M.W.(1984)“用于植物轉化的農(nóng)桿菌二元載體”,Nucl.Acids Res.128711-8721。
哺乳動物表達載體例如pCDM8(Seed,B.(1987)Nature 329840)和pMT2PC(Kaufman等(1987)EMBO J.6187-195)。
適用于原核和真核細胞的其它表達系統(tǒng)在Sambrook,J.,F(xiàn)ritsch,E.F.和Maniatis,T.,分子克隆實驗室手冊(Molecular cloningA LaboratoryManual),第二版,Cold Spring Harbor Laboratory,Cold Spring HarborLaboratory Press,Cold Spring Harbor,紐約,1989.的第16和17章中描述。
重組微生物本發(fā)明的載體可用于產(chǎn)生重組微生物,所述微生物由例如至少一個本發(fā)明的載體轉化并可用于產(chǎn)生本發(fā)明的多肽。有利地,可以將上述的本發(fā)明重組構建體引入適合的宿主系統(tǒng)中并在其中表達。本領域技術人員熟悉克隆和轉染的方法,例如共沉淀,原生質體融合,電穿孔法,逆轉錄病毒轉染法等,并優(yōu)選使用這些方法引起所述的核酸在特定的表達系統(tǒng)中表達。適宜的表達系統(tǒng)在例如《Current Protocols in Molecular Biology》(F.Ausubel等,eds,Wiley Interscience,紐約1997)或Sambrook等《分子克隆實驗室手冊》(Molecular CloningA Laboratory Manual)第二版(Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,紐約,1989)中有描述。
根據(jù)本發(fā)明還可以制備同源重組微生物。這需要產(chǎn)生包含至少一段本發(fā)明的基因或編碼序列的載體,在適當時,向其中引入至少一個氨基酸缺失、添加或替代以修飾,例如從功能上破壞本發(fā)明的序列(剔除載體)。引入的序列也可為例如來自相關微生物的同系物或來自哺乳動物、酵母或昆蟲??商娲?,還可設計用于同源重組的載體以便同源重組過程中內源性基因發(fā)生突變或經(jīng)過其他修飾但仍編碼功能蛋白(如可以修飾位于上游的調節(jié)序列以改變內源性蛋白的表達)。ME基因的修飾部分存在于同源重組載體內。適宜的同源重組載體的構建的描述見例如Thomas,K.R.和Capecchi,M.R.(1987)Cell 51503。
原則上適宜的宿主生物體可為所有能夠表達本發(fā)明的核酸的生物體,其等位基因變體,其功能等價物或衍生物。宿主生物指例如細菌,真菌,酵母,植物或動物細胞。優(yōu)選的生物為細菌,例如埃希氏桿菌屬(Escherichia)如大腸桿菌,鏈霉菌屬(streptomyces)、芽孢桿菌屬(Bacillus)或假單胞菌屬(Pseudomonas),真核微生物如釀酒酵母,曲霉菌(Aspergillus),來自動物或植物的高等真核細胞,如Sf9或CHO細胞。優(yōu)選的生物選自阿舒氏囊霉屬,尤其是棉桃阿舒氏囊霉株。
成功轉化的生物可通過同樣存在于載體或表達盒中的標記基因選擇。這樣的標記基因為例如抗生素抗性基因和催化引起轉化細胞染色的顏色形成反應的酶的基因。隨后可以通過自動細胞分揀法進行選擇。由載體成功轉化并包含適當?shù)目股乜剐曰?例如G418或潮霉素)的微生物可由適當?shù)暮股氐呐囵B(yǎng)質或營養(yǎng)介質選擇。利用細胞表面上存在的標記蛋白可以通過親和層析法進行選擇。
宿主生物與適合該生物的載體例如質粒、病毒或噬菌體,如具有RNA聚合酶/啟動子系統(tǒng)的質粒、λ或μ噬菌體或其他溫和噬菌體或轉座子和/或其他有利調節(jié)序列的結合形成表達系統(tǒng)?!氨磉_系統(tǒng)”一詞指,例如,哺乳動物細胞如CHO細胞與適合哺乳動物細胞的載體如pcDNA3neo載體的結合。
如需要,基因產(chǎn)物還可在轉基因生物體例如轉基因動物(尤其為小鼠,綿羊)或轉基因植物中表達。
多肽的重組生產(chǎn)本發(fā)明還涉及重組產(chǎn)生本發(fā)明的多肽或其生物學活性功能片斷的方法,該方法中培養(yǎng)可以產(chǎn)生多肽的微生物,在適當時誘導多肽的表達,并自培養(yǎng)物中分離多肽。如需要,該多肽可由此方法進行工業(yè)規(guī)模的生產(chǎn)。
可以利用已知的方法培養(yǎng)和發(fā)酵重組微生物??梢栽诶?0到40℃下,pH為6到9的TB或LB培養(yǎng)基中培養(yǎng)細菌。適合的培養(yǎng)條件的描述見例如T.Maniatis,E.F.Fritsch和J.Sambrook,Molecular CloningALaboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1989)。
如果多肽不被分泌入培養(yǎng)基,則破壞細胞后,利用已知的蛋白分離法自裂解物中獲得產(chǎn)物。備選地,可以通過高頻率超聲波,高壓例如在弗氏細胞壓碎器中,滲脹裂解(osmolysis),變性劑的作用,裂解酶或有機溶劑,勻漿或上述多種方法的組合來破碎細胞。
多肽的純化可以利用已知的色譜法例如分子篩色譜(凝膠過濾法),如Q-Sepharose色譜,離子交換色譜和疏水色譜以及其他常用方法如超濾,結晶,鹽析,透析和非變性凝膠電泳。對適合的方法的描述見例如Cooper,T.G.,Biochemische Arbeitsmethoden,Verlag Walter de Gruyter,Berlin,New York或Scopes,R.,Protein Purification,Springer Verlag,New York,Heidelberg,Berlin。
使用如下載體系統(tǒng)或寡核苷酸尤其利于分離重組蛋白,所述載體系統(tǒng)或寡核苷酸通過特定的核苷酸序列延長cDNA,并由此編碼可用于例如簡化純化過程的經(jīng)修飾的多肽或融合蛋白。該類型的適當修飾包括例如所謂的標簽--其起錨的作用(例如六組氨酸錨修飾法)或能被抗體識別為抗原的表位(描述見例如Harlow,E.和Lane,D.,1988,AntibodiesALaboratory Manual.Cold Spring Harbor(N.Y.)Press)。這些錨可用于使蛋白結合在例如聚合物基質等固相載體上,該固相載體可裝入例如層析柱中,或用于微量滴定板或其他載體上。
同時這些錨也可用于蛋白的識別。還可以單獨或與錨結合使用傳統(tǒng)的標記物例如熒光染料,與底物反應后可形成可探測的反應產(chǎn)物的酶標記物或放射性標記物來衍生并由此識別蛋白質。
本發(fā)明還涉及維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)方法。
如果轉化是用重組微生物進行的,則優(yōu)選該微生物首先在有氧的復合培養(yǎng)基中培養(yǎng),例如在約20℃或更高的溫度下,pH值約為6到9時培養(yǎng)直到細胞密度足夠為止。為了能夠更好的控制反應,優(yōu)選使用可誘導的啟動子。對維生素B2產(chǎn)生實施誘導后,接著在有氧條件下繼續(xù)培養(yǎng)12小時到3天。
以下非限制性實施例描述了本發(fā)明具體的實施方案。
一般性實驗描述a)一般克隆方法本發(fā)明利用的克隆步驟,例如限制性切割,瓊脂糖凝膠電泳,DNA片段的純化,轉移核酸至硝化纖維素膜和尼龍膜上,DNA片段的連接,大腸桿菌細胞的轉化,細菌的培養(yǎng),噬菌體的復制,以及重組DNA的序列分析,均按照Sambrook等(1989)上述引文的描述進行。
b)聚合酶鏈反應(PCR)按照標準方案在下面的標準混合物中進行PCR8μl dNTP混合液(200μM),10μl不含MgCl2的Taq聚合酶緩沖液(10x),8μl MgCl2(25mM),每種引物各1μl(0.1μM),1μl DNA(待擴增),2.5U Taq聚合酶(MBI Fermentas,Vilnius,Lithuania),去離子水加至100μl。
c)大腸桿菌的培養(yǎng)在LB-amp培養(yǎng)基(胰胨10.0g,氯化鈉5.0g,酵母提取物5.0g,氨芐青霉素100g/ml,H2O加至1000ml)中、37℃下培養(yǎng)重組大腸桿菌DH5α菌株。為此每種情況下用接種環(huán)將一個菌落從瓊脂平板轉移至5mlLB-amp中。在220rpm下振蕩培養(yǎng)約18小時后,將4ml培養(yǎng)物接種至2升搖瓶中的400ml培養(yǎng)基中。當OD578值到達0.8和1.0之間后在42℃下熱休克3至4個小時,誘導大腸桿菌中P450的表達。
d)自培養(yǎng)物中純化所需產(chǎn)物可以利用多種本領域已知的方法將所需的產(chǎn)物自微生物或培養(yǎng)物上清中分離出來。如果所需的產(chǎn)物不被細胞分泌,則可通過慢速離心將細胞從培養(yǎng)物中分離出來,并可以由如機械作用力或超聲作用等標準技術裂解細胞。
利用離心除去細胞碎片,得到包含可溶性蛋白的上清部分用于進一步純化所需的化合物。如果該產(chǎn)物被細胞分泌,則由慢速離心除去培養(yǎng)物中的細胞,保留的上清部分用于進一步純化。
在適合的樹脂中層析從這兩種純化方法得到的上清部分,所需的分子以大于雜質的選擇性保留于層析樹脂上或通過之。如有必要可用相同或不同的層析樹脂重復層析步驟。本領域技術人員能夠選擇適宜的層析樹脂,并最為有效的利用其純化特定的分子。純化產(chǎn)物可以經(jīng)過濾或超濾濃縮,并在該產(chǎn)物最為穩(wěn)定的溫度下儲存。
本領域已知多種純化方法。這些純化技術的描述見例如,Bailey,J.E.&Ollis,D.F.Biochemical Engineering Fundamentals,McGraw-HillNewYork(1986)。
可以利用現(xiàn)有技術確定分離的化合物的成分和純度。這些技術包括高效液相色譜法(HPLC)、光譜學方法、染色方法、薄層色譜法、NIRS、酶分析或微生物學分析法。這些分析方法的概述見Patek等(1994)Appl.Environ.Microbiol.60133-140;Malakhova等(1996)Biotekhnologiya 1127-32;和Schmidt等(1998)Bioprocess Engineer.1967-70;Ullmann’sEncyclopedia of Industrial Chemistry(1996)Vol.A27,VCHWeinheim,pp.89-90,pp.521-540,pp.540-547,pp.559-566,pp.575-581和pp.581-587;Michal,G(1999)Biochemical PathwaysAn Atlas of Biochemistry andMolecular Biology,John Wiley and Sons;Fallon,A.等(1987)HPLC在生物化學中的應用,《Laboratory Techniques in Biochemistry and MolecularBiology》,Vol.17。
e)MPSS法、克隆鑒定和同源性檢索的一般描述MPSS技術(Massive Parallel Signature Sequencing,大規(guī)模平行信號測序,參考Brenner等,Nat.Biotechnol.(2000)18,630-634)被應用于產(chǎn)生維生素B2的絲狀真菌棉桃阿舒氏囊霉。利用該技術可以獲得有關大量基因在真核生物體中的表達水平的高度準確的定量信息。該技術涉及在一個特定的時間X時分離生物體的mRNA,在逆轉錄酶的幫助下轉錄成cDNA并克隆入具有特定標簽序列的特定載體中。選擇數(shù)目足夠多(大約高1000倍)的具有不同標簽序列的載體,以便在統(tǒng)計學上每個DNA分子均被克隆入因其標簽序列而獨特的載體中。
該載體的插入序列隨后與標簽一起被切下。通過這種方法得到的DNA分子然后與具有所述標簽的分子對應物的微珠共同孵育。孵育后可認為通過特定標簽或對應物每個微珠僅加載了一種類型的DNA分子。將這些微珠轉移至特殊的流式處理槽(flow cell)中并固定在那里,從而可能利用以熒光染料為基礎的改造的測序法和數(shù)碼彩色相機對所有的微珠進行群體測序。盡管這種方法可進行高數(shù)目的分析,卻受到約16到20個堿基對的閱讀寬度的限制。然而對大多數(shù)生物體而言,該序列長度卻足以使序列和可能的基因之間建立明確的關系(20bp序列的頻率為~1×1012;與之相比,人類基因組的大小“僅”~3×109bp)。
計數(shù)相同序列的數(shù)目并相互比較頻率以分析由此得到的數(shù)據(jù)。頻繁出現(xiàn)的序列反映了高水平的表達,而只出現(xiàn)一次的序列反映了低水平的表達。如果在兩個不同的時間點(X和Y)分離mRNA,可構建單個基因按時間順序的表達模式。
實施例1自棉桃阿舒氏囊霉中分離mRNA根據(jù)已知的技術培養(yǎng)棉桃阿舒氏囊霉(營養(yǎng)培養(yǎng)基27.5g/l酵母提取物;0.5g/l硫酸鎂;50ml/l大豆油;pH 7)。在發(fā)酵過程的不同時間(24h,48h和72h)取出棉桃阿舒氏囊霉的菌絲樣品,根據(jù)Sambrook等(1989)的方案分離相應的RNA或mRNA。
實施例2MPSS的應用利用上述的MPSS分析法分析自棉桃阿舒氏囊霉分離的mRNA。
利用統(tǒng)計分析法分析得到的數(shù)據(jù)并根據(jù)表達差異的顯著性進行分類。這必需要進行關于表達水平的增加和降低的檢測。對表達的改變進行分類a)單調的改變(monotonic change),b)24h后改變,和c)48h后改變。
將由MPSS分析發(fā)現(xiàn)的反映了表達的改變的20bp序列作為探針與來自棉桃阿舒氏囊霉的基因文庫雜交,文庫的插入序列的平均大小約為1kb。在此處雜交溫度為約30至57℃。
實施例3自棉桃阿舒氏囊霉構建基因組文庫為構建基因組DNA文庫,首先通過Wright和Philippsen(Gene(1991)10999-105)及Mohr(1995,phD論文,Bio Zentrum universitt Basel,瑞士)的方法分離染色體DNA。
該DNA由Sau3A部分消化。為此,利用不同量(0.1至1U)Sau3A酶消化6μg基因組DNA。在蔗糖密度梯度中分級分離DNA片斷。分離1kb區(qū)并進行QiaEx提取。最大的片段與BamHI切割的載體pRS416(Sikorski和Hieter,Genetics(1988)122;19-27)連接(90ng BamHI切割的脫磷酸化載體;198ng插入DNA;5ml水;2μl的10×連接緩沖液;1U連接酶)。該連接混合物用于轉化大腸桿菌實驗室菌株XL-1 blue,產(chǎn)生的克隆用于鑒定該插入序列。
實施例4有序基因文庫的制備(芯片技術)將棉桃阿舒氏囊霉基因文庫的約25,000個菌落(相當于對該基因組的約3倍覆蓋)有序地轉移至尼龍膜然后由Sambrook等(1989)描述的菌落雜交法處理。從Mpss分析法發(fā)現(xiàn)的20bp序列合成寡核苷酸并用放射性32P標記。在每種情況下組合10個標記的熔點相似的寡核苷酸并一起與該尼龍膜雜交。雜交并洗滌后,由放射自顯影鑒定出陽性克隆,并直接由PCR測序法分析。
由此方法鑒定出包含內部名稱為″Oligo 72″的插入序列并與來自釀酒酵母的MIPS標簽“Ade3”具有顯著同源性的克隆。該插入序列具有SEQID NO1顯示的核酸序列。
由此方法鑒定出包含內部名稱為″Oligo 81″的插入序列并與來自釀酒酵母的MIPS標簽“Arg1”具有顯著同源性的克隆。該插入序列具有SEQID NO6顯示的核酸序列。
由此方法還鑒定出包含內部名稱為″Oligo 86″的插入序列并與來自釀酒酵母的MIPS標簽“Ade1”具有顯著同源性的克隆。該插入序列具有SEQID NO12顯示的核酸序列。
由此方法還鑒定出包含內部名稱為″Oligo 162″的插入序列并與來自釀酒酵母的MIPS標簽“FRDS1(2)”具有顯著同源性的克隆。該插入序列具有SEQ ID NO16顯示的核酸序列。
由此方法還鑒定出包含內部名稱為″Oligo 178″的插入序列并與來自釀酒酵母的MIPS標簽“AgPCK1”具有顯著同源性的克隆。該插入序列具有SEQ ID NO20顯示的核酸序列。
由此方法還鑒定出包含內部名稱為″Oligo 64″的插入序列并與來自釀酒酵母的MIPS標簽“Hem12”具有顯著同源性的克隆。該插入序列具有SEQ ID NO24顯示的核酸序列。
由此方法還鑒定出包含內部名稱為″Oligo 125″的插入序列并與來自釀酒酵母的MIPS標簽“Met1”具有顯著同源性的克隆。該插入序列具有SEQID NO28顯示的核酸序列。
由此方法還鑒定出包含內部名稱為″Oligo 107″的插入序列并與來自釀酒酵母的MIPS標簽“Hem4”具有顯著同源性的克隆。該插入序列具有SEQ ID NO32顯示的核酸序列。
由此方法還鑒定出包含內部名稱為″Oligo 136″的插入序列并與來自釀酒酵母的MIPS標簽“Pgk1”具有顯著同源性的克隆。該插入序列具有SEQID NO36顯示的核酸序列。
由此方法還鑒定出包含內部名稱為″Oligo 157″的插入序列并與來自釀酒酵母的MIPS標簽“PBI2”具有顯著同源性的克隆。該插入序列具有SEQID NO40顯示的核酸序列。
由此方法還鑒定出包含內部名稱為″Oligo 108”的插入序列并與來自釀酒酵母的MIPS標簽“CYSK”具有顯著同源性的克隆。該插入序列具有SEQ ID NO44顯示的核酸序列。
實施例5由BLASTX查詢法分析序列數(shù)據(jù)對所得核酸序列的分析,即通過功能性氨基酸序列推斷出其功能,由BLASTX查詢法在序列數(shù)據(jù)庫中進行。幾乎所有發(fā)現(xiàn)的氨基酸序列同系物均與釀酒酵母(面包酵母)有關。由于該生物的全部序列已被測定,有關這些基因的更詳細的信息可查閱http//www.mips.gsf.de/proi/yeast/search/code search.htm。
由此發(fā)現(xiàn)了與主要來自釀酒酵母的氨基酸片段的如下同源性。相應的比對情況見附圖1至11。
a)來自SEQ ID NO1的編碼鏈的氨基酸序列與釀酒酵母C1-四氫葉酸合成酶具有顯著的序列同源性。圖1描繪了來自該編碼鏈(相應于SEQ IDNO1第1位至第144位核苷酸)的氨基酸部分序列與該釀酒酵母酶的部分序列。此外,還發(fā)現(xiàn)了相應于SEQ ID NO1第180位至第287位核苷酸的氨基酸部分序列的同系物。SEQ ID NO2和SEQ ID NO3各顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有C1-四氫葉酸合成酶的功能。
b)來自SEQ ID NO6的相應互補鏈的氨基酸序列與釀酒酵母精氨基琥珀酸合成酶具有顯著的序列同源性。圖2A描繪了來自該互補鏈(相當于SEQ ID NO6第862位至551位核苷酸的互補鏈)的氨基酸部分序列與該釀酒酵母酶的部分序列。圖2B描繪了來自該互補鏈(相當于SEQ IDNO6第912位至859位核苷酸的互補鏈)的另一氨基酸部分序列與該釀酒酵母酶的部分序列。SEQ ID NO7和SEQ ID NO8各顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有精氨基琥珀酸合成酶的功能。
c)來自SEQ ID NO12的相應互補鏈的氨基酸序列與釀酒酵母的氨基咪唑-琥珀酸甲酰胺核苷酸合成酶具有顯著的序列同源性。圖3描繪了來自該互補鏈(相當于SEQ ID NO12中的第117位至第1位核苷酸)的氨基酸部分序列與該釀酒酵母酶的部分序列。SEQ ID NO13顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有氨基咪唑-琥珀酸甲酰胺核苷酸合成酶的功能。
d)來自SEQ ID NO16的編碼鏈的氨基酸序列與釀酒酵母延胡索酸還原酶具有顯著的序列同源性。圖4描繪了來自該編碼鏈(相當于SEQ IDNO16的第1位至第882位核苷酸)的氨基酸部分序列與該釀酒酵母酶的部分序列。SEQ ID NO17顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有延胡索酸還原酶的功能。
e)來自SEQ ID NO20的相應互補鏈的氨基酸序列與釀酒酵母烯醇丙酮酸磷酸羧激酶具有顯著的序列同源性。圖5描繪了來自該互補鏈(相當于SEQ ID NO20中的第783位至第1位核苷酸)的氨基酸部分序列與此釀酒酵母酶的部分序列。SEQ ID NO21顯示N端延長的氨基酸部分序列。
因此可以推斷發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有烯醇丙酮酸磷酸羧激酶的功能。
f)來自SEQ ID NO24的編碼鏈的氨基酸序列與釀酒酵母尿卟啉原脫羧酶具有顯著的序列同源性。來自該鏈的氨基酸部分序列(SEQ ID NO25,相當于SEQ ID NO24的第441位至第1058位核苷酸)顯示與來自釀酒酵母的MIPS標簽Hem12的部分序列具有同源性。圖6描繪了來自該鏈的氨基酸部分序列與此釀酒酵母酶的部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有尿卟啉原脫羧酶的功能。
g)來自SEQ ID NO28的相應互補鏈的氨基酸序列與釀酒酵母siroheme合成酶具有顯著的序列同源性。圖7描繪了來自該互補鏈(相當于SEQ ID NO28的第966位至第529位核苷酸的互補鏈)的氨基酸部分序列與該釀酒酵母酶的部分序列。SEQ ID NO29顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有siroheme合成酶或尿卟啉III C-甲基轉移酶的功能。
h)來自SEQ ID NO32的編碼鏈的氨基酸序列與釀酒酵母尿卟啉原III合成酶具有顯著的序列同源性。圖8描繪了來自該鏈(相當于SEQ IDNO32的第107位至第313位核苷酸)的氨基酸部分序列與該釀酒酵母酶的部分序列。SEQ ID NO33顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有尿卟啉原III合成酶的功能。
i)來自SEQ ID NO36的編碼鏈的氨基酸序列與釀酒酵母磷酸甘油酸激酶具有顯著的序列同源性。圖9描繪了來自該編碼鏈(相當于SEQ IDNO36的第2位至第91位核苷酸)的氨基酸部分序列與該釀酒酵母酶的部分序列。SEQ ID NO37表示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有磷酸甘油酸激酶的功能。
k)來自SEQ ID NO40的相應互補鏈的氨基酸序列與釀酒酵母蛋白酶B抑制劑2具有顯著的序列同源性。圖10描繪了來自該互補鏈(相當于SEQ ID NO40中的第713位至第513位核苷酸)的氨基酸部分序列與該釀酒酵母酶的部分序列。SEQ ID NO41顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有蛋白酶B抑制劑2的功能。
l)來自SEQ ID NO44的相應互補鏈的氨基酸序列與釀酒酵母和構巢曲霉的半胱氨酸合成酶具有顯著的序列同源性。圖11A描繪了來自該互補鏈(相當于SEQ ID NO44第1596位至1459位核苷酸)的氨基酸部分序列與該構巢曲霉酶的部分序列。圖11B描繪了來自該互補鏈(相當于SEQID NO44第1441位至971位核苷酸)的另一氨基酸部分序列與該構巢曲霉酶的部分序列。SEQ ID NO45和SEQ ID NO46各顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有半胱氨酸合成酶的功能。
實施例6全長DNA的分離a)構建棉桃阿舒氏囊霉基因文庫從100ml在液體MA2培養(yǎng)基(10克葡萄糖,10克蛋白胨,1克酵母提取物,0.3g肌醇,加至1000ml)中生長兩天的棉桃阿舒氏囊霉培養(yǎng)物制備高分子量細胞總DNA。濾出菌絲體,并用蒸餾水洗兩遍,懸浮于10ml包含1M山梨糖醇、20mM EDTA和20mg酶解酶20T的溶液中,并于27℃下孵育、輕振30至60分鐘。將原生質體懸液調整至包含50mMTris-HCl,pH 7.5,150mM NaCl,100mM EDTA和0.5%濃度的十二烷基硫酸鈉(SDS),并于65℃下孵育20分鐘。經(jīng)過兩次酚/氯仿(體積比1∶1)萃取,用異丙醇沉淀DNA,懸浮于TE緩沖液中,經(jīng)RNA酶的處理后再次用異丙醇沉淀并懸浮于TE緩沖液中。
根據(jù)大小選出并由Sau3A部分消化的基因組DNA與粘粒載體Super-Cosl(Stratagene)的去磷酸化臂連接產(chǎn)生棉桃阿舒氏囊霉粘?;蛭膸臁uper-Cos1載體在兩個cos位點間經(jīng)Xbal消化打開并用牛小腸堿性磷酸酶(Boehringer)去磷酸化,接著用BamHI打開克隆位點。該連接在20μl包含2.5μg部分消化的染色體DNA,1μg Super-Cos1載體臂,40mMTris-HCl,pH 7.5,10mM MgCl2,1mM二硫蘇糖醇,0.5mM ATP和2Weiss單位T4-DNA連接酶(Boehringer)的混合液中、15℃下過夜進行。利用提取物和Stratagene的方案(Gigapack II Packaging Extract)在體外包裝連接產(chǎn)物。將包裝產(chǎn)物用于感染大腸桿菌NM554(recA13,araD139,Δ(ara,leu)7696,Δ(lac)17A,galU,galK,hsrR,rps(strr),merA,mcrB)并涂布在含有氨芐青霉素(50μg/ml)的LB板上。獲得含有長度平均為30-45kb的棉桃阿舒氏囊霉插入片段的轉化體。
b)粘?;蛭膸斓膬Υ婧秃Y選將共4×104個新鮮單菌落各自單獨地接種于96孔微量滴定板(Falcon,No.3072)孔中的100μlLB培養(yǎng)基中,所述LB培養(yǎng)基補充有凍存液(36mM K2HPO4/13.2mM KH2PO4,、1.7mM檸檬酸鈉、0.4mMMgSO4、6.8mM(NH4)2SO4,、4.4%(w/v)甘油)和氨芐青霉素(50μg/ml),37℃下振搖過夜生長之后在-70℃下冷凍。快速融解滴定板并在用經(jīng)酒精浴消毒隨后在熱板上蒸發(fā)去除酒精的96孔復制板上于新鮮培養(yǎng)基中進行復制。在冷凍前和解凍后(采取其它所有措施前),在微量滴定板振蕩器(Infors)中短暫振蕩這些板子以保證該細胞懸液的均勻。利用能夠將少量液體自96孔微量滴定板轉移至尼龍膜的自動機械系統(tǒng)(Bio-Robotics)將單克隆置于尼龍膜上(GeneScreen Plus,New England Nuclear)。當培養(yǎng)物自96孔微量滴定板轉移后(1920個克隆),該膜被置于22×22厘米培養(yǎng)皿(Nunc)中含有氨芐青霉素(50μg/ml)的LB瓊脂表面上并在37℃下孵育過夜。細胞匯合前,用Herrmann,B.G.,Barlow,D.P和Lehrach,H.(1987),Cell 48,pp.813-825描述的方法處理這些膜,包括第一個變性步驟后的附加處理,即將濾膜置于沸水浴上飽含變性溶液的墊子上方暴露于蒸氣5分鐘。
利用隨機六聚體引物標記法(Feinberg,A.P.和Vogelstein,B.(1983),Anal.Biochem.132,pp.6-13)、通過[α-32P]dCTP的攝取,得到高比活的標記雙鏈探針。這些膜經(jīng)過預雜交后在42℃下、于含有50%(vol/vol)甲酰胺、600mM磷酸鈉、pH 7.2、1mM EDTA、10%硫酸葡聚糖、1%SDS和10×Denhardt氏液、鮭魚精子DNA(50μg/ml)以及32P標記的探針(0.5-1×106cpm/ml)的溶液中雜交6至12小時。典型地,在55至65℃下、13至30mM NaCl、1.5至3mM檸檬酸鈉、pH 6.3、0.1%SDS中洗滌約1小時,濾膜在-70℃用柯達增感屏放射自顯影12至24小時。至今,每張膜均已被成功重復使用20次以上。在95℃下、2mM Tris-HCl,pH 8.0,0.2mM EDTA,0.1%SDS中孵育2×20分鐘剝離濾膜上的探針。
c)從存儲的基因文庫中回收陽性菌落用無菌一次性柳葉刀將微量滴定板孔中的冰凍細菌培養(yǎng)物刮出,并在含有氨芐青霉素(50μg/ml)的LB瓊脂培養(yǎng)皿上劃線。然后將單菌落接種于液體培養(yǎng)基中,通過堿裂解法產(chǎn)生DNA(Birnboim,H.C.和Doly,J.(1979),Nucleic Acids Res.7,pp.1513-1523)。
d)全長DNA如上述可鑒定出包含具有正確的完全序列的插入片段的克隆。這些克隆的內部名稱為“Oligo 72v”,包含完全序列的插入片斷具有SEQ ID NO4中所示的核酸序列。
“Oligo 81v”,包含完全序列的插入片斷具有SEQ ID NO9.中所示的核酸序列。由該插入片段編碼的蛋白優(yōu)選地包含SEQ ID NO10和11中所示至少一種氨基酸序列。
“Oligo 86v”,包含完全序列的插入片斷具有SEQ ID NO14中所示的核酸序列。
“Oligo 162v”,包含完全序列的插入片斷具有SEQ ID NO18中所示的核酸序列。
“Oligo 178v”,包含完全序列的插入片斷具有SEQ ID NO22中所示的核酸序列。
“Oligo 64v”,包含完全序列的插入片斷具有SEQ ID NO26中所示的核酸序列。
“Oligo 125v”,包含完全序列的插入片斷具有SEQ ID NO30中所示的核酸序列。
“Oligo 107v”,包含完全序列的插入片斷具有SEQ ID NO34中所示的核酸序列。
“Oligo 136v”,包含完全序列的插入片斷具有SEQ ID NO38中所示的核酸序列。
“Oligo 157v”,包含完全序列的插入片斷具有SEQ ID NO42中所示的核酸序列。
“Oligo 108v”,包含完全序列的插入片斷具有SEQ ID NO47中所示的核酸序列。
表1序列綜覽




序列表<110>巴斯福股份公司(BASF Aktiengesellschaft)<120>棉桃阿舒氏囊霉的酶<130>M/42301/PCT<160>48<170>PatentIn version 3.1<210>1<211>1058<212>DNA<213>棉桃阿舒氏囊霉(Ashbya gossypii)<220>
<221>misc_feature<223>Oligo 72<400>1gatctctctc ctacggcgca aaagaagatt gccttgtaca cggcccaagg ttttgataaa 60ctacctatct gtatcgcgaa aactcagtac tccctgtccc atgatgccac ctttgaagaa 120cgtcccctcc gattttgtgt tccccataag ggatatcagg gccttccatt ggagcgggct 180acctgtacgc gctagcggca gagattcaaa ctatccccgg tctctccact aacgcaggct 240acatgaatgt tgaagtcagt gatgacggcg agattgaagg tcttttctag gtctacgatt 300acgtatgctt agccaccccc gctcatatac ataattatgt tgaacaggca tgctcaggct 360gcgttccctg tagtgcaccc gttagtgcgc atgggccccg aagccgttgc ttttagaacc 420ggcatgcgac acataccgga gacattactt tagcgtcgca gtgacagtta tgtcccgaga 480cgctggcatg caatcgatgt cgagcctagt gagtcagaaa cggagtcagt gtcttcagac 540acacaagcga aatcagggtc agctttgact aaacctaaaa accatagtgc attacgtccg 600actgtatctt cacataaagt tagggaggag aatcaaagca aggtagcata acaaagtatg 660gatttgatgg tcataaataa ggacgactgg gtatatgtac agtccgaggg cgaccacagc 720ggcgatcaca cttattttga gagcacaatc acctcatcgc ttcgagacac aaagcggcac 780gcgctattcc cgcccatagt cagggagcag ttcatccagg ggaaagatat gtgcctacca 840atctaccacg acgggataaa agagcaggca gcgctcgagt acgacggcac aggcgcgcta 900tgcggccttt gacacgctgt ggcaccacgc cgccacacag cacgcaataa acgggcaacg 960gtatattgct gatatacctc gatacttatt attagaaaaa acctgcgttt gcaggctttt1020atactacata aagacaggat gaaaaacgta gatagatc1058<210>2<211>48<212>PRT<213>棉桃阿舒氏囊霉
<220>
<221>misc_feature<223>Oligo 72<400>2Asp Leu Ser Pro Thr Ala Gln Lys Lys Ile Ala Leu Tyr Thr Ala Gln1 5 10 15Gly Phe Asp Lys Leu Pro Ile Cys Ile Ala Lys Thr Gln Tyr Ser Leu2025 30Ser His Asp Ala Thr Phe Glu Glu Arg Pro Leu Arg Phe Cys Val Pro35 40 45<210>3<211>41<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 72<400>3Ser Ile Gly Ala Gly Tyr Leu Tyr Ala Leu Ala Ala Glu Ile Gln Thr1 5 10 15Ile pro Gly Leu Ser Thr Asn Ala Gly Tyr Met Asn Val Glu Val Ser20 25 30Asp Asp Gly Glu Ile Glu Gly Leu Phe35 40<210>4<211>4474<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(440)..(3253)<223>
<220>
<221>misc_feature<223>Oligo 72<400>4cggcttcagt tttttttatc cccaattact ctcgttactg attccgcgat tgacgctaat 60ttaactttag ctttttatat gcttgactta gcctttacct gttgtcgact ttctttagtt120cagcatcttg tatattactt gttcacgtat aaatagatag cgatacccct ttgcgagtat180
acagttgcct tactgtgatt atgttcttcc tgttttattt gctaggtaag ttttgacctt240tttttgatgt tcacaagcac cgtcgacgct caagaaaacg atcgaagttc ctccctaacg300tctgccgttt accaagtata acgttgaact gtactatcct cctgtgcact aagttagcat360gcttcgcacc tttacggagt ggagtattct aaggagtaat actcagctcg gggctttcag420ctgcccagta cgaagacat tac cat tta att tct ggt aaa agc atc gcg aaa 472Tyr His Leu Ile Ser Gly Lys Ser Ile Ala Lys1 5 10acc att aga gac aat gct ctg aga gag gtg aaa gag att agg cag caa 520Thr Ile Arg Asp Asn Ala Leu Arg Glu Val Lys Glu Ile Arg Gln Gln15 20 25gtt cca gat ttt aat cca aaa ctg aag atc ttg cag gtt ggc tcc cgc 568Val Pro Asp Phe Asn Pro Lys Leu Lys Ile Leu Gln Val Gly Ser Arg30 35 40cct gat tca tct gca tat gtc cgg atg aag ttg aaa gca tcc acc gag 616Pro Asp Ser Ser Ala Tyr Val Arg Met Lys Leu Lys Ala Ser Thr Glu45 50 55tct ggt gta gaa tgt gac gtt gaa aag ctt cca gaa gat att acg caa 664Ser Gly Val Glu Cys Asp Val Glu Lys Leu Pro Glu Asp Ile Thr Gln60 65 70 75ctc gaa cta ctc aga aag atc gag aaa atc aac tct gac gcc gaa gtg 712Leu Glu Leu Leu Arg Lys Ile Glu Lys Ile Asn Ser Asp Ala Glu Val80 85 90cat ggg att ctg att cag ctg cca ctg cca aag cat tta gat gaa gtg 760His Gly Ile Leu Ile Gln Leu Pro Leu Pro Lys His Leu Asp Glu Val95 100 105aca gtt acc aat gct gtg gac cat gaa aag gac gtt gat ggg ttc cat 808Thr Val Thr Asn Ala Val Asp His Glu Lys Asp Val Asp Gly Phe His110 115 120cgc tat aat gtt ggt gag ctc gct aaa cgt ggc ggg aaa cca tac ttc 856Arg Tyr Asn Val Gly Glu Leu Ala Lys Arg Gly Gly Lys Pro Tyr Phe125 130 135ctg cca tgt aca cct aat gcg tgt ata cag ctt ttg aaa gag tgc ggt 904Leu Pro Cys Thr Pro Asn Ala Cys Ile Gln Leu Leu Lys Glu Cys Gly140 145 150 155gtt gag ata aga ggg aaa cag gca gtc gta att ggc cgc tct gac atc 952Val Glu Ile Arg Gly Lys Gln Ala Val Val Ile Gly Arg Ser Asp Ile160 165 170gtg ggg acc cca gtt gca acg atg ctc aaa aat ctt gat gcc acg gtg 1000Val Gly Thr Pro Val Ala Thr Met Leu Lys Asn Leu Asp Ala Thr Val175 180 185act gtt gcg cac aga cat acg aca aat ctt cca caa gtc ctc tcc act 1048Thr Val Ala His Arg His Thr Thr Asn Leu Pro Gln Val Leu Ser Thr190 195 200gcg gat att gta gtt gct gcg tgt ggc gtg cct aac tac ata aag ggc 1096Ala Asp Ile Val Val Ala Ala Cys Gly Val Pro Asn Tyr Ile Lys Gly205 210 215gaa tgg tta aaa gat ggc gcc gtg gtt att gac gtt ggc atc aat tat 1144Glu Trp Leu Lys Asp Gly Ala Val Val Ile Asp Val Gly Ile Asn Tyr
220 225 230 235gtt cag gat tcc acc aaa aaa tca ggc caa aga tta gtc ggt gat gtg 1192Val Gln Asp Ser Thr Lys Lys Ser Gly Gln Arg Leu Val Gly Asp Val240 245 250gac ttc gaa tcg gca aag gag aag gct tct cac atc acg cct gta cct 1240Asp Phe Glu Ser Ala Lys Glu Lys Ala Ser His Ile Thr Pro Val Pro255 260 265ggc ggc gtg ggt cct atg acc gtg gcc atg ctg gtg caa aat gtc ttg 1288Gly Gly Val Gly Pro Met Thr Val Ala Met Leu Val Gln Asn Val Leu270 275 280act gca gca aaa aga tcg ttg cag aag gac gca gag gtg cca gtg atc 1336Thr Ala Ala Lys Arg Ser Leu Gln Lys Asp Ala Glu Val Pro Val Ile285 290 295aca cca ctg cct gtg aat ttt gag atg cct gtg cca tcg gat atc gat 1384Thr Pro Leu Pro Val Asn Phe Glu Met Pro Val Pro Ser Asp Ile Asp300 305 310 315ata tca agg aaa cag aat ccg aaa cat att tct cag gtg gca gcc gag 1432Ile Ser Arg Lys Gln Asn Pro Lys His Ile Ser Gln Val Ala Ala Glu320 325 330ttg ggt att agg gat cac gag ctg gag ttg ttt ggg cat tat aaa gcc 1480Leu Gly Ile Arg Asp His Glu Leu Glu Leu Phe Gly His Tyr Lys Ala335 340 345aag att tct cca aaa ctc ctc caa aga ttg cat gct aac caa aat gca 1528Lys Ile Ser Pro Lys Leu Leu Gln Arg Leu His Ala Asn Gln Asn Ala350 355 360aac tat gtc tta gtt gct ggg att aca ccg acc cct cta gga gag gga 1576Asn Tyr Val Leu Val Ala Gly Ile Thr Pro Thr Pro Leu Gly Glu Gly365 370 375aag tcg acc acc act atg ggg cta gtc caa gcg ctt tcc gct cac cta 1624Lys Ser Thr Thr Thr Met Gly Leu Val Gln Ala Leu Ser Ala His Leu380 385 390 395ggc aaa cgg gct att gca aac gtt cgt caa cct tca atg gga ccc acg 1672Gly Lys Arg Ala Ile Ala Asn Val Arg Gln Pro Ser Met Gly Pro Thr400 405 410ttt gga gtc aag gga ggc gcg gca ggc ggg ggt tac gcc cag gtc att 1720Phe Gly Val Lys Gly Gly Ala Ala Gly Gly Gly Tyr Ala Gln Val Ile415 420 425cca atg gat gag ttc aac ttg cat ttg aca ggc gac atc cac gcc att 1768Pro Met Asp Glu Phe Asn Leu His Leu Thr Gly Asp Ile His Ala Ile430 435 440tca gcc gcc aac aat ctg cta gcc gca gcc ata gat aca agg atg ttt 1816Ser Ala Ala Asn ASn Leu Leu Ala Ala Ala Ile Asp Thr Arg Met Phe445 450 455cac gaa cac acg caa aag aac gat gct act ttt tat aac aga ttg gtg 1864His Glu His Thr Gln Lys Asn Asp Ala Thr Phe Tyr Asn Arg Leu Val460 465 470 475ccc aag aag ggc ggc tcg cgg aag ttc acg aaa tca atg ctg aag agg 1912Pro Lys Lys Gly Gly Ser Arg Lys Phe Thr Lys Ser Met Leu Lys Arg480 485 490ctc cag aag ctg gga att aac aaa aca gac cca gac agt ttg tct cca 1960
Leu Gln Lys Leu Gly Ile Asn Lys Thr Asp Pro Asp Ser Leu Ser Pro495 500 505aaa gaa atc aaa cga ttt gca cgc cta aac ata gac acg gat acc atc 2008Lys Glu Ile Lys Arg Phe Ala Arg Leu Asn Ile Asp Thr Asp Thr Ile510 515 520act atc aaa cgg gtg gtt gat gtc aac gat aga ctt cta cgg cag att 2056Thr Ile Lys Arg Val Val Asp Val Asn Asp Arg Leu Leu Arg Gln Ile525 530 535acg atc ggc caa gct cat act gag aag ggt ttt acc aga acc acc ggg 2104Thr Ile Gly Gln Ala His Thr Glu Lys Gly Phe Thr Arg Thr Thr Gly540 545 550 555ttt gat atc act gtt gca tct gaa ttg atg gcc att ttg gca ctt tct 2152Phe Asp Ile Thr Val Ala Ser Glu Leu Met Ala Ile Leu Ala Leu Ser560 565 570aag gac ttc gct gat atg aga gaa cgt gta ggt cgc atg gtt gtc gct 2200Lys Asp Phe Ala Asp Met Arg Glu Arg Val Gly Arg Met Val Val Ala575 580 585gcg aat cta gac ggc gag ccg att aca gca gaa gat gta ggc tgt gct 2248Ala Asn Leu Asp Gly Glu Pro Ile Thr Ala Glu Asp Val Gly Cys Ala590 595 600gga gct gtt gct gcc ctt ctg aag gac gct atc aag cca aca cta atg 2296Gly Ala Val Ala Ala Leu Leu Lys Asp Ala Ile Lys Pro Thr Leu Met605 610 615cag tct ttg gaa ggc acc cct gtt tta gtc cat gca ggg ccg ttc gcc 2344Gln Ser Leu Glu Gly Thr Pro Val Leu Val His Ala Gly Pro Phe Ala620 625 630 635aac atc tct atc gga gcc tcc tca gta att gct gac aga att gcc ctg 2392Asn Ile Ser Ile Gly Ala Ser Ser Val Ile Ala Asp Arg Ile Ala Leu640 645 650aag ttg gtg ggc act tct cca cat tct ccg gaa ggc acc gac gcc ggc 2440Lys Leu Val Gly Thr Ser Pro His Ser Pro Glu Gly Thr Asp Ala Gly655 660 665tat gtg gtt acc gag gcc gga ttc gac ttt aca atg ggc gga gaa cga 2488Tyr Val Val Thr Glu Ala Gly Phe Asp Phe Thr Met Gly Gly Glu Arg670 675 680ttc ctg aac ata aag tgc cgc tcc tca ggc ttg aag cca aat act atc 2536Phe Leu Asn Ile Lys Cys Arg Ser Ser Gly Leu Lys Pro Asn Thr Ile685 690 695gtc atc gtg gcc act gtc cgt gcc ctg aag ctg cac ggc ggt ggc cct 2584Val Ile Val Ala Thr Val Arg Ala Leu Lys Leu His Gly Gly Gly Pro700 705 710 715gag gta aag ccg ggc cag cca ctt act ccc cac tat act gag gaa aac 2632Glu Val Lys Pro Gly Gln Pro Leu Thr Pro His Tyr Thr Glu Glu Asn720 725 730ctc gag cta gtc aca aga ggt gcg gcc aac ctg cag aag caa ata aga 2680Leu Glu Leu Val Thr Arg Gly Ala Ala Asn Leu Gln Lys Gln Ile Arg735 740 745aat gcc aag ctt ttc ggg gtc cct gtc gta gtc gct gtg aac agg ttt 2728Asn Ala Lys Leu Phe Gly Val Pro Val Val Val Ala Val Asn Arg Phe750 755 760
gag tca gac act gtc gca gaa att gag att att cag aag gcg gcg aag 2776Glu Ser Asp Thr Val Ala Glu Ile Glu Ile Ile Gln Lys Ala Ala Lys765 770 775gag gct ggt gca cat gac gcc atc gat gca aat cgc tgg gcc gaa ggc 2824Glu Ala Gly Ala His Asp Ala Ile Asp Ala Asn Arg Trp Ala Glu Gly780 785 790 795gga aaa gga gca gtc acg ctg gcc gaa gcc gtc atc aac tca tgc aaa 2872Gly Lys Gly Ala Val Thr Leu Ala Glu Ala Val Ile Asn Ser Cys Lys800 805 810caa ccc agt tct ttt aag ttc ctt tat gac gtc gat caa cct gtg aca 2920Gln Pro Ser Ser Phe Lys Phe Leu Tyr Asp Val Asp Gln Pro Val Thr815 820 825gaa aag ctc tcc acc att gtt cgg aaa atg tat ggc ggt tcc gcg ata 2968Glu Lys Leu Ser Thr Ile Val Arg Lys Met Tyr Gly Gly Ser Ala Ile830 835 840gat ctc tct cct acg gcg caa aag aag att gcc ttg tac acg gcc caa 3016Asp Leu Ser Pro Thr Ala Gln Lys Lys Ile Ala Leu Tyr Thr Ala Gln845 850 855ggt ttt gat aaa cta cct atc tgt atc gcg aaa act cag tac tcc ctg 3064Gly Phe Asp Lys Leu Pro Ile Cys Ile Ala Lys Thr Gln Tyr Ser Leu860 865 870 875tcc cat gat gcc act ttg aag aac gtc ccc tcc gat ttt gtg ttc ccc 3112Ser His Asp Ala Thr Leu Lys Asn Val Pro Ser Asp Phe Val Phe Pro880 885 890ata agg gat atc agg cct tcc att gga gcg ggc tac ctg tac gcg cta 3160Ile Arg Asp Ile Arg Pro Ser Ile Gly Ala Gly Tyr Leu Tyr Ala Leu895 900 905gcg gca gag att caa act atc ccc ggt ctc tcc act aac gca ggc tac 3208Ala Ala Glu Ile Gln Thr Ile Pro Gly Leu Ser Thr Asn Ala Gly Tyr910 915 920atg aat gtt gaa gtc agt gat gac ggc gag att gaa ggt ctt ttc 3253Met Asn Val Glu Val Ser Asp Asp Gly Glu Ile Glu Gly Leu Phe925 930 935taggtctacg attacgtatg cttagccacc cccgctcata tacataatta tgttgaacag 3313gcatgctcag gctgcgttcc ctgtagtgca cccgttagtg cgcatgggcc ccgaagccgt 3373tgcttttaga accggcatgc gacacatacc ggagacatta ctttagcgtc gcagtgacag 3433ttatgtcccg agacgctggc atgcaatcga tgtcgagcct agtgagtcag aaacggagtc 3493agtgtcttca gacacacaag cgaaatcagg gtcagctttg actaaaccta aaaaccatag 3553tgcattacgt ccgactgtat cttcacataa agttagggag gagaatcaaa gcaaggtagc 3613ataacaaagt atggatttga tggtcataaa taaggacgac tgggtatatg tacagtccga 3673gggcgaccac agcggcgatc acacttattt tgagagcaca atcacctcat cgcttcgaga 3733cacaaagcgg cacgcgctat tcccgcccat agtcagggag cagttcatcc aggggaaaga 3793tatgtgccta ccaatctacc acgacgggat aaaagagcag gcagcgctcg agtacgacgg 3853cacaggcgcg ctatgcggcc tttgacacgc tgtggcacca cgccgccaca cagcacgcaa 3913taaacgggca acggtatatt gctgatatac ctcgatactt attattagaa aaaacctgcg 3973
tttgcaggct tttatactac ataaagacag gatgaaaaac gtagatagat cagagtacgc 4033tatggtttca ggttgataat ttatacaaaa tgcgcgccat tggaggaacc ctccagtgct 4093taggcatctt cctttagcaa agcctctctc ttttcagcga ttctttgagc tcttctctct 4153ctggcagctc tgttcttcaa tcttctggcc tcagcctcct ccttcaaggg cttctcacgc 4213tgagcatcag ccttggcctg gataatgtgt tcgaccaagg atctcttgtg cttgaaggtg 4273ttacccttgg cagccttgta caaagagtgg tacaagtgtc tgtcgatctt gccggcgtct 4333ctgtacttag ccaacaatct tctcaagaca cgcaatcttc tgatccagac gacctgggat 4393ggcagtctac cctccttggt accctttcct cttaccgtaa ccgggggtga cggggcgttt 4453tcttggactc agccatggct c 4474<210>5<211>938<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 72<400>5Tyr His Leu Ile Ser Gly Lys Ser Ile Ala Lys Thr Ile Arg Asp Asn1 5 10 15Ala Leu Arg Glu Val Lys Glu Ile Arg Gln Gln Val Pro Asp Phe Asn20 25 30Pro Lys Leu Lys Ile Leu Gln Val Gly Ser Arg Pro Asp Ser Ser Ala35 40 45Tyr Val Arg Met Lys Leu Lys Ala Ser Thr Glu Ser Gly Val Glu Cys50 55 60Asp Val Glu Lys Leu Pro Glu Asp Ile Thr Gln Leu Glu Leu Leu Arg65 70 75 80Lys Ile Glu Lys Ile Asn Ser Asp Ala Glu Val His Gly Ile Leu Ile85 90 95Gln Leu Pro Leu Pro Lys His Leu Asp Glu Val Thr Val Thr Asn Ala100 105 110Val Asp His Glu Lys Asp Val Asp Gly Phe His Arg Tyr Asn Val Gly115 120 125Glu Leu Ala Lys Arg Gly Gly Lys Pro Tyr Phe Leu Pro Cys Thr Pro130 135 140
Asn Ala Cys Ile Gln Leu Leu Lys Glu Cys Gly Val Glu Ile Arg Gly145 150 155 160Lys Gln Ala Val Val Ile Gly Arg Ser Asp Ile Val Gly Thr Pro Val165 170 175Ala Thr Met Leu Lys Asn Leu Asp Ala Thr Val Thr Val Ala His Arg180 185 190His Thr Thr Asn Leu Pro Gln Val Leu Ser Thr Ala Asp Ile Val Val195 200 205Ala Ala Cys Gly Val Pro Asn Tyr Ile Lys Gly Glu Trp Leu Lys Asp210 215 220Gly Ala Val Val Ile Asp Val Gly Ile Asn Tyr Val Gln Asp Ser Thr225 230 235 240Lys Lys Ser Gly Gln Arg Leu Val Gly Asp Val Asp Phe Glu Ser Ala245 250 255Lys Glu Lys Ala Ser His Ile Thr Pro Val Pro Gly Gly Val Gly Pro260 265 270Met Thr Val Ala Met Leu Val Gln Asn Val Leu Thr Ala Ala Lys Arg275 280 285Ser Leu Gln Lys Asp Ala Glu Val Pro Val Ile Thr Pro Leu Pro Val290 295 300Asn Phe Glu Met Pro Val Pro Ser Asp Ile Asp Ile Ser Arg Lys Gln305 310 315 320Asn Pro Lys His Ile Ser Gln Val Ala Ala Glu Leu Gly Ile Arg Asp325 330 335His Glu Leu Glu Leu Phe Gly His Tyr Lys Ala Lys Ile Ser Pro Lys340 345 350Leu Leu Gln Arg Leu His Ala Asn Gln Asn Ala Asn Tyr Val Leu Val355 360 365Ala Gly Ile Thr Pro Thr Pro Leu Gly Glu Gly Lys Ser Thr Thr Thr370 375 380Met Gly Leu Val Gln Ala Leu Ser Ala His Leu Gly Lys Arg Ala Ile385 390 395 400Ala Asn Val Arg Gln Pro Ser Met Gly Pro Thr Phe Gly Val Lys Gly405 410 415
Gly Ala Ala Gly Gly Gly Tyr Ala Gln Val Ile Pro Met Asp Glu Phe420 425 430Asn Leu His Leu Thr Gly Asp Ile His Ala Ile Ser Ala Ala Asn Asn435 440 445Leu Leu Ala Ala Ala Ile Asp Thr Arg Met Phe His Glu His Thr Gln450 455 460Lys Asn Asp Ala Thr Phe Tyr Asn Arg Leu Val Pro Lys Lys Gly Gly465 470 475 480Ser Arg Lys Phe Thr Lys Ser Met Leu Lys Arg Leu Gln Lys Leu Gly485 490 495Ile Asn Lys Thr Asp Pro Asp Ser Leu Ser Pro Lys Glu Ile Lys Arg500 505 510Phe Ala Arg Leu Asn Ile Asp Thr Asp Thr Ile Thr Ile Lys Arg Val515 520 525Val Asp Val Asn Asp Arg Leu Leu Arg Gln Ile Thr Ile Gly Gln Ala530 535 540His Thr Glu Lys Gly Phe Thr Arg Thr Thr Gly Phe Asp Ile Thr Val545 550 555 560Ala Ser Glu Leu Met Ala Ile Leu Ala Leu Ser Lys Asp Phe Ala Asp565 570 575Met Arg Glu Arg Val Gly Arg Met Val Val Ala Ala Asn Leu Asp Gly580 585 590Glu Pro Ile Thr Ala Glu Asp Val Gly Cys Ala Gly Ala Val Ala Ala595 600 605Leu Leu Lys Asp Ala Ile Lys Pro Thr Leu Met Gln Ser Leu Glu Gly610 615 620Thr Pro Val Leu Val His Ala Gly Pro Phe Ala Asn Ile Ser Ile Gly625 630 635 640Ala Ser Ser Val Ile Ala Asp Arg Ile Ala Leu Lys Leu Val Gly Thr645 650 655Ser Pro His Ser Pro Glu Gly Thr Asp Ala Gly Tyr Val Val Thr Glu660 665 670Ala Gly Phe Asp Phe Thr Met Gly Gly Glu Arg Phe Leu Asn Ile Lys
675 680 685Cys Arg Ser Ser Gly Leu Lys Pro Asn Thr Ile Val Ile Val Ala Thr690 695 700Val Arg Ala Leu Lys Leu His Gly Gly Gly Pro Glu Val Lys Pro Gly705 710 715 720Gln Pro Leu Thr Pro His Tyr Thr Glu Glu Asn Leu Glu Leu Val Thr725 730 735Arg Gly Ala Ala Asn Leu Gln Lys Gln Ile Arg Asn Ala Lys Leu Phe740 745 750Gly Val Pro Val Val Val Ala Val Asn Arg Phe Glu Ser Asp Thr Val755 760 765Ala Glu Ile Glu Ile Ile Gln Lys Ala Ala Lys Glu Ala Gly Ala His770 775 780Asp Ala Ile Asp Ala Asn Arg Trp Ala Glu Gly Gly Lys Gly Ala Val785 790 795 800Thr Leu Ala Glu Ala Val Ile Asn Ser Cys Lys Gln Pro Ser Ser Phe805 810 815Lys Phe Leu Tyr Asp Val Asp Gln Pro Val Thr Glu Lys Leu Ser Thr820 825 830Ile Val Arg Lys Met Tyr Gly Gly Ser Ala Ile Asp Leu Ser Pro Thr835 840 845Ala Gln Lys Lys Ile Ala Leu Tyr Thr Ala Gln Gly Phe Asp Lys Leu850 855 860Pro Ile Cys Ile Ala Lys Thr Gln Tyr Ser Leu Ser His Asp Ala Thr865 870 875 880Leu Lys Asn Val Pro Ser Asp Phe Val Phe Pro Ile Arg Asp Ile Arg885 890 895Pro Ser Ile Gly Ala Gly Tyr Leu Tyr Ala Leu Ala Ala Glu Ile Gln900 905 910Thr Ile Pro Gly Leu Ser Thr Asn Ala Gly Tyr Met Asn Val Glu Val915 920 925Ser Asp Asp Gly Glu Ile Glu Gly Leu Phe930 935
<210>6<211>918<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 81<400>6gatcgattcg ctttcgtgag acacttggcg taataccaca cgcgagccgc aatgggccgc 60cttaacgagg tagtgggcat atagtttctc cttctgagtt agcctgttca aagaattttc 120gagcgctgag cataataacg ggagcattcc gttccgccaa gtataactga ctgagctggt 180tgttcgtagt agccatcgtt cttagaatgc taaatgtatt acgcgaatgt atcgatactc 240gcttaaatat cgactgtagc atataaaaac gaacgaagca gttggtcctg gtccttattt 300atgtacaagc attacgttca aagttagtga ccaatgttgc aaaaagcctt tttggaggat 360ttcatagcgc cgtttcctcg gggggaggaa gactacttta atttaggcaa gtaaagtctg 420cgccagcctc aactgagtca cgccatcaga tgacgacgga tggatactca tctagccgca 480agtattagtc gctgatttac gcgccgttct attgatctga ttggctactt cggaatgtaa 540atagaattta caaagtcagg gattcacctt tgtccttctt ggattgaccg tactttttca 600tgcgaattgc ttgaatagcg atgaaaccag tggtatcagt cggctggaat ccggtcaatt 660cgtccatgga ggactccgtc gcatcataca agttctcagt ttccgaggac ctgcccaaca 720caatgacatt acccttgtaa agtctcaagc gaacctggcc atttaccgta atttgggatg 780gcttaatcat gctacggata tactctgcat tccggagaaa agtaggagcc attgtagagg 840aggcgagagt aagtcggctg taacaaattg gtcacgcaaa tgccgaactt ctttgtccag 900ggtgagaccc tcgagatc 918<210>7<211>20<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 81<400>7Asp Leu Glu Gly Leu Thr Leu Asp Lys Glu Val Arg His Leu Arg Asp1 5 10 15Gln Phe Val Thr20<210>8<211>104
<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 81<400>8Tyr Ser Arg Leu Thr Leu Ala Ser Ser Thr Met Ala Pro Thr Phe Leu1 5 10 15Arg Asn Ala Glu Tyr Ile Arg Ser Met Ile Lys Pro Ser Gln Ile Thr20 25 30Val Asn Gly Gln Val Arg Leu Arg Leu Tyr Lys Gly Asn Val Ile Val35 40 45Leu Gly Arg Ser Ser Glu Thr Glu Asn Leu Tyr Asp Ala Thr Glu Ser50 55 60Ser Met Asp Glu Leu Thr Gly Phe Gln Pro Thr Asp Thr Thr Gly Phe65 70 75 80Ile Ala Ile Gln Ala Ile Arg Met Lys Lys Tyr Gly Gln Ser Lys Lys85 90 95Asp Lys Gly Glu Ser Leu Thr Leu100<210>9<211>2898<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(716)..(1957)<223>
<220>
<221>CDS<222>(2246)..(2839)<223>
<220>
<221>misc_feature<223>Oligo 81<400>9gtgcagtact tcatctgcgt gagaaggggt tcgggcgcac atggttggta aatgaaatgc 60cgtttgttca gaggcgtatc ttctgtagtc aggaactccc gcccgtccaa cgaatgggaa 120acgacaaatt gcgggaacgc gggccttgcc gcatcagagt ttgtataaac aagatcgccc 180
tcctggtaag atataactgg ggcactcatc gcacacttta cccacgcggc ttgtactgat 240ctctctgagc ttgccgacgc cctgaacttt ctgcctgttg caagccatca cgtgacaaaa 300tattacatat cacgtgttac aagcagaacc agtctgagta cggttatgca ttggtccata 360atctgcgcgt gagggtccgc ctgcccgcta ctttgtactc aatgtcccac ttgtgcactt 420ttctttcgtg tcctgcggca ggagtcaccc gccccaatag ttatgctgtc ttagccgcct 480agctacgttg gcgtacacac gtagcgagca ccaacagttt ggtagatcaa gccttaccta 540gctctgtgac tcaaccattc agtcatagtt ctgtttttct gctagtggtc tggtagtgta 600ctcttgcgag aatggctatg agtcactttt tttgattcat gtgataagct tgttcggagt 660atataaacat cccttacgcg tttcgtttgg aagatctctc acatccggaa gcaag atg 718Met1gca cgc gga aag gtt tgc ttg gca tac tca gga ggc ctg gac act tcg 766Ala Arg Gly Lys Val Cys Leu Ala Tyr Ser Gly Gly Leu Asp Thr Ser5 10 15gtg atc ctc gcc tgg tta ctg gag cag ggt tat gaa gtt gta gcg ttt 814Val Ile Leu Ala Trp Leu Leu Glu Gln Gly Tyr Glu Val Val Ala Phe20 25 30atg gct aat gtt ggg caa gag gaa gat ttc cag gct gcg gaa gag aag 862Met Ala Asn Val Gly Gln Glu Glu Asp Phe Gln Ala Ala Glu Glu Lys35 40 45gca ttg aag ata gga gcg tcc aag ttt gtg tgc gtt gac tgc cgt gag 910Ala Leu Lys Ile Gly Ala Ser Lys Phe Val Cys Val Asp Cys Arg Glu50 55 60 65cag ttc gtg acg gat gtc ttg ttt cct gcg gtg cag gtg aac gcg gtg 958Gln Phe Val Thr Asp Val Leu Phe Pro Ala Val Gln Val Asn Ala Val70 75 80tac gaa gat gtt tat cta ctg ggg acg tcg ctt gca cgg ccc gtg att 1006Tyr Glu Asp Val Tyr Leu Leu Gly Thr Ser Leu Ala Arg Pro Val Ile85 90 95gcc aag gca cag atc gac atc gcg gag cag gag cat tgt ttt gcg gtc 1054Ala Lys Ala Gln Ile Asp Ile Ala Glu Gln Glu His Cys Phe Ala Val100 105 110gct cac gga tgc act ggg aag ggc aac gat cag atc cgg ttt gag ctt 1102Ala His Gly Cys Thr Gly Lys Gly Asn Asp Gln Ile Arg Phe Glu Leu115 120 125gcg ttc tac gcg ctg aag cca gac gtc cag gtt atc gcg cca tgg cgg 1150Ala Phe Tyr Ala Leu Lys Pro Asp Val Gln Val Ile Ala Pro Trp Arg130 135 140 145gac cct gcg ttt ttc gac cgg ttt gca ggt aga aat gac ttg cta gag 1198Asp Pro Ala Phe Phe Asp Arg Phe Ala Gly Arg Asn Asp Leu Leu Glu150 155 160tgt gcg gca gag aaa cag ata cct gtt gcg cag acc aag gcc aaa ccg 1246Cys Ala Ala Glu Lys Gln Ile Pro Val Ala Gln Thr Lys Ala Lys Pro165 170 175tgg tct acc gac gag aac gag gcg cat ata tcg tac gag gct gga att 1294Trp Ser Thr Asp Glu Asn Glu Ala His Ile Ser Tyr Glu Ala Gly Ile
180 185 190ttg gag gat ccc gat gtc aca cca ccg gca gac atg tgg aag ctc acg 1342Leu Glu Asp Pro Asp Val Thr Pro Pro Ala Asp Met Trp Lys Leu Thr195 200 205aca gac ccg ctt cga gca cca agt gag cct gag gac gtg acg ttg gtg 1390Thr Asp Pro Leu Arg Ala Pro Ser Glu Pro Glu Asp Val Thr Leu Val210 215 220 225ttc aag gag ggt gtc ccc act cag atg att tac aag gat gga gag gcg 1438Phe Lys Glu Gly Val Pro Thr Gln Met Ile Tyr Lys Asp Gly Glu Ala230 235 240agc aaa ccg ttg gat att ttt ctt gcg gct tcc aaa gtg gcg cgt aga 1486Ser Lys Pro Leu Asp Ile Phe Leu Ala Ala Ser Lys Val Ala Arg Arg245 250 255aac ggc gtt ggc aga atc gac atc gtg gaa aac cgt tac atc aac ctg 1534Asn Gly Val Gly Arg Ile Asp Ile Val Glu Asn Arg Tyr Ile Asn Leu260 265 270aag tcg cgt ggc tgc tac gaa cag gca cca ctg aca ctc ctg cgc cgg 1582Lys Ser Arg Gly Cys Tyr Glu Gln Ala Pro Leu Thr Leu Leu Arg Arg275 280 285gcc cac gtg tat ctc gag ggt ctc acc ctg gac aaa gag gtt cgg cat 1630Ala His Val Tyr Leu Glu Gly Leu Thr Leu Asp Lys Glu Val Arg His290 295 300 305ttg cgt gac caa ttt gtt acg ccg act tac tct cgc ctc ctc tac aat 1678Leu Arg Asp Gln Phe Val Thr Pro Thr Tyr Ser Arg Leu Leu Tyr Asn310 315 320ggc tcc tac ttt tct ccg gaa tgc gag tat atc cgt agc atg att aag 1726Gly Ser Tyr Phe Ser Pro Glu Cys Glu Tyr Ile Arg Ser Met Ile Lys325 330 335cca tcc caa att acg gta aat ggc cag gtt cgc ttg aga ctt tac aag 1774Pro Ser Gln Ile Thr Val Asn Gly Gln Val Arg Leu Arg Leu Tyr Lys340 345 350ggt aat gtc att gtg ttg ggc agg tcc tcg gaa act gag aac ttg tat 1822Gly Asn Val Ile Val Leu Gly Arg Ser Ser Glu Thr Glu Asn Leu Tyr355 360 365gat gcg acg gag tcc tcc atg gac gaa ttg acc gga ttc cag ccg act 1870Asp Ala Thr Glu Ser Ser Met Asp Glu Leu Thr Gly Phe Gln Pro Thr370 375 380 385gat acc act ggt ttc atc gct att caa gca att cgc atg aaa aag tac 1918Asp Thr Thr Gly Phe Ile Ala Ile Gln Ala Ile Arg Met Lys Lys Tyr390 395 400ggt caa tcc aag aag gac aaa ggt gaa tcc ctg act ttg taaattctat 1967Gly Gln Ser Lys Lys Asp Lys Gly Glu Ser Leu Thr Leu405 410ttacattccg aagtagccaa tcagatcaat agaacggcgc gtaaatcagc gactaatact2027tgcggctaga tgagtatcca tccgtcgtca tctgatggcg tgactcagtt gaggctggcg2087cagactttac ttgcctaaat taaagtagtc ttcctccccc cgaggaaacg gcgctatgaa2147atcctccaaa aaggcttttt gcaacattgg tcactaactt tgaacgtaat gcttgtacat2207aaataaggac caggaccaac tgcttcgttc gtttttat atg cta cag tcg ata ttt2263
Met Leu Gln Ser Ile Phe415 420aag cga gta tcg ata cat tcg cgt aat aca ttt agc att cta aga acg 2311Lys Arg Val Ser Ile His Ser Arg Asn Thr Phe Ser Ile Leu Arg Thr425 430 435atg gct act acg aac aac cag ctc agt cag tta tac ttg gcg gaa cgg 2359Met Ala Thr Thr Asn Asn Gln Leu Ser Gln Leu Tyr Leu Ala Glu Arg440 445 450aat gct ccc gtt att atg ctc agc gct cga aaa ttc ttt gaa cag cta 2407Asn Ala Pro Val Ile Met Leu Ser Ala Arg Lys Phe Phe Glu Gln Leu455 460 465act cag aag gag aaa cta tat gcc cac tac ctc gtt aag gcg gcc cat 2455Thr Gln Lys Glu Lys Leu Tyr Ala His Tyr Leu Val Lys Ala Ala His470 475 480tgc ggc tcg cgt gtg gta tta cgc caa gtg tct cac gaa agc gaa tcg 2503Cys Gly Ser Arg Val Val Leu Arg Gln Val Ser His Glu Ser Glu Set485 490 495 500atc ttt gat atg tta cta agt atc cat aaa gtg atg gcc ggg cgc tac 2551Ile Phe Asp Met Leu Leu Ser Ile His Lys Val Met Ala Gly Arg Tyr505 510 515cat gaa tca gaa gag aat act ctc ttc tta gag tat act tct caa ttc 2599His Glu Ser Glu Glu Asn Thr Leu Phe Leu Glu Tyr Thr Ser Gln Phe520 525 530ctt agc aac ttg ggg aac ttc aat tca ttt ggt gac act aag ttt att 2647Leu Ser Asn Leu Gly Asn Phe Asn Ser Phe Gly Asp Thr Lys Phe Ile535 540 545ccg cgc tgt acc caa ggg cac ttc ttt tcc ctt ttg aaa caa gcc ggc 2695Pro Arg Cys Thr Gln Gly His Phe Phe Ser Leu Leu Lys Gln Ala Gly550 555 560ctc gac aag aaa gcg aag cct gcc act aat gga tgt cca ttt aaa acc 2743Leu Asp Lys Lys Ala Lys Pro Ala Thr Asn Gly Cys Pro Phe Lys Thr565 570 575 580tat aaa gaa tta gtg gag att ggc gtc tat gcc gtt gat gcc caa atc 2791Tyr Lys Glu Leu Val Glu Ile Gly Val Tyr Ala Val Asp Ala Gln Ile585 590 595tgc aat gct aag ttt ccc gga tct tgg tcg tac gac ggc tta tta ctt 2839Cys Asn Ala Lys Phe Pro Gly Ser Trp Ser Tyr Asp Gly Leu Leu Leu600 605 610taactgcgtt agtaaagccg acatgcagtt ggttgcagaa ggaggtcttt gccgccctc 2898<210>10<211>414<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 81<400>10Met Ala Arg Gly Lys Val Cys Leu Ala Tyr Ser Gly Gly Leu Asp Thr
1 5 10 15Ser Val Ile Leu Ala Trp Leu Leu Glu Gln Gly Tyr Glu Val Val Ala20 25 30Phe Met Ala Asn Val Gly Gln Glu Glu Asp Phe Gln Ala Ala Glu Glu35 40 45Lys Ala Leu Lys Ile Gly Ala Ser Lys Phe Val Cys Val Asp Cys Arg50 55 60Glu Gln Phe Val Thr Asp Val Leu Phe Pro Ala Val Gln Val Asn Ala65 70 75 80Val Tyr Glu Asp Val Tyr Leu Leu Gly Thr Ser Leu Ala Arg Pro Val85 90 95Ile Ala Lys Ala Gln Ile Asp Ile Ala Glu Gln Glu His Cys Phe Ala100 105 110Val Ala His Gly Cys Thr Gly Lys Gly Asn Asp Gln Ile Arg Phe Glu115 120 125Leu Ala Phe Tyr Ala Leu Lys Pro Asp Val Gln Val Ile Ala Pro Trp130 135 140Arg Asp Pro Ala Phe Phe Asp Arg Phe Ala Gly Arg Asn Asp Leu Leu145 150 155 160Glu Cys Ala Ala Glu Lys Gln Ile Pro Val Ala Gln Thr Lys Ala Lys165 170 175Pro Trp Ser Thr Asp Glu Asn Glu Ala His Ile Ser Tyr Glu Ala Gly180 185 190Ile Leu Glu Asp Pro Asp Val Thr Pro Pro Ala Asp Met Trp Lys Leu195 200 205Thr Thr Asp Pro Leu Arg Ala Pro Ser Glu Pro Glu Asp Val Thr Leu210 215 220Val Phe Lys Glu Gly Val Pro Thr Gln Met Ile Tyr Lys Asp Gly Glu225 230 235 240Ala Ser Lys Pro Leu Asp Ile Phe Leu Ala Ala Ser Lys Val Ala Arg245 250 255Arg Asn Gly Val Gly Arg Ile Asp Ile Val Glu Asn Arg Tyr Ile Asn260 265 270
Leu Lys Ser Arg Gly Cys Tyr Glu Gln Ala Pro Leu Thr Leu Leu Arg275 280 285Arg Ala His Val Tyr Leu Glu Gly Leu Thr Leu Asp Lys Glu Val Arg290 295 300His Leu Arg Asp Gln Phe Val Thr Pro Thr Tyr Ser Arg Leu Leu Tyr305 310 315 320Asn Gly Ser Tyr Phe Ser Pro Glu Cys Glu Tyr Ile Arg Ser Met Ile325 330 335Lys Pro Ser Gln Ile Thr Val Asn Gly Gln Val Arg Leu Arg Leu Tyr340 345 350Lys Gly Asn Val Ile Val Leu Gly Arg Ser Ser Glu Thr Glu Asn Leu355 360 365Tyr Asp Ala Thr Glu Ser Ser Met Asp Glu Leu Thr Gly Phe Gln Pro370 375 380Thr Asp Thr Thr Gly Phe Ile Ala Ile Gln Ala Ile Arg Met Lys Lys385 390 395 400Tyr Gly Gln Ser Lys Lys Asp Lys Gly Glu Ser Leu Thr Leu405 410<210>11<211>198<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 81<400>11Met Leu Gln Ser Ile Phe Lys Arg Val Ser Ile His Ser Arg Asn Thr1 5 10 15Phe Ser Ile Leu Arg Thr Met Ala Thr Thr Asn Asn Gln Leu Ser Gln20 25 30Leu Tyr Leu Ala Glu Arg Asn Ala Pro Val Ile Met Leu Ser Ala Arg35 40 45Lys Phe Phe Glu Gln Leu Thr Gln Lys Glu Lys Leu Tyr Ala His Tyr50 55 60Leu Val Lys Ala Ala His Cys Gly Ser Arg Val Val Leu Arg Gln Val65 70 75 80
Ser His Glu Ser Glu Ser Ile Phe Asp Met Leu Leu Ser Ile His Lys85 90 95Val Met Ala Gly Arg Tyr His Glu Ser Glu Glu Asn Thr Leu Phe Leu100 105 110Glu Tyr Thr Ser Gln Phe Leu Ser Asn Leu Gly Asn Phe Asn Ser Phe115 120 125Gly Asp Thr Lys Phe Ile Pro Arg Cys Thr Gln Gly His Phe Phe Ser130 135 140Leu Leu Lys Gln Ala Gly Leu Asp Lys Lys Ala Lys Pro Ala Thr Asn145 150 155 160Gly Cys Pro Phe Lys Thr Tyr Lys Glu Leu Val Glu Ile Gly Val Tyr165 170 175Ala Val Asp Ala Gln Ile Cys Asn Ala Lys Phe Pro Gly Ser Trp Ser180 185 190Tyr Asp Gly Leu Leu Leu195<210>12<211>139<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 86<400>12gatccggtca gtagccacaa acagcaacgt ctcctgatca acctcgtaga tatcccgcac 60cttaccacgc gccactaacg gcaggatgcc gcccagctgt gtctgcacta tgctcatttt 120tgttcgccgc ccccagatc 139<210>13<211>39<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 86<400>13Met Ser Ile Val Gln Thr Gln Leu Gly Gly Ile Leu Pro Leu Val Ala1 5 10 15
Arg Gly Lys Val Arg Asp Ile Tyr Glu Val Asp Gln Glu Thr Leu Leu20 25 30Phe Val Ala Thr Asp Arg Ile35<210>14<211>1671<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(587)..(1492)<223>
<220>
<221>misc_feature<223>Oligo 86<400>14taacccttgc ccggttcgct gcgctgcttc gcgtgcttgc tgttttcgtc accgtttcga 60tctacgaaat gtgtgcaaca agccgaaaaa gcaaaccacc cgctccactg actatctgtt 120tatgcttaga cgccgcaaac ttgtttctct ttgggcctac tctttgattc ctggctcaga 180gccttcccta agtaaggaat ttcaactact tgtatatcaa agccttgcta caattgcctt 240ctacggcctc aattaccacg aatgcactaa gcagctcagc tgttcccctt gttatgaaac 300gaaatcatca acagctaaca aatgcctagc tttactcctg tgacaagctg ccttcacgtt 360tctttttcaa ccgttgacaa tgacgattaa gtaacaatgc gtctcgagga atttgctcga 420ggtcgggtgg ggcagccgcg aaatgtagaa tgcacggcag tatgactcca ggcagcgcga 480gcttgactct ggtctatggc caatttaaca gccccatata gacaagatat atatagagag 540atagcagata gtcccatctg gaacgatctg ggggcggcga acaaaa atg agc ata595Met Ser Ile1gtg cag aca cag ctg ggc ggc atc ctg ccg tta gtg gcg cgt ggt aag 643Val Gln Thr Gln Leu Gly Gly Ile Leu Pro Leu Val Ala Arg Gly Lys5 10 15gtg cgg gat atc tac gag gtt gat cag gag acg ttg ctg ttt gtg gct 691Val Arg Asp Ile Tyr Glu Val Asp Gln Glu Thr Leu Leu Phe Val Ala20 25 30 35act gac cgg atc tcg gcc tat gat gtg atc atg gcg aat gct atc ccc 739Thr Asp Arg Ile Ser Ala Tyr Asp Val Ile Met Ala Asn Ala Ile Pro40 45 50gac aag ggt gtg ctg ttg acg cgg ctg tct gag ttc tgg ttt aaa ttc 787Asp Lys Gly Val Leu Leu Thr Arg Leu Ser Glu Phe Trp Phe Lys Phe55 60 65ttg gag aaa gac gtc cgc aac cac ctc cgg gcg ccg tgt gag ggg ctt 835Leu Glu Lys Asp Val Arg Asn His Leu Arg Ala Pro Cys Glu Gly Leu
70 75 80ttt ggt ggt cta cct gat gcg cta acg tca ccc gag tac cgc tca cag 883Phe Gly Gly Leu Pro Asp Ala Leu Thr Ser Pro Glu Tyr Arg Ser Gln85 90 95cta gag ggg cgg agc ctg ctc gtg caa cgg tac cgg ttg ara cca ctt 931Leu Glu Gly Arg Ser Leu Leu Val Gln Arg Tyr Arg Leu Ile Pro Leu100 105 110 115gag gtc atc gtg cgc ggt tac att acg ggc tct gcc tgg aag gag tac 979Glu Val Ile Val Arg Gly Tyr Ile Thr Gly Ser Ala Trp Lys Glu Tyr120 125 130cag gag cgc ggc aca gtg cat ggc ctg gct cta cct gcc ggg ctg cgt 1027Gln Glu Arg Gly Thr Val His Gly Leu Ala Leu Pro Ala Gly Leu Arg135 140 145gag tct gag gag tta ccc gag ccg atg ttc act ccg tct acc aaa gcg 1075Glu Ser Glu Glu Leu Pro Glu Pro Met Phe Thr Pro Ser Thr Lys Ala150 155 160gag cag ggt gcg cac gat gag aat ata tca cca gca cag gct gca gac 1123Glu Gln Gly Ala His Asp Glu Asn Ile Ser Pro Ala Gln Ala Ala Asp165 170 175cta att ggg cag gag ctt tgt gac cgc gtg gct gcc ttg gca att cgc 1171Leu Ile Gly Gln Glu Leu Cys Asp Arg Val Ala Ala Leu Ala Ile Arg180 185 190 195ttg tat tcg aag tgc aag aag tat gcc agg gag cgc ggc att att att 1219Leu Tyr Ser Lys Cys Lys Lys Tyr Ala Arg Glu Arg Gly Ile Ile Ile200 205 210gca gac acg aag ttt gag ttt ggc att gat gac aag tca ggc gag att 1267Ala Asp Thr Lys Phe Glu Phe Gly Ile Asp Asp Lys Set Gly Glu Ile215 220 225gtt ctt gtc gat gag gtc ttg acc cca gat tct tct cgt ttc tgg aat 1315Val Leu Val Asp Glu Val Leu Thr Pro Asp Ser Ser Arg Phe Trp Asn230 235 240gct gcg aac tac gaa gtt ggt aag cct cag gat tca tat gat aaa cag 1363Ala Ala Asn Tyr Glu Val Gly Lys Pro Gln Asp Ser Tyr Asp Lys Gln245 250 255ttt ttg cgc aat tgg ctc act agc aac aag ttg aat ggt gtc gat ggg 1411Phe Leu Arg Asn Trp Leu Thr Ser Asn Lys Leu Asn Gly Val Asp Gly260 265 270 275gtc agc atg ccc gag gag atc gtg acg cgc acg aag gag aaa tat gtt 1459Val Ser Met Pro Glu Glu Ile Val Thr Arg Thr Lys Glu Lys Tyr Val280 285 290gag gcc tac gaa gca ctt aca ggc gcg aaa tgg taaaatgatg tacttttaaa1512Glu Ala Tyr Glu Ala Leu Thr Gly Ala Lys Trp295 300atgttaaata attttaagtg ataaatggag atgtgaaatt tatgacctcc atgggttagt1572tggggtgcgc acatggtacc ttgcatggat atctggtacg tcctgaatac gtttgccact1632caccagctcc cggggccgct tttctactgc caactcaaa 1671<210>15<211>302
<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 86<400>15Met Ser Ile Val Gln Thr Gln Leu Gly Gly Ile Leu Pro Leu Val Ala1 5 10 15Arg Gly Lys Val Arg Asp Ile Tyr Glu Val Asp Gln Glu Thr Leu Leu20 25 30Phe Val Ala Thr Asp Arg Ile Ser Ala Tyr Asp Val Ile Met Ala Asn35 40 45Ala Ile Pro Asp Lys Gly Val Leu Leu Thr Arg Leu Ser Glu Phe Trp50 55 60Phe Lys Phe Leu Glu Lys Asp Val Arg Asn His Leu Arg Ala Pro Cys65 70 75 80Glu Gly Leu Phe Gly Gly Leu Pro Asp Ala Leu Thr Ser Pro Glu Tyr85 90 95Arg Ser Gln Leu Glu Gly Arg Ser Leu Leu Val Gln Arg Tyr Arg Leu100 105 110Ile Pro Leu Glu Val Ile Val Arg Gly Tyr Ile Thr Gly Ser Ala Trp115 120 125Lys Glu Tyr Gln Glu Arg Gly Thr Val His Gly Leu Ala Leu Pro Ala130 135 140Gly Leu Arg Glu Ser Glu Glu Leu Pro Glu Pro Met Phe Thr Pro Ser145 150 155 160Thr Lys Ala Glu Gln Gly Ala His Asp Glu Asn Ile Ser Pro Ala Gln165 170 175Ala Ala Asp Leu Ile Gly Gln Glu Leu Cys Asp Arg Val Ala Ala Leu180 185 190Ala Ile Arg Leu Tyr Ser Lys Cys Lys Lys Tyr Ala Arg Glu Arg Gly195 200 205Ile Ile Ile Ala Asp Thr Lys Phe Glu Phe Gly Ile Asp Asp Lys Ser210 215 220Gly Glu Ile Val Leu Val Asp Glu Val Leu Thr Pro Asp Ser Ser Arg
225 230 235 240Phe Trp Asn Ala Ala Asn Tyr Glu Val Gly Lys Pro Gln Asp Ser Tyr245 250 255Asp Lys Gln Phe Leu Arg Asn Trp Leu Thr Ser Asn Lys Leu Asn Gly260 265 270Val Asp Gly Val Ser Met Pro Glu Glu Ile Val Thr Arg Thr Lys Glu275 280 285Lys Tyr Val Glu Ala Tyr Glu Ala Leu Thr Gly Ala Lys Trp290 295 300<210>16<211>1325<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 162<400>16gatctcgaac tggcggatga tgcagtccaa ggactacgct acatggacaa ggccggggca 60cagcacatat tgcacacgaa gaatgtagtt ttctgtactg gcgggtttgg gtcgtccaag 120gagttgttgg ggaagtatgc cccccatctc cgggaccttc ctacaacaaa cgcgcagggt 180actacgggag atggacagga cctgatgctc cgtgttggtg ggcagctgat tgatatggag 240catatccagg tacaccccac gagttttgtg gatcctaaag ataaagacag cggtagcaaa 300ttcctggcgg ctgaggcact gcgcggcaat ggaggtgtgc ttttaaaccc cagcactggc 360cggcgcttta cgaacgaatt ggcgacacgt gatgtactta cggctagcat tcaagagcac 420tgcaaagagc atgtggctta ccttgttctg agccaagggg catatgaaac tttgcaaagc 480tttgtcaact tctacatctc taaagggctg atgcgagcgt ccaccgttgg cgagctttcc 540gacgagatcg gagttccgaa acaacagctg gcgtcggagc tagaggcgta ctccgccgca 600gaggtggatc aattccagcg tcggcacatt atcaatgatt ttggcccgag tgttgatggg 660tcgacagcaa tatatgttgg cttgatcaca cccgcagtcc attttaccat gggcggtgtt 720cgaatcaatt ccagagcgga agtgctgagc agcgcaggga cgacctataa agggctttac 780gccgctggag aggtatccgg cggcgtgcac ggtagaaaca ggctgggtgg gtctagtctc 840ctggagtgcg tcgttttcgg gaggcaggca gcaacatcga ttacagaaag gttgcaggcg 900tgaactctag caaccctggc tcagtaacag acagtttttg cctgaaatgt gtcatttaaa 960taacagcaga tagtaggtag catacaaaat taattagaga cgtcaattaa tactgcaatt1020aggaaactag ggatatcaac tataattatt aaaaacgtcg agtaaaaaga attaattgga1080
cggtccttga aatagagccg aagaagctga agaagaacag taaatagtga atacgatgag1140aaaggccttc aggtgccgct tttgagtggg tagacataaa gcattttggt ttcttagatc1200aatcgaaagg aatgtgcgtc cttggatatt ttgatgctct ttttaggtac aggtggactg1260ccaaaaaatg gcttgttcgc tagcctaatg ggtattattg cgtgaccaat ctgccgtagt1320cagtt1325<210>17<211>294<212>PRT<213>棉桃阿舒氏囊霉<220>
<221> misc_feature<223>Oligo 162<400>17Asp Leu Glu Leu Ala Asp Asp Ala Val Gln Gly Leu Arg Tyr Met Asp1 5 10 15Lys Ala Gly Ala Gln His Ile Leu His Thr Lys Asn Val Val Phe Cys20 25 30Thr Gly Gly Phe Gly Ser Ser Lys Glu Leu Leu Gly Lys Tyr Ala Pro35 40 45His Leu Arg Asp Leu Pro Thr Thr Asn Ala Gln Gly Thr Thr Gly Asp50 55 60Gly Gln Asp Leu Met Leu Arg Val Gly Gly Gln Leu Ile Asp Met Glu65 70 75 80His Ile Gln Val His Pro Thr Ser Phe Val Asp Pro Lys Asp Lys Asp85 90 95Ser Gly Ser Lys Phe Leu Ala Ala Glu Ala Leu Arg Gly Asn Gly Gly100 105 110Val Leu Leu Asn Pro Ser Thr Gly Arg Arg Phe Thr Asn Glu Leu Ala115 120 125Thr Arg Asp Val Leu Thr Ala Ser Ile Gln Glu His Cys Lys Glu His130 135 140Val Ala Tyr Leu Val Leu Ser Gln Gly Ala Tyr Glu Thr Leu Gln Ser145 150 155 160Phe Val Asn Phe Tyr Ile Ser Lys Gly Leu Met Arg Ala Ser Thr Val165 170 175
Gly Glu Leu Ser Asp Glu Ile Gly Val Pro Lys Gln Gln Leu Ala Ser180 185 190Glu Leu Glu Ala Tyr Ser Ala Ala Glu Val Asp Gln Phe Gln Arg Arg195 200 205His Ile Ile Asn Asp Phe Gly Pro Ser Val Asp Gly Ser Thr Ala Ile210 215 220Tyr Val Gly Leu Ile Thr Pro Ala Val His Phe Thr Met Gly Gly Val225 230 235 240Arg Ile Asn Ser Arg Ala Glu Val Leu Ser Ser Ala Gly Thr Thr Tyr245 250 255Lys Gly Leu Tyr Ala Ala Gly Glu Val Ser Gly Gly Val His Gly Arg260 265 270Asn Arg Leu Gly Gly Ser Ser Leu Leu Glu Cys Val Val Phe Gly Arg275 280 285Gln Ala Ala Thr Ser Ile290<210>18<211>2754<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(264)..(1772)<223>
<220>
<221>misc_feature<223>Oligo 162<400>18tcgtggacca tttgtcgcac tggcgtgatg tctgtaaaag gaacggttac cgggatcacg 60ccataccagc tgctcccacg gctcgaaaag tagtacaaat aggtctatag cgacggtgtg 120cggcggcatc tgctgatttc ggaattcgct gtagtcaacg gcgctggata caggggcacc 180attcaggata cccagattta caggaaagct agtcgtatgg acaacttcgc ccgtgcagca 240gtatatttat ttgcatgtga aca atg tta aga ggg cgt agc aag aca gtg ctg 293Met Leu Arg Gly Arg Ser Lys Thr Val Leu1 5 10aca ttg ata ctg tta ctt gta acg gtc aga ctc ctg ttt aat cgc cta 341Thr Leu Ile Leu Leu Leu Val Thr Val Arg Leu Leu Phe Asn Arg Leu15 20 25
cgt tcg aga ggc cca gaa agc aat cgg agg ata gac atg tct ggt aaa 389Arg Ser Arg Gly Pro Glu Ser Asn Arg Arg Ile Asp Met Ser Gly Lys30 35 40gtt cag cct gtt gtc gtc gtc gga ctg ggt ctt gcc ggt ctg tcg act 437Val Gln Pro Val Val Val Val Gly Leu Gly Leu Ala Gly Leu Ser Thr45 50 55ggg gcg cag cta gtc aag aat ggg gtg ccg gtg atc ttg atg gac aag 485Gly Ala Gln Leu Val Lys Asn Gly Val Pro Val Ile Leu Met Asp Lys60 65 70gtt tct gcc atc ggc gga aat tcc gtt aag gcc tcc agc ggc ata aac 533Val Ser Ala Ile Gly Gly Asn Ser Val Lys Ala Ser Ser Gly Ile Asn75 80 85 90ggc gat ggt act cag gtg cag gag ctt ctt ggt gtg tat gac tct gct 581Gly Asp Gly Thr Gln Val Gln Glu Leu Leu Gly Val Tyr Asp Ser Ala95 100 105gac tcc ttc tac aga gac acc gtt gcg tcg gcg aag ggt gcc ggc gcc 629Asp Ser Phe Tyr Arg Asp Thr Val Ala Ser Ala Lys Gly Ala Gly Ala110 115 120agc gag cta atg gac aag ctt gca agg gac tcc gca ggt gct gta tcg 677Ser Glu Leu Met Asp Lys Leu Ala Arg Asp Ser Ala Gly Ala Val Ser125 130 135tgg ctg cag aat gaa ttt gga gtt aaa ctg gac atc ctt tcg caa ctg 725Trp Leu Gln Asn Glu Phe Gly Val Lys Leu Asp Ile Leu Ser Gln Leu140 145 150gga ggg cat tcg aag gct agg aca cat cgg tcg agc agc aac ata ccc 773Gly Gly His Ser Lys Ala Arg Thr His Arg Ser Ser Ser Asn Ile Pro155 160 165 170cca ggg ttt gag atc ata tcg gcc atg cgc aag aga ctg gag tca gtg 821Pro Gly Phe Glu Ile Ile Ser Ala Met Arg Lys Arg Leu Glu Ser Val175 180 185cag aag gaa aac cca gct ctc gtg aac ttc cgc ttg gag agc aaa gtt 869Gln Lys Glu Asn Pro Ala Leu Val Asn Phe Arg Leu Glu Ser Lys Val190 195 200gtt gat ctc gaa ctg gcg gat gat gca gtc caa gga cta cgc tac atg 917Val Asp Leu Glu Leu Ala Asp Asp Ala Val Gln Gly Leu Arg Tyr Met205 210 215gac aag gcc ggg gca cag cac ata ttg cac acg aag aat gta gtt ttc 965Asp Lys Ala Gly Ala Gln His Ile Leu His Thr Lys Asn Val Val Phe220 225 230tgt act ggc ggg ttt ggg tcg tcc aag gag ttg ttg ggg aag tat gcc 1013Cys Thr Gly Gly Phe Gly Ser Ser Lys Glu Leu Leu Gly Lys Tyr Ala235 240 245 250ccc cat ctc cgg gac ctt cct aca aca aac gcg cag ggt act acg gga 1061Pro His Leu Arg Asp Leu Pro Thr Thr Asn Ala Gln Gly Thr Thr Gly255 260 265gat gga cag gac ctg atg ctc cgt gtt ggt ggg cag ctg att gat atg 1109Asp Gly Gln Asp Leu Met Leu Arg Val Gly Gly Gln Leu Ile Asp Met270 275 280gag cat atc cag gta cac ccc acg agt ttt gtg gat cct aaa gat aaa 1157Glu His Ile Gln Val His Pro Thr Ser Phe Val Asp Pro Lys Asp Lys285 290 295
gac agc ggt agc aaa ttc ctg gcg gct gag gca ctg cgc ggc aat gga 1205Asp Ser Gly Ser Lys Phe Leu Ala Ala Glu Ala Leu Arg Gly Asn Gly300 305 310ggt gtg ctt tta aac ccc agc act ggc cgg cgc ttt acg aac gaa ttg 1253Gly Val Leu Leu Asn Pro Ser Thr Gly Arg Arg Phe Thr Asn Glu Leu315 320 325 330gcg aca cgt gat gta ctt acg gct agc att caa gag cac tgc aaa gag 1301Ala Thr Arg Asp Val Leu Thr Ala Ser Ile Gln Glu His Cys Lys Glu335 340 345cat gtg gct tac ctt gtt ctg agc caa ggg gca tat gaa act ttg caa 1349His Val Ala Tyr Leu Val Leu Ser Gln Gly Ala Tyr Glu Thr Leu Gln350 355 360agc ttt gtc aac ttc tac atc tct aaa ggg ctg atg cga gcg tcc acc 1397Ser Phe Val Asn Phe Tyr Ile Ser Lys Gly Leu Met Arg Ala Ser Thr365 370 375gtt ggc gag ctt tcc gac gag atc gga gtt ccg aaa caa cag ctg gcg 1445Val Gly Glu Leu Ser Asp Glu Ile Gly Val Pro Lys Gln Gln Leu Ala380 385 390tcg gag cta gag gcg tac tcc gcc gca gag gtg gat caa ttc cag cgt 1493Ser Glu Leu Glu Ala Tyr Ser Ala Ala Glu Val Asp Gln Phe Gln Arg395 400 405 410cgg cac att atc aat gat ttt ggc ccg agt gtt gat ggg tcg aca gca 1541Arg His Ile Ile Asn Asp Phe Gly Pro Ser Val Asp Gly Ser Thr Ala415 420 425ata tat gtt ggc ttg atc aca ccc gca gtc cat ttt acc atg ggc ggt 1589Ile Tyr Val Gly Leu Ile Thr Pro Ala Val His Phe Thr Met Gly Gly430 435 440gtt cga atc aat tcc aga gcg gaa gtg ctg agc agc gca ggg acg acc 1637Val Arg Ile Asn Ser Arg Ala Glu Val Leu Ser Ser Ala Gly Thr Thr445 450 455tat aaa ggg ctt tac gcc gct gga gag gta tcc ggc ggc gtg cac ggt 1685Tyr Lys Gly Leu Tyr Ala Ala Gly Glu Val Ser Gly Gly Val His Gly460 465 470aga aac agg ctg ggt ggg tct agt ctc ctg gag tgc gtc gtt ttc ggg 1733Arg Asn Arg Leu Gly Gly Ser Ser Leu Leu Glu Cys Val Val Phe Gly475 480 485 490agg cag gca gca aca tcg att aca gaa agg ttg cag gcg tgaactctag 1782Arg Gln Ala Ala Thr Ser Ile Thr Glu Arg Leu Gln Ala495 500caaccctggc tcagtaacag acagtttttg cctgaaatgt gtcatttaaa taacagcaga1842tagtaggtag catacaaaat taattagaga cgtcaattaa tactgcaatt aggaaactag1902ggatatcaac tataattatt aaaaacgtcg agtaaaaaga attaattgga cggtccttga1962aatagagccg aagaagctga agaagaacag taaatagtga atacgatgag aaaggccttc2022aggtgccgct tttgagtggg tagacataaa gcattttggt ttcttagatc aatcgaaagg2082aatgtgcgtc cttggatatt ttgatgctct ttttaggtac aggtggactg ccaaaaaatg2142gcttgttcgc tagcctaatg ggtattattg cgtgaccaat ctgccgtagt cagttagagg2202
gattcgtcat ccacagtgtt cttagttttc ctaatcttga aaaacttcac accgctctgg2262tgccgctgag gctctgcgac aggggcctgc accgggcgca cgtcattgac gggcacagcg2322ccgccctcaa gctcggggtt cgtgtcgtac acaatcgagt ggtccatctg gccatcgctc2382ccgtgcttgg tgccctggta cttgagcgcc tgctccttgt agtgctgcat ctcaacgtac2442tccttgtgtg cggtccacgc gcggcggatg aaggagatcc cgctgaagaa gaagaccagc2502agcgagcacg ccacactggc ccacgcaatc cccatcagct ccggcccgat cttcgcctcg2562cgcccgtcgt cgcggaacac gttgcgcgcc atcacaacaa ccgccgtctg gcacgccact2622gtcgctacgt tgaacacgca cccgatcagc accatggtga aaccaccttg gtgaacgagt2682tcgagcacca cgtgaacaca cagaacaaaa aacgcaattc gcaatgaaac gacagcgcga2742tccagaagag ca2754<210>19<211>503<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>O1igo 162<400>19Met Leu Arg Gly Arg Ser Lys Thr Val Leu Thr Leu Ile Leu Leu Leu1 5 10 15Val Thr Val Arg Leu Leu Phe Asn Arg Leu Arg Ser Arg Gly Pro Glu20 25 30Ser Asn Arg Arg Ile Asp Met Ser Gly Lys Val Gln Pro Val Val Val35 40 45Val Gly Leu Gly Leu Ala Gly Leu Ser Thr Gly Ala Gln Leu Val Lys50 55 60Asn Gly Val Pro Val Ile Leu Met Asp Lys Val Ser Ala Ile Gly Gly65 70 75 80Asn Ser Val Lys Ala Ser Ser Gly Ile Asn Gly Asp Gly Thr Gln Val85 90 95Gln Glu Leu Leu Gly Val Tyr Asp Ser Ala Asp Ser Phe Tyr Arg Asp100 105 110Thr Val Ala Ser Ala Lys Gly Ala Gly Ala Ser Glu Leu Met Asp Lys115 120 125Leu Ala Arg Asp Ser Ala Gly Ala Val Ser Trp Leu Gln Asn Glu Phe130 135 140
Gly Val Lys Leu Asp Ile Leu Ser Gln Leu Gly Gly His Ser Lys Ala145 150 155 160Arg Thr His Arg Ser Ser Ser Asn Ile Pro Pro Gly Phe Glu Ile Ile165 170 175Ser Ala Met Arg Lys Arg Leu Glu Ser Val Gln Lys Glu Asn Pro Ala180 185 190Leu Val Asn Phe Arg Leu Glu Ser Lys Val Val Asp Leu Glu Leu Ala195 200 205Asp Asp Ala Val Gln Gly Leu Arg Tyr Met Asp Lys Ala Gly Ala Gln210 215 220His Ile Leu His Thr Lys Asn Val Val Phe Cys Thr Gly Gly Phe Gly225 230 235 240Ser Ser Lys Glu Leu Leu Gly Lys Tyr Ala Pro His Leu Arg Asp Leu245 250 255Pro Thr Thr Asn Ala Gln Gly Thr Thr Gly Asp Gly Gln Asp Leu Met260 265 270Leu Arg Val Gly Gly Gln Leu Ile Asp Met Glu His Ile Gln Val His275 280 285Pro Thr Ser Phe Val Asp Pro Lys Asp Lys Asp Ser Gly Ser Lys Phe290 295 300Leu Ala Ala Glu Ala Leu Arg Gly Asn Gly Gly Val Leu Leu Asn Pro305 310 315 320Ser Thr Gly Arg Arg Phe Thr Asn Glu Leu Ala Thr Arg Asp Val Leu325 330 335Thr Ala Ser Ile Gln Glu His Cys Lys Glu His Val Ala Tyr Leu Val340 345 350Leu Ser Gln Gly Ala Tyr Glu Thr Leu Gln Ser Phe Val Asn Phe Tyr355 360 365Ile Ser Lys Gly Leu Met Arg Ala Ser Thr Val Gly Glu Leu Ser Asp370 375 380Glu Ile Gly Val Pro Lys Gln Gln Leu Ala Ser Glu Leu Glu Ala Tyr385 390 395 400Ser Ala Ala Glu Val Asp Gln Phe Gln Arg Arg His Ile Ile Asn Asp
405 410 415Phe Gly Pro Ser Val Asp Gly Ser Thr Ala Ile Tyr Val Gly Leu Ile420 425 430Thr Pro Ala Val His Phe Thr Met Gly Gly Val Arg Ile Asn Ser Arg435 440 445Ala Glu Val Leu Ser Ser Ala Gly Thr Thr Tyr Lys Gly Leu Tyr Ala450 455 460Ala Gly Glu Val Ser Gly Gly Val His Gly Arg Asn Arg Leu Gly Gly465 470 475 480Ser Ser Leu Leu Glu Cys Val Val Phe Gly Arg Gln Ala Ala Thr Ser485 490 495Ile Thr Glu Arg Leu Gln Ala500<210>20<211>1060<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 178<400>20gatcaatttc cggtgctggt ccgcagacaa ggtcgtctta ccagtgccgc tcaagccgaa 60gaagagcgtc acatcgttgt tggggccctg gttggcggag gagtgcaatg tcaagacgtt 120gtggttgata ggcatcaagt agaacatcac cgtgaagata cccttcttca tctcaccagc 180gtactccgtg ccaaggatga ccatctccat cgccctgaag ttgatttcga cagtggtctt 240cgaggacata ccctcagtgt gcgtgttcgc tgggaactgg cccgcgttcc acacggtgaa 300gtctggctcg ccgaactccg caagctcctc ttcggtcggc ctgatcaaca tgttggtcat 360gaacaacgcg tggtatgcgc ggcagcacac aatccggatc ttgatgcggt agcgggggtc 420ccagcccgcg tacgcatcca cgatgtatag gtgctcgcgg gtacgcaaga agtctgcggc 480acgctcgcgg ttgatcaacc acgtcttctc cgacgccttg cggttcactg gaccccacca 540aatattgtca gacgacgtgg gctcgtccac gatccgcttg tccttaggcg accgacccgt 600cttttcccca gagtacgcaa tcaacgcgcc agtgctggag attgctgtct tgcgctccgc 660tagcgcatct tcgtacaaca ccgcggccgg cgcattgcgc cgaatcgtca aaacgcccga 720gctgagccca agctcagcgc ggatcttctc ctctggtgtt tggtatacct ttgatggcga 780catagtgaac ttattggcct gctagctctc ctctgtgtag ctgaagcttg tccacttgag 840
acatgccatc tactacgcta gatgcctcta tttatacacg ccgaagcaca aggactgaaa 900attacgtcta cttggctgtt tgccgcagcg cccagtctct ggccgttcca ctgtgttcta 960cgcggcctgc aacagcgctg tcgctagcac aaactacgtc gcggacctat ggatgaagca1020agtacagcgg tttcgctgtg ctatccgttt ttcgccgatc 1060<210>21<211>261<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 178<400>21Met Ser Pro Ser Lys Val Tyr Gln Thr Pro Glu Glu Lys Ile Arg Ala1 5 10 15Glu Leu Gly Leu Ser Ser Gly Val Leu Thr Ile Arg Arg Asn Ala Pro20 25 30Ala Ala Val Leu Tyr Glu Asp Ala Leu Ala Glu Arg Lys Thr Ala Ile35 40 45Ser Ser Thr Gly Ala Leu Ile Ala Tyr Ser Gly Glu Lys Thr Gly Arg50 55 60Ser Pro Lys Asp Lys Arg Ile Val Asp Glu Pro Thr Ser Ser Asp Asn65 70 75 80Ile Trp Trp Gly Pro Val Asn Arg Lys Ala Ser Glu Lys Thr Trp Leu85 90 95Ile Asn Arg Glu Arg Ala Ala Asp Phe Leu Arg Thr Arg Glu His Leu100 105 110Tyr Ile Val Asp Ala Tyr Ala Gly Trp Asp Pro Arg Tyr Arg Ile Lys115 120 125Ile Arg Ile Val Cys Cys Arg Ala Tyr His Ala Leu Phe Met Thr Asn130 135 140Met Leu Ile Arg Pro Thr Glu Glu Glu Leu Ala Glu Phe Gly Glu Pro145 150 155 160Asp Phe Thr Val Trp Asn Ala Gly Gln Phe Pro Ala Asn Thr His Thr165 170 175Glu Gly Met Ser Ser Lys Thr Thr Val Glu Ile Asn Phe Arg Ala Met
180 185 190Glu Met Val Ile Leu Gly Thr Glu Tyr Ala Gly Glu Met Lys Lys Gly195 200 205Ile Phe Thr Val Met Phe Tyr Leu Met Pro Ile Asn His Asn Val Leu210 215 220Thr Leu His Ser Ser Ala Asn Gln Gly Pro Asn Asn Asp Val Thr Leu225 230 235 240Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr Leu Ser Ala Asp Gln245 250 255His Arg Lys Leu Ile260<210>22<211>2240<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(394)..(2016)<223>
<220>
<221>misc_feature<223>Oligo 178<400>22ccagcacaaa aaagagccgc gctgctccgg gcagccgccg gcagacggag ccgagcactt 60accgaaaggc ctttccaaca gctgctaaat gtgggggatt gattcgcatg cttccggatc 120ggcgaaaaac ggatagcaca gcgaaaccgc tgtacttgct tcatccatag gtccgcgacg 180tagtttgtgc tagcgacagc gctgttgcag gccgcgtaga acacagtgga acggccagag 240actgggcgct gcggcaaaca gccaagtaga cgtaattttc agtccttgtg cttcggcgtg 300tataaataga ggcatctagc gtagtagatg gcatgtctca agtggacaag cttcagctac 360acagaggaga gctagcaggc caataagttc act atg tcg cca tca aag gta tac 414Met Ser Pro Ser Lys Val Tyr1 5caa aca cca gag gag aag atc cgc gct gag ctt ggg ctc agc tcg ggc 462Gln Thr Pro Glu Glu Lys Ile Arg Ala Glu Leu Gly Leu Ser Ser Gly10 15 20gtt ttg acg att cgg cgc aat gcg ccg gcc gcg gtg ttg tac gaa gat 510Val Leu Thr Ile Arg Arg Asn Ala Pro Ala Ala Val Leu Tyr Glu Asp25 30 35gcg cta gcg gag cgc aag aca gca atc tcc agc act ggc gcg ttg att 558Ala Leu Ala Glu Arg Lys Thr Ala Ile Ser Ser Thr Gly Ala Leu Ile
40 45 50 55gcg tac tct ggg gaa aag acg ggt cgg tcg cct aag gac aag cgg atc 606Ala Tyr Ser Gly Glu Lys Thr Gly Arg Ser Pro Lys Asp Lys Arg Ile60 65 70gtg gac gag ccc acg tcg tct gac aat att tgg tgg ggt cca gtg aac 654Val Asp Glu Pro Thr Ser Ser Asp Asn Ile Trp Trp Gly Pro Val Asn75 80 85cgc aag gcg tcg gag aag acg tgg ttg atc aac cgc gag cgt gcc gca 702Arg Lys Ala Ser Glu Lys Thr Trp Leu Ile Asn Arg Glu Arg Ala Ala90 95 100gac ttc ttg cgt acc cgc gag cac cta tac atc gtg gat gcg tac gcg 750Asp Phe Leu Arg Thr Arg Glu His Leu Tyr Ile Val Asp Ala Tyr Ala105 110 115ggc tgg gac ccc cgc tac cgc atc aag atc cgg att gtg tgc tgc cgc 798Gly Trp Asp Pro Arg Tyr Arg Ile Lys Ile Arg Ile Val Cys Cys Arg120 125 130 135gca tac cac gcg ttg ttc atg acc aac atg ttg atc agg ccg acc gaa 846Ala Tyr His Ala Leu Phe Met Thr Asn Met Leu Ile Arg Pro Thr Glu140 145 150gag gag ctt gcg gag ttc ggc gag cca gac ttc acc gtg tgg aac gcg 894Glu Glu Leu Ala Glu Phe Gly Glu Pro Asp Phe Thr Val Trp Asn Ala155 160 165ggc cag ttc cca gcg aac acg cac act gag ggt atg tcc tcg aag acc 942Gly Gln Phe Pro Ala Asn Thr His Thr Glu Gly Met Ser Ser Lys Thr170 175 180act gtc gaa atc aac ttc agg gcg atg gag atg gtc atc ctt ggc acg 990Thr Val Glu Ile Asn Phe Arg Ala Met Glu Met Val Ile Leu Gly Thr185 190 195gag tac gct ggt gag atg aag aag ggt atc ttc acg gtg atg ttc tac 1038Glu Tyr Ala G1y Glu Met Lys Lys Gly Ile Phe Thr Val Met Phe Tyr200 205 210 215ttg atg cct atc aac cac aac gtc ttg aca ttg cac tcc tcc gcc aac 1086Leu Met Pro Ile Asn His Asn Val Leu Thr Leu His Ser Ser Ala Asn220 225 230cag ggc ccc aac agc gat gtg acg ctc ttc ttc ggc ttg agc ggc act 1134Gln Gly Pro Asn Ser Asp Val Thr Leu Phe Phe Gly Leu Ser Gly Thr235 240 245ggt aag acg acc ttg tct gcg gac cag cac cgg aaa ttg atc ggc gac 1182Gly Lys Thr Thr Leu Set Ala Asp Gln His Arg Lys Leu Ile Gly Asp250 255 260gac gag cac tgc tgg tct gac tac ggt gtg ttc aac ata gaa ggt ggg 1230Asp Glu His Cys Trp Ser Asp Tyr Gly Val Phe Asn Ile Glu Gly Gly265 270 275tgc tac gcc aag tgt atc ggc cta agc ggg gag aag gag ccg gaa atc 1278Cys Tyr Ala Lys Cys Ile Gly Leu Ser Gly Glu Lys Glu Pro Glu Ile280 285 290 295ttc aat gca atc aag tac ggc tct gtt ttg gag aac gtg gtc tac gac 1326Phe Asn Ala Ile Lys Tyr Gly Ser Val Leu Glu Asn Val Val Tyr Asp300 305 310cca gta acg cgt gtc gtg gac tat gag gac tct tcg atc acc gag aac 1374
Pro Val Thr Arg Val Val Asp Tyr Glu Asp Set Ser Ile Thr Glu Asn315 320 325aca cgt tgc gcg tac cca att gag tac atc cca agc gcg cag att cca 1422Thr Arg Cys Ala Tyr Pro Ile Glu Tyr Ile Pro Ser Ala Gln Ile Pro330 335 340tgc ttg tcc gag aac cat cct tct aac atc gtt cta ttg acc tgc gat 1470Cys Leu Ser Glu Asn His Pro Ser Asn Ile Val Leu Leu Thr Cys Asp345 350 355gcc tca ggt gtg ttg cca cct gtg tcc cgt ttg acg ccg gag cag gtg 1518Ala Ser Gly Val Leu Pro Pro Val Ser Arg Leu Thr Pro Glu Gln Val360 365 370 375atg tac cac ttc atc tcg ggc tac acc tcc aag atg gcc ggt act gag 1566Met Tyr His Phe Ile Ser Gly Tyr Thr Ser Lys Met Ala Gly Thr Glu380 385 390cag gga gtc act gag cct gag gct acc ttc tct tcc tgc ttc ggc cag 1614Gln Gly Val Thr Glu Pro Glu Ala Thr Phe Set Ser Cys Phe Gly Gln395 400 405cca ttc cta gcc cta cat cca atg aaa tac gct acg atg ttg gct gaa 1662Pro Phe Leu Ala Leu His Pro Met Lys Tyr Ala Thr Met Leu Ala Glu410 415 420aag atg tcg cag cat aac gct agc gcc tgg ttg att aac acg ggc tgg 1710Lys Met Ser Gln His Asn Ala Ser Ala Trp Leu Ile Asn Thr Gly Trp425 430 435act ggc tcc tcg tat acg gcc ggc ggt aag cgc tgt cca ttg aag tac 1758Thr Gly Ser Ser Tyr Thr Ala Gly Gly Lys Arg Cys Pro Leu Lys Tyr440 445 450 455acc cgt gct atc ttg gac tcg atc cat gac gga acc ttg gcc cag gct 1806Thr Arg Ala Ile Leu Asp Ser Ile His Asp Gly Thr Leu Ala Gln Ala460 465 470gaa tac gag acc cta ccc gtc ttt ggt ttg tcc att cca aaa gcg gtc 1854Glu Tyr Glu Thr Leu Pro Val Phe Gly Leu Ser Ile Pro Lys Ala Val475 480 485gag ggc gtg cca gct gag ttg cta aac cct gcc aag aac tgg gtc gag 1902Glu Gly Val Pro Ala Glu Leu Leu Asn Pro Ala Lys Asn Trp Val Glu490 495 500ggc gaa ggc aag tac gct agc gcc gtg tcg gct ttg gcc tcg aag ttc 1950Gly Glu Gly Lys Tyr Ala Ser Ala Val Ser Ala Leu Ala Ser Lys Phe505 510 515aca gag aac ttt aag atc tat cag gac cag gcc aca gag gag gtt gtc 1998Thr Glu Asn Phe Lys Ile Tyr Gln Asp Gln Ala Thr Glu Glu Val Val520 525 530 535cgc gct ggc cca caa ata tgagatgcga ccatatagtg gtttcaggga 2046Arg Ala Gly Pro Gln Ile540tctgagtctt ccggacccta tttataaggt aaaatactat atgtaataaa taacatattc2106ttgagaaact gcctgcctca tcggcgcggt gtcactaggc gcccgagggg gccgtaacca2166cagtttgcag tcatgcgggg tggtggcatc gtagtcgtag tggtgtgtgc tgttccagca2226gcaggcttct cact 2240
<210>23<211>541<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 178<400>23Met Ser Pro Ser Lys Val Tyr Gln Thr Pro Glu Glu Lys Ile Arg Ala1 5 10 15Glu Leu Gly Leu Ser Ser Gly Val Leu Thr Ile Arg Arg Asn Ala Pro20 25 30Ala Ala Val Leu Tyr Glu Asp Ala Leu Ala Glu Arg Lys Thr Ala Ile35 40 45Ser Ser Thr Gly Ala Leu Ile Ala Tyr Ser Gly Glu Lys Thr Gly Arg50 55 60Ser Pro Lys Asp Lys Arg Ile Val Asp Glu Pro Thr Ser Ser Asp Asn65 70 75 80Ile Trp Trp Gly Pro Val Asn Arg Lys Ala Ser Glu Lys Thr Trp Leu85 90 95Ile Asn Arg Glu Arg Ala Ala Asp Phe Leu Arg Thr Arg Glu His Leu100 105 110Tyr Ile Val Asp Ala Tyr Ala Gly Trp Asp Pro Arg Tyr Arg Ile Lys115 120 125Ile Arg Ile Val Cys Cys Arg Ala Tyr His Ala Leu Phe Met Thr Asn130 135 140Met Leu Ile Arg Pro Thr Glu Glu Glu Leu Ala Glu Phe Gly Glu Pro145 150 155 160Asp Phe Thr Val Trp Asn Ala Gly Gln Phe Pro Ala Asn Thr His Thr165 170 175Glu Gly Met Ser Ser Lys Thr Thr Val Glu Ile Asn Phe Arg Ala Met180 185 190Glu Met Val Ile Leu Gly Thr Glu Tyr Ala Gly Glu Met Lys Lys Gly195 200 205Ile Phe Thr Val Met Phe Tyr Leu Met Pro Ile Asn His Asn Val Leu210 215 220
Thr Leu His Ser Ser Ala Asn Gln Gly Pro Asn Ser Asp Val Thr Leu225 230 235 240Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr Leu Ser Ala Asp Gln245 250 255His Arg Lys Leu Ile Gly Asp Asp Glu His Cys Trp Ser Asp Tyr Gly260 265 270Val Phe Asn Ile Glu Gly Gly Cys Tyr Ala Lys Cys Ile Gly Leu Ser275 280 285Gly Glu Lys Glu Pro Glu Ile Phe Asn Ala Ile Lys Tyr Gly Ser Val290 295 300Leu Glu Asn Val Val Tyr Asp Pro Val Thr Arg Val Val Asp Tyr Glu305 310 315 320Asp Ser Ser Ile Thr Glu Asn Thr Arg Cys Ala Tyr Pro Ile Glu Tyr325 330 335Ile Pro Ser Ala Gln Ile Pro Cys Leu Ser Glu Asn His Pro Ser Asn340 345 350Ile Val Leu Leu Thr Cys Asp Ala Ser Gly Val Leu Pro Pro Val Ser355 360 365Arg Leu Thr Pro Glu Gln Val Met Tyr His Phe Ile Ser Gly Tyr Thr370 375 380Ser Lys Met Ala Gly Thr Glu Gln Gly Val Thr Glu Pro Glu Ala Thr385 390 395 400Phe Ser Ser Cys Phe Gly Gln Pro Phe Leu Ala Leu His Pro Met Lys405 410 415Tyr Ala Thr Met Leu Ala Glu Lys Met Ser Gln His Asn Ala Ser Ala420 425 430Trp Leu Ile Asn Thr Gly Trp Thr Gly Ser Ser Tyr Thr Ala Gly Gly435 440 445Lys Arg Cys Pro Leu Lys Tyr Thr Arg Ala Ile Leu Asp Ser Ile His450 455 460Asp Gly Thr Leu Ala Gln Ala Glu Tyr Glu Thr Leu Pro Val Phe Gly465 470 475 480Leu Ser Ile Pro Lys Ala Val Glu Gly Val Pro Ala Glu Leu Leu Asn
485 490 495Pro Ala Lys Asn Trp Val Glu Gly Glu Gly Lys Tyr Ala Ser Ala Val500 505 510Ser Ala Leu Ala Ser Lys Phe Thr Glu Asn Phe Lys Ile Tyr Gln Asp515 520 525Gln Ala Thr Glu Glu Val Val Arg Ala Gly Pro Gln Ile530 535 540<210>24<211>1058<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 64<400>24tcaccaaaag ggtgctcaag tttgtcctcc ggaaccggaa gacagccttc gttagtttca 60tctccggctg ggtggtttca ataacgtagt ctttggacaa tcaaacccgt taatctaccc 120tggagcttcg gtttatgaag aggagagaga agtctagcgg caaaagaagc tcaatttaaa 180atagagattt gtgtttgcca ctacgatgtt cagccgcgca ttccagatac attcgtctgg 240cacgatgaaa taaccgccga agtctcctca cgtgattatt acgtaacata ctttccgggt 300ctcgaggatg cagtagtaca ccccgaaata atgctacatt agtcacgtgg agatactgca 360gaagttgaag aagacaacgg ctttctccac tactacatct acgaacagca aggatcatgc 420aagctgttga tcggacgcag tttgcgccac ttaagaatga cttgatgtta agggctgcga 480ggggtgaaga tgttgaacga cctccgtgct ggatcatgcg gcaagcaggt cggtacttac 540ccgaatacca tgacgtgaag ggtggccgtg acttctttga aacctgccgt gatgctgaaa 600tagcttcgga aatcacgctt cagcccgtaa ggagatacgc aggccttttg gacgctgcaa 660ttatcttctc ggatattctg gtgattccgc aggcgatggg gatgcgcgta gagatgctgg 720agggcaaggg cccgcacttc cccgagccac tccggaccac cgagcaactg atgaaggtgc 780tagagtacga agtggatgtg ctgcgtgagc tcgactgggc tttccgggcc atcacactaa 840cgcggcaaaa gctggccggc gatgtgcctc tcttcggctt ctgtggaggg ccctggacat 900tgctagtcta catgaccgag ggaggtggct cgcgtctgtt ccgctttgcc aaagaatgga 960ttcacaaacg tccagaactt gcgcataaac tactgcagaa aatcactgac gttgcaattg1020agtttttggc gcagcaggtt gtagctggtt gccagatc1058<210>25<211>206<212>PRT
<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 64<400>25Phe Ala Pro Leu Lys Asn Asp Leu Met Leu Arg Ala Ala Arg Gly Glu1 5 10 15Asp Val Glu Arg Pro Pro Cys Trp Ile Met Arg Gln Ala Gly Arg Tyr20 25 30Leu Pro Glu Tyr His Asp Val Lys Gly Gly Arg Asp Phe Phe Glu Thr35 40 45Cys Arg Asp Ala Glu Ile Ala Ser Glu Ile Thr Leu Gln Pro Val Arg50 55 60Arg Tyr Ala Gly Leu Leu Asp Ala Ala Ile Ile Phe Ser Asp Ile Leu65 70 75 80Val Ile Pro Gln Ala Met Gly Met Arg Val Glu Met Leu Glu Gly Lys85 90 95Gly Pro His Phe Pro Glu Pro Leu Arg Thr Thr Glu Gln Leu Met Lys100 105 110Val Leu Glu Tyr Glu Val Asp Val Leu Arg Glu Leu Asp Trp Ala Phe115 120 125Arg Ala Ile Thr Leu Thr Arg Gln Lys Leu Ala Gly Asp Val Pro Leu130 135 140Phe Gly Phe Cys Gly Gly Pro Trp Thr Leu Leu Val Tyr Met Thr Glu145 150 155 160Gly Gly Gly Ser Arg Leu Phe Arg Phe Ala Lys Glu Trp Ile His Lys165 170 175Arg Pro Glu Leu Ala His Lys Leu Leu Gln Lys Ile Thr Asp Val Ala180 185 190Ile Glu Phe Leu Ala Gln Gln Val Val Ala Gly Cys Gln Ile195 200 205<210>26<211>1905<212>DNA<213>棉桃阿舒氏囊霉
<220>
<221>CDS<222>(612)..(1712)<223>
<220>
<221>misc_feature<223>Oligi 64<400>26cctttaccct atccaacaaa taatcgtgta ccttgtcatt tgcatgcgac gcgtacggat 60gcgggtattg tgtgatgatc tccaaatcca accaggcatc tgcaagcatc tgcgcataat 120tatagtctga tggcaatgta aagtggtacc taaagtggtc ccacacataa agagttgtga 180tcaccaaata tgtgatcacc aaaagggtgc tcaagtttgt cctccggaac cggaagacag 240ccttcgttag tttcatctcc ggctgggtgg tttcaataac gtagtctttg gacaatcaaa 300cccgttaatc taccctggag cttcggttta tgaagaggag agagaagtct agcggcaaaa 360gaagctcaat ttaaaataga gatttgtgtt tgccactacg atgttcagcc gcgcattcca 420gatacattcg tctggcacga tgaaataacc gccgaagtct cctcacgtga ttattacgta 480acatactttc cgggtctcga ggatgcagta gtacaccccg aaataatgct acattagtca 540cgtggagata ctgcagaagt tgaagaagac aacggctttc tccactacta catctacgaa 600cagcaaggat c atg caa gct gtt gat cgg acg cag ttt gcg cca crt aag 650Met Gln Ala Val Asp Arg Thr Gln Phe Ala Pro Leu Lys1 5 10aat gac ttg atg tta agg gct gcg agg ggt gaa gat gtt gaa cga cct 698Asn Asp Leu Met Leu Arg Ala Ala Arg Gly Glu Asp Val Glu Arg Pro15 20 25ccg tgc tgg atc atg cgg caa gca ggt cgg tac tta ccc gaa tac cat 746Pro Cys Trp Ile Met Arg Gln Ala Gly Arg Tyr Leu Pro Glu Tyr His30 35 40 45gac gtg aag ggt ggc cgt gac ttc ttt gaa acc tgc cgt gat gct gaa 794Asp Val Lys Gly Gly Arg Asp Phe Phe Glu Thr Cys Arg Asp Ala Glu50 55 60ata gct tcg gaa atc acg ctt cag ccc gta agg aga tac gca ggc ctt 842Ile Ala Ser Glu Ile Thr Leu Gln Pro Val Arg Arg Tyr Ala Gly Leu65 70 75ttg gac gct gca att atc ttc tcg gat att ctg gtg att ccg cag gcg 890Leu Asp Ala Ala Ile Ile Phe Ser Asp Ile Leu Val Ile Pro Gln Ala80 85 90atg ggg atg cgc gta gag atg ctg gag ggc aag ggc ccg cac ttc ccc 938Met Gly Met Arg Val Glu Met Leu Glu Gly Lys Gly Pro His Phe Pro95 100 105gag cca ctc cgg acc acc gag caa ctg atg aag gtg cta gag tac gaa 986Glu Pro Leu Arg Thr Thr Glu Gln Leu Met Lys Val Leu Glu Tyr Glu110 115 120 125gtg gat gtg ctg cgt gag ctc gac tgg gct ttc cgg gcc atc aca cta 1034Val Asp Val Leu Arg Glu Leu Asp Trp Ala Phe Arg Ala Ile Thr Leu130 135 140
acg cgg caa aag ctg gcc ggc gat gtg cct ctc ttc ggc ttc tgt gga 1082Thr Arg Gln Lys Leu Ala Gly Asp Val Pro Leu Phe Gly Phe Cys Gly145 150 155ggg ccc tgg aca ttg cra gtc tac atg acc gag gga ggt ggc tcg cgt 1130Gly Pro Trp Thr Leu Leu Val Tyr Met Thr Glu Gly Gly Gly Ser Arg160 165 170ctg ttc cgc ttt gcc aaa gaa tgg att cac aaa cgt cca gaa ctt gcg 1178Leu Phe Arg Phe Ala Lys Glu Trp Ile His Lys Arg Pro Glu Leu Ala175 180 185cat aaa cta ctg cag aaa atc act gac gtt gca att gag ttt ttg gcg 1226His Lys Leu Leu Gln Lys Ile Thr Asp Val Ala Ile Glu Phe Leu Ala190 195 200 205cag cag gtt gaa gct ggt tgc cag atc ctg cag ttg ttc gaa agt tgg 1274Gln Gln Val Glu Ala Gly Cys Gln Ile Leu Gln Leu Phe Glu Ser Trp210 215 220ggt ggc gag ctg tcc ctt gcc gac ttg gac gaa ttt tcg ctg ccg tac 1322Gly Gly Glu Leu Ser Leu Ala Asp Leu Asp Glu Phe Ser Leu Pro Tyr225 230 235ttg aag caa att gcg gct gcc gtt ccg gca cgt tta cgc gaa tta ggc 1370Leu Lys Gln Ile Ala Ala Ala Val Pro Ala Arg Leu Arg Glu Leu Gly240 245 250att act gaa gat gtc cca atg acg gtt ttt gcc aag ggc tcg tgg tat 1418Ile Thr Glu Asp Val Pro Met Thr Val Phe Ala Lys Gly Ser Trp Tyr255 260 265gct cta gac aag ctc tgc gac gca ggc tat aac acc gtt tcc ctc gac 1466Ala Leu Asp Lys Leu Cys Asp Ala Gly Tyr Asn Thr Val Ser Leu Asp270 275 280 285tgg ctg tgg gat cct gcc gag gcc gtt cgt atc aac aac ggc aga gtc 1514Trp Leu Trp Asp Pro Ala Glu Ala Val Arg Ile Asn Asn Gly Arg Val290 295 300acc cta cag ggc aat ctg gac ccg acc gtc atg tat ggt tcc gat gag 1562Thr Leu Gln Gly Asn Leu Asp Pro Thr Val Met Tyr Gly Ser Asp Glu305 310 315act atc acc aag aag act gag gca atg atc aaa gga ttc ggt ggt ggc 1610Thr Ile Thr Lys Lys Thr Glu Ala Met Ile Lys Gly Phe Gly Gly Gly320 325 330aaa aaa cag tac atc gtc aat ttc ggt cac gga acg cac cct ttc atg 1658Lys Lys Gln Tyr Ile Val Asn Phe Gly His Gly Thr His Pro Phe Met335 340 345gac cca gag aag ata cgc cat ttt ctt gag gaa tgc cac aga atc ggg 1706Asp Pro Glu Lys Ile Arg His Phe Leu Glu Glu Cys His Arg Ile Gly350 355 360 365aag atg taaccttctg gaagtagaag agcacattat caggtcaata gcatcattat 1762Lys Metgtattatttt agacgctagt tgaactccaa tatttttgat catgtgagcg tatgacgggc1822cactttacca cgcctagcaa aaatgttcgc ggttgttcta ccgatcataa accacttcac1882cgttcggaga agcacttttg atc1905
<210>27<211>367<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligi 64<400>27Met Gln Ala Val Asp Arg Thr Gln Phe Ala Pro Leu Lys Asn Asp Leu1 5 10 15Met Leu Arg Ala Ala Arg Gly Glu Asp Val Glu Arg Pro Pro Cys Trp20 25 30Ile Met Arg Gln Ala Gly Arg Tyr Leu Pro Glu Tyr His Asp Val Lys35 40 45Gly Gly Arg Asp Phe Phe Glu Thr Cys Arg Asp Ala Glu Ile Ala Ser50 55 60Glu Ile Thr Leu Gln Pro Val Arg Arg Tyr Ala Gly Leu Leu Asp Ala65 70 75 80Ala Ile Ile Phe Ser Asp Ile Leu Val Ile Pro Gln Ala Met Gly Met85 90 95Arg Val Glu Met Leu Glu Gly Lys Gly Pro His Phe Pro Glu Pro Leu100 105 110Arg Thr Thr Glu Gln Leu Met Lys Val Leu Glu Tyr Glu Val Asp Val115 120 125Leu Arg Glu Leu Asp Trp Ala Phe Arg Ala Ile Thr Leu Thr Arg Gln130 135 140Lys Leu Ala Gly Asp Val Pro Leu Phe Gly Phe Cys Gly Gly Pro Trp145 150 155 160Thr Leu Leu Val Tyr Met Thr Glu Gly Gly Gly Ser Arg Leu Phe Arg165 170 175Phe Ala Lys Glu Trp Ile His Lys Arg Pro Glu Leu Ala His Lys Leu180 185 190Leu Gln Lys Ile Thr Asp Val Ala Ile Glu Phe Leu Ala Gln Gln Val195 200 205Glu Ala Gly Cys Gln Ile Leu Gln Leu Phe Glu Ser Trp Gly Gly Glu210 215 220
Leu Ser Leu Ala Asp Leu Asp Glu Phe Ser Leu Pro Tyr Leu Lys Gln225 230 235 240Ile Ala Ala Ala Val Pro Ala Arg Leu Arg Glu Leu Gly Ile Thr Glu245 250 255Asp Val Pro Met Thr Val Phe Ala Lys Gly Ser Trp Tyr Ala Leu Asp260 265 270Lys Leu Cys Asp Ala Gly Tyr Asn Thr Val Ser Leu Asp Trp Leu Trp275 280 285Asp Pro Ala Glu Ala Val Arg Ile Asn Asn Gly Arg Val Thr Leu Gln290 295 300Gly Asn Leu Asp Pro Thr Val Met Tyr Gly Ser Asp Glu Thr Ile Thr305 310 315 320Lys Lys Thr Glu Ala Met Ile Lys Gly Phe Gly Gly Gly Lys Lys Gln325 330 335Tyr Ile Val Asn Phe Gly His Gly Thr His Pro Phe Met Asp Pro Glu340 345 350Lys Ile Arg His Phe Leu Glu Glu Cys His Arg Ile Gly Lys Met355 360 365<210>28<211>972<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>O1igo 125<400>28atctgctgcg gccggatgtc aacatccagg agcttggaaa tctgcgtcgt gcgctgggcc 60tctagtttcc cgccgccgtt agtgagcaat atgaagggta tgcagttggc aggtccagca 120gcctgagcgc ctcggccgca cccggaatgg gcttttcgcc gtggaggagg acgccgtcga 180tgtcaaacac aaacccgacg tctgtagaga ggcgcctgat acgctgtagg cacttgagtg 240gcgagaagcg gagcattgct gtgctgggcg agctgccttc gcgaatgggg tctgtgttcc 300gtcggcaact gcgttcgcct gcgaggcgga attttattgt gtgtcatatc tcgccggcgt 360gagctcagcc tccgtcagcg acgtgcggca gagccacttg gcgcgtgaac tgggagcgct 420atttactata caggaacaag tgtttctagt agtgtcggga tgtcatctcc ggtatccctc 480ttcgacagag tagtgcaggg cgcctgcctg ttcggaccct aaccctttta gtgaagtcac 540
tgcgtgaccg acaatcagca gccctggcgg gcgtgagccg atctgttcga cgacctcagg 600cacgcttgca agcgtggttc tggtcacgcg ctggtccgga cacgaggcac gctcgacaat 660ggctgctggc acctgagggt cccattgctg ttccagcagg gcctggacaa ggtcccccac 720acgatgcagc gccattagga aaattgtagt gcgtgcggcg acaaactcgg gagcaggggg 780cagcactccc cgcctaccag gtgcctggta catatcaaga cctgctctgc gacgtcactg 840ctgcgtggcc ggaatatgtg cgacagtagt ggcagcgaga gctgagctaa taccaggtac 900aacgcgaggc tcaaacccat gccgcttgaa aagcaggtac tcttcgccgc ctctaccgaa 960gatgtacgga tc 972<210>29<211>147<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 125<400>29Asp Pro Tyr Ile Phe Gly Arg Gly Gly Glu Glu Tyr Leu Leu Phe Lys1 5 10 15Arg His Gly Phe Glu Pro Arg Val Val Pro Gly Ile Ser Ser Ala Leu20 25 30Ala Ala Thr Thr Val Ala His Ile Pro Ala Thr Gln Gln Arg Arg Arg35 40 45Ala Gly Leu Asp Met Tyr Gln Ala Pro Gly Arg Arg Gly Val Leu Pro50 55 60Pro Ala Pro Glu Phe Val Ala Ala Arg Thr Thr Ile Phe Leu Met Ala65 70 75 80Leu His Arg Val Gly Asp Leu Val Gln Ala Leu Leu Glu Gln Gln Trp85 90 95Asp Pro Gln Val Pro Ala Ala Ile Val Glu Arg Ala Ser Cys Pro Asp100 105 110Gln Arg Val Thr Arg Thr Thr Leu Ala Ser Val Pro Glu Val Val Glu115 120 125Gln Ile Gly Ser Arg Pro Pro Gly Leu Leu Ile Val Gly His Ala Val130 135 140
Thr Ser Leu145<210>30<211>2455<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(275)..(2 023)<223>
<220>
<221>misc_feature<223>Oligo 125<400>30ggtcgcaatg gaataataag gttgtatata gttattctgc cccacttcga tgccctgagg 60ttttcggcga tgagcagtaa aaaagctcga tcaggccatc agcacgtgac tagtacaaag 120ccacagctgt ggggttggtc aagcttatga tcagcgccgc tcaaggatga atcacaagcg 180actgtggcca gatcctataa agagatatat acgcccggga agatggaggg cgttttgtgg 240ggtccatgct gtgattcttt aaagggtgac atcg atg ggc cgt gaa gga gtg ccg 295Met Gly Arg Glu Gly Val Pro1 5cta att gcg tct ttg aac gct agc aat gaa gtc atg cta ctg gtg ggg 343Leu Ile Ala Ser Leu Asn Ala Ser Asn Glu Val Met Leu Leu Val Gly10 15 20aca ggc gga tca ggg cga gtg gtc agt cga ctg agg ggg ttg ctt aat 391Thr Gly Gly Ser Gly Arg Val Val Ser Arg Leu Arg Gly Leu Leu Asn25 30 35aca ggt gca cag tgc att gtg gta cag ccc tcg aac agc aaa ctc gtg 439Thr Gly Ala Gln Cys Ile Val Val Gln Pro Ser Asn Ser Lys Leu Val40 45 50 55gcg caa cta tat cgg gaa ttt gcg ggg gag ccg ctg ctc cgg atc tta 487Ala Gln Leu Tyr Arg Glu Phe Ala Gly Glu Pro Leu Leu Arg Ile Leu60 65 70gat cgg gcg ttt gca ttg gaa gac ctg acg acc cta ggg agg tac gag 535Asp Arg Ala Phe Ala Leu Glu Asp Leu Thr Thr Leu Gly Arg Tyr Glu75 80 85gcc agc aat gtg gtg gat cgg gta ttt ctg acg ccg ggt cac agt gct 583Ala Ser Asn Val Val Asp Arg Val Phe Leu Thr Pro Gly His Ser Ala90 95 100gat gag ata tta cag gcc cat gcg gtg tac cgg cag tgc atc aaa ctg 631Asp Glu Ile Leu Gln Ala His Ala Val Tyr Arg Gln Cys Ile Lys Leu105 110 115cgc att ccc atc aac acg agc caa cgg ccg gaa ctt tcg acc ttt tcg 679Arg Ile Pro Ile Asn Thr Ser Gln Arg Pro Glu Leu Ser Thr Phe Ser120 125 130 135ctg ccg tca acc tac agg gac ccg aaa ggc tcc ggg ttg cag gtg gcc 727
Leu Pro Ser Thr Tyr Arg Asp Pro Lys Gly Ser G1y Leu Gln Val Ala140 145 150gtc act act gat ggc cgc ggc tgc gta ctg gcc aac aga atc aga cgt 775Val Thr Thr Asp Gly Arg Gly Cys Val Leu Ala Asn Arg Ile Arg Arg155 160 165gaa att gtg agc aag ctg oct gcc aat atc tcc gag gta gtc agc aac 823Glu Ile Val Ser Lys Leu Pro Ala Asn Ile Ser Glu Val Val Ser Asn170 175 180atg ggt cgg ctg cgg gac tgc ata acc aca cgt gac cat gcg gaa ttg 871Met Gly Arg Leu Arg Asp Cys Ile Thr Thr Arg Asp His Ala Glu Leu185 190 195ctc cag acg gtt gac tta gag tcc gag ctc gag acc atg ggc atc ctg 919Leu Gln Thr Val Asp Leu Glu Ser Glu Leu Glu Thr Met Gly Ile Leu200 205 210 215ccc gat gag gac caa tgg gcg tcg cac cgc ttt aat aag ctg gtc cag 967Pro Asp Glu Asp Gln Trp Ala Ser His Arg Phe Asn Lys Leu Val Gln220 225 230gag ttt cgg atg aag gag tcc gac cag cga ctc aag cgg ctc cgg tgg 1015Glu Phe Arg Met Lys Glu Ser Asp Gln Arg Leu Lys Arg Leu Arg Trp235 240 245ctc tcc cag ata atg gag tac tac cct ttg agc gag cta gcg gat gtg 1063Leu Ser Gln Ile Met Glu Tyr Tyr Pro Leu Ser Glu Leu Ala Asp Val250 255 260tcc gtt gac aaa ctg ttg gat gag cag act gga gcc gcg tgt tct gga 1111Ser Val Asp Lys Leu Leu Asp Glu Gln Thr Gly Ala Ala Cys Ser Gly265 270 275acg aca gcg aca acc gga gcc gca tcc gtg act ggg gcc aca gag gac 1159Thr Thr Ala Thr Thr Gly Ala Ala Ser Val Thr Gly Ala Thr Glu Asp280 285 290 295acg gct gct gag cct gct gag ggg gtg gca tcc gat agc tct ggc gct 1207Thr Ala Ala Glu Pro Ala Glu Gly Val Ala Ser Asp Ser Ser Gly Ala300 305 310cgc gac cta gca cgc agt gcc gca ggc tcc atc gca ctt gtt ggc agt 1255Arg Asp Leu Ala Arg Ser Ala Ala Gly Ser Ile Ala Leu Val Gly Ser315 320 325ggc cct ggc tcc ctc tcc atg ctc acg cta ggc gca ctc agc gag att 1303Gly Pro Gly Ser Leu Ser Met Leu Thr Leu Gly Ala Leu Ser Glu Ile330 335 340aag tcc gca gac ctt gtc ctc gca gac aag ctg gtt ccg caa gag gtg 1351Lys Ser Ala Asp Leu Val Leu Ala Asp Lys Leu Val Pro Gln Glu Val345 350 355atg aat aca att cca gcg ggc act gag acc ttc atc gcc aga aag ttc 1399Met Asn Thr Ile Pro Ala Gly Thr Glu Thr Phe Ile Ala Arg Lys Phe360 365 370 375ccg ggc aat gcg gag cgc gca cag gaa gag cta gcc gaa aag gct cta 1447Pro Gly Asn Ala Glu Arg Ala Gln Glu Glu Leu Ala Glu Lys Ala Leu380 385 390gcc gcg ctt cgg gag gga aag agg gtt gtg cgc ttg aaa cag ggc gat 1495Ala Ala Leu Arg Glu Gly Lys Arg Val Val Arg Leu Lys Gln Gly Asp395 400 405
ccg tac atc ttc ggt aga ggc ggc gaa gag tac ctg ctt ttc aag cgg 1543Pro Tyr Ile Phe Gly Arg Gly Gly Glu Glu Tyr Leu Leu Phe Lys Arg410 415 420cat ggg ttt gag cct cgc gtt gta cct ggt att agc tca gct ctc gct 1591His Gly Phe Glu Pro Arg Val Val Pro Gly Ile Ser Ser Ala Leu Ala425 430 435gcc act act gtc gca cat att ccg gcc acg cag cgt gac gtc gca gag 1639Ala Thr Thr Val Ala His Ile Pro Ala Thr Gln Arg Asp Val Ala Glu440 445 450 455cag gtc ttg ara tgt acc ggc act ggt agg cgg gga gtg ctg ccc cct 1687Gln Val Leu Ile Cys Thr Gly Thr Gly Arg Arg Gly Val Leu Pro Pro460 465 470gct ccc gag ttt gtc gcc gca cgc act aca att ttc cta atg gcg ctg 1735Ala Pro Glu Phe Val Ala Ala Arg Thr Thr Ile Phe Leu Met Ala Leu475 480 485cat cgt gtg ggg gac ctt gtc cag gcc ctg ctg gaa cag caa tgg gac 1783His Arg Val Gly Asp Leu Val Gln Ala Leu Leu Glu Gln Gln Trp Asp490 495 500cct cag gtg cca gca gcc att gtc gag cgt gcc tcg tgt ccg gac cag 1831Pro Gln Val Pro Ala Ala Ile Val Glu Arg Ala Ser Cys Pro Asp Gln505 510 515cgc gtg acc aga acc acg ctt gca agc gtg cct gag gtc gtc gaa cag 1879Arg Val Thr Arg Thr Thr Leu Ala Ser Val Pro Glu Val Val Glu Gln520 525 530 535atc ggc tca cgc ccg cca ggg ctg ctg att gtc ggt cac gca gtg act 1927Ile Gly Ser Arg Pro Pro Gly Leu Leu Ile Val Gly His Ala Val Thr540 545 550tca cta aaa ggg tta ggg tcc gaa cag gca ggc gcc ctg cac tac tct 1975Ser Leu Lys Gly Leu Gly Ser Glu Gln Ala Gly Ala Leu His Tyr Ser555 560 565gtc gaa gag gga tac gga gat gac atc ccg aca cta cta gaa aca ctt 2023Val Glu Glu Gly Tyr Gly Asp Asp Ile Pro Thr Leu Leu Glu Thr Leu570 575 580gttcctgtat agtaaatagc gctcccagtt cacgcgccaa gtggctctgc cgcacgtcgc2083tgacggaggc tgagctcacg ccggcgagat atgacacaca ataaaattcc gcctcgcagg2143cgaacgcagt tgccgacgga acacagaccc cattcgcgaa ggcagctcgc ccagcacagc2203aatgctccgc ttctcgccac tcaagtgcct acagcgtatc aggcgcctct ctacagacgt2263cgggtttgtg tttgacatcg acggcgtcct cctccacggc gaaaagccca ttccgggtgc2323ggccgaggcg ctcaggctgc tggaccgcca acgcataccc ttcatattgc tcactaacgg2383cggcgggaaa ctagaggccc agcgcacgac gcagatttcc aagctcctgg atgttgacat2443ccggccgcag ca2455<210>31<211>583<212>PRT<213>棉桃阿舒氏囊霉
<220>
<221>misc_feature<223>Oligo 125<400>31Met Gly Arg Glu Gly Val Pro Leu Ile Ala Ser Leu Asn Ala Ser Asn1 5 10 15Glu Val Met Leu Leu Val Gly Thr Gly Gly Ser Gly Arg Val Val Ser20 25 30Arg Leu Arg Gly Leu Leu Asn Thr Gly Ala Gln Cys Ile Val Val Gln35 40 45Pro Ser Asn Ser Lys Leu Val Ala Gln Leu Tyr Arg Glu Phe Ala Gly50 55 60Glu Pro Leu Leu Arg Ile Leu Asp Arg Ala Phe Ala Leu Glu Asp Leu65 70 75 80Thr Thr Leu Gly Arg Tyr Glu Ala Ser Asn Val Val Asp Arg Val Phe85 90 95Leu Thr Pro Gly His Ser Ala Asp Glu Ile Leu Gln Ala His Ala Val100 105 110Tyr Arg Gln Cys Ile Lys Leu Arg Ile Pro Ile Asn Thr Ser Gln Arg115 120 125Pro Glu Leu Ser Thr Phe Ser Leu Pro Ser Thr Tyr Arg Asp Pro Lys130 135 140Gly Ser Gly Leu Gln Val Ala Val Thr Thr Asp Gly Arg Gly Cys Val145 150 155 160Leu Ala Asn Arg Ile Arg Arg Glu Ile Val Ser Lys Leu Pro Ala Asn165 170 175Ile Ser Glu Val Val Ser Asn Met Gly Arg Leu Arg Asp Cys Ile Thr180 185 190Thr Arg Asp His Ala Glu Leu Leu Gln Thr Val Asp Leu Glu Ser Glu195 200 205Leu Glu Thr Met Gly Ile Leu Pro Asp Glu Asp Gln Trp Ala Ser His210 215 220Arg Phe Asn Lys Leu Val Gln Glu Phe Arg Met Lys Glu Ser Asp Gln225 230 235 240Arg Leu Lys Arg Leu Arg Trp Leu Ser Gln Ile Met Glu Tyr Tyr Pro
245 250 255Leu Ser Glu Leu Ala Asp Val Ser Val Asp Lys Leu Leu Asp Glu Gln260 265 270Thr Gly Ala Ala Cys Ser Gly Thr Thr Ala Thr Thr Gly Ala Ala Ser275 280 285Val Thr Gly Ala Thr Glu Asp Thr Ala Ala Glu Pro Ala Glu Gly Val290 295 300Ala Ser Asp Ser Ser Gly Ala Arg Asp Leu Ala Arg Ser Ala Ala Gly305 310 315 320Ser Ile Ala Leu Val Gly Ser Gly Pro Gly Ser Leu Ser Met Leu Thr325 330 335Leu Gly Ala Leu Ser Glu Ile Lys Ser Ala Asp Leu Val Leu Ala Asp340 345 350Lys Leu Val Pro Gln Glu Val Met Asn Thr Ile Pro Ala Gly Thr Glu355 360 365Thr Phe Ile Ala Arg Lys Phe Pro Gly Asn Ala Glu Arg Ala Gln Glu370 375 380Glu Leu Ala Glu Lys Ala Leu Ala Ala Leu Arg Glu Gly Lys Arg Val385 390 395 400Val Arg Leu Lys Gln Gly Asp Pro Tyr Ile Phe Gly Arg Gly Gly Glu405 410 415Glu Tyr Leu Leu Phe Lys Arg His Gly Phe Glu Pro Arg Val Val Pro420 425 430Gly Ile Ser Ser Ala Leu Ala Ala Thr Thr Val Ala His Ile Pro Ala435 440 445Thr Gln Arg Asp Val Ala Glu Gln Val Leu Ile Cys Thr Gly Thr Gly450 455 460Arg Arg Gly Val Leu Pro Pro Ala Pro Glu Phe Val Ala Ala Arg Thr465 470 475 480Thr Ile Phe Leu Met Ala Leu His Arg Val Gly Asp Leu Val Gln Ala485 490 495Leu Leu Glu Gln Gln Trp Asp Pro Gln Val Pro Ala Ala Ile Val Glu500 505 510
Arg Ala Ser Cys Pro Asp Gln Arg Val Thr Arg Thr Thr Leu Ala Ser515 520 525Val Pro Glu Val Val Glu Gln Ile Gly Ser Arg Pro Pro Gly Leu Leu530 535 540Ile Val Gly His Ala Val Thr Ser Leu Lys Gly Leu Gly Ser Glu Gln545 550 555 560Ala Gly Ala Leu His Tyr Ser Val Glu Glu Gly Tyr Gly Asp Asp Ile565 570 575Pro Thr Leu Leu Glu Thr Leu580<210>32<211>447<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 107<400>32gccgcgatat aattaagaaa cggttggaat cggcagaact agaggttgaa gagataatca 60cagtatcagt accagcccac ctccatgata ttagtgagca gcctttgaac gtgtgttcac 120cgataactct tgggtcgtgc tatttagtcc tcagggcacc aatgaactgc ttcccctact 180gagacagggg gctgccaaga ttgcagctat tggaccaaca actgcgcaat atctacttga 240caatgccact ccaccaatat taacgagccc taaacctgag ccctcgagct tgtacaatgc 300aataaaagat tatttggcag cgtctcctat gggcaattag ttggagggca ctatgtatgt 360atagctttat acttatgaaa tggtgcagaa cacgcatgtg ttcacgttac cagtttatgg 420agtctatgat caaataacaa atatttt 447<210>33<211>69<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 107<400>33Glu Arg Val Phe Thr Asp Asn Ser Trp Val Val Leu Phe Ser Pro Gln1 5 10 15Gly Thr Asn Glu Leu Leu Pro Leu Leu Arg Gln Gly Ala Ala Lys Ile20 25 30
Ala Ala Ile Gly Pro Thr Thr Ala Gln Tyr Leu Leu Asp Asn Ala Thr35 40 45Pro Pro Ile Leu Thr Ser Pro Lys Pro Glu Pro Ser Ser Leu Tyr Asn50 55 60Ala Ile Lys Asp Tyr65<210>34<211>1626<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(250)..(1035)<223>
<220>
<221>misc_feature<223>Oligo 107<400>34tcacccttgg gatccgctga ctggctactg taattctatg tagtggatta gtacgataag 60ttacttttgt atgatagatg taatcacatc tggctattaa aatgactcag ccgaggtaaa 120tctaacgtcc cttcacaagg gtgttcctgt gtggacttcc gcctgaattt ttatagatat 180atagatactc tactcatgaa caacctgcaa ccgaataagc attagtgcca ggagaagaga 240accgtggaa atg ggg caa gta gaa aaa atc ata ttc ctt aag aat aag aca 291Met Gly Gln Val Glu Lys Ile Ile Phe Leu Lys Asn Lys Thr1 5 10gta cca gag gac cat tac gag acg att ttt gaa tcg aat ggc ttc cag 339Val Pro Glu Asp His Tyr Glu Thr Ile Phe Glu Ser Asn Gly Phe Gln15 20 25 30act cac ttt gta ccc ata ata acc cat gaa cac ctg cca gat gag gtt 387Thr His Phe Val Pro Ile Ile Thr His Glu His Leu Pro Asp Glu Val35 40 45cgc ggt cga cta tcc gac gcg aat tac atg aaa agg ttg aat tgt ttg 435Arg Gly Arg Leu Ser Asp Ala Asn Tyr Met Lys Arg Leu Asn Cys Leu50 55 60gtg gta acc tct cag agg act gtg gag tgt ctc tat gag gac gtt ctg 483Val Val Thr Ser Gln Arg Thr Val Glu Cys Leu Tyr Glu Asp Val Leu65 70 75ccc tct ctt cca gct gaa gca cgc aaa tct ctt ctc aat acg cca gta 531Pro Ser Leu Pro Ala Glu Ala Arg Lys Ser Leu Leu Asn Thr Pro Val80 85 90ttc gtg gtt ggg cgt gcc act cag gaa ttt atg gag aga tgc ggc ttt 579Phe Val Val Gly Arg Ala Thr Gln Glu Phe Met Glu Arg Cys Gly Phe95 100 105 110
acg gac gtg aga ggg gga tct gag act ggt aat ggc gtt ttg cta gcg 627Thr Asp Val Arg Gly Gly Ser Glu Thr Gly Asn Gly Val Leu Leu Ala115 120 125gag tta atg tta aat atg atc cag aag ggc gat atc agc tcc tcg gga 675Glu Leu Met Leu Asn Met Ile Gln Lys Gly Asp Ile Ser Ser Ser Gly130 135 140act ttt ctg ctg ctc gtg ggc gag atc cgc cgc gat ata att aag aaa 723Thr Phe Leu Leu Leu Val Gly Glu Ile Arg Arg Asp Ile Ile Lys Lys145 150 155cgg ttg gaa tcg gca gaa cta gag gtt gaa gag ata atc acg tat cgt 771Arg Leu Glu Ser Ala Glu Leu Glu Val Glu Glu Ile Ile Thr Tyr Arg160 165 170acc agc cca ctc cat gat att agt gag cgc ttt gaa cgt gtg ttc acc 819Thr Ser Pro Leu His Asp Ile Ser Glu Arg Phe Glu Arg Val Phe Thr175 180 185 190gat aac tct tgg gtc gtg cta ttt agt cct cag ggc acc aat gaa ctg 867Asp Asn Ser Trp Val Val Leu Phe Ser Pro Gln Gly Thr Asn Glu Leu195 200 205ctt ccc cta ctg aga cag ggg gct gcc aag att gca gct att gga cca 915Leu Pro Leu Leu Arg Gln Gly Ala Ala Lys Ile Ala Ala Ile Gly Pro210 215 220aca act gcg caa tat cta ctt gac aat gcc act cca cca ata tta acg 963Thr Thr Ala Gln Tyr Leu Leu Asp Asn Ala Thr Pro Pro Ile Leu Thr225 230 235agc cct aaa cct gag ccc tcg agc ttg tac aat gca ata aaa gat tat 1011Ser Pro Lys Pro Glu Pro Ser Ser Leu Tyr Asn Ala Ile Lys Asp Tyr240 245 250ttg gca gcg tct cct atg ggc aat tagttggagg gcactatgta tgtatagctt 1065Leu Ala Ala Ser Pro Met Gly Asn255 260tatacttatg aaatggtgca gaacacgcat gtgttcacgt taccagttta tggagtctat1125gatcaaataa caaatatttt atcgcgctgg tatatgtgca caacttccac cactttgtcc1185ttctcgttgc tatagatctc tgcctttgga tatattaaat agccgcgccg caaagagatc1245aactgaatcg agaatactaa atggtcgcct actattacag aacggcgcct gccgttaatt1305gaccagtcag ggctgttgct gaactcgaca atatatgtca atggttccct ttccatcacc1365cactgcgtag acaagttgca cacttctaca tcaattgtga ccgcatcccc cacatgtaat1425acttcgtggc ttgtggcaga caagcgaaca ctgaatagct gtttgatgga tggaagatgc1485actgggacaa ttaacgtatt gggttggata ctaaaccgtg tttgtcggga gagaactcta1545tgccagaagc taataacttg agatagctac caaaccgggt caagatctca gaatcactaa1605tgggacgagg agaggtcatt c 1626<210>35<211>262<212>PRT<213>棉桃阿舒氏囊霉
<220>
<221>misc_feature<223>Oligo 107<400>35Met Gly Gln Val Glu Lys Ile Ile Phe Leu Lys Asn Lys Thr Val Pro1 5 10 15Glu Asp His Tyr Glu Thr Ile Phe Glu Ser Asn Gly Phe Gln Thr His20 25 30Phe Val Pro Ile Ile Thr His Glu His Leu Pro Asp Glu Val Arg Gly35 40 45Arg Leu Ser Asp Ala Asn Tyr Met Lys Arg Leu Asn Cys Leu Val Val50 55 60Thr Ser Gln Arg Thr Val Glu Cys Leu Tyr Glu Asp Val Leu Pro Ser65 70 75 80Leu Pro Ala Glu Ala Arg Lys Ser Leu Leu Asn Thr Pro Val Phe Val85 90 95Val Gly Arg Ala Thr Gln Glu Phe Met Glu Arg Cys Gly Phe Thr Asp100 105 110Val Arg Gly Gly Ser Glu Thr Gly Asn Gly Val Leu Leu Ala Glu Leu115 120 125Met Leu Asn Met Ile Gln Lys Gly Asp Ile Ser Ser Ser Gly Thr Phe130 135 140Leu Leu Leu Val Gly Glu Ile Arg Arg Asp Ile Ile Lys Lys Arg Leu145 150 155 160Glu Ser Ala Glu Leu Glu Val Glu Glu Ile Ile Thr Tyr Arg Thr Ser165 170 175Pro Leu His Asp Ile Ser Glu Arg Phe Glu Arg Val Phe Thr Asp Asn180 185 190Ser Trp Val Val Leu Phe Ser Pro Gln Gly Thr Asn Glu Leu Leu Pro195 200 205Leu Leu Arg Gln Gly Ala Ala Lys Ile Ala Ala Ile Gly Pro Thr Thr210 215 220Ala Gln Tyr Leu Leu Asp Asn Ala Thr Pro Pro Ile Leu Thr Ser Pro225 230 235 240
Lys Pro Glu Pro Ser Ser Leu Tyr Asn Ala Ile Lys Asp Tyr Leu Ala245 250 255Ala Ser Pro Met Gly Asn260<210>36<211>368<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 136<400>36gatctcccat gtgtccaccg gtggtggtgc ctccctagag ctattggagg gtaaggacct 60accaggtgtc accttcttgt ccagcaagca gtagatgctg tccgcgcgcc tgccggcctt 120gaatagataa taaactatat acgcacgtaa tggaaagttg agaaactact atatgcgcct 180gttgcgctgc tcgtccgtgg gctccagccg cgggaacccg agcagctcca tgatgcggta 240ctcgtccgcg ctctcgacgc acgcgccgct cgacttgtca aacaggccgt gctgattcag 300cgtcatgccc tgcgcggagg ccccgcgtcc gcagagcctt gttgaaaagt gtcgttgccg 360atgaaagt 368<210>37<211>30<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 136<400>37Ile Ser His Val Ser Thr Gly Gly Gly Ala Ser Leu Glu Leu Leu Glu1 5 10 15Gly Lys Asp Leu Pro Gly Val Thr Phe Leu Ser Ser Lys Gln20 25 30<210>38<211>2000<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(447)..(1790)<223>
<220>
<221>misc_feature<223>Oligo 136<400>38ctgcagcacg tggtcctgcc ggtttcgcag ttcgccgcac agctcccgca ccgccatgta 60ccgaagatct acatcctcct gctcgcgata gcgcatcacg caccgcagcg cgctctccat 120ctccgtctcc atccttgcgc ttgcccgtat ctgccaacaa gccgtccaga acgccgctgc 180ttagtacgag ctcgtcacgt gcgactgcca gcttcctgtt ctgtggaagc cggcttctcc 240cctggctttt tccgtagcat gacgccgggg ctcaccagag aacgaggaag aatttccagt 300tggcgagcac aggccaggcg ggctccctac gggtaccgtg gggcgagcaa ggcagggcaa 360tgatgcaata agcgcaggcc ggcacgcaat tgagcgagca acgtgcacga ggatttttct 420gggggcgaaa aaagcgagta taaagg atg ggc cgg tcg tgg ggt ctg ctc tgg 473Met Gly Arg Ser Trp Gly Leu Leu Trp1 5atg gcg tgc ttg ctg tac ggc gtg ttc aca gag tgt cgc aga tct rca 521Met Ala Cys Leu Leu Tyr Gly Val Phe Thr Glu Cys Arg Arg Ser Ser10 15 20 25cag cac gca cac aca gga aaa atg tcg cta tcc tct aag cra aca gtc 569Gln His Ala His Thr Gly Lys Met Ser Leu Ser Ser Lys Leu Thr Val30 35 40aag gac ctg agc ctt gcg ggc aaa cgc gtg ttc atc cgc gtg gac ttc 617Lys Asp Leu Ser Leu Ala Gly Lys Arg Val Phe Ile Arg Val Asp Phe45 50 55aac gtg ccg cta gac ggg aag acg atc acg tcg aac cag cgc att gtg 665Asn Val Pro Leu Asp Gly Lys Thr Ile Thr Ser Asn Gln Arg Ile Val60 65 70gcc gcg cta ccc acg atc aag tac gtg ttg gag cag ggc ccc aag gcg 713Ala Ala Leu Pro Thr Ile Lys Tyr Val Leu Glu Gln Gly Pro Lys Ala75 80 85gtg gtg ttg gcg tcg cac cta ggg cgg ccc aac ggc gag cgc aac gag 761Val Val Leu Ala Ser His Leu Gly Arg Pro Asn Gly Glu Arg Asn Glu90 95 100 105aag tac tcg ttg gcg ccg gtg gcc gcg gag ctg gag aag ctg ctg ggc 809Lys Tyr Ser Leu Ala Pro Val Ala Ala Glu Leu Glu Lys Leu Leu Gly110 115 120cag aag gtg aac ttc ctg gac gac tgc gtg ggc gag cac gtg acc gct 857Gln Lys Val Asn Phe Leu Asp Asp Cys Val Gly Glu His Val Thr Ala125 130 135gcg gtc aac ggc gcg gct gcg ggg tcc gtg ttc ctg ctt gag aac ctg 905Ala Val Asn Gly Ala Ala Ala Gly Ser Val Phe Leu Leu Glu Asn Leu140 145 150cgg ttc cac atc gag gag gag ggc tcg cgc aag gtg gac ggc gag aag 953Arg Phe His Ile Glu Glu Glu Gly Ser Arg Lys Val Asp Gly Glu Lys155 160 165gtc aag gcg tct gcg gag gac gtg cag aag ttc cgc cag ggc ctc atg 1001Val Lys Ala Ser Ala Glu Asp Val Gln Lys Phe Arg Gln Gly Leu Met170 175 180 185
tcg ctc gcg gac gtc tac gtc aac gac gcc ttc ggc acc gcg cac aga 1049Ser Leu Ala Asp Val Tyr Val Asn Asp Ala Phe Gly Thr Ala His Arg190 195 200gcg cac tcc tcg atg gtc ggc ttc gag ctg cct gag agg gcc ggc ggc 1097Ala His Ser Ser Met Val Gly Phe Glu Leu Pro Glu Arg Ala Gly Gly205 210 215ttc ttg ttg tcg cgc gag ctg gag tac ttc agc aag gcg ttg gag aac 1145Phe Leu Leu Ser Arg Glu Leu Glu Tyr Phe Ser Lys Ala Leu Glu Asn220 225 230cct acg aga ccc ttc ttg gcg atc ctg ggc ggt gcc aag gtt gcc gac 1193Pro Thr Arg Pro Phe Leu Ala Ile Leu Gly Gly Ala Lys Val Ala Asp235 240 245aag atc cag ttg atc gac aac ttg ttg gac aag gtc gac tcg att gtg 1241Lys Ile Gln Leu Ile Asp Asn Leu Leu Asp Lys Val Asp Ser Ile Val250 255 260 265atc ggc ggt ggc atg gcc ttc acc ttc aag aag gtg ctt gag aac atg 1289Ile Gly Gly GIy Met Ala Phe Thr Phe Lys Lys Val Leu Glu Asn Met270 275 280gag atc ggt aac tcc atc tac gac aag gcg ggt gcc gag atc gtt cct 1337Glu Ile Gly Asn Ser Ile Tyr Asp Lys Ala Gly Ala Glu Ile Val Pro285 290 295aag cta gcg gag aag gcc aag aag aac ggc gtc aag atc gtg ttg cct 1385Lys Leu Ala Glu Lys Ala Lys Lys Asn Gly Val Lys Ile Val Leu Pro300 305 310gtg gac ttc gtg atc ggc gac gac ttc tcc cag gac gcc aac acc aag 1433Val Asp Phe Val Ile Gly Asp Asp Phe Ser Gln Asp Ala Asn Thr Lys315 320 325att gtc tct gcc tcc gag ggc att cca tcc ggc tgg gag ggt cta gac 1481Ile Val Ser Ala Ser Glu Gly Ile Pro Ser Gly Trp Glu Gly Leu Asp330 335 340 345tgt ggt cct gag tcc aga aag ctg ttc agc gag acc atc gcg agc gcg 1529Cys Gly Pro Glu Ser Arg Lys Leu Phe Ser Glu Thr Ile Ala Ser Ala350 355 360aag acc atc gtg tgg aac ggc cca cca ggt gtc ttt gag att cca aag 1577Lys Thr Ile Val Trp Asn Gly Pro Pro Gly Val Phe Glu Ile Pro Lys365 370 375ttc tcc gag ggt acc cag gcc atg ctt gcg gcc gct gtc aag gcc tcc 1625Phe Ser Glu Gly Thr Gln Ala Met Leu Ala Ala Ala Val Lys Ala Ser380 385 390gag gct ggc agc acc gtc atc atc ggc ggt ggt gac acc gct acc gtg 1673Glu Ala Gly Ser Thr Val Ile Ile Gly Gly Gly Asp Thr Ala Thr Val395 400 405gcc aag aag tac ggt gtg gtc gag aag atc tcc cat gtg tcc acc ggt 1721Ala Lys Lys Tyr Gly Val Val Glu Lys Ile Ser His Val Ser Thr Gly410 415 420 425ggt ggt gcc tcc cta gag cta ttg gag ggt aag gac cta cca ggt gtc 1769Gly Gly Ala Ser Leu Glu Leu Leu Glu Gly Lys Asp Leu Pro Gly Val430 435 440acc ttc ttg tcc agc aag cag tagatgcgtc cgcgcgcctg ccggcttgaa 1820Thr Phe Leu Ser Ser Lys Gln445
tagataataa actatatacg caacgtaatg gaaagttgag aaactactat atgcgcctgt1880tgcgctgctc gtccgtgggc tccagccgcg ggaacccgag cagctccatg atgcagtact1940cgtccgggct ctcgacgcac gcgccgctcg acttgtcaaa caggccgtgc tgattcagcg2000<210>39<211>448<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 136<400>39Met Gly Arg Ser Trp Gly Leu Leu Trp Met Ala Cys Leu Leu Tyr Gly1 5 10 15Val Phe Thr Glu Cys Arg Arg Ser Ser Gln His Ala His Thr Gly Lys20 25 30Met Ser Leu Ser Ser Lys Leu Thr Val Lys Asp Leu Ser Leu Ala Gly35 40 45Lys Arg Val Phe Ile Arg Val Asp Phe Asn Val Pro Leu Asp Gly Lys50 55 60Thr Ile Thr Ser Asn Gln Arg Ile Val Ala Ala Leu Pro Thr Ile Lys65 70 75 80Tyr Val Leu Glu Gln Gly Pro Lys Ala Val Val Leu Ala Ser His Leu85 90 95Gly Arg Pro Asn Gly Glu Arg Asn Glu Lys Tyr Ser Leu Ala Pro Val100 105 110Ala Ala Glu Leu Glu Lys Leu Leu Gly Gln Lys Val Asn Phe Leu Asp115 120 125Asp Cys Val Gly Glu His Val Thr Ala Ala Val Asn Gly Ala Ala Ala130 135 140Gly Ser Val Phe Leu Leu Glu Asn Leu Arg Phe His Ile Glu Glu Glu145 150 155 160Gly Ser Arg Lys Val Asp Gly Glu Lys Val Lys Ala Ser Ala Glu Asp165 170 175Val Gln Lys Phe Arg Gln Gly Leu Met Ser Leu Ala Asp Val Tyr Val180 185 190
Asn Asp Ala Phe Gly Thr Ala His Arg Ala His Ser Ser Met Val Gly195 200 205Phe Glu Leu Pro Glu Arg Ala Gly Gly Phe Leu Leu Ser Arg Glu Leu210 215 220Glu Tyr Phe Ser Lys Ala Leu Glu Asn Pro Thr Arg Pro Phe Leu Ala225 230 235 240Ile Leu Gly Gly Ala Lys Val Ala Asp Lys Ile Gln Leu Ile Asp Asn245 250 255Leu Leu Asp Lys Val Asp Ser Ile Val Ile Gly Gly Gly Met Ala Phe260 265 270Thr Phe Lys Lys Val Leu Glu Asn Met Glu Ile Gly Asn Ser Ile Tyr275 280 285Asp Lys Ala Gly Ala Glu Ile Val Pro Lys Leu Ala Glu Lys Ala Lys290 295 300Lys Asn Gly Val Lys Ile Val Leu Pro Val Asp Phe Val Ile Gly Asp305 310 315 320Asp Phe Ser Gln Asp Ala Asn Thr Lys Ile Val Ser Ala Ser Glu Gly325 330 335Ile Pro Ser Gly Trp Glu Gly Leu Asp Cys Gly Pro Glu Ser Arg Lys340 345 350Leu Phe Ser Glu Thr Ile Ala Ser Ala Lys Thr Ile Val Trp Asn Gly355 360 365Pro Pro Gly Val Phe Glu Ile Pro Lys Phe Ser Glu Gly Thr Gln Ala370 375 380Met Leu Ala Ala Ala Val Lys Ala Ser Glu Ala Gly Ser Thr Val Ile385 390 395 400Ile Gly Gly Gly Asp Thr Ala Thr Val Ala Lys Lys Tyr Gly Val Val405 410 415Glu Lys Ile Ser His Val Ser Thr Gly Gly Gly Ala Ser Leu Glu Leu420 425 430Leu Glu Gly Lys Asp Leu Pro Gly Val Thr Phe Leu Ser Ser Lys Gln435 440 445<210>40<211>1006
<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<222>(361)..(361)<223>n=未知核苷酸<220>
<221>misc_feature<222>(388)..(388)<223>n=未知核苷酸<220>
<221>misc_feature<223>Oligo 157<400>40gatcgcgccg caccacctcc tcccacggcg gccgcttctc cggcgcaaca ggaggcttgt 60ggcggtcgta caggcacctg gtagtactgc accttcacac gcgtgcctgt cgatccgctt 120gcgctgccag gtcatagaac ttgggcaaat tgaggtcccg gtagtcccct ccgttgtcga 180taaattggcg aagccggtct tcgtagatgc cccttgacgg gcttgaactg cgggtcccag 240ttgaccgata tcgctgctca tagcgctgct tccttcctgc cttggtccgt agtctcgcct 300gccgctcgca ccttttaata tccttacccg cgcggttttc gtaatgcagt tttcscttgc 360ngtycgsccg cagtcacccg aaaccctncc cggaaaaacg cttttccccg cagggcgcgc 420catgaaacct gctgctgccg gcctgttgtc tgcctccggg gcacgttgat tattcagcta 480tactgattat atatactcta gttgtccaaa atgtgcatct cctggtcctt ctcgatgtgc 540tggatcaagt cgtcgtgctg cgacttaatc tgctccaagg ccgtgacctc gggcaacttc 600acactgaggc cgttgatgag cgagtgctcg tgcaggatac tcccgccgat ctgctcgatg 660gactctctga ccttggcgag gtcggccccc ttcttcaacg tgatgatata agatgattca 720gacatgcttg gtgctgggac tgatggtagt catctacccg cgttcgcgtg cccttttata 780tacggccgag cccggcaagg ggcccctagg cccccgtttc gcttgcgcag gccactgttg 840ctggctactt acttaggctt actgtacyta gattgctctg ggctgtgcgg tcagaggtgc 900tgtaatcagg attgtcgagc gcacgcccca gctcacgtga cagaacggcc atcaggcggg 960aaccgtcgcg tagcgagacc cactcgccgt caatcagagc cactag 1006<210>41<211>67<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 157
<400>41Ser Tyr Ile Ile Thr Leu Lys Lys Gly Ala Asp Leu Ala Lys Val Arg1 5 10 15Glu Ser Ile Glu Gln Ile Gly Gly Ser Ile Leu His Glu His Ser Leu20 25 30Ile Asn Gly Leu Ser Val Lys Leu Pro Glu Val Thr Ala Leu Glu Gln35 40 45Ile Lys Ser Gln His Asp Asp Leu Ile Gln His Ile Glu Lys Asp Gln50 55 60Glu Met His65<210>42<211>1658<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(809)..(1033)<223>
<220>
<221>misc_feature<223>Oligo 157<400>42gttatgatga gccccgccag ccccgcggga aatagagcag aatgtacatg ccgtgttttc 60gtccggacgt cctttcgtgc agttgtgtgc gactttttca gactttccgc ggagccggca 120gcgcaacctc ttcccccact atcgcaatga tccgccatac cgcccccgtt gcgcgccgta 180tcctgctcag taggccttct gcactcctgg cgcgccccgc cgtacgcatc gccgcgaggc 240cggccgcgtg gcgcgccatg tcatccttct ccggcggcat gcgcgctccc ccggagctgg 300cccagctcac gccgcaggcc taccacaagc aggccgacga gttcctgaac gacctgctgg 360accgtctcga agcgctgggc gacgagcgcc ccgacatcat cgcagactcc gagtactccc 420agggtgtgct cacgctgtcc gtacctgctc tgggcaccta tgtcattaac aaacagcccc 480caaacaagca gatatggctc tcgtcgccag tatccggccc caaccgctag tggctctgat 540tgacggcgag tgggtctcgc tacgcgacgg ttcccgcctg atggccgttc tgtcacgtga 600gctggggcgt gcgctcgaca atcctgatta cagcacctct gaccgcacag cccagagcaa 660tctargtaca gtagcaccta agtaagtagc cagcaacagt ggcctgcgca agcgaaacgg 720gggcctaggg gccccttgcc gggctcggcc gtatataaaa gggcacgcga acgcgggtag 780atgactacca tcagtcccag caccaagc atg tct gaa tca tct tat atc atc832
Met Ser Glu Ser Ser Tyr Ile Ile1 5acg ttg aag aag ggg gcc gac ctc gcc aag gtc aga gag tcc atc gag 880Thr Leu Lys Lys Gly Ala Asp Leu Ala Lys Val Arg Glu Ser Ile Glu10 15 20cag atc ggc ggg agt atc ctg cac gag cac tcg ctc atc aac ggc ctc 928Gln Ile Gly Gly Ser Ile Leu His Glu His Ser Leu Ile Asn Gly Leu25 30 35 40agt gtg aag ttg ccc gag gtc acg gcc ttg gag cag att aag tcg cag 976Ser Val Lys Leu Pro Glu Val Thr Ala Leu Glu Gln Ile Lys Ser Gln45 50 55cac gac gac ttg atc cag cac atc gag aag gac cag gag atg cac att 1024His Asp Asp Leu Ile Gln His Ile Glu Lys Asp Gln Glu Met His Ile60 65 70ttg gac aac tagagtatat ataatcagta tagctgaata atcaacgtgc 1073Leu Asp Asn75cccggaggca gacaacaggc cggcagcagc aggtttcatg gcgcgccctg cggggaagcg1133ttttccggga ggtttcggtg actgcggccg acgcagcgaa actgcatacg aaaccgcgcg1193gtaggatata aaggtgcgag cggcaggcga gactacggac caaggcagga aggagcagcg1253ctatgagcag cgatatcgtc aactgggacc cgcagttcaa gcccgtcaag ggcatctacg1313aagaccggct tcgccaattt atcgacaacg gaggggacta ccgggacctc aatttgccca1373agttctatga ccggcagcgc aagcggatcg acagcacgcg tgtgaaggtg cagtactacc1433aggtgcctgt acgaccgcca caagcctcct gttgcgccgg agaagcggcc gccgtgggag1493gaggtggtgc ggcgcgatcg tgctggagaa atcgaatgga agatgtgtac ctcgaccccg1553tcgggccgag ctggtccact acgaggttct aggtgagttg gacatcccgg aatcgtggag1613cagctctggg gaacagataa tattctagtg ggactgcgag aacaa1658<210>43<211>75<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 157<400>43Met Ser Glu Ser Ser Tyr Ile Ile Thr Leu Lys Lys Gly Ala Asp Leu1 5 10 15Ala Lys Val Arg Glu Ser Ile Glu Gln Ile Gly Gly Ser Ile Leu His20 25 30Glu His Ser Leu Ile Asn Gly Leu Ser Val Lys Leu Pro Glu Val Thr35 40 45
Ala Leu Glu Gln Ile Lys Ser Gln His Asp Asp Leu Ile Gln His Ile50 55 60Glu Lys Asp Gln Glu Met His Ile Leu Asp Asn65 70 75<210>44<211>1599<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<222>(331)..(331)<223>n=未知核苷酸<220>
<221>misc_feature<222>(343)..(343)<223>n=未知核苷酸<220>
<221>misc_feature<223>Oligo 108<400>44gatcgatata caggttttgg ggcatttgca actcctcttg cgggatatgt caccgctgcg 60gcatccgaac aggggccctg aattactggc ggttgaccca gatctgttca gccgcatgtt 120cttcacgaag ccgtctcagg attcgctgtt cctgaagagc aagggaccat tgccgtcgcg 180gattcttccc catttgtacc ttggttcact cgagcacgcg catgacccaa acctgctccg 240cagattgggt atcagaaata ttgtgtcagt cggggagact ttatcatggc tacaatcccc 300tcactcccgg gaggctgcta aaacagaaga nagcaaacaa ganaccatca cggacgcgta 360tgtgaccgca cctgctgaaa ccgccgcggc aacgtccacg accgcatcca ctggtagtct 420taatttgttg aagcgaaaca gatcacccag cgcgcctgaa attaaaccgt taaaatcctc 480atcctgtaaa actacagtct tctcgaagga tggattcgaa atatgccaca caagcaactt 540gggagacaat ggtgcagatc cgatgctcac tcagctggac caaatgctct ctttcatcaa 600tcggtgttat gaggccggcg aaaaggtact ggttcactgc atggtcggcg tttctcgcag 660tgcgacagta tgcatagccg aatgcatgag acgtctaaac tgcgcagtga tccaggccta 720cctgtttgtc cgtgtgcgcc gcttaaacat tataatccag cccaatctca tgttcatcta 780cgagctcctc aagtggcagg agctcaagca ccctgacgtt ctcaagattg actggcatat 840catgtgtagg gccatcaacg aactcaacag taattatata aaggacatga tttgacctac 900cagttgagct tggttgccca ctctcacatt ttgtactatt tagaggattt tacgatacca 960taaactactc tagtgtaaca tatttcttca acgagtccgg aatctcatcg tagagcttct1020
tttcctgcaa ccacttcttc gagaatacgc ggtcggcata cttgtgtcca gtgtcacaga1080ggatcgtgac gacattgctt cccggtggta gttccctggc cacacgcaca gcgccagcga1140cgttcagccc cgaagtgcca ccgaggaata gaccttcctc gtccagaagc ctgtaggtca1200tgttcaggga ctctgggtcc ggaacaaaca cggcgtcgtc aatgatatca acgctggctt1260cgaggttctt tgtaatccgc ccttggccca cgccctcagt gaacgagctg ccctccctct1320ccaagttgcc ggtcttgacg aatgaataga cgaccgagcc tggcgggtcc gtgaccacca1380gtttgcattt gcgctccgtg gcctcggcca ggtaccgcgc gatcccggag aacgttcctc1440ctggtacctg tggagcaagg tgaatgcatc cacctcgagc ccagcgttgc gcatttgctg1500caagatctcg ggaccggtcg tcgcatagtg cgccttccaa ttggcctcgt tgtcaaactg1560gttggtccag acagcattgt ccaatgccgc ggcgtgatc 1599<210>45<211>46<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 108<400>45His Ala Ala Ala Leu Asp Asn Ala Val Trp Thr Asn Gln Phe Asp Asn1 5 10 15Glu Ala Asn Trp Lys Ala His Tyr Ala Thr Thr Gly Pro Glu Ile Leu20 25 30Gln Gln Met Arg Asn Ala Gly Leu Glu Val Asp Ala Phe Thr35 40 45<210>46<211>157<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo 108<400>46Gly Gly Thr Phe Ser Gly Ile Ala Arg Tyr Leu Ala Glu Ala Thr Glu1 5 10 15Arg Lys Cys Lys Leu Val Val Thr Asp Pro Pro Gly Ser Val Val Tyr20 25 30Ser Phe Val Lys Thr Gly Asn Leu Glu Arg Glu Gly Ser Ser Phe Thr
35 40 45Glu Gly Val Gly Gln Gly Arg Ile Thr Lys Asn Leu Glu Ala Ser Val50 55 60Asp Ile Ile Asp Asp Ala Val Phe Val Pro Asp Pro Glu Ser Leu Asn65 70 75 80Met Thr Tyr Arg Leu Leu Asp Glu Glu Gly Leu Phe Leu Gly Gly Thr85 90 95Ser Gly Leu Asn Val Ala Gly Ala Val Arg Val Ala Arg Glu Leu Pro100 105 110Pro Gly Ser Asn Val Val Thr Ile Leu Cys Asp Thr Gly His Lys Tyr115 120 125Ala Asp Arg Val Phe Ser Lys Lys Trp Leu Gln Glu Lys Lys Leu Tyr130 135 140Asp Glu Ile Pro Asp Ser Leu Lys Lys Tyr Val Thr Leu145 150 155<210>47<211>2808<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(450)..(1517)<223>
<220>
<221>misc_feature<223>Oligo 108<400>47ccgctgacgg tgcgcaacct ggtcaagtgg cgcacggcaa ggagctggag cagttcctgg 60cggacgtggc ggacgtgcgg cggtgttgct cgagcatcag ggcgccgcgg actcgccgga 120agaggcggag cgctttgtgg gcggcctgcg cagcgccctt gaggcgccgg cggcggcgcc 180tgcgccgcca gcgcgcaaga gatacgagtt cgctccccgg cccgcgcgca actgaaccgc 240gcacctgtat ataccgcgac atagtgaata aagaatgaga gtcccacagt gcgcctgcgc 300gcggagcgcg cggcatggtc gccgaccgct gttgtgccgc cgcacgtgat tagtgcacta 360tggctgtgga tctgtgctga tgtcgggtca ccgtccagtc gctgggtata tcagtacagc 420agtaggcagc ccggccggaa cacgttacg atg cac gcc cag ctc att agg aag 473Met His Ala Gln Leu Ile Arg Lys1 5
atg tca gcg ccc aca ctg gcc gcc gga ggc ttc ccg gat gcc att ggc 521Met Ser Ala Pro Thr Leu Ala Ala Gly Gly Phe Pro Asp Ala Ile Gly10 15 20aag acg ccg ctg atc aag ctg cag aag ttg tcg cag gaa ctg ggt cgg 569Lys Thr Pro Leu Ile Lys Leu Gln Lys Leu Ser Gln Glu Leu Gly Arg25 30 35 40aac atc tac ggg aag gcg gag ttt atg aac ccg ggc gga tcc gtc aag 617Asn Ile Tyr Gly Lys Ala Glu Phe Met Asn Pro Gly Gly Ser Val Lys45 50 55gac cgt gct gcg ctt tac ctg gtg gaa gaa gcg gaa cgg gcg ggg ctg 665Asp Arg Ala Ala Leu Tyr Leu Val Glu Glu Ala Glu Arg Ala Gly Leu60 65 70atc gac cct tcg cgg ccg ggg acc ata gta gag ggc tct gcc ggc aac 713Ile Asp Pro Ser Arg Pro Gly Thr Ile Val Glu Gly Ser Ala Gly Asn75 80 85acg gcg atc ggg ctg gca cac ata gca cgc tcc agg ggg tac aat gct 761Thr Ala Ile Gly Leu Ala His Ile Ala Arg Ser Arg Gly Tyr Asn Ala90 95 100gtg ttc tac atg ccg gac acg cag tcg cgg gaa aag gtc aac ttg ctg 809Val Phe Tyr Met Pro Asp Thr Gln Ser Arg Glu Lys Val Asn Leu Leu105 110 115 120agg tac ctg ggg acc gag gtg cac ccg gta ccc gtg tgc ccc agc aca 857Arg Tyr Leu Gly Thr Glu Val His Pro Val Pro Val Cys Pro Ser Thr125 130 135gac cct ctg aac ttc aac aat cgc gct cgg gat cac gcc gcg gca ttg 905Asp Pro Leu Asn Phe Asn Asn Arg Ala Arg Asp His Ala Ala Ala Leu140 145 150gac aat gct gtc tgg acc aac cag ttt gac aac gag gcc aat tgg aag 953Asp Asn Ala Val Trp Thr Asn Gln Phe Asp Asn Glu Ala Asn Trp Lys155 160 165gcg cac tat gcg acg acc ggt ccc gag atc ttg cag caa atg cgc aac 1001Ala His Tyr Ala Thr Thr Gly Pro Glu Ile Leu Gln Gln Met Arg Asn170 175 180gct ggg ctc gag gtg gat gca ttc act tgc tcc aca ggt acc gga gga 1049Ala Gly Leu Glu Val Asp Ala Phe Thr Cys Ser Thr Gly Thr Gly Gly185 190 195 200acg ttc tcc ggg atc gcg cgg tac ctg gcc gag gcc acg gag cgc aaa 1097Thr Phe Ser Gly Ile Ala Arg Tyr Leu Ala Glu Ala Thr Glu Arg Lys205 210 215tgc aaa ctg gtg gtc acg gac ccg cca ggc tcg gtc gtc tat tca ttc 1145Cys Lys Leu Val Val Thr Asp Pro Pro Gly Ser Val Val Tyr Ser Phe220 225 230gtc aag acc ggc aac ttg gag agg gag ggc agc tcg ttc act gag ggc 1193Val Lys Thr Gly Asn Leu Glu Arg Glu Gly Ser Ser Phe Thr Glu Gly235 240 245gtg ggc caa ggg cgg att aca aag aac ctc gaa gcc agc gtt gat atc 1241Val Gly Gln Gly Arg Ile Thr Lys Asn Leu Glu Ala Ser Val Asp Ile250 255 260att gac gac gcc gtg ttt gtt ccg gac cca gag tcc ctg aac atg acc 1289Ile Asp Asp Ala Val Phe Val Pro Asp Pro Glu Ser Leu Asn Met Thr265 270 275 280
tac agg ctt ctg gac gag gaa ggt cta ttc ctc ggt ggc act tcg ggg 1337Tyr Arg Leu Leu Asp Glu Glu Gly Leu Phe Leu Gly Gly Thr Ser Gly285 290 295ctg aac gtc gct ggc gct gtg cgt gtg gcc agg gaa cta cca ccg gga 1385Leu Asn Val Ala Gly Ala Val Arg Val Ala Arg Glu Leu Pro Pro Gly300 305 310agc aat gtc gtc acg atc ctc tgt gac act gga cac aag tat gcc gac 1433Ser Asn Val Val Thr Ile Leu Cys Asp Thr Gly His Lys Tyr Ala Asp315 320 325cgc gta ttc tcg aag aag tgg ttg cag gaa aag aag ctc tac gat gag 1481Arg Val Phe Ser Lys Lys Trp Leu Gln Glu Lys Lys Leu Tyr Asp Glu330 335 340att ccg gac tcg ttg aag aaa tat gtt aca cta gag tagtttatgg 1527Ile Pro Asp Ser Leu Lys Lys Tyr Val Thr Leu Glu345 350 355tatcgtaaaa tcctctaaat agtacaaaat gtgagagtgg gcaaccaagc tcaactggta1587ggtcaaatca tgtcctttat ataattactg ttgagttcgt tgatggccct acacatgata1647tgccagtcaa tcttgagaac gtcagggtgc ttgagctcct gccacttgag gagctcgtag1707atgaacatga gattgggctg gattataatg tttaagcggc gcacacggac aaacaggtag1767gcctggatca ctgcgcagtt tagacgtctc atgcattcgg ctatgcatac tgtcgcactg1827cgagaaacgc cgaccatgca gtgaaccagt accttttcgc cggcctcata acaccgattg1887atgaaagaga gcatttggtc cagctgagtg agcatcggat ctgcaccatt gtctcccaag1947ttgcttgtgt ggcatatttc gaatccatcc ttcgagaaga ctgtagtttt acaggatgag2007gattttaacg gtttaatttc aggcgcgctg ggtgatctgt ttcgcttcaa caaattaaga2067ctaccagtgg atgcggtcgt ggacgttgcc gcggcggttt cagcaggtgc ggtcacatac2127gcgtccgtga tggttcttgt ttgcttcttc tgttttagca gcctcccggg agtgagggga2187ttgtagccat gataaagtct ccccgactga cacaatattt ctgataccca atctgcggag2247caggtttggg tcatgcgcgt gctcgagtga accaaggtac aaatggggaa gaatccgcga2307cggcaatggt cccttgctct tcaggaacag cgaatcctga gacggcttcg tgaagaacat2367gcggctgaac agatctgggt caaccgccag taattcaggg cccctgttcg gatgccgcag2427cggtgacata tcccgcaaga ggagttgcaa atgccccaaa acctgtatat cgatcggaaa2487taggaagtat ggacgctcga cctccgtatg caaccgcaac agaacctcat ccagaggttg2547atcccaggca aatatcagat aagccactag caaaaaggaa gtttctgtat aaccatcgga2607acagtataat agggaaagct tcttgtgtac cgcgctgaat cggtagatca ggtgacagat2667attaacacac gaagtgatgg agtccagagt gagggtcccc aggccaattg agcccgagct2727cggaaacgca atgtgtatcg gagcctccat ctgggtcaag tgatgcctga tgtcgtcgtg2787gtgtgggaag ggcgtgtgct c 2808<210>48
<211>356<212>PRT<213>棉桃阿舒氏囊霉<220>
<22l>misc_feature<223>Oligo 108<400>48Met His Ala Gln Leu Ile Arg Lys Met Ser Ala Pro Thr Leu Ala Ala1 5 10 15Gly Gly Phe Pro Asp Ala Ile Gly Lys Thr Pro Leu Ile Lys Leu Gln20 25 30Lys Leu Ser Gln Glu Leu Gly Arg Asn Ile Tyr Gly Lys Ala Glu Phe35 40 45Met Asn Pro Gly Gly Ser Val Lys Asp Arg Ala Ala Leu Tyr Leu Val50 55 60Glu Glu Ala Glu Arg Ala Gly Leu Ile Asp Pro Ser Arg Pro Gly Thr65 70 75 80Ile Val Glu Gly Ser Ala Gly Asn Thr Ala Ile Gly Leu Ala His Ile85 90 95Ala Arg Ser Arg Gly Tyr Asn Ala Val Phe Tyr Met Pro Asp Thr Gln100 105 110Ser Arg Glu Lys Val Asn Leu Leu Arg Tyr Leu Gly Thr Glu Val His115 120 125Pro Val Pro Val Cys Pro Ser Thr Asp Pro Leu Asn Phe Asn Asn Arg130 135 140Ala Arg Asp His Ala Ala Ala Leu Asp Asn Ala Val Trp Thr Asn Gln145 150 155 160Phe Asp Asn Glu Ala Asn Trp Lys Ala His Tyr Ala Thr Thr Gly Pro165 170 175Glu Ile Leu Gln Gln Met Arg Asn Ala Gly Leu Glu Val Asp Ala Phe180 185 190Thr Cys Ser Thr Gly Thr Gly Gly Thr Phe Ser Gly Ile Ala Arg Tyr195 200 205Leu Ala Glu Ala Thr Glu Arg Lys Cys Lys Leu Val Val Thr Asp Pro210 215 220
Pro Gly Ser Val Val Tyr Ser Phe Val Lys Thr Gly Asn Leu Glu Arg225 230 235 240Glu Gly Ser Ser Phe Thr Glu Gly Val Gly Gln Gly Arg Ile Thr Lys245 250 255Asn Leu Glu Ala Ser Val Asp Ile Ile Asp Asp Ala Val Phe Val Pro260 265 270Asp Pro Glu Ser Leu Asn Met Thr Tyr Arg Leu Leu Asp Glu Glu Gly275 280 285Leu Phe Leu Gly Gly Thr Ser Gly Leu Asn Val Ala Gly Ala Val Arg290 295 300Val Ala Arg Glu Leu Pro Pro Gly Ser Asn Val Val Thr Ile Leu Cys305 310 315 320Asp Thr Gly His Lys Tyr Ala Asp Arg Val Phe Ser Lys Lys Trp Leu325 330 335Gln Glu Lys Lys Leu Tyr Asp Glu Ile Pro Asp Ser Leu Lys Lys Tyr340 345 350Val Thr Leu Glu35權利要求
1.可自棉桃阿舒氏囊霉分離的多核苷酸,其編碼與棉桃阿舒氏囊霉的代謝相關的蛋白。
2.權利要求1的多核苷酸,其與棉桃阿舒氏囊霉的代謝相關并具有表1所示的結構和/或功能特性。
3.包含SEQ ID NO1,6,12,16,20,24,28,32,36,40或44所示的核酸序列并優(yōu)選自棉桃阿舒氏囊霉中分離的權利要求1或2的多核苷酸;其互補多核苷酸;以及通過遺傳密碼簡并性衍生自這些多核苷酸的序列。
4.權利要求3的多核苷酸,其包含SEQ ID NO4,9,14,18,22,26,30,34,38,42或47顯示的核酸序列或其片段。
5.寡核苷酸,其可以與任一前述權利要求的多核苷酸雜交,且尤其是在嚴格的條件下雜交。
6.多核苷酸,其可以與權利要求5的寡核苷酸雜交,且尤其是在嚴格的條件下雜交,并編碼阿舒氏囊霉屬微生物的基因產(chǎn)物或該基因產(chǎn)物的功能等價物。
7.多肽及其功能等價物,特別是與具有表1所示活性的釀酒酵母、構巢曲霉或棉桃阿舒氏囊霉蛋白具有類似活性的功能等價物,其中,所述多肽由包含權利要求1至4中任意一項的核酸序列或其片段的多核苷酸編碼,或由權利要求6的多核苷酸編碼;或具有包含SEQ ID NO2,3,5,7,8,10,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39,41,43,45,46或SEQID NO48中所示的至少10個連續(xù)氨基酸殘基的氨基酸序列。
8.包含權利要求1至6中任意一項的核酸序列的表達盒,其中,所述核酸序列與至少一個調節(jié)核酸序列可操作地連接。
9.包含至少一個權利要求8的表達盒的重組載體。
10.由至少一個權利要求9的載體轉化的原核或真核宿主。
11.原核或真核宿主,在該宿主中,至少一個編碼權利要求7的多肽的基因的功能性表達受到調節(jié);或權利要求7的多肽的生物活性被降低或增加。
12.權利要求10或11的宿主,其來自阿舒氏囊霉屬。
13.權利要求8的表達盒、權利要求9的載體或權利要求10至12之任一項的宿主在維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)中的用途。
14.權利要求8的表達盒、權利要求9的載體或權利要求10至12之任一項的宿主在權利要求7的多肽的重組生產(chǎn)中的用途。
15.檢測可以用于調節(jié)維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)的效應物靶點的方法,其中,用效應物處理能夠通過微生物法生產(chǎn)維生素B2和/或其前體和/或其衍生物的微生物,所述效應物可以與選自權利要求7的多肽或其核酸編碼序列的靶點相互作用,尤其是結合;驗證效應物對微生物法生產(chǎn)的維生素B2和/或其前體和/或其衍生物的產(chǎn)量的影響;并且適當時分離該靶點。
16.調節(jié)維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)的方法,其中,用效應物處理能夠以微生物法生產(chǎn)維生素B2和/或其前體和/或其衍生物的微生物,所述效應物可以與選自權利要求7的多肽或其核酸編碼序列的靶點相互作用。
17.針對選自權利要求7的多肽或其核酸編碼序列的靶點的效應物,其中所述效應物選自a)抗體或其抗原結合片段;b)可以與權利要求7的多肽相互作用的不同于a)的多肽配體;c)可以調節(jié)權利要求7的多肽的生物活性的低分子量效應物;d)反義核酸序列。
18.微生物生產(chǎn)維生素B2和/或其前體和/或其衍生物的方法,其中在利于產(chǎn)生維生素B2和/或其前體和/或其衍生物的條件下培養(yǎng)權利要求10至12之任一項的宿主,自培養(yǎng)混合物中分離所需的產(chǎn)物。
19.權利要求18的方法,其中用權利要求17的效應物在培養(yǎng)前和/或培養(yǎng)過程中處理宿主。
20.權利要求18或19的方法,其中宿主選自阿舒氏囊霉屬微生物。
21.權利要求18至20之任一項的方法,其中微生物為權利要求10至12之任一項的宿主。
22.權利要求1至4和6之任一項的多核苷酸或權利要求7的多肽作為靶點在調節(jié)阿舒氏囊霉屬微生物的維生素B2和/或其前體和/或其衍生物的生產(chǎn)中的用途。
23.權利要求1至4和6之任一項的多核苷酸或權利要求7的多肽作為靶點在培養(yǎng)阿舒氏囊霉屬微生物生產(chǎn)維生素B2和/或其前體和/或其衍生物的過程中的用途,用于調節(jié)阿舒氏囊霉屬微生物的代謝功能。
24.權利要求12的宿主,其具有改善的代謝調節(jié)作用或改變的代謝功能。
全文摘要
本發(fā)明涉及來自棉桃阿舒氏囊霉的新穎多核苷酸;與之雜交的寡核苷酸;包含這些多核苷酸的表達盒和載體;用其轉化的微生物;由這些多核苷酸編碼的多肽;及該新穎多肽和多核苷酸作為靶點在調節(jié)阿舒氏囊霉屬微生物的代謝反應,且尤其是改善阿舒氏囊霉屬微生物的維生素B2生產(chǎn)中的用途。
文檔編號C07K16/40GK1604964SQ02816225
公開日2005年4月6日 申請日期2002年8月23日 優(yōu)先權日2001年8月23日
發(fā)明者M·考羅什, H·阿爾特赫費, B·克勒格爾, J·L·雷韋爾塔多瓦爾 申請人:巴斯福股份公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1