本發(fā)明屬于生物技術(shù)領(lǐng)域,具體涉及一種來源于海洋細(xì)菌蛋白酯酶及其表達(dá)純化、晶體結(jié)構(gòu)以及在手性藥物前體篩選以及制備工業(yè)酶制劑中的應(yīng)用。
背景技術(shù):
酯酶(esterase EC 3.1.1.1)是一類能夠?qū)⒅愅ㄟ^化學(xué)反應(yīng)分解為酸和醇的水解酶類。酯酶通常存在一個由絲氨酸、組氨酸和天冬氨酸三個氨基酸殘基組成的催化三角為其活性中心;其中,絲氨酸殘基經(jīng)常出現(xiàn)在GXSXG這樣一個保守的五肽序列中。大部分酯酶催化反應(yīng)時不需要輔助因子參與,并且對反應(yīng)底物具有廣泛性和一定的立體結(jié)構(gòu)特異性,這些特性使其作為一種生物催化劑越來越受到人們關(guān)注。如今,酯酶作為一種環(huán)境友好、經(jīng)濟(jì)并且清潔的催化劑,在食品、造紙、精細(xì)化學(xué)合成以及醫(yī)療診斷等領(lǐng)域扮演著越來越重要的角色。工業(yè)上應(yīng)用的酯酶主要來源于不同的生物體內(nèi),特別是來自于真菌和細(xì)菌,這主要是由于微生物來源的酯酶具有產(chǎn)量高、反應(yīng)穩(wěn)定、副產(chǎn)物毒性小及分子生物學(xué)操作簡單等優(yōu)點。
海洋來源的酯酶通常具有與海洋環(huán)境相關(guān)的優(yōu)良性質(zhì),例如溫度穩(wěn)定性、耐鹽性、耐堿性、耐低溫、以及優(yōu)異的手性選擇性等等,因此,從海洋微生物中篩選出獨具特性的酯酶就成了手性藥物前體篩選及開發(fā)新型工業(yè)酶制劑的一個重要方向。本發(fā)明利用結(jié)晶的方法得到了酯酶E10的蛋白晶體并解析了其三維結(jié)構(gòu)。E10晶體結(jié)構(gòu)可在手性藥物前體篩選、工業(yè)酶制劑中底物改造及提高酶活方面具有廣泛的應(yīng)用前景。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于提供一種來源于海洋細(xì)菌的蛋白酯酶E10及其表達(dá)純化、晶體結(jié)構(gòu)和應(yīng)用。
本發(fā)明包括提供對來源于海洋細(xì)菌Croceicoccus marinus E4A9T的酯酶E10進(jìn)行基因工程改造,以獲得在大腸桿菌中的高效表達(dá)、純化和結(jié)晶的方法,以及所述酯酶E10第12位到第205位氨基酸的三維晶體結(jié)構(gòu)及其在工業(yè)方面的應(yīng)用。
本發(fā)明首先提供一種來源于海洋細(xì)菌Croceicoccus marinus E4A9T的酯酶E10,其含有205個氨基酸,分子量為22.36kDa;氨基酸序列如SEQ.ID.NO.1所示,核酸序列如SEQ.ID.NO.2所示。
本發(fā)明還對來源于海洋細(xì)菌Croceicoccus marinus E4A9T的酯酶E10進(jìn)行基因工程改造,將其全長基因克隆在pSMT3的載體上。
本發(fā)明優(yōu)先選擇使用大腸桿菌的原核細(xì)胞表達(dá)系統(tǒng)(但不排除其他的表達(dá)系統(tǒng),如在其它細(xì)菌或者其他的真核生物細(xì)胞中進(jìn)行表達(dá));對以上所述蛋白以融合蛋白的方式進(jìn)行表達(dá),優(yōu)先選擇了His標(biāo)簽得到了可溶性表達(dá)(但不排除其它標(biāo)簽,如MBP或GST等標(biāo)簽也有可溶性表達(dá))。
本發(fā)明還提供一種表達(dá)和純化來源于海洋細(xì)菌Croceicoccus marinus E4A9T的酯酶E10的方法,該方法包括:構(gòu)建融合未突變的E10全長基因的重組載體,用該載體轉(zhuǎn)化大腸桿菌,從而表達(dá)帶有標(biāo)簽的融合蛋白E10,將上述獲得的蛋白通過特異性的與所述特異標(biāo)簽識別的方法,優(yōu)選Ni親和層析(分離原理為:低咪唑濃度緩沖液進(jìn)行上樣,高咪唑濃度緩沖液進(jìn)行洗脫)分離目的蛋白,再通過凝膠過濾層析的方法得到高純度的E10的蛋白。
其中,擴(kuò)增酯酶全基因的上游引物為:
E10F(5’-TCGCGGATCCGTGGCGGACGGCGAGGC-3’,BamHI)(SEQ.ID.NO.3)
下游引物為:
E10R(5’-TCCGCTCGAGCTAGAGGTCGTCGATCCTGTC-3’,XhoI);(SEQ.ID.NO.4)
表達(dá)質(zhì)粒為pSMT3,轉(zhuǎn)化方法為CaCl2轉(zhuǎn)化法,轉(zhuǎn)化菌株為大腸桿菌DH5α,表達(dá)菌株為大腸桿菌BL21(DE3)。
其中,所述Ni親和層析的平衡緩沖液優(yōu)先選擇50mM Tris(pH 8.0),500mM NaCl,5%甘油,10mM咪唑,2mMβ-Me,0.2mM PMSF。所述Ni親和層析洗脫緩沖液優(yōu)先選擇50mM Tris,pH 8.0,500mM NaCl,5%甘油,250mM咪唑,2mMβ-Me;所述凝膠過濾層析的緩沖液優(yōu)先選擇20mM Tris(pH7.4),100mM NaCl,2mM DTT。
本發(fā)明還提供對上述得到的酯酶E10進(jìn)行結(jié)晶的方法,具體步驟為:將酯酶E10濃縮至濃度為10-40mg/ml,使用結(jié)晶試劑盒(來自Hampton Research等公司的Crystal Screen Kit I/II,Index,Salt,PEG/Ion等)作為晶體生長的初篩條件,采用懸滴氣相擴(kuò)散法進(jìn)行結(jié)晶。溫度為4-25攝氏度,優(yōu)先選擇使用18攝氏度。
結(jié)晶條件:采用懸滴氣相擴(kuò)散法進(jìn)行結(jié)晶,結(jié)晶液滴中蛋白溶液與結(jié)晶試劑體積比在2:1至1:2的范圍內(nèi),優(yōu)選體積比為1:1,蛋白溶液中蛋白質(zhì)濃度為20-30mg/ml,結(jié)晶條件為150mM乙酸鈣,100mM咪唑(pH 8.5),10%PEG 8000。晶體培養(yǎng)在4至25攝氏度(優(yōu)選18攝氏度)進(jìn)行。
本發(fā)明還提供衍射性能良好的酯酶E10蛋白質(zhì)的晶體。
本發(fā)明還提供酯酶E10(酯酶E10第12位到第205位氨基酸)的三維結(jié)構(gòu),該結(jié)構(gòu)描述了酯酶E10的二級結(jié)構(gòu)組成,肽鏈走向、組織模式以及三維分子構(gòu)造。其中,針對酯酶E10蛋白進(jìn)行衍射,得到酯酶E10蛋白的晶體衍射數(shù)據(jù),以來源于細(xì)菌Pseudomonas aeruginosa的同源的GDSL家族酯酶TesA(PDB ID:4JGG)為模型進(jìn)行結(jié)構(gòu)解析,最終得到酯酶E10蛋白的三維結(jié)構(gòu)。
在具體的實施方式中,提供了酯酶E10的晶體三維結(jié)構(gòu),其中,所述晶體三維結(jié)構(gòu)中的原子具有表1中所列的至少一部分的原子坐標(biāo),或者任何與該坐標(biāo)中至少40%氨基酸殘基的主鏈碳骨架的原子三維坐標(biāo)的平均根方差小于或等于的結(jié)構(gòu)。
本發(fā)明獲得了優(yōu)選酯酶E10的晶體三維結(jié)構(gòu),分辨率為其晶體結(jié)構(gòu)空間群為C2。晶胞參數(shù)為:α=γ=90.000°,β=99.055°。
本發(fā)明所述的酯酶E10或其可折疊部分的晶體結(jié)構(gòu),具有圖1中列出的原子坐標(biāo)(x,y,z)±(1.0,1.0,1.0)確定的三維結(jié)構(gòu)。
在一具體的實施方式中,所述的酯酶E10的三維結(jié)構(gòu)在一個晶體學(xué)不對稱單位內(nèi)有兩個蛋白分子。該結(jié)構(gòu)共由5個β折疊、9個α螺旋及3個310螺旋組成。
其中,所述的5個β折疊位于中心,所述的9個α螺旋圍繞在β折疊的周圍。其中,β折疊1,即含Ile21-Gly27的氨基酸區(qū)段;α螺旋1,即含Ser29-Ala32的氨基酸區(qū)段;310螺旋1,即含Arg38-Glu40的氨基酸區(qū)段;α螺旋2,即含Tyr42-Arg53的氨基酸區(qū)段;β折疊2,即含Val57-Gly63的氨基酸區(qū)段;α螺旋3,即含Thr69-Ser82的氨基酸區(qū)段;β折疊3,即含Leu89-Glu93的氨基酸區(qū)段;α螺旋4,即含Ala96-Arg101的氨基酸區(qū)段;α螺旋5,即含Ala105-Ser170的氨基酸區(qū)段,β折疊4,即含Val126-Tyr129的氨基酸區(qū)段;310螺旋2,即含Pro135-Leu137的氨基酸區(qū)段;α螺旋6,即含Gly139-Asp146的氨基酸區(qū)段;α螺旋7,即含Ser147-Tyr156的氨基酸區(qū)段;β折疊5,即含Glu159-Val161的氨基酸區(qū)段;α螺旋8,即含Ile165-Phe170的氨基酸區(qū)段;310螺旋3,即含Ala172-Leu174的氨基酸區(qū)段;α螺旋9,即含Ala184-Asp204的氨基酸區(qū)段。
本發(fā)明還提供酯酶E10發(fā)揮酯酶水解功能的作用機(jī)制。所述的酯酶E10的晶體結(jié)構(gòu),第29位絲氨酸(Ser29),第178位天冬氨酸(Asp178)與第181位組氨酸(His181)所構(gòu)成的催化三連體組成活性中心?;钚灾行谋灰粋€咪唑分子占據(jù),如圖3所示。
所述酯酶E10的晶體結(jié)構(gòu),第29位絲氨酸(Ser29),第66位甘氨酸(Gly66)與第97位天冬酰胺(Asn97)所構(gòu)成的氧離子通道。
本發(fā)明還提供該酯酶E10的三維結(jié)構(gòu)在手性藥物前體篩選、工業(yè)酶制劑中底物改造及提高酶活方面的應(yīng)用。
附圖說明
圖1為酯酶E10的三維結(jié)構(gòu)示意圖。其中,(a)酯酶E10三維結(jié)構(gòu)卡通示意圖。A鏈用綠色表示,B鏈用青色表示,活性位點的氨基酸以棍狀形式展示其所在位置;(b)酯酶E10活性位點示意圖,顏色標(biāo)記與(a)圖相同,電子云密度level=1.0;(c)酯酶E10單體三維結(jié)構(gòu)卡通示意圖,α螺旋用藍(lán)色標(biāo)記,β折疊使用黃色標(biāo)記,310螺旋用洋紅色表示,無規(guī)則卷曲用綠色表示。
圖2為酯酶E10的分子篩及SDS-PAGE檢測結(jié)果。其中,上:E10分子篩結(jié)果示意圖,使用的柱子為Superdex 200 10/300(GE,美國);下:E10分子篩洗脫樣品的SDS-PAGE檢測結(jié)果,左邊泳道為蛋白Marker。
圖3為活性中心的咪唑分子與周圍氨基酸相互作用示意圖。其中,A鏈用綠色表示,B鏈用青色表示,咪唑分子用紫色表示,電子云密度level=1.0。
具體實施方式
下面采用具體實施例進(jìn)一步說明本發(fā)明的內(nèi)容。
以下內(nèi)容是結(jié)合具體的優(yōu)選實施方式對本發(fā)明所作的進(jìn)一步詳細(xì)說明,不能認(rèn)定本發(fā)明的具體實施只局限于這些說明。對于本發(fā)明所屬技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干簡單推演或替換,都應(yīng)當(dāng)視為屬于本發(fā)明的保護(hù)范圍。
實施例1.酯酶E10的表達(dá)純化
來源于海洋細(xì)菌Croceicoccus marinus E4A9T的酯酶E10,其氨基酸序列如SEQ.ID.NO.1所示,核酸序列如SEQ.ID.NO.2所示。
通過分子克隆技術(shù)將酯酶E10的全長基因克隆到pSMT3的載體上,用來表達(dá)氨基末端融合6個His的融合蛋白,將重組載體轉(zhuǎn)化到大腸桿菌BL21(DE3)中,37℃振蕩培養(yǎng)至OD600達(dá)到0.8時加入終濃度為0.5mM的IPTG進(jìn)行誘導(dǎo)表達(dá),表達(dá)條件為:16℃振蕩培養(yǎng)20h或20℃振蕩培養(yǎng)16h或25℃振蕩培養(yǎng)8h。
將構(gòu)建好的重組表達(dá)載體轉(zhuǎn)化到大腸桿菌BL21(DE3)中進(jìn)行酯酶E10的可溶性表達(dá)。將以50μg/ml卡那霉素和34μg/ml氯霉素為選擇壓力,轉(zhuǎn)接重組表達(dá)菌株于含有上述選擇壓力的LB液體培養(yǎng)基中,37℃振蕩培養(yǎng)至OD600達(dá)到0.8時加入終濃度為0.5mM的IPTG進(jìn)行誘導(dǎo)表達(dá),優(yōu)選表達(dá)條件為:16℃振蕩培養(yǎng)20h。至OD600達(dá)到0.5-0.8時加入終濃度為0.5mM的IPTG進(jìn)行誘導(dǎo)表達(dá)。16℃,200rpm振蕩培養(yǎng),20小時后通過離心收集細(xì)菌,用于純化。
將離心收集的表達(dá)菌以適量緩沖液(50mM Tris(pH 8.0),500mM NaCl,5%甘油,10mM咪唑,2mMβ-Me,0.2mM PMSF)懸菌,使用低溫超高壓細(xì)胞破碎儀(廣州聚能生物科技有限公司)裂解菌體,以18000rpm高速離心1h去除沉淀和其它顆粒狀雜質(zhì)。將離心后上清液與Ni-NTA親和介質(zhì)結(jié)合后,用50mM Tris(pH 8.0),500mM NaCl,5%甘油,50mM咪唑,2mMβ-Me的緩沖液沖洗介質(zhì),去除雜蛋白。最終用50mM Tris(pH 8.0),500mM NaCl,5%甘油,250mM咪唑,2mMβ-Me的洗脫液將目的蛋白從親和介質(zhì)上洗脫下來,以10KDa截留的濃縮管將洗脫液濃縮。將濃縮后的蛋白溶液進(jìn)一步用凝膠過濾層析(superdex200,10/300)的方法純化,使用的緩沖液為20mM Tris(pH7.4),100mM NaCl,2mM DTT。將洗脫下來的目的蛋白進(jìn)行濃縮至濃度為20-30mg/ml,于-80℃保存,用于結(jié)晶實驗。
實施例2.酯酶E10的結(jié)晶
將如上方法表達(dá)純化好的酯酶E10濃縮至濃度約為10-30mg/ml,使用結(jié)晶試劑盒(來自Hampton Research等公司的Crystal Screen Kit I/II,Index,Salt,PEG/Ion等)作為晶體生長的初篩條件,采用懸滴氣象擴(kuò)散法進(jìn)行結(jié)晶。本發(fā)明在多個不同的結(jié)晶試劑條件下獲得了初始晶體。通過后期的優(yōu)化調(diào)整,優(yōu)選150mM乙酸鈣,100mM咪唑(pH 8-8.5),10-20%PEG 8000的緩沖液作為晶體生長條件,收集到一套分辨率為的X射線衍射數(shù)據(jù)。
實施例3.酯酶E10的收據(jù)收集及結(jié)構(gòu)解析
本發(fā)明將制備的晶體以25%的甘油作為防凍劑處理后,凍存于液氮中。晶體X射線衍射的數(shù)據(jù)收集在上海光源(SSRF)生物大分子晶體學(xué)光束線站(五線六站BL19U)進(jìn)行。數(shù)據(jù)處理使用HKL3000,結(jié)構(gòu)解析以來源于細(xì)菌Pseudomonas aeruginosa的同源的GDSL家族酯酶TesA(PDB ID:4JGG)為模型,采用分子置換法,利用Refmac程序并輔以Coot軟件做進(jìn)一步修正,最終解析得到酯酶E10蛋白的晶體結(jié)構(gòu)。本領(lǐng)域的普通技術(shù)人員可知,于其中所述晶體三維結(jié)構(gòu)中的原子具有表1中所列的至少40%的原子坐標(biāo),或者3D蛋白的晶體三維結(jié)構(gòu)中至少40%氨基酸的主鏈碳骨架的原子結(jié)構(gòu)坐標(biāo)與表1中的坐標(biāo)的平均根方差小于或等于的原子坐標(biāo),均可被認(rèn)為與3D蛋白具有雷同結(jié)構(gòu)。
具體而言,所述的酯酶E10的晶體三維結(jié)構(gòu),一個晶體學(xué)不對稱單位內(nèi)有兩個不對稱分子。由5個β折疊、9個α螺旋及3個310螺旋組成,其中,所述的5個β折疊位于中心,所述的9個α螺旋圍繞在β折疊的周圍。其中,β折疊1,即含Ile21-Gly27的氨基酸區(qū)段;α螺旋1,即含Ser29-Ala32的氨基酸區(qū)段;310螺旋1,即含Arg38-Glu40的氨基酸區(qū)段;α螺旋2,即含Tyr42-Arg53的氨基酸區(qū)段;β折疊2,即含Val57-Gly63的氨基酸區(qū)段;α螺旋3,即含Thr69-Ser82的氨基酸區(qū)段;β折疊3,即含Leu89-Glu93的氨基酸區(qū)段;α螺旋4,即含Ala96-Arg101的氨基酸區(qū)段;α螺旋5,即含Ala105-Ser170的氨基酸區(qū)段,β折疊4,即含Val126-Tyr129的氨基酸區(qū)段;310螺旋2,即含Pro135-Leu137的氨基酸區(qū)段;α螺旋6,即含Gly139-Asp146的氨基酸區(qū)段;α螺旋7,即含Ser147-Tyr156的氨基酸區(qū)段;β折疊5,即含Glu159-Val161的氨基酸區(qū)段;α螺旋8,即含Ile165-Phe170的氨基酸區(qū)段;310螺旋3,即含Ala172-Leu174的氨基酸區(qū)段;α螺旋9,即含Ala184-Asp204的氨基酸區(qū)段。
表1蛋白酯酶EST22晶體的原子坐標(biāo)群如下:
晶體空間群:C2
晶胞參數(shù)為:α=γ=90.000°,β=99.055°。
I/σI:16.81
Rwork/Rfree分別為:0.157和0.192
分辨率范圍98.5-1.9
數(shù)據(jù)完整性(%):98.38。
表1
SEQUENCE LISTING
<110> 復(fù)旦大學(xué)
<120> 一種嗜低溫蛋白酯酶E10及其表達(dá)純化、晶體結(jié)構(gòu)和應(yīng)用
<130> 001
<160> 4
<170> PatentIn version 3.3
<210> 1
<211> 205
<212> PRT
<213>
<400> 1
Met Ala Asp Gly Glu Ala Ala Gly Gln Gln Ala Asp Ala Val Met Pro
1 5 10 15
Thr Gly Pro Ala Ile Asp Val Leu Ala Phe Gly Asp Ser Leu Phe Ala
20 25 30
Gly Tyr Arg Leu Asp Arg Asp Glu Ser Tyr Pro Ala Arg Leu Gln Ala
35 40 45
Ala Leu Arg Glu Arg Gly Leu Asn Val Asn Val Thr Asn Ala Gly Val
50 55 60
Ser Gly Asp Thr Thr Ala Ala Gly Leu Gln Arg Ile Asp Phe Val Leu
65 70 75 80
Asp Ser Met Ala Gly Glu Pro Asp Leu Val Leu Leu Glu Leu Gly Ala
85 90 95
Asn Asp Met Leu Arg Gly Leu Pro Ala Glu Glu Ala Arg Arg Asn Leu
100 105 110
Asp Thr Ile Leu Gln Arg Leu Asp Gln Arg Asp Ile Pro Val Met Val
115 120 125
Tyr Gly Met Arg Ala Ala Pro Asn Leu Gly Gly Asp Tyr Gly Arg Ser
130 135 140
Phe Asp Ser Ile Phe Pro Asp Leu Ala Asp Lys Tyr Asp Ala Glu Leu
145 150 155 160
Val Pro Phe Phe Ile Glu Pro Leu Ile Phe Asp Arg Ser Leu Val Gln
165 170 175
Gln Asp Gln Leu His Pro Thr Ala Gln Gly Val Asp Ala Met Val Glu
180 185 190
Gln Thr Val Glu Gln Val Glu Asp Arg Ile Asp Asp Leu
195 200 205
<210> 2
<211> 618
<212> DNA
<213>
<400> 2
gtggcggacg gcgaggcggc gggtcagcag gccgatgcgg tcatgcccac cggccccgcc 60
atcgacgtgc tggcgttcgg cgacagcctg ttcgcgggat accggctgga ccgcgacgaa 120
tcctatcccg caaggcttca ggccgcgctg cgcgagcggg ggctgaacgt caatgtcacc 180
aacgccggag tatcgggcga taccacggcg gcggggctgc agcgcatcga cttcgtgctc 240
gattccatgg cgggagagcc cgatctggtg ctgctggaac tgggcgcgaa cgacatgctg 300
cgcggccttc cggccgagga agcgcggcgc aatctcgaca cgatcctgca gcggctcgac 360
cagcgcgaca tcccggtgat ggtctatggc atgcgcgccg cgcccaacct gggtggcgat 420
tacggccgca gcttcgacag catcttcccc gatctggccg acaaatacga tgccgaactc 480
gtgcccttct tcatcgagcc gctgatcttc gaccggtcgc tggtgcagca ggaccagctg 540
catcccacgg ctcagggcgt cgacgcgatg gtcgagcaga cggtcgagca ggtcgaggac 600
aggatcgacg acctctag 618
<210> 3
<211> 27
<212> DNA
<213>
<400> 3
tcgcggatcc gtggcggacg gcgaggc 27
<210> 4
<211> 31
<212> DNA
<213>
<400> 4
tccgctcgag ctagaggtcg tcgatcctgt c 31