亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

膜蛋白質的熱穩(wěn)定化突變體預測裝置、熱穩(wěn)定化突變體預測方法、以及程序與流程

文檔序號:11142292閱讀:497來源:國知局
膜蛋白質的熱穩(wěn)定化突變體預測裝置、熱穩(wěn)定化突變體預測方法、以及程序與制造工藝

本發(fā)明涉及膜蛋白質的熱穩(wěn)定化突變體預測裝置、熱穩(wěn)定化突變體預測方法、以及程序。



背景技術:

膜蛋白質占由基因組編碼的全部蛋白質的30%,在信號傳遞、物質運輸、生物體能量產(chǎn)生·轉換等細胞功能方面起到重要的作用。另外,同時,由于市售的藥品的60%左右作用于膜蛋白質,因此在創(chuàng)制新藥時也是重要的靶標。特別是,激素或神經(jīng)遞質等作為受體的G蛋白偶聯(lián)受體(GPCR)形成約800種的家族成員,估計有280種左右是創(chuàng)制新藥靶標。

近年來已經(jīng)發(fā)現(xiàn),為了設計、改良副作用少而效果高的藥劑,基于成為醫(yī)藥靶標的蛋白質的立體結構的醫(yī)藥分子設計(SBDD)是有效的。但是,GPCR存在有(1)熱穩(wěn)定性低而難以大量生產(chǎn)、(2)用于結晶化的親水性表面少而難以結晶化的問題,直到2007年還沒有獲得人類GPCR的詳細結構。

2007年,如非專利文獻1中記載所示,B.Kobilka和R.Stevens等人在人類腎上腺素受體的細胞內(nèi)第三環(huán)上融合T4溶菌酶(T4L),由此使受體熱穩(wěn)定化,同時擴大了親水性表面,利用被稱作脂質中間相法的方法進行結晶化,成功地進行了X射線晶體結構解析。如此所述,GPCR的(2)結晶化難的問題可以通過使用T4L融合或抗體來克服,然而對于(1)熱穩(wěn)定性低而難以大量生產(chǎn)的問題仍未充分解決,GPCR的9成以上還不能大量生產(chǎn)。

此處,專利文獻1等中,公開了如下的StaR(注冊商標)技術,即,為了提高熱穩(wěn)定性,將GPCR的各氨基酸包羅在內(nèi)地置換為丙氨酸,利用實驗研究了帶來熱穩(wěn)定性的提高的突變部位,利用這些突變部位的組合大幅度提高熱穩(wěn)定性而進行晶體結構解析,利用GPCR的結構彼此相似對其他種類的GPCR也提高了熱穩(wěn)定性。

現(xiàn)有技術文獻

專利文獻

專利文獻1:日本特表2011-505800號公報

非專利文獻

非專利文獻1:Vadim Cherezov,Daniel M.Rosenbaum,Michael A.Hanson,Soren G.F.Rasmussen,F(xiàn)oon Sun Thian,Tong Sun Kobilka,Hee-Jung Choi,Peter Kuhn,William I.Weis,Brian K.Kobilka,Raymond C.Stevens,“High-Resolution Crystal Structure of an Engineered Humanβ2-Adrenergic G Protein-Coupled Receptor”,Science 2007,Vol.318no.5854pp.1258-1265



技術實現(xiàn)要素:

發(fā)明所要解決的問題

但是,就StaR(注冊商標)技術而言,存在有如下的問題,即,需要借助實驗的網(wǎng)羅性解析,因此丙氨酸以外的其他氨基酸置換的效果不明,另外,為了進行針對GPCR等其他膜蛋白質的新的相同的解析,需要花費相當多的時間和勞力。

本發(fā)明是鑒于上述問題而完成的,其目的在于,提供可以利用計算機預測膜蛋白質中使之發(fā)生熱穩(wěn)定化的氨基酸突變的熱穩(wěn)定化突變體預測裝置、熱穩(wěn)定化突變體預測方法、以及程序。

用于解決問題的方法

為了達成此種目的,本發(fā)明的熱穩(wěn)定化突變體預測裝置的特征在于,是預測使膜蛋白質發(fā)生熱穩(wěn)定化的氨基酸突變體的候選的、具備存儲部和控制部的熱穩(wěn)定化突變體預測裝置,上述存儲部存儲上述膜蛋白質的氨基酸序列,上述控制部具備:突變導入機構,其將氨基酸突變導入上述膜蛋白質的上述氨基酸序列,由此生成上述氨基酸突變體的氨基酸序列;計算機構,其對于上述膜蛋白質及上述各氨基酸突變體,計算伴隨著基于上述氨基酸序列的結構最佳化的膜貫穿部位的、從一級結構形成到三級結構形成的溶劑化熵變(溶媒和エントロピー変化)或從二級結構形成到三級結構形成的溶劑化熵變;和候選選取機構,基于上述膜蛋白質的上述溶劑化熵變與上述氨基酸突變體的上述溶劑化熵變的差,選取上述使之發(fā)生熱穩(wěn)定化的氨基酸突變體的候選。

另外,本發(fā)明的熱穩(wěn)定化突變體預測裝置的特征在于,在上述記載的熱穩(wěn)定化突變體預測裝置中,上述計算機構還對于上述膜蛋白質及上述各氨基酸突變體,計算伴隨著基于上述氨基酸序列的上述結構最佳化的上述膜貫穿部位的、從上述一級結構形成到上述三級結構形成的能量變化或從上述二級結構形成到上述三級結構形成的能量變化,上述候選選取機構基于作為在上述膜蛋白質的上述能量變化與上述氨基酸突變體的上述能量變化的差、以及上述膜蛋白質的上述溶劑化熵變與上述氨基酸突變體的上述溶劑化熵變的差上乘以絕對溫度而得的值之和的變化量,選取上述使之發(fā)生熱穩(wěn)定化的氨基酸突變體的候選。

另外,本發(fā)明的熱穩(wěn)定化突變體預測裝置的特征在于,在上述記載的熱穩(wěn)定化突變體預測裝置中,上述計算機構使用基于排除體積、露出表面積、露出表面的平均曲率的積分值、以及露出表面的高斯曲率的積分值的4個幾何學指標的形態(tài)計測學的表現(xiàn)與積分方程式論的綜合型方法論,計算上述溶劑化熵變。

另外,本發(fā)明的熱穩(wěn)定化突變體預測裝置的特征在于,在上述記載的熱穩(wěn)定化突變體預測裝置中,上述存儲部還存儲上述膜蛋白質的結構數(shù)據(jù),上述計算機構基于上述氨基酸序列及上述結構數(shù)據(jù)進行結構最佳化。

另外,本發(fā)明的熱穩(wěn)定化突變體預測裝置的特征在于,在上述記載的熱穩(wěn)定化突變體預測裝置中,上述計算機構首先將上述膜蛋白質的重原子固定而進行最小化,然后,將Cα碳及Cβ碳固定而進行最小化,最后,不固定地進行最小化,由此在分階段地去掉約束的同時進行上述結構最佳化。

另外,本發(fā)明的熱穩(wěn)定化突變體預測裝置的特征在于,在上述記載的熱穩(wěn)定化突變體預測裝置中,上述計算機構中,作為上述溶劑化熵變計算在進行上述結構最佳化后取出上述膜貫穿部位而得的上述三級結構的溶劑化熵、與拆分該三級結構而得的上述二級結構的溶劑化熵的變化。

另外,本發(fā)明的熱穩(wěn)定化突變體預測裝置的特征在于,在上述記載的熱穩(wěn)定化突變體預測裝置中,上述計算機構中,作為上述溶劑化熵變計算在取出上述膜貫穿部位后進行上述結構最佳化而得的上述三級結構的溶劑化熵、與拆分(引き離す)所取出的該膜貫穿部位后進行上述結構最佳化而得的上述二級結構的溶劑化熵的變化。

另外,本發(fā)明的熱穩(wěn)定化突變體預測裝置的特征在于,在上述記載的熱穩(wěn)定化突變體預測裝置中,上述計算機構中,作為上述溶劑化熵變計算在進行上述結構最佳化后取出上述膜貫穿部位而得的上述三級結構的溶劑化熵、與取出上述膜貫穿部位并拆分該膜貫穿部位后進行上述結構最佳化而得的上述二級結構的溶劑化熵的變化。

另外,本發(fā)明的熱穩(wěn)定化突變體預測裝置的特征在于,在上述記載的熱穩(wěn)定化突變體預測裝置中,上述計算機構中,作為上述溶劑化熵變計算在進行上述結構最佳化后取出上述膜貫穿部位而得的上述三級結構的溶劑化熵、與取出上述膜貫穿部位并伸展該膜貫穿部位后進行上述結構最佳化而得的上述一級結構的溶劑化熵的變化。

另外,本發(fā)明的熱穩(wěn)定化突變體預測裝置的特征在于,在上述記載的熱穩(wěn)定化突變體預測裝置中,上述計算機構中,作為上述溶劑化熵變計算在取出上述膜貫穿部位后進行上述結構最佳化而得的上述三級結構的溶劑化熵、與取出上述膜貫穿部位并拆分該膜貫穿部位而伸展后進行上述結構最佳化而得的上述一級結構的溶劑化熵的變化。

另外,本發(fā)明涉及一種熱穩(wěn)定化突變體預測方法,其特征在于,是在具備存儲膜蛋白質的氨基酸序列的存儲部和控制部的計算機中執(zhí)行的、預測上述使膜蛋白質發(fā)生熱穩(wěn)定化的氨基酸突變體的候選的熱穩(wěn)定化突變體預測方法,包括:突變導入步驟,將氨基酸突變導入上述膜蛋白質的上述氨基酸序列,由此生成上述氨基酸突變體的氨基酸序列;計算步驟,對于上述膜蛋白質及上述各氨基酸突變體,計算伴隨著基于上述氨基酸序列的結構最佳化的膜貫穿部位的、從一級結構形成到三級結構形成的溶劑化熵變或從二級結構形成到三級結構形成的溶劑化熵變;和候選選取步驟,基于上述膜蛋白質的上述溶劑化熵變與上述氨基酸突變體的上述溶劑化熵變的差,選取上述使之發(fā)生熱穩(wěn)定化的氨基酸突變體的候選。

另外,本發(fā)明涉及一種程序,其特征在于,是用于使上述具備存儲膜蛋白質的氨基酸序列的存儲部和控制部的計算機執(zhí)行用于預測使膜蛋白質發(fā)生熱穩(wěn)定化的氨基酸突變體的候選的程序,使計算機執(zhí)行:突變導入步驟,將氨基酸突變導入上述膜蛋白質的上述氨基酸序列,由此生成上述氨基酸突變體的氨基酸序列;計算步驟,對于上述膜蛋白質及上述各氨基酸突變體,計算伴隨著基于上述氨基酸序列的結構最佳化的膜貫穿部位的、從一級結構形成到三級結構形成的溶劑化熵變或從二級結構形成到三級結構形成的溶劑化熵變;和候選選取步驟,基于上述膜蛋白質的上述溶劑化熵變與上述氨基酸突變體的上述溶劑化熵變的差,選取上述使之發(fā)生熱穩(wěn)定化的氨基酸突變體的候選。

另外,本發(fā)明涉及一種記錄介質,其特征在于,記錄有上述記載的程序。

發(fā)明效果

根據(jù)本發(fā)明,存儲膜蛋白質的氨基酸序列,并將氨基酸突變導入膜蛋白質的氨基酸序列,由此生成氨基酸突變體的氨基酸序列,對于膜蛋白質及各氨基酸突變體,計算伴隨著基于氨基酸序列的結構最佳化的膜貫穿部位的、從一級結構形成到三級結構形成的溶劑化熵變或從二級結構形成到三級結構形成的溶劑化熵變,基于膜蛋白質的溶劑化熵變與氨基酸突變體的溶劑化熵變的差,選取使之發(fā)生熱穩(wěn)定化的氨基酸突變體的候選,因此可以起到可以利用計算機(in silico)預測膜蛋白質中使之發(fā)生熱穩(wěn)定化的氨基酸突變的效果。

另外,由于本發(fā)明使用基于排除體積、露出表面積、露出表面的平均曲率的積分值、以及露出表面的高斯曲率的積分值的4個幾何學指標的形態(tài)計測學的表現(xiàn)與積分方程式論的綜合型方法論,來計算溶劑化熵變,因此能夠起到可以通過在形態(tài)計測學上將溶質的形態(tài)簡化處置而高速地計算溶劑化熵的效果。

另外,由于本發(fā)明還存儲膜蛋白質的結構數(shù)據(jù),并基于氨基酸序列及結構數(shù)據(jù)進行結構最佳化,因此能夠起到可以利用已知的結構數(shù)據(jù)準確地實現(xiàn)結構的最佳化的效果。

另外,由于本發(fā)明首先將膜蛋白質的重原子固定而最小化(ミニマイズ),然后,將Cα碳及Cβ碳固定而最小化,最后,不固定地進行最小化,由此在分階段地去掉約束的同時進行結構最佳化,因此能夠起到可以獲得精度更好的預測結構的效果。

另外,由于本發(fā)明中作為溶劑化熵變計算在進行結構最佳化后取出膜貫穿部而得的三級結構的溶劑化熵、與拆分該三級結構而得的二級結構的溶劑化熵的變化,因此能夠起到可以獲得預測準確率較高的結果(作為一個實施例為5/11)的效果。

另外,由于本發(fā)明中作為溶劑化熵變計算在取出膜貫穿部位后進行結構最佳化而得的三級結構的溶劑化熵、與拆分所取出的該膜貫穿部位后進行結構最佳化而得的二級結構的溶劑化熵的變化,因此能夠起到可以獲得預測準確率高的結果(作為一個實施例為1/4)。

另外,由于本發(fā)明中作為溶劑化熵變計算在進行結構最佳化后取出膜貫穿部位而得的三級結構的溶劑化熵、與取出膜貫穿部位并拆分該膜貫穿部位后進行結構最佳化而得的二級結構的溶劑化熵的變化,因此能夠起到可以獲得預測準確率高的結果(作為一個實施例為3/11)的效果。

另外,由于本發(fā)明中作為溶劑化熵變計算在進行結構最佳化后取出膜貫穿部位而得的三級結構的溶劑化熵、與取出膜貫穿部位并伸展該膜貫穿部位后進行結構最佳化而得的一級結構的溶劑化熵的變化,因此能夠起到可以獲得預測準確率高的結果(作為一個實施例為5/11)的效果。

另外,由于本發(fā)明中作為溶劑化熵變計算在取出膜貫穿部位后進行結構最佳化而得的三級結構的溶劑化熵、與取出膜貫穿部位并拆分該膜貫穿部位而伸展后進行結構最佳化而得的一級結構的溶劑化熵的變化,因此能夠起到可以獲得預測準確率高的結果(作為一個實施例為2/4)的效果。

附圖說明

圖1是熱力學循環(huán)(T0=298K)中的N原子為給體、O原子為受體時的圖。

圖2是熱力學循環(huán)(T0=298K)中的N原子為給體、O原子為受體時的圖。

圖3是示意性地表示脂質雙層膜層(脂質二重膜層)中的磷脂分子的旋轉、擴散、翻轉、彎曲的運動的圖。

圖4是示意性地表示烴基和球狀溶質的半徑之和R的圖。伴隨著具有15種(通り)直徑的球狀溶質的插入,可以獲得15種(R,S)的組。

圖5是表示針對膜蛋白質的立體結構形成的兩階段模型的圖。

圖6是表示由2個結構單元構成的GlyCophorinA(GpA)的天然結構(NS)、和利用復制交換蒙特卡洛模擬產(chǎn)生的偽結構(偽者構造)的圖。

圖7是對于GpA的天然結構(NS)和15000個偽結構在橫軸繪制與正解結構的最小平方偏差、在縱軸繪制無量綱化了的自由能量差的圖。

圖8是對于GpA的天然結構(NS)和15000個偽結構在橫軸繪制與正解結構的最小平方偏差、在縱軸繪制無量綱化了的能量成分差的圖。

圖9是對于GpA的天然結構(NS)和15000個偽結構在橫軸繪制與正解結構的最小平方偏差、在縱軸繪制熵成分(溶劑化熵)差的圖。

圖10是表示應用本實施方式的本熱穩(wěn)定化突變體預測裝置100的一例的方框圖,僅示意性地表示了該構成中與本實施方式有關的部分。

圖11是表示利用熱穩(wěn)定化突變體預測裝置100執(zhí)行的處理的一例的流程圖。

圖12是示意性地表示本實施方式的熱穩(wěn)定化突變體預測裝置100的、膜蛋白質的溶劑化熵變-ΔSw和氨基酸突變體的溶劑化熵變-ΔSm的計算方法的圖。

圖13是表示方式2、3的拆分螺旋后進行結構最佳化的樣子的圖。

圖14是表示方式4、5的將螺旋伸展至一級結構而得的結構的例子的圖。

圖15是表示本實施方式的方式1~5中共同的步驟的流程圖。

圖16是表示方式1的處理例的流程圖。

圖17是表示方式2的處理例的流程圖。

圖18是表示方式3的處理例的流程圖。

圖19是表示方式4的處理例的流程圖。

圖20是表示方式5的處理例的流程圖。

圖21是表示針對實驗中發(fā)生穩(wěn)定化的將第88個殘基的蘇氨酸置換為谷氨酸的突變體的利用方式1~5所得的計算結果(-ΔΔS)的圖。

圖22是表示針對實驗中發(fā)生穩(wěn)定化(熱變性溫度升高8℃)的將第91個殘基的絲氨酸置換為精氨酸的突變體的利用方式1~5所得的計算結果-ΔΔS的圖。

圖23是表示針對實驗中發(fā)生不穩(wěn)定化的將第245個殘基的半胱氨酸置換為色氨酸的突變體的利用方式1~5所得的計算結果-ΔΔS的圖。

圖24是表示針對實驗中發(fā)生不穩(wěn)定化的將第51個殘基的丙氨酸置換為色氨酸的突變體的利用方式1~5所得的計算結果-ΔΔS的圖。

圖25是表示針對實驗中發(fā)生不穩(wěn)定化的將第239個殘基的纈氨酸置換為精氨酸的突變體的利用方式1~5所得的計算結果-ΔΔS的圖。

圖26是對5種氨基酸突變預測利用方式1~5得到的熱穩(wěn)定化突變體的結果的表。

圖27是表示方式1的-ΔΔS的計算結果的圖表。

圖28是表示方式2的-ΔΔS的計算結果的圖表。

圖29是表示方式3的-ΔΔS的計算結果的圖表。

圖30是表示方式4的-ΔΔS的計算結果的圖表。

圖31是表示方式5的-ΔΔS的計算結果的圖表。

圖32是對各氨基酸突變預測利用方式1~5得到的熱穩(wěn)定化突變體的結果的表。

圖33是表示利用熱穩(wěn)定化突變體預測裝置執(zhí)行的處理的一例的流程圖。

圖34是表示形成一個分子內(nèi)氫鍵時的能量降低的值的圖。

圖35是表示Λ的處理例的流程圖。

圖36是表示預測結果的一例的圖。

圖37是表示對S91R計算的方式1~5的ΔΔF的值的圖。

圖38是表示對S91K計算的方式1~5的ΔΔF的值的圖。

圖39是表示對L85R計算的方式1~5的ΔΔF的值的圖。

圖40是表示對N280R計算的方式1~5的ΔΔF的值的圖。

圖41是表示對N181K計算的方式1~5的ΔΔF的值的圖。

圖42是表示預測結果的一例的圖。

圖43是表示對S91R計算的方式1~5的-ΔΔS的值的圖。

圖44是表示對S91K計算的方式1~5的-ΔΔS的值的圖。

圖45是表示對L85R計算的方式1~5的-ΔΔS的值的圖。

圖46是表示對N280R計算的方式1~5的-ΔΔS的值的圖。

圖47是表示對N181K計算的方式1~5的-ΔΔS的值的圖。

具體實施方式

以下,基于附圖對本發(fā)明的熱穩(wěn)定化突變體預測裝置、熱穩(wěn)定化突變體預測方法、以及程序的實施方式進行詳細說明。而且,本發(fā)明并不受該實施方式限定。

[本實施方式的概要]

以下,為了說明本發(fā)明的實施方式的概要,首先對本申請發(fā)明人等所開發(fā)的形態(tài)計測學的表現(xiàn)和積分方程式論的綜合型方法論進行說明,其后,對本實施方式的概要、構成及處理等進行詳細說明。

[綜合型方法論]

本申請發(fā)明人等以因水分子的并進移動而引起的熵效應作為主要著眼點,利用獨自開發(fā)的液體的統(tǒng)計力學理論與形態(tài)計測學的方法的綜合型方法論,成功地提供了水溶液中的蛋白質的熱變性的圖像。

本實施方式中,應用該綜合型方法論,以因構成磷脂分子的疏水鏈的CH、CH2、CH3基團(可以將它們的集合視為溶劑)的并進移動而引起的熵效應作為主要著眼點,目的在于,在理論上預測由氨基酸置換造成的膜蛋白質的溶劑化熵的變化。此處,膜蛋白質用的自由能量函數(shù)F由下式表示。

F=-TS+Λ

(T:絕對溫度、S:熵成分、Λ:能量成分)

將上述的式子除以kBT0(kB:玻爾茲曼常數(shù),T0=298K)而無量綱化,如果設定T=T0,則形成下式。

F/(kBT0)=-S/kB+Λ/(kBT0)

此處,圖1及圖2是熱力學循環(huán)(T0=298K)中的N原子為給體、O原子為受體時的圖。如圖1所示,以完全伸展的結構(完全不具有分子內(nèi)氫鍵)為基準,計算“伴隨著分子內(nèi)氫鍵形成的能量降低=分子內(nèi)氫鍵數(shù)*D”。

此處,D是形成1個分子內(nèi)氫鍵時的能量降低的值。另外,D也可以是甲酰胺在非極性溶劑中形成1條氫鍵時產(chǎn)生的能量降低值(例如-14kBT0等)。

例如,也可以如圖2所示,以完全伸展的結構(完全不具有分子內(nèi)氫鍵)為基準,計算“伴隨著分子內(nèi)氫鍵形成的能量降低=分子內(nèi)氫鍵數(shù)*(-14kBT0)”。此處,-14kBT0是甲酰胺在非極性溶劑中形成1條氫鍵時產(chǎn)生的能量降低值。

此后,研究主鏈-主鏈、主鏈-側鏈、側鏈-側鏈間的所有給體和受體,計數(shù)分子內(nèi)氫鍵數(shù),計算“Λ=伴隨著分子內(nèi)氫鍵形成的能量降低(負)”。而且,假定為蛋白質分子內(nèi)的范德華引力相互作用的獲得與蛋白質-磷脂間的范德華引力相互作用的喪失相抵消。此處,圖3是示意性地表示出脂質雙層膜層中的磷脂分子的旋轉、擴散、翻轉、彎曲的運動的圖(參考:東京大學生命科學結構化中心/生命科學網(wǎng)絡LS-EDI生命科學教育用圖像集《脂質雙層的性質》URL:http://Csls-db.C.u-tokyo.aC.jp/searCh/detail?image_repository_id=696)。

如圖3所示,當由于磷脂的劇烈熱運動而引起的蛋白質向膜內(nèi)的插入時,就會發(fā)生熵的損失。而且,熵以磷脂分子的烴基集團的并進配置熵為代表。損失的大小以立體結構的函數(shù)表示,損失盡可能變小的立體結構會穩(wěn)定化。此處,將S設為伴隨著插入的烴基集團的并進配置熵損失(負)。

在將磷脂分子的烴基集團視為溶劑的情況下,S就成為溶劑化熵(將固定為某個立體結構的溶質插入溶劑中時產(chǎn)生的溶劑的熵損失:負的量)。

本實施方式中,在計算溶劑化熵S時,可以使用本申請發(fā)明人等設計出的形態(tài)計測學的表現(xiàn)與積分方程式論的綜合型方法論,實現(xiàn)高速的運算。

就形態(tài)計測學的表現(xiàn)而言,對于溶質的立體結構,可以基于4個幾何學指標(排除體積V、露出表面積A、露出表面的平均曲率的積分值X、以及露出表面的高斯曲率的積分值Y),計算溶劑化熵。即,溶劑化熵S的表現(xiàn)式由以下的線性組合表示。

S/kB=C1V+C2A+C3X+C4Y

此處,排除空間是“溶劑分子的中心不能進入的空間”,排除空間的體積為排除體積V,排除空間的表面積為露出表面積A。排除空間也是具有各種半徑的球的結合體,來自于半徑r的球的對X、Y的貢獻如下所示。

“對X的貢獻=在平均曲率1/r上乘以該球的露出表面積ξ而得的值;

對Y的貢獻=在高斯曲率1/r2上乘以ξ而得的值“。

而且,根據(jù)形態(tài)計測學,由于4個形態(tài)指標的系數(shù)C1、C2、C3、C4不依賴于溶質的幾何學的特性,因此可以利用簡化了的形態(tài)(例如球)進行處理。由此,可以作為將形態(tài)簡化了的球來理解,計算伴隨著具有各種直徑的球狀溶質的插入的熵損失。本實施方式中,使用積分方程式論,將烴基集團作為剛體球溶劑加以模型化而進行計算。根據(jù)對于球狀溶質的形態(tài)計測學的表現(xiàn),得到以下的式子。

S/kB=C1(4πR3/3)+C2(4πR2)+C3(4πR)+C4(4π),

R=(dU+dS)/2

此處,dS為溶劑分子直徑,dU為球狀(剛體球)溶質直徑。使用積分方程式論計算多個具有不同直徑(在0<dU≤30dS的范圍內(nèi)為15種左右)的孤立剛體球溶質的S,應用上述的式子利用最小2乘法來確定C1~C4。一旦確定了C1~C4,就可以對具有任意的立體結構的蛋白質使用這些系數(shù)。即,只要計算V、A、X、Y就可以立即根據(jù)式子得到S。其中,C1~C4在很大程度上依賴于溶劑的種類、熱力學條件(溫度、壓力等)。

此處,圖4是示意性地表示烴基與球狀溶質的半徑之和R的圖。例如,伴隨著具有15種直徑的球狀溶質的插入,可以得到15種(R,S)的組。

如果將溶質設為蛋白質,對所有構成原子(H、C、N、O、S)的直徑和x、y、z-坐標進行使用了上述4個幾何學指標的計算,則利用上述的統(tǒng)計力學理論與形態(tài)計測學的方法的綜合型方法論,對每1個立體結構,用標準的工作站也可以高速地(1秒以內(nèi))計算S。如果與利用考慮了復雜的多原子結構的三維積分方程式論計算的情況相比,則計算時間為大約萬分之一,誤差小于±5%,即使將Λ的計算也包括在內(nèi),自由能量函數(shù)F的計算本身也在1秒以內(nèi)結束。

如上所述,通過將針對水溶液中的蛋白質開發(fā)出的綜合型方法論應用于膜蛋白質,可以實現(xiàn)處理負荷小的高速的運算。此處,對積分方程式論進行概述。

積分方程式論中,從系統(tǒng)的分配函數(shù)出發(fā),在定義各種分布函數(shù)(相關函數(shù))的同時,導出在它們之間成立的關系式。是只要涉及平衡結構·物性就可以實現(xiàn)與計算機模擬相同水平的解析的方法。由于以無限大的系統(tǒng)作為對象,對無限個微觀狀態(tài)取物理量的平均,因此不會有“系統(tǒng)尺寸有可能過?。粺o法避免統(tǒng)計誤差”等問題。

在由單一成分構成的大體積(バルク)溶劑的情況下,如果以溫度、數(shù)密度、溶劑分子間的相互作用勢作為輸入數(shù)據(jù),在數(shù)值上求解在分布函數(shù)間成立的關系式,則可以得到表示溶劑的微觀結構、宏觀性質的各種熱力學量(也可以擴展到由多成分構成的溶劑)。

也可以解析溶質的溶劑和特性(溶質附近的溶劑的微觀結構;溶劑化的熱力學量)。此處,所謂溶劑化的熱力學量,是將溶質(使立體結構固定)插入溶劑中時產(chǎn)生的熱力學量的變化。在剛體球系或林納德-瓊斯流體之類的單純的溶劑的情況下,可以直接處置具有任意的形狀·多原子結構的溶質(三維積分方程式論)。在溶劑化的熱力學量的計算中,與計算機模擬相比,積分方程式論的一方更優(yōu)越,然而在求解基本式的情況下要求相當多的數(shù)學、數(shù)值分析學的操作,因此在本實施方式中,利用與上述形態(tài)計測學的指標的綜合來解決該計算。

[本實施方式的概要]

下面,對本實施方式的概要進行說明。

首先,本實施方式制成將膜蛋白質的各氨基酸殘基置換為Gly和Pro以外的全部氨基酸的氨基酸突變體的氨基酸序列。例如,通過將氨基酸突變導入野生型的膜蛋白質,可以得到突變體的膜蛋白質。而且,氨基酸突變也可以是在原來的氨基酸序列中缺失、置換或添加了1個或多個氨基酸的氨基酸序列。

另外,本實施方式也可以制成將膜蛋白質的各氨基酸殘基置換為包括Gly和Pro在內(nèi)的全部氨基酸的氨基酸突變體的氨基酸序列。

然后,本實施方式對各氨基酸突變體,分別計算伴隨著基于氨基酸序列的結構最佳化的膜貫穿部位的、從一級結構形成到三級結構形成的溶劑化熵變-ΔS或從二級結構形成到三級結構形成的溶劑化熵變-ΔS。此處,圖5是表示針對膜蛋白質的立體結構形成的兩階段模型的圖(參考:Curr.opin.struCt.biol.2011,21:460-466)。

階段1涉及膜蛋白質從一級結構形成二級結的階段。更具體而言,α螺旋的結構單元在膜內(nèi)被單獨地穩(wěn)定化,形成盡可能多的分子內(nèi)氫鍵結構(步驟1)。而且,脂質雙層膜層中,與β折疊(シート)相比α螺旋的一方更有利。

階段2涉及膜蛋白質在膜內(nèi)從二級結構形成三級結構的階段。更具體而言,進行α螺旋等結構單元間的側鏈的填充(步驟2)。本實施方式可以求從一級結構形成經(jīng)過階段1、2直到三級結構形成的溶劑化熵變,也可以求從二級結構形成經(jīng)過階段2直到三級結構形成的溶劑化熵變。此處,圖6是表示由2個結構單元構成的GlyCophorinA(GpA)的天然結構(NS)、和利用復制交換蒙特卡洛模擬產(chǎn)生的偽結構的圖。下段的結構是從圖示的視點觀看上段的結構時的圖。如圖6所示,雖然作為二級結構的α螺旋結構自身是相同的結構,然而三級結構中的α螺旋之間的位置關系不同。

此后,基于膜蛋白質野生型的溶劑化熵變-ΔSw與氨基酸突變體的溶劑化熵變-ΔSm的差-ΔΔS,選取使之發(fā)生熱穩(wěn)定化的氨基酸突變體的候選。此處,圖7是對于GpA的天然結構(NS)和15000個偽結構在橫軸繪制與正解結構的最小平方偏差、在縱軸繪制無量綱化了的自由能量差的圖。

如圖7所示,天然結構中自由能量F取得最小值。圖8是對于GpA的天然結構(NS)和15000個偽結構在橫軸繪制與正解結構的最小平方偏差、在縱軸繪制無量綱化了的能量成分差的圖。

如圖8所示,天然結構中,由于在結構單元間沒有形成分子內(nèi)氫鍵,因此比天然結構更有利的偽結構(虛線長方形內(nèi)的點)作為假陽性(偽陽性)存在有多個。此處,圖9是對于GpA的天然結構(NS)和15000個偽結構在橫軸繪制與正解結構的最小平方偏差、在縱軸繪制熵成分(溶劑化熵)差的圖。

如圖9所示,可知如果基于作為本實施方式的指標的溶劑化熵變的差,則不會檢測出假陽性,可以準確地選取正解結構。這是因為,天然結構中,以使烴基集團的熵最大的方式進行結構單元間的側鏈的填充。

以上為本實施方式的概要。下面,對用于利用計算機實現(xiàn)上述的本發(fā)明的實施方式的裝置構成、處理的詳細例子,詳細說明如下。

[熱穩(wěn)定化突變體預測裝置的構成]

下面,參照圖10對本實施方式的熱穩(wěn)定化突變體預測裝置100的構成進行說明。圖10是表示應用本實施方式的本熱穩(wěn)定化突變體預測裝置100的一例的方框圖,僅示意性地表示出該構成中的與本實施方式有關的部分。

如圖10所示,本實施方式的熱穩(wěn)定化突變體預測裝置100大致上至少具備控制部102和存儲部106,在本實施方式中,還具備輸入輸出控制界面部108和通信控制界面部104。此處,控制部102是統(tǒng)括性地控制熱穩(wěn)定化突變體預測裝置100的整體的CPU等。另外,通信控制界面部104是連接于與通信線路等連接的路由器等通信裝置(未圖示)的界面,輸入輸出控制界面部108是連接于輸入部114、輸出部116的界面。另外,存儲部106是存放各種數(shù)據(jù)庫、表格等的裝置。這些熱穩(wěn)定化突變體預測裝置100的各部被可以借助任意的通信路通信地連接。此外,該熱穩(wěn)定化突變體預測裝置100被可以借助路由器等通信裝置及專用線等有線或無線的通信線路與網(wǎng)絡300通信地連接。

存放于存儲部106的各種數(shù)據(jù)庫、表格(結構文件106a、序列文件106b等)是固定磁盤裝置等存儲器機構。例如,存儲部106存放各種處理中所用的各種程序、表格、文件、數(shù)據(jù)庫、以及網(wǎng)頁等。

這些存儲部106的各構成要素當中,結構文件106a是存儲膜蛋白質的結構數(shù)據(jù)的結構數(shù)據(jù)存儲機構。結構文件106a也可以存儲經(jīng)由輸入部114輸入的進行了晶體結構解析的膜蛋白質的結構數(shù)據(jù)等。而且,結構文件106a中的結構數(shù)據(jù)也可以包含二維空間、三維空間中的各原子的坐標等。

另外,序列文件106b是存儲膜蛋白質的序列數(shù)據(jù)的序列數(shù)據(jù)存儲機構。序列文件106b也可以存儲經(jīng)由輸入部114輸入的膜蛋白質的序列數(shù)據(jù)等。

圖10中,輸入輸出控制界面部108進行輸入部114、輸出部116的控制。此處,作為輸出部116,除了可以使用監(jiān)視器(包括家用電視)以外,還可以使用揚聲器(而且,以下有時將輸出部116記作監(jiān)視器)。另外,作為輸入部114,可以使用鍵盤、鼠標、以及麥克風等。

另外,圖10中,控制部102具有用于存放OS(Operating System)等控制程序、規(guī)定各種處理步驟等的程序、以及所需數(shù)據(jù)的內(nèi)部存儲器。此后,控制部102利用這些程序等進行用于執(zhí)行各種處理的信息處理。就功能概念而言,控制部102具備突變導入部102a、計算部102b、以及候選選取部102c。

其中,如圖10所示,突變導入部102a是通過將氨基酸突變導入膜蛋白質的各氨基酸序列而生成氨基酸突變體(以下簡稱為“突變體”)的氨基酸序列的突變導入機構。此處,突變導入部102a也可以作為突變體生成相對于原來的氨基酸序列缺失、置換、或添加了1個或多個氨基酸的氨基酸序列。

另外,計算部102b是對膜蛋白質野生型及各突變體計算伴隨著基于氨基酸序列的結構最佳化的膜貫穿部位的、從一級結構形成到三級結構形成的溶劑化熵變或從二級結構形成到三級結構形成的溶劑化熵變-ΔSw、-ΔSm的計算機構。另外,計算部102b可以使用基于排除體積V、露出表面積A、露出表面的平均曲率的積分值X、以及露出表面的高斯曲率的積分值Y的4個幾何學指標的形態(tài)計測學的表現(xiàn)與積分方程式論的綜合型方法論,計算溶劑化熵。

此處,對于結構最佳化,計算部102b可以不僅基于存儲于序列文件106b中的氨基酸序列,而且還基于存儲于結構文件106a中的結構數(shù)據(jù)進行結構最佳化。另外,計算部102b可以首先將膜蛋白質的重原子固定而進行最小化,然后,將Cα碳及Cβ碳固定而進行最小化,最后,不固定地進行最小化,由此在分階段地去掉約束的同時進行結構最佳化。除此以外,計算部102b也可以使用像Modeller等那樣其他的結構最佳化法來進行結構最佳化。

此處,計算部102b也可以利用以下的方式1~方式5中的任意一種方式來計算溶劑化熵變。

方式1:在進行結構最佳化后取出膜貫穿部位而得的三級結構的溶劑化熵與拆分三級結構而得的二級結構的溶劑化熵的變化

方式2:在取出膜貫穿部位后進行結構最佳化而得的三級結構的溶劑化熵與拆分所取出的該膜貫穿部位后進行結構最佳化而得的二級結構的溶劑化熵的變化

方式3:在進行結構最佳化后取出膜貫穿部位而得的三級結構的溶劑化熵與取出膜貫穿部位并拆分該膜貫穿部位后進行結構最佳化而得的二級結構的溶劑化熵的變化

方式4:在進行結構最佳化后取出膜貫穿部位而得的三級結構的溶劑化熵與取出膜貫穿部位并伸展該膜貫穿部位后進行結構最佳化而得的一級結構的溶劑化熵的變化

方式5:在取出膜貫穿部位后進行結構最佳化而得的三級結構的溶劑化熵與取出膜貫穿部位并拆分該膜貫穿部位并伸展后進行結構最佳化而得的一級結構的溶劑化熵的變化

另外,候選選取部102c是基于膜蛋白質野生型的溶劑化熵變-ΔSw與突變體的溶劑化熵變-ΔSm的差-ΔΔS(=-ΔSw-(-ΔSm))來選取使之發(fā)生熱穩(wěn)定化的突變體的候選的候選選取機構。例如,候選選取部102c可以判定在-ΔΔS為負的值時發(fā)生熱穩(wěn)定化,在-ΔΔS為正時發(fā)生熱不穩(wěn)定化。作為一例,候選選取部102c可以選?。う為給定值以下的突變體作為使之發(fā)生熱穩(wěn)定化的突變體的候選。而且,以下,列舉出各記號與其意味的對應關系。

S:(某個結構的)溶劑化熵

-ΔS:(從某個結構向其他結構的)溶劑化熵變

-ΔΔS:(突變前的蛋白質與突變體之間的)溶劑化熵變的差

以上是本實施方式的熱穩(wěn)定化突變體預測裝置100的構成的一例。而且,熱穩(wěn)定化突變體預測裝置100也可以借助網(wǎng)絡300與外部系統(tǒng)200連接。該情況下,通信控制界面部104進行熱穩(wěn)定化突變體預測裝置100與網(wǎng)絡300(或路由器等通信裝置)之間的通信控制。即,通信控制界面部104具有借助通信線路與其他終端進行數(shù)據(jù)通信的功能。另外,網(wǎng)絡300具有將熱穩(wěn)定化突變體預測裝置100與外部系統(tǒng)200相互連接的功能,例如為互聯(lián)網(wǎng)等。

另外,外部系統(tǒng)200借助網(wǎng)絡300與熱穩(wěn)定化突變體預測裝置100相互連接,具有向涉及結構數(shù)據(jù)或序列數(shù)據(jù)、參數(shù)、模擬結果數(shù)據(jù)等各種數(shù)據(jù)的外部數(shù)據(jù)庫、或所連接的信息處理裝置提供用于執(zhí)行熱穩(wěn)定化突變體預測方法的程序等的功能。

此處,外部系統(tǒng)200也可以作為WEB服務器或ASP服務器等構成。另外,外部系統(tǒng)200的硬件構成一般可以利用市售的工作站、個人計算機等信息處理裝置及其附屬裝置來構成。另外,外部系統(tǒng)200的各功能由外部系統(tǒng)200的硬件構成中的CPU、磁盤裝置、存儲器裝置、輸入裝置、輸出裝置、通信控制裝置等及控制它們的程序等來實現(xiàn)。

以上內(nèi)容可以結束本實施方式的構成的說明。

[熱穩(wěn)定化突變體預測裝置100的處理]

下面,對于如此構成的本實施方式的熱穩(wěn)定化突變體預測裝置100的處理的一例,參照附圖詳細說明如下。

首先,參照圖11對利用熱穩(wěn)定化突變體預測裝置100執(zhí)行的處理的一例進行說明。圖11是表示利用熱穩(wěn)定化突變體預測裝置100執(zhí)行的處理的一例的流程圖。

如圖11所示,首先,突變導入部102a通過將氨基酸突變導入存儲于序列文件106b中的膜蛋白質的氨基酸序列,而生成突變體Mt的氨基酸序列(步驟SA-1)。例如,突變導入部102a也可以生成缺失了1個氨基酸、置換了1個氨基酸、添加了1個氨基酸等導入了氨基酸突變的突變體Mt。

此后,計算部102b對膜蛋白質野生型Wt及各突變體Mt,計算伴隨著基于氨基酸序列的結構最佳化的膜貫穿部位的、從一級結構形成到三級結構形成的溶劑化熵變或從二級結構形成到三級結構形成的溶劑化熵變-ΔSw、-ΔSm(步驟SA-2)。而且,計算部102b也可以利用后述的方式1~5中的任意一種方式來計算溶劑化熵的變化。另外,計算部102b也可以使用基于排除體積V、露出表面積A、露出表面的平均曲率的積分值X、以及露出表面的高斯曲率的積分值Y的4個幾何學指標的形態(tài)計測學的表現(xiàn)與積分方程式論的綜合型方法論,來計算溶劑化熵。此處,對于結構最佳化,計算部102b不僅可以基于存儲于序列文件106b中的氨基酸序列來進行結構最佳化,而且還可以基于存儲于結構文件106a中的結構數(shù)據(jù)來進行結構最佳化。另外,計算部102b可以首先將膜蛋白質的重原子固定而進行最小化,然后,將Cα碳及Cβ碳固定而進行最小化,最后,不固定地進行最小化,由此在分階段地去掉約束的同時進行結構最佳化。

此后,候選選取部102c計算膜蛋白質野生型Wt的溶劑化熵變-ΔSw與突變體Mt的溶劑化熵變-ΔSm的差-ΔΔS(=-ΔSw-(-ΔSm))(步驟SA-3)。

此后,候選選取部102c基于計算出的差-ΔΔS,選取使之發(fā)生熱穩(wěn)定化的突變體Mt的候選(步驟SA-4)。例如,候選選取部102c也可以判定在-ΔΔS為負的值時發(fā)生熱穩(wěn)定化,在-ΔΔS為正時發(fā)生熱不穩(wěn)定化。作為一例,候選選取部102c可以選?。う為給定的閾值以下的突變體Mt作為使之發(fā)生熱穩(wěn)定化的突變體Mt的候選。

以上是本實施方式的熱穩(wěn)定化突變體預測裝置100的處理的一例。

[5種方式]

下面,以上述的處理為基礎,參照圖12~圖32,對具體的5種方式1~5的處理的詳情說明如下。圖12是示意性地表示出本實施方式的熱穩(wěn)定化突變體預測裝置100的、膜蛋白質野生型Wt的溶劑化熵變-ΔSw、和突變體Mt的溶劑化熵變-ΔSm的計算方法的圖。

作為代表例,如圖12所示,對于膜蛋白質野生型Wt和突變體Mt,分別作為溶劑化熵變求出將α螺旋之間拆分的狀態(tài)與堆積的狀態(tài)之間的溶劑化熵的差-ΔS。求出這些膜蛋白質野生型Wt的溶劑化熵變-ΔSw與突變體Mt的溶劑化熵變-ΔSm的差-ΔΔS(=-ΔSw-(-ΔSm))。

具體而言,計算部102b可以利用以下的方式1~5中的任意一個方式來進行溶劑化熵的變化。

方式1是求出在進行結構最佳化后取出膜貫穿部位而得的三級結構的溶劑化熵S與拆分三級結構而得的二級結構的溶劑化熵S的變化-ΔS的方法。如此所述,方式1中,不考慮拆分了的螺旋的側鏈的再填充。

方式2是求出在取出膜貫穿部位后進行結構最佳化而得的三級結構的溶劑化熵S與將所取出的該膜貫穿部位拆分后進行結構最佳化而得的二級結構的溶劑化熵S的變化-ΔS的方法。圖13是表示將方式2、3的螺旋拆分后進行結構最佳化的樣子的圖。

方式3是求出在進行結構最佳化后取出膜貫穿部位而得的三級結構的溶劑化熵S與取出膜貫穿部位并拆分該膜貫穿部位后進行結構最佳化而得的二級結構的溶劑化熵S的變化-ΔS的方法。如圖13所示,方式2、3進行拆分了的螺旋各自的結構最佳化,考慮了側鏈的再填充。

方式4是求出在進行結構最佳化后取出膜貫穿部位而得的三級結構的溶劑化熵S與取出膜貫穿部位并伸展該膜貫穿部位后進行結構最佳化而得的一級結構的溶劑化熵S的變化-ΔS的方法。圖14是表示方式4、5的將螺旋伸展至一級結構的結構的例子的圖。

方式5是求出在取出膜貫穿部位后進行結構最佳化而得的三級結構的溶劑化熵S與取出膜貫穿部位并拆分該膜貫穿部位而伸展后進行結構最佳化而得的一級結構的溶劑化熵S的變化-ΔS的方法。如圖14所示,方式4、5中,也考慮兩階段模型中的階段1的伴隨著螺旋形成的熵變。另外,方式1、3、4中在將堆積了的結構最小化時,也考慮環(huán)結構。以下,對方式1~5的更具體的流程例進行詳細說明。

此處,圖15是表示本實施方式的方式1~5中共同的步驟的流程圖。而且,本實施例中,將來自于人的腺苷A2a受體的晶體結構(PDB Code;3vg9)作為野生型Wt使用。作為隨后詳述的方式1~5中共同的處理,如圖15所示,計算部102b作為一例使用CHARMM程序及MMTSB程序,對A2aR的晶體結構進行加氫(以后,將該結構稱作結構<1>)。以下對方式1~5的獨立流程進行說明。圖16是表示方式1的處理例的流程圖。

[方式1]

如圖16所示,首先,對野生型Wt的結構<1>,計算部102b使用CHARMM程序,依照將膜蛋白質的重原子固定而進行最小化、將Cα碳及Cβ碳固定而進行最小化、不固定而進行最小化的順序,在分階段地去掉約束的同時進行結構最佳化(步驟S1-1)。而且,以下將該處理簡稱為“結構的最佳化”。

然后,計算部102b僅將膜貫穿部位取出,計算其溶劑化熵(-Sw)(步驟S1-2)。

此后,計算部102b計算拆分各個螺旋而得的結構的溶劑化熵的總和(-S’w)(步驟S1-3)。

此后,計算部102b計算伴隨著螺旋的堆積的熵變-ΔSw=-Sw-(-S’w)(步驟S1-4)。

另一方面,對突變體Mt,突變導入部102a基于存儲于序列文件106b中的序列數(shù)據(jù),置換結構<1>的氨基酸殘基(步驟S1-a)。

此后,計算部102b進行結構的最佳化(步驟S1-b)。

此后,計算部102b僅將膜貫穿部位取出,計算溶劑化熵(-Sm)(步驟S1-c)。

此后,計算部102b計算拆分各個螺旋而得的結構的溶劑化熵的總和(-S’m)(步驟S1-d)。

此后,計算部102b計算伴隨著螺旋的堆積的熵變-ΔSm=-Sm-(-S’m)(步驟S1-e)。

根據(jù)以上的結果,計算部102b可以計算作為野生型Wt的熵變-ΔSw與突變型的熵變-ΔSm的差的、伴隨著氨基酸置換的熵變-ΔΔS=-ΔSm-(-ΔSw)。

[方式2]

圖17是表示方式2的處理例的流程圖。如圖17所示,首先,對于野生型Wt的結構<1>,計算部102b僅將結構<1>的膜貫穿部位(稱作結構<2>)取出(步驟S2-1)。

然后,計算部102b進行結構的最佳化,計算其溶劑化熵(-Sw)(步驟S2-2)。

此后,計算部102b拆分結構<2>的螺旋(步驟S2-3)。

此后,計算部102b進行各個螺旋的結構的最佳化,計算溶劑化熵的總和(-S’w)(步驟S2-4)。

此后,計算部102b計算伴隨著螺旋的堆積的熵變-ΔSw=-Sw-(-S’w)(步驟S2-5)。

另一方面,對于突變體Mt,突變導入部102a置換結構<2>的氨基酸殘基(將該結構設為結構<3>)(步驟S2-a)。

此后,計算部102b進行結構的最佳化,計算其溶劑化熵(-Sm)(步驟S2-b)。

此后,計算部102b拆分結構<3>的螺旋(步驟S2-c)。

此后,計算部102b進行各個螺旋的結構的最佳化,計算溶劑化熵的總和(-S’m)(步驟S2-d)。

此后,計算部102b計算伴隨著螺旋的堆積的熵變-ΔSm=-Sm-(-S’m)(步驟S2-e)。

根據(jù)以上的結果,計算部102b可以計算作為野生型Wt的熵變-ΔSw與突變型的熵變-ΔSm的差的、伴隨著氨基酸置換的熵變-ΔΔS=-ΔSm-(-ΔSw)。

[方式3]

圖18是表示方式3的處理例的流程圖。如圖18所示,首先,對于野生型Wt的結構<1>,計算部102b進行結構<1>的結構的最佳化(步驟S3-1)。

然后,計算部102b僅將膜貫穿部位取出,計算其溶劑化熵(-Sw)(步驟S3-2)。

此后,計算部102b取出結構<1>的膜貫穿部位,拆分螺旋結構(步驟S3-3)。

此后,計算部102b進行各個螺旋的結構的最佳化,計算溶劑化熵的總和(-S’w)(步驟S3-4)。

此后,計算伴隨著螺旋的堆積的熵變-ΔSw=-Sw-(-S’w)(步驟S3-5)。

另一方面,對于突變體Mt,突變導入部102a置換結構<1>的氨基酸殘基(將該結構設為結構<4>)(步驟S3-a)。

此后,計算部102b進行結構<4>的結構的最佳化(步驟S3-b)。

此后,計算部102b僅將膜貫穿部位取出,計算其溶劑化熵(-Sm)(步驟S3-c)。

此后,計算部102b僅將結構<4>的膜貫穿部位取出,拆分螺旋結構(步驟S3-d)。

此后,計算部102b進行各個螺旋的結構的最佳化,計算溶劑化熵的總和(-S’m)(步驟S3-e)。

此后,計算部102b計算伴隨著螺旋的堆積的熵變-ΔSm=-Sm-(-S’m)(步驟S3-f)。

根據(jù)以上的結果,計算部102b可以計算作為野生型Wt的熵變-ΔSw與突變型的熵變-ΔSm的差的、伴隨著氨基酸置換的熵變-ΔΔS=-ΔSm-(-ΔSw)。

[方式4]

圖19是表示方式4的處理例的流程圖。如圖19所示,首先,對于野生型Wt的結構<1>,計算部102b進行結構<1>的結構的最佳化(步驟S4-1)。

然后,計算部102b僅將膜貫穿部位取出,計算其溶劑化熵(-Sw)(步驟S4-2)。

此后,計算部102b取出結構<1>的膜貫穿部位,制成完全伸展開的結構(步驟S4-3)。

此后,計算部102b進行各個伸展開的結構的最佳化,計算溶劑化熵的總和(-S’w)(步驟S4-4)。

此后,計算部102b計算相對于伸展開的結構而言的伴隨著螺旋形成及堆積的熵變-ΔSw=-Sw-(-S’w)(步驟S4-5)。

另一方面,對于突變體Mt,突變導入部102a置換結構<1>的氨基酸殘基(將該結構設為結構<4>)(步驟S4-a)。

此后,計算部102b進行結構<4>的結構的最佳化(步驟S4-b)。

此后,計算部102b僅將膜貫穿部位取出,計算其溶劑化熵(-Sm)(步驟S4-c)。

此后,計算部102b僅將結構<4>的膜貫穿部位取出,制成完全伸展開的結構(步驟S4-d)。

此后,計算部102b進行各個伸展開的結構的最佳化,計算溶劑化熵的總和(-S’m)(步驟S4-e)。

此后,計算部102b計算相對于伸展開的結構而言的伴隨著螺旋形成及堆積的熵變-ΔSm=-Sm-(-S’m)(步驟S4-f)。

根據(jù)以上的結果,計算部102b可以計算作為野生型Wt的熵變-ΔSw與突變型的熵變-ΔSm的差的、伴隨著氨基酸置換的熵變-ΔΔS=-ΔSm-(-ΔSw)。

[方式5]

圖20是表示方式5的處理例的流程圖。如圖20所示,首先,對于野生型Wt的結構<1>,計算部102b僅將結構<1>的膜貫穿部位(稱作結構<2>)取出(步驟S5-1)。

然后,計算部102b進行結構的最佳化,計算其溶劑化熵(-Sw)(步驟S5-2)。

此后,計算部102b拆分結構<2>的螺旋,制成完全伸展開的結構(步驟S5-3)。

此后,計算部102b進行各個伸展開的結構的最佳化,計算溶劑化熵的總和(-S’w)(步驟S5-4)。

此后,計算部102b計算相對于伸展開的結構而言的伴隨著螺旋形成及堆積的熵變-ΔSw=-Sw-(-S’w)(步驟S5-5)。

另一方面,對于突變體Mt,突變導入部102a置換結構<2>的氨基酸殘基(步驟S5-a)。

此后,計算部102b進行結構<3>的結構的最佳化,計算其溶劑化熵(-Sm)(步驟S5-b)。

此后,計算部102b拆分結構<3>的螺旋,制成完全伸展開的結構(步驟S5-c)。

此后,計算部102b進行各個伸展開的結構的最佳化,計算溶劑化熵的總和(-S’m)(步驟S5-d)。

此后,計算部102b計算相對于伸展開的結構的伴隨著螺旋形成及堆積的熵變-ΔSm=-Sm-(-S’m)(步驟S5-e)。

根據(jù)以上的結果,計算部102b可以計算作為野生型Wt的熵變-ΔSw與突變型的熵變-ΔSm的差的、伴隨著氨基酸置換的熵變-ΔΔS=-ΔSm-(-ΔSw)。

[與實驗結果的比較]

對于已知會因置換而發(fā)生穩(wěn)定化或不穩(wěn)定化的5種氨基酸突變,研究了由方式1~5造成的熱穩(wěn)定化突變體的預測結果。圖21是表示對于實驗中發(fā)生穩(wěn)定化的將第88個殘基的蘇氨酸置換為谷氨酸的突變體的利用方式1~5得到的計算結果(-ΔΔS)的圖。

如圖21所示,方式1、2、5中,形成負的數(shù)而成功地完成預測。圖22是表示對于實驗中發(fā)生穩(wěn)定化(熱變性溫度升高8℃)的將第91個殘基的絲氨酸置換為精氨酸的突變體的利用方式1~5得到的計算結果-ΔΔS的圖。

如圖22所示,全都形成負的數(shù),在所有方式中成功地完成預測。即使是置換為其他的氨基酸,也可以期待發(fā)生穩(wěn)定化。圖23是對于實驗中發(fā)生不穩(wěn)定化的將第245個殘基的半胱氨酸置換為色氨酸的突變體的利用方式1~5得到的計算結果-ΔΔS的圖。

如圖23所示,方式1中,預測為會發(fā)生穩(wěn)定化。其他方式中,預測為會被不穩(wěn)定化。圖24是表示對于實驗中發(fā)生不穩(wěn)定化的將第51個殘基的丙氨酸置換為色氨酸的突變體的利用方式1~5的計算結果-ΔΔS的圖。

如圖24所示,方式1中預測為會發(fā)生穩(wěn)定化。但是,由于該置換,在受體的折疊過程中產(chǎn)生問題,可以認為是因為無法變?yōu)樗A測的折疊后的結構。圖25是表示對于實驗中發(fā)生不穩(wěn)定化的將第239個殘基的纈氨酸置換為精氨酸的突變體的利用方式1~5得到的計算結果-ΔΔS的圖。

如圖25所示,在所有的方式中預測失敗。圖26是對于5種氨基酸突變利用方式1~5得到的熱穩(wěn)定化突變體的預測結果的表?!饦擞洷硎绢A測成功,×標記表示預測失敗。另外,減號表示穩(wěn)定化,加號表示不穩(wěn)定化。

如圖26所示,對于5種氨基酸突變,方式5的預測成功率高。另外,例如在將方式1和2組合、兩者都得出穩(wěn)定(負的數(shù))的結果的情況下,可以作為穩(wěn)定化突變體候選預測。

然后,對根據(jù)StaR(注冊商標)技術的Tate等人的實驗結果已知熱穩(wěn)定效果的突變體組研究了方式1~5的預測結果。Tate等人根據(jù)丙氨酸掃描的實驗結果,報告了17處發(fā)生穩(wěn)定化的氨基酸置換。對該結果和利用方式1~5計算出的-ΔΔS的值進行了比較。圖27~圖31是各個方式1~5的-ΔΔS的計算結果的圖表。圖32是對于各氨基酸突變利用方式1~5得到的熱穩(wěn)定化突變體的預測結果的表?!饦擞洷硎绢A測成功,×標記表示預測失敗,空白欄表示從計算中去掉。另外,減號表示穩(wěn)定化,加號表示不穩(wěn)定化。而且,G114A、G118A、G123A、G152A等將甘氨酸置換為丙氨酸的情況由于結構的自由度大幅度改變,因此可以認為膜的熵效應以外的影響、即結構熵的影響大,因而從計算中去掉,設為空白欄。另外,P149A、E151A殘基是無法獲得晶體結構的環(huán)部分,因此從計算中去掉,設為空白欄。H075A、T119A、K122A、A203L、A204L、A231L、L235A是膜外的氨基酸殘基,因此在取出膜貫穿部位后進行置換的方式2和5中屬于計算外,所以設為空白欄。

如圖27~圖32所示,可以認為適合使用方式1或方式4。另外,對于T088A,根據(jù)實驗結果,是穩(wěn)定性大幅度提高的置換,利用方式1~5的哪個計算方式都可以預測會發(fā)生穩(wěn)定化。因而,如果選擇利用方式1~5的哪個計算方式都可以預測會發(fā)生穩(wěn)定化的置換,則可以期待能夠預測出穩(wěn)定性大幅度提高的突變體。

[實施例]

另外,參照圖1、以及圖33至圖47,對本實施方式的熱穩(wěn)定化突變體預測裝置100的實施例進行說明。圖33是表示利用熱穩(wěn)定化突變體預測裝置100執(zhí)行的處理的一例的流程圖。

如圖33所示,首先,突變導入部102a通過對存儲于序列文件106b中的膜蛋白質野生型Wt的氨基酸序列導入氨基酸突變,而生成突變體Mt的氨基酸序列(步驟SB-1)。例如,突變導入部102a也可以生成導入了缺失1個氨基酸、置換1個氨基酸、添加1個氨基酸等氨基酸突變的突變體Mt。

此后,計算部102b對于膜蛋白質野生型Wt及各突變體Mt,計算伴隨著基于氨基酸序列的結構最佳化的膜貫穿部位的、從一級結構形成到三級結構形成的溶劑化熵變或從二級結構形成到三級結構形成的溶劑化熵變-ΔSw、-ΔSm,對于膜蛋白質野生型Wt及各突變體Mt,計算伴隨著基于氨基酸序列的結構最佳化的膜貫穿部位的、從一級結構形成到三級結構形成或從二級結構形成到三級結構形成的能量變化ΔΛw、ΔΛm(步驟SB-2)。

而且,計算部102b也可以利用前述的方式1~5中的任意一個方式計算溶劑化熵的變化。另外,計算部102b也可以使用基于排除體積V、露出表面積A、露出表面的平均曲率的積分值X、以及露出表面的高斯曲率的積分值Y的4個幾何學指標的形態(tài)計測學的表現(xiàn)與積分方程式論的綜合型方法論,來計算溶劑化熵。

此處,對于結構最佳化,計算部102b不僅可以基于存儲于序列文件106b中的氨基酸序列,而且還可以基于存儲于結構文件106a中的結構數(shù)據(jù)進行結構最佳化。另外,計算部102b可以首先將膜蛋白質的重原子固定而進行最小化,然后,將Cα碳及Cβ碳固定而進行最小化,最后,不固定地進行最小化,由此在分階段地去掉約束的同時進行結構最佳化。

此處,參照圖1、圖34、以及圖35對本實施例的能量計算的一例進行說明。圖34是表示形成一個分子內(nèi)氫鍵時的能量降低的值的圖。

本實施例中,膜蛋白質用的自由能量函數(shù)F由下式表示。

F=-TS+Λ

(T:絕對溫度、S:熵成分、Λ:能量成分)

將上述的式子除以kBT0(kB:玻爾茲曼常數(shù),T0=298K)而無量綱化,如果設定T=T0,則形成下式。

F/(kBT0)=-S/kB+Λ/(kBT0)

此處,如圖1所示,本實施例中,以完全伸展開的結構(完全不具有分子內(nèi)氫鍵)為基準,計算“伴隨著分子內(nèi)氫鍵形成的能量降低=分子內(nèi)氫鍵數(shù)*D”。此處,D是形成1個分子內(nèi)氫鍵時的能量降低的值。

另外,如圖34所示,D在給體與受體的原子的中心間距離小于的情況下,設為D0(即,提供D0的能量降低),在中心間距離為以上且小于的情況下,設為從0到D0直線性減少的值(即,提供直線性減少了的能量降低),在中心間距離為以上的情況下,設為0(即,不提供能量降低)。此處,本實施例中,D0也可以是-4kBT。

此后,研究主鏈-主鏈、主鏈-側鏈、側鏈-側鏈間的所有給體和受體,分別計算D,取得其總和,由此計算出“Λ=伴隨著分子內(nèi)氫鍵形成的能量降低(負)”。而且,假定為蛋白質分子內(nèi)的范德華引力相互作用的獲得與蛋白質-磷脂間的范德華引力相互作用的喪失相互抵消。

此處,參照圖35,對本實施例的Λ的計算步驟的一例進行說明。圖35是表示Λ的處理例的流程圖。

如圖35所示,首先,計算部102b進行膜蛋白質野生型Wt的結構<1>的結構的最佳化(步驟S6-1)。

然后,計算部102b僅將膜貫穿(間入)部位取出,計算其能量(Λw)(步驟S6-2)。

此后,計算部102b取出結構<1>的膜貫穿部位,取得假想地認為完全伸展的結構(Λ’w=0)(步驟S6-3)。

此后,計算部102b計算相對于假想地認為完全伸展的結構(Λ’w=0)而言的伴隨著螺旋形成及堆積的能量變化ΔΛw=Λw-Λ’w(步驟S6-4)。

另一方面,對于突變體Mt,突變導入部102a置換結構<1>的氨基酸殘基(將該結構設為結構<4>)(步驟S6-a)。

此后,計算部102b進行結構<4>的結構的最佳化(步驟S6-b)。

此后,計算部102b僅將膜貫穿部位取出,計算其能量(Λm)(步驟S6-c)。

此后,計算部102b取出結構<4>的膜貫穿部位,取得假想地認為完全伸展的結構(Λ’m=0)(步驟S6-d)。

此后,計算部102b計算相對于假想地認為完全伸展的結構(Λ’m=0)而言的伴隨著螺旋形成及堆積的能量變化ΔΛm=Λm-Λ’m(步驟S6-e)。

根據(jù)以上的結果,計算部102b可以計算出作為膜蛋白質野生型Wt的能量變化ΔΛw與突變型的能量變化ΔΛm的差的、由折疊造成的能量降低的伴隨著氨基酸置換的能量變化量ΔΔΛ=ΔΛm-ΔΛw。

回到圖33,候選選取部102c計算膜蛋白質野生型Wt的溶劑化熵變-ΔSw與突變體Mt的溶劑化熵變-ΔSm的差-ΔΔS(=-ΔSw-(-ΔSm)),并計算膜蛋白質野生型Wt的能量變化ΔΛw與突變體Mt的能量變化ΔΛm的差ΔΔΛ(=ΔΛw-ΔΛm)(步驟SB-3)。

此后,候選選取部102c基于作為所計算出的ΔΔΛ與-TΔΔS的和的ΔΔF,選取使之發(fā)生熱穩(wěn)定化的突變體Mt的候選(步驟SB-4)。例如,候選選取部102c可以判定在ΔΔF(由折疊造成的體系的自由能量降低的伴隨著氨基酸置換的變化量)為負的值的情況下發(fā)生熱穩(wěn)定化,在ΔΔF為正的情況下發(fā)生熱不穩(wěn)定化。作為一例,候選選取部102c可以選取ΔΔF為給定的閾值以下的突變體Mt作為使之發(fā)生熱穩(wěn)定化的突變體Mt的候選。

此處,參照圖36至圖47,對本實施的預測結果的一例進行說明。圖36是表示預測結果的一例的圖。圖37是表示對S91R計算的方式1~5的ΔΔF的值的圖。圖38是表示對S91K計算的方式1~5的ΔΔF的值的圖。圖39是表示對L85R計算的方式1~5的ΔΔF的值的圖。圖40是表示對N280R計算的方式1~5的ΔΔF的值的圖。圖41是表示對N181K計算的方式1~5的ΔΔF的值的圖。圖42是表示預測結果的一例的圖。圖43是表示對S91R計算的方式1~5的-ΔΔS的值的圖。圖44是表示對S91K計算的方式1~5的-ΔΔS的值的圖。圖45是表示對L85R計算的方式1~5的-ΔΔS的值的圖。圖46是表示對N280R計算的方式1~5的-ΔΔS的值的圖。圖47是表示對N181K計算的方式1~5的-ΔΔS的值的圖。

首先,在使用Modeller進行的全氨基酸置換當中,在基于方式1計算出的ΔΔF的值中,從小的值起依次選取5個氨基酸置換(S91R、S91K、L85R、N280R、N181K)作為預測穩(wěn)定化的氨基酸置換。

此后,如圖36所示,在本實施例中,使用本熱穩(wěn)定化突變體預測方法,對這5個氨基酸置換計算ΔΔF的值(圖37~圖41),取得使用了方式1到方式5的任意一個方式時的預測結果(穩(wěn)定化(-)或不穩(wěn)定化(+))。

即,如圖36所示,本實施例中,無論是使用了方式1到方式5的哪個方式時,相對于這5個氨基酸置換的ΔΔF的值都是負的值,預測為使之發(fā)生穩(wěn)定化的突變體(圖36的方式1到方式5的列中所示的(-))。

此后,對這5個氨基酸置換進行驗證實驗,在實驗上進行是否發(fā)生穩(wěn)定化的確認,其結果是,如圖36所示,在這5個氨基酸置換當中的3個氨基酸置換中在實際中可以確認穩(wěn)定化(圖36的左端的列中所示的(-)),無論使用方式1到方式5的哪個方式,都可以得到預測成功率60%的結果。

此外,如圖42所示,本實施例中,使用本熱穩(wěn)定化突變體預測方法,對這5個氨基酸置換計算了-ΔΔS的值(圖43~圖47),其結果是,取得了使用方式1到方式5的任意一個方式時的預測結果(穩(wěn)定化(-)或不穩(wěn)定化(+))。

即,如圖42所示,本實施例中,無論使用方式1到方式5的哪個方式時,相對于這5個氨基酸置換的ΔΔF的值都是負的值,預測為使之發(fā)生穩(wěn)定化的突變體(圖42的方式1到方式5的列中所示的(-))。

此后,對這5個氨基酸置換進行驗證實驗,在實驗上進行了是否發(fā)生穩(wěn)定化的確認,其結果是,如圖42所示,在這5個氨基酸置換當中的3個氨基酸置換中在實際中可以確認穩(wěn)定化(圖42的左端的列中所示的(-)),如果僅從熵的觀點考慮,則無論使用方式1到方式5的哪個方式,都可以得到預測成功率60%的結果。

如此所述,可知在本實施例中,無論是進行使用了-ΔΔS的熱穩(wěn)定化突變體預測,還是進行使用了ΔΔF的熱穩(wěn)定化突變體預測,都可以得到高的預測成功率。

[其他實施方式]

雖然此前對本發(fā)明的實施方式進行了說明,然而本發(fā)明也可以在上述的實施方式以外,在技術方案的范圍中記載的技術思想的范圍內(nèi)利用各種不同的實施方式來實施。

例如,雖然以熱穩(wěn)定化突變體預測裝置100以獨立式(stand alone)的形態(tài)進行處理的情況作為一例進行了說明,然而熱穩(wěn)定化突變體預測裝置100也可以根據(jù)來自客戶端的要求進行處理,并將該處理結果返回該客戶端。

另外,也可以將實施方式中說明的各處理中的作為自動進行的處理說明的處理的全部或一部分手動地進行,或者將作為手動地進行的處理說明的處理的全部或一部分利用公知的方法自動地進行。

除此以外,對于上述文獻中或附圖中給出的處理步驟、控制步驟、包括具體的名稱、各處理的登記數(shù)據(jù)或檢索條件等參數(shù)的信息、畫面例、數(shù)據(jù)庫構成,除了特別記述的情況以外可以任意變更。

另外,對于熱穩(wěn)定化突變體預測裝置100,圖示的各構成要素是功能概念上的構成要素,不一定需要在實際中如圖所示地構成。

例如,對于熱穩(wěn)定化突變體預測裝置100的各裝置所具備的處理功能,特別是利用控制部102進行的各處理功能,也可以將其全部或任意的一部分利用CPU(Central ProCessing Unit)及由該CPU解釋執(zhí)行的程序來實現(xiàn),另外,也可以作為基于布線邏輯的硬件來實現(xiàn)。而且,程序記錄于后述的記錄介質中,根據(jù)需要由熱穩(wěn)定化突變體預測裝置100機械式地讀取。即,在ROM或HD等存儲部106等中,作為OS(Operating System)記錄有用于協(xié)同地對CPU提供命令、進行各種處理的計算機程序。該計算機程序通過加載到RAM中而執(zhí)行,與CPU協(xié)同地構成控制部。

另外,該計算機程序也可以存儲于借助任意的網(wǎng)絡300與熱穩(wěn)定化突變體預測裝置100連接的應用程序服務器中,根據(jù)需要可以下載其全部或一部分。

另外,也可以將本發(fā)明的程序存放在計算機能夠讀取的記錄介質中,另外,也可以作為程序產(chǎn)品構成。此處,該所謂“記錄介質”,包括存儲卡、USB存儲器、SD卡、軟盤、光磁盤、ROM、EPROM、EEPROM、CD-ROM、MO、DVD、以及Blu-ray(注冊商標)DisC等任意的“可搬用的物理介質”。

另外,所謂“程序”,是利用任意的語言或記述方法記述的數(shù)據(jù)處理方法,無論是源代碼還是二進制包等形式均可。而且,“程序”不一定限于單一地構成的程序,也包括作為多個模塊或庫分散構成的程序、與以OS(Operating System)為代表的其他程序協(xié)同地實現(xiàn)該功能的程序。而且,對于實施方式中所示的各裝置中用于讀取記錄介質的具體的構成、讀取步驟、或讀取后的安裝步驟等,可以使用周知的構成、步驟。

存放于存儲部106中的各種數(shù)據(jù)庫等(結構文件106a、序列文件106b等)是RAM、ROM等存儲器裝置、硬盤等固定磁盤裝置、軟盤、以及光盤等存儲機構,存放各種處理或網(wǎng)站提供中所用的各種程序、表格、數(shù)據(jù)庫、以及網(wǎng)頁用文件等。

另外,熱穩(wěn)定化突變體預測裝置100可以作為已知的個人計算機、工作站等信息處理裝置來構成,另外,也可以在該信息處理裝置中連接任意的周邊裝置來構成。另外,熱穩(wěn)定化突變體預測裝置100也可以通過在該信息處理裝置中安裝實現(xiàn)本發(fā)明的方法的軟件(包括程序、數(shù)據(jù)等)來實現(xiàn)。

此外,裝置的分散、合并的具體形態(tài)并不限于圖示的形態(tài),可以將其全部或一部分根據(jù)各種的添加等、或根據(jù)功能負荷,以任意的單位在功能上或實體上分散、合并地構成。即,可以將上述的實施方式任意地組合實施,也可以將實施方式選擇性地實施。

產(chǎn)業(yè)上的可利用性

如上說明所示,根據(jù)本發(fā)明,可以提供在將伸長法(エロンゲーション法)應用于二維系、三維系時也可以抑制計算時間的延長的熱穩(wěn)定化突變體預測裝置、熱穩(wěn)定化突變體預測方法、以及程序,因此在新型物質探索、醫(yī)療、制藥、創(chuàng)制新藥、化學的研究、生物學研究、臨床檢查等各種領域中極為有用。

符號的說明

100 熱穩(wěn)定化突變體預測裝置,

102 控制部,

102a 突變導入部,

102b 計算部,

102c 候選選取部,

104 通信控制界面部,

106 存儲部,

106a 結構文件,

106b 序列文件,

108 輸入輸出控制界面部,

114 輸入部,

116 輸出部,

200 外部系統(tǒng),

300 網(wǎng)絡

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1