亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種集成藥物靶標預測系統(tǒng)的構建和預測方法

文檔序號:6367268閱讀:377來源:國知局
專利名稱:一種集成藥物靶標預測系統(tǒng)的構建和預測方法
技術領域
本發(fā)明涉及計算機輔助藥物分子設計領域,特別涉及一種結合分子對接技術、藥效團模型和小分子結構相似性進行藥物靶標預測的新方法。
背景技術
藥物靶標鑒定是指通過某種方法發(fā)現(xiàn)已知藥物或活性化合物的作用靶標。藥物靶標鑒定在老藥新用、藥物的毒副作用預測等方面具有非常重要的作用。近年來,眾多制藥公司和科研機構都投入了大量的人力和財力開展藥物靶標鑒定方法研究。蛋白組學的方法是目前使用較普遍的方法,該方法通過對比加入待測藥物和不加藥物的情況下蛋白表達譜的變化,判斷該藥物可能作用的靶標或通路。親和力色譜法是另外一種常用的方法,采用了“釣魚”的思想,通過將待測藥物固定在生物芯片上去捕獲與其緊密結合的蛋白,然后通過生物大分子質譜確定該藥物的作用靶標。這些實驗手段雖然可行,但十分耗時,費用高昂并且實施困難。計算機輔助藥物靶標預測或篩選方法具有速度快、費用低、實施容易等特點,近年來已成為藥物靶標鑒定的一種重要方法受到越來越多的重視。目前已發(fā)展了三種主要的計算機輔助藥物靶標預測方法,即基于分子對接的藥物靶標預測方法、基于藥效團模型的靶標預測方法和基于小分子結構相似性的靶標預測方法。其中,基于分子對接的預測方法,利用分子對接的原理,將待測藥物或活性化合物分子自動對接到構建的靶標數(shù)據(jù)庫中的每個靶蛋白的活性位點,通過比較對接打分值進行靶標的預測。該方法具有原理簡單、充分考慮了靶標的三維結構信息等優(yōu)點,但分子對接方法本身還存在一些至今尚無有效解決辦法的問題,包括靶蛋白的柔性、打分函數(shù)的精度和溶劑水分子等,這些問題導致基于分子對接的靶標預測方法的預測準確度較低?;谒幮F模型的方法,首先建立靶標配體分子的藥效團模型數(shù)據(jù)庫,通過將藥物或活性化合物分子與藥效團模型數(shù)據(jù)庫中的藥效團進行比較疊合,從而推測可能的作用靶標。該方法避免了分子對接中存在的問題,但基于藥效團模型的虛擬篩選方法本身還存在假陽性率高等缺點。例外,目前已知的藥效團模型的質量也參差不齊。基于小分子結構相似性的方法是最近發(fā)展起來的快速簡單的方法,其中以基于二維指紋圖譜的小分子相似性方法最為常見。但這類方法只考慮了小分子化合物的結構信息,未能考慮靶標的信息。總之,這些已有的計算機輔助靶標預測方法,雖然均具有一些優(yōu)點,但也存在該方法本身難以克服的缺點,導致這些方法單獨使用時對靶標的預測準確率低。而將這些方法(包括基于分子對接的靶標預測方法、基于藥效團模型的靶標預測方法和基于小分子結構相似性的靶標預測方法)進行整合,發(fā)展集成的靶標預測方法,可以發(fā)揮它們各自的優(yōu)勢,并且克服單個方法使用時的缺陷,從而提高藥物靶標的預測準確度。另外,目前的計算機輔助靶標預測方法均不能給出靶標預測的概率,使得人們在挑選預測的靶標進行實驗驗證時,缺乏有效依據(jù)
發(fā)明內(nèi)容
本發(fā)明的目的是建立全面而準確的藥物靶標數(shù)據(jù)庫,構建集成的基于分子對接、藥效團模型和小分子結構相似性的集成藥物靶標預測系統(tǒng)和方法,并給出預測靶標的概率。本發(fā)明的基本思路是首先通過蛋白質晶體結構數(shù)據(jù)庫收集所有靶標的晶體結構,排除那些明顯不能與小分子化合物結合的蛋白質晶體結構(即不具有活性口袋的蛋白質晶體結構),對于同一個靶標,如有多個晶體結構則選取分辨率較高的I個或多個拷貝(如這些結構差異較小,則只選取分辨率最高者,否則選取多個),建立靶標的晶體結構數(shù)據(jù)庫。同時收集這些靶標的相關疾病、生物學類別以及活性小分子配體等信息。在此基礎上建立靶標活性位點數(shù)據(jù)庫、靶標配體的藥效團模型數(shù)據(jù)庫、活性小分子配體數(shù)據(jù)庫以及靶標基本信息數(shù)據(jù)庫;在進行藥物或活性化合物的靶標預測時,分別采用基于分子對接的方法、基于藥效團模型的方法和基于小分子結構相似性的方法進行靶標預測,并給出每種方法預測正確的概率以及三種方法的綜合預測總概率。這種思路的基本理論是基于1)在靶標數(shù)據(jù)庫中,排除了那些明顯不能與化學小分子結合的蛋白質,為后續(xù)正確的靶標篩選奠定了基礎;2)將基于分子對接的方法、基于藥效團模型的方法和基于小分子結構相似性的方法相 結合,可以發(fā)揮了三種方法在靶標預測方面的優(yōu)勢,克服單個方法由于自身局限導致的靶標預測準確度較低的問題;3)在計算三種預測方法的綜合預測正確的概率時,采用了基于置信理論的概率統(tǒng)計方法。本發(fā)明的目的是這樣達到的分析蛋白質晶體結構數(shù)據(jù)庫,選取已與類藥性配體小分子結合的蛋白質,或具有與小分子配體結合潛能的蛋白質作為靶點,建立靶標的晶體結構數(shù)據(jù)庫,對于同一個靶標,如有多個晶體結構則選取分辨率較高的I個或多個晶體結構拷貝(如這些結構差異較小,則只選取分辨率最高者,否則選取多個)。并針對這些靶標,收集其與疾病的相關信息、生物學類別以及活性小分子配體等信息,組建由活性位點數(shù)據(jù)庫、藥效團數(shù)據(jù)庫、小分子化合物數(shù)據(jù)庫以及靶標基本信息數(shù)據(jù)庫組成的綜合型靶標篩選數(shù)據(jù)庫;在綜合型靶標篩選數(shù)據(jù)庫基礎上,通過腳本程序或Pipeline Pilot流程實現(xiàn)集成分子對接技術、藥效團模型和小分子結構相似性三項靶標預測系統(tǒng)的構建,采用基于概率統(tǒng)計的集成方法聯(lián)合這三項技術實現(xiàn)藥物靶標綜合預測,并給出該方法的靶標預測準確度的概率。步驟是
(I)收集藥物靶標的晶體結構
分析蛋白質晶體結構數(shù)據(jù)庫F1DB (Protein Data Bank),選取已與類藥性配體小分子結合的蛋白質,或具有與小分子配體結合潛能的蛋白質作為靶點。對于同一個靶標,如有多個晶體結構則選取分辨率較高的I個或多個晶體結構拷貝(如這些結構差異較小,則只選取分辨率最高者,否則選取多個)。( 2 )組建綜合型靶標篩選數(shù)據(jù)庫
對上述收集的藥物靶標,建立靶標活性位點數(shù)據(jù)庫,為基于分子對接的靶標預測提供基礎;針對收集的靶標晶體結構,采用基于受體的藥效團建模方法建立藥效團模型數(shù)據(jù)庫,為基于藥效團模型的靶標預測方法提供基礎;收集藥物靶標的活性小分子配體,建立小分子配體數(shù)據(jù)庫,為基于小分子結構相似性的靶標預測方法提供基礎;收集藥物靶標結構名稱、生物功能類別、相關疾病以及藥物研發(fā)信息,建立藥物靶標基本信息數(shù)據(jù)庫,為靶標預測提供相關信息。
(3)建立基于分子對接、藥效團模型和小分子結構相似性的靶標預測系統(tǒng)
在Linux系統(tǒng)下構建腳本程序,自動調(diào)用GOLD對接軟件實現(xiàn)一個給定藥物分子或活性化合物與祀標數(shù)據(jù)庫的祀標活性位點對接,同時輸出打分函數(shù)Chemscore和Goldscore的打分值,實現(xiàn)基于分子對接的靶標預測;通過在Linux系統(tǒng)下構建腳本程序,利用Catalyst軟件實現(xiàn)一個藥物分子或活性化合物與藥效團模型數(shù)據(jù)庫所有藥效團自動匹配,并輸出相應的匹配值Fitvalue,實現(xiàn)基于藥效團模型的祀標預測;通過使用Pipeline Pilot 8. 5軟件構建流程,基于小分子結構指紋圖譜ECFP_4,計算一個給定藥物分子或活性化合物與靶標小分子配體數(shù)據(jù)庫中的化合物的Tanimoto系數(shù),實現(xiàn)基于小分子相似性的靶標預測。(4)活性分子概率分布曲線的建立
首先,通過挑選若干個不同類型的靶標,針對每個靶標分別構建活性化合物集合和非活性化合物集合Decoys,組成訓練集。利用分子對接、藥效團、小分子結構相似性三種方法針對各個祀標及相應訓練集進行篩選。集中所有訓練集的化合物以及各自評分,包括分子對接打分函數(shù)Chemscore的打分值和打分函數(shù)Goldscore的打分值、藥效團匹配值Fitvalue、小分子化合物與祀標已知活性配體相似性比較系數(shù)Tanimoto,分別統(tǒng)計其不同評分分數(shù)段活性分子的概率,利用最小二乘法擬合評分與評分分數(shù)段的概率之間的關系,得到各自評分的活性分子概率分布曲線。(5)集成的藥物靶標預測方法
在進行藥物或活性化合物的靶標預測時,分別采用基于分子對接的方法、基于藥效團模型的方法和基于小分子結構相似性的方法進行靶標預測,將各評分通過相應的活性分子概率曲線轉化為該評分預測正確的概率,然后采用置信理論Belief Theory計算三種方法的綜合預測正確的總概率,根據(jù)總概率對靶標數(shù)據(jù)庫所有靶標進行排序,排名靠前為預測化合物潛在作用靶標。集成藥物靶標預測方法的具體步驟是
I)通過已建立的基于分子對接、藥效團模型和小分子結構相似性的靶標預測系統(tǒng),分別實現(xiàn)待測藥物或活性化合物與靶標活性位點數(shù)據(jù)進行對接并輸出打分函數(shù)Chemsc0re和打分函數(shù)Goldscore的打分值,與靶標藥效團數(shù)據(jù)庫進行匹配并輸出匹配值Fitvalue,與靶標活性配體數(shù)據(jù)庫進行基于二維指紋圖譜的相似性比對并輸出相似度量值Tanimoto系數(shù)。2)將與祀標活性位點數(shù)據(jù)進行對接的打分函數(shù)Chemscore和打分函數(shù)Goldscore的打分值、與靶標藥效團數(shù)據(jù)的匹配值Fitvalue值、與靶標小分子配體數(shù)據(jù)基于二維指紋圖譜的相似性比對相似度量值Tanimoto系數(shù),分別通過各自相應的活性分子概率分布曲線轉化為其預測正確的概率。3)每個靶標不同評分預測正確的概率,通過置信理論公式計算三種方法綜合預測正確的總概率,置信理論公式(I)為
權利要求
1.一種集成藥物靶標預測系統(tǒng)的構建和預測方法,其特征在于分析蛋白質晶體結構數(shù)據(jù)庫,選取已與類藥性配體小分子結合的蛋白質,或具有與小分子配體結合潛能的蛋白質作為靶點,建立靶標的晶體結構數(shù)據(jù)庫,對于同一個靶標,如有多個晶體結構則選取分辨率較高的I個或多個晶體結構拷貝,針對這些靶標,收集其與疾病的相關信息、生物學類別以及活性小分子配體信息,組建由活性位點數(shù)據(jù)庫、藥效團數(shù)據(jù)庫、小分子化合物數(shù)據(jù)庫以及靶標基本信息數(shù)據(jù)庫組成的綜合型靶標篩選數(shù)據(jù)庫;在綜合型靶標篩選數(shù)據(jù)庫基礎上,通過腳本程序或Pipeline Pilot流程實現(xiàn)集成分子對接技術、藥效團模型和小分子結構相似性三項靶標預測系統(tǒng)的構建,采用基于概率統(tǒng)計的集成方法聯(lián)合這三項技術實現(xiàn)藥物靶標綜合預測,并給出該方法的靶標預測準確度的概率;步驟是 (1)收集藥物靶標的晶體結構 分析蛋白質晶體結構數(shù)據(jù)庫Η)Β,選取已與類藥性配體小分子結合的蛋白質,或具有與小分子配體結合潛能的蛋白質作為靶點,對于同一個靶標,如有多個晶體結構則選取分辨率較高的I個或多個晶體結構拷貝; (2)組建綜合型靶標篩選數(shù)據(jù)庫 對上述收集的藥物靶標,建立靶標活性位點數(shù)據(jù)庫,為基于分子對接的靶標預測提供基礎;針對收集的靶標晶體結構,采用基于受體的藥效團建模方法建立藥效團模型數(shù)據(jù)庫,為基于藥效團模型的靶標預測方法提供基礎;收集藥物靶標的活性小分子配體,建立小分子配體數(shù)據(jù)庫,為基于小分子結構相似性的靶標預測方法提供基礎;收集藥物靶標結構名稱、生物功能類別、相關疾病以及藥物研發(fā)信息,建立藥物靶標基本信息數(shù)據(jù)庫,為靶標預測提供相關信息; (3)建立基于分子對接、藥效團模型和小分子結構相似性的靶標預測系統(tǒng) 在Linux系統(tǒng)下構建腳本程序,自動調(diào)用GOLD對接軟件實現(xiàn)一個給定藥物分子或活性化合物與祀標數(shù)據(jù)庫的祀標活性位點對接,同時輸出打分函數(shù)Chemscore和Goldscore的打分值,實現(xiàn)基于分子對接的靶標預測;通過在Linux系統(tǒng)下構建腳本程序,利用Catalyst軟件實現(xiàn)一個藥物分子或活性化合物與藥效團模型數(shù)據(jù)庫所有藥效團自動匹配,并輸出相應的匹配值Fitvalue,實現(xiàn)基于藥效團模型的祀標預測;通過使用Pipeline Pilot 8. 5軟件構建流程,基于小分子結構指紋圖譜ECFP_4,計算一個給定藥物分子或活性化合物與靶標小分子配體數(shù)據(jù)庫中的化合物的Tanimoto系數(shù),實現(xiàn)基于小分子相似性的靶標預測; (4)活性分子概率分布曲線的建立 首先,通過挑選若干個不同類型的靶標,針對每個靶標分別構建活性化合物集合和非活性化合物集合Decoys,組成訓練集,利用分子對接、藥效團、小分子結構相似性三種方法針對各個祀標及相應訓練集進行篩選;集中所有訓練集的化合物以及各自評分,包括分子對接打分函數(shù)Chemscore的打分值和打分函數(shù)Goldscore的打分值、藥效團匹配值Fitvalue、小分子化合物與祀標已知活性配體相似性比較系數(shù)Tanimoto,分別統(tǒng)計其不同評分分數(shù)段活性分子的概率,利用最小二乘法擬合評分與評分分數(shù)段的概率之間的關系,得到各自評分的活性分子概率分布曲線; (5)集成的藥物靶標預測 在進行藥物或活性化合物的靶標預測時,分別采用基于分子對接的方法、基于藥效團模型的方法和基于小分子結構相似性的方法進行靶標預測,將各評分通過相應的活性分子概率曲線轉化為該評分預測正確的概率,然后采用置信理論Belief Theory計算三種方法的綜合預測正確的總概率,根據(jù)總概率對靶標數(shù)據(jù)庫所有靶標進行排序,排名靠前為預測化合物潛在作用靶標; 集成的藥物靶標預測的具體步驟是 1)通過已建立的基于分子對接、藥效團模型和小分子結構相似性的靶標預測系統(tǒng),分別實現(xiàn)待測藥物或活性化合物與靶標活性位點數(shù)據(jù)進行對接并輸出打分函數(shù)Chemsc0re和打分函數(shù)Goldscore的打分值,與靶標藥效團數(shù)據(jù)庫進行匹配并輸出匹配值Fitvalue,與靶標活性配體數(shù)據(jù)庫進行基于二維指紋圖譜的相似性比對并輸出相似度量值Tanimoto系數(shù); 2)將與祀標活性位點數(shù)據(jù)進行對接的打分函數(shù)Chemscore和打分函數(shù)Goldscore的打分值、與靶標藥效團數(shù)據(jù)的匹配值Fitvalue值、與靶標小分子配體數(shù)據(jù)基于二維指紋圖譜的相似性比對相似度量值Tanimoto系數(shù),分別通過各自相應的活性分子概率分布曲線轉化為其預測正確的概率; 3)每個靶標不同評分預測正確的概率,通過置信理論公式計算三種方法綜合預測正確的總概率,置信理論公式(I)為
2.如權利要求I所述的集成藥物靶標預測系統(tǒng)的構建和預測方法,其特征在于所述利用最小二乘法擬合評分與評分分數(shù)段的概率之間的關系,得到各自評分的活性分子概率分布曲線的步驟如下 1)數(shù)據(jù)的預處理集中所有訓練集的化合物以及各自評分,包括對接的打分函數(shù)Chemscore和Goldscore的打分值、藥效團Fitvalue匹配值、小分子配體基于二維指紋圖譜的相似性比對的相似度量值Tanimoto系數(shù);分別將各個評分所在的區(qū)間按照某個給定的間隔劃分為若干個小的區(qū)間,分別統(tǒng)計出落入每個小區(qū)間中的活性分子數(shù)目和總的分子數(shù)目,總分子數(shù)目是指活性分子和非活性化合物集合Decoys數(shù)目的總和,統(tǒng)計活性分子數(shù)目和總的分子數(shù)目的比值,將該比值視為的活性分子的概率; 2)活性分子概率分布曲線的擬合公式對經(jīng)過預處理的數(shù)據(jù),選擇修正后S型曲線公式(2)對各個評分及其分數(shù)段的概率之間的關系進行擬合,公式(2)為
3.如權利要求2所述的集成藥物靶標預測系統(tǒng)的構建和預測方法,其特征在于所述在對活性分子概率分布曲線的擬合中,對最小概率參數(shù)窮舉取值,對最大概率參數(shù)Fmax采取黃金分割法優(yōu)選取值,然后再轉化線性模型,用最小二乘法進行擬合,具體步驟如下 步驟一根據(jù)實際情況對最小概率賦初值,該值比實際值小, 步驟二 確定最大概率參數(shù)
4.如權利要求I所述的集成藥物靶標預測系統(tǒng)的構建和預測方法,其特征在于所述選取已與類藥性配體小分子結合的蛋白質,或具有與小分子配體結合潛能的蛋白質作為靶點,其選取類藥性配體的條件包括1)屬于有機化合物分子,而非離子型分子;2)氫鍵供體數(shù)目不超過5個;3)氫鍵受體數(shù)目不超過10個;4)分子量在200-700道爾頓之間;5)重原子數(shù)目大于6個;6)氮原子數(shù)目與氧原子數(shù)目之和大于等于I個;7)硫原子數(shù)目不超過I個;8)不含磷原子。
5.如權利要求I所述的集成藥物靶標預測系統(tǒng)的構建和預測方法,其特征在于所述 組建綜合型靶標篩選數(shù)據(jù)庫,對于同一個靶標,如有多個晶體結構,具體采用如下規(guī)則對晶體結構進行挑選1)對于已經(jīng)有上市或臨床藥物的祀標,選擇3到5個帶有重要配體的晶體結構,含已上市藥物或臨床藥物或結合常數(shù)高的化合物;2)對于正在研究的藥物靶標,僅選擇I個晶體結構;3)選擇的晶體結構活性中心周圍殘基無突變,且無缺失;4)同等情況下,選擇精度高的晶體結構。
6.如權利要求I所述的集成藥物靶標預測系統(tǒng)的構建和預測方法,其特征在于所述在收集與疾病的相關信息、生物學類別以及活性小分子配體等信息,組建由活性位點數(shù)據(jù)庫、藥效團數(shù)據(jù)庫、小分子化合物數(shù)據(jù)庫以及靶標基本信息數(shù)據(jù)庫組成的綜合型靶標篩選數(shù)據(jù)庫中最后確定的藥物靶標是1088個。
7.如權利要求I所述的集成藥物靶標預測系統(tǒng)的構建和預測方法,其特征在于所述每個靶標不同評分預測正確的概率,通過置信理論公式計算三種方法綜合預測正確的總概率,Tl 靶標的總概率 P1 計算公式為=P1 = I - (I - Pfl) X (I - Pcl) X (I - Pgl) X (I-Ptl),其中,Pfl代表待測藥物與Tl靶標對應藥效團匹配Fitvalue值預測正確的概率,Pcl表示待測藥物與Tl靶標對應的活性位點打分函數(shù)Chemscore的打分值預測正確的概率、Pgl表示待測藥物與Tl靶標對應的活性位點打分函數(shù)值Goldscore的打分值預測正確的概率,Ptl表示待測藥物與Tl靶標對應的小分子化合物數(shù)據(jù)庫進行基于二維指紋圖譜的相似性量值Tanimoto系數(shù)預測正確的概率。
8.如權利要求I所述的集成藥物靶標預測系統(tǒng)的構建和預測方法,其特征在于所述 分析蛋白質晶體結構數(shù)據(jù)庫TOB,選取已與類藥性配體小分子結合的蛋白質,或具有與小分子配體結合潛能的蛋白質作為靶點,對于同一個靶標,如有多個晶體結構則選取分辨率較高的I個或多個晶體結構拷貝是指如這些結構差異較小,則只選取I個分辨率最高者,否則選取多個晶體結構拷貝。
9.如權利要求I所述的集成藥物靶標預測系統(tǒng)的構建和預測方法,其特征在于所述在活性分子概率分布曲線的建立中通過挑選若干個不同類型的靶標,針對每個靶標分別構建活性化合物集合和非活性化合物集合Decoys,組成訓練集,是挑選20個不同類型靶標,這20個靶標必須具有至少一個可用的晶體結構且在其結合位點處包含一個配體。
全文摘要
本發(fā)明公開了一種集成藥物靶標預測系統(tǒng)的構建和預測方法。分析蛋白質晶體結構數(shù)據(jù)庫,選取已與類藥性配體小分子結合的蛋白質,或具有與小分子配體結合潛能的蛋白質作為靶點,建立靶標的晶體結構數(shù)據(jù)庫,針對這些靶標,收集其與疾病的相關信息、生物學類別以及活性小分子配體信息,集成由活性位點數(shù)據(jù)庫、藥效團數(shù)據(jù)庫、小分子化合物數(shù)據(jù)庫以及靶標基本信息數(shù)據(jù)庫組成的綜合型靶標篩選數(shù)據(jù)庫。在綜合型靶標篩選數(shù)據(jù)庫基礎上,通過腳本程序或PipelinePilot流程實現(xiàn)集成藥物靶標預測系統(tǒng)的構建,給出該方法的靶標預測準確度的概率。本發(fā)明發(fā)揮上述三項技術優(yōu)勢,給出靶標預測的概率,為進行進一步實驗驗證提供了有效的依據(jù)。
文檔編號G06F17/50GK102663214SQ201210140708
公開日2012年9月12日 申請日期2012年5月9日 優(yōu)先權日2012年5月9日
發(fā)明者李國菠, 李琳麗, 楊勝勇, 魏于全 申請人:四川大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1