本發(fā)明涉及一種人運(yùn)甲狀腺素蛋白干擾物虛擬篩選方法,屬于環(huán)境內(nèi)分泌干擾物篩選方法領(lǐng)域。
背景技術(shù):
國際上,潛在環(huán)境內(nèi)分泌干擾活性一直被作為評價有機(jī)化學(xué)品健康風(fēng)險的重要指標(biāo)之一。有機(jī)化學(xué)品干擾甲狀腺激素(TH)系統(tǒng)是其干擾內(nèi)分泌系統(tǒng)的重要機(jī)制之一。TH對脊椎動物生長、發(fā)育、分化、生熱等過程具有重要調(diào)控作用。在正常的生理?xiàng)l件下,TH需要由甲狀腺素運(yùn)載蛋白(TTR,TBG,ALA)轉(zhuǎn)運(yùn)到靶組織,才能產(chǎn)生TH轉(zhuǎn)導(dǎo)的生物學(xué)效應(yīng)。然而,一些物質(zhì)能通過與TH競爭運(yùn)載蛋白結(jié)合位點(diǎn)的途徑影響TH體內(nèi)平衡,進(jìn)而產(chǎn)生毒理效應(yīng),這類物質(zhì)屬于甲狀腺素干擾物(Thyroid disrupting chemicals,TDCs)。結(jié)合態(tài)的TDCs可被轉(zhuǎn)運(yùn)至胎盤等組織,從而減少這些組織TH水平。因此,有必要從日常使用的化學(xué)品中篩選可與TH競爭運(yùn)載蛋白結(jié)合位點(diǎn)的物質(zhì),以減少這些有機(jī)化學(xué)品對TH系統(tǒng)的干擾。
研究表明,TDCs對TBG和ALA的干擾活性較對TTR的干擾活性弱,部分TDCs可在nM水平干擾TTR(Boas M,Feldt-Rasmussen U,Skakkebaek NE,Main KM.Environmental chemicals and thyroid function.Eur J Endocrinol,2006,154(5):599-611)。此外,在人體中,TTR還負(fù)責(zé)運(yùn)輸TH透過血腦屏障進(jìn)入腦脊液和透過胎盤屏障進(jìn)入胎兒體內(nèi)。因此,需要關(guān)注TDCs通過干擾TTR的途徑影響TH體內(nèi)平衡的可能性及程度。
在過去的二十年中,通過實(shí)驗(yàn)測試了100多種有機(jī)化學(xué)品與TH競爭結(jié)合運(yùn)甲狀腺素蛋白的能力,其中有20多種TDCs與(hTTR)的結(jié)合能力比TH強(qiáng)。但是人類日常使用的化學(xué)品已超過14萬多種,且每年都在增加(Rudén C,Hansson SO.Registration,Evaluation,and Authorization of Chemicals(REACH)is but the first step-how far will it take us Six further steps to improve the European chemicals legislation.Environ Health Perspect,2010,118(1):6-10),這些化學(xué)品中哪些能干擾 人和其他脊椎動物TH體內(nèi)平衡成為人們關(guān)注的焦點(diǎn)。目前,評價有機(jī)化學(xué)品與TH競爭結(jié)合TTR能力的方法主要是體內(nèi)暴露實(shí)驗(yàn)法和體外測試法。但是面對待評價有機(jī)化學(xué)品眾多、每種有機(jī)化學(xué)品可能干擾多種生物及干擾同一生物體的多個靶標(biāo)的現(xiàn)狀,必須發(fā)展高通量的評價方法來滿足這種評價需求。此外,由于實(shí)驗(yàn)測定的方法面臨成本高、耗時長的問題,還可能違反動物實(shí)驗(yàn)倫理的“3R”原則,使發(fā)展非實(shí)驗(yàn)方法來獲取有機(jī)化學(xué)品風(fēng)險信息顯得越來越迫切。因此,需要發(fā)展一種具有高通量特性的非實(shí)驗(yàn)評價方法來克服目前方法的不足。(定量)活性-結(jié)構(gòu)相關(guān)已經(jīng)成功用于預(yù)測多種能描述污染物環(huán)境行為的參數(shù),如空氣-辛醇水分配系數(shù)、有機(jī)化學(xué)品生物富集因子等。將定量活性-結(jié)構(gòu)相關(guān)方法應(yīng)用于預(yù)測和篩選具有潛在生物效應(yīng)的有機(jī)化學(xué)品是近年來國際研究的前沿。
文獻(xiàn)檢索結(jié)果表明,涉及TTR的國內(nèi)外專利主要是關(guān)于治療和預(yù)防運(yùn)甲狀腺素蛋白淀粉化、預(yù)防運(yùn)甲狀腺素蛋白誤折疊及運(yùn)甲狀腺素蛋白提取方法等方面。在本發(fā)明完成前,關(guān)于篩選具有hTTR干擾活性的TDCs的專利未見報道。關(guān)于TDCs與TTR相互作用的模型研究有七篇,其中五篇論文涉及溴代阻燃劑、兩篇論文涉及全氟及多氟類化學(xué)品。Papa等人(Papa E,Kovarich S,Gramatica P.QSAR modeling and prediction of the endocrine-disrupting potencies of brominated flame retardants.Chem Res Toxicol,2010,23(5):946-954)基于17個溴代阻燃劑構(gòu)建了能預(yù)測hTTR干擾效應(yīng)的定量模型。預(yù)測模型的特征是使用兩個分子描述符表征溴代阻燃劑的干擾效應(yīng);Yang等人(Yang WH,Shen S,Mu LL,Yu HX.Structure-activity relationship study on the binding of PBDEs with thyroxine transport proteins.Environ ToxicolChem,2011,30(11):2431-2439)基于28個多溴聯(lián)苯醚及其羥基代謝物(其中16個有機(jī)化學(xué)品有活性),采用比較分子相似性指數(shù)分析法構(gòu)建了能預(yù)測hTTR干擾效應(yīng)的三維預(yù)測模型。預(yù)測模型的特征是使用體積場、靜電場、疏水場和氫鍵受體場作為描述符描述多溴聯(lián)苯醚及其羥基代謝物的干擾效應(yīng);Kovarich等人(Kovarich S,Papa E,Gramatica P.QSAR classification models for the prediction of endocrine disrupting activity of brominated flame retardants.J Hazard Mater,2011,190(1-3):106-112;Kovarich S,Papa E,Li J, Gramatica P.QSAR classification models for the screening of the endocrine-disrupting activity of perfluorinated compounds.SAR QSAR Environ Res.2012,23(3-4):207-220)基于29個溴代阻燃劑(其中17個有機(jī)化學(xué)品有活性)和19個全氟及多氟類化學(xué)品(其中11個有機(jī)化學(xué)品有活性)分別構(gòu)建了hTTR干擾效應(yīng)的分類模型。預(yù)測模型的特征是使用兩個分子描述符將溴代阻燃劑分為無活性、中等活性和高活性三類;并表征了模型預(yù)測準(zhǔn)確度和模型應(yīng)用域。
最近,Papa等人(Papa E,Kovarich S,Gramatica P.QSAR prediction of the competitive interaction of emerging halogenated pollutants with human transthyretin.SAR QSAR Environ Res.2013,24(4):599-615)基于53個有機(jī)化學(xué)品(29個溴代阻燃劑(其中17個有機(jī)化學(xué)品有活性)和24個全氟及多氟類化學(xué)品(其中15個有機(jī)化學(xué)品有活性))構(gòu)建了一個分類模型。分類預(yù)測模型的特征是使用三個分子描述符將溴代阻燃劑分為無活性、中等活性和高活性三類;并表征了模型預(yù)測準(zhǔn)確度;此外,還基于有效應(yīng)的32個有機(jī)化學(xué)品構(gòu)建了定量預(yù)測模型,其特征是使用三個分子描述符描述溴代阻燃劑和全氟及多氟類化學(xué)品的干擾效應(yīng);表征了模型擬合優(yōu)度、穩(wěn)健性、預(yù)測能力和模型應(yīng)用域;易忠勝等人(易忠勝,李連臣,葉廷文,劉紅艷,莫凌云.羥基多溴二苯醚生物活性的QSAR研究.桂林理工大學(xué)學(xué)報.2011,31(3):430-438)基于14種羥基多溴聯(lián)苯醚與hTTR的干擾效應(yīng)數(shù)據(jù),采用多元線性回歸方法構(gòu)建了三參數(shù)的預(yù)測模型。
Yang等人(Yang XH,Xie HB,Chen JW,Li XH.Anionic Phenolic Compounds Bind Stronger with Transthyretin than Their Neutral Forms:Nonnegligible Mechanisms in Virtual Screening of Endocrine Disrupting Chemicals.Chem Res Toxicol,2013,26(9):1340-1347)以酚類有機(jī)化學(xué)品為模型有機(jī)化學(xué)品研究了可電離有機(jī)化學(xué)品與hTTR的相互作用機(jī)制,發(fā)現(xiàn)陰離子態(tài)酚類有機(jī)化學(xué)品與該蛋白的相互作用強(qiáng)于對應(yīng)分子形態(tài)。酚類有機(jī)化學(xué)品中的芳環(huán)能與hTTR的殘基形成陽離子-π相互作用。該結(jié)果為進(jìn)行分類預(yù)測提供了機(jī)理信息。
目前,關(guān)于預(yù)測TDCs對hTTR干擾效應(yīng)的模型存在如下的不足:
(1)只是構(gòu)建了單一的預(yù)測模型,沒有形成系統(tǒng)的篩選策略及方法;
(2)只能適用于多溴聯(lián)苯醚及羥基多溴聯(lián)苯醚等溴代阻燃劑和全氟及多氟類化學(xué)品。
針對以上的不足及需要篩選潛在的hTTR干擾物的需求。本發(fā)明從如下幾個方面進(jìn)行了改進(jìn):
(1)收集多種類化學(xué)品對hTTR干擾效應(yīng)數(shù)據(jù),化學(xué)品包括鹵代聯(lián)苯及羥基鹵代聯(lián)苯類、羥基二噁英類、殺蟲劑、鹵代聯(lián)苯醚及羥基鹵代聯(lián)苯醚類、鹵代酚類、鹵代雙酚A類、多氟代及全氟代羧酸或磺酸類化學(xué)品及鹵代烷烴;構(gòu)建了hTTR干擾物篩選策略及方法。即基于10個基團(tuán)將化學(xué)品進(jìn)行分類,然后使用定量結(jié)構(gòu)-活性關(guān)系模型預(yù)測每類化學(xué)品對hTTR的干擾效應(yīng);
(2)針對不同類別的有機(jī)化學(xué)品與hTTR相互作用的不同特點(diǎn),分別選擇分子描述符,基于多元線性回歸方法構(gòu)建預(yù)測模型;使用內(nèi)部驗(yàn)證和外部驗(yàn)證方法評估模型擬合優(yōu)度、穩(wěn)健性和預(yù)測能力;并使用杠桿值法對模型的應(yīng)用域進(jìn)行定義。
本發(fā)明的有益效果:
(1)構(gòu)建了適用于多種類化學(xué)品的hTTR干擾物虛擬篩選策略及方法;
(2)分子描述符容易計(jì)算;預(yù)測模型簡潔透明、易于實(shí)現(xiàn)程序化;根據(jù)經(jīng)濟(jì)合作與發(fā)展組織發(fā)布的關(guān)于定量結(jié)構(gòu)-活性相關(guān)模型構(gòu)建與驗(yàn)證的導(dǎo)則,表征了預(yù)測模型的擬合優(yōu)度、穩(wěn)健性和預(yù)測能力,定義了模型的應(yīng)用域。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明要解決的技術(shù)問題是建立一種可靠、簡便、快速、低廉的區(qū)分及篩選潛在hTTR干擾物的策略和方法。具體要解決三方面的技術(shù)問題:
(1)選取合適的化學(xué)品分類基團(tuán);
(2)構(gòu)建準(zhǔn)確可靠的定量預(yù)測模型;
(3)構(gòu)建合理的hTTR干擾物虛擬篩選策略及實(shí)現(xiàn)方法。
根據(jù)分子結(jié)構(gòu)相似的物質(zhì),具有類似的物理化學(xué)性質(zhì)、環(huán)境歸趨和生態(tài)毒理學(xué)效應(yīng)的原理,采用數(shù)學(xué)模型表征分子結(jié)構(gòu)與其理化性質(zhì)、環(huán)境行為和生態(tài)毒理學(xué)參數(shù)的內(nèi)在聯(lián)系(如結(jié)構(gòu)-活性關(guān)系(SAR)和定量結(jié)構(gòu)-活性關(guān)系(QSAR)等), 是國際上倡導(dǎo)使用的化學(xué)品理化性質(zhì)、環(huán)境行為和生態(tài)毒理學(xué)效應(yīng)參數(shù)數(shù)據(jù)獲取技術(shù)之一。此理論的核心是基于一定樣本數(shù)的數(shù)據(jù),揭示出分子結(jié)構(gòu)與效應(yīng)之間的內(nèi)在關(guān)系,進(jìn)而使用科學(xué)的統(tǒng)計(jì)學(xué)方法構(gòu)建分子結(jié)構(gòu)與化學(xué)品理化性質(zhì)、環(huán)境行為和生態(tài)毒理學(xué)效應(yīng)參數(shù)之間的數(shù)學(xué)關(guān)系。基于此,本發(fā)明首先從文獻(xiàn)收集有機(jī)污染物對hTTR干擾效應(yīng)的實(shí)驗(yàn)數(shù)據(jù);在分析干擾效應(yīng)與結(jié)構(gòu)關(guān)系的基礎(chǔ)上,篩選出10個基團(tuán)對化學(xué)品進(jìn)行分類,然后使用多元線性回歸方法構(gòu)建定量預(yù)測模型;最后使用模型預(yù)測每類化學(xué)品對hTTR干擾效應(yīng),進(jìn)而根據(jù)預(yù)測的效應(yīng)值判斷化學(xué)品是否具有干擾hTTR轉(zhuǎn)運(yùn)甲狀腺素的能力及干擾能力的強(qiáng)弱。
本發(fā)明的技術(shù)方案:
一種人運(yùn)甲狀腺素蛋白干擾物虛擬篩選方法,步驟如下:
(1)收集有機(jī)化學(xué)品數(shù)據(jù)
收集108種有機(jī)化學(xué)品對hTTR干擾效應(yīng)數(shù)據(jù),該數(shù)據(jù)是通過放射性配體競爭結(jié)合方式獲取,獲取的條件:pH=8.0、放射性配體為125I標(biāo)記的甲狀腺素125I-T4和hTTR蛋白濃度為30nM;其中,62種有機(jī)化學(xué)品具有可檢測的干擾活性;有機(jī)化學(xué)品與125I-T4競爭hTTR結(jié)合位點(diǎn)的能力使用半數(shù)競爭效應(yīng)濃度(IC50)表示,IC50為將125I-T4從hTTR結(jié)合位點(diǎn)替換出50%時需要的有機(jī)化學(xué)品濃度;
108種有機(jī)化學(xué)品包括鹵代聯(lián)苯及羥基鹵代聯(lián)苯類、羥基二噁英類、殺蟲劑、鹵代聯(lián)苯醚及羥基鹵代聯(lián)苯醚類、鹵代酚類、鹵代雙酚A類、多氟代及全氟代羧酸和磺酸類及鹵代烷烴類;
(2)選取關(guān)鍵基團(tuán)、進(jìn)行化學(xué)品分類
在選取合適的分類基團(tuán)方面,基于Dragon6.0軟件計(jì)算的基團(tuán),分析了具有干擾活性的有機(jī)化學(xué)品結(jié)構(gòu)特征。根據(jù)出現(xiàn)率大于10%的官能團(tuán)及官能團(tuán)的意義,可以看出,描述符主要區(qū)分了芳烴和烷烴;此外,在取代基方面,主要體現(xiàn)了極性基團(tuán)或可電離基團(tuán)和鹵素取代的重要性。作用機(jī)制分析結(jié)果表明(Yang XH,Xie HB,Chen JW,Li XH.Anionic Phenolic Compounds Bind Stronger with Transthyretin than Their Neutral Forms:Nonnegligible Mechanisms in Virtual Screening of Endocrine Disrupting Chemicals.Chem Res Toxicol,2013, 26(9):1340-1347),有機(jī)化學(xué)品結(jié)構(gòu)中芳環(huán)可與hTTR形成陽離子-π相互作用,由于烷烴結(jié)構(gòu)中無芳環(huán)結(jié)構(gòu),因而不能與hTTR形成陽離子-π相互作用,這是導(dǎo)致烷烴類有機(jī)化學(xué)品與hTTR的相互作用弱于芳烴類有機(jī)化學(xué)品與hTTR的相互作用的重要原因之一。
可電離基團(tuán)在有機(jī)化學(xué)品與hTTR結(jié)合過程中的作用在于,在生理或?qū)嶒?yàn)條件下,羥基(-OH)、羧基(-COOH)、磺酸基和亞磺酸基(-SO2OH和-SOOH)等基團(tuán)可解離為陰離子,該陰離子基團(tuán)可與hTTR活性位點(diǎn)處的賴氨酸殘基側(cè)鏈-NH3+形成離子對相互作用,導(dǎo)致有機(jī)化學(xué)品陰離子形態(tài)與hTTR的相互作用強(qiáng)于對應(yīng)的分子形態(tài)。此外,有機(jī)化學(xué)品分子結(jié)構(gòu)中的鹵素基團(tuán)可通過與hTTR形成鹵鍵和鹵氫鍵、及通過誘導(dǎo)效應(yīng)和疏水效應(yīng)影響有機(jī)鹵有機(jī)化學(xué)品與TTR相互作用。因此,芳烴與烷烴、可解離有機(jī)化學(xué)品與不可解離有機(jī)化學(xué)品、鹵代有機(jī)化學(xué)品與非鹵代有機(jī)化學(xué)品與hTTR具有不同的作用機(jī)制。
根據(jù)氮原子個數(shù)nN、芳香碳原子個數(shù)nCar、酚羥基個數(shù)nArOH、苯甲酸基個數(shù)nArCOOH、羥基個數(shù)nROH、羧基個數(shù)nRCOOH、磺酸基個數(shù)nSO3H、亞磺酸基個數(shù)nSO2H、苯環(huán)取代的鹵素個數(shù)nArX和鹵素個數(shù)nX對108種有機(jī)化學(xué)品進(jìn)行分類,分類方法如下:
第一步:在步驟(1)得到108種有機(jī)化學(xué)品對hTTR干擾效應(yīng)數(shù)據(jù)中,首先,先判斷nN是否為0,當(dāng)nN=0時,需進(jìn)一步判斷;當(dāng)nN≠0時,含氮原子的有機(jī)化學(xué)品被排除;
第二步:當(dāng)nN=0時,再判斷nCar是否大于0,將有機(jī)化學(xué)品分為芳香類有機(jī)化學(xué)品和非芳香類有機(jī)化學(xué)品,當(dāng)nCar>0時,有機(jī)化學(xué)品為芳香類有機(jī)化學(xué)品;當(dāng)有機(jī)化學(xué)品nCar=0時,有機(jī)化學(xué)品為非芳香類有機(jī)化學(xué)品;
第三步:對于芳香類有機(jī)化學(xué)品,再判斷nArOH+nArCOOH是否大于0,篩選出含酚羥基或苯甲酸基的有機(jī)化學(xué)品;當(dāng)有機(jī)化學(xué)品nArOH+nArCOOH>0時,此有機(jī)化學(xué)品為含酚羥基或苯甲酸基的有機(jī)化學(xué)品,為第一類有機(jī)化學(xué)品;當(dāng)有機(jī)化學(xué)品nArOH+nArCOOH=0時,此有機(jī)化學(xué)品進(jìn)一步判斷;當(dāng)nArOH+nArCOOH=0的芳香類有機(jī)化學(xué)品,再判斷nROH+nRCOOH+nSO2OH+nSOOH是否大于0,篩選出支鏈 含羥基、羧基、磺酸基或亞磺酸基的芳香類有機(jī)化學(xué)品;
當(dāng)有機(jī)化學(xué)品nROH+nRCOOH+nSO2OH+nSOOH>0時,此有機(jī)化學(xué)品為支鏈含羥基或羧基或磺酸基或亞磺酸基的芳香類有機(jī)化學(xué)品,為第二類有機(jī)化學(xué)品;當(dāng)有機(jī)化學(xué)品nROH+nRCOOH+nSO2OH+nSOOH=0時,此有機(jī)化學(xué)品進(jìn)行進(jìn)一步判斷;
對nROH+nRCOOH+nSO2OH+nSOOH=0的芳香類有機(jī)化學(xué)品,再判斷nArX是否大于0,篩選出鹵代芳烴;當(dāng)有機(jī)化學(xué)品nArX>0時,此有機(jī)化學(xué)品為鹵代芳烴,為第三類有機(jī)化學(xué)品;當(dāng)有機(jī)化學(xué)品nArX=0時,此有機(jī)化學(xué)品被排除;
第四步:對于烷烴類有機(jī)化學(xué)品,判斷nROH+nRCOOH+nSO2OH+nSOOH是否大于0,篩選出含羥基或羧基或磺酸基或亞磺酸基的有機(jī)化學(xué)品;當(dāng)有機(jī)化學(xué)品nROH+nRCOOH+nSO2OH+nSOOH>0時,此有機(jī)化學(xué)品為含羥基或羧基或磺酸基或亞磺酸基的有機(jī)化學(xué)品,為第四類有機(jī)化學(xué)品;當(dāng)有機(jī)化學(xué)品nROH+nRCOOH+nSO2OH+nSOOH=0時,此有機(jī)化學(xué)品進(jìn)行進(jìn)一步判斷;
對nROH+nRCOOH+nSO2OH+nSOOH=0的烷烴類有機(jī)化學(xué)品,再判斷nX是否大于0,篩選出鹵代烷烴;當(dāng)有機(jī)化學(xué)品nX>0時,此有機(jī)化學(xué)品為鹵代烷烴,為第五類有機(jī)化學(xué)品;當(dāng)有機(jī)化學(xué)品nX=0時,此有機(jī)化學(xué)品被排除;
通過這十個關(guān)鍵的基團(tuán)可以將有機(jī)化學(xué)品按效應(yīng)強(qiáng)弱分成五類:
①酚類或苯甲酸類有機(jī)化學(xué)品;
②支鏈含羥基或羧基或磺酸基或亞磺酸基的芳香類有機(jī)化學(xué)品;
③不含羥基或羧基或磺酸基或亞磺酸基等基團(tuán)的鹵代芳烴有機(jī)化學(xué)品;
④含羥基或羧基或磺酸基或亞磺酸基等基團(tuán)的烷烴類有機(jī)化學(xué)品;
⑤不含羥基或羧基或磺酸基或亞磺酸基等基團(tuán)的鹵代烷烴類有機(jī)化學(xué)品。
本發(fā)明適用化學(xué)品范圍:
①不含氮的有機(jī)化學(xué)品
②芳香烴類化學(xué)品:主要以羥基或羧基或鹵素為取代官能團(tuán);
③烷烴類化學(xué)品:主要以羥基或羧基或磺酸基或亞磺酸基或鹵素為取代官能團(tuán)。
(3)定量預(yù)測模型的構(gòu)建及表征
建模時用取對數(shù)的相對效應(yīng)勢(RP)表征TDCs與TH競爭hTTR結(jié)合位點(diǎn)的能力,RP定義為:
其中:IC50(T4)和IC50(TDCs)分別代表甲狀腺素(T4)和TDCs的半數(shù)競爭效應(yīng)濃度(nM)。logRP值越大,表示有機(jī)化學(xué)品與TH競爭hTTR結(jié)合位點(diǎn)的能力越強(qiáng)。
為了構(gòu)建應(yīng)用域包含無活性化學(xué)品的定量預(yù)測模型,將無活性的有機(jī)化學(xué)品干擾活性設(shè)定為625000nM(Yang WH,Shen S,Mu LL,Yu HX.2011.Structure-activity relationship study on the binding of PBDEs with thyroxine transport proteins.Environ ToxicolChem,30:2431-2439)。根據(jù)Weiss等人測試的TH與hTTR作用的IC50(T4)值為61nM(Weiss JM,Andersson PL,Lamoree MH,Leonards PE,van Leeuwen SP,Hamers T.2009.Competitive binding of poly-and perfluorinated compounds to the thyroid hormone transport protein transthyretin.ToxicolSci 109:206-216.),可計(jì)算出無活性的化學(xué)品相對效應(yīng)勢logRP=-4.011。
①計(jì)算分子描述符
優(yōu)化有機(jī)化學(xué)品分子結(jié)構(gòu),基于優(yōu)化的有機(jī)化學(xué)品分子結(jié)構(gòu),計(jì)算每種有機(jī)化學(xué)品的4885個Dragon描述符;描述符按照以下原則進(jìn)行預(yù)處理:去除有缺失值的描述符;兩個描述符相關(guān)性大于0.99的描述符,去除標(biāo)準(zhǔn)偏差大的描述符;
②根據(jù)步驟(2)的分類結(jié)果,構(gòu)建了芳香類和烷烴類有機(jī)有機(jī)化學(xué)品對hTTR干擾效應(yīng)的預(yù)測模型:其中,芳香類有機(jī)化學(xué)品預(yù)測模型包括75個有機(jī)化學(xué)品,訓(xùn)練集和驗(yàn)證集分別為61個和14個;烷烴類有機(jī)化學(xué)品預(yù)測模型包括33個有機(jī)化學(xué)品,訓(xùn)練集和驗(yàn)證集分別為24個和9個;采用逐步多元線性回歸方法構(gòu)建芳香類和烷烴類有機(jī)有機(jī)化學(xué)品對hTTR干擾效應(yīng)的預(yù)測模型;
③預(yù)測模型表達(dá)式:
芳香類有機(jī)化學(xué)品預(yù)測模型表達(dá)式為:
logRP=-3.181+2.515nArOH-8.990×10-1CIC3+3.463Eig15_EA(dm)
+2.723×10-1H7m+6.901×10-1RTs+ (2)
其中,nArOH指分子中酚羥基的個數(shù),CIC3是分子信息指數(shù),Eig15_EA(dm)是偶極矩加權(quán)的特征值,H7m是分子質(zhì)量加權(quán)的H自相關(guān)指數(shù),RTs+是I-state加權(quán)的R指數(shù);
烷烴類有機(jī)化學(xué)品預(yù)測模型表達(dá)式為:
logRP=-4.279+3.891×10-2H2s–1.961×10-1Mor07m
+5.476×10R8v+ (3)
其中,H2s是I-state加權(quán)的H自相關(guān)指數(shù),Mor07m是分子質(zhì)量加權(quán)的3D-MoRSE描述符,R8v+指分子范德華體積加權(quán)的R自相關(guān)指數(shù);
④采用實(shí)驗(yàn)值與預(yù)測值之間的相關(guān)系數(shù)平方(R2)、去一法交叉驗(yàn)證系數(shù)(Q2訓(xùn)練集)、外部驗(yàn)證集的相關(guān)系數(shù)(Q2驗(yàn)證集)和均方根誤差(RMSE)評價模型的擬合優(yōu)度、穩(wěn)健性和預(yù)測能力;
芳香類有機(jī)化學(xué)品預(yù)測模型的表征結(jié)果:訓(xùn)練集的實(shí)驗(yàn)值與預(yù)測值之間的相關(guān)系數(shù)平方R2訓(xùn)練集=0.899,訓(xùn)練集的均方根誤差(RMSE訓(xùn)練集)=0.662,Q2訓(xùn)練集=0.863,表明模型具有較好的擬合優(yōu)度和穩(wěn)健性;外部驗(yàn)證集的相關(guān)系數(shù)Q2驗(yàn)證集=0.874,R2驗(yàn)證集=0.879,外部驗(yàn)證集的均方根誤差RMSE驗(yàn)證集=0.734,表明模型具有較好的預(yù)測能力。
烷烴類有機(jī)化學(xué)品預(yù)測模型的表征結(jié)果:R2訓(xùn)練集=0.961,RMSE訓(xùn)練集=0.217,Q2訓(xùn)練集=0.940,表明模型具有較好的擬合優(yōu)度和穩(wěn)健性;Q2驗(yàn)證集=0.932,R2驗(yàn)證集=0.950,RMSE驗(yàn)證集=0.264,表明模型具有較好的預(yù)測能力;
⑤使用Williams圖表征了模型的應(yīng)用域,Williams圖由標(biāo)準(zhǔn)殘差和杠桿值表示。芳香類有機(jī)化學(xué)品預(yù)測模型的應(yīng)用域?yàn)椋焊軛U值小于0.3;烷烴類有機(jī)化學(xué)品預(yù)測模型的應(yīng)用域?yàn)椋焊軛U值小于0.5。
(4)人運(yùn)甲狀腺素蛋白干擾物虛擬篩選方法
使用本發(fā)明進(jìn)行hTTR干擾物虛擬篩選的步驟為:
①根據(jù)分子結(jié)構(gòu)基團(tuán)判斷未知化學(xué)品是否在篩選方法的機(jī)理域內(nèi)。若在方法的機(jī)理域內(nèi),則基于十個基團(tuán)將未知有機(jī)化學(xué)品進(jìn)行分類;若不在方法的機(jī) 理域內(nèi),則不能用此方法進(jìn)行預(yù)測。
②根據(jù)未知化學(xué)品分類結(jié)果,選擇合適的預(yù)測模型;基于預(yù)測模型的要求計(jì)算未知有機(jī)化學(xué)品的分子描述符,并依據(jù)分子描述符計(jì)算未知有機(jī)化學(xué)品的杠桿值,比較未知有機(jī)化學(xué)品的杠桿值是否在模型的應(yīng)用域范圍內(nèi)。若未知有機(jī)化學(xué)品在模型的應(yīng)用域范圍內(nèi),則依據(jù)選擇的模型計(jì)算未知有機(jī)化學(xué)品對hTTR的logRP值;若未知有機(jī)化學(xué)品不在模型的應(yīng)用域范圍內(nèi),則不能用模型進(jìn)行預(yù)測。
③根據(jù)預(yù)測的logRP值判斷未知有機(jī)化學(xué)品是否具有干擾hTTR轉(zhuǎn)運(yùn)TH的能力及干擾能力的強(qiáng)弱。
干擾能力的判斷標(biāo)準(zhǔn)如下:
高干擾活性:logRP≥-1.00;
中等干擾活性:-2.00≤logRP<-1.00;
低干擾活性:-4.011≤logRP<-2.00;
無干擾活性:logRP<-4.011。
本發(fā)明的有益效果:
(1)構(gòu)建的hTTR干擾物虛擬篩選策略及方法簡明、合理;
(2)分子描述符簡單、容易計(jì)算;預(yù)測模型形式簡明、易于程序化實(shí)現(xiàn);根據(jù)經(jīng)濟(jì)合作與發(fā)展組織發(fā)布的關(guān)于定量結(jié)構(gòu)-活性關(guān)系模型構(gòu)建與驗(yàn)證的導(dǎo)則,表征了預(yù)測模型的擬合優(yōu)度、穩(wěn)健性和預(yù)測能力,定義了模型的應(yīng)用域。
(3)兩次判定未知化學(xué)品是否處于篩選方法的應(yīng)用域內(nèi),提高了預(yù)測結(jié)果的準(zhǔn)確度和可信度。
附圖說明
圖1是人運(yùn)甲狀腺素蛋白干擾物結(jié)構(gòu)-活性關(guān)系分析圖。
圖2是芳香類有機(jī)化學(xué)品預(yù)測模型訓(xùn)練集和驗(yàn)證集實(shí)驗(yàn)值與預(yù)測值關(guān)系圖。
圖3是烷烴類有機(jī)化學(xué)品預(yù)測模型訓(xùn)練集和驗(yàn)證集實(shí)驗(yàn)值與預(yù)測值關(guān)系圖。
圖4是人運(yùn)甲狀腺素蛋白干擾物篩選流程圖。
具體實(shí)施方式
以下結(jié)合技術(shù)方案和附圖,進(jìn)一步說明本發(fā)明的具體實(shí)施方式。
實(shí)施例1
2,4,6-三溴苯胺無人運(yùn)甲狀腺素蛋白的干擾活性(logRP=-4.011)。利用本發(fā)明預(yù)測其干擾活性的步驟如下:
根據(jù)Dragon計(jì)算的分子描述符,2,4,6-三溴苯胺的nN=1,為含氮有機(jī)化學(xué)品,不在方法的機(jī)理域內(nèi),不能進(jìn)入下一步計(jì)算。
不能使用模型預(yù)測2,4,6-三溴苯胺對人運(yùn)甲狀腺素蛋白的干擾活性。
實(shí)施例2
2'-羥基-2,3',4,4'-四溴聯(lián)苯醚對人運(yùn)甲狀腺素蛋白的干擾活性logRP=-1.871×10-1。利用本發(fā)明預(yù)測其干擾活性的步驟如下:
根據(jù)Dragon計(jì)算的分子描述符,2'-羥基-2,3',4,4'-四溴聯(lián)苯醚的nN=0,為不含氮有機(jī)化學(xué)品,在方法的機(jī)理域內(nèi),能進(jìn)入下一步計(jì)算;
其nCar=12>0,為芳香類有機(jī)化學(xué)品,且其nArOH+nArCOOH=1>0,為酚類有機(jī)化學(xué)品,在方法的機(jī)理域內(nèi),屬于化學(xué)品類別I,可進(jìn)入下一步計(jì)算;
根據(jù)化學(xué)品分類結(jié)果,選用模型1進(jìn)行活性預(yù)測。
依據(jù)2'-羥基-2,3',4,4'-四溴聯(lián)苯醚的分子結(jié)構(gòu)計(jì)算其杠桿值為0.03,在模型1的應(yīng)用域范圍內(nèi)(杠桿值小于0.3),因此,模型1可用于預(yù)測2'-羥基-2,3',4,4'-四溴聯(lián)苯醚對人運(yùn)甲狀腺素蛋白的干擾活性:
logRP=-3.181+2.515nArOH-8.990×10-1CIC3+3.463Eig15_EA(dm)
+2.723×10-1H7m+6.901×10-1RTs+
=-3.181+2.515×1-8.990×10-1×1.67×10-1+3.463×0
+2.723×10-1×6×10-2+6.901×10-1×1.127
=-2.210×10-2
模型預(yù)測的2'-羥基-2,3',4,4'-四溴聯(lián)苯醚logRP=-2.210×10-2,實(shí)驗(yàn)值為logRP=-1.871×10-1,預(yù)測值與實(shí)驗(yàn)值具有一致性。根據(jù)效應(yīng)值判斷,此有機(jī)化學(xué)品具有高干擾活性。因此,需要高度關(guān)注2'-羥基-2,3',4,4'-四溴聯(lián)苯醚通過干擾人運(yùn)甲狀腺素蛋白轉(zhuǎn)運(yùn)甲狀腺素的方式干擾甲狀腺系統(tǒng)。
實(shí)施例3
3,3',4,4',5-五氯聯(lián)苯對人運(yùn)甲狀腺素蛋白的干擾活性logRP=-3.354。利用本發(fā)明預(yù)測其干擾活性的步驟如下:
根據(jù)Dragon計(jì)算的分子描述符,3,3',4,4',5-五氯聯(lián)苯的nN=0,為不含氮有機(jī)化學(xué)品,在方法的機(jī)理域內(nèi),能進(jìn)入下一步計(jì)算;
其nCar=12>0,為芳香類有機(jī)化學(xué)品;
nArOH+nArCOOH=0,不是酚類或苯甲酸類有機(jī)化學(xué)品;
nROH+nRCOOH+nSO2OH+nSOOH=0,為不含羥基或羧基或磺酸基或亞磺酸基的芳香類有機(jī)化學(xué)品;
nArX=5>0,為鹵代芳香類有機(jī)化學(xué)品,在方法的機(jī)理域內(nèi),屬于化學(xué)品類別III,可進(jìn)入下一步計(jì)算;
根據(jù)化學(xué)品分類結(jié)果,選用模型1進(jìn)行活性預(yù)測。
依據(jù)3,3',4,4',5-五氯聯(lián)苯的分子結(jié)構(gòu)計(jì)算其杠桿值為0.05,在模型1的應(yīng)用域范圍內(nèi)(杠桿值小于0.5)。因此,模型1可用于預(yù)測3,3',4,4',5-五氯聯(lián)苯對人運(yùn)甲狀腺素蛋白的干擾活性:
logRP=-3.181+2.515nArOH-8.990×10-1CIC3+3.463Eig15_EA(dm)
+2.723×10-1H7m+6.901×10-1RTs+
=-3.181+2.515×0-8.990×10-1×8.87×10-1+3.463×0
+2.723×10-1×0+6.901×10-1×1.231
=-3.129
模型預(yù)測的3,3',4,4',5-五氯聯(lián)苯logRP=-3.129,實(shí)驗(yàn)值為logRP=-3.354,預(yù)測值與實(shí)驗(yàn)值具有一致性。根據(jù)效應(yīng)值判斷,此有機(jī)化學(xué)品具有低干擾活性。其與人運(yùn)甲狀腺素蛋白的結(jié)合能力遠(yuǎn)弱于天然甲狀腺素,因此,3,3',4,4',5-五氯聯(lián)苯只能在高濃度水平(>10-4mol)才具有干擾人運(yùn)甲狀腺素蛋白轉(zhuǎn)運(yùn)甲狀腺素的能力。
實(shí)施例4
3,3',4,4',5,5'-六溴聯(lián)苯醚無人運(yùn)甲狀腺素蛋白的干擾活性(logRP=-4.011)。 利用本發(fā)明預(yù)測其干擾活性的步驟如下:
根據(jù)Dragon計(jì)算的分子描述符,3,3',4,4',5,5'-六溴聯(lián)苯醚的nN=0,為不含氮有機(jī)化學(xué)品,在方法的機(jī)理域內(nèi),能進(jìn)入下一步計(jì)算;
其nCar=12>0,為芳香類有機(jī)化學(xué)品;
nArOH+nArCOOH=0,不是酚類或苯甲酸類有機(jī)化學(xué)品;
nROH+nRCOOH+nSO2OH+nSOOH=0,為不含羥基或羧基或磺酸基或亞磺酸基的芳香類有機(jī)化學(xué)品;
nArX=6>0,為鹵代芳香類有機(jī)化學(xué)品,在方法的機(jī)理域內(nèi),屬于化學(xué)品類別III,可進(jìn)入下一步計(jì)算;
根據(jù)化學(xué)品分類結(jié)果,選用模型1進(jìn)行活性預(yù)測。
依據(jù)3,3',4,4',5,5'-六溴聯(lián)苯醚的分子結(jié)構(gòu)計(jì)算其杠桿值為0.06,在模型1的應(yīng)用域范圍內(nèi)(杠桿值小于0.5)。因此,模型1可用于預(yù)測3,3',4,4',5,5'-六溴聯(lián)苯醚對人運(yùn)甲狀腺素蛋白的干擾活性:
logRP=-3.181+2.515nArOH-8.990×10-1CIC3+3.463Eig15_EA(dm)
+2.723×10-1H7m+6.901×10-1RTs+
=-3.181+2.515×0-8.990×10-1×1.652+3.463×0
+2.723×10-1×4.3×10-2+6.901×10-1×5.91×10-1
=-4.247
模型預(yù)測的3,3',4,4',5,5'-六溴聯(lián)苯醚logRP=-4.247,無干擾活性。
實(shí)施例5
全氟己酸對人運(yùn)甲狀腺素蛋白的干擾活性logRP=-2.130。利用本發(fā)明預(yù)測其干擾活性的步驟如下:
根據(jù)Dragon計(jì)算的分子描述符,全氟己酸的nN=0,為不含氮有機(jī)化學(xué)品,在方法的機(jī)理域內(nèi),能進(jìn)入下一步計(jì)算;
其nCar=0,為烷烴類有機(jī)化學(xué)品;
nROH+nRCOOH+nSO2OH+nSOOH=1>0,為含羥基或羧基或磺酸基或亞磺酸基的烷烴類有機(jī)化學(xué)品,在方法的機(jī)理域內(nèi),屬于化學(xué)品類別IV,可進(jìn)入下一步 計(jì)算;
根據(jù)化學(xué)品分類結(jié)果,選用模型2進(jìn)行活性預(yù)測。
依據(jù)全氟己酸的分子結(jié)構(gòu)計(jì)算其杠桿值為0.1,在模型2的應(yīng)用域范圍內(nèi)(杠桿值小于0.5)。因此,模型2可用于預(yù)測全氟己酸對人運(yùn)甲狀腺素蛋白的干擾活性:
logRP=-4.279+3.891×10-2H2s–1.961×10-1Mor07m+5.476×10R8v+
=-4.279+3.891×10-2×6.368×10–1.961×10-1×3.37+5.476×10×7×10-3
=-2.079
根據(jù)模型預(yù)測的全氟己酸logRP=-2.130,實(shí)驗(yàn)值為logRP=-2.079,預(yù)測值與實(shí)驗(yàn)值具有一致性。根據(jù)效應(yīng)值判斷,此有機(jī)化學(xué)品具有低干擾活性。因此,全氟己酸在較高濃度水平(>10-5mol)才具有干擾人運(yùn)甲狀腺素蛋白轉(zhuǎn)運(yùn)甲狀腺素的能力。
實(shí)施例6
十四烷酸無人運(yùn)甲狀腺素蛋白干擾活性(logRP=-4.011)。利用本發(fā)明預(yù)測其干擾活性的步驟如下:
根據(jù)Dragon計(jì)算的分子描述符,十四烷酸的nN=0,為不含氮有機(jī)化學(xué)品,在方法的機(jī)理域內(nèi),能進(jìn)入下一步計(jì)算;
其nCar=0,為烷烴類有機(jī)化學(xué)品;
nROH+nRCOOH+nSO2OH+nSOOH=1>0,為含羥基或羧基或磺酸基或亞磺酸基的非芳香烴有機(jī)化學(xué)品,在方法的機(jī)理域內(nèi),屬于化學(xué)品類別IV,可進(jìn)入下一步計(jì)算;
根據(jù)化學(xué)品分類結(jié)果,選用模型2進(jìn)行活性預(yù)測。
依據(jù)十四烷酸的分子結(jié)構(gòu)計(jì)算其杠桿值為0.005,在模型2的應(yīng)用域范圍內(nèi)(杠桿值小于0.5)。因此,模型2可用于預(yù)測十四烷酸對人運(yùn)甲狀腺素蛋白的干擾活性:
logRP=-4.279+3.891×10-2H2s–1.961×10-1Mor07m+5.476×10R8v+
=-4.279+3.891×10-2×4.126–1.961×10-1×8.45×10-1+5.476×10×2×10-3
=-4.175
模型預(yù)測的十四烷酸logRP=-4.175,無干擾活性。
實(shí)施例7
六溴環(huán)十二烷β對人運(yùn)甲狀腺素蛋白的干擾活性logRP=-2.658。利用本發(fā)明預(yù)測其干擾活性的步驟如下:
根據(jù)Dragon計(jì)算的分子描述符,六溴環(huán)十二烷β的nN=0,為不含氮有機(jī)化學(xué)品,在方法的機(jī)理域內(nèi),能進(jìn)入下一步計(jì)算;
其nCar=0,為烷烴類有機(jī)化學(xué)品;
nROH+nRCOOH+nSO2OH+nSOOH=0,nX=6為不含羥基或羧基或磺酸基或亞磺酸基的鹵代烷烴,在方法的機(jī)理域內(nèi),屬于化學(xué)品類別V,可進(jìn)入下一步計(jì)算;
根據(jù)化學(xué)品分類結(jié)果,選用模型2進(jìn)行活性預(yù)測。
依據(jù)六溴環(huán)十二烷β的分子結(jié)構(gòu)計(jì)算其杠桿值為0.4,在模型2的應(yīng)用域范圍內(nèi)(杠桿值小于0.5)。因此,模型2可用于預(yù)測六溴環(huán)十二烷β對人運(yùn)甲狀腺素蛋白的干擾活性:
logRP=-4.279+3.891×10-2H2s–1.961×10-1Mor07m+5.476×10R8v+
=-4.279+3.891×10-2×6.545–1.961×10-1×(-4.198)+5.476×10×1×10-2
=-2.653
根據(jù)模型預(yù)測的六溴環(huán)十二烷β效應(yīng)值為logRP=-2.658,實(shí)驗(yàn)值為logRP=-2.653,預(yù)測值與實(shí)驗(yàn)值具有一致性。根據(jù)效應(yīng)值判斷,此有機(jī)化學(xué)品具有低干擾活性。因此,六溴環(huán)十二烷β在較高濃度水平(>10-5mol)才具有干擾人運(yùn)甲狀腺素蛋白轉(zhuǎn)運(yùn)甲狀腺素的能力。