發(fā)明做進(jìn)一步詳細(xì)說(shuō)明。
[0034]按照如圖1所示的步驟對(duì)非線性劑量-效應(yīng)曲線進(jìn)行批量擬合。
[0035] (1)基礎(chǔ)劑量-效應(yīng)數(shù)據(jù)庫(kù)(DRD)的構(gòu)建:
[0036]以公開發(fā)表文獻(xiàn)【Ge H_L,Liu S_S,Zhu X_W,Liu H_L,Wang L-J.Predicting hormetic effects of ionic liquid mixtures on luciferase activity using the concentration addition model.Environ Sci Technol·2011;45:1623_1629】【Zhu X-ff, Liu S-S,Qin L-T, Chen F, Liu H-L.Modeling non-monotonic dose-response relationships:Model evaluation and hormetic quantities exploration.Ecotoxicol Environ Saf. 2013; 89:130-136】【朱祥偉,劉樹深,張瓊,劉堰.殺蟲劑及抗生素對(duì)發(fā)光菌的 短期毒性與長(zhǎng)期毒性.環(huán)境科學(xué)研究.2009; 22: 589-594 .】【葛會(huì)林,劉樹深,朱祥偉,王麗 娟.微板吸光法測(cè)定9種農(nóng)藥對(duì)斜生柵藻的抑制毒性.生態(tài)毒理學(xué)報(bào).2008; 3:606-612】、在 線數(shù)據(jù)【http: //www2 · epa · gov/chemical-research/toxicity-forecaster-toxcasttm-data】的數(shù)據(jù)為數(shù)據(jù)來(lái)源,包括不同的劑量范圍、劑量-效應(yīng)數(shù)據(jù)點(diǎn)構(gòu)建數(shù)據(jù)庫(kù),同時(shí)包括單 調(diào)與非單調(diào)的劑量-效應(yīng)數(shù)據(jù)。數(shù)據(jù)庫(kù)共集合了 1500組劑量-效應(yīng)曲線,包括不同化學(xué)物質(zhì) 對(duì)原核生物體、真核生物體、多種細(xì)胞、報(bào)告基因、生物蛋白酶實(shí)驗(yàn)體系的劑量-效應(yīng)數(shù)據(jù); 每條劑量-效應(yīng)曲線數(shù)據(jù)由實(shí)驗(yàn)測(cè)試體系名稱、化學(xué)物質(zhì)美國(guó)化學(xué)會(huì)注冊(cè)號(hào)(CASRN)、化學(xué) 物質(zhì)名稱、實(shí)驗(yàn)濃度及相應(yīng)效應(yīng)構(gòu)成;單調(diào)劑量-效應(yīng)數(shù)據(jù)中最低劑量數(shù)為5組,非單調(diào)劑 量-效應(yīng)數(shù)據(jù)中最低劑量數(shù)為8組。DRD中部分濃度-效應(yīng)數(shù)據(jù)示例如表1所示。
[0037] (2)擬合參數(shù)數(shù)據(jù)庫(kù)(SVCF)的構(gòu)建:
[0038]利用非線性函數(shù)擬合基礎(chǔ)劑量-效應(yīng)曲線數(shù)據(jù)庫(kù)(DRD)中的數(shù)據(jù),得到不同函數(shù)參 數(shù)的擬合值,利用這些擬合值作為擬合新型劑量-效應(yīng)曲線的初始值;包括13組單調(diào)函數(shù)和 6組非單調(diào)函數(shù)對(duì)基礎(chǔ)劑量-效應(yīng)曲線數(shù)據(jù)庫(kù)的擬合值參數(shù)。13組單調(diào)函數(shù)數(shù)據(jù)信息如下: We i bull 參數(shù) 20 組,We ibul l_three 參數(shù) 20 組,Wei bul l_f our 參數(shù) 20 組,Log it 參數(shù) 20 組, Logi t_three 參數(shù) 20 組,Logi t_f our 參數(shù) 20 組,Hi 11 參數(shù) 20 組,Hi 1 l_two 參數(shù) 20 組,Hi 11_ three參數(shù)20組,Hill_four參數(shù)20組,BCW參數(shù)20組,BCL參數(shù)20組,GL參數(shù)20組。6組非單調(diào) 函數(shù)擬合值參數(shù)如下:Brain&Consens參數(shù)20組,BCV參數(shù)20組,Cedergrenn參數(shù)20組, Beckon參數(shù)20組,Biphasic參數(shù)20組,Hill_six參數(shù)20組。SVCF中部分函數(shù)參數(shù)如表2-19所 不。
[0039] (3)劑量-效應(yīng)數(shù)據(jù)讀?。?br>[0040]選取美國(guó)環(huán)境保護(hù)局于2013年12月份發(fā)布的國(guó)家化學(xué)基因組研究中心(NCGC)的 針對(duì)化學(xué)物質(zhì)定量高通量篩選數(shù)據(jù)為測(cè)試對(duì)象,數(shù)據(jù)網(wǎng)頁(yè)http : //www2 · epa · gov/ chemical-research/toxicity-forecaster-toxcasttm-data,進(jìn)入頁(yè)面后,選擇 Downloads 列表中Previously Published ToxCast Data-項(xiàng),即可進(jìn)入數(shù)據(jù)下載鏈接選擇Dec_2013_ Data_Release-項(xiàng)進(jìn)行下載。數(shù)據(jù)zip格式壓縮文件大小為623.587兆,包含3000多種化學(xué) 物質(zhì)800多組測(cè)試體系的劑量-效應(yīng)數(shù)據(jù),劑量-效應(yīng)曲線數(shù)百萬(wàn)條。本發(fā)明選取其中數(shù)據(jù)中 NCGC報(bào)告基因測(cè)試體系中化合物針對(duì)線粒體毒性比率數(shù)據(jù)為例進(jìn)行分析,文件名T〇xCast_ c_resp_Tox21_MitochondrialToxicity_ratio_2013_12_10 · txt,該文件包含 3780條劑量-效應(yīng)曲線數(shù)據(jù),每條劑量-效應(yīng)曲線由15組劑量與其對(duì)應(yīng)的效應(yīng)組成,不同梯度劑量的稀釋 因子為0.446。對(duì)于上述3780組劑量-效應(yīng)數(shù)據(jù)采用高頻試錯(cuò)擬合方法逐條擬合,計(jì)算機(jī)每 次讀取一條劑量-效應(yīng)曲線數(shù)據(jù),讀取后劑量數(shù)與效應(yīng)數(shù)就一致且劑量與效應(yīng)一一對(duì)應(yīng)。 [0041] (4)劑量-效應(yīng)數(shù)據(jù)單調(diào)性判定:
[0042]對(duì)步驟(3)中3780條劑量-效應(yīng)曲線數(shù)據(jù)進(jìn)行Mann-kendal 1趨勢(shì)檢驗(yàn),共標(biāo)識(shí)632 條有效的單調(diào)劑量效應(yīng)數(shù)據(jù),圖2所示的為Palmatine chloride hydrate(CAS RN: 171869-95-7)的單調(diào)性數(shù)據(jù)。同時(shí)進(jìn)行非參數(shù)秩檢驗(yàn),共標(biāo)識(shí)185條有效的非單調(diào)劑量-效應(yīng)曲線數(shù) 據(jù),圖3所示的為PharmaGSID_47315(CAS RN:444610-91-7)非單調(diào)性數(shù)據(jù)。其余2963組劑 量-效應(yīng)數(shù)據(jù)為無(wú)規(guī)則數(shù)據(jù)。
[0043] Mann-kendal 1趨勢(shì)檢驗(yàn)與非參數(shù)秩檢驗(yàn)方法的檢驗(yàn)水平均為0.01。
[0044] (5)單調(diào)函數(shù)參數(shù)高頻試錯(cuò)擬合:
[0045] 對(duì)步驟(4)中標(biāo)識(shí)的單調(diào)劑量-效應(yīng)曲線數(shù)據(jù),本發(fā)明在SVCF中的13組單調(diào)函數(shù)中 選用Hill_three與Weibull_three函數(shù)對(duì)632條單調(diào)劑量-效應(yīng)數(shù)據(jù)分別進(jìn)行擬合;具體流 程如下:a ·選取Hi 1 l_three函數(shù),利用SVCF數(shù)據(jù)庫(kù)中Hi 1 l_three函數(shù)參數(shù)為初始值對(duì)單調(diào) 劑量-效應(yīng)曲線數(shù)據(jù)進(jìn)行擬合;b.擬合過(guò)程中若成功擬合,記錄相應(yīng)擬合參數(shù),效應(yīng)濃度,計(jì) 算擬合優(yōu)度信息:包括校正后確定系數(shù)(R 2adj)、均方誤差(RMSE)、赤池信息量(AIC)、偏差校 正后赤池信息量(AICc)、貝葉斯信息量(BIC)等,然后跳出該劑量-效應(yīng)曲線擬合,進(jìn)入下一 條數(shù)據(jù)擬合;c.重復(fù)上一步驟,直到所有數(shù)據(jù)全部擬合完畢,記錄所有成功擬合函數(shù)的擬合 信息;d.選取Weibul l_three函數(shù),重復(fù)上述過(guò)程,直到所有數(shù)據(jù)被擬合完成。
[0046]對(duì)于632組劑量-效應(yīng)數(shù)據(jù),利用SVCF數(shù)據(jù)庫(kù)中初始值,Hi ll_three成功擬合其中 382組,1以131111_讓^6模型成功擬合其中的512組數(shù)據(jù),分別占總數(shù)據(jù)量的60.4%和 81.0%。綜合兩組函數(shù)擬合信息,總共有81.2%的單調(diào)-劑量數(shù)據(jù)被成功擬合。圖4所示的為 單調(diào)劑量 -效應(yīng)數(shù)據(jù)Palmatine chloride hydrate(CAS RN: 171869-95-7)的Weibull_ three函數(shù)擬合圖。
[0047] (6)非單調(diào)函數(shù)參數(shù)高頻試錯(cuò)擬合:
[0048] 對(duì)步驟(4)中標(biāo)識(shí)的非單調(diào)劑量-效應(yīng)曲線數(shù)據(jù),本發(fā)明在SVCF中的6組非單調(diào)函 數(shù)中選用Biphasic函數(shù)對(duì)185組非單調(diào)劑量-效應(yīng)數(shù)據(jù)分別進(jìn)行擬合;具體流程如下:a.選 取Biphasic函數(shù),利用SVDF數(shù)據(jù)庫(kù)中Biphasic函數(shù)參數(shù)為初始值對(duì)單調(diào)劑量-效應(yīng)曲線數(shù) 據(jù)進(jìn)行擬合;b.擬合過(guò)程中若成功擬合,記錄相應(yīng)擬合參數(shù),效應(yīng)濃度,計(jì)算擬合優(yōu)度信息: 包括校正后確定系數(shù)(R 2adj)、均方誤差(RMSE)、赤池信息量(AIC)、偏差校正后赤池信息量 (AICc)、貝葉斯信息量(BIC)等,然后跳出該劑量-效應(yīng)曲線擬合,進(jìn)入下一條數(shù)據(jù)擬合;c. 重復(fù)上一步驟,直到所有數(shù)據(jù)全部擬合完畢,記錄所有成功擬合函數(shù)的擬合信息;
[0049]對(duì)于185組非單調(diào)劑量-效應(yīng)數(shù)據(jù),利用SVCF數(shù)據(jù)庫(kù)中初始值,Biphas i c模型成功 擬合其中128組,占總數(shù)據(jù)量的70.3%。圖5所示的為非單調(diào)劑量-效應(yīng)數(shù)據(jù)以PharmaGSID_ 47315(CAS RN:444610-91-7)的Biphasic函數(shù)擬合圖。
[0050]具體實(shí)施過(guò)程中采用R語(yǔ)言編寫核心算法及各項(xiàng)功能,在Dell inspiron系列電腦 Ubuntul4.04系統(tǒng)上運(yùn)行時(shí)間不超過(guò)30分鐘,完成對(duì)3780組劑量-效應(yīng)曲線的單調(diào)與非單調(diào) 判別及對(duì)632組單調(diào)與185組非單調(diào)劑量-效應(yīng)曲線的擬合。采用高頻試錯(cuò)擬合技術(shù),對(duì)單調(diào)