亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于副本交換和局部增強(qiáng)策略的群體構(gòu)象空間搜索方法

文檔序號(hào):9327184閱讀:636來(lái)源:國(guó)知局
一種基于副本交換和局部增強(qiáng)策略的群體構(gòu)象空間搜索方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及生物信息學(xué)、計(jì)算機(jī)應(yīng)用領(lǐng)域,尤其涉及的是一種基于副本交換和局 部增強(qiáng)策略的群體構(gòu)象空間搜索方法。
【背景技術(shù)】
[0002] 蛋白質(zhì)分子在生物細(xì)胞化學(xué)反應(yīng)過程中起著至關(guān)重要的作用。它們的結(jié)構(gòu)模型和 生物活性狀態(tài)對(duì)我們理解和治愈多種疾病有重要的意義。蛋白質(zhì)只有折疊成特定的三維結(jié) 構(gòu)才能產(chǎn)生其特有的生物學(xué)功能。因此,要了解蛋白質(zhì)的功能,就必須獲得其三維空間結(jié) 構(gòu)。
[0003] 蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)是生物信息學(xué)的一個(gè)重要任務(wù)。蛋白質(zhì)構(gòu)象優(yōu)化問題現(xiàn)在面 臨最大的挑戰(zhàn)是對(duì)極其復(fù)雜的蛋白質(zhì)能量函數(shù)曲面進(jìn)行搜索。蛋白質(zhì)能量模型考慮了分子 體系成鍵作用以及范德華力、靜電、氫鍵、疏水等非成鍵作用,致使其形成的能量曲面極其 粗糙,構(gòu)象對(duì)應(yīng)局部極小解數(shù)目隨序列長(zhǎng)度的增加呈指數(shù)增長(zhǎng)。而蛋白質(zhì)構(gòu)象預(yù)測(cè)算法能 夠找到蛋白質(zhì)穩(wěn)定結(jié)構(gòu)的機(jī)理是,大量的蛋白質(zhì)亞穩(wěn)定結(jié)構(gòu)構(gòu)成了低能量區(qū)域,所以能否 找到蛋白質(zhì)全局最穩(wěn)定結(jié)構(gòu)的關(guān)鍵是算法能夠找到大量的蛋白質(zhì)亞穩(wěn)定結(jié)構(gòu),即增加算法 的種群多樣性。因此,針對(duì)更加精確的蛋白質(zhì)力場(chǎng)模型,選取有效的構(gòu)象空間優(yōu)化算法,使 新的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)算法更具有普遍性和高效性成為生物信息學(xué)中蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的焦 點(diǎn)問題。
[0004] 目前,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法大致可以分為兩類,基于模板的方法和不基于模板的 方法。其中,不基于模板的從頭預(yù)測(cè)(Ab-inito)方法應(yīng)用最為廣泛。它適用于同源性小于 25%的大多數(shù)蛋白質(zhì),僅從序列產(chǎn)生全新結(jié)構(gòu),對(duì)蛋白質(zhì)分子設(shè)計(jì)及蛋白質(zhì)折疊的研究等 具有重要意義。當(dāng)前有以下幾種比較成功的從頭預(yù)測(cè)方法:張陽(yáng)與Jeffrey Skolnick合作 的TASSER(Threading/Assembly/Refinement)方法、David Baker及團(tuán)隊(duì)設(shè)計(jì)的Rosetta方 法、Shehu等設(shè)計(jì)的FeLTr方法等。但是到目前還沒有一種十分完善的方法來(lái)預(yù)測(cè)蛋白質(zhì) 的三維結(jié)構(gòu),即使獲得了很好的預(yù)測(cè)結(jié)果,但也只是針對(duì)某些蛋白質(zhì)而言的,目前主要的技 術(shù)瓶頸在于兩個(gè)方面,第一方面在于采樣方法,現(xiàn)有技術(shù)對(duì)構(gòu)象空間采樣能力不強(qiáng),另一方 面在于構(gòu)象更新方法,現(xiàn)有技術(shù)對(duì)構(gòu)象的更新精度仍然不足。
[0005] 因此,現(xiàn)有的構(gòu)象空間搜索方法存在不足,需要改進(jìn)。

【發(fā)明內(nèi)容】

[0006] 為了克服現(xiàn)有的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法的構(gòu)象空間搜索維數(shù)較高、收斂速度較慢、 預(yù)測(cè)精度較低的不足,本發(fā)明基于差分進(jìn)化群體算法,提出一種基于副本交換和局部增強(qiáng) 策略的群體構(gòu)象空間搜索方法,RELEDE :在差分進(jìn)化算法框架下,采用Rosetta Score3粗 粒度知識(shí)能量模型來(lái)有效降低構(gòu)象空間搜索維數(shù)、提高算法的收斂速度;引入基于知識(shí)的 片段組裝技術(shù)可以有效提高預(yù)測(cè)精度;利用Monte Carlo算法良好的局部搜索性能對(duì)種群 做局部增強(qiáng),以得到更為優(yōu)良的局部構(gòu)象,結(jié)合差分進(jìn)化算法較強(qiáng)的全局搜索能力,可以對(duì) 構(gòu)象空間進(jìn)行更為有效的采樣,副本交換策略的引入使得群體的多樣性以及空間采樣能力 得到進(jìn)一步增強(qiáng)。
[0007] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
[0008] -種基于副本交換和局部增強(qiáng)策略的群體構(gòu)象空間搜索方法,所述搜索方法包括 以下步驟:
[0009] 1)給定輸入序列信息;
[0010] 2)設(shè)置系統(tǒng)參數(shù):種群大小popSize,算法的迭代次數(shù)T,交叉因子CR,片段的長(zhǎng)度 L,副本層數(shù)RE,副本層溫度參數(shù)kT ;
[0011] 3)種群初始化:在每個(gè)副本層,由輸入序列產(chǎn)生popSize個(gè)種群個(gè)體Pinit;
[0012] 4)開始迭代,在每個(gè)副本層執(zhí)行種群更新過程,對(duì)初始種群中的每個(gè)個(gè)體:
[0013] 4. 1)設(shè)i = 1,其中 i e {1,2, 3,…,popSize};令 Ptarget=P1,其中 i為序號(hào),Ptarget 表示目標(biāo)個(gè)體;
[0014] 4. 2)隨機(jī)生成正整數(shù)抑11(11,抑11(12,抑11(13,其中抑11(11£{1,2,3,......popSize} ,randl 辛 i,rand2 辛 rand3 e {1,2,…,Length},Length 為序列長(zhǎng)度;
[0015] 4. 3)針對(duì)個(gè)體 Pj做變異操作,其中:j = randl,令 a = min (rand2, rand3),b = max (rand2, rand3),k G [a, b];
[0016] 4. 4)對(duì)蛋白質(zhì)鏈中第a到b個(gè)氨基酸做如下操作:
[0017] a :令 P target. phi (k) = Pj. phi (k);
[0018] b :令 P target. psi (k) = P." psi (k);
[0019] c :令 P target. omega (k) = P." omega (k);
[0020] 步驟a,b,c分別為:將Ptarget的氨基酸k所對(duì)應(yīng)的二面角phi、psi、omega替換為 P_j的相同位置所對(duì)應(yīng)的二面角phi、psi、omega ;
[0021] 4· 5)通過變異得到測(cè)試個(gè)體Ptrial;
[0022] 4. 6)生成隨機(jī)數(shù) rand4, rand5,其中 rand4 e (〇, I),rand5 e (1,Length);
[0023] 4. 7)根據(jù)
執(zhí)行交叉過程:若隨機(jī)數(shù) rand4〈 = CR,個(gè)體Ptolal的片段rand5替換為個(gè)體P t"get中對(duì)應(yīng)的片段,否則直接繼承個(gè)體 Ptrial °
[0024] 4· 8)根據(jù) Rosetta Score3 計(jì)算 Ptarget和 P trial的能量:E(P target)和 E(Ptrial);
[0025] 4. 9)若E (Ptoget) >E (Pw)則用Pw替換P t"get,否則保持種群不變;
[0026] 5)得到更新種群Pupdate;
[0027] 6)對(duì)更新種群中的每個(gè)個(gè)體P1:
[0028] 6. 1)調(diào)用Monte Carlo方法對(duì)個(gè)體做局部增強(qiáng);
[0029] 6. 2)計(jì)算增強(qiáng)過程中產(chǎn)生的構(gòu)象的能量E(MC);
[0030] 6. 3)若E (P1) >E (MC),則更新種群,否則保持種群不變;
[0031] 7)得到局部增強(qiáng)后的種群POThanOT;
[0032] 8)當(dāng)所有副本層的種群都完成一次更新,進(jìn)行副本交換操作:
[0033] 8. 1)在相鄰的兩個(gè)副本層中各隨機(jī)選擇一個(gè)個(gè)體P_hange A、P_ha_ B,用于副本交 換;
[0034] 8. 2)根據(jù) Rosetta Score3 計(jì)算兩個(gè)個(gè)體 Pexchange A、Pexchange B的能量 E (P exchange A)、
E (PexChange-B),
[0035] 8. 3)根據(jù)判決公式 判斷是否進(jìn)行副本交換, 其中(kT)A、(印及別是個(gè)體P exchange_A'* -^exchange _B對(duì)應(yīng)副本層的能量參數(shù),Judge為判決數(shù);
[0036] 8. 4)根據(jù)判決結(jié)果,以一定的概率進(jìn)行副本交換操作:交換這兩個(gè)個(gè)體;
[0037] 9)迭代的運(yùn)行步驟4)~8),至滿足終止條件。
[0038] 本發(fā)明的有益效果為:在差分進(jìn)化算法框架下,采用Rosetta Score3粗粒度知識(shí) 能量模型有效降低構(gòu)象空間搜索維數(shù)、提高算法收斂速度;引入基于知識(shí)的片段組裝技術(shù) 可以有效提高預(yù)測(cè)精度;利用Monte Carlo算法良好的局部搜索性能對(duì)種群做局部增強(qiáng), 以得到更為優(yōu)良的局部構(gòu)象;結(jié)合差分進(jìn)化算法較強(qiáng)的全局搜索能力,可以對(duì)構(gòu)象空間進(jìn) 行更為有效的采樣,副本交換策略的引入使得群體的多樣性以及空間采樣能力得到進(jìn)一步 增強(qiáng),從而在構(gòu)象空間中搜索得到較高精度的近天然態(tài)構(gòu)象。
【附圖說(shuō)明】
[0039] 圖1是蛋白質(zhì)IENH構(gòu)象系綜中構(gòu)象更新示意圖。
【具體實(shí)施方式】
[0040] 下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步描述。
[0041] 參照?qǐng)D1,一種基于副本交換和局部增強(qiáng)策略的群體構(gòu)象空間搜索方法,包括以下 步驟:
[0042] 1)給定輸入序列信息;
[0043] 2)設(shè)置系統(tǒng)參數(shù):種群大小popSize,算法的迭代次數(shù)T,交叉因子CR,片段的長(zhǎng)度 L,副本層數(shù)RE,副本層溫度參數(shù)kT ;
[0044] 3)種群初始化:在每個(gè)副本層,由輸入序列產(chǎn)生popSize個(gè)種群個(gè)體Pinit;
[0045] 4)開始迭代,在每個(gè)副本層執(zhí)行種群更新過程,對(duì)初始種群中的每個(gè)個(gè)體:
[0046] 4· 1)設(shè)i = 1,其中 i e {1,2, 3,…,popSize};令 Ptarget=P1,其中 i為序號(hào),Ptarget 表示目標(biāo)個(gè)體;
[0047] 4. 2)隨機(jī)生成正整數(shù)抑11(11,抑11(12,抑11(13,其中抑11(11£{1, 2,3,......popSize} ,randl 辛 i,rand2 辛 rand3 e {1,2,…,Length},Length 為序列長(zhǎng)度;
[0048] 4. 3)針對(duì)個(gè)體 Pj做變異操作,其中:j = randl ;令 a = min (rand2, rand3),b = max (rand2, rand3),k G [a, b];
[0049] 4. 4)對(duì)蛋白質(zhì)鏈中第a到b個(gè)氨基酸做如下操作:
[0050] a :令 P target. phi (k) = P." phi (k);
[0051] b :令 P target. psi (k) = P." psi (k);
[0052] c :令 P target. omega (k) = P." omega (k);
[0053] 步驟a,b,c分別為:將Ptarget的氨基酸k所對(duì)應(yīng)的二面角phi、psi、omega替換為 P_j的相同位置所對(duì)應(yīng)的二面角phi、psi、omega ;
[0054] 4· 5)通過變異得到測(cè)試個(gè)體Ptrial;
[0055] 4. 6)生成隨機(jī)數(shù) rand4, rand5,其中 rand4 e (〇, I),rand5 e (1,Length);
[0056] 4. 7)根S
執(zhí)行交叉過程:若隨機(jī)數(shù) rand4〈 = CR,個(gè)體Ptolal的片段rand5替換為個(gè)體P t"get中對(duì)應(yīng)的片段,否則直接繼承個(gè)體 Ptrial °
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1