一種基于副本交換和局部增強(qiáng)策略的群體構(gòu)象空間搜索方法

文檔序號(hào)：9327184閱讀：636來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于副本交換和局部增強(qiáng)策略的群體構(gòu)象空間搜索方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及生物信息學(xué)、計(jì)算機(jī)應(yīng)用領(lǐng)域，尤其涉及的是一種基于副本交換和局部增強(qiáng)策略的群體構(gòu)象空間搜索方法。
【背景技術(shù)】
[0002] 蛋白質(zhì)分子在生物細(xì)胞化學(xué)反應(yīng)過程中起著至關(guān)重要的作用。它們的結(jié)構(gòu)模型和生物活性狀態(tài)對(duì)我們理解和治愈多種疾病有重要的意義。蛋白質(zhì)只有折疊成特定的三維結(jié) 構(gòu)才能產(chǎn)生其特有的生物學(xué)功能。因此，要了解蛋白質(zhì)的功能，就必須獲得其三維空間結(jié) 構(gòu)。
[0003] 蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)是生物信息學(xué)的一個(gè)重要任務(wù)。蛋白質(zhì)構(gòu)象優(yōu)化問題現(xiàn)在面臨最大的挑戰(zhàn)是對(duì)極其復(fù)雜的蛋白質(zhì)能量函數(shù)曲面進(jìn)行搜索。蛋白質(zhì)能量模型考慮了分子體系成鍵作用以及范德華力、靜電、氫鍵、疏水等非成鍵作用，致使其形成的能量曲面極其粗糙，構(gòu)象對(duì)應(yīng)局部極小解數(shù)目隨序列長(zhǎng)度的增加呈指數(shù)增長(zhǎng)。而蛋白質(zhì)構(gòu)象預(yù)測(cè)算法能夠找到蛋白質(zhì)穩(wěn)定結(jié)構(gòu)的機(jī)理是，大量的蛋白質(zhì)亞穩(wěn)定結(jié)構(gòu)構(gòu)成了低能量區(qū)域，所以能否找到蛋白質(zhì)全局最穩(wěn)定結(jié)構(gòu)的關(guān)鍵是算法能夠找到大量的蛋白質(zhì)亞穩(wěn)定結(jié)構(gòu)，即增加算法的種群多樣性。因此，針對(duì)更加精確的蛋白質(zhì)力場(chǎng)模型，選取有效的構(gòu)象空間優(yōu)化算法，使新的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)算法更具有普遍性和高效性成為生物信息學(xué)中蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的焦點(diǎn)問題。
[0004] 目前，蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法大致可以分為兩類，基于模板的方法和不基于模板的方法。其中，不基于模板的從頭預(yù)測(cè)（Ab-inito)方法應(yīng)用最為廣泛。它適用于同源性小于 25%的大多數(shù)蛋白質(zhì)，僅從序列產(chǎn)生全新結(jié)構(gòu)，對(duì)蛋白質(zhì)分子設(shè)計(jì)及蛋白質(zhì)折疊的研究等具有重要意義。當(dāng)前有以下幾種比較成功的從頭預(yù)測(cè)方法：張陽(yáng)與Jeffrey Skolnick合作的TASSER(Threading/Assembly/Refinement)方法、David Baker及團(tuán)隊(duì)設(shè)計(jì)的Rosetta方法、Shehu等設(shè)計(jì)的FeLTr方法等。但是到目前還沒有一種十分完善的方法來(lái)預(yù)測(cè)蛋白質(zhì) 的三維結(jié)構(gòu)，即使獲得了很好的預(yù)測(cè)結(jié)果，但也只是針對(duì)某些蛋白質(zhì)而言的，目前主要的技術(shù)瓶頸在于兩個(gè)方面，第一方面在于采樣方法，現(xiàn)有技術(shù)對(duì)構(gòu)象空間采樣能力不強(qiáng)，另一方面在于構(gòu)象更新方法，現(xiàn)有技術(shù)對(duì)構(gòu)象的更新精度仍然不足。
[0005] 因此，現(xiàn)有的構(gòu)象空間搜索方法存在不足，需要改進(jìn)。

【發(fā)明內(nèi)容】

[0006] 為了克服現(xiàn)有的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法的構(gòu)象空間搜索維數(shù)較高、收斂速度較慢、預(yù)測(cè)精度較低的不足，本發(fā)明基于差分進(jìn)化群體算法，提出一種基于副本交換和局部增強(qiáng) 策略的群體構(gòu)象空間搜索方法，RELEDE :在差分進(jìn)化算法框架下，采用Rosetta Score3粗粒度知識(shí)能量模型來(lái)有效降低構(gòu)象空間搜索維數(shù)、提高算法的收斂速度；引入基于知識(shí)的片段組裝技術(shù)可以有效提高預(yù)測(cè)精度；利用Monte Carlo算法良好的局部搜索性能對(duì)種群做局部增強(qiáng)，以得到更為優(yōu)良的局部構(gòu)象，結(jié)合差分進(jìn)化算法較強(qiáng)的全局搜索能力，可以對(duì) 構(gòu)象空間進(jìn)行更為有效的采樣，副本交換策略的引入使得群體的多樣性以及空間采樣能力得到進(jìn)一步增強(qiáng)。
[0007] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是：
[0008] -種基于副本交換和局部增強(qiáng)策略的群體構(gòu)象空間搜索方法，所述搜索方法包括以下步驟：
[0009] 1)給定輸入序列信息；
[0010] 2)設(shè)置系統(tǒng)參數(shù)：種群大小popSize，算法的迭代次數(shù)T，交叉因子CR，片段的長(zhǎng)度 L，副本層數(shù)RE，副本層溫度參數(shù)kT ;
[0011] 3)種群初始化：在每個(gè)副本層，由輸入序列產(chǎn)生popSize個(gè)種群個(gè)體Pinit;
[0012] 4)開始迭代，在每個(gè)副本層執(zhí)行種群更新過程，對(duì)初始種群中的每個(gè)個(gè)體：
[0013] 4. 1)設(shè)i = 1，其中 i e {1，2, 3,…，popSize};令 Ptarget=P1，其中 i為序號(hào)，Ptarget 表示目標(biāo)個(gè)體；
[0014] 4. 2)隨機(jī)生成正整數(shù)抑11(11，抑11(12，抑11(13，其中抑11(11￡{1，2,3,......popSize} ，randl 辛 i，rand2 辛 rand3 e {1，2,…，Length}，Length 為序列長(zhǎng)度；
[0015] 4. 3)針對(duì)個(gè)體 Pj做變異操作，其中：j = randl，令 a = min (rand2, rand3)，b = max (rand2, rand3)，k G [a, b];
[0016] 4. 4)對(duì)蛋白質(zhì)鏈中第a到b個(gè)氨基酸做如下操作：
[0017] a :令 P target. phi (k) = Pj. phi (k);
[0018] b :令 P target. psi (k) = P." psi (k);
[0019] c :令 P target. omega (k) = P." omega (k);
[0020] 步驟a，b，c分別為：將Ptarget的氨基酸k所對(duì)應(yīng)的二面角phi、psi、omega替換為 P_j的相同位置所對(duì)應(yīng)的二面角phi、psi、omega ;
[0021] 4· 5)通過變異得到測(cè)試個(gè)體Ptrial;
[0022] 4. 6)生成隨機(jī)數(shù) rand4, rand5,其中 rand4 e (〇, I)，rand5 e (1，Length);
[0023] 4. 7)根據(jù)
執(zhí)行交叉過程：若隨機(jī)數(shù) rand4〈 = CR，個(gè)體Ptolal的片段rand5替換為個(gè)體P t"get中對(duì)應(yīng)的片段，否則直接繼承個(gè)體 Ptrial °
[0024] 4· 8)根據(jù) Rosetta Score3 計(jì)算 Ptarget和 P trial的能量：E(P target)和 E(Ptrial);
[0025] 4. 9)若E (Ptoget) >E (Pw)則用Pw替換P t"get，否則保持種群不變；
[0026] 5)得到更新種群Pupdate;
[0027] 6)對(duì)更新種群中的每個(gè)個(gè)體P1:
[0028] 6. 1)調(diào)用Monte Carlo方法對(duì)個(gè)體做局部增強(qiáng)；
[0029] 6. 2)計(jì)算增強(qiáng)過程中產(chǎn)生的構(gòu)象的能量E(MC);
[0030] 6. 3)若E (P1) >E (MC)，則更新種群，否則保持種群不變；
[0031] 7)得到局部增強(qiáng)后的種群POThanOT;
[0032] 8)當(dāng)所有副本層的種群都完成一次更新，進(jìn)行副本交換操作：
[0033] 8. 1)在相鄰的兩個(gè)副本層中各隨機(jī)選擇一個(gè)個(gè)體P_hange A、P_ha_ B，用于副本交換；
[0034] 8. 2)根據(jù) Rosetta Score3 計(jì)算兩個(gè)個(gè)體 Pexchange A、Pexchange B的能量 E (P exchange A)、
E (PexChange-B)，
[0035] 8. 3)根據(jù)判決公式判斷是否進(jìn)行副本交換，其中（kT)A、（印及別是個(gè)體P exchange_A'* -^exchange _B對(duì)應(yīng)副本層的能量參數(shù)，Judge為判決數(shù)；
[0036] 8. 4)根據(jù)判決結(jié)果，以一定的概率進(jìn)行副本交換操作：交換這兩個(gè)個(gè)體；
[0037] 9)迭代的運(yùn)行步驟4)~8)，至滿足終止條件。
[0038] 本發(fā)明的有益效果為：在差分進(jìn)化算法框架下，采用Rosetta Score3粗粒度知識(shí) 能量模型有效降低構(gòu)象空間搜索維數(shù)、提高算法收斂速度；引入基于知識(shí)的片段組裝技術(shù) 可以有效提高預(yù)測(cè)精度；利用Monte Carlo算法良好的局部搜索性能對(duì)種群做局部增強(qiáng)，以得到更為優(yōu)良的局部構(gòu)象；結(jié)合差分進(jìn)化算法較強(qiáng)的全局搜索能力，可以對(duì)構(gòu)象空間進(jìn) 行更為有效的采樣，副本交換策略的引入使得群體的多樣性以及空間采樣能力得到進(jìn)一步增強(qiáng)，從而在構(gòu)象空間中搜索得到較高精度的近天然態(tài)構(gòu)象。
【附圖說(shuō)明】
[0039] 圖1是蛋白質(zhì)IENH構(gòu)象系綜中構(gòu)象更新示意圖。
【具體實(shí)施方式】
[0040] 下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步描述。
[0041] 參照?qǐng)D1，一種基于副本交換和局部增強(qiáng)策略的群體構(gòu)象空間搜索方法，包括以下步驟：
[0042] 1)給定輸入序列信息；
[0043] 2)設(shè)置系統(tǒng)參數(shù)：種群大小popSize，算法的迭代次數(shù)T，交叉因子CR，片段的長(zhǎng)度 L，副本層數(shù)RE，副本層溫度參數(shù)kT ;
[0044] 3)種群初始化：在每個(gè)副本層，由輸入序列產(chǎn)生popSize個(gè)種群個(gè)體Pinit;
[0045] 4)開始迭代，在每個(gè)副本層執(zhí)行種群更新過程，對(duì)初始種群中的每個(gè)個(gè)體：
[0046] 4· 1)設(shè)i = 1，其中 i e {1，2, 3,…，popSize};令 Ptarget=P1，其中 i為序號(hào)，Ptarget 表示目標(biāo)個(gè)體；
[0047] 4. 2)隨機(jī)生成正整數(shù)抑11(11，抑11(12，抑11(13，其中抑11(11￡{1， 2,3,......popSize} ，randl 辛 i，rand2 辛 rand3 e {1，2,…，Length}，Length 為序列長(zhǎng)度；
[0048] 4. 3)針對(duì)個(gè)體 Pj做變異操作，其中：j = randl ;令 a = min (rand2, rand3)，b = max (rand2, rand3)，k G [a, b];
[0049] 4. 4)對(duì)蛋白質(zhì)鏈中第a到b個(gè)氨基酸做如下操作：
[0050] a :令 P target. phi (k) = P." phi (k);
[0051] b :令 P target. psi (k) = P." psi (k);
[0052] c :令 P target. omega (k) = P." omega (k);
[0053] 步驟a，b，c分別為：將Ptarget的氨基酸k所對(duì)應(yīng)的二面角phi、psi、omega替換為 P_j的相同位置所對(duì)應(yīng)的二面角phi、psi、omega ;
[0054] 4· 5)通過變異得到測(cè)試個(gè)體Ptrial;
[0055] 4. 6)生成隨機(jī)數(shù) rand4, rand5,其中 rand4 e (〇, I)，rand5 e (1，Length);
[0056] 4. 7)根S
執(zhí)行交叉過程：若隨機(jī)數(shù) rand4〈 = CR，個(gè)體Ptolal的片段rand5替換為個(gè)體P t"get中對(duì)應(yīng)的片段，否則直接繼承個(gè)體 Ptrial °

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張貴軍;郝小虎;俞旭鋒;周曉根;陳凱;徐東偉;
技術(shù)所有人：浙江工業(yè)大學(xué);
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

胎兒局部腸管回聲增強(qiáng)相關(guān)技術(shù)

局部對(duì)比度增強(qiáng)算法相關(guān)技術(shù)

局部對(duì)比度增強(qiáng)相關(guān)技術(shù)

圖像局部增強(qiáng)相關(guān)技術(shù)

局部腸管回聲增強(qiáng)相關(guān)技術(shù)

局部增強(qiáng)相關(guān)技術(shù)

自適應(yīng)局部增強(qiáng)相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于副本交換和局部增強(qiáng)策略的群體構(gòu)象空間搜索方法