亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

利用整合工具預(yù)測水稻蛋白質(zhì)磷酸化位點(diǎn)的方法

文檔序號(hào):6374687閱讀:742來源:國知局
專利名稱:利用整合工具預(yù)測水稻蛋白質(zhì)磷酸化位點(diǎn)的方法
技術(shù)領(lǐng)域
本發(fā)明涉及基因組學(xué)和蛋白質(zhì)組學(xué)研究中的蛋白質(zhì)翻譯后修飾技術(shù)領(lǐng)域,特別是一種利用整合工具預(yù)測水稻蛋白質(zhì)磷酸化位點(diǎn)的方法。
背景技術(shù)
蛋白質(zhì)磷酸化是最重要的蛋白質(zhì)翻譯后修飾過程之一,對細(xì)胞功能起著重要的調(diào)節(jié)作用。隨著生物化學(xué)研究技術(shù)的不斷發(fā)展,越來越多的蛋白質(zhì)磷酸化位點(diǎn)得到鑒定,刺激了蛋白質(zhì)磷酸化位點(diǎn)預(yù)測算法、工具的開發(fā)。當(dāng)前有大量的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具可供在線檢測。但由于蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具存在數(shù)據(jù)采樣的偏差,造成由特定數(shù)據(jù)訓(xùn)練開發(fā)的預(yù)測工具只對特定物種的蛋白質(zhì)磷酸化位點(diǎn)具有較高的預(yù)測性能。不同物種的蛋白質(zhì)在序列形態(tài)、空間結(jié)構(gòu)及激酶類型等方面具有較大的差異性。而現(xiàn)有的蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù)大都來源于哺乳動(dòng)物,因此,大部分預(yù)測軟件的模板和算法也是以哺乳動(dòng)物蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù)為訓(xùn)練集,使得現(xiàn)有大部分工具只適合預(yù)測哺乳動(dòng)物蛋白質(zhì)磷酸化位 點(diǎn)。前人也針對不同的物種,開發(fā)出相應(yīng)的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具。如擬南芥的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具PhosphAt,酵母蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具NetPhosYeast。其中,PhosphAt以經(jīng)試驗(yàn)驗(yàn)證的擬南芥蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù)為訓(xùn)練集,用支持向量機(jī)(SVM)方法開發(fā)出擬南芥蛋白質(zhì)絲氨酸磷酸化位點(diǎn)的預(yù)測工具。而NetPhosYeast是以神經(jīng)網(wǎng)絡(luò)方法建立酵母蛋白質(zhì)磷酸化位點(diǎn)的預(yù)測工具。不同的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具適用于特定的物種,不同的預(yù)測工具可能采用不同的算法。為了配合快速發(fā)展的水稻基因組學(xué)和蛋白質(zhì)組學(xué)研究,開發(fā)水稻蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具勢在必行。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種利用整合工具預(yù)測水稻蛋白質(zhì)磷酸化位點(diǎn)的方法,該方法有利于提高蛋白質(zhì)磷酸化位點(diǎn)的預(yù)測準(zhǔn)確性。一種利用整合工具預(yù)測蛋白質(zhì)磷酸化位點(diǎn)的方法,以在試驗(yàn)中檢測到的水稻蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù)為訓(xùn)練集,以η種蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具為子工具,通過一定的權(quán)重策略,為各子工具分配權(quán)重,將η種子工具整合而成水稻蛋白質(zhì)磷酸化位點(diǎn)預(yù)測的整合工具,通過所述整合工具預(yù)測水稻蛋白質(zhì)磷酸化位點(diǎn)。上述權(quán)重策略是建立于限制性網(wǎng)格搜索法和隨機(jī)加權(quán)法基礎(chǔ)上的基于網(wǎng)格的隨機(jī)數(shù)加權(quán)法。本發(fā)明的有益效果是利用整合算法,將國際上新近開發(fā)、性能較優(yōu)的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具綜合起來,作為整合工具,用于預(yù)測水稻蛋白質(zhì)的磷酸化位點(diǎn),與新近開發(fā)的預(yù)測工具相比,本發(fā)明具有更優(yōu)的預(yù)測性能。


圖I是本發(fā)明實(shí)施例的實(shí)施流程圖。
圖中,I為已發(fā)表文獻(xiàn)中的水稻蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù);2為從蛋白質(zhì)數(shù)據(jù)庫下載的水稻蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù);3為本發(fā)明試驗(yàn)驗(yàn)證的水稻蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù);4為數(shù)據(jù)庫整理技術(shù);5為水稻蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù)庫PhosRice ;6、7、…、12為若干種新近開發(fā)的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具;13為工具整合策略;14為由各子工具加權(quán)整合而成的水稻蛋白質(zhì)磷酸化位點(diǎn)預(yù)測的Meta-sever工具;15為由基于網(wǎng)格的隨機(jī)數(shù)加權(quán)法整合而成的整合工具PhosphoRice。
具體實(shí)施例方式本發(fā)明利用整合工具預(yù)測蛋白質(zhì)磷酸化位點(diǎn)的方法,以在生物化學(xué)試驗(yàn)中檢測到的水稻蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù)為訓(xùn)練集,以國際上新近開發(fā)的η種蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具為子工具,在本實(shí)施例中篩選7種作為子工具,通過一定的權(quán)重策略,即工具整合策略,包括未加權(quán)表決法、減數(shù)加權(quán)表決法、加權(quán)表決法、限制性網(wǎng)格搜索法、基于網(wǎng)格的隨機(jī)數(shù)加權(quán)法,為各子工具分配權(quán)重,將η種子工具整合而成水稻蛋白質(zhì)磷酸化位點(diǎn)預(yù)測的整 合工具,通過所述整合工具預(yù)測水稻蛋白質(zhì)磷酸化位點(diǎn)。經(jīng)比較驗(yàn)證,由基于網(wǎng)格的隨機(jī)數(shù)加權(quán)法整合而成的整合工具PhosphoRice預(yù)測性能最佳。因此,在本發(fā)明較佳實(shí)施例中,采用基于網(wǎng)格的隨機(jī)數(shù)加權(quán)法作為本發(fā)明方法的權(quán)重策略。本發(fā)明一實(shí)施例的實(shí)施流程如圖I所示。首先,選擇已發(fā)表文獻(xiàn)中的水稻蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù)(I)、從蛋白質(zhì)數(shù)據(jù)庫下載的水稻蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù)(2)以及本發(fā)明試驗(yàn)驗(yàn)證的水稻蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù)(3)作為訓(xùn)練集,通過數(shù)據(jù)庫整理技術(shù)(4)進(jìn)行整理,建立水稻蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù)庫PhosRice (5)。所述數(shù)據(jù)庫整理技術(shù)(4)包括提取蛋白質(zhì)序列信息、剪取磷酸化位點(diǎn)前后各12個(gè)氨基酸殘基的片段、刪除不足25個(gè)位點(diǎn)的數(shù)據(jù)、去除冗余數(shù)據(jù)等。同時(shí),以若干種國際上新近開發(fā)的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具(6)、
(7)、…、(12)為子工具,通過工具整合策略(13)進(jìn)行整合,即通過未加權(quán)表決法、減數(shù)加權(quán)表決法、加權(quán)表決法、限制性網(wǎng)格搜索法、基于網(wǎng)格的隨機(jī)數(shù)加權(quán)法等權(quán)重策略為各子工具分配權(quán)重,將各子工具加權(quán)整合而成水稻蛋白質(zhì)磷酸化位點(diǎn)預(yù)測的Meta-sever工具(14)。經(jīng)比較驗(yàn)證,由基于網(wǎng)格的隨機(jī)數(shù)加權(quán)法整合而成的整合工具PhosphoRice (15)預(yù)測性能最佳。由此產(chǎn)生了水稻蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具PhosphoRice (15)。下面對本發(fā)明作進(jìn)一步的說明。首先用已經(jīng)試驗(yàn)驗(yàn)證的水稻蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù)構(gòu)建數(shù)據(jù)集,篩選7種新近開發(fā)的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具為子工具。通過不同的權(quán)重策略,包括未加權(quán)表決法、減數(shù)加權(quán)表決法、加權(quán)表決法、限制性網(wǎng)格搜索法、基于網(wǎng)格的隨機(jī)數(shù)加權(quán)法等,對各子工具分配相應(yīng)權(quán)重,整合而成水稻蛋白質(zhì)磷酸化位點(diǎn)預(yù)測的Meta-sever工具。通過比較基于不同權(quán)重策略的所有Meta-sever工具的預(yù)測性能,基于網(wǎng)格的隨機(jī)數(shù)加權(quán)法的整合工具PhosphoRice的預(yù)測性能最優(yōu)。因此,在本實(shí)施例中通過所述蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具PhosphoRice預(yù)測水稻蛋白質(zhì)磷酸化位點(diǎn)。由于限制性網(wǎng)格搜索法的網(wǎng)格選擇受到網(wǎng)點(diǎn)的限制,只能是一些離散的數(shù)值,從中可能無法獲得最優(yōu)解。為進(jìn)一步優(yōu)化算法,在加權(quán)表決算法的基礎(chǔ)上,我們制定了一個(gè)隨機(jī)搜索的策略來進(jìn)一步選擇不同子工具的權(quán)重,任何子工具的權(quán)重都被允許在一定范圍內(nèi)波動(dòng)。波動(dòng)的范圍以限制性網(wǎng)格搜索法獲得的結(jié)果為基礎(chǔ),波動(dòng)范圍處于上一個(gè)網(wǎng)格與下一個(gè)網(wǎng)格之間。隨機(jī)數(shù)是專門的隨機(jī)試驗(yàn)結(jié)果。如果所選擇的預(yù)測方法有15種,對于每個(gè)方法都要產(chǎn)生一個(gè)隨機(jī)數(shù)作為該預(yù)測方法的權(quán)重。對于每組隨機(jī)數(shù)(即15個(gè)隨機(jī)數(shù))還需要一個(gè)閾值,作為判別每個(gè)位點(diǎn)是否為磷酸化位點(diǎn)的標(biāo)準(zhǔn)。因此,在每個(gè)隨機(jī)數(shù)的Meta組合中一共需要16個(gè)參數(shù)。因此,我們啟用一個(gè)隨機(jī)數(shù)發(fā)生器,在有限循環(huán)次數(shù)內(nèi),如果滿足下式,就判斷結(jié)果為一個(gè)積極的預(yù)測,并得出結(jié)論。如果超過設(shè)定的循環(huán)次數(shù),也會(huì)停止并給出在該循環(huán)中最佳的結(jié)果。
權(quán)利要求
1.一種利用整合工具預(yù)測水稻蛋白質(zhì)磷酸化位點(diǎn)的方法,其特征在于以在試驗(yàn)中檢測到的水稻蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù)為訓(xùn)練集,以η種蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具為子工具,通過一定的權(quán)重策略,為各子工具分配權(quán)重,將η種子工具整合而成水稻蛋白質(zhì)磷酸化位點(diǎn)預(yù)測的整合工具,通過所述整合工具預(yù)測水稻蛋白質(zhì)磷酸化位點(diǎn)。
2.根據(jù)權(quán)利要求I所述的利用整合工具預(yù)測水稻蛋白質(zhì)磷酸化位點(diǎn)的方法,其特征在于所述權(quán)重策略是建立于限制性網(wǎng)格搜索法和隨機(jī)加權(quán)法基礎(chǔ)上的基于網(wǎng)格的隨機(jī)數(shù)加權(quán)法。
全文摘要
本發(fā)明涉及一種利用整合工具預(yù)測水稻蛋白質(zhì)磷酸化位點(diǎn)的方法,其特征在于以在試驗(yàn)中檢測到的水稻蛋白質(zhì)磷酸化位點(diǎn)數(shù)據(jù)為訓(xùn)練集,以n種蛋白質(zhì)磷酸化位點(diǎn)預(yù)測工具為子工具,通過一定的權(quán)重策略,為各子工具分配權(quán)重,將n種子工具整合成水稻蛋白質(zhì)磷酸化位點(diǎn)預(yù)測的整合工具,通過所述整合工具預(yù)測水稻蛋白質(zhì)磷酸化位點(diǎn)。其中,由基于網(wǎng)格的隨機(jī)數(shù)加權(quán)法整合而成的整合工具PhosphoRice預(yù)測性能最佳。該方法有利于提高蛋白質(zhì)磷酸化位點(diǎn)的預(yù)測準(zhǔn)確性。
文檔編號(hào)G06F19/10GK102819690SQ201210282068
公開日2012年12月12日 申請日期2012年8月9日 優(yōu)先權(quán)日2012年8月9日
發(fā)明者何華勤 申請人:福建農(nóng)林大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1