亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種適用于天然產(chǎn)物質(zhì)譜數(shù)據(jù)解析的數(shù)據(jù)庫(kù)構(gòu)建方法

文檔序號(hào):9375834閱讀:1671來(lái)源:國(guó)知局
一種適用于天然產(chǎn)物質(zhì)譜數(shù)據(jù)解析的數(shù)據(jù)庫(kù)構(gòu)建方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種數(shù)據(jù)庫(kù)技術(shù)領(lǐng)域,尤其是涉及一種適用于天然產(chǎn)物質(zhì)譜數(shù)據(jù)解析的數(shù)據(jù)庫(kù)構(gòu)建方法。
【背景技術(shù)】
[0002]天然產(chǎn)物已經(jīng)被證明是獲取藥效物質(zhì)的一種重要來(lái)源?,F(xiàn)在已經(jīng)被FDA批準(zhǔn)的藥物中,有60%是來(lái)自于天然產(chǎn)物或都是天然產(chǎn)物相關(guān)的。像青蒿素和紫杉醇及其衍生物更是廣為人所知。正是如此,人們對(duì)于天然產(chǎn)物的分析方法一直在不停地探索和改進(jìn)之中。液相色譜-質(zhì)譜聯(lián)用技術(shù)是此領(lǐng)域最重要的技術(shù)之一。質(zhì)譜中常用碰撞誘導(dǎo)裂解(Collis1n-1nduced dissociat1n,CID)把分析物裂解為較小的分子碎片,通過(guò)觀察碎片的信息,我們能夠得到有關(guān)裂解前的化合物結(jié)構(gòu)信息。然而,這樣往往會(huì)得到非常巨大的數(shù)據(jù)量。怎么對(duì)這些數(shù)據(jù)進(jìn)行快速有效的解析成為了一個(gè)較大問(wèn)題?,F(xiàn)在的許多實(shí)驗(yàn)室依舊在依靠人工進(jìn)行數(shù)據(jù)的逐個(gè)解析,解析速度慢成了基于質(zhì)譜的天然產(chǎn)物分析的一個(gè)重要瓶頸。
[0003]在與天然產(chǎn)物質(zhì)譜分析相似的另一個(gè)領(lǐng)域一一基于質(zhì)譜分析的代謝組學(xué)研究中,類(lèi)似的問(wèn)題也存在。而對(duì)此已經(jīng)有一些方案提出來(lái)用于應(yīng)對(duì)這類(lèi)瓶頸。
[0004]建立標(biāo)準(zhǔn)化合物的質(zhì)譜數(shù)據(jù)庫(kù)是其中一種容易想到的途徑。比如NIST標(biāo)準(zhǔn)化合物質(zhì)譜數(shù)據(jù)庫(kù),在基于氣質(zhì)聯(lián)用的代謝組學(xué)研究中起到了非常重要的作用。另外像一些公開(kāi)的數(shù)據(jù)庫(kù),如MassBank,也收集了大量的基于液質(zhì)聯(lián)用的質(zhì)譜數(shù)據(jù),為科研人員提供了巨大的支持。然而,這類(lèi)數(shù)據(jù)庫(kù)的不足也是顯而易見(jiàn)的,就是這類(lèi)的庫(kù)很難把所有化合物都納入其中,事實(shí)上,被納入的化合物只是所有已知化合物中極小的一部分。比如MassBank中,到2015年2月份為止已有41092個(gè)化合物進(jìn)入庫(kù)中,而同一時(shí)間,收入于PubChem數(shù)據(jù)庫(kù)的化合物為6千萬(wàn)個(gè)左右,大部分的化合物沒(méi)有收入于質(zhì)譜數(shù)據(jù)庫(kù)。
[0005]為了解決標(biāo)準(zhǔn)化合物質(zhì)譜數(shù)據(jù)庫(kù)的這個(gè)問(wèn)題,已經(jīng)有了許多嘗試。通過(guò)化合物質(zhì)譜裂解規(guī)律對(duì)一些化合物進(jìn)行計(jì)算機(jī)模擬的裂解,以此來(lái)預(yù)測(cè)準(zhǔn)確的碎片以及每一種碎片的相對(duì)豐度,是最早為人所考慮的。自從1965年DENDRAL計(jì)劃啟動(dòng)以來(lái),此類(lèi)的方法也一直處于發(fā)展中。如今較為有名的是熱電公司的Mass Frontier。然而,包括Mass Frontier在內(nèi)基于裂解規(guī)律的計(jì)算機(jī)模擬工具均主要以在電子轟擊離子源(EI)下所得到和歸納的規(guī)律作為準(zhǔn)則,而在以電噴霧電離(ESI),大氣壓化學(xué)電離(APCI)等為代表的主要用來(lái)分析天然產(chǎn)物的各種軟電離方法下,上面的這些規(guī)律并沒(méi)有表現(xiàn)得預(yù)想的那樣準(zhǔn)確。
[0006]近年來(lái),一類(lèi)較新的計(jì)算機(jī)輔助質(zhì)譜數(shù)據(jù)解析方法不斷地產(chǎn)生。以MetFrag為代表的一類(lèi)組合裂解方法(combinatorial fragmentat1n)被提了出來(lái)。這類(lèi)方法均以一定的方式遍歷對(duì)象所有可能的碎片,對(duì)這類(lèi)碎片生成的合理性用一定的方法進(jìn)行評(píng)價(jià),進(jìn)而對(duì)所查詢(xún)的質(zhì)譜數(shù)據(jù)進(jìn)行碎片的自動(dòng)化歸屬。然而這類(lèi)方法的準(zhǔn)確性并不是很高,尤其是在天然產(chǎn)物這個(gè)領(lǐng)域。
[0007]前人對(duì)天然產(chǎn)物的質(zhì)譜分析從開(kāi)始到現(xiàn)在已經(jīng)積累了大量的數(shù)據(jù),歸納了大量的在ESI,APCI中切實(shí)能觀察到的裂解規(guī)律,這些寶貴的資源并沒(méi)有被好好地應(yīng)用起來(lái),所有的數(shù)據(jù)和裂解規(guī)律均散落在大量的文獻(xiàn)報(bào)道中,難以方便地應(yīng)用。

【發(fā)明內(nèi)容】

[0008]本發(fā)明主要是解決現(xiàn)有技術(shù)中化合物依靠人工進(jìn)行數(shù)據(jù)逐個(gè)解析,解析速度慢,現(xiàn)有的一些數(shù)據(jù)庫(kù)建立后準(zhǔn)確性并不是很高,以及數(shù)據(jù)和裂解規(guī)律均散落在大量的文獻(xiàn)報(bào)道中,難以方便地應(yīng)用的問(wèn)題,提供了一種適用于天然產(chǎn)物質(zhì)譜數(shù)據(jù)解析的數(shù)據(jù)庫(kù)構(gòu)建方法。
[0009]本發(fā)明的上述技術(shù)問(wèn)題主要是通過(guò)下述技術(shù)方案得以解決的:一種適用于天然產(chǎn)物質(zhì)譜數(shù)據(jù)解析的數(shù)據(jù)庫(kù)構(gòu)建方法,包括以下步驟:
S1.從化合物數(shù)據(jù)庫(kù)上進(jìn)行搜索獲取與選定的天然產(chǎn)物骨架相關(guān)的所有化合物,并記錄化合物相關(guān)信息;選定為預(yù)先設(shè)定好,操作人員根據(jù)選定名單對(duì)化合物進(jìn)行搜索。化合物存儲(chǔ)形式為SMILES形式。
[0010]S2.基于裂解規(guī)律對(duì)化合物進(jìn)行計(jì)算機(jī)模擬裂解,獲得該化合物的裂解碎片,記錄化合物碎片相關(guān)信息;
S3.根據(jù)化合物碎片以及化合物的相關(guān)信息建立起數(shù)據(jù)庫(kù),并將數(shù)據(jù)庫(kù)與網(wǎng)絡(luò)平臺(tái)相接。數(shù)據(jù)庫(kù)建立可以使用當(dāng)下的各種系統(tǒng),包括Oracle,mysql,splite或microsoft sqlserver等。裂解所得的化合物碎片仍采用SMILES形式進(jìn)行保存。
[0011]現(xiàn)有技術(shù)中化合物依舊依靠人工進(jìn)行數(shù)據(jù)的逐個(gè)解析,解析速度慢成了基于質(zhì)譜的天然產(chǎn)物分析的一個(gè)重要瓶頸前人對(duì)于天然產(chǎn)物的質(zhì)譜分析從開(kāi)始到現(xiàn)在積累了大量的數(shù)據(jù),歸納了大量的ESI,APCI中切實(shí)能觀察到的裂解規(guī)律,而這些寶貴的資源并沒(méi)有被好好的應(yīng)用起來(lái),所有數(shù)據(jù)和裂解規(guī)律均散落在大量文獻(xiàn)中,難以被方便地應(yīng)用。本發(fā)明數(shù)據(jù)庫(kù)建立將化合物進(jìn)行收集,并基于現(xiàn)有裂解規(guī)律將化合物進(jìn)行計(jì)算機(jī)模擬裂解,獲取化合物裂解后碎片信息,然后將這些化合物以及裂解后化合物碎片的信息進(jìn)行儲(chǔ)存構(gòu)成數(shù)據(jù)庫(kù)。本發(fā)明整合了裂解規(guī)律,通過(guò)計(jì)算機(jī)模擬裂解將化合物以及化合物碎片信息以特定結(jié)構(gòu)存儲(chǔ)到一個(gè)數(shù)據(jù)庫(kù)中。這使得用戶(hù)可以快速和較為準(zhǔn)確地進(jìn)行天然產(chǎn)物質(zhì)譜數(shù)據(jù)解析,為解決當(dāng)下天然產(chǎn)物的質(zhì)譜數(shù)據(jù)解析領(lǐng)域的瓶頸之一提供了可行的路徑。
[0012]作為一種優(yōu)選方案,所述步驟SI中搜索獲取化合物的過(guò)程包括:根據(jù)選定要求獲得子結(jié)構(gòu),根據(jù)子結(jié)構(gòu)進(jìn)行搜索,獲取所有包含子結(jié)構(gòu)的化合物。這里的選定為預(yù)先設(shè)定條件選擇子結(jié)構(gòu)。根據(jù)條件確定子結(jié)構(gòu)類(lèi)型,再根據(jù)子結(jié)構(gòu)類(lèi)型搜索所有包含子結(jié)構(gòu)的化合物。
[0013]作為一種優(yōu)選方案,步驟SI中記錄的化合物相關(guān)信息包括化合物分子結(jié)構(gòu)式、分子式、分子量、化合物數(shù)據(jù)庫(kù)中的編號(hào)。
[0014]作為一種優(yōu)選方案,步驟S2中裂解過(guò)程包括:
S21.對(duì)化合物進(jìn)行判定,判定化合物屬于何種類(lèi)型;包含子結(jié)構(gòu)的化合物具有多種類(lèi)型,首先判定化合物屬于哪一種類(lèi)型。
[0015]S22.對(duì)屬于同一類(lèi)型化合物根據(jù)選定的鍵進(jìn)行分類(lèi);設(shè)定同一層次的鍵,判斷是否存在這些鍵再對(duì)判定后化合物進(jìn)行分類(lèi),以便于選取正確對(duì)應(yīng)的化合物裂解規(guī)律。
[0016]S23.將分類(lèi)后的化合物按照對(duì)應(yīng)的裂解規(guī)律進(jìn)行模擬裂解。
[0017]作為一種優(yōu)選方案,步驟S2中記錄的化合物碎片相關(guān)信息包括裂解類(lèi)型信息,碎片的分子結(jié)構(gòu)式、分子量,碎片歸屬信息,碎片歸屬信息包括碎片裂解前的分子結(jié)構(gòu)式、分子量N分子式。
[0018]作為一種優(yōu)選方案,步驟SI中的化合物數(shù)據(jù)庫(kù)采用PubChem、CA或Reaxys?;衔飻?shù)據(jù)庫(kù)指數(shù)據(jù)可信任何來(lái)源的化合物數(shù)據(jù)庫(kù)??梢詾檫@些化合物數(shù)據(jù)庫(kù)中一種或幾種的組合。
[0019]作為一種優(yōu)選方案,步驟S2中采用化學(xué)信息學(xué)工具對(duì)化合物進(jìn)行模擬裂解,化學(xué)信息學(xué)工具為RDKit或⑶K。
[0020]作為一種優(yōu)選方案,建立數(shù)據(jù)庫(kù)采用的數(shù)據(jù)庫(kù)系統(tǒng)包括Oracle、mysql、splite或microsoft sql server。
[0021]因此,本發(fā)明的優(yōu)點(diǎn)是:數(shù)據(jù)庫(kù)建立將化合物進(jìn)行收集,并基于現(xiàn)有裂解規(guī)律對(duì)化合物進(jìn)行計(jì)算機(jī)模擬裂解,獲取化合物裂解后碎片信息,然后將這些化合物以及裂解后化合物碎片的信息進(jìn)行儲(chǔ)存構(gòu)成數(shù)據(jù)庫(kù)。本發(fā)明整合了裂解規(guī)律,通過(guò)計(jì)算機(jī)模擬裂解將化合物以及化合物碎片信息以
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1