亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種區(qū)分假陽性質(zhì)譜峰信號且定量校正質(zhì)譜峰面積的代謝組學方法

文檔序號:10652180閱讀:2968來源:國知局
一種區(qū)分假陽性質(zhì)譜峰信號且定量校正質(zhì)譜峰面積的代謝組學方法
【專利摘要】本發(fā)明公開了一種區(qū)分假陽性質(zhì)譜峰信號且定量校正質(zhì)譜峰面積的代謝組學方法。本發(fā)明提供代謝組學研究方法,該方法可以有效區(qū)分生物來源與非生物來源的質(zhì)譜峰信號,并對質(zhì)譜峰信號進行定量評價,排除定量能力(Quantification Performance)較差的質(zhì)譜峰;通過QC樣本稀釋建立相對含量校正模型,對質(zhì)譜峰面積進行校正。該方法最大的特點是有效消除假陽性的質(zhì)譜峰信號,使代謝組學數(shù)據(jù)變得可靠,有利于篩選真識的代謝標識物(Biomarkers)。本方法可以針對植物、動物、微生物樣本,也可以適合GC?MS,LC?MS和CE?MS的基于質(zhì)譜平臺的代謝組學分析。
【專利說明】
一種區(qū)分假陽性質(zhì)譜峰信號且定量校正質(zhì)譜峰面積的代謝組 學方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及生物技術(shù)領(lǐng)域,尤其涉及一種區(qū)分假陽性質(zhì)譜峰信號且定量校正質(zhì)譜 峰面積的代謝組學方法。
【背景技術(shù)】
[0002] 隨著人類全基因組序列的測定,各種組學的概念應(yīng)運而生。基因組學研究帶動了 生命科學的迅猛發(fā)展,并極大地推動了轉(zhuǎn)錄組學、蛋白質(zhì)組學、代謝組學、表型組學等的快 速發(fā)展。代謝組學(Metabonomics/Metabolomics)旨在研究生物體或組織甚至單個細胞的 全部小分子代謝物成分及其動態(tài)變化(Nicholson JK andLindon JC.Nature 455:1054- 6)。代謝物距表型最接近,是基因與表型之間的橋梁。代謝組學是系統(tǒng)生物學研究中非常重 要的一個環(huán)節(jié),不僅可以揭示基因的功能,也為生物技術(shù)的應(yīng)用提供科學依據(jù)(Chen,W.,et al.,Nat Genet.46:714-721;Sreekumar,A.,et al.,Nature 457:910-914)〇
[0003] 代謝組學研究的需求刺激了各種高靈敏度、高分辨率分析儀器的迅速發(fā)展。目前, 代謝組學主要采用兩大分析技術(shù)平臺,核磁共振譜(Nuclear Magnetic Resonance,NMR)平 臺和質(zhì)譜(Mass Spectrometry,MS)平臺。盡管NMR具有簡單的樣品預(yù)處理、較高的重現(xiàn)性和 良好的檢測客觀性等優(yōu)勢,但是質(zhì)譜擁有較高的分辨率和靈敏度,對于植物這樣復(fù)雜的樣 本尤其適合(Antignac,JP.,et al.,TrAC_Trend Anal.Chem.30:292_301;De Vos,RCH.,et al.,Nat Protoc.2:778-791)〇
[0004] 代謝組學力求分析所有的小分子代謝物,期望分析儀器能夠檢測盡可能多的代謝 物。然而,由于色譜-質(zhì)譜聯(lián)用技術(shù)具有非常高的靈敏度,對20種標準品組成的混合物能夠 提取上千種質(zhì)譜信號,超過90%的假陽性。有些假陽性信號具有隨機性,它們的含量波動大 多數(shù)時候會高于生物來源代謝物含量的差異,會直接影響后面的統(tǒng)計分析,極大地干擾真 實生物標志物"biomarkers"的篩選。在缺少數(shù)據(jù)質(zhì)量控制的代謝組學分析中,往往找不到 真實的生物標識物,或者篩選到假陽性13;[0111311^18(131'03(1111^81:,01.311(11(611, DB..Metabolomics 2:171-196;Kim,S.and Zhang,X..J Chemometr 29:80-86;Redestig, H.et al.,Anal.Chem. 83: 5645-5651)。在代謝組學數(shù)據(jù)分析,在盡可能檢測更多的信號與 減少假陽性信號之間存在矛盾,如何過濾質(zhì)譜數(shù)據(jù)沒有統(tǒng)一的標準。而且質(zhì)譜數(shù)據(jù)處理軟 件一個小參數(shù)的變化使得代謝物峰的數(shù)量發(fā)生巨大的變化,如何評價這些信號,如何取舍 這些信號,目前還缺乏合理的邏輯判斷方法。
[0005] 色譜-質(zhì)譜聯(lián)用代謝組學方法的質(zhì)譜信號可以分為兩種,一種是生物來源的,一種 是非生物來源的,即溶劑雜質(zhì),色譜柱,儀器管路,實驗耗材帶來的外來污染。通常一個空白 樣本可以輕易獲得上千的質(zhì)譜峰信號,一個生物學樣本可以獲得數(shù)千個質(zhì)譜峰信號,非生 物來源的信號占了大部分。對于生物來源的信號,也不是所有的信號都適合代謝組學定量 分析,比如那些含量極高、極低的組份,在色譜-質(zhì)譜分析中會獲得信號,但是它們的信號強 度與真實濃度之間不一定存在或存在極差的相關(guān)性。直接使用質(zhì)譜峰面積比較相對定量關(guān) 系,往往會得到錯誤的結(jié)果。因此,區(qū)分非生物來源的質(zhì)譜峰信號,評價生物來源的質(zhì)譜峰 信號對代謝組學分析有重要的意義。
[0006] 目前能有效區(qū)分非生物來源的質(zhì)譜峰信號的方法主要是同位素標記代謝組的方 法,該方法需要用c13,H 2等穩(wěn)定同位素標記整個代謝組(Giaval isco,P . et al.,Anal Chem81:6546-51),通過質(zhì)譜位移來判斷那些質(zhì)譜峰是來源于生物體,并可以對質(zhì)譜位移限 定碳原子(或氫原子)的個數(shù),對質(zhì)譜峰信號進行定性分析。同位素標記代謝組方法非常有 效,但是成本很高,技術(shù)要求非常高。靶向的代謝組學分析方法,用標準品,分析已知代謝物 的含量差異,這些可以方法局限于分析某種或某些具體的代謝物(Phinney,KW.et al., .Anal Chem 85:11732-11738),而對于非靶向代謝組學實驗不合適。

【發(fā)明內(nèi)容】

[0007] 本發(fā)明的一個目的是提供一種區(qū)分不同樣本的差異代謝產(chǎn)物的方法。
[0008] 本發(fā)明提供的方法,包括如下步驟:
[0009] 1)、制備QC_miX樣本、溶劑空白樣本、不同稀釋倍數(shù)QC_miX樣本、不同濃縮倍數(shù)QC_ mix樣本、多個待測樣本代謝產(chǎn)物樣本;
[0010] 所述QC_mix樣本為將多個待測樣本的代謝產(chǎn)物溶液混勻,得到QC_mix樣本;
[0011] 所述代謝產(chǎn)物溶液為由代謝產(chǎn)物和有機溶劑組成或用有機溶劑提取待測樣本的 代謝產(chǎn)物得到,作為待測樣本代謝產(chǎn)物樣本;
[0012] 所述溶劑空白樣本由內(nèi)標和所述有機溶劑組成;
[0013] 所述不同稀釋倍數(shù)QC_mix樣本為對所述QC_mix樣本進行逐級稀釋,得到的不同稀 釋倍數(shù)QC_mix樣本;
[0014] 所述不同濃縮倍數(shù)QC_mix樣本為對所述QC_mix樣本進行逐級濃縮,得到的不同濃 縮倍數(shù)QC_mix樣本;
[0015] 所述多個待測樣本代謝產(chǎn)物樣本為多個待測樣本的代謝產(chǎn)物溶液;
[0016] 2)、色譜-質(zhì)譜聯(lián)用依次檢測步驟1)獲得的各樣本,所述檢測包括如下步驟:
[0017] (1)對所述溶劑空白樣本進行大于等于3次檢測,得到溶劑空白樣本的大于等于3 次的原始質(zhì)譜數(shù)據(jù);
[0018] (2)對所述QC_mix樣本進行大于等于6次檢測,得到QC_mix樣本的大于等于6次的 原始質(zhì)譜數(shù)據(jù);
[0019] ⑶對所述不同稀釋倍數(shù)QC_mix樣本和不同濃縮倍數(shù)QC_mix樣本按照濃度從小到 大的順序依次檢測1次,得到濃度從小到大排列的不同稀釋倍數(shù)QC_mix樣本和不同濃縮倍 數(shù)QC_mix樣本的原始質(zhì)譜數(shù)據(jù);
[0020] (4)對所述多個待測樣本代謝產(chǎn)物樣本分別進行1次檢測,得到多個待測樣本代謝 產(chǎn)物樣本的原始質(zhì)譜數(shù)據(jù);
[0021] 3)、對步驟2)得到的所有質(zhì)譜數(shù)據(jù)進行峰提取和峰對齊,得到所有樣本的峰列表 矩陣;再用如下(A)-(E)的五步質(zhì)譜峰過濾規(guī)則過濾所述峰列表矩陣中的假陽性峰,得到過 濾后質(zhì)譜峰:
[0022] (A)選取所述峰列表矩陣中QC_mix樣本的大于等于6次檢測結(jié)果中峰出現(xiàn)頻率〉等 于80 %的峰保留;
[0023] (B)選取經(jīng)(A)處理得到的峰中QC_mix樣本的大于等于6次檢測結(jié)果中峰變異性 RSD〈20%的峰保留;
[0024] (C)選取經(jīng)(B)處理得到的峰中B/S值小于5%的峰保留;
[0025] B/S值為溶劑空白樣本大于等于3次檢測結(jié)果峰面積平均值比QC_mix樣本大于等 于6次檢測結(jié)果峰面積平均值;
[0026] (D)計算經(jīng)(C)處理得到的峰中QC_mix不同稀釋倍數(shù)樣本和QC_mix不同濃縮倍數(shù) 樣本的峰面積與各樣本對應(yīng)的相對濃度指數(shù)的pearson相關(guān)系數(shù)r,選取0.7〈r〈0.99的峰保 留,實現(xiàn)假陽性質(zhì)譜峰的消除;
[0027] 所述QC_mix不同稀釋倍數(shù)樣本和QC_mix不同濃縮倍數(shù)樣本對應(yīng)的相對濃度指數(shù) 按照如下包括如下步驟的方法獲得:將所述QC_mix不同稀釋倍數(shù)樣本和所述QC_mix不同濃 縮倍數(shù)樣本中濃度最小的樣本賦予相對濃度指數(shù)為X,根據(jù)下面公式1計算其余濃度樣本的 相對濃度指數(shù)y,得到所有QCjnix不同稀釋倍數(shù)和QCjnix不同濃縮倍數(shù)的相對濃度指數(shù);
[0028] 公式1:樣本相對濃度指數(shù)y =該樣本相對于濃度最小樣本的濃度倍數(shù)*X
[0029] X為不為0的數(shù)值;
[0030] (E)將經(jīng)(D)處理得到的0.7〈r〈0.99的質(zhì)譜峰進行手動校正對齊積分錯誤的數(shù)據(jù) 點,實現(xiàn)消除假陽性質(zhì)譜峰。
[0031] 4)、將步驟3)的E得到的所述過濾后質(zhì)譜峰的峰面積和其對應(yīng)的相對濃度指數(shù)建 立回歸模型;再將每個所述待測樣本的代謝產(chǎn)物的質(zhì)譜圖峰面積分別代入回歸模型進行校 正和歸一化,得到每個待測樣本的相對濃度指數(shù);
[0032] 所述回歸模型包括線性回歸模型、二項式回歸模型、對數(shù)回歸模型、指數(shù)回歸模型 和/或復(fù)合回歸模型;
[0033] 5)、對所有待測樣本的相對濃度指數(shù)進行多變量或單變量統(tǒng)計分析,找到多個待 測樣本的差異代謝產(chǎn)物。
[0034] 上述方法中,步驟2)中,所述色譜-質(zhì)譜聯(lián)用為GC-MS,LC-MS和CE-MS;
[0035]和/或,所述色譜-質(zhì)譜聯(lián)用具體為LC-MS;
[0036] 步驟3)中,所述峰提取和峰對齊采用的軟件為質(zhì)譜預(yù)處理分析軟件,
[0037] 和/或,所述質(zhì)譜預(yù)處理分析軟件具體為xcms或Masshunter Quanlitative Analysis;
[0038] 步驟3)的E中,將經(jīng)(D)處理得到的0.9〈r〈0.99的質(zhì)譜峰進行手動校正對齊積分錯 誤的數(shù)據(jù)點。
[0039] 上述方法中,步驟1)中,所述待測樣本為生物來源樣本和/或非生物來源樣本;
[0040] 所述生物來源樣本具體為植物、動物和/或微生物。
[0041] 上述方法中,步驟1)中,所述多個待測樣本個數(shù)大于等于2;
[0042]所述有機溶劑為甲醇,
[0043] 所述內(nèi)標為 umbelliferon;
[0044] 步驟2)中,所述QC_mix樣本為將多個待測樣本的代謝產(chǎn)物溶液等體積混勻得到;
[0045] 所述稀釋采用的稀釋液為所述有機溶劑;
[0046] 所述逐級稀釋為逐級稀釋至16-32倍;
[0047]所述逐級濃縮為逐級濃縮至2-4倍。
[0048] 本發(fā)明另一個目的是提供一種代謝產(chǎn)物檢測中假陽性質(zhì)譜峰消除方法。
[0049] 本發(fā)明提供的方法,包括如下步驟:為上述中的步驟1)-3),實現(xiàn)假陽性質(zhì)譜峰消 除。
[0050] 上述的方法在區(qū)分不同樣本的代謝產(chǎn)物中的應(yīng)用也是本發(fā)明保護的范圍。
[0051] 上述的方法在定量校正不同樣本的代謝產(chǎn)物中的應(yīng)用也是本發(fā)明保護的范圍。
[0052] 上述的方法在區(qū)分樣本中假陽性質(zhì)譜峰信號中的應(yīng)用也是本發(fā)明保護的范圍。 [0053] 上述LC-MS的條件如下:
[0054] (1)色譜條件:色譜儀器,Agilent公司1290型超高壓液相色譜(UHPLC),色譜柱 ZORBAX Eclipse Plus C18(Agilent),2. l*100mm,填料粒徑 1·8μηι。
[0055] (2)進樣量5ul,柱溫30度,流動相組成:Α水(0.1%,甲酸),Β乙腈(0.1%,甲酸), UHPLC梯度洗脫程序如下:起始5 % Β,5min-20 %Β,15min-40 % Β,25min-100 % Β,28- 100%8,28.5-5%8平衡2.511^11,整個洗脫時間3〇1^11。
[0056] (3)質(zhì)譜條件:色譜儀器,Ag i 1 ent公司6 540型四極桿串聯(lián)飛行時間質(zhì)譜(Q-TOF/ MS),配備高靈敏度噴射流離子聚焦離子源(Jet stream ESI)。全掃描模式(full scan),質(zhì) 量范圍50-1000,采集速率,2spectrum/s,正離子模式下校正離子:m/z 121.050873, 922.009798。正離子模式參數(shù)設(shè)置:載氣溫度,350 °C ;干燥氣流速:8L/min;霧化器壓力, 35psi ;鞘氣溫度,350°C ;鞘氣流速,8L/min; V cap電壓,4000V;Fragmentor電壓,130V; Nozzle V〇ltage,0V。負離子模式參數(shù)設(shè)置:載氣溫度,350°C ;干燥氣流速:8L/min;霧化器 壓力,35psi ;鞘氣溫度,350°C ;鞘氣流速,8L/min; V cap電壓,3000V;Fragmentor電壓, 130V;Nozzle voltage,1000V〇
[0057] 本發(fā)明提供簡單、低成本、有效地代謝組學研究新方法,該方法可以有效區(qū)分生物 來源與非生物來源的質(zhì)譜峰信號,并對質(zhì)譜峰信號進行定量評價,排除定量能力 (Quantification Performance)較差的質(zhì)譜峰。通過QC樣本稀釋建立相對含量校正模型, 對質(zhì)譜峰面積進行校正。該方法最大的特點是有效消除假陽性的質(zhì)譜峰信號,使代謝組學 數(shù)據(jù)變得可靠,有利于篩選真實的代謝標識物(Biomarkers)。本方法可以針對植物、動物、 微生物樣本,也可以適合GC-MS,LC-MS和CE-MS的基于質(zhì)譜平臺的代謝組學分析。
[0058] 本發(fā)明與現(xiàn)有技術(shù)相比,具有的突出優(yōu)點是建立了一種簡單、低成本、有效地區(qū)分 生物來源與非生物來源的質(zhì)譜峰信號,排除定量能力較差的質(zhì)譜峰,對質(zhì)譜峰面積進行校 正,提高了代謝組學數(shù)據(jù)的可靠性。
[0059] (1)簡單、低成本。與同位素標記的方法相比,本發(fā)明不需要額外的同位素標記技 術(shù)和儀器,也不需要昂貴的同位素標記材料。任何代謝組學實驗室均能完成,只需要做好樣 本的制備和按照本發(fā)明的檢測方式進行。
[0060] (2)有效地區(qū)分假陽性信號和定量能力差的信號。通過五步質(zhì)譜峰過濾規(guī)則,能夠 極大地降低質(zhì)譜峰數(shù)量,這五步質(zhì)譜峰過濾從分析化學的角度,即分析的重現(xiàn)性,檢測的精 確性,空白對照和定量相關(guān)性等幾個方面綜合分析,這些參數(shù)具有邏輯性,避免人為武斷地 過濾質(zhì)譜峰。
[0061] (3)引入相對濃度指數(shù)概念,不僅可以對峰的定量性能進行量化評價,而且還可以 建立相對校正模型,對質(zhì)譜峰面積進行校正,提高了定量準確性。
[0062] (4)高通量,批量化處理。通過對QC_mix進行分析,將所有的代謝物一起進行分析 評價,而且一次稀釋實驗即可對所有化合物建立相對回歸曲線,大大地節(jié)約成本和工作量。
[0063] (5)通過本發(fā)明,可以將非靶向代謝組學方法轉(zhuǎn)化為靶向的代謝組學分析方法。
[0064] (6)本發(fā)明采用的分析策略,包括混合各生物樣本組成質(zhì)控樣本(Quality Contro 1,QC ),對質(zhì)控樣本進行稀釋,設(shè)置溶劑空白樣本等。而且本發(fā)明規(guī)定了上樣順序,五 步峰過濾規(guī)則等。本方法對標準品組成的模擬樣本,能夠消除92.4%的假陽性質(zhì)譜峰信號, 對水稻籽粒的生物學樣本能消除71.4%的假陽性質(zhì)譜信號。本方法簡單、方便、成本低、消 除假陽性效果較好,保證了代謝組學的數(shù)據(jù)質(zhì)量。
【附圖說明】
[0065] 圖1為區(qū)分假陽性質(zhì)譜峰信號、提高定量準確性的代謝組學新方法流程圖。
[0066] 圖2為QCjnix稀釋用來區(qū)分假陽性質(zhì)譜峰信號。
[0067]圖3為人工樣本配制方法,不同標準品在12組人工樣本中的濃度比例。
[0068]圖4為五步過濾規(guī)則,對人工樣本減少假陽性質(zhì)譜峰的效果。
[0069]圖5為相對濃度指數(shù)和相對濃度校正模型。
[0070] 圖6為步過濾規(guī)則,對水稻籽粒樣本減少假陽性質(zhì)譜峰的效果。
[0071] 圖7為本方法(右)與傳統(tǒng)代謝組學方法(左)在區(qū)分兩種栽培水稻籽粒,建立主成 分分析模型中的差別。
[0072] 圖8為本方法(右)與傳統(tǒng)代謝組學方法(左)在區(qū)分水稻籽粒主成分分析得分圖中 的差別。
[0073] 圖9為本方法(下)與傳統(tǒng)代謝組學方法(上)在區(qū)分水稻籽粒主成分分析載荷圖中 的差別。
[0074] 圖10為本方法(黃)與傳統(tǒng)代謝組學方法(藍)篩選兩種水稻籽粒差異代謝物的數(shù) 量差別。
【具體實施方式】
[0075] 下述實施例中所使用的實驗方法如無特殊說明,均為常規(guī)方法。
[0076] 下述實施例中所用的材料、試劑等,如無特殊說明,均可從商業(yè)途徑得到。
[0077] 下面結(jié)合附圖對本發(fā)明做進一步說明。
[0078] 實施例1、本發(fā)明用于區(qū)分假陽性質(zhì)譜峰信號且定量校正質(zhì)譜峰面積的代謝組學 方法
[0079] -、代謝產(chǎn)物檢測中假陽性質(zhì)譜峰消除方法,包括如下步驟:
[0080] 1、制備QC_mix樣本、溶劑空白樣本、不同稀釋倍數(shù)QC_mix樣本、不同濃縮倍數(shù)QC_ mix樣本、多個待測樣本代謝產(chǎn)物樣本;
[0081 ] QC_mix樣本為將多個待測樣本的代謝產(chǎn)物溶液混勻,得到QC_mix樣本;
[0082]代謝產(chǎn)物溶液為由代謝產(chǎn)物和有機溶劑組成或用有機溶劑提取待測樣本的代謝 產(chǎn)物得到,作為待測樣本代謝產(chǎn)物樣本;
[0083]溶劑空白樣本由內(nèi)標和有機溶劑組成;
[0084] 不同稀釋倍數(shù)QC_mix樣本為對QC_mix樣本進行逐級稀釋,得到的不同稀釋倍數(shù) QC_mix 樣本;
[0085] 不同濃縮倍數(shù)QC_mix樣本為對QC_mix樣本進行逐級濃縮,得到的不同濃縮倍數(shù) QC_mix 樣本;
[0086] 2、色譜-質(zhì)譜聯(lián)用依次檢測步驟1)獲得的各樣本,檢測包括如下步驟:
[0087] (1)對溶劑空白樣本進行大于等于3次檢測至總離子流色譜圖完全重疊(即儀器達 到穩(wěn)定狀態(tài)),得到溶劑空白樣本的大于等于3次的原始質(zhì)譜數(shù)據(jù);
[0088] (2)對QC_mix樣本進行大于等于6次檢測,得到QC_mix樣本的大于等于6次的原始 質(zhì)譜數(shù)據(jù);
[0089] (3)對不同稀釋倍數(shù)QC_mix樣本和不同濃縮倍數(shù)QC_mix樣本按照濃度從小到大的 順序依次檢測1次,得到濃度從小到大排列的不同稀釋倍數(shù)QC_mix樣本和不同濃縮倍數(shù)QC_ mix樣本的原始質(zhì)譜數(shù)據(jù);
[0090] (4)對多個待測樣本代謝產(chǎn)物樣本分別進行1次檢測,得到多個待測樣本代謝產(chǎn)物 樣本的原始質(zhì)譜數(shù)據(jù);
[0091] 3、對步驟2得到的所有質(zhì)譜數(shù)據(jù)進行峰提取和峰對齊,得到所有樣本的峰列表矩 陣;再用如下(A)-(E)的五步質(zhì)譜峰過濾規(guī)則過濾峰列表矩陣中的假陽性峰,得到過濾后質(zhì) 譜峰:
[0092] (A)選取峰列表矩陣中QC_mix樣本的大于等于6次檢測結(jié)果中峰出現(xiàn)頻率〉等于 80%的峰保留;
[0093] (B)選取經(jīng)(A)處理得到的峰中QC_mix樣本的大于等于6次檢測結(jié)果中峰變異性 RSD〈20%的峰保留;
[0094] (C)選取經(jīng)(B)處理得到的峰中B/S值小于5%的峰保留;
[0095] B/S值為溶劑空白樣本大于等于3次檢測結(jié)果峰面積平均值比QC_mix樣本大于等 于6次檢測結(jié)果峰面積平均值;
[0096] (D)計算經(jīng)(C)處理得到的峰中QC_mix不同稀釋倍數(shù)樣本和QC_mix不同濃縮倍數(shù) 樣本的峰面積與各樣本對應(yīng)的相對濃度指數(shù)的pearson相關(guān)系數(shù)r,選取0.7〈r〈0.99的峰保 留,實現(xiàn)假陽性質(zhì)譜峰的消除;
[0097] QC_mix不同稀釋倍數(shù)樣本和QC_mix不同濃縮倍數(shù)樣本對應(yīng)的相對濃度指數(shù)按照 如下包括如下步驟的方法獲得:將QC_mix不同稀釋倍數(shù)樣本和QC_mix不同濃縮倍數(shù)樣本中 濃度最小的樣本賦予相對濃度指數(shù)為X,再將其余不同濃度的QC_mix不同稀釋倍數(shù)樣本和 QC_mix不同濃縮倍數(shù)樣本按照X的不同濃度倍數(shù)計算獲得,得到所有QC_mix不同稀釋倍數(shù) 和QCjnix不同濃縮倍數(shù)的相對濃度指數(shù);
[0098] 公式1:樣本相對濃度指數(shù)y =該樣本相對于濃度最小樣本的濃度倍數(shù)*X
[0099] X為不為0的數(shù)值;
[0100] (E)將經(jīng)(D)處理得到的0.7〈r〈0.9的質(zhì)譜峰進行手動校正對齊積分錯誤的數(shù)據(jù) 點,實現(xiàn)消除假陽性質(zhì)譜峰。
[0101] 二、區(qū)分不同樣本代謝產(chǎn)物的方法
[0102] 包括如下步驟:
[01 03] 1、制備QC_mix樣本、溶劑空白樣本、不同稀釋倍數(shù)QC_mix樣本、不同濃縮倍數(shù)QC_ mix樣本、多個待測樣本代謝產(chǎn)物樣本;
[0104] QC_mix樣本為將多個待測樣本的代謝產(chǎn)物溶液混勻,得到QC_mix樣本;
[0105] 代謝產(chǎn)物溶液為由代謝產(chǎn)物和有機溶劑組成或用有機溶劑提取待測樣本的代謝 產(chǎn)物得到,作為待測樣本代謝產(chǎn)物樣本;
[0106] 溶劑空白樣本由內(nèi)標和有機溶劑組成;
[0107] 不同稀釋倍數(shù)QC_mix樣本為對QC_mix樣本進行逐級稀釋,得到的不同稀釋倍數(shù) QC_mix 樣本;
[0108] 不同濃縮倍數(shù)QC_mix樣本為對QC_mix樣本進行逐級濃縮,得到的不同濃縮倍數(shù) QC_mix 樣本;
[0109] 多個待測樣本代謝產(chǎn)物樣本為多個待測樣本的代謝產(chǎn)物溶液;
[0110] 2、色譜-質(zhì)譜聯(lián)用依次檢測步驟1)獲得的各樣本,檢測包括如下步驟:
[0111] (1)對溶劑空白樣本進行大于等于3次檢測至總離子流色譜圖完全重疊(即儀器達 到穩(wěn)定狀態(tài)),得到溶劑空白樣本的大于等于3次的原始質(zhì)譜數(shù)據(jù);
[0112] (2)對QC_mix樣本進行大于等于6次檢測,得到QC_mix樣本的大于等于6次的原始 質(zhì)譜數(shù)據(jù);
[0113] (3)對不同稀釋倍數(shù)QC_mix樣本和不同濃縮倍數(shù)QC_mix樣本按照濃度從小到大的 順序依次檢測1次,得到濃度從小到大排列的不同稀釋倍數(shù)QC_mix樣本和不同濃縮倍數(shù)QC_ mix樣本的原始質(zhì)譜數(shù)據(jù);
[0114] (4)對多個待測樣本代謝產(chǎn)物樣本分別進行1次檢測,得到多個待測樣本代謝產(chǎn)物 樣本的原始質(zhì)譜數(shù)據(jù);
[0115] 3、對步驟2得到的所有質(zhì)譜數(shù)據(jù)進行峰提取和峰對齊,得到所有樣本的峰列表矩 陣;再用如下(A)-(E)的五步質(zhì)譜峰過濾規(guī)則過濾峰列表矩陣中的假陽性峰,得到過濾后質(zhì) 譜峰:
[0116] (A)選取峰列表矩陣中QC_mix樣本的大于等于6次檢測結(jié)果中峰出現(xiàn)頻率〉等于 80%的峰保留;
[0117] (B)選取經(jīng)(A)處理得到的峰中QC_mix樣本的大于等于6次檢測結(jié)果中峰變異性 RSD〈20%的峰保留;
[0118] (C)選取經(jīng)(B)處理得到的峰中B/S值小于5 %的峰保留;
[0119] B/S值為溶劑空白樣本大于等于3次檢測結(jié)果峰面積平均值比QC_mix樣本大于等 于6次檢測結(jié)果峰面積平均值;
[0120] (D)計算經(jīng)(C)處理得到的峰中QC_mix不同稀釋倍數(shù)樣本和QC_mix不同濃縮倍數(shù) 樣本的峰面積與各樣本對應(yīng)的相對濃度指數(shù)的pearson相關(guān)系數(shù)r,選取0.7〈r〈0.99的峰保 留,實現(xiàn)假陽性質(zhì)譜峰的消除;
[0121] QC_mix不同稀釋倍數(shù)樣本和QC_mix不同濃縮倍數(shù)樣本對應(yīng)的相對濃度指數(shù)按照 如下包括如下步驟的方法獲得:將QC_mix不同稀釋倍數(shù)樣本和QC_mix不同濃縮倍數(shù)樣本中 濃度最小的樣本賦予相對濃度指數(shù)為X,根據(jù)下面公式1計算其余濃度樣本的相對濃度指數(shù) y,得到所有QCjnix不同稀釋倍數(shù)和QCjnix不同濃縮倍數(shù)的相對濃度指數(shù);
[0122] 公式1:樣本相對濃度指數(shù)y =該樣本相對于濃度最小樣本的濃度倍數(shù)*X
[0123] X為不為0的數(shù)值;
[0124] (E)將經(jīng)(D)處理得到的0.7〈r〈0.99的質(zhì)譜峰進行手動校正對齊積分錯誤的數(shù)據(jù) 點,實現(xiàn)消除假陽性質(zhì)譜峰。
[0125] 4、將步驟3的E得到的過濾后質(zhì)譜峰的峰面積和其對應(yīng)的相對濃度指數(shù)建立回歸 模型;再將每個待測樣本的代謝產(chǎn)物的質(zhì)譜圖峰面積分別代入回歸模型進行校正和歸一 化,得到每個待測樣本的相對濃度指數(shù);
[0126] 回歸模型包括線性回歸模型、二項式回歸模型、對數(shù)回歸模型、指數(shù)回歸模型和/ 或復(fù)合回歸模型;
[0127] 5、對所有待測樣本的相對濃度指數(shù)進行多變量或單變量統(tǒng)計分析,找到多個待測 樣本的差異代謝產(chǎn)物。
[0128] 上述色譜-質(zhì)譜聯(lián)用為GC-MS,LC-MS和CE-MS;色譜-質(zhì)譜聯(lián)用具體為LC-MS;
[0129] 步驟3)中,峰提取和峰對齊采用的軟件為質(zhì)譜分析軟件,具體為xcms或 Masshunter Quanlitative Analysis;
[0130] 步驟3)的E中,將經(jīng)(D)處理得到的0.9〈r〈0.99的質(zhì)譜峰進行手動校正對齊積分錯 誤的數(shù)據(jù)點。
[0131] 實施例2、人工模擬樣本驗證本發(fā)明方法降低假陽性質(zhì)譜峰的效果
[0132] 為了驗證方法的有效性、可行性和可靠性,實驗配置了 20種標準品組成的人工模 擬樣本(Artificial Samples,AS),圖1為本發(fā)明的流程圖。
[0133] 表1為20種標準品組成的人工模擬樣本及濃度(mmol)
[0136] *:Asa:artificial samples group A,人工模擬樣本A組,Asa-1,-2,,,-6模擬6次 生物學重復(fù)。
[0137] ~ :Asb: artificial samples group B,人工模擬樣本13組,八813_1,_2,,,_6模擬6次 生物學重復(fù)。
[0138] 濃度單位為mmol
[0139] 標準品:酪氨酸(T2900000),苯丙氨酸(147966),山柰酚(96353),3_吲哚丁酸 (5731〇),花旗松素(78666),5-羥基色氨(14972),毛蕊黃酮-7-〇-0-〇葡萄糖苷(1〇87483), 2-氨基-4-氟苯甲酸(370169),卡草胺(P562s),綠原酸(C3878),東莨菪堿內(nèi)酯(S2500),氫 化肉桂酸內(nèi)酯(D104809),迷迭香酸(36954),6,7_二羥基香豆素(246573),3,4_二甲氧基肉 桂酸(D133809),香豆素(72609);購自Sigma公司(Sigma-Aldrich,上海),括號內(nèi)為貨號。
[0140] 標準品:丹參酮IIA(110766),隱丹參酮(110852),丹參酮1(110867)購自生物藥品 檢定所(中國),括號內(nèi)為貨號。
[0141 ] 1、制備QC_mix樣本、溶劑空白樣本、不同稀釋倍數(shù)QC_mix樣本、不同濃縮倍數(shù)QC_ mix樣本
[0142] 將20種標準品,按照表1中的配置濃度(mmol),配制成12份人工模擬樣本Asa_l, Asa_2,,,Asb6,溶劑為甲醇(色譜級,Thermo fisher公司),每個人工模擬樣品最終定容到 2mL,內(nèi)標為香豆素(見表1)。
[0143] 人工模擬樣本A組,包括樣本為Asa_l,Asa_2,Asa_3,Asa_4,Asa_5,Asa_6;
[0144] 人工模擬樣本B組,包括樣本為Asb_l,Asb_2,Asb_3,Asb_4,Asb_5,Asb_6;
[0145] 溶劑空白樣本為含有內(nèi)標(香豆素,0.2mmol)的色譜級甲醇。
[0146] QC_mix樣本為分別取人工模擬樣本A組和B組共12個樣本50ul,等量混合,得到QC_ mix;
[0147] 不同稀釋倍數(shù)QC_mix樣本為將QC_mix用色譜級甲醇逐級稀釋2,4,8,16倍,得到稀 釋2倍QC_mix樣本、稀釋4倍QC_mix樣本、稀釋8倍QC_mix樣本、稀釋16倍QC_mix樣本;
[0148] 不同濃縮倍數(shù)QC_mix樣本為將QC_mix采用冷凍離心(1500g)濃縮,逐級濃縮2倍、4 倍,得到濃縮2倍QC_mix樣本、濃縮4倍QC_mix樣本(圖3)。
[0149] 2、用液相質(zhì)譜聯(lián)用檢測各樣本
[0150] 色譜-質(zhì)譜聯(lián)用依次檢測如下各樣本:溶劑空白樣本檢測3次至總離子流色譜圖完 全重疊(即儀器達到穩(wěn)定狀態(tài))、QC_mix樣本檢測6次、稀釋16倍QC_mix樣本(DS_l/16x)檢測 1次、稀釋8倍QC_mix樣本(DS_l/8x)檢測1次、稀釋4倍QC_mix樣本(DS_l/4x)檢測1次、稀釋2 倍QC_mix樣本(DS_l/2x)檢測1次、濃縮2倍QC_mix樣本(DS_2x)檢測1次、濃縮4倍QC_mix樣 本(DS_4x)檢測1次、12個人工模擬樣本檢測1次,得到各樣本的質(zhì)譜原始數(shù)據(jù);
[0151 ]色譜-質(zhì)譜聯(lián)用的條件如下:
[0152] 1)色譜條件:色譜儀器,Agilent公司1290型超高壓液相色譜(UHPLC),色譜柱 ZORBAX Eclipse Plus C18(Agilent),2. l*100mm,填料粒徑 1·8μηι。
[0153] 2)進樣量5ul,柱溫30度,流動相組成:Α水(0.1 %,甲酸),Β乙腈(0.1 %,甲酸), UHPLC梯度洗脫程序如下:起始5 % B,5min-20 %B,15min-40 % B,25min-100 % B,28- 100%8,28.5-5%8平衡2.511^11,整個洗脫時間3〇1^11。
[0154] 3)質(zhì)譜條件:色譜儀器,Agi 1 ent公司6540型四極桿串聯(lián)飛行時間質(zhì)譜(Q-TOF/ MS),配備高靈敏度噴射流離子聚焦離子源(Jet stream ESI)。全掃描模式(full scan),質(zhì) 量范圍50-1000,采集速率,2spectrum/s,正離子模式下校正離子:m/z 121.050873, 922.009798。正離子模式參數(shù)設(shè)置:載氣溫度,350 °C ;干燥氣流速:8L/min;霧化器壓力, 35psi ;鞘氣溫度,350°C ;鞘氣流速,8L/min; V cap電壓,4000V;Fragmentor電壓,130V; Nozzle V〇ltage,0V。負離子模式參數(shù)設(shè)置:載氣溫度,350°C ;干燥氣流速:8L/min;霧化器 壓力,35psi ;鞘氣溫度,350°C ;鞘氣流速,8L/min; V cap電壓,3000V;Fragmentor電壓, 130V;Nozzle voltage,1000V〇
[0155] 3、分析質(zhì)譜數(shù)據(jù)
[0156] 1)質(zhì)譜數(shù)據(jù)預(yù)處理
[0157] 對3)得到的所有樣本的質(zhì)譜原始數(shù)據(jù)進行峰提取和峰對齊,得到所有樣本的峰列 表矩陣;
[0158] 峰提取和峰對齊采用的軟件為質(zhì)譜數(shù)據(jù)預(yù)處理軟件,具體包括化合物提取軟件: MasshunterQuanli tat ive Analysis (B04) (Agilent)和峰對齊軟件:Mass Profiler Professional(MPP,Agilent);
[0159] 峰提取及解卷積,使用分子特征提取(MoleculeFeatureExtraction,MFE)算法; 關(guān)鍵參數(shù)設(shè)置:峰高> = 500計數(shù),絕對峰高> = 6000,代謝物提取算法類型,小分子化合物 (色譜),離子種類包括:正離子,包括+H,+Na,+K,+NH4等,化合物電荷態(tài),1。
[0160] 峰對齊軟件Mass Profiler Professional(MPP,Agilent),所有代謝輪廓譜經(jīng)過 上述的MFE提取方法獲得所有檢測峰的列表,并導(dǎo)出成CEF文件,在MPP軟件中進行峰對齊, 形得到所有樣本的峰列表矩陣。
[0161] 2)五步質(zhì)譜峰過濾假陽性峰
[0162] (A)重現(xiàn)性檢查:選取峰列表矩陣中QC_mix樣本的6次檢測結(jié)果中峰出現(xiàn)頻率〉等 于80%的峰保留;過濾掉的峰可能為隨機出現(xiàn)的峰,或者測量不穩(wěn)定的峰。
[0163] (B)變異性檢查:選取經(jīng)(A)處理得到的峰中QC_mix樣本的6次檢測結(jié)果中峰變異 性RSD〈20%的峰保留;
[0164] (C)空白溶劑檢查:選取經(jīng)(B)處理得到的峰中B/S值小于5%的峰保留;
[0165] B/S值為溶劑空白樣本3次檢測結(jié)果峰面積平均值比QC_mix樣本6次檢測結(jié)果峰面 積平均值;
[0166] B/S值越低,說明背景含有的量越少;B/S〈l %或5%,低于一般的實驗誤差范圍內(nèi); B/S值越高,說明溶劑或儀器背景中含有相關(guān)離子,可能是非生物來源的質(zhì)譜信號。
[0167] (D)定量能力檢查:
[0168] 計算經(jīng)(C)處理得到的峰中 DS_l/8x,DS_l/4x,DS_l/2x,DS_lx,DS_2x,DS_4x 樣本 的峰面積與相對濃度指數(shù)的pearson相關(guān)系數(shù)r,選取0.7〈r〈0.99的峰保留,實現(xiàn)假陽性質(zhì) 譜峰的消除;
[0169] 給 DS_l/16x 樣本賦值相對濃度指數(shù) X 為 100,則 DS_l/8x,DS_l/4x,DS_l/2x,DS_lx, DS_2x,DS_4x樣本中的相對濃度指數(shù)分別為200,400,800,1600,3200;
[0170] 相對濃度指數(shù)(Relative Concentration Index,RCI),由于不知道每一個峰的絕 對濃度,但是所有的峰都具有相同的稀釋倍數(shù),假定所有的峰在DS樣本中具有相同的相對 濃度指數(shù)。
[0171] (E)手動檢查:將經(jīng)(D)處理得到的0.7〈r〈0.99的質(zhì)譜峰進行手動校正對齊積分錯 誤的數(shù)據(jù)點,實現(xiàn)消除假陽性質(zhì)譜峰。
[0172] 五步峰過濾規(guī)則過濾的效果圖見圖4,92.4%的假陽性質(zhì)譜信號被過濾。
[0173] 圖2是重疊的總離子流色譜圖,結(jié)合稀釋樣本和溶劑空白可以區(qū)分哪些質(zhì)譜峰是 非生物來源的峰,哪些質(zhì)譜峰具有較好或價差的定量能力。
[0174] 結(jié)果如下:
[0175] 1)所有的20種標準品均通過五步峰過濾規(guī)則,總共從1343個質(zhì)譜峰里面,保留下 來102個,過濾掉92.4%的假陽性質(zhì)譜峰。
[0176] 2)在102個被保留的質(zhì)譜峰里面,通過分子量和保留時間可以確定其中的53個來 源于20種標準品及其加合離子、裂解離子;其中的21個未知化合物,與標準品具有相似的濃 度比例,它們來源于標準品,因為標準品純度不可能到100%,可能為其中的雜質(zhì)成分;僅僅 13個未知峰不清楚其來源。
[0177] 4、建立回歸模型并計算12個人工模擬樣本的相對濃度指數(shù)
[0178] 將步驟3的E得到的過濾后質(zhì)譜峰的峰面積和其對應(yīng)的相對濃度指數(shù)建立回歸模 型;再將每個待測樣本的代謝產(chǎn)物的質(zhì)譜圖峰面積分別代入回歸模型進行校正和歸一化, 得到每個待測樣本的相對濃度指數(shù)。
[0179] 圖5所示部分回歸模型,是根據(jù)相對濃度指數(shù)和質(zhì)譜峰面積建立的幾種回歸模型 和校正方程。在過濾后的質(zhì)譜峰(保留下來的102個質(zhì)譜峰)中(圖4),72.0%的質(zhì)譜峰滿足 線性校正模型,21.8 %的峰滿足二項式模型,3.4%的符合對數(shù)模型,僅僅一個峰手動建立 復(fù)合模型,即在低濃度區(qū)符合線性模型,在高濃度區(qū)符合二項式模型。
[0180]再將保留下來的102個質(zhì)譜峰峰面積代入到各自建立的回歸模型進行校正,得到 相應(yīng)的相對濃度指數(shù)。
[0181] 實施例2、本發(fā)明的方法用于區(qū)分不同水稻品種的差異代謝產(chǎn)物
[0182] 以典型的indicia水稻栽培種9311和japonica水稻栽培種nipponbare水稻干籽粒 為例,比較本發(fā)明與傳統(tǒng)代謝組學方法的優(yōu)缺點。
[0183] -、本發(fā)明的方法和傳統(tǒng)代謝組學方法
[0184] A、本發(fā)明的方法如下:
[0185] 1、制備QC_mix樣本、溶劑空白樣本、不同稀釋倍數(shù)QC_mix樣本、不同濃縮倍數(shù)QC_ mix樣本、2個水稻品種代謝產(chǎn)物樣本
[0186] 待測樣本代謝產(chǎn)物樣本:9311和nipponbare水稻籽粒各10份,每份100mg,采用球 磨儀(Retsch Mixer Mill MM 400,VerderRetsch Trading Co.Ltd·,上海,中國)粉碎,米 用含有內(nèi)標為傘形酮內(nèi)酯(^11^1]^61'〇11,3丨81]^公司,貨號93979,濃度為211^/1]11^,2(^)的 色譜級甲醇進行超聲(20kHz)提取15min。然后在13,000rpm離心10min,獲得9311水稻10個 樣本和nipponbare水稻10個樣本的代謝提取物,為10個9311水稻代謝產(chǎn)物樣本和10個 nipponbare水稻代謝產(chǎn)物樣本。
[0187] 溶劑空白樣本由內(nèi)標傘形酮內(nèi)酯(umbel 1 iferon,濃度0.2mmol)和色譜級甲醇組 成。
[0188] QC_mix樣本:從9311水稻10個樣本和nipponbare水稻10個樣本分別取50ul體積混 合作為QC_mix(所有的生物樣本等量混合);
[0189] 不同稀釋倍數(shù)QC_mix樣本:將QC_mix用色譜級甲醇逐級稀釋2,4,8倍,得到稀釋2 倍QC_mix樣本、稀釋4倍QC_mix樣本、稀釋8倍QC_mix樣本;
[0190]不同濃縮倍數(shù)QC_mix樣本:將QC_mix采用冷凍離心濃縮(1500g)逐級濃縮2倍、4 倍,得到濃縮2倍QC_mix樣本、濃縮4倍QC_mix樣本。
[0191] 2、用液相質(zhì)譜聯(lián)用檢測各樣本
[0192] 分別色譜-質(zhì)譜聯(lián)用依次檢測如下各樣本:溶劑空白樣本(檢測3次至總離子流色 譜圖完全重疊,即儀器達到穩(wěn)定狀態(tài))、QC_mix樣本(檢測6次)、稀釋8倍QC_mix樣本(DS_1/ 8x)、稀釋4倍QC_mix樣本(DS_l/4x)、稀釋2倍QC_mix樣本(DS_l/2x)、濃縮2倍QC_mix樣本 (DS_2x)、濃縮4倍QC_mix樣本(DS_4x)、10個9311水稻代謝產(chǎn)物樣本和10個nipponbare水稻 代謝產(chǎn)物樣本,得到各樣本的代謝譜質(zhì)譜數(shù)據(jù);
[0193] 色譜-質(zhì)譜聯(lián)用的條件同實施例1。
[0194] 3、分析質(zhì)譜數(shù)據(jù)
[0195] 1)質(zhì)譜數(shù)據(jù)預(yù)處理:同實施例1;
[0196] 2)五步質(zhì)譜峰過濾:同實施例1;獲得消除假陽性的質(zhì)譜峰列表。結(jié)果見圖6, 71.4%的質(zhì)譜峰被過濾。
[0197] 4、建立回歸模型并計算9311水稻代謝產(chǎn)物樣本和nipponbare水稻代謝產(chǎn)物樣本 的相對濃度指數(shù)
[0198] 將步驟3的E得到的過濾后質(zhì)譜峰的峰面積和其對應(yīng)的相對濃度指數(shù)建立回歸模 型;再將每個9311水稻代謝產(chǎn)物樣本和每個nipponbare水稻代謝產(chǎn)物樣本的質(zhì)譜圖峰面積 分別代入回歸模型進行校正和歸一化,得到每個9311水稻代謝產(chǎn)物樣本相對濃度指數(shù)和每 個nipponbare水稻代謝產(chǎn)物樣本相對濃度指數(shù);
[0199] 5、對所有9311水稻代謝產(chǎn)物樣本相對濃度指數(shù)和所有nipponbare水稻代謝產(chǎn)物 樣本相對濃度指數(shù)進行多變量或單變量統(tǒng)計分析,找到9311水稻代謝產(chǎn)物樣本和 nipponbare水稻代謝產(chǎn)物樣本的差異代謝產(chǎn)物。
[0200] 本發(fā)明基于RCI而不是峰面積進行多變量分析,RCI已經(jīng)是歸一化的數(shù)據(jù),其數(shù)值 具有相同的尺度范圍,不需要對質(zhì)譜峰進行歸一化(normalization)處理。
[0201 ]直接通過RCI建立主成分分析(Principal component analysis,PCA),偏最小二 乘判別分析(Partial least squares regressiondiscrimination analysis,PLS_DA)或 正交偏最小二乘回歸分析(orthogonal projections to latent structures,0PLS)〇
[0202] 差異代謝物的標準必須滿足:
[0203] 1)代謝物在兩種水稻籽粒中含量的差別Fold Change>2或〈0.5
[0204] 2)t_test 檢驗的 p_value〈0 · 05
[0205] B、傳統(tǒng)代謝組學方法
[0206]分別色譜-質(zhì)譜聯(lián)檢測9311水稻代謝產(chǎn)物樣本和10個nipponbare水稻代謝產(chǎn)物, 獲得質(zhì)譜峰,不進行過濾直接用峰面積進行normal izat ion處理,然后進行多變量分析(De VosRCH etal.,Nat Protoc,2007,2:778-791)〇
[0207]二、本發(fā)明的方法和傳統(tǒng)代謝組學方法結(jié)果比對
[0208] 1、區(qū)分兩種水稻栽培種的主成分模型的解釋能力和預(yù)測能力不同
[0209]多變量統(tǒng)計分析結(jié)果如圖7,使用本發(fā)明獲得的PCA模型對數(shù)據(jù)的解釋百分比明顯 高于傳統(tǒng)方法,而且模型的預(yù)測能力也顯著高于傳統(tǒng)方法。
[0210] 2、本方法(右)與傳統(tǒng)代謝組學方法(左)在區(qū)分水稻籽粒主成分分析得分圖比較
[0211] 多變量統(tǒng)計分析結(jié)果如圖8所示,indicia水稻栽培種9311和japonica水稻栽培種 nipponbare水稻籽粒代謝物差別較大,無論是傳統(tǒng)方法還是本發(fā)明的方法,都能區(qū)分這兩 種水稻品種。但是新發(fā)明的PCA圖譜更加清楚地區(qū)分兩組實驗材料。
[0212] 3、本方法(下)與傳統(tǒng)代謝組學方法(上)在區(qū)分水稻籽粒主成分分析載荷圖比較
[0213] 多變量統(tǒng)計分析結(jié)果如圖9所示,S-plot顯示代謝物兩組樣本的差異代謝物,分布 在S-plot兩端的代謝物是在兩組間有明顯差異的物質(zhì)。本方法明顯消除S-plot中間部分的 代謝物,大大消除了假陽性的峰。
[0214] 4、比較本方法(左邊的圈)與傳統(tǒng)代謝組學(右邊的圈)篩選差異代謝物的能力
[0215] 多變量統(tǒng)計分析結(jié)果如圖10所示,通過相同的篩選標準,F(xiàn)old change>2或〈0.5, p-value〈0.5(t-test),傳統(tǒng)方法獲得575個差異代謝物,而新發(fā)明方法獲得135個差異的代 謝物,兩種方法篩選出共有的代謝物121種。本發(fā)明方法明顯減少假陽性的差異代謝物,大 大縮小候選差異代謝物的范圍。
[0216] 從上述可以看出,
[0217] (1)本發(fā)明與傳統(tǒng)方法相比,極大消除假陽性質(zhì)譜信號。
[0218] 在標準品組成的人工樣本中消除92.4%的假陽性質(zhì)譜信號,對生物樣本消除 71.4%的假陽性質(zhì)譜信號。
[0219] (2)本發(fā)明引入相對濃度指數(shù),建立回歸校正模型,提高定量分析能力,對水稻樣 本的主成分分析,明細提高了模型的解釋能力和預(yù)測能力。
[0220] (3)本發(fā)明極大減少了候選差異代謝物,為尋找真實的生物標志物提供基礎(chǔ)。
[0221] (4)本發(fā)明還能通過五步峰過濾規(guī)則,將非靶向代謝組學方法轉(zhuǎn)化為擬靶向代謝 組學方法,縮小擬檢測代謝物的范圍。
[0222] (5)本發(fā)明相對同位素標記,標準品建立的靶向方法而言,本發(fā)明簡單、低成本、高 效。
【主權(quán)項】
1. 一種區(qū)分多個待測樣本的差異代謝產(chǎn)物的方法,包括如下步驟: 1) 、制備QC_mix樣本、溶劑空白樣本、不同稀釋倍數(shù)QC_mix樣本、不同濃縮倍數(shù)QC_mix 樣本、多個待測樣本代謝產(chǎn)物樣本; 所述QC_mix樣本為將多個待測樣本的代謝產(chǎn)物溶液混勻,得到QC_mix樣本; 所述代謝產(chǎn)物溶液為由代謝產(chǎn)物和有機溶劑組成或用有機溶劑提取待測樣本的代謝 產(chǎn)物得到,作為待測樣本代謝產(chǎn)物樣本; 所述溶劑空白樣本由內(nèi)標和所述有機溶劑組成; 所述不同稀釋倍數(shù)QC_mix樣本為對所述QC_mix樣本進行逐級稀釋,得到的不同稀釋倍 數(shù)QC_mix樣本; 所述不同濃縮倍數(shù)QC_mix樣本為對所述QC_mix樣本進行逐級濃縮,得到的不同濃縮倍 數(shù)QC_mix樣本; 所述多個待測樣本代謝產(chǎn)物樣本為多個待測樣本的代謝產(chǎn)物溶液; 2) 、色譜-質(zhì)譜聯(lián)用依次檢測步驟1)獲得的各樣本,所述檢測包括如下步驟: (1) 對所述溶劑空白樣本進行大于等于3次檢測,得到溶劑空白樣本的大于等于3次的 原始質(zhì)譜數(shù)據(jù); (2) 對所述QC_mix樣本進行大于等于6次檢測,得到QC_mix樣本的大于等于6次的原始 質(zhì)譜數(shù)據(jù); (3) 對所述不同稀釋倍數(shù)QC_mix樣本和不同濃縮倍數(shù)QC_mix樣本按照濃度從小到大的 順序依次檢測1次,得到濃度從小到大排列的不同稀釋倍數(shù)QC_mix樣本和不同濃縮倍數(shù)QC_ mix樣本的原始質(zhì)譜數(shù)據(jù); (4) 對所述多個待測樣本代謝產(chǎn)物樣本分別進行1次檢測,得到多個待測樣本代謝產(chǎn)物 樣本的原始質(zhì)譜數(shù)據(jù); 3) 、對步驟2)得到的所有質(zhì)譜數(shù)據(jù)進行峰提取和峰對齊,得到所有樣本的峰列表矩陣; 再用如下(A)-(E)的五步質(zhì)譜峰過濾規(guī)則過濾所述峰列表矩陣中的假陽性峰,得到過濾后 質(zhì)譜峰: (A) 選取所述峰列表矩陣中QC_mix樣本的大于等于6次檢測結(jié)果中峰出現(xiàn)頻率大于等 于80 %的峰保留; (B) 選取經(jīng)(A)處理得到的峰中QC_mix樣本的大于等于6次檢測結(jié)果中峰變異性RSD小 于20 %的峰保留; (C) 選取經(jīng)(B)處理得到的峰中B/S值小于5%的峰保留; B/S值為溶劑空白樣本大于等于3次檢測結(jié)果峰面積平均值比QC_mix樣本大于等于6次 檢測結(jié)果峰面積平均值; (D) 計算經(jīng)(C)處理得到的峰中QC_mix不同稀釋倍數(shù)樣本和QC_mix不同濃縮倍數(shù)樣本 的峰面積與各樣本對應(yīng)的相對濃度指數(shù)的pearson相關(guān)系數(shù)r,選取0.7〈r〈0.99的峰保留; 所述QC_mix不同稀釋倍數(shù)樣本和QC_mix不同濃縮倍數(shù)樣本對應(yīng)的相對濃度指數(shù)按照 如下包括如下步驟的方法獲得:將所述QC_mix不同稀釋倍數(shù)樣本和所述QC_mix不同濃縮倍 數(shù)樣本中濃度最小的樣本賦予相對濃度指數(shù)為X,根據(jù)下面公式1計算其余濃度樣本的相對 濃度指數(shù)y,得到所有QCjnix不同稀釋倍數(shù)和QCjnix不同濃縮倍數(shù)的相對濃度指數(shù); 公式1:樣本相對濃度指數(shù)y=該樣本相對于濃度最小樣本的濃度倍數(shù)*X X為不為0的數(shù)值; (Ε)將經(jīng)(D)處理得到的0.7〈r〈0.99的質(zhì)譜峰進行手動校正對齊積分錯誤的數(shù)據(jù)點,實 現(xiàn)消除假陽性質(zhì)譜峰; 4) 、將步驟3)的E得到的所述過濾后質(zhì)譜峰的峰面積和其對應(yīng)的相對濃度指數(shù)建立回 歸模型;再將每個所述待測樣本的代謝產(chǎn)物的質(zhì)譜圖峰面積分別代入回歸模型進行校正和 歸一化,得到每個待測樣本的相對濃度指數(shù); 所述回歸模型包括線性回歸模型、二項式回歸模型、對數(shù)回歸模型、指數(shù)回歸模型和/ 或復(fù)合回歸模型; 5) 、對所有待測樣本的相對濃度指數(shù)進行多變量或單變量統(tǒng)計分析,找到多個待測樣 本的差異代謝產(chǎn)物。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于: 步驟2)中,所述色譜-質(zhì)譜聯(lián)用為GC-MS,LC-MS和CE-MS; 和/或,所述色譜-質(zhì)譜聯(lián)用具體為LC-MS; 步驟3)中,所述峰提取和峰對齊采用的軟件為質(zhì)譜預(yù)處理分析軟件, 和/或,所述質(zhì)譜預(yù)處理分析軟件具體為xcms或MasshunterQuanlitative Analysis; 步驟3)的E中,將經(jīng)(D)處理得到的0.9〈r〈0.99的質(zhì)譜峰進行手動校正對齊積分錯誤的 數(shù)據(jù)點。3. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于: 步驟1)中,所述待測樣本為生物來源樣本和/或非生物來源樣本; 所述生物來源樣本具體為植物、動物和/或微生物。4. 根據(jù)權(quán)利要求1-3中任一所述的方法,其特征在于: 步驟1)中,所述多個待測樣本個數(shù)大于等于2; 步驟2)中,所述QC_mix樣本為將多個待測樣本的代謝產(chǎn)物溶液等體積混勻得到; 所述稀釋采用的稀釋液為所述有機溶劑; 所述逐級稀釋為逐級稀釋至16-32倍; 所述逐級濃縮為逐級濃縮至2-4倍。5. -種代謝產(chǎn)物檢測中假陽性質(zhì)譜峰消除方法,包括如下步驟:為權(quán)利要求1-4中任一 方法中的步驟1)_3),實現(xiàn)假陽性質(zhì)譜峰消除。6. 權(quán)利要求1-3中任一所述的方法或權(quán)利要求5所述的方法在定量驗證不同樣本的代 謝產(chǎn)物中的應(yīng)用。7. 權(quán)利要求5所述的方法在區(qū)分樣本中假陽性質(zhì)譜峰信號中的應(yīng)用。
【文檔編號】G01N30/02GK106018600SQ201610346054
【公開日】2016年10月12日
【申請日】2016年5月23日
【發(fā)明人】漆小泉, 段禮新
【申請人】中國科學院植物研究所
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1