一種鑒別玉米單倍體的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種鑒別玉米單倍體的方法,特別涉及一種利用可見光漫透射光譜鑒 別玉米單倍體的方法。
【背景技術(shù)】
[0002] 目前,玉米遺傳研究及商業(yè)化育種中已廣泛采用單倍體技術(shù)(Doubled Haploid, 也稱DH技術(shù))以優(yōu)化資源配置、提高研究效率、增強(qiáng)自身競(jìng)爭(zhēng)力。采用傳統(tǒng)的育種方法選 育玉米自交系通常需要經(jīng)過6-10代才能獲得穩(wěn)定的自交系,時(shí)間跨度長(zhǎng),同時(shí)耗費(fèi)大量人 力物力。而DH技術(shù)中,將父本誘導(dǎo)系與育種材料雜交誘導(dǎo)得到F1籽粒,再將含有一定比率 (目前平均為8%左右)的單倍體籽粒從中挑選出來,再經(jīng)加倍技術(shù)處理,即可在一年內(nèi)得 到基因型完全純合的自交系,稱之為DH系。單倍體技術(shù)能夠大幅加快育種進(jìn)程,更加有利 于實(shí)現(xiàn)規(guī)?;⒐こ袒僮?。近年來,隨著DH育種技術(shù)的大規(guī)模應(yīng)用,面臨的一個(gè)重要問題 即是如何從大批量的誘導(dǎo)籽粒中高效地挑選出單倍體籽粒,更為重要的是可以實(shí)現(xiàn)自動(dòng)化 篩選的手段。目前主要有2種單倍體篩選方法:一是采用由誘導(dǎo)系攜帶的Rl-nj顯性花青 素顏色標(biāo)記系統(tǒng)進(jìn)行單倍體籽粒的人工挑選,凡是胚無紫色而胚乳糊粉層有紫色的籽粒均 是單倍體。同時(shí)也開發(fā)了基于顏色標(biāo)記的圖像和計(jì)算機(jī)視覺的自動(dòng)化鑒別單倍體的機(jī)器。 然而,Rl-nj基因受親本遺傳背景和環(huán)境的雙重影響,顏色表達(dá)有強(qiáng)有弱,因此不論是肉眼 還是圖像識(shí)別的儀器,都不能達(dá)到單倍體的高效篩選。二是利用高油型誘導(dǎo)系與育種材料 雜交,由于單倍體和非單倍體籽粒具有顯著的油分差異,通過測(cè)定雜交籽粒的油分值便可 區(qū)分出單倍體。該法必須采用專有的高油型誘導(dǎo)系,并且只能對(duì)非高油玉米育種材料進(jìn)行 誘導(dǎo),開發(fā)的核磁共振自動(dòng)化分選系統(tǒng)價(jià)格昂貴,這些都限制了該技術(shù)在育種過程中的普 及應(yīng)用。
[0003] Jones等應(yīng)用近紅外光譜鑒別玉米單倍體,但是該模型需對(duì)不同遺傳背景的單倍 體和雜交種單獨(dú)建模,已有模型無法識(shí)別未參與建模背景的籽粒。這在育種實(shí)踐工作中來 說,重新建模意味著增加了成本。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的是提供一種利用可見光漫透射光譜鑒別玉米單倍體的方法。
[0005] 首先,本發(fā)明提供了一種建立用于鑒別玉米單倍體籽粒和玉米雜交二倍體籽粒的 模型的方法,具體可包括如下步驟:以若干個(gè)玉米單倍體籽粒和玉米雜交二倍體籽粒(即 非單倍體玉米籽粒)作為模型訓(xùn)練樣本,采集所述模型訓(xùn)練樣本中每個(gè)玉米籽粒的可見光 漫透射光譜,對(duì)所采集的原始光譜數(shù)據(jù)進(jìn)行平滑、矢量歸一化預(yù)處理;將所得預(yù)處理數(shù)據(jù)進(jìn) 行主成分分析,然后基于支持向量機(jī)方法建立用于鑒別玉米單倍體籽粒和玉米雜交二倍體 籽粒的鑒別模型。
[0006] 其中,為了使模型具有代表性,所述模型訓(xùn)練樣本最好為不同遺傳背景,且最好每 個(gè)遺傳背景都既有玉米單倍體籽粒又有玉米雜交二倍體籽粒。
[0007] 在所述方法中,采集所述模型訓(xùn)練樣本中每個(gè)玉米籽粒的可見光漫透射光譜的過 程中,光譜范圍設(shè)定為400-780nm,共250個(gè)以上(如497個(gè))波長(zhǎng)采樣點(diǎn),積分時(shí)間設(shè)定為 60ms ;所述模型訓(xùn)練樣本中,每個(gè)玉米籽粒重復(fù)采集可見光漫透射光譜5次,結(jié)果以平均譜 表示。其中,所述250個(gè)以上(如497個(gè))波長(zhǎng)采樣點(diǎn)在400-780nm范圍內(nèi)均勻分布。
[0008] 在所述方法中,采集所述模型訓(xùn)練樣本中每個(gè)玉米籽粒的可見光漫透射光譜的過 程中,采用的光譜儀可為便攜式紫外-可見光纖光譜儀。
[0009] 在本發(fā)明的一個(gè)實(shí)施例中,所述光譜儀具體為QE65000便攜式紫外-可見光纖光 譜儀(Ocean Optics,USA)
[0010] 在所述方法中,采集所述模型訓(xùn)練樣本中每個(gè)玉米籽粒的可見光漫透射光譜的過 程中,在所述光譜儀的光源通光孔上覆蓋鋁箱,鋁箱開一小孔,玉米籽粒放置在所述小孔 上,胚面朝向光源。
[0011] 在所述方法中,對(duì)所述原始光譜數(shù)據(jù)進(jìn)行平滑、矢量歸一化預(yù)處理為:對(duì)所述原始 光譜數(shù)據(jù)進(jìn)行平滑去噪、矢量歸一化以去除光譜縱向平移,然后采用Kolmogorov-Smirnov 檢驗(yàn)檢測(cè)所述模型訓(xùn)練樣本中玉米單倍體籽粒和玉米雜交二倍體籽粒在每個(gè)所述波長(zhǎng)采 樣點(diǎn)處的吸光度數(shù)據(jù)的差異顯著性,剔除不存在顯著差異的所述波長(zhǎng)采樣點(diǎn)對(duì)應(yīng)的數(shù)據(jù), 剩余數(shù)據(jù)即為所述預(yù)處理數(shù)據(jù)。
[0012] 其中,所述"采用Kolmogorov-Smirnov檢驗(yàn)檢測(cè)所述模型訓(xùn)練樣本中玉米單倍體 籽粒和玉米雜交二倍體籽粒在每個(gè)所述波長(zhǎng)采樣點(diǎn)處的吸光度數(shù)據(jù)的差異顯著性"具體 為:根據(jù)如下判定所述模型訓(xùn)練樣本中玉米單倍體籽粒和玉米雜交二倍體籽粒在每個(gè)所述 波長(zhǎng)采樣點(diǎn)處的吸光度數(shù)據(jù)的差異顯著性:
[0013] K = max I Fl (X)-F2 (X)
[0014] 其中,F(xiàn)l(X)和F2(x)分別為波長(zhǎng)采樣點(diǎn)處兩組樣本吸光度的累積分布函數(shù);K值 為Fl (X)和F2 (X)差值的最大值;若K值對(duì)應(yīng)的p值〈0. 05,則認(rèn)為所述波長(zhǎng)采樣點(diǎn)處的所 述模型訓(xùn)練樣本中玉米單倍體籽粒和玉米雜交二倍體籽粒吸光度數(shù)據(jù)存在顯著差異。
[0015] 在所述方法中,將所述預(yù)處理數(shù)據(jù)進(jìn)行主成分分析,然后基于支持向量機(jī)方法建 立用于鑒別玉米單倍體籽粒和玉米雜交二倍體籽粒的鑒別模型,為:
[0016] (al)將所述預(yù)處理數(shù)據(jù)進(jìn)行主成分分析,得到一組特征向量;
[0017] (a2)采用基于支持向量機(jī)方法建立用于鑒別玉米單倍體籽粒和玉米雜交二倍體 籽粒的分類函數(shù):
[0018] 分類函數(shù)的形式如下:
[0020] 其中,X為待測(cè)玉米籽粒的特征向量;Xi (i = 1,2,…η)為模型訓(xùn)練樣本的特征向 量,即步驟(al)中所述的一組特征向量;71為模型訓(xùn)練樣本的標(biāo)簽(玉米單倍體籽粒和玉 米雜交二倍體籽粒為不同的類別,如用1代表玉米單倍體籽粒,-1代表玉米雜交二倍體籽 粒,則用1或者-1標(biāo)記不同類別的訓(xùn)練樣本,得到類似[1 1 1 1 1 1 -1 -1 -1 -1 -1]的 向量,即為模型訓(xùn)練樣本的標(biāo)簽);A為拉格朗日乘子;b為常量;
[0021] k (Xl,X)為核函數(shù),選用RBF核函數(shù),具體形式如下:
[0023] 在本發(fā)明中,采用Matlab (The Mathworks,USA)平臺(tái)編寫如上計(jì)算程序,基于OSU SVMs Toolbox (version 3. 0)編寫SVM源程序;程序輸入?yún)?shù)為:核函數(shù)類型,γ和c。
[0024] 經(jīng)過訓(xùn)練,確定訓(xùn)練SVM模型的輸入模型參數(shù)為:采用RBF核函數(shù),γ值為1,c值 為150 ;即可自動(dòng)訓(xùn)練出判別函數(shù)f (X),灸和b的值。
[0025] 采用不同的訓(xùn)練樣本時(shí),確定的分類函數(shù)f(x)使得玉米單倍體籽粒和雜交二倍 體籽粒樣本差異最大,取玉米單倍體籽粒和玉米雜交二倍體籽粒差異最大時(shí)的兩和13值。在 本發(fā)明中,6V = I,b = 0。
[0026] 基于上述模型構(gòu)建方法,本發(fā)明所提供了利用可見光漫透射光譜鑒別玉米單倍體 的方法,具體可包括如下步驟:
[0027] (1)采用上述方法構(gòu)建用于鑒別玉米單倍體籽粒和玉米雜交二倍體籽粒的模型。
[0028] (2)利用步驟(1)建立的鑒別模型鑒別待測(cè)玉米籽粒是否為單倍體。
[0029] 在所述方法的步驟(2)中,按照包括如下步驟的方法鑒別所述待測(cè)玉米籽粒是否 為單倍體:
[0030] (bl)采用與所述步驟(1)相同的方法采集所述待測(cè)玉米籽粒的可見光漫透射光 譜,對(duì)所采集的原始光譜數(shù)據(jù)進(jìn)行平滑、矢量歸一化預(yù)處理和主成分分析,獲得所述待測(cè)玉 米籽粒的特征向量;
[0031] (b2)將所述待測(cè)玉米籽粒的特征向量代入所述分類函數(shù)中,根據(jù)f(x)的符號(hào)按 照如下確定所述待測(cè)玉米籽粒是否為單倍體:若f (X) >0,則所述待測(cè)玉米籽粒為或候選為 單倍體籽粒;若f (X)〈〇,則所述待測(cè)玉米籽粒為或候選為雜交二倍體籽粒。
[0032] 本發(fā)明的另一個(gè)目的是提供一種用于鑒別玉米單倍體的系統(tǒng)。
[0033] 本發(fā)明所提供的用于鑒別玉米單倍體的系統(tǒng),包括光譜儀、積分球和數(shù)據(jù)處理裝 置;
[0034] 所述光譜儀為具有采集可見光漫透射光譜功能的光譜儀;
[0035] 所述數(shù)據(jù)處理裝置具有如下功能:(a)對(duì)所述光譜儀采集的可見