一種基于混合線性模型的種子數(shù)量性狀位點(diǎn)定位方法
【專利摘要】本發(fā)明公開了一種基于混合線性模型的種子數(shù)量性狀位點(diǎn)定位方法,包括:建立統(tǒng)計(jì)遺傳模型;在全基因組范圍內(nèi)搜索所有可能存在QTL的候選標(biāo)記區(qū)間:將所述的候選標(biāo)記區(qū)間作為協(xié)變量,在全基因組范圍內(nèi)搜索顯著的QTL位點(diǎn)和二互作標(biāo)記區(qū)間;以所述的QTL位點(diǎn)和二互作標(biāo)記區(qū)間作為協(xié)變量,在顯著的互作標(biāo)記區(qū)間內(nèi)搜索顯著的二互作上位性的位點(diǎn);通過(guò)所述QTL位點(diǎn)和二互作上位性的位點(diǎn),獲得統(tǒng)計(jì)遺傳模型中各種效應(yīng)的系數(shù),然后通過(guò)統(tǒng)計(jì)遺傳模型,計(jì)算這些位點(diǎn)的效應(yīng)以及估算每個(gè)位點(diǎn)的遺傳率。本發(fā)明將種子性狀分成二倍體種子和三倍體種子,考慮了上位性效應(yīng)及基因與環(huán)境互作的效應(yīng),可快速無(wú)偏的估計(jì)種子數(shù)量性狀位點(diǎn)的位置及各種效應(yīng)。
【專利說(shuō)明】一種基于混合線性模型的種子數(shù)量性狀位點(diǎn)定位方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及種子數(shù)量性狀位點(diǎn)定位領(lǐng)域,具體涉及一種基于混合線性模型種子數(shù)量性狀位點(diǎn)定位方法。
技術(shù)背景
[0002]作物種子是人類食物,動(dòng)物飼料以及工業(yè)原料的主要來(lái)源。胚或胚乳是種子中的主要成分。胚乳作為儲(chǔ)藏營(yíng)養(yǎng)物質(zhì)的主要器官,比如碳水化合物,蛋白質(zhì)和礦物質(zhì)等,它同時(shí)也會(huì)胚的發(fā)育提供營(yíng)養(yǎng)。胚乳在有些物種成熟時(shí)會(huì)消失,比如擬南芥。無(wú)論胚乳消失與否,它都將會(huì)對(duì)胚的發(fā)育產(chǎn)生影響。此外,種子是長(zhǎng)在母體植株中,因此母體植株對(duì)種子的發(fā)育也會(huì)產(chǎn)生影響。種子數(shù)量性狀位點(diǎn)定位的研究已經(jīng)成為數(shù)量遺傳領(lǐng)域的研究熱點(diǎn)之
一 O
[0003]近年來(lái),種子數(shù)量性狀位點(diǎn)的定位尤其是對(duì)農(nóng)作物品質(zhì)性狀的研究方面的應(yīng)用十分廣泛。
[0004]早在1994年,莫惠棟(Mo HD.Genetic analysis for qualitative-quantitativetraits II1.Endosperm character under triploid genetic control.Acta agronomicaSinica,1994,20 (5):513-519)提出了一個(gè)統(tǒng)計(jì)遺傳模型,可以把種子性狀的表型方差分解為各種各樣的遺傳和環(huán)境因子。1994年,朱軍和Bruce Weir (Zhu J, Weir.BSAnalysisof Cytoplasmic and Maternal Effects.2.Genetic Models for Triploid Endosperms.Theor Appl Genet,1994,89 (2-3): 160-166)進(jìn)一步提出了混合線性模型方法,利用雙列雜交試驗(yàn)分析了母體效應(yīng),胚,胚乳和細(xì)胞質(zhì)效應(yīng),以及各種效應(yīng)與環(huán)境的互作。以上這些方法都只能把種子性狀的遺傳變異分解為各種各樣的方差分量,把控制性狀的所有基因當(dāng)做一個(gè)整體來(lái)分析,而不能得到單個(gè)基因水平上的更詳細(xì)的信息,比如數(shù)量性狀位點(diǎn)的位置以及存在的各種效應(yīng)。
[0005]隨著分子標(biāo)記技術(shù)的發(fā)展,數(shù)量性狀位點(diǎn)定位的方法被提出和運(yùn)用到作物種子性狀的定位研究中。但是種子中的主要成分胚乳是三倍體,因此不能用一般的定位方法。基于這個(gè)遺傳背景,Kao (Kao CH.Multiple-1nterval Mapping for Quantitative Trait LociControlling Endosperm Traits.Genetics, 2004, 167 (4): 1987-2002)在 2004 年提出運(yùn)用多區(qū)間作圖方法,同時(shí)充分考慮到三倍體胚乳的性質(zhì)。這種方法可以分析胚乳的各種效應(yīng)。然而,種子一個(gè)很重要的特征是,它長(zhǎng)在母體植株上,因此種子的發(fā)育也會(huì)受到母體植株的影響。鑒于此,Hu 和 Xu(Hu ZQ, Xu Cff.A New Statistical Method for Mapping QTLsunderlying Endosperm Traits.Chinese Sci Bull, 2005, 50 (14): 1470-1476)提出了一個(gè)統(tǒng)計(jì)遺傳模型,他們把母體基因組和后代基因組整合在同一個(gè)模型中,使模型更加接近種子性狀發(fā)育的遺傳機(jī)制。
[0006]據(jù)我們所知,上位性,即一個(gè)基因的表達(dá)依賴于另外一個(gè)基因,在數(shù)量性狀的發(fā)育和進(jìn)化中起著重要的作用。大量的研究已經(jīng)表明,上位性對(duì)性狀的遺傳變異也產(chǎn)生了不可忽略的貢獻(xiàn)。通常所說(shuō)的上位性,指的是來(lái)自同一基因組的兩個(gè)基因之間的互作;然而在種子性狀中,存在著兩個(gè)不同的基因組,因此上位性的兩個(gè)基因可能是來(lái)自不同的基因組。隨著人們對(duì)上位性的重要性的深入了解,大量的遺傳模型已經(jīng)被提出來(lái)。在種子性狀的研究中,Cui (Cui Y, Wu R.Mapping Genome-genome Epistasis: A High-dimensional Model.Bioinformatics, 2005, 21 (10):2447-2455)提出了一種統(tǒng)計(jì)方法和框架去探索母體和后代的基因組之間的互作關(guān)系。
[0007]然而,迄今為止,尚未見(jiàn)有報(bào)道環(huán)境效應(yīng)以及基因與環(huán)境的互作效應(yīng),也沒(méi)有把上位性和基因與環(huán)境互作效應(yīng)整合在一個(gè)模型中的方法。
【發(fā)明內(nèi)容】
[0008]本發(fā)明提供了一種基于混合線性模型種子數(shù)量性狀位點(diǎn)定位方法,充分考慮到種子性狀的遺傳機(jī)制,把種子性狀分成主要以胚控制的二倍體種子和主要以胚乳控制的三倍體種子。在本發(fā)明中,把母體基因組和后代基因組整合在同一個(gè)遺傳模型中,同時(shí)把同一基因組和不同基因組之間的上位性效應(yīng)以及基因與環(huán)境互作的效應(yīng)加入到模型中,能夠快速無(wú)偏的估計(jì)種子數(shù)量性狀位點(diǎn)的位置以及各種效應(yīng),提高了育種學(xué)家進(jìn)行分子輔助育種的效率和精確性。
[0009]一種基于混合線性模型的三倍體種子數(shù)量性狀位點(diǎn)定位方法,包括:
[0010]( 1)統(tǒng)計(jì)遺傳模型的建立:
[0011]對(duì)一衍生于兩個(gè)純合親本(Pl,P2)的交配作圖群體,假設(shè)在t個(gè)不同的環(huán)境下進(jìn)行遺傳實(shí)驗(yàn),每個(gè)環(huán)境設(shè)置b個(gè)區(qū)組,某一種子數(shù)量性狀的變異受s個(gè)QTL (Ql,Q2,……,Qs)和t個(gè)上位性的調(diào)控,則環(huán)境h中第j個(gè)區(qū)組內(nèi)第i個(gè)株系后代種子性狀表型觀測(cè)值(yhiJ)可用下面的混合線性模型(I)表示:
【權(quán)利要求】
1.一種基于混合線性模型的三倍體種子數(shù)量性狀位點(diǎn)定位方法,其特征在于,包括: (1)統(tǒng)計(jì)遺傳模型的建立: 對(duì)一衍生于兩個(gè)純合親本(Pl,P2)的交配作圖群體,假設(shè)在t個(gè)不同的環(huán)境下進(jìn)行遺傳實(shí)驗(yàn),每個(gè)環(huán)境設(shè)置b個(gè)區(qū)組,某一種子數(shù)量性狀的變異受s個(gè)QTL (Q1,Q2,……,Qs)和t個(gè)上位性的調(diào)控,則環(huán)境h中第j個(gè)區(qū)組內(nèi)第i個(gè)株系后代種子性狀表型觀測(cè)值(yhij)可用下面的混合線性模型(I)表示:
2.如權(quán)利要求1所述的基于混合線性模型的三倍體種子數(shù)量性狀位點(diǎn)定位方法,其特征在于,步驟(6)中,通過(guò)模型(1),計(jì)算得到這些位點(diǎn)的效應(yīng)以及估算每個(gè)位點(diǎn)的遺傳率時(shí),首先給每個(gè)未知的參數(shù)一個(gè)初始值,隨機(jī)效應(yīng)的方差估計(jì)通過(guò)最小范數(shù)二階無(wú)偏估計(jì)法獲得,固定效應(yīng)的估計(jì)通過(guò)最小二乘法獲得,隨機(jī)效應(yīng)通過(guò)調(diào)整的無(wú)偏預(yù)測(cè)法預(yù)測(cè),然后把這些得到的值作為后驗(yàn)值通過(guò)吉布斯抽樣放入馬爾科夫鏈蒙特卡洛循環(huán)鏈中,通過(guò)歸納吉布斯的所有樣本的結(jié)果,最終得到每個(gè)效應(yīng)的估計(jì)值以及估算每個(gè)位點(diǎn)的遺傳率。
3.一種基于混合線性模型的二倍體種子數(shù)量性狀位點(diǎn)定位方法,其特征在于,包括: (I)統(tǒng)計(jì)遺傳模型的建立 對(duì)一衍生于兩個(gè)純合親本(Pl,P2)的交配作圖群體,假設(shè)在t個(gè)不同的環(huán)境下進(jìn)行遺傳實(shí)驗(yàn),每個(gè)環(huán)境設(shè)置b個(gè)區(qū)組,某一種子數(shù)量性狀的變異受s個(gè)QTL (Q1,Q2,……,Qs)和t個(gè)上位性的調(diào)控,則環(huán)境h中第j個(gè)區(qū)組內(nèi)第i個(gè)株系后代種子性狀表型觀測(cè)值(yhij)可用下面的混合線性模型表示:
4.如權(quán)利要求3所述的基于混合線性模型的二倍體種子數(shù)量性狀位點(diǎn)定位方法,其特征在于,步驟(6)中,通過(guò)模型(6),計(jì)算得到這些位點(diǎn)的效應(yīng)以及估算每個(gè)位點(diǎn)的遺傳率時(shí),首先給每個(gè)未知的參數(shù)一個(gè)初始值,隨機(jī)效應(yīng)的方差估計(jì)通過(guò)最小范數(shù)二階無(wú)偏估計(jì)法獲得,固定效應(yīng)的估計(jì)通過(guò)最小二乘法獲得,隨機(jī)效應(yīng)通過(guò)調(diào)整的無(wú)偏預(yù)測(cè)法預(yù)測(cè),然后把這些得到的值作為后驗(yàn)值通過(guò)吉布斯抽樣放入馬爾科夫鏈蒙特卡洛循環(huán)鏈中,通過(guò)歸納吉布斯的所有樣本的結(jié)果,最終得到每個(gè)效應(yīng)的估計(jì)值以及估算每個(gè)位點(diǎn)的遺傳率。
【文檔編號(hào)】G06F19/12GK103632067SQ201310549029
【公開日】2014年3月12日 申請(qǐng)日期:2013年11月7日 優(yōu)先權(quán)日:2013年11月7日
【發(fā)明者】徐海明, 祁婷, 曹玉杰, 祝水金, 樓向陽(yáng) 申請(qǐng)人:浙江大學(xué)