專利名稱:一種提高作物核心種質(zhì)取樣比例精確度的方法
技術(shù)領(lǐng)域:
本發(fā)明屬于作物遺傳育種中的種質(zhì)資源研究領(lǐng)域,具體涉及一種提高作物核心種質(zhì)取樣比例精確度的方法。
背景技術(shù):
豐富的種質(zhì)資源是進行作物遺傳育種工作的前提,至21世紀初已有數(shù)百萬計的各類遺傳資源被保存起來世界各國的種質(zhì)資源庫中。然而,隨著種質(zhì)資源的不斷搜集和新 種質(zhì)的不斷創(chuàng)新,越來越大的種質(zhì)庫規(guī)模給保存、評價、研究和利用植物遺傳資源帶來了眾多困難。核心種質(zhì)(core collection)是解決這一問題的有效手段。核心種質(zhì)是采用科學方法,從整個種質(zhì)資源群體中選擇一部分樣本,以最小的種質(zhì)資源數(shù)量,最大限度的代表整個群體的遺傳多樣性。種質(zhì)資源管理者和育種者可以對核心種質(zhì)進行優(yōu)先保存和評價,從而使有限的資金保存整個物種的遺傳多樣性成為可能。更為重要的是,核心種質(zhì)能夠在保持遺傳多樣性的前提下極大縮減種質(zhì)資源群體的規(guī)模,從而顯著降低冗余基因密度和增加有利基因及稀有基因密度,使育種者挖掘出優(yōu)良親本的可能性大大增加。核心種質(zhì)作為種質(zhì)資源研究的新領(lǐng)域在20世紀80年代一經(jīng)提出便受到了世界各國的廣泛重視。眾多研究主要集中在核心種質(zhì)的構(gòu)建方法和核心種質(zhì)代表性評價上,對于核心種質(zhì)取樣比例的確定研究較少。絕大多數(shù)核心種質(zhì)均是采用硬性規(guī)定取樣百分比的做法,如10%、30%等,這種做法顯然缺乏科學嚴謹性。并且隨著種質(zhì)資源庫的運作,核心種質(zhì)樣品經(jīng)常要保持變化,固定的取樣比例無法滿足核心種質(zhì)最大限度保持遺傳多樣性這一最重要的前提。因此,如何適應(yīng)種質(zhì)資源庫的動態(tài)變化確定精確的取樣比例,是當前核心種質(zhì)研究中亟待解決的問題。
發(fā)明內(nèi)容
針對上述現(xiàn)有技術(shù)存在的問題,本發(fā)明提供一種基于計算機模擬的提高作物核心種質(zhì)取樣比例精確度的方法。為實現(xiàn)上述目的,本發(fā)明通過以下技術(shù)方案實現(xiàn)。一種提高作物核心種質(zhì)取樣比例精確度的方法,包括以下步驟
(I)根據(jù)實際需要設(shè)置取樣比例的精確度和核心種質(zhì)的預(yù)期代表性。(2)用計算機從初始取樣比例開始模擬構(gòu)建核心種質(zhì),計算核心種質(zhì)代表性評價參數(shù)。(3)取樣比例按步驟(I)設(shè)置的精確度依次累加至設(shè)定的最大取樣比例,每次均構(gòu)建核心種質(zhì)和計算相應(yīng)的代表性評價參數(shù)。(4)將所有代表性評價參數(shù)按計算先后順序排列成數(shù)列,采用最小二乘法進行曲線擬合,獲得代表性評價參數(shù)隨取樣比例逐漸增大的函數(shù)公式。(5)根據(jù)核心種質(zhì)需要達到的代表性標準,將代表性評價參數(shù)的值帶入步驟(4)的公式中求得需要的取樣比例。其中,步驟(I)中取樣比例的精確度可根據(jù)群體規(guī)模和實際需要設(shè)置。對于規(guī)模較小的種質(zhì)資源群體(個體數(shù)小于200),精確度不宜設(shè)置過高,否則相鄰取樣比例構(gòu)建的核心種質(zhì)規(guī)模無差別,因此可設(shè)精確度為1% 2%。對于規(guī)模較大的種質(zhì)資源群體,可根據(jù)實際需要設(shè)置更高的精確度,個體數(shù)大于1000的群體,可設(shè)精確度為O. 1% O. 2%,個體數(shù)大于10000的群體,可設(shè)精確度為O. 01% O. 02%。其中,核心種質(zhì)的預(yù)期代表性可根據(jù)公認的評價標準采用常用的代表性評價參數(shù) 進行設(shè)置,如設(shè)均值差異百分率、極差符合率等。其中,步驟(2 )的初始取樣比例參照國際通行的核心種質(zhì)取樣比例最小值,通常設(shè)為1% 5%。小于1%取樣比例構(gòu)建的核心種質(zhì)為微核心種質(zhì),其構(gòu)建和評價方法與本發(fā)明中的核心種質(zhì)有所區(qū)別。其中,步驟(3)的最大取樣比例通常設(shè)為30% 40%,不宜太大,否則樣本太大,不符合核心種質(zhì)的基本要求,
本發(fā)明與現(xiàn)有技術(shù)相比具有以下優(yōu)點
(I)本發(fā)明基于計算機模擬和曲線擬合,能夠精確得到任意代表性的核心種質(zhì)取樣比例,避免了盲目性的同時大大提高了精確度。(2)本發(fā)明以核心種質(zhì)代表性為判定閾值,避免了種質(zhì)資源動態(tài)變化對核心種質(zhì)的影響。
具體實施例方式下面給出本發(fā)明的較佳的實施例,這些實施例并非限制本發(fā)明的內(nèi)容。
實施例I
北方春大豆地方品種群體有190份遺傳資源樣品,包含生育日數(shù)、株高、粗蛋白、粗脂肪、硬脂酸、軟脂酸、油酸、亞油酸和亞麻酸共9個數(shù)量性狀數(shù)據(jù)(在中國作物種質(zhì)信息網(wǎng)http: //icgr. caas. net. cn/, “種質(zhì)數(shù)據(jù)查詢”模塊中,選擇“大豆”,然后規(guī)定查詢條件即可得到所需數(shù)據(jù)),匯總為表I。根據(jù)實際需要設(shè)置核心種質(zhì)取樣比例的精確度為1%,初始取樣比例為3%,最大取樣比例為35%,預(yù)期代表性為極差符合率>=90%。取樣比例從3%增大到35%,每次增加1%,共進行33次計算機模擬核心種質(zhì),計算出33個不同的極差符合率值。將33個極差符合率值按計算先后順序排列成數(shù)列,采用最小二乘法進行曲線擬合,獲得極差符合率隨取樣比例逐漸增大的函數(shù)公式為Y = 5. 9ILn (X) + 78.70,其中X表示取樣比例,Y表示極差符合率。方程決定系數(shù)為O. 9254,表明該公式是較為可靠的。將極差符合率=90%的值帶入該公式,將結(jié)果四舍五入求得取樣比例為7%,此為所需的取樣比例。
表I北方春大豆地方品種群體數(shù)據(jù)
權(quán)利要求
1.一種提高作物核心種質(zhì)取樣比例精確度的方法,包括以下步驟 (1)根據(jù)實際需要設(shè)置取樣比例的精確度和核心種質(zhì)的預(yù)期代表性; (2)用計算機從初始取樣比例開始模擬構(gòu)建核心種質(zhì),計算核心種質(zhì)代表性評價參數(shù); (3)取樣比例按步驟(I)設(shè)置的精確度依次累加至設(shè)定的最大取樣比例,每次均構(gòu)建核心種質(zhì)和計算相應(yīng)的代表性評價參數(shù); (4)將所有代表性評價參數(shù)按計算先后順序排列成數(shù)列,采用最小二乘法進行曲線擬合,獲得代表性評價參數(shù)隨取樣比例逐漸增大的函數(shù)公式; (5)根據(jù)核心種質(zhì)需要達到的代表性標準,將代表性評價參數(shù)的值帶入步驟(4)的公式中求得需要的取樣比例。
2.如權(quán)利要求I所述的方法,其特征在于,步驟(I)中若核心種質(zhì)群體的個體數(shù)小于200,則取樣比例的精確度設(shè)為1%-2% ;個體數(shù)大于1000的群體,可設(shè)精確度為O. 1%-0. 2% ;個體數(shù)大于10000的群體,可設(shè)精確度為O. 01%-0. 02%。
3.如權(quán)利要求2所述的方法,其特征在于,步驟(I)中若核心種質(zhì)群體的個體數(shù)小于200,則取樣比例的精確度優(yōu)選設(shè)為1%。
4.如權(quán)利要求I所述的方法,其特征在于,步驟(I)中核心種質(zhì)的預(yù)期代表性可根據(jù)公認的評價標準采用常用的代表性評價參數(shù)進行設(shè)置,如設(shè)均值差異百分率、極差符合率中的一種。
5.如權(quán)利要求I所述的方法,其特征在于,步驟(2)的初始取樣比例參照國際通行的核心種質(zhì)取樣比例最小值,其范圍為1% 5%。
6.如權(quán)利要求5所述的方法,其特征在于,步驟(2)的初始取樣比例參照國際通行的核心種質(zhì)取樣比例最小值優(yōu)選2%或3%。
7.如權(quán)利要求I所述的方法,其特征在于,步驟(3)的最大取樣比例范圍設(shè)為30% 40%。
8.如權(quán)利要求7所述的方法,其特征在于,步驟(3)的最大取樣比例優(yōu)選35%。
全文摘要
本發(fā)明提供一種提高作物核心種質(zhì)取樣比例精確度的方法,包括設(shè)置取樣比例的精確度和核心種質(zhì)的預(yù)期代表性;從初始取樣比例開始模擬構(gòu)建核心種質(zhì),計算核心種質(zhì)代表性評價參數(shù);取樣比例按設(shè)置的精確度依次累加至設(shè)定的最大取樣比例,每次均構(gòu)建核心種質(zhì)和計算相應(yīng)的代表性評價參數(shù);將所有代表性評價參數(shù)排列成數(shù)列,采用最小二乘法進行曲線擬合,獲得函數(shù)公式;根據(jù)核心種質(zhì)需要達到的代表性標準,將代表性評價參數(shù)的值帶入公式中求得需要的取樣比例。本發(fā)明與現(xiàn)有技術(shù)相比具有以下優(yōu)點基于計算機模擬和曲線擬合,能夠得到任意代表性的核心種質(zhì)取樣比例,避免了盲目性的同時大大提高了精確度,也避免種質(zhì)資源動態(tài)變化對核心種質(zhì)的影響。
文檔編號G06F19/24GK102915408SQ20121034118
公開日2013年2月6日 申請日期2012年9月16日 優(yōu)先權(quán)日2012年9月16日
發(fā)明者胡晉, 王建成, 關(guān)亞靜 申請人:浙江大學