專利名稱:基于mcmc的小麥品種特征參數(shù)估算方法
技術(shù)領(lǐng)域:
本發(fā)明屬于精準(zhǔn)農(nóng)業(yè)中小麥品種特征定量評(píng)價(jià)領(lǐng)域,涉及小麥品種特征參數(shù)估算方法,具體涉及融合了馬爾可夫鏈蒙特卡洛方法(Markov Chain Monte Carlo, MCMC)的小麥品種特征參數(shù)估計(jì)方法。
背景技術(shù):
隨著農(nóng)業(yè)技術(shù)的發(fā)展進(jìn)步,新的小麥品種不斷出現(xiàn),科學(xué)家通過對(duì)不同品種的生理生態(tài)特性研究,提出了不少可以量化作物品種特性的參數(shù),如株高、千粒重、生理春化天數(shù)、灌漿時(shí)間、發(fā)生分蘗的能力等,這些參數(shù)被稱為作物品種特征參數(shù),它主要反映作物基因型特征。近半個(gè)多世紀(jì)以來,國(guó)際上出現(xiàn)了不少作物生長(zhǎng)模型,如美國(guó)的CERES模型、菲律賓國(guó)際水稻所的ORYZA模型、澳大利亞的APSIM模型、中國(guó)的WheatGrow模型等,它們通過解析“氣象_ 土壤_技術(shù)措施”與作物生理生態(tài)過程的機(jī)理關(guān)系,對(duì)作物的生長(zhǎng)發(fā)育過程進(jìn)行定量的表達(dá),將反映基因型差異的作物品種特征參數(shù)融入到具體作物生長(zhǎng)發(fā)育過程當(dāng)中,再結(jié)合環(huán)境因子作為輸入變量,達(dá)到對(duì)作物生長(zhǎng)發(fā)育過程的動(dòng)態(tài)模擬。科學(xué)家在廣泛利用模型進(jìn)行作物生長(zhǎng)預(yù)測(cè)的同時(shí),也在考慮如何逆向地利用作物生長(zhǎng)模型進(jìn)行品種特征參數(shù)的反演,以定量評(píng)估作物的品種特性,從而指導(dǎo)作物育種。He等利用GLUE方法和 CERES-Maize來反演玉米的品種特征參數(shù),金之慶等利用“試錯(cuò)法”和CERES-wheat來反演小麥品種特征參數(shù)。但這些方法都存在反演效率低且無法搜尋到全局最優(yōu)變量等缺點(diǎn)。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述缺陷,將MCMC方法和小麥生長(zhǎng)模型(WheatGrow)相結(jié)合,通過構(gòu)建生育期和產(chǎn)量的目標(biāo)函數(shù),提出一種小麥品種特征參數(shù)估算方法,為定量研究小麥品種特性提供了一種新的途徑。本發(fā)明選用了馬爾可夫鏈蒙特卡洛(Markov Chain Monte Carlo, MCMC)方法,其最早被廣泛應(yīng)用于圖像處理、統(tǒng)計(jì)物理學(xué)領(lǐng)域。近年來,隨著計(jì)算機(jī)技術(shù)的迅猛發(fā)展,MCMC 方法在根系水分吸收模型、農(nóng)業(yè)生態(tài)模型等諸多復(fù)雜模型中得到了廣泛應(yīng)用。該方法是基于貝葉斯理論框架,首先建立平衡分布為η (χ)的馬爾可夫鏈,并對(duì)其平衡分布進(jìn)行采樣, 然后通過不斷更新樣本信息而使馬爾可夫鏈能充分搜索模型參數(shù)空間,最終收斂于高概率密度區(qū);該方法能將一些復(fù)雜的高維問題轉(zhuǎn)化為一系列簡(jiǎn)單的低維問題,因此適用于復(fù)雜模型的貝葉斯計(jì)算。同時(shí)本發(fā)明選用了國(guó)內(nèi)建立并具有較好廣適性的WheatGrow生長(zhǎng)模型,該模型涉及到9個(gè)小麥品種特征參數(shù),分別是春化天數(shù)(VD)、光周期敏感因子(PS)、基本早熟因子(IE)、溫度敏感因子(TS)、灌漿期因子(FD)、葉熱間距(LT)、比葉面積(SLA)、收獲指數(shù)(HI)、小麥分蘗能力(TA)。其中,春化天數(shù)(VD)反映了小麥品種必須經(jīng)歷一定天數(shù)的春化,才能進(jìn)行花芽分化,極冬性的小麥品種為60,極春性的小麥品種為O。光周期敏感因子(PS),該參數(shù)反應(yīng)了小麥能否開花受到的日照長(zhǎng)短的影響,用光周期敏感因子反映不同品種對(duì)日照長(zhǎng)度的敏感性不同。基本早熟因子(IE),小麥出苗后,即使?jié)M足了溫光條件,也不會(huì)進(jìn)行花芽分化,這段時(shí)間進(jìn)行營(yíng)養(yǎng)生長(zhǎng),不同品種表現(xiàn)不同,用基本早熟因子反映該生育階段的差異。溫度敏感因子(TS),反映了小麥發(fā)育受溫度高低影響的程度。灌漿期因子(FD),反映了小麥開花以后不同品種灌漿時(shí)間的長(zhǎng)短不同。葉熱間距(LT),反映了連續(xù)兩個(gè)葉原基出現(xiàn)的時(shí)間間隔。比葉面積(SLA),單位重量的小麥葉片所包含的葉面積。收獲指數(shù)(HI),反映了小麥干物質(zhì)向穗部分配的比例。小麥分蘗能力(TA),不同小麥品種產(chǎn)生分蘗的能力不同,受品種基因控制,用分蘗能力反映小麥產(chǎn)生分蘗多少的特征。具體方案為一種基于MCMC的小麥品種特征參數(shù)估算方法,包括如下步驟1)小麥生長(zhǎng)模型即WheatGrow模型的數(shù)據(jù)獲取通過自動(dòng)氣象站記錄小麥生長(zhǎng)季田間逐日氣象數(shù)據(jù),包括日最高氣溫、日最低氣溫、日照時(shí)數(shù)、日降水量;利用五點(diǎn)取樣法, 將耕層土壤從上到下分4層進(jìn)行田間土壤取樣,然后通過室內(nèi)物理化學(xué)分析,測(cè)定土壤容重、飽和含水量、田間持水量、萎焉含水量、實(shí)際含水量、土壤全氮、氨態(tài)氮和硝態(tài)氮;記錄小麥生長(zhǎng)過程中的田間栽培管理數(shù)據(jù);實(shí)測(cè)小麥主要生育期(包括播種期、拔節(jié)期、開花期、 成熟期)和收獲時(shí)的籽粒產(chǎn)量;2)在小麥品種特征參數(shù)范圍內(nèi)選擇一套初始品種特征參數(shù)組合θ to),在未知參數(shù)分布的情況下,先假定各個(gè)參數(shù)的先驗(yàn)分布q^rve1-1)為均勻分布,ef分別代表九個(gè)品種特征參數(shù)(i = 1,2,3,4,5,6,7,8,9);3)在θ丨―1基礎(chǔ)上提出一個(gè)候選樣本θ:0"ew = θ廣1 + r χ (max(0,) - min(0i))/Dr是分布在0-1之間的一個(gè)隨機(jī)數(shù);max ( θ J和min( θ J分別是參數(shù)θ ,的上下限;D等于5,控制著推薦步長(zhǎng)的大?。?)將田間觀測(cè)的η年(η= 1,2,3...Ν)氣象數(shù)據(jù)、土壤數(shù)據(jù)、田間栽培管理數(shù)據(jù)以及兩套小麥品種特征參數(shù)θη 、θ (η)輸入到WheatGrow模型中,運(yùn)行模型η遍,得到模擬的η年小麥主要生育期和產(chǎn)量結(jié)果;5)通過田間實(shí)測(cè)的η年小麥生育期及產(chǎn)量數(shù)據(jù)和模擬的η年小麥生育期及產(chǎn)量結(jié)果,計(jì)算生育期和產(chǎn)量的釋然函數(shù)π ( θ ),計(jì)算公式如下
權(quán)利要求
1. 一種基于MCMC的小麥品種特征參數(shù)估算方法,其特征在于,包括如下步驟1)小麥生長(zhǎng)模型即WheatGrow模型的數(shù)據(jù)獲取通過自動(dòng)氣象站記錄小麥生長(zhǎng)季田間逐日氣象數(shù)據(jù),包括日最高氣溫、日最低氣溫、日照時(shí)數(shù)、日降水量;利用五點(diǎn)取樣法,將耕層土壤從上到下分4層進(jìn)行田間土壤取樣,然后通過室內(nèi)物理化學(xué)分析,測(cè)定土壤容重、飽和含水量、田間持水量、萎焉含水量、實(shí)際含水量、土壤全氮、氨態(tài)氮和硝態(tài)氮;記錄小麥生長(zhǎng)過程中的田間栽培管理數(shù)據(jù);實(shí)測(cè)小麥主要生育期(包括播種期、拔節(jié)期、開花期、成熟期)和收獲時(shí)的籽粒產(chǎn)量;2)在小麥品種特征參數(shù)范圍內(nèi)選擇一套初始品種特征參數(shù)組合θ((|),在未知參數(shù)分布的情況下,先假定各個(gè)參數(shù)的先驗(yàn)分布q(erve”)為均勻分布,θ〖分別代表九個(gè)品種特征參數(shù)(i = 1,2,3,4,5,6,7,8,9);3)在θ”基礎(chǔ)上提出一個(gè)候選樣本θ廠 r是分布在0-1之間的一個(gè)隨機(jī)數(shù);max( θ J和min( θ J分別是參數(shù)θ ,的上下限;D 等于5,控制著推薦步長(zhǎng)的大?。?)將田間觀測(cè)η年(η=1,2,3...Ν)氣象數(shù)據(jù)、土壤數(shù)據(jù)、田間栽培管理數(shù)據(jù)以及兩套小麥品種特征參數(shù)θ ne\ θ (η)輸入到WheatGrow模型中,運(yùn)行模型η遍,η = 1,2,3. . . N, 得到模擬的η年小麥主要生育期和產(chǎn)量結(jié)果;5)通過田間實(shí)測(cè)的η年小麥生育期及產(chǎn)量數(shù)據(jù)和模擬的η年小麥生育期及產(chǎn)量結(jié)果計(jì)算生育期和產(chǎn)量的釋然函數(shù)η ( θ ),計(jì)算公式如下 其中,Z(t)為觀察值,X(t)是模擬值,c0V(et)是et的協(xié)方差矩陣,θ為品種參數(shù);6)按照如下公式計(jì)算釋然比a
2.根據(jù)權(quán)利要求1所述的基于MCMC的小麥品種特征參數(shù)估算方法,其特征在于,上述步驟2)所述的品種特征參數(shù)是與小麥生育期相關(guān)的小麥品種特征參數(shù),包括了春化天數(shù) VD、對(duì)光周期反應(yīng)的敏感性PS、基本營(yíng)養(yǎng)生長(zhǎng)時(shí)間IE、對(duì)溫度高低的敏感性TS、灌漿時(shí)間的長(zhǎng)短FD;與產(chǎn)量相關(guān)的特征參數(shù),包括了相鄰兩個(gè)葉原基出現(xiàn)的時(shí)間間隔LT,單位重量的葉片的表面積SLA,品種發(fā)生分蘗的能力TA,光合干物質(zhì)向穗部分配的比例HI。
3.根據(jù)權(quán)利要求1所述的基于MCMC的小麥品種特征參數(shù)估算方法,其特征在于,上述步驟7)按照M-H準(zhǔn)則,將計(jì)算出來的釋然比ap、ay和均勻分布在W,1]之間的隨機(jī)變量U 進(jìn)行比較,對(duì)于生育期參數(shù)如果ap>U,設(shè)定θ〖 = θ廠(i = 1,2,3,4,5),否則設(shè)定0〖二0廣1; 對(duì)于產(chǎn)量參數(shù),如果ay彡U,設(shè)定時(shí)=0廠(i = 6,7,8,9),否則設(shè)定0丨=0廣1。
4.根據(jù)權(quán)利要求1所述的基于MCMC的小麥品種特征參數(shù)估算方法,其特征在于,上述步驟12)馬爾可夫鏈?zhǔn)諗康臈l件是根據(jù)中心極限定理通過M-H準(zhǔn)則的馬兒可夫鏈最終收斂于靜態(tài)分布,用一種定量收斂判斷指標(biāo)GRi對(duì)終止計(jì)算進(jìn)行判斷,該GRi指標(biāo)的計(jì)算基于馬爾可夫鏈鏈內(nèi)和鏈間方差,如下式
全文摘要
本發(fā)明公開了一種基于MCMC的小麥品種特征參數(shù)估算方法,其方法主要是通過田間實(shí)測(cè)小麥品種的生育期及產(chǎn)量與小麥生長(zhǎng)模型模擬的生育期及產(chǎn)量構(gòu)建概率密度函數(shù),利用MCMC方法反演得到小麥品種特征參數(shù)。具體過程首先通過測(cè)試運(yùn)算得到小麥品種特征參數(shù)的先驗(yàn)概率分布,根據(jù)初始參數(shù)和先驗(yàn)分布提出候選參數(shù),計(jì)算產(chǎn)量和生育期的概率密度函數(shù)和釋然比,根據(jù)M-H準(zhǔn)則判斷是否接受新的參數(shù),最終得到了品種各特征參數(shù)的后驗(yàn)概率密度分布。本發(fā)明所述方法估計(jì)的結(jié)果既準(zhǔn)確又高效,在同類模型小麥品種特征參數(shù)估算當(dāng)中具有普遍適用性。
文檔編號(hào)G06F19/00GK102495948SQ201110368758
公開日2012年6月13日 申請(qǐng)日期2011年11月21日 優(yōu)先權(quán)日2011年11月21日
發(fā)明者倪軍, 劉小軍, 呂尊富, 姚霞, 曹衛(wèi)星, 朱艷, 湯亮 申請(qǐng)人:南京農(nóng)業(yè)大學(xué)