本發(fā)明屬于分子生物學領(lǐng)域,具體涉及鹽膚木rchf3m基因。
背景技術(shù):
五倍子是一種重要的化工原料,是由半翅目hemiptera,蚜總科aphidoidea,癭綿科pemphigidae,倍蚜族melaphidini的五倍子蚜蟲生活在漆樹科anacardiaceae鹽膚木屬rhus的寄主植物上,刺激葉片組織增生而形成的蟲癭。中國五倍子利用有2000多年的歷史,古代主要用于中藥,現(xiàn)代廣泛用于化工、醫(yī)藥、紡織、食品等行業(yè),具有重要的經(jīng)濟價值。鹽膚木rhuschinensis是角倍蚜schlechtendaliachinensis的主要寄主,角倍是角倍蚜在寄生在鹽膚木上形成的蟲癭,是我國主要的五倍子種類之一,其產(chǎn)量占我國五倍子總產(chǎn)量的70%以上。
角倍的主要活性成分是單寧,單寧(tannins)又稱單寧酸、鞣質(zhì),是植物體內(nèi)一大類多酚黃酮化合物,單寧的生物合成途徑已基本明確,主要是通過莽草酸途徑合成,即由莽草酸途徑形成苯丙氨酸,再經(jīng)一系列反應(yīng)后最終形成單寧。許多植物中黃酮生物合成途徑中關(guān)鍵酶基因的生化功能已經(jīng)得到驗證,關(guān)鍵酶包括黃酮3-o-單氧酶、花青素3-o-葡糖基轉(zhuǎn)移酶、無花色素還原酶(lar),花色素還原酶(anr),二氫黃酮醇4-還原酶(dfr)、查兒酮合成酶(chs)和查兒酮異構(gòu)酶(chi)等。黃酮3-o-單氧酶在角倍的單寧合成過程中起到至關(guān)重要的調(diào)節(jié)作用,所以,鹽膚木黃酮3-o-單氧酶的表達水平對其產(chǎn)生角倍的單寧含量起著重要的調(diào)節(jié)作用,黃酮3-o-單氧酶基因是控制植物黃酮3-o-單氧酶表達的遺傳基礎(chǔ)。只有找到鹽膚木黃酮3-o-單氧酶的基因,才能對鹽膚木進行遺傳改良,從而提高角倍中單寧含量。
技術(shù)實現(xiàn)要素:
為解決上述問題,本發(fā)明通過對鹽膚木進行接種,并定期收集不同發(fā)育階段的蟲癭分別提取rna,通過轉(zhuǎn)錄組測序分析、基因注釋、kegg數(shù)據(jù)庫比對等步驟,得到了鹽膚木單寧合成關(guān)鍵基因rchf3m(序列1、2),并采用qpcr技術(shù)對rchf3m基因進行驗證(表2,圖1),具體技術(shù)方案如下:
1、樣本收集與處理
將五倍子蚜蟲放于鹽膚木上(rhuschinensismill),五倍子蚜蟲刺激葉翅產(chǎn)生角倍,定期收集生長于鹽膚木葉翅上不同生長時期的角倍,每次收集的角倍清除角倍內(nèi)所有蚜蟲后分為兩部分保存,一部分冷凍保存,用于提取總rna,另一部分用于測定單寧含量。
2、測序及轉(zhuǎn)錄組分析
提取去除蚜蟲后的五倍子的總rna,檢測rna質(zhì)量及純度后進行rna轉(zhuǎn)錄組測序,序列經(jīng)閱讀質(zhì)量分析、統(tǒng)計學比對分析、測序飽和度分析、參考基因讀取分布及參考基因組讀取分布分析后得到高質(zhì)量鹽膚木轉(zhuǎn)錄組序列。
3、基因注釋與篩選
拼接得到的所有功能基因都分別注釋到ncbi數(shù)據(jù)庫中的nr數(shù)據(jù)庫、nt數(shù)據(jù)庫及swiss-prot數(shù)據(jù)庫、kegg數(shù)據(jù)庫、cog數(shù)據(jù)庫、go數(shù)據(jù)庫中,得到與鹽膚木單寧合成通路相關(guān)基因,并結(jié)合基因表達量與單寧含量同步一致性,最終篩選出鹽膚木單寧合成的關(guān)鍵基因rchf3m(dna序列及其對應(yīng)的蛋白質(zhì)序列如序列3所示)。
4、基因表達量驗證
為了驗證rchf3m基因,將rchf3m基因做實時熒光定量(qpcr)分析,采用相對定量方法分析rchf3m基因相對表達量(圖1)。
附圖說明
圖1為鹽膚木rhuschinensis5個不同發(fā)育時期單寧含量;
圖2為鹽膚木rchf3m基因qpcr相對定量結(jié)果;
圖3為鹽膚木rchf3m基因qpcr相對表達量驗證結(jié)果;圖中縱坐標rchf3m基因qpcr相對表達量,橫坐標為鹽膚木發(fā)育的5個不同時間點(從6月21-8月28日);
圖4為鹽膚木不同發(fā)育時期單寧含量動態(tài)變化圖;圖中縱坐標為單寧含量(單寧占鹽膚木倍子重量的百分數(shù)),橫坐標為鹽膚木發(fā)育的5個不同時間點(從6月21-8月28日),5個時間點鹽膚木分別進行rna轉(zhuǎn)錄組測序分析。
具體實施方式
1、樣本收集
五倍子蚜蟲飼養(yǎng)于中國西南生態(tài)研究中心資源昆蟲研究所中的鹽膚木上(rhuschinensismill)。每隔十五天收集一次生長于鹽膚木葉翅上不同生長時期的角倍,共計8次。每次收集的角倍清除角倍內(nèi)所有蚜蟲后分為兩部分保存,一部分先以液氮凍存,隨后移入?80°c冰箱中以便提取總rna,另一部分用于單寧含量的測定。
2、測序及轉(zhuǎn)錄組分析
去除蚜蟲后的五倍子以通用植物總rna提取試劑盒(離心柱型)(百泰克,中國)提取總rna。以1%的瓊脂糖凝膠電泳檢測所提總rna質(zhì)量。以nanophotometer?分光光度計(implen,ca,usa)檢測純度,以核糖核酸6000納米盒(agilenttechnologies,ca,usa)檢測rna完整度。以打斷后的mrna為模板,隨機六聚體引物合成一鏈cdna,然后配制雙鏈合成反應(yīng)體系合成雙鏈cdna。合成的雙鏈cdna以qiaquickpcrextractionkit純化,經(jīng)過磁珠純化、粘性末端修復、3’末端加堿基a、加測序接頭后,進行pcr擴增,從而完成整個文庫制備工作。
去除含接頭的片段,其余所需片段以瓊脂糖凝膠電泳純化并進行pcr擴增。每個擴增樣品以nebnext?ultra?directionalrnalibraryprep試劑盒進行測序(neb,usa),所得基因代碼整合為測序文庫。整合后,文庫以illuminahiseqtm2000測序平臺雙向測序。最后,構(gòu)建好的文庫以ampurexp體系純化并以安捷倫生物分析儀2100系統(tǒng)(agilenttechnologies,ca,usa)檢測。經(jīng)測序儀讀取后,將去除含n(表示無法確定堿基信息)比例大于10%及低質(zhì)量的片段(質(zhì)量值q≤5的堿基數(shù)占整條read的50%以上)。
轉(zhuǎn)錄組序列拼接時將trinity2軟件中的min_kmer_cov選項設(shè)置為2,其余所有參數(shù)均為默認值。序列經(jīng)閱讀質(zhì)量分析、統(tǒng)計學比對分析、測序飽和度分析、參考基因讀取分布及參考基因組讀取分布分析后得到。
3、基因注釋
拼接得到的所有功能基因都分別注釋到ncbi數(shù)據(jù)庫中的nr數(shù)據(jù)庫、nt數(shù)據(jù)庫及swiss-prot數(shù)據(jù)庫、kegg數(shù)據(jù)庫、cog數(shù)據(jù)庫、go數(shù)據(jù)庫中?;虮磉_水平為每條基因堿基讀取比對到參考基因圖譜上的堿基數(shù)量,以rpkm表示1,rpkm值的大小反映了基因表達的豐度。將rpkm>0.3設(shè)為基因顯著表達閾值。fpkm法能消除基因長度和測序量差異對計算基因表達量的影響,計算得到的基因表達量可直接用于比較不同樣品間的基因差異表達。
4、實時熒光定量分析
為了驗證rna分析結(jié)果,實時熒光定量采用icycler熒光實時檢測系統(tǒng)(bio-rad,hercules,ca),采用相對定量方法分析各目的基因相對表達量。反應(yīng)體系均為25ul,其中,每個反應(yīng)體系中包含以1/40(v/v)稀釋過的的模板cdna2ul,及終濃度各為0.5mm的上下游引物。實時熒光定量反應(yīng)條件為:95°c,5分鐘;95°c,20秒;62°c,45秒;45個循環(huán)。最后,以熔解曲線檢測擴增特異性,熔解曲線反應(yīng)條件為:變性后樣品冷卻至55°c,然后以每10秒升高0.5°c為1個循環(huán),重復80個循環(huán),直至95°c。pcr產(chǎn)物以1.5%瓊脂糖凝膠電泳檢測,隨后純化擴增產(chǎn)物并測序,驗證有效擴增。以actin為內(nèi)參基因校準模板濃度。每個處理重復三次。
序列1.鹽膚木rchf3m基因序列(996bp)
ttcagacatagcccattctaaggcagtagctgcggtatccgttgctccaaatatgagatc60
ctgtgtcatgcccttaactctattacacgttagcttatcatcaagattggtatcatcatc120
agctagctgcaatagtaaatccaccatgtcttttggcacaaaattatcccccaatgcttc180
cctgttagctttgtgttcatcaaatatgtgctcataaaatggatcaagtcttttctttaa240
ggccttcattcgcttcacatatccttgcaggtccaagaaatccagccacggaatccaatc300
cccaatattcagcactccactgagcaagaacaactcacctaacatctcttgaaactcttc360
aagtgtcacacccgatgtttcatattttgagtcttctgactcactaaagtacttcttacc420
caacacaattctgcttataatgctgagggtaacgcgtgagagatgatctttaagcacagt480
tggcttccccgaacaggcatacaggcgagatataaagtctcgtatttcttcaacacgaat540
gtactcgtaagactcgagtcgttttgaactaaatagctctgtgaggtaaattttacggcc600
tcggcgccaatatggtccataaggagcccacaaaatatctgagttgttaaaagctatgaa660
cttgcctgctgcagtttgaggtctggaagcaaagatatgatcatgtgtcttgagaaaaag720
cttagccatttctggagaagaggcaacaacaagagagaaagagccaatcttgagttgcat780
tatttctccatatttttgggatagtttgtgaaaagattggtgagggagtggaccgatgag840
atgaaggttgccgataataggccacggtttaggacctggtggaaattttcgtgggtggcg900
ccacgaagatgagatttttctgaggaaggctatggcagctagccatgccaggcctaaaat960
aacccaagaaacagcttccattgtattagtgttgtg996
序列2.鹽膚木黃酮3-o-單氧酶氨基酸序列(由轉(zhuǎn)錄組所得序列的反義鏈翻譯得到)
metglualavalsertrpvalileleuglyleualatrpleuala
151015
alailealapheleuarglysilesersersertrparghispro
202530
arglyspheproproglyprolysprotrpproileileglyasn
354045
leuhisleuileglyproleuprohisglnserphehislysleu
505560
serglnlystyrglygluilemetglnleulysileglyserphe
657075
serleuvalvalalaserserproglumetalalysleupheleu
808590
lysthrhisasphisilephealaserargproglnthralaala
95100105
glylyspheilealapheasnasnseraspileleutrpalapro
110115120
tyrglyprotyrtrpargargglyarglysiletyrleuthrglu
125130135
leupheserserlysargleuglusertyrglutyrileargval
140145150
glugluileargasppheileserargleutyralacyssergly
155160165
lysprothrvalleulysasphisleuserargvalthrleuser
170175180
ileileserargilevalleuglylyslystyrphesergluser
185190195
gluaspserlystyrgluthrserglyvalthrleuglugluphe
200205210
glnglumetleuglygluleupheleuleuserglyvalleuasn
215220225
ileglyasptrpileprotrpleuasppheleuaspleuglngly
230235240
tyrvallysargmetlysalaleulyslysargleuaspprophe
245250255
tyrgluhisilepheaspgluhislysalaasnargglualaleu
260265270
glyaspasnphevalprolysaspmetvalaspleuleuleugln
275280285
leualaaspaspaspthrasnleuaspasplysleuthrcysasn
290295300
argvallysglymetthrglnaspleuilepheglyalathrasp
305310315
thralaalathralaleuglutrpalametserglu
320325
序列3.鹽膚木rchf3m基因堿基序列與編碼氨基酸序列的對應(yīng)圖
cacaacactaatacaatggaagctgtttcttgggttattttaggcctg48
metglualavalsertrpvalileleuglyleu
1510
gcatggctagctgccatagccttcctcagaaaaatctcatcttcg93
alatrpleualaalailealapheleuarglysileserserser
152025
tggcgccacccacgaaaatttccaccaggtcctaaaccgtggcct138
trparghisproarglyspheproproglyprolysprotrppro
303540
attatcggcaaccttcatctcatcggtccactccctcaccaatct183
ileileglyasnleuhisleuileglyproleuprohisglnser
455055
tttcacaaactatcccaaaaatatggagaaataatgcaactcaag228
phehislysleuserglnlystyrglygluilemetglnleulys
606570
attggctctttctctcttgttgttgcctcttctccagaaatggct273
ileglyserpheserleuvalvalalaserserproglumetala
758085
aagctttttctcaagacacatgatcatatctttgcttccagacct318
lysleupheleulysthrhisasphisilephealaserargpro
9095100
caaactgcagcaggcaagttcatagcttttaacaactcagatatt363
glnthralaalaglylyspheilealapheasnasnseraspile
105110115
ttgtgggctccttatggaccatattggcgccgaggccgtaaaatt408
leutrpalaprotyrglyprotyrtrpargargglyarglysile
120125130
tacctcacagagctatttagttcaaaacgactcgagtcttacgag453
tyrleuthrgluleupheserserlysargleuglusertyrglu
135140145
tacattcgtgttgaagaaatacgagactttatatctcgcctgtat498
tyrileargvalglugluileargasppheileserargleutyr
150155160
gcctgttcggggaagccaactgtgcttaaagatcatctctcacgc543
alacysserglylysprothrvalleulysasphisleuserarg
165170175
gttaccctcagcattataagcagaattgtgttgggtaagaagtac588
valthrleuserileileserargilevalleuglylyslystyr
180185190
tttagtgagtcagaagactcaaaatatgaaacatcgggtgtgaca633
pheserglusergluaspserlystyrgluthrserglyvalthr
195200205
cttgaagagtttcaagagatgttaggtgagttgttcttgctcagt678
leugluglupheglnglumetleuglygluleupheleuleuser
210215220
ggagtgctgaatattggggattggattccgtggctggatttcttg723
glyvalleuasnileglyasptrpileprotrpleuasppheleu
225230235
gacctgcaaggatatgtgaagcgaatgaaggccttaaagaaaaga768
aspleuglnglytyrvallysargmetlysalaleulyslysarg
240245250
cttgatccattttatgagcacatatttgatgaacacaaagctaac813
leuaspprophetyrgluhisilepheaspgluhislysalaasn
255260265
agggaagcattgggggataattttgtgccaaaagacatggtggat858
argglualaleuglyaspasnphevalprolysaspmetvalasp
270275280
ttactattgcagctagctgatgatgataccaatcttgatgataag903
leuleuleuglnleualaaspaspaspthrasnleuaspasplys
285290295
ctaacgtgtaatagagttaagggcatgacacaggatctcatattt948
leuthrcysasnargvallysglymetthrglnaspleuilephe
300305310
ggagcaacggataccgcagctactgccttagaatgggctatgtctgaa996
glyalathraspthralaalathralaleuglutrpalametserglu
315320325。
序列1.鹽膚木rchf3m基因序列(996bp)
ttcagacatagcccattctaaggcagtagctgcggtatccgttgctccaaatatgagatc60
ctgtgtcatgcccttaactctattacacgttagcttatcatcaagattggtatcatcatc120
agctagctgcaatagtaaatccaccatgtcttttggcacaaaattatcccccaatgcttc180
cctgttagctttgtgttcatcaaatatgtgctcataaaatggatcaagtcttttctttaa240
ggccttcattcgcttcacatatccttgcaggtccaagaaatccagccacggaatccaatc300
cccaatattcagcactccactgagcaagaacaactcacctaacatctcttgaaactcttc360
aagtgtcacacccgatgtttcatattttgagtcttctgactcactaaagtacttcttacc420
caacacaattctgcttataatgctgagggtaacgcgtgagagatgatctttaagcacagt480
tggcttccccgaacaggcatacaggcgagatataaagtctcgtatttcttcaacacgaat540
gtactcgtaagactcgagtcgttttgaactaaatagctctgtgaggtaaattttacggcc600
tcggcgccaatatggtccataaggagcccacaaaatatctgagttgttaaaagctatgaa660
cttgcctgctgcagtttgaggtctggaagcaaagatatgatcatgtgtcttgagaaaaag720
cttagccatttctggagaagaggcaacaacaagagagaaagagccaatcttgagttgcat780
tatttctccatatttttgggatagtttgtgaaaagattggtgagggagtggaccgatgag840
atgaaggttgccgataataggccacggtttaggacctggtggaaattttcgtgggtggcg900
ccacgaagatgagatttttctgaggaaggctatggcagctagccatgccaggcctaaaat960
aacccaagaaacagcttccattgtattagtgttgtg996
序列2.鹽膚木黃酮3-o-單氧酶氨基酸序列(由轉(zhuǎn)錄組所得序列的反義鏈翻譯得到)
metglualavalsertrpvalileleuglyleualatrpleuala
151015
alailealapheleuarglysilesersersertrparghispro
202530
arglyspheproproglyprolysprotrpproileileglyasn
354045
leuhisleuileglyproleuprohisglnserphehislysleu
505560
serglnlystyrglygluilemetglnleulysileglyserphe
657075
serleuvalvalalaserserproglumetalalysleupheleu
808590
lysthrhisasphisilephealaserargproglnthralaala
95100105
glylyspheilealapheasnasnseraspileleutrpalapro
110115120
tyrglyprotyrtrpargargglyarglysiletyrleuthrglu
125130135
leupheserserlysargleuglusertyrglutyrileargval
140145150
glugluileargasppheileserargleutyralacyssergly
155160165
lysprothrvalleulysasphisleuserargvalthrleuser
170175180
ileileserargilevalleuglylyslystyrphesergluser
185190195
gluaspserlystyrgluthrserglyvalthrleuglugluphe
200205210
glnglumetleuglygluleupheleuleuserglyvalleuasn
215220225
ileglyasptrpileprotrpleuasppheleuaspleuglngly
230235240
tyrvallysargmetlysalaleulyslysargleuaspprophe
245250255
tyrgluhisilepheaspgluhislysalaasnargglualaleu
260265270
glyaspasnphevalprolysaspmetvalaspleuleuleugln
275280285
leualaaspaspaspthrasnleuaspasplysleuthrcysasn
290295300
argvallysglymetthrglnaspleuilepheglyalathrasp
305310315
thralaalathralaleuglutrpalametserglu
320325
序列3.鹽膚木rchf3m基因堿基序列與編碼氨基酸序列的對應(yīng)圖
cacaacactaatacaatggaagctgtttcttgggttattttaggcctg48
metglualavalsertrpvalileleuglyleu
1510
gcatggctagctgccatagccttcctcagaaaaatctcatcttcg93
alatrpleualaalailealapheleuarglysileserserser
152025
tggcgccacccacgaaaatttccaccaggtcctaaaccgtggcct138
trparghisproarglyspheproproglyprolysprotrppro
303540
attatcggcaaccttcatctcatcggtccactccctcaccaatct183
ileileglyasnleuhisleuileglyproleuprohisglnser
455055
tttcacaaactatcccaaaaatatggagaaataatgcaactcaag228
phehislysleuserglnlystyrglygluilemetglnleulys
606570
attggctctttctctcttgttgttgcctcttctccagaaatggct273
ileglyserpheserleuvalvalalaserserproglumetala
758085
aagctttttctcaagacacatgatcatatctttgcttccagacct318
lysleupheleulysthrhisasphisilephealaserargpro
9095100
caaactgcagcaggcaagttcatagcttttaacaactcagatatt363
glnthralaalaglylyspheilealapheasnasnseraspile
105110115
ttgtgggctccttatggaccatattggcgccgaggccgtaaaatt408
leutrpalaprotyrglyprotyrtrpargargglyarglysile
120125130
tacctcacagagctatttagttcaaaacgactcgagtcttacgag453
tyrleuthrgluleupheserserlysargleuglusertyrglu
135140145
tacattcgtgttgaagaaatacgagactttatatctcgcctgtat498
tyrileargvalglugluileargasppheileserargleutyr
150155160
gcctgttcggggaagccaactgtgcttaaagatcatctctcacgc543
alacysserglylysprothrvalleulysasphisleuserarg
165170175
gttaccctcagcattataagcagaattgtgttgggtaagaagtac588
valthrleuserileileserargilevalleuglylyslystyr
180185190
tttagtgagtcagaagactcaaaatatgaaacatcgggtgtgaca633
pheserglusergluaspserlystyrgluthrserglyvalthr
195200205
cttgaagagtttcaagagatgttaggtgagttgttcttgctcagt678
leugluglupheglnglumetleuglygluleupheleuleuser
210215220
ggagtgctgaatattggggattggattccgtggctggatttcttg723
glyvalleuasnileglyasptrpileprotrpleuasppheleu
225230235
gacctgcaaggatatgtgaagcgaatgaaggccttaaagaaaaga768
aspleuglnglytyrvallysargmetlysalaleulyslysarg
240245250
cttgatccattttatgagcacatatttgatgaacacaaagctaac813
leuaspprophetyrgluhisilepheaspgluhislysalaasn
255260265
agggaagcattgggggataattttgtgccaaaagacatggtggat858
argglualaleuglyaspasnphevalprolysaspmetvalasp
270275280
ttactattgcagctagctgatgatgataccaatcttgatgataag903
leuleuleuglnleualaaspaspaspthrasnleuaspasplys
285290295
ctaacgtgtaatagagttaagggcatgacacaggatctcatattt948
leuthrcysasnargvallysglymetthrglnaspleuilephe
300305310
ggagcaacggataccgcagctactgccttagaatgggctatgtctgaa996
glyalathraspthralaalathralaleuglutrpalametserglu
315320325