專利名稱:花生乙酰輔酶a羧化酶生物素羧化酶亞基基因及其編碼的蛋白質(zhì)與克隆方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基因工程技術(shù)領(lǐng)域,具體涉及花生乙酰輔酶A羧化酶生物素羧化酶亞基 基因及其編碼的蛋白質(zhì)與克隆方法。
背景技術(shù):
乙酰輔酶A羧化酶(Acetyl-CoA Carboxylase, ACCase)屬于生物素包含酶,它在生物 體內(nèi)催化乙酰輔酶A羧化形成丙二酰輔酶A,為脂肪酸和許多次生代謝產(chǎn)物的合成提供底物 (Konishi T, Shinohara K, Yamada K. Acetyl-CoA carboxylase in higher plants: most plants other than gramineae have both the prokaryotic and the eukaryotic forms of this enzyme[J]. Plant Cell Physiol, 1996, 37(1): 17-122.)。生物體中ACCase有2種 類型。 一種ACCase稱為同質(zhì)型(Homomeric),亦稱多功能或真核型,存在于動物、酵母、藻 類及植物的胞質(zhì)溶膠中,具有一個相對分子量為22CT260的生物素包含亞基。另一種是異質(zhì) 型(Heteromeric),也稱多亞基或原核型ACCase,存在于細菌及雙子葉植物和非未本科單子 葉植物的細胞質(zhì)中。異質(zhì)型ACCase包含4個亞基,即生物素羧化酶(Biotin carboxylase, BC)、生物素羧基載體蛋白(Biotin carboxyl Carrier Protein, BCCP)以及羧基轉(zhuǎn)移酶的 2個亞基a-CT和CT,其中前2個亞基組成BC和BCCP域,后2個亞基構(gòu)成CT催化域。 BC亞基是由核基因組中的基因編碼的,目前已從擬南芥、煙草、油菜、大豆等多種植物中獲 得BC基因(J Sun, J Ke, J L Johnson, B J Niko]au, and E S Wurtele. Biochemical and molecular biological characterization of CAC2, the Arabidopsis thaliana gene coding for the biotin carboxylase subunit of the plastidic acetyl-coenzyme A carboxylase. Plant Physiol. 1997, 115(4): 1371—1383; Sergei Reverdatto, Vadim Beilinson, and Niels C. Nielsen. A Multisubunit Acetyl Coenzyme A Carboxylase from Soybean. Plant Physiol. 1999, 119(3): 961-978.)。但花生中尚沒有此基因的相關(guān)報道。
發(fā)明內(nèi)容
本發(fā)明的目的是克服現(xiàn)有技術(shù)的不足,提供一種花生乙酰輔酶A羧化酶生物素羧化酶亞 基基因及其編碼的蛋白質(zhì)與克隆方法。使該基因在花生中獲得高表達,以改良花生的品質(zhì)。
本發(fā)明的花生乙酰輔酶A羧化酶生物素羧化酶亞基基因,其序列由SEQIDNO. l中從核 苷酸第115 — 1737位的核苷酸序列構(gòu)成。所述基因來自花生(^rac力is力j^^aea),命名為J力5C基因。
本發(fā)明第二個目的是提供所述基因編碼的蛋白質(zhì),具有序列表中SEQ ID NO. 2所示的氨 基酸序列。所述蛋白質(zhì)命名為^^C蛋白質(zhì)
同時,本發(fā)明還提供所述基因的克隆方法,包括如下步驟
(1) 提取花生幼苗中的總RNA;
(2) 利用Promega的RT-PCR體系反轉(zhuǎn)錄獲得cDNA;
(3) 根據(jù)cDNA文庫中的EST信息設(shè)計引物-
(4) 進行PCR擴增,并將PCR產(chǎn)物回收后篩選陽性克隆;
(5) 對篩選到的陽性克隆進行序列分析,獲得乙酰輔酶A羧化酶生物素羧化酶亞基基因。 乙酰輔酶A羧化酶生物素羧化酶亞基是II類ACCase多肽復(fù)合物的一個亞基。該酶活性的
提高可以增強II類ACCase復(fù)合物的裝配,有利于提高花生種子的含油量。本發(fā)明公開的花生 乙酰輔酶A羧化酶生物素羧化酶亞基"力^:)基因的核苷酸序列及其編碼的蛋白序列以及基 因克隆方法,可廣泛應(yīng)用于花生品質(zhì)的改良、花生的栽培和培養(yǎng),尤其是花生作為油料作物 的開發(fā)和利用等領(lǐng)域。
圖1是本發(fā)明的蛋白質(zhì)的結(jié)構(gòu)域示意圖; 圖2是本發(fā)明的蛋白質(zhì)預(yù)測的三級結(jié)構(gòu)。
具體實施例方式
下面結(jié)合具體實例對本發(fā)明作進一步詳細的描述。
實施例l克隆花生乙酰輔酶A羧化酶生物素羧化酶亞基(力力5C)基因
(1) 選用E12花生幼苗作為實驗材料,采用Pbiozol植物組織RNA提取試劑盒提取花生 幼苗中的總RNA。腦A含量及質(zhì)量可采用瓊脂糖凝膠電泳檢測。
(2) 利用Promega的RT-PCR體系反轉(zhuǎn)錄獲得cDNA。
(3) 根據(jù)cDNA文庫中的EST信息設(shè)計花生乙酰輔酶A羧化酶生物素羧化酶亞基基因編碼 區(qū)引物其中
正向引物5' — CAGTTTCAGTTACAATTAGGAT _3' 反向引物5, - CAAATGTCATATCATATCCATC -3,
反應(yīng)體系2. 5 ul 10XPCR緩沖液(含MgCl》,0.5 ul 10 uM的引物,1.0 u 1 20 mM的dNTPs, 1 ul cDNA樣品,0. 5 u 1 Ex-Taq酶(Takara) , 19 u 1雙蒸水。PCR反應(yīng)程序為95° C預(yù)變性5 min, 95。C變性30s, 5(TC復(fù)性30s, 72。C延伸1. 5min, 28個循環(huán) 后,72°C延伸10min。
(4) 進行PCR擴增,PCR產(chǎn)物回收后與pMD18-T simple vector (Takara)連接,連接產(chǎn) 物轉(zhuǎn)化£ coh'Top IO感受態(tài)細胞,采用藍白斑法篩選陽性克隆。
(5) 篩選的陽性克隆經(jīng)PCR進一步驗證后測序,獲得花生乙酰輔酶A羧化酶生物素羧化 酶亞基基因。
實施例2 z力^:蛋白質(zhì)的序列信息與特性分析
本發(fā)明的J/^C基因長2027bp,其開放閱讀框為1623bp,位于115-1737bp處。BioXM軟 件分析表明力/^C共編碼540個氨基酸。根據(jù)PR0SITE數(shù)據(jù)庫分析花生力力^:基因編碼的540 個氨基酸,發(fā)現(xiàn)此序列含一個BC活性位點(Biotin carboxylation domain, PS50979 ), 位于75-520aa,如圖1所示。另外還包含2種其它功能位點,ATP-grasp domain profile (PS50975 ); 氨甲酰磷酸合成酶位點 (Carbamoyl-phosphate synthase subdomain signatures 1, PS00866; Carbamoyl-phosphate synthase subdomain signatures 2, PS00867)。
用Protparam預(yù)測編碼蛋白的物理化學(xué)性質(zhì),推測分子式為C2584H414。N7280774 S28,分子量為 58687.3,等電點為6.72,理論推導(dǎo)半衰期為30h,不穩(wěn)定參數(shù)是39. 30,屬于穩(wěn)定蛋白。該 蛋白中含量相對較多的氨基酸是Ala (10.4%), Gly (8.3%), Val (7.8%), Glu (7.0%), Leu (6.9%);該蛋白中不含Pyl和Sec??偟膸д姾傻臍埢鶠?Arg + Lys) : 63;總的帶負電荷 的殘基為(Asp + Glu) :65。該蛋白親水性平均數(shù)為-O. 152,預(yù)測該蛋白為疏水性蛋白。采用 iPS0RT進行預(yù)測,表明該蛋白含有導(dǎo)肽序列,可能定位于葉綠體。以Tmpred網(wǎng)站為基礎(chǔ)的 跨膜結(jié)構(gòu)預(yù)測表明該蛋白含2個跨膜信號區(qū)。
采用在線HNN網(wǎng)站預(yù)測花生AhBC蛋白的二級結(jié)構(gòu),表明該蛋白含有36. 85%的a -螺旋, 17. 96%的P -折疊以及45. 19%的無規(guī)則巻曲。利用3D-JIGSAW預(yù)測花生AhBC蛋白三級結(jié)構(gòu), 結(jié)果表明該蛋白呈緊密的球狀結(jié)構(gòu),如圖2所示。
本發(fā)明涉及的序列及記號分列如下 (l)SEQ ID NO. 1的信息 (i)序列特征
(A) 長度:2027bp
(B) 類型核苷酸
(C) 鏈性:單鏈(D)拓撲結(jié)構(gòu)線性
(ii) 分子類型核苷酸
(iii) 序列描述:SEQ ID NO. 1 (2) SEQ ID NO. 2的信息
(i) 序列特征:
(A) 長度540 aa
(B) 類型氨基酸
(C) 鏈性單鏈
(D) 拓撲結(jié)構(gòu)線性
(ii) 分子類型蛋白質(zhì)
(iii)序列描述:SEQ ID NO. 2序列表
<110>山東省花生研究所
〈120〉花生乙酰輔酶A羧化酶生物素羧化酶亞基基因及其編碼的蛋白質(zhì)與克隆方法
〈160〉 2
<170〉 Patentln version 3.3
<210> 1
〈211> 2027
<212〉 DNA
〈213〉 花生(Arachis hypogaea)
<220〉
<221〉 CDS
〈222〉 (115).. (1737)
〈400> 1
gaaacagaag aaacatcatc gttttcatcg acaatcgcca ttcggcattc gctaaccctt 60
caaaaagcaa atcatagaca gtttcsgtta caattaggat acaaaacaca csta atg 117
Met 1
gag agt aga ata atg get gcg etc aac tec gtt acc tct cct cat ctg 165 Glu Ser Arg lie Met Ala Ala Leu Asn Ser Val Thr Ser Pro His Leu 5 10 15
cct tct cat tec ccg ggt ctg tac gcg gtg gag aac age ate aag age 213 Pro Ser His Ser Pro Gly Leu Tyr Ala Val Glu Asn Ser lie Lys Ser 20 25 30
tec caa tgc age ttc tea gcg ggg age aag aag gtg agt ttt ccg agg 261 Ser Gin Cys Ser Phe Ser Ala Gly Ser Lys l>ys Val Ser Phe Pro Arg 35 40 45
caa agg Gin Arg 50
tgc Cys
agt Ser
cac His
gtg Val 55
acg Thr
卿 Lys
acc Thr
郷 Arg
gcg Ala 60
gC£l
Ala
cgt Arg
gat Asp
ggt Gly
ggt Gly 65
309
get ggt Ala Gly
ggt Gly
get Ala
etc Leu 70
ggt Gly
gec Ala
acg Thr
tgt Cys
cag Gin 75
gcg Ala
g鄧 Glu
卿 Lys
ate lie
ctg Leu 80
gtg Val
357
7gcg aac aga ggc gag ate gcg gtg cga gtc ate aga acc get cat gag 405 Ala Asn Arg Gly Glu lie Ala Val Arg Val lie Arg Thr Ala His Glu 85 90 95
atg gga att ccg tgc gtg get gtg tac teg acc att gat aag gac gcg 453 Met Gly lie Pro Cys Val Ala Val Tyr Ser Thr lie Asp Lys Asp Ala 100 105 110
ctt cat gtc aag etc get gat gat get gtt tgc ate ggt gaa gcg cct 501 Leu His Val Lys Leu Ala Asp Asp Ala Val Cys lie Gly Glu Ala Pro 115 120 125
age agt caa teg tac tta ttg att cca aat gtt eta tct get get att 549 Ser Ser Gin Ser Tyr Leu Leu lie Pro Asn Val Leu Ser Ala Ala lie 130 135 140 145
age cga aga tgc aca atg ttg cat cct ggg tgt ggt ttc ctt get gaa 597 Ser Arg Arg Cys Thr Met Leu His Pro Gly Cys Gly Phe Leu Ala Glu 150 155 160
aat gca gtg ttt gtt gag atg tgc aga gag cat gga ate aat ttt att 645 Asn Ala Val Phe Val Glu Met Cys Arg Glu His Gly lie Asn Phe lie 165 170 175
ggg cca aat ccc gac agt att egg gtt atg ggt gac aaa tea act gcc 693 Gly Pro Asn Pro Asp Ser lie Arg Val Met Gly Asp Lys Ser Thr Ala 180 185 190
aga gat aca atg aag aaa gca ggt gtt cct acg gtt ccg gga agt gat 741 Arg Asp Thr Met Lys Lys Ala Gly Val Pro Thr Val Pro Gly Ser Asp 195 200 205
gga ttg tta cag acc aca gag gaa get ate agg ctg gca aat gag att 789 Gly Leu Leu Gin Thr Thr Glu Glu Ala lie Arg Leu Ala Asn Glu lie 210 215 220 225
ggt ttc cct gt£i atg ate aag gca aca get gga ggt gga ggg cgt ggc 837 Gly Phe Pro Val Met lie Lys Ala Thr Ala Gly Gly Gly Gly Arg Gly 230 235 240
atg cgc ctt get aaa gaa cct gat gaa ttt gta aag tta tta cag caa 885 Met Arg Leu Ala Lys Glu Pro Asp Glu Phe Val Lys Leu Leu Gin Gin 245 250 255
get aag agt gaa get get get gca ttt ggt aat gat gga gtt tat ttg 933Ala Lys Ser Glu Ala Ala Ala Ala Phe Gly Asn Asp Gly Val Tyr Leu 260 265 270
gaa aag tat gtc caa aac cca agg cac att gag ttc cag gtt ctt get 981 Glu Lys Tyr Val Gin Asn Pro Arg His lie Glu Phe Gin Val Leu Ala 275 280 285
gat aaa tat ggt aat gta gtt cac ttt gga gga cgt gat tgc age ate 1029 Asp Lys Tyr Gly Asn Val Val His Phe Gly Gly Arg Asp Cys Ser lie 290 295 300 305
cag agg cgt aat cag aaa ctg ttg gaa gaa gca cct tct cct gca ttg 1077 Gin Arg Arg Asn Gin Lys Leu Leu Glu Glu Ala Pro Ser Pro Ala Leu 310 315 320
acc cca gag ttg cgt aag gca atg ggt gat gca gca gtt get gca get 1125 Thr Pro Glu Leu Arg Lys Ala Met Gly Asp Ala Ala Val Ala Ala Ala 325 330 335
gca tct ata ggt tac ata ggt gtt gga aca gtt gag ttc etc ttg gat 1173 Ala Ser lie Gly Tyr lie Gly Val Gly Thr Val Glu Phe Leu Leu Asp 340 345 350
gaa aga ggt tct ttt tac ttc atg gag atg aac act cgt ate cag gtt 1221 Glu Arg Gly Ser Phe Tyr Phe Met Glu Met Asn Thr Arg lie Gin Val 355 360 365
gag cat ccg gtg aca gaa atg att tct tct gtt gat ttg ata gaa gag 1269 Glu His Pro Val Thr Glu Met lie Ser Ser Val Asp Leu lie Glu Glu 370 375 380 385
caa att cgt gta get atg ggg gaa aaa ctt cga tac aaa cag gag gat 1317 Gin lie Arg Val Ala Met Gly Glu Lys Leu Arg Tyr Lys Gin Glu Asp 390 395 400
att gtg etc aga gga cat tct att gaa tgc cgt ate aat gca gag gat 1365 lie Val Leu Arg Gly His Ser lie Glu Cys Arg lie Asn Ala Glu Asp 405 410 415
get ttc aag ggt ttt aga cca ggg cca ggt aga ata aca gca tac teg 1413 Ala Phe Lys Gly Phe Arg Pro Gly Pro Gly Arg lie Thr Ala Tyr Ser 420 425 430
cca tct ggt ggt cca ttt gtt aga atg gac age cat gtt tat cct gat 1461 Pro Ser Gly Gly Pro Phe Val Arg Met Asp Ser His Val Tyr Pro Asp 435 440 445tat gtg Tyr Val 450
tgg get Trp Ala
gat gac Asp Asp
ctt ate Leu lie
ttt att Phe lie 515
gta ctg Val Leu 530
gtt Val
cca Pro
Thr
ctt Leu 500
CC3
Pro
gcc Ala
cct Pro
Thr
att lie 485
gac Asp
朋g Lys
Lys
cca Pro
a_ga Arg 470
ate lie
Elt3
lie
cat His
g幼 Glu
age Ser 455
g肪 Glu
8ca_ Thr
tat Tyr
g3g
Glu
g幼 Glu
ttc Phe 535
肪g Lys
ggg Gly
gat Asp
g站 Glu 520
get Ala
gac tec Asp Ser
gca att Ala lie
gtt cct Val Pro 490
ttc aaa Phe Lys 505
gag ttg Glu Leu
ggt gta Gly Val
ctt Leu
gas Glu 475
act Thr
33t
Asn
gca Ala
Asn
ctt Leu 460
cgt Arg
ac3 Thr
ggc Gly
atg Met
gca Ala 540
gg3
Gly
3tg Met
att lie
Lys
Lys
ga_t Asp
aaa Lys
cct Pro 525
gtt Val 510
cct Pro
ctt Leu
郷 Arg
tac Tyr 495
gat Asp
gtg Val
a/tt lie
gca Ala 480
cat His
gtt Val 465
ctt Leu
Lys
1509
act Thr
Lys
get Ala
£ltg Met
tga tggatatgat
1557
1605
1653
1701
1747
atgacatttg ggatatcatc aagaatggct ggccttgttt taatcactct ctccgtgcat 1807
ttatgtgaaa atttcaatga aattttgata gttaacttgg cactattgtc tttgttcttg 1867
atacattgta aaaaccaaac tttatgtttg gttctattgc taatatcaaa tactggtgct 1927
agaaagtgcg agtacccgtt tgeaattett caagattcat agttgtattt gactgatgaa 1987
atattctaaa tttttgtttt ccaaaaaaaa aaaaaaaaaa 2027
<210> 2 〈211〉 540 〈212〉 PRT
〈213> 花生(Arachis hypogaea) 〈400〉 2
Met Glu Ser Arg lie Met Ala Ala Leu Asn Ser Val Thr Ser Pro His 15 10 15Leu Pro Ser His Ser Pro Gly Leu Tyr Ala Val Glu Asn Ser lie Lys 20 25 30
Ser Ser Gin Cys Ser Phe Ser Ala Gly Ser Lys Lys Val Ser Phe Pro 35 40 45
Arg Gin Arg Cys Ser His Val Thr Lys Thr Arg Ala Ala Arg Asp Gly 50 55 60
Gly Ala Gly Gly Ala Leu Gly Ala Thr Cys Gin Ala Glu Lys lie Leu 65 70 75 80
Val Ala Asn Arg Gly Glu lie Ala Val Arg Val lie Arg Thr Ala His 85 90 95
Glu Met Gly lie Pro Cys Val Ala Val Tyr Ser Thr lie Asp Lys Asp 100 105 110
Ala Leu His Val Lys Leu Ala Asp Asp Ala Val Cys lie Gly Glu Ala 115 120 125
Pro Ser Ser Gin Ser Tyr Leu Leu lie Pro Asn Val Leu Ser Ala Ala 130 135 140
lie Ser Arg Arg Cys Thr Met Leu His Pro Gly Cys Gly Phe Leu Ala 145 150 155 160
Glu Asn Ala Val Phe Val Glu Met Cys Arg Glu His Gly lie Asn Phe 165 170 175
lie Gly Pro Asn Pro Asp Ser lie Arg Val Met Gly Asp Lys Ser Thr 180 185 190
Ala Arg Asp Thr Met Lys Lys Ala Gly Val Pro Thr Val Pro Gly Ser
11195
200
205
Asp Gly Leu Leu Gin Thr Thr Glu Glu Ala lie Arg Leu Ala Asn Glu 210 215 220
lie Gly Phe Pro Val Met lie Lys Ala Thr Ala Gly Gly Gly Gly Arg 225 230 235 240
Gly Met Arg Leu Ala Lys Glu Pro Asp Glu Phe Val Lys Leu Leu Gin 245 250 255
Gin Ala Lys Ser Glu Ala Ala Ala Ala Phe Gly Asn Asp Gly Val Tyr 260 265 270
Leu Glu Lys Tyr Val Gin Asn Pro Arg His lie Glu Phe Gin Val Leu 275 280 285
Ala Asp Lys Tyr Gly Asn Val Val His Phe Gly Gly Arg Asp Cys Ser 290 295 300
lie Gin Arg Arg Asn Gin Lys Leu Leu Glu Glu Ala Pro Ser Pro Ala 305 310 315 320
Leu Thr Pro Glu Leu Arg Lys Ala Met Gly Asp Ala Ala Val Ala Ala 325 330 335
Ala Ala Ser lie Gly Tyr lie Gly Val Gly Thr Val Glu Phe Leu Leu 340 345 350
Asp Glu Arg Gly Ser Phe Tyr Phe Met Glu Met Asn Thr Arg lie Gin 355 360 365
Val Glu His Pro Val Thr Glu Met lie Ser Ser Val Asp Leu lie Glu 370 375 380
12Glu Gin lie Arg Val Ala Met Gly Glu Lys Leu Arg Tyr Lys Gin Glu 385 390 395 400
Asp lie Val Leu Arg Gly His Ser lie Glu Cys Arg lie Asn Ala Glu 405 410 415
Asp Ala Phe Lys Gly Phe Arg Pro Gly Pro Gly Arg lie Thr Ala Tyr 420 425 430
Ser Pro Ser Gly Gly Pro Phe Val Arg Met Asp Ser His Val Tyr Pro 435 440 445
Asp Tyr Val Val Pro Pro Ser Tyr Asp Ser Leu Leu Gly Lys Leu lie 450 455 460
Val Trp Ala Pro Thr Arg Glu Lys Ala lie Glu Arg Met Lys Arg Ala 465 470 475 480
Leu Asp Asp Thr lie lie Thr Gly Val Pro Thr Thr lie Asp Tyr His 485 490 495
Lys Leu lie Leu Asp lie Glu Asp Phe Lys Asn Gly Lys Val Asp Thr 500 505 510
Ala Phe lie Pro Lys His Glu Glu Glu Leu Ala Met Pro Pro Val Lys 515 520 525
Met Val Leu Ala Lys Glu Phe Ala Gly Val Asn Ala 530 535 540
權(quán)利要求
1.一種花生乙酰輔酶A羧化酶生物素羧化酶亞基基因,其特征在于所述基因序列由SEQ IDNO.1中從核苷酸第115-1737位的核苷酸序列構(gòu)成。
2. 根據(jù)權(quán)利要求1所述的花生乙酰輔酶A羧化酶生物素羧化酶亞基基因,其特征在于所述 基因編碼的蛋白質(zhì)具有序列表中SEQ ID NO. 2所示的氨基酸序列。
3. —種花生同質(zhì)型乙酰輔酶A羧化酶基因的克隆方法,包括如下步驟(1) 提取花生幼苗中的總RNA;(2) 利用Promega的RT-PCR體系反轉(zhuǎn)錄獲得cDNA;(3) 根據(jù)cDNA文庫中的EST信息設(shè)計引物(4) 進行PCR擴增,并將PCR產(chǎn)物回收后篩選陽性克??;(5) 對篩選到的陽性克隆進行序列分析,獲得乙酰輔酶A羧化酶生物素羧化酶亞基基因。
全文摘要
本發(fā)明公開了一種花生乙酰輔酶A羧化酶生物素羧化酶亞基基因及其編碼的蛋白質(zhì)與克隆方法。所述基因序列由SEQ ID No.1中從核苷酸第115-1737位的核苷酸序列構(gòu)成;所述基因編碼的蛋白質(zhì)具有序列表中SEQ ID No.2所示的氨基酸序列。本發(fā)明公開的花生乙酰輔酶A羧化酶生物素羧化酶亞基(AhBC)基因的核苷酸序列及其編碼的蛋白序列以及基因克隆方法,可廣泛應(yīng)用于花生品質(zhì)的改良、花生的栽培和培養(yǎng),尤其是花生作為油料作物的開發(fā)和利用等領(lǐng)域。
文檔編號C12P19/34GK101550423SQ20091011955
公開日2009年10月7日 申請日期2009年3月13日 優(yōu)先權(quán)日2009年3月13日
發(fā)明者和亞男, 曹玉良, 楊慶利, 潘麗娟, 禹山林, 遲曉元 申請人:山東省花生研究所