时间:2023-08-17 15:54:32
序论:速发表网结合其深厚的文秘经验,特别为您筛选了11篇生物信息学分析范文。如果您需要更多原创资料,欢迎随时与我们的客服老师联系,希望您能从中汲取灵感和知识!
摘要:以酿酒酵母中已经报道的5个典型PITP序列为基础,对炭疽菌属蛋白质数据库进行Blastp比对以及
关键词 搜索,并通过SMART保守结构域分析,明确该菌含有4个典型的PITP;同时,通过对上述氨基酸序列进行疏水性、细胞信号肽、跨膜区结构域、亚细胞定位以及二级结构等生物信息学分析,并与其他物种中15个同源序列进行遗传关系比较分析,以期为深入开展希金斯炭疽菌(Colletotrichum higginsanum Sacc.)PITP的功能研究打下理论基础,同时,也为进一步开展其他炭疽菌的研究提供重要的理论指导。
关键词 :希金斯炭疽菌(Colletotrichum higginsanum Sacc.);磷脂酰肌醇转移蛋白质;生物信息学分析;遗传关系;炭疽菌属
中图分类号:Q81文献标识码:A文章编号:0439-8114(2015)03-0713-04
希金斯炭疽菌(Colletotrichum higginsanum Sacc.)属于炭疽菌属真菌,其可以侵染如菜心、小油菜、结球甘蓝、羽衣甘蓝、大白菜、萝卜等多种十字花科蔬菜作物而引起炭疽病,是一类重要的世界性植物真菌病害,现主要分布于美国、中国、日本以及印度等国[1-3]。在我国,由该病菌侵染菜心引起的炭疽病是菜心上最常见和发生最严重的病害之一[4]。该病害对广东省菜心种植地区具有重要的影响,不仅降低了菜心的产量,对菜心的品质也产生了较大影响[5,6]。国内外对该病菌的研究主要集中在生物学特性、生防菌筛选以及遗传转化等方面[7,8],同时,随着该病菌基因组序列的释放[9],林春花等[10]对其开展了MAPK途径相关基因的找寻及信号通路简图的绘制工作。
磷脂酰肌醇转移蛋白质(Phosphatidylinositol transfer protein,PITP)是一类广泛存在于真核生物细胞中具有一个疏水性强的水溶性蛋白质载体,其功能在于把一分子的脂类物质包裹在疏水腔内,使包裹的脂类物质远离细胞质内水溶性的环境,从而实现脂类物质在不同膜间定向转运[11]。该蛋白质通过参与调节脂类代谢途径和胞内进程,从而在多个复杂的生理发育过程中发挥重要作用[12]。目前,认为在肌醇磷脂代谢途径中发挥重要作用的有PITP-PLC(磷脂酶C)途径、CDP(胞嘧啶核苷二磷酸)-胆碱生物合成途径[13,14]。学术界对于植物中所含有的PITP有较多报道,如大豆、日本百脉根、拟南芥以及棉花等,而对于真菌PITP的研究报道较为少见。
本研究以酿酒酵母(Saccharomyces cerevisiae S288c)中已经报道的5个典型PITP氨基酸序列为基础,通过在炭疽菌属蛋白质数据库中进行Blastp比对分析以及
关键词 搜索,获得与酿酒酵母PITP同源的C. higginsanum序列,并通过保守结构域分析、疏水性分析、二级结构预测等生物信息学分析,以期明确该菌中所存在的PITP数量、疏水性特点、结构特征以及细胞定位情况,同时,基于上述PITP氨基酸序列,在美国国家生物信息中心(NCBI)在线进行同源序列搜索,通过遗传关系分析,以期为进一步开展其他炭疽菌中PITP的研究提供理论指导。
1材料与方法
1.1材料
根据酿酒酵母中含有的5个PITP(Sec14、Pdr16、Pdr17、Sfh5和CSR1)氨基酸序列,利用炭疽菌属蛋白质数据库在线进行Blastp比对[15],所有参数均选择默认值,获得C. higginsianum中所含有的典型PITP,同时,通过输入“Phosphatidylinositol-transfer-protein”、“PITP”
关键词 ,在上述数据库中进行PITP检索;另外,利用NCBI明确该菌中PITP蛋白质登录号信息(表1)。
1.2方法
1.2.1 保守结构域预测利用SMART网站在线分析PITP所具有的保守结构域特征。
1.2.2蛋白质疏水性预测利用Protscale程序[16]对PITP进行疏水性测定。
1.2.3蛋白质转运肽及信号肽预测转运肽的预测利用TargetP 1.1 Server进行在线分析[17],信号肽预测则是利用SignalP 3.0 Server[18]进行在线分析。
1.2.4蛋白质二级结构及跨膜区结构预测对蛋白质二级结构预测采用PHD[19]进行在线分析。同时,对其PITP的跨膜区结构进行预测,利用TMHMM Server v. 2.0进行在线分析[18]。
1.2.5亚细胞定位分析对C. higginsianum中PITP进行亚细胞定位分析,利用ProtComp v.9.0进行在线分析[20]。
1.2.6系统进化树构建在NCBI中,以C. higginsianum中所含PITP氨基酸序列为基础,在线进行Blastp同源搜索,获得来自不同物种的同源蛋白质序列。对所获得的同源序列,利用Clustal X软件[21]进行多重比对分析,随后利用MEGA 5.2.2软件[22]构建系统进化树,采用邻近法构建系统发育树,各分支之间的距离计算采用p-distance模型,系统可信度检测采用自举法重复1 000次进行。
2结果与分析
2.1希金斯炭疽菌含有4个典型的PITP
对酿酒酵母中典型的5个PITP进行SMART分析,明确上述PITP均具有SEC14保守域结构,除Sfh5外,其他4个还具有一个存在于氨基酸序列N端,且尚未知功能的CRAL_TRIO_N保守域结构,同时,上述典型PITP所含氨基酸的大小范围为343~469 aa。
对炭疽菌属进行Blastp比对分析,除Sec14、CSR1具有同源的序列外,其他3个(Pdr16、Pdr17、Sfh5)在希金斯炭疽菌中均没有发现其同源序列。同时,结合
关键词 搜索,结果表明,C. higginsianum中存在4个与酵母中PITP同源性较高序列,其ID分别为CH063_00815.1、CH063_06673.1、CH063_01014.1、CH063_10638.1。根据SMART保守域分析,结果显示,上述4个蛋白质序列均含有典型PITP所具有的SEC14保守域(图1),按照氨基酸长度,重新对上述希金斯炭疽菌中的典型PITP进行命名,分别为ChPITP1、ChPITP2以及ChPITP3、ChPITP4(表1)。
2.2蛋白质疏水性预测
疏水性分析结果显示,ChPITP1中位于291位的E,亲水性最强,数值达到-1.995,而位于179位的D,亲水性最弱,为0.921;ChPITP2中位于314、317位的Q、W,亲水性最强,而位于248位的T,亲水性最弱;ChPITP3中位于62位的T,亲水性最强,而位于294位的W,亲水性最弱;ChPITP4中位于66位的V,亲水性最强,而位于255位A,其亲水性最弱(表2,图2)。同时,发现ChPITP1、ChPITP2、ChPITP3、ChPITP4这4个典型PITP尽管在亲水性最强氨基酸残基位置和数值、疏水性最强氨基酸残基位置和数值、疏水性氨基酸残基数值总和以及亲水性氨基酸残基数值总和等方面的结果不尽相同,但均属于亲水性蛋白质,这与通过理化性质分析中的GRAVY计算所得结果一致。
2.3转运肽及信号肽特征
通过分析,ChPITP1、ChPITP2、ChPITP3、ChPITP4具有分泌途径信号肽的可能性最大,其预测值分别为0.948、0.961、0.854、0.924(表3)。经过SingnalP 3.0 Server在线分析,上述4个PITP均不含有明显的信号肽序列。
2.4二级结构及跨膜结构域预测
二级结构预测结果显示,4个PITP均含有α螺旋、β折叠、无规卷曲等二级结构,其中,ChPITP1、ChPITP3、ChPITP4所含α螺旋比例较高,分别为49%、51%、46%,而在ChPITP2中,其所含无规卷曲结构所占比例较高,为44%;对于β折叠结构,ChPITP1、ChPITP2、ChPITP3、ChPITP4所含比例均较低(图3)。
通过TMHMM Server v. 2.0在线分析,上述4个PITP均不含有典型的跨膜结构域,然而,通过二级结构预测发现ChPITP4在281到311位氨基酸之间存在一个跨膜结构域,两者预测不同,有待于今后通过试验进一步验证。
2.5亚细胞定位分析
通过ProtComp v. 9.0在线分析,结果表明,4个典型的PITP亚细胞定位情况不尽相同,其中,ChPITP1、ChPITP2定位于高尔基体中,而ChPITP3定位于线粒体上,ChPITP4定位于细胞质中(表4)。
2.6遗传关系
在NCBI中,通过对C. higginsianum 4个典型PITP序列进行Blastp搜索,分别获得ChPITP1、ChPITP2、ChPITP3、ChPITP4的同源序列,选择同源性较高的15条序列进行聚类分析,结果显示,上述4个PITP与其各自同源序列分别聚在一起,而彼此之间并未聚在一起;就C. higginsianum中每一个PITP与其他物种同源序列之间的亲缘关系而言,ChPITP1与禾谷炭疽菌中的EFQ27511.1、西瓜炭疽病菌中的ENH76666.1之间亲缘关系较近;ChPITP2与大丽轮枝菌中的EGY17177.1、黑白轮枝菌中的XP003005673.1亲缘关系较近;ChPITP3与C. graminicola中的EFQ29482.1之间的亲缘关系较近;ChPITP4与C. graminicola中的EFQ30498.1之间的亲缘关系较近(图4),这与前期关于禾谷炭疽菌PITP的亲缘关系研究所得结果一致[23]。
3小结与讨论
C. higginsanum可侵染菜心、白菜等众多十字花科蔬菜引起炭疽病,不仅影响蔬菜的产量,也对其品质造成重要影响。深入开展该病菌的致病因子研究,有助于进一步开发以致病因子为作用靶标的防治药剂。2012年,随着该菌全基因组序列的释放[9],为学术界对其开展致病因子研究提供了便利条件。
目前,已经明确PITP参与真核生物体内众多生理功能以及信号转导过程,然而,对于真菌中PITP的报道尚不多见。本研究基于酿酒酵母中已经报道的5个典型PITP序列,在炭疽菌属蛋白质数据库中,利用Blastp比对以及
关键词 搜索,同时,基于SMART保守域分析,共获得C. higginsanum 4个典型的PITP。利用生物信息学分析,初步明确了上述4个典型PITP在细胞信号肽、疏水性、亚细胞定位、跨膜结构域以及二级结构等方面具有的特征,为深入解析C. higginsanum PITP的功能研究打下坚实基础。与此相似,通过上述方法,也获得了C. graminicola中含有3个PITP,并明确上述PITP具有的相关特征。在炭疽菌属病菌中上述2种全基因组测序已经完成,而大多数危害农、林业生产的炭疽菌的全基因组测序尚未完成,因此,本研究基于C. higginsanum中典型PITP,通过遗传关系比较分析,可为进一步开展其他炭疽菌属真菌中PITP研究提供重要的理论指导。
参考文献:
[1] 沈瑞清,张萍,郭成瑾,等.宁夏炭疽菌属真菌资源研究[J].河南农业科学,2012(5):100-102,149.
[2] 梁惠凌,唐辉.广西常见花卉真菌性病害的防治[J].广西园艺, 2002(2):18-19.
[3] HYDE K, CAI L, CANNON P, et al. Colletotrichum-names in current use[J]. Fungal Diversity, 2009, 39: 147-182.
[4] 卢博彬,杨暹.菜心炭疽病研究进展[J].长江蔬菜,2009(24): 1-5.
[5] 张华,周而勋,刘自珠,等.菜心炭疽病苗期抗病性鉴定技术[J].华南农业大学学报,1998(3):50-53.
[6] 张华,刘自珠,郑岩松,等.菜心品种资源炭疽病抗性鉴定[J]. 广东农业科学,2000(3):47-49.
[7] 周而勋,杨媚,张华,等.菜心炭疽病菌菌丝生长、产孢和孢子萌发的影响因素[J].南京农业大学学报,2002,25(2):47-51.
[8] 况福元,吴小丽,吕风青,等.菜心炭疽病菌拮抗细菌的筛选及鉴定[J].微生物学通报,2009(9):1350-1355.
[9] O′CONNELL R J, THON M R, HACQUARD S, et al. Lifestyle transitions in plant pathogenic Colletotrichum fungi deciphered by genome and transcriptome analyses[J]. Nat Genet, 2012, 44(9):1060-1065.
[10] 林春花,蔡志英,黄贵修.全基因组法绘制禾谷炭疽菌和希金斯炭疽菌中MAPK级联信号途径简图[J].热带作物学报,2012, 33(4):674-680.
[11] HSUAN J, COCKCROFT S. The PITP family of phosphatidylinositol transfer proteins[J]. Genome Biol,2001,2(9):3011-3018.
[12] COCKCROFT S. Phosphatidylinositol transfer proteins couple lipid transport to phosphoinositide synthesis[J]. Seminars in Cell & Developmental Biology,2001,12(2):183-191.
[13] XIE Z G, FANG M, BANKAITIS V A. Evidence for an intrinsic toxicity of phosphatidylcholine to Sec14p-dependent protein transport from the yeast Golgi complex[J]. Molecular Biology of the cell,2001,12(4):1117-1129.
[14] PHILLIPS S E, VINCENT P, RIZZIERI K E, et al. The diverse biological functions of phosphatidylinositol transfer proteins in eukaryotes[J]. Critical Reviews in Biochemistry and Molecular Biology,2006,41(1):21-49.
[15] ALTSCHUL S F, MADDEN T L, SCHAFFER A A, et al. Gapped BLAST and PSI-BLAST: A new generation of protein database search programs[J]. Nucleic Acids Res, 1997, 25(17):3389-3402.
[16] WALKER J M. The Proteomics Protocols Handbook[M].Totowa:Humana Press Enc,2005.
[17] EMANUELSSON O, BRUNAK S, VON HEIJNE G, et al. Locating proteins in the cell using TargetP, SignalP and related tools[J]. Nature Protocols,2007,2(4):953-971.
[18] BENDTSEN J D, NIELSEN H, VON HEIJNE G, et al. Improved prediction of signal peptides: SignalP 3.0[J]. Journal of Molecular Biology,2004,340(4):783-795.
[19] KELLEY L A, STERNBERG M J. Protein structure prediction on the Web: A case study using the Phyre server[J]. Nat Protoc, 2009,4(3):363-371.
[20] EMANUELSSON O, NIELSEN H, BRUNAK S, et al. Predicting subcellular localization of proteins based on their N-terminal amino acid sequence[J]. Journal of Molecular Biology, 2000, 300(4): 1005-1016.
2 结果与分析
2.1 不结球白菜BcGAPDH蛋白质理化性质分析
对不结球白菜BcGAPDH氨基酸序列的理化性质进行分析,结果表明,该酶含有328个氨基酸,总相对分子量为35 161.2,理论等电点pI值为9.03,负电荷氨基酸(Asp+Glu) 37个,正电荷氨基酸(Arg+Lys)36个,分子式C1558H2507N433O473S9,原子总数
4 980,摩尔消光系数1.043(胱氨酸全按半胱氨酸计),该酶蛋白不稳定性参数为20.46,属于稳定蛋白,其脂肪系数为99.54,平均亲水性(GRAVY)为0.006,预测该蛋白质为水溶性蛋白质。
2.2 不结球白菜BcGAPDH蛋白质跨膜结构域及疏水性的预测和分析
用TMpred在线软件对不结球白菜BcGAPDH氨基酸序列的跨膜结构域进行预测,结果(图1)表明,不结球白菜BcGAPDH整条肽链都位于细胞膜外,说明其不存在跨膜区。此外,利用在线软件PHDhtm和ANTHEPROT对该酶跨膜螺旋进行预测,结果与TMpred所预测的结果一致,即均没有跨膜螺旋。因此,此被预测的跨膜螺旋区可信度较高。
蛋白质的疏水性分析是蛋白质二级结构以及三级结构预测中一个必要过程,通过分析可以得到蛋白质的亲疏水区域,一方面为二级结构预测结果提供参考,另一方面为结构域以及功能域的划分提供依据。因此,对不结球白菜BcGAPDH氨基酸序列进行疏水性分析,结果(图2)表明,多肽链第304位的氨基酸具有最低分值-4.500,亲水性最强;第212位的氨基酸具有最高分值4.200,疏水性最强。整体来看,亲水性氨基酸均匀分布在整个肽链中,且多于疏水性氨基酸。因此,整个多肽链表现为亲水性,没有明显的疏水区域,可认为不结球白菜BcGAPDH是亲水性蛋白质。结合跨膜结构域的预测结果,可以推断不结球白菜BcGAPDH不存在明显的疏水区域,与其不存在跨膜结构域的特征相吻合。
2.3 不结球白菜BcGAPDH信号肽及亚细胞定位的预测和分析
信号肽分析有助于蛋白质功能域的区分及蛋白质细胞定位。SignalP v3.0软件是神经网络、隐马尔科夫模式工具[12],将不结球白菜BcGAPDH的ORF通过该软件分析(图3),获得ORF的Cmax值为0.083、Ymax值为0.083、Smean值为0.561、Smean值为0.182,前3个值的位点分别在第25、25、1位。根据软件的默认选择,将Cmax值>0.5和Smean值>0.5的ORF确定为具有信号肽。根据分析结果,此信号肽计算结论为NO,表示没有信号肽存在。
对基因产物在亚细胞位置的了解对判定这些基因产物的功能起着重要作用。用Target P server程序进行不结球白菜BcGAPDH蛋白质的亚细胞定位,结果表明,基本确认BcGAPDH蛋白质在线粒体中发挥生物学作用,氨基酸序列长度为328个,定位于叶绿体、线粒体和其他细胞部分的得分分别为0.031、0.745、0.572,作为信号肽的可能性为0.018,软件的最终定位预测在线粒体,可信度为5。用 Subloc V server和WOLFPSORT server程序进行验证分析,结果一致。
2.4 不结球白菜BcGAPDH蛋白质的模体分析
将不结球白菜BcGAPDH蛋白质的氨基酸序列利用在线软件ScanProsite进行分析,发现其含有多种模点(图4),其中包括1个氨基化合物位点(M1),1个依赖于cAMP或cGMP的蛋白质激酶磷酸化位点(M2),6个酪蛋白激酶Ⅱ磷酸化位点(M3),3个N-糖基化位点(M4),6个N-肉豆蔻酰化位点(M5),4个蛋白质激酶C磷酸化位点(M6)。
2.5 不结球白菜BcGAPDH蛋白质二级结构的预测分析
利用SOPMA在线工具预测不结球白菜 BcGAPDH蛋白质的二级结构,结果如图5所示,BcGAPDH含有比较丰富的二级结构,由112个氨基酸残基组成α螺旋结构,占全部氨基酸残基的34.15%;82个氨基酸残基组成延伸链,占全部氨基酸残基的25.00%;由21个氨基酸残基组成β转角,占全部氨基酸残基的6.40%;由113个氨基酸残基组成随机卷曲,占全部氨基酸的34.45%。可以看出,随机卷曲和α-螺旋是BcGAPDH多肽链中的主要结构元件,延伸链散布于整个蛋白质中。
2.6 不结球白菜BcGAPDH蛋白质三维结构的预测
将不结球白菜BcGAPDH氨基酸序列上传到SWISS-MODEL的建模服务器中进行三维建模[13,14],然后在ViewerLite 4.2软件中进行序列编辑,获得BcGAPDH的三级结构模型,结果如图6所示。
3 讨论
GAPDH生物学的多功能性基于不同的研究结果,这些新的发现可以分为2组:第1组包括鉴定GAPDH新活性的研究,结果发现GAPDH有别于传统的脱氢酶活性的新功能;第2组包括鉴定GAPDH与细胞内大分子的特异性结合,为GAPDH新功能提供了重要证据。
早期的研究证明GAPDH是一个膜结合蛋白[15],发现细胞中60%~70%的GAPDH能与膜结合,但不结球白菜BcGAPDH不具有该活性,因为通过本试验分析该酶无跨膜区,是亲水性蛋白质。另外,研究表明,GAPDH还具有磷酸转移酶/激酶的活性,不仅能自身磷酸化,而且还能磷酸化其他蛋白质。本试验对不结球白菜BcGAPDH蛋白质的模体分析发现,该酶包括蛋白质激酶磷酸化位点、酪蛋白激酶Ⅱ磷酸化位点和蛋白质激酶C磷酸化位点,表明BcGAPDH在不结球白菜体内具有磷酸化活性,BcGAPDH在其细胞病毒生理学上可能扮演着重要角色。
GAPDH广泛存在于众多生物体中,并且具有高度种属保守序列,它作为一个多功能蛋白质,其结构与功能的关系仍有待研究。目前,GAPDH在机体的生理和病理状态下的作用越来越引起有关学者的关注。但迄今为止,GAPDH在细胞中的功能还没有完全搞清楚,因此,本试验对不结球白菜BcGAPDH结构和功能的分析将有助于研究者进一步了解GAPDH反应的机制及所需条件。
参考文献:
[1] 李晓泽,刘关君,杨传平,等.西伯利亚蓼甘油醛-3-磷酸脱氢酶基因的cDNA克隆与序列分析[J].植物生理学通讯,2007,43(1):41-48.
[2] NAKAGAWA T,HIRANO Y,INOMATA A,et al. Participation of a fusogenic protein, glyceraldehyde-3-phosphate dehydrogenase, in nuclear membrane assembly[J]. J Biol Chem,2003, 278(22):20395-20404.
[3] TISDALE E J. Glyceraldehyde-3-phosphate dehydrogenase is required for vesicular transport in the early secretory pathway[J]. J Biol Chem,2001,276(4):2480-2486.
[4] TISDALE E J,KELLY C,ARTALEJO C R. Glyceraldehyde-3-phosphate dehydrogenase interacts with rab2 and plays an essential role in endoplasmic reticulum to golgi transport exclusive of its glycolytic activity[J]. J Biol Chem,2004,279(52): 54046-54052.
[5] ENGEL M, SEIFERT M, THEISINGER B, et al. Glyceraldehyde-3-phosphate dehydrogenase and Nm23-H1/nucleoside diphosphate kinase A. Two old enzymes combine for the novel Nm23 protein phosphor transferase function[J]. J Biol Chem, 1998,273(32):20058-20065.
[6] MEYER-SIEGLER K,MAURO D J,SEAL G,et al. A human nuclear uracil DNA glycosylase is the 37-kDa subunit of glyceraldehyde-3-phosphate dehydrogenase[J]. Proc Natl Acad Sci USA,1991,88(19):8460-8464.
[7] ANDRADE J,PEARCE S T,ZHAO H,et al. Interactions among p22, glyceraldehyde-3-phosphate dehydrogenase and microtubules[J]. Biochem J,2004,384(2):327-336.
[8] RAJE C I,KUMAR S,HARLE A,et al. The macrophage cell surface glyceraldehyde-3-phosphate dehydrogenase is a novel transferrin receptor[J]. J Biol Chem,2007,282(5):3252-3261.
[9] GASTEIGER E,HOOGLAND C,GATTIKER A,et al. The Proteomics Proto-cols Handbook[M]. Totowa,New Jersey:Humana Press,2005.
[10] HOFMANN K,STOFFEL W. TMbase-A database of membrane spanning proteins segments[J]. Biological Chemistry Hoppe-Seyler,1993,374:1-6.
[11] SODING J, BIEGERTA, LUPASA N. The HHpred interactive server for protein homology detection and structure prediction[J]. Nucleic Acids Research,2005,33:244-248.
[12] BENDTSEN J D, NIELSEN H, VON HEIJNE G, et al. Improved prediction of signal peptides:SignalP 3.0[J].J Mol Biol,2004,340:783-795.
作者简介:李洁(1982—),女,河南商丘人,实验师,主要从事动物遗传育种与繁殖工作。联系电话:(0931)7631225。E-mail:lijie@gsau.edu.cn。
通信作者:王建福(1982—)男,河南商丘人,讲师,主要从事水产养殖工作。联系电话:(0931)7631225。E-mail:wangjf@gsau.edu.cn。
定西市安定区位于甘肃省中部,北纬35°17′54″至36°02′40″,东经104°12′48″至105°01′06″,南北長82.9km,东西宽73.3km,海拔1700~2580m,属典型的黄土高原干旱半干旱雨养农业区,抗旱生产是安定区农业工作的重点。中晚熟玉米适宜海拔在2000m以下的区域种植[1],而安定区大面积耕地海拔在2000m以上,中晚熟品种很难成熟,全膜双垄沟播技术将玉米种植范围扩大到海拔2100m区域[2-3]。为了考察早熟玉米新品种在安定区高海拔区的适应性、抗逆性、生产稳定性,2017年安定区农业技术推广服务中心引进了7个早熟玉米新品种进行比较试验,以期筛选出适合当地海拔2100m以上区域生产应用的玉米品种。现将结果报道如下。
1材料与方法
1.1供试材料
参试玉米品种7个,其中武科早303、武科早304由武威市武科种业科技有限公司生产,甘玉804由甘肃种业有限责任公司生产,兴达1601、兴达1602由甘肃兴达种业有限公司生产,金穗606、金穗607及当地常规种植品种金穗3号(CK)由白银金穗种业有限公司生产。
1.2试验地概况
试验设在定西市安定区团结镇小山村,海拔2150m,年平均降水量430mm,年蒸发量1450mm,无霜期141d。前茬作物收获后深耕晒垡,冬前浅耕耙耱。采用全膜双垄沟播技术[4],大垄宽70cm、高10cm,小垄宽40cm、高15cm。覆膜前结合整地一次性基施农家肥45000kg/hm2、玉米专用肥(N-P2O5-K2O为20-15-15)1200kg/hm2。用50%辛硫磷乳油7.5kg/hm2加适量水喷拌细土450kg制成毒土,撒施地面后起垄覆膜以防治地下害虫。用50%乙草胺乳油3750mL/hm2兑水600kg喷洒于垄沟表面芽前除草。
1.3试验方法
试验为随机区组设计,每品种为1个处理,3次重复,小区面积39.6m2(11.0m×3.6m)。4月19日用玉米点播器播种,每穴2粒,播深4cm,行距55cm,株距30cm,密度为60000株/hm2。田间管理措施同当地大田。田间观察记载物候期及主要农艺性状,成熟后按小区抽样考种并单收计产。
2结果与分析
2.1生育期
从表1可以看出,各品种出苗期一致,均在5月2日。金穗607、武科早303、甘玉804、武科早304于6月中旬开始拔节,与金穗3号(CK)基本一致;兴达1601、金穗606、兴达1602拔节期较金穗3号(CK)迟13~16d。抽雄期武科早303、武科早304均为7月11日,较金穗3号(CK)早4d;兴达1602与金穗3号(CK)一致;金穗606、兴达1601、甘玉804较金穗3号(CK)晚2d。成熟期武科早303、武科早304、兴达1602最早,8月下旬已经成熟,较金穗3号(CK)早9d;金穗607、甘玉804、兴达1601、金穗606均在9月上旬与金穗3号(CK)同期成熟。生育期武科早303、武科早304、兴达1602均为117d,较金穗3号(CK)短9d;其他品种生育期为126d,与金穗3号(CK)相同。
2主要性状
由表2可见,株高以金穗607、甘玉804、兴达1601最高,均为2.5m,较金穗3号(CK)高出0.5m;武科早304、金穗606次之,均为2.4m,较金穗3号(CK)高出0.4m;武科早303、兴达1602最低,为1.7m,较金穗3号(CK)低0.3cm。穗位以甘玉804、金穗606最高,为80.0cm,较金穗3号(CK)高12.5cm;金穗607次之,为73.0cm,较金穗3号(CK)高5.5cm;武科早303最低,为36.5cm,较金穗3号(CK)低31.0cm。穗长以兴达1601最长,为23.0cm,较金穗3号(CK)长5.0cm;其次为甘玉804,为21.5cm,较金穗3号(CK)长3.5cm;武科早304最短,为17.5cm,较金穗3号(CK)短0.5cm;其他品种较金穗3号(CK)长0.5~2.0cm。穗粗以金穗606最粗,为15.6cm,较金穗3号(CK)粗0.1cm,其他品种较金穗3号(CK)细0.2~2.3cm。轴粗以武科早304最粗,为10.8cm,较金穗3号(CK)粗0.8cm;其次是金穗606,为10.3cm,较金穗3号(CK)粗0.3cm;其他品种较金穗3号(CK)细0.3~0.7cm。粒型武科早304、兴达1602与金穗3号(CK)一致,均为半马齿型,其余品种均为马齿型。粒色除武科早303、武科早304为黄红色外,其余品种均与金穗3号(CK)一致,为黄色。轴色金穗607、甘玉804、兴达1602为浅粉色;武科早303、兴达1601、金穗606和金穗3号(CK)均为棕红色;武科早304为白色。
2.3产量及构成因子
由表3可知,穗粒数金穗607最多,为630粒,较金穗3号(CK)多132粒;其次是甘玉804,为552粒,较金穗3号(CK)多54粒;其余品种均较金穗3号(CK)少。百粒重以金穗606最高,为31.6g,较金穗3号(CK)高8.2g;其次是武科早303,为28.4g,较金穗3号(CK)高5.0g;武科早304、兴达1601分别为27.7、24.5g,较金穗3号(CK)分别高4.3、1.1g;其余品种均低于金穗3号(CK)。折合产量以武科早304最高,为8737.4kg/hm2,较金穗3号(CK)增产1186.9kg/hm2,增产率为15.7%;其次是武科早303,为8611.1kg/hm2,较金穗3号(CK)增产1060.6kg/hm2,增产率14.0%;金穗607居第3位,折合产量8585.9kg/hm2,较金穗3号(CK)增产13.7%;金穗606为8484.9kg/hm2,较金穗3号(CK)增产12.4%。对产量進行新复极差比较,各品种间产量差异均达到极显著水平。
3小结
在安定区海拔2150m的旱区,对引进的7个玉米品种进行了引种试验。结果表明,参试各玉米品种均可在9月中旬前成熟,武科早304、武科早303、金穗607、金穗606等4个品种综合性状优良。其中武科早304折合产量最高,为8737.4kg/hm2,较对照品种金穗3号增产1186.9kg/hm2,增产率为15.7%;武科早303折合产量8611.1kg/hm2,较对照品种金穗3号增产1060.6kg/hm2,增产率14.0%;金穗607折合产量8585.9kg/hm2,较对照品种金穗3号增产13.7%;金穗606较对照品种金穗3号增产12.4%。
张雷等人[5]认为全膜双垄沟播栽培玉米可在海拔2300m以内的区域内种植。本试验通过对供试玉米品种的性状、生育期及产量结果进行综合分析,建议在安定区海拔2100~2300m区域扩大武科早304、武科早303、金穗607及金穗606的种植面积,其他品种可在海拔2100m以下区域进一步试验。
参考文献:
[1] 刘广才,杨祁峰,李来祥,等. 旱地玉米全膜双垄沟播技术增产效果研究[J]. 农业现代化研究,2009,30(6):739-743.
1.1小桐子JcMSRA基因全长cDNA的克隆以小桐子叶片材料提取总RNA,并反转录cDNA为模板,扩增JcMSRA基因cDNA全长序列。结果表明,扩增得到的产物约0.9kb(图1A)。将目的条带切胶回收后与T/A克隆载体pEASY-T1连接,转化大肠杆菌,菌落PCR验证阳性克隆(图1B)。挑取阳性克隆过夜摇菌,提取重组质粒pEASY-T1-JcMSRA(图1C),并以M13通用引物进行测序。
1.2小桐子JcMSRA基因的生物信息学分析经测序分析,本研究克隆的小桐子JcMSRA基因的cDNA序列全长879bp,包含一个完整的开放阅读框(780bp),编码259个氨基酸(图2)。通过将JcMSRA编码框与其基因组序列(Jcr4S03665,14648~16350位,1702bp)比对,发现JcMSRA基因包含2个外显子(长度分别为528bp与252bp)与1个内含子,且内含子的序列(924bp)较2个外显子都长,符合AT/GT的剪切规则。ProtParam分析结果显示,JcMSRA编码的蛋白质分子量为29.1kD,理论等电点为8.75,且单体亚基不稳定,说明其属于多聚体蛋白质。另外,该蛋白质N端不含信号肽,预测其亚细胞定位可能性最大的为线粒体、其次为细胞核。ExPASy的COILS预测发现,该蛋白质在190~220位有一个明显的卷曲螺旋区域(图3A)。作为一种超二级结构,卷曲螺旋一般由2~7个短的琢-螺旋组成,是许多转录因子与功能蛋白质的结构元件,该卷曲螺旋出现的位置正好是其二级结构中琢-螺旋最长的部位,与SOPM服务器预测的结构吻合(图3B)。分别以大肠杆菌(Escherichiacoli)、酿酒酵母(Sa-ccharomycescerevisiae)、莱茵衣藻(Chlamydomonasreinhardtii)、拟南芥(Arabidopsisthaliana)、蒺藜苜蓿(Medicatruncatula)、毛果杨(Populustrichocarpa)、家鼠(Musmusculus)、人(Homosapiens)与小桐子MSRA氨基酸序列进行多重序列比对(图4),发现MSRA氨基酸序列在N端与C端都没有同源性,差异变化较大,而在中部相对保守。MSRA属于单结构域蛋白,位于该酶蛋白活性中心的核心氨基酸残基为Phe102、Trp103、Tyr132、Glu144、Tyr184(图4,菱形标注),而-GCF-W-保守序列的Cys与C端的两个保守Cys残基主要起维持酶活性中心结构的功能。将小桐子MSRA氨基酸序列进一步与MSR家族的三类不同(MSRA,MSRB,fRMSR)的MSR氨基酸序列进行多重序列比对,并构建系统进化树(图5)。由图中可以看出,不同的MSR被聚类为明显的三条分支,印证了MSR三个家族在氨基酸一级序列及高级结构等方面的进化差异性。我们得到的小桐子MSR被归入了MSRA分支中,与小桐子的近科物种毛果杨(Populustrichocarpa)在进化上距离较远,序列相似性仅为22.19%,而与芸豆(Phaseolusvulgaris)、棉花(ssypiumbarbadense)、油菜(Brassicanapus)、拟南芥(Arabidopsisthaliana)的亲缘关系较近,序列相似性分别为70.30%、68.82%、61.65%、60%。目前,通过X-晶体射线衍射法已经获得了几种(如大肠杆菌,毛果杨,牛)MSRA的高分辨率三维结构。我们通过同源建模方法构建了小桐子MSRA的三维空间结构并进行了氨基酸残基能量评估(图6)。综合研究MSRA的晶体结构显示,其表面都有一个口袋状结构,且该结构周围的氨基酸残基相对保守,后被证实是底物甲硫氨酸亚砜的结合位点。小桐子MSRA蛋白的底物结合位点氨基酸构成为Tyr132、Glu144、Tyr184,另外,-GCFW-保守序列中的最后两位氨基酸Phe102、Trp103也参与了催化中心的形成(图6A),而-GCFW-保守序列结构域中的Cys101以及C端的保守Cys251、Cys257在维持结合位点空间结构方面也是不可或缺的。Ramachandram能量图分析显示有96.9%的氨基酸残基处于能量稳定区域,说明预测的三维结构可信(图6B)。小桐子MSRA空间结构核心区域是3段琢-螺旋包裹的6条茁-折叠片层结构,呈现琢/茁卷状,二级结构组成顺序以茁1-琢1-茁2-茁3-琢2-茁4-琢3-茁5-茁6排列,并且茁1与茁6较短,而核心4条茁-折叠较长,在拓扑结构上排列为反平行方式。另外,在茁2与茁3之间有1段极短的琢-螺旋,在琢2与茁4之间存在2条反平行的极短茁-折叠与1段极短琢-螺旋,而在靠近N末端还存在1段极短琢-螺旋,C端存在2段极短琢-螺旋。蛋白质核心区域被两端柔性区包裹,包括N端的92个氨基酸残基(Met1-Glu92)与C端的33个氨基酸残基(Ala227-Gly259)。
2讨论
甲硫氨酸亚砜还原酶作为生物体内的抗氧化修复因子属于多基因家族,目前已经报道的甲硫氨酸亚砜还原酶有三个亚家族,不同家族虽然催化相似的反应,但没有一级氨基酸序列及三维结构相似性(Rouhieretal.,2006)。最早被报道的两个亚家族是MSRA与MSRB,MSRA与MSRB能够分别特异性地还原Met-S-SO与Met-R-SO,且两者既可以催化游离的甲硫氨酸亚砜,也可以催化蛋白表面的甲硫氨酸亚砜。第三个MSR家族最早在大肠杆菌中发现,命名为fRMSR(freemethionine-R-sulfoxidereductase),而该酶只能催化游离的甲硫氨酸亚砜。MSRA最早从大肠杆菌中分离出来的,是一类相对较小的胞质酶,编码该酶蛋白的基因广泛存在于生物界,如梭状芽孢菌(Clostridiumsp.Ohilas)、金属还原菌(Shewanellaoneidensis)、嗜热古生菌(T.kod-akaraensis)、酵母菌、拟南芥、杨树、果蝇、小鼠、大鼠及人。该亚家族不同种属间同源性不高,但其催化部位的氨基酸序列是非常保守的。在N端存在一个保守序列-GCFWG-(尤其是中心的Cys),这一序列的突变将导致MSRA完全失活;另外,在C端存在两个保守的还原型Cys残基,以上三个保守的Cys在空间结构上共同参与MSRA催化中心的构成(Rouhieretal.,2007)。MSRB最初也是从大肠杆菌中发现的,且在黄单孢菌(Xanthomonascampestris)、梭状芽孢菌(Clostriidiumsp.Ohila)、拟南芥、烟草、果蝇及人等生物体中都存在,属多基因亚家族,在不同生物体(如人,小鼠等)中一般都有3个MSRB,主要定位于内质网与线粒体,其N端定位信号肽在不同的MSRB中较为保守。MSRB在其N端同样存在-GCGWP-保守序列,除此之外,大部分MSRB在其C端仅存在一个保守的Cys残基(Dingetal.,2007)。与MSRA不同,MSRB中还包含两个-CXXC-保守序列,用于结合Zn2+或Fe2+,共同构成MSRB的活性中心(Olryetal.,2005)。
目前关于MSRA与MSRB的表达、调控及作用机理的研究主要集中在微生物及动物中,如大肠杆菌、酵母菌、小鼠及人等,而对于植物MSR的研究报道近几年才逐渐增多,本研究中克隆的小桐子MSRA基因也是首次报道。研究发现,拟南芥中至少存在5个编码不同形式的MSRA基因AtMSRA1-At-MSRA5,同时存在至少9个MSRB基因AtMSRB1-AtMSRB9;另外,在毛白杨中发现9个MSR基因,包括5个MSRA与4个MSRB;在水稻中发现4个MSRA与3个MSRB基因。利用在线软件预测发现,不同的MSR在植物细胞中有不同的定位,目前发现的包括细胞质、叶绿体、线粒体、内质网及分泌型MSR等(Rouhieretal.,2007)。芯片数据与转录组数据都表明不同亚细胞定位的MSR有着不同的组织表达模式,胞质型MSR通常在所有组织器官中都有表达,叶绿体型MSR主要在绿色组织尤其是叶中表达。Romero等(2004)通过RT-PCR分析了拟南芥不同MSR类型的组织表达特异性,结果表明,AtMRA4在除根以外的所有组织中的表达量都很丰富,其总表达量在所有MSRA中也是最高的;AtMSRA2和AtMSRA3表达量仅次于AtMSRA4,且主要在根和茎中表达;而AtMSRA1和AtMSRA5在所有组织中的表达量都很少;AtMSRB2、AtMSRB6的表达量在叶和其它绿色部位中最高,而AtMSRB5、AtMSRB7、AtMS-RB8、AtMSRB9则主要在根中高表达。大量数据表明,各种生物与非生物胁迫可以诱导高等植物不同MSR基因的表达,强光与盐胁迫可以强烈诱导拟南芥质体型AtMSRA4的表达(Gustavssonetal.,2002)。定位在内质网中的AtMSRB3可清除在植物受冷胁迫时内质网中积累的MetSO和ROS,过表达AtMSR-B3可以提高拟南芥植株的耐寒性(Kwonetal.,2007)。而水稻OsMSRB1.1在受到包括盐、甘露醇、低温、甲基紫精和ABA在内的非生物胁迫时表达量上升,而高温处理则会使OsMSRB1.1表达量下降(Guoetal.,2009)。以上事实说明MSR基因表达种类的多样性与组织特异性、表达调控的复杂性以及与植物应答逆境胁迫的关联性,同时也暗示其在植物抗逆性研究中的应用前景。
3材料与方法
3.1实验材料及处理供试小桐子种子采自云南省楚雄州元谋县。选取饱满的小桐子种子,用1.5%CuSO4消毒20min,无菌水漂洗5次,于26℃的恒温培养箱中吸涨24h(李忠光和龚明,2010)。将吸涨的种子在无菌水中漂洗3次,播于垫有5层用无菌水湿润滤纸的白磁盘(24cm伊16cm)中,于相对湿度75%、昼夜温度26/20℃、光周期16/8h的恒温培养箱中萌发5d。之后将发芽的种子播于消毒的培养土中并于同样恒温培养箱中培养15d至第二片真叶展开。取第二片真叶材料,液氮速冻后置于-80℃冰箱中用于RNA的提取。
3.2菌株与主要试剂大肠杆菌Trans1-T1(DH5琢)菌株由本实验室保存;TransZolUp、DNase玉、TransStartTaqDNAPoly-merase、Amp、X-gal、IPTG、2伊EasyTaqPCRSuperMix(+dye)、TransScriptTwo-StepRT-PCRSuperMix、EasyPureQuickGelExtractionKit、EasyPurePlasmidMin-iPrepKit、pEASY-T1CloningKit、Trans2KPlus域DNAMarker购自全式金生物技术有限公司;引物合成和测序由深圳华大基因有限公司完成。
3.3实验方法
3.3.1总RNA的提取及cDNA第一链的合成取0.2g小桐子叶片材料,按照王海波等(2014)的方法利用TransZolUp试剂提取并纯化总RNA。以AnchedOli(dT)18为逆转录引物,利用TransScriptTwo-StepRT-PCRSuperMix合成第一链cDNA。
文章编号:1007-7847(2015)02-0119-05Bioinformatic Analysis of TATA-binding Protein of ZebrafishYANG Shao-bin, FENG Jing-wen, ZHAO Wen-cheng, WANG Zhao-song, XU Shi-lei*(Tianjin Medical University Cancer Institute and Hospital, National Clinical Research Center for Cancer, Tianjin Key Laboratory of Cancer Prevention and Therapy, Tianjin 300060, China)Abstract : TATA-binding protein (TBP) is important in the process of transcription initiation in zebrafish. By means of bioinformatic methods, TBP of zebrafish is illustrated and analyzed by physicochemical property, sequence homology among different species, conserved domains, transmembrane structures, hydrophilici ty/hydrophobicity, protein secondary structure, protein tertiary structure, as well as protein-protein interactions. The results showed that zebrafish TBP consists of 302 amino acids, with isoelectric point of 9.8. This protein belongs to the TBP superfamily without transmembrane structure, and it is a hydrophilic protein. The secondary structure analysis showed that it contained 5 a. helices and 8 f3 sheets and random coil was the major structure element. The reliability of predicted three-dimensional structure of zebrafish TBP was up to 98.9%. Further analysis proved that the predicted protein structure was stable. It showed that the 10 most relevant interaction proteins with the zebrafish TBP were all transcription factors or TF II D complex members. Therefore, the results provided great information about zebrafish TBP in transcription regulation for further research.Key words: zebrafish; TATA-binding protein; bioinformatics(Life Science Research, 2015,19(2): 119?123)
TATA结合蛋白(TATA-binding protein,TBP)址一种特异性结合DNA序列上TATA框的转录因子。TATA序列存在于真核细胞基因启动子中转录起始位点上游30个bp左右[1]。TBP与其他一些TBP相关蛋白共同组成厂TFⅡD复合物,TFⅡD是一种常见的转录因子,它是RNA聚合酶Ⅱ起始复合体的组成部分。TBP能够帮助RNA聚合酶Ⅱ跨过转录起始位点。TBP在DNA双链解链(double strand separation)的过程中也起到一定的作用,这是通过其能够使DNA弯曲80°来实现[2-4]。TBP的另一个特点是含有一长串谷氨酰胺氨基酸残基。这个区域调节TBP的C端和DNA的结合能力、转录复合体形成的比率以及转录的起始。斑马鱼属于鲤科,鲤目。由于再生能力强的特性,斑马鱼经常被当作研究脊椎动物的生物模型[5]。分析研究斑马鱼TBP有助于更好地理解斑马鱼基因转录过程。到目前为止,对斑马鱼TBP的生物学研究已经有一定的进展,但是对其生物信息学分析还未见报道。为此,本研究采用生物信息学方法,对斑马鱼TBP的理化性质、保守结构域、跨膜区、亲水性/疏水性、二级结构、三级结构、与其他物种亲缘关系等进行预测和分析,为其后续研究奠定全面的理论基础。1材料与方法1.1材料数据资料来源于UniProt网站已经注册的TBP氨基酸序列。其中TBP:斑马鱼zebrafish(Q7SXL3)、非洲爪蛙Xenopus laevis( P27633)、小鼠Mouse( P29037)、牛Bos taurus (Q2HJ52)、人Human( P20226)。1.2方法利用ProtParam分析蛋白质理化性质;蛋白序列同源性、多序列比对及序列系统进化树分别由NCBI protein blast .ClustalX2.0、njplot等软件实现;利用TMHMM、ProtScale分析蛋白质的跨膜区和疏水性;NCBI Conserved Domains数据库用来分析保守区域;Jpred、Swiss-Model和Structural Analysis and Verification Server分别预测蛋白质二级、三级结构及其合理性。String则用来预测蛋白质的相互作用。各软件、数据库的相关信息如表1。2结果与分析2.1斑马鱼TBP的理化性质预测和分析使用ProtParam蛋白质理化性质预测网站对5种TBP进行理化性质预测,得到结果如表2。结果显示,TBP基因在5个不同物种中编码的氨基酸个数在297~339之间;相对分子质量在32702.8~37698.1之间;各物种TBP等电点差异其微,均在9.8附近,说明TBP是碱性蛋白质;TBP在5个物种中的半衰期均达到了30h;5种蛋白的不稳定系数均大于40,表明它们不是稳定蛋白;各TBP的脂肪族系数在76.58~88.65之间;5种蛋白的平均疏水性均为负值,表明它们都是亲水蛋白质。2.2斑马鱼TBP的同源性预测和分析
中图分类号:Q949.71
文献标识码:A
铁皮石斛(Dendrobiumofficinale)属于兰科(Orchidaceae)石斛属(Dendrobium)多年生的草本植物,铁皮石斛含石斛多糖、石斛碱、双苄酚类、菲酚类等多种药效成分,是石斛属药用植物中最为珍稀名贵的种,具有滋阴清热、润肺止咳、益胃生津、明目强身等作用(Zhangetal,2000)。核酮糖1,5二磷酸羧化酶/加氧酶(Ribulose1,5bisphosphatecarboxylase/oxygenase,Rubisco)是存在于叶绿体内的一个双功能酶,同时催化卡尔文循环中最初固定CO2的反应以及光呼吸作用中的第一步反应,该酶处于光合碳还原和碳氧化两个方向相反但又相互关联的循环交叉点上,对净光合速率起着決定性的影响,因此提高Rubisco活力是提高光合作用的重要途径(潘瑞炽等,2004)。因铁皮石斛原生地的生境破坏和常年的滥采乱挖,野生资源遭到严重的破坏,濒临灭绝,已列入中国珍稀濒危保护植物的名录。由于石斛不能够栽培在土壤里,北方地区必须栽培在树皮、木块、锯末等做的栽培床或者是石头上,冬天多数需要盖温棚等设施,投资较大,加上石斛种植的技术要求高,目前市场尚未完全打开,发展速度还不是很快(张明等,2010)。
随着生物技术的发展,许多粮食作物如大麦(Rundle&Zielinski,1991)、水稻(Toetal,1999)、大豆(Yinetal,2014)等植物的RCA基因被克隆,但目前报道的RCA基因很少有涉及药用观赏植物,最近有朱明库等(2013)对羽衣甘蓝Rubisco活化酶基因BoRCA的克隆、生物信息学及表达分析的研究;袁秀云等(2016)对蝴蝶兰Rubisco活化酶基因PhRCAα的序列特征及在低温胁迫下的表达分析的研究;祝钦泷等(2011)对彩叶草Rubisco活化酶基因SsRCA进行了组织表达特异性和光诱导表达特性研究;曾淑华等(2012)已从铁皮石斛中克隆了光合碳途径关键酶磷酸烯醇式丙酮酸羧化酶基因。因此,开展铁皮石斛RCA基因研究显得尤为必要。本研究为了提高石斛的质量,提高石斛光合效率,揭示铁皮石斛光合作用机理自然成了铁皮石斛研究领域的重要问题,该研究利用RACE技术克隆出铁皮石斛RCA2全长基因,并进行生物信息学分析,为进一步研究铁皮石斛光合作用调节机理奠定基础。
1材料与方法
1.1材料
铁皮石斛原产地为贵州,现在种植于河南省郑州市郑州师范学院兰花工程技术研究中心智能日光温室,植物材料为一年生铁皮石斛。
1.2方法
1.2.1RNA提取选取一年生铁皮石斛叶片,液氮速冻,保存于-80℃冰箱备用。叶片总RNA提取采用多糖多酚植物总RNA提取试剂盒(Tiangen公司);采用1%琼脂糖凝胶电泳鉴定RNA的完整性;采用QuawellQ5000微量紫外可见分光光度计测定其A260/A280值及其浓度。
1.2.2RCA2基因全长的克隆以提取的叶片总RNA为模板,用反转录试剂盒合成单链cDNA。根据GENBANK上已知植物的RCA保守区,利用DNAMAN和Primer5.0生物軟件设计兼并引物(表1),扩增RCA保守片段。PCR反应体系为20.0μL:10×PCRbuffer2.0μL、dNTPMix2.0μL、上游引物RCAF1(10μmol·L1)1.0μL、下游引物RCAR1(10μmol·L1)1.0μL、模板cDNA1.0μL、rTaq酶(5U·μL1)0.2μL,加灭菌双蒸水至总体积20.0μL;反应程序为94℃预变性5min;94℃变性40s,56℃退火40s,72℃延伸40s,35个循环;最后72℃延伸10min。切胶回收目的片段,连接pGEMTEasy载体,转化大肠杆菌DH5α,挑选阳性克隆送至上海英潍捷基生物技术公司测序,获得RCA基因的保守区序列。再根据获得的保守区序列,分别设计5′端和3′端特异性巢式引物(表1),以叶cDNA为模板,用巢式PCR方式分别扩增RCA的5′端和3′端序列,按Clontech公司SMARTerTMRACE扩增试剂盒操作说明进行反应,回收扩增目的产物,克隆到pGEMTEasy载体上,转入大肠杆菌DH5α菌株,进行测序和拼接。
1.2.3ORF的扩增根据DNAMAN软件拼接得到RCA基因序列全长,利用Premier5.0设计1对特异引物RCAF2和RCAR2(表1),用于完整开放阅读框(ORF)的扩增。PCR扩增程序为94℃预变性5min,94℃变性45s,58℃退火45s,72℃延伸1min,进行35个循环,72℃延伸15min。ORF片段连接到pGEMTEasy载体上,转化大肠杆菌DH5α,测序进行ORF序列验证。
1.2.4生物信息学分析利用ORFfinder进行开放阅读框的预测;利用NCBI上的BLAST进行基因相似性的分析(http://ncbi.nlm.nih.gov/blast/);利用DNAMAN进行氨基酸序列比对分析;利用ProtScale程序(http://expasy.org/tools/protscale.html)分析蛋白质亲疏水性;利用TargetP软件(UsingPLANTnetworks)和PSORTll(http://psort.hgc.jp/form.html)进行亚细胞定位的分析;利用Protfun(http://cbs.dtu.dk/services/ProtFun/)分析预测RCA2蛋白质结构功能和功能分类;利用ExPASy网站上的GOR进行蛋白质二级结构预测;利用ExPASy网站上的SWISSMODEL进行蛋白质三级结构的预测分析。
2结果与分析
2.1RCA2基因全长克隆
叶片总RNA提取后经1%琼脂糖凝胶电泳鉴定其完整性,检测结果显示,28S和18S条带清晰,A260/A280值1.96,浓度为210.56ng·μL1。
以铁皮石斛叶片总RNA反转录的cDNA为模板,以兼并引物RCAF1和RCAR2进行保守区片段PCR扩增,得到一个503bp保守片段(图1:B),根据设计的3′端和5′端特异引物,采用RACE技术,扩增获得3′端目的片段(图1:D)和5′端目的片段(图1:C)。利用生物软件DNAMAN进行序列拼接得到该基因的全长为1730bp,利用ORFfinder分析,共有9个ORF,该基因最长的ORF共计1323bp,包含81bp的5′UTR、326bp的3′UTR,编码440个氨基酸,将该基因命名为RCA2,GenBank登陆号为KT205842。利用引物RCAF2和RCAR2扩增获得1323bpORF片段(图1:A),连接到pGEMTEasy载体上测序验证,得到的阳性质粒命名为pGEMRCA2。
2.2RCA2基因全长的生物信息学分析
2.2.1RCA2核苷酸及编码蛋白序列的理化性质利用blastp和DNAMAN对RCA2氨基酸序列进行比对分析,发现该基因包含PloopNTPaseSuperfamily结构域,分别为“WGGKGQGKS”(A区)和“GKMCCLFINDLD”(B区),属于PloopNTPase超家族基因(图2)。理化性质分析该蛋白的分子质量为48.53kDa,等电点为6.19。将该基因全长核苷酸序列在NCBI上进行blastn相似性比较,结果表明基因均为RCA基因,且与蝴蝶兰(Phalaenopsis)的相似性高达87%。氨基酸序列比对分析,发现其氨基酸序列与蝴蝶兰、葡萄、荷花的相似性分别为89%、84%、85%(图3)。
2.2.2RCA2编码蛋白质的亲疏水性分析利用ProtScale分析蛋白的亲疏水性发现,RCA2蛋白质序列具有较高的亲水性,其中第69位的Thr亲水性最强(-3.078),第162位Leu的疏水性最强(2.122)(图4)。
2.2.3RCA2编码蛋白质的亚细胞定位蛋白的亚细胞定位与该蛋白所执行的功能是密切相关的,用TargetP和PSORTII软件进行亚细胞定位分析,TargetP预测结果显示RCA2蛋白定位于叶绿体基质,可信度为3(图5:A),用PSORTII预测蛋白显示,RCA2蛋白定位于叶绿体基质、线粒体基质间隙、叶绿体类囊体膜、叶绿体类囊体腔,RCA2蛋白主要存在于叶绿体基质(图5:B)。
2.2.4RCA2编码蛋白质的功能预测与分析利用ProtfunsoftwareofCBS分析预测RCA2蛋白质结构功能和功能分类,可能有意义的功能包括中间代谢、脂肪酸代谢、翻译、辅酶因子的生物合成和能量代谢等,他们的几率分别是5.484、4.387、4.048、3.639、3.098。这表明RCA2在中间代谢起到了一个非常重要的角色,在脂肪酸代谢、翻译中起到了重要作用,在辅酶因子的生物合成和能量代谢中也起到了关键作用。
2.2.5RCA2编码蛋白质的二级、三级结构预测采用ExPASy网站上的GOR进行蛋白质二级结构预测,结果表明,α螺旋占30.68%,延伸链占25.45%,不规则折叠占43.86%(图6)。用ExPASy网站上的SWISSMODELWorkspace预测蛋白质的三维结构以4w5w.1.A(SMTLid)为模板进行建模,该模板以XRAY2.90方法产生,与RCA2蛋白一致性为86.02%(图7)。
3讨论与结论
中图分类号 S662.2 文献标识码 A 文章编号 1007-5739(2017)06-0081-04
Analysis on Insilico Cloning and Bioinformatics of Vaccinium corymbosum UFGT Gene
XIN Xiao-juan 1 MA Wei 2 * LI Yu-cheng 3
(1 Daxing′ anling Academy of Agriculture and Forestry in Heilongjiang Province,Daxing′ anling Heilongjiang 165000; 2 Heilongjiang University of Chinese Medicine; 3 Daxing′ anling Forestry Administration)
Abstract [Objective]Using electronic cloning technology to predict UFGT gene of Vaccinium corymbosum.[Methods]Taking Vaccinium uliginosum UFGT sequence as the probe sequence,based on EST sequence from NCBI and assembled by CAP3 sequence assembly programme,using bioinformatics database and related software to predict the structure and function analysis.[Results]The full length of UFGT gene was 1 789 bp and it contained a 1 161 bp ORF,encoding 386 amino acid and the protein is a hydrophilic protein.[Conclusion]The study can provide theoretical and experi-mental basis for further explain of molecular genetic function.
Key words Vaccinium corymbosum;UFGT;insilico cloning;bioinformatics
高丛越桔(Vaccinium corymbosum)原产地为北美,是杜鹃花科(Ericaceae)越桔属(Vaccinium)木本植物,比^适合在中国北方地区栽培,是经济价值最高的优良品种,因其果实大、品质佳、口感好深受人们青睐[1]。
类酮类化合物在高等植物界分布广泛,可以参与花、叶片及果实等颜色的形成,还具有抗炎、抗癌、抗氧化和保护心脑血管系统等多种药理作用[2]。植物中的类黄酮-3-O-葡萄糖基转移酶(UFGT)处于类黄酮合成途径中,形成各种花色苷[3]。目前,科研人员已在葡萄、玉米、水稻、草莓、荔枝等植物上对UFGT基因进行了分析研究[4-5]。
电子克隆是一种基因克隆方法,具有高效、快速、投入低,并可以为实验克隆提供精准的参考序列等优点[6-8]。
本研究基于电子克隆技术,对预测的高丛越桔的UFGT基因进行序列分析,从理化性质、亚细胞定位、氨基酸组成、信号肽、跨膜结构域等方面对该基因编码的蛋白进行了预测,以期为进一步解释基因的分子功能奠定理论及实验基础。
1 材料与方法
1.1 电子克隆获得新基因序列
以笃斯越橘UDP-glucose:flavo-noid 3-O-glucosyltran-sferase(UFGT)基因(KP218512)作为探针,使用Blastn工具检索NCBI中与探针序列同源性较高的高丛越桔EST序列,使用在线工具CAP3[9]进行拼接,以拼接好的重叠群(Contig)为探针,再次Blast检索,如此反复。
1.2 生物信息学分析
对预测的高丛越桔UFGT基因序列进行分析,具体在线生物信息学软件如表1所示。
2 结果与分析
2.1 新基因的识别
以笃斯越橘UDP-glucose:flavo-noid 3-O-glucosyltran-sferase(UFGT)基因(KP218512)为探针,获得全长为1 789 bp的Contig 1条,其开放阅读框长度为1 161 bp,编码386个氨基酸,具体见图1。
2.2 高丛越桔UFGT基因编码氨基酸一级结构预测
蛋白质是生命功能的执行者,分析蛋白质的氨基酸序列,是蛋白质研究的重要组成部分。基于蛋白质数据库,通过在线软件ProtParam[10],对高丛越桔UFGT基因编码的氨基酸的一级结构预测见表2。
2.3 高丛越桔UFGT信号肽预测和分析
蛋白质的跨膜转运主要依靠信号肽指导。采用SignaIP-4.1 Server[11],预测高丛越桔UFGT的信号肽,结果如图2所示。可以看出,高丛越桔UFGT基因所编码的蛋白质不存在信号肽,该蛋白不进行转运。
2.4 高丛越桔UFGT蛋白疏水性/亲水性分析
对高丛越桔UFGT编码的氨基酸用ProScale在线软件[12]进行亲疏水性预测,一般负值越大表示蛋白亲水性越强,正值越大疏水性越强,结果如图3所示。可以看出,高丛越桔UFGT编码的蛋白为亲水性蛋白质,最小值-1.476,最大值1.205,这与一级结构预测的结果一致。
2.5 高丛越桔UFGT蛋白质跨膜结构预测
生物膜功能的主要承担者为膜蛋白。通过在线跨膜蛋白结构预测TMpred软件预测其蛋白质跨膜区和跨膜方向,结果如图4所示。可以看出,该蛋白中存在3个跨膜区,即32-51、86-104、249-270氨基酸位置。
2.6 高丛越桔UFGT蛋白的亚细胞定位
蛋白质由位于细胞质中的核糖体合成之后,需要转运到合适的位置才能正常行使其功能。基于蛋白质数据库,使用Psort在线软件[13]对高丛越桔UFGT蛋白进行亚细胞定位,具体结果见图5。可以看出,该蛋白在细胞质和线粒体的概率是39.1%,在细胞核的概率是13.0%,在细胞液中有8.7%的概率,可能主要分布于细胞质和线粒体中。
2.7 高丛越桔UFGT蛋白的二级结构预测
蛋白质中约85%的残基处于3种稳定二级结构,即α-螺旋、β-折叠和β-转角。二级结构预测的目的是根据一级结构判断残基是否处于特定二级结构。基于蛋白数据库,通过在线软件SOPMA[14] 对高丛越桔UFGT蛋白进行二级结构预测,具体结果见图6。可以看出,该蛋白质的二级结构主要由4种形式组成,即由α-螺旋占41.97%,无规卷曲占30.57%,延伸链占17.88%,β-转角占9.59%。据此推测,α-螺旋是高丛越桔UFGT蛋白二级结构中数量最多的结构元件。
2.8 高丛越桔UFGT蛋白的三级结构预测
采用同源建模法,利用SWISS-MODEL在线软件[15]对高丛越桔UFGT蛋白的三级结构进行预测,具体结果见图7。可以看出,该蛋白主要有无规则卷曲、α-螺旋2种结构,同时还伴随着延伸链、β-转角2种结构,基本与二级结构预测结果一致。
2.9 蛋白质磷酸化位点分析
蛋白质翻译后有精氨酸甲基化、磷酸化、ADP核糖基化、糖基化等多种修饰形式,其中,磷酸化是一种重要的共价修饰方式。利用NetPhos 3.1 Server在线软件分析[16]的具体结果见图8。可以看出,有15个丝氨酸(Ser)、10个苏氨酸(Thr)、1个酪氨酸(Tyr)可能成为蛋白激酶磷酸化位点。
3 结论与讨论
目前,越桔具有较高的营养价值,且药理作用正逐渐被人们认识[17]。越桔含有丰富的多酚类物质,如黄酮醇、酚酸和花青素。其中黄酮醇具有降低心血管和退化性疾病的风险能力[18]。花青素被证明具有减轻炎症、降低血糖、影响脂质代谢和脂肪沉积、减少大分子的氧化损伤[19]等作用。
通过电子克隆技术预测高丛越桔UFGT基因,全长为1 789 bp,开放阅读框长度为1 161 bp,编码386个氨基酸。该蛋白为亲水性的非分泌蛋白,且其中存在一处跨膜区。该蛋白主要由α-螺旋、无规则卷曲构成的二级结构,在细胞质和线粒体中分布的可能性最大,有15个丝氨酸(Ser)、10个苏氨酸(Thr)、1个酪氨酸(Tyr)可能成为蛋白激酶磷酸化位点[20-21]。通过本研究预测的结果,为未来UFGT基因在高丛越桔中提取、克隆及基因功能方面的研究奠定基础,同时也为电子克隆技术的广泛应用提供参考。
4 参考文献
[1] 赵建萍,柏新富,蒋小满,等.北高丛越桔芽器官离体培养与快繁体系的建立[J].林业科学,2007,43(5):111-115.
[2] 周军,姚泉洪,彭日荷,等.巨峰葡萄查尔酮异构酶基因克隆及表达分析[J].西北植物学报,2009,29(9):1723-1729.
[3] KOBAYASHI S,ISHIMARU M,DING C K,et parison of UDP-glucose:flavonoid 3-O-glucosyltransferase (UFGT) gene sequences be-tween white grapes(Vitis vinifera) and their sports with red skin[J].Plant Science,2001,160(3):543-550.
[4] 付海辉,辛培尧,许玉兰,等.几种经济植物 UFGT 基因的生物信息学分析[J].基因组学与应用生物学,2010,30(1):92-102.
[5] 赵志常,胡福初,胡桂兵,等.荔枝类黄酮糖基转移酶 (UFGT) 基因的克隆及其原核表达研究[J].广西师范大学学报(自然科学版),2011,29(4):104-110.
[6] HUMINIECKI L,BICKNELL R.In silico cloning of novel endothelial-specific genes[J].Genome Research,2000,10(11):1796-1806.
[7] GILL R W,SANSEAU P.Rapid in silico cloning of genes using expressed sequence tags (ESTs)[J].Biotechnology annual review,2000,5:25-44.
[8] 王冬冬,朱延明,李勇,等.子克隆技术及其在植物基因工程中的应用[J].东北农业大学学报,2006,37(3):403-408.
[9] PHUANG X,MADAN A.CAP3:A DNA sequence assembly program[J].Genome research,1999,9(9):868-877.
[10] GASTEIGER E,HOOGLAND C,GATTIKER A,et al.Protein identifi-cation and analysis tools on the ExPASy server[M].Humana Press,2005.
[11] PETERSEN T N,BRUNAK S,VON HEIJNE G,et al.SignalP 4.0:disc-riminating signal peptides from transmembrane regions[J].Nature met-hods,2011,8(10):785-786.
[12] KYTE J,DOOLITTLE R F.A simple method for displaying the hydr-opathic character of a protein[J].Journal of molecular biology,1982,157(1):105-132.
[13] PSORT I I.PSORT:a program for detecting sorting signals in proteins and predicting their subcellular localization[J].J.Mol.Biol,1997,266:594-600.
[14] GEOURJON C,DELEAGE G.SOPMA:significant improvements in pr-otein secondary structure prediction by consensus prediction from mul-tiple alignments[J].Computer applications in the biosciences:CABIOS,1995,11(6):681-684.
[15] BIASINI M,BIENERT S,WATERHOUSE A,et al.SWISS-MODEL:m-odelling protein tertiary and quaternary structure using evolutionary in-formation[J].Nucleic acids research,2014:340.
[16] BLOM N,GAMMELTOFT S,BRUNAK S.Sequence and structure-ba-sed prediction of eukaryotic protein phosphorylation sites[J].Journal of molecular biology,1999,294(5):1351-1362.
[17] 李丹,林琳.越桔食品资源的开发与利用[J].食品与发酵工业,2000,26(4):76-81.
[18] 刘淑兰,吕秀莲,王晓军,等.越橘的化学成分与药理活性研究进展[J].中医药学报,2006,34(6):53-54.
【关键词】 甲胎蛋白;镇痛抗肿瘤肽;真核表达载体;肝肿瘤
Abstract: ? Objective: To construct a gene-modified hepatocellular carcinoma?(HCC)?specific AGAP expression vector regulated by the cis-acting element of AFP. The physicochemical property and structural characteristics of the protein were analyzed and predicted by computer-aided analysis to establish a basis for exploring biotoxin thepapy for tumor. Method:?The AGAP DNA fragment was amplified through RT-PCR from the total RNA of Chinese Buthus Martensii Karsch. It was then cloned into the plasmid pGL3/AFP. The recombinant plasmid pAFP-AGAP was identified by restriction endonucleases and nucleotide sequence. The protein analysis software were utilized to predict the flexibility,hydrophilicity,and antigenicity of the new AGAP protein. Then the expression levels of AGAP mRNA were detected by reverse transcriptase polymerase chain reaction?(RT-PCR)?after the recombinant plasmid being transfected into HepG2 cell line. Results:?Through the analysis of the software,?it could be found that the secondary structure of the new AGAP didn’t almost changed and remain their biologic activity. The recombinant plasmid was successfully to express AGAP mRNA in HepG2 cell line. Conclusion:?The recombinant vector is constructed successfully.
Key words: ?alpha fetoprotein;analgesic-antitumor peptide;eukaryotic expression vector; hepatocellular carcinoma
肝细胞癌(hepatocellular carcinoma,HCC)是全球最常见的恶性肿瘤之一,是我国癌症患者病死率最高的疾病之一。手术、放化疗及介入等常规治疗效果均不理想,不能从根本上改善患者的预后。目前,利用基因工程的手段,实现AFP转录调控序列驱动目的基因表达,对肝癌进行基因治疗,是肝癌治疗的热点[1]。另外,蝎毒是一种毒性仅次于蛇毒的生物毒素,早在宋代全蝎就被用于治疗惊厥、癫痫及肿瘤等疾病。很多人试图从蝎毒中提取有抗肿瘤活性的组分,开发有效的、相对毒副作用较小的新药。近年来,东亚钳蝎毒(Buthus martensii Karsch)的药用研究是我国生物毒素方面研究和开发的热点之一。东亚钳蝎镇痛抗肿瘤肽(Analgesic-antitumor peptide,AGAP)就是从东亚钳蝎毒中分离出的一种有效的抗肿瘤成分,对多种肿瘤细胞有细胞毒作用,并对动物移植癌有抑制作用[2-3]。本实验利用基因工程手段,构建重组质粒,实现AGAP细胞内直接表达,省去了蝎毒分离、纯化等繁琐步骤,为进一步研究其在肝癌基因治疗中的作用奠定了基础。
1??材料和方法
1.1??材料??携带有效AFP启动子和增强子组合的质粒pGL3/AFP由Cheng Qian(Fundación para la Investigación Médica Aplicada)构建馈赠。菌株DH5α和人肝癌细胞(HepG2)由本室冻存。RNA提取试剂(RNAiso Reagent)、逆转录试剂盒(BCa BESTTM RNA PCR Kit Ver 1.1)购自大连宝生物公司,各种限制性内切酶、T4 DNA连接酶购自Fermentas公司,质粒提取试剂盒(EZ Spin Col-umn Plasmid DNA Minipreps Kit)购自BBI公司,琼脂糖凝胶DNA回收试剂盒购自TIANGEN公司,DMEM培养基购自HyClone公司,胰酶购自Gibco公司,胎牛血清购自杭州四季青公司,LipofectamineTM 2000购自美国Invitrogen公司。
1.2??引物设计??根据GeneBank中AGAP(AF464898)能表达66个成熟肽的基因序列及pGL3/AFP序列进行引物设计。AGAP基因上游引物顺序为:5’- CATGCC ATGGCCGTACGCGATGGTTATATTGCCG -3’,引入了Nco I酶切位点,下游引物顺序为:5’- TGCTCTAGAGACCG CCATTGCATTTTCCTG -3’,引入了Xba?I酶切位点,酶切位点已含起始密码和终止密码。
1.3??AGAP基因克隆??取新鲜的蝎尾,抽提RNA,按试剂盒步骤操作。利用RT试剂盒反转录出cDNA第1链,引物采用Oligo dT,条件为:65 ℃ 1 min、30 ℃ 5 min、65 ℃ 20 min、98 ℃ 5 min、5 ℃ 5 min。采用高保真Taq酶进行随后的PCR反应。PCR条件为:94 ℃预变性5 min,94 ℃ 30 s、54 ℃ 30 s、72 ℃ 1 min,28个循环,末次72 ℃延伸5 min。取PCR产物电泳,后用琼脂糖凝胶回收试剂盒回收待用。
1.4??pAFP-AGAP真核表达载体构建及鉴定??取质粒pGL3/AFP用Nco?I和Xba?I双酶切,将所需载体片段4?188 bp经电泳分离出并回收。胶回收的AGAP基因片段经Nco?I和Xba?I双酶切,获目的基因201 bp与所需载体片段4?188 bp按3:1的比例混合,加入T4 DNA连接酶进行连接反应,16 ℃过夜。将上述连接产物转化大肠杆菌DH5α,扩增后质粒提取试剂盒提取。新构建重组真核表达载体pAFP-AGAP(见图1)酶切鉴定并测序。双向测序由华大基因完成。
1.5??生物信息学分析??DNA测序验证重组质粒pAFP-AGAP的方向性和正确性,双向序列测定由华大基因公司完成,测序结果使用Gene bank Blast进行比对;采用Vector NTI软件对pAFP-AGAP序列进行读框(ORF)分析,然后用Translation程序推导并输出氨基酸序列;应用expasy.org网站提供的ProtParam方案以及DNAStar软件中的Protean程序进行蛋白理化性质分析。
1.6??重组质粒实现细胞表达??HepG2细胞复苏后置于含10%胎牛血清、100 U/mL青霉素、100 U/mL链霉素DMEM培养液中,37 ℃,体积分数5 %CO2条件下培养。转染前1 d,用新鲜无抗性培养液调整细胞密度为1×105/mL,以每孔2 mL接种于6孔板培养过夜。次日将质粒pAFP/AGAP与脂质体(g/L)以1:3比例混合后转染HepG2细胞,按LipofectamineTM 2000说明书操作。转染后24 h,Trizol提取每孔细胞的RNA。RT-PCR 法检测AGAP mRNA表达(条件同上),其扩增产物电泳并测序鉴定。双向测序由华大基因完成。
2??结果
2.1??AGAP基因克隆??提取的总RNA A260/A280比值为1.82,表明总RNA较纯。以反转录的cDNA为模板,用设计的引物进行PCR扩增,所得特异性条带208 bp与预期长度相符(见图2)。
2.2??重组质粒酶切鉴定??重组质粒pAFP-AGAP经Nco?I和Xba?I双酶切为201 bp和4?149 bp两片段,Xba?I单酶切符合4?395 bp大小,还用Kpn?I和Xba?I双酶切pAFP-AGAP便于观察,得3?081 bp和1?308 bp两个片段(见图2)。
2.3??生物信息学分析??pAFP-AGAP经双向测序结果证实融合基因插入方向正确,经Gene bank Blast比对,有98%的碱基与GenBank序列相同,部分不同可能由基因突变或者基因克隆过程中错配引起。结果显示AGAP基因序列与原设计相符。重组质粒Vector NTI读框分析表明,含AFP顺式作用元件的真核表达载体pAFP-AGAP下游插入了完整的目的基因AGAP,起始密码ATG,终止密码TAG,编码68个氨基酸。ProtParam分析显示,该AGAP蛋白分子量:16?355.9 Da,等电点:5.36,分子式: C606H1010N204O257S34,半衰期: 30 h(哺乳动物),不稳定系数: 20.97,该蛋白分类为稳定蛋白。DNAStar软件中的Protean程序分析,本实验所表达的AGAP蛋白与GeneBank中AGAP蛋白,虽然序列有两个碱基不同,并未完全正确表达增加的碱基数,但柔性、亲水性、抗原性未发生改变,也没有新的表位出现,二级结构也基本相同(见图3)。因此,我们可以预测pAFP-AGAP能正确表达AGAP,并与传统蛋白分离后的AGAP成分有相同的效果。
2.4??RT-PCR方法测重组质粒在细胞中的表达??电泳结果(见图4)显示HepG2细胞存在AGAP mRNA的表达,证实构建的重组质粒能正确读码并转录表达。
3??讨论
从1968年Abelev将甲胎蛋白(AFP)作为肝癌的肿瘤标志物到现在,可谓历史悠久。后来发现许多肿瘤标志物的表达受该肿瘤特异性顺式作用元件或反式作用因子的调控,故可将目的基因置于此类肿瘤特异性调控序列的调控之下,使目的基因(特别是细胞毒性基因)在肿瘤细胞异性地表达,而不影响其他组织,可实现肿瘤的靶向基因治疗。Kunitomi等[4]将白喉毒素片段A基因(DTA)连接在AFP启动子下游,作用于肝癌组织, 结果肝癌细胞中DTA基因大量表达并促使肿瘤细胞死亡。但后来发现,用AFP基因全部5’-端序列作为调控,专一性不好。Ido等[5]研究发现,人300 bp AFP启动子有效长度足以在人、大鼠细胞中启动目的基因表达。由于AFP的表达很大程度上依赖于增强子的活性,一些研究者试图利用其增强子的功能来增强转染基因的表达。Kanai[6]将AFP基因的启动子和增强子同时与自杀基因胞嘧啶脱氨酶(cytosine deaminase,CD)基因融合,转染肝癌细胞,使CD基因在肝癌组织特异性高效表达。
此外,传统的中医药在调节机体免疫功能方面有着西药无可取代的作用,是很好的抗肿瘤药物。其中,中药蝎毒广为应用,我国华南、华东地区的东亚钳蝎也称马氏钳蝎更是丰富。蝎毒成分复杂,AGAP是Liu等[7]分离纯化得到的单组分活性肽,兼有抗肿瘤活性和镇痛活性于一体。AGAP成熟肽含有66个氨基酸残基,从一级结构分析,推测是Na+离子通道抑制剂,但是AGAP具体的作用机制不明确。现已发现,蝎毒对人低分化鼻咽上皮癌细胞株、B16黑色素瘤[8]、卵巢癌细胞HO-8910[9]、结肠癌细胞等多种恶性肿瘤都存在抑制作用。孔天翰等[2-3]也证实,蝎毒对人食管癌细胞、人喉癌细胞、人直肠腺癌细胞、人肝细胞癌细胞(SMMC-7721)、人胃癌细胞等多种人肿瘤细胞具有显著的细胞毒作用,体内动物实验还发现可明显抑制H22荷瘤小鼠肿瘤的生长。
考虑到以上的因素,本实验正是利用含最短最有效AFP启动子和增强子组合的质粒pGL3/AFP来作为载体来构建重组质粒,实现高效的表达,为肝癌的基因靶向治疗提供了有力工具。实验结果显示,我们构建的重组质粒pAFP/AGAP,软件分析结果表明,所表达的目的蛋白α螺旋、β折叠等二级结构,以及亲水性、柔性、抗原性、表位等生物学活性几乎未受到影响,而且所构建质粒转染细胞后成功完成转录表达。因此,利用计算机辅助分析和预测蛋白质的理化和结构特征可使我们很好地了解所表达蛋白质的生物功能,对进一步的研究具有一定的指导性,而且可节省很多的时间和开支[10]。
参考文献
[1] Schmitz V, Qian C, Ruiz J, et al. Gene therapy for liverdiseases: recent strategies for treatment of viral hepatitisand liver malignancies[J]. Gut,2002,50(1):130-135.
[2] 孔天翰,林山,韩雪飞,等.蝎毒多肽对肿瘤细胞的抑制作用研究[J].中国病理生理杂志,2004,20 (6) :968-972.
[3] 魏玲,董伟华,孔天翰.东亚钳蝎毒抗癌多肽对人肿瘤细胞系和动物移植瘤的作用[J].中国癌症杂志,2002,12(2):97-101.
[4] Kunitomi M, Takayama E, Suzuki S, et al. Selective inhibi-tion of hepatoma cells using diphtheria toxin A under thecontrol of the promoter/enhancer region of the humanalphafetoprotein gene[J].Jpn J Cancer Res,2000,91(3):343-350.
[5] Ido A, Nakata K, Kato Y, et al. Gene therapy for hepatomacells using a retrovirus vector carrying herpes simplex virusthymidine kinase gene under the control of human alpha-fetoprotein gene promoter[J].Cancer Res,1995,55(14):3105-3109.
[6] Kanai F.Transcriptional targeted gene therapy for hepato-cellular carcinoma by adenovirus vector[J]. Mol Biotechnol,2001,18(3):243-250.
[7] LiuY F, Hu J, Zhang J H,et al.Isolation, purification, and N-terminal partial sequence of an antitumor peptide from thevenom of the Chinese scorpion Buthus martensii Karsch[J].Prep Biochem Biotechnol,2002,32(4):317-327.
中图分类号:S565.6 文献标识码:A 文章编号:0439-8114(2016)11-2930-04
DOI:10.14088/ki.issn0439-8114.2016.11.056
蓖麻(Riciuns communis L.)是大戟科(Euphorbiaceae)蓖麻属(Ricicuns)一年或多年生双子叶植物,广泛生长在热带、亚热带和温带地区,是世界十大重要油料作物之一[1]。植物种子中有一种储存营养物质的细胞器――油体[2-4],其内部主要成分为三酰甘油,外部则为磷脂单分子层及嵌入其内的油体结合蛋白质组成的半单位膜[5]。油体结合蛋白质主要有三种――油脂蛋白质、油体钙蛋白质和油体固醇蛋白质。油脂蛋白质由N-和C-末端两个亲水区域及中间疏水锚定区域组成。N-和C-末端暴露在油体表面,能够提供空间位阻和负电斥力来维持油体的稳定[5]。Chen等[6]在油体中发现了3种微量蛋白质分别称为Sop1、Sop2、Sop3。Sop1称为油体钙蛋白质。油体钙蛋白质由N-端亲水钙结合区域、C-端亲水性磷酸化区域和中间疏水锚定区域组成,可能在油体成熟、脂肪动员和提高油体稳定性方面发挥作用[5]。Sop2、Sop3被称为油体固醇蛋白质-A和油体固醇蛋白质-B[7]。油体固醇蛋白质是一种羟基固醇脱氢酶,属于SDR家族[8,9]。N-端的疏水区域由两个亲性α螺旋夹着一个疏水锚定结构组成,在此疏水区域中部有Pro knob结构[10],其余部位分为NADPH、固醇结合区域和两者之间的活性位点S-(12X)-Y-(3X)-K[10]。Sop3和Sop2蛋白质的固醇结合区域不同[7]。近来发现油体蛋白质也存在于根尖和芽等胚后组织中,推测在植物体内还存在未被发现的信号转导通路[8]。本试验以拟南芥蛋白质作“种子”在蓖麻的蛋白质数据库中搜索,结合关键字搜索方法对蓖麻油体固醇蛋白质进行生物信息学分析,以期为该蛋白质的鉴定提供参考。
1 材料与方法
1.1 蓖麻基因组数据库搜索
以“Steroid dehydrogenase”为关键字在蓖麻基因组数据库(http:///search.php)中搜索,下载基因、cDNA和蛋白质序列;以6条拟南芥油体固醇蛋白质[11]作为“种子”,分别在蓖麻数据库(http:///search.php)中进行Blastp搜索,E设为1×10-30,获得同源的油体固醇蛋白质的基因、cDNA和蛋白质序列,去除重复后,再利用NCBI保守结构域分析工具(http://ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi?)对所获得的蛋白质家族进行鉴定,检测是否有SDR(短链脱氢/还原酶超家族)的保守结构域。
1.2 蓖麻油体固醇蛋白质生物信息学分析
蓖麻油体固醇蛋白质的理化性质采用Protparam软件进行预测;内含子、外显子组成采用Spidey软件进行分析;疏水性/亲水性采用ProtScal软件进行分析;蛋白质二级结构分析采用GOR4软件进行分析;蛋白跨膜结构域采用TMHMM 2.0 Server软件;信号肽结构采用SignalP4.1 Server软件进行预测;蛋白质三维结构分析与同源建模采用CPHmodels软件和RasMol-Raindy软件;进化树的构建采用软件ClustalW2软件和MEGA 4.1软件,所有软件使用的都是其默认值,部分分析软件的网址见表1。
2 结果与分析
2.1 蛋白质的一级结构分析
2.1.1 氨基酸序列的理化性质分析 通过综合分析,最终获得11条完整的蓖麻油体固醇蛋白质基因,见表2。利用在线分析软件Protparam对10种油体固醇蛋白质进行分析,得到其对应的氨基酸序列的理化性质,结果见表2。大部分蛋白质成员外显子数为3或6,氨基酸残基数为317~352,分子量为35.286 0~39.918 9 kDa,等电点PI为5.35~9.57。不稳定系数表明,有8种成员在植物内可能阶段性出现。亲水性大部分都为正值,大部分成员都为亲水蛋白质。信号肽预测表明,这11个蛋白质不存在信号肽。由于Slo11蛋白质基因不完整,所以后续分析中只选择其他10个蓖麻油体固醇蛋白质。
2.1.2 疏水性/亲水性的预测和分析 采用ProtScale软件对10个蓖麻油体固醇蛋白质进行分析,结果(图1)表明,以Slo1、Slo9为例,1~40区域有强烈的疏水性,可能为跨膜区域与油体内部疏水的三酰甘油相接合处,其他区域无明显规律。
中图分类号:S792.153;Q78 文献标识码:A 文章编号:0439-8114(2017)09-1759-04
DOI:10.14088/ki.issn0439-8114.2017.09.040
Bioinformatics Analysis of Five MYB Transcription Factors from Betula piatyphylla Suk.
JIN Qiu,YANG Miao,SHI Mei-wei,REN Ru-yi,WEI Ji-cheng
(College of Life Sciences and Technology,Mudanjiang Normal University,Mudanjiang 157011,Heilongjiang,China)
Abstract:5 candidate MYB transcription factors were obtained from Betula platyphylla Suk. transcriptome datebase. The theoretical molecular weight(MW), isoelectronic point(pI), nuclear localization signal,transmembrane domain and amino acid conserved domain of 5 MYB transcription factors were predicted, amino acid sequence alignment and phylogenetic tree were contructed with the MYB transcription factors from Arabidopsis. The results indicated that 5 MYB transcription factors of birch were all belonged to R2R3 type MYB members according to amino acid sequence alignment. Phylogenetic construction showed that the 5 MYB transcription factors of birch were closely with MYB transcription factors related to stress resistance from Arabidopsis, which suggested that the 5 birch MYB members may function in stress resistance.
Key words:Betula platyphylla Suk.;MYB transcription factors;stress resistance
MYB(v-myb avian myeloblastosis viral oncogene homolog)转录因子参与植物生长发育、形态建成以及非生物胁迫等多种生物学过程。MYB转录因子在防虫、耐高低温、干旱、高盐、调节开花转型关键基因表达以及调控植株主根伸长通路等过程中起重要作用[1]。它是植物界转录因子家族成员之一,对植株抗逆性起关键作用[2]。研究发现,GhMYB11基因在黄萎病菌侵染,盐、干旱和氧化胁迫反应处置后的棉花新苗叶片中表达明显上调,表明GhMYB11基因在棉花生物和非生物胁迫反应中起关键作用[3]。GmMYB042基因在大豆的茎、根、根瘤、种子、花和荚果皮中均有表达,且在大豆中受到PEG、低温、高盐和辐射的诱导[4]。木薯R2R3-MYB类转录因子MeMYB63在叶面上有高强度抗旱反应,说明该基因对干旱胁迫诱导下的表达调控起关键作用[5]。水稻R2R3-MYB类盐胁迫表明OsMPS基因有调控植物激素和细胞壁合成的功效,该基因的表达受多种植物激素的诱导[6]。拟南芥AtMYB13基因受激素诱导后强烈表达,能够提高转基因拟南芥对病原细菌(PstDC3000)的基本防卫反应。MYB15蛋白可以结合CBF基因启动子的MYB元件,继而调控抑制低温相关基因的表达[7]。拟南芥AtMYB73基因可以通过影响水杨酸和茉莉酸抵抗病原菌丁香假单孢杆菌和核盘菌,从而在干旱胁迫中发挥作用[8]。AtMYB44在HrpNEa调控拟南芥预防桃蚜过程中起重要作用[9]。AtMYB44基因通过E1N2调控拟南芥对桃蚜与菜蛾的抗虫性[9]。郑博[10]通过基因枪转化技术把拟南芥的AtMYB44基因转导到扬麦158中,得到拥有良好耐寒、耐旱和抗盐碱的优质转基因小麦。MYB转录因子在红根甘肃桃抗根结线虫机制中能够经过调控苯丙烷代谢途径增长红根甘肃桃根部花色素苷和其余类黄酮物质的含量,从而抵抗根结线虫侵染[11]。多年生黑麦草3个转录因子LpMYB1、LpMYB2和LpMYB3参与黑麦草对紫外、干旱、高盐胁迫的应答和形态建成[12]。目前,MYB转录因子对植物作用的分子机理还不完全清楚。
3 小Y与讨论
本试验通过白桦5个MYB转录因子氨基酸序列与拟南芥的MYB转录因子比对,经过软件Bio Edit和MEGA 5.1分析,构建系统进化树,结果表明白桦的5个R2R3型MYB转录因子可能具有抗逆性。水稻OsmB3R-2基因在拟南芥中过表达后转基因植株对冻害、干旱和高盐的耐受性显著提高[6]; Rahaie等[13]研究证明小麦TaMYBsduI转录因子是高盐和干旱胁迫下的调控子,MdSIMYB1过表达能增强转基因小麦抗逆境能力。可见,MYB转录因子在植物的生长发育过程中起着重要的调控作用。
参考文献:
[1] 田双梅.进拟南芥转录因子AtMYB44促抗病耐热及抑制开花作用[D].南京:南京农业大学,2012.
[2] 刘 蕾,杜 海,唐晓凤,等.MYB转录因子在植物抗逆胁迫中的作用及其分子机理[J].遗传,2008,30(10):1265-1271.
[3] 李 菲,柳展基,王立国,等.棉花转录因子基因(GhMYB11)的克隆与表达分析[J].农业生物技术学报,2015,23(2):161-169.
[4] 杜 海,冉 风,马珊珊,等.GmMYB042基因对类黄酮生物合成调控作用[J].作物学报,2016,42(1):1-10.
[5] 荣 晶.木薯干旱胁迫相关R2R3-MYB转录因子MeMYB63的基因特性及启动子分析[D].海口:海南大学,2014.
[6] SCHMIDT R,SCHIPPERS J H,MIEULET D,et al.MULTIPASS,a rice R2R3-type MYB transcription factor,regulates adaptive growth by integrating multiple hormonal pathways[J].Plant J,2013,76(2):258-273.
[7] 许 瑞.RNA介导的启动子DNA甲基化在调控拟南芥盐胁迫应答中的作用研究[D].济南:山东农业大学,2010.
[8] 徐 钰.转录因子AtMYB13抑制拟南芥防卫反应的研究[D].南京:南京农业大学,2009.
[9] 吕贝贝.MYB44对HrpNEa诱导拟南芥抗虫防卫信号传导的调控作用[D].南京:南京农业大学,2012.
[10] 郑 博.基因枪法介导拟南芥AtMYB44基因转化小麦的研究[D].合肥:安徽大学,2013.
中图分类号:Q945.11;Q617文献标识码:A文章编号:0439-8114(2011)12-2558-05
Bioinformatic Analysis of PEPC in C3 and C4 Plants
WU Mei1,2,ZHANG Bian-jiang1,YANG Ping1,WANG Rong-fu2,CHEN Quan-zhan1
(1. College of Biochemistry and Enviromental Engineering,Nanjing Xiaozhuang University,Nanjing 211171,China;
2. College of Life Science,Anhui Agriculture University,Hefei 230036,China)
Abstract: To explore the functional differences between C3 and C4 PEPC, PEPC proteins of four different C3 and C4 plants were analyzed by various bioinformatic tools to predict the protein properties, such as amino acids composition, pI, domains, secondary and spatial structure; and the PEPC protein sequences of C3 and C4 plants were aligned. The results showed that the PEPC proteins were unstable and the secondary structures were mainly composed of random coil, indicating some differences between PEPCs of C3 and C4 plants. A highly homologous(99.7%) protein structure data 1JQO chain A was predicted by three-dimensional structure modeling of PEPC by ESyPred3D, thus facilitated the tertiary structure building of target sequence. The tertiary structure model of Zea mays PEPC was further checked by PROCHECK programmer, and showed that 94.2% of the amino acid residues were located in the most favored regions in Ramachandran plot, indicating that the simulated three-dimensional structure of Zea mays PEPC was reliable.
Key words:C3 plant; C4 plant; PEPC; bioinformatics
与C3植物相比,C4植物具有光合效率高、CO2补偿点低、几乎没有光呼吸等优点,特别在强光、高温、干旱等条件下,C4植物具有明显的生长优势及较高的水分和营养利用率,生物学产量也较高[1]。C4途径包含多种酶类如磷酸烯醇式丙酮酸羧化酶(Phosphoenolpyruvate carboxylase,PEPC)、NADP-苹果酸脱氢酶(NADP-malate dehydrogenase,NADP-MDH)、NADP-苹果酸酶(NADP-malic enzyme,NADP-ME)和丙酮酸磷酸二激酶(Pyruvate ortho-phosphate dikinase,PPDK)等,这些酶有效地固定外部及其光呼吸释放的CO2[2]从而使加氧酶活性受到抑制,降低了氮素的消耗,提高了水分利用率,大大提高了光合生产力[3]。近年来与光合作用途径相关的关键酶的基因已分别从玉米、高粱和苋菜等C4植物中被克隆,并开展了C4基因的遗传转化工作[4]。值得注意的是,Ku等[5]首次成功地将玉米C4光合途径的关键酶PEPC基因导入C3作物水稻中,获得了高表达的转基因水稻株,有效地提高了PEPC活性。罗素兰等[6]和张桂芳等[7]分别克隆了C4植物甘蔗和稗草PEPC基因并进行了功能验证。Chen等[8]又成功地将玉米C4型PEPC基因导入小麦中并实现有效表达,展示了转光合关键酶PEPC基因改造C3作物的应用前景。
Hermans[9]在菊科黄花菊属(Flaveria)中发现PEPC有C3型、类似C3型、类似C4型、C3-C4中间型、C4型等不同代谢类型,分析它们的PEPC基因,发现同源性极高,C4植物PEPC基因与C3植物PEPC基因有71%的同源性,由于表达量不同而活性高低不同。前人的研究表明玉米的PEPC有C4型、C3型和根型3种类型[10];高粱的PEPC基因家族有3个成员CP21、CP28、CP46[11];Flaveria的PEPC基因家族由ppcA、ppcB和ppcC 3个亚家族组成[12]。尽管PEPC也是C3植物中另一主要羧化酶,为三羧酸循环补充草酰乙酸起回补反应的功能,但以C3植物的形态结构,PEPC还不能完成CO2净固定直接生成碳水化合物,因为三羧酸循环的碳与PEPC结合是一种损失,必须在CO2固定后再进入Calvin循环。而在C4和CAM植物中,PEPC介导β羧化反应,把CO2固定为草酰乙酸,后转变为四碳酸[13]。在结构上除了N端有调节磷酸化的基团外,来源于不同生物的PEPC其反应机制本质上是相同的[14]。但不同来源的PEPC在不同植物体内有着不同的生化和生理特性,并致使光合作用产生较大的差异。通过对PEPC进行生物信息学的分析,来进行基因的结构和功能的比较,预测产生的结构和功能的差异,以期为将C4关键酶转入C3作物或者通过修饰C3作物的基因来改造C3作物,从而有效提高作物的光合生产力。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
1材料与方法
1.1供试材料
数据资料来源于National Center for Biotechnology Information(NCBI)核酸及蛋白质数据库中已注册的核酸序列及对应的氨基酸序列:玉米(Zea mays,AJ536629);稗草(Echinochloa crus-galli,AY995212);甘蔗(Saccharum officinarum,AJ293346);高粱(Sorghum bicolor,XM_002438476);拟南芥(Arabidopsis thaliana,AY210895);水稻(Oryza sativa,AF271995);棉花(Gossypium hirsutum,EU032328);大豆(Glycine max,AB008540)。
1.2试验方法
利用生物信息学数据库和互联网上的软件进行分析,用Protparam[15]分析PEPC基因编码蛋白的氨基酸序列组成、分子量、等电点等理化性质;在NCBI[16]上对其保守结构域进行分析;用SOPMA[17]预测其二级结构;用PROSITE[18]分析蛋白质功能;以ESyPred3D[19]程序预测三级结构;利用检测蛋白质质量结构的软件PROCHECK[20,21]对预测的蛋白质三维结构进行分析。
2结果与分析
2.1PEPC一级结构分析
2.1.1PEPC理化性质分析用Protparam预测PEPC基因编码的蛋白质的理化性质[15]。这8种植物PEPC的理论推导半衰期为30 h(体外,哺乳动物的网织红细胞内);大于20 h(体内,酵母细胞内);大于10 h(体内,大肠杆菌)。C4植物总的带负电残基(Asp+Glu)和总的带正电残基(Arg+Lys)略低于C3植物,总的亲水性平均系数(GRAVY)平均略高于C3植物,为-0.45~-0.30,预测该蛋白质属于亲水性蛋白质。C4植物不稳定参数低于C3植物,但两者均为不稳定蛋白质。8种植物PEPC蛋白质中含量较多的氨基酸基本相同,为Leu、Glu、Arg、Ala。其中排第三和第四的Arg和Ala的含量略有不同,在C4植物中排第五的为Gly或Val,而C3植物中则为Asp,所有植物都不含有Asx(B)、Glx(Z)、Xaa(X)。C4植物酸碱性氨基酸的比例略小于C3植物。C4植物中非极性氨基酸、极性氨基酸含量略高于C3植物(表1)。
2.1.2PEPC氨基酸序列分析利用DNAMAN[22]进行多序列比对,比较8种植物的氨基酸序列。参数选择:完全比对;多重比对;空位开放罚分:10;空位延伸罚分:1;延迟趋异序列:30%;蛋白质加权GONNET。蛋白质空位参数试用亲水罚分和残基特异罚分。在C3和C4植物中不同的氨基酸位点共有22处,见图1中用浅色或深色为背景的位点,其中“…”表示省略的氨基酸。据此将进一步研究这些氨基酸位点,观察造成的空间结构活性区域有无变化。
2.2PEPC二级结构分析
用SOPMA对PEPC二级结构进行预测,PEPC结构元件以α-螺旋、无规则卷曲为主,延伸链和β-折叠散布于整个蛋白质中。没有发现如310 helix、Pi helix、Beta bridge、Bend region等其他结构(表2)。对于一级结构中C3、C4植物不同处,在进行二级结构预测后,也发现有3处不同(图1)。在图1的阴影中,C4植物在E(谷氨酸)与S(丝氨酸)处表现为c(无规则卷曲)与h(α-螺旋)的链接、C3植物表现为E与S均为c,而之后的S与D(天冬氨酸)处为c与h的链接。C4植物在P(脯氨酸)到V(缬氨酸)之间均为c的链接,C3植物R(精氨酸)到V之间有两个c变成了e(延伸链),C4植物在K(赖氨酸)和两个Q(谷氨酰胺)之间是表现为两个t(β-折叠)与e的链接,而C3植物KQE之间为两个c和e的链接。分析这些二级结构的不同,为以后的三级结构的比对提供了基础,还有利于进一步去研究是否由于这些位点的不同而造成了PEPC在C3和C4植物中的差异。
2.3PEPC氨基酸序列结构域功能的分析
通过PROSITE分析,8种植物都具有两个符合PEPC活性的位点[VTI]-x-T-A-H-P-T-[EQ]-
x(2)-R-[KRHAQ](H是活性残基位点);[IVLC]-M-[LIVM]-G-Y-S-D-S-x-K-[DF]-[STAG]-G(K是活性残基位点)和一个保守序列M-F-H-G-R-G-G-T-V-G-R-G-G-G-P-T-H-L-A-I-L-S-Q-P-P-[DE]-T-I-H-G-S-[LP]-R-V-T-V-Q-G-E-V-I-E-Q-S-F-G-E-E-H-L。说明这几种植物中都具有PEPC活性,只是活性位点和保守序列的起始位点有所区别(表3),这应该是和它们的氨基酸序列起始位置有关。
2.4PEPC的三级结构预测
将玉米PEPC氨基酸序列上传到ESyPred3D的建模服务器中进行PEPC结构的三维建模,预测得到一个同源性较高的蛋白质结构数据1JQO chain A,同源性为99.7%,符合同源建模条件,从而构建目标序列的三级结构(图2)。
利用PROCHECK对模建结果进行检测,作Ramachandran点图,统计位于最适合区、附加允许区、一般允许区和不允许区残基的比率。Ramachandran点图能够将蛋白质的主链中的phi和psi的二面角角度以图示的方式显示。最深色区域是最理想的phi角和psi角分布区域,而白色区域则为不合理区域。因而如果预测的蛋白质残基的二面角有90%以上位于最深色区域,则表明其有稳定的空间结构。图3是玉米PEPC蛋白质的Ramachandran点图,其中94.2%位于最适合区,5.7%位于附加允许区,0.1%位于一般允许区,没有氨基酸位于不允许区域。从图中可以看出,模拟得到的玉米PEPC蛋白质的三维结构的氨基酸残基有94.2%位于Ramachandran点图中合理区域,从理论上表明模拟得到的玉米PEPC的三维结构是可靠的。
3讨论
根据经典的C4光合知识,C4植物有叶肉细胞和维管束鞘细胞的分化,进行C4光合途径所必需的多酶系统分别定位于此两类具有叶绿体的细胞中,而且C4光合途径是受多基因控制且各基因独立遗传,C3植物存在的内源的C4循环酶及转运蛋白质,都具有明确的生理功能,因而通过个别基因的过量表达增加其产物的活性,不能在C3植物中建立起完整的C4循环,还可能干扰C3植物的正常代谢,因此,把C3植物转化为C4植物是不可能的,但是Jiao等[23]通过转PEPC基因,水稻具有了类似初级的C3-C4中间型的特征。用生物信息学方法对已知PEPC序列进行比对分析,从而对其结构和功能进行推断和预测,为我们将PEPC基因转入C3作物以有效提高作物的光合生产力提供了尽可能多的信息,能为选择合适的试验方法提供理论参考,为进一步对该基因的功能研究提供线索。此外要培育类C4作物,进一步提高光合效率,可能需要Kranz结构,以免光呼吸CO2的外溢,这些都有待进一步研究。
参考文献:
[1] BROWN R H,BASSETT C L,CAMERON R G,et al. Photosynthesis of F1 hybrids between C4 and C3-C4 species of Flaveria[J]. Plant Physiol,1986,82:211-217.
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
[2] VON CAEMMERER S,FURBANK R T. The C4 pathway:an efficient CO2 pump[J]. Photosynthesis Research,2003,77:191-207.
[3] FUKAYAMA H,AGARIE S,NOMURA M,et al. High level expression of maize C4-specific pyruvate,Pi dikinase and its light activation in transgenic rice plants[J]. PlantCellPhysical,1999,40:116-123.
[4] MATSUOKA M,YAMAMOTO N. Induction of mRNAs for phosphoenolpyruvate carboxylase and pyruvate,orthophosphate dikinase in leaves of a C4plantexposed to light[J]. Plant Cell Physiol,1989,30(4):479-486.
[5] KU M S,AQARIE S,NOMURA M,et al. High-level expression of maize phosphoenolpyruvate carboxylase in transgenic rice plants[J]. Nat Biotechnol,1999,17(1):76-80.
[6] 罗素兰,陈如凯,潘大仁,等. 高光效基因植物表达载体的构建[J]. 生物技术通报,2003(4):38-41.
[7] 张桂芳,赵明,丁在松,等. 稗草磷酸烯醇式丙酮酸羧化酶(PEPCase)基因的克隆与分析[J].作物学报,2005,31(10):1365-1369.
[8] CHEN X Q,ZHANG X D,LIANG R Q,et al. Expression of the intact C4 type PEPC gene cloned from maize in transgenic winter wheat[J]. Chin Sci Bull,2004,49(20):1976-1982.
[9] HERMANS J,WESTHOFF P. Analysis of expression and evolutionary relationships of phosphoenol-pyruvate carboxylase genes in Flaveria trinervia(C4)and F. pringlei(C3)[J]. Molecular and General Genetics,1990,224(3):459-468.
[10] DONG L Y,MASUDA T,KAWAMURA T,et al. Cloning expression and characterization of a root-form phosphoenolpyruvate carboxylase from Zea mays:comparison with the C4 form enzyme[J]. Plant and Cell Physiology,1998,39(8):865-873.
[11] LEPINIEC L, KERYER E, PHILIPPE H, et al. Sorghum phosphoenolpyruvate carboxylase gene family:structure,function and molecular evolution[J]. Plant Molecular Biology,1993,
21(3):487-502.
[12] ENGELMANN S,BL?SING O E,GOWIK U,et al. Molecular evolution of C4 phosphoenolpyruvate carboxylase in the genus Flaveria―a gradual increase from C3 to C4 characteristics[J]. Planta,2003,217(5):717-725.
[13] SAGE R F. The evolution of C4 photosynthesis[J]. New Phytologist,2004,161(2):341-370.
[14] MATSUMURA H,XIE Y,SHIRAKATA S,et al. Crystal structures of C4 form maize and quaternary complex of E. coli phosphoenolpyruvate carboxylases[J]. Structure,2002,10(12):1721-1730.
[15] GASTEIGER E,HOOGLAND C,GATTIKER A,et al. Protein identification and analysis tools on the ExPASy server[A].WALKER J M. The Proteomics Protocols Handbook[C].Totowa:Humana Press,2005. 571-607.
[16] MARCHLER-BAUER A,BRYANT S H. CD-Search:protein domain annotations on the fly[J]. Nucleic Acids Res,2004, 32:327-331.
[17] TARAFDAR P K,VEDANTAM L V,KONDREDDY A,et al. Biophysical investigations on the aggregation and thermal unfolding of harpin(Pss) and identification of leucine-zipper-like motifs in harpins[J]. Biochim Biophys Acta,2009,
1794(11):1684-1692.
[18] JONASSEN I,EIDHAMMER I,GRINDHAUG S H,et al. Searching the protein structure databank with weak sequence patterns and structuralconstraints[J]. Molecular Biology,2000,304(4):599-619.
[19] LAMBERT C,L?ONARD N,DE BOLLE X,et al. ESyPred3D:Prediction of proteins 3D structures[J]. Bioinformatics,2002,18(9):1250-1256.
[20] LASKOWSKI R A,MACARTHUR M W,MOSS D S,et al. PROCHECK:a program to check the stereochemical quality of protein structures[J]. J Appl Cryst,1993,26:283-291.
[21] LASKOWSKI R A,RULLMANNN J A,MACARTHUR M W,et al. AQUA and PROCHECK-NMR:Programs for checking the quality ofprotein structures solved byNMR[J]. JBiomol NMR,1996,8(4):477-486.
[22] SONG J Y,YAO H,LI Y,et al. Authentication of the family polygonaceae in Chinese pharmacopoeia by DNA barcoding technique[J]. J Ethnopharmacol,2009,124(3):434-439.