我国药用植物次生代谢产物功能基因研究概况
作者:杜勤, 王金发
作者单位:广州中医药大学中药学院,广东 广州 510405; 中山大学生命科学院,广东 广州 510275
《时珍国医国药》 2009年 第8期
多个检索词,请用空格间隔。
【摘要】
综述了近年来我国药用植物次生代谢产物功能基因的研究方法和内容,着重介绍了萜类、黄酮类、生物碱类、酚类、多糖类、凝集素等次生代谢产物合成相关功能基因的研究现状,对药用植物次生代谢产物合成相关功能基因的应用前景作了介绍,为今后药用植物功能基因的大规模研究和利用提供借鉴。
【关键词】 药用植物 次生代谢产物 功能基因
Research Progress in Our Country’s Functional Genomics of Medicinal Plant Secondary Metabolism
DU Qin, WANG Jinfa
(Guangzhou University of Chinese Medicine, Guangzhou,Guangdong 510405, China; SunYat-Sen University,Guangzhou 510275, China)
Abstract:The content and methods of our country’s latest functional genomics study of medicinal plant secondary metabolism were reviewed, by focusing on the synthesis of terpinoids, flavonoids, alkaloids etc. The research progress and potential application in this new area were also commented.
Key words:Medicinal Plant; Secondary metabolism; Functional genomics; Research progress
1995年生物学家提出“后基因组(postgenome)”的概念,即在基因组静态的作图、碱基序列分析基础上转入对基因组动态的生物学功能的研究。随着人类基因组计划(HGP)的顺利进行,基因组学的研究从结构基因组学(structural genomics)开始过渡到功能基因组学(functional genomics),结构基因组学代表基因组分析的早期阶段,以建立生物体高分辨遗传、物理图谱为主;功能基因组学代表基因分析的新阶段,是利用结构基因组学提供的信息,发展和应用新的实验手段系统地研究基因功能,它以高通量、大规模实验方法及统计和计算机分析为特征。目前人类、酵母的功能基因组研究已全面展开,植物的功能基因组研究起步较晚,现正处于结构基因组学和功能基因组学并重的时代,但近几年植物功能基因组学研究得到了迅速发展[1~3]。
1 药用植物次生代谢产物合成相关功能基因组学研究方法
植物在长期进化过程中,逐渐形成了一些适应环境的生理生态功能,其中之一就是根据初生生长的需要产生各种类型的次生代谢产物。次生代谢产物是植物在长期进化中与其生存环境相互作用的结果,既能够在植物体内积累,抵御病原微生物等的侵害,又在植物的整个代谢活动中占有重要地位[4]。
药用植物功能基因研究是从功能基因入手阐明药用植物有效成分的生物合成途径及其调控机制,其中主要涉及到次生代谢产物生物调控的关键酶系的结构编码基因和其他功能基因。研究中可能应用的分子生物技术有植物的表达序列标签(EST)和cDNA文库筛选;药用植物功能蛋白质组研究;特定代谢时期细胞功能簇(CRC)分析和功能蛋白质组表达图谱用于基因组功能提示的可行性;基因表达指纹(GEF);基因表达系统分析(SAGE);cDNA3′端限制酶切片段显示;分子指数的RNA指纹(MI);消减杂交(SSH);基因芯片等。这些分子生物技术可应用于药用植物次生代谢调控机制研究,功能基因和次生代谢酶基因的克隆、表达和鉴定等[5]。
2 药用植物次生代谢产物相关功能基因组研究概况
2.1 萜类物质萜类化合物(terpenoid)是一类由异戊二烯(soprene)为结构组成单元的天然烃类化合物的统称,在自然界中分布广泛、种类繁多、结构多样。迄今为止大约有22 000种萜及萜类衍生物的化学结构已被鉴定,它们不仅在植物的生命活动中扮演重要的作用,而且还被广泛地应用于工业、医药卫生等领域[6]。
肖明贵等[7]从曼地亚红豆杉中提取分离出mRNA,然后根据已知植物的牻牛儿基牻牛儿基焦磷酸合成酶基因(GGPPS基因)DNA序列保守区设计特异简并引物。RT-PCR获得了一条大小约600 bp的扩增谱带,回收该特异谱带并进行TA克隆,发现该序列属于GGPP合成酶的片断,与加拿大红豆杉和北美冷杉的GGPP合成酶相应区段的氨基酸序列一致性为98%和86%。蛋白质序列分析发现该序列含有一个特征的异戊二烯合成酶保守的结构域。进化树分析表明,曼地亚红豆杉GGPPS在进化上位于植物类,靠近古细菌类。
冯磊(《中国红豆杉紫杉烷13α-羟基化酶基因的克隆及表达》.曲阜师范大学2006硕士研究生学位论文)从中国红豆杉中克隆得到紫杉烷13α-羟基化酶基因序列,长为1 848 bp,阅读框(ORF)编码区为1 458 bp,编码485个氨基酸,分子量54.7 KD,该基因与东北红豆杉紫杉烷13α-羟基化酶有97%的相似性。与其他已克隆的红豆杉羟基化酶有54%~60%的相似性。该基因编码一膜锚定蛋白,推断所克隆基因编码一个执行生物合成功能的A类P450蛋白。
周明兵等[8]以杜仲树叶总RNA为模板扩增出杜仲法呢基焦磷酸合酶基因(Farnesyl PyrophasphateSynthase, EuFPS), cDNA序列全长1 271 bp,开放阅读框共编码320个氨基酸残基,其核酸序列与拟南芥、银胶菊和巴西橡胶树FPP合酶的序列同源性分别为81%,87%和82%。
刘彦(《青蒿生物合成相关基因的克隆、大肠杆菌表达与分子分析》.中国科学院研究生院2006博士学位论文)从青蒿高产株系001中克隆出全长1 886 bp的倍半萜合酶cDNA,其氨基酸序列与烟草马兜铃烯合酶、蕊若岩兰螺旋二烯合酶、棉花杜松烯合酶的一致性分别为39%,38%和41%;与青蒿柏木脑合酶、紫穗槐二烯合酶和一个推测的倍半萜合酶克隆cASC125的一致性为50%,48%和59%。克隆了一个1 539 bp全长鲨烯合酶cDNA,青蒿鲨烯合酶氨基酸序列与拟南芥、烟草、人类、酵母鲨烯合酶的一致性分别为70%,77%,44%,39%。
赵玉军等[9]从青蒿高产株系025中的cDNA文库中克隆到了一个编码青蒿法呢基焦磷酸合酶(AaFPS1)的cDNA(af1),序列分析表明,这一cDNA编码一个含343个氨基酸残基的蛋白质,分子量为39 KD,推导出的氨基酸序列与来自其他植物、哺乳动物和酵母的FPS相似,也包含异戊烯基转移酶和聚异戊烯基合酶所共有的5个保守域,此cDNA在大肠杆菌中的表达产物表现出明显的FPS酶学活性。
刘水平等[10~12]从人参根组织中分离总RNA,使用RT-PCR扩增出人参皂苷生物合成相关基因GBR6开放阅读框(ORF)cDNA片断,并将其定向克隆入原核高效表达载体pQE30,阳性克隆经Bam1和Pst1双酶切鉴定、测序验证与已知的GBR6 ORF序列完全一致,成功构建了pQE30- GBR6ORF融合原核表达载体。
陈莉(《三七主要有效成分三萜皂苷合成关键酶FPS基因的克隆及序列分析》.广西医科大学2005硕士研究生学位论文)对三七三萜皂苷合成关键酶法呢基焦磷酸合酶(FPS)的基因进行克隆,cDNA序列全长1 409 bp,开放阅读框共编码343个氨基酸残基,氨基酸序列与积雪草、银胶菊、青篙、山艾树的FPS氨基酸序列的同源性分别为95%,87%,86%和86%,核酸序列同源性则分别为81%,66%,68%和66%。
陈珅(《三七三萜皂苷合成途径鲨烯环氧酶基因的克隆及初步表达》.广西医科大学2006硕士研究生学位论文)对三七三萜皂苷合成关键酶鲨烯环氧酶(squalene epoxidase,SE)的基因进行了克隆, cDNA序列长1648bp,分子量约为64KD,开放阅读框共编码537个氨基酸残基,氨基酸序列与人参、管状苜蓿、毛曼陀罗、亚洲栽培稻、番茄、拟南芥和甘蓝型油菜的同源性分别为97%,76%,73%,71%,70%,70%和45%;核酸序列的同源性分别为97%,63%,62%,62%,62%,60%和48%。
朱华(《三七鲨烯合酶基因的克隆及其功能的初步研究》.广西医科大学2006硕士研究生学位论文)对三七鲨烯合酶(SS)基因及3-磷酸甘油醛脱氢酶(GAPDH)基因进行体外克隆,cDNA序列全长1270bp,开放读码框共编码415个氨基酸残基,氨基酸序列与人参、积雪草、青蒿、拟南芥、水稻的SS氨基酸序列的同源性分别为98%,89%,81%,78%,71%,核苷酸序列的同源性分别为98%,88%,77%,73%,66%。获得了三七GAPDH基因的部分cDNA序列,长627bp,与拟南芥、烟草、人参的GAPDH氨基酸序列的同源性分别为91%,93%,95%。核苷酸序列的同源性分别为82%,84%,85%。
杜鹃(《蹄叶橐吾萜类化合物合成相关基因克隆及功能研究》.吉林大学2007博士学位论文)从野生蹄叶橐吾中克隆出萜类化合物紫菀酮形成关键酶HMG-CoA还原酶家族(HMGR、HMGR2),成功构建了HMGR基因植物双元高效表达载体pBSHMGR,获得了转化效率极高的转基因蹄叶橐吾植株。转基因植株及其野生型对照蹄叶橐吾紫菀酮含量HPLC测定结果表明,HMGR基因的超表达增加了紫菀酮在转基因植株根、茎中的积累。
刘长军等[13]从亚洲棉中分离得到倍半萜棉毒素合成相关酶法呢基焦磷酸合成酶(FPS)的cDNA。序列分析表明,该cDNA全长1280bp,开放阅读框共编码342个氨基酸残基,分子量为39 kD,氨基酸顺序与拟南芥和青蒿的FPP合酶序列同源性为78.9%和80.7%。
2.2 黄酮类物质黄酮类化合物是植物在长期的生态适应过程中为抵御恶劣生态条件、动物、微生物等攻击而形成的一大类次生代谢产物。它们是广泛分布于植物界的碳基本骨架化合物,在许多植物的花、果和叶中大量分布,目前发现的四千余种的黄酮类化合物可以分为以下几种:黄酮醇(flavonols)、黄酮(flavones)、异黄酮(isoflavones)和花色素苷(anthocyanins)[14]。
程水源等[15]从银杏叶中克隆得到了控制银杏叶中黄酮类化合物代谢途径中关键酶苯丙氨酸解氨酶(Phenylalanine ammo-nia-lyase, PAL)基因的部分序列,长度862 bp,氨基酸序列与长白松、海岸松、火炬松和亮石杉PAL基因的氨基酸同源性分别为93%,93%,91%和90%。Southern杂交结果表明银杏PAL是一个多基因家族。
崔光红等[16]研究丹参毛状根不同时期的基因表达谱,将45, 60 d丹参毛状根分别与30 d材料进行杂交,得到203个差异基因。测序后得到172条EST,拼接聚类后形成114个Unigene,其中功能已知基因62个。得到一系列次生代谢相关基因如细胞色素P450、二萜合酶等基因片段。
蔡文伟(《海南龙血树血竭生物合成相关基因的分离》.华南热带农业大学2006硕士学位研究生论文)以经诱导物诱导处理刚产生血竭和未经诱导物处理的海南龙血树组培苗为材料,利用抑制消减杂交(SSH)技术构建了龙血树血竭生物合成相关基因的差减cDNA文库,分离到与信号转导相关的cDNA片段5个,转录翻译相关蛋白cDNA片段5个,物质能量代谢酶类cDNA片段12个。
段小瑜等[17]从大豆总RNA中分离了合成异黄酮的关键酶异黄酮合酶(isoflavone synthase,IFS)基因,含1 583个核苷酸,与已报道的大豆异黄酮合酶基因的核苷酸同源性为92%。
杨丽(《百合查尔酮合成酶基因(CHS)及其启动子的克隆与分析》.西北农林科技大学2006硕士学位论文)从东方百合的花瓣组织RNA中克隆出查尔酮合成酶基因(CHS),长度约900 bp的目的片段,与已发表的百合中CHS基因的同源性达到91%以上。在获得CHS cDNA序列的基础上,重新设计CHS基因的引物,以基因组DNA为模板进行PCR扩增,获得了大约1 300 bp的目的片段, CHS基因DNA序列包含两个外显子和1个内含子。通过接头连接PCR,克隆了约898 bp的百合CHS基因的上游调控序列。
黄艳岚(《马铃薯花青素转录激活基因的克隆与序列分析》.华南热带农业大学2006硕士学位论文)从紫色马铃薯紫皮RNA中扩增了花青素转录激活基因MYC的保守区域片段(Stmyc1),长度为1 106 bp,具有完整的编码阅读框,编码区为10-990 bp,共编码326个氨基酸,与紫苏MYC类基因编码蛋白的一致性达94%。扩增了花青素转录激活基因R2R3 MYB的保守区域片段(Stmyb280和Stmyb211),Stmyb211编码的蛋白与番茄THM27、葡萄抗毒素GNF13、拟南芥At4g38620和MYB转录因子的花青素R2R3-MYB类蛋白有94%的相似性。
2.3 生物碱生物碱代谢研究主要集中在生物碱的储存和合成部位、转运途径、代谢调控因子、生物合成途径、关键酶及其编码基因等方面,生物碱代谢的精确途径和此过程中的关键酶及其编码基因的克隆是研究的焦点。
韩梅等[18]克隆得到长春花萜类吲哚生物碱合成途径中编码重要酶:5-磷酸脱氧木酮糖还原酶(DXR)、次番木鳖苷合成酶(SLS)、牻牛儿醇-10羟化酶(G10H)和异胡豆苷合成酶(STR)的cDNA基因片段。利用BP重组酶将扩增片段克隆到Gateway化的入门载体pDONR201中,并进行测序验证。测序后的基因通过LR重组酶的作用转移到带有HIS标签的目标载体pETG10A中,构成重组表达质粒,转化大肠杆菌BL21(DE3),经IPTG诱导得到了高效表达,通过Ni-TED树脂纯化方法得到了高纯度的蛋白。
黄海滨等[19]克隆了播娘蒿的甜菜碱醛脱氢酶(DsBADH)基因,cDNA序列全长1 653 bp,其中开放阅读框长1 503 bp,编码一个由501个氨基酸残基组成的蛋白质,推测的蛋白质相对分子质量为54 KD。播娘蒿的DsBADH与其它物种的BADHs无论在核酸水平还是在蛋白质水平上都表现较高的同源性,表明BADH基因家族具有较高的保守性。DsBADH基因的氨基酸序列在进化上与同属十字花科植物BADH基因距离较近。蛋白质序列存在一个编码十肽的高度保守序列,该结构在醛脱氢酶中是高度保守的,这些残基可能包含NAD+结合位点及酶催化位点,而且含有与酶功能有关的醛脱氢酶高度保守的氨基酸残基Cys,表明DsBADH可编码活性蛋白。
2.4 酚类物质段艳冰(《丹参中迷迭香酸生物合成途径的苯丙氨酸支路基因的克隆及研究》.第二军医大学2006硕士学位论文)克隆出丹参迷迭香酸生物合成途径中苯丙氨酸支路上的肉桂酸-4-羟化酶SmC4H (einnamate-4-hydorxylase)基因以及苯丙氨酸解氨酶SmPAL(phenylalanine ammonia-lyase)基因。SmC4H基因cDNA序列全长1 800 bp,包含一个完整的1512bp的开放阅读框,编码504个氨基酸组成的前体蛋白,该基因与藿香的C4H基因相似性达到94.7%,一致性达到89.7%。SmPAL基因cDNA序列全长2 354 bp,包含一个长度为2 133 bp的ORF区,编码含有711个氨基酸残基的蛋白,氨基酸水平比对结果以及蛋白空间结构预测表明,该基因为丹参中的PAL基因。
王冰梅等[20]从花生中分离出白藜芦醇合酶 (resveratrol synthase, RS) 基因,将其克隆到pMD18-T和pBluescript II KS (+)载体,获得全长1 537 bp的片段,含有2个外显子和1个内含子,编码区由389个氨基酸组成,其相对分子质量为42.8 KD,该白藜芦醇合酶氨基酸368 ~ 378位点上存在芪合酶家族的特征位点GVLFGFGPGLT。
2.5 多糖曾宇等[21]以藏青稞QB09基因组DNA为模板,构建DNA步移文库,并通过步移技术克隆出β-1,3-葡聚糖酶基因(BGHⅡ)起始密码子上游调控序列BGHP,BGHP具有大多数高等植物启动子的保守元件,对青稞BGHⅡ基因表达的调控具有多种时间性和空间性。
2.6 凝集素朱亚然等[22]克隆了海芋凝集素的全长cDNA,长度为1 124核苷酸,分析表明它是一个编码270个氨基酸残基的蛋白质,其等电点为pH 5.7,相对分子量为29.7 kD。同源性分析结果表明,海芋凝集素与其他来源于天南星科的甘露糖凝集素以及相似蛋白具有高度同源性。在海芋凝集素序列中发现了2个B型凝集素功能区域和3个甘露糖的结合位点,认为海芋凝集素cDNA是一个编码甘露糖识别凝集素的基因序列。
2.7 泛素陆小平等[23]克隆出蒙古桑树的泛素基因(mUb),克隆片段序列为泛素基因的阅读框架,其中有2个起始密码子(ATG)和1个终止密码子(TAA),长度为459个碱基,序列与菠萝、三叶胶树、烟草等物种的泛素基因有84%以上的同源性。
王利芬等[24]克隆出丰驰桑的植物泛素基因,得到1条690 bp的泛素基因片段。该片段5’端为编码156个氨基酸残基的阅读框,3’末端有219 bp的非翻译区。桑树泛素延伸蛋白与马铃薯、烟草、陆地棉、黄瓜的泛素延伸蛋白以及苜蓿的核糖体S27A蛋白的同源性都在96%以上。
3 展望
“中药基因组计划”是将分子生物学、生物信息学等现代生物技术与其他现代科学技术相结合研究开发中药,美国相继提出“人类基因组计划”(HGP)、“植物基因组计划”(PGP)、“微生物基因组计划”(MGP)都取得了突破性进展。我国提出和实施“中药基因组计划”是中药现代化研究与开发政策的重大战略措施,其中功能基因的研究是“中药基因组计划”中最重要的研究内容之一。在植物中药功能基因研究中,与基因组测序相比,药用植物次生代谢功能基因的研究是药用植物基因研究中最为活跃的领域,进展较快,并在一些领域中取得较大进展,植物次生代谢基因的发现、蛋白功能的确定、代谢途径的阐明、代谢物谱与微量代谢物的鉴定对特殊天然产物生产将带来巨大变革。我国的药用植物次生代谢功能基因克隆工作应增强原创性研究,体现我国传统中草药的深刻内涵,开展具有中国特色的药用植物功能基因研究,建立和完善药用植物重要功能基因组研究与发现的技术体系,获得具有我国自主知识产权、功能明确和有应用前景的重要基因, 在了解中药遗传信息表达和调控规律的基础上,对次生代谢产物的关键基因进行调控,促进其表达,从而提高目的产物的含量,同时通过控制遗传信息来分析和合成中药有效成分,为世界医药卫生事业发展作出贡献[25~26]。
【参考文献】
[1]黎 裕,王天宇,贾继增. 植物功能基因组学的发展现状与发展趋势[J].生物技术通报,2000,4:6.
[2]赵 雪,谢 华,马荣才. 植物功能基因组研究中出现的新型分子标记[J].中国生物工程杂志,2007, 27(8): 104.
[3]朱 平,王 伟,程克棣. 药用植物功能基因[J].中国生物工程杂志,2004,24(2):3.
[4]赵淑娟,刘 涤,胡之壁. 植物次生代谢基因工程[J].中国生物工程杂志,2003,23(7):52.
[5]于 玲,王 莱,牛吉山,等. 植物功能基因组研究进展[J].西北师范大学学报(自然科学版),2003,39(1):104.
[6]李 嵘,王喆之.植物萜类合成酶1-脱氧-D-木酮糖-5-磷酸还原异构酶的分子结构特征与功能预测分析[J].植物研究,2007,27(1):59.
[7]肖明贵,余龙江,刘 智,等.曼地亚红豆杉植株中GGPP合成酶的克隆与分析[J].中国生物工程杂志,2004,24(2):45.
[8]周明兵,肖月华,朱冬雪,等.杜仲胶合成相关基因EuFPS的克隆及序列分析[J].分子植物育种,2003,1(1):66.
[9]赵玉军,叶和春,李国凤,等.优系青蒿法呢基焦磷酸合酶基因的克隆和酶学分析[J].科学通报,2003,48(2):162.
[10]罗志勇,刘水平,陆秋恒,等. 人参植物与皂苷生物合成相关的差减cDNA文库构建及基因差异表达分析[J].生命科学研究,2003,7(4):324.
[11]罗志勇,陆秋恒,刘水平,等. 人参植物皂苷生物合成相关新基因的筛选与鉴定[J].生物化学与生物物理学报,2003,35(6):554.
[12]刘水平,罗志勇,陈湘晖,等. 人参皂苷生物合成相关新基因GBR6的cDNA克隆及序列分析[J].生命科学研究,2004,8(4):351.
[13]刘长军,孟玉玲,侯嵩生,等.棉花法呢基焦磷酸合酶cDNA克隆、序列分析及其种子发育过程中的表达特征[J].植物学报,1998,40(8):703.
[14]诸 姮,胡宏友,卢昌义,等. 植物体内的黄酮类化合物代谢及其调控研究进展[J]. 厦门大学学报(自然科学版),2007,46(增刊1):136.
[15]程水源,杜何为,许 锋,等. 银杏苯丙氨酸解氨酶基因的克隆和序列分析[J].林业科学研究,2005, 18(5): 573.
[16]崔光红,黄璐琦,邱德有. 丹参功能基因组学研究Ⅱ——丹参毛状根不同时期基因表达谱分析[J].中国中药杂志,2007,32(13):1267.
[17]段小瑜,马兵钢,牛建新.大豆异黄酮合酶基因的克隆及序列分析[J].生物技术,2007,17(2):3.
[18]韩 梅,赵 博,安志刚,等. 长春花萜类吲哚生物碱生物合成途径中重要酶(DXR、SLS、G10H、STR)基因的克隆与表达[J].植物研究,2007,27(5):564.
[19]董海滨,管荣展,张红生,等. 播娘蒿甜菜碱醛脱氢酶基因的克隆和表达分析[J].分子植物育种,2006,4(2):209.
[20]王冰梅,潘海芳,叶冰莹,等.花生白藜芦醇合酶基因的DNA克隆及序列分析[J]. 福建师范大学学报(自然科学版) 2005,21(3):56.
[21]曾 宇,苗 琛,唐 琳,等. 青稞β-1,3葡聚糖酶Ⅱ基因启动子的克隆分析及表达载体的构建[J].应用与环境生物学报,2003,9(2):122.
[22]朱亚然,王 捷,黄炳球,等.海芋凝集素cDNA的分子克隆及其性质预测[J].植物生理与分子生物学学报,2006,32(6):634.
[23]陆小平,肖 靓,陈正凯,等.桑树多聚泛素基因的克隆及序列分析[J].蚕业科学,2006,32(3):301.
[24]王利芬,陈正凯,陆小平.桑泛素延伸蛋白基因片段的克隆及序列分析[J].生物技术,2007,17(4):6.
[25]杨致荣,毛 雪,李润植.植物次生代谢基因工程研究进展[J].植物生理与分子生物学学报,2005,31(1):11.
[26]魏小勇,方 花,李杰芬.植物中药功能基因研究[J].中草药,2005,36(8):1251.