番茄WRKY转录因子in silico鉴定及表达分析  

万红建 , 俞锞 , 袁伟 , 刘云飞 , 叶青静 , 王荣青 , 阮美颖 , 姚祝平 , 杨悦俭
浙江农业科学院蔬菜研究所, 杭州, 310021
作者    通讯作者
《分子植物育种》印刷版, 2013 年, 第 11 卷, 第 13 篇   doi: 10.3969/mpb.011.000090
收稿日期: 2012年08月14日    接受日期: 2012年09月13日    发表日期: 2012年10月09日
© 2013 BioPublisher 生命科学中文期刊出版平台

这是一篇《分子植物育种》印刷版的数字优先出版(Online Publishing in Advance)论文,如果需要下载阅读全文,请您订阅

摘要

WRKY蛋白是植物中最大的转录因子家族之一,对植物的生长发育具有重要调控作用。本研究利用番茄全基因组测序结果鉴定了WRKY基因,分析了其系统发育关系,内含子-外显子结构,染色体上的分布及其表达方式。研究表明:番茄中存在81个WRKY转录因子,分为三类(Ⅰ, Ⅱ和Ⅲ),第Ⅰ和Ⅱ类分别细分为2和5个亚类,这些基因不均匀分布在番茄的11条染色体上;基因结构分析表明番茄WRKY转录因子进化过程中可能发生内含子的缺失/获得事件;不同芯片表达分析表明WRKY基因不仅参与了番茄根、子叶和真叶等不同组织类型的生长发育,而且还参与了一些生物胁迫(盐)和非生物胁迫(真菌激活子)的反应。

关键词
番茄;WRKY转录因子;生物信息学;表达分析

WRKY蛋白是植物中编码多成员的转录因子大家族,因其家族成员均含有WRKYGQK结构域而得名。第一个WRKY转录因子(SPF1)是从甘薯中分离获得的(Ishiguro and Nakamura, 1994),随后,研究者从不同植物中分离出WRKY转录因子,如拟南芥(de Pater et al., 1996)、大麦(Sun et al., 2003)、水稻(Zhang et al., 2004)、海棠(蒋阿维等, 2010)、黄瓜(Ling et al., 2011)等。这些转录因子均含有1或2个保守的WRKY结构域,通常含有60个氨基酸残基。每个WRKY保守结构域含有一个WRKYGQK七肽和一个锌指结构(C2H2或C2HC)。

研究者根据WRKY结构域的数量及锌指结构的组成,将WRKY蛋白家族分为3组,第一组(Ⅰ)通常含有2个WRKY结构域,如ABFI、SPFI、Pe- WRKY1及AP1等,其锌指结构的氨基酸组成模式为C-X45-C-X22-23-H-Xl-H(X为非保守的氨基酸)。第二组(Ⅱ)和第三组(Ⅲ)通常是只含有一个WRKY结构域,他们的主要区别在于锌指结构稍有差异。其中第二组的锌指结构与第一组类似,而第三组的锌指结构与第一、二组稍有不同,其结构模式为:C-X7-C-X23-H-T-C (de Pater et al., 1996)。

近年来,研究发现WRKY基因不仅在植物的根、茎、叶、花和果实等组织器官中表达,而且还会因植物受到生物胁迫和非生物胁迫而诱导表达。生物胁迫如Yang等(1999)和Guo等(2004)人发现病原物诱导WRKY基因的表达,不同的非生物胁迫因子包括干旱、低温、创伤等都能被诱导表达(Pnueli et al., 2002; Huang and Duman, 2002; Hara et al., 2000)。表明WRKY基因不仅可以参与植物的生长发育,而且调控植物适应外界逆境的环境条件。

最近,番茄基因组测序已经完成(The Tomato Genome Consortium, 2012),为我们在全基因组水平分析WRKY转录因子家族提供了可能。本研究运用生物信息学方法鉴定番茄中编码WRKY转录因子的数量,分析结构特征,染色体定位,系统发育关系以及表达模式,这将为揭示番茄WRKY转录因子的功能奠定基础。

1结果与分析
1.1番茄WRKY转录因子的鉴定及系统发育树构建

为了尽可能的全面鉴定番茄WRKY蛋白,两种方法用来检索番茄基因组数据库序列。首先,使用关键词“WRKY”搜索番茄基因组数据库(http://solgenomics.net/和http://mips.helmholtz-muenchen.de/plant/tomato/searchjsp/index.jsp/)。其次,我们从数据库PFAM (http://pfam.sanger.ac.uk/)中下载WRKY蛋白的保守序列(PF03106),利用这些序列对番茄基因组数据库进行BLAST搜索;通过这两种方法供检索获得85个候选番茄WRKY转录因子序列,随后,通过数据库PFAM鉴定这些基因是否具有WRKY结构域,4个无此结构域,因此它们没有进步一分析。最后共鉴定出81个番茄WRKY转录因子。这些转录因子的长度为537 bp (solyc03g082750.1.1)-6 011 bp (solyc12g014610.1.1)之间。其中15个WRKY蛋白(solyc12g014610.1.1, solyc07g047960.2.1, solyc07g06-6220.2.1, solyc06g066370.2.1, solyc02g088340.2.1, sol- yc03g104810.2.1, solyc09g014990.2.1, solyc04g05636-0.2.1, solyc05g012770.2.1, solyc10g005680.1.1, solyc-07g005650.2.1, solyc10g084380.1.1, solyc07g065260.2.1, solyc05g055750.2.1和solyc12g006170.1.1)编码两个高度保守的WRKY结构域;两个WRKY蛋白(solyc03g082750.1.1和solyc05g014040.1.1)缺失了WRKYGQK七肽,其余基因只含有一个WRKY保守结构域。

基于“WRKY”保守结构域氨基酸序列,运用软件MEGA5.0构建了番茄WRKY蛋白的系统发育树(图1)。其中具有两个高度保守的WRKY结构域的15个番茄WRKY转录因子被用来一起分析。命名规则:前一个WRKY结构域在基因名字末尾加上N,后一个结构域在基因名字末尾加上C。例如,SlWRKY01具有两个WRKY保守结构域,在构建系统发育树时,这两个保守结构域分别被命名为SlWRKY01N和SlWRKY01C。此外,为了确保系统发育树的准确,模式拟南芥的AtWRKY蛋白序列也被选择用来一起构建系统发育树。如图1所示,番茄WRKY转录因子可以明显的分为三大类,第一类包括番茄31个WRKY转录因子家族成员,可细分为Ⅰa-NTWD (N端的WRKY结构域聚合在一起),Ⅰa-CTWD (C端的WRKY结构域聚合在一起)和Ⅰb。第二类包括39个WRKY转录因子家族成员,占整个WRKY转录因子的50%,进一步分为五类,即Ⅱa、Ⅱb、Ⅱc、Ⅱd和Ⅱe。剩下的WRKY转录因子被聚为第三类(Ⅲ)。拟南芥WRKY转录因子成员也相应的归为番茄三类WRKY转录因子中,进一步支持了番茄WRKY转录因子分类的准确性。
 


图1 番茄WRKY转录因子系统发育树
Figure 1 The phylogenetic tree of WRKY proteins of tomato

 

1.2番茄WRKY转录因子保守结构域比对
为揭示番茄WRKY转录因子结构域的保守程度以及锌指结构特征,对这些转录因子的结构域进行多序列比对。根据上述系统发生树的结果,将WRKY结构域分为三类进行多序列比对(图2)。图2A显示的是Ⅰ类WRKY结构域的多序列比对图,可以看出WRKYGQK七肽具有较高的保守性,只有五个WRKY转录因子发生了突变,即SlWRKY48N的WRKY结构域突变为WIKYGEN、SlWRKY19、SlWRKY30、SlWRKY60和SlWRKY64均突变为WRKYGKK;Ⅰa-NTWD类转录因子锌指结构氨基酸组成为C-X4-C-X22-H-X1-H (X为非保守的氨基酸),而Ⅰa-CTWD和Ⅰb类转录因子锌指结构氨基酸组成为C-X4-C-X23-H-X1-H。图2B显示的是Ⅱ类WRKY结构域的多序列比对图,可以看出SlWRKY67和SlWRKY13的WRKYGQK七肽发生缺失,SlWRK-Y36的WRKYGQK七肽突变为WRKYGMK,其余的转录因子都是高度保守的;Ⅱa~Ⅱd类WRKY转录因子锌指结构氨基酸组成为C-X5-C-X23-H-X1-H,这些锌指结构氨基酸组成均与先前报道相一致(Eulgem et al., 2000);而Ⅱe类为CX29HX1H,目前在其他植物中还未见报道,这可能是番茄基因组中WRKY转录因子的特异结构。第Ⅲ类WRKY结构域的多序列比对见图2C。除了SlWRKY32WRKYGQK突变为WRKYGKK外,所有的转录因子均为WRKYGQK,显示高度的保守性;Ⅲ类WRKY转录因子锌指结构氨基酸组成为C-X7-C-X23-24-H-X1-C。这与以前报道的锌指结构氨基酸组成有细微差别,通常认为第二个C和H之间为23个变异的氨基酸,而在番茄中发现存在24个氨基酸的现象,如SlWRKY76。此外,一般还认为H和最后一个C之间是T,然而我们发现在番茄中H和C之间为T/S/N,因此,我们推测此位点在植物中可能是变异的,不是恒定的T。
 


图2 番茄SlWRKY转录因子“WRKY”结构域的氨基酸序列比对
Figure 2 The multiple sequence alignment of  “WRKY”  conserved domain in tomato WRKY proteins

 

1.3番茄WRKY转录因子染色体定位及外显子-内含子结构分析
根据茄科数据库网站番茄基因组信息,绘制了81个WRKY转录因子在染色体的分布图(图3)。发现除了11号染色体(Sl.11)外,所有染色体上都有WRKY转录因子的分布;大多数分布在染色体的末端,大约20%的WRKY转录因子(16个)分布在5号染色体上,剩下的WRKY转录因子比较均匀的分布在其余染色体上,每条染色体上大致分布4~9个。通过番茄基因组数据库提供的每一个SlWRKY转录因子基因组序列和核苷酸序列,利用GSDS网站绘制了它们的基因结构模式图(图4)。所有的SlWRKY基因有含有较少的内含子(0~5个),SlWRKY13和SlWRKY36基因无内含子。此外,每一类SlWRKY转录因子内部内含子的分布也是不均衡的,比如在Ⅰa类中,除了SlWRKY43含有2个内含子外,所有的基因均含有3~5内含子;在Ⅰb类中,除了SlWRKY71外含有3个内含子外,都含有1~2个内含子。在Ⅱb类中,除了SlWRKY81含有2个内含子外,其余的都含有4~5个内含子;而Ⅱe类基因含有0~2个内含子。
 


图3 番茄SlWRKY转录因子在染色体的分布
Figure 3 Distribution of WRKY genes in tomato chromosomes

 


图4 番茄WRKY转录因子的内含子-外显子结构特征
Figure 4 The intron-exon structure of WRKY genes in tomato

 

1.4番茄WRKY转录因子表达分析
为了进一步地研究番茄WRKY基因的表达情况,利用美国昂飞公司番茄芯片(Affymetrix Tomato Genome Array)表达的结果,共筛选出19个WRKY基因具有相应的探针,研究它们在不同组织类型、真菌胁迫和盐胁迫条件下的表达量。表达的部位和组织类型依次为下胚轴、子叶、第三片真叶、根、生长三周的叶片、生长五周的叶片和真菌激活子处理4 d的叶片、盐处理的叶片、真菌激活子处理8 d的叶片以及处理样品的对照(图5)。如图5所示,根据WRKY基因表达量的高低,这些基因可以分为两类(Ⅰ和Ⅱ类);在第Ⅰ类WRKY基因中,除了SlWRKY42、SlWRKY12、SlWRKY34和SlWRKY49在生长三周和五周的叶片中表达量较低外,其余基因在各种组织中都有较高的表达;在盐和真菌激活子胁迫处理下,SlWRKY78在真菌激活子处理下表达量下降,其余基因表达量较高;在第Ⅱ类WRKY基因中,所有基因在各种组织中表达量都较低,而在盐和真菌激活子处理下,表达量显著提高。
 


图5 番茄WRKY基因表达图谱
Figure 5 Expression profiles of tomato WRKY genes


2讨论

植物中WRKY转录因子是植物中最大的一类转录因子家族,广泛参与植物的生长发育和代谢调控。因此,全面鉴定和分析植物中WRKY转录因子为揭示其潜在功能具有重要意义。近年来,植物整个基因组的测序为我们在全基因组水平上鉴定WRKY基因家族成员提供了机遇,先前的研究已经发现拟南芥和水稻基因组中各含有72和102个成员(Wu et al., 2005),玉米含有136个(Wei et al., 2012),黄瓜55个(Ling et al., 2011)。目前,番茄基因组已经测序(The Tomato Genome Consortium, 2012),然而番茄基因组中WRKY家族成员的数目和结构还不清楚。本研究从番茄基因组数据库中鉴定了81个WRKY家族成员,分为3类;第一类(Ⅰ)含有31个成员(其中15个成员具有2个WRKY结构域,16个成员具有1个WRKY结构域),所有的这些成员都具有1个C2H2型锌指结构;第二类(Ⅱ)含有39个成员,这些基因都具有1个WRKY结构域和1个C2H2型锌指结构;第三类(Ⅲ)包括11个成员,具有1个WRKY结构域和1个C2HC型锌指结构特征。这些转录因子的多样化为深入研究WRKY基因的功能提供了一个很好的体系。

基因重复是植物基因家族进化过程中的一种重要机制。WRKY基因家族成员的鉴定表明了基因重复在番茄WRKY转录因子进化过程中已出现;系统发育关系分析发现拟南芥的几个成员分别被聚合到番茄不同类别的WRKY基因中,表明这些基因结构在拟南芥和番茄分化之前就已经构建;此外,番茄同一类WRKY转录因子具有相似的内含子数目,而不同类别的WRKY转录因子的内含子数目差异比较大(图4),表明番茄WRKY转录因子在进化过程中可能发生了内含子的缺失和获得事件。

本研究揭示了番茄WRKY基因参与根、子叶、叶片以及盐、真菌激活子处理的反应,表明他们广泛参与了番茄的生长发育,生物胁迫和非生物胁迫反应,为更深入了解WRKY基因在番茄一些重要的农艺性状以及环境因子、病虫害危害作用中的功能奠定重要基础。

3材料和方法
3.1材料

本研究所鉴定的番茄WRKY转录因子来自两个数据库,即http://solgenomics.net/http://mips.hel-mholtz-muenchen.de/plant/tomato/searchjsp/index.jsp/。拟南芥WRKY转录因子来自于TAIR数据库(http://www.arabidopsis.org/)。

3.2番茄WRKY转录因子的鉴定及基因结构分析
为了全面的鉴定番茄WRKY转录因子,我们应用两种方法对上述两个数据库进行搜索;第一种方法是应用关键词“WRKY”进行搜索;第二种方法是应用WRKY保守结构域的氨基酸序列进行同源性搜索,E值设为1e-10。然后通过PFAM网站(http://pfam.janelia.org/)鉴定这些候选基因是否具有“WRKY”结构域。通过网站(http://gsds.cbi.pku.edu.cn/)在线工具GSDS绘制WRKY基因的外显子-内含子结构图。根据茄科网站(http://solgenomics.net/)番茄基因组信息,利用软件MapDraw V2.1绘制WRKY基因染色体分布图。

3.3序列比对及系统发育树的构建
利用BioXM2.6软件将WRKY基因的核苷酸序列翻译成氨基酸序列,并且将文件格式转换为FASTA格式,进一步利用Clustal X软件将其文件格式再次转换为“CLUSTAL”格式,最后将此文件导入软件BioEdit进行多序列比对。利用MEGA (version 5.05)软件中的邻接法(Neighbor-Joining)对其氨基酸序列构建系统发育树,Bootstrap值设为1 000。

3.4番茄WRKY转录因子的表达分析
依据番茄已经发表的基因芯片(Affymetrix番茄基因表达芯片),检测SlWRKY转录因子在组织类型、生物胁迫和非生物胁迫条件下的表达情况。从番茄功能基因组数据库TFGD (http://ted.bti.cornell.edu/)网站下载三张芯片的表达结果。然后利用ClusterProject软件(Pan et al., 2003)制作基因表达谱。

作者贡献
万红建,俞锞是本研究的实验设计和实验研究的执行人;阮美颖,姚祝平和叶青静等参与论文写作与修改;袁伟,王荣青和刘云飞参与实验设计,试验结果分析;杨悦俭是项目的构思者及负责人,指导实验设计。全体作者都阅读并同意最终的文本。

致谢
本研究由国家自然科学基金(31071800)、浙江省自然科学基金(LQ12C150020)和浙江省公益技术研究农业项目(2011C22007)共同资助。

参考文献
de Pater S., Greco V., Pham K., Memelink J., and Kijne J., 1996, Characterization of a zinc-dependent transcriptional activator from Arabidopsis, Nucl. Acids Res., 24(23): 4624-4631

Eulgem T., Rushton P.J., Robatzek S., and Somssich I.E., 2000, The WRKY superfamily of plant transcription factors, Trends Plant Sci., 5(5): 199-206

Guo Z.J., Kan Y.C., Chen X.J., Li D.B., and Wang D.W., 2004, Characterization of a rice WRKY gene whose expression is induced upon pathogen attack and mechanical wounding, Acta Botanica Sinica, 46(8): 955-964

Hara K., Yagi M., Kusano T., and Sano H., 2000, Rapid systemica accumulation of transcripts encoding a tobacco WRKY transcription factor upon wounding, Mol. Gen. Genet., 263(1): 30-37

Huang T., and Duman J.G., 2002, Cloning and characterization of a thermal hysteresis (antifreeze) protein with DNA-binding activity from winter bittersweet nightshade, Solanum dulca- mara, Plant Mol. Biol., 48(4): 339-350

Ishiguro S., and Nakamura K., 1994, Characterization of a cDNA encoding a novel DNA-binding protein, SPF1, that recognizes SP8 sequences in the 5' upstream regions of genes coding for sporamin and b-amylase from sweet potato, Mol. Gen. Genet., 244(6): 563-571

Jiang A.W., Zhang S.W., Sun Y.W., Chu X.R., Zhao Y., Xu X.F., and Kong J., 2010, Expression analysis of WRKY family in response to salt stress in Malus zumi Mats, Yuanyi Xuebao (Acta Horticulturae Sinica), 37(8): 1213-1219 (蒋阿维, 张素维, 孙杨吾, 褚欣然, 赵宇, 许雪峰, 孔瑾, 2010, 珠美海棠MzWRKY基因家族盐胁迫应答模式研究, 园艺学报, 37(8): 1213-1219)

Ling J., Jiang W.J., Zhang Y., Yu H.J., Mao Z.C., Gu X.F., Huang S.W., and Xie B.Y., 2011, Genome-wide analysis of WRKY gene family in Cucumis sativus, BMC Genomics, 12: 471

Pan H., Zhu J., and Han D., 2003, Genetic algorithms applied to multi-class clustering for gene expression data, Genomics Proteomics Bioinformatics, 1(4): 279-287

Pnueli L., Hallak-Herr E., Rozenberg M., Cohen M., Goloubinoff P., Kaplan A., and Mittler R., 2002, Molecular and bioche- mical mechanisms associated with dormancy and drought tolerance in the desert legume Retama raetam, Plant J., 31(3): 319-330

Sun C.X., Palmqvist S., Olsson H., Borén M., Ahlandsberg S., and Jansson C., 2003, A Novel WRKY Transcription Factor, SUSIBA2, Participates in Sugar Signaling in Barley by Binding to the Sugar-Responsive Elements of the iso1 Promoter, Plant Cell, 15(9): 2076-2092

The Tomato Genome Consortium, 2012, The tomato genome sequence provides insights into fleshy fruit evolution, Nature, 485(7400): 635-641

Wei K.F., Chen J., Chen Y.F., Wu L.J., and Xie D.X., 2012, Molecular phylogenetic and expression analysis of the complete WRKY transcription factor family in maize, DNA Res., 19(2): 153-164

Wu K.L., Guo Z.J., Wang H.H., and Li J., 2005, The WRKY family of transcription factors in rice and Arabidopsis and their origins, DNA Res., 12(1): 9-26

Yang P.Z., Chen C.H., Wang Z.P., Fan B.F., and Chen Z.X., 1999, A pathogen- and salicylic acid-induced WRKY DNA- binding activity recognizes the elicitor response element of the tobacco class I chitinase gene promoter, Plant J., 18(2): 141-149

Zhang Z.L., Xie Z., Zou X.L., Casaretto J., Ho D.T., Shen Q.X.J., 2004, A rice WRKY gene encodes a transcriptional repressor of the gibberellin signaling pathway in aleurone cells, Plant Physiol., 134(4): 1500-1513

《分子植物育种》印刷版
• 第 11 卷
阅览选项
. PDF(0KB)
. 全文 HTML
读者评论
. 评论
作者的其他论文
.
万红建
.
俞锞
.
袁伟
.
刘云飞
.
叶青静
.
王荣青
.
阮美颖
.
姚祝平
.
杨悦俭
相关论文
.
番茄
.
WRKY转录因子
.
生物信息学
.
表达分析
服务
. Email 推荐给朋友
. 发表评论