3种常用亲本分析软件效率的比较--以鹅掌楸属树种控制授粉子代亲本分析为例  

李博 , 潘文婷 , 李康琴 , 李火根
南京林业大学林木遗传与生物技术省部共建教育部重点实验室, 南京, 210037
作者    通讯作者
《分子植物育种》印刷版, 2013 年, 第 11 卷, 第 14 篇   doi: 10.3969/mpb.011.000241
收稿日期: 2012年12月10日    接受日期: 2013年01月11日    发表日期: 2013年02月20日
© 2013 BioPublisher 生命科学中文期刊出版平台

这是一篇《分子植物育种》印刷版的数字优先出版(Online Publishing in Advance)论文,如果需要下载阅读全文,请您订阅

摘要

在亲本分析中,常用基于最大似然法的软件(如CERVUS, COLONY, PAPA)进行亲本推定,但不同软件各有其特点,其分析结果与亲本推定效率有时相差较大。为比较3种亲本分析软件(CERVUS3.0, COLONY2.0, PAPA2.0)的效率,本文以包含278个鹅掌楸潜在亲本及90个鹅掌楸已知亲本的子代群体为材料,利用13对EST-SSR引物对其进行分子检测,将3种软件推定的子代亲本与其真实亲本进行对照,进而评价各亲本分析软件的效率。研究结果表明,单亲(父本)分析时,CERVUS与COLONY软件分析效率较高;双亲分析时,采用PAPA 软件对异交子代分析结果较好,而CERVUS与COLONY软件则对自交子代分析效果较好。总体上,单亲分析的效率高于双亲分析。增加分子标记数量,或筛选多态性高的分子标记可提高双亲分析精度。

关键词
亲本分析;授粉;父本分析;双亲分析;CERVUS;COLONY;PAPA;鹅掌楸属

通过观察和(或)采用遗传标记来研究个体或种群的亲缘关系,重建子代的亲本谱系的过程,称为亲本分析。亲本分析主要有单亲分析和双亲分析两种,而单亲分析中父本分析方式较常见。亲本分析的理论模型主要有3类:即遗传排除法(genetic exclusion)、最大似然法(maximum likelihood assignment)和父性拆分法(fraction paternity assignment),基于最大似然法开发的亲本分析软件CERVUS应用最为广泛(Kalinowski et al., 2007; Jones et al., 2010; Xu et al., 2010)。

目前,亲本分析软件在动植物研究中应用较为广泛,但在具体选择哪一种分析软件时,还应考虑试验群体类型、遗传标记种类及特点、潜在亲本数量、突变率,零等位基因频率、以及读带误差等等,上述因素均会影响亲本分析结果的准确性。然而,迄今为止,对于不同亲本分析软件效率的比较研究尚未见报道,仅Slate等(2000)利用麋鹿(Cervus elaphus)为实验材料对CERVUS软件亲本分析的准确性进行过讨论。基于此,本研究以谱系清楚的90个鹅掌楸控制授粉子代及其278个候选亲本为实验材料,在假定父本未知或双亲未知的条件下,采用三种亲本分析软件(CERVUS, COLONY和PAPA)对鹅掌楸子代及候选亲本进行亲本分析,将分析所得结果与子代的真实亲本进行对比,进而比较3种软件的效率及特点,期望为植物亲本分析软件的选择提供参考。

1结果与分析
1.1实验群体遗传多样性及零等位基因频率分析
利用13对SSR引物对鹅掌楸实验群体(90个已知亲本的子代及278个候选亲本)进行PCR扩增。在整个实验群体中,13对SSR引物共扩增出68个等位基因,每个位点的等位基因平均数为5.23 (表1)。13个SSR位点的平均观测杂合度为0.476 6。Shannon多样性指数在不同位点间差异较大,其中,位点LT91最高,为1.929;而位点LT98最低,仅为0.678 1,平均为1.463 6。表明该批SSR引物具有较高的多态性,适合用于亲本分析。

 
表1 鹅掌楸候选亲本及子代SSR遗传多样性及零等位基因频率
Table 1 The genetic diversity and null allele frequency in an experimental population of Liriodendron spp as revealed by 13 EST-SSR loci 

利用CERVUS3.0软件分析了13个SSR位点的零等位基因频率。零等位基因频率变动范围为0.139 8~0.417 7,平均为0.219。

1.2子代谱系与亲本分析效率
利用三种亲本分析软件分别对双亲已知的控制授粉子代(即谱系清楚子代)及双亲均未知的林下自然更新苗木(即谱系不清的子代)进行双亲分析(表2)。可以看出,三种软件对谱系清楚的控制授粉子代的检出比例均高于谱系不清的林下自然更新子代的检出比例。相比较而言,PAPA与COLONY两种软件的分析效率较高,且两者效率几乎相同,而CERVUS软件的分析效率明显低于上述两者。

 
表2 3种亲本分析软件在鹅掌楸控制授粉子代及林下更新子代的检出比例
Table 2 The percentage of parentage pair assignment of three softwares for control/open pollination progenies in Liriodendron spp 

1.3三种亲本分析软件的效率比较
以278个鹅掌楸成年个体作为候选亲本群体,在设定候选亲本取样比例为1,平均基因分型误差为0.01,似然计算误差为0.01的条件下,利用CERVUS3.0、COLONY和PAPA三种软件对90个鹅掌楸控制授粉子代进行亲本分析。表3为80%置信度下的亲本推定结果。从中可以看出,COLONY软件的亲本分析效率较高。除了双亲分析中推定亲本准确率为37.78%,稍低于CERVUS3.0分析43.5%外,COLONY软件分析的结果均高于另外两种软件。与CERVUS3.0、COLONY两种软件分析结果相比,PAPA2.0分析结果准确性较低。同时,还可以看出,对于同一种软件而言,其单亲分析(如父本分析)准确率均高于双亲分析。

 
表3 3种亲本分析软件对鹅掌楸控制授粉子代的亲本分析结果
Table 3 The parentage analysis for control pollination progenies of Liriodendron spp 

1.4控制授粉子代类型与亲本分析效率
以鹅掌楸控制授粉子代及所有潜在亲本为实验材料,比较三种亲本分析软件在两种交配类型(自交,异交)子代群体中的的亲本分析效率(表4; 表5)。结果显示,PAPA与COLONY两种软件在不同交配类型子代的父本分析结果相差不大,而CERVUS软件分析结果则差异较大。父本分析时,CERVUS对于自交子代分析结果较差,不能正确检验出两个亲本,但对于异交子代则分析结果较好,在80%置信度下其推定比例,其检出比例及推定亲本准确率分别为70.8%和86.3% (表4)。而双亲分析时,COLONY和CERVUS对异交子代分析结果较差,但对自交类型分析结果较好,自交类型中CERVUS分析得到的推定亲本准确率为81.2%,COLONY软件推定亲本准确率为83.3% (表5)。与其他两个软件相比,PAPA2.0的分析结果则正好相反。可见,PAPA软件适用于异交子代的亲本分析,而COLONY和CERVUS软件适用于自交子代的亲本分析。

 
表4 鹅掌楸自交与异交子代的父本分析效率
Table 4 The power of paternity analysis for selfing/outcrossing progenies of Liriodendron spp 

 
表5 鹅掌楸自交与异交子代的双亲分析效率
Table 5 The power of parental pair analysis for selfing/outcrossing progenies of Liriodendron spp 

2讨论
本研究所比较的三种软件(COLONY, CERVUS和PAPA)中,CERVUS应用范围最广,而PAPA应用较少(Duchesne et al., 2002)。相比较而言,COLONY软件的功能较多。该软件不仅可用于亲本分析,而且还可用于谱系构建,分析群体的交配系统类型及个体的繁殖适合度,以及重构亲本或子代的基因型(Wang, 2007)。CERVUS软件最早应用于动物的亲本分析。随着林木分子标记技术的应用,该软件也逐渐应用于林木的父本分析。目前,CERVUS已应用于欧洲冷杉(Abies alba) (Vendramin et al., 1999)、马尾松(Pinus massoniana) (艾畅等, 2006)、青冈(Cyclobalanopsis glauca) (陈小勇和宋永昌, 2000)、栎树(Quercus macrcarpa) (Dow and Ashley, 1996)、黑杨(Populus nigra L.) (Georg et al., 2010)、鹅掌楸(Liriodendron) (Xu et al., 2006)等树种的父本分析。

Slate等(2000)在马鹿(Cervus elaphus)的父本分析中,仅对CERVUS软件的准确性进行了研究。Slate等(2000)利用84个位点对已知子代的172个候选父本进行分析,在80%置信度下其父本推定比率为98.25%,推定亲本中真正亲本比例为75.1%。本文利用13个SSR位点对鹅掌楸90个控制授粉子代进行父本分析,与Slate等(2000)相比,所使用的标记位点数大大减少,但亲本分析效率仅稍低于Slate等(2000)结果。在80%,置信条件下,利用CERVUS软件检出亲本的子代比率为70.%,推定父本准确率为69.9% (表3)。表明对于异交为主的林木,在进行亲本分析时,采用10~20个多态性较高的共显性分子标记(如SSR)就能达到较高的亲本分析效率,从而可大大降低实验工作量。而如果采用不同的亲本分析软件对相同实验群体采用相同的标记类型与数量,其结果又如何本实验结果显示,COLONY软件的分析效率优于CERVUS软件,而PAPA分析结果则相对较差。这足以说明亲本分析时软件选择的重要性。

三种软件的双亲分析效率均低于单亲分析(父本分析)。究其原因,可能有以下三个方面:(1)鹅掌楸为两性花,其交配类型主要以异交为主,兼性自交。与动物中单性异交的交配方式相比,林木的交配系统更复杂,增加了亲本分析的难度,尤其是双亲分析(Jones and Ardren, 2003)。(2)本研究所选用的13个SSR标记位点的零等位基因频率较高。亲本分析时,如果所采用标记位点的零等位基因频率较高,将导致某些真正的亲本被错误排除,导致亲本分析的准确性降低。许多亲本分析软件试图通过特定的算法来降低零等位基因对亲本分析的影响,但效果并不太理想(Dakin and Avise, 2004; Jones and Ardren, 2003)。(3)本研究仅选用了13个SSR位点,位点数稍少,有可能导致亲本排除概率不足。如果增加分子标记数量,或可提高双亲分析效率(Jones et al., 2010)。

综上所述,对于以异交为主兼性自交的森林树种如鹅掌楸,在单亲(比如, 父本)分析时,采用CERVUS及COLONY软件分析效果较好。而双亲分析时,尽管3种软件的分析结果都不甚理想,但相比较而言,CERVUS及COLONY软件适用于自交子代的亲本分析,而PAPA软件适用于异交子代的双亲分析。本研究结果对于植物亲本分析软件的选择具有参考意义。

3 材料与方法
3.1实验群体
为比较不同亲本分析软件的效率,利用已有的鹅掌楸杂交育种亲本群体及控制授粉子代群体,以及林下自然更新子代苗木作为本研究的实验群体。亲本群体来自1994年建立的鹅掌楸属(Liriodendron)种源试验林(李火根等, 2005)。控制授粉子代群体来源于2005年所获得的控制授粉子代,详细的交配组合见表6。2005年10月采种,共获得15个交配组合子代种子。2006年3月播种育苗,2008年春定植于江苏省句容市下蜀镇南京林业大学实习林场。

 
表6 鹅掌楸交配组合
Table 6 mating combinations of Liriodendron spp 

2011年7月中旬,从每个交配组合的子代中(全同胞家系)随机选取6个个体(基因型),每个个体采集3~5片嫩叶,置于-70℃超低温冰箱内保存。同年8月,在亲本群体(种源试验林)内设定16 m×16 m样方,采集样方内所有林下自然更新小苗幼嫩叶片,共获115株子代苗。同时,采集所有潜在亲本(278株)的幼嫩叶片,置于-70℃超低温冰箱内保存。

3.2研究方法
3.2.1鹅掌楸基因组DNA的提取
采用改进的CTAB裂解-硅珠吸附法(张博等, 2004; Kasem et al., 2008)提取鹅掌楸基因组DNA,利用1.0%琼脂糖凝胶电泳进行DNA质量检测。

3.2.2 PCR扩增
Xu等(2006)开发的176对EST-SSR引物中筛选出13对多态性引物对鹅掌楸实验群体进行PCR扩增,其PCR扩增反应体系及PCR扩增反应程序分别列于表7和表8。

 
表7 PCR扩增反应体系
Table 7 Contents of PCR amplification 

 
表8 PCR扩增反应程序
Table 8 Procedure of PCR amplification 

在PCR扩增产物中加入4 µL溴酚蓝,采用8%聚丙烯酰胺变性凝胶进行电泳。经硝酸银染色显带,最后,利用BIO-RAD凝胶成像系统对电泳条带进行判读。

3.2.3分析软件及分析参数
利用POPGENE6 (http://www.ualberta.ca/~fyeh/download.htm)和CERVUS3.0计算等位基因平均数(A)、观测杂合度(Ho)、Shannon多样性指数(I)和零等位基因频率(null allele frequence),同时利用CERVUS3.0,COLONY2.0和PAPA2.0对子代进行父本分析及双亲分析。CERVUS3.0及COLONY2.0在80%的置信概率条件下计算推定亲本的子代比例及推定亲本准确率,具体的计算

公式(Slate et al., 2000)如下:

推定亲本的子代比例=X/N;

推定亲本准确率=Y/X;

(N: 亲本分析中控制授粉子代总数; X: 亲本分析中可推定亲本的控制授粉子代数量; Y: 亲本分析中正确推定得到亲本的控制授粉子代数量)

CERVUS、COLONY和PAPA是以最大似然法为理论基础而编写的软件,3种软件都在windows下运行,其操作简单,界面友好,但因具体算法不同其功能也有所区别。3种软件组合使用基本可以解决在亲本分析研究中所遇到的问题,具体的功能及特点见表9。

 
表9 3种不同软件的功能及误差兼容
Table 9 Available functions and error accommodation of 3 parentage analysis softwares 

作者贡献
李博是本研究的实验设计和实验研究的执行人,完成论文初稿的写作;潘文婷和李康琴参与实验结果分析及实验数据的收集;李火根是项目的构思者及负责人,指导实验设计,文章修改与定稿;全体作者都阅读并同意最终的文本。

致谢
本研究由国家自然科学基金项目(30972391, 31170621)、江苏省高校自然科学重大项目(10KJA220017)和江苏省研究生培养创新工程(CXZZ12_0543)共同资助。

参考文献
Ai C., Xu L.A., Lai H.L., Huang M.R., and Wang Z.R., 2006, Genetic diversity and paternity analysis of a seed orchard in Pinus massoniana, Linye Kexue (Scientia Silvae Sinicae), 42(11): 146-150 (艾畅, 徐立安, 赖焕林, 黄敏仁, 王章荣, 2006, 马尾松种子园的遗传多样性与父本分析, 林业科学, 42(11): 146-150)

Chen X.Y., and Song Y.C., 2000, Analysis of parentage for naturally established seedlings of Cyclobalanopsis glauca, Zhiwu Kexue Xuebao (Plant Science Journal), 18(3): 174-180 (陈小勇, 宋永昌, 2000, 自然定居青冈幼苗的亲本分析, 植物科学学报, 18(3): 174-180)

Dakin E.E., and Avise J.C., 2004, Microsatellite null alleles in parentage analysis, Heredity, 93(5): 504-509

Dow B.D., and Ashley M.V., 1996, Microsatellite analysis of seed dispersal and parentage of saplings in bur oak, Quercus macrcarpa, Mol. Ecol., 5(5): 615-627

Duchesne P., Godbout M.H., and Bernatchez L., 2002, PAPA (package for the analysis of parental allocation): a computer program for simulated and real parental allocation, Mol. Ecol. Notes, 2(2): 191-193

Georg R., Marc N., Melanie K., Birgit Z., and Ronald B., 2010, Short-distance gene flow in Populus nigra L. accounts for small-scale spatial genetic structures: implications for in situ conservation measures, Conserv Genet, 11(4): 1327-1338

Jones A.G., Small C.M., Paczolt K.A., and Ratterman N.L., 2010, A practical guide to methods of parentage analysis, Mol. Ecol. Resour., 10(1): 6-30

Jones A.G., and Ardren W.R., 2003, Methods of parentage analysis in natural populations, Mol. Ecol., 12(10): 2511-2523

Kalinowski S.T., Taper M.L., and Marshall T.C., 2007, Revising how the computer program CERVUS accommodates genotyping error increases success in paternity assignment, Mol. Ecol., 16(5): 1099-1106

Kasem S., Rice N.F., and Henry R.J., 2008, DNA extraction from plant tissue, In: Henry R.J. (ed.), Plant genotypingⅡ: SNP technology, CABI Publishing, Wallingford, UK, pp.219-271

Li H.G., Chen L., Liang C.Y., and Huang M.R., 2005, A case study on provenance testing of tulip tree (Liriodendron spp),Linye Keji Kafa (China Forestry Science and Technology), 19(5): 13-16 (李火根, 陈龙, 梁呈元, 黄敏仁, 2005, 鹅掌楸属树种种源试验研究, 林业科技开发, 19(5): 13-16)

Slate J., Marshall T.C., and Pemberton J.M., 2000, A retrospective assessment of the accuracy of the paternity inference program CERVUS, Mol. Ecol., 9(6): 801-808

Vendramin G.G., Degen B., Petit R.J., Anzideil M., Madaghielel A., and Ziegenhagen B., 1999, High level of variation at Abies alba chloroplast microsatellite loci in Europe, Mol. Ecol., 8(7): 1117-1126

Wang J., 2007, Parentage and sibship exclusions: higher statistical power with more family members, Heredity, 99(2): 205-217

Xu M., Sun Y.G., and Li H.G., 2010, EST-SSRs development and paternity analysis for Liriodendron spp, New Forests, 40(3): 361-382

Xu M., Li H.G., and Zhang B., 2006, Fifteen polymorphic simple sequence repeat markers from expressed sequence tags of Liriodendron tulipifera, Mol. Ecol. Notes, 6(3): 728-730

Zhang B., Zhang L., Zhuge Q., Wang M.X., and Huang M.R., 2004, A rapid and simple method of total DNA extraction from tree, Nanjing Linye Daxue Xuebao (Journal of Nanjing Forestry University (Natural Sciences Edition)), 28(1): 13-17 (张博, 张露, 诸葛强, 王明庥, 黄敏仁, 2004, 一种高效的树木总DNA提取方法, 南京林业大学学报(自然科学版), 28(1): 13-17)

《分子植物育种》印刷版
• 第 11 卷
阅览选项
. PDF(0KB)
. 全文 HTML
读者评论
. 评论
作者的其他论文
.
李博
.
潘文婷
.
李康琴
.
李火根
相关论文
.
亲本分析
.
授粉
.
父本分析
.
双亲分析
.
CERVUS
.
COLONY
.
PAPA
.
鹅掌楸属
服务
. Email 推荐给朋友
. 发表评论