东北粳稻群体结构和连锁不平衡分析  

刘化龙 , 郑洪亮 , 赵宏伟 , 王敬国 , 孙健 , 刘涛 , 张艳梅 , 邹德堂
东北农业大学水稻研究所, 哈尔滨, 150030
作者    通讯作者
《分子植物育种》印刷版, 2013 年, 第 11 卷, 第 4 篇   doi: 10.3969/mpb.011.000494
收稿日期: 2013年05月09日    接受日期: 2013年06月20日    发表日期: 2013年07月23日
© 2013 BioPublisher 生命科学中文期刊出版平台

这是一篇《分子植物育种》印刷版的数字优先出版(Online Publishing in Advance)论文,如果需要下载阅读全文,请您订阅

摘要

为了利用关联分析发掘与重要农艺性状相关的数量性状基因位点,本研究采用全基因组扫描的方法,利用分布在基因组上的60对SSR引物,对140份东北三省水稻种质资源进行群体结构和连锁不平衡分析。结果表明:本研究中东北粳稻可分为2个类群,线性和非线性组合中,都有一定的连锁不平衡存在。群体中,19.2%的标记位点可以观察到显著的LD (P<0.05),其中第一类群和第二类群基于D'统计概率(P<0.05)支持的LD成对位点比例分别为2.1%和16.6%。第2类群连锁不平衡衰减(D'<0.5)所延伸的遗传距离变幅为0.32-120.4 cM,回归方程为:y=-0.0276ln(x)+0.3994。

关键词
粳稻;种质资源;群体结构;连锁不平衡

植物中大多数重要性状都是数量性状,如产量、品质、抗病性等,由于其遗传基础复杂且易受环境影响,使植物遗传改良工程面临巨大挑战。近年来,随着数量遗传学和分子标记技术的发展,在基因组水平上解析种质资源的群体结构到性状—标记的关联分析研究成为可能。Thornsberry等(2001)首次将关联分析方法成功地引入植物。随后在许多植物种质资源中有关联分析的研究报道,如:Eizenga等(2006)从125个SSR标记中发现32个位点与水稻抗稻瘟病性状关联;Andersen等(2007)研究表明,苯丙氨酸氨基裂解酶(PAL)基因多态性位点与32份具有最大遗传多样性的欧洲饲用玉米自交系的NDF (中性纤维)和IVDOM (组织器官的体外消化率)存在显著关联;Wang等(2011)对包括4个变种的94份美国花生微核心种质进行候选基因关联分析,验证了1个来源于FAD2A基因的SNP标记与油酸、亚油酸、油酸/亚油酸比显著关联。Huang等(2011)对950份国际水稻品种材料进行全基因组关联分析,鉴定出32个与开花时间和产量相关性状相关联的新位点。

然而,关联分析研究多是在分析种质资源的群体结构和连锁不平衡情况之后展开的。连锁不平衡(linkage disequilibrium, LD)又称配子不平衡,是一个群体内不同座位等位基因之间的非随机关联。常见的LD的度量方法有:r2和D',其计算方法详见FlintGarcia等(2003)。群体结构(Population structure)是指群体内存在亚群的情况,对LD水平和关联分析影响较大(杨小红等, 2007)。Yu和Buckler (2006)认为由亚群混合造成的伪关联现象在统计上是无法解决的,因此,进行关联分析前有必要了解材料的群体结构和亲缘关系。Andersen等(2005)对玉米开花期Dwarf8基因的研究表明,不控制群体结构时,Dwarf8的多态性与开花期显著关联;控制群体结构后,却没有产生关联结果。目前已发展了多种统计方法对不同群体结构进行控制,如传递不平衡法、基因组对照法、结构关联法、结构关联+亲缘关系混合模型法、主成分分析法、多维标度法和非计量多维标度法等。另外,连锁不平衡分析可以观察到历史上的重组事件,在基因组区段可以看到选择牵连效应(或搭载效应)。张学勇等(2006)认为发生选择牵连效应的基因组区段附近存在着控制重要农艺性状的基因或主效QTLs。可见,充分了解种质资源的群体结构和连锁不平衡情况,可以为复杂数量性状的研究提供理论依据。目前,关于东北粳稻种质资源的群体结构和连锁不平衡研究还鲜见报道。

本研究利用60对SSR标记对东北三省140份粳稻种质资源进行全基因组扫描,划分群体结构的同时分析连锁不平衡情况,旨在为进一步利用关联分析方法发掘与优异性状关联的标记位点、位点优异等位变异及其载体奠定基础。

1结果与分析
1.1群体结构分析
利用Structure v2.2软件的混合模型和等位变异发生频率相关模型对140份水稻种质资源的遗传结构进行分析,在运行结果中,当K=2时,lnP(D)值最大,且有比较稳定的α值(α=0.344 2<1),说明通过Q值的矫正可以排除群体的混合效应。群体结构分析将参试材料的遗传结构可分为2个类群,软件输出结果如图1


图1 140份材料的群体结构
注: a: 第1类; b: 第2类
Figure 1 Population structure of 140 accessions based on 60 SSRs
Note: a: Group 1; b: Group 2

全体材料系统进化树结果见图2。从图中可以看出,所有材料被分成2类,与structure软件的模型分析结果相吻合,表明供试的东北三省粳稻代表品种(系)主要分为2个类群,第1类群包括17个品种(系),对应的编号是:G110、G60、G126、G93、G94、G5、G109、G58、G57、G4、G108、G125、G138、G137、G134、G131和G133,供试材料中的其余123个品种(系)被分到第2类群。


图2 基于遗传距离的系统发生树
Figure 2 The phylogenetic tree of the accessions based on genetic distance

1.2连锁不平衡分析
LD是关联分析的基础,对于SSR位点间LD情况的解析有助于了解水稻不同染色体区段的连锁不平衡状况。60个SSR位点两两之间共产生C260=1 770种组合,在理想情况下,SSR位点间线性组合(染色体内的标记)有131种,非线性组合(染色体间的标记)有1 770-131=1 639种。连锁不平衡分析结果见图3表1。可以看出,无论是线性还是非线性组合中,都有一定的LD存在(黑色对角线上方非白色的像素格),说明历史上发生过连锁群间的重组。基于D'在P<0.05条件下支持的连锁不平衡位点所占比例为19.2%,其中染色体内连锁的占21.4%,染色体间为19.1%。


图3 60个SSR标记在水稻12条染色体上的LD分布
注: 黑色对角线上方的每一像素格使用右侧色差来表征SSR成对位点间的D'的大小; 对角线下方对应的像素格是成对位点间LD的概率
Figure 3 Distribution of LD among 60 SSR loci on 12 chromosomes in rice
Note: Each pixel above the black diagonal indicates the D' value of each pair of SSR loci as shown in the color code at the upper right; While each pixel below the black diagonal represent the probability of the teating LD of the corresponding marker pairs as shown in the color code at the lower right


表1 显著LD (D')中的SSR位点及比例
Table 1 Percentage of SSR locus pairs in significant (P<0.05) LD (D')

线性和非线性组合的LD位点所占比例在不同类群中差异较大。第1类群中,基于D'统计概率(P<0.05)支持的LD成对位点比例为2.1%,染色体内和染色体间比例差别不大,分别为2%和2.2%;第2类群中,基于D'统计概率(P<0.05)支持的LD成对位点比例为16.6%,染色体间为16.8%,略高于染色体内LD所占比例(染色体内为14.4%)。通过两个类群LD成对位点所占比例的比较可以说明,第2类群比第1类群在群体历史演化过程中发生过更高程度的交换和重组,使连锁不平衡水平高的位点保留下来。

对类群2的共线SSR位点D' (D'<0.5)值随遗传距离(cM)增加而变化的分析可以看出,SSR位点间D'值衰减比较缓慢,LD衰减(D'<0.5)所延伸的遗传距离变幅为0.32~120.4 cM (图4)。D'值对遗传距离的回归方程为:y=-0.0276ln(x)+0.3994。


图4 LD (D')随遗传距离(cM)衰减的散点图
Figure 4 Scatter plot of the LD (D') of marker pairs of the inter marker distance in cM

2讨论
2.1水稻的群体结构和连锁不平衡
不同地理来源的水稻种质资源的群体结构和连锁不平衡情况往往存在很大的差异。Garris等(2005)利用169对SSR标记对不同地理来源的234份(其中亚洲187份, 美国27份, 非洲14份, 欧洲3份, 大洋洲1份)水稻种质资源进行全基因组扫描将实验材料分为5个亚群,分别是籼稻(Indica)、aus水稻、香稻(Aromatic)、温带粳稻(Temperate japonica)和热带粳稻(Tropical japonica)。而Agrama等(2007)对亚洲、非洲、拉丁美洲和部分美国栽培种基于亲缘关系的群体结构分析,将所有材料分成8个簇(亚群),这些簇(亚群)与它们的地理起源具有明显的一致性,发生LD衰减在20~30 cM。而金亮(2009)研究将中国境内的水稻分为7个亚群,并且发现LD在小于50 cM时是普遍存在的。由此可见,水稻种质资源在世界上的分布是不均衡的,并且与地理起源相关密切,遗传进化的差异最终导致LD的差异。

本研究中,采用基于遗传距离的系统发生树与群体结构相互验证的方法,增加了群体结构分析结果的准确性和可靠程度,将140份东北粳稻种质资源分成2个群。而金亮(2009)研究认为东北粳稻只由1个群构成,本研究是对其结果的一个补充。线性和非线性位点均表现不同程度的LD,和前人研究结果一致。在第2类群中,LD成对位点比例为14.4%,比前人研究的LD程度低。LD衰减缓慢,LD所延伸的遗传距离广泛存在,变幅在0.32~120.4 cM,比金亮的研究结果范围大。可见,东北粳稻染色体不同区段发生连锁不平衡位点广泛存在,且LD所占比例较低。

2.2 LD分析与标记数量的关系
全基因组关联分析从严格意义上讲需利用尽可能多的覆盖全基因组的标记(如成千上万的SNP或SSR标记)进行扫描。一般认为标记的多寡与基因组大小和位点间的LD状况相关,如SSR位点LD程度较高的野生大豆需要的标记数量可以少些,关联作图的分辨率也较低。Flint-Garcia等(2003)指出,拟南芥进行全基因组LD分析需要6 000个标记。在水稻中,金亮(2009)使用100对SSR标记进行全基因组扫描,分析各亚群的LD较理想。本研究中,使用60对SSR标记进行全基因组扫描,在类群2中观察到了LD随遗传距离的衰减变化规律。由于类群1中LD衰减位点由于无效等位变异较多,影响了对LD的检测,若有更多的标记存在,可以看到类群1中LD随遗传距离的衰减规律。

3材料与方法
3.1试验材料
 选取东北三省不同生态区有代表性的粳稻品种(系)共140份(表2),这些材料被看作是无直接亲缘关系的自然群体。


表2 试验材料信息
Table 2 The information of test materials

3.2 SSR标记全基因组扫描
采用改进的CTAB法提取水稻总DNA。随机抽取不同地理来源的10份材料作为筛选引物的样本,选取覆盖水稻12条染色体的400对SSR引物,序列信息来源于Gramene网站(http://www.gramene.org/),引物由上海生工合成。

PCR反应体系为10 μL:10×PCR Buffer 1 μL,25 mmol/L MgCl2 0.75 μL,5 μ/μL Taq酶 0.1 μL,10 mmol/L dNTP 0.15 μL,模板DNA 1.5 μL,SSR引物1.5 μL,超纯水5 μL。使用的扩增仪型号为eppendorf 5333。PCR反应程序为:94℃预变性5 min,94℃变性30 s,55℃退火30 s,72℃延伸30 s,35个循环,72℃延伸6 min,4℃保存。PCR扩增产物检测在8% SDS-PAGE上进行,银染显色。显影后将胶放在灯箱上读取条带,记录数据。

3.3数据记录与处理方法
每1对SSR引物检测一个位点,每1条多态性条带记为1个等位基因。

采用(Pritchard et al., 2007, http://pritch.bsd.uchicago.edu/software/structure22/readme.pdf)分析群体结构的方法,使用Structure v2.2软件的混合模型和等位变异发生频率相关模型对140份水稻种质资源的遗传结构进行分析,参数的基本设置参见文献(Falush et al., 2003):分析群体数K设定为2~10,假定各位点独立,将MCMC开始时的不作数迭代和不作数迭代后的MCMC迭代设为10 000次,重复运行5次,按照最大似然值选取K值。

使用TASSEL2.1_standalone软件构建系统发生树,以UPGMA (unweighted pair group method using arithmetic averages)进行聚类。

使用TASSEL2.1_standalone软件计算LD配对检测的矩阵图,用来观测线性和非线性SSR位点之间的LD排列。利用Microsoft Excel 2003作LD衰减散点图并配置回归方程。

作者贡献
刘化龙和郑洪亮是本研究的实验设计和实验研究的执行人;赵宏伟、王敬国、孙健和刘涛完成数据分析和论文初稿的写作;张艳梅参与实验设计,试验结果分析;邹德堂是项目的构思者及负责人,指导实验设计,数据分析,论文写作与修改。全体作者都阅读并同意最终的文本。

致谢
本研究由国家科技支撑项目(2011BAD16B11)和黑龙江省十二五科技攻关项目(GA10B102-5)共同资助。

参考文献
Agrama H.A., Eizenga G.C., and Yan W., 2007, Association mapping of yield and its components in rice cultivars, Mol. Breeding, 19(4): 341-356

Andersen J.R., Schrag T., Melchinger A.E., Zein I., and Lübberstedt T., 2005, Validation of Dwarf8 polymorphisms associated with flowering time in elite European inbred lines of maize (Zea mays L.), Theor. Appl. Genet., 111(2): 206-217

Andersen J.R., Zein I., Wenzel G., Krützfeldt B., Eder J., Ouzu- nova M., and Lübberstedt T., 2007, High levels of linkage disequilibrium and associations with forage quality at a Phenylalanine Ammonia-Lyase locus in European maize (Zea mays L.) inbreds, Theor. Appl. Genet., 114(2): 307-319

Eizenga G.C., Agrama H.A., Lee F.N., Yan W., and Jia Y., 2006, Identifying novel resistance genes in newly introduced blast resistant rice germplasm, Crop Science, 46(5): 1870-1878

Falush D., Stephens M., and Pritchard J.K., 2003, Inference of population structure using multilocus genotype data: linked loci and correlated allele frequencies, Genetics, 164(4): 1567-1587

Flint-Garcia S.A., Thornsberry J.M., and Buckler E.S., 2003, Structure of linkage disequilibrium in plants, Annu. Rev. Plant Biol., 54(1): 357-374

Garris A.J., Tai T.H., Coburn J., Kresovich S., and McCouch S., 2005, Genetic structure and diversity in Oryza sativa L., Genetics, 169(3): 1631-1638

Huang X., Zhao Y., Wei X., Li C., Wang A., Zhao Q., Li W., Guo Y., Deng L., Zhu C., Fan D., Lu Y., Weng Q., Liu K., Zhou T., Jing Y., Si L., Dong G., Huang T., Lu T., Feng Q., Qian Q., Li J., and Han B., 2011, Genome-wide association study of flowering time and grain yield traits in a worldwide collection of rice germplasm, Nat. Genet., 44(1): 32-39

Jin L., 2009, Construction of an association population an association analysis for some quality traits in rice (Oryza sativa L.), Dissertation for Ph.D., Zhejiang University, Supervisor: Bao J.S., pp.42-93 (金亮, 2009, 水稻关联定位群体的构建及若干品质性状的关联分析, 博士学位论文, 浙江大学, 导师: 包劲松, pp.42-93)

Thornsberry J.M., Goodman M.M., Doebley J., Kresovich S., Nielsen D., and Buckler E.S., 2001, Dwarf8 polymorphisms associate with variation in flowering time, Nat. Genet., 28(3): 286-289

Wang M.L., Sukumaran S., Barkley N.A., Chen Z., Chen C.Y., Guo B., Pittman R.N., Stalker H.T., Holbrook C.C., Pederson G.A., and Yu J., 2011, Population structure and marker-trait association analysis of the US peanut (Arachis hypogaea L.) mini-core collection, Theor. Appl. Genet., 123(8): 1307-1317

Yang X.H., Yan J.B., Zheng Y.P., Yu J.M., and Li J.S., 2007, Reviews of association analysis for quantitative traits in plants, Zuowu Xuebao (Acta Agronomica Sinica), 33(4): 523-530 (杨小红, 严建兵, 郑艳萍, 余建明, 李建生, 2007, 植物数量性状关联分析研究进展, 作物学报, 33(4): 523-530)

Yu J., and Buckler E.S., 2006, Genetic association mapping and genome organization of maize, Curr. Opin. Biotechnol., 17(2): 155-160

Zhang X.Y., Tong Y.P., You G.X., Hao C.Y., Ge H.M., Wang L.F., Li B., Dong Y.C., and Li Z.S., 2006, Hitchhiking effect mapping: a new approach for discovering agronomic important genes, Zhongguo Nongye Kexue (Scientia Agricultra Sinica), 39(8): 1526-1535 (张学勇, 童依平, 游光霞, 郝晨阳, 盖红梅, 王兰芬, 李滨, 董玉琛, 李振声, 2006, 选择牵连效应分析: 发掘重要基因的新思路, 中国农业科学, 39(8): 1526-1535)

《分子植物育种》印刷版
• 第 11 卷
阅览选项
. PDF(0KB)
. 全文 HTML
读者评论
. 评论
作者的其他论文
.
刘化龙
.
郑洪亮
.
赵宏伟
.
王敬国
.
孙健
.
刘涛
.
张艳梅
.
邹德堂
相关论文
.
粳稻
.
种质资源
.
群体结构
.
连锁不平衡
服务
. Email 推荐给朋友
. 发表评论