大白菜单一基因微卫星标记的电子遗传图谱  

梁翠1 , 王哲1 , 倪梦2 , 黎瑞源2 , 孟金陵2 , 朴钟云1
1.沈阳农业大学园艺学院,沈阳,1108662
2.华中农业大学作物遗传改良国家重点实验,武汉,430070
1.沈阳农业大学园艺学院,沈阳,1108662
2.华中农业大学作物遗传改良国家重点实验,武汉,430070
1.沈阳农业大学园艺学院,沈阳,1108662
2.华中农业大学作物遗传改良国家重点实验,武汉,430070
1.沈阳农业大学园艺学院,沈阳,1108662
2.华中农业大学作物遗传改良国家重点实验,武汉,430070
1.沈阳农业大学园艺学院,沈阳,1108662
2.华中农业大学作物遗传改良国家重点实验,武汉,430070
1.沈阳农业大学园艺学院,沈阳,1108662
2.华中农业大学作物遗传改良国家重点实验,武汉,430070
作者    通讯作者
《分子植物育种》网络版, 2011 年, 第 9 卷, 第 59 篇   doi: 10.5376/mpb.cn.2011.09.0059
收稿日期: 2011年01月10日    接受日期: 2011年04月18日    发表日期: 2011年05月16日
© 2011 BioPublisher 生命科学中文期刊出版平台
这是一篇采用Creative Commons Attribution License进行授权的开放取阅论文。只要对本原作有恰当的引用,版权所有人允许和同意第三方无条件的使用与传播。
推荐引用:

梁翠等, 2011, 大白菜单一基因微卫星标记的电子遗传图谱, 分子植物育种 Vol.9 No.59 (doi: 10.5376/mpb.cn.2011.09.0059)

摘要

本研究以大白菜(Brassica rapa ssp pekinensis)182 703条表达序列标签(EST)为序列来源,在分析微卫星在大白菜基因组中分布的基础上,利用单一基因微卫星(unigene derived microsatellite, UGMS)标记构建了电子遗传图谱。结果表明,在利用182 703条EST拼接成的38 753个单一基因中,4 881个含有5 537个微卫星,占总数的12.6%。定位于10个连锁群的338个大白菜细菌人工染色体(Bacterial Artificial Chromosome, BAC)克隆共包含2 252个UGMS标记。平均每个BAC克隆包含6.7个UGMS。这些UGMS标记定位在由10个连锁群构成的电子遗传图谱中,总长度为1 170.1 cM。每个连锁群中分布有107-485个UGMS标记。在2 252个UGMS标记中,837个在连锁群中具有单一位点,756个有两个位点,其余的有3个或3个以上位点。这些多位点UGMS标记位于同一条连锁群或不同连锁群中。

关键词
大白菜;单一基因;单一基因微卫星标记;电子遗传图谱

芸薹种(Brassica rapa)是芸薹属植物中最为重要的物种之一,是蔬菜、油料和饲料作物的重要来源,而且富含膳食纤维、维生素C和抗癌等其它营养有益成分。其中大白菜、青梗菜和菜心等为我国栽培面积最大的蔬菜作物。
目前,应用于大白菜的分子标记主要有RFLPs (Restriction Fragment Length Polymorphisms)、RAPD (Random Amplified Polymorphic DNA)、SSRs (Simple Sequence Repeats)和AFLPs (Amplified Fragment Length Polymorphisms)等几种类型。SSR或微卫星(microsatellite)是指1~6个碱基长度的核苷酸单位以多次重复串联排列在基因组上的一段序列。由于SSR标记具有多态性高、呈共显性遗传、基因组上分布广泛、易于用PCR检测等特点,已广泛应用于遗传作图和遗传多样性等研究(Powell et al., 1996)。近年来,以大白菜基因组序列为基础开发了1 000余个SSR标记,并用于大白菜遗传图谱的构建(Suwabe et al., 2002, 2006; Kim et al., 2006; Choi et al., 2007; Kim et al., 2009)。这些标记都是通过文库构建和测序等传统方法开发的基因组SSR。

大白菜表达序列标签的大量释放为研究大白菜转录区域SSR的分布和EST-SSR标记的开发提供了丰富的序列资源。但EST数据库中众多的冗余序列将导致同一位点EST-SSR标记的重复开发。这些冗余EST序列可聚类分析拼接成单一基因序列,即单一基因(Unigene, http://www.ncbi.nlm.nih.gov)。如水稻298 808个EST序列拼接成33 722个单一基因(Parida et al., 2006)。因此,基于单一基因的微卫星(Unigene-derived microSatellite, UGMS)标记不仅可以避免功能标记的重复开发,也为开发染色体位置唯一的UGMS标记提供了可能(Parida et al., 2006)。Parida等(2010)利用大白菜单一基因开发了347个UGMS标记。但这些标记仅限于大白菜连锁群A03和A09。

研究表明芸薹属植物的部分染色体片段在基因组中平均存在3个拷贝(Lagercrantz and Lydiate, 1996)。Yang等(2006)发现大白菜基因组经历了三倍化的过程,并伴随有染色体部分片段的加倍。芸薹属植物的这种多倍性导致了多数基因拷贝数的增加以及基因在染色体位点上的重复性。

本研究旨在利用大白菜EST公共数据库,①分析UGMS在大白菜基因组中的分布频率,②构建大白菜UGMS标记电子遗传图谱,③分析UGMS标记的复制特点。该研究结果将为分析大白菜的遗传变异、进化机理、基因定位和克隆乃至分子育种提供基础。

1结果与分析
1.1大白菜UGMS分布频率
从NCBI公共数据库获得182 703条大白菜EST序列。通过重叠和聚类分析,共得到38 753条单一基因,总长度为26.5 Mb。利用MISA软件检测到4 881条单一基因含有5 537个微卫星,占总单一基因的12.6% (表1)。其中591个单一基因含有2个或2个以上的微卫星。在5 537个微卫星中,完全型的SSR为5 261个,复合型与间断型分别为266个和10个。微卫星的分布密度为4.8 kb。在一至六核苷酸重复中,二和三核苷酸重复是主导类型,分别占总数的48.7%和47.5%。其次分别为单,四,六和五核苷酸重复,依次为2.4%,0.9%,,0.4%和0.1%。

1.2大白菜电子遗传图谱的构建
通过4 881条含SSR的单一基因与这些BAC克隆序列的同源性比对,我们发现共有338个BAC克隆包含2 252个UGMS (表2)。其中连锁群A03和A09分布有最多的BAC克隆,分别为58和67个。每个克隆分布有1~35个微卫星,如BAC克隆KBrB068E07含35个微卫星。平均每个BAC含有6.7个UGMS。


表1 大白菜单一基因微卫星分布
Table 1 Distribution of unigene derived microsatellites in Chinese cabbage


表2 大白菜遗传图谱中UGMS标记的分布
Table 2 Distribution of UGMS markers on the linkage groups of Chinese cabbage 

根据JWF3p遗传图谱,利用Mapchart 2.1软件构建了大白菜电子遗传图谱(图1)。该图谱总长度为1 170.1 cM (表2),共分布有2 252个UGMS标记。连锁群A01-A10分别分布有228、213、424、107、149、195、147、155、485和149个UGMS标记。各连锁群覆盖的长度在A04的77.7 cM至A09的151.3 cM之间。

10个连锁群中,UGMS标记在大部分区域中分布较均匀。但在9个连锁群中存在超过15 cM以上的间隙。 


图1 大白菜电子遗传图谱
注: 左侧为遗传距离(cM), 右侧为UGMS标记; 黑体为锚定标记, 括号中数值代表每个位点上的单位点UGMS数
Figure 1 In silico map of Chinese cabbage
Note: The genetic distances (in cM) are indicated on the left of linkage group, The names of UGMS markers are given on the right; Anchor markers are presented in bold, The number of single-locus UGMS on each locus are presented in parentheses
 
如分布有228个UGMS的A01,在111.3~146.3 cM范围内无UGMS标记的分布。间隙在20~30 cM的有2个区域,分别位于A07的0~20.1 cM和A09的129.6~151.3 cM之间。在15~20 cM范围内无UGMS标记的共有5处。其中A01有1个、A03的1个、A06的1个、A07的1个和A10的1个。此外,我们也发现连锁群中UGMS标记的密集区。如在A03的32.8~42.7 cM内存在54个UGMS标记,平均每1 cM存在5.5个UGMS。

1.3 UGMS标记在大白菜基因组中的重复
通过对大白菜10个连锁群中标记序列的同源性分析,我们发现在2 252个UGMS标记中,837个表现为单一位点。在连锁群中有2、3、4及4个以上匹配位点的标记分别为756、249、136和274个,并称之为多位点UGMS。多位点UGMS的重复次数为2~77次,平均重复次数为2.7。重复4次以上的UGMS标记均同时出现在同一和不同连锁群(表3)。

根据UGMS标记在连锁群中的位置分布,将重复出现的标记划分为3类。分别是Ⅰ类:在同一连锁群中多次重复的UGMS;Ⅱ类:不同连锁群中多次重复的UGMS;Ⅲ类:在同一连锁群和不同连锁群中同时重复多次的UGMS。Ⅰ类UGMS标记在各连锁群均有分布,共有213个。其中分布在A09的有97个,A05中只有2个。Ⅱ类的有705个UGMS标记,占多位点UGMS标记的49.8%。其中2次重复的标记最多(578)。Ⅲ类UGMS标记共有497个,占多位点标记的35.1%。其中4次及其以上重复的UGMS标记有374个。定位分析发现U_01_001在电子遗传图谱中重复次数达到77次,分布于10个连锁群。其中A09中的分布最多,达12个;A04中最少,只有4个(图2)。功能预测结果显示该基因编码果胶酸裂解酶(Pectate lyase),具有促进花粉萌发和花粉管延伸、降解花柱道细胞壁展的活性(Wu et al., 1996)。 


表3 多位点UGMS在大白菜基因组中的重复特征
Table 3 Duplication of multi-locus UGMS on the genome of Chinese cabbage 


图2 果胶酸裂解酶在大白菜基因组中的复制
Figure 2 Duplication of pectate lyase in the Chinese cabbage genome
 
2讨论
本研究对大白菜38 753条单一基因进行SSR搜索,共获得5 537个SSR。含SSR的单一基因占总单一基因的12.6%,高于其他双子叶植物(2.6%~10.6%) (Kumpatla and Mukhopadhyay, 2005; Sharma et al., 2009)和单子叶植物(1.5%~4.7%)的比率(Kantety et al., 2002; Parida et al., 2006)。SSR在大白菜转录区域中每4.8 kb出现1次。该结果与大白菜基因组序列中SSR的分布密度(1/4.7 kb)相似(Hong et al., 2007)。Parida等(2010)利用大白菜4 353个单一基因分析了SSR的分布,结果显示SSR的分布密度为1/3.8 kb。该密度高于本研究的1/4.8 kb。这可能与单一基因的分析数量和SSR的界定标准不一致有关。

目前,利用基因组SSR构建了多张大白菜遗传图谱(Suwabe et al., 2006; Kim et al., 2006; Choi et al., 2007; Kim et al., 2009; 于仁波等,2008)。Parida等(2010)将193和90个大白菜UGMS标记分别定位在A03和A09染色体。但尚未见利用功能标记如UGMS标记构建覆盖大白菜基因组遗传图谱的研究。本研究利用2 252个UGMS 标记构建了覆盖大白菜10条染色体的电子遗传图谱。在该图谱的部分连锁群中观察到大于15 cM的间隙,如A01 连锁群中U_01_207-U_01_228间的间隙。这是由于JWF3p遗传图谱中的相应区域也存在较大的间隙而引起的。但大白菜基因组中广泛存在的SSR包括基因组SSR和以及尚未定位的3 285个UGMS标记,为定向的填充间隙以及进一步构建饱和的高密度遗传图谱提供了可能。

芸薹属植物不同种间表现出基因的高度同源性(Lagercrantz and Lydiate 1996; Parida et al., 2010)。如大白菜与甘蓝型油菜之间88.6%的基因具有同源性(Parida et al., 2010)。Kim等(2009)发现大白菜的部分染色体片断在基因组中存在2或3次重复。本研究通过分布于连锁群的UGMS标记序列的同源性分析和比较,进一步证实了大白菜基因的多拷贝现象。在构建的大白菜UGMS电子遗传图谱中,62.8%的UGMS标记为多位点UGMS。其中2位点的UGMS标记最多(33.6%),其次为3位点(11.1%),4位点以上的UGMS占总UGMS数量的12.2%。这些多位点UGMS标记覆盖了大白菜基因组。

大白菜UGMS标记在基因组中的重复出现表明这些标记并非是染色体位置唯一的。即使UGMS引物扩增出单一位点,也不能确定该标记在染色体的位置。因此,多位点UGMS标记不能准确应用于分子标记辅助选择,或作为锚定标记应用于遗传图谱的构建。这就需要开发出基于单拷贝基因的微卫星标记或单位点SSR标记。根据大白菜JWF3p遗传图谱中BAC克隆的序列,本研究共检测到837个单位点UGMS标记。在大白菜全基因组序列破译后,这些标记还需要进一步的分析和验证。

3实验材料与方法
3.1序列来源
2008年11月12日前登录在NCBI上的大白菜182 703条EST序列(http://www.ncbi.nlm.nih.gov)。这些序列用于分析微卫星在大白菜基因组中的分布。BrGSP (multinational Brassica rapa Genome Sequencing Project)公布的499个大白菜BAC (Bacterial Aritificial Chromosome)克隆序列(http://www.brassica-rapa.org)。这些BAC克隆分别位于大白菜JWF3p遗传图谱的10个连锁群。

3.2 EST前处理
利用EST-trimmer (http://pgrc.ipk-gatersleben.de/misa/download/est_trimmer.pl)去除5’端和3’端50 bp内重复次数大于5次的poly A/T,对于大于700 bp的序列保留其5’端,小于100 bp的序列则剔除。其次,利用Seqclean去除污染序列,包括载体序列(ftp://ftp.ncbi.nih.gov/pub/UniVec)、叶绿体和线粒体序列(http://www.arabidopsisi.org/)。

3.3 EST拼接和单一基因的获得
预处理后的EST序列利用CAP3软件进行序列的拼接。参数为在至少40个核苷酸的重叠区域内,最小匹配百分比大于或等于95%的EST序列可得到拼接与延伸。为获得非冗余单一基因,将拼接后产生的拼接体序列进一步进行BLAST分析。去除冗余序列按照以下标准进行:(ⅰ)如果2个或者更多的拼接体序列一致,但长短不同,则保留最长的拼接体为单一基因;(ⅱ)如果拼接体是通过重叠的SSR或多聚A/T/G/C拼接而成,则将所有EST作为单一基因;(ⅲ)如果拼接体是通过序列中的未知碱基(N)拼接而成,且未知碱基大于30 bp,则剔除此类拼接体。通过以上步骤得到的单一基因用于后续分析。

3.4微卫星的筛选
软件MISA(MIcroSAtellite identification tool; http://pgrc.ipk-gatersleben.de/misa)用来搜寻UGMS。搜索长度为:单核苷酸为18个以上(包括18个),二核苷酸的重复次数为6次以上(包括6次),三、四、五和六核苷酸的重复次数为5次以上(包括5次)。搜索的UGMS包括完全型[例如: (AT)8]、复合型[例如: (AT)3(CT)7]和间断型[例如: (AT) 6CA(AT)5]UGMS。

3.5电子遗传图谱的绘制
利用BLAST软件将含SSR的单一基因与499个大白菜BAC克隆(http://www.brassica-rapa.org)进行序列同源性分析,搜索出包含SSR序列同源区的BAC克隆。参数为E-value≤10-10,比对长度(包括SSR序列)≥100 bp。根据搜索结果,将包含在1个BAC克隆的SSR称为单位点UGMS,而位于1个以上BAC克隆的SSR称为多位点UGMS。

根据JWF3p遗传图谱中的BAC克隆位置,利用Mapchart 2.1软件构建大白菜UGMS电子遗传图谱,并分析UGMS标记在大白菜10个连锁群中的分布特点。UGMS标记命名为U_XX_YYY (XX代表连锁群,YYY代表序号),如U_03_102代表A03中的第102个UGMS。在10个连锁群中,每个连锁群选择2 个SSR标记作为构建电子遗传图谱的锚定标记(Kim et al., 2009)。

选择在大白菜基因组中重复次数最多的果胶酸裂解酶基因,利用华中农业大学开发的Complinkage V 0.1.2构建该基因的比较遗传图谱(孟金陵, 2010, 私人通讯)。该软件的主要功能之一是将位于不同位点的标记通过连线方式连接起来。

作者贡献
梁翠是本研究的实验设计和实验研究的执行人;王哲、倪梦及黎瑞源参与实验设计,试验结果分析;朴钟云及孟金陵是项目的构思者及负责人,指导实验设计,数据分析,论文写作与修改。全体作者都阅读并同意最终的文本。

致谢
国家自然科学基金(30771468);教育部高等学校博士学科点专项科研基金(20092103110006);辽宁省教育厅科学技术研究项目(2008S208)。

参考文献
Choi S.R., Teakle G.R., Plaha P., Kim J.H., Allender C.J., Beynon E., Piao Z.Y., Soengas P., Han T.H., King G.J., Barker G.C., Hand P., Lydiate D.J., Batley J., Edwards D., Koo D.H., Bang J.W., Park B.S., and Lim Y.P., 2007, The reference genetic linkage map for the multinational Brassica rapa genome sequencing project, Theor. Appl. Genet. 115(6): 777-792 doi:10.1007/s00122-007-0608-z PMid:17646962

Hong C.P., Piao Z.Y., Kang T.W., Batley J., Yang T., Hur Y.K., Bhak J., Park B.S., Edwards D., and Lim Y.P., 2007, Genomic distribution of simple sequence repeats in Brassica rapa, Molecular and Cells, 23(3): 349-356
PMid:17646709

Kantety R.V., Rota L.M., Matthews D.E., and Sorrells M.E., 2002, Data mining for simple sequence repeats in expressed sequence tags from balely, maize, rice, sorghum and wheat, Plant Molecular Biology, 48(5-6): 501-510
doi:10.1023/A:1014875206165 PMid:11999831

Kim H.R., Choi S.R., Bae J., Hong C.P., Lee S.Y., Hossain M.J., Nguyen D.V., Jin M., Park B.S., Bang J.W., Bancroft I., and Lim Y.P., 2009, Sequenced BAC anchored reference genetic map that reconciles the ten individual chromosomes of Brassica rapa, BMC Genomics, 10(1): 432
doi:10.1186/1471-2164-10-432 PMid:19751531    PMCid:2761421

Kim K.B., Chung T.Y., King G.J., Jin M., Yang T.J., Jin Y.M., Kim H.I., and Park B.S., 2006, A sequence-tagged linkage map of Brassica rapa, Genetics, 174(1): 29-39
doi:10.1534/genetics.106.060152 PMid:16988107    PMCid:1569789

Kumpatla S.P., and Mukhopadhyay S., 2005, Mining and survey of simple sequence repeats in expressed sequence tags of dicotyledonous species, Genome, 48(6): 985-998
doi:10.1139/g05-060 PMid:16391668

Lagercrantz U., Lydiate D., 1996, Comparative genome mapping in Brassica, Genetics, 144(4): 1903-1909 PMid:8978073    PMCid:1207737

Parida S.K., Kumar A.R., Dalal V., Singh N.K., and Mohapatra T., 2006, Unigene derived microsatellite markers for the cereal genomes, Theor. Appl. Genet., 112(5): 808-817
doi:10.1007/s00122-005-0182-1 PMid:16429310

Parida S.K., Yadava D.K., and Mohapatra T., 2010, Microsatellites in Brassica unigenes: relative abundance, marker design, and use in comparative physical mapping and genome analysis, Genome, 53(1): 55-67
doi:10.1139/G09-084 PMid:20130749

Powell W., Machray G.C., and Provan J., 1996, Polymorphism revealed by simple sequence repeats, Trends Plant Science, 1(7): 215-222
doi:10.1016/1360-1385(96)86898-1 doi:10.1016/S1360-1385(96)86898-0

Sharma K., Bhardwaj P., Negi R., Mohapatra T., and Ahuja P.S., 2009, Identification, characterization and utilization of unigene derived microsatellite markers in tea (Camellia sinensis L.), BMC Plant Biology, 9(1): 53
doi:10.1186/1471-2229-9-53 PMid:19426565    PMCid:2693106

Suwabe K., Iketani H., Nunome T., Kage T., and Hirai M., 2002, Isolation and characterization of microsatellites in Brassica rapa L., Theor. Appl. Genet., 104(6-7): 1092-1098
doi:10.1007/s00122-002-0875-7 PMid:12582617

Suwabe K., Tsukazaki H., Iketani H., Hatakeyama K., Kondo M., Fujimura M., Nunome T., Fukuoka H., Hirai M., and Matsumoto S., 2006, Simple sequence repeat-based comparative genomics between Brassica rapa and Arabidopsis thaliana: The Genetic Origin of Clubroot Resistance, Genetics, 173(1): 309-319
doi:10.1534/genetics.104.038968 PMid:16723420    PMCid:1461432

Wu Y.Z., Qiu X., Du S., and Erickson L., 1996, P0149, a new member of pollen pectate lyase-like gene family from alfalfa, Plant Molecular Biology, 32(6): 1037-1042
doi:10.1007/BF00041387 PMid:9002602

Yang T.J., Kim J.S., Kwon S.J., Lim K.B., Choi B.S., Kim J.A., Jin M., Park J.Y., Lim M.H., Kim H., Lim Y.P., Kang J.J., Hong J.H., Kim C.B., Bhak J., Bancroft I., and Park B.S., 2006, Sequence-level analysis of the diploidization process in the triplicated flowering locus C region of Brassica rapa, Plant Cell, 18(6): 1339-1347
doi:10.1105/tpc.105.040535 PMid:16632644    PMCid:1475497

Yu R.B., Yu S.C., Qi J.N., Zhang F.L., Yu Y.J., Zhao X.Y., and Zhang D.S., 2008, Simple sequence repeat (SSR) as anchor markers in constructing a molecular genetic map of Chinese cabbage (Brassica rapa L. ssp. pekinensis), Yuanyi Xuebao (Acta Horticulturae Sinica), 35(10): 1447-1454 (于仁波, 于拴仓, 戚佳妮, 张凤兰, 余阳俊, 赵岫云, 张德双, 2008, 大白菜SSR锚定标记分子遗传图谱的构建, 园艺学报, 35(10): 1447-1454)

    0.625
00120
《分子植物育种》网络版
• 第 9 卷
阅览选项
. PDF(595KB)
. FPDF
. 全文 HTML
. 在线 fPDF
读者评论
. 评论
作者的其他论文
.
梁翠
.
王哲
.
倪梦
.
黎瑞源
.
孟金陵
.
朴钟云
相关论文
.
大白菜
.
单一基因
.
单一基因微卫星标记
.
电子遗传图谱
服务
. Email 推荐给朋友
. 发表评论