2. 北京市农林科学院玉米研究中心, 北京, 100097
3. 北京华生恒业科技有限公司, 北京, 100083
*同等贡献作者
作者 通讯作者
《分子植物育种》网络版, 2012 年, 第 10 卷, 第 24 篇 doi: 10.5376/mpb.cn.2012.10.0024
收稿日期: 2012年04月24日 接受日期: 2012年05月16日 发表日期: 2012年06月01日
引用格式(中文):
王蕊等, 2012, 玉米DNA指纹鉴定中两种SSR数据分析软件GeneMapper和GeneMarker的应用比较, 分子植物育种(online) Vol.10 No.24 pp.1171-1178 (doi: 10.5376/mpb. cn.2012.10.0024)
引用格式(英文):
Wang et al., 2012, The Application Comparison of Two SSR Data Analysis Softwares GeneMapper and GeneMarker Used in the Identification of Maize Variety, Fenzi Zhiwu Yuzhong (online) (Molecular Plant Breeding) Vol.10 No.24 pp.1171-1178 (doi: 10.5376/mpb.cn.2012.10.0024)
GeneMapper与GeneMarker均是SSR数据分析的主要软件。本文使用40对引物对11套亲子组合分析可发现,GeneMapper与GeneMarker分析结果吻合度达99%,说明两种软件可靠性均很高。其中GeneMarker在二倍体筛选、去除Pull-up峰、平移Panel等功能上进一步优化,减少了人工分析的时间,同时降低了人工操作出现的误差。GeneMarker软件的升级为构建玉米DNA指纹数据库的标准化与自动化提供重要辅助作用。
SSR标记作为近年来发展较快的分子标记技术,具有多态性高、重复性高、共显性遗传、操作简单快速等优点,并在品种DNA指纹鉴定中被广泛应用。基于毛细管电泳的SSR检测平台被各研究单位、检测机构所青睐。北京市农林科学院玉米研究中心从2002年起开展基于SSR标记的玉米品种DNA指纹技术研究,目前已经建立简单快速、准确高效的毛细管荧光电泳检测技术。
随着毛细管电泳检测技术日益成熟,检测样品量急剧增加的情况下,对数据分析也提出了更高的要求,急需操作简单、自动化程度高、准确性高的数据分析软件来支持DNA指纹鉴定技术。目前用于分析SSR扩增片段的主流分析软件为GeneMapper和GeneMarker,这两个软件算法不同、具有各自的优缺点。
本文使用我国推广面积较大的11个杂交种及其父母本作为研究材料,对GeneMapper和GeneMarker两个软件从数据分析准确性、操作简便性、自动化分析程度等全方面进行比较分析,以期为从事DNA指纹鉴定研究的人员提供软件选择的依据。
1结果与分析
根据本实验材料40对SSR引物的数据分析结果,从以下6个方面对GeneMapper和GeneMarker两个软件进行应用比较,分析比较两软件在解决方案上的差异。
1.1去除Pull-up峰
在毛细管电泳中,引物标记的颜色有4种,当多重组合电泳时,某一色荧光引物某一位置的特异峰较高引起同一位置的其它颜色荧光峰值升高,这种峰称之为Pull-up峰。Pull-up峰是影响数据分析的重要因素,进行数据分析时易将峰高较高的Pull-up峰判为特异峰,同时也了影响分析效率。针对于此GeneMarker软件设计了便利的矩阵算法,可批量完成去除Pull-up峰的功能。如图1所示,使用GeneMarker分析,可根据每次电泳结果,根据图像设定不同荧光峰高比值,可直接将大部分Pull-up峰去除,设置的比值越精确,Pull-up峰消除效果越好。如图2所示,在GeneMapper软件分析中,黑色对红色、绿色对黑色等均有Pull-up峰,其中最高的Pull-up峰高接近1 000,易与特异峰混淆。而GeneMarker软件中去除得较为彻底。
图1 GeneMarker-BMSTC v1.0去除Pull-up峰设置界面 |
图2 毛细管电泳中Pull-up峰去除前后图 |
1.2 Panel平移功能
不同批次的电泳可能会出现峰的微小滑移现象(差异在0.5 bp以内。数据库为了保证不同批次数据能够有效整合,需要使用固定Panel进行数据分析,当数据出现滑移时,可能出现大量数据不能进入BIN的范围,只有重新设定Panel或加宽Panel来解决。GeneMarker软件具备Panel整体平移的功能,如图3A所示,当峰大多不在BIN内,可将此引物的Panel作为一个整体平移,使峰最大化进入BIN设置范围内,调整后如图3B所示。
图3 GeneMarker-BMSTC v1.0软件Panel平移界面(引物: phi080k15) |
1.3连续多峰识别功能
连续多峰一般在扩增片段大于300 bp时易出现,主要是由于扩增片段长度过长,Taq酶在模板链上滑动引起的,多是由一系列相差2 bp的连续峰峰组成,峰高普遍偏低。连续峰是荧光检测大片段位点时的常见峰形,而且容易引起软件识别的问题,容易将峰高较低的连续峰去除或将连续峰计算为多峰,这两种分析结果都要尽力避免,因此GeneMarker-BMSTC v1.0软件改进了荧光电泳中连续多峰的识别方法。如图4所示,杂交种及父本在403位点上为连续峰,使用GeneMapper软件分析时将父本连续峰位点计算成两个峰,使用GeneMarker软件分析时,因为能自动识别连续峰,因此亲本和杂交种在连续峰位点均只显示同一等位基因位点,不需额外删减位点,提高了数据分析的准确度与效率。
图4 京科糯120其亲本的荧光检测结果(引物: bnlg2291k4) |
1.4高低峰选择功能
在毛细管电泳图中,有时会出现两等位基因不对称扩增的情况,导致出现高低峰。高低峰出现的主要原因包括以下两点:一是PCR扩增时出现了不对称扩增,这在玉米杂交种出现亲本互补带型时出现的可能性较大,当杂交种某个位点上的条带也为单带或者是自交系时,出现这种情况的可能性较小;二是采用混株法提取DNA时,样品一致性出现问题,导致最终混入杂带,这种情况的低峰峰高通常较低,可通过人工看板去除掉。为了保证软件分析时特异峰能够被软件保留,而非特异峰以及杂带可被软件去掉,在GeneMarker软件中优化了高低峰选择功能,可通过不同参数设置,自动识别峰高偏低的特异峰。如图5所示,Local Region中可设定峰高比值,在面对不同农作物中以及不同检测对象时,应采取不同的比例。如图6所示,虽然峰高有所差异,但峰高较低的连续峰在GeneMapper与GeneMarker中均可入选。
图5 GeneMarker-BMSTC v1.0的低峰筛选功能 |
图6 京科糯120及其亲本的荧光检测结果(引物: umc1705w1) |
1.5 N+1峰自动过滤功能
N+1峰在毛细管电泳中比较常见,主要特征是在同一位置上出现了相差1 bp的两个峰(易红梅等, 2006)。一般认为与PCR反应过程中普通Taq酶在产物3'端自动加入一个碱基有关。使用GeneMapper分析时,为了避免N+1峰作为两个峰,需要不断加宽BIN设置中此等位基因的范围,致使相邻等位基因的范围可能出现交叉,降低了SSR的多态性。而GeneMarker软件可自动识别N+1峰,若两峰在同一个等位基因范围内,则计算为同一位点;若不在同一个等位基因范围内,则滤掉峰分值(score值)较小的峰,将峰分值较大的峰作为主峰。如图7所示,勾选“Use Low-High Filter”可使用此过滤算法。如图8所示,两软件均可自动识别N+1峰。
图7 GeneMarker-BMSTC v1.0的过滤算法 |
图8 京玉7及其亲本的荧光检测结果(引物: umc1506K12) |
1.6二倍体筛选功能
玉米为二倍体植物,SSR标记是共显性标记,如果采用单株提取DNA,则在同一引物只能出现两个特异峰(杂合位点)或一个特异峰(纯合位点)。但在混株提取DNA进行指纹分析时,由于各种原因有时会出现三峰或多峰的情况(赵久然等, 2003)。使用GeneMapper分析时需要人工手动删除杂带,极大影响分析速度,无法实现自动化,而GeneMarker-BMSTC v1.0版增加了二倍体筛选(即三峰, 多峰过滤)功能。应用该算法后,同一引物范围内最多保留两个峰。保留原则为在同一引物范围内,有多峰时仅保留Score值最好的2个,其余都删除;当Score值相同时,取强度较大的峰。具体方法为:运行GeneMarker,导入原始数据后,点击运行,出现如图9所示的对话框,勾选“Use Amphiploid Filter”即可。如图10所示,PCR扩增时出现少量杂带,GeneMapper需要人工删除杂带,而GeneMarker可以自动识别并删除多余杂带,适合大规模的自动化样品分析。
图9 GeneMarker-BMSTC v1.0的二倍体筛选功能设置 |
图10 京科糯120其亲本的荧光检测结果(引物:phi053k2) |
2讨论
经过多年的研究、应用,SSR指纹鉴定技术在玉米品种检测中的应用已趋向成熟,尤其是核心引物、实验流程、判断标准等方面均已在全国各检测机构被广泛应用,并且各步工作基本达到准确、适用、快速、高效的要求(Wang et al., 2011; 王凤格和赵久然, 2011, 中国农业科学技术出版社, pp.74-78)。但是目前面对各种检测需求的出现,检测样品量的急剧增加,对数据分析提出了更高的要求。所选择的SSR指纹数据分析软件不但需要满足急剧增长的数据量和数据质量要求,而且要在易操作性、通用性、自动化等方面提出了更高的要求。同时为了不同实验室间的数据整合与共享,构建的指纹数据库具有更高的通用性,分析工具得到的数据格式、存储方式也应满足上述要求(UPOV, 2007)。
通过本文一系列的比较分析可以看出,在分析相同样品数据时,GeneMapper与GeneMarker软件的分析数据吻合度达99%,说明两种软件可靠性都非常高。同时GeneMarker相对于GeneMapper做出了很多升级,比如二倍体筛选、自动去除Pull-up峰、识别连续峰、平移Panel等一系列功能,免除了人工看板增删条带的繁杂工序,大幅度提高了数据分析过程的自动化。GeneMarker软件因提供功能订制,所以能够实现与数据库对接,即电泳后的SSR片段信息作为源数据,在软件自动分析及人工检查后,数据可直接上传至指纹数据库系统,与数据库的对接进一步完成了数据分析自动化的过程。
SSR指纹数据分析不仅需要开发完善一个功能强大的数据分析软件,还需要一些后续研究工作,比如引物峰型特征描述、BIN的确定(王凤格等, 2006)。SSR标记具有种属特异性,不同农作物建立不同的引物Panel,每对引物根据其等位基因特征建立BIN。每对引物BIN的设置包括规定引物范围,各个等位基因的名称、范围,以及记录等位基因的频率,标注稀有等位基因等等。这些工作需要经过对大量样品的分析,并且在DNA指纹数据库构建的过程中不断累积完善,作为重要的备注信息添加到SSR分析软件中,为DNA指纹数据分析提供方便和标尺。综上所述,对于大量数据的分析工作离不开一款功能齐全,可靠性强,定制灵活的SSR数据分析软件对以上过程进行简化,同时能在进一步的数据库构建中实现无缝连接,为整个数据分析分析平台搭建的可靠性、便捷性、合理性、扩展性提供重要保障。
3材料与方法
3.1材料
本文使用11个杂交种及其父母本为研究对象,材料信息见表1,杂交种均为人工组配。
表1 11组供试材料杂交种及亲本名称 |
3.2实验方法
3.2.1 DNA提取
本文采用CTAB小量提法提取DNA (王凤格和赵久然, 2011, 中国农业科学技术出版社, pp.155)。DNA质量和浓度用琼脂糖电泳和NanoDrop 2000 (Thermo Scientific)紫外分光光度计进行测定,根据实际测量值调节DNA工作液浓度。
3.2.2 PCR扩增
PCR扩增体系:模板DNA 3 μl,0.25 μmol/L引物,1×PCR Buffer,0.15 μmol/L dNTP,2.5 μmol/L MgCl2,1单位Taq酶,反应总体积为20 μl。每对引物中的一条5'端用荧光染料标记,选用PET、NED、VIC、FAM四种荧光染料(Applied Biosystems, USA公司合成)。PCR反应程序:94℃预变性5 min,1个循环;94℃变性40 s,60℃退火35 s,72℃延伸45 s,共35个循环;72℃延伸10 min;4℃保存。引物选用适于玉米DNA指纹分析的40核心SSR引物(即20对基本核心引物+20扩展核心引物) (王凤格和赵久然, 2011, 中国农业科学技术出版社, pp.189-191)。
3.2.3检测扩增产物
毛细管电泳:PCR产物在毛细管荧光电泳系统AB 3730XL DNA分析仪(Applied Biosystems, USA)上进行10重电泳,即按照扩增片段大小和荧光颜色差异将10对引物的扩增产物混合在一起电泳。在96孔电泳板的单个孔中分别加入1.5 μL 10对引物PCR产物的混合物,9 μL甲酰胺,0.12 μL分子量内标(GeneScanTM-500 LIZ, Applied Biosystems, USA)。95℃变性5 min,4℃保存10 min,1 000 rpm离心1 min后,于AB 3730XL DNA分析仪上进行电泳。预电泳时间为15 kV,2 min;电泳时间为15 kV,20 min。用Date Collection v1.0软件收集原始数据。
3.2.4数据分析
用GeneMapper v3.7和GeneMarker-BMSTC v1.0软件(由北京市农林科学院玉米研究中心与北京华生恒业科技有限公司基于玉米共同研发)分别对11组供试材料的40对SSR引物的原始数据进行分析和校正。
作者贡献
王蕊是本研究的实验设计和实验研究的执行人;田红丽参与实验设计,试验结果分析,指导论文的写作与修改;王凤格,赵久然是项目的构思者及负责人,指导实验设计与论文修改;易红梅,王璐参与实验研究;李楠,霍永学提供软件相关指导。全体作者都阅读并同意最终的文本。
致谢
感谢北京华生恒业科技有限公司的李欣,江彬在软件方面提供重要指导与耐心帮助!本研究由十二五农村领域国家科技技术课题(2011BAD35B09),国家国际科技合作项目(2010DFB33740)联合资助。
参考文献
UPOV. (International Union for the Protection of New Varieties of Plants). 2007. Guidelines for DNA-profiling: molecular marker selection and database construction, BMT Guidelines (proj.9). http://www.upov.int/en/documents/c/41/bmt_guidelines_proj_9.pdf
Wang F.G., Zhao J.R., Dai J.R., Guo J.L., Yuan Y.P., Wang L., Yi H.M., Sun S.X., and Lu B., 2006, Criteria for the construction of maize DNA fingerprint database, Yumi Kexue (Journal of Maize Sciences), 14(6): 66-68 (王凤格, 赵久然, 戴景瑞, 郭景伦, 原亚萍, 王璐, 易红梅, 孙世贤, 吕波, 2006, 玉米DNA指纹数据库建库标准规范的建立, 玉米科学, 14(6): 66-68)
Wang F.G., Tian H.L., Zhao J.R., Yi H.M., Wang L., and Song W., 2011, Development and characterization of a core set of SSR markers for fingerprinting analysis of Chinese maize varieties, Maydica, 5 (1):7-18
Yi H.M., Wang F.G., Zhao J.R., Wang L., Guo J.L., and Yuan Y.P., 2006, Comparison of two maize SSR detection methods:capillary electrophoresis with fluorescence detection method and denaturing PAGE silver-staining detection method, Huabei Nongxuebao (Acta Agriculturae Boreali-Sinica), 21(5): 64-67 (易红梅, 王凤格, 赵久然, 王璐, 郭景伦, 原亚萍, 2006, 玉米品种SSR标记毛细管电泳荧光检测法与变性PAGE银染检测法的比较研究, 华北农学报, 21(5): 64-67)
Zhao J.R., Wang F.G., Guo J.L., Chen G., Liao Q., Sun S.X., Chen R.M., and Liu L.Z., 2003, Series of research on establishing DNA fingerprinting pool of Chinese new maize cultivarsⅡ. Confirmation of a set of SSR core primer pairs, Yumi Kexue (Journal of Maize Sciences), 11(2): 3-5, 8 (赵久然, 王凤格, 郭景伦, 陈刚, 廖琴, 孙世贤, 陈如明, 刘龙洲, 2003, 中国玉米新品种DNA指纹库建立系列研究Ⅱ.适于玉米自交系和杂交种指纹图谱绘制的SSR核心引物的确定, 玉米科学, 11(2): 3-5, 8)