研究报告/Research Report

马泡瓜叶绿体基因组测序  

马宗新
安徽省阜阳市农业科学院, 阜阳, 236065
作者    通讯作者
《分子植物育种》网络版, 2021 年, 第 19 卷, 第 19 篇   
收稿日期: 2021年05月08日    接受日期: 2021年05月10日    发表日期: 2021年05月17日
© 2021 BioPublisher 生命科学中文期刊出版平台
本文首次发表在 《分子植物育种》(ISSN1672-416X,CN46-1068/S)上。现依据版权所有人授权的许可协议,采用 Creative Commons Attribution License,协议对其进行授权,再次发表与传播。只要对原作有恰当的引用, 版权所有人允许并同意第三方无条件的使用与传播。
推荐引用:

马宗新, 2021, 马泡瓜叶绿体基因组测序, 分子植物育种 (网络版) 19(19): 1-9 (doi: 10.5376/mpb.cn.2021.19.0019) (ZMazon X., 2021, Sequencing of chloroplast genome of Cucumis melo L. var. agrestis Naud., Fenzi Zhiwu Yuzhong (Molecular Plant Breeding (online)), 19(19): 1-9 (doi: 10.5376/mpb.cn.2021.19.0019))

摘要

马泡瓜(Cucumis melo L. var. agrestis Naud.)葫芦科甜瓜属植物,种子富含油脂,可榨取优质食用油,还可为医药和食品工业提供原料。本研究首次开展了马泡瓜叶绿体基因组测序工作。结果表明:马泡瓜叶绿体基因组与普通甜瓜近似,物种聚类分析表明与甜瓜、蛇瓜、越瓜最为接近。本研究可以为育种提供理论参考。

关键词
马泡瓜;叶绿体基因组;测序

Sequencing of chloroplast genome of Cucumis melo L. var. agrestis Naud.

Mazon Xin *

Academy of Agricultural Sciences of Fuyang, Fuyang, 236065

* Correspondence author, mzxlsm965@163
 

Abstract Cucumis melo L. var. agrestis Naud. belong to the genus Cucumis in the Gourd family, it is rich in oil. It can extract high quality edible oil and provide raw materials for medicine and food industry. The chloroplast genome of Cucumis Melo L. was sequenced for the first time. The results showed that the chloroplast genome of Cucumis Melo L. was similar to that of common melon. This study can provide a theoretical reference for breeding.

Keywords Cucumis melo L. var. agrestis Naud.; Chloroplast genome; Sequencing
 

马泡瓜(Cucumis melo L. var. agrestis Naud.)为葫芦科(Cucurbitaceae)甜瓜属(Cucumis)植物,野生杂草。有学者认为马泡瓜是中国东方薄皮甜瓜的野生祖先(马宗新, 2020a)。种子中含有大量的脂肪,可以榨油食用,果实中富含药用成分葫芦素等,是一种极具开发潜力的新型野生植物(马宗新, 2020b)。目前叶绿体基因组测序小片段准确组装已经可以做到,但组装较大的完整基因组仍比较困难,核基因组组装更为困难(Anton et al., 2012)。甜瓜(Cucumis melo L.)作为世界最重要的经济作物之一,叶绿体基因组测序已经获得成功,甜瓜叶绿体基因组中包含133个基因。基因组的总GC含量为36.9% (Zhu et al., 2016)。利用叶绿体基因组分析揭示了越南甜瓜地方品种的遗传多样性(Phan et al., 2010)。利用基因组序列多态性推断栽培甜瓜的多样性和遗传分化(Katsunori et al., 2013)。并阐述了甜瓜叶绿体基因组全序列及其系统学意义(Hong et al., 2020)。截止目前,马泡瓜叶绿体基因组研究还没有相关文献报道。为了了解马泡瓜的叶绿体基因组的组成和基因与植物学性状之间的关系,为育种遗传改良马泡瓜提供理论技术依据,采用马泡瓜为实验材料,利用Illumina高通量测序技术,完成了马泡瓜叶绿体基因组测序工作。
 

1结果与分析

1.1叶绿体基因组测序数据统计及注释

测序表明马泡瓜叶绿体全基因组GC含量为37.45%,Q20为96.83% (表1)。基因总共133个,tRNA37个,rRNA8个,mRNA88个(表2)。叶绿体的基因功能主要分为光合合成、自我复制等其他一些基因,此外还有一些功能未知的基因(表3)。

 

 

表1 测序数据统计

Table 1 Sequencing data statistics

 

 

表2 叶绿体基因注释信息统计

Table 2 Statistics of chloroplast gene annotation information

 

 

表3 叶绿体基因功能分类统计

Table 3 Classification and Statistics of chloroplast gene function
注: Gene *: 含有一个内含子; Gene **: 含有两个内含子; #Gene :假基因; Gene (2): 拷贝数大于1的基因, 括号中为其拷贝数

Note: Gene *: Gene With One Intron; Gene **: Gene with two introns; # Gene: Pseudogene; Gene (2): Gene with a copy number greater than 1, with its copy number in parentheses

 

1.2叶绿体基因组图谱

马泡瓜叶绿体基因组为共价闭合的双链环状分子(图1),全长156 017 bp,包括1对反向重复(IR)区(25 797 bp)、1个大的单拷贝(LSC)区(86 336 bp)和1个小的单拷贝(SSR)区(18 087 bp),全基因组的GC含量为37.45%。6个ATP合酶基因、11个NADH脱氢酶基因。

 

 

图 1 叶绿体基因组图谱

Figure 1 Chloroplast genome map

 

1.3 RSCU密码子偏好性

密码子偏好性表明,TGG单独对应Trp编码(图2),Met分别对应GTG、ATT、ATG和ATC编码。Arg、Leu和Scr都对应6个密码子编码(图1)。密码子偏好性分析结果表明:UAA和GCU数值较高(表4),而GCG、UGC、UAG和UGA数值较低(表4)。

 

 

图2 RSCU密码子偏好性

Figure 2 RSCU codon preference

 

 

表4 密码子偏好性结果

Table 4 RSCU codon preference

 

1.4散在重复序列

散在重复序列结果表明:正向重复和回文重复数量较多,而反向重复数量较少,互补重复没有(图3)。

 

 

图3 散在重复序列统计

Figure 3 Statistics of scattered repeated sequences

 

1.5 cpSSR结果

马泡瓜叶绿体基因组中单核苷酸重复SSR有191个(表5),占66.55%;二核苷酸SSR 11个,三核苷酸SSR有71个,占24.74%;四核苷酸、五核苷酸和六核苷酸SSR较少,分别为9、3和2个(表5; 表6;  7)。单核苷酸重复中A、T核苷酸重复数量最多,C、G单核苷酸重复数量较少(图4)。

 

 

表5 SSR分析结果统计

Table 5 Statistics of SSR analysis results

 

 

表6 SSR结果

Table 6 Results of SSR analysis

 

 

表7  SSR引物设计结果

Table 7 Result of SSR primer design

 

 

图4 SSR各类型数量统计

Figure 4 Quantitative statistics of various SSR types

 

1.6 KaKs实验结果

非同义突变率(Ka)和同义突变率(Ks)的比值则说明受到何种选择作用。比值大于1,说明受到正选择效应,小于1,说明有纯化选择作用。KaKs值在0.4-0.8之间,说明有纯化选择作用(表8)。

 

 

表8 叶绿体基因KaKs分析统计

Table 8 analysis and Statistics of chloroplast gene KaKs

 

1.7核酸多样性pi分析

ssc和IR区域内pi值较高,这也意味着该区域变异程度较大,在lsc区间数值较小,说明变异程度较小(图5)。

 

 

图5 基因pi值折线

Figure 5 Polyline of geneo Pi value

 

1.8 IRscope试验结果

叶绿体基因组为环形结构,IR与LSC和SSC存在4个边界,即LSC-IRb、IRb-SSC、SSC-IRa和IRa-LSC。在基因组进化过程中,IR边界会发生扩张与收缩,使某些基因进入IR区或单拷贝区,使用Perl中的SVG模块将边界信息可视化(图6)。几个甜瓜种属之间有微小差异,基因组长度也有略微不同,在四个边界之间长度略有不同,只有细微差别,可能这细微的差异,就决定了不同种属的甜瓜形态各异,性状各异(图6)。

 

 

图6 叶绿体IR边界变化

Figure 6 IR boundary change of chloroplast

 

1.9叶绿体结构比较

叶绿体结构是一个环形状结构,通过比较近源属的甜瓜品种,结果比较近似。除少数位点不同外,其他近似程度较高(图7)。

 

 

图7 叶绿体结构比较

Figure 7 Comparative of chloroplast structure

 

1.10进化树聚类结果

聚类分析结果表明,甜瓜、越瓜、蛇瓜为一类,而马泡瓜与普通甜瓜、越瓜、蛇瓜亲缘关系较近,而与苦瓜、南瓜、丝瓜等亲缘关系较远(图8)。

 

 

图8 叶绿体系统进化树

Figure 8 chloroplast system evolution tree

 

1.11叶绿体序列同源及共线性分析

使用Mauve (http://darlinglab.org/mauve)软件默认参数进行基因组比对,序列同源性表明,马泡瓜与现有已知甜瓜、越瓜、黄瓜等作物具有同源相似性,在少数位点上有不同之外,大部分序列近似。特别是与越瓜、普通甜瓜更近似。与苦瓜、丝瓜相距较远(图9)。

 

 

图9 叶绿体序列同源性

Figure 9 Chloroplast sequence homology

 

2讨论与结论

参考甜瓜的基因组测序我们获得了马泡瓜这种植物的完整叶绿体测序和基因组图谱。结果表明马泡瓜与同属物种越瓜(Cucumis Melo var. Conomon) (156 017 bp)、甜瓜(Cucumis Melo var. Makuwa) (156 016 bp)、甜瓜亚种(Cucumis Melo subsp. Agrestis) (156 016 bp)相接近。叶绿体序列同源及共线性分析表明马泡瓜与甜瓜和越瓜等比较一致,而与西瓜、南瓜等在tRNA、少数基因上有很大区别。聚类分析结果表明,马泡瓜与甜瓜最为接近,在甜瓜几个种属中,与普通甜瓜、蛇瓜、越瓜最为接近。马泡瓜内含子数量21个,与甜瓜的内含子基本一致(王宏刚, 2017)。这说明葫芦科植物中,马泡瓜与甜瓜有相同的起源,这与前人考证的马泡瓜为中国薄皮甜瓜的野生祖先结论一致(马宗新, 2020a)。叶绿体基因组具有相对保守性,可以更好地说明物种的进化和亲缘关系。本研究表明马泡瓜在遗传学和分类学上与前人的研究结果一致(马宗新, 2020a)。甜瓜的为GC含量36.9%。黄瓜的也为36.9% (Zhu et al., 2016),马泡瓜的GC含量为37.45%。而LSC含量55.34%;SSC含量11.59%,IRs含量33.1%与甜瓜基本相同(Zhu et al., 2016)。
 

3材料与方法

3.1植物材料

马泡瓜植物新鲜叶片。采集地点为阜阳市农业科学院科技园内。
 

3.2生物信息学分析

将Clean Data按参考物种的叶绿体基因组序列进行序列组装,获得叶绿体序列组装结果,对叶绿体序列组装结果进行基因结构注释,制作叶绿体基因组图谱,分析叶绿体基因组SSR等基础内容,KaKs分析、系统发育分析等高级分析内容。使用fastp (version 0.20.0, https://github.com/OpenGene/fastp)软件对原始数据进行过滤,过滤标准如下:

(1)截除Reads中的测序接头以及引物序列

(2)过滤掉平均质量值小于Q5的reads

(3)过滤掉N个数大于5的reads

使用OGDRAW (https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)制作叶绿体基因组图谱。由于密码子生物学特点,不同物种其基因组密码子使用率存在着很大的不同。这种同义密码子使用的不平等性,叫做密码子的偏好性(Relative Synonymous Codon Usage, RSCU)。而这种偏好性被认为是自然选择、物种突变和遗传漂变的综合结果。其计算方法是:(编码某氨基酸的其中一种密码子数量/编码该氨基酸的所有密码子数量)/(1/编码该氨基酸的密码子种类),及(密码子的实际使用频率/该密码子的理论使用频率)。使用自行编写的Perl脚本进行计算。
 

散在重复序列使用vmatch v2.3.0 (http://www.vmatch.de/)软件结合Perl脚本鉴定重复序列。其参数设置为:最小长度(minimum length)=30 bp,海明距离(hamming distance)=3,鉴定形式为四种:正向(Forward)、回文(Palindromic)、反向(Reverse)、互补(Complement)。
 

叶绿体基因组上的SSR标记称之为cpSSR标记。使用MISA v1.0软件开展cpSSR的分析,参数1-8 (单碱基重复8次及以上),2-5,3-3,4-3,5-3,6-3。
 

pi (核酸多样性)能揭示不同物种核酸序列的变异大小,变异度较高的区域可以为种群遗传学提供潜在的分子标记。使用mafft软件(--auto模式)对不同物种的同源基因序列进行全局比对,使用dnasp5计算每个基因的pi值。
 

使用软件CGVIEW (http://stothard.afns.ualberta.ca/cgview_server/)默认参数,针对近源物种进行叶绿体基因组结构的比较分析。
 

默认采用全基因组做进化树分析,将环形序列设置相同起点,物种间序列用MAFFT软件(v7.427, --auto模式)进行多序列比对,将比对好的数据用trimAl (v1.4.rev15)修剪,然后使用RAxML v8.2.10 (https://cme.h-its.org/exelixis/software.html)软件,选用GTRGAMMA模型,rapid Bootstrap分析,bootstrap=1 000,构建最大似然进化树。
 

3.3基因组组装

为了降低接下来序列组装的复杂度,使用bowtie2 (v2.2.4, http://bowtie-bio.sourceforge.net/bowtie2/index.shtml) very-sensitive-local模式比对数据库并进行测序。组装核心模块采用SPAdes [1] v3.10.1 (http://cab.spbu.ru/software/spades/)软件组装叶绿体基因组。对基因组进行3个方面的质控来确保组装结果的准确性:

(1) reads回比基因组,统计基因组覆盖度、插入片段大小等信息;

(2)基因组比对参考序列,查看基因组的保守与重排等共线性分析;

(3)基因组比对参考序列结构信息,比较两者间的差异。

本项目使用参考序列Cucumis_melo:MT240857.1。
 

作者贡献

马宗新负责方案设计、数据处理和基因测序工作,并完成论文的写作和修改。本人已经阅读并同意最终的文本。
 

致谢

本研究由安徽省科技厅重点研发项目(1704f0704067)资助。
 

参考文献

Anton B., Sergey N., and Dmitry A., 2012, A new genome assembly algorithm and its applications to single-cell sequencing, J. Comput. Biol., 19(5): 455-477.
 

Hong C., Wei P.K., Zhang M.M., and Hou D., 2020, The complete chloroplast genome of Cucumis melo L. ‘Shengkaihua’ (Cucurbitaceae ) and its phylogenetic implication, Mitochondrial DNA Part B, 5(2): 1253-1254.
 

Katsunori T., Yukari A., Kenji F., Tatsuya Y., Yasheng A., Hidetaka N., Chun L.L., Hiromichi Y., YoIchiro S., and Kenji K., 2013, Diversification and genetic differentiation of cultivated melon inferred from sequence polymorphism in the chloroplast genome, Breeding Science, 63(2): 183-196.
 

Ma Z.X., 2020a, Brief history of production of Cucumis melo L. var. agrestis Naud., Nongcun Jingji Yu Keji (Rural Economy and Science-Technology), 31(7): 76-77. (马宗新, 2020a, 马泡瓜生产简史, 农村经济与科技, 31(7): 76-77.)
 

Ma Z.X., 2020b, Investigation on new food resources of a new wild plant, Nongye Yu Jishu (Agriculture and technology), 40(1) : 32-34. (马宗新, 2020b, 一种新型野生植物新食品资源调查研究, 农业与技术, 40(1): 32-34.)
 

Phan T.P.N., Yukari A., Tran T.M.H., Katsunori T., Yasheng A., Tatsuya Y., Hidetaka N., Long C. L., and Kenji K., 2010, Genetic diversity in Vietnamese melon landraces revealed by the analyses of morphological traits and nuclear and cytoplasmic molecular markers, Breeding Science, 60(3): 255-266.
 

Wang H.G., Bai YL., Xu H.J., Liu S.H., Zhang W.J., Liu Q., Zhang X.M., Qiao M.Q., and Wang Y., 2017, Construction and stability of cucumber chloroplast expression vector, Nankai Daxue Xuebao (Acta Scientiarum Naturalium Universitatis Nankaiensis), 50(5): 61-66. (王宏刚, 白艳玲, 徐海津, 刘盛海, 张文娟, 刘青, 张秀明, 乔明强, 王勇, 2017, 黄瓜叶绿体表达载体构建与稳定性研究, 南开大学学报(自然科学版), 50(5): 61-66.)
 

Zhu Q.L., Gao P., Liu S., Amanullah S., and Luan F.S., 2016, Comparative analysis of single nucleotide polymorphisms in the nuclear, chloroplast, and mitochondrial genomes in identification of phylogenetic association among seven melon (Cucumis melo L.) cultivars., Breeding science, 66(5): 711-719.

    0.625
00120
《分子植物育种》网络版
• 第 19 卷
阅览选项
. 全文 PDF
. 全文 HTML
读者评论
. 评论
作者的其他论文
.
马宗新
相关论文
.
马泡瓜
.
叶绿体基因组
.
测序
服务
. 发表评论