基因组学与应用生物学, 2010 年, 第 29卷, 第 3 篇 doi: 10.5376/gab.cn.2010.29.0003
收稿日期: 2010年07月28日 接受日期: 2010年08月15日 发表日期: 2010年11月30日
Wang et al, 2010, Microcollinearity between autopolyploid sugarcane and diploid sorghum genomes, BMC Genomics 2010, 11: 261 (doi: 10.1186/1471-2164-11-261)
背景
甘蔗(Saccharum spp.)在生物燃料生产中占据着主导地位,成为一种越来越重要的作物。高糖含量品种S. officinarum是一个八倍体品种,但是还不能确定其祖先是属于二倍体还是四倍体。商业化的甘蔗品种是由S. officinarum 和野生种S. spontaneum杂交获得的12倍体植株。目前的研究中,还缺乏在DNA序列水平上对复杂的多倍体甘蔗基因组的鉴定。
结果
我们利用Roche454焦磷酸测序获得20个甘蔗细菌人工染色体(BACs),并将其与高粱序列进行比较,以此评估甘蔗和高粱间的微共线性。通过1 961个单拷贝高粱寡核苷酸探针在甘蔗BAC库的杂交选择了这20个甘蔗BACs,并且每个BAC与20个高粱染色体臂中的一个相对应。甘蔗BACs的编码区域平均有95.2%的序列和高粱序列是相匹配的,以高粱基因组作为模板来对序列重叠群排序的话,可以覆盖20个BAC序列中的78.2%。大约有53.1%的甘蔗BAC序列与高粱的序列是相联配的。不能相联配的区域包括非编码区和重叠序列。在能联配的区域中,甘蔗有209个基因已经被注释,高粱有202个被注释。其中有17个表现为甘蔗所特有的,并且都得到了甘蔗序列表达标签(ESTs)的验证;然而,12个高粱特有基因中,只有一个得到高粱序列表达标签(ESTs)的验证。在17个甘蔗特有基因中,有12个基因在GenBank的非冗余蛋白数据库中没有找到匹配蛋白,它们可能是参与编码甘蔗特异过程中的其它蛋白。相对于甘蔗来说,高粱的直系同源区域的扩大,主要是通过反转录转座子的增加来实现。
结论
甘蔗和高粱的基因组在基因区域上大部分是共线的,高粱基因组能够用来作为同源多倍体甘蔗基因组中许多基因区间DNA组装的模板。多倍体物种由于在各自的基因位点冗余多个复等位基因,因而可能有更快的基因缺失速率,然而甘蔗BACs和对应高粱基因组间的相似基因密度比却违背了这一观点。