作者 通讯作者
计算分子生物学, 2014 年, 第 3卷, 第 10 篇 doi: 10.5376/cmb.cn.2014.03.0010
收稿日期: 2014年08月07日 接受日期: 2014年09月26日 发表日期: 2014年10月08日
Kumar et al., 2014, In silico Proteomic Functional Re-annotation of Escherichia coli K-12 Using Dynamic Biological Data Fusion Strategy, Computational Molecular Biology, Vol.4, No.4 34-43 (doi: 10.5376/cmb.2014.04.0004)
大肠杆菌,是广大生物学研究着最喜欢的模型生物之一,最初是在1997年注释,并在2007年完成重新注释。虽然在大肠杆菌基因组上,已经进行了多年的深入研究,但在完整和准确的生物功能上的研究信息并不可用。在大肠杆菌中,因为缺乏功能信息,约有40%的蛋白质序列被注释为假定蛋白。因此,这些蛋白序列需要利用更先进的计算方法去获取它的生物学功能。在这里,我们采用“动态生物数据融合策略”,对大肠杆菌K-12完整蛋白质组进行了重新注释。它是一种计算策略,我们通常应用于与异构生物数据源相结合,最大限度地提高知识共享和生成数据集的交集。本研究对大肠杆菌K-12的功能重新注释结果有助于我们获取高质量、完整的蛋白质组数据。我们已经更新了以前注释的所有的蛋白质编码基因,并试图在可能的情况下分析新的或更精确的蛋白功能。约29%的大肠杆菌的蛋白质序列,先前被注释为你不清楚或未知功能(即无功能),现在已被注释为清楚或已知的功能。此外,重新分析也导致了对已发现是假阳性或错误注释的蛋白序列的修订。这个研究的注释结果信息可以作为数据库,“REC-DB”,这仍然是一个有用的、数据得到更新、信息更准确的数据库。REC-DB是公开在http://recdb.bioinfo.au-kbc.org.in/recdb/。