NSCLC分类及生存分析预测的全基因组特征基因识别  

郑广强1 , 宋凯1,2
1天津大学化工学院, 天津, 300072; 2德克萨斯大学西南医学中心, 德克萨斯州, 75235
作者    通讯作者
基因组学与应用生物学, 2015 年, 第 34卷, 第 334 篇   
收稿日期: 1970年01月01日    接受日期: 1970年01月01日
© 2015 BioPublisher 生命科学中文期刊出版平台
这是一篇采用Creative Commons Attribution License进行授权的开放取阅论文。只要对本原作有恰当的引用,版权所有人允许和同意第三方无条件的使用与传播。
摘 要

基于NSCLC (非小细胞肺癌)子类分类在临床和生物医学研究方面的意义,利用全基因组基因表达水平(GE)和甲基化(ME)水平的微阵列数据对NSCLC子类分类进行全基因组特征基因识别分析。针对全基因组微阵列数据的高噪声、超高维小样本特性,利用弹性正交贝叶斯算法对全基因组基因进行递归筛选,识别分类精度最优的特征基因集。以TCGA的490的基因表达数据和378个甲基化数据为例,分别识别出52个GE特征基因和25个ME特征基因,相应的分类准确率分别为99%和98%。结合特征基因和临床数据建立的多变量Cox模型明确说明了特征基因在病人生存分析方面的重要作用:仅利用相应的基因表达数据和甲基化数据即可对病人样本的“高/低风险”进行正确分类,显著性水平均低于0.05。特征基因参与的代谢通路与p53、TGF-beta、Wnt等重要的癌症分类和发展的代谢通路的密切关系进一步证实了特征基因对NSCLC分类的重要性。

关键词
非小细胞肺癌;基因表达数据;基因甲基化数据;模式识别;生存分析
本文全文 PDF 和全文 HTML 正在制作中
基因组学与应用生物学
• 第 34 卷
阅览选项
. 全文 PDF
读者评论
. 评论
作者的其他论文
.
郑广强
.
宋凯
相关论文
.
非小细胞肺癌
.
基因表达数据
.
基因甲基化数据
.
模式识别
.
生存分析
服务
. 发表评论