2 深圳市水质检测中心, 深圳, 518000
作者 通讯作者
计算分子生物学, 2013 年, 第 2卷, 第 7 篇
收稿日期: 2013年07月24日 接受日期: 2013年07月24日 发表日期: 2013年07月25日
Song C.X., Lei P., and Wang T., 2013, Gene co-expression network analysis based on WGCNA algorithm-theory and implementation in R software, Jiyin Zuxue Yu Yingyong Shengwuxue (Genomics and Applied Biology), 32(1): 135-141 (宋长新, 雷萍, 王婷, 2013, 基于WGCNA算法的基因共表达网络构建理论及其R软件实现, 基因组学与应用生物学, 32(1): 135-141)
WGCNA(weighted gene co-expression network analysis)算法是一种构建基因共表达网络的典型系统生物学算法,该算法基于高通量的基因信使RNA(mRNA)表达芯片数据,被广泛应用于国际生物医学领域。本文旨在介绍WGCNA的基本数理原理,并依托R软件包WGNCA以实例的方式介绍其应用。WGCNA算法首先假定基因网络服从无尺度分布,并定义基因共表达相关矩阵、基因网络形成的邻接函数,然后计算不同节点的相异系数,并据此构建分层聚类树(hierarchical clustering tree),该聚类树的不同分支代表不同的基因模块(module),模块内基因共表达程度高,而分数不同模块的基因共表达程度低。最后,探索模块与特定表型或疾病的关联关系,最终达到鉴定疾病治疗的靶点基因、基因网络的目的。