作者 通讯作者
基因组学与生物技术, 2012 年, 第 1 卷, 第 3 篇 doi: 10.5376/gb.cn.2012.01.0003
收稿日期: 2012年02月22日 接受日期: 2012年05月15日 发表日期: 2012年05月18日
引用格式(中文):
刘朋虎等, 2012, 草菇菌丝体与原基差异表达基因分析, 基因组学与生物技术(online) Vol.1 No.3 pp.14-21 (doi: 10.5376/gb. cn.2012.01.0003)
引用格式(英文):
Liu et al., 2012, Analysis of Differentially Expressed Genes between Mycelium and Primordium of Paddy Straw Mushroom (Volvariella volvacea), Jiyinzuxue Yu Shengwujishu (online) Vol.1 No.3 pp.14-21 (doi: 10.5376/gb.cn.2012.01.0003)
采用Solexa测序技术,对草菇菌丝体和原基进行了数字基因表达谱(DGE)测序,在菌丝体和原基文库中分别得到5 701 781和5 659 262个高质量测序标签(clean tags),对应的标签种数(distinct clean tags)分别为85 626、95 363。将所有高质量测序标签与参考基因库进行比对,在菌丝体和原基文库中,占标签种数的43.32%和52.57% 的标签可以唯一定位(map)到参考序列上,占标签种数的21.65%和21.47%的标签可以被定位到基因组序列上。最终,被菌丝体和原基标签唯一定位的基因数(unambiguous tag-mapped genes)分别为14 794、15 534。差异基因分析显示,两个文库中共有显著性差异表达的基因4 163个,其中在原基中上调、下调的基因数分别为2 486和1 677,只在原基中表达的基因321个。经过Blastnr比对,在原基中特异表达的基因,涉及蛋白质(氨基酸)合成与代谢、糖代谢、脂类代谢和抗逆反应等多个代谢途径。GO功能富集分析结果表明,葡萄糖、己糖和乙醇等代谢途径大部分基因下调表达。Pathway功能富集分析结果表明,合成核糖体蛋白的基因均下调表达,表明原基形成时细胞代谢减弱,蛋白质合成量减小。
草菇(Volvariella volvacea (Bull.ex Fr.) Sing.),又称兰花菇、苞脚菇、麻菇、秆菇、贡菇和中国菇等,分类上隶属于担子菌亚门(Basidiomycatina),层菌纲(Hyoenomycetes),无隔担子菌亚纲(Holobasidio- mycetidae),伞菌目(Agaricales),鹅膏菌科(Pluteaceac),草菇属(Voluariella)。草菇是热带、亚热带高温多雨地区广泛栽培的食用菌,其品质鲜嫩,味道鲜美,具有很高的营养价值和医用价值,深受人们喜爱。目前,在已人工栽培的30多种食用菌中,其产量居第8位(张金霞, 2009, 中国农业出版社, pp.47-47),具有很高的经济价值。
原基的形成是食用菌生活史中的重要生理过程,对食用菌的生物学效率有重要影响。原基的形成需要一定的环境条件和营养条件,但归根结底是由遗传物质所决定的。原基的形成需要一系列基因的协调作用,基因的差异表达对子实体的形成具有关键的调控作用(蔡为明等, 2009)。对草菇原基形成时差异表达基因的研究,对阐明草菇子实体形成的分子机理具有重要的意义。
本研究利用Solexa Genome Analyzer测序平台,对草菇菌丝体及原基进行了数字基因表达谱(digital gene expression profiling)测序,并将测序得到的数据与到本实验室草菇基因组及转录组基因库进行比对,找到了主要差异表达的基因及参与的代谢途径,以期了解草菇原基形成的分子机制。
1结果与分析
1.1两个样本的转录本分析
为了获得草菇菌丝体与原基的全面基因表达信息,采用Solexa基因组分析仪,对草菇菌丝体与原基poly(A)富集的RNA进行了高通量标签测序(Tag-seq)。通过高通量测序,在菌丝体和原基样本库中分别得到了5 832 613和5 782 506个原始测序标签(raw tags),对应的标签种类数(distinct raw tags)分别为199 222和216 812 (表1)。原始数据去除低质量的标签后,在菌丝体和原基这两个文库得到高质量测序标签(clean tags)总数分别为5 701 781和5 659 262,这些高质量测序标签对应的标签种数(distinct clean tags)分别为85 626和95 363。将所有高质量测序标签与参考基因库进行比对,在菌丝体和原基文库中,占标签种数的51.32%和52.57% 的标签可以唯一地定位(map)到参考序列上,占标签种数的21.65%和21.47%的标签可以被定位到基因组序列上。最终,被菌丝体和原标签唯一定位的基因数(unambiguous tag-mapped genes)分别为14 794和15 534。这些基因代表了草菇在菌丝体和原基阶段表达的基因,暗示了原基形成的分子机制。
表1两个样本中标签分布一览表 Table 1 Distributions of tags from two libraries |
1.2原基形成时特异表达基因分析
为了分析草菇菌丝体、原基的基因表达情况,将两个文库中的高质量测序标签与参考基因库进行比对,分别获得了唯一定位的14 794和15 534个基因。为了进一步筛选显著性差异表达的基因,将基因的表达量标准化,并对差异检验的p值作进行多重假设检验校正,通过控制FDR (false discovery rate)≤0.001,来最终决定p值的域值。本研究中,差异表达基因条件是差异表达的倍数大于或等于2 (即 |log2 Ratio|≥1)且FDR≤0.001的基因。最终,在菌丝体和原基数据库中,共发现显著差异表达的基因4 163个,其中在原基中上调2 486个,下调1 677个,只在菌丝阶段表达的基因220个,只在原基中表达的基因321个(图1)。
图1菌丝体与原基差异表达基因分布 Figure 1 Differently expressed genes between libraries mycelium and primordium |
为了得到原基阶段特有基因的表达情况,将原基中特异表达的321个基因进行同源比对(Blastnr)。由于目前关于真菌基因功能的注释还很有限,得到的321个基因中绝大多数在NCBI中比对到的同源基因是功能未知的预测蛋白(predicted protein)或者假定蛋白(hypothetical protein)。将比对到的有确切功能的基因列于表2,从表中可以看到,在原基阶段特异表达的基因与蛋白质(氨基酸)代谢、糖代谢、脂类代谢、木质素和纤维素降解、细胞骨架等多种代谢途径有关。小热休克蛋白(小热激蛋白)是一种胁迫蛋白,具有维持蛋白质稳定、细胞稳定等多种功能(夏佳音和张耀洲, 2007)。SNF2家族蛋白在基因组复制、修复与表达中具有重要作用(陈祥贵等, 2004),钙ATP酶(钙泵)与钙离子吸收有关。
表2原基中特异表达基因的同源比对结果 Table 2 The results of Blast nr comparison of genes only expressed in the primordium |
1.3 GO功能富集分析
基因本体(gene ontology, GO)是一个基因功能的国际标准化分类体系,采用一套动态更新的控制子集(controlled vocabulary)来描述基因产物的功能。其总共有三个本体(ontology),分别用来描述基因的细胞组成(cellular component)、分子功能(molecular function)和生物过程(biological process)。GO的基本单位是词条(term),每个词条都对应一个属性。以显着性差异的GoTerm的p<0.05为阈值,得到5个显著富集的GO term,均富集在参与的生物过程(biological process)本体上(表3)。在富集到的5个Go term中,有4个与糖代谢有关,1个关于乙醇的分解代谢,除一个基因上调外,其它所有基因均下调表达。此结果表明,原基中糖代谢和乙醇代谢大部分基因是下调表达的。
表3菌丝体与原基Go功能富集分析 Table 3 Significantly enriched Go terms of mycelium vs primordium |
1.4 Pathway显著性富集分析
在细胞内,不同基因之间相互协调才能行使其生物学功能。对差异表达基因的代谢途径(Pathway)分析有助于更深入了解基因的功能。在菌丝体和原基中,通过pathway分析,得到了3个被显著富集的代谢途径(表4)。其中关于核糖体蛋白代谢途径中,只有一个基因上调,其它均下调,即核糖体数量在减少。核糖体是合成蛋白质的细胞器,核糖体数量在原基时数量下降,表明原基形成时细胞代谢减弱,蛋白质合成量减少。另外两个代谢途径基因上调或者下调数不等,现有的信息还不能确定代谢途径的加快或者减慢,有待于进一步分析。
表4菌丝体与原基pathway显着富集分析列表 Table 4 List of pathway enrichment analysis |
2讨论
食用菌子实体的形成和发育,对食用菌的生物学效率有重要影响,是食用菌研究的主要领域(郑永标等, 2003)。随着分子生物学的发展,子实体形成与发育的研究已深入到分子水平,并且聚焦于子实体形成过程中差异表达较大的基因(陈辉等, 2009)。目前,已经不少关于子实体形成、发育差异基因的报道(Szeto et al., 2008; 蔡为明等, 2009)。总的来说,虽然原基形成时差异基因表达的研究已经取得很大进展,但是仍然存在一些不足。存在的主要问题有两个:一是子实体发生和发育的信息还十分有限,特别缺少子实体发育关键基因的证据(刘雁英等, 2010);二是子实体发育需要一系列基因的参与,以前的报道还不能从整个基因组水平,准确发现子实体形成、发育时的差异表达基因。为了从基因组水平了解草菇原基形成时基因表达的变化,我们采用新一代Illumina测序技术,对草菇菌丝体、原基进行了数字基因表达谱测序,并且将测序结果与草菇基因组、转录组基因库比对,获得了大量在原基形成时差异表达的基因。
漆酶是一种多酚氧化酶,在木质素的降解中具有重要作用。Chen等(2004)克隆到新的草菇漆酶基因(Laccase 5),并且发现该酶在针头期表达量最高,推测该基因与子实体的形成与发育有关。本研究中,原基阶段特异表达的基因经NCBI比对,有一个基因与该报道的基因同源性很高,初步确定为Laccase 5。这与Chen的结论一致。Zhao and Kwan (1999)从香菇中克隆到漆酶基因Lac 1,并且发现该酶对香菇子实体的形态建成有一定的作用。潘迎捷等(1991)发现在平菇和香菇的栽培料中添加漆酶制剂,能促使菌丝扭结成更多的子实体原基。这些研究均表明,漆酶在子实体原基形成中有重要作用。
天冬氨酸蛋白酶(aspartic peptidase)是一种重要的蛋白水解酶,能切割天冬氨酸的羧基与下一个氨基酸的氨基形成的肽键来催化蛋白质的降解,在真菌的生理代谢及形态发育中起重要作用。有研究明,天冬氨酸蛋白酶在原基中特异表达(陈叶叶等, 中国菌物学会第五届会员代表大会暨2011年学术年会论文摘要集, pp.152-153),与本研究结果一致。热休克蛋白(heat shock protein)是细胞或生物体受胁迫时新合成或者含量增加的一类蛋白质。有研究表明,热休克蛋白可能参与子实体发育时,在温度等外界条件的刺激下所发生的转录调控与抗逆反应(Leung et al., 2000; Miyazaki et al., 2004; 蔡为明等, 2009)。本研究发现,草菇原基形成时小热休克蛋白(small shock protein)特异性表达,与前人的结果一致。
另外,通过Go功能富集分析和Pathyway显着性分析,发现原基形成时糖代谢、蛋白质合成均减弱,进一步表明原基形成是一个复杂的生理过程,需要多种代谢途径的协同调控。虽然本研究中差异表达基因还没有经过功能验证,还有大量的未知功能基因,但是我们得到了原基形成时准确的差异表达基因,为今后进一步探索原基形成的分子机制奠定了基础。
3材料与方法
3.1供试菌株
本研究所用菌株为杂交菌株H1521,在福建农林大学菌物研究中心保藏。
3.2样品制备及RNA提取
菌丝体的获取方法参照江玉姬等(2000)。菌株H1521出菇方法参照文献傅俊生等(2010),菌丝扭结形成原基后,采集米粒大小的原基用于后续试验。菌丝体及原基的总RNA提取方法:用pBIOZOL公司植物总RNA提取试剂提取总RNA,再用RNAeasy plant mini kit的试剂盒(QIAGEN公司)对提取的RNA进行纯化,具体操作方法参考试剂盒提取说明书。
3.4数字基因表达谱的测序
用Agilent 2100对提取总RNA的浓度(ng/μL)、28S:18S及RNA的完整性进检测,检测合格的RNA样品进行文库构建及测序,文库构建及测序方法参照Morrissy等(2009)。
3.5基因的表达注释及标准化
测序后得到的是带有3'接头的原始序列数据,含有各种杂质以及少量低质量序列(reads),去除一系列杂质和低质量序列(reads)后,得到Clean Tag。
本文参考基因库为本实验室单孢菌株PYd21基因组数据及8个样本(PY21, PYd15, H1521的菌丝体, H1521出菇后的原基, H1521出菇后纽扣期, 蛋形期, 伸长期和成熟期的菌柄) mRNA等量混合物的转录组测序数据库。首先,将两个参考基因库中的基因序列进行同源比对(Blast),当同源性≥0.8时,这两条序列被认为来自同一个基因,保留较长的序列,舍弃较短的序列;当同源性<0.8时,两条序列作为不同的基因都保留。本研究的参考基因库为两个基因库这样组合而来。
首先,利用生物信息学软件查找参考基因库中所有的CATG位点(对应的mRNA),构建一个CATG+17nt碱基的参考标签库。然后,将所有高质量测序标签与参考标签库比对(Blast),最多允许错配一个碱基,并对其中的Unambiguous Tags (唯一比对到一个基因的标签)进行基因注释。为了准确、科学地衡量每个基因的表达水平,对每个基因表达量做标准化处理。标准化公式为,TPM (transcript per million clean tags)=(比对到该基因高质量测序标签数)÷(该样本中总高质量测序标签数)×106,标准化结果用TPM表示(Hoen et al., 2008)。
3.6差异表达基因的筛选
参照Audic and Claerie (1997)报道的方法,采用严格的算法筛选两样本间差异表达的基因,并对差异检验的p值进行多重假设检验校正,然后通过控制FDR (false discovery rate)来最终决定p的阈值(Benjamini and Yekutieli, 2011)。本研究差异表达基因定义为“FDR≤0.001”且差异倍数2倍以上(即 |log2 Ratio|≥1)的基因。
3.7 Go功能富集分析
对不同样本中差异表达的基因进行基因本体(gene ontology, GO)分析能确定差异表达基因的功能。GO功能富集分析方法参照王海英(2011)。本文中,满足corrected-pvalue≤0.05条件的GO条目被认为是显著富集的GO条目。
3.8 Pathway显著性富集分析
参照王海英(2011)的方法对草菇原基、菌丝体差异表达基因进行Pathway显著性富集分析。Pathway分析的目的是确定不同样本间差异表达的基因所参与的最主要代谢途径和信号转导途径。
作者贡献
刘朋虎为本研究的主要执行人及论文初稿;邓优锦老师主要协助文库制备及测序;江玉姬教授参与了数据分析及论文修改;谢宝贵教授为项目负责人,指导实验设计,论文修改和写作。全体作者都阅读并同意最终文本。
致谢
本研究由国家现代农业产业技术体系建设专项资金资助(编号: CARS 24)。国家食用菌品种改良中心福建分中心和福建省食用菌工程技术研究中心为本研究提供了试验条件,特此致谢。
参考文献
Audic S., and Clayerie J.M., 1997, The significance of digital gene expression profiles, Genome Res., 7(10): 986-995
PMid:9331369
Benjamini Y., and Yekutieli D., 2011, The control of the false discovery rate in multiple testing under dependeny, The Annals of Statistics, 29(4): 1165-1188
Cai W.M., Li N.Y., Xie M., Gao Z.S., and Jin Q.L., 2009, Identification of developmentally related genes in Lentinula edodes by mRNA differential expression, Junwu Xuebao (Mycosystema), 28(2): 289-294 (蔡为明, 李南羿, 谢鸣, 高中山, 金群力, 2009, 利用mRNA差异显示技术研究香菇发育相关基因, 菌物学报, 28(2): 289-294)
Chen H., Feng Z.Y., Chen M.J., and Bao D.P., 2009, Advances in the cloning of key functional genes associated with substrate utilization, mating type and fruiting body development in edible fungi, Shiyongjun Xuebao (Acta Edulis Fungi), 16(2): 91-98 (陈辉, 冯志勇, 陈明杰, 鲍大鹏, 2009, 克隆食用菌重要功能基因的研究进展, 食用菌学报, 16(2): 91-98)
Chen S., Ge W., and Buswell J.A., 2004, Molecular cloning of a new laccase from the edible straw mushroom Volvariella volvacea: Possible involvement in fruitbody development, FEMS Microbiology Lett., 230(2): 171-176
http://dx.doi.org/10.1016/S0378-1097(03)00878-4
Chen X.G., Li Y., Zang M.X., Pei X.R., Xu Y.J., and Gao L.F., 2004, cDNA cloning and expression analysis of mouse gene encoding the protein ercc61 which is a novel member of SNF2 family, Shengwuhuaxue Yu Shengwuwuli Jinzhan (Progress in Biochemistry and Biophysics), 31(05): 443-448 (陈祥贵, 李勇, 臧明玺, 裴新荣, 许雅君, 高丽芳, 2004, SNF2家族新成员Ercc61的cDNA克隆与表达分析, 生物化学与生物物理进展, 31(05): 443-448)
Fu J.S., Zhu J., Xie B.G., Deng Y.J., and Liu X.R., 2010, Identification of hybrid strain 2628 on Volvariella volvacea and its variety test, Zhongguo Nongxue Tongbao (Chinese Agriculture Science Bulletin), 26(14): 48-53 (傅俊生, 朱坚, 谢宝贵, 邓优锦, 刘新锐, 2010, 草菇杂交菌株2628的鉴定与品比试验, 中国农学通报, 26(14): 48-53)
Hoen P.A., Ariyurek Y., Thyqesen H.H., Vreuqdenhil E., Vossen R.H., de Menezes R.X., Boer J.M., van Ommen G.J., and den Dunnen JT., 2008, Deep sequencing-basd expression analysis shows major advances in robustness,resolution and inter-lab portability over five microarray platforms, Nucleic Acids Res., 36(21): e141
http://dx.doi.org/10.1093/nar/gkn705 PMid:18927111 PMCid:2588528
Jiang Y.J., Xie B.G., and Chen W.X., 2000, Ways of extracting DNA from Volvariella volvacea, Fujian Nongye Xuebao (Fujian Journal of Agricultural Sciences), 15(2): 61-64 (江玉姬, 谢宝贵, 陈文校, 2000, 草菇DNA提取方法初探, 福建农业学报, 15(2): 61-64)
Leung G.S., Zhang M., Xie W.J., and Kwan H.S., 2000, Identification by RNA fingerprinting of genes differentially expressed during the development of the basidiomycete Lentinula edodes, Molecular Genetics and Genomic, 262(6): 977-990
http://dx.doi.org/10.1007/PL00008666
Liu Y.Y., Li L.H., Xie F.G., and Qiu H.L., 2010, Advances of research on fruiting body formation and development of edible fungi, Junwu Yanjiu (Journal of Fungal Research), 8(1): 57-62 (刘雁英, 李林辉, 谢富刚, 邱慧兰, 2010, 食用菌子实体分化发育研究进展, 菌物研究, 8(1): 57-62)
Miyazaki Y., Sakuraqi Y., Yamazaki T., and Shishido K., 2004, Tarkget genes of the developmental regulator PRIB of the mushroom Lentinula edodes, Bioscience, Biotechnology, and Biochemistry, 68(9):1898-1905
http://dx.doi.org/10.1271/bbb.68.1898 PMid:15388965
Morrissy A.S., Morin R.D., Delaney A., Zeng T., McDonald H., Jones S., Zhao Y., Hirst M., and Marra M.A., 2009, Next-generation tag sequencing for cancer gene expression profiling, Genome Res, 19(10): 1825-1835
http://dx.doi.org/10.1101/gr.094482.109 PMid:19541910 PMCid:2765282
Pan Y.J., Chen M.J., Zheng H.G., Wang Z.Y., and Gong S.P., 1991, Activity changes of laccase, tyrosinase and celllulase in Lentinus edodes and pleurotus asteratus during their growth, Shanghai Nongye Xuebao (Acta Agriculture Shanghai), 7(2): 21-26 (潘迎捷, 陈明杰, 郑海歌, 汪昭月, 龚胜萍, 1991, 香菇和平菇生长发育中漆酶、酪氨酸酶和纤维素酶活性的变化, 上海农业学报, 7(2): 21-26)
Szeto C.Y., Wonq Q.W., Leung G.S., and Kwan H.S., 2008, Isolation and transcript analysis of two-component histidine kinase gene Le nik 1 in Shiitake mushroom, Lentinula edodes, Mycol Res, 112(1): 108-116
http://dx.doi.org/10.1016/j.mycres.2007.08.024 PMid:18234485
Wang H.Y., 2011, Analysis of the differential stipe expression profiles of Volvarella volvacea, Thesis for M.S., Fujian Agriculture and Forestry University, Supervisor:Xie B.G., pp.55-56(王海英, 2011, 草菇不同时期菌柄基因表达谱差异初步分析, 硕士学位论文, 福建农林大学, 导师:谢宝贵, pp.55-56)
Xia J.Y., and Zhang Y.Z., 2007, Structure and functions of small heat shock proteins, Zhongguo Shengwuhuaxue Yu Fenzishengwuxuebao (Chinese Journal of Biochemistry and Molecular Biology), 23(11): 911-915 (夏佳音, 张耀洲, 2007, 小热休克蛋白的结构与功能, 中国生物化学与分子生物学报, 23(11): 911-915)
Zhao J., and Kwan H.S., 1999, Characterization, molecular cloning, and differential expression analysis of laccase genes from the edible mushroom Lentinula edodes, Applied and environmental microbiology, 65(11): 4908-4913 PMid:10543802 PMCid:91660
Zheng Y.B., Chen J.C., and Lin X.J., 2003, Research advances in the fruitbody formation of edible fungi, Shiyongjun Xuebao (Acta Edulis Fungi), 10(1): 59-63 (郑永标, 陈济琛, 林新坚, 2003, 食用菌子实体发生研究进展, 食用菌学报, 10(1): 59-63)