强大的基因功能富集分析的在线工具——Metascape

功能富集分析你还在使用clusterProfiler R包进行编程绘图吗?今天要和大家介绍一款强大的基因功能富集分析的在线工具——Metascape,由诺华研究基金会基因组研究所(GNF)的一组研究人员开发并发表在《Nature Communications》杂志上,并且此项工作由NIH所资助,旨在为实验生物学家提供全面的基因列表注释和分析资源,包括基因集功能富集分析、蛋白质互作组学分析、基因注释和基因-功能关系查询等分析模块。

芒果有被这个在线工具惊艳到,其不仅包含单个基因集的功能富集分析,而且具备多个基因集间功能富集的比较分析。这个工具输入的基因格式可以多样,并且其产出的很多结果图片非常好看。讲真,感觉几分钟一个section就可以暗戳戳完成了,话不多说,先给大家展示一下其结果图片:

网址:

http://metascape.org/gp/index.html#/main/step1

可以发现其有多个基因集选项以及单个基因集选项,并且会自动检测输入的基因格式,包括:Entrez Gene ID,gene symbol, RefSeq number, Ensembl ID等。输入你感兴趣的基因列表后,主要包括四个分析模块:

1)基因ID转化,将你输入的基因源标识符映射到一个独特的Entrez基因ID列表上,因为Metascape下的大量生物信息学知识库依赖于Entrez基因ID作为它们的主键;

2)基因注释,为后续研究选择候选基因提供了重要以及全面的生物学背景;

3)基因-功能关系查询,能够快速查询基因集中哪些基因与特定的功能相关;

4)基因功能富集分析,对基因集进行功能富集分析以及挖掘基因功能模块。

一、单个基因集的一系列分析

首先以它提供的单个基因集为例来进行探究,可以选择以文件或者文本粘贴的方式导入基因集,文件输入除了可以包含基因那列外,其他列可以作为基因的属性,然后选择物种为人类,点击Custom Analysis按钮。

Result 1ID转换,适用于目前很多生物学资源库以及一些表达谱以Entrez ID为基因标识符。

绿色的列是输入文件自带的基因属性,黄色列为转化后的结果,小漏斗表示可以对相关的属性进行筛选。

Result 2:基因注释,适用于批量注释基因集的多种生物学信息,根据基因描述,基因的功能,亚细胞定位,基因型/表型/疾病,组织表达,药物相关信息快速锁定以及筛选一些符合条件的基因作为候选基因进行后续分析。

勾选想要给基因注释的信息后,点击Apply按钮,可以得到基因相应的注释,如基因名字,描述,总结,参与的生物学过程等等。

Result 3:基因-功能关系查询,适用于只想要知道哪些基因参与了特定的生物学功能(不一定需要输入基因集与功能基因集显著富集) 

输入你关注的功能,然后点击search,下面会出现该功能相应的GO term,勾选你想要的GO term,然后点击Apply,然后发现基因注释的最后一列出现标红的列,则展示的是该基因是否与特定的功能相关。

Result 4:基因功能富集分析,该工具的核心内容,识别基因集在通路以及通路关系上的富集分析结果(综合GO的层级结构以及不同资源间的功能相似性,识别非冗余的代表性结果),以及基于MCODE在蛋白质-蛋白质互作网络挖掘功能基因模块来阐明控制生物学过程的生化复合物或信号转导成分。

勾选相应的功能注释信息,并设置相应的参数。

1)功能富集分析结果

条形图展示的富集到的功能模块及其相应的p值;网络图展示的是Go term 相似性网络,展示的是功能cluster之间以及内部的关联,左图颜色代表功能富集cluster,右图颜色代表显著性p值。比较感人的是还提供了cytoscape 可以编辑修改的格式.cys,可以后期自己进行相应的修改。

2)PPI功能模块富集分析

左图是基因在蛋白质-蛋白质互作网络中的分布,右图则是使用MCODE识别到的3个基因功能模块。

二、多个基因集的一系列分析

还是以其提供的多基因集合为例进行输入,选择物种是人类,点击Custom Analysis

由于多基因集的分析步骤以及参数选择与单基因集的分析类似,接下来则直接展示分析结果。

Result 1ID 转换

左图展示的是三个基因集合之间的交集情况,右图则是三个基因集中的基因的ID转换结果

Result 2:基因注释

Result 3:基因-功能查询分析

左图表示的是这三个基因集整体与“invasion”功能间的关系,以及右图展示的是三个基因集中单个基因与“invasion”之间的关系。

Result 4:功能富集分析,多基因集功能富集的荟萃分析或比较分析能够帮助解读这些基因集在通路或者功能上的异同,以及哪些基因贡献于基因集间共有的功能,哪些基因贡献于该基因集特有的功能。

1)条形图展示富集的功能,分别提供了top20与top100的结果

2)三个基因集之间共享的基因与功能 term(左为共享基因,右为共享功能term)

3)三个基因集所有富集到的功能term 之间的相似性

4)三个基因集对功能 term的贡献性不同的颜色代表不同的基因集

5)三个基因集在蛋白质-蛋白质互作网络上的功能模块(不同的颜色代表不同的基因集)

由于其功能模块较多,这里不对其功能模块的具体功能描述进行展示.

总结

Metascape除了常用的单基因集的功能富集分析外,例如差异表达基因、药物相关反应基因等;多基因集的功能富集分析还支持不同基因集间的功能以及模块的比较分析,例如探究不同药物的作用机制是否存在相同的功能影响用于药物重定位、不同基因敲除下差异表达基因间的功能比较分析来探究敲除基因间的功能联系、免疫治疗或者靶向治疗应答signature间的功能互补性可用来开发预测的组合signature或者指导组合治疗策略等多种生物学问题。整体功能富集分析的结果比较美观完善,而且其所有产出图片都能进行AI以及cytoscape的二次加工。当然还存在一些其他的图片以及结果表格,感兴趣的小伙伴们可以自行探索哟~

工具介绍

细胞-细胞通讯分析工具-CellChat

2021-9-30 11:58:39

工具介绍

HISNAPI 预测蛋白质-核酸界面热点残基动态分析

2021-9-30 12:05:48

声明 本网站部分文章源于互联网,出于传递更多信息和学习之目的转载,并不保证内容正确或赞同其观点。
如转载稿涉及失效、版权等问题,请立即联系管理员;我们会予以修改、删除相关文章,请留言反馈
Notice: When your legal rights are being violated, please send an email to: [email protected]
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索