科研日常问题:我有一张基因/蛋白列表,想知道富集在什么通路上,如何做?
其实,答案很简单,无需敲代码,只要通过简单的复制粘贴还有点两下鼠标,就能轻松实现。
而这就涉及到了今天要分享的一个神仙网站——Enrichr,网址:http://amp.pharm.mssm.edu/Enrichr/。
Enrichr数据库是一个综合性的基因富集分析在线工具,包含了大量可用于分析和下载的基因组注释库,如Transcription(转录)、Pathways(通路)、Ontologies(GO)、Diseases/Drugs(疾病/药物)、Cell types(细胞类型)等。
该数据库的输出结果包括结果表格和多种可视化的结果,如柱状图、Grid网格图、网络图和聚类热图,可用于文章中展示。

Enrichr的界面非常清爽,只需要你把基因/蛋白列表贴进去然后点submit就完事了。其实,该网站支持BED格式和基因列表两种输入文件,分析时只需要输入一种即可。
选择上传BED文件至服务器后,需要在选择后文件对应的物种和基因组版本,目前支持人类基因组hg18,hg19,hg38和小鼠基因组mm9,mm10。
关于BED格式,可以参考下图右侧的BED格式的参考链接。

以官网提供的示例数据为例,点击Submit提交任务到Enrichr服务器中。

在结果页面的最上栏,选择自己感兴趣的分类。Transcroption下包含有很多条目,可以将鼠标放置在小“i”符号上查看该条目的详细信息。点击条目名称,可以打开新的网页查看详细的富集结果和可视化图形。

以ChEA 2016为例,点击“ChEA 2016”,打开页面。Enrichr提供了五种形式来展现富集分析的结果,包括Bar Graph、Table、Grid、Network和Clustergram。
需要注意的是,不是所有结果都包含Grid和Network,但一般都会有Bar Graph、Table和Clustergram。
1.Bar Graph

2.Table

3.Grid

4.Network

5.Clustergram
