如何从芯片数据中挖(找)出想要的基因?

从GEO数据库,ArrayExpress数据库以及TCGA数据中获取芯片数据并从中筛选基因的流程我们已经介绍了很多,但是不知童鞋们是否有这样的困惑——筛选出来的基因数量过多?一张PPI网络图做出来三四百个基因,电脑直接就报警了!KEGG分析出来全是Cancer pathway,cell cycle这样的可能包含上百个基因的信号通路,进一步研究根本无从着手。今天就教大家几招如何进一步筛选基因,“ 刨”出我们想要的基因。

调整芯片数据差异基因筛选标准

一般我们筛选差异基因的标准是p-value<0.05和FC的绝对值>2,如果你做的是癌和癌旁组织的芯片数据分析,那么可以预见到的是,你将筛出好几千个基因,接下来不论是做GO和KEGG分析,还是做PPI网络分析都无法得到什么有效的结果。这里大家可以使用q-value<0.05以及提高FC的阈值来减少基因数量。

KEGG模块分析

利用Cytoscape的App——ClueGO对差异基因进行分析,它可以对差异基因相关的KEGG信号通路进行模块分组,比如下图中Bladder cancer这一模块就包含了多个信号通路(淡蓝色)。接下来再进行PPI分析,从网络中筛选出拓扑结构处于中心位置的基因。

PPI网络筛选

先做PPI网络,在STRING中上调阈值,去除网络中孤立节点,然后再进行功能分析。

 

PPI网络模块分析

PPI网络中往往很多蛋白扎堆存在,Cytoscape中的MCODE插件可以将这些复杂的小团体从整个网络中抽提出来,接下来再单独进行功能分析。

 

 

最后祝大家新年愉快!科研休息两不误!

生物信息学

利用R语言做韦恩图(Venn图)

2020-1-10 22:20:54

生物信息学

NGS可变剪切之STAR+rmats软件使用

2020-1-17 0:45:56

声明 本网站部分文章源于互联网,出于传递更多信息和学习之目的转载,并不保证内容正确或赞同其观点。
如转载稿涉及失效、版权等问题,请立即联系管理员;我们会予以修改、删除相关文章,请留言反馈
Notice: When your legal rights are being violated, please send an email to: [email protected]
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索