Mergeomics 疾病相关基因多组学在线分析工具

组学技术揭示了各种与疾病相关的遗传变异、基因、蛋白质和代谢物等。包括基因组学、表观基因组学、转录组学、蛋白质组学和代谢组学在内的多组学数据快速增长。如何整合不同类型数据更加整体系统地解释复杂疾病的发生发展成为一大挑战。

今天要给大家分享的是一篇发表在Nucleic Acids Res(IF: 16.974)上的文章“Mergeomics 2.0: a web server for multi-omics data integration to elucidate disease networks and predict therapeutics”。这篇文章开发了Mergeomics 网络工具,Mergeomics的核心理念是利用系统生物学方法揭示在疾病发生过程中不同分子结构域,细胞类型、组织和器官系统之间的复杂相互作用

研究背景

组学技术的高速发展,多组学数据(GWAS、EWAS、TWAS、PWAS 和 MWAS)的数据量呈指数增长。从系统生物学的角度整合多组织多组学数据理解生物学并揭示隐藏机制已成为研究热点。

研究思路

Mergeomics使用单一组学或多组学数据识别疾病的通路和网络水平上的机制并确定潜在的治疗靶标。

研究结果

MERGEOMICS的核心功能

Mergeomics2.0具有四个核心功能。首先,Mergeomics2.0提供了一个预处理工具,即标志物依赖过滤器 (Marker Dependency Filtering:MDF),以消除冗余标志物,例如单核苷酸多态性 (SNP) 之间的连锁不平衡 (LD)。其次,标志物富集分析 (Marker Set Enrichment Analysis:MSEA) 通过组学标志物与功能基因组学、经典途径或共表达网络的富集分析来识别疾病过程。第三,Meta-MSEA在多个数据集上运行 MSEA 并进行通路/网络Meta分析,识别跨数据集的相同疾病过程。第四,关键驱动因素分析 (Key Driver Analysis:KDA) 基于生物网络的拓扑结构确定疾病过程的网络调控。在Mergeomics 2.0 中,PharmOmics功能模块将来自多组学的疾病通路或网络作为输入,与药物特征匹配以预测潜在的治疗药物。

Mergeomics 2.0的模块PharmOmics

PharmOmics是具有物种和组织特异性的基于网络的药物重定位工具。PharmOmics提供两种药物重定位方法:1、基于网络的药物重定位:根据给定基因网络模型中受药物治疗影响的基因与疾病基因特征的连接程度对药物进行排序。2、基于基因重叠的药物重定位:药物基因和疾病基因之间直接重叠的程度。用户的输入仅限于基因或蛋白质,将感兴趣的基因输入到 PharmOmics中进行药物重新定位分析。

核心功能的工作流程

Mergeomics的每个主要功能都可以用作独立的分析工具,也可以组合成一个多步骤的工作流程。如图1所示,用户可以选择四种情况。一、用户输入GWAS数据,并运行MDF,其输出与基因组一起输入MSEA以发现与疾病相关的通路,这些通路可以在KDA中进一步分析,以确定关键调控因子,再使用PharmOmics进行药物重新定位。二、用户输入EWAS、TWAS、PWAS或MWAS数据,这些数据被输入到MSEA,其中MDF过程是可选的。与GWAS过程一样,MSEA的结果可以传送到KDA或PharmOmics。三、用户输入多个组学数据集,利用Meta-MSEA在每个数据集上运行 MSEA,然后跨数据集进行meta分析识别一致的生物过程,这些过程可以输入到PharmOmics或KDA。四、输入基因集和感兴趣的网络,可以直接运行KDA,它将提供KD基因和top KD的子网络可视化,并且可以将KD或子网络输入PharmOmics 来预测药物。

过滤相关的标志物

MDF校正组学标志物之间的依赖性,其输出作为MSEA的输入。此预处理步骤最常用于GWAS数据,以校正SNP之间的LD并滤除冗余SNP。MDF 还可以根据功能将SNP与潜在的下游基因联系起来,例如组织特异性eQTL。很少使用MDF校正其他组学标志物之间的依赖性。MDF的输入为:1、关联文件,其数值表示标志物(例如SNP)与疾病关联强度。2、映射文件,(例如SNP被映射到基因),3、标志物依赖文件(例如SNP之间的LD,以去除冗余标志物)。该过程得到的输出作为MSEA的输入。

标志物集富集分析 (MSEA)

MSEA 的输入为来自GWAS的SNP、EWAS的表观遗传位点、TWAS的基因、PWAS的蛋白质或MWAS的代谢物及其疾病关联值,该过程将输入的标志物与功能基因组学、经典途径或共表达网络相结合检索疾病相关的通路和网络。MSEA的输出可以解释为组学信息相关的疾病通路或网络

Meta-MSEA

Meta-MSEA分析允许输入为相同组学类型(例如多个GWAS数据集)或多个组学类型数据集(例如GWAS、EWAS、TWAS),使用每个组学数据集运行MSEA,然后进行meta分析。这种整合揭示了不同组学或同一组学的不同研究之间生物学扰动的一致性和差异性。与单个MSEA产生的结果一样,来自Meta-MSEA的显着相关基因集可用作KDA或 PharmOmics药物重新定位的输入。

关键驱动分析 (KDA)

KDA识别疾病相关通路和网络的重要调控因子,然后使用Cytoscape可视化网络(图 3)。KDs代表基于网络拓扑结构得到的疾病调控基因。KDA可用作MSEA或Meta-MSEA 的后续分析,也可用作使用感兴趣的基因列表和给定网络作为输入的独立分析。用户可以上传选定的疾病基因列表,并选择或上传相关网络来运行KDA,以识别疾病基因在网络中的相互作用以及网络中是否存在调节疾病基因的关键hub节点。

银屑病分析案例

使用公共数据库中银屑病的GWAS(www.ncbi.nlm.nih.gov/gap)和EWAS(GSE31835 和 GSE63315)数据执行Meta-MSEA和随后的KDA以查找银屑病的致病途径和调控因子。

银屑病案例输出结果解析

下图展示的是银屑病案例分析的Meta-MSEA、KDA和PharmOmics 的输出文件。结果文件可从输出表上方网页上的链接下载。(A) 银屑病例的Meta-MSEA输出示例。表格详细说明了每个途径/模块与顶级标志物的关联强度。(B) 银屑病例的KDA输出示例。表格记录了KD 的重要性、它们根据网络拓扑调节的通路/模块,以及局部子网的详细信息,如KD子网基因的数量和与KD子网重叠的通路/模块基因的数量。(C) PharmOmics药物重新定位输出,表格给出了药物特征的数据集来源、差异基因表达分析的方法、药物研究的详细信息以及来自银屑病相关基因与药物特征基因之间重叠度的显着性。

文章结论

Mergeomics Web服务器的开发大大降低了生物学家以数据驱动的方式理解生物学并揭示疾病隐藏机制的难度,使更多研究人员能够深入研究多组学系统生物学。

文章亮点

1、网络服务器继续积极整合最新的公共资源,包括多组学关联数据、功能基因组学数据,如 eQTL或蛋白质 QTL (pQTL)、基于知识的通路、基因共表达网络

2、该工具将包括单细胞网络,以便了解给定细胞类型内或细胞类型之间的基因调控联系,以更高分辨率识别疾病发病机制和分子机制

工具介绍

scTIME 泛癌的角度来刻画肿瘤免疫微环境的共性以及肿瘤类型的特异性

2021-9-30 12:07:41

工具介绍

KOBAS功能分析工具 GO和KEGG富集

2021-9-30 12:10:44

声明 本网站部分文章源于互联网,出于传递更多信息和学习之目的转载,并不保证内容正确或赞同其观点。
如转载稿涉及失效、版权等问题,请立即联系管理员;我们会予以修改、删除相关文章,请留言反馈
Notice: When your legal rights are being violated, please send an email to: [email protected]
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索