简单易懂,事半功倍。
提高接受率,人人国自然!

文献解读:整合MMRC构建了多发性骨髓瘤分子关系网络(M3CN)

之前我们说过,多组学是生物信息学高分的基本标配,90%以上的多组学技术路线都可以达到5分以上。今天我们说的是,多组学也可以做出很多变种,比如以下这篇文献:

多发性骨髓瘤(MM)是一种恶性浆细胞病,是第二常见的血液癌。MM是高度复杂和高异质性的疾病,整合多组学数据去研究MM的发生、发展以及识别药物反应机制对于MM的治疗十分重要。

Liu等人通过整合MMRC(the MultipleMyeloma Research Consortium)中的基因表达谱数据、拷贝数变异数据以及相应的临床数据最终构建了多发性骨髓瘤分子关系网络(M3CN)。本课题具体思想如下(如Fig 1):

1.  他们通过严格的质控校正样本的标签错误,得到较为准确的同时有着基因表达和拷贝数变异数据的配对样本;

2.为了识别分子特征之间的潜在关联和因果关系,Liu等人使用贝叶斯网络算法去整合基因表达和拷贝数数据构建M3CN网络;

3.通过文献检索得到MM相关的预后以及药物反应相关的基因标志物集合,将标志物基因映射到M3CN中去,进而得到更为鲁棒的MM预后相关子网;

4.在数据集中比较M3CN预后子网和已发表的预后signature之间的性能,进而评估预后子网的性能。Liu等人的结果表明,网络方法分析可以更好揭示MM相关的生物学机制。

 

Fig 1. 流程图

2.材料和方法

(1)训练数据:来自MMRC中的基因表达谱数据(n=304,GSE26760)、拷贝数改变数据(n= 254,GSE26849)以及样本相应的临床数据。使用proMODMatcher较正样本标签。

(2)染色体标记基因:XIST是x染色体的标记基因;RPS4Y1是Y染色体的标记基因。

(3)CNVcis调控基因表达:CNV通常发生在染色体较大的区块中,位于这些相同的区块中的基因可能共享相同CNV。由相同的CNV所调控的基因倾向于共表达,通过皮尔逊相关系数寻找这些关系对(fdr<0.01)。

(4)M3CN网络的构建:结合配对的基因以及拷贝数改变数据,采用重构整合的分子贝叶斯网络(RIMBANet)算法构建MM相关的网络,具体构建过程如Fig 2所示。为了提高运算速度,首先,对于每一个基因对,计算其互信息,剔除互信息排在后20%的关系对,从而得到每个基因候选的关系对;然后,通过马尔科夫模型重构网络,该算法给不同的种子,最后得到的网络结构会有所差异,因此,随机1000次,从而得到1000个候选网络结构,最后保留那些后验概率大于0.3的一致网络结构,再删除网络中的循环结构,最后,得到了M3CN网络。

Fig 2. 网络构建。A)不考虑拷贝数改变的网络构建;B)结合拷贝数改变的网络构建。

 

(5)MM预后相关标志物:通过文献挖掘收集(时间截止到2019年8月)得到MM相关的预后标志物,从中筛选出基因数大于15的预后标志物(如Table1所示)。

(6)MM药物相关的标志物:通过文献挖掘收集得到MM药物相关的标志物,这些标志物的包含的基因数范围从42到244个(如Table3所示)。

(7)关键调控因子的识别:将Hose_50、Huiper_92和Shaugnessy_70的预后标志物包含基因作为种子,通过上述网络构建算法,在M3CN去寻找步长为2的子网,如果输入的基因在这个子网中,保留这个子网,基因i作为候选的关键基因。

(8)通路分析:通过PANTHER网页版(版本:14.1,http://www.pantherdb.org/)对基因进行功能分析,卡FDR<0.01。

(9)验证数据集:

从MMRF(https://research.themmrf.org)得到CoMMpass数据集(n= 767),其中,只有648个病人有生存数据,后续只对这648个病人进行分析。

(10)网络可视化:通过Cytoscape3.7软件可视化。

 

3.结果

(1)预后相关的子网:将文献挖掘得到的8个满足基因数大于15的MM预后相关标志物(如Table1所示)映射到RIMBANet构建的M3CN网络中去,最终得到一个预后相关的子网。

Fig 3.预后相关的子网。黄色的点表示Kuiper_92,绿色的点表示Shaughnessy_70,红色的点表示Hose_40genes以及蓝色的点表示其他的预后标志基因。

(2)预后子网基因识别亚型:结合上述预后子网中的基因,分别采用层次聚类和k均值聚类(k)对CoMMpass数据集中的样本进行聚类,对k均值聚类划分的三类样本,通过log rank检验看各类之间OS和RFS生存曲线是否差异(如Fig4所示)。

Fig 4. 预后子网划分亚型。A)层次聚类;B)k均值聚类。红色代表高风险样本组,绿色代表中度风险样本组,蓝色代表低风险样本组;C-D)高中低风险组的log-rank检验图。

(3)预后模型对CoMMpass数据集的评估:将预后网络子网中的基因构建的预后模型与Table 3中的已发表的MM预后模型进行比较,发现预后网络子网基因所构成的预后模型在OS和RFS中的预测性能更好(如Table2所示)。

(4)耐药相关网络的构建:蛋白酶体抑制剂(PIs)和免疫调节剂(IMIDs)的应用,多发性骨髓瘤(MM)预后明显改善,结合Table2中的耐药相关基因标志物,将Zhu_244 和Bhutani_176这两个耐药相关的基因作为种子,映射到网络中,识别耐药相关的子网(如Fig 5所示)。

Fig 5. 耐药相关网络。红色基因来自Zhu_244,绿色来自Bhutani_176,红色的边表示直接和输入的基因连接。

结论:

(1)构建了一个分子因果网络来描述MM中潜在的调控关系网络M3CN;

(2)基于文献挖掘的MM预后相关标志物,最终映射到M3CN中去识别一个更为鲁棒的MM预后相关子网;

(3)MM发病机制复杂,结合网络去分析能更好的解释MM潜在分子机制。

 

参考文献:

Zhu,J.; Zhang, B.; Smith, E.N.; Drees, B.; Brem, R.B.; Kruglyak, L.; Bumgarner,R.E.; Schadt, E.E. Integrating large-scale functional genomic data to dissectthe complexity of yeast regulatory networks. Nat. Genet. 2008,40, 854–861.

除特别注明外,本站所有文章均为SCI666原创,转载请注明出处,谢谢。sci666 » 文献解读:整合MMRC构建了多发性骨髓瘤分子关系网络(M3CN)

分享到: 更多 (0)

评论 抢沙发

  • QQ号
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

SCI666 学习、交流、分享

生信分析交流群综合科研交流群
切换注册

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

切换登录

注册

我们将发送一封验证邮件至你的邮箱, 请正确填写以完成账号注册和激活