1. sci666首页
  2. 文献解读

文献解读:表观遗传结合转录组学在早期肺癌中的纯生信研究

今天文献解读的是一篇2020年2月发表在Chest上的文章,影响因子9.657。

题目:Independent Validation of Early-Stage NSCLC Prognostic Scores Incorporating Epigenetic and Transcriptional Biomarkers With Gene-Gene Interactions and Main Effects

结合基因-基因互作和主要作用的表观遗传和转录生物标志物的识别及对早期NSCLC预后评分的独立验证

摘要

背景: DNA甲基化和基因表达有望成为包括非小细胞肺癌(NSCLC)在内的多种癌症的生物标志物。除了生物标志物的主要作用外,复杂疾病的进展还受到基因-基因(GxG)相互作用的影响。使用多组学数据基于主要作用或相互作用筛选生物标志物可提高癌症预后的准确性。

方法:生物标志物筛选和模型验证用于构建和验证预后预测模型。根据NSCLC预后相关的生物标志物的主要作用或与两种组学数据的相互作用来鉴定其相关性。并验证了结合表观遗传和转录生物标志物以及临床信息的预后评分。

结果:具有基因-基因相互作用的26对生物标志物和2个具有主要作用的生物标志物与NSCLC生存率显著相关。在TCGA数据集中,与仅利用临床信息的模型相比,以表观遗传和转录生物标记为基础的3年和5年生存预后模型的准确性提高了35.38%和34.85%,对NSCLC的生存具有更好的预测能力。基因-基因相互作用分别为3年和5年生存率的预测准确度贡献了65.2%和91.3%的增长。

结论:整合主要作用和基因-基因相互作用的表观遗传和转录生物标志物的整合显著改善了早期NSCLC生存的预后预测。

方法和结果概述

文章整体方法流程图如下图所示:

文献解读:表观遗传结合转录组学在早期肺癌中的纯生信研究
通过质量控制,分析选取了1230个样本(613个训练集和617个检验集),包括12806个CpG位点和719个基因。

对于DNA甲基化和基因表达的主要作用分析,通过ISIS LASSO分别选择了23个CpG位点和13个基因。但是,只有cg19286631 显著。同样,在验证阶段和敏感性分析中,仅位于NDRG1基因中的一个基因探针很显著。

对于基因-基因相互作用分析,作者分别从表观遗传和转录分析中观察到2495和40基因-基因相互作用。最后,在验证阶段149和2个基因-基因相互作用在敏感性分析中是显著的。

通过进行逐步回归分析,作者在多生物标志物模型中发现了一个具有主要作用的CpG探针和25对具有基因-基因相互作用的CpG探针,用于计算表观遗传分数。一个具有主要作用的基因探针和一对具有基因-基因相互作用的基因探针用于计算转录分数。调整协变量后,在验证阶段会确认生存率与表观遗传得分,转录得分,预后得分,整合得分之间的关联。

为了评估这些得分的区分能力,分别根据表观遗传得分,转录得分,综合得分和预后得分的三分位数,将验证阶段的样本分为低,中和高得分组。与表观遗传低得分组相比,中得分和高得分组分别具有4.39和21.24倍的死亡风险,如下图A所示。转录评分高的患者的生存率显着降低,如下图B所示。具有不同综合评分的患者之间具有显著的生存差异,如下图C所示。此外,如果结合年龄,性别,研究中心,临床阶段和吸烟状况等临床信息,则预后评分可明显地区分NSCLC生存率,如下图D所示。通过得分的五分位数对患者进行分类,进一步说明了预后得分的区分能力。下图E、F表现出一种有序关系:高五分位数组的患者3年和5年生存率较低,中位生存时间较短。这表明可以使用此评分系统来检测死亡率较高的患者。
文献解读:表观遗传结合转录组学在早期肺癌中的纯生信研究

经协变量分层的分析进一步证实了预后评分的表现,如下图所示:

文献解读:表观遗传结合转录组学在早期肺癌中的纯生信研究

然后,作者独立验证了这些生物标志物的预测能力。发现仅具有临床信息的模型的预测能力非常有限。但是,通过添加具有主要作用或基因-基因间相互作用的生物标志物,分别增加了35.38%和34.85%3年和5年生存,并且对NSCLC生存期显示出超强的预测能力。基因-基因间相互作用对3年预测的准确率提高了65.2%,对5年预测的准确率提高了91.3%,如下图所示:

文献解读:表观遗传结合转录组学在早期肺癌中的纯生信研究

作为敏感性分析,我们使用两个不同的阈值(P = 0.10和0.15)重新分析了逐步回归,发现大多数选择的生物标志物与原始回归模型中的相同。另外,作者发现预后模型在LUAD(AUC3-year = 0.91,AUC5-year = 0.89和Cindex = 0.82,95%CI:0.76-0.87)和LUSC(AUC3-year = 0.85,AUC5-year = 0.87和 Cindex = 0.82,95%CI:0.76-0.88)人群,表明所选生物标志物及其相互作用在预测LUAD和LUSC患者预后方面的有效性。在独立的TCGA数据中,预后评分的Cindex也有较好的预测准确性。

在蛋白质分析中,TCGA中四个基因中的三个具有基因表达和蛋白质表达之间的显著相关性。此外,一个具有主要作用的基因和四对具有基因-基因相互作用的基因对LUAD存活率有显著影响。在表观遗传学分析中识别出的49个基因中,有5个基因(FOXP1,AFF3,BCL6,MAPK1和STAT3)被确定为连接度最高(度大于25)的枢纽基因。这49个基因富集在与癌症相关的通路,包括非小细胞肺癌通路中。如下图所示:
文献解读:表观遗传结合转录组学在早期肺癌中的纯生信研究

 

本文整合主要作用和基因-基因相互作用的表观遗传数据和转录组数据,使用较新颖的方法识别了生物标志物并验证其对非小细胞肺癌预后的预测作用,值得我们学习。

参考文献:Zhang R, Chen C, Dong X, Shen S, Lai L, He J, et al. Independent validation of early-stage NSCLC prognostic scores incorporating epigenetic and transcriptional biomarkers with gene-gene interactions and main effects. Chest. 2020;2(27).

这些可能会帮助到你: 问答社区 | 共享百度SVIP | 留言建议

欢迎入群交流:生信分析群: 732179952 · Meta分析群: 797345521

发表评论

登录后才能评论