文献解读:高分纯生信分析自噬预后模型文章

今天我们分享的是12月份发表在AgingIF=5.5)上的一篇纯生信文章。这篇文章主要研究的是自噬相关基因在非小细胞肺癌中的预后意义。对于自噬的研究近来一直比较火热,但关于自噬基因的生信分析还不算多,今天介绍的自噬基因这种生信分析加预后模型也就2019年发了两篇,都在3分之上。所以自噬相关分析可研究范围十分广阔,心动的话快跟着解读一起了解具体分析套路吧。

首先,我们先简要了解一下细胞自噬。自噬(autophagy)是将细胞内受损、变性或衰老的蛋白质以及细胞器运输到溶酶体进行消化降解的过程。自噬在肿瘤中扮演着双面角色,正常生理情况下,细胞自噬利于细胞保持自稳状态,细胞自噬还可以防止致癌的损伤蛋白质和细胞器的累积,抑制细胞癌变。然而肿瘤一旦形成,细胞自噬为癌细胞提供更丰富的营养,促进肿瘤生长。

这篇文章首先获取了非小细胞肺癌中的自噬相关基因,而后进行COX分析挑选与预后密切相关的基因构建风险评分模型。下一步将风险评分也作为一个变量与其他临床变量(如年龄、性别、分期)再次进行COX分析以证实风险评分可以单独作为影响患者预后的因素,而后进行预后和ROC分析验证模型的可信度。接下来,作者进行了基因的功能分析,包括GOKEGGGSEA分析。为了进一步验证风险模型的效度,作者又在GEO数据库中挑选数据集进行了生存分析和ROC分析。最后,作者绘制了列线图整合多种危险因素来定量确定患者个人在临床环境中的风险。

下面我们就进入正文,逐步拆解这篇文章。

1

获取数据

作者首先从TCGA数据库中下载了非小细胞肺癌的基因表达量和临床病理相关数据。接着从GeneCards数据库中获取了自噬相关基因。

2

通过COX分析筛选自噬基因构建肺癌预后相关模型

这一步中,作者首先通过单因素COX回归筛选出与预后相关的基因,而后将这些基因进行LASSO分析,最终在肺腺癌中选定22个基因构建COX模型(图1A),在肺鳞癌中选定11个基因构建模型(图1B)。图1CD展示了这些基因在癌症组织和正常组织中的表达情况。

图 1

3

展示预后相关基因和模型

作者展示了两种肺癌模型中预后基因的表达情况,图2A为肺腺癌的热图,图2B为肺鳞癌的热图。图2CD展示了在两种肺癌中按照COX风险模型评分中位值将患者分为高风险组和低风险组。并且随着风险评分增高,死亡的患者也更集中。

图 2

 

4

对风险模型和肺癌临床病理特征进行COX分析

为了验证上文中构建的风险模型能否作为肺癌预后的独立影响因素,作者把预后模型合并临床病理特征(包括年龄、性别、分期、T、NM)进行了单因素和多因素COX回归分析。

图3E、F分别为肺腺癌、鳞癌的单因素COX分析,图4AB分别为肺腺癌、鳞癌的多因素因素COX分析。由于两种肺癌风险模型在单因素和多因素COX分析中P值均小于0.05,可以认为作者构建的模型是肺癌预后的一个独立影响因素。接着作者又对预后模型进行了生存分析,绘制了ROC曲线,进一步体现该模型的预后价值(图5CEG为腺癌,图5DFH为鳞癌)。

图 3

图 4

图 5

5

基因的通路分析

通过上一步的分析,因为在肺腺癌中构建的模型AUC值更大,即有更好的预测性能,于是作者选取了肺腺癌模型中的22个自噬基因。然后以这22个基因为靶在TCGA腺癌数据库中选取了与这些基因关联最密切的50个基因,最后对共计72个基因进行GO分析(图6A)、PPI网络构建(图6B)、KEGG分析(图6C)、GSEA分析(图6D),筛选出基因易富集的通路。

图 6

6

对风险模型进行外部数据集验证

为了进一步验证预测模型,作者从GEO数据库中挑选了四个数据集,首先按照风险模型计算出每个病人的风险评分,然后按照中位数将患者平均分为高风险组和低风险组,进而进行预后分析和ROC 曲线绘制。结果显示风险模型在四个外部数据集中均有较好的预后预测能力,图7为其中两个数据集的验证结果。

图 7

7

列线图的绘制

最后,作者绘制了列线图(nomogram)(图8A),用于整合多种危险因素来定量确定个人在临床环境中的风险。作者通过联合年龄、性别、分期、T分期、N分期、M分期来预测患者的三年和五年的生存率。接着文章展示了在TCGA数据库中患者预测的和真实的生存情况,X轴代表预测的生存率,Y轴代表真实的生存率(图8BC分别为3年、5年的曲线),接着在外部数据库GEO中数据集再次验证(图8DE分别为3年、5年的曲线),结果显示预测的结果与患者真实的预后情况拟合程度较高。

图 8

文章到这里就结束了,总结一下,就是先获取自噬基因进行COX风险模型的构建,而后联合其他临床病理特征进行单因素和多因素COX回归以证实该模型可以作为预后的独立影响因素,而后对模型中的基因进行通路分析,最后在外部数据库中进一步验证该风险模型。当然,加上列线图的绘制及验证文章的结构会更加丰满。

这篇文章的分析算是比较全面了,其实主要分析到风险模型联合其他临床病理特征进行单因素和多因素COX回归就可以构成一篇文章,大家可以根据研究实际情况选择相应的分析步骤,或者把自噬相关基因换成免疫相关基因、miRNA、LncRNA等也可以进行相似的分析。套路有限,变化无限,快快一起学起来!

文献解读

清华大学祁海教授团队研究发现不同性别间体液免疫差异的新机制

2020-1-20 16:49:49

文献解读

文献解读:生信分析筛选基因结合临床验证

2020-1-20 19:21:27

声明 本网站部分文章源于互联网,出于传递更多信息和学习之目的转载,并不保证内容正确或赞同其观点。
如转载稿涉及失效、版权等问题,请立即联系管理员;我们会予以修改、删除相关文章,请留言反馈
Notice: When your legal rights are being violated, please send an email to: [email protected]
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索