提起铁死亡这一热点,各位科研er如雷贯耳。在申请国自然和其他基金项目,有了它“中奖率”都会提高。那有没有可以供我们参考的思路呢?安排,今天为各位医学童鞋解读2021年5月最新发表在Frontiers in Molecular Biosciences(IF=4.188)期刊上的文章。使用公共数据库与临床相结合,构建出对膀胱癌总体存活率具有预测价值的铁死亡相关基因的特征并进行外部验证。快来看起来,搭上铁死亡的东风,来一篇高分paper!
题目:Construction and External Validation of a Ferroptosis-Related Gene Signature of Predictive Value for the Overall Survival in Bladder Cancer
对膀胱癌总体存活率具有预测价值的铁死亡相关基因特征的构建和外部验证
摘要
目的:本研究确定铁死亡相关基因是否在膀胱癌患者中发挥预测作用,并发现铁死亡相关基因特征以预测总体生存结果。
方法:从GEO数据库下载了256个膀胱样本(188个膀胱肿瘤和68个非肿瘤样本)和TCGA数据库中的430个膀胱样本(411个膀胱肿瘤和19个非肿瘤样本)的mRNA表达文件和临床数据。通过GEO队列中的最小绝对收缩和选择算子Cox回归分析构建了基于预后铁死亡相关基因的多基因特征;TCGA队列用于验证铁死亡相关基因特征;功能富集分析,包括KEGG和GO分析,以阐明特征背后的机制。本研究还分析了高危组和低危组之间16种免疫细胞的ssGSEA评分和13种免疫相关通路活动。
结果:本研究发现33个 (67.3%) 铁死亡相关基因在GEO队列中的膀胱肿瘤样本和非肿瘤样本之间差异表达。预后铁死亡相关基因和差异表达基因的交叉确定了四个预后靶点,即ALOX5、FANCD2、HMGCR和FADS2。Cox回归成功构建了4基因特征模型:风险评分值=esum(每个基因的归一化表达*每个基因的系数)。在GEO和TCGA队列中进行了单变量和多变量Cox回归分析,以测试4基因风险特征的独立预后价值。GEO队列中的多变量Cox回归分析将年龄(p<0.001)、等级(p=0.129)和风险评分(p=0.016)确定为总生存期的独立预后预测因子。TCGA队列中的多变量Cox回归分析还将年龄(p=0.002)、分期(p<0.001)和风险评分(p =0.006)确定为总生存期的独立预后预测因子。在GEO和TCGA队列的高风险组中,II型IFN反应被确定为显着减弱。
结论:作者成功构建出对膀胱癌具有显着预测价值的铁死亡相关基因特征。这些结果为未来膀胱癌的靶向治疗提供了一个新的研究方向。

1. 数据的获取和整理
从GEO数据库和TCGA数据库分别下载256个样本和430个样本的mRNA转录组表达数据。GEO队列被设计为试验队列,TCGA队列被设计为验证队列。对于GEO队列,有68个非肿瘤样本、23个没有相应临床信息的肿瘤样本和165个具有可用临床信息的肿瘤样本。值得注意的是,下载的GEO队列的肿瘤样本探针和非肿瘤探针不同,在DEG分析中包括在肿瘤样本和非肿瘤样本中鉴定的49个(81.7%)铁死亡相关基因。总共在165个膀胱肿瘤样本探针中鉴定了54个(90%)铁死亡相关基因,并进一步包括在单变量Cox回归中以选择预后铁死亡相关基因。对于TCGA队列,有19个非肿瘤样本、404个具有可用临床数据的肿瘤样本和7个没有相应临床数据的肿瘤样本。考虑到本研究中使用的TCGA队列的基因探针矩阵,400个具有临床信息的膀胱肿瘤样本提供了靶基因,这些样本进一步用于验证当前的特征模型。所有详细的患者特征总结在表1中。
2. 基因表达综合队列中差异表达基因和预后铁死亡相关基因的鉴定
在GEO队列的DEG分析中,膀胱肿瘤样本和非肿瘤样本之间共有33个(67.3%)铁死亡相关基因显着不同。预后铁死亡相关基因和DEG的交叉点确定了四种预后DEG,包括 ALOX5、FANCD2、HMGCR和FADS2。热图显示了肿瘤和非肿瘤样本之间四种基因的详细表达模式(图3B)。此外,四种基因之间的相互作用网络和表达相关性(图3C、D)。
3. 铁死亡相关基因特征的开发和外部验证
通过LASSO Cox回归分析对上述4个基因进行分析,建立预后模型。LASSO Cox回归成功鉴定了4基因特征,结果见表2。单变量Cox分析表明ALOX5的高表达与较好的预后相关,而FANCD2、HMGCR和FADS2的高表达与较差的预后相关。具体计算公式如下:risk score value=e(1.882* expression value of FANCD2+2.661* expression value of HMGCR+1.573* expression value of FADS2–1.835* expression value of ALOX5)。GEO和TCGA队列不同风险组的患者特征,如表3所示。在GEO队列中,发现高风险组与较高的肿瘤等级(p<0.01)和年龄较大(p=0.05)有显着相关性。在TCGA队列中,还发现高风险组与较高的肿瘤分级显着相关(p=0.027)。GEO和TCGA队列中的PCA和t-SNE分析,如图4所示。GEO队列中具有不同风险组的患者分布在不同的方向(图4A、B);TCGA队列中具有不同风险组的患者分布在两个不同的方向(图 4C、D)。两个风险组在PCA和t-SNE分析中几乎没有交叉,表明使用上述4个基因标签的可行性。“神经元”亚型的风险评分也显着高于“基础”亚型(图5)。此外,进一步分析了GEO和TCGA队列中的Kaplan-Meier 曲线。Kaplan-Meier曲线表明,在GEO队列中,高风险组的生存结果比低风险组更差(p=0.01),(图6A)。在TCGA队列中也发现了高风险组的生存结果明显更差(p=0.039),(图6B)。
4. 试验和验证队列中标签的独立预后价值
为了进一步验证4基因铁死亡特征的独立预后价值,在GEO和TCGA队列中进行了单变量和多变量Cox回归分析。对于GEO队列,单变量Cox回归分析将年龄(p<0.001)、等级(p<0.001)和风险评分(p<0.001)确定为OS的预后因素(图7A)。多变量Cox 回归分析仅将年龄(p< 0.001)和风险评分(p=0.016)确定为OS的独立预后预测因子(图7B)。值得注意的是,对于TCGA 队列,单变量Cox回归分析将年龄(p<0.001)、阶段(p<0.001)和风险评分(p=0.002)确定为OS的预后因素(图8A)。多变量Cox回归分析还将年龄(p= 0.002)、阶段(p<0.001)和风险评分(p=0.006)确定为OS的独立预后预测因子(图8B)。
5. 试验和验证队列中的功能分析
为了进一步探索膀胱癌过程中与铁死亡相关基因相关的机制途径或生物学功能,在高危组和低危组之间进行了DEG分析。总共在GEO队列中的高风险和低风险组之间确定了132个DEG。DEG的分布基因热图 (图9A)和火山图 (图9B) (p<0.05) 。在TCGA队列中的高风险组和低风险组之间共确定了497个DEG。将上述高危组和低危组之间的所有DEG进一步用于GO富集和KEGG通路分析。TCGA队列的GO富集分析由条形图(图 10A)和气泡图(图10B)。GEO队列的GO结果也由条形图(图10C)和气泡图(图10D)。本研究发现许多免疫相关通路和氧化酶复合反应相关的基因TCGA队列中显着丰富(p<0.05,图10A、B)。许多核生物过程或分子功能的基因在GEO队列中显着丰富(p<0.05,图10C、D)。KEGG分析还表明,TCGA队列风险组中的DEG在各种免疫相关生物学过程中显着富集,包括原发性免疫缺陷、细胞因子-细胞因子受体相互作用、病毒蛋白与细胞因子和细胞因子受体的相互作用以及人类T细胞白血病病毒1感染(p < 0.05,图11A、B)。GEO队列风险组中的DEG在细胞衰老、人类T细胞白血病病毒1感染等中显着富集(p<0.05,图11C、D)。值得注意的是,对TCGA和GEO队列的KEGG 分析确定了各种类似富集的生物过程,包括人类T细胞白血病病毒1型感染、脂肪酸代谢和不饱和脂肪酸的生物合成(图11)。
6. 单样本基因集富集分析
考虑到各种丰富的免疫相关通路,作者进一步探讨了免疫通路与不同风险评分之间的关系。在本研究中详细量化了GEO队列和TCGA队列的许多免疫细胞的富集评分以及相应的免疫功能和途径与ssGSEA。与TCGA队列中的低风险组相比,高风险组的B细胞、DC、iDC、肥大细胞、中性粒细胞、NK细胞、pDC、T辅助细胞和 Th2细胞得分较低(p<0.01 ,图12A)。发现包括APC抑制、APC刺激、CCR、检查点、T细胞抑制、T细胞刺激、1型IFN反应和2 型IFN反应在内的各种抗原呈递过程在高危组中较弱(p<0.01 ,图12B)。
还发现各种抗原呈递过程成分,包括aDC、肥大细胞、T辅助细胞、Th2细胞和2型IFN 反应,在风险组中也有显着差异(p<0.05,图12C、D)。值得注意的是,在高危组中发现各种免疫相关细胞和生物学过程存在显着差异,这与上述GO富集分析的结果一致。
在本研究中,作者成功地建立了一个铁死亡相关的基因特征来预测膀胱癌患者的总生存期。在试验和验证队列中都已被证明具有显着的预测价值。这表明铁死亡可能在膀胱癌的发生发展中起一定作用,从而为未来膀胱癌的靶向治疗提供了一个新的研究方向。