“Development and validation of a hypoxia-immune-based microenvironment gene signature for risk stratification in gastric cancer”
识别和验证与缺氧免疫微环境相关gene signature来预测胃癌患者生存状态
发表时间:2020 May 14
影响因子:4.29
Doi: 10.1186/s12967-020-02366-0.
流程图
研究背景
胃癌是一种常见的癌症,并且是全球范围内死亡率较高的癌症之一,可以通过WHO对其进行分类和肿瘤淋巴结转移(TNM)分期系统来判断临床病理特征。胃癌是一种异质性疾病,这样的结果即使具有类似的临床特征患者,治疗方案也会有不同。
研究表明,胃癌组织是高度异质的,其中恶性细胞与肿瘤微环境,包括免疫细胞,血管和成纤维细胞的关系是错综复杂的。有报告之处,缺氧是肿瘤的特征标志之一,可直接导致癌症恶化,包括肿瘤的进展,侵袭和转移等等,同时,免疫细胞能够预防或减缓肿瘤的生长,其与肿瘤侵袭和转移息息相关。在这篇文章中,作者推测免疫和低氧相互作用可以预测胃癌患者的预后。所以作者基于低氧免疫相关的基因开发了一个gene signature来预测患者的预后情况。
材料与方法
1.数据来源
———-
训练集:GSE84437包含357名胃癌患者的临床信息
验证集:来自TCGA数据库321名胃癌患者的临床信息、ACRG:GSE66229包含300名胃癌患者的临床信息、CHEM :E15459包含136名经过化疗胃癌患者的临床信息,共三个外部独立的外部验证集
特征基因集:200个与缺氧相关的基因集来源于MsigDB数据库。
结果展示
1.筛选胃癌患者中属于缺氧状态的患者并提取与缺氧相关的差异基因(DEGs)
———-
基于200个缺氧相关的基因,使用t-SNE将训练集聚成三类,分别是Cluster1、Cluster2与Cluster3中含有的样本分别是120、107与130名(图1A)。然后对三类患者进行生存分析,结果显示三类患者的预后存在显著差异,C3预后最好,C1预后最差,将其定义为hypoxiahigh 和 hypoxialow (图1B)。接下来分析hypoxiahigh 和 hypoxialow使两种状态与KEGG HIF-1信号通路的靶基因中的Increase oxygen delivery包含(15 genes) 和Reduce oxygen consumption包含(13 genes)两个子基因集的关系。结果显示在Increase oxygen delivery子基因集中有11基因在hypoxiahigh组中过度表达,在Reduce oxygen consumption有8个hypoxiahigh组中过度表达(图1C)。最后在hypoxiahigh 和 hypoxialow共筛选到371个与缺氧相关的基因,并且在这些差异基因中有368个基因表达量上调,对应患者的预后有较差,说明这些基因是危险基因,反之下调基因为保护基因(图1D)。
2.鉴定胃癌患者的免疫状态并免疫状态相关DEGs
———-
使用ESTIMATE算法计算胃癌患者免疫细胞评分与基质细胞评分,在所有的患者中,免疫评分的范围为-145到2910.8之间,根据免疫评分最大选择秩统计量将患者分为高免疫组与低免疫组(图1E-F),且高免疫组患者的生存状态要高于低免疫组(图1G)。通过比较高低免疫组之间基因的差异表达,共筛选到216个与免疫相关的DEGs(图1H),其中209个基因在高免疫组高表达,7个基因在低免疫组中高表达,说明大多数与免疫相关的DEGs为保护基因。
3.在胃癌患者中鉴别保护性DEGs与危险性DEGs
———-
结合缺氧状态和免疫状态将患者分为三组分别是hypoxialow/immunehigh、 hypoxiahigh/immunelow和二者混合组.对生存分析显示三组的生存状态存在显著差异(p<0.001,图2A),hypoxialow/immunehigh患者生存情况最好,hypoxiahigh/immunelow患者生存情况最差。这说明了缺氧与免疫对胃癌患者的预后呈负相关。进一步在hypoxialow/immunehigh和hypoxiahigh/immunelow组之间筛选差异基因,共得到102个与缺氧免疫相关的DEGs(图2B),其中30个基因在hypoxialow/immunehigh组中高表达,患者预后好,72个在hypoxiahigh/immunelow组中高表达,患者预后差。说明与缺氧免疫相关的差异基因为危险因素。
然后,将低氧相关的DEGs和免疫相关的DEGs与缺氧免疫相关的DEGs取交集定义为保护性DEGs和风险性DEGs,保护性DEGs在hypoxialow/immunehigh组、 hypoxialow组和immunehigh组均高表达。危险性DEGs在hypoxiahigh/immunelow组、hypoxiahigh和immunelow 组均高表达。通过上面定义的方法,在训练集中共得到29个保护性DEG(图2C)和66个风险性DEG(图2D)。进一步,对这些基因进行GO功能注释,结果显示保护性DGEs参与免疫细胞活化、免疫细胞迁移和炎症因子释放等通路(图2E),危险性DEGs参与细胞骨架、细胞连接和上皮间质转化途径等通路(图2F)。
4.基于保护性DEGs与危险性DEGs鉴别与胃癌预后相关的gene signature
———-
将上面定义的保护性DEGs和风险性DEGs,在训练集中使用单因素cox回归分析,共得到39个对预后显著(p<0.0001)影响的基因,其中7个为保护基因(HR>0.2),32个为危险基因(HR>0.2,图3A)。进一步使用lasso cox回归,确定了3个基因模型来预测患者的生存情况(图3B-C),其中TAGLIN和PPP1R14A是危险基因,CXCR6是保护基因,并使用多因素回归分析,构建了一个评分公式: risk score = − 0.059 ×CXCR6 + 0.011 × PPP1R14A + 0.016 × TAGLN。根据上面的评分公式,通过最大选择秩统计量的方法确定阈值(图3D),基于这个阈值将患者分为高低风险两组,生存分析显著,低风险组患者的生产率显著高于高风险组(图3F),最后分析了风险得分、患者生存状态与基因表达的关系(图3E)。
5.gene signature对临床信息的预测能力
———-
基于风险得分,对 stage II 和stage III患者的生存状态进行预测,结果显示,3个genes构建的风险模型得分分别将stage II 和stage III患者分为高低风险两组,且两组之间患者的生存状态存在显著差异(图4A-B)。然后,对高风险组与低风险组的临床信息log-rank检验,结果显示除了性别和年龄之外,其他临床变量在高低风险组均存在显著差异。进一步,在训练集携带的临床信息中,使用单因素和多因素cox分析每个临床变量对患者生存状态的影响,并将临床因素和风险得分一起构建列线图来对患者的存活率进行预测(图4C),并用碎石图和决策曲线对列线图的预测性能进行评估(4图D-E)。
6.外部数据集验证风险模型的鲁棒性
———-
使用TCGA,ACRG和CHEM三个独立外部数据集对三个基因风险模型进行验证,得到与训练集类型的结果。首先,使用三个基因模型对三个外部验证集中的os进行预测,结果显示,三个数据集都能别风险得分分为高低风险两组,并且两组之间患者的生存状态存在的显著差异(图5),进一步分别对TCGA和ACRG验证集中stage II 和stage III患者的生存状态进行预测,结果显示风险模型能显著地将两个数据集中stage II 和stage III患者患者分为高低风险两组。而在CHEM数据集中,使用风险模型能显著(p=0.014)地将化疗患者分为高低风险两组, 而不能将没有化疗的患者分为高低风险两组(p=0.083)。其次,使用风险模型对三个外部集中的DFS进行预测,得到与OS类似的结果(图6)。
总结
作者基于与缺氧免疫相关的基因,将胃癌分为三个亚型,基于hypoxiahigh/immunelow组、hypoxiahigh和immunelow 组之间的差异基因用单因素cox回归分析和lasso cox分析构建了3个gene signature来预测胃癌患者的生存状况,并在三套外部数据中得到验证
结果图
图1 筛选与低氧状态相关免疫状态相关的DEGs
图2.筛选与hypoxia-immune-related相关的DEGs
图3. 构建基于Hypoxia-immune gene signature 和预测患者预后生存状态
图4. gene signature对TNM分期患者的预测情况和nomogram预测训练集患者总生存期
图5 基因风险模型对三个外部验证集中患者OS的预测情况