文献解读:预测非小细胞肺癌患者的预后以及改善其免疫治疗效果

“Identification of tumor immune infiltration-associated lncRNAs for improving prognosis and immunotherapy response of patients with non-small cell lung cancer”

在非小细胞肺癌患者中鉴别与肿瘤免疫相关的lncRNAs,来预测非小细胞肺癌患者的预后和改善其免疫治疗效果

发表期刊:Journal for immunotherapy of cancer

发表日期:2020 Fed 8

影响因子:10.08

DOI:10.1136/jitc-2019-000110

研究背景

肺癌发病率高,死亡率占所有癌症死亡人数的四分之一。有证据表明非小细胞肺(NSCLC)的微环境中富含与免疫相关的不同类型的免疫细胞,也越来越多地认识到肿瘤浸润免疫细胞的定量分子标记是预后生物标志物。lncRNA作为免疫系统中的关键调控元件,并对不同免疫细胞系的发育和分化中起重要作用。尽管有证据表明,在NSCLC中,长非编码RNA(lncRNA)与免疫调节和肿瘤微环境息息相关相关。

然而,与肿瘤免疫浸润相关的lncRNA在改善临床结果和免疫治疗中的作用仍然没有探索清楚。

在这项研究中,作者意在开发一种新的程序算法,通过对纯化的免疫细胞,癌细胞系和癌组织的表达谱进行综合分析,识别与肿瘤免疫浸润相关的lncRNA(TILncRNA),并对非小细胞肺癌预后进行预测

材料与方法

1. 构建模型的训练集与验证集

———-

数据集筛选条件:样本具有生存时间,生存状态等信息的临床随访信息;芯片注释平台为Affymetrix HG-U133_Plus 2.0或Illumina HiSeq;数据集所含样本数目大于200。通过上述条件共选择了三个数据集,一个来自TCGA,两个来自GEO,样本临床的临床信息如表1所示。

 

表1 训练集与验证集中样本的临床信息统计

2. 获取与细胞免疫相关的基因

———-

从GEO数据库中获取了16个芯片数据,它们的注释平台都为Affymetrix HG-U133_Plus 2.0平台。在这些数据集中提取115个细胞系,它们包含19种免疫细胞类型。并基于之前的研究方法,从这些数据集中获取366个免疫相关基因的表达谱。

3. 芯片数据重注释

———-

从GEO数据库中下载注释平台为Affymetrix HG-U133_Plus 2.0的芯片原始文件,使用R程序包affy对其进行背景矫正,分位数标准化和log2转换转化成表达矩阵。然后对Affymetrix HG-U133_Plus 2.0中的探针进行重注释,获得lncRNA表达谱。最终,获得2466个lncRNA对应3431个探针ID。对于TCGA表达谱直接提取lncRNA表达谱。

4. 获取与肿瘤浸润免疫相关lncRNA signature

———-

作者通过免疫细胞,癌细胞系和大块癌组织进行整合免疫和lncRNA分析,开发了一种新算法(如图1),用于识别与肿瘤浸润相关和免疫相关的lncRNA signature(TILSig)。

 

图1.识别与肿瘤免疫相关lncRNA signature(TILSig)的流程算法

 

5. 统计分析与功能分析

———-

使用R程序包samr筛选差异基因,使用单因素cox回归分析和多因素cox回归分析鉴别与非小细胞肺癌预后相关的TILncRNAs,使用KM曲线和log-rank检验评估非小细胞肺癌的OS与DFS,R包survivalROC用来评估患者的ROC,Kruskal-Wallis检验用于多组间的比较,R程序包GSEA用于富集分析。

结果展示

1. 人免疫细胞中lncRNA的表达情况

———-

首先根据lncRNA的表达水平对每种免疫类型的lncRNAs进行排序,并将表达水平在前5%的lncRNA作为候选免疫相关lncRNAs。结果表明,有91个lncRNA在19种免疫细胞类型中普遍高表达。另外还有117个lncRNA仅在一种免疫细胞中高表达。然后我们计算了208个候选免疫相关lncRNA的组织特异性指标(TSI)得分,目的是展示它们在不同类型的免疫细胞表达的特异性。最后,我们鉴定出9种免疫细胞型特异性 lncRNAs (icsLncRNA) ,它们只在一种类型的免疫细胞中表达,并且具有较高的细胞型特异性得分(score>0.5)。最后。我们还鉴定了57种hklncRNAs ,它们在所有类型的免疫细胞中都高度表达,并且具有较低的细胞类型特异性得分(sore<0.2),说明它们对基本免疫细胞功能至关重要。

2. 识别非小细胞肺癌TILncRNAs

———-

通过上述的分析,选择在免疫细胞中普遍高表达的57个hklncRNA,作者认为这些hklncRNA对维持基本的免疫细胞功能是至关重要的。接下来作者在免疫细胞中和NSCLC细胞中,对这57个hklncRNA进行了差异表达分析,结果显示有17个hklncRNA在免疫细胞中表达上调,在NSCLC细胞中表达下调,说明它们对免疫细胞具有特异性。在非小细胞肺癌中,这17个hklncRNAs称为TILncRNA。

3. 鉴别TILSig

———-

基于上面筛选的17个差异TILncRNAs,使用训练集携带的生存信息,进行单因素cox回归分析,结果显示有7个TILncRNAs(HCG26, PSMB8-AS1, TNRC6C-AS1, CARD8-AS1, HCP5, LOC286437 和 LINC02256)与NSCLC患者的OS显著相关。然后,对训练集进行多因素cox回归分析,并构造了一个由7个与免疫浸润(TILSig)组成的lncRNA评分公式: TILSig=(−0.1323*HCG26)+(−0.2323*PSMB8-AS1)+(0.0009*TNRC6C-AS1)+(0.2472*CARD8-AS1)+(0.1190*HCP5)+(−0.3019−*LOC286437)+(−0.0572*LINC02256).进一步,使用评分公式对训练集的每一个样本进行打分,根据每个样本风险得分是否小于所有样本风险得分的中值0.0429,将样本分为高低风险两组,两组之间患者的生存时间存在显著差异,低风险组患者的生存率要高于高风险组(图2A),并且3年和5年AUC为0.665和0.646(图2B),其中模型中每个lncRNA在样本的表达情况、样本存活状态与样本风险值的关系如(图2C)。最后在高低风险两组样本中使用GSVA评估了风险得分与免疫浸润的关系,结果显示,低风险组的患者富集了10个免疫亚群,而高风险组只有富集了4个免疫亚群。这说明TILSig评分越高,免疫细胞浸润越少,预后越差;TILSig评分越低,免疫细胞浸润越大,预后越好。

 

4. 外部数据集验证TILSig模型

———-

为了评估TILSig的鲁棒性,首先使用含有226个样本的数据集对模型进行验证,得到与训练集相似的结论,风险模型能将GEO验证集患者分为高低风险两组,且两组患者的生存状态具有显著差异(HR=2.422, 95% CI 1.219 to 4.812, log-rank p=0.009,图3A),低风险组患者的5年生存率为90.5%,而高风险组患者的5年生存率为75.5%。然后使用TCGA数据对模型进行进一步验证,结果显示,由于测试平台的差异,模型中7个lncRNA,TCGA验证集中只有4个lncRNA(PSMB8-AS1, TNRC6C-AS1, HCP5 and CARD8-AS1),基于这四个基因模型对每个患者进行风险评分,并根据所有样本评分的中位数将患者分为高低风险两组,生存分析表明,高风险组和低风险组的生存状态存在显著差异(HR = 1.305,95%CI 1.028 to 1.656,log-rank p = 0.028,图3B)。低风险组患者的5年生存率是43.8%,而高风险组患者的5年生存率是37.1%。进一步,使用TILSig对之前已经研究的5种免疫分子亚型之间进行分析,结果显著五种免疫亚型间TILSig有显著差异(Kruskal-Wallis test p<0.001,图3C),这说明TILSig与肿瘤免疫微环境密切相关。最后发现,TILSig中四种TILncRNA在五种免疫亚型之间表达水平也存在显著差异(图3D),其中lncRNA TNRC6C-AS1和CARD8-AS1在TGF-β免疫亚型中表达增加,而与IFN-γ相比,lncRNA HCP5 IFN-表达水平高其他四种免疫亚型,LncRNA PSMB8-AS1在五个免疫亚型中的三个表达过高,包括IFN-γ显性,炎性和TGF-β显性。作者其他17种实体癌中中使用单变量Cox分析TILSig与OS的关系。对TILSig的泛癌分析结果说明,在结肠腺癌(COAD)和肾肾透明细胞癌(KIRC)TILSig可以显著的将患者分为高低风险两组。

 

5. TILSig独立的预后因子

———-

分别在训练集和TCGA验证集中,使用单因素和多因素cox回归分析,分析TILSig、年龄、性别和分期等临床因素对患者预后的影响,结果如表2所示。结果表明,TILSig与年龄、性别等其他因素相比,TILSig可以作为一个独立的预后因子,对患者预后情况的预测能要优于其他临床因素。

 

表2.训练集和TCGA验证集临床因素与风险模型对预后的单因素和多因素风险分析

 

6.TILSig对肿瘤复发的预测

———-

为了验证TILSig是否也与肿瘤复发相关,使用训练集和GSE31210验证集携带的DFS数据,对两个数据集患者复发状态进行预测。结果表明,TILSig能显著的将训练集(p = 0.0001)和GSE31210(p = 0.01)患者的复发状态分为高低风险两组(图4A,C)。并在两个数据集之间AUC均大于0.6,训练集集和GSE31210验证集中,AUC分别为0.607和0.618(图4B,D)。最后使用单因素与多因素cox分析TILSig经年龄、性别和分期等临床因素对患者复发的影响,结果如表3所示。

 

表3.训练集和GSE31210验证集临床因素与风险模型对复发的单因素和多因素风险分析

 

7.TILSig对NSCLC患者免疫治疗的预测能力

———-

免疫检查点抑制剂能够调节免疫浸润,作者分别在训练集、GEO和TCGA验证集中提取PD1,PD-L1和CTLA-4三个免疫检查点抑制剂基因的表达量,根据TILSig得分将患者分为高低风险两组,然后比较上述三个基因在高低风险两组的表达具有差异性,结果表明,除了PD1基因在GEO验证集高低风险组的表达量呈边缘差异之外,其他免疫检查点基因在高风险患者的表达量要显著高于(P<0.05)低风险患者,如图5A-B所示。接最后我们使用风险得分和三个免疫检查点每个基因表达的高低结合将训练集患者分成四类,分别是高风险组与免疫检查点基因高表达组,高风险组与免疫检查点基因低表达组,低风险组与免疫检查点基因高表达组,低风险组与免疫检查点基因低表达组,结果表明四组之间患者的生存存在显著差异如图5D-F所示。

结论

对免疫细胞、肿瘤细胞系和癌体组织的分子谱整合分析进行转录组筛选,以识别与肿瘤免疫细胞浸润相关的lncRNAs,lncRNAs在评价肿瘤免疫浸润的重要性和价值。识别并验证7个TILncRNAs为基础的lncRNA模型(TILSig),作为TME中免疫细胞浸润的指标,对NSCLC患者具有独立的预后意义。并将TILSig结合特定的免疫检查点因素作为ICI反应潜在生物标志物。

结果图展示

 

 

图2. 识别TILncRNAs,对患者的预后情况进行预测。

 

图3. 外部数据集样本生存状态与时间验证TILncRNAs

 

图4. 使用训练集和外部数据集样本复发状态与时间验证TILncRNAs

 

图5.风险得分与免疫检查点的相互关系

文献解读

文献解读:多种人类癌症的放疗效果与免疫浸润的泛癌分析

2020-5-24 22:09:47

文献解读

文献解读:基于体细胞突变的深度神经网络分类可用于预测肺腺癌免疫治疗疗效

2020-5-24 22:15:28

声明 本网站部分文章源于互联网,出于传递更多信息和学习之目的转载,并不保证内容正确或赞同其观点。
如转载稿涉及失效、版权等问题,请立即联系管理员;我们会予以修改、删除相关文章,请留言反馈
Notice: When your legal rights are being violated, please send an email to: [email protected].
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索