这次分享的文献是Immune cell infiltration as a biomarker for the diagnosis and prognosis of digestive system cancer,2019年9月发表于Cancer Science,影响因子为4.6;同样是利用公共数据,围绕CIBERSORT的分析数据展开,进行模型构建验证,并将样本进行亚型的区分作生存分析。
• CIBERSORT Newman等开发的分析工具,使用基因表达数据来估计混合细胞群体中成员细胞类型的丰度,被广泛用于肿瘤浸润免疫细胞的估计;
• LM22 包含了547个基因在内的signature 矩阵,能够精确区分从外周血或体外培养条件中分离出的22种成熟的人造血细胞群;
• RFS (relapse free survival)无复发生存期,或无病生存期,从随机化开始至疾病复发或(因任何原因)死亡之间的时间,最常用于根治性手术或放疗后的辅助治疗的研究;
• 数据来源:TCGA数据库,ESCA, STAD, LIHC,PAAD, COAD, READ;GEO数据集
• 基于CIBERSORT结果进行lasso回归分析,用于诊断模型的构建,并进行验证
• 基于CIBERSORT结果进行预后模型的构建和验证,并比较预后模型、TNM、列线图的c-index,以确定预测效果
• 基于PIS和临床信息进行列线图的构建和验证
• 依据免疫细胞比例,对肿瘤病人进行无监督聚类,最后确定为6类,并进行生存曲线的绘制和PIS分布的比较
2.1 消化系统肿瘤中DIS(诊断免疫评分)的构建和验证
利用了CIBERSORT网站对表达矩阵进行处理,参考集是LM22 signature并置换1000次;结果图里,同样看到了熟悉的火山图,但这里的点代表的已经不是基因,而是免疫细胞了,代表的是免疫细胞比例的差异;将样本分为训练集和验证集,进行lasso回归分析,得到DIS的计算公式;在训练集、验证集和整个数据集绘制ROC曲线;关于DIC的一些更详细的结果,在补充材料里可以找到;这里用到的数据包括肿瘤和正常样本,大思路是,lasso回归得到的结果应能区分样本是否为肿瘤;
2.2 消化系统肿瘤中PIS(预后免疫评分)的构建和验证
相较DIS,PIS是预后指标,所以,用到的数据是肿瘤样本数据;同样是lasso回归后,得到PIS的计算公式;绘制ROC曲线,在训练集、验证集和整个数据集进行生存曲线的绘制;三个生存曲线的结果一致,均是,PIS高,预后差;
2.3 PIS(预后免疫评分)与TNM进行预后比较
这里采用了DCA分析,PIS与传统的TNM分级进行比较,认为使用PIS预测病人的RFS比使用TNM分级进行预测获益大,分别在训练集、验证集和整个数据集进行了DCA曲线的绘制;表格展示的是PIS、TNM、Nomogram的c-index,c-index越高即预测效果越好;
基于PIS和临床信息进行列线图的构建,同时在训练集、验证集和整个数据集都观察到预测结果和实际具有较好的一致性;
基于644个消化肿瘤病人的免疫浸润情况,进行无监督聚类,区分出6个免疫亚型;对分出的6个免疫亚型进行生存曲线的绘制并展示了不同亚型的PIS分布情况;生存曲线和PIS分布共同印证了亚型5和亚型6复发概率高;
总的来说,文章主要围绕CIBERSORT的分析结果展开,用lasso回归进行多个模型的构建,引入了DCA曲线、c-index和calibration curve对模型的预测能力进行评价;文章思路很清晰,有很多数据放在了附录。