大家好,今天和大家分享的是2020年3月发表在Cancer genetics(IF=3.105)上的一篇文章:“Heterogeneity of MSI-H gastric cancer identifies a subtype with worse survival”,作者通过生信分析手段将MSI-H胃癌数据分为了两个亚组,并进一步使用了基因集富集分析等多种方法,探究了两个亚组在临床特征,预后情况,肿瘤免疫等因素之间的差异,并探讨了MSI-H1亚组预后较差的原因。
一、研究背景
胃腺癌(STAD)是全球第四大常见癌症,复发率和死亡率都较高。在15年发表于Nat Med的一篇文章中STAD被分成4个分子亚类(MSI-H,MSS/TP53+,MSS/TP53-,MSS/EMT),其中MSI-H亚类预后较好。作者查阅文献发现,在结直肠癌中MSI-H样本可被分为两个亚组,且具有不同的基因表达模式和预后,故作者希望在STAD的MSI-H亚类中验证是否有类似的异质性存在。
二、研究流程
三、结果解析
1.MSI-H STAD的分类
因为作者想要验证在MSI-H STAD中是否有类似于结直肠癌中的异质性,所以首先要做的是进行分类。作者使用了随机NMF算法来探究MSI-H STAD是否能被聚类以及能被聚类时的最佳聚类数,如图1A,为选择最佳的factorization rank r,作者将r分别设为2-6的整数并分别运行了NMF,输出的quality factors信息可作为最佳r值的参考,如cophenetic系数开始减小的首个r值,残差平方和(RSS)曲线出现拐点的r值等,另外,还可以直接看consensus matrix判断。综合分析后,作者选择的r为2,即STAD MSI-H可被分为两个独立的亚组。

2.MSI-H1和MSI-H2的临床特征差异分析
在确定了MSI-H STAD可以被分为两个亚型之后,为探究MSI-H1和MSI-H2之间的差异,作者首先对这两种亚型的临床特征进行了探究(表1),大致情况如下:
- MSI-H1和MSI-H2之间的年龄分布无显著差异。在两个数据集的亚组中,大多数MSI-H STAD患者年龄在60-75岁( TCGA,MSI-H1:63%/MSI-H2:61%;GSE62254,70%/61%)。
- 对性别来说,在TCGA和GSE62254数据观测到相反的情况。在TCGA数据中,女性患者占比大(54%/65%),但在GSE62254数据中,男性患者占比大(70%/61%)。
- 从病变部位来看,病变总体主要位于远端胃窦部(TCGA:65%/68%;GSE62254:68%/77%),而很少位于近端幽门部(TCGA:5%/9%;GSE62254:8%/3%)。
- 就病理类型而言,大多数MSI-H STAD为管状腺癌,只有少数标本是印戒细胞癌(GSE62254 MSI-H1亚组1个,GSE62254 MSI-H2亚组2个;TCGA MSI-H2亚组1个)。
- 作者还分析了MSI-H1和MSI-H2亚组在经美国癌症联合委员会肿瘤分期系统分期后的差异,该分期与患者的预后密切相关。值得注意的是,在GSE62254数据集,I / II期占MSI-H1亚组样本的48%,MSI-H2亚组样本的71%;而除MSI-H1亚组中的一名被诊断为IV期的患者外,其余患者被归为III期。在TCGA数据集中,MSI-H1亚组(59%)的I / II期患者比例略高于MSI-H2亚组(39%)。
从临床特征来看,MSI-H1和MSI-H2亚组的组内存在一些趋势,但组间未见有显著差异存在,对于探索二者异质性的研究,这样的结果继续深入探究的价值不大,故作者将目光转向预后。
3.MSI-H1与MSI-H2亚组的预后研究
为了探寻MSI-H1与MSI-H2亚组在预后层面可能存在的差异,作者使用KM法和Log-rank法进行生存分析,比较了GSE62254 MSI-H两个亚组的无病生存期(DFS)和总生存期(OS),发现MSI-H1亚组的患者预后显著差于MSI-H2亚组(图2B,C,DFS:HR=0.428,p=0.06;OS:HR=0.4,p=0.04)。作者分析得到MSI-H1和MSI-H2的5年总生存率分别为62%(95%CI,48%-80%)和80%(95%CI,68%-96%)。
另外,作者还比较了MSI-H1/2和研究背景提到的文章中预后较差的MSS组之间生存率的差异,发现MSI-H2亚组的患者生存率明显高于MSS组(DFS:p=0.01;OS:p=0.0038),但MSI-H1组和MSS组之间未观察到显著的生存率差异,这也提示我们MSI-H1有更差的预后。
4.MSI-H1亚组中的抑制性免疫signatures
发现了两个亚组在预后方面存在的差异后,为探明MSI-H1亚组预后较差的原因,作者深入分子层面,进行了MSI-H1和MSI-H2亚组之间的差异表达基因(DEG)分析,分别在TCGA和GSE62254数据集中得到了870和449个DEG,两个数据集之间有111个重复DEG。
对DEG数据进行研究后作者发现,在MSI-H1亚组中,免疫负调控因子,如CCL2/CCL3/CCL4/CCL28,PD-L2和IDO1有更高的表达。
发现了免疫负调控因子的表达差异后,为进一步深入研究MSI-H1和MSI-H2亚组的分子signatures,作者使用MSigDB数据库中的hallmark gene sets进行了基因集富集分析(GSEA,图3A),发现MSI-H1与14个hallmark signature呈正相关(FDR q<0.05),其中8个与免疫反应相关,包括:排斥反应,炎症反应,补体,IL6-JAK-STAT3信号通路,IFN-γ反应,TNFA通过NFκb的信号传导,IL2-STAT5信号传导,IFN-α反应。作者在图3B左图中展示了MSI-H1/2亚组对应的基因在IL6-JAK-STAT3信号通路基因集的富集情况。

相比与MSI-H1的14个,只有4个标志性signatures与MSI-H2亚组显著相关:脂肪酸代谢,氧化磷酸化,蛋白质分泌,过氧化物酶体。这些signatures与免疫反应的关系不大。
5.MSI-H1亚组的预后较差可能与抑制性免疫受体和趋化因子的增多有关
从GSEA揭示的MSI-H1与免疫反应hallmark signature相关的结果中,作者受到启发——MSI-H1亚组的预后较差可能与肿瘤免疫有关。因为肿瘤突变负荷(TMB)对与肿瘤免疫相关的新生抗原的丰度和immune landscape有直接影响,所以作者首先比较了TMB在MSI-H1与MSI-H2亚组之间的差异,但结果并不显著(图4A)。
考虑到TIME的组成比较复杂,作者还探讨了T细胞耗竭标志物TIM3,TIGHT与CCLs之间的相关性(图4D),发现二者总体上呈正相关,说明肿瘤中出现的T细胞耗竭与CCL分子的上调存在相关。而经典的免疫检查点分子受体PD-L1与IDO1(r=0.64),TIGIT(r=0.55),CTLA4(r=0.51),PD-L2(r=0.5)和TIM3(r=0.5)也观察到了相关性,但稍弱。
值得注意的是,作者观察到TIGIT与某些免疫检查点阻断(ICB)靶点,尤其是CTLA4(r=0.82)和TIM3(r=0.8)之间具有很强的相关性。IDO1与其它ICB靶点也有类似的相关性。
此外,除了CCL3和CCL4之间的高度相关性(r=0.89)外,CCL之间的相关性很弱。有趣的是,CCL5与TIM3(r=0.81)和TIGIT(r=0.76)高度相关,提示可能存在尚未发现的STAD中CCL5与T细胞耗竭之间的关联。
小结