图5. 癌症驱动基因的突变富集和正向选择然后,观察到的癌症驱动基因突变根据其对蛋白质序列的影响进行了分类。结果发现,一些基因如IDH2主要是错义突变,而另一些基因如MAP2K1则是大量的的同义突变。为了评估选择压力对这些基因的影响,研究使用dN/dS计算了非同义突变与同义突变的比率,同时考虑了整个基因组的序列组成和变突率。dN/dS接近1表示存在中性选择,dN/dS > 1表示正选择,dN/dS < 1则表示纯化选择。该研究的分析表明,大多数癌症驱动基因都是在正选择效应下进化的(图5.e)。为进一步探讨选择对癌症相关突变的影响,作者进行了VAF分析。根据COSMIC中的癌症点突变,创建了两个体细胞突变列表:已经在癌症样本中观察到的,以及那些与已知癌症突变位置完全相同、但碱基变化不同的突变。然后,将这两个子集分别同义、错义和无义突变三种。在这三种情况中,癌症相关突变的VAFs明显高于相应的非癌症相关突变(图5.f),表明癌症相关突变会增加细胞的增殖率。有趣的是,癌症/非癌症突变VAFs的比值在同义突变类型中最低,错义突变居中,在无义突变中最高,表明了对许多极端突变的显著正向选择。此外,与其他突变相比,癌症相关突变在更多的个体中存在,特别是在非脑组织中,这些结果与dN/dS分析一致(图5.e),同样表明了对癌症驱动基因中无意义突变的强正向选择。最后,研究筛选出了在OncoKB中被注释为致癌或可能致癌的驱动突变。结果发现,所有观察到的NOTCH1中的无义突变都被标注为致癌,RHOA和RAC1在它们的Ras结构域也有致癌突变(图5.g)。以上所有结果表明,癌症突变在非疾病组织中富集,它们不仅聚集在驱动基因中,而且大多是在正向选择下进化的,表明这些突变在癌症发生之前就会增加细胞的增殖。总的来说,这篇文章描绘了一副复杂的人体体细胞突变谱,突出了它们的组织特异性分布和功能关联关系。癌症突变的普遍存在和癌驱动基因在非疾病组织中的正向选择表明了一种稳定的癌前状态的可能性。最后,该研究从RNA-seq数据中识别体细胞突变的方法对于研究体细胞进化及其在衰老和疾病中的作用具有重要意义。 Best wishes for your holiday!