1. sci666首页
  2. 文献解读

文献解读:急性粒细胞白血病纯生信分析高分文章研究思路

今天分享的是2019年10月发表于Cancer Immunology Immunotherapy的一篇文章,标题是Identification of prognostic genes in the acute myeloid leukemia immune microenvironment based on TCGA data analysis,影响因子4.9,文章思路比较清晰,分析的思路也比较方便借鉴。

术语

• AML Acute myeloid leukemia 急性粒细胞白血病

• DEG Differentially expressed genes 差异表达基因

• ESTIMATE(Estimation of STromal and Immune cells in MAlignant Tumor tissues using Expression data)是利用基因表达数据预测肿瘤组织中肿瘤纯度和浸润基质/免疫细胞的工具,算法基于ssGSEA(单样本基因集富集分析);主要是产生3个得分:

1)stromal score(肿瘤组织中的基质)

2)immune score (肿瘤组织中的免疫细胞浸润)

3)estimate score (肿瘤纯度)

• PrognoScan是网页工具,主要用于在大量公开可用的癌症芯片数据集中搜索基因表达与患者预后之间的关系,例如总体生存期(OS)和无病生存期(DFS)。

1.研究思路

• 下载公共数据库的AML 数据集,分别是来自TCGA(RNA-seq数据,测试集)和GEO(GSE12417和GSE5122,验证集);数据来源于不同,省去了划分测试集和验证集的部分;

• 利用ESTIMATE算法,计算TCGA的AML数据的immune score和stromal score;依据score分组后,进行差异分析;

• 利用DAVID、REACTOME、cytoscape的ClueGO进行功能、通路富集分析和通路相关分析;

• 同样,蛋白互作网络也是必需的,这里通过STRING获得差异基因的PPI信息后,利用Cytoscape的MCODE进行模块化分析,并依据MCODE score和node数目确定最显著的模块;

• 绘制生存分析曲线,并利用PrognoScan确定基因的预后价值;

• 在GEO数据集中进行相关验证;

2.结果

2.1 样本分组展示

与原公认的分组进行相关性分析,且展示是否具有统计学意义,后再形成自己的分组;

为所有病人进行immune score 和stromal score的计算,与TCGA中记录的亚型分类进行相关性的展示,且具有统计学意义;再与另一篇文章的预测分组(cytogenetic risk)进行相关分析,immune score与细胞遗传风险具有相关性,stromal score中无体现;

依据immune score 和stromal score将病人进行分组后,绘制生存曲线;
文献解读:急性粒细胞白血病纯生信分析高分文章研究思路

2.2 差异分析

在下游分析中,大家的启蒙应该都是差异分析,对不同的组别进行基因表达差异的比较,取得具有表达差异和显著性的基因便是目的;火山图、热图是两种差异分析后的可视化方式;依据immune score 和stromal score可以有两个分组,自然就有两个差异基因列表,后续在上调和下调方向取了交集;最后获得183+17个差异基因;

文献解读:急性粒细胞白血病纯生信分析高分文章研究思路

2.3 通路分析

差异分析后的通路分析方法很多,所用的数据集也有很多;网页工具和R包用得较多,文章用网页工具DAVID进行富集分析,并利用了cytoscape的插件ClueGO,对GO富集结果以网络图的方式进行展示;

文献解读:急性粒细胞白血病纯生信分析高分文章研究思路

2.4 生存分析

利用TCGA数据,一般绕不开生存分析,通过差异分析和通路富集缩小范围,找到目标基因后,对病人依据得到的marker进行分组,对分组进行生存曲线的绘制;获得有代表性的与OS呈负相关,且具有统计学意义的55个基因;这里展示了具有代表性的8个基因;

文献解读:急性粒细胞白血病纯生信分析高分文章研究思路

2.5 PPI和模块

利用STRING和cytoscape对差异基因进行PPI的绘制,用MCODE进行模块的挑选,这里挑选出了2个重要的模块;MCODE可以从cytoscpe app store中下载,后续分析的时候,可以尝试用上;

文献解读:急性粒细胞白血病纯生信分析高分文章研究思路

2.6 在GEO数据集中验证

同样是生存曲线的绘制,只是由TCGA(测试集)换成了GEO(验证集);在GEO数据集中确认了8个与预后相关的基因;

文献解读:急性粒细胞白血病纯生信分析高分文章研究思路

这些可能会帮助到你: 问答社区 | 共享百度SVIP | 留言建议

欢迎入群交流:生信分析群: 732179952 · Meta分析群: 797345521

发表评论

登录后才能评论