近年来,生信文章如同雨后春笋般涌现出来,但是想要发表高分文章并不是那容易,生信分析的套路可以说是遍地开花,我们如何才能让我们的文章脱颖而出呢?今天分享的文章也许可以为你提供新的思路。言归正传,今天向大家分享的是7月31日发表在发
(IF=4.848)上的一篇关于泛癌研究的文章。
-
根据数据完整性,样本量以及TCGA和ESTIMATE之间的重叠情况,选择20种恶性肿瘤类型;
表1
-
从UCSC Xena Browser门户下载患者生存数据;
-
从ESTIMATE网站下载癌症的免疫评分和基质评分;
-
从TCGA数据门户网站获得BRCA,LUAD,KIRC,STAD,LGG和SKCM的RNA-seq基因表达数据。
1. 20种不同类型肿瘤的预后与基质和免疫评分的相关性
首先,作者对20种不同肿瘤类型的总生存率与基质评分或免疫评分之间的相关性进行分析发现,对于BRCA,LUAD和KIRC,免疫评分比基质评分更能预测预后(p<0.05)(图1a–f),对于stad,基质评分存在显著差异(p p=””>0.05)。
图1
2.与基质和免疫评分高相关的DEGs的鉴定
接下来,作者选择先前鉴定的具有统计学差异的六种肿瘤类型,鉴定了其表达与免疫或基质评分值正相关或负相关的基因,其预后可以通过免疫(BRCA,LUAD,KIRC,LGG和SKCM)和/或基质(STAD,LGG和SKCM)评分来预测。通过绘制维恩图可视化常见的上调和下调基因,其中在免疫评分组中共检测到的54个常见DEGs,在基质评分组中共检测到116个常见DEGs(图2A-D)。
图2
3. DEGs的功能富集分析
选择在免疫评分组中检测到的54个常见DEG和在基质评分组中检测到的116个常见DEG进行功能富集分析。可视化免疫评分组BP,CC和MF中的前10个GO术语(图3A-C),基质评分组BP,CC和MF中排名前10位的GO术语(图3D-F)。
图3
4.免疫组和基质组之间PPI的比较
为了更好地理解各组中DEGs的相互作用并探讨免疫评分组和基质评分组之间的区别,作者使用STRING工具分别分析了免疫评分组的54个DEGs和基质评分组的116 DEGs,绘制了PPI网络(图4A-D)。在免疫评分组,由Cytoscape MCODE识别具有高度值的10个中心节点,并将其命名为ITGAM模块(图4B)。在基质评分组,确定了12个中心节点并将其命名为PTPRC模块(图4D)。
图4
5. 单个差异表达基因在相关癌症中的预后潜力分析
作者使用TCGA数据库的Kaplan-Meier生存曲线进一步研究了与相关癌症预后相关的DEGs。在免疫评分组的54个DEGs中,有53个DEGs的表达水平与BRCA,LUAD,KIRC,LGG和SKCM中至少一种的预后相关(p<0.05)(表2)。在基质评分组,有108个DEGs的表达水平与STAD,LGG和SKCM中至少一种的预后显著相关(补充表S4)。
表2
尽管这些DEGs在特定癌症中显示出了预后潜力,但作者认为有必要研究正常人群和癌症人群之间的基因表达差异。于是用GEPIA挖掘免疫评分组的53个DEGs和基质评分组的108个DEGs,以鉴定具有明显差异表达的基因,结果显示79个DEGs具有统计学意义的表达差异(p<0.01),其中FCER1G,LGALS9,TWEM149,EVI2B和HAMP在癌症人群中的基因表达水平显著高于正常人群(图5)。
图5
在本研究中,作者根据癌症基因组图谱(TCGA)数据分析了20种恶性肿瘤的总体生存率与免疫/基质评分之间的关联,对于20种肿瘤类型中具有统计学意义的6种癌症进一步分析,筛选出了免疫相关基因,这些基因可以鉴定一种或多种肿瘤类型的预后预测因子。
众所周知,生信分析的技术方法大同小异,文章的新颖性就表现在文章内容上,通常大家都是在一种癌症中筛选预后相关基因,但是本文作者却选择在多种癌症中进行分析,同时采用多数据库联合分析,不仅数据量大,说服力强,并且多种癌症的预后基因具有更广泛的应用价值。因此,多数据库联合分析可以提供一种评估肿瘤预后的新方法,并可以鉴定可能是肿瘤转移和预后的新生物标志物的相关基因。有了差异表达的基因,后期就可以根据分析结果任性的随机选择“基因+癌症”进行验证了,尤其对于想发干湿结合文章的小伙伴们来说,这种分析思路不防借鉴起来吧!