如今,单组学的门槛越来越低,更多的研究者都争相涌入研究领域。那如何在这个情况下脱颖而出呢?
多组学文章,就能简单粗暴的把之前学过的单组学联合起来分析,成为一篇新的文章,难道不香吗?
今天,小编就为大家介绍一篇2020年6月份Molecular Oncology[IF:6.574]的多组学纯生信文章,希望能成为大家入门多组学的第一步!

原文呈现:
https://febs.onlinelibrary.wiley.com/doi/full/10.1002/1878-0261.12755
文章背景
吸烟是癌症发生的危险因素,会增加各种癌症的发病率,包括膀胱癌、头颈部癌、肺癌和胰腺癌。但现如今,很少有文章研究癌症患者确诊时的吸烟状况(包括曾经吸烟者)与总存活率之间的关系。

表1 研究对象
通过多因素COX回归分析求取戒烟与总生存期的关系。结果显示在LUSC中,戒烟者预后比吸烟者更好(P值<0.05,HR=0.67),暗示戒烟可能是LUSC的独立保护因素(表2)。
因此,下面可以进一步探索戒烟改善LUSC预后的潜在分子机制。

结果显示:得出2899个DEGs,1326个DElncRNAs,48个DEmiRNAs(图3 A-C);且DEGs主要富集在与DNA,RNA相关的通路途径及DNA复制,RNA剪接等功能中。

D mRNA-miRNA-lncRNA共表达网络
进一步评估甲基化水平与DEGs表达量的关系,结果显示10个DEGs表达量(如HOXB2,PTHLH)与甲基化水平具有相关性。
综上,受不同遗传与表观调控的影响,85个DEGs能作为吸烟者的驱动基因。

结果显示:戒烟者的smoking signature比吸烟者更低(P<0.001)(图5A);且K-M曲线显示高smoking signature的预后更差(P<0.001)(图5B)。
与吸烟者(AUC=0.55,0.55,0.58)相比,戒烟者有更好的2年,3年,5年的生存率(AUC=0.65,0.67,0.70)(图5C)
单因素,多因素COX回归显示smoking signature能成为潜在独立的预后标志物(P<0.001)(图5D-E)
为了定量的预测LUSC病人的生存率,作者构建了包括smoking signature和临床信息的预测模型,并且校正曲线显示预测值与观测值间有良好的一致性(图5G-F)。
为了验证smoking signature的适用性,作者在7种癌症中分析其与总生存率的相关性。在BLCA,CESC,HNSC,LUAD,LUSC,PAAD中,相比低smoking signature患者,高smoking signature的有更高的危险率(表3)。


表3 smoking signature与总生存率的相关性
总结
作为一名医学生,刚接触生信的苦恼和迷茫一直历历在目。慢慢地,把每篇看到的文章做个小的思路总结已成为习惯。而这篇文章关键的地方就是非常的全面,能把RNAseq表达谱,miRNA 表达谱, 体细胞突变数据(SNV), 拷贝数变异数据 (CNV)和DNA甲基化五种不同的数据联合起来,与求出来的差异基因求交集,最后多因素COX回归求取对应的smoking signature。更谨慎的话可以在另外癌症数据中对其进行验证。
这篇文章思路非常清晰,也对初学者非常友好。更换研究的因素和疾病的话,可以成为多组学入门篇的标准套路进行研究。并且也可以分开作为不同的入口,进行新的数据挖掘呢!

附:专业英文术语
BLCA:bladder urothelial carcinoma 膀胱上皮癌
CESC:cervical squamous cell carcinoma宫颈鳞癌
ESCA:esophageal carcinoma食道癌
HNSC:head and neck squamous cell carcinoma头颈部鳞状细胞癌
LUAD:lung adenocarcinoma肺腺癌
LUSC:lung squamous cell carcinoma肺鳞状细胞癌
PAAD:Pancreatic adenocarcinoma胰腺癌