文献解读:缺血性心肌病ceRNA 文献解读 20年2月5日 转载大师 取消关注 关注 私信 今天跟大家文献解读的是一月份发表在bioscience reports.(IF: 2.535) 杂志的一篇文章,这是一篇关于ceRNA三元组与缺血性心肌病的研究。 A susceptibility biomarker identification strategy based on significantly differentially expressed ceRNA triplets for ischemic cardiomyopathy 缺血性心肌病中基于显著差异表达ceRNA三元组生物标志物的鉴定 缺血性心肌病(ICM)是导致死亡的常见心脏病。在现有数据库中无法找到有效的ICM生物标记物。首先,根据ICM和正常样本的RNA-Seq和miRNA-Seq数据鉴定潜在的生物标志物。利用差异表达的mRNA,miRNA和lncRNA以及随机检验的方法构建ceRNA三元组。确定了8个ICM易感基因并证实对易感基因于ICM和正常的分类准确性。这些生物标志物将有助于ICM的诊断和治疗。文章的流程图如图1所示。 图1.流程图 结果 1. 显著差异表达的ceRNA三元组 根据mRNA-miRNA、mRNA-lncRNA和miRNA-lncRNA表达值,计算相关性,得到显著相关的关系对,基于显著的调控对,构建正常和疾病中显著差异的三元组, 如表1所示。 表1.ceRNA三元组中显著差异表达的基因数目 2. 候选ICM易感基因 为筛选ICM易感基因,留下包含至少一个差异miRNA或者lncRNA 的ceRNA三元组,利用富集分析的方法对68个差异基因进行功能富集。发现富集到37个显著的GO term中,其中20个GO term是和6个ICM相关的功能类相关(图2)。 图2.ceRNA三元组中差异基因的富集分析 在ICM相关功能类中,其中37个基因认为是候选的ICM易感基因,以基因表达作为特征,利用支持向量机(SVM)模型对ICM和正常样本进行预测模型构建,并利用留一法交叉证实评估预测性能,发现利用不同的核函数均具有较高的准确性,最后发现利用linear和sigmoid核函数具有最高的预测准确性(图3)。 图3.37个候选易感基因的分类ROC曲线 利用linear核函数进一步对ICM易感基因类作为特征进行分类器的构建,发现ICM易感基因功能类中基因分类性能更高(表2)。对ICM易感基因单独作为特征,8个基因的分类AUC均大于0.75(表3)。且对于ceRNA三元组的lncRNA筛选显著的,发现8个lncRNA的分类AUC大于0.75(表3)。 表2.ICM相关功能类中基因分类性能 表3.ICM易感基因的分类准确性 进一步为了评估筛选的ICM易感基因的准确性,与随机筛选的基因的分类性能进行比较,发现识别的ICM相关的mRNA和lncRNA均相对随机筛选的具有高的AUC(图4)。并进一步通过文献查证,发现一些识别的基因与lncRNA是与心脏相关的生物学过程和功能是相关的。 图4.ICM易感基因分类准确性比较 这些易感基因最后形成了10个差异表达的ceRNA三元组,其中七个是在ICM样本中识别的,3个样本是正常样本识别的,进一步利用三元组中的基因作为特征进行性能评估,发现基于ICM识别的七个中的五个ceRNA三元组具有好的分类性能(图5),而正常的三个ceRNA三元组中两个的分类性能较好(图6)。七个ceRNA三元组中包含三个基因(FLT4, PSMB1, PKD1),也被证实与心血管功能有关。 图5.ICM中五个差异表达ceRNA的分类性能 图6.正常样本中2个差异表达ceRNA的分类性能 综上,该工作基于ceRNA三元组的信息,识别8个ICM易感mRNA和8个ICM易感lncRNAs。基于显著差异表达ceRNA三元组的策略也将有助于其他复杂疾病的生物标记物的挖掘。今天的分享到此就结束了,祝开启美好的一天! 推荐阅读: 文献解读:GEO中lncRNA的数据挖掘 文献解读:胃癌预后-lncRNA的支持向量机模型 文献解读:高分生信分析文章 文献解读:胰腺导管腺癌lncRNA预后风险模型 文献解读:免疫细胞特有marker肿瘤分析思路 lncRNA文献解读