大家好,今天和大家分享的是19年12月份发表在Cancers (IF:6.126)杂志上的一篇文章,“The Landscape of Long Non-Coding RNA Dysregulation and Clinical Relevance in Muscle Invasive Bladder Urothelial Carcinoma”,作者利用TCGA数据库下载的406例MIBC样本的测序数据,研究了lncRNA中与临床改变密切相关的分类,并将lncRNA 表达与基因组改变相关联,探究lncRNA失调的可能机制,分析了lncRNA与癌症、免疫相关通路和癌症相关特征的关联。
一、研究背景
膀胱尿路上皮癌是男性中第四常见和第八致命的癌症,在美国每年大约80,000个病例中,被诊断出的男性是女性的四倍。四分之一到三分之一的膀胱癌侵犯膀胱肌肉并成为肌肉浸润性膀胱癌(MIBC)。患有这种更具侵袭性的膀胱癌患者比其他类型的膀胱癌患者生存率低10% 以上,复发率为20-40%
对于所有在MIBC 中表达的lncRNA 的全貌,目前还缺乏全面的分析。但是可以通过计算性剖析来完成。先前的生物信息学分析已经使用GENCODE注释lncRNAs进行了检测,但是还没有使用LNCipedia注释对lncRNAs进行更加全面的评估。
二、研究思路
三、结果解析
1、鉴定膀胱癌中非调控的lncRNAs(Identifying Dysregulated lncRNAs in Bladder Carcinoma)
为了评价MIBC 患者lncRNA 表达异常的情况,作者从TCGA 数据库中下载了406例患者膀胱癌组织lncRNA 表达数据,并与19例正常组织lncRNA表达数据进行了比较。发现有3191个lncRNAs在癌组织中与正常组织相比存在失调。
作者使用egdeR包对数据进行了差异分析,与正常组织相比,如果edgeR精确检测的错误发现率(FDR)小于110,FC大于2或小于-2,则可认为lncRNA失调。
2、基于lncRNA表达的患者分层
作者在后文中通过cox风险因素回归分析获得了一组20个lncRNAs。这一组中的lncRNA表达与生存相关性以及临床变量具有显著的相关性。根据表达模式不同,20个lncRNAs被分为12组。
作者发现lncRNA表达更容易区分患者群体,通过lncRNA分组富集出来的这11组患者的组内临床信息趋同,表明lncRNA 的表达可以根据临床变量有效地将患者分类(图1B)。
3、分析lncRNA调节异常与膀胱癌患者生存率的关系
作者对患者的生存率以及lncRNAs的表达进行Cox回归分析。发现只有257个lncRNA的表达水平与患者存活率显着相关(p <0.05),与根据表达量中位数分组对比,这些lncRNA中只有20个与癌症组织与正常组织的对比中的表达趋势相同。
表现出生存相关性的lncRNA数量很少,这表明大多数失调的lncRNA在影响MIBC进程中可能没有重要作用,并发现某些lncRNA与临床表型密切相关。
作者生成了20个核心lncRNAs的Kaplan-Meier图来可视化lncRNA 表达与生存的相关性(附图2)。
- 它们都表现出与表达失调方向一致的显著生存相关性,以及与临床变量的相关性
- 8个下调的lncRNAs ーlnc-acsbg2-1:1; lnc-ANKRD54-1:1; lnc-BOD1-1:7,-1:8和-1:9; lncMUC22-1:1,-1:7和-1:8ー表明低患者存活率与低表达lncRNA 之间存在相关性,提示这些lncRNA 具有潜在的抑瘤作用。
- 十二个上调的lncrnas ーlnc-cgrrf1-3:1; lnc-EIF2AK4-1:1,-1:4,和-1:5; lnc-GCH1-2:1,-2:2,和-2:3; lnc-IYD-2:1; lnc-PGA3-2:1; lncSERF1B-1:4; lnc-ttmmem206-6:1; lnc-ULBP3-2:1ー1; lnc-ULBP3-2:1ー1; lnc-ulbp3:1ー1; lnc-ulbp3:2; lnc-ulbp3:1ー1; lnc-ulbp3:1ー1; lnc-ulbp3:1ー1; lnc-ulbp3: lnc-ulbp3:1ー1; lnc-ulbp3: lnc-1。表明低患者存活率与这些lncRNA 之间的高表达存在相关性
计算每个lncRNA在低表达组患者的HR,结果表明,如果lncRNA下调,患者死亡的可能性通常为1.5至2.0倍,如果lncRNA 上调,死亡的可能性为0.75至0.50倍(图1C)。
4、核心lncRNA的预后预测能力与其他模型的对比
作者使用留一验证(leave-one-out cross validation)构建了一个lncRNA相关预测模型,并将其与其他文献来源的预测模型进行模型的AUC对比。
5、临床变量相关的lncRNA表达水平失调
作者使用Kruskal-Wallis检验,将lncRNAs 表达失调与多种临床变量相关
- 包括病理TNM 分期(肿瘤、淋巴结和转移)、病理分期、最终随访肿瘤存在情况(癌症状态)、组织学分级、治疗成功率、治疗后新发肿瘤事件和淋巴管浸润(p < 0.05; 图2)。
- 作者发现大多数核心的20个lncRNAs 表现出与组织学分级、初级治疗结果成功率和癌症状态的相关性。
- 另一方面,临床变量如浸润、病理分期和新的肿瘤事件与lncRNA 表达没有高度相关性。
- 半数下调的lncRNAs,即lnc-ACSBG2-1:1和lnc-BOD1-1:7,-1:8和-1:9高表达水平与初次治疗的成功率和较低的肿瘤分级相关,进一步提示了潜在的抑瘤作用。
A图为显著上调lncRNA,B图为显著下调lncRNA
6、关键lncRNAs 与肿瘤相关基因组的相关表达
作者将患者标本根据lncRNA的表达差异分组,对其生物途经以及致癌标记相关的基因表达进行(Canonical biologic pathways (C2:CP gene sets) and oncogenic signatures (C6 gene sets) )GSEA分析。
- 典型路径是从精心策划的数据库中提取出来的,这些数据库包括Biocarta、Reactome 和京都基因和基因型百科全书(KEGG) ,其中包括参与特定生物过程的基因。
- 只对肿瘤发展和进展相关的路径,包括癌症过程相关和免疫相关的路径进行了分析。
- 致癌基因marker是在体外实验操纵癌相关基因的表达后,包含表达发生最显著变化的基因的基因集。
不同的lncRNAs以不同的方式与免疫和癌症相关通路的活性相关,对于下调的lncRNA:
图3B:根据lnc-ACSBG2-1:1进行分组的GSEA富集结果
- 对于下调的lncRNAs,lnc-ACSBG2-1:1和lnc-BOD1-1:7,-1:8和-1:9表现出类似的通路富集景观,其低表达与免疫和癌症相关通路中的高富集相关,表现为负增强评分(图3)。
- lncRNA 低表达与较高的癌症相关活性的关系进一步证明了lncRNA 作为肿瘤抑制因子的功能。
- lnc-ACSBG2-1:1与成纤维细胞生长因子受体信号通路、g 蛋白偶联受体和细胞外通路有关,而与细胞外间质、g 蛋白偶联受体和致癌转录因子有关的通路与lnc-BOD1-1:7、-1:8和-1:9有关(图3)。
- 免疫相关通路也在低lncRNA表达组中上调表达,这表明一些在膀胱癌中功能重要的lncRNAs 可能是免疫原性的。
- 对于lnc-ankrd54-1:1,癌症或免疫相关通路不在同一表达方向上丰富。相反,低lnc-ANKRD54-1:1的表达与重要癌通路的上调(主要涉及蛋白激酶A 和cAMP 反应元件结合蛋白信号转导)和许多免疫相关和凋亡相关通路的下调有关。
- 最后,下调的lncRNAs lncMUC22-1:1、-1:7和-1:8表现出低表达与低免疫相关活性和低细胞-细胞连接活性的相关性(补充图S3A)。
对于上调的lncRNAs:
- lnc-CGRRF1-3:1和lnc-GCH1-2:1,-2:2和-2:3具有几乎相同的相关性这四个lncRNAs 的高表达导致免疫活性增强,但凋亡减少(图4)。
- 补体途径和细胞因子/白细胞介素信号途径解释了大部分上调的免疫活动。相比之下,其他上调的lncRNA 的表达和通路之间没有显著的相关性(补充图S3B)。
- 与大多数lncRNAs 相关的免疫相关途径:包括补体途径、凝集素途径和局部急性炎症反应途径 ,而与大多数lncRNAs 。相关的癌症相关途径:包括caspase 途径、Wnt信号通路途径和细胞粘附降解SMAD通路的研究。
- 在将lncRNA 的表达与致癌信号相关后,与致癌信号相关的lncRNA 包括lnc-CGRRF-3:1,lnc-ACSBG2-1:1,lnc-BOD1-1:7,-1:8,-1:9,而与任何致癌基因签名无关的lnc 包括lnc-EIF2AK4-1:1,-1:4,-1:5,以及lnc-GCH1-2:1,-2:2,-2:3;lnc-IYD-2:1; lncMUC22-1:1,-1:7,-1:8; 以及lnc-PGA3-2:1(图5,补充图S4)。与大多数lncRNAs 相关的癌基因标记是KRAS-related。
- 8个下调的lncRNAs 中有5个与致癌过程有关,而12个上调的lncRNAs 中只有4个与致癌过程有关。总的来说,GSEA分析的相关性表明,下调的lncRNAs 比上调的lncRNAs 更有可能诱发多基因或通路水平的变化。
7、研究基因组改变与lncRNA表达的关系
作者使用了重复评估变量的条件熵和冗余(repeated evaluation of variables’ conditional entropy and redundancy,REVEALER)算法,计算相关所有出现的基因组改变与MIBC 样本的lncRNA表达的关系。这一方法利用信息论中的互信息和信息系数的概念,探测器计算出每个基因组改变事件的条件信息系数(CIC)。当CIC 的绝对值大于0.30时,基于测试数据集的事件和lncRNA 表达之间的相关性是合理建立的。
- 下调的lncRNAs lnc-ACSBG2-1:1和inc-ankrd54-1:1与任何基因组改变都不相关(图6A)。
- 发现所有上调的关键lncRNAs 都与一个或多个基因组改变事件相关
- 基因突变与lncRNA 表达没有相关性,所以拷贝数的改变是影响lncRNA 表达的主要基因组改变。一些CNA 区域与多个lncRNAs 的表达相关。13q12-14基因的缺失、14q24-32基因的缺失或扩增、3p22-24基因座的缺失均与四组上调lncRNAs 的表达有关(图6B)。
根据COSMIC 分析,作者还确定了所有位于CNA区域与lncRNA表达相关的MIBC基因失调,这些区域中只有一小部分基因是癌基因、肿瘤抑制基因或免疫相关(IA)基因。作者还发现在这些CNA 区域中只有四个失调基因与存活相关。这些结果表明,拷贝数的变化可能直接与lncRNA 失调有关。
8.研究lncRNAs作为microRNA抑制剂的潜在作用
作者使用DIANA 工具中的LncBase 工具分析了MIBC 中miRNAs 显著失调与关键lncRNAs 结合的可能性
- 结果显示给定的lncRNA 和miRNA 对之间存在相互作用。作者发现inc-bod1-1:7,-1:8,-1:9; inc-eif2ak4-1:4,1:5; 和incmuc22-1:1被预测与MIBC 中几个miRNAs 相互作用失调,大多数这些miRNAs 在MIBC 中被上调,这些lncRNAs 可以潜在地中和这些microrna 的上调作用。
小结
文章采用了与之前研究中不同的lncRNA注释库,并研究了lncRNA与基因组改变的差异。文章的大量篇幅在于对lncRNA分组的GSEA结果解释上,展示了不同lncRNA分组下肿瘤可能存在的免疫及肿瘤生长改变。作者还使用了一个新算法(REVEALER)对基因组的改变与lncRNAs的关联进行了分子,最后,作者使用lncBase对于lncRNAs与miRNA的关系进行了探究。
lncRNA如果难发文章,可以考虑跟外泌体结合