简单易懂,事半功倍。
提高接受率,人人国自然!

文献解读:生信分析怎么进行“机制研究”

在大家的印象当中,生信很难和机制研究撤在一块,这是一个极大的误解,今天我们就研究下膀胱癌干细胞的调节机制!

膀胱癌是指发生在膀胱黏膜上的恶性肿瘤。是泌尿系统最常见的恶性肿瘤,每年约有150,000的死亡病例数。近年来,膀胱癌中未分化细胞群体的干细胞样特性已被确定为影响该病复发和进一步恶化的主要因素[1]。当前,我们还不清楚膀胱癌中调节干细胞增殖的机制。

而干细胞(stem cell)作为原始且未特化的细胞,它是未充分分化、具有再生各种组织器官的潜在功能的一类细胞。干细胞存在所有多细胞组织里,能经由有丝分裂与分化来分裂成多种的特化细胞,而且可以利用自我更新来提供更多干细胞。那些具有自我更新和治疗抗性的干细胞在膀胱癌(BLCA)中发挥着重要的作用。

 

干细胞指数(stemness indices)是描述肿瘤细胞与干细胞相似性的指标。mRNAsi是基于表达数据计算的指数,指数范围在0到1之间,越接近于1说明细胞的分化程度越低,干细胞特征越强。在这项研究中,Pan等人旨在通过结合WGCNA和mRNAsi识别与干细胞特性相关的基因,找到影响膀胱癌干细胞特性的基因,发现通过控制上游的AURKB和PLK1基因可能有助于膀胱癌的治疗,这篇文章为研究癌症干细胞特性相关基因提供了一个很好的思路。

      

2.材料和方法

(1)训练数据集:从TCGA数据库(https://portal.gdc.cancer.gov)下载膀胱癌的表达谱数据(19个正常样本和414个疾病样本,其中有408个病人有对应的临床数据)。

(2)验证数据集:GSE87304、GSE124305和GSE52219。其中,GSE52219还记载用药后病人是否对药物反应的信息。

(3)差异基因:通过R包“edgeR”,将|fold chage|>1和FDR<0.05的基因视为差异表达基因。

(4)WGCNA:基于RNA表达谱数据计算基因共表达,进而通过R包WGCNA去识别功能模块。

(5)候选模块的识别:首先以0.25为阈值,将一些相关系数高的模块进行融合。通过计算模块中基因表达值与mRNAsi之间的线性相关的p值取log10得到基因重要性(GS = lgP)模块重要性是模块中每个基因GS值的平均。

(6)识别关键基因:选定相应的模块,计算模块中每个基因相应的GS和MM,MM > 0.8和GS > 0.5的基因视为关键基因。

(7)基因功能富集分析:通过R包“clusterProfiler”得到感兴趣的模块中基因所富集到的GO和KEGG功能。

(8)蛋白质互作网络的构建:通过DisNor (https://disnor.uniroma2.it/)刻画关键基因与疾病基因之间的互作网络,同时结合String(https://www.string-db.org)绘制关键基因蛋白质互作网络。

(9)基因共表达分析:通过R包corrplot看关键基因与互作基因之间的相关性。

(10)生存分析:以mRNAsi中位数值作为临界值划分高低mRNAsi组,通过log-rank检验两组之间生存曲线的差异。

 

3.结果

(1)mRNAsi的特征刻画:通过计算疾病和正常样本的mRNAsi,发现疾病样本与正常样本间的mRNAsi显著差异,疾病样本中的mRNAsi表达相对较高(Fig 1A),且高低mRNAsi两组病人间的生存显著差异(Fig 1E)。同时,发现正常和疾病样本间有8510个差异基因,5422个基因显著上调,3088个基因显著下调(Fig 1B)。且在膀胱癌5个亚型病人中的mRNAsi值也显著差异,其中预后最差的神经膀胱癌亚型病人(深蓝色)其mRNAsi的值最大(Fig 1D)。进一步结合样本的肿瘤纯度数据对mRNAsi进行校正,发现在疾病和正常样本中的mRNAsi也显著差异,疾病样本中的mRNAsi表达也相对较高(Fig 1C),高低mRNAsi两组病人间的生存显著差异(Fig 1H)。但在膀胱癌的5个亚型中,加入肿瘤纯度校正以后,神经膀胱癌亚型病人的mRNAsi不是最高的了(Fig 1G)。将T1和T4b时期的病人剔除,发现随着病人病情的恶化,mRNAsi的值的分布是下降的(Fig 1F),加入肿瘤纯度校正,发现随着病人病情的恶化,mRNAsi的值的分布和真实临床类似(Fig 1I)

Fig1. mRNAsi特征刻画

(2)WGCNA寻找相关的基因和模块:基于基因共表达关系矩阵,通过WGCNA识别共表达模块,最终识别了11个模块进行后续分析(Fig 2A);进一步衡量模块中基因与mRNAsi的相关性,brown、magenta和turquoise三个模块和mRNAsi明显负相关(Fig 2B),因此挑选这3个模块进行后续分析;通过卡MM > 0.8和GS > 0.5,最终在模块中识别了13个关键基因(Fig 2C)。

Fig2. WGCNA识别关键基因

(3)关键基因在膀胱癌中的表达情况:在膀胱癌不同时期去刻画上面找到的13个关键基因在疾病和正常样本中的表达模式,发现这13个基因在随着疾病分期越来越严重的时候,基因在疾病和正常样本中表达的foldchange值是没有差异的(Fig 3A);进一步通过Oncomine数据库,发现这13个基因不仅在膀胱癌中显著高表达,在其他很多癌症疾病中也过表达(Fig 3B)。

Fig3. 膀胱癌不同时期关键基因表达的趋势

(4)外部数据验证:结合GSE87304、GSE124305和GSE52219三套数据,刻画上述13个关键基因在basal亚型和luminal亚型中表达情况。发现在GSE87304和GSE124305两套数据中,13个基因在basal亚型中的表达普遍比在luminal亚型中高(Fig 4A)。同时,考虑到药物的影响,在GSE52219数据集中,进一步刻画有药物反应组和无反应组病人之间13个关键基因的表达模式(Fig 4B),发现13个基因在有药物反应组和无反应组病人之间表达模式不差异。

Fig4. 外部数据集验证13个关键基因的表达模式

(5)互作网络:通过DisNor刻画13个关键基因与上下调基因之间的网络(Fig 5A),并进一步刻画关键基因的蛋白质互作网络(如Fig 5B)。通过Fig 5A发现,PAK1和CDK1的功能相关复杂,这两个蛋白质可以上调或下调关键基因,PPP1CA,它在BLCA中也被上调,可以抑制关键基因的表达。因此,通过分析发现,AURKB和PLK1是理想的上游基因靶点。

Fig5. 蛋白质互作网络

4.结论

(1)基于WGCNA方法总共识别了11个模块;

(2)通过计算与mRNAsi的相关性,得到与mRNAsi负相关明显的3个模块;

(3)进一步卡MM > 0.8和GS > 0.5,最终在上述3个模块中识别了13个关键基因,这13个关键基因在膀胱癌干细胞维持中起着重要的作用;

(4)通过控制上游的AURKB和PLK1基因可能有助于膀胱癌的治疗,这些基因可能是作为抑制膀胱癌干细胞特征的治疗靶点。

 

题外话:其实可以继续完成简单的湿实验的验证,那样就更有说服力啦.

参考文献:

AghaalikhaniN, Rashtchizadeh N, Shadpour P, Allameh A, Mahmoodi M. Cancer stem cells as atherapeutic target in bladder cancer. J Cell Physiol. (2019) 234:3197–206. doi:10.1002/jcp.26916

除特别注明外,本站所有文章均为SCI666原创,转载请注明出处,谢谢。sci666 » 文献解读:生信分析怎么进行“机制研究”

分享到: 更多 (0)

评论 抢沙发

  • QQ号
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

SCI666 学习、交流、分享

生信分析交流群综合科研交流群
切换注册

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

切换登录

注册

我们将发送一封验证邮件至你的邮箱, 请正确填写以完成账号注册和激活

'); })();