简单易懂,事半功倍。
提高接受率,人人国自然!

零代码TCGA数据库下载第三期:cBioPortal网页

一入江湖终不悔,奈何高人这么多。各位sci666的朋友,大家好,又见面了,今天我们继续分享关于TCGA数据下载的专题,前面我们分别介绍了基于TCGA官网下载RNAseq数据,基于UCSC-XENA下载TCGA的RNAseq数据。

这次我们继续给大家推荐轻轻点击鼠标下载TCGA的网页版工具—-cBioportal工具这是一个专业分析TCGA数据的网站,相信很多肿瘤研究方向的老师同学都不陌生。网站在TCGA数据可视化中做的很不错,可以直观的看到数据以图和表的方式呈现,帮助大家更好使用TCGA这个资源丰富的数据库

我们之前写过一篇懒人如何分析TCGA数据之cBioportal网站,内容侧重于分析基因的预后生存,突变,拷贝数变异等信息,这篇推文侧重于如何通过cBioportal下载TCGA的RNAseq数据及临床信息

下面我们就进入正题,网站主页是这样的:                      

1

cBioportal网址

http://www.cbioportal.org/index.do

最新的cBioportal进行了更新,增加了一个Quick Search按钮,可以快速的进行数据检索,那我们先看看该数据库的使用。

2

先点击Query,进入该界面,接着点击2处的数据来源

 

 

3

点击TCGA provisional,进入TCGA数据站,会出现下面的界面。

 

可以看到一共有32个TCGA数据集,我们点击第一个肾上腺皮质癌,点击进去, 点击view summary

便会出现下面的界面

可以看到主要是包括了CNV的信息和Matution信息,Mutation 按照突变频率进行了排序,可以看到在肾上腺皮质癌中ZFPM1突变频率最高,CNV主要涵盖了两类分别是del和amp。当然还有一些生存曲线的图形。

4

点击Clinical Data 进入该疾病的临床数据存储站,出现下面的界面,点击下载按钮,便可以下载该数据。

可以看到在右侧的Active Data Hubs 包括了很多,不仅涵盖了TCGA还包括ICGA,Pan-Cancer Atlas Hub等数据节点。因为我们是研究TCGA,我们只需要选中TCGA就可以了。

5

前面说了这麽多,还是没有讲到TCGA的RNAseq数据的下载,那我们来看一下怎么下载,首先我们点击data sets,进入下面的界面。

 

6

接着我们找到Adrenocortical Carcinoma (TCGA, Provisional),进行数据下载

下载之后的数据如下,是一个压缩包,我们继续解压,发现包含的数据,很多,真的是一次下载多次使用。

RNAseq的数据类型有两种,选择一种即可。我们发现我们下载的数据不仅包括了RNAseq数据还包括其他各种数据,比如突变数据,450K甲基化数据等,几乎就是把一种疾病的所有类型数据全部给下载了。

7

除此之外,我们还可以下载关键通路上的基因的表达信息,一顿操作猛如虎,如下1-7个步骤,可以下载AR信号通路上的10个基因的表达信息, 选中Transpose data matrix, 便可以使得下载的数据为表达矩阵的格式:

 

结果文件如下, 行是样本名,列是基因名:

8

 仔细观察cBioproal,还提供了R包,来调用数据

OK,今天的教程主要是带大家体验TCGA的第三种非编程数据下载方式,下期我们继续推出TCGA的第四种方式下载,今天的数据下载先讲到这,下期再见。

除特别注明外,本站所有文章均为SCI666原创,转载请注明出处,谢谢。sci666 » 零代码TCGA数据库下载第三期:cBioPortal网页

分享到: 更多 (0)

评论 抢沙发

  • QQ号
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

SCI666 学习、交流、分享

生信分析交流群综合科研交流群
切换注册

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

切换登录

注册

我们将发送一封验证邮件至你的邮箱, 请正确填写以完成账号注册和激活

'); })();