头颈癌数据库HNCDB使用介绍

头颈癌(HNC)是全球第六大最常见的癌症。在过去的十年中,已经为HNC积累了大量经过批注的基因和药物数据。但是,通过查文献逐步寻找相关基因与药物费时费力。

因此,我国中山大学肿瘤防治中心的一个研究团队构建了头颈癌数据库HNCDB,通过整合PubMed摘要的文献文本挖掘和从GEO和TCGA数据库中收集HNC的高通量基因表达数据,来构建HNCDB,进行大量文本挖掘后进行人工整理,以收集有关HNC相关基因和药物的可靠信息。

网址:http://hncdb.cancerbio.info

HNCDB数据库主要包括三个分析模块:“Gene”、 “Connectivity Map”、 “ Analysis”。

01
Gene

包含从2,564个出版物中整理的1,173个与HNC相关的基因的全面信息,可以让你在短时间内高效准确的找到所研究基因相关信息。

02
Connectivity Map

包括有关从2032家出版物中人工策划的176种药物与1173种HNC相关基因之间的潜在联系的信息。

03
Analysis

我们可以对来自78个HNC基因表达数据集中的2403个样本进行相关性、差异表达、生存分析。

 

从这么多数据中人工整理出相关信息是难得又珍贵,让我们了解一下这个强大的数据库该如何使用呢?

输入网址http://hncdb.cancerbio.info,进入首页

PartⅠ  Gene

除了下载了NCBI GEO微阵列表达数据集和临床数据外,该部分还从Broad Institute的Firehose和TANRIC数据库中收集了TCGA样品的加工表达数据。

在这里可以查看肿瘤组织与正常组织对比数据分析或 HPV阴性和阳性对比分析结果, 热图的行为与HNC相关的基因,列为HNC相关的药物。热图中的每个单元格都会有一个得分,代表基因-药物对的缔合强度。

另外,包含HNC相关基因和药物的PubMed摘要的数量分别显示在第一列和第二列中。通过单击数字,我们可以查看讨论目的基因或药物的论文的详细信息,还可以通过在搜索框中搜索感兴趣的基因或药物进行分析。

点击任意数据方框后查看详情:
1
 基因基本信息

通过单击热图单元格,我们可以获得有关所选基因与药物之间的连接的详细信息。

 

2
基因相关报道
条状图将展现该基因在文献中的研究方法,包括下调、磷酸化、扩增、突变等等。

下方的表格中会提供更加详细的相关内容,包括文献来源、基因表达研究方法以及该基因在头颈癌中的作用等。如果发现感兴趣的文献,点击第二列链接,可以直接进入文章主页。

 

3
基因表达
在这里可以分析该基因在头颈癌中和正常组中表达差异,将鼠标移到箱型图上方可以查看详细信息。在上方会显示数据来源

4
生存分析
这里会展示不同数据集下该基因对头颈癌生存分析情况,红色代表高表达,蓝色代表低表达。

PartⅡ  Drug(Connectivity Map)

基因与药物相关性热图:

我们可以在文本框中搜索特定的HNC相关基因或HNC相关药物。分数越高,红色越深,代表药物和基因之间的相关性越强。

单击该单元格以获取有关HNC相关基因和来自DrugBank的有关所选药品的基本信息。包括该药物的类别、半衰期、作用机制、相关其他靶点等。

Part Ⅲ  Analysis

包括差异分析、相关性分析和生存分析三个部分。

在这里我们可以对从GEO和TCGA数据库收集的2403个HNC样本进行交互式分析。

1
“差异表达分析”
我们可以选择在“ HPV阳性”和“ HPV阴性”样本或“肿瘤”和“正常” HNC样本之间执行差异表达分析。

选择一个数据集类型和基因类型,点击submit

  

热图显示了所选数据集中显著差异表达的基因,红色代表HPV阳性,蓝色代表HPV阴性,颜色越深差异越显著。

 

切换其他数据集得到不同的结果,点击Show Result Table显示详细信息,包括logFC、AveExpr、P.Value、adj.P.Val,数据量太多,可以在右上方检索框中检索想要的基因。

点击表格中的基因,可以弹出该基因在两组数据中的高地表达差异,将鼠标移到箱线图上方可以显示相关数值信息。

 

2
相关性分析

选择Correlation Analysis选项

首先输入我们要执行表达相关分析的两个基因。
再选择参与分析的数据集。
点击“提交”,等待一分钟。

以EGFR和CD80为例,相关性结果以散点图的形式展现出来,双击圆点可以将此点删除,散点图会自动调整适应的视图大小,操作简单方便,让结果图更加美观。

3
生存分析
点击Survival Analysis选项

在这里我们可以获得单变量Cox比例风险回归分析的结果,以评估生存与目标基因表达之间的关系。

首先在文本框中输入一个基因,以进行生存分析。若想研究多个基因,则可以将基因列表输入“多基因表达生存分析”中的文本框中点击Submit以进行生存分析。

 

数据库的功能介绍到这里就结束了,这个数据库结合了TCGA和GEO两大数据库的癌症测序数据,又全面结合文献信息提供HNC相关药物,是为实验前期选择靶向药物、筛选相关基因标记物的有力工具,该数据库同时可以进行差异分析、生存分析、相关性分析等,正在头颈癌相关研究科研人员可以利用这个数据库发一篇不错的生物信息学文章。

工具介绍

利用Web of Science创建引文、期刊和检索词跟踪

2020-1-17 0:53:52

工具介绍

GEPIA2介绍:在线TCGA基因表达和生存分析的工具

2020-1-17 0:59:46

声明 本网站部分文章源于互联网,出于传递更多信息和学习之目的转载,并不保证内容正确或赞同其观点。
如转载稿涉及失效、版权等问题,请立即联系管理员;我们会予以修改、删除相关文章,请留言反馈
Notice: When your legal rights are being violated, please send an email to: [email protected]
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索