现在在进行医学科学研究的时候,如果要研究一个方向,我们经常会去查一下网上都有哪些数据库可以让我们使用,通过数据库的预测来进行确定我们自己的方向。但是要怎么找这些数据库呢?今天就来和大家分享一下,我们是如何查找目标数据库的。
01
搜索引擎检索
作为一个现代人,基本的检索能力还是要有的,遇事不决问百度。比如我们想要查找转录因子预测,那就在百度检索 “转录因子预测数据库”就行。基本上,关于一些经典的研究方向都可以检索到相关的数据库教程的。
如果中文检索,没有发现很好的结果怎么办呢?可以尝试着利用英文去检索的。这个时候如果有条件的话,推荐使用谷歌,如果没有条件的话,可是使用必应的国际版。例如,我们搜索 “promoter prediction”,尝试英文检索,用多了会发现真的资源比中文多一些。
02 NAR杂志总库
NAR 是 Nucleic Acids Research(核酸研究)一个杂志的简称。这个杂志目前一个11分的一个杂志,主要发表的文章就是网络数据库。由于经常发表网络相关的数据库,所以他们也把他们杂志发表的数据库汇总了到一个网站。也做好了相关的分类。我们可以在这个网站里面查找自己想要使用的数据库。这个总库的网站是:https://www.oxfordjournals.org/nar/database/c/
另外这个杂志,每一年都会公布他们杂志社每一年新发表的数据库。比如,今年最近的数据库汇总:
03 Pubmed 检索
很多的网络数据库都是有相关的文章发表的。只要是有文章发表的话,那我们就可以通过pubmed来检索到。对于这类网络数据库,基本上在他们的摘要里面都会提供网址的。由于网址都有固定的开头结果,所以我们只要利用这样的固定开头结构和想要查看的关键词检索就行的。目前用到的固定开头结构有:https | http | ftp| file,因此固定开头加上关键词就可以进行检索了。
假如我们想要检索和m6A相关的数据库。
通过检索结果,我们就可以找到相关发表的和m6A有关的数据库了。当然中间肯定有一些不是的。这个就需要自己筛选了。
通过对于数据库的检索,我们也能发现一个规律就是这些数据库题目基本都是:“数据库名称+数据库简单介绍”,所以很容易就能识别是不是数据库文章了。
基于以上两个原理,我们写了一个R语言的脚本(代码化的小软件吧)。我们只需要把这个脚本放到我们工作目录下,然后运行下面的代码。
source("DataBaseSearch.R") DatSetSearch("m6A") ###双引号里面填写我们想要检索的内容即可
就可以获得一个和?在pubmed检索结果类似的一个表格。表格里面包括,
如果想要基于这个来选择使用的数据库的话还是有两点建议的
- 使用发表年限较近的数据库,毕竟最近的包括的数据量相对来说大一些,结果可能更加准确一些。
- 使用被引次数多的,被引说明就是有人用了并且证明好用。