前面分享了NCBI的文献检索和跟踪
今天分享NCBI BLAST的学习心得~主要是NCBI网站的BLAST的使用,暂时不介绍本地BLAST+工具和API等等。
然后今天还大放送Pubmed插件的使用指南,八卦NCBI发展的简史(见列表文章)。
BLAST的全称“Basic Local Alignment Search Tool” ,顾名思义,在序列相似性搜索过程中BLAST执行“局部”对齐。
BLAST的搜索格式主要有以下几种:
NCBI手册中有一小章节介绍了BLAST工具,很遗憾这里并没有细致的操作说明(但是人家有跟你说去哪里看细致的说明)~我看完的感受是为BLAST建了一个框~
(如果需要关于BLAST的上述目录中的内容的PDF中文版文件~文章最后面我会给获取方式~~)
1、 打开BLAST
1)BLAST 的网站可以通过https://blast.ncbi.nlm.nih.gov/Blast.cgi直接进入;
2)从NCBI主页进入
2、 BLAST 页面介绍
1- 通用BLAST 标头
1.1 NCBI名称,可以链接到NCBI的主页;
1.2 BLAST 主页链接;
1.3“最新结果”链接;BLAST的搜索结果可以保存36h.
1.4“保存的策略”标签;列出了之前保存的一组搜索设置参数。它允许检查使用的搜索设置参数,快速重新启动这些搜索,以及下载用于在独立BLAST中共享或重复使用的特定策略。
1.5“帮助”选项;链接至BLAST ftp站点(ftp://ftp.ncbi.nlm.nih.gov/blast/或https://ftp.ncbi.nlm.nih.gov/blast/)上的帮助文档、教程、参考文献和有用下载目录的链接列表。
1.6 “我的NCBI”,一个来自NCBI的免费帐户,允许用户定制他们的网站偏好和管理他们在网站上执行的作品。可以注册NCBI账户,获得比较个性化的服务,参考NCBI数据库指南(一)。登录时执行的BLAST搜索允许通过“最近的结果”页面访问36小时的搜索结果。保存的策略将被永久保存。
2-提交搜索的工具之一:基本的BLAST
2.1 有五个BLAST搜索页面,每个页面执行特定类型的序列比对。具体如下:
类型 | 输入VS数据库 | 比对 | 程序和功能 |
nucleotide blast |
nucleotide vs nucleotide | Nucleotide | megablast:用于序列鉴定,种内比较 不连续megablast:用于种间比较,使用编码序列搜索 blastn:用于查询较短的查询,进行种间比较 |
protein blast | Protein vs protein | protein | blastp:一般序列识别和相似性搜索;Quick BLASTP:用Kmer匹配加速搜索速度非常相似的蛋白质;DELTA-BLAST:蛋白质相似搜索灵敏度高于blastp;PSI-BLAST相似性搜索:迭代搜索position-specific得分矩阵(PSSM)来确定蛋白质远亲家庭;PHI-BLAST:蛋白质与输入模式作为锚/约束 |
blastx | nucleotide (tr) vs protein | protein | blastx:用于识别核苷酸查询编码的潜在蛋白产品 |
tblastn | protein vs nucleotide (tr) | protein | tblastn:用于识别编码类似于查询的蛋白质的数据库序列 |
tblastx | nucleotide (tr) vs nucleotide (tr) | protein | tblastx:基于编码潜力来识别与查询相似的核苷酸序列 |
2.2 BLAST序列数据库的内容如下:
2.3 核苷酸BLAST比对参数设置
参数的选择:
可以设置以不同的速度和灵敏度进行核苷酸vs核苷酸搜索。
-
默认的megablast更适合例如识别输入查询和使用大型基因组查询进行搜索。
-
Discontiguous megablast 在寻找其他物种的相关序列方面效果更好。
-
blastn更适合短输入查询和识别短匹配,比megablast更适合跨物种搜索。
可以直接点击“ BLAST”按钮(F)将搜索提交给BLAST服务器进行处理。完成后将自动显示结果。
也可以点开Algorithm parameters 进行更多的参数设置;
上述就是核苷酸BLAST的参数设置的介绍;