1. sci666首页
  2. 实用技巧
  3. 工具介绍

通过Uniprot数据库获取蛋白序列并进行序列比对

很多情况下,我们为了研究一个蛋白的重要性,需要查看这个蛋白在多个物种,以及与这个蛋白家族中其它蛋白的相似性,并构建进化树。今天我们就来说一下具体的方法,先介绍蛋白序列的获取和序列比对。

 

以Sox家族的蛋白为例,我们首先通过Uniprot数据库(http://www.uniprot.org/)获取蛋白序列:

通过Uniprot数据库获取蛋白序列并进行序列比对

我们直接在搜索框中输入sox,单击search:

通过Uniprot数据库获取蛋白序列并进行序列比对

这样我们能看到各个物种中展示的结果,其中人里面有175个:

通过Uniprot数据库获取蛋白序列并进行序列比对

我们全部选择后单击左上角的下载,然后选择fasta格式的非压缩文件后直接单击GO就可以了:

通过Uniprot数据库获取蛋白序列并进行序列比对

这是打开后是序列,我们看到包括了Sox9,Sox2,Sox11等蛋白的序列,这样我们就拿到Sox家族的各条序列了,接来下我们进行序列比对。

 

接下来我们要用的工具软件是MEGA,可以从官网(http://www.megasoftware.net/)下载:

通过Uniprot数据库获取蛋白序列并进行序列比对

下载后打开后的界面:

通过Uniprot数据库获取蛋白序列并进行序列比对

接下来我们导入刚才查到的序列,单击Align选项下的Edit/Build Alignment:

通过Uniprot数据库获取蛋白序列并进行序列比对

创建新alignment,选择蛋白protein:

通过Uniprot数据库获取蛋白序列并进行序列比对

打开新的界面:

通过Uniprot数据库获取蛋白序列并进行序列比对

在这里面我们直接把刚才的序列复制进来就好了:

通过Uniprot数据库获取蛋白序列并进行序列比对

接下来我们进行比对,在Alignment里面有Alignment by ClustalW和Muscle两个选项,其中ClustalW常用于两序列比对,Muscle速度快,用于序列多的时候进行的比对,这里我们选择Muscle,选择所有序列后进行比对:

通过Uniprot数据库获取蛋白序列并进行序列比对

这里我们用默认的参数进行计算,序列比较多的话需要等一下:

通过Uniprot数据库获取蛋白序列并进行序列比对

上面是比对好的结果,图还是比较漂亮的,不过软件在导出图片的时候没有给出方法,大家先截图使用吧。

 

下期我们来介绍构建进化树的方法,看看如何做出下图的进化树:

通过Uniprot数据库获取蛋白序列并进行序列比对

这些可能会帮助到你: 问答社区 | 共享百度SVIP | 留言建议

欢迎入群交流:生信分析群: 732179952 · Meta分析群: 797345521 · 医学科研交流群: 797345521

发表评论

电子邮件地址不会被公开。 必填项已用*标注