在蛋白质研究中,经常会用到一些数据库,今天对这些数据库做一个汇总,具体如下:
蛋白质结构域预测工具
Esignal:http://motif.stanford.edu/esignal/
信号传导系统蛋白的结构域预测工具,凡是涉及到信号传导系统的蛋白用这个预测效果最佳
SignalP:http://www.cbs.dtu.dk/services/SignalP/
信号肽预测工具,适合定位于非胞质位置的蛋白质
Emotif:http://motif.stanford.edu/emotif-search/
结构域预测工具,由于其用motif电子学习的方法产生结构域模型,故预测效果比Prosite好
Ematrix:http://fold.stanford.edu/ematrix/
是用Matrix的方法创建的结构域数据库,可与emotif互相印证。其速度快,可快速搜索整个基因组
InterPro:http://www.ebi.ac.uk/InterProScan/
EBI提供的服务,用图形的形式表示出搜索的结构域结果
TRRD:http://wwwmgs.bionet.nsc.ru/mgs/gnw/trrd/
转录因子结构域预测的最好数据库
Protscale:http://cn.expasy.org/cgi-bin/protscale.pl
可分析该序列的各种性状如活动度、亲水性(Kyte&Doolittle)、抗原性(Hopp&Woods)等
通过寻找MOTIF和Domain来分析蛋白质的功能
A. MOTIF是蛋白中较小的保守序列片断,其概念比Domain小
PROSITE:http://cn.expasy.org/tools/scanprosite/
是专门搜索蛋白质Motif的数据库,其中signature seqs是最重要的motif信息
B. Domain:若干motif可形成一个Domain,每个Domain形成一个球形结构,Domain与Domain之间通常像串珠一样相连
Pfam:http://www.sanger.ac.uk
可以搜索某段序列中的Domain,并以图形化表示出来。这个数据库非常重要。用法:在搜索栏中输入蛋白的swissprot的序列号
CDD:http://www.ebi.ac.uk/interpro/
NCBI搜索时在每个蛋白质Link旁都有Blink,Domains两个链接。Domains可以直接看到这个蛋白的确定的结构域。如果要在CDD数据库寻找Domain信息,则可进入Blink链接,再进行CDD搜索,就可以了。看Domain的详细信息可以到:http://www.ebi.ac.uk/interpro/上进行搜索查看
蛋白跨膜序列分析
kyte-Doolittle疏水性分析:每个等于或高于1.8的峰都可能是跨膜结构域
蛋白质结构预测工具
PREDATOR:http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_preda.html
蛋白质二级结构预测工具
蛋白质糖基化位点的预测
http://bioresearch.ac.uk/browse/mesh/C0017982L1222670.html
这是个综合连接,包括:DictyOGlyc prediction server,NetOGlyc prediction server,YinOYang server,META II PredictProtein server,O-GLYCBASE,GlycoMod tool
蛋白质结构数据库
MMDB:http://www.ncbi.nlm.nih.gov/Structure/MMDB/mmdb.shtml
NCBI的蛋白质结构数据库,要使用Cn3D v4.1软件观看
PDB:http://www.rcsb.org/pdb/
Protein Data Bank, 要使用Swiss PDB viewer软件观看
蛋白质综合数据库
PIR:http://pir.georgetown.edu
Uniprot http://www.pir.uniprot.org