查找病菌中与感染宿主相关的基因

近年来,细菌感染在全世界范围内呈上升趋势,对人类的健康造成了非常大的影响。然而,许多潜在的细菌发病机制仍不清楚。新型抗菌药物的开发在很大程度上依赖于我们对细菌感染机制的理解。因此,深入了解细菌感染是如何在体内发生的,以及感染宿主需要哪些细菌基因是非常重要的。
最近出现的BacFITBase数据库正是为了上述目的而出现的,其方法文章请参考[1]。BacFITBase可用于系统地描述与宿主感染相关的细菌蛋白质,以便识别出新的抗生素靶点。BacFITBase,基于15项不同的研究涉及15种病原菌和5种脊椎动物的10种不同组织(表1),超过90,000个条目包含体内感染条件下单个基因对细菌适应度(fitness)的贡献信息(用转座子诱变法测定)。
 
表1 BacFITBase中包含的病菌、宿主、和组织类型
下面具体介绍这个数据库的使用方法
使用BacFITBase需要JavaScript支持,请确定你的浏览器已经启用了它。
一、使用BacFitBase的Search功能
1.1 搜索基因或蛋白质
打开BacFitBase网站(www.tartaglialab.com/bacfitbase),输入这些内容都可以进行搜索:gene symbols、gene locus identifiers、NCBI protein identifiers、UniProt protein accessions或基因产物的名称。然后,点击Search按钮。建议使用NCBI protein identifiers。
图1 搜索基因或蛋白质(以polyphosphate kinase为例)
 
1.2 搜索宿主和病菌
对特定宿主和/或病菌进行搜索,可以在下拉菜单中选择宿主和/或病菌名称,然后按Search按钮。如果在搜索框中没有输入基因或蛋白质名称,则会生成一个完整的基因列表。
图2 搜索特定宿主和/或病菌
 
1.3 搜索结果
点击Search后,在“搜索结果”页面会显示与所选搜索词和物种匹配的细菌基因的列表。
图3 搜索polyphosphate kinase的结果
 
图4 搜索Cow + Escherichia coli O157:H7 str. EDL933的结果
 
在图3中,与polyphosphate kinase匹配的列将以绿色突出显示。搜索功能也支持部分匹配,比如输入kinase也可以进行搜索。对于每个病菌物种和基因,搜索结果页面会显示所有可用宿主、组织和感染后时间点的最低适应度z值(Fitness z-Score),以及相应的p值。点击右上角的Download table按钮,可以下载结果表格。点击图3“搜索结果”页面上任意一个带超链接的名称,比如病菌、蛋白、基因、产物等,即会在新的页面上呈现具体信息(图5)。
注:Fitness z-Score < 0,表示特定基因很可能与感染过程相关。
图5 Salmonella enterica Serovar Typhimurium SL1344中polyphosphate kinase的具体信息
 
二、使用BacFitBase的BLAST功能
图6 BLAST页面
图7 BLAST结果页面
 
当你感兴趣的蛋白质不在BacFitBase数据库里,你可以使用BLAST序列比对来搜索相似的蛋白质。点击网页上方的“BLAST”,即可切换到BLAST页面(图6)。输入符合格式要求的序列,即可进行比对。如果从比对结果中能找出一个具有低z值(和低p值)的相似蛋白质,这表明查询的序列很可能与感染有关(图7)。默认情况下,具有最高Bit scores的BLAST结果将在第一行显示,而具有100%序列相似性的匹配将以绿色突出显示。点击右上角的Download table按钮,可以下载结果表格。点击图7“比对结果”页面上任意一个带超链接的名称,即会在新的页面上呈现具体信息。
三、使用BacFitBase的Browse功能
 
图8 Browse页面
 
点击网页上方的“Browse”,即可切换到Browse页面(图8)。Browse页面提供了BacFITBase数据库中所有条目的概述。你可以在顶部的选框中选择感兴趣的病菌物种(红色框出)。数据表按重要性和适应度z值排序,排最上面的适应度z值最小。点击图8页面上任意一个带超链接的名称,即会在新的页面上呈现具体信息。
四、使用BacFitBase的Download功能

图9 Download页面
 
如果你需要下载整个BacFITBase数据库以进行本地分析,请单击“Download”页面上的可用链接(图9)。目前BacFITBase是v1版。
更详细的BacFITBase使用说明,请查看页面顶部的“Tutorial”。
参考文献
Rendón JM, et al. BacFITBase: a database to assess the relevance of bacterial genes during host infection. Nucleic Acids Research, 2020. 48(D1):D511-D516.
生物信息学

什么是Graded-seq?

2020-6-29 18:08:23

生物信息学

pandas中的数据处理利器-groupby

2020-6-30 21:36:46

声明 本网站部分文章源于互联网,出于传递更多信息和学习之目的转载,并不保证内容正确或赞同其观点。
如转载稿涉及失效、版权等问题,请立即联系管理员;我们会予以修改、删除相关文章,请留言反馈
Notice: When your legal rights are being violated, please send an email to: [email protected].
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索