hello,大家好今天小编跟大家分享一篇文致病基因有关的数据库文章。CDG: An Online Server for Detecting Biologically Closest Disease-Causing Genes and Its Application to Primary ImmunodeficiencyCDG:检测生物学上最接近致病基因的在线服务器及其在原发性免疫缺陷中的应用我们在科研的时候,选择候选致病变异的常用方法是检查相关基因是否以前被报告为致病的。如果在缺乏已知致病基因的情况下,将候选基因与特定的遗传病联系起来可能是不太可靠的。为了有助于发现新的基因–疾病关联,最接近的致病基因(CDG)数据库就这样应运而生了,该数据库可用于从用户定义的基因或疾病列表中推断出与相关疾病最接近的基因。附上数据库链接:http://lab.rockefeller.edu/casanova/CDG。CDG的构建人类基因突变数据库(HGMD)是一个人工管理的变异数据库,其中包含了可能与人类遗传疾病相关或易患人类遗传疾病的变异。首先,作者从中挑选了5430个HGMD基因,这些基因被认为是高质量的致病或疾病相关的突变(主要与单基因疾病有关)。接下来,作者确定了人类基因连接组(HGC)中存在的13005个蛋白质编码基因,这些基因目前在HGMD数据库中没有被报告为致病基因。简而言之,HGC是整个人类基因(表示为节点)的网络,其中每条边代表两个人类基因之间的直接生物学距离。小编在这里解释一下,任意两个基因之间的HGC生物学距离定义为在包含大多数人类蛋白质编码基因的网络上,连接两个给定基因的最短路径中直接距离的加权总和。对于这13005个基因,首先从HGC数据库中检索每个基因的相应连接组,从而计算出它们的生物学CDG和相关疾病。对于任何给定的人类基因,基因特异性连接组包含所有其他人类基因的集合,这些基因按照它们与该特定基因的生物学距离进行排序。然后,按照HGC的生物学相关性标准,从p<0.01范围内的连接组中筛选HGMD已知的致病基因。CDG效能验证为了验证CDG,作者使用在构建原始CDG数据库时未使用的一组验证基因,将CDG与FunCoup和HumanNet的性能进行了比较。作为验证集,使用了两个外部数据集:(1)新的HGMD数据集,包含了该数据更新时新添加的339个致病基因;(2)来自ClinVar的84个致病基因。在此计算了每个基因中的CDG,并比较了CDG与FunCoup和HumanNet在预测基因数量,预测疾病与报道疾病符合度方面的效能。由于FunCoup和HumanNet不关联疾病,作者从HGMD中检索了与每个预测基因相关的疾病名称,并与预期的疾病名称进行比较。CDG的比较分析作者首先探索了13005个目前未被报告为导致临床表型的基因与HGMD已知致病基因之间的关系。通过HGC生物邻近性分析发现,每个基因平均与48个HGMD致病基因和7个疾病相关。如下图所示,92.9%的相关致病基因与相应的查询基因在一个或两个分离度之内。相比之下,所有人类基因对中只有13.9%在一两个分离度之内。