什么是Graded-seq?

Graded-seq的概念在2019年由韩斌和黄学辉课题组提出并发表于Nature Communication(Wang et al., 2019)。这种方法与常规BSA类似的是,它也是基于性状分离群体中按照性状选择子代个体构成混池(通常加上亲本)进行测序,并进行QTL定位的方式;但与常规BSA方法仅选择两个极端性状构成子代池不同,Graded-seq通过对数量性状的中间型性状也选择子代构成混池,构成“高值组”,“中值组”,“低值组”,形成三个或三个以上的混池。其实验设计如下图所示:

既然是超过2个混池,那么常规BSA方法使用的定位算法,无论是SNP-index还是ED(欧几里得距离)都不再适用,需要使用新的算法进行关联。而Graded-seq的核心,就是Ridit检验。

Ridit是relative to an identified distribution unit一词的缩写,它是一种非参数检验分析方法,用于按等级分组资料的比较。而对于多个混池测序数据,Ridit检验会对每个位点的等位基因频率进行计算,判断其是否显著偏离标准分布,得到一个p值。换言之,这个位点的p值越小,即代表这个位点与性状相关联的可能性越高。

这听起来是不是很像GWAS关联的逻辑?对每个位点计算一个p值,并且判断是否与性状连锁。但是与GWAS不同,Ridit检验的对象只有3-4个混池,远远及不上GWAS上百个个体的基因型数据,所以Ridit检验的结果用曼哈顿图的形式展现出来,我们会发现其噪音非常强烈。如下图,我们很难从中直观地判断我们的候选区间的位置。

所以研究者们就想到了一种降噪方法,选取一定大小的窗口(根据物种不同窗口的选择也不同,论文中提到水稻的最佳窗口大小是400kb),并且将窗口内的SNP位点进行统计,计算p值低于阈值的位点所占的比例。那么经过这种滑窗计算之后,上面的图被转换成了下面这幅背景非常干净的图:

这样,就可以非常清晰地对信号进行判断了。并且由于增加了一个以上的混池,Graded-seq的定位精度通常要优于仅使用两个极端池进行的常规BSA,通常可以有数倍的提升,对于水稻等常规作物可以定位到几百kb大小的区间。如果所研究的性状是数量性状,并且有一个足够大的F2分离群体,不妨考虑一下使用Graded-seq进行定位工作,也许能够得到意想不到的惊喜。

当然了,如果得到一个足够小的区间,我们也就可以更方便地展开精细定位的工作,如何进行精细定位,我们后面会再为大家介绍。

参考文献:

Wang, C., Tang, S., Zhan, Q. et al. Dissecting a heterotic gene through GradedPool-Seq mapping informs a rice-improvement strategy. Nat Commun 10, 2982 (2019).

生物信息学

什么是SNP?

2020-6-29 18:08:05

生物信息学

查找病菌中与感染宿主相关的基因

2020-6-30 17:50:52

声明 本网站部分文章源于互联网,出于传递更多信息和学习之目的转载,并不保证内容正确或赞同其观点。
如转载稿涉及失效、版权等问题,请立即联系管理员;我们会予以修改、删除相关文章,请留言反馈
Notice: When your legal rights are being violated, please send an email to: [email protected].
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索