1. sci666首页
  2. 实用技巧
  3. 生物信息学

候选基因里没有SNP和InDel变异是定位错了吗?

我们在利用BSA或者其他方法精细定位候选基因后,可能会发现双亲在该区间没有多态性,是否就说明定位区间是假阳性的呢?其实并不不一定。不同物种的表型分子机制丰富多样,有SNP引起的,有InDel引起的,有外显子变异引起的,也有启动子区域变异引起的。目前的基因定位和克隆研究中多数是这种情况。但是也有少部分由DNA的甲基化引起,典型的比如“春化”作用中低温改变甲基化状态调控FLC基因的表达进而影响植物开花(Sheldon et al., 2000; Berry et al., 2015)。最近北京市农林科学院张丽课题组在Journal of Experimental Botany上发表的一篇萝卜食用根颜色性状分子调控机制就和甲基化有关(Wang et al., 2020)。作者结合了QTL-seq和转录组分析确定了控制萝卜食用根颜色性状的候选基因(RsMYB1),该基因负责红肉萝卜中的花青素积累。但是,在红肉(MTH01)和白肉(JC01)系中的RsMYB1基因的编码区和调控区中未发现序列变异。随后的分析表明,主根白肉突变体是RsMYB1启动子中DNA甲基化改变的结果。下面就具体的阐述下本文的思路和方法。

作者的双亲选用衍生于红肉绿皮的地方种“心里美”的自交系MTH01,由MTH01突变的白肉材料JC01。之后构建了一个包含646个子代的F2群体用于基因定位(此外,还有F1以及BC1用于判定该性状的遗传规律)。又收集了111个萝卜的栽培种/地方种(含红肉,淡绿色肉,白肉表型)用于候选基因的单倍型分析。萝卜的颜色表型用HPLC测定花青素含量量化。

基因定位用QTL-seq的策略,依据F2群体的表型,构建了白肉和红肉的混池,每个混池包含30个个体,每个混池每个个体平均测序2X。精细定位采用KASP分型技术,在QTL-seq初定位的区间设计引物,在双亲和646个F2子代进行genotyping,并构建QTL区间的连锁图谱,结合表型QTL定位。

为了辅助候选基因的筛选,对双亲进行转录组测序以及qRT-PCR验证。

通过QTL-seq将QTL定位在7号染色体2.08Mb的区间。在该区间设计KASP引物,连锁分析后发现仅有R7-17024168标记和性状紧密连锁。无法确定区间,作者又重新更换了参考基因组序列(Aokubi DH)后重新进行QTL-seq分析,这次定位区间总共有281 Kb,其中包含了16个候选区间。其中6个scaffolds通过BLAST锚定到候选区间。转录组测序发现6个scaffold中注释到183个基因,其中9个在双亲之间有差异表达。2个基因(MYB1和MYB2)被注释参与花青素合成,均为MYB类型的转录因子。通过RT-PCR分离到其中的MYB1。序列比对发现MTH01中的MYB1序列和参考基因组中存在1-3个SNP,其他分析也表明MYB1更有可能是控制颜色的基因。

候选基因里没有SNP和InDel变异是定位错了吗?

精细定位的思路(精华)

通过long range PCR 和染色体步移克隆了亲本MTH01中MYB1基因的编码区和promoter区。这时候,故事的高潮就来了。作者发现该基因在双亲之间缺少变异信息。此时,作者应该是非常痛苦,千辛万苦拿到的候选基因,竟然在双亲之间没有差异,应该也怀疑过人生。。。好在作者并未放弃,作者在双亲MYB1基因的上游154bp处发现有一个En/Spm家族的CACTA 转座子。通过查阅大量文献发现,该类型转座子在基因组上分布广泛,而且影响邻近基因的表达,这个信息提示作者,有可能是DNA的甲基化差异导致表型的差异。然后通过McrBC-PCR检测该转座子附近的甲基化情况,发现在亲本JC01的CACTA promoter区高度甲基化,在转座子上游甲基化程度却并不明显。作者继续使用亚硫酸盐处理对全基因组的甲基化鉴定。最终找到BS1位点,该位点处在双亲之间的甲基化差异显著,而且,亲本MTH01甲基化程度高于JC01。MTH01的嵌合突变体也支持CACTA promoter区甲基化和表型之间的关联。

后续就是互补的实验了,由于萝卜的转基因体系尚不成熟,作者仍然采用造突变体的策略,JC01亲本的种子,利用不同浓度的5-azaC处理,最终在3000个种子中发现了8个有表型变异的材料。在T1,T3,T4和T6代中均发现了根中花青素含量的上升,MYB1-CACTA表达也上调。其他的VIGS验证等实验就不再赘述。

靠谱er点评:
本文过程还是非常曲折,首先一个是,由于不同物种参考基因组组装完整度差异较大,对于一些参考基因组组装一般的物种,在定位结果不好的前提下,可以考虑换个参考基因组重新BSA定位。其次就是筛选到候选基因后,发现双亲之间并无SNP或者InDel的差异,在确认各方面无误的前提下,就要考虑甲基化的差异导致表型差异了。另外,针对非模式物种,无法做转基因实验,考虑做VIGS,以及利用自然群体进行单倍型分析,让结果更加robust。最后靠谱er提示一下就是,基于一个较大规模的F2群体,进行BSA定位(或者Graded-seq定位),然后继续在定位区间内涉及SNP标记进行局部区域的连锁图谱构建和QTL定位,能更好的定位目标性状位点,同时结合转录组测序联合分析,加快候选基因的筛选。这个思路未来一段时间将会长期霸占精细定位思路的榜首。
参考文献
Berry S, Dean C. Environmental perception and epigenetic memory: mechanistic insight through FLC. The Plant Journal, 2015, 83(1): 133-148.
Sheldon C C, Rouse D T, Finnegan E J, et al. The molecular basis of vernalization: the central role of FLOWERING LOCUS C (FLC). Proceedings of the National Academy of Sciences, 2000, 97(7): 3753-3758.
Wang Q, Wang Y, Sun H, et al. Transposon-induced methylation of the RsMYB1 promoter disturbs the anthocyanin accumulation in red-fleshed radish (Raphanus sativus L.). Journal of Experimental Botany, 2020.

这些可能会帮助到你: 问答社区 | 共享百度SVIP | 留言建议

欢迎入群交流:生信分析群: 732179952 · Meta分析群: 797345521 · 医学科研交流群: 797345521

发表评论

电子邮件地址不会被公开。 必填项已用*标注