转录组测序是研究特定的生物学样本,包括个体、组织、特定部位、细胞在特定时间所表达的全部转录本。近十几年来,随着基因测序技术的快速发展,转录组测序也得到快速发展,也越来越成为分子生物学课题和实验中非常常规的一种实验手段。
自从有了转录组测序技术,我们就在一直讨论到底需要多少个生物学重复才能满足要求?一般认为,至少要有3个生物学重复,但这仅仅是从数据分析的角度,回归实验本身,3个生物学重复,真的够吗?
有一篇文献,专门讨论了关于转录组生物学重复的问题,作者来自英国邓迪大学,发表在RNA杂志。
先说结论:
1)在任何条件下,都应该保证有至少6个生物学重复;
2)如果要关注差异表达基因,尤其是差异表达倍数不大的基因,建议至少12个生物学重复。
下面,我们看一下分析结果。
1)生物学重复数量与真实差异基因的关系
随着生物学重复的增加,鉴定出真实差异基因的比例由19%增加到74%
2)不同阈值下平均真阳性率与生物学重复数之间的关系
随着生物学重复的增加,平均真阳性率增加
3)生物学重复数量与真/假阳性/阴性基因数量的关系
随着生物学重复的增加,真阳性明显升高,假阴性明显降低
4)生物学重复与差异基因倍数的关系
可以看出,T设置较大(差异倍数要求较高)时,生物学重复的影响较小;当T设置较小(差异倍数要求较低)时,生物学重复的影响就很大了。也就是说,对于差异倍数不大的差异基因,在生物学重复较多时,才更可信。
以上是对本文几个重要结果的描述。
另外,对于不同来源的生物学样本,生物学重复的需求量也不同,比如对于临床样本,个体差异可能会比较大,建议尽量提高生物学重复的数量,以提升真阳性差异基因;比如对于培养的细胞样本,由于重复之间比较稳定,设置适当的重复即可。