今天跟大家分享的是十一月份发表在AGING杂志上的一篇文章,主要是基于DNA甲基化对儿童年龄进行定量分析。目前已经有许多研究开始基于DNA甲基化的改变对成人年龄进行预测。那么,在儿童中DNA甲基化和年龄又有何关系呢?就让我们通过今天的文章一探究竟吧!
DNA methylation profile is a quantitative measure of biological aging in children
基于DNA甲基化对儿童的生物学年龄进行预测
在本研究中,作者通过11个数据集中716份血液样本的DNA甲基化数据,构建出一个DNA甲基化的儿童年龄预测模型(9-212个月)。最终模型中共包括111个CpG位点,大部分位于与发育和衰老相关的基因中。本模型显示出较高的精度,得出的DNA甲基化年龄与实际年龄之间的相关性为98%,误差较小。另外,研究者还基于这个甲基化模型对儿童衰老模式和疾病之间关系进行评估,发现幼儿早期接触铅会增加男孩的衰老速度,短期重组人生长激素治疗对儿童的衰老影响不大等。本模型可以有效地检测出生命早期的表观遗传变化和健康失衡状态,进而完成对表观遗传干预年龄相关疾病的进一步探索。
一. 建立儿童特异性甲基化年龄预测模型
1. DNA甲基化数据集的特征
本文数据主要来源于由Illumina 27K或Illumina 450K阵列平台生成的公开的DNA甲基化数据集,共包括11个数据集的716名9 – 212个月健康儿童的DNA甲基化数据,具体特征如表1和图1A所示。
表1.DNA甲基化数据集的样本特征
图1.样本及预测模型的特征
图2.DNA甲基化年龄预测模型构建过程
2. 构建DNA甲基化儿童年龄预测模型
通过将独立性筛选和惩罚性多元回归(弹性网)结合起来,在训练数据中建立基于甲基化的儿童年龄预测模型,并将该预测值称为DNA甲基化年龄(图2)。通过K倍交叉验证(k = 10)划分训练集和测试集,通过多次训练出的最佳模型包括可以准确预测年龄的111个CpG位点。在训练集中该模型预测性能准确,年龄与预测年龄之间的相关系数为98%,误差为5.9个月(图1B)。当在测试集中进行验证时,准确性保持不变(图1C)。年龄对111个CpG位点的影响如图1D所示。
3. 年龄相关CpG位点的功能识别
为了确定111个年龄相关CpG位点的生物学功能,我们对这些CpG位点相关的基因进行GO富集(生物学过程、细胞成分和分子功能,P < 0.05)和KEGG信号通路富集(图1E,补充图1C和1D)。
4. 与其他年龄预测模型的比较及性能评估
对不同年龄预测模型中所识别到的年龄相关CpG位点进行交叠,一致性并不高(图A)。为进一步探索该模型的准确性和适用性,研究者使用来自数据集GSE56105中的67对单卵双胞胎的数据进行验证。从理论上讲,拥有相同遗传背景和生活环境的健康单卵双胞胎的DNA甲基化年龄应该是相似的。首先,基于本模型和常用的多组织预测方法计算单卵双胞胎的DNA甲基化年龄。研究发现,本模型预测出双胞胎的实际年龄更为接近,DNA甲基化年龄的分布也更集中(图3B)。其次,研究者通过比较这两个模型计算出的双胞胎1和2的DNA甲基化年龄发现本预测的双胞胎之间DNA甲基化年龄和年龄差的绝对值都没有显著差异(图3C,E),而使用其他方法进行预测时, 二者DNA甲基化年龄存在显著差异(图3D, P = 0.025,配对t检验)。因此,本预测模型的性能更为优越。
图3. 与其他年龄预测模型的比较
二. 儿童的衰老模式
本模型不仅可以用于儿童甲基化年龄的预测,还可以揭示儿童的个体生物学差异和老龄化趋势。基于年龄加速差 (AAD, DNA甲基化时代-实际年龄)和甲基化老化速率 (AMAR,DNA甲基化是年龄/实际年龄) 检查这些差异是否是真实的生理差异。科学家们通过研究发现,儿童年龄加速不受性别或者种族的影响。另外,观察在0到18岁的健康儿童中年龄加速的趋势,发现年龄加速在4岁前接近于0,5岁后逐渐上升,12岁后下降为负值(图4A) ,以及儿童中期的AAD和AMAR显着高于幼儿期,青春期的AAD和AMAR显着低于儿童中期(图4B,C)。在另外一套独立的DNA甲基化数据集中同样可以发现,青春期前的老化率明显高于青春期后(图4E和4F)。另外,在儿童中期,女孩的衰老速度似乎略快于男孩(图4D)。
图4. 儿童不同阶段的年龄加速
三. DNA甲基化年龄与疾病的关系
基于三套数据集分析DNA甲基化年龄与儿童潜在健康问题,如儿童疾病、短期干预措施和长期环境暴露等问题之间的关系。研究者发现,在儿童中期,自闭症儿童比健康儿童衰老更快(图5A, B);早期接触铅会增加男孩的衰老速度,但不会增加女孩的衰老速度(图5C, D);短期重组人生长激素治疗对儿童的衰老率影响不大。
图5. DNA甲基化年龄与疾病的关系
今天的文章内容大概就是这些,让我们来总结一下吧。首先研究者基于DNA甲基化数据构建儿童年龄预测模型,接着通过与其他模型的比较论证本模型的优越性。另外,研究者还基于本模型探索DNA染色质年龄与儿童衰老模式以及疾病之间的关系。思路清晰又简单,小伙伴们掌握的怎么样呢!对了,我觉得这篇文章中很有意思的一点在于双胞胎DNA甲基化数据的使用,感兴趣的小伙伴别忘了自己偷偷学习下哦。
今天的文献解读到这里就结束了,我们下次再见吧。