快速准确地对患者的COVID-19病情进行早期临床评估至关重要。不过,尚无直接可用的预测性生物标志物可以识别出需要立即给予临床关注的患者,并预估他们的相应死亡率。
2020年5月14日,华中科技大学同济医学院附属同济医院在Nature Machine Intelligence上发表了一篇题为An interpretable mortality prediction model for COVID-19 patients 的论文。该研究指出,机器学习工具根据中国武汉485名COVID-19感染者的血液标本挑选三个生物标志物,预测患者的死亡率,这三个生物标志物分别是乳酸脱氢酶、淋巴细胞和超敏C反应蛋白水平,可以至少提前十天预测患者个体的死亡率,准确率超过90%。

该团队用于建模的样本为2020年1月10日至2月18日间从同济医院的485患者中采集,团队从中寻找可靠且有意义的死亡风险标志物。其中110个样本用于测试模型,其余375例用于建模。在分析所囊括的375例病例中,201例在COVID-19康复后出院,其余174例死亡。
作者根据机器学习算法设计了一套数学建模方法,这些算法专门用于识别最能预测患者死亡率的生物标志物。作者在算法中将问题变成一个分类任务,输入数据包括基本信息、症状、血液标本,以及普通、重症、危重症患者的实验室检查结果,如肝功能、肾功能、凝血功能、电解质和炎症因子。
该模型将乳酸脱氢酶(LDH)、淋巴细胞、超敏C反应蛋白水平选为识别病危患者的三个最关键的生物标志物。这一结果与当前的医学知识相符,即LDH水平较高本身与不同疾病出现的组织损伤有关,包括肺炎等肺部疾病。大部分患者在住院期间都采集过多次血样,但模型只使用了患者最终标本的数据。尽管如此,模型也适用于所有其他血液标本,对生物标志物的预测潜力也可以估计。
作者总结称,他们的模型可以通过简单直观易解读的临床检查来精准快速地量化死亡风险。作者还建议淋巴细胞或能作为一个潜在的治疗靶标,这也得到了临床研究的支持。作者指出,随着可用的数据越来越多,有必要对算法进行重复以达到更高的准确率。