今天和大家分享一篇2019年发表在柳叶刀子刊《Ebiomedicine》上的一篇文章。文章以我国某地区CDC中AIDs患者数据为基础,建立并验证了预测接受抗逆转录病毒疗法的患者预后的Nomogram。文章整体结构清晰,方法严谨,有众多可学习之处。欢迎大家前来交流。
Title: Development and validation of a prognostic nomogram for HIV/AIDSpatients who underwent antiretroviral therapy: Data from a Chinapopulation-based cohort
标题:建立和验证接受抗逆转录病毒治疗的AIDs患者预后的nomogram:来自中国以人群为基础的队列的数据
文章主要内容:
1. 通过PSM,研究人员纳入750例患者纳入本研究,525例归入训练集,225例归入验证集。通过表格展示训练集和验证集患者基本信息,并进行统计学检验。
这一步其实有一个特殊之处,那就是进行了PSM,全称为倾向性匹配评分(Propensity Score Match)。其实这一方法的最大重要主要体现在回顾性队列研究中。
图 1. 23分PSM研究
图 1. 28分PSM研究
比如我们想比较2种手术/药物/措施对某一疾病患者的疗效比较,最完美的当时是进行随机对照研究(RCT)。但是由于各种各样的原因,我们只能回顾性收集数据进行研究,往往会出现2组患者基线资料有较大差异的情况,这样使得研究的统计学方法变得极为复杂,并且研究成果证据等级大大折扣。此时即可以运行PSM,系统在实验组和对照组各选出一定比例(1:1/2/4)的患者,可使得两者的统计学差异在设定的范围内。PSM的运行可在R软件中进行,也可以在SPSS中安装插件运行。
本文利用年龄和性别两个指标进行死亡患者和生存患者的匹配,利用150例死亡患者数据,匹配600例生存患者,组成研究队列,之后分为训练集和验证集。
和既往大量文献类似,研究团队首先进行了单因素Cox回归分析,确定了13个与死亡相关的因素。随后,将单因素中P<0.2的指标纳入多因素Cox回归,确定了CD4, VL(病毒载量), HB(血红蛋白), GLU(空腹血糖) 和 CR(肌酐)为独立预后因子。
图 3. 单因素/多因素COX回归截图(部分)
按照常规套路,接下去应该要将所有独立危险因素纳入建立预测模型。但是此处,研究团队进行了创新。为了尽量简化Nomogram(这也是公认的目标之一),研究团队比较了不同组合的预测模型的AUC,结果发现将5个独立危险因素纳入和只纳入CD4、VL(病毒载量)和HB(血红蛋白)的模型之间AUC相差不大,且差异无统计学意义(P=0.075)。
因此,基于3个独立危险因素,建立了Nomogram。训练集中的C指数为0.91,在验证集中为0.92,校准曲线表现出了较高的校准度。AUC比较结果显示Nomogram高于实验室检查指标。DCA表现出良好的临床适用性。
图 4. Nomogram
此部分其实本文还是有很多不常规的套路的。除了前述的去除了多因素中有意义的2个指标之外,将单因素中P<0.2的指标纳入多因素也是常规套路不一样的。在结果中我们发现,肌酐这一指标就显示出了此法的优势(虽然最后还是没有被纳入)。肌酐在单因素中P为0.102,但是在多因素中为0.023。(图5)
图5
3. 患者危险因素分分层
很多Nomogram文章到上面就没了,虽然这一的预测模型比单纯的Logistic回归或Cox回归公式已经实现了可视化,但是临床应用还是差了点。到底算出来之后谁是高危谁是中危谁是低危还是不知道。近年来已经有不少文章增加了此步骤。本文也利用X-tile软件将患者分成了高、中和低风险组。
总结:
其实我非常建议大家把这篇文章仔细读一读,不仅课题设计严谨,而且写的也很棒。文章的方法学部分进行了极为详细的阐述,尤其是统计学部分。细细品读,感觉这篇文章有点上次推送的JCO那篇文章的味道。
好了,今天就和大家聊到这里,小伙伴们有什么科研方面的想法,希望可以一起交流进步。