1. sci666首页
  2. 文献解读

文献解读:基于SEER数据库的临床预测模型

今天继续和大家分享一篇临床预测模型文章,同样是基于SEER数据库的一篇预测模型,于2019年11月发表在Annals of Translational Medicine(IF=3.689)上。

总体而言,文章套路清晰,易学习模仿。

Title: Development and validation of prognostic nomogram for young patients with gastriccancer

标题:建立并验证青年胃癌患者预后的预测模型

文章总体概览:

作者通过检索SEER数据库2004年-2015年的胃癌患者数据,纳入549例资料详细的年龄<45岁的患者。将549例患者分为训练集(n=276)和验证集(n=273)。随后,在训练集中进行单因素COX回归及多因素COX回归,最终确定与预后(本文同时研究了OS和CSS)独立相关的危险因素。基于独立危险因素建立了Nomogram并进行验证和评价。文章总体流程见图1。

文献解读:基于SEER数据库的临床预测模型

图1.文章整体流程

文章结果概述如下:

01

患者基本信息

作者对纳入研究队列的患者(n=549)基本信息进行了概述。其中包括性别、种族、组织学分级、TNM分期、常见位置及SEER分期。同时,作者利用X-tile软件确定了Age和Size的最佳截断值,并将患者分为根据截断值将患者分为3组。(注:X-tile的具体介绍和使用方法见文末)

 

02

建立预测模型

首先,作者利用单因素COX回归分析确定了与OS相关的的因素。随后,将单因素中P<0.2的因素纳入多因素回归分析并确定了与OS独立相关的因素,包括肿瘤尺寸及肿瘤位置。同时,利用同样的方法,作者确定了与CSS独立相关的因素,包括肿瘤尺寸、肿瘤位置及SEER stage。基于独立危险因素,作者建立了预测青年胃癌患者术后3年及5年OS和CSS的Nomogram。(见图2、图3)

文献解读:基于SEER数据库的临床预测模型

图2. OS Nomogram

文献解读:基于SEER数据库的临床预测模型

图3. CSS Nomogram

03

验证Nomogram

在内部验证验证中,OS Nomogram的C指数为0.688 (95% 置信区间:0.629–0.747),而在CSS Nomogram的为0.785(95% 置信区间: 0.735–0.835)。在独立队列的外部验证中,OS和CSS Nomogram的C指数分别为0.633 (95% 置信区间: 0.579–0.687)和0.733 (95% 置信区间: 0.686–0.780)。作者同时建立了3年及5年的ROC曲线并描述了其对应的AUC值,均表现出来较好的区分度(AUC: 0.725-0.793),见图4。此外,作者建立了3年及5年的校准曲线,结果表明列线图预测的生存率(包括OS及CSS)与实际生存率具有较高的一致性,见图5(此推送仅展示OS结果,CSS类似)。最后,通过DCA结果,研究发现Nomogram展现出了与TNM及SEER stage相当的临床适用能力。并且在OS Nomogram优于TNM而CSSNomogram 优于SEER stage,见图6。

文献解读:基于SEER数据库的临床预测模型

图4. ROC曲线

 

文献解读:基于SEER数据库的临床预测模型

图5. 校准曲线(OS)

 

文献解读:基于SEER数据库的临床预测模型

图6. DCA结果

 

笔者总结:本文通过SEER数据库建立了青年胃癌患者OS和CSS的预后预测模型,并进行了验证。通过统计学分析+R语言技术建立了临床适用性较强的Nomogram。通读文献,初学者可能对其中部分内容存在疑惑,相信最多人想问的就是为什么这里的单因素P<0.2的纳入了多因素分析,不是一般都是0.05吗???作者这么做也是有道理的,而且这样的做法也是有众多文献可以支撑的。2008年,肿瘤权威期刊《Journal of clinical medicine》发表了一篇文章对Nomogram进行了详细介绍,文中指出纳入Nomogram的变量应该取决于临床资料的可获取性和临床证据,而不是统计学意义(参考文献2)。此外,样本量的限制也可能使得部分变量在单因素COX回归中呈现出P>0.05而其可能在多因素COX回归中P<0.05,。因此,在本文中,纳入统计分析的患者数量为276。为了最大限度减少样本量限制而导致的统计偏移,研究团队选择P<0.2为单因素分析的截断值具有重要的意义。从结果中,我们也可以发现这一操作带来的好处。在OS的生存分析中,我们发现肿瘤位置在单因素COX分析的P为0.062,而在多因素中却表现出P<0.05。

此外,对于X-tile这个软件可能很多人也很陌生。笔者初次接触此软件后爱不释手,其对于生存分析的相关资料处理具有极大的作用。X-tile是是耶鲁大学开发的单一功能小软件,其详细介绍于2004年被发表于肿瘤学国际期刊《Clinical cancer research》,见参考文献3。通俗易懂的讲,其可以将一个连续变量进行2分类或者3分类甚至多分类截断,选择出最佳的截断值,这个截断值可以将研究对象分成若干组,若干组之间的生存趋势具有最大的差异。举个例子,本文中的年龄与患者预后的关系,很多小伙伴会说直接把年龄当成连续性变量进行分析,这样也没错。但是,年龄与结局的关联不是线性关系,另外相对于连续性变量,分类变量的临床可操作性显然更强。因此,此时X-tile就可以大显身手了,其可以寻找一个最佳的年龄截断值,将患者分为3组,3组之间的生存模式差异实现最大化,

参考文献:

1. Yu Chaoran,Zhang Yujie,Development andvalidation of prognostic nomogram for young patients with gastric cancer.[J].Ann Transl Med, 2019, 7: 641.

2. Iasonos Alexia,Schrag Deborah,Raj Ganesh V et al. How to build and interpret a nomogram for cancer prognosis.[J] .J. Clin. Oncol., 2008, 26: 1364-70.

3. Camp Robert L,Dolled-FilhartMarisa,Rimm David L,X-tile: a new bio-informatics tool for biomarker assessmentand outcome-based cut-point optimization.[J] .Clin. Cancer Res., 2004, 10:7252-9.

①SCI666交流QQ群:医学综合科研群:703163967 · 生信分析群:732179952 · Meta分析群:797345521(点击群号即可加群)。
②下载提示:点击查看百度网盘会员共享账号,部分内容具有时效性,若文中的下载链接失效请留言反馈。

发表评论

登录后才能评论

联系我们

(857)626-2666

在线咨询:点击这里给我发消息

邮件:123456@whu.edu.cn

QR code