统计实践的10条原则

笔者近来频繁的进行数据分析,深感保持一个清晰有序的头脑的重要性,尤其当研究团队不能奢侈到配置一名有能力复核分析思路和代码的队友时。卡耐基梅隆大学的RobertE. Kass教授领衔的拥有一众大佬的发表于PLOS COMPUTATIONAL BIOLOGY文章Ten Simple Rules for Effective Statistical Practice是一个极好的阅读材料,笔者在此做一简要分享。

原则一:统计方法应当让数据来回答科学问题

Rule1: Statistical Methods Should Enable Data to Answer Scientific Questions

这看上去像句废话,实际上还真不是。作者举了一个神经成像领域的例子:理解在不同实验条件下的大脑活动是主要的研究目标,用高质量的图像来呈现活动是次要目标。作者进一步表明了根据回答问题的不同,可能需要调整分析目标,进而设计新的分析数据的策略。笔者这里再延伸一下:这还是一个为什么需要合作的问题?当你手上有一把锤子的时候,看所有的东西都是钉子是一种常见的情况,比如你作为一个临床医生,刚刚学会了新的一个统计方法,就想着找地方试试。笔者并不是说这没有道理,毕竟不试试怎么知道能不能行?但是,很多时候,别人已经试过了,重复发明轮子不是一个高效的做法。和专家合作的一大重要意义就是减少试错的时间。另外一点就是,我们需要理解学科间发展的不平衡,比方在你的认知里,打仗还是一板一眼的冷兵器对砍,然而别人可能已经研发出了战斗机,彻底改变了战争的形态。

原则二:信号总是伴随着噪声

Rule2: Signals Always Come with Noise

笔者觉得这个问题更适合让流行病学来回答。当我们分析一组数据得到了一些结果,我们是不是就可以放心大胆的下结论了,你怎么确保这是你想评估的变量的作用?

先来看看P值,Sander Greenland教授在2016年重新定义了P值:当整个统计模型是正确的时候(包括所有用来计算P值的假设),P值是一个统计学参数,代表观测到的数据和模型预测出来的数据之间的兼容性。换言之,P值涉及到的是数据如何产生的问题,不仅仅是关于零假设的。所谓的兼容性是指,当P值为零时,我们的数据和用来计算P值的整个模型完全不兼容,而P值为1时,则完美兼容。

那么好,产生数据的过程,通常不是完美的。对于这些不完美,有些我们可以通过统计方法克服,有些则不可以。以观察性研究举例,不管我们使用了什么样的方法来校正偏倚,我们始终是基于已经观察到的变量进行的。对于没有被观察到的部分的影响,我们是需要通过额外的敏感性分析来探索的。

原则三:计划先行

Rule 3: Plan Ahead, Really Ahead

Ronald Fisher爵士的名言最为简洁有力:当实验完成后去咨询统计学家,有时候就像让他进行尸检,他可能只能告诉你该实验的死亡原因。

To consult the statistician after an experiment is finished is often merely to ask him to conduct a post mortem examination. He can perhaps say what the experiment died of.

为了避免出现类似尸检的尴尬场景,一个相对完备的计划特别重要。

原则四:担心数据质量

Rule 4: Worry about Data Quality

有几个需要关注的点:

第一,  我们想要测量的是否就是我们测量到的;

第二,  测量的单位是否被一致记录,例如记录缺失数据,可以是999,也可以是-1,也可以是空白。当我们面对一个长时间随访的队列研究时,需要注意,因为录入数据的规则在随访期间可能发生了改变;

第三,  探索性分析对我们理解手中的数据很重要,特别当我们面对一个新的问题,缺少之前的文献作为参考;

第四,  用同一组数据同时进行产生假设和验证假设是有问题的。

原则五:统计分析不仅仅是一组比较

Rule 5: Statistical Analysis Is More Than a Set ofComputations

根据具体的应用场景选择合适的方法很重要。然后统计方法往往都有其假设,违背假设倒不一定造成严重后果,但论文里面不写清楚,很多时候就会让读者造成误解。因此,清晰的描述加上结构化的分析策略应当是我们对自己数据分析工作的要求。

原则六:保持简单

Rule 6: Keep it Simple

尽可能保持模型的简单,原因其实很简单:这有助于推广和交流。不过我们同时也要清楚,世界并不总是简单的,多频次的测量,变量之间的交互作用,非线性关系,缺失数据,混杂,抽样误差等等都会让我们的模型增加复杂度。这些必要的复杂会让我们更好的理解我们的问题。笔者这里延伸一下,实际上复杂的模型往往要求的有效样本量更大。当我们手头的数据有限,很多时候是需要克制自己提复杂问题的想法的。

原则七:提供对变异程度的测量

Rule 7: Provide Assessments of Variability

两个值得注意的点,一是标准误的计算也是有相应假设的,二是大数据其实并不一定大,特别是少量样本进行了大量的测量,就需要更加注意统计方法的假设。

原则八:检查你的假设

Rule 8: Check Your Assumptions

每一个统计学推断都包含假设,这些假设是基于领域知识和一些对数据变异性的概率呈现,后者就是我们常说的统计模型。

常见的两类被忽视的假设,一是线性,二是独立性。拿血压举个例子,假设我们有一组数据,其收缩压分布是90到180毫米汞柱。我们想评估一下收缩压和患者急性心梗发作之间的关系。

如果此时我们假设收缩压是线性的,这就意味着我们认为收缩压从90增加到100毫米汞柱和从170增加到180毫米汞柱对急性心梗发作的风险是一致的,这个假设很可能是有问题的。

如果有100个患者,每一个患者我们在不同时间测量了三次血压。如果此时我们假设这些测量是相互独立的,那么就意味着我们的样本量扩充到了300,这样很可能得到一些有误导的结果,因为这大概率和300个患者测量一次的结果不同。

作者提到我们至少需要通过图示法来检测一下我们的模型与数据之间的符合情况。

原则九:如果有可能,重复!

Rule 9: When Possible, Replicate!

可重复性危机是一个老生常谈的话题了,主要由P值引起,那么怎么办呢?让P值退休是一种观点,Valentin Amrhein, Sander Greenland和Blake McShane等三位教授2019年在Nature上发表了文章旗帜鲜明的表达了这一观点。另一方面,John P. A.Ioannidis教授2018年在JAMA上提到我们可以把P的阈值降低,从0.05降到0.005。Sander Greenland教授作为流行病领域上帝级的存在,还提出了一个新的解决方案compatibility interval。他和Andrew Gelman教授一起发表了相关论文在2019年的BMJ上。Frank Harrell教授提出了用贝叶斯和似然比框架来替代频率学派的框架。

诸位大佬过招,江湖一时波涛汹涌。作者在文中提到,最理想的做法是让第三方独立机构用相同的方法拿新数据来重复分析一遍。不过作者自己也承认,这个做法过于理想化了。

原则十:让你的分析可被复现

Rule 10: Make Your Analysis Reproducible

这条原则其实是第九条的低配版本。作者希望至少应该拿同一组数据,用相同的办法来复现研究的结果。不过很遗憾,这条做到的难度就很大,上来第一步开源数据就不容易做。

最后,笔者也特别同作者引用的Andrew Vickers教授的话,把统计当成一门科学,而不是菜谱

参考文献

1. Kass, R. E., Caffo, B. S., Davidian, M., Meng, X. L., Yu,B., & Reid, N. (2016). Ten simple rules for effective statistical practice.PLoS computational biology, 12(6).

2. Amrhein,V., Greenland, S., & McShane, B. (2019). Scientists rise up against statistical significance.

3. Ioannidis,J. P. (2018). The proposal to lower P value thresholds to. 005. Jama, 319(14),1429-1430.

4. Gelman,A., & Greenland, S. (2019). Are confidence intervals better termed“uncertainty intervals”?. BMJ, 366, l5381.

5. Greenland,S., Senn, S. J., Rothman, K. J., Carlin, J. B., Poole, C., Goodman, S. N.,& Altman, D. G. (2016). Statistical tests, P values, confidence intervals,and power: a guide to misinterpretations. European journal of epidemiology, 31(4), 337-350.

统计与绘图

生存分析如何绘制事件发生累计概率曲线图?

2020-6-19 13:31:29

统计与绘图

R语言统计与绘图:卡方检验

2020-6-20 23:06:34

声明 本网站部分文章源于互联网,出于传递更多信息和学习之目的转载,并不保证内容正确或赞同其观点。
如转载稿涉及失效、版权等问题,请立即联系管理员;我们会予以修改、删除相关文章,请留言反馈
Notice: When your legal rights are being violated, please send an email to: [email protected].
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索