首先我们提出这样一个问题:
为了评估A和B两种同期发情方案在奶牛妊娠率方面的效果,我们得到如下数据(数据是瞎编的):
妊娠 | 未妊娠 | |
A方案 | 50 | 30 |
B方案 | 40 | 40 |
可以算出A方案的妊娠率要比B方案的妊娠率高,但是二者之间有显著性差异吗?这时就需要用到卡方检验的思想了。
卡方检验主要是比较两个率或者两个构成比的显著性差异。
下面小编就为大家讲解如何利用GraphPad软件做卡方检验。
1. 打开GraphPad软件,依次点击Contingency, 柱状图,Create。
2. 按如下格式输入数据(2×2列联表)。
3. 点击上图中的Analyze,出现下图。点击Contingency table analyses前的+号,选择Chi-square (and Fisher’s exact) test,点击ok。
4. 如下图所示,这里出现了三个选项(Chi-square test for trend无法选择,这个问题以后再具体介绍),我们来分别解读一下各种方法的适用情况。
Chi-square test:给出的是P值的估计值,大样本量的情况下比较适用。
Yates’ continuity corrected chi-square test:最初的设计是通过校正P值使Chi-square test更加精确,但是有时候会出现过度校正的情况,反而适得其反。对于大样本量,Chi-square test自身的检验效果就很好,对于小样本量,无论校正不校正,效果都不是很好。实际上,统计学家们对该方法有分歧,不推荐使用,但是GraphPad还是保留了此项功能。
Fisher’s exact test:给出的是P值的精确值,而且小样本量的情况下效果很好,如果是大样本量,即使选择Fisher’s exact test,GraphPad也给出的也是Chi-square test方法检验的P值。
说了这么多,记住一句话,那就是,如果是两行两列的列联表的比较,我们直接选择Fisher’s exact test就可以了。
下面我们继续往下进行。
5. 我们先选择Fisher’s exact test,结果如下,可以看到A和B两种方案是没有显著性差异的。
如果我们选择Chi-square test,得到的结果如下图所示,可以看到和Fisher’s exact test方法的P值是不一样的。
同时,会出现如下提示,意思就是让我们考虑使用Fisher’s exact test。并且这里也给出了解释,对于大样本量,二种检验方法差别不大,但如果是小样本的话,用Fisher’s exact test就更好一些了。
然后,我们把样本量扩大,将数字变成5000,5000,6000,4000,然后还是选择Fisher’s exact test,出现如下提示,意思就是样本量太大,Fisher’s exact test无法估计,所以给出的还是Chi-square test方法的P值。
说了这么多,还是那句话,用GraphPad做2×2列联表卡方分析,不用多考虑,直接选择Fisher’s exact test就行。