白话统计学11—因子方差分析和协方差分析(学习分享)

引言:前面我们学习了单因子方差分析,这一小节和下一小节将探讨更高级的方差分析:因子方差分析和重复测量方差分析。这两种方法可以用来考察更复杂往往也更有意义的问题,而在这个时候单因子方差分析可能无能为力。赶快开始今天的学习吧~~~

一、情景1

观察A、B两种镇痛药物联合运用在产妇分娩时的镇痛效果。A药取3个剂量:1.0mg、2.5mg、5.0mg;B药也取3个剂量:5μg、15μg、30μg。共有9个处理组。将27名产妇随机等分为9组,每组3名产妇,记录每名产妇分娩时的阵痛效果,结果见表1。试分析A、B两种药物联合运用的阵痛效果。

问题分析:在这种两种变量的情况下,如果我们使用单因子方差分析来处理的话,只考虑A的水平或B的水平的影响,便会忽略掉B药物水平或者A药物水平的作用,更重要的是,我们还会忽略掉两因素之间的交互作用(A对B的影响或者B对A的影响)。带着这个问题,我们今天来学习因子方差分析。

二、因子方差分析的主要内容

1) 析因设计:以前面2因素3水平的案例为例,完全随机将样本分组并给与处理因素,A因素(A药)有3个水平,记作a1,a2,a3;B因素(B药)也有3个水平,记作b1,b2,b3。像上面这样的设计称为析因设计(factorial design),其处理组是A、B两因素各水平的全面交叉分组(fully-crossed)的结果,共形成以下9个处理组:

2) A因素与B因素不同水平的单独效应、主效应和交互效应

  • 单独效应(simple effect):单独效应指的是其他因素的水平固定时,用一因素不同水平间的差别。

    • 如在案例中,A因素固定在1.0mg水平时,考虑B因素的单独效应:

    • A因素固定在2.5mg水平时,考虑B因素的单独效应:

    • A因素固定在5.0mg水平时,考虑B因素的单独效应:

    • 同理,我们也可以固定B因素,探究B因素的单独效应,如当B因素固定在5μg时,探究A因素的单独效应:

  • 主效应(main effect) :主效应指的是某一因素各水平间的差别,类似于每个因素的单因子方差分析。

    • 如不考虑B因素是,探究A因素的主效应:

    • 如不考虑A因素时,探究B因素的主效应:

  • 交互作用(interaction):当某因素的各个独立效应随另一因素变化而变化时,则称这两个因素间存在交互效应。

    • 如,当A因素的单独效应随着B因素变化而变化时,则称A、B两因素间存在交互效应。

3)因子方差分析的变异分解:同单因子方差分析一样,在因子方差分析中也要进行观测变量变异和自由度的分解,如下:

三、SPSS实现因子方差分析

直接进入软件实操部分:

①数据录入;

②选择分析→一般线性模型→多变量(详细步骤如下)

③输出结果与结果解释

统计描述部分:展示纳入的样本统计量,以及各分组的均值和标准差,尽管组间的均值不同,但是我们也必须通过统计检验,才能得出其所在总体的均值是否具有差异的结论。

        SPSS因子方差分析的结果:根据方差分析变异分解的原理提取结果中的关键信息。SS=28450.000,SSA=6572.222,SSB=7022.222,SSAxB=7872.222,SS误差=6983.333 ,MSA=3286.111,MSB=3511.111,MSAxB=1968.056,MS误差=387.963。将结果整理成表格如下:

结果解释:A药不同剂量的镇痛效果不同;B药不同剂量的镇痛效果不同;A、B两药有交互作用,A药5.0mg与B药30μg时,镇痛时间持续最长。

SPSS输出交互作用轮廓图:可得出同样的结论,3条直线相交,说明A药与B药具有交互作用,在A药5.0mg与B药30μg时,镇痛时间持续最长。

组间多重比较:同单因子方差分析一样,如果在因子方差分析中得出各因素有差异的结论后,我们可以继续做事后检验,探究各因素在哪些水平间存在差异:如上,小编采用的是LSD检验。通过查看结果,我们发现A药中,1.0mg与2.5mg、5.0mg间的效应存在差异,而2.5mg与5.0mg之间无显著差异;在B药中,30μg与5μg、15μg间存在差异,而5μg与15μg间不存在显著差异。最后,结合我们的实际研究,将统计结果转换成研究结果。

四、情景2

为研究某种药治疗黄疸的效果,随机将纳入的56名患者分为2组,一组接受传统药物治疗(对照组),一组接受新药治疗(治疗组)。在治疗前测一次ALP含量(ALP1),在治疗后测一次ALP含量(ALP2),试比较2组的治疗后ALP是否相同?

分析:在这种情况下,我们要探究2组患者治疗后的ALP水平是否相同?能否直接使用两独立样本t检验或者单因子方差分析呢?很显然是不能这样做的,因为这样做会舍弃掉患者治疗前ALP水平对治疗后ALP水平的影响。所以我们要采用一种新的方法,叫做协方差分析,顾名思义,协方差分析就是多元线性回归中的协变量和方差分析结合的一种分析方法(小编认为:其主要的目的就是通过构建线性回归方程的方式来控制协变量因素,使协变量因素在各组间的水平相一致,从而增强组间应变量的可比性)

五、协方差分析的主要内容

1)适用前提:理想状态下,进行2组或多组均数比较的时候,除了所施加的处理因素不同外,要求对结果指标有影响的因素应均衡,我们应控制对试验观察指标有影响的其他因素。但在实际工作中,有时有些因素是难以控制的,如案例中治疗前患者的ALP水平。那么为了扣除或者均衡这些不可控因素的影响,我们要考虑使用协方差分析的方法。

2)基本思想:将影响实验观察结果的定量指标X(指未加控制或者难以控制的因素)对应变量Y的影响当做协变量,建立应变量Y随协变量X变化的线性回归关系,并利用这种回归关系把X转化为相等后再进行各组Y的修正均数的比较。相比于单因子方差分析,其实质就是从随机误差中扣除一部分X对Y的回归平方和。

3)应用条件:

  • 观察变量符合正态分布,各观察变量相互独立,各样本的总体具有方差齐性。这可以使用levene检验探究。

  • 各总体客观存在应变量与协变量的线性回归关系,并且斜率相同(回归线平行)。换个角度理解,就是各分组变量与协变量之间无交互作用,这个可以通过因子方差分析探究。

六、SPSS中进行协方差分析

SPSS实战环节:

①输入数据,数据格式参考如下,分组变量用1和2代替(1=对照组,2=实验组):

②协方差分析应用条件判定:判断协变量与分组变量是否存在交互效应以及样本总体是否满足方差齐性:

选择分析→一般线性模型→单变量分析(具体设置如下):

输出交互作用结果:通过group*ALP1栏,我们可以了解到分组与治疗前水平ALP1无交互作用,满足协方差分析的前提条件2。

治疗后ALP2方差齐性检验结果:Levene检验结果p=0.847,认为具有方差齐性。满足协方差分析的前提条件1。

仅有在满足协方差分析前提的情况下,得出的协方差结果才是可靠的!

③协方差分析步骤:

④ 协方差分析结果输出与结果解释:

统计描述部分:实验组有28个样本,对照组有28个样本;对照组与实验组治疗后的ALP的均值和标准差分别为(435.6950,344.48918),(412.4789,549.91891)。两样本均值是有差异的,但其所代表总体的均值是否具有差异,仍需要结合后面的统计检验结果。

协方差分析中的零假设和备择假设、显著性水平如下:

零假设H0:实验组和对照组的总体修正系数相同

被择假设H1:实验组和对照组的总体修正系数不同

显著性水平:α=0.05

 

结合SPSS输出的协方差分析结果进行解释:将治疗前ALP1水平作为协方差,矫正后的SS=11376803.19,不同处理间(group)的 F 统计量为9.618,p=0.003,拒绝H0,接受H1,可以认为在扣除治疗前(基线)ALP1水平的影响后,实验组和对照组患者接受治疗后的总体ALP2水平有差异,可认为实验组ALP2的水平低于对照组的ALP1水平。

为突出协方差分析中控制对试验结果因素的重要性,小编再进行未校正ALP1的治疗后ALP2方差分析,其结果如下:

因子方差分析中的零假设和备择假设、显著性水平如下:

 

零假设H0:实验组和对照组的总体均数相等;

被择假设H1:实验组和对照组的总体均数不相等;

显著性水平:α=0.05

结合SPSS输出的单因子方差分析的结果解释:未考虑治疗前的ALP1水平,直接探究两组治疗后的ALP2水平是否具有差异。不同处理间(group)的F统计量为0.036,p=0.851,尚不能拒绝H0,不能认为实验组和对照组患者接受治疗后的总体ALP2水平有差异。

小结:通过两种结果对比,未考虑治疗前ALP1基线水平会影响治疗后ALP2的水平的单因子方差分析得出的结论是不可靠的。

总结

本小节从2个方面扩展了关于方差分析的内容。第一,引入多元自变量的概念,以便能更好地分割或解释因变量方差,讨论各因素之间的主要效应和交互效应。第二,考察控制或剔除模型中其他变量(包括协变量)效应的概念,以更好地理解自变量和因变量之间的独特关系。在实际研究中,尽管t检验和单因子方差分析是非常有用的统计方法,但是却不能考察生活中复查的问题,故我们仍需要了解一下稍微复杂一点的统计方法。下一小节,我们继续学习有点复杂但却特别有意义的重复测量方差分析,我们下期再见。

参考书籍:
1.中国人民大学出版社《白话统计学》第3版   蒂莫西.C.厄丹(Timothy C.Urdan)著,彭志文译
2.人民卫生出版社《医学统计学》第4版 孙振球,徐勇勇著
3.中国工信出版集团《R语言之书-编程与设计》 蒂尔曼.M.戴维斯(Tilman M.Davies)著,李毅译
统计与绘图

白话统计学12—重复测量方差分析

2019-11-29 23:46:27

统计与绘图

白话统计学10—单因子方差分析(学习分享)

2019-11-29 23:48:23

声明 本网站部分文章源于互联网,出于传递更多信息和学习之目的转载,并不保证内容正确或赞同其观点。
如转载稿涉及失效、版权等问题,请立即联系管理员;我们会予以修改、删除相关文章,请留言反馈
Notice: When your legal rights are being violated, please send an email to: [email protected]
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索