介 绍
数值变量如果服从正态分布,采用均数±标准差进行统计描述,采用方差分析进行组间比较,如果组间差异有统计学意义,进一步采用LSD法(也可以是其它方法)进行两两比较。如果不服从正态分布,采用中位数(四分位数间距)进行统计描述,组间比较采用非参数检验(Kruskal-Wallis秩和检验),当组间总的有统计学差异,进一步采用Dunn法(也可以是其它方法)进行多重比较。
我们想比较不同BMI组人群的年龄是否有差异,经正态性检验,年龄不符合正态分布,故选用非参数检验(Kruskal-Wallis秩和检验)。
软件操作
1、导入数据
使用read.delim命令读取剪贴板上的数据,str命令查看数据的样本量和变量数及每个变量的类型,head命令查看数据集的前6行。
2、分类变量因子化
使用factor命令把sex、bmig、work和disease因子化,并添加值标签,使用str命令查看数据类型,使用head命令查看前6行。
3、Kruskal-Wallis秩和检验
使用kruskal.test命令进行Kruskal-Wallis秩和检验,结果显示统计量H=12.365,p=0.002<0.05,提示不同BMI组人群的年龄有差异,但具体是哪两组有差异,还需进一步两两比较。
4、Dunn法进行两两比较
"FSA") install.packages(
library(FSA)
技能拓展
1、如果要发表SCI,统计方法可以描述为:
2、我们之前介绍了如何快速生成研究对象基本特征的Table1,非常方便,但遗憾的是,对于多组比较,不能提供进一步两两比较的p值。好在,R在实现Kruskal-Wallis秩和检验和两两比较方面还是比较方便的,在得到结果后,我们可以手动把相应p值标注在Table1上。