单因素重复测量方差分析

SPSS教程方差分析
问答

点击绿色“提问”按钮

  • 针对本文提问
  • 查看历史问答

长按鼠标选中正文某句话

  • 对选中的内容进行针对性提问
一、问题与数据

研究者想知道锻炼是如何降低心脏病发生风险的,于是他关注了一种与心脏病相关的蛋白——C反应蛋白(C-Reactive Protein, CRP):CRP的浓度越高,发生心脏病的风险越高。研究者想知道锻炼对CRP浓度的影响。

 

研究者招募了10名研究对象,研究对象进行了6个月的锻炼干预。CRP浓度共测量了3次:干预前的CRP浓度——crp_pre;干预中(3个月)——crp_mid;干预后(6个月)——crp_post。这三个时间点代表了受试者内因素“时间”的三个水平,因变量是CRP的浓度,单位是mg/L。部分数据如下:

 

二、对问题分析

使用One-way Repeated Measures Anova进行分析时,需要考虑6个假设。 

 

对研究设计的假设:

 

假设1:因变量唯一,且为连续变量;

 

假设2:受试者内因素(Within-Subject Factor)有3个或以上的水平。

 

注:在重复测量的方差分析模型中,对同一个体相同变量的不同次观测结果被视为一组,用于区分重复测量次数的变量被称为受试者内因素,受试者内因素实际上是自变量。

 

对数据的假设:

 

假设3:受试者内因素的各个水平,因变量没有极端异常值;

 

假设4:受试者内因素的各个水平,因变量需服从近似正态分布;

 

假设5:对于受试者内因素的各个水平组合而言,因变量的方差协方差矩阵相等,也称为球形假设。


思维导图


 
三、假设判断

在分析时,如何考虑和处理这5个假设呢?

 

由于假设1-2都是对研究设计的假设,需要研究者根据研究设计进行判断,所以我们主要对数据的假设3-5进行检验。

 

(一) 检验假设3和假设4的SPSS操作

 

1. 在主菜单点击Analyze > Descriptive Statistics > Explore...,如下图:

 

 

2. 出现Explore对话框,将crp_pre、crp_mid和crp_post选入Dependent List,点击Plots;

 

 

3. 出现下图Plots对话框;

 

 

4. 在Boxplots下选择Dependents together,去掉Descriptive下Stem-和-leaf,选择Normality plots with tests,点击Continue;

 

 

5. 回到Explore主对话框,在Display下方选择Plots,点击OK。

 

 

(二) 检验假设3:受试者内因素的各个水平,因变量没有极端异常值

 

1. 在输出的结果中,如下图所示,在箱式图中,距离箱子边缘超过1.5倍箱身长度的数据点定义为异常值,在本例中,未发现异常值

 

 

2. 为了方便进一步的理解,下面图示是有异常值的箱式图,上下边缘超过1.5倍箱式长度为异常值,如下图所示,用“圆圈”表示,右上标为异常值在数据表中所对应的行数;将距离箱子边缘超过3倍箱身长度的数据点定义为极端值(极端异常值),用“*”表示,右上标代表异常值在数据表中所对应的行数。因此,在箱式图中查看异常值时,可以直接看“圆圈”或“*”。

 

 

3. 异常值的处理

 

导致数据中存在异常值的原因有3种:

 

(1) 数据录入错误:首先应该考虑异常值是否由于数据录入错误所致。如果是,用正确值进行替换并重新进行检验;

 

(2) 测量误差:如果不是由于数据录入错误,接下来考虑是否因为测量误差导致(如仪器故障或超过量程),测量误差往往不能修正,需要把测量错误的数据删除;

 

(3) 真实存在的异常值:如果以上两种原因都不是,那最有可能是一种真实的异常数据。这种异常值不好处理,但也没有理由将其当作无效值看待。目前它的处理方法比较有争议,尚没有一种特别推荐的方法。

 

需要注意的是,如果存在多个异常值,应先把最极端的异常值去掉后,重新检查异常值情况。这是因为有时最极端异常值去掉后,其他异常值可能会回归正常。

 

异常值的处理方法分为2种:

 

(1) 保留异常值:

  • 采用非参数Friedman test检验;

  • 用非最近端的值代替极端异常值(如用第二大的值代替极端异常值);

  • 因变量转换成其他形式;

  • 将异常值纳入分析,并坚信其对结果不会产生实质影响。

 

(2) 剔除异常值:

 

直接删除异常值很简单,但却是没有办法的办法。当我们需要删掉异常值时,应报告异常值大小及其对结果的影响,最好分别报告删除异常值前后的结果。而且,应该考虑有异常值的个体是否符合研究的纳入标准。如果其不属于合格的研究对象,应将其剔除,否则会影响结果的推论。

 

(更多阅读:怎么判别我的数据中存在特异值?教你几招!

 

(三) 检验假设4:受试者内因素的各个水平,因变量需服从近似正态分布

 

1. 对于样本量较小(<50例)的研究,推荐使用Shapiro-Wilk方法检验正态性。当P<0.05时,认为不是正态分布。本例中,P均大于0.05,说明受试者内因素的三个水平crp_pre、crp_mid和crp_post均服从正态分布

 

 

2. 如果数据不服从正态分布,可以有如下4种方法进行处理:

 

(1) 数据转换:对转换后呈正态分布的数据进行单因素方差分析。当各组因变量的分布形状相同时,正态转换才有可能成功。对于一些常见的分布,有特定的转换形式,但是对于转换后数据的结果解释可能比较复杂。

 

(2) 使用非参数检验:可以使用Friedman test等非参数检验方法,但是要注意Friedman test和单因素重复测量方差分析的无效假设和备择假设不太一致。

 

(3) 直接进行分析:由于单因素重复测量方差分析对于偏离正态分布比较稳健,尤其是在各组样本量相等或近似相等的情况下,而且非正态分布实质上并不影响犯I型错误的概率。因此可以直接进行检验,但是结果中仍需报告对正态分布的偏离。

 

(4) 检验结果的比较:将转换后和未转换的原始数据分别进行单因素重复测量方差分析,如果二者结论相同,则再对未转换的原始数据进行分析。

四、SPSS操作
请先登录
这么重要的内容,赶快登录查看吧!
五、结果解释
请先登录
这么重要的内容,赶快登录查看吧!
六、撰写结论

1. 假如:满足球形假设,单因素重复测量方差分析显示组间差异无统计学意义:

 

采用单因素重复测量方差分析方法,判断6个月的锻炼干预对受试者CRP浓度的影响。经箱线图判断,数据无异常值;经Shapiro-Wilk检验,各组数据服从正态分布(P>0.05);经Mauchly's球形假设检验,因变量的方差协方差矩阵相等,χ2(2)=3.343, P=0.188。

 

数据以均数±标准差的形式表示。受试者干预前、干预中和干预后的CRP浓度分别为4.33 ± 0.64 mg/L、3.94 ± 0.57 mg/L和3.65 ± 0.43mg/L。干预前、干预中和干预后的CRP浓度差异不具有统计学意义,F(2, 18)=1.256, P=0.309,偏η2=0.02。

 

2. 假如:不满足球形假设,单因素重复测量方差分析显示组间差异无统计学意义:

 

采用单因素重复测量方差分析方法,判断6个月的锻炼干预对受试者CRP浓度的影响。经箱线图判断,数据无异常值;经Shapiro-Wilk检验,各组数据服从正态分布(P>0.05);经Mauchly's球形假设检验,因变量的方差协方差矩阵不相等,χ2(2)=6.270, P=0.043,通过Greenhouse & Geisser方法校正ε=0.648。

 

数据以均数±标准差的形式表示。受试者干预前、干预中和干预后的CRP浓度分别为4.33 ± 0.64 mg/L、3.94 ± 0.57 mg/L和3.65 ± 0.43mg/L。干预前、干预中和干预后的CRP浓度差异不具有统计学意义,校正后F(1.296, 11.663)=1.256, P=0.300,偏η2 =0.02。

 

3. 不满足球形假设,单因素重复测量方差分析显示组间差异有统计学意义,并进行了两两比较(本文例子的结果):

 

采用单因素重复测量方差分析方法,判断6个月的锻炼干预对受试者CRP浓度的影响。经箱线图判断,数据无异常值;经Shapiro-Wilk检验,各组数据服从正态分布(P>0.05);经Mauchly's球形假设检验,因变量的方差协方差矩阵不相等,χ2(2)=6.270, P=0.043,通过Greenhouse & Geisser方法校正ε=0.648。

 

数据以均数±标准差的形式表示。受试者干预前、干预中和干预后的CRP浓度分别为4.33 ± 0.64 mg/L、3.94 ± 0.57 mg/L和3.65 ± 0.43mg/L。干预前、干预中和干预后的CRP浓度差异具有统计学意义,校正后F(1.296, 11.663)=26.938, P<0.001, 偏η2=0.75。

 

干预中三个月时CRP浓度比干预前显著降低了0.390(95%置信区间:0.242-0.538)mg/L(P<0.001),干预后6个月时CRP浓度比干预前显著降低了0.680(95%置信区间:0.342-1.018)mg/L(P=0.001),未发现干预中和干预后CRP的浓度存在的差异具有统计学意义。

 

4. 从无效假设和备择假设的角度出发,当单因素重复测量方差分析显示组间差异有统计学意义时:各组间均数差异有统计学意义(P<0.05)。因此,可以拒绝无效假设,接受备择假设。

 

5. 从无效假设和备择假设的角度出发,当单因素重复测量方差分析显示组间差异无统计学意义时:各组间均数差异无统计学意义(P>0.05)。因此,不能拒绝无效假设,不能接受备择假设。

 
七、绘制图表

最后,我们来学习如何在SPSS软件中绘制简单线图,从而更好地展示展示单因素重复测量方差分析的结果,使其更适合于学术发表。

 

1. 绘制简单线图的操作

 

(1) 在菜单栏中,点击Graphs > Chart Builder...:

 

 

出现如下Chart Builder对话框:

 

 

(2) 在Chart Builder对话框的左下角,Choose from:模块中选择“Line”:

 

 

(3) 在Chart Builder对话框的中下部,出现2个不同的线图选项,把左侧的第一个(Simple Line)拖进上面的主要图表预览窗口,并点击Element Properties:

 

 

(4) 出现下图,图表预览窗口的线图横纵轴分别显示“X-Axis?”和“Y-Axis?”:

 

 

(5) 从Variables:模块中把自变量time拖进“X-Axis?”,把因变量crp拖进“Y-Axis?”:

 

 

(6) 在Element Properties对话框中勾选Display error bars,激活–Error Bars Represent– 模块,勾选Confidence intervals,Level (%):设定为95,当然也可以根据需要勾选Standard error或者Standard deviation,点击Apply:

 

 

(7) 在"Edit Properties of: 模块中点击"Y-Axis1 (Line1)"进行设置,出现下图:

 

 

(8) 去掉勾选Scale Range下的Minimum,点击Apply并进行确认;

 

 

(9) 如果想改变自变量分组的顺序,可以在"Edit Properties of: 模块中点击"X-Axis1 (Line1)"进行设置,并在更改后点击Apply,点击OK。

 

 

2. 简单线图结果

 

按照上述操作步骤,生成简单线图如下图所示:error bar表示均值的95%置信区间。

 

请先登录
这么重要的内容,赶快登录查看吧!
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
Next
Previous
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
    提交问题