"站长统计 研究方法 慢阻肺专项 研究问答 研究进展 学术服务 关于我们 提问

"站长统计 研究方法 慢阻肺专项 研究问答 研究进展 学术服务 关于我们 提问 SPSS教程 样本量计算 Meta分析 Stata课程 R语言课程 科研进阶New 多重线性回归 SPSS教程回归分析 问题与数据 对问题分析 SPSS操作 结果解释 撰写结论 更多阅读 数据下载 问答 点击绿色“提问”按钮 针对本文提问 查看历史问答 长按鼠标选中正文某句话 对选中的内容进行针对性提问 四、结果解释 4.1 判断线性回归模型的拟合程度 (1)变异的解释程度  Model Summary表格中,R是多重相关系数,相当于多重线性回归预测值(PRE_1)和因变量实际值(VO2 max)的Pearson相关系数。如图22。 它是判断两者之间线性关系的重要指标,也反映了回归的拟合程度。一般来说R值在0-1之间分布,数值越大,线性关系越强。在本研究中,R=0.703,提示中高等相关。但必须强调的是,多重线性回归的结果解释一般不关注R值,而是关注R2 和adjusted R2值。   图22 Model Summary R2是指回归中因变量变异被自变量解释的程度。本研究中,R2=0.494,提示自变量可以解释49.4%的因变量(VO2 max)变异。但是,R2是会夸大自变量对因变量变异的解释程度,如果模型中增加一个自变量,即使这个自变量在统计上并不显著,R2也会增大。 adjusted R2与R2不同的是,它剔除了自变量个数的影响,这使得adjusted R2永远小于R2,且adjusted R2的值不会由于自变量个数的增加而越来越接近1。本研究中,adjusted R2=0.473,小于R2=0.494,校正了R2中总体自变量对因变量变异解释程度的夸大作用。在汇报结果时,adjusted R2更能代表自变量对因变量变异的解释程度。当然,如果能同时汇报adjusted R2和R2值更好。此外,adjusted R2也是影响程度的评价指标。本研究中,adjusted R2=0.473,提示具有高影响强度。 扩展阅读 R2是指回归中因变量变异被自变量解释的程度。但很多人对R2的具体解释存在误解,我们将在这里给大家举例说明。 比如,我们想要预测因变量值,最简单的办法就是运行空模型,即回归中仅有因变量,没有自变量。这时,最佳预测值就是因变量的均数。当然这种空模型也是最差的预测模型,所有自变量对因变量预测值的影响都被我们忽略了。但是在这种空模型中,我们可以估算出回归预测的总变异。随后,我们把相关的自变量重新放入回归模型,再次估算回归变异程度。因为自变量可以在一定程度上影响或解释因变量的变化情况,加入自变量后的变异会比总变异小。这个减少的部分就是R2值,即自变量解释因变量变异的程度。   (2)模型的统计学意义 SPSS的输出ANOVA表格,如图23。   图23 ANNOVA 结果显示,本研究回归模型具有统计学意义,F=23.223,P<0.001,提示因变量和自变量之间存在线性相关。如果P<0.05,就说明多重线性回归模型中至少有一个自变量的系数不为零。同时,回归模型有统计学意义也说明相较于空模型,纳入自变量有助于预测因变量,或说明该模型优于空模型。 4.2 回归系数的解释 本研究的回归方程可以表示为:VO2 max = β0 + β1 × age + β2 × weight + β3 × heart_rate + β4 × gender 其中,β0是截距,β1-β4是斜率。如果可以得到这5个指标,我们就可以根据自变量(年龄age,体重weight,心率heart_rate和性别gender)预测因变量(最大携氧能力 VO2 max )了。SPSS对回归截距和斜率的输出结果如图24。       图24 Coefficients 在SPSS中,截距被称为“Constant”,即84.959。实际上,我们并不是关注回归的截距指标。它是指当自变量值都为0时,因变量的值。这种截距值并不是真实存在的,为了避免对数据的过度挖掘,我们在这里不再进一步讨论。根据P值,我们可以判断截距的统计学意义。P<0.001,提示截距与0之间的差异有统计学意义。必须强调的是,无论截距的统计检验结果如何,是否有统计学意义,在进行多重线性回归时都无需十分关注这项指标,需要关注的指标是斜率。 斜率代表的是自变量每改变一个单位因变量的变化值。在本研究中,年龄的斜率为-0.211,表示年龄每增加1岁,最大携氧能力就会降低0.211 ml/min/kg。因为年龄的斜率是负值,所以当年龄增加时,最大携氧能力降低。同样地,如果斜率是正值,那么每当年龄增加,最大携氧能力也会增加。从另一个角度来说,该研究结果具有专业意义,人体最大携氧能力就是随着年龄的增加而降低的。同时,还需要注意,这种最大携氧能力随年龄的变化情况是在控制了其它几个自变量的情况下计算出来的。只要其它几个自变量的数值不变,年龄每增加1岁,最大携氧能力就下降0.211 ml/min/kg。此外,我们也可以对斜率进行一些运算。例如,我们希望计算年龄每增加10岁人体最大携氧能力的变化情况,只需要将斜率0.211 ml/min/kg×10。即年龄每增加10岁,人体最大携氧能力降低2.11 ml/min/kg。另外,也可以得到年龄的斜率的95%CI为(-0.349,-0.072)ml/min/kg。Sig栏可以得到斜率的统计学检验结果(P=0.003),提示斜率值与0的差异有统计学意义,也说明最大携氧能力和年龄之间存在线性关系。 如果斜率的P值大于0.05,证明斜率没有统计学意义,即斜率值与0的差异没有统计学意义,说明因变量和自变量之间不存在线性关系。 同样也可以得到多重线性回归中其它连续型自变量的斜率。如体重每增加1 kg,最大携氧能力下降0.295 ml/min/kg;心率每增加1 bpm,最大携氧能力下降0.109ml/min/kg。 但值得注意的是,当自变量是分类变量时,就不能再按照连续变量的方法解释。以本研究中的性别变量为例,它的斜率是指不同类别之间的差异。在录入数据时,我们将女性录入为0,男性录入为1。SPSS自动默认是以0组为参照,将1组与0组进行对比,即将男性与女性进行对比。该研究中性别变量的斜率是指这两个性别之间最大携氧能力预测值的差异。本研究中,性别的斜率是7.897,提示男性的最大携氧能力预测值比女性高7.897 ml/min/kg(控制了其它自变量)。从专业的角度上看,男性的平均最大携氧能力也确实高于女性。同时,我们也可以按照连续变量的分析方法,解释性别变量的95%CI和P值,不再赘述。 最后将上述系数代入回归方程,得:VO2 max = 84.959 – 0.211 × age – 0.295 × weight – 0.109 × heart_rate + 7.897 × gender 4.3 预测因变量 多重线性回归分析的主要目的之一是通过自变量预测因变量。在本研究中,研究者之所以建立最大携氧能力与年龄、体重、心率和性别的回归模型,是希望通过这些自变量预测最大携氧能力,以代替昂贵、复杂的检测手段。 以下将从回归方程预测因变量开始,逐步介绍计算预测值和95%置信区间的SPSS操作方法及对预测结果的解释。 (1)根据回归方程计算预测值 本研究的回归方程为: VO2 max = 84.959 – 0.211 × age – 0.295 × weight – 0.109 × heart_rate + 7.897 × gender 假设有一位30岁男性患者,体重80kg,心率133 bpm,则预测他的最大携氧能力= 84.959 – 0.211×30 – 0.295×80 – 0.109×133 + 7.897×1 = 48.429 ml/min/kg。即30岁男性(体重80kg、心率133 bpm)最大携氧能力平均预测值为48.429 ml/min/kg。这个预测值有两种含义。第一,如果我们调查了目标人群中所有的30岁男性(体重80kg、心率133 bpm),他们最大携氧能力的平均值应为48.429 ml/min/kg。第二,如果某位受调查者符合30岁、男性、体重80kg以及心率133 bpm的条件,那么48.429 ml/min/kg是其最大携氧能力的最佳估计值。 (2)预测值和95%置信区间的SPSS操作方法 SPSS可以估计预测值及的95%CI。这里仍以30岁、男性、体重80kg、心率133 bpm为例,介绍预测值和95%置信区间的SPSS操作方法。 点击Analyze→ General Linear Model→ Univariate,将因变量VO2 max放入Dependent Variable框内,自变量age、weight、heart_rate和gender放入Covariate(s)框内,如图25。   图25 Univariate 点击Paste,出现IBM SPSS Statistics Syntax Editor窗口,在/DESIGN= age weight heart_rate gender上方插入/LMATRIX=ALL 1 30 80 133 1,如图26。   图 26 IBM SPSS Statistics Syntax Editor /LMATRIX=ALL 1 30 80 133 1语句中各部分的含义如下: ALL指同时运用斜率和自变量进行预测; 1 指纳入回归截距; 30 指用来预测因变量的自变量age的值; 80指用来预测因变量的自变量weight的值; 133 指用来预测因变量的自变量heat_rate的值; 1指用来预测因变量的自变量gender的值(0=女性;1=男性)。 点击Run→ All,输出结果。 需要注意的是,/LMATRIX=ALL 1 30 80 133 1中各自变量数值的顺序必须与“/DESIGN=”行中各自变量的排列顺序一致。 (3)预测结果的解释 预测结果在Contrast Results(K Matricx)中展示,如图27。   图27 Contrast Results(K Matricx) 从Contrast Estimate可以看出,30岁男性(体重80kg、心率133 bpm)的最大携氧能力预测值为48.441 ml/min/kg。这与回归方程得到的结果(49.429 ml/min/kg)略有不同,原因在于SPSS保留的运算位数多于直接计算,结果也更准确。同时,SPSS操作还提供了其它结果。如预测值的标准误(Std. Error)是0.903 ml/min/kg,提示预测值的变异程度;预测值的95%CI为46.647-50.234 ml/min/kg。 必须注意的是,这里提到的95%CI是平均值的95%CI,而不是个体值的95%CI。个体预测值的95%CI不能通过SPSS自动计算得到。在这里,只需要了解平均值的95%CI与个体值的95%CI不同即可。 Next Previous 医咖会©2016-2019      北京医助科技有限公司      京ICP备16065316号-1 电话:010-84148036            关于我们 "