简单线性回归

SPSS教程回归分析
问答

点击绿色“提问”按钮

  • 针对本文提问
  • 查看历史问答

长按鼠标选中正文某句话

  • 对选中的内容进行针对性提问
一、问题与数据

某研究者猜测,45岁至65岁健康男性中,看电视时间较长者,血液中的胆固醇浓度要高一些。因此拟开展一项研究探讨胆固醇浓度与观看电视的时间是否有关,并希望通过看电视时间预测胆固醇浓度。研究者收集了研究对象每天看电视时间(变量time_tv)和胆固醇浓度(变量cholesterol)。部分数据如下图。

 

二、对问题分析

研究者想判断两个变量之间的关系,同时用其中一个变量(看电视时间)预测另一个变量(胆固醇浓度),计算其中一个变量(看电视时间)对另一个变量(胆固醇浓度)变异的解释程度。针对这种情况,可以使用简单线性回归分析,但需要考虑7个假设。


假设1:因变量是连续变量。


假设2:自变量可以被定义为连续变量。


假设3:因变量和自变量之间存在线性关系。


假设4:各观测值之间相互独立,即残差之间不存在自相关。


假设5:因变量没有显著异常值。


假设6:残差的方差齐。


假设7:残差近似正态分布。


假设1和假设2与研究设计有关。经分析,本研究数据符合假设1和2。如何考虑和处理假设3-5呢?

三、SPSS操作
请先登录
这么重要的内容,赶快登录查看吧!
四、结果解释
请先登录
这么重要的内容,赶快登录查看吧!
五、撰写结论

采用简单线性回归模型分析看电视时间对胆固醇浓度的影响。通过绘制散点图,直观判断两者之间存在线性关系,并通过绘制标准化残差散点图和带正态曲线的直方图和P-P图,判断残差方差齐且近似正态分布。同时为了保证数据的代表性,我们剔除了一项异常值(胆固醇浓度为7.98 mmol/L)。


回归方程为:胆固醇浓度= -0.944+(0.037×看电视时间)。看电视时间对胆固醇浓度的影响有统计学意义,F=14.395,P <0.001;看电视时间可以解释胆固醇浓度变异的12.9%,影响程度中等(调整R2= 12.0%)。每增加1分钟/天看电视时间,胆固醇浓度增加0.037 (95% CI:0.018-0.056)mmol/L。此外,看电视时间为160分钟/天、170分钟/天和180分钟/天的胆固醇浓度预测值分别为4.98 (95% CI:4.73-5.23)mmol/L、5.35 (95% CI:5.24-5.45)mmol/L和5.72 (95% CI:5.53-5.90)mmol/L。


绘制散点图


3.1部分中,已经绘制出了基本的散点图,但是在汇报结果时,有时仍需要增加最佳拟合线、平均值的95%CI与个体值的95%CI等指标。具体操作方法如下:


双击散点图,激活Chart Editor,点击Element→ Fit Line at Total。
 



此时,散点图上出现拟合直线及回归方程。同时,Properties对话框也会自动弹出。
 



提示:如果只想做出最佳拟合线,到这一步就可以关闭Properties和Chart Editor窗口,完成操作。如果需要绘制平均值的95%CI与个体值的95%CI,请继续操作。


在Properties对话框中,点击Confidence Intervals中的Mean。
 




点击Apply,出现下图。
 



同样在Properties对话框中,点击Confidence Intervals中的Individual,点击Apply,则出现个体值的95%CI。


关闭Properties和Chart Editor窗口,Output Viewer窗口会弹出带有平均值95%CI和个体值95%CI的散点图。

 

请先登录
这么重要的内容,赶快登录查看吧!
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
Next
Previous
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
    提交问题