一、问题与数据
某研究者猜测,45岁至65岁健康男性中,久坐时间较长者,血液中的胆固醇浓度要高一些。因此开展一项研究,拟探讨胆固醇浓度(mmol/L)与久坐时间((mins/day))是否有关。研究者收集了研究对象每天久坐时间(变量time)和胆固醇浓度(变量cholesterol)。部分数据如图1。
图1 部分数据
二、对问题分析
研究者想观察两个连续变量之间的相关性,可以使用Pearson相关性分析。使用Pearson相关性分析时,需要考虑5个假设。
假设1:两个变量都是连续变量。
假设2:两个连续变量应当是配对的,即来源于同一个个体。
假设3:两个连续变量之间存在线性关系,通常做散点图检验该假设。
假设4:两个变量均没有明显的异常值。Pearson相关系数易受异常值影响。
假设5:两个变量符合双变量正态分布。
假设1和假设2与研究设计有关。经分析,本研究数据符合假设1和2。如何考虑和处理假设3-5呢?
确认删除