一、问题与数据
某研究者已知受教育程度可以影响幸福指数,即如果将研究对象的受教育程度分为高中及以下、大学本科和硕士研究生及以上3个等级(级别依次递增),那么他们的幸福指数会随着受教育程度的增加而增加。目前,该研究者拟进一步分析研究对象这种受教育程度与幸福指数的相关关系是否受性别影响。研究者招募了58位研究对象,包括28位男性和30位女性。每一类性别中,研究对象的受教育程度由均分为3类(高中及以下、大学本科和硕士研究生及以上)。该研究者采用问卷测量研究对象的幸福指数,研究对象得分在0-100之间分布,分数越高,幸福指数越强。最终收集了研究对象的幸福指数(Index)、性别(gender)和受教育程度(education)等变量信息,部分数据如图1。
图1 部分数据
二、对问题分析
研究者已知一个自变量(受教育程度)对因变量(幸福指数)的影响,想判断另一个自变量(性别)对这一相关关系是否存在作用。针对这种情况,我们可以使用两因素方差分析,但需要先满足6项假设:
假设1:因变量是连续变量。
假设2:存在两个自变量,且都是分类变量。
假设3:具有相互独立的观测值。
假设4:任一分类中不存在显著异常值。
假设5:任一分类中残差近似正态分布。
假设6:任一分类都具有等方差性。
假设1-3主要和研究设计有关,经分析,本研究数据满足假设1-3,那么应该如何检验假设4-6,并进行两因素方差分析呢?
确认删除