不少人可能对方差齐性检验不是很重视,觉得正态性可能更重要,但其实方差齐性的重要程度可能更大,因为它可能会让你的标准误发生很大变化,从而导致结论的变化。线性回归中,方差齐性是一个必须考虑的前提条件。
本文主要介绍一下,如何理解线性回归中的方差齐性的含义,以及如何对方差是否齐性进行探测。
所谓方差齐性,也就是方差相等,在t检验和方差分析中,都需要满足这一前提条件。
在两组和多组比较中,方差齐性的意思很容易理解,无非就是比较各组的方差大小,看看各组的方差是不是差不多大小,如果差别太大,就认为是方差不齐,或方差不等。如果差别不大,就认为方差齐性或方差相等。当然,这种所谓的差别大或小,需要统计学的检验,所以就有了方差齐性检验。
在两组和多组比较中,每组都有很多数据,可以求出每组的方差,然后比较就行了,很容易理解。但是在线性回归中,有的人就不理解方差齐性是什么意思了。因为线性回归中自变量x不是分类变量,x取值很多。
通常情况下,每个x值只对应1个y值。比如,分析身高对血压值的影响,可能每个身高对应的血压值只有一个数值。很显然,对于1个数是没有办法计算方差的,那还何来“方差齐性”检验呢?
这是因为,尽管在一次抽样中每个x取值上可能只有1个y值,但对于总体而言,理论上每个x取值上对应的y值是有很多的。
例如,研究身高(x)与血压值(y)的关系,尽管在一次抽样中每一身高值(如170cm)所对应的血压值可能只有1个值(如140mmHg),但从总体而言这一固定的身高(170cm)所对应的血压值应该有很多,可能是140mmHg,也可能是150mmHg,只是在我们的抽样中恰好抽中了这1个值而已。
事实上,如果你重新抽样,170cm所对应的血压值可能就不是140mmHg了,有可能就是145mmHg或138mmHg等。
确认删除