在回归分析中,经常看到多变量回归、多因素分析、多重线性回归、多元logistic回归等诸如此类的名词。这些所谓的多变量、多因素、多重、多元,是否一回事?很多初学者都会比较迷惑,本文主要对此做一阐述。
回归分析中,主要就是因变量和自变量,大多数的回归模型的形式都是如下所示:
因变量(或因变量的变换)=截距+回归系数*自变量(可以是多个自变量)
它反映了1个或多个自变量是如何影响因变量的。
因此,关于多变量、多因素、多重、多元,也就是如何对应因变量和自变量。
为了简单起见,下面都以线性回归为例来说明,其它如logistic回归、Poisson回归等都一样。
(1)简单(simple)线性回归
简单线性回归模型(simple linear regression model)是指1个因变量、1个自变量的模型,如下:
(2)多因素(multivariable)或多重(multiple)线性回归
(3)多元或多变量(multivariate)线性回归
多元或多变量线性回归模型(multivariate linear regression model)是指多个因变量的回归模型。
大家可以再对比一下多元方差分析和多因素方差分析。
多元方差分析或多变量方差分析,它们都是什么意思呢?主要适用于像重复测量数据这种情况,在重复测量数据中,每个人测量了多次,有多个结局变量(因变量),因此是多元方差分析。
多因素方差分析主要用于什么情形呢?通常用于有多个分组变量(自变量),如析因设计中至少有2个分组变量,这种情况下,采用的是多因素方差分析。这里的“因素”是指自变量,因此不是多元方差分析。
有些分类比较清楚的统计软件,其实分的很清楚,尤其是一些菜单结构的。比如下图是SAS jmp软件的菜单,可以看出,在多元方法的菜单中,不是回归分析,而是主成分分析、因子分析、偏最小二乘回归等方法。
确认删除