逐步回归分析,涉及多分类变量和连续型变量

做影响因素分析,因变量是连续型变量,自变量包括社会人口学变量(分类变量)和其他连续型变量,准备做线性回归,之前直接用的是将分类变量进行虚拟化,重新编码为不同变量,设置参考类别 ,纳入线性回归,默认“输入”,结果统计老师说我这个不科学,应该选择“逐步”

我了解到,逐步 相当于更高阶,操作会,但是我不明白,做逐步的话,同样需要把各个分类变量设置哑变量吗?有二分类的,也有多分类的,是所有的都需要哑变量处理吗?那样的话,会不会类别太多

还有一个问题是,之前做线性回归,只纳入了单因素分析中有差异的分类变量,及连续型变量;若改用 逐步,还需要单因素分析吗?因为据说也可以纳入“理论上我们认为可能影响因变量的变量,即使它在单因素分析中无差异”

我刚刚试了做逐步,设置参考类别,和不设置参考类别(直接把原始变量纳入),两种结果有不同。设置参考类别那种,显示的其中一个类别的统计值有意义,我都不知道怎么去用表格展示结果了,是直接展示变量名(代替类别名)吗?