多因素分析的统计方法,我们之前推送过多篇文章,小伙伴们可以去医咖会专题“多因素回归及变量筛选”中找找是否有你感兴趣的。接下来,咱们说说在运用这些统计方法时可能存在的一些问题。
一、纳入变量时存在问题
【原文】将文化程度、月收入等19个因素进行单因素Logistic回归分析,筛选出12个有统计学意义的影响因素。将单因素分析筛选出的有意义的可能危险因素,进行多因素条件Logistic回归分析,最终进入模型的因素有6个,整个模型有统计学意义(似然比χ2=135.21,P<0.05)。(《中华疾病控制杂志》2010年发表)
【分析】作者只将单因素分析结果显示有统计学意义的变量纳入多因素分析是不正确的。因为这些变量与结局之间的关系可能受到混杂因素的干扰,单因素分析无法避免这种情况。
单因素分析没有统计学意义的自变量,不代表多因素分析时其也无统计学意义。在自变量较多的情况下,可以采用逐步回归分析方法。但应注意,变量是否显著及作用大小,与模型中包含的变量有关,如在模型中含有{X1},{X1,X2}或{X1,X2,X3},这三种情况下,X1的检验结果可能会有很大的不同。实际中最好结合专业背景和研究目的去选择变量[1]。
(详细阅读:那么多变量,我该选择哪些进入多因素分析呢?;前进法、后退法...N多人问过的自变量筛选方法,再来细讲下!)
二、单因素分析代替多因素分析
【原文】烧伤入我院治疗的132例患者中,有HCV感染者105例,占烧伤患者79.5%。对HCV感染者,我们进一步对年龄、有无输血及血制品、输血及血制品的量、烧伤程度等进行了对比分析(见表1、2、3)。
对HCV感染与诸因素相关性运用四格表专用公式法进行统计学处理,结果表明HCV感染与有无输血及血制品(χ2=12.05,P<0.01)、烧伤程度(χ2=5.03,P<0.05)有显著性差异,与输血及血制品的量(χ2=0.015,P>0.05)、年龄(χ2=0.0174,P>0.05)无明显差异。(《中华医院感染学杂志》1997年发表)
确认删除