数据库搭建(EDC)

统计分析服务

提问

登录 / 注册

二分类Logistic回归【简】-SPSS教程

张耀文

医咖会

擅长：研究设计、统计分析、循证医学、样本量计算、随机化方案、数据管理

已关注

关注

个人主页

2017-10-26 来源：医咖会

一、问题与数据

某呼吸内科医生拟探讨吸烟与肺癌发生之间的关系，开展了一项成组设计的病例对照研究。选择该科室内肺癌患者为病例组，选择医院内其它科室的非肺癌患者为对照组。通过查阅病历、问卷调查的方式收集了病例组和对照组的以下信息：性别、年龄、BMI、COPD病史和是否吸烟。变量的赋值和部分原始数据见表1和表2。该医生应该如何分析？

表1. 肺癌危险因素分析研究的变量与赋值

表2. 部分原始数据

二、对问题分析

该设计中，因变量为二分类，自变量（病例对照研究中称为暴露因素）有二分类变量（性别、BMI和是否吸烟）、连续变量（年龄）和有序多分类变量（COPD病史）。要探讨二分类因变量与自变量之间的关系，应采用二分类Logistic回归模型进行分析。在进行二分类Logistic回归（包括其它Logistic回归）分析前，如果样本不多而变量较多，建议先通过单变量分析（t检验、卡方检验等）考察所有自变量与因变量之间的关系，筛掉一些可能无意义的变量，再进行多因素分析，这样可以保证结果更加可靠。即使样本足够大，也不建议直接把所有的变量放入方程直接分析，一定要先弄清楚各个变量之间的相互关系，确定自变量进入方程的形式，这样才能有效的进行分析。

表3. 病例组和对照组暴露因素的单因素比较

单因素分析中，病例组和对照组之间的差异有统计学意义的自变量包括：性别、COPD病史和是否吸烟。

此时，应当考虑应该将哪些自变量纳入Logistic回归模型。一般情况下，建议纳入的变量有：1）单因素分析差异有统计学意义的变量（此时，最好将P值放宽一些，比如0.1或0.15等，避免漏掉一些重要因素）；2）单因素分析时，没有发现差异有统计学意义，但是临床上认为与因变量关系密切的自变量。

评论

请先登录后再发表评论

发表评论

medi_27722230571

！

2024-11-09 19:07:10 回复

0

medi_28369562201

结果有个块0：起始块，只有常量。还有个块1：方法=前进法（似然法），有相应的参数。选哪个啊。是块1的结果吗。

2023-12-10 10:11:24 回复

1

好牛啊

2023-05-17 14:47:06 回复

0

medi_28008493384

很清晰👍

2023-04-03 16:30:40 回复

0

好清晰好棒！感恩！

2022-12-03 21:42:07 回复

0

好棒

2022-12-02 16:57:07 回复

0

medi_27530643058

我的逐步logistic回归最后只有一个自变量有意义，然后）Hosmer and Lemeshow Test：p为-，那可以吗

2022-10-22 22:51:22 回复

0

medi_26617671675

如果总P值>0.05，哑变量子项存在p<0.05，这个子项算有统计学差异吗？

2022-08-31 16:10:35 回复

2

有统计学意义

2023-02-24 08:41:00 回复

0

混杂因素调整

2022-06-25 12:07:13 回复

0

老师您好，请问为什么如果关注自变量年龄的OR值，就把它转换为分类变量。不理解为什么（年龄每增加1岁，患肺癌的风险增加1.02倍）这种解释在临床上没有意义的？

2022-04-04 23:39:50 回复

0

不符合临床实际吧

2022-04-16 10:40:38 回复

0

推荐课程

【图文】Cox回归的PH假定问题

【图文】Cox回归的PH假定问题

【视频】33节科研进阶教程：系统学习临床研究知识！

【视频】33节科研进阶教程：系统学习临床研究知识！

【图文】文献检索与管理

【图文】文献检索与管理

【视频】基金申请与标书撰写入门课

【视频】基金申请与标书撰写入门课

确认

取消

确认

取消

公众号

统计咨询

扫一扫添加小咖个人微信，立即咨询统计分析服务！