我该咋筛选变量进入多因素回归?先教你基础几招!

龚志忠

龚志忠

首都医科大学附属北京中医医院

擅长:临床研究数据统计分析、流行病学方法设计、临床预测模型建模与评价
已关注
关注
2018-09-18 来源:医咖会

在前期推送的内容中,我们介绍了构建多因素回归模型,探讨对结局指标有独立作用的影响因素,就好比侦探破案找出真凶的过程。我们作为研究人员,就像是一名侦探,通过统计学方法及专业知识,在众多的嫌疑人中一一排查,来一次『白夜追凶』,最终才能找出真正的凶手X。

相关阅读:嫌疑人X的献身:如何理解回归模型中的"调整"和"独立作用"

当然,要做一名好侦探,你一定要有一种可靠的直觉,能够准确划定嫌疑人的范围,这才是成功破案最为关键的一步,如果事先连嫌疑人都判断错了,那就只能让凶手逃之夭夭了。

同样,对于一个研究来说,我们通常会收集很多数据资料,但由于受到样本量、或者结局事件数量的限制,我们不可能把所有的变量都带入到多因素回归中进行分析。那么,在面对众多自变量需要进行分析时,到底如何来确定谁是可疑因素,哪些因素需要被纳入到嫌疑人的范围内,从而进入到多因素回归分析呢?今天就跟着小咖一起,教大家如何筛选多因素回归分析的候选变量

研究实例

学习标准的统计方法,最直观便捷的一个途径就是从文献中去学习,看看在高分期刊上发表文章的大牛们都是怎么进行分析的。

我们首先来看一篇2011年发表在The New England Journal of Medicine (影响因子:72.4)的文章:《A Prospective Natural-History Study of Coronary Atherosclerosis》[1]。

我们先不管这篇文章都做了哪方面的研究,就单凭作者对于统计学方法的描述,小咖觉得已经足够膜拜的了。

关于如何筛选多因素回归分析的候选变量,作者原文中这样写道:

Baseline variables that were considered clinically relevant or that showed a univariate relationship with outcome were entered into multivariate Cox proportional-hazards regression model. Variables for inclusion were carefully chosen, given the number of events available, to ensure parsimony of the final model.

试读结束,兑换后即可解锁本专栏全部课程
评论
请先登录后再发表评论
发表评论
胖子也要当学霸
请教老师,多因素logistic回归从临床因素中筛选出了A、B、C、D四个变量建立临床模型,AUC为0.9,然后同时从临床因素和影像学指标中筛选变量A、B、E建立临床-影像模型,AUC为0.8,为什么会出现这种结果呢?如果影像学指标对模型无用的话,不应该是不被筛选进去,也得出A、B、C、D的模型吗?
2022-03-17 10:56:43 回复
0
medi_27054104249
请问咖咖,对于连续型数值变量,按照ROC或X-tile二分类得到的结果,P值很大或分不出来临界值,又想纳入多因素,这个怎么搞?直接以数值型变量纳入吗
2021-06-29 22:02:06 回复
1
嘎嘎嘎
也可以根据专业背景自定义分类方法
2022-02-24 16:31:22 回复
0
阿咖
请问,“需要注意的是,这里指的是结局事件的数量,而不是总的样本量,总样本量当然还要远远多于结局事件的数量。” 那总样本量应该是多少呢?
2021-02-14 22:15:18 回复
0
李侗桐
总样本量要经过计算哦,可以看看:PASS 软件估算样本量实操(上)https://www.mediecogroup.com/zhuanlan/lessons/750/
2021-03-05 10:23:09 回复
0
使用课程券需先认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
下载附件需认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
会员服务
SCI-AI工具
积分商城
意见反馈