如何处理缺失数据?给你支3招!

龚志忠

龚志忠

首都医科大学附属北京中医医院

擅长:临床研究数据统计分析、流行病学方法设计、临床预测模型建模与评价
已关注
关注
2018-07-24 来源:医咖会

研究实例

某研究人员拟研究针灸疗法对于治疗肩部疼痛的效果,设计了一个随机单盲对照临床试验,一共纳入了52名患有肩袖肌腱炎的运动员,随机分为2组,分别接受针灸治疗和虚拟针灸治疗,治疗共持续4周,研究以基线和治疗后的肩关节评分作为疗效评价指标,最终共有45名研究对象完成了本次临床试验。

在该研究中,有7名(13.5%)研究对象因为各种各样的原因退出了本次临床试验,其中试验组3名,对照组4名,研究人员未能真实地记录到他们治疗后的疗效情况,无法准确评估治疗效果,由于病例脱落而产生了缺失数据。

在临床试验的过程中,病例脱落是非常常见的,而且往往也是不可避免的,缺失数据不仅会降低临床试验统计分析的把握度,而且会给试验结果的评价带来一定的偏倚。那么,为了保证研究结果的稳定性和可靠性,我们今天就来讨论一下,在进行统计分析时,应该如何科学有效的处理这些缺失数据呢?

1、直接剔除法

当脱落病例占总病例数量的比例很小时,而且病例脱落是完全随机发生的,即脱落的原因与临床试验本身无关,例如研究对象因工作出差而退出研究,或搬家而造成失访等,此时可以考虑直接舍弃脱落病例产生的缺失记录,形成一个完全数据集,仅对记录完整的数据进行统计分析(complete case analysis)。

然而,在实际研究中,缺失数据往往占有相当的比重,直接删除缺失数据会丢失大量信息,减少了对原始数据的利用效率,造成资源浪费,特别是当样本量本身很少的时候。此外,盲目删除缺失数据可能导致统计分析结果产生一定的偏倚,当缺失数据和完全观测的数据之间存在系统差异时,会影响研究结论的客观性及正确性,甚至可能会得出错误的结论。

2、单一填补法:LOCF

评论
请先登录后再发表评论
发表评论
使用课程券需先认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
下载附件需认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
会员服务
SCI-AI工具
积分商城
意见反馈