第九部分. 缺失数据
缺失数据一般分为完全随机缺失、随机缺失和非随机缺失。但是,临床研究中最常见的情况不是随机缺失的,如果缺失的数据与临床表现或研究结果相关,就会产生偏倚。数据缺失是较为常见的,为临床研究的结果分析和解释带来较大的挑战。
对于临床试验,当发生数据缺失时,没有任何分析方法能够保证对治疗效果产生无偏倚的估计,如果数据是前瞻性收集的,那么在试验设计阶段防止数据丢失就显得十分必要,且同样适用于其他研究。
因此,最好的方法是采取预防措施,在设计阶段尽量减少数据的丢失。在数据分析阶段并没有处理缺失数据的统一方法。需要强调的是,假设数据是否为随机缺失的合理性通常无法得到验证。常用的缺失数据处理方法有全数据集分析、缺失指标法、单值填补法、多重填补法和逆概率加权法。
9.1 统计报告标准
- 报告所有主要和次要结局测量中缺失数据的频率。
- 报告在所有建模中作为预测变量的数据缺失的频率。
- 尽可能多地报告数据缺失的原因,并以此来告知读者关于数据缺失机制的主要假设,如完全随机缺失,随机缺失或非随机缺失。
- 在主要缺失数据的假设下,使用有效的统计方法进行分析。
- 采用敏感性分析,以证明在偏离主要缺失数据假设的情况下推论的稳健性或缺乏稳健性。
- 提供足够的细节,让你的分析方法可以被重复。
确认删除