分享BMJ上一篇很有意思的文献:统计专家告诉我要注意的12个统计错误

这个文献是去年圣诞节发表在BMJ上的,不是一项原始研究,是BMJ的统计专家列举了12条常见统计错误清单。一天消化一条建议,都消化完了,我们论文中的统计错误就会大大减少啦!原文见附件,下面简单列一列12条都有啥,有不到位的地方,各位大佬多多赐教。

第1天:阐明研究问题

例如,在一项观察性研究中,作者可能需要澄清他们的研究是描述性的还是因果性的,是预后因素识别还是预测模型开发,是探索性的还是确认性的。

第2天:关注效应值、置信区间和临床相关性

统计学显著性不等同于临床显著性,例如,一项大型试验估计风险比为 0.97,95%CI为 0.95-0.99,那么治疗效果可能很小,即使P值小于 0.05。

第3天:仔细考虑缺失值

最常见的填补方法要根据具体情况而定。例如,随机试验中处理缺失基线数据的策略,可能是用均值填补(对于连续变量),或创建一个单独类别以表明缺失值的存在。对于研究相关性的观察性研究,均值填补可能导致偏倚,多重填补法通常是首选(但不一定总是首选)。

第4天:避免对连续变量进行二分类处理

第5天:要考虑到非线性关系

https://dr2pp.oss.ns-svc.cn/KS/KSiu/KSiufXUpGixM8QlIsZpU.jpg

第6天:量化亚组结果的差异

论文中一个常见的错误,是在结论中说一个亚组的结果与另一个亚组的结果不同,但实际上没有量化这种差异。假设两个亚组的治疗效果结果,第一个有统计学意义(RR 0.67,95%CI 0.46-0.98;P=0.03),第二个则没有(0.88,0.71-1.08;P=0.2)。一个简单粗暴的解释是得出结论:治疗对第一个亚组有益,对第二个亚组无益。然而,实际比较两个亚组之间的结果,发现置信区间很宽(RR为0.76,95%CI为0.49-1.17;P=0.2),这表明在得出亚组效应的结论之前需要进一步研究。

第7天:考虑是否要进行聚类分析

尤其是使用多个数据来源时。

第8天:合理解释I2和Meta回归结果

系统评价和Meta分析是研究者向BMJ提交的热门文章,但BMJ的统计专家经常碰到对I2解释不正确的情况。

第9天:评估预测模型的校准

第10天:仔细考虑变量选择方法

第11天:评估其他假设的影响(敏感性分析)

第12天:使用报告规范并避免过度解释