分享BMJ上一篇很有意思的文献：统计专家告诉我要注意的12个统计错误-医咖社区

分享BMJ上一篇很有意思的文献：统计专家告诉我要注意的12个统计错误

这个文献是去年圣诞节发表在BMJ上的，不是一项原始研究，是BMJ的统计专家列举了12条常见统计错误清单。一天消化一条建议，都消化完了，我们论文中的统计错误就会大大减少啦！原文见附件，下面简单列一列12条都有啥，有不到位的地方，各位大佬多多赐教。

第1天：阐明研究问题

例如，在一项观察性研究中，作者可能需要澄清他们的研究是描述性的还是因果性的，是预后因素识别还是预测模型开发，是探索性的还是确认性的。

第2天：关注效应值、置信区间和临床相关性

统计学显著性不等同于临床显著性，例如，一项大型试验估计风险比为 0.97，95%CI为 0.95-0.99，那么治疗效果可能很小，即使P值小于 0.05。

第3天：仔细考虑缺失值

最常见的填补方法要根据具体情况而定。例如，随机试验中处理缺失基线数据的策略，可能是用均值填补（对于连续变量），或创建一个单独类别以表明缺失值的存在。对于研究相关性的观察性研究，均值填补可能导致偏倚，多重填补法通常是首选（但不一定总是首选）。

第4天：避免对连续变量进行二分类处理

第5天：要考虑到非线性关系

第6天：量化亚组结果的差异

论文中一个常见的错误，是在结论中说一个亚组的结果与另一个亚组的结果不同，但实际上没有量化这种差异。假设两个亚组的治疗效果结果，第一个有统计学意义（RR 0.67，95%CI 0.46-0.98；P=0.03），第二个则没有（0.88，0.71-1.08；P=0.2）。一个简单粗暴的解释是得出结论：治疗对第一个亚组有益，对第二个亚组无益。然而，实际比较两个亚组之间的结果，发现置信区间很宽（RR为0.76，95%CI为0.49-1.17；P=0.2），这表明在得出亚组效应的结论之前需要进一步研究。

第7天：考虑是否要进行聚类分析

尤其是使用多个数据来源时。

第8天：合理解释I2和Meta回归结果

系统评价和Meta分析是研究者向BMJ提交的热门文章，但BMJ的统计专家经常碰到对I2解释不正确的情况。

第9天：评估预测模型的校准

第10天：仔细考虑变量选择方法

第11天：评估其他假设的影响（敏感性分析）

第12天：使用报告规范并避免过度解释