2024年2月17日,《Lancet》发布了一篇通信类文章(Correspondence),基于对近三年投稿到《Lancet》的1000多份文章的审查,总结了常见的统计误区,并为如何避免这些错误提供了指导。
原文链接:https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(24)00139-9/fulltext
准确报告统计数据的基本建议总结
- 使用均值和标准差(SD)(或中位数和四分位间距[IQR])描述定量数据的分布情况;在补充材料中提供直方图或表格。
- 不要简单写P值小于或大于0.05(或0.01),要报告精确的P值(例如,P值为0.032,应写P=0.032,而不是P<0.05);但对于极小的P值,可以报告为P<0.0001。
- 不要简单将结果描述为没有效果,除非区间估计的所有效应值均没有临床意义。
- 应基于临床重要性来解释结果。
- 根据背景信息(如因果有向无环图[DAG]所示)识别混杂因素,而不是显著性检验。
- 缺失数据的占比过高,可能会影响结果,不要简单删除不完整数据,可使用逆概率加权或多重插补等方法。
- 应使用专用的方法评估和处理稀疏数据偏倚(sparse-data bias)。
- 如果结局发生率较高,应报告危险比(risk ratio,RR)或危险差(risk difference,RD),而不是比值比(odds ratio,OR)
- 即使采用了相乘模型,也要评估相加交互作用。
确认删除