本文参考自《Am J Gastroenterol》(影响因子:9.566)上的一篇文章《Ten common statistical errors and how to avoid them》[1],我们将拆分成多篇文章来细讲,做成一个系列~~~
1. 研究设计和分析方法的阐述不够清晰
“重现性”是体现科学过程的基础。如果可以获得与某一研究相同的数据,依据文章的“研究方法”这一部分,遵循相同的统计方法,应该可以得到相同的结果。否则就表明该文章对于研究设计或者分析方法的介绍是不完整的。好的“研究方法”不仅应该详细介绍数据的来源、研究设计类型(如前瞻性的队列研究或回顾性研究等),还应该有明确的纳入排除标准以及缺失数据的处理方法等。(相关阅读:如何处理缺失数据?给你支3招!)
“研究方法”这一部分通常都会介绍文中使用的统计学方法,例如:服从正态分布的组间比较用t检验,不服从正分布的用Wilcoxon秩和检验;分类变量的组间比较依据适用条件选择卡方检验或Fisher确切概率法。
但是仅凭上述一段简单描述并不完整,为了确保“重现性”,需要具体明确验证某一假设时采用了何种检验方法。举例而言,卡方检验、连续性校正、Fisher确切概率法有不同的统计学适用条件,不同的检验方法得出的结论常常会有细微的差别;在构建多变量模型时如果不能说明获得最终模型的过程以及所依据的原则,这样的分析有可能是无法被重现的。(相关阅读:SPSS详细操作:独立样本四格表的卡方检验)
【建议】
① 简洁清晰地描述选取研究对象及数据收集过程,明确在分析每一个假设及研究指标时所对应的统计学方法。
② 结果部分需要包括两方面内容:
确认删除