近年来,关于“statistical significance(统计显著性)”和P值的争议一直存在。前段时间,《Nature》发表了一篇题为《scientists rise up against statistical significance》的文章,《美国统计学家》也专门发布了一个针对P值的专刊。感兴趣的可以查看:放弃"统计显著性(P<0.05)"的时代,已经到来了吗?
近日,《欧洲心脏病杂志》(EHJ)发表了一篇专家观点,再次针对“统计显著性”发表了自己的观点,到底是降低P值,还是抛弃统计显著性,我们来看看这位专家持怎样的态度。
几十年来,论文中都基于p<0.05来声明具有“统计显著性”。然而,很多专家也发现,有些论文中的统计学意义和临床意义并不相符,p值的滥用问题很严重。2016年,美国统计协会(ASA)曾针对这些误用发表了共识(表1)。
表1. ASA关于P值的主要声明要点
方法学专家在核心问题上意见一致,但在许多关键细节上仍然存在分歧,更重要的是,在如何最好解决“统计显著性”问题上也存在分歧。理想情况下,所有学科都需要全面了解统计工具、注意事项和如何正确解读结果。然而,提高所有学者、临床医生甚至普通大众的统计素养需要长期的努力。
最常见和严重的误解是,“P< 0.05”就表示效果“是真的”,甚至“很重要”。目前大多数达到P<0.05的研究,并不太可能反映真实的因果效应,更不用说重要效应。大多数研究都存在偶发性或偏倚,可能很少真的具有临床重要意义且值得采取措施。
还有一个误解是,P≥0.05就必然意味着“不是真的”或“不存在差异”。小型研究可能就无法发现真正的差异性。如果偏倚削弱了估计值,即使是大型研究也可能会遗漏一些真正的差异。在某些领域,尤其是社会科学领域,有人认为不管差异多么小,也总是存在差异的。还有另一种学派主张,大多数经过检验的关联和效果很可能实际上是无效的。
确认删除