有关“P<0.05表示有统计学差异”似乎从诞生之初就备受争议,事实上,为什么把检验水准定在0.05,有什么科学道理?到现在大家也没整明白,但是这并不妨碍众多作者在研究结果中对于P<0.05的痴迷,总得有点儿“有意义”的结果,论文才“好看”。但是呢,带来的问题是各种假阳性结果的泛滥。于是乎,就不断有人提出修改目前所使用的统计学显著的标准。
Daniel J. Benjamin等人提出将现行的0.05标准降低到0.005—《Redefine Statistical Significance》于2017.7.22发表在Nature Human Behaviour。
在这篇论文中,70名牛X的科学家支持在研究中提高被广泛使用的统计学显著的阈值,也就是我们常常想尽一切办法获得的P<0.05。这些科学家说,应该把检验水准调整为0.005,目的嘛,就是为了降低发现假阳性结果的可能性,提高科学的可重复性。
而来自荷兰埃因霍温科技大学的心理学家Daniël Lakens却抱怨道:“这群优秀的人怎么就给出了如此可怕的Bad Advice”。Lakens认为一个更小的α(或者说检验水准),毫无疑问会需要更大的样本量,而这无疑会让一些研究永远无法完成(比如说一些罕见病研究,疾病发生率本来就低,难道要等到患者达到一定的数量才开始搞研究,这显然是极度违背伦理的!)。
Lakens进一步发问道,“既然科学是如此的多元化,那么为什么要把科学研究局限在一个单一的P值上?”
Lakens等人最近也发表了一篇他们自己的论文来提供另外一种选择,这篇文章同样发表Nature Human Behaviour。就文章内容而言并没有什么惊天动地大发现,但是呢,整个论文的成稿过程却绝对会让你叹为观止! 这篇论文由来自全球100多名作者(既有国际大腕儿Prof.,亦有博士研究生Ph.D.),利用Google docs(一款在线协助编辑工具),为期两个月撰写完成。
确认删除