文章来源:“小白学统计”公众号
两两比较方法的选择,大概是统计学界争议最多的一个话题了,直至今天,也没有一个完全统一的说法。所以,本文虽然说是两两比较方法的选择,但更多的是在基于以往文献的基础上,再结合作者本人的经验和理解,给读者一些提示。
两两比较的方法太多了,正因为太多了,所以往往大家都不知道给怎么选择。比如SAS提供了12种两两比较方法让人选择,SPSS更是毫不吝啬地给出了18种方法让你选择。我想任何一个非统计专业的人都有同一个感觉:你在耍我们吗?
毫无提示地给出10多种方法,让我一个毫无统计背景的人自己选择。就像是医生给你10多种药,一脸怜悯地对你说:回家自己看着吃啊,你觉得哪个好就吃哪个。
关键是,明知道我们没有这个判别力,为什么要给我们这么多的两两比较方法,还得让我们自己选择?正是统计学家太多了,每个人都能根据自己的理念提出一种方法,而这些方法看起来似乎都没错,那怎么办?只好都放在软件中,你自己跟着感觉走吧。
下面就来说几种比较常见的两两比较方法的选择,希望给大家稍微理清一点思路。先声明一下,以下结论是参考了不少国外课本和文献,加上自己的一点经验,而且只给出结论性的内容,不给出公式和证明,喜欢追根究底的朋友可以自己看专业书籍。
为什么要用两两比较方法呢?大多数两两比较方法的目的都是为了控制假阳性,因为两两比较次数多了,容易产生假阳性的结果。
首先说医学统计课本中最喜欢介绍的3种方法:LSD、SNK和Bonferroni法。我大概翻了一下国内的医学统计学教程,几乎都是这3种方法,但似乎都没有说什么情况下用。
LSD法其实就相当于t检验,只不过它需要在方差分析一定要有统计学差异的情况下才用。所以LSD法并没有控制假阳性错误。一般情况下,如果你在设计初期就有很明确的目的,可以考虑这种方法,因为每一对比较都是有特定意义的,不用非得控制假阳性错误。
确认删除