万年谜题,多组间比较时为什么会出现结果总体有差异,但两两比较无差异?或总体无差异,两两比较却有差异的情况呢?让我们开启本期的解谜之旅吧。
总体检验结果显著只说明多组间总体差异有统计学意义,具体哪两个总体有差异呢,还要看事后两两比较。
在大多数情况下,如果多组间总体有差异,那么事后至少有一个两两比较组间的差异具有统计学意义,但个别情况下,也会出现总体结果与两两比较结果前后矛盾的现象。为什么呢?
首先,整体比较和事后两两比较的差异性检验方法、计算原理和统计量都是不同的,因此计算出的p值也会有差别。如用于整体比较的单因素方差分析与用于两两比较的Tukey-Kramer检验,原理和统计量不同,而且Tukey-Kramer为了控制假阳性,还损失了部分统计功效,那就可能出现单因素方差分析提示总体差异显著,但Tukey-Kramer检验却发现两两比较组间差异无统计学意义的情况。此外,事后两两比较的方法也有许多种,采用更保守的检验方法将更难得到差异具有统计学意义的结果。
另外,当两两比较,各组样本量较小时,会由于统计功效低而难以得到差异具有统计学意义的结果。
其次,组别数量也会造成影响。组别越多,为控制假阳性率,对p值惩罚(penalized)程度或对检验水准(α)的调整程度越大。如事后两两比较采用Bonferroni法对α进行校正时,校正后α'=α/k,其中k为比较的次数,显然α'<α,更不容易拒绝相应的H0,因此校正后结果更为保守。这也就解释了为什么会出现总体差异有统计学意义,而两两比较的组间差异却无统计学意义的情况。
确认删除