本文转载自微信公众号“小白学统计”,感谢作者授权。
统计分析方法有很多,从简单的组间比较到复杂的各种模型,如果你感兴趣,有众多的统计方法足够你徜徉在统计学的海洋之中。当然,统计学方法的误用也不在少数,国内的医学杂志中,毫不夸张地说,几乎每一本杂志总能找出一些统计学上的错误。
对于非统计学专业人士,专门去学各种复杂的方法确实有点过于为难,而且从杂志中的错误来看,绝大多数的错误其实都是最基础的错误,为什么呢?我个人觉得,可能是因为复杂方法非统计专业人士不会用,只能去请教统计学家,反而不容易出错。越是简单的方法,可能大家都想干脆自己做算了,结果反而漏洞百出。
所以本文主要是用一张图来介绍一下,对于定量资料,如何选择组间比较方法。这里要明确两个问题:一是针对的是定量资料,二是针对组间比较。
什么是定量资料?这个问题可能过于简单,不过还是先说一下。定量资料有很多特征,起码可以有单位,比如身高,你知道单位是cm或m。而对于性别,你想象不出它的单位是什么,因为它只能有男和女。
定量资料可以分为连续资料和离散资料,连续资料,顾名思义,就是数值连绵不断,想象一下在一个坐标轴上,你可以从负无穷到正无穷取任意值,可以有小数点。
而离散资料是只能取整数,比如红细胞计数,单位是个。当然如果你指定不同单位,有时看起来离散资料好像也可以取小数点。比如3.5X1012,单位太大,所以前面的数值可以带小数点,但如果单位是个,那前面数值肯定不是小数点。
什么是组间比较?我们都知道看,数据分析的目的有很多,你可以探索多个变量的关系,可以看不同组的差异比较,可以看如何对数据进行分类,等等。组间比较是一种比较简单的思想,就是你采用相应的设计方法(如完全随机设计),把人群分为两组或多组,比较各组之间的均值或率有没有统计学差异。涉及的因素很简单,就是一个组别因素。所以,对于这类研究目的,选择方法的时候,只要稍微注意下,一般不会选择错误。但现实的问题是,很多人都不注意细节,所以反而容易出错。
下面就是关于组间比较的常用统计方法选择的图示,根据这一图示,可以比较容易选择相应的统计分析方法。
确认删除