内容来自:“小白学统计”微信公众号,感谢作者授权。
有不少临床工作者,提“率”必“卡方”,似乎卡方检验是分析“率”指标的万能工具,也有的人只要看到分类资料,一律用卡方检验。事实上,不同的研究目的、资料类型所采用的方法是各不相同的。卡方只是其中之一,但绝不是全部。换句话说,卡方检验可以比较两组或多组的分类资料,但分类资料的比较不一定非要用卡方检验。
本文主要针对目前论文撰写中常见的一些卡方检验的错误应用进行分析,并给出正确的分析思路。
一定要区分“分组”和“结局”
以前有的统计学书中,经常这么说:行变量是无序、列变量是有序的情形用某某方法,行变量是有序、列变量无序用某某方法,等等之类的。很容易让人糊涂,什么行和列?我的行列跟你的行列一样吗?作为初学者,经常晕晕乎乎的搞不懂。
其实,比较简单的方法是这样:分清楚哪个是分组变量,哪个是分析变量(结局)就行了。这个比较好区分,根据你的研究目的就行了。比如你要比较两种药物的疗效,那很明显,疗效是结局,药物是分组。再比如,比较男女间某病发病率,那么性别就是分组,是否发病就是结局。
只要你能分清分组和结局,就很容易选择方法。其实在分类资料的比较重,分组是什么资料并没有关系,重要的是结局资料的类型。且看下面的图形。
分类结局组间比较的方法选择
首先一定要明确,分类资料主要有三种类型:二分类、无序多分类和有序多分类。对于不同的类型,组间比较方法是不同的,绝不是卡方检验一家独大,更需要结合实际情况来判断。下图是常见的分类资料组间比较的方法。
不难看出,对于分类资料的组间比较,统计方法的选择主要跟结局指标类型和研究设计有关,跟分组变量的类型没什么关系。你的分组变量是无序也好,有序也好,都无所谓。只跟你的结局变量的类型有关,你的结局变量是有序或无序,那就有影响了。
确认删除