【图文】分类变量的统计分析,都能用χ2检验吗?

龚志忠

龚志忠

首都医科大学附属北京中医医院

擅长:临床研究数据统计分析、流行病学方法设计、临床预测模型建模与评价
已关注
关注
2022-03-08 来源:医咖会

2021年年底,医咖会“临床研究100问”正式启动。目前已经进行了三期直播,前三期的内容可以直接点击查看:《正态分布及正态检验中被问爆了的典型问题》《独立样本t检验的那些经典问题与常见错误》和《配对资料,统计方法怎么选?》。

第四期直播,龚志忠老师带来了《分类变量的统计分析,都能用χ2检验吗?》,例如χ2检验的基本原理是什么?是不是所有分类资料比较都可以用χ2检验?2组配对设计的分类资料如何进行检验?多组配对设计的分类资料如何进行检验?

图片

什么是χ2检验

χ2检验基本思想

χ2检验是由英国统计学家Karl Pearson于1900年提出的,也称为Pearson χ2检验。χ2检验主要用于计数资料,推断两个或多个总体率或构成比之间差异是不是有统计学的显著性。

χ2检验的统计量为χ2值,计算公式为:

其中A为实际频数,T为理论频数。χ2值实际上反映了实际频数和理论频数的吻合程度。χ2检验另一个比较重要的参数是自由度(v),计算公式为v=(行数-1)(列数-1)。进行χ2检验检验时,需要根据自由度来选择对应的χ2值进行推断。

举个例子

举例:研究分为试验组和对照组,给予一定的干预措施后,查看试验组的有效率和对照组的有效率是否存在差异。试验组,干预有效的人数为a,干预无效的人数为b;对照组,干预有效的人数为c,干预无效的人数为d。此时,a、b、c、d就是χ2检验的实际频数(A)。

根据实际频数,可以计算出对应的理论频数(T),也称为期望频数。计算公式如下:

例如:

如果A与T相差越大,说明实际频数和理论频数差异很大,计算所得的χ2值越大,P值越小。反之,实际频数和理论频数差异很小,计算所得的χ2值越小,P值越大。

2*2四格表χ2检验

2*2四格表χ2检验最基本也是最常见的χ2检验,用于检验两个样本的总体分布是否相同。进行四格表χ2检验时,可以采用χ2检验的原始公式进行计算。但是,需要计算每个表格的χ2值,计算过程比较复杂。此时,可以采用比较简单的四格表等价公式:

2*2四格表χ2检验的适用条件包括总样本量≥40,且期望频数均≥5。

举个例子

一篇与冬奥运动相关的研究:Injury patterns in a large-scale ski resort in the host city of 2022 Winter Olympic Games: a retrospective cross-sectional study。本项研究旨在调查不同滑雪类型的运动员中,受伤类型是否存在差异。

单板滑雪和双板滑雪的参与者,男女性别是否存在差异,具体数据如下图:

χ2检验计算结果如下图,P=0.846>0.05,表明参与单板滑雪和双板滑雪的男女性别比例差异无统计学显著性。

试读结束,兑换后即可解锁本专栏全部课程
评论
请先登录后再发表评论
发表评论
使用课程券需先认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
下载附件需认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
会员服务
SCI-AI工具
积分商城
意见反馈