2021年年底,医咖会“临床研究100问”正式启动。目前已经进行了六期直播,前六期的内容可以直接点击查看:《正态分布及正态检验中被问爆了的典型问题》《独立样本t检验的那些经典问题与常见错误》和《配对资料,统计方法怎么选?》《分类变量的统计分析,都能用卡方检验吗?》《分类变量不满足卡方检验使用条件时,该怎么办?》《解析连续变量相关性分析中的4大常见问题!》。
第七期直播,龚志忠老师带来了《分类变量的相关性分析,应该采用什么样的统计方法?》,此外,课程中还介绍了:分类变量和连续变量之间的相关性分析,应该采用什么样的统计方法?
分类变量分析方法
对于分类变量,可根据行和列的个数,分为2*2的四格表和R*C的列联表,对于2*2的四格表,有独立样本和配对样本两种设计。R*C的列联表,情况相对复杂,包括双向无序列联表,单向有序列联表,双向有序属性不同和双向有序属性相同的列联表。对于不同的情况,需要采用不同的分析方法。
不同资料的分析方法举例:
2*2四格表
2*2四格表通常有两种系数表明相关性:
Pearson列联系数:值的范围在 0 到 1 之间,值越大表明两变量间的相关性越强
φ系数:只适用于四格表资料,值的范围在 0 到 1 之间
举个例子
某研究人员拟探讨支气管炎的发生与吸烟的相关性,H0表示支气管炎与吸烟之间相互独立,H1表示支气管炎与吸烟之间相互关联。
数据如下:
确认删除