要做相关性分析,该如何选择正确的统计方法?

李侗桐

李侗桐

北京大学

擅长:卫生统计学、定性分析方法、卫生经济学、全球卫生政策分析
已关注
关注
2019-11-27 来源:医咖会

作者:李侗桐;审稿:张耀文

相关性分析主要用于:(1)判断两个或多个变量之间的统计学关联;(2)如果存在关联,进一步分析关联强度和方向。

那么,什么样的研究可以进行相关性分析呢?我们在这里列举了几个相关性研究的例子供大家参考:

确定要进行相关性分析后,对两个变量或多个变量进行相关性分析所采取的统计方法是不同的。那么,怎么判断研究变量的数量呢?

我们分别就两个变量的研究和三个及以上变量的研究进行了举例,帮助大家理解。同时,我们也对例子中变量数据类型进行了描述(如,连续变量、二分类变量、无序分类变量和有序分类变量)。

确定拟分析变量之间的相关性后,我们需要判断变量的数据类型。

变量的数据类型主要分为连续变量、二分类变量、无序分类变量和有序分类变量4类。拟分析的变量可以同属于一个数据类型,也可以分属不同的数据类型。根据这两个变量数据类型的不同,应采用的统计分析方法也不同。

连续变量是指对连续的指标测量所得到的数值,比如体重。其特点是等距区间的差异相同,例如体重在50kg-60kg之间的差异与60kg-70kg之间的差异相同。连续变量的示例如下:

     a.距离(以米为单位)

     b.温度(以摄氏度为单位)

     c.时间(以小时为单位)

     d.体重(以千克为单位)

     e.成绩(以0-100分为计算区间)

有序分类变量可以有两个或者多个已排序的类别。举例来说,如果某患者的治疗结果是“痊愈”、“好转”、“不变”或者“恶化”。这就是一个有序分类变量,因为可以对四个类别进行排序。

需要注意的是,虽然我们可以对有序分类变量的类别排序,但还需要判断这种类别排序是不是等距的。例如,用各年龄段的近似中位数代表年龄类别,即24(18-30)岁、40(31-50)岁、60(51-70)岁、80(70岁以上)岁,可以将年龄视为定距变量。

评论
请先登录后再发表评论
发表评论
良良良
连续+有序,如果有认为有序变量是等距的,是否可以按Pearson方法进行分析?如果连续是因变量,有序是自变量,是否可以按只有一个有序变量的线性回归分析呢?
2024-03-24 11:13:13 回复
2
medi_28380358865
请问多变量的相关分析该怎么处理呢,有没有类似的总结哇
2023-12-17 22:07:44 回复
1
medi_28523664614
同求
2024-03-26 10:57:53 回复
0
medi_28256169205
怎么没有1.6救命啊
2023-09-22 16:10:12 回复
0
medi_26989893140
请问二分类变量或有序分类变量与连续性变量的散点图怎么做呢?
2022-05-22 10:24:16 回复
0
小爱
那无序分类变量和连续变量之间的相关性呢
2021-09-25 19:33:02 回复
4
medi_26742642685
我也有这个问题,后来我想了一下会不会是做方差分析? 如果各项的均值都不存在显著差异,其实也就是不相关了
2022-03-07 00:07:53 回复
2
良良良
是不是具有有序关系的变量(连续、二分类、有序分类)与无序分类变量间无法做关联性分析?
2024-01-19 21:06:14 回复
1
medi_27160273880
请问多变量如何做相关性分析
2021-09-09 21:42:10 回复
1
medi_89t4w4d
能具体讲解下Phi (φ)系数吗?列如要看两个二分类变量的关系,具体怎么操作呢?
2021-08-26 12:44:30 回复
0
豆包
可以看看:http://blog.sina.com.cn/s/blog_1859648c00102ylak.html
2021-09-03 16:04:00 回复
0
木头人
求助“Point-biserial相关”的教程
2021-08-03 21:18:25 回复
0
豆包
可以看看:https://www.ibm.com/support/pages/node/417511
2021-09-03 16:05:37 回复
0
使用课程券需先认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
下载附件需认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
会员服务
SCI-AI工具
积分商城
意见反馈