经验分享:如何有效地分析一份数据

2019-01-04 来源:小白学统计

如何有效地分析一份数据。这个题目很大,然而也正是很多非统计学专业(可能也包括一些统计学专业人员)不知如何下手的问题。当拿到一份数据,到底从哪儿入手开始分析。什么是第一步?有没有固定步骤?或者说,数据分析到底有没有什么宝典?我们就来谈谈这个问题。

首先,数据分析绝对没有一个固定的步骤,一定要先干什么,再干什么,等等。没有这回事。具体在软件操作上,我们可能并无差别,我会用SAS做t检验,你会用SPSS做t检验,本质上并无差异。真正差别的,不是软件操作,而是软件操作之前的思路。

我下面要说的内容,只是个人的十多年分析经验总结,但你千万不要把它看做是一个放之四海而皆准的分析套路。所谓思路,那就是没有什么固定套路,只是参考和借鉴。而且,我介绍的这些,肯定也不全,几乎不可能一篇文章面面俱到,把所有的分析思路都介绍清楚。只希望能对各位朋友在不同角度上有所帮助。

第一步要考虑的,我个人认为,一定是研究目的。

所有的统计分析都是围绕目的而执行,偏离了研究目的,分析的方法再高级,那也是南辕北辙。不同的目的,需要考虑不同的方法。

例如,你要做两组比较(例如,两种药物的血糖变化值有无差异),还是要做两个变量有无关联(比如血糖值和血压值的关联),或者想做综合评价(如根据多个指标评价哪家医院更好)。这都需要选择不一样的方法,组间比较可能最简单的方差分析就可以,综合评价可能需要用到主成分分析等更为复杂的方法。

第二步,要考虑指标的类型。

这里的指标包括分析指标因变量,也包括影响因素自变量。当然,并非所有分析都这么划分为因变量和自变量。有的可能只有分析指标,而无影响因素。

如果你有明确的结局,然后有一个或多个可能跟结局有关的指标,那就可以按因变量和自变量的方法来分析。大多数的这种情形都可以考虑广义线性模型。它包含了几乎绝大多数的有结局和影响因素的分析场景。例如,结局是连续资料,可以考虑线性回归等;结局是分类资料,可以考虑logistics回归等。

评论
请先登录后再发表评论
发表评论
使用课程券需先认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
下载附件需认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
会员服务
SCI-AI工具
积分商城
意见反馈