统计分析数据时的几大常见错误,有中招的吗?

2021-08-24 来源:医咖会

1. 用组内比较推断组间差异

很多研究会在基线水平和一个或几个随访时间点对研究指标进行测量(例如随机临床试验的治疗前和治疗后),作者也可以对两组或多组的指标测量值的变化进行分析(例如RCT中的安慰剂组和治疗组)。常见的结果就是治疗组前后有明显的改善,而安慰剂组并没有明显的改善。很多作者的分析到此结束,并就此认为治疗是有效果的,但是事实并非如此。

例如,某项研究用来评估A、B两种降压药的效果[2],一组给予A药,组内用药前后比较显示其效应值和标准误为25 ± 10,差异有统计学意义(P<0.01);另外一组给予B药,组内用药前后比较显示其效应值和标准误为10 ± 10,差异无统计学意义。

此时容易得出“两种药物的疗效明显不同”的结论,认为A药的疗效优于B药。但是事实上对两组进行比较,差异并无显著性(P > 0.05),两组间比较显示A、B两种药物的效应差值为15,标准误为14。“两种药物的疗效明显不同”的结论是不正确的。

建议】为了证明一组的治疗效果明显优于另外一组,组内比较是不够的,而应该对组间的差异进行比较。

2. 将有相关性的数据当独立数据进行分析

许多研究都会对研究对象进行多次(重复)测量。例如,患者可能会多次进行食道、胃、十二指肠镜检查,每一次检查都会提供一个或多个不同组织活检的结果。如果将这些结果看作是独立的,会忽视同次活检的不同组织之间的相关性,以及同一患者多次活检之间的相关性。

举例而言,有两种不同的方法获取100份活检组织,如图所示:

显然a方法有更好的代表性。对上述两种方法所获得的数据进行分析,由于b方法获得的数据有相关性,若按照独立数据来进行分析,则会高估研究的精确性。忽略这种相关性会导致方差估计值偏小,使得检验效能看起来比实际要高,因而可能会导致拒绝无效假设,然而事实上研究资料并不足以得出这样的结论。

建议】选择适合重复测量资料的统计学方法,例如,重复测量资料的方差分析、混合效应模型。需要注意的是,文章中应该明确模型的假设、验证假设所使用的方法以及处理相关数据所使用的方法。

(相关阅读:SPSS详细操作:两因素重复测量的方差分析

3. 在匹配的病例对照研究中没有采用匹配的分析方法

病例对照研究中,病例组均为患有某种疾病X的研究对象,而对照组通常为与病例组可比的、未患有某种疾病X的研究对象。在1:1匹配的病例对照研究中,对照组和病例组的研究对象需要在一个或多个可能的混杂因素上进行匹配(例如,年龄、性别、BMI),以提高统计学功效。

建议】若采用了匹配的病例对照研究设计,则在样本量计算和统计分析时需要采用与“匹配”研究设计对应的分析方法。例如,在匹配的病例对照研究中,应采用条件Logistic回归,将每对匹配的病例和对照均看作一层,来对疾病的危险因素进行评估。

(相关阅读:SPSS操作:搞定病例与对照的1:1匹配SPSS实例教程 | 1:m匹配病例对照Logistic回归

评论
请先登录后再发表评论
发表评论
使用课程券需先认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
下载附件需认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
会员服务
SCI-AI工具
积分商城
意见反馈