本文参考自《Am J Gastroenterol》(影响因子:9.566)上的一篇文章《Ten common statistical errors and how to avoid them》[1],我们将拆分成多篇文章来细讲,第一期推送的是“论文中研究方法和结论的常见问题”,今天我们来看看数据分析时的常见错误。
1. 用组内比较推断组间差异
很多研究会在基线水平和一个或几个随访时间点对研究指标进行测量(例如随机临床试验的治疗前和治疗后),作者也可以对两组或多组的指标测量值的变化进行分析(例如RCT中的安慰剂组和治疗组)。常见的结果就是治疗组前后有明显的改善,而安慰剂组并没有明显的改善。很多作者的分析到此结束,并就此认为治疗是有效果的,但是事实并非如此。
例如,某项研究用来评估A、B两种降压药的效果[2],一组给予A药,组内用药前后比较显示其效应值和标准误为25 ± 10,差异有统计学意义(P<0.01);另外一组给予B药,组内用药前后比较显示其效应值和标准误为10 ± 10,差异无统计学意义。
此时容易得出“两种药物的疗效明显不同”的结论,认为A药的疗效优于B药。但是事实上对两组进行比较,差异并无显著性(P > 0.05),两组间比较显示A、B两种药物的效应差值为15,标准误为14。“两种药物的疗效明显不同”的结论是不正确的。
【建议】为了证明一组的治疗效果明显优于另外一组,组内比较是不够的,而应该对组间的差异进行比较。
2. 将有相关性的数据当独立数据进行分析
许多研究都会对研究对象进行多次(重复)测量。例如,患者可能会多次进行食道、胃、十二指肠镜检查,每一次检查都会提供一个或多个不同组织活检的结果。如果将这些结果看作是独立的,会忽视同次活检的不同组织之间的相关性,以及同一患者多次活检之间的相关性。
确认删除