在我们的日常科学研究或者论文撰写过程中,统计学错误普遍存在,近年来也日益受到学者以及大众媒体的广泛关注。关于如何改进统计学应用与实践的争论,目前主要集中在统计推断方法的选择,尤其是P值和显著性检验上。
2020年6月,PM&R杂志发表了题为“Ten Common Statistical Errors from All Phases of Research, and Their Fixes”的文章,作者列举了研究四个阶段(研究设计→数据整理与清洗→数据分析→结果报告)常犯的10个统计学错误案例,并给出了可以帮助研究人员避免这些错误的潜在解决方案。让我们来一起看看吧!
举例:30名运动员被随机分为两组:生酮饮食组和习惯性饮食组,为期4周。研究目的是为证明生酮饮食与正常饮食相比,不会引起炎症反应升高。研究者直接比较了两组患者4周的脂联素(炎症标志物)水平,差异无统计学意义(P=0.50),于是得出结论:4周的生酮饮食不会增加炎症反应。
解决办法:研究中应把这项研究设计成一个非劣效性试验,目的是为证明一种干预措施不差于另一种干预措施。因此,研究者应事先设定一个非劣效性界值(non-inferiority margin),比如脂联素增加0.5 mg/L,同时样本量计算也应包含这个非劣效性界值。
图片来源:医咖会既往推文《非劣效性检验是个啥?非劣效性的结论是否有价值?》
举例:某研究旨在评估一种新型卒中患者平衡测试的评分者间的可靠性。两名评分者分别测量了10名卒中患者,研究者计算了组内相关系数(intra-class correlation coefficient,ICC)和95%可信区间,结果为0.76(0.23-0.93)。问题在于,对ICC的估计过于不精确,导致无法判断结果的可靠性。
确认删除