本文内容来自《中华流行病学杂志》2019年第40卷第1期,作者为严若华和彭晓霞教授,原题目为《医学期刊统计报告要求的详述与解读》。将这篇文章分享给医咖会的伙伴们,希望大家能从领域大咖的见解中有所收获,指导医学研究之路。
(感谢彭晓霞教授的授权)
该文结合已发表的研究论文,从研究设计、统计分析与结果报告3方面涉及的统计学问题入手,进行逐条解读,以阐明医学论文应达到的统计报告要求。之前小咖分享了研究设计部分(一表总结:医学期刊的统计报告要求),今天我们继续分享统计分析和结果报告要求。
统计分析
1、缺失值的处理:
缺失值是人群研究中不可避免的问题,其处理方式的差异可能在不同程度上引入偏倚,因此,详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。
例如,瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略,包括:将二分类结局中的缺失值视为未发生事件;将生物标志物和心电图测量中的缺失值进行多重填补(multiple imputation);为了证明缺失值处理的合理性和填补结果的稳定性,研究还比较了多重填补与完整数据(complete-case)分析的结果。
2、数据的预处理:
实施统计分析之前往往需要将原始数据进行预处理,如:对连续变量进行函数转换使其更接近正态分布,基于原始数据构建衍生变量,将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据,瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。
3、变量分布特征描述:
确定统计分析使用的变量,并针对每一个变量的分布特征进行描述,是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求,但作者往往套用常用方法,如:连续变量符合正态分布时,采用均数(标准差)描述,否则采用中位数(四分位间距)描述;分类变量采用频数(百分比)描述等。
确认删除