内容来自:“小白学统计”微信公众号,感谢作者授权
本文摘自下面文章的一部分(有改动):
Guoshuang Feng, Guoyou Qin, Tao Zhang, Zheng Chen, Yang Zhao. Common Statistical Methods and Reporting of Results in Medical Research. CVIA. 2022. Vol. 6(3):117-125.
统计描述在绝大多数的文章中都会有,不管是随机对照试验、观察性研究等等,都需要有数据描述部分。统计描述看似很简单,然而在一些细节方面其实很多研究人员都没有注意。本文主要介绍一下 统计描述中需要注意的一些问题:
(1)关于统计描述表格的几个基本特征
第一,尽管表格规范一般认为,主语在左侧作为横标目,谓语在上方作为纵标目,这样读起来比较通顺。我当年有一篇投稿,就被专家质疑,说我把分析变量放到了横标目上,不符合表格的规定,说这样读起来不顺,让我一定要放在纵标目。但是,大家可以看一下把分析变量放在纵标目的效果(这真的是我们想要的吗):
上面这个真的是严格按照“规范”来,把分析变量作为谓语坚决地放在纵标目。万一再增加2个变量该怎么办呢?
有时候“尽信书则不如无书”。在基线描述中,由于需要展示的指标通常都较多,建议还是以组别作为纵标目,各分析变量作为横标目更好一些。就像下面表格一样(表1):
第二,不同变量建议可列出对应的计量单位,如ng/ml、岁等,这对某些有多种计量单位的指标尤为必须。
第三,需要对表格做进一步解释说明的,通常在表格下方进行标示,如表1标示说明了百分比之和可能不是100%的原因。
第四,通常表中需要列出各组的例数,如果不同指标的缺失例数不同,需要对每一指标分别列出各自例数,或针对每一指标列出缺失例数。
(2)定量资料统计描述指标应保留小数点后多少位?
目前关于该问题尚无十分明确的规范,如SAMPL(Statistical Analyses and Methods in the Published Literature)规范给出的建议是:小数点后应保留合理的位数,不能太少,也不能太多。EASE(European Association of Science Editors)规范的建议是:保留2-3位有效数字。Habibzadeh建议:像均值、标准差、中位数、四分位数间距等指标,不应超过原始数据的精度。过于粗略或过于精细,都会产生一定问题。
我们认为Habibzadeh的建议比较合理,可以考虑。例如,红细胞计数有1位小数,血红蛋白是整数,则可以写“红细胞计数的均值(标准差)为4.7(0.4)×1012/L,血红蛋白的均值(标准差)为136(12)g/L。”
(3)定性资料(分类资料)统计描述指标应保留多少位小数?
关于分类资料百分比的小数位数,多数情况下保留1位小数即可,如果作为主要研究指标需要重点描述,可根据情况保留2位小数。如果分母例数小于100,建议百分比以整数形式报道,无需保留小数点。如80人中发生20例阳性,可报道为:“80例观察对象中发生20(25%)例阳性结局”。因为当分母不足100例时,分子例数每增加或减少1例,其变化幅度都大于1%。
确认删除