研究人群的代表性：理想和现实之间的取舍

2019-07-03 来源：医咖会

本文内容来自《中华疾病控制杂志》2019年第23卷第3期，作者为唐金陵。将这篇文章分享给医咖会的伙伴们，希望大家能从领域大咖的见解中有所收获，指导医学研究之路。

1、所有科学研究都是抽样研究

所有科学研究都是通过对局部的观察来推测局部以外世界的一般规律，其进程总是从小的局部到大的局部再到更大的局部，没有哪个科学定律是在观察了所有局部的集合（即总体的全部）之后才作出推论的，既是因为实际上做不到，也因为理论上没有必要。万有引力定律是这样，吸烟可以引起肺癌是这样，抗生素可以治疗感染也是这样。认识茅台酒的味道也是这样。

在流行病学研究里，对局部的研究就是抽样研究，研究的人群就是样本。只有当样本可以代表总体的条件下，局部的研究结果才可以用来推论总体的规律。换言之，所谓样本的代表性，就是研究人群与总体人群在各种可能决定最终研究结果的因素上保持一致性或可比性的程度，二者越接近，样本对总体的代表性就越高。在宣称现实世界大数据就是总体、抽样研究不再重要的时代，重提抽样研究的必要性，厘清样本及其代表性的意义和作用，对未来流行病学研究具有重要的指导意义。潘雄飞和潘安及其同事有关流行病学研究中的样本代表性问题的文章（下称潘文）讨论的正是与此相关的问题。

潘文正确地指出，关于疾病负担的横断面研究，研究人群的代表性十分重要。相比，对于病因的前瞻性研究和对于疗效的随机对照试验，则可以在代表性上做出适当且必要的妥协，否则提高代表性的代价可能是导致真实性降低，得不偿失。因此潘文建议，流行病学研究不应一味地强调代表性，而应该具体情况具体分析，平衡提高代表性可能造成的得与失，在理想和现实之间做出合理的取舍。这个建议具有重要的实践意义。本文则希望扩展潘文的分析和讨论，试图进一步厘清代表性的实质，为当前流行病学研究选择研究对象的一般做法提供理论依据。本文里的总体就等于潘文里的目标人群，样本等于研究人群。在目标人群和研究人群之间经常还存在抽样人群，就是潘文里的源人群。