1936年美国总统大选前,当时著名的调查机构《文学文摘》(The Literary Digest)向美国民众发放了240万份问卷调查民意。根据调查结果,《文学文摘》预测共和党候选人兰登会赢得大选。但是,一位新闻学教授乔治·盖洛普(George Gallup)却提出了不同的看法。盖洛普通过对5万人的调查分析,预测民主党候选人罗斯福会连任。
图1. 罗斯福总统
后来大选结果是罗斯福连任。面对迷惑的民众,盖洛普解释了其中的原因:《文学文摘》统计的样本数量虽然多,但不具有代表性。因为他们的调查员是根据电话本上的地址发放问卷的,而当时美国只有一半的家庭安装了电话,这些家庭的收入相对较高——他们大多数支持共和党。而盖洛普在选择样本时,考虑了选民的种族、性别、年龄和收入等各种因素,因此虽然只有5万个样本,却更具有代表性。[2]
选择的样本人群不能代表总体,导致样本推断总体时出现偏差。我们把这种情况称为研究中的选择偏倚。
确认删除