文章来源:“小白学统计”公众号。
悖论这个词主要是指一切与我们的直觉或日常生活经验相矛盾的结论。悖论这个词由来已久,公元前6世纪古希腊有一句经典的“说谎者悖论”,这句话是“这句话是谎话”。那句话到底是不是谎话?至今仍然无人能给出合理的解释。古希腊的著名诡辩家芝诺提出了几个非常著名的悖论,如“阿基里斯永远追不上一只乌龟”和“飞矢不动”是最为经典的,一直是困扰数学家的难题。
统计中也有悖论,本文介绍一个统计学中非常经典的悖论,叫做辛普森悖论,它首先是由一个名叫辛普森的人发现并提出的。故事如下:
罗尼哈特小姐是一位统计员,最近想找一位男朋友,便加入了一个俱乐部。一个周末的晚上,她去参加俱乐部的活动。去了之后,发现这些人分别在不同的厅。其中犹太人在东厅,非犹太人在西厅,东西两个厅中,有些人有胡子,有些人没有胡子,有些人放荡不羁,有些人循规蹈矩。
罗尼哈特小姐想找一个风流倜傥的男朋友,在她看来,循规蹈矩的人比较古板,所以想找一个比较活跃的男友。
罗尼哈特小姐想到一个问题:“我要找风流潇洒的人,是不是应该找有胡子的人呢?”作为统计员的她,迅速观察了一下,东厅中是犹太人,留胡子的人中,风流人物的比例是5/11=45.5%,不留胡子的人中风流人物的比例是3/7=42.9%。
风流
古板
风流者的比例
留胡子
5
6
45.50%
不留胡子
3
4
42.90%
她又到了西厅,也观察了一下,西厅是非犹太人。发现结果相似,西厅中留胡子的人中,风流人物的比例是6/9=66.7%,不留胡子的人中风流人物的比例是9/14=64.3%。
风流
古板
风流者的比例
留胡子
6
3
66.70%
不留胡子
9
5
64.30%
罗尼哈特小姐认真统计完之后,想“多简单啊,不管去哪个厅,我只要找留胡子的人就更加容易结识到风流潇洒的人物。”当她稍加整理,准备随便到一个厅去认识留胡子的人时,联欢会的主办者已经将两个厅中的人全部集中到一个大厅中。
确认删除