内容来自:“小白学统计”微信公众号,感谢作者授权。
随着目前疫情的变化,国内据说已经开展了100多项关于病毒治疗的临床试验,而且有的似乎也得出了“有效”的结论。然而,越是在这种情况下,越是应该冷静,要用统计学的思想去解读治疗有效性的含义,而不是简单地去凭字面意思说是否有效。
先举个简单例子,有研究纳入了100例病例,随机分为两组,每组各50人。最后结果发现,试验组治疗有效10人,对照组治疗有效5人。很显然,从数据来看,两组的有效率分别为20%和10%,差值为10%。
这是不是个值得欢欣鼓舞的结果呢?表面来看,的确如此。你可以说,有效率差值达到了10%,试想一下,如果100人,相当于能多治好10人,1000人就可以多治好100人,而10000人就可以多治好1000人。这么一看,还真的很不错。
然而,实际中是不是如此呢?这就需要重提统计学中最基本也是最重要的一个概念:假设检验。
我们这里就直接通过一个模拟的例子来说一下这种情况。
假定有10000人(算作总体),在这总体的10000人中,有5000人在试验组,5000人在对照组,而且这两组的有效率都是20%(1000人有效,4000人无效)。也就是说,试验药是没有任何作用的,两组效果完全相同。
假定这就是实际情况,实际中一共就10000例病例,而且某药的治疗效果无效(两组有效率完全相同)。现实中由于各种条件所限,要做随机对照,总是不大可能把这10000例都获得,通常也就是获得一部分。
假定每个研究都有100例病例(当然也可以是其它例数,此处仅是举例),这100例也是随机分两组,每组50例。采用有放回的随机抽样,总共抽样1000次,每次都是100例(每组50例),让我们看看抽样的这1000次结果,他们的差值情况。
确认删除