文章一开始,我们一起来看一个临床试验中常见的设计。
我们想知道一种新药A能否改变患者的住院天数。在没有确切信息的时候,我们的假设是不能,也就是使用A和不使用A的两组的平均住院天数相同。换句话说,使用A对于患者住院天数没有影响。我们设计了一个随机对照试验(RCT),把200名患者1:1随机分入A组(使用新药)和B组(使用安慰剂),每组100人。
试验结果中,A组患者平均住院天数为25.1天,B组为27.6天。进行双样本t检验后,得到了p值为0.015。
那么,单看这个p值,下列理解哪些是正确的呢?
A. 有1.5%的概率,使用A对于患者住院天数没有影响;
B. p = 0.015 意味着两组平均住院天数有很大不同(即效应值很大);
C. p = 0.015 意味着使用A和患者住院天数的关联度很高;
D. 若 p > 0.05,则意味着没有治疗效果。
-------------------------------------------
实际上,这4个选项都是错的!让我们一个个来解释。
A 选项
一句话解释:p值只是假设和数据的关系
首先,我们来明确一下p值的定义。
美国统计学会(American Statistical Association, ASA)明确告诉我们:
P-values do not measure the probability that the studied hypothesis is true, or the probability that the data were produced by random chance alone.
( p值不是“我们研究的假设是真的”的概率,也不是“数据仅仅由随机因素产生的”的概率)
确认删除