临床试验中的多重比较,通常存在于有若干研究目标的临床试验中,比如含有多个终点事件或者多个剂量-对照组别、多个亚组人群等。进行比较的次数越多,造成假阳性的可能性就越大。选择适当的统计方法来处理多重比较的问题,控制I型错误的发生率(假阳性率),对于提升临床试验推断的可靠性和成功率至关重要。
例如,自身免疫病和心血管疾病的病因较复杂,通常需要多个主要终点来准确描述治疗效益。Ⅲ期临床试验中也会预先设定一系列次要终点,来获得新疗法的疗效特征、确定差异化的影响因素。
控制总体I型错误,最常用的方法Bonferroni法,其基本原理为:若进行了n次检验,检验水准α应校正为α/n,或将P值乘以n后再与α比较。比如,某试验具有三个终点,则采用Bonferroni法进行多重性校正后的检验水准α’= 0.05/3 = 0.0167。
Bonferroni法可以控制有多个终点临床试验的总体I型错误率,但该方法仍是最为保守的多重性校正方法。因此,Bonferroni法也出现了多种扩展形式。
第一种是Fallback法。以治疗转移性去势抵抗性前列腺癌的Ⅲ期试验为例,该试验拟评估阿比特龙联合泼尼松 VS. 单独用泼尼松对患者生存的获益。其主要结局指标是放射学无进展生存期(rPFS)和总生存期(OS)。由于该试验具有两个结局指标,因此采用Bonferroni法在双侧α=0.05的水平上控制总I型错误率,但总I型错误率在不同结局指标之间进行了不均匀分配。
该试验中,检验分为两步。第1步,rPFS的组间差异检验,定义在P≤0.01的水平。如果rPFS疗效显著,则确证OS获益的概率可能会增加。
因此,第2步时做如下考虑:如果第1步中rPFS的疗效显著,那么OS的分析将设定在更高的水平(P≤0.05);否则,第2步的分析将设定在P≤0.04。
确认删除