生存分析是对时间-事件结局(time-to-event outcomes)进行分析的统计方法[1],例如受试者从进入研究到死亡的时间。竞争风险(competing risk)是指某个事件的发生,就排除了研究主要事件的发生。例如,一项研究关注的结局是心血管原因所致死亡,那么非心血管原因导致的死亡就是一种竞争风险。
分析生存数据的传统统计方法,通常会估算随时间推移主要事件的发生概率,或某个风险因素或治疗方法对事件发生的影响。存在竞争风险的情况下,需要对分析方法进行调整。生存分析的一个主要特点是考虑删失(censoring),即参与者随访结束前未观察到结局事件。
近期发表于JAMA的一项研究[2],Roumie等比较了糖尿病合并肾功能减退患者接受二甲双胍和磺脲类药物治疗的主要不良心血管事件 (MACE) 发生率(包括心血管死亡)。在分析中,作者考虑了两个竞争风险:停药,非心血管原因导致死亡。
概念解释
当对受试者进行长期随访以确定主要事件的发生时间时,可能会发生其他类型的事件。例如,在以某特定原因所致死亡为研究结局的情况下,其他类型的事件可能有其他原因所致死亡。
如果不同类型的事件是相互排斥的,那么就会存在竞争风险,即一种事件的发生会排除其他类型事件的发生。因此,如果死亡原因分为心血管或非心血管两种,就会出现竞争风险。
竞争风险的其他常见情况,还包括研究关注的是非致死性事件,例如急性心肌梗死,那么全因死亡就成为竞争风险。由于急性心肌梗死的发生并不能阻止死亡的发生,而死亡则意味着后续不会发生急性心肌梗死,因此这种情况可称为半竞争风险(semicompeting risks)[3]。
存在竞争风险的情况下,统计分析的一个常见做法是估算累积发生率函数(cumulative incidence function, CIF),是指研究所关注的事件在给定时间点之前发生的概率。CIF是一条随时间的非递减曲线,从零开始,上升越快表示相关事件的发生率越高。
竞争风险为何值得关注?
竞争风险之所以重要,是因为分析时间-事件结局的传统统计方法,通常假设只存在一种事件。存在竞争风险的情况下,必须对传统的统计方法进行修改,以防止关于CIF、风险因素或治疗效果得出错误的结论。
当只有一种结局时(如全因死亡率),可以使用Kaplan-Meier生存曲线来估计CIF曲线(即1减去生存曲线的高度)。然而,存在竞争风险的情况下,这种方法会导致估计的CIF曲线过高,因为Kaplan-Meier方法假定主要事件会在删失后的某个时间点发生,而如果将竞争事件视为了删失,但实际上主要事件之后不会发生[4]。
相较于使用Kaplan-Meier生存曲线来估算,建议使用Aalen-Johansen方法来估计CIF[5,6]。两种方法的不同之处在于,Kaplan-Meier法只使用主要事件发生的瞬时速率信息(单一风险函数),而Aalen-Johansen估计法则结合了每种不同类型事件的风险函数信息。
当只有一种结局时(如全因死亡率),通常使用Cox比例风险回归模型来估计变量(如年龄、性别、临床危险因素)与单一结局风险函数的关联强度,得出预测变量的风险比(HR)。
存在竞争风险的情况下,为了估计变量与特定事件发生风险的关联,研究者必须在不同的竞争风险回归模型中做出选择。存在竞争风险的情况下,最常用的两种回归模型是病因特异性风险模型[6]和子分布风险模型(通常称为Fine-Gray模型)[7]。这两种模型解决了不同的问题。
病因特异性风险模型(proportional cause-specific hazards model)估计预测变量与病因特异性风险率之间的关联:在目前尚未发生事件的受试者中,单位时间内发生特定事件的瞬时概率。
每种不同类型的事件,都有一个单独的病因特异性风险模型。每个模型中的每个预测变量都有一个病因特异性HR。例如,如果男性性别(与女性性别相比)的病因特异性HR为 2,那么男性个体某特定结局的病因特异性风险率将是女性个体的两倍。
Fine-Gray 模型使研究者能够确定预测变量是否与 CIF(相关事件随时间发生的累积概率)的变化相关[7]。与病因特异性风险模型一样,Fine-Gray模型中的每个预测变量都有一个HR,称为子分布风险比(subdistribution hazard ratio)。
病因特异性风险模型中的病因特异性HR可以简单量化预测变量与事件发生率之间的关联程度,但Fine-Gray模型中的子分布HR的大小并不能直接提供预测变量与CIF关联程度的信息。如果子分布HR大于1,则该预测变量与CIF的增加相关,而如果HR小于1,则该变量与 CIF的减少相关,但无法量化大小[8]。
确认删除