生存分析是临床研究中一种常用方法,主要用来处理考虑发生时间的二分类结局变量。结局可以是死亡、疾病发生或任何其他感兴趣的二分类结局事件。如果我们同时关心结局发生的时间,那么可以将此类数据统称为生存数据。
生存数据一般是正数,且很少是对称分布。在临床研究中,我们需要规范生存数据分析结果的报告形式,这样才能更好地回答研究问题。以下是生存分析需要报告的几个重要部分。
结局定义
结局定义明确至关重要。例如结局可设定为①任何原因导致的死亡;②疾病进展;③某种疾病的确诊。对于这些结局需要提供更加具体的信息,例如:疾病进展如何定义?由谁测量?是否包括死亡在内?具体判断标准?为了便于读者对研究结果进行评价和比较,通常还需要描述结局资料获取的方式(比如前瞻性随访、公开资料获取、医疗数据、自发报告等)。
测量起始时间
测量的起始时间即生存分析的时间起点。在临床试验中通常将随机化的时间作为起始点,在观察性研究中可能是研究对象进入试验的时间、出生日期或某些重要事件发生的时间,如第一次心梗、手术或疾病确诊的日期。
对时间起点的选择应当慎重。临床试验将随机化时间作为测量起点,在样本量较大时可以保证组间可比。对于观察性研究来说,将测量起点设定为某些重要事件发生的时间比设定为进入研究的时间可能更好。在生存分析的结果报告中应当报告测量起点。
危险集(At Risk)
危险集,即某个时间点有发生结局风险的所有人的集合。如果观察对象在研究开始之后的某个时间点,既没有发生结局事件,也没有退出研究,那么该研究对象处于该时刻的危险集中。生存曲线通常用来描述不同时点的危险集以及发生结局的人的比例(即结局发生率)。需注意的是,在危险集中人数比较少时,结局发生率的估计是不准确的,这种情况通常出现在随访的后期,也就是生存曲线的末端部分。
确认删除