对于生存数据,1958年,E. L. Kaplan 和 Paul Meier 两位教授介绍了一种全新的、解决随访期间右删失 (right censoring) 问题的生存分析方法,被称作Kaplan-Meier方法。这种方法精确地记录并利用每个个体发生终点事件的具体时间,在任何一个终点事件发生的时间点计算出一个新的、基于之前所有信息的总生存率 (Cumulative survival) 。
相比于之前使用的寿命表法(Life-table method),这种方法更加充分地利用了信息,给出更准确的统计量。同时,作为一种非参数估计方法,不要求总体的分布形式,因此非常适合生存分析时使用。Kaplan-Meier 曲线(简称K-M曲线) 还可以很直观地表现出两组或多组的生存率或死亡率,非常适合在文章中进行展示。因此,K-M曲线也成为了临床研究中最常用的方法之一。
Why Stata?
Stata软件在进行生存分析的过程中具有很强大的功能。无论是 K-M曲线,还是Cox回归分析,甚至是一些更加复杂的参数分析,Stata都可以轻松完成。
相比于SPSS,Stata的可重复性更强,图像更加美观;而相比于R语言,Stata的代码又更加简便、易懂、上手快,甚至可以完全使用窗口菜单完成,非常适合有科研追求的医生入门。
今天,我们就一起来学习一下生存分析中的第一步、也是最重要的步骤之一:K-M曲线的绘制和Logrank检验。
我们将使用Stata自带的一个模拟的药物临床试验的数据集进行所有的演示,请大家在Command对话框中输入webuse drugtr以调入这个数据集。
屏幕显示:
请注意:Stata已经将这个数据集设置成了生存数据的格式,导入数据集后,请大家首先输入stset, clear命令恢复成普通的数据格式。这样才是我们在临床研究中见到的数据结构,我们将在Step 2中学习如何将其转换成生存数据格式。
确认删除