Heart最近发表了一篇综述《Graphics and statistics for cardiology: clinical prediction rules》[1],作者以心血管风险评分(CVD risk factor)为例探讨了如何借助统计图优势构建疾病的预测模型,并提出了6个重要步骤。(表1)
表1. 疾病预测模型的构建
上期我们聊到模型中预测变量的筛选,一旦重要的预测变量被筛选出来,下面就到了重点——风险评分模型构建和评价。
建立风险评分
风险评分可通过模型中变量的加权总和函数计算求得,其中每个变量的权重就是多因素回归模型中的回归系数(例如,Logistic回归模型是log OR,Cox和Weibull回归为log HR)。模型中另外一个重要的决定因素是时间的滞后性,ASSIGN评分中,研究者假定为10年。
从数学的角度上看,风险其实就是一种概率,因此其取值范围在0-1之间。临床实际应用中,更常见的是将它定义为0-100%。通过Glasgow数据获得的女性CVD风险评分如下:
表2. Glasgow数据获得的女性CVD风险评分模型
评价风险评分:区分度
一个风险评分是否能够很好地预测某人将来是否患CVD(即所谓的模型区分度“Discrimination”)是很复杂的,因为风险评分只能告诉我们一个人发生CVD概率有多大,取值在0-100%之间。
实际上,一个人在10年间只可能出现两种结局——患CVD or 不患CVD。这时候就需要一个临床意义上的阈值(例如,我们将CVD 10年的发生概率≥10%定义为高危人群,急需进行预防性干预),基于这样的阈值就可以通过灵敏度和特异度评价风险评分的好坏。
确认删除