以JAMA子刊一项研究为例,聊一聊工具变量分析的用法

龚志忠

龚志忠

首都医科大学附属北京中医医院

擅长:临床研究数据统计分析、流行病学方法设计、临床预测模型建模与评价
已关注
关注
2022-04-02 来源:医咖会

随机临床试验(RCT)可用于估计人群的平均治疗效果。有些患者的治疗效果会大于平均水平,而还有一些患者的治疗效果会小于平均水平。亚组分析通常用于评估治疗效果之间的异质性。当患者随机分组方案无法执行或者有违伦理原则时,平均治疗效果可能是真实的治疗效果和混杂因素叠加的效果。当混杂因素未知或无法观察到时,校正混杂因素的影响在统计分析时是非常具有挑战性的,工具变量分析正是解决未知混杂因素的一种有效方法。

工具变量分析旨在观察性研究中减少或消除无法观察到的混杂因素,从而允许对治疗效果进行无偏的估计。工具变量分析通常应用在研究人群的亚组分析中。在《JAMA Internal Medicine》2019年发表的一篇文章中,Werner等人报告了一项工具变量分析的结果,比较了从医院出院到家接受家庭医疗护理,或者出院后被送往专业的护理机构,两者之间患者在急救后的护理结局。作者还描述了他们的研究结果为何不适用于所有患者,而是仅针对一个特定的亚组人群。

一、工具变量分析方法的应用

1、治疗效果存在异质性时,为什么要使用工具变量分析?

工具变量分析是用来在观察性研究中,减少无法观察到的混杂因素所带来的偏倚,从而估计治疗或暴露的效应大小。工具变量分析首先要确定一个可观察到的可解释的变量,就像随机化一样,它会影响治疗的分组,但对治疗的效果没有直接影响,被称为“工具变量”。但与随机化不同,工具变量可能不像随机化一样会针对所有患者,而是仅针对部分患者,这些患者基于工具变量值的大小而分配到治疗组或对照组,实现类似随机化的效果。

在这种分析方法中,这些患者被称为“边缘患者”(Marginal Patients)。工具变量分析的总体目的是测量无偏倚的治疗效果。减少偏倚(增加内部效度)的一个主要权衡就要是以丧失普遍性为代价,因为结果仅适用于边缘患者,尽管存在能够描述边缘患者的方法,但我们无法确定整个队列中的哪个子集是边缘患者。

2、治疗效果存在异质性时工具变量分析的描述方法

在工具变量分析中,接受治疗的患者可以被分为“具有工具变量的依从者”或“总是接受治疗者”(always-takers),即这些患者会接受治疗而不受工具变量值的影响。未经治疗的患者也可以被分为“依从者”或“从不接受治疗者”(never-takers),也就是说,无论工具变量的值如何,他们都不会接受治疗。依从者,即边缘患者,他们的决定强烈受到工具变量值的影响,而总是接受治疗和从不接受治疗的人完全不受工具变量值的影响。

例如,假设有这样一项研究,一个城市有两家医院提供不同的紧急治疗,位于城市东部的医院专门从事腹腔镜结肠切除术,西部的医院专门从事开放式结肠切除术。有些病人总是会选择腹腔镜结肠切除术,还有一些患者总是会选择开放式结肠切除术;因此,如果有必要,双方都会穿越整个城市,以获得他们的首选治疗方法。

还有第三种患者,他们将根据家到医院的距离来选择医院,从而选择对应的治疗方法。这第三种患者就是关于距离方面的边缘患者,假设到两家医院的相对距离会影响治疗方法的选择,但是对治疗结局没有直接影响,那么这个相对距离就可以作为工具变量。数据中没有可观察到的变量来明确区分治疗组中经常接受治疗的患者和边缘患者,也没有可观察到的变量来区分未治疗组中从不接受治疗的患者和边缘患者,但所有患者到达医院接受腹腔镜或开放式结肠切除术的相对距离都可以被观察到。

对于治疗结局为连续型变量,治疗分组为二分类变量的疗效研究,一个常用的工具变量分析方法是两阶段回归模型。第一阶段方程式用于估计每位患者接受治疗的预期概率,主要是作为工具变量的函数,同时调整其他因素。在第二阶段中,以第一阶段中接受治疗的预测概率作为自变量,同时再次调整其他因素,以治疗结局作为因变量构建线性回归模型。其中,接受治疗的预测概率的系数被解释为局部平均治疗效果,因为它仅“局部”适用于边缘患者。而对于治疗结局为二分类变量时,工具变量分析则需要不同的估计方法。

如果所有患者的治疗反应完全相同,以及如果非随机研究中的患者与随机对照试验中的患者相似,那么工具变量分析的结果将与RCT结果相吻合。但是,如果治疗反应因人而异,即治疗效果存在异质性,那么结果可能就与RCT结果不吻合。工具变量分析仅测量边缘患者的治疗效果,这些患者的治疗选择直接受到工具变量值的影响,因此,如果治疗效果存在异质性,局部的平均治疗效果可能不同于总体的平均治疗效果。

3、治疗效果存在异质性时,工具变量分析有哪些局限性

第一,治疗效果很少是同质的,而且往往因患者的年龄或合并症而有所不同。当治疗效果存在异质性时,局部的平均治疗效果可能不会等于总体的平均治疗效果。工具变量分析可能会漏掉治疗有效的患者子集,或者可能会发现仅适用于一小部分患者的显著效果。就像Werner等人的研究那样,这种局限性可以通过尝试识别边缘患者来解决

第二,不同的工具变量可以识别不同的边缘患者的不同亚组。因此,使用两种不同的工具变量分析可能产生两种不同的结果,两者都是正确的,但适用于不同(也有可能重叠)边缘患者的亚组。

评论
请先登录后再发表评论
发表评论
iwannago
捉虫,“在《JAMA Internal Medicine》2009年发表的一篇文章中,Werner等人报告了一项工具变量分析的结果”,是2019年来着
2022-12-17 17:26:58 回复
1
Lee北
给力 火眼金睛
2023-02-21 14:12:32 回复
1
使用课程券需先认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
下载附件需认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
会员服务
SCI-AI工具
积分商城
意见反馈