如何设计目标仿真试验（ETT）？来看详细教程！

2024-01-30 来源：中华流行病学杂志

本文内容来自：陶立元, 刘珏. 目标仿真试验的基本原理、设计要素及其优缺点[J]. 中华流行病学杂志, 2023, 44(12): 1963-1969. 感谢陶立元老师的授权。

随机对照试验（RCT）往往是干预措施效果评价的“金标准”。由于研究资源和伦理等因素的限制，RCT研究往往不是在所有研究方向上都可以开展的，此时不得不使用观察性研究的证据作为替代。但利用观察性研究数据来开展因果推断又经常被认为是不够严谨的[1-2]，且有时观察性研究结果与RCT研究结果相差甚远[3]。

近年来，随着大型真实世界观察性研究数据的积累，在观察性数据中仿真模拟RCT的想法逐渐出现在一些观察性数据分析的思路中[4]，即恰当地利用RCT的原则分析观察性研究中的部分数据。在此基础上，哈佛大学公共卫生学院Hernán和Robins[5]于2016年提出了一种基于真实世界研究数据或大型队列研究数据来模拟开展RCT的研究思路，即目标仿真试验（emulated target trial，ETT），又称目标试验仿真（target trial emulation）。

近年来，ETT在各类医学问题的研究中得到了较为广泛的关注和应用[6-11]，为真实世界数据分析提供了一种新的思路。不同领域的研究者基于电子病历数据、大型随访队列或医疗保险资料等真实世界数据开展了ETT研究，利用此类观察性数据进行仿真试验，获得了接近于RCT的因果推断结果，提供了高质量的研究证据。

本文旨在对ETT的基本原理、设计要素、应用案例以及优缺点等相关内容进行探讨，以期为国内学者基于观察性研究资料开展ETT研究提供参考。

1. 基本原理

ETT是指在已有观察性研究数据中采用特定的方法筛选研究对象组成假设的RCT，遵照RCT研究的设计和分析原则，通过对该假设试验数据的分析得到类似RCT的研究结论[12]。ETT可在RCT研究不可行或尚未开展且同时存在有高质量观察性研究数据的情况下，利用高质量观察性数据仿真RCT研究，得出相应的高质量研究结论。如利用大规模真实世界数据模拟长期随访的实用性RCT（pragmatic RCT）研究[13]，利用观察性队列数据模拟某些公共卫生措施对健康的影响效应[14-16]，利用医院信息系统数据探索不同药物的治疗效果[17]等。

ETT的开展可分为4步：①提出研究假设；②设计理想的目标试验相关要素：包括研究对象的入选和排除标准、干预措施、随机分组、结局指标、随访、统计分析与因果推断等；③利用现有数据仿真目标试验，包括理想试验的各相关要素；④验证研究假设。ETT研究步骤参照RCT，见图 1。

图1. 目标仿真试验基本流程

ETT研究需要严格按照RCT研究框架开展试验仿真，否则容易获得错误的结论[5]。因此在ETT的使用过程中需要明确几点：

①当观察性研究中未采集足够的混杂因素信息时，即可能存在较多残余混杂时，不能盲目开展ETT分析；

②需要在观察性研究中明确定义研究开始的时间点（即基线时间点），避免引入现使用者偏倚（prevalent user bias）和永恒时间偏倚（immortal time bias）等[18-19]；

③如果观察性研究在诊断方法或干预措施上存在局限，导致研究者无法仿真“理想”的RCT研究，此时可在ETT中做出适当的妥协或修改；

④ETT毕竟是在观察性数据中开展的RCT仿真，因此它不能取代设计良好的RCT研究，而仅是RCT的一个补充。

由于ETT研究遵照了RCT研究设计的严格思路和原则，同时利用真实世界队列研究数据开展研究，因此ETT同时具备了真实世界研究和RCT研究的优点和不足（表 1）。同时ETT的设计思路可帮助研究者发现原队列研究数据分析中的误区[20]，识别原队列数据分析中可能存在的混杂和其他偏倚，提高队列数据分析的质量。

表1. 真实世界队列研究、目标仿真试验和随机对照试验比较

2. 设计要素

（1）入选和排除标准：为了更好地仿真RCT研究，ETT研究对象的入选和排除标准必须与目标RCT保持一致。研究对象的入选和排除标准常包括人口学指标、疾病具体诊断、合并症、既往史和用药史等。除此之外，ETT的入选和排除标准中还常需要包括研究对象一定时长的随访情况，因为RCT研究往往具有规范的结局指标随访计划和测量方法[5, 21]，但ETT的数据只能依赖于原观察性研究数据。研究对象在满足上述入选和排除标准后方可进入ETT。

由于是在真实世界数据中开展RCT仿真，因此ETT在入选和排除标准上有可能存在缺少重要变量的可能，比如对某病的诊断缺乏医生的诊断结果（可能是患者自报）。此时可考虑采用相关医学检查（如CT、核磁共振成像等）或检验结果进行替代，但这种替代的过程应该在局限性中进行说明[22]。有时也可能存在缺少研究对象诊断信息的情况，此时应调整ETT方案或放弃ETT研究。

ETT研究中需要注意的是研究对象的入选和排除标准是在研究对象基线入组时使用的，其中不应包括基线后的研究对象治疗依从性等信息[5, 21]。由于在RCT研究中研究者未知基线后研究对象的依从情况，因此在RCT研究中该情况往往不会出现，但在观察性研究的ETT分析中则可能出现。

（2）干预与随机分组：ETT研究需要依照目标RCT研究明确定义干预措施和干预周期，将符合干预方式的研究对象分为干预组，将不符合干预方式的研究对象分为对照组。如果在观察性数据中存在干预方式仅部分符合的研究对象，此时不应将其纳入ETT研究。ETT研究中干预方式的评价需要在基线时进行，这样可避免发生现使用者偏倚。

在RCT研究中，研究对象通过随机化过程被随机分配到不同的干预组，随机化过程在绝大部分情况下保障了组间基线的均衡性和组间的可交换性。但在ETT中，由于是利用观察性研究数据去仿真RCT，因此研究对象在实际情况下并没有得到随机分组。此时研究者可在基线时对研究对象进行随机分组模拟，通过相应的统计学方法来平衡组间基线特征差异[5, 23]，此过程又可称为“事后随机化过程”。常用的统计学方法有倾向性得分匹配[24]、逆概率加权[25]、G方法[26]和双重稳健估计法[27]等。

但此类“事后随机化过程”并不是完美的，因为此类过程仅能控制已测混杂，而不能像真正的随机化过程一样同时控制已测和未测混杂的影响[5, 23]。且有时在观察性数据中这些已测混杂可能存在信息缺失或测量不准确的情况，此时研究者可依赖其他方式（如自然语言处理技术）对这些信息进行适当的弥补[28]。同时，研究者也可以通过工具变量和未测混杂敏感性分析的方法（如E-值）来对研究结果进行校正和稳健性估计[29]。

由于在观察性研究中往往不存在安慰剂和盲法，因此一般情况下ETT不能模拟安慰剂对照试验和盲法试验。但也有研究者认为常规医疗处理条件下的对照组效应可能与安慰剂效应类似[22]。

（3）定义基线时间点：在ETT研究中基线时间点的定义非常重要且往往存在难点，错误的定义容易引起试验的失败[30]。基线时间点在RCT研究中容易定义，即为研究对象符合入选和排除标准后入组和随机化的时间点，该时间点也是研究对象接受干预的时间点，同时也是研究对象结局指标随访开始的时间点。

在ETT研究中，研究对象可能在较长的时间范围内均符合入选和排除标准，但治疗或干预则是在某一特定时间点开始。如某研究拟探索降糖药物对2型糖尿病的治疗效果，患者可能患病数月依旧没有开始服用降糖药物，在此数月内研究对象均符合入选和排除标准，但只有患者开始服用降糖药物时基线时间点才发生。尽管此类情况在RCT研究中也可能存在，但RCT研究中的随机化过程可在一定程度上平衡不同组间从诊断至服药的时长影响。

因此ETT研究中干预组基线时间点的定义往往是研究对象符合入选和排除标准后且开始干预的时间点，而空白对照组的定义则只能是研究对象首次满足入选和排除标准的时间点。但此时可能会引入永恒时间偏倚[19]，因此研究者需要在干预组与对照组的匹配时考虑采用年龄分层或者对干预前的人-时（person-time）信息进行调整等方式来进行控制。

在实际操作过程中，研究对象可能仅存在一个基线时间点，如比较不同给药剂量的治疗效果，大部分情况下研究对象不会在不同药物剂量间来回切换，因此符合入选和排除标准后的给药时间点即是基线时间点。有时研究对象也可能存在多个基线时间点，如某研究拟探索绝经后女性激素替代治疗的效果，此时未使用激素替代治疗的绝经后女性在50~60岁间均符合基线时间点。

对存在多个基线时间点的处理可采用两种方式：①仅纳入一次，此时可采用首次合格的时间点或采用随机选择一个合格的时间点来纳入研究；②纳入多次，此时可采用嵌套设计的方法选取其多个合格的时间点来纳入研究，如García-Albéniz等[6, 9]针对乳腺癌和结直肠癌开展的研究。从统计的角度上来看，第二种方式更为高效，但由于同一个研究对象可能被使用多次，在研究过程中应该采用适当的方法来对估计的方差进行校正。

ETT研究中基线时间点要求研究对象符合入选和排除标准时间点、开始干预时间点和开始随访时间点相同，可称为“三点合一”，此时才是正确的基线时间点定义（图 2A），其他情况均是错误的情况，且可能引入偏倚（图 2B，C，D，E）。但在真实世界数据中往往会存在不符合“三点合一”的研究对象，研究者需要尽量将其排除。

例如在探索房颤患者服用华法林的疗效和安全性研究中，可能会在以下情况下引入现使用者偏倚：①已经服用华法林两年的房颤患者（符合入选和排除标准）在此刻刚纳入疗效和安全性的评价与随访，此时研究对象在前两年的服药过程中所出现的疗效和安全性事件则不会纳入分析；②已经服用华法林两年的非房颤患者（即刚服用华法林时此患者并不符合入选和排除标准），在此刻符合入选和排除标准且纳入了疗效和安全性的评价与随访，此类患者之前的疗效和安全性事件也不会纳入分析。

注：A为正确定义；B，C，D，E为错误定义

图 2 目标仿真试验基线时间点定义

（4）结局指标与随访：ETT研究跟RCT研究一样需要事先定义结局指标（包括首要和次要结局指标）及其测量方法，然后使用观察性研究的随访数据信息来确定结局指标的测量结果。对ETT的研究方案也可以考虑进行类似RCT研究的注册[31]，这也会提高结局指标评估的准确性和规范性。在结局指标的确定上最好能够有相关的验证措施，否则容易导致错误的估计[32-33]。同时对结局指标的评估如果能适当地采用盲法会更好，比如评估结局指标的临床医生并不知道研究对象的干预情况。

随访是指由研究的基线时间点开始，去记录研究的结局指标直至结局事件出现。随访在RCT研究中往往有明确的时间间隔，而在ETT研究中则只能依赖于现有数据中的随访测量情况。类似生存数据一样，在随访期间观察到结局发生的为完全事件，未观察到结局发生的为删失事件，删失事件又可分为左删失、右删失和区间删失，不同的删失数据应采用不同的生存分析方法进行分析。对于缺失数据的处理可以采用多重插补[34]或逆概率加权法[35]等进行分析。

（5）统计分析与因果推断：ETT研究的因果比较与RCT研究一样，通过对比不同干预措施组的结局指标情况，探索干预措施对结局的影响。RCT研究的比较往往采用意向性分析原则（ITT），以全分析集结果为主，以符合方案集结果为辅，理论上ETT中也应该与RCT保持一致。但在ETT研究中去实现ITT存在一些困难，因为在ETT数据中研究对象的依从性往往很难得到良好的测量，研究对象往往只会被记录为“干预”或者“非干预”，而很少去记录其接受干预的质量好坏（即依从性）。

符合方案分析（PP）集分析在ETT研究中往往是最可行的，且该分析往往更有助于探索干预措施在真实世界中的疗效。但在ETT研究中的PP集分析不仅需要考虑基线的混杂，也需要考虑随访过程中的混杂[5]，可以考虑通过G-方法分析来实现[36]。

ETT研究统计分析方法的选择需要参考结局指标的类型。如果结局指标是生存数据则需要选择Cox比例风险回归进行分析，如果结局指标是连续性指标则可选择相应的线性回归来开展分析。在数据分析时，往往需要进行多因素的分析，且需要同时纳入基线时的协变量和随访时的协变量进行分析。如果协变量在随访过程中出现了时间依赖性，则还需要考虑时依协变量的分析方法。