本文整理自《JAMA Surgery》期刊推出的“统计和方法学指南(Guide to Statistics and Methods)”系列的一篇文章,原文题目为“Practical Guide to Designing a Clinical Trial in Surgery”[1],介绍了在外科临床试验的研究设计阶段需要考虑的关键因素。
研究问题和假设
一个临床试验的开端,是提出一个经过深思熟虑的研究问题,并以假设的形式加以阐述和检验。最好是具有文献支持的问题,并能解决明确界定的知识空白。在外科临床试验中,患者安全和伦理问题尤其需要考虑,因为试验干预的侵入性或因研究方案要求而暂停手术治疗的风险,都可能对患者造成伤害。
填补知识空白
研究问题的提出,是为了填补明确定义的文献缺口,即知识欠缺的领域,该空白一旦填补,预计会对临床实践或卫生政策产生重大影响。初步分析应充分证明,该试验能够很好地解决这一空白。
主要终点和次要终点
所有试验都应制定一个定义明确的单一主要终点,该终点可直接解决研究问题,并作为计算样本量的基准,也能决定研究的时间长度。主要终点可以是一个单一结局,也可以是包含多个事件的一个复合结局,但不能是很多个单一结局,而且需要由设盲的结局评估者以有效、客观的方式进行测量。
连续变量(如住院时间)可用作主要终点,理论上具有吸引力,因为可以减少所需的样本量。然而,外科临床试验中,很多重要的主要终点事件,如死亡率或术后并发症的发生,都是二分类变量。
制定一个主要复合终点有双重好处:① 可作为所有结局的总体概括测量;(2)提高统计效能(power)和减少所需的样本量。复合终点的定义需要谨慎,其单个组成事件要具有相似的临床意义、相似的发生率和相同的变化方向。
除主要结局外,还应事先定义次要结局,以更好描述不同治疗方法的各种效果。事后分析(对研究分析计划中未预先指定的结局进行分析)可能纯粹是探索性的,可作为推动未来研究的假设,此类分析可能会出现报告偏倚以及I类和II类错误,如果结果显示治疗效果与主要终点不同,则可能会改变试验的主要信息。
样本量
纳入的研究样本应能代表研究问题所适用的目标人群。必须明确界定纳入和排除标准,以尽量减少选择偏倚并最大限度地提高外推性。参与者自然流失程度以及对脱落和交叉(crossover)的考虑也是减少选择偏倚的重要考虑因素。
干预组和对照组
大多数外科试验都包含一种单一干预措施,例如一种可能优于保守治疗的新疗法。对照组要么不接受治疗,要么接受代表现有治疗标准的手术治疗。例如,在OVER试验中[2],干预组接受的是血管内动脉瘤修补术,而对照组接受的是开放动脉瘤修补术,后者几十年来一直是腹主动脉瘤修补术的标准手段。
确认删除