本文内容来源:詹思延教授主译的《观察性疗效比较研究的方案制定:使用者指南》,原文为美国卫生保健研究和质量管理署(The Agency for Health care Research and Quality,AHRQ)组织编写的《Developing a Protocol for Observational Comparative Effectiveness Research: A User’s Guide》。
感谢詹思延教授的授权!
以下内容摘自《观察性疗效比较研究的方案制定:使用者指南》的“第十章 统计分析思考”章节,该章节的作者为:Patrick G.Arbogast,Ph.D.(已故);Tyler J.VanderWeele,Ph.D. 该章节的译者为张洋博士。更详细的内容请查看书籍原文。
利用现有观察性数据进行疗效比较研究时,通常需要细致、复杂的分析策略来调整混杂因素。其中包括标准的分析策略,如传统的多元回归模型法,也包括更复杂的分析方法,如倾向评分匹配和工具变量分析法。本章将介绍的统计方法涵盖相对简单的描述性统计分析以至更为复杂的统计方法,同时将对数据分析时重要的注意事项,如缺失数据、时依暴露和时依协变量的处理作介绍。
在许多教科书中已经介绍了针对不同种类数据的适合的描述性统计量和图形表示,其中包括连续变量的极差,离散程度和集中趋势,分类变量的数量和百分比,以及评估数据分布的分布图。在疗效比较研究数据分析中这些描述性统计资料是非常重要的。
例如,在队列研究中,按暴露水平对协变量进行分层描述,可以很好的发现层间协变量的不均衡性。单变量以及其他未校正混杂因素的假设检验,比如两样本t检验,可以用于识别与暴露和(或)结局有关的变量。在疗效比较研究中,常常需要从多个协变量中识别潜在混杂因素的影响,因此,描述性统计应对全部研究对象的特点提供一个全面的概述。
确认删除