作者:杨超 鲁艺斐 李延龙 张耀文
2019年3月,European Urology 杂志(IF 17.581)发表了泌尿外科临床研究领域的统计报告指南《Guidelines for Reporting of Statistics for Clinical Research in Urology》,目的在于提升人们的统计学知识,改善论文质量。
在之前的文章“医学论文中统计报告要注意的诸多细节:p值、置信区间...”中,我们介绍了p值、置信区间、研究估计值等报告时要注意的问题,今天这篇文章我们再来看一看多因素模型和诊断试验中统计报告的注意事项,以及结论和解释部分要注意的问题。
1. 多因素模型和诊断试验
1.1 多变量回归、倾向性评分和工具变量并不是一根魔棒
有研究者认为多变量调整可以“消除混杂”、“使两组相似”或“模拟随机试验”。但这个说法有两个问题:首先,记录在数据集中的变量值通常是近似值,因此可能会掩盖组间差异。
例如,当使用临床分期作为协变量,比较不同治疗方案对局限性前列腺癌的预后时,如果一组临床分期为T2c 期患者多于另一组,那么该组的预后可能会更差。但是T2c 期也具有不同表型。多变量调整T2c 时,并不能保证T2c 的不同表型也完全相同。
其次,模型只针对少数测量的协变量进行调整,并不能排除未测量(甚至不可测量)的协变量存在重要作用的可能性。通常情况下,倾向性评分匹配比传统的多变量回归能更好地调整混杂因素。工具变量法的效果则主要取决于工具变量的质量。在许多情况下,工具变量与干预没有很强的关联,这导致了95% CI的大幅增加;而在某些情况下,则会低估治疗效果。
1.2 避免完全依赖“逐步选择”
确认删除