荷兰阿姆斯特丹大学医学院麻醉科Patrick Schober教授发表了一篇论文《Statistics From A (Agreement) to Z (z Score): A Guide to Interpreting Common Measures of Association, Agreement, Diagnostic Accuracy, Effect Size, Heterogeneity, and Reliability in Medical Research》,对各种常见的统计指标的界值进行了介绍说明,并建议对医学研究中的一些常用统计指标进行简单易懂的解释,小咖将继续为大家一一介绍。
前面我们已经介绍了相关系数、克朗巴哈系数等,今天我们继续介绍另外几个统计指标。
I2统计量
在Meta分析中,在纳入的研究之间观察到的效应量大小的变异,一方面是由于随机抽样误差,另一方面是由于效应量的真实变化。研究之间效应大小的真实变化称为异质性。通常报告I2统计量来量化这种异质性。
I2表示可归因于异质性而非抽样误差所造成的研究之间效应量的变异在总变异中所占的百分比。相比于评估一致性的经典指标—Cochran’ Q,I2被认为是更好的评价指标,因为它不依赖于纳入研究的数量。
由于I2是一个百分比,所以它是评价异质性的一个相对指标,它不能以绝对值的形式来量化研究中效应量变异的大小。I2的范围为0%到100%。有学者将I2按照25%、50%和75%的界值进行划分,分别代表异质性的低、中、高。如文末表1所示。
组内相关性ICC
在对同一度量或测量工具的定量数据进行一致性评价时,如评分量表的评分者间或评分者内的信度,通常采用组内相关系数(ICC)进行评价。
ICC至少有10种,选择最合适的ICC取决于几个因素,包括所有评估是否由相同的评估员或不同的评估员执行;评估员是否被视为随机样本;主要关注点是个人评估还是平均评估;以及是否评估的是绝对一致性。
ICC系数通常在0到1之间,可以认为是受试者(或评分者)之间的变异在总变异中所占的比例。由于加权kappa统计量是ICC的一个特例,因此可以将ICC和Kappa统计量采用相似的界值进行解释。如表1所示。
确认删除