聊起诊断试验那可是应用相当广泛:评价两种方法或仪器诊断结果是否一致,得用到诊断试验;看看两个大夫对同一群病人诊断是否一致,要用诊断试验;评价同一组患者前后两次诊断结果的一致性,还得用到诊断试验,等等......
简而言之,诊断试验关注的重点是“一致性”,也就是说同一个体用两种仪器(方法/评价者)或前后两次时间进行观测,其结果在误差允许范围内是一致的。评价一致性程度的方法很多,比如说Kappa值、Kendall一致性系数、组内相关系数(ICC)等等,但是选对合适的方法却不容易,接下来就帮大家梳理一番!
配对χ2检验 vs. 一致性检验
配对χ2检验(McNemar检验)和Kappa一致性检验都可以用于配对设计的列联表分析(表1),例如,比较超声和CT平扫对于急性阑尾炎的诊断价值,但是两者却各有侧重。
(1) 两者计算方法不同
由①②③可知在计算Kappa过程中,会利用到四格表中全部的数据(a、b、c、d),而公式④表明配对χ2检验只利用了四格表中“不一致”的数据(b和c)。
(2) 两者提供的信息不同
一致性检验不仅可以明确两种方法是否存在一致,更重要的是可以计算Kappa值,进而评价一致性的程度。目前认为,Kappa<0,一致性强度极差(实际情况下发生可能性较低);0-0.20,微弱;0.21-0.40,弱;0.41-0.60,中度;0.61-0.80,高度;0.81-1.00,极强。
配对χ2检验只能给出两种方法阳性(或阴性)检出率的差异是否具有统计学意义,但配对卡方检验掩盖了一个问题,即它对两种方法阳性(或阴性)检出率不区分真阳性(真阴性)和假阳性(假阴性)。事实上我们更想知道两种方法都检出真正病人或者非病人一致性如何,这里就凸显了Kappa的重要性。
确认删除