本文转载自微信公众号“小白学统计”,感谢作者授权。
最近审稿,看到关于预测建模的文章越来越多,模型构建过程有时在文章中体现不明显,然而评价指标的使用却是一目了然。不少文章尽管也列出了一些评价指标,却不一定合适。因此特撰此文,以期为临床医师提供一些参考。
预测模型评价指标很多,医学中比较常用的是灵敏度(sensitivity)、特异度(specificity)、准确度(accuracy)等,机器学习领域中常喜欢用精准率(precision)、召回率(recall)、F1 score等术语。这是非常实用的几个指标。
本文主要介绍这几个简单指标的使用场景及缺点(ROC、NRI等相对复杂的指标以后再说),希望大家使用时谨慎。最后简单介绍一个好像在医学中很少使用但很有效的指标MCC。
这几个指标的概念都非常容易理解,尽管绝大多数文章或书中都有说明,但这里还是先列出这个随处可见的混淆矩阵表格,方便大家对照着看。
确认删除