无论是医生还是患者都会接触很多诊断试验,比如胸片、心电图、血常规、B超以及CT等等。然而,很多诊断并不是100%正确的,有时候会有假阴性,有时候会有假阳性。那么,为什么一个医学诊断不能做到100%的正确呢?
我们先来看看人体生物指标的分布情况。
一、人体生物指标——双峰分布
以结核菌素试验(PPD试验)为例,结核菌素在皮内注射后,硬结直径在人群中的分布情况如图1:
可以看出,结核菌素试验后,硬结直径主要集中在0mm和20mm两个区域,呈现两个高峰(即双峰分布)。没有感染过结核杆菌的人集中上图的左侧(没有硬结或很小),感染过结核杆菌的人集中在上图的右侧(出现20mm左右的硬结)。
当然,也有一些人的硬结直径可能落入“灰色地带”(上图中间区域),不容易诊断是否有过结核杆菌感染。但是,一个诊断如果依据的是这样的双峰分布,仍然比较容易区分大部分人的情况,判断病人和非病人。
二、人体生物指标——单峰分布
男性收缩压的分布情况如图2。可见,收缩压的分布只有一个峰值,属于单峰分布。
在这种情况下,如果想通过一个诊断来区分高血压患者和非高血压患者,我们就必须设置一个截点(cutoff)。血压值高于此截点认为是高血压人群,低于此截点认为是非高血压人群。
然而,对于这样一个连续的、呈单峰分布的血压值,截点选择在什么位置才更合适呢?理想的截点是,收缩压超过这个截点,相比低于这个截点的人,在中风、动脉硬化以及死亡等方面有更高的风险。这样我们的诊断试验和结果才更有意义。
实际上,人体大多数的生物指标都呈现单峰分布。因此,我们需要通过一定的统计手段,选择截点的位置,同时希望截点具有一定生物学意义。但无论怎样,选择一个截点,必然会有一部分收缩压大于这个截点的人,中风、动脉硬化以及死亡等方面风险并不高(假阳性);但另一部分收缩压小于这个截点的人,中风、动脉硬化以及死亡等方面风险很高(假阴性)。这就是为什么一个医学诊断不能做到100%的正确的原因(图3)。
确认删除