一、问题与数据
某医生拟探讨吸烟与阿尔兹海默症之间的关联性,该医生招募了100名研究对象,按照吸烟状态分为两组,其中吸烟者52人,不吸烟者48人,对他们进行长期随访,收集研究对象发生阿尔兹海默症的终点事件信息。部分数据图1。
图1 部分数据
二、对问题分析
研究者想判断不同吸烟状态发生阿尔兹海默症的风险是否相同。针对这种情况,我们可以使用卡方检验,但需要先满足3项假设:
假设1:存在两个二分类变量,如本研究中的吸烟和阿尔兹海默症都是二分类变量。
假设2:具有相互独立的观测值,如本研究中各位研究对象的信息都是独立的,不存在相互干扰作用。
假设3:样本量足够大,最小的样本量要求为分析中的任一单元格期望频数大于5。
经分析,本研究数据符合假设1和假设2,那么应该如何检验假设3,并进行比较呢?
确认删除