一、问题与数据
某研究者招募了100位研究对象,想知道招募的研究对象体型分布是否与总体人群一致。该研究者已知总体人群中有50%是正常体型(normal),35%为超重(overweight)以及15%为肥胖(obese)。现该研究者统计了这100位研究对象的体型(BMI)信息,部分数据图1。
图1 部分数据
二、对问题分析
若研究者拟检验数据是否服从某个指定分布,如本研究中拟判断招募的研究对象体型分布是否与总体人群一致,建议使用卡方拟合优度检验,但需要先满足3项假设:
假设1:存在一个分类变量,如本研究中研究对象的体型变量是分类变量。
假设2:具有相互独立的观测值,如本研究中各位研究对象的信息都是独立的,不会相互干扰。
假设3:样本量足够大,最小的样本量要求为分析中的任一预测频数大于5。
经分析,本研究数据符合假设1和假设2,那么应该如何检验假设3,并进行卡方拟合优度呢?
确认删除