在上一期的文章中,我们向大家介绍了随机抽样的相关内容,它主要用在流行病学调查选择研究对象的过程中,目的是为了使所有的研究对象都有相同的机会被抽取。(点击查看:手把手教你SPSS实现随机抽样的两种方法)。
当然,对于抽样结构比较复杂的情况时,我们需要综合多种随机抽样的方法,分阶段进行抽样,今天我们就来向大家介绍一下,如何利用SPSS实现复杂的多阶段抽样。
研究实例
假设某城市想要调查了解该地区居民的健康状况,拟从该城市5个不同地理位置辖区内的共49个区县11128个居住小区中进行抽样,数据库格式如下:
ID:小区编号,且是唯一识别号
District:地区编号,该城市根据地理位置划分为东、西、南、北、中共5个地区
town:区县编号,即5个不同地理位置中管辖的区县编号,其中东部9个,西部16个,南部8个,北部9个,中部7个
抽样要求:
1. 覆盖全部5个地理位置辖区
2. 从49个区县中随机抽取22个区县,每个地理位置根据其管辖的不同区县数量,来确定抽样量
3. 再从被抽中的区县中,随机抽取20%的小区
4. 被抽中的小区居民全部参与健康调查
对于这个抽样过程,虽然看似很复杂,但是我们可以把它简化,因为它几乎涵盖了上我们在一篇文章中所讲到的各种随机抽样方法,包括简单随机抽样、分层抽样、整群抽样、分阶段抽样等,那么考考大家,到底应该如何进行抽样呢?
抽样思路
1. 完整抽样框:11128个居住小区
2. 第一阶段抽样:
抽样目标:抽取22个区县(占49个总区县数量的45%)
分层抽样:按照5个不同地理位置辖区进行分层
按比例分配:由于每个地理位置管辖的区县数量不同,我们按照45%的抽样比例,来计算每个地区的抽样数量,即东部4个,西部7个,南部4个,北部4个,中部3个
确认删除