作者:李侗桐;审稿:张耀文
单样本分析主要用于:(1)对变量进行描述;(2)对比样本与已知分布的差异。
单样本分析中仅包含一个变量的一组数据。举例来说,研究者拟分析50-60岁男性的血压情况。其中,血压是该研究中唯一的变量,50-60岁男性是唯一的分组,没有其他数据,这时就适合使用单样本分析。当然,单样本分析也常作为其他统计分析的基础出现在多数报告中,帮助研究者了解各变量的基本情况。单样本分析的示例如下:
单样本分析主要分描述分析和分布检验两类。
其中描述分析主要反映数据的集中趋势和离散程度。比如,研究50-60岁男性的血压情况时,需要了解血压的均值、中位数、标准差、偏度等描述性统计指标。
分布检验主要提示研究样本与已知或假设总体的关系,即研究样本是否服从正态分布、均匀分布、指数分布以及泊松分布等。
比如,研究50-60岁男性的血压时,研究者需要分析血压样本的分布情况,检验其是否满足正态分布。再比如,分析队列中每年因吸烟死于肺癌的人数时,需检验数据是否满足泊松分布。描述分析和分布检验的区别如下:
3.1 描述分析
① 连续变量
均值和标准差。许多检验方法都可以输出连续变量的集中趋势(如均值)、离散程度(如标准差)以及数据形状(如偏度)。
②分类变量
频数。SPSS也可以输出分类变量的集中趋势(如中位数)、离散程度(四分位间距)以及绝对频数(如频次)、相对频数(如百分比)和四分位数等。
3.2 分布检验
① 连续变量
Kolmogorov-Smirnov检验。该检验可用于判断数据是否服从正态分布、均匀分布、指数分布或泊松分布。
②有序分类变量或无序分类变量
卡方拟合优度检验。该检验适用于分析分类变量是否服从已知或假设分布。
确认删除