当我们应用统计方法对数据进行分析时,会发现许多分析方法,例如常用的T检验、方差分析、相关分析等,都要求数据服从正态分布或者近似正态分布。为了保证数据满足这些统计方法的应用条件,对原始数据进行正态性检验是十分必要的。
(注:以下加粗标题都可以直接点击,打开文章查看详情)
很多人都问过这样一个问题:样本量大于30或50是不是就不用做正态性检验了?而且一本正经地说,这是统计书上说的。有的更专业了:这是根据中心极限定理,当样本量大于30的时候,就接近正态了。事实真的如此吗,点击上方标题链接,赶快了解一下吧。
对于正态性的判断,尽管有很多种检验方法,但这些方法都过于敏感,尤其大样本时,轻微偏离一点,就会认为非正态,所以实际中没有必要非得根据这些检验方法来判断是否正态。如果想快速判断,可以简单算四分位数间距和标准差。也可以随便用任何统计软件,绘制直方图、茎叶图、QQ图等。
这些图怎么绘制呢?且看下面的SPSS教程。
如果数据分布呈现非正态,该怎么办呢?一种方法是,可以将原始数据作某种函数的转换,使偏态资料正态化,从而满足T检验或其他统计分析方法对资料的要求。如何操作呢,赶快参考:
要注意的是,不是任何非正态数据都可以进行正态转换,如果通过变量转换的方法依然无法将数据转化为正态分布的话,可以使用非参数检验的方法来进行统计分析。都有哪些非参数检验的方法呢?请查看下方的合集:
另外,医咖会还推出了一些课程,解答了许多关于正态性的许多问题,想要了解的小伙伴可以查看下面的文章:
扫码关注“医咖会”公众号,及时获取最新统计教程
确认删除