一、问题与数据
某研究者想探索受教育程度、性别与幸福指数之间的关系,招募了58位研究对象,包括28位男性和30位女性。受教育程度分为3类(高中及以下、大学本科和硕士研究生及以上)。
幸福指数采用问卷测量,得分在0-100之间分布,分数越高,幸福指数越强。最终收集了研究对象的幸福指数(Index)、性别(gender)和受教育程度(education)等变量信息,部分数据如图1。对于该数据,如何绘图展示数据特征呢?
图1 部分数据
二、对问题分析
研究者想绘图展示不同受教育程度、性别人群中幸福指数的差异,可以使用堆积面积图(Stacked Area)。
堆积面积图常展示因变量在两个自变量类别间的差异。其中,其中因变量一般为连续或有序多分类变量,其中一个自变量则一般是有序多分类或无序多分类变量,另一个自变量只能是分类(二分类、有序多分类或无序多分类)变量。
堆积面积图常用来展示两因素方差分析,两因素重复测量方差分析和两因素混合方差分析。
此外,研究需要注意,如果数据中两个自变量都是无序多分类变量,绘制簇状条形图更能展示数据特征。如果其中一个自变量是连续变量,则可绘制多组线图等。
确认删除