老师们好,我有具体的统计问题要咨询~我有一组人群数据,变量有基本人口学特征,是否

老师们好,我有具体的统计问题要咨询~我有一组人群数据,变量有基本人口学特征,是否接受过健康教育,5道结核病防治知识的题,接受过健康教育的人是通过什么途径接受的,大家又期望什么途径,都是单选题。知晓率可以做成二分类的是否全部知晓,也可以做成总知晓率,想说明2个问题:1.知晓率的所有影响因素中健康教育最重要;2不同健康教育途径效果不同(知晓率不同),某些途径效果特别好;目前我用了logistic回归,以是否全部知道为因变量,是否接受过健康教育和所有人口学特征为自变量,结果除了“地区”全都纳入了模型,想问,如何能够说明健康教育在里边的重要性,以及发现随年龄升高健康教育率升高,但知晓率降低,我是否应该把年龄和是否受过健康教育的交互作用纳入模型?但这涉及到凭什么只放这两个交互作用不放别的呢,全放进去的话又太多了,还是说可以分层什么的,说明不同的人群接受健康教育之后效果不同?还有我的人群地区和职业分布不均匀,直接放进模型的时候地区不纳入,但如果地区和职业交互放进去之后,反而是职业不纳入,这又要如何处理?第二个问题:我把接受的教育途径和期望的教育途径都归成5类后,做卡方就可以说明二者不同了吗?是不是解释力很差?因为有5类呢,而5类途径的全部知晓做卡方有统计学意义,就可以说明最高的真的最高了吗?还是说像方差分析似的有两两比较的方法?麻烦啦~困扰了好久