您好!我有一个样本量大约在15万的住院患者的数据库,含有年龄、性别、主要诊断、某些生化指标和住院花费等。我想看看年龄、性别、主要的诊断、某项生化指标异常对于住院花费有无影响。问题有: 1. 是否应当采用多元线性回归? 2. 在做回归分析时,主要诊断这一自变量,应当是个无序的分类变量,应当如何处理为宜?或者选取何种方法分析为宜? 非常感谢!