一、问题与数据
某医生想利用自己科室的患者数据,采用匹配的病例对照方法探究吸烟和肺癌的关系。该研究为每一位肺癌患者根据年龄段(±2岁)、性别和是否有家族史匹配2名对照,对病例和对照均收集是否吸烟的信息,并探索收入水平是否是可能的混杂因素。部分患者信息如表1:
表1. 病例对照信息
其中,ID表示对子数,每组对子3人,含1名肺癌患者和2名对照。Status变量表示是否患有肺癌,其中1表示患有肺癌(即病例),0表示未患肺癌(即对照)。Smoke变量代表是否吸烟,1表示吸烟,0表示不吸烟。Income变量代表收入水平,1表示高收入水平,0表示低收入水平。
二、对问题分析
该研究中,病例与对照根据年龄、性别和是否有家族史进行了匹配。此种设计需应用配对Logistic回归(条件Logistic回归)进行分析。SPSS中无专门进行配对Logistic回归的菜单,但是可以利用分层Cox回归进行分析。SPSS的Cox回归可分析病例与对照为1:m(m≥1)配比的设计。若配比为n:m(n>1,m≥1),需使用Stata软件的Cox回归过程,其数据格式与SPSS一致。在Cox回归中,将是否患病作为是否发生结局的变量,然后新建患者生存时间变量,此变量的赋值应满足对照组大于病例组,具体数值可不固定。
确认删除