内容来自:“小白学统计”微信公众号,感谢作者授权。
重复测量数据是指对同一个体在不同时间点的测量,这种数据在医学研究中较为常见,比较典型的数据形式如:
a.对一组人群分别在干预前后不同的时间点观察其结局情况。这种研究通常是为了比较不同时间点的差异情况,或者分析时间变化趋势。
b.或将一组人群分配至不同组别,对每组人群分别在干预前后不同的时间点观察其结局。这种研究通常要比较不同组的差异,有的再深入点,可能还要分析几个组的变化趋势是否有差异。
重复测量数据的个体观测值不完全独立,数据间存在趋同性,如果采用独立数据的统计推断方法(如t检验、方差分析)进行分析,往往会增大Ⅰ类错误发生的概率,容易使本来无统计学意义的结果变成了有统计学意义。事实上,这种情况在审稿中甚至在已发表的文章中都不算少见。
基于不同的研究目的和分析策略,重复测量数据可采用不同的分析方法,医学中常见的有重复测量方差分析、广义估计方程、多水平模型。
重复测量方差分析,顾名思义,仍是属于方差分析的范畴,因此其思路也是基于方差分解。
重复测量方差分析与单变量方差分析思路的不同之处在于:单变量方差分析是对某一变量的方差进行分解,而重复测量数据存在多个时间点的测量结果,并不仅有1个变量,而有多个变量,从而形成多个变量的方差-协方差矩阵。
这里关键要弄清楚,1个变量,只有方差,而2个及以上变量,不仅有每个变量的方差,还有表示几个变量之间关系的协方差,所以多个变量就会形成一个方差-协方差矩阵。
因此,重复测量方差分析不是对1个变量的方差进行分解,而是对多个变量的方差-协方差矩阵进行分解。
为了给大家一个直观印象,下面就是一个协方差矩阵:
确认删除