上QQ阅读APP看书,第一时间看更新
第四节 重复测量及序列相关数据
测定标志物踪迹的快速方法的应用允许研究者将标志物当作监视装置使用。如连续测定接收到的Ca 125或前列腺特定抗原水平。
在不同时间点上对相同个体的测量,观察值不能再像许多广义线性模型所假定的那样是独立的,必须使用其他分析过程。此处有两个典型的统计学问题:①某种特性随时间变化吗?②这些特性与其他协变量或解释变量存在什么关系?在某些严格的约束条件下,如数据服从正态分布,个体的测量在相同的时间点完成(如进入实验后1个月和3个月),没有缺失数据,具有特殊的协方差结构,则可使用一种称为重复测量ANOVA的单变量分析方法分析该数据。如果关于协方差阵的某些约束不满足,可进行轮廓分析回答这两个问题。
更为常见的是,研究者并不能完全控制进行测量的环境。如受试者可能没有按计划来访,盛有血浆的试管可能跌落或在离心分离期间破裂。由此引起的不平衡数据集一般不适合用前面介绍的方法进行分析。然而可通过多元方法利用完全多元模型,将缺失数据转嫁到设计期,在设计中的使数据以随机的方式缺失,从而达到预期的平衡。当测量是在唯一或任意时间点进行时,或协方差阵的维数太大以致难以处理,或希望估计某些特殊的(随机)特性,可使用二阶段随机效应模型。Laird和Ware给出了以生长模型和重复测量模型为特例的一般性模型族。第一阶段是对每个单独的受试者计算测量值关于时间的回归,得到每个受试者的变化率的估计值(下降或增长率)。第二阶段拟合线性模型,在其中将个体变化率与个体协方差相联系。他们也给出了使用EM算法,结合经验Bayes法和最大似然法拟合这类模型的统一方法。
由于测定标志物的技术日臻成熟,有可能在一个个体上对给定标志物随时间进行多次测量。本节描述的方法适合于每个个体仅有相对少量的观测(≤20)。对更大量的测量,时间序列的方法可能更合适一些,但对前面提到的凌乱的不平衡情况不能很好地处理。