现场流行病学
上QQ阅读APP看书,第一时间看更新

第一节 队列研究

一、基本原理
队列研究是分析性研究方法之一,其基本原理是在某一特定人群中选择研究对象,根据目前或过去某个时期是否暴露于某个待研究的危险因素,或按不同的暴露水平而将研究对象分成不同的亚组(如暴露组和非暴露组),随访观察一段时间,检查并登记各组人群待研究结局的发生情况(如疾病、死亡或其他健康事件),比较各组结局的发生率,从而检验和评价暴露因素与结局的关系。如果暴露组某结局的发生率明显高于非暴露组,则可推测暴露与结局之间可能存在因果关系(图5-1)。
图5-1 队列研究设计原理示意图
流行病学研究中所指队列(cohort)一般具备两个要素:一是必须是同一暴露的人群;二是该人群必须被随访一定时间。根据研究队列人群的稳定情况,可分为:①固定队列(fixed cohort)指人群都在某一固定时间或一个短时期之内进入队列,之后对他们进行随访观察,直至观察期终止,成员没有无故退出,也不再加入新的成员,即在整个观察期内队列保持相对的固定;②动态队列(dynamic cohort)是相对固定队列而言的,即在某队列确定之后,原有的队列成员可以不断退出,新的观察对象可以随时加入。
队列研究的基本特点:①属于观察性研究;②必须设立对照组;③由因到果的研究,能确证暴露与结局的因果联系。
由于队列研究能确认暴露与疾病之间的关系,队列研究也常用于检验病因假设,可检验一种暴露与一种疾病之间的因果关联,也可检验一种暴露与多种结局之间的关联。如果研究的暴露因素是人群中自然存在的保护措施,则可评价该措施的预防效果。另外由于队列研究开始时研究对象未患所研究疾病,因此通过随访可观察到人群暴露于某因素后,疾病逐渐发生、发展,直至结局的全过程,即研究疾病自然史。
二、研究类型
根据研究对象进入队列及终止观察的时间不同,队列研究可分为前瞻性(prospective)队列研究、历史性(historical)队列研究和双向性队列研究3种(图5-2)。
图5-2 3种类型队列研究的示意图
(一)前瞻性队列研究
研究对象的确定与分组是根据研究开始时研究对象的暴露状况而定的,研究结局的获得需要随访观察一段时间后才能获得,是队列研究的基本形式。其最大优点就是研究者可以直接获取关于暴露与结局的第一手资料,因而偏倚较小,结果可信;其缺点就是随访观察的时间较长,所需观察的人群样本很大,需要花费很大,因而影响其现场可行性。
(二)历史性队列研究
研究工作是从现在开始的,但研究对象是在过去某个时间进入队列,即观察或随访的起点是过去某个时间,研究对象的确定与分组是根据过去某时点进入队列时的暴露情况。研究的结局在研究开始时可能已经发生,但资料收集是从暴露到结局的方向进行的,因此可省去较长的随访时间,研究可在较短时期内完成,具有省时、省力、出结果快的特点,适宜于长诱导期和长潜伏期的疾病,也常用于具有特殊暴露的职业人群研究。但是这种研究常常缺乏影响暴露与疾病关系的混杂因素资料,影响暴露组和对照组的可比性。
(三)双向性队列研究
如果在历史性队列研究之后,继续进行随访观察,称双向性队列研究,这种研究同时具有历史性队列研究和前瞻性队列研究的性质,一定程度上弥补了相互的不足。一般应用在研究开始时暴露和暴露引起的快速效应(如肝功能损害、出生畸形等)已经发生,而与暴露有关的长期影响(如肿瘤)尚未出现,需要进一步的观察,因此适于评价对人体健康同时具有短期效应和长期作用的暴露因素。
三、设计与实施
(一)确定研究因素
研究因素即暴露因素,一般在描述性研究和病例对照研究的基础上确定,队列研究通常一次只着重研究一个因素。因此,队列研究中研究因素的确定至关重要。在队列研究开始前首先必须给研究因素一个明确的定义,一般可通过查阅文献或请教有关专家,同时结合自己的研究目的、人力、财力,以及对研究结果的精确度要求等因素后综合考虑此定义,可以从定性和定量两个角度考虑。研究一旦实施后,暴露因素定义不可更改。
暴露的测量应采用敏感、精确、简单和可靠的方法。除了对暴露因素进行定性和定量外,还应考虑暴露的时间,以估计累积暴露剂量。同时还要考虑暴露的方式,如间歇暴露或连续暴露、直接暴露或间接暴露、一次暴露或长期暴露等。
除了要确定主要的暴露因素外,还应确定同时需要收集的其他因素资料及背景资料,包括各种可疑的混杂因素及研究对象的人口学特征,以利于对研究结果作深入分析。
(二)确定研究结局
与暴露因素相对应的是研究结局,也称结局变量(outcome variable),是指随访观察中将出现的预期结果,也就是研究者所希望追踪观察的事件。结局是队列研究观察的自然终点,与观察期的终止不是一个概念。
研究结局的确定应全面、具体、客观。结局不仅限于出现某种疾病甚至死亡,也可以是健康状况和生命质量的变化;既可是终极的结果(如发病或死亡),也可是中间结局(如分子或血清标志物的变化);结局变量既可是定性的,也可是定量的,如血清抗体的滴度、尿糖及血脂等。
结局变量应有明确统一的测定标准,并在研究的全过程中严格遵守。一般采用国际上或国内的通用标准,以便对不同地区的研究结果进行比较。另外,考虑到一种疾病往往有多种表现,如轻型和重型、不典型和典型、急性和慢性等,可以考虑按照自定标准判断,并准确记录其他可疑症状或特征以供分析。
虽然队列研究一般只能研究一个因素,但一次可以同时收集到多种结局资料,分析一因多果的关系,故在队列研究中除确定主要研究结局外,可考虑同时收集多种可能与暴露有关的结局。
(三)确定研究现场与研究人群
研究现场的选择首先要考虑现场的代表性、是否有足够数量符合条件的研究对象,还要求当地政府的重视,群众的理解和支持。最好是当地的文化教育水平较高,医疗卫生条件较好,交通较便利。选择符合这些条件的现场,将使随访调查更加顺利,所获资料将更加可靠。
研究人群包括暴露组和非暴露组(对照组),暴露组中有时还有不同暴露水平的亚组。根据研究目的和研究条件的不同,研究人群的选择有不同的方法。
1.暴露组的选择
暴露组即具有某暴露因素的人群,也称暴露队列,一般有以下4种选择。
(1)职业人群:
其暴露史一般比较明确,有关暴露与疾病的历史记录较为全面、真实和可靠,发病率也较高,故在进行历史性队列研究时首选,通常用于研究某种可疑的职业暴露因素与疾病或健康的关系。例如研究石棉致癌作用,可选择石棉作业工人。
(2)特殊暴露人群:
一般是指对某因素有较高暴露水平的人群,如果暴露因素与疾病有关,则高度暴露的人群中疾病的发病率或死亡率可能高于其他人群,将有利于探索暴露与疾病之间的联系,有时甚至是研究某些罕见暴露的唯一选择,如选择原子弹爆炸的受害者,或接受过放射线治疗的人,用于研究放射线暴露与白血病的关系。
由于对某些职业暴露或某些特殊暴露的危险作用多半不是一开始就能认识到,一旦认识到了,大多都采取了防护措施以减少暴露,所以一般不易进行前瞻性队列研究,而常使用历史性队列研究。
(3)一般人群:
在一般人群中选择暴露组,通常基于两点考虑:①不打算观察特殊人群发病的情况,而着眼于一般人群及今后在一般人群中的防治,使研究结果具有普遍意义;②所研究的因素和疾病都是一般人群中常见的,不必要或没有特殊人群可寻,特别是在研究一般人群的生活习惯或环境因素时。如研究高血脂、高血压与心脑血管疾病的关系。
(4)有组织的人群团体:
该类人群可看作是一般人群的特殊形式,如医学会会员,机关、社会团体或部队成员等某些群众组织或专业团体成员。选择该类人群的主要目的是利用他们的组织系统,便于有效地收集随访资料。而且他们的职业和经历往往相同,可增加其可比性。例如Doll和Hill选择英国医师协会会员研究吸烟与肺癌的关系就属于这种情况。
2.对照人群的选择
正确选择对照人群直接影响到队列研究结果的真实性。设立对照的目的就是为了比较,以便更好地分析暴露的作用。因此,选择对照组的基本要求是尽可能保证与暴露组具有可比性,即对照人群除未暴露于所研究因素外,其他各种影响因素或人群特征(年龄、性别、民族、职业等)都应尽可能地与暴露组相同。做到暴露组与对照组有良好的可比性很不容易,关键在于选择恰当的对照人群。
(1)内对照:
在同一研究人群中,采用没有暴露或暴露水平最低的人群作为对照即为内对照,即先选择一组研究人群,将其中暴露于所研究因素的对象作为暴露组,其余非暴露者即为对照组(非暴露组)。即暴露组和非暴露组来自同一个总体,可以无误地从总体上了解研究对象的发病率情况。
内对照的另外一种情况是当研究的暴露变量是定量变量时,可按暴露剂量分成若干档次,以最低档次暴露的人群为对照组。例如饮用水中的氟、营养素的摄入等。
(2)外对照:
也称特设对照。当选择职业人群或特殊暴露人群作为暴露组时,往往不能从这些人群中选出对照,而常需在该人群之外去寻找对照组,称之为外对照。例如以放射科医生为研究放射线致病作用的暴露对象时,可以不接触放射线或接触极少的儿科或内科医生为外对照。选用外对照的优点是随访观察时可免受暴露组的影响,即暴露组的“沾染”,缺点是需费力气去另外组织一项人群工作。
(3)总人口对照:
也称一般人群对照,即以所研究地区一般人群的发病率或死亡率作为对照组的数据,实际上并非严格意义上的对照,因为总人口中可能包含有暴露人群。用一般人群做对照时资料容易得到,可以节省研究经费和时间。但是资料比较粗糙,可比性较差。因此,应当使用暴露人群所在地区的人口,而且在时间上与暴露组资料一致或相近,以保证其可比性。
(4)多重对照:
即选择上述两种或两种以上形式的人群同时作对照,以减少只用一种对照所带来的偏倚,增强结果的可靠性。
(四)估算样本量
在确定好暴露组和对照组的选择方式后,具体可参照第三章进行样本量估算。但需要注意的是,队列研究通常要追踪观察相当长一段时间,这期间内研究对象的失访几乎是难免的。因此在计算样本量时,需要预先估计一下失访率,适当扩大样本量,防止在研究的最后阶段因失访导致样本量不足而影响结果的分析。假设失访率为10%,则可按计算出来的样本量再除以90%作为实际样本量。
(五)资料收集与随访
1.基线资料的收集
在研究对象选定之后,必须详细收集每个研究对象在研究开始时的基本情况,包括每个个体的暴露资料及其他信息,这些资料一般称为基线资料或基线信息(baseline information),一方面可作为判定暴露组与非暴露组的依据,另一方面也为今后仔细分析影响研究结局的因素提供保证。基线资料一般包括每个研究对象具体的暴露状况,疾病与健康状况,年龄、性别、职业、文化、婚姻等个人状况,家庭环境、个人生活习惯及家族疾病史等。获取基线资料的方式一般有下列4种:①查阅医院、工厂、单位及个人健康记录或档案;②访问研究对象或其他能够提供信息的人;③对研究对象进行体格检查和实验室检查;④环境调查与检测。
2.随访
当队列研究开始后,必须采用统一的方法定期或不定期地收集各组成员的资料,通过随访来确定研究对象是否仍处于观察之中,收集研究人群中结局事件的发生情况,同时收集有关暴露和混杂因素的资料。
(1)随访对象与方法:
所有被选定的研究对象,不论是暴露组或对照组都应采用相同的方法同等地进行随访,并坚持追踪到观察终止期。对于失访者应尽可能进行补访,未能追访到的,应尽量了解其原因,以便进行失访原因分析。同时可比较失访者与继续观察者的基线资料,以估计有无产生偏差。
随访一般采用常规的现况调查方法,包括对研究对象的直接面对面访问、电话访问、自填问卷、定期体检等,还可以利用记录或档案来进行随访。有时需要对环境进行调查与检测,以确证某一项暴露,如对水质进行化验、测定环境污染等。随访方法的确定应根据随访内容以及投入研究的人力、物力等条件来综合考虑。应该强调的是,对暴露组和对照组应采取相同的随访方法,且在整个随访过程中,随访方法应保持不变。
根据随访内容的不同,调查员可以是普通的询问调查者,也可以是实验室的技术人员、临床医生等,但随访调查员必须认真进行培训。研究者可以参加随访,但最好不要亲自参与,因为研究者随访易于带来主观的偏倚,而不知情的局外者反而能够获取更客观的信息。当然也可以采用盲法设计,以避免调查者带来的偏倚。
(2)随访内容:
一般与基线资料内容一致,但重点是有关结局变量资料,一般将各种随访内容制成调查表,在随访过程中使用并贯彻始终。有关暴露状况的资料也要不断收集,以便及时了解其变化。
(3)随访期限:
其长短取决于疾病的自然史,以及自暴露至疾病发生间隔的时间(疾病的潜隐期)。
确定随访期应了解疾病的诱导期和潜伏期,并以此做出设定。诱导期是指病因开始作用至疾病发生的一段时间,在此期间充分病因的作用逐步显现。潜伏期指从疾病发生到临床上被发现的时间间隔,理论上随访应在疾病的最短诱导期和潜伏期之后进行,最好不要暴露一发生就随访,但实际工作往往比较难以做到,因为很多疾病特别是慢性病的诱导期和潜伏期都不是很清楚。
随访期的长短不仅取决于疾病诱导期和潜伏期的长短,还取决于暴露与疾病的联系强度,暴露作用因素越强,随访的时间就越短。另外还应考虑整个研究所需的观察人年数,在保证随访期间内会出现预期结果的基础上尽量缩短随访期,以节约人力、物力,减少失访。
在确定了随访期后,应明确随访的时间间隔,即多长时间对研究对象随访一次,对于随访期比较短的队列研究,在观察终止时一次搜集资料即可。但大部分队列研究的随访期都比较长,则需多次随访,其随访间隔与次数将视研究结局的变化速度、研究的人力、物力等条件而定。一般慢性病的随访间隔期可定为1~2年。如Framingham心血管病的随访研究每2年随访1次,历时24年。
(4)观察终点和终止时间
观察终点(end-point)指研究对象出现了预期的结果,达到了这个观察终点,就不再对该研究对象继续随访。观察终止特指出现预期结果,如观察的预期结果是冠心病,但某对象患了高血压,不应视为该人已达观察终点,而应继续当作对象进行追踪。如果某对象猝死于脑卒中,尽管已不能对其随访,但仍不作为到达终点对待,而应看作是失访,在资料分析时作失访处理。
一般情况下,观察终点是疾病或死亡,但也可是某些指标的变化,如血清抗体的出现,尿糖转阳及血脂升高等,根据研究的要求而不同。发现终点的方法要敏感、可靠、简单、易被接受。
观察终止时间是指整个研究工作截止的时间,也即预期可以得到结果的时间,这与观察终点不是一个概念。
(六)质量控制
队列研究费时、费力、费钱,加强实施过程,特别是资料收集过程中的质量控制显得特别重要,很多控制措施和现况调查、病例对照研究一样,如调查员的选择与培训、制订调查员手册等,其目的都是提高资料的真实性。随访结束以后,也需要对原始资料逐项进行检查与核对,以提高原始资料的准确性、完整性。对不完整的资料要设法补齐;对重复的资料及时进行删除;对有明显错误的资料应进行重新调查修正或剔除。
四、资料整理与分析
随访结束后的原始资料一般通过软件(如EpiData 3.1)录入计算机,建立电子数据库,同样尽可能采用双录入,并进行核查,以确保数据的准确性。分析时一般先对资料做统计描述,即描述研究对象的组成及人口学特征、随访时间、结局及失访情况等,分析两组的可比性及资料的可靠性;然后再分别计算两组或多组结局的发生率,如发病率;最后进行统计推断,分析两组率的差异,获得暴露和结局的关联强度。
(一)率的计算与比较
结局事件的发生率计算是队列研究资料分析的关键,根据研究队列人群的稳定情况,可选择计算累积发病率(cumulative incidence)或者发病密度(incidence density)。
1.累积发病率
当研究人群的数量比较多,人口比较稳定,资料比较整齐时,无论其发病强度大小和观察时间长短,均可用观察开始时的人口数作分母,以整个观察期内的发病(或死亡)人数为分子,计算某病的累积发病率。累积发病率的量值变化范围为0~1,其流行病学意义有赖于对累积时间长度的说明。
(公式5-1)
2.发病密度
观察的人口不稳定,观察对象进入研究的时间先后不一,以及各种原因造成失访,研究对象出现终点结局的时间不同等原因均可造成每个对象被观察的时间不一样。此时以总人数为单位计算发病(死亡)率是不合理的,因为提早退出研究者若能坚持到随访期结束,则仍有发病可能。此时,需以观察人时(person time)即观察人数与观察时间的乘积为分母计算发病率。用人时为单位计算出来的率带有瞬时频率性质,即表示在一定时间内发生某病新病例的速率,称为发病密度,其变化范围是0~∞。最常用的人时单位是人年(person year),以此求出人年发病(死亡)率。关于人年的计算可参照有关书籍。
在队列研究中暴露组和非暴露组两组人群的发病率或死亡率比较需作统计学检验。当研究样本量较大, p和1 - p都不太小,如 npn(1 - p)均大于5时,样本率的频数分布近似正态分布,可采用U检验来检验两组之间率的差异。如果率比较低,样本较小时,可改用 χ 2检验。
(二)效应的估计
队列研究的最大优点就在于它可以直接计算出研究对象的结局发生率,因而能够直接计算出暴露组与对照组之间的率比和率差,即相对危险度与归因危险度等关联强度指标,从而可准确地评价暴露的效应。
根据统计分析的要求,队列研究的资料一般整理成表5-1模式。
表5-1 队列研究资料归纳整理表
a/n 1和c/n 0分别为暴露组和非暴露组的发病率,是统计分析的基础
1.相对危险度(relative risk,RR)
也叫危险比(risk ratio),是反映暴露与发病(死亡)关联强度的最常用的指标,其本质是率比(rate ratio)。
(公式5-2)
式中 I eI 0分别代表暴露组和非暴露组的发病或死亡率。RR表示暴露组发病或死亡的危险是非暴露组的多少倍。RR = 1表示两组的发病率或死亡率没有差别;RR > 1表示暴露组的发病率或死亡率高于非暴露组,则该暴露因素为危险因素;RR < 1表示暴露组的发病率或死亡率低于非暴露组,则该暴露因素为保护因素。RR值离1越远,表明暴露的效应越大,暴露与结局关联的强度越大。无论RR > 1或< 1,都应进行统计学检验。
考虑到抽样误差的存在,需计算其95%置信区间,一般采用Woolf法计算。Woolf法是建立在RR方差基础上的简单易行的方法。
(公式5-3)
lnRR的95%置信区间= lnRR ± 1.96 ,其反自然对数即为RR的95%置信区间。
2.归因危险度(attributable risk,AR)
又叫特异危险度、率差(rate difference,RD)和超额危险度(excess risk),是暴露组发病率与对照组发病率相差的绝对值,说明由于暴露因素增加或减少的发病率的大小,或理解为危险特异地归因于暴露因素的程度。
(公式5-4)
由于 ,I e= RR × I 0,所以AR = RR × I 0 - I 0= I 0(RR - 1)。
同样,归因危险度也是一个样本值,可以计算其95%置信区间。AR的95%置信区间为AR ± 1.96 ×
RR与AR都是表示关联强度的重要指标,彼此密切相关,但其公共卫生意义却不同。RR说明暴露者与非暴露者比较增加相应疾病危险的倍数,其结果是一个相对数,没有单位;AR则一般是对人群而言,暴露人群与非暴露人群比较,所增加的疾病发生数量,如果暴露因素消除,就可减少这个数量的疾病发生,其结果是一个绝对数,并且有单位。前者具有病因学的意义,后者更具有疾病预防和公共卫生学上的意义。以表5-2为例说明两者的区别,从RR看,吸烟对肺癌的作用较大,病因联系较强;从AR看,吸烟对心血管疾病的作用较大,预防所取得的社会效果将更大。
表5-2 吸烟者与非吸烟者死于不同疾病的RR与AR
引自:Lee,1982
3.归因危险度百分比(AR%)
又称为病因分值(etiologic fraction,EF),是指暴露人群中归因于暴露的发病或死亡部分占全部发病或死亡的百分比。
(公式5-5)
(公式5-6)
以表5-2为例计算肺癌的AR% = × 100% = 90.7%,说明吸烟者中发生的肺癌有90.7%归因于吸烟。
4.人群归因危险度(population attributable risk,PAR)与人群归因危险度百分比(PAR%)
人群归因危险度百分比也叫人群病因分值(population etiologic fraction,PEF)。PAR是指总人群发病率中归因于暴露的部分,而PAR%是指PAR占总人群全部发病(或死亡)的百分比。
RR和AR都说明暴露的生物学效应,即暴露的致病作用有多大;而PAR和PAR%则说明暴露对一个具体人群的危害程度,以及消除这个因素后可能使发病率或死亡率减少的程度,它既与RR和AR有关,又与人群中暴露者的比例有关。除非研究对象两组的暴露比例与人群中的恰好一致,否则,计算出来的AR、AR%与PAR和PAR%不一致。假设,I t代表全人群的率,I 0为非暴露组的率,则PAR和PAR%的计算式如下:
(公式5-7)
(公式5-8)
另外,PAR%亦可由下式计算:
(公式5-9)
式中P e表示人群中有某种暴露者的比例,从该式可看出PAR%与相对危险度及人群中暴露者的比例的关系。
例如表5-2中,已知非吸烟人群肺癌年死亡率为4.49/10万人年(I 0),全人群的肺癌年死亡率为28.36/10万人年(I t),则:
PAR = I t - I 0 = 28.36 - 4.49 = 23.87/10万人年
从计算结果可知,虽然吸烟导致肺癌的AR%达90.6%,但因人群中只有部分人吸烟,故其PAR%降至84.2%。
5.标化比
当研究对象数目较少,结局事件的发生率比较低时,无论观察的时间长或短,都不宜直接计算率。此时可以全人口的发病(死亡)率作为标准,计算出该观察人群的理论发病(死亡)人数,即预期发病(死亡)人数,再求观察人群中实际发病(死亡)人数与此预期发病人数之比,即得标化发病(死亡)比,同样可以说明暴露与疾病之间的关系。标化比指标最常用的为标化死亡比(standardized mortality ratio,SMR)。有时某单位的历年人口资料不能得到,而仅有死亡人数、原因、日期和年龄,则可改算标化比例死亡比(standardized proportional mortality ratio,SPMR)。其计算方法是以全人口中某病因死亡占全部死亡之比例乘以某单位实际全部死亡数而得出某病因的预期死亡数,然后计算实际死亡数与预期死亡数之比。
例如,已知某地区30~40岁年龄组居民有600名,某年内有4人死于冠心病,已知该年全人口30~40岁组冠心病的死亡率2.5‰,则:
(公式5-10)
已知O = 4,E = 600 × 2.5‰ = 1.5,则SMR = 4/1.5 = 2.67,即某地区30~40岁年龄组居民死于冠心病的危险是一般人群的2.67倍。
如果只知道该地区某年30~40岁年龄组居民死亡总数为100人,其中因冠心病死亡4人,全人口中该年30~40岁组冠心病死亡占全死因死亡的比例为1.5%,则:
同样可以说明某地区30~40岁年龄组居民冠心病死亡的危险为一般人群的2.67倍。
6.剂量反应关系的分析
如果某种暴露存在剂量反应关系,即暴露的剂量越大,其效应越大,则该种暴露为病因的可能性就增大。其分析方法是先计算出不同暴露水平下的发病率,然后以最低暴露水平组为对照,计算各暴露水平的相对危险度或率差,并对率的变化作趋势性检验。表5-3数据描述了进食毛蚶数量与甲型肝炎发病的关系,分析结果显示随着食用毛蚶量的增加,其患急性甲型肝炎的RR增大,说明存在剂量反应关系。
表5-3 食毛蚶数量与甲型肝炎发病关系
χ 2 = 202.52,P < 0.0001
五、偏倚及其控制
队列研究在设计、实施和资料分析等各个环节都有可能产生偏倚,如选择偏倚、信息偏倚和混杂偏倚。因此,在各阶段都应采取措施,预防和控制偏倚的产生。
(一)选择偏倚
如最初选定参加研究的对象中有人拒绝参加;历史性队列研究中部分档案丢失了或记录不全;研究对象由志愿者组成;抽样方法不正确等,均会导致选择偏倚。在队列研究的随访期内,总会有对象迁移、外出、死于非终点疾病或拒绝继续参加而退出队列,由此产生的偏倚称为失访偏倚(lost to follow-up),这是队列研究中不可避免的偏倚。由于失访在本质上是破坏了原有样本的代表性,因而本质上属于选择偏倚。
要减少选择偏倚首先需要严格按规定的标准选择对象;如果有志愿者加入,则与正常参加的人群进行比较,如两者在一些基本特征上没有差异,则可认为导致的选择偏倚很小。失访偏倚的防止主要靠尽可能提高研究对象的依从性,做好宣传解释工作。
(二)信息偏倚
信息偏倚常是由于使用的仪器不精确、询问技巧不佳、检验技术不熟练、医生诊断水平不高或标准不明确等,也可来源于记录错误等。
信息偏倚的防止主要是选择精确稳定的测量方法、校准仪器、严格实验操作规程、同等地对待每个研究对象、提高临床诊断技术、严格按规定执行随访等。
(三)混杂偏倚
队列研究过程中也会有混杂偏倚的发生,其中性别、年龄是最常见的混杂因素,其控制方法参加病例对照研究。