第三节 职业流行病学的病例-对照研究
近年来文献中职业流行病学调查应用病例-对照研究(case-control studies,代号C-C.S以下同)方法的报告越来越多了。C-C.S也称回顾性调查。根据多年来的实践它是一种有效的方法,如能正确使用,工作中加强质量控制,合理地评价其结果,可对职业流行病学的病因研究提供重要线索,有时甚或对管理决策起到决定性影响的作用。然而多数C-C.S结果是其他观察研究的前导或补充,常需用前瞻性或实验研究进一步验证。
一、病例-对照研究的实施
确定病例应规定诊断标准及诊断条件。病例诊断标准的统一有利于不同研究结果相互比较。病例最好是病因学上同源的,肺癌的鳞癌与腺癌应分别研究,细胞分化程度、病期、部位尽可能一致,这种纯化的病例有利于病因分析。最好用新病例,因其发病时间与病因暴露更接近,回忆较可靠。新病例的各种特征如吸烟、饮食习惯等容易保持其本来面目,新病例尚未受到决定其生存因素的影响。在一个固定人群选用全部新病例,经过一定时期可估计发病率。新病例的C-C.S虽是用得最多的,但这种方法较难实用于职业流行病学研究,主要因为接触特定职业危害的人群小,限定时期内发生的新病例数很难满足观察数量的要求。累积发病的C-C.S是从过去某一时刻开始到研究时间为止的一个时间过程中累积发生的病例。应用累积发病例进行CC.S必然涉及到调查已死亡的病例。职业流行病学研究应用累积发病的CC.S方法,优越性在于所观察的主要暴露因素(职业接触)常是有据可查的。如研究接触苯与白血病的关系,白血病病例(或已死亡)还可通过用人单位记录查清他接触苯的工种岗位及接触期限。但对非职业性因素,如营养或生活条件,当病例去世后再追问其亲属则可靠性差。对用人单位劳动者只要有职业史记录及作业场所职业病危害因素的监测资料就可进行累积发病的CC.S。患病率的C-C.S一般不用,因为已死亡的不调查,存活的与已死亡的病例,可能由于其因素分布不同而产生偏倚。在职业医学中如所研究的是非致命性病症,如铅吸收、白内障、神经精神障碍等与职业接触的关系,尤其当与生活因素交织在一起时,更适于进行患病类型的C-C.S。
可根据选取对照的方式与比数的不同,分为以下几种类型:
1.成组比较 按与病例特征相同或相似的原则,取主要混杂因素,如性别相同、年龄差不超过两岁等原则,选取病例数相应的对照数。尽量选取同源对象,如年龄都是45~59岁之间的,若范围再大则需分层(按年龄分层的)分析。
2.配对比较 有①1∶1配对;②1∶2配比;③1∶R配比;④1∶R对照数不固定的配比(R代表1或2、3、4等)。配对的目的是为了调整外部变量的效应。一般是一个病例配一个对照(1∶1配对)。当病例数量有限或病例组获取资料的代价与对照组相差悬殊,对照数可增至2或3,一个病例最多可配4例对照,对照再多其统计效率增加甚微,得不偿失。在一个有限群体(如职业队列)内病例很宝贵,而有些病例的对照也很难得,当本应1∶4配比时,有的病例配不足4例对照,只能配到两例甚至仅一例,如按1∶4固定对照数的配比设计,这些有限的宝贵病例只好舍弃。1∶R对照数不固定的配比设计可以避免舍弃这些病例,全部资料都可利用,虽然统计分析繁琐,有计算机也不难解决。
认为配对就是要求病例和对照除所研究因素之外,其他方面均应保持一致,这是误解。最佳方案应是仅以确定的混杂因素来配对,以提高统计分析效率。以非混杂变量作为条件来配对,可能会低估所研究的效应,这称配对过度(over-matching),不但无益反会有害,应注意避免。对照的来源应与病例相适应,以所研究的问题及实施的现场而定。目前多主张同时选用两类或多种类的对照,如从医院中选,同时从居民区选,或从用人单位车间选,病例分别同各种对照比较,其结果的一致性趋向,就更增加了结论的可靠性。
需保证资料的确实性与可靠性。可经调查员询问,自填调查表,查阅病史或用人单位记录资料。病例与对照最好同时调查,接受调查的环境应相同。调查员应事先培训。提倡用 “盲法”收集资料。调查结果每次都应经过审核,调查情况可抽样复核,可用录音带检查调查员的调查质量。
收集劳动者的终生职业史,不同时期的职业变动,曾接触过哪些职业危害,主要暴露是什么,总暴露期限,其中平均暴露强度,高峰暴露强度,首次接触的日期及年龄。应考虑到工作场所职业病危害因素的环境浓度是否能代表工人实际吸入、消化吸收了的危害物质实际剂量(即内剂量或生物效应剂量)。表达劳动者的职业暴露以生物监测指标比环境浓度好。研究发现疾病与职业接触有联系时,要考虑可能的偏倚与混杂影响。当未发现两者有联系也应考虑,这可以是意味着本来并不存在的联系,但也可能是观察与监测方法太差,以致不足以反映出实际存在的联系。
调查的样本大小应兼顾统计学的准确性和实际可行性。成组比较的CC.S,病例与对照数相等时可按表5估计所需调查的近似人数。
例如吸烟与膀胱癌的C-C.S样本量的估计。参考过去资料,相对危险度(RR)约为3,人群吸烟的比例40%(P0=0.4),查表1-5为71,即病例与对照各需调查71例以上。
对照例数增多可相应减少病例观察数,配对及配比的研究样本量的估计也有表可查,也可用公式计算,请参考有关专著。
二、病例-对服研究的资料分析
1.暴露因素与疾病是否有联系,用χ2或U检验判断所观察的比值比是否有显著意义。
2.联系的强度:应以相对危险度(RR)表示,实际是用比值比(OR)作为相对危险度的近似估计。
3.OR值的95%可信区间:比值比除点估计之外,需补以该观测值的变异性估计。95%可信区间这个数值范围表示总体参数值有95%机会落入这数值范围之内。以不分层的吸烟与肺癌的C-C.S资料分析为例,见表1-6。
按校正χ2计算:χ2=18.63,P<0.01,说明吸烟与肺癌的联系非常显著。比值比。这表明吸烟者发生肺癌的危险性为非吸烟者的三倍多。比值比的标准误SE按下式计算:,表1-6资料SE=0.2732,比值比的95%可信区间用下式计算:ORe(±1.96SE)本例e(±1.96×0.2732)=0.5854~1.7083。本例的95%可信区间为3.18×0.5854~3.18×1.7083即1.86~5.43。
前部分是不分层的简单分析。许多情况还应考虑年龄、性别、职业等的影响。为消除这些外部因素的影响,可根据协变量水平将资料分成亚组,应用Mantel-Haenzel方法计算总的OR,公式:
分成资料的显著性检验用下式:
以上两式中i为协变量的层,I为合计层数。其他符号见表1-6。分层资料OR值的95%可信区间用下式计算:
以儿童出生前(孕期)辐射暴露与儿童白血病的关系,其分层分析资料见表1-7。
选取100例儿童白血病,以200例非白血病儿童为对照,调查其出生前母亲职业性辐射暴露之有无。其粗比值比。按其母亲受产次影响,把粗资料分成两个水平,即初产与多产。为比较产次水平效应的一致性,计算各层别的比值比1.08,可见两层的效应一致性很好。这样可求总的比值比,带入(1)式ORM-H=1.08,这表达了将母亲产次影响去除之后,胎期辐射使儿童白血病的危险性增加8%,这比粗OR值(1.48)小,其差别归因于母亲产次的混杂作用。此混杂作用扩大了未分层资料中联系的效应。总比值比的显著性检验用(2)式,代入得,P>0.8。说明差别不显著。总比值比95%可信区间,,这个区间包括1,也说明比值比的点估计没有统计显著性,与检验结果是一致的。
配对或配比资料不应拆开对子按例数分析,应该按对子数或配比组数进行配对或配比资料的分析。1∶1配对资料的分析见下节实例分析,其他复杂的配比资料分析及C-C.S资料的多因素分析方法等可参考有关专著。
三、职业流行病学病例-对照研究的一个实例
我国的职业肿瘤流行病学调查,为验证苯导致白血病的病因学联系,考虑到白血病的发病率与死亡率均极低,故采用C-C.S。病例的选取是在浙、蜀、沪和黑龙江四个省市分别各在1或2个市级医院调查1972~1981年,10年间18岁以上本地职工死于白血病的全部病例。对照是从同一医院为每例白血病选配一例非白血病的内科死亡病例(1∶1配对)。配对条件是:同性别,年龄相差7岁以内,死亡时间在病例死亡的一年之内的本地职工。获得的资料如表1-8:
配对调查共255对,(a)代表病例及对照都是有接触苯的历史,这样的对子共三对。(c)代表白血病病例无接触苯史,而对照却有接苯史,这样的对子共5对,余类推。其OR值估计如下:,这表明接触苯的职工患白血病的危险性为无接苯史者的3.4倍。,df=1,P<0.05。这说明接触苯与白血病的联系有显著性。OR值的95%可信区间用公式:计算。但本例因为所观察到接触史不同的对子数较少,故变异性较大,可信区间较宽,不适于用此公式计算(注:参考计算方法,见下一段附注)。这项研究如只在少数苯作业工厂观察短时间难以获得结果。可见职业流行病学研究也可在社会人群或社会上的大医院去进行,并不只限于在用人单位或其医院中进行。
附注:苯与白血病OR值的95%可信区间的计算应该用公式:
ORL(下限)=b/[(c+1)Fα(2c+2,2b)]
ORU(上限)=[(b+1)Fα(2b+2,2c)]/c
本例b=17,c=5,Fα()内为F分布的两个自由度,需查方差齐性检验所用的F值表。结果ORL=1.25,ORU=7.70。
四、病例-对照研究的利弊
职业流行病学的病例-对照研究,在短时期内就能获得成果,不需长期追踪观察,从人力、物力和时间上来考虑优于其他任何流行病学的调查研究方法。这些优点随着病例越是罕见的病,其优越性就更突出。在职业卫生研究中,可把用人单位甚或一定领域内的某种行业当作一个定群,C-C.S可在这样的封闭人群中进行,可称巢式C-C.S(Nested C-C.S),或称队列内C-C.S(C-C.S Within Cohort)。研究某公司橡胶工人死亡率,发现淋巴肉瘤及白血病死亡超高。为研究其与职业接触的关系,如用回顾性定群研究方法需对6678名男工全部调查。审核全部队列内劳动者的职业史,工作太繁杂。改用队列内C-C.S:对88名淋巴肉瘤及白血病病例,及按年龄、种族、性别和厂别在用人单位成员中选取1∶4配比的对照352名。重点整理分析这440人的各种职业危害接触史。结果发现接触有机溶剂与白血病和淋巴瘤有明显联系。这个结果与回顾性队列研究(整理分析6678名工人的溶剂接触史资料)的结论是一致的。巢式的C-C.S优越性还可在队列研究无法执行的情况下更进一步体会到。
C-C.S可以同时考虑一连串的因素,如几十项甚或上百项的可疑因素与疾病的联系,这在队列研究无法做到。C-C.S可以分析暴露随时间而变化的复杂情况,例如职业性毒物种类的变化及其浓度的变化,吸烟行为的变化,用量的变化等。对潜隐期长的病,可将其开始暴露一直到发病的终生职业接触史详细整理分析,而队列研究常因工作量太大,以致无法办到。
C-C.S的主要弊端在于调查过程中产生偏倚机会较多。选择合适的对照有时相当困难。只能限于单一病种或状态的调查研究,这也是一种缺陷。职业危害因素常不只引起一种机体危害,有的甚至全身各系统都有影响。一种职业致癌物可引起多种部位肿瘤,如氯乙烯。从这方面看来C-C.S难以满足对职业因素危害性的全面评价。C-C.S常不能确切地计算出真正的相对危险度,尤其更难可靠地估算出归因危险度,虽然可用间接的办法推算,但要求对照组作为样本对人群需有充分的代表性,从该点上考虑,C-C.S较难满足深入分析的要求。
虽有上述某些缺点,对罕见病和潜隐期长的病,所假定的暴露因素又易于随时间而变的,以选用C-C.S方法进行研究最为有利。在职业卫生研究中,选用流行病学方法时,应想到还有一种C-C.S方法。尽管它有某些缺点,但仍不失为经济有效而又现实可行的方法。