第一节 分子流行病学调查概述
分子流行病学是应用分子生物学的基本理论和技术,研究疾病或健康人群现象的科学。它从分子水平揭示影响疾病或健康分布的因素,为更有效地控制疾病和促进健康提供基因或分子水平的研究方法和防治手段。分子流行病学使传统的流行病学与分子生物学理论和技术有机地结合起来,既从群体水平又从分子或基因水平阐明疾病的病因、发病机制、流行规律,从而使流行病学的研究更加深入和精确。地中海贫血是一种单基因隐性遗传病,其最终的确诊和分型有赖于基因检测,因此需要采用分子流行病学的方法对地中海贫血的流行病学进行调查。
分子流行病学在地中海贫血相关研究中的应用,主要用于描述地中海贫血基因突变的三间分布情况、从基因水平揭示影响地中海贫血分布的因素、探索发现地中海贫血基因突变的新类型等,为有效地做好地中海贫血防控工作提供基因水平的科学依据。
一、明确调查目的
在设计调查方案时,首先要明确调查的目的,分析通过该项调查可能要发现或解决的问题。地中海贫血分子流行病学调查的主要目的有:
1.了解人群中地中海贫血基因的携带率、分布特点和趋势。
2.地中海贫血基因类型和新发突变的变迁和分布特点。
3.不同类型地中海贫血的分布特点及对健康和家庭、社会的影响。
4.检测技术和干预效果评估等。
二、选择调查方法
流行病学研究方法一般分为描述流行病学、分析流行病学和实验流行病学研究,分子流行病学调查方法是这些方法与分子生物学技术相结合而产生的流行病学调查方法,可以应用于描述性、分析性和实验性的流行病学调查。地中海贫血的分子流行病学调查,应根据调查目的和实际需要,结合流行病学研究的基本原理和方法,选择适当的方法。
1.描述流行病学 描述流行病学是通过调查、观察,了解所研究问题在研究人群中的分布情况的一类方法。通过这类研究可以把所研究问题在特定时间的频率及其分布特点展示出来。描述流行病学方法一般包括横断面研究、个案调查、暴发调查、公共卫生监测、生态学研究等。如若研究某人群中地中海贫血基因突变的分布情况,则可选择描述流行病学中的横断面研究方法。通过不同时间的横断面调查,可以了解地中海贫血分布和发生率的变化趋势。
2.分析流行病学 分析流行病学是研究疾病病因或危险因素,检验疾病病因假设的一类方法。根据描述流行病学研究或在工作实践中形成的假设,在样本人群中进行检验或验证。分析流行病学包括两类方法,即病例对照研究与队列研究。研究不同类型地中海贫血对儿童健康的影响、比较不同地区地中海贫血分布的差异等,均可采用分析流行病学方法。
3.实验流行病学 实验流行病学是通过人为控制研究因素而验证或证实假设的一类方法。此类方法由于人为地控制了研究因素,从而最大程度避免混杂因素的干扰,因此与描述性研究、分析性研究相比,其结果说服力更强,能够强有力地验证或证实各类假设。实验流行病学研究方法包括临床试验、现场试验、社区试验。对于地中海贫血预防控制项目效果的评价可以采用实验流行病学方法。
三、确定调查人群
应根据调查目的确定调查人群。在进行调查方案的设计时应注意明确所调查人群的纳入和排除标准,调查人群的选择应具有代表性,避免产生选择偏倚。如果调查的目的是早发现、早诊断、早治疗,则可选择高危人群;如果调查目的是确定某些相关因素与疾病的关联,则要选择这些因素的暴露人群;如果调查目的是获得疾病的三间分布资料或确定某些生理生化指标的参考值,则要选择具有代表性的患病人群;如果调查目的是评价疾病的防治措施的效果,则要选择已参与了该预防或治疗措施的人群作为被调查人群。
地中海贫血是一种单基因隐性遗传病,在不同地区、不同遗传背景的人群中,地中海贫血基因携带率、基因型分布等存在差异,且重型地中海贫血的胎儿和儿童死亡率高。因此,在进行地中海贫血分子流行病学调查时,要了解某地区的地中海贫血基因携带率,需要根据研究目的和可行性选择合适的调查对象。例如常住人群和户籍人群的选择;成人、育龄人群、孕产妇及儿童的选择等。
四、选择抽样方法
分子流行病学中常用的抽样方法有单纯随机抽样、整群抽样、系统抽样和分层抽样等。
1.单纯随机抽样 单纯随机抽样是最基本的抽样方法,也是其他抽样方法的基础,其特征是研究人群中的每一个个体都有同等的机会被抽中,成为研究的对象。单纯随机抽样一般是先将被研究的对象编号,再用随机数字表或抽签、摸球、计算机抽取等方法进行抽样。如果抽取的样本量不大,可采用抽签的方式进行抽样;如果样本量较大,可用随机数字表或利用计算机提供的随机数进行抽样。
2.整群抽样 整群抽样所抽到的对象不是个体,而是由个体所组成的集体(即群体),如村、车间、班级、居民小组等。这些群体是从相同类型的群体中随机抽取出来的,抽取到的对象包括被抽到单位的所有成员都是研究对象。这种抽样方法要求群体内的变异要和总体的变异相等,群组间的变异越小越好,这样群体才能更好地反映总体。
3.系统抽样 系统抽样是按照一定顺序,机械地每隔一定数量单位抽取一个样本,又称间隔抽样或机械抽样。它是在随机抽样的基础上进行的,即要求每次抽样的起点必须是随机的。
4.分层抽样 分层抽样是指先将研究对象按某些主要特征(如性别、年龄、职业等)分为几层,然后再在各层中进行随机抽样,以保证了各层在重要的影响因素方面取得均衡。分层随机抽样分为两类:一类为等比例分层随机抽样,即各层内抽样比例相同;另一类为最优分层随机抽样,即按照一定的要求,各层内抽样比例不同。
为了尽量降低抽样误差对研究结果代表性的影响,在研究中应尽量综合使用上述几种抽样方法,以弥补单独使用某种抽样方法的漏洞,即多级抽样方法。例如研究某省户籍人口地中海贫血基因携带情况,可采用多级抽样方法:首先在该省的各个地级市分别随机抽取一个或几个区县,其次在抽样区县中随机抽取若干街道或乡镇,再在抽样街道或乡镇中随机抽取若干居委或村,最后根据样本量的要求,可以以抽样居委或村的所有户籍人口为研究对象,或进一步在抽样居委或村中采取单纯随机、整群、系统或分层抽样方法抽取研究对象。
五、估计样本含量
样本含量即观察例数的多少,又称样本大小。在保证研究结论具有一定可靠性(精度和检验效能)的前提下,常需要在设计阶段就准确估计最少的样本数量。样本含量过小,所得指标不稳定,用以推断总体的精密度和准确度较差,检验功效较低,特异性较差,难以获得正确的研究结果,结论缺乏充分依据。然而,样本含量过大,会增加实际工作的困难,浪费人力、物力和时间,且由于过分地追求样本含量,可能会引入更多的混杂因素,从而影响数据的质量。影响样本含量估计的因素主要包括:
1.第一类错误概率的大小α 也称检验水准,α越小所需样本含量越多。
2.检验功效(1-β)或第二类错误概率的大小β 检验功效愈大,第二类错误的概率愈小,所需样本含量愈多。一般要求检验功效在0.8及以上。
3.容许误差δ 容许误差δ愈大,所需样本含量愈小。
4.总体标准差σ或总体概率π σ反映资料的变异度。σ愈大,所需样本含量自然愈多。总体概率π越近于0.50,则所需样本含量愈多。
若研究者无法得到总体参数,可通过预试验来估计,也可用样本统计量来代替总体参数,其中δ还可根据专业知识由各专业的专家确定有专业意义的差值。
不同设计类型的研究可用相应的公式估算样本量,如对于横断面研究设计的计数资料,应用下列公式估计样本量:
n=t2pq/δ2
其中,p为总体率的估计值,如果p有若干个估计值可供参考时,应取接近0.5者,以使n的估计值不致偏低;q=1-p; t为与所定义α水平相当的t值,如t0.05=1.96; δ为允许误差。此计算公式仅适用于呈两项分布性质的资料,当拟调查的疾病患病率或某指标的阳性率大小适中时适用。当所调查的患病率或阳性率偏向两侧,即较低或较高时,可用下式估计样本量:
n=[57.3uα/arc sin(δ/ p(1-p))]2
其中,uα为与α值相应的u值;arc sin为取反正弦;δ为允许误差;p为总体率的估计值。例如地中海贫血基因携带率的分子流行病学调查,估计样本量时应采用第二个公式。
六、选择客观准确的测定指标
分子流行病学调查中所选择的各种测定指标必须具有客观性、稳定性和代表性,并且容易检测到。测定指标的选择是否恰当,直接决定研究的成败。测定指标选择的一般原则为:
1.测定指标应特异、稳定。
2.标本采集、储存方便。
3.检测方法比较简单、实用,而且操作规范,便于与同类研究结果比较。
4.检测方法灵敏度和特异度高。
对于地中海贫血基因的分子流行病学调查,选择的测定指标应是α、β地中海贫血基因,根据调查目的,可选择检测所有α、β地中海贫血基因突变类型,或选择检测调查地区常见的地中海贫血基因突变类型,并对罕见突变类型予以报告。
七、选择科学的测定方法
根据测定指标,结合实验室条件合理选择简便快速、成熟可靠、灵敏度和特异度高、被公认的测定方法。应用新的测定方法时,应注意所得结果与其他方法所得结果的可比性。还应明确选择是进行数值测量或分类测量。
对于地中海贫血基因的分子流行病学调查,目前常用的测定α、β地中海贫血基因的方法包括:GaP-PCR、反向斑点杂交(RDB)、液态基因芯片、基因测序等。地中海贫血基因检测方法可参考本书第四章内容。
八、质量控制
质量控制是分子流行病学研究设计中的一个重要部分,它直接关系到所得结果的准确性、可靠性和科学性。
1.一般性实验质量控制
(1)确定标本采集方案:包括采集部位、时间及方法,标本采集后的储存问题等。
(2)药品和试剂的选择:同一测定指标最好使用同一批号的药品和试剂,更换批号时应进行对比和标准化。
(3)实验方法的确定:对于同一种生物标志的测定要用统一的方法。
(4)仪器设备的确定:如无特殊情况,不要更换设备,调校后一般不应重新调校。
(5)操作规范化:每一实验步骤都要规范化,保证同一操作者或操作者之间的可重复性。
2.设立多种对照 实验开始前就应设立好对照,一般应设以下对照:
(1)标准对照(阳性对照):是指含有待测或某种生物标志,并已知其含量的生物标本。
(2)空白对照(阴性对照):是指不含待测或某种生物标志的生物标本。
(3)重复对照(相关对照):是指来源于同一份待测生物标本具有不同编号的多份生物标本或与待测生物标本有关系的生物标本。
3.预实验 正式实验开始前应进行预实验,确保所用方法的可重复性。一般包括本实验室内和实验室之间不同操作者之间的交叉重复实验等。
4.误差、偏倚的控制 导致误差、偏倚的因素很多,主要包括:
(1)检测者本身、试剂、药品、材料、仪器等。
(2)同一受检者的生理生化变化。
(3)人群中的生物遗传学差异等方面。
应针对具体环节制定详细的质控方法。
九、分析与总结
在研究设计中要预测研究结果,事先确定明确的资料统计分析方法,并拟定资料总结、分析与报告的详细计划。如地中海贫血基因的分子流行病学研究,通常采用的是描述性统计分析方法,分析和总结报告中应包括研究人群中地中海贫血基因突变情况、地中海贫血基因突变的三间分布情况(时间、地点、人群)以及地中海贫血基因型分布构成情况等。