分子流行病学和分子进化流行病学
上QQ阅读APP看书,第一时间看更新

第二节 生物学标志的分类

从生物学标志定义可看出,生物学标志涵盖范围很广,并随着现代检测技术的发展不断增加。生物学标志的种类很多,分类方法各异。
FDA-NIH Biomarker Working Group(2018年)根据不同的应用功能,可将其分为:诊断生物学标志(diagnostic biomarker),监测生物学标志(monitoring biomarker),药效/反应生物学标志(pharmacodynamic/response biomarker),预测生物学标志(predictive biomarker),预后生物学标志(prognostic biomarker),合理可行替代终点(reasonably likely surrogate endpoint),安全评价生物学标志(safety biomarker),易感性/风险生物学标志(susceptibility/risk biomarker)。从生物学标志的自然属性的角度,则可将其分为核酸(DNA、RNA)类、蛋白质、糖及其衍生物类等。
分子流行病学研究中生物学标志依据1989年美国国家科学院(NAS)分类,按从暴露到疾病进程中出现的不同阶段分为三类:暴露生物学标志(exposure biomarker),简称暴露标志(exposure marker, M exp);效应生物学标志(effect biomarker),简称效应标志(effect marker, M eff);易感性生物学标志(susceptibility biomarker),简称易感性标志(susceptibility marker, M sus)。其中,易感性生物学标志可以影响从暴露到疾病发生、发展及预后进程中的每一个环节(图2-1)。本文着重从分子流行病学中的生物学标志分类一一陈述。
图2-1 分子流行病学研究中生物学标志的分类
一、暴露标志
“暴露”是指“接触”某种因素或具有某种特征,有外暴露和内暴露,涉及界面、强度、持续时间、透过界面的途径、速度及透过量、吸收量等内容。暴露研究最初曾应用于探究职业病危险因素。暴露的三个途径为呼吸、饮食和皮肤,暴露量与生物有效暴露量密切相关,可用支持暴露-效应曲线和/或剂量-效应曲线表示。在空气污染与健康效应研究中,与暴露量相比,生物有效暴露量能更好地反映室内外空气重污染物与健康效应的关系。近十余年来暴露学科发展迅速,已经发展成为暴露科学。面对环境因素可能是很多人类疾病重要影响因素的现实,人们还难以模拟一个人一生所有环境暴露的问题,Wild于2005年首次提出暴露组(exposome)的概念,目的是引起科学家的重视,强调暴露评价在病因学研究中的作用。应特别强调的是,此处的暴露组与传统上的与“对照组”对应的“暴露组”概念是截然不同的。2012年Wild发文细化暴露组学的内涵,指出暴露组是从受精卵开始,贯穿整个人生的环境和职业暴露(包括生活方式等因素);暴露源包括外源(污染、辐射、饮食等)和内源(炎症、感染、微生物等),还包括对化学性、物理性、生物性等应激物的暴露,其具备三个基本特征:①贯穿人的一生;②探究混合暴露影响;③强调环境因素。
暴露标志是指能反映暴露因素与疾病或健康状态相关联的生物学标志,主要包括外暴露标志(external exposure biomarker)、内暴露标志(internal exposure biomarker)和生物有效暴露标志(biologically effective biomarker)三种。
1.外暴露标志
指机体暴露于某一类有害物质的总量,是暴露因素进入机体之前的标志和剂量,一般用暴露总量来权衡人体受到的环境影响和危害,暴露因素可以分为生物性的和非生物性的。生物性因素主要有细菌、病毒、寄生虫、毒素等,其外暴露标志可以是生物性因素的分型/分类、剂量等,主要用于病原体的进化规律、传播途径判别、传染源追溯的分子流行病学研究。非生物性暴露因素主要包括物理、化学、社会的因素等,如烟草使用过程中烟雾的浓度、环境有害物质的浓度或化学物质的含量等;生活在电子垃圾拆卸区居民通过灰尘暴露多氯联苯(PCBs);人体暴露灰尘中的污染物与人体的年龄、社会角色及生活习性息息相关,比如中国人群通过居室灰尘暴露邻苯二甲酸二酯仅占总暴露量的2%~5%,而美国人群却通过灰尘摄入此类污染物占总暴露量的10%~60%,这些外暴露标志为进一步分析内暴露标志及早期效应标志的研究提供直接证据。
2.内暴露标志
指机体暴露于上述生物性的和非生物性的因素后,其体内可测量到的外源性物质(如某种化学物质)或其代谢产物,或暴露物质与体内物质相互作用的产物标志,是外源性物质进入机体内的可靠生物学证据,又称体内剂量(internal dose)。体内剂量是在某时点上经各种途径吸收进入体内并经历一定的代谢过程后达到平衡时的暴露物质的量,它可能受到与吸收及代谢有关的各种因素的影响。因此,内暴露标志比外暴露标志能更好地反映个体体内暴露物质的负荷。内暴露标志暴露剂量的检测可以是定性测定,也可以是定量测量。越来越多的具有良好精确性和可靠性的内暴露标志用于分子流行病学研究中,在暴露的精确测量及其与疾病关系的研究中发挥着越来越重要的作用。
体内可测到未改变的外源性物质,如尿铅;也可测到外源性物质的代谢产物,如烟草中尼古丁(nicotine)的代谢产物尿中的可替宁(cotinine)(表2-1)。如果能用某种实验室分析技术从体内生物材料中测量出来一种外源性物质,那么这种检测物就是内暴露标志,它表示被人体吸收的外源性暴露物质进入体内后产生内暴露标志的过程是机体参与外源性物质相互作用的过程,内暴露标志经常采用半衰期、药峰浓度或累积剂量等药代动力学参数表示,了解这些参数不仅能对体内剂量作出较为准确的估计,对理解其作用方式和确定其检测时间都有一定意义。某种物质进入体内后半衰期长者,作用时间长,在暴露后较长的时间内均可以检测到该种标志。同一种标志在体内不同生物材料中半衰期可能不同,应充分注意,卤化烃可在脂肪组织中蓄积,检出的体内剂量标志代表累积剂量。头发、指甲中的微量元素半衰期也较长。因此,在研究设计时需要考虑从暴露到机体内暴露标志出现和持续的时间、代谢过程和参与因素及代谢产物存续的时间等。
外暴露标志与内暴露标志剂量是有区别的,外暴露标志的剂量是指宿主所处环境中的某物质浓度和强度,外暴露剂量是通过环境监测来估计。当然,对个体监测、询问调查以及数学模型技术等也用于外暴露剂量的估计,如空气PM2.5及PM10个体采样器可监测个体暴露剂量,也可用反距离加权法或其他方法通过监测点PM2.5及PM10浓度等参数估算个体暴露剂量。
表2-1 体内剂量标志
3.生物有效暴露标志
指外源性物质进入体内后经吸收、代谢活化、转运等过程,最终与靶组织细胞内DNA或蛋白质相互作用的外源性物质或其反应产物的标志,又称生物有效剂量(biologically effective dose)标志(表2-2)。这些标志能在靶组织内测到,也可能在其周围组织中检出,如暴露于苯并[a]芘(benzo[a]pyrene, BaP)后,在淋巴细胞中能检测到特异的DNA加合物或加成物(adduct, addition product),显然它是比体内剂量更具说服力的暴露标志,这种标志不仅可从靶细胞及其周围组织中测量到,有时也可能从血细胞中检测到。
表2-2 生物有效暴露标志
近年来蛋白加合物作为生物学标志的研究也备受关注。研究较多的有外周血中的血红蛋白(Hb)加合物和白蛋白(Alb)加合物,它们可作为DNA加合物的替代物,且作为剂量指示剂不受DNA修复的影响,而且Hb和Alb在血中含量丰富、易于分离提取,如二氢二醇环氧苯并[a]芘-白蛋白(7,8-dihydroxy benzo(a)pyrene-9,10-oxide, BPDE-Alb)加合物。由于加合物的形成意味着疾病或事件的开始,因此,DNA和蛋白质加合物的研究受到格外关注。
但目前对生物学有效剂量标志的检测尚有其局限性,首先,不能完全明确加合物的特异来源,例如虽然测量到DNA苯并[a]芘的加合物,并表明是BaP与DNA产生的特异加合物,然而由于外环境中BaP的普遍存在,因此就不能准确反映这种加合物形成与特异性暴露之间关系。相反,甲基溴与血红蛋白虽然产生的是非特异性的血红蛋白甲基加合物,但它可说明职业暴露的存在,因为非职业暴露的甲基加合物的本底水平非常低。其次,疾病的发生还与体内体外很多其他致病因素有关,如与体内代谢过程,细胞修复功能等有关,因此应尽可能确定每种加合物的类型及其定位的细胞类型、染色体上结合的位点等,而这种工作的难度很大。再次,需要找到靶组织的替代物,因为发病靶组织往往不易得到,大多只能用血细胞作为其替代物,但能否替代还需进行这方面的研究,如吸烟者支气管细胞有特异性的苯并[a]芘DNA加合物,但白细胞能否作为支气管细胞的替代物尚在研究中。此外,检测结果一般仅能反映过去数月内对该致癌物的暴露,而无法代表过去数年甚至数十年的暴露水平。
二、效应标志
机体暴露外源性物质后产生结构性或功能性变化,并与疾病启动、发生、发展过程相关的生物学标志,包括早期生物效应(early biological effect)标志、结构和/或功能改变(altered structure and function)标志及疾病(clinical disease)标志。
1.早期生物学效应标志
由于结合到靶细胞上的外源性物质的持续作用,引起组织与细胞的生物学或生物化学的变化,从而产生疾病前期的生物学标志,称早期生物学效应标志。早期生物学效应标志可以用于研究暴露因素强度与作用机制的关系。这些标志主要包括,细胞毒性反应,染色体畸变、核酸(DNA、RNA)或蛋白质结构变化或表达异常、细胞功能的早期变化(DNA修复,RNA调控功能的改变)等,表2-3列举了一些早期生物学效应标志。有些外源性物质暴露导致的早期生物学效应主要发生在细胞特定部位,尤其在基因的某些特定序列。例如,吸烟导致食管癌组织抑癌基因 TP53序列上的一些特殊部位发生G到T的突变而使其失活;长期砷暴露,导致活性氧增多和抗氧化能力降低,持续诱发氧化应激造成健康危害,同时砷暴露还会引起人淋巴细胞中姊妹染色体单体交换(sister chromatid exchanges, SCEs)频率增高和染色体畸变(chromosomal aberrations, CAs)。此外, CDKN2A基因启动子区域甲基化水平的改变是肺癌、胃癌、结肠癌等常见肿瘤的早期生物学效应标志,而 RASSFlA基因启动子区域的高甲基化水平可作为乳腺癌早期生物学效应标志。染色体的改变可能影响到邻近染色体断裂或重接位点的遗传物质,引起基因自身或其产物的变化,从而导致疾病的发生。抑癌基因启动子区异常高甲基化导致抑癌基因失活与癌变发生及进展密切相关。早期生物学效应标志代表细胞或组织中的比较稳定的变化,持续的时间更长,它与生物有效暴露标志不同,在这一类标记中出现较多的是细胞遗传标记。
表2-3 早期生物学效应标志
早期生物效应标志的检测多选择容易获得的生物材料,如外周血已成为检测早期效应标志的主要来源(红细胞、白细胞、血浆、血清、DNA及RNA等)。此外,其他一些组织来源,如皮肤、宫颈和结肠组织切片、表皮组织刮片或痰液中的上皮细胞等,均可用于早期生物学效应标志的检测。
从理论上推测,外周血液、体液中检测得到的早期生物学效应标志和机体内部特定靶器官的生物学效应标志与体内剂量标志之间存在一定的关联,因此从血液、体液中检测早期生物学效应标志已成为分子流行病学研究中重要的手段。
2.结构和/或功能改变标志
指自暴露到疾病发生前的可以测量或评估的分子标志,这些改变更接近观察终点,它代表疾病的亚临床阶段(表2-4)或者它本身就是疾病的表现,这一类标志常常是为了疾病筛检而提出的。比如,心肌梗死、脑血管病和脑卒中的早期动脉粥样硬化,通过影像学技术测定血管结构和功能改变,识别早期亚临床动脉硬化的个体。再如,肿瘤发生前的癌前病变,通过局部组织或细胞中可以检测到癌基因或抑癌基因产物结构或功能的改变。随着试验技术发展,目前通过增殖试验、凋亡试验和细胞分析等反映细胞周期调控早期事件的试验方法研究,可发现和识别一些更早期的病变。结构和/或功能改变标志的检测通常使用来自于靶器官的组织。
3.疾病标志
指疾病发生后特有的分子生物学标志,这些分子标志对于推断发病机制、疾病早期筛查、临床诊断以及作为疾病分期、选择临床治疗方案、评价治疗效果以及预测疾病预后有着重要参考价值(表2-4)。目前,多种标志物已应用到临床作为肿瘤及其他疾病辅助诊断指标,如甲胎蛋白(alpha fetoprotein, AFP),癌胚抗原(carcinoembryonic antigen, CEA)和各种肿瘤特异抗原[前列腺特异性抗原(prostate specific antigen, PSA)]已被作为不同部位癌症的早期诊断标记。很多肿瘤特异性抗原在监测癌症复发、估计预后和提示肿瘤发展程度等方面很有用,但目前很多疾病的临床疾病生物学标志的灵敏度和特异度不够高,主要用于辅助诊断,不能作为临床疾病诊断的主要依据。随着分子生物学标志研究的发展,新技术层出不穷,高灵敏度和特异度的分子水平标志物的检测成为可能。Petricoin等报道,利用飞行时间质谱技术发现特异性低分子肽,灵敏度和特异性都在95%以上,对诊断卵巢癌有重要意义。但是疾病标志能否作为疾病的筛查、临床诊断及治疗方案选择,疾病预后评估,还需在群体水平上进行分子流行病学研究验证。
表2-4 亚临床疾病的生物学标志
三、易感性标志
易感性标志是指机体在暴露因素作用下,对疾病发生、发展易感程度的生物学标志。机体的易感性标志可以包括遗传易感性和非遗传易感性。遗传易感性是指机体遗传背景差异所导致的不同个体对同一疾病易感程度,即遗传背景差异对疾病发生发展的影响,是决定暴露到疾病发生、发展、预后整个进程的重要因素,包括疾病发生的可能性大小,疾病发展进程中的临床类型、病程、治疗效果、预后等。近年遗传易感性的研究受到更多的关注。非遗传易感性可以影响机体对疾病的易感性,但其不是遗传因素导致疾病易感性升高,而是生命过程中形成的或经历的一些特征或因素,包括年龄、行为、生活方式、心理精神状态、环境暴露、既往病史等,其特点是可以随时间变化而改变的。
遗传易感性生物学标志是与遗传相关的生物学标志,是机体稳定存在的可测量的指标,遗传易感性影响着进入体内的有害物质代谢特点、生物有效剂量大小、早期生物效应及结构功能改变状态、临床疾病的发生和疾病预后的不同结局或类型等。遗传易感性与暴露至疾病发生的整个过程的每一个环节均有关系(见图2-1),是决定暴露至发病整个进程的重要因素,也成为分子流行病学研究的重要内容。近年有关疾病遗传易感性的研究精彩纷呈,试图破解人类基因图谱中极低比例的差异,如何形成疾病发病风险千差万别的原因,但挑战的艰巨性可想而知。遗传易感性可以是机体某个基因型的改变,如基因的野生型,突变型或某个基因片段的缺失、插入或是基因拷贝数变异、单核苷酸多态性等,也可能是基因的变异并不存在,但维持甲基化模式酶的调节失控和正常非甲基化CpG岛的高甲基化,以往的研究证明启动子区的高甲基化导致抑癌基因失活是人类肿瘤所具有的共同特征之一,与多种肿瘤的发生或预后相关。遗传易感性生物学标志的研究对疾病发病机制探索、易感人群(高危人群)划定、防制措施制定、临床诊治及预后具有深远的意义,对精准医学的多层面问题产生深远影响。传统流行病学研究表明,在相同的环境暴露下,具有不同某种遗传特征的人群对疾病的易感性存在差异。
目前,疾病易感性的研究主要集中于遗传易感性,随着组学技术的进展,如人类基因组计划、环境基因组计划的完成以及代谢组学、表观组学等研究的进展,越来越多的遗传易感性生物学标志被发现,这些研究揭示了基因的改变及功能学的改变影响着机体的生物学功能,如细胞分化、细胞凋亡、细胞周期调控以及DNA修复等,从而形成一系列疾病或异常健康现象的出现。如吸烟与肺癌易感性的研究已经进行多年,早期的研究表明在吸烟量相似的吸烟者群体中,作为生物学有效剂量标志的苯并[a]芘-DNA加合物的水平,在不同个体可相差2~100倍。研究发现,是因为外来化合物代谢酶基因多态性不同,影响烟草的生物转化过程的激活或解毒,Ⅰ相代谢酶为代谢活化酶,主要包括细胞色素P450家族(cytochrome P450,CYP450),可将前致癌物活化为终致癌物,Ⅱ相代谢酶为代谢解毒酶,主要包括谷胱甘肽-S-转移酶(glutathione-S-transferase, GST)和N-乙酰基转移酶(N-acetyltransferase, NAT),将活性产物催化形成亲水物质排出。由于这些代谢酶控制和影响了致癌物的代谢,故其多态性在决定人群中个体的肿瘤易感性方面起着重要的作用。CYP450是一类最重要的Ⅰ相代谢酶,人类的CYP450家族与多种致癌物代谢密切相关,且其中许多基因存在多态性,研究显示其亚家族成员 CYP1A1CYP2A6CYP2D6CYP2E1等与吸烟诱导肺癌发生关系密切。GST作为Ⅱ相代谢酶,催化谷胱甘肽和许多包括环境致癌物在内的亲电子和疏水化合物间的反应,其中 GSTM1缺陷型不能表达GSTM1,不具备对致癌物的灭活功能,其基因频率在人群中变化也较大,已报道的中国汉族人的 GSTM1基因缺失率为35.7%~66.0%, GSTM1缺陷型且有吸烟行为的人更易患肺癌,是肺癌的高危人群。