第二节 基因的结构与活动规律为防病治病提出新途径
一、比较各种属染色体DNA限制性核酸内切酶图谱,推测生物体的进化顺序和亲缘关系
如比较人、黑猩猩和长臂猿α-珠蛋白基因及其邻近区的限制性核酸内切酶图谱,显示在进化过程中人与黑猩猩的亲缘关系比长臂猿近(图2-2-1)。通过DNA限制性核酸内切酶片段长度多态性分析,或PCR等体外扩增DNA,可以鉴定基因的种属或个体来源,为法医追查罪犯和亲子鉴定等提供一定的依据。
图2-2-1 人、黑猩猩和长臂猿α-珠蛋白基因及其邻近区的限制性核酸内切酶位点
注:字母表示各类限制性核酸内切酶,*为人与黑猩猩限制性内切酶的部分差异位点
二、探索肿瘤的发病机制
正常组织中癌基因转录活性极低,如果转录活性增高,其表达产物与其他因素共同作用,细胞可能癌变。用Northern分子杂交或实时定量PCR(qPCR)测定均证明人肝癌组织N-ras癌基因的转录活性增高,灵敏度可达0.01ng。
人肝癌组织DNA与肝炎病毒DNA探针进行杂交,发现明确的杂交带,表明人基因组整合了HBV病毒基因。从慢性肝炎组织提取的DNA也出现了肝炎病毒基因的杂交条带,而正常肝组织DNA没有出现杂交感光带,表明肝炎病毒的基因与患者基因组整合,与肝癌的发生有着密切的关系(图2-2-2)。防治病毒性肝炎可以降低肝癌发病率。1982年Weinberg用DNA顺序分析发现膀胱癌中C-raS和正常细胞的C-raS之间只有一个碱基G突变为T,使p21多肽第12位氨基酸由甘氨酸转变为缬氨酸,是第一个被发现的与肿瘤直接有关的基因点突变。
图2-2-2 DNA分子杂交(Southern blot)检测人基因组DNA整合肝炎病毒DNA
泳道1,阴性对照;2,阳性对照;3,试剂对照;5~8,患者肝组织DNA;4和9,正常肝组织DNA
用基因转移方法研究癌变机制,将SV40病毒T抗原基因显微注射入小鼠受精卵并植入假孕小鼠输卵管,染色体中整合有该基因的小鼠发生了脉络丛乳头瘤,并能将此性状按孟德尔规律遗传。把小鼠C-myc癌基因与MTV小鼠腺瘤病毒的启动子重组,将此重组子注射入小鼠受精卵,植入假孕小鼠输卵管,建立含有该重组子的小鼠品系,有的小鼠在第三次妊娠时发生了乳腺腺癌。整合有重组子的后代,在第二、三次妊娠时也发生了乳腺腺癌。这些结果表明:①C-myc基因在肿瘤发病中起关键作用;②C-myc基因的表达,在一定条件下并不影响小鼠的正常生长和发育,但由于MTV启动子受催乳素、皮质激素调控,经过2~3次妊娠刺激myc高水平表达,才发生乳腺腺癌;③单独的C-myc癌基因的过度表达尚不足以发生癌变,因为所发生的乳腺癌都是单个结节状,而不是10个乳腺全部癌变,说明还有其他因素参与才发生乳腺上皮细胞的癌变。
基于肿瘤细胞基因组顺序转录和翻译水平以及蛋白质功能等多个环节发生变化,可用定位克隆(positional cloning strategy)、定位候选基因(positional candidate gene strategy)、消减杂交法(substractive hybridization)、mRNA 差异显示、EST法(expression sequencing tag)和酵母双杂交等技术检测肿瘤相关基因及其基因表达产物,作为肿瘤诊断和防治的有效手段。
三、从分子水平研究细胞分化、胚胎发育和遗传特性
比较胚胎时期和骨髓瘤患者B淋巴细胞免疫球蛋白基因的结构,发现特异免疫球蛋白的产生是基因重排、剪接、修饰的结果。在不同的抗原刺激下,发生不同的重排、剪接和修饰,产生了结构和功能不同的免疫球蛋白。
免疫球蛋白由两条相同的轻链(L)和两条相同的重链(H)组成。轻链因C区结构不同分为κ型和λ型,它们的编码基因组分别位于第6、12染色体上,由V L、JL和Cκ和Cλ基因组成。JL至少有4个,V L有10个,胚胎细胞分化为B细胞时,V与J之间的顺序被切除,在不同的抗原刺激下有选择地进行VJC的重排和连接(图2-2-3)。重链基因更为复杂,由V H、DH、JH和8个CH基因连接成基因组,即V H…DH…JH…μ…δ…γ3…γ1…γ2 b…γ2 a…ε…α,位于12号染色体。B细胞分化时,有两个水平的变化:①RNA转录加工水平——VDJ重排,8个CH保持原状,但选择性地转录某个C基因,或先转录全部CH基因,再进行选择性剪接,形成特异的H链mRNA。由此可以解释在B细胞成熟过程中先合成IgM,然后合成IgG、IgD、IgA、IgE。②CH基因丢失或重排——8个CH基因表达前,先丢失几个,然后与VDJ连接。例如形成VDJ-μγ2 b,转录产生VDJ-μγ2b mRNA,以后μ也被剪除,形成VDJ-γ2b mRNA。CH基因的重排是染色体内部片段丢失还是姐妹染色体间不均等交换的结果,尚无定论。
图2-2-3 免疫球蛋白κ链形成过程中DNA重排、剪接和修饰示意
四、疾病基因的定位克隆用于疾病相关性分析
疾病相关基因的定位克隆,不仅要有足够信息量的家系标本,还要有高密度的多态标记,如RFLP或短串联重复序列(STR)。单核苷酸多态性(SNP)有足够的信息量,易于识别和检测。大规模自动化操作,是疾病相关基因分析的新工具。
疾病关联分析的原理基于多态性标记的某个等位基因与疾病处于连锁不平衡状态,患病群体和一般群体中该等位基因的频率有显著差异。关联分析无需家系资料,还可以用于基因定位。例如限制性核酸内切酶图谱测定RFLP、STR和SNP等可进行疾病的关联分析,并可发现疾病易感性基因。
五、全外显子组测序
人全基因组序列解密后显示,基因组DNA序列变异引起的疾病中,80%以上是外显子区域的序列突变。因此,全外显子组序列测定特别适合于单基因或多基因遗传性疾病的诊治。(见第五章)
六、基因诊断
基因诊断是采用分子生物学方法在DNA或RNA水平对某一基因或全基因组序列进行分析,从而对特定的疾病进行诊断,目前应用最多的是全外显子序列分析或基因捕获后高通量测序。基因诊断不仅能确诊遗传性疾病,也能检查人体对疾病的易感性、疾病的类型、发展的阶段,以及对药物的抗性等。人体各组织的有核细胞DNA均有全套基因组,都可作为基因诊断的检测标本,如淋巴细胞、皮肤细胞、绒毛细胞等。但基因表达有组织器官特异性,如胰岛素基因在胰腺β细胞表达,白蛋白基因在肝细胞表达,做基因诊断测试时必须选取合适的检测标本。
(一)基因诊断分为两类
1.直接基因诊断
直接检查致病基因或疾病易患性基因标志。适用于已知致病基因的疾病。
2.间接基因诊断
致病基因尚属未知,通过对患者及其家属成员进行连锁分析,推测患者是否带有致病基因和疾病易患性基因标志。
(二)常用的基因诊断技术
1.Southern印迹杂交
详见本篇第一章第三节“核酸分子杂交技术”。
2.聚合酶链反应(PCR)
应用PCR技术可以使特定的基因或DNA片段在体外扩增数十万至百万倍,扩增的片段可通过电泳进行观察。PCR反应特异性强,灵敏度高。毛发、血痕,甚至单个细胞的DNA即可供PCR扩增之用,用于病原体DNA的检查、肿瘤残留细胞的检出、罪犯或个体遗传物质的鉴定以及遗传病的基因诊断等。
PCR技术有许多新的发展,用途日益扩大。如以RNA为模板经过逆转录再行PCR建立了RT-PCR;改变两引物浓度,使其相差100倍,结果得到大量单链产物,则为不对称PCR,其单链产物还可用于序列分析;在一个反应中加入多对引物同时扩增和检测多个部位的基因,则为多重PCR等。
已知突变部位的基因,可以合成等位基因特异的寡核苷酸探针(allele-specific oligonucleotide,ASO),通常约20bp。探测点突变时一般需要合成两种探针,一种与正常基因序列完全一致,能与之稳定地杂交,但不能与突变基因序列杂交;另一种与突变基因序列一致,能与突变基因序列稳定杂交,但不能与正常基因序列稳定杂交,可以检出只有一个碱基发生了突变的基因。
3.PCR结合ASO(PCR-ASO)
先将含有突变的基因片段进行体外扩增,再与ASO探针做点杂交,由此简化方法,节约时间,而且只要极少量的基因组DNA就可进行。
4.单链构象多态性(single strand conformation polymorphism,SSCP)
单链DNA由于碱基序列的不同可引起构象差异,这种差异造成相同或相近长度的单链DNA电泳迁移率不同,用于基因点突变、微小的缺失或插入的检测。通常在怀疑有突变顺序附近设计一对引物进行PCR扩增,然后将扩增产物用甲酰胺变性,凝胶中电泳,电泳带位置的差异,即为PCR-SSCP,能快速、灵敏地检测点突变或DNA内切酶片段多态性。但如果要阐明突变的碱基性质,则需做序列分析。小卫星DNA和微卫星DNA的长度多态性也可以通过PCR扩增后用电泳检出,即扩增片段长度多态性(amplified fragment length polymorphism,Amp-FLP)。PCR扩增后,用聚丙烯酰胺凝胶电泳分离,可以检出几个核苷酸的差别,用于突变性质不明的连锁分析。
5.全外显子组测序
从全外显子测序可快速简便地检出基因突变,明确诊断和采取靶向治疗。(详见第五章)
(三)基因诊断方法的选择
表2-2-1显示基因诊断方法的选择,一般无需对家系成员进行分析,但必须检出异常基因,并肯定该异常与疾病之间的关系。
表2-2-1 基因诊断方法的选择
(四)基因的连锁分析(gene linkage analysis)
临床实践中,直接检测突变基因进行基因诊断的疾病十分有限,多数需用基因连锁分析。因为同一条染色体上相邻基因一起复制传代,连锁的基因可以作为遗传标志。通过检测连锁基因标志判断是否存在致病基因或疾病易患性基因标志。基因连锁分析多数采用RFLP技术进行家系分析。通过家系分析双亲的两条染色体,确定哪条染色体正常,哪条染色体含异常结构。基因连锁分析需要注意:①家系中关键成员如父母、祖父母等是否为RFLP杂合子,以便确定异常结构分布于哪条染色体;②子代中有患病的纯合子,利于分析异常结构从哪条染色体遗传下来;③需要使用多种RFLP的探针以便提高诊断率和准确性;④亲缘关系必须正确。
(五)基因诊断实例——α-地中海贫血
图2-2-4 正常人,Bats胎儿α-珠蛋白基因点杂交
图2-2-5 α-珠蛋白基因多态性
利用限制性核酸内切酶片段长度的多态性(RFLP)分析致病基因,包括对胎儿作产前诊断。正常人染色体DNA含有4个完全一样的α-珠蛋白基因,α-地中海贫血患者缺失1个或数个α-珠蛋白基因,用α-珠蛋白的基因探针与患者的白细胞或产妇的羊水细胞DNA进行点杂交(图2-2-4),根据杂交点上的放射性强度,与正常人数据比较,或直接观察放射自显影的强度,可初步诊断严重的地中海贫血。正常人染色体的DNA用EcoRⅠ和HpaⅠ两种限制性核酸内切酶水解以后,以α-珠蛋白基因为探针,通过Southern分子杂交,出现2.1、3.7、16kb三条感光带。当α-珠蛋白基因有缺陷时,会改变杂交带的长度和数目,血红蛋白H病患者因缺少3个α-珠蛋白基因,用EcoRⅠ和 HpaⅠ水解时,只出现5.6kb杂交带,用EcoRⅠ和HindⅢ水解时,只出现2.1kb和16kb感光带(图2-2-5)。利用合适的内切酶可以详细地诊断出α-地中海贫血1型和2型及其亚型,即左侧还是右侧α-珠蛋白基因缺失,正常人的染色体由两条染色单体组成,每条染色单体含结构完全相同的两个α-珠蛋白基因;患者的两个单体中可能都缺失一个α-珠蛋白基因,或一个单体缺失两个α-珠蛋白基因而另一个单体完全正常。
七、基因治疗
利用重组DNA技术将外源正常基因导入靶细胞,外源基因表达正常蛋白质分子以纠正或补偿因基因缺陷引起的异常,实现靶向治疗。外源基因转移方法通常应用反转录病毒作为载体的基因导入法。作为载体的反转录病毒已经缺失该病毒的某些功能蛋白基因,进入体内后,通常不会出现这类反转录病毒。目的基因同反转录病毒载体重组后,包装成重组病毒颗粒,转染受体细胞,实现基因转移。这种重组反转录病毒将所携带的功能性目的基因整合到细胞染色体上,其表达产物将弥补原来缺失的基因产物。
将组织或器官特异性启动子与目的基因重组,使外源基因在特定的组织或器官中表达。例如,在Keratin typ-5启动子控制下,外源基因只在皮肤、牙齿和毛发进行表达。
遗传性疾病的基因治疗,目前局限于单基因缺陷所引起的疾病,如血友病、腺苷酸脱氨酶(ADA)缺陷症、地中海贫血、镰刀型细胞贫血、α1-抗胰蛋白酶缺陷症引起的肺气肿等。ADA缺损导致2'-脱氧腺苷的水平过高,毒害T、B淋巴细胞,出现免疫缺损。通过反转录病毒载体将ADA基因稳定地转移到淋巴细胞,使外周血液T细胞明显升高,纠正T细胞免疫功能。疗效可持续6个月以上。对多基因引起的疾病如恶性肿瘤的基因治疗,已探索多年,如表达IL-2、IFN-2和IL-1的淋巴细胞治疗神经细胞瘤及白血病等。用反转录病毒将毒素基因(蓖麻毒素和脊髓灰质炎病毒毒素中所含的一种蛋白酶基因)导入癌细胞内,表达毒素杀死靶细胞,而对其他细胞毒性很低。
血管内支架、心导管技术、冠状动脉搭桥术后有时局部产生血栓,导致再狭窄。将抗凝、溶血栓和促进血管舒张因子的基因导入血管内皮细胞,然后种植于支架内表面,预防血栓形成。例如应用反转录病毒载体将组织型纤溶酶原激活剂(t-PA)基因导入培养的血管内皮细胞,覆盖在支架的内表面上,内皮细胞合成和分泌t-PA明显升高,不仅使血管再通,而且有预防再栓塞的功能。
通过反转录病毒载体将酪氨酸羟化酶(tyrosine hydroxylase,TH)cDNA基因转移至成纤维细胞,再植入实验性帕金森病动物脑内,不仅表达活性TH,而且纠正了TH酶活性缺乏引起的症状,能持续5个月以上。复旦大学薛京伦等将人第Ⅸ因子基因通过重组质粒或重组反转录病毒导入自体的皮肤成纤维细胞,然后移植至患者腹部皮下组织,临床症状明显改善,实现了对乙型血友病的基因治疗。
利用CRISPR/Cas9技术可以高效快速实现基因靶向敲除和靶向敲入,特效治疗遗传性疾病和恶性肿瘤等。(详见第一章第四节)
八、基因工程药物及疫苗
从20世纪80年代起,人们用基因工程技术大量生产人体中只含有微量的多肽或蛋白质,如激素、酶、神经递质、疫苗等,用于防治疾病。
基因工程(genetic engineering)是指某种生物细胞的基因或人工合成的基因经重组后,引入另一种生物细胞,在此种细胞内大量合成该基因编码的蛋白质(或多肽),提纯后形成基因工程产品,具有重要的应用价值。
基因工程的基本过程
1.目的基因的制备
(1)人工合成:利用化学合成基因片段和DNA连接酶的催化作用合成基因。自从DNA合成仪问世以来,人工合成基因的效率非常高。
(2)反向转录合成双链cDNA基因:与载体重组后转化宿主细菌后形成双链cDNA基因库,用探针从基因库筛选含目的基因的克隆(图2-2-6)。
图2-2-6 双链cDNA由反向转录合成示意
(3)从染色体DNA分离目的基因:基因组DNA用超声打成片段或用限制性核酸内切酶水解形成DNA片段,与载体DNA重组,转化宿主细胞,制成基因库,再用探针从基因库中分离含目的基因的克隆。
(4)PCR技术拷贝和扩增目的基因。
2.目的基因与载体DNA连接形成重组DNA分子。
3.重组DNA分子转化宿主细胞并且稳定地对目的基因进行无性繁殖。
4.克隆的分离和鉴定 重组DNA转化宿主细胞形成克隆后经筛选鉴定,最后经核苷酸序列测定肯定阳性克隆中含有目的基因的编码顺序而且符合阅读框架。
5.基因表达、表达产物分离纯化和鉴定 目的基因与表达载体重组后转化表达宿主,利用宿主的酶系进行基因复制、转录和翻译,形成基因表达产物,表达产物经分离纯化和活性检定后获得基因工程产物,可以作为药物或疫苗进行临床试用研究。
迄今,用于临床的基因工程药物有数百种,属激素类的有生长激素、胰岛素等;属细胞因子类的有多种干扰素、多种白细胞刺激因子等;属酶类的有t-PA、链激酶和超氧化物歧化酶等;以及促红细胞生成素(EPO)、抗血友病因子等。
在蛋白质构效关系研究的基础上,通过基因工程-蛋白质工程改变天然分子结构提高疗效,并使其性质和功能更符合临床的需要。例如,天然水蛭素能强烈抑制凝血酶,但动脉血栓的形成主要与血小板凝聚有关,在天然水蛭素基因的合理部位融合RGD三肽编码序列,融合基因编码的RGD-水蛭素具有抑制凝血酶和抑制血小板凝聚双重功能,防栓抗凝效力显著提高,治疗剂量只需野生型水蛭素用量的~倍,并克服了出血等不良反应。
乙肝病毒疫苗,若从患者血液中分离制备,有混入核心抗原、传播乙肝病毒的危险,通过基因工程途径,可以方便地用限制性核酸内切酶从乙肝病毒基因组分离和扩增表面抗原基因,由此生产的乙肝疫苗安全高效。
应用蛋白质工程、基因工程生产特异性靶向治疗药物,已达到分子靶向(molecularly targeted drugs)水平。如靶向肿瘤的药物分子,特异高效地杀死肿瘤细胞。CD3-EGFR双特异单链单抗分子量只有7000,其中CD3决定簇靶向结合T淋巴细胞,EGFR决定簇靶向结合肿瘤细胞表面受体,这两个决定簇的编码基因由小分子柔性短肽的编码基因相连。这种双特异单链单抗桥连结合T-细胞和肿瘤细胞,激活T细胞,使T细胞中的颗粒酶和穿孔素基因表达水平显著升高,穿孔素促使T细胞与肿瘤细胞间形成“突触”,颗粒酶及T细胞的其他毒素经突触进入肿瘤细胞,裂解杀死肿瘤细胞或加速其凋亡,并体现“瀑布式”裂解肿瘤细胞的能力。使CD3-EGFR单链单抗分子能特异地浓集在肿瘤细胞表面,而且进入实体瘤,杀死实体瘤细胞,使肿瘤快速缩小。临床应用证明能特异地靶向乳腺癌、大肠癌、胃癌和肺癌等实体肿瘤,疗效显著。