基因工程药物研究与应用
上QQ阅读APP看书,第一时间看更新

克隆载体

克隆载体(cloning vector):通常采用从病毒、质粒或高等生物细胞中获取的DNA作为克隆载体,在载体上插入合适大小的外源DNA片段,并注意不能破坏载体的自我复制性质。将重组后的载体引入到宿主细胞中,并在宿主细胞中大量繁殖。对载体的要求:①能在宿主细胞中复制繁殖,而且最好要有较高的自主复制能力。②容易进入宿主细胞,而且进入效率越高越好。③容易插入外来核酸片段,插入后不影响其进入宿主细胞和在细胞中的复制。这就要求载体DNA上要有合适的限制性核酸内切酶位点。④容易从宿主细胞中分离纯化出来,这才便于重组操作。⑤有容易被识别筛选的标志,当其进入宿主细胞,或携带着外来的核酸序列进入宿主细胞都能容易被辨认和分离出来。
所有的分子克隆载体应具有以下3个基本的结构:①复制起点:可以在生物体中自主复制;②多克隆位点:以供外源DNA插入;③遗传标记基因:以指示重组DNA分子是否进入宿主细胞。最主要的载体是质粒、噬菌体和病毒,分别应用于原核细胞或真核细胞。从功能来分,有克隆载体(构建基因组文库或cDNA文库)、测序载体、表达载体以及能在两个不同物种中存在的穿梭质粒。随着生物技术的发展和科学研究的深入,不断出现具有不同功能的新载体,如可以容纳几百万碱基的酵母人工染色体。载体的具体种类有:PAC(P1衍生人工染色体)、MAC(哺乳动物人工染色体)。

(一)质粒

质粒(plasmids)是细菌内的共生型遗传因子。作为染色体外小型双链环状DNA复制子,它能在细菌中垂直遗传并且赋予宿主(受体菌)某些代谢活动和抗药表型,是比病毒更简单的原始生命。质粒由Lederburg发现并于1952年正式命名。由于质粒不仅可以携带外源基因进入细菌中进行扩增和表达,而且在添加真核复制信号和启动子后,构建出能在原核或真核细胞中均可复制的穿梭质粒,使外源基因在真核细胞中得以表达,因而成为基因的运载工具(即载体),在基因工程中具有极广泛的应用价值。质粒并不是宿主染色体的永久组成部分,而是一种自主复制的遗传单元。不同质粒DNA的复制,其机制不尽相同,根据质粒拷贝数的不同,分为严紧型和松弛型,前者与宿主繁殖结合,致使每个细胞仅有一个或几个拷贝质粒,而后者却是由质粒自己编码的基因合成功能蛋白所调节,因此在宿主染色体复制停止的情况下,质粒可以继续扩增,因而具有10~200个拷贝数。对于克隆载体,松弛型质粒更为适用。天然质粒不足以用作载体,必须根据基因克隆的要求进行体外修饰改造。因此可以用作载体的质粒需具备一定的基本元件后才有相应的功能。
质粒(载体)具备的基本元件:①复制起始点(ori):使质粒可以自我复制和扩增。②抗生素抗性基因:一般有两个,以便为受体菌提供易于检测的表型性状的选择记号,而且在外源基因插入后形成的重组质粒中,至少仍保留一个强选择记号。常用的抗性有:抗氨苄西林基因 Ampr、抗四环素基因 Tetr、抗卡那霉素基因 Kanr、抗氯霉素基因 Cmlr、抗链霉素基因 Strr。③若干限制酶单一识别位点(多克隆位点,polylinker):满足各种基因克隆的需要,而且外源基因插入后不影响质粒的复制功能。④较小分子量和较高拷贝数:便于进行分子操作和质粒扩增。
质粒的功能:①运载外源DNA片段:质粒通常用于运载小于15kb的外源基因片段到宿主中。为了便于操作,人们又构建了穿梭质粒(shuttle plasmids)。所谓穿梭质粒是指一类人工构建的具有两种不同复制起点和选择标记,因而可以在两种不同类群宿主中存活和复制的质粒载体。此概念不仅用于不同的微生物菌群之间,也可以推广到真核生物表达载体的构建,如用于枯草的pBE2、酵母的pPIC9K、哺乳动物表达载体pMT2和用于植物细胞的Ti质粒。这些穿梭质粒不仅可以在大肠埃希菌中复制扩增,也可以在相应的枯草、酵母、动物或植物细胞中扩增和表达。由于大肠埃希菌的培养、基因重组、扩增、测序等工作易于进行,技术也相当成熟,因此利用穿梭质粒把要表达的基因组装好后,再转入相应的细胞中进行表达,这无疑给基因工程操作,特别是以真核细胞为表达体系的工作提供了极大的方便。②筛选重组子:通常以质粒的抗生素抗性基因作为筛选的遗传标记。当外源基因插入质粒的某一个抗性基因中,就使该抗性基因不能正常表达,致使含有该质粒的细菌丢失抗性。利用抗性的变化,很容易筛选出含有外源基因的重组子。质粒除有抗性基因外,往往还带有其他明显的筛选标记,最常用的是蓝白斑筛选(β-半乳糖苷酶系统)。此类载体携带 lacZ基因,它编码β-半乳糖苷酶的N末端(α肽),并且处于可被安慰诱导物IPTG(异丙基硫代半乳糖苷,与乳糖结构类似但不能被β-半乳糖苷酶降解)诱导的启动子调控之下。质粒转化的宿主菌为LacZ△M15基因型(含有编码N末端缺陷型的β-半乳糖苷酶多肽的基因)。未重组的质粒转化宿主菌后,在IPTG的诱导下,质粒与基因组分别表达缺陷但可以相互补偿的两个肽(即α互补),形成了有功能的β-半乳糖苷酶,该酶能把培养基中无色的X-gal(5-溴-4-氯-3-吲哚-β- D-半乳糖苷)底物分解成半乳糖和深蓝色的5-溴-4-氯-靛蓝。然而当外源DNA插入质粒位于α肽编码序列中的多克隆位点时,由于破坏了α肽的阅读框架,因而不能表达出与宿主菌基因组表达的缺陷型β-半乳糖苷酶多肽发生α互补。由于没有β-半乳糖苷酶的酶解作用,致使重组菌形成白色菌落。由此,可以借助蓝白斑很容易筛选出重组子。不过实际操作中发现当插入小片段时,重组子也有形成浅蓝斑的情况。据最新报道,大概有30%的假阴性,即蓝色菌斑也有可能含外源基因,同时还会出现一定程度的假阳性。尽管蓝白斑筛选应用了二十余年,但假阳性和假阴性却经常出现,促使人们不断对分子克隆方法提出改进,并思考着建立新的载体和克隆技术。但迄今为止,几乎没有一个克隆系统可以保证不会出现假阳性克隆。Slilaty SN和Lebel S研究证明,蓝白斑筛选的载体,通常将插入位点放在 LacZ基因的起始密码子ATG到第7个氨基酸密码子之间。但如果将插入位置改变到 LacZ基因的第11~36个氨基酸密码子之间,那么就可以完全消除假阳性和假阴性。Genomics One公司正是利用了他们的研究结果开发出TrueBlue技术,同样是蓝白斑筛选,但准确率可达100%。③DNA测序:为了便于对克隆到质粒中的外源DNA片段进行鉴定,必须进行DNA序列的测定。通常克隆质粒(包括某些表达质粒)中位于多克隆位点两侧含有通用引物,因此无论插入何种DNA片段,均可利用通用引物进行测序,而不必另外设计特异测序引物,如pGEM-T载体,相关的序列位点为:T7 RNA聚合酶转录起始位点1;多克隆位点区10~113;SP6 RNA聚合酶启动子(-17至+3)124~143;SP6 RNA聚合酶转录起始位点126;pUC/M13反向测序引物结合位点161~177; lacZ起始密码子165; lac操纵子185~201;β内酰胺酶编码区1322~2182;噬菌体f1区2365~2820; lac操作子序列2821~2981、151~380;pUC/M13正向测序引物结合位点2941~2957;T7 RNA聚合酶启动子(-17至+3)2984~3。在该载体多克隆位点两侧有两对通用引物(SP6 RNA聚合酶启动子、T7 RNA聚合酶启动子和pUC/M13反向测序引物、pUC/M13正向测序引物),它们均可以用来对插入的任何片段进行测序。④表达外源基因:许多表达质粒均构建了强启动子,外源基因可以在该启动子的控制下实现高表达,获得大量目的蛋白。
质粒的电泳行为:电泳是分离鉴定生物大分子的常规方法,大分子的电泳行为(迁移率)取决于该分子的大小、空间结构和携带的电荷量。利用不同的染料可以用肉眼观察它们的电泳行为。溴乙锭(ethidium bromide,EB)是一种具有扁平结构的荧光染料,可以嵌入核酸分子中的碱基对之间,在紫外线的激发下发出红色荧光,同类型核酸的荧光染色强度与核酸浓度成正比,灵敏度可达1~5ng,因此它是常用的核酸染料。
质粒DNA的形态不一,其电泳行为有差异,电泳时在凝胶中表现出的迁移率不同。超螺旋质粒DNA由于结构紧密迁移速度最快;结构松弛的开环(缺口)质粒DNA最慢;而线形DNA位于两者之间。

(二)噬菌体和病毒

利用噬菌体和病毒(bacteriophage and virus)具有感染宿主(受体细胞)的能力,将插入的外源基因带入宿主中。噬菌体是一类侵害细菌(包括放线菌、真菌和原核生物,即宿主菌)的病毒,又称细菌病毒(bacterial virus)。它具有其他病毒的共同特性:个体小、可通过除菌滤器、没有细胞结构、非常专一的寄生性等,为非细胞生物。其结构主要由蛋白质和核酸(DNA 或RNA)组成。在自然界中分布广泛,土壤、空气、水中或生物体内都可存在。根据噬菌体与宿主菌的关系可分为烈性噬菌体(virulent phage)和温和噬菌体(temperate phage)两类。前者能改变宿主菌的性质,大量产生新的噬菌体,最后导致宿主菌裂解死亡;后者可因生长条件的不同,既可引起宿主菌的裂解死亡(lytic phage),又可将其核酸整合到宿主菌的染色体上,使宿主菌继续生长繁殖,并被溶源化(lysogeny,即噬菌体的核酸附加于宿主菌的遗传物质上,随同宿主菌分裂一起进行复制)。噬菌体的研究历史,是同分子生物学、分子遗传学的创立和发展过程密切相关的。DNA复制机制的阐明、转录的终止作用、连接酶和解旋酶的发现、位点特异的重组作用、SOS修复机制等,均是以噬菌体为材料取得的重要研究成果。
分子生物学技术常用的噬菌体有:①λ噬菌体:外形特征类似于蝌蚪,由头和尾组成,头部呈等轴的20面体,直径约54nm,尾部无尾鞘,长150nm,主要由衣壳蛋白组成。其基因组为线状双链DNA分子,长约49kb,约含50个基因,其中50%的基因对噬菌体的生长和裂解寄主菌是必需的,分布在噬菌体DNA两端(即为左右臂);中间是非必需区,当它们被外源基因取代后,并不影响噬菌体的生命功能。由外源基因取代非必要基因所形成的重组DNA,可以随寄主大肠埃希菌细胞一起复制和增殖,而且在其溶源周期中,它们的DNA是整合在大肠埃希菌染色体DNA上的,成为大肠埃希菌的一个组成部分,因此改造后可以组建一系列具有不同特点的载体分子。λ噬菌体具有以下特征:λ-DNA可在体外包装成病毒颗粒,高效地感染大肠埃希菌;可以把25kb长的外源DNA插入λ-DNA,引入受体细胞;重组λ-DNA的筛选和保藏较易。故λ噬菌体常作为分子克隆的载体,而且特别适用于构建真核生物基因文库。噬菌体在液体培养基中,噬菌现象可使浑浊菌液变为澄清,在固体培养基中,若用适量噬菌体和宿主菌液混合后接种培养,培养基表面可有透亮的溶菌空斑出现。一个空斑是由一个噬菌体复制增殖并裂解细菌后形成的,称为噬菌斑(plaque)。在基因重组中,噬菌斑是噬菌体重组包装成功的筛选标志。将噬菌体按一定倍数稀释,通过噬菌斑计数(滴度),可测知一定体积内的噬菌斑形成单位数目,即噬菌体的数量。②M13噬菌体:是一种独特的载体系统,为6400bp的单链DNA,整个基因组编码10个基因。它只能侵袭具有 F基因的大肠埃希菌,但不裂解宿主菌。进入宿主菌后成为双链环状分子,能像质粒一样自主复制(即复制型,RF),制备方法同质粒。宿主菌可分泌含单链DNA的M13噬菌体,又能方便地制备单链DNA,用于DNA顺序分析、定点突变和制备单链核酸探针,同时不存在包装限制问题。因此作为单链DNA载体,它具有其他载体所不具备的优越性。③柯斯(Cos)质粒:是一种人工构建的克隆载体,为克隆真核DNA大片段而专门设计的。它包含了λ噬菌体的 cos基因、用于克隆的限制性内切酶位点、抗药性标记和质粒的复制原点,因此是有噬菌体DNA黏性末端顺序的质粒DNA分子。柯斯质粒能被包装到λ噬菌体粒子中,感染大肠埃希菌。此类载体分子容量大,可携带45kb的外源DNA片段。也能像一般质粒一样携带小片段DNA,直接转化宿主菌。这类载体常被用来构建高等生物基因文库。④腺病毒(adenoviral)载体:腺病毒的形态是特征性的20面体病毒壳体,直径为60~90nm,没有囊膜,衣壳由252个壳微粒组成,主要含有三种蛋白:六邻体(Ⅱ)、五邻体基底(Ⅲ)和纤突(Ⅳ),还有多种其他的辅助蛋白Ⅵ、Ⅷ、Ⅸ、Ⅲa和Ⅳa2,其中240个壳微粒是六邻体(hexon),位于20面体顶端的12个壳微粒是五邻体(penton),每个五邻体由基底和伸出表面的一根末端有顶球的纤维组成(图3-1)。腺病毒基因组是一个线性的双链DNA,其5'端与一种末端蛋白(TP)共价结合,5'端上还具有末端反向重复序列(ITRs)。病毒DNA与核心蛋白Ⅶ和一个称为mu的小肽紧密结合。另一种蛋白Ⅴ包被在DNA-蛋白复合物上,并且通过蛋白Ⅵ为DNA-蛋白复合物和病毒壳体间提供了结构上的联系。病毒含有一种病毒自身编码的蛋白酶,这种蛋白酶对于加工某些结构蛋白从而产生成熟的具有感染性的病毒是必需的。腺病毒颗粒可以转染各种细胞,具有高感染率、低变异、高表达的特性,拷贝数可控制,插入片段可达8kb,是非常有用的真核细胞的表达载体。⑤昆虫杆状病毒(baculoviruses):是对昆虫具有专一性的杆状病毒,对于其他种类的细胞不具感染性。它是一种长杆状的病毒,长200~400nm,宽40~50nm,染色体DNA长度在80~200kb之间。当病毒成熟时,在病毒鞘外会包裹一层多角体蛋白,包裹完整的杆状病毒形成包含体,可以保护病毒抗紫外线与抗旱。野生型的杆状病毒是一种安全的生物杀虫剂,对其改造后已成为有效的真核表达载体、表面展示系统以及基因治疗载体。昆虫细胞和杆状病毒组成了一个完整的表达系统,已经被证明是高水平表达哺乳动物全长蛋白的方法。在昆虫细胞中很多翻译后修饰类似于哺乳动物细胞,而那些在大肠埃希菌中不能成功表达的蛋白也可以利用杆状病毒系统在昆虫细胞中进行表达。因此BES(杆状病毒表达系统)具备以下优点:具有真核细胞的翻译后修饰功能;正确的蛋白折叠、二硫键形成,使重组蛋白在结构和功能上更接近天然蛋白;高表达量,最高表达量可达昆虫细胞蛋白总量的50%;可表达非常大的外源基因(~200kb);具有在同一个感染昆虫细胞内同时表达多个基因的能力;对脊椎动物是安全的。
图3-1 腺病毒结构

(三)人工染色体

所谓人工染色体(artificial chromosomes)是利用染色体片段组成的载体。同质粒一样,由从染色体分离出来的ARS(autonomous replication sequences,DNA自主复制起始序列)、CEN(centromeric sequences,着丝点序列)和TEL(telomeric sequences,端粒序列)组成。当然作为载体还必须有克隆位点和筛选标记。其最大的特点是能容许100~2000kb大片段的外源DNA的插入,这为进行基因组工程的工作带来方便,用不多的克隆就可以包含特定的基因组全部序列,这样可以保证基因组特定序列的完整性。因能包容大而复杂的基因,利用哺乳动物人工染色体,还可以进行功能分析以及基因治疗。在人类基因组计划和其他基因组研究中,人工染色体发挥了不可替代的作用。