上帝的手术刀:基因编辑简史
上QQ阅读APP看书,第一时间看更新

达尔文的麻烦

“遗传”,听起来是个人人都能理解的科学名词。中国人说“种瓜得瓜,种豆得豆”“老鼠的儿子会打洞”,英美人说“like father like son”(有其父必有其子)。这些俗语里反映的生物代际之间的相似性,就是遗传。其实从这几句俗语就能看出来,先人们大概早就发现,不管是动物还是植物,不管是生物的外形、行为,还是性格,这些性状都能在一代代的繁衍中顽强地延续和保留下来。

实际上,早在人类文明开始之前,人类就已经充分——尽管也许是下意识——观察到了遗传现象的存在,甚至已经开始利用遗传规律改善自己的生活了。

现代人类的祖先可以追本溯源到数百万年前的非洲大陆。2015年,古生物学家在东非埃塞俄比亚发现的下颌骨化石,将人属生物出现的时间又一次大大前推至距今280万年前。在200多万年的无尽岁月里,先祖们在非洲大陆上采集植物果实、捕获动物,过着靠天吃饭、随遇而安的日子。人类文明的曙光出现在距今十几二十万年前。那时,现代人的直系祖先——人属智人种——出现在非洲大陆,并且很快一批批地走出非洲,在全世界的各个大陆和主要岛屿上开枝散叶,也把采集和狩猎的固有天性带到了世界各地。在那个时候,还压根看不出我们这些身材矮小、面相平凡的先祖会在日后成为整个地球的主宰。

然而,就像突然拥有了某种未知的魔力一般,差不多从10 000年前开始,在世界各地快乐采集和狩猎的智人先祖们,几乎在一眨眼间就改变了赖以生存的生活方式。这些变化开启了农业时代,也最终催生了今天建立在发电机、汽车、互联网和生物技术基础上的全新人类社会。而这一切变化的开端,就是祖先们对于遗传规律的利用。

在贾雷德・戴蒙德(Jared Diamond)的名著《枪炮、病菌与钢铁》中对此有着生动详尽的讨论。就在人类先祖走出非洲的必经之路上,地中海东岸生长着繁茂的野生小麦,它们的种子富含蛋白质和淀粉。因此我们不难想象,当生活在中东新月沃地的人类先祖们在偶然间发现这种植物后,一定会如获至宝地将它们作为日常采集和储藏的对象。对于先祖们来说,这和他们数百万年来在非洲大陆进行的日常采集工作并无分别。

但是如果先祖们想要把这些野生小麦挖出来,栽培在自己村庄的周围,为他们提供稳定的食物来源,就会遇到一些棘手的问题。野生小麦的麦穗会在成熟后自动从麦秆上脱落,将种子尽力播撒到周围的泥土里。这是这些禾本科植物赖以生存繁衍的性状之一,但这也使得人类先祖想要大规模收获小麦种子变得非常困难。毕竟,总不能一天到晚盯着快要成熟的麦穗,在它们刚要成熟尚未脱落的短暂时间窗口里眼疾手快地收割吧?

后来,在某个不知名的具体年代,生活在中东地区的远古居民们无意间发现了一些偶然出现的遗传变异小麦。这些小麦的麦穗即便成熟以后,也不会自动脱落。我们可以很容易想象,如果这些变异小麦出现在野外,将注定只有死路一条。因为它们完全无法通过脱落的麦穗散播自己的后代。但这些变异植株对于我们的先祖们来说却无比珍贵,因为这样的遗传突变小麦会大大方便他们在固定时间大批收割麦穗、储存麦粒(见图1-1)!

更要紧的是,先祖们一定也在无意间发现了遗传的秘密——种瓜得瓜,种豆得豆,因此这些仿佛是上天赐予般的神奇的小麦种子,也将会顽强地保留这种对人类先祖而言——而不是对小麦自身,极其有利的性状。所以我们可以想象,先祖们可能会将这些奇怪的植物小心移植到村庄周围,用心呵护,直到收获第一批成熟的种子。这些种子将成为下一年扩大种植的基础。就这样,伴随着一代代人类先祖们的细心发现、栽培和收获,符合人类需要的优良性状被保留了下来,一直保留到今天。

图1-1 古埃及壁画

画中的农民们正在收割小麦。今天在全球范围内广泛种植的小麦是人类驯化的产物,在漫长的驯化过程中,野生小麦天然出现的遗传突变被远古居民发现并小心保留下来。这些无意间发现的遗传突变小麦,可能标志着人类农业社会的开端。

在中东、黄河两岸以及中美洲的丛林里,对遗传现象的理解和利用给我们的先祖带来了籽粒更饱满、发芽和成熟时间更统一的小麦和大麦,豆荚永不会爆裂的豌豆和大豆,有着超长纤维的亚麻和棉花,还有绵羊和鸡鸭等各种家禽家畜。人类的文明时代就这样开始了。因为这些遗传现象,人类祖先们得以告别随遇而安的狩猎采集生活定居下来,靠小心侍弄作物和家畜过活。也因为这些遗传现象,人类祖先们可以生产出多余的粮食来养活四体不勤、五谷不分的神父、僧侣、战士和科学家,可以组织起复杂的政府和广阔的国家,建造辉煌的神庙和宫殿,并最终孕育出了神迹般的现代人类社会。

但是遗传的本质究竟是什么呢?为什么是“种瓜得瓜,种豆得豆”“老鼠的儿子会打洞”呢?反过来,如果遗传的力量是如此强大,为什么我们仍然可以在自然界看到各种各样的丰富变异?为什么生长在中东新月沃地的野生小麦,百万年来遵循着成熟即脱落的繁衍规则,却还是能偶然产生麦穗不会脱落的后代,而这种奇特性状又可以稳定地遗传下去?为什么经过一代代的筛选后,长得像狗尾巴草一样的野生玉米会变成今天穗壮粒满的模样(见图1-2)?

图1-2 野生类玉米(左)和今天广泛种植的玉米作物(右)

两者看起来几乎不像是同类生物。在玉米的驯化过程中,玉米穗的大小变化更是惊人。

最早从理性高度思考遗传现象本质的,是同样生活在地中海边的古希腊人。

在古希腊哲学家德谟克利特和希波克拉底看来,遗传现象必然有着现实的物质基础,不需要用虚无缥缈的神祇来解释。在他们的想象里,遗传的本质是一种叫作“泛生子”(pangene)的微小颗粒。这种肉眼不可见的颗粒在先辈的体内无处不在,忠实记录了先辈从形态到性格的各种性状,并且会在交配过程中进入后代体内。以泛生子颗粒承载的信息为蓝图,子代得以表现出对先辈们的忠实模仿。

必须承认,泛生子的概念本身,其实并没有解决任何实际问题。或者刻薄点说,这只是把人们习以为常的遗传现象用一个听起来晦涩难懂的名词概括了出来而已。但是这个从现象到概念的抽象过程绝非毫无用处。至少,借用这个概念,人们可以把许多看起来很不一样的现象联系起来。例如,无性生殖——微小的细菌和酵母能够一分为二产生两个后代;有性生殖——雌雄家畜交配后会生出一群嗷嗷待哺的小崽儿;甚至还包括果树的嫁接——为什么果树嫁接后的果实会带有接穗(用来嫁接的枝条或嫩芽)和砧木(用来承接接穗的树木)的共同特征,不就是因为泛生子颗粒能够从砧木毫无障碍地流动到接穗里面去,和接穗的泛生子合二为一嘛!因此,这个生命力顽强的概念从古希腊时期一直流传到了近代。甚至在19世纪中期,在达尔文创立进化论,为地球生命和人类的起源找到科学解释的时候,他仍然借用泛生子的概念作为自然选择理论的遗传基础。

在达尔文看来,一个生物个体的所有器官、组织乃至细胞,都拥有自己专属的泛生子颗粒。手的泛生子记录着每个动物的手掌大小、宽窄、掌纹乃至毛发的生长位置,眼睛的泛生子当然少不了记录眼睛的大小、虹膜的颜色、视力的好坏,等等。在交配过程中,来自父母双方的泛生子融合在一起,共同决定了后代们五花八门的遗传性状——就像红蓝墨水混合以后产生的紫色液体,仍旧带着红色和蓝色的印迹(见图1-3)。

图1-3 泛生子融合理论

按照这种理论,父母的遗传信息隐藏在泛生子颗粒内,在交配过程中,父母双方的泛生子颗粒混合进入子代,决定了子代的性状。

更要紧的是,泛生子携带的生命蓝图一旦出错,就会导致后代遗传性状的“突变”,而这些突变,就是达尔文进化论中自然选择和最适者生存的物质基础。正是因为有突变,一代代生物个体才会具有微小但能够稳定遗传的差异,而这些遗传差异影响着生物个体在环境中生存和繁衍的能力,并最终导致最适者生存。

就像许多读者早在中学时期就耳熟能详的那样,达尔文的进化论在诞生后遭到了猛烈攻击。特别在宗教界人士和虔诚的信徒们看来,达尔文的学说亵渎了人类万物之灵的神圣性,也把传说中按照自己的模样造人的上帝置于可有可无的尴尬地位。牛津主教塞缪尔・威尔伯福斯(Samuel Wilberforce)的那个著名问题:“尊敬的赫胥黎先生,你是否愿意承认自己的祖父或祖母是猿猴变来的”也因此进入了中小学教科书。

但很少有人知道的是,进化论同样遭遇了严肃的科学批评。热力学创始人之一、物理学家开尔文勋爵(Lord Kelvin,原名威廉・托马森)当时估算出地球的年龄至多不会超过一亿年,而这点时间远远不够积累出达尔文进化论所需要的五花八门的遗传突变(当然,后来人们意识到地球的年龄远大于此)。古生物学家们对此发出了诘难,按照进化论,地球上必然存在许许多多物种之间的中间形态,但是它们的化石又在哪里呢?(越来越多的化石发掘已经填补了大量进化过程的所谓“缺环”。)有一个批评可能是最致命的,因为它声称发现了进化论和遗传融合理论的深刻矛盾,换句话说就是,达尔文辛辛苦苦为进化论找到的遗传基础,可能根本不支持进化论的声明!

这一批评来自苏格兰工程师、爱丁堡大学教授亨利・弗莱明・詹金(Henry Fleeming Jenkin)。他评论说,按照达尔文的进化论,生物的遗传物质需要经历漫长、微小的突变过程,才能产生足够显著的性状变化,最终造就地球上千万种五花八门的物种(见图1-4)。

图1-4 泛生子融合理论(左)和自然选择理论(右)的矛盾

按照泛生子融合理论,那么父母体内泛生子的微小变化会在交配繁衍过程中被“稀释”不见。这一点和自然选择理论是矛盾的。按照后者,微小的遗传变化也是可遗传的,这将成为自然选择的物质基础。

打个比方,就像有一头小猪,今天替换掉鼻子,明天替换掉尾巴,几个月后(如果在这个过程中不考虑小猪的感受的话),我们就能把它变成一头小牛。但如果泛生子融合理论是正确的,那么任何生物个体中出现的一点点微小的遗传变异,都会在交配繁衍的过程中湮灭不见——就像一滴墨汁滴入一大杯牛奶,黑色很快会消失不见。

我们立刻可以看出,小猪变小牛和墨汁滴入牛奶,是完全无法相容的两套理论。如果前者是正确的,就像在说一滴墨汁——不管多么微小——都可以让整杯牛奶变黑;而如果后者是正确的,那么小猪根本就不会失去任何原有的特征,因为所有微小的遗传变异都会像牛奶里的一滴墨汁一样,会被毫不留情地稀释消失。

达尔文也许并没有多么严肃地看待詹金的辩驳。数年后,达尔文发表了他的另一本巨著《人类的由来和性选择》,正式把人类开除出伊甸园,成为猿猴们的近亲,他的依据仍然是自己的进化论。而达尔文和詹金都不知道的是,就在他们为泛生子融合理论反复辩驳诘难的同时,在数百英里之外的欧洲大陆一座不起眼的修道院里,人类的目光已经穿透纷繁壮美的地球生命,第一次看到了遗传的真正秘密。

遗传的秘密隐藏在黑暗之中。

上帝说,请让豌豆开花结果,于是一切有了光明。

种豌豆的神父

在抽象的哲学思辨——想想德谟克利特、希波克拉底和达尔文——之外,世界各地的农牧民们也在自觉不自觉间研究着遗传的秘密。

当然,这里头的缘由是很朴素的。农民和牧民们担心的问题也许只是,怎样能培育出更符合人类需要的动物或植物?如果发现了有益于人类的生物性状,怎样保证这样的性状能稳定存在下去为我们所用?一个很经典的例子是达尔文曾经在自己的《物种起源》中讨论过的“安康羊”(见图1-5)。1791年,美国马塞诸塞州的一位牧民偶然在自家的羊圈里发现了一只腿短、跳跃能力极差的小羊。这只小羊立刻被用来繁育更多的后代,因为它的后代根本无法翻过低矮的羊圈,这使得羊群管理变得方便了许多。

图1-5 安康羊

这种短腿的变种在野外将毫无生存能力,但是它能够极大地方便牧民圈养,因此被牧民细心挑选并推广开来。很明显,安康羊是一次偶然的遗传变异的结果,因为其父母的腿都是正常的。

当然了,农牧民们还有一些在技术层面上更复杂的目标,例如怎样把不同的优良性状整合起来(当然,这里的“优良”一词仍然仅对人类适用,对于动植物而言就不一定是什么好事了,比如短腿的安康羊和麦穗不会自动脱落的小麦)。以另一种重要的驯化动物家猪为例,脂肪含量比野猪高、体型比野猪小、圈养在一起也从不打架斗殴的家猪是远古农民们梦寐以求之物。而繁育出这样的猪并不容易。农民们经常会发现,试图把几种优良性状集中起来的尝试往往以失败告终,而成功一般只会在漫长的等待和无数次的失败中偶然且随机地出现(见图1-6)。

图1-6 两种家猪杂交的假想结果

将分别携带两种优良性状的猪(“肉”和“乖”)杂交,后代的性状可能有数种完全不同的组合方式。

打个比方吧。假设农民手中现在有了两种还算差强人意的家猪:一种肥肉较多,但脾气暴躁,不易于集中饲养,我们叫它“肉猪”;一种脾气倒是不错,可惜骨瘦如柴,我们叫它“乖猪”。当然,又肉又乖的猪是最完美的啦。一个简单的思路就是,选一头公肉猪,一头母乖猪(当然也可以选公乖猪和母肉猪),让它们交配产仔。按照泛生子融合理论,后代岂不是应该同时具备来自父母的两种优良属性?然而现实往往是,生出来的小猪有很大概率不会是又肉又乖,反而连原本的“肉/乖”属性也会减弱。更可气的是,可能还会有一些小猪居然整合了两种较差的性状,变得又瘦又暴躁。往往需要反复多次的交配繁殖,农民们才能得到真正整合了两种优良性状的小猪;而往往他们还需要同样长的时间,才能找到把这两种生物性状稳定遗传下去的小猪,真正开始他们繁育“肉+乖”猪的伟大事业。

为什么有的性状能够稳定遗传,而有的出现了一次就消失不见了呢?为什么有的性状看起来黑白分明,有的就会出现各种复杂的数量变化?为了搞清楚遗传的秘密,1854年,一位瘦削的中年神父在奥匈帝国边陲的圣托马斯修道院的后院种下了一批豌豆。他的名字叫格里高利・孟德尔(Gregor Johann Mendel)。

那个时候,我们故事的第一位主角达尔文早就结束了贝格尔号上的环球旅行(见图1-7)。他从非洲、美洲和太平洋小岛上采集的无数珍奇标本早已让他作为博物学家享誉天下。而旅途中,达尔文曾在厄瓜多尔以西的加拉帕戈斯群岛短暂停留了一个月。在那里,达尔文看到了许多让他困惑不已的现象。一些体型不大、毛色暗淡的小鸟(这些鸟后来以“达尔文地雀”为名名垂史册)吸引了他的注意。这些地雀分属十几个物种,嘴巴形态不一,有的更圆钝,有的较尖锐,而其他性状都非常接近,这暗示它们有着很近的亲缘关系。所以,达尔文自然而然地设想,这些鸟儿应该有着共同的祖先,在漫长的世代繁衍中逐渐出现了各种遗传变异,影响了鸟嘴的形状,进而进化出了不同的物种。这个现象对于笃信《圣经》教义的达尔文来说是个重大危机,因为按照《圣经》所言,地球上所有物种都是上帝在创世纪的几天里创造的,是一成不变的。《圣经》并没有给地球生物的任何细微变化留出空间,更不要说全新物种的出现了!可能也正是基于这样的观察和思考,让达尔文在结束旅行后的20年里离群索居,直到1859年出版了那本注定要震惊世界的《物种起源》。

图1-7 达尔文随贝格尔号的旅行(1831—1836)

达尔文把这次航程称为“第一次真正的训练或教育”。也正是在环球航行的5年间,达尔文通过观察生物物种的变化,形成了物种进化的观念。在这次旅行中,位于东南太平洋上的加拉帕戈斯群岛具有特别的意义,直到今天仍然是不少进化生物学家开展研究的圣地。

而作为我们故事的第二位主角,孟德尔神父的目标远没有达尔文那么宏大(见图1-8)。和我们刚刚提及的农牧民一样,他大概仅仅希望从自己的豌豆田里,看看能否发现遗传的秘密——就像我们刚刚说过的,生物的性状究竟是按照什么样的规律遗传下去的,为什么有时稳定,有时不见踪影,有时黑白分明,有时又呈现出黑白之间的各种灰色地带呢?

而这时候,我们马上可以看到孟德尔和达尔文的不同,可能也正是这种不同确保了前者的成功。

孟德尔并没有像达尔文那样,从古希腊哲学中借鉴来“泛生子”的概念,并试图拓展这个概念,用来解释遗传的所有秘密——我们已经知道,这样的做法固然可以自圆其说,但并不能为解释遗传现象提供任何新的线索。毕竟,谈论了上千年之久,达尔文仍然不知道这种肉眼不可见的“泛生子”到底是个什么东西,又有着怎样的特性。

图1-8 达尔文(左)和孟德尔(右)

两位生活在同时代的巨人一生中从未谋面。虽然孟德尔肯定了解达尔文的进化论,但达尔文很可能并没有注意到孟德尔的研究。

孟德尔的做法几乎完全相反,他抛开了一切预设的学说和假定,单纯从豌豆杂交的现象出发,试图发现隐藏的遗传规律。

孟德尔神父首先选择了一些看起来泾渭分明、非常容易确认和定量统计的性状,例如豌豆种子的表皮是光滑的还是褶皱的,种子表皮是黄色还是绿色,豌豆花(见图1-9)的颜色是白色还是紫色,等等。然后选出性状截然不同的一对“父亲”和“母亲”豌豆,把“父亲”花朵的花粉小心翼翼地收集起来,轻轻播撒在“母亲”花朵的雌蕊上,开始了他的杂交试验。

图1-9 豌豆花

豌豆开着像蝴蝶翅膀一样的花朵。豌豆是一种典型的自花授粉植物,花瓣密闭,在自然状态下只有自身的雄蕊可以为雌蕊授粉。这可能也是孟德尔挑中豌豆的原因之一。这样一来他可以完全控制授粉过程,不需要担心随风飘散的花粉的干扰。

第一轮试验的结果就足够让人震惊了:在孟德尔挑选的全部七种性状方面——不管是种子表皮的颜色、花朵的颜色还是植物的高度,杂交后代都表现出了高度一致的性状来。比如说,黄豌豆和绿豌豆杂交的后代全部是黄豌豆(见图1-10),紫花豌豆和白花豌豆的后代全部是紫花豌豆,高豌豆和矮豌豆的后代全部是高豌豆。换句话说,在杂交一次之后,来自“父亲”或者“母亲”一方的某种性状就彻底消失了,这似乎已经在挑战人们习以为常的融合遗传理念了:难道孩子不是会从父母那里分别继承一些性状才对吗?难道不是父母的泛生子水乳交融构成了孩子的一切吗?

图1-10 孟德尔的第一次杂交试验

黄豌豆和绿豌豆杂交的结果是,后代结出的是清一色的黄豌豆。

孟德尔的做法仍然是非常实用主义的。看到这样的结果,他想到的不是去修补看起来出了问题的遗传融合理论,而是做了一个非常技术性的处理:他把杂交后消失的性状称为“隐性”的,而把杂交后仍然顽强显现出来的性状称为“显性”的。

“你看,”孟德尔解释说,“性状只能有一个——种子不可能又黄又绿,而来自父母的遗传性状却有两个。那么我们看到的结果就说明,来自父母的遗传性状如果互相矛盾,则只有一个会胜出——就像黄色的种子、紫色的花朵,以及高高的茎秆,而另一个就会被‘隐藏’起来。很简单,不是吗?”

嗯,确实挺简单。不过,你可能会马上反驳,和泛生子的概念一样,显性和隐性的概念也并没有提供任何新的信息,只不过是把孟德尔看到的现象换了个名词描述一下而已。他看到黄色种子的杂交后代,于是黄色种子就是显性的;他没有看到白色花朵的杂交后代,白色花朵就是隐性的,仅此而已。

但是如果你仔细想想,就会发现显性、隐性的概念不但能解释孟德尔已经看到的现象,而且还可以给出某些他尚未观察到的现象的预测。

比如,按照这套显/隐性的遗传逻辑,我们马上可以想象,在孟德尔收获的杂交豌豆中,必然同时存在来自父母双方的两套遗传物质,而这两套遗传物质并没有像红色和蓝色墨水一样均匀混合在一起变出非红非蓝的紫色,而是其中显性的一套“压制”了隐性的一套。那么问题就来了,如果我们栽培这样的杂交豌豆,等待它们再次开花,再让它们继续杂交一次,会看到什么现象呢?

简单起见,我们来考虑一下黄色和绿色豌豆杂交的产物。这些长着黄色种子的第一代杂交豌豆如果自己和自己交配会出现什么情况呢?第二代杂交豌豆又会是什么样子的?它们结出的种子会是黄色还是绿色呢?

孟德尔确实这么做了。第二年,他细心交配了258株结着黄色种子的第一代杂交豌豆,并在当年收获了超过8 000颗新一代(也就是第二代)的豌豆种子。果然如他的显/隐性假说所料,绿色豌豆又重新出现了!这个发现已经毋庸置疑地证明,绿色豌豆这一性状并没有在第一次杂交中被永久性地稀释和消失。即便在一律呈现黄色的第一代杂交豌豆中,绿色豌豆的遗传蓝图仍然顽强地存在着。

图1-11 孟德尔的第二次杂交试验

黄豌豆和绿豌豆杂交产生的黄豌豆后代,继杂交一代之后,后代重新出现了绿色豌豆,黄:绿比例非常接近3:1。

而且更有意思的是,在第二代杂交豌豆种子中,孟德尔发现了一个相当有趣的比例关系:6 022颗为黄色,2 001颗为绿色,比例为3.01:1(见图1-11)。

这个数字是如此接近3:1的简单配比,已经很难用巧合来解释了。而且这个比例还出现在孟德尔所关注的全部七种豌豆性状中。不管是豌豆表皮的光滑或褶皱,豌豆花是紫色或白色,豌豆茎秆是高还是矮,每一次试验中,3:1这个比例都在反复出现。

我相信读者们可能对中学课本里的孟德尔遗传定律仍旧记忆犹新,因此完全能够条件反射般地说出这个3:1比例关系背后的原因。但是在这里,我倒是建议你们干脆忘记课本上的知识,我们一起来想一想,站在孟德尔神父的立场上,我们该如何试图去理解3:1背后的规律,甚至进一步通过试验来证明它呢?

首先我们已经知道,绿色豌豆在第二次杂交中重新出现这个事实,已经证明了在豌豆交配和繁殖过程中,来自上一代豌豆的遗传信息并没有被稀释和丢失。记录着“绿色豌豆”的遗传信息仍然顽固存在于黄色的第一代杂交豌豆的种子里。而孟德尔对此提供的解释是他的显/隐性理论:黄色是显性,绿色是隐性,两者都存在的时候显性压制了隐性。

因此我们马上可以推出,第一代杂交出现黄色豌豆,必然是黄/绿遗传信息同时存在;而第二代中出现的占比1/4的绿色豌豆,肯定拥有绿/绿遗传信息,因为只有这种组合才会显现出“隐性”的绿色嘛。

好了,黄/绿豌豆和黄/绿豌豆杂交,会出现占比1/4的绿/绿豌豆,以及占比3/4的黄色豌豆。当然了,根据孟德尔的假说,我们目前还不知道这些黄色豌豆究竟是黄/黄还是黄/绿——两种情形下豌豆表皮都会是“显性”的黄色。

第一代杂交:黄/绿=黄/绿

第二代杂交:黄/绿×黄/绿=3 黄/?:1绿/绿

或者我们可以借用孟德尔的方法,用大小写字母代替显性或隐性的遗传性状(见图1-12):

第一代杂交:AA(黄色)×aa(绿色)=Aa(黄色)

第二代杂交:Aa(黄色)×Aa(黄色)=3A?(黄色):1aa(绿色)

图1-12 两次豌豆杂交试验的遗传学解释

如果我们用A代表黄豌豆性状,a代表绿豌豆性状,那么孟德尔的杂交试验就可以被完美解释。

看到这里,3:1比例背后的逻辑已经昭然若揭。要在Aa杂交的后代中产生aa,唯一的可能性,是父母双方分别给出一个a类型的遗传信息,从而组合出aa来。可以想象,如果Aa父母能给出a类型的遗传信息,自然也可以给出同等数量的A类型遗传信息。因此,后代遗传信息的组合至少有三种:AA、Aa和aa。三者的比例关系很明显是1:2:1。考虑到显性A相对隐性a的“压制”,3:1的比例关系也就自然而然出现了!

那么有没有办法直接验证这个推理呢?

有,而且并不复杂,把第二次杂交的豌豆继续做第三次杂交就可以了。如果上面的推理正确,我们马上可以推算出,所有的绿色豌豆(aa)杂交的产物必然全部是绿色豌豆(aa),而黄色豌豆杂交的结果就会较为复杂:接近1/3的黄色豌豆(AA)杂交将会产生清一色的黄色豌豆后代(AA),而剩下2/3黄色豌豆(Aa)杂交的后代中,将会再一次浮现3:1这个简洁的比例关系。

事实上,孟德尔把这样的杂交试验一共进行了五六代。在长达8年的时间里,孟德尔神父照料着上万株豌豆,在豌豆开花的季节小心收集雄蕊的花粉,拨开紧闭的花瓣进行人工授粉,仔细清点收获的种子……每一次,豌豆后代的性状都完美符合这些简单的数字分配规律。

这就是孟德尔杂交试验所揭示的遗传秘密。这秘密并不仅仅关于豌豆,也不仅仅关系到种子表皮的颜色或者褶皱。上述推理的最大价值,在于说明遗传信息在一代代的传递过程中不存在像液体一样的融合和稀释,而是以某种坚硬的“颗粒”形态存在。每一次生物交配,都意味着遗传信息“颗粒”的重新分离和组合。遗传信息的组合方式可以五花八门,但遗传信息本身却始终顽强存在着,并且随时准备在允许的场合影响生物体的性状。

一个历史的遗憾是,尽管达尔文进化论和孟德尔颗粒遗传理论几乎出现在同一时代——达尔文的《物种起源》和孟德尔的《植物杂交实验》发表相距仅有短短6年,但事实上直到70多年后的20世纪30年代两者才真正被联系在一起。然而我们完全不需要替他们两位感到遗憾。站在科学的高度上,颗粒遗传理论使得詹金的责难不复存在,不管是多么微小的遗传变异,都仍然可以以这种颗粒的形式顽强地存在下去,不被稀释。从某种意义上说,孟德尔为达尔文的学说提供了坚实的物质基础,而达尔文则为孟德尔的发现找到了壮丽的用武之地。两位生活在同时代却缘悭一面的科学巨人,如果在天堂相见,一定会对此无比欣慰。

围猎遗传因子

孟德尔的豌豆杂交试验有一个直白的推论,那就是在父母亲的体内存在许多颗粒状的、携带着父母遗传信息的物质——例如“黄豌豆”遗传物质和“绿豌豆”遗传物质——这些物质会在交配过程中同时进入后代的体内。而在此之后,在这些后代每一次繁衍的时候,都会重复一次分离再组合的过程,孟德尔把这些物质简单称为“遗传因子”。到了20世纪初,孟德尔的遗传因子又被重新命名为“基因”(gene)。“gene”这个单词明显是从“泛生子”(pangene)简化而来的,反倒是“基因”这个来自中国第一代遗传学家谈家桢先生的中文翻译颇具神韵。基因基因,不就是携带着遗传信息的最“基”本单元的“因”子嘛。

有些读者可能会马上想到,基因分离和组合的过程有点类似于化学反应的过程。比如说,将氢气和氧气混合后点燃,在爆炸声中就产生了水。在此过程中四个氢原子和两个氧原子反应生成两个水分子,化学反应式可以写成下面的样子(见图1-13)。

图1-13 氢气和氧气反应生成水的示意图

在此过程中,氢原子和氧原子发生了连接方式的变化,但是其数目并没有变。

在此过程中,不论是氢原子还是氧原子本身都没有发生什么变化,反应前我们有四个氢原子、两个氧原子,反应之后仍然有同样多的氢原子和氧原子。发生变化的只是这些原子之间连接的方式。

同样,按照颗粒遗传理论,不管在哪一代豌豆体内,也不管豌豆表皮是黄是绿,“黄豌豆”遗传因子和“绿豌豆”遗传因子也都始终如一,发生变化的是它们组合的方式。

就像原子论极大地推动了化学的发展一样,至少在科学意义上,颗粒状的基因要比像液体一样混合的泛生子方便处理得多。从我们对豌豆杂交结果的讨论就能看出来,颗粒状的基因能简单用各种字母代替,而我们甚至难以想象能自由融合的泛生子到底是一种什么东西。

随之而来的问题是,这种颗粒状的基因到底是什么呢?它们当然非常微小——否则也不可能隐藏在豌豆花粉之中随风飘散。既然每一代生物体内都有它的存在,我们是不是可以用某种方法把它提取出来,就像我们从成吨的金矿石中通过破碎、研磨以及化学反应提取出区区几克黄金一样?

进入20世纪,特别是在孟德尔的颗粒遗传理论被重新发现,正式进入人类的主流科学认知之后,一代代最聪明的头脑投入到猎取基因颗粒的工作中。

当然了,与淘金相比,猎取基因颗粒要困难得多。我们至少早早就见到了天然存在的纯金的样子,也知道它具备的许多物理化学性质:它的密度很大,超过了大部分矿石;它很难和酸碱发生化学反应;它能溶解在由三份盐酸和一份硝酸配比成的王水里;等等。利用这些信息,我们可以设计出提取纯金的程序,也可以设计出检验最终黄金成色的方法。而基因呢?基因长什么样我们可是一无所知啊。

在孟德尔的试验里我们已经知道了基因的一个至关重要的属性,比如“黄豌豆”基因能够让豌豆表皮呈现黄色。那么我们是不是可以这么做——找一堆黄豌豆,切碎磨细,用各种化学方法将其分离成各种各样的物质,然后把每种提取出来的物质再通过某种方法放到一颗绿豌豆里面去。如果这颗绿豌豆从此就能结出黄色的种子,我们是不是就可以反推这种物质就是传说中的“黄豌豆”基因?

这么说下来你们可能会觉得很可笑,这方法听起来一点也不高明,而且也没什么“科学”的影子。基因这么高大上的科学概念,难道不是该有一套更先进、更现代的研究方法吗?传说中的显微镜、离心机、培养皿这些电视上常见的生物研究设备呢?不过仔细想想你就会明白,这几乎是唯一能够帮助我们猎取基因的办法了!因为关于这种被叫作基因的东西,我们唯一知道的就是它存在于生物体内,能够产生某种特别的性状(例如“黄豌豆”基因能够让豌豆长出黄色的表皮)。我们当然必须靠这一点来寻找和理解它。

猎取基因的第一个重大突破发生于20世纪20年代的英国。为英国政府工作的病理学家弗雷德・格里菲斯(Fred Griffth)试图发明出疫苗来对抗当时肆虐全欧的细菌性肺炎。当时人们已经知道,想要获得对某种传染病的免疫力,一个办法是让人先接触某种较弱的传染源。英国医生爱德华・琴纳(Edward Jenner)正是让孩子们先感染对人危害较小的牛痘病毒,从而让他们获得对致死性的人类天花病毒的免疫力。格里菲斯当然也想重复琴纳的成就。因此,他也试图寻找毒性较弱的肺炎链球菌,人工催生人体对肺炎的免疫力。

格里菲斯手里有两种从病人那里收集来的肺炎链球菌(见图1-14),一种外表光滑,一种表面粗糙(是不是又让你想到了孟德尔手里表皮光滑或褶皱的豌豆)。前者能够引起肺炎,对实验老鼠来说是致命的,但后者并没有什么毒性。当然我们现在知道,表面光滑的细菌外层包裹着一层多糖外壳。实际上,并不是细菌本身,而是这层多糖外壳引发的剧烈免疫反应杀死了病人和实验动物。

所以自然而然的,格里菲斯产生了两个想法:给老鼠注射表面粗糙的细菌,或者注射已经杀死的表面光滑的细菌,这两种“较弱”的刺激是不是能够催生老鼠对抗致命性肺炎的免疫力?

结果让格里菲斯很失望(见图1-15),实验老鼠看起来很健康,这说明这两种刺激确实“较弱”,老鼠也并没有获得什么免疫力。于是他再接再厉,干脆把两种较弱的刺激混合在一起注射给老鼠。也许这样能好一点?与其说格里菲斯的想法是顺理成章,不如说是破罐破摔。

图1-14 两种肺炎链球菌

粗糙型(左)和光滑型(右)肺炎链球菌的显微镜照片。

可是混合注射的结果大大出乎了格里菲斯的意料——老鼠居然很快就死掉了,就像它们真的患了肺炎一样!可这肺炎是从何而来的呢?能够致病的光滑型细菌已经彻底煮熟死掉了,活着的粗糙型细菌又明明没有任何致病性。而且更要命的是,格里菲斯从死亡的老鼠体内,居然发现了活着的光滑型细菌!煮熟的光滑型细菌“菌死不能复生”,那这些活着的光滑型细菌又是从何而来的呢?

图1-15 格里菲斯的肺炎链球菌转化试验

简单来说,给老鼠注射不能致病的粗糙型细菌(蓝,左一),老鼠安然无恙。注射能致病的光滑型细菌(红,左二),老鼠会死亡。致病性光滑型细菌如果经过热处理(浅红,左三),也就失去了致死性。最有意思的是,活着的粗糙型细菌在与热灭活的光滑型细菌混合后(左四)重新产生了致死能力,这说明活着的粗糙型细菌从死亡的光滑型细菌那里获取了后者的遗传物质,被“转化”成了后者。

看到这里大家大概已经明白了,格里菲斯无意间做的这个混合注射试验,不就是我们刚刚假想过的寻找“黄豌豆”基因试验的翻版吗?已经死掉的光滑型细菌和活着的粗糙型细菌放在一起,能让后者干脆“变成”光滑型细菌,并且杀死可怜的小老鼠。这不就正好说明,细菌表面是光滑还是粗糙,就和豌豆表皮是黄还是绿一样,是由某种基因决定的吗?而且,既然死掉的光滑型细菌能让活着的粗糙型细菌华丽变身(格里菲斯把这种现象叫作“转化”),岂不是说明光滑型细菌基因能够轻松进入粗糙型细菌,并且改变它的遗传性状?更进一步说,如果能够利用这个简单的实验系统,从光滑型细菌里提取出能让粗糙型细菌变身的物质,我们不就能看到基因的真面目吗?

也正是因为这个原因,猎取基因的进展在格里菲斯的偶然发现之后骤然加速了。至少,在这个系统里,科学家需要处理的仅仅是微小的细菌,而不是豌豆这种一年才开一次花的庞然大物。在大洋彼岸的美国纽约洛克菲勒医学研究所,几位科学家的接力赛跑在十几年后终于为我们揭示了基因的真面目。而他们的做法其实就和我们刚刚假想的“黄豌豆”基因分离实验差不多。

在那个时代,人们已经对组成生命的几大类物质——蛋白质、脂肪、碳水化合物及核酸(特别是DNA和RNA)——有所了解了。洛克菲勒医学研究所的奥斯瓦德・西奥多・埃弗里(Osward Theodore Avery Jr.)在将光滑型肺炎链球菌煮沸之后,从中提取了可溶于水的物质(这样就首先去除了不溶于水的脂肪),再利用三氯甲烷将蛋白质去除,之后又利用乙醇沉淀出了某种纤维状的透明物质(见图1-16)。他证明,这种纤维状物质能够将粗糙型的肺炎链球菌成功转化为光滑型。也就是说,光滑型细菌的基因就是这种纤维!

埃弗里有足够的信心认定这种纤维分子就是已知的化学分子DNA。他首先证明,这种纤维状分子的化学组成和人们熟知的DNA别无二致,都含有一定比例的碳原子、氢原子、氮原子和磷原子。更重要的是,他发现一种能特异性消化DNA分子的酶能够破坏掉纤维的转化能力,而如果用能消化蛋白质或者RNA分子的酶来处理,则不会对这种转化能力产生任何影响。

图1-16 埃弗里实验

简单来说,埃弗里发现,如果用能够降解RNA分子的RNA酶或者能够降解蛋白质分子的蛋白酶处理光滑型肺炎链球菌,就不会影响其将粗糙型细菌转化成光滑型细菌的能力。但是如果消化掉DNA分子则会破坏这种转化能力。因此,具备转化能力的遗传物质就是DNA。

因此,在孟德尔提出颗粒遗传理论近百年后,我们终于开始对遗传因子颗粒的物质属性有了了解。解释遗传真相,我们再也不需要泛生子这样的抽象理论了。遗传信息的载体是一种叫作DNA的化学物质!它携带着来自父亲和母亲的遗传信息进入后代的机体中,作为生命蓝图决定了后代丰富多彩的性状(从豌豆表皮的颜色到肺炎链球菌的外壳)。

当然,我们这么说有点事后诸葛亮的乐观主义。实际上,在20世纪40年代,尽管埃弗里的实验很快得到了同行的重复验证,但大家对于DNA就是遗传物质这件事还是有点将信将疑。

甚至对于埃弗里实验最低程度的接受——DNA至少在遗传过程中起着很重要的作用——都不是很普遍。同行们质疑的原因倒是也很直白:埃弗里实验有一个逻辑上无法克服的缺陷,他是依靠化学提取从光滑型细菌中得到纤维状DNA分子的。尽管从技术上说,他可以尽量优化提取过程,保证提取出来的DNA纯而又纯,不包含任何杂质(埃弗里和同事也证明了这一点),但是从逻辑上说,反对者总是可以质疑也许埃弗里提取出的DNA携带了极其微量的、现有技术无法检测出来的蛋白质。因此,质疑者总是可以说,是这些蛋白质“杂质”传递了遗传信息。DNA只不过是碰巧在那里出现,却因为数量巨大、长相又抓人眼球,才窃取了遗传因子的美名。

想要严肃排除微量蛋白质杂质的干扰,光靠实验技术的改进是不可能的——不管埃弗里将蛋白质去除得多么干净,反对者都可以用同一个逻辑来反问:“你怎么知道里面不存在现有技术检测不出来的微量蛋白质?”想要真正彻底排除蛋白质的干扰,我们需要换一个方法来思考问题。

当然,必须得说埃弗里实验已经让一部分人先明白起来了。他们突然意识到,DNA分子是遗传物质这件事,虽然听起来像是天方夜谭,但似乎并不是没有蛛丝马迹可循。早在此前40年,人们就已经知道生物体的细胞中隐藏着一种能被碱性染料染成深色的丝状物质——也就是我们今天熟悉的染色体。在动物产生生殖细胞的时候,这些细丝会小心翼翼地平均分配到两个后代细胞中去(见图1-17)。而当两个生殖细胞——精子和卵子——融合,开始发育时,两个生殖细胞中的这种丝状物质又会很有默契地配对到一起。

图1-17 细胞分裂的过程

在一次细胞分裂的过程中,深色的染色体分散到细胞的两端,细胞从中断裂,一分为二,染色体也随之进入到两个后代细胞当中。染色体的移动规律和孟德尔杂交试验中遗传因子的行为看起来很相似。

这个过程听起来是不是和孟德尔对遗传因子的猜测有点像?染色体的分离对应着父母遗传信息的分离,而精子和卵子内的染色体的重新配对又对应着后代体内遗传信息的重新组合。因此,当时就有人猜测,基因其实就定位在染色体上。而继孟德尔之后最伟大的遗传学家,托马斯・亨特・摩尔根(Thomas Hunt Morgan)进一步发展了这个猜测,他利用果蝇证明了基因——比如决定果蝇的眼睛颜色是红还是白的“白色”基因,就定位在果蝇性染色体的某个特定位置上。

而关于染色体的化学组成人们是很清楚的——就是DNA和蛋白质!

DNA这种物质连续两次出现已经不太像是巧合了。难道说,埃弗里实验的结论是正确的,DNA真的就是遗传物质?

距此约10年后的1952年,两位美国科学家,艾尔弗雷德・赫尔希(Alfred Hershey)和他的助手玛莎・蔡斯(Martha Chase)用完全不同的思路重新证明了DNA就是遗传物质(见图1-18)。为了避免蛋白质的干扰,他们走了一条和埃弗里完全不同的路,非常巧妙地利用了基因的另一个特性——世代间的传递。

我们已经知道,遗传因子的一大特性是能够影响后代的各种性状,比如豌豆表皮是黄色还是绿色,以及肺炎链球菌表面是光滑还是粗糙。埃弗里正是利用了这一点,首先证明了DNA就是这种遗传因子。我们稍微思考一下就会发现,遗传因子的这个特性需要一个前提条件,就是它必须能够有效地从父母那里传递给子女,再由子女传递给孙辈,世世代代传递下去。它就像一张蓝图,一个标签,一个设计师,决定了后代豌豆和后代肺炎链球菌的性状。反过来说,如果一种物质压根不能在世代之间传递,那它当然就不可能是遗传因子。赫尔希和蔡斯就是利用这一点,证明了是DNA而非蛋白质才能够在世代之间传递,因此,我们也就根本没有必要担心埃弗里实验中大家假想出来的所谓蛋白质杂质的污染了。

图1-18 赫尔希-蔡斯实验

这个设计精巧的实验旨在追踪到底是蛋白质还是DNA进入了病毒后代体内。为此,赫尔希和蔡斯用放射性同位素分别标记了病毒的蛋白质外壳(上,红色外壳)或内部的DNA分子(下,红色曲线),再用这些病毒感染细菌,繁殖后代。随后,他们在后代病毒体内检测放射性信号的强弱,最终发现当标记蛋白质外壳时后代放射性信号较弱(上),而标记DNA分子时放射性较强(下)。

他们的实验用到了一种比细菌还要微小的生物——噬菌体,这是一种依靠入侵细菌为生的病毒颗粒。人们当时已经知道,DNA的化学组成中含有磷元素而没有硫元素,蛋白质则恰好相反。因此赫尔希和蔡斯利用了这点微小的差别,用两种不同的放射性同位素——磷-32和硫-35——分别标记了噬菌体的蛋白质和DNA。当这种病毒入侵细菌,疯狂复制繁衍时,遗传因子就会进入它们后代的体内。可以想象,如果病毒后代带有磷-32的放射信号,那么DNA就更像遗传物质;反过来,如果病毒颗粒带有硫-35的放射信号,那么蛋白质才更有资格做遗传物质的候选。赫尔希和蔡斯的实验结果表明,病毒后代体内磷-32的放射性要显著地超过硫-35。换句话说,相比众望所归的蛋白质,DNA才更像那个能够在病毒世代之间传递遗传信息的分子。DNA就是遗传物质,我们苦苦寻觅的基因,一定是以DNA分子形式存在的!

双螺旋

豌豆杂交提示了遗传因子颗粒,肺炎链球菌和噬菌体的研究证明了DNA就是遗传物质。遗传的秘密是不是就此大白于天下了呢?

并没有。不仅如此,甚至可以讽刺地说,DNA是遗传物质这件事,反而使得遗传的秘密更令人困惑不解了。因为对于遗传性状在世代之间传递这件事来说,最终极的问题不是遗传因子是什么物质——当然找到这种物质,理论上应该能帮我们解决最终的问题——而是遗传因子是怎样记录遗传性状的信息的,比如豌豆表皮应该是黄色的,或者肺炎链球菌的表面必须是光滑的。

打个比方大家会更容易理解这个问题。假设我们手里有一份报纸,是用一种我们不懂的外国语言出版的。我们想知道这份报纸的头条社论在说些什么,光靠分析报纸的大小、密度、纸张的化学元素构成、油墨的配方和印刷方法,是不会有什么决定性作用的。我们真正需要的是解读这种陌生语言的词典,只有它能够帮助我们理解文章里每个单词、每句话的含义。

确定了DNA就是遗传物质,就像我们手上终于拿到了这份报纸。但是对“黄色豌豆”“光滑型细菌”这样的信息是如何写在DNA上的,我们仍然一无所知。更要命的是,在当时人们的视野里,DNA可能是最不适合用来做信息载体的物质了!

为什么呢?当时人们已经知道,DNA分子由四种较为简单的脱氧核糖核苷酸分子组成(见图1-19)。这四种分子上分别带有一个名为碱基的标签,因此,人们很多时候干脆就用这四种标签的名字来指代它们(见图1-20):分别是腺嘌呤(Adenine, A)、胸腺嘧啶(Thymine, T)、鸟嘌呤(Guanine, G)和胞嘧啶(Cytosine, C)。纯净的DNA分子之所以会呈现细长的纤维形态,正是因为这四种核苷酸分子首尾相连形成了超长链条,就像一个个金属圈嵌套形成的铁链。当时甚至有一种(尽管未经证实)观点认为,就连四种金属圈嵌套的先后顺序都是完全一样的,这样的一根铁链不管延伸多长、套多少个金属圈,能携带的信息量都少得可怜,更别说记录像豌豆表皮颜色和细菌表面形态这么具体的信息了。

图1-19 DNA长链示意图

一小段由四种核苷酸单体分子(以A、T、C、G为代表)首尾相连串起来的DNA分子。

在这里顺便插句话,为什么埃弗里的DNA提纯实验自1944年发表之后,很长时间里都没有被同行接受?我们说过,同行们质疑的首要原因是技术性的:埃弗里没有能力保证DNA样品绝对没有受蛋白质杂质的污染,也许就是那一点点蛋白质才是遗传信息的载体呢!但是在内心深处,大家很可能在感情上和逻辑上压根就难以接受DNA是遗传物质这个声明,因为这样会马上把遗传学家置于非常尴尬的境地——他们实在是无法想象如此单调的DNA长链,怎么可能是用来记载和传递复杂的遗传信息的。

不过,1952年赫尔希和蔡斯的噬菌体实验逼得遗传学家们不得不正视房子里的大象了。好了,DNA就是遗传物质,被大象逼到墙角的遗传学家们需要马上想出办法,解释遗传信息是怎么写在这根无聊的DNA长链里的。

图1-20 组成DNA的四种碱基分子

DNA的一个很重要的特性是,这四种分子之间可以通过氢原子间的相互作用配对,A和T配对,C和G配对。这个特性我们还会反复提到。

图1-21 发现DNA双螺旋结构四人组

其中,富兰克林病逝于1958年,其余三人在1962年共享了诺贝尔生理学或医学奖。

伟大的夏洛克・福尔摩斯曾说过,当你已经排除了其他所有的可能性,不管看起来有多么不可能,剩下的那个就必须是真相(语出柯南・道尔的《斑点带子案》)。仅仅一年以后,1953年,DNA双螺旋模型横空出世。遗传信息的记录和传递方式从此大白于天下。四位科学家,詹姆斯・沃森(James D.Watson)20世纪分子生物学的带头人之一,被称为“DNA之父”,1962年诺贝尔生理学或医学奖获得者。其著作《双螺旋》(插图注释本)中文简体字版已由湛庐文化策划,浙江人民出版社出版。——编者注、弗朗西斯・克里克(Francis Crick)、莫里斯・威尔金斯(Maurice Wilkins)和罗莎琳德・富兰克林(Rosalind Franklin)也因此名扬四海(见图1-21)。

今天,作为象征人类最高智慧的代表作品,大大小小的DNA双螺旋模型矗立在地球上的各个学校、科技馆和公园。读者们应该也或多或少了解一些那段激动人心的科学历史。但是不知道大家有没有想过,为什么DNA双螺旋会被认为是现代生物学的开端?故事看到现在我们已经明白,在1953年时,通过埃弗里实验和赫尔希-蔡斯实验,我们已经确信DNA就是遗传物质。那么它究竟是一条长链还是两条,是优美的螺旋形还是一团乱麻,有那么重要吗?

有,还真就是这么重要(请原谅我的故弄玄虚)。围绕DNA双螺旋的发现,生物学历史上的英雄人物们悉数登场。在继相对论和量子力学刷新了人类的时空观和物质观之后,璀璨群星再一次照亮了人类世界最隐秘的角落。

在故事的一开始,被大象逼到墙角的生物学家们不得不首先抛弃原来那个很有说服力、但从未得到证实的理论。他们不得不先假定,构成DNA链条的四种碱基分子可能并不是以一种固定不变的排列顺序串联起来的。因为只有这样,DNA长链上才可能出现五花八门的碱基排列顺序,而这些序列本身是可以携带遗传信息的。

这一点不难理解。比如,如果构成DNA的四种碱基分子,每一种都能决定一种遗传性状,比如A代表“黄豌豆”,T代表“褶皱豌豆”,C代表“紫色豌豆花”,G代表“高茎豌豆”,那么它们携带的信息无疑是特别有限的——就连孟德尔曾经研究过的区区七种性状都代表不完。但如果两个碱基组合可以用来编码一种信息,那信息量一下子就从4种增加到了42种(AA、AT、AG、AC、CA、CT、CG、CC、TA、TT、TG、TC、GA、GT、GG、GC)。那么三个碱基的组合呢(那就是43种)?四个碱基的组合呢(那就是44种)?一万个碱基的组合呢(那就是410000种)?不管实际情况如何,这么想来,DNA携带和传递遗传信息的能力至少在理论上是没有问题了。

那么实际情况如何呢?DNA双螺旋又能如何帮助我们理解遗传呢?晶体学家威尔金斯和富兰克林获得了DNA晶体的X射线衍射图谱(见图1-22)。根据这种射线穿透DNA晶体后在胶片上留下的黑色印记,沃森和克里克用硬纸板和铁丝手工制作搭建出了相互缠绕的DNA双螺旋模型(见图1-23)。更重要的是,他们敏锐地借鉴了生物化学家埃尔文・查加夫(Erwin Chargaff)的发现,意识到两条缠绕在一起的DNA长链应该遵循着非常朴素的配对规则。一条链上的A碱基总是需要和另一条链上的T碱基配对,而C碱基则一定要和G碱基配对,它们就像中式衬衫的纽扣结一样结合在一起,构成了稳定的双螺旋结构。而这一点也就意味着,从任意一条DNA长链的碱基序列出发(如A-T-C-C-G-C),可以完美预测出双螺旋中另一条DNA长链的碱基序列(G-C-G-G-A-T,两条链是以相反的顺序配对的)——两条链所携带的信息是完全等同的。

图1-22 DNA双螺旋的X射线衍射图

这张照片由英年早逝的女科学家罗莎琳德・富兰克林拍摄。

图1-23 沃森(左)和克里克(右)

他们在讨论他们用硬纸板和铁丝搭起来的DNA双螺旋模型。

既然如此,遗传信息的代际传递至少从逻辑上就变得非常简单了。当一个小小的肺炎链球菌需要一分为二,产生两个体型较小的后代时,它的DNA双螺旋只需要从中分开,公平地为两个后代各自分配一条单链就可以了。当然了,后代的这条单链DNA总还是要变成双螺旋形状,才好继续下一次分裂和繁衍后代的过程(见图1-24)。这个过程并不难理解,只需要想象有一个微小的分子机器,能够根据这条单链的碱基序列(如A-T-C-C-G-C)和朴素的配对规则(A和T, C和G)工作,新的G-C-G-G-A-T链就能形成,DNA双螺旋也就可以重新产生了。这个过程不涉及任何新信息的输入,图纸已经就绪,搬砖砌瓦的工作虽然烦琐,但还在生物学家可以理解的范围内。

几乎是在一瞬间,人们就已经相信这就是遗传信息的传递法则。这套模型简直太简洁、太优美了!

图1-24 DNA半保留复制模型

简单来说,在DNA复制时,原有的DNA双螺旋会一分为二(①红色),分别按照碱基配对原则,为两条单链匹配上新的碱基分子(②蓝色),最终形成两条独立的DNA双螺旋,每一条都是新旧参半(③红蓝混合)。

有位科学家是这样评价科学发现和科学家同行的:看到一个科学发现,科学家们的反应一般只有两种,一种是“这有什么了不起”,另一种则是“我为什么没想到”。DNA双螺旋在科学界引发的反应毫无疑问是后者。作为公认的DNA双螺旋模型的创立者,詹姆斯・沃森和弗朗西斯・克里克在1953年发表的论文其实非常简短,简短到没有任何实际的实验数据,仅仅展示了一个他们猜测的DNA呈双螺旋缠绕的模型。DNA双螺旋的意义是如此简洁和清晰,在看到这篇论文的时候,世界上一定有数不清的聪明脑袋在懊悔地大喊:“我为什么没想到!”很快,这个优美的模型也获得了实实在在的证据支撑。

证据来自1958年,距沃森和克里克发表他们的双螺旋模型之后仅仅五年。马修・梅塞尔森(Matthew Meselson)和富兰克林・斯塔尔(Franklin Stahl)证明了双螺旋模型所揭示的DNA复制过程。在很多人眼里,梅塞尔森-斯塔尔实验可能是整个生物学历史上最漂亮的实验了。因此,在我们的故事里,它也理应获得一席之地。

让我们回头再审视一下双螺旋模型,看看它所提示的DNA自我复制和遗传信息传递的过程。两条相互缠绕的DNA长链首先解离螺旋,鉴于两者都忠实遵循着A-T和G-C的碱基配对规则,所以,它们所携带的信息是完全等同的。这样一来,只要存在某种分子机器,能够为分解开的两条单链再次匹配相应的碱基,就能够实现从一个DNA双螺旋到完全相同的两个DNA双螺旋的复制变化。在这种变化中,原本的两条DNA链被平均分配到两个后代中,两条新生的DNA链随之加入它们。因此,在后代的DNA双螺旋中,一半DNA保留自上一代,另一半则产生于子代自身。沃森把这种过程形象地称为“半保留”复制。

可是我们怎么证明这一点呢?DNA为什么必须要采用这种半新半旧的复制方式?我们同样也可以想象一种分子机器,能够根据DNA双螺旋的碱基顺序,直接制造出一个新的、完全一样的双螺旋来。甚至,为什么DNA一定要整条长链同时参与复制?难道不能首先把它断成一截一截再进行复制,之后再拼装起来吗?

你们可能已经看出来了,区分这三种可能性的核心在于,子代的DNA里面有多少成分是来自上一代。半保留模型预测,子代的DNA恰好有一半来自上一代,不多不少;全复制模型则预测子代的DNA全部是新生的,没有一点上一代的痕迹(尽管它们携带的信息是完全一致的);而在“碎片化复制”模型里,子代和上一代的DNA由于频繁的断裂和拼接已经水乳交融,根本区分不开了。那么,想要通过实验验证DNA复制和遗传信息传递的法则,核心当然就是如何才能知道DNA分子是来自上一代还是由子代新生的呢?

借鉴了赫尔希-蔡斯实验的巧妙设计,梅塞尔森和斯塔尔也同样想到了用同位素标记DNA的方法,只不过他们这次利用的不是放射性,而是同位素原子之间的重量差异。他们首先把细菌在含有氮-15同位素的培养基上持续培养。我们已经知道,DNA分子中含有氮原子,因此,在经过许多代培养后,我们有理由相信细菌DNA分子的全部氮原子都已经被替换成了较为不常见的氮-15。在此之后,他们再把细菌转移到含有在自然界中常见的氮-14同位素的培养基上。从这个时间点开始,DNA复制将只能使用氮-14同位素。换句话说,任何新生的DNA分子和原本存在的DNA分子因为利用了不同的氮同位素,将会在密度上带有细微的差别。这些细微的差别就可以告诉我们,细菌子代的DNA到底从何而来。

在不同的时间点上,梅塞尔森和斯塔尔从一部分细菌中提取DNA分子,然后利用超高速离心的方法判断它们的密度。他们收获的第一代细菌DNA分子的密度,已经偏离了上一代DNA分子的密度,而且其密度恰好介于纯的氮-15DNA和氮-14DNA之间。随着分裂次数的增加,细菌DNA分子的密度继续降低,越来越多地出现在了氮-14DNA的密度区间。对这个结果唯一的解释就是半保留复制模型——每一次的分裂繁衍中,子代细菌获得的都是由一条上一代DNA和一条新生DNA缠绕而成的双螺旋链(见图1-25)!

图1-25 梅塞尔森-斯塔尔实验

简单来说,饲养在氮-15条件下的大肠杆菌DNA较“重”,饲养在氮-14条件下则较“轻”,这点微弱的重量差别可以在高速离心中体现出来。而当饲养在氮-15条件下的细菌转移到氮-14条件下后,细菌第一次分裂繁殖产生的后代中,DNA的重量恰好介于两者之间,这说明这条新生DNA双螺旋是新旧参半的。

就这样,在百年间,孟德尔实验、埃弗里实验、赫尔希-蔡斯实验、DNA双螺旋以及梅塞尔森-斯塔尔实验,分别从几个方向上共同完成了对遗传因子的解密过程。最终在猎人的捕兽网中剩下的,就是长得像一条长纤维的DNA双螺旋分子。DNA长链上紧密排列的碱基,用某种晦涩难懂的语言记录着生命的蓝图。在每一次生命的繁衍过程中,两条DNA长链都会解离螺旋构型各自为营,遗传信息就是这样代代相传、永不湮灭的。

从此,花朵像蝴蝶翅膀一样漂亮的豌豆、危险致命的肺炎链球菌、需要动用最强大的电子显微镜才得以一窥真容的噬菌体、每过20分钟就能一分为二繁衍生息的大肠杆菌,把它们的形象留在了一代代学生的生物学课本上。经过科学家上百年的孜孜求索,地球生物世代遗传的奥秘,从一类模糊的日常观察、一段神秘的哲学理论,变成了一种具体的化学物质、一个精妙的生物繁衍过程。这种物质从化学组成上说可谓是平淡无奇——氢、氧、碳、氮、磷,都是这个星球上最常见的化学元素,但在亿万年流淌的地球生命河道里,DNA就是源源不断的水流。它就像很多家族世代珍藏的族谱,将先辈们的特征和记忆代代流传,成就了子子孙孙与生俱来的骄傲和荣光。

中心法则

我们的故事还没讲完。

“好了,我相信DNA分子确实就是遗传物质了,”你也许会说,“它的碱基顺序能够记录信息。它的半保留复制能够保证这些信息被完美复制和传递,甚至它的螺旋结构都是那么优美动人。可是这些到底和遗传有什么关系呢?讲了这么久,我还是不知道为什么‘种瓜得瓜,种豆得豆’,还是不知道黄色豌豆和绿色豌豆的区别,不知道为什么孩子总是长得像爸爸妈妈呀?”

这个疑问的核心其实是,遗传信息到底是以什么形式写进DNA的,或者反过来说,DNA上携带的信息是怎样决定生物性状的?就像我们刚刚举过的例子,如果把DNA看成是用一种外国语言出版的报纸,报纸上的文章究竟该怎么读,又说明了什么事情呢?

还是拿孟德尔的豌豆来举例吧,我们现在已经知道,必须有一种“黄豌豆”基因能够决定豌豆的表皮颜色,而且这个基因就在DNA分子长链上。甚至我们都可以设计些简单的方法,准确地把它给找出来。但是一段由四种简单的碱基分子组装成的长链,怎么就能够决定豌豆的表皮颜色呢?

这个环节的主角,正是刚刚被遗传学家抛弃的分子——蛋白质。

从某种程度上来说,蛋白质就像是更加复杂的DNA。和DNA的组成方式类似,地球生物中的蛋白质分子是由20种氨基酸小分子首尾相连形成的长链——当然复杂程度明显要高得多。大多数地球生物的DNA分子总是呈现双螺旋的简洁结构,而蛋白质分子的三维结构则变化多端、复杂莫测。插句话,其实这也是为什么在埃弗里实验之后,很多生物学家拒绝相信DNA是遗传物质的原因——他们下意识觉得更加复杂和多样的蛋白质分子才是遗传物质。而人们对蛋白质的认识历史也要远远早于DNA。

早在20世纪初人们就已经知道,生命体中存在着许多能加速各种化学反应的催化物质,而这些物质就是蛋白质(图1-26是一个非常复杂的蛋白质三维结构)。就在沃森和克里克看着DNA分子的X射线衍射图谱,用硬纸板和铁丝搭建双螺旋模型的时候,他们的同事马克斯・佩鲁茨(Max Perutz)和约翰・肯德鲁(John Kendrew)也在试图用同样的方法分析蛋白质分子的三维结构。他们的成功来得更晚一些,到了1959年,他们才成功获得了血红蛋白——血液中负责运输氧气的蛋白——的三维结构,而这也充分说明了蛋白质的高度复杂性。因此,在遗传的秘密终于得到解答以后,人们有理由做出这样的假设,即生命体的各种性状是由各种各样的蛋白质分子实现决定的。

图1-26 蛋白质(ATP合成酶)的三维结构

不难想象,也许有一种蛋白质分子能够合成黄色色素,所以会让豌豆种子长出黄色的表皮;也许有一种蛋白质分子能够制造厚厚的多糖,从而让肺炎链球菌具备光滑的外壳——这一类有着几乎无穷无尽的组合(可以心算一下,一个由20个氨基酸组成的蛋白质就可以有2020种可能),有着复杂空间结构的大分子,给人们留足了想象的空间。

于是我们的问题就变成构成方式较为单调、结构也很简洁的DNA分子,是怎样指导生命体生产出各种各样的蛋白质,从而决定生命性状的?

说起来有点惊人,对这个问题最初的回答居然不是在实验室里,而是在演算纸上完成的,这一点对于生物学这门绝大多数时候仍然依赖经验的科学来说非比寻常。大爆炸理论的发明者、物理学家乔治・伽莫夫(George Gamow)对DNA双螺旋也非常着迷,他试图用物理学家的思维方式帮助解决从基因到蛋白质的难题——这可能部分解释了为什么我们是从纸上而不是试管里得到问题的答案的。

在和克里克的通信中,伽莫夫推测,DNA如果能够指导蛋白质的准确合成,就意味着四种碱基A、T、C、G的排列顺序必须能够指导20种氨基酸的排列顺序。就像我们在故事里提到的,一个简单的思路就是,数个碱基的序列共同决定一个氨基酸。如果是两个碱基分子构成一个氨基酸“密码”,那么仅有的42(16)种组合不足以代表全部的氨基酸;如果是三个碱基形成一个氨基酸“密码”的话,那么43(64)种组合,仅仅比氨基酸数量略高;而如果是四个碱基形成一个氨基酸“密码”的话,那么44(256)种组合似乎就太过浪费了(见图1-27)。因此,伽莫夫推测,DNA指导蛋白质合成的基本原则是相邻三个碱基的序列形成一个独特的密码子,用来指代一种独一无二的氨基酸。

图1-27 伽莫夫推理

根据伽莫夫的推理,三个碱基构成的密码子既能够覆盖所有的20种氨基酸,又不会太浪费。

我们现在知道,伽莫夫的简单推理精确得不可思议,所有地球上的生命都使用了三碱基密码子来指导氨基酸的装配序列和蛋白质的生产。这其实也是对生命进化之美的一次绝妙展示,在无数种可能的编码机制中,生命恰恰选择了足够多样而又非常节约的一种编码方式!

而解密密码子的实验也同样精巧美妙。如果三个相邻的碱基顺序能够决定蛋白质分子中一个氨基酸的身份,那么我们就可以用一串人工合成的DNA序列,生产出任何一种我们想要的蛋白质分子来。1961年,马歇尔・尼伦伯格(Marshall Nirenberg)证明,一长串人工合成的尿嘧啶核酸序列,会指导生产出一个由一串苯丙氨酸相连而成的蛋白质分子。(要说明一下的是,尼伦伯格实验中实际使用的是RNA而非DNA。RNA中的尿嘧啶对应的是DNA中的胸腺嘧啶。)随后尼伦伯格和他的同事们又相继证明,一长串腺嘌呤对应的是全部由赖氨酸组成的蛋白质,一长串鸟嘌呤则是脯氨酸。碱基序列和氨基酸序列的对应关系得到了初次证明(见图1-28)。

当然,严格说起来,尼伦伯格实验只能证明DNA序列对应氨基酸序列,还不能证明到底是几个碱基对应一个氨基酸。而在此后不久,哈尔・霍拉纳(Har Khorana)又利用更复杂的长链核酸序列,证明了只能是3碱基序列对应一个氨基酸(见图1-28)。在接下来的几年里,许多研究机构之间的白热化竞争最终解密了3碱基密码子全部64种组合所携带的信息。最终我们知道了,大多数氨基酸都对应着两到三种密码子,与此同时,还有三种密码子不负责编码任何氨基酸。它们作为终止信号,竖立在基因DNA序列的尽头,标志着氨基酸装配工作的完成。

图1-28 尼伦伯格-霍拉纳实验证明了3碱基密码子假说

好了,说到这里,我们大概可以再回头说说孟德尔神父的豌豆了。

我们现在已经知道,组成DNA分子的碱基排列顺序能够决定氨基酸的特定排列顺序,从而指导蛋白质的合成。那么想象豌豆里有这么一个“黄豌豆”基因就没有那么困难了。我们完全可以想象,豌豆里会有一种蛋白质,它的功能是帮助豌豆表皮生产一种黄色色素,从而把豌豆表皮变成淡黄色。而这种生产色素的蛋白质中氨基酸的排列顺序,都被一丝不苟地以三个碱基对应一个氨基酸的形式写在豌豆的DNA里。这段“黄豌豆”基因会随着豌豆的交配过程进入子孙后代的体内,再随着子孙后代的生长,不断地一分为二,二分为四,四分为八,进入每一个豌豆细胞的内部,从而让这些后代结出的千千万万颗豌豆都变成黄色。考虑到不管是豌豆还是人类,细胞内蕴藏的DNA分子都是由数十亿碱基所组成的,而与此同时,蛋白质一般是由数十个至数千个氨基酸构成的——这个数字乘以3就是编码所需的碱基长度。也就是说,复杂生物的遗传物质足以编码数以万计的蛋白质分子。这个庞大的数字,也就是丰富多彩的生物性状的物质基础。

●DNA是遗传信息的载体。

●遗传信息的最小单位——基因,以碱基序列的形式存在于细长的DNA分子上。

●DNA分子通过一轮又一轮的半保留复制,将遗传信息忠实地传递给了每一个后代。

●基因通过3碱基对应一个氨基酸的形式,决定了氨基酸的装配序列和蛋白质的生产。

●蛋白质催化了生物体内各种各样的化学反应,从而让生物体呈现出丰富多样的性状。

这,可能就是遗传的秘密。

当然,在我们今天的生物学认知里,遗传的秘密比这几条简单的原则要复杂得多。从某种程度上说,今天的地球生命正是在此基础上叠床架屋,增加了许多层次的复杂度,来保证对遗传信息的精确传递,以及对生物性状的复杂控制。

比如说,我们现在知道,大多数复杂生物的DNA并不是单纯用来编码RNA和蛋白质的。人类的基因组DNA中有多达90%的碱基序列并不用来制造任何蛋白质。单纯从蛋白质生产的角度而言,人类的基因组里充满了“垃圾”,效率惊人得低下。但是这些看似无用的“垃圾”DNA为遗传的秘密提供了新的复杂度。我们已经知道,很多不直接参与蛋白质制造的DNA能够通过各种方式参与到蛋白质合成的调节中去,是它们保证了生物可以在合适的时间和地点生产出合适数量的蛋白质分子。

再比如说,早在双螺旋模型刚刚诞生的时候,克里克就已经预言,DNA并不会直接指导蛋白质的合成,而必须借助一个中间桥梁——RNA。DNA首先要根据碱基互补的原则,以自己为模板制造一条RNA长链;然后RNA再根据3碱基对应一个氨基酸的原则制造蛋白质。这个假说之后也被证明了,DNA→RNA→蛋白质的遗传信息流动规律,被冠以了“中心法则”的鼎鼎大名(见图1-29),站在了全部生物学发现的巅峰。RNA为遗传的秘密提供了又一层新的复杂度。因为RNA的存在,蛋白质生产的时空调节可以通过RNA来进行。比如我们可以想象,如果细胞大量合成某个特定的RNA分子,就可以极大地促进其对应的蛋白质分子的生产。

还比如说,我们今天也知道,蛋白质分子自身的结构和功能也能够被精密地调控。许多蛋白质分子需要特定氨基酸位置上发生化学修饰——例如磷酸化、甲基化、乙酰化,等等——才能够发挥特定的功能。与此同时,我们也知道了生物体内的蛋白质分子并非永生不死,它们也有自己的生命周期,有诞生和独立存活,也有死亡和降解。正因为此,遗传的秘密可谓非常复杂。

图1-29 中心法则

根据中心法则,遗传信息存储在DNA分子中,通过RNA介导,指导了蛋白质的合成,从而决定了生物体的各种性状。

但是如果抛开这些所有的复杂调节,DNA→蛋白质的核心原则,始终存在于地球上的每个生命体内。

这个原则细细想来可谓意味深长。

对于地球生命而言,这无疑是传递遗传信息最简洁高效的办法。我们可以把一个活的生物体看成许许多多化学物质在三维空间里的时空分布——对于人体而言,这意味着差不多有近1023个原子,在以纳米为空间精度、微秒为时间精度的约束下完成排列组合。其中蕴含的信息量远远超过人类文明的理解范围。即便在遥远的将来,它对于人类文明来说也可能是永久的秘密。所有这些时空组合的源头,却不过是区区30亿个碱基对组成的DNA长链。在DNA长链上,遗传信息以碱基组合变化的方法存储,呈简单的一维线性排列,而且精确到在世代传递中几乎不发生任何错误!可想而知,在生物世代繁衍的过程中,想要准确复制一条DNA分子的难度——就像我们刚刚讲过的那样——要远远低于临摹先辈三维空间里的全部生物性状。而DNA复制和传递过程中出现的偶然错误——概率大约是1/109,反过来也可以赋予生物体足够的多样性,为达尔文的进化论提供基础,让地球生命在严酷多变的地球环境中熬过自然选择的洗礼。

而对于渴望理解生命、理解人类自身的我们而言,DNA为我们的探寻提供了方便的入口。对于刚刚走进生命大厦的一楼大厅却渴望探索大厦里每一处神秘角落的我们而言,DNA就像建筑师的蓝图,为我们提供了最可靠的指南。人类遗传学手段帮助我们理解了许多人类基因的功能。简单来说,当我们发现某个疾病患者体内存在某个基因的功能缺失,我们就可以将这个基因与这种疾病联系在一起。类似的例子包括先天性色觉障碍、白化病、血友病,以及更为复杂的某些癌症和代谢疾病。而反过来,我们马上也可以想象,如果有一天我们期望能够改造人类本身,消灭某些顽疾,甚至是增强某些机能,直接在人类的基因组上下手将是最快捷和高效的做法。

路漫漫其修远兮。

在过去的亿万年里,是遗传规律促成了地球生命的开枝散叶,并呈现出了五彩斑斓的模样。基因就像亿万年间从未止息的河流,把地球生命带向一个又一个新的港湾。

在过去的一万年间,对遗传现象的认识和利用催生了农业社会的到来,人类这种不起眼的灵长类生物也正是基于此建立起辉煌的文明大厦,开始了认识自身、认识世界、认识宇宙的漫漫征程。

而在过去的一两百年中,我们才真正开始理解遗传的秘密,理解在一代代生命的繁衍中,是什么样的规律主宰了遗传信息的流动,这些信息又如何塑造了每个独一无二的生物体。我们甚至已经开始利用这些规律来改造地球生物,甚至改造我们自己。

在即将到来的未来,遗传的秘密又将把我们带往何处?人类有一天会不会操起上帝的手术刀,主动修改自身的遗传信息,就像在河流上建坝修堤,让生命的河流顺着我们自己的意愿流淌?