第1章 遗传学基本原理
现代遗传学理论是从数据中推演出来的,而数据又是从含有一个或多个不同性状的两个个体杂交而来。现代遗传学理论主要关注的是遗传单元在个体后面几代之间的分布情况。正如化学家和物理学家分别假设存在“看不见”的原子与电子,遗传学专业的学生也假设存在“基因”(Gene)这种看不见的要素。这种类比的关键点在于,无论化学家还是遗传学专业的学生(即“遗传学家”),都是从定量数据中得出结论。对于一种理论,只有当它能够支持我们用定量数据做出某种特定的预测时,这样的理论才能站得住脚。这正是基因论与早期生物学理论在本质上的不同。早期的生物学理论虽然也假设了看不见的单元,却对这些单元随意指定了各种理想的性状。相较之下,基因论扭转了这种顺序,将数据作为指定基因性状的唯一依据。
孟德尔的两条定律
现代遗传学的奠基性理论,当属格雷戈尔·孟德尔(Gregor Mendel)发现的两条基本遗传定律。本世纪(二十世纪)其他学者的后续努力,使我们朝同样的方向深入探索,并使现代遗传学理论日趋完善。关于孟德尔的发现,或许可以用几个耳熟能详的例子加以说明。
孟德尔对食用豌豆的高株与矮株品种进行杂交。杂交产生的第一代子代(F1)全是高株(图1)。F1代自花受精,其下一代中的高株与矮株比例为3:1。如果高株的生殖细胞中含有某种促成高株的东西,矮株的生殖细胞中也含有某种促成矮株的东西,那么两者产生的杂种理应同时包含上述两种东西。但由于杂种表现为高株,因此显然证明当上述两种东西合并时,高株为显性性状,矮株为隐性性状。
图1 高株与矮株豌豆杂交产生的第一代(F1)杂种全部表现为高株。方块表示配子(即卵子和花粉粒)组合的结果。第二代(F2)杂种的高株与矮株比例为3:1
孟德尔指出,第二代杂种中高株与矮株的3:1比例可以用非常简单的假说加以解释。当卵子与花粉粒[1]发育成熟时,如果分别促成高株或矮株的要素(两者同时存在于杂种中)在杂种中发生分离,那么一半的卵子将包含促成高株的要素,另一半的卵子将包含促成矮株的要素(图1)。花粉粒的情况也是如此。任何一个卵子偶然与任何一个花粉粒结合受精,平均将产生3个高株和1个矮株的比例。高株的要素遇上高株的要素将产生高株;高株的要素遇上矮株的要素将产生高株;矮株的要素遇上高株的要素将产生高株;矮株的要素遇上矮株的要素将产生矮株。
孟德尔用一个简单的方法验证了上述假说。他让杂种与隐性型进行回交(Back-cross)。如果杂种的生殖细胞同时包含促成高株和矮株的两种要素,那么前述回交产生的子代将出现同等数量的高株与矮株(图2)。实验结果也的确证实了上述猜想。
图2 F1代杂种中的高株(矮株)与隐性型(矮株)进行“回交”,产生同等数量的高株与矮株后代
高株与矮株豌豆的关系,同样存在于人类瞳孔颜色的遗传过程中。蓝眼睛的人与蓝眼睛的人结合,孩子只可能是蓝眼睛;棕眼睛的人与棕眼睛的人结合,如果两人都只有一位棕眼睛的祖先,他们的孩子也只可能是棕眼睛的。如果一个蓝眼睛的人与一个纯棕眼睛的人结合,子女都将拥有棕色的眼睛(图3)。这一类棕眼睛的人如果彼此结合,其子女的棕眼睛与蓝眼睛比例将为3:1。
图3 人类棕眼睛(棕棕)与蓝眼睛(蓝蓝)的遗传情况
如果一个棕眼睛的杂种(即F1代棕蓝)与一个蓝眼睛的人婚配结合,那么他们的子女将有一半为棕眼睛,另一半为蓝眼睛(图4)。
图4 F1代的棕眼人(棕蓝杂合子)与隐性型(蓝眼人)进行“回交”,产生同等数量的棕眼与蓝眼后代
其他一些杂交实验或许更能说明孟德尔第一定律。例如,红花紫茉莉与白花紫茉莉杂交,产生的杂种都开粉花(图5)。如果让这些粉花杂种自花受精,其子代(F2代)中的一部分将像祖代中的一方那样开红花,另一些像亲代一样开粉花,还有一些则像祖代中的另一方那样开白花,红花、粉花与白花三者比例为1:2:1。在紫茉莉的例子中,两个红花的生殖细胞相结合,子代将重现亲代的一种初始花色;两个白花的生殖细胞相结合,子代将重现亲代的另一种初始花色;红花与白花的生殖细胞相结合,子代将出现杂种的组合。从第二代的整体来看,有色花(包括红花与粉花)与白花的比例为3:1。
图5 红花紫茉莉与白花紫茉莉杂交,子代(F1代)都开粉花,孙代(F2代)中有1朵红花、2朵粉花和1朵白花
这里有两点事实值得注意。由于F2代中的红花与白花个体分别含有促成红花或白花的双倍要素,因此我们预期这些个体可以真实遗传[2]。然而,F2代中的粉花个体应该不能真实遗传,因为它们同第一代杂种一样,同时含有促成红花和白花的一半要素(图6)。实验结果显示,上述所有预测都是正确的。
图6 基于红花紫茉莉与白花紫茉莉的杂交实验(图5),本示意图展示了该交叉实验中生殖细胞的历史情况。小黑圈表示控制开红花的基因,小白圈表示控制开白花的基因
到目前为止,以上实验结果仅仅告诉我们,在杂种的生殖细胞中,来自父方的某种东西与来自母方的某种东西彼此发生了分离。单从这一项证据来看,我们或可将前述实验结果解读成:植物的红花与白花性状以整体的方式进行遗传。
但是另一项实验进一步阐释了这个问题。孟德尔在实验中用黄色圆粒的豌豆种子与绿色皱粒的豌豆种子杂交。此前,其他交叉实验的结果已经证实,豌豆种子的黄色和绿色是一对相对性状(Contrasting Characters),两者在第二代中的呈现比例为3:1。同理,圆粒和皱粒也是一对相对性状。
豌豆杂交产生的子代都是黄色圆粒(图7)。自交后,这些子代产生了四种个体,分别为:黄色圆粒、黄色皱粒、绿色圆粒与绿色皱粒,四者比例为9:3:3:1。
图7 两对孟德尔性状(黄色圆粒、绿色皱粒)的遗传示意图。图的下半部是四类F2代豌豆,包括2个原始型(黄色圆粒、绿色皱粒)及2个重组型(黄色皱粒、绿色圆粒)
孟德尔指出,该实验得出的数据只能有一种解释,那就是黄色与绿色要素之间的分离、圆粒与皱粒要素之间的分离彼此独立进行,互不干涉。由此,杂种必然有着四种组合的生殖细胞:黄色圆粒、黄色皱粒、绿色圆粒与绿色皱粒(图8)。
图8 F1代四种卵子与四种花粉粒结合后,F2代16种组合示意图(图中G表示黄色,g表示绿色,W表示圆粒,w表示皱粒)
如果上述四种胚珠(卵子)与四种花粉粒(精子)随机受精,将产生16种可能的组合。黄色是显性性状,绿色是相对的隐性性状;圆粒是显性性状,皱粒是相对的隐性性状。由此,这16种组合将可归成四类,以9:3:3:1的比例分布。
这项实验的结果表明,我们不能再继续假设父方与母方生殖细胞中的全部种质在杂种体内分离。因为在某些情况下,联合参与杂交实验的黄色圆粒性状,在下一代中会分开出现。绿色皱粒性状也是如此。
孟德尔还证明,三对(甚至四对)性状参与杂交实验,其分别对应的要素在杂种的生殖细胞里可以进行自由组合。
有鉴于此,我们似乎有理由认为,这个结论适用于任何杂交实验,也不限定多少种性状参与杂交实验。也就是说,有多少种可能的性状,种质中就对应有多少对独立要素。但后续研究证实,孟德尔第二定律(又称自由组合定律)存在一定的适用范围限制,因为许多成对要素彼此之间不能自由组合,还有一些参与杂交实验的联合要素有在后代中继续保持联合的趋势。这就是连锁(Linkage)。
连锁
1900年,孟德尔的研究论文重见天日。四年后,贝特森(Bateson)与庞内特(Punnett)[3]发表了他们就两对独立性状的观察结果,表示没有从实验中得出预期数据。例如,开紫花、结长形花粉粒的香豌豆与开红花、结圆形花粉粒的香豌豆杂交,联合参与杂交实验的两种性状,在后代中竟然以更高的频率联合重现,这种重现频率要高于“紫”“红”“长”“圆”自由组合预期将出现的频率(图9)。贝特森与庞内特认为,之所以会出现上述结果,是因为分别来自父方和母方的“紫-长”组合与“红-圆”组合互相排斥。今天,我们把这种关系称为“连锁”,指的是参与杂交实验的某些联合性状倾向于稳定联合遗传给后代的现象。用否定的语气来说就是,某些成对性状并不在对与对之间发生随机的自由组合。
图9 开紫花、结长形花粉粒的香豌豆与开红花、结圆形花粉粒的香豌豆杂交。图底部展示的是F2代呈现的四类个体及其比例
仅就连锁而言,种质的划分似乎有其限度。例如,黑腹果蝇(学名:Drosophila melanogaster)约有400种新的突变型,但这些突变型只能划分为四个连锁群。
在黑腹果蝇的四个连锁群中,其中一个连锁群据说是性连锁的(Sex-linked),因为这群性状的遗传与果蝇的性别呈现出一定的相关性。这类性连锁的突变性状约有150种,其中一些影响果蝇眼的颜色,一些影响眼的形状或大小,还有一些影响复眼[4]分布的规则程度。其他性连锁的突变性状与果蝇身体的颜色有关,另一些与翅膀的形态或翅脉的分布情况有关,还有的与覆盖全身的刚毛有关。
黑腹果蝇的第二个连锁群包括120种突变性状,涉及全身各个部位,但都与第一个连锁群的作用不同。
第三个连锁群约有130种性状,同样涉及全身各个部位,与第一、第二个连锁群的作用均不同。
第四个连锁群较小,仅包含三种性状:一种影响眼的大小,极端情况下可致眼部完全消失;另一种影响翅膀的承重方式;还有一种与体毛的长短有关。
下面这个例子可以说明连锁性状(Linked Characters)是如何遗传的。一只雄蝇带有四种连锁性状(同属于第二个连锁群),包括黑体、紫眼、残翅与翅基斑点(图10)。让它与一只带有相应正常性状(灰体、红眼、长翅、翅基无斑)的野生型雌蝇交配,产生的子代都是野生型。接着,让其中一只子代雄蝇[5]与一只带有四种隐性性状(黑体、紫眼、残翅、翅基斑点)的雌蝇交配,产生的孙代只有两种表现型:一种像祖代的一方,带有四种隐性性状,另一种像祖代的另一方,带有四种野生型性状。
图10 四种连锁隐性性状(黑体、紫眼、残翅、翅基斑点)与正常等位野生型交配后的遗传情况。F1代雄蝇回交带有四种隐性性状的雌蝇,产生的F2代(图底部所示)只有祖代的两种性状组合
这里有两组相对(或等位)的连锁基因参与了杂交。雄性杂种的生殖细胞成熟后,其中一组连锁基因进入一半的精子细胞,另一组等位的连锁基因进入另外一半的野生型精子细胞。如前所述,通过杂交F1代杂种雄蝇与一只带有四种隐性基因的纯种雌蝇,即可印证上述机制的存在。雌蝇所有的成熟卵子都包含一组四种隐性基因。任何一个卵子,如果与带有一组野生型显性基因的精子结合,都应该会产生一只野生型果蝇。而任何一个卵子如果与带有四种隐性基因(与这里采用的雌蝇基因相同)的精子结合,都应该会产生一只黑体、紫眼、残翅、翅基斑点的果蝇。这两种类型就是孙代果蝇能有的全部类型。
交换
一个连锁群内的基因并不总像上文示例中的那样完全连锁。事实上,在同一次杂交产生的F1代雌蝇中,某一组隐性性状可在一定程度上与另一组的野生型性状发生交换。但即便如此,由于结合的时候往往多于交换的时候,因此它们仍可以说是连锁的。这种交换现象被称为“交换”(Crossing-over),即在两个相对应的连锁组之间,可能会发生大量基因的有序交换。理解这个过程对于理解这本书后面要谈的内容十分重要,因此以下举几个例子来更好地说明“交换”。
一只带有两种隐性突变性状(黄翅、白眼)的雄蝇与一只带有野生型性状(灰翅、红眼)的雌蝇交配,产生的F1子代不论雌雄均为灰翅、红眼(图11)。如果让F1代中的一只雌蝇与一只带有两种隐性性状(黄翅、白眼)的雄蝇交配,则F2代将包括四种类型。其中两种与祖代一样,都是黄翅、白眼或灰翅、红眼,两者约占F2代数量的99%。这些联合进入杂交实验的性状,以高于孟德尔第二定律预测的概率在后代身上联合重现。除了上述两种类型外,F2代中还有另外两种类型(图11)。其中一种为黄翅、红眼,另一种为灰翅、白眼,两者约占F2代数量的1%。它们就是所谓的“交换型”,代表两个连锁群之间发生了基因交换。
图11 两种性连锁隐性性状(黄翅、白眼)及其“正常”等位野生型(灰翅、红眼)交配后的遗传情况
另一项类似实验研究的也是上述性状,只是将这些性状进行了不同的重组。如果一只黄翅、红眼的雄蝇与一只灰翅、白眼的雌蝇交配,其F1代中的雌蝇将全部为灰翅、红眼(图12)。让F1代中的一只雌蝇与带有两种隐性性状(黄翅、白眼)的雄蝇交配,则F2代也将包括四种类型。其中两种与祖代一样,约占F2代数量的99%。另外两种为重新组合而成的交换型,一种为黄翅、白眼,另一种为灰翅、红眼,两者约占F2代数量的1%。
图12 与图11相同但组合方式相反(黄翅红眼与灰翅白眼)的两种性连锁性状遗传
以上结果表明,同样的性状无论在杂交时采用怎样的组合方式,都将发生等量的交换率。两种隐性性状联合参与杂交,它们在后代身上有联合重现的倾向。这种关系被贝特森与庞内特称为“偶联”(Coupling)。如果两种隐性性状分别来自父方和母方,则它们有在后代身上分别重现的倾向(各自与其联合参与杂交的显性性状进行组合)。这种关系被称为“互斥”(Repulsion)。但前述两项交叉实验的结果显然表明,偶联与互斥关系并非两种孤立存在的现象,而是同一现象的不同表现方式。换言之,两种连锁性状参与杂交时,无论它们是显性还是隐性性状,总是呈现出联合重现的趋势。
其他性状的交换率各有不同。例如,一只带有两种突变性状(小翅、白眼)的雄蝇与一只野生型(长翅、红眼)雌蝇交配(图13),产生的后代均为长翅、红眼。让F1代中的一只雌蝇与小翅、白眼的雄蝇交配,将产生四种类型的F2代。其中两种与祖代一样,约占F2代数量的67%。另外两种交换型约占F2代数量的33%。
以下实验中的性状交换率还要更高一些。一只白眼、叉刚毛的雄蝇与一只野生(红眼,直毛)型雌蝇交配(图14),产生的后代均为直毛、红眼。让F1代中的一只雌蝇与叉刚毛、白眼的雄蝇交配,将产生四种类型的F2代。其中两种与祖代一样,约占F2代数量的60%。另外两种交换型约占F2代数量的40%。
图13 两种性连锁性状(小翅白眼与长翅红眼)的遗传
图14 两种性连锁性状(叉刚毛白眼与直毛红眼)的遗传
关于基因交换的研究已经显示了所有可能发生的交换率,最高者可达近50%。如果交换率正好为50%,则其数据结果将与自由组合时的情况一样。也就是说,尽管两种性状属于同一个连锁群,我们也不会观察到它们之间的连锁现象。不过,它们属于同一连锁群的关系,仍可从它们与该连锁群中第三种性状的共同连锁看出。如果发现交换率高于50%,就会出现所谓的“反向连锁”(Inverted Linkage)现象。此时,交换型的发生率将高于祖代型的发生率。
雌蝇体内基因的交换率总是低于50%,源于另一种名为“双交换”(Double Crossing-over)的现象。双交换指的是杂交实验中的两对基因之间发生了两次交换。结果是我们观察到的交换情形变少,因为第二次交换抵消了第一次交换的效果。关于这一点,我们将在下面的内容中加以解释。
许多基因在交换过程中同时交换
上面的交换案例只研究了两对性状。相应证据仅与参与杂交的两对基因有关,且两对基因之间仅发生了一次交换。为了解别处(即连锁群内剩余部分)发生了何种频次的交换,我们有必要把连锁群覆盖的性状全部包括进来。例如,一只雌蝇同时带有第一连锁群包含的9种性状,即鳞甲、棘眼、横脉缺失、截翅、棕褐色刚毛、朱红眼色、暗红眼色、叉刚毛与截刚毛。先让这只雌蝇与一只野生型雄蝇交配,再让F1代雌蝇(图15)与带有同样多个隐性性状的雄蝇回交,产生的F2代将出现各式各样的交换型。倘若交换发生在连锁群的中部位置(介于朱红色眼与暗红色眼之间)附近,则F2代的情况将如图16所示。从图上可以看出,这个连锁群的两个完整半边之间发生了交换。
图15 两个等位连锁基因序列示意图。上方横线标出了9个性连锁隐性基因的大致位点,下方横线表示正常的等位基因
图16 暗红色眼与朱红色眼基因交换示意图,大约发生在图15等位基因序列的中部
图17 棘眼与横脉缺失基因交换示意图,大约发生在图15等位基因序列的左端
图18 两个基因序列(见图15)之间的双交换,其中一次交换发生在截翅与棕褐色刚毛之间,另一次交换发生在暗红色眼与叉刚毛之间
从其他案例来看,交换也可以发生在端点附近(如棘眼与横脉缺失之间)。相应结果如图17所示。发生交换的只有两个基因序列的短端。每当交换发生时,都会经过同样的过程。尽管一般只有交换点两侧基因的交换能够被观察到,但其实整个基因序列都发生了交换。
当双交换同时发生在两个水平面上时(图18),涉及的基因也很多。例如,仍是在上述两个基因序列中,一次交换应当发生于截翅与棕褐色刚毛之间,另一次交换应当发生于暗红色眼与叉刚毛之间。此时,两个基因序列中部的所有基因都发生了交换。若该区域没有突变基因可供标记,那么由于两个基因序列的两端与起始状态一样,这个双交换现象将无法被观察到,从而使我们无从知晓双交换已然发生。
基因的直线排列
不言而喻,两对基因互相靠近时,距离越近,两者之间发生交换的概率越低;距离越远,则两者之间发生交换的概率也越高。基于这种关系,我们可以求出任意两对基因间的相对“距离”。有了这种信息,我们便可以画出连锁群内基因序列的相对位置图。已经有人画出了果蝇所有连锁群的这类图表(如图19所示),但它们仅代表目前所能得到的测算结果。
图19 黑腹果蝇四个连锁群(I, II, III, IV)基因序列的相对位置图。各种性状左侧标注的数字表示“图距”,即根据交换率推算出来的基因间距
在以上关于连锁与交换的示例中,基因看起来像是直线排列的,如同串在一条线上的珠子。事实上,交换研究的数据显示,基因的直线排列方式是唯一能与研究结果吻合的排列方式。下面就以一个例子来说明。
假设在所有情形下,黄翅与白眼的交换率为1.2%,然后用同一连锁群的第三个基因(如二裂翅)来测试白眼,发现黄翅与白眼的交换率为3.5%(图20)。如果二裂翅与白眼在同一条直线上,且二裂翅在白眼的一侧,则我们预期二裂翅与黄翅的交换率将为4.7%。但如果二裂翅在白眼的另一侧,则二裂翅与黄翅的交换率应该为2.3%。现实结果显示,二裂翅与黄翅的交换率正是4.7%这个数值。因此,我们才把二裂翅放在图中白眼的下方。每当一种新性状与同一连锁群其他两种性状进行比较时,都会出现这种结果。研究发现,新性状与其他两个已知因子的交换率,要么是其他两个交换率之和,要么是其他两个交换率之差。这便是我们所熟知的直线上各点之间的关系,由此证明基因呈直线排列。到目前为止,我们还没有发现基因存在其他类型的空间关系能满足所有这些条件。
图20 三个性连锁基因(黄翅、白眼、二裂翅)的直线排列示意图
基因论
现在,我们有理由构建起基因论。该理论认为,个体的种种性状都可归结于种质中的成对要素(即基因),有限数量的基因又共同构成一个个连锁群。根据孟德尔第一定律,生殖细胞成熟时,其中的每对基因都会彼此发生分离,由此造成每个生殖细胞只含半数基因。根据孟德尔第二定律,属于不同连锁群的基因可以进行自由组合。有时,相应两个连锁群间的基因会发生有序的交换。交换率证明每个连锁群中的基因呈直线排列,并揭示每个基因所处的相对位置。
我贸然将以上原理统称为基因论,认为它能帮助我们从严格的数理基础上解决遗传学问题,并使我们得以相当准确地预测任何既定情况下会发生什么。有鉴于此,基因论可以说是完全符合了科学理论的要求。