第18章 进化,复杂化
在第1章我曾问过:“生物进化是如何产生出个体如此简单、整体上又如此复杂的生物呢?”通过书中的例子我们可以看到,对生命系统的理解越深入,就越感到惊讶,这样精巧的复杂性居然是通过有利突变和历史偶然的逐步积累形成的。这也正是从达尔文时代到现在神创论或其他超自然“智能设计”的拥护者论证的依据。
进化是如何创造出复杂性,或者说是否能创造复杂性,以及生物复杂性该如何刻画和度量,这些问题都还没有解决。复杂系统研究几十年来最重要的贡献之一就是为这些老问题提供了一些新的研究途径。这一章我将介绍遗传学和基因调控动力学的最新发现,它们为我们带来了一些关于复杂系统进化的惊人的新认识。
遗传,复杂化
在科学研究中,经常有一些新的技术会打开新发现的闸门,从而改变以前建立起来的对研究领域的认识。回到第2章我们可以看到一个这样的例子——计算机的发明使得为天气这样的复杂系统建模仿真成为可能,并因此揭示了混沌的存在。最近,超级天文望远镜的建造在天文学领域导致了关于所谓的暗物质和暗能量的许多新发现,因此引发了对之前的宇宙学知识的重新审视。
过去四十年中,没有什么技术的影响比得上所谓的分子革命对遗传学的影响。对DNA进行快速复制、测序、合成,实施DNA工程,对分子层面的结构进行成像,同时观察数以千计不同基因的表型,这些技术还只是20世纪末21世纪初生物技术取得成就的一小部分。随着新技术的出现,生物学家们可以更细致地观察细胞,更多出人意料的复杂性也随之出现。
在沃森和克里克发现DNA结构之后,DNA基本被视为由基因组成的序列,每个基因编码一种特定的蛋白质,在细胞中实现一定的功能。基因序列本质上被视为细胞的“计算机程序”,通过RNA、核糖体等物质的译码和执行,合成出相应的蛋白质。DNA在复制过程中会有小的随机变化;对有利变化的长期积累最终会导致生物的适应性变化,并产生新的物种。
这种传统观念在过去40年中已经发生了巨变。分子革命一词不仅指遗传学中的新技术,也指这些技术带来的对DNA、基因和进化本质的革命性新观点。
基因是什么
分子革命的一个诱因就是基因概念本身。第6章描述的DNA的机制仍然是成立的——染色体中包含DNA,通过转录和译码产生蛋白质——但这只是故事的一部分。下面来看看部分新近发现的许多现象,这些现象关注的是基因和遗传的运作机制。
◆基因并不像“一根绳子上串着的豆子”。我在中学学生物时,基因和染色体被解释比喻成一根绳子上串着的豆子(我记得我们还用塑料豆子组装过模型)。后来发现基因并不是相互分开的。有些基因相互重叠——也就是说,它们各自编码不同的蛋白质,但是共用DNA核苷酸。有些基因甚至完全包含在其他基因内部。
◆基因可以在染色体上移动,甚至移动到其他染色体。你也许听说过“跳跃基因(jumping genes),”实际上基因是可以移动的,染色体的组成也会被重新排列。这在任何细胞中都有可能发生,包括精子和卵子,也就是说可以遗传。这样产生的变异率比DNA复制错误导致的变异率要高得多。一些科学家提出,近亲甚至同卵双胞胎之间的差别可能就是这种“可动遗传因子(mobile genetic element)”造成的。还有人提出,跳跃基因是导致生命多样性的机制之一。
◆单个基因可以编码多个蛋白质。以前一直以为基因和蛋白质是一对一的关系。这个认识在人类基因组被测序后受到怀疑,基因编码的不同蛋白质的数量可能超过100000种,而人类基因组只有大约25000个基因。最近发现的多重剪接(alternative splicing)和RNA编辑(RNA editing)可以帮助解释这个差异。这些过程可以在信使RNA ;转录DNA之后和译码成氨基酸之前以各种方式变化。这意味着同样的基因通过不同的转录事件可以产生出不同的蛋白质。
◆由于如此复杂,以至于最专业的生物学家也经常无法对“基因”的定义达成共识。最近一组科学哲学家和生物学家进行了一项调查,向500名生物学家各提供一些不常见但真实的DNA序列,然后问他们这些序列是不是“基因”,以及他们对自己的答案有多大把握。结果发现对其中许多序列,他们的想法产生了分化,60%的人相信一个答案,40%的人相信另一个答案。《自然》杂志上报告这项调查的文章评论道:“对分子遗传学越专长的学者,越不确定基因到底是什么。”
◆生物系统的复杂性主要来自基因网络,而不是单个基因独立作用的简单加总。第16章曾讲过,基因调控网络目前是遗传学的研究重点。以前的绳子串豆子的观念同孟德尔遗传律一样,都是把基因看作线性的——每个基因都各自负责某个表型。而现在的普遍观念则是,细胞中的基因组成了非线性的信息处理网络,一些基因会根据细胞状态控制其他基因的行为——基因并不是独立运作。
◆即使基因的DNA序列不发生变化,基因的功能也会发生可遗传的变化。最近兴起的表观遗传学(epigenetics)研究的就是这种变化。一个例子就是所谓的DNA甲基化(methylation),细胞中的一种酶将特定的分子连接到DNA序列的某些部分,将这些部分“关闭”。一旦细胞中发生这种现象,这个细胞的所有后代就会产生同样的DNA甲基化。如果DNA甲基化发生在精子或卵子中,就会被遗传。
◆一方面,这类表观遗传现象在所有细胞中都不断在发生,对生命活动的许多方面都很关键,因为它可以关闭不再需要的基因(例如,一旦进入成年期,我们就不再需要像小孩一样生长发育,控制青春期发育的基因就会甲基化)。另一方面,错误的甲基化,或者应当甲基化却没有甲基化,又会导致遗传紊乱和疾病。事实上,一些人认为,正是由于胚胎发育期缺乏必需的甲基化,使得很多克隆胚胎无法存活,许多克隆动物即便存活也会有严重甚至致命的缺陷。
◆最近发现,在大部分生物中,DNA转录为RNA之后很大部分最终都没有被译码成蛋白质。这些所谓的非编码RNA对基因和细胞的功能具有调控作用,这些以前都认为是由蛋白质单独完成的。非编码RNA的作用是目前遗传学中一个非常活跃的研究领域。
遗传学已经变得非常复杂了。这种复杂对生物学的影响巨大。2003年,人类基因组计划发布了完整的人类基因组——人类DNA的全部序列。虽然这个计划获得了大量新发现,但还是没有达到许多人的预期。一些人曾以为人类基因的详尽图谱能让我们彻底理解遗传的运作原理,哪个基因对应哪项特征,并带来医学发现和靶向性基因治疗的革命。虽然发现了一些基因可能是某些疾病的原因,但结果表明仅仅知道DNA的序列还不足以让我们理解人(或其他复杂生物)的全部特性和缺陷。
使得基因序列被寄予如此厚望的一个主要因素是国际生物技术工业。《纽约时报》最近的一篇文章报道了新近发现的这些遗传复杂性对生物技术工业的影响:“基因独立运作的想法是1976年之后形成的,这也是第一家生物技术公司成立的时间。事实上,整个生物技术工业的经济基础都建立在这个认识之上。”
问题还不仅仅在于遗传学被迅速修改。生物技术工业一个潜藏的大问题是基因专利的归属。几十年来,生物技术公司对人类DNA中一些被认为“编码了特定的功能性产物”的序列申请了专利。但就像我们在前面看到的,许多复杂特性并不是由某个基因的DNA序列单独决定的。既然这样,这些专利还能成立吗?如果“功能性产物”是表观遗传过程作用或调控基因的结果呢?又或者这个产物不仅需要被申请专利的基因,还需要调控这个基因的基因,以及调控调控基因的基因呢?如果这些调控基因的专利被授予了其他人呢?一旦放弃线性基因的观念,面对本质上的非线性,这些专利的意义就会变得不明不白,好处是专利律师和法官今后不用担心失业了。专利不是唯一的问题。就像《纽约时报》指出的:“基因组网络化的证据实际上毁掉了对当今生物技术产品商业化进行的所有官方风险评估的科学基础,不管是转基因作物还是医药。”
不仅遗传学,整个进化论都因这些新的遗传学发现受到了挑战。“进化发育生物学(evolutionary developmental biology)”领域就是一个突出的例子。
进化发育生物学
进化发育生物学是一个让人兴奋的领域,这个领域最近的发现据称解释了至少3个遗传和进化的大谜团:
1.人类只有大约25000个基因。复杂性从何而来?
2.人类在遗传上与其他许多物种很类似。例如,我们的DNA超过90%与老鼠一样,超过95%与大猩猩一样。为什么我们的形态与这些动物相差这么大?
3.如果古尔德等人提出的进化间断平衡是正确的,身体形态为何会在很短的进化时期内发生巨大变化呢?
最近有观点认为,这些问题的答案至少部分在于基因开关(genetic switch)的发现。
发育生物学和胚胎学研究的是单个受精卵如何变成由亿万细胞组成的活生物体的过程。然而,现代综合关注的却是基因;用发育生物学家卡罗尔(Sean Carroll)的话说,现代综合是将胚胎和发育过程视为“‘黑箱’,在其中可以将遗传信息变成三维的、活的动物”。这部分归咎于以前的观念,认为多种多样的动物形态最终可以用基因的数量和DNA构成的巨大差异解释。
20世纪80—90年代,这种观念有了很大变化。就像前面说的,DNA测序发现许多不同的物种DNA却很相似。遗传学的进展也使得对胚胎发育过程中基因表达的机制有了更详细的了解。结果发现这些机制与之前预想的差别很大。胚胎学家发现,在研究过的复杂动物中,都存在一小部分“主导基因”调控动物许多身体部位的发育成形。更让人吃惊的是,各物种之间,不管是果蝇还是人类,虽然形态差异极大,主导基因的DNA序列却有许多是相同的。
如果发育过程是受相同的基因掌控,这些动物的形态怎么会如此不同呢?进化发育生物学的支持者提出,物种形态多样性的主要来源不是基因,而是打开和关闭基因的基因开关。这些开关是不编码蛋白质的DNA序列,通常长度为几百个碱基对。它们以前被认为是所谓的“垃圾基因”的一部分,但现在发现有基因调控的作用。
图18.1是基因开关的工作原理。基因开关是位于某个基因旁边的非编码DNA序列。这个序列一般包含有一组标签子序列,其中每个都可以与特定的蛋白质结合,从而让蛋白质附着到DNA上。旁边的基因是否能被转录,速度多快,都取决于蛋白质与这些子序列的结合情况。允许转录的蛋白质会为进行转录的RNA分子创造强结合点;阻止转录的蛋白质则会阻挡这些RNA分子同DNA结合。其中一些蛋白质还有能消除其他蛋白质的作用。
图18.1 基因“开关”示意图。(a)一段DNA序列,包含一个有两个标签子序列的开关、被开关打开的功能基因以及两个调控主导基因。调控主导基因生成调控蛋白质。(b)调控蛋白质同标签子序列结合,打开功能基因——也就是允许其转录
这些特定的调控蛋白质是从何而来呢?同所有蛋白质一样,它们由基因生成,这里是由调控基因对这些蛋白质进行编码,根据细胞的当前状态决定相应基因是开还是关。这些调控基因又是如何判断细胞的状态呢?一些蛋白质可以与这些调控基因本身的开关相结合,从而向其传递细胞状态的信号。这些蛋白质通常是由另外的调控基因编码,这些基因又由其他基因调控。
简而言之,基因调控网络包括功能基因和调控基因,功能基因编码用于细胞结构和运转的蛋白质(和非编码RNA),而调控基因编码的蛋白质则可与目标基因旁边的DNA“开关”相结合,从而开启或关闭相应的基因。
现在可以为这节开头提出的3个问题给出进化发育生物学的答案了。人类(和其他动物)比基因数量所表现的要复杂得多,可能的原因很多,“基因是什么”一节列出了一些。但主要原因还是基因调控网络使得基因表型的可能性极多,因为蛋白质对基因开关的附着情况有很多种。
人类之所以与其他差别极大的物种能有如此多相同的基因,是因为虽然基因是一样的,但基因开关的序列构成却已进化得不一样了。基因开关的微小变化能导致发育过程中基因采取截然不同的开关模式。因此,根据进化发育生物学,生物的多样性主要来自开关而不是基因的进化。这也是为什么形态的巨大变化——可能还包括物种形成——可以在很短的进化时间内发生:主导基因不变,但是开关变了。根据进化发育生物学的观点,进化的主要力量正是这种——长期以来一直被视为“垃圾”的DNA的——变化,而不是新基因的出现。生物学家马蒂克就此评论说:“讽刺的是……一直被视为垃圾的[DNA]却藏有人类复杂性的秘密。”
进化发育生物学的一个惊人例证就是燕雀鸟喙的进化。第5章曾讲过,达尔文发现加拉帕格斯群岛燕雀的喙的大小和形状差别很大。直到不久前,大部分进化生物学家都还认为这种差别是几种基因随机变异逐渐积累的渐变过程。但最近发现了一个名为BMP4的基因可以通过调控生成骨骼的基因来控制喙的大小和形状。鸟在发育过程中BMP4的表达越强烈,喙就越强大。另一种名为钙调素(calmodulin)的基因则被发现与长细形的喙有关。卡罗尔·尹(Carol Kaesuk Yoon)在《纽约时报》上撰文介绍,“为了证明BMP4基因确实能触发生长粗壮、能打开坚果的喙,研究者在小鸡胚胎发育出喙时人为加快了BMP4的产生。结果小鸡长出了宽厚而结实的喙,类似于能啄开坚果的燕雀……像BMP4一样,钙调素基因的表达越强,雀喙就会长得越长。如果在小鸡胚胎中人为增加钙调素,小鸡就会长出变长的喙,就像啄食仙人掌的燕雀……这样科学家就发现,无需几十上百种基因,只需这两种,就有可能让鸟喙变得或是厚重,或是短粗,或是细长”。结论是鸟喙(及其他特征)形态的巨大变化可以很快发生,而无须等待时间漫长的随机变异。
进化发育生物学挑战进化传统观念的另一个例子是趋同进化(convergent evolution)。在中学生物课上我们学过,章鱼眼睛和人类眼睛——形态差异很大——是趋同进化的例子:这两个物种的眼睛是相互独立进化出来的,是自然选择作用于两种不同环境的产物,两种环境中眼睛都具有适应优势。
然而,最近有证据表明,这两种眼睛的进化并不像以前认为的那样独立。人类、章鱼、苍蝇等物种都具有名为PAX6的基因,这种基因能引导眼睛的发育。瑞士生物学家格林(Walter Gehring)做了一个古怪而富有启发的实验,实验中格林将老鼠的PAX6基因取出插入到果蝇的染色体中。在不同实验中,PAX6被插入染色体的三个不同部位:这三个部位分别引导腿、翅膀和触须的发育。结果非常怪异:果蝇的腿、翅膀和触须上长出了类似眼的结构。这种结构像果蝇的眼,而不是老鼠的眼。格林得出结论:眼睛不是多次独立进化出来的,而是只有一次,有一个具有PAX6基因的共同祖先。这个结论在进化生物学家中仍然极具争议。
虽然主导基因引导的基因调控网络能产生多样性,它们也对进化施加了一些限制。进化发育生物学家认为任何生物的身体形态类型都受主导基因高度约束,这也是为什么自然界中只有少数基本的身体结构类型。如果基因组很不相同的话,也许会有新的身体结构类型,但实际上进化无法让我们变成那样,因为我们非常依赖现在的调控基因。我们的进化可能性是有局限的。根据进化发育生物学的观点,“所有特性都能无限变化”的观念是错误的。
基因调控和考夫曼的“秩序的起源”
理论生物学家考夫曼(图18.2)早在40年前就开始思考基因调控网络及其对进化的影响,当时进化发育生物学还尚未发端。同时他还思考了从这种复杂网络中涌现出的秩序对进化的意义。
图18.2 考夫曼(Daryl Black摄影,经许可重印)
考夫曼是复杂系统的传奇人物。我第一次遇见他是在我读研究生最后一年参加的一次会议上。他的演讲被安排在会议的最开头,我必须说,当时对我来说,那是我听过的最富启发的演讲。我不记得主题具体是什么;我只记得当时听演讲的感觉,我感到他讲得非常深刻,他提出的问题极为重要,我想去和这家伙一起做研究。
考夫曼刚开始是研究物理学,但很快就转向了遗传学研究。他的研究新颖而且极具影响,为他赢得了许多学术荣誉,包括麦克阿瑟“天才”奖,以及圣塔菲研究所的职位。在SFI的研讨会上,考夫曼经常会在听众席上插话:“我知道我只是个孤陋寡闻的乡下博士,但……”然后针对他以前不知道的一些很专业的主题滔滔不绝地讲述他即兴的想法,他可以讲上5分钟或更长时间。一位科学记者称他为“世界级的知识即兴演奏家”,这个评价我认为相当中肯。
考夫曼说自己是“孤陋寡闻的乡下博士”只是谦虚。他是最有影响力的复杂系统思想家之一,富有远见,绝不是什么孤陋寡闻的人物。SFI有个笑话,说考夫曼“拥有达尔文进化论的专利”。事实上,他确实拥有在实验室演化蛋白质序列的专利技术,这项技术可以用来发现新的药物。
随机布尔网络
考夫曼可能是第一个发明和研究基因调控网络的简化计算机模型的人。他的模型结构是所谓的随机布尔网络(Random Boolean Network, RBN),是从元胞自动机扩展而来。同其他网络一样,RBN也包含节点以及节点之间的边。类似于元胞自动机,RBN以离散时间步的形式更新节点状态。在每一步各节点可以处于开状态或关状态。
状态只有开和关两种,这也是布尔一词的由来:布尔规则(或函数)的输入是一些等于0或1的数,根据输入得到的输出也要么是0要么是1。这类规则因数学家布尔而得名,布尔对其进行了深入的研究。
在RBN中,边是有方向的:节点A有边指向节点B,节点B并不必然(但可能)有边指向节点A。各节点的入度(从其他节点指向这个节点的边的数量)都是一样的,记为数字K。
下面来看看如何构建一个RBN:对每个节点,随机选取K个节点(可能包括自己),建立从这些节点指向目标节点的边,然后给这个节点随机赋予一条布尔规则,规则的输入为K个开关状态,输出则为单个开关状态[图18.3(a)]。
图18.3 (a)5个节点组成的随机布尔网络。各节点的入度(K)等于2。在第0个时间步,各节点处于随机的初始状态:开(黑)或关(白)。(b)各节点更新状态后第1个时间步的网络
RBN运行前,给每个节点赋予随机选择的初始开关状态。在每个时间步,各节点将自己的状态传送到其连接的节点,并从连接到它的节点接收状态输入。然后各节点根据其规则和输入确定自己下一步的状态。图18.3显示了一个5节点的RBN在第1步的变化,每个节点有2个输入。
RBN类似于元胞自动机,但是有两个主要区别:节点不是与空间上相邻的节点相连,而是随机连接,另外元胞自动机各节点的规则是一样的,而RBN的每个节点都有自己的规则。在考夫曼的研究中,RBN被作为基因调控网络的理想模型,其中节点代表“基因”,节点A指向节点B的边则表示“基因A调控基因B”。这个模型显然比真正的基因网络要简单得多。现在在生物学中使用这种理想模型已经很普遍,但在20世纪60年代考夫曼开始研究时还很少有人接受。
混沌边缘的生命
考夫曼和他的学生及同事用各种入度值K进行了大量RBN实验,从随机初始状态开始,然后迭代许多步,节点状态一开始会以类似随机的方式变化,但最终要么停在不动点上(所有节点状态保持不变),要么进入周期振荡(整个网络的状态以较短的周期振荡),要么就根本不停下来,迭代了很久仍然像是随机变化。这种变化实际上是混沌,因为网络状态变化的轨迹敏感依赖于网络的初始状态。
考夫曼发现最终的行为是由网络中的节点数量以及各节点的入度K决定的。随着K从1开始(各节点只有一个输入)逐渐增大到等于全部节点的数量(每个节点都从其他所有节点有输入,包括它自己),RBN的典型行为经历了3种类型(不动点、振荡、混沌)。你可能注意到了这与逻辑斯蒂映射随着R增大时的行为变化类似(参见第2章)。在K=2时考夫曼发现了一个有趣的类型——既不是不动点、振荡,也不是完全混沌。类似于逻辑斯蒂映射的“混沌的发端”,他称之为“混沌边缘”。
考夫曼认为RBN能反映真实的基因网络的行为,他用水在各种温度下的状态作类比:“控制从受精卵到成人的发育的基因组网络有可能处于以下三种类型:类似冰冻的有序态,类似气体的混沌态,以及位于有序和混沌之间类似液态的区域。”
考夫曼认为,生物既要具有活性同时又要稳定,RBN所模拟的基因网络应当为“液态”才有意义——既不能太僵硬也不能太混沌。用他的话说:“生命存在于混沌的边缘。”
考夫曼用动力系统理论的术语——吸引子、分叉、混沌——来阐述他的发现。将节点可能的状态组合称为网络的全局状态。由于RBN的节点数量有限,因此可能的全局状态的数量也是有限的。如果网络迭代足够长时间,就必然会重复之前出现过的全局状态,接下来就会循环。考夫曼将这种循环称为网络的“吸引子”。通过反复实验,他估计出K=2时产生的不同吸引子的平均数量大致等于节点数量的平方根。
然后考夫曼对模型进行了大胆的解读。身体中所有细胞都具有同样的DNA。然而,细胞的类型却有很多:皮肤细胞、肝细胞,等等。考夫曼认为确定具体细胞类型的就是细胞中的基因表达形式——前面我曾讲过不同细胞的基因表达形式可以差别很大。在RBN模型中,一种吸引子就对应一种“基因表达”形式。因此考夫曼提出他的网络中的吸引子就对应于生物体内的一种细胞类型,细胞类型的数量应当接近100000的平方根,大约316种。这与在人类身上发现的细胞种类数量——约为256种——相差不大。
在考夫曼进行这些计算的时候,普遍认为人类基因组包含大约100000个基因(因为人体中大约有100000种蛋白质)。考夫曼很兴奋,他的模型很好地预测了人体中细胞种类的数量。现在我们知道人类基因组只有25000个基因,因此根据考夫曼的模型得出的预测是大约158种。
有序的起源
模型并不完美,但考夫曼相信它揭示了他对生命系统最重要的一般性观点:原则上自然选择对于复杂生物的产生并不是必需的。许多K=2的RBN也能表现出“复杂”行为,而其中并不涉及自然选择或进化算法。他的观点是,一旦网络结构变得足够复杂——即有大量节点控制其他节点——复杂和“自组织”行为就会涌现出来。他说:
继承了达尔文传统的大部分生物学家都认为1,个体发育的有序性有赖于某种分子级的鲁布·戈德堡机器慢慢打磨2,这种机器是通过进化一点一滴累积而成的。我的观点相反:个体发育过程中的美丽秩序大部分是自发的,是极度复杂的调控网络所包含的惊人自组织的自然表达。我们似乎从根本上就错了。秩序,无处不在而且有生命力的秩序,是自然发生的。
考夫曼深受统计力学框架的影响。第3章曾介绍过统计力学。记得统计力学解释了温度这样的属性如何产生自对大量分子的统计。也就是说,人们不用跟踪所有分子的牛顿轨道就能预测系统的温度变化。考夫曼认为他的发现类似于统计力学的定律,其决定的是从大量相互连接调控的组分中涌现出来的复杂性。他称这条定律为“候选的热力学第四定律”。热力学第二定律指出宇宙有熵增的内在趋势,而考夫曼的“第四定律”则提出生命具有复杂化的内在趋势,而这独立于自然选择的任何趋势。这个思想在考夫曼的《秩序的起源》(The Origins of Order)一书中有详尽阐释。考夫曼认为,复杂生物的进化部分是由于这种自组织,部分由于自然选择,而且可能自组织才是起主导作用的,对选择的可能性施加了严格限制。
对考夫曼的研究的反响
由于考夫曼的研究意味着“对选择在进化论中的地位进行根本性的重新解读”,可想而知人们对其的反应会有多强烈。这项研究有许多狂热的拥护者(“他的方法开启了新的未来”;这是“对整个生物学进行建模的第一次严肃尝试”)。另一方面,许多人则极为怀疑他的结果和他对结果的宽泛解释。一位评论家说考夫曼的写作风格具有“危险的诱惑力”,并且这样评价《秩序的起源》的:“有时候就好像在虚幻的空间悠然漫步,似乎无需理会来自现实的琐屑烦恼。”
实际上,相关的实验证据并不都是站在考夫曼一边。考夫曼自己也承认,将RBN作为基因调控网络的模型需要许多不符合实际的假设:每个节点只能两个状态取其一(而基因表达则有各种程度的强度),每个基因的调控基因都一样多,所有节点都是以离散时间步同步更新。这些简化可能会忽略基因活动的重要细节。
更麻烦的是,“噪声”——错误和其他不确定行为的来源——在真实世界的复杂系统中是不可避免的,基因调控也是如此。生物的基因网络会不断犯错误,但是它们具有弹性——大多数情况下我们的健康不会受这些错误影响。然而,仿真结果表明,噪声对RBN的行为有明显的影响,有时候甚至会阻止RBN到达稳定的吸引子。虽然考夫曼对RBN的实验结果做了具体说明,但其中一些也经不起仔细推敲。
例如,考夫曼认为一个典型的网络可能的吸引子数量大约为节点数量的平方根,而他将这个解释为细胞类型。但进一步的仿真表明,吸引子的数量实际上并不是近似等于节点数量的平方根。当然,这并不意味着考夫曼的观点在大的方面就肯定错了;这只是表明,在发展更准确的模型方面还有很多工作要做。发展基因调控网络的准确模型现在是生物学中非常活跃的研究领域。
总结
生命系统的复杂性是如何进化出来的?这个进化生物学中最重要的问题目前仍未得到解决。在这一章我们看到,对生物复杂度的完全理解现在才刚刚开始。我们也看到,对复杂性的进化的理解已经迈出了一些重要的步伐。其中包括一些人提出的“扩展综合(extended Synthesis)”,这个理论认为自然选择仍然很重要,但是其他因素——历史偶然、发育制约(developmental constraint)和自组织——也和自然选择一样重要。进化论者由于受到宗教极端主义的攻击,尤其是在美国,并且经常处于守势,因而不愿意承认自然选择可能不是故事的全部。对于这种窘境,生物学家霍泽尔(Guy Hoelzer)、佩珀(John Pepper)和埃里克·斯密斯(Eric Smith)评论道:“加入捍卫达尔文主义的战斗现在已经成为进化生物学家必需的社会责任,但这种文化范式也带来了对科学的负面影响。对进化过程进行新的解释,以对自然选择进行补充,也会激起同样的不经思索的反对立场。”
进化生物学家麦舒(Dan Mc Shea)教了我一个思考这些问题的好办法。他将进化论者分为三类:适应主义者,认为自然选择才是主要的;历史主义者,相信历史偶然导致了许多进化变化;以及考夫曼这样的结构主义者,关注的是组织结构如何能没有自然选择也能产生。只有这三类人证明他们的研究能够成为一个整体时,进化论才能统一。
麦舒也为我进行了乐观的展望:“进化生物学处于知识混沌状态中,但这个知识混沌极富成效。”