第17章 比例之谜
前两章我们看到,网络的思想对许多科学领域都有深刻影响,尤其是生物学。就在不久前,网络思想又为生物学中一个最让人费解的难题提出了新的解答:生物的大小变化时其他属性会如何变化。
生物学中的比例缩放
比例描述的是一个属性改变时,其他相关的属性会如何改变。生物学的比例之谜关注的则是生物在休息时消耗的平均能量——基础代谢率——随着生物体重的变化会如何变化。细胞将食物、空气和光照转化为能量的代谢过程是所有生物系统的关键,因此体重与代谢的关系对于理解生命的运作极为重要。
人们很早就发现,相对于体重大小来说,较小动物的代谢率比较大的动物更快。1883年,德国生理学家鲁伯纳(Max Rubner)尝试从热力学和几何的角度来确定准确的比例关系。第3章曾提到过,代谢过程要将能量从一种形式转化成另一种形式,因此总是会发热。生物的代谢率可以定义为细胞将营养转化为能量的速率,能量用于细胞的运作和生成新细胞。在这个过程中生物会以同样的速率散发热量。因此通过测量生物产生的热量就能推导出代谢率。
如果你之前不知道较小动物的代谢率相对比较大的动物更快,你很可能会想代谢率是不是与体重呈线性比例关系——例如,仓鼠的体重是老鼠的8倍,那么代谢率也应该是老鼠的8倍,或者举个极端点的例子,河马的体重是老鼠的125000倍,那么代谢率也应该是老鼠的125000倍。
问题是,如果这样,仓鼠产生的热量也应该是老鼠的8倍。但是散热要通过表皮,而仓鼠的表皮面积只是老鼠的4倍。这是因为动物的表皮面积并不正比于动物的体重(同样也不正比于体积)。
图17.1说明了这一点,图中老鼠、仓鼠和河马用球体表示。你也许还记得中学几何学过球体的体积公式是(4/3)π乘以半径的立方,其中π≈3.14159。而球体的表面积公式是4π乘以半径的平方。因此“体积与半径的立方呈比例”而“表面积与半径的平方呈比例”。这里“呈比例”的意思也就是“正比于”——也就是说忽略常数(4/3)π和4π。从图17.1中可以看到,仓鼠球体的半径大约是老鼠球体的2倍,因此表面积是老鼠球体的4倍,而体积则是老鼠球体的8倍。河马球体的半径是老鼠球体的50倍(没有按比例画),因此河马球体的表面积是老鼠球体的2500倍,而体积则是老鼠球体的125000倍。可以看到,随着半径增大,表面积的增长要比体积慢得多。因为表面积与半径平方呈比例,而体积与半径立方呈比例,因此我们说“表面积与体积的2/3次幂呈比例”。(推导过程见注释。)
图17.1 动物的比例特征(用球体表示)(David Moser绘图)
体积的2/3次幂的意思就是“体积平方,然后开3次方”。
表皮面积只大4倍,通过表皮发的热却要大8倍,这只仓鼠肯定不是一般的热。同样,河马的表皮面积比老鼠大2500倍,发的热却是老鼠的125000倍。天哪!这只河马恐怕会烧起来。
大自然非常仁慈,它没有这样做。谢天谢地,我们的代谢率与我们的体重不是呈线性比例。鲁伯纳推测,为了安全地发散热量,大自然让我们的代谢率与体重的比例关系同表皮面积一样。他提出代谢率同体重的2/3次幂呈比例。这就是所谓的“表皮猜想(surface hypothesis)”,此后50年这个猜想被广泛接受。唯一的问题是实际数据并不与之相符。
20世纪30年代,瑞典动物学家克莱伯(Max Kleiber)仔细测量了一系列动物的代谢率。他的数据表明代谢率与体重的3/4次幂呈比例。也就是说,代谢率正比于体重3/4。你肯定注意到了这就是一个指数为3/4的幂律。这个结果出人意料。指数为3/4而不是2/3,这意味着动物——尤其是较大的动物——的代谢率比人们预想的要高,这也意味着动物比先前根据几何简单预计的要更高效。
图17.2展示了各种动物的这种比例关系。横轴表示体重(单位:千克),纵轴则表示平均基础代谢率(单位:瓦)。图中黑点表示各种动物的实际测量值,直线则表示与体重的3/4次幂呈比例的代谢率曲线。数据与曲线没有精确匹配,但也符合得很好。图17.2是一种特殊的图——专业上称为双对数(或对数—对数)图——图中两条轴都是以10次幂增长。在双对数图上幂律曲线表现为直线,而直线的斜率则等于幂律的指数。(见注释中对此的解释。)
图17.2 各种动物的代谢率与体重的关系[引自施密特—尼尔森的《比例:为什么动物的大小如此重要?》(K.Schmidt.Nielsen, Scaling:Why Is Animal Size So Important?),剑桥大学出版社1984年出版。经剑桥大学出版社许可重印]
这个幂律关系现在被称为克莱伯定律(Kleiber’s law)。最近有研究发现,3/4次幂比例不仅对哺乳动物和鸟类成立,对鱼类、植物,甚至单细胞生物也成立。
克莱伯定律是建立在对代谢率和体重的测量的基础上,克莱伯没有解释这个定律为什么成立。结果克莱伯定律一直困扰着生物学家们。生命系统的重量范围很大,细菌不到万亿分之一克,鲸鱼则可能超过10万千克。这个规律不仅违背简单的几何推理,适用范围也大得惊人,涵盖各种大小的生物,也适用于各种生物类型和生境。到底是生物的哪种共性导致了这个简单而优雅的规律呢?
其他一些相关的比例关系也一直让生物学家们感到困惑。例如,越大的哺乳动物生命期越长。老鼠的生命期一般为2年左右,猪的生命期则大约为10年,大象超过50年。其中也有例外,特别是人类,但是对大部分哺乳动物都成立。如果画出许多物种的平均生命期和体重的关系,会发现是指数为1/4的幂律。如果画出平均心率与体重的关系,你会得到指数为-1/4的幂律(越大的动物心率越慢)。生物学家们发现了大量的幂律关系,都是分母为4的分数指数。因此,这些关系也被称为四分幂比例律(quarter-power scaling laws)。许多人怀疑,这些四分幂比例律意味着这些生物具有某种非常重要的共性。但是没人知道是什么共性。
一次跨学科合作
20世纪90年代中期,新墨西哥大学的生态学教授布朗(James Brown)多年来一直在研究四分幂比例律。他很早就意识到,如果能解决这个问题,理解这些普适比例律的原理,对于发展出生物学的一般理论将很重要。一位对比例问题很着迷的生物学研究生恩奎斯特(Brian Enquist)加入了布朗的团队,他们开始尝试一起来攻克这个问题(图17.3)。
图17.3 从左往右:韦斯特、恩奎斯特、布朗(圣塔菲研究所拥有照片版权。经许可重印)
布朗和恩奎斯特怀疑,向细胞输送营养的系统结构是解决这个问题的关键。血液不断在血管中循环,血管形成了一个树状网络,将营养物质输送到身体的所有细胞。同样,在肺部是由支气管组成的分支结构将氧气输送到血管提供给血液(图17.4)。布朗和恩奎斯特认为正是这种在动物体内普遍存在的分支结构导致了四分幂律。要理解这种结构为何会导致四分幂律,就得用数学描述这种结构,并从数学上证明这种结构直接导致了观察到的那些比例律。
图17.4 肺中由支气管组成的分支结构(Patrick Lynch绘图,经知识共享组织许可使用,http://creativecommons.org/licenses/by/3.0/)
大部分生物学家,包括布朗和恩奎斯特,都不具备必需的数学背景,无法进行这样复杂的几何和拓扑分析。因此布朗和恩奎斯特决定寻找一位“数学伙伴”——一位数学家或理论物理学家,可以帮助他们解决这个问题,同时又不过度简化以至于失去生物学意义。
韦斯特(Geoffrey West)正符合他们的要求。韦斯特是理论物理学家,在洛斯阿拉莫斯国家实验室工作,他具有解决比例问题所需的数学能力。他研究过比例问题,虽然是在量子力学领域,但是他自己也思考过生物比例问题,只是不太懂生物学。20世纪90年代中期,布朗和恩奎斯特在圣塔菲研究所遇到了韦斯特。此后三人开始每周在研究所会面,形成了合作关系。我记得当时每星期都见到他们,在一间玻璃会议室里专心讨论,同时还有人(通常是韦斯特)在黑板上写下一堆复杂的公式。(恩奎斯特后来用“放烟火”来描述他们的数学结果。1)当时我并不是很清楚他们在讨论什么。但后来当我听到韦斯特在讲座上介绍他们的理论时,我被这个理论的优雅简洁和适用范围之广惊呆了。在我看来,这个工作是迄今为止复杂系统研究的巅峰之作。
布朗、恩奎斯特和韦斯特提出的理论不仅揭示了克莱伯定律和其他观察到的生物比例关系,而且还推断出生命系统中一系列新的比例关系,其中许多后来都得到了数据支持。这个理论叫作代谢比例理论(Metabolic scaling theory,或简单代谢理论),结合了生物学和物理学,也在这两个领域引起了很大的轰动和争议。
幂律与分形
代谢比例理论回答了两个问题:①到底为什么代谢比例遵循幂律;②为什么遵循指数为3/4的幂律。在阐述这个理论之前,我需要简单阐释一下幂律与分形的关系。
还记不记得第7章讨论的科赫曲线和分形?如果记得,你也许还会记得“分形维”的概念。我们看到,在科赫曲线中,每一层的线段长度都是上一层的1/3,而每一层都是由上一层的4份拷贝组合而成。类似于维数的传统定义,我们这样定义科赫曲线的分形维:3维数=4,得到维数=1.26。也就是说,如果每一层与上一层的比例系数是x,而又是由上一层的N个拷贝组合而成,那么x维数=N。现在阅读了第15章之后,你会意识到这就是幂律,维数就是幂律指数。这说明幂律与分形有密切关联。我们在第15章图15.10中看到的幂律分布就是分形——它们在所有缩放尺度上都自相似,而幂律指数则是相应的分形维(参见第7章),维数量化的正是分布的自相似与放大倍数的比例关系。因此我们可以说,例如,网络的度分布具有分形结构,因为它是自相似的。同样,我们也可以说科赫曲线这样的分形导致了幂律——幂律描述的正是曲线的自相似与放大倍数的比例关系。
最后的结论就是,分形结构是产生幂律分布的一种方式;如果你发现某种量(例如代谢率)遵循幂律分布,你就可以猜想这是某种自相似或分形系统导致的。
代谢比例理论
考虑到代谢率是身体细胞将原料转化为能量的速率,布朗、恩奎斯特和韦斯特认为代谢率应当主要是由向细胞输送原料的效率决定的。而输送原料是生物循环系统的工作。
布朗、恩奎斯特和韦斯特意识到,对于循环系统来说,起决定性作用的不仅是它的质量或长度,更重要的是它的网络结构。正如韦斯特所说的:“你应当在两个不同的尺度上思考——表面的你和真正的你,而后者是由网络组成的。”
在发展理论时,布朗、恩奎斯特和韦斯特假定进化过程已使得循环和营养输送系统能尽可能地填充身体空间,也就是说能将养分输送到身体所有部位的细胞。他们还假定进化出的网络能最小化向细胞输送养分时所花费的能量和时间。最后,他们假定网络向身体组织提供燃料的“终端单元”大小不随体重变化。这个看法是有根据的,例如,大多数动物循环系统的毛细血管都是一样大的。只是越大的动物毛细血管越多。这是因为细胞的大小不受身体大小影响:老鼠和河马的细胞都差不多大。只是河马的细胞更多,因此也需要更多的毛细血管向它们提供养分。
尽可能填充空间的几何对象其实就是分形分支结构——在所有尺度上自相似意味着空间在所有尺度上都被同等填充。布朗、恩奎斯特和韦斯特那些日子在玻璃会议室发展的精巧数学模型正是将循环系统视为填充空间的分形。他们融合了前面说的能量时间最小化和终端单位大小不变假设,然后问,当身体变大时,模型会发生什么变化呢?他们的计算表明,决定代谢率的养分输送速率与体重呈指数为3/4的比例关系。
推导出指数为3/4的模型细节相当复杂,不过还是可以看看他们对指数3/4的解释。前面讨论了鲁伯纳的表皮假说,代谢率与体重的比例关系就如同表面积与体积的比例关系,指数为2/3。理解指数3/4的一种方式是将其视为表皮假说应用到四维生物的结果!通过简单的维数类比就能明白这一点。圆这样的二维对象有周长和面积。如果是三维,就分别对应表面积和体积。如果是四维,表面积和体积则分别对应于“表面”体积和超体积——这个量很难想象,因为我们天生擅长思考三维,不擅长思考四维。表面积与体积呈指数为2/3的比例关系,通过类似的论证,就可以知道四维的表面体积与超体积呈指数为3/4的比例关系。
简而言之,布朗、恩奎斯特和韦斯特的观点就是,进化将我们的循环系统塑造成了接近于“四维的”分形网络,从而使我们的新陈代谢更加高效。用他们自己的话说:“虽然生物是三维的,内部的生理结构和运作却表现为四维……分形几何给了生命一个额外的维度。”
理论的应用
代谢比例理论最初是用来解释各种动物的代谢比例,也就是图17.2中的现象。但是布朗、恩奎斯特和韦斯特,以及越来越多新加入的研究者并不满足于此。不断有新的生物门类和现象被发现可以用这个理论解释。他们认为他们的理论也可以解释其他四分幂比例律,例如心率、生命期、妊娠期以及睡眠时间等。他们认为植物的代谢比例也可以用这个理论解释,许多植物都是用类似于分形的管道网络输送水和养分。不仅如此,他们认为树干周长、植物生长速度等动植物特性的四分幂比例律都可以用这个理论解释。一种更广义的代谢比例理论将体温也囊括进来,可以解释爬行动物和鱼类的代谢律。
再来看看微观领域,研究组推测,他们的理论可以应用到细胞层面,3/4指数代谢比例既可以计算单细胞生物的代谢律,也适用于细胞内部分子层面的类代谢运输过程,甚至包括像线粒体这样的细胞器内部的类代谢过程。研究组还认为这个理论可以解释生物DNA的变化速率,因此与遗传学和进化生物学也密切相关。还有人发现这个理论可以解释肿瘤生长速度与重量的比例关系。
在大的方面,代谢比例理论及其扩展已经被应用到整个生态系统。布朗、恩奎斯特和韦斯特认为他们的理论能解释一些生态系统中观察到的种群密度与身体大小的-3/4幂律关系。
事实上,代谢对于生命系统的方方面面都很重要,几乎找不到这个理论没有触及的领域。许多科学家对此非常兴奋,不断为这个理论寻找新的应用。有人认为代谢比例理论“有统一整个生物学的潜力”,“对于生物学的重要性就好比牛顿的发现对于物理学的重要性”。研究组在一篇论文中这样说道:“可以预见,广义代谢理论的涌现对于生物学的重要性将类似于遗传理论。”
争议
一个刚刚初具雏形的理论却声称能解释这么多东西,可想而知,一些科学家会对代谢比例理论充满热情,一些人则极力反对。下面是最近发表在顶级科学期刊上的两个主要批评观点:
◆四分幂比例律并不像理论说的那样具有普适性。通常来说,任何关于生物系统的一般性属性都会有特例。(甚至规则本身都会有特例。)姑且认为代谢比例理论也不例外。虽然大部分生物学家都同意大多数物种都遵循各种四分幂比例律,但也有许多例外。甚至在单一物种内的代谢律都变化很大。狗就是一个常见的例子,小型犬与大型犬的寿命都差不多。有观点认为,克莱伯定律只是统计平均,偏差有可能相当大,而代谢理论无法解释这一点,因为只考虑了体重和体温。有人则认为理论得出的一些规律与实际数据严重不符。甚至有人认为克莱伯根本就是错的,一百多年前鲁伯纳提出的表皮假说才是对的,指数为2/3的幂律对数据的拟合最好。在大部分情形中,争议都在于对代谢比例的数据应该如何解读,以及“拟合”指的是什么。代谢比例研究组坚持他们的理论,并且不厌其烦地回应了许多争议,由于涉及高等统计学和生物学,这些争议变得越来越艰深晦涩。
◆克莱伯的比例定律是对的,但代谢比例理论错了。有些人认为代谢比例理论过度简化,生命极为复杂多变,不可能被单一理论所涵盖,分形结构也不是解释幂律分布现象的唯一途径。一位生态学家这样评论:“人们对于所涉及的生理细节了解得越多,这种解释就越显得不合理。”另一位学者则说:“事情简单当然很好,但现实中往往不是这样。”另外还有人认为代谢比例理论的数学有错误。代谢比例理论研究组坚决不同意这一点,并且指出了批评意见中的一些基本数学错误。
研究组坚持自己的立场,他们对吹毛求疵的批评意见感到沮丧。韦斯特说:“我的内心不会向这些在我脚边乱吠的小狗屈服。”不过研究组还是认为,有这么多批评意见不是坏事——不管他们到底怎么认为,毕竟有很多人在关注代谢比例理论。并且,就像我在前面提到的,怀疑是科学家们最重要的职责,越是杰出而有雄心的理论,越是会受到质疑。
争议不会很快平息;牛顿的引力理论提出来60年后都没有被广泛认可,许多最重要的科学进展都曾有类似的经历。现在我们能说的是,代谢比例理论非常有趣,应用范围很广,也得到了一些实验数据的支持。生态学家穆勒—兰道(Helene Müller-Landau)评论道:“我想韦斯特和恩奎斯特等人不会一直重复他们的观点,批评者也不会一直重复他们的质疑,随着时间流逝,证据的天平最终会倒向胜利的一边。”
幂律的未解之谜
在前一章和这一章我们看到了许多幂律。除了这些,在城市规模、收入、地震、心率变化、森林火灾和股市波动等现象中都发现了幂律分布,这还只是其中一小部分。
第15章曾讲过,科学家们一般都假定大部分自然现象都服从钟形曲线或者说正态分布。然而幂律却在很多现象中都有被发现,以至于一些科学家说它“比‘正态’还要正态”。用数学家维林格(Walter Willinger)和他同事的话说:“在复杂的自然和工程系统中获得的数据中发现(幂律)分布,应当视为正常而不是意外。”
科学家们对自然界中钟形曲线分布的成因有很好的理解,但幂律在一定程度上却还是个谜。我们已经看到,对于自然界中观察到的幂律有各种解释(例如,偏好附连、分形结构、自组织临界性、高度容错等等),对于是哪种机制导致了幂律现象很少有共识。
20世纪30年代早期,哈佛语言学教授齐普夫(George Kingsley Zipf)在一本书中介绍了语言的许多有趣属性。随意在小说或报纸中取一大段文字,将所有词根据出现次数排序。例如,下面是莎士比亚戏剧《哈姆雷特》的独白“生存还是毁灭”中的词频表:
根据词频降序排列,频数最高的词排第一(“the”),频数第二高的词排第二,等等。一些词的频数一样(例如,“a”和“sleep”都出现了5次),对于这种情况随机排序。
在图17.5中画出了“生存还是毁灭”的词频与排名的关系。图的形状接近幂律。如果选取的文本更多,图形会更接近幂律。
图17.5 齐普夫定律,以莎士比亚的独白“生存还是毁灭”为例
齐普夫用这种方法分析了大量文本(没有借助计算机),他发现,对于大规模文本,词频大致正比于其排名的倒数(也就是1/排名)。这是指数为-1的幂律。排名第二的词的频数大约是排第一的词的一半,第三大约是1/3,等等。这个关系现在被称为齐普夫定律(Zipf’s law),这可能是最著名的幂律。
对齐普夫定律有各种解释,齐普夫自己提出,一方面,人们一般都遵循“最省力原则(Principle of Least Effort)”:一旦用到了某个词,对类似的意思再用这个词就比换其他词要省力。另一方面,人们希望语言没有歧义,这又需要用不同的词来表示相似却又不完全一样的意思。齐普夫从数学上证明了这两种倾向在一起会产生观察到的幂律分布。
20世纪50年代,因发现分形而闻名的曼德布罗特从信息量的角度提出了不同的解释。借鉴香农的信息论(参见第3章),曼德布罗特将词视为“讯息”,发送者在将信息量最大化的同时尽量将发送信息的成本最小化。例如,“feline”和“cat”的意思都是猫,但后者更短,因此传送成本也更低(或者更节省能量)。曼德布罗特证明,如果同时优化信息量和传送成本,就会导致齐普夫定律。
几乎同时,西蒙(Herbert Simon)也提出了一种解释,可以说是偏好附连的前身。西蒙设想一个人每次向文本中添加一个词。他认为,人们重用一个词的概率正比于这个词在文本中的当前频数。没出现过的词具有同样的非零概率。西蒙证明这个过程产生的文本会遵循齐普夫定律。
对于曼德布罗特和西蒙的解释哪个正确,争论很激烈(从《信息与控制》杂志不断收到的信件可见一斑)。
结果,几乎与此同时,让所有人都大跌眼镜,心理学家乔治·米勒(George Miller)使用简单的概率论证明,让猴子在键盘上随意敲击,如果(偶然)敲到了空格键就断词,这样得出的文本同样遵循齐普夫定律。
20世纪30—50年代针对齐普夫定律提出的许多解释是目前针对自然界中产生幂律的物理或信息机制的争论的缩影。理解幂律分布的根源、意义和在各学科中的共性,是目前许多复杂系统研究领域最为重要的未解决的问题。我相信,随着这些现象背后的科学越来越清晰,你还会不断听到这个问题的消息。