第一推动丛书·综合系列(套装共8册)
上QQ阅读APP看书,第一时间看更新

第14章 计算机模型

复杂系统顾名思义就是很复杂的系统,而物理、化学、数学、生物学这些以数学为导向的学科关注的往往是易于用数学处理的简单而理想化的系统。复杂系统很难单独用数学进行处理,不过现在的计算机速度越来越快,价格也越来越便宜,已经有可能构造复杂系统的计算机模型并进行实验。图灵、冯·诺依曼、维纳(Norbert Wiener)等计算机科学先驱都希望用计算机模拟能发育、思维、学习和进化的系统。一门新的实践科学由此诞生。在理论科学和实验科学之外又产生了一个新的门类:计算机仿真(图14.1)。在这一章,我们来看一看复杂系统的计算机模型能告诉我们什么,用这样的模型来进行研究又会有哪些陷阱。

图14.1 在理论科学和实验科学的传统划分之外又产生了一个新的门类:计算机仿真(David Moser绘制)

模型是什么

在科学中,模型是对某种“实在”现象的简化表示。科学家们说是在研究自然,但实际上他们做的大部分事情都是在对自然进行建模,并对所建立的模型进行研究。

以牛顿的引力定律为例:两个物体之间的引力正比于它们质量的乘积。这是对一种特定现象的数学描述——也就是数学模型。还有一种模型是用较为简单的概念来描述现象实际是如何运作的,也就是所谓的原理。在牛顿的时代,他的引力定律受到质疑,就是因为他没有解释引力的原理。也就是说,他没有用“大小、形状和运动”等物理对象的属性对其进行解释——根据笛卡儿的思想,这些基本要素是所有物理模型必要而且充分的组成部分“根据笛卡儿的思想,这些基本要素是所有物理模型必要而且充分的组成部分”:Garber, D.,Descartes, mechanics, and the mechanical philosophy.Midwest Studies in Philosophy,26(1),2002,pp.185—204。牛顿自己推测过引力的可能原理,例如,他“猜想地球就像海绵一样,“猜想地球就像海绵一样”:Kubrin, D.,Newton and the cyclical cosmos:Providence and the mechanical philosophy.Journal of the History of Ideas,28(3),1967。不断吸收天空降落下来的轻质流体,这种流体作用到地球上的物体上,导致它们下降”。这种概念框架可以称为原理模型。200年后,爱因斯坦提出了一种不同的引力原理模型——广义相对论,在其中引力被概念化为四维时空的几何特性。现在,一些物理学家又在鼓吹弦论,提出引力是由细小、振动的弦导致的。

模型是我们思维的方式,是用我们熟悉的概念解释观察到的现象,所用到的概念是我们的头脑能够理解的(就弦论来说,则是少数非常聪明的人能够理解的)。模型也是预测未来的途径:比如说,牛顿的引力定律仍然被用来预测行星轨道,而爱因斯坦的广义相对论则成功预测了那些所预测的轨道的偏差。

理想模型

在天气预报、汽车和飞机设计、军事运筹中,经常用计算机来运行详尽而复杂的模型,对所建模的特定现象进行详细的预测。

而在复杂系统研究中一个主要的方向就是研究理想模型:通过相对简单的模型来理解一般性的概念,而不用对具体系统进行详细的预测。下面是我在书中曾讨论过的一些理想模型的例子:

◆麦克斯韦妖:用来研究熵的概念的理想模型。

◆图灵机:用来对“明确程序”进行形式化定义以及研究计算概念的理想模型。

◆逻辑斯蒂模型和逻辑斯蒂映射:用来预测种群数量的极简模型;后来成为研究动力学和混沌一般性概念的理想模型。

◆冯·诺依曼自复制自动机:用来研究自复制“逻辑”的理想模型。

◆遗传算法:用来研究适应性概念的理想模型。有时候也作为达尔文进化的极简模型。

◆元胞自动机:用于研究一般性的复杂系统的理想模型。

◆科赫曲线:用来研究海岸线、雪花等分形结构的理想模型。

◆模仿者:用来研究人类类比思维的理想模型。

理想模型有许多用途:研究一些复杂现象背后的一般机制(例如,冯·诺依曼研究自复制的逻辑);证明解释某种现象的机制是不是合理(例如,种群数量的动力学);研究简单模型在变化后的效应(例如,研究遗传算法的变异率或逻辑斯蒂映射的控制参数R变化所带来的影响);或者更普遍是作为哲学家丹尼特(Daniel Dennett)所谓的“直觉泵”“直觉泵”:Dennett, D.R.,Elbow Room:The Varieties of Free Will Worth Wanting.Cambridge, MA:MIT Press,1984,p.12。(intuition pump)——用来引导对复杂现象进行理解的思维实验或计算机仿真。

复杂系统的理想模型也能为新的技术和计算方法提供灵感。例如,图灵机启发了可编程计算机;冯·诺依曼的自复制自动机启发了元胞自动机;达尔文进化、免疫系统和昆虫社会的极简模型分别启发了遗传算法、计算机免疫系统和“群体智能(swarm intelligence)”方法。为了领略科学中理想模型的成就,现在我们来深入了解一下社会科学中的几个理想模型,从最广为人知的模型开始:囚徒困境。

对合作的进化进行模拟

许多生物学家和社会学家都用理想模型来研究为什么在由自私个体组成的群体中会进化出合作。

生物归根结底都是自私的——它们要想在进化中获得成功,就必须能活足够长的时间,保持足够的健康,还要能吸引异性,以繁衍后代。大部分生物为了达到这些目的会毫不犹豫地与其他生物进行斗争,采用各种伎俩,杀死或杀伤其他生物。通常的看法认为进化选择会使得自私或自卫本能得以传递给下一代并在种群中扩散。

然而与这种看法相反,在生物王国和社会的各个层面上都有许多明显不符合自私原则的例子。从底层看,在进化历程的一定阶段时刻,单细胞生物会互相合作以形成更复杂的多细胞生物。后来,又进化出了蚁群这样的社会性生物,大部分蚂蚁为了蚁群的整体利益工作,甚至放弃了繁衍的能力,只让蚁后来繁衍后代。后来,灵长类动物群体中又涌现出了更加复杂的社会,社会团结一致对外,复杂的贸易,最终出现了人类国家、政府、法律和国际条约。

生物学家、社会学家、经济学家和政治学家都面临着类似的问题,本质上自私的个体中是怎么产生出合作的。这不仅仅是个科学问题,也是政治问题:例如,是否有可能创造条件让国家之间产生并维持合作,一起应对核扩散、艾滋病、全球变暖等国际问题?

囚徒困境

20世纪50年代冷战高峰时期,一些人开始思考如何推动敌对国家之间的合作,以避免核战争。1950年前后,两位数学博弈论学家,弗勒德(Merrill Flood)和德雷希尔(Melvin Drescher)发明了囚徒困境,“弗勒德和德雷希尔发明了囚徒困境”:对囚徒困境以及博弈论的历史和应用有趣而富有启发的讨论,参见Poundstone, W.,Prisoner’s Dilemma.New York:Doubleday,1992。用来研究这种合作难题。

囚徒困境基本形式如下。两个人(姑且称他们为爱丽丝和鲍勃)因为合伙犯罪被逮捕了,警察将他们分别关在不同的房间(图14.2)。爱丽丝和鲍勃必须各自决定是否指证对方。如果爱丽丝同意指证鲍勃,她就会被释放,而鲍勃则会被判处无期徒刑。但如果爱丽丝拒绝指证,而鲍勃同意指证爱丽丝,则他将被释放,爱丽丝则会被判无期徒刑。如果两人都指证对方,则两人都会被关入监狱,但是只判10年徒刑。而如果两人都不指证对方,则两人都会判得较轻,只需入狱5年。警察要求他们不许相互沟通,必须马上做出决定。

图14.2 爱丽丝和鲍勃面临着“囚徒困境”(David Moser绘制)

如果你是爱丽丝,你会怎么做呢?

你可能会这样想:鲍勃有可能指证你,也有可能不指证,你不知道他会怎么做。如果他指证你,你最好的选择就是指证他(入狱10年要好于无期)。如果他不指证你,你最好的选择仍然是指证他(释放要好于入狱5年)。因此,不管鲍勃怎么做,你脱罪最好的选择都是同意指证他。

问题是鲍勃也会这样想。因此你们俩都会同意指证对方,而如果你们俩都保持沉默,得到的结果会更好。

我们再换一个场景来看这个问题,假设你是美国总统,你在考虑是否建造一种强大的核武器,比你现有的武器强得多。你怀疑俄国政府也在考虑这样做,但是不确切。

假设俄国决定发展这种武器,如果你也决定建造这种武器,那美国和俄国的军力就会维持平衡,尽管两国的花费都不少,世界也处于更危险的境地;如果你决定不发展这种武器,那么俄国对美国的军力就会占优势。

假设俄国决定不发展这种武器,如果你决定建造,那美国对俄国的军力就会占优,同时国家也会有财政负担;而如果你决定不建造,那么美国和俄国仍然会维持军力平衡。

同鲍勃和爱丽丝面临的情形一样,无论俄国怎么做,你最好的选择都是同意建造,因为不管俄国的选择是什么,建造武器都是美国更好的选择。当然,俄国也这样想,因此两国都会决定建造新的核弹,而如果两国都不建造,本来结果会更好。

这就是囚徒困境悖论——用政治学家阿克塞尔罗德(Robert Axelrod)的话说,“每个人都追求自利,使得所有人的利益都受损。”“每个人都追求自利,使得所有人的利益都受损”:Axelrod, R.,The Evolution of Cooperation.New York:Basic Books,1984,p.7。这个悖论指的是群体中的个体由于只顾自身利益,整体上却使得群体所有个体都受损的情形(全球变暖就是典型的这种例子)。经济学家哈丁(Garrett Hardin)有个著名的词描述这种情况——“公地悲剧”。“公地悲剧”:Hardin, G.,The tragedy of the commons.Science,162,1968,pp.1243—1248.

囚徒困境及其变体作为理想模型体现了合作问题的本质,其影响遍及学术界和商业界,并且改变了各国政府对于核裁军、恐怖主义以及合作管理和规范等现实世界中政策问题的看法。

囚徒困境通常用两人“博弈”的收益矩阵表示——矩阵中各元素为两个人在各种可能情形下的收益。表14.1给出了囚徒困境收益矩阵的一个例子。博弈的目标是尽可能多得分(蹲监狱的时间尽可能短)。参与者各自决定“合作还是背叛”,各决定一次形成一个回合。也就是说,每个回合中,参与者A和B不能相互商量是否合作(例如,拒绝指证;决定不建造核弹)。如果双方都合作,各得3分。如果A合作而B背叛,则A得0分而B得5分,反之则A得5分而B得0分。如果双方都背叛,则各得1分。前面说了,如果只进行一个回合,则两人合理的策略就是背叛。但如果有多个回合,也就是说,如果双方相互博弈多次,则总是背叛的参与者的收益会远低于学会了相互合作的参与者。互利合作是如何产生的呢?

表14.1 囚徒困境的收益矩阵

密歇根大学的政治学家阿克塞尔罗德(图14.3)深入研究了囚徒困境。他在这方面的成果深深影响了许多学科,也让他赢得了许多奖项,包括麦克阿瑟“天才”奖。

图14.3 阿克塞尔罗德(密歇根大学复杂系统研究中心提供照片)

阿克塞尔罗德因为关注军备竞赛,从冷战时期开始研究囚徒困境。他的问题是:“在一个自私的世界里,如果没有中央权威,合作要如何才能出现?”“合作要如何才能出现?”:Axelrod, R.,The Evolution of Cooperation.New York:Basic Books,1984,p.3。阿克塞尔罗德注意到历史上对这个问题最著名的回答是17世纪哲学家霍布斯(Thomas Hobbes)给出的,他认为合作只有在存在中央权威的情况下才有可能产生。“霍布斯……认为合作只有在存在中央权威的情况下才有可能产生”:霍布斯关于集权政府的论述参见Hobbes, T.,Leviathan.1651年首次出版;1991年版由R.Tuck编辑。Cambridge University Press,1991。300年(和无数场战争)之后,爱因斯坦也提出了类似的观点,“爱因斯坦也提出了类似的观点”:爱因斯坦关于世界政府等问题的思想参见他的著作集,Einstein, A.,Out of My Later Years.1950年首次出版;2005年修订版,Castle Books。认为在核武器时代要确保和平的唯一途径就是成立高效的世界政府。国际联盟,以及后来的联合国,就是以此为目的成立的,但是都没有成功成立世界政府,或是维持世界和平。

高效的世界政府看来是指望不上了,阿克塞尔罗德想知道,如果没有世界政府是不是也有可能产生合作。他认为通过研究多回合的囚徒困境也许能有助于认识这个问题。阿克塞尔罗德认为,“合作要能够产生”就意味着,不管对手的策略如何变化,从长期来看,合作策略必须比非合作策略的收益更高。而且,如果用达尔文选择对策略进行演化,则种群中的合作策略的比重应当会随时间增加。

用计算机模拟囚徒困境

阿克塞尔罗德想知道什么样的策略是好策略,因此他组织了两次囚徒困境竞赛。他让各学科的研究人员提出各自的策略,并根据策略设计能进行囚徒困境博弈的计算机程序,然后在比赛中让这些程序互相博弈。

回想一下第9章讨论的机器人罗比,策略指的其实就是一组规则,规定了在各种情形中应该采取何种行动。对于囚徒困境来说,策略就是根据对手以前的行为决定下一步是合作还是背叛的规则。

第一次竞赛收到了14个程序;第二次增加到了63个。每个程序都相互博弈200个回合,根据表14.1中的收益矩阵计算总分。程序可以有记忆——每个程序都能存储一些之前与对手的博弈记录。有些提交来的策略相当复杂,使用统计方法分析其他策略的“心理”。然而,两次竞赛中获胜的策略——平均得分最高——都是所提交的策略中最简单的策略:针锋相对(TIT FOR TAT)。这个策略是数学家拉普波特(Anatol Rapoport)提交的,第一个回合合作,然后在后面的回合中采取对手在前一回合中所使用的策略。也就是说针锋相对策略愿意合作,并且对愿意合作的对手以礼相待。但如果对方背叛,针锋相对策略就会回之以背叛,直到对手又开始合作为止。

让人吃惊的是,这样简单的策略竟然打败了其他所有策略,尤其是第2次竞赛时参赛者已经知道了针锋相对策略,可以有针对性地与它对抗。然而,在参赛的几十位专家中,没有人能设计出更好的策略。

根据竞赛结果,阿克塞尔罗德得出了一些一般性结论。他注意到所有成绩好的策略都有友善的特点——他们从不先背叛对方。友善的策略中得分最低的是“绝不宽恕”策略:它开始时合作,但一旦对方背叛,它以后就会一直背叛。而针锋相对策略会以一次背叛惩罚对手的上一次背叛,但如果对手又开始合作,它就会原谅对方,也开始合作。阿克塞尔罗德还注意到,虽然大多数成功的策略既友善也能宽恕对手,但是它们也具有报复性——它们会在背叛发生后很快就进行惩罚。针锋相对策略不仅友善、宽恕和进行报复,它还有一个很重要的特性:行为明确,具有可预见性。对手很容易就能知道针锋相对采取的策略,因此也就能预知它会如何对对手的行为做出反应。这种可预见性对于促进合作很重要。

有趣的是,阿克塞尔罗德在竞赛之后又进行了一系列实验,用遗传算法演化囚徒困境的策略。策略的适应度就是它与种群中其他策略反复博弈之后的得分。遗传算法演化出的策略行为与针锋相对也是一样的。

囚徒困境的扩展

阿克塞尔罗德对囚徒困境的研究在20世纪80年代引起了轰动,尤其是在社会科学中影响很大。人们开始研究它的各种变体——采用不同的收益矩阵、不同的参与人数或者在多方博弈中让各方能选择对手,等等。其中有两个很有趣的实验分别增加了社会规范和空间结构。

加入社会规范

阿克塞尔罗德进行了添加社会规范的囚徒困境实验,“阿克塞尔罗德进行了添加社会规范的囚徒困境实验”:Axelrod, R.,An evolutionary approach to norms.American Political Science Review,80(4),1986,pp.1095—1111。实验中规范表现为在背叛被其他人发现时的社会谴责(用负分表示)。在阿克塞尔罗德的多方博弈中,个体的每次背叛,都有一定的概率被其他个体发现。除了决定合作或背叛的策略,每个个体还有在发现其他个体的背叛行为时决定是否进行惩罚(减分)的策略。

具体说,每个个体的策略由两个数字组成:背叛的概率(无耻度)和发现背叛行为时进行惩罚的概率(正义度)。在最初的群体中,概率值被随机赋予。

在每一代,群体进行一次循环博弈:群体中每个个体与其他所有个体博弈一次,每当出现背叛,背叛行为都有一定概率被其他个体发现。一旦被发现,发现背叛行为的个体就会根据自身的正义度以一定概率对背叛个体进行惩罚。

在每次循环之后,会发生进化过程:根据适应度(得分)选择父代策略,从而产生出下一代策略。父代通过变异复制产生后代:每个后代的无耻度和嫉恶度在父代的基础上稍微变化。如果开始时群体中大多数个体的正义度都设为0(也就是没有社会规范),那背叛者就会越来越多。阿克塞尔罗德最初希望能发现促进群体中合作进化的规范——也就是说,进化出正义度以对抗无耻度。

然而,结果是仅仅有规范并不足以保证产生合作。在后来的实验中,阿克塞尔罗德又加入了元规范(metanorms),在其中有执法者来惩罚非执法者。不知道你们明不明白我的意思,就好像逛超市的时候,如果我没有阻止我的小孩在过道里嬉闹,还撞到了其他顾客,有些这样的人就会以鄙视的眼神看着我。这样的元规范对我很有效。阿克塞尔罗德也发现元规范很有用——如果周围有惩罚者,非惩罚者就会演化得更倾向于惩罚,而被惩罚的背叛者也会演化得更愿意合作。用阿克塞尔罗德的话说,“元规范能促进并保持群体中的合作”。“元规范能促进并保持群体中的合作”:Axelrod, R.,An evolutionary approach to norms.American Political Science Review,80(4),1986,pp.1095—1111。

加入空间结构

数学生物学家诺瓦克(Martin Nowak)和其合作者在囚徒困境中加入了空间结构,这种扩展也非常有趣。在阿克塞尔罗德最初的实验中没有空间的概念——所有参与者相遇的可能性都一样,参与者之间的距离没有意义。

诺瓦克猜测,如果参与者位于空间网格上,有严格的邻居概念,则会对合作的进化产生很强的影响。诺瓦克同他的博士后导师梅一起进行了计算机仿真“诺瓦克同他的博士后导师梅一起进行了计算机仿真”:Nowak, M.A.&May, R.M.,Evolutionary games and spatial chaos.Nature,359(6398),1992,pp.826—829。(在第2章讲逻辑斯蒂映射时我们已经见过梅),实验中参与者位于2维网格上,都只与最近的邻居博弈。如图14.4所示,图中有一个5×5的网格,每个格子中有一个参与者(诺瓦克和梅的网格要大得多)。所有参与者的策略都极为简单——它们没有记忆;要么一直合作,要么一直背叛。

图14.4 空间囚徒困境博弈示意图。每个策略只与最近的邻居进行博弈——例如,策略P13只与其最近的邻居(阴影部分)进行博弈和生存竞争

模型周期运行。在每个时间步,每个策略与8个最近的邻居分别进行一次囚徒困境博弈(与元胞自动机类似,边缘上的格子回绕相连),然后将8次博弈的得分加总。接下来进行选择,每个策略都替换为邻域中得分最高的策略(有可能是它自己):没有变异。

这项研究的出发点是生物学。就像诺瓦克和梅说的,“我们认为,群体中确定的空间结构对合作的进化可能很重要“我们认为,群体中确定的空间结构对合作的进化可能很重要”:Nowak, M.A.&May, R.M.,Evolutionary games and spatial chaos.#Nature#,359(6398),1992,pp.826—829。,无论是分子、细胞,还是生物”。

诺瓦克和梅用各种合作和背叛个体的初始设置以及不同的收益矩阵进行了实验。他们发现在有些条件下,合作和进化个体的空间分布模式有可能振荡,甚至产生“混沌性变化”,“混沌性变化”:Nowak, M.A.&May, R.M.,Evolutionary games and spatial chaos.#Nature#,359(6398),1992,pp.826—829。在其中合作者和背叛者共存。而在非空间性的多方囚徒困境博弈中,如果没有前面提到的元规范,最后背叛者会占据群体。在诺瓦克和梅加入空间后,合作者可以一直坚持下去,无需在博弈中加入规范或元规范。

诺瓦克和梅认为他们的结果表现了真实世界中的一个特性——即,空间相邻关系的存在会促进合作。在评论这项研究时,生物学家西格蒙德(Karl Sigmund)这样说道:“地域性有利于合作“地域性有利于合作”:Sigmund, K.,On prisoners and cells,#Nature#,359(6398),1992,p.774。……这在真实的社区中可能也是成立的。”

建模的好处

对于囚徒困境这样的理想模型的计算机仿真,如果做得好的话,会是实验科学和数学理论的有力补充。对于大部分复杂系统来说,不可能对其进行真正的实验,用数学研究也非常困难,这个时候模型就是研究它们的唯一可行途径。像囚徒困境这样的理想模型最大的贡献就是为我们提供了一把钥匙,来研究合作的进化这类没有精确的科学术语和完善定义的现象。

囚徒困境模型具备了前面列出的科学中理想模型的所有作用(其他复杂系统模型也可以列出类似的贡献):

证明了解释某种现象的机制是不是合理。例如,霍布斯可能不会相信,在自私但具有适应性的个体组成的缺乏领袖的群体中会产生合作,而各种各样的囚徒困境模型则证明了这一点(虽然是以某种理想形式)。

研究简单模型在改变后的效应,引导对复杂现象的认识。各种各样的囚徒困境变体揭示了合作得以产生的条件。比如说,你可能会问,如果本来想合作的人犯了错,不小心发出了不合作的信号,打个比方,美国总统的意见被翻译成俄语时不小心弄错了,会发生什么呢?囚徒困境模型为研究这类讯息错误的影响提供了条件。霍兰德曾把这种模型比作“飞行模拟器”“霍兰德曾把这种模型比作‘飞行模拟器’”:Holland, J.H.,Emergence:From Chaos to Order.Perseus Books,1998,p.243。”,可以用来验证人们的思想和改进人们的认识。

为新技术带来灵感。囚徒困境的研究结果——例如,合作得以产生和维持的条件——就被用来帮助改进P2P网络“被用来帮助改进P2P网络”:例如,Hales, D.&Arteconi, S.,SLACER:A Self-Organizing Protocol for Coordination in Peer-to-Peer Networks.IEEE Intelligent Systems,21(2),2006,pp.29—35。和在电子商务中防止欺诈“在电子商务中防止欺诈”:例如,参见Kollock, P.,The production of trust in online markets.收录在E.J.Lawler, M.Macy, S.Thyne,&H.A.Walker(编辑),Advancesin Group Processes,Vol.16.Greenwich, CT:JAI Press,1999。,类似的应用还有很多。

引出数学理论。一些人利用囚徒困境的计算机仿真结果研究合作产生条件的通用数学理论。最近的一个例子就是诺瓦克在题为《合作进化的5条规则》的文章中所做的工作。“诺瓦克在题为《合作进化的5条规则》的文章中所做的工作”:Nowak, M.A.,Five rules for the evolution of cooperation.Science,314(5805),2006,pp.1560—1563。

从囚徒困境这样的理想模型中得出的结论能否用于改进政府外交策略或全球变暖等问题的政策决策呢?用理想模型研究各种政策效果的想法很有吸引力,事实上,囚徒困境及其相关模型对政策分析的影响已经很大了。

举个例子,新能源金融(New Energy Finance)是专为全球变暖问题提供咨询的公司,这家公司最近公布了一份报告,“新能源金融……最近公布了一份报告”:Liebreich, M.,How to Save the Planet:Be Nice, Retaliatory, Forgiving,&Clear.White Paper, New Energy Finance, Ltd.,2007。(http://www.newenergyfinance.com/docs/Press/NEF_WP_Carbon-Game-Theory_05.pdf)题为《如何拯救地球:友善、报复、宽恕、明确》。报告中认为气候变化问题就是多方多回合的囚徒困境问题,各个国家可以选择合作(减少碳排放,代价是经济受损)或是不合作(什么也不做,目前来看省了钱)。这个博弈会反复进行,不断缔结新的规范碳排放的协议和公约。报告认为,各国政府和国际组织的政策应当采取“友善、报复、宽恕、明确”的原则,正是阿克塞尔罗德在重复囚徒困境中指出的成功所需的条件。

另外,前面介绍了,通过研究规范和元规范的模型,发现规范和元规范对维持合作都很重要。这个结果对政府制定应对恐怖主义、军备控制和环境治理等问题的政策也有影响。“对政府制定应对恐怖主义、军备控制和环境治理等问题的政策也有影响”:例如,参见Cupitt, R.T.,Target rogue behavior, not rogue states.The Nonproliferation Review,3,1996,pp.46—54;Cupitt, R.T.&Grillot, S.R.,COCOM is dead, long live COCOM:Persistence and change in multilateral security institutions.British Journalof Political Science27,7,pp.361—389;以及Friedheim, R.L.,Ocean governance at the millennium:Where we have been, where we should go:Cooperation and discord in the world economy.Ocean and Coastal Management,42(9),1999,pp.747—765。诺瓦克和梅的空间囚徒困境模型则告诉人们,在许多问题中——无论是生物多样性的维持和细菌制造新抗生素的效率问题“生物多样性的维持和细菌制造新抗生素的效率问题”:例如,Nowak, M.A.&Sigmund, K.,Biodiversity:Bacterial game dynamics.Nature,418,2002,pp.138—139;Wiener, P.,Antibiotic production in a spatially structured environment.Ecology Letters,3(2),2000,pp.122—130。——空间和位置对于促进合作起到的作用。

计算机建模注意事项

所有模型都是错的,但是有一些有用。“所有模型都是错的,但是有一些有用”:Box, G.E.P.&Draper, N.R.,Empirical Model Building and Response Surfaces.New York:Wiley 1997,p.424。

——伯克斯(George Box)和德雷珀(Norman Draper)

前面描述的模型都很简单,但是却有力地促进了科学的进步和政策的调整。它们带来了全新的认识,为研究复杂系统提供了新的途径,也让我们对怎样建立有用的模型有了更深刻的理解。不过,对于这些模型结果的意义以及它们在真实世界中的应用,却存在着一些夸大其词。因此,科学家应当仔细审视这些模型,弄清楚所得到的结果的普遍性。最好的方法就是看看这些结果是不是可重复。

在天文学或化学这样的实验科学中,所有重要的实验都必须是可重复的,也就是说其他科学家如果进行同样的实验要能得出同样的结果。如果实验结果没有人能重复,就不会(也不应当)被采信。不计其数的科学观点都是因为他人无法重复而被判了死刑。

计算机模型也必须是可重复的——也就是说,其他人重新构造所提出的模型要能得到同样的结果。阿克塞尔罗德就极力拥护这种观点,他写道:“可重复性是科学积累的基石。“可重复性是科学积累的基石”:Axelrod R.,Advancing the art of simulation in the social sciences.收录在Conte, R.,Hegselmann, R.,Terna, P.(编辑),Simulating Social Phenomena.(Lecture Notes in Economics and Mathematical Systems 456).Berlin:Springer-Verlag,1997。必须确认得到的仿真结果是否可靠,也就是说可以从头进行复制。如果没有进行确认,所发表的结论中有些就有可能只不过是程序错误导致的,歪曲了所仿真的对象,或是分析结果存在错误所致。可重复性对于检验模型结论的稳健性也很有用。”

大部分研究者从内心接受这样的观点,尝试重复了许多著名的囚徒困境仿真。这其中也产生了一些有趣甚至出人意料的结果。

1995年,胡伯尔曼(Bernardo Huberman)和格兰斯(Natalie Glance)重复了诺瓦克和梅的空间囚徒困境模型。“胡伯尔曼和格兰斯重复了诺瓦克和梅的空间囚徒困境模型”:Huberman, B.A.&Glance, N.S.,Evolutionary games and computer simulations.Proceedings of the National Academy of Science,USA,90,1993,pp.7716—7718。他们的仿真只有一处改动。在原来的模型中,每一步格子上所有策略的博弈都同时进行,然后再在邻居中选择适应度最高的策略。(诺瓦克和梅必须在非并行计算机上模拟这种并行性。)胡伯尔曼和格兰斯则让一些博弈可以异步进行——也就是说,一些策略先进行博弈并选择,然后另一些策略再接着做,这样轮着来。这样简单的变化,应该说是让模型更符合实际了,他们却发现结果经常是整个网格中合作者完全被不合作者取代。穆科吉(Arijit Mukherji)、拉詹(Vijay Rajan)和斯莱格勒(James Slagle)也独立得到了类似的结果。“穆科吉、拉詹和斯莱格勒也独立得到了类似的结果”:Mukherji, A.,Rajan, V.,&Slagle, J.R.,Robustness of cooperation.Nature,379,1996,pp.125—126。他们还发现,只要存在一点失误或是欺骗(例如,合作者无意或是有意地背叛),合作就无法继续。诺瓦克、梅和他们的合作者博恩霍艾弗(Sebastian Bonhoeffor)则回应说,“诺瓦克、梅和他们的合作者博恩霍艾弗则回应说”:Nowak, M.A.,Bonhoeffer, S.,&May, R.M.,Spatial games and the maintenance of cooperation.Proceedings of the National Academy of Sciences, USA,91,1994,pp.4877—4881;Nowak, M.A.,Bonhoeffer, S.,&May, R.M.,Reply to Mukherji et al.Nature,379,1996,p.126。这样的改变只有在收益矩阵取一定的值时才会导致合作者消失,而在其他情况下则不会,至少在很长的时间内都不会消失。

2005年,加兰(Jose Manuel Galan)和利兹奎尔多(Luis Izquierdo)发表了他们重复阿克塞尔罗德的规范和元规范模型实验的结果。“加兰和利兹奎尔多发表了他们重复阿克塞尔罗德的规范和元规范模型实验的结果”:Galan, J.M.&Izquierdo, L.R.,Appearances can be deceiving:Lessons learned re-implementing Axelrod’s‘Evolutionary Approaches to Norms.’Journal of Artificial Societies and Social Simulation,8(3),2005。(http://jasss.soc.surrey.ac.uk/8/3/2.html)在阿克塞尔罗德的实验后已经过去了20年,计算机的性能已得到大幅提升,他们可以让仿真运行更多的周期,也可以彻底研究如果改变收益矩阵、变异概率等条件会导致什么结果。他们的结果与阿克塞尔罗德的一些结果相吻合,但也有一些结果相当不同。例如,他们发现虽然元规范在短期内会促进和维持合作,但如果仿真很长时间,不合作者最终还是会占据优势。他们还发现结果对收益矩阵等条件相当敏感。

我们应当怎样理解这一切呢?我认为就像伯克斯和德雷珀说的:所有模型都是错的,但是有一些对于尝试研究极为复杂的系统却很有用。独立的重复实验能够发现理想模型中隐藏的一些不切实际的假设和对某些参数的敏感性。当然重复实验本身也应当被重复检验,就像实验科学一样。最后,建模者也必须明确指出模型的局限性,以免模型的结果被误读,生搬硬套,或是过分渲染。我用囚徒困境的模型作为例子来说明这些观点,其他复杂系统的简化模型同样应当注意这些。

最后借用一段物理学家安德森(Phillip Anderson)在1977年诺贝尔奖授奖仪式上讲的一段话(他也是建模的先驱):

建模的艺术就是去除实在中与问题无关的部分,“建模的艺术就是去除实在中与问题无关的部分”:Anderson, Nobel Prize acceptance speech,1977。建模者和使用者都面临一定的风险。建模者有可能会遗漏至关重要的因素;使用者则有可能无视模型只是概略性的,意在揭示某种可能性,而太过生硬地理解和使用实验或计算的具体结果样本。