你的第一本博弈论:用博弈论解决工作和生活的难题
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

什么是博弈论:从“囚徒困境”说起

一天,警局接到报案,一位富翁被杀死在自己的别墅中,家中的财物也被洗劫一空。经过多方调查,警方最终将嫌疑人锁定在杰克和亚当身上,因为事发当晚有人看到他们两个神色慌张地从被害人的家中跑出来。警方到两人的家中进行搜查,结果发现了一部分被害人家中失窃的财物,于是将二人作为谋杀和盗窃嫌疑人拘留。

但是到了拘留所,两人都矢口否认自己杀过人,他们辩称自己只是路过那里,想进去偷点东西,结果进去的时候发现主人已经被人杀死了,于是他们便随便拿了点东西就走了。这样的解释不能让人信服,再说,谁都知道在判刑方面杀人要比盗窃严重得多。警察决定将两人隔离审讯。

隔离审讯的时候,警察告诉杰克:“尽管你们不承认,但是我知道人就是你们两个杀的,事情早晚会水落石出的。现在我给你一个坦白的机会,如果你坦白了,亚当拒不承认,那你就是主动自首,同时协助警方破案,你将被立即释放,亚当则要坐10年牢;如果你们都坦白了,每人坐8年牢;都不坦白的话,可能以入室盗窃罪判你们每人1年,如何选择你自己想一想吧。”同样的话,警察也说给了亚当。

一般人可能认为杰克和亚当都会选择不坦白,这样他们只能以入室盗窃的罪名被判刑,每人只需坐1年牢。这对于两人来说是最好的一种结局。可结果会是这样的吗?答案是否定的,两人都选择了招供,结果每人各被判了8年。

博弈的分类

figure_0015_0002

事情为什么会这样呢?杰克和亚当为什么会作出这样“不理智”的选择呢?其实这种结果正是两人的理智造成的。我们先看一下两人坦白与否及其结局的矩阵图:

figure_0016_0003

当警察把坦白与否的后果告诉杰克的时候,杰克心中就会开始盘算坦白对自己有利,还是不坦白对自己有利。杰克会想,如果选择坦白,要么当即释放,要么同亚当一起坐8年牢;要是选择不坦白,虽然可能只坐1年牢,但也可能坐10年牢。虽然(1,1)对两人而言是最好的一种结局,但是由于是被分开审讯,信息不通,所以谁也没法保证对方是否会选择坦白。选择坦白的结局是8年或者0年,选择不坦白的结局是10年或者1年,在不知道对方选择的情况下,选择坦白对自己来说是一种优势策略。于是,杰克会选择坦白。同时,亚当也会这样想。最终的结局便是两个人都选择坦白,每人都要坐8年牢。

上面这个案例就是著名的“囚徒困境”模式,是博弈论中最出名的一个模式。为什么杰克和亚当每个人都选择了对自己最有利的策略,最后得到的却是最差的结果呢?这其中便蕴涵着博弈论的道理。

博弈论是指双方或者多方在竞争、合作、冲突等情况下,充分了解各方信息,并依此选择一种能为本方争取最大利益的最优决策的理论。博弈论的概念中显示了博弈必须拥有的四个要素,即至少两个参与者、利益、策略和信息。按照博弈的结果来分,博弈分为负和博弈、零和博弈与正和博弈。

“囚徒困境”中杰克和亚当便是参与博弈的双方,也称为博弈参与者。两人之所以陷入困境,是因为他们没有选择对两人来说最优的决策,也就是同时不坦白。而根本原因则是两人被隔离审讯,无法掌握对方的信息。所以,看似每个人都作出了对自己最有利的策略,结果却是两败俱伤。

我们身边的很多事情和历史典故中也有博弈论的应用,我们就用大家比较熟悉的“田忌赛马”这个故事来解释一下什么是博弈论。

齐国大将田忌,平日里喜欢与贵族赛马赌钱。

当时赛马的规矩是每一方出上等马、中等马、下等马各一匹,共赛三场,三局两胜制。由于田忌的马比贵族们的马略逊一筹,所以十赌九输。当时孙膑在田忌的府中做客,经常见田忌同贵族们赛马,对赛马的比赛规则和双方马的实力差距都比较了解。这天田忌赛马又输了,非常沮丧地回到府中。孙膑见状,便对田忌说:“明天你尽管同那些贵族们下大赌注,我保证让你把以前输的全赢回来。”田忌相信了孙膑,第二天约贵族赛马,并下了千金赌注。

田忌赛马的制胜策略

田忌赛马出自《史记》卷六十五:《孙子吴起列传第五》,是中国历史上有名的揭示如何善用自己的长处去应对对手的短处,从而在博弈中获胜的事例。

figure_0018_0004

孙膑通过对赛马的博弈分析,为田忌制定了唯一制胜的博弈策略,同样的马,只是调整了不同的出场顺序,便起到了不同的效果。

孙膑为什么敢打保证呢?因为他对这场赛马的博弈做了分析,并制定了必胜的策略。赛前孙膑对田忌说:“你用自己的下等马去对阵他的上等马,然后用上等马去对阵他的中等马,最后用中等马去对阵他的下等马。”比赛结束之后,田忌三局两胜,赢得了比赛。田忌从此对孙膑刮目相看,并将他推荐给了齐威王。

一个能争取最大利益的策略,也就是最优策略。所以说,这是一个很典型的博弈论在实际中应用的例子。

在这里还要区分一下博弈与博弈论的概念,以免搞混。它们既有共同点,又有很大的差别。

“博弈”的字面意思是指赌博和下围棋,用来比喻为了利益进行竞争。自从人类存在的那一天开始,博弈便存在,我们身边也无时无刻不在上演着一场场博弈。而博弈论则是一种系统的理论,属于应用数学的一个分支。可以说博弈中体现着博弈论的思想,是博弈论在现实中的体现。

博弈作为一种争取利益的竞争,始终伴随着人类的发展。但是博弈论作为一门科学理论,是1928年由美籍匈牙利数学家约翰·冯·诺依曼建立起来的。他同时也是计算机的发明者,计算机在发明最初不过是庞大、笨重的算数器,但是今天已经深深影响到了我们生活、工作的各个方面。博弈论也是如此,最初冯·诺依曼证明了博弈论基本原理的时候,它只不过是一个数学理论,对现实生活影响甚微,所以没有引起人们的注意。

直到1944年,冯·诺依曼与摩根斯坦合著的《博弈论与经济行为》发行出版。这本书的面世意义重大,先前冯·诺依曼的博弈理论主要研究二人博弈,这本书将研究范围推广到多人博弈;同时,还将博弈论从一种单纯的理论应用于经济领域。在经济领域的应用,奠定了博弈论发展为一门学科的基础和理论体系。

谈到博弈论的发展,就不能不提到约翰·福布斯·纳什。这是一位传奇的人物,他于1950年写出了论文《n人博弈中的均衡点》,当时年仅22岁。第二年他又发表了另外一篇论文《非合作博弈》。这两篇论文将博弈论的研究范围和应用领域大大推广。论文中提出的“纳什均衡”已经成为博弈论中最重要和最基础的理论。他也因此成为一代大师,并于1994年获得诺贝尔经济学奖。后面我们还会详细介绍纳什其人与“纳什均衡”理论。

经济学史上有三次伟大的革命,它们是“边际分析革命”“凯恩斯革命”和“博弈论革命”。博弈论为人们提供了一种解决问题的新方法。

博弈论发展到今天,已经成了一门比较完善的学科,应用范围也涉及各个领域。研究博弈论的经济学家获得诺贝尔经济学奖的比例是最高的,由此也可以看出博弈论的重要性和影响力。2005年的诺贝尔经济学奖又一次颁发给了研究博弈论的经济学家,瑞典皇家科学院给出的授奖理由是“他们对博弈论的分析,加深了我们对合作和冲突的理解”。

那么,博弈论对我们个人的生活有什么影响呢?这种影响可以说是无处不在的。

假设,你去酒店参加一个同学的生日聚会,当天晚上他的亲人、朋友、同学、同事去了很多人,大家都玩得很高兴。可就在这时,外面突然失火,并且火势很大,无法扑灭,只能逃生。酒店里面人很多,但是安全出口只有两个。一个安全出口离得较近,但是人特别多,大家都在拥挤;另外一个安全出口人很少,但是距离相对较远。如果抛开道德因素来考虑,这时你该如何选择?

这便是一个博弈论的问题。我们知道,博弈论就是在一定情况下,充分了解各方面信息,并作出最优决策的一种理论。在这个例子里,你身处火灾之中,了解到的信息就是远近共有两个安全门,以及这两个门的拥挤程度。在这里,你需要作出最优决策,也就是最有可能逃生的选择。那应该如何选择呢?

博弈论的发展历程

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题。发展到今天,博弈论已经成了一门比较完善的学科,并被应用到各个领域。

figure_0021_0005

你现在要做的事情是尽快从酒店的安全门出去,也就是说,走哪个门出去花费的时间最短,就应该走哪个门。这个时候,你要迅速地估算一下到两个门之间的距离,以及人流通过的速度,算出走哪个门逃生会用更短的时间。估算的这个结果便是你的最优策略。