第一章 博弈论,共赢才是硬道理
什么是囚徒困境?
囚徒困境是博弈论中著名的案例之一。所谓囚徒困境,大意是这个样子的。
有一天,某富翁在家中被杀,财物被窃。警方在侦破此案的过程中,抓到了汤姆、杰克两个犯罪嫌疑人,并从他们的住处搜出了被害富翁家中丢失的财物。面对呈现在眼前的物证,他们承认了自己的偷窃行为,但却矢口否认杀害富翁,辩称是先发现富翁被杀,然后他俩只是顺手牵羊偷了点儿东西。
针对两人的狡辩,警方对他们进行了隔离审讯。为了分化瓦解他们,检察官分别对两人说了以下一段话:
本来你们的偷盗罪证据确凿,可以就此判你们1年刑期。但是,按照将功赎罪制度,如果你主动坦白并且揭发同伙的杀人罪行,我们将对你进行从宽发落,判你无罪释放,但你的同伙要被判30年刑期;如果你顽抗到底,拒不坦白,而被同伙检举出你的杀人行为,那么你就要受到严惩,将被判刑30年,你的同伙将被无罪释放;当然,如果你们两人都坦白,那么你们都将只被判15年刑期。
在这里,博弈的决策主体——汤姆和杰克各有两个选择,即坦白和抵赖。
这两个嫌疑犯该怎么办呢?他们面临着两难的选择——坦白还是抵赖。显然,最好的选择是两人都选择抵赖,都得到最好的结果——只判刑1年(杀人罪按照疑罪从无原则,证据不足无法成立,只能以偷盗罪各判每人1年刑期)。但是由于两人处于隔离的情况下,没有串供的条件,所以他们不得不仔细考虑对方可能采取什么策略,以及对方采取的策略对自己有什么影响。
心理较量就这样开始了,汤姆和杰克都是绝对精明的人,都只在乎减少自己的刑期,并不关心自己的选择会对对方产生什么影响,对方因为自己的决策又将被判多少年刑期。
汤姆会这样推理:假如杰克选择抵赖的话,我只要坦白,马上就可以无罪释放,获得自由,而我若抵赖则要坐牢1年,显然坦白比抵赖要划算得多;假如杰克选择坦白的话,我若抵赖,则要坐30年牢,坦白却只坐15年牢,显然还是坦白为上策。所以说,无论杰克选择抵赖还是坦白,我的最佳选择都是坦白,还是坦白交代了吧!
同样,杰克也跟汤姆一样会算计,也会如此推理。
囚徒困境之所以称为困境,就是因为这局博弈的最终结果对两个参与者来说都是最坏的,两个嫌疑犯都选择坦白,结果皆被判刑15年。这对他们个人来说都是从自身利益出发的最佳选择,符合他们的个体理性选择。因为坦白交代者可能会被无罪释放,显然比自己抵赖可能会独自承受30年刑期要好。而原本对双方都有利的策略——两个人都抵赖,每人被判1年刑期就不会出现。
囚徒困境是典型的非合作博弈的范例,为我们探讨合作是怎样形成的提供了极为形象的解说方式,其产生不良后果的原因是两个嫌疑犯都从利己目的出发,最终损人不利己,合作没有实现。反过来我们就可看到:彼此达成合作是最好的利己策略,但合作必须符合以下黄金定律:“己所不欲,勿施于人。”在此基础之上的合作才能形成一个和谐的、良好的社会环境。
在囚徒困境中,最好的策略直接取决于对方所采用的策略,取决于对方所采取的策略为双方发展合作留出多大的余地。独立于对方所用策略之外的、从利己目的出发的、最好的决策是不存在的。
实际上,囚徒困境是现实生活中许多现象的一个抽象概括,有着广泛而深刻的意义。同一行业不同企业之间激烈的价格竞争就是囚徒困境的典型现象。在价格博弈中,只要双方都以对方为敌手,只关心自己的利益,那么不管对方采取怎样的决策,自己采取低价策略总会占便宜,就如同囚徒困境中的犯罪嫌疑人始终认为自己坦白为最佳决策一样,这就促使双方都采取低价策略。如可口可乐公司和百事可乐公司之间的价格竞争、各大航空公司之间的价格战,等等。
如果双方进行合作,共同制定比较高的价格,就可以避免无休止的价格大战并获得较高的利润。但是这些企业往往处于利益驱动的囚徒困境之中,双赢也就成了泡影。不同企业之间五花八门的价格联盟总是非常短命,原因也就在这里。