第七章 博弈论
1.什么是占优策略均衡?什么是重复剔除的占优策略均衡?什么是纳什均衡?
答:(1)不论其他参与人选择什么策略,他的最优策略都是唯一的,这样的最优战略称为占优策略。在博弈中,如果所有的参与人都有占优策略存在,因为博弈将在所有参与人的占优策略的基础上达到均衡,那么这种均衡就称为占优策略均衡。
(2)首先找出某一博弈参与人的严格劣战略,将它剔除掉,重新构造一个不包括已剔除战略的新的博弈;然后继续剔除这个新的博弈中某一参与人的严格劣战略;重复进行这一过程,直到剩下唯一的参与人战略组合为止。这个唯一剩下的参与人战略组合,就是这个博弈的均衡解,称为重复剔除的占优策略均衡。
(3)纳什均衡是指这样一种均衡:在这一均衡中,每一个博弈参与人都确信,在给定其他参与人策略决定的情况下,选择了最优策略。纳什均衡是由所有参与人的最优战略所组成的一个战略组合,也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而没有人有积极性去打破这个均衡。
2.什么是子博弈精炼纳什均衡?重复博弈与一次性博弈有何不同?
答:(1)如果某一策略组合在每一个子博弈(包括原博弈)上都构成一个纳什均衡,那么这个策略组合称为子博弈精练纳什均衡。
(2)影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。当博弈只进行一次时,每个参与人只关心一次性的支付,不会考虑信用和长远利益;但如果博弈进行多次,参与人就可能为了长远利益而牺牲短期利益,选择不同的均衡策略。就信息的完备性而论,当一个参与人的支付函数还不为其他参与人所知时,该参与人可能有建立一个良好的声誉以换取长远利益的积极性。
如图7-1所示。在一次性的完全信息静态博弈中,两个参与人A与B均有占优战略,占优战略均衡为双方都定低价。而一次性博弈意味着没有人能够对其他参与人的行为进行奖励或报复。而在动态的重复博弈中,所有参与人过去的行为都是通过观测得到的,因而某一参与人可以通过自己在本阶段博弈中的选择,来回应其他参与人在以前的阶段博弈中的行为。
图7-1 产品定价博弈
3.假定两寡头生产同质产品,两寡头的边际成本为0。两寡头所进行的是产量竞争。对于寡头产品的市场需求曲线为P=30-Q,其中Q=Q1+Q2。Q1是寡头1的产量,Q2是寡头2的产量。
(1)假定两个寡头所进行的是一次性博弈。如果两寡头同时进行产量决策,两个寡头各生产多少产量?各获得多少利润?
(2)假定寡头1先于寡头2进行产量决策,两个寡头各生产多少产量?各获得多少利润?寡头1是否获得了首先行动的优势?
(3)假定两个寡头所进行的是十轮博弈,每一轮博弈都是两个寡头同时进行产量决策,每个寡头都试图使十轮博弈所获得的利润总额达到最大。在这种前提下,第一轮博弈每个寡头各生产多少产量?第十轮博弈各生产多少产量?第九轮、第八轮……每个寡头各生产多少产量?
(4)假定两个寡头所进行的仍然是十轮博弈,但是每轮博弈寡头2都先于寡头1进行产量决策,那么每轮博弈两个寡头的产量各自是多少?
解:(1)根据题目条件,两个寡头同时进行产量决策,则两个寡头的利润函数为:
利润最大化的一阶条件为
则得寡头1的反应函数:
①
同理,可得寡头2的反应函数:
②
联立①②得:Q1=Q2=10,从而P=10,。
(2)根据(1)结果,若寡头1先于寡头2进行产量决策,则把寡头2的反应函数代入寡头1的利润函数中,即:
则利润最大化的一阶条件为:
得:Q1=15。则Q2=15-7.5=7.5,P=30-(Q1+Q2)=7.5,π1=112.5,π2=56.25。
由此可知寡头1取得了首先行动优势
(3)假定寡头是理性选择,由于博弈的次数有限,因为在最后一次博弈中,博弈双方考虑到对手不会有报复自己的机会,将不会合作,那么,在倒数第二次博弈中,他们也不会合作。以此类推,第一次博弈也不会有合作行为。因此,每一轮都达到古诺均衡,每一轮竞赛各寡头都生产10的产出水平。
(4)若理性反应,则如题目(2)中的结果,若寡头1做出非理性反应,则达到古诺均衡,但最后一轮会出现问题依此推知第二轮出现问题。分析如下:
如果寡头2总是第一个确定产量,寡头1在某单个时期作出“非理性反应”也许是更有利的。例如,在第一轮,寡头2将宣布其产量是15,如同题目(2)中情况。寡头1的理性反应应该是生产7.5,因为这样可以使寡头1的利润最大化。如果寡头1每一轮都做出这样的反应,寡头1的利润总额是112.5。寡头2的利润总额是56.25。
不过,如果每当寡头2宣布15的产出时,寡头1的反应也是生产15,二者的利润将减少到0。如果寡头2知道寡头1将做出这种反应,寡头2选择产出10(古诺均衡下的产出)将改进自身的状况。但最后一期将出现问题。因为寡头2知道,寡头1了解自己策略性的行为不会再产生长期利益。因此,寡头2将宣布生产15的产出,寡头1的反应是生产7.5。进一步看,寡头2知道寡头1不会在最后一期作出策略的反应,寡头1在第9期的策略行为也不会产生长期的利益。因此第9期寡头2将宣布15的产出,寡头1的反应是生产7.5的产出。观察从最后一期到第一期的每一时期,寡头1的最优策略依赖于寡头1如何估价未来利润。
4.博弈情况如图7-2所示。
(1)如果博弈双方追求的都是自身利润的最大化,博弈结果如何?
(2)如果博弈双方追求的是自己与对手利润的差额(当然是自己利润高于对方)最大化,博弈结果又如何?
图7-2 博弈情况
答:(1)博弈双方追求自身利润最大化,则博弈结果为:(高价,高价),(正常价格,正常价格)。先考虑B的策略,若A选择高价,则B的最优策略是选择高价,此时利润最大;若A选择正常价格,则B的最优策略是选择正常价格。再考虑A的策略选择,若B选择高价,为了实现自身利润的最大化,A的是最优策略是选择高价;若B选择正常价格,则A的最优策略是选择正常价格。因此,如果双方追求的都是自身利润的最大化,博弈的结果是两个纳什均衡:(高价,高价),(正常价格,正常价格)。
(2)博弈双方追求自己与对手利润的差额最大化,则博弈变成一个零和博弈,如都选择高价,那么A的支付为-50,B的支付为50。依次类推,对于A而言,选择正常价格是严格占优策略,对于B而言,选择正常价格也是严格占优策略,因此博弈的结果是(正常价格,正常价格)。