3.4 重复博弈
同样结构的博弈重复多次的博弈,每次博弈称为阶段博弈。
重复无限次的为无限次重复博弈;反之为有限次重复博弈。
序贯博弈
参与人在前一个决策点的选择决定随后的子博弈的结构,从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈。同样结构的子博弈只出现一次。
3.4.1 重复博弈的基本特征
1.各阶段博弈相互独立,前阶段博弈不会改变后阶段博弈的结构;
2.所有参与人都能看到博弈历史,可以将自己的选择依赖于他人之前的行动,均衡结果可能与一次博弈大不相同。
3.参与人的支付等于各阶段支付的贴现值之和或加权平均值;
3.4.2 重复博弈的战略
1.All-D
不论过去什么发生,总是选择不合作;
2.All-C
不论过去什么发生,总是选择合作;
3.合作-不合作交替进行
4.tit-for-tat
从合作开始,之后每次选择对方前一阶段的行动
5.trigger strategies
从合作开始,一直到有一方不合作,然后永远选择不合作。
3.4.3 重复博弈的影响因素
1.博弈重复的次数
其重要性来源于参与人在短期利益和长远利益之间的权衡。
2.信息的完备性
当一个参与人的支付函数不为其他参与人知道时,该参与人可能有积极性建立一个“好”的声誉以换取长远利益。
3.4.3 有限次重复博弈
案例1 囚徒困境
一次博弈时——
| 囚徒B | |||
| 坦白 | 抵赖 | ||
| 囚徒A | 坦白 | -6,-6 | 0,-8 |
| 抵赖 | -8,0 | -1,-1 | |
二次博弈时——
| 囚徒B | |||
| 坦白 | 抵赖 | ||
| 囚徒A | 坦白 | -12,-12 | -6,-14 |
| 抵赖 | -14,-6 | -7,-7 | |
逆向归纳法分析
第二阶段中,由于该阶段仍然是一个囚徒困境博弈,结果还是原博弈惟一的纳什均衡(坦白,坦白),双方支付(-6,-6)。
第一阶段中,理性的参与人会知道第二阶段的结果必然是(坦白,坦白),因此可以把第二阶段的支付直接加到第一阶段对应支付上。
最终两次重复囚徒的困境仍然相当于一次性囚徒的困境博弈的简单重复。
结论
若原博弈有惟一的纯战略纳什均衡,则有限次重复博弈的惟一均衡就是重复采用原博弈的纳什均衡战略。
案例2 市场进入阻挠博弈
| 在位者 | |||
| 默许 | 斗争 | ||
| 进入者 | 进入 | 40,50 | -10,0 |
| 不进入 | 0,300 | 0,300 | |
这是一个完全信息静态博弈
1.(进入,默许)——强纳什均衡
2.(不进入,斗争)——弱纳什均衡
连锁店悖论
因为逆向归纳法得到唯一的SPNE为在位者在每个市场选择默许,进入者选择进入,所以在有限次重复博弈中,斗争不是一个可置信战略。
结论
如果阶段博弈只有唯一的纳什均衡,那么N次重复博弈唯一的子博弈精炼纳什均衡结果是阶段博弈的纳什均衡重复N次。
如果阶段博弈有多个纳什均衡,那么上述结论不再成立。
3.4.4 无限次重复博弈
无限次重复博弈中会出现冷酷战略或触发战略——开始选择抵赖;如果对方也选择抵赖,将继续选择抵赖;一旦对方选择坦白,将永远选择坦白。无限次重复中不能再用逆向归纳法求解SPNE。
贴现因子
下一期的一单位支付在这一期的价值。(也可以解释成耐心程度)
结论
如果博弈重复无穷次而且每个人有足够的耐心,任何短期机会主义行为的所得都是微不足道的,博弈方都有积极性为自己建立一个乐于合作的声誉,同时也有积极性惩罚对方的机会主义的行为。
无名氏定理
在无限次重复博弈中,如果参与人有足够的耐心(即贴现因子足够大),则任何满足个人理性的可行的支付向量都可以通过一个特定的子博弈精炼均衡得到。
案例
商店与流动摊贩
结论
重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈无限重复,合作就可能出现