博弈学习理论(当代世界学术名著)(The Theory of Learning in Games)
分類: 图书,经济,经济学理论与读物,经济学研究方法,
品牌: 朱·弗登伯格
基本信息·出版社:中国人民大学出版社
·页码:329 页
·出版日期:2004年
·ISBN:7300057470/9787300057477
·条形码:9787300057477
·包装版本:1版
·装帧:平装
·开本:16
·正文语种:中文
·丛书名:当代世界学术名著
·外文书名:The Theory of Learning in Games
产品信息有问题吗?请帮我们更新产品信息。
内容简介在经济学中,绝大多数的非合作博弈理论集中研究博弈中的均衡问题,尤其是纳什均衡及其精炼。对均衡什么时候出现以及为什么均衡会出现,传统解释是,均衡是在博弈的规则、参与人的理性以及参与人的支付函数都是共同知识的情况下,由参与人的分析和自省所得出的结果。不论是在概念上还是在实证上,这个理论都存在许多问题。
在《博弈学习理论》一书中,朱·弗登伯格和戴维·K·莱文提出了另一种解释:均衡是并非完全理性的参与人随时间的推移寻求最优化这一过程的长期结果。他们研究的模型为均衡理论提供了基础,并为经济学家评价和改进传统的均衡概念提供了有用的方法。
作者简介朱·弗登伯格(Drew Fudenberg),哈佛大学经济系教授。1981年毕业于麻省理工学院,获得经济学博士学位。主要研究领域为博弈论和动态经济学。曾在加州大学伯克利分校、麻省理工学院、斯坦福大学和法国图卢兹大学任教。1 982年至今,朱·弗登伯格教授一直是美国国家科学基金的主要负责人,1998年以来为美国计量经济学会委员会委员。他与让·梯若尔教授合著的《博弈论》是全球范围内最流行的博弈论教材。
戴维·K·莱文(David K.Levme),华盛顿大学圣路易斯分校经济学教授,他的研究工作包括研究知识产权和内生增长的动态一般均衡模型,偏好的内生形成,社会规范和机构,博弈学习理论和实验经济学中的博弈理论应用。
媒体推荐本书收集了博弈学习和演进理论的前沿领域中的主要现有成果,以及该领域两位权威学者的新成果。对于任何从事学习理论和博弈理论研究或在应用研究中使用演进博弈理论的人来说,这本书将是必不可少的。
——拉里·萨缪尔森威斯康星大学安托万·奥古斯丁·库诺特经济学教授
对经济理论和博弈理论中的演进和学习领域做出杰出贡献的两位学者所写的这本优秀著作,内容非常广泛。它对于高年级本科生、研究生和理论工作者将非常有用。
——埃迪·德科尔西北大学
本书巧妙地介绍了博弈学习和演进理论中近些年来提出的大量模型,同时对这些模型进行了非常精细的解释,并用例子加以说明,将这些模型相互联系在一起。
——尤根·w·威布尔斯德哥尔摩经济学院
目录
第1章引论
1.1前言
1.2大群体模型和匹配模型
1.3三个常用的学习和/或进化模型
1.4库诺特调整
1.5库诺特动态分析
1.6具有锁定功能的库诺特过程
1.7回顾同时行动有限博弈
附录:动态系统和局部稳定性
参考文献
第2章虚拟行动
2.1引言
2.2两人虚拟行动
2.3虚拟行动中的渐近行动
2.4对虚拟行动中循环的解释
2.5多人虚拟行动
2.6虚拟行动的支付
2.7两战略博弈中的一致性和相关均衡
2.8虚拟行动和最优反应动态
2.9虚拟行动的一般化
附录:狄利克雷先验和多项抽样
参考文献
第3章模仿者动态和相关的确定性进化模型
3.1引言
3.2同质群体中的模仿者动态
3.3同质群体模仿者动态的稳定性
3.4进化稳定战略
3.5非对称模仿者动态模型
3.6对模仿者动态方程的解释
3.7模仿者动态的一般化和重复剔除严格劣战略
3.8短视调整动态
3.9集值极限点和漂移
3.10廉价磋商和秘密握手
3.11离散时间模仿者系统
附录:刘维尔(Liouville)定理
参考文献
第4章随机虚拟行动和混合战略均衡
4.1引言
4.2收敛的概念
4.3渐近短视和渐近经验主义
4.4随机扰动支付与平滑最优反应
4.5平滑虚拟行动和随机逼近
4.6部分抽样
4.7普遍一致性和平滑虚拟行动
4.8刺激反应和作为学习模型的虚拟行动
4.9对战略空间的学习
附录:随机逼近理论
参考文献
第5章具有持续随机性的调整模型
5.1引言
5.2回顾随机调整模型
5.3坎多里迈拉斯罗布(Kandori Mailath Rob)模型
5.4讨论其他动态
5.5局部相互作用
5.6吸引域的半径和协半径
5.7修正的协半径
5.8具有异质群体的一致随机匹配
5.9随机模仿者动态
附录A:有限马尔可夫链的回顾
附录B:随机稳定分析
参考文献
第6章扩展式博弈和自确认均衡
6.1引言
6.2一个例子
6.3扩展式博弈
6.4一个简单的学习模型
6.5自确认均衡的稳定性
6.6异质的自确认均衡
6.7一致自确认均衡
6.8一致自确认均衡与纳什均衡
6.9可理性化的自确认均衡和关于对手支付的先验信息
参考文献
第7章纳什均衡,大群体模型和扩展式博弈中的变异
7.1引言
7.2相关信息集和纳什均衡
7.3外生试验
7.4在被比做吃角子老虎机问题的博弈中的学习
7.5定态学习
7.6“快速学习”模型中的随机调整和后向归纳
7.7廉价磋商博弈中的变异和快速学习
7.8试验和期限的长度
附录:吃角子老虎机问题回顾
参考文献
第8章老练学习
8.1引言
8.2条件学习的三个范例
8.3老练学习的贝叶斯方法
8.4绝对连续条件的解释
8.5选择专家
8.6条件学习
8.7折现
8.8分类策略和循环
8.9内省的分类规则,校准和相关均衡
8.10模式识别中的索斯诺模型
8.11操纵学习程序
参考文献
索引
……[看更多目录]
文摘插图:
在群体中的参与人被配对进行博弈的条件下,我们能够嵌入一个特定的两人(或N人)博弈。根据参与人如何相遇和在每一回合结束时揭示什么信息,可以建立各种各样的模型。
单对模型(single-pair model):在每个阶段,随机地选择一对参与人进行博弈。在每轮博弈结束时,向所有参与人揭示他们的行动。这里,如果群体很大,那么今天进行博弈的参与人很有可能在较长时间内不再参与博弈。如果与折现因子相比参与人群体的规模充分大,即使对于有耐心的参与人来说,为了影响其对手的未来行动而牺牲他们当前的收益也是不值得的。
总体统计模型(aggregate statistic model):在每一阶段,所有参与人都被随机地匹配。在每轮博弈结束时,公布群体的总体博弈情况(population aggregates)。如果群体足够大,每个参与人对群体的总体博弈影响很小,从而对未来的行动也影响很小。参与人同样没有理由拒绝采取短视的(myopic)行动。
随机匹配模型(random-matching model):在每一阶段,所有参与人都被随机地匹配。在每轮博弈结束时,每个参与人只能观察到自己对手的行动。一个参与人今天的行动方式将影响当前对手明天的行动方式,但是在很长时间内该参与人不太可能再次和其当前的对手或者和他当前对手相遇的任何其他参与人配对。如果参与人群体虽然有限但与参与人的折现因子相比较大,短视的行动将再次成为近似最优的行动。[5]这种处理方法在博弈试验中用得最频繁。
大群体模型为“天真”的行动提供了另一种解释;当然,这将以减少其在相关群体可能被认为很大的情形下的适用性为代价。[6]应该指出,实验者通常声明发现了“大”群体模型,其实这些群体只由6个那样少的参与人组成。弗里德曼(1996)对此进行了一些讨论。