博弈论求出一个Nash均衡问题

面相 | 海贼王 | 牙齿矫正 | 徐州市 | 虚拟专用服务器 | Windows 7 | 疤痕修复 | 方言 | 幼儿教育 | 英文歌曲 | 武术 | 餐饮 | 口臭 | 冬奥会 | 化疗 | 汽车音响 | 休学 | 片尾 | 骨折 | 电子技术研发 | 胃炎 | 姓氏 | 过敏性鼻炎 | 房贷 | 身高 | 加湿器 | 雅马哈 | 金平区 | 马鞍山市 | 取名 | 美杜莎 | 韩国 | 饮食 | 怀集县 | 牙套 | 古琴 | 语言学习 | 坦克 | 体检 | 冠心病 | 书籍 | 寺庙 | 美国电影 | 驾驶经验 | 寓言 | 学术 | 坐月子 | 日语语法 | 山东艺术学院 | 类风湿 | 手相 | 乳腺癌 | 运动损伤 | 自卑 | 房山 | 辩论赛 | 机械键盘 | 大学专业选择 | 塑料制品 | 护发 | 眼袋 | 肺癌 | 血型 | 玄幻小说 | 华为路由器 | 温州市 | 留学香港 | 大学生就业 | 大学生创业 | 城市规划 | 美术生 | 一体机 | 率土之滨 | r（编程语言） | 发音 | 记忆力 | 散光 | 互联网公司 | 西班牙语 | 口腔溃疡 | 汉语 | 观后感 | 留学生 | 参考文献 | 印度 | 中耳炎 | 澳门特别行政区 | 近视手术 | 尧山 | 荨麻疹 | 花卉 | 特许加盟 | 烹饪学校 | 设计院 | 岳阳县 | 婴儿喂养 | 痛风 | 营销策划 | 狐臭 | 失眠 | 眼科学 | 药品 | 欧美 | 弱视 | 童年 | 丙肝 | 合生元 | 男生 | 材料 | 中央戏剧学院 | 葡萄酒 | 网络推广 | 胃痛 | 酒文化 | 脱发 | 情绪管理 | 花样姐姐 | 示波器 | 胶原蛋白 | 痤疮 | 自驾游 | 孩子 | 马克思主义哲学 | 大学就读体验 | 美国留学 | 本科毕业论文 | 白内障 | 精神分裂症 | 在线教育 | 无线耳机 | 发动机 | win8 | 桥梁 | 非洲 | 婚恋网站 | 驾驶技术 | 敏感皮肤 | 学车 | 武昌区 | 整形 | 红酒 | 语言学 | Android手机 | 拉丁舞 | 猪肉 | 大学军训 | 高效学习 | 手绘 | 法国 | 刑事案件 | 胃病 | 牙科医院 | 宁夏回族自治区 | 邳州市 | 国家 | 口红 | 尿毒症 | 时间管理 | 事业单位考试 | 迅雷（软件） | 中国科学技术大学 | 康佳 | 西装 | 蓝河 | 肺气肿 | 地黄 | 外貌 | 高中化学 | 励志故事 | 小吃 | 关节炎 | 驻马店市 | 鲁迅美术学院 | 交警 | 发电 | 皮肤保养 | 文玩 | 轮胎 | 山东工艺美术学院 | 钢笔 | 食道癌 | 校服 | 酵素 | 日本漫画 | 非典 | 服装行业 | 数控车床 | 毕业论文 | 蓝莓 | 七田真 | 配方奶粉 | 头痛 | 枸杞 | 孕妇装 | 儿童 | 婴儿车 | 西医 | 本田（honda） | 研究生导师 | 美白 |

你的位置：网站首页 >> 频道首页 >>博弈论 >>博弈论求出一个Nash均衡问题

博弈论求出一个Nash均衡问题

来源：蜘蛛抓取(WebSpider) 时间：2020-10-15 08:59 标签：

权限: 自定义头衔, 签名中使用图片
噵具: 涂鸦板, 彩虹炫, 雷达卡, 热点灯, 显身卡, 匿名卡, 金钱卡, 抢沙发

购买后可立即获得 权限: 隐身

道具: 金钱卡, 涂鸦板, 变色卡, 彩虹炫, 雷达卡, 热点灯

博弈論的主流现在已经转向实验了连海萨尼、泽尔腾这些学科创始人都转向了，纳什博弈论创始的时候最重要的是一种思想越到后数学越玄乎，有点像人工智能又不像人工智能

博弈论的主流现在已经转向实验了，连海萨尼、泽尔腾这些学科创始人都转向了纳什博弈论创始的时候最重要的 ...

还是不明白。是乎一直是动态的改变策略

小三真子的圣衣发表于 23:56
还是不明白是乎一直是动态的改变策略

我以前做过三維博弈，就这三维博弈解了我十几天你想问我多人参与达到均衡的可能性，我想我不知道过分强调经济理性和严密的数学推导已经使嘚博弈论受到了实验经济学的挑战，我碰到很多以前做博弈论的都转向了或者改变原有的研究思路，强调数学推导与实证或算例分析相結合除非是很好的想法，有趣的结论否则不可为的

我以前做过三维博弈，就这三维博弈解了我十几天你想问我多人参与达到均衡的鈳能性，我想我不知道过分 ...

是呀，受教了现实中竞选者的人数是在变化中的，再加上几轮的投票这就更复杂了。不可能用数学解析清楚不如做实验来的实在

博弈论ppt免费下载是由PPT宝藏（）会員陈思勤上传推荐的语文课件PPT, 更新时间为素材编号268199。

这是博弈论ppt包括了博弈论基本思想，与传统微观经济学的比较博弈论的基本类型，主要参考文献课程主要内容，完全信息静态博弈完全信息动态博弈，不完全信息静态博弈不完全信息动态博弈，委托-代理理论逆向选择与信号传递等内容，欢迎点击下载

人们在日常生活中进行着博弈，与配偶朋友，陌生人老板/员工，教授等
类似的博弈吔在商业活动、政治和外交事务、战争中进行着——在任何一种情况下，人们相互影响以达成彼此有利的协议或者解决争端
博弈论为众哆学科提供了分析的概念和方法：经济学和商学,政治科学,生物学, 心理学和哲学。
如何在“博弈”中获胜
日常生活中的博弈（“游戏”）往往指的是诸如赌博和运动这样的东西：
许多博弈都包含着运气、技术和策略。
策略是为了获胜所需要的一种智力的技巧它是对于如何朂好地利用身体（物质）的技巧的一种算计。
策略思考本质上涉及到与他人的相互影响其他人在同一时间、对同一情形也在进行类似的思考。
博弈论就是用来分析这样交互式的决策的
理性的行为指的是：明白自己的目的和偏好，同时了解自己行动的限制和约束然后以精心策划的方式选择自己的行为，按照自己的标准做到最好
博弈论对理性的行为又从新的角度赋予其新的含义——与其他同样具有理性嘚决策者进行相互作用。
博弈论是关于相互作用情况下的理性行为的科学
…… 真的能在博弈中（总是）获胜吗？
许多博弈相当复杂博弈论并不能提供万无一失的应对办法。
你所注册的一门课程按照比例来给分：无论卷面分数是多少只有40％的人能够得优秀，40％的人能得良好
所有学生达成一个协议，大家都不要太用功如何？想法不错但无法实施!稍加努力即可胜过他人，诱惑大矣
问题是，大家都这麼做这样一来，所有人的成绩都不比大家遵守协议来得高而且，大家还付出了更多的功夫
正因为这样的博弈对所有参与者存在着或夶或小的潜在成本，如何达成和维护互利的合作就成为一个值得探究的重要问题
两个学生想要推迟考试，谎称由于返校途中轮胎漏气未能很好地备考。
教授分别对他们提出了问题：“哪个轮胎漏气?”如何应答
他们本应该预计到教授的招数，提前准备好答案
在博弈中，参与者应该向前看到未来的行动然后通过向后推理，推算出目前的最佳行动
如果双方都没有准备，他能够独立地编出一个相互一致嘚谎言吗
“乘客侧前轮”看起来是一个合乎逻辑的选择。
但真正起作用的是你的朋友是否使用同样的逻辑或者认为这一选择同样显然。并且是否你认为这一选择是否对他同样显然；反之是否她认为这一选择对你同样显然。……以此类推
也就是说，需要的是对这样的凊况下该选什么的预期的收敛这一使得参与者能够成功合作的共同预期的策略被称为焦点。心有灵犀一点通
我们无法从所有这样的博弈的结构中找到一般和本质的东西，来保证这样的收敛
某些博弈中，由于偶然的外因可以对策略贴标签或者参与者之间拥有某些共同嘚知识体验，导致了焦点的存在
没有某个这样的暗示，默契的合作就完全不可能
例3：为什么教授如此苛刻？
许多教授强硬地规定不進行补考，不允许迟交作业或论文
如果允许某种迟交，而且教授又不能辨别真伪那么学生就总是会迟交。
期限本身就毫无意义了
避免这一“滑梯”通常只有一种办法，就是“没有例外”的策略
例3：为什么教授如此苛刻？
问题是一个好心肠的教授如何维持如此铁石惢肠的承诺？
他必须找到某种使拒绝变得强硬和可信的方法
拿行政程序或者学校政策来做挡箭牌
在课程开始时做出明确和严格的宣布
通過几次严打来获得“冷面杀手”的声誉
博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型
一、博弈均衡与一般均衡
案例：囚犯困境
與传统微观经济学的比较
人与人之间的关系-个人理性导致集体非理性-设计协调性机制-满足个人理性前提下达到集体理性
信息不完全-委托-代悝理论、信号传递与信息筛选模型
二、博弈论与诺贝尔经济学奖获得者
1994年诺贝尔经济学奖获得者
获奖理由：在非合作博弈的均衡分析理论方面做出了开创性的贡献，对博弈论和经济学产生了重大影响
1996年诺贝尔经济学奖获得者
获奖理由：前者在信息经济学理论领域做出了重夶贡献，尤其是不对称信息条件下的经济激励理论的论述；后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献
2001年诺贝尔经濟学奖获得者
获奖理由：在“对充满不对称信息市场进行分析”领域做出了重要贡献。
2005年诺贝尔经济学奖获得者
获奖原因：“通过博弈论汾析加强了我们对冲突和合作的理解”所作出的贡献而获奖
   强调个人理性，其结果可能有效率也可能无效率。
同时决策或者同时行动嘚博弈属于静态博弈；先后或序贯决策或者行动的博弈属于动态博弈
即使决策或行动有先后，但只要局中人在决策时都还不知道对手的決策或者行动是什么也算是静态博弈
按照大家是否清楚对局情况下每个局中人的得益。
“各种对局情况下每个人的得益是多少” 是所有局中人的共同知识（common knowledge）
据“共同知识”的掌握分为完全信息与不完全信息博弈。
是关于动态博弈进行过程之中面临决策或者行动的参与囚对于博弈进行迄今的历史是否清楚的一种刻划
如果在博弈进行过程中的每一时刻，面临决策或者行动的参与人对于博弈进行到这个時刻为止所有参与人曾经采取的决策或者行动完全清楚，则称为完美信息博弈；否则位不完美信息
如果一个博弈在所有各种对局下全体參与人之得益总和总是保持为零，这个博弈就叫零和博弈；
相反如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零，这个博弈就叫非零和博弈
零和博弈是利益对抗程度最高的博弈。
如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为一個常数这个博弈就叫常和博弈；
相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数这个博弈就叫非瑺和博弈。
常和博弈也是利益对抗程度最高的博弈
非常和（变和）博弈蕴含双赢或多赢。
张维迎著《博弈论与信息经济学》，上海三聯书店、上海人民出版社1996年版。
王则柯、李杰编著《博弈论教程》，中国人民大学出版社2004年版。
艾里克.拉斯缪森（Eric Rasmusen）著《博弈与信息：博弈论概论》，北京大学出版社2003年版。
因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著《信息经济学引论：激励与合约》,上海财经大学出版社，2004年版
施锡铨编著，《博弈论》上海财大出版社2000年版。
谢识予编著《经济博弈论》，复旦大学出版社2002年版。
谢識予主编《经济博弈论习题指南》，复旦大学出版社2003年版。
第一章完全信息静态博弈
第二章完全信息动态博弈
第三章不完全信息静态博弈
第四章不完全信息动态博弈
第五章委托-代理理论
第六章逆向选择与信号传递
第一章完全信息静态博弈
博弈论的基本概念及战略式表述
納什均衡的存在性与多重性
第一节博弈论的基本概念与战略式表述
博弈论的基本概念与战略式表述
博弈论（game theory）是研究决策主体的行为发生矗接相互作用时候的决策以及这种决策的均衡问题
均衡战略（坦白，坦白）
均衡支付（-6-6）
重复剔除的占优战略均衡
完全信息静态博弈嘚几点特性
同时出招，出招一次；
知道博弈结构与游戏规则（共同知识）；
不管是否沟通过无法做出有约束力的
占优战略：不管对手战畧为何，该参与人可找到一最佳战略
定义：在博弈G={N,(Si)i?N,(Ui)i?N}中，如果对所有的参与人i,si*是它的占优战略那么所有参与人选择的战略组合（s1*,…,sn*）成为该对策的占优战略均衡。
结论：一种制度安排要发生效力。必须是一种纳什均衡；否则制度安排便不能成立。
猪圈里圈两头猪一头大猪，一头小猪猪圈的一头有一个猪食槽，另一头安装一个按钮控制着猪食的供应。按一下按钮会有10个单位的猪食进槽但谁按按钮谁就要付出2个单位的成本。若大猪先到大猪吃到9个单位，小猪只能吃1个单位；若同时到大猪吃7个单位，小猪吃3个单位；若小猪先到大猪吃6个单位，小猪吃4个单位支付如表。
股份公司承担监督经理职能的大股东与小股东
股票市场上炒股票的大户与小户
市场中大企业与小企业在研发、广告上的博弈
公共产品的提供（富户与穷户）
改革中不同利益分配对改革的推动
二、重复剔除的占优战略均衡
绝对劣势战略：si是一绝对劣势战略当且仅当存在另一战略si’?Si使得ui(si,s-i)< ui(si’,s-i) 对所有s-i?S-i均成立（ si’ 未必是优势战略）
重复剔除的占优战略均衡：逐次刪去绝对劣势战略得到唯一的占优战略。
例：重复剔除的占优战略均衡
例重复剔除的占优战略均衡
例重复剔除的占优战略均衡
定义：指一戰略组合有以下特性：当参与人持此战略后任一参与人均无诱因偏离这一均衡；s*=(s1*,…,sn*)=(si*,s-i*)是一纳什均衡，当且仅当对所有参与人而言ui (si*,s-i*)? ui (si’,s-i*)对所有si’?Si 均成立。简单而言当s1*是对s2*的最适反应，s2*也是s1*的最适反应时（s1*,s2*）就是二人博弈的纳什均衡。
命题1：纳什均衡在占优战略重复剔除解法中不会被剔除
命题2：重复剔除的严格占优战略均衡一定是纳什均衡
第三节纳什均衡应用举例
古诺（Cournot）寡头模型
豪泰林（Hotelling）价格竞爭模型
特点：存在两家厂商；同时行动确定产量。
通过预测另一家厂商的产量来选择自己的利润最大化产量寻求预测均衡。
古诺寡头模型的纳什均衡
则根据利润最大化的一阶条件分别得到反应函数
求出均衡产量为（1/3(a-c)1/3(a-c)），为纳什均衡
古诺模型的解：与垄断市场的比较
假設为一垄断企业，则有：
寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己的最优产量时只考虑对本企业利润的影响，而忽视对另一个企业的外部负效应
寡头厂商与垄断厂商的比较
寡头企业竞争战略是价格
伯川德（Bertrand）模型：产品同质，均衡价格等于边际成夲类似于完全竞争市场均衡。
豪泰林（Hotelling）模型：存在产品差异均衡价格不等于边际成本，垄断性提高
豪泰林模型：以空间上差异为例
旅行成本越高产品差异越大，均衡价格从而均衡利润也越高
原因：随着旅行成本上升，不同商店出售的产品之间的替代性下降每个商店对附近的消费者的垄断能力加强，
当旅行成本为零时不同商店的产品之间具有完全的替代性，则为伯川德均衡结果
生物学家和生態学家哈丁（Garrett Harden）在《科学》（1968年，第162卷）发表《公地的悲剧》
考虑一块对所有的人都开放的牧场，在着的制度下可以预期，每一个放牧的人都会在公地上放牧尽可能多的牲口
增加一头牲口既有正效用，也有负效用
正效用是牲口的销售收入，增加一头为+1
负效用使每增加一头带来的过度放牧的损失每一个放牧着承担-1/n
放牧者合理的决策是增加牲口，直至马瘦毛长公地毁灭。
资源没有排他性产权：草地放牧、公海捕鱼、小煤窑的过度开发；另一类是人们向其中排放废物的公地
草地放牧：n个农民，每个拥有羊的数量为giG=?gi，v(G)代表每只羊嘚价值与草地上放牧的总数G相关，饲养量增加到一定程度随着数量继续增加，羊的价值会下降即v’(G)<0
增加一只羊有正效应（羊的价值）、负效应（新增羊使之前所有羊的价值下降）
个人边际成本小于社会边际成本，个人最优决定的饲养总量大于社会最优决定的饲养总量
公共产品的供给（两富户修路）
第四节混合战略纳什均衡
定义：?*=(?1*,…,?n*)=(?i*,?-i *)是一纳什混合战略均衡当且仅当对所有参与人而言， ?i*是?-i*的最适反应ui(?i*,?-i *)? ui(?I’,?-i *)，对所有?i’??i成立)
持混合战略的前提是在均衡时两种战略的报酬会相等，是预期支付最大化的推导结果
给定参与人2（p,1-p），参与人1的支付为：
求得（1/21/2）是纳什混合战略均衡
如果两种战略报酬不相等，那么就变为
混合战略均衡的博弈原则
兩博弈方不能让对方知道或猜到自己的选择因而必须在决策时利用随机性；
两博弈方选择每种策略的概率一定要恰好使对方无机可乘，即让对方无法通过针对性地倾向某一策略而在博弈中占上风
例：在掷硬币的博弈中，参与人1选正面、反面的概率q,1-q一定要使参与人2选正媔的和反面的期望得益相等。
单纯战略与混合战略的定义
G={N,S,U}是一个战略式有限博弈参与人i的战略空间S中的任一元素si称为i的一个单纯战略（pure strategy）；定义在Si上的一个概率分布函数pi(si)代表了一个混合战略（mixed strategy）——这个战略的内容是：参与人i以概率pi(sij)选择单纯战略sij，而?pi(sij)=1
单纯战略是混合戰略的特例，因为任一单纯战略si都可以理解为i以概率1选择si以0概率选取其他所有单纯战略。
引入混合战略参与人的目标需要修改为“最夶化自己的期望支付”
Selton：小偷和守卫的博弈
一小偷欲偷窃有一守卫看守的仓库，如果小偷偷窃时守卫在睡觉则小偷就能得手，偷得价值為V的赃物；如果小偷偷窃时守卫没有睡觉则小偷就会被抓住。设小偷被抓后要坐牢负效用为-P，守卫睡觉而未遭偷窃有S的正效用因睡覺被窃要被解雇，其负效用为-D而如果小偷不偷，则他既无得也无失守卫不睡意味着出一份力挣一分钱，他也没有得失
古代齐威王与夶将田忌赛马，田忌的谋士孙膑运用计谋帮助田忌以弱胜强
比赛规则：田忌与齐威王各出三匹马，一对一比赛三场每一场的输方要赔1000斤铜给赢方。双方的马按实力都可以分为上、中、下但齐威王的上、中、下均优于田忌的上、中、下。实际上田忌的上马、中马要优於齐威王的中马、下马。
比赛结果：田忌连输三场；后孙膑建议以上对中、以中对下、以下对上，结果以2：1赢得比赛
前述为单方面运鼡策略的故事，如果齐威王预料到田忌的做法必然会改变各匹马出场的次序。
本博弈中博弈双方的利益是完全对立的是严格竞争的零囷博弈，不会有纯策略纳什均衡必然是一个混合策略均衡。
假设齐威王采取六种战略的概率分别为pa,pb,pc,pd,pe,pf（加总为1）,则田忌采取六种战略的期朢得益相等则得出齐威王与田忌均以1/6的相同概率随机选择各自的六个纯策略，构成本博弈唯一的混合策略纳什均衡
将博弈方的策略空間扩展到包括混合策略，将纳什均衡扩展到包括混合策略纳什均衡以后求纳什均衡反应函数的分析方法也可以扩展到求混合策略纳什均衡。
反应函数即一博弈方对另一博弈方每种可能的决策内容的最佳反映决策构成的函数在纯策略的范畴内，反应函数是各博弈方选择的純策略对其他博弈方纯策略的反应在混合策略的范畴内，博弈方的决策内容为选择概率分布反应函数就是一方对另一方的概率分布的反应。
第五节纳什均衡的存在性与多重性
   每个有限战略式博弈（参与人与战略数目均为有限）都有纳什均衡存在这均衡有可能是混合战畧均衡
给定妻子分别以q,1-q的概率选择时装、足球，则丈夫选择时装、足球的期望收益相等即1.q+0.(1-q)=0.q+3.(1-q)，解得妻子选择时装、足球的概率分别为（3/41/4）
给定丈夫分别以p,1-p的概率选择时装、足球，则妻子选择时装、足球的期望收益相等即2.p+0.(1-p)=0.p+1.(1-p)，解得妻子选择时装、足球的概率分别为（1/32/3）
当妻子以（3/4，1/4）的概率分布随机选择时装表演和足球丈夫以（1/3，2/3）的概率随机选择时装表演和足球时双方都无法通过单独改变策略，即單独改变随机选择纯策略的概率分布而提高利益因此双方的上述概率分布的组合构成一个混合策略纳什均衡。
该混合策略纳什均衡给妻孓和丈夫各自带来的期望收益分别为：
双方的期望收益均小于纯策略时的期望收益
当一个博弈有多个纳什均衡时，博弈论并没有一个一般的理论来证明纳什均衡结果一定会出现
在现实生活中，参与人可能使用某些被博弈模型抽象掉的信息来达到一个“焦点”均衡这些信息可能与社会文化习惯、参与人过去博弈的历史有关。
例在性别战中，如果今天是丈夫的生日（足球、足球）可能是一个焦点均衡；而如果是妻子的生日，（时装、时装）可能是一个焦点均衡
第二章完全信息动态博弈
子博弈精炼纳什均衡举例
第一节博弈的扩展式表述
一般以扩展型式来表示：G=(N,H,P,I,U)，包括5要素：
（2）历史H:博弈树是一个多环节与枝干的集合从单一的起始环节，直到终结环节代表博弈历史；
（3）对每个环节的分配法则P:将每个环节（除终结环节外）分配给不同的局中人，并赋予行动时可选的策略；
（4）局中人行动时的信息集匼I；
（5）对应局中人可能选择策略各局中人在终结环节所得到的报酬U。
        在博弈树中“谁在什么时候行动”用在决策结旁边标注参与人嘚办法来表示。参与人的支付标注在博弈树终点结处
2．枝(branches)：在博弈树上，枝是从一个决策结到它的直接后续结的连线每一个枝代表参與人的一个行动选择。
3．信息集(information sets)：博弈树上的所有决策结分割成不同的信息集每一个信息集是决策结集合的一个子集。该子集包括所有滿足下列条件的决策结：(1)每一个决策结都是同一参与人的决策结；(2)该参与人知道博弈进入该集合的的某个决策结但不知道自己究竟处于哪一个决策结。
第二节子博弈精炼纳什均衡
子博弈定义：在一个扩展型博弈中如果一个博弈由它的一个决策结及其所有后续结构成，并滿足（1）起始结是一个单结的信息结;（2）子博弈保留了原博弈的所有结构则称它为原博弈的一个子博弈（子博弈）。
二、子博弈精炼纳什均衡
子博弈精炼纳什均衡定义：
   在博弈G中如果s*=(s1,…,sn)是G的一个纳什均衡，并且对所有可能的子博弈而言仍是一个纳什均衡则称s*=(s1,…,sn)为一个孓博弈精炼纳什均衡
纳什均衡?子博弈精炼纳什均衡
排除（上，{左左}），（下{右，右}）只有（下{左，右}）
是子博弈精炼纳什均衡
四、承诺行动（commitment）与子博弈精炼纳什均衡
纳什均衡之所以不是精炼均衡是因为不可置信的威胁存在，如父母与子女之间的博弈
如果参与囚在博弈前采取措施改变行动空间或支付函数，原来不可置信威胁就变得可置信博弈的精炼均衡就会改变；将改变博弈结果而采取的措施称为“承诺行动”
完全承诺，如破釜沉舟、军事博弈
春节前夕某小镇上两个商铺主甲和乙同时看到一个赚钱机会：去城里贩一批鞭炮囙来零售，购货款加上运输费用共5000元如果没有竞争对手，这批货在小镇上能卖6000元；但如果另一家商铺同时在小镇上卖鞭炮价格下跌使嘚这批鞭炮只能卖4000元。纳什均衡是什么
假设甲先行动，商铺乙看到对方的选择后再决定是否进货子博弈精炼纳什均衡是什么？
   如果甲先行动但在博弈开始前商铺主乙有一次行动A的机会，利用子博弈精炼均衡概念分析下述两种情况下的博弈结果：
（1）A：商铺主乙逢人便說自己一定要进货无论对方如何行动他都不会改变这个决定；
（2）A：商铺主乙与某个嘲笑他说大话的第三者丙打赌：如果自己到时不进貨，向丙支付1500元；如果自己到时候进货丙向他支付100元。并且乙将这个赌局通知甲。
开金矿博弈的基本问题：甲在开采一价值4万元的金礦时缺1万元资金而乙正好有1万元资金可以投资。设甲想说服乙将这1万元资金借给自己用于开矿并许诺在采到金子后与乙对半分成，乙昰否该将钱借给甲呢假设金矿的价值是经过权威部门探测确认的，没必要怀疑
第三节子博弈精炼纳什均衡举例
斯塔克尔伯格（Stackelberg）寡头競争模型
劳资（工会与厂商）博弈模型
罗宾斯泰英（Rubinstein）轮流出价的讨价还价模型
产量领导模型：行动顺序为，第一家厂商首先选择产量；苐二家厂商再选择产量得到反应函数；将反应函数代入第一家厂商的利润函数求出y1*；然后求y2。
代入厂商1的利润函数
里昂惕夫1946年提出分別代表劳资双方的工会与厂商之间的博弈模型。
该模型假设工资完全由工会决定而厂商则根据工会要求的工资高低决定雇用工人的数量。
工会代表的劳方效用u=u(W,L)
行动顺序为：先由工会决定工资率，然后厂商根据工会提出的工资率决定雇用多少劳动
先分析第二阶段厂商的選择。厂商对工会选择的工资率W的反应函数为L=L(W)则：max ?(W,L)=max[R(L)-WL],解得R’(L)=W，求得L*(W)为在给定工会选择W时厂商的最优雇佣数量
然后分析第一阶段工会的選择。工会清楚厂商对应每一个W所选择的L*工会需要决定的是选择W*，使得max u=u(W,L*(W)),求得符合工会最大利益的W*
先由工会决定工资率，再由厂商决定雇用多少劳动力
三、罗宾斯泰林讨价还价模型
   甲、乙两人协商分配上级下拨的1000元钱在给定的3天协商时间内，第一天甲提出一个分配方案乙若同意的话就按此分配，乙若不同意他可在第二天提出自己的方案甲可选择接受或在第三天再提出一个方案，乙对此可以接受或拒絕；如果3天内两人不能达成协议上级将收回这1000元钱；甲和乙分别按天贴现率?和?贴现自己的未来收益， 0? ?、??1简化条件：如果洎己不能从拒绝对方提案中获取更多的收益，局中人都会接受对方提案
第三天：只要甲的提案满足b1?0，乙总会接受甲的目标是利益最夶化，因而提案为(a1,b1)=(1,0)（单位为千元）
第二天：乙预料到第三天(1,0)的结果所以尽可能让甲接受自己的提案，提案中给甲的金额不小于1的贴现?因而有方案(a2,b2)=(?,1-?)
第一天：甲清楚如果自己的提案被否决，对方第二天的提案将是(?,1-?)自己会接受它。甲的问题是保证第一天乙得到?(1-?)的前提下自己尽可能多得一些他的最佳选择将是(a3,b3)=(1-?(1-?),?(1-?))，乙接受博弈于第一天即告结束
无穷次讨价还价模型不能采用逆推法
Rubinstein曾经對其进行证明，得到结果：甲在第一阶段提出
四、委托人—代理人理论
经济活动和社会活动中有很多委托人——代理人关系有明显的，吔有隐蔽的工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。
委托人——代理人关系的关键特征：不能直接控制监督不完全，信息不完全利益的相关性
委托人——代理人涉及问题：激励机制设计、机制设计理论，委托合同设计问題等
无不确定性的委托人—代理人模型
有不确定性但可监督的委托人—代理人博弈
有不确定性且不可监督的委托人—代理人博弈
第四节重複博弈和无名氏定理
有限次重复博弈：连锁店悖论
无限次重复博弈和无名氏定理
   令G为阶段性博弈G(T)是G重复T次的重复博弈（T<?）。如果G有唯┅的纳什均衡解重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次，如囚犯困境
有限次重复博弈：连锁店悖论
   假萣同样的市场有20个（可以理解为在位者有20个连锁店），进入者每次进入一个市场博弈就变成了20次重复博弈。
子博弈精炼纳什均衡为在位者在每一个市场选择默许，进入者在每一个市场选择进入
连锁店悖论—市场进入博弈
“信息完备”是重复博弈的一个必要条件，事实證明如果局中人的博弈环境存在不完备信息，或者存在不确定性类似于“连锁店悖论”这样的问题多半会消失。
假定连锁店有高成本、低成本两种情况就但其博弈看，面对新厂商进入高成本厂商最佳反应为容忍，低成本厂商最佳反应为斗争那么高成本厂商在博弈嘚前期阶段选择斗争，仍是可信的威胁
二、无限次重复博弈与无名氏定理
假设囚徒困境是一个阶段性博弈，并且是无限次重复博弈那麼任一个囚徒选择抵赖的条件是：0+?(-6)+?2(-6)+…?-1+?(-1)+?2(-1)+…（ ? 为贴现因子）或者-6?/(1-?)?-1/(1-?)，即 ??1/6（即局中人具有足够的耐心）（抵赖、抵赖）是无限次囚徒博弈的一个子博弈精炼纳什均衡。
以囚徒困境为例：开始选择抵赖选择抵赖直到有一方选择了坦白，然后永远选择坦白
一旦哪个参与人选择了坦白，就触发了惩罚的扳机。
在无限次重复博弈中如果参与人具有足够的耐心（即?足够大），那么任何满足个人理性的可行的支付向量都可以通过一个特定的子博弈精炼均衡得到
以“利己、利他”为例，其博弈中唯一的纳什均衡为（利己利己），两个局中人在此均衡下所的支付都是1；所以只要无穷重复博弈中局中人可行的平均单期支付不小于1，这样的支付就是一个可能嘚均衡支付
无穷重复博弈能够导致帕雷托改进。
寡头市场上古诺均衡的无限次重复博弈
合作：生产垄断产量的一半(1/4,1/4)获取超额利润(1/8,1/8)
不合莋：生产纳什均衡产量(1/3,1/3)，获取超额利润(1/9,1/9)
给定企业坚持冷酷战略企业一开始生产1/4，中途只要有企业偏离合作产量生产短期最优产量3/8，则對方选择1/3
寡头市场上古诺均衡的无限次重复博弈
证明冷酷战略是子博弈精炼纳什均衡
即如果??9/17，默契合作就会是一个精炼均衡结果
寡头市场上古诺均衡的无限次重复博弈
如果有n个寡头企业，默契合作要求??(1+4n/(n+1)2)-1当n??时,??1，即企业越多默契合作越困难。
解释了为什么小团体的合作靠非正式规则就可以维持而大团体就必须依赖于正式的规则与合约。
作业1：请找出此博弈的子博弈精炼纳什均衡
一个建筑公司每到有工程合同才雇用临时工人考虑某项工程中公司与工人的劳动-工资博弈；工人受雇于该公司的机会成本是0；工人可以老实哋干活，为公司创造利润y但这需要付出劳动成本l，y>l>0；工人也可以受雇后不干活这不需任何劳动成本，同时创造的利润也是0假设公司與工人在工程结束之前没有任何工资合同，它只是在雇用期满后才决定付给每个工人的工资额w
如果该建筑公司在未来的10年内每年有一项楿同的工程，证明：无论公司的利润贴现因子?是多少唯一的子博弈完美均衡是：在每一项工程中，无论工人是否干活公司向工人付嘚工资额w都是0；工人不干活。
如果该建筑公司依次有无穷多个工程而下一期工人又能看到以前的工资政策。证明：只要?充分接近1每┅期工人都努力干获将是一个子博弈完美均衡战略。
在所有子博弈完美均衡中对公司最有利的是什么样的均衡？
第三章不完全信息静态博弈
不完全信息博弈和贝叶斯纳什均衡
贝叶斯博弈与混合战略均衡
机制设计理论与显示原理
第一节不完全信息博弈和贝叶斯均衡
   每个局中囚对其他局中人的特征（或类型）和支付函数有准确的了解；否则为不完全信息（incomplete information ）。
   在博弈过程的任何时点每个局中人都能观察并记憶之前各局中人所选择的行动否则为不完美信息（imperfect information ）
二、海萨尼（Harsanyi）转换
在位者存在不同类型，类似于与n个参与人博弈；海萨尼（）提絀引入虚拟参与人——自然，自然先决定参与人的特征不完全信息博弈转换为不完美信息博弈
不完全信息意味着至少有一个人有多个類型（type），即个人所拥有的非共同信息用?i表示参与人i的一个类型，分布函数p(?1,…,?n)为共同知识
假设自然N按照一个先验的分布函数p(?1,…,?n)来选择各个局中人的类型，并且假设这是共同知识记?-i=(?1,…,?i-1,?i+1,…?n)??-i
局中人i不知道N对?-i的选择结果，但由于他知道自己的类型?i它可以利用贝叶斯法则计算出条件分布函数，对其他局中人的类型进行估计：
称pi(?-i??i)为局中人i对别的局中人类型的信念（belief）在许哆场合下，局中人的类型是彼此无关的此时pi(?-i??i)就简化为pi(?-i)。
三、不完全信息静态博弈的战略式表述
n人贝叶斯博弈的战略式表述为：
類型空间为：?1,… ?n；
条件概率为：p1,…pn；
类型依存战略为：S1(?1) ,…S(?n)；
给定参与人i知道自己的类型?i??i条件概率pi=pi(?-i??i)描述给定自己属於?i的情况下，参与人i有关其他参与人类型?-i??-i的不确定性
静态贝叶斯博弈的时间顺序
自然选择类型向量?=(?1,…,?n),其中?i??i,参与人i觀测到?i,但参与人j只知道pj(?-j??j),观测不到?i
当进入者选择进入的期望收益大于选择不进入的期望收益时，进入者选择进入
四、贝叶斯纳什均衡（BNE）
定义：如果有一组与局中人类型相关的战略{si*(?i)??i??i}ni=1对每个局中人i和每种局中人i的类型?i??I,si*(?i)是问题
的解，则称{si*(?i)??i??i}ni=1是一个贝叶斯纳什均衡换句话说，贝叶斯纳什均衡下每个局中人都在其他局中人（无论他属于哪种类型）不改变当前战略的情况下達到了他的最大期望支付。
静态贝叶斯博弈均衡举例求解
乙：如果为?2有占优战略为“左”；如果为?2/，有占优战略为“右”
甲：由于甲相信对方为两种类型的可能性各为1/2故甲计算选“上”或“下”，分别给他带来的期望收益结果选“上”，期望支付为5/2选“下”，期望支付为2因而甲的最佳选择是“上”。
一、不完全信息古诺模型
在不完全信息古诺模型中参与人的类型是成本函数
假定企业1的单位荿本c1=1是共同知识，企业2的单位成本可能是c2h=5/4,也可能是c2l=3/4,两者的可能性各为p=1/2,1-p=1/2
不完全信息古诺模型求解（一）
不完全信息古诺模型求解（二）
完全信息与不完全信息情况下古诺模型比较
与完全信息相比不完全信息情况下，企业1面对低成本企业选择的产量相对较低面对高成本企业選择的产量相对较高，其原因在于：企业1生产预期的最优产量高于完全信息下面对低成本竞争对手时的产量，低于完全信息下面对高荿本竞争对手时的产量，企业2对此做出反应
二、不完全信息情况下公共产品的提供
两个参与人同时决定是否提供公共产品，提供或不提供如果至少有一个人提供，每人得到一单位好处；如果没有人提供每人得到0单位支付，参与人i提供公共产品的成本是ci
不完全信息公囲产品提供的解
最大化行为意味着，只有当参与人i预期对方j不提供时参与人才会考虑自己是否提供。
假设对方提供公共产品的概率为zj,则參与人i提供公共产品的条件为：1-ci>zj+(1-zj)0=zj即只有1-zj>ci，参与人才会提供存在一个分割点（cutoff），使得ci?[c,ci*]时参与人才会提供。
当一件物品对买者的价徝买者比卖者更清楚时卖者一般不愿意首先提出价格，而常常采用拍卖的方式获得可能的最高价格
一级密封价格拍卖是许多拍卖方式嘚一种，在这种拍卖中投标人同时将自己的出价写下来转入一个信封，密封后交给拍卖人拍卖人打开信封，出价最高者是赢者按他嘚出价支付价格，拿走被拍卖的物品
一级密封价格拍卖（一）
   两个人对拍卖品分别有自己的主观判断，称其为对拍卖品的保留价格v假設两人都不清楚对方的保留价格，只知道对方的保留价格为一均匀分布于[01]上的随机值。记局中人的最佳叫价为b(v)由经验常识，假设函数b(v)嚴格单增是合适的在此假设下，其反函数存在记为V(b)，反映的是叫价为b的局中人真实的保留价格
一级密封价格拍卖（二）
当某人叫价b時，获胜的概率当然是对方叫价低于b的概率或者等价地说，是对方的保留价格低于V(b)的概率——由于局中人对该物品的保留价格是闭区间[01]上的均匀分布，这一概率就等于V(b)所以，一个具有保留价格v、叫价b的竞价者的期望支付为：
一级密封价格拍卖（三）
显然当某人对一个粅品的保留价格是0时它最优的叫价也是0，即V(0)=0将这一初始条件带入上式可求得c=0。
竞价者的最优战略是以自己保留价格的一半作为叫价
┅级密封价格拍卖（四）
   如果有n人参与竞标，则b=(n-1)v/n即b随n的增加而增加，特别地当n??时，b?v就是说，投标人越多卖者能得到的价格僦越高；当投标人趋于无穷时，卖者几乎得到买者价值的全部因此，让更多的人加入竞标是卖者的利益所在
贝叶斯均衡与混合战略均衡
有不少人认为完全信息博弈中的混合战略均衡仅仅只是理论上的概念，但在现实生活中确实难以理解的针对这一点，海萨尼（1973）对混匼战略提出了另一种解释
其思想是，只要在原来的博弈中加入少许不完全信息因素得到（单纯战略）贝叶斯均衡就与完全信息下的混匼战略均衡相似。
完全信息情况下的“性别战”加上不完全信息想象两人还不十分了解，当双方都去看足球赛时男士得到的支付是4+?1雙方都去听音乐会时女士得到的支付为4+?2。两人知道自己的类型但不清楚对方?值的大小，只知道对方的?值是均匀地分布在区间[0,?]上嘚随机变量
如果男士的类型?1不小于某一临界值a，他选择“足球”否则选择“音乐会”；如果女士的类型?2不小于某一临界值，她选擇“音乐会”否则选择“足球”。
   整理后得到男士选“足球”的充要条件：
女士选择“音乐会”的充要条件是：
联立两个条件中的等式解得
在上述贝叶斯均衡中，两个局中人使用的都是单纯战略因为不知道对方的类型，感觉面对的像是混合战略的博弈对手如果令?為0，男士选足球的概率(?-a)/?趋于4/5但不完全信息消失时，贝叶斯均衡趋向于完全信息下的混合均衡
机制设计原理与显示原理
机制设计是┅种特殊的不完全信息博弈，委托人(principal)选择设计机制给代理人足够的激励，促使代理人(agent)说实话（获取真实信息）也可以最大化委托人的期望效用。
委托人设计机制面临两个约束：
（2）激励相容约束(incentive-compatibility constraint)：代理人在所设计的机制下必须有积极性选择委托人希望他选择的的行动
滿足参与约束的机制称为可行机制，满足激励相容约束的机制称为可实施机制满足两个约束条件的机制称为可行的可实施机制。委托人嘚目的是选择一个可行的可实施机制以最大化他的期望效用
典型的机制设计是一个三阶段不完全信息博弈：第一阶段：委托人设计机制，即博弈规则代理人根据规则发出信号(message)，实现的信号决定配置结果(allocation)；第二阶段：代理人同时选择接受或不接受委托人设计的机制；第三階段：接受机制的代理人根据机制的规定进行博弈
   机制设计的案例有很多：拍卖、垄断企业定价、政府税收政策的制定、政府对垄断企業的规制、公共产品的供给、雇主对雇员职位的安排、保险公司的收费和赔偿政策等。
机制设计案例分析（一）
《圣经》上索罗门国王对駭子所有权的判定：
私人信息：孩子对于A、B两人的价值分别为CA,CB
索罗门国王的处置方式：将孩子切成两半
A、B两个人按照所罗门国王设计的机淛采取行动：私人信息?配置结果
存在问题：代理人可以模仿其他人的反应
机制设计案例分析（二）
采取处罚措施：让A先行动，如果放棄得0如果向B挑战需要付出F。B如果接受A的选择放弃孩子则得0，如果不放弃向A挑战，则需要付出EA再进入下一个迎接挑战的循环。
?n)矗接机制的均衡配置结果与原机制的均衡配置结果相同。
显示原理肯定了对任何贝叶斯博弈的任何贝叶斯纳什均衡都能设计出一种促使各博弈方“揭示”自己真实类型的直接机制来实现它。
以暗标拍卖为例设只有两个投标人，他们的估价类型V1,V2都是[0,1]上的标准分布说实话嘚直接机制是这样设计的：(1)两投标人同时声明V1/,V2/；(2)投标人中中标的概率为qi=V1//2，中标的价格为pi=V1//?由于Vi?[0,1]，因此Vi/?[0,1]q1+q2?1。其中?为代定参数是決定投标人都说实话是否能成为贝叶斯纳什均衡的关键。
假定两投标人的声明是线性齐次的具有：Vi/=aiVi的形式，则投标人i声明Vi/的期望收益为：
对投标人i来讲均衡条件是找出ai使期望收益最大
其一阶条件为ai=?/2
因此，当?=2时也就是中标价格为中标人声明估价（也是真实股价）的┅半时，上述直接机制使得两投标人都讲真话是贝叶斯纳什均衡
第四章不完全信息动态博弈
信号传递博弈及其应用举例
一、不完全信息动態博弈特点
“自然”首先选择参与人的类型参与人自己知道，其他参与人不知道；
参与人开始行动后行动者能观测到先行动者的行动，但不能观测到先行动者的类型；
后行动者通过观察先行动者所选择的行动来推断类型或修正对其类型的先验信念（概率分布）然后选擇自己的最优行动；
先行动者预测到自己的行动将被后行动者所利用，就会设法选择传递对自己最有利的信息避免传递对自己不利的信息。
贝叶斯法则：假定参与人i有K个类型有H个行动，用?k和sh分别代表一个特定的类型和战略假定i属于?k的先验概率是p(?k)?0,?p(?k)=1,i选择sh的条件概率为p(sh??k),?p(sh??k)=1。
假如观测到i选择了sh,i属于类型?k的后验概率Prob(?k?sh)有以下公式存在：
假定现实中分为好人(?1)和坏人(?2)(type)所有的事分为好倳(s1)和坏事(s2)(strategy),那么一个人干好事的概率p{s1}就等于他是好人的概率p(?1)（先验概率）乘以好人干好事的概率p(s1??1)，加上他是坏人的概率p(?2)乘以坏人干恏事p(s1??2)的概率即p{s1}=p(s1??1)p(?1)+p(s1??2)p(?2)(边缘概率)。
假定观测到一个人干了一件好事那么这个人是好人的后验概率为：
假设认为这个人是好人嘚先验概率为1/2，那么在观测到他干了好事之后来修正他是好人的先验概率依赖于这件事好到什么程度
三、精炼贝叶斯均衡（PBNE）
PBNE是不完全信息动态均衡的基本均衡概念，是泽尔腾的完全信息动态博弈子博弈精炼纳什均衡（SPNE）和海萨尼的不完全信息静态博弈贝叶斯均衡（BNE）的結合
BNE中，参与人的信念是事前给定的均衡概念没有规定参与人如何修正自己的信念。
SPNE要求均衡战略不仅在整个博弈上构成纳什均衡洏且要求在每个子博弈上构成纳什均衡，剔除了那些包含不可置信威胁的战略
PBNE要求，给定每一个参与人有关其他参与人类型的后验信念参与人的战略组合在每一个后续博弈（continuation game，每一个信息集开始的博弈的剩余部分不同于开始于单结信息集的子博弈）上构成贝叶斯均衡。
三、精炼贝叶斯均衡（PBNE）
精炼贝叶斯均衡（ PBNE ）是贝叶斯均衡、子博弈精炼均衡和贝叶斯推断的结合
PBNE要求：（1）在每一个信息集上，决筞者必须有一个定义在属于该信息集的所有决策结上的一个概率分布（信念）；（2）给定该信息集上的概率分布和其他参与人的后续战略参与人的行动必须是最优的；（3）每一个参与人根据贝叶斯法则和均衡战略修正后验概率。
或者说，参与人的战略是序贯理性的即茬每个参与人的信息集中，给定这个人的信念以及其他参与人的战略他在该信息集中的选择以及之后的行动是他在这些前提下的最优行動。
精炼贝叶斯均衡定义的阐释
精炼贝叶斯均衡是均衡战略和均衡信念的结合：
四、精炼贝叶斯均衡求解
SPNE的缺点：有不完全信息、不完美信息时无法检验决策情境
在均衡中加入信念的好处：给定均衡状态，可检验每一种情境
信号传递博弈及其应用举例
是一种比较简单但囿广泛应用意义的不完全信息动态博弈（斯宾塞，1974）
博弈中有两个参与人,1的类型是私人信息,为信号发送者;2的类型是公共信息,为信号接收者
(1)“自然”首先选择1的类型???，2只知道1属于?的先验概率p=p(?)；
(2)1在观测到类型?后选择发出信号m?M,M={m1,…,mJ}是信号空间；
信号传递博弈的精炼貝叶斯均衡
不同类型发送者以1的概率选择不同信号或者说，没有任何类型选择与其他类型相同的信号在分离均衡下，信号准确地揭示絀类型
不同类型的发送者选择相同的信号，或者说没有任何类型选择与其他类型不同的信号，因此接收者不修正先验概率。
假定mj是均衡战略那么：
假定有两个时期，市场上一个垄断企业在生产潜在的进入者考虑是否进入。如果进入两个企业进行古诺博弈，否则茬位者仍是一个垄断者
在位者有两个类型，高成本与低成本其概率分别为q,1-q（先验信念）。
进入者只有一个类型进入成本为2。如果进叺生产成本函数与高成本的在位者相同。
如果是高成本单阶段最优价格为p=6；如果是低成本，单阶段最优价格为p=5
市场进入博弈求解（┅）
单阶段最优垄断价格p=6(高成本)或p=5(低成本)，不是精炼贝叶斯均衡如果进入者这样选择，则后验概率q~(6)=1(选择p=6证明在位者是高成本),q~(5)=0(选择p=5证明在位者是低成本)
给定后验概率当观测到在位者选择p=6，进入者选择进入在位者两期利润=7+3=10;而如果模仿低成本企业，选择p=5,则得到两期利润=6+7=13因此p=6不是高成本在位者的最优选择
市场进入博弈求解（二）
假定q?1/2，得到混同均衡两类在位者选择相同的价格
给定进入者的后验概率和战畧，如果高成本选择p=6进入者进入，u1=7+3=10如果选择p=5，进入者不进入u1=6+7=13，p=5是高成本的最优选择；如果低成本选择p=5u1=9+9=18，大于选择其他任何价格时嘚利润p=5是低成本的最优选择。
给定两类在位者都选择p=5进入者不能从观测到的价格中得到任何新的信息，即后验概率q~=1*q/(1*q+1*(1-q))=q?1/2,（式中的1分别为高成本、低成本时在位者选择p=5的概率）进入的期望利润q*1+(1-q)*(-1)?0,不进入的期望利润为0因此不进入是最优的。
市场进入博弈求解（三）
假定q?1/2嘚到分离均衡，两类在位者选择不同价格
如果不同类型在位者选择相同的价格进入者得不到新的信息，将选择进入因为q*1+(1-q)*(-1)=2q-1?0。给定进入鍺一定会进入在位者的最优选择是p=6(高成本)或p=5(低成本)，前面已经证明不是一个均衡
给定进入者的后验概率和战略，低成本在位者选择p=6(认為他是高成本进入)，u1=8+5=13；选择p=5进入者进入，u1=9+5=14；选择p=4进入者不进入， u1=6+9=15最优战略为p=4,进入者不进入。
给定进入者的后验概率和战略,高成本茬位者选择p=4进入者不进入,u1=2+7=9;选择p=5,进入者进入, u1=6+3=9;选择p=6,进入者进入,u1=7+3=10,因此p=6是最优的。
工人:U(e,w;?)=w-e/?,e为信息,w为工资,?为劳动者的素质,其中高生产率者?H的概率为P,低生产率者?L的概率为1-P=E[?]
雇主:U(w,?)=?-w,?(??e):给定教育程度时能力的概率分布，如果雇主完全竞争则工资就等于劳动者的期望工作能力，即w(e)=?(?H?e)* ?H+ ?(?L?e)* ?L
行动顺序为工人先选择e雇主根据e支付w，
如果改成由公司先行动：只有一个可能的均衡
经验：拥有信息的人先荇动均衡多；处于信息劣势的一方先行动，均衡唯一
简化的KMRW声誉模型
市场上有大小两个厂商1，2博弈分两个阶段，在第1阶段厂商1降低产品价格挑起价格战（战），也可以选择和平相处（和）厂商2在第二阶段选择“退出” 和“留下”。
厂商1有“强”、“弱”两种类型其概率分别为p,1-p，假设“强”厂商始终选择“战”
厂商1选择“战”，厂商2在每期的支付为F2(第二期退出支付为0)；如果对方选“和”厂商2茬每个阶段的支付为A2，满足F2?0?A2
厂商1选“战”、“和”时每期的利润分别是F1、A1，如果第二阶段厂商2退出厂商1获得垄断利润M1，三者的关系是F1?A1?M1,假设跨时贴现因子为??[0,1]
“强”厂商1的战略已经假设总选择“战”，模型的重点是“弱”厂商会选择什么样的战略
从单期看，因为F1<A1他当然会选“和”；但由于有A1<M1，“弱”厂商自然希望厂商2在第二阶段退出市场让自己获得垄断利润。要达到这一目的在第一階段选“和”显然不行。
如果在第一阶段佯装“强”厂商使用“战”对方相信并退出市场，后期得到的额外利润贴现后还超过前期损失嘚话即使厂商1是“弱”的也会有“战”的动机。
概括地说“弱”厂商可能希望通过前期的行动为自己建立一个“强”的形象和声誉，讓厂商2在后期知难而退
分离均衡的特点：不同类型的参与人使用不同的战略，从而一个参与人一旦作出行动就相当于向所有人宣布了自巳的类型
分离均衡的条件：“弱”厂商1决定“和”，对手看到后调整自己的信念：p{?1=弱?和}=1；厂商2必然决定留在市场厂商1的总利润(1+?)A1; “弱”厂商确定可以吓退对手，决定“战”总利润F1+?M1,，因而存在分离均衡的条件是：(1+?)A1?F1+?M1
如果不等式成立，下述战略和信念构成一個完美贝叶斯均衡：“强”厂商1选“战”“弱”厂商1选“和”；厂商2观察到对手战略后修正自己的信念：p{?1=强?战}=1， p{?1=弱?和}=1
混同均衡的特点：不同类型的参与人选择相同的均衡战略，此时参与人的行动不会暴露他的真实类型。
混同均衡的条件：如果两种厂商1都选“戰”没有给厂商2任何辨别的信息，厂商2看到对方行动后的信念等于先验概率：p{?1=强?战}=p；“弱”厂商1确定可以吓退对手才值得选“战”，即厂商2在第二阶段期望支付小于零：
    pF2+(1-p)A2<0,如果这个不等式成立并且有：(1+?)A1<F1+?M1，那么下述战略和信念构成一个完美贝叶斯均衡：两种厂商1嘟选“战”厂商2观察到对手战略后的信念：p{?1=强?战}=p，在该信念下厂商2决定退出市场。
第五章委托-代理理论
委托-代理理论的基本分析框架
第一节信息经济学引论
信息经济学是研究与信息不对称有关的经济行为及其相应的制度设计问题是非对称信息博弈论在经济学上的應用。
博弈论是方法导向：给定信息结构什么是可能的均衡结果。
信息经济学是问题导向：给定信息结构什么是最优的契约安排。
二、基本分类及应用举例
信息经济学的分类：一是依据非对称发生的时间二是依据非对称信息的内容，分类如下：
逆向选择：在鉴定交易契约前进行市场交易的一方可能因为占据信息优势，做出对自己有利对另一方有害的事情，从而降低了市场效率甚至可能导致这一市场的萎缩。
道德风险：是指交易双方签订契约后处于信息优势的一方在使自己利益最大化的同时，损害了处于信息劣势一方的利益洏且不承担由此造成的全部后果。
委托人（principal）与代理人（agent）的概念来自法律经济学上的委托—代理关系泛指任何一种涉及非对称信息的茭易，交易中有信息优势的一方称为代理人；不具有信息优势的一方称为委托人
存在原因：保险与信用是暂时的；代理人试图从委托人那里获得更多的收益。
签约时信息是对称的；签约后代理人选择行动，自然选择状态；代理人的行动和自然状态一起决定某些可观测的結果；委托人只能观测到结果而不能直接观测到代理人的行动本身和自然本身状态。
委托人的问题是设计一个激励合同以诱使代理人从洎身利益出发选择对委托人最有利的行动
例如：雇主与雇员的关系；保险公司与投保人；员工与经理；房东与住户；公民与政府官员等。
签约时信息是对称的；签约后自然选择状态；代理人观测到自然的选择，然后选择行动；委托人观测到代理人的行动但不能观测到洎然的选择。
委托人的问题是设计一个激励合同以诱使代理人在给定自然状态下选择对委托人最有利的行动
例如：企业经理与销售人员嘚关系；股东与经理；债权人与债务人；原告（或被告）与代理律师等。
自然选择代理人的类型；代理人知道自己的类型委托人不知道；委托人和代理人签订合同。
例如：卖者和买者的关系；保险公司和投保人；雇主与雇员；债权人与债务人等
自然选择代理人的类型；玳理人知道自己的类型，委托人不知道；为了显示自己的类型代理人选择某种信号；委托人在观测到信号之后与代理人签订合同。
例如：雇主与雇员的关系；买者与卖者
自然选择代理人的类型；代理人知道自己的类型，委托人不知道；委托人提供多个合同供代理人选择代理人根据自己的类型选择一个最适合自己的合同，并根据合同选择行动
例如：雇主与雇员的关系；垄断者与消费者；保险公司与投保人。
习惯上委托-代理理论是指隐藏行动道德风险模型
逆向选择理论包括了信号传递模型与信息甄别模型
第二节委托-代理理论的基本分析框架
激励机制设计的基本思想
委托-代理论的基本分析框架
一、保险市场与道德风险
   消费者购买保险后，如果意外损失可以得到全部保险即全部保险，那么他会放弃一些预防意外事故发生的措施引起意外事件发生的概率提高；如果保险金额小于意外损失，即部分保险與完全信息条件相比，投保人倾向于减少预防不测事件发生费用的支出
二、激励机制设计的基本思想
   委托人想使代理人按照前者的利益荇动，但不能直接观察到代理人的行动能观察到的另一些变量，是由代理人的行动与其他外生的随机因素共同决定的委托人的问题是洳何根据观测到的变量奖惩代理人，以激励选择对委托人最有利的行动
如表所示：如果委托人确定w=10,那么代理人选择不努力工作；如果委託人按利润支付工资，在利润为10、20w=10,在利润为40，w=20,代理人选择不努力工作的收入为10选择努力工作的预期收益为13，代理人选择努力工作
三、委托—代理理论分析的基本框架
委托人设计契约，预期效用最大：
代理人接受契约使自身效用最大：
委托人面临的第一个约束，预期效用大于机会效用:Eu=?u(a,w,?)g(?)d??u*（2）(IR)；
面临的第二个约束为激励相容条件即代理人能够按照委托人设计的努力程度工作，Eu(a,w)?Eu(a’,w)（3）（IC）
最優激励机制设计可以概括为：(1)、(2)、(3)
如果代理人选择了某一契约那么就可以根据激励机制方程计算出相应的w*，根据w*确定代理人努力程度a。
委托人根据代理人创造的利润与付出的努力制定相应的工资并通过观察代理人的行为，相应调整工资水平促使代理人努力工作，使玳理人承担了更多的风险
对称信息下的最优风险分担合同
对称信息下的最优激励合同
不对称信息下的最优激励合同
一、对称信息下的最優风险分担合同
如果委托人和代理人都是严格风险规避的，最优风险分担要求每一方都承担一定的风险；
如果委托人是风险中性者而代理囚是严格风险规避者那么代理人得到固定收入，委托人承担所有风险；
如果委托人是严格风险规避者而代理人是风险中性者委托人得箌固定收入，代理人承担全部风险
二、对称信息下的最优激励合同
当委托人可以观测到代理人的努力水平时，怕累托最优风险分担和帕累托最优努力水平可以同时实现：委托人要求代理人选择最优努力程度a*委托人根据努力程度支付代理人；否则，代理人得到最低支付
洳果委托人不能观测到代理人的努力水平和外生变量，而代理人是风险规避的帕累托最优是无法实现的，最优激励合同要求代理人承担仳对称信息情况下更大的风险
如果代理人的行动不可观察，而代理人是风险中性的帕累托最优可以实现。
三、不对称信息下的最优激勵合同
如果委托人是风险中性的在对称信息下，帕累托最优风险意味着代理人得到固定收入不承担任何风险；在非对称信息下，代理囚必须承担一些风险
给定产出?，如果代理人不努力时的概率大于努力的概率w将减小；如果?在代理人努力时的概率大于不努力时的概率，w将增加
在合同中增加其他不需要成本的变量：如相对业绩比较，例如同一行业不同企业的经营业绩除了受每个企业经营者的行為和特有的外生因素影响外，也受到行业性共同因素影响
第四节多阶段博弈动态模型
   在静态模型中，委托人不能观测代理人的行动为叻诱使代理人选择委托人所希望的行动，委托人必须根据可观测的行动结果来奖惩代理人这样的激励机制称为显性激励机制。
二、代理囚市场-声誉模型
   主要观点：在竞争的经理市场经历的市场价值从而收入决定于其过去的经营业绩，从长期看经理必须对自己的行为负唍全的责任；因此，即使没有显性激励机制合同经理也有积极性努力工作，因为这样做可以改进自己在经理市场上的声誉从而提高未來的收入。
   如果用代理人过去的业绩作为现在业绩的评价标准那么会出现以下情况：代理人越努力，好业绩出现的可能性越大评价“標准”也就越高；当代理人预测到他的努力将提高评价“标准”时，他努力的积极性也就下降了这种标准随业绩上升的趋向被称为“棘輪效应”。
声誉模型：根据代理人过去的业绩推段经理的经营能力将强化激励机制；传递的信息是有关经理的经营能力的信息经营能力嘚所有权属于经理；经营业绩越好，市场所认为的经营能力越高经理的报酬也越高。
棘轮效应模型：根据代理人过去的业绩推断企业的內在生产率将弱化激励机制；过去的业绩传递的是有关企业内在生产能力的信息企业内在生产能力的所有权属于委托人；经营业绩越好，委托人认为的企业的内在生产能力越高经理给委托人上缴的份额越高，因此经理努力工作的积极性下降。
第六章逆向选择与信号传遞
保险市场上的逆向选择问题
逆向选择与信贷市场的配给制
信号传递：斯宾塞劳动力市场模型
      在鉴定交易契约前进行市场交易的一方可能因为占据信息优势，做出对自己有利对另一方有害的事情，从而降低了市场效率甚至可能导致这一市场的萎缩。
     在旧车市场卖者擁有信息，买者缺乏信息买者以平均质量的价格购买旧商品，将质量较高的旧商品逐出市场质量较差的旧商品留在市场。在均衡的情況下只有低质量的车成交，在极端情况下市场可能根本不存在，交易的帕累托改进不能实现
旧车市场有多个潜在的买者与卖者卖者知道自己出售的车的质量?，买者不知道?但知道?的分布函数F(?)，买者与卖者均为风险中性
买者出价P，卖者决定接受或不接受如果接受，买者、卖者的效用分别为：?B=V(?)-P、?S=P-U(?)且有V(?)?U(?)，如果不接受双方的效用均为0。
一、买卖双方有相同的偏好只有两类卖主
两类卖主：?=6000（高质量）或?=2000（低质量），每一种的概率各为1/2；买卖双方有相同的偏好且对车的评价等于车的质量：V(?)=U(?)=?
当买者不知噵车的质量时当两类车都进入市场，车的平均质量E?=4000买者愿意出的最高价格为P=4000；高质量的车退出市场，平均质量再次下降唯一的均衡是P=2000，只有低质量的车成交高质量的车逐步退出市场。
二、买卖双方偏好相同但卖主的类型连续分布
假定车的质量在[2000，6000]区间上均匀分咘密度函数为1/4000。
二、买卖双方偏好相同但卖主的类型连续分布
如果用需求曲线表示买者愿意支付的最高价格与市场上车的平均质量的關系，则有P=E?；供给曲线表示市场上车的平均质量与价格的关系则有
区间是动态的，因而密度函数为1/(P-2000)
供求均衡意味着P=E?,唯一的交点和均衡点。
三、买者对车的评价高于卖者
假定买者对旧车的评价高于卖者即存在V(?)=b?>U(?)=?（b?1），旧车的交易就会出现
交易带来的净剩餘为(b-1)?，买卖双方的讨价还价决定净剩余的分配
卖者的供给曲线仍为E?=P/2+1000。
买者的需求曲线为P(E?)=bE?
三、买者对车的评价高于卖者
如果b=1，囙到分析二
如果b?1,均衡价格和均衡质量均高于上例；均衡价格和均衡质量都是b的增函数，买者与卖者的评价差距越大均衡价格越高，茭易量越大
当b=1.2时，均衡价格等于3000所有??3000的车都进入交易，所有??3000的车都退出交易市场上出售的车的平均价格E?=2500。
当b?1.5时所有嘚车都成交，所有的车都成交平均质量为=4000，均衡价格为P=4000b
在现实中，不同的卖者对同样质量的车的评价一般也是不相同的假定U(?)=(1+?)?,(?是一个均值为0的随机变量)；当(1+?)??P，卖者才会卖车给定?，市场上出售的车的平均质量为：E?(P,?)=P/2(1+?)+1000如果买者知道?，他就可以知噵市场上出售的车的质量
均衡交易量取决于买者评价参数b以及卖者评价参数?的共同作用。
保险市场上的逆向选择问题
假设一家保险公司想提供汽车失窃保险经调查发现，不同社区失窃情况差别很大有的社区失窃率高，有的失窃率低保险公司根据平均失窃率提供保險，结果如何
假设n个人投保，投保价格p=P/x汽车失窃率为?，则保险公司的预期利益为：?=-n?(x-P)+n(1-?)P=-n?(1-p)x+n(1-?)px如果保险市场是完全竞争市场，则囿?=0?=p，即投保价格等于汽车失窃率
对应而言，失窃率高投保价格高；失窃率低，投保价格低；如果采用平均失窃率那么投保价格会高于失窃率低的社区，并将这一部分低风险的消费者挤出保险市场保险公司利益受损，为逆向选择
逆向选择与信贷市场的配给制
信贷配给是信贷市场上存在的一种典型现象，原因在于逆向选择现象存在高风险的项目驱赶了低风险的项目。
信贷市场中一般高风险與高收益成正比，银行不了解贷款者的类型厂商知道自己的信息。导致贷款利率与银行期望收益之间的变化如图所示利率上升的（直接的）收益效应大于（间接的）风险效应，?随r上升而上升；当r>r*时利率上升的（间接的）风险效应超过（直接的）收益效应，?随r的上升而下降银行期望收益最大化的利率为r*。
例：两类项目其收益分别为：R1=2.4成功的概率p=0.5；R2=1.5，p=0.8其中高风险项目占1/4，低风险占3/4
   当r=0.5略微上升時，低风险项目退出银行单位贷款的期望收益急剧下降。
一、信号传递与信息筛选模型
非对称信息导致帕累托最优交换经济不能实现擁有私人信息的一方设法将信号传递给没有私人信息的一方，交易的帕累托改进就可以实现
一、信号传递与信息筛选模型
信号传递模型：是指在交易前为了解决逆向选择问题，暂居信息优势的一方会通过某种方式向处于信息劣势的人发出信号，把自己的某些物品或自身優秀的特征显示出来以表明自己与众不同。
信息筛选模型：是指在交易之前处于信息劣势一方，以某种方式给出区分不同类型的市场信号以求获得自己所取信息，以此解决在交易中所处的信息劣势地位
二、斯宾塞劳动力市场模型
斯宾塞劳动力市场模型：雇员的教育程度向雇主传递有关雇员能力的信息，原因在于接受教育的成本与能力成反比，不同能力的人最优教育程度是不相同的
二、斯宾塞劳動力市场模型
假定教育不影响劳动生产率，
受教育程度e=0（不接受教育）、1（接受教育）；
二、斯宾塞劳动力市场模型a
H：如果接受教育净收益为WH-cH=2；如果不接受教育，净收益为WH-cH=1H选择接受教育。
L：如果接受教育净收益为WL-cL=0；如果不接受教育，净收益为WL-cL=1L选择不接受教育；
通过受教育传递了高、低生产率差别信息，得到均衡
二、斯宾塞劳动力市场模型
存在问题：（1）假设教育是连续的，教育水平如何确定过高，H与L均选择不接受教育过低，选择接受教育；（2）对于受教育者工资的制定过高，都接受教育过低，均不接受教育以至教育无法起到传递生产率的作用。均衡是不唯一的有分离均衡与混同均衡。
雇主先行动提出合同菜单{w,e}（假定教育是连续的），雇员选择其中┅个与雇主签约根据合约接受教育e，得到w
均衡是指存在一组合同和一个选择规则，使得（1）每一类型雇员在所有可选择的合同中选择┅个最适合自己的合同（即?能力的雇员选择(w?,s?) 当只当对于所有的(w,s)，U?(w?,s?)?U?(w,s) ）；（2）雇主的利润不为负；（3）不存在新的合同使嘚选择提供该合同的雇主得到严格正的利润

：这是博弈论英文ppt，包括了博弈论的基本问题简单博弈与博弈均衡，重复博弈与序列博弈威胁与承诺，几种相关的策略等内容欢迎点击下载。

：这是耶鲁大学公开课博弈论课件包括了感受历史，肩负未来新文化运动，噺文化运动的背景学习思考，走近北大新文化运动的内容，新闻资料问题探讨等内容，欢迎点击下载

分钱计划（Gibbons 教科书中习题）：

参與人1 和参与人2 因为如何分配10 美元的问题争执

不休每个参与人都说出了一个自己预期金额，该金额在0 到10 之间且允许出现小数两人需
要同時做出选择。参与人的收益就是她分得的钱款这个博弈有两条规则。

无论按哪条规则来分钱如果出现S1+S2<=10 的情况，每人获得自己的预期金額剩余的钱款被销毁。

(a).第一条规则是如果S1+S2>10 ，那么每个参与人都一无所获并且钱会被销毁这种情况下的（纯策略）纳什均衡是什么？

(b).苐二条规则是

如果S1+S2>10 ，并且每个人的预期金额是不同的那么预期金额最小的参与人分得等值的钱款而剩余的钱款归另一个参与人。
都分嘚5 美元这种情况下的（纯策略）纳什均衡是什么？

(c).假如我们为前两条规则增加一个限制条件即预期金额必须是整数。这是否会改变前兩条规则下的（纯策略）纳什均衡

博弈论求出一个Nash均衡问题

我要回帖

随机推荐