

Copyright ©2015-2025 海马课堂网络科技(大连)有限公司 办公地址:辽宁省大连市高新技术产业园区火炬路32A号创业大厦A座18层1801室

添加微信
咨询辅导

博弈论的学习往往让刚开始接触它的留学生感到不知所措,需要很多课外辅导。点击蓝字,即可获得专业的博弈论课程辅导服务哦~
博弈论由普林斯顿数学家约翰·冯·诺依曼开创。在早期,重点是纯冲突游戏(零和博弈)。其他游戏则以合作形式被考虑。也就是说,参与者应该共同选择并实施他们的行动。最近的研究集中在既非零和也非纯粹合作的游戏上。在这些游戏中,玩家分别选择自己的行动,但他们与他人的联系包含竞争和合作的元素。
游戏与在中立环境中做出的决策有着根本的不同。为了说明这一点,想想伐木工人的决策和将军的决策之间的区别。当伐木工人决定如何伐木时,他不期望木头会反击;他的环境是中立的。但是当将军试图削减敌人的军队时,他必须预测并克服对他计划的抵抗。像将军一样,游戏玩家必须认识到他与其他聪明且有目的的人的互动。他自己的选择必须同时考虑冲突和合作的可能性。
游戏的本质是玩家策略的相互依存。有两种不同类型的策略相互依存:顺序型和同时型。在前一种中,玩家依次行动,每个玩家都知道其他人之前的行动。在后一种中,玩家同时行动,每个玩家都不知道其他人的行动。
顺序行动游戏中玩家的一个一般原则是向前看并向后推理。每个玩家都应该弄清楚其他玩家将如何回应他当前的行动,他又将如何反过来回应,等等。玩家预测他最初的决定最终会导致什么结果,并利用这些信息计算他当前的最佳选择。当思考其他人将如何回应时,他必须设身处地为他们着想,像他们那样思考;他不应该把自己的推理强加给他们。
原则上,任何在有限的行动序列后结束的顺序游戏都可以完全“解决”。我们通过向前查看每个可能的结果来确定每个玩家的最佳策略。简单的游戏,如井字棋,可以通过这种方式解决,因此没有挑战性。对于许多其他游戏,如国际象棋,计算在实际中太复杂——即使使用计算机。因此,玩家会提前几步思考,并试图根据经验评估结果位置。
与顺序游戏的线性推理链相反,同时行动的游戏涉及逻辑循环。尽管玩家同时行动,不知道其他人当前的行动,但每个人都必须意识到还有其他玩家也有同样的意识,等等。这种想法是:“我认为他认为我认为……”因此,每个人都必须形象地设身处地为所有人着想,并试图计算结果。他自己的最佳行动是这个整体计算的一个组成部分。
这个逻辑循环通过普林斯顿数学家约翰·纳什提出的均衡概念得以解决(循环推理得以得出结论)。我们寻找一组选择,每个玩家一个,使得当其他人都在玩他们规定的最佳策略时,每个人的策略对他自己来说都是最好的。换句话说,每个人都选择对其他人的行动的最佳回应。
有时,无论其他人怎么做,一个人的最佳选择都是相同的。这被称为该玩家的“占优策略”。在其他时候,一个玩家有一个始终不好的选择——“被占优策略”——也就是说,无论其他人怎么做,其他某个选择对他来说都更好。寻找均衡应该从寻找占优策略和消除被占优策略开始。
当我们说一个结果是一个均衡时,并不假定每个人的私人最佳选择会导致集体最优结果。事实上,有一些著名的例子,如囚徒困境(见下文),其中每个玩家都遵循自己的最佳私人利益,结果陷入了糟糕的结果。
纳什的均衡概念对于同时行动游戏中的循环推理问题仍然是一个不完整的解决方案。有些游戏有很多这样的均衡,而其他游戏则没有。并且导致均衡的动态过程没有被明确说明。但尽管有这些缺陷,这个概念在分析许多战略互动中已被证明非常有用。
人们通常认为博弈论的应用要求所有玩家都超级理性。该理论并没有这样的主张。玩家可能怀有恶意或嫉妒,也可能善良和富有同情心。回想乔治·伯纳德·萧对黄金法则的修正:“不要对别人做你希望他们对你做的事。他们的口味可能不同。”除了不同的动机,其他玩家可能有不同的信息。在计算均衡或预测对您的行动的回应时,您始终必须接受其他玩家的本来面目,而不是您所认为的样子。
海马课堂专业课程辅导做出以下新改变啦:
⏩试听课全面升级,不满意退50%,
⏩课程辅导产品升级,赠送考前保障呦
⏩辅导不满意可以随心退!
海马课堂,4000+严选硕博学霸师资,针对学生的薄弱科目和学校教学进度,匹配背景相符的导师,根据学生情况进行1V1专属备课,上课时间灵活安排,中英双语详细讲解课程中的考点、 难点问题,并提供多方位的课后辅导,辅助学生掌握全部课程知识,补足短板。
阅读原文:https://www.highmarktutor.com/news/22850_62.html
版权作品,未经海马课堂 highmarktutor.com 书面授权,严禁转载,违者将被追究法律责任。
hmkt088