博弈论与伦理学 and ethics (Keith Hankins and Peter Vanderschraaf)

首次发布于 2021 年 9 月 27 日星期一

博弈论是研究相互依赖的选择和行动的学科。它包括战略决策的研究，分析理性主体的选择和决策如何依赖于（或应该受到）其他主体的选择，以及群体动态的研究，分析在各种情境下种群策略的分布如何演变以及这些分布如何影响个体互动的结果。它应与决策理论（研究主体在独立于其他主体的情境中进行选择）和社会选择理论（研究集体决策）区分开来。我们的重点将放在博弈论对伦理学和政治哲学的相关性上。要全面讨论博弈论及其与哲学其他领域的相关性，请参阅博弈论词条。

我们可以区分博弈论对伦理学的两种相关性。第一种是解释性的。博弈论工具可用于解释从（i）道德功能和（ii）我们道德实践的一般特征，到（iii）道德或政治上重要的社会问题的动态和（iv）特定道德规范的出现、存在和稳定性。博弈论对伦理学的第二种相关性是辩护性的。在这里，博弈论工具被用于辩护从（i）特定规范或原则，到（ii）大规模社会制度，或（iii）我们道德实践的一般特征。接下来，我们将考虑这些用途，包括前者如何补充后者。

1. 历史

约翰·冯·诺伊曼（John von Neumann）和奥斯卡·摩根斯特恩（Oskar Morgenstern）在他们的著作《博弈论与经济行为理论》（von Neumann & Morgenstern 1944）中奠定了古典博弈论的基础。在 20 世纪 50 年代，由众多理论家发表的一系列完善了的著作，尤其是约翰·纳什（John Nash）的著作，使博弈论在接下来的几十年里改变了社会科学。非合作博弈论，作为博弈论更基础的分支，探讨了情景，其中一个代理人的行动结果取决于其他代理人的行动，并且代理人缺乏强制协议的外部机制。更准确地说，它提供了一个模型，描述了满足某些理性标准的代理人在游戏中的互动，这些游戏由各个代理人可用的行动或策略以及他们可以实现的收益所特征化。在这种情景中，收益是由联合策略配置的产物，这些配置由各自代理人独立选择的行动和世界状态组成，反映了游戏的一些可变方面，而没有代理人能够控制。非合作博弈论中的许多情景可以通过从代理人对可能结果的排名构建的序数偏好进行有益分析。然而，冯·诺伊曼和摩根斯特恩还引入了一种利用代理人对彩票的偏好来更精确地描述收益的基数效用理论。利用这一框架，开发了更多种类的解决方案概念，以预测游戏的进行方式，并确定个体代理人何时使用最佳策略以及这对所有代理人的后果。

最广泛使用的解决方案概念之一是纳什均衡。基于贝叶斯理性标准，根据这一标准，一个人选择以最大化她的预期效用，纳什均衡是一组代理人采用的策略概况，在这个概况中，每个代理人采用的策略都最大化了她的相应回报，考虑到其他代理人采用的策略是概率独立的。换句话说，在纳什均衡中，每个代理人的策略都是对其他人策略的最佳响应，因此在其他人所做的情况下，没有人可以通过采取不同的行动来做得更好。尽管纳什不是第一个引入这个均衡概念的人，但只有在纳什完善了这个概念并证明了如果一个非合作博弈有有限数量的纯策略概况，那么至少会存在一个纳什均衡时，人们才意识到它的广泛适用性。在纳什的证明之前，人们广泛知道许多博弈缺乏纳什均衡的纯策略，即每个代理人通过采取她可用的行动来最优地响应其他每个代理人所做的事情。这最初限制了可以应用这个概念的问题类别，但纳什表明，在这种情况下，总会存在一个纳什均衡，其中每个代理人通过以一定概率从她可用的策略子集中选择来最优地响应其他代理人所做的事情。随后的完善进一步扩展了这个概念的实用性，其中尤其值得注意的是约翰·哈尔萨尼和莱因哈德·塞尔滕所做的工作（参见哈尔萨尼和塞尔滕 1988 年）。

除了在非合作博弈理论中完善解决方案概念的工作外，纳什还对合作博弈理论做出了重要贡献，这是一种建模战略互动的方法，通过允许代理人受到约束的约定的可能性来扩展事物。合作博弈理论提供了一套工具，用于分析与联盟建立相关的问题，以及在代理人可以依赖外部权威来执行协议的情境中出现的问题。纳什在这里的最重要贡献是引入了两种分析谈判问题的方法。这个问题在契约论方法中证明了道德和政治秩序的重要性，这是我们将在第 4 节中回顾的一个主题。

利用博弈论工具来模拟社会互动的第三种方法探讨了有限理性代理人如何通过归纳学习或焦点的存在来实现某些结果。这种方法的归纳学习方面被称为进化博弈论，因为归纳学习的早期工作大部分应用于为什么各种生物特征或行为模式会在特定种群中出现的问题。约翰·梅纳德·史密斯的《进化与博弈论》（1982 年）是这一传统中的早期经典著作，随后的工作由人类学家、经济学家和政治科学家进行，他们将这种方法应用于社会和政治哲学家感兴趣的问题，尤其是如何在大型群体中维持合作。尽管归纳学习的基础性工作大部分是由生物学家完成的，但焦点的早期工作大部分是由经济学家完成的，托马斯·谢林的《冲突的策略》（1960 年）尤其有影响力。粗略地说，焦点是行动或结果，可能是显著的（刘易斯 1969 年：35-36），因为它们在博弈中涉及的代理人中“突出”。正如谢林所示，这种点在策略空间较大和/或存在许多潜在均衡的博弈中尤为重要。

理查德·布雷思韦特（Richard Braithwaite）是第一位正式运用博弈论来分析伦理问题的专业哲学家。在他 1954 年的演讲《博弈论作为道德哲学家的工具》（1955 年出版）中，布雷思韦特使用纳什的讨价还价问题来论证对公平分配问题的特定解决方案。他还推测博弈论可能像统计学一样改变道德哲学，尽管这种转变并没有像其他社会科学那样在哲学领域发生。自布雷思韦特的演讲以来，博弈论在道德和政治哲学领域取得了重要进展。大卫·高缇尔（David Gauthier）的《协议道德》（1986 年）和肯·宾莫尔（Ken Binmore）的《博弈论与社会契约》（1994 年、1998 年两卷本）可以说是最早从博弈论基础出发建立系统道德理论的两部作品。高缇尔的理论根植于经典博弈论，尽管他对经典理论通常假设的贝叶斯理性解释提出了修正。而宾莫尔的理论则融合了进化博弈论和经典博弈论的元素。博弈论在伦理学中的其他重要应用包括但不限于：

分析社会惯例作为基于共同知识的博弈均衡（Lewis 1969; Vanderschraaf 2019）；
分析社会规范（Ullmann-Margalit 1977; Basu 2000; Bicchieri 2006, 2017; Brennan, Eriksson, Goodin & Southwood 2013）；
用进化博弈论解释社会契约要素的解释（Sugden 1986; Skyrms 1996）; 和
在替代社会契约理论中应用纳什的谈判理论（Gaus 2010; Muldoon 2016; Moehler 2018; Vanderschraaf 2019）。

此外，尽管与博弈论相关的正式框架直到 20 世纪中期才出现，但现在广泛认为许多早期哲学家的工作适合于博弈论分析，并且在许多情况下，这些作品显然预见了博弈论的重要发展。例如，Barry（1965），Gauthier（1969），Hampton（1986），Kavka（1986）和 Taylor（1987）提供了对霍布斯关于自然状态中战争不可避免性以及建立主权的好处的博弈论特征的描述。事实上，这一霍布斯学术分支仍在发展，正如 Vanderschraaf（2007 和 2010），Moehler（2009）和 Chung（2015）的最新作品所证明的。虽然霍布斯的论点吸引了博弈论学者最多的关注，但格罗提乌斯（1625），普芬多夫（1673），洛克（1689），休谟（1740）和卢梭（1755）在其对道德，自然状态和自然法的讨论中也提供了可以解释为非正式博弈论论证的内容。其中，休谟在《论人性》中对惯例的分析（休谟 1740：3.2.2–10）尤其值得注意，因为它对均衡的非正式描述以及相互知识在允许代理人达到和维持某些均衡中所起的作用进行了分析（Vanderschraaf 1998）。此外，休谟讨论了代理人如何通过渐进的试错过程定下惯例，并建议代理人遵循某些惯例是由于使某些替代方案显著的特性，这预见了基于归纳学习和焦点的游戏分析（Skyrms 1996; Sugden 1986）。

2. 道德的功能

在伦理学中，博弈论的最常见用途之一是假设道德的各种功能，并确定其一些重要特征。早期的一个例子是埃德娜·乌尔曼-马加利特（Edna Ullmann-Margalit）的《规范的出现》，该书认为道德可以被理解为一种规范系统，使代理人能够协调其行动，以实现在通常情况下自利的追求会阻止的互惠结果（Ullmann-Margalit 1977）。她用来说明这一点的现在经典的例子是涉及两名士兵必须选择是否操作迫击炮以阻止敌人的前进，或者逃跑。如果两人都留下，敌人的前进肯定会被阻止，但士兵们几乎肯定会受伤。如果两人都逃跑，敌人不仅能够通过山口，还能够追上并俘获逃跑的士兵。如果其中一人留下，而另一人逃跑，勇敢的士兵将死在试图阻止敌人的过程中，而另一个人将有足够的时间逃到安全地方。

乌尔曼-马加利特提出的情景是囚徒困境的一个例子，并在下面的图 1 中进行了说明。在这个战略形式的博弈中，每个士兵都在不观察对方行动的情况下行动。每个士兵可以选择逃跑（F）或留下（S）的策略。矩阵中的单元格对应于每对可能选择的结果，单元格中的数字代表了对士兵的效用。具体来说，较高的数字对应于更偏好的结果，第一个数字代表选择行对应的行动的士兵 1 的回报，而第二个数字代表选择列对应的行动的士兵 2 的回报。

士兵 2

S = 留下, F = 逃跑

图 1. Ullmann-Margalit 的迫击炮手困境

在这种情况下，每个士兵都有逃跑的理由。这是因为逃跑提供了唯一的逃脱无伤的机会，这是每个士兵最喜欢的结果。然而，这种情况是一个困境，因为如果每个士兵都采取这种行动，那么他们最终会比如果没有采取行动更糟糕。此外，这个困境被放大了，因为对于每个士兵来说，F 都是他对其他士兵可能选择的任何策略的最佳反应。也就是说，F 是每个士兵的严格优势策略，而(F,F)是这个博弈的唯一纳什均衡，尽管如果两个士兵能够以某种方式遵循(S,S)，他们都会表现得更好。

Ullmann-Margalit 指出，如果士兵们了解到他们所处的困境的本质，他们可能会想要采取一些措施来防止自己既逃跑又被俘。更重要的是，她认为困扰他们的囚徒困境在我们每天所处的无数互动中都会出现。乍一看，这些困境的明显解决方案似乎是士兵们简单地承诺留在他们的岗位上。然而，问题在于在这种情况下，承诺很可能不可信，并且即使它们是可信的，也容易被利用。相反，士兵们需要的是一种能够将他们与迫击炮紧密联系在一起的方式，无论是字面上还是比喻上。基于这一观察，Ullmann-Margalit 的建议是道德规范起到了这个作用。更具体地说，解决士兵们困境的不是承诺留在岗位上，而是他们对信守承诺和惩罚那些不信守承诺的人的承诺。

理解这种观点的一种方式是，道德的功能是防止理性的失败。在下一节中，我们将讨论博弈论如何被用来分析道德与务实理性之间的关系。然而，在最近的文献中，越来越多的共识是，社会道德规范的作用不一定是限制我们的工具性推理，以便我们能够克服务实理性的失败，而是将类似囚徒困境的混合动机博弈转化为协调问题，从而使互利的结果更加稳定和容易达成。这种方法的一个经典例子是 Bicchieri（2006）。与 Ullmann-Margalit 一样，Bicchieri 以我们对某些行动的承诺来描述规范，并且在这个背景下强调了制裁的重要性。然而，Bicchieri 在社会规范和其他类型的规范之间划分了一个区别，并认为区分前者和后者的是我们对它们的承诺的条件性。特别是，遵守社会规范的依据既包括个体对足够大比例的人口遵守规范的经验性期望，也包括个体对足够大比例的人口期望其他人遵守规范的规范性期望。只有当这两个期望都得到满足，个体才会遵守社会规范。然而，由于某些个体对他人的期望更加敏感，或者更倾向于希望看到特定规范得到遵守，相关的期望可能因个体而异。因此，只有当足够多的人的期望得到满足时，规范才能成功地将互利的结果不稳定的社会困境转化为更容易解决的协调问题。虽然乍一看似乎奇怪，暗示我们只有有条件地承诺的规范是社会道德的关键，但考虑到社会困境在阻止我们共同生活中的重要作用，这并不令人惊讶。有关这些问题的更详细讨论，请参阅社会规范的条目。

到目前为止，我们的讨论集中在博弈论如何被用来说明道德的一些明显功能以及社会规范在其中所起的作用。然而，博弈论也被用来确定可能重要的特定规范，以及确定规范的重要特征。而且，在先前的分析中主要依赖非合作博弈论的工具，而在这里，进化博弈论尤其具有启发性。在这方面特别有影响力的是罗伯特·阿克塞尔罗德及其同事在 20 世纪 80 年代初关于合作演化的工作，以及罗伯特·博伊德、彼得·里切森和其他合作者的后续工作（有关相关工作的摘要，请参阅 Axelrod 2006 和 Boyd＆Richerson 2005）。通过分析在重复的社会困境中各种固定策略的表现，他们能够说明有条件策略和对不良行为进行制裁的意愿在使合作和其他亲社会行为不仅能够出现，而且从个体的角度来看，还能够成为最优选择中的重要角色。更具体地说，他们表明，在个体在长期内有兴趣实现互利结果，但在短期内有兴趣利用他人以获取最大利益的环境中，重要的是（i）个体不使自己容易受到反复利用，以及（ii）至少有一些个体愿意惩罚剥削行为。

对于阿克塞罗德（Axelrod）来说，他主要在重复囚徒困境的背景下研究这些问题，上述两个要求实际上是一回事。无条件合作的策略允许个体反复受到利用。为了防止这种情况发生，她应该只与那些同样愿意合作的人合作。更准确地说，她应该友善（也就是说，她最初应该愿意与任何人合作），但她也应该是可挑衅的（也就是说，她应该准备停止与任何利用她的人合作，至少一段时间）。而且，因为持续的合作符合每个人的长期利益，在这种情况下，因为被利用而撤回未来的合作是一种惩罚形式。

然而，正如博伊德（Boyd）和里奇森（Richerson）所表明的，在许多情况下，每个人都愿意惩罚不良行为并不是必要的。必要的是有足够的个体愿意这样做。然而，这带来了一对难题。首先，在许多情况下，随附规范是有成本的。为了维持合作，团体通常需要一些成员愿意进行利他性惩罚。也就是说，一些个体需要愿意为了他人的利益而承担与惩罚相关的个人成本。其次，一些个体愿意随附规范不仅仅允许合作和其他亲社会规范的演化。相反，它潜在地允许任何规范出现并变得稳定。因此，尽管我们已经看到博弈论如何帮助解释为什么遵守和随附某些规范的性情可能是道德的重要特征，但关于这是否从个体的角度来看是必然合理的重要问题仍然存在。我们现在将转向这些问题。在第 5 节中，我们将回到如何区分好的规范和坏的规范的问题。

3. 调和道德与谨慎的理性

Kavka (1984) 将试图证明遵守道德要求是被要求的，或者至少与审慎的理性相容的一系列努力称为和解项目。至少自柏拉图以来，哲学家们一直在努力解决这个项目，而博弈论可以帮助我们区分他们所采取的三种方法。

霍布斯在《利维坦》中（霍布斯 1651 年：第 15 章）所提出的挑战很好地描述了和解项目中所涉及的核心问题。愚者认为，在某些情况下，一个人“最合理”的行动是犯下不义。具体来说，愚者声称，有时候，如果其他缔约方已经遵守（或将被迫遵守）他们的承诺，一个人应该违背她作为契约的一部分所做的承诺。这是因为履行契约可能是代价高昂的，而理性合理地要求，如果一个人不会因此获得进一步的利益，那么应该避免这些成本。这一挑战在下图 2 的决策树中有所体现。

图 2. 愚者的机会博弈【有关图 2 的详细描述请参见附录。】

这里，Claudia 和 Laura 通过交换承诺创建了双边契约。但是因为 Claudia 已经履行了她的契约，而 Laura 知道这一点，Laura 站在了愚者的位置，她可以选择履行（P）她的契约要求，也可以通过违背她的承诺并利用 Claudia 先前的表现来进行侵略（A）。正如愚者所主张的那样，在这种收益结构下，A 是 Laura 唯一的贝叶斯理性选择。

但是，值得注意的是，愚者并不仅仅是对那些支持她推理的人提出挑战。这是因为为了避免被像愚者那样推理的个体利用，那些本来可能倾向于遵守承诺的个体有时会发现自己有理由违背他们的承诺。我们可以从下面的图 3 中看到这一点，图 3 描述了从图 2 中扩展决策树以包括 Claudia 的初始举动所导致的顺序囚徒困境。

图 3. 顺序囚徒困境【图 3 的扩展描述在附录中。】

在这个广泛形式的博弈中，明确了代理人行动的顺序，每个收益向量的第 i 个分量是在游戏中移动的第 i 个代理人的收益（因此，克劳迪娅的收益首先被描述，因为她首先行动）。在这里，我们可以假设克劳迪娅不同意弗尔认为如果一个人的契约伙伴遵守了诺言，那么她应该违背自己的诺言，但是如果克劳迪娅怀疑劳拉可能同意弗尔的观点，那么仍然会出现困境。这是因为克劳迪娅可能会推理，如果她行动，那么劳拉已经受益，不会再获得任何进一步的利益，因此不会回报。因此，克劳迪娅预期（A）劳拉的侵略，决定不行动，导致劳拉现在理解地也不行动，以至于最终每个人都比如果他们都行动要糟糕。

参与和解项目意味着支持霍布斯的观点，即弗尔是错误的，我们不需要担心我们中的一些人的理性可能会建议不按照道德要求行事。正如我们上面所指出的，有三种主要策略来做到这一点。

3.1 不可分割的商品策略

不可分割的商品策略吸引了人们对通过道德行为才能获得或保留的某些好处的关注，而这正是愚者显然未能考虑到的。柏拉图在《哥吉亚斯》和《理想国》中对正义的好处的描述就是这种方法的一个例子。柏拉图认为，如果一个人犯了不义之事，那么他的灵魂就会受到腐蚀，而且他进一步认为，拥有腐蚀的灵魂是所有可能的不幸中最糟糕的（哥吉亚斯 478c3–478e5，理想国 353d3–354a7）。或者，一个人可以追随阿奎那斯的观点，认为像偷窃这样的不义之事是一种会在来世带来可怕后果的致命罪（阿奎那斯 1271: II.II Q. 66 A. 6）。或者，像西奇威克一样，他强调了一个人由于其不道德行为而可能遭受的内在责任制裁（西奇威克 1874 [2011: 164]）。通过博弈论的视角来看，不可分割的商品方法建议那些怀疑道德行为是否符合审慎理性的人应该重新评估他们的偏好，考虑到所涉及的全部商品。例如，下面的图 4 说明了如果劳拉被说服她违背与克劳迪娅的契约会导致她承受成本 γ>1，也许是因为她可能会因犯下不义之事而感到内疚，那么图 3 中描述的情景将会发生变化。

图 4. 修订后的顺序交换博弈，[图 4 的详细描述在附录中。]

这个广义形式博弈描述了劳拉的真实回报，包括西奇威克所称的内在制裁成本。在这个博弈中，如果克劳迪娅按照承诺行事，那么遵循 P 作为正义所要求的现在是劳拉的最佳反应。然而，这并不是因为我们简单地假设一个人永远不可能通过违背承诺而获益。要理解为什么，注意到如果克劳迪娅先违背了她的承诺，那么 A 仍然是劳拉的最佳反应。正如我们在讨论合作的演变时所看到的，道德不能要求我们成为傻瓜。或者用卡夫卡的有益术语来说，正义可能禁止通过意外违背契约来违反契约，同时允许防御性违反那些他人不再能合理期望我们遵守的契约（卡夫卡 1986: 139）。因此，如果克劳迪娅通过追随 A 来进攻性地违反了她与劳拉的契约，那么如果劳拉以牙还牙，劳拉的违反不应该引起与犯下不义之事相关的内在制裁。此外，注意到即使这些内在制裁并非普遍感受到，它们的存在也可以改变事情。例如，即使克劳迪娅本人对于进攻性违反他们契约会感到微不足道的内疚，如果克劳迪娅知道劳拉会因进攻性违反而承受成本 γ>1 的内在制裁，那么克劳迪娅可以期望劳拉在她这样做时也会表现出同样的行为，而在这种情况下，她最好一开始就遵循 P。

3.2 社会制裁策略

先前对和解项目的方法依赖于代理人对自己施加的制裁，而社会制裁策略则依赖于他人施加的成本。这一策略以霍布斯对愚者的回应和休谟对收获困境的讨论为例，后者被 Skyrms（1998）和 Sobel（2009）认定为之前图 2 中所描述的博弈。霍布斯认为，主动违反契约意味着做出一种趋向于自我毁灭的选择，因为其他人将不愿意与已知会这样做的人进入未来的契约（霍布斯 1651: 15:5）。同样，休谟认为，我们许下承诺是为了创造对我们未来行为的期望，并且我们遵守承诺是为了保持他人的信任，如果我们希望进入并从未来的契约中获益，这种信任是必需的（休谟 1740: 3.3.5: 8–12）。正如我们之前对合作演化的讨论所预期的那样，我们可以使用重复博弈理论来阐明这一策略。

当代理人参与一系列可以被描述为单个非合作博弈的互动时，他们可以采用依赖历史的策略，其中他们在游戏的任何特定迭代中的行动取决于先前迭代中采取的行动。早期，博弈论者意识到，当代理人参与无限重复的游戏时，他们可以使用这种策略来得出包括在任何被重复的组成游戏的均衡中从未出现的行为的均衡。这一观点导致了一系列被称为民间定理的结果，这些结果建立了一系列条件，使得历史依赖策略的配置成为无限重复博弈的均衡。Sugden（1986）和 Skyrms（1998）是最早主张霍布斯对愚者和休谟对承诺分析的原始民间定理论证的人之一。

为了说明民间定理如何支持社会制裁策略，假设劳拉和克劳迪娅有兴趣互相交换，并且他们的情况具有下图所示的囚徒困境结构。

| | | 第 2 方（劳拉） | | --- | --- | --- | --- |

P = 执行, A = 预测

图 5. 囚徒困境

这个囚徒困境在结构上与图 1 中的迫击炮手困境完全相同，但在这里我们对各方的策略进行了不同的解释。(A, A)是描述劳拉和克劳迪亚彼此特定互动的这个博弈的唯一均衡。然而，如果我们假设它们的互动是一系列相似互动的无限序列，它们将与彼此和其他社区成员进行互动，那么它们可以采用历史依赖策略。 Sugden（1986）制定的一种策略是_人类策略_：

h∗: 如果我的当前伙伴是无辜的，则遵循_P_，如果她有罪，则遵循_A_，

如果在过去的某个时刻，她通过预测或侵犯无辜伙伴来进攻违反契约，那么她就是有罪的，否则她就是无辜的。如果克劳迪亚预期在无限重复的囚徒困境中的所有伙伴都遵循 h∗，那么 h∗ 可以成为克劳迪亚的最佳应对。例如，如果克劳迪亚和劳拉在囚徒困境中相遇时都是无辜的，那么如果克劳迪亚遵循 h∗，她将保持无辜，并且她可以期望未来的合作伙伴也会与她一起行动，因为他们也遵循 h∗。另一方面，如果克劳迪亚对劳拉进行预测，那么克劳迪亚就会成为有罪的，她应该期望未来的伙伴在未来的重复中也对她进行预测，因为 h∗ 要求如此。换句话说，如果克劳迪亚非常期待迭代的囚徒困境序列将继续下去，那么通过侵犯与劳拉的契约所获得的短期利益将被 h∗ 产生的未来互惠互利互动的长期回报所淹没，而预测则将阻止这种情况发生。此外，保持声誉的长期利益意味着，只要克劳迪亚的贴现率不是太高，即使她误读了与劳拉的情况并被她利用，这也可能是正确的。最后，因为他们的情况是对称的，只要他们都期望大多数其他社区成员遵循 h∗，那么 h∗ 对于劳拉和所有其他社区成员来说都可以成为最佳应对。上面的讨论表明，遵守公正要求，不去攻击违反契约可能是理性的，即使在任何特定情况下可能看起来不理性。就像不可分割的商品策略一样，社会制裁策略意味着愚者犯的错误是误解了表征道德对我们提出要求的社会互动的游戏。然而，不可分割的商品策略暗示着愚者忽视了道德行为固有的一些商品，社会制裁策略警告愚者应关注的游戏不是任何特定的互动，而是他们不可避免地参与的无限重复的社会互动系列。也就是说，每个代理人采用 h∗ 的策略配置并不是无限重复囚徒困境的唯一可能均衡。事实上，这样的游戏有许多可能的均衡，其中许多不涉及任何个体采用 h∗ 策略，而且其中并非所有均能导致所有（甚至大多数）代理人遵守他们的承诺的合作结果。

3.3 改革的决策理论策略

与不可分割的商品和社会制裁策略相反，这种策略质疑愚者对道德和理性之间的紧张关系产生的情景的描述，改革的决策理论策略建议像愚者这样的代理人重新审视他们对理性选择的理解。特别是，它提出了一个比正统的贝叶斯解释更微妙的理性选择解释，根据这一解释，理性选择是一个相当直接的最大化预期效用的问题。大卫·高缇尔（1986 年）和爱德华·麦克莱南（1990 年）是这一方法最著名的典范，高缇尔提出了受限最大化原则，麦克莱南提出了坚决选择原则。为了便于阐述，我们将重点放在高缇尔身上。

在《道德协议》中，戈缔尔区分了直接最大化者和受限最大化者。直接最大化者是一个正统的贝叶斯人，在任何特定时刻，根据她对相关事态和她的对手可能做出的选择的信念，选择以最大化她的预期效用。受限最大化者则通过尽自己的一份力来实现一个公平和最优结果，如果（i）她期望她的对手也尽自己的一份力来实现这个结果，和（ii）她因此受益。因此，受限最大化者在某些时候限制了她的利益追求，但如果她期望她的对手会像直接最大化者一样行事，或者如果她不会因限制自己的行为而受益相对于没有人限制行为的情况下，她会恢复到直接最大化。

例如，如果克劳迪娅是一个受限最大化者，那么在图 5 所示的囚徒困境中，如果她相信劳拉也是一个受限最大化者，她会合作，但如果她相信劳拉是一个直接最大化者，她会背叛。理解受限最大化如何修改代理人的行为的一种方式是将采用自己的理性原则视为参与类似囚徒困境的游戏的元策略。如果克劳迪娅和劳拉每个人都采用直接最大化者（SM）或受限最大化者（CM）的元策略，那么图 5 所示的囚徒困境就会转变成下面图 6 所示的游戏。

| | | Party 2 (Laura) | | --- | --- | --- | --- |

CM= 受限最大化, SM = 直接最大化

图 6.《囚徒困境》元策略博弈

在这里，无论对方采取什么策略，通过遵循 CM 而不是 SM，一个人总是至少能够做得和有时更好。也就是说，CM 对克劳迪娅和劳拉来说是一个弱支配策略，而（CM，CM）是唯一的帕累托最优纳什均衡。戈蒂埃认为，在许多社会困境中，受限制的最大化者至少和直接最大化者一样好，而且通常情况下能够更好，只要代理人对受限制或直接最大化的倾向对彼此足够清晰。因此，戈蒂埃得出结论，代理人应该采用受限制最大化原则，并且当他们这样做时，对道德要求的遵守与理性选择相一致。

3.4 和解项目的局限性

正如我们所看到的，博弈论已被纳入到和解项目的主要方法中。然而，博弈论分析也可以表明为什么这些策略可能无法完全调和道德与谨慎的理性。例如，要使不可分割的善策略有效，像愚者这样的行动者必须被说服，正义行为所固有的善是如此重要，或者不公正所带来的代价如此巨大，以至于冒险行事不公正是愚蠢的。但很明显，这并不总是（甚至通常也不是）真实的。

同样，尽管可以向像愚者这样的行动者提出社会制裁道德行为的论据，但这些论据取决于社会成员是否愿意制裁不良行为并且能够有效地这样做，这并不是毫无保证的。事实上，这是规范的功能分析明显预见到的困难。例如，除了强调条件策略和愿意制裁不良行为的重要性外，阿克塞罗德（1984）还强调了采用易于他人解释的策略的重要性。比奇埃里（2006）强调了在不清楚哪个规范适用的情况下可能出现的问题，而博伊德和里奇森（2005）则注意到了随附规范所带来的代价。因此，愚者可以反对说，即使她所在社区的所有成员都致力于尽其所能地遵循类似于休谟策略，很明显他们可能无法可靠地遵循它。事实上，休谟策略依赖于一些相当苛刻的认识假设，尤其是社区成员能够可靠地区分有罪和无辜的伙伴，这在社区规模增大时可能变得越来越不太可能。

此外，正如民间定理所暗示的那样，尽管社区的所有成员在像愚者所处的情况下可能都遵循类似于 h∗ 的策略，但也可能存在许多其他均衡。此外，其中一些均衡可能很难相互区分，特别是如果像愚者这样的行动者非常罕见，并且在其中一些均衡中，对于愚者来说，进攻性地违反契约可能符合其利益。因此，社会制裁策略的有效性明显取决于社区成员建立和维护可靠声誉的能力，并依赖这些信息在彼此的互动中。

最后，高希耶和麦克莱南提出的改革决策理论策略的修订原则，依赖于代理人能够采取一种有条件地遵循某些亲社会策略的能力，无论这样做是否符合代理人在行动时的最佳利益。然而，批评者对这一策略提出了质疑，质疑将自己约束于过去承诺的含义是什么，他们还指出了许多情况，在这些情况下这样做既不符合代理人的短期利益也不符合长期利益。此外，虽然高希耶对受限最大化的好处的分析在某些方面类似于 Bicchieri 对社会规范如何将混合动机社会困境转化为协调博弈的分析，但后者依赖于制裁（或对制裁的期望），而前者则不依赖于制裁。因此，即使代理人可以可靠地采取约束其未来行为的倾向，对于像受限最大化这样的规则来发挥其实际作用，代理人必须能够识别谁已经采取了相关的倾向。然而，一些批评者怀疑我们能否可靠地识别谁采取了这些倾向。当然，改革决策理论策略的支持者们对这些批评有充分的认识，并在他们的著作中做出了仔细的回应。然而，迄今为止，批评者并未被安抚，改革决策理论策略在这里描述的方法中是最不具影响力的。

4. 博弈论和契约论

可以说，在道德和政治哲学中，对契约论进行道德或政治秩序的正当化的最系统的运用是博弈论。哲学家们通常将社会契约描述为调节社区成员互动的一组规则。通过提供一个互动决策的形式模型，博弈论显然与这些契约的分析相关。然而，博弈论对社会契约的分析尤其独特的是对谈判问题的强调。正如我们将在下文讨论的那样，纳什谈判问题提供了一个简单而灵活、概念上强大的框架，用于确定契约中可能包括的规则中哪些可以说是对社区的每个成员都是互惠的（或可接受的）。在接下来的两个小节的正文中，我们试图对这一框架进行相对非技术性的概述。在这些讨论中，我们已经在各自小节的末尾包含了这些讨论的笔记，这些讨论中形式化概念的重要性，或者对一些读者来说可能是启发性的技术问题的讨论。有关对道德和政治秩序进行正当化的契约论方法的更彻底的分析，包括对一些这些技术问题的进一步讨论，请参阅有关当代社会契约方法的条目。

4.1 博弈论中的讨价还价问题

正如 Gauthier (1986)所指出的，讨价还价问题为社会契约的契约分析提供了一个框架，通过对部分利益冲突的各方如何达成一个双方都能接受的规则集来模拟，以便各方都能从中获益。这与 Harsanyi (1953, 1955, 1977)、Rawls (1958, 1971)和 Scanlon (1982, 1998)的契约主义方法形成对比，后者将社会契约描述为在旨在确保选择适当无偏见的约束条件下进行的理性选择的对象，并且原则上可以由单个代理人进行。Braithwaite (1955)首次使用 Nash 讨价还价问题来推导社会契约，即在他的案例中公平地分配资源给两个申索人的规则。随后，Hampton (1986)和 Kavka (1986)认为，通过设计创建共和国的 Hobbesian 设备包含了 Nash 讨价还价问题的元素。Gauthier (1986)和 Binmore (1994, 1998)使用 Nash 讨价还价问题来发展独立的分配正义理论。最近，Muldoon (2016)和 Moehler (2018)使用 Nash 讨价还价问题来模拟深度多元化社会成员如何找到和平共处的规则问题。

Nash 将讨价还价问题描述为（i）一组代理人可能实现的收益的可行集合，每个收益与代理人必须共同同意遵循的一组行动相关联，以及（ii）一个非协议点，指定了如果他们未能遵循任何这些共同行动集合时，每个代理人将获得的内容。Nash 讨价还价问题的一个例子是下图 7 中描述的 2 代理人葡萄酒问题。

| | | 代理人 2 (Laura) | | --- | --- | --- | --- |

D= dove (claim none), H = hawk (claim all)

图 7. 酒问题

在这个游戏中，Claudia 和 Laura 各自有两种纯策略：鹰（H），即要求一瓶可用的葡萄酒，或者鸽子（D），即把葡萄酒留给对方。游戏在纯策略中有两个纳什均衡：（H，D），对 Claudia 最有利的结果，和（D，H），对 Laura 最有利的结果。如果两人都试图要求葡萄酒，导致（H，H）的结果，他们会争斗，都得不到葡萄酒，这对他们来说是最糟糕的结果。葡萄酒问题是冲突协调游戏的一个例子（Vanderschraaf & Richards 1997），因为它有多个均衡，任何一个均衡都只能通过协调他们的行动来实现，而协调受到代理人对不同可用均衡的冲突偏好的复杂影响。[ 1]

有人可能会认为葡萄酒问题的一个自然解决方案是 Claudia 和 Laura 各自要求葡萄酒的一半。因此，下面的图 8 展示了葡萄酒问题的扩展版本，其中每个代理现在都有第三种纯策略 M，她要求一半的葡萄酒。

| | | 代理人 2（Laura） | | --- | --- | --- | --- | --- |

D = dove (claim none), M = moderate (claim half), H = hawk (claim all)

图 8. 扩展的葡萄酒问题

在这个游戏中，Laura 和 Claudia 如果她们的要求是兼容的，即如果有足够的酒来满足每个要求，她们将收到她们所要求的酒的数量。然而，如果她们的要求是不兼容的，她们就会打架。现在在纯策略中有一个新的纳什均衡，(M,M)，在那里 Laura 和 Claudia 每人收到一半的酒。尽管他们将会达成(M,M)并不是一个必然的结论，因为(H,D)和(D,H)仍然是均衡状态，前者继续是 Claudia 最喜欢的，后者是 Laura 最喜欢的。

此外，如果每个人都可以要求一半的酒，那么为什么他们不能要求其他份额呢？下面的图 9 总结了 Claudia 可以要求任何份额 x1 的酒，Laura 同样可以要求任何份额 x2 时出现的谈判问题。

图 9. 酒的谈判问题【图 9 的详细描述在附录中。】

这里克劳迪娅的收益在水平轴上描述，劳拉的收益在垂直轴上描述。绿色阴影区域代表了劳拉和克劳迪娅可以提出兼容要求的收益向量 Λ 的可行集，即 x1+x2≤1 的地方。而收益向量 u0=(−1,−1)对应于(H,H)结果，代表了他们的不同意点。

在社会契约的背景下，我们可以将不同意点 u0 看作代表自然状态，将可行集 Λ 看作各方可能同意的各种契约的代表。Λ 中每个弱帕累托优于 u0 的点 u 因此表征了一个具有合作剩余的社会契约（高希耶，1986: 141）。[ 2] 当一组要求构成了相关协商问题的均衡解时，这使我们能够说契约各方有充分理由遵守其条款。然而，正如我们将在下文看到的，从规范角度来看，有各种方法来确定最有吸引力的均衡。那么，使用纳什协商方法对社会契约进行建模的一个优势是，这种形式化有助于澄清这些方法之间的差异。[ 3]

布雷思韦特在他的剑桥讲座中分析的基础博弈非常适合说明协商问题的公理方法。在这个游戏中，两个代理人卢克和马修争夺有限资源的份额。与葡萄酒问题一样，布雷思韦特基础博弈是一个冲突协调游戏，每个代理人都有两种纯策略可用，H 代表代理人要求所有的利益，D 代表他不要求任何。在这里，(H,D)是对卢克最有利的纳什均衡，(D,H)是对马修最有利的均衡。然而，正如图 10 所示，这个游戏具有葡萄酒问题中不存在的不对称性。[ 4]

| | | 代理人 2 (Matthew) | | --- | --- | --- | --- |

D= 鸽子（宣称无），H = 鹰（宣称所有）

图 10. 布雷思韦特基础博弈

再次，与之前一样，这个博弈可以扩展以适应代理人可以宣称对商品的份额的情况。如果非协议点再次导致由冲突结果（H，H）产生的收益（如布雷思韦特所假设的），那么马修和卢克就处于一个具有可行集 Λ 和非协议点 u0=(0,19)的纳什谈判问题中。图 11 描述了这样一个博弈的可行集 Λ（再次用绿色阴影标出）。不过，这次，图中还标识了与三种解决方案概念相关的收益向量，这些解决方案概念在社会契约的博弈理论分析中尤为有影响力（即纳什、比例和最小最大比例收益解决方案）。

图 11. Braithwaite 博弈论问题[图 11 的详细描述在附录中。]

这里，Luke 的收益在水平轴上表示，而 Matthew 的收益在垂直轴上表示。正如我们所看到的，尽管解决方案不同，但每个解决方案都使 Matthew 的收益高于 Luke 的收益。这是因为每个解决方案都分配给 Matthew 更大的份额[5]，这是由 Braithwaite 问题中特征化的非协议点的不对称性所导致的。具体而言，(H, H)是 Luke 的最坏结果，但不是 Matthew 的最坏结果，所以 Matthew 具有威胁优势。简单来说，因为对 Matthew 来说不达成协议不那么糟糕，他可以利用不达成协议的威胁来争取对他更有利的协议。这种不对称性区分了 Braithwaite 博弈论问题和图 9 中所示的 Wine Division 问题，其中三个解决方案与点 u∗=(12,12)重合，其中涉及的代理人每个人都获得相等的份额。

在他自己的分析中，Braithwaite 偏爱选择与协议点相对于非协议点的收益按比例分配的解决方案，该比例与某个独立指定的公平收益度量成比例[6]。另一方面，Gauthier（1986, 2013）则支持最大最小比例收益解决方案，该方案也通过比较代理人相对于非协议点的收益来选择 Pareto 边界上的一个点，但此外还考虑了代理人相对于他们理想收益的表现[7]。然而，在博弈论文献中，纳什解决方案仍然是最广泛使用的解决方案概念，这在提供社会契约的博弈论处理方面的哲学家中也是如此（参见，例如，Binmore 1994, 1998; Muldoon 2016）。粗略地说，这个解决方案选择最大化合作剩余的点，尽管一些哲学家对这个概念提出了细化，以确保收益也满足最低阈值（Moehler 2018）[8]。

运用博弈论对社会契约进行辩论的核心问题是上述每个解决方案概念，实际上任何解决协商问题的方案，可能满足一些但不是所有我们希望公平协商程序实现的直观合理约束。例如，Nash 的解决方案是唯一满足以下四个约束的解决方案概念：

Pareto 最优性，
对称性，
规模（或效用）不变性，和
重新应用稳定性。[9]

但它未能同时满足：

个体单调性，以及
群体单调性。

在这个背景下，一个结果（或其相关的收益向量）是帕累托最优的，如果没有其他结果对某些代理人更好而对其他代理人更差。[10] 如果一个解是对称的，那么当代理人具有相等的效用函数、非协议点和策略时，他们从相同份额的商品中获得的收益是等价的。[11] 如果解不依赖于收益如何表示，那么它是尺度不变的。[12] 如果将解的概念应用于一个谈判问题不会在代理人子集之间产生关于相对份额的下游谈判问题，那么它是再应用稳定的。[13] 当一个解在谈判问题通过扩大可行解集合以包括对代理人更有利的新结果时，一个代理人保证至少能做得一样好，那么它是个体单调的。如果对于给定的索赔人集合，没有人损失而其他人仅仅因为一些集合成员离开和/或新的索赔人到来而获得收益，那么它是群体单调的。

相反，最大最小比例增益解决方案在个体和人口上是单调的，但不是可重新应用的。而比例解决方案在个体上是单调的，在人口上是单调的，并且是可重新应用的，但不是尺度不变的。最终，就像阿罗不可能定理和相关结果一样，对于是否存在最佳程序来聚合偏好或做出集体决策，存在疑问，对于博弈问题的单一解决方案概念也没有清晰的最佳选择。也就是说，将博弈理论应用于社会契约的哲学分析在某种程度上是有用的，因为它提供了一个框架，用于说明理论家认为社会契约的哪些特征是有价值的，并且用于确定与这些特征相关的权衡是什么。例如，一个人可能推测，纳什和比例解决方案概念所关联的可重新应用稳定性属性将使基于其中之一的社会契约更适合在面对社会变革时阻止冲突。这是因为这样的契约将在未来合作利益发生变化时是不可重新谈判的，例如，由于社会中新成员的涌入或者资源开发的新技术的发现所导致的。但这种稳定性将不得不以使用代理人收益的特权表示，或者接受这样的契约的各方不一定会因为他们有更多的谈判而变得更好这样的代价。而且，尽管这种权衡可能是合理的，但重要的是任何契约理论家所做的权衡都将使她对一定的规范判断做出承诺，而博弈论可以帮助澄清这些判断。例如，许多博弈论倾向的哲学家认为，任何偏向于某些代理人效用表示的解释都无法避免将某些道德判断纳入这些效用中（Sen 1980; Moehler 2018）。

4.2 进化社会契约方法

在专注于博弈理论在哲学分析社会契约中的应用之后，我们现在将简要关注进化博弈论对这一任务的相关性。请记住，进化博弈论是对建模的正式方法，用于描述特征在人口中的分布如何随时间演变，当这些特征决定了拥有它们的代理人将如何相互作用。Gaus（2010）和 Muldoon（2016）是两部最近的作品，它们利用非正式的进化模型来展示社会契约的条款如何随时间演变以适应多样化的政体。而采取更正式的方法，Alexander（2007）探讨了社交网络中表征亲社会规范的均衡如何随时间演变。然而，Brian Skyrms（1996 [2014]，2004）的作品对将进化博弈论应用于社会契约产生了最大的影响。

Skyrms 的进化博弈论的一个标志性用途之一是解释各种“公平”解决纳什议价问题的起源（1996 [2014]：第 1 章）。正如我们前面所看到的，不同的公理解决概念可能会推荐对同一议价问题的不同解决方案。然而，即使一个人支持某个解决概念的论点，这也并不意味着实际的申请人在进行议价问题时会倾向于遵循这个解决方案。这是因为典型的议价问题通常会有大量的均衡，每个均衡可能对某些人更有利，对其他人更不利。因此，人们可能会怀疑实际的申请人能否达成任何均衡，更不用说我们认为公平的结果所特征的均衡了。

为了解决这个问题，Skyrms 考虑了一个简单但非平凡的 3 件式纳什需求博弈，它在结构上类似于图 8 的扩展葡萄酒问题。在这个现在熟悉的游戏中，一对代理商争夺一件商品的份额。每个人提出一个要求，并在双方的要求兼容时获得与其要求等值的回报，在他们的要求不兼容时则什么都不得到。在 Skyrms 的版本中，申请人可以提出最小要求 D，获得商品的 1/3 份额；提出最大要求 H，获得商品的 2/3 份额；或者提出“中间”要求 M，获得其中 1/2 份额。正如 Skyrms 指出的（1996 [2014]：4），在这类游戏中，我们倾向于认为有一个结果是申请人应该遵循的，即，公平的结果，即每个人要求所争夺的商品的一半。这对应于双方都遵循 M 的情况，正如我们前面看到的，（M，M）是游戏的一个均衡。但问题仍然是，为什么申请人会选择公平的结果，当存在其他可能更可取的均衡时呢？

对这个问题的一个答案是，当代理商不断地需要就商品的分配与其他代理商达成协议，但只有在他们就可行的分配达成一致意见时才能获得商品的份额时，克制自己不提出最大要求的代理商更有可能遇到其他可以进行可行交易的代理商。换句话说，正如我们在第 2 节中稍微不同的情境中看到的那样，从长远来看，成功与志同道合的代理商达成协议所带来的好处，要大于偶尔通过追求不那么公平的分配而获得的放弃的收益。Skyrms 通过将进化的动态模型——复制动态应用到他的纳什需求博弈中来测试这一理由。图 12 说明了一个可以用来总结这一动态的单纯形。

图 12. Skyrms 纳什需求博弈的策略单纯形[图 12 的扩展描述在附录中。]

单纯形中的每个点对应于人口中代理类型的特定混合，可以用有序三元组(z1,z2,z3)表示，其中 z1 是遵循 D 策略的人口比例，z2 是遵循 M 策略的人口比例，z3 是遵循 H 策略的人口比例。因此，靠近单纯形顶点的点表示更多代理遵循与该顶点相关联的策略的混合。复制动态然后总结了人口状态的演变，其中代表策略的比例随时间按其平均生殖适应度的比例变化。这里，策略的平均生殖适应度对应于其相对于给定时间人口中其他策略的平均收益的平均收益。[15] 举例说明，在图 12 中，点 z0=(16,13,12)表示初始状态，其中 16 人口遵循 D，13 人口遵循 M，12 人口遵循 H。在这个起点上，复制动态然后跟踪从 z0 开始的轨道，收敛到 e2=(0,1,0)，整个人口遵循纯策略 M 的顶点。

通过在图 12 单纯形中的广泛初始状态应用复制动态，Skyrms 随后表明公平结果 e2，即每个人都提出平等要求，最有可能演变。我们在这里复制 Skyrms 的实验。图 13 描述了从图 12 单纯形中随机选择的初始人口状态开始的 200 个复制动态轨道。

图 13. Skyrms 的纳什需求博弈的复制动态轨道【图 13 的扩展描述在附录中。】

正如这幅图所说明的，大多数原告类型的初始分布最终会收敛到一个平衡状态，所有代理人都遵循 M 并提出 1/2 的索赔。用一个技术术语来说，我们可以说 e2 具有最大的吸引盆地。[16]要看到这种情况为什么会发生，我们可以考虑当一个群体的代理人随机相遇并参与纳什需求博弈时，不同的纯策略类型会有怎样的表现。提出 D 索赔的代理人总是能够达成可行的交易，但在特定的互动中，他们的表现永远不如提出 M 或 H 索赔的伙伴。另一方面，提出 H 索赔的代理人只有在与提出最低索赔 D 的代理人匹配时才能达成可行的交易，因此可以被利用。与此同时，提出 M 索赔的代理人在与提出 D 的伙伴或其他提出 M 的伙伴匹配时能够达成可行的交易。因此，平均而言，M 的追随者比 D 的追随者和 H 的追随者做得更好，除非在人口中有很多 H 的追随者和很少的 M 的追随者，以至于在个体相遇时，M 的追随者更有可能遇到 H 的追随者，而不是另一个 M 的追随者或 D 的追随者。[17]事实上，M 是这个博弈的进化稳定策略（Maynard Smith 1982）。这意味着，如果 e2 是当前的人口状态，M 是唯一的现有策略，那么 e2 可以击退任何对一些不同突变策略的有限入侵。[18]

在某些方面，Skyrms 的观察显示了 Gauthier 对受限最大化的论证可能如何通过利用理性选择理论之外的资源而得到加强。事实上，Skyrms 表明，在代理人更有可能与他们自己的策略类型的代理人互动时，公平均衡的吸引盆地扩大，就像他们有能力识别与自己相似的代理人一样。例如，图 14 描述了 Skyrms 用来模拟这种情况的一系列相关复制动态的轨道。在这种动态中，一个代理人以比普通复制动态的随机概率高出 0.2 的概率遇到相同纯策略类型的对应者。[19]正如我们所看到的，即使在这种相同类型互动的可能性相对较小的情况下，所有修改后的复制动态轨道现在都收敛到 e2。[20]

图 14. Skyrms 纳什需求博弈的相关复制动态轨道【图 14 的扩展描述在附录中。】

另外，Skyrms 还展示了如何演化的对特定地方或物品的依恋，更重要的是信号这些依恋的能力，可以帮助解决像纳什需求博弈这样的冲突协调问题。特别是，Skyrms（1996 [2014]：第 4 章）表明，通过发展对财产权的原始概念，参与这类博弈的代理人可以通过在家中扮演鹰，远离家中扮演斑鸠，从而避免导致冲突或两个代理人放弃资源的互动类型。然而，Skyrms 利用的进化博弈理论只能在某种程度上支持 Gauthier 的观点。首先，Skyrms 模拟的博弈假设代理人具有固定类型，并且不能根据他人的声明修改他们的声明。此外，解释公平分配或受限制的最大化这样的特征为何会演化，或者展示为何这对个体代理人和群体可能有益，与约束自己的行为是理性行为之间有着区别。总之，Skyrms 利用的进化博弈理论只能在某种程度上支持 Gauthier 的观点。首先，Skyrms 模拟的博弈假设代理人具有固定类型，并且不能根据他人的声明修改他们的声明。此外，解释公平分配或受限制的最大化这样的特征为何会演化，或者展示为何这对个体代理人和群体可能有益，与约束自己的行为是理性行为之间有着区别。

5. 分析具有道德意义的社会问题

如果契约论方法用于证明道德和政治秩序，那么博弈论的运用最为系统，而其未来可能产生最大影响的领域是对道德重要社会问题的分析。例如，从全球性问题，如如何应对气候变化；到国家或社区内部出现的问题，如税收政策或如何管理共有资源；再到主要涉及个人和团体的问题，如如何激发参与合作努力的个人的最佳水平。下面我们将更详细地讨论三个例子。

5.1 核冲突

在二战和冷战初期，许多博弈论的早期进展是由致力于推动我们对核冲突的理解的组织中的个人所取得的。例如，约翰·冯·诺伊曼（John von Neumann）在二战期间做出了早期对博弈论的贡献，他为曼哈顿计划工作，这对核武器的发展起到了重要作用，他通常被认为是发展了相互确保毁灭（MAD）战略的人，这在冷战核政策中起着重要作用（Macrae 1992）。MAD 是一种管理核武器使用的政策，核大国通过可信地威胁对核首次打击进行报复，以摧毁任何首次打击的战略或战术优势。

毫不奇怪，与核武器使用相关的伦理问题最终会在哲学文献中得到广泛关注。其中大部分工作集中在核伦理如何对功利主义或义务论伦理学提出问题，特别是关于是否可以威胁造成巨大邪恶以避免它的问题。虽然在这一领域工作的大多数哲学家很少使用博弈论，但许多问题是由格雷戈里·卡夫卡、拉塞尔·哈丁等人的重要工作框定的，他们广泛使用了形式和非正式的博弈论工具（参见卡夫卡 1987 年；R·哈丁 1983 年；戈蒂埃 1984 年；麦克林 1984 年）。特别是，这项工作帮助识别了与 MAD 和其他威慑理论相关的一些悖论，澄清了单方面裁军的赞成和反对案例，并对更一般的关于理性的辩论产生了影响（特别是关于意图的性质和模块化是否是理性的要求的辩论）。

核冲突的分析也推动了合作博弈论的早期发展。这种工作的最早例子之一是劳埃德·沙普利和马丁·舒比克预测联合国安全理事会成员行为的努力（沙普利和舒比克 1954 年）。沙普利-舒比克权力指数量化了投票机构的任何成员投出决定性选票的可能性。这提供了每个成员的影响力度量，并帮助我们分析各种联盟形成的可能性，这些联盟将会有多稳定，以及获胜联盟获得的收益将如何分配。

或许博弈论对与核冲突相关的问题的最有影响力的应用可以在谢林的开创性作品《冲突策略》（1960 年）和《武器与影响》（1966 年）中找到，这两部作品共同重塑了冲突的博弈论分析。谢林最重要的洞察之一，尤其是核战争的前景使其特别清晰，就是观察到在冲突中参与各方的利益只在极少数情况下完全对立。这导致谢林强调冲突创造和塑造了谈判和合作的机会。这些问题越来越多地被使用合作博弈论的工具来研究，但谢林通过展示这些问题如何能够更有成效地通过非合作方法来分析，使得非合作博弈论得到了复兴。发展更有效的核武器的军备竞赛，以及政府为保护核秘密所做的广泛努力，也是信息和时间对冲突分析的重要性的象征，谢林对这些问题的强调将导致博弈论学者重新优先考虑更能够捕捉不完全信息的影响和冲突动态性质的广泛形式分析。最后，联系上述许多问题的是谢林早期关于承诺和威胁的工作。正如谢林所展示的，通过预先承诺付出代价的行动（或限制自己的未来选择），一个代理人可以影响与其处于冲突中的其他代理人的行动。事实上，谢林表明，在某些情况下，非理性甚至可以成为一种优势，这是卡夫卡（1987 年）在威慑的背景下进一步发展的论点。

5.2 不良规范

如果核冲突是第一个被广泛使用博弈论工具进行深入分析的道德上重要的社会问题，那么在最近的哲学文献中，对有害、破坏性和浪费性规范的分析是博弈论工具最为普遍的。具体而言，博弈论工具已被用来解释：1）什么是不良规范，2）它们何时以及为什么出现，以及 3）它们是否可以被改变，如果可以，如何改变。

在这些话题中，区分良好规范和不良规范的问题迄今为止受到的关注最少（一个值得注意的例外是 Thrasher 2018）。其中一个解释是，人们通常认为某些规范是不良的是显而易见的。例如，荣誉谋杀在规范文献中受到了广泛关注，也许并不奇怪的是，这类谋杀通常被认为是对至少部分受到该做法影响的人的权利构成侵犯的明显例子。因此，文献并没有集中讨论是什么使荣誉规范不良，而是倾向于关注为什么这类规范出现以及如何改变它们。

为了回答这些问题，博弈论工具被用来描述导致所讨论实践的潜在社会动态，并展示这些动态对实践的响应。其中几种实践共同的动态是规范在传递群体对特定价值观或行动方针的承诺方面所起的作用。例如，在荣誉杀人的案例中，当这些杀人行为针对外群体成员时，它们可能通过传递内群体对（真实或被认为是）侮辱的复仇承诺来阻止外群体对内群体的进一步侮辱（Boehm 1986; Nisbett & Cohen 1996; Skarbek 2014; Thrasher & Handfield 2018）。在公共秩序维护机构不健全的情况下，这一点尤为重要。然而，使荣誉规范不好的一件事是，群体对侮辱的复仇承诺可能会引发（或持续）暴力循环的风险。

荣誉杀人也可以针对违反某些规范的同组成员。例如，在许多地方，家庭成员杀害违反性道德规范或未能遵守传统性别规范的儿童（尤其是女孩）并不罕见。在这些情况下，群体成员希望遵守这些规范的愿望通常是因为相信这样做会使群体成员更具吸引力的婚姻伴侣，并且荣誉杀人的作用是传递家庭（或家庭所属的群体）对相关规范的承诺（United Nations Population Fund 2000; Chesler & Bloom 2012; Skarbek 2014; Thrasher & Handfield 2018）。然而，在某些情况下，群体对规范的承诺可能是由于多元无知驱动的。也就是说，有些情况下，两个（或更多）群体可能都在从事像缠足或女性生殖器切割这样的实践，而他们自己并不愿意从事，但他们基于错误的信念仍然对规范保持承诺（Bicchieri & Fukui 1999; Bicchieri 2017）。在这里，了解每个群体偏好的条件性质对于确定多元无知在维持所讨论规范中所起的作用至关重要，而了解多元无知在维持规范中所起的作用有助于解释为什么它是不好的。

除了帮助确定规范为何不好以及维持规范的因素，博弈论分析还可以帮助我们确定何时以及如何改变这些规范。例如，在由多元无知维持的实践案例中，改变实践的关键在于改变多个群体的信念。正如博弈论分析所示，如果不知道他们对其他群体的规范承诺的信念是错误的，如果要求一个群体单方面地透露他们的偏好，无论是什么激励他们的条件性偏好，都可能会给他们理由隐藏他们真实的偏好（Bicchieri 2017）。

或者，博弈论分析也可以帮助我们理解像露天排便这样的实践，这些实践似乎不是由多元无知所维持，而是由对超越个人或社区关注的规范的强烈承诺所维持，比如公共卫生等事项。例如，在印度农村，露天排便很常见，这种实践往往由与种姓制度相互作用的纯洁规范所维持，这使得社区在有条件提供厕所时也不愿使用。因此，解决由露天排便加剧的公共卫生危机不仅仅是建设必要的基础设施的问题，还包括破坏阻止基础设施利用的现行规范（Coffey＆Spears 2017），以及激励个人随附促进更好卫生实践的新规范（Bicchieri 2017）。在这种情况下，博弈论分析使我们能够看到如何激励相关行为。

然而，对于那些明显导致不良结果的规范，对不良规范的分析并不仅限于这些情况。博弈论还可以告诉我们，看似无害的规范和偏好如何导致不良结果。也许最著名的例子是谢林（1971）关于种族隔离的模型，它帮助我们理解为什么隔离如此难以解决。谢林表明，即使个体不介意与其他群体成员生活在一起，即使对于希望与自己相似的邻居有一些最低偏好，个体也会随着时间的推移将自己分配到相对隔离的社区中。例如，下图 15 显示了一个个体代理人在网格上随机分布时，随着时间的推移如何分离自己，当个体代理人对自己周围至少有 20％相似的邻居有偏好时。图 15a 描绘了一个 20×20 网格上的随机初始分布，其中有 10％的方格为空以便移动，并且有两种类型的代理人，比例相等。图 15b 描述了当代理人更喜欢周围至少有 20％相似的邻居时发生的分离情况。图 15c 显示了当阈值增加到 30％时情况如何变化。图 15d 显示了当阈值为 50％时的情况。

a. 初始分布

b. 20% 阈值

c. 30% 阈值

d. 50% 阈值

图 15. 谢林隔离模型 [图 15 的详细描述在附录中。]

如果我们比较图 15a 和图 15b，我们会发现当代理人希望他们的邻居中至少有五分之一与他们相似时，分布并没有受到很大影响。然而，如果我们将图 15a 和图 15b 与图 15c 进行比较，我们会发现当阈值从 20%增加到 30%时，代理人会显著分离。当阈值达到 50%时，代理人几乎完全被分配到同质化的社区中。换句话说，即使代理人对大多数与他们不同的邻居没有异议（在图 15c 的情况下，多达 70%），只希望有一些邻居与自己相似的偏好也可能产生巨大的分布后果，并且除了无意外，这些后果可能是不可取的。然而，虽然我们可能会因为这些后果而批评潜在的偏好，并且可能存在明显歧视的邻居组成阈值，但当涉及到只希望自己的 30%邻居与自己相似的偏好时（在只有两个群体的世界中），这种偏好是否令人反感远非明显。

5.3 气候变化和环境

最后，至少对于我们的目的来说，博弈论在环境伦理学中分析许多重要问题时至关重要，其中最著名的可能是“公地悲剧”（G. Hardin 1968），博弈论被用来展示资源在共有且未受监管的情况下如何容易被耗尽或退化。公地悲剧的概念是，当对稀缺资源的访问没有以某种方式限制时，资源的使用往往会超过环境再生资源的能力。因此，例如，我们过度放牧土地，耗尽鱼类和野生动物资源，降低含水层的水位，或者向环境排放过多的污染物。一般来说，公共池资源问题出现在以下情况下：（i）个人从尽可能大程度上利用资源中获益，（ii）任何一个个体的行为对资源影响微不足道，但（iii）所有个体的行为总体上有很大的影响。在这些情况下，一个人往往很容易看到整个社区的行为是有问题的，但是因为任何个体决定不利用资源本身不太可能有所不同，个体合理地推断他们可能会在能够的时候利用资源。因此，公共池资源问题是一种集体行动问题，从某些方面类似于我们在之前章节中讨论过的问题（例如，如何确保社区成员愿意执法规范，即使这样做是有成本的）。

通常有两种方法可以解决公共池资源问题：（1）将相关资源从公共领域中排除出去，即通过建立财产权来解决，或者（2）找到共同管理资源的方法，例如通过规定谁可以在特定时间访问公共领域。哪种方法最适合解决特定问题，以及该方法应采取何种形式，取决于许多因素，例如资源的排他性、是否稳定以及资源再生速度。通过提供一个分析不同情境下个体战略行为的框架，博弈论为确定在特定情况下最有可能奏效的解决方案提供了有用的工具。在这方面，埃莉诺·奥斯特罗姆（Elinor Ostrom）在公共池资源方面的工作对此产生了特别大的影响，她因此获得了 2009 年诺贝尔经济学奖。奥斯特罗姆通过广泛的实地研究结合博弈论分析，展示了尽管社区在可持续管理共有资源方面的方式多种多样，但这些方法的成功往往取决于一些基本原则（Ostrom 1990）。其中一些原则反映了我们在其他情境中已经讨论过的事物，例如监测和制裁的重要性，而其他一些原则可能不太明显。例如，容纳嵌套或重叠的责任辖区的重要性。然而，由于这些原则的具体表现方式高度依赖于情境，所以我们不会在这里进一步讨论它们，而是转向另一个在环境伦理学中受到广泛关注的问题：气候变化。

博弈论在气候变化的道德和政治分析中发挥了重要作用。特别是，它对于分析为什么解决气候变化困难至关重要。在文献中的共识是，对于有意解决气候变化的国家（和其他实体）来说，他们面临着一个巨大的搭便车问题，因为可以采取的许多措施来防止进一步的气候变化或减轻其影响的事物要么是准公共品，要么是产生巨大的正外部性的事物。例如，大幅减少碳排放和增加对碳封存或替代能源技术的投资，这些事物无论由谁投资都会使大多数国家受益。而且，由于投资这些事物是昂贵的（至少在短期内是如此），我们往往在这些事物上投资不足，这个问题在于气候变化的最严重成本可能主要落在未来的几代人身上，这使问题更加严重。

从广义上讲，对于我们应该如何应对上述问题，有两种思路。一种思路由加维（2008）、加德纳（2011）和布鲁姆（2012）等人代表，承认问题的集体性和政治性质，但同时认为除了国家行动外，个人也有责任采取措施，如减少碳足迹以减轻气候变化的影响。另一种思路的代表（如布伦南 2009 年、诺德豪斯 2014 年）则对个人或国家层面的单边行动能够产生多大作用持怀疑态度，因此主张我们应该将精力投入到寻找可行的集体机制来应对气候变化上。

6. 结论

伦理学中对博弈论的早期应用主要局限于契约论理论和探索道德与理性之间关系的研究。然而，随着越来越多的学者在哲学、政治学和经济学交叉领域的问题上进行研究，博弈论在道德和政治哲学中的应用越来越重要。可以预见，随着学者数量的增加，博弈论将成为研究这些问题的重要工具。尽管如此，博弈论仍然是分析道德功能和确定其必要特征的重要工具。而且，通过越来越复杂的博弈论工具，社会契约传统仍在不断做出新的贡献。

然而，尽管伦理学中使用博弈论的情况越来越普遍，许多道德和政治哲学家仍对这一趋势持怀疑态度。怀疑者提出的一个担忧是，博弈论分析往往依赖于简化假设，这使我们有理由怀疑这些分析与现实世界问题的相关性。例如，个体很少是博弈论经常假设的自私效用最大化者。这种担忧是错误的，原因有两个。首先，大多数倾向于在工作中使用形式方法的哲学家都非常清楚他们所依赖的假设。这并不意味着形式化工作从不使用错误的模型或假设，或者我们不应该对我们从博弈论分析和其他形式化工作中得出的结论进行批判性思考。但是，当结果被正确解释时，它们可以非常有帮助。例如，当为了计算可行性而进行简化假设时，它们可以提供一个有用的工具，用于缩小未来的研究方向。有时，简化假设是为了提出一些推测性问题，比如理性效用最大化者是否能够通过推理进入道德，这就是社会契约传统的情况。其次，归根结底，形式模型与哲学中更为熟悉的思想实验并没有太大的区别。然而，博弈论和其他形式工具的一个优势是，它们迫使使用它们的哲学家明确说明他们所做的假设，并且它们通常允许熟练的从业者对行动的位置和各种假设对事物的影响做出精确的陈述。

Bibliography

Alexander, J. McKenzie, 2007, The Structural Evolution of Morality, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511550997
Aquinas, Thomas, 1271 [1989], Summa Theologiae:, translated in Summa Theologiae: A Concise Translation, Timothy McDermott (ed.), Notre Dame, IN: Christian Classics.
Axelrod, Robert, 1984 [2006], The Evolution of Cooperation, New York: Basic Books. Revised Edition, New York: Basic Boats, 2006.
Barry, Brian, 1965 [1990], Political Argument, New York: Humanities Press. Reprinted as Political Argument: A Reissue with New Introduction, Berkeley: University of California Press, 1990.
Basu, Kaushik, 2000, Prelude to Political Economy: A Study of the Social and Political Foundations of Economics, Oxford: Oxford University Press. doi:10.1093/0198296711.001.0001
Bicchieri, Cristina, 2006, The Grammar of Society: The Nature and Dynamics of Social Norms, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511616037
–––, 2017, Norms in the Wild: How to Diagnose, Measure, and Change Social Norms, New York: Oxford University Press. doi:10.1093/acprof:oso/9780190622046.001.0001
Bicchieri, Cristina and Yoshitaka Fukui, 1999, “The Great Illusion: Ignorance, Informational Cascades, and the Persistence of Unpopular Norms”, in Experience, Reality, and Scientific Explanation, Maria Carla Galavotti and A. Pagnani (eds), Dordrecht: Springer, 89–121.
Binmore, Ken, 1994, Game Theory and the Social Contract Volume I: Playing Fair, Cambridge, MA: MIT Press.
–––, 1998, Game Theory and the Social Contract Volume II: Just Playing, Cambridge, MA: MIT Press.
Boehm, Christopher, 1986, Blood Revenge: The Enactment and Management of Conflict in Montenegro and Other Tribal Societies, Philadelphia, PA: University of Pennsylvania Press.
Boyd, Robert and Peter Richerson, 2005, The Origin and Evolution of Cultures, Oxford: Oxford University Press.
Braithwaite, Richard B., 1955 [2009], Theory of Games as a Tool for the Moral Philosopher: An inaugural lecture delivered in Cambridge on 2 December 1954, Cambridge: Cambridge University Press. Reprinted 2009.
Brennan, Geoffrey, 2009, “Climate Change: A Rational Choice Politics View”, Australian Journal of Agricultural and Resource Economics, 53(3): 309–326. doi:10.1111/j.1467-8489.2009.00457.x
Brennan, Geoffrey, Lina Eriksson, Robert E. Goodin, and Nicholas Southwood, 2013, Explaining Norms, Oxford University Press. doi:10.1093/acprof:oso/9780199654680.001.0001
Broome, John, 2012, Climate Matters: Ethics in a Warming World, New York: W.W. Norton.
Chesler, Phyllis and Nathan Bloom, 2012, “Hindu vs. Muslim Honor Killings”, Middle East Quarterly, 19: 43–52. [Chesler and Bloom 2012 available online]
Chung, Hun, 2015, “Hobbes’s State of Nature: A Modern Bayesian Game-Theoretic Analysis”, Journal of the American Philosophical Association, 1(3): 485–508. doi:10.1017/apa.2015.12
Coffey, Diane and Dean Spears, 2017, Where India Goes: Abandoned Toilets, Stunted Development and the Costs of Caste, Noida, Uttar Pradesh: HarperCollins India.
Eshel, Ilan and L. L. Cavalli-Sforza, 1982, “Assortment of Encounters and Evolution of Cooperativeness”, Proceedings of the National Academy of Sciences, 79(4): 1331–1335. doi:10.1073/pnas.79.4.1331
Gardiner, Stephen M., 2011, A Perfect Moral Storm: The Ethical Tragedy of Climate Change, Oxford: Oxford University Press. doi:10.1093/acprof:oso/9780195379440.001.0001
Garvey, James, 2008, The Ethics of Climate Change: Right and Wrong in a Warming World, London: Continuum.
Gaus, Gerald, 2010, The Order of Public Reason: A Theory of Freedom and Morality in a Diverse and Bounded World, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511780844
Gauthier, David P., 1969, The Logic of Leviathan: The Moral and Political Theory of Thomas Hobbes, Oxford: Clarendon Press. doi:10.1093/acprof:oso/9780198246169.001.0001
–––, 1984, “Deterrence, Maximization, and Rationality”, Ethics, 94(3): 474–495. doi:10.1086/292561
–––, 1985, “Bargaining and justice”, Social Philosophy and Policy, 2(2): 29–47.
–––, 1986, Morals By Agreement, Oxford: Clarendon Press.
–––, 2013, “Twenty-Five On”, Ethics, 123(4): 601–624. doi:10.1086/670246
Grotius, Hugo, 1625 [2005], De iure belli ac pacis libri tres, Paris: Buon. Translated as The Rights of War and Peace, Richard Tuck and Jean Barbeyrac (eds), Indianapolis, IN: Liberty Fund.
Hampton, Jean, 1986, Hobbes and the Social Contract Tradition, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511625060
Hardin, Garrett, 1968, “The Tragedy of the Commons”, Science, 162(3859): 1243–1248. doi:10.1126/science.162.3859.1243
Hardin, Russell, 1983, “Unilateral Versus Mutual Disarmament”, Philosophy & Public Affairs, 12(3): 236–254.
Harsanyi, John C., 1953, “Cardinal Utility in Welfare Economics and in the Theory of Risk-Taking”, Journal of Political Economy, 61(5): 434–435. doi:10.1086/257416
–––, 1955, “Cardinal Welfare, Individualistic Ethics, and Interpersonal Comparisons of Utility”, Journal of Political Economy, 63(4): 309–321. doi:10.1086/257678
–––, 1977, Rational Behaviour and Bargaining Equilibrium in Games and Social Situations, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511571756
Harsanyi, John and Reinhard Selten, 1988, A General Theory of Equilibrium Selection in Games, Cambridge, MA: MIT Press.
Hobbes, Thomas, 1651 [1994], Leviathan, London. Reprinted Edwin Curley (ed.), Indianapolis, IN: Hackett, 1994.
Hume, David, 1740 [2011], A Treatise of Human Nature, London. Reprinted David Fate Norton and Mary J. Norton (eds), Oxford: Clarendon Press, 2011.
Kalai, Ehud, 1977, “Proportional Solutions to Bargaining Situations: Interpersonal Utility Comparisons”, Econometrica, 45(7): 1623–1630. doi:10.2307/1913954
Kalai, Ehud and Meir Smorodinsky, 1975, “Other Solutions to Nash’s Bargaining Problem”, Econometrica, 43(3): 513–518. doi:10.2307/1914280
Kavka, Gregory S., 1984, “The Reconciliation Project”, in Morality, Reason and Truth, David Copp and David Zimmerman (eds), Totowa: Rowan and Allanheld, 297–319.
–––, 1986, Hobbesian Moral and Political Theory, Princeton, NJ: Princeton University Press.
–––, 1987, Moral Paradoxes of Nuclear Deterrence, Cambridge: Cambridge University Press.
Lensberg, Terje, 1988, “Stability and the Nash Solution”, Journal of Economic Theory, 45(2): 330–341. doi:10.1016/0022-0531(88)90273-6
Lewis, David, 1969, Convention: A Philosophical Study, Cambridge, MA: Harvard University Press.
Locke, John, 1689 [1960], The Second Treatise of Government, Reprinted in Two Treatises of Government, Peter Laslett (ed.), Cambridge: Cambridge University Press, 1960, 283–446.
Luce, R. Duncan and Howard Raiffa, 1957, Games and Decisions: Introduction and Critical Survey, New York: John Wiley and Sons.
MacLean, Douglas (ed.), 1984, The Security Gamble: Deterrence Dilemmas in the Nuclear Age, Rowman & Allanheld.
Macrae, Norman, 1992, John von Neumann: The Scientific Genius Who Pioneered the Modern Computer, Game Theory, Nuclear Deterrence, and Much More, New York: Pantheon Press.
Maynard Smith, John, 1982, Evolution and the Theory of Games, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511806292
McClennen, Edward F., 1990, Rationality and Dynamic Choice: Foundational Explorations, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511983979
Moehler, Michael, 2009, “Why Hobbes’ State of Nature Is Best Modeled by an Assurance Game”, Utilitas, 21(3): 297–326. doi:10.1017/S0953820809990069
–––, 2018, Minimal Morality: A Multilevel Social Contract Theory, Oxford: Oxford University Press. doi:10.1093/oso/9780198785927.001.0001
Muldoon, Ryan, 2016, Social Contract Theory for a Diverse World, New York: Routledge. doi:10.4324/9781315545882
Nash, John, 1950, "The Bargaining Problem", Econometrica, 18(2): 155–162. doi:10.2307/1907266
–––, 2002, The Essential John Nash, Harold W. Kuhn and Sylvia Nassar (eds), Princeton, NJ: Princeton University Press.
Nisbett, Richard and Dov Cohen, 1996, Culture of Honor: The Psychology of Violence in the South, Boulder, CO: Westview Press.
Nordhaus, William, 2014, “The Ethics of Efficient Markets and Commons Tragedies: A Review of John Broome’s Climate Matters: Ethics in a Warming World”, Journal of Economic Literature, 52(4): 1135–1141. doi:10.1257/jel.52.4.1135
Ostrom, Elinor, 1990, Governing the Commons: The Evolution of Institutions for Collective Action, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511807763
Plato, Plato: Complete Works, John Cooper (ed.), Indianapolis: Hackett, 1997.
Pufendorf, Samuel, 1673 [1991], De officio hominis et civis juxta legem naturalem, London: Sumtibus Adami Junghans. Translated as On the Duty of Man and Citizen according to Natural Law, James Tully (ed.) and Michael Silverthorne (trans.), Cambridge: Cambridge University Press. doi:10.1017/9781316160800
Raiffa, Howard, 1953, “Arbitration Schemes for Generalized Two-Person Games”, in Contributions to the Theory of Games, Volume II, Harold William Kuhn and Albert William Tucker (eds.), (Annals of Mathematics Studies 28), Princeton, NJ: Princeton University Press, 361–388. doi:10.1515/9781400881970-022
Rawls, John, 1958, “Justice as Fairness”, The Philosophical Review, 67(2): 164–194. doi:10.2307/2182612
–––, 1971, A Theory of Justice, Cambridge, MA: Harvard University Press.
Roth, Alvin E., 1979, Axiomatic Models of Bargaining, (Lecture Notes in Economics and Mathematical Systems 170), Berlin, Heidelberg: Springer Berlin Heidelberg. doi:10.1007/978-3-642-51570-5
Rousseau, Jean-Jacques, 1755 [1997], Discours sur l’origine et les fondements de l’inégalité parmi les hommes, translated as “Discourse on the Origin and Nature of Inequality Among Men”, in The Discourses and Other Early Political Writings, Victor Gourevitch (ed.), Cambridge: Cambridge University Press.
Rubinstein, Ariel, 1982, “Perfect Equilibrium in a Bargaining Model”, Econometrica, 50(1): 97–109. doi:10.2307/1912531
Scanlon, Thomas M., 1982, “Contractualism and Utilitarianism”, in Utilitarianism and Beyond, Amartya Sen and Bernard Williams (eds.), Cambridge: Cambridge University Press, 103–128. doi:10.1017/CBO9780511611964.007
–––, 1998, What We Owe to Each Other, Cambridge, MA: Belknap Press.
Schelling, Thomas C., 1960, The Strategy of Conflict, Cambridge, MA: Harvard University Press.
–––, 1966, Arms and Influence, New Haven, CT: Yale University Press.
–––, 1971, “Dynamic Models of Segregation”, The Journal of Mathematical Sociology, 1(2): 143–186. doi:10.1080/0022250X.1971.9989794
Sen, Amartya, 1980, “Equality of What?”, Tanner Lectures on Human Values delivered at Stanford University 22 May 1979, collected in Tanner Lectures on Human Values, Sterling M. McMurrin (ed.), Cambridge: Cambridge University Press, 1980, 197–220. [Sen 1980 available online]
Shapley, L. S. and Martin Shubik, 1954, “A Method for Evaluating the Distribution of Power in a Committee System”, American Political Science Review, 48(3): 787–792. doi:10.2307/1951053
Skarbek, David, 2014, The Social Order of the Underworld: How Prison Gangs Govern the American Penal System, Oxford: Oxford University Press. doi:10.1093/acprof:oso/9780199328499.001.0001
Sidgwick, Henry, 1874 [2011], The Methods of Ethics, Cambridge: Cambridge University Press. doi:10.1017/CBO9781139136617
Skyrms, Brian, 1996 [2014], Evolution of the Social Contract, Cambridge: Cambridge University Press; second edition, 2014. doi:10.1017/CBO9781139924825
–––, 1998, “The Shadow of the Future”, in Rational Commitment and Social Justice: Essays for Gregory Kavka, Jules L. Coleman and Christopher W. Morris (eds.), Cambridge: Cambridge University Press, 12–21. doi:10.1017/CBO9780511527364.003
–––, 2004, The Stag Hunt and the Evolution of Social Structure, Cambridge: Cambridge University Press. doi:10.1017/CBO9781139165228
Sobel, Jordan Howard, 2009, Walls and Vaults: A Natural Science of Morals (Virtue Ethics According to David Hume), Hoboken, NJ: John Wiley & Sons, Inc. doi:10.1002/9781118031605
Stähl, Ingolf, 1972, Bargaining Theory, Stockholm: Economic Research Institute.
Sugden, Robert, 1986, The Economics of Rights, Co-operation, and Welfare, Oxford: Blackwell Press.
Taylor, Michael, 1987, The Possibility of Cooperation, Cambridge: Cambridge University Press.
Thrasher, John, 2018, “Evaluating Bad Norms”, Social Philosophy and Policy, 35(1): 196–216. doi:10.1017/S0265052518000055
Thrasher, John and Toby Handfield, 2018, “Honor and Violence: An Account of Feuds, Duels, and Honor Killings”, Human Nature, 29(4): 371–389. doi:10.1007/s12110-018-9324-4
Thomson, William and Terje Lensberg, 1989, Axiomatic Theory of Bargaining with a Variable Number of Agents, Cambridge: Cambridge University Press. doi:10.1017/CBO9780511664489
Ullmann-Margalit, Edna, 1977, The Emergence of Norms, Oxford: Clarendon Press.
United Nations Population Fund (UNFPA), 2000, “Violence Against Women and Girls: A Human Rights and Health Priority”, in The State of World Population, 2000, United Nations Population Fund, 25–30. [UNFPA 2000 available online]
Vanderschraaf, Peter, 1998, “The Informal Game Theory in Hume’s Account of Convention”, Economics and Philosophy, 14(2): 215–247. doi:10.1017/S0266267100003849
–––, 2007, “Covenants and Reputations”, Synthese, 157(2): 167–195. doi:10.1007/s11229-006-9147-4
–––, 2010, “The Invisible Foole”, Philosophical Studies, 147(1): 37–58. doi:10.1007/s11098-009-9449-8
–––, 2019, Strategic Justice: Convention and Problems of Balancing Divergent Interests, New York: Oxford University Press. doi:10.1093/oso/9780199832194.001.0001
Vanderschraaf, Peter and Diana Richards, 1997, “Joint Beliefs in Conflictual Coordination Games”, Theory and Decision, 42(3): 287–310. doi:10.1023/A:1004962809537
Von Neumann, John and Oskar Morgenstern, 1944 [2004]. Theory of Games and Economic Behavior, Princeton, NJ: Princeton University Press. Sixtieth-Anniversary Edition, Princeton and Oxford: Princeton University Press, 2004.

Academic Tools

Other Internet Resources

Game Theory 101, a website managed by William Spaniel associated with his textbook of the same name that includes an extensive library of videos that explain most of the important ideas and topics in game theory.
Veconlab: Experimental Economics Laboratory, a website managed by Charlie Holt that provides a platform for running experiments that can be used in the classroom to illustrate numerous game theoretic scenarios.
Verbeek, Bruno and Peter Vanderschraaf, “Game Theory and Ethics”, Stanford Encyclopedia of Philosophy (Fall 2021 Edition), Edward N. Zalta (ed.), URL = https://plato.stanford.edu/archives/fall2021/entries/game-ethics/. [This was the previous entry on this topic in the Stanford Encyclopedia of Philosophy — see the version history.]

Acknowledgments

We would like to thank Bruno Verbeek and Christopher Morris whose earlier version of this entry helped shape some of our thinking on the issues discussed here. We would also like to thank the many colleagues with whom we’ve discussed our presentation of the material discussed here, including especially colleagues at Chapman University and the University of Arizona. Finally, we would like to thank the editors for their patience with us during the writing process, and, especially, the anonymous referee whose substantial feedback on earlier drafts improved the final product.

上一页博弈论的认识论基础 epistemic foundations of (Eric Pacuit and Olivier Roy)下一页演化博弈论 evolutionary (J. McKenzie Alexander)

最后更新于10小时前